1. 什么是t分数
Void alphabet 3D / Letter shaped hole formed by
1.1 t分数的计算
假设检验的目的在于通过样本了解未知的总体。然而计算z分数的前提又必须是总体的标准差已知。如何解决两者之间的矛盾呢?当总体的变异性未知时,我们可以用样本的变异性来代替。也就是说我们可以通过样本来估计标准误。当σ未知时,估计标准误(SM)被用作实际标准误的估计值,它提供了样本平均数M到其总体平均数µ之间的标准距离的估计。M的估计标准误公式为:
之所以用方差来代替标准差的原因是样本方差是无偏差的统计量,用样本方差来估计总体方差是最准确的。t分数和z分数唯一的不同在于z分数公式使用的是总体方差的真实值,t分数使用的是相应的样本方差。
1.2自由度与t分布
自由度是指样本中有多少个分数是独立,并可以自由变化的。
很显然,样本的分数越多,样本就越能够代表总体。一个样本的自由度越大,样本方差就越接近总体方差,t分数也就越接近z分数。因此t分布的形状随自由度的变化而变化,自由度越大,越接近正态分布。
1.3 确定t分数的面积和概率
就像我们使用正态分布表来定位于z分数相关的面积那样,我们也会用t分布表来确定t分数的面积。在使用t分布表时,要注意自由度df以及单尾的概率。
高斯 (贝尔) 曲线在笔记本电脑上
2. 假设检验与t分数
t分数的假设检验步骤与z分数相同。最主要的区别是由于总体方差未知,我们需要估计标准误,随后计算t分数,最后从t分布表而不是正态分布表里去找临界点。
t分数的假设检验步骤:
1. 陈述假设,确定α水平。
2. 确定临界区域。算出df,以及对应α水平和df的t值。
3. 计算检验统计量
a. 方差
b. 计算估计标准误
c. 计算t分数
4. 对于H0做出判定。
需要注意的是关于t分数假设检验的两个基本假定为:
A. 样本数值包含互相独立的观察
B. 样本来自的总体必须是正态分布
3. t检验中效应大小的测量
3.1 估计的d值
就像我们在上一章说的,假设检验并不能真正的测量处理效应的大小,它只能决定处理效应是否比偶然的效应大。因此在t检验中,我们依然应该在报告假设检验结果的同时报告效应的大小,例如科恩d值。由于总体数值未知,我们在检验的过程中使用的是估计的标准误,因此t检验的效应用估计的d值来表示。
3.2 方差百分率r2
另一种测量效应大小的方法是确定分数的变异性有多少是可以由处理效应来解释。也就是说有多少变异性是由处理引起的。假设一组样本在处理前的平均值为µ=30,经过试验处理平均数增大到M=36,则处理效应值为6。消除处理效应意味着从每个分数中间去掉6。如果我们将实验处理后的变异性称为总的变异性SS=396,消除处理效应后的变异性减小为SS=72。两组数值之间的差别是324,这个数值被称为解释的变异性。解释变异性与总体变异性之间的百分比就叫做由处理引起的方差百分比。
方差百分率r2的计算公式为
以上介绍的所有统计方法都是用一个样本作为基础来推论有关总体的结论。如果涉及到两组或多组数据,我们就需要比较两组数据的平均数差异。下一章我们将要介绍的两个独立样本的t检验就是针对多组数据使用的统计方法。
螺钉
参考书目:行为科学统计,现代心理与教育统计学