做过智力测试的人都知道,任何智商量表都有不同数量的题目可以用来衡量个人不同的智力成分水平。(威廉莎士比亚,智力,智力,智力,智力。
也许你会得到以下报告:词汇测验 8分
算数测验 9分
一般性理解测验 11分
图形排列测验 4分
相信很少有人能够正确理解以上报告的含义。通常情况下我们所说的智商值,显然并不是这些数字的简单相加。这个将报告的分数转化成标准化的一般人易于理解的分数的统计方法就是我们今天所要介绍的z分数。
1. z分数的目的
1.1 转换
用平均数与标准差把每一个分数(X值)转变为z分数是为了确定和描述每一个分数在分布中的精确位置。很多时候仅仅知道原始分数和平均数,并不能让我们了解到分布内的具体位置信息,比如某次考试的平均分是70分,你的分数是76,同样是高出平均分六分,随着标准差的不同,76这个分数的相对位置也会发生很大的改变。
1.2 分布标准化
z分数的第二个目的是将整个分布标准化。标准化才有可能比较两个不同的分布。例如上面所说的智商测试,不论用哪种量表进行测试,我们都将结果转化为标准化的,平均数100,标准差15的分布。这样不同个体的智商才具有可比性。
2. z分数的定义
z分数描述的是从分数X到平均数µ之间有几个标准差的距离。z分数的符号(+/-)表示这个分数比平均数高(+)或比平均数低(-)。z分数与原始分数的位置关系如下图:
计算公式为:
3. z分数的分布性质
由于分布中每个X值都可以转换成相应的z分数,因此整个X值的整个分布都变成了z分数的分布。
3.1 z分数具有以下几个特性:
A. 形状与原始分数的分布完全相同。这个过程仅仅是把每一个分数重新标号,并不会使分数在整个分布中发生位移。
B. z分数的分布的平均数永远为0。原始的总体平均数变成了z分数分布中的0,所有正值都高于平均数,所有负值都低于平均数。0是一个非常便利的参考点。
C. z分数的分布的标准差永远为1。
由于所有z分数都具有形同的平均数和标准差,任意一个分布转换成z分数的分布后,都可以用来进行比较。比如某次期中考试,A学生的语文和数学分别考了60和54分。B学生考了50和60分。我们如何知道哪个学生的成绩相对更好?由于语文成绩和数学成绩是两个完全不同的分布,不能拿来比较,我们不能简单的将两门课的分数相加,从而认为A的成绩更好。这种情况下我们就需要通过z分数来标准化这两个分布。假如语文考试µ=50,σ=5,数学考试µ=50,σ=2。通过计算,我们可以得知A两科z分数的总和为2+2=4,B两科z分数的总和为0+5=5。相对来说,B的成绩比A要好。
3.2 将z分数转换成预先设好的µ和σ的分布
尽管z分数具有很多优点,但由于其包含了负值和小数,在实际运用中还是会比较复杂,因此我们常常做另一种标准化,将z分数转换成预先设好的µ和σ的分布。这个过程包含两个步骤
A.原始分数变换成z分数。
B.z分数变成新的X值,使得预先设定的µ和σ值被达到。
这种运用最常见的是用于智力测验上。大多数智力测验都会将原始分数转换成平均数100,标准差15的标准分。
4. 推论性统计的前瞻
推论性统计是运用从样本中得到的信息去回答有关总体问题的一种方法。研究结果的解释往往取决于样本是否和总体显著不同。而决定样本是否属于极端分数的一个方法就是运用z分数。例如一个研究者要评估一种新的生长激素的作用,以老鼠作为研究对象。如果在研究中,接受了激素注射的老鼠具有极端的z分数,即z分数在+以外,我们可以得出结论:这种激素对生长是有效的。
在上面的例子里,我们把具有+外的个体称为“极端”,但实际上z分数的边界是任意的。如何才能准确地确定边界呢?我们会在下一章概率中具体谈到。
参考书目:行为科学统计,现代心理与教育统计学