问题:Pearson积差相关系数能代表变量间真正的相关关系吗?
比如身高、体重、肺活量三个变量,两两之间的Pearson积差相关系数为:
根据Pearson积差相关系数,身高、体重、肺活量两两之间都存在正相关关系。关系图如下:
那么:身高越高,肺活量就真的越大吗?身高升高后,会直接引起肺活量的增大,还是会通过增加体重,间接引起肺活量的增大?
所以:Pearson积差相关系数只能从表面上反映两个变量相关的性质,往往不能真实地反映变量之间的线性相关程度,甚至会给人造成相关的假象。
当其他变量被固定住,即将他们控制起来后,给定的任意两个变量之间的相关系数叫偏相关系数,偏相关系数才是真正反映两个变量相关关系的统计量。
案例:控制"体重"影响的情况下,探索身高与肺活量的相关关系。
SPSS步骤:1)分析-相关-偏相关
2)"身高"、"肺活量"放入"变量列表"。
"体重"放入"控制"变量列表。
点击"确定"。查看结果。
3)SPSS结果:
结果的判断方法和简单线性相关一致,当显著性也就是P≤0.05时,变量间存在线性相关关系;P>0.05时,变量间不存在线性相关关系。
控制"体重"的情况下,身高与肺活量之间的偏相关系数r=0.569(P<0.05)。比原来的0.790低了很多。可以认为0.569更加接近身高与肺活量之间真正的相关关系。
注意:计算偏相关系数时,被控制的变量不能随意确定,要有理论依据。