您的位置 首页 > 数码极客

如何判断回归系数显著性、如何检验回归系数的显著性

更多CFA官方教材详解,请关注“边际实验室”。

“边际实验室”是一家专注于金融科技、金融大数据领域的工作室,同时提供CFA、FRM等金融考试内容的免费讲解。

之前,我们说明了如何分别对回归系数进行假设检验。如果我们现在想测试整个回归的显著性应该怎么办?

作为一个整体,自变量是否有助于解释因变量?为了解决这个问题,我们检验了回归中所有斜率系数同时等于0的原假设。在本节中,我们进一步讨论通过回归的方差分析来衡量模型的解释程度等问题。

如果回归模型中没有任何自变量有助于解释因变量,则斜率系数应全部等于0。但是,在多元回归中,我们基于每个斜率系数均等于零的t检验方法而检验所有斜率系数等于0的原假设是没有意义的,因为这种检验未考虑自变量之间相互作用的影响。多重共线性就是指的这样一种情况,即使各个估计斜率系数的t统计量都不显著,我们也可以拒绝所有斜率系数等于0的假设。

为了检验多元回归模型中所有斜率系数都等于零的原假设(H0:b1= b2 = ... = bk = 0),至少一个斜率系数不等于0的备择假设,我们必须使用F检验。

F检验被视为对回归的整体意义的检验。

为了正确计算零假设的检验统计量,我们需要四个输入项:

■观察值总数,n;

■估计的回归系数数目k+ 1,其中k是斜率系数的数目;

■平方误或残差之和:

缩写为SSE,也称为残差平方和(无法解释的变化);

■回归平方和:


缩写为RSS。该值是Y由回归方程解释的均值的变化(能够解释的变化)。

用于确定斜率系数是否等于0的F检验基于上述四个值计算F统计量。F统计量用于衡量回归方程对因变量变化的解释程度;它是平均回归平方和与平均残差平方和之比。

我们通过将回归平方总和除以估计的斜率系数数目k来计算平均的回归平方和。我们通过将残差平方总和除以n-(k+1)来计算平均残差平方和。这些计算中的两个除数是F统计量的自由度。对于n个观测值和k个斜率系数,斜率系数均等于0的原假设的F检验表示为Fk,n–(k+ 1)。下标表示检验的分子应具有k个自由度(分子自由度),分母应具有n-(k+1)个自由度(分母自由度)。

F统计量的公式为

其中,MSR是平均回归平方和,MSE是平均残差平方和。

在回归输出的ANOVA表中,MSR和MSE是MSS列下的第一和第二个数值。如果回归模型很好地解释了因变量的变化,则MSR/ MSE之比将很大。

当回归模型中的自变量无法解释因变量的变化时,该F检验能告诉我们什么?在这种情况下,回归模型中的每个预测值^Yi均是因变量Y的平均值,回归平方和为0。因此,当自变量根本无法解释因变量时,用于检验原假设(所有斜率系数等于0)的F统计量的值为0。如果F的结果大于F分布的α临界值,那么我们在α显著性水平上拒绝原假设。请注意,我们使用单尾F检验。

我们可以使用之前所讲的案例来说明该检验,在案例中,我们检验纳斯达克做市商数量的自然对数和股票市值的自然对数是否解释买卖价差除以价格的自然对数。

假设我们将此检验的显著性水平设置为α=0.05(即如果为零,我们错误拒绝原假设的概率为5%)。下图显示了此回归的方差计算结果。

该模型具有两个斜率系数(k= 2),因此该F检验的分子有两个自由度。在样本中有2587个观测值时,F检验的分母中的自由度数为n-(k+1)=2,587-3 =2,584。残差平方和是2172.8870。平方回归总和是3728.1334。因此,该模型中两个斜率系数等于0的原假设的F检验为

在斜率系数等于0的零假设下,该检验统计量显示了F2,2584的随机变量分布。在0.05显著性水平的图表中,我们查看第二列,该列显示了具有2个分子自由度的F分布。在该列底部附近,我们发现拒绝原假设所需的F检验临界值在3.00和3.07之间。

F检验统计量的实际值是2216.75,要大得多,因此我们拒绝两个独立变量的系数都等于0的原假设。事实上,图表中“F显著性水平”下的p值为0。p值表示可以拒绝原假设的最小显著性水平,几乎为0。因此F统计量的值较大表示错误拒绝原假设的可能性很小(第I类错误)。

责任编辑: 鲁达

1.内容基于多重复合算法人工智能语言模型创作,旨在以深度学习研究为目的传播信息知识,内容观点与本网站无关,反馈举报请
2.仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告,请读者放心使用!

“如何判断回归系数显著性,如何检验回归系数的显著性,判断回归系数的显著性,回归系数显著性检验判断方法”边界阅读