关于偏相关系数计算思想的思考

时间:2022-08-11 07:29:32

关于偏相关系数计算思想的思考

[摘 要] 偏相关系数作为研究变量之间“纯”相关关系的一种手段,在相关分析中占有非常重要的地位。本文以三变量为例分析了偏相关系数的计算过程,认为在排除其余变量对进行偏相关分析的两个变量的影响时,存在一个数学期望不为零的漂移量,这无疑使得变两间的“纯”相关关系受到影响。最后文章分析了漂移量的含义,并就偏相关系数计算的改进提出了初步的设想。

[关键词] 相关分析 偏相关系数

相关和回归分析作为研究变量之间相关关系的两种基本方法,在统计学中占有非常重要的地位,在进行实证分析过程中二者之间存在互补关系。

一、偏相关系数基本计算方法分析

我们以三个变量(y,χ1,χ2)为例,来说明偏相关系数计算的基本思想。假设变量y,χ1,χ2之间的数量依存关系为:

y=ω0+ω1χ1+ω2χ2+μ (1)

在求y与χ1的偏相关系数时,必须清除χ2的影响,为此先求y、χ1对χ2的回归:

y=αμ+χ2+ε1―― (2)

y= +χ2+ε2―― (3)

在传统的偏相关系数计算方法中认为(1)式和(2)式中的残差部分ε1和ε2分别是变量y和χ1中未被χ2解释的部分,即清除了χ2影响后y和χ1的值,这两个残差间的相关关系就表示了y和χ1之间的纯相关关系。因此界定排除χ2影响后y和χ1之间的偏相关系数:

(4)

其中就是ε1和ε2的简单相关系数。

由此可见:偏相关系数计算思想的就是对进行偏相关分析的两个变量“排除其他变量的影响”,通过两个变量中其他变量不能解释的部分间的相关关系来分析两变量间的“纯”依存关系,因此偏相关分析的关键在于如何有效排除其他变量的影响。在传统的偏相关系数计算中排除其它变量影响的工具就是(2)式和(3)式,就本例而言通过(2)(3)两式提供的方法能否有效的清除χ2对y和χ1的影响呢?

二、对和的分析

(2)式的主要目的是寻找y中受χ1影响的部分,那么ε1是否准确地度量了这一结果呢?在进行偏相关分析时,我们已知变量y,χ1,χ2之间存在数量依存关系y=ω0+ω1χ1+ω2χ2+μ,由此可知在没有确定三变量之间的因果关系之前,它们之间表现为相互影响的相关关系。我们利用进行(2)式和(3)式分析时的样本,通过最小二乘法来估计(1)式,假设估计的结果为:

y=(5)

在进行(5)式的估计过程中正规方程组的第二个方程为:

由于ε3利用现有样本将χ1对χ2回归而得到的残差,因此χ2,且=0所以上式可以转化为,因为只是χ1的线性组合,所以,亦即:,所以,进而有所以:

(6)

其中ε3利用现有样本将χ2对χ1回归而得到的残差,通过的表达式不难发现,可以看作是χ2排除χ1影响之后剩余的部分与y进行回归分析而得到的回归系数,因此度量了在排除χ1影响之后χ2与y之间的关系。和(2)式相比β通常不等于,但在两种比较明显的情况下他们会相等,其一是:样本中χ1对y的局部效应为0,即ω1=0,其二是样本中χ2和χ1不相关。而我们进行yy1.2分析之前,通常不可能一开始就认定χ1对y的局部效应为0或χ2和χ1不相关,如果χ1对y的局部效应为0,那么我们就没有必要来进行yy1.2的分析;如果χ2和χ1不相关,显然没有必要排除χ2对χ1的影响,也就没有必要进行(3)式的分析。

由于本例的主要目的是测量χ1对y的纯效应,因此我们不可能一开始就判断χ1是对y没有重要影响的变量。通过(2)式和(5)的对比不难发现:(2)式在测量χ2对y的影响时,很可能遗漏重要变量χ1,进而使β成为一个有偏估计量。

(7),由(1)式可知:,所以:

将此结果带入(7)式可得:

由于其中

所以

所以,亦即。由此可见,利用(2)式来测量χ2对y的影响是有偏移的。将(8)式带入到(2)式中可得:

根据(1)式可知ω2χ2i部分就是χ2排除χ1影响后的部分对y的影响。因此根据(2)式所确定的χ1对y的影响ε1存在一个漂移,

而且此漂移量的数学期望不等于零。

同理利用(3)式来分析χ1中χ2不能解释的部分时,由于y与χ1的因果关系并没有确定,因此无法直接排除y对χ1的影响,故此这一步一样面临着遗漏重要变量y的影响,其分析过程与上述过程一样。假设:χ1=κ0+κ1χ2+κ2y+ν,利用估算(2)式的样本,估计(3)式时可知:

同样利用(3)式测算χ1中χ2不能解释的部分ε2存在一个数学期望不为零的漂移

三、对偏相关系数计算思想的分析

利用(2)式和(3)式测算排除χ2影响后y和χ1的值存在一个数学期望不为零的漂移量,其背后隐藏着一个关于χ2对y和χ1影响机制的设定问题。由于我们进行的是相关分析,在进行定量测量时我们并没有分析三者之间的因果关系,因此它们之间的影响是相互的,因此从回归分析的角度来说(2)式和(3)式存在遗漏重要变量的风险是毫无疑问的。正是因为它们之间相互影响,那么我们在测量χ2对y和χ1影响时,是仅仅把χ2对y和χ1的直接影响界定为χ2对y和χ1的影响,还是把χ2对y和χ1的间接影响也包含在χ2对y和χ1的影响中,这种不同的界定最后得出的结果是不同的。以χ2对y的影响为例,χ2对y存在直接影响,即(5)式中的部分,同时χ2对y存在间接影响,即χ2通过直接影响χ1间接影响y,这部分第二部分分析的漂移量

中有一定的体现。

,由(3)式可知测量了

χ2对χ1的影响,再由(1)式可知ω1就测量了χ2通过直接影响χ1对y间接影响。因此(2)式中βχ2部分不仅包含有χ2对y的直接影响,同时也包含有χ2对y的间接影响。对于χ1通过直接影响χ2对y的间接影响,笔者认为应该包含在χ1对y的影响之中,在进行偏相关分析时只用排除χ2对y和χ1的直接影响。怎样通过排除χ2对y和χ1的直接影响后分析y和χ1之间的相关关系我们将另文进行论述。

参考文献:

[1]伍德里奇著:《计量经济学导论-现代观点》J.M.费剑平 林相森译:中国人民大学出版社2003年3月第一版

[2]于俊年:《计量经济学》,对外经济贸易大学出版社2005年6月

[3]梁之舜:《概率论与数理统计》,高等教育出版社2001年3月

“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文”

上一篇:商务英语教学中中西文化异同的表象 下一篇:商务英语谈判中模糊限制语的语用功能及策略