基于先验信息的改进随机约束两参数估计
Improved Stochastic Restricted Two-Parameter Estimation Based on Prior Information
摘要: 本文主要针对一般线性模型中存在复共线性的情况,结合随机约束条件下的混合估计和基于先验信息的两参数估计提出了一种新的有偏估计,即随机约束改进两参数估计。并在均方误差矩阵准则的意义下研究了随机约束改进两参数估计相对于两参数估计、改进两参数估计混合估计、随机约束岭估计和随机约束两参数估计的优良性。进一步,讨论了偏置参数的选择。同时,通过一个数值算例对所提出的估计的性能进行了说明。
Abstract: This paper mainly aims at the situation where there is complex collinearity in the general linear model. Combining the mixed estimator under the condition of stochastic restricted and the two-parameter estimator of parameter vectors based on prior information, a new biased estimator is proposed, that is, the stochastic constrained modified two-parameter estimator. In the sense of mean square error matrix criterion, the superiority of stochastic constrained modified two-parameter estimator relative to two-parameter estimator, modified two-parameter estimator, mixed estimator, stochastic restricted ridge estimator and stochastic restricted two-parameter estimator are studied. Further, the selection of bias parameters is discussed. At the same time, the performance of the proposed estimator is explained through a numerical example.
文章引用:陈景, 陈菊, 李荣. 基于先验信息的改进随机约束两参数估计[J]. 应用数学进展, 2020, 9(11): 1879-1886. https://doi.org/10.12677/AAM.2020.911216

1. 介绍

考虑线性回归模型的一般形式为:

y = X β + ε (1)

其中y为 n × 1 的观测向量;X为 n × p 的设计矩阵; β p × 1 的未知参数向量; ε n × 1 的随机误差向量。在这里,我们假定 ε 的均值向量和协方差矩阵分别为 E ( ε ) = 0 C o v ( ε ) = σ 2 I n ,其中 I n 是n阶单位矩阵。

在模型(1)中参数向量 β 的最小二乘估计(OLSE)定义为:

β ^ L = ( X X ) 1 X y (2)

当自变量之间出现复共线性时,最小二乘估计不再是良好的估计。为此,相关学者提出了有偏估计作为OLSE的替代估计,以克服复共线性问题。如:岭估计,Liu估计以及两参数估计(TPE)。分别表示如下:

β ^ ( k ) = ( X X + k I ) 1 X X β ^ L (3)

β ^ ( d ) = ( X X + I ) 1 ( X X + d I ) β ^ L (4)

β ^ ( k , d ) = ( X X + k I ) 1 ( X X + k d ) β ^ L (5)

其中 k > 0 0 < d < 1

关于参数向量 β 的估计,相关学者考虑存在一个关于 β 的先验信息b,结合其他有偏估计提出了一系列的改进估计。如Swindel [1] 提出了改进岭估计(MRRE),Li和Yang [2] 提出了改进Liu估计(MLE)等。运用类似的方法,Adewale [3] 结合先验信息和两参数估计(Özkale和Kaciranlar [4] )提出了改进两参数估计(MTPE)。分别表示如下:

β ^ ( k , b ) = ( X X + k I ) 1 ( X X β ^ L + k b ) (6)

β ^ ( d , b ) = ( X X + I ) 1 ( ( X X + d I ) β ^ L + ( 1 d ) b ) (7)

β ^ ( k , d , b ) = ( X X + k I ) 1 ( ( X X + k d ) β ^ L + k ( 1 d ) b ) (8)

其中 k > 0 0 < d < 1 ,b是 β 的先验信息。

另一方面,可以通过对模型(1)添加等式或随机约束的方式来克服多重共线性对参数估计的影响。本文我们假设参数向量受如下随机线性约束:

r = R β + e (9)

其中r为 m × 1 的已知随机向量;R为 m × p 的已知元素矩阵;e为 m × 1 的随机误差向量。在这里,我们假定e的均值向量和协方差矩阵分别为 E ( e ) = 0 C o v ( e ) = σ 2 V ,并假定V是已知的正定矩阵。进一步,我们还假设随机向量 ε 随机独立于e。

Theil和Goldberger [5] 通过构建下面的增广矩阵模型:

( y r ) = ( X R ) β + ( ε e ) (10)

或表示如下:

y m = X m β + u m (11)

其中 y m = ( y r ) X m = ( X R ) u m = ( ε e ) E ( u m ) = 0 C o v ( u m ) = σ 2 N = σ 2 ( I 0 0 V )

并运用最小二乘法得到了 β 的混合估计(OME):

β ^ m = ( S + R V 1 R ) 1 ( X y + R V 1 r ) (12)

其中 S = X X 。混合估计 β ^ m 也可以通过求解以下极值问题而得到:

Ψ 1 = ( y m X m β ) ( y m X m β ) + ( r R β ) V 1 ( r R β )

运用类似的方法Özkale等人 [6] 得到模型(11)中 β 的随机约束岭估计(SRRE)。Hu Yang等人 [7] 提出了一种新的估计方法,称为随机约束两参数估计(SRTPE)。分别表示如下:

β ^ S S R E = ( S + R V 1 R + k I ) 1 ( X y + R V 1 r ) (13)

β ^ y m ( k , d ) = ( S + R V 1 R + k I ) 1 ( X y + R V 1 r + k d β ^ L ) (14)

结合带随机约束的线性模型和基于先验信息的改进两参数估计,我们提出了新估计,即基于先验信息的改进随机约束两参数估计(SRMTPE),如下:

β ^ y m ( k , d , b ) = ( S + R V 1 R + k I ) 1 ( X y + R V 1 r + k d β ^ L + k ( 1 d ) b ) = ( S + R V 1 R + k I ) 1 ( ( S + k d I ) β ^ L + R V 1 r + k ( 1 d ) b ) (15)

已知:

β ^ y m ( 0 , 0 , b ) = β ^ m β ^ y m ( k , 1 , 0 ) = β ^ y m ( k , d ) β ^ y m ( k , d , 0 ) = β ^ y m ( k , d )

β ^ y m ( k , 1 , b ) = β ^ m k R , k 0 β ^ y m ( k , 0 , 0 ) = β ^ S S R E β ^ y m ( 0 , 0 , b ) = β ^ y m ( 0 , 1 , b ) = β ^ L

R = 0 β ^ y m ( k , d , b ) = β ^ ( k , d , b )

因此,可以认为随机约束改进两参数估计 β ^ y m ( k , d , b ) 是OLSE、ME、SRRE、SRTPE、MTPE估计的推广。

我们可以得到的新估计 β ^ y m ( k , d , b ) 的均值向量和协方差矩阵分别为:

E ( β ^ y m ( k , d , b ) ) = ( X X + R V 1 R + k I ) 1 β ( X X + R V 1 R + k d I ) + k ( 1 d ) b ( X X + R V 1 R + k I ) 1 = M ( k ) ( ( S ( k d ) + R V 1 R ) β + k ( 1 d ) b ) (16)

C o v ( β ^ y m ( k , d , b ) ) = σ 2 M ( k ) ( S + k 2 d 2 S 1 + R V 1 R ) M ( k ) (17)

其中 M ( k ) = ( X X + R V 1 R + k I ) 1

从式(16)可知 β ^ y m ( k , d , b ) 是有偏估计。

2. 均方误差矩阵意义下新估计的优良性

在本节中,我们使用均方误差矩阵(MSEM)准则来研究随机约束改进两参数估计(SRMPTE)估计的性能。

首先,我们给出 β 的任一个估计 β ^ * 的均方误差矩阵(MSEM)的定义如下:

M S E M ( β ^ * ) = E ( β ^ * β ) ( β ^ * β ) = C o v ( β ^ * ) + B i a s ( β ^ * ) B i a s ( β ^ * )

其中 C o v ( β ^ * ) 是方差矩阵, B i a s ( β ^ * ) 是偏差向量,且 B i a s ( β ^ * ) = E ( β ^ * ) β

假设 β ^ 1 β ^ 2 为参数向量 β 的两个估计,则 β ^ 1 在均方误差矩阵意义下优于 β ^ 2 当且仅当 M S E M ( β ^ 2 ) M S E M ( β ^ 1 ) 0 ,即差值为正定或半正定矩阵。

引理1. 假设M是一个正定矩阵,即 M > 0 α 是一个向量,当且仅当 α M 1 α 1 M α α 0

引理2. 假设M是一个正定矩阵,N是非负定矩阵。然后有 M N 0 λ max ( N M 1 ) 1

2.1. ME和SRMTPE的MSEM性能比较

ME估计的偏差向量和和协方差矩阵如下:

B i a s ( β ^ m ) = E ( β ^ m ) β = 0 C o v ( β ^ m ) = σ 2 ( S + R V 1 R ) 1

因此,其均方误差矩阵为:

M S E M ( β ^ m ) = σ 2 ( S + R V 1 R ) 1

对于SRMTPE估计,我们进一步有估计 β ^ y m ( k , d , b ) 的偏差向量和均方误差矩阵为:

B i a s ( β ^ y m ( k , d , b ) ) = k ( d 1 ) M ( k ) ( β b )

M S E M ( β ^ y m ( k , d , b ) ) = σ 2 M ( k ) ( S + k 2 d 2 S 1 + R V 1 R ) + k 2 ( d 1 ) 2 M ( k ) ( β b ) ( β b ) M ( k )

其中 S ( k ) = X X + k I S ( k d ) = X X + k d I M ( k ) = ( X X + R V 1 R + k I ) 1

所以,ME估计与SRMTPE估计之间的MSEM差值如下所示:

Δ 1 = M S E M ( β ^ m ) M S E M ( β ^ y m ( k , d , b ) ) = M ( k ) ( σ 2 M 1 k 2 ( d 1 ) 2 ( β b ) ( β b ) ) M ( k )

其中 M 1 = 2 k I + k 2 ( ( X X + R V 1 R ) 1 d 2 ( X X ) 1 )

进一步,我们可以得到以下定理。

定理1. 如果 d 2 λ min ( S + R V 1 R ) 1 S ,那么 Δ 1 0 ,则称在均方误差矩阵准则下 β ^ y m ( k , d , b ) 优于 β ^ m ,当且仅当 k 2 ( d 1 ) 2 ( β b ) M 1 1 ( β b ) σ 2

2.2. MTPE与SRMTPE的MSEM性能比较

MTPE估计的偏差向量和协方差矩阵如下:

B i a s ( β ^ ( k , d , b ) ) = k ( d 1 ) M ( k ) ( β b ) C o v ( β ^ ( k , d , b ) ) = σ 2 S ( k ) 1 S ( k d ) S 1

因此,其均方误差矩阵为:

M S E M ( β ^ ( k , d , b ) ) = σ 2 S ( k ) 1 S ( k d ) S 1

MTPE估计与SRMTPE估计之间的MSEM差值如下所示:

Δ 2 = M S E M ( β ^ ( k , d , b ) ) M S E M ( β ^ y m ( k , d , b ) ) = M ( k ) ( σ 2 M 2 k 2 ( d 1 ) 2 ( β b ) ( β b ) ) M ( k )

其中 M 2 = 2 k I + k 2 ( ( X X + k I ) 1 ( X X + k d I ) ( X X ) 1 d 2 ( X X ) 1 )

类似的,我们可以得到以下定理。

定理2. 如果 d 2 λ min S ( k ) 1 S ( k d ) ,那么 Δ 2 0 ,则称在均方误差矩阵准则下 β ^ y m ( k , d , b ) 优于 β ^ ( k , d , b ) ,当且仅当 k 2 ( d 1 ) 2 ( β b ) M 2 1 ( β b ) σ 2

2.3. SRTPE与SRMTPE的MSEM性能比较

SRTPE估计的偏差向量和协方差矩阵如下:

B i a s ( β ^ y m ( k , d ) ) = k ( d 1 ) M ( k ) β C o v ( β ^ y m ( k , d ) ) = σ 2 M ( k ) ( S + k 2 d 2 S 1 + R V 1 R ) M ( k )

因此,其均方误差矩阵为:

M S E M ( β ^ y m ( k , d ) ) = σ 2 M ( k ) ( S + k 2 d 2 S 1 + R V 1 R ) + k 2 ( d 1 ) 2 M ( k ) β β M ( k )

SRTPE估计与SRMTPE估计之间的MSEM差值如下所示:

Δ 3 = M S E M ( β ^ y m ( k , d ) ) M S E M ( β ^ y m ( k , d , b ) ) = k 2 ( d 1 ) 2 M ( k ) ( β β ( β b ) ( β b ) ) M ( k )

在Li和Yang [8] 采用先验信息 b = 0.95 β ^ L ,所以当 ( β β ( β b ) ( β b ) ) 0 时, Δ 3 0 。所以,

我们有以下定理:

定理3. 对于 0 < d < 1 , k > 0 ,在均方误差矩阵准则下 β ^ y m ( k , d , b ) 优于 β ^ y m ( k , d )

2.4. SSRE与SRMTPE的MSEM性能比较

SSRE估计的偏差向量和协方差矩阵如下:

B i a s ( β ^ S S R E ) = k ( X X + R V 1 R + k I ) 1 β C o v ( β ^ S S R E ) = σ 2 M ( k ) ( S + R V 1 R ) M ( k ) ,因此,其均方误差矩阵为:

M S E M ( β ^ S S R E ) = σ 2 M ( k ) ( S + R V 1 R + k 2 β β ) M ( k )

SSRE估计与SRMTPE估计之间的MSEM差值如下所示:

Δ 4 = M S E M ( β ^ S S R E ) M S E M ( β ^ y m ( k , d , b ) ) = M ( k ) ( σ 2 M 3 + k 2 ( β β ( d 1 ) 2 ( β b ) ( β b ) ) ) M ( k )

其中

M 3 = X X ( X X + k d I ) ( X X ) 1 ( X X + k d I ) = X X ( I ( X X ) 1 ( X X + k d I ) ( X X ) 1 ( X X + k d I ) )

进一步,如果 I ( X X ) 1 ( X X + k d I ) ( X X ) 1 ( X X + k d I ) > 0 ,那么 Δ 4 是正定的。既有 γ i = 1 ( λ i + k d ) 2 λ i 2 γ i 为其特征值。由于 0 < d < 1 , k > 0 ,所以当 λ i < k d 2 时, 1 ( λ i + k d ) 2 λ i 2 > 0 。因此,我们可以表述如下定

理:

定理4. 对于 0 < d < 1 , k > 0 ,当 λ i < k d 2 时,在均方误差矩阵准则下 β ^ y m ( k , d , b ) 优于 β ^ y m ( k , d )

2.5. TPE与SRMTPE的MSEM性能比较

TPE估计的偏差向量和协方差矩阵如下:

B i a s ( β ^ ( k , d ) ) = k ( d 1 ) S ( k ) 1 β C o v ( β ^ ( k , d ) ) = σ 2 S ( k ) 1 S ( k d ) S 1 S ( k d ) S ( k ) 1

因此,其均方误差矩阵为:

M S E M ( β ^ ( k , d ) ) = σ 2 M ( k ) ( S + R V 1 R + k 2 β β ) M ( k ) + k 2 ( d 1 ) 2 S ( k ) 1 β β S ( k ) 1

TPE估计与SRMTPE估计之间的MSEM差值如下所示:

Δ 5 = M S E M ( β ^ ( k , d ) ) M S E M ( β ^ y m ( k , d , b ) ) = σ 2 M ( k ) ( S + R V 1 R + k 2 β β ) M ( k ) + k 2 ( d 1 ) 2 S ( k ) 1 β β S ( k ) 1 σ 2 M ( k ) ( S + k 2 d 2 S 1 + R V 1 R ) k 2 ( d 1 ) 2 M ( k ) ( β b ) ( β b ) M ( k ) = A B

其中 A = M S E M ( β ^ ( k , d ) ) B = σ 2 M ( k ) ( S + k 2 d 2 S 1 + R V 1 R ) + k 2 ( d 1 ) 2 M ( k ) ( β b ) ( β b ) M ( k )

由于A是正定的,如果 A B 0 ,即 A B ,那么 I A 1 / 2 B A 1 / 2 。所以, Δ 5 0 的充分必要条件是 λ max ( A 1 B ) 1 ,其中 λ max ( A 1 B ) 1 A 1 B 的最大特征值。现在我们给出下面的定理。

定理5. 当且仅当 λ max ( A 1 B ) 1 ,在均方误差矩阵准则下 β ^ y m ( k , d , b ) 优于 β ^ ( k , d )

3. 参数k和d的选择

在本节中,我们将讨论用均方误差(MSE)准则选择参数k和d。我们可以首先计算SRMPTE的MSE:

f ( k , d , b ) = M S E ( β ^ y m ( k , d , b ) ) = t r [ M S E M ( β ^ y m ( k , d , b ) ) ] = σ 2 t r [ M ( k ) ( S + k 2 d 2 S 1 + R V 1 R ) M ( k ) ] + k 2 ( d 1 ) 2 ( β b ) M ( k ) M ( k ) ( β b )

通过使函数 f ( k , d , b ) 最小化,可以得到d和k的最优值。对于固定的k,函数 f ( k , d , b ) 关于d求偏导有:

f ( k , d , b ) d = 2 σ 2 k 2 d [ t r ( M ( k ) S 1 M ( k ) ) ] + 2 k 2 ( d 1 ) [ t r ( M ( k ) ( β b ) ( β b ) M ( k ) ) ]

因此,我们可以通过 f ( k , d , b ) d = 0 得到d的最优值,这是由:

d ^ o p t = t r ( M ( k ) ( β ^ b ) ( β ^ b ) M ( k ) ) t r [ M ( k ) ( σ ^ 2 S 1 + ( β ^ b ) ( β ^ b ) ) M ( k ) ]

其中 β ^ , σ ^ 2 β , σ 2 相应的估计。对于固定的d值,关于参数k的最优选择同样通过对函数 f ( k , d , b ) 求偏导得到。接下来我们考虑通过一个实证进一步探讨随机约束改进两参数估计的优良性。

4. 数值例子

我们考虑Gruber (1998)中讨论的数据资料,即1972~1986年法国、德国、日本、前苏联与美国国家研究与开发支出占国民生产总值的百分比,分别记为 x 1 x 2 x 3 x 4 与y,以用来分析随机约束改进两参数估计的优良性。数据资料矩阵如下:

X = ( x 1 , x 2 , x 3 , x 4 ) = ( 1.9 2.2 1.9 3.7 1.8 2.2 2.0 3.8 1.8 2.4 2.1 3.6 1.8 2.4 2.2 3.8 2.0 2.5 2.3 3.8 2.1 2.6 2.4 3.7 2.1 2.6 2.6 3.8 2.2 2.6 2.6 4.0 2.3 2.8 2.8 3.7 2.3 2.7 2.8 3.8 ) y = ( 2.3 2.2 2.2 2.3 2.4 2.5 2.6 2.6 2.7 2.7 )

我们可以计算出如下 β , σ 2 的最小二乘估计(OLSE):

在这里考虑如下随机线性约束:

在几组不同的参数k,d值下,通过计算相应的均方误差表达式,容易得到与之相应的两参数估计、改进两参数估计、混合估计、随机约束岭估计和随机约束两参数估计的均方误差值,见表1

表1可以看出,当参数(k, d)取以上几组参数值时,随机约束改进两参数估计的均方误差值均小于两参数估计、改进两参数估计、混合估计、随机约束岭估计和随机约束两参数估计的均方误差值。即随机约束改进两参数估计在均方误差意义下优于两参数估计、改进两参数估计、混合估计、随机约束岭估计和随机约束两参数估计。这表明我们提出的随机约束改进两参数估计在实际中是有意义的。

Table 1. Estimated MSE values of the TPE, MTPE, ME, SRRE, SRTPE and SRMTPE

表1. TPE、MTPE、ME、SRRE、SRTPE和SRMTPE估计的MSE值

5. 结论

本文在带随机约束的线性模型中结合了考虑先验信息的参数向量的两参数估计,以克服线性回归模型中存在复共线性的问题。并分别通过理论和实证分析,在均方误差矩阵和均方误差意义下探讨了随机约束改进两参数估计的优良性。在理论分析中,得到了随机约束改进两参数估计在均方误差矩阵优于两参数估计、改进两参数估计、混合估计、随机约束岭估计和随机约束两参数估计的充要条件。实证结果表明,在均方误差意义下,随机约束改进两参数估计相对于两参数估计、改进两参数估计、混合估计、随机约束岭估计和随机约束两参数估计具有一定的优越性。

基金项目

贵州民族大学自然科学基金项目(黔科合平台人才[2018]5773-YB04)。

参考文献

[1] Swindel, B.F. (1976) Good Ridge Estimators Based on Prior Information. Communications in Statistics Theory and Methods, 5, 1065-1075.
https://doi.org/10.1080/03610927608827423
[2] Li, Y.L. and Yang, H. (2012) A New Liu-Type Estimator in Linear Regression Model. Statistical Papers, 53, 427-437.
https://doi.org/10.1007/s00362-010-0349-y
[3] Lukman, A.F., Ayinde, K., Kun, S.S. and Adewuyi, E.T. (2019) A Modified New Two-Parameter Estimator in a Linear Regression Model. Modelling and Simulation in Engineering, 2019, Article ID: 6342702.
https://doi.org/10.1155/2019/6342702
[4] Özkale, M.R. and Kaciranlar, S. (2007) The Restricted and Unrestricted Two-Parameter Estimators. Communications in Statistics Theory and Methods, 36, 2707-2725.
https://doi.org/10.1080/03610920701386877
[5] Theil, H. (1963) On the Use of Incomplete Prior Information in Regression Analysis. Journal of the American Statistical Association, 58, 401-414.
https://doi.org/10.1080/01621459.1963.10500854
[6] ÖZkale, M.R. (2009) A Stochastic Restricted Ridge Regression Estimator. Journal of Multivariate Analysis, 100, 1706-1716.
https://doi.org/10.1016/j.jmva.2009.02.005
[7] Yang, H. and Cui, J. (2011) A Stochastic Restricted Two-Parameter Estimator in Linear Regression Model. Communications in Statistics Theory and Methods, 40, 2318-2325.
https://doi.org/10.1080/03610921003778217
[8] Li, Y.L. and Yang, H. (2011) A New Ridge-Type Estimator in Stochastic Restricted Linear Regression. Statistics, 45, 123-130.
https://doi.org/10.1080/02331880903573153