Advances in Applied Mathematics
Vol. 11  No. 08 ( 2022 ), Article ID: 55001 , 11 pages
10.12677/AAM.2022.118615

基于BLUS残差的非线性模型误差分布的拟合优度检验

赵建昕

海军潜艇学院,山东 青岛

收稿日期:2022年7月17日;录用日期:2022年8月11日;发布日期:2022年8月22日

摘要

针对非线性模型误差分布的拟合优度检验问题,不同于文献中利用最小二乘残差(OLS)作为构造检验的样本的作法,这里采用了Theil的BLUS残差作为新的构造检验的样本,解决了经典的残差的奇异非同分布问题。同时利用样本分位点与来自于原假设分布的拟样本分位点间的随机距离来构造新的检验统计量,得到了一类新的拟合优度检验,并将之应用到非线性模型误差分布的检验中。模拟结果显示,在某些备择假设下,新的检验的功效高于原有的基于经验分布函数的检验的功效。

关键词

非线性模型,拟合优度检验,BLUS残差

Test of Goodness of Fit for Error Distribution of Nonlinear Model Based on BLUS Residuals

Jianxin Zhao

Navy Submarine Academy, Qingdao Shandong

Received: Jul. 17th, 2022; accepted: Aug. 11th, 2022; published: Aug. 22nd, 2022

ABSTRACT

Aiming at the problem of goodness of fit test for error distribution of nonlinear model, it is different from the method of using the least square residuals (OLS) as the sample of constructing test in the literature, in this paper, the BLUS (best linear unbiased scale) residuals of Theil are used as the samples of the new structural test, and the problem of the singular non-identical distribution of the classical residuals is solved. At the same time, a new kind of goodness of fit test is obtained by using the random distance between the sample quantiles and the quasi-sample quantiles from the original hypothesis distribution, it is applied to the test of error distribution of nonlinear model. The simulation results show that under some alternatives, the efficiency of the new test is higher than that of the original test based on the empirical distribution function.

Keywords:Nonlinear Model, Goodness of Fit Test, BLUS Residuals

Copyright © 2022 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

非参数回归模型被广泛地应用到诸如生物学、化学和经济学等学科领域中。其一般形式往往写成

Y = m ( x ) + ε (1)

其中m是回归函数,误差 ε 满足 E ( ε ) = 0 E ( ε 2 ) > 0 x是解释变量,总假设对应不同观测值的误差是独立同分布的。

对于误差的分布,若有附加的信息能改善统计分析的有效性。例如,在正态误差的假定下,精确或最优的检验在很多情形下可以得到。一个典型的例子是误差分布在正态分布的假设下,考虑回归函数m的拟合优度检验问题(见文献 [1] [2] [3])。因此,误差分布的正态性检验,即检验(2)是重要的。近期的有Jurečková, Picek & Sen (2003) [4],Sen, Jurečková & Picek (2003) [5],这两篇文章是基于Shapiro & Wilk (1965) [6] 检验统计量的思想用残差构造检验。Jurečková, Picek (2007) [7] 进一步利用Shapiro & Wilk (1965) [6] 检验统计量的思想,通过标准化的残差构造了检验统计量。而Natalie & Holger (2006) [8] 利用最小二乘残差的经验过程,以Kolmogorov-Smirnov (KS)检验统计量为基础,结合Bootstrap方法研究了误差分布的拟合优度检验。Marie & Simos G (2007) [9] 用最小二乘残差构造经验特征函数,以L2-型距离研究了误差分布的拟合优度检验。Christensen & Sun (2010) [10],Christensen & Lin (2015) [11] 和Hattab & Christensen (2018) [12] 利用残差的部分和构造检验统计量。

本文要研究的问题是

H : ε ~ N ( 0 , σ 2 ) . (2)

关于检验(2)涉及到两个重要的量,一是样本;二是检验统计量。上述文献中,都是利用模型的最小二乘残差(OLS)来构造检验,这是一类重要的方法。但是存在着如下问题,即在正态原假设下,易知OLS残差向量有奇异的正态分布,并且向量的分量之间不再是独立同分布的。显然,用OLS残差来构造检验,特别是利用残差作为新的样本,用已有的如Shapiro-Wilk检验来构造检验时略显得不自然,因为像Shapiro-Wilk等检验原来构造的基础是来自于同一个分布的独立样本。其次,利用的检验统计量大多是基于EDF的检验统计量,具体见下节。

为解决第一个问题,Theil [13] 提出了一种最优线性无偏尺度残差(BLUS),证明了在正态原假设下,BLUS残差向量不同于OLS残差,有非奇异的正态分布,并且向量的分量之间是独立同分布的。

关于检验统计量,Zhao (2009) [14] 利用样本分位点和来自于原假设分布的随机样本分位点的距离构造了一种新的检验,在简单假设和复合假设下,模拟结果显示,构造的检验统计量有较好的检验功效。

鉴于上面的分析,下面以Zhao (2009, 2014) [14] [15] 的检验统计量为基础,以BLUS残差作为新样本,构造非线性模型误差分布的拟合优度检验统计量。

2. BLUS残差

对于线性模型(3),

Y = X β + ε , E ε = 0 , E ε ε T = σ 2 I (3)

回归系数的最小二乘估计为 β ^ = ( X T X ) 1 X T y ,用e表示与误差向量ε有关的OLS残差,则有

e = y X β ^ = ( I X ( X T X ) 1 X T ) y = M y = M ε . (4)

由此可得, E e = 0 E e e T = σ 2 M

按照Theil (1968) [13],BLUS残差是由下面步骤得到的:

首先,选择矩阵M的主对角元素中最小的k个元素,按照这k个元素所在行的位置重新排列观测值y,不妨将它们放在开始的前k个位置(Ramsey (1969) [16])。这样便将原模型分块得到

( y 0 y 1 ) = ( X 0 X 1 ) β + ( ε 0 ε 1 ) (5)

M = [ I X 0 ( X T X ) 1 X 0 T X 0 ( X T X ) 1 X 1 T X 1 ( X T X ) 1 X 0 T I X 1 ( X T X ) 1 X 1 T ] (6)

其中(6)式中左上角的Ik × k单位矩阵,右下角的I ( n k ) × ( n k ) 单位矩阵。

其次,计算矩阵 X 0 ( X T X ) 1 X 0 T 的特征根 d 1 2 , , d k 2 和相应的特征向量 q 1 , , q k

最后,计算BLUS残差 ε ^ = e 1 X 1 X 0 1 [ i = 1 k d i 1 + d i q i q i T ] e 0 ,这里的 e 0 , e 1 是对应(5)式中的误差项的分块残差向量。

此时在原假设(2)下,BLUS残差向量 ε ^ ~ N ( 0 , σ 2 I n k ) 。下一节的检验都是以此为新的样本来构造检验的。记 ε ^ ( 1 ) , , ε ^ ( m ) 为BLUS残差的次序统计量, m = n k F0(x)是标准正态分布。

3. 检验统计量

选择的检验统计量基于经验分布函数的有KS统计量

D ^ m = m max 1 i m { | i m F 0 ( ε ˜ ) | , | i 1 m F 0 ( ε ˜ ) | } (7)

和AD统计量

A ^ m 2 = 1 m i = 1 m [ ( 2 i 1 ) log F 0 ( ε ˜ ) + ( 2 m + 1 2 i ) log ( 1 F 0 ( ε ˜ ) ) ] m (8)

其中 ε ˜ = ε ^ ( i ) / S m 2 ,考虑到原假设的均值为0,误差方差的参数估计选择 S m 2 = 1 / m i = 1 m ε ^ i 2

基于样本次序统计量或样本分位点的检验统计量有 Shapiro & Wilk检验统计量

W = ( i = 1 m a i ε ^ ( i ) ) 2 m S m 2 (9)

其中 a = ( a 1 , , a m ) T = V 1 E W ˜ E W ˜ T V 1 V 1 E W ˜ V = ( v i j ) = V a r ( W ˜ E W ˜ ) W ˜ = ( W ˜ ( 1 ) , , W ˜ ( m ) ) 是来自 F 0 ( ) 的样本次序统计量。

基于de Wet and Venter [17] 思想构造的统计量

T ^ 2 = i = 1 m ( ε ^ ( i ) θ ^ F 0 1 ( i m + 1 ) ) 2 (10)

其中 F 0 1 ( u ) = inf { x : F 0 ( x ) u } θ ^ = S m 2 是标准误差方差的估计。

del Barrio, Couesta-Albertos, Matrán, Rodríguez-Rodríguez (1999) [18] 提出的基于L2-Wasserstein距离构造的统计量

B C M R ^ = 1 ( i = 1 m ε ^ ( i ) ( i 1 ) / m i / m Φ 1 ( t ) d t ) 2 S m 2 (11)

Zhao (2009) [14] 模拟结果显示,以样本随机距离方法构造的检验,两种不同的参数估计方法得到的检验,其功效相差不大,故而此处仅选择基于最小距离的参数估计方法构造的检验作为研究的新检验。即选择检验统计量为:

Z R ^ 2 = i = 1 m Z ( i ) 2 + ( i = 1 m ε ^ ( i ) Z ( i ) ) 2 i = 1 m ε ^ ( i ) 2 (12)

其中 Z ( 1 ) , , Z ( m ) 是来自于标准正态分布的容量为m的样本所对应的次序统计量。 Z R ^ 2 是尺度不变的。同样的理由,可以取 Z R ^ 2 q分位点和期望作为检验统计量。这里我们仅选取q = 0.05, q = 0.50, q = 0.95作为分位点统计量 Z R ^ 2 , q 。利用BLUS残差求解各个检验统计量的临界值算法详见Zhao (2014) [15] 中的算法,此处略去。

4. 数值模拟

假设回归函数足够的光滑,则总可以在某个点x0处将未知的回归函数展开成泰勒级数。选择上节给出的检验统计量构造检验,检验水平为5%。根据假设,回归函数可以在某个点x0处展开成

m ( x ) = β 0 + β 1 ( x x 0 ) + + β k ( x x 0 ) k + r k

其中rk是余项。本节的x0 = 0.2,k取1,4。考虑的非线性模型为

y i = ( x i 0.5 ) 2 + ε i , i = 1 , 2 , , n (13)

y i = e x i + ε i , i = 1 , 2 , , n (14)

y i = sin ( 2 π x i ) + ε i , i = 1 , 2 , , n (15)

Xi ε i 相互独立,并来自于均匀分布,对给定的样本容量,这些值为常数。误差变量ε按照下述设定的备择分布抽取。

k = 1时,取备择分布

第一组:误差服从非正态分布,有自由度为3的卡方分布χ2 (3),形状参数为1.5的Gamma分布函数Gamma(1.5),双指数分布Laplace(0, 1),Cauchy(0, 1)。

第二组:异方差,此时考虑的模型是

y i = ( x i 0.5 ) 2 + σ i ε ¯ i , i = 1 , 2 , , n (16)

y i = e x i + σ i ε ¯ i , i = 1 , 2 , , n (17)

y i = sin ( 2 π x i ) + σ i ε ¯ i , i = 1 , 2 , , n (18)

这里的 σ i 服从均匀分布U(0, 50), i = 1 , 2 , , n 。同时,误差变量ε分别服从Logistic(0, 1),Cauchy(0, 1),N(0, 1)和Laplace(0, 1)。

k = 4 时,取备择分布

上述第一组和下面的第三组:回归误差具有非零均值的离群点,有

ε i ~ N ( 8 , 1 ) , i = 1 , 2 , 3 , ε i ~ N ( 0 , 1 ) , i = 4 , , n

ε i ~ N ( 8 , 1 ) , i = 1 , , 5 , ε i ~ N ( 0 , 1 ) , i = 6 , , n

和高杠杆离群点,即

ε i ~ N ( 8 , 1 ) , i = 1 , 2 , 3 , x 11 = x 12 = x 13 = x 14 = 2 , ε i ~ N ( 0 , 1 ) , i = 4 , , n

ε i ~ N ( 8 , 1 ) , i = 1 , , 5 , x 11 = x 12 = x 13 = x 14 = 2 , ε i ~ N ( 0 , 1 ) , i = 6 , , n .

在这一小节中,样本容量取n = 20, 50,经验的检验功效是10,000次模拟得到的。模拟结果分别放在表1~4中。

k = 1时,如表1表2所示:

Table 1. The level is 5%, the sample size is 20, three models, the regression function is approximated by first order polynomial, the error distribution is normal distribution

表1. 水平为5%,样本容量为20,三个模型,回归函数一阶多项式近似,误差分布为正态分布假设下的检验功效

a误差εF1(x):ε服从Cauchy分布;F2(x):ε服从Laplace分布;F3(x):ε服从Logistic分布,F4(x):ε服从标准正态分布;σ~U(0, 50)。

bG(1.5):形状参数为1.5的Gamma分布。

Table 2. The level is 5%, the sample size is 50, three models, the regression function is approximated by first order polynomial, the error distribution is normal distribution

表2. 水平为5%,样本容量为50,三个模型,回归函数一阶多项式近似,误差分布为正态分布假设下的检验功效

a误差 ε = σ ε ¯ F1(x): ε ¯ 服从Cauchy分布;F2(x): ε ¯ 服从Laplace分布;F3(x): ε ¯ 服从Logistic分布;F4(x): ε ¯ 服从标准正态分布;σ~U(0, 50)。

bG(1.5):形状参数为1.5的Gamma分布。

1) 对于这三个非线性模型,当备择分布是非正态分布函数时, Z R ^ 2 , q = 0.05 的检验功效显著地比其它的检验高; Z R ^ 2 , μ T2在容量为20时,两者的检验功效相差不大,但在容量为50时,对非对称备择分布,BCMRT2W Z R ^ 2 , μ 相差不大,对于对称备择分布,T2最好,次之为 Z R ^ 2 , μ 。总之在新检验的对手中,T2最好,次之为BCMR,Shapiro-Wilk检验好于另外两个经典统计量。

2) 对于备择分布为N(0, 1),此时的检验功效即为第一类错误的概率,从表1表2中可知,在不同的非线性模型中,所有的检验在不同的样本容量下,基本充分的利用了5%的检验水平。

3) 对第二组的备择分布,即异方差的情形, Z R ^ 2 , q = 0.05 的检验功效显著地比其它的检验高,其它的结果类似于(1)中的结果。

k = 4时,从表3表4中不难发现模拟结果有所变化,具体是:

Table 3. The level is 5%, the sample size is 20, three models, the regression function is approximated by fourth-order polynomial, the error distribution is normal distribution

表3. 水平为5%,样本容量为20,三个模型,回归函数四阶多项式近似,误差分布为正态分布假设下的检验功效

aG(1.5):形状参数为1.5的Gamma分布。

bF1(x):εi~N(8, 1), i = 1, 2, 3且x11 = x12 = x13 = x14 = 2;F2(x):εi~N(8, 1), i = 1, …, 5且x11 = x12 = x13 = x14 = 2;F3(x):εi~N(8, 1), i = 1, 2, 3且εj~N(0, 1), i = 4, …, nF4(x):εi~N(8, 1), i = 1, …, 5且εj~N(0, 1), i = 6, …, n

Table 4. The level is 5% , the sample size is 50, three models, the regression function is approximated by fourth-order polynomial, the error distribution is normal distribution

表4. 水平为5%,样本容量为50,三个模型,回归函数四阶多项式近似,误差分布为正态分布假设下的检验功效

aG(1.5):形状参数为1.5的Gamma分布。

bF1(x):εi~N(8, 1), i = 1, 2, 3且x11 = x12 = x13 = x14 =2;F2(x):εi~N(8, 1), i = 1, …, 5且x11 = x12 = x13 = x14 =2;F3(x):εi~N(8, 1), i = 1, 2, 3且εj~N(0, 1), i = 4, …, nF4(x):εi~N(8, 1), i = 1, …, 5且εj~N(0, 1), i = 6, …, n

4) 对于模型(13, 14, 15),当样本容量为20时,对于非正态备择分布, Z R ^ 2 , q = 0.05 的检验功效显著地比其它的检验高; Z R ^ 2 , μ T2在容量为20时,两者的检验功效相差不大,但在容量为50时,对非对称备择分布,BCMRT2W Z R ^ 2 , μ 相差不大,但对于对称备择分布,T2最好,次之为 Z R ^ 2 , μ 。总之在新检验的对手中,T2最好,次之为BCMR,Shapiro-Wilk检验好于另外两个经典统计量。

5) 对于备择分布为N(0, 1),结果类似于(2)。

6) 对第三组中的备择分布 F 1 ( x ) : ε i ~ N ( 8 , 1 ) , i = 1 , 2 , 3 x 11 = x 12 = x 13 = x 14 = 2 ,在样本容量为 20 时,新的检验中 Z R ^ 2 , q = 0.95 表现最好,但与 Z R ^ 2 , q = 0.50 Z R ^ 2 , μ 相差不大。与比较的检验相比,差别也不大,其中BCMRW稍好。而 Z R ^ 2 , q = 0.05 表现差一些。但在样本容量为50时,除了模型(13)中, Z R ^ 2 , q = 0.05 的检验功效最好外,其它两个模型的检验的功效规律不变,但模型(13, 15)的所有检验的功效在减少。备择分布为 F 4 ( x ) : ε i ~ N ( 8 , 1 ) , i = 1 , , 5 ε j ~ N ( 0 , 1 ) , i = 6 , , n 时,结果类似。对于另外两种备择,各个检验在样本容量不同时,检验功效变化比较大。这说明在有离群点的备择分布下,如果回归函数展开的项数越多,检验的规律越不清楚。

7) 比较同一个模型下,备择分布为非正态分布时,各个检验的功效都随着回归函数展开的项数增加而减少。这说明回归函数估计的精度影响到了检验的功效,但各个检验的功效的大小关系没有因为回归函数展开的项数变化而变化。

5. 结束语

基于BLUS残差,利用残差顺序统计量和伪随机样本顺序统计量之间的差异,构造了分位数类型统计量和条件期望类型检验统计量,用于检验非线性模型的误差分布正态性。仿真结果表明,本文提供的检验方法有较好的检验功效。当然,如何在众多的检验中选择出更优的检验,分位点类型检验有没有恰当的选择标准?对于非线性模型中误差分布的拟合优度检验问题,回归函数的局部多项式展开项数有无合适的判断准则?都是值得进一步研究的问题。

致谢

作者非常感谢相关文献对本文的启发以及审稿专家提出的宝贵意见。

文章引用

赵建昕. 基于BLUS残差的非线性模型误差分布的拟合优度检验
Test of Goodness of Fit for Error Distribution of Nonlinear Model Based on BLUS Residuals[J]. 应用数学进展, 2022, 11(08): 5831-5841. https://doi.org/10.12677/AAM.2022.118615

参考文献

  1. 1. Eubank, R.L., Hart, J.D. and Lariccia, V.N. (1993) Testing Goodness of Fit via Nonparametric Function Estimation Techniques. Communication in Statistics—Theory and Methods, 22, 3327-3354. https://doi.org/10.1080/03610929308831219

  2. 2. Eubank, R.L. and Hart, J.D. (1992) Testing Goodness-of-Fit in Regression via Order Selection Criteria. The Annals of Statistics, 20, 1412-1425. https://doi.org/10.1214/aos/1176348775

  3. 3. Young, S.G. and Bowman, A.W. (1995) Non-Parametric Analysis of Covariance. Biometrics, 51, 920-931. https://doi.org/10.2307/2532993

  4. 4. Jurečková, J., Picek, J. and Sen, P.K. (2003) Goodness-of-Fit Test with Nuisance Regression and Scale. Metrika, 58, 235-258. https://doi.org/10.1007/s001840300262

  5. 5. Sen, P.K., Ju-rečková, J. and Picek, J. (2003) Goodness-of-Fit Test of Shapiro-Wilk Type with Nuisance Regression and Scale. The Austrian Journal of Statistics, 32, 163-177.

  6. 6. Shapiro, S.S. and Wilk, M.B. (1965) An Analysis of Variance Test for Normality. Biomatrika, 52, 591-611. https://doi.org/10.1093/biomet/52.3-4.591

  7. 7. Jurečková, J. and Picek, J. (2007) Shapiro-Wilk Type Test of Nor-mality under Nuisance Regression and Scale. Computational Statistics & Data Analysis, 51, 5184-5191. https://doi.org/10.1016/j.csda.2006.08.026

  8. 8. Neumeyer, N., Dette, H. and Nagel, E.-R. (2006) Bootstrap Tests for the Error Distribution in Linear and Nonparametric Regression Models. Australian and New Zealand Journal of Sta-tistics, 48, 129-156. https://doi.org/10.1111/j.1467-842X.2006.00431.x

  9. 9. Hušková, M. and Merintanis, S.G. (2007) Omnibus Tests for the Error Distribution in the Linear Regression Model. Statistics, 41, 363-376. https://doi.org/10.1080/02331880701442643

  10. 10. Christensen, R. and Sun, S.K. (2010) Alternative Good-ness-of-Fit Tests for Linear Models. Journal of the American Statistical Association, 105, 291-301. https://doi.org/10.1198/jasa.2009.tm08697

  11. 11. Christensen, R. and Lin, Y. (2015) Lack-of-Fit Tests Based on Partial Sums of Residuals. Communications in Statistics—Theory and Methods, 44, 2862-2880. https://doi.org/10.1080/03610926.2013.844256

  12. 12. Hattab, M.W. and Christensen, R. (2018) Lack of Fit Tests Based on Sums of Ordered Residuals for Linear Models. Australian & New Zealand Journal of Statistics, 60, 230-257. https://doi.org/10.1111/anzs.12231

  13. 13. Theil, H. (1968) A Simplification of the Blus Procedure for Analyzing Re-gression Disturbances. Journal of the American Statistical Association, 63, 242-251. https://doi.org/10.1080/01621459.1968.11009238

  14. 14. Zhao, J., Xu, X. and Ding, X. (2009) Some New Good-ness-of-Fit Tests Based on Stochastic Sample Quantiles. Communications in Statistics-Simulation and Computation (SCI), 38, 571-589. https://doi.org/10.1080/03610910802585832

  15. 15. Zhao, J.X. and Xu, X.Z. (2014) Good-ness-of-Fit Tests for Location—Scale Families Based on Random Distance. Journal of Statistical Computation and Sim-ulation, 84, 739-752. https://doi.org/10.1080/00949655.2012.725246

  16. 16. Ramsey, J.B. (1969) Tests for Specifi-cation Errors in Classical Linear Least Squares Regression Analysis. Journal of the Royal Statistical Society, Ser. B, 31, 350-371. https://doi.org/10.1111/j.2517-6161.1969.tb00796.x

  17. 17. De Wet, T. and Venter, J.H. (1972) Asymptotic Distributions of Certain Test Criteria of Normality. The South African Statistical Journal, 6, 135-149.

  18. 18. Del Barrio, E., Couesta-Albertos, J.A., et al. (1999) Tests of Goodness of Fit Based on the L2-Wasserstein Distance. The Annals of Statistics, 27, 1230-1239. https://doi.org/10.1214/aos/1017938923

期刊菜单