响应变量缺失的半参数 EV 模型估计的渐近正态性 Asymptotic Properties for Estimators in Semi-Parametric Error-in-Variables Model with Missing Responses

doi:10.12677/AAM.2022.117460

设为首页加入收藏期刊导航网站地图

期刊菜单

文章导航

AdvancesinAppliedMathematics应用数学进展,2022,11(7),4335-4354

PublishedOnlineJuly2022inHans.http://www.hanspub.org/journal/aam

https://doi.org/10.12677/aam.2022.117460

响应变量缺失的半参数EV模型估计的

渐近正态性

杨雪，张晶晶

，胡婷婷

上海理工大学理学院，上海

收稿日期：2022年6月6日；录用日期：2022年7月1日；发布日期：2022年7月8日

摘要

本文重点研究半参数模型中估计量的性质，根据实际情况特别考虑了缺失数据和测量误差的影响。

缺失数据采用三种不同的方法处理：直接删除法、插值填补法和回归插值法。同时，得到了斜率参

数和非参数变量的相应估计量。在合适的条件下，我们深入研究了这些估计量的渐近正态性，为

未知参数和函数的置信区间的构建提供了基础。此外，在不同的样本量和缺失概率下也对理论结

果进行了数值模拟，其结果与理论结果一致。

关键词

半参数模型，测量误差，响应变量缺失，渐近正态性

AsymptoticPropertiesforEstimatorsin

Semi-ParametricError-in-Variables

ModelwithMissingResponses

XueYang,JingjingZhang

∗

,TingtingHu

CollegeofScience,UniversityofShanghaiforScienceandTechnology,Shanghai

*通讯作者。

文章引用:杨雪,张晶晶,胡婷婷.响应变量缺失的半参数EV模型估计的渐近正态性[J].应用数学进展,2022,

11(7):4335-4354.DOI:10.12677/aam.2022.117460

杨雪等

Received:Jun.6

,2021;accepted:Jul.1

,2022;published:Jul.8

,2022

Abstract

Thispaper,concentratingonthepropertiesofestimatorsinsemi-parametricmodels,

particularlyconsiders theeﬀectsofmissingdataand measurementerrorsaccordingto

theactualsituation.Themissingdataareprocessedbythreediﬀerentmethods:di-

rectdeletionmethod,imputation(interpolationﬁll)method,andregressionsurrogate

method.Also,thecorrespondingestimatorsofslopeparameterandnon-parameter

variableareobtained.Undersuitableconditions,theasymptoticnormalityofthese

estimatorsisstudiedthoroughly,whichprovidesthebasisfortheconstructionofcon-

ﬁdenceintervalsforunknownparametersandfunctions.Inaddition,diﬀerentsample

sizesandmissingprobabilitiesweresetforsimulation,whoseresultsareconsistent

withthetheoreticalresults.

Keywords

Semi-ParametricModel,Error-in-Variables,MissingResponses,Asymptotic

Normality

This work is licensed under theCreative Commons Attribution InternationalLicense (CCBY4.0).

http://creativecommons.org/licenses/by/4.0/

1.引言

在下列的半参数EV模型中：







=ξ

β+g(t

)+ϵ

=ξ

+µ

(1.1)

是标量响应变量,(ξ

)是设计点，x

是观察到的带有测量误差µ

的随机变量.当Eµ

=0，ϵ

是统计误差并且Eϵ

=0.β∈R是一个需要被估计的未知的参数.g(·)是一个未知的在[0,1]上取

DOI:10.12677/aam.2022.1174604336应用数学进展

杨雪等

值的函数，h(·)是一个定义在[0,1]上已知的函数，并且满足

=h(t

)+v

�(1.2)

其中v

是设计点.

模型(1.1)一直是统计研究中的重要问题之一.当µ

≡0，ξ

被精确观察到时，模型(1.1)就

简化为一般的半参数模型，该模型由Engle等[1]首次引入.Huybrechts等[2]研究了一个随机缺

失响应的半参数回归模型.Wang等[3]考虑了聚类数据的边际广义半参数部分线性模型.半参数

模型的广泛应用对参数估计器的发展和估计器的效率具有重要意义.

近20年来，测量误差数据的统计研究越来越受到重视，因为它出现在医学、经济学和工程学

等多个学科领域.毫无疑问，最终结果会存在偏差.当y

能够被完全观察到并且g(·)≡0，模型

(1.1)被简化为通常的线性EV模型.Hu等[4]考虑了用于测试序列相关性的经验对数似然比.Cui

andChen[5]提出了一个受约束的经验似然置信区域.当g(·)̸=0时，模型(1.1)也被很多学者研

究过.Ahmad等[6]建立了模型有限维参数估计量的一致性和

√

n-正态性属性.Chen[7]讨论了协

变量中的正确测量误差.因此，有必要使用相应的测量误差模型，该模型一直在不断发展.

大多数提到的结果都是在完整的数据下建立的，但是，我们经常会因为各种原因遇到不完整

的数据，其中之一是数据丢失.丢失数据可能是由于实践中的技术故障、预算限制或受试者拒绝

回答问题.为了防止估计量有偏差或效率低下，我们经常需要对缺失机制做出一些假设，大致可

以分为完全随机缺失（MCAR）、随机缺失（MAR）和非随机缺失（NMAR），以及其细节可以在

Ibrahim等[8]和Rubin[9]的著作中看到.在MCAR条件下，Mirjam等[10]总结了最常用的完

整案例分析（CC）的优缺点.Geert等[11]表明，基于MI的模型与在不同条件下推导的模型没

有太大区别.当数据为MAR时，Li等[12]提出了一类失拟检验，用于拟合一些响应变量随机缺

失的线性回归模型.对于NMAR，Yutaka等[13]提出了一种具有或不具有平均结构的多样本分

析，以使模型中所有参数的估计量一致且渐近正态.

处理缺失数据的方法已被广泛研究，其中缺失数据插补是最流行的一种.使用这种方法，可以

为每个缺失的数字估算一个合理的值，然后分析结果，就好像它们是完整的一样.在回归问题中，

常用的插补方法包括Healy和Westmacott[14]的线性回归插补，Cheng[15]的非参数核回归插

补，以及Wang和Sun[16] 的半参数回归插补.我们在这里将这些方法扩展到模型(1.1)下的β和

g(·)的估计.我们获得了三种方法去估计有缺失响应的β和g(·)，并研究估计量的渐近正态性.

在本文中，我们研究了具有固定设计的模型的参数估计：假设我们从模型(1.1)获得一个不完

整的随机样本数据{(y

,δ

)}，其中δ

是一个数，如果y

缺失，δ

=0；否则δ

=1.我们假

设y

是随机缺失的，这对于缺失数据的统计分析是一个常见的假设，在许多实际情况下是合理的.

本文的结构如下.在第2部分，我们列出一些假设.主要结果在第3部分.第4部分介绍了一

项模拟研究.一些初步的引理在第5部分.主要结果的证明见第6部分.

DOI:10.12677/aam.2022.1174604337应用数学进展

杨雪等

2.假设

在这个部分,我们列出一些会在下面主要结果中用到的假设.这里a

=O(b

)意味着

|≤C|b

|,a

=o(b

)意味着当n→∞，a

→0,而a.s.代表几乎处处.

(A0)令{ϵ

,1≤i≤n}和{µ

,1≤i≤n}是独立的随机变量满足

(i)Eϵ

=0,Eµ

=Ξ

>0.

(ii)sup

E|ϵ

<∞,sup

E|µ

<∞对于某个r

>8/3,r

>4.

(iii){ϵ

,1≤i≤n}和{µ

,1≤i≤n}彼此独立.

(A1)令{v

,1≤i≤n}in(1.2)是一个序列满足

(i)lim

n→∞

−1



i=1

=Σ

,lim

n→∞

−1



i=1

=Σ

(0<Σ

,Σ

<∞).

(ii)lim

n→∞

sup

(

√

nlogn)

−1

·max

1≤m≤n



i=1

|<∞,其中{j

,...,j

}是一个(1,2,...,n)

的排列.

(iii)max

1≤i≤n

|=O(n

1/2

log

−1

n).

(iv)max

1≤i≤n

|=O(n

1/4

(A2)g(·)和h(·)都是连续的函数并在闭区间[0,1]上满足一阶Lipschitz条件.

(A3)令W

)(1≤i,j≤n)是定义在[0,1]上的权函数，并满足

(i)max

1≤j≤n



i=1

)=O(1)

(ii)max

1≤i≤n



j=1

)I(



−t



>a·n

−1/4

log

−1

n)=o(n

−1/4

log

−1

n)对于任意a>0.

(iii)max

1≤i,j≤n

)=o(n

−1/2

log

−2

(A4)概率权重函数W

)(1≤i,j≤n)定义在[0,1]上并且满足

(i)max

1≤j≤n



i=1

)=O(1).

(ii)max

1≤i≤n



j=1

)I(



−t



>a·n

−1/4

log

−1

n)=o(n

−1/4

log

−1

n)，对于任何a>0.

(iii)max

1≤i,j≤n

)=o(n

−1/2

log

−1

n).

󰨟2.1条件(A0)-(A4)是标准正则条件，并且在大量著作中被使用.[Härdle等[17],Gao等[18]

和Chen[19]]

3.主要结果

对于模型(1.1)，我们寻求β和g(·)是删除所有丢失的数据.因此，我们可以得到模型

=δ

β+δ

g(t

)+δ

.如果可以观察到ξ

，我们可以应用最小二乘估计（LSE）方法来估计

参数β.如果参数β已知，则使用完整的数据{(δ

,δ

),1≤i≤n}，我们可以定义g(·)的

估计量为

∗

(t,β)=



j=1

(t)(δ

−δ

β),

DOI:10.12677/aam.2022.1174604338应用数学进展

杨雪等

其中W

(t)是满足(A3)的权重函数.在另一方面，在这种半参数EV模型的条件下，梁等[20]

在通常的部分线性模型基础上改进了LSE方法，并使用参数β的估计来最小化以下公式：

SS(β)=



i=1





−x

β−g

∗

,β)



−Ξ



=min!

因此，我们可以实现β的修改LSE如下：





i=1

(δ

−δ

)



−1



i=1

,(3.1)

其中

−



j=1

−



j=1

.我们将(3.1)带入g

∗

(t,β)，然后我

们可以得到如下公式：

ˆg

(t)=



j=1

(t)(y

−x

).(3.2)

显然，我们没考虑所有样本信息然后得到了估计量

和ˆg

(t).因此，为了弥补缺失的数据，

我们采用来自Wang和Sun[16]的插补方法，即

[I]

=δ

+(1−δ

)[x

+ˆg

)].(3.3)

因此，使用完整数据{(U

[I]

)�1≤i≤n}，类似于(3.1)-(3.2)，我们可以得到另一个β和g(·)

的估计量，即





i=1

(˜x

−Ξ

)



−1



i=1

˜x

[I]

,(3.4)

ˆg

[I]

(t)=



j=1

(t)(U

[I]

−x

).(3.5)

其中

[I]

−



j=1

[I]

,˜x

−



j=1

(t)是满足(A4)的权重函数.

第三，WangandSun[16]提出了一种所谓的半参数回归代理方法，它使用估计的半参数回归

值而不是相应的用于定义估计量的响应值，无论响应是否被观察到.令

[R]

+ˆg

).(3.6)

因此,使用完整数据{(U

[R]

),1≤i≤n},类似于(3.1)-(3.2),我们可以得到β和g(·)的第三

个估计,即





i=1

˜x



−1



i=1

˜x

[R]

,(3.7)

DOI:10.12677/aam.2022.1174604339应用数学进展

杨雪等

ˆg

[R]

(t)=



j=1

(t)(U

[R]

−x

),(3.8)

其中

[R]

−



j=1

[R]

(t)是满足(A4)的权重函数.

基于β和g(·)的第三个估计,我们采取一些将被使用的符号并且有以下结果：

=ξ

−



j=1

)ξ

=ξ

−



j=1

)ξ



i=1

(

)



i=1

(

)

=Var





i=1



(

+µ

)(ϵ

−µ

β)+Ξ







(˜x

−Ξ

),D

−2

(1−δ

)

=Var





i=1



(

)(ϵ

−µ

β)+(1+D

)



−(µ

−Ξ

)β





(t)=Var





j=1

(t)δ

(ϵ

−µ

β)



,Γ

(t)=Var





i=1

)



j=1

(t)δ

(ϵ

−µ

β)



󱄽3.1假设(A0),(A1)(i)(ii)(iii),(A2),(A3)满足.

(a)如果Σ

≥Cn对于所有的n,那么S

(

−β)/Σ

−→N(0,1)

(b)如果nΓ

(t)→∞对于每个t∈[0,1],那么[ˆg

(t)−Eˆg

(t)]/Γ

(t)

−→N(0,1)

󱄽3.2假设(A0)-(A4)满足.

(a)如果Σ

≥Cn对于所有的n,那么R

(

−β)/Σ

−→N(0,1)

(b)如果nΓ

(t)→∞对于每个t∈[0,1],那么[ˆg

(t)−Eˆg

(t)]/Γ

(t)

−→N(0,1)

󱄽3.3假设(A0)-(A4)满足.

(a)如果Σ

≥Cn对于所有的n,那么S

(

−β)/Σ

−→N(0,1)

(b)如果nΓ

(t)→∞且在(A0)中对于每个t∈[0,1]和r

>4,r

>8，那么

[ˆg

(t)−Eˆg

(t)]/Γ

(t)

−→N(0,1)

4.模拟研究

在本节中，我们进行了一个模拟来研究提出估计的有限样本表现.尤其：

(i)我们给出β和g(·)的估计量的QQ图.

(ii)我们展示了g(·)的估计量的拟合曲线.

DOI:10.12677/aam.2022.1174604340应用数学进展

杨雪等

观察量来自







=ξ

β+g(t

)+ϵ

=ξ

+µ

,i=1,2,···,n,

其中β=1,g(t)=sin(2πt),t

=( i−0.5)/n,ξ

以及{v

,1≤i≤n}是独立同分布的

N(0,1)序列,{µ

,1≤i≤n}和{ϵ

,1≤i≤n}是独立同分布的N(0,0.2

)序列.这三个随机序列

彼此独立.这里,p是假设满足|p|<1的实数.对于提出的估计量，加权函数取

(t)=

K((t−t

)/h

)



j=1

K((t−t

)/h

)

(t)=

M((t−t

)/b

)



j=1

M((t−t

)/b

)

其中K(·)和M(·)是高斯核函数并且满足(A1)-(A4),其中h

和b

是两个带宽.

下一步,我们从以上模型产生n=100,300和500的样本.我们考虑丢失的概率p分别设定为

0.1,0.25,和0.5.然后β估计量的基于M=500重复量的MSE定义为

MSE(

β)=



l=1



β(l)−β



g(·)估计量的GMSE定义为

GMSE(ˆg)=



l=1



k=1



ˆg(t

,l)−g(t

)



众所周知，在任何有限样本研究中选择窗口宽度都是非常关键的.带宽选择规则之一是删除一

交叉验证规则.由于我们的估计器涉及两个窗口宽度，情况变得更加复杂.具体步骤如下：

CV(h



i=1

−x

−i

−ˆg

−i

))

通过上面的式子被选择出来,其中β

−i

和ˆg

−i

)是

β和ˆg的省略版本.

在图1中,我们分别给出

和

在p=0.25,n=100,300和500的QQ图.在图2中,

我们分别画出ˆg

(0.5),ˆg

[I]

(0.5)和ˆg

[R]

(0.5)在p=0.25,n=100,300和500的QQ图.同时,g(·)

估计量的三个拟合曲线在图3给出.

从以上图1∼3中，我们可以看到:

(i)β和g(·)的所有估计的分布都接近正态分布.

(ii)g(·)所有估计的拟合曲线和真实的曲线有着极好的一致性.

(iii)当n增大,拟合效果更好.

(iv)当p增大,拟合效果变差.

(v)仿真结果和理论结果一致.

DOI:10.12677/aam.2022.1174604341应用数学进展

杨雪等

Figure1.Theqqplotsfor

and

withM=500,n=100,300,500andp=0.25respectively

图1.

，

和

在M=500，n=100，300，500和p=0.25时的QQ图

DOI:10.12677/aam.2022.1174604342应用数学进展

杨雪等

Figure 2.Theqqplotsfor ˆg

(0.5), ˆg

(0.5)and ˆg

(0.5)withM=500, n=100,300, 500andp=0.25respectively

图2.ˆg

(0.5)，ˆg

(0.5)和ˆg

(0.5)在M=500，n=100，300，500和p=0.25时的QQ图

DOI:10.12677/aam.2022.1174604343应用数学进展

杨雪等

Figure3.The ﬁttings forˆg

(·),ˆg

(·)andˆg

(·)withM=500,n=100,300,500 and p=0.1,0.25,0.5respectively

图3.ˆg

(·)，ˆg

(·)和ˆg

(·)在M=500，n=100，300，500和p=0.1,0.25,0.5时的拟合图

5.初步引理

在这部分中,令C,C

,···是一些有限正常数，其值不重要，可能改变.现在，我们介绍几个

引理，这些引理将用于主要结果的证明.

󱄽5.1[BaekangLiang[21],Lemma3.1]令α>2,e

,···,e

是独立的随机变量并且Ee

=0.

假设{a

,1≤i≤n}是一个三角形数列并且满足max

1≤i≤n

|=O(n

−1/2

)和



i=1

o(n

−2/α

log

−1

n).如果对于某个p>2α /(α−1)有sup

E|e

<∞.那么



i=1

=o(n

−1/α

)a.s.

DOI:10.12677/aam.2022.1174604344应用数学进展

杨雪等

󱄽5.2[Härdleetal“.[17],LemmaA.3]令V

,···,V

是独立的随机变量并且EV

=0,以及它满

足有限方差和sup

1≤j≤n

E|V

≤C<∞(r>2).假设{a

,k,i=1,···,n}是一个数字序列且满

足当0<p

<1有sup

1≤i,k≤n

|=O(n

−p

)和p

≥max(0,2/r−p

)有



j=1

=O(n

)，则

max

1≤i≤n





k=1



=O(n

−s

logn)a.s.其中s =(p

−p

)/2.

󱄽5.3

(a)令

=A(t

)−



j=1

)A(t

),其中A(·)=g(·)orh(·).令

=A(t

)−



j=1

)A(t

其中A(·)=g(·)orh(·).那么,由(A0)-(A4)可以推断出max

1≤i≤n

|=o(n

−1/4

)和

max

1≤i≤n

|=o(n

−1/4

(b)由(A0)-(A4)可以推断出n

−1



i=1

→Σ



i=1

|≤C

n,n

−1



i=1

(

)

→Σ

和



i=1

|δ

|≤C

(c)由(A0),(A1)(i)(ii)(iii),(A2)-(A4)可以推断出max

1≤i≤n

|=O(n

1/2

log

−1

n)和

max

1≤i≤n

|=O(n

1/2

log

−1

n).

(d)由(A0),(A1)(i)(ii)(iv),(A2)-(A4)可以推断出max

1≤i≤n

|=O(n

1/4

)和max

1≤i≤n

O(n

1/4

󱄽5.4假设(A0)-(A4)满足.那么可以推断出

max

1≤i≤n



ˆg

)−g(t

)



=o(n

−

)a.s.

引理5.3的证明是简单的.引理5.4的证明是类似于定理3.1(b)的证明.

6.主要结果的证明

首先,我们引入了一些符号，这些符号将在下面证明中使用.

=µ

−



j=1

)µ

=g(t

)−



j=1

)g(t

=ϵ

−



j=1

)ϵ

˜µ

=µ

−



j=1

)µ

,˜g

=g(t

)−



j=1

)g(t

),˜ϵ

=ϵ

−



j=1

)ϵ



i=1

(˜x

−Ξ

),S



i=1

˜x

DOI:10.12677/aam.2022.1174604345应用数学进展

杨雪等

󱄽3.1(a)󱎻󲣸󰍅.从(3.1),可以得到

−β=S

−2





i=1



(

)(

−

β)+δ





i=1



i=1



−2





i=1



(

+µ

)(ϵ

−µ

β)+Ξ





i=1

˜g



i=1

˜µ

˜g



i=1



j=1

)µ

β−



i=1



j=1

)ξ

−



i=1



j=1

)µ

−



i=1



j=1

)µ



i=1



j=1

)µ



i=1



j=1



k=1

)µ

−



i=1



j=1



k=1

)µ



:=S

−2



l=1

.(6.1)

因此,为了证明S

(

−β)/Σ

→N(0,1),我们只需要证明S

a.s.

−→1和



l=1

/Σ

→

N(0,1).

󱡣󰢜.我们证明S

a.s.

−→1.注意到



i=1

(

)



i=1

(µ

−Ξ



i=1





j=1

)µ





i=1

−2



i=1



j=1

)µ

−2



i=1



j=1

)µ

:=S

11n

12n

13n

14n

15n

通过引理5.4 (b), 我们得到n

−1

→Σ

.因此, 这足以证明k=1,2,···,5有S

1kn

=o(S

)=o(n).

应用(A0),在引理5.2中取r>2,p

=1/2,p

=1/2,我们可以得到



i=1



−Eζ





i=1

−



−Eζ



=O(n

logn)a.s.(6.2)

其中ζ

是独立随机变量满足sup

1≤i≤n

E|ζ

<∞.因此,我们得到S

11n

=O(n

1/2

logn)=o(n)=

o(S

)a.s.from(A0)和(6.2).另一方面,在引理5.1中取α=4,p>8/3,我们有

max

1≤i≤n





j=1

)ζ



=o(n

−

)a.s.,max

1≤i≤n





j=1

)ζ



=o(n

−

)a.s.(6.3)

其中ζ

是独立随机变量满足sup

1≤i≤n

E|ζ

<∞.通过(A0)和引理5.4,在引理5.2中取r=4,

DOI:10.12677/aam.2022.1174604346应用数学进展

杨雪等

=1/4,p

=1/4,s=0,可以得到



13n



=2n





i=1

−



=2n

·O(logn)=o(n)=o(S

)a.s.(6.4)

注意到,通过引理5.4(a),(6.2)和(6.3),我们有



12n



≤



i=1

|δ

|·max

1≤i≤n





j=1

)µ



=o(n

)=o(n)=o(S

)a.s.(6.5)



14n



≤2



i=1

|δ

|·max

1≤i≤n





j=1

)µ



=o(n

)=o(n)=o(S

)a.s.(6.6)



15n



≤2





i=1

(|δ

|−E|δ

|)+



i=1

E|δ



·max

1≤i≤n





j=1

)µ



=o(n

)a.s.(6.7)

因此,通过(6.2)-(6.7),可以推断出S

+o(S

)a.s.,从而得到

lim

n→∞

=lim

n→∞

+o(S

)

=1a.s.

󱡣󰢜.我们证明当l=2,3,···,10有A

/Σ

→0并且Σ

≥Cn.我们只需要证明

1/2

)当l=2,3,···,10.从定理3.1(a),引理5.4,(6.2)和(6.3)的条件,可以得到





i=1

˜g





i=1

˜g



i=1

˜g

−



i=1



j=1

˜g



=o(n

)a.s.





=E(



i=1

˜µ

˜g

)

≤C·





i=1

˜g

)





i=1

˜g



j=1

)µ





≤C·





i=1

(˜g

)



j=1





i=1

)˜g





=o(n





≤C·E





i=1



j=1

)µ



≤



i=1



j=1



)



Eµ

Eϵ

=o(n

log

−1

n).





≤C·E





i=1



j=1

)µ



≤C·





)







≤C·





i=1



j=1

)E(µ



)E(µ

)



=O(1).

因此A

1/2

)当k=3,6,8.同样地,可以得到A

1/2

)对于k=4,5,7,9,10.因此,

我们可以得到A

/Σ

→0对于l=2,3,···,10.

DOI:10.12677/aam.2022.1174604347应用数学进展

杨雪等

󱡣󰢜.我们证明A

/Σ

→N(0,1).注意到η

=δ

[(

+µ

)(ϵ

−µ

β)+Ξ

β].因此,η

是

一个独立的随机变量序列并且Eη

=0和Var(



i=1

)=Σ

.根据(6.1),󱡣󰢜󱡣󰢜,我

们可以得出结论

(

−β)=A



l=2



i=1

(1).

通过Σ

≥Cn,引理5.4,在(A0)中取r=min{r

/2}>2和任意η>0,当n→∞,可以证明



i=1



·I



|η

|>η·n





≤



i=1

E|η

·I



|η

|>η·n



(η·n

)

−(r−2)

≤



i=1







−Ξ







(η·n

)

−(r−2)

≤



i=1





max

1≤i≤n



r−2

−

r−2

−

r−2

=o(1).

这意味着对于中心极限定理的林德伯格条件是满足的.因此,A



i=1

−→N(0,Σ

).因此,

定理3.1(a)的证明完成了.

󱄽3.1(b)󱎻󲣸󰍅.通过(3.2),对于每个t∈[0,1],可以得到

ˆg

(t)−Eˆg

(t)=



j=1

(t)δ

−x

)−E





j=1

(t)δ

−x

)





j=1

(t)δ

(ϵ

−µ

β)+



j=1

(t)δ

(β−

)−



j=1

(t)δ

E(β−

)



j=1

(t)δ

(β−

)−



i=1

(t)δ

E[µ

(β−

)]

:=F

(t)+F

(t)−F

(t)+F

(t)−F

(t).(6.8)

使用定理3.1(a)中的󱡣󰢜的类似方法,可以得到F

(t)/Γ

(t)

→N(0,1).考虑到当n→∞有

nΓ

(t)→∞,我们只需要证明F

(t)=O

−1/2

)对于k=2,4,F

(t)=O(n

−1/2

)对于i=3,5.

󱡣󰢜.我们证明E(

−β)

=O(n

−1

).从定理3.1(a)的证明,可以得到

−β=O

−

).(6.9)

采用和定理3.1(a)一样的表示方法即A

当k=1,2,···,10,写作



(

−β)







k=1



≤C·



k=1

E(A

)

DOI:10.12677/aam.2022.1174604348应用数学进展

杨雪等

使用引理5.2(b)和引理5.4,通过(A0)(i),(A2)(i),可以推断出

sup

−1

E(A

)

=sup

−1

·E





i=1

[(

+µ

)(ϵ

−µ

β)+Ξ

β]



≤sup

−1







i=1

(ϵ

−µ

β)







i=1







i=1

(−µ

β+Ξ

β)





≤sup

−1





i=1

(

)



i=1



i=1



≤C<∞.

sup

−1

E(A

)

=sup

−1

·E





i=1

˜g



≤sup

−1



i=1

(

)

E(˜g

)

≤C<∞.

类似的,可得到sup

−1

·E(A

)

<∞对于k=3,4,···,10.下一步从引理5.4(a),可得到

−β)

=O(n

−1

),E|

−β|=O(n

−

).(6.10)

步骤2.从定理3.1(b)和(6.10)的条件,可以得到



(t)





j=1

(t)δ

(β−

)



≤E|

−β|·





j=1

(t)δ

)



=O(n

−

)



(t)





j=1

(t)δ

(β−

)



≤



−β)

·E





j=1

(t)δ





≤



−β)







j=1

(t)δ

)



=O(n

−

从而得出F

(t)=O

−

)对于s=2,4.同样可以类似证明F

(t)=O(n

−

)对于s=3,5.因

此

定理

3.1

(b)

的证明完成了



上述定理3.1(b)的证明可以推出



ˆg

)−g(t

)



=O(n

−

),E



ˆg

)−g(t

)



=O(n

−1

).(6.11)

󱄽3.2(a)󱎻󲣸󰍅.通过(3.3)-(3.4)和(6.1),可以得到

(

−β)=



i=1

˜x



[I]

−˜x





i=1



i=1



(

)(ϵ

−µ

β)+(1+D

)



−(µ

−Ξ

)β





−2



i=1

(1−δ

)



l=2

−



i=1

(1−δ

)



g(t

)−ˆg

)



−



i=1

(1−δ

)µ



g(t

)−ˆg

)



DOI:10.12677/aam.2022.1174604349应用数学进展

杨雪等

−





i=1



j=1

)δ

(ϵ

−µ

β)−(1−δ

)Ξ



−



i=1



j=1

)δ

(ϵ

−µ

β)



i=1



j=1

)(1−δ

)



g(t

)−ˆg

)





i=1



j=1

)(1−δ

)



g(t

)−ˆg

)





i=1

˜g



i=1

˜g

−



i=1



k=1

)µ

(ϵ

−µ

β)+



i=1



k=1

)µ

(1−δ

)



g(t

)−ˆg

)





i=1



k=1

)µ



j=1

)δ

(ϵ

−µ

β)−



i=1



k=1

)µ



j=1

)(1−δ

)



g(t

)−ˆg

)



−



i=1



k=1

)µ

˜g



i=1

(1−δ

)



j=1

)ξ

(

−β)+



i=1

(1−δ

)

(

−β)



i=1

(1−δ

)ξ

(

−β)+



i=1

(1−δ

)(µ

−Ξ

)(

−β)

−



i=1



j=1

)(1−δ

)ξ

(

−β)−



i=1



j=1

)(1−δ

)ξ

(

−β)

−



i=1



j=1

)(1−δ

)µ

(

−β)−



i=1



j=1

)(1−δ

)µ

(

−β)

−



i=1



k=1

)µ

(1−δ

)ξ

(

−β)−



i=1



k=1;k̸=i

)µ

(1−δ

)µ

(

−β)

−



i=1

)(1−δ

)(µ

−Ξ

)(

−β)+



i=1



k=1

)µ



j=1

)(1−δ

)ξ

(

−β)



i=1



k=1

)µ



j=1

)(1−δ

)µ

(

−β)



l=1



l=16

·(

−β).

类似于定理3.1(a)的第一步的证明,可以推出S

a.s.

−→1.根据(6.9),为了证明R

(

−

β)/Σ

→N(0,1),我们只需要证明当l=2,3,···,15有B

1/2

),当k=16,17,···,28有

(n)和B

/Σ

→N(0,1).

󱡣󰢜.我们证明当l=2,3,···,15有B

1/2

)和当k=16,17,···,28有B

(1).

从定理3.1(a)的证明,我们得到B

1/2

).根据引理5.1-引理5.4和(6.2)-(6.3),我们得到,





i=1

(1−δ

)



−



j=1



g(t

)−ˆg

)





≤C·





i=1

(1−δ

)



g(t

)−ˆg

)





+C·





i=1

(1−δ



g(t

)−ˆg

)





−C·





i=1



g(t

)−ˆg

)



(1−δ

)



j=1



=o(n

)a.s.

DOI:10.12677/aam.2022.1174604350应用数学进展

杨雪等





≤C·E





j=1





i=1

)δ



(ϵ

−µ

β)



≤C·



j=1





i=1

)δ



E(ϵ

−µ

β)

=O(n

logn)



≤C





i=1



j=1

)δ



g(t

)−ˆg

)







i=1

)





j=1



g(t

)−ˆg

)



=o(n

)a.s.



16n



≤C·





i=1

(1−δ

)



j=1

)ξ



=C·





i=1



j=1

)(1−δ

)



−



j=1





=O(n

logn).

同样地,我们可证明l=4,6,7,9,10,···,15有B

1/2

)和k=17,···,28有B

(1).

󱡣󰢜.我们证明B

/Σ

→N(0,1).令B



i=1

,其中γ

=δ



(

)(ϵ

−

β)+(1+D

)



−(µ

−Ξ

)β





.那么,γ

是一个独立的随机变量序列并且满足Eγ

=0和

Var(



i=1

)=Σ

.同时,我们通过定理3.3(a)的条件推断出





i=1



=o(n

3/4





i=1



O(n

1/2

logn),





j=1

)ξ



=O(1)和D

=o(1).通过Σ

≥Cn,引理5.4,在(A0)中取

r=min{r

/2}>2和任意γ>0,当n→∞ ,可以证明



i=1



·I



|γ

|>γ·n





≤



i=1

E|γ

·I



|γ

|>γ·n



(γ·n

)

−(r−2)

≤



i=1





(

)(ϵ

−µ

β)



+E|δ



(µ

−Ξ

)





(γ·n

)

−(r−2)

≤



i=1





+E|δ



(µ

−Ξ

)





(γ·n

)

−(r−2)

≤



i=1





max

1≤i≤n



r−2

−

r−2



i=1





max

1≤i≤n



r−2

−

r−2

−

r−2

=o(1).

显然林德伯格条件可行.因此,可以得到B

/Σ

→N(0,1).那么,定理3.2 (a) 的证明是完成了.

󱄽3.2(b)󱎻󲣸󰍅.定理3.2(b)的证明是类似的.

󱄽3.3(a)󱎻󲣸󰍅.从(3.6)-(3.7)和定理3.1(a),我们只需证明S

(

−

)/Σ

(1).注意到

−β

−2



i=1

˜x



+ˆg

)−



j=1

−



j=1

)ˆg

)



−

DOI:10.12677/aam.2022.1174604351应用数学进展

杨雪等

−2



i=1

˜x





ˆg

)−g(t

)



−



j=1

)



ˆg

)−g(t

)



+˜g



−2





i=1



ˆg

)−g(t

)





i=1

˜µ



ˆg

)−g(t

)



−



i=1



j=1

)



ˆg

)−g(t

)



−



i=1

˜µ



j=1

)



ˆg

)−g(t

)





i=1

˜g



i=1

˜µ

˜g



:=S

−2



l=1

采用定理3.1(a)证明的第一步中类似的方法,可得到0<C

≤S

≤C

<∞a.s.因此,我们

只需证明k=1,2,···,7有H

/Σ

(1).从(A0)-(A4),定理3.1,引理5.2-引理5.4,(6.2)和

(6.3),我们有



≤Cn

−



i=1





ˆg

)−g(t

)





=Cn

−





i=1



−



j=1





ˆg

)−g(t

)



=o(1)a.s.



≤Cn

−





i=1



j=1

)



ˆg

)−g(t

)





≤n

−





i=1





j=1

)



·max

1≤j≤n



ˆg

)−g(t

)



=o(1)a.s.



≤Cn

−





i=1

˜g



≤Cn

−





i=1



·max

1≤i≤n



˜g



=o(1).

当k=2,4,6，H

/Σ

(1)的证明是类似的.因此,定理3.3(a)的证明就完成了.

󱄽3.3(b)󱎻󲣸󰍅.定理3.3(b)的证明是类似的.

7.总结与展望

本文主要研究了响应变量缺失下的半参数EV模型的估计的渐近正态性，半参数模型研究主

要侧重于响应变量缺失与测量误差，主要结论如下：第一，通过三种不同的插补方法处理了缺失

数据，从而得到了β和g(·)的估计量，而且证明了在不同条件下它们都是趋于渐近正态的;第二，

通过一个仿真模拟研究了这些估计量的有限样本表现，仿真结果与我们所提出的理论结果是相符

合的，即这些估计量都是趋于渐近正态的.

本文深入研究了β和g(·)的估计量的渐近正态性，为未知参数和函数的置信区间的构建提供

了基础，可以成为今后我们所要研究的内容，甚至于我们可以去考虑这些估计量的强收敛性以及

DOI:10.12677/aam.2022.1174604352应用数学进展

杨雪等

它们的Berry-Esseen界.并且本文只研究了随机误差是独立随机变量这一种较为简单的情况，而

在很多情况下，随机误差可以是自回归序列，移动平均序列，α混合序列，ϕ混合序列以及负相关

序列等等.另外本文只考虑了响应变量缺失，进一步还可以考虑协变量缺失，这些情况相结合产生

的模型都可以是我们下一步考虑研究的内容.

参考文献

[1]Engle,R.F.,Granger, C.W.J.,Rice,J. and Weiss,A. (1986) Semiparametric Estimationof the

RelationbetweenWeatherandElectricitySales.JournaloftheAmericanStatisticalAssocia-

tion,81,310-320.https://doi.org/10.1080/01621459.1986.10478274

[2]Bindele, H.F.andAbebe,A. (2015)Semi-ParametricRankRegressionwithMissingResponses.

Semi-ParametricRankRegressionwithMissingResponses.JournalofMultivariateAnalysis,

142,117-132.https://doi.org/10.1016/j.jmva.2015.08.007

[3]Wang,N.,Carroll,R.J.andLin,X.(2005)EﬃcientSemiparametricMarginalEstimationfor

Longitudinal/ClusteredData.JournaloftheAmericanStatisticalAssociation,100,147-157.

https://doi.org/10.1198/016214504000000629

[4]Hu,X.M.,Wang,Z.Z.andLiu,F.(2008)ZeroFinite-OrderSerialCorrelationTestina

Semi-Parametric Varying-Coeﬃcient Partially LinearErrors-in-Variables Model. Statistics and

ProbabilityLetters,78,1560-1569.https://doi.org/10.1016/j.spl.2008.01.012

[5]Cui,H.J.andChen,S.X. (2003) EmpiricalLikelihoodConﬁdenceRegionforParameter in the

Errors-in-VariableModels.JournalofMultivariateAnalysis,84,101-115.

https://doi.org/10.1016/S0047-259X(02)00017-9

[6]Ahmad, I., Leelahanon, S. andLi, Q. (2005)Eﬃcient Estimationof aSemiparametric Partially

LinearVaryingCoeﬃcientModel.TheAnalysisofStatistics,33,258-283.

https://doi.org/10.1214/009053604000000931

[7]Chen,L.-P.(2019)SemiparametricEstimationforCureSurvivalModelwithLeft-Truncated

andRight-Censored Dataand Covariate MeasurementError. Statisticsand Probability Letters,

154,108-547.https://doi.org/10.1016/j.spl.2019.06.023

[8]Ibrahim,J.G.,Chen,M.H.,Lipsitz,S.R.andHerring,A.H.(2005)MissingDataMethods

forGeneralizedLinearModels:AComparativeReview.JournaloftheAmericanStatistical

Association,100,332-346.https://doi.org/10.1198/016214504000001844

[9]Rubin,D.B.(1976)InferenceandMissingData.Biometrika,63,581-592.

https://doi.org/10.1093/biomet/63.3.581

[10]Knol,M.J.,Janssen,K.J.M.,Donders,A.R.T.,Egberts,A.C.G.andGeerlings,M.I.(2010)

UnpredictableBiasWhen Usingthe MissingIndicator Methodor CompleteCase Analysisfor

DOI:10.12677/aam.2022.1174604353应用数学进展

杨雪等

MissingConfounderValues:AnEmpiricalExample.JournalofClinicalEpidemiology,63,

728-736.https://doi.org/10.1016/j.jclinepi.2009.08.028

[11]vanderHeijden,G.J.M.G.,Donders,A.R.T.,Stijnen,T.andMoons,K.G.M.(2006)Moons:

Imputation ofMissing Values IsSuperior toComplete Case Analysisand theMissing-Indicator

MethodinMultivariableDiagnosticResearch:AClinicalExample.JournalofClinicalEpi-

demiology,59,1102-1109.https://doi.org/10.1016/j.jclinepi.2006.01.015

[12]Li,X.Y.(2012)Lack-of-FitTestingofRegressionModelwithResponseMissingatRandom.

JournalofStatisticalPlanningandInference,142,155-170.

https://doi.org/10.1016/j.jspi.2011.07.005

[13]Kano,Y.andTakai,K.(2011)AnalysisofNMARMissingDatawithoutSpecifyingMissing-

DataMechanismsinaLinearLatentVariateModel.JournalofMultivariateAnalysis,102,

1241-1255.https://doi.org/10.1016/j.jmva.2011.04.007

[14]Healy,M.J.R.andWestmacott,M.(1956)MissingValuesinExperimentsAnalysisonAuto-

maticComputers.JournaloftheRoyalStatisticalSociety.SeriesC(AppliedStatistics),5,

203-206.https://doi.org/10.2307/2985421

[15]Cheng,P.E.(1994)NonparametricEstimationofMeanFunctionalswithDataMissingAt

Random.JournaloftheAmericanStatisticalAssociation,89,81-87.

https://doi.org/10.1080/01621459.1994.10476448

[16]Wang,Q.andSun,Z.(2007)EstimationinPartiallyLinearModelswithMissingResponses

atRandom.JournalofMultivariateAnalysis,98,1470-1493.

https://doi.org/10.1016/j.jmva.2006.10.003

[17]Härdle,W.,Liang,H.andGao,J.T.(2000)PartiallyLinearModels.Physica-Verlag,Heidel-

berg.https://doi.org/10.1007/978-3-642-57700-0

[18]Gao,J.T.,Chen,X.R.andZhao,L.C.(1994)AsymptoticNormalityofaClassofEstimators

inPartialLinearModels.ActaMathematicaSinica,37,256-268.

[19]Chen, H. (1988) Convergence Rates forParametric Components ina Partly Linear Model. The

AnnalsofStatistics,16,136-146.https://doi.org/10.1214/aos/1176350695

[20]Liang, H., Härdle, W. and Carrol, R.J.(1999) Estimation ina SemiparametricPartially Linear

Errors-in-VariablesModel.TheAnnalsofStatistics,27,1519-1935.

https://doi.org/10.1214/aos/1017939140

[21]Baek,J.I.andLiang,H.Y.(2006)AsymptoticofEstimatorsinSemi-ParametricModelunder

NASamples.JournalofStatisticalPlanningandInference,136,3362-3382.

https://doi.org/10.1016/j.jspi.2005.01.008

DOI:10.12677/aam.2022.1174604354应用数学进展