设为首页
加入收藏
期刊导航
网站地图
首页
期刊
数学与物理
地球与环境
信息通讯
经济与管理
生命科学
工程技术
医药卫生
人文社科
化学与材料
会议
合作
新闻
我们
招聘
千人智库
我要投稿
办刊
期刊菜单
●领域
●编委
●投稿须知
●最新文章
●检索
●投稿
文章导航
●Abstract
●Full-Text PDF
●Full-Text HTML
●Full-Text ePUB
●Linked References
●How to Cite this Article
AdvancesinAppliedMathematics
应用数学进展
,2022,11(7),4335-4354
PublishedOnlineJuly2022inHans.http://www.hanspub.org/journal/aam
https://doi.org/10.12677/aam.2022.117460
响应变量缺失的半参数
EV
模型估计的
渐近正态性
杨雪,张晶晶
*
,胡婷婷
上海理工大学理学院,上海
收稿日期:
2022
年
6
月
6
日;录用日期:
2022
年
7
月
1
日;发布日期:
2022
年
7
月
8
日
摘要
本文重点研究半参数模型中估计量的性质,根据实际情况特别考虑了缺失数据和测量误差的影响。
缺失数据采用三种不同的方法处理:直接删除法、插值填补法和回归插值法。同时,得到了斜率参
数和非参数变量的相应估计量。在合适的条件下,我们深入研究了这些估计量的渐近正态性,为
未知参数和函数的置信区间的构建提供了基础。此外,在不同的样本量和缺失概率下也对理论结
果进行了数值模拟,其结果与理论结果一致。
关键词
半参数模型,测量误差,响应变量缺失,渐近正态性
AsymptoticPropertiesforEstimatorsin
Semi-ParametricError-in-Variables
ModelwithMissingResponses
XueYang,JingjingZhang
∗
,TingtingHu
CollegeofScience,UniversityofShanghaiforScienceandTechnology,Shanghai
*
通讯作者。
文章引用
:
杨雪
,
张晶晶
,
胡婷婷
.
响应变量缺失的半参数
EV
模型估计的渐近正态性
[J].
应用数学进展
,2022,
11(7):4335-4354.DOI:10.12677/aam.2022.117460
杨雪等
Received:Jun.6
th
,2021;accepted:Jul.1
st
,2022;published:Jul.8
th
,2022
Abstract
Thispaper,concentratingonthepropertiesofestimatorsinsemi-parametricmodels,
particularlyconsiders theeffectsofmissingdataand measurementerrorsaccordingto
theactualsituation.Themissingdataareprocessedbythreedifferentmethods:di-
rectdeletionmethod,imputation(interpolationfill)method,andregressionsurrogate
method.Also,thecorrespondingestimatorsofslopeparameterandnon-parameter
variableareobtained.Undersuitableconditions,theasymptoticnormalityofthese
estimatorsisstudiedthoroughly,whichprovidesthebasisfortheconstructionofcon-
fidenceintervalsforunknownparametersandfunctions.Inaddition,differentsample
sizesandmissingprobabilitiesweresetforsimulation,whoseresultsareconsistent
withthetheoreticalresults.
Keywords
Semi-ParametricModel,Error-in-Variables,MissingResponses,Asymptotic
Normality
Copyright© 2022byauthor(s)andHansPublishersInc.
This work is licensed under theCreative Commons Attribution InternationalLicense (CCBY4.0).
http://creativecommons.org/licenses/by/4.0/
1.
引言
在下列的半参数
EV
模型中:
y
i
=
ξ
i
β
+
g
(
t
i
)+
ϵ
i
,
x
i
=
ξ
i
+
µ
i
,
(1.1)
y
i
是标量响应变量
,
(
ξ
i
,t
i
)
是设计点,
x
i
是观察到的带有测量误差
µ
i
的随机变量
.
当
Eµ
i
=0
,
ϵ
i
是统计误差并且
Eϵ
i
=0
.
β
∈R
是一个需要被估计的未知的参数
.
g
(
·
)
是一个未知的在
[0
,
1]
上取
DOI:10.12677/aam.2022.1174604336
应用数学进展
杨雪等
值的函数,
h
(
·
)
是一个定义在
[0
,
1]
上已知的函数,并且满足
ξ
i
=
h
(
t
i
)+
v
i
�(1.2)
其中
v
i
是设计点
.
模型
(1.1)
一直是统计研究中的重要问题之一
.
当
µ
i
≡
0
,
ξ
i
被精确观察到时,模型
(1.1)
就
简化为一般的半参数模型,该模型由
Engle
等
[1]
首次引入
.Huybrechts
等
[2]
研究了一个随机缺
失响应的半参数回归模型
.Wang
等
[3]
考虑了聚类数据的边际广义半参数部分线性模型
.
半参数
模型的广泛应用对参数估计器的发展和估计器的效率具有重要意义
.
近
20
年来,测量误差数据的统计研究越来越受到重视,因为它出现在医学、经济学和工程学
等多个学科领域
.
毫无疑问,最终结果会存在偏差
.
当
y
i
能够被完全观察到并且
g
(
·
)
≡
0
,模型
(1.1)
被简化为通常的线性
EV
模型
.Hu
等
[4]
考虑了用于测试序列相关性的经验对数似然比
.Cui
andChen[5]
提出了一个受约束的经验似然置信区域
.
当
g
(
·
)
̸
=0
时,模型
(1.1)
也被很多学者研
究过
.Ahmad
等
[6]
建立了模型有限维参数估计量的一致性和
√
n
-
正态性属性
.Chen[7]
讨论了协
变量中的正确测量误差
.
因此,有必要使用相应的测量误差模型,该模型一直在不断发展
.
大多数提到的结果都是在完整的数据下建立的,但是,我们经常会因为各种原因遇到不完整
的数据,其中之一是数据丢失
.
丢失数据可能是由于实践中的技术故障、预算限制或受试者拒绝
回答问题
.
为了防止估计量有偏差或效率低下,我们经常需要对缺失机制做出一些假设,大致可
以分为完全随机缺失(
MCAR
)、随机缺失(
MAR
)和非随机缺失(
NMAR
),以及其细节可以在
Ibrahim
等
[8]
和
Rubin[9]
的著作中看到
.
在
MCAR
条件下,
Mirjam
等
[10]
总结了最常用的完
整案例分析(
CC
)的优缺点
.Geert
等
[11]
表明,基于
MI
的模型与在不同条件下推导的模型没
有太大区别
.
当数据为
MAR
时,
Li
等
[12]
提出了一类失拟检验,用于拟合一些响应变量随机缺
失的线性回归模型
.
对于
NMAR
,
Yutaka
等
[13]
提出了一种具有或不具有平均结构的多样本分
析,以使模型中所有参数的估计量一致且渐近正态
.
处理缺失数据的方法已被广泛研究,其中缺失数据插补是最流行的一种
.
使用这种方法,可以
为每个缺失的数字估算一个合理的值,然后分析结果,就好像它们是完整的一样
.
在回归问题中,
常用的插补方法包括
Healy
和
Westmacott[14]
的线性回归插补,
Cheng[15]
的非参数核回归插
补,以及
Wang
和
Sun[16]
的半参数回归插补
.
我们在这里将这些方法扩展到模型
(1.1)
下的
β
和
g
(
·
)
的估计
.
我们获得了三种方法去估计有缺失响应的
β
和
g
(
·
)
,并研究估计量的渐近正态性
.
在本文中,我们研究了具有固定设计的模型的参数估计:假设我们从模型
(1.1)
获得一个不完
整的随机样本数据
{
(
y
i
,δ
i
,x
i
,t
i
)
}
,其中
δ
i
是一个数,如果
y
i
缺失,
δ
i
=0
;否则
δ
i
=1
.
我们假
设
y
i
是随机缺失的,这对于缺失数据的统计分析是一个常见的假设,在许多实际情况下是合理的
.
本文的结构如下
.
在第
2
部分,我们列出一些假设
.
主要结果在第
3
部分
.
第
4
部分介绍了一
项模拟研究
.
一些初步的引理在第
5
部分
.
主要结果的证明见第
6
部分
.
DOI:10.12677/aam.2022.1174604337
应用数学进展
杨雪等
2.
假设
在这个部分
,
我们列出一些会在下面主要结果中用到的假设
.
这里
a
n
=
O
(
b
n
)
意味着
|
a
n
|≤
C
|
b
n
|
,
a
n
=
o
(
b
n
)
意味着当
n
→∞
,
a
n
/
b
n
→
0
,
而
a.s.
代表几乎处处
.
(A0)
令
{
ϵ
i
,
1
≤
i
≤
n
}
和
{
µ
i
,
1
≤
i
≤
n
}
是独立的随机变量满足
(i)
Eϵ
i
=0
,
Eµ
i
=0
,
Eµ
2
i
=Ξ
2
µ
>
0
.
(ii)sup
i
E
|
ϵ
i
|
r
1
<
∞
,sup
i
E
|
µ
i
|
r
2
<
∞
对于某个
r
1
>
8/3
,r
2
>
4
.
(iii)
{
ϵ
i
,
1
≤
i
≤
n
}
和
{
µ
i
,
1
≤
i
≤
n
}
彼此独立
.
(A1)
令
{
v
i
,
1
≤
i
≤
n
}
in(1.2)
是一个序列满足
(i)lim
n
→∞
n
−
1
n
i
=1
v
2
i
=Σ
0
,
lim
n
→∞
n
−
1
n
i
=1
δ
i
v
2
i
=Σ
1
(0
<
Σ
0
,
Σ
1
<
∞
)
.
(ii)lim
n
→∞
sup
n
(
√
n
log
n
)
−
1
·
max
1
≤
m
≤
n
|
m
i
=1
v
j
i
|
<
∞
,
其中
{
j
1
,j
2
,...,j
n
}
是一个
(1
,
2
,...,n
)
的排列
.
(iii)max
1
≤
i
≤
n
|
v
i
|
=
O
(
n
1/2
log
−
1
n
)
.
(iv)max
1
≤
i
≤
n
|
v
i
|
=
O
(
n
1/4
)
.
(A2)
g
(
·
)
和
h
(
·
)
都是连续的函数并在闭区间
[0
,
1]
上满足一阶
Lipschitz
条件
.
(A3)
令
W
c
nj
(
t
i
)(1
≤
i,j
≤
n
)
是定义在
[0
,
1]
上的权函数,并满足
(i)max
1
≤
j
≤
n
n
i
=1
δ
j
W
c
nj
(
t
i
)=
O
(1)
(ii)max
1
≤
i
≤
n
n
j
=1
δ
j
W
c
nj
(
t
i
)
I
(
t
i
−
t
j
>a
·
n
−
1/4
log
−
1
n
)=
o
(
n
−
1/4
log
−
1
n
)
对于任意
a>
0
.
(iii)max
1
≤
i,j
≤
n
W
c
nj
(
t
i
)=
o
(
n
−
1/2
log
−
2
n
)
(A4)
概率权重函数
W
nj
(
t
i
)(1
≤
i,j
≤
n
)
定义在
[0
,
1]
上并且满足
(i)max
1
≤
j
≤
n
n
i
=1
W
nj
(
t
i
)=
O
(1)
.
(ii)max
1
≤
i
≤
n
n
j
=1
W
nj
(
t
i
)
I
(
t
i
−
t
j
>a
·
n
−
1/4
log
−
1
n
)=
o
(
n
−
1/4
log
−
1
n
)
,对于任何
a>
0
.
(iii)max
1
≤
i,j
≤
n
W
nj
(
t
i
)=
o
(
n
−
1/2
log
−
1
n
)
.
2.1
条件
(A0)-(A4)
是标准正则条件,并且在大量著作中被使用
.[Härdle
等
[17],Gao
等
[18]
和
Chen[19]]
3.
主要结果
对于模型
(1.1)
,我们寻求
β
和
g
(
·
)
是删除所有丢失的数据
.
因此,我们可以得到模型
δ
i
y
i
=
δ
i
ξ
i
β
+
δ
i
g
(
t
i
)+
δ
i
ϵ
i
.
如果可以观察到
ξ
i
,我们可以应用最小二乘估计(
LSE
)方法来估计
参数
β
.
如果参数
β
已知,则使用完整的数据
{
(
δ
i
y
i
,δ
i
x
i
,δ
i
t
i
)
,
1
≤
i
≤
n
}
,我们可以定义
g
(
·
)
的
估计量为
g
∗
n
(
t,β
)=
n
j
=1
W
c
nj
(
t
)(
δ
j
y
j
−
δ
j
x
j
β
)
,
DOI:10.12677/aam.2022.1174604338
应用数学进展
杨雪等
其中
W
c
nj
(
t
)
是满足
(A3)
的权重函数
.
在另一方面,在这种半参数
EV
模型的条件下,梁等
[20]
在通常的部分线性模型基础上改进了
LSE
方法,并使用参数
β
的估计来最小化以下公式:
SS
(
β
)=
n
i
=1
δ
i
y
i
−
x
i
β
−
g
∗
n
(
t
i
,β
)
2
−
Ξ
2
µ
β
2
=
min
!
因此,我们可以实现
β
的修改
LSE
如下:
ˆ
β
c
=
n
i
=1
(
δ
i
˜
x
c
i
2
−
δ
i
Ξ
2
µ
)
−
1
n
i
=1
δ
i
˜
x
c
i
˜
y
c
i
,
(3.1)
其中
˜
x
c
i
=
x
i
−
n
j
=1
δ
j
W
c
nj
(
t
i
)
x
j
,
˜
y
c
i
=
y
i
−
n
j
=1
δ
j
W
c
nj
(
t
i
)
y
j
.
我们将
(3.1)
带入
g
∗
n
(
t,β
)
,然后我
们可以得到如下公式:
ˆ
g
c
n
(
t
)=
n
j
=1
δ
j
W
c
nj
(
t
)(
y
j
−
x
j
ˆ
β
c
)
.
(3.2)
显然,我们没考虑所有样本信息然后得到了估计量
ˆ
β
c
和
ˆ
g
c
n
(
t
)
.
因此,为了弥补缺失的数据,
我们采用来自
Wang
和
Sun[16]
的插补方法,即
U
[
I
]
i
=
δ
i
y
i
+(1
−
δ
i
)[
x
i
ˆ
β
c
+ˆ
g
c
n
(
t
i
)]
.
(3.3)
因此,使用完整数据
{
(
U
[
I
]
i
,x
i
,t
i
)
�
1
≤
i
≤
n
}
,类似于
(3.1)-(3.2)
,我们可以得到另一个
β
和
g
(
·
)
的估计量,即
ˆ
β
I
=
n
i
=1
(˜
x
2
i
−
Ξ
2
µ
)
−
1
n
i
=1
˜
x
i
˜
U
[
I
]
i
,
(3.4)
ˆ
g
[
I
]
n
(
t
)=
n
j
=1
W
nj
(
t
)(
U
[
I
]
j
−
x
j
ˆ
β
I
)
.
(3.5)
其中
˜
U
[
I
]
i
=
U
[
I
]
i
−
n
j
=1
W
nj
(
t
i
)
U
[
I
]
j
,
˜
x
i
=
x
i
−
n
j
=1
W
nj
(
t
i
)
x
j
,
W
nj
(
t
)
是满足
(A4)
的权重函数
.
第三,
WangandSun[16]
提出了一种所谓的半参数回归代理方法,它使用估计的半参数回归
值而不是相应的用于定义估计量的响应值,无论响应是否被观察到
.
令
U
[
R
]
i
=
x
i
ˆ
β
c
+ˆ
g
c
n
(
t
i
)
.
(3.6)
因此
,
使用完整数据
{
(
U
[
R
]
i
,x
i
,t
i
)
,
1
≤
i
≤
n
}
,
类似于
(3.1)-(3.2),
我们可以得到
β
和
g
(
·
)
的第三
个估计
,
即
ˆ
β
R
=
n
i
=1
˜
x
2
i
−
1
n
i
=1
˜
x
i
˜
U
[
R
]
i
,
(3.7)
DOI:10.12677/aam.2022.1174604339
应用数学进展
杨雪等
ˆ
g
[
R
]
n
(
t
)=
n
j
=1
W
nj
(
t
)(
U
[
R
]
j
−
x
j
ˆ
β
R
)
,
(3.8)
其中
˜
U
[
R
]
i
=
U
[
R
]
i
−
n
j
=1
W
nj
(
t
i
)
U
[
R
]
j
,
W
nj
(
t
)
是满足
(A4)
的权重函数
.
基于
β
和
g
(
·
)
的第三个估计
,
我们采取一些将被使用的符号并且有以下结果:
˜
ξ
c
i
=
ξ
i
−
n
j
=1
δ
j
W
c
nj
(
t
i
)
ξ
j
,
˜
ξ
i
=
ξ
i
−
n
j
=1
W
c
nj
(
t
i
)
ξ
j
,S
2
n
=
n
i
=1
δ
i
(
˜
ξ
c
i
)
2
,R
2
n
=
n
i
=1
(
˜
ξ
i
)
2
,
Σ
2
n
=
Var
n
i
=1
δ
i
(
˜
ξ
c
i
+
µ
i
)(
ϵ
i
−
µ
i
β
)+Ξ
2
µ
β
,S
2
1
n
=
n
i
=1
δ
i
(˜
x
2
i
−
Ξ
2
µ
)
,D
in
=
S
−
2
1
n
(1
−
δ
i
)
˜
ξ
2
i
Σ
2
1
n
=
Var
n
i
=1
δ
i
(
˜
ξ
i
+
D
in
˜
ξ
c
i
)(
ϵ
i
−
µ
i
β
)+(1+
D
in
)
µ
i
ϵ
i
−
(
µ
2
i
−
Ξ
2
µ
)
β
,
Γ
2
n
(
t
)=
Var
n
j
=1
W
nj
(
t
)
δ
i
(
ϵ
i
−
µ
i
β
)
,
Γ
2
3
n
(
t
)=
Var
n
i
=1
W
c
ni
(
t
j
)
n
j
=1
W
nj
(
t
)
δ
i
(
ϵ
i
−
µ
i
β
)
3.1
假设
(A0),(A1)(i)(ii)(iii),(A2),(A3)
满足
.
(a)
如果
Σ
2
n
≥
Cn
对于所有的
n,
那么
S
2
n
(
ˆ
β
c
−
β
)/Σ
n
D
−→
N
(0
,
1)
(b)
如果
n
Γ
2
n
(
t
)
→∞
对于每个
t
∈
[0
,
1]
,
那么
[ˆ
g
c
n
(
t
)
−
E
ˆ
g
c
n
(
t
)]/Γ
n
(
t
)
D
−→
N
(0
,
1)
3.2
假设
(A0)-(A4)
满足
.
(a)
如果
Σ
2
1
n
≥
Cn
对于所有的
n,
那么
R
2
n
(
ˆ
β
I
−
β
)/Σ
1
n
D
−→
N
(0
,
1)
(b)
如果
n
Γ
2
n
(
t
)
→∞
对于每个
t
∈
[0
,
1]
,
那么
[ˆ
g
I
n
(
t
)
−
E
ˆ
g
I
n
(
t
)]/Γ
n
(
t
)
D
−→
N
(0
,
1)
3.3
假设
(A0)-(A4)
满足
.
(a)
如果
Σ
2
n
≥
Cn
对于所有的
n,
那么
S
2
n
(
ˆ
β
R
−
β
)/Σ
n
D
−→
N
(0
,
1)
(b)
如果
n
Γ
2
3
n
(
t
)
→∞
且在
(A0)
中对于每个
t
∈
[0
,
1]
和
r
1
>
4
,r
2
>
8
,那么
[ˆ
g
R
n
(
t
)
−
E
ˆ
g
R
n
(
t
)]/Γ
3
n
(
t
)
D
−→
N
(0
,
1)
4.
模拟研究
在本节中,我们进行了一个模拟来研究提出估计的有限样本表现
.
尤其:
(i)
我们给出
β
和
g
(
·
)
的估计量的
QQ
图
.
(ii)
我们展示了
g
(
·
)
的估计量的拟合曲线
.
DOI:10.12677/aam.2022.1174604340
应用数学进展
杨雪等
观察量来自
y
i
=
ξ
i
β
+
g
(
t
i
)+
ϵ
i
,
x
i
=
ξ
i
+
µ
i
,i
=1
,
2
,
···
,n,
其中
β
=1
,
g
(
t
)=
sin
(2
πt
)
,
t
i
=(
i
−
0
.
5)/
n
,
ξ
i
=
t
2
i
+
v
i
以及
{
v
i
,
1
≤
i
≤
n
}
是独立同分布的
N(0,1)
序列
,
{
µ
i
,
1
≤
i
≤
n
}
和
{
ϵ
i
,
1
≤
i
≤
n
}
是独立同分布的
N
(0
,
0
.
2
2
)
序列
.
这三个随机序列
彼此独立
.
这里
,
p
是假设满足
|
p
|
<
1
的实数
.
对于提出的估计量,加权函数取
W
c
nj
(
t
)=
K
((
t
−
t
i
)/
h
n
)
n
j
=1
K
((
t
−
t
j
)/
h
n
)
,W
nj
(
t
)=
M
((
t
−
t
i
)/
b
n
)
n
j
=1
M
((
t
−
t
j
)/
b
n
)
.
其中
K
(
·
)
和
M
(
·
)
是高斯核函数并且满足
(A1)-(A4),
其中
h
n
和
b
n
是两个带宽
.
下一步
,
我们从以上模型产生
n=100,300
和
500
的样本
.
我们考虑丢失的概率
p
分别设定为
0
.
1
,
0
.
25
,
和
0
.
5
.
然后
β
估计量的基于
M
=500
重复量的
MSE
定义为
MSE
(
ˆ
β
)=
1
M
M
l
=1
ˆ
β
(
l
)
−
β
0
2
g
(
·
)
估计量的
GMSE
定义为
GMSE
(ˆ
g
)=
1
Mn
M
l
=1
n
k
=1
ˆ
g
(
t
k
,l
)
−
g
(
t
k
)
2
众所周知,在任何有限样本研究中选择窗口宽度都是非常关键的
.
带宽选择规则之一是删除一
交叉验证规则
.
由于我们的估计器涉及两个窗口宽度,情况变得更加复杂
.
具体步骤如下:
CV
(
h
n
)=
1
n
n
i
=1
(
y
i
−
x
i
ˆ
β
−
i
−
ˆ
g
−
i
(
t
i
))
2
h
n
通过上面的式子被选择出来
,
其中
β
−
i
和
ˆ
g
−
i
(
t
i
)
是
ˆ
β
和
ˆ
g
的省略版本
.
在图
1
中
,
我们分别给出
ˆ
β
c
,
ˆ
β
I
和
ˆ
β
R
在
p
=0
.
25
,
n
=100
,
300
和
500
的
QQ
图
.
在图
2
中
,
我们分别画出
ˆ
g
c
n
(0
.
5)
,
ˆ
g
[
I
]
n
(0
.
5)
和
ˆ
g
[
R
]
n
(0
.
5)
在
p
=0
.
25
,
n
=100
,
300
和
500
的
QQ
图
.
同时
,
g
(
·
)
估计量的三个拟合曲线在图
3
给出
.
从以上图
1
∼
3
中,我们可以看到
:
(i)
β
和
g
(
·
)
的所有估计的分布都接近正态分布
.
(ii)
g
(
·
)
所有估计的拟合曲线和真实的曲线有着极好的一致性
.
(iii)
当
n
增大
,
拟合效果更好
.
(iv)
当
p
增大
,
拟合效果变差
.
(v)
仿真结果和理论结果一致
.
DOI:10.12677/aam.2022.1174604341
应用数学进展
杨雪等
Figure1.
Theqqplotsfor
ˆ
β
c
,
ˆ
β
I
and
ˆ
β
R
withM=500,n=100,300,500and
p
=0
.
25
respectively
图
1.
ˆ
β
c
,
ˆ
β
I
和
ˆ
β
R
在
M=500
,
n=100
,
300
,
500
和
p
=0
.
25
时的
QQ
图
DOI:10.12677/aam.2022.1174604342
应用数学进展
杨雪等
Figure 2.
Theqqplotsfor
ˆ
g
c
(0
.
5)
,
ˆ
g
I
(0
.
5)
and
ˆ
g
R
(0
.
5)
withM=500, n=100,300, 500and
p
=0
.
25
respectively
图
2.
ˆ
g
c
(0
.
5)
,
ˆ
g
I
(0
.
5)
和
ˆ
g
R
(0
.
5)
在
M=500
,
n=100
,
300
,
500
和
p
=0
.
25
时的
QQ
图
DOI:10.12677/aam.2022.1174604343
应用数学进展
杨雪等
Figure3.
The fittings for
ˆ
g
c
(
·
)
,
ˆ
g
I
(
·
)
and
ˆ
g
R
(
·
)
withM=500,n=100,300,500 and
p
=0
.
1
,
0
.
25
,
0
.
5
respectively
图
3.
ˆ
g
c
(
·
)
,
ˆ
g
I
(
·
)
和
ˆ
g
R
(
·
)
在
M=500
,
n=100
,
300
,
500
和
p
=0
.
1
,
0
.
25
,
0
.
5
时的拟合图
5.
初步引理
在这部分中
,
令
C,C
1
,
···
是一些有限正常数,其值不重要,可能改变
.
现在,我们介绍几个
引理,这些引理将用于主要结果的证明
.
5.1
[BaekangLiang[21],Lemma3.1]
令
α>
2
,
e
1
,
···
,e
n
是独立的随机变量并且
Ee
i
=0
.
假设
{
a
ni
,
1
≤
i
≤
n
}
是一个三角形数列并且满足
max
1
≤
i
≤
n
|
a
ni
|
=
O
(
n
−
1/2
)
和
n
i
=1
a
2
ni
=
o
(
n
−
2/
α
log
−
1
n
)
.
如果对于某个
p>
2
α
/(
α
−
1)
有
sup
i
E
|
e
i
|
p
<
∞
.
那么
n
i
=1
a
ni
e
i
=
o
(
n
−
1/
α
)
a
.
s
.
DOI:10.12677/aam.2022.1174604344
应用数学进展
杨雪等
5.2
[Härdleetal“.[17],LemmaA.3]
令
V
1
,
···
,V
n
是独立的随机变量并且
EV
i
=0
,
以及它满
足有限方差和
sup
1
≤
j
≤
n
E
|
V
j
|
r
≤
C<
∞
(
r>
2)
.
假设
{
a
ki
,k,i
=1
,
···
,n
}
是一个数字序列且满
足当
0
<p
1
<
1
有
sup
1
≤
i,k
≤
n
|
a
ki
|
=
O
(
n
−
p
1
)
和
p
2
≥
max
(0
,
2/
r
−
p
1
)
有
n
j
=1
a
ji
=
O
(
n
p
2
)
,则
max
1
≤
i
≤
n
n
k
=1
a
ki
V
k
=
O
(
n
−
s
log
n
)
a
.
s
.
其中
s
=(
p
1
−
p
2
)/
2
.
5.3
(a)
令
˜
A
i
=
A
(
t
i
)
−
n
j
=1
W
nj
(
t
i
)
A
(
t
j
)
,
其中
A
(
·
)=
g
(
·
)
or
h
(
·
)
.
令
˜
A
c
i
=
A
(
t
i
)
−
n
j
=1
δ
j
W
c
nj
(
t
i
)
A
(
t
j
)
,
其中
A
(
·
)=
g
(
·
)
or
h
(
·
)
.
那么
,
由
(A0)-(A4)
可以推断出
max
1
≤
i
≤
n
|
˜
A
i
|
=
o
(
n
−
1/4
)
和
max
1
≤
i
≤
n
|
˜
A
c
i
|
=
o
(
n
−
1/4
)
.
(b)
由
(A0)-(A4)
可以推断出
n
−
1
n
i
=1
˜
ξ
2
i
→
Σ
0
,
n
i
=1
|
˜
ξ
i
|≤
C
1
n
,
n
−
1
n
i
=1
δ
i
(
˜
ξ
c
i
)
2
→
Σ
1
和
n
i
=1
|
δ
i
˜
ξ
c
i
|≤
C
2
n
.
(c)
由
(A0),(A1)(i)(ii)(iii),(A2)-(A4)
可以推断出
max
1
≤
i
≤
n
|
˜
ξ
i
|
=
O
(
n
1/2
log
−
1
n
)
和
max
1
≤
i
≤
n
|
˜
ξ
c
i
|
=
O
(
n
1/2
log
−
1
n
)
.
(d)
由
(A0),(A1)(i)(ii)(iv),(A2)-(A4)
可以推断出
max
1
≤
i
≤
n
|
˜
ξ
i
|
=
O
(
n
1/4
)
和
max
1
≤
i
≤
n
|
˜
ξ
c
i
|
=
O
(
n
1/4
)
.
5.4
假设
(A0)-(A4)
满足
.
那么可以推断出
max
1
≤
i
≤
n
ˆ
g
c
n
(
t
i
)
−
g
(
t
i
)
=
o
(
n
−
1
4
)
a
.
s
.
引理
5.3
的证明是简单的
.
引理
5.4
的证明是类似于定理
3.1
(b)
的证明
.
6.
主要结果的证明
首先
,
我们引入了一些符号,这些符号将在下面证明中使用
.
˜
µ
c
i
=
µ
i
−
n
j
=1
δ
j
W
c
nj
(
t
i
)
µ
j
,
˜
g
c
i
=
g
(
t
i
)
−
n
j
=1
δ
j
W
c
nj
(
t
i
)
g
(
t
j
)
,
˜
ϵ
c
i
=
ϵ
i
−
n
j
=1
δ
j
W
c
nj
(
t
i
)
ϵ
j
,
˜
µ
i
=
µ
i
−
n
j
=1
W
nj
(
t
i
)
µ
j
,
˜
g
i
=
g
(
t
i
)
−
n
j
=1
W
nj
(
t
i
)
g
(
t
j
)
,
˜
ϵ
i
=
ϵ
i
−
n
j
=1
W
nj
(
t
i
)
ϵ
j
,
S
2
2
n
=
n
i
=1
(˜
x
2
i
−
Ξ
2
µ
)
,S
2
3
n
=
n
i
=1
˜
x
2
i
.
DOI:10.12677/aam.2022.1174604345
应用数学进展
杨雪等
3.1(a)
.
从
(3.1),
可以得到
ˆ
β
c
−
β
=
S
−
2
1
n
n
i
=1
δ
i
(
˜
ξ
c
i
+
˜
µ
c
i
)(
˜
ϵ
c
i
−
˜
µ
c
i
β
)+
δ
i
Ξ
2
µ
β
+
n
i
=1
δ
i
˜
ξ
c
i
˜
g
c
i
+
n
i
=1
δ
i
˜
µ
c
i
˜
g
c
i
=
S
−
2
1
n
n
i
=1
δ
i
(
˜
ξ
c
i
+
µ
i
)(
ϵ
i
−
µ
i
β
)+Ξ
2
µ
β
+
n
i
=1
δ
i
˜
ξ
c
i
˜
g
c
i
+
n
i
=1
δ
i
˜
µ
c
i
˜
g
c
i
+
n
i
=1
n
j
=1
δ
i
δ
j
˜
ξ
c
i
W
c
nj
(
t
i
)
µ
j
β
−
n
i
=1
n
j
=1
δ
i
δ
j
W
c
nj
(
t
i
)
ξ
c
i
ϵ
j
−
n
i
=1
n
j
=1
δ
i
δ
j
W
c
nj
(
t
i
)
µ
j
ϵ
i
−
n
i
=1
n
j
=1
δ
i
δ
j
W
c
nj
(
t
i
)
µ
i
ϵ
j
+2
n
i
=1
n
j
=1
δ
i
δ
j
W
c
nj
(
t
i
)
µ
i
µ
j
β
+
n
i
=1
n
j
=1
n
k
=1
δ
i
δ
j
δ
k
W
c
nj
(
t
i
)
W
c
nk
(
t
i
)
µ
j
ϵ
k
−
n
i
=1
n
j
=1
n
k
=1
δ
i
δ
j
δ
k
W
c
nj
(
t
i
)
W
c
nk
(
t
i
)
µ
j
µ
k
β
:=
S
−
2
1
n
10
l
=1
A
ln
.
(6.1)
因此
,
为了证明
S
2
n
(
ˆ
β
c
−
β
)/Σ
n
D
→
N
(0
,
1)
,
我们只需要证明
S
2
1
n
/
S
2
n
a.s.
−→
1
和
10
l
=1
A
ln
/Σ
n
D
→
N
(0
,
1)
.
.
我们证明
S
2
1
n
/
S
2
n
a.s.
−→
1
.
注意到
S
2
1
n
=
n
i
=1
δ
i
(
˜
ξ
c
i
)
2
+
n
i
=1
δ
i
(
µ
2
i
−
Ξ
2
µ
)+
n
i
=1
δ
i
n
j
=1
δ
j
W
c
nj
(
t
i
)
µ
j
2
+2
n
i
=1
δ
i
˜
ξ
c
i
µ
i
−
2
n
i
=1
δ
i
˜
ξ
c
i
n
j
=1
δ
j
W
c
nj
(
t
i
)
µ
j
−
2
n
i
=1
δ
i
µ
i
n
j
=1
δ
j
W
c
nj
(
t
i
)
µ
j
:=
S
2
n
+
S
11
n
+
S
12
n
+
S
13
n
+
S
14
n
+
S
15
n
.
通过引理
5.4
(b)
,
我们得到
n
−
1
S
2
n
→
Σ
1
.
因此
,
这足以证明
k
=1
,
2
,
···
,
5
有
S
1
kn
=
o
(
S
2
n
)=
o
(
n
)
.
应用
(A0),
在引理
5.2
中取
r>
2
,
p
1
=1/2
,
p
2
=1/2
,
我们可以得到
n
i
=1
ζ
i
−
Eζ
i
=
n
1
2
·
n
i
=1
n
−
1
2
ζ
i
−
Eζ
i
=
O
(
n
1
2
log
n
)
a
.
s
.
(6.2)
其中
ζ
i
是独立随机变量满足
sup
1
≤
i
≤
n
E
|
ζ
i
|
r
<
∞
.
因此
,
我们得到
S
11
n
=
O
(
n
1/2
log
n
)=
o
(
n
)=
o
(
S
2
n
)
a.s.from(A0)
和
(6.2).
另一方面
,
在引理
5.1
中取
α
=4
,p>
8/3
,
我们有
max
1
≤
i
≤
n
n
j
=1
δ
j
W
c
nj
(
t
i
)
ζ
j
=
o
(
n
−
1
4
)
a
.
s
.,
max
1
≤
i
≤
n
n
j
=
1
W
nj
(
t
i
)
ζ
j
=
o
(
n
−
1
4
)
a
.
s
.
(6.3)
其中
ζ
i
是独立随机变量满足
sup
1
≤
i
≤
n
E
|
ζ
i
|
r
<
∞
.
通过
(A0)
和引理
5.4,
在引理
5.2
中取
r
=4
,
DOI:10.12677/aam.2022.1174604346
应用数学进展
杨雪等
p
1
=1/4
,
p
2
=1/4
,
s
=0
,
可以得到
S
13
n
=2
n
3
4
·
n
i
=1
n
−
3
4
δ
i
˜
ξ
c
i
µ
i
=2
n
3
4
·
O
(
log
n
)=
o
(
n
)=
o
(
S
2
n
)
a
.
s
.
(6.4)
注意到
,
通过引理
5.4
(a)
,(6.2)
和
(6.3),
我们有
S
12
n
≤
n
i
=1
|
δ
i
|·
max
1
≤
i
≤
n
n
j
=1
δ
j
W
c
nj
(
t
i
)
µ
j
2
=
o
(
n
1
2
)=
o
(
n
)=
o
(
S
2
n
)
a
.
s
.
(6.5)
S
14
n
≤
2
n
i
=1
|
δ
i
˜
ξ
c
i
|·
max
1
≤
i
≤
n
n
j
=1
δ
j
W
c
nj
(
t
i
)
µ
j
=
o
(
n
3
4
)=
o
(
n
)=
o
(
S
2
n
)
a
.
s
.
(6.6)
S
15
n
≤
2
n
i
=1
(
|
δ
i
µ
i
|−
E
|
δ
i
µ
i
|
)+
n
i
=1
E
|
δ
i
µ
i
|
·
max
1
≤
i
≤
n
n
j
=1
δ
j
W
c
nj
(
t
i
)
µ
j
=
o
(
n
3
4
)
a
.
s
.
(6.7)
因此
,
通过
(6.2)-(6.7),
可以推断出
S
2
1
n
=
S
2
n
+
o
(
S
2
n
)
a
.
s
.,
从而得到
lim
n
→∞
S
2
1
n
S
2
n
=
lim
n
→∞
S
2
n
+
o
(
S
2
n
)
S
2
n
=1
a
.
s
.
.
我们证明当
l
=2
,
3
,
···
,
10
有
A
ln
/Σ
n
P
→
0
并且
Σ
2
n
≥
Cn
.
我们只需要证明
A
ln
=
o
p
(
n
1/2
)
当
l
=2
,
3
,
···
,
10
.
从定理
3.1
(a)
,
引理
5.4,(6.2)
和
(6.3)
的条件
,
可以得到
A
2
n
=
n
i
=1
δ
i
˜
ξ
c
i
˜
g
c
i
=
n
i
=1
δ
i
˜
h
c
i
˜
g
c
i
+
n
i
=1
δ
i
v
i
˜
g
c
i
−
n
i
=1
n
j
=1
δ
i
δ
j
W
c
nj
(
t
i
)
v
j
˜
g
c
i
=
o
(
n
1
2
)
a
.
s
.
E
A
3
n
2
=
E
(
n
i
=1
δ
i
˜
µ
c
i
˜
g
c
i
)
2
≤
C
·
E
(
n
i
=1
δ
i
˜
g
c
i
µ
i
)
2
+
E
n
i
=1
δ
i
˜
g
c
i
n
j
=1
δ
j
W
nj
(
t
i
)
µ
j
2
≤
C
·
n
i
=1
(˜
g
c
i
)
2
+
n
j
=1
δ
2
j
n
i
=1
W
nj
(
t
i
)˜
g
c
i
2
=
o
(
n
1
2
)
.
E
A
6
n
2
≤
C
·
E
n
i
=1
n
j
=1
δ
i
δ
j
W
c
nj
(
t
i
)
µ
j
ϵ
i
2
≤
n
i
=1
n
j
=1
δ
2
i
δ
2
j
W
c
nj
(
t
i
)
2
Eµ
2
j
Eϵ
2
i
=
o
(
n
1
2
log
−
1
n
)
.
E
A
8
n
2
≤
C
·
E
n
i
=1
n
j
=1
δ
i
δ
j
W
c
nj
(
t
i
)
µ
i
µ
j
β
2
≤
C
·
n
i
1
=1
n
i
2
=1
n
j
1
=1
n
j
2
=1
δ
i
1
δ
i
2
δ
j
1
δ
j
2
W
nj
1
(
t
i
1
)
W
nj
2
(
t
i
2
)
E
µ
i
1
µ
i
2
µ
j
1
µ
j
2
≤
C
·
n
i
=1
n
j
=1
δ
2
j
W
2
nj
(
t
i
)
E
(
µ
2
i
µ
2
j
)+
n
i
1
=1
n
i
2
=1
W
ni
1
(
t
i
1
)
W
ni
2
(
t
i
2
)
E
(
µ
2
i
1
µ
2
i
2
)
=
O
(1)
.
因此
A
kn
=
o
p
(
n
1/2
)
当
k
=3
,
6
,
8
.
同样地
,
可以得到
A
kn
=
o
p
(
n
1/2
)
对于
k
=4
,
5
,
7
,
9
,
10
.
因此
,
我们可以得到
A
ln
/Σ
n
P
→
0
对于
l
=2
,
3
,
···
,
10
.
DOI:10.12677/aam.2022.1174604347
应用数学进展
杨雪等
.
我们证明
A
1
n
/Σ
n
D
→
N
(0
,
1)
.
注意到
η
in
=
δ
i
[(
˜
ξ
c
i
+
µ
i
)(
ϵ
i
−
µ
i
β
)+Ξ
2
µ
β
]
.
因此
,
η
in
是
一个独立的随机变量序列并且
Eη
in
=0
和
Var
(
n
i
=1
η
in
)=Σ
2
n
.
根据
(6.1),
,
我
们可以得出结论
S
2
1
n
(
ˆ
β
c
−
β
)=
A
1
n
+
10
l
=2
A
ln
=
n
i
=1
η
in
+
o
p
(1)
.
通过
Σ
2
n
≥
Cn
,
引理
5.4,
在
(A0)
中取
r
=
min
{
r
1
,r
2
/2
}
>
2
和任意
η>
0
,
当
n
→∞
,
可以证明
1
n
·
n
i
=1
E
η
2
in
·
I
|
η
in
|
>η
·
n
1
2
≤
C
n
·
n
i
=1
E
|
η
in
|
r
·
I
|
η
in
|
>η
·
n
1
2
(
η
·
n
1
2
)
−
(
r
−
2)
≤
C
n
·
n
i
=1
E
δ
i
˜
ξ
c
i
ϵ
i
r
+
E
δ
i
˜
ξ
c
i
µ
i
β
r
+
E
δ
i
µ
i
ϵ
i
r
+
E
δ
i
µ
2
i
−
Ξ
2
µ
β
r
(
η
·
n
1
2
)
−
(
r
−
2)
≤
C
1
n
n
i
=1
˜
ξ
c
i
2
max
1
≤
i
≤
n
˜
ξ
c
i
r
−
2
n
−
r
−
2
2
+
C
2
n
−
r
−
2
2
=
o
(1)
.
这意味着对于中心极限定理的林德伯格条件是满足的
.
因此
,
A
1
n
=
n
i
=1
η
in
D
−→
N
(0
,
Σ
2
n
)
.
因此
,
定理
3.1
(a)
的证明完成了
.
3.1(b)
.
通过
(3.2),
对于每个
t
∈
[0
,
1]
,
可以得到
ˆ
g
c
n
(
t
)
−
E
ˆ
g
c
n
(
t
)=
n
j
=1
W
c
nj
(
t
)
δ
j
(
y
j
−
x
j
ˆ
β
c
)
−
E
n
j
=1
W
c
nj
(
t
)
δ
j
(
y
j
−
x
j
ˆ
β
c
)
=
n
j
=1
W
c
nj
(
t
)
δ
j
(
ϵ
j
−
µ
j
β
)+
n
j
=1
W
c
nj
(
t
)
δ
j
ξ
j
(
β
−
ˆ
β
c
)
−
n
j
=1
W
c
nj
(
t
)
δ
j
ξ
j
E
(
β
−
ˆ
β
c
)
+
n
j
=1
W
c
nj
(
t
)
δ
j
µ
j
(
β
−
ˆ
β
c
)
−
n
i
=1
W
n
nj
(
t
)
δ
j
E
[
µ
j
(
β
−
ˆ
β
c
)]
:=
F
1
n
(
t
)+
F
2
n
(
t
)
−
F
3
n
(
t
)+
F
4
n
(
t
)
−
F
5
n
(
t
)
.
(6.8)
使用定理
3.1
(a)
中的
的类似方法
,
可以得到
F
1
n
(
t
)/Γ
n
(
t
)
D
→
N
(0
,
1)
.
考虑到当
n
→∞
有
n
Γ
2
n
(
t
)
→∞
,
我们只需要证明
F
kn
(
t
)=
O
p
(
n
−
1/2
)
对于
k
=2
,
4
,F
in
(
t
)=
O
(
n
−
1/2
)
对于
i
=3
,
5
.
.
我们证明
E
(
ˆ
β
c
−
β
)
2
=
O
(
n
−
1
)
.
从定理
3.1
(a)
的证明
,
可以得到
ˆ
β
c
−
β
=
O
p
(
n
−
1
2
)
.
(6.9)
采用和定理
3.1
(a)
一样的表示方法即
A
kn
当
k
=1
,
2
,
···
,
10
,
写作
E
S
2
1
n
(
ˆ
β
c
−
β
)
2
=
E
10
k
=1
A
kn
2
≤
C
·
10
k
=1
E
(
A
kn
)
2
.
DOI:10.12677/aam.2022.1174604348
应用数学进展
杨雪等
使用引理
5.2
(b)
和引理
5.4,
通过
(A0)(i),(A2)(i),
可以推断出
sup
n
n
−
1
E
(
A
1
n
)
2
=
sup
n
n
−
1
·
E
n
i
=1
δ
i
[(
˜
ξ
c
i
+
µ
i
)(
ϵ
i
−
µ
i
β
)+Ξ
2
µ
β
]
2
≤
sup
n
Cn
−
1
E
n
i
=1
δ
i
˜
ξ
c
i
(
ϵ
i
−
µ
i
β
)
2
+
E
n
i
=1
δ
i
µ
i
ϵ
i
2
+
E
n
i
=1
δ
i
(
−
µ
2
i
β
+Ξ
2
µ
β
)
2
≤
sup
n
Cn
−
1
·
n
i
=1
δ
i
(
˜
ξ
c
i
)
2
+
n
i
=1
δ
2
i
+
n
i
=1
δ
2
i
β
2
≤
C<
∞
.
sup
n
n
−
1
E
(
A
2
n
)
2
=
sup
n
n
−
1
·
E
n
i
=1
δ
i
˜
ξ
c
i
˜
g
c
i
2
≤
sup
n
n
−
1
·
n
i
=1
δ
2
i
(
˜
ξ
c
i
)
2
E
(˜
g
c
i
)
2
≤
C<
∞
.
类似的
,
可得到
sup
n
n
−
1
·
E
(
A
kn
)
2
<
∞
对于
k
=3
,
4
,
···
,
10
.
下一步从引理
5.4
(a)
,
可得到
E
(
ˆ
β
c
−
β
)
2
=
O
(
n
−
1
)
,E
|
ˆ
β
c
−
β
|
=
O
(
n
−
1
2
)
.
(6.10)
步骤
2.
从定理
3.1
(b)
和
(6.10)
的条件
,
可以得到
E
F
2
n
(
t
)
=
E
n
j
=1
W
c
nj
(
t
)
δ
j
ξ
j
(
β
−
ˆ
β
c
)
≤
E
|
ˆ
β
c
−
β
|·
n
j
=1
W
c
nj
(
t
)
δ
j
ξ
j
)
=
O
(
n
−
1
2
)
E
F
4
n
(
t
)
=
E
n
j
=1
W
c
nj
(
t
)
δ
j
µ
j
(
β
−
ˆ
β
c
)
≤
E
(
ˆ
β
c
−
β
)
2
·
E
n
j
=1
W
c
nj
(
t
)
δ
j
µ
j
2
1
2
.
≤
E
(
ˆ
β
c
−
β
)
2
1
2
·
n
j
=1
(
W
c
nj
(
t
)
δ
j
)
2
1
2
=
O
(
n
−
1
2
)
.
从而得出
F
sn
(
t
)=
O
p
(
n
−
1
2
)
对于
s
=2
,
4
.
同样可以类似证明
F
kn
(
t
)=
O
(
n
−
1
2
)
对于
s
=3
,
5
.
因
此
,
定理
3.1
(b)
的证明完成了
.
上述定理
3.1
(b)
的证明可以推出
E
ˆ
g
c
(
t
i
)
−
g
(
t
i
)
=
O
(
n
−
1
2
)
,E
ˆ
g
c
(
t
i
)
−
g
(
t
i
)
2
=
O
(
n
−
1
)
.
(6.11)
3.2(a)
.
通过
(3.3)-(3.4)
和
(6.1),
可以得到
S
2
2
n
(
ˆ
β
I
−
β
)=
n
i
=1
˜
x
i
˜
U
[
I
]
i
−
˜
x
i
β
+
n
i
=1
Ξ
2
µ
β
=
n
i
=1
δ
i
(
˜
ξ
i
+
D
in
˜
ξ
c
i
)(
ϵ
i
−
µ
i
β
)+(1+
D
in
)
µ
i
ϵ
i
−
(
µ
2
i
−
Ξ
2
µ
)
β
+
S
−
2
1
n
n
i
=1
(1
−
δ
i
)
˜
ξ
2
i
10
l
=2
A
ln
−
n
i
=1
(1
−
δ
i
)
˜
ξ
i
g
(
t
i
)
−
ˆ
g
c
n
(
t
i
)
−
n
i
=1
(1
−
δ
i
)
µ
i
g
(
t
i
)
−
ˆ
g
c
n
(
t
i
)
DOI:10.12677/aam.2022.1174604349
应用数学进展
杨雪等
−
n
i
=1
µ
i
n
j
=1
W
nj
(
t
i
)
δ
j
(
ϵ
j
−
µ
j
β
)
−
(1
−
δ
i
)Ξ
2
µ
β
−
n
i
=1
˜
ξ
i
n
j
=1
W
nj
(
t
i
)
δ
j
(
ϵ
j
−
µ
j
β
)
+
n
i
=1
˜
ξ
i
n
j
=1
W
nj
(
t
i
)(1
−
δ
j
)
g
(
t
i
)
−
ˆ
g
c
n
(
t
i
)
+
n
i
=1
µ
i
n
j
=1
W
nj
(
t
i
)(1
−
δ
j
)
g
(
t
i
)
−
ˆ
g
c
n
(
t
i
)
+
n
i
=1
˜
ξ
i
˜
g
i
+
n
i
=1
µ
i
˜
g
i
−
n
i
=1
n
k
=1
W
nk
(
t
i
)
µ
k
δ
i
(
ϵ
i
−
µ
i
β
)+
n
i
=1
n
k
=1
W
nk
(
t
i
)
µ
k
(1
−
δ
i
)
g
(
t
i
)
−
ˆ
g
c
n
(
t
i
)
+
n
i
=1
n
k
=1
W
nk
(
t
i
)
µ
k
n
j
=1
W
nj
(
t
i
)
δ
j
(
ϵ
i
−
µ
i
β
)
−
n
i
=1
n
k
=1
W
nk
(
t
i
)
µ
k
n
j
=1
W
nj
(
t
i
)(1
−
δ
j
)
g
(
t
i
)
−
ˆ
g
c
n
(
t
i
)
−
n
i
=1
n
k
=1
W
nk
(
t
i
)
µ
k
˜
g
i
+
n
i
=1
(1
−
δ
i
)
˜
ξ
i
n
j
=1
W
nj
(
t
i
)
ξ
j
(
ˆ
β
c
−
β
)+
n
i
=1
(1
−
δ
i
)
˜
ξ
i
µ
i
(
ˆ
β
c
−
β
)
+
n
i
=1
(1
−
δ
i
)
ξ
i
µ
i
(
ˆ
β
c
−
β
)+
n
i
=1
(1
−
δ
i
)(
µ
i
−
Ξ
2
µ
)(
ˆ
β
c
−
β
)
−
n
i
=1
˜
ξ
i
n
j
=1
W
nj
(
t
i
)(1
−
δ
j
)
ξ
j
(
ˆ
β
c
−
β
)
−
n
i
=1
µ
i
n
j
=1
W
nj
(
t
i
)(1
−
δ
j
)
ξ
j
(
ˆ
β
c
−
β
)
−
n
i
=1
˜
ξ
i
n
j
=1
W
nj
(
t
i
)(1
−
δ
j
)
µ
j
(
ˆ
β
c
−
β
)
−
n
i
=1
µ
i
n
j
=1
W
nj
(
t
i
)(1
−
δ
j
)
µ
j
(
ˆ
β
c
−
β
)
−
n
i
=1
n
k
=1
W
nk
(
t
i
)
µ
k
(1
−
δ
i
)
ξ
i
(
ˆ
β
c
−
β
)
−
n
i
=1
n
k
=1;
k
̸
=
i
W
nk
(
t
i
)
µ
k
(1
−
δ
i
)
µ
i
(
ˆ
β
c
−
β
)
−
n
i
=1
W
ni
(
t
i
)(1
−
δ
j
)(
µ
2
i
−
Ξ
2
µ
)(
ˆ
β
c
−
β
)+
n
i
=1
n
k
=1
W
nk
(
t
i
)
µ
k
n
j
=1
W
nj
(
t
i
)(1
−
δ
j
)
ξ
j
(
ˆ
β
c
−
β
)
+
n
i
=1
n
k
=1
W
nk
(
t
i
)
µ
k
n
j
=1
W
nj
(
t
i
)(1
−
δ
j
)
µ
j
(
ˆ
β
c
−
β
)
:=
15
l
=1
B
ln
+
28
l
=16
B
ln
·
(
ˆ
β
c
−
β
)
.
类似于定理
3.1
(a)
的第一步的证明
,
可以推出
S
2
2
n
/
R
2
n
a.s.
−→
1
.
根据
(6.9),
为了证明
R
2
n
(
ˆ
β
I
−
β
)/Σ
1
n
D
→
N
(0
,
1)
,
我们只需要证明当
l
=2
,
3
,
···
,
15
有
B
ln
=
o
p
(
n
1/2
)
,
当
k
=16
,
17
,
···
,
28
有
B
kn
=
o
p
(
n
)
和
B
1
n
/Σ
1
n
D
→
N
(0
,
1)
.
.
我们证明当
l
=2
,
3
,
···
,
15
有
B
ln
=
o
p
(
n
1/2
)
和当
k
=16
,
17
,
···
,
28
有
B
kn
=
o
p
(1)
.
从定理
3.1
(a)
的证明
,
我们得到
B
2
n
=
o
p
(
n
1/2
)
.
根据引理
5.1-
引理
5.4
和
(6.2)-(6.3),
我们得到
,
B
3
n
=
n
i
=1
(1
−
δ
i
)
˜
h
i
+
v
i
−
n
j
=1
W
nj
(
t
i
)
v
j
g
(
t
i
)
−
ˆ
g
c
n
(
t
i
)
≤
C
·
n
i
=1
(1
−
δ
i
)
˜
h
i
g
(
t
i
)
−
ˆ
g
c
n
(
t
i
)
+
C
·
n
i
=1
(1
−
δ
i
)
v
i
g
(
t
i
)
−
ˆ
g
c
n
(
t
i
)
−
C
·
n
i
=1
g
(
t
i
)
−
ˆ
g
c
n
(
t
i
)
(1
−
δ
i
)
n
j
=1
W
nj
(
t
i
)
v
j
=
o
(
n
1
2
)
a
.
s
.
DOI:10.12677/aam.2022.1174604350
应用数学进展
杨雪等
E
B
5
n
2
≤
C
·
E
n
j
=1
n
i
=1
˜
ξ
i
W
nj
(
t
i
)
δ
j
(
ϵ
i
−
µ
j
β
)
2
≤
C
·
n
j
=1
n
i
=1
˜
ξ
i
W
nj
(
t
i
)
δ
j
2
E
(
ϵ
j
−
µ
j
β
)
2
=
O
(
n
1
2
log
n
)
B
8
n
≤
C
n
i
=1
µ
i
n
j
=1
W
nj
(
t
i
)
δ
j
g
(
t
j
)
−
ˆ
g
c
n
(
t
j
)
=
C
n
i
=1
µ
i
W
nj
(
t
i
)
·
n
j
=1
g
(
t
j
)
−
ˆ
g
c
n
(
t
j
)
=
o
(
n
1
2
)
a
.
s
.
B
16
n
≤
C
·
n
i
=1
(1
−
δ
i
)
˜
ξ
i
n
j
=1
W
nj
(
t
i
)
ξ
j
=
C
·
n
i
=1
n
j
=1
W
nj
(
t
i
)(1
−
δ
i
)
˜
h
i
+
v
i
−
n
j
=1
W
nj
(
t
i
)
v
j
ξ
j
=
O
(
n
1
2
log
n
)
.
同样地
,
我们可证明
l
=4
,
6
,
7
,
9
,
10
,
···
,
15
有
B
ln
=
o
p
(
n
1/2
)
和
k
=17
,
···
,
28
有
B
kn
=
o
p
(1)
.
.
我们证明
B
1
n
/Σ
1
n
D
→
N
(0
,
1)
.
令
B
1
n
=
n
i
=1
γ
in
,
其中
γ
in
=
δ
i
(
˜
ξ
i
+
D
in
˜
ξ
c
i
)(
ϵ
i
−
µ
i
β
)+(1+
D
in
)
µ
i
ϵ
i
−
(
µ
2
i
−
Ξ
2
µ
)
β
.
那么
,
γ
in
是一个独立的随机变量序列并且满足
Eγ
in
=0
和
Var
(
n
i
=1
γ
in
)=Σ
2
1
n
.
同时
,
我们通过定理
3.3
(a)
的条件推断出
n
i
=1
˜
ξ
i
=
o
(
n
3/4
)
,
n
i
=1
v
i
=
O
(
n
1/2
log
n
)
,
n
j
=1
W
nj
(
t
i
)
ξ
j
=
O
(1)
和
D
in
=
o
(1)
.
通过
Σ
2
1
n
≥
Cn
,
引理
5.4,
在
(A0)
中取
r
=
min
{
r
1
,r
2
/2
}
>
2
和任意
γ>
0
,
当
n
→∞
,
可以证明
1
n
·
n
i
=1
E
γ
2
in
·
I
|
γ
in
|
>γ
·
n
1
2
≤
C
n
·
n
i
=1
E
|
γ
in
|
r
·
I
|
γ
in
|
>γ
·
n
1
2
(
γ
·
n
1
2
)
−
(
r
−
2)
≤
C
n
·
n
i
=1
E
δ
i
(
˜
ξ
i
+
D
in
˜
ξ
c
i
)(
ϵ
i
−
µ
i
β
)
r
+
E
|
δ
i
µ
i
ϵ
i
|
r
+
E
δ
i
(
µ
2
i
−
Ξ
2
µ
)
r
β
r
(
γ
·
n
1
2
)
−
(
r
−
2)
≤
C
n
·
n
i
=1
E
δ
i
˜
ξ
i
ϵ
i
r
+
E
δ
i
˜
ξ
i
µ
i
β
r
+
E
δ
i
˜
ξ
c
i
ϵ
i
r
+
E
δ
i
˜
ξ
c
i
µ
i
β
r
+
E
|
δ
i
µ
i
ϵ
i
|
r
+
E
δ
i
(
µ
2
i
−
Ξ
2
µ
)
r
β
r
(
γ
·
n
1
2
)
−
(
r
−
2)
≤
C
1
n
n
i
=1
˜
ξ
i
2
max
1
≤
i
≤
n
˜
ξ
i
r
−
2
n
−
r
−
2
2
+
C
2
n
n
i
=1
˜
ξ
c
i
2
max
1
≤
i
≤
n
˜
ξ
c
i
r
−
2
n
−
r
−
2
2
+
C
3
n
−
r
−
2
2
=
o
(1)
.
显然林德伯格条件可行
.
因此
,
可以得到
B
1
n
/Σ
1
n
D
→
N
(0
,
1)
.
那么
,
定理
3.2
(a)
的证明是完成了
.
3.2(b)
.
定理
3.2
(b)
的证明是类似的
.
3.3(a)
.
从
(3.6)-(3.7)
和定理
3.1(a),
我们只需证明
S
2
n
(
ˆ
β
R
−
ˆ
β
c
)/Σ
n
=
o
p
(1)
.
注意到
ˆ
β
R
−
β
c
=
S
−
2
3
n
n
i
=1
˜
x
i
x
i
ˆ
β
c
+ˆ
g
c
n
(
t
i
)
−
n
j
=1
W
nj
(
t
i
)
x
j
ˆ
β
c
−
n
j
=1
W
nj
(
t
i
)ˆ
g
c
n
(
t
j
)
−
ˆ
β
c
DOI:10.12677/aam.2022.1174604351
应用数学进展
杨雪等
=
S
−
2
3
n
n
i
=1
˜
x
i
ˆ
g
c
n
(
t
i
)
−
g
(
t
i
)
−
n
j
=1
W
nj
(
t
i
)
ˆ
g
c
n
(
t
j
)
−
g
(
t
j
)
+˜
g
i
=
S
−
2
3
n
n
i
=1
˜
ξ
i
ˆ
g
c
n
(
t
i
)
−
g
(
t
i
)
+
n
i
=1
˜
µ
i
ˆ
g
c
n
(
t
i
)
−
g
(
t
i
)
−
n
i
=1
˜
ξ
i
n
j
=1
W
nj
(
t
i
)
ˆ
g
c
n
(
t
i
)
−
g
(
t
i
)
−
n
i
=1
˜
µ
i
n
j
=1
W
nj
(
t
i
)
ˆ
g
c
n
(
t
i
)
−
g
(
t
i
)
+
n
i
=1
˜
ξ
i
˜
g
i
+
n
i
=1
˜
µ
i
˜
g
i
:=
S
−
2
3
n
6
l
=1
H
ln
.
采用定理
3.1
(a)
证明的第一步中类似的方法
,
可得到
0
<C
1
≤
S
2
3
n
/
S
2
n
≤
C
2
<
∞
a.s
.
因此
,
我们
只需证明
k
=1
,
2
,
···
,
7
有
H
kn
/Σ
n
=
o
p
(1)
.
从
(A0)-(A4),
定理
3.1,
引理
5.2-
引理
5.4,(6.2)
和
(6.3),
我们有
H
1
n
Σ
n
≤
Cn
−
1
2
n
i
=1
˜
ξ
i
ˆ
g
c
n
(
t
i
)
−
g
(
t
i
)
=
Cn
−
1
2
n
i
=1
˜
h
i
+
v
i
−
n
j
=1
W
nj
(
t
i
)
v
j
ˆ
g
c
n
(
t
i
)
−
g
(
t
i
)
=
o
(1)
a
.
s
.
H
3
n
Σ
n
≤
Cn
−
1
2
n
i
=1
˜
ξ
i
n
j
=1
W
nj
(
t
i
)
ˆ
g
c
n
(
t
j
)
−
g
(
t
j
)
≤
n
−
1
2
n
i
=1
˜
ξ
i
·
n
j
=1
W
nj
(
t
i
)
·
max
1
≤
j
≤
n
ˆ
g
c
n
(
t
j
)
−
g
(
t
j
)
=
o
(1)
a
.
s
.
H
5
n
Σ
n
≤
Cn
−
1
2
n
i
=1
˜
ξ
i
˜
g
i
≤
Cn
−
1
2
n
i
=1
˜
ξ
i
·
max
1
≤
i
≤
n
˜
g
i
=
o
(1)
.
当
k
=2
,
4
,
6
,
H
kn
/Σ
n
=
o
p
(1)
的证明是类似的
.
因此
,
定理
3.3
(a)
的证明就完成了
.
3.3(b)
.
定理
3.3
(b)
的证明是类似的
.
7.
总结与展望
本文主要研究了响应变量缺失下的半参数
EV
模型的估计的渐近正态性,半参数模型研究主
要侧重于响应变量缺失与测量误差,主要结论如下:第一,通过三种不同的插补方法处理了缺失
数据,从而得到了
β
和
g
(
·
)
的估计量,而且证明了在不同条件下它们都是趋于渐近正态的
;
第二,
通过一个仿真模拟研究了这些估计量的有限样本表现,仿真结果与我们所提出的理论结果是相符
合的,即这些估计量都是趋于渐近正态的
.
本文深入研究了
β
和
g
(
·
)
的估计量的渐近正态性,为未知参数和函数的置信区间的构建提供
了基础,可以成为今后我们所要研究的内容,甚至于我们可以去考虑这些估计量的强收敛性以及
DOI:10.12677/aam.2022.1174604352
应用数学进展
杨雪等
它们的
Berry-Esseen
界
.
并且本文只研究了随机误差是独立随机变量这一种较为简单的情况,而
在很多情况下,随机误差可以是自回归序列,移动平均序列,
α
混合序列,
ϕ
混合序列以及负相关
序列等等
.
另外本文只考虑了响应变量缺失,进一步还可以考虑协变量缺失,这些情况相结合产生
的模型都可以是我们下一步考虑研究的内容
.
参考文献
[1]Engle,R.F.,Granger, C.W.J.,Rice,J. and Weiss,A. (1986) Semiparametric Estimationof the
RelationbetweenWeatherandElectricitySales.
JournaloftheAmericanStatisticalAssocia-
tion
,
81
,310-320.https://doi.org/10.1080/01621459.1986.10478274
[2]Bindele, H.F.andAbebe,A. (2015)Semi-ParametricRankRegressionwithMissingResponses.
Semi-ParametricRankRegressionwithMissingResponses.
JournalofMultivariateAnalysis
,
142
,117-132.https://doi.org/10.1016/j.jmva.2015.08.007
[3]Wang,N.,Carroll,R.J.andLin,X.(2005)EfficientSemiparametricMarginalEstimationfor
Longitudinal/ClusteredData.
JournaloftheAmericanStatisticalAssociation
,
100
,147-157.
https://doi.org/10.1198/016214504000000629
[4]Hu,X.M.,Wang,Z.Z.andLiu,F.(2008)ZeroFinite-OrderSerialCorrelationTestina
Semi-Parametric Varying-Coefficient Partially LinearErrors-in-Variables Model.
Statistics and
ProbabilityLetters
,
78
,1560-1569.https://doi.org/10.1016/j.spl.2008.01.012
[5]Cui,H.J.andChen,S.X. (2003) EmpiricalLikelihoodConfidenceRegionforParameter in the
Errors-in-VariableModels.
JournalofMultivariateAnalysis
,
84
,101-115.
https://doi.org/10.1016/S0047-259X(02)00017-9
[6]Ahmad, I., Leelahanon, S. andLi, Q. (2005)Efficient Estimationof aSemiparametric Partially
LinearVaryingCoefficientModel.
TheAnalysisofStatistics
,
33
,258-283.
https://doi.org/10.1214/009053604000000931
[7]Chen,L.-P.(2019)SemiparametricEstimationforCureSurvivalModelwithLeft-Truncated
andRight-Censored Dataand Covariate MeasurementError.
Statisticsand Probability Letters
,
154
,108-547.https://doi.org/10.1016/j.spl.2019.06.023
[8]Ibrahim,J.G.,Chen,M.H.,Lipsitz,S.R.andHerring,A.H.(2005)MissingDataMethods
forGeneralizedLinearModels:AComparativeReview.
JournaloftheAmericanStatistical
Association
,
100
,332-346.https://doi.org/10.1198/016214504000001844
[9]Rubin,D.B.(1976)InferenceandMissingData.
Biometrika
,
63
,581-592.
https://doi.org/10.1093/biomet/63.3.581
[10]Knol,M.J.,Janssen,K.J.M.,Donders,A.R.T.,Egberts,A.C.G.andGeerlings,M.I.(2010)
UnpredictableBiasWhen Usingthe MissingIndicator Methodor CompleteCase Analysisfor
DOI:10.12677/aam.2022.1174604353
应用数学进展
杨雪等
MissingConfounderValues:AnEmpiricalExample.
JournalofClinicalEpidemiology
,
63
,
728-736.https://doi.org/10.1016/j.jclinepi.2009.08.028
[11]vanderHeijden,G.J.M.G.,Donders,A.R.T.,Stijnen,T.andMoons,K.G.M.(2006)Moons:
Imputation ofMissing Values IsSuperior toComplete Case Analysisand theMissing-Indicator
MethodinMultivariableDiagnosticResearch:AClinicalExample.
JournalofClinicalEpi-
demiology
,
59
,1102-1109.https://doi.org/10.1016/j.jclinepi.2006.01.015
[12]Li,X.Y.(2012)Lack-of-FitTestingofRegressionModelwithResponseMissingatRandom.
JournalofStatisticalPlanningandInference
,
142
,155-170.
https://doi.org/10.1016/j.jspi.2011.07.005
[13]Kano,Y.andTakai,K.(2011)AnalysisofNMARMissingDatawithoutSpecifyingMissing-
DataMechanismsinaLinearLatentVariateModel.
JournalofMultivariateAnalysis
,
102
,
1241-1255.https://doi.org/10.1016/j.jmva.2011.04.007
[14]Healy,M.J.R.andWestmacott,M.(1956)MissingValuesinExperimentsAnalysisonAuto-
maticComputers.
JournaloftheRoyalStatisticalSociety.SeriesC(AppliedStatistics)
,
5
,
203-206.https://doi.org/10.2307/2985421
[15]Cheng,P.E.(1994)NonparametricEstimationofMeanFunctionalswithDataMissingAt
Random.
JournaloftheAmericanStatisticalAssociation
,
89
,81-87.
https://doi.org/10.1080/01621459.1994.10476448
[16]Wang,Q.andSun,Z.(2007)EstimationinPartiallyLinearModelswithMissingResponses
atRandom.
JournalofMultivariateAnalysis
,
98
,1470-1493.
https://doi.org/10.1016/j.jmva.2006.10.003
[17]Härdle,W.,Liang,H.andGao,J.T.(2000)PartiallyLinearModels.Physica-Verlag,Heidel-
berg.https://doi.org/10.1007/978-3-642-57700-0
[18]Gao,J.T.,Chen,X.R.andZhao,L.C.(1994)AsymptoticNormalityofaClassofEstimators
inPartialLinearModels.
ActaMathematicaSinica
,
37
,256-268.
[19]Chen, H. (1988) Convergence Rates forParametric Components ina Partly Linear Model.
The
AnnalsofStatistics
,
16
,136-146.https://doi.org/10.1214/aos/1176350695
[20]Liang, H., Härdle, W. and Carrol, R.J.(1999) Estimation ina SemiparametricPartially Linear
Errors-in-VariablesModel.
TheAnnalsofStatistics
,
27
,1519-1935.
https://doi.org/10.1214/aos/1017939140
[21]Baek,J.I.andLiang,H.Y.(2006)AsymptoticofEstimatorsinSemi-ParametricModelunder
NASamples.
JournalofStatisticalPlanningandInference
,
136
,3362-3382.
https://doi.org/10.1016/j.jspi.2005.01.008
DOI:10.12677/aam.2022.1174604354
应用数学进展