本文利用核回归估计方法对二元极值Copula函数的相关函数进行估计。构建了相关函数的N-W核回归估计。在选择最优带宽的前提下,通过数值模拟对比了N-W核回归估计与OLS估计。数值模拟的结果显示N-W核回归估计在一定情况下较之于OLS估计更具有稳定性,是一种相对较优的相关函数非参数估计方法。 This paper gives an estimate of correlation function for bivariate extremes Copula model using kernel regression method. A N-W kernel regression estimator is constructed and we prove that the estimator is asymptotically unbiased. Based on selection of the optimal bandwidth, we compare the N-W kernel regression estimation and OLS estimation by numerical simulation. The result shows that the N-W kernel regression estimator is more stable than the OLS estimator. So, the N-W kernel regression estimation is a relatively favourable non-parametric method.
蒋晓艺,张浩敏,梁丽芳
桂林理工大学理学院,广西 桂林
收稿日期:2018年4月3日;录用日期:2018年4月21日;发布日期:2018年4月28日
本文利用核回归估计方法对二元极值Copula函数的相关函数进行估计。构建了相关函数的N-W核回归估计。在选择最优带宽的前提下,通过数值模拟对比了N-W核回归估计与OLS估计。数值模拟的结果显示N-W核回归估计在一定情况下较之于OLS估计更具有稳定性,是一种相对较优的相关函数非参数估计方法。
关键词 :极值Copula函数,相关函数,N-W核回归估计
Copyright © 2018 by authors and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
1959年Sklar首次提出Copula的概念并证明了任何一个n维联合分布函数都可以用某个Copula函数“连接”n单变量的边际分布函数表达,其中边际分布描述了单个变量的特征,而Copula函数用以刻画边际分布之间的“结构” [
Copula函数的优良性质和特殊结构使得其在极端事件统计规律的研究中具有重要作用,极值Copula函数的相关函数作为极值Copula函数的重要推导函数,国外从上个世纪的八十年代开始对相关函数进行估计 [
综合现有的文献可以发现,国内外很多学者关注于极值Copula函数的相关函数的研究。受此启发,本文在OLS-估计和N-W核回归估计模型的基础上构建了二元相关函数的N-W核回归估计并通过数值模拟验证了N-W核回归估计在一定程度上优于OLS-估计 [
假设
上式中
1)
2)
3)
当
由此可知
其中g为Euler常数,
由(2.2)式得
有
成立,所以
Kendal’s t系数是一个最具有代表性的相关系数,Kendal’s t系数的定义如下 [
Kendal’s t系数与相关函数的表达式 [
设
核估计是权函数估计的一种方法,最常见的核估计是Nadaraya和Waston于1964年提出的N-W核权函数回归估计即N-W核估计,N-W核估计得到函数 的核光滑方法即 [
其中
1)
2)
3)
常见的核函数如表1。
依据N-W核回归的定义构建相关函数的核回归的模型:
由(3.1)可得到相关函数的N-W核估计公式
, (3.2)
其中
核估计的结果与带宽h的选择有关所以相关函数的N-W核估计结果同样与带宽h有关。选择的带宽h值越小,核估计的偏差值就会越小,核估计的方差反而越大;反之,选择的带宽h值越大,核估计的偏差值就会越大,核估计的方差反而越小。所以要在核估计的偏差与方差之间做一个权衡,使核估计的均方误差最小。选择带宽主要有直接插入法、经验法则、最小平方交叉验证法和惩罚函数法。本文使用广义交叉验证法的最优带宽公式 [
其中
二元极值Copula函数的相关函数的模型 [
其中
核种类 | 核函数 |
---|---|
Boxcar核 | |
Gaussian核 | |
Epanechnikov核 | |
Tricube核 |
表1. 常见的核函数
注:
模型(4.1)在除去
在本文的模拟过程中相关函数的N-W核回归估计均在最优宽带的前提下选择Gaussian核函数,其中Gaussian核函数的
如表2与表3所示的t的值均从0取到0.95,间隔为0.05,相当于r的值从1取到20,但间隔不等。如表2与表3所示在t相同样本量不同的情况下,随着样本量的增加相关函数的N-W核估计和OLS估计与
t | r | N-W | OLS | ||||
---|---|---|---|---|---|---|---|
n = 50 | n = 100 | n = 500 | n = 50 | n = 100 | n = 500 | ||
0.00 | 1.0000 | 0.146942 | 0.082552 | 0.056272 | 0.051214 | 0.050122 | 0.044455 |
0.05 | 1.0526 | 0.123233 | 0.067013 | 0.043829 | 0.039383 | 0.038107 | 0.033216 |
0.10 | 1.1111 | 0.102391 | 0.053682 | 0.033394 | 0.029523 | 0.028136 | 0.024020 |
0.15 | 1.1765 | 0.084173 | 0.042356 | 0.024765 | 0.021435 | 0.020007 | 0.016653 |
0.20 | 1.2500 | 0.068358 | 0.032843 | 0.017756 | 0.014933 | 0.013532 | 0.010916 |
0.25 | 1.3334 | 0.054735 | 0.024965 | 0.012192 | 0.009841 | 0.008534 | 0.006620 |
0.30 | 1.4286 | 0.043111 | 0.018555 | 0.007911 | 0.005994 | 0.004846 | 0.003585 |
0.35 | 1.5385 | 0.033302 | 0.013456 | 0.004757 | 0.003241 | 0.002313 | 0.001642 |
0.40 | 1.6667 | 0.025138 | 0.009520 | 0.002585 | 0.001433 | 0.000787 | 0.000628 |
0.45 | 1.8182 | 0.018459 | 0.006606 | 0.001259 | 0.000436 | 0.000125 | 0.000388 |
0.50 | 2.0000 | 0.013113 | 0.004579 | 0.000646 | 0.000118 | 0.000191 | 0.000773 |
0.55 | 2.2222 | 0.008952 | 0.003309 | 0.000624 | 0.000358 | 0.000851 | 0.001642 |
0.60 | 2.5000 | 0.005837 | 0.002671 | 0.001074 | 0.001039 | 0.001972 | 0.002860 |
0.65 | 2.8571 | 0.003629 | 0.002542 | 0.001880 | 0.002049 | 0.003422 | 0.004303 |
0.70 | 3.3333 | 0.002188 | 0.002803 | 0.002931 | 0.003279 | 0.005070 | 0.005861 |
0.75 | 4.0000 | 0.001372 | 0.003345 | 0.004116 | 0.004622 | 0.006791 | 0.007439 |
0.80 | 5.0000 | 0.001028 | 0.004068 | 0.005324 | 0.005965 | 0.008479 | 0.008972 |
0.85 | 6.6667 | 0.000996 | 0.004898 | 0.006436 | 0.007190 | 0.010066 | 0.010433 |
0.90 | 10.00 | 0.001103 | 0.005789 | 0.007334 | 0.008171 | 0.011553 | 0.011834 |
0.95 | 20.00 | 0.001178 | 0.006723 | 0.007933 | 0.008816 | 0.012995 | 0.013142 |
表2. 数据纯净情况下的均方误差
t | r | N-W | OLS | ||||
---|---|---|---|---|---|---|---|
n = 250 | n = 500 | n = 1000 | n = 250 | n = 500 | n = 1000 | ||
0.00 | 1.0000 | 0.046526 | 0.038409 | 0.038532 | 0.078072 | 0.058253 | 0.052327 |
0.05 | 1.0526 | 0.035004 | 0.028263 | 0.028102 | 0.063104 | 0.045229 | 0.040220 |
0.10 | 1.1111 | 0.025533 | 0.020016 | 0.019674 | 0.05032 | 0.034327 | 0.030164 |
0.15 | 1.1765 | 0.017901 | 0.013471 | 0.013037 | 0.039519 | 0.025333 | 0.021956 |
0.20 | 1.2500 | 0.011904 | 0.008438 | 0.007989 | 0.030507 | 0.018046 | 0.015404 |
0.25 | 1.3334 | 0.007356 | 0.004746 | 0.004342 | 0.023105 | 0.012279 | 0.010331 |
0.30 | 1.4286 | 0.004075 | 0.002228 | 0.001915 | 0.017148 | 0.007855 | 0.006571 |
0.35 | 1.5385 | 0.001893 | 0.000731 | 0.000538 | 0.012477 | 0.004603 | 0.003964 |
0.40 | 1.6667 | 0.000646 | 0.000108 | 0.000046 | 0.008942 | 0.002366 | 0.002361 |
0.45 | 1.8182 | 0.000181 | 0.000219 | 0.000284 | 0.006402 | 0.000991 | 0.001619 |
0.50 | 2.0000 | 0.000346 | 0.000934 | 0.001102 | 0.004721 | 0.000334 | 0.001598 |
0.55 | 2.2222 | 0.001003 | 0.002127 | 0.002356 | 0.003766 | 0.000260 | 0.000216 |
0.60 | 2.5000 | 0.002017 | 0.003678 | 0.003912 | 0.003528 | 0.000640 | 0.003181 |
0.65 | 2.8571 | 0.003267 | 0.005471 | 0.005647 | 0.003410 | 0.001358 | 0.004520 |
0.70 | 3.3333 | 0.004643 | 0.007391 | 0.007450 | 0.003999 | 0.002306 | 0.006049 |
0.75 | 4.0000 | 0.006055 | 0.009327 | 0.009235 | 0.004711 | 0.003396 | 0.007647 |
0.80 | 5.0000 | 0.007442 | 0.011160 | 0.001094 | 0.005565 | 0.004558 | 0.009211 |
0.85 | 6.6667 | 0.008776 | 0.012765 | 0.012556 | 0.006490 | 0.005746 | 0.010681 |
0.90 | 10.00 | 0.010067 | 0.014011 | 0.014093 | 0.007448 | 0.006942 | 0.012058 |
0.95 | 20.00 | 0.011284 | 0.014809 | 0.015522 | 0.008435 | 0.008087 | 0.01339 |
表3. 数据混杂情况下的均方误差
100和500情况下在
本文在二元极值Copula函数的相关函数OLS估计的基础上,结合具有模型简单,参数少且稳定性高的非参数估计方法N-W核估计,提出了相关函数的N-W核估计,并证明了该估计的无偏性。通过生成服从不相关的二元正态分布的随机变量数值生成N-W核估计与OLS估计模拟相关函数。分别与选定的相关函数的模型进行比较,可以得出N-W核估计的稳定性在分布未知数据混杂的情况下要高于OLS估计。
本文数值分析选择了相关系数单一且样本量较小的情况分析,相关系数的选择和样本量的个数可能会对相关函数的估计会造成影响,在以后的研究中还需进一步的验证方法的适用性。
国家自然科学基金项目(71762008)。
蒋晓艺,张浩敏,梁丽芳. 二元极值Copula函数的相关函数的N-W核回归估计 N-W Kernel Regression Estimation for Correlation Function of Bivariate Extremes Copula Function[J]. 统计学与应用, 2018, 07(02): 234-240. https://doi.org/10.12677/SA.2018.72027