Statistics and Application
Vol. 08  No. 02 ( 2019 ), Article ID: 29561 , 8 pages
10.12677/SA.2019.82028

Dependence Analysis of CPI and PPI Based on Copula Function

Ying Cui, He Li, Lili Wei*

School of Mathematics and Statistics, Ningxia University, Yinchuan Ningxia

Received: Mar. 11th, 2019; accepted: Mar. 26th, 2019; published: Apr. 2nd, 2019

ABSTRACT

CPI and PPI are core indexes in price systems, measure and analysis of the dependence between CPI and PPI can help us to better understand the economic development trend, which provides a reliable basis and suggestion for the government in making economic policy. Considering the essential nonlinearity of CPI and PPI, copula function with perfect performance is selected to study the dependence between CPI and PPI in this paper. Using the national monthly CPI and PPI data from January 2015 to December 2016 to research dependence, the results show that Gaussian Copula is better in depiction of rank correlation, and Gumble Copula is superior to other Copula functions in tail correlation and degree of fit with original data.

Keywords:Copula, CPI, PPI, Dependence

基于Copula函数的CPI与PPI相关性分析

崔英,李贺,魏立力*

宁夏大学数学统计学院,宁夏 银川

收稿日期:2019年3月11日;录用日期:2019年3月26日;发布日期:2019年4月2日

摘 要

CPI与PPI是价格体系中的两大核心指标,两者之间相关关系的度量及分析,有利于定量刻画经济发展趋势,为政府制定经济政策提供依据和建议。考虑到CPI与PPI数据的本质非线性关系,选取表现能力更强的Copula函数来研究CPI与PPI之间的相依性。采用2011年1月至2016年12月全国月度同比CPI与PPI数据进行相关性研究,结果表明Gaussian Copula在刻画秩相关性上效果较好,而在尾部相关性以及与原始数据的拟合程度上,Gumble Copula要优于其他Copula。

关键词 :Copula,CPI,PPI,相关性

Copyright © 2019 by authors and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

1. 引言

CPI与PPI作为我国价格体系中的两大核心指标,从构成上看既有相交也有相离。当构成的商品和服务价格发生变化时,会引起CPI与PPI的关联性波动,可能是同向的,也可能是反向的。对两者之间相关关系进行度量及分析,有利于我们定量刻画经济过热或紧缩的发展趋势,为政府制定经济政策提供可靠的依据和建议。考虑到CPI与PPI数据的本质非线性相关,Pearson相关系数是不合适的,取而代之的是选用能够更加精细、全面、灵活刻画相关关系的Copula函数来研究CPI与PPI之间的相依性。

我国学者对Copula函数的研究始于文献 [1] ,该文献对Copula理论应用在金融领域的可行性进行分析,并在我国股票市场进行了应用研究。文献 [2] 对金融时间序列时变的相依性结构用Copula理论进行刻画。文献 [3] 利用Pair Copula-GARCH模型研究了我国商业银行的经营风险。文献 [4] 利用贝叶斯估计方法,通过对沪深股市的实证研究,发现基于贝叶斯方法的Copula相关结构具有时变性。文献 [5] 建立了信用风险相关性度量的Copula模型,对信用风险的相关性变化进行描述。

本文利用Copula函数对2011年1月至2016年12月全国月度同比CPI与PPI数据的相关性进行分析。相比之前的研究,在样本数据的采集过程中,主要考虑金融危机爆发后,经济逐渐恢复平稳的CPI与PPI数据,这样更有利于反映当下的经济发展形势。其次,由于金融数据具有尖峰厚尾的性质,所以通过非参数估计法来确定CPI与PPI各自的边缘分布而不是指定拟合的边缘分布。在选择Copula函数时,将选择范围从椭圆族扩大到Archimedean族,以便于更精细地刻画CPI与PPI之间的相关关系。最后,利用经验Copula来代替 χ 2 检验统计量对数据进行拟合优度检验,这也更加符合实际观测数据。

2. Copula理论及其相关性度量

1959年,Sklar初次提出Copula理论,并指出可以将 N 维联合分布函数分解为 N 个边缘分布函数以及一个Copula函数,这个Copula函数可以细致、全面地刻画随机变量之间的相关结构。由于Copula函数具有将联合分布与边缘分布结合在一起的性质,有人也把Copula函数称之为“连接函数”。本节介绍Copula函数的基本概念及一系列基于Copula函数的相关性度量。

2.1. Copula函数的概念与性质

这里我们给出有关Copula函数的基本概念和有关性质 [6] 。

定义1:称满足以下条件的函数 C ( u , v ) 为二元Copula函数:

① 定义域为 [ 0 , 1 ] × [ 0 , 1 ]

C ( u , v ) 有零基面,即;并且是二维递增的,即对于任意 0 u 1 u 2 1 , 0 v 1 v 2 1 ,有

C ( u 2 , v 2 ) C ( u 2 , v 1 ) C ( u 1 , v 2 ) ) + C ( u 1 , v 1 ) 0

③ 对于任意 u , v [ 0 , 1 ] ,满足 C ( u , 1 ) = u C ( 1 , v ) = v

由定义可知: C ( u , v ) 是一个边缘分布为 U ( 0 , 1 ) 的二元联合分布函数,且对于定义域内的任意一点 ( u , v ) 均有: 0 C ( u , v ) 1

定理1:(二元分布的Sklar定理)令 H ( x , y ) 为具有边缘分布 F ( x ) G ( y ) 的二元联合分布函数,则存在一个Copula函数 C ( u , v ) ,满足

H ( x , y ) = C [ F ( x ) , G ( y ) ] (1)

F ( x ) , G ( y ) 是连续函数,则 C ( u , v ) 是唯一确定的;反之,若 F ( x ) , G ( y ) 为一元分布函数, C ( u , v ) 是一个Copula函数,由(1)式确定的 H ( x , y ) 是具有边缘分布 F ( x ) , G ( y ) 的二元联合分布函数。

二元Copula函数有如下基本性质。

C ( u , v ) 关于每一个变量都是单调非减的,也就是说,如果保持一个变量不变,那么 C ( u , v ) 的值也将会随着另一个变量的增大而增大。

② 对任意的 u 1 , u 2 , v 1 , v 2 [ 0 , 1 ] ,有

③ 对任意的 u , v [ 0 , 1 ] ,令 C ( u , v ) = max ( u + v 1 , 0 ) C + ( u , v ) = min ( u , v ) ,则有

max ( u + v 1 , 0 ) C ( u , v ) min ( u , v )

C + ( u , v ) C ( u , v ) 分别为Fréchet上界和下界。

④ 若 U , V 独立,且服从 U ( 0 , 1 ) ,则 C ( u , v ) = u v ,记 C ( u , v ) = u v

⑤ 对变量 X , Y 做严格递增的连续变换 h 1 ( X ) , h 2 ( Y ) ,有 C X , Y = C h 1 ( X ) , h 2 ( Y ) ,其中 C X , Y 表示连接 X , Y 的Copula函数; C h 1 ( X ) , h 2 ( Y ) 表示连接的Copula函数.

2.2. 常用的Copula函数

Copula分布作为一类连接函数,包含很多分布族,其中椭圆Copula函数族和Archimedean Copula函数族是最为常见的两个分布族。椭圆Copula函数族中主要有Gaussian Copula函数和t-Copula函数,而Archimedean Copula函数族中主要有Gumble Copula、Glayton Copula和Frank Copula函数,由于这些Copula具有厚尾的特征而在金融领域得到广泛应用。

二元Gaussian Copula的分布函数为

C G a ( u , v ; ρ ) = Φ 1 ( u ) Φ 1 ( v ) 1 2 π 1 ρ 2 exp [ s 2 + t 2 2 ρ s t 2 ( 1 ρ 2 ) ] d s d t , (2)

其中, Φ 1 ( ) 是标准正态分布函数的逆函数。

自由度为 k 的二元t-Copula的分布函数为

C t ( u , v ; ρ , k ) = t k 1 ( u ) t k 1 ( v ) 1 2 π 1 ρ 2 [ 1 + s 2 + t 2 2 ρ s t k ( 1 ρ 2 ) ] ( k + 2 ) / 2 d s d t , (3)

其中, t k 1 ( ) 是自由度为 k 的标准 t 分布函数 t k ( ) 的逆函数。

二元Gumble Copula、Clayton Copula、Frank Copula的分布函数分别为

C G u ( u , v ; α ) = exp { [ ( ln u ) α + ( ln v ) α ] 1 α } ;

C C l ( u , v ; α ) = ( u α + v α 1 ) 1 α , 0 u , v 1 ; (4)

C F ( u , v ; α ) = 1 α ln ( 1 + ( 1 e α u ) ( 1 e α v ) 1 e α ) , 0 u , v 1.

2.3. 基于Copula函数的相关性度量

Copula函数作为刻画变量间相依性结构的工具,在度量具有非线性关系的变量之间的相依性结构时具有明显的优势,因此产生了一系列基于Copula函数的相关性度量。基于Copula函数的度量包括Kendall’s τ ,Spearman’s ρ S ,尾部相关系数 λ 等。

1) Kendall秩相关系数

( X , Y ) ( X , Y ) 是独立同分布的随机变量,若 ( X X ) ( Y Y ) > 0 ,称 ( X , Y ) ( X , Y ) 是一致的;若 ( X X ) ( Y Y ) < 0 则称 ( X , Y ) ( X , Y ) 是不一致的。

Kendall’s秩相关系数 τ 的一般形式为:

若随机变量 X , Y 的边缘分布分别为 F ( x ) , G ( y ) ,相应的Copula函数为 C ( u , v ) ,则Kendall’s秩相关系数 τ 可由相应的Copula函数 C ( u , v ) 给出:

τ = 4 [ 0 , 1 ] 2 C ( u , v ) d C ( u , v ) 1 .

2) Spearman’s秩相关系数 ρ S

( X 1 , Y 1 ) , ( X 2 , Y 2 ) , ( X 3 , Y 3 ) 独立同分布的随机变量,Spearman’s秩相关系数 ρ S 的一般形式为:

若随机变量 X , Y 的边缘分布分别为 F ( x ) , G ( y ) ,相应的Copula函数为 C ( u , v ) ,则Spearman’s秩相关系数 ρ S 可由相应的Copula函数 C ( u , v ) 给出:

ρ S = 12 [ 0 , 1 ] 2 C ( u , v ) d u d v 3

3) 尾部相关系数 λ

尾部相关性是人们在金融风险中比较关心的,包括上尾相关和下尾相关。令 X , Y 为连续的随机变量,具有边缘分布 F ( x ) , G ( y ) 和Copula函数为 C ( u , v ) ,如果

lim u 1 C ¯ ( u , u ) / ( 1 u ) = λ U

存在, λ U ( 0 , 1 ] C ¯ ( u , v ) = 1 u v + C ( u , v ) 为生存Copula函数,则称 X , Y 上尾相关; λ U = 0 时,称 X , Y 在分布上尾渐近独立。同样地,如果

lim u 0 + C ( u , u ) / u = λ L

存在, λ L ( 0 , 1 ] 时,则称 X , Y 下尾相关; λ L = 0 时,称 X , Y 在分布下尾渐近独立。我们把 λ U , λ L 统称为尾部相关系数,且 λ U , λ L 0

3. CPI与PPI相关性的实例分析

3.1. 边缘分布的确定

采用2011年1月至2016年12月全国月度同比 CPI ( x i ) PPI ( y i ) 数据。令 X , Y 分别表示CPI与PPI,为了确定 X , Y 的分布类型,首先分别做出CPI与PPI的频率直方图,如图1所示。

Figure 1. Curve: CPI and PPI frequency histogram

图1. CPI与PPI的频率直方图

表1给出了CPI与PPI的描述性统计量的值。通过图1表1可以看出,CPI与PPI均呈现出非正态分布的特征,初步可以判断这两个变量不服从正态分布。

Table 1. Descriptive statistics of CPI and PPI

表1. CPI与PPI的描述性统计量

下面用jbtest、kstest和lillietest函数分别对 X , Y 进行正态性检验,结果由表2给出。

Table 2.Test results of CPI and PPI normality

表2.CPI与PPI的正态性检验结果

X , Y 进行检验的结果为: p 0.01 ,说明 X , Y 的分布非正态,在已知的分布族中也难以找到适合者。因此,在估计 X , Y 的分布时,采用核密度估计的方法。图2给出了CPI与PPI的核分布估计图。

3.2. Copula函数的选取及参数估计

在确定了 X 的边缘分布 F ( x ) Y 的边缘分布 G ( y ) 之后,根据 u i = F ( x i ) , v i = G ( y i ) 的直方图选取Copula函数。图3给出了CPI与PPI的二维频率直方图,即Copula密度函数的估计。

Figure 2. Curve: The core distribution of CPI and PPI is estimated

图2. CPI与PPI的核分布估计图

Figure 3. Curve: Binary histogram of marginal distribution of CPI and PPI

图3. CPI与PPI的边缘分布的二元直方图

在选择Copula函数形式时,我们考虑选择用椭圆Copula函数族中的Gaussian Copula函数和t-Copula函数,或者选择Archimedean Copula函数族中的Frank Copula函数来刻画变量呈现对称尾部的特质;用Archimedean Copula函数族中的Gumble Copula和Glayton Copula,或者选择混合Copula函数来刻画非对称的尾部特质。图3可以看出, c ( u , v ) 的尾部较为对称,所以初次尝试选用椭圆族中的Gaussian Copula函数或t-Copula函数来拟合CPI与PPI的相关关系。随后再选取Archimedean Copula族中的Gumble Copula、Glayton Copula或Frank Copula来拟合CPI与PPI的相关关系。Copula模型中参数的估计值由极大似然估计得到。

估计的 ρ ^ G a = 0.7958 代入(2)式,得到Gaussian Copula函数为:

C ^ G a ( u , v ) = Φ 1 ( u ) Φ 1 ( v ) 1 2 π 1 0.7958 2 exp [ s 2 + t 2 2 × 0.7958 s t 2 × ( 1 0.7958 2 ) ] d s d t .

估计的 ρ ^ t = 0.8373 , k ^ = 8.3252 8 代入(3)式,得到t-Copula函数为:

C ^ t ( u , v ) = t 4 1 ( u ) t 4 1 ( v ) 1 2 π 1 0.8373 2 [ 1 + s 2 + t 2 2 × 0.8373 s t 4 × ( 1 0.8373 2 ) ] 8 + 2 2 d s d t .

估计的 α ^ G u = 2.7146 α ^ C l = 1.9037 α ^ F = 8.2744 代入(4)式,得到Gumbel Copula、Clayton Copula、Frank Copula函数分别为:

C ^ G u ( u , v ) = exp { [ ( ln u ) 2.7146 + ( ln v ) 2.7146 ] 1 2.7146 } ; C ^ C l ( u , v ) = [ u 1.9037 + v 1.9037 1 ] 1 1.9037 ; C ^ F ( u , v ) = 1 8.2744 ln [ 1 + ( 1 e 8.2744 u ) ( 1 e 8.2744 v ) 1 e 8.2744 ] .

计算CPI与PPI原始观测数据的 τ , ρ S 。同时,分别计算出Gaussian Copula、t-Copula、Gumble Copula、Glayton Copula、Frank Copula对应的 τ , ρ S ,对比结果如表3所示。

Table 3.Kendall’s rank correlation coefficient, Spearman’s rank correlation coefficient and tail correlation coefficient

表3. Kendall’s秩相关系数、Spearman’s秩相关系数、尾部相关系数

原始数据求得的 τ , ρ S 与五种常用Copula求得的 τ , ρ S 对比发现,在反映CPI和PPI的秩相关性上,Gaussian Copula的 τ , ρ S 与原始观测数据的 τ , ρ S 接近程度会更好些,说明Gaussian Copula能较好地刻画CPI与PPI之间的秩相关性。

在刻画尾部相关性时,Gumbel Copula在分布上尾处的相关系数 λ U = 0.7076 ,Clayton Copula在分布下尾处的相关系数 λ L = 0.6944 ,效果要优于t-Copula的尾部相关系数 λ ^ U = λ ^ L = 0.3952

3.3. Copula函数模型的评价

在建立好模型之后,要对Copula函数模型进行拟合优度的评价,所用的方法是基于欧式平方距离准则,选择与经验Copula之间距离最小的Copula函数作为最优。以Gaussian Copula为例:

d G a 2 = i = 1 n | C ^ n ( u i , v i ) C ^ G a ( u i , v i ) | 2 ,

其中, C ^ n ( u , v ) 为经验Copula函数。

表4给出了不同Copula函数在基于平方欧式距离下与经验Copula函数的距离。

Table 4. Fitting evaluation of Copula function of CPI and PPI

表4. CPI与PPI的Copula函数的拟合评价

基于距离评判准则给出了最优Copula是与经验Copula之间距离最短的。因为 d G u 2 < d G a 2 < d t 2 < d F 2 < d C l 2 ,所以Gumble Copula更能拟合CPI与PPI的原始观测数据间的关系。

基金项目

本文受宁夏回族自治区研究生教育创新计划示范课程建设项目“数理统计引论”资助,项目编号为YKC201603。

文章引用

崔 英,李 贺,魏立力. 基于Copula函数的CPI与PPI相关性分析
Dependence Analysis of CPI and PPI Based on Copula Function[J]. 统计学与应用, 2019, 08(02): 251-258. https://doi.org/10.12677/SA.2019.82028

参考文献

  1. 1. 张尧庭. 连接函数(Copula)技术与金融风险分析[J]. 统计研究, 2002, 19(4): 48-51.

  2. 2. 韦艳华, 张世英, 孟利锋. Copula理论在金融上的应用[J]. 西北农林科技大学学报(社会科学版), 2003, 3(5): 97-101.

  3. 3. 黄恩喜, 程希骏. 基于Pair Copula-GARCH模型的多资产组合VaR分析[J]. 中国科学研究生院学报, 2010, 27(4): 440-446.

  4. 4. 王璐, 黄登仕. 沪深股市相关性结构之谜: 基于贝叶斯Copula的研究[J]. 运筹与管理, 2014, 23(2): 213-219.

  5. 5. 罗长青, 朱慧明, 欧阳资生. 跳跃–扩散条件下信用风险相关性度量的变结构Copula模型[J]. 中国管理科学, 2014, 22(3): 1-12.

  6. 6. Harry, J. (2014) Dependence Modeling with Copulas. CRC Press, New York.

  7. NOTES

    *通讯作者。

期刊菜单