在信息熵的基础上,我们进一步研究累积剩余熵的一些性质,并将累积剩余熵模型应用于风险度量中。再在实际应用中,选取8支股票,收集每日收盘价格数据,利用SPSS软件绘制累积剩余熵与标准差的关系图,得出累积剩余熵与标准差的线性关系,又因为累积剩余熵的适用范围比方差更广,即在度量风险中,累积剩余熵模型比方差更具有优势。 On the basis of information entropy, we further study some properties of the cumulative residual entropy, and the cumulative residual entropy model applied in risk measure. In practical applica-tions, the selection of eight stocks, collect the daily closing price data, using SPSS software to draw the cumulative residual entropy and the standard deviation of the diagram. It is concluded that the cumulative residual entropy and the standard deviation of the linear relationship, and because of the cumulative residual entropy of a broader scope than variance, namely in the risk measurement, the cumulative residual entropy model has more advantages than the variance.
周丹
安徽工业大学数理科学与工程学院,安徽 马鞍山
收稿日期:2018年1月9日;录用日期:2018年1月24日;发布日期:2018年1月31日
在信息熵的基础上,我们进一步研究累积剩余熵的一些性质,并将累积剩余熵模型应用于风险度量中。再在实际应用中,选取8支股票,收集每日收盘价格数据,利用SPSS软件绘制累积剩余熵与标准差的关系图,得出累积剩余熵与标准差的线性关系,又因为累积剩余熵的适用范围比方差更广,即在度量风险中,累积剩余熵模型比方差更具有优势。
关键词 :熵,累积剩余熵,风险度量,方差
Copyright © 2018 by author and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
金融市场随着时间的演化,越来越多的因素影响着它的变化,随着金融市场的复杂化,越来越多的人试图运用各种方法探索它的变化规律,以求获得利益。投资者获得的收益可能与期望不一致,因为投资具有很大的风险,通常巨大的利益常伴随着巨大的风险,金融市场中存在的各种各样的风险,这种风险越来越引起人们的重视,只有正确理解什么是金融风险,掌握影响金融风险的因素有哪些,才能恰当的度量金融风险,为金融活动提供有力保障。
风险一般有两种理解:一种强调了风险表现为收益不确定性;另一种则强调风险表现为成本或代价的不确定性。金融风险是指金融资产在未来时期内预期收入遭受损失的可能性,即金融风险与损失的不确定性有关。无论是对损失还是收益,风险都表现出一种不确定性,这种不确定性体现出风险的本质。为了减少损失,扩大收益,人们试图采用各种方法去度量风险,即利用已知数据来分析未来不确定事件的不确定性以及可能带来的损失或收益。
现有的度量风险方法有很多种,例如:波动性方法即方差(均方差)方法 [
20世纪,shannon提出了一个对离散随机变量不确定性的度量,即shannon熵,这与风险的本质相吻合。近年来,越来越引起人们的关注与研究,并将熵应用于金融投资组合、风险度量和数据压缩等领域中。本文中如无特别说明,总假定log是以2为底的对数。对于离散随机变量 X ,其shannon熵 [
义为: H ( X ) = − ∑ x p ( x ) log p ( x ) ,其中 p ( x ) 是随机变量 X 的概率密度函数, 0 ≤ p ( x ) ≤ 1 , ∑ x p ( x ) = 1 ,并约定 0 ln 0 = 0 。当随机变量 X 是连续型时,我们称其不确定性的度量为微分熵,其定义为: h ( X ) = − ∫ s f ( x ) log f ( x ) d x ,其中 f ( x ) 是随机变量 X 的概率密度函数, s 是 X 的支撑集(即使 f ( x ) > 0 的所有 x 构成的集合)。
但shannon熵也存在一些不足,例如:假设 X 和 Y 是两个离散的随机变量, X 的取值空间是
{ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 } ,每一个的取值概率都为 1 8 , Y 的取值空间是 { 1 , 2 , 3 , 4 , 5 , 6 , 7 , 10000 } ,每一个的取值概率也都为 1 8 ,则 H ( X ) = − ∑ i = 1 8 1 8 log 1 8 = 27 8 = H ( Y ) ,即 X 和 Y 的shannon熵是一样的,但如果 X 和 Y 代表的
是博弈游戏中两个不同的回报方案,显然随机变量 X 和 Y 包含的信息量是不同的,但shannon熵对此并加以区分。为了克服shannon熵的一些不足,Murali Rao等提出了一种新的熵概念,即累积剩余熵(Cumulative Residual Entropy,简记为CRE)。
定义: [
ε ( X ) = − ∫ R + N P ( | X | > λ ) log P ( | X | > λ ) d λ
其中 X = ( X 1 , X 2 , ⋯ , X N ) , λ = ( λ 1 , λ 2 , ⋯ , λ N ) ,并且 | X | > λ 意味着
| X i | > λ i , i = 1 , ⋯ , N , R + N = { x i ∈ R N ; x i ≥ 0 } .
性质1: 若存在 p > N ,使得对任意的 i , E ( | X i | p ) < + ∞ 恒成立,则 ε ( X ) < + ∞ 。
性质2: [
性质3:(条件使熵减少) 对任意的 X , Y ∈ R N ,有 E X [ ε ( Y | X ) ] ≤ ε ( X + Y ) ,当且仅当 X , Y 相互独立时,
等号成立。
此性质说明当已知条件越多时,未来事件的不确定性就下降了,即风险降低了。
此外,累积剩余熵中,由于 p ( x > λ ) = 1 − F ( λ ) ,其中 F ( λ ) 是其经验分布函数,在实际应用中,经验分布函数更容易得到,若对已知的分布,只需按定义即可计算出其剩余熵,若随机变量的分布形式未知,则可依据下面的定理,用经验 CRE ( ε ( F n ) ) 逼近 CRE ( ε ( F ) ) 。
设 X 1 , X 2 , ⋯ , X n 是正的且是独立同分布的随机变量, F 是其分布函数,令 F n 是 n 个样本
性质4: [
性质5:设
证明:由于
所以
由性质1可得,
由性质5,我们可以看出,只要随机变量的方差存在,则其累积剩余熵必存在,反之,当累积剩余熵存在时,方差是否存在呢?为此我们以Pareto分布为例比较一下。
Pareto分布是一种比较常见的厚尾分布,厚尾分布是金融市场中比较常见的分布。首先,我们了解一下Pareto分布的密度函数,
由此可得,其方差为:
其累积剩余熵为:
由以上方差与累积剩余熵的算式,我们可以看出,当
下面我们研究一下,当随机变量的方差与累积剩余熵都存在时,方差与累积剩余熵是否有关系。首先,我们比较一下几种常见分布的方差与累积剩余熵。
1) 均匀分布的CRE。
设
即
2) 指数分布的CRE。
设
则
3) Pareto分布的CRE。
由上面的分析,当
由以上几个例子,可以看出随机变量的累积剩余熵与它的标准差呈线性关系。
下面我们举例看一下它的应用。
例现有两个转盘A,B的抽奖游戏,中奖的钱
X | 6 | 7 | 8 |
---|---|---|---|
p | 1/3 | 1/3 | 1/3 |
表1. 转盘A中奖的钱数及概率
Y | 0 | 8 |
---|---|---|
p | 1/8 | 7/8 |
表2. 转盘B中奖的钱数及概率
由表1,表2,我们可以计算出它们的均值、方差、熵以及累积剩余熵,比较一下,哪一个更准确。
首先计算出均值:
其次计算出方差:
下面计算熵:
因为
最后我们看一下它们的累积剩余熵:
首先,设
则
显然,
对于独立同分布的随机变量
为了分析股票市场中的不确定性,下面选了8支股票(海螺水泥,长城汽车,工商银行中国国航,青岛啤酒股份,马鞍山钢铁股份,大唐发电以及中国石油股份)的每日收盘价格(从2014年1月3日到2017年8月30日)为样本(数据来源:东方财富网)。
根据相应的公式,我们可以计算出8支股票对应的平均值、标准差、偏度(偏态的系数)、峰度(峰态的系数)以及累积剩余熵(CRE),如表3所示。
由表3可以看出,8支股票都有一定的偏度和峰度,不是标准的正态分布,而且由上表,我们可以看出标准差与累积剩余熵有一定的联系,标准差大的股票,其对应的累积剩余熵也较大;标准差小的股票,其对应的累积剩余熵也较小。
为了进一步观察标准差与累积剩余熵的关系,我们在8支股票中任选一支股票,例如中国石油股份,将其900个数据(从2014年1月3日到2017年8月30日)按时间顺序分成15份,如表4所示。
股票 | 平均值 | 标准差 | 偏度 | 峰度 | CRE |
---|---|---|---|---|---|
海螺水泥 | 25.15471111 | 4.143943572 | −0.34573552 | −0.378607978 | 0.00567103 |
长城汽车 | 21.85918889 | 15.81356261 | 0.560897073 | −1.085948676 | 0.023137935 |
工商银行 | 4.998355556 | 0.625932511 | 0.859293615 | 1.208585424 | 0.000954 |
中国国航 | 6.075777778 | 1.320075905 | 1.025236892 | 0.371892073 | 0.002048 |
青岛啤酒股份 | 42.03461111 | 11.99408778 | 0.317773978 | −1.505081472 | 0.016755 |
马鞍山钢铁股份 | 2.108133333 | 0.59367379 | 1.272127076 | 1.002785755 | 0.000928 |
大唐发电 | 2.958333333 | 0.83296801 | 0.543866136 | −0.996340603 | 0.001232 |
中国石油股份 | 7.009133333 | 1.925877095 | 0.46147846 | −1.230233326 | 0.002801 |
表3. 8支股票对应的各参数值
组别 | 平均值 | 标准差 | CRE |
---|---|---|---|
1 | 7.942 | 0.25514 | 0.000856 |
2 | 9.1665 | 0.362332 | 0.001023 |
3 | 10.534333 | 0.491367 | 0.001696 |
4 | 9.0878333 | 0.673325 | 0.002053 |
5 | 8.6088333 | 0.214477 | 0.000643 |
6 | 9.3696667 | 0.638645 | 0.001987 |
7 | 7.4008333 | 0.96352 | 0.002661 |
8 | 5.83 | 0.365434 | 0.001049 |
9 | 4.8816667 | 0.360391 | 0.000845 |
10 | 5.3373333 | 0.231135 | 0.000909 |
11 | 5.2951667 | 0.093183 | 0.00032 |
12 | 5.272 | 0.185963 | 0.000653 |
13 | 5.963667 | 0.228265 | 0.000559 |
14 | 5.521333 | 0.232689 | 0.000594 |
15 | 4.925833 | 0.091989 | 0.000273 |
表4. 中国石油股份的标准差与CRE
由表4我们可以画出标准差与累积剩余熵的图形,如图1~3所示。
由图3,我们可以看出标准差与累积剩余熵呈线性关系。由以上分析,我们可以看出,当方差波动较大时,累积剩余熵 [
图1. CRE序列图
图2. 标准差的序列图
图3. 标准差与CRE之间的线性相关性
感谢我的导师对我的悉心教导,感谢我的同学和朋友在学习、生活上的关心和帮助,最后,感谢我的家人,一直以来,无论是学习和生活,都离不开他们的支持、照顾和理解。
安徽工业大学研究生创新基金资助(2016137)。
周 丹. 累积剩余熵的若干基本性质及其在股票分析中的应用The Basic Properties of Accumulated Residual Entropy and Its Application in Stock Analysis[J]. 理论数学, 2018, 08(01): 105-112. http://dx.doi.org/10.12677/PM.2018.81013