Pure Mathematics
Vol. 13  No. 01 ( 2023 ), Article ID: 60797 , 9 pages
10.12677/PM.2023.131011

基于Markov链的华夏银行股票波动短期预测

付军

北方工业大学理学院统计学系,北京

收稿日期:2022年12月23日;录用日期:2023年1月22日;发布日期:2023年1月29日

摘要

随着社会经济的发展,人们逐渐建立了投资理财的意识,其中股票就是常见的投资对象。如果提供具有参考依据的股票预测结果,对广大投资者以及企业自身而言都将得到可观的收益。本文将Markov链作为预测股票的方法,简要阐述Markov链及其相关的基础理论,以华夏银行作为实证,检验Markov链预测股票涨幅的效果。本文收集和整理了95个交易日的股票数据,以每日涨幅作为依据,划分成为下跌、略微下跌、略微上升和上升共四个状态,计算各阶转移概率矩阵,并在预测前对数据进行了马氏性检验。通过对比发现之后六个交易日中,大部分实际涨幅情况落在预测区间内,并简要分析了华夏银行股票当前走势的可能原因。得出Markov链对股票预测准确度较好的结论,分析出状态转移矩阵的改变是Markov链在中长期预测精准度下降的原因。

关键词

Markov链,状态转移,马氏性检验,预测

Short-Term Forecast of Huaxia Bank Stock Volatility Based on Markov Chain

Jun Fu

Department of Statistics, School of Science, North China University of Technology, Beijing

Received: Dec. 23rd, 2022; accepted: Jan. 22nd, 2023; published: Jan. 29th, 2023

ABSTRACT

With the development of social economy, people have gradually established the awareness of investment and financial management, among which stocks are the common investment object. If the stock forecast results with reference basis are provided, both the majority of investors and the enterprise itself will get considerable returns. In this paper, Markov chain is used as the method to predict stocks, Markov chain and its related basic theories were briefly expounded, taking Huaxia Bank as the empirical to test the effect of Markov chain in predicting stock increase. This paper collects and arranges the stock data of 95 trading days, based on the daily increase, divided into four states: fall, slightly fall, slightly rise and rise, and calculates the transition probability matrix of each order, and conducts the Markov property on the data before the prediction. Through comparison, in the following six trading days, most of the actual gains fell within the forecast range, and the possible reasons for the current trend of Huaxia Bank stock were briefly analyzed. The conclusion is drawn that the Markov chain has good accuracy in stock prediction, and the change of the state transition matrix is the reason for the decrease in the prediction accuracy of the Markov chain in the medium and long term.

Keywords:Markov Chain, State Transfer, Markov Property, Prediction

Copyright © 2023 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

1.1. 研究背景及意义

随着经济的发展和时代的进步,人们的收入除了用于日常消费外,还会将部分闲置资金投资于金融市场中,购买股票就是一种常见的投资方式。

根据中国证券登记结算有限责任公司发布的数据,截至202211月开立了A股账户投资者就达2.108亿,其中自然人(个人投资者)2.103亿,占比达到99.77%。如果提供一些股票未来走势的预测参考,使广大投资者及时做出买入或抛出等决策,一方面能让人们充分发挥闲置资金的作用,投资成功将给投资者带来收益;另一方面能让企业的经营和融资过程更加顺利,给企业带动可观的利润,对市场发出正向的信号。从这两方面来看,股票对社会经济发展有一定作用,故研究和预测股票走势具有重要意义。

1.2. 研究方法

预测股票走势即研究股票价格波动并非容易之事。从国际和国内经济形势的宏观因素到个体投资者决策的微观因素,影响股票价格波动的变量很多,因此部分学者认为股票市场不可预测,便放弃了其研究工作,但是更多的国内外研究者和投资者提出了各种预测模型及理论,并得到了较好的预测效果。

早期的预测模型主要聚焦于线性回归领域,但是随着金融界理论的发展以及股票价格变化具有非线性的特征,1982罗伯特·恩格尔提出了自回归条件异方差模型(ARCH模型)用于金融领域的预测,同时也解决了传统时间序列中方差恒定的问题,后来学者以此为基础提出了GARCHARCH-M、SV等随机波动模型;之后随着计算机算法的提升,提出了模糊神经网络、BP神经网络等机器学习类的预测模型,且精度有了明显的提高。近年来随着数学算法的发展以及强化学习的推进,作为其基石的Markov链及其相关理论引起了学者们的重视。

Markov链预测股票价格,国内外学者有很多相关先例及其研究成果,陈嘉晋 [1] 等人曾运用Markov链预测2018年10月22日及23日伊利股份收盘股价区间;王鑫 [2] 用此方法预测了华联股票价格,并对养老基金运行提供有关建议。本文将随机过程领域的Markov链作为主要研究方法,先讲述其基础理论,再以华夏银行(600015)作为研究对象,具体说明Markov链在实际预测股票价格的应用过程。将预测结果与实际结果进行对比,说明其预测效果较好,并阐述Markov链在短期与中、长期预测中准确度不同的原因。

2. Markov链理论基础

Markov链由俄国数学家Андрей Андреевич Марков1906年首次提出,是第一个从理论上被提出并加以研究的随机过程模型 [3],目前已在经济、医学、通信等领域具有广泛的运用。

假设 { X n , n = 1 , 2 , 3 } 为随机变量长度为n的随机过程,对于 n > 0 情况下,随机变量 X n 的取值均在可数集I内,即 X n = S i ( i = 1 , 2 , 3 , ) S i ( i = 1 , 2 , 3 , ) I

P ( X n + 1 = S k | X 1 = S 1 , X 2 = S 2 , , X n = S n ) = P ( X n + 1 = S k | X n = S n ) (1)

若满足式1,我们称 { X n , n = 1 , 2 , 3 } 为Markov链,对于可数集I称为状态空间。式1体现了Markov链无后效性的特点,即对于下一阶段n + 1时的状态,只与本阶段n时的状态有关,与之前n − 1个任何阶段的状态均无关。

2.1. 转移概率矩阵

状态转移概率是指事物此时处于某一状态时,其下一时刻转移到其他状态的可能性。例如 p i j ( i , j = 1 , 2 , 3 , ) 是事物此时处于 S i 状态,其下一时刻转移至 S j 状态的概率。假设该事物有n个可能的状态,该事物下一阶段可能转移的状态有n种,逐个计算其转移概率,形成 n × n 的转移概率矩阵P

P = ( p 11 p 12 p 1 n p 21 p 22 p 2 n p n 1 p n 2 p n n )

其具备如下两条性质 [4]:

非负性。根据概率论的基本知识,事物的任何概率均不可能为负,且均不大于1,转移概率也不例外,即 0 p i j 1 , ( i , j = 1 , 2 , 3 , , n )

归一性。转移概率矩阵的行和始终为1。在事物所有状态已知的情况下,事物从当前状态转化成下一阶段的状态,只可能是n种状态的其中一种,因此行边缘概率为1,即 j = 1 n p i j = 1 ( i = 1 , 2 , 3 , n )

我们将 P ( X n + 1 = S k | X n = S n ) 称为从状态 S n 转化成 S k 的一步状态转移概率。我们对其进行推广, P ( X n + m = S k | X m = S n ) ( n > 1 ) 称为从状态 S n 转化成 S k 的n步状态转移概率,即状态转移并非一步完成,有中间的过渡状态,且之间相互独立,本文通过举例的方式推导n步状态转移概率的计算公式。

图1所示,事物A的状态空间 I = { S 1 , S 2 , S 3 } ,一步转移概率矩阵P已知。n ( n > 1 )时刻事物A处于S1状态,若计算事物A在n + 2时处于S3状态的概率,通过观察发现共有三条路径能够实现,其概率为各条路径概率之和,由于各步之间相互独立,每条路径概率为各步概率乘积,即

P ( X n + 2 = S 3 | X n = S 1 ) = p 11 × p 13 + p 12 × p 23 + p 13 × p 33 = i I p 1 i × p i 3 (2)

将式2推广后,即为Chapman-Kolmogorov方程 [5] (以下简称“C-K方程”):

p i j ( n ) = k I p i k ( l ) p k j ( n l ) (3)

P ( n ) = P P ( n 1 ) (4)

式3提供了n步转移概率的计算公式,n步状态转移概率的所有元素组成的矩阵称为n步状态转移概率矩阵 P n ,根据C-K方程,能更简便的计算出n步状态转移概率矩阵 P n

Figure 1. Two-step state transfer path diagram of thing A

图1. 事物A两步状态转移路径图

P n = ( P 1 ) n ( p 11 p 12 p 1 n p 21 p 22 p 2 n p n 1 p n 2 p n n ) n

2.2. 马氏性检验

马氏性检验的目的是判断序列是否为Markov链,即检验该随机变量序列是否满足式1中的条件。如果未对序列进行马氏性检验或未通过马氏性检验,则得出预测结果的精准度有待考察,由此做出的投资建议将不具备合理依据。

该检验借助统计学中假设检验的知识和方法,构造出 χ 2 统计量,在显著性水平 α 给定的情况下,通过比较统计量与临界值 χ α 2 [ ( n 1 ) 2 ] 的大小,若 χ α 2 [ ( n 1 ) 2 ] < χ 2 ,则该序列符合马尔可夫性,可以进行分析预测 [6],反之亦然。统计量表达式如下:

χ 2 = 2 i = 1 n j = 1 n f i j | log p i j p . j | (5)

其中, f i j p i j 分别表示该事物从当期状态i下一阶段转移至状态j的历史频率和概率,均可通过被研究数据进行估算; p . j 为列边缘概率,即无论该事物当期处于什么状态,下一阶段能转移至状态j的概率。

3. 实证分析

Figure 2. Empirical analysis process

图2. 实证分析过程

借助同花顺股票交易平台,本文收集和整理了华夏银行(600015)在2022年8月1日至2022年12月19日期间共95个交易日的每日收盘价格,参考图2实证分析过程,运用Markov链及其相关理论,预测该只股票未来几日价格走势。本文将每个交易日涨幅r作为划分状态的指标,涨幅r计算公式如下:

( r ) = × 100 % (6)

得到了序列长度为94的股票每日涨幅时间序列G,本文后续分析均基于此序列。

3.1. 确定波动状态

观察序列G发现涨幅最低为−2.39%,最高为2.95%,参考文献 [7] 和 [8],结合序列G的分布图与聚类情况,我们将94个收盘价波动分为四个状态:涨幅为(−10%, −1%]定义为下降、(−1%, 0%]定义为略微下跌、(0%, 1%]定义为略微上升、(1%, 10%]定义为上升,并分别用 S 1 , S 2 , S 3 , S 4 表示以上四种状态,即状态空间为 S = { S 1 , S 2 , S 3 , S 4 } ,每日的波动状态见附表1。从统计情况来看,下跌状态(S1)共8次,略微下跌状态(S2)共44次、略微上升状态(S3)共32次、上升状态(S4)共10次。

3.2. 建立状态转移概率矩阵

f i j 为研究数据中从状态 S i 经过一步转移到状态 S j 的频数( i , j = 1 , 2 , 3 , 4 ),可以组建出4 × 4状态转移频率矩阵f,该矩阵为后续计算各阶状态转移矩阵 P n ( n = 1 , 2 , 3 , ) 以及序列马氏性检验做准备。

受篇幅限制,本文仅以下跌状态(S1)转移至略微下跌(S2)为例,说明矩阵f计算过程。序列中呈现下跌状态(S1)的总数共8次,其中从下跌状态(S1)转移至略微下跌(S2)有3次,即 f 12 = 3 ,以此类推。矩阵f的计算结果如下:

f = ( 1 3 2 2 3 18 17 6 3 19 9 1 2 3 4 1 )

我们将状态转移频数矩阵f中的所有元素除于该行元素总和,即

p i j = f i j j = 1 4 f i j = f i j f i . (7)

按式7可得到一步状态转移概率矩阵P:

P = ( 1 / 8 3 / 8 1 / 4 1 / 4 3 / 44 9 / 22 17 / 44 3 / 22 3 / 32 19 / 32 9 / 32 1 / 32 1 / 5 3 / 10 2 / 5 1 / 10 ) = ( 0.1250 0.3750 0.2500 0.2500 0.0682 0.4090 0.3864 0.1364 0.0938 0.5937 0.2812 0.0313 0.2000 0.3000 0.4000 0.1000 )

图3为状态转移图,是直观表达转移概率的另一种方式。

根据C-K方程,二步、三步状态转移概率矩阵 P 2 P 3 如下:

P 2 = ( 0.1147 0.4237 0.3465 0.1152 0.0999 0.4632 0.3383 0.0986 0.0849 0.4543 0.3444 0.1164 0.1030 0.4652 0.3184 0.1134 )

P 3 = ( 0.0988 0.4566 0.3359 0.1088 0.0955 0.4573 0.3385 0.1086 0.0972 0.4570 0.3402 0.1056 0.0971 0.4519 0.3404 0.1105 )

Figure 3. State transition diagram

图3. 状态转移图

我们可以通过各步状态转移矩阵和初始状态向量,计算出各阶段的状态转移向量,从而对股票未来状态进行预测。

3.3. 马氏性检验

在运用Markov链之前,我们需要对序列G进行马氏性检验,用于判断序列中的随机变量是否满足:下一阶段状态只与当前状态有关,而与之前阶段的状态无关。该检验是后续分析和预测的前提与基础。

通过计算式5中参数 n = 4 情况下的统计量,来判断序列G是否具备马氏性。如不具备马氏性,则预测结果的参考价值不大。参考刘致谦 [9] 在检验招商银行长度为41序列的方法进行计算。

原假设H0:序列G不具备马氏性,备择假设H1:序列G具备马氏性

χ 2 = 2 i = 1 4 j = 1 4 f i j | log p i j p . j |

表1可知,统计量 χ 2 = 109.0399 ,在 α = 5 % 显著水平下,查验 χ 2 临界值表, χ 0.05 2 ( 9 ) = 16.919 ,统计量 χ 2 > 16.919 ,即拒绝原假设H0,认为序列G具备马氏性,预测结果具有一定参考价值。

Table 1. Calculation process and presentation of Markov property

表1. 马氏性检验计算过程及结果呈现

3.4. 基于状态转移概率矩阵的预测

由于2022年12月19日收盘价处于下跌状态(S1),则可以认为初始状态向量 a 0 = ( 1 , 0 , 0 , 0 ) 。利用该向量和各步状态转移概率矩阵,从而预测2022年12月20日至2022年12月27日状态概率向量(非交易日除外)。

2022年12月20日状态概率向量: a 1 = a 0 × P = ( 1 , 0 , 0 , 0 ) ( 0.1250 0.3750 0.2500 0.2500 0.0682 0.4090 0.3864 0.1364 0.0938 0.5937 0.2812 0.0313 0.2000 0.3000 0.4000 0.1000 ) = ( 0.1250 , 0.3750 , 0.2500 , 0.2500 )

2022年12月21日状态概率向量: a 2 = a 0 × P 2 = ( 1 , 0 , 0 , 0 ) ( 0.1147 0.4237 0.3465 0.1152 0.0999 0.4632 0.3383 0.0986 0.0849 0.4543 0.3444 0.1164 0.1030 0.4652 0.3184 0.1134 ) = ( 0.1147 , 0.4237 , 0.3465 , 0.1152 ) 向量 a 3 a 4 的计算过程以此类推,计算结果整理后见表2

Table 2. Daily state probability vector for 20 December 2022 to 27 Dec. 2022

表2. 2022年12月20日至2022年12月27日每日状态概率向量

从预测结果来看,2022年12月20日转移至S2状态的概率最大为37.5%,对应的预测涨幅区间为(−1%, 0%]。实际涨幅为−0.96%,在预测区间范围内;后续四个交易日的实际涨幅均落在预测涨幅区间范围内,2022年12月27日实际涨幅为1.17%未落在预测区间内,详细情况见表3。综合来看,预测效果较好。

Table 3. Contrast situation of forecast range and the actual increase

表3. 预测区间与实际涨幅对比情况

4. 结论与说明

从结果来看,华夏银行之后五个交易日的股票价格走势处于非上升的趋势,本文认为主要原因有两方面:一方面与当时的市场环境有关。根据每日经济新闻的消息,2022年12月19日上证指数收盘涨幅为−1.92%,随后两天的涨幅均为负数;另一方面与银行自身情况有关,近年来华夏银行的业绩增长乏力,不良贷款率高于业内平均水平,且该行出现多起大额处罚 [10],2022年的股票价格处于下跌趋势较多。

通过Markov链以及相关理论和对华夏银行的短期预测结果来看,Markov链对股票价格的走势预测具备一定的精准性,即短期预测结果能对投资者提供一定的参考价值,使其避免一些因盲目决策带来的损失 [11]。当然预测结果的精准程度也与观察序列的长度、确定状态指标的选取以及状态划分区间等因素有关。但是无论以上因素如何调整和变化,若将Markov链应用于对股票的中、长期预测时,会发现预测结果与实际结果偏差会增加,其精准度小于短期预测。这也是Markov链的弊端,究其根本在于状态转移概率矩阵不稳定。

在短时间内,影响股票走势的主要是与股票本身特点有关的内生变量,而外生变量在短时间内通常不会出现大规模的调整,市场环境可认为比较稳定,此时的状态转移概率矩阵不会有大的波动;在长时间内,由于外生变量的影响,例如货币政策的调整、经营遇到突发事件等情况,使市场环境发生改变,此时的状态转移概率矩阵将会改变,原先的状态转移概率矩阵代表性将会减弱,预测的参考性会降低。

致谢

本文所运用的方法大部分来自于随机过程的领域,很多方法和理论都是在大学生创业项目学到的。撰写本文既是对项目结束后的一次实际成果检验,亦是对本人2022年学习生活画下的圆满句号。从国际国内到个人,2022年注定是极不平凡的一年!奋进新征程,希望2023年能继续充实过好每一天!

文章引用

付 军. 基于Markov链的华夏银行股票波动短期预测
Short-Term Forecast of Huaxia Bank Stock Volatility Based on Markov Chain[J]. 理论数学, 2023, 13(01): 96-104. https://doi.org/10.12677/PM.2023.131011

参考文献

  1. 1. 陈嘉晋, 李登明. 马尔科夫链模型对股价短期变动趋势的研究——以伊利集团为例[J]. 经济研究刊, 2019(10): 104-106+120.

  2. 2. 王鑫. 马尔科夫预测模型在股票涨跌预测中的应用研究[J]. 新财经, 2019(19): 13-14+26.

  3. 3. 张波, 张景肖. 应用随机过程[M]. 北京: 清华大学出版社, 2004.

  4. 4. 李自玲. 基于马尔可夫链的历史和现状的研究[J]. 商业经济, 2017(3): 132-133.

  5. 5. 刘次华. 随机过程[M]. 第4版. 武汉: 华中科技大学出版社, 2008: 58.

  6. 6. 徐艳梅. 新疆消费价格指数的马氏链分析及预测[J]. 石河子科技, 2019(4): 47-51.

  7. 7. 骆佳磊. 基于马尔科夫链的股票预判实证研究[J]. 中国经贸, 2017(13): 126-127.

  8. 8. 万云倩, 范爱华. Markov过程在股票市场中的应用[J]. 统计学与应用, 2017, 6(3): 298-303. https://doi.org/10.12677/SA.2017.63034

  9. 9. 刘致谦. 基于马尔可夫链的股票价格波动预测[J]. 合作经济与科技, 2021(24): 64-67. https://doi.org/10.13665/j.cnki.hzjjykj.2021.24.023

  10. 10. 于晗. 华夏银行 被罚逾1.27亿元 屡因“掩盖资产质量”受罚[N]. 中国银行保险报, 2022-08-15(002). https://doi.org/10.28049/n.cnki.ncbxb.2022.003028

  11. 11. 王洲, 范爱华. 基于Markov模型对股票的价格预测[J]. 统计学与应用, 2022, 11(4): 778-784. https://doi.org/10.12677/SA.2022.114081

附录

Table A1. The daily increase status for the period of 95 trading days from August 1, 2022 to December 19, 2022

表1. 2022年8月1日至2022年12月19日期间95个交易日每日涨幅状态

期刊菜单