Markov过程对股票价格走势的分析与预测 Analysis and Forecast of Stock Price Trend Using Markov Process

doi:10.12677/SA.2020.92015

Statistics and Application
Vol. 09 No. 02 ( 2020 ), Article ID: 34711 , 13 pages
10.12677/SA.2020.92015

Analysis and Forecast of Stock Price Trend Using Markov Process

Wenduo Xu, Haitong Bian, Aihua Fan^*

●How to Cite this Article

School of Mathematics & Physics Science and Engineering, Anhui University of Technology, Ma’anshan, Anhui

Received: Feb. 26^th, 2020; accepted: Mar. 18^th, 2020; published: Mar. 25^th, 2020

ABSTRACT

In the stock market, the stock price is a random variable which changes with time, and its changing process is a random process. In this paper, the data of 104 trading days of A-share “Shanghai Pudong Development Bank (SH600,000)” from Shanghai Stock Exchange is selected. After checking that this process has Markov property, the corresponding Markov model is established to analyze and predict the stock price, and a relatively reasonable result is obtained. The establishment and application of the model can help us to understand the running cycle of stock price, and predict the trend of stock price.

Keywords:Markov Process, Transfer Probability, Share Price

Markov过程对股票价格走势的分析与预测

许文多，卞海通，范爱华^*

安徽工业大学数理科学与工程学院，安徽马鞍山

收稿日期：2020年2月26日；录用日期：2020年3月18日；发布日期：2020年3月25日

摘要

在股票市场中股票的价格是随时间变化而变化的随机变量，其变化过程是一个随机过程。本文选取上证A股“浦发银行(SH600000)”104个交易日的数据，在检验该过程具有Markov性的基础上，建立相应的Markov模型对股票价格进行了分析与预测，得到了较为理想的结果。模型的建立和应用对我们了解股价运行周期及预测股价走势有一定的指导作用。

关键词 :Markov过程，转移概率，股票价格

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

近年来，随着政府对股票市场的大力支持和推动，股票市场的管理机制逐渐完善。与此同时，随着机构、私募以及广大散户投资者的参与逐渐增加，对于股票价格走势的分析与预测变得十分重要。文献 [1] [2] [3] [4] 分别从收盘价、成交量、收益率、股票综合指数等方面对股票价格进行分析与预测。Markov过程是一类重要的随机过程，它的最主要特性是无记忆性，而股票价格的波动具有Markov性，所以可以通过建立股票价格的Markov过程的数学模型，来分析和预测股票价格走势的波动情况。具体做法是：首先收集一段时间的某只股票的收盘数据，用Matlab软件或其它数学软件对收集的股票数据进行适当处理和筛选，计算一步状态转移概率矩阵，在检验该过程具有Markov性的基础上，借助C-K方程，建立Markov预测法的数学模型，对股票价格走势进行预测。同时，利用Markov过程的平稳分布和周期性等方法，对股票的价格周期进行分析预测，将预测结果与真实数据进行对比，检验预测结果与真实市场价格走势的吻合程度。这两种手段对于解决大型周期性的波段操作比较实用有效，适合投资者进行中期和长期的投资使用，为投资者在实际操作中买卖该股票提供一个实际参考。

2. Markov过程的基本概念

2.1. Markov过程定义

定义1 [5]：随机过程 ${X_{n}, n = 0, 1, 2, \dots}$ 称为Markov链，若它只取有限或可列个值，对任意的 $n \geq 0$ 及状态 $i, j, i_{0}, i_{1}, \dots, i_{n - 1}$ ，有

$P {X_{n + 1} = j | X_{0} = i_{0}, X_{1} = i_{1}, \dots, X_{n - 1} = i_{n - 1}, X_{n} = i} = P {X_{n + 1} = j | X_{n} = i}$

它表示系统未来所处的状态只与系统现在所处的状态有关，与过去的状态无关，这个性质称为Markov性或无后效性。

2.2. 转移概率

定义2 [5]：条件概率 $P {X_{n + 1} = j | X_{n} = i}$ 为Markov链 ${X_{n}, n = 0, 1, 2, \dots}$ 的一步转移概率，简称转移概率，记 $p_{i j} = P {X_{n + 1} = j | X_{n} = i} (n \geq 0)$ ，我们可以将 $p_{i j} (i, j \in S)$ 排列成一个矩阵的形式

$P = (p_{i j}) = [\begin{matrix} p_{00} & p_{01} & p_{02} & p_{03} & \dots \\ p_{10} & p_{11} & p_{12} & p_{13} & \dots \\ p_{20} & p_{21} & p_{22} & p_{23} & \dots \\ p_{30} & p_{31} & p_{32} & p_{33} & \dots \\ ⋮ & ⋮ & ⋮ & ⋮ & ⋱ \end{matrix}]$

称P为转移概率矩阵，一般简称转移矩阵。 $p_{i j} (i, j \in S)$ 有性质

1) $p_{i j} \geq 0, i, j \in S$ ；

2) $\sum_{j \in S} p_{i j} = 1, \forall i \in S$ 。

2.3. n步转移概率C-K方程

定义3 [5]：(n步转移概率) 称条件概率 $p_{i j}^{(n)} = P {X_{m + n} = j | X_{m} = i}, i, j \in S, m \geq 0, n \geq 1$ 为Markov链的n步转移概率，相应的称 $P^{(n)} = (p_{i j}^{(n)})$ 为n步转移矩阵。

定理1 [5]：(C-K方程)对一切 $n, m \geq 0, i, j \in S$ 有

1) $p_{i j}^{(m + n)} = \sum_{k \in S} p_{i k}^{(m)} p_{k j}^{(n)}$ ；

2) $P^{(n)} = P \cdot P^{(n - 1)} = P \cdot P \cdot P^{(n - 2)} = \dots = P^{n}$ 。

2.4. 随机变量的马氏性检验方法

要应用马尔可夫链模型分析和解决实际问题，必须检验随机变量序列是否具有“马氏性”。目前绝大多数科技工作者应用各种马尔可夫链预测方法去解决实际问题时忽视了检验“马氏性”这一步骤这是不科学的也是不严谨的。下面给出马氏性检验定理。

定理2 [6]：设所讨论的指标值序列包含m个可能的状态， $f_{i j}$ 用表示指标值序列 $x_{1}, x_{2}, \dots, x_{n}$ 中从状态i经过一步转移到达状态j的频数， $i, j \in E$ 。将转移频数矩阵的第j列之和除以各行各列的总和所得的值称为“边际概率”记为 $p_{• j}$ 。则统计量 $χ^{2} = 2 \sum_{i = 1}^{m} \sum_{j = 1}^{m} f_{i j} | \log \frac{p_{i j}}{p_{• j}} |$ 以自由度为 ${(m - 1)}^{2}$ 的 $χ^{2}$ 分布为极限分布。其中 $p_{i j} = f_{i j} / \sum_{j = 1}^{m} f_{i j}$ 。且给定显著性水平 $α$ ，若 $χ^{2} > χ_{α}^{2} {(m - 1)}^{2}$ 则认为 $(x_{i})$ 符合马氏性，否则该序列不可作为马尔可夫链来处理。

3. 建立数学模型

3.1. 股价预测

设 $X_{n}$ 是某股票在第 $n (n = 0, 1, 2, \dots)$ 天的收盘价格，其变化只与前一天的股票收盘价格有关， $X_{n} \in [0, + \infty)$ 。在 $[0, + \infty)$ 插入 $m - 1$ 个分点 $0 < x_{1} < x_{2} < \dots < x_{m - 1}$ ，分别记 $x_{0}$ 和 $x_{m}$ 为 $0, \infty$ ，规定 $X_{n} \in [x_{i - 1}, x_{i})$ 时出现状态i。记 $f_{i j}$ 为股票价格从状态i经过一个时间间隔转移到状态j的频数，记 $p_{i j}$ 为股票价格从状态

i经过一个时间间隔转移到状态j的概率， $p_{i j} = f_{i j} / \sum_{j = 1}^{m} f_{i j}$ ， $p_{i j}^{(n)}$ 表示从状态i经过n步转移到状态j的概率。

得到转移频数和转移概率分别为

$F = [\begin{matrix} f_{11} & f_{12} & \dots & f_{1 m} \\ f_{21} & p_{22} & \dots & f_{m 2} \\ ⋮ & ⋮ & ⋱ & ⋮ \\ f_{m 1} & f_{m 2} & \dots & f_{m m} \end{matrix}]$

$P = [\begin{matrix} p_{11} & p_{12} & \dots & p_{1 m} \\ p_{21} & p_{22} & \dots & p_{m 2} \\ ⋮ & ⋮ & ⋱ & ⋮ \\ p_{m 1} & p_{m 2} & \dots & p_{m m} \end{matrix}]$

股票的价格是随时间变化而变化的随机变量，其变化过程是一个随机过程，股票价格在时刻t下一刻所处的状态只与时刻t所处的状态有关，与时刻t之前所处的状态无关，即具有马氏性。为保证研究数据的严谨，接下来对股价随机变量序列是否具有马氏性做检验，将转移频数矩阵的第j列之和除以各行各列的总和所得的值称为“边际概率”记为 $p_{• j}$ ，即 $p_{• j} = \sum_{i = 1}^{m} f_{i j} / \sum_{i = 1}^{m} \sum_{j = 1}^{m} f_{i j}$ 。则统计量 $χ^{2} = 2 \sum_{i = 1}^{m} \sum_{j = 1}^{m} f_{i j} | \log \frac{p_{i j}}{p_{• j}} |$ 以自由度为 ${(m - 1)}^{2}$ 的 $χ^{2}$ 分布为极限分布。且给定显著性水平 $α$ ，查 $χ^{2}$ 分布临界值表，若 $χ^{2} > χ_{α}^{2} {(m - 1)}^{2}$ 则认为股票价格符合马氏性，否则不能用Markov过程对股票价格进行预测。

若股票价格符合马氏性，根据C-K方程可知 $P^{(n)} = P^{n}$ ，P描述了股价从一个状态向另一个状态转移的概率分布状况，故我们可以通过计算 $P^{(n)}$ 预测n个交易日后的股价。即通过比较 $P^{(n)}$ 中第i (i为当前股价所处状态)行各值的大小就可以判断n个时间间隔后股价的运行趋势。

3.2. 股价的平稳分布

设 $π_{i}$ 是系统位于状态i的平稳概率， $π = (π_{1}, π_{2}, \dots, π_{m})$ 为系统的平稳分布，若已知一步转移概率矩阵，则

${\begin{cases} π = π P \\ π_{1} + π_{2} + π_{3} + \dots + π_{m} = 1 \\ π_{i} \geq 0 \end{cases}$

解方程组就可以求出Markov链的平稳分布。

3.3. 股价的运行周期

记 $T_{i j}$ 为股票价格由状态i转移到状态j所需的时间，则可推导出公式 $T_{i j} = 1 + \sum_{i \neq j} p_{i k} T_{k j}$ ，再通过软件求解方程组得到相应的 $T_{i j}$ ，进而求得股价的运行周期为 $T_{1 m} + T_{m 1}$ 。

4. 应用实例

本文收集上证A股“浦发银行(SH600000)”从2019年4月1日到2019年8月30日共105个交易日的收盘价，将股票划分为5个状态区间，即：

状态1：(11.00, 11.24]；2：(11.24, 11.48]；3：(11.48, 11.72]；4：(11.72, 11.96]；5：(11.96, 12.20]。

整理数据得出一步转移频数(表1)。

Table 1. One-step transfer frequency table

表1. 一步转移频数表

则

$F = [\begin{matrix} 7 & 8 & 0 & 0 & 0 \\ 7 & 22 & 8 & 1 & 1 \\ 1 & 9 & 19 & 2 & 0 \\ 0 & 0 & 2 & 10 & 2 \\ 0 & 0 & 2 & 1 & 2 \end{matrix}]$

进一步求出一步转移概率矩阵：

$P = [\begin{matrix} \frac{7}{15} & \frac{8}{15} & 0 & 0 & 0 \\ \frac{7}{39} & \frac{22}{39} & \frac{8}{39} & \frac{1}{39} & \frac{1}{39} \\ \frac{1}{31} & \frac{9}{31} & \frac{19}{31} & \frac{2}{31} & 0 \\ 0 & 0 & \frac{2}{14} & \frac{10}{14} & \frac{2}{14} \\ 0 & 0 & \frac{2}{5} & \frac{1}{5} & \frac{2}{5} \end{matrix}]$

由 $p_{• j} = \sum_{i = 1}^{m} f_{i j} / \sum_{i = 1}^{m} \sum_{j = 1}^{m} f_{i j}$ 可求得边际概率见表2。

Table 2. Marginal probability table

表2. 边际概率表

计算极限分布 $χ^{2} = 2 \sum_{i = 1}^{m} \sum_{j = 1}^{m} f_{i j} | \log \frac{p_{i j}}{p_{• j}} |$ 见表3。

Table 3. Calculation table of limit distribution

表3. 极限分布计算表

给定显著水平 $α = 0 .05$ ，查 $χ^{2}$ 分布临界值表，得 $χ_{α}^{2} {(m - 1)}^{2} = χ_{0.05}^{2} (16) = 26.296$ ，由于 $χ^{2} = 142 .7094 > χ_{α}^{2} {(m - 1)}^{2}$ ，根据定理可知股票价格序列满足马氏性。

根据公式 $π P = π$ 可以计算出各状态的平稳分布

$π = [15 / 104, 3 / 8, 31 / 104, 7 / 52, 5 / 104]$

股价预测：根据一步转移概率矩阵和C-K方程在我们可以选取9月某一天的股价预测后面的股价，例如，选取9月16日的股价11.93预测后面5天的股价(表4)。

Table 4. Stock price forecast

表4. 股价预测表

讨论股价从状态i首次到达状态j所需的平均交易时间 $T_{i j}$ ，由 $T_{i j} = 1 + \sum_{i \neq j} p_{i k} T_{k j}$

${\begin{cases} T_{15} = 1 + \frac{7}{15} T_{15} + \frac{8}{15} T_{25} \\ T_{25} = 1 + \frac{7}{39} T_{15} + \frac{22}{39} T_{25} + \frac{8}{39} T_{35} + \frac{1}{39} T_{45} \\ T_{35} = 1 + \frac{1}{31} T_{15} + \frac{9}{31} T_{25} + \frac{19}{31} T_{35} + \frac{2}{31} T_{45} \\ T_{45} = 1 + \frac{2}{14} T_{35} + \frac{10}{14} T_{45} \\ T_{55} = 1 + \frac{2}{5} T_{35} + \frac{1}{5} T_{45} \end{cases}$

计算可得

$T_{15} = 39.9$ ， $T_{25} = 38.0$ ， $T_{35} = 38.2$ ， $T_{45} = 22.6$ ， $T_{55} = 20.8$

同理可得

$T_{11} = 6.9$ ， $T_{21} = 11.1$ ， $T_{31} = 14.2$ ， $T_{41} = 19.4$ ， $T_{51} = 17.6$

由上述结果，可推断浦发银行在这104个交易日时间内，状态1到状态5需要39.9个交易日，状态5到状态1需要17.6交易日，即大跌到大涨需要39.9个交易日，大涨到大跌需要17.6个交易日，股价完成一个运行周期平均需要 $T_{15} + T_{51} = 57.5$ 个工作日。

5. 结论

研究股票价格走势的方法有很多，比如主成分分析法、时间序列法、逐步回归法、神经网络法等等。本文利用马尔科夫链，在对股票收盘价格作连续观察的基础上，建立了动态数学模型，在检验该过程具有Markov性的基础上，对股票价格走势及股价运行周期进行了分析和预测，并将部分预测结果和实际收盘价格进行了对比，与实际结果吻合度较好，为投资者选择股票买卖点提供了选择依据。在股票市场受外界因素影响较小的情况下，该模型还是相当有效的。本文的预测方法最方便的一点就是对于初始状态矢量和状态概率转移矩阵的确定，他们在分析预测的过程中保持稳定不变，要注意的是，进行多次或者长期的预测，可能会产生一定误差，如果想解决这个问题，需要依据市场变化及时的调整状态概率转移矩阵，这样才能提高预测结果的可信度。另外，股票价格有时还受到一些外界随机因素的影响，所以模型的结果也只能作为投资者选择的一种参考，股市有风险，投资需谨慎！

基金项目

安徽省教学研究项目资助(2016jyxm0136)。

文章引用

许文多,卞海通,范爱华. Markov过程对股票价格走势的分析与预测
Analysis and Forecast of Stock Price Trend Using Markov Process[J]. 统计学与应用, 2020, 09(02): 128-140. https://doi.org/10.12677/SA.2020.92015

参考文献

1. 赵婕, 赵妍. Markov链在股票市场近期走势的预测分析[J]. 现代商贸工业, 2010(16): 194-195.

2. 张宇山, 廖芹. 马尔可夫链在股市分析中的若干应用[J]. 华南理工大学学报, 2003(31): 74-77.

3. 孟银凤, 李荣华. 股票价格的马氏链预测模型[J]. 数学理论与应用, 2010(30): 53-57.

4. 应益荣, 吴冲锋. 股票综合指数的特征值分析法[J]. 系统工程理论方法应用, 2002(11): 177-180.

5. 张波，张景肖. 应用随机过程[M]. 北京: 清华大学出版社, 2004.

6. 张玉芬，朱雅琳. 马尔可夫性及其检验方法[J]. 价值工程, 2012, 31(2): 312-313.

附录1

股票价格表

$χ^{2}$ 分布临界值表：

附录2

1) 状态转移

function [z] = shaixuan(a)

for i=1:105

if a(i)>11&&a(i)<=11.24

x(i)=1;

elseif a(i)>11.24&&a(i)<=11.48

x(i)=2;

elseif a(i)>11.48&&a(i)<=11.72

x(i)=3;

elseif a(i)>11.72&&a(i)<=11.96

x(i)=4;

elseif (i)>11.96&&a(i)<=12.2

x(i)=5;

end;

for i=2:105

z(i)=x(i-1)*10+x(i);

end;

2) 平稳分布

syms x1 x2 x3 x4 x5%定义符号变量，以便后续计算

p=[7/15 8/15 0 0 0;

7/39 22/39 8/39 1/39 1/39;

1/31 9/31 19/31 2/31 0;

0 0 2/14 10/14 2/14;

0 0 2/5 1/5 2/5];

eq1=x1-[x1,x2,x3,x4,x5]*p(:,1);

eq2=x2-[x1,x2,x3,x4,x5]*p(:,2);

eq3=x3-[x1,x2,x3,x4,x5]*p(:,3);

eq4=x4-[x1,x2,x3,x4,x5]*p(:,4);

eq5=x5-[x1,x2,x3,x4,x5]*p(:,5);

eq6=x1+x2+x3+x4+x5-1;

[x1,x2,x3,x4,x5]=solve(eq1,eq2,eq3,eq4,eq5,eq6);

3) 求极限分布

p=[7/15 8/15 0 0 0;

7/39 22/39 8/39 1/39 1/39;

1/31 9/31 19/31 2/31 0;

0 0 2/14 10/14 2/14;

0 0 2/5 1/5 2/5];

f=[7 8 0 0 0;

7 22 8 1 1;

1 9 19 2 0;

0 0 2 10 2;

0 0 2 1 2];

p2=[15/104 39/104 31/104 14/104 5/104];

for i=1:5

for j=1:5

t(i,j)=f(i,j)*log(p(i,j)/p2(j));

end

4) 平均转移时间

syms x1 x2 x3 x4 x5%定义符号变量，以便后续计算

p=[7/15 8/15 0 0 0;

7/39 22/39 8/39 1/39 1/39;

1/31 9/31 19/31 2/31 0;

0 0 2/14 10/14 2/14;

0 0 2/5 1/5 2/5];

m=5;

for i=1:5

p(i,m)=0;

end;

eq1=x1-1-[x1,x2,x3,x4,x5]*p(1,:)';

eq2=x2-1-[x1,x2,x3,x4,x5]*p(2,:)';

eq3=x3-1-[x1,x2,x3,x4,x5]*p(3,:)';

eq4=x4-1-[x1,x2,x3,x4,x5]*p(4,:)';

eq5=x5-1-[x1,x2,x3,x4,x5]*p(5,:)';

[x1,x2,x3,x4,x5]=solve(eq1,eq2,eq3,eq4,eq5);

NOTES

^*通讯作者。

期刊菜单