Statistics and Application
Vol. 10  No. 06 ( 2021 ), Article ID: 47479 , 12 pages
10.12677/SA.2021.106114

基于MS-GARCH模型的时间序列聚类

王琳,丁孝全*

河南科技大学数学与统计学院,河南 洛阳

收稿日期:2021年11月27日;录用日期:2021年12月11日;发布日期:2021年12月27日

摘要

聚类是时间序列数据挖掘的重要任务之一。本文基于有限混合MS-GARCH模型,提出一种时间序列聚类方法。利用贝叶斯马尔科夫链蒙特卡洛模拟方法,克服路径依赖的困难,给出了模型参数的估计。最后,选取23家中国上市公司股票数据进行实证分析,验证了所提方法的有效性。

关键词

时间序列聚类,有限混合模型,MCMC算法,MS-GARCH模型

Time Series Clustering with MS-GARCH Mixtures

Lin Wang, Xiaoquan Ding*

School of Mathematics and Statistics, Henan University of Science and Technology, Luoyang Henan

Received: Nov. 27th, 2021; accepted: Dec. 11th, 2021; published: Dec. 27th, 2021

ABSTRACT

Clustering is one of the important tasks of time series data mining. In this paper, we propose a novel time series clustering method based on the finite mixture MS-GARCH model. By using Bayesian Markov chain Monte Carlo simulation methods to overcome the difficulty of full path dependence, we estimate the model parameters. Finally, the empirical analysis of stock data of 23 Chinese listed companies verifies the effectiveness of our proposed method.

Keywords:Time Series Clustering, Finite Mixture Model, MCMC Algorithm, MS-GARCH Model

Copyright © 2021 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

时间序列数据是一类非常重要的复杂数据,广泛存在于经济、金融、管理、医疗卫生、气象、水文和工程等领域。由于其高维、高冗余和随时间动态变化的特点,相比直接分析原始数据,合理利用前人建立的时间序列模型,在研究中更能容易刻画序列的变化规律。

广义自回归条件异方差(GARCH)模型是由Bollerslev [1] 在Engle [2] 研究的基础上对自回归条件异方差(ARCH)模型推广得到的。该模型以可变条件方差描述序列波动特征,条件异方差依赖于给定信息和滞后条件方差,具有更灵活的滞后结构,能更好地体现序列的记忆特征。1990年,Lamoureux和Lastrages [3] 指出条件方差可能存在结构转换,如果不考虑这种结构变化,可能造成波动持续性的错误估计。受其启发,Cai [4] 和Hamilton,Sumsel [5] 将Markov状态切换和ARCH效应结合,提出MS-ARCH模型;Gray [6] 则进一步把马尔可夫状态切换引入GARCH模型,建立MS-GARCH模型。随后,许多学者对MS-GARCH模型做了不同的改进,并开展了深入研究 [7] - [13]。

聚类是把一个数据对象的集合划分成若干簇(子集),使簇内对象彼此相似、簇间对象不相似的过程。面对庞杂而日益增长的时间序列数据,聚类是时间序列数据挖掘的重要任务之一。近年来,涌现出许多时间序列聚类方法,大体上可以分为基于原始数据的聚类、基于数据特征的聚类和基于数据模型的聚类等三种 [14] [15] [16]。

基于混合模型的聚类是一种有效、可解释、适应性强的统计分析方法 [17] [18] [19],它假定要聚类的数据来自一个有限混合的概率分布,通过计算每个数据在此概率分布下的后验概率,取后验概率最大的成分作为聚类结果。近年来,该方法也被广泛用于时间序列数据的聚类 [20] - [27]。

在基于混合模型的聚类研究中,参数估计是关键工作,通常有期望最大化(EM)和Markov Chain Monte Carlo (MCMC)两种算法。EM算法基于极大似然估计,利用迭代优化估计模型的参数;MCMC算法则基于Bayes估计,利用MCMC模拟,解决了时间序列数据的高维、高冗余、路径依赖等不适用于EM算法的问题。研究表明,MCMC算法能很好地解决高维数据计算复杂的难题,拟合效果优于EM算法 [12] [13] [28] [29] [30]。

本文基于有限混合MS-GARCH模型,利用Bayes理论的数据增补方法和MCMC模拟,探讨时间序列数据的聚类问题。文 [21] 利用有限混合GARCH模型对美国上市公司股票收益数据进行聚类,最终确定按波动率的高、中、低分为三类,但并没有考虑机制切换问题。就我们所知,未见文献把有限混合MS-GARCH模型用于时间序列数据的聚类分析。

2. 基于MS-GARCH模型的时间序列聚类

2.1. 基于有限混合模型的聚类

设数据集 { y 1 , y 2 , , y I } 是来自由K个成分构成的有限混合概率分布

f ( y | ρ , Θ ) = k = 1 K ρ k f ( y | Θ k ) (2.1)

的样本,其中 ρ = ( ρ 1 , ρ 2 , , ρ K ) 是混合权重, Θ = ( Θ 1 , Θ 2 , , Θ K ) 是成分参数, f ( y | Θ k ) 是第k个成分的概率分布,权重 ρ 满足:

0 ρ k 1 ( k = 1 , 2 , , K ) , k = 1 K ρ k = 1.

基于模型的聚类方法把混合模型的成分与聚类的簇相对应,成分数就是簇数。设 z i 代表数据 y i 的簇标记, z i = k 表示 y i 属于第k个簇。若模型的参数 ρ , Θ 已知,则由Bayes定理

{ z i = k | y i } = ρ k f ( y i | Θ k ) j = 1 K ρ j f ( y i | Θ j ) .

λ i = arg min k { 1 , 2 , , K } { z i = k | y i } ,

y i 归属于第 λ i 个簇。

2.2. MS-GARCH模型

{ y t = h t ε t , h t = ω s t + i = 1 p α i , s t y t i 2 + j = 1 q β j , s t h t j ,

为具有Markov状态切换的GARCH(p, q)模型,简记为MS-GARCH,其中 { s t } t 是状态空间为 { 1 , 2 , , S } 、转移概率矩阵为 η = ( η i j ) 的遍历Markov链, { ε t } 独立同分布,对任意 s = 1 , 2 , , S i = 1 , 2 , , p j = 1 , 2 , , q ,有 ω s > 0 α i , s 0 β j , s 0

2.3. 基于MS-GARCH模型的时间序列聚类

{ y i , t , i = 1 , 2 , , I ; t = 1 , 2 , , T } 是I个长度为T的时间序列组成的观察数据,记

y i = ( y i , 1 , y i , 2 , , y i , T ) , i = 1 , , I .

假设 { y 1 , y 2 , , y I } 来自有限混合概率分布(2.1), f ( y | Θ k ) 是第k个MS-GARCH(p, q)模型

{ y t = h t ε t , h t = ω s t k k + i = 1 p α i , s t k k y t i 2 + j = 1 q β j , s t k k h t j , (2.2)

的概率密度,其中 { s t k } t 是状态空间为 { 1 , 2 , , S } 、转移概率矩阵为 η k = ( η i j k ) 的遍历Markov链。

为叙述方便,下面只对两状态的MS-GARCH(1, 1)模型讨论,其它情况类似。此时,模型(2.2)的参数为 Θ k = ( θ k , η k ) ,其中

θ k = ( ω 1 k , ω 2 k , α 1 k , α 2 k , β 1 k , β 2 k ) , η k = ( η 11 k , η 12 k , η 21 k , η 22 k ) ,

j = 1 , 2 ,有

ω j k > 0 , α j k 0 , β j k 0 , η j 1 k 0 , η j 2 k 0 , α j k + β j k < 1 , η j 1 k + η j 2 k = 1.

ε t 服从标准正态分布时,联合概率密度

f ( y | Θ k ) = t = 1 T 1 2 π h t exp ( y t 2 2 h t ) , (2.3)

其中 h t 由(2.2)的第二式递推给出。

定义随机变量 z i { 1 , 2 , , K } i = 1 , 2 , , I ,其概率分布

{ z i = k | ρ } = ρ k .

z = ( z 1 , z 2 , , z I ) , S T k = ( s 1 k , s 2 k , , s T k ) , S t k = ( s 1 k , s 2 k , , s t 1 k , s t + 1 k , , s T k ) .

由于GARCH模型中条件方差存在路径依赖问题,参数估计的极大似然方法不再适用,我们利用MCMC方法对隐变量z和参数 ρ , Θ 进行Gibbs抽样。为此,需要计算 ( z , ρ , Θ ) 的后验分布。取先验分布 π ( z , ρ , Θ ) ,使得

π ( z , ρ , Θ ) = π ( z | ρ ) π ( ρ ) π ( Θ ) , (2.4)

其中

π ( z | ρ ) = i = 1 I ρ z i = k = 1 K ρ k x k , x k = # { z i = k , i = 1 , 2 , , I } , (2.5)

π ( Θ ) = k = 1 K π ( Θ k ) . (2.6)

利用Bayes定理,由(2.4)~(2.6)可得 ( z , ρ , Θ ) 的后验分布

p ( z , ρ , Θ | y ) f ( y | z , ρ , Θ ) π ( z , ρ , Θ ) = π ( ρ ) k = 1 K ρ k x k π ( Θ k ) i = 1 I f ( y i | Θ z i ) . (2.7)

下面依次讨论z、 ρ Θ 的抽样。

2.3.1. 簇标记z的抽样

由(2.7)可得z的后验分布

p ( z 1 , z 2 , , z I | ρ , Θ , y ) i = 1 I f ( y i | Θ z i ) ρ z i = i = 1 I p ( z i | ρ , Θ , y i ) . (2.8)

于是, z i | ρ , Θ , y i 服从多项分布,满足

P ( z i = k | ρ , Θ , y i ) f ( y i | Θ k ) ρ k , k = 1 , 2 , , K . (2.9)

2.3.2. 混合概率ρ的抽样

由(2.7)可得 ρ 的后验分布

p ( ρ | z , Θ , y ) = p ( ρ | z ) π ( ρ ) k = 1 K ρ k x k . (2.10)

π ( ρ ) 为Dirichlet分布 D ( a 1 , a 2 , , a K )

π ( ρ | a ) = k = 1 K Γ ( a k ) Γ ( k = 1 K a k ) k = 1 K ρ k a k 1 , a k > 0 , ρ i 0 , k = 1 K ρ k = 1 ,

则由(2.10)可知,后验分布 p ( z | ρ ) 为Dirichlet分布 D ( a 1 + x 1 , a 2 + x 2 , , a K + x K )

2.3.3. 簇参数Θ的抽样

由(2.6)和(2.7)可知, Θ 的后验分布

p ( Θ | z , ρ , y ) = p ( Θ | z , y ) = k = 1 K p ( Θ k | y ˜ k ) k = 1 K π ( Θ k ) i I k f ( y i | Θ k ) , (2.11)

其中 I k = { i | z i = k } y ˜ k = { y i | i I k } 。于是,对 Θ 的抽样可通过对每个 Θ k 分别独立抽样来实现。取先验分布 π ( Θ k ) ,使得

π ( Θ k ) = π ( θ k ) π ( η k ) .

下面依次讨论 S k η k θ k 的抽样。

1) 状态标记 S T k 的抽样

状态变量 s t k 是一个隐Markov过程,根据Markov链的性质, s t k 的概率需要考虑 s t 1 k s t + 1 k 的影响。由

p ( s t k | S t k , θ k , η k , y ˜ k ) = p ( s t k , S t k , θ k , η k , y ˜ k ) p ( S t k , θ k , η k , y ˜ k ) = p ( y ˜ k | S T k , θ k , η k ) p ( S T k , θ k , η k ) p ( y ˜ k | S t k , θ k , η k ) p ( S t k , θ k , η k ) = f ( y ˜ k | S T k , θ k , η k ) p ( S T k | S t k , θ k , η k ) f ( y ˜ k | S t k , θ k , η k ) ,

可知

( s t k = s | S t k , θ k , η k , y ˜ k ) η s t 1 , s k η s , s t + 1 k i I ( k ) τ = t T h i τ 0.5 exp ( y i τ 2 2 h i τ ) . (2.12)

由于 s t k 只有两个状态,由(2.12)可知对 s t k 的抽样相当于从一个Bernoulli分布中抽样。

2) 转移概率 η k 的抽样

给定 η k 的先验分布 π ( η k ) ,当 η k 独立于观察变量 y ˜ k 和参数 θ k 时, η k 的后验分布

p ( η k | S T k , θ k , y ˜ k ) = p ( η k | S T k ) π ( η k ) t = 1 T η s t 1 , s t k . (2.13)

π ( η k ) = π ( η 11 k , η 12 k ) π ( η 21 k , η 22 k ) ,当 π ( η 11 k , η 12 k ) π ( η 21 k , η 22 k ) 分别为Dirichlet分布 D ( b 1 , b 2 ) D ( c 1 , c 2 ) 时,由(2.13)可知后验分布 p ( η 11 k , η 12 k | S T k ) p ( η 21 k , η 22 k | S T k ) 分别为 D ( b 1 + n 11 , b 2 + n 12 ) D ( c 1 + n 21 , c 2 + n 22 ) ,其中 n g l 为从状态g转移到状态l的次数。

3) GARCH参数 θ k 的抽样

由于GARCH模型中当期条件方差受到前期条件方差影响的递推结构,各参数之间不独立,参数的后验分布没有合适的共轭先验,因此不能直接使用常规的Gibbs抽样。若取 θ k 的先验分布为常数,则 θ k 的后验分布

p ( θ k | S T k , η k , y ˜ k ) i I ( k ) t = 1 T h i t 0.5 exp ( y i t 2 2 h i t ) . (2.14)

利用griddy-Gibbs抽样方法 [12] [28],根据(2.14)可对 θ k 进行抽样。

3. 实证分析

本文选取美的集团、长安汽车、格力电器、海信家电、三全食品、比亚迪、东风汽车、宇通客车、上汽集团、江淮汽车、光明乳业、海尔智家、伊利股份、长城汽车、飞科电器、中信证券等23家上市公司2017年12月至2020年7月的所有日收益数据进行模拟实验(数据来源:网易财经数据库),以验证本算法的有效性。

3.1. 数据预处理

1) 由于上市公司的股权变更、违规调查等外部因素造成的停牌现象,使数据中存在少数NULL值。对此执行删除操作,不影响原序列的特征信息。

2) 实验中选取上市公司股票的对数收益率数据进行计算,以消除时间不连续等负面影响,

3) 本文的MS-GARCH模型只考虑条件方差的波动特征,取对数收益率后,将序列减去各自样本均值以消除模型中均值参数的影响,有助于简化迭代计算过程。

3.2. 数据概览

我们从中选取两家公司的收益率序列数据,画出它们的时序图,如图1所示。可以看出各个序列都有明显的波动聚集特征,即某些时间段有较稳定的波动,某些时间段有较剧烈的震荡。

Figure 1. Returns chart of logarithmic rate

图1. 对数收益率图

3.3. 模型选择

选用两状态的MS-GARCH(1,1)混合模型进行聚类分析。在聚类数的选择方面,参照文 [21] 的结论,我们把股票收益率数据按照波动率的高、中、低划分为三类,分别对应投资风险高、投资风险中等和投资风险低的三类股票。

3.4. 聚类结果

首先,我们计算得出了23条股票数据(包含均值、标准差等)的描述性统计,如表1所示。这些数据确实存在一定差异性。例如,全部数据的平均峰度为6.3084,但范围从3.6448到11.9634。

Table 1. Descriptive statistics

表1. 描述性统计

算法程序采用Matlab软件实现。抽样算法设定循环3000次,其中前1000次作为预烧阶段,保留后2000次作为抽样结果。

对于参数初始化,我们根据每条数据方差的差异性,对混合概率和簇类归属作了简单的初始化设置。其中,11家公司(美的集团、格力电器、上汽集团、三元股份、海尔智家、伊利股份、长江电力、中国平安、工商银行、中国石油、建设银行)归属第一类,8家公司(海信家电、三全食品、比亚迪、宇通客车、光明乳业、长城汽车、飞科电器、中信证券)归属第二类,4家公司(长安汽车、贝因美、东风汽车、江淮汽车)归属第三类。初始混合概率的设置如表2所示。

Table 2. Initial mixed probability of groups

表2. 初始混合概率

23条时间序列各自包含两个状态的参数,即共有46组不相同的参数。我们在程序中对这些模型参数分别设置了不同的初始值,同时它们又必须满足GARCH模型的平稳性条件。由于Gibbs抽样的收敛性质,只需要粗略估计其大致范围即可。除此之外,griddy-Gibbs计算中设置格点数为50 (格点的数量过大或过小都会对估计结果和运行时间产生负面影响)。最后,要注意计算过程中数值不能超过Matlab所允许的范围。对于GARCH参数初始化,我们以美的集团为例给出了详细情况,如表3所示。

Table 3. Initialization information of GARCH parameters

表3. GARCH参数初始化信息

通过计算,我们得到了该组数据两个状态的参数后验概率密度,抽样情况良好。根据Gibbs抽样原理,经过迭代后的抽样值会在真实值附近波动。美的集团的GARCH参数的后验概率密度图,如图2所示。

Figure 2. Posterior probability density plot of GARCH parameters

图2. GARCH参数后验概率密度图

由实验结果中状态转移概率后验均值与状态转移概率初始值的对比,可以看到股票处于低波动状态的持续性长于高波动状态,表示该股票大多数时间处于低幅度变动,不会频繁出现剧烈震荡。这类相对稳定的股票对于投资者来说风险偏低,若近期走势良好,值得投资。相反,若实验所得的后验概率中,高波动状态所占比重较高,那么说明股票长期处于数值较大的震荡,不利于进行投资,投资者需结合实际情况慎重分析。状态转移概率初始值与后验均值,如表4所示。

Table 4. Transition probability of states

表4. 状态转移概率

在最终实验结果中,根据混合概率后验均值的情况可以看出在我们提供数据的基础上,三个混合概率非常接近。其中,第二类混合后验概率与初始簇类混合概率相比变化极小,也就意味着我们对第二类的初始分类状况较好。而第一类和第三类经过迭代抽样后,都产生了不同程度的变化,如表5所示。

Table 5. Mixed probability

表5. 混合概率

根据GARCH参数可对三个簇进行解释。三类中持久性最高的为第一组(1状态 α 1 1 + β 1 1 估计为0.4217,2状态 α 2 1 + β 2 1 估计为0.4621),第一组与第三组的持久性更加接近(第三组1状态 α 1 3 + β 1 3 估计为0.4062,2状态 α 2 3 + β 2 3 估计为0.4320),即第一组代表持久性最高的股票类型,第二组代表持久性最低的股票类型,第三组代表持久性中等的股票类型。其中三组的滞后因子彼此相近(1状态为0.0273左右,2状态为0.2160左右),而差异最明显的地方则是条件方差的自回归参数(第一组两状态分别为0.3942和0.2462,第二组分别估计为0.2974和0.2375,第三组估计分别为0.3790和0.2148)。其次,三类的无条件方差具有一定差异,第一类与第二类相对接近(第一组两状态估计分别为3.05e−05和1.61e−03,第二组估计分别为1.75e−04和1.67e−03),第三类最小(第三类估计分别为4.61e−05和9e−04)。但由于数值较小,还不足以对各自模型的持久性产生决定性的影响。GARCH参数的后验均值结果,如表6所示。

Table 6. Posterior mean of GARCH parameters

表6. GARCH参数的后验均值

在23家上市公司股票数据聚类结果中,有5家公司属于第一组,9家公司属于第二组,9家公司属于第三组。与初始化值相比较,有9家公司在初始化中就被正确区分,其余14家公司经过迭代抽样产生了类别变化,说明我们基于Gibbs抽样的聚类算法有明显的纠正效果。除此之外,我们还展示了各股票数据各自模型参数 ω ^ α ^ β ^ 的后验均值,在取值上均满足GARCH模型的平稳性条件,如表7所示。

对于Gibbs抽样,先验分布的设定可能影响算法对于参数的估计、状态识别和聚类结果。在实验过程中,我们尝试修改各参数初始值,观察结果变化,发现初始值的改变并不会对最终结果产生太大影响,这与理论分析是一致的。

Table 7. Experimental results

表7. 实验结果

4. 结论

本文基于有限混合MS-GARCH模型,提出一种时间序列聚类方法。在新息服从标准正态分布的情况下,利用MCMC方法,给出了模型参数的估计,再通过计算后验概率得到聚类结果。最后,选取23家中国上市公司股票的收益率数据进行实证分析,验证了所提方法的有效性。本文的方法也可用于新息服从t-分布、广义误差分布等其它分布的情况。本文的聚类数目是根据经验和理论分析事先指定的,聚类数目未知的聚类问题将在未来的工作中讨论

文章引用

王 琳,丁孝全. 基于MS-GARCH模型的时间序列聚类
Time Series Clustering with MS-GARCH Mixtures[J]. 统计学与应用, 2021, 10(06): 1071-1082. https://doi.org/10.12677/SA.2021.106114

参考文献

  1. 1. Bollerslev, T. (1986) Generalized Autoregressive Conditional Heteroskedasticity. Journal of Econometrics, 31, 307-327.
    https://doi.org/10.1016/0304-4076(86)90063-1

  2. 2. Engle, R.F. (1982) Autoregressive Conditional Heteroskedasticity with Estimates of the Variance of U.K. Inflation. Econometrica, 50, 987-1008.
    https://doi.org/10.2307/1912773

  3. 3. Lamoureux, C.G. and Lastrapes, W.D. (1990) Persistence in Variance, Structural Change, and the GARCH Model. Journal of Business and Economic Statistics, 8, 225-234.
    https://doi.org/10.1080/07350015.1990.10509794

  4. 4. Cai, J.A. (1994) Markov Model of Switching-Regime ARCH. Journal of Business & Economic Statistics, 12, 309-316.
    https://doi.org/10.1080/07350015.1994.10524546

  5. 5. Hamilton, J.D. and Susmel, R. (1994) Autoregressive Conditional Heteroskedasticity and Changes in Regime. Journal of Econometrics, 64, 307-333.
    https://doi.org/10.1016/0304-4076(94)90067-1

  6. 6. Gray, S. (1996) Modeling the Conditional Distribution of Interest Rates as a Regime-Switching Process. Journal of Financial Economics, 42, 27-62.
    https://doi.org/10.1016/0304-405X(96)00875-6

  7. 7. Klaassen, F. (2002) Improving GARCH Volatility Forecasts with Regime-Switching GARCH. Empirical Economics, 27, 363-394.
    https://doi.org/10.1007/s001810100100

  8. 8. Marcucci, J. (2005) Forecasting Stock Market Volatility with Regime-Switching GARCH Models. Studies in Nonlinear Dynamics and Econometrics, 9, 1145.
    https://doi.org/10.2202/1558-3708.1145

  9. 9. Haas, M., Mittnik S. and Paolella, M.S. (2004) A New Approach to Markov-Switching GARCH Models. Journal of Financial Econometrics, 2, 493-530.
    https://doi.org/10.1093/jjfinec/nbh020

  10. 10. Ané, T. and Ureche-Rangau, L. (2006) Stock Market Dynamics in a Regime-Switching Asymmetric Power GARCH Model. International Review of Financial Analysis, 15, 109-129.
    https://doi.org/10.1016/j.irfa.2005.08.002

  11. 11. Abramson, A. and Cohen, I. (2007) On the Stationarity of Markov-Switching GARCH Processes. Econometric Theory, 23, 485-500.
    https://doi.org/10.1017/S0266466607070211

  12. 12. Bauwens, L., Preminger, A. and Rombouts, J.V.K. (2010) Theory and Inference for a Markov Switching GARCH Model. Econometrics Journal, 13, 218-244.
    https://doi.org/10.1111/j.1368-423X.2009.00307.x

  13. 13. Henneke, J.S., Rachev, S.T., Fabozzi, F.J. and Nikolov, M. (2011) MCMC-Based Estimation of Markov Switching ARMA-GARCH Models. Applied Economics, 43, 259-271.
    https://doi.org/10.1080/00036840802552379

  14. 14. Liao, T.W. (2005) Clustering of Time Series Data—A Survey. Pattern Recognition, 38, 1857-1874.
    https://doi.org/10.1016/j.patcog.2005.01.025

  15. 15. Aghabozorgi, S., Shirkhorshidi, A.S. and Wah, T.Y. (2015) Time-Series Clustering—A Decade Review. Information Systems, 53, 16-38.
    https://doi.org/10.1016/j.is.2015.04.007

  16. 16. Maharaj, E.A., D’Urso, P. and Caiado, J. (2019) Time Series Clustering and Classification. CRC Press, New York.
    https://doi.org/10.1201/9780429058264

  17. 17. Fraley, C. and Raftery, A.E. (2002) Model-Based Clustering, Discriminant Analysis, and Density Estimation. Journal of the American Statistical Association, 97, 611-631.
    https://doi.org/10.1198/016214502760047131

  18. 18. McLachlan, G.J., Lee, S.X. and Rathnayake, S.I. (2019) Finite Mixture Models. Annual Review of Statistics and Its Application, 6, 355-378.
    https://doi.org/10.1146/annurev-statistics-031017-100325

  19. 19. Bouveyron, C., Celeux, G., Murphy, T.B. and Raftery, A.E. (2019) Model-Based Clustering and Classification for Data Science: with Applications in R. Cambridge University Press, New York.
    https://doi.org/10.1017/9781108644181

  20. 20. Xiong, Y. and Yeung, D.Y. (2004) Time Series Clustering with ARMA Mixtures. Pattern Recognition, 37, 1675-1689.
    https://doi.org/10.1016/j.patcog.2003.12.018

  21. 21. Bauwens, L. and Rombouts, J.V.K. (2007) Bayesian Clustering of Many GARCH Models. Econometric Reviews, 26, 365-386.
    https://doi.org/10.1080/07474930701220576

  22. 22. Fröhwirth-Schnatter, S. and Kaufmann, S. (2008) Model-Based Clustering of Multiple Time Series. Journal of Business & Economic Statistics, 26, 78-89.
    https://doi.org/10.1198/073500107000000106

  23. 23. Samé, A., Chamroukhi, F., Govaert, G. and Aknin, P. (2011) Model-Based Clustering and Segmentation of Time Series with Changes in Regime. Advances in Data Analysis & Classification, 5, 301-321.
    https://doi.org/10.1007/s11634-011-0096-5

  24. 24. Frühwirth-Schnatter, S. (2011) Panel Data Analysis: A Survey on Model-Based Clustering of Time Series. Advances in Data Analysis and Classification, 5, 251-280.
    https://doi.org/10.1007/s11634-011-0100-0

  25. 25. Kini, B.V. and Sekhar, C.C. (2013) Bayesian Mixture of AR Models for Time Series Clustering. Pattern Analysis and Applications, 16, 179-200.
    https://doi.org/10.1007/s10044-011-0247-5

  26. 26. Costilla, R., Liu, I., Arnold, R. and Fernández, D. (2019) Bayesian Model-Based Clustering for Longitudinal Ordinal Data. Computational Statistics, 34, 1015-1038.
    https://doi.org/10.1007/s00180-019-00872-4

  27. 27. Wang, Y. and Tsay, R.S. (2019) Clustering Multiple Time Series with Structural Breaks. Journal of Time Series Analysis, 40, 182-202.
    https://doi.org/10.1111/jtsa.12434

  28. 28. Bauwens, L. and Lubrano, M. (1998) Bayesian Inference on GARCH Models Using the Gibbs Sampler. The Econometrics Journal, 1, 23-46.
    https://doi.org/10.1111/1368-423X.11003

  29. 29. Aielli, G.P. and Caporin, M. (2013) Fast Clustering of GARCH Processes via Gaussian Mixture Models. Mathematics and Computers in Simulation, 94, 205-222.
    https://doi.org/10.1016/j.matcom.2012.09.015

  30. 30. Sampietro, S. (2010) Bayesian Analysis of Mixture of Autoregressive Components with an Application to Financial Market Volatility. Applied Stochastic Models in Business & Industry, 22, 225-242.
    https://doi.org/10.1002/asmb.613

  31. NOTES

    *通讯作者。

期刊菜单