Statistics and Application
Vol. 08  No. 04 ( 2019 ), Article ID: 31882 , 8 pages
10.12677/SA.2019.84079

Forecast of Overseas Students Based on Grey Prediction and Improvement Model

Tianhao Jin, Shaoling Ding

College of Science, Guilin University of Technology, Guilin Guangxi

Received: Aug. 6th, 2019; accepted: Aug. 16th, 2019; published: Aug. 26th, 2019

ABSTRACT

By comparing and analyzing the grey forecasting model with the improved grey forecasting model based on moving average, this paper establishes a fitting and forecasting model for the number of overseas students and returnees in China. The results show that the grey prediction model smoothed by moving average method is better than the grey prediction method alone in this empirical analysis. The new method improves the fitting accuracy, facilitates relevant state institutions to obtain the trend of studying abroad and the number of returnees, and gives priority to formulating relevant policies.

Keywords:Grey Prediction, Moving Average Method, The Number of Students Studying Abroad, The Number of Returned Students Studying Abroad

基于灰色预测及改进模型的留学人员预测

金天昊,丁少玲

桂林理工大学理学院,广西 桂林

收稿日期:2019年8月6日;录用日期:2019年8月16日;发布日期:2019年8月26日

摘 要

本文通过对灰色预测模型与使用移动平均改进后的灰色预测模型进行比较和分析,建立了我国出国留学人数以及学成归国人数的拟合及预测模型。结果表明,在本实证分析中,使用移动平均法修匀的灰色预测模型预测效果优于单独使用灰色预测法。新方法提高拟合精度,便于国家有关机构获取出国留学以及归国人数的趋势,优先制定相关政策。

关键词 :灰色预测,移动平均法,出国留学人数,学成归国留学人员

Copyright © 2019 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

1. 引言

随着近些年留学热潮的持续升温,留学现象以及留学归国情况也成为引起学术界关注的经济社会现象之一。而对于未来我国出国留学人数以及留学归国人员走向的准确预测,毫无疑问,对把握人才流动趋势、经济科技趋势,推动教育、经济改革,政府因地制宜的制定相关教育政策等起到重要作用。

当前CNKI收录文献涉及留学研究的文章对于留学生人员的预测方面研究较少,现有论著包括使用时间序列 [1] 或利用灰色预测法及其改进模型 [2] 预测我国出国留学人数。针对灰色预测模型及其改进形式,陈有为使用指数平滑模型改进离散GM (1, 1)模型,但并未利用到留学数据中 [3] ,柯普使用GM (1, 1)对出国人数进行预测 [4] 。2010年卫彦琼 [5] 使用灰色神经网络模型对1999年到2006年我国出国留学生总人数以及留学生学成归来人数进行了实证分析。但笔者在对比作者使用此模型进行预测2007年至2011年的数据与国家统计局已经发布的真实数据来看,偏差较大。因此,使用灰色预测模型针对留学数据进行预测已有先例但预测效果还有改进空间。

2. 方法介绍

2.1. 灰色预测及GM (1, 1)模型基本概念与具体方法

本文将灰色预测理论、指数平滑和移动平均法以及改进后的灰色预测模型应用于我国留学生规模以及学成归来学生人数预测,为我国留学生规模预测提供有效的模型,从而为政府相关决策提供数据支持。

灰色理论是由我国学者邓聚龙于20世纪80年代前期提出,用于控制和预测的新理论和新技术。灰色预测法是一种对含有不确定因素的系统进行预测的方法。灰色系统内的一部分信息是已知的,另一部分信息是未知的。其中,灰色预测GM (1, 1)模型因其所需信息少、运算方便、建模精度较高而被广泛应用于各种预测领域。其理论已初步形成了较为完善的模型、方法和技术体系,基于灰色建模理论的灰色数列预测方法经过20多年的发展,已经在人口规模、交通事故、农业、社会经济、旅游、生态足迹等方面得到了广泛的应用 [6] ,且均获得较为理想的预测结果。

灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联度分析,并对原始数据进行累加和累减的处理来寻找系统变动的规律。首先生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来的发展趋势状况。

首先得到生成列,为弱化原始时间序列的随机性,需要进行数据处理即产生生成列,本文叙述累加法生成(累加即将原始序列通过依次叠加得到生成列)。记原始时间序列为:

X ( 0 ) = { X ( 0 ) ( 1 ) , X ( 0 ) ( 2 ) , X ( 0 ) ( 3 ) , X ( 0 ) ( 4 ) , , X ( 0 ) ( n ) } (1)

上标为0表示原始时间序列,通过累加构造生成列为:

X ( 1 ) = { X ( 1 ) ( 1 ) , X ( 1 ) ( 2 ) , X ( 1 ) ( 3 ) , X ( 1 ) ( 4 ) , , X ( 1 ) ( n ) } (2)

对于非负数据。累加次数越多,则随机性弱化越多,当累加次数足够大后,可认为时间序列已由随机序列变为非随机序列了。一般随机序列的多次累加序列,大多可用指数曲线逼近。

之后需要计算关联度。关联度分析是分析系统中各因素关联程度的方法,在计算关联度之前需要先计算关联系数。关联系数公式为:

η ( k ) = min min | X ^ ( 0 ) ( k ) X ( 0 ) ( k ) | + ρ max max | X ^ ( 0 ) ( k ) X ( 0 ) ( k ) | | X ^ ( 0 ) ( k ) X ( 0 ) ( k ) | + ρ max max | X ^ ( 0 ) ( k ) X ( 0 ) ( k ) | (3)

式中具体含义此处不予赘述。

在算出 X ^ ( 0 ) ( k ) 序列与 X ( 0 ) ( k ) 序列的关联系数后,计算各类关联系数的平均值:

r = 1 n k = 1 n η ( k ) (4)

这个平均值r被称为关联度。为建立GM (1, 1)模型,设时间序列有n个观察值,通过累加得到序列,则相应的GM (1, 1)模型的微分方程为

d X ( 1 ) d t + a X ( 1 ) = μ (5)

式中,a称为发展灰数 μ 称为内生控制灰数,设 a ^ 为待估计参数向量,其中 a ^ = ( a μ ) ,利用最小二乘

法求解得:

a ^ = ( B T B ) 1 B T Y n (6)

解出微分方程,得到预测模型

X ^ ( 1 ) ( k + 1 ) = [ X ^ ( 0 ) ( 1 ) μ a ] e a k + μ a ( k = 0 , 1 , 2 , , n ) (7)

2.2. 移动平均模型

移动平均是技术分析中一种分析时间序列数据的工具,其基本思想是:根据时间序列资料、逐项推移,依次计算包含一定项数的序时平均值,以反映长期趋势。因此移动平均可抚平短期波动,反映长期趋势或周期。移动平均法可分为简单移动平均、加权移动平均、指数移动平均等。本文以简单移动平均为例展开。简单移动平均是某变数k个数值的未作加权算术平均。这种方法是根据过去k期的观察值来计算平均数的,以之作为测算数据进行决策 [7] 。

若使用移动平均法,照其定义t + 1期的预测值为

F t + 1 = Y ¯ t = Y t k + 1 + Y t k + 2 + + Y t 1 + Y t k (8)

式中Y为观测值,k为观测期数。这种方法的优点是计算简单,缺点是适用范围具有局限性,一般只适用于观测值发展比较平稳、起伏不大的数据。对于下文实证分析部分数据来说,留学生数量与留学生归国数量均是递增的序列。使用移动平均法得出后一项的预测值是前k项观测值的算术平均值,导致预测值偏小,受到该方法适用范围的局限,因此不能对本文实证分析的原始数据直接使用移动平均法。

2.3. 组合模型的构建

随着灰色预测理论研究的进一步深入,一些学者发现灰色预测存在一些局限。陈有孝,林晓言指出灰色模型预测由于其原始数据的起伏性和无序性,且原始数据的个数有限,难以将预测带限制在一个较小的范围之内,导致灰色预测模型在大多数情况之下是粗糙的 [8] 。

具体来说,灰色系统模型的一大优点在于不要求通过足够的数据建立模型,然而对于某些具有递增(或递减)趋势的数据,由于数据量有限,灰色系统模型偏向于过分提取其递增趋势,从而高估预测结果。因此笔者尝试利用移动平均的移动平均可削弱原序列的上下波动的特点从而对灰色预测数据进行修匀或平滑,抑制其较高的递增趋势,得到准确的预测值。本文尝试使用两种方式进行组合模型的构建。首先使用原移动平均公式的结合灰色预测模型。具体做法为将灰色预测得到的数据使用移动平均法修匀。

结合灰色模型公式与移动平滑公式得到如下:

F t + 1 = Y ¯ t = Y t k + 1 + Y t k + 2 + + Y t 1 + Y t k = X ^ ( 1 ) ( t k + 1 ) + X ^ ( 1 ) ( t k + 2 ) + + X ^ ( 1 ) ( t 1 ) + X ^ ( 1 ) ( t ) k (9)

值得注意的是,若使用移动平均的原始公式与灰色预测结合,在多次测算后发现,移动平均在改进数据的同时会带有滞后特点,过分的削弱趋势性。因此为避免移动平均只是在处理水平型历史数据时才有效的特点,可将移动平均模型进行修改再与灰色预测模型组合,即将灰色预测得到的数据使用改进后的移动平均法修匀:

F t + 1 = Y ¯ t + 1 = Y t k + 2 + Y t k + 3 + + Y t + Y t + 1 k = X ^ ( 1 ) ( t k + 2 ) + X ^ ( 1 ) ( t k + 3 ) + + X ^ ( 1 ) ( t ) + X ^ ( 1 ) ( t + 1 ) k (10)

其中 X ^ ( 1 ) 为灰色预测模型得出的结果。

对比两种组合模型,并通过数据进行实验分析,发现相比于改进后的组合模型,未改进的移动平均与灰色预测的组合模型对于灰色预测数据的递增趋势的抑制作用更加强烈,因此针对递增趋势强、弱的不同数据情况,可分别使用未改进的组合模型和改进后的组合模型。此外还可以通过调整观测系数k对不同数据进行适当的修匀。

3. 实证分析

本文通过对灰色预测模型与使用移动平均改进后的灰色预测模型进行比较和分析,利用国家统计局自2006年至2018年的我国留学生相关数据,分别对出国留学生总人数以及留学生学成归来人数进行拟合分析,并对2018至2024年的留学人数及学成归来人数进行预测。

3.1. 灰色预测模型及其问题

首先分析留学生样本,数据呈单调递增的变化趋势所选样本数据列适合GM (1, 1)建模。根据GM (1, 1)建模原理,运用RStudio软件计算,得到发展系数a = 0.1161707、灰色作用量u = 15.27659,灰色预测模型的拟合情况如表1所示。

表1,GM (1, 1)模型的预测误差较小,软件运算得到从2005年到2018年预测值的平均误差11.39092%。根据预测结果,进行模型检验:后验差检验结果为p = 1,C值 = 0.09690246,预测模型预测精度好,可以进行后续预测。2019~2024的预测留学生数量如表2所示。

Table 1. The forecast table of the number of overseas students based on the grey prediction model GM (1, 1)

表1. 出国留学生人数基于灰色预测模型GM (1, 1)的预测表

Table 2. The forecast table of the number of overseas students and returned students based on the grey prediction model GM (1, 1)

表2. 出国留学生以及归国留学生数基于灰色预测模型GM (1, 1)的预测表

由于数据同样呈单调递增的变化趋势因此使用相同的方法可以分析留学生学成归国人数。根据GM (1, 1)建模原理,计算得出发展系数a = 0.1561495、灰色作用量u = 8.706992 (拟合表略)。

使用软件得到从2005年到2018年预测值的平均误差为44.93455%、相对精度 = 88.60908%,效果较差。根据结果,进行模型检验显示,后验差检验结果为p = 1,C值 = 0.09690246,预测模型预测精度好。继续预测得出2019~2024的预计归国留学生数量如上表所示(表2)。

对于本实证分析来说,灰色预测存在的问题较为明显。在数据拟合时可以发现,不管对于留学生数据还是对于留学归国人数的拟合,2016年之后的预测值均较实际值偏大,残差为负值,且残差绝对值逐渐递增,说明此灰色模型预测值呈现出过分的递增趋势。而且这种趋势可能将扩大,在折线图(图1)中也能明显看出拟合值的指数趋势。

Figure 1. Gray prediction of the number of overseas students and returnees

图1. 留学生人数及归国人数灰色预测效果图

此外,学成归国的留学生的灰色预测值在2021年之后超过了预测留学生人数(如图1),这在现实中很难得到解释。经过分析,此现象的原因是很可能是预测归国人数时递增趋势经灰色模型过度放大导致超出留学人员的预测值。因此综合本文的预测结果分析,本数据灰色预测数据指数性过强,预测效果一般。需要其他方法对此进行改进。

3.2. 移动平均法与灰色预测组合方法

联想到移动平均对序列有修匀或平滑的作用,使得原序列的上下波动被削弱了,并结合本例的特点,在灰色预测拟合结果大大超出了实际值,预测值呈现较强的指数趋势情况下,尝试使用移动平均法修匀灰色预测结果,对两组数据使用改进后的移动平均法(两期),进行修匀并计算相应MSE,与灰色预测模型拟合值进行比较得到如下表格(表3)。

表3可知对于留学生人数的预测来说,虽然MSE略有上升,但上升的范围很小,且最近几期的(2016年~2018年)的拟合值明显优于单独使用灰色预测的拟合值,说明过分的指数趋势被平滑和修正,且效果较好,对于未来几期的预测效果优于使用单一的灰色预测。对留学归国人数的拟合,同样的,表中信息表明2016年-2018年的拟合值更好,避免了不合理的过分上升趋势。而且MSE得到了下降,说明使用本方法的效果很好,经过修改的移动平均的对本文两组数据的拟合效果皆有提升。

此外,大量试验发现,单独对于留学归国人员数据而言,使用未修改的移动平均公式结合灰色预测的效果会让MSE大幅减小(MSE = 5.4135625)。但若使用此方法拟合留学人数会让对应的MSE大大增加(MSE = 46.913)。猜想这样的现象发生的是由于回国留学生的数据变化较为剧烈,灰色预测的预测指数性过强,上升趋势极其明显,需要使用未改进后的移动平均才能更有效的抑制其过分的趋势性,而留学生数据灰色预测值的指数性相对较弱,若使用原始的移动平均,会将趋势性过分抑制,预测效果下降。

3.3. 预测结果

本文对出国留学生总人数,留学生学成归来人数做出预测,分别使用修改的移动平均和未修改的移动平均修匀灰色预测得到如下预测值,整合为表4图2

列表数据可以看出对上述两组数据来说,移动平均都有修匀作用,使强烈的递增趋势得到控制(见图2),这符合当前实际情况——留学生多年的快速增加使留学市场接近饱和状态。且改进后的预测留学归国人数小于改进后的预测留学生数量,这也是合理的,因此判断预测效果得到改进。

Table 3. Grey moving average method for fitting table of the number of overseas students and returnees

表3. 灰色移动平均法对留学生及归国人数拟合表

Table 4. Grey moving average method for forecasting the number of overseas students and returnees

表4. 灰色移动平均法对留学生及归国人数预测表

Figure 2. Grey moving average method for forecasting the number of overseas students and returnees

图2. 灰色移动平均法对留学生及归国人数预测条形图

4. 结论

本文通过对灰色预测模型与使用移动平均改进后的灰色预测模型进行比较和分析,利用从2006年至2018年的我国留学生相关数据,分别对出国留学生总人数以及留学生学成归来人数进行拟合分析,并对2018至2024年的留学人数及学成归来人数进行预测。

首先使用灰色预测法,发现对本例的数据来看预测拟合效果一般。对于实际情况来说,预测数据有较强的上升趋势,而且预测值增速过快,其中某些结果不符合实际意义。因此,利用此预测模型进行预测,要持谨慎态度,并需要对其方法进行改进。

将移动平均(二期)进行修改并与灰色预测模型结合起来,发现对本文两组数据都有较好的修匀作用。对比发现,修改后的移动平均对留学生数据有更好的效果,未修改的移动平均对留学生归国数据有更好的效果。最终完成预测(表4),结果符合实际情况,且效果优于单独使用灰色预测法。

致谢

感谢审稿人提出的建议。

基金项目

桂林理工大学2019年本科教学建设项目与改革(jxzh201926)。

文章引用

金天昊,丁少玲. 基于灰色预测及改进模型的留学人员预测
Forecast of Overseas Students Based on Grey Prediction and Improvement Model[J]. 统计学与应用, 2019, 08(04): 696-703. https://doi.org/10.12677/SA.2019.84079

参考文献

  1. 1. 杨彩华, 段玲晓. 我国出国留学人数的预测——基于时间序列预测法[J]. 科技经济市场, 2016(1): 119-121.

  2. 2. 林春艳. 一种新的灰色预测模型及其在留学管理中的应用[C]//中国管理科学学术会议, 2001.

  3. 3. 陈有为. 基于离散GM模型和指数平滑模型组合的统计预测方法[J]. 统计与决策, 2015(10): 74-76.

  4. 4. 柯普, 吴广. 基于GM(1.1)模型的出国留学人数预测研究[J]. 价值工程, 2012, 31(25): 318-319.

  5. 5. 卫彦琼. 基于灰色神经网络模型的留学生和学成归国人员预测[J]. 商业经济, 2010(4): 4-6.

  6. 6. 赵琳琳. 灰色马氏链预测方法及其在水文序列中的应用研究[D]: [硕士学位论文]. 南京: 河海大学, 2007.

  7. 7. 李云刚. 基于移动平均法的改进[J]. 统计与决策, 2009(19): 158-159.

  8. 8. 陈有孝, 林晓言. 灰色-马尔可夫链改进的预测方法[J]. 统计与决策, 2005(8): 36-38.

期刊菜单