Statistics and Application
Vol. 09  No. 06 ( 2020 ), Article ID: 39627 , 8 pages
10.12677/SA.2020.96109

基于主成分分析对新零售销售量灰色预测 GM(1,1)模型

沈乔羽,卫俊峰,冯爱芬

河南科技大学数学与统计学院,河南 洛阳

收稿日期:2020年11月27日;录用日期:2020年12月22日;发布日期:2020年12月31日

摘要

基于预先处理得到的前九个月销售量数据性质离散∞,通过建立灰色预测GM(1,1)模型,预测后三个月的销售量并进行误差分析。再结合主成分分析,通过降维来更好地突出模型的优点,提出主成分回归–灰色预测模型,减少了回归分析所需要考虑的变量个数,并使预测结果具有较好的准确性,具有较好应用前景。本文结合主成分分析、灰色预测的优点,通过降维将粗糙但相关性高的成分组合,预测销售量,给出进货建议。

关键词

灰色预测,主成分分析,回归预测

GM(1,1) Model for Grey Prediction of New Retail Sales Based on Principal Component Analysis

Qiaoyu Shen, Junfeng Wei, Aifen Feng

Mathematics and Applied Mathematics, Henan University of Science and Technology, Luoyang Henan

Received: Nov. 27th, 2020; accepted: Dec. 22nd, 2020; published: Dec. 31st, 2020

ABSTRACT

Based on the discretization of the first nine months sales data obtained by pre-processing, the grey forecast GM(1,1) model is established to predict the sales volume in the last three months and to carry out error analysis. Combined with principal component analysis, the advantages of the model are better highlighted by dimensionality reduction, and the principal component regression-gray prediction model is proposed to reduce the number of variables to be considered in regression analysis, and to make the prediction results more accurate. It has a good application prospect. This paper combines the advantages of principal component analysis and grey prediction to predict sales volume and give purchase suggestions by reducing dimension to combine rough but highly correlated components.

Keywords:Grey Prediction, Principal Component Analysis, Regression Prediction

Copyright © 2020 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

随着我国经济发展,消费市场的逐步发展,市场上的消费模式不断变化,逐渐由“以物为主”转变成“以客为主”的销售模式 [1]。消费者的需求日趋多样化、个性化,对应的市场供应也需调整。在此类销售模式和这类特殊需求的推动下,新零售企业的生产模式逐步向多品种、小批量迈进,这让商场内零售店铺里的饰品和玩具等种类变得更加琳琅满目,然而需求小众,单品的购买量小 [2]。要求门店种类繁多,数量少。本文要解决的具体问题是以种类为层级给出按月精准需求预测,并给出商场进货建议。

2. 数据来源

本文用到的数据来自某大型商贸平台给定区域内2018~2019年不同销售小类的产品销售信息,本文预测给定区域内目标小类在2019年10月1日后3个月中每个月的销售量,与实际比较后,给出每个月预测值的平均绝对百分比误差(MAPE)。其中,目标小类为历史销售时间处于2019年6月1日至2019年10月1日内且累计销售额排名前10的小类。本文最后给出了部分数据样表。

3. 主成分分析回归模型的建立

3.1. 研究方法

主成分分析在物质科学领域对复杂现象的研究,这是通过将粗糙但相关性高的成分组合,并挑选其中贡献率大的指标来研究现实问题,得以更清晰看待问题。这里用来研究影响目标小类的销售量的因素,合适性比较好 [3]。

由于影响目标小类销售的因素很多,各因素之间具有一定的相关性,进行回归预测之前需要采用主成分分析法选取贡献率高的主成分,构造出与主成分之间的回归预测模型 [4]。

1. 首先样本自变量矩阵进行标准化处理:

按列计算均值 x ˜ j = 1 n i = 1 n X i j 和标准差 S j = i = 1 n ( X i j X ¯ j ) 2

标准化数据 X i j = ( X i j X ¯ j ) 2 S j

2. 计算R的特征值和特征向量

3. 计算主成分贡献率以及累计贡献率

本文通过matlab求解矩阵得到主成分分析,结果如表1所示。

Table 1. Summary of principal component analysis results

表1. 主成分分析结果汇总表

利用结果分析,前三个主成分分析已经达到99.8%,包含了大部分信息部分,所以我们取前三个作为指标。

F 1 = 0.7020 X 1 + 0.0295 X 2 0.7085 X 3 0.0570 X 4 + 0.0315 X 5 , F 2 = 0.0350 X 1 0.6352 X 2 0.0591 X 3 + 0.5292 X 4 0.5584 X 5 , F 3 = 0.3245 X 1 0.1890 X 2 0.2910 X 3 + 0.7400 X 4 0.4761 X 5

对三主成分解释:

F 1 X 1 有着高度的正载荷,对 X 3 高度的负载荷,可以解释为库存与价格平衡度。

F 2 X 2 X 5 有着高度的负载荷,对 X 4 有高度的正载荷,可以解释为折扣敏感度。

F 3 X 4 有着中等的正载荷对 X 4 高度的负载荷,可以解释为销售价波动感知。

3.2. 基于主成分分析的回归模型建立

通过以上分析和计算,我们用3个新变量来替代5个可量化变量 [5]。这两个新变量相互独立,且充分反映了原来5个影响因素包含的信息。这3个主成分体现了之前5个可量化指标99.8%的信息,提取效果较好。

接下来我们用得出的三个新变量用最小二乘法来建立回归模型 [6]。将F使用主成分得到主成分指标,并将因变量销量y标准化,整理得到主成分自变量分析表,如表2所示。

Table 2. Analysis table of independent variables

表2. 自变量分析表

R检验所得到的 R 2 = 0.9801 ,而R2越接近于1,则说明模型的拟合程度越好,因此本模型的拟合是比较好的。利用F检验判断回归方程显著性的时候,则关注目标小类的回归预测方程:

y 1 = 0.01442 + 0.019679 Z 1 + 0.0008919 Z 2 + 0.00993 Z 3

本文通过Excel对2019年目标小类10月到12月的三个月销量的预测(表3~表5)。

Table 3. October 2019 forecast table

表3. 2019年10月份预测表

Table 4. November 2019 forecast table

表4. 2019年11月份预测表

Table 5. Sales volume in December 2019

表5. 2019年12月份销售量

由此可见,主成分回归预测中,百分比误差不稳定,甚至个别达到了百分之八十,于是接下来我们在主成分回归的基础上建立灰色预测模型。

4. 灰色预测GM(1,1)模型的建立

4.1. 研究思路方法

灰色预测模型是一种灰色系统理论提出了一种新的分析方法即关联度分析方法 [7],即根据因素之间发展态势的相似或相异程度来衡量因素间关联的程度,它揭示了事物动态关联的特征与程度 [8]。目标小类商品销售信息如表6

Table 6. Sales information of target small categories of goods

表6. 目标小类商品销售信息

1. 为了保证建模方法的可行性,需要对已知数据进行必要的检验处理,

设参数数据为: x ( 0 ) = ( x ( 0 ) ( 1 ) , x ( 0 ) ( 2 ) , , x ( 0 ) ( n ) )

计算数列的级比 λ ( k ) = x ( 0 ) ( k 1 ) x ( 0 ) ( k ) , k = 2 , 3 , , n

按照GM (1,1)模型可以得到预测值:

x ^ ( 1 ) ( k + 1 ) = ( x ( 0 ) ( 1 ) b a ) e a k + b a , k = 1 , 2 , , n 1

x ^ ( 0 ) ( k + 1 ) = x ^ ( 1 ) ( k + 1 ) x ^ ( 1 ) ( k ) , k = 1 , 2 , , n 1

2. 检验预测值

(1) 残差检验:

令残差,计算 ε ( k ) = x ( 0 ) ( k ) x ^ ( 1 ) ( k + 1 ) x ( 0 ) ( k ) , k = 1 , 2 , , n

如果残差 < 0.2,则可以认为达到一般要求,如果则认为达到比较高的要求。

(2) 级比偏差检验:

首先由参考数据计算出级比偏差,再用发展系数a求出相应的级比偏差。

p ( k ) = 1 ( 1 0.5 a 1 + 0.5 a ) λ ( k )

如果 p ( k ) < 0.2 ,则可认为达到一般要求;如果 p ( k ) < 0.1 ,则认为达到较高的要求

4.2. 灰色预测模型求解

选取连续标签号27092025作为例子,对齐1~9月份的值进行建立灰色预测模型,如表7所示,用matlab计算解出10~12月份的预测值,并与其实际值比较 [7],得出MAPE。

2019年10到12月的销售量预测值分别为110337,103520,106440,如表8所示。

销量的预测以及误差分析如表9

Table 7. Small label sales for the first 9 months

表7. 小标签前九个月销售量

Table 8. Predicted values of small labels from October to December 2019

表8. 小标签2019年10月到12月所求预测值

Table 9. Sales forecast and error analysis

表9. 销量的预测以及误差分析

回归曲线: y = 4234999.0 4068944.0 exp ( 0.0335519 t )

分析依然可以得知,除了个别值有较大的偏差,其余值都在误差10%以内,说明灰色预测模型较好的符合本模型,个别值可能考虑是特殊因素或者季节因素,为了验证对于2019年缺失1~9月份的数据的类似离散值进行灰色预测的可行性,我们取值第一组的27050401的数值进行验证,数据如表10~11:

Table 10. Monthly sales in 2018

表10. 2018年各月销售量

Table 11. Sales forecast for October-December 2019

表11. 2019年10~12月份预测销售量

Table 12. Error analysis of 2019 sales volume

表12. 2019年销售量误差分析

回归方程 y = 1.11569 e 8 1.09729 e 8 exp ( 0.0209087 t )

表12可以看出,灰色预测的其误差值均在8%左右,拟合程度较好。

5. 结果分析

发现经过主成分分析回归预测,和灰色预测GM(1,1)模型比较,发现基于主成分分析的回归预测后的灰色预测能够校正主成分分析中的个别偏大误差,得出的模型结合两种模型的优点可以用于预测销售量,在进货上根据预测值进货、备货。

基金项目

河南省高校省级大学生创新创业训练计划项目(S202010464052),河南科技大学SRTP项目(2020169) 2019年河南省高等教育教学改革研究与实践项目(2019SJGLX262),河南科技大学教育教学改革研究与实践项目(2019YBZD-009)。

文章引用

沈乔羽,卫俊峰,冯爱芬. 基于主成分分析对新零售销售量灰色预测GM(1,1)模型
GM(1,1) Model for Grey Prediction of New Retail Sales Based on Principal Component Analysis[J]. 统计学与应用, 2020, 09(06): 1040-1047. https://doi.org/10.12677/SA.2020.96109

参考文献

  1. 1. 滕树军, 郑惠文, 刘柏森. 基于多元回归分析的超市商品销售影响因素的研究[J]. 全国流通经济, 2018(14): 6-9.

  2. 2. 黄晓梅. 一元线性回归分析法在超市产品销售中的应用[J]. 科技信息, 2013(11): 77-78.

  3. 3. Lu, Q., Liu, S.L., Li, W. and Jin, X.J. (2020) Combination of Thermodynamic Knowledge and Multilayer Feed forward Neural Networks for Accurate Prediction of MS Temperature in Steels. Materials & Design, 192, 108696.
    https://doi.org/10.1016/j.matdes.2020.108696

  4. 4. 孟昌, 庞燕岭. 北京市出租车需求量测算与数量规制——基于课题组调查问卷和官方数据的测算[J]. 北京社会科学, 2020(5): 4-16.

  5. 5. Deng, B., Luo, X., Zhang, M., Ye, L. and Chen, Y. (2020) Corrigendum to “Quantitative Detection of Acyclovir by Surface Enhanced Raman Spectroscopy Using a Portable Raman Spectrometer Coupled with Multivariate Data Analysis. Colloids Surf. B: Biointerfaces, 173, 286-294.
    https://doi.org/10.1016/j.colsurfb.2018.09.058

  6. 6. 任婕. 基于向量自回归模型的旅游热门景点预测方法研究[J]. 现代电子技术, 2020, 43(3): 158-161.

  7. 7. 吴越, 杨烨军, 黄钰婷. 基于多元回归和灰色预测的浙江省文化产业发展影响因素的计量分析[J]. 东莞理工学院学报, 2020, 27(3): 5-10.

  8. 8. 孙建华, 张志立, 石茜, 赵阳, 魏春荣. 基于主成分-逐步回归分析法的瓦斯涌出量预测研究[J]. 煤炭工程, 2020, 52(1): 89-94.

数据样表

期刊菜单