本文利用二次、指数和阻滞增长三种增长模型对中国电子商务季度交易额数据进行拟合;使用MATLAB软件绘制了电子商务增长数据点图以及预测图,对模型参数,拟合优度及模型的残差进行分析,最后得出模型的拟合曲线以及对于未来电子商务规模数据的预测。 Based on Chinese quarterly e-commerce transactions data in recent years, the quadratic, the exponential and the logistic growth models are fitted. Using MATLAB software, we plot the e-commerce growth data points as well as the forecast figure, and estimate the model parameters, goodness-of-fit statistics and model residual analysis. The analytic model of the fitting curve and forecast for the future scale of e-commerce data are given.
陈鸿展,郑静
杭州电子科技大学经济学院,浙江 杭州
收稿日期:2019年2月2日;录用日期:2019年2月14日;发布日期:2019年2月21日
本文利用二次、指数和阻滞增长三种增长模型对中国电子商务季度交易额数据进行拟合;使用MATLAB软件绘制了电子商务增长数据点图以及预测图,对模型参数,拟合优度及模型的残差进行分析,最后得出模型的拟合曲线以及对于未来电子商务规模数据的预测。
关键词 :电子商务,阻滞增长模型,残差分析
Copyright © 2019 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
电子商务是一种基于互联网平台的买卖双方直接在网上进行交易的商业模式。近些年电子商务的迅猛发展为消费者提供了购物的便利,造就了淘宝天猫,京东商城等电子商务巨头。文献 [
模型方面,文献 [
模型假设电子商务交易金额增长率是常数,即单位时间内电子商务交易金额的增长量与当时的电子商务交易金额成正比。定义 x ( t ) 为t时刻的电子商务交易金额,可以得到
x ( t ) = a t 2 + b t + c
模型假设今年电子商务交易额 x 0 ,年增长率r,k年后电子交易额为 x k = x 0 ( 1 + r ) k 。
且电子商务增长率r是常数(或单位时间内电子商务的增长量与当年的电子商务交易额成正比)。 x ( t ) 为t时刻的电子商务交易额;模型的表达式为 x ( t ) = x 0 e r t 。
根据前两个模型可以得到电子商务交易量数据的无穷增长的结论,显然这有一定的不合理。而阻滞增长(logistic)模型考虑到了自然资源、环境条件等因素对电子商务交易金额的增长起着阻滞作用,并且随着电子商务交易金额的增加,阻滞作用会越来越大。所以有如下模型:
d x d t = r ( 1 − x x m ) x , x ( 0 ) = x 0
这里参数r是该模型的内禀增长率, x m 是自然资源和环境条件所能容纳的最大电子商务交易金额数据。当x = x m 时,电子商务交易金额不再增长,即此时增长率为0。对上述方程求解可以得到
x ( t ) = x m 1 + ( x m x ( 0 ) − 1 ) e − r t 。
我们选取艾瑞网上摘录的2010年第一季度到2016年第四季度的电子商务交易数据(见表1)共计28个进行实证分析。
2010 | 2011 | 2012 | 2013 | 2014 | 2015 | 2016 | |
---|---|---|---|---|---|---|---|
第一季度 | 1 | 1.5 | 1.7 | 2.23 | 2.81 | 3.5 | 4.2 |
第二季度 | 1.1 | 1.5 | 1.93 | 2.39 | 3.07 | 3.8 | 4.6 |
第三季度 | 1.2 | 1.64 | 2.05 | 2.53 | 3.35 | 3.9 | 5.2 |
第四季度 | 1.4 | 1.8 | 2.39 | 2.57 | 3.87 | 4.9 | 6.2 |
表1. 电子商务2010年~2016年季度交易规模数据(万亿)
利用二次模型,指数模型和阻滞增长模型对上述数据的分析结果进行简单的汇总比较,相关的模型统计量描述和方差分析结果如表2所示:
模型名称 models | 模型统计量描述 | 检验方差分析 | ||||
---|---|---|---|---|---|---|
Multiple R | R square | Adjusted R square | Standard Error | F | Signif F | |
二次曲线 | 0.984 | 0.969 | 0.966 | 0.252 | 389.213 | 0.000 |
指数模型 | 0.992 | 0.984 | 0.983 | 0.064 | 1596.3 | 0.000 |
logistic曲线 | 0.992 | 0.983 | 0.983 | 0.072 | 1525.528 | 0.000 |
表2. 模型的统计描述
从表2可以看出,三个模型的拟合度(R2值)均达到了0.9以上,而方差分析的Signif F值均明显小于0.01,因此这三个模型的拟合结果均具有统计上的意义。
三个模型的判定系数均接近于1,所反映的自变量与因变量的相关性较高,模型的拟合程度较好。虽然三个模型的拟合程度均不相上下,但是我们可以明显的发现逻辑曲线和指数曲线的标准误差项明显较小,我们可以初步认为其更适用于电子商务规模的增长模型。
本文用数学软件对这三个模型曲线进行拟合,相关参数数据描述如下。
二次模型:因变量y对自变量时间t,t2的非标准化回归系数分别为0.023,0.005,对应的显著性检验的T值分别为0.949,5.808;显著性水平方面,变量t的sig > 0.05,显著性水平不强;而t的平方项的sig < 0.05,显著性水平较强。对应的二次曲线模型为: y = 0.005 t 2 + 0.023 t + 1.156
指数模型:因变量ln(y)对自变量时间t的非标准化回归系数为0.060,对应的显著性检验的T值为39.954,回归系数的显著性水平sig T值小于0.05。
对应的指数回归方程为: y = 1.038 e 0.06 t
阻滞模型:因变量 ln ( 1 / y − 1 / 15.0 ) 对时间t的非标准化回归系数为0.936,对应的显著性检验的T值为592.701,回归系数的显著性水平sig T值小于0.05。
对应的logistic模型的回归方程是: y = ( 1 / 31.6 + 0.891 ∗ exp ( − 0.066 ( t − 1 ) ) ) − 1
图1. 原始数据与拟合曲线
上面的三张图是通过对三个模型进行拟合得到的实际效果图(见图1),可以看出对于已有的数据的拟合效果还算不错。但是第1张和第2张往后将呈现爆炸性的增长趋势显然不符合实际,第3张就比较合理的预计再经过十年左右电子商务规模将渐趋于一个上限。
图2是对三个模型的残差项用R软件所做的自相关函数图(ACF)。
图2. 残差自相关系数
从上面三个残差的自相关系数图可以看出,样本长度为28,自相关系数服从以0为均值, 1 n 为标准差的正态分布,当自相关系数落在以区间(− 1 n , 1 n )为独立置信区间时,我们就认为误差项是均值为
0的独立同分布随机变量序列。从图中我们可以得出残差项存在独立性。
图3分别是二次,指数,阻滞模型的残差的直方图。
图3. 残差直方图
可以看出残差项近似的服从正态分布,均值为零。由于电子商务正处于初始的加速上升阶段所以拟合效果均不错差异性不是很大。
二次模型 | 指数模型 | 阻滞模型 | |
---|---|---|---|
2017年第二季度 | 6.346 | 6.280 | 6.811 |
2017年第三季度 | 6.674 | 6.668 | 7.170 |
2017年第四季度 | 7.012 | 7.080 | 7.543 |
2018年第一季度 | 7.36 | 7.518 | 7.928 |
2018年第二季度 | 7.718 | 7.983 | 8.327 |
2018年第三季度 | 8.086 | 8.476 | 8.738 |
2018年第四季度 | 8.464 | 9.001 | 9.161 |
2019年第一季度 | 8.852 | 9.557 | 9.596 |
2019年第二季度 | 9.25 | 10.148 | 10.043 |
2019年第三季度 | 9.658 | 10.776 | 10.501 |
2019年第四季度 | 10.076 | 11.442 | 10.968 |
2020年第一季度 | 10.504 | 12.150 | 11.446 |
2020年第二季度 | 10.942 | 12.901 | 11.932 |
2020年第三季度 | 11.39 | 13.699 | 12.426 |
2020年第四季度 | 11.848 | 14.546 | 12.927 |
表3. 未来季度数据预测(万亿)
在模型的拟合结果中我们可以看出,二次曲线和指数曲线模型拟合值与前期数据比较吻合,这说明目前我国的电子商务正处于迅猛发展时期,但考虑到环境因素等原因,未来不可能一直持续这一趋势。当资源有限时,电子商务交易总额的增长率将会随着基数的增大而减小,由此我们认为电子商务交易额的增长速度会缓慢下降,即随着电商交易额的增加而降低,存在着增长有限性的特征。阻滞增长模型,更能描述电子商务的发展趋势,对数据进行拟合,结果可以看出阻滞增长模型拟合得到的数据客观的反映了电子商务增长规律,与现有数据非常吻合,并且对未来电商交易金额的预计(见表3)也在我们的理想范围之内,效果更为准确。
根据模型的拟合效果预测图也可以看出未来十年电商交易规模仍旧会有着较强的发展势头,并将在未来五年内突破年交易量五十万亿大关。伴随着大量传统企业的转型升级和智能物流体系的建立,电子商务的交易金额将牵动着国民生产总值的发展,电商的地位将日益抬高,政府对电商的支持度也是日益增加,这表明电商在中国经济市场未来将占有相当大的份额,未来将是中国经济强劲增长的非常重要的一环。我们不仅要看到电商以前辉煌的成就,也要瞄准电商充满机遇的未来。
国家社科基金17BTJ023资助。
陈鸿展,郑 静. 电子商务增长模型的分析预测 Analysis and Prediction of Electronic Commerce Growth Model[J]. 统计学与应用, 2019, 08(01): 176-183. https://doi.org/10.12677/SA.2019.81020