广州市财政收入分析及预测模型 Analysis and Prediction Model of Financial Income in Guangzhou

doi:10.12677/SA.2015.43021

Statistical and Application
Vol.04 No.03(2015), Article ID:16055,9 pages
10.12677/SA.2015.43021

Analysis and Prediction Model of Financial Income in Guangzhou

Geng Chen, Dandan Lu, Haowen Wan, Guochang Wang^*

●Abstract

●Full-Text PDF

●Full-Text HTML

●Linked References

College of Economics, Jinan University, Guangzhou Guangdong

^*通讯作者。

Email: ^*wanggc023@amss.ac.cn

Received: Aug. 29^th, 2015; accepted: Sep. 11^th, 2015; published: Sep. 18^th, 2015

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

ABSTRACT

Local financial revenue is an important part of national fiscal revenues. In order to identify the impact affecting factors of Guangzhou’s fiscal revenue automatically, we established a variable selection model in Adaptive-Lasso based on 1994-2013 years’ economic data. Under the research above, the paper offered the predictive value of fiscal revenue from 2014 to 2015 based on grey prediction and BP neural network combined model. The results of the variable selection models showed that the social number of employees, the total of worker’s salary, total volume of retail sales of the social consumer goods, per capita disposable income in urban residents, per capita expenditure on consumption in urban residents and social fixed assets investment were more related to fiscal revenue; afterwards the combined model had better effects. Furthermore, some advices were presented.

Keywords:Financial Income, Adaptive-Lasso, Grey Prediction, BP Neural Network

广州市财政收入分析及预测模型

陈庚，卢丹丹，万浩文，王国长^*

暨南大学经济学院，广州，中国

Email: ^*wanggc023@amss.ac.cn

收稿日期：2015年8月29日；录用日期：2015年9月11日；发布日期：2015年9月18日

摘要

地方财政收入是国家财政收入的重要组成部分。利用1994~2013年广州市的财政收入相关数据，建立Adaptive-Lasso变量选择模型，并自动识别出广州市财政收入的关键影响因素。并且在变量选择的基础上，又构建了灰色预测与BP神经网络的组合模型来预测广州市2014、2015年的财政收入。模型分析结果表明，社会从业人数、在岗职工工资总额、社会消费品零售总额、城镇居民人均可支配收入、城镇居民人均消费性支出以及全社会固定资产投资额与财政收入的关联性较大，之后进行的组合模型预测也有较好的效果。最后，根据分析结果提出相关的政策性建议。

关键词 :财政收入，Adaptive-Lasso，灰色预测，BP神经网络

1. 引言

在我国现行的分税制财政管理体制下，地方财政收人不仅是国家财政收入的重要组成部分容。因此，对地方财政收人进行科学、合理的预测，对于克服年度地方预算收支规模确定的随意性和盲目性、正确处理地方财政与经济的相互关系具有十分重要的意义。广州作为改革开放的前沿城市，其经济发展在全国经济中的地位举足轻重。目前，广州市在财政收入规模、结构等方面与北京、上海、深圳等城市仍有一定差距，因此如何完善广州市的财政结构，合理利用广州市的财政收入，缩短广州与国内城市北京，上海，深圳乃至国际大都市的差距对广州的发展及提高广州市民的生活质量具有至关重要的作用。因此研究广州市地方财政收入以及各类别收入的影响因素，对政府了解经济增长模式，更方便地进行决策具有主要的现实意义。

关于地方财政收入的影响因素问题，许多学者已经从不同角度进行了大量的研究。如尚元君、殷瑞锋(2009) [1] 选用1993~2005年中国31个省、市、自治区的财政、经济指标的面板数据，使用固定效应模型，对影响地方政府财政收入能力的因素进行了实证分析，研究发现：产业发展和城市经济水平指标对财政收入能力有极大的促进作用；刘心竹(2012) [2] 等选用2009年中国各省市财政以及经济数据，使用多元线性回归模型，并且加入地区虚拟变量，对影响地方财政收入的因素进行了实证分析，结果发现：固定资产投资、第一、第三产业生产总值对财政收入的影响非常显著；成军(2003) [3] 选用河北省1995~2000年河北省财政以及经济数据，使用BP神经网络、多元线性回归组合模型预测2001年地方财政收入，结果显示：预测误差为0.36%，达到了较高的预测精度；何邓娇(2014) [4] 选用广州市1978~2011年财政以及经济数据，使用VAR模型来分析影响广州市财政收入的因素，结果发现：国内生产总值、税收收入对财政收入的影响最大，社会从业人数对财政收入增加的贡献最大。

总的来看，很多学者已经对财政收入的影响因素进行了很多有意义且很实用的研究，但是他们大多是建立财政收入与各待定的影响因素之间的多元线性回归模型，运用最小二乘估计方法来估计回归模型的系数，通过系数能否通过检验来检验他们之间是否存在显著的相关关系。但所有的方法存在以下2个方面的缺点：第一，这样的结果对数据的依赖程度很大，并且普通最小二乘估计求得的解往往是局部最优解，后续的检验可能就会失去应有的意义。第二，这样先估计后检验的方法，当自变量存在共线性时，最小二乘估计会很不精确进而导致检验也出现错误，从而得到不合理的模型。因此，需要一种新的方法能估计回归系数的同时自动的选出对反应变量有显著影响的自变量。

随着社会的发展，新数据的出现对统计方法也提出了很多新的要求。很多新的统计方法和模型也相应的得以发展，比如变量选择方法Lasso, Tibshirani (1996) [5] 提出Lasso算法，并使用模拟数据对算法进行了验证，结果发现Lasso有很好的效果；Zou (2006) [6] 提出Adaptive-Lasso方法，分别做了广义线性模型和高维logistic回归模型的同时估计和变量选择，结果发现Adaptive-Lasso有Lasso同样的计算优势且有很好的oracle性能；范剑青等(2009) [7] 做了真实数据和蒙特卡罗仿真的实验，结果发现Adaptive-Lasso有比Lasso更好的效果。本文在已有的统计方法基础上，为了实现在估计回归参数的同时实行变量选择，我们运用Adaptive-Lasso变量选择方法来研究影响地方财政收入的因素。其优点为：本文提的方法能实现参数估计和变量选择同时进行，且我们选择出来的变量是由数据自身决定的，是客观的没有加入主观的因素。所以，本文利用广州市统计信息网的1994~2013年真实数据，采用Adaptive-Lasso方法，梳理影响广州市财政收入关联指标的有关数据，分析并识别影响财政收入的关键影响因素，构建广州市财政收入预测模型。进而利用BP神经网络与灰色预测的组合模型对广州市2014、2015年的地方财政收入进行预测。最后结合研究的结果，给政府部门提出相关的建议。

2. 模型的构建

2.1. Adaptive-Lasso变量选择模型

在以往的文献中，对影响财政收入的因素的分析中大多使用普通最小二乘法来对回归模型的系数进行估计，预测变量的选取则采用的是逐步回归。如果预测变量过多，子集选择的计算过程具有不可实行性，且子集选择具有内在的不连续性，从而导致子集选择极度多变。Lasso是近年来被广泛应用于参数估计和变量选择的方法之一，并且Lasso进行变量选择在确定的条件下已经被证明是一致的。

Lasso是由Tibshirani (1996) [5] 提出的将参数估计与变量选择同时进行的一种正则化方法。Lasso参数估计被定义如下：

(1)

其中，为非负正则参数，称为惩罚项。

但是Lasso对所有的变量加相同的惩罚，这样对那些非零的参数估计的惩罚也很大，从而参数估计的偏差较大。Lasso方法虽然可以解决最小二乘法和逐步回归局部最优估计的不足，但是其自身需要满足一定的苛刻条件变量选择才具有相合性且估计的偏差较大，从而导致预测不精确。

为了克服Lasso的这一缺点，本文选用了Adaptive-Lasso方法来探究地方财政收入与各因素之间的关系。Zou (2006) [6] 提出了一种改进的Lasso方法，其改进之处在于给不同的系数加上了不同权重的惩罚，称为Adaptive-Lasso方法，具体定义如下：

(2)

式中，权重，，为由普通最小二乘法得出的系数。

2.2. 灰色预测模型

设变量为一非负单调原始数据序列，建立灰色预测模型：首先对进行一次累加得到一次累加序列。

对可建立下述一阶线性微分方程：

(3)

即GM(1,1)模型。

求解微分方程，得到预测模型：

(4)

由于GM(1,1)模型得到的是一次累加量，将GM(1,1)模型所得数据经过累减还原为，即的灰色预测模型为：

(5)

后验差检验模型精度表见表1。

2.3. 神经网络预测模型

BP神经网络由Rumelhard和McClelland (1985) [8] 提出，它是一类多层的前馈神经网络，具有一个输入层、数个隐含层和一个输出层。层与层之间采用全连接的方式，同一层的神经元之间不存在相互连接。并且理论上已经证明，具有一个隐含层的三层网络可以逼近任意非线性函数 [9] 。本文运用BP神经网络的方法建立预测模型，并利用该模型对2014、2015年广州市财政收入进行预测。

2.4. 灰色预测与BP神经网络的组合模型

在Adaptive-Lasso变量选择的基础上，鉴于灰色预测对小数据量数据预测的优良性能，对单个选定的影响因素建立灰色预测模型，得到它们在2014、2015年的预测值。之后对历史数据建立BP神经网络预测模型，把通过灰色预测模型得到的预测值代入训练好的模型中，从而得到充分考虑历史信息的2014、2015年广州市财政收入的预测值。

3. 广州市财政收入影响因素分析

考虑到数据的可得性，本文所用的财政收入分为地方一般预算收入和政府性基金收入。地方一般预算收入包括：1) 税收收入，主要包括企业所得税和地方所得税中中央和地方共享的40%，地方享有的25%的增值税、营业税、印花税等；2) 非税收入，包括专项收入、行政事业性收费、罚没收入、国有资本经营收入和其他收入等。政府性基金收入是国家通过向社会征收以及出让土地、发行彩票等方式取得收入，并专项用于支持特定基础设施建设和社会事业发展的收入 [10] 。

Table 1. Model precision of posterior-variance-test

表1. 后验差检验模型精度表

3.1. 数据来源

由于1994年我国对财政体制进行了重大改革，开始实行分税制财政体制，影响了财政收入相关数据的连续性，在1994年前后不具有可比性。由于没有合适的数学手段来调整这种数据的跃变，仅对1994年及其以后的数据进行分析，本文所用数据均来自《广州市统计年鉴》(1995~2014)。

3.2. 变量选取

影响财政收入的因素有很多，在查阅大量文献的基础上，通过经济理论对财政收入的解释以及对实践的观察，考虑一些与能源消耗关系密切并且直观上有线性关系的因素，初步选取以下因素为自变量，分析它们之间的关系。

x1) 社会从业人数：就业人数的上升伴随着居民消费水平的提高，从而间接影响财政收入的增加。

x2) 在岗职工工资总额：反映的是社会分配情况，主要影响财政收入中的个人所得税、房产税以及潜在消费能力。

x3) 社会消费品零售总额：代表社会整体消费情况，是可支配收入在经济生活中的实现。当社会消费品零售总额增长时，表明社会消费意愿强烈，部分程度上会导致财政收入中增值税的增长；同时当消费增长时，也会引起经济系统中其他方面发生变动，最终导致财政收入的增长。

x4) 城镇居民人均可支配收入：居民收入越高消费能力越强，同时意味着其工作积极性越高，创造出的财富越多，从而能带来财政收入的更快和持续增长。

x5) 城镇居民人均消费性支出：居民在消费商品的过程中会产生各种税费，税费又是调节生产规模的手段之一。在商品经济发达的如今，居民消费的越多，对财政收入的贡献就越大。

x6) 年末总人口：在地方经济发展水平既定的条件下，人均地方财政收入与地方人口数呈反比例变化。

x7) 全社会固定资产投资额：是建造和购置固定资产的经济活动，即固定资产再生产活动。主要通过投资来促进经济增长，扩大税源，进而拉动财政税收收入整体增长。

x8) 地区生产总值：一般来讲，政府财政收入来源于即期的地区生产总值。在国家经济政策不变、社会秩序稳定的情况下，地方经济发展水平与地方财政收入之间存在着密切的相关性，越是经济发达的地区，其财政收入的规模就越大。

x9) 第一产业产值：取消农业税、实施三农政策，第一产业对财政收入的影响更小。

x10) 税收：由于其具有征收的强制性、无偿性和固定性特点，可以为政府履行其职能提供充足的资金来源。因此，各国都将其作为政府财政收入的最重要的收入形式和来源。

x11) 居民消费价格指数：反映居民家庭购买的消费品及服务价格水平的变动情况，影响城乡居民的生活支出和国家的财政收入。

x12) 第三产业与第二产业产值比：表示产业结构。三次产业生产总值代表国民经济水平，是财政收入的主要影响因素，当产业结构逐步优化时，财政收入也会随之增加。

x13) 居民消费水平：在很大程度上受整体经济状况GDP的影响，从而间接影响地方财政收入。

3.3. 描述性统计

首先对已有数据进行描述性统计分析，获得对数据的整体性认识。表2报告了主要变量的描述性统计结果。由表2可见财政收入(y)的均值和标准差分别为64.87和609.25，这说明：第一，广州市各年份财政收入存在较大差异。第二，2008年后，广州市各年份财政收入大幅上升。而相关系数可以用来描述定量变量之间的关系，初步判断因变量与解释变量之间是否具有线性相关性。

Table 2. Statistical resulting data of variables

表2. 变量统计结果

由表3可知，居民消费价格指数(x11)与财政收入的线性关系不显著，而且呈现负相关。其余变量均与财政收入呈现高度的正相关关系。

4. 财政收入分析及预测预测

4.1. Adaptive-Lasso变量选择模型

运用LARS 算法来解决公式(2)的Adaptive-Lasso估计，对于每给一个，该算法会寻找一个最优的。此处取，用R语言编制相应的程序后运行得到如下结果，见表4。

由表4可看出，年末总人口、地区生产总值、第一产业产值、税收、居民消费价格指数、第三产业与第二产业产值比以及居民消费水平等因素的系数为0，即在模型建立的过程中这几个变量被剔除了。这是因为居民消费水平与城镇居民人均消费性支出存在明显的共线性，Adaptive-Lasso方法在构建模型的过程中剔除了这个变量；由于广州存在流动人口与外来打工人口多的特性，年末总人口并不显著影响广州市财政收入；居民消费价格指数与财政收入的相关性太小以致可以忽略；由于农牧业各税在各项税收总额中所占比重过小，而且广州于2005年取消了农业税，因而第一产业对地方财政收入的贡献率极低；其他变量被剔除均有类似于上述的原因。这说明Adaptive-Lasso方法在构建模型时，能够剔除存在共线性关系的变量，同时体现了Adaptive-Lasso方法对多指标进行建模的优势。

综上所述，利用Adaptive-Lasso方法识别影响财政收入的关键影响因素是社会从业人数、在岗职工工资总额、社会消费品零售总额、城镇居民人均可支配收入、城镇居民人均消费性支出以及全社会固定资产投资额。

4.2. 财政收入预测模型

对Adaptive-Lasso 变量选择方法识别的影响财政收入的因素建立灰色预测与BP神经网络的组合预测模型，其参数设置为误差精度10⁻⁷，学习次数10,000次。社会从业人数(x1)、在岗职工工资总额(x2)、

Table 3. Correlation coefficient matrix of Pearson

表3. Pearson相关系数矩阵

Table 4. Coefficients data of variables

表4. 变量系数表

社会消费品零售总额(x3)、城镇居民人均可支配收入(x4)、城镇居民人均消费性支出(x5)、固定资产投资额(x7)指标的2014年及2015年数值通过R语言建立灰色预测模型得出，预测精度等级见表5，灰色预测模型有很好的效果。

代入地方财政收入所建立的BP神经网络预测模型，得到广州市财政收入2015年的预测值为2879.26亿元。图1为BP神经网络地方财政收入真实值与预测值对比图。

5. 结论及建议

5.1. 结论

本文在广州市经济历史数据的基础上，建立了财政收入的Adaptive-Lasso变量选择模型，确定包括：社会从业人数、在岗职工工资总额、社会消费品零售总额、城镇居民人均可支配收入、城镇居民人均消费性支出和固定资产投资额等6项影响广州市地方财政收入的主要因素。在此基础上，对选择出的各变量建立GM(1,1)灰色预测模型得到2014、2015年的预测值，代入根据1999~2013年数据训练出的BP神经网络模型即可得到地方财政收入2014、2015年的预测值。

本文在对历史数据充分分析的基础上建立的地方财政收入预测模型，很大程度上提高了地方财政收入预算的准确性。

Table 5. Model precision of grey prediction

表5. 灰色预测模型相关因素精度表

Figure 1. Curve: system result of standard experiment

图1. 标准试验系统结果曲线

5.2. 建议

1) 改善就业环境，促进就业

根据有关机关调查表明，去年广州市常驻人口的调查失业率为5.22%，保持着较高的水平。这一方面是由于局部用工需求减弱，比如消费行业，部分人群就业压力增大。另一方面，我国去年经济下行压力较大，经济持续低迷，使得企业用工人数下降。就业是地区经济保持活力的重要特征，也是百姓安居乐业的重要依靠。提高就业率能够有效地促进经济发展，增加政府的财政收入。因此，广州市应该着力于培养失业人口的劳动技能，在企业和就业人群之间建立良好的就业信息通道。

2) 调整分配收入

合理调整收入初次分配和再分配，兼顾公平与效率原则。2014年广州市人均GDP突破1万美元，但是初次分配和再分配过程中还存在许多不足之处。研究发现，在岗职工工资和人均可支配收入对财政收入存在显著影响，说明合理的收入分配有利于增加财政收入。所以，广州市应该不断提高居民的收入水平，健全国民分配体制，使全社会处于高效有序的节奏中。

3) 促进居民消费

社会消费品零售总额和城镇居民人均消费性支出与财政收入存在显著的正相关关系。居民消费低迷和粗狂的投资方式是广州市着力解决的重要难题，也是经济处于转型期需要跨过的两座大山。促进居民消费是一个长期而艰难的课题，它涉及到社会保障、收入分配、消费观念等各个方面，这也是对政府执政能力的巨大考验。促进居民消费，改变经济增长方式，将是提高政府财政收入的有力措施。

4) 增加社会固定资产投资

模型表明随着全社会固定资产投资额增加，财政收入也会显著增加。近年来，广州市加大政府投资，对交通系统进行改造，比如兴建快速公关交通系统(BRT)，很好的改善交通拥堵情况。然而广州市的基础设施还存在许多不完善的地方，比如城市的下水道系统，所以不断增加投资尤其是固定资产投资，能够提高经济运行效率，吸引投资，创造更多的财政收入。

6. 结束语

本文首先建立了Adaptive-Lasso变量选择模型，用于对影响广州市财政收入的因素进行变量选择，与传统的变量选择方法相比解决了估计不准确以及多重共线性的问题，因而具有明显的优势；之后在变量选择的基础上建立了灰色预测与BP神经网络的组合预测模型，这样就得到了充分考虑历史信息的预测值，预测精度相对较高。

文章引用

陈庚,卢丹丹,万浩文,王国长. 广州市财政收入分析及预测模型
Analysis and Prediction Model of Financial Income in Guangzhou[J]. 统计学与应用, 2015, 04(03): 187-195. http://dx.doi.org/10.12677/SA.2015.43021

参考文献 (References)

1. 尚元君, 瑞锋 (2009) 地方政府财政收入能力影响因素的实证分析. 中央财经大学学报, 5, 12-15.

2. 刘心竹, 李昊, 等 (2012) 我国地方财政收入影响因素的实证分析. 中国集体经济, 9, 84-85.

3. 成军 (2003) 地方财政收入预测模型设计及实证分析. 经济研究参考, 88, 27-34.

4. 何邓娇 (2014) 广州市财政收入影响因素的实证研究. 经济研究导刊, 15, 104-106.

5. Tibshirani, R. (1996) Regression shrinkage and selection via the lasso. Journal of the Royal Statistical Society. Series B, 58, 267-288.

6. Zou, H. (2006) The adaptive lasso and its oracle properties. Journal of the American Statistical Association, 101, 1418- 1429. http://dx.doi.org/10.1198/016214506000000735

7. Fan, J.Q., Feng, Y. and Wu, Y.C. (2009) Network exploration via the adaptive lasso and SCAD penalties. The Annals of Applied Statistics, 3, 521-541. http://dx.doi.org/10.1214/08-AOAS215

8. Rumelhart, D.E., Hinton, G.E. and Williams, R.J. (1986) Learning re-presentations by back-propagating errors. Nature, 323, 533-536.http://dx.doi.org/10.1038/323533a0

9. 史峰, 王辉, 等 (2011) MATLAB智能算法30个案例分析. 北京航空航天大学出版社, 北京.

10. 陈共 (2012) 财政学. 中国人民大学出版社, 北京.

期刊菜单