Operations Research and Fuzziology
Vol. 13  No. 05 ( 2023 ), Article ID: 74507 , 12 pages
10.12677/ORF.2023.135568

基于因子模型的我国各省市经济发展水平的 影响因素实证分析

刘艺凡,高广阔

上海理工大学管理学院,上海

收稿日期:2023年9月6日;录用日期:2023年10月18日;发布日期:2023年10月30日

摘要

近年来中国经济倡导高质量发展,但我国各省份经济发展水平长期以来存在着明显的地域差异,这不利于国家的均衡发展。本文首先通过多元回归模型分析了我国GDP水平的影响因素,再通过主成分分析和因子模型对全国31个地区的经济发展情况进行城市综合竞争力评价,讨论各省市经济发展的特点。针对国内经济区域发展不平衡问题,找出原因并试图利用所学知识提出合理建议。

关键词

经济发展水平,影响因素因子模型,回归分析

Empirical Analysis of Influencing Factors of Economic Development Level of Provinces and Cities in China Based on Factor Model

Yifan Liu, Guangkuo Gao

School of Management, University of Shanghai for Science and Technology, Shanghai

Received: Sep. 6th, 2023; accepted: Oct. 18th, 2023; published: Oct. 30th, 2023

ABSTRACT

In recent years, China’s economy has advocated high-quality development, but there have been obvious regional differences in the level of economic development of various provinces in China for a long time, which is not conducive to the balanced development of the country. This paper first analyzes the factors that affect the level of GDP in China through multiple regression model, and then evaluates the comprehensive competitiveness of the economic development of 31 regions in China through principal component analysis and factor model, and discusses the characteristics of the economic development of each province and city. In view of the unbalanced development of domestic economic regions, this paper finds out the reasons and tries to put forward reasonable suggestions by using the knowledge learned.

Keywords:Level of Economic Development, Influencing Factor, Factor Model, Regression Analysis

Copyright © 2023 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

中国作为世界经济的重要组成部分,改革开放四十多年来经济飞速发展,近年来在经济建设中取得重大成就,但是各省份经济发展却具有明显的不平衡现象,这深受我国政府以及民众的高度重视。如何客观、定量的对全国各地区经济差异做出评价,提出有效解决国内经济发展不平衡的政策建议,促进全国经济全面协调发展,是目前有待解决的问题。

国内生产总值(Gross Domestic Product, GDP)是指一个国家(或地区)所有常驻单位在一定时期内生产的所有最终产品和劳务的市场价值 [1] ,一些学者研究发现,收入、居民消费水平、进出口贸易总额、外商直接投资和研究与实验发展支出、固定资产投资 [2] 、就业人数是影响GDP的主要因素。

一般而言衡量一个地区是否有竞争力,常常关注一个区域的经济总量、消费支出、商品价格以及收入水平,这些因素直接影响该地区的可持续发展和综合竞争力。本文利用因子分析的方法,利用其降维的思想,将影响经济发展水平的具有错综复杂关系的多个变量压缩为数量较少的几个综合变量,使高度相关的变量划归同组内,相关性较低的变量归于不同组内,以再现原始变量与因子之间的相互关系,避免综合评价中因信息量过大而导致的重复评价。公共因子的选取通常是以特征值大于1或累积方差贡献率大于70%为标准,确保保留大部分原始信息。最后,以公因子得分与各因子方差贡献率进行加权求和,得分越高,表明该省份综合实力越强,整体质量越高;得分低的省份竞争力相对较弱,城市居住适宜性越差,居民的幸福感自然越低。综合考虑影响社会经济发展状况的各项指标,希望能为各地区因地制宜制定相应的发展战略提供一些科学依据。

2. 数据来源与说明

本文数据来源于《中国统计年鉴》的2012到2021年中国31个省份分省年度面板数据。根据各省经济发展情况,通过阅读相关文献,参考杨武(2018) [3] 衡量区域经济的指标数据,最终选取了见表1的2021年各省经济发展情况的截面数据所示部分指标:如地区生产总值、资本形成总额,居民消费支出、政府消费支出、就业人数、私营单位平均工资、居民消费价格指数、商品零售价格、居民人均可支配收入、居民消费水平绝对数、固定资产投资价格指数以及电力消费量等指标作为相关变量,运用多元线性回归模型 [4] 进行实证分析,探讨影响GDP的主要因素,并对最终结果进行检验。

Table 1. Data indicators of economic development of each province in 2021

表1. 2021年各省经济发展情况数据指标

3. 我国各省份城市经济发展水平实证研究

3.1. 多元回归模型分析

首先是对中国31个省份地区生产总值做多元回归分析,地区生产总值是衡量一个地区是否有竞争力的重要指标,其影响因素众多,经过查阅相关文献,最终选取了以地区生产总值Y作为被解释变量,资本形成总额X1,居民消费支出X2、政府消费支出X3、就业人数X4、私营单位平均工资X5、居民消费价格指数X6、商品零售价格X7、居民人均可支配收入X8、居民消费水平绝对数X9、固定资产投资价格指数X10以及电力消费量X11作为解释变量建立多元回归模型:Y = β0 + β1X1 + β2X2 + β3X3 +…+ Є。通过多元线性回归的指标检测,识别出对GDP的增长具有明显作用的主要变量指标,以此来确定回归方程并进行预测分析 [5] 。

第一步是参数估计,本文以Stata软件为统计分析工具,将上述整理的符合数据统计格式的数据导入软件,并基于对模型中的各参数的估计,计算得到了初步回归结果。见表2所示,根据初步回归结果,整理后得到多元回归模型如下:

Y = 0.86X1 + 0.35X2 + 1.07X3 + 13.6X4 + 0.12X5 − 456.2X6 + 910.68X7 + 0.09X8 − 0.48X9 + 257.52X10 + 0.03X11 − 81524.2

Table 2. Multiple regression model analysis results

表2. 多元回归模型分析结果

表2多元回归结果可以看出,R2 = 0.977,调整后的可决系数adjR2 = 0.976,说明该回归模型对样本的拟合程度非常高。在进行F检验时,首先提出原假设:β1 = β2 = β3 = β4 = β5 = β6 = β7 = β8 = β9 = β10 = 0,在指定的显著性水平α = 0.05,F (11, 288) = 1111.67,对应的P值远小于0.05,所以强烈拒绝原假设,说明回归方程的系数不全为0,回归方程非常显著。即资本形成总额X1,居民消费支出X2、政府消费支出X3、就业人数X4、私营单位平均工资X5、居民消费价格指数X6、商品零售价格X7、居民人均可支配收入X8、居民消费水平绝对数X9、固定资产投资价格指数X10以及电力消费量X11对地区生产总值增长有显著影响。

Figure 1. Residual diagram

图1. 残差图

第二步是异方差检验,见图1残差图可以看出散点分布较为集中,可初步判断可能存在异方差。再对其进行怀特检验,原假设H0默认为不存在异方差。见表3检验结果显示,P = 0.00 < 0.05,故拒绝同方差的原假设,认为存在异方差,这个检验也证实了根据残差图所做出的大致判断。因此需要通过异方差稳健标准误修正,为后续的统计检验提供保障。见表4稳健性检验结果显示,被解释变量高度显著,回归方程更加精确。

Table 3. White test

表3. 怀特检验

Table 4. Robust standard error test

表4. 稳健标准误检验

Table 5. Variance inflation factor

表5. 方差膨胀因子

第三步是多重共线性检验,一般用方差膨胀因子VIF来检验多重共线性,见表5所示经检验,VIF的值x8 = 54.48,x2 = 39.51,x9 = 29.01,x1 = 18.85均远大于10,故可认为存在多重共线性,必须进行多重共线性修正,得到的回归结才更可靠和具有实际意义,接下来通过主成分分析和因子模型来消除多重共线性。

3.2. 主成分分析和因子模型

首先要检验数据是否适合做因子分析,“KMO和巴特利特检验”主要用于评估数据是否适合做因子分析,其中KMO值越接近1表示越适合做因子分析 [6] ,见表6所示,KMO统计量为0.756,大于0.5,说明本数据集还比较适合做因子分析,巴特利特检验的概率值为0,小于显著性水平(0.05),因此拒绝原假设,即说明所分析的变量之间存在相关关系,有相关性则适合做因子分析。从“公因子方差”结果表来看,见表7所示,“提取”列的值除了固定资产投资价格指数和居民消费价格指数的共同度为0.376和0.505,其余变量的共同度均大于0.75,表示其他原始变量被公共因子解释的程度超过了0.75,即提取的公共因子能够反映各原始变量75%以上的信息,说明公因子的解释能力还不错,因子分析的结果是有效的。

Table 6. KMO and Bartlett test results

表6. KMO 和巴特利特检验结果

Table 7. Common degree test of original variable

表7. 原始变量共同度检验

在因子分析中,提取的每个因子都有方差贡献率,方差贡献率表示该因子对所有原始变量的信息提取程度,即解释能力。而总方差贡献率是指提取出的所有因子对于原始变量总共提取的信息量。表中,左侧部分为初始特征值,中间部分为旋转前的主要因子结果,右侧为旋转后的主要因子结果,其中“总计”为因子的特征值,“方差百分比”表示该因子特征值占总特征值的百分比,“累计”表示累计的百分比。因子载荷是公共因子与指标变量之间的相关系数,载荷越大说明公共因子与指标变量之间的关系越密切。因为设定的因子抽取标准是因子特征值大于1时才抽取,所以从表中的数据来看,只有特征值大于1的前三个因子被成功提取,见表8所示他们的方差贡献率分别为50.416%、24.549%、9.457%,累计总方差贡献率达到了84.422%,说明前三个因子对变量的解释能力非常好。因此,可以提取前三个因子作为主因子对全国31个省市经济综合发展水平作出评价。

Table 8. Total variance interpretation results

表8. 总方差解释结果

图2提取因子的碎石图所示能够辅助我们判断最佳因子个数,通常选取处在曲线较陡斜率所对应的因子为主因子,而处在平缓斜率上的因子对变量的解释力非常小。从结果来看,只有前三个因子处在陡坡上,从第四个因子开始曲线斜率变得平缓,因此选择前三个因子为主因子。后面的结果主要是根据提取的三个因子进行后续分析。

Figure 2. Factor lithotripsy diagram

图2. 提取因子碎石图

成分矩阵表有两个,一个是旋转前的,一个是旋转后的。见表9所示为旋转前的因子载荷矩阵。从旋转前的矩阵来看可以得到利用主成分方法提取的两个主因子的载荷值。但结果并不令人满意,第二个主因子的因子载荷略显模糊,难以对因子明确定义。因此需要进行因子旋转,本文采取Kaiser标准化的正交旋转法对因子进行旋转,见表10所示是旋转后的成分矩阵可以更清楚的观察样本数据。

Table 9. Component matrix before rotation

表9. 旋转前的成分矩阵

Table 10. The component matrix after rotation

表10. 旋转后的成分矩阵

Table 11. Component transformation matrix

表11. 成分转换矩阵

接下来是因子命名,旋转的因子载荷矩阵 = 未旋转的因子载荷阵 * 成分转换矩阵。见表11所示,从数据中可以看到,前五个变量在因子1中的载荷值都比较大,中间四个变量在因子2中载荷量比较大,而后两个变量在因子3中的载荷比较大,说明变量与其对应的因子的相关程度较高。可以看到影响各省份发展水平的因素大致可以分为三类,第一类是以就业人数、资本形成总额、地区生产总值、政府财政预算支出和电力消费量这些变量为代表的反映出各省市的经济总量,他们的因子载荷分别为0.970、0.967、0.966、0.951、0.945,他们与经济总量关系密切可以命名为经济总量因子;第二类是以居民人均可支配收入、居民人均消费支出、居民消费水平绝对数、私营单位平均工资为代表的反映出各省市居民的消费水平,因子载荷分别为0.921、0.920、0.901、0.876,可以命名为居民消费因子;第三类是以商品零售价格指数和居民消费价格指数为代表的反映各省市的物价水平,因子载荷分别为0.876、0.645,可以命名为商品价格因子。

Table 12. Component score matrix

表12. 成分得分矩阵

表12所示,成分转换矩阵给出了各因子间相关系数,可以由成分得分系数矩阵得出各因子计算公式:

F1 = 0. 2 0 5Zx1 + 0. 2 0 5Zx2 0.0 25Zx3 + 0. 2 0 7Zx4 + 0. 211Zx5 0.0 19Zx6 0.0 1 0 Zx7 + 0.0 5 0 Zx8 0.0 32Zx9 0.0 25Zx1 0 + 0.0 88Zx11 + 0. 214Zx12

F2 = 0.00 4Zx1 0.0 19Zx2 + 0. 256Zx3 0.0 11Zx4 0.0 41Zx5 + 0. 264Zx6 0.0 45Zx7 + 0. 134Zx8 + 0. 249Zx9 + 0. 238Zx1 0 0. 243Zx11 0. 1 0 8Zx12

F3 = 0.0 56Zx1 0.0 22Zx2 0.00 6Zx3 0.0 9 0 Zx4 0.00 8Zx5 0.0 88Zx6 + 0. 466Zx7 0. 692Zx8 + 0.0 34Zx9 + 0.0 47Zx1 0 + 0. 284Zx11 + 0.0 94Zx12

因为选择了将因子得分保存为变量的选项,所以可以在数据集中看到新增了三个变量FAC1、FAC2和FAC3,见表13所示即为提取出的经济总量因子、居民消费因子和商品价格因子得分。因子得分可以看作是原始变量降维后的新变量值,既能够与其他统计分析方法结合使用,比如回归分析、聚类分析,也可以用来进行综合得分 [7] 。由因子得分可以进一步计算综合得分:

Score = 4 0. 781 / 84 . 442 * FAC1 _ 1 + 31 . 221 / 84 . 442 * FAC2 _ 1 + 12 . 42 / 84 . 442 * FAC3 _ 1

按照因子综合得分降序排列可以得到下表所示的各省市经济发展情况排名。

Table 13. Provincial economic development comprehensive factor score ranking

表13. 各省经济发展情况综合因子得分排名

3.3. 因子得分分析

从经济总量因子来看,排名前三名的省份是广东、江苏和浙江,从居民消费因子来看,排名前三的是上海、北京和天津,从商品价格因子来看,排名前三的是宁夏、山西与内蒙古。而三个因子的综合得分排名前三的是广东、江苏与上海,与我们公认的具有实力的省份具有一致性。从地域分布上看,综合实力强大的省份基本上都分布在东部沿海地区,东、中、西部地区之间的差距明显,前十名中有8个靠近东部沿海,可见,东部沿海地区仍然是我国经济增长的热点地区。各省份在上述的3个公共因子中,这些城市和省份都具有得天独厚的优势,无论是从经济总量还是居民消费水平等各方面基本上都遥遥领先其他省份 [8] 。广东、江苏位居前二名,超越了我们常识认为的经济发达省份北京和上海,这主要是因为选取的12个变量因子中,有8个变量与人口总数和面积相关,而北京上海的人口和面积都相对较少,这样的评价结果更为客观真实。

3.4. 影响因素分析

根据以上的因子分析,我们可以看出得分排名第一的广东省的经济发展状况与其他地区有很大差别,主要表现在GDP、居民消费支出等几大经济指标远远高于其他地区,这与广东省作为我国人口第一大省,最早对外开放而且包含深圳等经济特区,企业富含活力和生机,经济实力非常雄厚等是十分吻合的;其次是江苏,经济水平稍低于广东,江苏位于长三角经济圈,它具有很强的科技研发能力和雄厚的工业实力,迅速闻名于民营经济的发展;第四名浙江,因其体制优势而且靠低价格劳动密集型产品迅速发展起来,并且近年来得益于互联网技术的高速发展,经济进入了新的增长阶段;第三名的上海和第五名的北京,作为国家的工业经济和政治文化中心,虽地处要塞经济发达,但人口和面积都相对较少,所以总量上要略低于传统省级行政单位。此次对全国各省份的经济发展水平的因子分析结果与我国现阶段各省各地区经济发展现状吻合度较高,也比较符合认知常理,从而可用来为国家做出适宜的经济投资决策提供依据,从而实现全国各城市经济水平协调发展,又快又好的促进国民经济及生活水平的提高。

4. 结论与建议

通过本文的多元回归模型分析,从模型中可以看出资本形成总额X1,居民消费支出X2、政府消费支出X3、就业人数X4、私营单位平均工资X5、商品零售价格X7、居民消费水平绝对数X9、固定资产投资价格指数X10是影响地区生产总值的主要因素。通过主成分提取和因子分析,我们可以看到,我国各省份经济发展水平之间存在着明显的地域差异,从经济总量看,广东、江苏、浙江经济总量大幅领先其他省份,这些东部地区由于具备得天独厚的地理位置、高度开放的经济贸易、发达便利的交通,以及较大规模的政府支出和固定资产投资,使得经济发展遥遥领先,而甘肃、青海、西藏等西部地区排名居后,主要是基础配套设施不全导致的经济发展滞后,因此我国应大力推动西部大开发政策,逐步扩大开放,积极引进国内外资金、人才、技术,承接中东部地区的产业转移,逐步加大西部地区的固定资产投资和改善人民生活水平。从消费与价格水平看,中部地区的排名居中,主要是中部地区各种环境和条件具有过渡性和中间性,因此需要充分发挥因地制宜优势,大力发展本土化特色产业,提升就业人数和居民可支配收入水平,逐步向东部地区靠拢。

综上所述,要实现东中西地区发展的良性互动,各省份就要正视自身所处的位置以及存在的问题,制定合理的发展规划,加强与周边省份的合作,实现资源共享、优势互补,促进生产要素在各区域之间的合理流动,充分发挥地区的比较优势,实现省份之间的区域协调发展,这样才能提升本省的整体发展水平,从而提升我国的综合经济实力。

文章引用

刘艺凡,高广阔. 基于因子模型的我国各省市经济发展水平的影响因素实证分析
Empirical Analysis of Influencing Factors of Economic Development Level of Provinces and Cities in China Based on Factor Model[J]. 运筹与模糊学, 2023, 13(05): 5688-5699. https://doi.org/10.12677/ORF.2023.135568

参考文献

  1. 1. 许宪春. 中国国内生产总值核算中存在的若干问题研究[J]. 经济研究, 2000(2): 10-16+78.

  2. 2. 白雨. 基于多元回归分析的我国GDP影响因素实证分析[J]. 中小企业管理与科技, 2019(6): 55-57.

  3. 3. 杨武. 安徽省国内生产总值影响因素的多元回归分析[J]. 南方农机, 2018, 49(5): 11-13.

  4. 4. 梁浩南. 安徽省GDP影响因素实证研究——基于多元回归分析[J]. 时代金融, 2021(24): 73-75.

  5. 5. 周金欣. 各省消费对经济发展水平影响的实证分析[J]. 全国流通经济, 2019(32): 5-6.

  6. 6. 蔡俊英, 郭秋诗. 基于因子分析法的全国各省发展状况综合评价[J]. 柳州职业技术学院学报, 2015, 15(5): 40-44.

  7. 7. 王波, 胡华瑞. 基于因子分析的31个省市经济发展水平研究[J]. 湖北科技学院学报, 2014, 34(12): 47-48.

  8. 8. 王翠云, 胡学平. 聚类分析及其在我国各省经济发展水平分类研究中的应用[J]. 安庆师范学院学报(自然科学版), 2014, 20(4): 36-41.

期刊菜单