为建立低保标准的数学模型,我们提出了以下四个问题:问题一:挑选主要的计算“低保标准”的指标。问题二:就某一地区,根据获得的数据,给出该地区的“低保标准”。问题三:分析现行的各地(省、或县市)之间“低保标准”的相关性。问题四:利用问题三分析的结果,给出多元数学模型,并给出模型适应性验证。 In order to establish the mathematical model of the standard, we put forward the following four questions. Question 1: Select the main index to calculate the “subsistence allowance standard”. Question 2: For a certain region, according to the data obtained, the “subsistence allowance standard” of the region is given. Question 3: Analyze the correlation between the existing “subsistence allowance standards” in different regions (provinces, counties and cities). Question 4: Using the result of question 3, this paper gives a multivariate mathematical model and verifies the adaptability of the model.
奚源,于岱卉,郭慧婷
吉林大学,吉林 长春
收稿日期:2019年3月25日;录用日期:2019年4月9日;发布日期:2019年4月16日
为建立低保标准的数学模型,我们提出了以下四个问题:问题一:挑选主要的计算“低保标准”的指标。问题二:就某一地区,根据获得的数据,给出该地区的“低保标准”。问题三:分析现行的各地(省、或县市)之间“低保标准”的相关性。问题四:利用问题三分析的结果,给出多元数学模型,并给出模型适应性验证。
关键词 :一致矩阵法,成分分析,回归分析,聚类分析
Copyright © 2019 by authors and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
低保是对低收入家庭的一种保障制度,低保问题事关困难群众衣食冷暖,事关社会的和谐稳定和公平正义,是维持困难群众基本生活权益的基础性制度安排。研究制定合理的低保标准制度能更有效地帮助老百姓摆脱贫困,提高生活质量。
基于找寻的数据,研究下面四个问题:
(1) 挑选主要计算“低保标准”的指标;
(2) 就某一地区,给出该地区“低保标准”,并给出模型分析与解释;
(3) 分析现行各地“低保标准”的相关性;
(4) 利用(3)分析的结果,给出多元数学模型,并给出模型适应性验证。
1) 假设不考虑自然灾害、金融危机等不可抗因素;
2) 假设所查阅的数据不存在误差。
符号意义:
C i :低保标准的六个指标;
y t :第t年的年低保标准的实际值;
y ^ t :第t年的年低保标准的预测值;
x 1 t :第t年居民人均消费支出;
x 2 t :第t年该地区财政收入;
α 0 :参数;
β i :参数;
y :年低保标准的实际值;
y ^ :年低保标准的预测值;
x i :影响低保标准的六个变量。
由于建立低保制度是以地方人民政府为主,实行属地管理,低保标准要由县以上各级地方政府自行制定和公布执行。因此,就必须考虑各地的物价情况及政府的财政状况 [
我们希望在这六项指标中,寻找出影响“低保标准”的主要指标和次要指标。
由于影响因素较多,想要通过某种方式计算不同指标的权重,根据权重选择出主要因素和次要因素。
在确定各因素之间的权重时,如果只是定性的结果,常常不为人所接受,运用Saaty等人提出的:一致矩阵法 [
C 1 , C 2 , C 3 , C 4 , C 5 , C 6 依次表示:地区生产总值、人均消费支出、一般公共预算社会保障和就业支出、居民消费价格指数、商品零售价格指数、政府财政收入。所构造的成对比较矩阵如下:
A = [ 1 1 / 5 1 / 2 2 2 1 / 3 5 1 3 6 6 2 2 1 / 3 1 3 3 1 / 2 1 / 2 1 / 6 1 / 3 1 1 1 / 4 1 / 2 1 / 6 1 / 3 1 1 1 / 4 3 1 / 2 2 4 4 1 ]
利用MATLAB对模型进行编程和求解,得到地区生产总值、人均消费支出、一般公共预算社会保障和就业支出、居民消费价格指数、商品零售价格指数、政府财政收入的权重为0.0906,0.4060,0.1519,0.0552,0.0552,0.2412。
成对比较矩阵的一致性指标CI = 0.0115,一致性比率CR = 0.0092 < 0.1。因此,此矩阵的一致性可以接受。
由此可见,人均消费支出、政府财政收入的权重较大,我们将其选为主要指标。
在构造成对比较矩阵是,标度虽有统一标准,但标度的选择仍然具有较大的主观性,而且城市和农村的消费水平、生活方式、生活来源存在较大差异,该模型并未体现出农村与城市的区别之处,因此所求出的权重仅能大概反映出指标的重要程度。我们希望能够运用大量的客观数据,通过一定方式求解出各个指标的权重。
我们通过查阅中华人民共和国民政部官网和《中国统计年鉴2017》 [
我们利用SPSS实现了主成分分析,并获得了如下结果:
地区 | 年低保标准 (元) | 地区生产总值 (亿元) | 城市居民人均 消费支出(元) | 公共预算社会保障 就业支出(亿元) | 分地区居民 消费价格指数 | 商品零售 价格指数 | 财政收入 (亿元) |
---|---|---|---|---|---|---|---|
北京 | 9600.0 | 25,669.1 | 38,255.5 | 6406.8 | 101.4 | 98.1 | 5081.3 |
天津 | 9135.0 | 17,885.4 | 28,344.6 | 3699.4 | 102.1 | 100.5 | 2723.5 |
河北 | 5846.0 | 32,070.5 | 19,105.9 | 6049.5 | 101.5 | 101.1 | 2849.9 |
山西 | 5157.1 | 13,050.4 | 16,992.8 | 3428.9 | 101.1 | 100.5 | 1557.0 |
内蒙古 | 6379.1 | 18,128.1 | 22,744.5 | 4512.7 | 101.2 | 100.6 | 2016.4 |
辽宁 | 6071.6 | 22,246.9 | 24,995.9 | 4577.5 | 101.5 | 101.0 | 2200.5 |
吉林 | 5015.9 | 14,776.8 | 19,166.4 | 3586.1 | 101.5 | 101.4 | 1263.8 |
黑龙江 | 6251.4 | 15,386.1 | 18,145.2 | 4227.3 | 101.2 | 101.1 | 1148.4 |
上海 | 10,290.0 | 28,178.7 | 39,856.8 | 6918.9 | 103.2 | 100.8 | 6406.1 |
江苏 | 7116.8 | 77,388.3 | 26,432.9 | 9982.0 | 102.4 | 100.7 | 8121.2 |
浙江 | 7942.3 | 47,251.4 | 30,067.7 | 6974.3 | 102.0 | 101.0 | 5302.0 |
安徽 | 5759.1 | 24,407.6 | 19,606.2 | 5523.0 | 101.8 | 100.9 | 2672.8 |
福建 | 6091.2 | 28,810.6 | 25,005.5 | 4275.4 | 101.8 | 100.7 | 2654.8 |
江西 | 5764.9 | 18,499.0 | 17,695.6 | 4617.4 | 102.0 | 100.5 | 2151.5 |
山东 | 5796.4 | 68,024.5 | 21,495.3 | 8755.2 | 102.2 | 101.4 | 5860.2 |
河南 | 5035.1 | 40,471.8 | 18,087.8 | 7453.7 | 101.9 | 100.3 | 3153.5 |
湖北 | 5705.4 | 32,665.4 | 20,040.0 | 6423.0 | 102.1 | 100.7 | 3102.1 |
湖南 | 4958.2 | 31,551.4 | 21,420.0 | 6339.2 | 101.9 | 101.0 | 2697.9 |
广东 | 6561.7 | 80,854.9 | 28,613.3 | 13,446.1 | 102.4 | 100.8 | 10,390.4 |
广西 | 5081.5 | 18,317.6 | 17,268.5 | 4441.7 | 101.6 | 100.4 | 1556.3 |
海南 | 5575.4 | 4053.2 | 19,015.5 | 1376.5 | 102.9 | 100.8 | 637.5 |
重庆 | 5204.7 | 17,740.6 | 21,030.9 | 4001.8 | 101.8 | 101.3 | 2227.9 |
四川 | 4742.5 | 32,934.5 | 20,659.8 | 8008.9 | 102.0 | 100.8 | 3388.9 |
贵州 | 5878.5 | 11,776.7 | 19,201.7 | 4262.4 | 101.5 | 100.3 | 1561.3 |
云南 | 5058.0 | 14,788.4 | 18,622.4 | 5018.9 | 101.4 | 100.6 | 1812.3 |
西藏 | 7705.8 | 1151.4 | 19,440.5 | 1588.0 | 102.6 | 102.1 | 156.0 |
陕西 | 5669.7 | 19,399.6 | 19,368.9 | 4389.4 | 101.3 | 100.3 | 1834.0 |
甘肃 | 4824.5 | 7200.4 | 19,539.2 | 3150.0 | 101.2 | 100.8 | 787.0 |
青海 | 4773.6 | 2572.5 | 20,853.2 | 1524.8 | 101.8 | 100.2 | 238.5 |
宁夏 | 4727.2 | 3168.6 | 20,364.2 | 1254.5 | 101.6 | 100.7 | 387.7 |
新疆 | 4398.9 | 9649.7 | 21,228.5 | 4138.3 | 101.4 | 100.5 | 1299.0 |
表1. 城市低保标准及各项指标
地区 | 年低保标准 (元) | 地区生产总值 (亿元) | 农村居民人均 消费支出(元) | 公共预算社会 保障就业支出(亿元) | 分地区居民 消费价格指数 | 商品零售 价格指数 | 财政收入 (元) |
---|---|---|---|---|---|---|---|
北京 | 9600.0 | 25,669.1 | 17,329.0 | 6406.8 | 5081.3 | ||
天津 | 8506.1 | 17,885.4 | 15,912.1 | 3699.4 | 2723.5 |
河北 | 3223.7 | 32,070.5 | 9798.3 | 6049.5 | 101.5 | 101.3 | 2849.9 |
---|---|---|---|---|---|---|---|
山西 | 2994.6 | 13,050.4 | 8028.8 | 3428.9 | 101.1 | 100.4 | 1557.0 |
内蒙古 | 4110.3 | 18,128.1 | 11,462.6 | 4512.7 | 101.1 | 100.4 | 2016.4 |
辽宁 | 3708.6 | 22,246.9 | 9953.1 | 4577.5 | 101.8 | 100.9 | 2200.5 |
吉林 | 2978.8 | 14,776.8 | 9521.4 | 3586.1 | 101.9 | 100.8 | 1263.8 |
黑龙江 | 3644.3 | 15,386.1 | 9423.8 | 4227.3 | 102.1 | 101.3 | 1148.4 |
上海 | 10,200.0 | 28,178.7 | 17,070.8 | 6918.9 | 6406.1 | ||
江苏 | 6204.1 | 77,388.3 | 14,428.2 | 9982.0 | 101.8 | 101.3 | 8121.2 |
浙江 | 7017.2 | 47,251.4 | 17,358.9 | 6974.3 | 101.8 | 101.0 | 5302.0 |
安徽 | 3571.4 | 24,407.6 | 10,287.3 | 5523.0 | 101.6 | 100.8 | 2672.8 |
福建 | 3765.9 | 28,810.6 | 12,910.8 | 4275.4 | 101.5 | 101.0 | 2654.8 |
江西 | 3328.6 | 18,499.0 | 9128.3 | 4617.4 | 101.9 | 100.8 | 2151.5 |
山东 | 3596.7 | 68,024.5 | 9518.9 | 8755.2 | 101.8 | 101.0 | 5860.2 |
河南 | 3015.3 | 40,471.8 | 8586.6 | 7453.7 | 102.0 | 100.3 | 3153.5 |
湖北 | 3624.6 | 32,665.4 | 10,938.3 | 6423.0 | 102.2 | 100.9 | 3102.1 |
湖南 | 2912.6 | 31,551.4 | 10,629.9 | 6339.2 | 101.9 | 101.1 | 2697.9 |
广东 | 4971.6 | 80,854.9 | 12,414.8 | 13,446.1 | 102.0 | 101.0 | 10,390.4 |
广西 | 2729.0 | 18,317.6 | 8351.2 | 4441.7 | 101.7 | 100.3 | 1556.3 |
海南 | 4146.3 | 4053.2 | 8921.2 | 1376.5 | 102.5 | 102.3 | 637.5 |
重庆 | 3125.3 | 17,740.6 | 9954.4 | 4001.8 | 2227.9 | ||
四川 | 2803.6 | 32,934.5 | 10,191.6 | 8008.9 | 101.7 | 100.9 | 3388.9 |
贵州 | 3029.1 | 11,776.7 | 7533.3 | 4262.4 | 101.1 | 100.0 | 1561.3 |
云南 | 2518.0 | 14,788.4 | 7330.5 | 5018.9 | 101.7 | 101.2 | 1812.3 |
西藏 | 2543.6 | 1151.4 | 6070.3 | 1588.0 | 102.5 | 102.2 | 156.0 |
陕西 | 2887.0 | 19,399.6 | 8567.7 | 4389.4 | 101.2 | 100.7 | 1834.0 |
甘肃 | 2815.8 | 7200.4 | 7487.0 | 3150.0 | 101.5 | 101.0 | 787.0 |
青海 | 2889.2 | 2572.5 | 9222.2 | 1524.8 | 101.8 | 101.5 | 238.5 |
宁夏 | 2983.2 | 3168.6 | 9138.4 | 1254.5 | 101.2 | 100.0 | 387.7 |
新疆 | 2660.2 | 9649.7 | 8277.0 | 4138.3 | 101.3 | 100.5 | 1299.0 |
表2. 农村低保标准及各项指标
由相关矩阵可以看出,无论是城市还是农村,都提取出了两个主成份,分别是居民人均消费支出和
年低保标准 | 地区生产总值 | 城市居民人 均消费支出 | 公共预算社会 保障就业支出 | 居民消费 价格指数 | 商品零售价格指数 | 财政收入 | |
---|---|---|---|---|---|---|---|
年低保标准 | 1 | 0.218 | 0.842 | 0.228 | 0.446 | −0.232 | 0.477 |
地区生产总值 | 0.218 | 1 | 0.351 | 0.937 | 0.342 | 0.046 | 0.918 |
城市居民人均消费支出 | 0.842 | 0.351 | 1 | 0.392 | 0.392 | −0.383 | 0.634 |
公共预算社 会保障就业支出 | 0.228 | 0.937 | 0.392 | 1 | 0.280 | −0.066 | 0.924 |
居民消费价格指数 | 0.446 | 0.342 | 0.392 | 0.28 | 1 | 0.283 | 0.447 |
---|---|---|---|---|---|---|---|
商品零售价格指数 | −0.232 | 0.046 | −0.383 | −0.066 | 0.283 | 1 | −0.114 |
财政收入 | 0.477 | 0.918 | 0.634 | 0.924 | 0.447 | −0.114 | 1 |
表3. (城市)相关矩阵
成份 | ||||
---|---|---|---|---|
1 | 2 | |||
年低保标准 | 0.652 | −0.608 | ||
地区生产总值 | 0.841 | 0.465 | ||
城市居民人均消费支出 | 0.764 | −0.571 | ||
公共预算社会保障就业支出 | 0.848 | 0.393 | ||
分地区居民消费价格指数 | 0.556 | 0.072 | ||
商品零售价格指数 | −0.153 | 0.661 | ||
财政收入 | 0.967 | 0.175 | ||
提取方法:主成份。 a已提取了2个成份。 | ||||
表4. (城市)成份矩阵a
年低保标准 | 地区生产总值 | 城市居民人均 消费支出 | 公共预算社会 保障就业支出 | 居民消费 价格指数 | 商品零售 价格指数 | 财政收入 | |
---|---|---|---|---|---|---|---|
年低保标准 | 1 | 0.303 | 0.890 | 0.501 | 0.164 | 0.165 | 0.683 |
地区生产总值 | 0.303 | 1 | 0.489 | 0.650 | −0.050 | −0.282 | 0.519 |
城市居民人均消费支出 | 0.890 | 0.489 | 1 | 0.535 | 0.044 | 0.028 | 0.656 |
公共预算社会保障就业支出 | 0.501 | 0.650 | 0.535 | 1 | 0.110 | −0.093 | 0.945 |
居民消费价格指数 | 0.164 | −0.050 | 0.044 | 0.110 | 1 | 0.732 | 0.130 |
商品零售价格指数 | 0.165 | −0.282 | −0.028 | −0.093 | 0.732 | 1 | 0.007 |
财政收入 | 0.683 | 0.519 | 0.656 | 0.945 | 0.130 | 0.007 | 1 |
表5. (农村)相关矩阵
成份 | ||||
---|---|---|---|---|
1 | 2 | |||
年低保标准 | 0.821 | 0.211 | ||
地区生产总值 | 0.681 | −0.350 | ||
农村居民人均消费支出 | 0.855 | 0.035 | ||
公共预算社会保障就业支出 | 0.876 | −0.105 | ||
分地区居民消费价格指数 | 0.140 | 0.877 | ||
商品零售价格指数 | −0.002 | 0.942 | ||
财政收入 | 0.924 | 0.007 | ||
提取方法:主成份。 a已提取了2个成份。 | ||||
表6. (农村)成份矩阵a
财政收入,和一致矩阵法一致。因此,选定居民人均消费支出和财政收入作为主要的计算“低保标准”的指标。
据题目要求,选定吉林省为研究地区,收集了该地区连续9年的年平均低保标准 [
表7的数据是以时间为序的,由于城市居民人均消费支出和该地区的财政收入等变量与时间有一定的联系,同一变量的不同时间的值之间会出现相关性。该题不再采用用普通的回归模型,考虑自相关性,建立新的回归模型。
年份序号 | 年份 | 年低保标准/千元 | 城市居民人均消费支出/千元 | 财政收入/千亿元 |
---|---|---|---|---|
1 | 2008 | 1.8002 | 9.7291 | 0.4228 |
2 | 2009 | 2.0123 | 10.9144 | 0.4871 |
3 | 2010 | 2.5815 | 11.6791 | 0.6024 |
4 | 2011 | 2.5627 | 13.0106 | 0.8501 |
5 | 2012 | 3.3659 | 14.6135 | 1.0143 |
6 | 2013 | 3.7151 | 15.9407 | 1.1570 |
7 | 2014 | 4.1459 | 17.1561 | 1.2034 |
8 | 2015 | 4.5630 | 17.9726 | 1.2294 |
9 | 2016 | 5.0159 | 19.1664 | 1.2638 |
表7. 吉林省城市年低保标准与城市居民人均消费支出及该地区财政收入数据
将2008年到2016年分别编号为1~9,计该地区第t年的年低保标准为 y t ,城市居民人均消费支出为 x 1 t ,财政收入为 x 2 t , t = 1 , 2 , ⋯ , n 。
随着城市居民人均消费支出的增加,年低保标准增大,两者存在线性关系,财政收入与年低保标准的关系类似,因此建立多元线性回归模型:
y t = β 0 + β 1 x 1 t + β 2 x 2 t + ε t (1)
根据表7的数据,对模型(1)利用MATLAB求解,得到的回归系数估计值及其置信区间(置信水平 α = 0.05 )、检验统计量 R 2 ,F,p, s 2 的结果见表8。
代入(1)得到:
参数 | 参数估计值 | 参数置信区间 |
---|---|---|
β 0 | −2.1448 | [−3.0806, −1.2090] |
β 1 | 0.4445 | [0.2889, 0.6001] |
β 2 | −1.0692 | [−2.6150, 0.4766] |
R 2 = 0.9895 , F = 283.7485 , p < 0.0000 , s 2 = 0.0181 |
表8. 模型(1)的计算结果
y ^ t = − 2.1448 + 0.4445 x 1 t − 1.0692 x 2 t (2)
残差 e t = y t − y ^ t 见表9。
t | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
e t | −0.8316 | −1.2151 | −1.1092 | −1.9847 | −2.0695 |
t | 6 | 7 | 8 | 9 | |
e t | −2.4628 | −2.6218 | −2.5954 | −2.7100 |
表9. 模型(2)的残差et
下面考虑 ε t 的自相关性,考虑如下模型:
y t = β 0 + β 1 x 1 t + β 2 x 2 t + ε t , ε t = ρ ε t − 1 + u t (3)
ρ 是自相关系数, | ρ | ≤ 1 , u t 相互独立且服从均值为零的正态分布, t = 1 , 2 , ⋯ , n .
下面进行Durbin-Watson检验,根据模型(2)得到的残差计算DW统计量:
D W = ∑ t = 2 n ( e t − e t − 1 ) 2 ∑ t = 2 n e t 2 (4)
化简得:
D W = 2 ( 1 − ∑ t = 2 n e t e t − 1 ∑ t = 2 n e t 2 ) (5)
而 ∑ t = 2 n e t e t − 1 ∑ t = 2 n e t 2 是自相关系数 ρ 的估计值 ρ ^ ,所以:
D W ≈ 2 ( 1 − ρ ^ ) (6)
经计算得到 D W = 0.205 ,查DW分布表知检验结果存在自相关,采用模型(3),计算得:
ρ ^ = 1 − D W 2 = 0.8975 (7)
做变换:
y t * = y t − ρ y t , x i t * = x i t − ρ x i , t − 1 , t = 1 , 2 (8)
模型(3)化为:
y t * = β 0 * + β 1 * x 1 t * + β 2 * x 2 t * + u t , β 0 * = β 0 ( 1 − ρ ) (9)
比较 d u 和 d l 之后可以认为随机误差存在自相关,将(7)的值代入(8)做变换,得到变换后的 x 1 t * , x 2 t * , y t * 数据如表10。
利用表10估计模型(9)的参数,得到的结果见表11。
将模型(9)中的 x 1 t * , x 2 t * , y t * 还原为原始变量 x 1 t , x 2 t , y t 得到的结果为:
y ^ t = − 0.0102 + 0.8975 y t − 1 + + 0.3932 x 1 t − 0.3528 x 1 , t − 1 − 1.5132 x 2 t + 1.3581 x 2 , t − 1 (10)
结果预测与分析,将模型(10),模型(2)的计算值 y ^ t 与实际数据 y t 比较,见表12,可以发现模型(10)在偏差内更适合求解城市低保标准。
t | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|
x 1 t * | 2.1850 | 1.8862 | 2.5315 | 2.9397 | 2.8287 | 2.8533 | 2.5793 | 3.0405 |
x 2 t * | 0.1077 | 0.1654 | 0.3096 | 0.2515 | 0.2469 | 0.1653 | 0.1496 | 0.1607 |
y t * | 0.397092 | 0.775937 | 0.246409 | 1.066503 | 0.695061 | 0.812593 | 0.843085 | 0.921701 |
表10. 变换后的数据
参数 | 参数估计值 | 参数置信区间 |
---|---|---|
β 0 * | −0.0102 | [−1.7040, 1.6837] |
β 1 * | 0.3932 | [−0.2786, 1.0649] |
β 2 * | −1.5132 | [−5.4969, 2.4705] |
R 2 = 0.3373 , F = 1.2727 , p < 0.3575 , s 2 = 0.0685 |
表11. 模型(9)的参数估计
t | y t (实际数据) | y ^ t (模型(2)) | y ^ t (模型(10)) |
---|---|---|---|
1 | 1.8002 | 2.6318 | |
2 | 2.0123 | 3.2274 | 2.3008 |
3 | 2.5815 | 3.6907 | 2.2864 |
4 | 2.5627 | 4.5473 | 2.8327 |
5 | 3.3659 | 5.4353 | 3.0642 |
6 | 3.7151 | 6.1779 | 3.7482 |
7 | 4.1459 | 6.7677 | 4.1947 |
8 | 4.5630 | 7.1584 | 4.4973 |
9 | 5.0159 | 7.7259 | 5.0361 |
表12. 模型(10)、模型(2)的计算值 y ^ t
对于农村问题的研究,初步和城市问题建立相似的模型来研究,农村的变量是否有自相关性由数据来判断。如表13是吉林省农村年低保标准与城市居民人均消费支出及该地区财政收入数据 [
将2008年到2016年分别编号为1~9,记该地区第t年的年低保标准为 y t ,城市居民人均消费支出为 x 1 t ,财政收入为 x 2 t , t = 1 , 2 , ⋯ , n ( = 20 ) 。
建立多元线性回归模型:
y t = β 0 + β 1 x 1 t + β 2 x 2 t + ε t (11)
根据表13的数据,对模型(1)利用MATLAB求解,得到的回归系数估计值及其置信区间(置信水平 α = 0.05 )、检验统计量 R 2 ,F,p, s 2 的结果见表14。
将参数估值代入(11)得到:
y ^ t = − 0.4637 + 0.3667 x 1 t − 0.1466 x 2 t (12)
残差 e t = y t − y ^ t 作为随机误差 ε t 的估计值,判断 ε t 的自相关性,模型(12)的残差如表15。
为研究对 ε t 的自相关性,考虑如下模型:
年份 序号 | 年份 | 年低保标准/千元 | 农村居民人均消费支出/千元 | 财政收入/千亿元 |
---|---|---|---|---|
1 | 2008 | 0.5438 | 3.4432 | 0.4228 |
2 | 2009 | 0.8133 | 3.9029 | 0.4871 |
3 | 2010 | 1.2961 | 4.1474 | 0.6024 |
4 | 2011 | 1.4291 | 5.3058 | 0.8501 |
5 | 2012 | 1.6655 | 6.1862 | 1.0143 |
6 | 2013 | 1.9340 | 7.3797 | 1.1570 |
7 | 2014 | 2.2514 | 8.1398 | 1.2034 |
8 | 2015 | 2.5403 | 8.7833 | 1.2294 |
9 | 2016 | 2.9788 | 9.5214 | 1.2638 |
表13. 吉林省农村年低保标准与农村居民人均消费支出及该地区财政收入数据
参数 | 参数估计值 | 参数置信区间 |
---|---|---|
β 0 | −0.4637 | [−0.9356, 0.0083] |
β 1 | 0.3667 | [0.0827, 0.6506] |
β 2 | −0.1466 | [−2.0552, 1.7621] |
R 2 = 0.9596 , F = 71.2453 , p < 0.0001 , s 2 = 0.0341 |
表14. 模型(11)的计算结果
t | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
e t | −0.1931 | −0.0827 | 0.3273 | 0.0718 | 0.0094 |
t | 6 | 7 | 8 | 9 | |
e t | −0.1388 | −0.0934 | −0.0366 | 0.1363 |
表15. 模型(12)的残差 e t
y t = β 0 + β 1 x 1 t + + β 2 x 2 t + ε t , ε t = ρ ε t − 1 + u t (13)
ρ 是自相关系数, | ρ | ≤ 1 , u t 相互独立且服从均值为零的正态分布, t = 1 , 2 , ⋯ , n 。
下面进行Durbin-Watson检验,根据模型(12)得到的残差计算DW统计量:
D W = ∑ t = 2 n ( e t − e t − 1 ) 2 ∑ t = 2 n e t 2 (14)
化简得:
D W = 2 ( 1 − ∑ t = 2 n e t e t − 1 ∑ t = 2 n e t 2 ) (15)
而 ∑ t = 2 n e t e t − 1 ∑ t = 2 n e t 2 是自相关系数 ρ 的估计值 ρ ^ ,因此:
D W ≈ 2 ( 1 − ρ ^ ) (16)
计算得到 D W = 1.910146 ,经查DW分布表知检验结果不存在自相关,即适合农村的低保标准的模型就是简单的线性回归模型(12)。
结果预测与分析,将模型(12)的计算值 y ^ t 与实际数据 y t 比较,见表16,可以发现模型(12)在偏差内比较适合吉林省农村的低保标准。
t | y t (实际数据) | y ^ t (模型(12)) |
---|---|---|
1 | 0.5438 | 0.7369 |
2 | 0.8133 | 0.8961 |
3 | 1.2961 | 0.9688 |
4 | 1.4291 | 1.3573 |
5 | 1.6655 | 1.6561 |
6 | 1.9340 | 2.0728 |
7 | 2.2514 | 2.3447 |
8 | 2.5403 | 2.5769 |
9 | 2.9788 | 2.8425 |
表16. 模型(12)的计算值 y ^ t
通过第一题的计算,我们筛选出了计算各地“低保标准”的主要指标,第三题我们选择利用聚类分析方法 [
比较题目中要求分析现行各地之间的“低保标准”的相关性,我们选择我们首先选择根据只根据低保标准的数目对全国36个省份和直辖市进行比较,并用EXCEL编程做出相应热图1,图2。
由于某些省份的低保标准数目集中,我们指定的区间并不能完全展现出各省的特征,所以选择以“低保标准”、问题一求出的主要指标(“居民人均消费支出”和“公共预算支出”)以及低保标准和两者的比值,把农村和城市作为一项影响因素,重点分析各省域之间的区别,把全国省份之间的差异问题更加突出,运用聚类分析模型,对全国各省份和直辖市进行分类。
我们可以把全国31个省域划分为四个大类,见表17。
按照不同类别,把全国低保标准的热图绘制出来,见图3。
1) 类别一
类别一所属省市都是经济发达地区。城市低保平均标准和居民消费水平在全国处于领先位置,但低保标准占人均消费水平的百分比农村和城市的差距过大,可见,低保标准制定并未能与所在城市人均可支配收入同步增长,未能充分发挥低保救助工作的作用。
图1. 全国城市低保标准分布
图2. 全国农村低保标准热图
图3. 全国低保标准热图
类别 | 地区 |
---|---|
类别一 | 北京、上海、天津 |
类别二 | 浙江、广东、江苏 |
类别三 | 西藏 |
类别四 | 宁夏、湖北、安徽、福建、辽宁、海南、内蒙古、青海、四川、重庆、湖南、 河南、新疆、甘肃、吉林、黑龙江、江西、山西、陕西、广西、贵州、云南 |
表17. 全国31个省域的分类
2) 类别二
此类经济发达地区所属省域城市低保标准基本都与经济富裕程度相符。
3) 类别三
西藏地区人均可支配收入属于全国最后梯队,但受中央财政支撑,低保标准实施表现较突出,城市低保平均标准、支出水平相对较高。
4) 类别四
第四类地区属于经济不是特别发达的地区,财政收收入较少,而贫困人口多,因此低保平均标准较低,对于这样的经济不发达地区,中央财政就是低保制度的主要财政支柱,理应加大对低保工作的支持力度。
据题目要求,利用问题的结果建立多元数学模型,使验证其适应性。由问题三可知,不论哪种模型分析的结果都与地理位置有很大的因素,所以本题把增加地理位置作为一个新的变量,增加城市或农村作为一个新的变量,建立一个统一的制定低保标准的回归模型。利用问题三聚类分析的结果作为该题区分地理位置变量的依据。该题选取2016年数据进行研究建模,用2015年数据对适应性进行验证。
定义变量,y表示低保标准, x 1 表示区域发展情况,因为聚类分布是依据各省的城市和农村的低保标准把全国化为四个类别,所以该题表示属于不同类别的具体指标是由该类别的城市和农村的低保标准求平均来近似。
x 1 = { 9.56 , 类 别 一 ; 6.64 , 类 别 二 ; 5.12 , 类 别 三 ; 4.31 , 类 别 四 . x 2 = { 1 , 城 市 ; 0 , 农 村 . x 4 = { 0 , 城 市 ; 1 , 农 村 .
x 3 表示城市居民人均消费, x 5 表示农村居民人均消费, x 6 表示该地区财政收入。
建立回归模型:
y = α 0 + α 1 x 1 + α 2 x 2 x 3 + α 3 x 4 x 5 + α 4 x 6 (17)
根据表18的数据,对模型(1)直接利用MATLAB统计工具箱求解,得到的回归系数估计值及其置信区间(置信水平 α = 0.05 )、检验统计量 R 2 ,F,p, s 2 的结果见表19。
模型(17)的参数估计见表20。
将数值代入(17)得到:
y ^ = − 0.9474 + 0.6373 x 1 + 0.1710 x 2 x 3 + 0.1994 x 4 x 5 − 0.0615 x 6 (18)
结果预测与分析,将模型(17)的2016年计算值 y ^ 与实际数据 y 比较,比较数据见表21,可以发现模型(17)在偏差内比较适合各省的低保标准。
地区 | 城市年低保标准/元 | 农村年低保标准/元 | 城市低保与消费支出比值 | 农村低保与消费支出比值 |
---|---|---|---|---|
北京 | 9600 | 9600.00 | 0.25 | 0.55 |
天津 | 9135 | 8506.06 | 0.32 | 0.53 |
上海 | 10,290 | 10,200.00 | 0.25 | 0.59 |
表18. 北京、天津、上海各项数据
地区 | 城市年低保标准/ 千元 | 农村年低保标准/ 千元 | 城市居民人均消费支出/ 千元 | 农村居民人均消费支出/ 千元 | 财政收入/ 千万元 |
---|---|---|---|---|---|
北京 | 9.6000 | 9.6000 | 38.2555 | 17.3290 | 5.0813 |
天津 | 9.1350 | 8.5061 | 28.3446 | 15.9121 | 2.7235 |
上海 | 10.2900 | 10.2000 | 39.8568 | 17.0708 | 6.4061 |
江苏 | 7.1168 | 6.2041 | 26.4329 | 14.4282 | 8.1212 |
浙江 | 7.9423 | 7.0172 | 30.0677 | 17.3589 | 5.3020 |
广东 | 6.5617 | 4.9716 | 28.6133 | 12.4148 | 10.3904 |
西藏 | 7.7058 | 2.5436 | 19.4405 | 6.0703 | 0.1560 |
海南 | 5.5754 | 4.1463 | 19.0155 | 8.9212 | 0.6375 |
内蒙古 | 6.3791 | 4.1103 | 22.7445 | 11.4626 | 2.0164 |
湖北 | 5.7054 | 3.6246 | 20.0400 | 10.9383 | 3.1021 |
宁夏 | 4.7272 | 2.9832 | 20.3642 | 9.1384 | 0.3877 |
山东 | 5.7964 | 3.5967 | 21.4953 | 9.5189 | 5.8602 |
安徽 | 5.7591 | 3.5714 | 19.6062 | 10.2873 | 2.6728 |
福建 | 6.0912 | 3.7659 | 25.0055 | 12.9108 | 2.6548 |
辽宁 | 6.0716 | 3.7086 | 24.9959 | 9.9531 | 2.2005 |
青海 | 4.7736 | 2.8892 | 20.8532 | 9.2222 | 0.2385 |
新疆 | 4.3989 | 2.6602 | 21.2285 | 8.2770 | 1.2990 |
重庆 | 5.2047 | 3.1253 | 21.0309 | 9.9544 | 2.2279 |
河南 | 5.0351 | 3.0153 | 18.0878 | 8.5866 | 3.1535 |
吉林 | 5.0159 | 2.9788 | 19.1664 | 9.5214 | 1.2638 |
四川 | 4.7425 | 2.8036 | 20.6598 | 10.1916 | 3.3889 |
湖南 | 4.9582 | 2.9126 | 21.4200 | 10.6299 | 2.6979 |
甘肃 | 4.8245 | 2.8158 | 19.5392 | 7.4870 | 0.7870 |
黑龙江 | 6.2514 | 3.6443 | 18.1452 | 9.4238 | 1.1484 |
山西 | 5.1571 | 2.9946 | 16.9928 | 8.0288 | 1.5570 |
江西 | 5.7649 | 3.3286 | 17.6956 | 9.1283 | 2.1515 |
河北 | 5.8460 | 3.2237 | 19.1059 | 9.7983 | 2.8499 |
广西 | 5.0815 | 2.7290 | 17.2685 | 8.3512 | 1.5563 |
贵州 | 5.8785 | 3.0291 | 19.2017 | 7.5333 | 1.5613 |
---|---|---|---|---|---|
陕西 | 5.6697 | 2.8870 | 19.3689 | 8.5677 | 1.8340 |
云南 | 5.0580 | 2.5180 | 18.6224 | 7.3305 | 1.8123 |
表19. 全国31个省域各项数据
参数 | 参数估计值 | 参数置信区间 |
---|---|---|
α 0 | −0.9474 | [−1.7745, −0.1204] |
α 1 | 0.6373 | [0.4021, 0.8725] |
α 2 | 0.1710 | [0.1003, 0.2416] |
α 3 | 0.1994 | [0.0511, 0.3476] |
α 4 | −0.0615 | [−0.1731, 0.0500] |
R 2 = 0.8644 , F = 90857 , p < 0.0000 , s 2 = 0.6030 |
表20. 模型(17)的计算结果
城市低保标准 | 农村低保标准 | |||||
---|---|---|---|---|---|---|
地区 | 2016实际值/千元 | 2016预测值/千元 | 2016残差 | 2016实际值/千元 | 2016预测值/千元 | 2016残差 |
北京 | 9.6000 | 11.3713 | −1.7713 | 9.6000 | 8.2850 | 1.3150 |
天津 | 9.1350 | 9.8246 | −0.6896 | 8.5061 | 8.1506 | 0.3555 |
上海 | 10.2900 | 11.5667 | −1.2767 | 10.2000 | 8.1551 | 2.0449 |
江苏 | 7.1168 | 7.3020 | −0.1853 | 6.2041 | 5.6590 | 0.5451 |
浙江 | 7.9423 | 8.0998 | −0.1575 | 7.0172 | 6.4196 | 0.5976 |
广东 | 6.5617 | 7.5381 | −0.9764 | 4.9716 | 5.1208 | −0.1492 |
西藏 | 7.7058 | 5.6333 | 2.0725 | 2.5436 | 3.5194 | −0.9758 |
海南 | 5.5754 | 5.0111 | 0.5642 | 4.1463 | 3.5383 | 0.6079 |
内蒙古 | 6.3791 | 5.5647 | 0.8144 | 4.1103 | 3.9610 | 0.1493 |
湖北 | 5.7054 | 5.0354 | 0.6700 | 3.6246 | 3.7897 | −0.1651 |
宁夏 | 4.7272 | 5.2578 | −0.5306 | 2.9832 | 3.5977 | −0.6146 |
山东 | 5.7964 | 5.1147 | 0.6817 | 3.5967 | 3.3370 | 0.2597 |
安徽 | 5.7591 | 4.9877 | 0.7715 | 3.5714 | 3.6863 | −0.1149 |
福建 | 6.0912 | 5.9120 | 0.1792 | 3.7659 | 4.2105 | −0.4446 |
辽宁 | 6.0716 | 5.9383 | 0.1333 | 3.7086 | 3.6487 | 0.0599 |
青海 | 4.7736 | 5.3506 | −0.5770 | 2.8892 | 3.6236 | −0.7344 |
新疆 | 4.3989 | 5.3496 | −0.9507 | 2.6602 | 3.3699 | −0.7097 |
重庆 | 5.2047 | 5.2586 | −0.0540 | 3.1253 | 3.6472 | −0.5219 |
河南 | 5.0351 | 4.6984 | 0.3366 | 3.0153 | 3.3176 | −0.3023 |
吉林 | 5.0159 | 4.9991 | 0.0168 | 2.9788 | 3.6202 | −0.6414 |
四川 | 4.7425 | 5.1238 | −0.3813 | 2.8036 | 3.6231 | −0.8195 |
湖南 | 4.9582 | 5.2963 | −0.3380 | 2.9126 | 3.7531 | −0.8405 |
甘肃 | 4.8245 | 5.0922 | −0.2677 | 2.8158 | 3.2439 | −0.4281 |
---|---|---|---|---|---|---|
黑龙江 | 6.2514 | 4.8316 | 1.4198 | 3.6443 | 3.6078 | 0.0365 |
山西 | 5.1571 | 4.6094 | 0.5477 | 2.9946 | 3.3045 | −0.3100 |
江西 | 5.7649 | 4.6930 | 1.0719 | 3.3286 | 3.4872 | −0.1586 |
河北 | 5.8460 | 4.8912 | 0.9548 | 3.2237 | 3.5779 | −0.3542 |
广西 | 5.0815 | 4.6566 | 0.4249 | 2.7290 | 3.3689 | −0.6399 |
贵州 | 5.8785 | 4.9868 | 0.8916 | 3.0291 | 3.2055 | −0.1764 |
陕西 | 5.6697 | 4.9987 | 0.6710 | 2.8870 | 3.3950 | −0.5080 |
云南 | 5.0580 | 4.8723 | 0.1856 | 2.5180 | 3.1496 | −0.6316 |
表21. 2016年低保标准的实际值、预测值和残差
利用模型(17)分析2015年数据,得到结果如表22,发现全国各省的低保标准在一定误差范围内可以使用模型(17)。
城市低保标准 | 农村低保标准 | |||||
---|---|---|---|---|---|---|
地区 | 2015实际值/千元 | 2015预测值/千元 | 2015残差 | 2015实际值/千元 | 2015预测值/千元 | 2015残差 |
北京 | 8.50875 | 11.4079 | −2.89915 | 8.48488 | 7.846756 | 0.638124 |
天津 | 8.265 | 9.630433 | −1.36543 | 7.11485 | 7.635913 | −0.52106 |
上海 | 9.24 | 11.46297 | −2.22297 | 8.94 | 7.740618 | 1.199382 |
江苏 | 6.70032 | 7.550658 | −0.85034 | 6.01967 | 5.426817 | 0.592853 |
浙江 | 7.25001 | 8.185354 | −0.93534 | 6.46947 | 5.83725 | 0.63222 |
广东 | 5.94156 | 7.674372 | −1.73281 | 4.71015 | 5.066469 | −0.35632 |
西藏 | 6.94821 | 5.229316 | 1.718894 | 3.48125 | 3.136413 | 0.344837 |
海南 | 4.93851 | 4.953345 | −0.01483 | 4.00029 | 2.763032 | 1.237258 |
内蒙古 | 6.03495 | 5.540245 | 0.494706 | 4.3925 | 3.436473 | 0.956027 |
湖北 | 5.23509 | 4.910417 | 0.324673 | 3.57817 | 3.005786 | 0.572384 |
宁夏 | 4.11366 | 5.04561 | −0.93195 | 2.91281 | 2.621421 | 0.291389 |
山东 | 5.55981 | 5.194363 | 0.365447 | 3.76684 | 2.858051 | 0.908789 |
安徽 | 5.39148 | 4.746292 | 0.645189 | 3.66421 | 2.626262 | 1.037948 |
福建 | 5.30148 | 5.821317 | −0.51984 | 3.71098 | 3.781698 | −0.07072 |
辽宁 | 5.6883 | 5.485559 | 0.202741 | 3.98685 | 3.160763 | 0.826087 |
青海 | 4.37778 | 5.082666 | −0.70489 | 2.90694 | 3.168348 | −0.26141 |
新疆 | 4.10247 | 5.119277 | −1.01681 | 2.65257 | 3.020362 | −0.36779 |
重庆 | 4.61328 | 5.175296 | −0.56202 | 3.21293 | 3.165046 | 0.047884 |
河南 | 4.18746 | 4.732748 | −0.54529 | 2.59156 | 2.707742 | −0.11618 |
吉林 | 4.56303 | 4.872678 | −0.30965 | 3.06321 | 3.139999 | −0.07679 |
四川 | 4.24164 | 5.095696 | −0.85406 | 2.78887 | 3.102529 | −0.31366 |
湖南 | 4.27827 | 5.134102 | −0.85583 | 2.87274 | 3.222903 | −0.35016 |
甘肃 | 4.41681 | 4.783467 | −0.36666 | 3.00094 | 2.909387 | 0.091553 |
---|---|---|---|---|---|---|
黑龙江 | 5.73825 | 4.732372 | 1.005878 | 3.90603 | 3.146883 | 0.759147 |
山西 | 4.83975 | 4.504344 | 0.335406 | 3.19367 | 2.946964 | 0.246706 |
江西 | 5.41818 | 4.660501 | 0.757679 | 3.57248 | 2.960715 | 0.611765 |
河北 | 5.24874 | 4.806672 | 0.442068 | 3.26915 | 3.190449 | 0.078701 |
广西 | 4.3275 | 4.590288 | −0.26279 | 2.76093 | 2.784698 | −0.02377 |
贵州 | 5.15049 | 4.691691 | 0.458799 | 3.11221 | 2.690905 | 0.421305 |
陕西 | 5.04849 | 4.95669 | 0.0918 | 3.12543 | 3.04464 | 0.08079 |
云南 | 4.59555 | 4.821788 | −0.22624 | 2.85295 | 2.769753 | 0.083197 |
表22. 2015年低保标准的实际值、预测值和残差
优点:
1) 本文建立的模型与实际生活紧密相连,对各省低保标准和主要指标进行建模,其结果与实际相符。对民政部门,统计部门都具有很高的参考价值。
2) 模型建立的模型依据的数据来自《中国统计年鉴》以及中国民政部所给出的数据,使得模型的可信度较高。
3) 模型具有一定创新性和灵活性,对各省的情况都符合。
缺点:
1) 对省份的分类不够细致,在实际中应用会有一定误差。
2) 成对比较矩阵,可以实现权重计算,但由于其标度的选择具有较大的主观性,且无法体现出城市与农村“低保”指标的差异性,因此所得出的结果不够具有说服力。
3) 问题二中在针对吉林省研究该地区的低保标准时,由于官网上找不到大量年份的低保标准,所以在研究此问题时的数据量不够大,无法深层次地再研究2016年以前低保标准的适应性。
奚 源,于岱卉,郭慧婷. “低保标准”的数学模型建立 The Establishment of Mathematical Model of “Subsistence Allowance Standard”[J]. 统计学与应用, 2019, 08(02): 303-319. https://doi.org/10.12677/SA.2019.82035