Statistics and Application
Vol.06 No.02(2017), Article ID:21110,9 pages
10.12677/SA.2017.62019

Most Probable Distribution and the Gini Coefficient of Income of Residents in City and Town

Guofeng Gu, Guoning Tang

College of Physics Science and Technology, Guangxi Normal University, Guilin Guangxi

Received: Jun. 3rd, 2017; accepted: Jun. 18th, 2017; published: Jun. 26th, 2017

ABSTRACT

This paper analyzes the relation between Gini coefficient and the income proportion between capital income and disposable income. An ideal hypothesis of the disposable income of residents in city and town of China is proposed. The most probable distribution, median and Gini coefficient of the disposable income of the residents are theoretically obtained based on the hypothesis. The results show that when the income proportion between capital income and disposable income is larger than or equal to 0.12, the Gini coefficient increases linearly with the income proportion. The Gini coefficient increases approximately 0.007 for each increase of 0.01 in income proportion. Moreover, the median and Gini coefficient obtained from most probable distribution almost match with the sampling survey results because the difference between theoretical results and sampling results is less than one percent.

Keywords:Disposable Income, Most Probable Distribution, Gini Coefficient, Median, Income Proportion

城镇居民收入的最可几分布及其基尼系数

顾国锋,唐国宁

广西师范大学物理科学与技术学院,广西 桂林

收稿日期:2017年6月3日;录用日期:2017年6月18日;发布日期:2017年6月26日

摘 要

本文研究城镇居民收入基尼系数与城镇居民资本收入占可支配收入的比例之间的数值关系。对城镇居民可支配收入分布状态提出理想化假设,从理论上导出城镇居民可支配收入的最可几分布;由城镇居民可支配收入的最可几分布导出其对应的中位数和基尼系数。研究结果表明:当城镇居民资本收入占可支配收入的比例大于0.12时,其基尼系数几乎随收入比例线性增加,收入比例每增加0.01,基尼系数约增加0.007。由最可几分布得到的中位数和基尼系数与抽样调查结果基本吻合,因为两者之差小于1%。

关键词 :可支配收入,最可几分布,基尼系数,中位数,收入比例

Copyright © 2017 by authors and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

1. 引言

近年来,我国居民收入的两极分化现象引起人们高度关注,反映两极分化程度的基尼系数较大,也引来很多争议。一些研究机构根据宏观经济数据推算得到的基尼系数,与国家统计局通过城镇居民收入抽样调查得到的基尼系数不一致。有经济学者认为 [1] ,一些高收入人员有很多灰色收入,这是人们调查不到的,通过居民收入抽样调查得到的数据真实性存疑;另外,现有的理论分布函数 [2] [3] ,无论如何选择其中的参数,所得的结果与实际分布都有较大的差距,无法反映居民收入实际分布的“胖尾现象”(即在高收入区间,实际分布的数值比理论分布的数值大得较多)。经济学界普遍认为 [4] [5] [6] ,我国城镇居民收入基尼系数较大的主要原因是资本收入占可支配收入的比例过大。基尼系数G与资本收入占可支配收入的比例K的具体数值关系,有待进一步研究。

本文用统计物理学方法 [7] ,分别对城镇居民的劳动收入(工资性收入加转移性收入)和资本收入(经营性净收入加财产性收入)的分布状态提出理想化假设,分别导出其各自的最可几分布和可支配收入(劳动收入加资本收入)的最可几分布,并由可支配收入的最可几分布导出基尼系数G与资本收入占可支配收入比率K的数值关系。最后将最可几分布导出的结果与抽样调查的结果作比较,说明我们所得结论的正确性。

2. 城镇居民可支配收入的最可几分布

本文假设居民收入有两种不同的来源,一种是劳动收入,另一种是资本收入。这两种收入不但在数量上差异巨大,而且其背后的动力学机制不同。一个人劳动收入的多少,主要由其所从事的行业、个人的地位与能力、以及其劳动的时间及强度等诸多因素决定。就整体而言,假设存在一个劳动收入的三维连续相空间。一个人资本收入的多少,主要由其资本投资额决定。一般来说,投资额越大,投资收入就越多。就整体而言,假设存在一个资本收入的一维连续相空间。因此,投资收入的最可几分布与劳动收入的最可几分布不同。

假设主要靠劳动获得收入的居民人数为N,全体劳动居民总收入为E,个人劳动收入为的相格数(档次)为,人数为,劳动收入分布系统的微观态数为:

(1-1)

其控制条件为:

(1-2)

现采用求条件极值的拉格朗日乘子法求取极大值时的分布,即最可几分布。对引入参量、对引入参量,则有:

(1-3)

利用斯特林公式:,对式(1-1)取自然对数得:

(1-4)

对式(1-2)、式(1-4)求关于一级变分得:

(1-5)

(1-6)

将式(1-5)、式(1-6)代入式(1-3)得:

(1-7)

由于是自变量,要(1-7)式恒成立,须,由此可得劳动收入分布系统的最可几分布:

(1-8)

在三维情况下,收入处于区间的相格数为,相应的人数为:

(1-9)

式中是相格的大小,令,由归一化条件

(1-10)

可得,劳动收入的最可几概率密度函数:

(1-11)

劳动收入的平均值为:

(1-12)

同理,假设主要靠资本获得收入的居民人数为M,资本总收入为F,个人资本收入为的相格数为,人数为,资本收入分布系统的微观态数为:

(1-13)

其控制条件为:

(1-14)

引入参量、对引入参量,可得资本收入分布系统的最可几分布:

(1-15)

收入处于区间的相格数为:,相应的人数为:

(1-16)

式中是相格的大小。由于靠资本获得收入的居民有最小的收入起点,设该起点为,假设其大于或者等于劳动收入的平均值,即:。由归一化条件:

(1-17)

可得,资本收入的最可几概率密度函数:

(1-18)

资本收入的平均值为:

(1-19)

假设城镇居民的总人数为,其中可支配收入处于区间的人数为,城镇居民可支配收入的最可几概率密度函数:

,

即:

(1-20)

式中的分别为主要靠劳动收入的人数、主要靠投资收入的人数占总人数的比例。式(1-20)同样满足归一化条件:

(1-21)

由式(1-20)可得城镇居民可支配收入的平均值为:

(1-22)

如果资本收入占可支配收入的比例为K,由式(1-12)和式(1-19)得:

,得到最可几分布的参数为:

(1-23)

(1-24)

3. 城镇居民可支配收入中位数与基尼系数

可支配收入中位数是将人数按收入由低到高排列,达到一半时,居民可支配收入的数值。中位数一般比平均值小一些。由于灰色收入一般只存在于高收入人群中,因此对于抽样调查的结果,中位数比平均值更能反映收入分布的实际情况。设可支配收入中位数为,则有:

(2-1)

将式(1-20)代入式(2-1)积分并整理得:

(2-2)

基尼系数是反映收入分布偏离平均分布的参数,具体定义为 [8] :

(2-3)

式(2-3)中为个人财富在这部分人数与总人数之比,这部分人所拥有的财富占总财富的比率为,即:

, ,

(2-4)

时,

(2-5)

时,令,则有:

(2-6)

将式(2-5)、式(2-6)代入式(2-4)积分得:

(2-7)

式(2-7)中的

(2-8)

总之,如果可支配收入的平均值、资本收入占可支配收入的比例K已知,主要靠劳动收入的人数占总人数的比例、主要靠资本获得收入的居民收入起点、主要靠资本收入的人数占总人数的比例也已知,则由式(1-23)、式(1-24)可以算出最可几分布的参数,由式(2-2)算出中位数,由式(2-8)算出,代入式(2-7)算出S,再代入式(2-3)便可以算出基尼系数G了。

4. 数值计算结果

为了显示基尼系数G随资本收入比例K变化的数值关系,本文取城镇居民年人均可支配收入(万元)进行数值计算。当时(等同于计划经济时期,居民既无经营性收入也无财产性收入),,代入式(1-12)计算得:,代入式(2-7)计算得:,代入式(2-3)计算得基尼系数:;当时,且在满足的条件下适当选择参数,代入上述有关公式计算得到的基尼系数为:;当取时,代入上述有关公式计算得到的基尼系数如表1图1。从表1图1可以看出,当城镇居民资本收入占可支配收入的比例时,基尼系数G几乎随K线性增加,K每增加0.01,基尼系数约增加0.007。

5. 实证研究

根据国家统计局网站公布的数据,2011年我国城镇居民人均可支配收入21,810元,其中人均工资性收入15,412元,人均转移性收入3539元,人均经营净收入2210元,人均财产性收入649元,人均可支

Table 1. Gini coefficient with income proportion

表1. 基尼系数随资本收入比例变化的数值关系表

Figure 1. Gini coefficient with income proportion

图1. 基尼系数随资本收入比例变化的数值关系图

配收入中位数为19,118元。按照本文的计算方法,取,由上述数据得到。代入上述有关公式计算得:,人均可支配收入中位数,与实际的19118元相差103元,相对差异约为0.54%;城镇居民收入的基尼系数,与王小鲁1根据国家统计局的2011年城镇居民分组数据计算得到的基尼系数的相对差异约为0.25%。图2是最可几概率密度函数与抽样调查得到的概率密度函数对照图象,其中的实线是将上述参数代入式(1-20)计算得到的图象,星号代表抽样调查得到的分组数据经处理后得到的概率密度函数值图示。从图中可以看出,尽管实际的抽样分布在一些小范围内与最可几分布略有差异,但其整体的变化关系与最可几分布基本相同。因此,用最可几分布计算得到的中位数、基尼系数与抽样分布的计算结果基本相同。

Figure 2. Comparison of most probable distribution and the sampling survey results, the star is the sampling survey results, and the curved line is theoretical results

图2. 最可几分布函数与抽样分布函数对照图,星号为调查结果,曲线为理论结果

然而,国家统计局通过抽样调查得到的上述数据,不可能包含一部分高收入人群的灰色收入。而灰色收入是客观存在的,而且数量不少。因此,上述各种数据并未反映实际情况。根据王小鲁 [1] 的调查和判断,2011年我国居民的灰色收入总量约为6.2万亿元,如果其中95%发生在城镇,则2011年我国城镇居民的灰色收入总量约为5.89万亿元。到2011年底,我国城镇居民的总数约为69,079万人,2011年我国城镇居民平均灰色收入约为8526元。由于灰色收入主要为高收入人群所有,而且基本属于非劳动收入,因此,上述各项数据调整为:

,,

, ,, ,

,城镇居民收入的基尼系数,与王小鲁在《城镇居民收入分配状况调查报告》中提供的按家庭分布的基尼系数的相对差异约为0.73%,与按人口分布的基尼系数的相对差异约为0.28%。

由以上的分析与计算可知,只要知道居民收入(包含灰色收入)的总量以及资本收入占可支配收入的比例,便可以用最可几分布估算出基尼系数。估算结果与实际结果的差异不大。减小基尼系数、消除两极分化的出路主要有两条:一是完善各种分配制度,反对腐败,尽量减少灰色收入;另一是减小资本收入占可支配收入的比率,提高基层劳动者的工资收入。只要腐败现象得到有效遏制、资本收入占可支配收入的比例在合理区间内,基尼系数就在合理区间内,将不会产生明显的两极分化现象。

基金项目

本文研究受到国家自然科学基金(11565005)的资助。

文章引用

顾国锋,唐国宁. 城镇居民收入的最可几分布及其基尼系数
Most Probable Distribution and the Gini Coefficient of Income of Residents in City and Town[J]. 统计学与应用, 2017, 06(02): 165-173. http://dx.doi.org/10.12677/SA.2017.62019

参考文献 (References)

  1. 1. 王小鲁. 收入的真相[J]. 党政论坛(干部文摘), 2013(11): 12.

  2. 2. Reed, W.J. (2003) The Pareto Law of Income—An Explanation and an Extension. Physica A, 319, 579-597.

  3. 3. Reed, W.J. (2004) On Pareto’s Law and the Determinants of Pareto Exponents. Journal of Income Distribution, 13, 7- 17.

  4. 4. 丁为民. 皮凯蒂曲线: 两极分化、资本趋势与解决方案[J]. 马克思主义研究, 2015(3): 79-90.

  5. 5. 孙秋鹏. 财富与收入分配的理论与政策[J]. 当代经济研究, 2014(4): 92-95.

  6. 6. 孙乘叔. 再论《21世纪资本论》的当代意义[J]. 党政干部学刊, 2005(10).

  7. 7. 翁甲强. 热力学与统计物理学基础[M]. 桂林: 广西师范大学出版社, 2008: 141-144.

  8. 8. 王亚峰. 中国1985-2009年城乡居民收入分布的估计[J]. 数量经济技术经济研究, 2012(6): 61-73.

  9. NOTES

    1http://news.ifeng.com/gundong/detail_2012_01/18/12048141_0.shtml?_from_ralated

期刊菜单