Advances in Social Sciences
Vol.04 No.02(2015), Article ID:15597,8 pages
10.12677/ASS.2015.42014

Cross Random Effects Model Analysis for Residents’ Income Influence Factor

—Data from Kunming

Huizhi Jia, Lei An, Lei Xu

Yunnan University of Finance and Economics, Kunming Yunnan

Email: jiahuizhi0117@163.com

Received: Jun. 10th, 2015; accepted: Jun. 23rd, 2015; published: Jun. 30th, 2015

Copyright © 2015 by authors and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

ABSTRACT

Based on Family STEP Investigation which was carried out in Kunming by World Bank in 2012, this paper using Multilevel Crossed Random Effects Model analyzes the influence of character, education and gender on residents’ income under the cross background of family and occupation. Evidence indicates that educational background has positive effect on personal income and highly educated people have higher income. At the same time, vocational high school graduates have higher income than ordinary high school graduates. Training, foreign language and open character have positive effect on personal income and working-year has negative effect on personal income. At last, according to the result, some suggestions are put forward in the paper.

Keywords:Crossed Random Effect Model, Occupation Background, Family Background, Resident Income

居民收入影响因素的交叉随机效应模型分析

—以云南省昆明市居民为例

贾慧芝,安 蕾,许 磊

云南财经大学,云南 昆明

Email: jiahuizhi0117@163.com

收稿日期:2015年6月10日;录用日期:2015年6月23日;发布日期:2015年6月30日

摘 要

基于世界银行2012年STEP住户调查数据,运用交叉随机效应模型,分析了在家庭和职业的交叉背景下,学历、个人性格、性别等对居民月收入的影响,并得出相应结论。结果表明,教育对居民的收入有正向影响,随着学历的提高,收入也会增加,而且职业高中比普通高中毕业的人收入更多;接受培训、外语水平、性格开放性等均对月收入有正向的促进作用;工作年限对月收入的影响非常小,甚至为负。最后,根据结论提出相关政策建议。

关键词 :交叉随机效应模型,职业背景,家庭背景,居民收入

1. 研究背景及意义

云南省是中国较为落后的省份之一,但是在过去的十年中其发展十分迅速,除2014年GDP增长率为8.1%外,年度GDP增长率均在10%以上,如何能让其保持现在或者更高速的发展,是云南省各级政府都在苦苦思索的问题。经济发展是为了提高人们的生活水平,使居民的收入更高。

关于居民收入的问题,已有众多文献从各方面进行了研究,专门研究学历和收入之间关系的成果很多,如李实、李文彬(1994) [1] 的研究表明,中国城镇居民中随着教育文凭等级即受教育年限的增加,教育收益率也相对提高;同时,后续褚建芳、王伯庆和恩斯特·史君多福(1995) [2] ,李实、丁赛(2003) [3] ,王云多(2009) [4] ,岳昌君(2004) [5] 等众多学者也对中国不同教育水平对居民收入的影响作了相关研究。除教育水平外,性别、家庭背景、工作类型等方面对于居民的收入也同样有着非常重要的影响,对于该方面的研究有:谢周亮(2010) [6] 基于2005年中国社会调查数据研究了家庭背景和人力资本对个人收入的影响;王晓焘(2011) [7] 利用2004年青年发展状况全国调查数据,运用简单最小二乘法研究了城市青年中性别和独生子女对收入的影响;陈宗胜、周云波(2001) [8] 研究了文化、年龄及性别对收入的影响,结果表明,除年龄外,另外两项对收入均具有显著影响。由于在中国,城市和农村之间或者各省之间在发展速度、发展方式等方面有一定的差别,所以在研究收入影响因素中,也有很多学者也分区域进行了研究,如吴思怡、梅亚琪(2013) [9] 利用1991~2010年广西省龙胜各族自治县农村经济的统计数据对影响该地区农民收入的因素进行了研究,结果表明粮食播种面积、农业机械总动力、农业技术人员等对农民纯收入有些促进作用,而农业中间消耗则起着反向作用;李兴绪、刘曼莉(2011) [10] 基于2009年云南省红河哈尼族彝族自治州的调查数据,对影响该地农民收入的因素进行了分析,分析结果表明,农户生产性固定资产原值、生产经营投入、耕地面积、劳动力素质能对农户收入有着显著正向影响。

文章基于世界银行于2012年在云南省昆明市进行的STEP住户调查数据,用交叉随机效应模型,将个人特征同职业背景及家庭背景结合在一体化的分析模型中,从受调查者的收入的总差异中,将个人和职业及家庭的影响加以剥离和测量,并对各层的解释变量的作用进行实证检验,分别探讨各层解释变量之间的互动机制。力求对该问题进行客观、定量的研究。

2. 数据分析

2.1. 数据来源及预处理

2.1.1. 数据来源

文章基于世界银行于2012年在昆明市区开展的STEP住户调查的数据,该调查从昆明市区抽取了2025户家庭进行家庭成员及住房条件等方面的调查,并在每个家庭中抽取一名15~64岁的家庭成员,对其工作、教育、健康状况、性格等方面进行深入了解。

在所调查的2025名个体中,有778名受访者在调查期间或者之前一年内处于无工作状态,考虑到本文主要研究市民的收入影响因素,故剔除这778个样本数据。在剩余的1247个样本中,有11名受访者在填写的问卷中存在不同程度的逻辑错误和问题缺失,如:受访者目前的年龄比第一次工作时年龄小、现阶段收入缺失等,最终得到有效样本1236个。以下的所有分析均是基于这1236个样本进行的。

2.1.2. 数据预处理

根据问卷中的相关问题,对变量作如下处理处理:

1) 因变量薪资收入,在问卷中关于薪资收入的调查分为两部分,支付期(月、两周、周、天)及在上个支付期内的净收入,为了方便计算,将所有样本的收入均转化为月收入。其中,“周”和“两周”的月收入分别乘以4和2,“天”的月收入为相应的日工资乘以20。

2) 关于受访者的性格开放性、外向性、稳定性、认真程度变量,对于每个性格特征,问卷中均通过3个问题了解其具体情况,而且每个问题的答案均有4个表征等级的选项,将4个选项分别赋值1、2、3、4,将每个样本中3个相关问题相加,最终得到每个性格特征变量的变化范围在1~12之间。对于受访者的风险偏好,通过对问卷中题目赋值−1、0、1,再将题目加总而成 [11] 。

3) 对于受访者的职业,调查问卷中所采用的职业分类标准及编码是“国际职业标准分类(ISCO 08)”,且此次调查中共涉及多达111个小职业类别。而根据国家人力资源和社会保障部所制定的职业分类,全社会的就业人员共分为8个大类,故将该111个职业类别分别归入国家所公布的职业分类标准中,最终所有的受访者的工作类别集中于以下6类:国家机关、党群组织、企业、事业单位负责人;专业技术人员;办事人员和有关人员;商业、服务业人员;农林牧渔水利业生产人员;生产、运输设备操作人员及有关人员。

4) 对于表征受访者家庭的变量非常之多,本文将父母的平均受教育程度相同的受访者归为一类,即具有相同的家庭背景。父母平均受教育程度等于父母受教育程度之和除以2,父母平均受教育程度共分为11类。最终得到的变量信息如下表1所示。

每个人会由于家庭背景的不同,从而学历、性格等方面会有一定差异,最终影响个人的收入水平;同时,随着社会的发展,工作的种类越来越趋向于多样化,而且也越来越趋向于高科技化,工作不同的人,其月收入之间亦会又很大差异。为了更真实及客观的研究学历、培训、性格因素等对市民月收入的影响,本文将运用交叉随机效应模型对其进行分析,研究在家庭和职业的交叉背景下,上表所示的自变量对月收入的影响。

2.2. 随机效应模型

在一些经济社会问题的研究中,经常要涉及分层或者多层数据结构问题,这种数据结构的特点是一个层级的数据往往嵌套在另一层中 [12] [13] 。而常规的统计分析仅仅对单一分析单位进行处理,展开变量之间关系的研究。此分析的重要假定是各案例之间均完全独立,但通常这些案例均隶属于不同的组群,而不同组群之内的案例之间相互影响,并不独立,且往往存在很强的同质性,即组内相关。而各组群之间往往又存在一定的差别。故当常规回归应用于分层数据模型中时,其关于案例之间相互独立的假定就会被违反,最终得到的统计结果便会出现偏差,并且所有统计检验均丧失其有效性。

分层线性模型是一种具有普适性的新统计模型,其是针对传统统计技术在处理多层结构数据所存在的局限性,及可能产生的对分析结果的曲解而提出的。在本文中,由于相同家庭背景或职业背景下的受访者有一定的同质性,而不同家庭或职业背景的人之间又存在一定的差别;同时,即使家庭背景相同的

Table 1. The definition and statistical description of the variables

表1. 变量的定义及其统计描述

人其职业也不一定相同,即“家庭”和“职业”是交叉在一起的。所以本文将建立在家庭和职业背景交叉下的随机效应模型 [14] 。

2.2.1. 零模型

零模型是多层线性模型的基础,是指各层方程中都不设自变量的模型,它注重区别个体差异和背景差异之间的比较,不考虑各层自变量对因变量的影响。通过零模型,可以将受访者之间月收入差异的总方差分解到个人和职业与家庭背景中,通过观察两层随机方差各占总方差的比例,就可以确定分层分析的必要性。其模型形式为:

其中,为表示受访者月收入的列向量,为表示固定效应部分的列向量,为随机效应部分,其中为第一层次的残差项,为背景层次的残差项。

用R软件运行零模型,结果如下(表2表3)。

组内相关系数越大,说明影响个人收入差异的总方差中,层–2的背景方差所占的比例越大。

分别建立以家庭、职业、家庭 × 职业为背景的随机效应模型,如表2所显示,三个模型的固定效应的参数估计值均十分显著;表3显示了模型中随机效应的分析结果:以家庭和职业为背景的模型中,组

Table 2. The result of fixed effect analysis for Null Model

表2. 零模型固定效应分析结果

Table 3. The result of random effect analysis for Null Model

表3. 零模型随机效应分析结果

内相关系数分别为0.0882和0.1363,即组间差异分别占总差异的8.82%和13.63%,表明不同家庭背景和职业背景的受访者之间是有一定差异的,当以家庭和职业的交叉效应作为层二背景时,组间差异占总差异的13.12%。

零模型表明个人的月收入均受家庭的职业的影响,所以有必要对该问题进行分层线性模型分析。以下将以家庭和职业的交叉作用作为层二背景进行建模,分析教育水平、性格等因素对个人月收入的影响。

2.2.2. 模型分析

表1中显示了从世界银行STEP住户调查调查的问卷中筛选出的与个人月收入相关的变量,实际上,其中只有部分变量对个人的月收入又显著影响,而另一些则没有。所以下面将建立模型对变量进行筛选。

首先建立方差分析模型,研究哪些自变量会受家庭背景和职业的显著影响。由于本文主要研究个人学历和性格对月收入的影响,而且根据前人的研究,个人的学历和性格往往会受家庭的影响,而且职业对其也会有一定影响,所以在下面的方差分析模型中主要研究家庭和职业的交互作用是否会对个人学历和性格有显著影响。

表4所示:在显著性水平为0.1时,“普通初中”、“普通高中”、“职业高中”、“情绪稳定性”受家庭和职业交互作用影响显著,其余变量并不显著。所以总体来看,受教育水平受这家庭和职业影响相对显著,而性格相对并不显著。

一般认为,家庭环境和职业背景会决定一个人的性格,但方差分析的结果却表明家庭和职业对个人的性格影响并不显著。决定子女性格的家庭和职业方面的因素往往是父母的性格、居住场所、同事性格、公司文化等,而文中仅以父母平均受教育程度和职业类型作为代表难免有些不全面,所以方差分析的结果并不显著。

受家庭和职业影响显著的自变量,其系数为随机系数,即模型中有该变量对于月收入的残差项,而其余自变量的系数为固定系数。先将表征学历的变量设为随机变量,建立的模型,然后将模型中统计结果不显著的变量删除,不断的修改和完善模型,直到各变量均统计显著。初步模型和最终模型如下:

Table 4. The result of variance analysis of family and occupation interaction

表4. 家庭和职业交互影响的方差分析结果

初步模型:

最终模型:

关于交叉随机效应模型与两层、三层甚至多层的随机效应模型不同,普通分层模型是一层嵌套于另一层的,而交叉随机效应模型中两层相互交叉在一起。因为很多估计方法都被局限于嵌套的随机效应模型中,在交叉模型的估计中,按照(Goldstein,1987) [15] 所介绍的诀窍,将一个随机效应模型表示为一个带有大量随机效应的层及模型,首先引入一个虚拟层次,家庭和职业都嵌套于这个层次中,如昆明市,我们称其为第三层次,在第三层单元中的受访者,只能隶属于该单元中的中学和小学(不能在第三层单元之间有交叉) [16] 。

初步模型和最终模型运行结果(表5表6)。

表6所示,总体来看,AIC和BIC信息准则的结果均显示最终模型优于初步模型。表5显示了模型中变量的参数估计和参数的显著性检验结果,最终模型中部分变量的参数估计值比较显著,也有一些变量的参数估计值并不十分显著,不显著的变量大多表征受访者的学历,由于文章主要研究其对个人月收入的影响,故不宜将其删除,所以总体来看该模型可以采纳。

2.2.3. 模型结果分析

表5所显示的结果来看,在相同职业相同家庭背景的情况下:

1) 男性的月收入要比女性多5.46%,一般女性结婚后大部分精力都要投入于家庭,不能完全的投入到工作中,男性则仍会以工作为重,这就造成了在许多领域女性并没有男性有竞争力,从而收入也没有男性多,即使在新时代的今天,“女主内,男主外”的思想仍然贯穿在大部分家庭中。

2) 工作年限每增加1年,收入要减少0.21%,这似乎与传统的认识不符,事实上,随着时代的发展,

Table 5. Model test result

表5. 模型检验结果

Table 6. The result of model comparison

表6. 模型比较结果

许多行业中,收入已经不仅仅和工作年限相关,更多的是需要个人的能力和水平,年轻人有活力、敢创新,在各行各业中都表现出超强的竞争力。

3) 在义务教育阶段,即小学毕业和初中毕业的个体分别比没有上过学的人平均月收入高8.65%和17.00%。即使仅仅是小学或者初中毕业,看似没有学到多少知识,事实上他们在计算、理解问题、辨别是非能力上均强于没有上过学的人。在学校期间,老师不仅会教授知识,更重要的是教会了学生思想品德方面的教育及解决事务的思维方法,所以小学毕业群体的月收入会高于没有上过学的人,而初中文凭的个体月收入会高于小学。这也就是为什么国家倡导学生必须完成基本的九年义务教育了。

4) 普通高中的教育回报率为23.65%,职业高中的教育回报率为32.85%。年龄相仿的青年从学校毕业后,职业高中的学生怀揣技能,再加上在校期间教师会灌输工作、实践、社会等方面的知识,同时自己也做好了步入社会的思想准备,毕业后相比普通高中毕业学生更适应社会,工作可归为技术型蓝领;而对于普通高中毕业后不继续深造的个体,初接触社会难免有不适应,加之自己又没有拿得出手的技能,文化课知识也仅仅是了解皮毛,而专业类知识又不懂,只能做那些对专业技能要求较低的工作,如服务员、销售员等,可替代性非常高。知识就是财富,同样技能也是财富,当职业类学校学生掌握着不可被替代的技能,而普通高中的学生只能做着几乎任何人都可以完成的工作时,十分容易被他人替代。

5) 高职、大专的教育回报率为36.16%,本科及以上文凭的个体比没有上过学的个体平均月收入高57.64%。俗话说“知识改变命运”,以上的数据确实体现了这句话,上过学的人要比没有上过学的个体平均月收入高,而且学历越高,平均月收入也会增加。高职和大专注重的是技能的培养,即理论知识只是了解,动手实操能力才是其所看重的;而本科及以上的教授理念中,相比动手实践,其更注重理论的掌握,不仅要知其然,还要知其所以然,不仅仅知道如何动手,更要了解其原理。所以同样在毕业之后,工作之初本科生或研究生在动手方面可能并不如高职大专类的学生,但随着工作的深入,由于本科生及研究生有着深厚的理论功底,其在工作的潜力和延伸性的优势会逐渐展现出来。

6) 政府部门、企业等均会不定期的组织一些与工作有关或个人技能的培训,参加过培训的人要比没有参加过培训的人平均月收入高6.35%。参加过培训能够提高工作技能、开拓视野、变换思维方式,人们在培训完后,往往将培训中的知识运用于生活和工作中,培训后的个体在许多方面优于没有参加过培训的个体,故其月收入也相对较高。

7) 一个人的性格往往受基因、父母性格、家庭居住环境等等许多方面因素的影响,性格的开放性每提高一个等级,其平均月收入也会增加4.40%。性格开放的人往往又更强的好奇心、更高的情商、更活跃的思维、更喜欢追求新事务,当代社会发展变化非常快,性格开放的人往往能够发现商机,而且在工作和生活中后年也非常善于与人沟通交流,相比性格不开放的人更适应职场。

8) 熟练掌握一门外语的人比其他人平均月工资高8.06%,这正是全球化的一种表现。全球化使得世界各国之间的交流越来越密切,也越来越深入,同时对于精通外语的人才需求也不断增加,从阅读外文文件到与国外合作伙伴交流,都需要深入的外语功底。所以,倡导学习外语,不仅有利于个人职业生涯的发展,更有助于推进我国的发展。

3. 结论及建议

1) 要加强职业教育。从昆明市的调查数据来看,如果不上大专、高职或者大学的话,职业教育的回报率高于普通教育。现在越来越多家长不管自己孩子的特长与意愿,均让自己的孩子接受普通教育,进而上大学、硕士、博士,毕业后当公务员、留任高校、当白领等,而对职业教育嗤之以鼻,甚至认为那是学习及品德特别不好的学生才会去的地方,以至于职业学校的发展越来越不景气,国家的高级蓝领也越来越缺乏。实际上,职业院校的学生由于在校期间就学习着职业技能、做着适应社会的心理准备,毕业后有着一技之长,从而更容易在社会上立足;而普通初中或高中毕业的学生,毕业后没有专业技能,走入社会后适应能力相对较弱,最终可能并没有职业学校学生发展好。所以,家长还是需要根据孩子的特长、喜好等,将孩子送入普通中学或职业中学,这不仅有利于孩子的发展,也会使我国的发展更加平衡,从而避免出现高级蓝领缺乏的现象。

2) 加强教育,提倡人们多读书,最基本的要完成9年义务教育,如果条件允许,要进入更高的学府。更重要的是,不仅要学好与工作技能相关的专业知识,更要努力学习外语,尤其是英语。

3) 政府部门和企业要多组织与工作相关或个人技能的培训。组织相关培训有助于技能水平的快速提高。

4) 要培养孩子的想象力和创造力,提高孩子的情商。在工作中,有大量的知识、高超的技能是重要的,但是人的想象力、创造力的重要性更不容忽视。

文章引用

贾慧芝,安 蕾,许 磊, (2015) 居民收入影响因素的交叉随机效应模型分析—以云南省昆明市居民为例
Cross Random Effects Model Analysis for Residents’ Income Influence Factor—Data from Kunming. 社会科学前沿,02,83-91. doi: 10.12677/ASS.2015.42014

参考文献 (References)

  1. 1. 李实, 李文彬 (1994) 中国教育投资的个人收益率的估算. In: 赵人伟, Ed., 中国居民收入分配研究, 中国社会科学出版社, 北京, 335-345.

  2. 2. 褚建芳,王伯庆,恩斯特•史君多福 (1995) 中国人力资本投资的个人收益率研究. 经济研究, 12, 55-63.

  3. 3. 李实, 丁赛 (2003) 中国城镇教育收益率的长期变动趋势. 中国社会科学, 6, 58-73.

  4. 4. 王云多 (2009) 教育水平差别对收入分配影响的实证分析. 西北人口, 4, 108-111.

  5. 5. 岳昌君 (2004) 教育对个人收入差异的影响. 经济学(季刊), 3, 135-149.

  6. 6. 谢周亮 (2010) 家庭背景、人力资本与个人收入差异. 财经科学, 5, 70-76.

  7. 7. 王晓焘 (2011) 城市在职青年的教育回报基于性别与独生子女身份的分析. 社会, 4, 158-174.

  8. 8. 陈宗胜, 周云波 (2001) 文化程度等人口特征对城镇居民收入水平及收入差别的影响——三论经济发展对收入分配的影响. 南开经济研究, 4, 38-42.

  9. 9. 吴思怡, 梅亚琪 (2013) 农民纯收入影响因素的实证分析. 安徽农业科学, 20, 8754-8755.

  10. 10. 李兴绪, 刘曼莉 (2011) 边境民族地区农户收入影响因素的实证分析——以云南红河州农户为例. 数理统计与管理, 4, 604-613.

  11. 11. 柯惠新, 黄刚, 江宇 (2007) 社会调查中二分数据的转换与解读——以《2005年中国青少年网瘾调查报告》中的数据分析为例. 数理统计与管理, 6, 958-965.

  12. 12. 张雷, 雷劈, 郭伯良 (2005) 多层线性模型应用. 教育科学出版社, 北京, 18-32.

  13. 13. Raudenbush, S.W. (2002) Hierarchical linear models: Application and data analysis methods. Sage, Thousand Oaks.

  14. 14. Goldstein, H. (1986) Multilevel mixed model analysis using iterative generalize least squares. Biometrika, 78, 43-56.

  15. 15. Goldstein, H. (1987) Multilevel covariance component models. Biometrika, 74, 430-431.

  16. 16. Skrondal, A. and Rabe-Hesketh, S., 著 (2011) 陈华珊, 谢鹏飞, 李洋, 译. 广义潜变量模型——多层次、纵贯性以及结构方程模型. 重庆大学出版社, 重庆.

期刊菜单