面对我国目前快速增长的房价,研究影响房地产价格的因素具有重要意义。本文收集我国大陆在2015年的31个省级行政区的横截面数据,考虑影响房地产价格的多个变量,建立多元线性回归OLS定量分析,并进行LM,White,BP,DW等一系列检验以及利用WLS方法来消除克服异方差。利用Eviews,R等统计软件进行逐步回归,并且引入虚拟变量来考虑我国东、中、西部不同地区之间的房价差异。 It is of great significance for us to study the factors that affect the price of real estate in the face of the rapidly increasing housing price in China. This paper collected the cross-section data of 31 provincial level administrative regions in mainland China in 2015. It used multiple variables that influence the real estate price to establish multiple linear regression models. There is a series of testing, such as LM, White, BP, DW and use of the WLS method to eliminate and overcome hete-roscedasticity. The paper used Eviews, R and other statistical softwares to gradually return, and introduce the virtual variables to consider the differences between the east, middle and western regions of China.
卢丽煌
云南财经大学统计与数学学院,云南 昆明
收稿日期:2017年8月1日;录用日期:2017年8月15日;发布日期:2017年8月21日
面对我国目前快速增长的房价,研究影响房地产价格的因素具有重要意义。本文收集我国大陆在2015年的31个省级行政区的横截面数据,考虑影响房地产价格的多个变量,建立多元线性回归OLS定量分析,并进行LM,White,BP,DW等一系列检验以及利用WLS方法来消除克服异方差。利用Eviews,R等统计软件进行逐步回归,并且引入虚拟变量来考虑我国东、中、西部不同地区之间的房价差异。
关键词 :房价,截面数据,虚拟变量
Copyright © 2017 by author and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
房地产业是国民经济的基础产业和支柱产业,对我国的经济发展有着举足轻重的作用。1998年对城镇实施住房制度改革后,我国房价保持了一段时间的相对稳定,然而自2004年来随着经济的发展,城镇化也逐步完善,我国的房价也在经历着快速的增长,并且还伴随着明显的区域不平衡。房价的增长一方面拉动了GDP的增长以及提高了人民的生活水平,另一方面却带来了一系列的问题,对整个社会的安定和谐产生负面影响,并且不利于我国的宏观经济健康持续发展。房地产市场过热,引起了社会各界的极大关注,我国对房地产的深化改革也不断地提上日程,政府逐步加强对我国房地产市场的调控,才能使得我国在2008年金融危机中,房地产产业保持相对稳定的增长,大大减弱次贷危机所带来的冲击。房价的变动能够清晰地反映房地产市场的冷暖供需状况,具有“晴雨表”的功能:若市场发展过热,供不应求,房价大幅度上涨;若市场发展萎靡,供过于求,房价大幅度下跌。房价问题不仅是一个关系国计民生的重大问题,而且影响着其他市场的健康发展,关系着我国经济的发展,因此研究房价的波动特征,影响房价的主要因素,分析房价运行规律,成为迫在眉睫的研究重点。
国内学者对影响我国房价的因素从各个方面进行研究,主要集中在以下两个方面:一是经济基本面与房价的关系,二是非经济基本面与房价的关系。对经济基本面与房价的关系研究的文献主要包括国民收入、利率、人口密度、通货膨胀率、失业率、市场供需以及建设成本等经济基本面因素。桑田(2012)基于南京市1994年第三季度至2012年第二季度的数据,利用向量自回归模型和格兰杰因果检验模型对影响房地产价格的因素进行研究以及实证分析,指出基本面及其预期是影响房价的主要因素,固定资产、居民收入、成本和建设价格对该市的房价影响较小 [
非经济面主要关注政府出台的各种政策,在房地产市场的政策调控方面,周京奎(2005) [
通过对国内相关文献的综述,近年来国内学者对住宅房地产价格的影响因素虽然进行了广泛的研究,但由于理论研究中的模型和方法还有待完善,在如何构建住宅房地产价格模型来定量分析住宅房地产价格变动的影响因素、如何确定各影响因素对住宅房地产价格变动的影响程度、如何有科学依据地制定调控房价的政策等问题上,结论还不一致。
所谓横截面数据,就是在给定时点对个人、家庭、企业、城市、州、国家或者一系列其他单位采集样本所构成的数据集。有时,所有单位的数据并非完全对应于同一时间段。
多元线性回归模型(multiple linear regression model)在总体中可以写成:
其中,
同方差性指的是:给定任意解释变量值,误差u都具有相同的方差,即
若(2)式假设不成立,即对于x不同的值,u的方差不同,那么扰动项就是异方差。OLS估计在异方差的情况下仍然不影响无偏性和一致性,不影响
需要检验H0:
Breusch-Pagan检验,将OLS回归得到的残差估计出来,用残差的平方对所有x回归之后,就可以用
White检验能够通过加入所有解释变量的平方项和交叉项来检验异方差,通过OLS估计得到残差和拟合值,计算OLS残差的平方和拟合值的平方,同样利用F、LM统计值来检验。
加权最小二乘法(WLS)基本思想就是将存在异方差的模型转化成同方差模型。
假定
然后把(3)转化成具有同方差误差的方程,由于
回归模型的随机项
随机项序列相关,虽然所得的估计值仍然无偏,但估计值方差大小不同于真实的方差,若根据OLS回归模型用于预测,预测值将会失效。
Durbin-Waston检验也是以OLS残差为基础
为
虚拟变量又称为虚设变量、名义变量,用于反映质的属性的一个人工变量,是量化的自变量,通常取值为0或1。引入虚拟变量会使线性回归模型变得更加复杂,但对问题的描述更加简明。作用是分离异常因素,检验不同属性类型对因变量的作用,而且能够提高模型的精确度。
若模型中有截距,有m种互斥的属性类型,在模型中引入(m − 1)个虚拟变量;若没有截距,有m个特征,就设置m个虚拟变量。
本文收集我国大陆在2015年(目前最新)的31个省级行政区(含自治州、直辖市)的横截面数据,该数据集来着中国统计年鉴和EPS全球数据统计网。本文所应用的数据见表1。
将所有的自变量引入回归模型,模型如下:
用普通最小二乘法估计出来的方程为:
地区 | area:北京,河北,…… 31个省级行政区 |
---|---|
被解释变量 | y:房地产价格(元/平方米) |
解释变量 | x1:本年购置土地面积(平方米) x2:本年土地成交价格(万元) x3:计划总投资(万元) x4:房屋竣工面积(平方米) x5:竣工房屋价值(万元) x6:出租屋面积(平方米) x7:固定资产投资额(亿元) x8:商品房销售额(万元) x9:国内生产总值(亿元) x10:人均国内生产总值(元) x11:总人口(万人) |
表1. 数据说明
从估计结果可以看出,有多个解释变量的t值在5%的显著性水平下不显著,而整体的可决系数较高,说明变量之间存在多重共线性。进一步验证是否存在多重共线性。
计算各解释变量之间的相关系数,它一般用字母r表示,由两个变量的样本
得到的。公式为:
关,则r接近于1(正相关)或者−1(负相关)。计算发现各自变量之间的相关系数较大,接近或者超过0.8,
因此可以认为各解释变量存在多重共线性。也可以用条件数来判断,
值(X代表自变量矩阵),当
为了克服多重共线性,用逐步回归法,可以得到表2、表3。
逐步回归法剔除一些不相关变量,剔除
修正之后的多元回归模型,
进一步对模型进行F检验,是否整体显著。
H0:
通过Wald-Test方法检验得到
从图1中,不能够清晰看出该模型是否存在异方差。Breusch-Pagan检验判定是否存在异方差。H0:不存在异方差;H1:存在异方差。通过软件运行得到
AIC | |
---|---|
所有自变量 | 443.56 |
去掉 | 441.65 |
去掉 | 440.02 |
去掉 | 439.08 |
去掉 | 438.74 |
表2. 逐步回归法AIC值
通常t统计量 | 5.75 | −5.75 | 6.84 | 2.81 | 8.58 | 2.59 | −3.38 | 2.86 |
---|---|---|---|---|---|---|---|---|
稳健t统计量 | 5.75 | −5.48 | 6.49 | 2.26 | 11.18 | 2.92 | −3.28 | 3.88 |
表3. 回归方程的t统计量
图1. 残差散点图
认为不存在异方差。
在式子(8)回归结果中得知
从回归结果可以看出,房地产价格与本年购置土地面积(
为了研究我国东、中、西部的地域性差异是否会引起房地产价格的差异,引入虚拟变量,由于地域有3种属性特征,因此引入两个虚拟变量。目前,东部省区包括11个省级行政区,分别是北京、天津、河北、辽宁、上海、江苏、浙江、福建、山东、广东、海南;中部省区包括8个省级行政区,分别是黑龙江、吉林、山西、安徽、江西、河南、湖北、湖南;西部省区包括12个省级行政区,分别是四川、重庆、贵州、云南、西藏、陕西、甘肃、青海、宁夏、新疆、广西、内蒙古。
设立引入虚拟变量的回归模型:
其中,
对模型进行回归,得到结果如下:
式(10)比式(8)的
利用加权最小二乘法(WLS)来消除异方差,设置权重w = 1/resid,得到回归方程如下:
从回归结果可以看出各系数的t值均大于5%显著性水平,并且
从回归结果看,非虚拟变量的系数符合经济意义。如上述解释大概一致,现在解释虚拟变量的系数含义。
本文在查阅了国内外的相关文献之后,通过2015年31个省(自治区)的横截面数据做了定量分析,建立多元线性回归,并逐步剔除自变量,通过一系列的异方差检验、序列相关检验等,得出最终的回归模型。从最后的模型结果来看,影响房价的因素是多方面的,其中土地开发面积对房价的影响是负向的,即供给越大,房价越低。固定资产投资额和计划总投资额越大,房地产市场的发展前景越好,从而进一
通常t统计量 | 7.65 | −6.43 | 8.26 | 2.55 | 10.56 | 2.81 | −4.27 | 1.99 | 2.42 | −1.75 |
---|---|---|---|---|---|---|---|---|---|---|
稳健t统计量 | 7.17 | −5.97 | 5.59 | 2.56 | 14.71 | 2.84 | −4.51 | 1.97 | 2.11 | −2.14 |
表4. 引入虚拟变量的回归模型t值
步促进房价的上涨。GDP和人均GDP的变大,意味着人民生活水平提高,对物质生活的要求也加强,进而对房子的需求加大。高昂的房价让越来越多的年轻人望而却步,转向租房,随着对租房面积的扩大,间接也推动了房价的上涨。后面引入虚拟变量研究我国东、中、西部房价的差异,发现由于我国地域的不同,各个区域的经济发展水平也相差甚多。对于东部沿海城市比较发达,经济发展迅速这一情况,中、西部的年轻人就会往发展好的地方去工作、定居,加剧了住房紧张,土地资源短缺,房价蹭蹭上涨的形势。而中部特别是西部相对落后地区,由于交通闭塞,经济发展缓慢,生活节奏慢,所以房价也相对增长的比较缓慢。本文模型在逐步回归的时候将总人口数剔除,有点不合适,通常人口密度越大对房子的需求就越大,同样也会推动房价的变动,除此,回归模型的拟合度将近1,说明拟合比较成功。
本文主要对影响房价的因素做定量分析,而像货币政策和财政政策作为我国宏观调控的主要经济手段,对房地产市场的调控起到了至关重要的作用,有助于为我国房地产市场创造良好的经济环境。
卢丽煌. 我国房地产价格影响因素研究The Study of the Influential Factors of China’s Real Estate Price[J]. 社会科学前沿, 2017, 06(08): 1071-1078. http://dx.doi.org/10.12677/ASS.2017.68154