基于Logistic回归模型的房地产上市公司信用风险研究 Research on Credit Risk of Real Estate Listed Companies Based on Logistic Regression Model

doi:10.12677/FIN.2024.141007

Finance
Vol. 14 No. 01 ( 2024 ), Article ID: 78731 , 9 pages
10.12677/FIN.2024.141007

基于Logistic回归模型的房地产上市公司信用风险研究

杨璐菱

●How to Cite this Article

重庆电力高等专科学校人文素质学院，重庆

收稿日期：2023年10月30日；录用日期：2023年11月23日；发布日期：2024年1月8日

摘要

伴随着中国城镇化的发展，在过去二十年里，我国的房地产行业迅猛的发展。由于房地产行业的产业关联性极强，已然成为我国民经济的重要“支柱产业”之一。在此背景下，研究房地产的企业信用风险，对构建现代房地产企业管理机制，以及商业银行的风险管理有着重要的现实意义。本文搜集了2020年所有房地产上市公司的财务报表中的14个有关风险管理的财务指标，构建了房地产企业的财务信用评价指标体系。再通过因子分析法生成了对所有指标具有代表意义的4个公因子，并挑选出具有实际意义的两个公因子：即企业的“盈利能力”M₁和企业的“偿债能力”M₃。之后，选取M₁和M₃作为自变量，选取Y“企业是否为ST企业”作为因变量，建立Logistic回归模型。结果显示建立的Logistic回归模型能实际计算一个房地产企业信用风险，且一个房地产企业的盈利能力越好，其面临的信用风险就越低。最后根据输出结果提出了一些可行的实际建议，例如要关注与盈利能力相关的指标的变动，要制定相应的防范措施以避免企业出现信用风险等。

关键词

信用风险，因子分析法，Logistic回归模型

Research on Credit Risk of Real Estate Listed Companies Based on Logistic Regression Model

Luling Yang

College of Human Quality, Chongqing Electric Power College, Chongqing

Received: Oct. 30^th, 2023; accepted: Nov. 23^rd, 2023; published: Jan. 8^th, 2024

ABSTRACT

Abstract: With the development of urbanization in China, in the past 20 years, China’s real estate industry has developed rapidly. Due to the strong industrial correlation of the real estate industry, it has become one of the important “pillar industries” of our national economy. In this context, the study of real estate enterprise credit risk is of great practical significance to the construction of modern real estate enterprise management mechanism and the risk management of commercial banks. This paper collects 14 financial indicators related to risk management in the financial statements of all listed real estate companies in 2020, and constructs the financial credit evaluation index system of real estate enterprises. Then, four common factors representing all indicators are generated through factor analysis, and two common factors with practical significance are selected, namely, the “profitability” M₁ and the “solvency” M₃. After that, the Logistic regression model was established by selecting M₁ and M₃ as independent variables and Y “whether the enterprise is ST enterprise” as dependent variable. The results show that the established Logistic regression model can actually calculate the credit risk of a real estate enterprise, and the better the profitability of a real estate enterprise, the lower the credit risk it faces. Finally, according to the output results, some practical suggestions are put forward, such as paying attention to the changes of the indicators related to profitability, and formulating corresponding preventive measures to avoid the credit risk of enterprises.

Keywords:Credit Risk, Factor Analysis, Logistic Regression Model

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

二十大报告指出，必须坚持创新是第一动力，加快实施创新驱动发展战略。我国经济的高质量发展离不开实体经济和虚拟经济失衡的困境 ‎[1] 。随着中国城镇化的发展，在过去二十年里，我国的房地产行业迅猛的发展。由于房地产行业的产业关联性极强，已然成为我国民经济的重要“支柱产业”之一。在宽松的货币政策以及“去库存”的战略条件下，埋下了房地产泡沫的隐患。所以，有效的预测房地产企业的信用风险，对抑制房地产泡沫的产生有着至关重要的作用。

众所周知，房地产行业属于资本密集型产业，在众多房地产企业资金回收速度放慢，负债率高的情况下，许多企业的资金主要来源于银行贷款。在过去的几年，房地产的非理性繁荣，积聚了众多风险。对于房地产企业的信用风险研究有助于商业银行在发放贷款时进行有效的风险防范。同时，对于房地产行业的信用风险的研究，也是能保证企业利润的一个重大措施。

信用风险又称违约风险，是评价一笔债务由于某些因素遭受损失的可能性 ‎[2] ，是信用关系中债务人用以偿还债务的资产或收入来源存在巨大的不确定性。这种不确定性可能导致债务人无力偿还债务，从而引发违约事件 ‎[3] 。

对于一般企业的信用风险研究分为三个发展阶段：起初是传统的信用风险研究，最具代表性的是Altman在1968年建立了传统统计模型，通过构建判别分析对信用风险进行了研究；而我国对于企业的信用风险的研究则更多的依托于资产评估公司；这些方式虽从一定程度上提高了企业的风险防范水平，但实施过程艰难，评估结果精度较差，不利于推广使用。

随着互联网的发展，不同的学者通过建立不同的模型，能够更精确的预测企业的信用风险。王慧选取了2009年至2016年共计147家房地产上市企业的数据，通过穷举法，选用KVM模型预测了我国房地产上市企业的违约风险 ‎[4] ；李杰辉选取了房地产上市公司的14个相关财务指标，采用Logistic模型对我国房地产企业的信用风险进行了预测 ‎[5] 。Daniel C基于问题的期望最大利润和计算利润，选取了Logistic Regression和XG Boost模型，优化了竞争性信用风险评分模型 ‎[6] 。

为进一步提高信用风险的预测效果，更多的学者开始利用算法建立模型，何睿利用卷积神经网络，在构建银行间债券市场信用债知识图谱的基础上，构建了异构信息处理(R-GCN-BKG)的违约债券预测算法，其准确率可达92% ‎[7] 。

2. 研究方法和数据来源

2.1. 研究方法

2.1.1. 因子分析法

因子分析是研究相关阵或者协方差阵的内部依赖关系，它将多个变量综合为少数几个因子，以再现原始变量与因子之间的相关关系。

2.1.2. Logistic回归模型

Logistic回归模型因其简单的形式和优越的性能成为了信用风险研究中较为主流的方法。Logistic回归模型对数据的要求不严，可以不需要满足正态分布，也不需要保持自变量与因变量的线性关系。

2.2. 数据来源

本文数据来源于国泰安数据库，经过查阅资料，选择了部分能描述房地产公司信用风险的指标，最终选取了2020年我国房地产上市公司的14个财务指标。

3. 建模与分析

本文通过因子分析从14个财务指标中概括出能够解释原始变量的4个公共因子，然后根据实际意义，选择其中的2个公共因子作为建模的自变量，最后根据企业是否为ST企业(证券交易中实行“警示存在终止上市风险的特别处理”的企业，以提示该公司的股票可能有被终止上市的风险)作为因变量，建立能够描述房地产企业的风险的Logistic模型。

3.1. 指标筛选

通过因子分析筛选出能解释大部分原始变量的公因子，依据这几个对原始数据代表性较高的公因子作为自变量，结合因变量建立Logistic回归模型。

3.1.1. 碎石图

碎石图可以表示各个因子的重要程度，它将所提取的因子特征按照从大到小的顺序排列，从图中可以很直观地了解到解释变量的主要因子。

如图1所示，其中第一个和第二个因子的特征值较高，对解释原有变量的贡献最大；第三个和第四个因子的特征值较为明显，但第四个因子之后的其余因子则趋于平坦状态，所以提取前四个公因子作为解释原始变量的主要因子。

Figure 1. Scree plot

图1. 碎石图

3.1.2. 累计贡献率

累计贡献率是因子特征值之和和所有因子特征值之和的比值。代表了抽取出的因子变异对所有变量变异的解释力，也就是抽取出的因子对所有变量的代表性。累计贡献率越高，说明这个因子的能够代表原始数据的信息越多。

Table 1. Cumulative contribution statement

表1. 累计贡献率表

通过表1可以看到这四个因子对于变量的解释程度，第一个因子对变量的解释达到了37%，第二个因子对变量的解释达到了27%，第三个因子对变量的解释达到了26%，第四个因子对变量的解释仅仅只有10%。说明第一个因子和第三个因子对于原始数据的代表性较高。

3.1.3. 因子载荷矩阵

因子载荷矩阵是将特征向量归一化后得到的矩阵，表示了各因子对各变量的影响程度。

Table 2. Factor load matrix

表2. 因子载荷矩阵

Figure 2. Point diagram of factor load matrix

图2. 因子载荷矩阵点图

表2表示了因子各因子在原始变量上的载荷，图2可以更加清晰的看到因子载荷矩阵的分布。综上可以看到变量“固定资产比率”和“综合杠杆”对于任何一个变量的影响程度都很弱，说明这两个变量不具有能解释原始变量的作用，因此将其剔除。

3.1.4. 因子分析

根据因子载荷矩阵可以进一步提取出4个公共因子，以及归纳出每个因子所包含的变量，由此进行因子分析。

Figure 3. Factor analysis diagram

图3. 因子分析图

Table 3. Factor interpretation table

表3. 因子解释表

图3清晰的显示了每个因子所包含的变量，这有助于划分因子包含的不同变量。结合图3，可以总结如表3的因子解释表。根据表3可以看到四个因子的含义以及每个因子所包含的变量，根据实际意义，将第一个因子M₁命名为“盈利能力”，将第二个因子M₂命名为“每股净资产”，将第三个因子M₃命名为“偿债能力”，将第四个因子M₄命名为“产权比率”。根据每个因子所包含的解释变量，M₂和M₄这两个因子只包含了一个解释变量，不具有实际意义，所以在后续建模的过程中将其剔除。

3.1.5. 模型检验

通过卡方检验可以判断选取的房地产上市公司的财务指标是否适合建立因子分析模型，最终通过卡方检验的P值大小判断。

Table 4. Test table of factor analysis model

表4. 因子分析模型检验表

从表4可以看出模型的卡方检验结果为9.2*e²⁵，该值小于0.05，说明数据通过因子分析法进行建模是可行的。

3.1.6. 因子得分系数

因子得分系数则是用来计算每个观测值在公因子上的得分。根据各个因子的得分可以写出各个因子关于各个指标的表达式。

Table 5. Factor score coefficient table

表5. 因子得分系数表

表5为因子得分系数表，表中显示了不同因子对原始变量的解释程度，在剔除了前面的两个无关变量“固定资产比率”和“综合杠杆”以后，得到了M₁、M₂、M₃、M₄这四个公因子的因子得分系数。根据房地产上市公司各个财务指标的实际意义，在下一章节中将选择公因子M₁“盈利能力”和公因子M₃“偿债能力”进行Logistic建模，以下为M₁和M₃公因子关于房地产上市公司各个财务指标的表达式：

$\begin{matrix} M_{1} = - 0.0016 x_{1} + 0.009 x_{2} + 0.5748 x_{3} + 0.0755 x_{4} + 0.5205 x_{5} + 0.0054 x_{6} \\ + 0.0029 x_{7} - 0.0023 x_{8} + 0.0069 x_{9} + 0.0005 x_{10} + 0.0014 x_{11} + 0.0024 x_{12} \end{matrix}$

$\begin{matrix} M_{3} = 0.203 x_{1} + 0.012 x_{2} + 0.5031 x_{3} + 0.0845 x_{4} - 0.4694 x_{5} - 0.0047 x_{6} - 0.2792 x_{7} \\ + 0.1778 x_{8} - 0.4538 x_{9} + 0.1572 x_{10} - 0.0051 x_{11} + 0.0063 x_{12} \end{matrix}$

在表达式中，x₁为“资产负债率”，x₂为“净资产收益率”，x₃为“总资产收益率”，x₄为“总资产回报率”，x₅为“每股收益”，x₆为“每股净资产”，x₇为“流动比率”，x₈为“产权比率”，x₉为“速动比率”，x₁₀为“流动负债率”，x₁₁为“营业毛利率”，x₁₂为“销售净利率”。

3.2. 建立Logistic回归模型

根据上述因子分析的结果，从房地产上市公司中的14个原始财务指标进行提取了其中2个具有代表性的公共因子，分别命是M₁“盈利能力”和M₃“偿债能力”。在建立的Logistic回归模型中，Y表示了企业是否为ST企业(证券交易中实行“警示存在终止上市风险的特别处理”的企业，以提示该公司的股票可能有被终止上市的风险)。若该上市企业为ST企业，则反应变量取值为1，说明该企业的信用风险较大；若该上市企业不为ST企业，则反应变量取值为0，说明该企业的信用风险较小。选取M₁和M₃作为自变量，Y作为因变量，建立Logistic回归模型。

3.2.1. 变量筛选

Table 6. Summary of Logistic regression results

表6. Logistic回归结果汇总表

注：***P < 0.001，**P < 0.01，*P < 0.05，下同。

表6是根据M₁“盈利能力”和M₃“偿债能力”建立的Logistic回归模型，可以看到自变量M₁的P值为0.01，其结果小于0.05，说明自变量M₁对回归结果的影响是显著的。而自变量M₃的P值为0.42，其结果大于0.05，说明自变量M₃对回归结果的影响不显著，故剔除该变量，选取自变量M₁与因变量Y建立Logistic回归模型。

3.2.2. 建立Logistic回归模型

Table 7. Summary of Logistic regression results

表7. Logistic回归结果汇总表

剔除M₃后，根据变量M₁“盈利能力”以及因变量Y“是否为ST企业”，建立二元Logistic回归模型。

从表7能看M₁的P值为0.00841，其结果小于0.05，说明该变量对结果是显著的，代表了模型的拟合效果很好。根据R语言的输出结果显示，模型的AIC值为43.921，其值较小，能代表原始数据的更多信息，所以最终选择建立二元Logistic回归模型。根据表7可以写出Logistic模型的回归方程：

$\log (\frac{p}{1 - p}) = - 2.3102 M 1 - 2.6989$

$p = \frac{1}{(1 + e^{M_{1}}) - 2.6989}$

由回归方程可以看出Logistic模型的系数为−2.31，也就是说事件的发生比为−2.31，由于该系数小于1，说明自变量随着事件的发生有负向作用，即房地产企业的盈利能力这一因子在企业违约的情况中占主导作用，且房地产企业的盈利能力越好，违约的概率约低。

4. 结论及建议

4.1. 结论

依据Logistic模型的回归结果显示，决定我国房地产企业信用风险的主要因子是企业的盈利能力，其主要具体对应财务指标是净资产收益率、总资产回报率、总资产净利润率、每股收益、营业毛利率、销售净利率。所以在房地产企业经营的过程中，要时刻关注这几个指标的波动，当指标出现过低或者过高的情况时，要及时调整经营战略，以防止出现企业的信用问题，减少企业的违约风险。

4.2. 建议

房地产企业要在新环境背景下加强内部经营与内部控制能力，提高企业盈利能力，企业就有足够利润偿还债务，企业违约风险就越小。同时也要树立优良产品理念，加强房地产企业内部管理与监督，积极通过多种途径提升员工技术专业水平、创新能力、道德水平，形成优秀企业文化，创立优质企业品牌，不断提升房地产企业竞争力，使企业盈利能力与偿债能力不断加强。

文章引用

杨璐菱. 基于Logistic回归模型的房地产上市公司信用风险研究
Research on Credit Risk of Real Estate Listed Companies Based on Logistic Regression Model[J]. 金融, 2024, 14(01): 46-54. https://doi.org/10.12677/FIN.2024.141007

参考文献

1. 马昭君, 葛新权. 房地产泡沫抑制了我国技术创新吗?——来自省际面板数据的经验证据[J]. 中国流通经济, 2023, 37(9): 11-22.

2. 李哲, 迟国泰. 基于最大指标区分度与最优相对隶属度的上市公司信用风险研究[J]. 中国管理科学, 2021, 29(4): 1-15.

3. 韩立岩, 郑承利, 罗雯, 等. 中国市政债券信用风险与发债规模研究[J]. 金融研究, 2003(2): 85-94.

4. 王慧, 张国君. KMV模型在我国上市房地产企业信用风险度量中的应用[J]. 经济问题, 2018(3): 36-40.

5. 李杰辉, 陈珊珊. 基于Logistic模型的供应链金融信用风险实证研究——以房地产上市公司为例[J]. 金融理论与教学, 2020(4): 21-29.

6. Daniel, C. and Marcin, C. (2022) The Advantage of Case-Tailored Information Metrics for the Development of Predictive Models, Calculated Profit in Credit Scoring. En-tropy, 24, Article 1218. https://doi.org/10.3390/e24091218

7. 何睿. 基于深度学习算法的信用债违约风险预测模型[J]. 统计与决策, 2023 , 39(17): 154-158.

期刊菜单