Modeling and Simulation
Vol.04 No.01(2015), Article ID:14878,9 pages
10.12677/MOS.2015.41004

Research on the Regional Financial Eco-Environments via Multivariate Statistical Analysis

Zhongkui Sun1, Yifei Liu2

1Department of Applied Mathematics, Northwestern Polytechnical University, Xi’an Shannxi

2College of Sciences, Georgia Institute of Technology, Atlanta, Georgia, USA

Email: sunzk@nwpu.edu.cn

Received: Feb. 7th, 2015; accepted: Feb. 20th, 2015; published: Feb. 26th, 2015

Copyright © 2015 by authors and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

ABSTRACT

It is of particular importance to estimate a regional financial eco-environment, based on which the administrators can make their efficient policy, and the investors may estimate the potential risk in investment to make brilliant decisions. For this purpose, the current paper deals with the measurement of a regional financial eco-environment. A mathematical model has been proposed by means of multivariate statistical methods, for example, the factor analysis method, the cluster methods and the discriminant analysis method, and it has been well tested and verified in estimating for regional financial eco-environment through the real data of ten states in United State.

Keywords:Regional Financial Eco-Environment, Evaluating Model, Multivariate Statistical Analysis

基于多元统计分析的地区金融 生态环境量化评估模型研究

孙中奎1,刘怡菲2

1西北工业大学理学院应用数学系,陕西 西安

2乔治亚理工学院理学院,亚特兰大,佐治亚州,美国

Email: sunzk@nwpu.edu.cn

收稿日期:2015年2月7日;录用日期:2015年2月20日;发布日期:2015年2月26日

摘 要

合理评估金融生态环境对于改善地区金融环境、提高金融系统的抗风险能力具有十分重要的意义。尤其是针对地区金融生态环境的量化分析和评价既可发挥地区经济特色,也能促进地区经济健康有序发展。有鉴于此,本文研究了地区金融生态环境的评价问题,基于多元统计理论建立了地区金融环境的量化评估模型——利用因子分析对指标进行降维、利用聚类分析对样本进行分类、再利用判别分析建立了判别规则。通过所收集的美国10个州的经济、民生数据,验证了本文所建立模型在地区金融生态环境评价中的合理性和有效性。

关键词 :地区金融生态环境,评估模型,多元统计分析

1. 引言

金融生态环境是指一个国家(或地区)在一定的政治制度和金融体系下,影响经济主体活动的各种要素的总和,包括政治、经济、文化、地理、人口等一切与金融相互影响、相互作用的因素。因此,合理评估金融生态环境对于改善社会金融环境、提高金融系统的抗风险能力、促进经济的多元健康发展具有十分重要的意义。尤其是针对地区金融环境的全面分析和评价将有助于发挥经济特色,助力地区经济腾飞。

金融生态环境是一个十分复杂的系统,通过对现实表征数据的研究,例如经济基础、金融发展、企业诚信、司法环境等,人们可以挖掘出数据下隐藏的金融规律。目前,借助于数据分析技术,多种统计模型和方法被成功引入金融分析领域,特别是对信用风险的研究之中[1] -[3] 。经过几十年的发展,信用风险的研究经历了银行专家体系、基于会计的信用评分系统、现代风险度量模型三个发展阶段[1] 。不仅形成了一套较为成熟的信用评价模型,而且诞生了若干知名的信用评级机构[2] 。近年来,随着中国经济的飞速发展,我国也步入了“信用经济时代”,社会信用体系的概念也于1999年由中国社会科学院世界经济与政治研究所提出[3] 。然而,相较于对信用风险的研究,对于金融生态环境的研究还比较匮乏,相关成果还很少见到。特别地,如何对地区金融生态环境进行量化仍然是国内外研究人员关注的热点[4] [5] 。

有鉴于此,本文基于多元统计理论建立了金融生态环境的量化评价模型。在合理选择表征地区金融环境的指标数据和样本的基础上,通过因子分析对数据进行降维,提取出具有明显经济学意义的因子;再通过聚类分析得到现实样本的一个划分;最后通过对聚类分析结果分析,利用判别分析建立了判别函数,实现了对地区金融环境信用风险的评估。

2. 指标选取

对地区金融生态环境的研究最早源于瑞士洛桑国际管理学院(IMD)。该项研究的目的是评估一个国家的竞争力——通过将一个国家的竞争力分成8大类290项指标,研究者建议了一套评价国家竞争力的评估方法。其中涉及金融生态环境的指标包括4大类27项指标。然而,这套指标体系侧重于对国家整体竞争力的考量,因此包括了许多类似于汇率、短期实际利率、利息加息率等短期指标。此后,不断有学者对此指标体系进行改善,并针对不同研究对象分别提出了金融竞争力评价指标体系[6] 。一般来说,表征金融竞争力的指标涉及到经济基础、社会保障、社会基本情况和政府服务四个方面。本文从地区金融生态环境量化评估角度出发,在邓淇中等人针对区域金融生态环境的研究成果基础上[6] ,构建了:同步经济指标(Coincident Economic Index)、实际国内生产总值(Real Total Gross Domestic Product)、零售贸易盈余(Retail Trade Earnings)、批发贸易盈余(Wholesale Trade Earnings)、政府税收/税收总额(Government Tax Collection/Total Tax)、个人总收入(Total Personal Income)、健康保险覆盖/不覆盖率(Health Insurance Coverage/Uncovered Rate)、民用劳动力(Civilian Labor Force)、居住人口(Residential Population)以及失业率(Unemployment Rate)等10项指标,如表1所示。全面涵盖了经济基础、社会保障、社会基本情况和政府服务四个方面。

3. 样本选取

本文选取了美国Alabama、Massachusetts等10个州作为样本,另外选取Colorado、Florida等6个州作为检验样本。数据均来自美联储圣路易斯分行(Federal Reserve Bank of ST. LOUIS)发布的2012年指标数据[7] ,表2为所选各州的原始数据。

4. 基于多元统计的地区金融生态环境量化模型

4.1. 对实际指标数据进行降维

在实际问题中,多个指标之间可能会存在信息重叠,通过研究指标之间的相关性和内部依赖关系来探究指标数据的基本结构,并从指标中提取出可反映原指标信息的公因子,如此便实现了对指标数据的降维和简化,这种方法称为因子分析[8] 。常用的因子分析类型有R型因子分析,其中每一个变量均能表示成公共因子的线性函数与特殊因子之和,公共因子是不可直接观测但又客观存在的共同影响因子,即

(1)

公式(1)中的称为公共因子,称为的特殊因子。该模型可用矩阵表示为

(2)

这里,

Table 1. Indexes and Variables

表1. 指标与变量

Table 2. The values of indexes

表2. 指标原始数据表

且满足:

1)

2),即公共因子与特殊因子是不相关的;

3),即各个公共因子不相关且方差为1;

4),即各个特殊因子不相关,方差不同。

其中,是第个变量在第个因子上的“载荷”,表示变量维空间中坐标轴上的投影,称为因子载荷矩阵。对标准化的各州指标数据进行因子分析。

表3显示前四个公因子的累积方差贡献率已经达到87.464%,故应提取四个因子。在实际分析中,有些变量可能在多个公因子上都有较大的载荷,说明它对多个公因子都有较明显的影响作用,这样很难对所提取的公共因子的实际含义进行合理的解释,故不可取。通过因子旋转法,使每个变量仅在一个公共因子上有较大载荷。本文采用正交旋转法,即给载荷矩阵右乘一个正交矩阵,使得具有更鲜明的实际意义。旋转以后的公共因子向量为,它的各个分量也是互不相关的公共因子。旋转后的因子载荷矩阵如表4

Table 3. Characteristic root and variance contribution rate

表3. 特征根与方差贡献率

Table 4. The factor loading matrix

表4. 因子载荷阵

表4显示经过旋转后的载荷系数已经明显地两极分化了,并且每个公共因子都具有明显的经济学意义,例如第一个公共因子在指标上有较大载荷,对应于前文所述的经济基础。可以看出这四个公共因子分别对应经济基础、社会基本情况、社会保障情况以及政府公共服务情况。同时结合方差贡献率来分析,可知第一公共因子,即经济基础对金融环境的贡献是最高的,其次是社会基本情况,最后是政府服务情况。由此看来一个地区的金融环境的好坏受到当地经济基础的极大影响。

利用汤姆孙回归法可以得到各因子得分[8] [9] :

(3)

其中的相关系数矩阵。再根据因子得分和原始变量可以计算得到每个因子的得分。

如此,我们便通过因子分析方法将原本的10个指标简化为了4个因子,达到了降低数据维数的目的。表5给出了这4个因子的实际数值。

4.2. 地区金融生态环境的聚类分析

将指标数据降维后,再利用聚类分析对各因子所表征的各州金融环境进行分类,使金融环境相似的州分为一类。本文采用K均值聚类分析方法[8] ,每个样品的个指标构成一个维的向量,将样品看成维空间中的点,通过马氏距离来测度样品之间的距离。令表示样品的距离,设是来自均值为、协方差为 (>0)的总体中的样品,则两个样品间的马氏距离为

(4)

这种方法的基本思想是将每一个样品分配给最近中心均值的类中,具体算法包括以下三个步骤:

1) 将所有的样品分为K个初始类;

2) 计算某个样品与各类中心的距离,将样品划入距离最近的类中,重新计算获得样品与失去样品的)类的中心坐标;

3) 重复步骤2),直到所有的样品都不能再分配时为止。

图1图2比较了第一类各州的经济基础,通过表6可以看出第一类各州的经济基础均在温和上升

Table 5. The real value of factors to the 10 states in United State

表5. 美国各州因子实际数值表

Table 6. The results from cluster analysis

表6. 聚类结果表

Figure 1. Economic foundation of the 10 state in United State: X2 and X4

图1. 各州经济基础:X2和X4

Figure 2. Economic foundation of the 10 state in United State: X6 and X10

图2. 各州经济基础:X6和X10

中,例如Massachusetts,该州的一致经济指数活动指数较高,说明该州的经济活动较为活跃,与此同时该州的GDP也呈现出较快的增长速度。该州的零售贸易收入增幅较小,而批发贸易的增幅基本为零。Massachusetts的优势产业为高等教育产业、健康医疗以及金融服务产业,虽在2008年的金融危机中,该州的金融服务产业受到了冲击,然而该州的经济整体趋势是回暖的。第二类中所有的州经济基础增长都十分迅猛,所有的州经济活动活跃程度都很高,一致经济活动指数的增长率都在平均水平以上。各州的GDP增速显著,名列十个州的前三名。零售批发贸易收入增速也均在平均水平以上。其中Texas的各项指标数据增长十分强劲,该州的经济呈显著上升趋势,这种情况与该州作为全美经济复苏的领头羊的地位是相符的,该州农牧业发达,作为传统优势产业,农牧业在金融危机中称为了该州经济的坚强后盾,该州经济多元化发展,高科技产业兴起,作为新的经济增长点,显然这些产业推动了该州的经济发展。 第三类各州的经济也处于温和回暖中,各州经济活动活跃程度较为一般,在均值附近,地区生产总值和零售贸易收入也增长缓慢,批发贸易收入增长尚可观,在均值附近。值得注意的是New Jersey和Illinois的金融服务业都较为发达。

图3显示的是第一类各州得社会保障情况。就社会保障情况而言,第一类各州的社会保障程度并不令人满意,健康保险未覆盖率增长均较快而个人收入的增长幅度很小。说明这些州有很多人并未享受到健康保险福利,并且收入增幅小,生活上经济压力可能较大。第二类的州健康保险未覆盖率减小并且个人收入增加,社会保障程度较为理想。例如California的健康保险未覆盖率显著减小而个人收入情况增长幅度很大。第三类的州健康保险未覆盖率显著下降的同时保持了较低的个人收入增长。第三类各州的社会保障程度虽不及第二类,但较第一类更好一些。

对比各州的社会基本情况(见图4),我们不难发现第一类中各州的劳动力水平上升,居民人口增加,失业率下降,这与第一类各州的经济基础温和回暖这一情况相匹配。第二类中各州因为经济情况十分可观,不断吸引外来劳动力,并且创造了许多就业,例如Texas劳动力的增长则十分显著,Texas作为经济复苏的领头羊,吸引了许多劳动力在该州寻找就业机会。第三类中各州居民人口总数缓慢增长的同时失业率缓慢减少。

对比各州的政府公共服务情况(见图5),第一类各州的政府税收总体在温和上涨;第二类中California温和下降,Washington轻微上涨,Texas明显上涨。第三类New Jersey轻微上涨,Illinois明显上涨。可

Figure 3. Social security of the 10 state in United State: X3 and X8

图3. 各州社会保障:X3和X8

Figure 4. Basic condition of social of the 10 state in United State: X1, X5 and X9

图4. 各州社会基本情况:X1、X5和X9

Figure 5. Government service of social of the 10 state in United State: X7

图5. 各州政府服务:X7

以看出每一类各州的情况存在一定的差异。

考虑到四个公因子的方差贡献率各异,故综合四方面情况考虑各州的金融环境时,首先考虑每一类中各州经济基础情况的相似程度,其次社会基本情况,社会保障情况,最后是政府服务情况。再结合专家意见,就可以实现对各州金融生态环境的量化评价:将第二类各州评为A级,第三类各州为B级,第一类各州为C级。A级的各州经济上升迅猛,州内就业情况可观,劳动力水平上升,社会保障情况乐观。B级各州的经济底子良好,经济温和回暖,州内就业率上升,劳动力水平上升,政府的服务能力较好,社会保障程度较好。C级各州的经济也温和回暖,然而社会保障薄弱,劳动力水平和就业率温和上涨。

4.3. 地区金融生态环境判断规则的建立

为了进一步实现对其它各州金融生态环境的量化评价,本小节将利用Fisher判别法建立金融生态环境的统一判断规则,并以Colorado、Iowa、Florida、New York、Utah和Virginia州为例,对所建立的判断规则进行检验。

建模原理:假设有个样本,每个样本有项指标,这些样本分属于个类别,每个类别的分布函数为。根据这些信息,利用Fisher判别法[8] 确定判别函数,进而得到统一判断规则。不妨假设有个总体,其均值和协方差矩阵分别为 (>0) ()。考虑线性判别函数,在的条件下,有

(5)

(6)

其中,。这里表示组间差,表示组内差。

根据方差分析思想:选择使得函数达到极大,就可以得到判别规则,若

(7)

则判定来自总体

将Colorado、Iowa、Florida、New York、Utah和Virginia州的数据代入判别规则(7),则可以得到对这6个州金融生态环境的判别分析结果,如表7所示。

Florida的一致经济活动指数、GDP和零售贸易收入增长都位于全美国的平均值左右,批发贸易收入增幅较大,健康保险未覆盖率增长显著,同时个人收入水平温和上涨。该州劳动力水平和居民人口增长的同时失业率显著下降,政府税收收入轻微上涨。这与第一类的各州情况较为接近。Utah的经济基础各项指标增长均十分迅猛,劳动力水平和居民人口增长的同时失业率显著下降,政府税收收入增幅基本位于均值水平,这些与第二类中各州情况比较接近。New York经济基础各项指标增长比较迅猛,个人收入水平温和上涨的同时保持较为明显的健康保险未覆盖率下降,这与New Jersey和Illinois的情况十分相似。

5. 结论

本文基于多元统计理论研究了地区金融生态环境的量化评价问题。首先利用因子分析对现实经济指

Table 7. The results from discriminant analysis

表7. 判别分析结果

标进行了降维,剔除冗余信息,提取出四个具有明显经济学意义的因子;然后运用聚类分析模型得到现实样本的一个划分;最后利用判别分析建立了判别函数,实现了对地区金融环境信用风险的评估。为了验证本文所建立模型的有效性,我们选取了美国十六个州作为研究样本,运用所建立的量化评价模型将这16个州分成了3类:第一类各州的经济温和回暖,劳动力水平和就业率温和上涨,然而社会保障薄弱;第二类各州经济上升迅猛,州内就业情况可观,劳动力水平上升,社会保障情况乐观;第三类各州经济底子良好,经济温和回暖,州内就业率上升,劳动力水平上升,政府的服务能力较好,社会保障程度较好。结合各州金融环境的实际情况,我们将第二类各州评价为A级,第三类各州评价为B级,第一类各州评价为C级。最后利用判别分析生成了判别函数,建立了一般性的判别规则。

基金项目

感谢陕西省青年科技新星项目(批准号:2013KJXX-19)对本研究的支持。

文章引用

孙中奎,刘怡菲, (2015) 基于多元统计分析的地区金融生态环境量化评估模型研究
Research on the Regional Financial Eco-Environments via Multivariate Statistical Analysis. 建模与仿真,01,23-32. doi: 10.12677/MOS.2015.41004

参考文献 (References)

  1. 1. Altman, E.I. and Saunders, A. (2011) Credit risk measurement: Development over the last 20 years. Journal of Banking & Finance, 21, 1721-1742.

  2. 2. 许文彬, 张亦春, 黄瑾轩 (2009) 美国三大评级公司主权评级模式评析. 国际金融研究, 10, 26-33.

  3. 3. 林钧跃 (2012) 社会信用体系理论的传承脉络与创新. 征信, 1, 1-13.

  4. 4. 李扬, 王国刚, 刘煜辉 (2005) 中国城市金融生态环境评价. 人民出版社, 北京.

  5. 5. 黄国平, 刘煜辉 (2007) 中国金融生态环境评价体系设计与分析. 系统工程理论与实践, 6, 7-14.

  6. 6. 邓淇中, 李鑫, 陈瑞 (2012) 区域金融生态环境指标体系构建及竞争力评价研究. 湖南科技大学学报, 6, 75-80.

  7. 7. Federal Reserve Bank of ST. LOUIS (2012) Economic research. https://research.stlouisfed.org/

  8. 8. 朱建平 (2006) 应用多元统计分析. 科学出版社, 北京.

  9. 9. 高惠璇 (2004) 应用多元统计分析. 北京大学出版社, 北京.

期刊菜单