Statistics and Application
Vol. 12  No. 04 ( 2023 ), Article ID: 71369 , 10 pages
10.12677/SA.2023.124108

我国31个主要城市空气质量情况研究

——基于SPSS软件分析

梁影

广西大学工商管理学院,广西 南宁

收稿日期:2023年7月24日;录用日期:2023年8月14日;发布日期:2023年8月28日

摘要

随着社会经济和工业化的发展,人们更加关注自己的生命健康,空气质量也成为了人们关注的重点之一。本文根据基于中国31个主要城市空气质量原始数据,主要运用了回归分析、因子分析和聚类分析对31个主要城市的空气质量情况有一个更详细的认识。

关键词

空气质量,回归分析,因子分析,聚类分析

A Study on the Air Quality of 31 Major Cities in China

—An Analysis Based on SPSS Software

Ying Liang

School of Business, Guangxi University, Nanning Guangxi

Received: Jul. 24th, 2023; accepted: Aug. 14th, 2023; published: Aug. 28th, 2023

ABSTRACT

With the development of social economy and industrialization, people are paying more attention to their own lives and health, and air quality has become one of the focuses of people’s attention. Based on the original air quality data of 31 major cities in China, this paper mainly uses regression analysis, factor analysis and cluster analysis to have a more detailed understanding of the air quality of 31 major cities.

Keywords:Air Quality, Regression Analysis, Factor Analysis, Cluster Analysis

Copyright © 2023 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

我国改革开发40多年,经济虽然上去了,但是工业化给我们带来了严重的污染,包括空气污染、水污染等,给我们的生命带来了严重威胁。每个人都要呼吸,没有健康的空气又怎会有健康的生活,更会影响生态自然的和谐与可持续发展。我们不能只顾眼前利益,要为我们的后代着想,我们要坚持走可持续发展战略,关注空气质量 [1] 。

改善空气质量一直是我们追求的目标,也更有利于地区经济的发展,对地区的空气质量有所了解可以更好地提出针对性的措施 [2] 。

空气质量达到及好于二级的天气可以反映一个城市的空气状况,而空气质量又和什么因素有关呢?我国主要城市面临的空气状况如何呢?本文通过SSPS对我国31个主要城市的空气质量进行分析研究。

2. 文献回顾

现在关于空气质量的研究有很多,大多是从某个经济指标来解释空气质量的影响,或者对空气质量的时空变化进行研究。姚祎等人 [3] 以北京市2016~2020年春节期间的空气质量为研究对象,首先运用多元线性回归法判断了气象因素以及经济和社会活动因素对四类污染物(PM2.5、PM10、NO2和SO2)有影响。湛社霞等人 [4] 分析2006~2016年粤港澳大湾区空气污染物的时空变化,并发现工业、能源消耗、人口、机动车数量和环境管理政策是影响区域空气质量的主要因素。胡敏 [5] 以2008~2019年我国31个主要城市的面板数据为基础,从分位数回归的角度将空气质量污染指标、经济增长以及公共交通对我国空气质量的影响程度进行分析。刘贺等人 [6] 利用空间自相关及空间回归模型探究中国城市空气质量的时空演变特征、空间溢出效应及影响因素。王斌会和王术 [7] 根据2006~2012年我国31个主要城市面板数据,证明了经济发展和公共交通发展正向影响城市空气质量,城市绿化的发展不影响空气质量。但是空气质量最直接的影响因素是影响空气质量的污染气体,我们可以根据其他污染气体在空气中的含量来判定空气质量,这是最直接的。现在很多研究都从宏观的经济指标来判定,经济发展确实会对空气质量产生影响,但是这种影响是间接的,是需要时间积累的,不是动态实时反映空气质量的好坏,而本文选择的是最直接,能够动态实时反映空气质量的指标。

3. 指标选择和数据来源

由于各市空气质量指数是实时变化的,季节不同,空气质量也不一样,只能通过一年中空气质量好于二级的天数来衡量这个城市一年的空气质量情况,所以空气质量指的衡量选用该城市一年中空气质量达到及好于二级的天数。本研究在参考了前人的研究基础上,为分析我国31个主要城市空气质量情况,选取我国31个省市中具有代表性的6个指标对其空气质量水平进行综合评价。具体如下:(1) SO2年平均浓度、(2) NO2年平均浓度、(3) PM10年平均浓度、(4) CO日均值第95百分位浓度、(5) O3最大8小时第90百分位浓度、(6) PM2.5年平均浓度。

这6个指标能更综合、全面地反映我国31个主要城市空气质量情况,保证分析指标和结果的客观性和准确性。

本文采用的数据是《主要城市空气质量情况(2020年)》,本文研究数据来自于《中国统计年鉴·2021》。

4. 数据分析

4.1. 描述性分析

Table 1. Descriptive analysis

表1. 描述性分析

对数值型指标进行描述性分析,可以查到异常值情况和了解数据的大概分布。如表1所示。

结果可以看出,SO2平均浓度为9.5左右,最大值和最小值分别为4和18;NO2平均浓度为33.2左右,最大值和最小值分别为11和47;PM10平均浓度为60.9左右,最大值和最小值分别为29和101;CO平均浓度为1.4左右,最大值和最小值分别为0.8和2.4;O3平均浓度为148.7左右,最大值和最小值分别为113和190;PM2.5平均浓度为36.5左右,最大值和最小值分别为12和58;气质量达到及好于二级的天数平均值为303.5左右,最大值和最小值分别为205和366;可以看到数据并无异常值,可以进行后面的分析。

4.2. 相关性分析

Table 2. Correlation analysis

表2. 相关性分析

注:*,在0.05级别(双尾),相关性显著。**,在0.01级别(双尾),相关性显著。

为验证各个因素是否会对空气质量有影响,将两种因素进行皮尔逊相关性检验,结果如表2所示。

表2中可以看出,有17组指标是具有很强的关联性,并且在0.01水平上显著。其中空气质量与PM2.5、CO、O3、NO2、PM10年平均浓度有显著关系,为后面的回归分析做基础,也有其他指标之间两两相关,这里不再赘述。

4.3. T检验

Table 3. Independent sample test results

表3. 独立样本检验结果

为验证是否为北方城市这个因素是否会对空气质量有影响,将两个变量进行独立样本T检验,结果如表3所示。

表3可知,莱文方差等同性检验的显著性大于0.05,方差齐,假定等方差的P值小于0.05,拒绝原假设,说明是否为北方城市对该城市的空气质量有显著影响。置信区间都为负说明地域处于北方的城市空气质量达到及好于二级的天数显著少于处于南方的城市,可见南方城市空气质量普遍比北方城市好。

4.4. 回归分析

为了验证选取的各因素与空气质量的关系,以及各因素对它的影响程度大小,本文进行了回归分析,如表4~6所示。

Table 4. Model summary table

表4. 模型摘要表

注:a. 预测变量:(常量),细颗粒物(PM2.5)年平均浓度(μg/m3);b. 预测变量:(常量),细颗粒物(PM2.5)年平均浓度(μg/m3),臭氧(O3)最大8小时第90百分位浓度(μg/m3);c. 预测变量:(常量),细颗粒物(PM2.5)年平均浓度(μg/m3),臭氧(O3)最大8小时第90百分位浓度(μg/m3),二氧化氮年平均浓度(μg/m3);d. 预测变量:(常量),细颗粒物(PM2.5)年平均浓度(μg/m3),臭氧(O3)最大8小时第90百分位浓度(μg/m3),二氧化氮年平均浓度(μg/m3),可吸入颗粒物(PM10)年平均浓度(μg/m3)。

4个模型调整后的R方均大于为80%,从第2个模型开始大于90%,说明模型的拟合优度较好,4个模型的方程检验P值均小于5%,通过检验,其中第4个模型调整后的R方最大,拟合最好。方程通过检验后,对系数进行检验。

Table 5. Test of variance

表5. 方差检验表

Table 6. Equation coefficient verification table

表6. 方程系数检验表

由结果可知,PM2.5、O3、NO2、PM10年平均浓度的Sig值通过了检验,且容差较小,不存在多重共线性。经过以上最小二乘法回归分析,可以发现:我国31个主要城市的空气质量与PM2.5、O3、NO2、PM10有显著关系,与其他变量之间的关系不显著。回归方程为:空气质量达到及好于二级的天气 = 512.311 − 2.053 × PM2.5 − 0.849 × O3 + 1.188 × NO2 − 0.772 × PM10

4.5. 因子分析

与空气质量相关的指标较多,为了便于进行研究,我们对指标进行降维,找到公共因子来将指标进行降维,因此要对6个空气指标进行因子分析。进行因子分析之前首先要进行KMO和巴特利检验才能说明此数据是否适合做因子分析,结果如表7所示,KMO检验值为0.795,巴特利特球形度检验的显著性为0.000,可以进行因子分析。

Table 7. KMO and Bartlett test results

表7. KMO和Bartlett检验结果

载荷平方和越大,说明因子对原始数据的贡献的越大。根据特征值大于1,提取了两个因子,累计旋转载荷平方和达到84.540%。在提取两个因子的情况下,方差的提取率均在0.7以上,表明原始数据的损失度较小,数据具有代表性,如表8表9

Table 8. Explains the total variance

表8. 解释的总方差

Table 9. Common FACTOR Variance

表9. 公因子方差

因子旋转后可以更好地解释各个因子的含义。结果由表10所示:公共因子F1有O3、PM10、PM2.5、NO2,主要反映了对呼吸道的影响,所以可以把它命名为呼吸道影响因子 [2] ;公共因子F2有CO、SO2,主要是具有刺激性,所以可以把它命名为刺激性影响因子 [2] 。

Table 10. Rotating component matrix

表10. 旋转成分矩阵

根据两个公共因子的方差贡献率设置得分模型,计算综合得分,如表11所示,进而可以得出31个主要城市的因子得分及综合排序情况。

F = 0.46114 F 1 + 0.38426 F 2 0.46114 + 0.38426

Table 11. Ranking of factor scores and comprehensive scores

表11. 因子得分及综合得分排名

表11可知,太原、石家庄、济南、兰州、郑州分别排第一、二、三、四、五,说明这些城市的空气质量较差,最后五名是南宁、贵阳、福州、拉萨、海口,说明这些城市的空气质量较好。

4.6. 聚类分析

为了能够了解我们各区域空气质量的情况以及清楚知道哪些城市在空气质量上可以分为一类,需要对数据进行聚类分析。首先,对这些指标数据进行标准化处理,利用了系统聚类法下的K均值聚类法,对31个城市进行聚类,结果如表12所示。

Table 12. Cluster members

表12. 聚类成员

根据所有指标对我国31个主要城市进行分类,分类结果如下:

第一类:太原、石家庄、济南、郑州、西安、天津;

第二类:成都、武汉、长春、合肥、南京、重庆、北京、杭州、南昌、长沙、上海、广州;

第三类:昆明、南宁、贵阳、福州、拉萨、海口;

第四类:沈阳、呼和浩特、乌鲁木齐、银川、西宁、哈尔滨;

从前面因子分析可以看出,第三类城市的空气质量最好,其次是第二类,第四类的空气质量稍差,第一类城市的空气质量最差。第四和第一类城市的空气质量有待加强,需要相关部门予以重视。

5. 研究结果及建议

首先,描述性分析说明数据没有异常;相关性分析发现空气质量与PM2.5、CO、O3、NO2、PM10年平均浓度有很强的关联;通过T检验说明位于北方的城市的空气质量显著优于位于南方城市。其次,通过回归分析发现空气质量与PM2.5、O3、NO2、PM10有显著关系,与NO2成正相关,与PM2.5、O3、PM10负相关,其中PM2.5对空气质量影响最大。

此外,通过因子分析将6个因子概括为2个因子(呼吸道影响因子和刺激物影响因子),并对其进行综合排名,初步发现太原、石家庄、济南、兰州、郑州空气质量较差,南宁、贵阳、福州、拉萨、海口空气质量较好。最后通过聚类分析将31个城市分成4类,第一类城市有太原、石家庄、济南、郑州、西安、天津,空气质量最差,这些城市大多属于华北地区,工业发展较为迅速,但随之也带来了严重的空气污染,又是北方供暖烧煤的地区,雾霾现象严重。有关政府部门应该加强对该地区的工业空气排放问题,抑制污染气体的排放,加强监管。第二类城市有成都、武汉、长春、合肥、南京、重庆、北京、杭州、南昌、长沙、上海、广州,空气质量较好,这些城市大多属于长三角地区、珠三角地区,位于南方,四季常春,植被种类较多,对空气有一定的净化作用,但是双三角地区经济和工业水平也较高,需要有关部门加强对空气排放的监管,防止空气的恶化。第三类城市有昆明、南宁、贵阳、福州、拉萨、海口,空气质量最好,这些城市主要南方沿海城市,温和多雨,植被茂诚,可以净化空气,所以这些地方的空气质量最好。第四类城市有沈阳、呼和浩特、乌鲁木齐、银川、西宁、哈尔滨,空气质量较差,主要位于东北和西北地区,沙漠化严重,植被稀少,对该地区应该采取退耕还林,增加植被等措施来进行补救。

致谢

非常感谢老师、同学、朋友、父母、亲人在这段时间的帮助,让我能够顺利地完成这篇论文的写作,特别感谢我的导师李老师在论文上对我的指导,我将继续保持初心,完成更多更优秀的作品。

文章引用

梁 影. 我国31个主要城市空气质量情况研究——基于SPSS软件分析
A Study on the Air Quality of 31 Major Cities in China—An Analysis Based on SPSS Software[J]. 统计学与应用, 2023, 12(04): 1055-1064. https://doi.org/10.12677/SA.2023.124108

参考文献

  1. 1. 虞颖, 孟彦菊. 中国31个主要城市空气质量的聚类分析和主成分分析[J]. 科技和产业, 2022, 22(5): 246-250.

  2. 2. 刘琴, 葛梅梅. 基于聚类分析和因子分析对我国31个主要城市空气质量的研究[J]. 西昌学院学报(自然科学版), 2021, 35(1): 62-65.
    https://doi.org/10.16104/j.issn.1673-1891.2021.01.013

  3. 3. 姚祎, 王宇, 俞海, 秦虎. 北京市2020年春节期间空气质量影响因素分析[J]. 环境与可持续发展, 2021, 46(2): 107-114.
    https://doi.org/10.19758/j.cnki.issn1673-288x.202102107

  4. 4. 湛社霞, 匡耀求, 阮柱. 基于灰色关联度的粤港澳大湾区空气质量影响因素分析[J]. 清华大学学报(自然科学版), 2018, 58(8): 761-767.
    https://doi.org/10.16511/j.cnki.qhdxxb.2018.26.031

  5. 5. 胡敏, 杨宜平. 我国空气质量影响因素的实证研究[J]. 重庆工商大学学报(自然科学版), 2021, 38(3): 94-99.
    https://doi.org/10.16055/j.issn.1672-058X.2021.0003.013

  6. 6. 刘贺, 李雪铭, 田深圳, 等. 中国城市空气质量时空演变及影响因素研究[J]. 生态经济, 2021, 37(9): 91-96+101.

  7. 7. 王斌会, 王术. 我国城市空气质量影响因素的实证研究——基于中国31个主要城市面板数据的分析[J]. 福建农林大学学报(哲学社会科学版), 2015, 18(6): 29-33.
    https://doi.org/10.13322/j.cnki.fjsk.2015.06.007

期刊菜单