Advances in Environmental Protection
Vol. 09  No. 01 ( 2019 ), Article ID: 28999 , 6 pages
10.12677/AEP.2019.91009

Principal Component Analysis of Water Quality in Lihe River

Gang Liu1, Hui Wu1, Zaiping Liu2, Yanxi Li1, Jingsha Song1

1Jingmen Academy of Environmental Sciences, Jingmen Hubei

2Hubei Jinghuan Environmental Protection Engineering Technology Co., Ltd., Jingmen Hubei

Received: Jan. 30th, 2019; accepted: Feb. 18th, 2019; published: Feb. 25th, 2019

ABSTRACT

Principal components analysis (PCA) was applied to assess the water quality at the end of the Lihe River in 2017, based on the monitoring data of 13 indicators of BOD5, CODMn, NH3-N, TP, TN, DO, pH, etc. The result showed that the water pollution score was the highest in July and lowest in January; Domestic pollution, river sediment and industrial waste water are the main causes of water pollution in the river.

Keywords:Lihe River, Community Structure, Cluster Analysis

基于主成分分析法的浰河水质评价

刘刚1,吴辉1,刘在平2,李妍羲1,宋荆沙1

1荆门市环境科学研究院,湖北 荆门

2湖北荆环环保工程技术有限公司,湖北 荆门

收稿日期:2019年1月30日;录用日期:2019年2月18日;发布日期:2019年2月25日

摘 要

依据浰河入汉江口2017年常规监测数据,选取BOD5、CODMn、NH3-N、TP、TN、DO等13种水质指标,基于主成分分析法对浰河的水质情况进行综合评价。结果表明,1月份水质较好,7月份水质较差,生活源、河道底泥、工业废水是造成浰河水质污染的主要原因。

关键词 :浰河,主成分分析,水质评价

Copyright © 2019 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

1. 引言

水环境是人类赖以生存的重要环境要素之一。随着我国经济社会的高速发展,水环境污染已成为严重制约我国经济社会可持续发展和危害人们身体健康的重要因素。因此,如何合理、客观地描述水质现状,对水质污染程度进行准确评价已成为环境研究领域的一个热点和难点问题。目前,国内外主要的水质评价方法有污染指数法 [1] [2] 、模糊评价法 [3] 、神经网络评价法 [4] [5] 、灰色评价法 [6] 、物元评价法 [7] [8] 、地理信息系统评价法 [9] 及主成分分析法 [10] [11] [12] 等。

由于地区差异而形成的水污染的特点不同,导致污染因子权重的确定各异,分析方法权重值的选取主观性较强,评价的结果不便于与其它地区水质状况进行比较,因而也不能准确反应本地的相对污染状态。主成分分析方法是一种成功的因子降维和数据压缩的统计学方法 [13] [14] ,它将收集到的河流水质监测数据,在确保不损失原有主要信息的前提下,用较少的具有代表性的主因子来概括多种水质要素所反映的水质信息,达到找出影响其河流水质的主要污染因子,并识别污染物来源及其成因,为进行环境综合整治提供技术支持。本文使用IBM SPSS Advanced Statistics 20.0软件对浰河入汉江口2017年监测数据进行主成分分析,并对水质进行评价。

2. 数据来源

浰河是汉江的主要支流之一,流经荆门市东宝区、钟祥市,长约184公里,控制流域面积1140平方公里,主要界于北纬30˚09'07''~30˚27'36''、东经112˚00'17''~112˚24'45''。浰河入汉江口监测断面执行《地表水环境质量标准》(GB3838-2002) III类标准,本文选取该监测点2017年常规监测数据中的pH、电导率、水温、氨氮、溶解氧、高锰酸钾指数、生化需氧量、石油类、化学需氧量、总磷、总氮、氟化物、六价铬等13项指标以及浰河水文站(陈安站)的流量数据作为数据源,见下表1

Table 1. Routine monitoring data of water quality from Lihe river into Hanjiang river in 2017

表1. 浰河入汉江口监测断面2017年常规监测数据

3. 研究方法

主成分分析法是利用降维思想,把多指标变量转化为少数几个综合指标的多元统计分析方法,且这少数几个综合指标可以反映原来多个变量的大部分信息。本研究使用SPSS软件由湖北荆环环保工程技术有限公司提供,对13项浰河水质监测因子和流量进行主成分分析,得到综合水质评价函数;依据此评价函数计算结果,比较不同月份的水质情况,准确地掌握不同月份水体受污染的程度 [15] 。其分析步骤如下:

1) 对原始指标进行标准化处理,以消除数据之间量纲的影响;

2) 求标准化数据的相关关系矩阵;

3) 求相关系数的特征值、特征向量和方差贡献率;

4) 计算主成分贡献率及累计贡献率,确定主成分个数,一般要求前n个主成分的累计解释方差占总方差的85%以上即可;

5) 选择n个主成分,计算相应的特征向量,求主成分分析的得分;

6) 计算主成分载荷得到综合函数并用其评判水质。

4. 结果与分析

4.1. 综合水质评价函数

通过主成分分析得到综合水质评价函数。运用SPSS软件,将各项水质指标进行标准化处理,提取相关系数矩阵(表2),并求得各个指标解释的总方差、累计贡献率(表3)、碎石图(图1)及初始因子荷载(成分)矩阵(表4)。主成分荷载矩阵需用初始因子荷载矩阵中相关数据除以主成分相对应特征值的平方根,求出3个主成分中每个指标对应的系数,得到相应的主成分荷载矩阵(表5)。

Table 2. Correlation coefficient matrix

表2. 相关系数矩阵

Table 3. Eigenvalue, contribution rate and cumulative contribution rate

表3. 特征值、贡献率及累积贡献率

Table 4. Initial factor composition matrix

表4. 初始因子荷载(成分)矩阵

Table 5. Factor load matrix

表5. 主成分荷载矩阵

依据特征根大于1的原则,由表3及碎石图可以看出,有3个主成分的特征根大于1,旋转后第一主成分对总方差的贡献率为33.631%,3个主成分累计解释方差为89.017%,符合大于85%的信息抽取率。

表4可知,第一主成分与水温相关性最高,与化学需氧量、高锰酸钾指数正相关,与电导率、溶解氧、氨氮负相关,溶解氧含量表明水体自净能力的强弱,一定程度反应水体的受污染程度,可代表季节性波动明显的水体因子,表明污染来自生活源和河流底泥;第二主成分与六价铬高度负相关,与石油类、生化需氧量负相关,与流量、高锰酸盐指数正相关,可表明污染来自工业源;第三主成分与总磷、总氮高度相关,与氟化物、生化需氧量正相关,与流量负相关,可表明浰河水质有富营养化加剧的风险。分析方差贡献率可知3个主成分方差贡献率接近,表明浰河水体受污染不是某方面原因,是多因素作用的结果。

Figure 1. Scree plot

图1. 碎石图

由上表5可知,Fx是特征向量与相对应系数的累和;由表3可知,三个主成分特征根分别为: λ 1 = 6.663 λ 2 = 3.75 λ 3 = 2.049

综上,可以得到浰河综合水质评价函数:

F = [ λ 1 / ( λ 1 + λ 2 + λ 3 ) ] F 1 + [ λ 2 / ( λ 1 + λ 2 + λ 3 ) ] F 2 + [ λ 3 / ( λ 1 + λ 2 + λ 3 ) ] F 3

F = 0.534665 F 1 + 0.300915 F 2 + 0.16442 F 3 (1)

4.2. 水质等级评价

将所有月份采样点的因子值分别代入主成分分析得到的综合水质评价函数(1),统计得到不同时期每个采样点的综合水质评价函数值F,其中污染严重程度随着得分的增大而增大。

根据图2对2017年浰河水质污染严重程度进行排序(7月 > 9月 > 5月 > 11月 > 3月 > 1月),其中7月份污染最严重,1月份污染最轻。呈现出明显的季节性变化,与地表水环境质量标准评价结果一致。

5. 结论

本文从浰河入汉江口2017年的采样数据分析中选取13个主要水质因子和流量进行主成分分析,得到综合水质评价函数;依据综合水质评价函数,得到水质污染程度趋势图。

1) 浰河水质污染呈现明显季节性特征,随着气温升高而污染程度加深,春冬季的12月至2月污染较轻,夏季的6月至8月污染最重。

2) 第一主成分解释总方差值较大,第二主成分及第三主成分解释总方差值较接近,说明浰河水质污染来源复杂多样,主要包括生活源、河道底泥和工业源。

Figure 2. Principal component analysis comprehensive score

图2. 主成分分析综合得分

3) 第一主成分中水温、电导率、溶解氧、流量代表水体环境的物理状况;氨氮与水温负相关(R2 = 0.65),可能因为冬春季节流域内人口密度增加,生产活动加大引起的;COD与水温正相关,考虑到温度同样也能影响有机质的释放,随着温度升高而增大,当超过20℃时COD释放量最大 [16] ,因此,浰河水质中的有机物污染主要为河道底泥引起的。

4) 第二主成分、第三主成分中六价铬、石油类、总磷、总氮、氟化物与流量负相关,表明其属于点源污染。浰河流域主要分布磷化工生产企业,六价铬、总磷、氟化物是其生产废水的特征因子,表明点源污染主要源于工业废水。

文章引用

刘 刚,吴 辉,刘在平,李妍羲,宋荆沙. 基于主成分分析法的浰河水质评价
Principal Component Analysis of Water Quality in Lihe River[J]. 环境保护前沿, 2019, 09(01): 58-63. https://doi.org/10.12677/AEP.2019.91009

参考文献

  1. 1. 梁德华, 蒋火华. 河流水质综合评价方法的统一和改进[J]. 中国环境监测, 2002, 18(2): 63-66.

  2. 2. 薛巧英. 水环境质量评价方法的比较分析[J]. 环境保护科学, 2004, 30(4): 64-67.

  3. 3. 陈广桐. 模糊聚类方法在水体环境单元分类中的应用[J]. 环境工程, 1994, 12(2): 61-63.

  4. 4. 王李管, 贾明涛. 水质评价及预测的神经网络方法[J]. 环境工程, 1998, 16(2): 62-65.

  5. 5. 刘国东, 黄川友, 丁晶. 水质综合评价的神经网络模型[J]. 中国环境科学, 1998, 18(6): 514-517.

  6. 6. 陆洲, 夏秋颖, 周琳, 等. 等斜率灰色聚类法在地面水环境质量评价中的应用[J]. 环境保护科学, 2000(5): 43-46.

  7. 7. 王国平, 王洪光. 物元分析法用于水环境质量的评价比较[J]. 干旱环境监测, 1997(2): 65-67.

  8. 8. 冯玉国. 用物元分析法综合评价环境质量[J]. 环境保护, 1995(9): 30-32.

  9. 9. 方丽玲, 吴立新, 周广明, 等. GIS支持下水质模型的应用[J]. 新疆环境保护, 1999, 2l(3): 1-8.

  10. 10. 刘德林, 刘贤赵. 主成分分析在河流水质综合评价中的应用[J]. 水土保持研究, 2006, 13(3): 124-125.

  11. 11. 吴浩东, 胡衡生. 基于主成分分析法的明江河水质评价[J]. 湖北农业科学, 2010, 49(10): 247-249.

  12. 12. 王红, 姚君兰, 李艳蔷, 等. 基于主成分分析法的梁子湖水质评价分析[J]. 湖北大学学报, 2017, 39(6): 602-608.

  13. 13. 吉祝美, 方里, 张俊, 等. 主成分分析法在SPSS软件中的操作及在河流水质评价中的应用[J]. 环保科技, 2012, 18(4): 38-43.

  14. 14. 朱琳, 王雅南, 韩美, 等. 武水河水质时空分布特征及污染成因的解析[J]. 环境科学, 2018, 38(6): 2151-2155.

  15. 15. 李晓丰, 李兴华, 黄涛, 等. PCA水质分类法在通济堰水质评价中的应用[J]. 四川环境, 2016, 35(3): 41-45.

  16. 16. 黄飞. 三岔湖底泥污染物释放规律研究[D]: [硕士学位论文]. 四川: 西南交通大学, 2011: 6-7.

期刊菜单