Hans Journal of Data Mining 数据挖掘, 2013, 3, 1-5 http://dx.doi.org/10.12677/hjdm.2013.31001 Published Online January 2013 (http://www.hanspub.org/journal/hjdm.html) City Atmospheric Quality Optimal Assessment Based on Combined Model* Li Xiao, Xian gh ong Hu, Guoquan Z h ang College of Science, South China Agricultural University, Guangzhou Email: scauxl@tom.com Received: Oct. 9th, 2012; revised: Oct. 30th, 2012; accepted: Nov. 7th, 2012 Abstract: This paper puts forward a new atmospheric quality assessment method that is, according to the combinatorial theories, using Goodness of Fit method to get weights to combine three models which are air pollution index method, cloud model and Projection Pursuit Grade method. The combined model is applied to the Hong Kong atmospheric qual- ity assessment; the results show the method increases the evaluation performance, possesses more reliability and com- prehension, and provides a new idea for the city atmospheric quality synthetically assessment. Keywords: Combined Model; Atmospheric Quality; Assessment 基于组合模型的城市空气质量评价优化法* 肖 莉,胡湘红,张国权 华南农业大学理学院,广州 Email: scauxl@tom.com 收稿日期:2012 年10 月9日;修回日期:2012 年10 月30 日;录用日期:2012 年11 月7日 摘 要:本文提出一种新的空气质量评价方法,即应用组合原理,以拟合优度法确定权重组合三个模型(API 法, 云模型及粒子群投影寻踪法),并将之应用于香港空气质量评价中,实例表明该方法增加了评价性能,具有较强 的可靠性和全面性,为城市空气质量综合评价方法提供了一种新思路。 关键词:组合模型;空气质量;评价 1. 引言 我国正处于工业化和城市化发展的快速时期,而 环境质量仍在不断恶化,尤其是近年以来,由于经济 持续高速增长,使得环境压力明显增大,长期积累的 环境风险开始出现。在诸多环境问题中,空气污染造 成的损失尤其巨大,空气质量的控制成为各国环保机 构面临的一个重要课题,然而,要合理控制空气质量 的恶化,首先得对空气质量做出科学的评价,只有这 样才能有针对性的进行改善。目前国内外关于空气质 量评价方法的研究十分活跃,除了常用的方法如空气 污染指数法(Air Pollution Index,简称 API 法)、人工 神经元网格法、模糊聚类法、主成分分析法、灰色系 统分析法[1-4]等之外,随着一些新学科的创立和计算技 术的发展,又有多种大气环境质量分析与评价的新方 法,如云模型法[5,6]、投影寻踪分析法[7,8]等。 然而由于大气环境系统是一个包括随机性、模糊 性、灰色性和不相容性等多种不确定性信息的系统, 因此,在实际应用中,仅采用上述单一的理论或分析 工具处理环境信息具有一定的局限性,此外,在选择 了某种方法后,不可避免的会丢失另外一些有用信 息,从而导致评价误差相对较大[9]。为了尽可能多地 利用有用信息,1969 年J. N. Bates和C. W. J. Granger *基金项目:广东省自然科学基金项目(S2011010002371)。 Copyright © 2013 Hanspub 1 基于组合模型的城市空气质量评价优化法 在运筹学季刊中,提出了“组合预测”的思想。根据 组合定理,即使一个评价结果不理想的方法,如果它 含有系统的独立信息,当与另一个较好的评价方法进 行组合后,同样可以增加系统的评价性能[10,11]。因 此 , 组合评价能够更大化地利用有用信息,比单一评价方 法更为科学、有效。本文采用 API 指数、雷达图面积 –云模型评价和粒子群投影寻踪这 3种方法分别对城 市空气质量进行评价,再运用组合原理,利用拟合优 度法确定权重,结合上述三种方法构建组合模型来综 合反映城市空气质量。 2. 研究方法 2.1. API评价模型 空气污染指数(AIR POLLOTION INDEX,简称 API)是将环境保护署在每个空气质量监测站所录得 的空气污染物含量,如 SO2、可吸入悬浮粒子、NO2、 CO、O3,转化为一个简单易明的数字,其数值由 0 至500 不等,并分级表征空气质量状况与空气污染的 程度,结果简明直观,使用方便,适用于表示城市的 空气质量状况和变化趋势。 2.1.1. 计算各污染物的污染分指数 各项污染物的分指数 i I ,由实测的污染物浓度值 ,按照分段线性方程计算,对于第 i种污染物的第 j个转折点 的污染分指数和相应的浓度限值 见表 1。 i C ,1 ,, , ij ij CI 当第 i种污染物浓度 时,其分指 数为: ,ij i ij CCC Table 1. Classification for Hong Kong air pollution index and its corresponding pollutant potencies limited value 表1. 香港空气污染指数分级及对应的污染物浓度限值表 相应污染物浓度(微克/立方米) 污染水 平 等级 API指数 可吸入 悬浮粒子 SO2 NO2 CO O3 轻微 Ⅰ 25 28 40 40 750060 中等 Ⅱ 50 55 80 80 15,000120 偏高 Ⅲ 100 180 350 150 30,000240 甚高 Ⅳ 200 350 800 280 60,000400 Ⅴ 300 420 1600 565 90,000800 Ⅵ 400 500 2100 750 120,0001000 严重 Ⅶ 500 600 2620 940 150,0001200 , ,1 ,, ,1 , 1,2, ,;1,2, , iij iij ij ij CC III CC injm ijij I (1) 计算(1)式时, ,ij I ,,1ij I ,,等 4个参 数值可通过查表 1得到。 ,ij C,1ij C 当C时,选择点 及点 ,ii Cm,1 ,1 , im im CI ,im, , im CI 来确定线性函数,其分指数为: ,1 ,,1, ,,1 iim iimim im im CC III CC 1im I (2) 2.1.2. 确定空气污染指数及首要污染物 当各种污染物的污染分指数计算出后,按下列公 式确定 API: 123 max,,,,, , in A PII IIII (3) 即选污染物分指数最大者为该区域空气污染指 数 A PI AP ,并确定该污染物为首要污染物。当空气污染 指数 50I 时,不报告首要污染物。 2.2. 基于雷达图面积的云模型评价 针对空气污染的特点,本文选取雷达图的面积作 为特征量,对多元数据进行融合从而降维,根据云模 型理论的基本特征,用 ,,Ex En He三个数字特征来整 体表征一个具体概念,结合云模型定性与定量转换思 想进行转换,构造描述空气质量评价所用的语言值。 应用正向云进行空气质量的定量评价,应用逆向云进 行基础指标的定性分析,从而得到符合人类思维方式 的及模糊性与随机性为一体的定性和定量集成的空 气质量综合评价结果。图 1是基于雷达图的云模型原 理图。 Figure 1. Theory chart of cloud model based on radar chart 图1. 基于雷达图的云模型原理图 Copyright © 2013 Hanspub 2 基于组合模型的城市空气质量评价优化法 2.3. 粒子群投影寻踪等级评价模型 投影寻踪(Projection Pursuit,PP)方法能充分利用 高维数据中的所有信息,它利用计算机把高维数据通 过某种组合,投影到低维子空间上,以达到研究和分 析高维数据的目的[12,13]。传统的投影寻踪算法常用遗 传算法寻找模型的最优值,但遗传算法实现过程复 杂,并且有多个参数需要调整,而粒子群算法简单、 易于实现,因此本文以粒子群优化算法替代遗传算 法,建立基于粒子群算法的投影寻踪等级评价模型 (PSO-PPE),PSO-PPE 模型建立的流程见图 2。 2.4. 组合评价模型及权重的确定 API 法计算方便,能够直观地显示首要空气污染 物的信息,有利于普通公众了解空气环境质量的优 劣,但该方法片面地重视单一样本数据的最大观测 值,没有考虑不同等级的多种污染物对分类的共同影 响。雷达图可将评价对象的各项指标映射到二维图形 中,直观形象,而云模型方法除能保留传统定性划分 的优点外,也更加符合实际的数据分布和人的思维方 式,雷达图和云模型的结合是一种有效的、可视化的 定性定量相结合的综合评价法,但该方法的缺点是计 算雷达图面积时会导致信息损失较大,确定云的三个 数字特征时主观性太强。粒子群投影寻踪法依据样本 Figure 2. Flow chart of PSO-PPE model 图2. PSO-PPE模型流程图 自身的数据特性 通过线性投影 了高 2.4.1. 组合评价模型 M种评价方法,经过分析,可 以确 i ti y (4) 其中,为第 t个样本的组合评价值; 为第t个样 2.4.2. 的确定 和不等权组合两种形式, 但实验表 寻求最优的投影方向, 计算反映评价样本综合特征信息的投影特征指标,根 据这一指标可以形象、直观地对样本进行分类或评 价,避免了诸如各评价因素权重确定的人为任意性。 API 法、雷达图云模型法、PSO-PPE 法分别考虑 值影响与平均影响,部分样本和全体的数据特 征,因此,将这 3种方法应用组合模型方法进行分析 与评价,可以发挥各模型的优势,避免单一模型在因 素与函数关系方面的弊端,有利于提高评价的准确性 以及反应信息的全面性。 假设对某一问题有 定第i种方法的权重 1, 2,,wi M,那么组合 模型可表示为: i 1 ˆ M t i Yw t Y 权重 ˆti y 本第 i种评价模型的评价值, M。 1 1 i i w 组合模型常用等权组合 明不等权的组合结果较为准确。由于本文三 种评价模型的结果较分散,采用拟合优度法确定权 重。该模型能予以预测标准误差最小的模型以最大的 权重,使预测结果保证拟合优度,权重公式定义如下: 1 1 1 1 M ii i iM i i Se Se wM Se (5) 2 1 1 n ti t i i yy Se n (6) 式中为第t个样本的实际值。 3. 研究结果与分析 3.1. 数据收集 选取 2011 年1~12 月香港 14 个监测点每天 24 小 时的监测 i.htm)。 t y 数据,数据来源于香港环保署网站 (http://www.gov.hk/sc/residents/environment/air/ap 监测的污染物为:SO2、可吸入悬浮粒子、NO2、CO、 Copyright © 2013 Hanspub 3 基于组合模型的城市空气质量评价优化法 O3,香港空气质量评价标准参见表 1,图 3是14 个监 测点的分布图。 3.2. 评价结果 使用组合评价模型时,首先要确定各种方法的权 重, 从表 ,香港 2011年12 月大部分地区空气 质量 测站 珠三角的东涌观测站空气质量为Ⅲ 级, 根据表 1,运用SAS 统计软件随机模拟不同级别 的空气质量污染物浓度样本,以及API 指数法,云模 型评价法,粒子群投影寻踪法评价结果,代入公式(5), 得到三个模型的权重分别为(0.2520,0.2976,0.4504)。 表2是香港 2011 年12 月份 14 个监测点的空气质量 评价结果,图4是香港 2011 年12 月份空气质量监测 预警图。 3.3. 结果分析 2可知 为Ⅱ级,处于中等水平。同时图 4显示香港 2011 年12 月的空气质量一般,污染程度较高,达到Ⅲ级。 结合图 3和表 2分析,从香港空气质量的路边检 点和香港主要道路交通情况来看,路边检测站有 中环、铜锣湾和旺角,是主要道路密集的地方,实际 污染程度大,而表 2的结果显示,利用 API 法、云模 型和 PS0-PPE 模型评价出旺角的空气质量为Ⅱ级,处 于中等水平,这与实际不符合,而组合模型对旺角空 气质量评价的结果为Ⅲ级,处于污染偏高水平,与客 观实际一致。 此外,靠近 污染处于偏高水平;利用 API 法可以分析主要污 Figure 3. The distribution chart for fourteen air quality monitoring Table 2. Air quality evur models for four- 表 API 法 组合模型 points in Hong Kong 图3. 香港 14 个空气质量监测点分布图 aluation results from fo teen monitoring points in Hong Kong 2. 四个模型对香港 14个监测点,2011 年12 月份空气质量评价 结果 监测点 API 评价 污染 级 云模型 PS0-PPE 模型 组合 评 污染 值等价值 等级 中西区 58 Ⅱ级 Ⅱ级 Ⅱ级 2.252 Ⅱ级 东区 53 Ⅱ级 Ⅱ级 Ⅱ级 2.252 Ⅱ级 大浦 57 Ⅱ级 Ⅱ级 Ⅱ级 2.252 Ⅱ级 葵涌 57 Ⅱ级 Ⅱ级 Ⅱ级 2.252 Ⅱ级 观塘 55 Ⅱ级 Ⅱ级 Ⅱ级 2.252 Ⅱ级 沙田 56 Ⅱ级 Ⅱ级 Ⅱ级 2.252 Ⅱ级 深水涉 铜锣湾 中10 56 Ⅱ级 Ⅱ级 Ⅱ级 2.252 Ⅱ级 塔门 53 Ⅱ级 Ⅱ级 Ⅱ级 2.252 Ⅱ级 东涌 62 Ⅱ级 Ⅱ级 Ⅲ级 2.704 Ⅲ级 荃湾 57 Ⅱ级 Ⅱ级 Ⅱ级 2.252 Ⅱ级 元朗 63 Ⅱ级 Ⅱ级 Ⅱ级 2.252 Ⅱ级 102 Ⅲ级 Ⅱ级 Ⅲ级 2.9544Ⅲ级 旺角 64 Ⅱ级 Ⅱ级 Ⅱ级 2.7024 Ⅲ级 环站 3 Ⅲ级 Ⅱ级 Ⅲ级 2.9544 Ⅲ级 Figure 4. Air quality monitoring and warning chart based on com- bination model in Hong Kong (data used in December, 2011) 2 度法确定 API、雷达图云模型和 PSO- PPE 图4. 基于组合模型的香港 2011年12 月空气质量监测预警图 染物来源,路边监测点主要以 NO 为主,其它监测点 主要为可悬浮颗粒。 4. 结论 1) 用拟合优 组合模型的权重,避免了主观确定权重的随意性, 有效地解决了空气质量污染评价问题,且结果合理, 与实际符合,计算简便。 Copyright © 2013 Hanspub 4 基于组合模型的城市空气质量评价优化法 Copyright © 2013 Hanspub 5 利用已知信息,提高多因 子综 合模型应用于空气质量评价是完全 可行 参考文献 (References) 识别法评价大气环境质量—— 2) 应用组合定理,充分 合评价精度,评价结果清楚,反映整体空气质量 的级别和优劣,可相互比较,具有一定的可行性和实 用性。 3) 本文的组 的,不仅可以判定污染的等级,还便于在样本间 进行污染程度的比较,结果与其它方法基本一致,为 城市空气质量的判定提供了新的思路。 [1] 袁秀娟, 毛显强. 用改进的灰色 以北京市石景山区为例[J]. 环境科学与技术, 2006, 29(9): 71- 73. [2] B. Fisher. Fuzzy environmental decision-making: Applications to air pollution. Atmospheric Environment, 2003, 37(14): 1865- 1877. [3] W. X. Li, X.-X. Zhang, B. Wu, et al. A comparative analysis of environmental quality assessment methods for heavy metal-con- taminated soils. Chemosphere, 2008, 18(3): 344-352. [4] 高俊枝, 程鹰. 安徽省宣州市大气环境质量的 API 评价[J]. 安徽师范大学学报(自然科学版), 2000, 23(2): 166-168. [5] 付赟, 方德英. 雷达图法在综合评价中的应用研究[J]. 统计 与决策, 2007, 252(24): 176-178. [6] 邸凯昌, 李德毅, 李德仁. 云理论及其在空间数据发掘和知 识发现中的应用[J]. 中国图像图形学报, 1999, 4(11): 930- 935. [7] 王顺久, 李跃清. 基于投影寻踪原理的动态聚类模型及其在 气候区划中的应用[J]. 应用气象学报, 2007, 18(5): 722-725. [8] J. H. Friedman, W. Stuetzle. Projection pursuit regression. Jour- nal of the American Statistical Association, 1981, 76(376): 817- 823. [9] 陈大伟, 李旭宏, 于世军, 朱彦东. 我国城市开发区客运交通 需求预测方法研究[J]. 交通运输系统工程与信息, 2004, 1: 80-83. [10] 张世英, 张文泉, 王京芹. 技术经济预测与决策[M]. 天津: 天津大学出版社, 1996: 9. [11] 刘思峰, 党耀国. 预测方法与技术[M]. 北京: 高等教育出版 社, 2005: 8. [12] 王允良, 李为吉. 粒子群优化算法及其在结构优化设计中的 应用[J]. 机械科学与技术, 2005, 24(2): 248-252. [13] 黄婉平. 自适应粒子群优化算法及其应用研究[D]. 浙江大学, 2006. |