受径流、潮汐、地形、风向等多重因素影响,珠江河口区咸潮上溯现象异常复杂。本文运用支持向量机回归(SVR)与分类(SVC)联合建模的方法,综合考虑上游径流和河口区潮汐因素,构建珠江河口区磨刀门水道咸潮上溯预测模型,并采用动态反馈机制分别开展了磨刀门水道日均咸度和超标历时预测。研究结果表明:基于支持向量机的咸潮上溯模型,具有模型简单精度高,样本容量要求少,自学习与联想记忆能力强的特点,能较好模拟预测多重因素影响的复杂河口区咸潮上溯现象;磨刀门水道上游三水马口前三日流量、河口区前三日三灶站的平均潮差过程与咸潮上溯具有较好时间相关性。 Effected by multiple factors such as upstream runoff, tide, topography, and wind, the saltwater in-trusion of Pearl River Estuary displays extreme complexity. In this paper, a hybrid method based on Support Vector Machine (SVR) and Classification (SVC) is used to build a daily average salinity prediction model in the Pearl River Estuary which has considered the variation of upstream runoff and tide. The result shows that the model for saltwater intrusion prediction has high accuracy and only requires a few samples. Furthermore, the model has a good ability of self-learning and asso-ciative memory which can well simulate the complex saltwater intrusions of this estuary. The findings of this study also show that the previous average three-day runoff from upstream and the previous three-day tidal range from outlet have a good time correlation with saltwater intrusion in this estuary.
柯华斌1,刘丙军1*,章文1,陈仲策2
1中山大学地理科学与规划学院水资源与环境系,广东 广州
2广东省水利水电技术中心,广东 广州
Email: 149449192@qq.com, *liubj@mail.sysu.edu.cn
收稿日期:2014年12月16日;录用日期:2014年12月30日;发布日期:2015年1月16日
受径流、潮汐、地形、风向等多重因素影响,珠江河口区咸潮上溯现象异常复杂。本文运用支持向量机回归(SVR)与分类(SVC)联合建模的方法,综合考虑上游径流和河口区潮汐因素,构建珠江河口区磨刀门水道咸潮上溯预测模型,并采用动态反馈机制分别开展了磨刀门水道日均咸度和超标历时预测。研究结果表明:基于支持向量机的咸潮上溯模型,具有模型简单精度高,样本容量要求少,自学习与联想记忆能力强的特点,能较好模拟预测多重因素影响的复杂河口区咸潮上溯现象;磨刀门水道上游三水马口前三日流量、河口区前三日三灶站的平均潮差过程与咸潮上溯具有较好时间相关性。
关键词 :珠江河口区,咸潮上溯,支持向量机
受上游径流、河口区潮汐动力、河口地形、风力风向等多重因素影响[
当前,咸潮上溯预测模型研究主要包括数学模型与物理模型两类。现行数学模型多以数值模拟为主,难以准确描述众多因素对咸潮入侵的影响,如一维或二维数值模型都因无法模拟垂向密度差异等因素的影响导致咸潮预测效果欠佳[
本文从统计学习理论角度,利用支持向量机对小样本、非线性问题的自组织、自学习和联想记忆等优势,综合考虑径流、潮汐对咸潮上溯的影响,运用支持向量机回归(SVR)和分类(SVC)联合建模的方法,建立了咸潮上溯预测模型,并采用动态反馈机制分别对逐日最大咸度和超标历时进行了预测。
本文选取平岗站为研究站点,平岗站位于磨刀门水道中游河段,距出海口35 km,该站点每年的盐度序列数据代表性良好,能较好反映每年咸潮入侵磨刀门水道的基本情况,是珠海市重要的取水泵站。根据珠江三角洲的水力条件,选用马口水文站与三水水文站的日均合流量(简称马 + 三流量)作为上游来水资料,马口站及三水站具备长序列流量资料,其径流量变化特征具有良好的代表性。下游潮汐资料选用三灶站,该站距离磨刀门16 km左右,其潮位特征同时受外海潮汐、上游径流来水来沙以及河口区地形条件影响,是珠江河口区最重要验潮站之一。磨刀门水道及各测站位置示意图见图1。
支持向量机是建立在统计学习理论的VC维理论和结构风险最小化原则上的,根据有限的样本信息在模型复杂性与学习能力之间寻求最佳折衷,以求获得最佳推广能力的新型学习方法。它具有回归拟合与分类识别功能,在解决小样本、非线性及高维问题中有很强的优势。
1) 支持向量机回归(SVR)
支持向量机回归问题是利用非线性变换将样本映射到高维特征空间(Hilbert空间),从而将输入空间中的非线性函数估计问题转化为高维特征空间中的线性函数估计问题。同时将其最小化风险函数等价如下优化问题:
式中,
图1. 研究区域位置图
2) 支持向量机分类(SVC)
支持向量机分类问题原理与SVR类似,将输入空间通过非线性变换映射到高维特征空间,构造线性的最优分类超平面。其最小化风险函数可等价如下优化问题:
式中,
1) 基于SVR的日均咸度预测模型
珠江口咸潮上溯受上游径流和下游潮汐作用明显[
式中,
为消除变量量纲影响,减少训练过程中数值运算的复杂程度,采用比例压缩法对样本数据归一化处理;选取高斯径向基(RBF)函数作为核函数[
2) 基于SVC的超标历时预测模型
运用支持向量机分类(SVC)的识别功能,对超标历时进行识别分类,从而预测超标历时过程,分类标准见表1。模型输入端考虑上游马 + 三流量、下游三灶站日潮差过程、平岗站的日均咸度等历史资料;输出端为预测当天平岗站的日超标历时类别。超标历时预测模型如下:
超标历时(h) | 0~4 | 5~9 | 10~14 | 15~19 | 20~24 |
---|---|---|---|---|---|
类别(级别) | 1 | 2 | 3 | 4 | 5 |
表1. 日超标历时分类标准
式中,
为评价模型的拟合效果,分别选用效果系数、一致性指标、分类准确率等三个拟合度度量指标表征。
1) “效果系数”(coefficient of efficiency),用E表示。效果系数E愈接近1,则说明预测值愈接近实测值,但效果系数E对系列中的极值是敏感的,因此需要结合一致性指标D判断来消除此影响。
2) “一致性指标”(index of agreement),用D表示。一致性指标D的取值在0~1之间,取值越大,说明模型预测值变化与实测值越一致。
3) 分类准确率,用T表示。是用来衡量模型分类结果准确性的指标。
式中,
选取2003年12月1日至 2004 年 2 月 29 日 的实测资料(上游马 + 三流量、三灶站日潮差与平岗站日均咸度同步资料)为计算样本。其中,选用 2003 年 12 月 1 日 至 2004 年 1 月 31 日 的数据作为训练集,选取 2004 年 2 月 1 日 至2月29日共29天的数据作为模型检验样本。
比较不同径流、潮汐序列组合输入的模型模拟结果(见表2),发现当输入条件选择前三日马 + 三流量
输入变量 | ||||||||
---|---|---|---|---|---|---|---|---|
E | D | E | D | E | D | E | D | |
0.8739 | 0.9656 | 0.7367 | 0.9194 | 0.7631 | 0.9292 | 0.7247 | 0.914 | |
0.8217 | 0.9448 | 0.8449 | 0.9556 | 0.8767 | 0.9664 | 0.8399 | 0.9541 | |
0.7921 | 0.9369 | 0.8156 | 0.9452 | 0.7887 | 0.9375 | 0.8176 | 0.9458 | |
0.9081 | 0.9749 | 0.8362 | 0.9515 | 0.8804 | 0.967 | 0.8145 | 0.9444 |
表2. 不同径流与潮差组合输入的模型模拟结果对比
注:
不敏感参数
为分析模型的预测精度,分别对比了普通SVR模型(未采用动态反馈机制)、常用BP神经网络模型和动态反馈SVR模型的预测结果,结果见图3。其中,动态反馈机制,是将模型执行过一天的预测,作为最新的当天实测数据加入训练集并重新训练模型,通过动态反馈机制使模型在使用过程中不断提炼。分析图4,动态反馈SVR模型的预测效果最好,测试集效果系数E达到0.9779,一致性指标D达到0.9941;普通SVR模型测试集效果系数E只有0.8167,一致性指标D只有0.9391;由于样本数目较少,导致BP神经网络模型的训练神经网络并不成熟,泛化能力较差,其测试集效果系数E只有0.7706,一致性指标D也只有0.9118。由此可见,支持向量机在小样本的学习问题更为出色,动态反馈机制也能有效地提高模型预测精度。
比较不同径流、潮汐组合输入的超标历时预测模型模拟结果,见表3。当输入选择前三日马 + 三流
图2. 日均咸度预测模型参数优选与模拟结果
图3. 日均盐度模型预测结果对比图
量
参数优选,确定模型参数C = 1,g = 5.6569。具体参数优选和模拟结果见图4。
加入动态反馈机制,分析普通SVC模型、常用BP神经网络模型和动态反馈SVC模型的预测效果(图5)。
图4. 日均咸度超标历时模型参数与模拟结果
图5. 日均盐度超标历时模型预测结果对比图
输入变量 | ||||
---|---|---|---|---|
98.31% | 98.31% | 98.31% | 98.31% | |
98.31% | 98.31% | 98.31% | 98.31% | |
98.31% | 98.31% | 98.31% | 98.31% | |
100% | 98.31% | 98.31% | 98.31% |
表3. 不同径流与潮差组合输入的超标历时分类模拟结果(T) (单位:%)
可以得出,动态反馈SVC模型的测试集预测分类准确率最理想,达到93.10%,较普通SVC模型的分类准确率提高了6.90%;BP神经网络模型的分类预测效果明显欠佳,分类准确率只有55.2%。表明动态反馈SVC模型能更好地预测超标历时分类。
受径流、潮汐、地形、风向等多重因素影响,珠江河口区咸潮上溯现象异常复杂。本文尝试运用支持向量机回归(SVR)与分类(SVC)联合建模方法,综合考虑上游径流和河口区潮汐因素,建立珠江河口区磨刀门水道咸潮上溯预测模型,得出以下结论:
1) 支持向量机方法具有很强的自组织、自学习与联想记忆能力,能较好应用于咸潮上溯这种资料较为缺乏的小样本、非线性问题。本文构建的基于支持向量机的咸潮上溯预测模型,采用动态反馈机制,能较好模拟磨刀门水道平岗站日均咸度和超标历时,模型预测效果明显优于人工神经网络。
2) 通过比较模型不同径流、潮汐组合输入的模型计算结果,确定前三日马+三流量序列和前三日三灶站平均潮差序列为最佳输入条件。
广东省水利科技创新项目(2013-13);国家自然科学基金项目(50909106,51009156);广东省科技计划项目(2011B0308 00008)。
柯华斌,刘丙军,章 文,陈仲策, (2015) 基于支持向量机的珠江河口咸潮上溯预测研究Study on Prediction of Saltwater Intrusion Based on Support Vector Machine in the Pearl River Estuary. 水资源研究,01,46-54. doi: 10.12677/JWRR.2015.41006