设为首页 加入收藏 期刊导航 网站地图
  • 首页
  • 期刊
    • 数学与物理
    • 地球与环境
    • 信息通讯
    • 经济与管理
    • 生命科学
    • 工程技术
    • 医药卫生
    • 人文社科
    • 化学与材料
  • 会议
  • 合作
  • 新闻
  • 我们
  • 招聘
  • 千人智库
  • 我要投搞
  • 办刊

期刊菜单

  • ●领域
  • ●编委
  • ●投稿须知
  • ●最新文章
  • ●检索
  • ●投稿

文章导航

  • ●Abstract
  • ●Full-Text PDF
  • ●Full-Text HTML
  • ●Full-Text ePUB
  • ●Linked References
  • ●How to Cite this Article
Journal of Water Resources Research 水资源研究, 2013, 2, 389-394
http://dx.doi.org/10.12677/jwrr.2013.26055 Published Online December 2013 (http://www.hanspub.org/journal/jwrr.html)
An Application of Cross Entropy Method to the
Parameter Estimation in Flood Frequency Analysis*
Linsen Niu, Songbai Song#
College of Water Resources and Architectural Engineering, Northwest A&F University, Xianyang
Email: mail:nls1990@163.com, #ssb6533@nwsuaf.edu.cn
Received: Sep. 30th, 2013; revised: Nov. 20th, 2013; accepted: Nov. 26th, 2013
Abstract: This paper studies on the application of fractile constrained cross-entropy to the estimation of dis-
tribution parameters in flood frequency analysis. Based on the principle of minimum cross-entropy, two
annual maximum flood peak series respectively in Feather River in Canada and Zhangcunyi Station in north-
ern Shaanxi province with Gumbel distribution and Gamma distribution were employed to the parameter
estimation of the four distribution functions. Four frequency curves with the estimated parameters were also
plotted. Then, comparing the calculated cross-entropy values with those that are derived by traditional methods-
MOM and MLM, it turned out that: by using cross entropy method, we got the minimum cross entropy values.
The plotted theoretical frequency curves fit well with the empirical frequency curves. So, we can conclude
that the quantile constrained cross-entropy method has the considerable merit in the flood frequency
parameter estimation and is superior to the traditional methods-MOM and MLM.
Keywords: Cross Entropy; Fractile Constraints; Parameter Estimation; Flood Frequency Analysis
交互熵法在洪水频率分布参数估计中的应用研究*
牛林森,宋松柏#
西北农林科技大学,水利与建筑工程学院,咸阳
Email: mail:nls1990@163.com, #ssb6533@nwsuaf.edu.cn
收稿日期:2013 年9月30 日;修回日期:2013 年11 月20 日;录用日期:2013 年11 月26 日
摘 要:本文研究基于分位数对约束下的交互熵进行洪水频率分布参数估计方法。以加拿大 Feather
河和陕北地区张村驿站年最大洪峰流量序列为例,选取 Gumbel 和Gamma 分布,基于最小交互熵原理,
进行年最大洪峰流量序列分布参数估计,并根据估计参数推求洪峰流量频率曲线图。与矩法和极大似
然法所求熵值比较,结果表明:交互熵法获得最小熵值,频率点距拟合亦取得满意效果。因此,在考
虑分位数对约束的条件下,交互熵法能有效的估计分布参数,且较矩法和极大似然法优越。
关键词:交互熵;分位数对约束;参数估计;洪水频率分析
1. 引言
目前,在洪水频率分析中,虽已出现了许多非参
数方法[1],但是,在大多数研究和实际工作中,洪水
频率分析仍然作为一个参数推断问题来处理[2]。传统
的参数估计方法有矩法,极大似然法,概率权重矩法
等,它们的优劣性已被众多研究者讨论过[3]。为了改
进矩法估计,马秀峰于 1984年提出了权函数法,在样
本矩的计算中引入正态概率密度函数作为权函数,增
*基金项目:国家自然科学基金(51179160, 50879070, 50579065);高
等学校博士学科点专项科研基金(20110204110017)。
作者简介:牛林森(1990-),女,河南驻马店人,在读硕士生,主要
从事流域水文模拟及水文预报研究。宋松柏(1965-),男 ,陕 西 咸 阳
人,教授,博士,主要从事水文水资源教学与研究工作。
#通讯作者。
Open Access 389
牛林森,宋松柏:交互熵法在洪水频率分布参数估计中的应用研究
第2卷 · 第6期
加了靠近均值部分的权重,减小了两端部分的权重,
但是权函数属于单参数估计,不能全面地解决洪水频
率参数估计问题[4]。为了避免计算对数 P-Ⅲ分布中的
Cs,Rao 提出了混合矩法,在所提出的四种混合矩法
中,选择对数数据的均值、方差及原始数据均值作为
混合矩时,统计性能最优[2]。Hosking 在Greenwood
(1979)定义概率权重矩之后,于1990 年提出了线性矩,
该法是概率权重矩的线性组合,其最大特点是对洪水
系列中的极大值和极小值远没有常规矩那么敏感,所
以估计结果受样本中个别点据误差的影响较小,但该
法以概率作为权重来求矩,在各阶矩中,变数均为一
次幂,其阶次主要由其相应的概率(作为权重)来反映,
在推求参数时会引起误差和灵敏性问题[5]。另外,在
实际拟合中,常常出现中间部分拟合较好,但在两端
尤其是高尾部分拟合难以取得满意效果。针对这种情
况,Wang (1997)建议使用高阶概率权重矩,为序列中
的较大流量赋予更高的权重,该法求得频率曲线中上
部拟合效果良好[6,7]。Cohn 于1997年提出了 EMA
(Expected Moments Algorithm)算法,该法的主要思想
是在具有历史洪水的情形下,以矩法估计结果为初值,
充分考虑小于门限值 T (一般认为很大的洪峰流量)的
洪水资料,通过高效迭代提高洪水分位点估计精度和
收敛速度[8]。洪水本身就是一种非常复杂的水文现象,
准确描述其规律需要大量且较长的观测数据,在目前
的资料技术水平基础上,寻求更为有效的洪水频率参
数估计方法,提高洪水频率分析成果的合理性和可靠
性是一项非常重要的课题。
Kullback (1959)提出了交互熵的概念和最小交互
熵原理。与贝叶斯方法类似,采用先验分布和后验分
布,它们之间的概率距离(Probabilistic Distance)或直
接偏差(Directed divergence)称为交互熵。最小交互熵
原理即先验分布已知,且约束条件一定,候选分布中
能使交互熵函数最小化值的分布即为所求分布[9-12]。
Lind 和Solana于1988年提出用分位数对作为约束条
件的交互熵法,该法将观测数据直接进行数据编码,
从而产生分位数对约束,并在该约束条件下使交互熵
最小化。这种方法计算简单,后验分布函数满足单调
性和不变性的要求[13-15]。目前我国缺乏该法的应用研
究。本文以加拿大 Feather 河和陕北地区张村驿站年
洪峰流量序列为例,研究最小交互熵原理进行洪水分
布参数估计的普适性。
2. 分位数对约束下的交互熵法
该法包括两步:第一步,选定参考分布,并从样
本数据中推求出分位数对约束。第二步,选定一个后
验分布,使分位数约束下的交互熵最小化。
2.1. 分位数对约束
将随机变量
X
的观测序列 i
x
按升序值进行排
列,得到


i
Sx,1, 2,,ir

,i
x
R。假设
x
是一
个可能未来发生值。那么该值落在
X
由i
x
分成的
1r

个子区间




12
,,, ,xx 

,x

101
xx ,
rr
x
内是等可能
的,根据样本规则,对应的分位数概率为 1ir

。假
设


,
r
x
12
,,x xQx 是由数据集 S推断
X
的分布函
数,


,
r
x
12
,,x xqx 为相应密度函数。则分位数对约
束为


12
;,,, ,,1,2,
1
ri
i
i,
x
Qxxxxxir
r






(1)
2.2. Kullback最小交互熵原理
给定一个待选分布函数 和密度函数

Px


px,
在分位数 i
x
x

上,


Px值记为 。通过寻求后验分
布函数
i
p


,
r
x
12
,,x xQx ,使 Kullback-Leibler 交互熵
函数




12
12
,,,
,,,,log r
r
qxxxx
Dqpqxx xxx
px

d
(2)
满足分位数对约束(1)的条件下最小化。式(1) 可写
为期望值的形式,即


12
1
:,,,d0,1,2,,
1
ii r
I
g
fxqxxxx xir
r



(3)
式中,


i
f
x为指示函数,

1;
0;
i
i
x
I
fx 


其它 。
根据极值原理,引入拉格朗日乘子i

,有





1
12 12
12
1
,
, , ,log, , ,log
1
,,, d1
r
ii
i
rr
r
ii r
I
i
LDqpg
qxx xxqxx xxpx
fxqxxxx xr




















(4)
Open Access
390
牛林森,宋松柏:交互熵法在洪水频率分布参数估计中的应用研究
第2卷 · 第6期
为了获得 ,使交互熵最小,根据变分法中的
Euler-Lagrange 方程,若

px
 

,, d
b
a
I
Gxqxq xx

,
其中 G已知,则 满足

px

 
d0
d
GG
qxxq x









(5)
在式(4)中没有项,仅为 的函数。式(4)
仅对

qx


qx


qx求偏导,并令其为0,有


 
12
1
,,,
log1 0
r
r
ii
i
qxx xx
Lfx
qx px





(6)
进一步整理,有

 
 
12
1
,,,exp 1
r
ri
i
qxxxxpxfx
xpx









i


(7)
式中,
 
1
exp 1
r
ii
i
x
fx






。当 i
x
I,

 
exp 1
ii i
xx

 
。
把式(7)代入式(3)的左边,考虑 i
x
I,


1
i
fx

有


  
12
1
,,, d1
1
dd
11
ir
I
ii
II
fxqxxxxxr
fx xpxxpxx
rr



1






有


1
1
1
i
ii
rPP



(8)
因此,当 i
x
I,有


12
,,,
ri
qxx xxpx

 (9)
并可通过代换,有


12
,,, 1
ri
i
Qxx xxPxP
r

 


i

 (10)
把式(8)和式(9)代入式(2)中,有
 

0
,log
ri
i
i
px
Dqppx px



,
化简整理,有
 

1
0
1
,log 1log
1
r
ii
i
DqprP P
r

 
。
令, 为非负数。令
。则

log 1cr

1
0
r
ii
i
P P




c

SP


min ,1Dqp cSPr

 (11)
由式(11)可知,最小交互熵可以写成参考分布的
函数,并且


SP 值越小,式(11)的值越小,如果参考
分布已经选定,那么根据最小交互熵原理,说明该分
布的参数值最优。
3. 参考分布的选择
对于一个给定的随机样本来说,分位数对约束可以
通过数据编码求得,利用最小交互熵法将后验分布


12
,,,
r
Qxx xx看作是先验分布 的一个代数转
化。因此,参考分布必须尽可能的靠近后验分布和样本
点。本文选择Gumbel 分布和 Gamma 分布为参考分布。

Px
4. 应用实例
以加拿大的 Feather River 57年洪峰流量数据和
中国陕北的张村驿站 37年洪峰流量数据为例,选择
Gumbel 和Gamma 分布为参考分布,进行参考分布参
数的估计,并与矩法和极大似然法相对比。
4.1. 参考分布
Gumbel 密度与分布函数分别为
 



expe ;
xu
pxx ux




 

(12)



exp exu
Px


 (13)
Gamma 密度与分布函数分别为
 

1e
x
x
px





 (14)
 

,
1
x
Px



  (15)
4.2. 参数估计
首先,分别根据矩法和极大似然法求出估计分布
的参数,将矩法所求的参数作为初始值,然后利用优
化函数确定交互熵函数最小值及参考分布的分布参
数。
经计算,参数计算结果见表1~2。
4.3. 结果分析
表1显示,Feather 河选用 Gumbel 分布作为参考
Open Access 391
牛林森,宋松柏:交互熵法在洪水频率分布参数估计中的应用研究
Open Access
第2卷 · 第6期
392
Gumbel 分布,即分位数估计值更接近实测值。图2
显示,张村驿站在两种分布下拟合结果亦较好,但
Gamma 分布的拟合效果整体优于 Gumbel 分布。
分布进行参数估计时,矩法、极大似然法、交互熵法
分别求得的


SP

min ,Dq
值和 值呈减小的趋势,而
Gamma 分布所求值和值同Gumbel
分布规律一致,且所求值比Gumbel 分布小;而参数
估计值的计算结果分别为:Gumbel 分布中,极大似
然法计算所得 u值最大,交互熵法其次,矩法最小,
α值的计算结果为交互熵法所得值最大,矩法其次,
极大似然法最小;
Gamma 分布中,三个方法计算所得
u值相差不大,α值的计算结果为矩法最大,极大似
然法其次,交互熵法最小。表 2显示,张村驿站所求
值和值结果与 Feather 河存在相同的
规律,且 Gumbel 分布中,极大似然法计算所得λ值
最大,交互熵法其次,矩法最小,κ值的计算结果为
极大似然法所得值最大,交互熵法其次,矩法最小。

min ,Dqp

min





SP
p

,Dqp

SP
5. 结论与展望
本文以加拿大 Feather 河和陕北张村驿站为例,
探讨了分位数对约束条件下的交互熵法在洪水频率
分析参数估计中的应用,并与传统的矩法和极大似然
法相对比。结论与展望如下:
1) 在选择 Gumbel 和 Gamma两种参考分布时,
交互熵法求得的


SP值和 值均小于由其
它两种方法所求值,且采用 Gamma 分布求得的

min ,Dqp



SP
值和


min ,Dqp值较Gumbel 分布所求值小,说明在洪
水频率参数估计时,交互熵法优于传统的矩法和极大
似然法。
由以上分析结果可知,选用上述两种参考分布
时,交互熵法所求得的 值和值均是最
小,所以运用该法所求参数绘制频率曲线图,结果见
图1和图2。

SP

min ,Dqp 2) Feather 河和张村驿站的理论频率曲线与经验
点据的拟合效果均良好,
Gamma 分布的两条拟合曲线
均较相应站点Gumbel 分布下的拟合效果好,没有负
值段,说明本文的两个实例选用 Gamma分布线型更
合理。
图1显示,对于 Feather河,整体来说,两种分
布下,经验点据与分位数估计值拟合结果均比较理
想,但在高尾部拟合中,
Gamma 分布的拟合效果优于 3) 本文主要研究了分位数对为约束条件下,利用
Table 1. The parameters of Feather River for the annual maximum flood peak discharge
表1. Feather河洪峰流量分布参数计算结果
选用分布 估算方法 S(P) H(Dmin(q, p)) u或λ α或κ
矩法 352.0545 1.7732 2652.3285 0.0009
极大似然法 323.4119 1.2959 2785.0856 0.0006
Gumbel
交互熵法 292.9187 0.7876 1293.0598 0.0010
矩法 289.9769 0.7386 0.0009 1.8204
极大似然法 289.9578 0.7383 0.0009 1.7933
Gamma
交互熵法 289.9000 0.7373 0.0009 1.7434
Table 2. The parameters of Zhangcunyi Station for the annual maximum flood peak discharge
表2. 张村驿站年洪峰流量分布参数计算结果
选用分布 估算方法 S(P) H(Dmin(q, p)) u或λ α或κ
矩法 202.8352 1.2336 152.3158 0.0134
极大似然法 188.8355 0.8922 162.6435 0.0078
Gumbel
交互熵法 165.9407 0.3338 65.4722 0.0171
矩法 163.6595 0.2781 0.0119 1.3020
极大似然法 163.4675 0.2734 0.0139 1.5143
Gamma
交互熵法 163.3476 0.2705 0.0146 1.4960
牛林森,宋松柏:交互熵法在洪水频率分布参数估计中的应用研究
第2卷 · 第6期
(a) Gumbel 分布 (b) Gamma 分布
Figure 1. The fitting results of Feather River for the annual maximum flood peak discharge
图1. Feather河年最大洪峰流量频率曲线拟合结果
(a) Gumbel 分布 (b) Gamma 分布
Figure 2. The fitting results of Zhangcunyi Station for the annual maximum flood peak discharge
图2. 张村驿站年最大洪峰流量频率曲线拟合结果
参考文献 (References)
最小交互熵原理进行洪水频率分析参数估计的方法。
对于我国常用的P-III 型分布,目前缺少该法推求分布
参数的研究,把概率权重矩作为约束时,采用交互熵
法推求分布参数的方法有待进一步研究。
6. 致谢
本文系国家自然科学基金 (51179160, 50879070,
50579065) 和高等学校博士学科点专项科研基金
(20110204110017) 资助。在研究过程 中,作者十分感
谢Niels Lind教授的指导及提供文献资料,同时感谢
第十一届中国水论坛推荐。
[1] 董洁, 谢悦波, 翟金波. 非参数统计在洪水频率分析中的应
用与展望[J]. 河海大学学报(自然科学版), 2004, 32(1): 23-26.
DONG Jie, XIE Yuebo and ZHAI Jinbo. Application of non-
parametric statistic approach to flood frequency analysis and
prospect of its development trend. Journal of Hohai University
(Natural Sciences), 2004, 32(1): 23-26. (in Chinese)
[2] 丛树铮, 胡四一. 洪水频率分析的现状与展望[J]. 水文, 1987,
6: 52-58.
CONG Shuzheng, HU Siyi. Present situation and prospect of
flood frequency analysis. Hydrology, 1987, 6: 52-58. (in Chi-
nese)
[3] RAO, A.R., HAMED, K.H. Flood frequency analysis. New York:
CRC Press LCC, 2000: 127-186.
[4] 马秀峰. 计算水文频率参数的权函数法[J]. 水文, 1984, 3: 1-
11.
MA Xiufeng. The weighted function method applied in hydro-
Open Access 393
牛林森,宋松柏:交互熵法在洪水频率分布参数估计中的应用研究
第2卷 · 第6期
logic frequency parameters calculation. Hydrology, 1984, 3: 1-
11. (in Chinese )
[5] 陈元芳, 沙志贵, 陈剑池等. 具有历史洪水时 P-III 分布线性
矩法的研究[J]. 河海大学学报, 2001, 29(4): 76-80.
CHEN Yuanfang, SHA Zhigui, CHEN Jianchi, et al. Study on L-
moments estimation method for P-III distribution with historical
flood. Journal of Hohai University, 2001, 29(4): 76-80. (in Chi-
nese)
[6] 李扬, 宋松 柏. 高阶概率权重矩在洪水频率分析中的应用[J].
水力发电学报, 2013, 32(2): 14-21.
LI Yang, SONG Songbai. Application of higher-order probabil-
ity-weighted moments to flood frequency analysis. Journal of
Hydroelectric Engineering, 2013, 32(2): 14-21. (in Chinese)
[7] WANG, Q.J. Using higher probability weighted moments for
flood frequency analysis. Journal of Hydrology, 1997, 194(1):
95-106.
[8] COHN, T.A., LANE, W.L. and BAIER, W.G. An algorithm for
computing moments-based flood quantile estimates when his-
torical flood information is available. Water Resources Research,
1997, 33(9): 2089-2096.
[9] DENG, J., PANDEY, M.D. and GU, D. Extreme quantile estima-
tion from censored sample using partial cross-entropy and frac-
tional partial probability weighted moments. Structural Safety,
2009, 31(1): 43-54.
[10] PANDY, M.D. Extreme quantile estimation using order statistics
with minimum cross-entropy principle. Probabilistic Engineer-
ing Mechanics 2001, 16(1): 31-42.
[11] 茆诗松. 贝叶斯统计[M]. 北京: 中国统计出版社, 1999: 1-6.
MAO Shisong. Bayesian statistics. Beijing: China Statistics
Press, 1999: 1-6. (in Chinese)
[12] SHORE, J.E., JOHNSON, R.W. Axiomatic derivation of the
principle of maximum entropy and the principle of minimum
cross-entropy. IEEE Transformation on Information Theory,
1980, 26(1): 26-37.
[13] 黄振平. 水文统计学[M]. 南京: 河海大学出版社, 2008: 169-
171.
HUANG Zhenping. Hydrological statistics. Nanjing: Hohai Uni-
versity Press, 2008: 169-171. (in Chinese)
[14] LIND, N.C. and HONG, H.P. A cross entropy method in flood
frequency analysis. Stochastic Hydrology and Hydraulics, 1989,
3(3): 191-192.
[15] LIND, N.C. and SOLANA, V. Fractile constrained entropy
estimation of distributions based on scarce data. Civil Engineer-
ing Systems, 1990, 7(2): 87-93.
Open Access
394

版权所有:汉斯出版社 (Hans Publishers) Copyright © 2012 Hans Publishers Inc. All rights reserved.