结合丹江口水库下游沙洋站历来四大家鱼产卵时的水文数据资料,选取8个生态水文指标,采用主成分分析法进行相关分析。结果表明,影响四大家鱼的关键生态调控因子为:洪峰初始水位、洪峰初始流量、流量日上涨率、水位上涨幅度。这样可以简化水库生态调控时的难度,对生态修复具有一定的指导意义。 Based on the historical hydrological data of the four major Chinese carps spawning at the Shayang Sta-tion in the lower reaches of Danjiangkou Reservoir, eight ecological hydrological indicators were se-lected to analyze the correlation between the ecological hydrological indicators and spawning using principal component analysis (PCA) method. The results show that the key ecological control factors of the influence of four major Chinese carps are flood peak initial water level, flood peak initial flow, rise rates of flow in one day , range of water level during the flood . This will greatly simplify the difficulty of the reservoir ecological regulation, and have certain guide of the ecological restoration.
结合丹江口水库下游沙洋站历来四大家鱼产卵时的水文数据资料,选取8个生态水文指标,采用主成分分析法进行相关分析。结果表明,影响四大家鱼的关键生态调控因子为:洪峰初始水位、洪峰初始流量、流量日上涨率、水位上涨幅度。这样可以简化水库生态调控时的难度,对生态修复具有一定的指导意义。
四大家鱼,产卵,主成分分析法,生态因子
Jie Li, Weizheng Kong
Hubei Provincial Hydrological Water Resources Emergency Monitoring Center, Wuhan Hubei
Received: Feb. 4th, 2021; accepted: Apr. 23rd, 2021; published: Apr. 30th, 2021
Based on the historical hydrological data of the four major Chinese carps spawning at the Shayang Station in the lower reaches of Danjiangkou Reservoir, eight ecological hydrological indicators were selected to analyze the correlation between the ecological hydrological indicators and spawning using principal component analysis (PCA) method. The results show that the key ecological control factors of the influence of four major Chinese carps are flood peak initial water level, flood peak initial flow, rise rates of flow in one day , range of water level during the flood . This will greatly simplify the difficulty of the reservoir ecological regulation, and have certain guide of the ecological restoration.
Keywords:Four Major Chinese Carps, Spawning, Principal Component Analysis, Eco-Hydrological Factors
Copyright © 2021 by author(s) and Wuhan University.
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
青鱼(Mylopharyngodon piceus)、草鱼(Ctenopharyngodon idellus)、鲢鱼(Hypophthalmichthys molitrix)、鳙鱼(Aristichthys mobilis),俗称“四大家鱼”,是我国主要的淡水养殖和捕捞对象,在淡水渔业中占有很大的比例。汉江是我国著名的四大家鱼天然产卵场的分布区之一 [
目前,对四大家鱼产卵的研究中,李翀等 [
和上述研究一样,一些研究 [
本主成分分析法(Principal Component Analysis)简称PCA,是将高维变量空间进行降维处理的一种方法。在保证原始数据信息损失最小的前提下,经过线性变换和舍弃部分信息,以少数综合变量取代原有多维变量,使较少的综合指标既能尽量多地反映原来变量指标信息,同时它们之间又是相互独立的。根据PCA基本原理。一般的计算过程如下 [
1) 建立n个样本p个指标的原始数据矩阵 X = [ x i j ] ( i = 1 , 2 , ⋯ , n ; j = 1 , 2 , ⋯ , p ) ,对其进行无量纲化或标准化处理。通常采用z-score法无量纲化,得到矩阵计算公式为:
x ′ i j = ( x i j − x ¯ j ) / s j (1)
其中: x ¯ j = 1 2 ∑ i = 1 n x i j , s j = ∑ i = 1 n ( x i j − x ¯ j ) 2 n − 1 。
2) 计算指标相关系数矩阵 R = [ r i j ] ( i , j = 1 , 2 , ⋯ , p ) ,其计算公式为:
r i j = ∑ k = 1 n ( x k i − x ¯ i ) ( x k i − x ¯ j ) ∑ k = 1 n ( x k i − x ¯ i ) 2 ( x k i − x ¯ j ) 2 (2)
式中:R为实对称矩阵,只需计算上三角元素或下三角元素即可。
3) 根据特征方程 | λ I − R | = 0 ,求特征向量 λ i ( i = 1 , 2 , ⋯ , p ) ,并对进行排序,即 λ 1 ≥ λ 2 ≥ ⋯ ≥ λ p ≥ 0 ;再分别求对应于 λ i 的特征向量 e i ( i = 1 , 2 , ⋯ , p ) ,这里要求 ‖ e i ‖ = 1 ,即 ∑ j = 1 p e i j 2 = 1 ,表示向量ei的第j个分量。
4) 计算各主成分的贡献率及累计贡献率。贡献率为:
C i = λ i / ∑ k = 1 p λ k ( i = 1 , 2 , ⋯ , p ) (3)
累计贡献率计为:
D k = ∑ i = 1 k C i (4)
一般取累计贡献率达85%~95%的特征值 λ 1 , λ 2 , ⋯ , λ m 所对应的m (m ≤ p)个主成分。
5) 计算原变量在各主成分上的载荷矩阵:
L = [ l i j ] , l i j = λ i e i j ( i , j = 1 , 2 , ⋯ , p ) (5)
6) 计算各主成分的得分矩阵:
Z = [ z i j ] = X ′ L ( i = 1 , 2 , ⋯ , n ; j = 1 , 2 , ⋯ , p ) (6)
7) 多指标加权综合评价模型:
S i = ∑ j = 1 p w j Z i j ( i = 1 , 2 , ⋯ , n ; j = 1 , 2 , ⋯ , p ) (7)
式中:wj为权值,可以按各主成分的贡献率来确定。可以将式(7)定义成综合主成分得分,它反映综合发展水平。
选取丹江口水库下游沙洋站水文及鱼类数据为研究对象。丹江口水库是一个峡谷盆地交替型的水库,控制流域面积9.52万km2,坝高162 m,正常蓄水位157 m,相应库容174.5亿m3。2006年9月,丹江口水库大坝加高工程开始实施,从高程162.0 m加高到176.6 m,加高14.6 m,加高后正常蓄水位为170 m,相应库容290.5亿rn3,属不完全多年调节水库。沙洋站位于丹江口水库下游,其地理位置如图1所示。
根据前面分析和现有水文资料,从水温、涨水过程数、涨水持续时间、断面初始流量、流量的日增长率、洪峰的初始水位、水位的日上涨率、前后两个洪峰过程的间隔时间、洪峰水位上涨持续时间、前后两个洪峰过程的水位差异、起始产卵日期、苗汛时序等水文指标中选取水位上涨持续时间、洪峰初始水位、洪峰最高水位、水位日上涨率,水位上涨幅度、洪峰初始流量、洪峰最高流量、流量日上涨率8项水文指标进行PCA分析。各指标的含义如表1所示。选取历年四大家鱼产卵时对应的生态洪水过程特征如表2。
图1. 汉江中下游“四大家鱼”产卵场分布示意图
指标名称 | 计算方法 |
---|---|
水位上涨持续时间(d) | 某次涨水从开始到洪峰水位的天数 |
洪峰初始水位(m) | 开始涨水的水位 |
洪峰最高水位(m) | 一次涨水中最高水位 |
水位日上涨率(m/d) | (洪峰水位 − 初始水位)/涨水天数 |
水位上涨幅度(m) | 洪峰水位 − 初始水位 |
洪峰初始流量(m3/s) | 开始涨水的流量 |
洪峰最高流量(m3/s) | 一次涨水中的最大流量 |
流量日上涨率(m3/s/d) | (洪峰流量 − 初始流量)/涨水天数 |
表1. 四大家鱼自然繁殖生态水文指标计算方法
洪水序号 | 上涨持续时间 | 洪峰初始水位 | 洪峰最高水位 | 水位日上涨率 | 水位上涨幅度 | 洪峰初始流量 | 洪峰最高流量 | 流量日上涨率 |
---|---|---|---|---|---|---|---|---|
H1 | 3 | 34.01 | 37 | 1.50 | 2.99 | 930 | 3430 | 1250.00 |
H2 | 8 | 34.56 | 37.7 | 0.45 | 3.14 | 1160 | 4370 | 458.60 |
H3 | 3 | 35.76 | 37.3 | 0.78 | 1.55 | 1800 | 3780 | 990.00 |
H4 | 13 | 34.9 | 36.71 | 0.14 | 1.81 | 1170 | 2490 | 101.54 |
H5 | 4 | 35.59 | 36.89 | 0.33 | 1.3 | 1590 | 2740 | 287.50 |
H6 | 7 | 37.7 | 39.83 | 0.30 | 2.13 | 3750 | 8890 | 734.29 |
表2. 沙洋站四大家鱼产卵时洪水过程特征
根据四大家鱼产卵事件和对应洪水过程特征,建立统计分析数据库。根据主成分分析法,先对原始数据进行无量纲处理,再求相关系数矩阵,由相关系数矩阵计算特征值。相关系数矩阵结果见表3。
上涨持续时间 | 洪峰初始水位 | 洪峰最高水位 | 水位日上涨率 | 水位上涨幅度 | 洪峰初始流量 | 洪峰最高流量 | 流量日上涨率 | |
---|---|---|---|---|---|---|---|---|
上涨持续时间 | 1.000 | −0.008 | 0.017 | −0.671 | 0.038 | −0.029 | −0.013 | −0.733 |
洪峰初始水位 | −0.008 | 1.000 | 0.812 | −0.485 | −0.459 | 0.972 | 0.797 | −0.053 |
洪峰最高水位 | 0.017 | 0.812 | 1.000 | −0.231 | 0.145 | 0.915 | 0.997 | 0.178 |
水位日上涨率 | −0.671 | −0.485 | −0.231 | 1.000 | 0.474 | −0.357 | −0.168 | 0.881 |
水位上涨幅度 | 0.038 | −0.459 | 0.145 | 0.474 | 1.000 | −0.256 | 0.168 | 0.365 |
洪峰初始流量 | −0.029 | 0.972 | 0.915 | −0.357 | −0.256 | 1.000 | 0.909 | 0.080 |
洪峰最高流量 | −0.013 | 0.797 | 0.997 | −0.168 | 0.168 | 0.909 | 1.000 | 0.240 |
流量日上涨率 | −0.733 | −0.053 | 0.178 | 0.881 | 0.365 | 0.080 | 0.240 | 1.000 |
表3. 相关系数矩阵
相关系数矩阵(表3)中大部分相关系数均大于0.25,即显示选取的8个指标之间的相关程度较高,说明参数之间存在信息重叠,适合用主成分分析法进行分析。
成份 | 初始特征值 | 提取平方和载入 | ||||
---|---|---|---|---|---|---|
合计 | 方差的% | 累计% | 合计 | 方差的% | 累计% | |
1 | 3.881 | 48.509 | 48.509 | 3.881 | 48.509 | 48.509 |
2 | 2.676 | 33.446 | 81.955 | 2.676 | 33.446 | 81.955 |
3 | 1.236 | 15.447 | 97.402 | 1.236 | 15.447 | 97.402 |
4 | 0.189 | 2.357 | 99.759 | |||
5 | 0.019 | 0.241 | 100.000 | |||
6 | 2.819E−16 | 3.523E−15 | 100.000 | |||
7 | −1.216E−17 | −1.521E−16 | 100.000 | |||
8 | −1.406E−16 | −1.758E−15 | 100.000 |
表4. 方差分解主成分提取分析表
计算各主成分特征根及累计贡献,其结果如表4。按照特征根大于1的原则,使用主成分分析法提取3个主成分,其累计贡献率为97.402%,三因子对原有变量信息包含程度很高,因此,选取的三个主成分Z1,Z2,Z3能够充分反映上述8项指标的信息。然后计算主成分载荷,结果见表5。
Z1 | Z2 | Z3 | |
---|---|---|---|
上涨持续时间 | 0.119 | −0.755 | 0.564 |
洪峰初始水位 | 0.963 | −0.021 | −0.265 |
洪峰最高水位 | 0.921 | 0.289 | 0.253 |
水位日上涨率 | −0.498 | 0.849 | −0.03 |
上涨幅度 | −0.231 | 0.478 | 0.835 |
洪峰初始流量 | 0.982 | 0.137 | −0.104 |
洪峰最高流量 | 0.904 | 0.344 | 0.252 |
流量日上涨率 | −0.07 | 0.968 | −0.103 |
表5. 主成分载荷矩阵
从表5中可知:第一主成分与水位日上涨率、上涨幅度、流量日上涨率3个指标呈负相关,与其他5个指标正相关,且第一主成分在洪峰初始水位、洪峰最高水位、洪峰初始流量、洪峰最高流量上的载荷比较大(0.904~0.982),说明第一主成分在一定程度上就能反映四大家鱼产卵所需洪水的主要特征;第二主成分在水位日上涨率、流量日上涨率上的载荷较大,且正相关;第三主成分在上涨幅度上的载荷较大,达到0.835。由主成分载荷矩阵作进一步处理,可得主成分方差与方差贡献,如表6所示。
第一主成份 | 第二主成份 | 第三主成份 | 公因子方差 | |
---|---|---|---|---|
上涨持续时间 | 0.119 | −0.755 | 0.564 | 0.9023 |
洪峰初始水位 | 0.963 | −0.021 | −0.265 | 0.9980 |
洪峰最高水位 | 0.921 | 0.289 | 0.253 | 0.9958 |
水位日上涨率 | −0.498 | 0.849 | −0.03 | 0.9697 |
上涨幅度 | −0.231 | 0.478 | 0.835 | 0.9791 |
洪峰初始流量 | 0.982 | 0.137 | −0.104 | 0.9939 |
洪峰最高流量 | 0.904 | 0.344 | 0.252 | 0.9991 |
流量日上涨率 | −0.07 | 0.968 | −0.103 | 0.9525 |
方差贡献 | 3.8776 | 2.6774 | 1.2354 | 7.7904 |
特征根 | 3.8776 | 2.6774 | 1.2354 | 7.7904 |
表6. 主成分方差与方差贡献
综合已有四大家鱼产卵研究与主成分定义和3个主成分的线性组合,汉江四大家鱼产卵的主要生态水文因子为:洪峰初始水位、洪峰初始流量、流量日上涨率、上涨幅度。由此原来的8项指标减少到4项,在一定的程度上简化生态调度时需要注意的调控因子。
主成分分析法在保证原始数据信息损失最小的前提下,经过线性变化和舍弃部分信息,以少数的综合变量取代原有多维变量,简化了数据结构,使结果客观合理,可以避免依据主观评价确定指标权重的不准确性。本文在已有四大家鱼产卵研究的背景下,运用主成分分析法对影响四大家鱼产卵的洪水过程特征的指标进行简化处理,得出四大家鱼产卵所需的生态洪水过程的关键调控指标(洪峰初始水位、洪峰初始流量、流量日上涨率、上涨幅度),为水库的调度和保证四大家鱼的产卵水文过程提供理论依据。本文不足之处在于所得鱼类产卵数据有限,需要更加详细的资料进行对相关结论进行验证。
李 杰,孔维峥. 汉江四大家鱼产卵生态水文因子分析研究Analysis and Research on Eco-Hydrological Factors of Spawning of Four Major Chinese Carps in Hanjiang River[J]. 水资源研究, 2021, 10(02): 228-234. https://doi.org/10.12677/JWRR.2021.102024