logo资料库

基于遗传算法的P-Ⅲ型分布参数估计研究.pdf

第1页 / 共5页
第2页 / 共5页
第3页 / 共5页
第4页 / 共5页
第5页 / 共5页
资料共5页,全文预览结束
http://www.paper.edu.cn 基于遗传算法的 P-Ⅲ型分布参数估计研究 刘华1 胡琳2 顾巍巍3 河海大学大资源环境学院,南京 (210098) 摘 要:水利工程的规划与设计,都需要进行水文频率计算工作,确定水位、暴雨或洪峰等 水文特征值的概率分布曲线和相应设计标准的设计值。它需要解决两类主要问题:线型选择 问题和参数估计问题。在我国现行水文频率计算中,有关规范推荐选用 P-Ⅲ型分布曲线, 、变差系数Cv 和偏态系数 并采用适线法、权函数法或概率权重矩法来估计总体的均值 Cs 。本文从应用蒙特卡罗法(简称 M-C 法)研究参数估计方法优劣的思路出发,根据遗传 算法全局寻优的原理与特点,采用遗传算法对 P-Ⅲ型分布参数进行估计,并与现行的参数 估计方法——适线法进行统计试验综合比较,计算结果表明:基于遗传算法的 P-Ⅲ型分布 参数估计方法比现行使用的适线法更为优良。 关键词: P-Ⅲ型分布 参数估计 适线法 遗传算法 蒙特卡罗法 1. 前言 EX 水文频率计算的目的是估计某种水文特征值某一指定设计标准p的设计值 ,以作为工 程规划设计的依据。在此,一般需要考虑两个基本问题——线型选择和参数估计问题。线型 的选择具有很大的不确定性,因此,现行水文频率计算工作一般只在假定线型已知的基础上 对总体参数进行估计,并确定相应设计标准的设计值。在水利工程的规划与设计中,我国规 范推荐使用P-Ⅲ型分布曲线,以适线法、权函数法或概率权重矩法[1]来估计总体的均值 变差系数Cv 和偏态系数 ,其中应运最广泛的为适线法。 EX Cs 、 px 0 早期,我国生产单位进行水文频率计算时普遍使用目估适线法,但由于目估时主观性强, 缺乏客观依据,又有许多不同的经验频率公式,而且计算过程烦琐,结果往往因人而异,从 而大大增加了设计值的不确定性。随着计算机的普及,各种新的并具有良好统计特性的适线 准则应运而生,如最小绝对值准则和最小平方和准则等,这为适线结果的优劣提供了客观评 价标准,提高了计算精度,并为各个生产单位所接受。 2. 适线法(简称 FIT 法) 当随机变量 X 服从 P-Ⅲ型分布时,其概率密度函数如下: f x ( ) = α β ( ) α Γ ( x a − 0 ) 1 − α e − ( β x a − 0 ) x > a 0 (1) px 0 = ( )[ E X Cv 某一指定设计标准 p 的设计值 px ) 1] 0 + 其中(2)式中的 Φ 值由Cs 和 确定,故要求某一指定设计标准 p 的设计值 (2) p Cs p 为: ⋅Φ px 0 ( , ,首先 应确定总体参数 EX 、Cv 和 的值。 Cs 适线法[2]本身是一种图解方法,现行适线法一般通变改变参数步长的方法在计算机上进 行搜索优化适线,根据绝对值最小准[3]则来评价样本点据与理论点据在机率格纸上拟合程度 的好坏,并确定总体分布的参数,所得结果基本能满足设计要求。但在各个参数都相对较大 的计算中,三参数的优化适线计算速度较慢,需做大量的循环处理,并在变步长过程中所得 到的最优解也不是全局最优解,可进一步加以改进。 1
3. 遗传算法的原理 http://www.paper.edu.cn 遗传算法[4](Genetic Algorithm,简称GA)是基于达尔文的进化论和孟德尔遗传学, 在计算机上模拟生物界中的生命进化机制而发展起来的一门新学科,它根据适者生存、优胜 劣汰等自然进化规则搜索和计算问题的解,该领域最早是由美国 Michigen大学的John Holland 于 1975 年提出的。遗传算法的基本思想是,从一个代表最优化问题解的一组初始 值开始进行搜索,这组解为一个种群,种群由一定数量、通过一定基因编码的个体组成,其 中每一个个体称为染色体,不同个体通过染色体的复制、交叉或变异又生成新的个体,依照 适者生存的规则,个体也一代一代的进化,通过若干代的进化最终得出条件最优的个体。 该方法不受模型结构、参数数目等条件的影响,因而对处理模型参数的估计问题,对参 数全局范围进行搜索寻优,尤其是非线性模型,具有较强的通用性和适用性。 4. 基于遗传算法的 P-Ⅲ型分布参数估计研究(简称 GAFIT) P-Ⅲ型分布参数估计是通理实测样本点据来估计总体参数 EX 、Cv 和Cs 的值。 基于遗传算法的 P-Ⅲ型分布参数估计步骤如下: 1、 根据给定的样本,先用矩法初步估计 x 、 和 的值; cv cs E X 2、 确 定 总 体 分 布 参 数 的 大 致 范 围 , 取 ( ) ∈ x [0.8 ,1.2 ] x , Cv ∈ cv [0.8 ,1.2 ] cv , Cs ∈ cs [0.7 ,1.3 ] cs ,在计算过程中, E X 和 的范围可相对较小,Cs 相对较大; ( Cv ) 3、 采用二进制编码[4],为保证 x 、 和 cs 的计算结果至少保有 3 位有效数字,每个参数 cv 的编码长度均取为 12,这样每个个体对应的二进制数字串长度就为chromsize=36,在规 定范围内均匀随机生成初始种群currentpop,种群规模popsize=100, 4、 将初始种群解码成十进制[4],得到初始参数,计算 j 1 = n −∑ x * m | x P ( m ) | ( x * 1 ≥ x * 2 ≥ L ≥ x * m ≥ L ≥ 的值,其中 * mx 为样 x 中第 项 m * n ) ( x x , 本 1 , xL , )n 2 从大到小排列后构成的新序列 mP = 的值, x P 应于 ( )m m ( n + ) 的设计值,并按照下面公式计算每个个体的适应度: 1 F i = 1/ n ∑ j 1 = | x * m − x P ( m ) | i = 1,2, L , popsize (3) 5、 选择过程采用轮盘赌选择[4](roulette wheel selection)方法,该方法能保证适应度 越大的个体被选中的概率越大,并确定重组或交叉个体,以及被选个体产生多少子个体; 6、 交叉过程[4](crossover)是重组来自父代交配种群中的信息并产生新的个体,本次研究 采用二进制单点交叉,为保证优化效果,交叉概率一般较大,交叉概率 cp = 0.8 ; 7、变异过程[4](mutation)实际上是交叉之后的子代基因按小概率拢动产生的变化,本次 研究采用二进制变异,为保证遗传,变异概率一般较小,取 mp = 0.025 ; 2
http://www.paper.edu.cn 8、由第 7 步便可得到 100 个子代个体,并作为下一轮进化过程的父代,算法转入第 4 步, 如此反复迭代,直到满足以下条件停止运算: 1 n F ⋅ i ① <= 0.05 (样本点据与理论点据的平均绝对误差不超过 0.05)时,直接输出结果; 1 n F ⋅ i <= 0.05 ② 若无法满足 条件时,则遗传进化代数超过 50 代时,停止迭代计算,输出 适应度最大值所对应的参数。 5. 应用 M—C 法研究以上两种参数估计方法的优劣 文频率计算中,参数估计方法优劣的评价,通常以参数估计值、设计值以及期望概率的 不偏性、有效性为依据的,一般通过M-C(蒙特卡罗)计算方法来确定[5]。在本文中,对适 线法与基于遗传算法的P-Ⅲ型分布参数估计法这两种参数估计方法的优劣评价,计算步骤如 下: 1、设定总体分布线型、参数及样本容量 本次研究对象为 P-Ⅲ型分布曲线,故设总体分线型 P-Ⅲ型;总体参数为 0EX 0Cv , 和 0Cs ,可考虑有若干组不同作用组合的的 和 取值,取 0Cv 0Cs EX = ;样本容量 1 0 n = 50 (不 考虑特大值); 2、选定需要研究的参数估计方法 本次需要研究的参数估计方法有适线法和基于遗传算法的 P-Ⅲ型分布参数估计法; K i K n 3、生成 组样本容量为 的样本(抽自以上设计定总体), 一般取 500; x cv cs 及设计值 4、对每一组样本用指定的参数估计方法估计参数( , ˆi px ix , , 为第 次试验的参数估计值, icv ics ˆi px ( ) i , i i 。 为第i 次试验相应设计标准 的设计值 p 估计值,其中 i = 1,2, L , K , p = 0.01%,0.1% 1% 和 ); 5、参数不偏性及有效性是分别统计 ix , , 的平均值和均方差来进行分析;文献 icv ics [4]研 究表明,用适线法估计P-Ⅲ型分布参数,以此计算的设计值的期望概率偏大,低于设计标准, 本文未对期望概率进行研究。设计值的不偏性和有效性分别采用相对偏差的均值和相对根均 方误表示[5],其计算公式如下: K ∑ i 1 = − ˆ( x i p K x ⋅ 0 p x 0 p ) ⋅ 100% ( 4 ) K ∑ i 1 = ˆ( x i p − x ) /( 0 2 p K x ⋅ 0 p ) 100% ⋅ (5) B xp = S xp = 3
http://www.paper.edu.cn px 0 其中 为相应设计标准 的总体设计值。 p 具体计算结果见下表: 参数、设计值不偏性、有效性计算成果表(部分方案) 总体参数 n Cv0 Cs0 估计 方法 EEX ECv ECs SEX SCv SCv Bxp1 Bxp2 Bxp3 Sxp1 Sxp2 Sxp3 50 0.5 1.5 FIT 1.00 0.51 1.53 0.07 0.06 0.41 2.71 2.31 1.72 20.55 17.92 14.24 50 0.5 1.5 GAFIT 1.00 0.51 1.51 0.05 0.06 0.35 2.53 2.14 1.56 19.76 14.27 11.46 50 1.0 3.0 FIT 1.01 1.04 3.12 0.15 0.16 0.51 8.24 7.24 5.50 33.92 31.34 26.93 50 1.0 3.0 GAFIT 1.00 0.98 3.08 0.11 0.14 0.32 7.62 6.54 4.65 28.95 26.45 22.56 6. 结语 根据本次研究所做的统计试验,对现行使用的适线法与基于遗传算法的 P-Ⅲ型分布参 数估计法进行了对比分析,可得出以下结论: K = 500 在 次的统计实验中,根据以上两种方法所估计的 P-Ⅲ型分布参数值,其均值 与总体基本接近,基本上可认为无偏估计,且均方误较小,有效性较高; Bxp1 、Bxp2 和 Bxp3 均大于零,说明设计值较相应设计标准的理论设计值略微偏大, 对工程要求偏于安全; 通过对 Bxp1 、Bxp2 和 Bxp3 的对比分析,说明基于遗传算法的 P-Ⅲ型分布参数估计法 要比现行使用的适线法精度略高; 通过对两种方法 SEX、SCv、 SCs 、Sxp1 、Sxp2 和 Sxp3 的对比分析,说明基于遗传 算法的 P-Ⅲ型分布参数估计法要比现行使用的适线法更为有效。 基于遗传算法的 P-Ⅲ型分布参数估计其方法本质是全局寻优的适线法,由于自变量个 数只有三个,并且最优解的大致范围可通过矩法容易地确定,适应度函数数学意义明确,因 此,与现行的变步长寻优适线法相比,具有计算速度相对较快,参数估计精度相对较高等特 点,可在生产实际中广泛地应用。 参考文献 [1] 水利电力部. 水利水电工程设计洪水规范 北京:水利水电出版社,1980 [2] 丛树铮. 水文学概率统计基础 北京:水利水电出版社,1980 [3] 刘光文. 皮尔逊-Ⅲ型分布参数估计 [J]. 水文,1990,(4、5):1-15. [4] 周明,陈树栋. 遗传算法原理及应用 北京:国防工业出版社, 1999.6 [5] 陈元芳,候玉. P-Ⅲ型分布参数估计方法的研究 [J]. 河海大学学报,1992,(3):24-31. Study on Pearson Type III distribution parameter estimations based on genetic algorithm LIUHUA1 HULIN2 GUWEIWEI3 4
http://www.paper.edu.cn College of Water Resources and Environment, Hohai University, Nanjing, Jiangsu 210098 Abstract :The planning and the designing of hydraulic engineering projects needs to compute the hydrology frequency, in order to get the probability distribution curves and corresponding design standard design value of hydrology characteristic values, such as water level, rainstorm or flood peak。Two kind of problems need to be solved: choose appropriate linetype and parameter estimation Recently, Pearson Type III frequency curve is accepted according to the criterion.This article (the i.e. M-C method) studies the parameter estimation method by applying Monte Carlo method. According to the characteristic of genetic algorithm called overall optimization, genetic algorithm was used to estimate the parameters of P-III,and compare with fitting-cuve method.The computed result indicated that the Pearson Type III distribution parameter estimation method that based on genetic algorithm has some superiority Key words:Pearson Type III distribution; parameter estimations ; fitting-cuve method; genetic algorithm; Monte Carlo method; 作者简介:刘华,男,江苏人,1981 年生,硕士研究生,主要研究方向是流域水文预报 5
分享到:
收藏