一种基于蚁群算法动态均衡的网格任务调度.pdf

发布时间：2022-06-09 发布人：admin 分类：说明书资料大小：0.07M 资料格式：pdf 举报版权申诉

chenchengyu-3956432-16359647757289517115.pdf-第1页.png

第1页 / 共4页

chenchengyu-3956432-16359647757289517115.pdf-第2页.png

第2页 / 共4页

chenchengyu-3956432-16359647757289517115.pdf-第3页.png

第3页 / 共4页

chenchengyu-3956432-16359647757289517115.pdf-第4页.png

第4页 / 共4页

文本预览

第 3 1卷第 5期 2 0 1 0 年 5 月东北大学学报 ( 自然科学版 ) Journal of Northeastern University(Natural Science) Vol.31,No .5 2 0 1 0 May 一种基于蚁群算法动态均衡的网格任务调度孙大为, 常桂然, 陈东, 王兴伟 ( 东北大学信息科学与工程学院, 辽宁沈阳 110004) 摘要: 网格资源分配属于 NP - 难问题,为了更好地解决该问题,首先建立一种性能 QoS 优化的作业级网格任务调度模型和目标函数,并对资源和任务数进行了分析·提出了基于动态信誉度的改进蚁群算法 RACO(reputation-based ACO)进行网格任务调度,RACO 引入空间效率和时间效率的动态调节因子,同时采用局部和全局信息素更新策略·仿真实验表明,RACO 在资源利用率、动态均衡方面优于 Min-min, Max-min 和 ACO 算法· 关键词: 网格计算;任务调度;动态均衡;蚁群算法;信誉中图分类号: T P 393 .01 文献标志码: A 文章编号: 1005-3026(2010)05-0630-04 A Grid Task Scheduling with Dynamic Equilibrium Based on Ant Colony Algorithm SUN Da-wei, CH ANG Gu i-ran, CH EN Dong, W A NG X ing-wei (School of Correspondent: SUN Da-wei, E-mail: sundaweicn @ 163 .com) Information Science & Engineering, Northeastern University, Shenyang 110004, China . Abstract: Resource allocation in grid is an NP-hard problem . To optimize the grid system, a performance QoS optimization model is developed for grid task scheduling and objective function, resources and tasks analyzed in detail . Then, an improved ant colony with the number of algorithm named RACO(reputation-based ant colony algorithm) is presented to schedule tasks in grid, based on the dynamic reputation . Int roducing a dynamic scheduling factor involving both space and time efficiencies, a local and global pheromone updating st rategy is applied to RACO . Simulation results showed that RACO algorithm outperforms the conventional Min-min, Max- min and ACO in resource utilization rate and dynamic equilibrium . Key words: grid compution; task scheduling; dynamic equilibrium; ant colony algorithm; reputation 网格计算技术强调在动态变化的异构环境中,共享资源和协作解决问题,因此网格环境中的任务调度问题是网格计算的一个关键问题,是一个 NP - 难问题 [ 1 ] ·良好的任务调度策略能高效地分配网格资源,实现最优跨度、服务质量、负载均衡和经济原则等,网格环境下的任务调度问题目前是网格计算的研究热点之一[ 2 ] · 针对任务调度算法在网格环境中存在的一些缺陷 [ 3 ]:①经典算法不能有效地实现资源的动态负载均衡;②蚁群算法不能有效满足用户的性能 QoS 和经济原则等问题·本文提出了基于动态信誉度的改进蚁群算法 RACO(reputation-based ant colony algorithm)进行网格任务调度,引入空间效率和时间效率的动态调节因子,结合蚁群算法的正反馈优点,采用局部和全局信息素更新策略,有效地实现网格任务调度系统的动态负载均衡和用户的性能 QoS· 1 问题建模作业级网格任务调度问题的实质[ 4 - 5 ] 就是收稿日期: 2009-10-21 基金项目: 国家自然科学基金资助项目 (60673159, 70671020); 国家高技术研究发展计划项目 (2007AA041201); 教育部科学技术研究发展计划项目 (108040); 高等学校博士学科点专项科研基金资助项目(20060145012, 20070145017)· 作者简介: 孙大为(1985 - ),男 , 安徽六安人, 东北大学博士研究生 ; 常桂然(1946 - ),男 ,河北曲周人, 东北大学教授, 博士生导师; 王兴伟(1968 - ),男 , 辽宁盖州人, 东北大学教授 ,博士生导师·

第 5 期孙大为等: 一种基于蚁群算法动态均衡的网格任务调度 136 将这 n 个相互独立的任务 J = { J1, J2, …, Jn}分配到 m 个异构可用资源 ( 处理单元, PE (processing elements)) P = { P1, P2,…, Pm },使得任务总完成代价最小且资源得到均衡利用·即 s 表示问题的一个解, F 2 m 是可行解,当且仅当 s ∈ F 时, s 是可行解·解空间中的一个适应度函数 f, f:2 m → R,目的为找到一个最小任务完成代价的可行解 s * , s * ∈ F 且 f( s * )≤ f( s)·为了便于问题的深入分析,引入如下定义· 定义 1 原子任务,即一次独立调度的不相互关联的任务,其中不排除任务内部的依赖关系, 即子任务(subtask)的依赖性· 其中, J 是 n 个需要调度的原子任务集合, Ji 表示第 i 个原子任务, 每个任务的任务量大小用百万指令(MI)表示,每个原子任务只能在一个资源上被执行完成· 定义 2 可用资源,即可用于完成网格任务的各种 PC、同构异构机群等, 处理单元 PE 是它们的基本单元· 其中, P 是 m 个可用资源集合, Pj 表示第 j 个可用资源·每个可用资源的计算能力用 p(百万指令每秒(MI/ s))表示· 定义 3 ET C 矩阵(expected time to compute mat rix),任务 Ji 在可用资源 Pj 上的期望执行时间为 ET C, ij,其中 i∈{1,…, n}, j∈{1,…, m},由 ETC , ij 构成矩阵 ( ⁝ ET C, 1 1 … ET C, 1 m ET C, n 1 … ETC , n m ), ⁝ ET C, n× m = 其中, Eij = { P + ∪ + ∞},当资源 Pj 不能满足任务 Ji 的需求时,则 E( Ji, Pj)→ + ∞· 定义 4 EC T 矩阵 (earliest completion time mat rix),任务 Ji 在可用资源 Pj 上的最早完成时间为 ECT , ij, 其中, i∈{1,…, n}, j∈{1,…, m}, 由 EC T, ij 构成矩阵 ( ⁝ ECT , 1 1 … ECT , 1 m EC T, n 1 … ECT , n m ), ⁝ ECT , n× m = 其中, ECT , ij 表示任务 Ji 在可用资源 Pj 上的期望执行时间为 ETC , i j加上可用资源 Pj 中队列中已存在的任务的总执行时间·假设任务 Ji 开始执行时刻为 S i,那么 EC T , ij = Si + ETC , ij· 网格任务调度问题是一个求极小值问题·为了便于问题的描述,引入变量 0, 否则·{ xij = 1, 任务 Ji 分配到资源 Pj 上执行; 则网格任务调度的目标函数可以描述为满足如下约束条件: n m )·(1) makespan( J) = min ∑ 1) 当 n≤ m 时,即任务个数和可用资源个数 ECT , i j· xij ∑ ( j = 1 i = 1 xij = 1, j ∈ {1,2,…, m}, xij ∈ {0,1}·} xij = 1, i ∈ {1,2,…, n}, xij ∈ {0,1}; n m ∑ i = 1 ∑ j = 1 (2) 第一个约束条件表示第 j 个资源 Pj 只能处理一项任务,第二个约束条件表示第 i 个任务 Ji 只能由一个资源处理·此时网格任务调度问题简化为多约束条件下的极小值求解问题· 2) 当 n > m 时,即任务个数多于可用资源个数,会出现几个任务提交到某一个资源进行处理的情况,那么可以通过任务聚类(job cluster)以队列方式转化为第一种情况处理· 2 算法描述蚁群算法[ 6 - 7 ] ( ant colony optimization, ACO)是通过蚂蚁群体之间的信息素(pheromone) 的传递及更新来实现收敛于最佳路径,是一种正反馈机制· 2 .1 动态均衡机制在蚁群算法中引入信誉度因子来实现网格任务的动态负载均衡,通过动态的信誉激励机制,促进资源的合理利用,实现资源的动态均衡· 节点信誉度是对可用资源节点的历史信誉的一种测评,信誉度越高,表明此节点在过去的服务中越可靠、安全·采用可用资源节点实际完成网格任务的成功率进行量化,同时根据当前可用资源节点完成网格任务的时间效率进行动态调整,即 { Trc( t + 1) = T rc(0) = 1, t = 0; (1 + λ)· Trc ( t), t > 0 且 0 ≤ λ≤ 1· (3) 其中: Trc ( t + 1)为可用资源节点 Pav ailable 在 t + 1 时刻的信誉度;λ如式(4)所示, 为信誉度调节系数,根据可用资源节点对网格任务的空间效率和时间效率进行动态调整,1 + λ是保证信誉度随着提供的服务的增加而动态增加· JM I, j k( t)( )+ β ECT , jh( t)( )· ETC , h( t) JM I, k ( t) λ = α ∑ ∑ ∑ ∑ k = 1 size s uccess h = 1 size siz e size all m m - - ∑ j = 1 ∑ k = 1 j = 1 h = 1 (4)

236 东北大学学报(自然科学版) 第 31 卷其中:α+ β= 1,α和 β分别表示空间效率和时间效率对信誉度调节系数 λ的权重; 1≤ j≤ m, 0≤ h≤ size ≤ n, 0≤ k ≤ size - success ≤ size - all ≤ + m size all - ∑ JM I, j k ( t) 为系统可用资源节点 ∞; ∑ Pav ail able 在 t 时刻之前已接受的所有任务工作总 k = 1 j = 1 siz e succe ss - JM I , k ( t) 为可用资源节点 Pava il able 在 t 量; ∑ 时刻之前所成功完成的任务工作总量; k = 1 m size ∑ EC T , j h( t) 为系统可用资源 Pa vaila bl e在 t 时 ∑ j = 1 刻之前已接受的全部任务最早完成时间总量; h = 1 size ET C, h( t) 为系统可用资源 Pa vaila bl e在 t 时刻之 h = 1 ∑ 前已接受的全部任务期望执行时间· 2 .2 信息素初始化在分配任务到各个资源之前, 需从网格信息服务(G IS,grid information service)中获取可用资源的 PE 个数及其处理能力 p(MI/ s)、网络带宽 br(Mb/ s)、信誉度 rc 以及资源价格 cs 作为资源的初始信息素,即 Tk (0) = a· T p(0) + b· T b r (0) + s c c· T r (0) + d· Tc (0)· (5) 其中: a + b + c + d = 1, a, b, c, d 分别代表可用资源处理能力信息素、网络带宽信息素、信誉度信息素和资源价格信息素在该资源信息素中所占的权重· 2 .3 路径选择机制在 t 时刻,第 i 个蚂蚁选择可用资源 Pj 的概率 pij( t)由式(6)确定且随信息素的更新而动态调整· pij( t) = [τj( t)]η·[ωj( t)]ε {[τu( t)]η·[ωu( t)]ε} , j ∈ allowed; { ∑ u allow ed 0, j | allowed· (6) 其中:τj ( t)表示可用资源节点 Pj 在 t 时刻的信息素浓度;ωj ( t) = τj (0 )是启发因子, 表示节点 Pj 的固有属性; 参数 η 和 ε 用于调节 τj ( t) 和 ωj( t)之间的权重, 当 η 变小时,收敛速度变快, 当 ε变小时, 收敛速度变慢;allowed 为第 i 个蚂蚁尚未访问的节点集合· 2 .4 局部更新机制当任务 Ji 被分配到某可用资源节点 Pav ailable 后,资源的信息素需要进行必要更新,减少该资源节点的信息素,促进蚁群搜索不同的路径,增加解的多样性和求解最优解的概率,实现动态负载均衡,信息素浓度调整如式(7)所示: Tk ( t + 1) = ρ· T k( t) + Δ T k( t),0 < ρ≤ 1· (7) 其中:ρ为信息素的持久性(一般取 0.6);1 - ρ为信息素的挥发性;ΔT k ( t)如式(8)所示,为信息素改变量· Δ T k( t) = - (μ1·JM I, i + μ2·ET C, i + μ3·Ki), 0≤μ1 ,μ2,μ3 ≤1· (8) 其中:ΔT k ( t)是任务 Ji 的任务量 JM I , i,期望执行时间 ETC , i 和通信量 Ki 的函数;μ1,μ2,μ3 为调节系数且 μ1 + μ2 + μ3 = 1· 2 .5 全局更新机制当可用资源节点 Pa vaila bl e完成任务并返回时, 需进行信息素的全局更新,如式(9)所示: T k ( t + 1) = ρ· T k( t) + ∑ΔT k ( t), 0 < ρ≤ 1· (9) c ( t),当任务从资源节点其中:ΔT k ( t) = Ce· Tr Pav ail able成功返回时, Ce 作为奖励参数取 0.6; 当任务从资源节点 Pav ailable 失败返回时, Ce 作为惩罚因子取 - 1.2· 2 .6 网格资源调度流程改进后蚁群算法网格任务调度包括 8 个步骤: 1) 用户提交任务,并插入到任务队列中等待调度,同时为每一个任务设置优先级,按照优先级高低进行任务分配·优先级与任务量和期望执行时间成正比,即 f: k·( JM I, i, ETC , i)→P rior i· 2) 根据式 (5) 初始化网格各可用资源节点 Pav ail able的初始信息素 T k(0)· 3) 从 GIS 中查询可用资源当前状态、返回价格、机器数、PE 数及处理能力等信息,对可用资源进行排序· 4) 调度器从任务列表中取优先级高的任务 p rior,根据式( 6)计算概率, 将任务分配到概 - Jhigh 率较大且价格在预算范围内的可用资源 Pav ailable 上· 5) 当任务正常分配后,利用式( 7)进行局部信息素的更新· 6) 当资源节点将任务执行完毕且任务成功返回,利用式(3)对该资源节点进行信誉度更新, 并采用式(9)进行节点全局信息素更新· 7) 若任务执行失败,则将其重新插入任务队

第 5 期孙大为等: 一种基于蚁群算法动态均衡的网格任务调度 336 列中,等待调度器重新调度,利用式(3)对该资源节点进行信誉度更新,并采用式(9)进行节点全局信息素更新· 运行速度、增强收敛能力、改善网格系统性能· 参考文献: 8) 循环步骤 3)～8),直到所有任务均成功执 [ 1 ] 行· 3 仿真结果与性能分析本文利用 GridSim 模拟器 [ 8 ] 构建网格任务调度模拟平台·所选择的系统结构为 Sun Ultra, 操作系统为 Solaris,模拟 3 个 GIS, 200 个网格资源节点、1 000 个任务, 任务计算量为 5 000 MI 到 20 000 MI,数据通信量在 10～100 Mb/ s· 如图 1 所示,在不断增加资源数量的情况下, ACO 算法 [ 9 ] 的资源动态负载均衡优于 Max-min 算法[ 1 0 ] 和 Min-min 算法[ 1 0 ] ;而 RACO 的资源负载均衡较 ACO 有较大改进·其中,平均资源负载度提高 16.87 % ;资源负载度方差 n 1 n∑ i = 1 (εi - 珋ε)2 减少 28.68 % , 取得了较好的资源利用率和动态均衡· Fig .1 图 1 网格资源负载均衡度对比 Comparison of grid resource load balancing between different algorithms 4 结语本文针对网络资源频繁变化的网格环境, 基于信誉度,引入空间效率和时间效率动态因子到网格任务调度策略中,综合考虑资源的各方面参数来确定信息素浓度,改进了蚁群算法在资源动态均衡方面的性能, 最后的实验证实了该方法的有效性·下一步的研究重点集中于提高蚁群算法 Mcmullan P, M ccollum B . Dyn amic job sch eduling on the grid environment using the great deluge algorith m [ C ] ∥ Parallel Computing Tec hnologies: P roceedings th e 9th Intern ation al Conference . Pereslavl-Zalessky: Springer- V erlag, 2007:288 - 308 . [ 2 ] At ta nasio A, Ghia ni G, Grandin et ti L, et a l . Op era tions research me thods for resource management and sch eduling in a computa tion al grid: a survey [ J ] . A d v an ces in Paral lel Com put i ng, 2005,14:53 - 81 . [ 3 ] Li K . Job sch eduling and processor allocat ion for grid comput ing on met a-computers[J ] . Jour na l o f Pa ral lel and [ 4 ] Distribu ted Compu t i ng, 2005,65(11):1406 - 1418 . 王兴伟 ,蔡颖, 佟呈呈, 等· 基于拍卖和免疫优化的网格作业分配机制 [ J ]· 东北大学学报 : 自然科学版, 2009, 30 (3):354 - 356· (Wang Xing-w ei, Cai Ying, Tong C heng-cheng, et al . Grid job assignment scheme based on auc tion and im mune optimiza tion [ J ] . Jou rnal o f N ortheastern U ni versi ty: N a t ura l S cien ce, 2009,30(3):354 - 356 .) Leal K, Huedo E, Llorente L M . A decentralized model for [ 5 ] sche duling independent tasks in fe derated grids [ J] . F u t ure Genera tion Compu ter Syste ms, 2009,25(8):840 - 852 . [ 6 ] Dorigo M, Blum C . Ant colony optimiza tion th eory: a survey [J] . Theoret ical Com pu ter S cience, 2005, 344 (3): 243 - 278 . [ 7 ] Stutzle T, Dorigo M . A short convergen ce proof for a class of ant colony optimization algorithm s [ J ] . I EEE T ransactions on Evo lu t ionary Compu t at ion, 2002,6(4):358 - 365 . B uyya R , Murshe d M . GridSim: a toolkit for the modeling [ 8 ] a nd simulat ion of distributed resource management and sc heduling for grid comput ing [ J ] . Concu rrency and Com pu ta t ion: Pract ice and Ex perie nce, 2002, 14 (3): 1175 - 1220 . [ 9 ] M arilen a1 B, Antonella D S, Giovanni M . An ACO inspired strategy to improve jobs sc heduling in a grid environment[ C] ∥ Th e 8th International Conference on Algorithms and Processing, Archit ectures Cyprus: Springer-V erlag, 2008:30 - 41 . Parallel for ICA3 PP 2008 . [10] Etmin ani K, N aghibzad eh M . A min-min max-min selec tive algorithm for grid task sch eduling [ C ] ∥ 2007 the T hird I EE E/ I FI P Intern ational C onference in Central Asia on Internet . Tashkent: IE EE, 2007:134 - 144 .

分享到：

赞收藏

资料库

一种基于蚁群算法动态均衡的网格任务调度.pdf

相关推荐

课程资源

热门标签

最新资料