基 于 任 务 负 载 监 测 的 高 性 能 集 群 节 点 启 停 机 制
1,2, 曹荣强
1, 戴志辉
1,2, 朱 鹏
1, 迟学斌
1
曹宗雁
(1.中国科学院计算机网络信息中心 超级计算中心, 北京 100190; 2.中国科学院研究生院, 北京 100049)
摘 要: 对高性能计算集群在运行过程中如何通过关闭闲置节点来实现有效节能的问题进行了研究和探讨,设
计和实现了基于任务负载量统计监测的节点启停机制。 根据对系统中作业运行和排队情况的记录和分析,通过
参数估计设计了反映队列任务情况的负载因子,并围绕负载因子制定具体策略,结合作业系统的队列设置和资
源分配规则,对集群中的空闲节点进行自动启停控制。 模拟实验表明,基于任务负载监测的节点启停机制能够
有效地自动启停系统中闲置的节点,从而降低系统功耗,并且对系统中作业的整体完成时间基本不造成影响。
关键词: 高性能计算机; 集群; 任务负载; 节点控制; 参数估计; 节能
中图分类号: TP393 文献标志码: A 文章编号: 1001唱3695(2011)12唱4663唱03
doi:10.3969/j.issn.1001唱3695.2011.12.069
Nodes start/stop mechanism for high唱performance computing
CAO Zong唱yan1,2, CAO Rong唱qiang1, DAI Zhi唱hui1,2, ZHU Peng1, CHI Xue唱bin1
clusters based on task load monitoring
(1.Supercomputing Center, Computer Network Information Center of Chinese Academy of Sciences, Beijing 100190, China; 2.Graduate School
of Chinese Academy of Sciences, Beijing 100049, China)
Abstract: This paper discussed the method of closing idle nodes to save power in high唱performance computing clusters.It pro唱
posed a mechanism for nodes start and stop control based on task load monitoring and statistics and designed task load indicator
using parameter estimation.It set up detail strategies around this indicator to automatically control the idle nodes starting and
stopping.It also considered queue configuration and resource allocation of job manage system in the strategies.Simulation tests
indicate that the nodes start/stop mechanism can effectively control the idle nodes in the system, so that the power consumption
can be reduced; moreover, the mechanism impacts very little on the system overall job scheduling and running.
Key words: high唱performance computer; cluster; task load; node control; parameter estimation; power saving
第 28 卷第 12 期
2011 年 12 月
计 算 机 应 用 研 究
Application Research of Computers
Vol畅28 No畅12
Dec畅2011
倡
第一大难题
大的电力资源开销给超级计算机的运行维护带来了巨大的挑
超级计算机规模扩大的同时也导致其功耗急剧提 高,
[1],庞
TOP500 中排名前30 位的机器总功率均在1 000 KW 以上
战。 人们认识到了高性能计算机带来的能源消耗的问题,DAR唱
PA 在讨论Exa(1021)级的高性能计算机时将系统能耗问题列为
[2]。 在高性能计算机电力消耗得到重视的情况下,
系统管理工作自然要考虑到对系统功耗的控制和管理。 如何合
理地管理高性能计算机中的资源,在保证运行效率和服务能力
的同时,又能通过各种手段降低系统的总体功耗,节约电力资
源,实现绿色节能的高性能计算,是现今系统管理工作中值得研
究的问题。 本文以此为出发点,结合中国科学院超级计算环
的实际运行情况,利用对空闲计算节点的启停控制,对降低
[3]
系统整体功耗的方法和策略进行了研究和实现。
1 研究背景
式的不同使得这些工作不能直接应用于高性能计算集群。 高
性能计算集群在运行时,节点资源通常被划分为若干队列来接
收性质不同的用户作业。 而不同用户提交的作业频率、规模和
时长通常是随机的,在某一时刻可能队列中作业很多且大部分
在排队等待,而在另一时刻队列中作业则相对较少。 尤其是对
于作业运行时间较短的队列,在夜间或节假日等时段,用户向
系统中提交作业的可能性较低时,就很容易出现部分节点闲置
的情况。 另外,在系统运行时由于被调度执行的作业没能完全
装满队列,但剩余资源亦不足以装载其他作业,就会产生节点
碎片,碎片中的节点也会因为分不到作业而闲置。 闲置的节点
资源无法提供服务,因而造成了电力损耗。
对于集群来说,要让系统在整体任务较少时降低功耗,一
各个部件进入低功耗状态。 这种方法能够保证系统在线资源
数量稳定,应用的方法也较为简单,仅需安装好相应的驱动,并
设置好单台服务器的电源管理模式即可。 该方法的局限在于:
a)低功率运行状态下系统仍然会有相当的功耗;b) 有时因为
收稿日期: 2011唱05唱26; 修回日期: 2011唱06唱30 基金项目: 国家“863” 计划重点资助项目(2006AA01A116,2006AA01A117);中国科学院
“ 十一五” 信息化专项资助项目(INFO唱115唱B01)
作者简介:曹宗雁(1981唱),男,湖南湘潭人,助理研究员,博士,主要研究方向为高性能计算机系统管理及优化技术(zycao@sccas.cn);曹荣强
(1982唱),男,山东临沂人,助理研究员,博士,主要研究方向为计算网格、并行计算;戴志辉(1983唱),男,湖南涟源人,博士,主要研究方向为计算网
格、网格容错技术;朱鹏(1971唱),男,山东菏泽人,高级工程师,硕士,主要研究方向为高性能计算机体系结构、计算数学;迟学斌(1963唱),男,吉林
梅河口人,研究员,博士,主要研究方向为高性能计算方法与软件、并行计算应用.
在已有的关于降低集群功耗的研究中,有针对负载均衡集
[5],但系统运行方
[4],也有应用于分布式集群的方法
个途径是通过高级电源管理功能使空闲节点在开机的状态下
群的方法
境
·4664·
驱动等原因使得状态切换不及时而影响应用性能;c) 部分服
态运行,典型的例子如中国科学院超级计算中心的深腾 7000
务器会因为硬件或操作系统版本的原因而无法支持低功耗状
超级计算机
[6]。
[7]。
让系统空闲时降低功耗的另一个方法是将空闲的资源直
要在保证服务水平的前提下通过关闭闲置节点来降低高
部分节点以降低系统总功耗的同时使系统的相对负载保持在
算集群的硬件厂商的产品都可以通过向供电控制模块发送命
接关闭或休眠,待需要时再将其启动或是唤醒。 多数高性能计
令来完成节点的开关机操作,并且在技术上不难实施。 该方法
能够使空闲节点的功耗达到或是接近0,从而让系统整体功耗
尽可能降至最低,关闭的节点大部分部件不会继续通电并发
热。 从机房散热的角度,这样做也能够进一步节约能源。 但这
样做的风险是会使系统中可用资源减少,如果实施不当,会出
现资源不足使得作业排队时间急剧上升,这相当于降低了服务
质量,对于用户来说是不可接受的
性能计算集群的功耗,需要制定合理的节点启停策略,在关闭
较均衡的水平;当监测到队列中作业量增大,可能需要更多的
资源时,应及时开启闲置节点,提供满足需求的节点资源,避免
出现作业调度响应时间过长的情况。
2 节点启停机制设计
2畅1 负载因子设计
要设计并实现基于负载监测的节点启停策略,确保节点启
停策略的有效性,首要任务是建立起一套对队列任务负载状况
进行监测和评价的机制。 这里所说的队列任务负载,不仅指当
前正在运行的作业对系统资源的占用状况,还包括队列中仍在
排队的作业可能对系统资源的使用情况。 由于在作业未完成
之前,从系统的角度几乎无法确定作业会在何时结束,因此必
须通过合理的估计对系统中未来可能需要的资源进行衡量。
Zotkint 等人在研究作业调度的回填策略时,针对未完成的作业
的运行时间估计这个问题,得出了两点结论:a) 策略的有效性
并不一定十分依赖于准确估计用户作业运行时长;b) 如果采
[8,9]。 从中可以得到一定的启发,即
用用户承诺的运行时间来执行回填策略的效果反倒不如采用
随机生成的作业运行时间
作业的运行时间能不能被准确估计并不一定是策略是否有效
的决定性条件。
[10]
[11]
或负载预
已有的一些研究工作使用了随机调度的策略
对系统负载进行评估及控制,而本文尝试在高性
测的方法
能集群中采用更为简单的作业抽样统计并进行参数估计的方
法来估算队列中现有的任务负载。
首先对已完成作业情况进行统计。 考虑到不同规模的作
业对节点资源的实际消耗量相差较大,在进行资源消耗量的统
计和评估时,按作业规模划分区间进行统计,将队列中接收的
作业规模按照一定间隔( 如 2 的整数次方) 划分成不同的区
间,从系统日志中回溯选取或是随机抽取足够数量已完成作业
的信息作为样本,例如某区间内的作业样本数量不够多,可以
将该组与其相邻的组进行合并处理。 分组完成后,对每一组中
每个作业样本计算其资源消耗量,即作业规模 ×实际运行时
长,并求出每组的样本均值和样本方差。
可知,当样本数量足够大
(≥30)时,样本均值接近正态分布,可以用参数估计的方法,
由 Lyapunov 中心极限定理
[12]
计 算 机 应 用 研 究
第 28 卷
σ2
n
σ2
n
,μ+Z α2
使用上面的样本均值和样本方差近似估算作业资源占用量均
间计数并分别乘以该规模作业资源占用量均值估计下界和均
值置信度在 α的置信区间。 当某个区间内作业数为 n、作业样
本资源占用量均值为 μ、样本资源占用量方差为 σ时,这样在
满足 α置信度的情况下,该规模作业整体资源占用量均值的
置信区间为 μ-Z α2
,这即是该作业规模资源占
用量的均值在置信区间内的最小值和最大值,记这两个值为
rmin 和 rmax。 然后据此对队列内的现存作业按不同作业规模区
值估计上界,得出该队列剩余作业资源占用量的最小估计值和
最大估计值。 为确保高性能计算机服务的有效性,在实际实现
过程中采用均值估计上界即 rmax。 接下来依据一定的规则或
倾向性,对不同队列定义不同的归一化转换函数,函数值随作
业估值同向变化,将求得的函数值定义为队列的负载因子 T。
本文工作在实现中采用了较为简单的转换函数,令负载因子 T
等于队列全部规模的作业资源占用量均值估计上界 rmax 之和
与队列节点数量 p 和队列允许的作业最长时间 tmax 乘积之比,
即 T =(Σrmax)/(p ×tmax)。
2畅2 节点启停策略
情况。 求出了队列的负载因子后,针对负载因子来制定节点启
停的规则,在队列负载因子较低时关闭空闲节点,较高时再开
启,从而有效降低系统功耗。
节点启停策略需要设定两个基本阈值用于启停控制,即闲
置节点关闭阈值 Tc 和闲置节点开启阈值 Ts(Ts >Tc)。 当队列
的负载因子低于 Tc 时,关闭部分闲置的节点;当队列的负载因
子高于 Ts 时,将部分因闲置关闭的节点启动。 除了 Tc 和 Ts 之
外,在节点启停机制发生作用时,还需要预先定义两个参考值
Tc′(Ts >Tc′>Tc)和 Ts′(Ts >Ts′>Tc),分别用于计算关闭和开
启节点的数量,以保证启停动作完成之后队列的负载因子大小
适中,减少反复启停操作的可能。
还需要注意的是,在关闭和开启节点时,需要考虑到作业
系统对队列的配置情况,保证队列在逻辑上的有效性,避免成
为无效队列而浪费资源,降低服务水平。
队列的负载因子能够在一定程度上反映队列目前的负载
综合以上原则,设计出节点启停策略的细节如下:
a)计算队列当前的负载因子。
b)如果队列负载因子高于开启阈值 Ts,或队列中排队的
最大作业规模超过了开启的节点总数,再或者空闲节点数量少
于队列允许的最小作业规模,则开启部分或全部已关闭的节
点,使队列达到下列状态之一:
(a) 全部闲置节点开启,开启后负载因子仍然高于 Ts,且
队列中闲置节点数不小于队列允许的最小作业规模;
(b)开启部分已关闭的节点,开启后负载因子小于 Ts′,且
开启后队列中闲置节点数等于队列允许的最小作业规模,但如
于排队中作业最大规模,则应保证开启后的总节点数不小于排
队中最大作业规模;
(c)开启部分已关闭的节点,开启后负载因子等于或最接
近 Ts′,队列中闲置节点数不小于队列允许的的最小作业规模,
且所有未关闭的节点数不小于排队中最大作业规模;
(d)如果以上条件皆无法满足,则不开启任何节点。
c)如果队列的负载因子低于闲置节点关闭阈值 Tc,或是
闲置节点数小于队列允许的最小作业规模,则关闭部分或全部
果有作业运行的节点数量与队列允许的最小作业规模之和小
有作业运行的节点数量与队列允许的最小作业规模之和小于
第 12 期
闲置节点,使队列达到下列状态之一:
(a)全部闲置节点关闭,关闭后负载因子仍低于 Tc,且队
列中正在运行作业的节点数不小于排队中最大作业规模;
(b)部分节点关闭,关闭后队列的负载因子小于 Tc′,且关
闭后队列中闲置节点数等于队列允许的最小作业规模,但如果
排队中作业最大规模,则应保证未关闭节点数不小于排队中最
大作业规模;
(c)部分节点关闭,关闭后队列的负载因子等于或最接近
于 Tc′,队列中闲置节点数不小于队列允许的最小作业规模,且
未关闭的节点数不小于排队中最大作业规模;
(d)如果以上条件皆无法满足,则说明队列中开启的闲置
节点是碎片节点,不论负载因子是多少,直接关闭。
d)全部调整完毕,等待下一次实施策略。
3 模拟测试及结果分析
通过模拟程序虚拟出与深腾7000 功能相似的队列进行了模
拟测试,模拟程序用C 语言编写,实现了队列的作业接收、作业调
度、节点资源分配等功能
[13]。 在这些功能的基础上,加入了作业
历史信息的统计、队列负载因子的估计和节点的启停功能。
队列设 置 参 考 的 是 深 腾 7000 上 x64_blades 队 列 的 设
[6],允许接收的作业规模为 16 ~512 处理器核心( 每节点 8
处理器核心),作业运行的最长时间为 60 min。 提交到队列的
作业来自于2009 年9 月28 日至10 月31 日深腾7000 上 x64_
blades 队列接收到的真实作业数据信息。
关于节点启停策略的参数设置如下:关闭阈值 Tc 为 0畅7,
开启阈值 Ts 为 1畅5,而两个中间参考值 Tc′和 Ts′分别设定为
1畅0 和0畅9。 节点机在获取开机命令之后5 min 才能完全开启
并接收作业。
而引起的启停机制效果变化的情况,依次设置模拟队列的节点
数为320、240 和160 节点进行三组测试,每组测试中设置不同
的节点启停机制启用的间隔,分别为 30、60、120、240 min。 通
过考察全部作业耗时、作业平均等待时间和节点关闭总时间来
验证基于任务负载监控的启停机制的效果。 三组测试的结果
数据分别列于表1 ~3 中,而图1 则画出了模拟测试中作业完
成所需的虚拟时长及各种机时的占比情况。
表 1 模拟 320 节点队列测试结果
为了体现出因队列资源的多少导致队列的负载程度不同
置
关机机时
作业机时
闲置机时
总时长/min
48 915
48 917
48 915
48 915
48 915
占比/%
.41
57
.41
57
.41
57
57
.41
57
.41
占比/%
.66
39
.73
38
37
.07
30
.76
0
.00
表 2 模拟 240 节点队列测试结果
占比/%
.93
2
.86
3
.52
5
11
.83
42
.59
平均等待
时间/min
.53
1
.55
1
.80
1
2
.27
0
.68
调整频
率/min
30
60
120
240
全开
调整频
率/min
30
60
120
240
全开
总时长/min
49 486
49 456
49 509
49 391
49 401
作业机时
占比/%
75
.67
.71
75
.63
75
75
.81
75
.80
闲置机时
占比/%
3
.32
.83
3
.15
5
8
.22
24
.20
关机机时
占比/%
21
.01
.46
20
19
.21
15
.97
0
.00
平均等待
时间/min
3
.43
.45
3
.62
3
3
.57
2
.73
可以看到,对于320 节点的模拟队列,由于节点资源充足,
采用不同间隔的启停机制和保持节点全开对作业的总完成时
曹宗雁,等:基于任务负载监测的高性能集群节点启停机制
·5664·
间影响很小;因启停机制生效而产生的节点关闭时间也很高;
当启停机制检测执行的频率越高时,节约的机时也就越多。 但
是启停机制对于作业的平均等待时间造成了一定的影响,启停
调整频率越低,平均等待时间增加得越多,这对执行作业的用
户可能是一个不利的影响。 从对节点数量稍少的 240 节点队
列的模拟测试(表2)中可以看出,作业总耗时和作业平均等待
时间相较320 节点队列模拟有一定的增加,而采用不同间隔的
影响。 由于少了60 个节点,而作业量没有变化,因此在总耗时
不变的情况下闲置的机时亦有所下降,节点关闭的总时间占比
也有所减少。 从对于节点数量较少、队列负担相对较重情况的
160 节点队列的模拟测试(表3)中可以看出,作业完成总时间
大幅增加,这是因为给定的节点数在与前两组模拟相近的时间
内能够提供的机时资源已小于全部作业所需,故需要花费更多
的时间才能完成所有作业,平均等待时间也随之激增,节点关
闭的总机时急剧减少。 在这种情况下,不论采用何种间隔的启
停机制来调整,关机机时占比都相对较少。
启停机制和保持节点全开对作业的总完成时间也有了微小的
表 3 模拟 160 节点队列测试结果
调整频
率/min
30
60
120
240
全开
总时长/min
62 257
62 221
62 100
62 142
62 034
作业机时
占比/%
.22
90
90
.27
.45
90
.39
90
90
.54
闲置机时
占比/%
.23
4
4
.22
.44
4
.20
5
9
.46
关机机时
占比/%
.56
5
5
.51
.12
5
.42
4
0
.00
平均等待
时间/min
57
.97
58
.30
.25
57
.37
57
.53
56
综合上面的实验结果,可以得出结论:当队列中节点资源
比较充裕、队列的任务负载量不高时,节点启停机制能够通过
关闭节点有效地节约闲置的机时,但是会造成作业平均等待时
间的增加;而当队列负载很重的情况下,启停机制产生的作用
不会很大。 实验结果表明,采用执行频率更高的启停机制得到
的实验数据会更好,但是需要考虑到频繁实施节点启停策略会
给节点硬件以及机房整体供电带来的冲击,因此在实际中还需
要选取合适的频率来执行启停调整。
4 结束语
本文提出在高性能计算集群、运行过程,根据队列任务负
载情况自动启停节点的机制,减小系统功耗, ( 下转第 4680 页)
·0864·
式(8)(9)计算的结果比较(表3),其中取 p =0.99。 表3 中的
上限1 是用式(8) 计算的结果,上限 2 是用样本计算的结果;
下限1 是用式(9) 计算的结果,下限 2 是用样本计算的结果。
从表3 可以看出,样本中的数据完全在式(8)(9)计算的上、下
限之间。
二跳
9
一跳
0
.0014
.0122
.0112
0
0
0
表 2 WSNTS 误差的期望和标准差
期望 1
期望 2
标准差 1
标准差 2
0
.5968e -004
.0173
0
0
.0150
表 3 WSNTS 误差的上、下限
.0446
0
.0264
0
-0
.0446
.0200
-0
.0314
0
.0266
0
-0
.0314
.0203
-0
上限 1
上限 2
下限 1
下限 2
一跳
二跳
项目
项目
期望
标准差
上限
下限
三跳
0
.0017
.0212
.0137
0
0
0
三跳
.0546
0
.0276
0
-0
.0546
.0272
-0
4 结束语
本文在已有研究的基础上,考虑了发送方时延和接收方时
延对WSNTS 误差的影响,分析并给出了影响 WSNTS 误差的因
素及其分布规律。 首先,在分析了经典的 TPSN 时间同步协议
双向报文交换机制的基础上,指出了影响 WSNTS 误差的因素,
建立了数学模型;其次,给出并证明了在考虑发送方时延和接收
方时延后单跳 WSNTS 误差仍然服从正态分布的分布规律;最
后,给出了多跳WSNTS 最大误差的随机过程模型,计算出了其
期望和方差,并给出其上、下限,得到了比文献[5] 更普适的结
论。 仿真实验结果证明了这些结论的正确性。
参考文献:
[1] LASASSMEH S M, CONRAD J M.Time synchronization in wireless
sensor networks: a survey[C] //Proc of IEEE Southeast Conference
(上接第 4665 页)设计了根据作业统计信息估算的负载因子,并
设计实现了节点自动启停机制。 模拟实验表明,在队列中节点
资源较为充足的情况下,节点启停机制能够收到较好的效果,
但同时也会带来平均作业等待时间一定程度的增长。 下一步
探索和优化,而对于启停节点造成的抖动对系统的冲击也需要
作进一步观察,力求在保证系统全局稳定运行的情况下尽可能
地节约更多的能源。
参考文献:
[1] Top 500 supercomputer sites[EB/OL].(2010唱11唱15)[2011唱05唱
23].http://www.top500.org/.
[2] KOGGE P, BERGMAN K, BORKAR S, et al.Exascale computing
study: technology challenges in achieving exascale systems [ R].
Washington DC: DARPA Information Processing Techniques Office,
2008.
[3] 中国 科 学 院 超 级 计 算 环 境[EB/OL].(2011唱05唱01)[2011唱05唱
25].http://www.cscgrid.cn/.
[4]
for idle system in clusters:
SRINIVASAN V.Power management
United States, 2011/0106935[P].2011唱05唱05.
[5] OPPENHEIM B M.Reducing cluster power consumption by dynami唱
cally suspending idle nodes[D].San Luis Obispo: California Poly唱
将对负载因子的生成函数以及启停策略的各项参数作进一步
计 算 机 应 用 研 究
第 28 卷
(SoutheastCon).2010: 242唱245.
[2] HU Xin, PARK T, SHIN K G.Attack唱Tolerant time synchronization
in wireless sensor networks[C] //Proc of the 27th IEEE Conference
on Computer Communications.2008: 41唱45.
[3] SU Wei唱lian, AKYILDIZ I F.Time唱diffusion synchronization protocol
for wireless sensor networks[ J].IEEE/ACM Trans on Networ唱
king, 2005,13(2):384唱397.
[4] 董超,田畅,倪明放.Ad hoc 网络时钟同步研究[J].通 信 学 报,
2006,27(9): 110唱117.
[5] 田贤忠, 陈长军, 胡同森.无线传感器网络时间同步概率误差研
究[J].计算机应用研究, 2009,26(6): 2199唱2201.
[6] 钟海东, 邬春学, 孔若英.无线传感器网络时间同步算法误差分
析[J].微计算机信息, 2008(4): 151唱152.
[7] GANERIWAL S, KUMAR R, SRIVASTAVA M B.Timing唱sync pro唱
tocol for sensor networks[C] //Proc of the 1st International Confe唱
rence on Embedded Networked Sensor Systems.2003: 138唱149.
[8] KULAKLI A B, ERCIYES K.Time synchronization algorithms based
on timing唱sync protocol in wireless sensor networks[C] //Proc of the
23rd International Symposium on Computer and Information Sciences.
2008:180唱184.
[9] 李晓维, 徐勇军, 任丰原.无线传感器网络 技术[M].北京: 北
京理工大学出版社, 2007.
[10] TIAN Zhen, YUAN Dong唱feng, LIANG Quan唱quan.Energy efficien唱
cy analysis of error control schemes in wireless sensor networks[C] //
Proc of Wireless Communications and Mobile Computing Conference.
2008: 401唱405.
[11] GANG Xiong, KISHORE S.Performance of distributed consensus
time synchronization with Gaussian delay in wireless sensor networks
[C] //Proc of IEEE Wireless Communications and Networking Con唱
ference.2009: 1唱5.
[12] 杨博,廖明宏.基 于 统 计 的 无 线 传 感 器 网 络 时 钟 同 步 协 议[J].
哈尔滨工业大学学报, 2007,39(1):98唱101.
technic State University, 2010.
[6] 深腾7000 使用指南[EB/OL].(2010唱05唱11)[2011唱05唱23].http://
www.sccas.cn/gb/compute/supports/documents/Lenovo7000.pdf.
[7] 中科院网络中心 2010 年第三方服务质量调查用户意见与建议落
实情况[EB/OL].(2011唱03唱17) [2011唱05唱25].http://www.
cnic.cas.cn/fdtp/201103/t20110317_3086889.html.
[8] MU’ALEM A W, FEITELSON D G.Utilization, predictability,
workloads, and user runtime estimatesin scheduling the IBM SP2 with
backfilling[ J].IEEE Trans on Parallel and Distributed Sys唱
tems,2001,12(6):529唱543.
[9] ZOTKIN D, KELEHER P J.Job唱length estimation and performance
in backfilling schedulers [C] //Proc of
the 8th IEEE International
Symposium on High Performance Distributed Computing.California:
Citeseer,1999:236唱243.
[10] 石高涛,廖明宏.大规模传感器网络随机睡眠调度节能机制[J].
计算机研究与发展,2006,43(4):579唱585.
[11] 张立敏.渲染集群节能控制研究与实现[D].长沙: 湖南师范大
学, 2008.
[12] 盛骤,谢式千,潘承毅.概率论与数理统计[M].2 版.北京:高等
教育出版社, 1989: 403.
[13] 曹宗雁,赵毅, 牛 铁,等.基 于 用 户 评 价 的 集 群 作 业 优 先 级 调 度
[J].华中科技大学学报:自然科学版,2011,39(S1):134唱138.