特此感谢以下专家参加 HPC CHINA 论文评审:(按姓氏笔画排序)
王 珏 中国科学院计算机网络信息中心
王 涛 上海超级计算中心
王 婷 中国科学院软件研究所
王 鹏 NVIDIA 公司
王 磊 中国科学院计算技术研究所
王文珂 国防科技大学
王海霞 清华大学
王朝利 美国圣母大学
车永刚 国防科技大学
毛 睿 深圳大学
邓笋根 中国科学院计算机网络信息中心
左宪禹 河南大学
叶 煌 中国科学院计算机网络信息中心
叶可江 中科院深圳先进技术研究院
叶笑春 中国科学院计算技术研究所
田 聪 西安电子科技大学
付斌章 华为公司
冯仰德 中国科学院计算机网络信息中心
冯春生 湘潭大学
冯晓兵 中国科学院计算技术研究所
邢 晶 中国科学院计算技术研究所
毕仲科 日本理化学研究所/天津大学
任 睿 中国科学院计算技术研究所
刘 旭 北京应用物理与计算数学研究所
刘 杰 国防科技大学
刘 铎 重庆大学
刘 悦 上海大学
刘 辉 加拿大卡尔加里大学
刘 颖 中国科学院计算技术研究所
刘卫国 山东大学
刘日晨 南京师范大学
刘新春 曙光信息产业股份有限公司
江先阳 武汉大学
汤善江 天津大学
安 虹 中国科学技术大学
安学军 中国科学院计算技术研究所
安恒斌 北京应用物理与计算数学研究所
许 嘉 广西大学
孙毓忠 中国科学院计算技术研究所
阳王东 湖南大学
李于峰 中物院计算机应用研究所
李士刚 中国科学院计算技术研究所
李文明 中国科学院计算技术研究所
李肯立 湖南大学
李昌华 中国科学院国家天文台
李佳佳 佐治亚理工学院
杨 章 北京应用物理与计算数学研究所
杨 锋 广西大学
杨海龙 北京航空航天大学
肖永浩 中物院计算机应用研究所
肖利民 北京航空航天大学
肖俊敏 中国科学院计算技术研究所
吴亚东 西南科技大学
吴俊敏 中国科学技术大学
何 鑫 中国科学院计算技术研究所
何万青 阿里巴巴集团
宋 莹 北京信息工业大学
张 峰 中国人民大学
张元铭 浙江科技(工业)大学
张佩珩 中国科学院计算技术研究所
张宝印 北京应用物理与计算数学研究所
张常有 中国科学院软件研究所
张悠慧 清华大学
陆忠华 中国科学院计算机网络信息中心
陈 全 上海交通大学
陈 军 北京应用物理与计算数学研究所
陈 娟 国防科技大学
陈文光 清华大学
陈汉华 华中科技大学
陈国宁 美国休斯顿大学
陈明宇 中国科学院计算技术研究所
武林平 北京应用物理与计算数学研究所
范东睿 中国科学院计算技术研究所
罗红兵 北京应用物理与计算数学研究所
罗红兵 北京应用物理与计算数学研究所
周 池 深圳大学
周 威 江南计算技术研究所
单桂华 中国科学院计算机网络信息中心
单桂华 中国科学院计算机网络信息中心
孟祥飞 国家超级计算天津中心
赵 霞 北京工商大学
赵永华 中国科学院计算机网络信息中心
胡晓东 中国科学院计算机网络信息中心
钟 诚 广西大学
段玉聪 海南大学
俞宏峰 美国内布拉斯加大学
姜金荣 中国科学院计算机网络信息中心
袁 良 中国科学院计算技术研究所
袁晓如 北京大学
徐 顺 中国科学院计算机网络信息中心
徐 然 中物院高性能数值模拟软件中心
徐小文 北京应用物理与计算数学研究所
徐俊刚 中国科学院大学
翁楚良 华为技术有限公司
高家全 南京师范大学
郭 红 北京应用物理与计算数学研究所
郭翰琦 美国阿贡国家实验室
唐 卓 湖南大学
陶煜波 浙江大学
梅 晶 湖南大学
曹 政 阿里巴巴集团
曹 轶 北京应用物理与计算数学研究所
曹小林 北京应用物理与计算数学研究所
曹宗雁 阿里巴巴集团
曹荣强 中国科学院计算机网络信息中心
戚正伟 上海交通大学
崔 涛 中国科学院数学与系统科学研究院
章隆兵 中国科学院计算技术研究所
梁 婕 澳大利亚悉尼科技大学
隋秀峰 中国科学院计算技术研究所
董德尊 国防科技大学
蒋德钧 中国科学院计算技术研究所
韩 锐 北京理工大学
韩 睿 北京工业大学
喻之斌 中科院深圳先进技术研究院
程汤培 中物院高性能数值模拟软件中心
詹剑锋 中国科学院计算技术研究所
窦 勇 国防科技大学
谭光明 中国科学院计算技术研究所
谭郁松 国防科技大学
翟季冬 清华大学
熊 劲 中国科学院计算技术研究所
缪裕青 桂林电子科技大学
薛 巍 清华大学
薛栋梁 上海交通大学
霍志刚 中国科学院计算技术研究所
特此感谢以下专家参加 HPC CHINA 论文审稿会:(按姓氏笔画排序)
叶笑春 副研究员 中国科学院计算技术研究所
冯晓兵 研究员
中国科学院计算技术研究所
阳王东 教 授
湖南大学
何万青 资深专家 阿里巴巴集团
张云泉 研究员
陆忠华 研究员
詹剑锋 研究员
谭光明 研究员
中国科学院计算技术研究所
中国科学院计算机网络信息中心
中国科学院计算技术研究所
中国科学院计算技术研究所
目 录
稀疏矩阵向量乘法在申威众核架构上的性能优化 ................................................... 1
李亿渊,王欣亮,许平,薛巍
基于 OpenCL 的 WebP 图像有损压缩算法 FPGA 异构加速技术 ....................... 11
赵雅倩,郭振华,范宝余,胡雷钧,高开
面向 LICOM3 系统的并行 I/O 优化技术研究与实现 ........................................... 21
祝子杰,李云龙,朱小谦,林鹏飞,刘海龙
基于申威众核处理器的格点量子色动力学并行加速计算方法 ............................. 31
张增校,栾钟治,宫明,徐顺
A Massively Parallel Bayesian Approach to Factorization-based Analysis of Big
Time Series Data ........................................................................................................ 41
Tengfei Gao, Yongyan Liu, Yunbo Tang, Lei Zhang and Dan Chen
一种多精度混合的浮点乘加部件的设计与实现 ..................................................... 53
陈正博,吴铁彬,刘骁,郑方,丁亚军,李宏亮
基于强化学习的 Lustre 文件系统的性能调优 ........................................................ 61
张文韬,汪璐,程耀东
共享指令缓存 XOR 散列索引的研究与设计 .......................................................... 69
刘骁,唐勇,郑方,丁亚军
基于“神威·太湖之光”的区域海洋模式并行优化 ............................................. 79
吴琦,倪裕芳,黄小猛
监督学习模型指导的低开销编译器优化顺序选择方法研究 ................................. 89
刘慧,赵荣彩,姚金阳
基于用户级融合 IO 的 Key-Value 存储系统优化技术研究 ................................. 100
张云尧,安仲奇,邢晶,霍志刚
一种基于共享公平的多资源公平分配策略 ........................................................... 110
李杰,李伟东,张学杰
利用多副本调度策略支持分布式对象存储的强一致性及负载均衡 ................... 119
史骁,胡德天,宋永浩,郑晓辉,姜云涛,刘晓东,唐宏伟,赵晓芳
基于 Hopfield Neural Network 的云作业调度算法 .............................................. 129
李强,强彦,郝瑞,刘晓峰
基于卷积神经网络的低剂量 CT 图像肺结节检测 ................................................ 136
孙娇娇,龚安
快速多极子方法在申威众核处理器上的实现和优化 ........................................... 142
王武,王舒扬,姜金荣,孟虹松
申威众核处理器上的三对角并行求解器 ............................................................... 148
刘侃,王欣亮,许平,薛巍
度量空间支撑点选择穷举算法并行化研究 ........................................................... 156
胡梓良,毛睿
一种基于 Inter-Warp 异构性的缓存管理与内存调度机制 .................................. 164
方娟,魏泽琳,于婷雯
Scalable Graph Traversal on GPUs ....................................................................... 172
Zhiheng Lin, Ke Meng and Guangming Tan
基于国产十亿亿次超算系统的近连续过渡流区 N-S/DSMC 耦合算法并行优化研
究................................................................................................................................ 180
徐金秀,李中华,孙俊,李志辉,郑岩
基于 TCG 技术的二进制翻译条件转移指令优化研究......................................... 186
张家豪,单征,岳峰,傅立国,王军,李明亮
面向大规模海洋数据同化算法的并行实现及优化 ............................................... 194
万威强,肖俊敏,洪学海,谭光明
一种基于 GPGPU 架构的并行空间叠加分析方法 ............................................... 202
赵艳伟,杨帆
GA-Sim:一种基于分类和实例学习相结合的作业运行时间预测算法 ............. 210
肖永浩,许伦凡,熊敏
基于“神威·太湖之光”的 LQCD Dslash 热点的研究分析与 MPI 实现 ....... 216
张淼,周宇,陈建海,何钦铭,徐顺,宫明
一种支持 DDR4 的软硬件结合的访存踪迹收集分析工具集 .............................. 224
李作骏,陈明宇
基于非结构网格的近海海域污染物迁移三维数值模拟并行算法 ....................... 232
廖子菊,邓小毛
二维 Mesh 网络中一种新型的多播路由算法 ........................................................ 240
肖灿文,娄辉
面向神威·太湖之光的 THAFTS-Acoustic 广义水动力系数计算模块并行优化策
略................................................................................................................................ 247
吕小敬,刘钊,蒋令闻,陈德训,杨广文
并行任务图的优化调度算法 ................................................................................... 256
李于锋,莫则尧,肖永浩,熊敏,赵士操,段博文
一种缓解矩阵分解并行算法负载不均衡问题的新方法 ....................................... 264
郭睿欣,张锋,王力哲,张武生,雷辛亚,薛尔康
HSWAP:适用于高性能计算环境的数值模拟工作流管理平台 ......................... 272
赵士操,肖永浩,段博文,李于锋
科学计算环境 REST 风格 WEB 服务 API 的认证与授权 ................................... 280
曹荣强,和荣,卢莎莎,王小宁,王彦棡,迟学斌
A Scalable Reservoir Simulator for Polymer Flooding in Naturally Fractured
Reservoirs on Parallel Computers .......................................................................... 288
He Zhong, Hui Liu, Tao Cui, Kun Wang, Ye He, Lihua Shen, BoYang, et al.
mDCR: 一个多任务的并行计算模型和运行框架 ................................................ 296
陈虎,杨颖文
Constructing Skeleton for Parallel Applications with Machine Learning Methods
.................................................................................................................................... 304
Zihang Zhang, Guangzhong Sun, Jiepeng Zhang, Yuze Qin and Yilun Dong
一种基于深度学习的性能分析框架设计与实现基于共享内存的 OpenCL 主机-内
核代码融合编译器设计与实现 ............................................................................... 311
洪锐,伍明川,刘颖,黄磊,冯晓兵
基于 CUDA 的地震相干体并行算法 ...................................................................... 320
张全,林柏栎,彭博,靳梓宁
针对基于 Cache 的同驻攻击的主动防御策略 ....................................................... 326
黄汝维,何佩聪,刘灿,陈思琪
基于 FPGA 的流计算加速框架设计 ...................................................................... 333
刘元卿,陈灿,沈华,臧大伟
基于 ARMv8 架构面向机器翻译的 SGEMM 优化 .............................................. 341
龚鸣清,张鉴,卢兴敬,陈伟,王砚峰
基于天河互连的公共通信接口 UCX 实现与评估 ................................................. 349
谢旻,周恩强,董勇,张伟
FPGA 与闪存融合的存算一体架构 ....................................................................... 357
马恬煜,刘伯然,金岳平,沈华,臧大伟
基于低基数路由器构建大规模直接网络 ............................................................... 365
苏勇,万伟,李斌,戴荣,吉青,秦晓宁
基于聚类的环形 kNN 算法 ..................................................................................... 375
匡振曦,武继刚,李嘉兴
HPC 云超算集群性能特征评测 .............................................................................. 383
余洋,覃伟,田永军,何万青
基于流式计算的空间科学卫星数据实时处理 ....................................................... 392
孙小涓,石涛,胡玉新,佟继周,李冰,宋峣
基于 PID 参数约束的谱多流形聚类算法 .............................................................. 400
罗养霞,马迪,常言说
TLRank:一种新的社会化协同排序推荐算法 ..................................................... 408
李改,邹小青,宋海生,李亚军,陈强
基于邻接点特征的大规模标签图子图查询 ........................................................... 416
单晓欢,高见野,丁琳琳,宋宝燕
一种云环境下基于强化学习的多目标任务调度算法 ........................................... 424
童钊,邓小妹,陈洪剑,梅晶
基于植物生长算法的云作业调度模型 ................................................................... 432
李强,刘晓峰
一种基于 Java 虚拟机的动静结合自适应优化方法 ............................................. 440
张海军,郑艳,叶俊,白书敬
基于公共云的 HPC 集群实现及自动伸缩闲时计算研究 ..................................... 446
田永军,何万青,孙相征,余洋
基于微操作的 Hadoop 参数自动调优方法 ............................................................ 453
李耘书,滕飞,李天瑞
适合神威太湖之光架构的 LOBPCG 求解器 ........................................................ 461
于天禹,赵永华,赵莲
基于 Winograd 算法的卷积神经网络 FPGA 加速器的设计方法 ....................... 467
王奥博,刘凯,李伟,陈凯,赵鹏
基于分治法求解对称三对角矩阵特征问题的 MPI/Cilk 混合并行算法 ............. 473
朱京乔,赵永华
基于多特征融合的运动目标跟踪方法 ................................................................... 479
益争祝玛,尚振宏,刘辉,李润鑫
面向天河 2 号升级系统的粒子输运求解器 OpenSN ............................................ 486
朱肖雄,刘杰,龚春叶
基于 GPU 加速和非负矩阵分解的并行协同过滤推荐算法 ................................. 492
康林瑶,唐兵,夏艳敏,张黎
FPGA 应用于高性能计算的研究现状和未来挑战 ............................................... 498
贾迅,钱磊,邬贵明,吴东,谢向辉
基于非结构化网格的高可扩展并行有限体积格子 Boltzmann 方法 .................. 507
徐磊,陈荣亮,蔡小川
基于应用的全局资源优化调度方法研究 ............................................................... 513
寇大治,沈瑜,唐小勇
一种大规模并行作业运行故障快速定位方法 ....................................................... 519
朱光慧,曾云辉
支持并行程序大规模运行的 MPI 仿真环境 ......................................................... 525
郭亚宇,林放,刘轶,钱德沛
服务器级 ARM Cortex-A72 多核处理器的性能评估 ........................................... 531
王一超,陈昕鑫,杨屿杰,左思成,林新华
可验证的支持模糊检索的加密算法 ....................................................................... 537
黄汝维,李志坤,刘灿,陈思琪
基于 CUDA 的地震倾角方位角并行算法 .............................................................. 543
陈鹏程,张全,彭博,向伟铭
一种分布式文件系统客户端缓存优化机制 ........................................................... 549
刘宇胜,刘光明,喻杰
基于超算暨 HPIC-LBM 的大时空三维湍流磁重联数值模拟研究 ..................... 555
颜辉,朱伯靖,万文,钟英