logo资料库

2018全国高性能计算学术年会(HPC China 2018)会议论文集.pdf

第1页 / 共700页
第2页 / 共700页
第3页 / 共700页
第4页 / 共700页
第5页 / 共700页
第6页 / 共700页
第7页 / 共700页
第8页 / 共700页
资料共700页,剩余部分请下载后查看
特此感谢以下专家参加 HPC CHINA 论文评审:(按姓氏笔画排序) 王 珏 中国科学院计算机网络信息中心 王 涛 上海超级计算中心 王 婷 中国科学院软件研究所 王 鹏 NVIDIA 公司 王 磊 中国科学院计算技术研究所 王文珂 国防科技大学 王海霞 清华大学 王朝利 美国圣母大学 车永刚 国防科技大学 毛 睿 深圳大学 邓笋根 中国科学院计算机网络信息中心 左宪禹 河南大学 叶 煌 中国科学院计算机网络信息中心 叶可江 中科院深圳先进技术研究院 叶笑春 中国科学院计算技术研究所 田 聪 西安电子科技大学 付斌章 华为公司 冯仰德 中国科学院计算机网络信息中心 冯春生 湘潭大学 冯晓兵 中国科学院计算技术研究所 邢 晶 中国科学院计算技术研究所 毕仲科 日本理化学研究所/天津大学 任 睿 中国科学院计算技术研究所 刘 旭 北京应用物理与计算数学研究所 刘 杰 国防科技大学 刘 铎 重庆大学 刘 悦 上海大学 刘 辉 加拿大卡尔加里大学 刘 颖 中国科学院计算技术研究所 刘卫国 山东大学 刘日晨 南京师范大学 刘新春 曙光信息产业股份有限公司 江先阳 武汉大学 汤善江 天津大学 安 虹 中国科学技术大学 安学军 中国科学院计算技术研究所 安恒斌 北京应用物理与计算数学研究所 许 嘉 广西大学 孙毓忠 中国科学院计算技术研究所 阳王东 湖南大学 李于峰 中物院计算机应用研究所 李士刚 中国科学院计算技术研究所
李文明 中国科学院计算技术研究所 李肯立 湖南大学 李昌华 中国科学院国家天文台 李佳佳 佐治亚理工学院 杨 章 北京应用物理与计算数学研究所 杨 锋 广西大学 杨海龙 北京航空航天大学 肖永浩 中物院计算机应用研究所 肖利民 北京航空航天大学 肖俊敏 中国科学院计算技术研究所 吴亚东 西南科技大学 吴俊敏 中国科学技术大学 何 鑫 中国科学院计算技术研究所 何万青 阿里巴巴集团 宋 莹 北京信息工业大学 张 峰 中国人民大学 张元铭 浙江科技(工业)大学 张佩珩 中国科学院计算技术研究所 张宝印 北京应用物理与计算数学研究所 张常有 中国科学院软件研究所 张悠慧 清华大学 陆忠华 中国科学院计算机网络信息中心 陈 全 上海交通大学 陈 军 北京应用物理与计算数学研究所 陈 娟 国防科技大学 陈文光 清华大学 陈汉华 华中科技大学 陈国宁 美国休斯顿大学 陈明宇 中国科学院计算技术研究所 武林平 北京应用物理与计算数学研究所 范东睿 中国科学院计算技术研究所 罗红兵 北京应用物理与计算数学研究所 罗红兵 北京应用物理与计算数学研究所 周 池 深圳大学 周 威 江南计算技术研究所 单桂华 中国科学院计算机网络信息中心 单桂华 中国科学院计算机网络信息中心 孟祥飞 国家超级计算天津中心 赵 霞 北京工商大学 赵永华 中国科学院计算机网络信息中心 胡晓东 中国科学院计算机网络信息中心 钟 诚 广西大学 段玉聪 海南大学 俞宏峰 美国内布拉斯加大学
姜金荣 中国科学院计算机网络信息中心 袁 良 中国科学院计算技术研究所 袁晓如 北京大学 徐 顺 中国科学院计算机网络信息中心 徐 然 中物院高性能数值模拟软件中心 徐小文 北京应用物理与计算数学研究所 徐俊刚 中国科学院大学 翁楚良 华为技术有限公司 高家全 南京师范大学 郭 红 北京应用物理与计算数学研究所 郭翰琦 美国阿贡国家实验室 唐 卓 湖南大学 陶煜波 浙江大学 梅 晶 湖南大学 曹 政 阿里巴巴集团 曹 轶 北京应用物理与计算数学研究所 曹小林 北京应用物理与计算数学研究所 曹宗雁 阿里巴巴集团 曹荣强 中国科学院计算机网络信息中心 戚正伟 上海交通大学 崔 涛 中国科学院数学与系统科学研究院 章隆兵 中国科学院计算技术研究所 梁 婕 澳大利亚悉尼科技大学 隋秀峰 中国科学院计算技术研究所 董德尊 国防科技大学 蒋德钧 中国科学院计算技术研究所 韩 锐 北京理工大学 韩 睿 北京工业大学 喻之斌 中科院深圳先进技术研究院 程汤培 中物院高性能数值模拟软件中心 詹剑锋 中国科学院计算技术研究所 窦 勇 国防科技大学 谭光明 中国科学院计算技术研究所 谭郁松 国防科技大学 翟季冬 清华大学 熊 劲 中国科学院计算技术研究所 缪裕青 桂林电子科技大学 薛 巍 清华大学 薛栋梁 上海交通大学 霍志刚 中国科学院计算技术研究所
特此感谢以下专家参加 HPC CHINA 论文审稿会:(按姓氏笔画排序) 叶笑春 副研究员 中国科学院计算技术研究所 冯晓兵 研究员 中国科学院计算技术研究所 阳王东 教 授 湖南大学 何万青 资深专家 阿里巴巴集团 张云泉 研究员 陆忠华 研究员 詹剑锋 研究员 谭光明 研究员 中国科学院计算技术研究所 中国科学院计算机网络信息中心 中国科学院计算技术研究所 中国科学院计算技术研究所
目 录 稀疏矩阵向量乘法在申威众核架构上的性能优化 ................................................... 1 李亿渊,王欣亮,许平,薛巍 基于 OpenCL 的 WebP 图像有损压缩算法 FPGA 异构加速技术 ....................... 11 赵雅倩,郭振华,范宝余,胡雷钧,高开 面向 LICOM3 系统的并行 I/O 优化技术研究与实现 ........................................... 21 祝子杰,李云龙,朱小谦,林鹏飞,刘海龙 基于申威众核处理器的格点量子色动力学并行加速计算方法 ............................. 31 张增校,栾钟治,宫明,徐顺 A Massively Parallel Bayesian Approach to Factorization-based Analysis of Big Time Series Data ........................................................................................................ 41 Tengfei Gao, Yongyan Liu, Yunbo Tang, Lei Zhang and Dan Chen 一种多精度混合的浮点乘加部件的设计与实现 ..................................................... 53 陈正博,吴铁彬,刘骁,郑方,丁亚军,李宏亮 基于强化学习的 Lustre 文件系统的性能调优 ........................................................ 61 张文韬,汪璐,程耀东 共享指令缓存 XOR 散列索引的研究与设计 .......................................................... 69 刘骁,唐勇,郑方,丁亚军 基于“神威·太湖之光”的区域海洋模式并行优化 ............................................. 79 吴琦,倪裕芳,黄小猛 监督学习模型指导的低开销编译器优化顺序选择方法研究 ................................. 89 刘慧,赵荣彩,姚金阳 基于用户级融合 IO 的 Key-Value 存储系统优化技术研究 ................................. 100 张云尧,安仲奇,邢晶,霍志刚 一种基于共享公平的多资源公平分配策略 ........................................................... 110 李杰,李伟东,张学杰 利用多副本调度策略支持分布式对象存储的强一致性及负载均衡 ................... 119 史骁,胡德天,宋永浩,郑晓辉,姜云涛,刘晓东,唐宏伟,赵晓芳 基于 Hopfield Neural Network 的云作业调度算法 .............................................. 129 李强,强彦,郝瑞,刘晓峰 基于卷积神经网络的低剂量 CT 图像肺结节检测 ................................................ 136 孙娇娇,龚安 快速多极子方法在申威众核处理器上的实现和优化 ........................................... 142 王武,王舒扬,姜金荣,孟虹松 申威众核处理器上的三对角并行求解器 ............................................................... 148 刘侃,王欣亮,许平,薛巍 度量空间支撑点选择穷举算法并行化研究 ........................................................... 156
胡梓良,毛睿 一种基于 Inter-Warp 异构性的缓存管理与内存调度机制 .................................. 164 方娟,魏泽琳,于婷雯 Scalable Graph Traversal on GPUs ....................................................................... 172 Zhiheng Lin, Ke Meng and Guangming Tan 基于国产十亿亿次超算系统的近连续过渡流区 N-S/DSMC 耦合算法并行优化研 究................................................................................................................................ 180 徐金秀,李中华,孙俊,李志辉,郑岩 基于 TCG 技术的二进制翻译条件转移指令优化研究......................................... 186 张家豪,单征,岳峰,傅立国,王军,李明亮 面向大规模海洋数据同化算法的并行实现及优化 ............................................... 194 万威强,肖俊敏,洪学海,谭光明 一种基于 GPGPU 架构的并行空间叠加分析方法 ............................................... 202 赵艳伟,杨帆 GA-Sim:一种基于分类和实例学习相结合的作业运行时间预测算法 ............. 210 肖永浩,许伦凡,熊敏 基于“神威·太湖之光”的 LQCD Dslash 热点的研究分析与 MPI 实现 ....... 216 张淼,周宇,陈建海,何钦铭,徐顺,宫明 一种支持 DDR4 的软硬件结合的访存踪迹收集分析工具集 .............................. 224 李作骏,陈明宇 基于非结构网格的近海海域污染物迁移三维数值模拟并行算法 ....................... 232 廖子菊,邓小毛 二维 Mesh 网络中一种新型的多播路由算法 ........................................................ 240 肖灿文,娄辉 面向神威·太湖之光的 THAFTS-Acoustic 广义水动力系数计算模块并行优化策 略................................................................................................................................ 247 吕小敬,刘钊,蒋令闻,陈德训,杨广文 并行任务图的优化调度算法 ................................................................................... 256 李于锋,莫则尧,肖永浩,熊敏,赵士操,段博文 一种缓解矩阵分解并行算法负载不均衡问题的新方法 ....................................... 264 郭睿欣,张锋,王力哲,张武生,雷辛亚,薛尔康 HSWAP:适用于高性能计算环境的数值模拟工作流管理平台 ......................... 272 赵士操,肖永浩,段博文,李于锋 科学计算环境 REST 风格 WEB 服务 API 的认证与授权 ................................... 280 曹荣强,和荣,卢莎莎,王小宁,王彦棡,迟学斌 A Scalable Reservoir Simulator for Polymer Flooding in Naturally Fractured Reservoirs on Parallel Computers .......................................................................... 288 He Zhong, Hui Liu, Tao Cui, Kun Wang, Ye He, Lihua Shen, BoYang, et al.
mDCR: 一个多任务的并行计算模型和运行框架 ................................................ 296 陈虎,杨颖文 Constructing Skeleton for Parallel Applications with Machine Learning Methods .................................................................................................................................... 304 Zihang Zhang, Guangzhong Sun, Jiepeng Zhang, Yuze Qin and Yilun Dong 一种基于深度学习的性能分析框架设计与实现基于共享内存的 OpenCL 主机-内 核代码融合编译器设计与实现 ............................................................................... 311 洪锐,伍明川,刘颖,黄磊,冯晓兵 基于 CUDA 的地震相干体并行算法 ...................................................................... 320 张全,林柏栎,彭博,靳梓宁 针对基于 Cache 的同驻攻击的主动防御策略 ....................................................... 326 黄汝维,何佩聪,刘灿,陈思琪 基于 FPGA 的流计算加速框架设计 ...................................................................... 333 刘元卿,陈灿,沈华,臧大伟 基于 ARMv8 架构面向机器翻译的 SGEMM 优化 .............................................. 341 龚鸣清,张鉴,卢兴敬,陈伟,王砚峰 基于天河互连的公共通信接口 UCX 实现与评估 ................................................. 349 谢旻,周恩强,董勇,张伟 FPGA 与闪存融合的存算一体架构 ....................................................................... 357 马恬煜,刘伯然,金岳平,沈华,臧大伟 基于低基数路由器构建大规模直接网络 ............................................................... 365 苏勇,万伟,李斌,戴荣,吉青,秦晓宁 基于聚类的环形 kNN 算法 ..................................................................................... 375 匡振曦,武继刚,李嘉兴 HPC 云超算集群性能特征评测 .............................................................................. 383 余洋,覃伟,田永军,何万青 基于流式计算的空间科学卫星数据实时处理 ....................................................... 392 孙小涓,石涛,胡玉新,佟继周,李冰,宋峣 基于 PID 参数约束的谱多流形聚类算法 .............................................................. 400 罗养霞,马迪,常言说 TLRank:一种新的社会化协同排序推荐算法 ..................................................... 408 李改,邹小青,宋海生,李亚军,陈强 基于邻接点特征的大规模标签图子图查询 ........................................................... 416 单晓欢,高见野,丁琳琳,宋宝燕 一种云环境下基于强化学习的多目标任务调度算法 ........................................... 424 童钊,邓小妹,陈洪剑,梅晶 基于植物生长算法的云作业调度模型 ................................................................... 432 李强,刘晓峰
一种基于 Java 虚拟机的动静结合自适应优化方法 ............................................. 440 张海军,郑艳,叶俊,白书敬 基于公共云的 HPC 集群实现及自动伸缩闲时计算研究 ..................................... 446 田永军,何万青,孙相征,余洋 基于微操作的 Hadoop 参数自动调优方法 ............................................................ 453 李耘书,滕飞,李天瑞 适合神威太湖之光架构的 LOBPCG 求解器 ........................................................ 461 于天禹,赵永华,赵莲 基于 Winograd 算法的卷积神经网络 FPGA 加速器的设计方法 ....................... 467 王奥博,刘凯,李伟,陈凯,赵鹏 基于分治法求解对称三对角矩阵特征问题的 MPI/Cilk 混合并行算法 ............. 473 朱京乔,赵永华 基于多特征融合的运动目标跟踪方法 ................................................................... 479 益争祝玛,尚振宏,刘辉,李润鑫 面向天河 2 号升级系统的粒子输运求解器 OpenSN ............................................ 486 朱肖雄,刘杰,龚春叶 基于 GPU 加速和非负矩阵分解的并行协同过滤推荐算法 ................................. 492 康林瑶,唐兵,夏艳敏,张黎 FPGA 应用于高性能计算的研究现状和未来挑战 ............................................... 498 贾迅,钱磊,邬贵明,吴东,谢向辉 基于非结构化网格的高可扩展并行有限体积格子 Boltzmann 方法 .................. 507 徐磊,陈荣亮,蔡小川 基于应用的全局资源优化调度方法研究 ............................................................... 513 寇大治,沈瑜,唐小勇 一种大规模并行作业运行故障快速定位方法 ....................................................... 519 朱光慧,曾云辉 支持并行程序大规模运行的 MPI 仿真环境 ......................................................... 525 郭亚宇,林放,刘轶,钱德沛 服务器级 ARM Cortex-A72 多核处理器的性能评估 ........................................... 531 王一超,陈昕鑫,杨屿杰,左思成,林新华 可验证的支持模糊检索的加密算法 ....................................................................... 537 黄汝维,李志坤,刘灿,陈思琪 基于 CUDA 的地震倾角方位角并行算法 .............................................................. 543 陈鹏程,张全,彭博,向伟铭 一种分布式文件系统客户端缓存优化机制 ........................................................... 549 刘宇胜,刘光明,喻杰 基于超算暨 HPIC-LBM 的大时空三维湍流磁重联数值模拟研究 ..................... 555 颜辉,朱伯靖,万文,钟英
分享到:
收藏