计算性能的极限
计算性能的极限
计算性能的极限
计算性能的极限
探求计算密集应用优化的天花板
探求计算密集应用优化的天花板
探求计算密集应用优化的天花板
探求计算密集应用优化的天花板
核心系统研发部 王琤
专用计算组的工作
专用计算组的工作
专用计算组的工作
专用计算组的工作
• 针对特定硬件的“实现”优化
• 例:OWLQN算法CPU和GPU实现优化,微软参考实现
Confidential & Proprietary
固定算法及平台下
固定算法及平台下“投入加速比
投入加速比”曲线曲线曲线曲线
投入加速比
固定算法及平台下
固定算法及平台下
投入加速比
性能性能性能性能
Confidential & Proprietary
投入时间
投入时间
投入时间
投入时间
红线在哪里
红线在哪里
红线在哪里
红线在哪里
• 决定红线的因素复杂
– 算法复杂度
– 指令复杂度
– 实际计算量
–
– 访存复杂度
– 等等
• 各种因素相互影响,决定了红线在哪
Confidential & Proprietary
看不清的红线
看不清的红线
看不清的红线
看不清的红线
• 不管你看的清看不清,反正它在那里
Confidential & Proprietary
看的见的天花板
看的见的天花板
看的见的天花板
看的见的天花板
1. 天花板是各个维度上的平台极限性能
2. 确定的算法及实现决定了各个维度的“工作量”。
3. 特定硬件平台各个维度的天花板可以量化。
4. 由于2和3,决定了特定硬件平台,确定算法和实
4. 由于2和3,决定了特定硬件平台,确定算法和实
现的各个维度天花板可见。
5. 红线一定比所有天花板都低
6. 由于5推论:天花板最低者一定比红线高
Confidential & Proprietary
看不清的红线
看不清的红线
看不清的红线
看不清的红线
• “天花板最低者一定比红线高”等于:
– 红线一定比天花板最低者还低
– 接近天花板最低者也就接近红线了
– 有幸撞到了天花板,恭喜你,这也是红线
–
Confidential & Proprietary
撞到天花板是一件十分幸福的事
撞到天花板是一件十分幸福的事
撞到天花板是一件十分幸福的事
撞到天花板是一件十分幸福的事
Confidential & Proprietary