痛击NV CUDA！AMD ROCm开放计算平台瓜熟蒂落

去年11月的超级计算大会SC15上，AMD提出了，重构了自己的整个HPC高性能计算软件平台，向着NVIDIA CUDA发起强有力的冲击，尤其是可以直接将CUDA编译代码直接转换过来。

今年4月份，这一项目被正式命名为“Radeon开放计算平台”(Radeon Open Compute Platform)，简称ROCm，并发布了1.0版本，支持Fiji GPU、P2P RDMA。

ROCm 1.1版本在6月推出，支持多GPU；8月升级为1.2版本，支持Hawaii GPU、LLVM原生编译器也进入Beta测试阶段。

最新一届的超算大会SC16上，ROCm 1.3登场了，变化极大，异构计算编译器(HCC)、异构计算可移植界面(HIP)都有重大进展，可以说AMD的宏伟规划已经基本成型。

LLVM原生编译器现在基本已经视为正式版本了，它和相关驱动、API、接口也是整个ROCm平台的支柱。

ROCm 1.3也引入了不少新特性，现在支持16位浮点和整数格式(GCN 1.3 Tonga/Fiji及之后的硬件支持)、OpenCL 1.2+、Polaris家族显卡(RX 400/Pro WX系列)、Ubuntu 16.04/Fedora 24操作系统。

处理器方面，除了支持Intel、AMD x86平台(包括未来的Zen)，还将支持ARMv8 AArch64、IBM POWER8，尤其后者直接杀入了NVIDIA的地盘。

实际效果如何呢？AMD在大会上展示了从CUDA向HIP一直深度学习框架CAFFE，5.5万行代码只用了不到4天，99.6％都是自动移植完成，并且软件运行甚至比OpenCL版本还要快。

期待明年的SC17大会上带来更多惊喜。

责任编辑：mooreelite