痛击NV CUDA!AMD ROCm开放计算平台瓜熟蒂落

发布时间:2016-11-16  

去年11月的超级计算大会SC15上,AMD提出了,重构了自己的整个HPC高性能计算软件平台,向着NVIDIA CUDA发起强有力的冲击,尤其是可以直接将CUDA编译代码直接转换过来。

今年4月份,这一项目被正式命名为“Radeon开放计算平台”(Radeon Open Compute Platform),简称ROCm,并发布了1.0版本,支持Fiji GPU、P2P RDMA。

ROCm 1.1版本在6月推出,支持多GPU;8月升级为1.2版本,支持Hawaii GPU、LLVM原生编译器也进入Beta测试阶段。

最新一届的超算大会SC16上,ROCm 1.3登场了,变化极大,异构计算编译器(HCC)、异构计算可移植界面(HIP)都有重大进展,可以说AMD的宏伟规划已经基本成型。

LLVM原生编译器现在基本已经视为正式版本了,它和相关驱动、API、接口也是整个ROCm平台的支柱。

ROCm 1.3也引入了不少新特性,现在支持16位浮点和整数格式(GCN 1.3 Tonga/Fiji及之后的硬件支持)、OpenCL 1.2+、Polaris家族显卡(RX 400/Pro WX系列)、Ubuntu 16.04/Fedora 24操作系统。

处理器方面,除了支持Intel、AMD x86平台(包括未来的Zen),还将支持ARMv8 AArch64、IBM POWER8,尤其后者直接杀入了NVIDIA的地盘。

实际效果如何呢?AMD在大会上展示了从CUDA向HIP一直深度学习框架CAFFE,5.5万行代码只用了不到4天,99.6%都是自动移植完成,并且软件运行甚至比OpenCL版本还要快。

期待明年的SC17大会上带来更多惊喜。

责任编辑:mooreelite
文章来源于:半导体行业观察    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    迪严厉表示,公司除了四级处罚(解除劳动合同)外,还将其信息录入除名查询系统;对违反廉洁合作协议的单位,按协议追究相应责任;对于涉嫌违法犯罪的行为,移交司法机关处理。 值得一提的是,据了解,比亚......
    机以每小时执行17044次查询的成绩,刷新该测试最高纪录,为全球金融、高端制造、零售、能源等行业用户的商业智能分析,提供高效、领先的算力平台,从容应对快速多变的商业环境。 SAP BWH Bechmark基准......
    机以每小时执行17044次查询的成绩,刷新该测试最高纪录,为全球金融、高端制造、零售、能源等行业用户的商业智能分析,提供高效、领先的算力平台,从容应对快速多变的商业环境。 SAP BWH Bechmark基准......
    浅谈8051单片机进行外部数据交换的3种方式;单片机CPU与外部设备交换信息通常有如下几种方式:无条件传送方式,查询传送方式和中断传送方式。我们以单片机与微型打印机接口为例讲述这三种方式。假定......
    基于8051单片机的外部设备交换信息的三种数据传输方式解析;单片机CPU与外部设备交换信息通常有如下几种方式:无条件传送方式,查询传送方式和中断传送方式。我们......
    解析8051单片机的三种数据传输方式;单片机CPU与外部设备交换信息通常有如下几种方式:无条件传送方式,查询传送方式和中断传送方式。我们以单片机与微型打印机接口为例讲述这三种方式。假定......
    自动驾驶领域的应用需求。面对互联网、政企海量数据存储,智能分析、营销趋势分析、库存分析、即席查询等湖仓一体的场景,通过算力中度CPU+ 24大盘(HDD),24HDD可挂载在1个Raid卡下,充分......
    的需求。” 实际上,谈算力问题始终离不开成本问题。分析师StacyRasgon曾估算算,ChatGPT每次查询成本约4美分。若ChatGPT查询增长到Google 搜索规模的十分之一,需要......
    的优点是可以减轻 CPU 的负担,同时也可以提高数据传输的效率。DMA 方式的缺点是需要占用一定的 DMA 资源,并且在数据传输过程中需要注意数据的同步和错误处理等问题。 三、查询方式 查询......
    一款基于高性能时序数据库,支持复杂分析与流处理的实时计算平台,集成了功能强大的编程语言和高吞吐率的流数据分析系统,为海量结构化数据的快速存储、检索、分析及计算提供一站式解决方案,显著提升量化投研中海量数据的存储与查询......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>