阿里云磐久超高性能网络亮相 时延降低90%至2微秒

发布时间:2022-11-04 15:01  

2022云栖大会上,阿里巴巴集团副总裁、阿里云基础设施负责人周明表示,阿里云将服务器、网络、数据中心进行了一体化架构升级,打造成“一台超高速运转的计算机”,并为这台发动机研发了一套超高性能的网络——磐久PredFabric,长尾时延显著降低90%,低至2微秒。

磐久超高性能网络 解决AI算力难题

近几年人工智能、机器学习相关需求井喷,AI算力需求每3.5个月翻一倍,过去六年已增长了30万倍,面对这种爆发式的算力需求,简单粗暴的硬件堆砌不可持续。虽然市面上许多AI硬件(包括GPU、FPGA等)的计算能力很强大,但它们的内存资源非常稀缺,当内存资源不足时,要么运算停滞,要么会增加数据的无效传输,带来很大的运行开销,增加了时间成本。

周明透露,阿里云工程师为此打造了一套“磐久超高性能网络”,采用自研的Solar-RDMA高速网络协议,使处理器可以通过load/store指令访问其他任意服务器的内存,非常适合深度学习模型内神经网络的交互形态,相比传统模式可降低长尾时延90%以上,最低可至2微秒。

1.png

同时,阿里云将云服务器的接入带宽提升了一倍,可达1.6Tbps,再配合上层的融合通信库ACCL,实现了在AI场景下的通信效率倍增,保障集群算力的线性输出,确保在大流量突发场景甚至部件异常的情况下,整个数据中心仍能保持稳定、高效的运转。

“灵骏”智算助力人工智能 释放高效算力

基于这套超高性能网络技术及软硬一体化能力,今年6月阿里云推出了新一代智能计算产品——灵骏,可最小化所有非计算开销,实现5倍的通信性能提升,千卡并行计算效率高达90%。

目前,“灵骏”不仅在阿里巴巴集团内大规模部署,也为广大企业提供算力服务。今年8月,小鹏汽车就基于“灵骏”建成了中国最大的自动驾驶智算中心“扶摇”,用于自动驾驶模型训练,训练速度相比传统模式下提升了近170倍。

2.jpg

通过与阿里云合作,“扶摇”以更低成本实现了更强算力,将GPU资源虚拟化利用率提高3倍,端对端通信延迟降低90%至2微秒。整体计算效率上,实现了算力的线性扩展。存储吞吐比业界20GB/s的普遍水准提升了40倍,数据传输能力相当于从送快递的微型面包车,换成了20多米长的40吨集装箱重卡。

更绿色低碳的全球云计算基础设施

目前,阿里云基础设施层已形成了服务器、网络、数据中心一体化架构设计,具备计算异构、资源池化和加速引擎三大能力,支撑上层云计算产品和应用平台的算力释放最大化,从而实现数据中心利用率的全局最优。

3.jpg

同时,阿里云还积极推动数据中心低碳转型,自主研发了单相浸没液冷技术,PUE低至1.09,大幅降低数据中心散热能耗。在清洁能源使用方面,2022年1-9月,阿里云五大数据中心清洁能源使用占比超过50%,累计减排二氧化碳77.4万吨,位列国内科技公司榜首。

“绿色是检验数据中心的黄金标准,我们将持续加强绿色自研技术创新投入,积极开展清洁能源电力交易,推动数据中心减碳增效。”周明表示。

文章来源于:ECCN    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    搭载自研芯片,阿里云推出“磐久”云原生服务器系列;10月19日上午,在2021杭州云栖大会上,阿里云正式推出面向云原生时代的“磐久”自研服务器系列,首款搭载自研芯片倚天710的磐久高性能......
    阿里云磐久超高性能网络亮相 时延降低90%至2微秒;2022云栖大会上,阿里巴巴集团副总裁、阿里云基础设施负责人周明表示,阿里云将服务器、网络、数据中心进行了一体化架构升级,打造成“一台......
    突发阿里云机房烧了……; 阿里云机房烧了,火灾持续超30小时! 近日有消息称,阿里云位于新加坡的数据中心遭遇严重故障,导致部分用户服务中断,包括网站访问缓慢、API调用失败、云存......
    云上平头哥(2022-12-30)
    芯片成本降低一半以上。” “一旦超过这个拐点之后,云服务将迎来爆发性增长,其增长基于云服务本身的特性,云服务一旦达到一定的规模,其成本将会大幅降低。” 在2019阿里云......
    、PCIe5.0等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。 阿里云智能总裁、达摩院院长张建锋表示:“基于阿里云“一云多芯”和“做深基础”的商业策略,我们发布倚天710,希望......
    流片,是阿里云推进“一云多芯”策略的重要一步,也是阿里第一颗为云而生的CPU芯片,将在阿里云数据中心部署应用。 业界性能最强的ARM服务器芯片,性能超过业界标杆20%,能效比提升50%以上。 据介......
    突发!马云减持阿里巴巴创始人股份!; 业内最新消息,昨天美国证交会(SEC)官网披露的 144 文件显示,家族信托 JC Properties Limited 和 JSP Investment......
    提升15%~25%不等。更重要的是,八代实例保持价格不变,使阿里云g8i实例可以用更小的性能开销保障用户的数据高度安全性。 第五代至强® 可扩展至强算力大升级,支持......
    加解密、AI应用、音视频等场景性能提升15%~25%不等。更重要的是,八代实例保持价格不变,使阿里云g8i实例可以用更小的性能开销保障用户的数据高度安全性。 第五代至强® 可扩展至强算力大升级,支持......
    要的是,八代实例保持价格不变,使阿里云g8i实例可以用更小的性能开销保障用户的数据高度安全性。第五代至强® 可扩展至强算力大升级,支持......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>