正如英特尔公司市场营销集团副总裁、中国区云与行业解决方案部总经理梁雅莉估计,当人类的日常经济、娱乐、生活中的活动搬运到虚拟数字世界后,产生的数据量预计将达到Quecca级别,也就是10的30次方。随着数据量的增长,数据形式和处理方式也会有新的变化。
她指出,在这种趋势下,传统的单一计算架构无法解决所有问题,需要不同的架构处理不同类型的数据,真正做到“用好的工具解决好的问题”,从而更加高效地处理复杂计算。
为此,英特尔的XPU战略打造了跨CPU、GPU、FPGA、IPU等多种架构的算力资源。其中GPU的主要任务是加速图形渲染,以及处理其他并行任务,比如人工智能、深度学习和科学计算等领域。
为此,英特尔专为数据中心打造了Flex系列GPU产品,能够在不牺牲性能或质量的情况下,灵活处理多种工作负载。
Flex两大产品问世
目前英特尔的Flex系列共有两个型号。英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰介绍道,其中Flex140功耗是75W,半高PCIE卡,内置16个Xe内核和16个光追单元。而Flex170是150W,全高PCIE卡,内置32个Xe内核和32个光追单元。Xe矩阵扩展计算单元,可提供高达256Tops (INT8)的算力支持。
在媒体运算方面,Flex系列支持最多单卡4个(Flex 140) 媒体运算引擎,可提供业界领先的编解码密度。在编码格式上,Flex系列支持AV1编码格式,在同样的视频质量下,相比AVC可节省30%以上的传输带宽。同时也支持包括H.265、VP9等编码。且支持硬件SR-IOV虚拟化技术,并且不需要软件授权费用。
在软件开发方面,英特尔提供了开源软件工具oneAPI统一编程架构,包括了编程语言和标准的跨架构库、工具和框架。用户可以据此开发出开放的、易于移植的代码,并且更大限度地利用多种跨英特尔硬件平台XPU的组合。
谁在使用英特尔数据中心GPU?
Flex系列GPU自从8月正式推出后,已经被多家客户所采纳,其中包括中科大洋、亿联网络、火山引擎、当虹科技等,涵盖了广电、游戏、视频会议甚至视频修复等多个领域。
中科大洋公司的LeoVideo Cloud云转码平台,选择了英特尔Flex140产品。其技术研究院院长褚震宇表示,英特尔Flex GPU具有高性能、高性价比等优势。通过Flex 140,LeoVideo Cloud实现了16路4K并发或4路8K并发的解码,以及6路4K并发或30路高清并发的编码。尤其是在甚低码率编码质量上,英特尔Flex 140较竞品有明显优势。
亿联网络高级解决方案架构师林振鹏则表示,远程视频会议传统方式正在面临着挑战,无论是早期的MCU传统架构下,或者是现在新的视频会议架构下,都无法实现优质的高并发的处理,当SIP H.323终端接入会议的时候,需要进行全编全解的能力。这时,CPU处理架构需要兼顾到多种业务处理方式,又要做到整体的业务编解码,从而导致性能较低。而借助Flex GPU来做图像的编解、处理、缩放以及混屏等功能,可以卸载CPU工作负载,从而专注在其他业务处理。“这种联合处理方式,我们可以在4K 30FPS H.265情况下达到19路输出,而采用CPU方式只能达到2路。”林振鹏说道。
火山引擎系统架构师梁宇则介绍了公司采用Flex 140实现安卓云游戏的例子。梁宇表示,火山引擎此前遇到了三个主要挑战,一个是成本,包括硬件服务器的成本和网络带宽成本。其次,是云游戏对GPU的硬件编解码能力需求较大。第三,则是网络延迟。而通过Flex 140,极大缓解了火山引擎遇到的三大痛点。“单个Flex系列140 GPU可支持渲染20路720p60数据流,编码60路720p60数据流。Flex系列GPU提供了更多路实时云游戏流,保证了更优的游戏服务质量。”
构建广泛的生态合作伙伴
除了以上行业合作伙伴的实际使用场景之外,英特尔Flex GPU还在构建更广泛的生态系统,包括新华三、浪潮、宁畅、宝德、超聚变等众多OEM合作伙伴的系统陆续面市,同时也获得了来自中国联通、天翼云、移动云的电信运营商的支持,整体生态呈现良好增长势头。
在这种快速发展势头下,英特尔的Flex产品正在快速发展,从而成为XPU战略中至关重要的一环。