燧原科技:以中国速度为人工智能应用提供强劲算力

发布时间:2023-01-15  

在2021世界人工智能大会同期,燧原科技举办新品发布会,推出其第二代人工智能训练产品组合,即“邃思2.0”芯片、基于邃思2.0的“云燧T20”训练加速卡和“云燧T21”训练OAM模组,更新了软件平台“驭算TopsRider”,还推出了全新服务器产品云燧智算集群CloudBlazer Matrix 2.0。

随着内容视频化与万物互联进一步发展,全球产生的数字化数据量增长势头凶猛,而且越来越多种类终端产品接入,数据形态日趋多元化,非结构化难处理的数据占比增加,在数据处理中,人工智能算法作用越来越大,互联网厂商对人工智能加速芯片的需求也越来越多,人工智能对算力的要求越来越高。在发布会上,清华大学教授尹首一就表示,人工智能算力需求每3.4月翻一番,远超摩尔定律。

要满足人工智能应用对算力需求,就离不开芯片。根据赛迪顾问的推算,2019至2021年间我国人工智能芯片平均年增速可超过50%,市场规模在2021年约为300亿元左右,其中云端训练芯片市场规模约为139亿元,云端推理芯片市场规模约为82亿元,而终端推理芯片约为84亿元,各细分市场均需求旺盛,而在云端训练芯片市场上,当前仍由英特尔、英伟达和赛灵思等外资厂商占绝对主导地位,国产替代空间广阔。

尹首一认为,想做好人工智能芯片,要解决三个问题。首先是芯片本身的延展性,因为算法在不断演进,人工智能系统在不断变化,所以人工智能芯片要有一定可编程性;其次是算法包容性,神经网络只是人工智能应用的一个分支,还有众多传统算法在人工智能应用中发挥着重要作用,所以人工智能芯片要具备覆盖不同类型计算任务的能力;第三是能效比,从数据中心、云计算到边缘物联网设备,能效问题始终是芯片面临的最大挑战。

针对这些挑战,燧原科技此次宣布的“燧原产品定理”在一定程度上给出了解决路径:在“平均业务”中,燧原每一代产品必须比前一代能效比提升三倍,性价比提升两倍,并且软件向后兼容可靠。燧原科技COO张亚林公布了云端训练产品路线图,计划2023年推出的第三代加速卡和计算集群产品,其能效比将是初代产品的14倍。

具体来看,燧原科技本次发布的邃思2.0与上代产品同样采用格芯12纳米工艺,利用立体封装技术整合9颗裸芯片,单精度32位浮点数算力达40 TFLOPS,比邃思1.0单精度算力提升一倍。邃思2.0对张量计算进行了大幅优化,单精度张量TF32峰值算力达到160 TFLOPS。此外,邃思2.0也支持半精度16位浮点运算(峰值算力160TFLOPS)以及8位整数精度(峰值算力320TOPS)等多种数据格式运算。性能已经优于国际领先厂商的次旗舰产品,与旗舰产品相比也是互有胜负。

左:燧原科技CEO赵立东

右:燧原科技COO张亚林

对于云端训练等应用,芯片做出来只是第一步,如何用起来才更重要,为帮助客户用得好,燧原科技为用户提供了计算加速卡、服务器和完整的软件开发环境与支持包等产品。

云燧T20和云燧T21是基于邃思2.0打造的两款AI训练加速板卡,邃思2.0的参数即由云燧T21板卡测试得出。在本次推出的服务器产品云燧智算集群CloudBlazer Matrix 2.0中,最高支持8192张云燧训练卡级联,从而实现最高1.3E(130000T)单精度浮点运算的算力。

驭算TopsRider是燧原科技自主知识产权的计算及编程平台,通过软硬件协同架构设计,充分发挥邃思2.0的性能;基于算子泛化技术及图优化策略,支持主流深度学习框架下的各类模型训练;利用Horovod分布式训练框架与GCU-LARE互联技术相互配合,为超大规模集群的高效运行提供解决方案。开放升级的编程模型和可扩展的算子接口,为客户模型的优化提供了自定义的开发能力。

在发布会上,燧原科技CEO赵立东宣布建设异构计算生态的“燎原”计划,目标是以人功能为起点构建通用异构计算生态,构建标准化技术体系,共建完整生态服务数字中国。

在当日的产品发布会上,多位专家学者和投资人都提到了生态建设的重要性。以个人电脑市场为例,我国前后几十年的投入,信创市场仍然不能说达到了自主可控好用的预期目标,只有芯片没有建设好应用生态就是一个教训——当然也有芯片性能难以满足市场化推广要求的原因。

投资方代表武岳峰资本创始合伙人武平就表示,把生态搭建好,芯片才能用得好。中国有全世界领先的互联网生态,但在芯片产业上还比较幼稚,最近不少国内厂商宣布进入高难度大芯片领域,但像燧原科技这样能说到做到的企业还不多。如果全产业上下游通力合作,给予中国芯片更多试错空间,将来数据中心终将用上以燧原科技为代表的中国芯主芯片。

文章来源于:21IC    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    这些发生在千分之一纳米范围内的微小变化,研究人员正在开发新的方法来控制材料在导电和绝缘状态之间变化,使其具有半导体的特性。研究人员还用瑞士日内瓦的粒子加速器观察这些微小变化如何影响新材料中电子的排列,以进一步推进未来晶体管的研发。 ......
    和俄罗斯等国都争相开始通过人工的方式合成元素。主要是利用粒子加速器使离子高速运动,撞击另外的原子,促使原子核相互融合。         Nihonium是首个由亚洲国家合成的元素,通过30号锌的离子与83号铋金属相互碰撞而成。让只有1万亿......
    师们一直在想出实用的方法,将由化合物半导体制成的激光器集成到硅晶圆上,并以可制造且相对便宜的方式实现。 8. 芯片上的粒子加速器变小 很少有技术能够同时拥有城市大小和小硬币大小的版本。但现在粒子加速器......
    斯顿卓越研究小组ct.qmat(量子物质中的复杂性和拓扑学)领导的这一突破性实验及其理论描述,是从拓扑学角度描述量子材料特征的首次成功尝试。桑焦万尼指出了粒子加速器在实验中的重要作用,他说:"我们需要同步加速器......
    《科学》杂志的论文中,美国哥伦比亚大学化学家团队描述了迄今为止速度最快、效率最高的半导体:一种名为Re6Se8Cl2的超原子材料。 任何材料的原子结构都会振动,从而产生被称为声子的量子粒子。激子......
    千亿分之一秒!人类首次拍摄到材料内部的电子运动;电子是一种亚原子粒子,属于轻子的一种。长期以来,由于它的质量小(9.1×10-31千克),速度快(绕原子核一周只需要1.8×10-16秒),虽然......
    物理学、医学等领域。在医学领域,该技术已经促进了白内障和眼屈光手术的发展。 穆鲁指出,他们会从一个能量极小的发光“小种子”开始,这颗“小种子”会被放大数百万倍。他们将利用这些超高压脉冲产生更紧凑、更便宜的粒子加速器......
    过云相互连接。由于需要一个偏差极低且在两个地点均可随时获得的外部参考,因此这项任务变得愈加困难。   下至原子级别 此时,数据库架构师以前的敌人“原子”登场。当原子忙于废除摩尔定律时,其亚原子粒子......
    过云相互连接。由于需要一个偏差极低且在两个地点均可随时获得的外部参考,因此这项任务变得愈加困难。 下至原子级别 此时,数据库架构师以前的敌人“原子”登场。当原子忙于废除摩尔定律时,其亚原子粒子却在忙于自旋。原子......
    计算研究正迎来新的发展机遇。德国、日本和波兰的超算中心将使用该平台来赋能他们由 NVIDIA 加速的高性能计算系统中的量子处理器(QPU)。 QPU 是量子计算机的大脑,通过利用电子或光子等粒子行为进行计算,计算......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>