大算力硬件“牛市”即将开启!戴伟民博士解读AIGC芯片的机遇与挑战

2024-07-07  

2024年7月6日下午,由上海开放处理器产业创新中心和芯原微电子(上海)股份有限公司主办的“RISC-V和生成式AI论坛”,在上海世博中心成功召开。芯原股份创始人、董事长兼总裁戴伟民博士发表了关于“AIGC芯片的机遇与挑战”的精彩演讲。这一演讲不仅深入分析了人工智能技术的历史发展和当前趋势,还预测了这些技术将如何在未来塑造半导体行业,特别是在AIGC领域的应用和发展。


群模乱舞是浪费电,垂直领域微调具备更高价值

戴博士的演讲首先回顾了从机械化时代到信息化时代的转变,强调了人工智能从“弱智能”向“强智能”的转变如何极大地推动了计算需求的增长。他指出,随着技术的进步,AIGC的发展已从单一模式识别和响应,扩展到更复杂的任务如自然语言处理和机器学习模型的自我迭代。这些技术的进步不仅加速了人工智能的应用,也对芯片设计和制造提出了新的要求。

但当下的“百模大战”,在戴博士看来更像是“群模乱舞”、浪费电。“不要说一讲起AI就要建一个训练中心、要很多训练卡,树干是长不出树叶的、要树枝。树枝是什么意思?微调。垂直领域的微调,这是在端上、然后端上再推。实际上三张卡“云上的训练卡、端上的微调推理卡”,应该是端上的卡大大大于“云”上的卡。”戴博士解释到。


AIGC:推动高性能计算芯片市场扩张

戴博士详细探讨了AIGC技术对半导体行业的具体影响。他提到,随着模型规模的增加,对计算能力的需求也呈指数级增长,这直接推动了高性能计算芯片市场的扩张。在他的演讲中,戴博士使用具体数据展示了从GPT-3到GPT-4模型的参数和计算需求的激增,以及这对芯片设计和生产技术的挑战。

据悉,GPT 3拥有1750亿个参数,计算需求 约为 315000百亿亿次;GPT 4约有1.7万亿个参数,计算需求 约为 1.35亿百亿亿次。一个拥有10万亿参数的理论上要130亿百亿亿次的计算量,将需要1060万个A100 PCle 80GB芯片或3336 个采用256 个Grace Hopper芯片的DGX GH200系统。

而为了实现这些模型加速,产业界也进行了多种探索。Groq自研的一种名为张量流处理器(TSP)的新型处理单元,并定义为“语言处理单元 (LPU)”。通过其专门的架构设计、高效的内存带宽、改进的能效比、可扩展性和未来发展潜力,在处理 特定AI工作负载,尤其是大型语言模型时,相对于GPU展现出显著的先进性。

初创公司Etched AI,则针对Transformer推出了专用ASIC“Sohu”。Sohu是基于台积电4nm工艺,配有144GB HBM3E高带宽内存。能效方面明显优于传统GPU,推理方面性能比英伟达的H100快20倍。而这种性能优势的建立是基于对Transformer架构的优化硬化,所以并不能够支持CNN、RNN 或 LSTM等大多数AI 架构,灵活性欠佳。

戴博士引用了来自Counterpoint Research的数据,该报告称到2030年,关键计算领域的半导体收入将达数万亿美元;,生成式AI将使服务器领域的半导体收入增至三倍,达到5930亿美元的规模。


下一轮“先软后硬”的牛市正在到来,芯原实现积极布局

芯原在应对AIGC挑战方面的创新举措,包括低功耗设计、高性能计算和芯片微调技术上的突破。特别是在可穿戴设备和汽车电子领域,芯原开发的芯片不仅能够处理复杂的AI模型,还能在极低的功耗下运行,这些技术的应用展示了其在行业中的领先地位。

在今年的德国嵌入式展上,芯原还展示了谷歌Open Se Cura项目。这是一个由设计工具和IP库组成的开源框架,旨在加速安全、可扩展、透明和 高效的AI系统的发展;芯原提供多个IP、低功耗芯片设计、BSP,并负责推动该项目的商业化。

值得一提的是,芯原神经网络处理器 (NPU) 已在全球累积出货超过1亿颗,被72家客户用于其128款人工智能芯片中,涉猎了超过10个市场应用领域。芯原的图形处理器 (GPU) 也已在全球累积出货近20亿颗,拥有70项专利,在千万辆车上运行。在视频处理器 (VPU) 方面,芯原也是全球第一。其VPU产品已被全球前20大云平台解决方案提供商中12个采用,国内前5大互联网提供商种有3个也选择了芯原的VPU。

在自动驾驶方面,芯原Chiplet技术正在助力构建下一代智慧驾驶平台。在数据中心领域,芯原也提供了全面的产品组合,提供了一系列高性能AIGC芯片。

展望未来,戴博士讨论了AIGC技术在多个垂直市场中的应用前景,如自动驾驶、健康医疗和制造业等。他预测,随着技术的成熟,这些领域的需求将进一步驱动高性能芯片的市场增长。此外,他强调了在全球范围内建立战略合作伙伴关系的重要性,以便更好地利用全球资源和专业知识,加速AIGC技术的商业化进程。

“我认为下一轮牛市2026年、最晚2027年,是因为2023年的ChatGPT。”戴博士认为,上一轮的牛市由iphone4开启,是从移动硬件创新到移动互联网的软件创新,“先硬后软”的节奏。而新一轮的牛市的开启,则是先软后硬的节奏,以ChatGPT为代表的大模型将会引领大算力硬件的“牛市”。


结语

戴伟民博士的演讲为我们提供了对AIGC技术发展的深刻洞察,以及这些技术如何影响芯片行业的全面分析。他的见解不仅强调了芯原在这一变革中的领导角色,也展示了半导体行业面临的机遇与挑战。随着AI技术的快速进步,芯原的创新和战略布局将在未来的技术革命中扮演关键角色,推动整个行业向前发展。

文章来源于:21IC    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。