现在的AI市场有多热呢?受到美国可能进一步加强技术封锁的消息影响,面向数据中心的英伟达H800在中国炒到了50万元人民币的高价,A800也升值20%;美国多家巨头的相关业务负责人都在社交平台抱怨近期的算力资源悉数被预订;甚至已经有一些AI项目(典型如Comma AI)为了确保算力供给,开始把目标转向游戏显卡……有媒体甚至在担忧,游戏显卡会不会像之前矿潮时期那般,受到AI需求的影响而再度大幅涨价。
2022年,DALL-E 2深度学习模型一度成为头条,输入几个关键词就能生成精美图像,一度震惊了艺术创作者;今年,ChatGPT毫无争议地长期占据头版,人们发现机器可以如此“智能”地与人直接对话。于是AI现如今的大热门显然就着眼在几个关键词上:LzaiLM(大语言模型)、Transformer/GPT、生成式AI(Generative AI,或AIGC)……
所谓的生成式AI,就是指基于用户的输入(prompt),由AI来生成对应的信息、内容。比如可以生成文字构成问答或对话形式;生成图像、图形、视频等多媒体内容。在今年的WAIC(世界人工智能大会)上,几乎所有的AI芯片与相关技术厂商,都在自家展位的C位展示生成式AI的Demo,比如在令笔者印象还挺深刻的燧原展位上,输入几个关键词就可自动生成完整的PPT——前后耗时不过50秒,生成的PPT结构清晰、图文排版纯熟,颇有很快取代文案工作者的既视感。
据统计,在今年英伟达春季GTC开发者大会上,英伟达CEO黄仁勋的主题演讲中提到了48次“Generative AI”这个词,他在面向亚太区的媒体采访活动上又提了23次。主题演讲共计1小时20分钟,前1小时都在谈AI,彻底盖过了去年还是香饽饽的元宇宙的风头——这是往届GTC从未有过的情况。
从英伟达的股价可以看出行业的一丝有趣风向。去年笔者撰文聊AI时提到,昔日英伟达的股价为30至40美元一股,随加速计算和AI的兴起,从2021年底一路飙升至将近330美元。但2022年Q3受到电子产业下行、消费电子市场整体疲软,以及消息面上美国针对中国技术封锁等多重因素的影响,英伟达的股价“狂泻”50%。2022年Q4随着ChatGPT的问世,其股价又快速攀升,到今年7月底已经在冲击470美元——其股价5年涨幅超过600%。
这应该是行业热点的最佳写照。即便热钱“再度”涌向AI技术,这也只是生成式AI发展的开端。时隔一年之后,《国际电子商情》封面故事再聊AI,我们来看看生成式AI与AI芯片市场的现状与未来。
生成式AI真的有落地吗?
可能尚有不少读者未能直接体验到生成式AI对生活的影响。以下从个人和行业企业两个角度来简单谈谈生成式AI现阶段的应用情况。
从内容创作者、撰稿人的角度来看,笔者为提升日常的工作效率,订阅了ChatGPT和Midjourney会员。前者用于粗粒度的资料收集,或活动文案创作点子参考,以及将ChatGPT作为某些技术问题的活体字典,极大程度减少了搜索引擎的使用和资料收集的时间;后者则着眼在文章的配图生成,部分取代了摄影和平面设计工作。
另外,Adobe在Photoshop这类工具的beta版中加入了生成式AI特性:针对一张图选出其中一部分,用文字的形式输入修改期望,比如在图片中增加一个物件,AI能快速完成这类操作,虽说它尚无法做到完全可用,但却大大减轻了用户的工作负担。
与此同时,本人正在进修计算机科学硕士学位,在学习过程中会频繁使用ChatGPT与New Bing来辅助写代码与算法——只需用自然语言提出对应的需求,ChatGPT就能写出媲美专业程序员的复杂算法。笔者也留意到身边的技术人员也普遍开始在工作中使用ChatGPT,一位CCIE(思科专家级网络工程师)好友在针对不同行业企业、机构做网络结构设计与配置时,都会征询ChatGPT的意见。
这些都是生成式AI的威力——暂且不谈ChatGPT、Midjourney这类直接面向个人的工具会产生多少价值。行业普遍认为,生成式AI产生价值的主力应该在不同的垂直细分市场上。瀚博半导体联合创始人兼CEO钱军先生在采访中就提到,AI落地的“更多是行业应用”。这应该也是现阶段主要的AI芯片公司正在努力的方向。
今年的WAIC展会上,Graphcore的工程师告诉《国际电子商情》,文生图(text-to-image)类型的生成式AI在行业里已经有比较多的落地,包括修图、绘画辅助、建筑渲染,他还介绍说:“我们在CV(计算机视觉)领域已经在开展合作;NLP这块还在测试”。恰好,燧原科技就在WAIC上发布了曜图(LumiCanvas)——这是个初看与Midjourney挺类似的服务——只要输入提示词就可生成图片。
不过,曜图本身是一个企业级解决方案,内含“MaaS(Model-as-a-Service)”模式。如燧原工程师提到的,曜图就像是一个基础画板,面向客户的是包含底层硬件,到软件及上层生态的整套交付,满足企业客户文生图服务部署;构建从算力到云服务、基础模型与微调,再到终端客户使用的一体化流程。这应该算是生成式AI比较典型的行业应用。
现如今,黄仁勋在在英伟达GTC大会上的主题演讲,会把大量篇幅放在AI合作和业务落地上,这使得GTC大会成为见证生成式AI商业落地的最佳场合。
在今年的GTC大会上,英伟达宣布与多家企业进行合作。比如,与Getty Images在生成式AI方面进行合作,基于Getty Images的素材库构建图像、视频生成式模型,企业客户输入简单的文字或图片prompt,就能获得定制化的图片和视频;与Shutterstock合作,基于图像、3D和视频素材库打造3D生成模型,简化3D内容构建,包括数字孪生、虚拟协作的流程和工作量;当然还有和Adobe的合作,在图像、视频、3D与动画制作工具中融入生成式AI模型。
多媒体和内容创作似乎是生成式AI现阶段最直接的受益者。但也不止于此,以医疗领域为例,生成式AI正在彻底变革药物发现的每一步流程。如英伟达BioNeMo服务中包含了诸多3D蛋白质结构预测模型,其中不同的步骤都需要对应的模型,生成式AI模型能够在读取蛋白质氨基酸序列后,精准预测靶蛋白结构。此外,还有像是生成所需ADME属性的分子,以及预测蛋白质与分子的3D交互……虽然这段文字可能晦涩难懂,但总体是指加速药物发现流程。
以上是生成式AI行业应用的一个典型例子。实际上,生成式AI的潜在应用市场远不止这些,在WAIC展会上还有电力、金融等行业大模型的应用实例,其中的很多实例可能尚未真正进入商用,或者离商用还有距离。但就前文提及的个人领域的应用而言,就已经展现了生成式AI在计算机科学、网络工程等市场的应用潜力。
此外,还包括零售、广告、建筑、能源等各行各业都会受到深远的影响,甚至在生成式AI中仅借助自然语言提需求来设计芯片,都不需要HDL(硬件描述语言)工程师参与,这是最近几个月热议的焦点,只不过这其中的绝大部分,离行业应用的成熟还有距离。钱军说:“我觉得很多问题在现在开始谈还太早,包括最终有多少Foundation Models (基础模型)能够存活,中国大模型发展会是怎样的商业模式,行业应用如何做模型训等等。最近我觉得Llama 2不错,基于此做再开发可能会是趋势,但从我们芯片厂商的角度来看,很多东西都还没有看得很清楚。”
沐曦联合创始人、CTO兼首席软件架构师杨建,将生成式AI的落地概括为“以Foundation模型为底座,加上针对行业应用领域做微调的中间层,去服务大量下游客户的商业生态结构”。杨建表示,沐曦正“广泛、深入地和各个Foundation大模型机构通力合作,快速推进AIGC大模型的应用落地”。
今年的GTC上,针对生成式AI在内容与多媒体创作方向上的应用,英伟达在Omniverse(元宇宙)部分有句话说得很好,元宇宙虚拟世界应当是基于物理规律的,而生成式AI则加速了虚拟世界的创建过程——“生成式”一词在此体现得相当到位,元宇宙里的内容填充不就都等着“生成”吗?
所以无论最终生成式AI会在哪些领域全面落地,可以肯定的是,当前的热度绝非简单的市场、媒体或投资行业吹捧所致。
电子产业的潜在发动机
前不久,笔者受邀参加了英伟达GeForce游戏显卡的媒体活动。从活动当天所讨论的内容来看,英伟达Gaming业务现在也在寻求对游戏应用中的AI技术做宣传,当然这远不只是很多人熟知的AI超分(DLSS)。
去年,英伟达发布了一个叫ACE(Avatar Cloud Engine,虚拟化身云引擎)的工具,这两年网上挺火的Toy Jensen(黄仁勋的3D卡通形象),它有一部分就是基于ACE。ACE这一市场概念下包含了好些技术点,比如Audio2Face,这是一个生成式AI,基于单纯的音频信息就能构建脸部动画;再比如Riva,能够将文字信息转成语音;还有NeMo,它可以理解为针对特定领域的定制版ChatGPT。
在今年5月的Computex大会上,英伟达又发布了ACE游戏开发版。英伟达透露称,ACE在游戏里的主要功能是创建游戏NPC(非玩家角色),在生成式AI的帮助下,未来的NPC与玩家的交互会变得非常智能。届时,游戏里的NPC有着ChatGPT般的对话能力,而且它的表情、口型、动作都会很自然。
ACE自然是生成式AI在游戏领域的一个应用。不过这个逻辑中比较有趣的一点是,如果ACE技术或者其他AI技术本身能够推进游戏行业的发展,以及英伟达的GeForce游戏显卡卖得更好,是否也能泛活在经济低迷期如一潭死水的Gaming业务?而英伟达营收的另一大支柱Data Center(数据中心),也是Nvidia AI所处的业务部门,它的发展形势一片大好,客观上它能够帮助Gaming业务的发展。
当然这只是笔者的猜测,但AI对电子产业的价值已经相当确切。英伟达Gaming业务营收的下滑,反映的是整个电子产业、半导体行业的大趋势。IBS(International Business Strategies)数据显示,预计今年全球半导体市场价值下滑9%,可能收报于5,110亿美元。
Morgan Stanley的分析师认为,今年AI计算半导体市场的年度销售额可能会达到430亿美元(不同分析机构的数据不能直接对比,因为统计范围,比如统计的芯片类型、对“AI芯片”的定义,都可能存在较大差异),占到芯片行业整体营收的大约8%。未来4年内,AI芯片的产值达到1,250亿美元,在整个芯片行业的市场价值占比会翻一番。
杨建受访时援引了IDC的数据,“生成式AI计算市场规模将从2022年的8.2亿美元增长到2026年的109.9亿美元”。其中,量级上的差异应当是统计范围不同所致,这组数字表达的是“生成式AI计算占整体AI计算市场的比例从4.2%增长到31.7%”。
显然生成式AI会成为整个半导体产业发展的发动机,也就是极大利好GPU、AI芯片制造商。但不要忘记《国际电子商情》去年的AI主题封面故事提到的:英伟达对所有市场参与者造成的白色恐怖。
英伟达的生成式AI神话
OpenAI发布ChatGPT及GPT-4之后,在随后的英伟达GTC开发者大会上,黄仁勋放出了将全球首台DGX-1(英伟达的AI计算机)赠予OpenAI的视频,随即英伟达的股票就迎来了新一波涨势。该视频仿佛是在向市场宣告,英伟达才是生成式AI领域内算力工厂的老大。
GPU的算力基础或许还在其次,英伟达的AI生态或者说Nvidia AI全栈,才是令其他市场参与者都只能暂避锋芒的关键。前文谈到的BioNemo、ACE等是英伟达AI生态的冰山一角,下文中笔者从软硬两方面来举例谈谈所谓的“AI生态”。
LLM大模型训练与推理的基础是高算力、大容量存储,当需求大到单一芯片、单一封装、单一节点无法承载时,就需要跨节点做通讯。说白了就是要一堆GPU、一堆板卡、一堆服务器去算。在英伟达的这套系统里,不同层级的NVLink可互联。很多AI芯片企业就这一层面的基础设施支持都做不到完备。
去年秋季的GTC上,英伟达发布Spectrum-4 400Gbps交换机时说,这台交换机主要是为大规模数字孪生、模拟仿真类应用的“elephant flow(大象流)”大流量所准备的。Spectrum-4在今年GTC正式亮相时,生成式AI已经爆火,英伟达对该产品的宣传口径已经转向了生成式AI,为生成式AI云提供规模化所需的性能......这种基础设施作为其AI生态里的一环,显然就不是一般竞争对手可轻易拿捏的。
英伟达AI的软件生态层面触及了各行各业的预训练模型、开发工具、框架与库,这绝不是任何AI芯片企业旦夕可及的。今年6月底,AspenCore发布的处理器报告中也提到,英伟达在软件生态层面的积累,在很多领域是达到了可无视并抹平DSA AI芯片性能和能效优势的程度。这里再举一个生成式AI的例子。
去年,在“生成式AI”一词还未被病毒式传播之前,英伟达就发布了NeMo LLM服务,这是个针对大模型的云服务,可让大模型适用于特定领域。因为针对某一个问题,在不同领域的回答理应是不一样的,如ChatGPT作为一个“普适”的AI机器人,必须要经过调整,给予其对话的上下文,才能将其直接应用于零售行业。
“定制LLM”的NeMo在只需要提供一些额外token(令牌)、prompt、“例子”的情况下,就能对模型做出微调,而不需要重新训练整个模型。其实今年英伟达又发布了一遍NeMo,只不过套上了生成式AI的宣传词,并强调企业需要基于自己的业务,以及安全、因素方面的考量,对自己的模型做“guardrail(限定范围)”和“redefine(重新界定)”。起码这是生成式AI快捷实现行业应用的关键。今年和NeMo共同发布的,还有面向视觉模型(包含图像、视频与3D图形)的Picasso,和前文已经提到的BioNeMo。
在8月上旬的SIGGRAPH上,英伟达又发布了AI Workbench,其宣传语是“让每个能用上GPU的人都成为生成式AI创作者”,在PC、工作站、数据中心和公有云等不同平台上,都能做AI相关的工作。这一阶段的英伟达显然是期望越来越多的人能够用上生成式AI,以此占领更大范围的市场。
市场的机会与未来
总体来说,这是个特别质朴和简单的道理。Graphcore联合创始人兼CEO Nigel Toon在谈AI从一项技术转向应用时的两大关键点,其一是硬件和软件部署的基础设施,其二是用于AI计算系统的效率。一套完整的AI解决方案理应包含云计算、开发工具、软件栈、AI-as-a-Service(人工智能即服务)产品。
这是个听起来理所应当,但实践起来十分困难的巨型工程。换句常被人提及的话来说,就是AI芯片公司从来不是把一颗AI芯片做出来就完事。杨建就在采访中多次强调沐曦“致力于软硬件一体的全面生态解决方案”,其自主研发的MXMACA®软件栈支持“多种开源技术和主流框架的网络模型”,能够“持续完善ModelZoo让客户开箱即用”,“为各行各业的数字化转型升级提供高能效和高通用性的全栈GPU产品”——“全栈”似乎是AI芯片企业必须强调的方向。
英伟达是真正借助“全栈”的长期投入,才掌握着超过80%的市场份额。但AMD数据中心硬件负责人Forrest Norrod说,行业需要竞争,“很多人都非常期望能够有新的选项”。尤其随着模型本身走向成熟,更多竞品(包括固定成本更低的芯片)与设备购入会体现出优势。
J.P. Morgan美国企业软件研究负责人Mark Murphy说,微软的AI产品(应当是指new Bing和Office的copilot)显然还在发展早期阶段,“我们相信范式转变已经在发生。ChatGPT把这阵风吹了起来,成百上千的初创公司都奔着开发基础模型而去,搭载AI原生应用、构建基础设施。”
很显然,这是个发展尚处在早期,机会仍十分充沛的市场,蛋糕都还没有完全做大。且不论那些看到竞争对手引入AI技术,认为自己也不能在战局中落后的企业,SemiAnalysis在今年初的报告中说,基于其统计范围,他们了解到的至少有21家初创公司、11家大型企业,在训练理论上达到GPT-3质量甚至更好的大模型。这个数量级可能还相对保守,但总体说明AI芯片企业市场机会的充盈。
即便单就大模型训练,英伟达GPU还是一家独大,但不难发现,有实力的AI芯片公司都期望,能在尽可能避开与英伟达正面锋芒的情况下,寻求市场机会。比如在今年的WAIC大会上,瀚博发布了LLM大模型AI加速卡VA1L,在高算力基础上特别做出了对于ChatGPT、LLaMA、Stable Diffusion等主流生成式AI模型的支持。
而更值得关注的是,瀚博推出AIGC大模型一体机,它用了8张VA1L,支持512GB显存,1,750亿参数大模型。瀚博在宣传中提到,这是目前价格最低的针对LLM的大模型一体机方案,其对标友商产品的价格为150万元。钱军说:“我们意识到大模型还是需要私有化的部署。借助一体机来做fine tuning(微调),又能支撑推理,真正把私有化部署的大模型应用做起来。”
J.P. Morgan在评论文章中说,生成式AI的商业化并不简单,除非有着极强的需求驱动力,且能够变现。或许将AI技术真正融入到业务中,要核算AI所占成本是件还挺复杂的事:比如黄仁勋就始终在说英伟达的产品是“买得越多、省得越多”,这大概是从模型训练到部署与推理使用,杂糅了开发全周期,以及固定成本、可变成本的系统性考量。但对中小型企业而言,高昂的固定成本是现阶段能否用上生成式AI的巨大门槛。这大概也是诸多AI芯片厂商的切入点之一,杨建在评价生成式AI时,就提到“AIGC产业发展不仅需要高算力,更需要性价比更高的普惠算力”。
不仅是瀚博,大部分AI芯片与GPU企业都有自己在技术与市场上于生成式AI时代生存和发展的逻辑,比如Cerebras就强调堆料在应对大模型时的高效性;Graphcore似乎渐有从单纯卖硬件,走向把更多注意力放在运营AI云的业务模式上;亚马逊Trainium则显然是借助AWS的强势,在字节跳动、Airbnb之类的客户中推广AI。
另外,当前英伟达还面临一定程度的半导体产业区域化和地缘政治的不良影响。中国市场显得更为特殊,即美国潜在的技术封锁行为持续收紧,让英伟达的数据中心产品很难在中国开展业务。这就给了其他AI芯片企业以机会,也才有了文首提及现如今H800/A800一卡难求,以及二级市场价格高涨的局面。
Nigel Toon就在不同场合提过,Graphcore的亚洲业务发展不错,尤其中国企业在寻找美国供应商之外的选择。而中国GPU与AI芯片企业则或许能够借此机会,催生更完整的自有生态。可能在生成式AI接下来深入到更多行业中以后,我们会找到答案,毕竟ChatGPT正式发布还不到1年。