据外媒援引知情人士消息透露,计划在下个月举行的年度开发者大会上推出该公司首款专为支持人工智能()而设计的。此举是多年来努力的结果,有助于减少对设计的GPU的依赖,同时有效降低成本。
本文引用地址:这款代号为Athena,是为训练和运行大语言模型(LLM)的数据中心服务器设计的。它预计将与的旗舰产品H100 GPU竞争,同时可支持推理,能为ChatGPT背后的所有软件提供动力。
此前就有消息爆出,秘密组建的300人团队,在2019年左右着手开发Athena。今年开始微软加快了时间轴,目前已经在和Open的小团队中进行了秘密测试。
早在2020年,OpenAI就在微软的大型超级计算机上开发其生成式人工智能技术,使用了上万块的GPU。为了支持OpenAI的产品和研究需求,微软至少已下单数十万块英伟达芯片,由于需求激增,英伟达GPU一直处于供应不足的状况,而且价格昂贵。
微软正面临GPU供应短缺的风险,这可能会影响其明年生成式AI业务收入的能力。转向内部开发的AI芯片将提高微软在该市场上的地位,并将降低对英伟达的依赖,同时节约生产成本。
根据最初的计划,Athena会使用台积电的5nm工艺打造,预计可以将每颗芯片的成本降低1/3。Athena虽然并不能直接替代英伟达的芯片,但随着微软后续推动在Bing、Office、GitHub和其他地方推出AI驱动的功能,芯片可能会大幅削减成本。
Athena的性能细节尚不清楚,尽管其可能具有硬件和成本优势,但由于CUDA平台(由英伟达推出的通用并行计算架构),英伟达的GPU仍然是AI开发者的首选。吸引用户使用新的硬件和软件对微软来说将至关重要,说服他们的云客户更多采用内部芯片而不是英伟达的GPU服务器可能降低支付金额。
微软还在与AMD密切合作,开发即将推出的AI芯片MI300X。这种合作伙伴多样化的方法,能够帮助微软应对激增的AI工作负载挑战,也希望增加与英伟达谈判的筹码。在与AMD合作的同时,微软也打算继续与英伟达密切合作,试图获得更多英伟达处理器。
目前,微软云(Azure)也依赖英伟达的GPU支持云客户的需求。在谷歌、微软和亚马逊的芯片大战中,微软一直处在落后的位置,在推出Athena后,微软将基本赶上亚马逊和谷歌。有了Athena,微软可以效仿竞争对手亚马逊和谷歌,为云客户提供自家研发的AI芯片。
亚马逊对OpenAI的竞争对手Anthropic提供了财务支持,并规定Anthropic使用亚马逊的AI芯片,名为Trainium和Inferentia。与此同时,谷歌云宣传称,AI图像生成公司Midjourney和Character AI等客户正在使用谷歌自主研发的张量处理单元(TPU)。
人工智能的繁荣正在给云计算供应商带来更大压力,迫使他们开发自己的芯片:你可以从英伟达购买,但当你看到谷歌和亚马逊这些巨无霸时,会发现他们有资本设计自己的芯片。
除了AMD和英伟达外,微软也正与OpenAI在多个领域展开合作,其中包括在其新版必应中使用OpenAI的技术。有传言称,OpenAI也在寻求设计自己的人工智能芯片,以减少对基于英伟达的GPU系统的依赖。
根据路透社掌握的最近的内部讨论,OpenAI尚未决定是否继续推进这项AI芯片开发计划。不过,熟悉情况的人士称,至少从去年开始OpenAI一直在讨论解决AI芯片短缺的办法,包括自行制造AI芯片,与英伟达等其他芯片制造商更紧密地合作,以及将供应商多样化,如在英伟达之外寻找其他公司。
另外,收购芯片公司可能会加速构建OpenAI自制芯片的进程,就像亚马逊在2015年收购Annapurna Labs一样。熟悉计划的人士表示,OpenAI的收购计划曾进展到对潜在收购目标进行尽职调查的程度。不过,OpenAI所考察的公司身份目前尚不清楚。
即使OpenAI继续推进自主研发芯片的计划,包括收购企业,也可能需要数年时间才能实现,同时公司仍然会依赖芯片供应商如英伟达和AMD。截至目前,OpenAI没有直接回应有关其AI芯片计划的问题。