DeepSeek大模型于2025年引发轰动效应,多家AI芯片厂商已经宣布适配DeepSeek大模型,包括华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯、龙芯中科等。
近日,媒体询问寒武纪,得到回应:暂时没有这方面消息,如果有的话公司会通过官方宣布。
业界指出,AI行业过去依赖扩大模型、增加数据和提升硬件效能来发展,但成本与效率成为挑战。DeepSeek 采用蒸馏模型(Model Distillation)技术,压缩大型模型以提升推理速度并降低硬件需求,同时充分发挥 NVIDIA Hopper 降规版芯片的效益,最大化运算资源利用。其成本优势来自高效能硬件选择、新型蒸馏技术及 API 开源策略,不仅优化技术与商业应用的平衡,也展现AI产业向高效发展的趋势。
DeepSeek大模型的成功上线,为企业提供了低成本、高性能的技术解决方案,还推动了人工智能行业的良性竞争与发展。随着更多应用场景的开发和落地,DeepSeek有望在更多领域发挥重要作用,后续发展值得持续关注。
文章来源于:全球半导体观察 原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。