6月16日消息,中国科学院自动化研究所今天发布了该所研制的新一代大模型——紫东太初2.0。
全新大模型相比第一代着力提升了决策与判断能力,实现了从感知、认知到决策的跨越,未来将在医疗、交通、工业生产等领域发挥更大作用。
第一代紫东太初大模型于2021年问世,由中国科学院自动化研究所和华为联合开发,区别于当前以文本为主的大部分语言大模型,是全球首个图文音三模态大模型,实现了无标识的图像、文字、语音的识别能力。
这次发布的“紫东太初”2.0全模态大模型,不但优化了文本、图片、语音的融合认知,还进一步加入了视频、传感信号、3D点云等识别能力。
新版本突破了多模态分组认知编码、解码,全模态认知等关键技术,提升了系统的决策和判断能力,打通了系统识别能力从感知、认知到决策的通路,从而拓展出更为广泛的应用场景。
目前,由自动化所牵头打造的多模态产业联合体已陆续吸纳产学研各界近70家成员单位。紫东太初大模型已经在神经外科手术导航、短视频内容审核、医疗多模态鉴别诊断、交通违规图像研读等多领域应用。
文章来源于:21IC 原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。