阿里达摩院提出“知识链”框架,逐步纠错降低大模型幻觉

发布时间:2024-05-09  

5月9日消息,阿里巴巴达摩院(湖畔实验室)、新加坡南洋理工大学等联合提出了大模型知识链(CoK)框架。相比传统的检索增强生成(RAG)技术,该框架可实时检索异构知识源并逐步纠正推理错误,进一步提高大模型问答知识型问题的准确率,降低幻觉现象。相关论文入选正在奥地利维也纳举行的国际表征学习大会(ICLR 2024)。

“执导了《El Tio Disparate》的阿根廷演员出生于哪一年?”面对此类需要多步推理的知识型问题,大模型可能会“胡言乱语”,给出看似符合逻辑,实则错误或并不存在的回答。这个问题被称作大模型“幻觉”,极大制约了大模型的应用场景。学界也在重点研究给大模型“外挂知识库”的RAG等技术路线。

在论文《Chain-of-Knowledge: Grounding Large Language Models via Dynamic Knowledge Adapting over Heterogeneous Sources》中,达摩院领衔的联合研究团队提出了一种名为“知识链”(Chain-of-Knowledge, CoK)的新框架,包括推理准备、动态知识适应和答案整合三个步骤。对于知识密集型问题,知识链先确定知识领域,并准备若干中间推理步骤和相应答案。如若这些初步结论没有共识,知识链将实时检索相应知识领域内的不同知识源,逐步生成、纠正推理步骤,给出最终答案。

图说:“知识链”(CoK)框架包括(I)推理准备(II)动态知识适应和(III)答案整合

与传统的RAG相比,知识链框架创新性地设计了对推理分析过程的逐步纠错,最大程度地防止错误层层传导。有别于此前的大模型知识增强方案主要使用非结构化数据源,知识链框架同时支持结构化数据源,并引入了经过指令微调的自适应查询生成器,从而更精准地生成查询语句,从知识源提取到有效信息。

在通用知识、医学、物理、生物等多个领域的实验结果显示,相比起思维链(Chain-of-Thought, CoT)方法,知识链框架可将大模型的回答准确率平均提高4.3%。对比ReAct、Verify-and-Edit等RAG方法,知识链也表现出稳定的优势。据论文介绍,知识链有望连接各类大模型和不同格式的知识源,帮助解决隐私保护、知识源可靠性和快速信息更新等关键问题。

据介绍,ICLR由图灵奖得主、深度学习领军人物Yoshua Bengio和Yann LeCun牵头举办,是国际AI顶级学术会议之一。达摩院共有三篇大模型研究论文入选,另外两篇涉及大模型推理长度外推、多语言安全等课题。

文章来源于:21IC    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>