酷睿轻薄本也能运行大语言模型,英特尔推动 PC 生成式 AI 落地

发布时间:2023-08-25  

 8 月 24 日消息,2023 年 8 月 18 日上午,英特尔在大湾区举办了一场技术分享会,主题是英特尔在 AIGC(人工智能生成式计算)领域的最新进展。会上,英特尔的技术专家向与会者展示了他们在 AIGC 上的技术方向,并进行了多个应用的演示。

本文引用地址:

首先,英特尔介绍了他们在大语言模型方面的优化和支持。在我们传统的认知里,运行类似 ChatGPT 这种大语言模型必须要有大显存的显卡支持。但这场交流会却颠覆了我们的认知。英特尔为了让 12、13代酷睿平台也能够顺利运行各种大语言模型并提供流畅的使用体验,构建了 BigDL-LLM 库。通过这个库,可以对各种大语言模型进行优化和支持,包括一些开源的、可以在本地运行的大语言模型。这个库甚至可以在一台搭载 16GB 内存的英特尔轻薄本的机器上运行参数量高达 16B 的大语言模型。此外还支持 LLaMA / LLaMA2、ChatGLM / ChatGLM2 等多个大语言模型。

接下来,英特尔展示了他们在大语言模型应用方面的表现。通过集成了 ChatGLM2、LLaMA2 和 StarCoder 这三个大语言模型的 Demo,他们演示了这些模型在中文和英文应用上的表现。通过优化和量化操作,这些大语言模型在生成回答时能够以非常快的速度生成,并且不影响阅读体验。英特尔已经发布了这套 Demo,任何搭载 12、13代酷睿的电脑都可以直接安装并体验。

我们这里选择了一台通过英特尔Evo平台认证的轻薄本:华为 MateBook 16s 来进行测试。处理器为酷睿 i9-13900H + 32G 内存,看看在核显轻薄本上究竟能不能跑 AIGC。

英特尔大语言模型的 Demo 安装过程非常傻瓜,英特尔已经打包成了 EXE 文件,安装并导入.Bin 格式的大语言模型就可以运行了。打开界面我们可以看到左侧可以选择聊天内容、调整模型参数和查看运算延迟,右侧则是聊天框。

笔者先尝试问了他一些人情世故方面的问题,没想到回答非常出色,响应速度也很快。这样一个问题只花了 658.87ms 就完成了响应。

在运算过程中我们可以看到,i9-13900H 占用率达到了 100%,内存占用达到了 16G,Xe 核显也有一定占用。看来这个运算过程确实是在本地进行的。经过英特尔不断的优化和 13代酷睿处理器算力的提升,我们真的在轻薄本上实现了 AIGC 的落地。

在情感分析功能中,我们让大语言模型分析了一段经典散文。可以看到虽然分析的角度比较浅显,但没有逻辑错误,还是可以自洽的。

而在这个中文翻译功能中,英特尔大语言,模型的表现就更加令我意外了,它的翻译质量相当高,速度也很快。哪怕是有如此多专有名词的稿件,也能准确无误地翻译。

在故事创作方面,这套大语言模型也展现出了令我惊讶的逻辑能力和创造能力。我这边让它写一篇关羽大战林黛玉,最后林黛玉取胜的故事。但 AI 居然认识到了这两人根本不是一个时代的,最后写了一个穿越时空的戏码,虽然漏洞百出,但大体上没有问题。

生成大纲功能则是一个非常有用的功能,我们只要输入想要撰写的稿件,就能帮我们列出一套逻辑清晰的稿件大纲了。这对于经常需要写文章的群体来说能起到很好的辅助作用。

信息提取功能对于经常需要阅读报告的群体来说很有帮助。可以快速从长篇文章中提取核心信息。我这边尝试让 AI 从英文文章中提取中文信息,效果却依然非常好。

最后,笔者让 AI 给出一份青岛美食建议和青岛旅游建议。由于这个大语言模型是完全离线运行的,所以给到的信息也会比较陈旧,但单从撰写水平来看还是不错的。

除了大语言模型应用外,英特尔还展示了在 AI 文生图算法 Stable Diffusion 上的支持。他们启用了 OpenVINO 的加速,开发了一套 AI 框架,通过一行代码的安装,就可以加速 PyTorch 模型的运行。通过 Stable Diffusion 的 WebUI,可以在集成显卡和 Arc 独立显卡上运行 Stable Diffusion Automatic1111。通过演示,可以看到在 Evo 轻薄本和搭载 i7-13700H 处理器的机器上,Stable Diffusion 在集成显卡上的表现效果。96EU 版本的英特尔锐炬 Xe 显卡强大的算力,可以支持 Stable Diffusion 软件上运行 FP16 精度的模型,快速生成高质量图片。

同时,他们还展示了在搭载 i7-13700K CPU + Arc A770 独显的机器上运行 Stable Diffusion 的效果,速度非常快。

此外,英特尔还展示了基于 Arc 显卡的人物动作的三维数字重建技术。通过 Arc 强大的算力和 OpenVINO 框架对 AI 算法的优化推理,可以实时探测和重建人物动作,并进行后期渲染。这项技术不需要智能穿戴设备,只需连接家用摄像头,即可实现实时探测和重建人物动作,并通过数字人的形象进行动画渲染。通过实时的骨骼点信息和 3D 重建,数字人可以展现出灵活多样的肢体动作,实现真实的三维动效。同时,根据用户的需求,可以自定义渲染器的画风,快速打造各种元宇宙应用。

在最后的涡轮卡展示环节,英特尔展示了他们新的涡轮 GPU 卡,Arc A770 16G。这张卡具有双槽全长全高的设计,适应各种边缘侧服务器机箱或设备机箱。它采用涡轮风扇设计,减少对机箱内流场的干扰,更适合多卡混合计算的服务器、炼丹炉场景。

从本次分享会看来,英特尔一直着力于发展 AI 技术,特别是当下火热的 AIGC 领域,英特尔也没有缺席。凭借 13代酷睿强劲的算力和不断的算法优化,现在即便是轻薄本也可支持大语言模型的本地运行。而在 Arc 显卡的加持下,Stable Diffusion 文生图的支持也在不断开展。同时,英特尔也在探索 AI 的下一代应用场景,并为企业级用户提供算力更强的解决方案。

通过这些技术的展示,英特尔向大家展示了他们在 AIGC 领域的领先地位和不断创新的能力。他们致力于为用户提供更智能、高效的计算体验,推动人工智能技术的发展和应用。随着技术的不断进步和完善,我们可以期待在未来看到更多来自英特尔的 AIGC 应用和解决方案。


文章来源于:电子产品世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>