作者: 付斌
最近,比尔盖茨力推AI Agent,给本就火爆的GPT再加了一把火。
五年内每个人都将拥有AI私人助理Agent——无论你是否在办公室工作,并称“它们将彻底改变我们的生活方式”。
从商界到学界,观点和产品都在井喷,这昭示着全面AI时代已经到来。当所有公司加入道这竞赛时,倘若在几年之内,自己的产品还没有被AI技术所重构,或许就意味着淘汰。
英特尔作为基础设施提供商,12月15日,2023英特尔新品发布会暨AI技术创新派对上,英特尔酷睿Ultra处理器(代号Meteor Lake)和第五代至强可扩展处理器(代号Emerald Rapids)正式发布,而这两款产品瞄准的,则正是AI。
最强AI处理器面世
至强可扩展处理器一直以来都以其强大的通用性和扩展能力著称,而自前几代开始,也愈发注重AI方面的性能加速,本代处理器,则更加注重在AI能力的建设。
首先,从官方参数来看,第五代英特尔至强可扩展处理器其迭代性能相较于上一代产品提升了21%,并在一系列客户工作负载5中将每瓦性能提升高达36%。而AI推理性能的提升则高达42%,得益于内置的英特尔高级矩阵扩展功能,第五代至强处理器无需搭配独立的AI加速器,就可以直接应付严苛的AI工作负载。
其次,第五代至强可扩展处理器推出一系列电源管理工具,是迄今为止推出的最绿色的至强处理器,它能够帮助用户管理能耗,降低碳足迹。
具体从产品来说,第五代至强延续了现有四代的Intel 7制造工艺、CPU架构、LGA4677封装接口,在布局设计、规格特新上做了升级和增强:三级缓存容量大幅增加,从最多112.5MB增加至320MB,相当于每核心从1.875MB增至5MB,接近2.7倍;DDR5内存支持从四代的4800MHz提高到5600MHz,最低档也从4000MHz提高到4400MHz;最高加速频率从1.9~4.2GHz提升至3.4~4.1GHz;功耗则从四代的115~350W提升至150~385W。
此外,第五代至强依然是多芯片整合封装,但从四芯片改为双芯片,每颗芯片组的最大核心数量则从15个增加到32个,因此从最多60核心120线程提高到了64核心128线程。
从型号上来看,第五代至强拥有64、60、56、52、48、36、32、28、24、16、8核心等配置,相比于第四代至强,取消了44、40、20、18、12、10核心版本,SKU型号总数也从55款精简到28款。
AI是第五代至强的重点,根据·英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立的介绍,自第一代至强开始,英特尔一直注重加速AI工作负载,为此,推出了AVX512等指令集。今年年初发布第四代至强时,首次推出英特尔® AMX(英特尔®高级矩阵扩展)内置加速器,在相较于前一代产品进行迭代性能提升之外,同时致力于为产品带来更优的AI性能。第五代至强,也已在处理多数企业的AI负载上表现优异。
第五代至强每一个内核都具备了AI加速功能以处理包括大模型在内的AI工作负载,目前,与众多客户进行合作中,已成功在第五代至强处理器上运行高达200亿参数的模型推理。
AI PC时代正式开启
“AI PC的出现将加速换机潮的到来。” 这是IDC与联想联合发布的《AI PC产业(中国)白皮书》中的核心观点。
英特尔在业内首提AI PC,并在今年10月发布“AI PC加速计划”后,酷睿Ultra终于正式面世,这也意味着,AI PC时代的序幕已经拉开,这也开辟出了一个新的赛道。
什么是AI PC?AI PC 是满足该需求的新一代个人电脑,它将向个体充分释放AI大模型技术突破带来能力延伸,同时带动产业构建新生态。
英特尔酷睿 Ultra 处理器在 CPU、GPU 和神经网络处理单元(NPU)的架构中集成了专属 AI 加速功能,从而成为英特尔历史上 AI 性能最强、能效最佳的客户端处理器。
首批酷睿 Ultra 系列处理器包括 U 和 H 两个系列:U 系列为 2+8+2 核心规格,最高 4Xe 核显,基础功耗15W;H 系列最高 6+8+2 核心规格,最高 8Xe 核显,基础功耗分别为 28W。明年第一季度,英特尔还将发布基础功耗 45W 的 Ultra 9 旗舰型号,6+8+2 核心规格,8Xe 核显。H和U两个系列还会分为三种不同的配置,即酷睿Ultra 5、酷睿Ultra 7和酷睿Ultra 9。
与AMD Ryzen 7 7840U、高通骁龙8cx Gen 3和苹果自研M3芯片等笔记本电脑处理器相比,酷睿Ultra 7 165H芯片的多线程性能提高了11%。与之前的英特尔酷睿i7-1370P相比,它的功耗降低了25%,比AMD的Ryzen 7 7840U的功耗降低了79%。
根据英特尔中国区技术部总经理高宇的介绍,从技术上来说,有四个点值得关注。
第一,在封装与制程上,英特尔酷睿 Ultra 处理器是首款基于 Intel 4 制程工艺打造的处理器,代表了 40年来英特尔架构最大的革新。Intel 4采用了EUV极紫外光刻技术,首次采用高密度metal in metal方式,改善半导体晶体管供电,从性能上来说,Intel 4在密度上提升了2倍,整体能效比比上一代提升了20%。采用了Foveros 3D 封装技术,结合前沿的知识产权成果与先进的制程工艺,以优化相关模块的性能表现。
第二,沿袭之前大小核的传统,全新性能核架构提高每时钟周期的指令执行能力(Instructions Per Cycle),能效核(E-cores)和低功耗能效核(LP E-cores)可扩展的多线程性能,并为性能核(P-cores)分担更多后台工作负载,从而实现更高效多任务处理表现。
第三,每颗CPU中都配备了一颗NPU,即神经处理单元,提供低功耗人工智能加速和CPU/GPU卸载,执行人工智能驱动的任务,如背景模糊、眼动追踪和图片框架等。与英特尔上一代产品相比,能够提高运行Stable Diffusion等人工智能模型的效率。由于有NPU加持,整体功耗降低38%。而在综合巡航测试日常办公应用中,续航能力提升了36%。从测试结果来看,酷睿Ultra在能效表现上取得了非常好的成绩。
第四,集成英特尔锐炫 iGPU,拥有最多 8 个 Xe 核心,支持基于 AI 的超级采样技术 XeSS 及 DX12 Ultimate,图形性能最高为前代的2 倍,支持现代图形功能,包括硬件加速的光线追踪、网格着色、AV1 编解码、HDMI 2.1 以及 DisplayPort 2.1 20G。根据英特尔在现场演示,无须独立显卡,仅使用处理器内置的锐炫GPU,酷睿Ultra处理器就能流畅运行《赛博朋克2077》这样的3A大作,达到平均60FPS的运行帧数,面对《逆水寒》《CS2》这样的网络游戏则能分别实现平均90FPS、150FPS左右。
总结起来,酷睿Ultra不仅自身强大,同时配备有CPU、GPU和NPU三种计算引擎,三种引擎算力特点各不相同,从而可以适应不同的AI任务。
酷睿Ultra如何拥抱AI PC时代?根据高宇的解析,所谓的AI PC最重要的特征,就是把复杂的AI任务直接运行在PC上,当然这和云侧所运行的AI任务相比,英特尔认为AI PC可以提供四大客户价值。
第一是降低网络时延,所以它可以提供瞬时响应的AI服务;第二是PC算力触手可及,所以它是门槛最低,最易用,成本最低廉的AI服务形式;第三可以根据针对个人场景进行模型的微调,从而提供千人千面的AI服务;第四,提供强大的个人隐私保护,用户敏感数据不用离开本地端,就降低了泄露风险,当用户运行在云上的时候,由于TDX技术加持,用户数据照样是安全的。
最终,AI PC应该是云、端紧密结合的产品,毕竟PC能够承载的模型尺寸有限,所以AI PC最合理的设计方式,应该是云边端混合部署,以及灵活调度。
值得一提的是,通过英特尔工程师和大模型厂商的共同优化,酷睿Ultra处理器可以胜任高达200亿参数的大语言模型应用。这意味着,普通用户也可以通过搭载Ultra的笔电,在边缘侧也能拥抱大模型。
推动更大的AI生态
AI大模型时代飞临,数字经济发展进一步加快。正如英特尔CEO Pat Gelsinger前不久提出来“芯经济”的概念,现在芯片经济差不多达到5700亿美元的规模,推动了8万亿美元的数字经济,增长速度非常快。在接下来几年的时间,接入到整个物联网、互联网的设备会有4倍的增长,在未来5~10年的时间会有15倍的增长。
英特尔作为IT行业领导厂商,怎么跟上这样快的节呢,怎么继续推动数字经济向前发展?
“英特尔最近推出了‘四年五个节点’半导体工艺的演进计划,为行业和公司都奠定了很好的基础。” 英特尔公司市场营销集团副总裁兼中国区总经理王稚聪如是说。
此外,为了推动更大的AI生态建设,让AI无处不在,做好硬件产品后,英特尔还会和数据中心大量云厂商、人工智能模型厂商、工具链厂商、数据库厂商、操作系统厂商及各种基础软件厂商、虚拟化软件厂商协作。
“当然这里面也有英特尔自身很多软件工程师的努力,以及软件工程很多的工具以及工具链,如Open AI、Open VINO和ONE API这样的软件体系,使得在合作过程当中,我们和很多合作伙伴有很多深入的交流和探讨。” 王稚聪这样介绍道。
值得一提的是,英特尔很快也会启动人工智能开发者大赛,进一步在中国推动基于人工智能新的计算应用的发展。