让孙燕姿唱周杰伦的歌曲,让泰勒斯威夫特流利地说中文,让乔布斯和马斯克用中文对谈会是一种什么样的体验?这种新奇的展现场景正在成为一种新的流行趋势。创作者们经常尝试通过改变自己的声线,在多人游戏语音或是视频录制中绽放独特的魅力,但苦于机械的调音设备和软件,通常只能让声音失真。而就在此刻,随着新一代英特尔酷睿Ultra系列处理器发布,基于人工智能(AI)的自然发声正在变成可能。
在驱动AI PC的英特尔酷睿Ultra处理器新品发布会上,英特尔联合格子互动将天马行空的变声体验提升到了新高度,名为“大饼AI变声”的应用已经悄然改变视频创作者、游戏主播的声音创作模式,全新的酷睿Ultra处理器则成为了这场AI变声体验的重要一环。
生成式AI变声唾手可得
年轻人的变声畅想可以追溯到上个世纪动漫中的变声领结,只需要几步简单调整,就能发出清晰、自然、与本人完全不同的声音。但在过去的数十年中,声音调整是一项复杂的系统工程,不仅涉及到专业的硬件调试设备,还需要专业的声音工程人才通过专业软件才能实现近似于自然的效果。这注定在很长一段时间中,自然变声只能是电影级的大制作中才有可能被采用。
随着生成式AI普及,繁琐的声音调试变成了过去式,现在创作者只需要在“大饼AI变声”输入自己的声音,AI就能够自然的创造出全新的声线,包括稳定的变出目标音色,完美模拟音色、语气、语调、口音,甚至还能支持任何语种和方言的发音,让整个发声过程清晰、自然,并在AI的加持下得到重新演绎和表达。更重要的是,生成式AI变声的过程中,不需要创作者任何专业知识和人工参与,仅需接上麦克风,剩下的工作都交给AI完成。
从实际体验来看,“大饼AI变声”的响应时间几乎是没有延迟的。平均低于5%的CPU占用率以及极低的内存占用保证了清爽的使用体验,搭配上酷睿Ultra处理器所展现出的高效率,变声过程几乎在声音录入的同时就已经完成。这意味着创作者无需任何等待,在完成声音录入之后,即可直接投入到后期的视频剪辑,甚至是在线直播的语音聊天中,也能即刻变换,无需任何等待的时间,让生成式AI语音唾手可得。
有意思的是,创造了“大饼AI变声”的格子互动是个成立不到3年的创业团队,43名员工平均年龄仅为26岁。正是这群怀揣梦想的年轻人,利用英特尔CPU处理器的加速优势,打造出了国内唯一投入商用的实时变声SDK产品,一站式解决语音合成、语音转化和声音克隆以及即将推出的口音消除等技术服务,并提供给普通用户免费体验,包括25个声音标签、上千个好声音等丰富的AI声音选择,让更多消费者、玩家更快的接触到AIGC带来的流畅体验和便利性。
酷睿Ultra释放AI潜能
英特尔酷睿Ultra处理器是首款基于Intel 4制程工艺打造的处理器,代表了40年来英特尔架构最大的革新。它采用了先进的Foveros 3D封装技术,结合前沿的知识产权成果与先进的制程工艺,以优化相关模块的性能表现。
酷睿Ultra系列处理器助力生成式AI变声应用普及仅仅是AIGC的一个细分,其背后所推动的正是今年9月份英特尔CEO帕特·基辛格在硅谷提出的AI PC理念。简单的说,AI PC是能够玩转AI功能的PC。当AI可以通过云端和PC紧密协作,或是在离线的状态下依靠终端的算力运行大语言模型,AI所能产生的用户体验、生产力和创造力,也将得以进一步释放。
酷睿Ultra系列正是AI PC走向普及的转折点,除了拥有强大的基础性能,酷睿Ultra系列还首次融入了用于AI加速的NPU模块,即神经网络处理单元。这不仅可以让“大饼AI变声”这样的AI应用在离线、节能的状态下流畅运行,还将推动AI相关产业进一步发展。预计在2025年前,全球会出货超过1亿台AI PC。合作涉及100家ISV合作伙伴,覆盖300余项AI加速功能,AI应用将会得到更大范围的推广。
时至今日,“大饼AI变声”已经获得超过100+各大平台知名主播的应用,在视频、直播、内容呈现上获得了很好的节目效果。同时也意味着AIGC应用走向全面普及的关键节点,每一位用户都可以通过AIGC应用,轻松创作内容获得收益,比如通过简单的文字就能生成美妙的音乐、充满创意的图片,乃至从未有过的视频画面。再比如通过AI PC轻薄笔记本就能实现动态捕捉、虚拟形象生成、AI抠图。
在每一个AI应用的背后,都能找到由于英特尔所打造的硬件和软件生态,搭载酷睿Ultra系列处理器的笔记本就是很好的例子。相信过不了多久,我们就能在更多AI PC上,享受到诸如“大饼AI变声”这般便捷、高效的AIGC应用了。