谷歌人工智能(AI)系统“AlphaGo”,先前击败韩国围棋棋王Lee Se-dol扬名国际。如今研发AlphaGo的团队再下一城,宣称能让电脑说话的声音更贴近人类,或许未来人们能和AI对话聊天。
CNBC、每日邮报、英国金融时报报导,谷歌母公司Alphabet旗下的DeepMind 8日宣布研发新技术,能让电脑合成语音和人类声音的差距减少一半。DeepMind表示,长久以来,人机互动的梦想就是让人类能和机器对话。
当前的语音合成技术录制人们实际说话的声音,存放在数据库,需要时把字句打散重组,合成为完整句子,此种方式生成的语音听起来生硬不自然,也缺乏感情。
DeepMind的“WaveNet”技术,能分析原始声波,使用类神经网络(Neural Network)加以修正。此种技术需要庞大的运算能力,每秒要1.6万个范本才能转成数据、合成为语音。DeepMind表示,WaveNet生成的中英文,听起来比谷歌现行技术自然许多。
英文
https://storage.googleapis.com/deepmind-media/pixie/us-english/wavenet-1.wav
中文
https://storage.googleapis.com/deepmind-media/pixie/mandarin-chinese/wavenet-1.wav
DeepMind说,Wavenet能模仿所有人的声音,还能加入感情和语调,让电脑生成语音听来更丰富多变。不此如此,他们还用该技术制造出类似钢琴的琴声。不过内情人士指出,WaveNet需要极大的运算能力,可预见的未来或许还无法使用在真实世界,目前也未用于谷歌产品。
人工智能(AI)再次缔造里程碑,谷歌人工智能系统“AlphaGo”,3月9日击败世界围棋棋王Lee Se-dol,写下历史新页。
金融时报(FT)、卫报报导,电脑早已征服西洋棋,1997年IBM深蓝(Deep Blue)打败了西洋棋王Garry Kasparov。围棋比西洋棋更复杂,有上兆种可能性,需要靠直觉推演情势,即便超级电脑都不容易上手。研发AlphaGo的谷歌DeepMind执行总裁Demis Hassabis说,AlphaGo的胜利是历史性时刻。韩国解说员认为,AlphaGo下法神祕莫测,致胜关键在于不会受到情绪干扰。AlphaGo就算犯错,仍能保持冷静,不影响后面棋局。相反的,Lee因为一开始的失误,苦吞败仗。
AlphaGo的胜利,可能意味人工智能将更广泛运用,人类工作岌岌可危。CNBC报导,人工智能不断进化,新创公司Thumbtack报告称,当前所谓的“零工经济”,将在20年消失。未来物流公司无需聘请人类驾驶,改用自驾车和无人机取代,叫车软件优步(Uber)、零售巨头亚马逊(Amazon)都会加入此一潮流。另外,当前的高端工作者,如律师、会计等,工作也不再稳固,将成为新的零工经济成员。
(本文由 MoneyDJ新闻 授权转载;首图来源:Google)
如需获取更多资讯,请关注微信公众账号:半导体行业观察