微软把多语言翻译变得像“面对面”一样简单

发布时间:2016-12-15  

microsoft-translator-interpret-multiple-languages-live-3-624x416

“我的父亲来自中国、母亲来自日本,我在美国长大,我的丈夫是一半法国一半犹太人,”微软杰出科学家 Lili Cheng 介绍她的家庭沟通难题,“我希望能用母语和每个人沟通,这样在家里才是最自然的。”

微软翻译(Microsoft Translator)一个新版本将能够解决这个问题。在旧金山,该公司向包括 PingWest 品玩在内的多家媒体和科技公司展示了已经发布的新版微软翻译:两名用户语音聊天,一人说英语,使用 PC,另一人说法语,使用智能手机,两个人各自的语音可以翻译成对应的语言,在彼此的设备上播放。

pingwest 配图

从图片中可以看出,这一新版本的界面和传统的翻译软件区别很大,采用了对话的界面──就像 LINE 的群组聊天一样。

为什么说是群组聊天?因为对话和翻译的参与者不只两个人:在现场的 demo 中,还有另外两台设备将所有的对话翻译成了希伯来语和日语。不仅如此,该公司全球执行副总裁沈向洋也即时加入到聊天中,微软翻译将他的中文翻译成其他参与者对应的语言。

怎么参与到一个翻译对话中?不得不说,微软可能从微信那里获得了很多灵感。举个例子,我在异国的酒吧需要和两个分别来自法国和德国朋友聊天:首先,我在手机上选择我的语言并创建一个对话,之后微软翻译就生成了一个 5 位代码和一个二维码,我的法国朋友在他的应用软件里输入代码,我的德国朋友扫描二维码,填写名字后就可以立刻加入到对话当中,不需要帐号登录也不需要加好友,和微信的扫码 / 雷达 / 面对面建群一样简单。

pingwest 配图

我和微软翻译产品策略总监奥列维·丰塔纳(法语)一起在手机和 PC 上测试新产品。现场的网络讯号不错,语音翻译的速度很快,丰塔纳一句话还没说完,我已经在我的手机上看到系统翻译和不停地修正文字。

有趣的是,这个对话的设定充分借鉴了 IM 软件的群聊功能,发起者就像群主一样,可以移除或禁止其他参与者发言,而且当发起者退出时,所有参与者设备上的对话也同时结束──丰塔纳说这个设定出于隐私的考虑。对话结束后,参与者可以选择退出或者保留对话纪录(在 PC 上是一个纯文本档案),方便以后使用。

新版本现在已经正式推出,在网页和 iOS App Store、Windows 10 手机和 Android 应用市场上线,目前语音翻译已经支持包括中文在内的 9 种全球最常使用的语言,另有希伯来语、泰语和日语等数十种支持文字翻译。新版本还有一个“演讲者模式”功能,可以当成会议演讲设备来使用。

丰塔纳对 PingWest 品玩透露,微软为新版翻译开发了一个神经机器翻译系统(Neural Machine),主要由微软 2015 年推出的 ResNet 深度神经网络和 LSTM(长短时记忆单元)技术两部分组成,分别负责文字语音辨识和不同语言之间的转换,整个系统运行在 Azure 云端计算平台上。丰塔纳指出,相较于过去微软以及各公司使用的统计机器(statistical machine)翻译,神经机器翻译的结果更准确,更接近自然语言,方便理解。

pingwest 配图

让机器给人的交互感觉和人与人之间的交流越来越接近,是微软近年来主推的技术方向。从底层技术上,微软将微软研究院、亚研等过去相对分离的研究力量整合成了人工智能和研究事业群(AI & Research Group),进一步加深深度神经网络等各种人工智能底层技术的整合,并加快技术投入生产的节奏。从实现形式上,微软开始推动“对话式 AI”的理念。包括小冰、微软翻译、Skype 聊天机器人等,都是该公司为了实现这一理念所推出的产品。

翻译是不同语言之间的人类交流必经的流程步骤,但也正因此,在过去大部分翻译软件都被定义为工具。然而实际上,翻译的目的不是翻译而是沟通,将翻译工具转变成对话式的界面,让翻译服务于沟通,而不是做为工具,新版微软翻译在这一点上做的很有诚意。

(本文由 PingWest 授权转载)

如需获取更多资讯,请关注微信公众账号:半导体行业观察

责任编辑:mooreelite
文章来源于:半导体行业观察    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    成对应的语言,在彼此的设备上播放。 从图片中可以看出,这一新版本的界面和传统的翻译软件区别很大,采用了对话的界面──就像 LINE 的群组聊天一样。 为什么说是群组聊天?因为对话和翻译......
    。 AR眼镜让信息在三维空间即时呈现,眼前整个世界变成了可演绎、可计算、可深度改造的。以翻译功能为例,当面对面交谈时,雷鸟X2的定向收音MIC会精确获取注视目标的话语,并自动检测和翻译对话。整个......
    过IAR 现如今,“C/C++与RTOS结合使用”是嵌入式软件开发的黄金范式,所以在嵌入式领域,判别编译器好不好用,那一定是在RTOS上好用。 根据著名嵌入式Jacob Beningo的测试,使用IAR......
    Datasheet几乎是基本功,国外的芯片企业起步较早,因此大部分资料本就以英文为主,绝大部分工程师普遍均精通阅读英文资料,偶尔个别不熟悉的词语会使用翻译软件的划词/截图翻译功能或使用WPS全文翻译......
    码提示与动态语法检测功能,使得 MDK 的编辑器越来越好用了,这里我们简单说一下如何设置,同样,点击 ,打开配置对话框,选择 Text Completion选项卡。 Strut/Class Members,用于......
    能因为车机没有真正满足用户需求。例如,用户在一天内和车对话100次,可能代表车机好用,也可能代表车机太笨拙,无法理解或预测用户需求,用户只能重复多次和车机对话。”  另外,李涛表示,目前车机的Pad化趋......
    淘汰的是只支持/只默认QQ音乐或只支持网易云的,另一个音乐软件它也能安装使用,但排他性导致你想用另一个软件则障碍较多。 蔚来则做到了允许你任选QQ音乐还是网易云,你用哪个,喊“我要听XX”就默认用哪个软件......
    偏重应用层。 很多人喜欢去评价,说哪个方向比哪个好,这4个方向没有绝对的哪个工资比哪个高,行内人自然懂,不懂得喷子键盘侠我也懒得解释。 我做了这个行业10年来说说自己的看法。 这4个方向,没有说哪个比哪个好......
    整个世界变成了可演绎、可计算、可深度改造的。以翻译功能为例,当面对面交谈时,雷鸟X2的定向收音MIC会精确获取注视目标的话语,并自动检测和翻译对话。整个过程先实现谈话对象的视觉感知、定位和声音过滤收集,然后......
    上比较像是不用动手翻的英汉字典,而不是翻译。 而另外一个好用的功能则是地图,前面一篇文章我们已经讲过地图 App 要怎么用了,在这里则是地图与小娜结合的案例,你可以直接在小娜里头问“从家......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>