揭开Amazon Echo语音控制的神秘面纱

发布时间:2016-12-29  

china0513-624x468

版权声明:本文来自MEMS,如您觉得不合适,请与我们联系,谢谢。

亚马逊(Amazon) Echo可说是目前最热销的物联网(IoT)装置,无论你称它为智能麦克风、虚拟数字助理、家用机器人、语音控制或R2-D2,这一类以语音为基础的产品正迅速崛起…


相较于Echo,最新的第二代Echo Dot的价格从89.99美元调整为49.99美元,并将于本月在美国上市销售。


Amazon Echo(及其随后推出的Dot)开拓了一个新的市场,让装置供应商能够在语音获取、提高麦克风音频解析度、更先进的背景杂讯过滤、更好的音场检测与稳定连线能力等方面展开竞争,以提供更佳音频品质。


china0513-624x468
Amazon Echo (左)及其第二代产品Dot


而像XMOS等公司虽然自家芯片并未用于Echo中,但也瞄准了这个新的语音接口市场。XMOS行销与业务发展副总裁Paul Neil表示,「物联网目前正是一场快速移动的盛宴。为了控制IoT装置,语音是最自然的使用者接口。」


Neil说,由于融合了「传统的微控制器(MCU)性能、嵌入式DSP以及灵活的I/O组合,使得我们的技术成为语音接口的理想选择。」


然而,硬件装置之间的战争只是构成整个智能麦克风/扬声器市场的一部份。IHS Markit连网家庭资深分析师Paul Erickson强调,「真正的竞争变数来自云端。」


为了追求更「聪明」的智能麦克风(能够处理复杂的查询和随机问题),云端服务领域的竞争越来越激烈。 Google预计将于今年年底推出Google Home与Google Assistant (Google Now的新版本),并借此进入这个市场。Erickson表示,「而且市场上盛传苹果(Apple)很可能将在2017年挟其Siri进入这个领域。」


Amazon Echo——这款IoT装置如此热门的另一个原因在于它极具潜力,可实现IoT的重要优点:经得起时间考验(Future-proofing)。


芯科科技(Silicon Labs)软件副总裁Skip Ashton解释,Future-proofing的意思是「确保装置可随时间进展持续添加更多功能特性。」例如,Alexa为Echo提供的语音服务功能一开始有70种,如今已经增加到超过1700种了。


Echo可以回答问题、阅读新闻、为运动评分、控制灯光、从Amazon网站订购产品以及设定闹铃等。使用者还可以利用该装置向Uber叫车或订购披萨外送等。


「目前Echo大约每两周通过云端更新一次,」Ashton说,「Amazon会在星期五时发送电子邮件给Echo用户发布新功能, 」而Echo用户「也对于产品的功能持续增加怀抱着期待。


本地智能


IHS Markit嵌入式处理器首席分析师Tom Hackenberg剖析Amazon Echo对于电子产业带来重大影响的原因:智能麦克风/智能扬声器应用「对于处理器供应商来说极具价值。」


因为这种装置关键之处并不只是提供了「本地智能」。语音接口正普遍应用在广大的市场领域。不只是数字助理市场出现,成为智能手机App的消费电子装置版本,还有扬声器,也不是它唯一的外形应用。


例如,他解释说,「家庭自动化中心和数字助理可以内建于电视、机上盒(STB)、HVAC/环境控制中枢等。此外,在车载资讯娱乐方面也存在大量的应用,特别是着眼于其免手持的优点。」


拆解Echo与Echo Dot


通过拆解Echo与Echo Dot并进一步比较后,Hackenberg说,「除了存储器供应商,我发现Echo和Echo Dot的处理元件并没有明显的不同。」

china0513-624x468

拆解Echo与Echo Dot (来源:iFixit)


根据iFixit所进行的拆解,Amazon Echo采用:


– 三星(Samsung) K4X2G323PD-8GD8 256MB LPDDR1 RAM


– SanDisk SDIN7DP2-4G 4GB iNAND Ultra Flash


而到了新版的Dot则改用:


– 美光(Micron) MT46H64M32LFBQ 256MB (16Meg x 32 x 4Banks) LPDDR SDRAM (挥发性记忆体)


– 三星KLM4G1FEPD 4GB高性能eMMC NAND Flash (非挥发性储存)


两款产品使用的处理器则是相同的。在Echo与Dot的核心采用的是「德州仪器(Texas Instruments;TI)的媒体处理器DM3725」,此外,高通(Qualcomm) Atheros QCA6234应用专用标准处理器则用于提供「连接性」。


Hackenberg解释说,虽然存储器可能稍微影响性能,但存储器定价是波动的。因此,对于Echo系列的所有产品而言,在其整个生命周期中改变所使用的元件也很平常。


相形之下,「连线模组,尤其是媒体处理器更加复杂,如果不是重大的产品更新,一般并不会改变,」他说。


Hackenberg指出,Atheros处理器专用于作为连接应用标准产品。其设计是以Tensilica定制化XTensa核心为基础,而且「它只做一件事——协调与网络的通讯,以利作业进行。」


Erickson补充说,「连接能力至关重要,因为它涉及哪些资料可被获取、传送与接收云端资料的速度与可靠度等。由于速度/响应的可用性因素,它直接影响到与扬声器之间的互动有多么「即时」。因此,Wi-Fi的吞吐量、服务品质(QoS)与范围的改善,都将有所帮助。」


所有的「本地」(local)智能功能是由TI DM3725进行处理。Hackenberg指出,「这是一款专为STB、TV、显示器、视讯游戏系统等各种多媒体应用而设计的系统单芯片(SoC)。」


DM3725是一款以ARM Cortex A8为基础打造的元件,并整合TI的C64x+DSP与3D绘图加速引擎。「Cortex A8是一款成熟且经济型的应用处理器,但又完全足够用于本地执行简单的任务,」Hackenberg表示。


然而,「如果应用变得复杂,而不只是一款扬声器这么单纯,可能就会有所变化。」


china0513-624x468
china0513-624x468
Amazon Echo Dot主板 (来源:iFixit)


整合DSP


根据Hackenberg,这颗SoC的关键就在于整合了DSP,甚至可能是GPU。


「在一个典型的设计中,存在多个输入传感器(主要是麦克风)。整个音频输入首先经DSP高度滤波,使系统快速地理解用户的语音和环境杂讯之间的差异,」他说。


「它甚至能够解读相对于该装置的位置或甚至发话者是谁;它还建立了一种模式,能够经过处理以匹配该模式(通常发送至云端),」他补充说。


但是,GPU做什么呢?


Hackenberg认为,「对于本地智能,GPU可以用于更简单、但快速且高效的本地模式匹配。」


这可以让装置仍然回应所储存的控制模式,例如「降低音量」、「切换频道」或其他简单的控制,而无需网路连接,他解释说。 「接着,应用核心根据所需提供的回应、启动/关闭所需的输入或控制以及必须显示的内容等条件来执行应用程式。」


麦克风阵列


Amazon Echo和Dot之所以吸引人之处在于它使用了7麦克风阵列。Amazon声称,Echo和Dot由于使用了多支麦克风和波束成型技术,因而「能在整个室内都听到你的声音——即使是正在播放音乐的环境下。」该公司还表示,Echo是一款专业级的调音扬声器,能以360°沉浸式音效充满在整个房间中。


根据IHS Markit负责MEMS和传感器的资深分析师Marwan Boustany表示,Echo采用了楼氏电子(Knowles)的MEMS麦克风。


china0513-624x468
Dot采用7支麦克风阵列


Boustany指出,为声音频率提升其讯号杂讯比(SNR)、匹配和性能,将有助于远场音讯获取,同时改善语音辨识。


但最终,「算法才是实现更优质语音辨识的真正关键,」他说,「所谓的『智能』就在于云端可能持续作为关键应用,而本地处理则可以提高对于简单/预定义片语(如Hey Siri等)的辨识能力。」


他以Cypheras为例表示,「这一类的软件供应商将有利于智慧家庭系统(如Alexa)中的语音辨识功能。」

china0513-624x468
Amazon Echo Dot (来源:iFixit)


竞争日益加剧


以供应商来看,目前有几家提供微控制器(MCU)和连接用ASSP的供应商可能在此领域展开竞争,包括Apple、博通(Broadcom)、赛普拉斯(Cypress)、微芯科技(Microchip)、恩智浦(NXP)、瑞萨(Renesas)、意法半导体(STMicroelectronics)以及芯科科技(Silicon Labs)等。Boustany表示,」802.11n与BT 4.0的组合并不常见,但有些设计针对较低成本的解决方案或许将会只用蓝牙。


媒体处理器较为棘手。虽然多家行动装置应用处理器供应商都可提供,但对于简单的应用来说成本太高。根据Hackenberg的观察,供应商们可能会选择不提供性能相当的DSP或模式匹配功能。


「我可能会考虑采用Apple Ax、Broadcom BCM7xxxx、海思(Hisilicon) Hi3xxx、NXP i.MX、联发科MT8xxx、意法STiHxxx、高通(Qualcomm)Snapdragon等。当然,TI或许在成本方面具有最佳DSP支持(对于语音辨识至关重要)的优势,但其他的这几家供应商也在不断地缩小差距中。」


XMOS相信该公司将在这个市场上获得动能。对于诸如Echo这一类的语音助理产品,提高性能的关键在于远场语音获取能力、波束成型与处理速度等。Neil认为,「凭借着大量的处理能力和嵌入式DSP,我们的XMOS单芯片元件提供了可扩展和差异化的解决方案。」


china0513-624x468
XMOS xCore语音接口案例 (来源:XMOS)

china0513-624x468 【关于转载】:转载仅限全文转载并完整保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“半导体行业观察icbank”微信公众号。谢谢合作!

china0513-624x468 【关于投稿】:欢迎半导体精英投稿,一经录用将署名刊登,红包重谢!来稿邮件请在标题标明“投稿”,并在稿件中注明姓名、电话、单位和职务。欢迎添加我的个人微信号MooreRen001或发邮件到 jyzhang@moore.renchina0513-624x468

责任编辑:mooreelite
文章来源于:半导体行业观察    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    如何通过低延迟语音响应改善用户体验和安全性;使用语音命令来控制我们生活中的机器通常能够更加自然(且更快)地与周遭世界进行互动。随着越来越多的小型、低成本消费设备取消按钮,仅提供触摸屏,语言......
    舒服呢。 对于红外设备,还没研究透彻怎么去获取遥控器的红外编码,然后发射出来。这样就可以实现更多的功能。 可以语音控制空调、电视等红外设备。 [智能家居]MQTT 控制 HomeAssistant......
    干燥地区家庭不可缺少的一种小型家电产品。 近几年,离线语音控制技术已经逐步变得成熟,很多厂商都会为加湿器增加语音控制方式,用户通过语音对加湿器就可以进行控制,大大地提高生活便利性。 而加湿器能够实现语音控制,是因为里面置入了语音......
    智能语音落地灯:离线语音控制技术的优势与应用;随着科技的进步和消费者对智能化生活的需求日益增长,智能家居产品逐渐走入了千家万户。其中,智能语音落地灯以其独特的控制方式和出色的实用性,成为......
    电子设备和机器的好处,并回顾如何实现这种控制。我们还将展示这种控制界面现在可以如何能够嵌入到离线设备,以及它们提供的音频控制体验如何能够大幅度改善。 使用语音控制电子设备 采用语音控制......
    相对单一:与智能音箱联动的智能灯相比,智能开关的功能相对较少,主要集中在灯光的开关和调光等基本操作上。 离线语音控制模块: 工作原理:离线语音控制......
    离线语音芯片加入香薰机实现语音控制功能!;冬季供暖后室内空气通常会变得干燥,在这个环境下,部分人可能会出现嘴唇干裂、咽干声嘶,口苦干咳,肌肤干燥,鼻出血等“暖气燥”症状,香薰......
    简单化、节能高效化,智能照明由此应运而生! 智能语音照明和其他的灯一样,只是多了语音控制功能,就是通过说话就能开关关灯或者实现一些其他的功能。 NRK3301智能照明语音芯片方案: 智能照明可以语音控制......
    语音控制在你的指尖:十大免费; 您可以在下一个项目中使用的语音到文本api语音到文本技术,也称为自动语音识别(ASR),是将口语转换为书面文本的技术。这项技术有很多应用,包括语音控制设备、转录......
    语音控制茶吧机模块选型;茶吧机是一款集烧水壶、养生壶、即热饮水机、桶装饮水机、调奶器、煮茶器、泡茶壶、上水壶等于一体的新型多功能生活电器。随着人们生活水平的提高,都追求舒适的体验感,特别......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>