智能音箱第一人,为何不看好智能音箱?

发布时间:2020-02-12  

缪炜,是中国第一波从事语音识别技术研究的高材生之一。在同学都转行其它领域后,缪炜仍坚持专注语音技术研究,先后在摩托罗拉、夏普和Nuance公司任职。如今,他创办的互问信息科技在智能家电离线语音交互市场坐上了“第一把交椅”。而因足球结缘的缪炜和邓惠忠(前润欣科技副总)有一个共同的梦想:让声音连接一切!

上海互问信息科技有限公司总经理缪炜(左)、副总经理邓惠忠(右)

见证AI语音发展史

缪炜博士是中国语音交互发展的见证者。谈及AI语音发展史,就不得不谈Nuance这家公司,它诞生于上世纪90年代,是早期苹果Siri技术的提供者。2012年Nuance在全球智能语音市场占比接近70%。巅峰时期,Nuance的语音识别可支持全球50种语言,拥有近20亿用户Nuance是业界公认的培养智能语音技术人才的“黄埔军校”,其深厚的技术背景以及进入中国时间较早,为中国语音行业输送了诸多人才,很多国内的语音技术公司几乎都有来自Nuance的人才,当然互问科技也有不少技术骨干来自Nuance。

缪炜回忆称,在2007年以前,在上海从事语音识别研究毕业的学生几乎很难找到和专业对口的工作,因为那个时候全上海几乎没有招聘语音识别研究相关的工作岗位,大部分的同学毕业后基本都转行做其它工作了。但缪炜坚信语音识别是新一代人机交互的未来,于是在2005年毅然选择进入摩托罗拉语音“冷衙门”但这也是当时国内从事语音技术研究最大的团队,事实证明语音交互的未来,在2009年这个团队被Nuance收购后成为了Nuance中国的研发中心。

据《国际电子商情》了解,不久后,Nuance内陆续有同事加盟盛大创新院,后来盛大创新院的语音团队迅速成长为可以与科大讯飞、Nuance等正面竞争的AI语音“雄狮”。

2012年是语音识别技术发展的大拐点,是由“大一统”走向“群雄割据”的关键节点。随着深度学习在语音技术上取得的巨大成功,以及国内创业氛围越来越好,这一年,受盛大公司的影响,很多语音行业的老兵都纷纷出来“另起炉灶”,北京云知声就是在这一年创立的。缪炜则选择了“小智”音箱,后来创办了互问信息科技。

与其他侧重于云端AI语音技术定位不同,互问更专注于产品的本地语音功能,目前互问70%的业务仍聚焦于本地语音技术服务,30%的业务聚焦于在线(云端)语音交互,其离线语音识别芯片(W02x)销量已突破100万片。“我一开始就很关注在端侧智能这条线,这条线最难熬,但只要是自己感兴趣的事情,就一定要把它做到极致!”缪炜坚定地说。

智能音箱第一人,却不看好智能音箱

事实上,缪炜团队是全球第一个做出智能音箱的人!2013年缪炜带领团队加入小智团队后成功开发出了“小智”音箱,第一次把麦克风阵列、远场交互等技术带给了用户,比亚马逊的Echo音箱还要早出半年。

缪炜清楚地记得,智能音箱刚开始被看作一种智能硬件形态而存在,大致等同于智能插座、智能开关等产品。当时,绝大部分代工厂都没代工过这种产品,也不知道怎么生产。“小智”当时选了深圳某代工厂,在“被教育”后,这个代工厂后来成为世界主要智能音箱代工厂之一。2015年,互联网公司通过各种补贴手段大举进入该市场,目的是获得占据家庭入口。然而也就在这一年,缪炜毅然决定放弃音箱这个产品和这条道路。

用缪炜的话说,智能音箱作为智能家电的唯一“中控”和绝对“入口”是个伪命题,他当时就看到了4-5年后智能音箱可能面临的瓶颈——不具备使用刚需,不足以担当如此重任。

智能音箱厂商原本的设想是:聊天对话+中控+音乐+电商多管齐下,培养用户的使用粘性并获得数据,但从三大智能音箱后台使用数据可见,聊天对话的热度仅7天左右,中控使用率仅1-2‰(小米因生态优势可达到1%-2%),电商使用率仅有万分之五。在缪炜看来,智能音箱正在由“中控+电商+娱乐+生活服务”的高端定位沦为诸多消费者口中的“儿童玩具”。

智能音箱的“中控”功能还存在使用场景的限制,在离音箱较远的浴室、卧室、厨房等可能受到网络条件的限制;客厅嘈杂的环境可能会让声音受到干扰;产品的互联互通性也不足。研究显示,64%的用户最看重智能家居的控制功能,之所以购买此类产品,主要是希望用它来控制家中的智能家居设备。而事实上,因中国智能音箱品牌各自为政,不同品牌自建封闭生态,“一台音箱控制所有家电品牌”的想法难成现实。

缪炜预计,至少未来3-5年内都看不到这种生态的达成。他坦言,控制是家庭的强刚需,更好的选择还是离线控制,因为离线控制完全规避了在线的短板,且成本更低更易被客户接受。

做离线语音的王者!

在这种思维的导向下,缪炜带领最初“小智”音箱的团队于2016年10月成立了互问科技,从离线语音识别芯片入手,聚焦智能家电产品的语音交互,以“技术实用”“低成本”的优势迅速打入全球一线家电品牌阵列。

互问科技第一代离线语音识别芯片W02x于2018年中发布,截至目前已出货超过100万颗,占据国内智能家电离线语音市场第一的位置。

据《国际电子商情》了解,为进一步落地离线语音的应用,2019年5月,互问科技又针对这些成本要求更严格的产品推出了LS416,芯片单价更低,完全可以满足终端售价在100元以内的小家电使用。2020年互问还将推出比LS416更具性能价比的语音芯片,同时还将推出带云端连接的语音芯片。

离线语音摆脱了中控的场景限制,可随时随地对就近产品进行唤醒和操控,且互问的离线语音词条已多达100条以上。缪炜给出了一个数据:以一台空调为例,可能有多达81项技能,然而前四项功能(开关机,调模式,温度调节,摆风)占了95%的用户使用率,而后面70多项功能仅占不到5%,语音命令词条个数对控制智能家电绰绰有余。

家电产品70%是离线控制的需求,还有30%是云端控制的需求。以离线为切入点回到云端是互问科技的发展思路。W03(与LS416同时发布)就是互问科技针对离在线语音识别推出的芯片。

因使用成本低、随时随地唤醒、易操作等特性,互问的离线语音芯片(模块)已直接或间接的为国内外多个知名家电和互联网企业服务,如海尔、TCL、苏宁等。尤其是在追求极致细节的日本市场,互问的离线语音技术得到施展拳脚的机会,弥补了日本离线语音技术的空缺。

缪炜强调,智能音箱实现了普及大众语音交互的概念,但却没有达到让用户使用语音的习惯。要完成这个使命,一定要有刚需。这也是为何目前国产智能音箱均采用“补贴”、“低价渗透”的销售策略,在消费者“尝鲜”的非理性消费时期结束之后,开始思考渠道如何下沉,如何增强内容服务的粘性的原因。

借力卖芯片

语音识别的特别之处在于,复制一家公司并不容易。在语音交互热潮高涨之时,很多公司试图分得杯羹,但他们立即发现这并非易事。

从互问科技当前的股本结构来看,电子元器件代理商武汉力源和瑞凡微都是互问的股东,同代理商的绑定可以将互问的产品快速导入市场。“力源是上市公司,力源和瑞凡微都有很强的家电客户群和技术支持团队,跟它们合作,一来可以学到公司的规范化操作,二来可以将产品快速落地商用。”

缪炜表示,力源的家电业务跟互问高度重合,在渠道拓展方面为互问提供了不小的助力,以前互问的销售市场仅局限于华东和华南,而现在借助力源的渠道将芯片业务拓展至西安、成都、武汉等地区,在销售渠道拓展的同时还为公司带来了品牌知名度。

据悉,2017-2018年,互问的市场开拓主要由代理商推动,但在快速获得客户的同时问题也来了——语音识别技术门槛太高,代理商对语音技术支持的能力不足。于是,互问在2019年培养了多家技术方案商,以减轻技术支持的压力。

谈及客户的差异化需求,缪炜感触颇深。根据客户产品定位的差异化,同一颗芯片进入场景化应用的定位也要有所不同,比如有些企业强调制造质量,要求产品的可靠性和质量。有的却强调的是互联网特性,要求产品跟生态的互联互通性。有的则强调以科技为主,要让不同的人都觉得很好用。因此,同样一颗芯片,在不同的客户那里,重心会有所偏移,总之要符合不同企业的价值定位。缪炜笑称这是泥腿子的活,其它厂商可能不愿意撩起裤脚干这活!

众所周知,头部家电客户皆乃兵家必争之地。缪炜表示,目前,离线语音市场竞争并不激烈,但不乏有新进入者,互问正在提高IC设计和算法的门槛,比如将在2020年推出第三代专用本地语音芯片,并全力完善下一代本地语音识别技术,以提高竞争壁垒。

悍将加入,如虎添翼

人才是一个企业的灵魂,特别是高科技行业,“以人为本”已成为半导体芯片设计公司发展的关键所在。2020年1月初,原就职于国内知名电子元器件分销上市公司——润欣科技的邓惠忠先生加入互问科技,为其带来新的助力。

因足球结缘的邓惠忠和缪炜有一个共同的梦想:让中国5亿家庭都养成使用语音的习惯!让声音连接一切!

邓惠忠告诉《国际电子商情》分析师,足球人有两大精神,一是不服输,追不上还得追,必须拼搏到最后一刻;二是团队凝聚力,11个人必须相互配合才能取得最终的胜利。正是这种不服输的足球精神,将二人凝聚在一起,为了实现共同的梦想而努力奋斗。

作为纯正的60后,邓惠忠1986年毕业于中山大学,1999年成为台湾旺宏科技进入大陆的前五位员工,2007加入润欣科技的次年遭遇金融风暴,在团队的共同抗压下度过危机,并推动公司于2015年12月10日成功上市。

20年半导体行业团队管理经验及资源积累,将带给互问科技带来技术团队管理、销售渠道、品牌形象及市场营销策略上的全新蜕变。邓惠忠感同身受的目标:让用户在选择家电时,非语音产品不买!让声音连接一切!!

我们看到,当前正值国产半导体产业发展的黄金时期,在这波风潮的影响下,互问科技定能顺势而为,在专注语音识别技术的道路上走出自己的特色!

互问后记:本篇采访于年前完成,因恰逢春节一直未发表。随着春节前后疫情越来越厉害,全体互问人更加觉得语音交互可以减少人们需要在家手动操作各类开关、遥控器的不便,真正享受让声音来连接一切!而希望成为智慧“声”活倡导者和语音交互技术领导者的互问科技正乘风破浪,响应政府号召,居家协同办公,希望按照原计划推出更加优秀的产品,为居家隔离人员服务,共同抗击疫情,推动语音交互市场的春天早日到来!

文章来源于:国际电子商情    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    面在4月推出新品大屏音箱CC10丰富了产品矩阵,通过智能音箱大屏化加强其在教育和购物场景上的布局;另一方面阿里加速完善带屏音箱的内容服务,提升用户体验,增强用户粘性。 百度继续延续其在带屏音箱......
    万台,同比下降28.9%,未税平均单价为184元人民币,同比增长21%,高于带屏智能音箱市场9%的平均单价涨幅。无屏智能音箱市场均价快速上涨主要受两点因素推动。一方面,厂商补贴收窄导致入门级无屏音箱......
    亚马逊今年最重磅发布会:生成式AI加持Alexa助手、新款音响、平板、路由等硬件;美东时间就9月20日周三,举行今年最重磅的新品发布会,得到生成式人工智能()功能加持的语音助手、新款音箱Echo......
    什么是甲类功放和乙类功放 甲类功放和甲乙类功放哪个好;什么是甲类功放和乙类功放 甲类功放和乙类功放是两种常见的功率放大器类别。 甲类功放(Class A Amplifier)是一种功率放大器,其工......
    测到异常情况时自动触发保护机制,例如过流保护、短路保护等。如果音箱正负极接反会导致异常电路状态,可能触发保护机制,进而停止功放机的工作。   损坏设备:尽管现代功放机通常具有保护机制来防止损坏,但如......
    现在的智能语音芯片已经开始集成AI专核了;不过随着边缘算力需求提升,智能语音芯片算力加强本身也是这两年智能家居、智能音箱发展的趋势。比如面向智能音箱的主SoC中,CPU部分......
    与主控芯片相匹配,从1.6-3.6V,到目前的1.05-2.0V。在功耗方面也从1.8V的 16μJ/Mb降低至6.5μJ/Mb。 超低功耗、超低电压的NOR Flash非常适合智能音箱智能穿戴、耳机......
    单片机和嵌入式哪个好?单片机会被嵌入式取代吗?;很多初学者都搞不清楚单片机和嵌入式的区别。 今天就和大家来聊一聊这个话题。 嵌入式和单片机,我喜欢用老爸和儿子的关系来区分它们。 嵌入......
    阻抗相同,那么功率大小就不是第一位,哪个功率大点就无所谓了,只是在使用的时候不要把声音开很大就可。   一般在1倍以内都是可以接受的,而音箱大一倍也是能正常工作的,只不过是要比带正常音箱的音量稍微轻些,但是仅用耳朵是听不出的。 ......
    针可以通过前面板香蕉头或后面板排线接口连接到源表上。 2、 吉时利源表为何能被应用于四探针法呢? 吉时利源表智能触屏界面提供I-V示图功能 很多工程师都选吉时利公司开发的高精度源表,源于......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>