自从技术出现以来,对技术的道德恐慌就一直是人类体验的一部分。而人类科技所带来的信息共享,正有逐步让人类打消对隐私的顾虑,习惯透明化生存,以及将人体作为物联网终端一部分的趋势。
数据研究者称 2020 年,语音交互将占据 50% 的搜索入口。Amazon Alexa和Google助手等语音助手,AIOT, 车载助理,智能音箱... 在目前人类科技树上,“语音交互” (Voice interaction) 已然成为必点技能之一。然而在各种场景下,人们尝试通过“自然语言”重新与冰冷的机器对话,但往往效果不及预期。
语音识别技术大概经历过三个阶段,从匹配声纹和声波到下达命令,面临很难进行统一地语法规律,识别的错误率很高的挑战,一直到依托于算力和大数据,通过神经网络来建立更复杂的这种语音识别模型。
VUI(Voice User Interface,语音用户界面)正是在第三阶段快速发展的新领域。VUI对用户体验提出了更多关于语言学、情感塑造、逻辑搭建等方面的新要求。
语音技术,越来越多地用于智能家居控制、楼宇自动化、智能零售、联接的汽车、医疗等物联网垂直领域。而语音识别和自然语言处理技术是VUI的基础。
“千箱大战”退潮,智能语音交互持续进化
人类传统的交互单一通道有眼(视觉系统)、耳(听觉系统)、口(味觉系统)、鼻(嗅觉系统)、手(触觉系统)等器官,在这些通道彼此融合后,人机交互技术正从键盘鼠标变成了触屏,又转变成现在的语音视觉等多模态交互。具体表现为从“手指”优先,发展为“语音”优先。语音交互技术兼顾老人、儿童以及方言人士让语音对话体验越来越好。语音与视觉,触屏,LCD反馈显示结合的交互体验,令交互门槛的不断降低。
VUI是用户通过语音或者语音平台与计算机进行人机交互,来启动自动化服务或流程。VUI设计,即用户与语音应用系统的交互设计。VUI是直接面向用户的界面,所以是否能满足用户需求是系统成功与否的决定性因素之一。
VUI各种场景下对声音信息的收集带来了便利,个性化推送、定制服务都不再高端,逐渐平民化,提高了社会运行效率,降低时间与商家的营销成本。
VUI将成为私人助理
一个行业,如果有爆发式的增长,一定是打中了被压制的需求。声音的价值在于便利性和情境性或者情感性,VUI正是戳中了别的交互技术所不能达到的情境性。
Siri淑女、微软小冰的童真可爱、小爱同学的青春靓丽,商家主动打造VUI虚拟角色、树立不同人格特质供用户选择。
VUI技术的发展将更容易为人们提供量身定制的数字体验,它不但能成为人们的私人助理,了解人的需求,还能超前预测需求。它能涉及到你生活的方方面面,甚至是你想象不到的领域。
声音承载的信息特性是能包含更多感情信息。因为需要稳定易理解的文字信息所以更需要语音识别,只是强调语音清晰还不够用。但其实无论是Siri还是微软小冰,语音呈现模仿人类的语言情感仍不算非常理想,“机器味儿”重。
VUI 的设计趋势
衡量语音交互的质量也不再局限于识别的准确率,而是更侧重垂直场景下的语义理解,以及后端的内容服务。
+
让智能语音交互实现“真”智能
未来的语音交互终端需要理解“千人千面”,即使对面是一台机器,它不仅懂你声音的语义,也懂你的情感和诉求。
声音承载的信息本身,信息密度不高,而且人类主要依赖视觉信息。声音信息(生物特征识别)本身的价值,比较有限,应用也很有限。说话声音的粗细音调高低语言习惯,这些在刑侦领域、安防技术领域有应用。无障碍设计,创建可用不同方式呈现的内容(例如简单的布局),而不会丢失信息或结构。
追求的一种自然、亲切的交互方式,使产品“带有情感和温度的交互体验”,真正的从用户角度出发。
+
消除使用者的认知负荷
声音信息的价值被注意到,但是如何利用和维护是个问题。
一方面,目前缺乏监管、缺乏法律对于声音信息收集的约束(其实对于隐私收集,全世界范围内都缺乏成熟的法律法规),导致声音信息收集被滥用。另一方面,一些打着科技让生活更美好的幌子的企业们干起了用户信息灰色交易、大数据杀熟等等勾当。
19年南京建环给环卫工配发智能手环
更敏感的,是公权力对于声音信息的收集是否对于公民权利构成侵犯。对于公权力法无授权地侵犯,法律似乎没有明确这方面的界限。
消除使用者的认知负荷,是VUI技术持续发展亟待解决的问题。
协同图形用户界面(GUI)
语音、视觉、触控加上反馈的融合是未来的方向。建立GUI+VUI协作机制,可打造更多智慧体验。
GUI的内容主要为图形和文字;VUI的内容主要为文字。人们主要通过点击和手势的方式与GUI进行交互,人们通过对话的方式与VUI进行交互。VUI要给出正确的响应事件必须要先理解人类在说什么,更重要的是在想什么。
例如Siri、Google Assistant、Cortana、Bixby,以及Alexa屏幕版。在GUI的基础上增加VUI有助于简化整个导航的交互,可以做到无直接关系页面的跳转,例如以命令的形式导航去其他应用的某个页面。在VUI的基础上增加GUI可以使选择、确认等操作得以简化,尤其是用Alexa进行购物时。
智能语音是未来最重要的交互入口,但目前语音交互仍没有成为主流的人机交互手段。除了技术上人工智能还未特别“智能”,还有一部分来源于人们的认知负荷。
自从技术出现以来,对技术的道德恐慌就一直是人类体验的一部分。
人类科技所带来的信息共享,正有逐步让人类打消对隐私的顾虑,习惯透明化生存,以及将人体作为物联网终端一部分的趋势。
更多精彩
电动汽车电池剩余电量不准惹的祸 里程焦虑如何拯救?
【典型新旧造车势力大盘点】彩虹总现风雨后 当把新桃换旧符
自动驾驶方案的安全风险及化解之道
优化衬底助推第三代半导体实现汽车创新
相关文章