ChatGPT的热度仍在持续,尽管从表面上看,它只是一种更加智能的聊天机器人,但毕竟这只是AI表现形式的一种,背后的技术最终能够扩展到哪些领域,能给各个行业带来哪些变化,是业界更为关注的。
随着汽车智能化进程加深,近几年AI技术在汽车上的地位持续提高,包括自动驾驶、智能座舱等都大量用到AI技术。那么ChatGPT的出现,伴随着这一轮新的热潮,智能汽车领域会带来哪些变化?
颠覆座舱语音交互体验?
对于ChatGPT的落地应用,微软给出的答案是搜索引擎,利用对话的方式给搜索引擎带来颠覆性的交互体验。而在汽车上,目前在智能座舱中的一个显著趋势就是在交互上,逐步减少非必要的实体按键,转向使用触摸和语音等形式来对座舱不同功能进行操作。
作为“Chat”功能为主的AI模型,我们很容易能联想到ChatGPT技术被用到语音助手中,其中就包括当前重语音交互的汽车智能座舱。语音交互流程中包含语音识别、自然语言理解/处理、自然语言生成、文字转语音这几项技术,以目前主流厂商推出的产品来看,语音识别的准确率已经可以做到很高,而文字转语音更加是已经被普及到各大短视频平台,视频AI配音都几乎可以实现以假乱真的效果。
但尽管语音助手这一应用已经在智能手机上大规模应用十多年了,但发展似乎陷入一定程度的停滞,很多时候智能手机语音助手能够准确识别出用户的话,但问题是依然无法准确理解用户的大部分指令,无法回答或是作出相应指令。 如今车载语音交互在识别指令方面已经有了一定进步,可以识别连续的语音指令,但本质上,语音助手依然只能识别一些固定的指令组合,而进行相应固定的操作。因此,车载语音助手实际上依然称不上“智能”。
ChatGPT的出现可能将会给智能语音行业带来一定改变,从之前的体验中我们已经认识到ChatGPT的对话能力,不仅能够“理解”用户的对话,还能结合上下文的语境来进行有“逻辑”的交流。尽管由于数据来源的问题可能导致一些内容准确度不高,但在汽车座舱应用中,或许可以结合这类语音模型来大幅提升车载语音交互的用户体验。
目前车载语音的市场主要是科大讯飞和Cerence所主导,但也有很多新势力车企较早布局自研语音,比如小鹏、理想等,采用科大讯飞、思必驰、微软等供应商提供的底层技术,自研出有特色的语音系统。比如小鹏主打的全场景语音,可以同时识别多人指令,并可以分辨出无效语义,实现边说话边提出指令。
如果ChatGPT或是其他有类似产品的公司入局车载语音,则有可能对目前各家语音技术供应商的技术路线,或是整个市场格局,都会产生很大影响。
最近百度的类ChatGPT大模型AI交互项目文心一言,已经有长城、集度、哪吒、爱驰、岚图等车企宣布接入,但最终实际效果还需要产品装车后才能知道了。
自动驾驶能跟ChatGPT有什么关系?
ChatGPT从底层技术上看,是属于NLP自然语言处理领域,但NLP并不局限于文字方面的应用,视觉识别领域中Transformer大模型早已被广泛应用,而Transformer本身就属于NLP领域的一种训练模型。
因此,ChatGPT可能不会直接对自动驾驶产生什么推动作用,而是在人机交互方面会有更大的贡献。但ChatGPT背后的技术路线,可能会推动自动驾驶技术的发展。
在ChatGPT中,与以往的GPT模型不同的是加入了人类反馈强化学习(RLHF)的技术,利用人类提供的内容来判断自己回答质量,从而不断迭代改进。据毫末智行介绍,在自动驾驶领域中,这种技术可以通过不断输入真实人驾接管数据,持续优化自动驾驶决策模型。
毫末智行近期表示将自动驾驶认知大模型正式升级为DriveGPT,未来将在大模型中使用RLHF算法,让模型学习人类驾驶接管的数据。比如在同样的驾驶环境下,如果人类驾驶的动作与算法决策一致,不选择接管,则记为一个good case;如果人类司机接管了,就记为一个bad case。即通过好坏的判断引导自动驾驶算法做出更接近人类的决策。
写在最后
目前从车载应用来看,类ChatGPT的最佳应用场景只有车内语音交互。有业内人士认为,车载语音市场空间并不大,目前几乎垄断该市场的科大讯飞和Cerence在该领域收入实际称不上理想,这种情况下用训练成本极高的ChatGPT似乎有点小材大用。不过百度的文心一言近期已经官宣上车,未来可以期待一下更加智能的语音对话在智能汽车上会带来怎样的体验变化。
相关文章