近日,2016国际车联网与智慧交通展览会(MMC 2016)在上海开展。与车联网、新能源汽车、智能电单车、智慧出行平台等相关的100余家厂商齐聚新国际博览中心,共同探讨“智慧出行,互联生活”。
首日下午,一场主题为“汽车声控与声活”的论坛上,国内几家比较知名的语音交互方案提供商分别发表了演讲并进行了讨论。记者摘取部分嘉宾发言精要:
云知声陈吉胜:理解人并执行是关键
语音在车内处于系统级交互的地位,需要系统级思考与设计:从概念入手,设计UI/UX,然后进行系统集成,最后是市场推广。其中交互设计要把握以下原则:
简单:体验要一致,符合人的心智,简单易懂。
有用:只显示司机关心的,可协助做决定,但解决权在司机本身;能引导司机进行纠错。
有效:对深度用户更有效率。
安全:只有在紧急情况下才会打断司机,同时解放了手和眼睛。
因为车载环境复杂,噪音干扰,因此需要多麦克风阵列,确保语音正确识别;通过声纹传递个性化生物信息(识别男、女、老、幼),让深度用户更“有效”达到目的。
云知声力推的“语用计算”,其实就是理解人的意图
车载安全是出行最重要的保障,需要尽一切可能实现快捷语音操作:避免炫技式的多轮对话以及反复纠正;同时要推行特定场合免唤醒操作。
语用计算,返回真正有用的信息,而不仅仅是语义,能传递话外之音:不仅能识别,还能理解,之后还能给出行动方案。
凯立德导航刘志坚:语音与高精度地图结合
自动驾驶三要素:感知、地图与驾驶策略——地图与驾驶策略均依赖感知、需要更新,二者相互匹配,相互促进。
除了依靠图像识别之外,地图在进行车道识别和提供可行驶路径上起到了重要的作用。在现阶段,语音交互是发挥智能汽车驾驶策略的最常用方式,语音交互指令集当中肯定要涉及到地图、导航命令的解析和学习;而在未来半自动驾驶场景中,更是需要快速精准的语音识别和车道级导航来保证驾驶安全。
高精度地图应用中涉及的各类语音交互有:定位、显示、路径规划与诱导,还有辅助驾驶。
理解需要高精度与高速度
高精度自然语义理解:
对多重语义的理解:比如去广州南站我想走沿江高速,去机场不走高架等;更精准的语音交互反馈;符合高精定位的快速反应以及超视距、更精准的预言能力。
未来智能网联汽车,高精度地图和智能语音交互是两个相对核心的因子。
安吉星(Onstar)朱佳明:富于情感的语音交互
车内声音交互包括语音提醒、语音输入、语音操控、音效、音乐、语音通话、操作反馈、电台等。
车内声音交互的用户体验价值进阶:安全(解放双手、避免实现分散)——便利(提高效率、减少学习、及时反馈)——乐趣(情感化互动、精神享受)。
声音在车联网产品中的核心交互方式:任务节点与声音交互方式相互匹配。
针对性交互方式的选择
管家式的情感化场景服务体验:
能基于动态场景及用户数据提供个性化服务、信息推送;使用情感化语言与司机互动;无处不在的贴心语音提醒让体验直达内心。
思必驰龙梦竹:极致体验与算法为王
她认为目前用户的痛点是:对口语交互很渴望,但是驾车环境下有很多噪音干扰,同时符合场景的内容很少。
目前为了提供更极致的体验,可以将地图导航、社交、音乐曲库、电台、信息搜索和O2O服务结合起来。更多的细节优化:
音乐电台的语音操控唤醒、导航支持所有地图资源的对接、合成音的切换(自定义声音)、路况查询、跨领域打断(导航、音乐、微信、电话等功能直接自由切换)交互体验的升级、自定义唤醒词(不再是系统自定的唯一,比如:Hey,Siri)。
技术上解决用户痛点
目前的语音交互都是从单一模态到多模态(多种交互方式结合)的转变、从被动交互到主动交互(机器主动与人交互)的转变。
她认为以往比拼识别的正确率没有意义,因为用户很难分辨出来。她表示,目前大数据很重要,但是更加重要的是算法的优劣。
数据揭示整个市场的前景
会上,Strategy Analytics全球汽车行业高级分析师李建宇指出,车载语音技术实际应用目前还没有很高的市场占有率。
2015年,世界范围内带有相关车联网嵌入模组的乘用车占比13%左右,2020年将达到44%;而在中国,2020年将有3200万左右的乘用车被售出,其中带有相关远程控制模组和语音识别模组的车辆将占50%左右。未来这个市场非常巨大。
目前,声控技术在车载系统中的应用已经成为车联网重要的组成部分,语音交互逐渐在替代传统手动控制,成为智慧行车的显著特征之一。厂商们需要在安全的基础上,不断提升用户体验,让“声活”成为现实。