无人驾驶的核心 语音识别控制技术面临的障碍

文章来源:车联社 发布时间:2017-11-30
分享到
智能汽车包括,车联网、车内及车际通讯、智能交通基础设施等要素,融合了传感器、雷达、GPS定位人工智能等技术,使汽车具备感知环境的能力,这样汽车就能够自己判断当前环境下汽车处于安全还是危险等状态。通过这种感知,汽车就会自动规划路线,无人驾驶到达目的地。同时,车内所有的操控都是智能化进行,解放双手。

  智能汽车包括,车联网、车内及车际通讯、智能交通基础设施等要素,融合了传感器、雷达、GPS定位人工智能等技术,使汽车具备感知环境的能力,这样汽车就能够自己判断当前环境下汽车处于安全还是危险等状态。通过这种感知,汽车就会自动规划路线,无人驾驶到达目的地。同时,车内所有的操控都是智能化进行,解放双手。

  最有可能落地的智能——语音识别控制

  智能汽车作为一个集环境感知、规划决策、多等级辅助驾驶等功能于一体的综合系统,已经被各国列为汽车发展的重点。而相比于市场上被炒的大红大紫的自动驾驶技术而言,语音识别控制技术便显得不那么火热了,但语音识别控制技术对智能汽车的发展是至关重要的。

  实现真正的智能有一个前提,那就是人机交流。智能汽车的标志就是解放双手,也就是说不用双手去操控方向盘、功能按钮等,那么怎样让汽车能够正确领会你的意图?让它真正做到“随心所欲”?抛开脑电波这类离量产遥遥无期的技术外,车载语音实现人机交流目前是最有可能落地的。你只需动动嘴,便可以操控整个汽车的所有功能,这就是语音识别所能达到的地步。

  语音识别正在被重塑,成为人机交互的新范式,在过去75年里,每10年就有一次人机交互的重大革新,人类对机器的操作,从物理手柄按键,到物理键盘鼠标,再到触摸屏,而这些变革无疑也会带来我们对汽车新的控制模式,而目前语音识别人工在大数据的训练和学习下,已经可以到达90%的识别成功率,完全能部分替代人工。

  国内语音识别技术发展如火如荼

  目前国内语音识别厂商遍地开花,如科大讯飞、思必驰、云知声等专注语音领域的,搜狗、百度这类互联网公司,甚至做智能硬件的小米也在发展自己的语音识别技术。拿科大讯飞来说,自从科大讯飞的讯飞语音输入法面世以来,其词库和识别率不断提升,而后推出的灵犀语音助手的识别率已经可以达到97%的准确率,也有不少基于科大讯飞SDK开发的智能语音机器人。但是在目前的商业模式和市场环境下,像科大讯飞这样靠提供技术解决方案的方式实现商业价值的企业,在国内并没有那么好的市场前景。对于提供这些技术解决方案的公司,需要下沉到某一个垂直产业,做更上游的事情,才能更好的实现商业价值。所以就出现了各类跨领域的合作,如广汽传祺GS8 ,其搭载的语音识别控制技术就是和科大讯飞共同开发的。

  传祺GS8可以通过语音控制完成地图导航、空调控制、车窗升降、调整座椅、雨刮器启动等多项功能的操作,甚至可以通过说话启动和熄灭发动机。虽然只是一些普通的控制操作,但已经有智能化的影子了。

  语音识别控制技术面临的障碍

  虽然语音识别控制技术已经发展可以应用到汽车上了,但也只能操控简单的功能。目前语音识别技术还有许多需要解决的障碍。

  一:使用场景有限。触觉的人机交互可以随时随地进行,但是语音识别目前在嘈杂的地方却不行,特别是背景音存在其他人的声音的时候,也是无法分辨。比较可喜的是,语音识别目前已经能够记忆用户的声线,未来要做的就是怎样让系统能够在嘈杂的背景下识别特定的声音曲线。

  二:中文识别技术难度高。中文博大精深,不像单词一样有特定的含义,不同的语境,不同的口气,说出来的同一个词,可能并不是一个意思。并且中文的多音字也繁多,更别说几十种各地的方言。当然国内领先的语音识别公司已经可以破译粤语、上海话、四川话等十几种方言,但还远远达不到顾及所有词语含义的地步。

  三:交互模式不成熟。目前市面上搭载的车载语音需要“你好,xx”“嘿,xx”的特定词汇唤醒,需要一定的反应交互时间,并不能像触觉控制那样立即反馈,并且大部分交互的回答语音比较生硬,冷漠,没有情感变化。

  四:误操作几率大。即便语音识别的准确率国内已经可以做到最高97%,但实际使用中还是会产生误操作或者无法识别,并且汽车控制不像手机操作,手机误操作还可以返回,但汽车作为高速行驶的产品,一旦发生误操作,严重时会影响安全。

  总结:语音识别控制技术对于智能汽车有着不可或缺的重要性,一但语音识别技术可以达到精准无误的地步,智能汽车便会迎来高速发展的时期,距量产也就不远了。我们也期待着这一天。

 

收藏
赞一下
0