语音识别技术在汽车上的应用

作者:张 翔 文章来源:东软集团股份有限公司 点击数:1986 发布时间:2014-05-06

苹果和谷歌这两大国际IT巨头的战略表明,在智能手机上广泛应用的语音识别技术很快会在汽车上普及。本文以宝马、本田和福特等几个典型汽车厂商的案例介绍语音识别在汽车上的应用,并展望未来发展趋势。

苹果公司iPhone 4S推出的Siri应用语音识别技术,不但可以通过手机读短信、介绍餐厅或者询问天气,还可以回答问题,与用户聊天。这一产品成功地将语音识别技术商业化,给消费者带来了方便和快乐。不仅如此,目前苹果公司已经联合通用雪佛兰、本田、奔驰和沃尔沃等12家全球主要汽车厂商,开发iOS in the Car系统(见图1)。iOS操作系统安装在车内显示屏上,驾驶者可以把iPhone上的功能投射到车载系统的屏幕上,利用Siri语音控制功能,使用iPhone的导航、电话、信息和音乐播放,并且可以通过智能化操作使用手机上的各种功能。车主们在开车的时候,无需动手,就可以通过呼叫Siri—苹果声控车载智能通信助理。iOS in the Car系统提供了Eyes-Free方式播放音乐、打电话、查询地图和阅读短信等功能。


图1 苹果公司的汽车语音识别系统iOS in the Car

其实在此之前,语音识别技术早已在一些豪华汽车上得以应用,例如2000年宝马汽车就开始应用语音控制技术,操作汽车的电话、导航和收音机等设备。随着技术的进步与普及,如今语音识别功能已经出现在10多万元的国产A级乘用车上,例如2013年中国市场最畅销的福特福克斯轿车上就搭载了SYNC车载多媒体交互系统。

本文仅以宝马、本田和福特等几个汽车厂商的典型案例介绍语音识别技术在汽车上的应用。

宝马汽车的语音控制系统

宝马汽车2000年推出的语音控制系统可以通过多功能方向盘上的专用控制按钮操作(见图2)来识别50余条英语语音指令。

1.打电话

例如拨打电话的过程是,驾驶员说:“Dial phone”,汽车回答:“Please speak number”。然后驾驶员每次读出四位数以下的电话号码,电话号码过长可以分次读出。驾驶员全部确认后,再次说“Dial phone”,汽车语音控制系统就拨出该电话号码。

2.编辑通讯录

驾驶员可以用“Store name”、“Save”、“Delete name”、“Clear name”、“Yes”和“No”等语音命令存储、删除和编辑说出的电话号码。


图2 宝马汽车多功能转向盘的语音控制按钮

3.语音记事本

驾驶员用“Record note”和“End of note”命令,对说出的话进行录音记录,然后保存。用“Play note”或“Read note”读取记事本的录音。

4.导航

调用地图的命令是“Route map”,启用导航的命令是“Navigation”,定义地图比例尺命令的一个例子是“Scale 400 feet”,寻找加油站的命令是“Gas station at current location”,保存当前位置的命令是“Save position”。

5.设备音量控制

驾驶员用“Volume up”或“Volume down”来调节音量。

6.语音帮助系统

例如“Help phone”命令可以让系统朗读出所有与打电话相关的命令,如:Dial number、Dial name、Add name、Delete name、Play phonebook、Clear phonebook和Redial。

本田汽车的语音控制系统

早在2004年9月,搭载车载语音识别导航系统的本田汽车就已在北美市场上市,其中2005年款的Acura RL轿车将语音识别系统作为标准配置, 2005年款的Acura MDX和2005年款的Odyssey轿车将其作为选配。

本田汽车的车载语音识别导航系统内置的嵌入式ViaVoice语音识别软件由IBM公司与本田汽车公司联合开发,它不但具备朗读文字的语音合成能力,还具备自动识别驾驶员说出的包含在北美大陆地图数据库中的所有城市和街道名称的英语语音。本田汽车的命令到控制系统可以理解700多条语音指令,控制汽车上的CD、DVD和空调系统等系统,同时可以识别驾驶员读出的导航系统中的170万个城市和街道的名称,从而解放驾驶员的双手,实现安全驾驶。


图3 SYNC车载多媒体交互系统的用户界面

福特的语音识别系统

1. SYNC车载多媒体交互系统

福特的SYNC车载多媒体交互系统已经有7年的商业化历史。2007年1月,SYNC美国底特律国际车展发布,到2012年SYNC系统已经搭载在14款福特车型和5款林肯车型上。目前全球已有超过500万的汽车正在使用SYNC系统。SYNC已是汽车行业功能最完善和应用最广泛的汽车语音识别系统之一,其用户界面见图3。

SYNC使驾驶者和乘客可以在一个交互式汽车环境下获得便捷和安全的使用,用户只要通过语音就可以发出各种指令,进而获得各种超乎想像的简单控制感受,从而使用户最大限度地降低了传统驾驶过程中那种可能分神而引发危险性的人工控制模式。

SYNC的软件由福特与微软公司共同研发,目前福特已经购买了这个系统的专利权,用户可以终身免费使用。该系统支持语音拨打电话、手机蓝牙播放音乐、语音阅读短信及USB点歌等功能。

2. SYNC的语音识别能力

SYNC最初在北美上市时仅能识别三种语言。通过与美国Nuance公司合作,福特将SYNC可以识别的语言范围扩展到了20多种。面向中国市场推出的SYNC由福特联合微软、Nuance和泰为公司共同开发。

SYNC中文系统在标准中文的基础上,还能够识别各地方言的口音,包括上海、北京、四川、河北和江苏等地的普通话口音,比如北京口音的“儿”话音等。新福克斯可以快速通过语音控制功能,用中文来操作系统,例如拨打电话或者播放音乐。

SYNC目前可以识别1万多条指令,使客户能够更加随意地发布指令,而不会受到通常那种固定语言格式命令要求的限制。用户只需简单地说出他们的指令就可以开始导航,无论他们是在一句话中说出一个完整的地址,还是仅仅搜索兴趣点,SYNC都能够进行精确的解析。例如“帮我查找最近的意大利餐厅”,系统会生成目标搜索结果,而驾驶者只需说“带我去那里”便可直接导航到该目的地。语音调用音乐功能能够快速、便捷地识别各种不同的发音,用户不仅可以搜索音乐名称和艺术家、专辑或播放列表名称,也可以简单地说出他们感兴趣的音乐、体育或新闻节目类型,诸如“爵士乐频道”或“大都会歌剧院电台”,就能选择相应的节目和频道。扩展至SIRIUS旅游链接信息门户的语音命令。借助该功能,用户只需简单的说“我想知道煤气费”或“告诉我NFL分数”,就能获悉诸如体育比赛比分、天气情况、交通状态、燃料价格或电影列表等最新的信息和娱乐内容。

SYNC系统的语音识别控制功能主要分为基本命令(Basic Commands)、打电话(Phone)、调节空调(Climate)、娱乐(Entainment)、导航(Navigation)和SYNC车联网服务(SYNC Service)六大类,其系统构架见图4。


图4 SYNC系统的主要语音识别指令

新一代SYNC AppLink系统的语音控制功能更先进,能够让移动应用程序开发者直接调用汽车音响系统的功能,借助手机端或云端语音识别软件处理指令。用户通过SYNC语音命令来控制汽车,而AppLink则是用来连接汽车和智能手机,只要智能手机上的应用支持AppLink,就可以出现在汽车界面上,用户可通过语音进行控制。无论是谷歌安卓、苹果iOS或其它智能手机系统的用户都可以下载和使用QQ音乐。

在驾驶车辆时,只需简单的语音命令即可进行操作,例如当驾驶者说出“播放本地歌曲”,SYNC系统的语音识别功能就自动为驾驶员播放存在手机里的音乐。相应地,当使用者发出“播放我喜欢”或“随便听听”等命令时,该系统也将自动执行所对应的功能。

2014年1月7日,在美国拉斯维加斯举办的消费电子展览会(CES 2014)上,福特汽车携手中国用户量第三大的互联网公司搜狗,借助搜狗语音助手功能,展示了AppLink2.0的最新功能。搭载福特SYNC AppLink的搜狗语音助手,能够通过车载语音控制设备开启和操控应用中的功能,大幅度提升驾驶体验。用户将搜狗语音助手与福特汽车相连后,可通过方向盘上的语音按钮向搜狗语音助手发出语音命令,比操作手机更加快捷和安全。同时可通车载音响设备及显示屏实现语音拨打电话、发短信、来信播报和快捷回复、查天气及聊天解闷。这也是未来智能汽车的发展趋势。

搜狗语音助手已接入搜狗自主研发的语音识别系统。经过一年多的持续测试和改进,该识别系统准确率已大幅度提升,通过结合福特SYNC AppLink系统先进的车内噪声处理技术,能够在车载环境下将语音识别准确率再次提升,从而大幅度提升汽车用户的使用体验。

新的进展

2014年是车载语音识别技术发生重大进展的一年。1月,谷歌在美国国际消费性电子展览会上,宣布与通用、本田、奥迪和现代共同成立“开放汽车联盟(OOA,Open Automotive Alliance)”,旨在将其开源系统Android应用于汽车领域。3月,苹果公司在日内瓦车展上公布了智能车载系统CarPlay,可以与法拉利、奔驰和沃尔沃的汽车实现联接。紧接着,苹果iOS 7操作系统的更新版iOS 7.1发布,它可以支持链接CarPlay系统。预计搭载谷歌OOA和苹果CarPlay的汽车即将上市。

两大国际IT巨头的战略决策表明,在智能手机上广泛应用的语音识别技术很快会在汽车上普及。它带来的第一个很大的变化是,驾驶员可以使用Google Now和Siri等成熟的语音识别工具,在驾驶过程中实现双手不离开转向盘就可以接听拨打电话、选择收音机频道、播放音乐和调节空调等操作。

结论

目前在中国汽车市场上搭载语音识别系统的车型逐渐增多,典型的系统包括福特汽车的SYNC车载多媒体交互系统、通用别克汽车的Intellilink智能车载交互系统、雷克萨斯汽车的Remote Touch 信息操作系统、上海汽车荣威车联网inkaNet系统中搭载的语音云驾驶iVoka等。新的更加智能的技术也正在不断涌现并推向市场,应用于更多的品牌和车款。

随着技术的进步,预计未来5年内,语音识别功能将会成为在中国市场上10万元左右的乘用车的标准配置。这是提高驾驶安全的有力武器。