CN104332159B

CN104332159B - 一种车载语音操作***人机互动方法及装置

Info

Publication number: CN104332159B
Application number: CN201410595192.5A
Authority: CN
Inventors: 黄修源
Original assignee: Shanghai Xiuyuan Network Technology Co ltd
Current assignee: Shanghai Xiuyuan Network Technology Co ltd
Priority date: 2014-10-30
Filing date: 2014-10-30
Publication date: 2017-05-10
Anticipated expiration: 2034-10-30
Also published as: CN104332159A

Abstract

本发明公开了一种车载语音操作***人机互动方法及装置，多个麦克风对采集到的声音进行过滤，分离出不同人说话的声音，首先将背景音或噪音分离开，仅收集来自用户的语音，同时将接收到的语音转化成文本数据，语音云服务器对该文本数据进行识别，若成功识别为可执行命令，则***将执行此命令，若不能识别此命令，则忽略。整个过程中，并不需要人为开启***，不需要在发出语音命令前做任何物理操作启动语音操作***。本发明能够实时收集用户语音指令，智能甄别来自用户的可能的操作指令，忽略非操作指令，更加精确的发现、分析、处理指令，除驾驶人以外，其他车内乘客也能通过语音控制车辆相关的软件、硬件操作。

Description

一种车载语音操作***人机互动方法及装置

技术领域

本发明涉及一种车载语音操作***人机互动方法及装置。

背景技术

随着中国经济的高速发展，越来越多的家庭和个人拥有汽车。汽车的普及不仅促进了汽车行业的发展，也促进了汽车相关技术及汽车用户体验相关技术的更新迭代。

汽车操作***作为汽车的大脑，相关技术也在不断进步，但市场上的车辆操作***却一直没有足够颠覆的用户体验，最大的原因是用户需要进行诸多手动操作，而在用户驾车时手动操作需要用户转移注意力和时间，这对用户来说不仅不够便捷，对于驾车这种特别需要用户专注的行为来说有时候将是致命的。

语音识别、控制技术的不断成熟，其被更广泛的应用到各个领域，也有更多的汽车的智能操作***开始使用语音识别与控制技术。然而现行的语音识别、控制技术应用到操作***中仍有一些问题需要解决。

首先，当前所有的语音操作***都需要用户提前开启语音程序，若操作***当前不在语音程序所在的界面时，或者用户驾车不方便手动开启语音程序时，用户不能顺畅的使用语音***。

其次，当前的车辆语音操作***的声音收集装置多位于车辆中控面板，虽然靠近驾驶人，但对汽车内其他座位的乘客来说，因为距离的原因则有可能产生识别不精确、识别错误等，不利于驾驶人以外的用户通过语音控制操作。

再次，当前的车辆语音操作***大多只能通过语音做简单的部分操作，且集中在通讯、导航等方面，很多操作还是需要用户手动完成，尤其是车辆硬件操作部分。

最后，当前的车辆语音操作***在识别用户命令上不够精确，用户必须按照预先设定好的语音命令规则发出命令，或者可以按照个人习惯发出命令，但因为数据的存储、分析能力有限，用户的一些语音命令不能被识别。

发明内容

本发明所要解决的技术问题是，针对上述现有技术的不足，提供一种车载语音操作***人机互动方法及装置。

为解决上述技术问题，本发明所采用的技术方案是：一种车载语音操作***人机互动方法，包括以下步骤：

1）在车辆内安装多个监听设备；

2）上述多个监听设备对采集到的声音进行过滤，分离出不同音源的声音，并保存来自用户的声音；

3）监听设备将用户的声音发送给车辆操作***上的语音控件；

4）语音控件内的语音处理模块将接收到的语音数据转化为文本数据，并将所述文本数据发送给语音云服务器；

5）上述文本数据进入语音云服务器的缓存区，若所述文本数据命中缓存区已储存的历史语音命令数据，则语音云服务器将所述历史命令数据所载的执行命令发送给车辆操作***上的语音控件，并进入步骤8）；若所述文本数据与缓存区数据不匹配，则进入步骤6）；

6）所述文本数据进入语音云服务器的数据分析区，数据分析区预设编码器、语句数据库与属性分类区，编码器将文本数据编码为数据分析区可识别的编码数据，然后将编码数据按照数据识别规则进行识别，识别后的数据若未命中语句数据库，则语音云服务器得到该命令不是一个语音命令的结果，语音云服务器自动忽略该数据；若命中语句数据库，则语音云服务器认为该数据是一个语音命令，并将此数据发送给属性分类区，属性分类区再次按照数据识别规则识别该命令，并生成一个可执行命令；

7）语音云服务器将属性分类区生成的可执行命令数据发送给车辆操作***上的语音控件，同时，将此可执行命令数据写入缓存区作为历史语音命令数据；

8）语音控件的语音执行模块将所述可执行命令数据发送给车辆网关或车辆操作***上，车辆网关或车辆操作***执行所述可执行的命令。

车辆网关或车辆操作***执行所述可执行的命令后，还包括以下步骤：

9）若需要用户的进一步指令才能够执行所述可执行的命令后，则车辆操作***启动语音询问模块，语音询问模块根据预设的相关语音指令向用户发出询问；

10）用户回答上述询问；

11）重复执行上述步骤1）～步骤10）。

12）若命令被执行仍需要用户的进一步指令，则重复上述步骤1）～步骤11），直到命令被执行完成。

本发明还提供了一种车载语音操作***人机互动装置，包括：

多个监听模块，用于对采集到的声音进行过滤，分离出不同音源的声音，并保存来自用户的声音，将用户的声音发送给车辆操作***上的语音控件；

语音控件，包括语音处理模块和语音执行模块，所述语音处理模块用于将接收到的语音数据转化为文本数据，并将所述文本数据发送给语音云服务器；语音执行模块用于将语音云服务器发送的可执行命令数据发送给车辆网关或车辆操作***上；

语音云服务器，包括缓存区和数据分析区，所述缓存区用于存储用户历史语音命令数据，并判断所述文本数据与缓存区用户历史语音命令数据是否相匹配，若匹配，则将所述文本数据发送给车辆操作***上的语音控件；若不匹配，则将该文本数据发送给数据分析区；所述数据分析区包括编码器、语句数据库与属性分类区，编码器用于将文本数据编码为数据分析区可识别的编码数据，然后将编码数据按照数据识别规则进行识别，识别后的数据若未命中语句数据库，则得到该命令不是一个语音命令的结果，自动忽略该结果，结束对该命令的处理；若命中语句数据库，则认为该数据是一个语音命令，并将此数据发送给所述属性分类区，属性分类区再次按照数据识别规则识别该命令，并生成一个可执行命令。

与现有技术相比，本发明所具有的有益效果为：通过本发明的方法，用户可以通过分散在车辆各个部位的麦克风监听设备，在车辆的任何一个位置、任何一个时间向汽车发出语音指令，不需要提前启动语音程序，用户可以根据自己的说话习惯向车辆发出语音指令，对车辆各个部件（如空调、车门、座椅、灯光）及与车辆相连接的任何设备、程序（如通讯、导航、音乐、日历、闹钟）发出语音指令，云数据库通过特殊识别、学习规则及不断更新的海量数据库，更加精确地识别用户指令，有利于驾驶人以外的用户通过语音控制操作，能自动完成车辆相关软硬件操作。

具体实施方式

本发明具体实现过程如下：

第一：监听设备数量为4个，其中两个监听设备分别安装在中控车机左右两侧，另外两个监听设备分别安装在车辆后排中央扶手箱左右两侧。

第二：上述多个监听设备对采集到的声音进行过滤，分离出不同音源的声音，并保存来自用户的声音；

第三：监听设备将用户的声音发送给车辆操作***上的语音控件；

第四：语音控件内的语音处理模块将接收到的语音数据转化为文本数据，并将所述文本数据发送给语音云服务器；

第五：上述文本数据进入语音云服务器的缓存区，若所述文本数据命中缓存区已储存的历史语音命令数据，则语音云服务器将所述历史命令数据所载的执行命令发送给车辆操作***上的语音控件，并进入步骤8）；若所述文本数据与缓存区数据不匹配，则进入步骤六；

第六：所述文本数据进入语音云服务器的数据分析区，数据分析区预设编码器、语句数据库与属性分类区，编码器将文本数据编码为数据分析区可识别的编码数据，然后将编码数据按照数据识别规则进行识别，识别后的数据若未命中语句数据库，则语音云服务器得到该命令不是一个语音命令的结果，语音云服务器自动忽略该数据；若命中语句数据库，则语音云服务器认为该数据是一个语音命令，并将此数据发送给属性分类区，属性分类区再次按照数据识别规则识别该命令，并生成一个可执行命令；

数据识别规则如下：

1、对编码数据进行分词；

2、对分词后的编码数据进行容错，服务器预设容错数据库，编码器根据容错数据库将错误词汇替换成正确词汇；

3、过滤无效词汇，判断过滤后的数据与语句数据库标准语句的匹配程度，如果找到与语句数据库标准语句匹配的数据，则将匹配的数据格式化为标准语句数据并跳转到步骤5），如果找不到则跳转至步骤4）；

4、使用贝叶斯网络判断过滤后的数据所属的分类，得到分类结果后，将过滤后的数据格式化为标准语句数据；

5、编码器将标准语句数据发送给属性分类区，属性分类区对所述标准语句数据按照步骤1）～步骤4）的规则进行再次识别后生成可执行命令数据。

第七：语音云服务器将属性分类区生成的可执行命令数据发送给车辆操作***上的语音控件，同时，将此可执行命令数据写入缓存区作为历史语音命令数据；

第八：语音控件的语音执行模块将所述可执行命令数据发送给车辆网关或车辆操作***上，车辆网关或车辆操作***执行所述可执行的命令。

第九：若需要用户的进一步指令才能够执行所述可执行的命令后，则车辆操作***启动语音询问模块，语音询问模块根据预设的相关语音指令向用户发出询问；

第十：用户回答上述询问；

第十一：重复执行上述步骤1）～步骤10）。

第十二：若命令被执行仍需要用户的进一步指令，则重复上述步骤1）～步骤11），直到命令被执行完成。

整个过程中，并不需要人为开启***，不需要在发出语音命令前做任何物理操作启动语音操作***。

Claims

1.一种车载语音操作***人机互动方法，其特征在于，包括以下步骤：

1）在车辆内安装多个监听设备；

3）监听设备将用户的声音发送给车辆操作***上的语音控件；

5）上述文本数据进入语音云服务器的缓存区，若所述文本数据命中缓存区已储存的历史语音命令数据，则语音云服务器将所述历史语音命令数据所载的执行命令发送给车辆操作***上的语音控件，并进入步骤8）；若所述文本数据与缓存区数据不匹配，则进入步骤6）；

6）所述文本数据进入语音云服务器的数据分析区，数据分析区预设编码器、语句数据库与属性分类区，编码器将文本数据编码为数据分析区可识别的编码数据，然后将编码数据按照数据识别规则进行识别，识别后的数据若未命中语句数据库，则语音云服务器得到该命令不是一个语音命令的结果，语音云服务器自动忽略该数据；若命中语句数据库，则语音云服务器认为该数据是一个语音命令，并将此编码数据发送给属性分类区，属性分类区再次按照数据识别规则识别该命令，并生成一个执行命令；

8）语音控件的语音执行模块将所述执行命令数据发送给车辆网关或车辆操作***上，车辆网关或车辆操作***执行所述执行命令。

2.根据权利要求1所述的车载语音操作***人机互动方法，其特征在于，车辆网关或车辆操作***执行所述执行命令后，还包括以下步骤：

10）用户回答上述询问；

11）重复执行上述步骤1）～步骤10）；

3.根据权利要求2所述的车载语音操作***人机互动方法，其特征在于，所述监听设备为麦克风。

4.根据权利要求3所述的车载语音操作***人机互动方法，其特征在于，所述数据识别规则如下：

1）对编码数据进行分词；

2）对分词后的编码数据进行容错，服务器预设容错数据库，编码器根据容错数据库将错误词汇替换成正确词汇；

3）过滤无效词汇，判断过滤后的数据与语句数据库标准语句的匹配程度，如果找到与语句数据库标准语句匹配的数据，则将匹配的数据格式化为标准语句数据并跳转到步骤5），如果找不到则跳转至步骤4）；

4）使用贝叶斯网络判断过滤后的数据所属的分类，得到分类结果后，将过滤后的数据格式化为标准语句数据；

5）编码器将标准语句数据发送给属性分类区，属性分类区对所述标准语句数据按照步骤1）～步骤4）的规则进行再次识别后生成可执行命令数据。

5.一种车载语音操作***人机互动装置，其特征在于，包括：

语音控件，包括语音处理模块和语音执行模块，所述语音处理模块用于将接收到的语音数据转化为文本数据，并将所述文本数据发送给语音云服务器；语音执行模块用于将语音云服务器发送的执行命令数据发送给车辆网关或车辆操作***上；

语音云服务器，包括缓存区和数据分析区，所述缓存区用于存储用户历史语音命令数据，并判断所述文本数据与缓存区用户历史语音命令数据是否相匹配，若匹配，则将所述文本数据发送给车辆操作***上的语音控件；若不匹配，则将该文本数据发送给数据分析区；所述数据分析区包括编码器、语句数据库与属性分类区，编码器用于将文本数据编码为数据分析区可识别的编码数据，然后将编码数据按照数据识别规则进行识别，识别后的数据若未命中语句数据库，则得到该命令不是一个语音命令的结果，自动忽略该结果，结束对该命令的处理；若命中语句数据库，则认为该数据是一个语音命令，并将此数据发送给所述属性分类区，属性分类区再次按照数据识别规则识别该命令，并生成一个执行命令。