CN106205613A

CN106205613A - 一种导航语音识别方法及***

Info

Publication number: CN106205613A
Application number: CN201610587485.8A
Authority: CN
Inventors: 梁国锋
Original assignee: SHENZHEN WISDOM TECHNOLOGY Co Ltd
Current assignee: Guangzhou Maitu Information Technology Co ltd
Priority date: 2016-07-22
Filing date: 2016-07-22
Publication date: 2016-12-07
Anticipated expiration: 2036-07-22
Also published as: CN106205613B

Abstract

本发明提供了一种导航语音识别方法及***，所述导航语音识别方法包括以下步骤：将客户端收到的语音信息通过语音引擎进行语音识别；对语音识别的结果根据识别地域检索后台数据库，如果存在对应数据记录，则将识别结果返回到客户端；如不存在对应数据记录，则从本地数据库中寻找预设地域范围内的、与识别结果相似度大于预设值的数据，如果存在相似度大于预设值的结果，则将相似度大于预设值的结果按照使用频率降序推荐给用户；如果在本地没有相似度大于预设值的结果，则将其返回至后台服务器数据库中，根据相似度降序排序所有记录，返回至客户端。本发明的技术方案能根据识别结果推荐更接近用户输入的结果，减少搜寻时间。

Description

一种导航语音识别方法及***

技术领域

本发明属于语音识别技术领域，尤其涉及一种导航语音识别方法及***。

背景技术

语音识别技术是近十年来信息技术领域十大重要的科技发展技术之一，主要应用于语音拨号、语音导航、室内设备控制、语音搜索、听写数据录入等。语音识别技术一般包括声学模型和语言模型，声学模型负责完成语音到音素的转换，其中所述语音如英语中的音标和中文中的拼音的声韵母；语言模型负责完成音素到文本的转换，两者配合完成语音到文本的识别过程。

现有技术中一般有三种语音识别技术：第一种是基于云端识别引擎的语音识别技术，第二种是基于本地语音识别引擎的语音识别技术，第三种是同时基于本地语音识别引擎和云端识别引擎的语音识别技术。而不管采用上述任意一种语言识别技术，由于语音识别过程是智能的，会出现同音不同字的情况，因此就会出现多个识别结果。当存在多个识别结果时，对识别结果进行排序显得尤为重要。现有技术中一般是将识别结果按照相似度由高到低排序的识别结果返回给用户。另外，现有的语音识别引擎识别率低，正常环境下大部分识别结果与期望结果相差较大。再者，同时按照相似度由高到低排序的识别结果返回给用户，会使得发音不标准的用户每次都需要花大量的时间去寻找所需识别结果。

发明内容

针对以上技术问题，本发明公开了一种导航语音识别方法及***，通过特定识别地域及语音引擎识别结果分析，并获取更接近输入语音的结果。

对此，本发明采用的技术方案为：

一种导航语音识别方法，其包括以下步骤：

步骤S1：将客户端收到的语音信息通过语音引擎进行语音识别；

步骤S2：对步骤S1语音识别的结果根据识别地域检索后台数据库，如果存在对应数据记录，则将识别结果返回到客户端，识别完成；

如果不存在对应数据记录，则从本地数据库中寻找预设地域范围内的、与识别结果相似度大于预设值的数据，如果存在相似度大于预设值的的结果，则将该相似度大于预设值的数据按照使用频率降序排序推荐给用户；如果在本地数据库中没有相似度大于预设值的数据，则将该识别结果返回至后台服务器数据库中，后台服务器计算出后台服务器数据库中所有记录与识别结果的相似度，根据相似度降序排序所有记录，并将排序结果返回至客户端；其中，所述相近似的数据是指大于预设相似度的数据；

如后台服务器数据库中也没有大于预设相似度的数据，则本次语音识别错误，并反馈给客户端。

其中，本地数据库是指设备自带的存储数据库。

采用此技术方案，通过多种途径实现对语音识别的辨认，并结合特定识别地域获取更接近输入语音的结果，减少搜寻时间。

作为本发明的进一步改进，步骤S2中，首选对步骤S1语音识别的结果进行判断，是否为有效结果，然后进行检索。采用此技术方案，首先对识别结果进行初步分析，看是否为有效结果，如果不是，则不再进行下一步的检索，使结果反馈更快，节约不必要的时间浪费。

作为本发明的进一步改进，步骤S2中，如果存在相似度大于预设值的结果，则将其按照使用频率降序排序推荐给用户，并获取用户当前位置信息，根据地域范围筛选数据，反馈至客户端。采用此技术方案，结合用户当前位置信息进行分析，使得识别分析的结果更加准确。

作为本发明的进一步改进，步骤S2中，如果在本地数据库中没有相近似的结果，则将该识别结果返回至后台服务器数据库中，服务器计算出后台服务器数据库中所有记录与识别结果的相似度，根据相似度降序排序所有记录，并将排序结果返回至客户端，并获取用户当前位置信息，根据地域范围筛选数据，反馈至客户端。

作为本发明的进一步改进，步骤S2中，如后台服务器数据库中也没有大于预设相似度的数据，则本次语音识别错误，并反馈给客户端，同时告知用户重新输入语音信息或者加入限定词或者扩展词。

作为本发明的进一步改进，步骤S2中，所述预设相似度不小于50%。

本发明还公开了一种语音识别***，所述语音识别***包括语音接收模块、语音识别模块、本地数据库、通讯模块、后台服务器和发送模块；其中，所述语音接收模块，用于接收客户端发送的语音信息；所述语音识别模块，用于将语音信息根据识别地域检索后台服务器数据库查找对应数据记录，或从本地数据库中寻找预设地域范围内的、与识别结果相近似的数据；所述通讯模块，用于与后台服务器连接，则将该识别结果返回至后台服务器数据库中；所述后台服务器，用于计算出后台服务器数据库中所有记录与识别结果的相似度，根据相似度降序排序所有记录；发送模块，用于将排序结果返回至客户端。

与现有技术相比，本发明的有益效果为：

采用本发明的技术方案，通过特定识别地域及语音引擎识别结果分析，并获取更接近输入语音的结果，减少搜寻时间，使用更加方便。本发明的技术方案可以应用在各个需要语音识别的平台上，尤其是智能终端。

附图说明

图1是本发明一种实施例的流程图。

具体实施方式

下面结合附图，对本发明的较优的实施例作进一步的详细说明。

一种导航语音识别方法，如图1所示，首先使用第三方语音引擎获得识别结果后，根据用户所选的语音内容识别地域通过后在台服务器数据库中检索看是否存在对应的记录，即完全相同的记录；若存在，则将语音引擎得出的识别结果发送至客户端；此种结果仅仅一个识别结果对应后台服务器检索数据库中一个数据；若识别的结果与数据库中对比无完全相同的，则认为识别结果存在一定的谬误，并发送语音识别结果的同时，告之客户端识别结果存在谬误同时进入下一步；然后在本地数据库中寻找预设地域范围内的与识别结果相近似的数据，然后以使用频率降序排列推荐给用户，减少用户搜寻时间；其中，所述相近似的数据是指大于预设相似度的数据。另外，如果在本地数据库中寻找不到大于预设相似度的数据，则将该识别结果返回至后台服务器检索数据中，后台服务器计算出数据库中所有记录与识别结果的相似度，根据相似度降序排序所有记录，并将排序结果返回至客户端。如后台服务器数据库同样也寻找不到大于预设相似度的数据，则认为本次语音识别错误，并反馈给客户端，提醒用户重新输入语音信息或者加入限定词或者扩展词。

例如，用户在成都需要导航至广州市广州塔，在成都输入语音“广州塔”而预设的地域范围为市辖区即只搜索成都市的地名，则在后台无法搜索到与“广州塔”相对应的数据；下一步则在本地数据库中搜索，如本地数据库中存在 “光轴塔”“光州塔”以及“逛周它”“广州塔”，其频率分别为A、B、C以及D，D>C>B>A，那么呈现给用户的信息是由上往下依次为“广州塔”，“逛周它”，“光州塔”，“光轴塔”，即方便客户选取，识别成功。

如本地数据库预设的相似度为大于50%，而其识别结果“广州塔”无法找到与之相似度大于50%的数据，那么将识别结果“广州塔”反馈至后台服务器数据库中检索，通过后台服务器计算出数据库中所有记录与识别结果的相似度，将相似度超过预设阈值的数据根据相似度降序排序所有记录，并将排序结果返回至客户端。

如通过服务端计算出数据库中所有记录与识别结果的相似度，其相似度均小于预设阈值，则识别失败，那么反馈给用户该次语音输入错误，并且提示用户更换语音或者加入限定词或者扩展词，如在成都的用户需要导航位于广州的“广州塔”，则输入语音信息的时候加上扩展词，即输入语音为“广州市广州塔”。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种导航语音识别方法，其特征在于：其包括以下步骤：

步骤S2：对步骤S1语音识别的结果根据识别地域检索后台服务器数据库，如果存在对应数据记录，则将识别结果返回到客户端，识别完成；

如果不存在对应数据记录，则从本地数据库中寻找预设地域范围内的、与识别结果相似度大于预设值的数据，如果存在相似度大于预设值的数据，则将该相似度大于预设值的数据按照使用频率降序排序推荐给用户；如果在本地数据库中没有相似度大于预设值的数据，则将该识别结果返回至后台服务器数据库中，后台服务器计算出后台服务器数据库中所有记录与识别结果的相似度，根据相似度降序排序所有记录，并将排序结果返回至客户端；

2.根据权利要求1所述的导航语音识别方法，其特征在于：步骤S2中，首选对步骤S1语音识别的结果进行判断，是否为有效结果，然后进行检索。

3.根据权利要求1所述的导航语音识别方法，其特征在于：步骤S2中，如果存在相似度大于预设值的结果，则将其按照使用频率降序排序推荐给用户，并获取用户当前位置信息，根据地域范围筛选数据，反馈至客户端。

4.根据权利要求1所述的导航语音识别方法，其特征在于：步骤S2中，如果在本地数据库中没有相近似的结果，则将该识别结果返回至后台服务器数据库中，服务器计算出后台服务器数据库中所有记录与识别结果的相似度，根据相似度降序排序所有记录，并将排序结果返回至客户端，并获取用户当前位置信息，根据地域范围筛选数据，反馈至客户端。

5.根据权利要求1~4任意一项所述的导航语音识别方法，其特征在于：步骤S2中，如后台服务器数据库中也没有大于预设相似度的数据，则本次语音识别错误，并反馈给客户端，同时告知用户重新输入语音信息或者加入限定词或者扩展词。

6.根据权利要求5所述的导航语音识别方法，其特征在于：步骤S2中，所述预设相似度不小于50%。

7.一种语音识别***，其特征在于：所述语音识别***包括语音接收模块、语音识别模块、本地数据库、通讯模块、后台服务器和发送模块；

其中，所述语音接收模块，用于接收客户端发送的语音信息；

所述语音识别模块，用于将语音信息根据识别地域检索后台服务器数据库查找对应数据记录，或从本地数据库中寻找预设地域范围内的、与识别结果相似度大于预设值的数据；所述通讯模块，用于与后台服务器连接，则将该识别结果返回至后台服务器数据库中；

所述后台服务器，用于计算出后台服务器数据库中所有记录与识别结果的相似度，根据相似度降序排序所有记录；

发送模块，用于将排序结果返回至客户端。