CN109065020B

CN109065020B - 多语言类别的识别库匹配方法及***

Info

Publication number: CN109065020B
Application number: CN201810849884.6A
Authority: CN
Inventors: 潘晓明
Original assignee: Chongqing Youbanhome Technology Co ltd
Current assignee: Chongqing Youbanhome Technology Co ltd
Priority date: 2018-07-28
Filing date: 2018-07-28
Publication date: 2020-11-20
Anticipated expiration: 2038-07-28
Also published as: CN109065020A

Abstract

本发明涉及语音识别技术领域，具体为多语言类别的识别库匹配方法及***。该方法包括以下步骤：语音采集步骤，采集用户语音；语音识别步骤，在预设的识别库范围内依次使用每一种识别库对用户的语音进行识别，生成识别结果；评分步骤，针对于每一种识别库的识别结果进行分析评估，生成识别库评分；筛选步骤，选择识别库评分最高的识别库作为当前用户语音识别所采用的识别库。本发明提供的多语言类别的识别库匹配方法及***，能够针对多语言类型的输入进行识别库的动态调整，自动的针对用户的语音选取合适的识别库，提高识别准确度，解决现有语音识别技术中在多语言输入的情况下识别效果差的问题。

Description

多语言类别的识别库匹配方法及***

技术领域

本发明涉及语音识别技术领域，具体为多语言类别的识别库匹配方法及***。

背景技术

随着多媒体技术的发展，多媒体***的服务项目也随之扩展，例如音乐、视频、图片、实时路况信号、目的地地图导航、语音导航等。智能终端的广泛使用给上述服务项目提供了广阔的发展空间。

无论终端带有按键还是触摸屏，都需要人为进行手动操控，才能使用上述服务项目，不仅操作繁琐，还可能具有危险性，例如驾驶员在行车过程中手动操作车载设备就可能发生危险。

语音识别技术的发展为此类操作提供了新的发展方向。但是现有语音识别中，只能单一的针对一种语言进行识别，然而实际生活中，并不是所有的人都说普通话，除了普通话外还有四川话、广东话、东北话等，为此，现有的语音识别技术中，通常设置一个选项供用户手动选择语言，用户选择语言后，***调用不同的识别库对语音进行识别，提高方言识别准确度。但是这需要用户手动操作，极为不便。并且，一种语言在发展的过程中也常常会受到其他语言的影响，进而使得一种方言往往在其所属的地区的不同区域内也有一些微小的差异，例如重庆话和四川话虽然总体都属于西南官话，但是彼此之间又有不同，而四川话又可以分为成都话、自贡话等，用户自己可能也无法察觉这些语言之间的差异，造成选择不准确的问题，这些问题对于一些居住在多个地区交接区域、常年居住在外地或更换过多个居住城市的用户则更加明显，这些用户受到多个区域的影响，日常说话的语音可能是多种方言的交叉，用户自身都不知道自己说的话的哪一些属于方言A，哪一些属于方言B，如果只是手动选择一种语言进行匹配识别，无疑会降低一些方言识别的准确度，进而影响用户体验。

发明内容

本发明意在提供多语言类别的识别库匹配方法及***，能够针对多语言类型的输入进行识别库的动态调整，自动的针对用户的语音选取合适的识别库，提高识别准确度。

为了解决上述技术问题，本专利提供如下技术方案：

多语言类别的识别库匹配方法，包括以下步骤：

语音采集步骤，采集用户语音；

语音识别步骤，在预设的识别库范围内依次使用每一种识别库对用户的语音进行识别，生成识别结果；

评分步骤，针对于每一种识别库的识别结果进行分析评估，生成识别库评分；

筛选步骤，选择识别库评分最高的识别库作为当前用户语音识别所采用的识别库。

本发明技术方案中，通过依次使用每一个识别库对用户的语音进行识别，然后对识结果进行分析和评估，通过判断识别结果的合理性来判断当前识别库对用户语音识别的效果，并通过评分的方式量化识别结果的合理性，最终选取最为合适的一种识别库作为用于用户语音识别的识别库，可以有效的提高多语言的识别效果，且通过这种方式可以动态地对所使用的识别库进行调整，可以在不同语言之间切换的场景下依旧保持很高的识别率。

进一步，所述筛选步骤中，根据识别库评分由高到低对识别库进行排序，并根据排序结果将前N种识别库作为预选范围；

所述声纹识别步骤和存储步骤，所述声纹识别步骤包括：

声纹识别步骤，检测用户语音中的声纹信息；

范围设定步骤，根据用户的声纹信息判断***中是否已经存储有该声纹对应的预选范围，若是，则采用预选范围作为预设的识别库范围，若否，则设定预设的识别库范围为全部的识别库；

所述存储步骤用于存储筛选步骤的筛选结果以及生成的预选范围。

通过声纹信息分辨不同的用户，通过存储步骤记录每一个用户的预选范围，可以减小下次评分时的预设的识别库范围，进而加速识别库的匹配速度。

进一步，所述评分步骤包括：

词汇匹配评分步骤，在识别结果中匹配词汇，根据词汇的匹配数量得到词汇匹配评分；

语句合理性评分步骤，根据匹配到的词汇，计算这些词汇在同一句话中出现的概率，根据概率得到语句合理性评分；

关联合理性评分步骤，根据每一句话匹配到的词汇提取每一句内容的语义，根据相邻的两句语音的语义计算两个相邻语句的关联合理性，得到关联合理性评分；

评分计算步骤，根据词汇匹配评分、语句合理性评分以及关联合理性评分计算识别库评分。通过查看匹配后语句中各个单独文字之间是否能够构成合理的词汇、单句中各个词汇的一致性以及多个语句之间语义的连贯性三个方面，对不同的识别库进行评分，更加全面准确。

进一步，所述存储步骤还用于存储各个识别库的历次评分，所述评分步骤还包括平均得分计算步骤，所述平均得分计算步骤用于计算各个识别库的历次的评分的平均得分，所述评分计算步骤中还会根据平均得分来计算识别库评分。通过平均得分反应识别库的累计评分，避免单次评分存在的偶然性影响评分的准确性。

进一步，本发明还公开了一种多语言类别的识别库匹配***，包括：

语音采集模块，所述语音采集模块用于采集用户语音；

语音识别模块，所述语音识别模块用于在预设的识别库范围内依次使用每一种识别库对用户的语音进行识别并生成识别结果；

评分模块，所述评分模块用于针对于每一种识别库的识别结果进行分析评估并生成识别库评分；

筛选模块，所述筛选模块用于选择识别库评分最高的识别库作为当前用户语音识别所采用的识别库。

进一步，所述筛选模块包括排序模块、选择模块、预选范围设定模块，所述排序模块用于根据识别库评分由高到低对识别库进行排序，所述预选范围设定模块用于根据排序结果将前N种识别库作为预选范围；还包括声纹识别模块、预设识别库范围设定模块以及存储模块，所述声纹识别模块用于识别用户的声纹信息，所述存储模块用于存储是声纹信息以及与声纹对应的识别库的筛选结果以及预选范围；

所述预设识别库范围设定模块用于根据用户的声纹信息判断***中是否已经存储有该声纹对应的预选范围，并在检测到***中存在相应声纹信息的预选范围时，设定该声纹信息对应的预选范围作为预设的识别库范围，在检测到***中不存在相应声纹信息的预选范围时，设定预设的识别库范围为全部的识别库。

进一步，所述评分模块包括：

词汇匹配评分模块，所述词汇匹配评分模块用于在识别结果中匹配词汇，根据词汇的匹配数量得到词汇匹配评分；

语句合理性评分模块，所述语句合理性评分模块用于根据匹配到的词汇，计算这些词汇在同一句话中出现的概率并根据概率得到语句合理性评分；

关联合理性评分模块，所述关联合理性评分模块用于根据每一句话匹配到的词汇提取每一句内容的语义，同时根据相邻的两句语音的语义计算两个相邻语句的关联合理性并计算关联合理性评分；

评分计算模块，所述评分计算模块用于根据词汇匹配评分、语句合理性评分以及关联合理性评分计算识别库评分。

进一步，所述存储模块还用于存储各个识别库的历次评分，所述评分模块还包括平均得分计算模块，所述平均得分计算模块用于计算各个识别库的历次的评分的平均得分，所述评分计算模块还会根据平均得分来计算识别库评分。

附图说明

图1为本发明多语言类别的识别库匹配***实施例中的逻辑框图。

具体实施方式

下面通过具体实施方式进一步详细说明：

本实施例公开了一种多语言类别的识别库匹配方法以及使用该方法的多语言类别的识别库匹配***，该***逻辑结构如图1所示，该***包括语音采集模块、语音识别模块、声纹识别模块、评分模块、筛选模块、预设识别库范围设定模块以及存储模块。其中：

语音采集模块用于采集用户语音；语音识别模块用于在预设的识别库范围内依次使用每一种识别库对用户的语音进行识别并生成识别结果，语音识别模块包括识别库加载模块，识别库加载模块用于加载语音识别所使用的识别库，识别库存储了语音识别的规则，例如四川话识别库、普通话识别库、广东话识别库等，不同的识别库有不同的语音识别规则；语音采集模块能够按照预设的识别库范围，依次使用预设的识别库范围内每一个识别库对用户输入的语音进行识别。声纹识别模块用于识别用户的声纹信息。

评分模块用于针对于每一种识别库的识别结果进行分析评估并生成识别库评分，评分模块包括词汇匹配评分模块、语句合理性评分模块、关联合理性评分模块、平均得分计算模块以及评分计算模块。

词汇匹配评分模块用于在识别结果中匹配词汇，根据词汇的匹配数量得到词汇匹配评分；具体的，存储模块中存储有词典库，词典库中每一个词汇具有自己的权重，这些权重用于反映词汇的重要性，例如一些拟声词会等没有实际意义的词汇的权重就会比较小，而具有实际意义的一些词汇的权重较大，词汇匹配评分模块根据词典库中的词汇对识别结果的内容进行词汇匹配，记录匹配到的词汇以及数量，根据预设的权重进行加权求和，得到词汇匹配评分。语句合理性评分模块用于根据匹配到的词汇，计算这些词汇在同一句话中出现的概率并根据概率得到语句合理性评分，语句合理性评分模块主要通过大数据分析实现，即***的存储模块中存储有足够多的语句数据库，语句合理性评分模块从语句数据库中找寻所有匹配的词汇同时出现在一句话中的语句，并得到这样子的语句的数量，以该数量占总数据量的比例作为语句合理性评分。

关联合理性评分模块用于根据每一句话匹配到的词汇提取每一句内容的语义，同时根据相邻的两句语音的语义计算两个相邻语句的关联合理性并计算关联合理性评分，存储模块中预设有各个词汇的关联系数，关联合理性评分模块用于根据词典库中每个词汇的权重来判断一句话中的关键词汇，以权重最高的词汇作为一句话的语义，根据相邻两句话的关键词汇之间的关联系数，乘以预设的权重即可得到关联合理性评分。平均得分计算模块用于计算各个识别库的历次的评分的平均得分；

评分计算模块用于根据词汇匹配评分、语句合理性评分、平均得分以及关联合理性评分计算识别库评分，本实施例中评分计算模块用于将词汇匹配评分、语句合理性评分、平均得分以及关联合理性评分按照预设的权重进行加权求和，以得到的和值为识别库评分。

筛选模块用于选择识别库评分最高的识别库作为当前用户语音识别所采用的识别库。筛选模块包括排序模块和预选范围设定模块，排序模块用于根据识别库评分由高到低对识别库进行排序，预选范围设定模块用于根据排序结果将前5种识别库作为预选范围；

存储模块用于存储是声纹信息以及与声纹对应的识别库的筛选结果、预选范围以及各个识别库的历次评分。

预设识别库范围设定模块用于根据用户的声纹信息判断***中是否已经存储有该声纹对应的预选范围，并在检测到***中存在相应声纹信息的预选范围时，设定该声纹信息对应的预选范围作为预设的识别库范围，在检测到***中不存在相应声纹信息的预选范围时，设定预设的识别库范围为全部的识别库。

多语言类别的识别库匹配方法，包括以下步骤：

语音采集步骤，采集用户语音；

筛选步骤中，根据识别库评分由高到低对识别库进行排序，并根据排序结果将前5种识别库作为预选范围；

还包括声纹识别步骤和存储步骤，声纹识别步骤包括：

声纹识别步骤，检测用户语音中的声纹信息；

存储步骤中，将筛选步骤的筛选结果、生成的预选范围以及各个识别库的历次评分存储起来。

评分步骤包括：

平均得分计算步骤，平均得分计算步骤用于计算各个识别库的历次的评分的平均得分

评分计算步骤，根据词汇匹配评分、语句合理性评分、关联合理性评分以及平均得分计算识别库评分。

通过依次使用每一个识别库对用户的语音进行识别，然后对识结果进行分析和评估，通过判断识别结果的合理性来判断当前识别库对用户语音识别的效果，并通过评分的方式量化识别结果的合理性，最终选取最为合适的一种识别库作为用于用户语音识别的识别库，可以有效的提高多语言的识别效果，且通过这种方式可以动态地对所使用的识别库进行调整，可以在不同语言之间切换的场景下依旧保持很高的识别率。通过声纹信息分辨不同的用户，通过存储步骤记录每一个用户的预选范围，可以减小下次评分时的预设的识别库范围，进而加速识别库的匹配速度。通过查看匹配后语句中各个单独文字之间是否能够构成合理的词汇、单句中各个词汇的一致性以及多个语句之间语义的连贯性三个方面，对不同的识别库进行评分，更加全面准确。通过平均得分反应识别库的累计评分，避免单次评分存在的偶然性影响评分的准确性。

以上的仅是本发明的实施例，方案中公知的具体结构及特性等常识在此未作过多描述，所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识，能够获知该领域中所有的现有技术，并且具有应用该日期之前常规实验手段的能力，所属领域普通技术人员可以在本申请给出的启示下，结合自身能力完善并实施本方案，一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出，对于本领域的技术人员来说，在不脱离本发明结构的前提下，还可以作出若干变形和改进，这些也应该视为本发明的保护范围，这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准，说明书中的具体实施方式等记载可以用于解释权利要求的内容。

Claims

1.多语言类别的识别库匹配方法，其特征在于：包括以下步骤：

语音采集步骤，采集用户语音；

评分步骤，针对于每一种识别库的识别结果进行分析评估，生成识别库评分；所述评分步骤包括词汇匹配评分步骤、语句合理性评分步骤、关联合理性评分步骤和评分计算步骤：

评分计算步骤，根据词汇匹配评分、语句合理性评分以及关联合理性评分计算识别库评分；

筛选步骤中，根据识别库评分由高到低对识别库进行排序，并根据排序结果将前N种识别库作为预选范围；还包括声纹识别步骤和存储步骤，所述声纹识别步骤包括：声纹识别步骤，检测用户语音中的声纹信息；范围设定步骤，根据用户的声纹信息判断***中是否已经存储有该声纹对应的预选范围，若是，则采用预选范围作为预设的识别库范围，若否，则设定预设的识别库范围为全部的识别库；所述存储步骤用于存储筛选步骤的筛选结果以及生成的预选范围。

2.根据权利要求1所述的多语言类别的识别库匹配方法，其特征在于：所述存储步骤还用于存储各个识别库的历次评分，所述评分步骤还包括平均得分计算步骤，所述平均得分计算步骤用于计算各个识别库的历次的评分的平均得分，所述评分计算步骤中还会根据平均得分来计算识别库评分。

3.多语言类别的识别库匹配***，其特征在于：包括：

语音采集模块，所述语音采集模块用于采集用户语音；

评分模块，所述评分模块用于针对于每一种识别库的识别结果进行分析评估并生成识别库评分；所述评分模块包括词汇匹配评分模块、语句合理性评分模块、关联合理性评分模块和评分计算模块；

评分计算模块，所述评分计算模块用于根据词汇匹配评分、语句合理性评分以及关联合理性评分计算识别库评分；

筛选模块包括排序模块、选择模块、预选范围设定模块，所述排序模块用于根据识别库评分由高到低对识别库进行排序，所述预选范围设定模块用于根据排序结果将前N种识别库作为预选范围；还包括声纹识别模块、预设识别库范围设定模块以及存储模块，所述声纹识别模块用于识别用户的声纹信息，所述存储模块用于存储是声纹信息以及与声纹对应的识别库的筛选结果以及预选范围；

4.根据权利要求3所述的多语言类别的识别库匹配***，其特征在于：所述存储模块还用于存储各个识别库的历次评分，所述评分模块还包括平均得分计算模块，所述平均得分计算模块用于计算各个识别库的历次的评分的平均得分，所述评分计算模块还会根据平均得分来计算识别库评分。