CN111259170A

CN111259170A - 一种语音搜索方法、装置、电子设备及存储介质

Info

Publication number: CN111259170A
Application number: CN201811458192.5A
Authority: CN
Inventors: 薄琳
Original assignee: Beijing Didi Infinity Technology and Development Co Ltd
Current assignee: Beijing Didi Infinity Technology and Development Co Ltd
Priority date: 2018-11-30
Filing date: 2018-11-30
Publication date: 2020-06-09

Abstract

本申请涉及语音搜索技术领域，尤其涉及一种语音搜索方法，包括：获取参考文本集；针对参考文本集中的每个参考文本，基于该参考文本对应的语言种类，对参考文本进行处理，得到候选搜索文本库；在确定目标语音对应的语音识别文本后，从所有候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本库，并根据查找到的候选搜索文本库确定与目标语音对应的参考文本。采用上述方法，基于语言种类进行语音识别文本的处理提高了目标语音识别的包容度，基于匹配度确定搜索结果又进一步提升了目标语音搜索的准确度，从而提升了用户的使用体验。本申请还提供了一种语音搜索装置、电子设备及存储介质。

Description

一种语音搜索方法、装置、电子设备及存储介质

技术领域

本申请涉及语音搜索技术领域，具体而言，涉及一种语音搜索方法、装置、电子设备及存储介质。

背景技术

随着移动终端技术的飞速发展，移动终端所具备的功能也越来越丰富，如在手机等移动终端上应用十分广泛的语音搜索功能。用户通过语音搜索功能可以搜索包括天气、地图、音乐、联系人等各种类型的数据。

现有的语音搜索方法，通常是基于对用户的语音内容的识别结果来进行的，也即，在识别出用户的语音内容后，搜索引擎可以为用户提供与上述语音内容相匹配的搜索内容。以音乐搜索为例，当用户对着移动终端说出：“我想听××歌曲”时，希望该歌曲能够很快被识别并播放。

然而，利用现有语音识别技术识别语音内容时，往往无法避免各种语音环境所可能带来的噪声影响，导致语音识别的准确度较差，这将进一步导致返回的搜索内容不准确，甚至是无法返回相应的搜索内容，用户的使用体验度较差。

可见，需要一种能够准确推送用户所要搜索的内容的技术方案。

发明内容

有鉴于此，本申请实施例的目的在于提供一种语音搜索方法、装置、电子设备及存储介质，能够提高语音搜索的准确度，提升用户的使用体验。

主要包括以下几个方面：

第一方面，本申请实施例提供了一种语音搜索方法，所述方法包括：

获取参考文本集；

针对所述参考文本集中的每个参考文本，基于该参考文本对应的语言种类，对所述参考文本进行处理，得到候选搜索文本库；

在确定目标语音对应的语音识别文本后，从所有候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本库，并根据查找到的候选搜索文本库确定与所述目标语音对应的参考文本。

在一些实施例中，所述参考文本包括至少一个汉字，所述至少一个汉字对应的语言种类为汉语类别；基于所述参考文本对应的语言种类，对所述参考文本进行处理，包括：

依次从所述参考文本中提取出各个汉字；

将提取的任意多个汉字进行顺序组合，得到各个汉字组；

将每个所述汉字、以及所述汉字组分别作为处理后的一个候选搜索文本。

在一些实施例中，所述参考文本包括至少一个拼音，所述至少一个拼音对应的语言种类为汉语类别；基于所述参考文本对应的语言种类，对所述参考文本进行处理，包括：

依次从所述参考文本中提取出各个拼音，并确定每个拼音对应的声母部和韵母部；

将提取的任意多个拼音进行顺序组合，得到各个拼音组；

针对任意两个拼音，确定一个拼音的声母部与另一个拼音的声母部组合后的声母组，以及确定一个拼音的韵母部与另一个拼音的韵母部组合后的韵母组；

将每个所述拼音、所述拼音组、以及所述声母组和所述韵母组分别作为处理后的一个候选搜索文本。

在一些实施例中，所述参考文本包括至少一个字母，所述至少一个字母对应的语言种类为英语类别；基于所述参考文本对应的语言种类，对所述参考进行处理，包括：

依次从所述参考文本中提取出各个字母；

将提取的任意多个字母进行顺序组合，得到各个字母组；

将每个所述字母组作为处理后的一个候选搜索文本。

在一种实施方式中，在从所有所述候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本库之前，还包括：

基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，得到处理后的语音识别文本；

从所有候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本，包括：

从所有候选搜索文本库中查找与处理后的语音识别文本匹配的候选搜索文本库。

在另一种实施方式中，从所有所述候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本库，包括：

针对每个候选搜索文本库，确定处理后的语音识别文本与该候选搜索文本库中的候选搜索文本之间的匹配度；

按照匹配度由高到低的顺序对所有候选搜索文本库进行排名；

将符合预设名次的候选搜索文本库作为与处理后的语音识别文本匹配的候选搜索文本库。

在一些实施例中，所述候选搜索文本库中包含多个候选搜索文本；所述确定处理后的语音识别文本与该候选搜索文本库中的候选搜索文本之间的匹配度，包括：

针对处理后的每个语音识别文本，确定该语音识别文本是否与所述候选搜索文本库中的任一候选搜索文本相一致；

若一致，则确定该语音识别文本与该候选搜索文本匹配；

针对任一候选搜索文本库，统计与该候选搜索文本库中的候选搜索文本相匹配的语音识别文本的个数；

将统计的个数作为确定处理后的语音识别文本与该候选搜索文本库中的候选搜索文本之间的匹配度。

在又一种实施方式中，在所述确定处理后的语音识别文本与该候选搜索文本库中的候选搜索文本之间的匹配度之前，还包括：

针对处理后的每个语音识别文本，为该语音识别文本赋予对应的重要度信息；

所述确定处理后的语音识别文本与该候选搜索文本库中的候选搜索文本之间的匹配度，包括：

确定赋予重要度信息后的语音识别文本与所述候选搜索文本库中的候选搜索文本之间的匹配度。

在再一种实施方式中，在基于该参考文本对应的语言种类，对所述参考文本进行处理之前，还包括：

判断所述参考文本是否存在扩展参考文本；

基于该参考文本对应的语言种类，对所述参考文本进行处理，包括：

在判断所述参考文本存在所述扩展参考文本时，基于该参考文本对应的语言种类，对所述参考文本进行处理，以及基于所述扩展参考文本对应的语言种类，对所述扩展参考文本进行处理。

在再一种实施方式中，在获取参考文本集之后，还包括：

针对所述参考文本集中的每个参考文本，对该参考文本进行文本转换，得到转换后的参考文本。

第二方面，本申请实施例还提供了语音搜索装置，所述装置包括：

获取模块，用于获取参考文本集；

第一处理模块，用于针对所述参考文本集中的每个参考文本，基于该参考文本对应的语言种类，对所述参考文本进行处理，得到候选搜索文本库；

搜索模块，用于在确定目标语音对应的语音识别文本后，从所有候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本库，并根据查找到的候选搜索文本库确定与所述目标语音对应的参考文本。

在一些实施例中，所述参考文本包括至少一个汉字，所述至少一个汉字对应的语言种类为汉语类别；所述第一处理模块，具体用于：

依次从所述参考文本中提取出各个汉字；

将提取的任意多个汉字进行顺序组合，得到各个汉字组；

在一些实施例中，所述参考文本包括至少一个拼音，所述至少一个拼音对应的语言种类为汉语类别；所述第一处理模块，具体用于：

将提取的任意多个拼音进行顺序组合，得到各个拼音组；

在一些实施例中，所述参考文本包括至少一个字母，所述至少一个字母对应的语言种类为英语类别；所述第一处理模块，具体用于：

依次从所述参考文本中提取出各个字母；

将提取的任意多个字母进行顺序组合，得到各个字母组；

将每个所述字母组作为处理后的一个候选搜索文本。

在一种实施方式中，还包括：

第二处理模块，用于基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，得到处理后的语音识别文本；

所述搜索模块，具体用于从所有候选搜索文本库中查找与处理后的语音识别文本匹配的候选搜索文本库。

在一些实施例中，所述搜索模块，具体用于：

若一致，则确定该语音识别文本与该候选搜索文本匹配；

在另一种实施方式中，还包括：

赋予模块，用于针对处理后的每个语音识别文本，为该语音识别文本赋予对应的重要度信息；

所述搜索模块，具体用于：

在又一种实施方式中，还包括：

判断模块，用于判断所述参考文本是否存在扩展参考文本；

所述第一处理模块，具体用于：

在再一种实施方式中，还包括：

转换模块，用于针对所述参考文本集中的每个参考文本，对该参考文本进行文本转换，得到转换后的参考文本。

第三方面，本申请实施例还提供了一种电子设备，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行时执行如第一方面所述的语音搜索方法的步骤。

第四方面，本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如第一方面所述的语音搜索方法的步骤。

采用上述方案，在获取到参考文本集后，针对所述参考文本集中的每个参考文本，基于该参考文本对应的语言种类，对所述参考文本进行处理，得到候选搜索文本库，并在确定目标语音对应的语音识别文本后，从所有候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本库，并根据查找到的候选搜索文本库确定与所述目标语音对应的参考文本。这样，基于语言种类进行语音识别文本的处理，提高了目标语音识别的准确度，进而基于识别出的文本进行搜索时可以提升搜索结果的准确度。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例一所提供的一种语音搜索方法的流程图；

图2示出了本申请实施例二所提供的一种语音搜索方法的流程图；

图3示出了本申请实施例二所提供的另一种语音搜索方法的流程图；

图4示出了本申请实施例三所提供的一种语音搜索方法的流程图；

图5示出了本申请实施例四所提供的一种语音搜索方法的流程图；

图6示出了本申请实施例五所提供的一种语音搜索方法的流程图；

图7示出了本申请实施例七所提供的一种语音搜索装置的结构示意图；

图8示出了本申请实施例八所提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，应当理解，本申请中附图仅起到说明和描述的目的，并不用于限定本申请的保护范围。另外，应当理解，示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本申请内容的指引下，可以向流程图添加一个或多个其他操作，也可以从流程图中移除一个或多个操作。

另外，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

考虑到现有语音识别技术识别语音内容时，语音识别的准确度较差，这将导致返回的搜索内容不准确，甚至是无法返回相应的搜索内容，用户的使用体验度较差。有鉴于此，本申请实施例提供了一种语音搜索方法，该语音搜索方法可以应用于音乐搜索技术领域，还可以应用于天气搜索技术领域，还可以应用于其他技术领域。接下来通过几个实施例进行具体的说明。

实施例一

如图1所示，为本申请实施例一提供的一种语音搜索方法的流程示意图，该语音搜索方法的执行主体可以是电子设备，如私有设备、运营商网络设备(例如，基站设备)，也可以是一定行业组织、团体和个人部署的站点(Station)等，具体而言，可以包括但不限于移动台、移动终端、移动电话、用户设备、手机及便携设备(portable equipment)、车辆(vehicle)等，例如，终端设备可以是移动电话(或称为“蜂窝”电话)、具有无线通信功能的计算机等，终端设备还可以是便携式、袖珍式、手持式、计算机内置或者车载移动装置，本申请实施例对此不予限制。上述方法具体包括如下步骤：

S101、获取参考文本集。

这里，首先需要获取参考文本集。该参考文本集可以是预先收集的正确参考文本的集合。本申请实施例中的参考文本可以是汉字，还可以是拼音，还可以是字母，还可以是其他文本。

S102、针对所述参考文本集中的每个参考文本，基于该参考文本对应的语言种类，对所述参考文本进行处理，得到候选搜索文本库。

这里，在确定参考文本对应的语言种类后，可以根据对应的语言种类对参考文本进行相应的处理。本申请实施例中，对于不同语言种类的参考文本可以进行相应的处理，以得到对应的候选搜索文本库。这主要是考虑到现有的语音识别***对环境比较敏感，针对一个场景通常需要进行针对性的语音训练，而且识别得到的语音识别文本通常夹杂有各种噪音，如缺字漏字、同音不同字、相似声母、相似韵母、英文音译与英文原文混杂等。在识别得到的语音识别文本夹杂有噪音时，现有利用按字创建倒排索引进行语音搜索的方案导致返回的搜索内容不准确，甚至是无法返回相应的搜索内容，用户的使用体验度较差。本申请正是在为了解决上述语音搜索方案所存在的问题，才综合考虑语音识别文本对应的语言种类进行文本处理，以便根据处理后的语音识别文本进行搜索结果的匹配。与此相对应的是，本申请实施例在进行候选搜索文本库确定的过程中，也可以是基于语言种类进行确定的。

S103、在确定目标语音对应的语音识别文本后，从所有候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本库，并根据查找到的候选搜索文本库确定与所述目标语音对应的参考文本。

这里，通过对参考文本集进行多种语言种类(至少包括汉语种类以及英语种类)下的分析处理，得到对应的多个候选搜索文本库。本申请实施例可以预先建立参考文本与候选搜索文本库之间的索引关系，也即，在确定语音识别文本与候选搜索文本库中的候选搜索文本之间的匹配个数时，可以基于上述建立的索引关系确定对应的搜索结果。也即，本申请实施例在确定目标语音对应的语音识别文本后，便可以从所有候选搜索文本库中查找与语音识别文本匹配的候选搜索文本库，然后再基于上述参考文本与候选搜索文本库之间的索引关系，即可以确定与目标语音对应的参考文本。

本申请实施例可以针对不同的语言种类进行相应的文本处理，接下来通过如下实施例二和实施例三着重对汉语类型和英语类型的参考文本进行处理的过程进行说明。

实施例二

在参考文本包括至少一个汉字时，其对应的语言种类为汉语类别，这样，基于所述参考文本对应的语言种类，对所述参考文本进行处理，如图2所示，具体包括如下步骤：

S201、依次从所述参考文本中提取出各个汉字；

S202、将提取的任意多个汉字进行顺序组合，得到各个汉字组；

S203、将每个所述汉字、以及所述汉字组分别作为处理后的一个候选搜索文本。

这里，首先依次从所述参考文本中提取出各个汉字，然后将任意多个汉字进行顺序组合，得到各个汉字组，最后将每个汉字组、每个汉字均作为处理后的一个候选搜索文本。以陈奕迅这一参考文本为例，可以提取出陈、奕、迅这三个汉字，经过顺序组合后，可以得到陈奕、奕迅等汉字组，这样，陈、奕、迅、陈奕、奕迅均可以作为处理后的一个候选搜索文本。

值得说明的是，本申请实施例不仅可以将每个汉字组、每个汉字均作为处理后的一个候选搜索文本，还可以对汉字组、汉字进行筛选后，将筛选后的汉字、汉字组作为处理后的候选搜索文本，以在确保语音搜索准确度的前提下，提高搜索效率。

对于包括至少一个汉字的参考文本而言，本申请实施例可以基于该参考文本包括的汉字生成对应的拼音，这样，每一个汉字对应一个拼音，一个参考文本也可以对应于至少一个拼音，这样，便可以对拼音及拼音包括的声母和韵母进行识别以提高语音识别的包容性。在拼音作为参考文本时，基于所述参考文本对应的语言种类，对所述参考文本进行处理，如图3所示，具体包括如下步骤：

S301、依次从所述参考文本中提取出各个拼音，并确定每个拼音对应的声母部和韵母部；

S302、将提取的任意多个拼音进行顺序组合，得到各个拼音组；

S303、针对任意两个拼音，确定一个拼音的声母部与另一个拼音的声母部组合后的声母组，以及确定一个拼音的韵母部与另一个拼音的韵母部组合后的韵母组；

S304、将每个所述拼音、所述拼音组、以及所述声母组和所述韵母组分别作为处理后的一个候选搜索文本。

这里，首先依次从所述参考文本中提取出各个拼音，可以对任意多个拼音进行顺序组合，得到各个拼音组，还可以针对每个拼音，确定该拼音对应的声母部和韵母部，并可以针对任意两个拼音，确定一个拼音的声母部与另一个拼音的声母部组合后的声母组，以及确定一个拼音的韵母部与另一个拼音的韵母部组合后的韵母组，最后将每个所述拼音、所述拼音组、以及所述声母组和所述韵母组分别作为处理后的一个候选搜索文本。

以chenyixun这一参考文本为例，可以提取出chen、yi、xun这三个拼音以及每个拼音的声母部和韵母部(如chen的声母部为ch，韵母部为en，yi的声母部为y，韵母部为i，xun的声母部为x，韵母部为un)，这样，将多个拼音进行顺序组合后，可以得到chenyi、yixun等拼音组。另外，针对任意两个拼音而言，可以将对应的声母部组合起来，得到声母组，如chy、yx等，还可以将对应的韵母部组合起来得到韵母组，如eni、iun等，这样，chen、yi、xun、chenyi、yixun、chy、yx、eni、iun等均可以作为处理后的一个候选搜索文本。

同样的，这里，不仅可以将每个拼音、每个拼音组、每个声母组、每个韵母组均作为处理后的一个候选搜索文本，还可以在对拼音、拼音组、声母组、韵母组进行筛选后，将筛选后的拼音、拼音组、声母组、韵母组作为处理后的候选搜索文本，以在确保语音搜索准确度的前提下，提高搜索效率。

实施例三

在参考文本包括至少一个字母时，其对应的语言种类为英语类别，这样，基于所述参考文本对应的语言种类，对所述参考文本进行处理，如图4所示，具体包括如下步骤：

S401、依次从所述参考文本中提取出各个字母；

S402、将提取的任意多个字母进行顺序组合，得到各个字母组；

S403、将每个所述字母组作为处理后的一个候选搜索文本。

这里，首先依次从所述参考文本中提取出各个字母，然后将任意多个字母进行顺序组合，得到各个字母组，最后将每个字母均作为处理后的一个候选搜索文本。以eason(即陈奕迅的英文名)这一参考文本为例，可以提取出各个字母，经过顺序组合后，可以得到eas、aso、son等，均可以作为处理后的一个候选搜索文本。

值得说明的是，本申请实施例不仅可以将每个字母均作为处理后的一个候选搜索文本，还可以对字母组进行筛选后，将筛选后的字母组作为处理后的候选搜索文本，以在确保语音搜索准确度的前提下，提高搜索效率。

本申请实施例提供的语音搜索方法在获取到目标语音后，可以先进行语音识别，以得到对应的语音识别文本。本申请实施例中，可以采用语音识别***对目标语音进行语音识别，也即，可以通过特征参数提取单元对目标语音进行分析处理，把丰富的语音信息中的冗余信息去除，获取对语音识别有用的信息，再根据模式匹配及模型训练单元对上述获取的信息进行识别以得到语音识别文本。

这里，与参考文本类似的是，本申请实施例中的语音识别文本可以是汉字，还可以是拼音，还可以是字母，还可以是其他文本。在确定语音识别文本对应的语言种类后，可以根据对应的语言种类对语音识别文本进行相应的处理。这主要是考虑到在语音识别的实际应用中，不同的语言种类受到环境的影响程度也不相同，本申请实施例可以针对汉语类别的文本(汉字、拼音等)进行处理，还可以针对英语类别的文本(字母)进行处理，还可以针对其他语言种类的文本进行处理，在此不再赘述。

针对不同语言种类进行处理得到的语音识别文本可以有一个，也可以有多个。这样，通过统计处理后的语音识别文本与各个候选搜索文本库中的候选搜索文本之间的匹配度便可以确定与当前语音识别文本匹配的候选搜索文本库，如下实施例四进行了具体描述。

实施例四

如图5所示，本申请实施例提供了一种候选搜索文本库的查找方法，具体包括：

S501、针对每个候选搜索文本库，确定处理后的语音识别文本与该候选搜索文本库中的候选搜索文本之间的匹配度；

S502、按照匹配度由高到低的顺序对所有候选搜索文本库进行排名；

S503、将符合预设名次的候选搜索文本库作为与处理后的语音识别文本匹配的候选搜索文本库。

这里，本申请实施例提供的语音搜索方法可以首先按照匹配度由高到低的顺序对所有候选搜索文本库进行排名；然后再将符合预设名次的候选搜索文本库作为与处理后的语音识别文本匹配的候选搜索文本库，以根据查找到的候选搜索数据库确定根据目标语音到的参考文本。

这里，预设名次可以根据不同的应用场景进行适应性调节，如对于一些对搜索结果的精准度要求不高的语音搜索场景，如可以模糊搜索的应用场景(如地图导航)，可以将预设名次(如前5名)的候选搜索文本库对应的参考文本作为与该目标语音对应的搜索结果推荐给用户，但对于一些对搜索结果的精准度要求较高的语音搜索场景，如需要精确搜索的应用场景(如利用语音机器人实现音乐推荐)，可以将最高排名的候选搜索文本库对应的参考文本作为与该目标语音对应的搜索结果推荐给用户，以进一步提升用户的使用体验。

值得提出的是，本申请实施例中的语音识别文本可以包括汉字、拼音、字母中的任意组合。如对于“安吉拉baby”，“爱的ATM”等语音识别文本，本申请实施例可以按照语言种类分开进行搜索，即，将汉语和英文分开搜索，也即，将汉字对应的匹配度与字母对应的匹配度相加以得到语音识别文本的最终匹配度，解决了语言混杂所带来的搜索错误率较高的问题，确保了搜索准确度。

上述匹配度确定过程作为本申请实施例的一个关键步骤，通过如下实施例五进行展开说明。

实施例五

如图6所示，上述匹配度的确定过程具体通过如下步骤实现：

S601、针对处理后的每个语音识别文本，确定该语音识别文本是否与所述候选搜索文本库中的任一候选搜索文本相一致；

S602、若一致，则确定该语音识别文本与该候选搜索文本匹配；

S603、针对任一候选搜索文本库，统计与该候选搜索文本库中的候选搜索文本相匹配的语音识别文本的个数；

S604、将统计的个数作为确定处理后的语音识别文本与该候选搜索文本库中的候选搜索文本之间的匹配度。

这里，可以首先针对处理后的每个语音识别文本，确定该语音识别文本是否与所述候选搜索文本库中的任一候选搜索文本相一致，如果一致，则说明该语音识别文本与该候选搜索文本匹配，然后针对任一候选搜索文本库，统计与该候选搜索文本库中的候选搜索文本相匹配的语音识别文本的个数，将该统计的个数作为匹配度，匹配度随着统计个数的增加而增大。

特举一个具体的实例说明上述匹配度的确定过程。如在进行语音识别时，将陈奕迅的浮夸识别成了陈奕军的浮夸，此时，针对陈奕军这三个汉字而言，陈、奕、军、陈奕、奕军均可以作为处理后的一个语音识别文本，而对参考文本陈奕迅而言，陈、奕、迅、陈奕、奕迅均可以作为候选搜索文本库中的候选搜索文本，在确定处理后的语音识别文本与候选搜索文本库中的四个候选参考文本相同，两个不同的前提下，可以确定该候选搜索文本库中的候选搜索文本与目标语音之间的匹配度，这时，基于该匹配度便可以从各候选搜索文本库中确定与目标语音对应的搜索结果，也即，即使在语音识别阶段存在噪声干扰，本申请实施例提供的语音搜索方法仍然可以基于匹配度进行准确的语音搜索。

另外，考虑到不同种类的语音识别文本对匹配度的影响并不相同，如对于“yixun”这一拼音类的语音识别文本而言，其对匹配度的影响往往会小于“奕迅”这一文字类的语音识别文本对匹配度的影响，因此，本申请实施例中，对于上述处理后的每一语音识别文本而言，可以为其赋予对应的重要度信息，基于该重要度信息以及语音识别文本便可以确定对应的匹配度。

这里，重要度信息可以预先设置，还可以适应性调节以适应不同应用场景的需求。

实施例六

为了便于更好的对参考文本进行处理，本申请实施例可以对该参考文本进行预处理。该预处理可以包括文本转换处理、文本扩展处理、文本过滤处理等。

针对文本扩展处理而言，在确定参考文本存在扩展参考文本时，在基于所述参考文本对应的语言种类，对所述参考文本进行处理的同时还可以基于所述扩展参考文本对应的语言种类，对所述扩展参考文本进行处理。

本申请实施例中，如可以在建立数据库时，将歌手的别名作为同义词扩展，如将周杰伦的别名周董作为扩展语音识别文字，这样，当用户语音搜索别名时也能匹配到正确的歌手。如还可以为英文歌手名增加中文名作为扩展语音识别文字，用来支持中文搜索，如将Justin这一英文歌手名的中文名贾斯丁作为扩展参考文本，这样，当用户语音搜索中文名贾斯丁时也能匹配到正确的英文歌手。

针对文本转换处理而言，本申请实施例考虑到数字在语言识别中的多样性，可以将语义识别文本中的***数字均处理为中文，如将歌曲名爱情36计转换为爱情三十六计，以实现当前语音搜索环境与数据库之间的统一，进一步提高搜索效果。

基于上述实施例，本申请还提供了一种语音搜索装置，下述各种装置的实施可以参见上述方法的实施，重复之处不再赘述。

实施例七

如图7所示，为本申请实施例六提供的语音搜索装置，所述装置包括：

获取模块701，用于获取参考文本集；

第一处理模块702，用于针对所述参考文本集中的每个参考文本，基于该参考文本对应的语言种类，对所述参考文本进行处理，得到候选搜索文本库；所述候选搜索文本库中包含多个候选搜索文本；

搜索模块703，用于在确定目标语音对应的语音识别文本后，从所述候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本，并根据查找到的候选搜索文本确定与所述目标语音对应的参考文本。

在一些实施例中，所述参考文本包括至少一个汉字，所述至少一个汉字对应的语言种类为汉语类别；所述第一处理模块702，具体用于：

依次从所述参考文本中提取出各个汉字；

将提取的任意多个汉字进行顺序组合，得到各个汉字组；

在一些实施例中，所述参考文本包括至少一个拼音，所述至少一个拼音对应的语言种类为汉语类别；所述第一处理模块702，具体用于：

将提取的任意多个拼音进行顺序组合，得到各个拼音组；

在一些实施例中，所述参考文本包括至少一个字母，所述至少一个字母对应的语言种类为英语类别；所述第一处理模块702，具体用于：

依次从所述参考文本中提取出各个字母；

将提取的任意多个字母进行顺序组合，得到各个字母组；

将每个所述字母组作为处理后的一个候选搜索文本。

在一种实施方式中，还包括：

第二处理模块704，用于基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，得到处理后的语音识别文本；

所述搜索模块703，具体用于从所述候选搜索文本库中查找与处理后的语音识别文本匹配的候选搜索文本。

在一些实施例中，所述搜索模块703，具体用于：

确定处理后的语音识别文本与所述候选搜索文本库中的候选搜索文本之间的匹配度；

按照匹配度由高到低的顺序对所有候选搜索文本进行排名；

将符合预设名次的候选搜索文本作为与处理后的语音识别文本匹配的候选搜索文本。

在一些实施例中，所述搜索模块703，具体用于：

针对处理后的每个语音识别文本，确定该语音识别文本是否与所述候选搜索文本库中任一候选搜索文本关联的搜索文本相一致；

若一致，则确定该语音识别文本与该候选搜索文本匹配；

针对任一候选搜索文本，统计与该候选搜索文本相匹配的语音识别文本的个数；

将统计的个数作为确定处理后的语音识别文本与所述候选搜索文本库中的候选搜索文本之间的匹配度。

在另一种实施方式中，还包括：

赋予模块705，用于针对处理后的每个语音识别文本，为该语音识别文本赋予对应的重要度信息；

所述搜索模块703，具体用于：

在又一种实施方式中，还包括：

判断模块706，用于判断所述参考文本是否存在扩展参考文本；

所述第一处理模块702，具体用于：

在再一种实施方式中，还包括：

转换模块707，用于针对所述参考文本集中的每个参考文本，对该参考文本进行文本转换，得到转换后的参考文本。

实施例八

如图8所示，为本申请实施例七所提供的一种进行电子设备的结构示意图，包括：处理器801、存储介质802和总线803，所述存储介质802存储有所述处理器801可执行的机器可读指令，当电子设备运行时，所述处理器801与所述存储介质802之间通过总线803通信，所述机器可读指令被所述处理器801执行时执行上述任一实施例提供的语音搜索方法。

实施例九

本申请实施例九还提供了一种计算机可读存储介质802，该计算机可读存储介质802上存储有计算机程序，该计算机程序被处理器801运行时执行上述实施例所对应的语音搜索方法的步骤。

具体地，该存储介质能够为通用的存储介质，如移动磁盘、硬盘等，该存储介质上的计算机程序被运行时，能够执行上述语音搜索方法，从而解决目前语音搜索准确度较低的问题，达到提高语音搜索的准确度，提升用户的使用体验的效果。

基于相同的技术构思，本申请实施例还提供了一种计算机程序产品，包括存储了程序代码的计算机可读存储介质，程序代码包括的指令可用于执行上述语音搜索方法的步骤，具体实现可参见上述方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***和装置的具体工作过程，可以参考方法实施例中的对应过程，本申请中不再赘述。在本申请所提供的几个实施例中，应该理解到，所揭露的***、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个模块或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种语音搜索方法，其特征在于，所述方法包括：

获取参考文本集；

2.根据权利要求1所述的方法，其特征在于，所述参考文本包括至少一个汉字，所述至少一个汉字对应的语言种类为汉语类别；基于所述参考文本对应的语言种类，对所述参考文本进行处理，包括：

依次从所述参考文本中提取出各个汉字；

将提取的任意多个汉字进行顺序组合，得到各个汉字组；

3.根据权利要求1所述的方法，其特征在于，所述参考文本包括至少一个拼音，所述至少一个拼音对应的语言种类为汉语类别；基于所述参考文本对应的语言种类，对所述参考文本进行处理，包括：

将提取的任意多个拼音进行顺序组合，得到各个拼音组；

4.根据权利要求1所述的方法，其特征在于，所述参考文本包括至少一个字母，所述至少一个字母对应的语言种类为英语类别；基于所述参考文本对应的语言种类，对所述参考进行处理，包括：

依次从所述参考文本中提取出各个字母；

将提取的任意多个字母进行顺序组合，得到各个字母组；

将每个所述字母组作为处理后的一个候选搜索文本。

5.根据权利要求1所述的方法，其特征在于，在从所有所述候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本库之前，还包括：

从所有所述候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本库，包括：

6.根据权利要求5所述的方法，其特征在于，从所有所述候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本库，包括：

7.根据权利要求6所述的方法，其特征在于，所述候选搜索文本库中包含多个候选搜索文本；所述确定处理后的语音识别文本与该候选搜索文本库中的候选搜索文本之间的匹配度，包括：

若一致，则确定该语音识别文本与该候选搜索文本匹配；

8.根据权利要求6所述的方法，其特征在于，在所述确定处理后的语音识别文本与该候选搜索文本库中的候选搜索文本之间的匹配度之前，还包括：

9.根据权利要求1所述的方法，其特征在于，在基于该参考文本对应的语言种类，对所述参考文本进行处理之前，还包括：

判断所述参考文本是否存在扩展参考文本；

10.根据权利要求1所述的方法，其特征在于，在获取参考文本集之后，还包括：

11.一种语音搜索装置，其特征在于，所述装置包括：

获取模块，用于获取参考文本集；

12.根据权利要求11所述的装置，其特征在于，所述参考文本包括至少一个汉字，所述至少一个汉字对应的语言种类为汉语类别；所述第一处理模块，具体用于：

依次从所述参考文本中提取出各个汉字；

将提取的任意多个汉字进行顺序组合，得到各个汉字组；

13.根据权利要求11所述的装置，其特征在于，所述参考文本包括至少一个拼音，所述至少一个拼音对应的语言种类为汉语类别；所述第一处理模块，具体用于：

将提取的任意多个拼音进行顺序组合，得到各个拼音组；

14.根据权利要求11所述的装置，其特征在于，所述参考文本包括至少一个字母，所述至少一个字母对应的语言种类为英语类别；所述第一处理模块，具体用于：

依次从所述参考文本中提取出各个字母；

将提取的任意多个字母进行顺序组合，得到各个字母组；

将每个所述字母组作为处理后的一个候选搜索文本。

15.根据权利要求11所述的装置，其特征在于，还包括：

16.根据权利要求15所述的装置，其特征在于，所述搜索模块，具体用于：

17.根据权利要求16所述的装置，其特征在于，所述候选搜索文本库中包含多个候选搜索文本；所述搜索模块，具体用于：

若一致，则确定该语音识别文本与该候选搜索文本匹配；

18.根据权利要求16所述的装置，其特征在于，还包括：

所述搜索模块，具体用于：

19.根据权利要求11所述的装置，其特征在于，还包括：

判断模块，用于判断所述参考文本是否存在扩展参考文本；

所述第一处理模块，具体用于：

20.根据权利要求11所述的装置，其特征在于，还包括：

21.一种电子设备，其特征在于，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行时执行如权利要求1至10任一所述的语音搜索方法的步骤。

22.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1至10任一所述的语音搜索方法的步骤。