CN103853703A

CN103853703A - 一种信息处理方法及电子设备

Info

Publication number: CN103853703A
Application number: CN201410056941.7A
Authority: CN
Inventors: 戴海生; 赵一方
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2014-02-19
Filing date: 2014-02-19
Publication date: 2014-06-11
Anticipated expiration: 2034-02-19
Also published as: CN103853703B

Abstract

本发明公开了一种信息处理方法，用于提高电子设备对语音信息的处理效率。所述方法包括：获得第一语音输入信息；通过其中N个语音识别引擎分别对所述第一语音输入信息进行语种识别，获得N个语种识别结果；N为不大于M的正整数；根据预设规则从所述N个语种识别结果中确定出第一语种识别结果作为最终语种识别结果。本发明还公开了相应的电子设备。

Description

一种信息处理方法及电子设备

技术领域

本发明涉及计算机技术领域，特别涉及一种信息处理方法及电子设备。

背景技术

随着科学技术的不断发展，电子技术也得到了飞速的发展，电子产品的种类也越来越多，人们也享受到了科技发展带来的各种便利。现在人们可以通过各种类型的电子设备享受随着科技发展带来的舒适生活。比如，手机等电子设备已经成为人们生活中一个不可或缺的部分，人们可以通过手机等电子设备以打电话、发短信等等方式加强与其他人之间的联系。

现有技术中，用户在需要进行翻译时，常常会将待翻译的内容输入到电子设备中来进行翻译，电子设备的翻译速度显然比用户自己翻译的速度快。

将待输入的内容输入到电子设备，有多种不同的方式，例如用户可以通过键盘进行输入，或者用户可以通过写字板等手写设备进行输入，或者用户也可以通过语音进行输入。在用户通过语音输入时，由于语音信息与文字信息不同，则用户在输入语音信息后，还需要手动选择一下所输入的信息属于什么语种，例如输入的信息可能是中文、英文或其他语种的文字，电子设备在确认用户的选择后，才会对用户输入的信息进行分析。

对于电子设备来说，其至少需要接收用户的两个操作（输入语音的操作和确定语种的操作）之后才能开始进行分析，而且用户进行这两个操作是串行的，即一般都是选择输入的语音究竟是什么语种之后才会输入语音，电子设备的处理过程较长，显然处理效率较低，会增加用户的等待时间。同时，对于用户来说，其不仅需要输入语音信息，还需要手动选择语种，所需的操作较多，影响用户体验。

发明内容

本发明实施例提供一种信息处理方法及电子设备，用于解决现有技术中电子设备在处理语音信息时处理效率较低的技术问题。

一种信息处理方法，应用于电子设备，所述电子设备中安装有M个语音识别引擎，M为不小于2的整数，所述M个语音识别引擎用于对语音信息进行识别，其中每个语音识别引擎对应一个语种；所述方法包括以下步骤：

获得第一语音输入信息；

通过其中N个语音识别引擎分别对所述第一语音输入信息进行语种识别，获得N个语种识别结果；N为不大于M的正整数；

根据预设规则从所述N个语种识别结果中确定出第一语种识别结果作为最终语种识别结果。

较佳的，通过其中N个语音识别引擎分别对所述第一语音输入信息进行识别，获得N个语种识别结果，包括：

根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎；

通过所述N个语音识别引擎分别对所述第一语音输入信息进行识别，获得所述N个语种识别结果。

较佳的，根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，包括：

根据所述电子设备中存储的语音信息和/或文字信息，确定所述第一语音输入信息近似属于的N个语种；

在所述M个语音识别引擎中，确定与所述N个语种分别对应的所述N个语音识别引擎。

根据在接收所述第一语音输入信息之前的第一预设时长内接收的语音输入信息，和/或，根据在接收所述第一语音输入信息之后的第二预设时长内接收的语音输入信息，确定所述第一语音输入信息近似属于的N个语种；

根据所述电子设备中存储的联系人的联系电话信息，分别确定各联系电话信息所属的地域信息；

根据确定出的多个地域信息，确定其中所占比例大于预设比例阈值的地域信息；

确定所占比例大于预设比例阈值的地域信息所分别对应的语种，共确定出N个语种；

较佳的，根据所述语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，包括：

根据所述电子设备中存储的通话信息，分别确定通话频率高于预设通话频率的联系电话信息所属的地域信息；

较佳的，根据预设规则从所述N个语种识别结果中确定出第一语种识别结果作为最终语种识别结果，包括：

获得所述N个语音识别引擎输出的N个置信度；

从所述N个置信度中确定值最大的置信度，并确定该值最大的置信度所对应的语音识别引擎；

确定从所述N个语种识别结果中选择该值最大的置信度所对应的语音识别引擎所对应的语种识别结果作为所述第一语种识别结果。

较佳的，在根据预设规则从所述N个语种识别结果中确定出第一语种识别结果作为最终语种识别结果之后，还包括：

判断选择第一语音识别引擎输出的语种识别结果作为最终语种识别结果的次数是否大于预设次数阈值；其中，所述第一语音识别引擎对应于所述第一语种识别结果；

当选择所述第一语音识别引擎输出的语种识别结果作为最终语种识别结果的次数大于所述预设次数阈值时，确定所述第一语音识别引擎为默认语音识别引擎。

通过所述N个语音识别引擎中的至少一个语音识别引擎对所述第一语音输入信息进行语义识别，获得至少一个语义识别结果；其中，所述至少一个语音识别引擎中包括第一语音识别引擎，所述第一语音识别引擎对应于所述第一语种识别结果；

根据所述至少一个语义识别结果，得到所述第一语音输入信息的最终语义识别结果。

较佳的，根据所述至少一个语义识别结果，得到所述第一语音输入信息的最终语义识别结果，包括：

当得到的语义识别结果的数量为1时，将该语义识别结果作为所述最终语义识别结果；

当得到的语义识别结果的数量不小于2时，将所述至少一个语义识别结果进行融合，得到所述最终语义识别结果。

一种电子设备，所述电子设备中安装有M个语音识别引擎，M为不小于2的整数，所述M个语音识别引擎用于对语音信息进行识别，其中每个语音识别引擎对应一个语种；所述电子设备包括：

第一获取单元，用于获得第一语音输入信息；

处理单元，用于通过其中N个语音识别引擎分别对所述第一语音输入信息进行语种识别，获得N个语种识别结果；N为不大于M的正整数；

确定单元，用于根据预设规则从所述N个语种识别结果中确定出第一语种识别结果作为最终语种识别结果。

较佳的，所述处理单元具体用于：根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎；通过所述N个语音识别引擎分别对所述第一语音输入信息进行识别，获得所述N个语种识别结果。

较佳的，所述处理单元具体用于根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，具体包括：根据所述电子设备中存储的语音信息和/或文字信息，确定所述第一语音输入信息近似属于的N个语种；在所述M个语音识别引擎中，确定与所述N个语种分别对应的所述N个语音识别引擎。

较佳的，所述处理单元具体用于根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，具体包括：根据在接收所述第一语音输入信息之前的第一预设时长内接收的语音输入信息，和/或，根据在接收所述第一语音输入信息之后的第二预设时长内接收的语音输入信息，确定所述第一语音输入信息近似属于的N个语种；在所述M个语音识别引擎中，确定与所述N个语种分别对应的所述N个语音识别引擎。

较佳的，所述处理单元具体用于根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，具体包括：根据所述电子设备中存储的联系人的联系电话信息，分别确定各联系电话信息所属的地域信息；根据确定出的多个地域信息，确定其中所占比例大于预设比例阈值的地域信息；确定所占比例大于预设比例阈值的地域信息所分别对应的语种，共确定出N个语种；在所述M个语音识别引擎中，确定与所述N个语种分别对应的所述N个语音识别引擎。

较佳的，所述处理单元具体用于根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，具体包括：根据所述电子设备中存储的通话信息，分别确定通话频率高于预设通话频率的联系电话信息所属的地域信息；根据确定出的多个地域信息，确定其中所占比例大于预设比例阈值的地域信息；确定所占比例大于预设比例阈值的地域信息所分别对应的语种，共确定出N个语种；在所述M个语音识别引擎中，确定与所述N个语种分别对应的所述N个语音识别引擎。

较佳的，所述确定单元具体用于：获得所述N个语音识别引擎输出的N个置信度；从所述N个置信度中确定值最大的置信度，并确定该值最大的置信度所对应的语音识别引擎；确定从所述N个语种识别结果中选择该值最大的置信度所对应的语音识别引擎所对应的语种识别结果作为所述第一语种识别结果。

较佳的，所述电子设备还包括判断单元；

所述判断单元用于判断选择第一语音识别引擎输出的语种识别结果作为最终语种识别结果的次数是否大于预设次数阈值；其中，所述第一语音识别引擎对应于所述第一语种识别结果；

所述确定单元还用于：当选择所述第一语音识别引擎输出的语种识别结果作为最终语种识别结果的次数大于所述预设次数阈值时，确定所述第一语音识别引擎为默认语音识别引擎。

较佳的，所述电子设备还包括第二获取单元；

所述处理单元还用于：通过所述N个语音识别引擎中的至少一个语音识别引擎对所述第一语音输入信息进行语义识别，获得至少一个语义识别结果；其中，所述至少一个语音识别引擎中包括第一语音识别引擎，所述第一语音识别引擎对应于所述第一语种识别结果；

所述第二获取单元用于：根据所述至少一个语义识别结果，得到所述第一语音输入信息的最终语义识别结果。

较佳的，所述第二获取单元具体用于：当得到的语义识别结果的数量为1时，将该语义识别结果作为所述最终语义识别结果；当得到的语义识别结果的数量不小于2时，将所述至少一个语义识别结果进行融合，得到所述最终语义识别结果。本发明实施例中，在获得所述第一语音输入信息后，可以将所述第一语音输入信息送给多个语音识别引擎进行语种识别，由于每个语音识别引擎对应一个语种，从而可以通过多个语音识别引擎得到多个语种识别结果，再从多个语种识别结果中选择一个最终语种识别结果，这样，对于电子设备来说，其只需接收一段语音输入信息就能开始进行分析，由于无需接收用户的两个操作，自然也就减少了串行等待过程，电子设备的处理过程较短，显然处理效率较高，减少了用户的等待时间。同时，对于用户来说，其仅需要输入语音信息即可获得结果，无需手动选择语种，所需的操作较少，提高用户体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例中信息处理方法的主要流程图；

图2为本发明实施例中电子设备的主要结构框图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚明白，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行。并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本发明实施例中的信息处理方法可以应用于电子设备，所述电子设备中安装有M个语音识别引擎，M为不小于2的整数，所述M个语音识别引擎用于对语音信息进行识别，其中每个语音识别引擎对应一个语种；所述方法包括以下步骤：获得第一语音输入信息；通过其中N个语音识别引擎分别对所述第一语音输入信息进行语种识别，获得N个语种识别结果；N为不大于M的正整数；根据预设规则从所述N个语种识别结果中确定出第一语种识别结果作为最终语种识别结果。

本发明实施例中，在获得所述第一语音输入信息后，可以将所述第一语音输入信息送给多个语音识别引擎进行语种识别，由于每个语音识别引擎对应一个语种，从而可以通过多个语音识别引擎得到多个语种识别结果，再从多个语种识别结果中选择一个最终语种识别结果，这样，对于电子设备来说，其只需接收一段语音输入信息就能开始进行分析，由于无需接收用户的两个操作，自然也就减少了串行等待过程，电子设备的处理过程较短，显然处理效率较高，减少了用户的等待时间。同时，对于用户来说，其仅需要输入语音信息即可获得结果，无需手动选择语种，所需的操作较少，提高用户体验。

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例中，所述电子设备可以是PC（个人计算机）、PAD（平板电脑）、手机、智能电视等等不同的电子设备，本发明对此不作限制。

另外，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

下面结合附图对本发明优选的实施方式进行详细说明。

请参见图1，本发明实施例提供一种信息处理方法，所述方法可以应用于电子设备，所述电子设备中安装有M个语音识别引擎，M为不小于2的整数，所述M个语音识别引擎用于对语音信息进行识别，其中每个语音识别引擎对应一个语种。所述方法的主要流程描述如下。

步骤101：获得第一语音输入信息。

首先，所述电子设备可以获得所述第一语音输入信息。所述第一语音输入信息可以是一段话，其中包括多个句子，或者所述第一语音输入信息也可以只包括一句话，即只包括一个句子。

例如，所述电子设备可以具有声音采集单元，例如所述声音采集单元可以是麦克，所述电子设备可以通过所述声音采集单元获得所述第一语音输入信息。或者，所述电子设备也可以通过网络获得其他电子设备传输的所述第一语音输入信息。或者，所述第一语音输入信息可以存储在所述电子设备中，所述电子设备可以从所述电子设备的存储区中获得所述第一语音输入信息。或者所述电子设备也可以通过其他方式获得所述第一语音输入信息，对于所述第一语音输入信息的获取方式本发明不做限制。

例如，如果所述电子设备通过所述声音采集单元获得所述第一语音输入信息，那么所述第一语音输入信息可能是用户通过所述声音采集单元输入的一段话，或一句话。

步骤102：通过其中N个语音识别引擎分别对所述第一语音输入信息进行语种识别，获得N个语种识别结果；N为不大于M的正整数。

较佳的，通过所述N个语音识别引擎分别对所述第一语音输入信息进行识别，获得搜索N个语种识别结果，具体可以包括：根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎；通过所述N个语音识别引擎分别对所述第一语音输入信息进行识别，获得所述N个语种识别结果。

所述电子设备在获得所述第一语音输入信息后，可以从所述M个语音识别引擎中确定所述N个语音识别引擎。

例如，N可以等于M，即所述电子设备将所述第一语音输入信息分别送给所述电子设备中安装的每个语音识别引擎进行语种识别，这样得到的语种识别结果较多，能够使最终得到的语种识别结果更为准确。

例如，N可以小于M，则所述电子设备从所述M个语音识别引擎中确定所述N个语音识别引擎，可以有多种不同的确定方式。

较佳的，根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，一种可能的方式例如是：所述电子设备根据所述第一语音输入信息，从所述M个语音识别引擎中随机确定所述N个语音识别引擎。这种确定方式较为简单，实现较为方便。

较佳的，根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，一种可能的方式例如是：根据在接收所述第一语音输入信息之前的第一预设时长内接收的语音输入信息，和/或，根据在接收所述第一语音输入信息之后的第二预设时长内接收的语音输入信息，确定所述第一语音输入信息近似属于的N个语种；在所述M个语音识别引擎中，确定与所述N个语种分别对应的所述N个语音识别引擎。

这种方式，可以简单理解为根据上下文来确定所述第一语音输入信息近似属于的语种。在接收所述第一语音输入信息之前的所述第一预设时长内接收的语音输入信息，为所述第一语音输入信息的“上文”，在接收所述第一语音输入信息之后的所述第二预设时长内接收的语音输入信息，为所述第一语音输入信息的“下文”。例如，所述电子设备已确定所述第一语音输入信息的“上文”的语种，和/或，所述电子设备已确定所述第一语音输入信息的“下文”的语种，则所述电子设备可以确定所述第一语音输入信息也可能与所述第一语音输入信息的“上文”的语种和/或所述第一语音输入信息的“下文”的语种相同。在确定所述第一语音输入信息近似属于的所述N个语种后，由于每个语种对应一个语音输入引擎，则可以相应确定出所述N个语种对应的所述N个语音输入引擎。

较佳的，根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，一种可能的方式例如是：根据所述电子设备中存储的联系人的联系电话信息，分别确定各联系电话信息所属的地域信息；根据确定出的多个地域信息，确定其中所占比例大于预设比例阈值的地域信息；确定所占比例大于预设比例阈值的地域信息所分别对应的语种，共确定出N个语种；在所述M个语音识别引擎中，确定与所述N个语种分别对应的所述N个语音识别引擎。

所述电子设备中如果包括有联系人信息，则可能每个联系人信息或部分联系人信息中会包含有相应联系人的联系电话信息。所述电子设备可以根据所述电子设备中存储的各联系电话信息分别确定出各联系电话信息所对应的地域信息。例如，无论联系电话信息是座机号码还是手机号码，都可以确定出其对应的地域信息。例如，如果联系电话信息是座机号码，例如该座机号码的区号为“021”，则可以确定出该座机号码对应的地域信息为上海市，例如，如果联系电话信息是手机号码，例如该手机号码为“1860801XXXX”，则可以确定出该手机号码对应的地域信息为四川省成都市。

根据多个联系电话信息可以确定出多个地域信息，所述电子设备中可以预先设定有所述预设比例阈值。例如，根据多个联系电话信息共确定出了5个地域信息，分别为北京市、上海市、厦门市、长春市、成都市，则可以分别确定出这5个地域信息所占的比例。例如，共确定出有10个联系电话信息对应的地域信息为北京市，12个联系电话信息对应的地域信息为上海市，18个联系电话信息对应的地域信息为厦门市，18个联系电话信息对应的地域信息为长春市，16个联系电话信息对应的地域信息为成都市，则可以分别计算出这5个地域信息所占的比例，例如计算出北京市所占的比例为14%，上海市所占的比例为16%，厦门市所占的比例为24%，长春市所占的比例为24%，成都市所占的比例为22%。例如所述预设比例阈值为20%，则所述电子设备可以确定出厦门市、长春市和成都市所占的比例均大于所述预设比例阈值，所述电子设备可以分别确定出厦门市、长春市和成都市对应的语种，共确定出3个语种，则可以在所述M个语音识别引擎中确定与这3个语种所对应的3个语音识别引擎。

较佳的，根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，一种可能的方式例如是：根据所述电子设备中存储的通话信息，分别确定通话频率高于预设通话频率的联系电话信息所属的地域信息；根据确定出的多个地域信息，确定其中所占比例大于预设比例阈值的地域信息；确定所占比例大于预设比例阈值的地域信息所分别对应的语种，共确定出N个语种；在所述M个语音识别引擎中，确定与所述N个语种分别对应的所述N个语音识别引擎。

如果所述电子设备具有通讯功能，则所述电子设备可以根据所述电子设备中存储的通话信息分别确定通话频率高于所述预设通话频率的联系电话信息所属的地域信息，同样的，可以确定出多个地域信息，所述电子设备中可以预先设定有所述预设比例阈值，确定各地域信息中所占的比例大于所述预设比例阈值的地域信息，从而可以确定这些地域信息分别对应的语种，共确定出所述N个语种，再从所述M个语音识别引擎中确定所述N个语种所分别对应的语音识别引擎，共确定出所述N个语音识别引擎。

步骤103：根据预设规则从所述N个语种识别结果中确定出第一语种识别结果作为最终语种识别结果。

在获得所述N个语种识别结果之后，所述电子设备需要从所述N个语种识别结果中选择一个作为所述最终语种识别结果。

较佳的，本发明实施例中，根据预设规则从所述N个语种识别结果中确定出第一语种识别结果作为最终语种识别结果，具体包括：获得所述N个语音识别引擎输出的N个置信度；从所述N个置信度中确定值最大的置信度，并确定该值最大的置信度所对应的语音识别引擎；确定从所述N个语种识别结果中选择该值最大的置信度所对应的语音识别引擎所对应的语种识别结果作为所述第一语种识别结果。

即，每个语音识别引擎在对所述第一语音输入信息进行语种识别时，除了输出语种识别结果之外，还可以输出对于该识别的置信度。例如，N=3，第一个语音识别引擎对应的语种例如为中文，则所述第一个语音识别引擎输出的语种识别结果为“中文”，且输出的置信度为“65”，第二个语音识别引擎对应的语种例如为英文，则所述第二个语音识别引擎输出的语种识别结果为“英文”，且输出的置信度为“80”，第三个语音识别引擎对应的语种例如为法文，则所述第三个语音识别引擎输出的语种识别结果为“法文”，且输出的置信度为“92”，可见，所述第三个语音识别引擎输出的置信度最高，所述电子设备可以确定选择该值最大的置信度所对应的语音识别引擎输出的语种识别结果作为所述最终语种识别结果，即在本实施例中，所述最终语种识别结果为“法文”。

需要说明的是，本发明实施例中，除了不同的国别对应的语种外，对于同一个国家来说，不同的方言也可以视为不同的语种，即不同的方言也对应于不同的语音识别引擎。例如对于中国来说，河南话可以对应一个语音识别引擎，上海话可以对应另一个语音识别引擎，等等。

进一步的，本发明一实施例中，在根据预设规则从所述N个语种识别结果中确定出所述第一语种识别结果作为所述最终语种识别结果之后，还可以包括：判断选择第一语音识别引擎输出的语种识别结果作为最终语种识别结果的次数是否大于预设次数阈值；其中，所述第一语音识别引擎对应于所述第一语种识别结果；当选择所述第一语音识别引擎输出的语种识别结果作为最终语种识别结果的次数大于所述预设次数阈值时，确定所述第一语音识别引擎为默认语音识别引擎。

例如，所述电子设备确定语音识别引擎A所输出的语种识别结果作为所述最终识别结果，则所述电子设备可以继续确定选择所述语音识别引擎A所输出的语种识别结果作为所述最终识别结果的次数是否大于所述预设次数阈值，所述预设次数阈值可以由所述电子设备自行设定，或者也可以由用户来进行设置。如果选择所述语音识别引擎A所输出的语种识别结果作为所述最终识别结果的次数大于所述预设次数阈值，则可以确定用户基本是一直使用同一个语种在进行输入，则所述电子设备可以将所述语音识别引擎A作为所述默认语音识别引擎，之后如果有语音输入信息继续输入，则所述电子设备可以选择直接送给所述语音识别引擎A进行识别，而无需再同时送给多个语音识别引擎来进行识别，节省了***资源。

当然，即使确定了所述默认语音识别引擎，在有语音输入信息继续输入时，所述电子设备也可以继续将输入的语音输入信息送给所述N个语音识别引擎进行识别，这样能够尽量使语种识别结果更为准确。

进一步的，本发明一实施例中，在根据预设规则从所述N个语种识别结果中确定出所述第一语种识别结果作为所述最终语种识别结果之后，还可以包括：通过所述N个语音识别引擎中的至少一个语音识别引擎对所述第一语音输入信息进行语义识别，获得至少一个语义识别结果；其中，所述至少一个语音识别引擎中包括第一语音识别引擎，所述第一语音识别引擎对应于所述第一语种识别结果；根据所述至少一个语义识别结果，得到所述第一语音输入信息的最终语义识别结果。

即，本发明实施例中，对于一个语音输入信息，是先识别其对应的语种，之后再识别其对应的语义。

在得到所述最终语种识别结果之后，所述电子设备可以继续识别所述第一语音输入信息的语义。

较佳的，因为所述最终语种识别结果对应的语音识别引擎为所述第一语音识别引擎，则所述电子设备可以只通过所述第一语音识别引擎来识别所述第一语音输入信息的语义，以所述第一语音识别引擎输出的语义识别结果作为所述最终语义识别结果，这样可以节省***资源，所述电子设备也能够较快地得到所述最终语义识别结果。

较佳的，所述电子设备也可以通过所述至少一个语音识别引擎来对所述第一语音输入信息进行语义识别，在获得所述至少一个语义识别结果之后，再根据所述至少一个语义识别结果来得到所述最终语义识别结果。因为即使所述最终语种识别结果对应的语音识别引擎为所述第一语音识别引擎，但有时用户在说一句话或一段话的时候，不一定一直使用一个语种，例如用户可能在中文里夹杂有英文，或者可能在普通话里夹杂有四川话，而一个语音识别引擎只能识别一个语种，如果所述第一语音输入信息是两个或多个语种夹杂，则只采用一个语音识别引擎的话识别出的语义可能会不够准确。

因此，所述电子设备可以继续通过多个语音识别引擎来识别所述第一语音输入信息的语义，每个语音识别引擎可以输出一个语义识别结果，所述电子设备可以获得多个语义识别结果，再通过多个语义识别结果来获得所述最终语义识别结果，这样通过多个语音识别引擎共同作业，分别识别不同的语种，能够使得到的语义识别结果更为准确。

较佳的，本发明实施例中，根据所述至少一个语义识别结果，得到所述第一语音输入信息的最终语义识别结果，包括：当得到的语义识别结果的数量为1时，将该语义识别结果作为所述最终语义识别结果；当得到的语义识别结果的数量不小于2时，将所述至少一个语义识别结果进行融合，得到所述最终语义识别结果。

其中，如果得到的语义识别结果的数量为1，则该语义识别结果为所述第一语音识别引擎输出的语义识别结果。

本发明实施例中，无论所述第一语音输入信息是一个句子，还是多个句子，一个语音识别引擎在对所述第一语音输入信息进行识别时，都可以将所述第一语音输入信息分为多个小单元来进行识别，其中每个小单元可以包括一个字或多个字，小单元的划分方法对于每个语音识别引擎来说可以相同，则对于同一个语音输入信息来说，每个语音识别引擎可能会将其划分为相同的小单元。

例如，对于一个语音识别引擎来说，其在识别一个语音输入信息的过程中，会对识别的每个小单元进行评分，类似于给出每个小单元的置信度。例如，将所述第一语音输入信息送给两个语音识别引擎进行语义识别，所述第一语音输入信息分为3个小单元，对于第1个小单元来说，第一个语音识别引擎给其评分为94，第二个语音识别引擎给其评分为30，对于第2个小单元来说，第一个语音识别引擎给其评分为54，第二个语音识别引擎给其评分为90，对于第3个小单元来说，第一个语音识别引擎给其评分为95，第二个语音识别引擎给其评分为43，则所述电子设备可以将两个语义识别结果进行融合，对于第1个小单元，因为第一个语音识别引擎给出的评分高于第二个语音识别引擎给出的评分，因此选择第一个语音识别引擎的识别结果，对于第2个小单元，因为第一个语音识别引擎给出的评分低于第二个语音识别引擎给出的评分，因此选择第二个语音识别引擎的识别结果，对于第3个小单元，因为第一个语音识别引擎给出的评分高于第二个语音识别引擎给出的评分，因此选择第一个语音识别引擎的识别结果，从而，根据选择的识别结果得到所述最终语义识别结果，可见所述最终语义识别结果综合了多个语音识别引擎的语义识别结果，更为准确，更贴近一个语音输入信息的原义。

请参见图2，本发明实施例提供一种电子设备，所述电子设备中可以安装有M个语音识别引擎，M为不小于2的整数，所述M个语音识别引擎用于对语音信息进行识别，其中每个语音识别引擎对应一个语种。所述电子设备可以包括第一获取单元201、处理单元202和确定单元203。较佳的，图2中所述的电子设备与如前所述的电子设备为同一电子设备。

第一获取单元201可以用于获得第一语音输入信息。

处理单元202可以用于通过其中N个语音识别引擎分别对所述第一语音输入信息进行语种识别，获得N个语种识别结果；N为不大于M的正整数。

确定单元203可以用于根据预设规则从所述N个语种识别结果中确定出第一语种识别结果作为最终语种识别结果。

较佳的，本发明实施例中，处理单元202具体可以用于：根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎；通过所述N个语音识别引擎分别对所述第一语音输入信息进行识别，获得所述N个语种识别结果。

较佳的，本发明实施例中，处理单元202具体用于根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，具体包括：根据所述电子设备中存储的语音信息和/或文字信息，确定所述第一语音输入信息近似属于的N个语种；在所述M个语音识别引擎中，确定与所述N个语种分别对应的所述N个语音识别引擎。

较佳的，本发明实施例中，处理单元202具体用于根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，具体包括：根据在接收所述第一语音输入信息之前的第一预设时长内接收的语音输入信息，和/或，根据在接收所述第一语音输入信息之后的第二预设时长内接收的语音输入信息，确定所述第一语音输入信息近似属于的N个语种；在所述M个语音识别引擎中，确定与所述N个语种分别对应的所述N个语音识别引擎。

较佳的，本发明实施例中，处理单元202具体用于根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，具体包括：根据所述电子设备中存储的联系人的联系电话信息，分别确定各联系电话信息所属的地域信息；根据确定出的多个地域信息，确定其中所占比例大于预设比例阈值的地域信息；确定所占比例大于预设比例阈值的地域信息所分别对应的语种，共确定出N个语种；在所述M个语音识别引擎中，确定与所述N个语种分别对应的所述N个语音识别引擎。

较佳的，本发明实施例中，处理单元202具体用于根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，具体包括：根据所述电子设备中存储的通话信息，分别确定通话频率高于预设通话频率的联系电话信息所属的地域信息；根据确定出的多个地域信息，确定其中所占比例大于预设比例阈值的地域信息；确定所占比例大于预设比例阈值的地域信息所分别对应的语种，共确定出N个语种；在所述M个语音识别引擎中，确定与所述N个语种分别对应的所述N个语音识别引擎。

较佳的，本发明实施例中，确定单元203具体可以用于：获得所述N个语音识别引擎输出的N个置信度；从所述N个置信度中确定值最大的置信度，并确定该值最大的置信度所对应的语音识别引擎；确定从所述N个语种识别结果中选择该值最大的置信度所对应的语音识别引擎所对应的语种识别结果作为所述第一语种识别结果。

较佳的，本发明实施例中，所述电子设备还可以包括判断单元。

所述判断单元可以用于判断选择第一语音识别引擎输出的语种识别结果作为最终语种识别结果的次数是否大于预设次数阈值；其中，所述第一语音识别引擎对应于所述第一语种识别结果；确定单元203还用于：当选择所述第一语音识别引擎输出的语种识别结果作为最终语种识别结果的次数大于所述预设次数阈值时，确定所述第一语音识别引擎为默认语音识别引擎。

较佳的，本发明实施例中，所述电子设备还可以包括第二获取单元。

处理单元202可以用于：通过所述N个语音识别引擎中的至少一个语音识别引擎对所述第一语音输入信息进行语义识别，获得至少一个语义识别结果；其中，所述至少一个语音识别引擎中包括第一语音识别引擎，所述第一语音识别引擎对应于所述第一语种识别结果。

所述第二获取单元可以用于：根据所述至少一个语义识别结果，得到所述第一语音输入信息的最终语义识别结果。

较佳的，本发明实施例中，所述第二获取单元具体可以用于：当得到的语义识别结果的数量为1时，将该语义识别结果作为所述最终语义识别结果；当得到的语义识别结果的数量不小于2时，将所述至少一个语义识别结果进行融合，得到所述最终语义识别结果。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。上述描述的***，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的***，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）或处理器（processor）执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

具体来讲，本申请实施例中的一种信息处理方法对应的计算机程序指令可以被存储在光盘，硬盘，U盘等存储介质上，当存储介质中的与一种信息处理方法对应的计算机程序指令被一电子设备读取或被执行时，包括如下步骤：

获得第一语音输入信息；

可选的，所述存储介质中存储的与步骤：通过其中N个语音识别引擎分别对所述第一语音输入信息进行识别，获得N个语种识别结果，对应的计算机指令在具体被执行过程中，具体包括：

可选的，所述存储介质中存储的与步骤：根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，对应的计算机指令在被执行的过程中，具体包括：

可选的，所述存储介质中存储的与步骤：根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，对应的计算机指令在具体被执行过程中，具体包括：

可选的，所述存储介质中存储的在与步骤：根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，对应的计算机指令在被执行的过程中，具体包括：

可选的，所述存储介质中存储的在与步骤：根据所述语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，对应的计算机指令在被执行的过程中，具体包括：

可选的，所述存储介质中存储的在与步骤：根据预设规则从所述N个语种识别结果中确定出第一语种识别结果作为最终语种识别结果，对应的计算机指令在被执行的过程中，具体包括：

获得所述N个语音识别引擎输出的N个置信度；

可选的，所述存储介质中存储的在与步骤：在根据预设规则从所述N个语种识别结果中确定出第一语种识别结果作为最终语种识别结果，对应的计算机指令在被执行之后，还包括：

可选的，所述存储介质中存储的在与步骤：根据预设规则从所述N个语种识别结果中确定出第一语种识别结果作为最终语种识别结果，对应的计算机指令在被执行之后，还包括：

可选的，所述存储介质中存储的在与步骤：根据所述至少一个语义识别结果，得到所述第一语音输入信息的最终语义识别结果，对应的计算机指令在被执行的过程中，具体包括：

以上所述，以上实施例仅用以对本申请的技术方案进行了详细介绍，但以上实施例的说明只是用于帮助理解本发明的方法及其核心思想，不应理解为对本发明的限制。本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。

Claims

1.一种信息处理方法，应用于电子设备，所述电子设备中安装有M个语音识别引擎，M为不小于2的整数，所述M个语音识别引擎用于对语音信息进行识别，其中每个语音识别引擎对应一个语种；所述方法包括以下步骤：

获得第一语音输入信息；

2.如权利要求1所述的方法，其特征在于，通过其中N个语音识别引擎分别对所述第一语音输入信息进行识别，获得N个语种识别结果，包括：

3.如权利要求2所述的方法，其特征在于，根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，包括：

4.如权利要求2所述的方法，其特征在于，根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，包括：

5.如权利要求2所述的方法，其特征在于，根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，包括：

6.如权利要求2所述的方法，其特征在于，根据所述语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，包括：

7.如权利要求1-6任一所述的方法，其特征在于，根据预设规则从所述N个语种识别结果中确定出第一语种识别结果作为最终语种识别结果，包括：

获得所述N个语音识别引擎输出的N个置信度；

8.如权利要求7所述的方法，其特征在于，在根据预设规则从所述N个语种识别结果中确定出第一语种识别结果作为最终语种识别结果之后，还包括：

9.如权利要求7所述的方法，其特征在于，在根据预设规则从所述N个语种识别结果中确定出第一语种识别结果作为最终语种识别结果之后，还包括：

10.如权利要求9所述的方法，其特征在于：根据所述至少一个语义识别结果，得到所述第一语音输入信息的最终语义识别结果，包括：

11.一种电子设备，所述电子设备中安装有M个语音识别引擎，M为不小于2的整数，所述M个语音识别引擎用于对语音信息进行识别，其中每个语音识别引擎对应一个语种；所述电子设备包括：

第一获取单元，用于获得第一语音输入信息；

12.如权利要求11所述的电子设备，其特征在于，所述处理单元具体用于：根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎；通过所述N个语音识别引擎分别对所述第一语音输入信息进行识别，获得所述N个语种识别结果。

13.如权利要求12所述的电子设备，其特征在于，所述处理单元具体用于根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，具体包括：根据所述电子设备中存储的语音信息和/或文字信息，确定所述第一语音输入信息近似属于的N个语种；在所述M个语音识别引擎中，确定与所述N个语种分别对应的所述N个语音识别引擎。

14.如权利要求12所述的电子设备，其特征在于，所述处理单元具体用于根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，具体包括：根据在接收所述第一语音输入信息之前的第一预设时长内接收的语音输入信息，和/或，根据在接收所述第一语音输入信息之后的第二预设时长内接收的语音输入信息，确定所述第一语音输入信息近似属于的N个语种；在所述M个语音识别引擎中，确定与所述N个语种分别对应的所述N个语音识别引擎。

15.如权利要求12所述的电子设备，其特征在于，所述处理单元具体用于根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，具体包括：根据所述电子设备中存储的联系人的联系电话信息，分别确定各联系电话信息所属的地域信息；根据确定出的多个地域信息，确定其中所占比例大于预设比例阈值的地域信息；确定所占比例大于预设比例阈值的地域信息所分别对应的语种，共确定出N个语种；在所述M个语音识别引擎中，确定与所述N个语种分别对应的所述N个语音识别引擎。

16.如权利要求12所述的电子设备，其特征在于，所述处理单元具体用于根据所述第一语音输入信息，从所述M个语音识别引擎中确定所述N个语音识别引擎，具体包括：根据所述电子设备中存储的通话信息，分别确定通话频率高于预设通话频率的联系电话信息所属的地域信息；根据确定出的多个地域信息，确定其中所占比例大于预设比例阈值的地域信息；确定所占比例大于预设比例阈值的地域信息所分别对应的语种，共确定出N个语种；在所述M个语音识别引擎中，确定与所述N个语种分别对应的所述N个语音识别引擎。

17.如权利要求11-16任一所述的电子设备，其特征在于，所述确定单元具体用于：获得所述N个语音识别引擎输出的N个置信度；从所述N个置信度中确定值最大的置信度，并确定该值最大的置信度所对应的语音识别引擎；确定从所述N个语种识别结果中选择该值最大的置信度所对应的语音识别引擎所对应的语种识别结果作为所述第一语种识别结果。

18.如权利要求16所述的电子设备，其特征在于，所述电子设备还包括判断单元；

19.如权利要求16所述的电子设备，其特征在于，所述电子设备还包括第二获取单元；

20.如权利要求19所述的电子设备，其特征在于，所述第二获取单元具体用于：当得到的语义识别结果的数量为1时，将该语义识别结果作为所述最终语义识别结果；当得到的语义识别结果的数量不小于2时，将所述至少一个语义识别结果进行融合，得到所述最终语义识别结果。