CN104424944A

CN104424944A - 一种信息处理方法及电子设备

Info

Publication number: CN104424944A
Application number: CN201310364228.4A
Authority: CN
Inventors: 王鸷翔
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2013-08-19
Filing date: 2013-08-19
Publication date: 2015-03-18
Anticipated expiration: 2033-08-19
Also published as: CN104424944B

Abstract

本发明公开了一种信息处理方法及电子设备，该方法应用一电子设备中，所述方法包括：获得一触发指令，根据所述触发指令启动语音识别引擎，所述语音识别引擎具有收音阶段、识别处理阶段以及结果反馈阶段，当所述语音识别引擎处于所述收音阶段时获得第一语音数据；当所述语音识别引擎处于所述识别处理阶段，获得一附加参数信息，将所述附加参数信息作用于所述语音识别引擎对所述第一语音数据进行识别处理的所述识别处理阶段，产生第一处理结果；当所述语音识别引擎处于所述结果反馈阶段将所述第一处理结果输出。可以根据用户输入的附加参数进一步的修正语音识别的最后结果，从而提高语音识别的速度及准确度。

Description

一种信息处理方法及电子设备

技术领域

本发明涉及电子技术领域，尤其涉及一种信息处理方法及电子设备。

背景技术

随着互联网的快速发展，以及手机等移动终端的普及应用，语音识别技术已经被广泛的应用到各种智能电子设备中。语音识别技术，也被称为自动语音识别Automatic Speech Recognition，(ASR)，其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。

语音识别是一门交叉学科。近二十年来，语音识别技术取得显著进步，开始从实验室走向市场。人们预计，未来10年内，语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别技术所涉及的领域包括：信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

语音识别技术被广泛的用于家用电器、电脑以及移动通信设备中。而且很多通信设备中已采用基于服务器的语音识别技术并提供搜索功能和用于作为语音输入功能。

本申请发明人在实现本申请实施例中技术方案的过程中，发现现有技术存在如下技术问题：

现有的语音识别应用中，语音录入之后识别过程相对复杂所以对应花费的时间较长，但是现有方案中对于语音指令的识别过程只是笼统的提示正在处理，使得用户在输入语音指令后，不能确定当前语音指令确切的处理进度是怎样的，所以造成用户的感受度不好。

发明内容

本发明提供一种信息处理方法及电子设备，本发明所提供的方法和装置解决现有技术中语音录入之后识别过程相对复杂所以对应话费的时间较长，但是现有技术中只是笼统的提示正在处理，使得用户不能知道当前确切的处理进度是怎样的，所以造成用户的感受度并不好的问题。

本发明提供一种信息处理方法，该方法应用一电子设备中，所述方法包括：

获得一触发指令，根据所述触发指令启动语音识别引擎，所述语音识别引擎具有收音阶段、识别处理阶段以及结果反馈阶段，所述收音阶段用于获得输入的语音数据，所述识别处理阶段用于对所述收音阶段所获得的语音数据进行识别并执行所述语音数据对应的指令，所述结果反馈阶段用于将所述识别处理阶段的处理结果进行输出；

当所述语音识别引擎处于所述收音阶段时获得第一语音数据；

当所述语音识别引擎处于所述识别处理阶段，获得一附加参数信息，将所述附加参数信息作用于所述语音识别引擎对所述第一语音数据进行识别处理的所述识别处理阶段，产生第一处理结果；

当所述语音识别引擎处于所述结果反馈阶段将所述第一处理结果输出。

可选的方案，获得一附加参数信息包括：所述电子设备通过所述电子设备的感应单元采集的参数信息。

可选的方案，获得一附加参数信息之前，该方法还进一步包括：

显示多个预设类别标示，使得用户可选择所述多个预设类别标示对应生成附加参数信息。

所述语音识别引擎处于所述识别处理阶段，确定所述识别处理阶段当前执行的识别步骤，获取与当前识别步骤对应的预设图标，所述预设图标显示识别状态当前的处理进度。

可选的方案，确定所述识别处理阶段当前执行的识别步骤之前，该方法还进一步包括：

当检测到识别处理阶段当前是对所述语音数据的内容进行识别，则确定当前执行的是第一识别步骤；

当检测到识别处理阶段当前是根据识别得到的语音数据的内容对应的类型，则确定当前执行的是第二识别步骤；

当检测到识别处理阶段当前是在一类型对应的内容中确定语音识别结果，则确定当前执行的是第三识别步骤。

可选的方案，所述第二识别步骤对应的第二预设图标包括多个，其中，每个第二预设图标对应所述语音识别结果的一种类型。

可选的方案，将所述附加参数信息作用于所述语音识别引擎对所述第一语音数据进行识别处理的所述识别处理阶段，产生第一处理结果包括：

检测所述附加参数信息是否为从多个第二预设图标中选择目标类型的选择信息，如果是，则根据所述附加参数信息确定的目标类型中确定语音识别所对应的语音识别结果。

根据上述方法本发明还提供一种电子设备，该电子设备包括：

启动模块，用于获得一触发指令，根据所述触发指令启动语音识别引擎，所述语音识别引擎具有收音阶段、识别处理阶段以及结果反馈阶段，所述收音阶段用于获得输入的语音数据，所述识别处理阶段用于对所述收音阶段所获得的语音数据进行识别并执行所述语音数据对应的指令，所述结果反馈阶段用于将所述识别处理阶段的处理结果进行输出；

获取模块，用于当所述语音识别引擎处于所述收音阶段时获得第一语音数据；

修正模块，用于当所述语音识别引擎处于所述识别处理阶段，获得一附加参数信息，将所述附加参数信息作用于所述语音识别引擎对所述第一语音数据进行识别处理的所述识别处理阶段，产生第一处理结果；

输出模块，用于当所述语音识别引擎处于所述结果反馈阶段将所述第一处理结果输出。

可选的方案，该电子设备还包括：

进度确定模块，用于所述语音识别引擎处于所述识别处理阶段，确定所述识别处理阶段当前执行的识别步骤，获取与当前识别步骤对应的预设图标，所述预设图标显示识别状态当前的处理进度。

可选的方案，所述进度确定模块还用于当检测到识别处理阶段当前是对所述语音数据的内容进行识别，则确定当前执行的是第一识别步骤；当检测到识别处理阶段当前是根据识别得到的语音数据的内容对应的类型，则确定当前执行的是第二识别步骤；当检测到识别处理阶段当前是在一类型对应的内容中确定语音识别结果，则确定当前执行的是第三识别步骤。

可选的方案，所述第二识别步骤对应的第二预设图标包括多个，其中，每个第二预设图标对应所述语音识别结果的一种类型，所述修正模块还用于检测所述附加参数信息是否为从多个第二预设图标中选择目标类型的选择信息，如果是，则根据所述附加参数信息确定的目标类型中确定语音识别所对应的语音识别结果。

上述技术方案中的一个或两个，至少具有如下技术效果：

本发明提供的方法针对现有技术中语音录入之后识别过程相对复杂所以对应花费的时间较长，并且现有技术中只是笼统的提示语音识别处理的过程为正在处理，从而使得用户不能知道现在确切的处理进度是怎样，所以造成用户的感受度并不好的问题。提供在语音识别过程，电子设备可以接受用户输入的附加参数，使得电子设备能够在已输入的语音内容的基础上，还进一步的通过附加参数修正最后的结果。从而能够提高语音识别的速度以及最后反馈结果的准确度。

另外，为了能够实时的让用户确定语音识别处理的进度，还将语音识别处理过程划分为多个阶段，并根据每个阶段所处理的效果、内容等显示对应的图标。

进一步因为语音识别处理过程中每个步骤都会出现很多可供选择的目标，本发明提供的方案中还可以将电子设备确定的多个疑似目标都输出给用户，从而用户可以通过输入附加参数的形式对不需要的目标删除，从而能够有效的提高语音识别出的速度以及输出结果的准确度。

附图说明

图1为现有技术中语音识别操作各阶段的示意图；

图2为本发明实施例一种信息处理方法的流程图；

图3为本发明实施例中执行语音识别之前的选项显示界面示意图；

图4为本发明实施例中第二识别步骤中提供的选项显示界面示意图；

图5为本发明实施例一种电子设备的结构示意图。

具体实施方式

例如：通过语音输入指令进行内容搜索，则整个实现过程则可以是：获取语音指令对应的语音数据，则是对语音数据进行识别，并响应所述语音指令并对应的输出结果。可见在现有技术中只是将语音指令的控制过程划分成了三个阶段（三个阶段显示的图标可以是图1所示的内容），其中语音识别和响应指令的实现复杂度最好耗时最长，而且因为语音识别的准确度没有文字录入的高，而且在整个语音识别过程都是在后台运作的，没有相关的信息输出给用户所以用户只有在看到响应指令的输出结果之后才能知道语音输入指令是否正确，所以会浪费大量的时间；另外，因为语音输入的会在很多的影响因素，所以在响应语音指令的时候很容易出现误差。针对上述情况，本发明提供一种信息处理方法，在语音识别的过程中用户可以通过语音、触控或者是按键输入的方法添加一些附加信息，进一步的辅助语音识别操作，从而能够提高语音识别的速度以及最后反馈结果的准确度。本发明提供方法应用一电子设备中，所述方法包括：

下面将参照下述细节对本发明的各种实施例和各个方面进行说明，附图将图示各种实施例。下面的说明和附图是对本发明的示例性说明，而不应看作对本发明的限制。描述了大量具体细节以提供对本发明各种实施例的详尽理解。但是在某些情况下，将不对公知的或传统的细节进行描述，以对本发明的实施例提供简要的说明。

下文具体实施方式的某些部分是以算法的形式展现的，这些算法包括对于计算机存储器内储存的数据进行的操作。算法大体上是指造成所需结果的操作的自洽序列。这些操作通常需要或涉及到物理操纵或物理量。通常（但不是必然），这些量采取电信号或磁信号的形式，这些信号能够被储存、传输、合并、比较和以其他方式受到操纵。业已证明，有时（主要是为了通常使用的原因），将这些信号称为位、值、元素、符号、字符、项、数等等是方便的。

但是应当牢记，这些以及类似的所有术语是与适当的物理量相关联的，并且仅仅是应用于这些量的方便的标号。除非下文中明显地以其他形式另有说明外，整个说明书中使用诸如“处理”或“计算”或“判定”或“显示”等术语所进行的说明可以指数据处理***或类似电子装置进行的动作和处理，所述动作和处理操纵计算机的寄存器和存储器内以物理（电子）量表示的数据并将其转换成该***的存储器或寄存器（或其他这类信息存储、传输或显示的装置）内类似地以物理量的形式表示的其他数据。

本发明可以涉及用于执行本申请中所述操作中的一项或多项操作的设备。该设备可以为所需的目的而专门构造，或者也可以包括通用计算机，所述通用计算机由储存在该计算机中的计算机程序选择性地激活(activate)或重构（reconfigure)。这样的计算机程序可以被储存在机器(例如计算机）可读介质中或者存储在适于储存电子指令并分别耦联到总线的任何类型介质中，所述计算机可读介质包括但不限于任何类型的盘(包括软盘、光盘、CD-ROM、和磁光盘）、只读存储器（ROM)、随机存取存储器（RAM)、可擦除可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、闪存、磁性卡片或光学卡片。

机器可读介质包括用于以由机器（例如计算机）可读的形式储存或传输信息的任何机构。例如，机器可读介质包括只读存储器（ROM)；随机存取存储器（RAM)、磁盘储存介质、光学储存介质、闪存装置、以电的、光的、声的或其他的形式传播的信号（例如载波、红外信号、数字信号等）等。

如图2所示，本发明实施例提供一种信息处理方法，该方法应用一电子设备中，下面结合说明书附图对本发明的具体实施方式进行详细说明：

步骤201，获得一触发指令，根据所述触发指令启动语音识别引擎，所述语音识别引擎具有收音阶段、识别处理阶段以及结果反馈阶段，所述收音阶段用于获得输入的语音数据，所述识别处理阶段用于对所述收音阶段所获得的语音数据进行识别并执行所述语音数据对应的指令，所述结果反馈阶段用于将所述识别处理阶段的处理结果进行输出；

步骤202，当所述语音识别引擎处于所述收音阶段时获得第一语音数据；

步骤203，当所述语音识别引擎处于所述识别处理阶段，获得一附加参数信息，将所述附加参数信息作用于所述语音识别引擎对所述第一语音数据进行识别处理的所述识别处理阶段，产生第一处理结果；

在本发明实施例中，在不影响当前的识别处理阶段的识别处理操作，电子设备能够通过感应单元获得输入操作对应的附加参数信息。其中，输入操作可以是语音、可以是触控操作，也可是物理按键实现的输入操作。获得一附加参数信息包括：所述电子设备通过所述电子设备的感应单元采集的参数信息。

在本发明实施例中，所述附加参数是用户在输入最初的语音数据之后，并且电子设备已经在对输入的语音数据进行处理的过程中，用户为了提高输出结果的准确性，在已输入的语音数据的基础上再添加一些有助于语音识别或者是语音指令实现的参数。电子设备在进行语音识别或只是响应语音指令的时候，会将最初输入的语音数据和后来添加的附加参数信息综合考虑。从而能够提高语音指令响应的速度以及最后结果的准确度。

步骤204，当所述语音识别引擎处于所述结果反馈阶段将所述第一处理结果输出。

在本发明实施例中，输出所述第一处理结果的时候可以通过显示第一处理结果，也可以通过语音输出的方式。

另外，因为本发明所提供的方法，在语音识别的过程中还添加了附加的一些参数，附加参数会对语音识别的最后结果做进一步的筛选，所以应用本发明所提供的方法最后确定的第一处理结果比没有输入附加参数识别出来的第二处理结果准确度更好，错误的输出结果更少。

为了提高语音识别的准确度，用户可以在进行语音识别之前或者是语音识别的过程中确定好语音识别最后结果的一个范围，所以在步骤203中获得一附加参数信息之前，可以将常用的一些语音指令所对应的分类分别列出来，然后用户可以通过电子设备提供的分类做进一步的语音识别操作，所以本发明实施例所提供的该方法还进一步包括：

显示多个预设类别标示，使得用户可选择所述多个预设类别标示对应生成附加参数信息。需要说明的是，该多个预设类别的标示与该语音识别引擎的图标对应显示，换句话说，就是在语音识别引擎的图标上显示所述多个预设类别标示一个，同时，此时该语音识别引擎的图标在该阶段支持用户可通过操控操作从所述多个预设类别标示选择一个类别标示。

如图3所示，因为用户最常用的一些搜索内容大体可以是交通、餐饮、用户号码等，所以在用户输入一个语音信息之后，以及进行语音识别之前为了提高语音识别的准确度缩小识别的范围，则电子设备可以提供一些预设类别（其中具体的类别可以是图3所示的几种，但并不局限于图3所示的这几种情况），如图3所示的情况，如果通过触控显示单元显示各类别标示（或称作类别图标），则每个图标的对应位置还显示一个供用户选择的触控按键，当用户确定是某个类别之后，则可以触控所述触控按键，生成对应的附加参数信息（即电子设备接收到用户输入的触控操作信息），进一步电子设备则可以通过生成的附加参数信息确定用户输入的语音指令所对应的类别，从而就可以在确定的类别中进行识别以及响应识别后的语音指令。其中，该预设类别标示也可以为该电子设备采集用户的使用习惯而生成的类别标示。该电子设备采集用户的使用习惯为该用户进行语音识别/语音搜索的使用习惯。

在本发明实施例中，为了使得用户能够在语音识别处理的过程中知道电子设备都在进行怎样的处理，即语音识别处理的进度。所以本发明实施例所提供的方法，还将所述语音识别引擎的识别处理阶段的整个过程分成多个阶段，并根据不同的阶段输入不同的图标，使得用户根据输出的图标确定电子设备当前对输入的语音数据处理到什么程度了，所以获得一附加参数信息之前，该方法还进一步包括：

将电子设备在对语音信息进行所述识别处理阶段的整个过程分为多个识别步骤，并且每个识别步骤都对应一个预设的图标，从而用户可以根据输出的预设图标确定当前处理到进度。

本发明实施例中，确定所述识别处理阶段当前执行的识别步骤之前，还进一步的需要将语音识别处理阶段划分为多个识别步骤，在本发明实施例中，可以通过当前识别处理的内容不同，将所述语音识别处理阶段划分为一下几个识别步骤，具体为：

A，当检测到识别处理阶段当前是对所述语音数据的内容进行识别，则确定当前执行的是第一识别步骤；

例如，用户通过语音输入一个指令，该指令用于搜索一个饭店。电子设备通过语音获取装置获取到了用户输入的语音信息，该语音信息为饭店的名字。则该语音识别处理阶段首先是对用户输入的语音信息进行识别，确定所述语音信息的具体内容，将语音对应的转换为文字内容。

B，当检测到识别处理阶段当前是根据识别得到的语音数据的内容对应的类型，则确定当前执行的是第二识别步骤；

根据上述例子，当确定语音信息所对应的具体内容后，因为可搜索的范围很大，所以首先要缩小搜索的范围，所以需要确定语音信息所对应的类型。上例中则在该步骤确定用户需要查找的是餐饮类别。

C，当检测到识别处理阶段当前是在一类型对应的内容中确定语音识别结果，则确定当前执行的是第三识别步骤。

在第二识别步骤确定对应的类别后，则可以在这个类别中做进一步的搜索和确定语音对应的指令，并响应指令输出结果。

进一步，因为电子设备对用户输入的语音信息进行识别的时候，因为很多因素可能会导致电子设备对语音信息的识别出现一些误差，所以电子输出预设图标的时候，有可能一个语音数据在识别的时候电子设备会找到多个疑似目标内容，所以这个时候电子设备还可以通过预设图标的形式将多个疑似目标进行显示，然后用户再根据自己的需求确定哪个目标是正确的，从而通过设定的操作选择正确的目标，从而电子设备根据用户的选择操作生成对应的附加参数，电子设备则可通过原有的语音数据以及后来添加的附加参数使得响应语音指令的结果更为准确。

在本发明实施例中，因为语音识别过程中存在上述因素对语音识别结果的影响，所以在每个识别步骤都有肯定会对应到多个预设图标。其中，如果按照上述实例对语音识别处理过程的步骤划分，因为第二识别步骤所所对应的是语音识别结果的类型，所以很多时候可以对应多种类型，所以所述第二识别步骤在确定语音内容所对应的第二预设图标可能包括多个，其中，每个第二预设图标对应所述语音识别结果的一种类型。

在第二识别步骤的时候电子设备是在确定语音内容的基础上做的进一步的识别操作，因为对应一个语音内容的搜索结果也可能会有好几个类别，所以为了进一步的缩小识别的范围，在第二识别步骤的时候也可以显示多个类别图标如图4所示。显示图标之后用户就可以从显示的图标中选择一个与输入语音匹配度最高的类别进行识别，提高语音识别的速度。

为了提高语音指令最终反馈结果的准确性，则用户可以在电子设备显示一个识别步骤对应的多个图标中选择一个满足指令要求的内容，则将所述附加参数信息作用于所述语音识别引擎对所述第一语音数据进行识别处理的所述识别处理阶段，产生第一处理结果包括：

因为最后的处理结果应该只对应一个类型，所以通过附加参数选择识别步骤对应的类型后，可以进一步提高语音识别处理的速度并提高最后结果的准确度。

如图5所示，根据上述方法本发明还提供一种电子设备，该电子设备包括：

启动模块501，用于获得一触发指令，根据所述触发指令启动语音识别引擎，所述语音识别引擎具有收音阶段、识别处理阶段以及结果反馈阶段，所述收音阶段用于获得输入的语音数据，所述识别处理阶段用于对所述收音阶段所获得的语音数据进行识别并执行所述语音数据对应的指令，所述结果反馈阶段用于将所述识别处理阶段的处理结果进行输出；

获取模块502，用于当所述语音识别引擎处于所述收音阶段时获得第一语音数据；

修正模块503，用于当所述语音识别引擎处于所述识别处理阶段，获得一附加参数信息，将所述附加参数信息作用于所述语音识别引擎对所述第一语音数据进行识别处理的所述识别处理阶段，产生第一处理结果；

输出模块504，用于当所述语音识别引擎处于所述结果反馈阶段将所述第一处理结果输出。

因为语音识别过程的处理复杂度高时间长，为了使用户能够清楚的知道电子设备当前处理到什么程度，所以该电子设备还包括：

进度确定模块505，用于所述语音识别引擎处于所述识别处理阶段，确定所述识别处理阶段当前执行的识别步骤，获取与当前识别步骤对应的预设图标，所述预设图标显示识别状态当前的处理进度。

为了让电子设备显示语音识别处理的进度，该电子设备还包括：

所述进度确定模块505还用于当检测到识别处理阶段当前是对所述语音数据的内容进行识别，则确定当前执行的是第一识别步骤；当检测到识别处理阶段当前是根据识别得到的语音数据的内容对应的类型，则确定当前执行的是第二识别步骤；当检测到识别处理阶段当前是在一类型对应的内容中确定语音识别结果，则确定当前执行的是第三识别步骤。

为了提高语音识别处理的速度及最终结果的准确度，还提供用户识别修正语音识别处理过程中每个识别步骤的机会，所以所述第二识别步骤对应的第二预设图标包括多个，其中，每个第二预设图标对应所述语音识别结果的一种类型，所述修正模块503还用于检测所述附加参数信息是否为从多个第二预设图标中选择目标类型的选择信息，如果是，则根据所述附加参数信息确定的目标类型中确定语音识别所对应的语音识别结果。

本申请实施例中的上述一个或多个技术方案，至少具有如下的技术效果：

本发明所述的方法并不限于具体实施方式中所述的实施例，本领域技术人员根据本发明的技术方案得出其它的实施方式，同样属于本发明的技术创新范围。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种信息处理方法，该方法应用一电子设备中，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，获得一附加参数信息包括：所述电子设备通过所述电子设备的感应单元采集的参数信息。

3.如权利要求1所述的方法，其特征在于，获得一附加参数信息之前，该方法还进一步包括：

4.如权利要求1所述的方法，其特征在于，获得一附加参数信息之前，该方法还进一步包括：

5.如权利要求4所述的方法，其特征在于，确定所述识别处理阶段当前执行的识别步骤之前，该方法还进一步包括：

6.如权利要求5所述的方法，其特征在于，所述第二识别步骤对应的第二预设图标包括多个，其中，每个第二预设图标对应所述语音识别结果的一种类型。

7.如权利要求6所述的方法，其特征在于，将所述附加参数信息作用于所述语音识别引擎对所述第一语音数据进行识别处理的所述识别处理阶段，产生第一处理结果包括：

8.一种电子设备，其特征在于，该电子设备包括：

9.如权利要求8所述的电子设备，其特征在于，该电子设备还包括：

10.如权利要求9所述的电子设备，其特征在于，所述进度确定模块还用于当检测到识别处理阶段当前是对所述语音数据的内容进行识别，则确定当前执行的是第一识别步骤；当检测到识别处理阶段当前是根据识别得到的语音数据的内容对应的类型，则确定当前执行的是第二识别步骤；当检测到识别处理阶段当前是在一类型对应的内容中确定语音识别结果，则确定当前执行的是第三识别步骤。

11.如权利要求10所述的电子设备，其特征在于，所述第二识别步骤对应的第二预设图标包括多个，其中，每个第二预设图标对应所述语音识别结果的一种类型，所述修正模块还用于检测所述附加参数信息是否为从多个第二预设图标中选择目标类型的选择信息，如果是，则根据所述附加参数信息确定的目标类型中确定语音识别所对应的语音识别结果。