CN108073572A

CN108073572A - 信息处理方法及其装置、同声翻译***

Info

Publication number: CN108073572A
Application number: CN201611031049.9A
Authority: CN
Inventors: 姜里羊; 王宇光; 陈伟; 程善伯
Original assignee: Beijing Sogou Technology Development Co Ltd
Current assignee: Beijing Sogou Technology Development Co Ltd
Priority date: 2016-11-16
Filing date: 2016-11-16
Publication date: 2018-05-25
Anticipated expiration: 2036-11-16
Also published as: CN108073572B

Abstract

本发明实施例提供了一种信息处理方法及其装置、同声翻译***，其中的方法具体包括：获取讲话用户的语音信号对应的文本信息；依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句，作为当前需要进行机器翻译的目标分句；向机器翻译装置发送所述目标分句，以使所述机器翻译装置将所述目标分句信息翻译为目标语言的文字。本发明实施例可以对当前需要进行机器翻译的分句进行控制，以避免发送给机器翻译装置的句子过长或过短的情形，因此可以有效提高翻译的准确率和实时率。

Description

信息处理方法及其装置、同声翻译***

技术领域

本发明涉及信息处理技术领域，特别是涉及一种信息处理方法和装置、一种用于信息处理的装置、以及一种同声翻译***。

背景技术

同声传译，是指同声传译员在不打断讲话者演讲的情况下，不停地将其讲话内容传译给听众的一种口译方式。目前，同声传译技术被广泛应用在大型会议、演讲、会展、景点等场景。以会议场景为例，在会议过程中，同声传译员坐在隔音间内，使用专业的设备，将其从耳机中听到的内容同步口译为目标语言，并通过话筒输出；同时，需要同声传译服务的与会者，可以从耳机中获得翻译的信息。

然而，在实际应用中，由于需要不停地将从耳机中听到的内容同步口译为目标语言，故同声传译员的工作强度非常大。因为工作强度大，一般由2名同声传译员交替进行翻译，每名同声传译员通常持续翻译半小时左右，这样将耗费较多的人力成本。

为了节省人力成本，一种现有方案可以通过音本转换装置将讲话用户的语音信号转换为文本，并对该文本进行机器翻译，以得到目标语言的文本，进而输出目标语言的文本对应的语音。其中，现有方案中音本转换装置是依据语音信号的间隔时间判断句子的结束的，其在判断句子结束后，可以向机器翻译装置发送对应的句子。

然而，发明人在实现本发明的过程中发现，不同讲话用户往往具有不同的语速，这样，现有方案中依据语音信号的间隔时间判断句子的结束，将影响判断结果的准确度。例如，在讲话用户的语速过快时，固定的间隔时间将导致句子过长；而在讲话用户的语速过慢时，固定的间隔时间将导致句子过短。而对于机器翻译而言，其通常需要一个意义完整的句子，如果句子过长将会降低翻译的实时率，且考虑的上下文内容过多也会降低翻译的准确率，如果句子过短将无法考虑上下文内容，故也会对翻译的准确率造成影响。

发明内容

鉴于上述问题，提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的信息处理方法、信息处理装置、用于信息处理的装置及同声翻译***，本发明实施例可以对当前需要进行机器翻译的分句进行控制，以避免发送给机器翻译装置的句子过长或过短的情形，因此可以有效提高翻译的准确率和实时率。

为了解决上述问题，本发明公开了一种信息处理方法，包括：

获取讲话用户的语音信号对应的文本信息；

依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句，作为当前需要进行机器翻译的目标分句；

向机器翻译装置发送所述目标分句，以使所述机器翻译装置将所述目标分句信息翻译为目标语言的文字。

可选地，所述分句的信息包括：分句数量和字数，则所述依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句的步骤，包括：

若所述文本信息中位于前面的分句的数量超过第一数量阈值、且所述位于前面的分句的字数超过第一字数阈值，则将所述位于前面的分句作为当前需要进行机器翻译的目标分句；或者

若所述文本信息中位于前面的分句的数量与延迟阈值的差值D为第二数量阈值的倍数、且所述位于前面的分句的字数超过第二字数阈值，则将所述位于前面的D个分句作为当前需要进行机器翻译的目标分句；其中，D为正整数。

若所述文本信息的总字数未超过第三字数阈值、且所述文本信息中存在预置标志位，则若所述文本信息中位于前面的分句的数量超过第一数量阈值、且所述位于前面的分句的字数超过第一字数阈值，则将所述位于前面的分句作为当前需要进行机器翻译的目标分句；或者

若所述文本信息的总字数超过第三字数阈值、且所述文本信息中不存在预置标志位，则若所述文本信息中位于前面的分句的数量与延迟阈值的差值D为第二数量阈值的倍数、且所述位于前面的分句的字数超过第二字数阈值，则将所述位于前面的D个分句作为当前需要进行机器翻译的目标分句；其中，D为正整数。

可选地，所述依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句的步骤，还包括：

在将所述位于前面的D个分句作为当前需要进行机器翻译的目标分句后，若所述文本信息中存在第一预设标点符号，则将所述第一预设标点符号及其之前的字符作为当前需要进行机器翻译的目标分句。

可选地，所述方法还包括：

从所述文本信息中获取标点符号为第一预设标点符号的第一分句；

则所述依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句的步骤，包括：

依据所述文本信息所包含第一分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的第一分句。

可选地，所述方法还包括：

将所获取的文本信息写入缓存区；

从所述缓存区读取文本信息，并依据所读取的文本信息所包含分句的信息，从所读取的文本信息中获取所述分句的信息符合预置条件的分句。

可选地，所述方法还包括：

从所述文本信息中获取标点符号为第二预设标点符号的第二分句，将所述文本信息所包含的所述第二分句及所述第二分句之前的分句作为当前需要进行机器翻译的目标分句。

另一方面，本发明公开了一种信息处理装置，包括：

文本获取模块，用于获取讲话用户的语音信号对应的文本信息；

目标分句获取模块，用于依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句，作为当前需要进行机器翻译的目标分句；以及

目标分句发送模块，用于向机器翻译装置发送所述目标分句，以使所述机器翻译装置将所述目标分句信息翻译为目标语言的文字。

可选地，所述分句的信息包括：分句数量和字数，则所述目标分句获取模块包括：

第一目标分句获取子模块，用于在所述文本信息中位于前面的分句的数量超过第一数量阈值、且所述位于前面的分句的字数超过第一字数阈值时，将所述位于前面的分句作为当前需要进行机器翻译的目标分句；或者

第二目标分句获取子模块，用于在所述文本信息中位于前面的分句的数量与延迟阈值的差值D为第二数量阈值的倍数、且所述位于前面的分句的字数超过第二字数阈值时，将所述位于前面的D个分句作为当前需要进行机器翻译的目标分句；其中，D为正整数。

第三目标分句获取子模块，用于在所述文本信息的总字数未超过第三字数阈值、且所述文本信息中存在预置标志位时，若所述文本信息中位于前面的分句的数量超过第一数量阈值、且所述位于前面的分句的字数超过第一字数阈值，则将所述位于前面的分句作为当前需要进行机器翻译的目标分句；或者

第四目标分句获取子模块，用于在所述文本信息的总字数超过第三字数阈值、且所述文本信息中不存在预置标志位时，若所述文本信息中位于前面的分句的数量与延迟阈值的差值D为第二数量阈值的倍数、且所述位于前面的分句的字数超过第二字数阈值，则将所述位于前面的D个分句作为当前需要进行机器翻译的目标分句；其中，D为正整数。

可选地，所述目标分句获取模块还包括：

第五目标分句获取子模块，用于在将所述位于前面的D个分句作为当前需要进行机器翻译的目标分句后，若所述文本信息中存在第一预设标点符号，则将所述第一预设标点符号及其之前的字符作为当前需要进行机器翻译的目标分句。

可选地，所述装置还包括：

第一分句获取模块，用于从所述文本信息中获取标点符号为第一预设标点符号的第一分句；

则所述目标分句获取模块包括：

第六目标分句获取子模块，用于依据所述文本信息所包含第一分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的第一分句。

可选地，所述装置还包括：

写入模块，用于将所获取的文本信息写入缓存区；

则所述目标分句获取模块包括：

第七目标分句获取子模块，用于从所述缓存区读取文本信息，并依据所读取的文本信息所包含分句的信息，从所读取的文本信息中获取所述分句的信息符合预置条件的分句。

可选地，所述装置还包括：

第二分句处理模块，用于从所述文本信息中获取标点符号为第二预设标点符号的第二分句，将所述文本信息所包含的所述第二分句及所述第二分句之前的分句作为当前需要进行机器翻译的目标分句。

再一方面，本发明公开了一种用于信息处理的装置，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

获取讲话用户的语音信号对应的文本信息；

又一方面，本发明公开了一种同声翻译***，包括：

第一转换装置，用于将讲话用户的语音信号转换为文本信息；

前述的信息处理装置；

机器翻译装置，用于将所述信息处理装置得到的目标分句翻译为目标语言的文字，并输出。

本发明实施例包括以下优点：

本发明实施例不是直接将文本信息直接进行机器翻译，而是在依据文本信息所包含分句的信息对文本信息进行进一步处理、以从中获取分句的信息符合预置条件的目标分句后，进行该目标分句的机器翻译，也即，本发明实施例可以依据文本信息所包含分句的信息，对当前需要进行机器翻译的分句进行控制，以避免发送给机器翻译装置的句子过长或过短的情形，因此可以有效提高翻译的准确率和实时率。

附图说明

图1是本发明的一种同音翻译***的示例性结构示意图；

图2是本发明的一种信息处理方法实施例一的步骤流程图；

图3是本发明的一种信息处理方法实施例二的步骤流程图；

图4是本发明的一种信息处理装置实施例的结构框图；

图5是根据一示例性实施例示出的一种用于信息处理的装置作为终端时的框图；及

图6是根据一示例性实施例示出的一种用于信息处理的装置作为服务器时的框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

本发明实施例提供了一种信息处理方案，该方案可以获取讲话用户的语音信号对应的文本信息，依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句，作为当前需要进行机器翻译的目标分句，并向机器翻译装置发送所述目标分句，以使所述机器翻译装置将所述目标分句信息翻译为目标语言的文字。

本发明实施例中，当前需要进行机器翻译的目标分句是指能够契合当前文本信息所包含的信息的分句，也即，本发明实施例不是直接将文本信息直接进行机器翻译，而是在依据文本信息所包含分句的信息对文本信息进行进一步处理、以从中获取分句的信息符合预置条件的目标分句后，进行该目标分句的机器翻译，也即，本发明实施例可以依据所述文本信息所包含分句的信息，对当前需要进行机器翻译的分句进行控制，以避免发送给机器翻译装置的句子过长或过短的情形，因此可以有效提高翻译的准确率和实时率。

本发明实施例可以应用于在大型会议、演讲、会展、景点等各种需要同声翻译的场景。

参照图1，示出了本发明的一种同音翻译***的示例性结构示意图，其具体可以包括：第一转换装置101、信息处理装置102、机器翻译装置103和机器翻译装置104。其中，第一转换装置101、信息处理装置102、机器翻译装置103和机器翻译装置104可以作为单独的服务器，也可以共同设置于同一个服务器中，也即，本发明实施例对于第一转换装置101、信息处理装置102、机器翻译装置103和机器翻译装置104的具***置不加以限制。

其中，第一转换装置101可用于将讲话用户的语音信号转换为文本信息。在实际应用中，讲话用户可以为上述需要同声翻译的场景中讲话并发出语音信号的用户，则可以通过麦克风或其他语音采集器件接收讲话用户的语音信号，并向第一转换装置101发送所接收的语音信号；或者，该第一转换装置101可以具有接收讲话用户的语音信号的功能。

可选地，第一转换装置101可以采用语音识别技术将讲话用户的语音信号转换为文本信息。如果将用户讲话用户的语音信号记作S，对S进行一系列处理后得到与之相对应的语音特征序列O，记作O＝{O₁，O₂，…，O_i，…，O_T}，其中O_i是第i个语音特征，T为语音特征总个数。语音信号S对应的句子可看作是由许多词组成的一个词串，记作W＝{w₁，w₂，…，w_n}。语音识别的过程就是根据已知的语音特征序列O，求出最可能的词串W。

具体来说，语音识别是一个模型匹配的过程，在这个过程中，可以首先根据人的语音特点建立语音模型，通过对输入的语音信号的分析，抽取所需的特征，来建立语音识别所需的模板；对用户所输入语音进行识别的过程即是将用户所输入语音的特征与所述模板比较的过程，最后确定与所述用户所输入语音匹配的最佳模板，从而获得语音识别的结果。具体的语音识别算法，可采用基于统计的隐含马尔可夫模型的训练和识别算法，也可采用基于神经网络的训练和识别算法、基于动态时间归整匹配的识别算法等等其他算法，本发明实施例对于具体的语音识别过程不加以限制。

在需要同声翻译的场景下，讲话用户会源源不断地产生语音信号S，也即，语音信号S可以对应一个或多个句子。在本发明的一种可选实施例中，第一转换装置101可以依据语音信号S的间隔时间判断句子的结束。

然而，在实际应用中，不同讲话用户往往具有不同的语速，这样，现有方案中依据语音信号的间隔时间判断句子的结束，将影响判断结果的准确度。例如，在讲话用户的语速过快时，固定的间隔时间将导致句子过长；而在讲话用户的语速过慢时，固定的间隔时间将导致句子过短。而对于机器翻译而言，其通常需要一个意义完整的句子，如果句子过长将会降低翻译的实时率，且考虑的上下文内容过多也会降低翻译的准确率，如果句子过短将无法考虑上下文内容，故也会对翻译的准确率造成影响。

针对上述句子结束对应判断结果的准确度欠低、导致的翻译准确率和实时率的问题，信息处理装置102可以依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句，作为当前需要进行机器翻译的目标分句。其中，当前需要进行机器翻译的目标分句是指能够契合当前文本信息所包含分句的信息的分句，也即，本发明实施例不是直接将第一转换装置101输出的文本信息直接输出给机器翻译装置103，而是在信息处理装置102对第一转换装置101输出的文本信息进行进一步处理，以从中获取契合当前文本信息所包含分句的信息的分句，作为当前需要进行机器翻译的目标分句，并向机器翻译装置103发送该目标分句，由于可以对当前需要进行机器翻译的目标分句进行控制，故可以有效提高翻译的准确率和实时率。

本发明实施例中，复句(一个完整的句子)中相对独立的单句形式被称为分句，分句和分句之间一般有停顿，在书面上用逗号或者分号表示；分句和分句在意义上有一定的联系，常用一些关联词语(连词、有关联作用的副词或词组)来连接。

可选地，第一转换装置101可以依据语音信号S的间隔时间及其语言模型，在讲话用户的语音信号对应的文本信息中***对应的第二预设标点符号，例如，***的第二预设标点符号可以包括但不限于：逗号、顿号、句号等，则信息处理装置102可以依据所述文本信息所包含的第二预设标点符号，获取其中所包含的分句。

可选地，例如过长的句子(以下简称为长句)或者过短的句子(以下简称短句)的当前文本信息所包含分句均具备自身的特点，信息处理装置102则可以依据所述文本信息所包含分句的信息，获取契合当前文本信息所包含分句的信息的目标分句。

机器翻译装置103，可以从信息处理装置102接收目标分句，并将所述目标分句翻译为目标语言的文字，其中，机器翻译装置103可以采用机器翻译技术进行目标分句的翻译，机器翻译技术可以利用计算机将一种自然语言(源语言)的目标分句转换为另一种自然语言(目标语言)的文字的过程，例如，源语言和目标语言可以分别为中文和英文，或者，源语言和目标语言可以分别为英文和中文等，本发明实施例对于具体的源语言、目标语言及具体的机器翻译技术不加以限制。

第二转换装置104，可以从机器翻译装置103接收目标语言的文字，将所述目标语言的文字转换为目标语言的语音，并输出。可选地，第二转换装置104可以利用文本到语音的转换技术(如语音合成技术)，将所述目标语言的文字转换为目标语言的语音，并通过耳机、扬声器等语音播放器件将目标语言的语音输出。可以理解，本发明实施例对于将所述目标语言的文字转换为目标语言的语音并输出的具体过程不加以限制。

需要说明的是，第二转换装置104只是作为本发明的可选实施例中的可选装置，实际上，在本发明的其他实施例中，可以直接将机器翻译装置103得到的目标语言的文字输出，例如，将目标语言的文字显示在例如屏幕的显示装置上，供用户查看。

综上，本发明实施例中，当前需要进行机器翻译的目标分句是指能够契合当前文本信息所包含的信息的分句，也即，本发明实施例不是直接将文本信息直接进行机器翻译，而是在依据文本信息所包含分句的信息对文本信息进行进一步处理、以从中获取分句的信息符合预置条件的目标分句后，进行该目标分句的机器翻译，也即，本发明实施例可以依据所述文本信息所包含分句的信息，对当前需要进行机器翻译的分句进行控制，以避免发送给机器翻译装置的句子过长或过短的情形，因此可以有效提高翻译的准确率和实时率。

方法实施例一

参照图2，示出了本发明的一种信息处理方法实施例一的步骤流程图，具体可以包括如下步骤：

步骤201、获取讲话用户的语音信号对应的文本信息；

步骤202、依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句，作为当前需要进行机器翻译的目标分句；

步骤203、向机器翻译装置发送所述目标分句，以使所述机器翻译装置将所述目标分句信息翻译为目标语言的文字。

本发明实施例提供的信息处理方法可应用于计算设备的应用环境中。可选地，上述计算设备可以包括：终端或服务器。其中，上述终端可以包括但不限于：智能手机、平板电脑、膝上型便携计算机、车载电脑、台式计算机、智能电视机、可穿戴设备等等。上述服务器可以为云服务器或者普通服务器，用于向机器翻译装置提供当前需要进行机器翻译的目标分句。

在实际应用中，本发明实施例的计算设备可以从其他计算设备获取讲话用户的语音信号对应的文本信息。或者，本发明实施例的计算设备可以通过客户端应用执行本发明实施例的信息处理方法流程，客户端应用可以运行在计算设备上，例如，该客户端应用可以为智能终端上运行的任意APP(应用程序，Application)，则该客户端应用可以从计算设备的其他应用获取讲话用户的语音信号对应的文本信息。或者，本发明实施例的计算设备可以通过客户端应用的功能装置执行本发明实施例的信息处理方法流程，则该功能装置可以从其他功能装置获取讲话用户的语音信号对应的文本信息。可以理解，本发明实施例对于步骤201获取讲话用户的语音信号对应的文本信息的具体方式不加以限制。

在本发明的一种可选实施例中，本发明实施例的方法还可以包括：将所获取的文本信息写入缓存区；则所述依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句的步骤202，可以包括：从所述缓存区读取文本信息，并依据所读取的文本信息所包含分句的信息，从所读取的文本信息中获取所述分句的信息符合预置条件的分句。可选地，可以在计算设备的内存区建立例如队列、数组、或者链表的数据结构作为上述缓存区，本发明实施例对于具体的缓存区不加以限制。上述采用缓存区存储文本信息的方式能够提高文本信息的处理效率，可以理解，采用磁盘存储文本信息的方式也是可行的，本发明实施例对于文本信息的具体存储方式不加以限制。

本发明实施例中，当前需要进行机器翻译的目标分句是指能够契合当前文本信息所包含分句的信息的分句。可选地，例如过长的句子(以下简称为长句)或者过短的句子(以下简称短句)的当前文本信息所包含分句均具备自身的特点，则可以依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句。

在本发明的一种可选实施例中，所述分句的信息可以包括：分句数量和字数，文本信息所包含的分句的数量可用于表示文本信息包含几个分句，文本信息所包含分句的字数可用于表示文本信息包含的部分或全部分句所占用的字符数，文本信息所包含的分句的数量和字数的组合可以对机器翻译的质量(准确率和实时率)产生影响，因此可以作为获取目标分句的依据。

本发明实施例可以提供上述依据所述文本信息所包含的分句的数量和字数获取目标分句的如下技术方案：

技术方案1、若所述文本信息中位于前面的分句的数量超过第一数量阈值、且所述位于前面的分句的字数超过第一字数阈值，则将所述位于前面的分句作为当前需要进行机器翻译的目标分句。也即，技术方案1中，预置条件可以包括：文本信息中位于前面的分句的数量超过第一数量阈值、且所述位于前面的分句的字数超过第一字数阈值。

技术方案1可以适用于文本信息所包含分句对应的复句为短句的情况，可以判断文本信息中位于前面的短句的数量是否超过第一字数阈值n1，以及判断所述位于前面的分句的字数是否超过第一字数阈值m1，若判断结果均为是，则按照从前到后的顺序对文本信息所包含的n1个短句进行拼接，并将拼接结果发送给机器翻译装置进行翻译，其中，n1和m1均为正整数。可见，技术方案1通过对短句对应的分句进行拼接，使得拼接后的目标分句的结构更加完整，提高了翻译的准确率。

在本发明的一种应用示例1中，假设队列中存储的文本信息包括位于前面的“今天天气不错，”、“我们出去钓鱼吧，”两个分句，该两个分句所占用的字数为15，假设n1＝2，m1＝10，由于该两个分句的数量超过n1、且该两个分句的字数超过m1，故可以将该两个分句一起发送给机器翻译装置，由于可以将结构更加完整的多个分句作为整体发送给机器翻译装置，故可以提高翻译的准确率。

可以理解，上述n1＝2、m1＝10只是作为本发明实施例的n1、m1的可选实施例，实际上，本领域技术人员可以根据实际应用需求，确定n1、m1的具体数值，例如，可以基于翻译的准确率和实时率两个特征对n1和m1的当前值进行测试，若当前值不通过测试，则对当前值进行更新，直至当前值通过测试；其中，该当前值可以具有对应的初始值，如n1的初始值为1，m1的初始值为1等；可以依据当前值情况下翻译的准确率和实时率判断当前值是否通过测试，具体，若当前值情况下翻译的准确率和实时率分别在对应的预设范围内，则通过测试，否则，若当前值情况下翻译的准确率和实时率分别不在对应的预设范围内，则不通过测试。可以理解，本发明实时率对于n1、m1的具体数值及其确定方式不加以限制。

在本发明的一种可选实施例中，在将所述位于前面的分句作为当前需要进行机器翻译的目标分句向机器翻译装置发送后，还可以在缓存区中删除该位于前面的分句，以有效节省缓存区所占用的空间。

技术方案2、若所述文本信息中位于前面的分句的数量与延迟阈值的差值D为第二数量阈值的倍数、且所述位于前面的分句的字数超过第二字数阈值，则将所述位于前面的D个分句作为当前需要进行机器翻译的目标分句；其中，D为正整数。也即，技术方案2中，预置条件可以包括：文本信息中位于前面的分句的数量与延迟阈值的差值D为第二数量阈值的倍数、且所述位于前面的分句的字数超过第二字数阈值。

技术方案2可以适用于文本信息所包含分句对应的复句为长句的情况，对于长句，在将语音信号转换为文本信息的过程中，前后的语音信号对应的文本信息可能会相互影响，例如，前面的语音信号对应的文本信息可能随着后面的语音信号对应的文本信息而发生变化，这样，长句对应文本信息并不是完全稳定的，因此，为了保证翻译的准确率，需要在长句的结构基本稳定后再进行翻译；也即，技术方案2可以通过切分长句，使得不需要得到整个长句完全固定了才进行翻译，提高了翻译的实时率和准确率。

技术方案2通过延迟阈值k表示文本信息中位于后面的不稳定的分句，也即文本信息中位于后面的k个分句为延迟发送的分句，k能够保证复句的变化不会太大。并且，技术方案2通过第二数量阈值n2表示每次正常发送的分句的数量，这样，在文本信息包含位于前面的M*n2+k个分句时，若M*n2+k个分句的总字数超过第二字数阈值m2，则可以将位于前面的M*n2个分句作为整体发送给机器翻译装置进行翻译，其中，k、n2、M、m2均为正整数。

在本发明的一种应用示例2中，假设队列中的文本信息包括位于前面的分句“哦，”、“好的”、“我要去问问我妈妈，”、“今天我们有安排吗，”、“如果没安排的话，”、“我就跟你一块儿去钓鱼。”，假设n2＝2，m2＝15，k＝2，则由于位于前面的文本信息“哦，好的，我要去问问我妈妈，今天我们有安排吗，”包含4个分句，且该4个分句的总字数超过m2，则可以将4个分句中的前(4-2)个分句发送给机器翻译装置；接着，位于前面的文本信息“哦，好的，我要去问问我妈妈，今天我们有安排吗，今天我们有安排吗，如果没安排的话，”包含6个分句，且该6个分句的总字数超过m2，则可以将6个分句中的前(6-2)个分句发送给机器翻译装置。

在本发明的一种可选实施例中，所述依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句的步骤，还可以包括：在将所述位于前面的D个分句作为当前需要进行机器翻译的目标分句后，若所述文本信息中存在第二预设标点符号，则将所述第二预设标点符号及其之前的字符作为当前需要进行机器翻译的目标分句。上述应用示例2中，在将6个分句中的前(6-2)个分句发送给机器翻译装置后，假设位于前面的文本信息“哦，好的，我要去问问我妈妈，今天我们有安排吗，今天我们有安排吗，如果没安排的话，我就跟你一块儿去钓鱼。”包含第二预设标点符号“。”，则可以将所有的文本信息发送给机器翻译装置。

可选地，该第二预设标点符号可以包括：句号、感叹号、问号等，该第二预设标点符号使得对应的第二分句及其之前的分句具有一定的独立性以至于具有明确的意义，也即，该第二分句及其之前的分句的翻译的准确率可以不受后续分句的影响；因此，本发明实施例可以依据第二预设标点符号将k个延迟发送的分句发送至机器翻译装置。可选地，该第二预设标点符号可由第一转换装置依据语音信号的间隔和/或语言模型添加得到，本发明实施例对于该第二预设标点符号的添加方式不加以限制。

在本发明的一种可选实施例中，在将所述第二预设标点符号及其之前的字符作为当前需要进行机器翻译的目标分句向机器翻译装置发送后，还可以在缓存区中删除第二预设标点符号及其之前的字符，以有效节省缓存区所占用的空间。

在实际应用中，本发明实施例可以根据实际应用需求，采用上述技术方案1和技术方案2中的任一或者组合。例如，在本发明的一种可选实施例中，可以判断文本信息所包含分句对应的复句为短句或者长句，若为短句，则可以采用技术方案1，若为长句，则可以采用技术方案2。

可选地，可以依据文本信息所包含分句的总字数及文本信息所包含的分句是否包含预置标志位，判断文本信息所包含分句对应的复句为短句或者长句。其中，该预置标志位可以用于标识分句的结束，该预置标志位可由第一转换装置根据语音信号的分析结果添加。可选地，若所述文本信息的总字数未超过第三字数阈值n3、且所述文本信息中存在预置标志位，则可以认为文本信息所包含分句对应的复句为短句，否则，若所述文本信息的总字数超过第三字数阈值、且所述文本信息中不存在预置标志位，则可以认为文本信息所包含分句对应的复句为长句。在本发明的一种应用示例中，该第三字数阈值n3可以为30，可以理解，本领域技术可以根据实际应用需求确定该第三字数阈值n3的值，本发明实施例对于第三字数阈值n3的具体数值不加以限制。

在本发明的一种可选实施例中，所述方法还可以包括：从所述文本信息中获取标点符号为第一预设标点符号的第一分句；则所述依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句的步骤102，具体可以包括：依据所述文本信息所包含第一分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的第一分句。可选地，该第一预设标点符号可以包括：逗号、分号等。该第一预设标点符号对应的第一分句通常与其前后的分句之间均存在意义关联，故该第一分句及其之前的分句的翻译的准确率可能会受到后续分句的影响，因此本发明实施例可以依据第一分句的信息，从所述文本信息中获取所述第一分句的信息符合预置条件的第一分句，作为目标分句。

在实际应用中，步骤201、步骤202和步骤203可以为连续执行的步骤，也即，步骤201不断地获取讲话用户的语音信号对应的文本信息，并将所获取的文本信息输出给步骤202；步骤202可以不断地将步骤201输出的文本信息中获取当前需要进行机器翻译的目标分句；步骤203可以将步骤202输出的目标分句发送给机器翻译装置。其中，机器翻译装置可以为与执行本发明实施例的信息处理方法流程的信息处理装置位于相同的计算设备或者不同的计算设备，例如，该机器翻译装置可以为信息处理装置所属的客户端应用对应的服务器，可以理解，本发明实施例对于机器翻译装置与信息处理装置之间的具***置不加以限制。

在本发明的一种可选实施例中，所述方法还可以包括：从所述文本信息中获取标点符号为第二预设标点符号的第二分句，将所述文本信息所包含的所述第二分句及所述第二分句之前的分句作为当前需要进行机器翻译的目标分句。假设采用队列存储文本信息，则可以从队列中读取文本信息，并按照从前到后的顺序对所读取的文本信息进行遍历，若遍历到第二预设标点符号，则将上述第二预设标点符号及其之前的字符作为目标分句。例如，在本发明的一种应用示例3中，文本信息“你觉得好吗？”中包含“？”，则可以将“？”及其之前的字符作为目标分句。

综上，本发明实施例不是直接将文本信息直接进行机器翻译，而是在依据文本信息所包含分句的信息对文本信息进行进一步处理、以从中获取分句的信息符合预置条件的目标分句后，进行该目标分句的机器翻译，也即，本发明实施例可以依据所述文本信息所包含分句的信息，对当前需要进行机器翻译的分句进行控制，以避免发送给机器翻译装置的句子过长或过短的情形，因此可以有效提高翻译的准确率和实时率。

例如，本发明实施例可以依据分句的数量和字数，通过对短句对应的分句进行拼接，使得拼接后的目标分句的结构更加完整，提高了翻译的准确率。又如，本发明实施例可以依据分句的数量和字数，通过切分长句，使得不需要得到整个长句完全固定了才进行翻译，故能够提高翻译的实时率和准确率。

方法实施例二

参照图3，示出了本发明的一种信息处理方法实施例二的步骤流程图，具体可以包括如下步骤：

步骤301、获取讲话用户的语音信号对应的文本信息；

步骤302、依据所述文本信息所包含分句的标点符号，识别得到所述文本信息所包含分句对应的分句类型，若所述分句类型为第二分句类型，则执行步骤303，否则，若所述分句类型为第一分句类型，则执行步骤304；

步骤303、将所述文本信息所包含的所述第二分句及所述第二分句之前的分句作为当前需要进行机器翻译的目标分句；

步骤304、依据文本信息所包含分句的总字数及文本信息所包含的分句是否包含预置标志位，识别所述文本信息对应分句的长短类型，若所述长短类型为短句类型，则执行步骤305，否则，若所述长短类型为长句类型，则执行步骤306；

步骤305、若所述文本信息中位于前面的分句的数量超过第一数量阈值、且所述位于前面的分句的字数超过第一字数阈值，则将所述位于前面的分句作为当前需要进行机器翻译的目标分句；

步骤306、若所述文本信息中位于前面的分句的数量与延迟阈值的差值D为第二数量阈值的倍数、且所述位于前面的分句的字数超过第二字数阈值，则将所述位于前面的D个分句作为当前需要进行机器翻译的目标分句，并执行步骤307；其中，D为正整数；

步骤307、在将所述位于前面的D个分句作为当前需要进行机器翻译的目标分句后，若所述文本信息中存在第二预设标点符号，则将所述第二预设标点符号及其之前的字符作为当前需要进行机器翻译的目标分句；

步骤308、向机器翻译装置发送所述目标分句，以使所述机器翻译装置将所述目标分句信息翻译为目标语言的文字。这里，目标分句可以源自步骤303、步骤305、步骤306或者步骤307。

可选地，在步骤302之前，可以将步骤301获取的文本信息写入缓存区，则步骤302可以从所述缓存区读取文本信息，并对读取的文本信息中的字符进行遍历，以得到读取的文本信息中的分句及分句的标点符号、数量和字数等信息。

进一步可选地，对于第二分句类型和短句类型，在向机器翻译装置发送所述目标分句后，可以在所述缓存区中删除对应的目标分句；对于长句类型，在向机器翻译装置发送所述第二预设标点符号及其之前的字符后，可以在所述缓存区中删除所述第二预设标点符号及其之前的字符。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的运动动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的运动动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的运动动作并不一定是本发明实施例所必须的。

装置实施例

参照图4，示出了本发明的一种信息处理装置实施例的结构框图，具体可以包括：文本获取模块401、目标分句获取模块402、以及目标分句发送模块403。

其中，文本获取模块401，用于获取讲话用户的语音信号对应的文本信息；

目标分句获取模块402，用于依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句，作为当前需要进行机器翻译的目标分句；

目标分句发送模块403，用于向机器翻译装置发送所述目标分句，以使所述机器翻译装置将所述目标分句信息翻译为目标语言的文字。

可选地，所述分句的信息可以包括：分句数量和字数，则所述目标分句获取模块可以包括：

可选地，所述目标分句获取模块还可以包括：

可选地，所述装置还可以包括：

则所述目标分句获取模块可以包括：

可选地，所述装置还可以包括：

写入模块，用于将所获取的文本信息写入缓存区；

则所述目标分句获取模块可以包括：

可选地，所述装置还可以包括：

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图5是根据一示例性实施例示出的一种用于信息处理的装置作为终端时的框图。例如，终端900可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图5，终端900可以包括以下一个或多个组件：处理组件902，存储器904，电源组件906，多媒体组件908，音频组件910，输入/输出(I/O)的接口912，传感器组件914，以及通信组件916。

处理组件902通常控制终端900的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理元件902可以包括一个或多个处理器920来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件902可以包括一个或多个模块，便于处理组件902和其他组件之间的交互。例如，处理组件902可以包括多媒体模块，以方便多媒体组件908和处理组件902之间的交互。

存储器904被配置为存储各种类型的数据以支持在终端900的操作。这些数据的示例包括用于在终端900上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件906为终端900的各种组件提供电力。电源组件906可以包括电源管理***，一个或多个电源，及其他与为终端900生成、管理和分配电力相关联的组件。

多媒体组件908包括在所述终端900和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动运动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件908包括一个前置摄像头和/或后置摄像头。当终端900处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。

音频组件910被配置为输出和/或输入音频信号。例如，音频组件910包括一个麦克风(MIC)，当终端900处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。在一些实施例中，音频组件910还包括一个扬声器，用于输出音频信号。

I/O接口912为处理组件902和***接口模块之间提供接口，上述***接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件914包括一个或多个传感器，用于为终端900提供各个方面的状态评估。例如，传感器组件914可以检测到终端900的打开/关闭状态，组件的相对定位，例如所述组件为终端900的显示器和小键盘，传感器组件914还可以检测终端900或终端900一个组件的位置改变，用户与终端900接触的存在或不存在，终端900方位或加速/减速和终端900的温度变化。传感器组件914可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件914还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件914还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件916被配置为便于终端900和其他设备之间有线或无线方式的通信。终端900可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信部件916经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中，所述通信部件916还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，终端900可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器904，上述指令可由终端900的处理器920执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由终端的处理器执行时，使得终端能够执行一种信息处理方法，所述方法包括：获取讲话用户的语音信号对应的文本信息；依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句，作为当前需要进行机器翻译的目标分句；向机器翻译装置发送所述目标分句，以使所述机器翻译装置将所述目标分句信息翻译为目标语言的文字。

图6是根据一示例性实施例示出的一种用于信息处理的装置作为服务器时的框图。该服务器1900可因配置或性能不同而产生比较大的差异，可以包括一个或一个以***处理器(central processing units，CPU)1922(例如，一个或一个以上处理器)和存储器1932，一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中，存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1922可以设置为与存储介质1930通信，在服务器1900上执行存储介质1930中的一系列指令操作。

服务器1900还可以包括一个或一个以上电源1926，一个或一个以上有线或无线网络接口1950，一个或一个以上输入输出接口1958，一个或一个以上键盘1956，和/或，一个或一个以上操作***1941，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器1932，上述指令可由服务器1900的处理器执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由服务器的处理器执行时，使得服务器能够执行一种信息处理方法，所述方法包括：获取讲话用户的语音信号对应的文本信息；依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句，作为当前需要进行机器翻译的目标分句；向机器翻译装置发送所述目标分句，以使所述机器翻译装置将所述目标分句信息翻译为目标语言的文字。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

以上对本发明所提供的一种信息处理方法、一种信息处理装置、一种用于信息处理的装置及一种同声翻译***，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种信息处理方法，其特征在于，包括：

获取讲话用户的语音信号对应的文本信息；

2.根据权利要求1所述的方法，其特征在于，所述分句的信息包括：分句数量和字数，则所述依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句的步骤，包括：

3.根据权利要求1所述的方法，其特征在于，所述分句的信息包括：分句数量和字数，则所述依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句的步骤，包括：

4.根据权利要求2或3所述的方法，其特征在于，所述依据所述文本信息所包含分句的信息，从所述文本信息中获取所述分句的信息符合预置条件的分句的步骤，还包括：

5.根据权利要求1或2或3所述的方法，其特征在于，所述方法还包括：

6.根据权利要求1或2或3所述的方法，其特征在于，所述方法还包括：

将所获取的文本信息写入缓存区；

7.根据权利要求1至3中任一所述的方法，其特征在于，所述方法还包括：

8.一种信息处理装置，其特征在于，包括：

9.一种用于信息处理的装置，其特征在于，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

获取讲话用户的语音信号对应的文本信息；

10.一种同声翻译***，其特征在于，包括：

权利要求9所述的信息处理装置；