WO2016112841A1

WO2016112841A1 - 一种信息处理方法及客户端、计算机存储介质

Info

Publication number: WO2016112841A1
Application number: PCT/CN2016/070683
Authority: WO
Inventors: 肖芬
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2015-01-12
Filing date: 2016-01-12
Publication date: 2016-07-21
Also published as: US10580394B2; US9858910B2; CN105845158A; MY187298A; US20180151163A1; US20160300557A1

Abstract

本发明公开了一种信息处理方法及客户端、计算机存储介质，其中，所述方法包括：触发第一操作；响应第一操作，下载第一音频文件及与第一音频文件相匹配的第一文字文件；根据用于标识截取起点位置的第一指示信息和用于标识截取终点位置的第二指示信息对第一音频文件进行部分截取得到第一音频片段；触发第二操作；响应第二操作，播放第一音频片段，并同步动态显示第一文字文件中与第一音频片段对应的文字信息部分；在播放第一音频片段的同时，采集用户的语音信息；将第一音频片段与语音信息合成为第一采集结果。

Description

一种信息处理方法及客户端、计算机存储介质

技术领域

本发明涉及通讯技术，尤其涉及一种信息处理方法及客户端、计算机存储介质。

背景技术

本申请发明人在实现本申请实施例技术方案的过程中，至少发现相关技术中存在如下技术问题：

近年来，随着智能终端的智能化，网络技术的高速发展，通过从服务器下载信息用于智能终端上各种应用程序(APP)的信息处理技术越来越多，能满足用户日常生活和工作的需要。

一种信息处理的应用场景可以是针对智能终端上一种常用的K歌类APP的场景，智能终端上安装的这类APP可以向用户播放从服务器下载得到的音频文件，比如歌曲对应的伴奏音乐，采集用户的语音信息并进行识别，将识别结果、或将对识别结果进一步与预设标准参照信息比较后得到的比较结果上传到服务器上以分享给其他人收听和评价。

鉴于这类APP只能够对下载的音频文件全部播放并同时采集用户的语音信息，比如供用户唱完并录制整首歌曲，从而导致以下两方面的问题：

一，采用现有技术无法对音频文件的部分内容进行截取播放，导致采集的信息量越大，对应的识别效果就会越复杂，识别所耗费的时间就会越长；

二、用户出于自身的喜好和声音条件，比如唱的音调比较高，或者比较低，导致与预设标准参照信息不匹配，从而得不到最佳的声音表现结果，也就是说，用户可能也只对其中音频文件的部分内容感兴趣，只需要截取音频文件的部分内容就可以，但是采用现有技术无法实现对音频文件的部分内容进行截取播放。

然而，相关技术中，对于上述问题，尚无有效解决方案。

发明内容

有鉴于此，本发明实施例希望提供一种信息处理方法及客户端、计算机存储介质，至少解决了现有技术存在的问题。

本发明实施例的技术方案是这样实现的：

本发明提供了一种信息处理方法，所述方法应用于终端中，所述方法包括：

触发第一操作；

响应所述第一操作，下载第一音频文件及与所述第一音频文件相匹配的第一文字文件；

根据用于标识截取起点位置的第一指示信息和用于标识截取终点位置的第二指示信息对所述第一音频文件进行部分截取得到第一音频片段；

触发第二操作；

响应所述第二操作，播放所述第一音频片段，并同步动态显示所述第一文字文件中与所述第一音频片段对应的文字信息部分；

在播放所述第一音频片段的同时，采集用户的语音信息；

将所述第一音频片段与所述语音信息合成为第一采集结果。

本发明又提供了一种客户端，所述客户端应用于终端中，所述客户端包括：

下载单元，被配置为下载第一音频文件及与所述第一音频文件相匹配的第一文字文件；

截取单元，被配置为根据用于标识截取起点位置的第一指示信息和用于标识截取终点位置的第二指示信息对所述第一音频文件进行部分截取得到第一音频片段；

播放单元，被配置为播放所述第一音频片段，并同步动态显示所述第一文字文件中与所述第一音频片段对应的文字信息部分；

采集单元，被配置为在播放所述第一音频片段的同时，采集用户的语音信息；

合成单元，被配置为将所述第一音频片段与所述语音信息合成为第一采集结果。

所述下载单元，所述截取单元，所述播放单元，所述采集单元，所述合成单元可以采用中央处理器(CPU，Central Processing Unit)、数字信号处理器(DSP，Digital Singnal Processor)或可编程逻辑阵列(FPGA，Field－Programmable Gate Array)实现。

本发明实施例还提供一种计算机存储介质，其中存储有计算机可执行指令，该计算机可执行指令用于执行上述信息处理方法。

本发明实施例的一种信息处理方法，所述方法应用于终端中，所述方法包括：触发第一操作；响应所述第一操作，下载第一音频文件及与所述第一音频文件相匹配的第一文字文件；根据用于标识截取起点位置的第一指示信息和用于标识截取终点位置的第二指示信息对所述第一音频文件进行部分截取得到第一音频片段；触发第二操作；响应所述第二操作，播放所述第一音频片段，并同步动态显示所述第一文字文件中与所述第一音频片段对应的文字信息部分；在播放所述第一音频片段的同时，采集用户的语音信息；将所述第一音频片段与所述语音信息合成为第一采集结果。

采用本发明实施例的信息处理方法及客户端，能够对下载的音频文件的部分内容进行截取播放，一方面，减少采集的信息量，降低终端的处理负荷；另一方面，用户可以根据自身的喜好和声音条件截取自己感兴趣的或自己能力所及的音频内容，从而提升用户的使用体验。

附图说明

图1为本发明方法实施例一的一个实现流程示意图；

图2为本发明方法实施例二的一个实现流程示意图；

图3为本发明方法实施例二的一个应用场景的示意图；

图4为本发明方法实施例三的一个实现流程示意图；

图5为本发明方法实施例三的一个应用场景的示意图；

图6为本发明方法实施例四的一个实现流程示意图；

图7为应用本发明方法实施例四的一个应用场景的示意图；

图8为实现本发明实施例的***的结构示意图；

图9为实现本发明实施例的终端的结构示意图；

图10为实现本发明实施例的交互流程图；

图11为本发明客户端实施例一的一个组成结构示意图；

图12为本发明客户端实施例二的一个组成结构示意图。

具体实施方式

下面结合附图对技术方案的实施作进一步的详细描述。

方法实施例一：

本发明实施例的一种信息处理方法，所述方法应用于终端中，如图1所示，所述方法包括：

步骤101、触发第一操作；

步骤102、响应第一操作，下载第一音频文件及与第一音频文件相匹配的第一文字文件；

步骤103、根据用于标识截取起点位置的第一指示信息和用于标识截取终点位置的第二指示信息对第一音频文件进行部分截取得到第一音频片段；

步骤104、触发第二操作；

步骤105、响应第二操作，播放第一音频片段，并同步动态显示第一文字文件中与第一音频片段对应的文字信息部分；

步骤106、在播放第一音频片段的同时，采集用户的语音信息；

步骤107、将第一音频片段与语音信息合成为第一采集结果。

上述方法中的步骤在不矛盾的情况下可以以不同的顺序或并发的方式执行。例如，步骤102中的下载第一音频文件的操作可以步骤103的截取操作之前完成，也可以仅下载步骤103中的截取操作所必需的信息，稍后在步骤105中播放第一音频片段时，采用流媒体的方式，边下载稍后所需的音频数据边进行播放。

采用本实施例的方法，解决了现有技术中无法对音频文件的部分内容进行截取播放的技术问题。一方面，从设备的角度来说，截取音频文件的部分内容进行播放并采集相应的语音信息会大幅度降低采集的信息量，减轻终端的处理负荷；另一方面，从用户的角度来说，用户可以根据自身的喜好和声音条件截取自己感兴趣的或自己能力所及的音频内容，从而提升了用户使用体验。

方法实施例二：

本发明实施例的一种信息处理方法，所述方法应用于终端中，如图2所示，所述方法包括：

步骤201、触发第一操作；

步骤202、响应第一操作，下载第一音频文件及与第一音频文件相匹配的第一文字文件；

步骤203、提供支持进行滑动操作的第一交互对象和第二交互对象；

步骤204、利用第一交互对象和第二交互对象同时或分别捕获截取起点位置和截取终点位置；

步骤205、生成用于标识截取起点位置的第一指示信息和用于标识截取终点位置的第二指示信息；

步骤206、从第一音频文件中截取第一指示信息指示的时间点与第二指示信息指示的时间点之间的部分，得到第一音频片段；

步骤207、触发第二操作；

步骤208、响应第二操作，播放第一音频片段，并同步动态显示第一文字文件中与第一音频片段对应的文字信息部分；

步骤209、在播放第一音频片段的同时，采集用户的语音信息；

步骤210、将第一音频片段与语音信息合成为第一采集结果。

相对于方法实施例一，本实施例提供了一种对音频文件的部分内容进行截取播放的具体实现方法，其中向用户提供了两个可滑动操作的交互对象。例如，在用户使用具有触摸屏的终端的情况下，用户可以通过手指在触摸屏上的滑动手势操纵两个交互对象来确定截取起点位置和截取终点位置。

用户可以根据需要或根据自己的操作习惯利用单个手指分别操纵两个交互对象，比如，利用单个手指的触控操作来操纵两个交互对象中的一个交互对象来确定截取起点位置，在截取起点位置确定后，再利用单个手指操纵两个交互对象中的另一个交互对象来确定截取终点位置；当然，也可以利用单个手指的触控操作来操纵两个交互对象中的一个交互对象来确定截取终点位置，在截取终点位置确定后，再利用单个手指操纵两个交互对象中的另一个交互对象来确定截取起点位置，总归目的是单手分别操纵两个交互对象中的任意一个交互对象，具体实现方式不限。

或者，用户也利用两个手指同时操纵两个交互对象，比如，利用两个手指在屏幕上的滑动操作同时操纵两个交互对象，选定位置后，进而通过长按及释放操作来确定选定位置中的截取起点位置和截取终点位置，总归目的是两个手指同时操纵两个交互对象，具体实现方式不限。

无论单手还是双手的上述具体实现方式都极大地方便了用户的使用。

叠加方案时常用的是：

在本实施例的一个实施方式中，可以在捕获截取起点位置和截取终点位置之后，将与所述第一音频片段对应的文字信息部分以区别于其它文字信息部分的方式进行显示。

在本实施例的一个实施方式中，可以触发第三操作；响应第三操作，可以使文字信息向上或向下平移，并且交互对象跟随文字信息向上或向下平移。

在本实施例的一个实施方式中，在将第一音频片段与语音信息合成为第一采集结果之后，可以回放第一采集结果。

在本实施例的一个实施方式中，在将所述第一音频片段与所述语音信息合成为第一采集结果之后，可以触发第四操作；响应第四操作，可以将第一采集结果保存至本地、上传至服务器或者发送给另一终端。

在本实施例的一个实施方式中，在将所述第一音频片段与所述语音信息合成为第一采集结果之后，可以触发第五操作；响应第五操作，重新进行步骤S208-S211。

在本实施例的一个实施方式中，将所述第一音频片段与所述语音信息合成为第一采集结果之后，可以触发第六操作；响应第六操作，可以从所述第一采集结果中截取部分得到第二采集结果。

在本实施例的一个实施方式中，可以将所述第一采集结果与所述第一音频文件的其他部分进行叠加得到第三采集结果。

在本实施例的一个实施方式中，可以对第一采集结果进行分析，得到一分析结果；可以将分析结果与预设标准参照信息进行比较，得到比较结果并显示该比较结果。

在本实施例的一个实施方式中，可以将第一采集结果与比较结果一起上传至服务器。

在本实施例的一个应用场景中，所描述的方法可以由安装在终端上的K歌App执行。图3为本实施例的一个应用场景的示意图。这里，上述的第一操作为用户的点歌操作，第一音频文件为与用户所选择的歌曲对应的伴奏曲，第一文字文件为与用户所选择的歌曲对应的歌词文件。K歌App可以为用户提供推荐曲目列表或搜索入口，以供用户找到自己想唱的歌曲。在用户点歌之后，该终端从服务器下载对应的伴奏曲和歌词文件。用户可以选择唱整首歌或截取片段，当选择“截取片段”选项卡时，K歌App在其交互界面上显示整首歌的歌词以及两个交互对象。如图3所示，在该应用场景下，这两个交互对象呈现为支持进行滑动操作的“起点”和“终点”两个标签。用户通过手指在触摸屏上的滑动手势确定这两个标签的位置以截取自己想唱的片段，其中“起点”和“终点”两个标签之间的歌词部分以区别于其他歌词部分的方式突出显示，例如以不同的颜色显示、以放大字体显示等等。上述的第二操作为用户点击“只录此段”按钮的操作，当用户点击此按钮时，终端音频输出单元(例如扬声器或耳机)开始播放截取的音频片段，并在显示屏幕上同步显示与该音频片段对应的歌词。用户参考伴奏曲和歌词来唱歌，同时终端通过麦克风采集用户的声音。终端将采集的用户声音与伴奏曲进行合成，从而在用户唱完该片段之后，可以得到第一采集结果，即用户的唱段。

方法实施例三：

本发明实施例的一种信息处理方法，所述方法应用于终端中，如图4所示，所述方法包括：

步骤401、触发第一操作；

步骤402、响应第一操作，下载第一音频文件及与第一音频文件相匹配的第一文字文件，其中第一文字文件包括时间配置信息和文字信息；

步骤403、利用时间配置信息将第一文字文件中的文字信息预先划分成多个部分；

步骤404、针对所述文字信息的每个部分提供一个支持进行选中操作的第三交互对象；

步骤405、根据第三交互对象被选中的指示信息确定与该第三交互对象对应的文字信息部分；

步骤406、将该文字信息部分的开头作为截取起点位置，将该文字信息部分的末尾作为截取终点位置；

步骤407、生成用于标识截取起点位置的第一指示信息和用于标识截取终点位置的第二指示信息；

步骤408、从第一音频文件中截取第一指示信息指示的时间点与第二指示信息指示的时间点之间的部分，得到第一音频片段；

步骤409、截取起点位置的第一指示信息和用于标识截取终点位置的第二指示信息对第一音频文件进行部分截取得到第一音频片段；

步骤410、触发第二操作；

步骤411、响应第二操作，播放第一音频片段，并同步动态显示第一文字文件中与第一音频片段对应的文字信息部分；

步骤412、在播放第一音频片段的同时，采集用户的语音信息；

步骤413、将第一音频片段与语音信息合成为第一采集结果。

与方法实施例二类似的是，相对于方法实施例一，本实施例的方法也提供了一种具体的对音频文件的部分内容进行截取播放的实现方法。相对于方法实施例一，在本实施例中，第一文字文件中的文字信息被预先划分成多个部分，针对文字信息的每个部分向用户提供了一个支持进行选中操作的交互对象。例如，用户可以通过手指或触屏笔在触摸屏上的单个轻敲手势或者鼠标单击操纵交互对象来确定截取起点位置和截取终点位置。如此一来，用户可以通过仅一个点击动作就完成第一音频片段的截取所需的操作，因此本实施例的方法相对于方法实施例二来说更加快捷。

在方法实施例二中描述的叠加方案同样适用于本实施例，在此不再重复描述。

在本实施例的一个应用场景中，所描述的方法也可以由安装在终端上的K歌App执行。图5为本实施例的一个应用场景的示意图。如图5所示，与图3所示的应用场景不同的是，在该应用场景下，整首歌的歌词被预先划分成多个部分，交互对象呈现为支持进行选中操作的多个单选框，每个单选框对应一个歌词部分。用户通过手指在触摸屏上的轻敲手势选中一个单选框以确定要截取的歌词部分，其中被选中的歌词部分以区别于其他歌词部分的方式突出显示，例如以不同的颜色显示、以放大字体显示等等。同样地，当用户点击“只录此段”按钮时，开始录歌。

方法实施例四：

本发明实施例的一种信息处理方法，所述方法应用于终端中，如图6所示，所述方法包括：

步骤601、触发第一操作；

步骤602、响应第一操作，下载第一音频文件及与第一音频文件相匹配的第一文字文件，其中第一文字文件包括时间配置信息和文字信息；

步骤603、利用时间配置信息将第一文字文件中的文字信息预先划分成多个部分；

步骤604、针对文字信息的每个部分提供一个支持进行选中操作的第四交互对象；

步骤605、根据至少两个第四交互对象被选中的指示信息，确定与所述至少两个第四交互对象中的第一个交互对象对应的文字信息部分的开头作为所述截取起点位置，与所述至少两个第四交互对象中的最后一个交互对象对应的文字信息部分的末尾作为所述截取终点位置；

步骤606、生成用于标识截取起点位置的第一指示信息和用于标识截取终点位置的第二指示信息；

步骤607、从第一音频文件中截取第一指示信息指示的时间点与第二指示信息指示的时间点之间的部分，得到第一音频片段；

步骤608、触发第二操作；

步骤609、响应第二操作，播放第一音频片段，并同步动态显示第一文字文件中与第一音频片段对应的文字信息部分；

步骤610、在播放第一音频片段的同时，采集用户的语音信息；

步骤611、将第一音频片段与语音信息合成为第一采集结果。

与方法实施例二、三类似的是，相对于方法实施例一，本实施例的方法也提供了一种具体的对音频文件的部分内容进行截取播放的实现方法。相对于方法实施例三，在本实施例中，多个交互对象可以被同时选中。例如，用户可以通过手指或触屏笔在触摸屏上的轻敲手势或者鼠标单击操纵交互对象，截取起点位置和截取终点位置根据被选中的第一个交互对象和最后一个交互对象来确定。如此一来，用户可以根据自己的需要通过例如两次点击动作随意地截取音频片段，因此本实施例的方法相对于方法实施例三来说能够实现更加令人满意的截取效果。

在本实施例的一个应用场景中，所描述的方法也可以由安装在终端上的K歌App执行。图7为本实施例的一个应用场景的示意图。如图7所示，与图3所示的应用场景不同的是，在该应用场景下，整首歌的歌词被预先划分成多个部分，交互对象呈现为支持进行选中操作的多个复选框，每个复选框对应一句歌词。用户通过手指在触摸屏上的轻敲手势选中至少两个复选框，其中第一个被选中的复选框和最后一个被选中的复选框之间的部分被确定为要截取的歌词部分，被选中的歌词部分以区别于其他歌词部分的方式突出显示，例如以不同的颜色显示、以放大字体显示等等。同样地，当用户点击“只录此段”按钮时，开始录歌。

以一个现实应用场景为例对本发明实施例阐述如下：

图8为实现本发明实施例的***的结构示意图。参照图8，其示出一个用于在终端上进行K歌的***。该***800包括一个或多个终端810以及一个或多个服务器830，这些终端810和服务器830通过网络820连接。终端810中安装有K歌App，用户通过使用该App来从服务器830下载伴奏曲和对应的歌词，从伴奏曲中截取一个片段，基于终端播放的伴奏曲片段并同步显示的歌词进行K歌，上传自己录制的唱段并查看他人对该唱段的评价、收听和评论他人录制的唱段，等等。

终端810可以是智能手机、WiFi耳机、平板电脑、笔记本电脑等等。图9为实现本发明实施例的终端810的框图。该终端810包括处理器910、存储器920、联网设备930、显示设备940、音频输出设备950(包括扬声器、耳机等)以及采集设备960(比如麦克风、耳麦等)。处理器910被配置为结合其他元件执行上述本发明实施例的方法。联网设备930被配置为使能该终端810与服务器830之间的通信，例如从服务器830获取推荐伴奏曲列表以及推荐唱段列表，下载伴奏曲、歌词、他人上传的唱段，将录制的唱段上传到服务器上，等等。存储器920被配置为存储从服务器下载的音频文件和文字文件、通过采集设备960采集的语音信息以及合成得到的采集结果。音频输出设备950被配置为播放伴奏曲以及采集结果，显示设备940被配置为在播放伴奏曲或采集结果时，同步显示歌词。采集设备960被配置为采集用户的语音信息。

下面结合本发明方法实施例二来描述实现该实施例的交互流程。图10为实现本发明实施例的交互流程图。该交互流程涉及用户1、用户1使用的终端810-1，用户2、用户2使用的终端810-2和服务器830。为了便于描述，这里对终端810-1和终端810-2实现的功能进行了区分。应该理解，这些功能均可以在一个终端上实现，并且整个K歌***不限于两个终端。该交互流程包括以下步骤：

步骤1001、用户1通过在终端810-1的触摸屏上执行轻敲手势来启动App；

步骤1002、终端810-1启动App；

步骤1003、服务器830向终端810-1推送推荐伴奏曲列表和推荐唱段列表；

步骤1004、用户1通过在终端810-1的触摸屏上执行轻敲手势来点歌；

步骤1005、终端810-1向服务器发送下载所点歌曲对应的伴奏曲及对应的歌词文件的请求；

步骤1006、服务器830返回该伴奏曲及对应的歌词文件；

步骤1007、终端810-1显示歌词以及可供用户操作的起点标签和终点标签；

步骤1008、用户1滑动操作起点标签和终点标签以确定起点和终点；

步骤1009、终端810-1从伴奏曲中截取起点和终点之间的音频片段；

步骤1010、用户1点击录制按钮以向终端810-1发送开始录制的命令；

步骤1011、终端810-1播放音频片段，动态显示该与音频片段对应的歌词；

步骤1012、用户1唱歌；

步骤1013、终端810-1采集用户1的歌声，对用户1针对每一句的歌声进行实时打分，并在显示屏幕上实时显示单句得分；

步骤1014、终端810-1将用户1的歌声与音频片段进行合成得到用户1的唱段，根据实时得分计算出唱段的总体得分，并在显示屏幕上显示总体得分；

步骤1015、终端810-1回放用户1的唱段供用户1收听，并提供重新录制、上传等选项供用户1选择；

步骤1016、用户1选择重新录制，该交互流程跳转至步骤1011；用户选择上传，则继续执行下一步；

步骤1017：终端810-1将用户1的唱段与总体得分一起上传至服务器830；

步骤1018：用户2通过在终端810-2的触摸屏上执行轻敲手势来启动App；

步骤1019、终端810-2启动App；

步骤1020、服务器830向终端810-2推送推荐伴奏曲列表和推荐唱段列表；

步骤1021、用户2通过在终端810-2的触摸屏上执行轻敲手势来选择用户1上传的唱段；

步骤1022、终端810-2向服务器830发送下载该唱段的请求；

步骤1023、服务器830返回该唱段及对应的歌词；

步骤1024、终端810-2播放该唱段，并同步显示对应的歌词；

步骤1025：用户2收听该唱段，并进行评价；

步骤1026：终端810-2将用户2的评价上传至服务器830。

这里需要指出的是：以上描述的交互流程仅仅是一个示例，其中的实时打分、计算总体得分、上传以及评价等步骤是可选的；截取音频片段的操作也可以用其它方式来实现，例如以方法实施例三或四所述的方式来实现；以上描述中提及的从推荐伴奏曲列表和推荐唱段列表中选择伴奏曲和唱段的方式，仅仅是一个示例而已，用户可以通过其他手段，例如关键词搜索，来选择自己感兴趣的伴奏曲和唱段。

基于上面方法实施例，本发明提供了客户端实施例。以下客户端实施例的描述，与上述方法描述是类似的，同方法的有益效果描述，不做赘述。对于本发明客户端实施例中未披露的技术细节，请参照本发明方法实施例的描述。

客户端实施例一：

本发明实施例的一种客户端，所述客户端应用于终端中，如图11所示，客户端810包括：

下载单元1101，被配置为下载第一音频文件及与所述第一音频文件相匹配的第一文字文件；

截取单元1102，被配置为根据用于标识截取起点位置的第一指示信息和用于标识截取终点位置的第二指示信息对所述第一音频文件进行部分截取得到第一音频片段；

播放单元1103，被配置为播放所述第一音频片段，并同步动态显示所述第一文字文件中与所述第一音频片段对应的文字信息部分；

采集单元1104，被配置为在播放所述第一音频片段的同时，采集用户的语音信息；

合成单元1105，被配置为将所述第一音频片段与所述语音信息合成为第一采集结果。

在本实施例的一个具体实现方式中，可选地，所述截取单元1102包括：

捕获子单元1102-1，被配置为捕获所述截取起点位置和所述截取终点位置；

指示信息生成单元1102-2，被配置为生成用于标识所述截取起点位置的第一指示信息和用于标识所述截取终点位置的第二指示信息，

音频片段生成单元1102-3，被配置为从所述第一音频文件中截取所述第一指示信息指示的时间点与所述第二指示信息指示的时间点之间的部分，得到第一音频片段。

在本实施例的一个具体实现方式中，可选地，所述捕获子单元1102-1被配置为提供支持进行滑动操作的第一交互对象和第二交互对象，利用所述第一交互对象和所述第二交互对象同时或分别捕获所述截取起点位置和所述截取终点位置。

客户端实施例二：

本发明实施例的一种客户端，客户端810应用于终端中，除了如图11所示的下载单元1101、截取单元1102、播放单元1103、采集单元1104、合成单元1105之外，如图12所示，所述客户端还包括：划分单元1206，被配置为利用第一文字文件的时间配置信息将所述第一文字文件中的文字信息预先划分成多个部分。

在本实施例的一个具体实现方式中，所述捕获子单元1102-1被配置为针对所述文字信息的每个部分提供一个支持进行选中操作的第三交互对象，根据一个第三交互对象被选中的指示信息确定与该第三交互对象对应的文字信息部分，将该文字信息部分的开头作为所述截取起点位置，将该文字信息部分的末尾作为所述截取终点位置。

在本实施例的另一个具体实现方式中，所述捕获子单元1102-1被配置为针对所述文字信息的每个部分提供一个支持进行选中操作的第四交互对象，根据至少两个第四交互对象被选中的指示信息，确定与所述至少两个第四交互对象中的第一个交互对象对应的文字信息部分的开头作为所述截取起点位置，与所述至少两个第四交互对象中的最后一个交互对象对应的文字信息部分的末尾作为所述截取终点位置。

在本实施例的一个具体实现方式中，可选地，该客户端进一步包括：区别标志单元，被配置为在捕获所述截取起点位置和所述截取终点位置之后，将与所述第一音频片段对应的文字信息部分以区别于其它文字信息部分的方式进行显示。

在本实施例的一个具体实现方式中，可选地，该客户端进一步包括：平移单元，被配置为使所述文字信息向上或向下平移，并且使所述交互对象跟随所述文字信息向上或向下平移。

在本实施例的一个具体实现方式中，可选地，该客户端进一步包括：回放单元，被配置为在将所述第一音频片段与所述语音信息合成为第一采集结果之后，回放所述第一采集结果。

在本实施例的一个具体实现方式中，可选地，该客户端进一步包括：存储单元，被配置为将所述第一采集结果保存至本地；上传单元，被配置为将所述第一采集结果上传至服务器。

在本实施例的一个具体实现方式中，可选地，该客户端进一步包括：分析单元，被配置为对第一采集结果进行分析；比较单元，被配置为将分析结果与预设标准参照信息比较得到比较结果并显示。

本发明实施例所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本领域内的技术人员应明白，本申请的实施例可提供为方法、***、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式，所述存储介质包括但不限于U盘、移动硬盘、只读存储器(ROM， Read-Only Memory)、磁盘存储器、CD-ROM、光学存储器等。

本申请是根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

相应的，本发明实施例还提供一种计算机存储介质，其中存储有计算机可执行指令，该计算机可执行指令用于执行本发明实施例的上述信息处理方法。

工业实用性

Claims

一种信息处理方法，所述方法应用于终端中，所述方法包括：

触发第一操作；

响应所述第一操作，下载第一音频文件及与所述第一音频文件相匹配的第一文字文件；

根据用于标识截取起点位置的第一指示信息和用于标识截取终点位置的第二指示信息对所述第一音频文件进行部分截取得到第一音频片段；

触发第二操作；

响应所述第二操作，播放所述第一音频片段，并同步动态显示所述第一文字文件中与所述第一音频片段对应的文字信息部分；

在播放所述第一音频片段的同时，采集用户的语音信息；

将所述第一音频片段与所述语音信息合成为第一采集结果。
根据权利要求1所述的方法，其中，根据用于标识截取起点位置的第一指示信息和用于标识截取终点位置的第二指示信息对所述第一音频文件进行部分截取得到第一音频片段包括：

捕获所述截取起点位置和所述截取终点位置；

生成用于标识所述截取起点位置的第一指示信息和用于标识所述截取终点位置的第二指示信息；

从所述第一音频文件中截取所述第一指示信息指示的时间点与所述第二指示信息指示的时间点之间的部分，得到所述第一音频片段。
根据权利要求2所述的方法，其中，捕获所述截取起点位置和所述截取终点位置包括：

提供支持进行滑动操作的第一交互对象和第二交互对象；

利用所述第一交互对象和所述第二交互对象同时或分别捕获所述截取起点位置和所述截取终点位置。
根据权利要求2所述的方法，其中，所述第一文字文件包括时间配置信息和文字信息，所述方法进一步包括：利用所述时间配置信息将所述第一文字文件中的文字信息预先划分成多个部分；

捕获所述截取起点位置和所述截取终点位置包括：

针对所述文字信息的每个部分提供一个支持进行选中操作的第三交互对象；

根据所述第三交互对象被选中的指示信息确定与所述第三交互对象对应的文字信息部分；

将该文字信息部分的开头作为所述截取起点位置，将该文字信息部分的末尾作为所述截取终点位置。
根据权利要求2所述的方法，其中，所述第一文字文件包括时间配置信息和文字信息，所述方法进一步包括：利用所述时间配置信息将所述第一文字文件中的文字信息预先划分成多个部分；

捕获所述截取起点位置和所述截取终点位置包括：

针对所述文字信息的每个部分提供一个支持进行选中操作的第四交互对象；

根据所述至少两个第四交互对象被选中的指示信息，确定与所述至少两个第四交互对象中的第一个交互对象对应的文字信息部分的开头作为所述截取起点位置，与所述至少两个第四交互对象中的最后一个交互对象对应的文字信息部分的末尾作为所述截取终点位置。
根据权利要求3至5中任一项所述的方法，其中，所述方法进一步包括：在捕获所述截取起点位置和所述截取终点位置之后，将与所述第一音频片段对应的文字信息部分以区别于其它文字信息部分的方式进行显示。
根据权利要求3至5中任一项所述的方法，其中，所述方法进一步包括：

触发第三操作；

响应所述第三操作，使所述文字信息向上或向下平移，并且所述交互对象跟随所述文字信息向上或向下平移。
根据权利要求1所述的方法，其中，所述方法进一步包括：

在将所述第一音频片段与所述语音信息合成为第一采集结果之后，回放所述第一采集结果。
根据权利要求1所述的方法，其中，所述方法进一步包括：

在将所述第一音频片段与所述语音信息合成为第一采集结果之后，触发第四操作；

响应第四操作，将所述第一采集结果保存至本地、上传至服务器或者发送给另一终端。
根据权利要求1所述的方法，其中，所述方法进一步包括：

对所述第一采集结果进行分析，得到一分析结果；

将所述分析结果与预设标准参照信息进行比较，得到比较结果并显示所述比较结果。
一种客户端，所述客户端应用于终端中，所述客户端包括：

下载单元，被配置为下载第一音频文件及与所述第一音频文件相匹配的第一文字文件；

截取单元，被配置为根据用于标识截取起点位置的第一指示信息和用于标识截取终点位置的第二指示信息对所述第一音频文件进行部分截取得到第一音频片段；

播放单元，被配置为播放所述第一音频片段，并同步动态显示所述第一文字文件中与所述第一音频片段对应的文字信息部分；

采集单元，被配置为在播放所述第一音频片段的同时，采集用户的语音信息；

合成单元，被配置为将所述第一音频片段与所述语音信息合成为第一采集结果。
根据权利要求1所述的客户端，其中，所述截取单元包括：

捕获子单元，被配置为捕获所述截取起点位置和所述截取终点位置；

指示信息生成单元，被配置为生成用于标识所述截取起点位置的第一指示信息和用于标识所述截取终点位置的第二指示信息，

音频片段生成单元，被配置为从所述第一音频文件中截取所述第一指示信息指示的时间点与所述第二指示信息指示的时间点之间的部分，得到所述第一音频片段。
根据权利要求12所述的客户端，其中，所述捕获子单元被配置为提供支持进行滑动操作的第一交互对象和第二交互对象，利用所述第一交互对象和所述第二交互对象同时或分别捕获所述截取起点位置和所述截取终点位置。
根据权利要求12所述的客户端，其中，所述第一文字文件包括时间配置信息和文字信息，所述客户端进一步包括：划分单元，被配置为利用所述时间配置信息将所述第一文字文件中的文字信息预先划分成多个部分；

所述捕获子单元被配置为针对所述文字信息的每个部分提供一个支持进行选中操作的第三交互对象，根据所述第三交互对象被选中的指示信息确定与所述第三交互对象对应的文字信息部分，将该文字信息部分的开头作为所述截取起点位置，将该文字信息部分的末尾作为所述截取终点位置。
根据权利要求12所述的客户端，其中，所述第一文字文件包括时间配置信息和文字信息，所述客户端进一步包括：划分单元，被配置为利用时间配置信息将所述第一文字文件中的文字信息预先划分成多个部分，

所述捕获子单元被配置为针对所述文字信息的每个部分提供一个支持进行选中操作的第四交互对象，根据至少两个第四交互对象被选中的指示信息，确定与所述至少两个第四交互对象中的第一个交互对象对应的文字信息部分的开头作为所述截取起点位置，与所述至少两个第四交互对象中的最后一个交互对象对应的文字信息部分的末尾作为所述截取终点位置。
根据权利要求13至15中任一项所述的客户端，其中，所述客户端进一步包括：区别标志单元，被配置为在捕获所述截取起点位置和所述截取终点位置之后，将与所述第一音频片段对应的文字信息部分以区别于其它文字信息部分的方式进行显示。
根据权利要求13至15中任一项所述的客户端，其中，所述客户端进一步包括：

平移单元，被配置为使所述文字信息向上或向下平移，并且使所述交互对象跟随所述文字信息向上或向下平移。
根据权利要求11所述的客户端，其中，所述客户端进一步包括：

回放单元，被配置为在将所述第一音频片段与所述语音信息合成为第一采集结果之后，回放所述第一采集结果。
根据权利要求11所述的客户端，其中，所述客户端进一步包括：

存储单元，被配置为将所述第一采集结果保存至本地；

上传单元，被配置为将所述第一采集结果上传至服务器。
根据权利要求11所述的客户端，其中，所述客户端进一步包括：

分析单元，被配置为对所述第一采集结果进行分析，得到一分析结果；

比较单元，被配置为将所述分析结果与预设标准参照信息进行比较，得到比较结果并显示所述比较结果。
一种计算机存储介质，其中存储有计算机可执行指令，该计算机可执行指令用于执行所述权利要求1至10任一项所述的方法。