CN109246308A

CN109246308A - 一种语音处理方法及终端设备

Info

Publication number: CN109246308A
Application number: CN201811242031.2A
Authority: CN
Inventors: 刘奔; 卢异龄
Original assignee: Vivo Mobile Communication Co Ltd
Current assignee: Vivo Mobile Communication Co Ltd
Priority date: 2018-10-24
Filing date: 2018-10-24
Publication date: 2019-01-18

Abstract

本发明实施例公开了一种语音处理方法及终端设备，涉及通信技术领域，可以解决用户通过终端设备发送的语音信息的效果单一的问题。具体方案为：通过目标应用程序获取用户输入的语音数据；采用第一语音处理方式对语音数据进行处理，以得到处理后的语音数据；通过目标应用程序发送处理后的语音数据。本发明实施例应用于对用户输入的语音数据进行处理的过程中。

Description

一种语音处理方法及终端设备

技术领域

本发明实施例涉及通信技术领域，尤其涉及一种语音处理方法及终端设备。

背景技术

通常，用户可以通过终端设备的语音输入功能输入语音信息，并通过终端设备将该语音信息发送至其它终端设备，以实现与其他用户之间的语音交流。

目前，用户在输入语音信息后，可以以多种方式将该语音信息发送至其他终端设备，例如通过短信应用程序将该语音信息发送至其他终端设备，或者通过聊天类的应用程序将该语音信息发送至其他终端设备等。

但是，由于用户输入到终端设备的语音信息是用户原声输入的，并未对语音信息进行任何处理，因此导致用户通过终端设备发送的语音信息的效果单一。

发明内容

本发明实施例提供一种语音处理方法及终端设备，可以解决用户通过终端设备发送的语音信息的效果单一的问题。

为了解决上述技术问题，本发明实施例采用如下技术方案：

本发明实施例的第一方面，提供一种语音处理方法，该语音处理方法可以包括：通过目标应用程序获取用户输入的语音数据；采用第一语音处理方式对语音数据进行处理，以得到处理后的语音数据；通过目标应用程序发送处理后的语音数据。

本发明实施例的第二方面，提供一种终端设备，该终端设备可以包括：获取单元、处理单元和发送单元。其中，获取单元，用于通过目标应用程序获取用户输入的语音数据。处理单元，用于采用第一语音处理方式对获取单元采集的语音数据进行处理，以得到处理后的语音数据。发送单元，用于通过目标应用程序发送处理单元得到的处理后的语音数据。

本发明实施例的第三方面，提供一种终端设备，该终端设备包括处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序，该计算机程序被处理器执行时实现如第一方面所述的语音处理方法的步骤。

本发明实施例的第四方面，提供一种计算机可读存储介质，该计算机可读存储介质上存储计算机程序，该计算机程序被处理器执行时实现如第一方面所述的语音处理方法的步骤。

在本发明实施例中，终端设备可以通过目标应用程序获取用户输入的语音数据，并采用第一语音处理方式对语音数据进行处理，以得到处理后的语音数据，以及通过目标应用程序发送处理后的语音数据。由于终端设备可以先采用第一语音处理方式对用户输入的语音数据处理，然后再通过目标应用程序发送处理后的语音数据，而并非直接发送用户原声输入的语音数据，因此可以使得用户通过终端设备发送的语音数据的效果多样化，从而可以提升用户的体验。

附图说明

图1为本发明实施例提供的一种安卓操作***的架构示意图；

图2为本发明实施例提供的一种语音处理方法的示意图之一；

图3为本发明实施例提供的一种语音处理方法的示意图之二；

图4为本发明实施例提供的一种手机的界面的实例示意图之一；

图5为本发明实施例提供的一种语音处理方法的示意图之三；

图6为本发明实施例提供的一种语音处理方法的示意图之四；

图7为本发明实施例提供的一种手机的界面的实例示意图之二；

图8为本发明实施例提供的一种手机的界面的实例示意图之三；

图9为本发明实施例提供的一种终端设备的结构示意图之一；

图10为本发明实施例提供的一种终端设备的结构示意图之二；

图11为本发明实施例提供的一种终端设备的结构示意图之三；

图12为本发明实施例提供的一种终端设备的硬件示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例的说明书和权利要求书中的术语“第一”和“第二”等是用于区别不同的对象，而不是用于描述对象的特定顺序。例如，第一输入和第二输入等是用于区别不同的输入，而不是用于描述输入的特定顺序。在本发明实施例的描述中，除非另有说明，“多个”的含义是指两个或两个以上。

本文中术语“和/或”，是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。本文中符号“/”表示关联对象是或者的关系，例如A/B表示A或者B。

在本发明实施例中，“示例性的”或者“例如”等词用于表示作例子、例证或说明。本发明实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言，使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

本发明实施例提供一种语音处理方法及终端设备，终端设备可以通过目标应用程序获取用户输入的语音数据，并采用第一语音处理方式对语音数据进行处理，以得到处理后的语音数据，以及通过目标应用程序发送处理后的语音数据。由于终端设备可以先采用第一语音处理方式对用户输入的语音数据处理，然后再通过目标应用程序发送处理后的语音数据，而并非直接发送用户原声输入的语音数据，因此可以使得用户通过终端设备发送的语音数据的效果多样化，从而可以提升用户的体验。

本发明实施例提供的语音处理方法及终端设备，可以应用于对用户输入的语音数据进行处理的过程中。具体的，可以应用于采用第一语音处理方式对用户输入的语音数据进行处理，并通过目标应用程序发送处理后的语音数据的过程中。

本发明实施例中的终端设备可以为具有操作***的终端设备。该操作***可以为安卓(Android)操作***，可以为ios操作***，还可以为其他可能的操作***，本发明实施例不作具体限定。

下面以安卓操作***为例，介绍一下本发明实施例提供的语音处理方法所应用的软件环境。

如图1所示，为本发明实施例提供的一种可能的安卓操作***的架构示意图。在图1中，安卓操作***的架构包括4层，分别为：应用程序层、应用程序框架层、***运行库层和内核层(具体可以为Linux内核层)。

其中，应用程序层包括安卓操作***中的各个应用程序(包括***应用程序和第三方应用程序)。

应用程序框架层是应用程序的框架，开发人员可以在遵守应用程序的框架的开发原则的情况下，基于应用程序框架层开发一些应用程序。

***运行库层包括库(也称为***库)和安卓操作***运行环境。库主要为安卓操作***提供其所需的各类资源。安卓操作***运行环境用于为安卓操作***提供软件环境。

内核层是安卓操作***的操作***层，属于安卓操作***软件层次的最底层。内核层基于Linux内核为安卓操作***提供核心***服务和与硬件相关的驱动程序。

以安卓操作***为例，本发明实施例中，开发人员可以基于上述如图1所示的安卓操作***的***架构，开发实现本发明实施例提供的语音处理方法的软件程序，从而使得该语音处理方法可以基于如图1所示的安卓操作***运行。即处理器或者终端设备可以通过在安卓操作***中运行该软件程序实现本发明实施例提供的语音处理方法。

下面结合附图，通过具体的实施例及其应用场景对本发明实施例提供的一种语音处理方法及终端设备进行详细地说明。

目前，现有技术中，由于用户输入到终端设备的语音信息是用户原声输入的，并未对语音信息进行任何处理，因此导致用户通过终端设备发送的语音信息的效果单一。

为了解决上述技术问题，本发明实施例提供的一种语音处理方法，图2示出了本发明实施例提供的一种语音处理方法的流程图，该方法可以应用于具有如图1所示的安卓操作***的终端设备。如图2所示，本发明实施例提供的语音处理方法可以包括下述的步骤201至步骤203。

步骤201、终端设备通过目标应用程序获取用户输入的语音数据。

可选的，本发明实施例中，上述目标应用程序可以为具有采集语音数据功能的应用程序。

示例性的，上述目标应用程序可以为聊天类应用程序。

可选的，本发明实施例中，用户可以通过在目标应用程序中进行语音输入，以输入语音数据。

可选的，本发明实施例中，结合图2，如图3所示，上述步骤201具体可以通过下述的步骤201a和步骤201b实现。

步骤201a、终端设备接收用户在目标应用程序的界面上的第二输入。

本发明实施例中，上述第二输入为用户输入语音数据的输入。

可选的，本发明实施例中，用户可以在目标应用程序的语音输入界面上进行第二输入，以输入语音数据。

可选的，本发明实施例中，上述第二输入可以为长按输入和语音输入，或者第二输入可以为点击输入和语音输入。

步骤201b、终端设备响应于第二输入，获取语音数据。

示例性的，以终端设备为手机为例进行说明。如图4所示，用户B打开应用程序1的聊天界面(例如与用户A的聊天界面)之后，手机中的应用程序1的界面10上显示语音输入框11，用户B可以对语音输入框11进行长按输入，并输入语音数据。

本发明实施例中，终端设备可以通过用户在目标应用程序的界面上的第二输入，以实现获取语音数据。

步骤202、终端设备采用第一语音处理方式对语音数据进行处理，以得到处理后的语音数据。

可选的，本发明实施例中，终端设备在采集用户输入的语音数据之后，可以采用第一语音处理方式对语音数据进行渲染处理。

可选的，本发明实施例中，上述第一语音处理方式可以为终端设备根据语音数据从终端设备中保存的多个语音处理方式中选取的语音处理方式，或者也可以为用户从终端设备中保存的多个语音处理方式中选择的语音处理方式。

可选的，在本发明实施例的一种可能的实现方式中，结合图2，如图5所示，在上述步骤202之前，本发明实施例提供的语音处理方法还可以包括下述的步骤301和步骤302。

步骤301、终端设备获取语音数据的属性信息。

可选的，本发明实施例中，上述属性信息可以包括以下至少一项：语音数据对应的文字信息、语音数据对应的声音特征信息、语音数据的语义信息以及文字信息的关键字等。

可选的，本发明实施例中，终端设备在采集语音数据之后，可以解析语音数据，以获取语音数据的属性信息。

可选的，本发明实施例中，上述语音数据对应的声音特征信息可以包括以下至少一项：输入语音数据的用户的情绪信息、用户的声音的音色、用户的声音的音调、用户的声音的响度以及用户的声音的时长和节奏等。

步骤302、终端设备根据属性信息，确定与属性信息对应的第一语音处理方式。

可选的，本发明实施例中，上述第一语音处理方式可以包括以下至少一项：在语音数据中添加背景语音、更改语音数据对应的声音特征信息、调整关键字的播放音量以及调整关键字的播放速度等。

可选的，本发明实施例中，终端设备可以根据语音数据对应的声音特征信息(例如用户的声音的时长和节奏)，在语音数据中添加背景语音。

可选的，本发明实施例中，上述更改语音数据对应的声音特征信息可以包括以下至少一项：更改输入语音数据的用户的情绪信息、用户的声音的音色、用户的声音的音调以及用户的声音的响度。

可选的，本发明实施例中，终端设备可以调高文字信息的关键字的播放音量和/或调慢文字信息的关键字的播放速度。

可选的，本发明实施例中，若属性信息为语音数据对应的文字信息，则第一语音处理方式可以为在语音数据中添加背景语音和/或更改语音数据对应的声音特征信息。

示例性的，终端设备可以识别语音数据对应的文字信息，然后更改语音数据对应的声音的音色，例如将语音数据对应的声音的音色更改为预设的音色。

可选的，本发明实施例中，若属性信息为语音数据对应的声音特征信息，则第一语音处理方式可以为在语音数据中添加背景语音和/或更改语音数据对应的声音特征信息。

示例性的，终端设备识别出语音数据对应的声音的情绪信息，然后更改情绪信息的强度(例如增强情绪信息)，并且，终端设备根据语音数据对应的声音的时长和节奏，在语音数据中添加对应的背景音乐。

可选的，本发明实施例中，若属性信息为语音数据的语义信息，则第一语音处理方式可以为在语音数据中添加与语义信息对应的背景语音和/或更改语音数据对应的声音特征信息。

示例性的，假设终端设备识别的语音数据的语义信息为“祝你生日快乐”，终端设备可以在语音数据中添加与“生日快乐”对应的背景语音，和/或，将语音数据对应的声音的情绪信息更改为欢快情绪的声音。

可选的，本发明实施例中，若属性信息为文字信息的关键字，则第一语音处理方式可以包括以下至少一项：在语音数据中添加背景语音、更改语音数据对应的声音特征信息、调整关键字的播放音量以及调整关键字的播放速度。

示例性的，终端设备可以将语音数据解析为文字信息，并根据该文字信息识别出关键字，然后将该关键字进行慢放，同时调高该关键字的播放音量。

本发明实施例中，终端设备可以通过获取的语音数据的属性信息，以实现确定处理语音数据的第一语音处理方式。

可选的，在本发明实施例的另一种可能的实现方式中，结合图2，如图6所示，在上述步骤202之前，本发明实施例提供的语音处理方法还可以包括下述的步骤401至步骤403。

步骤401、终端设备在第一界面上显示提示信息。

本发明实施例中，上述提示信息用于提示处理语音数据的多个语音处理方式。

可选的，本发明实施例中，终端设备在采集用户输入的语音数据之后，可以在终端设备的第一界面(即终端设备的当前界面)上显示提示信息，以提示处理语音数据的多个语音处理方式。

可选的，本发明实施例中，终端设备可以采用悬浮框的形式在第一界面上显示提示信息。

可选的，本发明实施例中，用户可以滑动悬浮框中的滚动条，以触发终端设备显示多个语音处理方式。

示例性的，结合图4，如图7所示，用户B在语音输入框11进行长按输入，并输入语音数据之后，手机的应用程序1的界面10上显示提示框12，该提示框12中包括多个语音处理方式(例如语音处理方式1、语音处理方式2、语音处理方式3)。

步骤402、终端设备接收用户的第一输入。

本发明实施例中，上述第一输入为用户从多个语音处理方式中的选择输入。

本发明实施例中，用户可以从多个语音处理方式中对第一语音处理方式进行选择输入。可以理解，多个语音处理方式中包括第一语音处理方式。

步骤403、终端设备响应于第一输入，确定第一语音处理方式。

本发明实施例中，终端设备可以通过用户对第一语音处理方式的选择输入(即第一输入)，以实现确定处理语音数据的第一语音处理方式。

步骤203、终端设备通过目标应用程序发送处理后的语音数据。

可选的，本发明实施例中，终端设备可以通过目标应用程序将处理后的语音数据发送至服务器，并通过服务器将处理后的语音数据发送至其他终端设备。

可选的，本发明实施例中，终端设备可以在目标应用程序的界面上以预设方式显示处理后的语音数据。

示例性的，结合图4，如图8所示，手机在应用程序1的界面10上以预设方式显示处理后的语音数据(例如显示处理后的语音数据的时长)，并通过应用程序1将处理后的语音数据发送至用户A所属的终端设备，则用户A可以通过用户A所属的终端设备接收并播放处理后的语音数据。

本发明实施例提供一种语音处理方法，终端设备可以通过目标应用程序获取用户输入的语音数据，并采用第一语音处理方式对语音数据进行处理，以得到处理后的语音数据，以及通过目标应用程序发送处理后的语音数据。由于终端设备可以先采用第一语音处理方式对用户输入的语音数据处理，然后再通过目标应用程序发送处理后的语音数据，而并非直接发送用户原声输入的语音数据，因此可以使得用户通过终端设备发送的语音数据的效果多样化，从而可以提升用户的体验。

图9示出了本发明实施例中涉及的终端设备的一种可能的结构示意图。如图9所示，终端设备90可以包括：获取单元91、处理单元92和发送单元93。

其中，获取单元91，用于通过目标应用程序获取用户输入的语音数据。处理单元92，用于采用第一语音处理方式对获取单元91获取的语音数据进行处理，以得到处理后的语音数据。发送单元93，用于通过目标应用程序发送处理单元92处理后的语音数据。

在一种可能的实现方式中，获取单元91，用于在处理单元92采用第一语音处理方式对语音数据进行处理之前，获取语音数据的属性信息。结合图9，如图10所示，本发明实施例提供的终端设备90还可以包括：确定单元94。其中，确定单元94，用于根据获取单元91获取的属性信息，确定与属性信息对应的第一语音处理方式。

在一种可能的实现方式中，上述属性信息可以包括以下至少一项：语音数据对应的文字信息、语音数据对应的声音特征信息、语音数据的语义信息以及文字信息的关键字。

在一种可能的实现方式中，上述第一语音处理方式可以包括以下至少一项：在语音数据中添加背景语音、更改语音数据对应的声音特征信息、调整关键字的播放音量以及调整关键字的播放速度。

在一种可能的实现方式中，结合图9，如图11所示，本发明实施例提供的终端设备90还可以包括：显示单元95、接收单元96和确定单元94。其中，显示单元95，用于在处理单元92采用第一语音处理方式对语音数据进行处理之前，在第一界面上显示提示信息，该提示信息用于提示处理语音数据的多个语音处理方式。接收单元96，用于接收用户的第一输入，该第一输入为用户从显示单元95显示的多个语音处理方式中的选择输入。确定单元94，用于响应于接收单元96接收的第一输入，确定第一语音处理方式。

在一种可能的实现方式中，获取单元91，具体用于接收用户在目标应用程序的界面上的第二输入，该第二输入为用户输入语音数据的输入；并响应于第二输入，获取语音数据。

本发明实施例提供的终端设备能够实现上述方法实施例中终端设备实现的各个过程，为避免重复，详细描述这里不再赘述。

本发明实施例提供一种终端设备，终端设备可以通过目标应用程序获取用户输入的语音数据，并采用第一语音处理方式对语音数据进行处理，以得到处理后的语音数据，以及通过目标应用程序发送处理后的语音数据。由于终端设备可以先采用第一语音处理方式对用户输入的语音数据处理，然后再通过目标应用程序发送处理后的语音数据，而并非直接发送用户原声输入的语音数据，因此可以使得用户通过终端设备发送的语音数据的效果多样化，从而可以提升用户的体验。

图12为实现本发明各个实施例的一种终端设备的硬件示意图。如图12所示，终端设备100包括但不限于：射频单元101、网络模块102、音频输出单元103、输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。

需要说明的是，本领域技术人员可以理解，图12中示出的终端设备结构并不构成对终端设备的限定，终端设备可以包括比图12所示更多或更少的部件，或者组合某些部件，或者不同的部件布置。在本发明实施例中，终端设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。

其中，处理器110，用于通过目标应用程序获取用户输入的语音数据；并采用第一语音处理方式对语音数据进行处理，以得到处理后的语音数据；以及通过目标应用程序发送处理后的语音数据。

应理解的是，本发明实施例中，射频单元101可用于收发信息或通话过程中，信号的接收和发送，具体的，将来自基站的下行数据接收后，给处理器110处理；另外，将上行的数据发送给基站。通常，射频单元101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外，射频单元101还可以通过无线通信***与网络和其他设备通信。

终端设备通过网络模块102为用户提供了无线的宽带互联网访问，如帮助用户收发电子邮件、浏览网页和访问流式媒体等。

音频输出单元103可以将射频单元101或网络模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且，音频输出单元103还可以提供与终端设备100执行的特定功能相关的音频输出(例如，呼叫信号接收声音、消息接收声音等等)。音频输出单元103包括扬声器、蜂鸣器以及受话器等。

输入单元104用于接收音频或视频信号。输入单元104可以包括图形处理器(Graphics Processing Unit，GPU)1041和麦克风1042，图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中或者经由射频单元101或网络模块102进行发送。麦克风1042可以接收声音，并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。

终端设备100还包括至少一种传感器105，比如光传感器、运动传感器以及其他传感器。具体地，光传感器包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度，接近传感器可在终端设备100移动到耳边时，关闭显示面板1061和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别终端设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；传感器105还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等，在此不再赘述。

显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061，可以采用液晶显示器(Liquid Crystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode，OLED)等形式来配置显示面板1061。

用户输入单元107可用于接收输入的数字或字符信息，以及产生与终端设备的用户设置以及功能控制有关的键信号输入。具体地，用户输入单元107包括触控面板1071以及其他输入设备1072。触控面板1071，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作)。触控面板1071可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器110，接收处理器110发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071，用户输入单元107还可以包括其他输入设备1072。具体地，其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

进一步的，触控面板1071可覆盖在显示面板1061上，当触控面板1071检测到在其上或附近的触摸操作后，传送给处理器110以确定触摸事件的类型，随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图12中，触控面板1071与显示面板1061是作为两个独立的部件来实现终端设备的输入和输出功能，但是在某些实施例中，可以将触控面板1071与显示面板1061集成而实现终端设备的输入和输出功能，具体此处不做限定。

接口单元108为外部装置与终端设备100连接的接口。例如，外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如，数据信息、电力等等)并且将接收到的输入传输到终端设备100内的一个或多个元件或者可以用于在终端设备100和外部装置之间传输数据。

存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器109可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器110是终端设备的控制中心，利用各种接口和线路连接整个终端设备的各个部分，通过运行或执行存储在存储器109内的软件程序和/或模块，以及调用存储在存储器109内的数据，执行终端设备的各种功能和处理数据，从而对终端设备进行整体监控。处理器110可包括一个或多个处理单元；优选的，处理器110可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作***、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器110中。

终端设备100还可以包括给各个部件供电的电源111(比如电池)，优选的，电源111可以通过电源管理***与处理器110逻辑相连，从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。

另外，终端设备100包括一些未示出的功能模块，在此不再赘述。

优选的，本发明实施例还提供一种终端设备，包括如图12所示的处理器110，存储器109，存储在存储器109上并可在所述处理器110上运行的计算机程序，该计算机程序被处理器110执行时实现上述方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本发明的保护之内。

Claims

1.一种语音处理方法，其特征在于，所述方法包括：

通过目标应用程序获取用户输入的语音数据；

采用第一语音处理方式对所述语音数据进行处理，以得到处理后的语音数据；

通过所述目标应用程序发送所述处理后的语音数据。

2.根据权利要求1所述的方法，其特征在于，所述采用第一语音处理方式对所述语音数据进行处理之前，所述方法还包括：

获取所述语音数据的属性信息；

根据所述属性信息，确定与所述属性信息对应的所述第一语音处理方式。

3.根据权利要求2所述的方法，其特征在于，所述属性信息包括以下至少一项：所述语音数据对应的文字信息、所述语音数据对应的声音特征信息、所述语音数据的语义信息以及所述文字信息的关键字；

所述第一语音处理方式包括以下至少一项：在所述语音数据中添加背景语音、更改所述语音数据对应的声音特征信息、调整所述关键字的播放音量以及调整所述关键字的播放速度。

4.根据权利要求1所述的方法，其特征在于，所述采用第一语音处理方式对所述语音数据进行处理之前，所述方法还包括：

在第一界面上显示提示信息，所述提示信息用于提示处理所述语音数据的多个语音处理方式；

接收用户的第一输入，所述第一输入为用户从所述多个语音处理方式中的选择输入；

响应于所述第一输入，确定所述第一语音处理方式。

5.根据权利要求1至4中任一项所述的方法，其特征在于，所述通过目标应用程序获取用户输入的语音数据，包括：

接收用户在所述目标应用程序的界面上的第二输入，所述第二输入为用户输入所述语音数据的输入；

响应于所述第二输入，获取所述语音数据。

6.一种终端设备，其特征在于，所述终端设备包括：获取单元、处理单元和发送单元；

所述获取单元，用于通过目标应用程序获取用户输入的语音数据；

所述处理单元，用于采用第一语音处理方式对所述获取单元获取的所述语音数据进行处理，以得到处理后的语音数据；

所述发送单元，用于通过所述目标应用程序发送所述处理单元得到的所述处理后的语音数据。

7.根据权利要求6所述的终端设备，其特征在于，所述获取单元，还用于在所述处理单元采用第一语音处理方式对所述语音数据进行处理之前，获取所述语音数据的属性信息；

所述终端设备还包括：确定单元；

所述确定单元，用于根据所述获取单元获取的所述属性信息，确定与所述属性信息对应的所述第一语音处理方式。

8.根据权利要求7所述的终端设备，其特征在于，所述属性信息包括以下至少一项：所述语音数据对应的文字信息、所述语音数据对应的声音特征信息、所述语音数据的语义信息以及所述文字信息的关键字；

9.根据权利要求6所述的终端设备，其特征在于，所述终端设备还包括：显示单元、接收单元和确定单元；

所述显示单元，用于在所述处理单元采用第一语音处理方式对所述语音数据进行处理之前，在第一界面上显示提示信息，所述提示信息用于提示处理所述语音数据的多个语音处理方式；

所述接收单元，用于接收用户的第一输入，所述第一输入为用户从所述多个语音处理方式中的选择输入；

所述确定单元，用于响应于所述接收单元接收的所述第一输入，确定所述第一语音处理方式。

10.根据权利要求6至9中任一项所述的终端设备，其特征在于，所述获取单元，具体用于接收用户在所述目标应用程序的界面上的第二输入，所述第二输入为用户输入所述语音数据的输入；并响应于所述第二输入，获取所述语音数据。

11.一种终端设备，其特征在于，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的语音处理方法的步骤。