CN107818786A

CN107818786A - 一种通话语音处理方法、移动终端

Info

Publication number: CN107818786A
Application number: CN201711015890.3A
Authority: CN
Inventors: 王健
Original assignee: Vivo Mobile Communication Co Ltd
Current assignee: Vivo Mobile Communication Co Ltd
Priority date: 2017-10-25
Filing date: 2017-10-25
Publication date: 2018-03-20

Abstract

本发明实施例提供了一种通话语音处理方法及移动终端，其中所述方法包括：将通话语音转化成文本；其中，所述通话语音为用户通过所述移动终端进行通信产生的语音；识别所述通话语音对应的通话语气；确定与所述通话语气对应的通话情绪关键词，以及与所述通话语音对应的通话对象的身份标识；将所述文本、所述通话情绪关键词、所述身份标识以及所述通话语音进行对应存储。通过本发明实施例提供的通话语音处理方案，当用户预查找某通话语音时，仅需输入关键词移动终端即可查找到与关键词匹配的通话语音，无需用户手动逐个进行通话语音查找，查找耗时短、效率高，能够提升用户的使用体验。

Description

一种通话语音处理方法、移动终端

技术领域

本发明实施例涉及通信技术领域，尤其涉及一种通话语音处理方法、移动终端。

背景技术

随着移动终端功能的不断提升，用户不仅可以通过接打电话的形式与他人进行语音通话，还可以通过移动终端中安装的社交类应用程序与他人进行语音通话。

目前在通过拨打电话的形式进行语音通话时，大多数移动终端无法对通话语音进行存储因此也无法为用户提供语音回溯的服务。即便是有少数移动终端存在通话录音功能，所录制的通话语音也仅是单一的存储在移动终端的存储卡中，通话语音也不易回溯。具体地，若用户预查找某段历史通话语音，但用户只能模糊记得大致的谈话内容，此时，用户需要到存储卡中存储的通话语音中逐个试听查找，耗时长查找效率低，影响用户的使用体验。可见，现有技术中无法高效地对历史通话语音进行查找。

发明内容

本发明实施例提供一种通话语音处理方法、移动终端，以解决现有技术中存在的无法高效地对历史通话语音进行查找的问题。

为了解决上述技术问题，本发明是这样实现的：一种通话语音处理方法，包括：将通话语音转化成文本；其中，所述通话语音为用户通过所述移动终端进行通信产生的语音；识别所述通话语音对应的通话语气；确定与所述通话语气对应的通话情绪关键词，以及与所述通话语音对应的通话对象的身份标识；将所述文本、所述通话情绪关键词、所述身份标识以及所述通话语音进行对应存储。

第一方面，本发明实施例还提供了一种移动终端，包括：转化模块，用于将通话语音转化成文本；其中，所述通话语音为用户通过所述移动终端进行通信产生的语音；识别模块，用于识别所述通话语音对应的通话语气；第一确定模块，用于确定所述通话语气对应的通话情绪关键词，以及与所述通话语音对应的通话对象的身份标识；存储模块，用于将所述文本、所述通话情绪关键词、所述身份标识以及所述通话语音进行对应存储。

第二方面，本发明实施例提供了一种移动终端，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现本发明实施例中任一种所述的通话语音处理方法的步骤。

第三方面，本发明实施例提供了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现本发明实施例中任一种所述的通话语音处理方法的步骤。

在本发明实施例中，通过将通话语音转化成本文，确定通话语音对应的通话情绪关键词，确定通话对象的身份标识，在存储通话语音时将上述三个维度的信息与通话语音进行对应存储。该种存储通话语音的方案，当用户预查找某通话语音时，仅需输入关键词移动终端即可查找到与关键词匹配的通话语音，无需用户手动逐个进行通话语音查找，查找耗时短、效率高，能够提升用户的使用体验。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1是根据本发明实施例一的一种通话语音处理方法的步骤流程图；

图2是根据本发明实施例二的一种通话语音处理方法的步骤流程图；

图3是根据本发明实施例三的一种通话语音处理方法的步骤流程图；

图4是根据本发明实施例四的一种移动终端的结构框图；

图5是根据本发明实施例五的一种移动终端的硬件结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

参照图1，示出了本发明实施例一的一种通话语音处理方法的步骤流程图。

本发明实施例的通话语音处理方法包括以下步骤：

步骤101：将通话语音转化成文本。

其中，通话语音为用户通过移动终端进行通信过程中产生的语音。该通信过程可以为用户接打电话进行的通信，也可以为用户通过社交类应用程序进行的通信。

移动终端录制用户的通话语音，当通话结束后进行通话语音存储。在对通话语音进行存储前，需确定通话语音对应的三个维度的信息，分别为：文本、通话情绪关键词以及通话对象的身份标识。在确定这三个维度的信息后，将这三个维度的信息与通话语音进行对应存储。

本发明实施例中，以对一条通话语音进行处理为例进行说明，在具体实现过程中，可以重复执行本发明实施例中所示的通话语音处理流程，对移动终端通信过程中所产生的各条通话语音进行处理。

步骤102：识别通话语音对应的通话语气。

通话语气可以反映用户通话时的情绪，因此通过识别通话语音对应的通话语气能够反向推导出用户通话时的情绪。

步骤103：确定与通话语气对应的通话情绪关键词，以及与通话语音对应的通话对象的身份标识。

通话情绪可以包括但不限于：开心、生气、悲伤、惊讶、恐惧以及平和等，相应地通话情绪对应的关键词可以对应设置为：开心、生气、悲伤、惊讶、恐惧以及平和。

通话语音的采集场景不同，相应地通话对象的身份标识获取途径也不同。通话对象的身份标识可以为通话对象在通讯录中的联系人名称，也可以为通话对象的社交应用程序账号或昵称等。

需要说明的是，步骤101为文本转换流程、步骤102至步骤103为通话对象的身份标识以及通话情绪关键词的确定流程，在具体实现过程中，这两个流程并无必然的先后执行顺序，二者还可以并行执行。

步骤104：将文本、通话情绪关键词、身份标识以及通话语音进行对应存储。

该对应关系可以存储在移动终端中的任意适当的存储空间中。当用户进行历史通话语音查找时，触发移动终端弹出通话语音搜索框，在通话语音搜索框中输入搜索关键词，移动终端从相应存储空间中进行关键词匹配即可搜索得到目标通话语音。

本发明实施例提供的通话语音处理方法，通过将通话语音转化成本文，确定通话语音对应的通话情绪关键词，确定通话对象的身份标识，在存储通话语音时将上述三个维度的信息与通话语音进行对应存储。该种存储通话语音的方案，当用户预查找某通话语音时，仅需输入关键词移动终端即可查找到与关键词匹配的通话语音，无需用户手动逐个进行通话语音查找，查找耗时短、效率高，能够提升用户的使用体验。

实施例二

参照图2，示出了本发明实施例二的一种通话语音处理方法的步骤流程图。

本发明实施例的通话语音处理方法中，包括通话语音存储以及查找两个阶段，通话语音处理方法具体包括以下步骤：

步骤201：将通话语音转化成文本。

其中，通话语音为用户通过移动终端进行通信产生的语音。

移动终端设置有文本转换模块以及语气和情绪识别模块。移动终端录制用户的通话语音，当通话结束后调用文本转换模块将所录制的通话语音转化成文本。

将通话语音转化成文本的具体转化方式参照相关技术即可，本发明实施例中对此不作具体限制。

步骤202：识别通话语音对应的通话语气。

语气和情绪识别模块利用语气和情绪识别技术，识别出所录制的该段通话语音对应的通话情绪，并且进一步确定通话情绪对应的关键词。语气和情绪识别的具体技术参照相关技术即可，本发明实施例中对此不作具体限制。

通话情绪关键词可以包括：开心、生气、悲伤、惊讶、恐惧以及平和中的至少之一。

步骤203：确定与通话语气对应的通话情绪关键词，以及与通话语音对应的通话对象的身份标识。

通话对象的身份标识可以从移动终端的通讯录中获取，也可以从用户所登录的社交类应用程序中获取。具体的获取途径需要依据该通话语音的产生途径适应性调整，例如：该通话语音为用户电话录音，则通话对象的身份标识需要从通讯录中获取；再例如：该通话语音为用户通过社交类应用程序与好友的语音通话录音，则通话对象的身份标识需要从社交类应用程序的联系人名单中获取。

步骤204：将文本、通话情绪关键词、身份标识以及通话语音进行对应存储。

本发明实施例中建立三个维度的信息与通话语音进行的对应关系。当进行通话语音查找时，用户输入上述三个维度信息中的任意一个维度的信息，移动终端即可为其匹配到目标通话语音，无需用户手动逐个进行通话语音查找。

步骤205：接收用户在通话语音搜索框中，输入的第一关键词。

通话语音搜索框可以由相应接口控制显示，当该接口被调用时显示通话语音搜索框。具体地，该接口可以设置在通话语音的管理界面中，用户预进入管理界面中查找通话语音时，调用该接口即可触发移动终端显示通话语音搜索框。

其中，第一关键词为文本关键词、通话情绪关键词以及身份标识中的至少之一。当然，用户也可以同时输入文本关键词、通话情绪关键词以及身份标识这三个维度的关键词，或者任意两个维度的关键词。

所输入的关键词的维度越多，则最终查找到的通话语音的精准性越高。

步骤206：遍历已存储的各文本、通话情绪关键词、身份标识以及通话语音，查找与第一关键词匹配的目标通话语音并输出。

遍历文本、通话情绪关键词、身份标识以及通话语音时，可以逐条遍历各文本、通话情绪关键词、身份标识以及通话语音对应关系。具体地，将第一关键词与第一个对应关系中的通话情绪关键词、身份标识以及文本分别进行匹配，若与其中一个维度的信息匹配成功，则将该对应关系中的通话语音确定为目标通话语音；并进行下一个对应关系的匹配。若与三个维度的信息匹配均失败，则与第二个对应关系中的通话情绪关键词、身份标识以及文本分别进行匹配，依次类推直至匹配出全部目标通话语音为止。

需要说明的是，通过查找可以得到一条目标通话语音，也可以得到多条目标通话语音，移动终端在显示出各条目标通话语音供用户选择，用户从中选择出所需通话语音点击播放即可。

通过本发明实施例提供的通话语音处理方法，用户仅通过一个维度的关键词即可查找到所需要的通话语音。例如：用户预查找一个月前与某人的电话录音，但该用户无法记得通话对象以及通话内容，仅依稀记得当时通话很恼火，因此用户语音搜索框中输入“生气”这一个表征通话情绪关键词，即可触发移动终端从历史所存储的通话语音中匹配情绪为“生气”的历史通话语音，或对应的文本里面有“生气”二字的历史通话语音，然后把这些查找到的目标通话语音列出来，用户在所列出的目标通话语音中选择所需要的通话记录即可。

实施例三

参照图3，示出了本发明实施例三的一种通话语音处理方法的步骤流程图。

步骤301：将通话语音转化成文本。

其中，通话语音为用户通过移动终端进行通信产生的语音。

移动终端设置有文本转换模块以及语气和情绪识别模块。移动终端录制用户的通话语音，当通话结束后调用文本转换模块将所录制的通话语音转化成文本。将通话语音转化成文本的具体转化方式参照相关技术即可，本发明实施例中对此不作具体限制。

通话语音转化后的文本中包含大量的词语以及短句，因此通话语音转化后的文本可作为关键词匹配的一个维度。

步骤302：识别通话语音对应的通话语气，并确定通话语气对应的通话情绪关键词。

步骤303：确定通话语气对应的通话情绪关键词，以及与通话语音对应的通话对象的身份标识。

通话对象的身份标识可以从移动终端的通讯录中获取，也可以从用户所登录的社交类应用程序中获取。具体的获取途径需要依据该通话语音的产生途径适应性调整。

步骤304：确定本次通话的时间以及地点。

通话地点可以通过移动终端中设置的GPS(Global Positioning System，全球定位***)确定。通话时间可以由移动终端中设置的时钟应用程序确定。

步骤305：将文本、通话情绪关键词、时间、地点、身份标识以及通话语音进行对应存储。

本发明实施例中建立五个维度的信息与通话语音进行的对应关系。当进行通话语音查找时，用户输入上述五个维度信息中的任意一个或多个维度的信息，移动终端即可为其匹配到目标通话语音，无需用户手动逐个进行通话语音查找。

本发明实施例相较于实施例二中的通话语音处理方法，在进行通话语音存储时增加了时间、地点这两个维度的信息，这样当用户进行通话语音查找时，能够增加用户查找通话语音关键词的广度。

步骤306：接收用户在通话语音搜索框中，输入的第二关键词。

其中，第二关键词为文本关键词、通话情绪关键词、身份标识、时间、地点中的至少之一。当然，用户也可以同时输入五个维度的关键词，或者任意两个维度、三个维度或四个维度的关键词。所输入的关键词的维度越多，则最终查找到的通话语音的精准性越高。

步骤307：遍历已存储的各文本、通话情绪关键词、身份标识、时间、地点以及通话语音，查找与第二关键词匹配的目标通话语音并输出。

遍历各文本、通话情绪关键词、身份标识、时间、地点以及通话语音时，可以逐条遍历各对应关系。具体地，将第二关键词与第一个对应关系中的通话情绪关键词、身份标识、文本、时间以及地点分别进行匹配，若与其中一个维度的信息匹配成功，则将该对应关系中的通话语音确定为目标通话语音；并进行下一个对应关系的匹配。若与五个维度的信息匹配均失败，则与第二个对应关系中的通话情绪关键词、身份标识、文本、时间以及地点分别进行匹配，依次类推直至匹配出全部目标通话语音为止。需要说明的是，通过查找可以得到一条目标通话语音，也可以得到多条目标通话语音，移动终端在显示出各条目标通话语音供用户选择，用户从中选择出所需通话语音点击播放即可。

通过本发明实施例提供的通话语音处理方法，用户仅通过一个维度的关键词即可查找到所需要的通话语音。例如：用户预查找通过某社交应用程序通话时的通话语音，仅记得该条通话语音是关于转账的，但是用户无法记得通话对象、时间以及地点等信息，因此用户语音搜索框中输入“转账”这一个表征通话内容的关键词，即可触发移动终端从历史所存储各文本里面匹配包含“转账”二字文本，并确定匹配到的该文本对应的通话语音，然后把这些查找到的通话语音作为目标通话语音列出来，用户在所列出的目标通话语音中选择所需要的通话记录即可。

本发明实施例提供的通话语音处理方法，除具有实施例一中所示的通话语音处理方法所具有的有益效果外，还确定通话语音对应的时间以及地点，将时间、地点也作为关键词添加至与通话语音的对应关系中，通过增加时间、地点等关键词，能够增加用户查找通话语音关键词的广度，即便是用户仅记得通话时间或通话地点也可以查找到目标通话语音，能够进一步提升用户的使用体验。

实施例四

参照图4，示出了本发明实施例四的一种移动终端的结构框图。

本发明实施例的移动终端可以包括：转化模块401，用于将通话语音转化成文本；其中，所述通话语音为用户通过所述移动终端进行通信产生的语音；识别模块402，用于识别所述通话语音对应的通话语气；第一确定模块403，用于确定与所述通话语气对应的通话情绪关键词，以及与所述通话语音对应的通话对象的身份标识；存储模块404，用于将所述文本、所述通话情绪关键词、所述身份标识以及所述通话语音进行对应存储。

优选地，所述移动终端还包括：第二确定模块405，用于确定本次通话的时间以及地点；所述存储模块404具体用于：将所述文本、所述通话情绪关键词、所述时间、所述地点、所述身份标识以及所述通话语音进行对应存储。

优选地，所述通话情绪关键词包括：开心、生气、悲伤、惊讶、恐惧以及平和中的至少之一。

优选地，所述移动终端还包括：第一接收模块406，用于在所述存储模块对应存储所述文本、所述通话情绪关键词、所述身份标识以及所述通话语音之后，接收用户在通话语音搜索框中，输入的第一关键词；其中，所述第一关键词为文本关键词、通话情绪关键词以及身份标识中的至少之一；第一查找模块407，用于遍历已存储的各文本、通话情绪关键词、身份标识以及通话语音，查找与所述第一关键词匹配的目标通话语音并输出。

优选地，所述移动终端还包括：第二接收模块408，用于在所述存储模块将所述文本、所述通话情绪关键词、所述身份标识以及所述通话语音进行对应存储之后，接收用户在通话语音搜索框中，输入的第二关键词；其中，所述第二关键词为文本关键词、通话情绪关键词、身份标识、时间、地点中的至少之一；第二查找模块409，用于遍历已存储的各文本、通话情绪关键词、身份标识、时间、地点以及通话语音，查找与所述第二关键词匹配的目标通话语音并输出。

本发明实施例提供的移动终端能够实现图1至图3的方法实施例中移动终端实现的各个过程，为避免重复，这里不再赘述。

本发明实施例提供的移动终端，通过将通话语音转化成本文，确定通话语音对应的通话情绪关键词，确定通话对象的身份标识，在存储通话语音时将上述三个维度的信息与通话语音进行对应存储。该种存储通话语音的方案，当用户预查找某通话语音时，仅需输入关键词移动终端即可查找到与关键词匹配的通话语音，无需用户手动逐个进行通话语音查找，查找耗时短、效率高，能够提升用户的使用体验。

实施例五

参照图5，示出了本发明实施例五的一种移动终端的硬件结构框图。

图5为实现本发明各个实施例的一种移动终端的硬件结构示意图，该移动终端500包括但不限于：射频单元501、网络模块502、音频输出单元503、输入单元504、传感器505、显示单元506、用户输入单元507、接口单元508、存储器509、处理器510、以及电源511等部件。本领域技术人员可以理解，图5中示出的移动终端结构并不构成对移动终端的限定，移动终端可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。在本发明实施例中，移动终端包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。

其中，处理器510，用于将通话语音转化成文本；其中，所述通话语音为用户通过所述移动终端进行通信产生的语音；识别所述通话语音对应的通话语气；确定与所述通话语气对应的通话情绪关键词，以及与所述通话语音对应的通话对象的身份标识；将所述文本、所述通话情绪关键词、所述身份标识以及所述通话语音进行对应存储。

应理解的是，本发明实施例中，射频单元501可用于收发信息或通话过程中，信号的接收和发送，具体的，将来自基站的下行数据接收后，给处理器510处理；另外，将上行的数据发送给基站。通常，射频单元501包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外，射频单元501还可以通过无线通信***与网络和其他设备通信。

移动终端通过网络模块502为用户提供了无线的宽带互联网访问，如帮助用户收发电子邮件、浏览网页和访问流式媒体等。

音频输出单元503可以将射频单元501或网络模块502接收的或者在存储器509中存储的音频数据转换成音频信号并且输出为声音。而且，音频输出单元503还可以提供与移动终端500执行的特定功能相关的音频输出(例如，呼叫信号接收声音、消息接收声音等等)。音频输出单元503包括扬声器、蜂鸣器以及受话器等。

输入单元504用于接收音频或视频信号。输入单元504可以包括图形处理器(Graphics Processing Unit，GPU)5041和麦克风5042，图形处理器5041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元506上。经图形处理器5041处理后的图像帧可以存储在存储器509(或其它存储介质)中或者经由射频单元501或网络模块502进行发送。麦克风5042可以接收声音，并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元501发送到移动通信基站的格式输出。

移动终端500还包括至少一种传感器505，比如光传感器、运动传感器以及其他传感器。具体地，光传感器包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板5061的亮度，接近传感器可在移动终端500移动到耳边时，关闭显示面板5061和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别移动终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；传感器505还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等，在此不再赘述。

显示单元506用于显示由用户输入的信息或提供给用户的信息。显示单元506可包括显示面板5061，可以采用液晶显示器(Liquid Crystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板5061。

用户输入单元507可用于接收输入的数字或字符信息，以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地，用户输入单元507包括触控面板5071以及其他输入设备5072。触控面板5071，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板5071上或在触控面板5071附近的操作)。触控面板5071可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器510，接收处理器510发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板5071。除了触控面板5071，用户输入单元507还可以包括其他输入设备5072。具体地，其他输入设备5072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

进一步的，触控面板5071可覆盖在显示面板5061上，当触控面板5071检测到在其上或附近的触摸操作后，传送给处理器510以确定触摸事件的类型，随后处理器510根据触摸事件的类型在显示面板5061上提供相应的视觉输出。虽然在图5中，触控面板5071与显示面板5061是作为两个独立的部件来实现移动终端的输入和输出功能，但是在某些实施例中，可以将触控面板5071与显示面板5061集成而实现移动终端的输入和输出功能，具体此处不做限定。

接口单元508为外部装置与移动终端500连接的接口。例如，外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元508可以用于接收来自外部装置的输入(例如，数据信息、电力等等)并且将接收到的输入传输到移动终端500内的一个或多个元件或者可以用于在移动终端500和外部装置之间传输数据。

存储器509可用于存储软件程序以及各种数据。存储器509可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器509可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器510是移动终端的控制中心，利用各种接口和线路连接整个移动终端的各个部分，通过运行或执行存储在存储器509内的软件程序和/或模块，以及调用存储在存储器509内的数据，执行移动终端的各种功能和处理数据，从而对移动终端进行整体监控。处理器510可包括一个或多个处理单元；优选的，处理器510可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作***、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器510中。

移动终端500还可以包括给各个部件供电的电源511(比如电池)，优选的，电源511可以通过电源管理***与处理器510逻辑相连，从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。

另外，移动终端500包括一些未示出的功能模块，在此不再赘述。

优选的，本发明实施例还提供一种移动终端，包括处理器510，存储器509，存储在存储器509上并可在所述处理器510上运行的计算机程序，该计算机程序被处理器510执行时实现上述通话语音处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述通话语音处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(Read-OnlyMemory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本发明的保护之内。

Claims

1.一种通话语音处理方法，应用于移动终端，其特征在于，所述方法包括：

将通话语音转化成文本；其中，所述通话语音为用户通过所述移动终端进行通信产生的语音；

识别所述通话语音对应的通话语气；

确定与所述通话语气对应的通话情绪关键词，以及与所述通话语音对应的通话对象的身份标识；

将所述文本、所述通话情绪关键词、所述身份标识以及所述通话语音进行对应存储。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

确定本次通话的时间以及地点；

所述将所述文本、所述通话情绪关键词、所述身份标识以及所述通话语音进行对应存储的步骤，包括：

将所述文本、所述通话情绪关键词、所述时间、所述地点、所述身份标识以及所述通话语音进行对应存储。

3.根据权利要求1所述的方法，其特征在于，所述通话情绪关键词包括：开心、生气、悲伤、惊讶、恐惧以及平和中的至少之一。

4.根据权利要求1所述的方法，其特征在于，在所述对应存储所述文本、所述通话情绪关键词、所述身份标识以及所述通话语音的步骤之后，所述方法还包括：

接收用户在通话语音搜索框中，输入的第一关键词；其中，所述第一关键词为文本关键词、通话情绪关键词以及身份标识中的至少之一；

遍历已存储的各文本、通话情绪关键词、身份标识以及通话语音，查找与所述第一关键词匹配的目标通话语音并输出。

5.根据权利要求2所述的方法，其特征在于，在所述将所述文本、所述通话情绪关键词、所述身份标识以及所述通话语音进行对应存储的步骤之后，所述方法还包括：

接收用户在通话语音搜索框中，输入的第二关键词；其中，所述第二关键词为文本关键词、通话情绪关键词、身份标识、时间、地点中的至少之一；

遍历已存储的各文本、通话情绪关键词、身份标识、时间、地点以及通话语音，查找与所述第二关键词匹配的目标通话语音并输出。

6.一种移动终端，其特征在于，包括：

转化模块，用于将通话语音转化成文本；其中，所述通话语音为用户通过所述移动终端进行通信产生的语音；

识别模块，用于识别所述通话语音对应的通话语气；

第一确定模块，用于确定所述通话语气对应的通话情绪关键词，以及与所述通话语音对应的通话对象的身份标识；

存储模块，用于将所述文本、所述通话情绪关键词、所述身份标识以及所述通话语音进行对应存储。

7.根据权利要求6所述的移动终端，其特征在于，所述移动终端还包括：

第二确定模块，用于确定本次通话的时间以及地点；

所述存储模块具体用于：将所述文本、所述通话情绪关键词、所述时间、所述地点、所述身份标识以及所述通话语音进行对应存储。

8.根据权利要求6所述的移动终端，其特征在于，所述通话情绪关键词包括：开心、生气、悲伤、惊讶、恐惧以及平和中的至少之一。

9.根据权利要求6所述的移动终端，其特征在于，所述移动终端还包括：

第一接收模块，用于在所述存储模块对应存储所述文本、所述通话情绪关键词、所述身份标识以及所述通话语音之后，接收用户在通话语音搜索框中，输入的第一关键词；其中，所述第一关键词为文本关键词、通话情绪关键词以及身份标识中的至少之一；

第一查找模块，用于遍历已存储的各文本、通话情绪关键词、身份标识以及通话语音，查找与所述第一关键词匹配的目标通话语音并输出。

10.根据权利要求7所述的移动终端，其特征在于，所述移动终端还包括：

第二接收模块，用于在所述存储模块将所述文本、所述通话情绪关键词、所述身份标识以及所述通话语音进行对应存储之后，接收用户在通话语音搜索框中，输入的第二关键词；其中，所述第二关键词为文本关键词、通话情绪关键词、身份标识、时间、地点中的至少之一；

第二查找模块，用于遍历已存储的各文本、通话情绪关键词、身份标识、时间、地点以及通话语音，查找与所述第二关键词匹配的目标通话语音并输出。

11.一种移动终端，其特征在于，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的通话语音处理方法的步骤。

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的通话语音处理方法的步骤。