CN107040452B

CN107040452B - 一种信息处理方法、装置和计算机可读存储介质

Info

Publication number: CN107040452B
Application number: CN201710068757.8A
Authority: CN
Inventors: 俞悦; 帅颖斌; 张书超
Original assignee: Zhejiang Yixin Technology Co Ltd
Current assignee: Zhejiang Yixin Technology Co Ltd
Priority date: 2017-02-08
Filing date: 2017-02-08
Publication date: 2020-08-04
Anticipated expiration: 2037-02-08
Also published as: CN107040452A

Abstract

本发明的实施方式提供了一种信息处理方法。该方法包括：由第二即时通信客户端接收来自第一即时通信客户端发送的第一信息内容；根据所述第一信息内容，从预定的信息库中搜索出适于与发送该第一信息内容的用户互动的语音信息集，以供第二即时通信客户端的用户从中选择一个或多个语音选项与发送该第一信息内容的用户互动，其中每个语音选项包括至少一段语音内容。通过在即时通信领域为用户提供斗声音的方式与其他用户进行互动，本发明的方法使得用户与其他用户的信息交互方式更加丰富有趣，为用户带来了更好的体验。此外，本发明的实施方式提供了一种信息处理装置和计算机可读存储介质。

Description

一种信息处理方法、装置和计算机可读存储介质

技术领域

本发明的实施方式涉及信息处理领域，更具体地，本发明的实施方式涉及一种信息处理方法、装置和计算机可读存储介质。

背景技术

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

目前，用户基于即时通信交互界面与其他用户进行即时通信的过程中，为了进行更好地表达，通常会采用斗图的方式与其他用户互动。所谓采用斗图的方式互动，即，使用一些非常符合交互情境的图片、表情包与其他用户交流。虽然现有技术存在采用斗图的方式与其他用户互动，但是图片能表达的内容还是较为受限，有时候仍不能对人的丰富情感进行较好地表达。而语音作为人经常在现实环境下交流的工具，有时候相对于图片能够更贴切地表达人的情感，但是现有的即时通信技术只实现了将用户自身的语音或歌曲类音频文件发送至其他用户、或者为两个用户提供语音通话的功能，这仍然不能较好地满足用户多样化的表达需求以及用户与其他用户的互动需求，也缺乏趣味性。

发明内容

从上述可以看出，现有技术在即时通信领域只提供了斗图的方式供用户与其他用户互动，斗图的方式有时候仍不能较好地表达用户的情感，这是非常令人烦恼的过程。

为此，非常需要一种改进的信息处理方法和装置，以解决现有技术中存在的缺陷，为用户与其他用户的交互带来更好地互动体验。

在本上下文中，本发明的实施方式期望提供一种信息处理方法、装置和计算机可读存储介质。

在本发明实施方式的第一方面中，提供了一种信息处理方法，包括：由第二即时通信客户端接收来自第一即时通信客户端发送的第一信息内容；根据所述第一信息内容，从预定的信息库中搜索出适于与发送该第一信息内容的用户互动的语音信息集，以供第二即时通信客户端的用户从中选择一个或多个语音选项与发送该第一信息内容的用户互动，其中每个语音选项包括至少一段语音内容。

在本发明的一个实施例中，所述信息处理方法还包括：响应于接收到第二即时通信客户端的用户对选择的语音选项的预览操作，在第二即时通信客户端上执行对该选择的语音选项的预览事件，该预览事件包括播放所选择的语音选项对应的语音内容或/和呈现该语音选项对应的文本内容。

在本发明的另一实施例中，所述信息处理方法还包括：响应于接收到第二即时通信客户端的用户对选择的语音选项的发送操作，将所选择的语音选项发送至第一即时通信客户端。

在本发明的又一实施例中，所述语音信息集包括一个或多个不同类型的声音包，每个类型的声音包中包括一个或多个语音选项。

在本发明的再一实施例中，根据本发明的上述又一实施例，所述第一信息内容包括语音信息，所述根据所述第一信息内容，从预定的信息库中搜索出适于与第一信息内容进行互动的语音信息集包括：响应于接收到对第一信息内容的特定操作，根据预设的信息匹配规则，从预定的信息库中搜索出与第一信息内容匹配的语音信息集，作为适于与发送该第一信息内容的用户互动的语音信息集。

在本发明的再一实施例中，根据本发明的上述再一实施例，所述根据预设的信息匹配规则从预定的信息库中搜索出与第一信息内容匹配的语音信息集包括：根据预设的计算规则，并根据第一信息内容和预定的信息库中多条语音信息基于语音特征而确定的情绪或/和所属的声音包的类型，计算第一信息内容与预定的信息库中多条语音信息的匹配度；将预定的信息库中匹配度大于预定阈值的语音信息或者匹配度排序靠前的特定数量的语音信息，作为与第一信息内容匹配的语音信息集。

在本发明的一些实施例中，根据本发明的上述再一实施例，所述信息处理方法还包括：以特定的形式向第二即时通信客户端的用户呈现所述语音信息集中的多个语音选项；响应于接收到对所述多个语音选项中的至少一个语音选项的选择，使该选择的至少一个语音选项成为待发送至第一即时通信客户端的语音选项。

在本发明的一些实施例中，根据本发明的上述再一实施例，所述对第一信息内容的特定操作包括：对第一信息内容的重按操作；所述以特定的形式呈现多个语音选项包括：以多个卡片层叠的形式呈现多个语音选项；所述接收到对所述多个语音选项中的至少一个语音选项的选择之前，还包括：接收到对所述多个语音选项中至少一部分语音选项的滑动操作，以呈现待被选择的语音选项。

在本发明的一些实施例中，所述信息处理方法还包括：响应于接收到第二即时通信客户端的用户制作语音信息的操作，呈现语音信息集中的多个待模仿的语音选项供用户选择；响应于接收到第二即时通信客户端的用户对至少一个待模仿的语音选项的选择以及针对该选择的语音选项的语音内容进行模仿的语音录制操作，得到与该选择的语音选项对应的语音文件。

在本发明的一些实施例中，所述信息处理方法还包括：获取待处理的图片；获取第二即时通信客户端的用户录制的针对该目标图片的语音信息；根据所录制的语音信息对所述待处理的图片进行处理，得到目标图片；根据预定的针对目标图片和语音信息进行结合的规则，得到结合后的语音图片文件；将所述语音图片文件发送至第一即时通信客户端。

在本发明的一些实施例中，根据本发明的上述实施例，根据所录制的语音信息的语音特征对所述待处理的图片进行处理，得到目标图片包括：根据语音信息的音高、音色、音量、音长和节奏中的至少一项特征，对待处理的图片进行翻转、扭转、拉伸中的一项或多项处理，得到目标图片；或/和，为该待处理的图片配置与该语音信息对应的文本信息，得到包括该配置的文本信息的目标图片。

在本发明的一些实施例中，根据本发明的上述实施例，在所述获取录制的针对该目标图片的语音信息的步骤之后还包括：根据语音信息的音高、音色、音量、音长和节奏中的至少一项特征，确定第一即时通信客户端在接收到该条语音信息时发生震动的震动强度或/和震动时间；所述将所述语音图片文件发送至第一即时通信客户端的步骤包括：-将所述语音图片文件发送至第一即时通信客户端，以使第一即时通信客户端接收到该语音图片文件时发生所述确定的震动强度或/和震动时间的震动。

在本发明的一些实施例中，根据本发明的上述实施例，所述目标图片包括动图。

在本发明实施方式的第二方面中，提供了一种信息处理装置，包括：接收单元，用于接收来自第一即时通信客户端发送的第一信息内容；

搜索单元，用于根据所述第一信息内容，从预定的信息库中搜索出适于与发送该第一信息内容的用户互动的语音信息集，以供所述信息处理装置的用户从中选择一个或多个语音选项与发送该第一信息内容的用户互动，其中每个语音选项包括至少一段语音内容。

在本发明实施方式的第三方面中，提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现步骤：由第二即时通信客户端接收来自第一即时通信客户端发送的第一信息内容；根据所述第一信息内容，从预定的信息库中搜索出适于与发送该第一信息内容的用户互动的语音信息集，以供第二即时通信客户端的用户从中选择一个或多个语音选项与发送该第一信息内容的用户互动，其中每个语音选项包括至少一段语音内容。

根据本发明实施方式的信息处理方法和装置，使得用户能够基于即时通信客户端采用斗声音的方式与其他用户互动，即采用一些非常符合聊天情境的语音与其他用户互动，给用户提供了崭新的互动方式。由于语音作为表达方式能够很好地体现出人的夸张、有感染力的情感等，因而能够较好地满足用户情感表达需求以及用户与其他用户的互动需求，而且显著提升了互动的趣味性，为用户带来了全新的、更好的体验。

附图说明

通过参考附图阅读下文的详细描述，本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本发明的若干实施方式，其中：

图1示意性地示出了根据本发明一个实施例的信息处理方法的应用场景示意图；

图2为本发明另一个实施例的信息处理方法的应用场景示意图；

图3示意性地示出了根据本发明一个实施例的信息处理方法的流程示意图；

图4示意性地示出了根据本发明一个实施例的针对图3中的步骤S102进行具体描述的流程图；

图5示意性地示出了根据本发明另一个实施例的信息处理方法的应用场景示意图；

图6示意性地示出了根据本发明另一个实施例的信息处理方法的流程示意图；

图7示意性地示出了根据本发明一个实施例的针对图6进行描述的应用场景的第一示意图；

图8示意性地示出了根据本发明一种实施例的针对图6进行描述的应用场景的第二示意图；

图9示意性地示出了根据本发明又一实施例的信息处理方法的流程示意图；

图10示意性地示出了根据本发明一个实施例的针对图9进行描述的应用场景的示意图；

图11示意性地示出了根据本发明一个实施例的信息处理装置的示意性框图；

图12示意性地示出了根据本发明另一个实施例的信息处理装置的示意性框图；

图13示意性地示出了根据本发明又一个实施例的信息处理装置的示意性框图；

图14示意性地示出了根据本发明再一实施例的信息处理装置的结构示意图；

图15示意性地示出了根据本发明一个实施例的信息处理的程序产品示意图；

在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解，给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明，而并非以任何方式限制本发明的范围。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域技术技术人员知道，本发明的实施方式可以实现为一种***、装置、设备、方法或计算机程序产品。因此，本公开可以具体实现为以下形式，即：完全的硬件、完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。

根据本发明的实施方式，提出了一种信息处理方法、装置以及计算机可读存储介质。

在本文中，需要理解的是，附图中的任何元素数量均用于示例而非限制，以及任何命名都仅用于区分，而不具有任何限制含义。

下面参考本发明的若干代表性实施方式，详细阐释本发明的原理和精神。

发明概述

本发明人发现，现有技术中，出于用户只能采用斗图的方式与其他用户进行良好地互动，但是有时候在采用图片不能贴切地表达人的情感的情况下，无法采用其他更合适地表达方式与其他用户互动的原因，导致用户只能通过文字表达等其他方式配合图片来弥补这种表达上的缺陷，但是即便如此，有时候仍不能贴切地表达情感，互动体验差；或者仍让用户觉得，相对于一次表达到位，通过文字等其他方式的补充表达，终究有所欠缺。

本发明实施方式中，可以使第二即时通信客户端的用户在接收到第一即时通信客户端发送的第一信息内容后，为其提供针对于发送该第一信息内容的用户互动的语音选项，从而第二即时通信客户端的用户可以选择合适地语音选项与发送该第一信息内容的用户互动，相比较于现有技术中采用斗图的方式进行互动，本申请采用针对性较强的语音进行互动，互动体验新颖有趣，也有效地弥补了图片有的时候无法表达或无法贴切地表达人的部分情感的缺陷。

在介绍了本发明的基本原理之后，下面具体介绍本发明的各种非限制性实施方式。

应用场景总览

首先参考图1，图1为本发明一个实施例的信息处理方法的应用场景示意图，该应用场景示例性呈现了为用户提供多个语音选项供用户选择和交互的即时通信交互界面，以满足用户采用斗声音的方式与其他用户进行互动的需求。如图1所示，示出了昵称为“大破碗”的用户基于即时通信交互界面与另一用户进行的信息互动的场景。当“大破碗”的用户想采用斗声音的方式与另一用户进行互动时，其可以点击交互界面上的“声音”按钮(如图1中位于输入框右侧的“声音”按钮)，从而其可以看到多个语音选项，如图1中示例的“哈哈哈”、“啊啊啊啊…”、“你无理取闹…”、“对,你无情…”、“西湖水啊…”。当用户例如通过长按的方式操作其中一个语音选项“对,你无情…”，则其可以对该语音选项中的声音进行预览或者在预览的同时还能看到该语音选项对应的文本全文“对，你无情，你残酷，你无理取闹”。

需要说明的是，图1以一个声音包仅包含一个语音选项为例来示例，在实际应用中，一个声音包可以包括一个或多个语音选项。

可选地，请参考图2，图2为本发明另一个实施例的信息处理方法的应用场景示意图，该应用场景示例性呈现了为用户提供多个语音预览页面。

在图2中，一个声音包可以包括多个语音选项，当用户通过长按输入区下方的选项框中的一个声音包，在该信息处理的界面上以逐渐放大的气泡的样式呈现该声音包包含的多个语音选项分别对应的语音预览页面。可选地，当气泡放大的动作结束后，直接默认播放其中某一个语音预览页面中的语音内容。优选地，在播放的过程中，还会呈现语音播放的倒计时或/和随声音频率的变化而变化的动画(如代表声音频率变化的波形图)。优选地，用户每长按一次输入区下方的选项框中的一个声音包，该声音包中的多个语音选项对应的语音预览页面以层叠的卡片样式依次呈现。优选地，声音包中的多个语音选项对应的语音预览页面按照默认的编号来确定层叠的层级，例如，1号语音选项对应的语音预览页面默认位于顶层，2号语音选项对应的语音预览页面默认位于次顶层,,,n号语音选项对应的语音预览页面默认位于底层。优选地，用户可以通过滑动该多个卡片，来实现不同语音预览页面的切换效果，且根据卡片的切换来播放不同的语音信息。优选地，当用户想预览其他声音包对应的语音预览页面时，可以选择选项框中的其他声音包，从而原声音包对应的多个语音预览页面消失，当前被选择的声音包对应的多个语音预览页面呈现。进一步地，继续参考图2，用户也可以通过短按的方式操作其中一个语音预览页面中的声音发送按钮，从而触发该语音预览页面对应的语音选项直接发送至另一用户，从而实现用户之间以富有感情张力的经典语音作为互动方式来更好地表达和互动。进一步优选地，继续参考图2，当用户通过短按的方式触发语音预览页面对应的语音选项发送给对方时，在当前交互页面以缩小的气泡的方式来呈现该发送给对方的语音选项。

优选地，对于对于同一文本的发音，其可以包括多个系列或多个类型的声音。所谓多个系列或多个类型，可以指用于表达同一文本的不同人(尤其是不同名人)的声音。例如，对于同一文本的发音，可以采用“华妃(电视剧中某一人物)”的发音、“马景涛(某一明星)”的发音、“林志玲(某一明星)”的发音等等。

需要说明的是，图1所示的语音选项的呈现方式仅是示例，也可以采用其他方式来呈现，例如根据语音类型的不同而不是语音对应的文本内容的不同来呈现，例如，在即时通信交互界面的第一位置呈现包括多个语音选项的“华妃”声音包，在第二位置呈现包括多个语音选项的“马景涛”声音包，在第三位置呈现包括多个语音选项的“林志玲”声音包……则当用户通过点击等操作其中某一个声音包(例如“马景涛”声音包)时，呈现该声音包所包括的多种不同文本内容对应的声音选项。

示例性方法

下面结合图1和图2的应用场景，参考图3来描述根据本发明示例性实施方式的信息处理方法。需要注意的是，上述应用场景仅是为了便于理解本发明的精神和原理而示出，本发明的实施方式在此方面不受任何限制。相反，本发明的实施方式可以应用于适用的任何场景。

图3示意性地示出了根据本发明一个实施例的信息处理方法的流程示意图。该实施例中，信息处理方法的执行主体可以为用户终端或/和安装在用户终端上的即时通信客户端或/和与用户终端通信连接的服务器。其中，用户终端可以包括但不限于手机、平板电脑、笔记本电脑、个人计算机等，即时通信终端可以包括但不限于微信客户端、qq客户端、易信客户端等，服务器可以包括任何能够接收用户终端或/和即时通信终端发送的信息并进行相应处理的服务器设备。

如图3所示，该信息处理方法可以包括步骤：

步骤S101，由第二即时通信客户端接收来自第一即时通信客户端发送的第一信息内容。

其中，第一即时通信客户端和第二即时通信客户端例如指同一类型的客户端(如微信客户端、qq客户端、易信客户端等)。另外，第一即时通信客户端和第二即时通信客户端可以位于不同的用户终端上，也可以位于同一用户终端上且与不同的客户端账号相关联。

其中，第一信息内容包括但不限于文字、图片、语音、视频、动画等。第一信息内容的接收包括但不限于通过互联网、广域网、城域网、局域网等来实现。

步骤S102，根据所述第一信息内容，从预定的信息库中搜索出适于与发送该第一信息内容的用户互动的语音信息集，以供第二即时通信客户端的用户从中选择一个或多个语音选项与发送该第一信息内容的用户互动，其中每个语音选项可以包括至少一段语音内容。

其中，所述预定的信息库包括但不限于即时通信客户端所在的用户终端的本地语音库、即时通信客户端联网时与其通信的即时通信服务器中的语音库或两者结合。

所述从预定的信息库中搜索出适于与发送该第一信息内容的用户互动的语音信息集可以根据预设的搜索规则来实现。例如根据大量的人在特定环境(如平时对话环境)下交流的信息或者根据大量的电视剧中经典人物之间的对话等，得到语音训练样本，从而根据语音训练样本建立语音库(该语音库可以存储在即时通信服务器)，其中每一段语音内容都存在与之相对应的关键字/词/句，例如对于某段语音内容“你无情，你残酷，你无理取闹”，其对应的关键字/词/句包括：关键词——无情、残酷和无理取闹，关键句——你无情、你残酷和你无理取闹等等。当已知第一信息内容中包括关键词“无情”时，则根据该关键词“无情”，从语音库中搜索与该关键字/词/句对应的多条语音内容(包括你无情，你残酷，你无理取闹”)，作为适于与发送该第一信息内容的用户互动的语音信息集。

需要注意的是，由于第一信息内容包括但不限于文字、图片、语音、视频、动画等形式，则为了更好地实现从语音库中搜索相对应的语音内容，可以先将非文本形式的信息内容转换为文本形式的信息内容，从而根据该文本形式的信息内容，从语音库中搜索与该关键字/词/句对应的多条语音内容，作为适于与发送该第一信息内容的用户互动的语音信息集。

当然，上文所述的从预定的信息库中搜索出适于与发送该第一信息内容的用户互动的语音信息集的搜索规则仅是示例，并不意味着对搜索方式的限定，本申请可以采用其他适合的搜索规则来从预定的信息库中搜索出适于与发送该第一信息内容的用户互动的语音信息集。

其中，所述语音信息集包括一个或多个不同类型的声音包，每个类型的声音包中包括一个或多个语音选项。如上文所述，声音包的类型可以指语音的类型，例如“华妃”语音类型、“马景涛”语音类型、“林志玲”语音类型等。一个或多个语音选项可以指，同一语音类型下的一个或多个文本内容对应的语音内容。可选地，每个语音选项包括至少一段语音内容，例如某个语音选项包括三段间隔时间相等的语音内容。

可选地，请继续参考图3，所述信息处理方法还包括：

步骤S103，响应于接收到第二即时通信客户端的用户对选择的语音选项的预览操作，在第二即时通信客户端上执行对该选择的语音选项的预览事件，该预览事件包括播放所选择的语音选项对应的语音内容或/和呈现该语音选项对应的文本内容。

其中所述预览操作，可以指用户对语音选项进行的长按操作。例如，用户长按图1中的语音选项“对，你无情……”,则可以实现对该语音选项的预览。其中，预览的方式包括但不限于播放该语音选项对应的部分或全部语音内容或/和呈现该语音选项对应的文本内容“对，你无情，你残酷，你无理取闹”

可选地，请继续参考图3，所述信息处理方法还包括：

步骤S104，响应于接收到第二即时通信客户端的用户对选择的语音选项的发送操作，将所选择的语音选项发送至第一即时通信客户端。

其中，所述发送操作，可以指用户对语音选项的短按操作。例如，用户短按图1中的语音选项“对，你无情……”,则触发该语音选项发送至第一即时通信客户端，从而实现用户之间以富有感情张力的经典语音选项作为互动方式来更好地表达和互动。

可选地，请参考图4和图5，图4提供了本发明一种实施例的针对图3中的步骤S102进行具体描述的流程图，图5提供了与图4的流程图相对应的、本发明另一实施例的信息处理方法的应用场景示意图。根据图4，如果第一信息内容包括语音信息，所述步骤S102中的根据所述第一信息内容，从预定的信息库中搜索出适于与第一信息内容进行互动的语音信息集包括：

步骤S1021，响应于接收到对第一信息内容的特定操作，根据预设的信息匹配规则，从预定的信息库中搜索出与第一信息内容匹配的语音信息集，作为适于与发送该第一信息内容的用户互动的语音信息集。

其中，所述对第一信息内容的特定操作可以指，对第一信息内容的重按操作。

其中，所述预设的信息匹配规则可以包括：根据预设的计算规则，并根据第一信息内容和预定的信息库中多条语音信息基于语音特征而确定的情绪或/和所属的声音包的类型，计算第一信息内容与预定的信息库中多条语音信息的匹配度；将预定的信息库中匹配度大于预定阈值的语音信息或者匹配度排序靠前的特定数量的语音信息，作为与第一信息内容匹配的语音信息集。

其中，所述第一信息内容中基于语音特征而确定的情绪，例如指根据语音的语调、以及音高与给定的基准值的比较，确定第一信息内容中所包含的情绪。例如，当语调为上扬、且声音的分贝值超过基准值M，则确定该第一信息内容包含愤怒情绪。进一步地，例如还可以在此基础上，根据声音的分贝值与基准值的差值的大小，进一步确定该第一信息内容包含愤怒情绪的幅度值(或可能性值或权重分值)，例如当差值小于给定的值C1，则该幅度值(或可能性值或权重分值)为20％；当差值大于C1小于C2，则该幅度值为60％。当然，上述基于语音特征而确定的情绪幅度值或称情绪权重分值的方法仅是示例，可以采用其他适用于本发明的方法来确定语音信息所包括的某种情绪或某几种情绪的权重分值。此外，还可以直接由用户或者***管理员为语音信息人工设置情绪相关数值。

其中，所述第一信息内容所属的声音包的类型，如上文所述，例如属于“华妃”语音类型的声音包。

其中，所述第一信息内容对应文本内容，即基于语音识别，将语音信息转化为对应的语言文本。

其中，根据预设的计算规则，计算第一信息内容与预定的信息库中多条语音信息的匹配度的一个示例如下：

定义匹配度Suitability计算过程的一个例子为：

Suitability＝总情绪匹配度X*声音包的类型的匹配度Y；

需要注意的是，如果上述计算过程中的一项数值为0，则则以另一项不为0的数值确定匹配度。例如，假定如果第一信息内容属于用户录制的声音，则Y取值为0，Suitability＝X。如果两项都为0，则结果为0或者根据其他预定的规则来确定结果。

接下来对上述计算过程中的每项进行详述：

首先，计算第一信息内容n1与预定的信息库中某条语音信息n2的总情绪匹配度。

假定第一信息内容n1为“对，你无情，你残酷，你无理取闹！”，根据已知的确定语音信息所包含的多种情绪的权重分值的方法(例如根据上文所述的确定愤怒情绪的幅度值得方法，或者根据用户或者***管理员为语音信息人工设置的情绪相关数值)，得到该第一信息内容n1包含的多种情绪的权重分值为：喜悦a1＝50％，愤怒b1＝5％，悲伤c1＝5％，欢乐d1＝20％，惊讶e1＝10％，恐慌f1＝5％，思念g1＝5％，其中a+b+c+d+e+f+g＝100％。

假定通过计算，得到预定的信息库中某条语音信息n2包含的多种同类情绪的权重分值，分别用a2、b2、c2、d2、e2、f2、g2表示。

则如果a2>＝a1，则得到n1和n2在喜悦情绪上的匹配度为a＝a1/a2，否则，a＝a2/a1；优选地，如果a1、a2中至少一个的值为0，则a取0值。

同理，计算n1和n2在其他情绪上的匹配度值，分别用b、c、d、e、f和g表示。

进一步地，如果a、b、c、d、e、f和g都不为0，则第一信息内容n1与n2的总情绪匹配度X＝a*b*c*d*e*f*g；否则，若a、b、c、d、e、f和g中有一个为0，则总情绪匹配度X等于数值不为0的情绪的匹配度相乘的乘积。

其次，计算第一信息内容n1与预定的信息库中某条语音信息n2所属的声音包的类型的匹配度。

在一个例子中，如果两条语音信息属于同一声音包且各自对应的语言文本在语言结构上相似或相同，则定义这两条语音信息的匹配度为P1，例如是100％；如果两条语音信息不属于同一声音包，但且各自对应的语言文本在语言结构上相似或相同，则定义这两条语音信息的匹配度为P2，例如是80％；否则，定义这两条语音信息的匹配度为P3，例如是0。

可选地，为了在用户接收到包括语音信息的第一信息内容后，给该用户提供更适合其与对方互动的语音选项，根据该用户经常使用的一些语音选项，并结合上文得到的匹配度，来从匹配度较高的多条语音信息中进一步筛选出该用户使用频率相对较高的一些语音信息，供该用户更具个人特色地与对方互动。

基于重按操作，可以触发第二即时通信客户端根据第一信息内容所属的声音包的类型或/和该语音信息对应的文本内容，从预定的信息库中搜索出与发送该第一信息内容的用户互动的语音信息集。所述搜索可以是根据***作的第一信息内容所归属的语音类型(或语音系列)、语音内容对应的文本含义、语音内容对应的情绪(例如通过语调、分贝值、语速等来判断情绪)等维度并基于针对这些维度的搜索规则来进行。

可选地，本申请的信息处理方法还包括：

步骤S1022，以特定的形式向第二即时通信客户端的用户呈现所述语音信息集中的多个语音选项。

其中，以特定的形式呈现多个语音选项可以指，以多个卡片层叠的形式呈现多个语音选项。如图5所示，在每个卡片上可以呈现一个语音选项的带播放时长提示(例如12秒)的语音播放图标、语音内容对应的文本(例如“那你就不无情，不残酷，不无理取闹！？”)以及可以触发该语音选项发送至对方用户的发送图标等。

步骤S1024，响应于接收到对所述多个语音选项中的至少一个语音选项的选择，使该选择的至少一个语音选项成为待发送至第一即时通信客户端的语音选项。

例如，选择图5所示的语音选项“那你就不无情，不残酷，不无理取闹！？”对应的卡片，通过点击该卡片上的“发送声音”的图标，将该语音选项发送至对方用户。

可选地，请继续参考图4，所述在对所述多个语音选项中的至少一个语音选项的选择之前，还包括：

步骤S1023，接收到对所述多个语音选项中至少一部分语音选项的滑动操作，以呈现待被选择的语音选项。

例如，以图5所示的多个卡片层叠的方式呈现多个语音选项，则用户可以通过上、下滑动所述多个卡片，使上层或下层的卡片的显示上移一层或下移一层，从而便于用户从中筛选出满意的语音选项，将其发送至对方用户。

可选地，请参考图6和图7、图8，图6提供了本发明另一实施例的信息处理方法的流程示意图，图7和图8分别提供了本发明一种实施例的针对图6进行描述的应用场景的第一示意图和第二示意图。根据图6，所述信息处理方法还包括：

步骤S105，响应于接收到第二即时通信客户端的用户制作语音信息的操作，呈现语音信息集中的多个待模仿的语音选项供用户选择。

如图7所示，用户通过点击、双击等对待制作语音信息的图标“添加声音”进行操作，从而触发即时通信应用界面呈现语音信息集中的多个待模仿的语音选项供用户选择，如图7中呈现出的位于第一位置的语音选项“华妃的故事”、位于第二位置的语音选项“还珠格格的你不无理取闹”……用户可以选择图7中的任意一语音选项，并展开得到图7右侧所示的声音卡片；进一步地，当客户端呈现图7右侧所示的声音卡片时，用户可以点击其他的语音选项，从而将原呈现的声音卡片收起或隐藏，并呈现所点击的新的语音选项对应的声音卡片。用户可以通过左滑动或右滑动的方式滑动声音包中包含的多个语音选项对应的卡片来播放对应卡片中的声音、文本等内容，用户也可以点击卡片中的录音按钮，然后对该卡片对应的语音内容进行模仿并录制保存。

需要说明的是，此处的语音信息集与上文所描述的图3中的“适于与发送第一信息内容的用户互动的语音信息集”可以是不同的逻辑概念。此处的语音信息集中包括多个待模仿的语音选项，每一个待模仿的语音选项中可以包括同一种类型的发音下的一种或多种文本对应的语音内容，如包括某一类型的发音“华妃的故事”下的文本“就是矫情”对应的语音内容；上文所描述的图3中的与发送第一信息的用户互动的语音信息集是指，根据第一信息的内容以及特定的信息匹配规则而得到的与该第一信息的内容相匹配的语音信息集，该语音信息集中的语音选项供用户选择以与对方用户进行交互。

步骤S106，响应于接收到第二即时通信客户端的用户对至少一个待模仿的语音选项的选择以及针对该选择的语音选项的语音内容进行模仿的语音录制操作，得到与该选择的语音选项对应的语音文件。

例如，当用户点击录音按钮后，客户端上呈现图8左侧所示的进入录音状态的页面，此时语音选项中的原语音内容暂时不播放，该页面上还可以呈现倒计时进度或/和实时录制的声音的频率变化或音量变化的动画(例如呈现代表声音频率变化的波形图)。当倒计时结束时，表明录制完成，此时页面上的播放按钮激活，可以通过点击该播放按钮来播放录制的声音。进一步地，如果用户不满意当前录制的声音，还可以重新录制声音。进一步地，页面上还可以呈现“保存并发送”的按钮，将该录制的声音保存并发送至对应的用户。

需要说明的是，本实施例所录制的声音可以基于已有技术将用户录制的声音和语音选项中的背景音自动合并，从而得到既具有语音选项中的声音特征又具有个人独特声音特征的声音，互动体验进一步提升。具体地，本申请的语音选项在格式上已将原语音内容和背景音进行了区分，当用户选取任何一个语音选项进行模仿录制时，本申请的实施例能够基于现有技术自动提取该语音选项中的背景音，并将该背景音和模仿录制的语音内容合并，以新生成一个语音选项。

由此，基于上述实施例，用户可以结合自己声音的特点以及声音包中的语音选项本身的原始发音的特点，获得独特的语音文件，从而更好地与对方用户进行互动。

可选地，为了结合图片和语音各自的特点来综合表达用户在交互过程中的情感，本申请实施例可为用户提供包括图片和语音的综合文件，请参考图9和图10，图9提供了本发明又一实施例的信息处理方法的流程示意图，图10提供了本发明一种实施例的针对图9进行描述的应用场景的示意图。根据图9，所述信息处理方法还包括：

步骤S107，获取待处理的图片。

所述获取图片的方式，包括但不限于从用户终端本地、联网状态下从其他服务器所存储的大量图片或照片中选取一张或多张图片、实时进行照片的拍摄等。

步骤S108，获取第二即时通信客户端的用户录制的针对该目标图片的语音信息。

例如，用户基于本实施例的即时通信客户端从终端本地选择某一张照片后，即为其呈现如图10左边所示的界面，在该界面中用户可以录制声音。可选地，当用户针对该照片进行声音的录制的过程中，在该图片的下方显示“正在录音”的状态信息。可选地，用户在录制完声音后可以试听，如果不满意，可以重新录制。可选地，用户针对同一张照片可以录制多种不同类型的声音，例如，以正常的声音、咆哮的声音、温婉的声音、模仿某个电视剧的角色的声音等各种类型的声音来对同一文本进行声音文件的录制，从而在后续形成多个语音图片文件。

步骤S110，根据所录制的语音信息对所述待处理的图片进行处理，得到目标图片。

具体地，可以通过现有的算法对所述待处理的图片进行处理。

更具体地，可以根据语音信息的音高、音色、音量、音长、节奏等中的至少一项特征以及现有的算法，将原来是静态的待处理的图片进行翻转、扭转、拉伸中的一项或多项处理，得到是动图的目标图片，或/和，为该待处理的图片配置与该语音信息对应的文本信息，得到包括该配置的文本信息的目标图片。

具体地，此处现有的算法的处理规则包括但不限于以下方式中的至少一项：

-根据语音信息的音高或/和节奏，对待处理的图片进行相应程度的翻转；

-根据语音信息的音色或/和音量，对待处理的图片进行相应程度的扭转；

-为该待处理的图片配上相应的文本；例如，根据现有的语音识别技术，识别出该语音信息对应的文本，将该文本以特定的形式与所述图片一同呈现。

-根据语音信息的音色或/和音色，对待处理的图片进行相应程度的拉伸。

步骤S111，根据预定的针对目标图片和语音信息进行结合的规则，得到结合后的语音图片文件。

其中，所述图片和语音信息结合的规则可以通过现有技术来实现。所述结合后的语音图片文件可以为：可以播放语音的动图。

步骤S112，将所述语音图片文件发送至第一即时通信客户端。

例如，将包含咆哮体发音的图片文件发送至第一即时通信客户端，当第一即时通信客户端的用户下载并打开该语音图片文件时，用户可以看到该图片的同时听到咆哮体发音的语音内容。

可选地，请继续参考图9，获取第二即时通信客户端的用户录制的针对该目标图片的语音信息的步骤S108之后，还包括：

步骤S109，根据语音信息的音高、音色、音量、音长和节奏中的至少一项特征，确定第一即时通信客户端在接收到该条语音信息时发生震动的震动强度或/和震动时间。

例如，按照语音信息的音高，设定不同震动强度的震动，当音高在预定的第一区间内时，震动强度为弱；当音高在预定的第二区间内时，震动强度为中；当音高在预定的第三区间内时，震动强度为强。也即，如果第一即时通信客户端接收到的该条语音信息的音高位于第三区间内时，该第一即时通信客户端发生强烈震动。同理，可以根据音高、音色、音量、音长和节奏中的至少一项特征，确定第一即时通信客户端在接收到该条语音信息时发生震动的时间。

由此，相应地，根据上文，在图9中将所述语音图片文件发送至第一即时通信客户端所述步骤S112可以包括：

-将所述语音图片文件发送至第一即时通信客户端，以使第一即时通信客户端接收到该语音图片文件时发生所述确定的震动强度或/和震动时间的震动。

从而基于上述实施例，不仅可以基于斗图的方式实现用户间的互动，而且还可以根据语音信息的不同特点，使该语音信息发送至对方用户的客户端时，可以发生不同强度或不同时间的震动，从而进一步增强了双方或多方的信息交互。

示例性设备

在介绍了本发明示例性实施方式的方法之后，接下来，参考图11对本发明示例性实施方式的信息处理装置进行说明。

图11示意性地示出了根据本发明实施例提供的信息处理装置的结构示意图。如图11所示，所述信息处理装置可以包括：

接收单元11，用于接收来自第一即时通信客户端发送的第一信息内容。

搜索单元12，用于根据所述第一信息内容，从预定的信息库中搜索出适于与发送该第一信息内容的用户互动的语音信息集，以供所述信息处理装置的用户从中选择一个或多个语音选项与发送该第一信息内容的用户互动，其中每个语音选项包括至少一段语音内容。

其中，所述语音信息集可以包括一个或多个不同类型的声音包，每个类型的声音包中可以包括一个或多个语音选项。

可选地，所述信息处理装置还包括：

预览单元13，用于响应于接收到第二即时通信客户端的用户对选择的语音选项的预览操作，在第二即时通信客户端上执行对该选择的语音选项的预览事件，该预览事件包括播放所选择的语音选项对应的语音内容或/和呈现该语音选项对应的文本内容。

可选地，所述信息处理装置还包括：

发送单元14，用于响应于接收到第二即时通信客户端的用户对选择的语音选项的发送操作，将所选择的语音选项发送至第一即时通信客户端。

可选地，当第一信息内容包括语音信息，所述搜索单元12根据所述第一信息内容，从预定的信息库中搜索出适于与第一信息内容进行互动的语音信息集包括：

-响应于接收到对第一信息内容的特定操作，根据预设的信息匹配规则，从预定的信息库中搜索出与第一信息内容匹配的语音信息集，作为适于与发送该第一信息内容的用户互动的语音信息集。其中，所述搜索单元12对第一信息内容的特定操作包括：对第一信息内容的重按操作。

其中，所述根据预设的信息匹配规则从预定的信息库中搜索出与第一信息内容匹配的语音信息集包括：根据预设的计算规则，并根据第一信息内容和预定的信息库中多条语音信息基于语音特征而确定的情绪或/和所属的声音包的类型，计算第一信息内容与预定的信息库中多条语音信息的匹配度；将预定的信息库中匹配度大于预定阈值的语音信息或者匹配度排序靠前的特定数量的语音信息，作为与第一信息内容匹配的语音信息集。

可选地，所述搜索单元12还包括呈现模块，用于以特定的形式向第二即时通信客户端的用户呈现所述语音信息集中的多个语音选项。例如，以多个卡片层叠的形式呈现多个语音选项。

可选地，所述搜索单元12还包括选择响应模块，用于响应于接收到对所述多个语音选项中的至少一个语音选项的选择，使该选择的至少一个语音选项成为待发送至第一即时通信客户端的语音选项。

可选地，在所述搜索单元12接收到对所述多个语音选项中的至少一个语音选项的选择之前，由搜索单元12根据接收到的对所述多个语音选项中至少一部分语音选项的滑动操作，呈现待被选择的语音选项。

可选地，请参考图12，所述信息处理装置还包括：

制作语音操作响应单元15，用于响应于接收到第二即时通信客户端的用户制作语音信息的操作，呈现语音信息集中的多个待模仿的语音选项供用户选择。

模仿操作响应单元16，用于响应于接收到第二即时通信客户端的用户对至少一个待模仿的语音选项的选择以及针对该选择的语音选项的语音内容进行模仿的语音录制操作，得到与该选择的语音选项对应的语音文件。

可选地，请参考图13，为了结合图片和语音各自的特点来综合表达用户在交互过程中的情感，所述信息处理装置还包括：

图片获取单元21，用于获取待处理的图片。

录制的语音信息获取单元22，用于获取第二即时通信客户端的用户录制的针对该目标图片的语音信息。

目标图片获取单元23，用于根据所录制的语音信息对所述待处理的图片进行处理，得到目标图片。其中，所述目标图片包括但不限于动图。

语音图片文件获取单元24，用于根据预定的针对目标图片和语音信息进行结合的规则，得到结合后的语音图片文件。

语音图片文件发送单元25，用于将所述语音图片文件发送至第一即时通信客户端。

可选地，目标图片获取单元23根据所录制的语音信息的语音特征对所述待处理的图片进行处理，得到目标图片具体包括：

-根据语音信息的音高、音色、音量、音长和节奏中的至少一项特征，对待处理的图片进行翻转、扭转、拉伸中的一项或多项处理，得到目标图片；或/和

-为该待处理的图片配置与该语音信息对应的文本信息，得到包括该配置的文本信息的目标图片。

可选地，所述信息处理装置还包括：震动确定单元，用于根据语音信息的音高、音色、音量、音长和节奏中的至少一项特征，确定第一即时通信客户端在接收到该条语音信息时发生震动的震动强度或/和震动时间。进一步地，在录制的语音信息获取单元22获取第二即时通信客户端的用户录制的针对该目标图片的语音信息之后，由震动确定单元根据语音信息的音高、音色、音量、音长和节奏中的至少一项特征，确定第一即时通信客户端在接收到该条语音信息时发生震动的震动强度或/和震动时间。

可选地，语音图片文件发送单元25将所述语音图片文件发送至第一即时通信客户端具体包括：

示例性设备

在介绍了本发明示例性实施方式的方法和装置之后，接下来，介绍根据本发明的另一示例性实施方式的信息处理装置。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为***、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“***”。

在一些可能的实施方式中，根据本发明的信息处理装置可以至少包括至少一个处理单元、以及至少一个存储单元。其中，所述存储单元存储有程序代码，当所述程序代码被所述处理单元执行时，使得所述处理单元执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的信息处理方法中的步骤。例如，所述处理单元可以执行如图3所示的步骤S101，由第二即时通信客户端接收来自第一即时通信客户端发送的第一信息内容；步骤S102，根据所述第一信息内容，从预定的信息库中搜索出适于与发送该第一信息内容的用户互动的语音信息集，以供第二即时通信客户端的用户从中选择一个或多个语音选项与发送该第一信息内容的用户互动，其中每个语音选项包括至少一段语音内容。

下面参考图14来描述本发明的这种实施方式的信息处理装置80。图14显示的信息处理装置80仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图14所示，信息处理装置80以通用计算设备的形式表现。信息处理装置80的组件可以包括但不限于：上述至少一个处理单元81、上述至少一个存储单元82、连接不同***组件(包括处理单元81和存储单元82)的总线83。

总线83表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器、***总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。

存储单元82可以包括易失性存储器形式的可读介质，例如随机存取存储器(RAM)8201和/或高速缓存存储器8202，还可以进一步包括只读存储器8203。

存储单元82还可以包括具有一组(至少一个)程序模块8204的程序/实用工具821，这样的程序模块包括但不限于：操作***、一个或多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或者某种组合中可能包括网络环境的实现。

信息处理装置80也可以与一个或多个外部设备84(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或多个使得用户能与该信息处理装置80交互的设备通信，和/或与使得该信息处理装置80与一个或多个其他计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口85进行。并且，信息处理装置还可以通过网络适配器86与一个或多个网络(例如局域网，广域网等)通信。如图所示，网络适配器86通过总线与信息处理装置80的其他模块通信。应当明白，尽管图中未示出，可以结合信息处理装置使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。

示例性程序产品

在一些可能的实施方式中，本发明的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的信息处理方法的步骤，例如所述终端设备可以执行如图3所示的步骤S101，由第二即时通信客户端接收来自第一即时通信客户端发送的第一信息内容；步骤S102，根据所述第一信息内容，从预定的信息库中搜索出适于与发送该第一信息内容的用户互动的语音信息集，以供第二即时通信客户端的用户从中选择一个或多个语音选项与发送该第一信息内容的用户互动，其中每个语音选项包括至少一段语音内容。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光钎、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件或者上述的任意合适的组合。

如图15所示，描述了根据本发明的实施方式的信息处理的程序产品90，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或器件使用或者与其结合使用。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言——例如Java、C++等，还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络——包括局域网或广域网——连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

应当注意，尽管在上文详细描述中提及了信息处理装置的若干装置或子装置，但是这种划分仅仅并非强制性的。实际上，根据本发明的实施方式，上文描述的两个或更多装置的特征和功能可以在一个装置中具体化。反之，上文描述的一个装置的特征和功能可以进一步划分为由多个装置来具体化。

此外，尽管在附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施方式描述了本发明的精神和原理，但是应该理解，本发明并不限于所公开的具体实施方式，对各方面的划分也不意味着这些方面中的特征不能组合以进行受益，这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims

1.一种信息处理方法，包括：

由第二即时通信客户端接收来自第一即时通信客户端发送的第一信息内容；

根据所述第一信息内容，从预定的信息库中搜索出适于与发送该第一信息内容的用户互动的语音信息集，以供第二即时通信客户端的用户从中选择一个或多个语音选项与发送该第一信息内容的用户互动，其中每个语音选项包括至少一段语音内容；

所述语音信息集包括一个或多个不同类型的声音包，每个类型的声音包中包括一个或多个语音选项；

获取待处理的图片；

获取第二即时通信客户端的用户录制的针对目标图片的语音信息；

根据所录制的语音信息特征对所述待处理的图片进行相应的处理，得到包括动图的目标图片；

根据预定的针对目标图片和语音信息进行结合的规则，得到结合后的语音图片文件；

将所述语音图片文件发送至第一即时通信客户端。

2.根据权利要求1所述的信息处理方法，还包括：

响应于接收到第二即时通信客户端的用户对选择的语音选项的预览操作，在第二即时通信客户端上执行对该选择的语音选项的预览事件，该预览事件包括播放所选择的语音选项对应的语音内容或/和呈现该语音选项对应的文本内容。

3.根据权利要求1所述的信息处理方法，还包括：

响应于接收到第二即时通信客户端的用户对选择的语音选项的发送操作，将所选择的语音选项发送至第一即时通信客户端。

4.根据权利要求3所述的信息处理方法，其中所述第一信息内容包括语音信息，所述根据所述第一信息内容，从预定的信息库中搜索出适于与第一信息内容进行互动的语音信息集包括：

响应于接收到对第一信息内容的特定操作，根据预设的信息匹配规则，从预定的信息库中搜索出与第一信息内容匹配的语音信息集，作为适于与发送该第一信息内容的用户互动的语音信息集。

5.根据权利要求4所述的信息处理方法，其中所述根据预设的信息匹配规则从预定的信息库中搜索出与第一信息内容匹配的语音信息集包括：

根据预设的计算规则，并根据第一信息内容和预定的信息库中多条语音信息基于语音特征而确定的情绪或/和所属的声音包的类型，计算第一信息内容与预定的信息库中多条语音信息的匹配度；

将预定的信息库中匹配度大于预定阈值的语音信息或者匹配度排序靠前的特定数量的语音信息，作为与第一信息内容匹配的语音信息集。

6.根据权利要求4或5所述的信息处理方法，还包括：

以特定的形式向第二即时通信客户端的用户呈现所述语音信息集中的多个语音选项；

响应于接收到对所述多个语音选项中的至少一个语音选项的选择，使该选择的至少一个语音选项成为待发送至第一即时通信客户端的语音选项。

7.根据权利要求6所述的信息处理方法，其中，所述对第一信息内容的特定操作包括：对第一信息内容的重按操作；

所述以特定的形式呈现多个语音选项包括：以多个卡片层叠的形式呈现多个语音选项；

所述接收到对所述多个语音选项中的至少一个语音选项的选择之前，还包括：接收到对所述多个语音选项中至少一部分语音选项的滑动操作，以呈现待被选择的语音选项。

8.根据权利要求1所述的信息处理方法，还包括：

响应于接收到第二即时通信客户端的用户制作语音信息的操作，呈现语音信息集中的多个待模仿的语音选项供用户选择；

响应于接收到第二即时通信客户端的用户对至少一个待模仿的语音选项的选择以及针对该选择的语音选项的语音内容进行模仿的语音录制操作，得到与该选择的语音选项对应的语音文件。

9.根据权利要求1所述的信息处理方法，其中根据所录制的语音信息的语音特征对所述待处理的图片进行处理，得到目标图片具体包括：

根据语音信息的音高、音色、音量、音长和节奏中的至少一项特征，对待处理的图片进行翻转、扭转、拉伸中的一项或多项处理，得到目标图片；或/和

为该待处理的图片配置与该语音信息对应的文本信息，得到包括该配置的文本信息的目标图片。

10.根据权利要求1所述的信息处理方法，在所述获取录制的针对该目标图片的语音信息的步骤之后还包括：

根据语音信息的音高、音色、音量、音长和节奏中的至少一项特征，确定第一即时通信客户端在接收到该条语音信息时发生震动的震动强度或/和震动时间；

所述将所述语音图片文件发送至第一即时通信客户端的步骤具体包括：

11.一种信息处理装置，包括：

接收单元，用于接收来自第一即时通信客户端发送的第一信息内容；

搜索单元，用于根据所述第一信息内容，从预定的信息库中搜索出适于与发送该第一信息内容的用户互动的语音信息集，以供所述信息处理装置的用户从中选择一个或多个语音选项与发送该第一信息内容的用户互动，其中每个语音选项包括至少一段语音内容；

图片获取单元，用于获取待处理的图片；

录制的语音信息获取单元，用于获取第二即时通信客户端的用户录制的针对该目标图片的语音信息；

目标图片获取单元，用于根据所录制的语音信息特征对所述待处理的图片进行相应的处理，得到包括动图的目标图片；

语音图片文件获取单元，用于根据预定的针对目标图片和语音信息进行结合的规则，得到结合后的语音图片文件；

语音图片文件发送单元，用于将所述语音图片文件发送至第一即时通信客户端。