CN111666940A

CN111666940A - 聊天截图内容处理方法、装置、电子设备和可读存储介质

Info

Publication number: CN111666940A
Application number: CN202010506616.1A
Authority: CN
Inventors: 叶唐陟; 陈星�; 李骈臻; 田兴业; 戴晓雪; 吴棨贤
Original assignee: Xiamen Meitu Technology Co Ltd
Current assignee: Xiamen Meitu Technology Co Ltd
Priority date: 2020-06-05
Filing date: 2020-06-05
Publication date: 2020-09-15
Anticipated expiration: 2040-06-05
Also published as: CN111666940B

Abstract

本申请实施例提供了一种聊天截图内容处理方法、装置、电子设备和可读存储介质，涉及图像处理技术领域。该方法首先获取待识别聊天截图。接着，将待识别聊天截图输入预先建立的内容识别模型中，得到待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息。最后，按照每个聊天内容信息的位置信息，将至少一个聊天内容信息进行排列，得到待识别聊天截图的还原聊天内容。如此，可根据聊天内容信息的坐标信息关联上下文信息，获取对话的先后顺序，进而提高处理聊天截图内容的准确性。

Description

聊天截图内容处理方法、装置、电子设备和可读存储介质

技术领域

本申请涉及图像处理技术领域，具体而言，涉及一种聊天截图内容处理方法、装置、电子设备和可读存储介质。

背景技术

社交即时通讯(Instant Messaging)是目前网络上最为流行的通讯方式。在我国以微信、QQ为代表的即时通讯软件的人均使用时长远比其他类型的软件多。以QQ、微信为例，大部分的聊天软件的聊天界面都符合相同的样式，左侧是客视角，右侧是主视角，每条消息都会关联一个头像，上方是对话名称。

用户在即时通讯软件上发生的聊天对话常常以截图的形式分享到社交媒体上。但是截图的形式不同于文本格式，难以被检索。

目前通用的光学字符识别(Optical Character Recognition，OCR)算法可以识别出截图内的文字，但是无法关联上下文信息，获取对话的先后顺序。

发明内容

有鉴于此，本申请提供了一种聊天截图内容处理方法、装置、电子设备和可读存储介质，以解决上述问题。

本申请的实施例可以这样实现：

第一方面，本申请实施例提供一种聊天截图内容处理方法，所述方法包括：

获取待识别聊天截图；

将所述待识别聊天截图输入预先建立的内容识别模型中，得到所述待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息；

按照每个聊天内容信息的位置信息，将至少一个聊天内容信息进行排列，得到所述待识别聊天截图的还原聊天内容。

在可选的实施方式中，所述待识别聊天截图为多个；

所述按照每个聊天内容信息的位置信息，将至少一个聊天内容信息进行排列的步骤之后，所述方法还包括：

删除多个所述待识别聊天截图中重复的聊天内容信息。

在可选的实施方式中，每个所述待识别聊天截图均具有用于表征聊天顺序的标号；

所述删除多个所述待识别聊天截图中重复的聊天内容信息的步骤，包括：

获取目标待识别聊天截图中的最后一个聊天内容信息，得到第一内容信息，所述目标待识别聊天截图为多个聊天截图中的任意一个；

依据所述目标待识别聊天截图的标号，确定所述目标待识别聊天截图的下一个待识别聊天截图；

获取所述下一个待识别聊天截图的所有聊天内容信息，得到多个第二内容信息；

将所述第一内容信息与每个所述第二内容信息进行匹配，若存在与所述第一内容信息相同的目标第二内容信息，则删除所述目标第二内容信息及所述目标第二内容信息前所有的第二内容信息。

在可选的实施方式中，所述内容识别模型包括目标检测模型和字符识别模型；

所述将所述待识别聊天截图输入预先建立的内容识别模型中，得到所述待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息的步骤包括：

利用所述目标检测模型，对所述待识别聊天截图进行目标检测，得到至少一个聊天内容图像块、每个聊天内容图像块的类别属性及每个聊天内容图像块在预设坐标系中的坐标信息；

基于每个聊天内容图像块的类别属性，利用所述字符识别模型对每个聊天内容图像块进行识别，得到每个聊天内容图像块中的聊天内容信息；

将每个聊天内容图像块的坐标信息及类别属性作为每个聊天内容图像块的位置信息；

将每个聊天内容图像块的位置信息与每个聊天内容图像块的聊天内容信息一一对应进行关联。

根据每个聊天内容图像块的类别属性，对所有聊天内容图像块进行层级编号；

将每个聊天内容图像块的层级编号、坐标信息及类别属性作为每个聊天内容图像块的位置信息；

在可选的实施方式中，所述按照每个聊天内容信息的位置信息，将至少一个聊天内容信息进行排列的步骤包括：

获取每个聊天内容信息对应的层级编号、坐标信息及类别属性；

根据每个聊天内容信息对应的所述层级编号、坐标信息及类别属性，对每个聊天内容信息进行排列。

在可选的实施方式中，所述类别属性包括消息类别、昵称类别及头像类别，所述消息类别包括消息文字子类别及消息表情子类别，所述昵称类别包括昵称文字子类别及昵称表情子类别，所述字符识别模型包括表情识别子模型及文字识别子模型，所述聊天内容信息包括Unicode编码信息及文字信息；

所述基于每个聊天内容图像块的类别属性，利用所述字符识别模型对每个聊天内容图像块进行识别，得到每个聊天内容图像块中的聊天内容信息的步骤包括：

利用所述表情识别子模型，对每个类别属性为消息表情子类别的聊天内容图像块进行识别，得到每个类别属性为消息表情子类别的聊天内容图像块的Unicode编码信息；

利用所述表情识别子模型，对每个类别属性为昵称表情子类别的聊天内容图像块进行识别，得到每个类别属性为昵称表情子类别的聊天内容图像块的Unicode编码信息；

利用所述文字识别子模型，对每个类别属性为消息文字子类别的聊天内容图像块进行识别，得到每个类别属性为消息文字子类别的聊天内容图像块的文字信息；

利用所述文字识别子模型，对每个类别属性为昵称文字子类别的聊天内容图形块进行识别，得到每个类别属性为昵称文字子类别的聊天内容图像块的文字信息。

在可选的实施方式中，所述位置信息包括坐标信息；

所述按照每个聊天内容信息的位置信息，将至少一个聊天内容信息进行排列的步骤包括：

获取每个聊天内容信息的坐标信息；

根据每个聊天内容信息的坐标信息，对每个聊天内容信息进行排列。

在可选的实施方式中，所述位置信息还包括类别属性，所述类别属性包括昵称类别及头像类别；

响应分享操作，获取待分享聊天截图，所述待分享聊天截图是还原所述待识别聊天截图中的聊天内容后得到的；

对所述待分享聊天截图中类别属性为头像类别及昵称类别的聊天内容信息进行屏蔽处理；

将进行屏蔽处理后的待分享聊天截图发送至目标对象。

第二方面，本申请实施例提供一种聊天截图内容处理装置，所述装置包括：

获取模块，用于获取待识别聊天截图；

内容识别模块，用于将所述待识别聊天截图输入预先建立的内容识别模型中，得到所述待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息；

排列模块，用于按照每个聊天内容信息的位置信息，将至少一个聊天内容信息进行排列，得到所述待识别聊天截图的还原聊天内容。

第三方面，本申请实施例提供一种电子设备，所述电子设备包括处理器、存储器及总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器及所述存储器之间通过总线通信，所述处理器执行所述机器可读指令，以执行前述实施方式任意一项所述的聊天截图内容处理方法的步骤。

第四方面，本申请实施例提供一种可读存储介质，所述可读存储介质中存储有计算机程序，所述计算机程序被执行时实现前述实施方式任意一项所述的聊天截图内容处理方法。

本申请实施例提供了一种聊天截图内容处理方法、装置、电子设备和可读存储介质。该方法首先获取待识别聊天截图。接着，将待识别聊天截图输入预先建立的内容识别模型中，得到待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息。最后，按照每个聊天内容信息的位置信息，将至少一个聊天内容信息进行排列，得到待识别聊天截图的还原聊天内容。如此，可根据聊天内容信息的坐标信息关联上下文信息，获取对话的先后顺序，进而提高处理聊天截图内容的准确性。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的电子设备的结构框图。

图2为本申请实施例提供的聊天截图内容处理方法的流程图之一。

图3为本申请实施例提供的聊天截图内容处理方法的流程图之二。

图4为本申请实施例提供的目标待识别聊天截图的示意图。

图5为本申请实施例提供的目标待识别聊天截图的下一个待识别聊天截图的示意图。

图6为本申请实施例提供的包括多个聊天内容图像块的待识别聊天截图的示意图。

图7为本申请实施例提供的聊天截图内容处理装置的功能模块框图。

图标：100-电子设备；110-存储器；120-处理器；130-聊天截图内容处理装置；131-获取模块；132-内容识别模块；133-排列模块。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

在本申请的描述中，需要说明的是，若出现术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，或者是该发明产品使用时惯常摆放的方位或位置关系，仅是为了便于描述本申请和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本申请的限制。

此外，若出现术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

需要说明的是，在不冲突的情况下，本申请的实施例中的特征可以相互结合。

如背景技术所介绍，社交即时通讯(Instant Messaging)是目前网络上最为流行的通讯方式。在我国以微信、QQ为代表的即时通讯软件的人均使用时长远比其他类型的软件多。以QQ、微信为例，大部分的聊天软件的聊天界面都符合相同的样式，左侧是客视角，右侧是主视角，每条消息都会关联一个头像，上方是对话名称。

目前通用的OCR算法可以识别出截图内的文字，但是无法关联上下文信息，获取对话的先后顺序。

有鉴于此，本申请实施例提供了一种聊天截图内容处理方法、装置、电子设备和可读存储介质。该方法通过预先建立的内容识别模型，对截图内的文字及文字的位置信息进行识别，根据位置信息对文字进行排序，以解决上述问题，下面对上述方案进行详细阐述。

请参阅图1，图1为本申请实施例提供的一种电子设备100的结构框图。设备可以包括处理器120、存储器110、聊天截图内容处理装置130及总线，存储器110存储有处理器120可执行的机器可读指令，当电子设备100运行时，处理器120及存储器110之间通过总线通信，处理器120执行机器可读指令，并执行聊天截图内容处理方法的步骤。

存储器110、处理器120以及其他各元件相互之间直接或间接地电性连接，以实现信号的传输或交互。

例如，这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。聊天截图内容处理装置130包括至少一个可以软件或固件(firmware)的形式存储于存储器110中的软件功能模块。处理器120用于执行存储器110中存储的可执行模块，例如聊天截图内容处理装置130所包括的软件功能模块或计算机程序。

其中，存储器110可以是，但不限于，随机读取存储器(Random ACCess memory，RAM)，只读存储器(Read Only Memory，ROM)，可编程只读存储器(Programmable Read-OnlyMemory，PROM)，可擦除只读存储器(Erasable Programmable Read-Only Memory，EPROM)，电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory，EEPROM)等。

处理器120可以是一种集成电路芯片，具有信号处理能力。上述处理器120可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(NetworkProcessor，简称NP)等。

还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本申请实施例中，存储器110用于存储程序，处理器120用于在接收到执行指令后，执行程序。本申请实施例任一实施方式所揭示的流程定义的方法可以应用于处理器120中，或者由处理器120实现。

在本申请实施例中，电子设备100可以是但不限于智能手机、个人电脑、平板电脑等具有处理功能的设备。

可以理解，图1所示的结构仅为示意。电子设备100还可以具有比图1所示更多或者更少的组件，或者具有与图1所示不同的配置。图1所示的各组件可以采用硬件、软件或其组合实现。

作为一种可能的实施方式，本申请实施例提供了一种聊天截图内容处理方法，请结合参阅图2，图2为本申请实施例提供的聊天截图内容处理方法的流程图。下面结合图2所示的具体流程进行详细描述。

步骤S1，获取待识别聊天截图。

步骤S2，将待识别聊天截图输入预先建立的内容识别模型中，得到待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息。

步骤S3，按照每个聊天内容信息的位置信息，将至少一个聊天内容信息进行排列，得到待识别聊天截图的还原聊天内容。

其中，预先建立的内容识别模型可以是通过人工标记训练样本后，使用神经网络训练得到的。例如，该神经网络可以是yolo目标检测模型，faster-RCNN网络，SSD(SingleShot MultiBox Detector)目标检测模型，CenterNet目标检测模型，FCOS目标检测模型中任意一个模型与OCR模型中的组合。具体训练过程及方法可参照现有技术，在此不做赘述。

本申请实施例提供了一种聊天截图内容处理方法通过预先建立的内容识别模型，对截图内的文字及文字的位置信息进行识别，根据位置信息对文字进行排序，解决了无法关联上下文信息，获取聊天截图中对话的先后顺序的问题。

进一步地，作为另一种可能的实施方式，请结合参阅图3，待识别聊天截图为多个时，由于多个聊天截图中可能包括重复的聊天内容，若按照图2中所示出的方法对每个聊天截图进行识别，往往造成得到的还原聊天内容出现重复冗余的问题。

因此，在按照每个聊天内容信息的位置信息，将至少一个聊天内容信息进行排列的步骤之后，方法还包括如下步骤：

步骤S4，删除多个待识别聊天截图中重复的聊天内容信息。

可通过以下方式，实现删除多个待识别聊天截图中重复的聊天内容信息：

首先，获取目标待识别聊天截图中的最后一个聊天内容信息，得到第一内容信息，目标待识别聊天截图为多个聊天截图中的任意一个，每个待识别聊天截图均具有用于表征聊天顺序的标号。

接着，依据目标待识别聊天截图的标号，确定目标待识别聊天截图的下一个待识别聊天截图。

然后，获取下一个待识别聊天截图的所有聊天内容信息，得到多个第二内容信息。

最后，将第一内容信息与每个第二内容信息进行匹配，若存在与第一内容信息相同的目标第二内容信息，则删除目标第二内容信息及目标第二内容信息前所有的第二内容信息。

例如，请结合参阅图4及图5，图4为目标待识别聊天截图的示意图，图5为目标待识别聊天截图的下一个待识别聊天截图的示意图。图4中的A为目标待识别聊天截图中的最后一个聊天内容信息，即第一内容信息。图5中的B1、B2、B3、B4、B5、B6及B7为下一个待识别聊天截图中的多个第二内容信息。

通过匹配，可以知道图5中存在与第一内容信息一致的目标第二内容信息B2，则删除该目标第二内容信息B2，以及B2前的第二内容信息B1。

如此，可解决还原聊天内容出现重复冗余的问题。

进一步地，为了使得检测更加准确，避免删除重复内容时发生错删的情况，还可以通过以下方式实现删除多个待识别聊天截图中重复的聊天内容信息。

同样地，在上述基础上，将第一内容信息与每个第二内容信息进行匹配，若存在与第一内容信息相同的目标第二内容信息，则获取第一内容信息的前一条聊天内容信息及目标第二内容信息的前一条聊天内容信息。

接着，将第一内容信息的前一条聊天内容信息作为新的第一内容信息，将目标第二内容信息的前一条聊天内容信息作为新的第二内容信息。

然后，重复将第一内容信息与每个第二内容信息进行匹配的步骤，直至找出下一个待识别聊天截图中与目标待识别聊天截图重复的所有目标第二内容信息，并将所有目标第二内容信息删除。

如此，在解决了还原聊天内容出现重复冗余的问题的情况下，进一步提高了删除重复内容的准确性，从而提高了处理聊天截图内容的准确性。

进一步地，内容识别模型包括目标检测模型和字符识别模型。

作为一种可能的实施方式，可通过以下步骤，得到待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息。

首先，利用目标检测模型，对待识别聊天截图进行目标检测，得到至少一个聊天内容图像块、每个聊天内容图像块的类别属性及每个聊天内容图像块在预设坐标系中的坐标信息。

接着，基于每个聊天内容图像块的类别属性，利用字符识别模型对每个聊天内容图像块进行识别，得到每个聊天内容图像块中的聊天内容信息。

然后，将每个聊天内容图像块的坐标信息及类别属性作为每个聊天内容图像块的位置信息。

最后，将每个聊天内容图像块的位置信息与每个聊天内容图像块的聊天内容信息一一对应进行关联。

其中，目标检测模型可以yolo目标检测模型，faster-RCNN网络，SSD(Single ShotMultiBox Detector)目标检测模型，CenterNet目标检测模型，FCOS目标检测模型中的任意一种模型训练得到，字符识别模型则可以由OCR模型训练得到。

作为一种可能的实施场景，如图6所示，图6中具有虚线框的图像块为利用目标检测模型进行目标检测后得到的多个聊天内容图像块。每个聊天内容图像块的类别属性可以是消息类别、昵称类别及头像类别中的任意一种。例如，图6中的聊天内容图像块1的类别属性为昵称类别(以下将聊天内容图像块简称为图像块)。图像块2的类别属性为头像类别，图像块3的类别属性为消息类别。

坐标信息为基于预设坐标系得到的，针对每个待识别聊天截图，该预设坐标系的原点均位于待识别聊天截图左上端，延待识别聊天截图上端向右为x轴，y轴则与x轴基于原点垂直。

同时，每个聊天内容图像块的坐标信息可以是每个聊天内容图像块左上端的在预设坐标系中的坐标，还可以是每个聊天内容图像块的几何中心在预设坐标系中的坐标。

基于上述实施方式，可得到待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的坐标信息及类别属性。

作为又一种可能的实施方式，为了使得得到的待识别聊天截图的还原聊天内容更加准确，关联对话与头像，当聊天内容信息中有换行时，还可通过以下方式，得到待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息：

然后，根据每个聊天内容图像块的类别属性，对所有聊天内容图像块进行层级编号。

然后，将每个聊天内容图像块的层级编号、坐标信息及类别属性作为每个聊天内容图像块的位置信息。

其中，目标检测模型、字符识别模型坐标信息的原理可参照与前一种实施方式提及的相关内容，在此不做赘述。

请结合参阅图6，作为一种可能的实施场景，根据每个聊天内容图像块的类别属性，对所有聊天内容图像块进行层级编号后可如图6所示。

进一步地，消息类别包括消息文字子类别及消息表情子类别，昵称类别包括昵称文字子类别及昵称表情子类别，字符识别模型包括表情识别子模型及文字识别子模型，聊天内容信息包括统一码(Unicode)编码信息及文字信息。

作为一种可能的实施方式，可通过以下方式得到每个聊天内容图像块中的聊天内容信息：

首先，利用表情识别子模型，对每个类别属性为消息表情子类别的聊天内容图像块进行识别，得到每个类别属性为消息表情子类别的聊天内容图像块的Unicode编码信息。

接着，利用表情识别子模型，对每个类别属性为昵称表情子类别的聊天内容图像块进行识别，得到每个类别属性为昵称表情子类别的聊天内容图像块的Unicode编码信息。

然后，利用文字识别子模型，对每个类别属性为消息文字子类别的聊天内容图像块进行识别，得到每个类别属性为消息文字子类别的聊天内容图像块的文字信息。

最后，利用文字识别子模型，对每个类别属性为昵称文字子类别的聊天内容图形块进行识别，得到每个类别属性为昵称文字子类别的聊天内容图像块的文字信息。

例如，请接着参阅图6，图6中聊天内容图像块1的类别属性为昵称类别，其中包括文字和emoji表情，即聊天内容图像块1-2为昵称表情子类别，聊天内容图像块1-1为昵称文字子类别。聊天内容图像块5的类别属性为消息类别，其中也同样包括文字和emoji表情，即，聊天内容图像块5-1为消息文字子类别，聊天内容图像块5-2为消息表情子类别。

则利用表情识别子模型分别对聊天内容图像块1-1及聊天内容图像块5-2进行识别，分别得到两个聊天内容图像块的Unicode编码信息，以对聊天内容图像块中的表情进行分类识别。

利用文字识别子模型分别对聊天内容图像块1-2及5-1进行识别，得到聊天内容图像块的文字信息，以对聊天内容图像块的文字内容进行识别。

进一步地，作为一种可能的实施方式，可通过以下步骤将至少一个聊天内容信息进行排列：

首先，获取每个聊天内容信息的坐标信息。

接着，根据每个聊天内容信息的坐标信息，对每个聊天内容信息进行排列。

例如，作为一种可能的实施场景，筛选出类别属性为消息类别的聊天内容信息，通过每个聊天内容信息的坐标信息中y坐标的大小顺序，从上到下依次将聊天内容信息进行排列，生成对话列表。对于在同一行的聊天内容信息，则根据x坐标的大小顺序，从左到右进行排序。

筛选出类别属性为头像类别的聊天内容信息，同样通过每个聊天内容信息的坐标信息中y坐标的大小顺序，从上到下依次将聊天内容信息进行排列，生成头像列表。

筛选出类别属性为昵称类别的聊天内容信息，同样通过每个聊天内容信息的坐标信息中y坐标的大小顺序，从上到下依次将聊天内容信息进行排列，生成昵称列表。

将对话列表、头像列表及昵称列表进行关联排序，以还原出每个聊天内容信息的阅读顺序，得到待识别聊天截图的还原聊天内容。

应当理解的是，在其它实施场景中，本申请实施例所阐述的根据每个聊天内容信息的坐标信息，对每个聊天内容信息进行排列的方法中的部分步骤的顺序可以根据实际需要相互交换，或者其中的部分步骤也可以省略或删除。

例如，生成头像列表、生成昵称列表及生成对话列表的步骤可以根据实际需要相互交换，在此不对其生成顺序进行限定。

如此，可得到待识别聊天截图的还原聊天内容，但是在基于上述方式的基础上，仅根据每个聊天内容信息的坐标信息对每个聊天内容信息进行排列，在聊天内容信息有换行或者一个聊天内容信息的类别包括多个子类别的情况下，得到的待识别聊天截图的还原聊天内容可能存在排列顺序错乱的情况。

因此，为了解决上述问题，作为另一种可能的实施方式，还可以通过以下步骤将至少一个聊天内容信息进行排列：

首先，获取每个聊天内容信息对应的层级编号、坐标信息及类别属性。

接着，根据每个聊天内容信息对应的层级编号、坐标信息及类别属性，对每个聊天内容信息进行排列。

例如，作为一种可能的实施场景，按照层级编号依次获取对应的聊天内容信息，根据聊天内容的坐标信息，按照上述生成对话列表、头像列表及昵称列表是方式对所有聊天内容信息进行排列，得到待识别聊天截图的还原聊天内容。

进一步地，在本申请实施例提供的上述聊天截图内容处理方法的基础上，本申请实施例还提供一种方法，该方法可帮助用户分享截图时一键隐藏昵称、头像等隐私，不用手动修图。

首先，响应分享操作，获取待分享聊天截图，待分享聊天截图是还原待识别聊天截图中的聊天内容后得到的。

接着，对待分享聊天截图中类别属性为头像类别及昵称类别的聊天内容信息进行屏蔽处理。

最后，将进行屏蔽处理后的待分享聊天截图发送至目标对象。

如此，通过先对待识别聊天截图中的聊天内容进行还原，进而响应分享操作得到待分享聊天截图，对待分享聊天截图中类别属性为头像类别及昵称类别的聊天内容信息进行屏蔽处理，即可在用户分享聊天截图时，隐藏昵称、头像等隐私，而不用用户手动修图，提高了用户体验。

进一步地，在本申请实施例提供的上述聊天截图内容处理方法的基础上，还可基于自然语言处理(Natural Language Processing，NLP)技术对还原后的聊天内容进行分类，打标签，以将聊天内容推荐给感兴趣的用户。

进一步地，在本申请实施例提供的上述聊天截图内容处理方法的基础上，利用各类搜索引擎可通过文本关键字搜索出被处理后得到的还原聊天内容，可提高查找聊天内容的效率和准确度。

基于同一发明构思，请结合参阅图7，本申请实施例中还提供了与上述聊天截图内容处理方法对应的聊天截图内容处理装置130，装置包括：

获取模块131，用于获取待识别聊天截图。

内容识别模块132，用于将待识别聊天截图输入预先建立的内容识别模型中，得到待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息。

排列模块133，用于按照每个聊天内容信息的位置信息，将至少一个聊天内容信息进行排列，得到待识别聊天截图的还原聊天内容。

由于本申请实施例中的装置解决问题的原理与本申请实施例上述聊天截图内容处理方法相似，因此装置的实施原理可以参见方法的实施原理，重复之处不再赘述。

本实施例也提供了一种可读存储介质，可读存储介质中存储有计算机程序，计算机程序被执行时实现上述的聊天截图内容处理方法。

综上所述，本申请实施例提供了一种聊天截图内容处理方法、装置、电子设备和可读存储介质。该方法首先获取待识别聊天截图。接着，将待识别聊天截图输入预先建立的内容识别模型中，得到待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息。最后，按照每个聊天内容信息的位置信息，将至少一个聊天内容信息进行排列，得到待识别聊天截图的还原聊天内容。如此，可根据聊天内容信息的坐标信息关联上下文信息，获取对话的先后顺序，进而提高处理聊天截图内容的准确性。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本申请的实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种聊天截图内容处理方法，其特征在于，所述方法包括：

获取待识别聊天截图；

2.根据权利要求1所述的聊天截图内容处理方法，其特征在于，所述待识别聊天截图为多个；

删除多个所述待识别聊天截图中重复的聊天内容信息。

3.根据权利要求2所述的聊天截图内容处理方法，每个所述待识别聊天截图均具有用于表征聊天顺序的标号；

4.根据权利要求1所述的聊天截图内容处理方法，其特征在于，所述内容识别模型包括目标检测模型和字符识别模型；

5.根据权利要求1所述的聊天截图内容处理方法，其特征在于，所述内容识别模型包括目标检测模型和字符识别模型；

6.根据权利要求5所述的聊天截图内容处理方法，其特征在于，所述按照每个聊天内容信息的位置信息，将至少一个聊天内容信息进行排列的步骤包括：

7.根据权利要求4或5所述的聊天截图内容处理方法，其特征在于，所述类别属性包括消息类别、昵称类别及头像类别，所述消息类别包括消息文字子类别及消息表情子类别，所述昵称类别包括昵称文字子类别及昵称表情子类别，所述字符识别模型包括表情识别子模型及文字识别子模型，所述聊天内容信息包括Unicode编码信息及文字信息；

8.根据权利要求1或所述的聊天截图内容处理方法，其特征在于，所述位置信息包括坐标信息；

获取每个聊天内容信息的坐标信息；

9.根据权利要求1所述的聊天截图内容处理方法，其特征在于，所述位置信息还包括类别属性，所述类别属性包括昵称类别及头像类别；

将进行屏蔽处理后的待分享聊天截图发送至目标对象。

10.一种聊天截图内容处理装置，所述装置包括：

获取模块，用于获取待识别聊天截图；

11.一种电子设备，其特征在于，所述电子设备包括处理器、存储器及总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器及所述存储器之间通过总线通信，所述处理器执行所述机器可读指令，以执行权利要求1-9任意一项所述的聊天截图内容处理方法的步骤。

12.一种可读存储介质，其特征在于，所述可读存储介质中存储有计算机程序，所述计算机程序被执行时实现权利要求1-9任意一项所述的聊天截图内容处理方法。