CN111666940A - 聊天截图内容处理方法、装置、电子设备和可读存储介质 - Google Patents

聊天截图内容处理方法、装置、电子设备和可读存储介质 Download PDF

Info

Publication number
CN111666940A
CN111666940A CN202010506616.1A CN202010506616A CN111666940A CN 111666940 A CN111666940 A CN 111666940A CN 202010506616 A CN202010506616 A CN 202010506616A CN 111666940 A CN111666940 A CN 111666940A
Authority
CN
China
Prior art keywords
chat
information
content
screenshot
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010506616.1A
Other languages
English (en)
Other versions
CN111666940B (zh
Inventor
叶唐陟
陈星�
李骈臻
田兴业
戴晓雪
吴棨贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meitu Technology Co Ltd
Original Assignee
Xiamen Meitu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meitu Technology Co Ltd filed Critical Xiamen Meitu Technology Co Ltd
Priority to CN202010506616.1A priority Critical patent/CN111666940B/zh
Publication of CN111666940A publication Critical patent/CN111666940A/zh
Application granted granted Critical
Publication of CN111666940B publication Critical patent/CN111666940B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Signal Processing (AREA)
  • Tourism & Hospitality (AREA)
  • Information Transfer Between Computers (AREA)
  • Computing Systems (AREA)
  • Strategic Management (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Human Computer Interaction (AREA)

Abstract

本申请实施例提供了一种聊天截图内容处理方法、装置、电子设备和可读存储介质,涉及图像处理技术领域。该方法首先获取待识别聊天截图。接着,将待识别聊天截图输入预先建立的内容识别模型中,得到待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息。最后,按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列,得到待识别聊天截图的还原聊天内容。如此,可根据聊天内容信息的坐标信息关联上下文信息,获取对话的先后顺序,进而提高处理聊天截图内容的准确性。

Description

聊天截图内容处理方法、装置、电子设备和可读存储介质
技术领域
本申请涉及图像处理技术领域,具体而言,涉及一种聊天截图内容处理方法、装置、电子设备和可读存储介质。
背景技术
社交即时通讯(Instant Messaging)是目前网络上最为流行的通讯方式。在我国以微信、QQ为代表的即时通讯软件的人均使用时长远比其他类型的软件多。以QQ、微信为例,大部分的聊天软件的聊天界面都符合相同的样式,左侧是客视角,右侧是主视角,每条消息都会关联一个头像,上方是对话名称。
用户在即时通讯软件上发生的聊天对话常常以截图的形式分享到社交媒体上。但是截图的形式不同于文本格式,难以被检索。
目前通用的光学字符识别(Optical Character Recognition,OCR)算法可以识别出截图内的文字,但是无法关联上下文信息,获取对话的先后顺序。
发明内容
有鉴于此,本申请提供了一种聊天截图内容处理方法、装置、电子设备和可读存储介质,以解决上述问题。
本申请的实施例可以这样实现:
第一方面,本申请实施例提供一种聊天截图内容处理方法,所述方法包括:
获取待识别聊天截图;
将所述待识别聊天截图输入预先建立的内容识别模型中,得到所述待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息;
按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列,得到所述待识别聊天截图的还原聊天内容。
在可选的实施方式中,所述待识别聊天截图为多个;
所述按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列的步骤之后,所述方法还包括:
删除多个所述待识别聊天截图中重复的聊天内容信息。
在可选的实施方式中,每个所述待识别聊天截图均具有用于表征聊天顺序的标号;
所述删除多个所述待识别聊天截图中重复的聊天内容信息的步骤,包括:
获取目标待识别聊天截图中的最后一个聊天内容信息,得到第一内容信息,所述目标待识别聊天截图为多个聊天截图中的任意一个;
依据所述目标待识别聊天截图的标号,确定所述目标待识别聊天截图的下一个待识别聊天截图;
获取所述下一个待识别聊天截图的所有聊天内容信息,得到多个第二内容信息;
将所述第一内容信息与每个所述第二内容信息进行匹配,若存在与所述第一内容信息相同的目标第二内容信息,则删除所述目标第二内容信息及所述目标第二内容信息前所有的第二内容信息。
在可选的实施方式中,所述内容识别模型包括目标检测模型和字符识别模型;
所述将所述待识别聊天截图输入预先建立的内容识别模型中,得到所述待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息的步骤包括:
利用所述目标检测模型,对所述待识别聊天截图进行目标检测,得到至少一个聊天内容图像块、每个聊天内容图像块的类别属性及每个聊天内容图像块在预设坐标系中的坐标信息;
基于每个聊天内容图像块的类别属性,利用所述字符识别模型对每个聊天内容图像块进行识别,得到每个聊天内容图像块中的聊天内容信息;
将每个聊天内容图像块的坐标信息及类别属性作为每个聊天内容图像块的位置信息;
将每个聊天内容图像块的位置信息与每个聊天内容图像块的聊天内容信息一一对应进行关联。
在可选的实施方式中,所述内容识别模型包括目标检测模型和字符识别模型;
所述将所述待识别聊天截图输入预先建立的内容识别模型中,得到所述待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息的步骤包括:
利用所述目标检测模型,对所述待识别聊天截图进行目标检测,得到至少一个聊天内容图像块、每个聊天内容图像块的类别属性及每个聊天内容图像块在预设坐标系中的坐标信息;
基于每个聊天内容图像块的类别属性,利用所述字符识别模型对每个聊天内容图像块进行识别,得到每个聊天内容图像块中的聊天内容信息;
根据每个聊天内容图像块的类别属性,对所有聊天内容图像块进行层级编号;
将每个聊天内容图像块的层级编号、坐标信息及类别属性作为每个聊天内容图像块的位置信息;
将每个聊天内容图像块的位置信息与每个聊天内容图像块的聊天内容信息一一对应进行关联。
在可选的实施方式中,所述按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列的步骤包括:
获取每个聊天内容信息对应的层级编号、坐标信息及类别属性;
根据每个聊天内容信息对应的所述层级编号、坐标信息及类别属性,对每个聊天内容信息进行排列。
在可选的实施方式中,所述类别属性包括消息类别、昵称类别及头像类别,所述消息类别包括消息文字子类别及消息表情子类别,所述昵称类别包括昵称文字子类别及昵称表情子类别,所述字符识别模型包括表情识别子模型及文字识别子模型,所述聊天内容信息包括Unicode编码信息及文字信息;
所述基于每个聊天内容图像块的类别属性,利用所述字符识别模型对每个聊天内容图像块进行识别,得到每个聊天内容图像块中的聊天内容信息的步骤包括:
利用所述表情识别子模型,对每个类别属性为消息表情子类别的聊天内容图像块进行识别,得到每个类别属性为消息表情子类别的聊天内容图像块的Unicode编码信息;
利用所述表情识别子模型,对每个类别属性为昵称表情子类别的聊天内容图像块进行识别,得到每个类别属性为昵称表情子类别的聊天内容图像块的Unicode编码信息;
利用所述文字识别子模型,对每个类别属性为消息文字子类别的聊天内容图像块进行识别,得到每个类别属性为消息文字子类别的聊天内容图像块的文字信息;
利用所述文字识别子模型,对每个类别属性为昵称文字子类别的聊天内容图形块进行识别,得到每个类别属性为昵称文字子类别的聊天内容图像块的文字信息。
在可选的实施方式中,所述位置信息包括坐标信息;
所述按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列的步骤包括:
获取每个聊天内容信息的坐标信息;
根据每个聊天内容信息的坐标信息,对每个聊天内容信息进行排列。
在可选的实施方式中,所述位置信息还包括类别属性,所述类别属性包括昵称类别及头像类别;
所述按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列的步骤之后,所述方法还包括:
响应分享操作,获取待分享聊天截图,所述待分享聊天截图是还原所述待识别聊天截图中的聊天内容后得到的;
对所述待分享聊天截图中类别属性为头像类别及昵称类别的聊天内容信息进行屏蔽处理;
将进行屏蔽处理后的待分享聊天截图发送至目标对象。
第二方面,本申请实施例提供一种聊天截图内容处理装置,所述装置包括:
获取模块,用于获取待识别聊天截图;
内容识别模块,用于将所述待识别聊天截图输入预先建立的内容识别模型中,得到所述待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息;
排列模块,用于按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列,得到所述待识别聊天截图的还原聊天内容。
第三方面,本申请实施例提供一种电子设备,所述电子设备包括处理器、存储器及总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器及所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行前述实施方式任意一项所述的聊天截图内容处理方法的步骤。
第四方面,本申请实施例提供一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序被执行时实现前述实施方式任意一项所述的聊天截图内容处理方法。
本申请实施例提供了一种聊天截图内容处理方法、装置、电子设备和可读存储介质。该方法首先获取待识别聊天截图。接着,将待识别聊天截图输入预先建立的内容识别模型中,得到待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息。最后,按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列,得到待识别聊天截图的还原聊天内容。如此,可根据聊天内容信息的坐标信息关联上下文信息,获取对话的先后顺序,进而提高处理聊天截图内容的准确性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的电子设备的结构框图。
图2为本申请实施例提供的聊天截图内容处理方法的流程图之一。
图3为本申请实施例提供的聊天截图内容处理方法的流程图之二。
图4为本申请实施例提供的目标待识别聊天截图的示意图。
图5为本申请实施例提供的目标待识别聊天截图的下一个待识别聊天截图的示意图。
图6为本申请实施例提供的包括多个聊天内容图像块的待识别聊天截图的示意图。
图7为本申请实施例提供的聊天截图内容处理装置的功能模块框图。
图标:100-电子设备;110-存储器;120-处理器;130-聊天截图内容处理装置;131-获取模块;132-内容识别模块;133-排列模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要说明的是,若出现术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
此外,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在不冲突的情况下,本申请的实施例中的特征可以相互结合。
如背景技术所介绍,社交即时通讯(Instant Messaging)是目前网络上最为流行的通讯方式。在我国以微信、QQ为代表的即时通讯软件的人均使用时长远比其他类型的软件多。以QQ、微信为例,大部分的聊天软件的聊天界面都符合相同的样式,左侧是客视角,右侧是主视角,每条消息都会关联一个头像,上方是对话名称。
用户在即时通讯软件上发生的聊天对话常常以截图的形式分享到社交媒体上。但是截图的形式不同于文本格式,难以被检索。
目前通用的OCR算法可以识别出截图内的文字,但是无法关联上下文信息,获取对话的先后顺序。
有鉴于此,本申请实施例提供了一种聊天截图内容处理方法、装置、电子设备和可读存储介质。该方法通过预先建立的内容识别模型,对截图内的文字及文字的位置信息进行识别,根据位置信息对文字进行排序,以解决上述问题,下面对上述方案进行详细阐述。
请参阅图1,图1为本申请实施例提供的一种电子设备100的结构框图。设备可以包括处理器120、存储器110、聊天截图内容处理装置130及总线,存储器110存储有处理器120可执行的机器可读指令,当电子设备100运行时,处理器120及存储器110之间通过总线通信,处理器120执行机器可读指令,并执行聊天截图内容处理方法的步骤。
存储器110、处理器120以及其他各元件相互之间直接或间接地电性连接,以实现信号的传输或交互。
例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。聊天截图内容处理装置130包括至少一个可以软件或固件(firmware)的形式存储于存储器110中的软件功能模块。处理器120用于执行存储器110中存储的可执行模块,例如聊天截图内容处理装置130所包括的软件功能模块或计算机程序。
其中,存储器110可以是,但不限于,随机读取存储器(Random ACCess memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器120可以是一种集成电路芯片,具有信号处理能力。上述处理器120可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等。
还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本申请实施例中,存储器110用于存储程序,处理器120用于在接收到执行指令后,执行程序。本申请实施例任一实施方式所揭示的流程定义的方法可以应用于处理器120中,或者由处理器120实现。
在本申请实施例中,电子设备100可以是但不限于智能手机、个人电脑、平板电脑等具有处理功能的设备。
可以理解,图1所示的结构仅为示意。电子设备100还可以具有比图1所示更多或者更少的组件,或者具有与图1所示不同的配置。图1所示的各组件可以采用硬件、软件或其组合实现。
作为一种可能的实施方式,本申请实施例提供了一种聊天截图内容处理方法,请结合参阅图2,图2为本申请实施例提供的聊天截图内容处理方法的流程图。下面结合图2所示的具体流程进行详细描述。
步骤S1,获取待识别聊天截图。
步骤S2,将待识别聊天截图输入预先建立的内容识别模型中,得到待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息。
步骤S3,按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列,得到待识别聊天截图的还原聊天内容。
其中,预先建立的内容识别模型可以是通过人工标记训练样本后,使用神经网络训练得到的。例如,该神经网络可以是yolo目标检测模型,faster-RCNN网络,SSD(SingleShot MultiBox Detector)目标检测模型,CenterNet目标检测模型,FCOS目标检测模型中任意一个模型与OCR模型中的组合。具体训练过程及方法可参照现有技术,在此不做赘述。
本申请实施例提供了一种聊天截图内容处理方法通过预先建立的内容识别模型,对截图内的文字及文字的位置信息进行识别,根据位置信息对文字进行排序,解决了无法关联上下文信息,获取聊天截图中对话的先后顺序的问题。
进一步地,作为另一种可能的实施方式,请结合参阅图3,待识别聊天截图为多个时,由于多个聊天截图中可能包括重复的聊天内容,若按照图2中所示出的方法对每个聊天截图进行识别,往往造成得到的还原聊天内容出现重复冗余的问题。
因此,在按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列的步骤之后,方法还包括如下步骤:
步骤S4,删除多个待识别聊天截图中重复的聊天内容信息。
可通过以下方式,实现删除多个待识别聊天截图中重复的聊天内容信息:
首先,获取目标待识别聊天截图中的最后一个聊天内容信息,得到第一内容信息,目标待识别聊天截图为多个聊天截图中的任意一个,每个待识别聊天截图均具有用于表征聊天顺序的标号。
接着,依据目标待识别聊天截图的标号,确定目标待识别聊天截图的下一个待识别聊天截图。
然后,获取下一个待识别聊天截图的所有聊天内容信息,得到多个第二内容信息。
最后,将第一内容信息与每个第二内容信息进行匹配,若存在与第一内容信息相同的目标第二内容信息,则删除目标第二内容信息及目标第二内容信息前所有的第二内容信息。
例如,请结合参阅图4及图5,图4为目标待识别聊天截图的示意图,图5为目标待识别聊天截图的下一个待识别聊天截图的示意图。图4中的A为目标待识别聊天截图中的最后一个聊天内容信息,即第一内容信息。图5中的B1、B2、B3、B4、B5、B6及B7为下一个待识别聊天截图中的多个第二内容信息。
通过匹配,可以知道图5中存在与第一内容信息一致的目标第二内容信息B2,则删除该目标第二内容信息B2,以及B2前的第二内容信息B1。
如此,可解决还原聊天内容出现重复冗余的问题。
进一步地,为了使得检测更加准确,避免删除重复内容时发生错删的情况,还可以通过以下方式实现删除多个待识别聊天截图中重复的聊天内容信息。
同样地,在上述基础上,将第一内容信息与每个第二内容信息进行匹配,若存在与第一内容信息相同的目标第二内容信息,则获取第一内容信息的前一条聊天内容信息及目标第二内容信息的前一条聊天内容信息。
接着,将第一内容信息的前一条聊天内容信息作为新的第一内容信息,将目标第二内容信息的前一条聊天内容信息作为新的第二内容信息。
然后,重复将第一内容信息与每个第二内容信息进行匹配的步骤,直至找出下一个待识别聊天截图中与目标待识别聊天截图重复的所有目标第二内容信息,并将所有目标第二内容信息删除。
如此,在解决了还原聊天内容出现重复冗余的问题的情况下,进一步提高了删除重复内容的准确性,从而提高了处理聊天截图内容的准确性。
进一步地,内容识别模型包括目标检测模型和字符识别模型。
作为一种可能的实施方式,可通过以下步骤,得到待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息。
首先,利用目标检测模型,对待识别聊天截图进行目标检测,得到至少一个聊天内容图像块、每个聊天内容图像块的类别属性及每个聊天内容图像块在预设坐标系中的坐标信息。
接着,基于每个聊天内容图像块的类别属性,利用字符识别模型对每个聊天内容图像块进行识别,得到每个聊天内容图像块中的聊天内容信息。
然后,将每个聊天内容图像块的坐标信息及类别属性作为每个聊天内容图像块的位置信息。
最后,将每个聊天内容图像块的位置信息与每个聊天内容图像块的聊天内容信息一一对应进行关联。
其中,目标检测模型可以yolo目标检测模型,faster-RCNN网络,SSD(Single ShotMultiBox Detector)目标检测模型,CenterNet目标检测模型,FCOS目标检测模型中的任意一种模型训练得到,字符识别模型则可以由OCR模型训练得到。
作为一种可能的实施场景,如图6所示,图6中具有虚线框的图像块为利用目标检测模型进行目标检测后得到的多个聊天内容图像块。每个聊天内容图像块的类别属性可以是消息类别、昵称类别及头像类别中的任意一种。例如,图6中的聊天内容图像块1的类别属性为昵称类别(以下将聊天内容图像块简称为图像块)。图像块2的类别属性为头像类别,图像块3的类别属性为消息类别。
坐标信息为基于预设坐标系得到的,针对每个待识别聊天截图,该预设坐标系的原点均位于待识别聊天截图左上端,延待识别聊天截图上端向右为x轴,y轴则与x轴基于原点垂直。
同时,每个聊天内容图像块的坐标信息可以是每个聊天内容图像块左上端的在预设坐标系中的坐标,还可以是每个聊天内容图像块的几何中心在预设坐标系中的坐标。
基于上述实施方式,可得到待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的坐标信息及类别属性。
作为又一种可能的实施方式,为了使得得到的待识别聊天截图的还原聊天内容更加准确,关联对话与头像,当聊天内容信息中有换行时,还可通过以下方式,得到待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息:
首先,利用目标检测模型,对待识别聊天截图进行目标检测,得到至少一个聊天内容图像块、每个聊天内容图像块的类别属性及每个聊天内容图像块在预设坐标系中的坐标信息。
接着,基于每个聊天内容图像块的类别属性,利用字符识别模型对每个聊天内容图像块进行识别,得到每个聊天内容图像块中的聊天内容信息。
然后,根据每个聊天内容图像块的类别属性,对所有聊天内容图像块进行层级编号。
然后,将每个聊天内容图像块的层级编号、坐标信息及类别属性作为每个聊天内容图像块的位置信息。
最后,将每个聊天内容图像块的位置信息与每个聊天内容图像块的聊天内容信息一一对应进行关联。
其中,目标检测模型、字符识别模型坐标信息的原理可参照与前一种实施方式提及的相关内容,在此不做赘述。
请结合参阅图6,作为一种可能的实施场景,根据每个聊天内容图像块的类别属性,对所有聊天内容图像块进行层级编号后可如图6所示。
进一步地,消息类别包括消息文字子类别及消息表情子类别,昵称类别包括昵称文字子类别及昵称表情子类别,字符识别模型包括表情识别子模型及文字识别子模型,聊天内容信息包括统一码(Unicode)编码信息及文字信息。
作为一种可能的实施方式,可通过以下方式得到每个聊天内容图像块中的聊天内容信息:
首先,利用表情识别子模型,对每个类别属性为消息表情子类别的聊天内容图像块进行识别,得到每个类别属性为消息表情子类别的聊天内容图像块的Unicode编码信息。
接着,利用表情识别子模型,对每个类别属性为昵称表情子类别的聊天内容图像块进行识别,得到每个类别属性为昵称表情子类别的聊天内容图像块的Unicode编码信息。
然后,利用文字识别子模型,对每个类别属性为消息文字子类别的聊天内容图像块进行识别,得到每个类别属性为消息文字子类别的聊天内容图像块的文字信息。
最后,利用文字识别子模型,对每个类别属性为昵称文字子类别的聊天内容图形块进行识别,得到每个类别属性为昵称文字子类别的聊天内容图像块的文字信息。
例如,请接着参阅图6,图6中聊天内容图像块1的类别属性为昵称类别,其中包括文字和emoji表情,即聊天内容图像块1-2为昵称表情子类别,聊天内容图像块1-1为昵称文字子类别。聊天内容图像块5的类别属性为消息类别,其中也同样包括文字和emoji表情,即,聊天内容图像块5-1为消息文字子类别,聊天内容图像块5-2为消息表情子类别。
则利用表情识别子模型分别对聊天内容图像块1-1及聊天内容图像块5-2进行识别,分别得到两个聊天内容图像块的Unicode编码信息,以对聊天内容图像块中的表情进行分类识别。
利用文字识别子模型分别对聊天内容图像块1-2及5-1进行识别,得到聊天内容图像块的文字信息,以对聊天内容图像块的文字内容进行识别。
进一步地,作为一种可能的实施方式,可通过以下步骤将至少一个聊天内容信息进行排列:
首先,获取每个聊天内容信息的坐标信息。
接着,根据每个聊天内容信息的坐标信息,对每个聊天内容信息进行排列。
例如,作为一种可能的实施场景,筛选出类别属性为消息类别的聊天内容信息,通过每个聊天内容信息的坐标信息中y坐标的大小顺序,从上到下依次将聊天内容信息进行排列,生成对话列表。对于在同一行的聊天内容信息,则根据x坐标的大小顺序,从左到右进行排序。
筛选出类别属性为头像类别的聊天内容信息,同样通过每个聊天内容信息的坐标信息中y坐标的大小顺序,从上到下依次将聊天内容信息进行排列,生成头像列表。
筛选出类别属性为昵称类别的聊天内容信息,同样通过每个聊天内容信息的坐标信息中y坐标的大小顺序,从上到下依次将聊天内容信息进行排列,生成昵称列表。
将对话列表、头像列表及昵称列表进行关联排序,以还原出每个聊天内容信息的阅读顺序,得到待识别聊天截图的还原聊天内容。
应当理解的是,在其它实施场景中,本申请实施例所阐述的根据每个聊天内容信息的坐标信息,对每个聊天内容信息进行排列的方法中的部分步骤的顺序可以根据实际需要相互交换,或者其中的部分步骤也可以省略或删除。
例如,生成头像列表、生成昵称列表及生成对话列表的步骤可以根据实际需要相互交换,在此不对其生成顺序进行限定。
如此,可得到待识别聊天截图的还原聊天内容,但是在基于上述方式的基础上,仅根据每个聊天内容信息的坐标信息对每个聊天内容信息进行排列,在聊天内容信息有换行或者一个聊天内容信息的类别包括多个子类别的情况下,得到的待识别聊天截图的还原聊天内容可能存在排列顺序错乱的情况。
因此,为了解决上述问题,作为另一种可能的实施方式,还可以通过以下步骤将至少一个聊天内容信息进行排列:
首先,获取每个聊天内容信息对应的层级编号、坐标信息及类别属性。
接着,根据每个聊天内容信息对应的层级编号、坐标信息及类别属性,对每个聊天内容信息进行排列。
例如,作为一种可能的实施场景,按照层级编号依次获取对应的聊天内容信息,根据聊天内容的坐标信息,按照上述生成对话列表、头像列表及昵称列表是方式对所有聊天内容信息进行排列,得到待识别聊天截图的还原聊天内容。
进一步地,在本申请实施例提供的上述聊天截图内容处理方法的基础上,本申请实施例还提供一种方法,该方法可帮助用户分享截图时一键隐藏昵称、头像等隐私,不用手动修图。
首先,响应分享操作,获取待分享聊天截图,待分享聊天截图是还原待识别聊天截图中的聊天内容后得到的。
接着,对待分享聊天截图中类别属性为头像类别及昵称类别的聊天内容信息进行屏蔽处理。
最后,将进行屏蔽处理后的待分享聊天截图发送至目标对象。
如此,通过先对待识别聊天截图中的聊天内容进行还原,进而响应分享操作得到待分享聊天截图,对待分享聊天截图中类别属性为头像类别及昵称类别的聊天内容信息进行屏蔽处理,即可在用户分享聊天截图时,隐藏昵称、头像等隐私,而不用用户手动修图,提高了用户体验。
进一步地,在本申请实施例提供的上述聊天截图内容处理方法的基础上,还可基于自然语言处理(Natural Language Processing,NLP)技术对还原后的聊天内容进行分类,打标签,以将聊天内容推荐给感兴趣的用户。
进一步地,在本申请实施例提供的上述聊天截图内容处理方法的基础上,利用各类搜索引擎可通过文本关键字搜索出被处理后得到的还原聊天内容,可提高查找聊天内容的效率和准确度。
基于同一发明构思,请结合参阅图7,本申请实施例中还提供了与上述聊天截图内容处理方法对应的聊天截图内容处理装置130,装置包括:
获取模块131,用于获取待识别聊天截图。
内容识别模块132,用于将待识别聊天截图输入预先建立的内容识别模型中,得到待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息。
排列模块133,用于按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列,得到待识别聊天截图的还原聊天内容。
由于本申请实施例中的装置解决问题的原理与本申请实施例上述聊天截图内容处理方法相似,因此装置的实施原理可以参见方法的实施原理,重复之处不再赘述。
本实施例也提供了一种可读存储介质,可读存储介质中存储有计算机程序,计算机程序被执行时实现上述的聊天截图内容处理方法。
综上所述,本申请实施例提供了一种聊天截图内容处理方法、装置、电子设备和可读存储介质。该方法首先获取待识别聊天截图。接着,将待识别聊天截图输入预先建立的内容识别模型中,得到待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息。最后,按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列,得到待识别聊天截图的还原聊天内容。如此,可根据聊天内容信息的坐标信息关联上下文信息,获取对话的先后顺序,进而提高处理聊天截图内容的准确性。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (12)

1.一种聊天截图内容处理方法,其特征在于,所述方法包括:
获取待识别聊天截图;
将所述待识别聊天截图输入预先建立的内容识别模型中,得到所述待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息;
按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列,得到所述待识别聊天截图的还原聊天内容。
2.根据权利要求1所述的聊天截图内容处理方法,其特征在于,所述待识别聊天截图为多个;
所述按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列的步骤之后,所述方法还包括:
删除多个所述待识别聊天截图中重复的聊天内容信息。
3.根据权利要求2所述的聊天截图内容处理方法,每个所述待识别聊天截图均具有用于表征聊天顺序的标号;
所述删除多个所述待识别聊天截图中重复的聊天内容信息的步骤,包括:
获取目标待识别聊天截图中的最后一个聊天内容信息,得到第一内容信息,所述目标待识别聊天截图为多个聊天截图中的任意一个;
依据所述目标待识别聊天截图的标号,确定所述目标待识别聊天截图的下一个待识别聊天截图;
获取所述下一个待识别聊天截图的所有聊天内容信息,得到多个第二内容信息;
将所述第一内容信息与每个所述第二内容信息进行匹配,若存在与所述第一内容信息相同的目标第二内容信息,则删除所述目标第二内容信息及所述目标第二内容信息前所有的第二内容信息。
4.根据权利要求1所述的聊天截图内容处理方法,其特征在于,所述内容识别模型包括目标检测模型和字符识别模型;
所述将所述待识别聊天截图输入预先建立的内容识别模型中,得到所述待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息的步骤包括:
利用所述目标检测模型,对所述待识别聊天截图进行目标检测,得到至少一个聊天内容图像块、每个聊天内容图像块的类别属性及每个聊天内容图像块在预设坐标系中的坐标信息;
基于每个聊天内容图像块的类别属性,利用所述字符识别模型对每个聊天内容图像块进行识别,得到每个聊天内容图像块中的聊天内容信息;
将每个聊天内容图像块的坐标信息及类别属性作为每个聊天内容图像块的位置信息;
将每个聊天内容图像块的位置信息与每个聊天内容图像块的聊天内容信息一一对应进行关联。
5.根据权利要求1所述的聊天截图内容处理方法,其特征在于,所述内容识别模型包括目标检测模型和字符识别模型;
所述将所述待识别聊天截图输入预先建立的内容识别模型中,得到所述待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息的步骤包括:
利用所述目标检测模型,对所述待识别聊天截图进行目标检测,得到至少一个聊天内容图像块、每个聊天内容图像块的类别属性及每个聊天内容图像块在预设坐标系中的坐标信息;
基于每个聊天内容图像块的类别属性,利用所述字符识别模型对每个聊天内容图像块进行识别,得到每个聊天内容图像块中的聊天内容信息;
根据每个聊天内容图像块的类别属性,对所有聊天内容图像块进行层级编号;
将每个聊天内容图像块的层级编号、坐标信息及类别属性作为每个聊天内容图像块的位置信息;
将每个聊天内容图像块的位置信息与每个聊天内容图像块的聊天内容信息一一对应进行关联。
6.根据权利要求5所述的聊天截图内容处理方法,其特征在于,所述按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列的步骤包括:
获取每个聊天内容信息对应的层级编号、坐标信息及类别属性;
根据每个聊天内容信息对应的所述层级编号、坐标信息及类别属性,对每个聊天内容信息进行排列。
7.根据权利要求4或5所述的聊天截图内容处理方法,其特征在于,所述类别属性包括消息类别、昵称类别及头像类别,所述消息类别包括消息文字子类别及消息表情子类别,所述昵称类别包括昵称文字子类别及昵称表情子类别,所述字符识别模型包括表情识别子模型及文字识别子模型,所述聊天内容信息包括Unicode编码信息及文字信息;
所述基于每个聊天内容图像块的类别属性,利用所述字符识别模型对每个聊天内容图像块进行识别,得到每个聊天内容图像块中的聊天内容信息的步骤包括:
利用所述表情识别子模型,对每个类别属性为消息表情子类别的聊天内容图像块进行识别,得到每个类别属性为消息表情子类别的聊天内容图像块的Unicode编码信息;
利用所述表情识别子模型,对每个类别属性为昵称表情子类别的聊天内容图像块进行识别,得到每个类别属性为昵称表情子类别的聊天内容图像块的Unicode编码信息;
利用所述文字识别子模型,对每个类别属性为消息文字子类别的聊天内容图像块进行识别,得到每个类别属性为消息文字子类别的聊天内容图像块的文字信息;
利用所述文字识别子模型,对每个类别属性为昵称文字子类别的聊天内容图形块进行识别,得到每个类别属性为昵称文字子类别的聊天内容图像块的文字信息。
8.根据权利要求1或所述的聊天截图内容处理方法,其特征在于,所述位置信息包括坐标信息;
所述按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列的步骤包括:
获取每个聊天内容信息的坐标信息;
根据每个聊天内容信息的坐标信息,对每个聊天内容信息进行排列。
9.根据权利要求1所述的聊天截图内容处理方法,其特征在于,所述位置信息还包括类别属性,所述类别属性包括昵称类别及头像类别;
所述按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列的步骤之后,所述方法还包括:
响应分享操作,获取待分享聊天截图,所述待分享聊天截图是还原所述待识别聊天截图中的聊天内容后得到的;
对所述待分享聊天截图中类别属性为头像类别及昵称类别的聊天内容信息进行屏蔽处理;
将进行屏蔽处理后的待分享聊天截图发送至目标对象。
10.一种聊天截图内容处理装置,所述装置包括:
获取模块,用于获取待识别聊天截图;
内容识别模块,用于将所述待识别聊天截图输入预先建立的内容识别模型中,得到所述待识别聊天截图中的至少一个聊天内容信息及每个聊天内容信息的位置信息;
排列模块,用于按照每个聊天内容信息的位置信息,将至少一个聊天内容信息进行排列,得到所述待识别聊天截图的还原聊天内容。
11.一种电子设备,其特征在于,所述电子设备包括处理器、存储器及总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器及所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行权利要求1-9任意一项所述的聊天截图内容处理方法的步骤。
12.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,所述计算机程序被执行时实现权利要求1-9任意一项所述的聊天截图内容处理方法。
CN202010506616.1A 2020-06-05 2020-06-05 聊天截图内容处理方法、装置、电子设备和可读存储介质 Active CN111666940B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010506616.1A CN111666940B (zh) 2020-06-05 2020-06-05 聊天截图内容处理方法、装置、电子设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010506616.1A CN111666940B (zh) 2020-06-05 2020-06-05 聊天截图内容处理方法、装置、电子设备和可读存储介质

Publications (2)

Publication Number Publication Date
CN111666940A true CN111666940A (zh) 2020-09-15
CN111666940B CN111666940B (zh) 2024-01-16

Family

ID=72386816

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010506616.1A Active CN111666940B (zh) 2020-06-05 2020-06-05 聊天截图内容处理方法、装置、电子设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN111666940B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113343769A (zh) * 2021-05-11 2021-09-03 广州市申迪计算机***有限公司 一种自动收取文字消息的方法和装置
CN113438526A (zh) * 2021-06-25 2021-09-24 维沃移动通信有限公司 屏幕内容分享方法、显示方法、装置、设备及存储介质
CN113905001A (zh) * 2021-09-15 2022-01-07 深圳市六度人和科技有限公司 一种自动回复方法、装置、计算机设备及可读存储介质
CN115022268A (zh) * 2022-06-24 2022-09-06 深圳市六度人和科技有限公司 一种会话识别方法及装置、可读存储介质、计算机设备
CN116522400A (zh) * 2023-07-03 2023-08-01 荣耀终端有限公司 图像处理方法和终端设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030038884A1 (en) * 2000-02-25 2003-02-27 Nobuyuki Matsushita Method and apparatus for producing communication data, method and apparatus for reproducing communication data, and program storage medium
CN104715233A (zh) * 2014-12-30 2015-06-17 上海孩子国科教设备有限公司 字符转换的方法及***
CN107948048A (zh) * 2017-10-31 2018-04-20 阿里巴巴集团控股有限公司 转发聊天信息的方法、装置和电子设备
CN109032726A (zh) * 2018-06-29 2018-12-18 北京明朝万达科技股份有限公司 聊天信息的获取方法和装置
CN109726712A (zh) * 2018-11-13 2019-05-07 平安科技(深圳)有限公司 文字识别方法、装置及存储介质、服务器
CN109919014A (zh) * 2019-01-28 2019-06-21 平安科技(深圳)有限公司 Ocr识别方法及其电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030038884A1 (en) * 2000-02-25 2003-02-27 Nobuyuki Matsushita Method and apparatus for producing communication data, method and apparatus for reproducing communication data, and program storage medium
CN104715233A (zh) * 2014-12-30 2015-06-17 上海孩子国科教设备有限公司 字符转换的方法及***
CN107948048A (zh) * 2017-10-31 2018-04-20 阿里巴巴集团控股有限公司 转发聊天信息的方法、装置和电子设备
CN109032726A (zh) * 2018-06-29 2018-12-18 北京明朝万达科技股份有限公司 聊天信息的获取方法和装置
CN109726712A (zh) * 2018-11-13 2019-05-07 平安科技(深圳)有限公司 文字识别方法、装置及存储介质、服务器
CN109919014A (zh) * 2019-01-28 2019-06-21 平安科技(深圳)有限公司 Ocr识别方法及其电子设备

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113343769A (zh) * 2021-05-11 2021-09-03 广州市申迪计算机***有限公司 一种自动收取文字消息的方法和装置
CN113438526A (zh) * 2021-06-25 2021-09-24 维沃移动通信有限公司 屏幕内容分享方法、显示方法、装置、设备及存储介质
CN113905001A (zh) * 2021-09-15 2022-01-07 深圳市六度人和科技有限公司 一种自动回复方法、装置、计算机设备及可读存储介质
CN113905001B (zh) * 2021-09-15 2023-06-06 深圳市六度人和科技有限公司 一种自动回复方法、装置、计算机设备及可读存储介质
CN115022268A (zh) * 2022-06-24 2022-09-06 深圳市六度人和科技有限公司 一种会话识别方法及装置、可读存储介质、计算机设备
CN115022268B (zh) * 2022-06-24 2023-05-12 深圳市六度人和科技有限公司 一种会话识别方法及装置、可读存储介质、计算机设备
CN116522400A (zh) * 2023-07-03 2023-08-01 荣耀终端有限公司 图像处理方法和终端设备
CN116522400B (zh) * 2023-07-03 2024-05-14 荣耀终端有限公司 图像处理方法和终端设备

Also Published As

Publication number Publication date
CN111666940B (zh) 2024-01-16

Similar Documents

Publication Publication Date Title
CN111666940B (zh) 聊天截图内容处理方法、装置、电子设备和可读存储介质
CN106446816B (zh) 人脸识别方法及装置
US20190236352A1 (en) Classification of piping and instrumental diagram information using machine-learning
US20120083294A1 (en) Integrated image detection and contextual commands
CN108734212B (zh) 一种确定分类结果的方法以及相关装置
CN109685052A (zh) 文本图像处理方法、装置、电子设备及计算机可读介质
US12033411B2 (en) Stroke based control of handwriting input
CN111460131A (zh) 公文摘要提取方法、装置、设备及计算机可读存储介质
CN109074547B (zh) 基于消息内容的文本消息排序
WO2018075191A1 (en) Techniques for scheduling language models and character recognition models for handwriting inputs
CN111753744B (zh) 用于票据图像分类的方法、装置、设备及可读存储介质
CN111104516B (zh) 一种文本分类方法、装置及电子设备
CN110597965B (zh) 文章的情感极性分析方法、装置、电子设备及存储介质
CN110490237B (zh) 数据处理方法、装置、存储介质及电子设备
CN112650858A (zh) 应急协助信息的获取方法、装置、计算机设备及介质
CN113963147A (zh) 一种基于语义分割的关键信息提取方法及***
CN114416976A (zh) 文本标注方法、装置及电子设备
CN113326363B (zh) 搜索方法及装置、预测模型训练方法及装置、电子设备
CN109190615B (zh) 形近字识别判定方法、装置、计算机设备和存储介质
CN114328816A (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
CN112579781A (zh) 文本归类方法、装置、电子设备及介质
CN115270711A (zh) 电子签名方法、电子签名装置、电子设备、存储介质
CN113742559A (zh) 关键词检测方法和装置、电子设备、存储介质
CN114492306A (zh) 语料标注方法、装置、电子设备及存储介质
CN112204506A (zh) 用于手写文本的自动语言检测的***和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant