CN111126301B - 一种图像处理方法、装置、计算机设备和存储介质 - Google Patents

一种图像处理方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN111126301B
CN111126301B CN201911362175.6A CN201911362175A CN111126301B CN 111126301 B CN111126301 B CN 111126301B CN 201911362175 A CN201911362175 A CN 201911362175A CN 111126301 B CN111126301 B CN 111126301B
Authority
CN
China
Prior art keywords
text
image
target
page
original image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911362175.6A
Other languages
English (en)
Other versions
CN111126301A (zh
Inventor
伍芷滢
刘立强
何丹
蔡忆宁
董浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201911362175.6A priority Critical patent/CN111126301B/zh
Priority to CN202210003009.2A priority patent/CN114332887A/zh
Publication of CN111126301A publication Critical patent/CN111126301A/zh
Application granted granted Critical
Publication of CN111126301B publication Critical patent/CN111126301B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44521Dynamic linking or loading; Link editing at or after load time, e.g. Java class loading
    • G06F9/44526Plug-ins; Add-ons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例公开了一种图像处理方法、装置、计算机设备和存储介质,可以显示即时通讯客户端的聊天会话页面,其中,聊天会话页面包括聊天会话用户发送的原始图像;基于针对原始图像的图像文本识别操作,显示原始图像的识别结果页面,识别结果页面包括目标图像,目标图像包括:从原始图像中识别到的文本、以及文本对应的背景内容,文本为可编辑文本、背景内容为原始图像中除文本以外的内容;当检测到针对目标图像中的文本的编辑操作时,显示文本的编辑结果,由此,在聊天会话中由聊天会话用户发送的原始图像,可以识别为文本可编辑的目标图像,用户可以直接在目标图像中进行文本编辑,得到需要的编辑结果。

Description

一种图像处理方法、装置、计算机设备和存储介质
技术领域
本申请涉及互联网技术领域,具体涉及一种图像处理方法、装置、计算机设备和存储介质。
背景技术
IM(即时通讯)应用是基于即时通讯技术实现在线聊天和交流的软件,除此之外,即时通讯应用还为聊天会话页面中用户发送的图像,提供了图像识别功能,该图像识别功能可以针对用户发送的图像进行文字识别,便于用户使用图像对应的文字识别结果。
发明内容
本发明实施例提供一种图像处理方法、装置、计算机设备和存储介质,可以将聊天会话中用户发送的原始图像识别为文本可编辑的目标图像,使得用户可以在目标图像上实现对原始图像的文本识别结果的编辑。
本发明实施例提供一种图像处理方法,该方法包括:
显示即时通讯客户端的聊天会话页面,其中,所述聊天会话页面包括聊天会话用户发送的原始图像;
基于针对所述原始图像的图像文本识别操作,显示所述原始图像的识别结果页面,所述识别结果页面包括目标图像,所述目标图像包括:从所述原始图像中识别到的文本、以及所述文本对应的背景内容,所述文本为可编辑文本、所述背景内容为所述原始图像中除所述文本以外的内容;
当检测到针对所述目标图像中的所述文本的编辑操作时,显示所述文本的编辑结果。
本实施例还提供一种图像处理装置,该装置包括:
会话页面显示单元,用于显示即时通讯客户端的聊天会话页面,其中,所述聊天会话页面包括聊天会话用户发送的原始图像;
识别结果显示单元,用于基于针对所述原始图像的图像文本识别操作,显示所述原始图像的识别结果页面,所述识别结果页面包括目标图像,所述目标图像包括:从所述原始图像中识别到的文本、以及所述文本对应的背景内容,所述文本为可编辑文本、所述背景内容为所述原始图像中除所述文本以外的内容;
编辑结果显示单元,用于当检测到针对所述目标图像中的所述文本的编辑操作时,显示所述文本的编辑结果。
本实施例还提供一种存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如本发明实施例所示的图像处理方法的步骤。
本实施例还提供一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如本发明实施例所示的图像处理方法的步骤。
本发明实施例提供了一种图像处理方法、装置、计算机设备和存储介质,可以显示即时通讯客户端的聊天会话页面,其中,聊天会话页面包括聊天会话用户发送的原始图像;基于针对原始图像的图像文本识别操作,显示原始图像的识别结果页面,识别结果页面包括目标图像,目标图像包括:从原始图像中识别到的文本、以及文本对应的背景内容,文本为可编辑文本、背景内容为原始图像中除文本以外的内容;当检测到针对目标图像中的文本的编辑操作时,显示文本的编辑结果,由此,在聊天会话中由聊天会话用户发送的原始图像,可以识别为文本可编辑的目标图像,用户可以直接在目标图像中进行文本编辑,得到类似于在原始图像中编辑文本的编辑体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本发明实施例提供的图像处理方法的场景示意图;
图1b是本发明实施例提供的图像处理方法的流程图;
图2a是本发明实施例提供的一种识别结果页面的显示示意图;
图2b是本发明实施例提供的另一种识别结果页面的显示示意图;
图2c是本发明实施例提供的又一种识别结果页面的显示示意图;
图2d是本发明实施例提供的一种图像快捷操作的显示示意图;
图2e是本发明实施例提供的一种图像快捷操作的显示示意图;
图2f是本发明实施例提供的一种图像快捷操作的显示示意图;
图2g是本发明实施例提供的一种图像快捷操作的显示示意图;
图2h是本发明实施例提供的一种图像快捷操作的显示示意图;
图3a是本发明实施例提供的目标图像的文本修改示意图;
图3b是本发明实施例提供的目标图像的部分文本分享示意图;
图3c是本发明实施例提供的目标图像的文本分享示意图;
图3d是本发明实施例提供的目标图像的图像分享示意图;
图3e是本发明实施例提供的目标图像基于翻译的图像分享示意图;
图3f是本发明实施例提供的分享设置页面的一种可选的示意图;
图3g是本发明实施例提供的分享设置页面的另一种可选的示意图;
图4a是本发明实施例提供的目标图像的文本提取结果页面的显示示意图;
图4b是本发明实施例提供的文本提取结果页面对应的对照页面的显示示意图;
图5a是本发明实施例提供的图像处理方法的一种流程示意图;
图5b是本发明实施例提供的图像处理方法的另一种流程示意图;
图5c是本发明实施例中,针对原始图像进行粗分类的一种可选的流程示意图;
图6是本发明实施例提供的一种图像处理装置的结构示意图;
图7是本发明实施例提供的计算机设备的结构示意图;
图8是本发明实施例提供的分布式***800应用于区块链***的一个可选的结构示意图;
图9是本发明实施例提供的区块结构的一个可选的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种图像处理方法、装置、计算机设备和存储介质。具体地,本发明实施例提供适用于第一计算机设备的图像处理装置(为区分,可以称为第一图像处理装置),该第一计算机设备可以为终端等设备,该终端可以为手机、平板电脑以及笔记本电脑等设备。本发明实施例还提供适用于第二计算机设备的图像处理装置(为区分,可以称为第二图像处理装置),该第二计算机设备可以为服务器等网络侧设备,该服务器可以是单台服务器,也可以是由多个服务器组成的服务器集群,可以是实体的服务器,也可是虚拟服务器。
比如,第一图像处理装置可以集成在终端中,第二图像处理装置可以集成在服务器。
本发明实施例将以第一计算机设备为终端,第二计算机设备为服务器为例,来介绍图像处理方法。
参考图1a,本发明实施例提供了图像处理***包括终端10和服务器20等;终端10与服务器20之间通过网络连接,比如,通过有线或无线网络连接等,其中,第一图像处理装置集成在终端中,比如,以客户端的形式集成在终端中。
其中,终端10,可以用于显示即时通讯客户端的聊天会话页面,其中,所述聊天会话页面包括聊天会话用户发送的原始图像;基于针对所述原始图像的图像文本识别操作,显示所述原始图像的识别结果页面,所述识别结果页面包括目标图像,所述目标图像包括:从所述原始图像中识别到的文本、以及所述文本对应的背景内容,所述文本为可编辑文本、所述背景内容为所述原始图像中除所述文本以外的内容;当检测到针对所述目标图像中的所述文本的编辑操作时,显示所述文本的编辑结果。
其中,原始图像对应的目标图像可以由服务器20生成的,终端可以在需要获取目标图像时,通过向服务器20发送携带原始图像的图像识别请求来获取目标图像;服务器20可以具体用于:接收终端发送的图像识别请求;基于图像识别请求获取终端发送的原始图像,对所述原始图像进行文本识别,得到所述原始图像的文本识别结果,其中,所述文本识别结果包括从原始图像中识别到的文本,以及识别到的文本在原始图像中的文本位置,将识别到的文本以可编辑文本的形式,替换所述原始图像中位于对应的文本位置上的文本,得到所述原始图像对应的目标图像,将所述目标图像发送给终端10。
终端10可以在接收到目标图像后,显示识别结果页面,其中,识别结果页面中包含目标图像。
在一个实施例中,服务器在获取文本识别结果后,可以将文本识别结果发送给终端,由终端基于文本识别结果以及原始图像,生成原始图像的目标图像。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
本发明实施例将从第一图像处理装置的角度进行描述,该第一图像处理装置具体可以集成在终端中。
本发明实施例提供的一种图像处理方法,该方法可以由终端的处理器执行,如图1b所示,该图像处理方法的流程可以如下:
101、显示即时通讯客户端的聊天会话页面,其中,所述聊天会话页面包括聊天会话用户发送的原始图像;
为便于理解本实施例的内容,对本实施例中出现的一些技术用语进行解释:
即时通讯:一种终端服务,允许两人或多人使用网络即时的传递文字讯息、档案、语音与视频交流。典型代表有手机QQ、微信、WhatsApp等即时通讯工具。
图片OCR:全称是Optical Character Recognition,是指电子设备用字符识别方法将图片上的形状翻译成计算机文字的过程。
本发明实施例中,即时通讯客户端的聊天会话页面,可以是单聊会话页面,也可以是群聊会话页面,或者还可以是与公众号的聊天会话页面,本实施例对此没有限制。发送原始图像的聊天会话用户可以是终端的当前用户,即当前登录终端的用户,也可以是聊天会话页面中与该当前用户进行聊天会话的其他用户,本实施例对此也没有限定。
本实施例中,原始图像可以是任意类型的图像,如JGP格式的图像,表情图像等等;原始图像中承载的内容不限,可以包括表格、文本、图片等形式的内容。原始图像的来源不限,可以是通过截屏得到的图像,也可以是通过拍摄得到的图像等等。
例如,在一个实施例中,原始图像可以是聊天会话用户针对所述聊天会话页面的截屏操作得到的截屏图像,或者原始图像可以是在聊天会话过程中,基于终端的摄像头拍摄得到的图像。
102、基于针对所述原始图像的图像文本识别操作,显示所述原始图像的识别结果页面,所述识别结果页面包括目标图像,所述目标图像包括:从所述原始图像中识别到的文本、以及所述文本对应的背景内容,所述文本为可编辑文本、所述背景内容为所述原始图像中除所述文本以外的内容。
可以理解的是,本实施例中,当原始图像中存在文本,并且从原始图像中识别到文本时,才会显示原始图像的识别结果页面,若从原始图像中识别不到文本(如原始图像中不存在文本,或者对原始图像的文本识别失败),则不会显示识别结果页面。
本实施例中,针对于可以从原始图像中识别到文本的情况而言,鉴于原始图像中的某些文本可能存在识别困难的问题,所以从原始图像中识别到的文本不一定完全与原始图像中的原始文本等同。但是可以理解的是,本实施例中目标图像中的可编辑文本和背景内容在目标图像上的分布,与原始图像中的原始文本和原始文本之外的其他内容在原始图像上的分布是类似,在一个实施例中,目标图像可以理解为在原始图像的基础上,以从原始图像中识别到的文本替换原始图像中的原始文本得到,原始图像和目标图像的一个区别在于目标图像中从原始图像上识别到的文本是可编辑的,而原始图像中的原始文本是不可编辑的。
本实施例中,图像文本识别操作,可以是特定的触控操作,如长按操作、双击操作、以及滑动操作等等。可选的,图像文本识别操作还可以是一系列操作的组合,本实施例对此没有限制。
例如,参考图2a所述的识别结果页面显示示意图,在图2a中,201所示的聊天会话页面中,终端的当前用户的好友A向当前用户发送了图像A,该图像A即为上述的原始图像,在201所示的页面中,原始图像A是以缩略状态进行展示的,用户可以针对原始图像进行图像文本识别操作,基于针对原始图像的图像文本识别操作,可以显示如202所示的识别结果页面,该识别结果页面中包含文本和插图,该文本即为从原始图像A中识别到的文本,该文本具有可编辑的特性。
可选的,本实施例中,在识别结果页面中,还可以包括文本标识,每一个文本标识对应目标图像中的一个文本区域的文本,文本标识可以是下划线,颜色标记,文本框等形式的标识,文本区域可以是以文本行或文本列(视原始图像中文本的排列方式而定)为单位划分的,参考图2a中的202,每一行文本对应有一个将该文本行包括在内的文本框,该文本框内的文本可以被作为一个整体进行编辑,如转发、复制、修改等等操作。
可选的,本实施例中,步骤“基于针对所述原始图像的图像文本识别操作,显示所述原始图像的识别结果页面”,可以包括:
基于针对所述原始图像的控件显示操作,显示图像文本识别控件;
当检测到针对所述图像文本识别控件的触发操作时,显示所述原始图像的识别结果页面。
本实施例中的控件的表现形式,可以为图标、输入框以及按钮等形式。
本实施例中,控件显示操作可以是针对原始图像的触控操作,如双击、长按等操作,该控件显示操作,还可以是通过语音的方式触发的。
可选的,基于针对原始图像的控件显示操作,除了显示图像文本识别控件,还可以显示针对原始图像的其他控件,如用于在被触发时针对原始图像进行转发的转发控件,用于在被触发时针对原始图像进行编辑的编辑控件等等。本实施例对此不做限制。
可选的,显示图像文本识别控件的方式有多种。
(1)基于对全屏显示状态下的原始图像进行操作得到;
可选的,步骤“基于针对所述原始图像的控件显示操作,显示图像文本识别控件”,可以包括:
当检测到针对所述原始图像的显示操作时,显示所述原始图像的图像放大页面,所述图像放大页面包括全屏显示状态下的原始图像;
当在所述图像放大页面检测到针对所述原始图像的控件显示触发操作时,显示图像文本识别控件。
本实施例中,当在所述图像放大页面检测到针对所述原始图像的控件显示触发操作时,除了显示图像文本识别控件,还可以显示其他控件,如用于将原始图像添加至图像收藏集合中的收藏控件等等。
其中,当在所述图像放大页面检测到针对所述原始图像的控件显示触发操作时,显示图像文本识别控件,可以包括:当在所述图像放大页面检测到针对所述原始图像的控件显示触发操作时,在图像放大页面显示子页面,所示子页面包括显示图像文本识别控件。
例如,参考图2b所示的识别结果页面显示示意图,在图2b中,201所示的聊天会话页面中,终端的当前用户的好友A向当前用户发送了图像A,该图像A即为上述的原始图像,在201所示的页面中,原始图像A是以缩略状态进行展示的,当在201所示的页面检测到针对原始图像A的显示操作如点击操作时,显示如图2b中标号203所示的图像放大页面,该图像放大页面包括全屏显示状态下的原始图像。当在图像放大页面,检测到针对原始图像的控件显示触发操作如长按操作时,显示图像文本识别控件如204所示页面中的名为“提取图中文字”的控件。当检测到针对该“提取图中文字”控件的触发操作如点击操作时,显示202所示的识别结果页面。
其中,针对原始图像的显示操作还可以双击操作、长按操作等等,本实施例对此没有限制。图像识别控件可以以小窗口的形式显示,或者如204所示,显示在子页面中,可以理解的是,该子页面中还可以显示其他功能的控件,例如用于将原始图像分享给关联用户的控件“好友”。本实施例中,关联用户为当前用户的即时通讯客户端通讯录中的用户。
在一个实施例中,当检测到针对所述图像文本识别控件的触发操作时,显示所述原始图像的识别结果页面,包括:
当检测到针对所述图像文本识别控件的触发操作时,显示所述原始图像的识别等待页面,所述识别等待页面包含所述原始图像和识别结果加载图标;
当针对所述原始图像的识别成功时,显示原始图像的识别结果页面。
(2)基于对聊天回话页面的原始图像的操作得到;
可选的,步骤“基于针对所述原始图像的控件显示操作,显示图像文本识别控件”,可以包括:
当检测到针对所述原始图像的控件显示操作时,在所述聊天会话页面显示对应于所述原始图像的功能控件列表,所述功能控件列表中包含图像文本识别控件。
本实施例中,针对所述原始图像的控件显示操作可以是针对原始图像的长按、画圈等操作,功能列表中除了包括图像文本识别控件,还可以包括其他控件,如用于对原始图像进行转发的转发控件等等。
例如,参考图2c所示的识别结果页面显示示意图,在图2c中,201所示的聊天会话页面中,终端的当前用户的好友A向当前用户发送了图像A,当在201所示的页面检测到针对原始图像A的控件显示操作如长按、双击等操作时,在201所示的聊天会话页面中显示功能控件列表2011,该功能控件列表中包含图像文本识别控件如名为“文字识别”的控件。当检测到针对功能控件列表2011中的该“文字识别”控件的触发操作如点击操作时,显示205所示的原始图像的识别等待页面,所述识别等待页面包含所述原始图像和识别结果加载图标如“提取文字中”的图标,当针对所述原始图像的识别成功时,显示202所示的识别结果页面。
在一个示例中,当检测到针对功能控件列表2011中的该“文字识别”控件的触发操作如点击操作时,可以不显示205所示的原始图像的识别等待页面,而是在针对原始图像的识别成功时,直接显示202所示的识别结果页面。
本实施例中,考虑到针对一些比较特殊的图像内容,用户倾向的操作有一定的共同性,例如,针对身份证照片,用户可能倾向的操作为提取身份证号码,针对银行卡照片,用户可能倾向的操作为银行***提取。从这些情况中得到启发,本实施例提供针对原始图像的快捷操作,便于降低用户对图像的操作时间,便于用户快速得到想要的结果。
可选的,本实施例中,图像放大页面还包括:与所述原始图像中的目标内容对应的快捷操作控件,所述快捷操作控件用于在被触发时针对所述目标内容执行所述快捷操作控件指示的操作。
上述的目标内容,可以是用户设置的,可以是由即时通讯客户端的开发人员设置的,本实施例对此没有限定。目标内容可以包括:银行卡、身份证、驾照等各种证件卡片,或者二维码、条形码等码图,或者飞机票、快递单、税款单等具有特定格式的票据。
在一个实施例中,可以对原始图像进行分类,基于原始图像的图像类型,确定与原始图像的图像类型对应的快捷操作控件,本实施例中每一种快捷操控件均可以设置有对应的目标内容。
可选的,当检测到针对所述原始图像的显示操作时,显示所述原始图像的图像放大页面,可以包括:
当检测到针对所述原始图像的显示操作时,触发对原始图像的图像类型识别,获取原始图像的图像类型;
显示所述原始图像的图像放大页面,其中,图像放大页面中包含图像类型对应的快捷操作控件,所述快捷操作控件用于在被触发时针对原始图像中的目标内容执行所述快捷操作控件指示的操作。
例如,参考图2d,假设原始图像为中国XXX银行的照片,则原始图像的图像放大页面203中,显示有银行照片对应的快捷操作控件如名为“提取号码”的号码提取控件,当检测到针对号码提取控件的触发操作时,显示原始图像的号码提取结果页面,号码提取结果页面包括号码提取结果图像,号码提取结果图像包括:从所述原始图像中识别到的号码、以及所述号码对应的背景内容,所述号码为可编辑文本、所述背景内容为所述原始图像中除所述号码以外的内容。其中,号码提取结果页面中提取到的号码外显示有号码对应的文本框,当检测到针对文本框的触发操作如点击操作时候,显示针对文本框的功能控件列表,该功能控件列表中包括如复制控件、转发控件、编辑控件等功能控件,功能控件列表中的控件被触发时,是针对被点击的文本框中的内容进行操作的,例如,在功能列表中点击复制控件,则会将文本框中的号码如6224XXXXXXXXXXXXXX添加到复制内容集合中,以便后续使用。
例如,参考图2e,假设原始图像中包括文本内容,如为英文文本,图像放大页面中显示的快捷操作控件可以是翻译控件,如图2e中的名为“翻译图中文字”控件。
又例如,参考图2f,假设原始图像中包括文本内容,图像放大页面中显示的快捷操作控件可以是图像文本识别控件,如图2f中的名为“识别图中文字”控件。
又例如,参考图2g,假设原始图像中包括二维码,图像放大页面中显示的快捷操作控件可以是二维码识别控件,如图2g中的名为“识别二维码”控件。
又例如,参考图2h,假设原始图像中包括条形码,图像放大页面中显示的快捷操作控件可以是条形码识别控件,如图2h中的名为“识别条形码”控件。
103、当检测到针对所述目标图像中的所述文本的编辑操作时,显示所述文本的编辑结果。
本实施例中,针对目标图像中文本的编辑操作,可以是现有技术中针对文本的任意类型的文本编辑操作,例如修改、复制、转发、剪切等等编辑操作。
可选的,步骤“当检测到针对所述目标图像中的所述文本的编辑操作时,显示所述文本的编辑结果”,可以包括:
当检测到针对所述文本中目标文本的修改触发操作时,显示文本输入控件;
基于针对所述文本输入控件的文本输入操作,确定所述目标文本对应的修改后文本;
当检测到针对所述文本输入控件的文本输入结束操作时,显示修改后的目标图像,修改后的目标图像中所述目标文本被所述修改后文本替换。
本实施例中,目标文本可以目标图像中的全部可编辑文本,或者可以基于文本选择操作得到。
可选的,步骤“当检测到针对所述文本中目标文本的修改触发操作时,显示文本输入控件”,包括:基于针对目标图像中文本的选择操作,确定所述目标图像中被选中的目标文本,显示文本输入控件。
在一个实施例中,每一行文本周围显示有一个文本框,针对目标图像的选择操作,可以是针对文本框的选择操作,被选中的文本框中的文本即为目标文本。
在一个实施例中,文本输入控件包括输入框和输入子控件,输入框中显示有被选中的目标文本,可以基于针对输入子控件的文本输入操作,修改输入框中的目标文本,当检测到针对所述文本输入控件的文本输入结束操作时,将输入框中的文本作为目标文本的修改后文本,以修改后文本替换目标图像中的目标文本,显示替换后的目标图像。
其中,输入子控件可以是键盘等控件。
参考图3a,当检测到针对图3a的301页面中文本框的触发操作时,显示编辑功能控件列表,所述编辑功能控件列表包含复制、转发、编辑等控件,当检测到针对“编辑”控件的触发操作时,显示302所示的图像编辑页面,其中,触发操作对应的文本框中的文本为目标文本,图像编辑页面302包括文本输入控件,文本输入控件包括输入框3021和输入子控件3022,其中,输入框中显示有目标文本“He adds coal for the eyes and buttons.In”,基于针对输入子控件的文本输入操作,确定所述目标文本对应的修改后文本,当检测到针对所述文本输入控件的文本输入结束操作时,以输入框中的文本“He adds tone for theeyes and buttons.In”作为修改后文本,显示修改后的目标图像(如304所示),修改后的目标图像中原本的“He adds coal for the eyes and buttons.In”被“He adds tone forthe eyes and buttons.In”替换。
例如,参考图3b,选择的文本框可以不止一个,当检测到针对图3a的301页面中文本框的触发操作时,显示编辑功能控件列表,其中,触发操作对应的文本框可以进行标识,例如以灰色文本框表示触发操作对应的文本框,即用户选择的文本框,所述编辑控件列表包含复制、转发、编辑等控件,当检测到针对“转发”控件的触发操作时,显示305所示的转发目的选择页面,基于针对转发目的选择页面的选择操作,显示转发用户选择页面,当检测到针对转发用户选择页面的用户选择操作时,将用户选择的文本框中文本转发给用户选择操作对应的用户。例如将两个灰色文本框中的内容转发给用户选择操作对应的好友B(参考图3b中的307标识的页面)。
本实施例中,可以对目标图像中的内容进行分享,该分享可以是纯文本分享,或图片形式的分享,纯文本形式的分享包括全部文本分享和部分文本分享。
可选的,本实施例中,本实施例的方法还包括:
当检测到针对所述目标图像的分享触发操作时,显示文本分享控件和图像分享控件;
当检测到针对所述文本分享控件的触发操作时,对所述目标图像中的文本进行分享;
当检测到针对所述图像分享控件的触发操作时,对所述目标图像进行分享。
其中,对文本的分享可以是部分文本的分享,也可以是全部文本的分享,可选的,识别结果页面还包括分享触发控件,步骤“当检测到针对所述目标图像的分享触发操作时,显示文本分享控件和图像分享控件”,可以包括:当检测到针对分享触发控件的触发操作时,显示文本分享控件和图像分享控件。
例如,参考图3c,301所示的识别结果页面中包括分享触发控件如名为“转发”的控件,当检测到针对分享触发控件的触发操作,如点击操作时,显示308所示的分享选择页面,所述分享选择页面中包括文本分享控件如“文字”控件和图像分享控件如“图片”控件,当检测到针对“文字”控件的触发操作时,对目标图像中的可编辑文本中的文本内容进行分享,例如参考图3c中的309,将目标图像中的文本内容分享给好友D,可以理解的是,对文本的分享,不仅限于将文本内容分享给好友,还可以将文本内容分享至用户群或者分享至朋友圈等等。
例如,参考图3d,301所示的识别结果页面中包括分享触发控件如名为“转发”的控件,当检测到针对分享触发控件的触发操作,如点击操作时,显示310所示的分享选择页面,所述分享选择页面中包括文本分享控件如“文字”控件和图像分享控件如“图片”控件,当检测到针对“图片”控件的触发操作时,对目标图像本身进行分享,例如参考图3d,当检测到针对“图片”控件的触发操作时,基于针对目标图像的分享对象选择操作,将目标图像分享给被选择的分享对象,例如好友D,但是可以理解的是,分享对象并不仅限于用户,还可以是即时通讯客户端的消息集成页面,如朋友圈页面等等。
可选的,本实施例中,本实施例的方法还包括:当检测到针对所述目标图像的文本翻译操作时,显示所述目标图像对应的翻译结果页面,所述翻译结果页面包含所述目标图像对应的翻译图像,其中,所述翻译图像包括:所述目标图像中的所述文本对应的翻译结果,以及所述目标图像中所述文本对应的背景内容。
其中,文本翻译操作可以是某些特设的触控操作,如长按,双击,三连击等触控操作,文本翻译操作还可以通过对控件的触发操作实现。可选的,一个实施例中,识别结果页面中包括翻译控件,例如图3e的识别结果页面301中显示有翻译控件如名为“翻译”的控件。
步骤“当检测到针对所述目标图像的文本翻译操作时,显示所述目标图像对应的翻译结果页面”,可以包括:
当检测到针对目标图像中的翻译控件的触发操作时,显示所述目标图像对应的翻译结果页面。
例如,参考图3e,当检测到针对301所示识别结果页面中“翻译”控件的触发操作如点击操作时,显示311所示的翻译结果页面。该翻译结果页面中,目标图像中的可编辑文本,被对应的翻译结果替换。
本实施例中,还提供了对目标图像的分享方案,可选的,本实施例的方法还包括:
当检测到针对所述目标图像的图像分享操作时,显示所述目标图像的分享设置页面;
基于针对所述分享设置页面的分享样式选择操作,确定目标图像的目标分享样式;
基于所述目标分享样式和所述目标图像确定待分享图像;
对所述待分享图像进行分享。
其中,识别结果页面可以包括分享触发控件,步骤“当检测到针对所述目标图像的图像分享操作时,显示所述目标图像的分享设置页面”,可以包括:
当检测到针对分享触发控件的触发操作时,显示第二文本分享控件和第二图像分享控件;
当检测到针对第二图像分享控件的触发操作时,显示分享设置页面,本实施例中,分享设置页面不仅可以用于选择目标图像的分享样式,还可以用于选择目标图像的分享对象,选择分享对象的过程可以参考前面的叙述,在此不进行赘述。
在一个实施例中,可以是针对翻译结果页面的操作,触发对分享设置页面的显示。可选的,翻译结果页面上也可以包括翻译控件以及其他功能控件,如转发控件等等。
可选的,“当检测到针对所述目标图像的图像分享操作时,显示所述目标图像的分享设置页面”,可以包括:
当检测到针对翻译结果页面上的分享触发控件的触发操作时,显示第二文本分享控件和第二图像分享控件;
当检测到针对第二图像分享控件的触发操作时,显示分享设置页面,本实施例中,分享设置页面不仅可以用于选择目标图像的分享样式,还可以用于选择目标图像的分享对象,选择分享对象的过程可以参考前面的叙述,在此不进行赘述。
例如,还是参考图3e,当检测到针对301所示识别结果页面中“翻译”控件的触发操作如点击操作时,显示311所示的翻译结果页面。该翻译结果页面中,目标图像中的可编辑文本,被替换为了对应的翻译结果。翻译结果页面中显示有分享触发控件如名为“转发”的控件,当检测到针对“转发”控件的触发操作时,显示第二文本分享控件如名为“文字”的控件和第二图像分享控件如名为“图片”的控件,其中,第二文本分享控件和第二图像分享控件可以是在翻译结果页面上显示的,还可以是在识别结果页面上显示的(参考图3e),本实施例对此没有限制。当检测到针对“图片”控件的触发操作时,显示313所示的分享设置页面,基于针对分享设置页面的分享样式选择操作,确定目标图像的目标分享样式,基于所述目标分享样式和所述目标图像确定待分享图像;对所述待分享图像进行分享
本实施例中的分享样式包括三种:分享原始图像的识别结果,分享翻译结果,以及分享翻译对比结果。
可选的,若所述目标分享样式为分享识别结果,所述基于所述目标分享样式和所述目标图像确定待分享图像包括:将所述目标图像确定为待分享图像。
例如,在图3e所示的分享设置页面313中,若选中的目标分享样式为“识别结果”,则待分享图像即为目标图像。
可选的,分享设置页面中包括各分享样式下的待分享图像的预览图像。基于针对所述分享设置页面的分享样式选择操作,确定目标图像的目标分享样式,可以包括:基于针对分享设置页面中预览图像的选择操作,确定待分享图像的目标分享样式。
可选的,若所述目标分享样式为分享翻译结果,所述基于所述目标分享样式和所述目标图像确定待分享图像包括:将所述目标图像对应的翻译图像确定为待分享图像。
该实施例中,若在基于目标分享样式和所述目标图像确定待分享图像前,没有检测到针对目标图像的文本翻译操作。则可以先对目标图像进行文本翻译得到目标图像的翻译图像。可选的,基于所述目标分享样式和所述目标图像确定待分享图像包括:
获取目标图像的翻译图像,将目标图像对应的翻译图像确定为待分享图像。
例如,在图3f所示的分享设置页面中,若选中的目标分享样式为“翻译结果”,则待分享图像即为目标图像的翻译图像。
可选的,若所述目标分享样式为分享翻译对比结果,所述基于所述目标分享样式和所述目标图像确定待分享图像包括:
获取所述目标图像的翻译对比图像,所述翻译对比图像中包含所述目标图像中的内容,以及所述目标图像的翻译图像中的内容。
该示例中,翻译对比图像可以是对目标图像和目标图像的翻译图像进行拼接得到。该拼接可以由终端完成,也可以由终端将拼接指令发送给服务器,由服务器完成对目标图像和翻译图像的拼接。
例如,在图3g所示的分享设置页面中,若选中的目标分享样式为“翻译对比”,则待分享图像为翻译对比图像。
本实施例中,还可以从目标图像中提取可编辑文本进行显示和编辑,可选的,本实施例的图像处理方法,还可以包括:
当检测到针对所述识别结果页面中所述目标图像的文本提取操作时,显示所述目标图像的文本提取结果页面,其中,所述文本提取结果页面包括所述目标图像中的可编辑文本。
也即,文本提取结果页面中的文本来源于从原始图像中识别到的文本。
其中,文本提取操作可以是特定的触控操作,如双击、长按等触控操作,另外,文本提取操作还可以通过对控件的触发操作实现。
例如,参考图4a,识别结果页面401中包括文本提取控件如名为“提取部分”的控件,当检测到针对该控件的触发操作时,显示目标图像的文本提取结果页面402。
其中,识别结果页面401中的文本是可以编辑的,若用户选择了识别结果页面401中的一部分文本框,则被选择的文本框中的文本,为文本提取控件对应的提取文本。可选的,步骤“当检测到针对所述识别结果页面中所述目标图像的文本提取操作时,显示所述目标图像的文本提取结果页面”,可以包括:
基于针对所述目标图像中文本的选择操作,确定所述目标图像中的已选择文本;
当检测到针对识别结果页面中文本提取控件的触发操作时,显示目标图像的文本提取结果页面,其中,文本提取结果页面包括已选择文本。
由此,可以实现对目标图像中文本的部分提取。
可选的,本实施例中,步骤“显示所述目标图像的文本提取结果页面”后,还可以包括:
当检测到针对所述文本提取结果页面的对照显示操作时,显示对照页面,所述对照页面包括第一显示区域和第二显示区域,所述第一显示区域用于显示所述目标图像,所述第二显示区域用于显示所述目标图像的文本提取结果。
可选的,对照显示操作以是特定的触控操作,也可以通过对控件的操作实现。
可选的,所述文本提取结果页面中还包括对照显示控件,当检测到针对所述文本提取结果页面的对照显示操作时,显示对照页面,可以包括:当检测到针对对照显示控件的触发操作时,显示对照页面。
例如,参考图4b,402所示的文本提取结果页面中包含对照显示控件如名为“对照控件”的控件,当检测到针对“对照控件”的触发操作时,显示对照页面403,对照页面403包括两个显示区域,第一显示区域4031,第二显示区域4032,所述第一显示区域用于显示所述目标图像,所述第二显示区域用于显示所述目标图像的文本提取结果。
在一个实施例中,第一显示区域显示的可以不是目标图像,而是原始图像,该原始图像和目标图像的文本提取结果对照显示,可以为文本提取结果提供原图对照功能,便于检查从原始图像中识别到的文本是否有误。
可选的,当第一显示区域显示的是目标图像时,本实施例的方法还包括:
当检测到针对所述第一显示区域中的所述目标图像的文本选择操作时,确定所述目标图像中所述文本选择操作对应的已选择文本;
基于所述已选择文本调整所述第二显示区域显示的文本提取结果,其中,在调整后,所述第二显示区域显示的文本提取结果中包含所述已选择文本对应的文本提取结果。
例如,参考图4b,在403所示的对照页面,当检测到针对第一显示区域中“He putsa big snowball on top.He adds a”这一行文本的文本选择操作时,将该行文本作为已选择文本,基于所述已选择文本调整所述第二显示区域显示的文本提取结果,调整后的第二显示区域可参考404,相较于403,在404中的第二显示区域中,“He puts a big snowballon top.He adds a”的显示位置位于第二显示区域的上部,更为明显。
在本实施例中,第二显示区域中的文本提取结果是可编辑的,当在第二显示区域检测到输入触发操作时,在第二显示区域显示第二文本输入控件。其中,输入触发操作了可以是点击操作,在用户点击的位置,可以显示如图4b中A指示的光标,便于提示用户文本输入位置。在显示文本输入控件时,本实施例可以增大第二显示区域的面积,如提升第二显示区域的上边界线的位置。
可选的,当第一显示区域显示的是原始图像时,本实施例的方法还包括:
当检测到针对所述第一显示区域中的所述原始图像的文本选择操作时,确定所述原始图像中所述文本选择操作对应的已选择文本;
基于所述已选择文本调整所述第二显示区域显示的文本提取结果,其中,在调整后,所述第二显示区域显示的文本提取结果中包含所述已选择文本对应的文本提取结果。
本实施例中,原始图像中的文本,可以具有位置信息,例如,原始图像中的文本也可以通过文本框等进行标识,将文本框的位置信息作为被文本框标识的文本的位置信息。该文本框的位置信息可以基于目标图像中对应的文本框的位置信息确定。
可选的,本实施例中,步骤“基于针对所述原始图像的图像文本识别操作,显示所述原始图像的识别结果页面”,可以包括:
基于针对所述原始图像的图像文本识别操作,触发获取所述原始图像的文本识别结果,其中,所述文本识别结果包含从所述原始图像中识别到的文本,以及所述文本在所述原始图像中的文本位置;
将识别到的文本以可编辑文本的形式,替换所述原始图像中位于对应的文本位置上的原始文本,得到所述原始图像对应的目标图像;
显示所述原始图像的识别结果页面,所述识别结果页面包含所述目标图像。
其中,文本识别结果和目标图像可以是由终端独立生成的,或者,文本识别结果可以是由服务器基于对原始图像的识别得到的,目标图像可以是由终端基于原始图像和文本识别结果生成的,或者文本识别结果和目标图像可以是均由服务器生成的,本实施例对此没有限制。
可选的,本实施例中,可以通过OCR技术对原始图像进行识别得到文本识别结果。
可选的,步骤“将识别到的文本以可编辑文本的形式,替换所述原始图像中位于对应的文本位置上的文本,得到所述原始图像对应的目标图像”,包括:
基于文本识别结果中文本的文本位置,对识别到的文本进行分析得到至少一个文本块;
对文本块进行排序,对文本块内的文本进行排版;
以排版后的文本块,替换所述原始图像中对应的文本内容,得到目标图像。
其中,可以先基于文本识别结果中文本的位置信息,将原始图像中的文本移除,并对原始图像进行修改,以移除的文本附近的背景内容填充被移除的文本,得到背景图像,将排版后的文本块,以可编辑文本的形式绘制到背景图像中,得到目标图像。
采用本实施例的图像处理方法,可以显示即时通讯客户端的聊天会话页面,其中,聊天会话页面包括聊天会话用户发送的原始图像;基于针对原始图像的图像文本识别操作,显示原始图像的识别结果页面,识别结果页面包括目标图像,目标图像包括:从原始图像中识别到的文本、以及文本对应的背景内容,文本为可编辑文本、背景内容为原始图像中除文本以外的内容;当检测到针对目标图像中的文本的编辑操作时,显示文本的编辑结果,由此,在聊天会话中由聊天会话用户发送的原始图像,可以识别为文本可编辑的目标图像,用户可以直接在目标图像中进行文本编辑,得到类似于在原始图像中编辑文本的编辑体验。
根据上面实施例所描述的方法,以下将举例作进一步详细说明。
在本实施例中,将以该第一图像处理装置具体集成终端、第二图像处理装置具体集成在服务器为例进行说明。
如图5a所示,一种图像处理方法,具体流程如下:
501、终端显示即时通讯客户端的聊天会话页面,其中,所述聊天会话页面包括聊天会话用户发送的原始图像。
502、终端基于针对所述原始图像的图像文本识别操作,向服务器发送图像识别请求,其中,所述图像识别请求可以携带有原始图像;
其中,参考图5b所示的图像处理方法的可选的时序示意图,用户可以通过长按即时通讯客户端的聊天会话页面中的原始图像,将原始图像发送给服务器,以触发对原始图像的识别。
本实施例中,服务器可以由很多组件构成,如参考图5b,包括但不限于:云识别后台组件、OCR识别服务组件、云识别排版组件、绘制组件以及图片生成组件。这些组件可以集成于一个服务器中,也可以集成到不同的服务器中,本实施例对此没有限制。
可选的,终端可以通过大数据通道向服务器的云识别后台组件发送图像识别请求。
云识别后台集成了众多的分类、识别服务,并且支持配置不同的识别类型。该分类包括对图片的分类,该识别类型包括号码识别类型、文本识别类型、码图识别类型等等。
针对所述原始图像的图像文本识别操作,则可以认为终端侧主动选择了文本识别类型,或者,终端在发送图像识别请求时,可以直接将文本识别类型写入图像识别请求中,在接收到图像识别请求后,云识别后台会启动云识别的OCR服务提取原始图像中文字。
503、服务器接收终端发送的图像识别请求,基于图像识别请求获取原始图像;
504、服务器针对原始图像进行文本识别,获取原始的文本识别结果,其中,所述文本识别结果包含从所述原始图像中识别到的文本,以及所述文本在所述原始图像中的文本位置;
服务器的云识别后台接收图像识别请求后,发现针对原始图像的识别类型为文本识别类型,调用OCR服务组件,对原始图像进行OCR识别,接收OCR服务组件的识别结果,本实施例中OCR服务组件,可以对于是图像中的文本进行分割,单独识别每个分割出来的文本,得到的文本识别结果中可以包含识别到的文本以及每个文本的文本位置和置信度,其中,每个文本的文本位置可以通过坐标表示。
505、服务器将识别到的文本以可编辑文本的形式,替换所述原始图像中位于对应的文本位置上的文本,得到所述原始图像对应的目标图像;
其中,服务器可以基于识别到的文本的文本位置,确定原始图像中该文本位置对应的原始内容,将识别后的文本以可编辑文本的形式替换该文本位置上的原始内容,得到目标图像。
但是这种直接替换的方式,可能存在替换后的文本排版不规范,不利于阅读的问题,本实施例中,可以先对OCR识别文本进行排版,再进行上述的替换,得到目标图像。
可选的,步骤“服务器将识别到的文本以可编辑文本的形式,替换所述原始图像中位于对应的文本位置上的文本,得到所述原始图像对应的目标图像”,可以包括:
服务器基于文本识别结果中文本的位置信息,对识别到的文本进行分析得到至少一个文本块;
服务器对文本块进行排序,对文本块内的文本进行排版;
服务器以排版后的文本块,替换所述原始图像中对应的文本内容,得到目标图像。
其中,上述的文本识别结果可以是OCR识别结果,服务器的云识别后台接收到OCR识别结果后,可调用云识别排版组件,对OCR识别结果进行排版。
例如,服务器的云识别后台调用云识别排版组件基于OCR识别结果中文本的文本位置,对OCR识别结果中的文本进行分析得到至少一个文本块,对文本块进行排序,对文本块内的文本进行排版。
其中,云识别排版组件可以先通过分类算法判断原始图像是否包含预设文档,若原始图像不包含预设文档,则对原始图像进行简单排版,例如原始图像中只识别到少量的文本如一行文本,则认为原始图像中不包含预设文档,对原始图像进行简单排版即可。
若原始图像包含预设文档,例如,原始图像中识别到的文本数量较多,则认为原始图像中包含预设文档,云识别排版组件可以采用版面分析算法进行排版。
本实施例中,云识别排版组件采用的版面分析算法可以是优化后的Docstrum算法,该算法使用OCR提取的文本的文本位置(例如文本的文字框的四个角的坐标)作为输入,解决了传统的Docstrum算法的耗时、阈值难控制等问题,最后将OCR提取的文本框合并为文本块。
其中,云识别排版组件可以基于OCR提取的文本的文本位置,先确定文本行,再基于文本行的质心,将文本行分成至少一个文本块。在划分到文本块后,云识别排版组件可以对文本块进行排序,例如可以通过对文本块进行垂直方向和水平方向进行递归的切割,构建二叉树,基于二叉树,确定文本块的顺序,使其符合用户的阅读顺序,符合阅读逻辑。
之后,云识别排版组件可以对文本块中的文本进行排版,使得文本块中的文本符合用户的阅读逻辑。
其中,云识别排版组件还可以对原始图像进行分割,获取原始图像中除了文本之外的其他内容的位置信息,例如,获取原始图像中插图的图像位置,服务器可以基于文本块中文本的文本位置,以及对文本块的排序和块内排版,获取排序后的文本块的位置信息,基于该位置信息以及原始图像中背景图像如插图的位置信息,将文本块绘制于原始图像中,得到目标图像。
在一个实施例中,服务器获取排序后的文本块的位置信息,以及原始图像的信息,如原始图像的背景内容的位置信息等,后,可以将文本块的位置信息和原始图像的信息发送给终端。
终端接收后,可以将文本块、文本块的位置信息和原始图像的信息发送给服务器的绘制组件,绘制组件基于文本块、文本块的位置信息和原始图像的信息,在原始图像中绘制文本块,得到目标图像,其中目标图像中被绘制出来的文本块中的文本为可编辑文本。可选的,绘制组件绘制文本的同时,还可以绘制文本的文本框,其中,每一行文本可以对应绘制一个文本框,该文本框可用于响应用户的触控操作,例如,将用户点击的文本框内的文本作为已选择文本,针对该已选择文本,可以进行如复制、转发等编辑操作等等。
一个实施例中,绘制目标图像的过程可以由终端执行。
506、服务器将目标图像发送给终端。
507、终端接收目标图像,显示识别结果页面,其中,识别结果页面中包含目标图像。
508、当终端检测到针对目标图像的文本翻译操作时,显示所述目标图像对应的翻译结果页面,所述翻译结果页面包含所述目标图像对应的翻译图像,其中,所述翻译图像包括:所述目标图像中的所述文本对应的翻译结果,以及所述目标图像中所述文本对应的背景内容。
其中,对目标图像的可编辑文本的翻译,以及生成翻译图像,可以是终端执行的,也可以是服务器执行的。
其中,翻译结果页面可以包括分享控件。
本实施例的方法,还可以包括:
当终端在翻译结果页面检测到针对分享控件的分享操作时,显示所述目标图像的分享设置页面;
终端基于针对所述分享设置页面的分享样式选择操作,确定目标图像的目标分享样式;
终端基于所述目标分享样式和所述目标图像确定待分享图像;
终端对所述待分享图像进行分享。
例如,参考图5b当用户点击分享图像,终端可以向图片生成组件发送图像分享请求,触发图片生成组件生成待分享图像。
其中,当所述目标分享样式为分享翻译结果时,待分享图像为所述目标图像对应的翻译图像确定。终端可以向图片生成组件请求翻译图像。
当所述目标分享样式为分享翻译对比结果,带分享图像为所述翻译对比图像,该翻译对比图像中包含所述目标图像中的内容,以及所述目标图像的翻译图像中的内容。
可选的,终端可以向服务器的图片生成组件发送翻译对比图像的图像分享请求,触发图片生成组件对目标图像和翻译图像进行合成,例如进行左右拼接得到翻译对比图像。
本实施例中,还为图像提供了快捷操作,实现快捷操作的流程图参考图5c所示,当终端检测到用户查看图像,例如检测到针对原始图像的显示操作如点击操作时,终端向服务器发送原始图像,触发服务器启动云识别后台,通过大数据通道调用云端识别服务下的粗分类服务,云识别后台中为不同场景下的图像配置了不同的识别类型,例如,针对身份证照片,配置了号码识别类型,针对具有二维码的图像,配置了码图识别类型等等。
通过粗分类服务,识别了图片对应的识别类型后,将识别类型返回给客户端,由客户端显示对应于该识别类型的图像快捷控件。
由此,本实施例可以为用户提供文本可编辑的目标图像,给用户一种类似于在原始图像中直接修改文本的体验,而且针对目标图像的文本处理可以是局部文本处理,用户可以自由地选择需要处理的文本,进行诸如翻译、划重点、复制等操作,有利于提升用户的图像处理体验。
为了更好地实施以上方法,相应的,还提供一种图像处理装置,其中,该图像处理装置可以集成在终端中,或者集成在服务器中,或者集成在终端和服务器中。
例如,如图6,所示,该图像处理装置可以包括
会话页面显示单元601,用于显示即时通讯客户端的聊天会话页面,其中,所述聊天会话页面包括聊天会话用户发送的原始图像;
识别结果显示单元602,用于基于针对所述原始图像的图像文本识别操作,显示所述原始图像的识别结果页面,所述识别结果页面包括目标图像,所述目标图像包括:从所述原始图像中识别到的文本、以及所述文本对应的背景内容,所述文本为可编辑文本、所述背景内容为所述原始图像中除所述文本以外的内容;
编辑结果显示单元603,用于当检测到针对所述目标图像中的所述文本的编辑操作时,显示所述文本的编辑结果。
可选的,识别结果显示单元,用于基于针对所述原始图像的控件显示操作,显示图像文本识别控件;当检测到针对所述图像文本识别控件的触发操作时,显示所述原始图像的识别结果页面。
可选的,识别结果显示单元,用于当检测到针对所述原始图像的显示操作时,显示所述原始图像的图像放大页面,所述图像放大页面包括全屏显示状态下的原始图像;当在所述图像放大页面检测到针对所述原始图像的控件显示触发操作时,显示图像文本识别控件。
可选的,所述图像放大页面还包括:与所述原始图像中的目标内容对应的快捷操作控件,所述快捷操作控件用于在被触发时针对所述目标内容执行所述快捷操作控件指示的操作。
可选的,编辑结果显示单元,用于当检测到针对所述文本中目标文本的修改触发操作时,显示文本输入控件;基于针对所述文本输入控件的文本输入操作,确定所述目标文本对应的修改后文本;当检测到针对所述文本输入控件的文本输入结束操作时,显示修改后的目标图像,修改后的目标图像中所述目标文本被所述修改后文本替换。
可选的,装置还包括:
第一分享触发单元,用于当检测到针对所述目标图像的分享触发操作时,显示文本分享控件和图像分享控件;
第一分享单元,用于当检测到针对所述文本分享控件的触发操作时,对所述目标图像中的文本进行分享;
第二分享单元,用于当检测到针对所述图像分享控件的触发操作时,对所述目标图像进行分享。
可选的,装置还包括:翻译结果显示单元,用于当检测到针对所述目标图像的文本翻译操作时,显示所述目标图像对应的翻译结果页面,所述翻译结果页面包含所述目标图像对应的翻译图像,其中,所述翻译图像包括:所述目标图像中的所述文本对应的翻译结果,以及所述目标图像中所述文本对应的背景内容。
可选的,装置还包括:
第二分享触发单元,用于当检测到针对所述目标图像的图像分享操作时,显示所述目标图像的分享设置页面;
分享设置单元,用于基于针对所述分享设置页面的分享样式选择操作,确定目标图像的目标分享样式;
确定单元,用于基于所述目标分享样式和所述目标图像确定待分享图像;
第三分享单元,用于对所述待分享图像进行分享。
可选的,若所述目标分享样式为分享识别结果,确定单元,用于将所述目标图像确定为待分享图像;
可选的,若所述目标分享样式为分享翻译结果,确定单元,用于将所述目标图像对应的翻译图像确定为待分享图像;
可选的,若所述目标分享样式为分享翻译对比结果,确定单元,用于获取所述目标图像的翻译对比图像,所述翻译对比图像中包含所述目标图像中的内容,以及所述目标图像的翻译图像中的内容。
可选的,装置还包括:提取单元,用于当检测到针对所述识别结果页面中所述目标图像的文本提取操作时,显示所述目标图像的文本提取结果页面,其中,所述文本提取结果页面包括所述目标图像中的可编辑文本。
可选的,装置还包括对照显示单元,用于在提取单元显示所述目标图像的文本提取结果页面后,当检测到针对所述文本提取结果页面的对照显示操作时,显示对照页面,所述对照页面包括第一显示区域和第二显示区域,所述第一显示区域用于显示所述目标图像,所述第二显示区域用于显示所述目标图像的文本提取结果。
可选的,装置还包括:文本选择单元,用于当检测到针对所述第一显示区域中的所述目标图像的文本选择操作时,确定所述目标图像中所述文本选择操作对应的已选择文本;
定位单元,用于基于所述已选择文本调整所述第二显示区域显示的文本提取结果,其中,在调整后,所述第二显示区域显示的文本提取结果中包含所述已选择文本对应的文本提取结果。
可选的,识别结果显示单元,包括:
触发子单元,用于基于针对所述原始图像的图像文本识别操作,触发获取所述原始图像的文本识别结果,其中,所述文本识别结果包含从所述原始图像中识别到的文本,以及所述文本在所述原始图像中的文本位置;
替换子单元,用于将识别到的文本以可编辑文本的形式,替换所述原始图像中位于对应的文本位置上的文本,得到所述原始图像对应的目标图像;
显示子单元,用于显示所述原始图像的识别结果页面,所述识别结果页面包含所述目标图像。
此外,本发明实施例还提供一种计算机设备,该计算机设备可以为终端或者服务器,如图7所示,其示出了本发明实施例所涉及的计算机设备的结构示意图,具体来讲:
该计算机设备可以包括一个或者一个以上处理核心的处理器701、一个或一个以上计算机可读存储介质的存储器702、电源703和输入单元704等部件。本领域技术人员可以理解,图7中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器701是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器702内的软件程序和/或模块,以及调用存储在存储器702内的数据,执行计算机设备的各种功能和处理数据,从而对计算机设备进行整体监控。可选的,处理器701可包括一个或多个处理核心;优选的,处理器701可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器701中。
存储器702可用于存储软件程序以及模块,处理器701通过运行存储在存储器702的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器702可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器702还可以包括存储器控制器,以提供处理器701对存储器702的访问。
计算机设备还包括给各个部件供电的电源703,优选的,电源703可以通过电源管理***与处理器701逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源703还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该计算机设备还可包括输入单元704,该输入单元704可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,计算机设备中的处理器701会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器702中,并由处理器701来运行存储在存储器702中的应用程序,从而实现各种功能,如下:
显示即时通讯客户端的聊天会话页面,其中,所述聊天会话页面包括聊天会话用户发送的原始图像;
基于针对所述原始图像的图像文本识别操作,显示所述原始图像的识别结果页面,所述识别结果页面包括目标图像,所述目标图像包括:从所述原始图像中识别到的文本、以及所述文本对应的背景内容,所述文本为可编辑文本、所述背景内容为所述原始图像中除所述文本以外的内容;
当检测到针对所述目标图像中的所述文本的编辑操作时,显示所述文本的编辑结果。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本发明实施例还提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的图像处理方法。
本发明实施例涉及的***可以是由客户端、多个节点(接入网络中的任意形式的计算机设备,如服务器、终端)通过网络通信的形式连接形成的分布式***。
以分布式***为区块链***为例,参见图8,图8是本发明实施例提供的分布式***800应用于区块链***的一个可选的结构示意图,由多个节点801(接入网络中的任意形式的计算设备,如服务器、用户终端)和客户端802形成,节点之间形成组成的点对点(P2P,Peer To Peer)网络,P2P协议是一个运行在传输控制协议(TCP,Transmission ControlProtocol)协议之上的应用层协议。在分布式***中,任何机器如服务器、终端都可以加入而成为节点,节点包括硬件层、中间层、操作***层和应用层,其中,原始图像、目标图像、以及目标图像的翻译图像等等可以存储于区块链***的共享账本中。
参见图8示出的区块链***中各节点的功能,涉及的功能包括:
1)路由,节点具有的基本功能,用于支持节点之间的通信。
节点除具有路由功能外,还可以具有以下功能:
2)应用,用于部署在区块链中,根据实际业务需求而实现特定业务,记录实现功能相关的数据形成记录数据,在记录数据中携带数字签名以表示任务数据的来源,将记录数据发送到区块链***中的其他节点,供其他节点在验证记录数据来源以及完整性成功时,将记录数据添加到临时区块中。
例如,应用实现的业务包括:
2.1)钱包,用于提供进行电子货币的交易的功能,包括发起交易(即,将当前交易的交易记录发送给区块链***中的其他节点,其他节点验证成功后,作为承认交易有效的响应,将交易的记录数据存入区块链的临时区块中;当然,钱包还支持查询电子货币地址中剩余的电子货币;
2.2)共享账本,用于提供账目数据的存储、查询和修改等操作的功能,将对账目数据的操作的记录数据发送到区块链***中的其他节点,其他节点验证有效后,作为承认账目数据有效的响应,将记录数据存入临时区块中,还可以向发起操作的节点发送确认。
2.3)智能合约,计算机化的协议,可以执行某个合约的条款,通过部署在共享账本上的用于在满足一定条件时而执行的代码实现,根据实际的业务需求代码用于完成自动化的交易,例如查询买家所购买商品的物流状态,在买家签收货物后将买家的电子货币转移到商户的地址;当然,智能合约不仅限于执行用于交易的合约,还可以执行对接收的信息进行处理的合约。
3)区块链,包括一系列按照产生的先后时间顺序相互接续的区块(Block),新区块一旦加入到区块链中就不会再被移除,区块中记录了区块链***中节点提交的记录数据。
本实施例中当前用户和/或关联用户浏览过的内容,和/或,当前用户和/或关联用户浏览过的内容的记录数据(如内容的描述信息和链接信息等)可以通过节点被存储在区域链的共享账本中,计算机设备(例如终端或服务器)可以基于共享账本存储的数据获取当前用户和/或关联用户浏览过的内容。
参见图9,图9是本发明实施例提供的区块结构(Block Structure)一个可选的示意图,每个区块中包括本区块存储交易记录的哈希值(本区块的哈希值)、以及前一区块的哈希值,各区块通过哈希值连接形成区块链。另外,区块中还可以包括有区块生成时的时间戳等信息。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了相关的信息,用于验证其信息的有效性(防伪)和生成下一个区块。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本发明实施例所提供的图像处理方法中的步骤,因此,可以实现本发明实施例所提供的图像处理方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本发明实施例所提供的一种图像处理方法、装置、计算机设备和存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。

Claims (15)

1.一种图像处理方法,其特征在于,包括:
显示即时通讯客户端的聊天会话页面,其中,所述聊天会话页面包括聊天会话用户发送的原始图像;
基于针对所述原始图像的图像文本识别操作,显示所述原始图像的识别结果页面,所述识别结果页面包括目标图像,所述目标图像包括:从所述原始图像中识别到的文本、以及所述文本对应的背景内容,所述文本为可编辑文本、所述背景内容为所述原始图像中除所述文本以外的内容;
基于针对目标图像中文本的选择操作,确定所述目标图像中被选中的目标文本,显示文本输入控件,所述文本输入控件包括输入框和输入子控件,所述输入框中显示有被选中的目标文本;
基于针对输入子控件的文本输入操作,修改输入框中的所述目标文本;
当检测到针对所述文本输入控件的文本输入结束操作时,将输入框中的文本作为所述目标文本的修改后文本,以所述修改后文本替换所述目标图像中的所述目标文本,得到修改后的目标图像;
显示所述修改后的目标图像。
2.根据权利要求1所述的图像处理方法,其特征在于,所述基于针对所述原始图像的图像文本识别操作,显示所述原始图像的识别结果页面,包括:
基于针对所述原始图像的控件显示操作,显示图像文本识别控件;
当检测到针对所述图像文本识别控件的触发操作时,显示所述原始图像的识别结果页面。
3.根据权利要求2所述的图像处理方法,其特征在于,所述基于针对所述原始图像的控件显示操作,显示图像文本识别控件,包括:
当检测到针对所述原始图像的显示操作时,显示所述原始图像的图像放大页面,所述图像放大页面包括全屏显示状态下的原始图像;
当在所述图像放大页面检测到针对所述原始图像的控件显示触发操作时,显示图像文本识别控件。
4.根据权利要求3所述的图像处理方法,其特征在于,所述图像放大页面还包括:与所述原始图像中的目标内容对应的快捷操作控件,所述快捷操作控件用于在被触发时针对所述目标内容执行所述快捷操作控件指示的操作。
5.根据权利要求1所述的图像处理方法,其特征在于,还包括:
当检测到针对所述目标图像的分享触发操作时,显示文本分享控件和图像分享控件;
当检测到针对所述文本分享控件的触发操作时,对所述目标图像中的文本进行分享;
当检测到针对所述图像分享控件的触发操作时,对所述目标图像进行分享。
6.根据权利要求1所述 的图像处理方法,其特征在于,还包括:
当检测到针对所述目标图像的文本翻译操作时,显示所述目标图像对应的翻译结果页面,所述翻译结果页面包括所述目标图像对应的翻译图像,所述翻译图像包括:所述目标图像中的所述文本对应的翻译结果,以及所述目标图像中所述文本对应的背景内容。
7.根据权利要求6所述 的图像处理方法,其特征在于,还包括:
当检测到针对所述目标图像的图像分享操作时,显示所述目标图像的分享设置页面;
基于针对所述分享设置页面的分享样式选择操作,确定目标图像的目标分享样式;
基于所述目标分享样式和所述目标图像确定待分享图像;
对所述待分享图像进行分享。
8.根据权利要求7所述 的图像处理方法,其特征在于,若所述目标分享样式为分享识别结果,所述基于所述目标分享样式和所述目标图像确定待分享图像包括:
将所述目标图像确定为待分享图像;
若所述目标分享样式为分享翻译结果,所述基于所述目标分享样式和所述目标图像确定待分享图像包括:
将所述目标图像对应的翻译图像确定为待分享图像;
若所述目标分享样式为分享翻译对比结果,所述基于所述目标分享样式和所述目标图像确定待分享图像包括:
获取所述目标图像的翻译对比图像,所述翻译对比图像中包含所述目标图像中的内容,以及所述目标图像的翻译图像中的内容。
9.根据权利要求1所述的图像处理方法,其特征在于,还包括:
当检测到针对所述识别结果页面中所述目标图像的文本提取操作时,显示所述目标图像的文本提取结果页面,其中,所述文本提取结果页面包括所述目标图像中的可编辑文本。
10.根据权利要求9所述的图像处理方法,其特征在于,所述显示所述目标图像的文本提取结果页面后,还包括:
当检测到针对所述文本提取结果页面的对照显示操作时,显示对照页面,所述对照页面包括第一显示区域和第二显示区域,所述第一显示区域用于显示所述目标图像,所述第二显示区域用于显示所述目标图像的文本提取结果。
11.根据权利要求10所述的图像处理方法,其特征在于,还包括:
当检测到针对所述第一显示区域中的所述目标图像的文本选择操作时,确定所述目标图像中所述文本选择操作对应的已选择文本;
基于所述已选择文本调整所述第二显示区域显示的文本提取结果,在调整后,所述第二显示区域显示的文本提取结果中包含所述已选择文本对应的文本提取结果。
12.根据权利要求1所述的图像处理方法,其特征在于,基于针对所述原始图像的图像文本识别操作,显示所述原始图像的识别结果页面,包括:
基于针对所述原始图像的图像文本识别操作,触发获取所述原始图像的文本识别结果,其中,所述文本识别结果包含从所述原始图像中识别到的文本,以及所述文本在所述原始图像中的文本位置;
将识别到的文本以可编辑文本的形式,替换所述原始图像中位于对应的文本位置上的原始文本,得到所述原始图像对应的目标图像;
显示所述原始图像的识别结果页面,所述识别结果页面包含所述目标图像。
13.一种图像处理装置,其特征在于,包括:
会话页面显示单元,用于显示即时通讯客户端的聊天会话页面,其中,所述聊天会话页面包括聊天会话用户发送的原始图像;
识别结果显示单元,用于基于针对所述原始图像的图像文本识别操作,显示所述原始图像的识别结果页面,所述识别结果页面包括目标图像,所述目标图像包括:从所述原始图像中识别到的文本、以及所述文本对应的背景内容,所述文本为可编辑文本、所述背景内容为所述原始图像中除所述文本以外的内容;
编辑结果显示单元,用于基于针对目标图像中文本的选择操作,确定所述目标图像中被选中的目标文本,显示文本输入控件,所述文本输入控件包括输入框和输入子控件,所述输入框中显示有被选中的目标文本;
基于针对输入子控件的文本输入操作,修改输入框中的所述目标文本;
当检测到针对所述文本输入控件的文本输入结束操作时,将输入框中的文本作为所述目标文本的修改后文本,以所述修改后文本替换所述目标图像中的所述目标文本,得到修改后的目标图像;
显示所述修改后的目标图像。
14.一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如权利要求1-12任一项所述方法的步骤。
15.一种存储介质,其特征在于,所述存储介质中存储有多条指令,该指令能够被处理器进行加载,以执行如权利要求1-12任一项所述方法的步骤。
CN201911362175.6A 2019-12-26 2019-12-26 一种图像处理方法、装置、计算机设备和存储介质 Active CN111126301B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201911362175.6A CN111126301B (zh) 2019-12-26 2019-12-26 一种图像处理方法、装置、计算机设备和存储介质
CN202210003009.2A CN114332887A (zh) 2019-12-26 2019-12-26 一种图像处理方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911362175.6A CN111126301B (zh) 2019-12-26 2019-12-26 一种图像处理方法、装置、计算机设备和存储介质

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202210003009.2A Division CN114332887A (zh) 2019-12-26 2019-12-26 一种图像处理方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN111126301A CN111126301A (zh) 2020-05-08
CN111126301B true CN111126301B (zh) 2022-01-11

Family

ID=70502687

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201911362175.6A Active CN111126301B (zh) 2019-12-26 2019-12-26 一种图像处理方法、装置、计算机设备和存储介质
CN202210003009.2A Pending CN114332887A (zh) 2019-12-26 2019-12-26 一种图像处理方法、装置、计算机设备和存储介质

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202210003009.2A Pending CN114332887A (zh) 2019-12-26 2019-12-26 一种图像处理方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (2) CN111126301B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111669312A (zh) * 2020-05-15 2020-09-15 上海盛付通电子支付服务有限公司 消息交互方法、电子设备及介质
CN111638838A (zh) * 2020-05-19 2020-09-08 维沃移动通信有限公司 文本编辑方法、装置及电子设备
CN111753108B (zh) * 2020-06-28 2023-08-25 平安科技(深圳)有限公司 演示文稿生成方法、装置、设备及介质
CN113761257A (zh) * 2020-09-08 2021-12-07 北京沃东天骏信息技术有限公司 一种图片解析方法和装置
CN112132003A (zh) * 2020-09-18 2020-12-25 北京搜狗科技发展有限公司 一种数据处理方法、装置和录音设备
CN112947923B (zh) * 2021-02-25 2024-06-04 维沃移动通信有限公司 对象编辑方法、装置和电子设备
CN113300938B (zh) * 2021-04-02 2023-02-24 维沃移动通信有限公司 消息发送方法、装置及电子设备
CN115527135A (zh) * 2021-06-24 2022-12-27 Oppo广东移动通信有限公司 内容识别方法、装置以及电子设备
CN115567473A (zh) * 2021-06-30 2023-01-03 北京有竹居网络技术有限公司 数据处理方法、装置、服务器、客户端、介质和产品
CN113436297A (zh) * 2021-07-15 2021-09-24 维沃移动通信有限公司 图片处理方法和电子设备
CN113778303A (zh) * 2021-08-23 2021-12-10 深圳价值在线信息科技股份有限公司 一种文字提取的方法、装置及计算机可读存储介质
CN115857737A (zh) * 2021-09-24 2023-03-28 荣耀终端有限公司 信息推荐方法及电子设备
CN115016710B (zh) * 2021-11-12 2023-06-16 荣耀终端有限公司 应用程序推荐方法
CN115081404B (zh) * 2022-08-22 2022-11-15 佳瑛科技有限公司 一种基于区块链的共享文档编辑管理方法及装置
CN115396391B (zh) * 2022-08-23 2024-05-03 北京字跳网络技术有限公司 用于会话消息呈现的方法、装置、设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104463103A (zh) * 2014-11-10 2015-03-25 小米科技有限责任公司 图像处理方法及装置
CN104636740A (zh) * 2013-11-08 2015-05-20 株式会社理光 图像处理***和图像处理方法
CN105739832A (zh) * 2016-03-10 2016-07-06 联想(北京)有限公司 信息处理方法及电子设备
CN106909270A (zh) * 2016-07-20 2017-06-30 阿里巴巴集团控股有限公司 聊天数据输入方法、装置及通讯终端
WO2018125003A1 (en) * 2016-12-30 2018-07-05 Turkcell Teknoloji̇ Araştirma Ve Geli̇şti̇rme Anoni̇m Şi̇rketi̇ A translation system
CN109002759A (zh) * 2018-06-07 2018-12-14 Oppo广东移动通信有限公司 文本识别方法、装置、移动终端以及存储介质
CN109993075A (zh) * 2019-03-14 2019-07-09 深圳市六度人和科技有限公司 聊天应用会话内容存储方法、***及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103135977A (zh) * 2011-12-02 2013-06-05 腾讯科技(深圳)有限公司 一种浏览器中输入信息的方法和装置
US10496276B2 (en) * 2013-09-24 2019-12-03 Microsoft Technology Licensing, Llc Quick tasks for on-screen keyboards
CN105786295A (zh) * 2014-12-19 2016-07-20 阿里巴巴集团控股有限公司 文字输入方法及装置
US20160202865A1 (en) * 2015-01-08 2016-07-14 Apple Inc. Coordination of static backgrounds and rubberbanding
CN108182184B (zh) * 2017-12-27 2021-11-02 北京百度网讯科技有限公司 图片文字翻译方法、应用及计算机设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636740A (zh) * 2013-11-08 2015-05-20 株式会社理光 图像处理***和图像处理方法
CN104463103A (zh) * 2014-11-10 2015-03-25 小米科技有限责任公司 图像处理方法及装置
CN105739832A (zh) * 2016-03-10 2016-07-06 联想(北京)有限公司 信息处理方法及电子设备
CN106909270A (zh) * 2016-07-20 2017-06-30 阿里巴巴集团控股有限公司 聊天数据输入方法、装置及通讯终端
WO2018125003A1 (en) * 2016-12-30 2018-07-05 Turkcell Teknoloji̇ Araştirma Ve Geli̇şti̇rme Anoni̇m Şi̇rketi̇ A translation system
CN109002759A (zh) * 2018-06-07 2018-12-14 Oppo广东移动通信有限公司 文本识别方法、装置、移动终端以及存储介质
CN109993075A (zh) * 2019-03-14 2019-07-09 深圳市六度人和科技有限公司 聊天应用会话内容存储方法、***及装置

Also Published As

Publication number Publication date
CN111126301A (zh) 2020-05-08
CN114332887A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN111126301B (zh) 一种图像处理方法、装置、计算机设备和存储介质
JP7102170B2 (ja) 画像処理装置、および画像処理装置の制御方法とプログラム
CN112632942B (zh) 一种文档处理方法、装置、设备及介质
US20150277686A1 (en) Systems and Methods for the Real-Time Modification of Videos and Images Within a Social Network Format
WO2017125024A1 (zh) 资源分享方法、终端及存储介质
JP7407928B2 (ja) ファイルコメント、コメント閲覧方法、装置、コンピュータ機器及びコンピュータプログラム
CN111144320A (zh) 一种图像处理方法、装置、计算机设备和存储介质
JP2007288769A (ja) 画像形成装置、メール配信サーバおよび情報処理装置
US20160210347A1 (en) Classification and storage of documents
CN111324535A (zh) 一种控件异常检测方法、装置和计算机设备
CN101908218A (zh) 编辑设备和布置方法
CN112749606A (zh) 一种文本定位方法和装置
US20220113847A1 (en) Online collaborative document processing method and device
CN113158619B (zh) 文档处理方法、装置、计算机可读存储介质及计算机设备
CN112287403B (zh) 基于区块链的电子卷宗管理方法、装置、电子设备及介质
CN108140173A (zh) 将从通信中解析的附件分类
US20030025729A1 (en) Method and apparatus for viewing and marking up a design document
CN113591657B (zh) Ocr版面识别的方法、装置、电子设备及介质
JP4430490B2 (ja) データエントリ装置及びその制御方法、プログラム
US20240193975A1 (en) Image processing apparatus, image processing method, and storage medium
JP7501255B2 (ja) 文書検索システム、文書検索方法およびプログラム
US20210289078A1 (en) Information processing apparatus, method, and non-transitory computer readable medium
JP7069631B2 (ja) 情報処理装置及び情報処理プログラム
CN113434679A (zh) 图文内容发布方法及装置
KR101770724B1 (ko) 소셜 네트워크 서비스에 사용하는 이미지 제공 시스템 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant