CN110633457B - 一种内容替换方法、装置、电子设备及可读存储介质 - Google Patents

一种内容替换方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN110633457B
CN110633457B CN201810651671.2A CN201810651671A CN110633457B CN 110633457 B CN110633457 B CN 110633457B CN 201810651671 A CN201810651671 A CN 201810651671A CN 110633457 B CN110633457 B CN 110633457B
Authority
CN
China
Prior art keywords
picture
character
target
characters
recorded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810651671.2A
Other languages
English (en)
Other versions
CN110633457A (zh
Inventor
冷志峰
张作兵
刘浩丽
朱静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Kingsoft Mobile Technology Co Ltd
Original Assignee
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Kingsoft Mobile Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Office Software Inc, Zhuhai Kingsoft Office Software Co Ltd, Guangzhou Kingsoft Mobile Technology Co Ltd filed Critical Beijing Kingsoft Office Software Inc
Priority to CN201810651671.2A priority Critical patent/CN110633457B/zh
Publication of CN110633457A publication Critical patent/CN110633457A/zh
Application granted granted Critical
Publication of CN110633457B publication Critical patent/CN110633457B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

本发明实施例提供了一种内容替换方法、装置、电子设备及可读存储介质。该方法包括:接收针对文档中的目标图片的内容替换指令;内容替换指令中至少携带:待被替换的第一字符和用于替换第一字符的第二字符;将目标图片输入至预先构建的图片字符识别模型,得到目标图片所记录的目标字符和每个目标字符的位置区域信息;图片字符识别模型用于:识别图片所记录的字符和所记录的每个字符的位置区域信息;判断目标字符中是否存在与第一字符匹配的字符;若存在,生成记录有第二字符的子图片;利用子图片对目标图片的目标区域进行覆盖。应用本发明实施例,可以对文档中图片所记录的文字内容进行替换,提高了用户的办公体验。

Description

一种内容替换方法、装置、电子设备及可读存储介质
技术领域
本发明涉及文档处理技术领域,特别是涉及一种内容替换方法、装置、电子设备及可读存储介质。
背景技术
目前,在办公过程中,用户常常需要通过办公软件来处理各种各样的文档。例如,常常需要对word文档、PDF(Portable Document Format,便携式文档格式)文档和PPT(PowerPoint,演示文稿)文档等文档进行编辑。
这些文档中常常会存储有一些图片,并且,这些图片中有时会记录有一些文字内容。例如,文档中一张图片记录有文字:其它。发明人发现,当用户想要利用办公软件的替换功能,将该文档中的出现的“其它”替换为“其他”,从而使文档的用词统一时,办公软件无法对图片所记录的“其它”进行替换,影响了用户的办公体验。
发明内容
本发明实施例的目的在于提供一种内容替换方法、装置、电子设备及可读存储介质,以能够实现对图片所记录的文字内容进行替换,提高用户的办公体验。具体技术方案如下:
第一方面,本发明实施例提供了一种内容替换方法,该方法可以包括:
接收针对文档中的目标图片的内容替换指令;其中,内容替换指令中至少携带:待被替换的第一字符和用于替换第一字符的第二字符;
将目标图片输入至预先构建的图片字符识别模型,得到目标图片所记录的目标字符和每个目标字符的位置区域信息;图片字符识别模型用于:识别图片所记录的字符和所记录的每个字符的位置区域信息;
判断目标字符中是否存在与第一字符匹配的字符;
若存在,生成记录有第二字符的子图片;
利用子图片对目标图片的目标区域进行覆盖;目标区域为:与第一字符匹配的目标字符的位置区域信息所对应的区域。
可选地,在将目标图片输入至预先构建的图片字符识别模型之前,该方法还可以包括:
构建图片字符识别模型;
构建图片字符识别模型的步骤,包括:
获得记录有字符的多张预设图片;
利用预设深度学习算法对训练样本进行训练,得到图片字符识别模型;其中,一个训练样本中包括:一张预设图片、该预设图片中的字符和该字符在该预设图片中对应的位置区域信息。
可选地,一个训练样本中还可以包括:该训练样本中所包含的预设图片中的字符在该预设图片中的背景内容。
可选地,将目标图片输入至预先构建的图片字符识别模型,得到目标图片所记录的目标字符和每个目标字符的位置区域信息的步骤,可以包括:
将目标图片输入至预先构建的图片字符识别模型,得到目标图片所记录的目标字符、每个目标字符的位置区域信息和每个目标字符的背景内容;
生成记录有第二字符的子图片的步骤,包括:
生成记录有第二字符和目标背景内容的子图片;目标背景内容为:与第一字符匹配的目标字符的背景内容。
可选地,预设深度学习算法可以包括:卷积循环神经网络算法CRNN和组合算法中的任意一项;组合算法包括卷积循环神经网络算法CRNN和场景文本检测网络算法CTPN。
第二方面,本发明实施例还提供了一种内容替换装置,该装置可以包括:
接收单元,用于接收针对文档中的目标图片的内容替换指令;其中,内容替换指令中至少携带:待被替换的第一字符和用于替换第一字符的第二字符;
输入单元,用于将目标图片输入至预先构建的图片字符识别模型,得到目标图片所记录的目标字符和每个目标字符的位置区域信息;图片字符识别模型用于:识别图片所记录的字符和所记录的每个字符的位置区域信息;
判断单元,用于判断目标字符中是否存在与第一字符匹配的字符;
生成单元,用于在目标字符中存在与第一字符匹配的字符时,生成记录有第二字符的子图片;
覆盖单元,用于利用子图片对目标图片的目标区域进行覆盖;目标区域为:与第一字符匹配的目标字符的位置区域信息所对应的区域。
可选地,在本发明实施例中,该装置还可以包括:
构建单元,用于在将目标图片输入至预先构建的图片字符识别模型之前,构建图片字符识别模型;
构建单元具体用于:
获得记录有字符的多张预设图片;
利用预设深度学习算法对训练样本进行训练,得到图片字符识别模型;其中,一个训练样本中包括:一张预设图片、该预设图片中的字符和该字符在该预设图片中对应的位置区域信息。
可选地,一个训练样本中还可以包括:该训练样本中所包含的预设图片中的字符在该预设图片中的背景内容。
可选地,在本发明实施例中,输入单元具体可以用于:
将目标图片输入至预先构建的图片字符识别模型,得到目标图片所记录的目标字符、每个目标字符的位置区域信息和每个目标字符的背景内容;
相应地,生成单元具体可以用于:
生成记录有第二字符和目标背景内容的子图片;目标背景内容为:与第一字符匹配的目标字符的背景内容。
可选地,预设深度学习算法可以包括:卷积循环神经网络算法CRNN和组合算法中的任意一项;组合算法包括卷积循环神经网络算法CRNN和场景文本检测网络算法CTPN。
第三方面,本发明实施例还提供了一种电子设备,可以包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一项内容替换方法的方法步骤。
第四方面,本发明实施例还提供了一种可读存储介质,该可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一项内容替换方法的方法步骤。
第五方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在电子设备上运行时,使得电子设备执行:上述任一项内容替换方法的方法步骤。
在本发明实施例中,可以接收到针对文档中目标图片的内容替换指令,该内容替换指令中至少携带:待被替换的第一字符和用于替换所述第一字符的第二字符。在接收到该内容替换指令后,可以将该目标图片输入至预先构建的图片字符识别模型。由于图片字符识别模型可以对图片所记录的字符和所记录的每个字符的位置区域信息进行识别。因而,在将目标图片输入至图片字符识别模型后,图片字符识别模型可以识别并输出:目标图片所记录的目标字符和每个目标字符的位置区域信息。然后,可以判断目标字符中是否存在与第一字符相匹配的字符。若存在,则生成记录有第二字符的子图片。之后,利用该子图片对目标图片中的、与第一字符匹配的目标字符的位置区域信息所对应的目标区域进行覆盖。
这样,在利用子图片对目标区域进行覆盖后,实现了利用第二字符替换掉目标图片中的第一字符。该种内容替换方式,不需要用户将目标图片发送至图片编辑软件,再通过图片编辑软件对图片内容进行调整,降低了对图片内容进行调整的操作复杂度和操作时间,降低了内容替换成本,提高了用户的办公效率和办公体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种内容替换方法的流程图;
图2为本发明实施例提供的一种内容替换装置的结构示意图;
图3为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决现有技术中存在的问题,本发明实施例提供了一种内容替换方法、装置、电子设备及可读存储介质。
下面首先对本发明实施例提供的内容替换方法进行说明。
本发明实施例提供的内容替换方法可以应用于安装有办公软件的电子设备。该电子设备包括但并不局限于电脑和手机。
其中,办公软件包括但并不局限于:WPS(WPS software,WPS软件)办公软件、PPT(PowerPoint,演示文稿)办公软件和PDF(Portable Document Format,便携式文档格式)办公软件,当然并不局限于此。
相应地,本发明实施例中的目标文档包括但并不局限于:WPS文档、PPT文档和PDF文档,当然并不局限于此。
参见图1,该方法可以包括如下步骤:
S101:接收针对文档中的目标图片的内容替换指令;其中,内容替换指令中至少携带:待被替换的第一字符和用于替换第一字符的第二字符;
S102:将目标图片输入至预先构建的图片字符识别模型,得到目标图片所记录的目标字符和每个目标字符的位置区域信息;图片字符识别模型用于:识别图片所记录的字符和所记录的每个字符的位置区域信息;
S103:判断目标字符中是否存在与第一字符匹配的字符;若存在,执行步骤S104;
S104:生成记录有第二字符的子图片;
S105:利用子图片对目标图片的目标区域进行覆盖;目标区域为:与第一字符匹配的目标字符的位置区域信息所对应的区域。
在本发明实施例中,可以接收到针对文档中目标图片的内容替换指令,该内容替换指令中至少携带:待被替换的第一字符和用于替换所述第一字符的第二字符。在接收到该内容替换指令后,可以将该目标图片输入至预先构建的图片字符识别模型。由于图片字符识别模型可以对图片所记录的字符和所记录的每个字符的位置区域信息进行识别。因而,在将目标图片输入至图片字符识别模型后,图片字符识别模型可以识别并输出:目标图片所记录的目标字符和每个目标字符的位置区域信息。然后,可以判断目标字符中是否存在与第一字符相匹配的字符。若存在,则生成记录有第二字符的子图片。之后,利用该子图片对目标图片中的、与第一字符匹配的目标字符的位置区域信息所对应的目标区域进行覆盖。
这样,在利用子图片对目标区域进行覆盖后,实现了利用第二字符替换掉目标图片中的第一字符。该种内容替换方式,不需要用户将目标图片发送至图片编辑软件,再通过图片编辑软件对图片内容进行调整,降低了对图片内容进行调整的操作复杂度和操作时间,降低了内容替换成本,提高了用户的办公效率和办公体验。
下面以PDF文档为示例,对本发明实施例提供的内容替换方法进行说明。
假设电子设备中安装有PDF办公软件,并且通过该PDF办公软件打开有PDF文档,该PDF文档中存储有目标图片。那么,当电子设备检测到针对PDF文档全文的内容替换指令时,表明该电子设备接收到针对该目标图片的内容替换指令。
另外,当电子设备检测到针对该PDF文档中目标图片的内容替换指令时,也表明该电子设备接收到针对该目标图片的内容替换指令。其中,该内容替换指令中至少携带:待被替换的第一字符和用于替换该第一字符的第二字符。
其中,第一字符/第二字符可以为字母、数字、文字或符号,以及字母、数字、文字和符号中的任意组合,也可以为多个字母组成的英文单词,多个文字组成的词语,当然并不局限于此。其中,符号包括但并不局限于:!、#、¥和%。
举例而言,当用户想要将PDF文档中目标图片中记录的“其它”替换为“其它”时,电子设备接收到的、针对目标图片的内容替换指令所携带的第一字符为:其它,携带的第二字符为:其他。
电子设备在接收到针对目标图片的内容替换指令后,可以将目标图片输入至预先构建的图片字符识别模型。其中,该图片字符识别模型可以是存储在电子设备中的模型,也可以是存储在服务器中的模型,这都是合理的。
当图片字符识别模型存储在服务器时,电子设备可以通过服务器中的图片字符识别模型接口,将目标图片输入至服务器中的图片字符识别模型,并从图片字符识别模型接口获得图片字符识别模型针对目标图片的识别结果。
由于该图片字符识别模型可以对图片所记录的字符和所记录的每个字符的位置区域信息进行识别,因而在将目标图片输入至预先构建的图片字符识别模型后,图片字符识别模型可以对目标图片进行识别并输出:目标图片所记录的目标字符和每个目标字符的位置区域信息。
举例而言,图片字符识别模型可以识别目标图片中的第一行文字为“梅花和其它的花不一样”,识别目标图片中的第二行文字为“它俏也不争春,只把春来报”。并且,可以识别第一行文字和第二行文字中每个字符的位置区域信息。例如,可以识别字符“其”的位置区域信息为:目标图片中字符“其”所在矩形区域的左上角坐标和右下角坐标。
其中,构建图片字符识别模型的方式如下:
利用记录有字符的多张预设图片来形成训练样本。其中,得到的一个训练样本中可以包括:一张预设图片、该预设图片中的字符和该字符在该预设图片中的位置区域信息。
举例而言,得到的一个训练样本中可以包括:预设图片k、预设图片k所记录的字符和字符在预设图片k中的位置区域信息。其中,预设图片k所记录的字符为:其它地区。字符“其”的位置区域信息为:预设图片k中字符“其”所在矩形区域的左上角坐标和右下角坐标;……;字符“区”的位置区域信息为:预设图片k中字符“区”所在矩形区域的左上角坐标和右下角坐标。当然,位置区域信息并不局限于此。
然后,利用预设深度学习算法对训练样本进行训练,从而可以得到图片字符识别模型。
其中,为了使得执行替换操作后的目标图片看起来跟替换操作之前的目标图片差不多,增强用户的阅读体验。用于训练图片字符识别模型的训练样本中除了包括:预设图片、该预设图片中的字符和该字符在该预设图片中的位置区域信息之外,还可以包括:该训练样本中所包含的预设图片中的字符在该预设图片中的背景内容。
这样,当将目标图片输入至预先构建的图片字符识别模型后,图片字符识别模型可以对目标图片进行识别并输出:目标图片所记录的目标字符、每个目标字符的位置区域信息和和每个目标字符的背景内容。
其中,预设深度学习算法包括但并不局限于卷积循环神经网络算法(Convolutional Recurrent Neural Network,CRNN)和组合算法中的任意一项。组合算法包括卷积循环神经网络算法CRNN和场景文本检测网络算法(Connectionist TextProposal Network,CTPN)。
卷积循环神经网络算法(CRNN)集成了卷积神经网络算法(Convolutional NeuralNetworks,CNN)和循环神经网络算法(Recurrent Neural Network,RNN)的优点,使得本发明实施例训练得到图片字符识别模型能够更准确地识别出图片中的字符、字符的位置区域信息和字符的背景内容,进而使得可以获得更准确的查找结果,进而可以实现精准地替换。
另外,由于用于训练该图片字符识别模型的训练样本越多,则训练得到的图片字符识别模型的识别结果就越准确,因而可以采用尽量多的训练样本来训练该图片字符识别模型。
此外,为了提高图片字符识别模型输出的识别结果的准确性,在训练得到图片字符识别模型之后,还可以利用多个优化样本对该图片字符识别模型进行调优。其中,一个优化样本中可以包括:用于优化模型的图片和该图片所记录的字符和每个字符的位置区域信息。当然还可以包括每个字符的背景内容。这样,可以对图片字符识别模型中的参数进行优化,从而使得该模型的输出的识别结果更准确。
以上,使得训练得到的图片字符识别模型可以对输入该模型的图片中所记录的字符、每个字符的位置区域信息和每个目标字符的背景内容进行识别。
假设通过预先构建的图片字符识别模型,可以识别出PDF文档中的图片所记录的目标字符、每个目标字符的位置区域信息和每个目标字符的背景内容,那么在获得图片字符识别模型的识别结果后,可以利用第一字符“其它”与目标图片所记录的目标字符进行匹配。
然后,可以判断识别得到的目标字符中是否存在与第一字符匹配的字符。若存在,则可以确定出匹配成功的字符,并可以确定该匹配成功的字符的位置区域信息。然后,可以生成记录有第二字符的子图片。当判断识别得到的目标字符中不存在与第一字符匹配的字符时,则放弃生成记录有第二字符的子图片。
在一种实现方式中,所生成的子图片的背景可以为预设颜色的背景,例如白色背景。在另一种实现方式中,所生成的子图片的背景也可以是根据匹配成功的字符的背景内容的。这都是合理的。
可以理解的是,生成子图片的操作可以在电子设备上执行,也可以在服务器上执行。当在电子设备上执行时,可以减少电子设备和服务器之间的数据传输量,节省了电子设备和服务器的传输带宽。当在服务器上执行时,可以减少电子设备的计算量,并提高生成子图片的速度。
在生成子图片后,可以利用子图片对目标图片的目标区域进行覆盖。该目标区域为:目标图片中的、与第一字符匹配的目标字符的位置区域信息所对应的区域。
当所生成的子图片的大小与该目标区域大小相等时,可以直接利用子图片对目标图片的目标区域进行覆盖。当所生成的子图片的大小与该目标区域大小不相等时,可以将子图片进行缩放,以使子图片的大小与该目标区域大小相等,然后利用缩放后的子图片执行覆盖操作。
其中,如果电子设备检测到的内容替换指令是针对整个文档的,那么还需要利用该第一字符与该文档中的文本内容进行匹配,并利用第二字符对文本内容中与第一字符匹配的内容进行替换。从而,可以将全文中的“第一字符”替换为“第二字符”。
举例而言,假设PDF文档有两页,一页是目标图片,另一页是文本内容。那么,在通过图片字符识别模型识别出:PDF文档中的图片所记录的目标字符、每个目标字符的位置区域信息和每个目标字符的背景内容后,可以利用第一字符与识别得到的目标字符进行匹配。当目标字符中存在与第一字符匹配的字符时,则生成记录有第二字符的子图片。并利用该子图片对目标图片中的、与第一字符匹配的目标字符的位置区域信息所对应的目标区域进行覆盖。并且,直接利用第一字符与另一页中的文本内容进行匹配,并利用第二字符对文本内容中匹配成功的字符进行替换。
需要说明的是,对word文档、WPS文档和PPT文档等文档中的内容进行替换的方式可以参考上述PDF文档对应的内容替换方式,在此不做详述。
以上,电子设别可以在接收到针对目标图片的内容替换指令后,可以通过记录有第二字符的子图片对目标图片中记录了第一字符的相应区域进行覆盖,实现了利用第二字符替换掉目标图片中的第一字符。该种内容替换方式,不需要用户将目标图片发送至图片编辑软件,再通过图片编辑软件对图片内容进行调整,降低了对图片内容进行调整的操作复杂度和操作时间,降低了内容替换成本,提高了用户的办公效率和办公体验。
相应于上述方法实施例,本发明实施例还提供了一种内容替换装置,参见图2,该装置可以包括:
接收单元201,用于接收针对文档中的目标图片的内容替换指令;其中,内容替换指令中至少携带:待被替换的第一字符和用于替换第一字符的第二字符;
输入单元202,用于将目标图片输入至预先构建的图片字符识别模型,得到目标图片所记录的目标字符和每个目标字符的位置区域信息;图片字符识别模型用于:识别图片所记录的字符和所记录的每个字符的位置区域信息;
判断单元203,用于判断目标字符中是否存在与第一字符匹配的字符;
生成单元204,用于在目标字符中存在与第一字符匹配的字符时,生成记录有第二字符的子图片;
覆盖单元205,用于利用子图片对目标图片的目标区域进行覆盖;目标区域为:与第一字符匹配的目标字符的位置区域信息所对应的区域。
应用本发明实施例提供的装置,可以接收到针对文档中目标图片的内容替换指令,该内容替换指令中至少携带:待被替换的第一字符和用于替换所述第一字符的第二字符。在接收到该内容替换指令后,可以将该目标图片输入至预先构建的图片字符识别模型。由于图片字符识别模型可以对图片所记录的字符和所记录的每个字符的位置区域信息进行识别。因而,在将目标图片输入至图片字符识别模型后,图片字符识别模型可以识别并输出:目标图片所记录的目标字符和每个目标字符的位置区域信息。然后,可以判断目标字符中是否存在与第一字符相匹配的字符。若存在,则生成记录有第二字符的子图片。之后,利用该子图片对目标图片中的、与第一字符匹配的目标字符的位置区域信息所对应的目标区域进行覆盖。
这样,在利用子图片对目标区域进行覆盖后,实现了利用第二字符替换掉目标图片中的第一字符。该种内容替换方式,不需要用户将目标图片发送至图片编辑软件,再通过图片编辑软件对图片内容进行调整,降低了对图片内容进行调整的操作复杂度和操作时间,降低了内容替换成本,提高了用户的办公效率和办公体验。
可选地,在本发明实施例中,该装置还可以包括:
构建单元,用于在将目标图片输入至预先构建的图片字符识别模型之前,构建图片字符识别模型;
构建单元具体用于:
获得记录有字符的多张预设图片;
利用预设深度学习算法对训练样本进行训练,得到图片字符识别模型;其中,一个训练样本中包括:一张预设图片、该预设图片中的字符和该字符在该预设图片中对应的位置区域信息。
可选地,一个训练样本中还包括:该训练样本中所包含的预设图片中的字符在该预设图片中的背景内容。
可选地,在本发明实施例中,输入单元202具体用于:
将目标图片输入至预先构建的图片字符识别模型,得到目标图片所记录的目标字符、每个目标字符的位置区域信息和每个目标字符的背景内容;
相应地,生成单元204具体用于:
生成记录有第二字符和目标背景内容的子图片;目标背景内容为:与第一字符匹配的目标字符的背景内容。
可选地,预设深度学习算法包括:卷积循环神经网络算法CRNN和组合算法中的任意一项;组合算法包括卷积循环神经网络算法CRNN和场景文本检测网络算法CTPN。
相应于上述方法实施例,本发明实施例还提供了一种电子设备,参见图3,该电子设备包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信,
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序时,实现上述任一项内容替换方法的方法步骤。
在本发明实施例中,电子设备可以接收到针对文档中目标图片的内容替换指令,该内容替换指令中至少携带:待被替换的第一字符和用于替换所述第一字符的第二字符。在接收到该内容替换指令后,可以将该目标图片输入至预先构建的图片字符识别模型。由于图片字符识别模型可以对图片所记录的字符和所记录的每个字符的位置区域信息进行识别。因而,在将目标图片输入至图片字符识别模型后,图片字符识别模型可以识别并输出:目标图片所记录的目标字符和每个目标字符的位置区域信息。然后,可以判断目标字符中是否存在与第一字符相匹配的字符。若存在,则生成记录有第二字符的子图片。之后,利用该子图片对目标图片中的、与第一字符匹配的目标字符的位置区域信息所对应的目标区域进行覆盖。
这样,在利用子图片对目标区域进行覆盖后,实现了利用第二字符替换掉目标图片中的第一字符。该种内容替换方式,不需要用户将目标图片发送至图片编辑软件,再通过图片编辑软件对图片内容进行调整,降低了对图片内容进行调整的操作复杂度和操作时间,降低了内容替换成本,提高了用户的办公效率和办公体验。
相应于上述方法实施例,本发明实施例还提供了一种可读存储介质,该可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一项内容替换方法的方法步骤。
本发明实施例提供的可读存储介质中存储的计算机程序被电子设备的处理器执行后,电子设备可以接收到针对文档中目标图片的内容替换指令,该内容替换指令中至少携带:待被替换的第一字符和用于替换所述第一字符的第二字符。在接收到该内容替换指令后,可以将该目标图片输入至预先构建的图片字符识别模型。由于图片字符识别模型可以对图片所记录的字符和所记录的每个字符的位置区域信息进行识别。因而,在将目标图片输入至图片字符识别模型后,图片字符识别模型可以识别并输出:目标图片所记录的目标字符和每个目标字符的位置区域信息。然后,可以判断目标字符中是否存在与第一字符相匹配的字符。若存在,则生成记录有第二字符的子图片。之后,利用该子图片对目标图片中的、与第一字符匹配的目标字符的位置区域信息所对应的目标区域进行覆盖。
这样,在利用子图片对目标区域进行覆盖后,实现了利用第二字符替换掉目标图片中的第一字符。该种内容替换方式,不需要用户将目标图片发送至图片编辑软件,再通过图片编辑软件对图片内容进行调整,降低了对图片内容进行调整的操作复杂度和操作时间,降低了内容替换成本,提高了用户的办公效率和办公体验。
相应于上述方法实施例,本发明实施例还提供了一种包含指令的计算机程序产品,当其在电子设备上运行时,使得电子设备执行:上述任一项内容替换方法的方法步骤。
本发明实施例提供的包含指令的计算机程序产品,当其在电子设备上运行时,使得电子设备可以接收到针对文档中目标图片的内容替换指令,该内容替换指令中至少携带:待被替换的第一字符和用于替换所述第一字符的第二字符。在接收到该内容替换指令后,可以将该目标图片输入至预先构建的图片字符识别模型。由于图片字符识别模型可以对图片所记录的字符和所记录的每个字符的位置区域信息进行识别。因而,在将目标图片输入至图片字符识别模型后,图片字符识别模型可以识别并输出:目标图片所记录的目标字符和每个目标字符的位置区域信息。然后,可以判断目标字符中是否存在与第一字符相匹配的字符。若存在,则生成记录有第二字符的子图片。之后,利用该子图片对目标图片中的、与第一字符匹配的目标字符的位置区域信息所对应的目标区域进行覆盖。
这样,在利用子图片对目标区域进行覆盖后,实现了利用第二字符替换掉目标图片中的第一字符。该种内容替换方式,不需要用户将目标图片发送至图片编辑软件,再通过图片编辑软件对图片内容进行调整,降低了对图片内容进行调整的操作复杂度和操作时间,降低了内容替换成本,提高了用户的办公效率和办公体验。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、可读存储介质和计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种内容替换方法,其特征在于,所述方法包括:
接收针对文档中的目标图片的内容替换指令;其中,所述内容替换指令中至少携带:待被替换的第一字符和用于替换所述第一字符的第二字符;
将所述目标图片输入至预先构建的图片字符识别模型,得到所述目标图片所记录的目标字符和每个目标字符的位置区域信息;所述图片字符识别模型用于:识别图片所记录的字符和所记录的每个字符的位置区域信息;
判断所述目标字符中是否存在与所述第一字符匹配的字符;
若存在,生成记录有所述第二字符的子图片;
利用所述子图片对所述目标图片的目标区域进行覆盖;所述目标区域为:与所述第一字符匹配的目标字符的位置区域信息所对应的区域;
所述将所述目标图片输入至预先构建的图片字符识别模型,得到所述目标图片所记录的目标字符和每个目标字符的位置区域信息的步骤,包括:
将所述目标图片输入至预先构建的图片字符识别模型,得到所述目标图片所记录的目标字符、每个目标字符的位置区域信息和每个目标字符的背景内容;
所述生成记录有所述第二字符的子图片的步骤,包括:
生成记录有所述第二字符和目标背景内容的子图片;所述目标背景内容为:与所述第一字符匹配的目标字符的背景内容。
2.根据权利要求1所述的方法,其特征在于,在将所述目标图片输入至预先构建的图片字符识别模型之前,所述方法还包括:
构建所述图片字符识别模型;
所述构建所述图片字符识别模型的步骤,包括:
获得记录有字符的多张预设图片;
利用预设深度学习算法对训练样本进行训练,得到所述图片字符识别模型;其中,一个训练样本中包括:一张预设图片、该预设图片中的字符和该字符在该预设图片中对应的位置区域信息。
3.根据权利要求2所述的方法,其特征在于,一个训练样本中还包括:该训练样本中所包含的预设图片中的字符在该预设图片中的背景内容。
4.根据权利要求2-3中任一项所述的方法,其特征在于,所述预设深度学习算法包括:卷积循环神经网络算法CRNN和组合算法中的任意一项;所述组合算法包括所述卷积循环神经网络算法CRNN和场景文本检测网络算法CTPN。
5.一种内容替换装置,其特征在于,所述装置包括:
接收单元,用于接收针对文档中的目标图片的内容替换指令;其中,所述内容替换指令中至少携带:待被替换的第一字符和用于替换所述第一字符的第二字符;
输入单元,用于将所述目标图片输入至预先构建的图片字符识别模型,得到所述目标图片所记录的目标字符和每个目标字符的位置区域信息;所述图片字符识别模型用于:识别图片所记录的字符和所记录的每个字符的位置区域信息;
判断单元,用于判断所述目标字符中是否存在与所述第一字符匹配的字符;
生成单元,用于在所述目标字符中存在与所述第一字符匹配的字符时,生成记录有所述第二字符的子图片;
覆盖单元,用于利用所述子图片对所述目标图片的目标区域进行覆盖;所述目标区域为:与所述第一字符匹配的目标字符的位置区域信息所对应的区域;
所述输入单元具体用于:
将所述目标图片输入至预先构建的图片字符识别模型,得到所述目标图片所记录的目标字符、每个目标字符的位置区域信息和每个目标字符的背景内容;
所述生成单元具体用于:
生成记录有所述第二字符和目标背景内容的子图片;所述目标背景内容为:与所述第一字符匹配的目标字符的背景内容。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
构建单元,用于在将所述目标图片输入至预先构建的图片字符识别模型之前,构建所述图片字符识别模型;
所述构建单元具体用于:
获得记录有字符的多张预设图片;
利用预设深度学习算法对训练样本进行训练,得到所述图片字符识别模型;其中,一个训练样本中包括:一张预设图片、该预设图片中的字符和该字符在该预设图片中对应的位置区域信息。
7.根据权利要求6所述的装置,其特征在于,一个训练样本中还包括:该训练样本中所包含的预设图片中的字符在该预设图片中的背景内容。
8.根据权利要求6-7中任一项所述的装置,其特征在于,所述预设深度学习算法包括:卷积循环神经网络算法CRNN和组合算法中的任意一项;所述组合算法包括所述卷积循环神经网络算法CRNN和场景文本检测网络算法CTPN。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-4中任一所述的方法步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-4中任一所述的方法步骤。
CN201810651671.2A 2018-06-22 2018-06-22 一种内容替换方法、装置、电子设备及可读存储介质 Active CN110633457B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810651671.2A CN110633457B (zh) 2018-06-22 2018-06-22 一种内容替换方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810651671.2A CN110633457B (zh) 2018-06-22 2018-06-22 一种内容替换方法、装置、电子设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN110633457A CN110633457A (zh) 2019-12-31
CN110633457B true CN110633457B (zh) 2023-05-26

Family

ID=68967274

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810651671.2A Active CN110633457B (zh) 2018-06-22 2018-06-22 一种内容替换方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN110633457B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110930302B (zh) * 2018-08-30 2024-03-26 珠海金山办公软件有限公司 一种图片处理方法、装置、电子设备及可读存储介质
CN117274430A (zh) * 2023-08-31 2023-12-22 北京百度网讯科技有限公司 目标图片获取以及模型获取方法、装置、设备及存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5167016A (en) * 1989-12-29 1992-11-24 Xerox Corporation Changing characters in an image
JPH05174188A (ja) * 1991-12-20 1993-07-13 Ricoh Co Ltd 文字認識の前処理方法
CN102651138A (zh) * 2012-04-10 2012-08-29 西安理工大学 基于jpeg图片拼接的超大图片合成方法
CN102843470A (zh) * 2012-08-16 2012-12-26 广东步步高电子工业有限公司 优化编辑信息通信***及其方法
CN103324924A (zh) * 2012-03-19 2013-09-25 宇龙计算机通信科技(深圳)有限公司 一种字符定位的方法、装置及终端
CN104715497A (zh) * 2014-12-30 2015-06-17 上海孩子国科教设备有限公司 数据替换的方法及***
CN105184838A (zh) * 2015-09-21 2015-12-23 深圳市金立通信设备有限公司 一种图片处理方法及终端
CN106407981A (zh) * 2016-11-24 2017-02-15 北京文安智能技术股份有限公司 一种车牌识别方法、装置及***
CN106598623A (zh) * 2016-12-23 2017-04-26 维沃移动通信有限公司 一种图片组合模板的生成方法及移动终端
CN106874909A (zh) * 2017-01-18 2017-06-20 深圳怡化电脑股份有限公司 一种图像字符的识别方法及其装置
CN107679074A (zh) * 2017-08-25 2018-02-09 百度在线网络技术(北京)有限公司 一种图片生成方法与设备
CN107688772A (zh) * 2017-06-23 2018-02-13 平安科技(深圳)有限公司 保单信息录入的方法、装置、计算机设备及存储介质
CN107797737A (zh) * 2017-09-26 2018-03-13 努比亚技术有限公司 图片再编辑的方法、装置及计算机可读存储介质
CN108153468A (zh) * 2017-12-14 2018-06-12 阿里巴巴集团控股有限公司 图片处理方法及装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5167016A (en) * 1989-12-29 1992-11-24 Xerox Corporation Changing characters in an image
JPH05174188A (ja) * 1991-12-20 1993-07-13 Ricoh Co Ltd 文字認識の前処理方法
CN103324924A (zh) * 2012-03-19 2013-09-25 宇龙计算机通信科技(深圳)有限公司 一种字符定位的方法、装置及终端
CN102651138A (zh) * 2012-04-10 2012-08-29 西安理工大学 基于jpeg图片拼接的超大图片合成方法
CN102843470A (zh) * 2012-08-16 2012-12-26 广东步步高电子工业有限公司 优化编辑信息通信***及其方法
CN104715497A (zh) * 2014-12-30 2015-06-17 上海孩子国科教设备有限公司 数据替换的方法及***
CN105184838A (zh) * 2015-09-21 2015-12-23 深圳市金立通信设备有限公司 一种图片处理方法及终端
CN106407981A (zh) * 2016-11-24 2017-02-15 北京文安智能技术股份有限公司 一种车牌识别方法、装置及***
CN106598623A (zh) * 2016-12-23 2017-04-26 维沃移动通信有限公司 一种图片组合模板的生成方法及移动终端
CN106874909A (zh) * 2017-01-18 2017-06-20 深圳怡化电脑股份有限公司 一种图像字符的识别方法及其装置
CN107688772A (zh) * 2017-06-23 2018-02-13 平安科技(深圳)有限公司 保单信息录入的方法、装置、计算机设备及存储介质
CN107679074A (zh) * 2017-08-25 2018-02-09 百度在线网络技术(北京)有限公司 一种图片生成方法与设备
CN107797737A (zh) * 2017-09-26 2018-03-13 努比亚技术有限公司 图片再编辑的方法、装置及计算机可读存储介质
CN108153468A (zh) * 2017-12-14 2018-06-12 阿里巴巴集团控股有限公司 图片处理方法及装置

Also Published As

Publication number Publication date
CN110633457A (zh) 2019-12-31

Similar Documents

Publication Publication Date Title
US20220067416A1 (en) Method and device for generating collection of incorrectly-answered questions
JP6244892B2 (ja) 文書内の文字の局所的な拡大縮小、回転および表示位置に対して不変である光学的文字認識のためのワード検出
US10521654B2 (en) Recognition of handwritten characters in digital images using context-based machine learning
WO2020233332A1 (zh) 文本结构化信息提取方法、服务器及存储介质
CN108108342B (zh) 结构化文本的生成方法、检索方法及装置
WO2022057707A1 (zh) 文本识别方法、图像识别分类方法、文档识别处理方法
EP3869385A1 (en) Method for extracting structural data from image, apparatus and device
US20210390370A1 (en) Data processing method and apparatus, storage medium and electronic device
WO2015168051A1 (en) Techniques for distributed optical character recognition and distributed machine language translation
CN112396049A (zh) 文本纠错方法、装置、计算机设备及存储介质
EP3138046A1 (en) Techniques for distributed optical character recognition and distributed machine language translation
CN111222368B (zh) 一种识别文档段落的方法、装置及电子设备
CN112396047B (zh) 训练样本生成方法、装置、计算机设备和存储介质
CN110472701A (zh) 文字纠错方法、装置、电子设备和存储介质
CN110633457B (zh) 一种内容替换方法、装置、电子设备及可读存储介质
CN111061887A (zh) 一种新闻人物照片提取方法、装置、设备及存储介质
CN108090044B (zh) 联系方式的识别方法和装置
US9665786B2 (en) Confirming automatically recognized handwritten answers
CN110363189B (zh) 一种文档内容修复方法、装置、电子设备及可读存储介质
JP2022128202A (ja) 情報処理装置、情報処理システム、及び情報処理プログラム
CN111027345A (zh) 一种字体识别方法及装置
CN116343221A (zh) 证件信息自动录入方法和装置、电子设备及存储介质
CN111208955A (zh) 打印方法、装置及服务器
CN112784594B (zh) 一种文档处理方法、装置、电子设备及可读存储介质
CN110895924B (zh) 一种文档内容朗读方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant