CN110245572A - 区域内容识别方法、装置、计算机设备和存储介质 - Google Patents

区域内容识别方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN110245572A
CN110245572A CN201910419206.0A CN201910419206A CN110245572A CN 110245572 A CN110245572 A CN 110245572A CN 201910419206 A CN201910419206 A CN 201910419206A CN 110245572 A CN110245572 A CN 110245572A
Authority
CN
China
Prior art keywords
picture
identification
region
selection
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910419206.0A
Other languages
English (en)
Inventor
许剑勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910419206.0A priority Critical patent/CN110245572A/zh
Publication of CN110245572A publication Critical patent/CN110245572A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请涉及开发领域,特别涉及一种区域内容识别方法、装置、计算机设备和存储介质。所述方法包括:接收采集指令,并根据采集指令获取识别目标的待处理图片;显示待处理图片;接收输入的区域选择指令,并根据区域选择指令在待处理图片上选择至少两个识别区域;根据选择的至少两个识别区域得到一张拼接图片;将拼接图片发送至服务器,并接收服务器发送的对拼接图片进行内容识别得到的目标文本。采用本方法能够根据图片中待识别文字所在的区域进行针对性识别、提高识别结果准确性。

Description

区域内容识别方法、装置、计算机设备和存储介质
技术领域
本申请涉及多区域内容识别技术领域,特别是涉及一种区域内容识别方法、装置、计算机设备和存储介质。
背景技术
随着数据技术的发展,越来越多的信息都通过网络处理和交互,因而对于纸质材料转换为电子格式的技术也层出不穷。
传统地,终端对于纸质材料中内容的识别通常是将纸质材料的图片进行全图智能识别,然而对于背景较为复杂的材料,如海报,广告栏等,在内容识别过程中,计算机无法判断待识别的文字内容在图片中的区域,可能误将图片中的非文字区域列入识别范围,造成识别结果不准确。
发明内容
基于此,有必要针对上述技术问题,提供一种能够根据图片中待识别文字所在的区域进行针对性识别、提高识别结果准确性的多区域内容识别方法、装置、计算机设备和存储介质。
一种区域内容识别方法,所述方法包括:
接收采集指令,并根据采集指令获取识别目标的待处理图片;
显示所述待处理图片;
接收输入的区域选择指令,并根据所述区域选择指令在所述待处理图片上选择至少两个识别区域;
根据选择的至少两个所述识别区域得到一张拼接图片;
将所述拼接图片发送至服务器,并接收所述服务器发送的对所述拼接图片进行内容识别得到的目标文本。
在其中一个实施例中,所述接收输入的区域选择指令,并根据区域选择指令在所述待处理图片上选择至少两个识别区域,包括:
接收输入的区域选择指令,根据所述待处理图片的显示差别选择与所述区域选择指令对应的识别区域;
显示选择的所述识别区域;
继续所述接收输入的区域选择指令,直至接收到输入的选择完成指令。
在其中一个实施例中,所述显示选择的所述识别区域之后,还包括:
接收输入的区域调整指令;
根据所述区域调整指令调整所述识别区域。
在其中一个实施例中,所述根据区域选择指令在所述待处理图片上选择至少两个识别区域之后,还包括:
记录所述至少两个识别区域的选择顺序;
所述根据选择的至少两个所述识别区域得到一张拼接图片,包括:
获取背景图片;
将选择的所述至少两个识别区域根据所述选择顺序排列在所述背景图片上,生成一张拼接图片。
在其中一个实施例中,所述接收所述服务器发送的对所述拼接图片进行内容识别得到的目标文本之后,还包括:
显示所述目标文本;
接收输入的错误指令,并将所述错误指令发送至服务器;
接收所述服务器返回的与所述错误指令对应的纠正内容。
一种多区域内容识别装置,所述装置包括:
图片采集模块,用于接收采集指令,并根据采集指令获取识别目标的待处理图片;
图片显示模块,用于显示所述待处理图片;
区域选择模块,用于接收输入的区域选择指令,并根据区域选择指令在所述待处理图片上选择至少两个识别区域;
图片获取模块,用于根据选择的至少两个所述识别区域得到一张拼接图片;
文本获取模块,用于将所述拼接图片发送至服务器,并接收所述服务器发送的对所述拼接图片进行内容识别得到的目标文本。
在其中一个实施例中,所述区域选择模块包括:
第一选择单元,用于接收输入的区域选择指令,根据所述待处理图片的显示差别选择与所述区域选择指令对应的识别区域;
区域显示单元,用于显示选择的所述识别区域;
继续选择单元,用于继续所述接收输入的区域选择指令,直至接收到输入的选择完成指令。
在其中一个实施例中,所述区域选择模块还包括:
调整指令接收单元,用于接收输入的区域调整指令;
区域调整单元,用于根据所述区域调整指令调整所述识别区域。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
上述区域内容识别方法、装置、计算机设备和存储介质,终端根据用户需求,采集需要识别的纸质材料的识别目标的待处理图片,并在终端的显示界面进行显示,用户在终端输入区域选择指令,在显示的待处理图片中选择至少两个识别区域,并根据选择的识别区域得到一张包含此待处理图片中所有需识别的区域的拼接图片,将拼接图片发送至服务器,由服务器对拼接图片的内容进行识别,得到可编辑的电子文本,即目标文本。通过用户手动选择至少两个识别区域,使服务器在对待识别图片的内容识别时只识别拼接图片中包含的部分,能够避免非文字区域被误列入识别范围,造成识别出错,从而提高识别结果的准确性。
附图说明
图1为一个实施例中区域内容识别方法的应用场景图;
图2为一个实施例中区域内容识别方法的流程示意图;
图3为一个实施例中步骤S206步骤的流程示意图;
图4为一个实施例中多区域内容识别装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的区域内容识别方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。终端102接收到采集指令时,即获取纸质材料的识别目标的待处理图片,并根据用户在终端上的输入在待处理图片中选择识别区域,然后对选择的识别区域进行拼接得到拼接图片,将拼接图片发送至服务器104进行内容识别,服务器104识别出拼接图片中的内容时,再将得到的目标文本返回至终端102。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种区域内容识别方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤:
S202,接收采集指令,并根据采集指令获取识别目标的待处理图片。
其中,采集指令是用于启动终端采集图片的指令,可以是用户在终端上通过启动程序或者对应的按键输入的指令。
待处理图片是是终端通过扫描设备对需要识别其中文字内容的、背景复杂的纸质材料或其他形式的材料的识别目标进行拍摄或者扫描得到的图片,例如对路边的海报或者广告牌拍摄得到的图片,此时的海报或广告牌为识别目标。
具体地,终端获取到采集指令后,通过内置或外接的拍摄设备,如手机或电脑的摄像头,或者电脑外接的扫描仪等,将待拍摄的目标放置于拍摄区域,获取拍摄区域的图片,即待处理图片。
S204,显示待处理图片。
具体地,终端采集了待处理图片后,将其显示在终端的显示界面上,供用户对此图片进行编辑。
S206,接收输入的区域选择指令,并根据区域选择指令在待处理图片上选择至少两个识别区域。
其中,区域选择指令是用户在终端上输入的、用于在待处理图片中选择出需要识别内容的区域的指令,例如用户可以在手机终端通过触屏或者键盘输入区域选择指令。
具体地,用户在终端上输入区域选择指令,终端根据用户输入的区域选择指令在显示界面上选择此待处理图片中需要识别的至少两个区域作为识别区域。例如,用户在手机或者电脑的屏幕上通过触屏或者鼠标等输入设备,在屏幕上显示的待处理图片中用矩形或其他形状标注出至少两个包含待识别内容的识别区域。
S208,根据选择的至少两个识别区域得到一张拼接图片。
拼接图片是终端将所有选择的识别区域进行拼接等处理得到的一张用于识别其中内容的图片,例如,用户在终端的显示界面的待处理图片中选择了三个矩形的识别区域,终端将这三个矩形的识别区域拼接成一张图片,即拼接图片。当用户只在待处理图片中选择一个识别区域时,可将这一个识别区域作为待识别内容的拼接图片,继续执行下面的操作步骤。
S210,将拼接图片发送至服务器,并接收服务器发送的对拼接图片进行内容识别得到的目标文本。
具体地,终端将图片拼接完成后,将得到的拼接图片发送至服务器进行下一步的内容识别操作,待服务器识别完成后将识别得到的目标文本发送至终端,完成此次对图片上的多个区域的内容进行识别的操作。
可选地,服务器通过内容识别技术对拼接图片中的文字部分进行识别,服务器可以通过终端内置或外接的内容识别设备将拼接图片转化为可编辑的文字(或字符)形式,得到目标文本。其中,内容识别设备是用于将图片中的文字转化为可编辑的目标文字的设备,可以指OCR识别设备等;OCR(Optical Character Recognition,光学字符识别)设备是指检查图片上的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程的设备。
上述区域内容识别方法,终端根据用户需求,采集需要识别的纸质材料的识别目标的待处理图片,并在终端的显示界面进行显示,用户在终端输入区域选择指令,在显示的待处理图片中选择至少两个识别区域,并根据选择的识别区域得到一张包含此待处理图片中所有需识别的区域的拼接图片,将拼接图片发送至服务器,由服务器对拼接图片的内容进行识别,得到可编辑的电子文本,即目标文本。通过用户手动选择至少两个识别区域,使服务器在对待识别图片的内容识别时只识别拼接图片中包含的部分,能够避免非文字区域被误列入识别范围,造成识别出错,从而提高识别结果的准确性。
在一个实施例中,上述区域内容识别方法中的步骤S206接收输入的区域选择指令,并根据区域选择指令在待处理图片上选择至少两个识别区域,可以包括:
S302,接收输入的区域选择指令,根据待处理图片的显示差别选择与区域选择指令对应的识别区域。
其中,待处理图片的显示差异指的是待处理图片的背景色的差异,例如颜色差异,或者待处理图片的显示内容上的差异,例如文字的排版差异。
具体地,终端接收到用户输入的区域选择指令后,根据用户在屏幕中的点击自动判断用户想要获取的识别区域。例如,对于一张海报图片,其背景色通常为图画区域和文案区域,终端可以根据此海报图片中的显示情况,区分此海报中的文案区域,将文案区域作为识别区域。或者对于一个图片中有多个不同排版的文字区域,当用户点击一个区域时,可自动匹配对应的排版的文字区域。
S304,显示选择的识别区域。
具体地,当终端根据用户输入的区域选择指令自动识别出一个对应的识别区域后,可用矩形或其他形状的框、或者高亮等方式在屏幕上显示出这一选择好的识别区域,供用户查看此识别区域是否为其想要选择的区域。
S306,继续接收输入的区域选择指令,直至接收到输入的选择完成指令。
具体地,用户可继续输入区域选择指令,通过输入设备在屏幕上的待处理图片中进行选择,终端继续自动为用户匹配对应的识别区域,直至用户选择出所有此待处理图片中的识别区域,用户在终端输入选择完成指令,完成此待处理图片的区域选择步骤。
上述实施例中,终端可通过用户输入的区域选择指令,为用户智能匹配出对应的识别区域,提高用户在区域选择时的可操作性。
在一个实施例中,上述步骤S304显示选择的识别区域之后,还可以包括:接收输入的区域调整指令;根据区域调整指令调整识别区域。
其中,区域调整指令是用于调整此识别区域的指令,可以是用户在终端屏幕上对识别区域的边界进行调整的指令。
具体地,在上述步骤S304中,终端在显示界面显示了选择的识别区域后,若用户发现此识别区域并非自己想要的识别区域时,可再向终端输入调整指令,对此识别区域进行调整。例如,终端生成的识别区域为矩形区域,用户通过拖动矩形的长和宽,使需识别的内容在此矩形之内。
上述实施例中,通过区域调整指令对终端智能判断的识别区域进行纠正,保证识别区域的准确性。
在一个实施例中,上述步骤S206中的根据区域选择指令在待处理图片上选择至少两个识别区域之后,还可以包括:记录至少两个识别区域的选择顺序;则上述的步骤S208中的根据选择的至少两个识别区域得到一张拼接图片,可以包括:获取背景图片;将选择的至少两个识别区域根据选择顺序排列在背景图片上,生成一张拼接图片。
其中,背景图片是用于放置识别区域,生成拼接图片的背景层。可以为透明色或其他颜色。
具体地,用户可依据待处理图片中需识别的内容的先后或重要性的顺序来进行顺序选择,并将选择的识别区域按照用户的选择顺序拼接在一个统一的背景层上,使拼接图片具有相同的背景色,得到一张拼接图片。
可选地,服务器获取到终端发送的拼接图片后,也按照拼接图片中多个识别区域的排列顺序来对其中的文字内容进行识别,得到的目标文本的排版顺序也和多个识别区域的排列顺序保持一致。
上述实施例中,通过用户的选择顺序来进行图片拼接和识别,使得最终得到的拼接图片与最终的目标文本的排版顺序都可以与用户选择识别区域的顺序一致。
在一个实施例中,上述步骤S210中的接收服务器发送的对拼接图片进行内容识别得到的目标文本之后,还可以包括:显示目标文本;接收输入的错误指令,并将错误指令发送至服务器;接收服务器返回的与错误指令对应的纠正内容。
其中,错误指令是当用户发现服务器内容识别得到的目标文本中的内容存在识别错误时,向终端输入的指令。可以是一个重新识别的指令,也可以是对目标文本中的部分内容进行标注,只对这部分内容进行再次识别的指令等等。
具体地,终端接收目标文本后,将此目标文本显示在显示界面上,若是用户发现服务器的内容识别不准确时,则向终端输入错误指令,端将此错误指令发送给服务器,使得服务器根据此错误指令对目标文档中的全部内容或者部分内容进行纠错。
可选地,技术人员可以在服务器端训练一个智能纠错模型,即以大量文本作为样本,通过机器学习和大数据训练得到的能够自动识别出文档中的错误内容的模型,自动对服务器对拼接图片识别得到的目标文本进行纠错。
上述实施例中,服务器可根据终端反馈的错误指令,收集服务器的识别结果,对于识别出错的部分进行排错。
应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种多区域内容识别装置,包括:图片采集模块100、图片显示模块200、区域选择模块300、图片拼接模块400和文本获取模块500,其中:
图片采集模块100,用于接收采集指令,并根据采集指令获取识别目标的待处理图片;
图片显示模块200,用于显示待处理图片;
区域选择模块300,用于接收输入的区域选择指令,并根据区域选择指令在待处理图片上选择至少两个识别区域;
图片拼接模块400,用于根据选择的至少两个识别区域得到一张拼接图片;
文本获取模块500,用于将拼接图片发送至服务器,并接收服务器发送的对拼接图片进行内容识别得到的目标文本。
在一个实施例中,上述区域选择模块300可以包括:
第一选择单元,用于接收输入的区域选择指令,根据待处理图片的显示差别选择与区域选择指令对应的识别区域。
区域显示单元,用于显示选择的识别区域。
继续选择单元,用于继续接收输入的区域选择指令,直至接收到输入的选择完成指令。
在一个实施例中,上述区域选择模块300还可以包括:
调整指令接收单元,用于接收输入的区域调整指令。
区域调整单元,用于根据区域调整指令调整识别区域。
在一个实施例中,上述多区域内容识别装置还可以包括:
选择顺序记录模块,用于记录至少两个识别区域的选择顺序。
则上述的图片拼接模块400可以包括:
背景获取单元,用于获取背景图片。
图片拼接单元,用于将选择的至少两个识别区域根据选择顺序排列在背景图片上,生成一张拼接图片。
在一个实施例中,上述多区域内容识别装置还可以包括:
文本显示模块,用于显示目标文本。
错误指令发送模块,用于接收输入的错误指令,并将错误指令发送至服务器。
纠错模块,用于接收服务器返回的与错误指令对应的纠正内容。
关于多区域内容识别装置的具体限定可以参见上文中对于区域内容识别方法的限定,在此不再赘述。上述多区域内容识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种区域内容识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:接收采集指令,并根据采集指令获取识别目标的待处理图片;显示待处理图片;接收输入的区域选择指令,并根据区域选择指令在待处理图片上选择至少两个识别区域;根据选择的至少两个识别区域得到一张拼接图片;将拼接图片发送至服务器,并接收服务器发送的对拼接图片进行内容识别得到的目标文本。
在一个实施例中,处理器执行计算机程序时实现的接收输入的区域选择指令,并根据区域选择指令在待处理图片上选择至少两个识别区域,包括:接收输入的区域选择指令,根据待处理图片的显示差别选择与区域选择指令对应的识别区域;显示选择的识别区域;继续接收输入的区域选择指令,直至接收到输入的选择完成指令。
在一个实施例中,处理器执行计算机程序时实现的显示选择的识别区域之后,还包括:接收输入的区域调整指令;根据区域调整指令调整识别区域。
在一个实施例中,处理器执行计算机程序时实现的根据区域选择指令在待处理图片上选择至少两个识别区域之后,还包括:记录至少两个识别区域的选择顺序;处理器执行计算机程序时实现的根据选择的至少两个识别区域得到一张拼接图片,包括:获取背景图片;将选择的至少两个识别区域根据选择顺序排列在背景图片上,生成一张拼接图片。
在一个实施例中,处理器执行计算机程序时实现的接收服务器发送的对拼接图片进行内容识别得到的目标文本之后,还包括:显示目标文本;接收输入的错误指令,并将错误指令发送至服务器;接收服务器返回的与错误指令对应的纠正内容。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:接收采集指令,并根据采集指令获取识别目标的待处理图片;显示待处理图片;接收输入的区域选择指令,并根据区域选择指令在待处理图片上选择至少两个识别区域;根据选择的至少两个识别区域得到一张拼接图片;将拼接图片发送至服务器,并接收服务器发送的对拼接图片进行内容识别得到的目标文本。
在一个实施例中,计算机程序被处理器执行时实现的接收输入的区域选择指令,并根据区域选择指令在待处理图片上选择至少两个识别区域,包括:接收输入的区域选择指令,根据待处理图片的显示差别选择与区域选择指令对应的识别区域;显示选择的识别区域;继续接收输入的区域选择指令,直至接收到输入的选择完成指令。
在一个实施例中,计算机程序被处理器执行时实现的显示选择的识别区域之后,还包括:接收输入的区域调整指令;根据区域调整指令调整识别区域。
在一个实施例中,计算机程序被处理器执行时实现的根据区域选择指令在待处理图片上选择至少两个识别区域之后,还包括:记录至少两个识别区域的选择顺序;计算机程序被处理器执行时实现的根据选择的至少两个识别区域得到一张拼接图片,包括:获取背景图片;将选择的至少两个识别区域根据选择顺序排列在背景图片上,生成一张拼接图片。
在一个实施例中,计算机程序被处理器执行时实现的接收服务器发送的对拼接图片进行内容识别得到的目标文本之后,还包括:显示目标文本;接收输入的错误指令,并将错误指令发送至服务器;接收服务器返回的与错误指令对应的纠正内容。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种区域内容识别方法,所述方法包括:
接收采集指令,并根据采集指令获取识别目标的待处理图片;
显示所述待处理图片;
接收输入的区域选择指令,并根据所述区域选择指令在所述待处理图片上选择至少两个识别区域;
根据选择的至少两个所述识别区域得到一张拼接图片;
将所述拼接图片发送至服务器,并接收所述服务器发送的对所述拼接图片进行内容识别得到的目标文本。
2.根据权利要求1所述的方法,其特征在于,所述接收输入的区域选择指令,并根据区域选择指令在所述待处理图片上选择至少两个识别区域,包括:
接收输入的区域选择指令,根据所述待处理图片的显示差别选择与所述区域选择指令对应的识别区域;
显示选择的所述识别区域;
继续所述接收输入的区域选择指令,直至接收到输入的选择完成指令。
3.根据权利要求2所述的方法,其特征在于,所述显示选择的所述识别区域之后,还包括:
接收输入的区域调整指令;
根据所述区域调整指令调整所述识别区域。
4.根据权利要求1所述的方法,其特征在于,所述根据区域选择指令在所述待处理图片上选择至少两个识别区域之后,还包括:
记录所述至少两个识别区域的选择顺序;
所述根据选择的至少两个所述识别区域得到一张拼接图片,包括:
获取背景图片;
将选择的所述至少两个识别区域根据所述选择顺序排列在所述背景图片上,生成一张拼接图片。
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述接收所述服务器发送的对所述拼接图片进行内容识别得到的目标文本之后,还包括:
显示所述目标文本;
接收输入的错误指令,并将所述错误指令发送至服务器;
接收所述服务器返回的与所述错误指令对应的纠正内容。
6.一种多区域内容识别装置,其特征在于,所述装置包括:
图片采集模块,用于接收采集指令,并根据采集指令获取识别目标的待处理图片;
图片显示模块,用于显示所述待处理图片;
区域选择模块,用于接收输入的区域选择指令,并根据区域选择指令在所述待处理图片上选择至少两个识别区域;
图片获取模块,用于根据选择的至少两个所述识别区域得到一张拼接图片;
文本获取模块,用于将所述拼接图片发送至服务器,并接收所述服务器发送的对所述拼接图片进行内容识别得到的目标文本。
7.根据权利要求6所述的装置,其特征在于,所述区域选择模块包括:
第一选择单元,用于接收输入的区域选择指令,根据所述待处理图片的显示差别选择与所述区域选择指令对应的识别区域;
区域显示单元,用于显示选择的所述识别区域;
继续选择单元,用于继续所述接收输入的区域选择指令,直至接收到输入的选择完成指令。
8.根据权利要求7所述的装置,其特征在于,所述区域选择模块还包括:
调整指令接收单元,用于接收输入的区域调整指令;
区域调整单元,用于根据所述区域调整指令调整所述识别区域。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
CN201910419206.0A 2019-05-20 2019-05-20 区域内容识别方法、装置、计算机设备和存储介质 Pending CN110245572A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910419206.0A CN110245572A (zh) 2019-05-20 2019-05-20 区域内容识别方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910419206.0A CN110245572A (zh) 2019-05-20 2019-05-20 区域内容识别方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN110245572A true CN110245572A (zh) 2019-09-17

Family

ID=67884501

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910419206.0A Pending CN110245572A (zh) 2019-05-20 2019-05-20 区域内容识别方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110245572A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580625A (zh) * 2020-12-11 2021-03-30 海信视像科技股份有限公司 一种显示设备和图像内容识别方法
US11997341B2 (en) 2020-07-14 2024-05-28 Hisense Visual Technology Co., Ltd. Display apparatus and method for person recognition and presentation

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667251A (zh) * 2008-09-05 2010-03-10 三星电子株式会社 具备辅助定位功能的ocr识别方法和装置
CN107358227A (zh) * 2017-06-29 2017-11-17 努比亚技术有限公司 一种标记识别方法、移动终端以及计算机可读存储介质
CN108470041A (zh) * 2018-02-12 2018-08-31 维沃移动通信有限公司 一种信息搜索方法及移动终端
CN108874283A (zh) * 2018-05-29 2018-11-23 努比亚技术有限公司 图片识别方法、移动终端及计算机可读存储介质
US20180365536A1 (en) * 2017-06-19 2018-12-20 Adobe Systems Incorporated Identification of fonts in an application
CN109117848A (zh) * 2018-09-07 2019-01-01 泰康保险集团股份有限公司 一种文本行字符识别方法、装置、介质和电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667251A (zh) * 2008-09-05 2010-03-10 三星电子株式会社 具备辅助定位功能的ocr识别方法和装置
US20180365536A1 (en) * 2017-06-19 2018-12-20 Adobe Systems Incorporated Identification of fonts in an application
CN107358227A (zh) * 2017-06-29 2017-11-17 努比亚技术有限公司 一种标记识别方法、移动终端以及计算机可读存储介质
CN108470041A (zh) * 2018-02-12 2018-08-31 维沃移动通信有限公司 一种信息搜索方法及移动终端
CN108874283A (zh) * 2018-05-29 2018-11-23 努比亚技术有限公司 图片识别方法、移动终端及计算机可读存储介质
CN109117848A (zh) * 2018-09-07 2019-01-01 泰康保险集团股份有限公司 一种文本行字符识别方法、装置、介质和电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11997341B2 (en) 2020-07-14 2024-05-28 Hisense Visual Technology Co., Ltd. Display apparatus and method for person recognition and presentation
CN112580625A (zh) * 2020-12-11 2021-03-30 海信视像科技股份有限公司 一种显示设备和图像内容识别方法

Similar Documents

Publication Publication Date Title
CN110442822B (zh) 一种小程序内容展示方法、装置、设备及存储介质
JP4829920B2 (ja) フォーム自動埋込方法及び装置、グラフィカルユーザインターフェース装置
CN109947967A (zh) 图像识别方法、装置、存储介质和计算机设备
CN108052687B (zh) 一种基于互联网的教育信息搜索***
US8897594B2 (en) Image reader, mobile terminal apparatus, and non-transitory computer readable medium
US9135234B1 (en) Collaborative generation of digital content with interactive reports
US11243670B2 (en) Information processing system, information processing apparatus, information processing method and non-transitory computer readable medium
CN110462613A (zh) 自动生成文档
CN105809162B (zh) 获取wifi热点、图片关联信息的方法和装置
CN110245572A (zh) 区域内容识别方法、装置、计算机设备和存储介质
US10965743B2 (en) Synchronized annotations in fixed digital documents
CN109710144A (zh) 笔记本的笔记页处理方法、计算机设备和存储介质
CN115174506B (zh) 会话信息处理方法、装置、可读存储介质和计算机设备
CN109697242B (zh) 拍照搜题方法、装置、存储介质和计算设备
CN111223155A (zh) 图像数据处理方法、装置、计算机设备和存储介质
CN112988568B (zh) 游戏测试方法、装置及电子设备
US20070300167A1 (en) Integrated development environment and related methods
US10275528B2 (en) Information processing for distributed display of search result
CN114237468B (zh) 文字图片的翻译方法、装置、电子设备及可读存储介质
US20210073458A1 (en) Comic data display system, method, and program
CN113835598A (zh) 信息获取方法、装置及电子设备
CN115437736A (zh) 一种笔记记录方法和装置
CN114998102A (zh) 图像处理方法、装置及电子设备
CN108664945A (zh) 图像文本及形音义特征识别方法和装置
CN114679546A (zh) 一种显示方法及其装置、电子设备和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination