CN112215087A - 图片审核方法、装置、计算机设备和存储介质 - Google Patents

图片审核方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112215087A
CN112215087A CN202010994033.8A CN202010994033A CN112215087A CN 112215087 A CN112215087 A CN 112215087A CN 202010994033 A CN202010994033 A CN 202010994033A CN 112215087 A CN112215087 A CN 112215087A
Authority
CN
China
Prior art keywords
target picture
picture
handwriting
information
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010994033.8A
Other languages
English (en)
Inventor
李仙果
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Shulian Technology Co ltd
Original Assignee
Zhejiang Shulian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Shulian Technology Co ltd filed Critical Zhejiang Shulian Technology Co ltd
Priority to CN202010994033.8A priority Critical patent/CN112215087A/zh
Publication of CN112215087A publication Critical patent/CN112215087A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/30Writer recognition; Reading and verifying signatures
    • G06V40/33Writer recognition; Reading and verifying signatures based only on signature image, e.g. static signature recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种图片审核方法、装置、计算机设备和存储介质。所述方法包括:通过手写打印分类器判断目标图片的内容类型;在目标图片包括手写内容的情况下,获取手写内容的笔迹信息,在预设的笔迹数据库中存在笔迹信息的情况下,指示目标图片审核成功;在目标图片包括其它内容的情况下,提取目标图片中的文字信息,在文字信息和与目标图片对应的目标信息匹配的情况下,指示目标图片审核成功。采用本方法能够提高图片审核的准确性和效率。

Description

图片审核方法、装置、计算机设备和存储介质
技术领域
本申请涉及图像处理技术领域,特别是涉及一种图片审核方法、装置、计算机设备和存储介质。
背景技术
在线下业务中,发生业务的各方往往需要纸质的单据作为证据,例如在物流业务中,回单就是运输过程中业务真实发生的有力凭证,具有不可替代的作用。随着信息化技术的发展,越来越多的证据单据以图片的形式在线上存储审核,因此亟待机器审核来代替人工完成图片的审核。由于图片证据的样式各种各样,需要判断图片的内容与真实业务的匹配度以及图片本身的可靠性。然而,在物流业务的回单审核场景中,用作审核的回单图片中不仅有打印的信息,此外,还有随意上传的无关图片等,导致机器审核的准确率较低。
针对相关技术中,物流业务中图片机器审核准确率低的问题,目前尚未提出有效的解决方案。
发明内容
基于此,有必要针对上述技术问题,提供一种图片审核方法、装置、计算机设备和存储介质。
第一方面,本申请实施例提供了一种图片审核方法,包括以下步骤:
通过手写打印分类器判断目标图片的内容类型,其中,所述内容类型包括手写内容和其它内容;
在所述目标图片包括所述手写内容的情况下,获取所述手写内容的笔迹信息,在预设的笔迹数据库中存在所述笔迹信息的情况下,指示所述目标图片审核成功;
在所述目标图片包括所述其它内容的情况下,提取所述目标图片中的文字信息,在所述文字信息和与所述目标图片对应的目标信息匹配的情况下,指示所述目标图片审核成功。
在其中一个实施例中,所述获取所述手写内容的笔迹信息之后,所述方法还包括:
获取所述目标图片的身份信息;
在预设的笔迹数据库中获取与所述身份信息对应的笔迹特征,在所述笔迹信息与所述笔迹特征匹配的情况下,指示所述目标图片审核成功。
在其中一个实施例中,在所述目标图片包括所述其它内容的情况下,所述方法还包括:
通过光学字符识别获取所述目标图片中的文字信息;
根据预设的关键信息特征从所述文字信息中提取所述关键信息;
在所述关键信息和与所述目标图片对应的目标信息匹配的情况下,指示所述目标图片审核成功。
在其中一个实施例中,在提取所述目标图片中的文字信息之后,所述方法还包括:
在所述文字信息中包括预设敏感词的情况下,指示所述目标图片审核失败。
在其中一个实施例中,在所述目标图片是其它内容的情况下,所述方法还包括:
获取所述目标图片中的字符数量;
在所述字符数量小于预设阈值的情况下,指示所述目标图片审核失败。
在其中一个实施例中,所述预设阈值的设置方法为将审核成功的所述目标图片中字符数量的最小值作为所述预设阈值。
在其中一个实施例中,所述方法还包括:
获取所述目标图片的感知哈希值;
在感知哈希值数据库中存在所述感知哈希值的情况下,指示所述目标图片审核失败。
在其中一个实施例中,所述方法还包括:
通过图片有效性分类器判断所述目标图片的有效性类型,其中,所述有效性类型包括有效图片和无效图片;
在所述目标图片为无效图片的情况下,指示所述目标图片审核失败,在所述目标图片为有效图片时,指示所述目标图片审核成功。
第二方面,本申请实施例还提供一种图片审核装置,所述装置包括分类模块、笔迹模块和关键信息模块:
所述分类模块包括手写打印分类器和图片有效性分类器,所述手写打印分类器用于判断目标图片的内容类型,其中,所述内容类型包括手写内容和其它内容,所述图片有效性分类器用于在所述目标图片为有效图片的情况下指示所述目标图片审核成功,在所述目标图片为无效图片的情况下指示所述目标图片审核失败;
所述笔迹模块用于在所述目标图片是手写内容的情况下,获取所述目标图片的身份信息和与所述身份信息对应的笔迹记录,在所述目标图片的笔迹信息与所述笔记记录匹配的情况下,指示所述目标图片审核成功;
所述关键信息模块用于在所述目标图片是其它内容的情况下,提取所述目标图片中的关键信息,在所述关键信息和与所述目标内容对应的订单信息匹配的情况下,指示所述目标图片审核失败。
第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述图片审核方法。
第四方面,本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述图片审核方法。
上述图片审核方法、装置、计算机设备和存储介质,通过手写打印分类器判断目标图片的内容类型;在目标图片包括手写内容的情况下,获取手写内容的笔迹信息,在预设的笔迹数据库中存在笔迹信息的情况下,指示目标图片审核成功;在目标图片包括其它内容的情况下,提取目标图片中的文字信息,在文字信息和与目标图片对应的目标信息匹配的情况下,指示目标图片审核成功,提高了图片审核的准确性和效率。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本发明实施例的图片审核方法的终端的硬件结构框图;
图2是根据本发明实施例中图片审核方法的流程图;
图3是根据本发明实施例的图片审核方法中手写内容审核的流程图;
图4是根据本发明实施例的图片审核方法中其它内容审核的流程图;
图5是根据本发明优选实施例的图片审核方法示意图;
图6是根据本发明优选实施例的图片审核方法中内容审核的示意图;
图7是根据本发明实施例中图片审核装置的示意图;
图8是根据本发明实施例中图片审核计算机设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
本实施例提供的方法实施例可以在终端、计算机或者类似的运算装置中执行。以运行在终端上为例,图1是根据本发明实施例的图片审核方法的终端的硬件结构框图。如图1所示,终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述终端的结构造成限定。例如,终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的图片审核方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括终端10的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在一个实施例中,图2是根据本发明实施例中图片审核方法的流程图,如图2所示,提供了一种图片审核方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
步骤S210,通过手写打印分类器判断目标图片的内容类型。其中,内容类型包括手写内容和其它内容。通过分类器算法模型将图片分为含有手写内容的图片和其它类型的图片,例如内容为打印的、或不含文字的图片,上述分类器算法模型是指在训练样本上执行后并且通过了性能监测的分类算法模型,该算法模型可以是决策树分类器、选择树分类器以及其它可以起到图像分类作用的算法模型,算法模型中可以包括但不限于决策树、逻辑回归、朴素贝叶斯、神经网络等算法。
步骤S220,在目标图片包括手写内容的情况下,获取手写内容的笔迹信息,在预设的笔迹数据库中存在笔迹信息的情况下,指示目标图片审核成功。在目标图片中包括手写内容的情况下,首先确定手写内容的位置,在通过对该区域的手写字体的笔迹信息进行提取,通过算法模型判断目标图片中的手写内容的笔迹是否在预设的笔迹数据库中,是则通过审核,否则不通过。上述笔迹数据库可以是目标图片所对应的单据的流转过程中可能会接触到的人员笔迹的集合。可选地,在目标图片包括手写内容和其它内容,在手写内容中的笔迹信息无法在笔迹数据库中搜索到匹配项,但是其它内容通过了审核的情况下,将该目标图片放入待定缓存区,进行后续鉴定和确认,在确认该目标图片中的手写内容可靠的情况下,将该手写内容对应的笔迹信息加入笔迹数据库中。
步骤S230,在目标图片包括其它内容的情况下,提取目标图片中的关键信息,在关键信息和与目标图片对应的目标信息匹配的情况下,指示目标图片审核成功。在目标图片包括其它内容的情况下,通过图片文字识别算法获取目标图片中的文字信息。此外,获取该目标图片所对应的目标信息,例如,物流事件、物流事件执行地点、物流货物编号和物流事件编号等。将获取到的文字信息与目标信息进行比对,文字信息与目标信息匹配则审核成功。
上述步骤S210至步骤S230,通过手写打印分类器判断目标图片的内容类型;在目标图片包括手写内容的情况下,获取手写内容的笔迹信息,在预设的笔迹数据库中存在笔迹信息的情况下,指示目标图片审核成功;在目标图片包括其它内容的情况下,提取目标图片中的文字信息,在文字信息和与目标图片对应的目标信息匹配的情况下,指示目标图片审核成功,通过手写打印分类器对目标图片中的内容类型进行判断,再根据不同的内容类型采取不同的处理方式,无论是打印还是手写的单据图片都可以进行机器审核,提高了审核的准确性和效率。
在一个实施例中,图3是根据本发明实施例的图片审核方法中手写内容审核的流程图,如图3所示,在获取手写内容的笔迹信息之后,该方法还包括以下步骤:
步骤S310,获取目标图片的身份信息;
步骤S320,在预设的笔迹数据库中获取与身份信息对应的笔迹特征,在笔迹信息与笔迹特征匹配的情况下,指示目标图片审核成功。
通过步骤S310至步骤S320,在目标图片包括手写内容的情况下,获取目标图片的身份信息,上述身份信息可以是目标图片上传者的身份信息,例如某个货物进仓管理员,也可以是与目标图片对应的物流事件的身份信息例如某个物流公司。再根据身份信息在笔迹数据库中获取与该身份信息对应的笔迹特征,在身份信息为个人的情况下,则获取个人的笔迹特征;在身份信息为集体的情况下,则获取该集体的笔迹特征集合。在目标图片中获取到的笔迹信息与笔迹数据库中获取到的笔迹特征匹配的情况下,指示目标图片审核成功。在本实施例中,通过获取目标图片的身份信息,并根据身份信息进行笔迹比对匹配,能够进一步提高图片审核的准确性和审核效率。
在一个实施例中,图4是根据本发明实施例的图片审核方法中其它内容审核的流程图,如图4所示,在目标图片包括其它内容的情况下,该方法还包括以下步骤:
步骤S410,通过光学字符识别获取目标图片中的文字信息。通过光学字符识别OCR(Optical Character Recognition)对目标图片中的文字信息进行识别,获取图片中的所有文字信息。
步骤S420,根据预设的关键信息特征从文字信息中提取关键信息。其中,预设的关键信息特征可以是业务方提出的需要核对的信息,例如物流回单中的车牌号、日期等。根据关键信息特征获取文字信息中的关键信息,例如具体的车牌号信息和日期信息。
步骤S430,在关键信息和与目标图片对应的目标信息匹配的情况下,指示目标图片审核成功。与目标图片对应的目标信息中指定了上述关键信息的内容,因此,将关键信息与目标信息进行比对,匹配则审核成功。
通过步骤S410至步骤S430,根据关键信息特征对目标图片中的文字进行过滤,仅对关键信息进行比对和匹配,能够进一步提高图片审核的效率。
在一个实施例中,在提取所述目标图片中的文字信息之后,在文字信息中包括预设敏感词的情况下,指示目标图片审核失败。可选地,上述敏感词可以是图片编辑软件在编辑之后留下的水印字符,在目标图片中提取到上述水印字符则表示该图片经过编辑,可靠性较差。因此,通过设置敏感词,过滤掉可信度较差的图片,可以进一步提高图片审核的准确度。
在一个实施例中,在目标图片是其它内容的情况下,获取目标图片中的字符数量;在字符数量小于预设阈值的情况下,指示目标图片审核失败。由于审核的目标图片中记载着物流信息,在大多数的应用场景中,该目标图片是一个有固定格式的表单,即使表单是未填的,也应该有“物流单号”、“车牌号码”和“日期”等字符,也就意味着表单中有字符数量的阈值。因此,在本实施例中,通过字符数量对目标图片进行审核,字符数量小于预设阈值的目标图片大概率是随意上传的无关图片。上述审核过程能够进一步提高图片审核的准确性。在一些实施例中,上述预设阈值是审核成功的目标图片中字符数量的最小值。其中,审核成功的目标图片指的是历史审核成功的图片,即统计历史记录中真实回单中的字符数量,取所有回单中字符数量最少的值作为字符数量判断的预设阈值,使得字符数量的审核更加准确。
在一个实施例中,图片审核的方法还包括获取目标图片的感知哈希值;在感知哈希值数据库中存在感知哈希值的情况下,指示目标图片审核失败。在本实施例中,提供了一种图片重复性的审核方式。感知哈希算法是一种图片感知哈希算法,相似度高的图片的phash值有可能相同。在本实施例中,对于各个审核图片,都将计算并且存储图片的感知哈希(Perceptual hash,phash)值。而对于待审核的目标图片,也会计算该图片的phash值,并且对比待审核图片的phash值与历史库中的phash值,如果有相同的phash值,则判断待审核图片为重复性图片。通过图片的重复性审核,能够避免用历史图片进行虚假审核的情景,进一步提高图片审核的准确性。
在一个实施例中,图片审核的方法还包括通过图片有效性分类器判断目标图片的有效性类型,其中,有效性类型包括有效图片和无效图片;在目标图片为无效图片的情况下,指示目标图片审核失败。在本实施例中,提供了一种图片整体有效性的审核过程,可选地,通过图片有效性分类器分类。本申请使用的分类器为二分类图片分类器,可以采用深度神经网络模型或者其他传统图片分类模型,目标图片通过该模型可以直接被分为有效图片或无效图片。上述图片的整体有效性可以包括图片的清晰程度、图片完整度和图片亮度等参数。例如,经过多次翻拍的图片清晰度较差,这类照片即使提取到的文字信息符合审核要求,依旧会因为图片整体质量较差而审核失败。图片的整体有效性审核能够过滤图片来源不明的图片,进一步提高图片审核的准确性。
应该理解的是,虽然图2至图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2至图4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
下面通过优选实施例对本申请实施例进行描述和说明。图5是根据本发明优选实施例的图片审核方法示意图,如图5所示,客户传递订单信息以及和订单对应的回单图片即目标图片,其中,订单信息中包含业务方需要审核的关键信息。首先,先对目标图片进行重复性审核,在目标图片不是重复图片的情况下,进入内容审核,否则将该目标图片判断为假回单,程序结束。再根据订单信息,对目标图片OCR获取到的文字信息进行内容审核,审核通过则判断图片有效。内容审核过程中,文字信息部分有效的情况下则对目标图片进行整体有效性审核,通过则判断该目标图片有效,不通过则判断该目标图片无效。
在上述审核过程中,回单重复性审核方法包括:计算历史回单的phash值,然后进行对phash值进行存储;计算目标图片的phash值,对比待审核图片的phash值与历史库中的phash值,如果有相同的phash值,则判断待审核图片为重复性图片,即目标图片为无效,审核结果为失败。
图6是根据本发明优选实施例的图片审核方法中内容审核的示意图,如图6所示,内容审核包括:对目标图片进行手写/非手写分类,如果图片为手写,则确定手写文字位置,然后将该位置文字的笔迹信息与该客户历史记录中的手写内容进行笔迹对比匹配,如果匹配成功,则通过审核,否则不通过审核。手写打印分类器可以将图片分为含有手写内容的图片和其他类型的图片的算法模型。如果图片为非手写图片,则进行OCR识别得到图片中的文字信息,可选地,根据预设的敏感词库,在文字信息中查找敏感词,如果找到任意一个敏感词库中的敏感词则为存在敏感词。如果文字信息中存在敏感词,判断目标图片为无效回单并结束程序,否则进入字符数量判断过程。获取目标图片中文字信息包含的字符数量,判断该字符数量是否超过字数的预设阈值。预设阈值的计算是统计历史记录中真实回单OCR结果的字符数量,取所有真实回单OCR结果字符数量最少的值作为字符数量判断的预设阈值。如果目标图片中的字符数量不超过阈值则判断目标图片为无效回单并结束程序,否则进入关键信息审核。从文字信息中获取关键信息,例如日期、车牌号等,然后判断关键信息与订单信息是否一致,如果一致则判断目标图片为真实回单,即审核成功并结束程序。当OCR识别出图片中的文字信息后,可以根据关键信息的特点进行正则表达式匹配或其他方式将关键信息从大量的文字中准确取出。
图片的整体有效性审核则通过分类器对图片进行判断,图片有效性分类器为二分类图片分类器,可以采用深度神经网络模型如VGGNet、inception网络等或者其他传统图片分类模型如支持向量机(Support Vector Machine,简称SVM),决策树等,目标图片通过该分类模型可以被分为有效图片或无效图片。
需要说明的是,上述图片审核方案的优选实施例中包括三个过程,图片重复性判断过程、图片内容有效性判断过程和图片整体有效性判断过程。这些过程有缺失,或者过程中的一些环节省略时仍然可以起到一定的有效性审核效果。例如只使用图片整体有效性判断过程时审核准确率会有一定的下降,但同样能够实现审核目的。例如辅助人工审核时提高审核效果和审核质量,或则直接代替人工审核。另外本技术方案的三个过程顺序可以进行更改,例如先进行图片内容有效性判断,然后再进行图片重复性判断,均可以起到对回单进行审核的作用。
上述图片审核方法能够在复杂场景下进行稳定的工作,在审核要求不是特别严格的场景下可以代替人工来审核图片,节约劳动成本。在要求严格的场景下也可以起到辅助审核的效果,提高审核工作效率。该方案具有多个审核环节,能够给出各个环节的审核通过或不通过的原因,方便用户对审核结果进行核查跟踪;而且人工审核存在审核标准主观性大,偶然误差难以避免的情况,本方案用于辅助审核时也可以起到提高审核质量的效果。
在一个实施例中,图7是根据本发明实施例中图片审核装置的示意图,如图7所示,提供了一种图片审核装置,该装置包括分类模块70、笔迹模块74和关键信息模块76:
分类模块70包括手写打印分类器71和图片有效性分类器73,手写打印分类器71用于判断目标图片的内容类型,其中,内容类型包括手写内容和其它内容;图片有效性分类器73用于在目标图片为有效图片的情况下指示目标图片审核成功,在目标图片为无效图片的情况下指示目标图片审核失败;
笔迹模块74用于在目标图片是手写内容的情况下,获取目标图片的身份信息和与身份信息对应的笔迹记录,在目标图片的笔迹信息与笔记记录匹配的情况下,指示目标图片审核成功;
关键信息模块76用于在目标图片是其它内容的情况下,提取目标图片中的关键信息,在关键信息和与目标内容对应的订单信息匹配的情况下,指示目标图片审核失败。
关于图片审核装置的具体限定可以参见上文中对于图片审核方法的限定,在此不再赘述。上述图片审核装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,图8是根据本发明实施例中图片审核计算机设备的结构示意图,如图8所示,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储图片审核数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图片审核方法。
上述图片审核装置,通过手写打印分类器判断目标图片的内容类型;在目标图片包括手写内容的情况下,获取手写内容的笔迹信息,在预设的笔迹数据库中存在笔迹信息的情况下,指示目标图片审核成功;在目标图片包括其它内容的情况下,提取目标图片中的文字信息,在文字信息和与目标图片对应的目标信息匹配的情况下,指示目标图片审核成功,提高了审核的准确性和效率。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述图片审核方法。
上述图片审核计算机设备,通过手写打印分类器判断目标图片的内容类型;在目标图片包括手写内容的情况下,获取手写内容的笔迹信息,在预设的笔迹数据库中存在笔迹信息的情况下,指示目标图片审核成功;在目标图片包括其它内容的情况下,提取目标图片中的文字信息,在文字信息和与目标图片对应的目标信息匹配的情况下,指示目标图片审核成功,提高了审核的准确性和效率。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述图片审核方法。
上述图片审核存储介质,通过手写打印分类器判断目标图片的内容类型;在目标图片包括手写内容的情况下,获取手写内容的笔迹信息,在预设的笔迹数据库中存在笔迹信息的情况下,指示目标图片审核成功;在目标图片包括其它内容的情况下,提取目标图片中的文字信息,在文字信息和与目标图片对应的目标信息匹配的情况下,指示目标图片审核成功,提高了审核的准确性和效率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (11)

1.一种图片审核方法,其特征在于,所述方法包括:
通过手写打印分类器判断目标图片的内容类型,其中,所述内容类型包括手写内容和其它内容;
在所述目标图片包括所述手写内容的情况下,获取所述手写内容的笔迹信息,在预设的笔迹数据库中存在所述笔迹信息的情况下,指示所述目标图片审核成功;
在所述目标图片包括所述其它内容的情况下,提取所述目标图片中的文字信息,在所述文字信息和与所述目标图片对应的目标信息匹配的情况下,指示所述目标图片审核成功。
2.根据权利要求1所述的方法,其特征在于,所述获取所述手写内容的笔迹信息之后,所述方法还包括:
获取所述目标图片的身份信息;
在预设的笔迹数据库中获取与所述身份信息对应的笔迹特征,在所述笔迹信息与所述笔迹特征匹配的情况下,指示所述目标图片审核成功。
3.根据权利要求1所述的方法,其特征在于,在所述目标图片包括所述其它内容的情况下,所述方法还包括:
通过光学字符识别获取所述目标图片中的文字信息;
根据预设的关键信息特征从所述文字信息中提取所述关键信息;
在所述关键信息和与所述目标图片对应的目标信息匹配的情况下,指示所述目标图片审核成功。
4.根据权利要求1至3任一项所述的方法,其特征在于,在提取所述目标图片中的文字信息之后,所述方法还包括:
在所述文字信息中包括预设敏感词的情况下,指示所述目标图片审核失败。
5.根据权利要求1至3任一项所述的方法,其特征在于,在所述目标图片包括所述其它内容的情况下,所述方法还包括:
获取所述目标图片中的字符数量;
在所述字符数量小于预设阈值的情况下,指示所述目标图片审核失败。
6.根据权利要求5所述的方法,其特征在于,所述预设阈值的设置方法为将审核成功的所述目标图片中字符数量的最小值作为所述预设阈值。
7.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
获取所述目标图片的感知哈希值;
在感知哈希值数据库中存在所述感知哈希值的情况下,指示所述目标图片审核失败。
8.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
当上述方法审核无法确定审核成功或审核失败时,通过图片有效性分类器判断所述目标图片的有效性类型,其中,所述有效性类型包括有效图片和无效图片;
在所述目标图片为无效图片的情况下,指示所述目标图片审核失败,在所述目标图片为有效图片的情况下,指示所述目标图片审核成功。
9.一种图片审核装置,其特征在于,所述装置包括分类模块、笔迹模块和关键信息模块:
所述分类模块包括手写打印分类器和图片有效性分类器,所述手写打印分类器用于判断目标图片的内容类型,其中,所述内容类型包括手写内容和其它内容,所述图片有效性分类器用于在所述目标图片为有效图片的情况下指示所述目标图片审核成功,在所述目标图片为无效图片的情况下指示所述目标图片审核失败;
所述笔迹模块用于在所述目标图片是手写内容的情况下,获取所述目标图片的身份信息和与所述身份信息对应的笔迹记录,在所述目标图片的笔迹信息与所述笔记记录匹配的情况下,指示所述目标图片审核成功;
所述关键信息模块用于在所述目标图片是其它内容的情况下,提取所述目标图片中的关键信息,在所述关键信息和与所述目标内容对应的订单信息匹配的情况下,指示所述目标图片审核失败。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
CN202010994033.8A 2020-09-21 2020-09-21 图片审核方法、装置、计算机设备和存储介质 Pending CN112215087A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010994033.8A CN112215087A (zh) 2020-09-21 2020-09-21 图片审核方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010994033.8A CN112215087A (zh) 2020-09-21 2020-09-21 图片审核方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN112215087A true CN112215087A (zh) 2021-01-12

Family

ID=74050227

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010994033.8A Pending CN112215087A (zh) 2020-09-21 2020-09-21 图片审核方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112215087A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861757A (zh) * 2021-02-23 2021-05-28 天津汇智星源信息技术有限公司 基于文本语义理解的笔录智能审核方法及电子设备
CN113255836A (zh) * 2021-06-28 2021-08-13 北京乐学帮网络技术有限公司 一种作业数据处理方法、装置、计算机设备和存储介质
CN114866271A (zh) * 2022-03-15 2022-08-05 上海东普信息科技有限公司 电子凭证的生成方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102662473A (zh) * 2012-04-16 2012-09-12 广东步步高电子工业有限公司 基于眼部动作识别来实现人机信息交互的装置及方法
US20150339543A1 (en) * 2014-05-22 2015-11-26 Xerox Corporation Method and apparatus for classifying machine printed text and handwritten text
US20160063240A1 (en) * 2014-09-01 2016-03-03 Alibaba Group Holding Limited Managing registration of user identity using handwriting
CN109887153A (zh) * 2019-02-03 2019-06-14 国信电子票据平台信息服务有限公司 一种财税处理方法和处理***
WO2020077895A1 (zh) * 2018-10-16 2020-04-23 深圳壹账通智能科技有限公司 签约意向判断方法、装置、计算机设备和存储介质
CN111079499A (zh) * 2019-07-02 2020-04-28 广东小天才科技有限公司 一种学习环境中的书写内容识别方法及***
CN111178203A (zh) * 2019-12-20 2020-05-19 江苏常熟农村商业银行股份有限公司 签名审核方法、装置、计算机设备和存储介质
CN111368128A (zh) * 2020-03-12 2020-07-03 北京海益同展信息科技有限公司 目标图片的识别方法、装置和计算机可读存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102662473A (zh) * 2012-04-16 2012-09-12 广东步步高电子工业有限公司 基于眼部动作识别来实现人机信息交互的装置及方法
US20150339543A1 (en) * 2014-05-22 2015-11-26 Xerox Corporation Method and apparatus for classifying machine printed text and handwritten text
US20160063240A1 (en) * 2014-09-01 2016-03-03 Alibaba Group Holding Limited Managing registration of user identity using handwriting
WO2020077895A1 (zh) * 2018-10-16 2020-04-23 深圳壹账通智能科技有限公司 签约意向判断方法、装置、计算机设备和存储介质
CN109887153A (zh) * 2019-02-03 2019-06-14 国信电子票据平台信息服务有限公司 一种财税处理方法和处理***
CN111079499A (zh) * 2019-07-02 2020-04-28 广东小天才科技有限公司 一种学习环境中的书写内容识别方法及***
CN111178203A (zh) * 2019-12-20 2020-05-19 江苏常熟农村商业银行股份有限公司 签名审核方法、装置、计算机设备和存储介质
CN111368128A (zh) * 2020-03-12 2020-07-03 北京海益同展信息科技有限公司 目标图片的识别方法、装置和计算机可读存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861757A (zh) * 2021-02-23 2021-05-28 天津汇智星源信息技术有限公司 基于文本语义理解的笔录智能审核方法及电子设备
CN113255836A (zh) * 2021-06-28 2021-08-13 北京乐学帮网络技术有限公司 一种作业数据处理方法、装置、计算机设备和存储介质
CN114866271A (zh) * 2022-03-15 2022-08-05 上海东普信息科技有限公司 电子凭证的生成方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN112215087A (zh) 图片审核方法、装置、计算机设备和存储介质
US11055524B2 (en) Data extraction pipeline
CN109729383B (zh) 双录视频质量检测方法、装置、计算机设备和存储介质
CN108846676B (zh) 生物特征辅助支付方法、装置、计算机设备及存储介质
CN111191539B (zh) 证件真伪验证方法、装置、计算机设备和存储介质
US20210004580A1 (en) Anomaly and fraud detection with fake event detection using machine learning
CN110489415B (zh) 一种数据更新方法及相关设备
EA034354B1 (ru) Система и способ проверки подлинности информации документа
US20180189561A1 (en) Identity document validation using biometric image data
US11824851B2 (en) Identification document database
US20240095325A1 (en) Intelligent gallery management for biometrics
CN109214904B (zh) 财务造假线索的获取方法、装置、计算机设备和存储介质
CN110782277A (zh) 资源处理方法、装置、计算机设备和存储介质
WO2021164205A1 (zh) 基于身份识别的数据审核方法、装置和计算机设备
CN111782550B (zh) 基于用户隐私保护训练指标预测模型的方法及装置
CN111191568A (zh) 翻拍图像识别方法、装置、设备及介质
KR20210117324A (ko) 창고 관리 시스템
CN114020578A (zh) 基于用户画像的异常账户检测方法、装置、设备及介质
CN111935104A (zh) 物联网设备非法接入检测方法、装置和计算机设备
CN111260214A (zh) 核电站预留工单领料方法、装置、设备及存储介质
US20210090180A1 (en) Methods for determining image content when generating a property loss claim through predictive analytics
CN113468017A (zh) 应用于区块链的在线业务状态检测方法及业务服务器
CN115759758A (zh) 风险评估方法、装置、设备及存储介质
US20230005122A1 (en) Image forgery detection via pixel-metadata consistency analysis
CN112862409A (zh) 提运单核验方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination