CN113780116A - ***分类方法、装置、计算机设备和存储介质 - Google Patents

***分类方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN113780116A
CN113780116A CN202110987139.XA CN202110987139A CN113780116A CN 113780116 A CN113780116 A CN 113780116A CN 202110987139 A CN202110987139 A CN 202110987139A CN 113780116 A CN113780116 A CN 113780116A
Authority
CN
China
Prior art keywords
invoice
processed
image
picture
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110987139.XA
Other languages
English (en)
Inventor
丁拥科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongan Online P&c Insurance Co ltd
Original Assignee
Zhongan Online P&c Insurance Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongan Online P&c Insurance Co ltd filed Critical Zhongan Online P&c Insurance Co ltd
Priority to CN202110987139.XA priority Critical patent/CN113780116A/zh
Publication of CN113780116A publication Critical patent/CN113780116A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/04Billing or invoicing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Accounting & Taxation (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Character Input (AREA)

Abstract

本申请涉及一种***分类方法、装置、计算机设备和存储介质。所述方法包括:获取待处理***图片;对所述待处理***图片进行图像码识别;当识别到图像码时,对所述待处理***图片进行识别以得到所述待处理***图片中的分类字符;根据所述分类字符对所述待处理***图片进行分类。采用本方法能够快速将某一类***从大量***图片中分离出来。

Description

***分类方法、装置、计算机设备和存储介质
技术领域
本申请涉及人工智能图像技术领域,特别是涉及一种电子***分类方法、装置、计算机设备和存储介质。
背景技术
电子***作为消费者消费的有效凭证,相比传统的纸质***,它具有互通性、无纸化以及实名制的基本特点,且开具更为迅速,查询真伪更为方便,也便于保存。因此,电子***获得了广泛的推广与应用。
在当前实际保险业务场景下,用户会上传手机拍摄的***照片作为理赔凭证,即便是电子***,也会通过打印出来进行拍摄或者直接上传***截图来进行提交。但对于处理电子***和普通***识别问题的方法是不同的,电子***可以通过识别***上的二维码迅速获得***的关键信息,准确率高,而普通***只能通过传统OCR等技术来获得***信息,准确率相对较低。如何从大量的***中将电子***分离出来用于后续***信息识别成为一个非常有意义的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够快速对大量***进行分类的***分类方法、装置、计算机设备和存储介质。
一种***分类方法,所述方法包括:
获取待处理***图片;
对所述待处理***图片进行图像码识别;
当识别到图像码时,对所述待处理***图片进行识别以得到所述待处理***图片中的分类字符;
根据所述分类字符对所述待处理***图片进行分类。
在其中一个实施例中,所述对所述待处理***图片进行识别以得到所述待处理***图片中的分类字符,包括:
对所述待处理***图片进行分割以得到表头区域;
识别所述表头区域中的分类字符。
在其中一个实施例中,所述对所述待处理***图片进行分割以得到表头区域是通过预先训练的表头检测模型进行处理的;其中,所述表头检测模型的训练方式包括:
读取第一***图像,并标记所述第一***图像中表头位置;
根据所述第一***图像和对应的所述表头位置进行训练得到表头检测模型。
在其中一个实施例中,所述识别所述表头区域中的分类字符是通过预先训练的文字识别模型得到的;其中,所述文字识别模型的训练方式包括:
随机生成不同长度的文本切片,并标记所述文本切片的文本内容;
根据所述不同长度的文本切片和对应的标记的文本内容进行训练得到文字识别模型。
在其中一个实施例中,所述根据所述分类字符对所述待处理***图片进行分类,包括:
获取所述分类字符所对应的***分类作为所述待处理***图片的分类。
在其中一个实施例中,所述对所述待处理***图片进行图像码识别是通过预先训练的图像码检测模型得到的;其中,所述图像码检测模型的训练方式包括:
读取第二***图像,并根据所述第二***图像是否含有图像码生成目标标记;
根据所述第二***图像和所述目标标记进行模型训练得到图像码检测模型。
一种***分类装置,所述装置包括:
接收模块,用于获取待处理***图片;
图像码检测模块,用于判断待处理***图片中是否含有图像码;
分类字符识别模块,用于当识别到图像码时,对所述待处理***图片进行识别以得到所述待处理***图片中的分类字符;
分类模块,用于根据所述分类字符对所述待处理***图片进行分类。
在其中一个实施例中,所述分类字符识别模块包括:
表头检测单元,用于对所述待处理***图片进行分割以得到表头区域待;
文字识别单元,用于识别所述表头区域中的分类字符。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
上述电子***分类方法、装置、计算机设备和存储介质,首先通过获取待处理***图片,并对***图片进行图像码识别判断该***图片中是否含有图像码,若是则进入下一步检测,否则就及时结束判别过程,这样就能起到节省程序耗时的目的;当识别到图像码时,进一步识别***图片中的分类字符,并根据分类字符对***图片进行分类,从而能够根据分类字符快速地在大量***中对***进行分类,以为后续对不同类型的***进行不一样的处理奠定基础。
附图说明
图1为一个实施例中***分类方法的应用环境图;
图2为一个实施例中***分类方法的流程示意图;
图3为一个实施例中对待处理***图片进行识别以得到待处理***图片中的分类字符步骤的流程示意图;
图4为一个实施例中***图片示意图;
图5为一个实施例中预先训练表头检测模型的流程示意图;
图6为一个实施例中预先训练文字识别模型的流程示意图;
图7为一个实施例中预先训练图像码检测模型的流程示意图;
图8为一个实施例中一种电子***分类方法的流程示意图;
图9为一个实施例中一种***分类装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的***分类方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端102可以将获取待处理***图片发送到服务器104,从而服务器104可以对该待处理***图片进行处理,例如服务器104判断该待处理***图片中是否包含图像码,若待处理***图片中包含图像码时,则进入下一步检测,否则就及时结束判别过程,这样就能起到节省程序耗时的目的;当待处理***图片中含有图像码时进行下一步检测,识别待处理***图片中的分类字符,并根据分类字符对当前该待处理***图片进行分类。这样可以实现从大量***中快速的进行***分类。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种***分类方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,获取待处理***图片。
其中,待处理***图片是服务器接收的与终端上传的***照片,该待处理***图片可以是由终端上传的电子***的截图,也可以是拍摄的打印出来的电子***或是拍摄的普通***。例如,终端可以根据需要从终端中选取部分或全部的待处理***图片并上传至服务器,这样服务器可根据指令对待处理***图片进行分类。当待处理***图片为电子***图片,则服务器可以通过识别电子***图片上的二维码迅速获得***的关键信息,准确率高。当待处理***图片为普通***图片,则服务器通过OCR等技术来获得***信息。
步骤204,对待处理***图片进行图像码识别。
其中,图像码是指包括***信息的可识别的条码,其可以是一维码、二维码或者是条形码。
具体地,服务器获取用户上传的待识别***图像后,判断待识别***图像中是否包含图像码,以便对待识别***图像进行下一步处理。
可选地,服务器获取终端上传的待识别***图像后,使用图像码检测模型对该待识别***图像进行识别以判断是否包含图像码,若包括图像码则进入下一个处理步骤进行识别,否则就及时结束判断过程,起到节省程序耗时的目的。
需要说明的一点是,***分类包括但不限于电子***和普通***,其中电子***和普通***可以根据***中的分类字符进行分类,但是由于对字符进行识别耗时较大,因此本实施例中,服务器先通过判断待处理***图片中是否包括图像码以对待处理***进行初始分类,从而过滤掉大部分普通***,进而再对剩余的待处理***图片进行字符识别,这样减少了字符识别的待处理***的数量,从而提高了整个分类流程的效率。
步骤206,当识别到图像码时,对待处理***图片进行识别以得到待处理***图片中的分类字符。
其中,分类字符是指对***图片分类的特定的字符,例如电子***中在表头区域存在“电子”两个字,而普通***中则不存在。因此服务器可以通过识别特定区域中的分类字符,并根据特定区域中的分类字符对用户上传的待识别的***图像进行分类。
其中,服务器在判定待处理***图片中存在图像码后,则继续对该待处理***进行分类字符识别,若是识别到分类字符,则根据分类字符对待处理***进行分类。
可选地,服务器检测到用户上传的待处理***图片后,对该待处理***图片进行分割,得到该待处理***图片的特定区域,例如表头区域,并将表头区域裁剪出来得到相应的表头切片,然后识别表头切片中所包含的分类字符。这样仅对表头区域的字符进行识别,又进一步减少了字符识别的数量,提高了处理效率。
步骤208,根据分类字符对待处理***图片进行分类。
具体地,服务器根据当前待处理***图片的表头区域文字中的分类字符对***图片进行分类。
可选地,分类字符可以是有一个也可以是多个,例如服务器可以根据“电子”二字对待处理的***图片进行分类,也可以根据“电子”和“医疗”两个分类字符对待处理的***图片进行分类。具体地,当服务器判定分类字符为“电子”时,则将对应的待处理***分类为电子***,否则分类普通***。
其中,还需要说明的一定是,当服务器接收到的待处理***的数量较多时,可以通过负载均衡的方式将待处理***分配至不同的线程进行处理。此外线程还可以分为图像码检测线程,分类字符识别线程等,通过不同的线程来并行处理不同的步骤,提高处理效率。
上述电子***分类方法中,首先通过获取待处理***图片,并对***图片进行图像码识别判断该***图片中是否含有图像码,若是则进入下一步检测,否则就及时结束判别过程,这样就能起到减少程序耗时地目的;当识别到图像码时,进一步识别***图片中的分类字符,并根据分类字符对***图片进行分类,从而能够根据分类字符快速地在大量***中对***进行分类,为后续不同类型的***进行处理奠定基础。
在其中一个实施例中,如图3所示,图3为图2所示实施例中的步骤206的步骤流程,该步骤206,具体地对待处理***图片进行识别以得到待处理***图片中的分类字符,包括以下步骤:
步骤302:对待处理***图片进行分割以得到表头区域。
具体地,待处理***图片中包括表格区域和表头区域,具体地,可以参见图4所示,其中表头区域是指位于待处理***图片的顶部中间位置的区域。剩余的区域则为表格区域。
服务器通过对待处理***图片进行分割以得到表头区域,可选地,服务器可以通过预先训练得到的表头检测模型对待处理***图片进行分割得到表头区域,或者是通过对应的图像识别规则对待处理***图片进行分割得到表头区域。
服务器对已识别到图像码的待处理***图片进行定位检测,服务器定位到当前待处理***图片的表头位置后,对当前待处理***图片进行分割得到***图片表头区域。其中可选地,为了避免误差,服务器可以将识别得到的表头区域向外延伸预设像素,例如5个像素,然后对延伸预设像素后的表头区域进行裁剪得到目标表头区域。
步骤304:识别表头区域中的分类字符。
具体地,分类字符是指对***图片分类的特定的字符。
服务器获得目标表头区域后,对目标表头区域进行识别,读取目标表头区域中包含的文本内容,其中文本内容包括分类字符和其他字符。可选地,服务器可以仅识别读取到分类字符即可,以减少字符的识别量,例如服务器对表头区域进行识别以判断表头区域是否包括分类字符“电子”。
在上述实施例中,由于服务器可以识别待处理***图片中表头区域的文字,并根据***表头区域文字中所包括地分类字符对识别***图片进行分类,从而避免对***图片进行人工分类造成大量时间损耗。
在其中一个实施例中,如图5所示,图5为一个实施例中的表头检测模型训练步骤的步骤流程,待处理***图片进行分割以得到表头区域是通过预先训练的表头检测模型进行处理的;其中,表头检测模型的训练方式包括以下步骤:
步骤502:读取第一***图像,并标记第一***图像中表头位置。
具体地,表头检测模型是指用于获取***图片表头区域的机器学习模型,训练完成后的表头检测模型可快速地对待处理***图像进行分割以得到表头区域;第一***图像是指用于训练表头检测模型的***图像数据,其可以是包括表头的任意***图片。
其中,用户预先对每一张第一***图像中的表头位置进行标记,这样服务器可以获取到标记了表头位置的第一***图像,该第一***图像携带有标记的表头标签。
步骤504:根据第一***图像和对应的表头位置进行训练得到表头检测模型。
服务器将第一***图像及对应的表头位置输入至第一机器学习模型,其中,第一机器学习模型是指可以获取图像中某一区域定位的机器学习模型,其中可选地,第一机器学习模型可选择EAST(An Efficient and Accurate Scene Text Detector,一种文字检测模型)、DBNet(Differentiable Binarization Network,一种文字检测模型)等模型,该第一机器学习模型通过对大量第一***图像及其对应的表头位置进行训练学习,得到能够对待处理***图像进行识别以获得相应表头区域的表头检测模型。
服务器在在判定待处理***图片中存在图像码后,通过表头检测模型对当前待处理***图片的表头区域进行定位,并对待处理***图片进行分割得到相应的表头切片。
在上述实施例中,由于通过训练得到了检测第一***图片的表头检测模型,可快速自动识别***表头位置,这样通过表头检测模型能够更快速、更准确地对***图片表头进行识别。
在其中一个实施例中,如图6所示,图6为一个实施例中的文字识别模型训练步骤的步骤流程,识别表头区域中的分类字符是通过预先训练的文字识别模型得到的;其中,文字识别模型的训练方式包括以下步骤:
步骤602:随机生成不同长度的文本切片,并标记文本切片的文本内容。
具体地,文字识别模型是指用于读取***表头区域文字内容的机器学习模型,训练完成后的文字识别模型可快速读取待处理***图像中表头切片的文本内容,随机生成的不同长度的文本切片是指用于训练文字识别模型的文本切片数据,其中由于现实世界中各省各地区的***表头文字长度不是固定的,例如“天津市医疗门诊收费票据”和“广东省医疗收费票据”,因此服务器在随机生成训练数据时其长度也是按一定规则随机变化的,例如均等地生成不同长度的文本切片,或者是根据文字识别模型的应用地区中所涉及的***的表头中文字的多少来生成对应长度的文本切片,而不是每一种长度都生成。
服务器随机生成一系列不同长度的文本切片,并读取每一个文本切片中的文本内容对相应的文本切片进行标记,其中不同长度的文本切片为文字识别模型训练集样本,对应的文本内容为样本标签。
步骤604:根据不同长度的文本切片和对应的标记的文本内容进行训练得到文字识别模型。
服务器将一系列不同长度的文本切片及其对应的文本内容标签输入至第二机器学习模型,其中第二机器学习模型是指可以识别图像中内容文本的机器学习模型,其中可选地,第二机器学习模型可选择CRNN(Convolutional Recurrent Neural Network,卷积循环神经网络)等模型,该第二机器学习模型通过对一系列不同长度的文本切片和对应的文本内容进行训练学习,得到能够识别待处理***图像进行识别以得到表头区域内容的文字识别模型。
服务器通过预先训练的表头检测模型对待处理***图片进行识别后分割得到相应的表头切片,再通过预先训练的文字识别模型对表头切片进行识别,得到待处理***图片表头切片的文本内容。
在上述实施例中,由于通过训练得到了文字识别模型,文字识别模型可快速、准确的读取***图片中的文本内容,从而避免了人工读取***图片中包含的文本内容,节省人力资源开销。
在其中一个实施例中,根据分类字符对待处理***图片进行分类,包括:获取分类字符所对应的***分类作为待处理***图片的分类。
具体地,服务器根据文字识别模型所识别的分类字符对待处理的***图片进行分类,其中分类字符是指对***图片分类的特定的字符,可根据不同的应用场景进调整。
可选地,分类字符可以是有一个也可以是多个,例如服务器可以根据“电子”二字对待处理的***图片进行分类,也可以根据“电子”和“医疗”两个分类字符对待处理的***图片进行分类。具体地,当服务器判定分类字符为“电子”时,则将对应的待处理***分类为电子***,否则分类普通***。
服务器通过预先训练的表头检测模型对待处理***图片进行识别后分割得到相应的表头切片,再通过预先训练的文字识别模型对表头切片进行识别,得到待处理***图片表头区域的文本内容,然后根据待处理***图片表头区域的文本内容中所包括的分类字符对待处理***图片进行分类。
在上述实施例中,由于服务器可根据文字识别模型所识别的***图片表头切片中的分类字符对***图片进行分类,从而能够依据分类字符快速、准确地对大量***进行分类,用于后续***图片识别。
在其中一个实施例中,如图7所示,图7为一个实施例中预先训练的图像码检测模型步骤流程图,该图像码检测模型包括以下步骤:
步骤702:读取第二***图像,并根据第二***图像是否含有图像码生成目标标记。
具体地,图像码检测模型是指用于判断待处理***图片中是否包括图像码的机器学习模型,训练完成后的图像码检测模型可快速地对待处理***图片进行识别判断是否包括图像码;图像码是指包括***信息的可识别的条形码,其可以是一维码、二维码或者是条形码。
服务器读取每一张第二***图像,并对每一张第二***是否包括图像码生成目标标记,可选地其目标标记可以是“1”或“0”,若第二***图像中包含图像码,则第二图像的目标标记为“1”否则为“0”,其中第二***为图像码检测模型的样本,对应的目标标记为样本标签。
可选地,第二***可以是真实的***图像,其数据更为真实,使训练的图像码检测模型能够对图像码的识别更为准确,也可以是服务器通过图像生成方式将图像码经过处理后贴在***图像上生成的,其中空间处理的目的是为是更贴近真实的***图片,若第二图像为图像生成方式生成的,则可以直接得到图像码的坐标,更加方便快捷。
步骤704:根据第二***图像和目标标记进行模型训练得到图像码检测模型。
服务器将第二***图像及对应的目标标记输入至第三机器学习模型,其中第三机器学习模型是指可以识别***图片中是否含有图像码的机器学习模型,其中可选地,第三机器学习模型可以选择YOLO(You Only Look Once,一个对象检测算法)系列模型、FasterR-CNN(Faster Convolutional Recurrent Neural Network,区域卷积神经网络)和MaskR-CNN(Mask Convolutional Recurrent Neural Network,一个实例分割框架)等模型,该第三机器学习模型通过对第二***图像及对应的目标标记进行训练学习,得到能够识别待处理***图像进行识别是否包括图像码的图像码检测模型。
服务器通过预先训练的图像码检测模型对待处理***图片进行识别以判断待处理***图片是否包括图像码,若包括图像码则将当前待处理***图片发送至表头训练模型,否则就及时结束判断过程,起到节省程序耗时的目的。
在上述实施例中,由于使用了图像码检测模型可以快速对待识别的***图像进行判断是否含有图像码,服务器可及时对没有含有图像码的待识别***对象结束判别过程,从而过滤掉大部分普通***,起到减少程序耗时的目的。
在其中一个实施例中,如图8所示,一种电子***分类方法的判别过程如下:
服务器首先获取待处理***图片,其中待处理***图片可以是终端上传的电子***或者是普通***;然后,通过二维码检测模型对待测***图片进行检测,判断当前待处理***图片是否包括二维码,若当前待处理***图片包括二维码则进入表头检测模型进行下一步检测,否则就立刻结束判别过程,将当前待处理***图片判定为普通***;通过表头检测模型对包括二维码的待处理***图片进行定位,获取当前待处理***图片的表头区域,并对该表头区域进行分割得到相应的表头切片,随后用过文字识别模型读取表头切片中的文本内容,并对文本内容判断是否含有“电子”二字,其中“电子”二字为电子***分类方法的分类字符,若当前待处理***图片中含有“电子”二字则判定为电子***,否则为普通***。
其中,二维码检测模型、表头检测模型和文字识别模型是通过预先进行训练获得的,分别用于对待处理***图像进行判断是否包括二维码、对待处理***进行定位识别***表头区域并进行分割得到***表头切片和对***表头切片进行文字识别获取***表头切片中的分类字符。
在上述实施例中,电子***分类方法首先使用二维码检测模型对待测***图片进行检测,并对含有二维码的***图片使用表头检测模型和文字识别模型获得并读取待处理***图片中的表头切片及切片中的文本内容,最后根据分类字符即“电子”对待处理***图片进行分类,可将电子***从大量***中分离出来,以为后续对不同类型的***进行不一样的处理奠定基础。其中,二维码检测模型可对没有含有二维码的待识别***图像及时结束判别过程,这样就能节省程序耗时的目的,从而能够更快速的对待识别的***图像进行分类。
应该理解的是,虽然图1-8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-8中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图9所示,提供了一种***分类装置,包括:接收模块100、图像码检测模块200、图像识别模块300、分类模块400,其中:
接收模块100,用于获取待处理***图片;
图像码检测模块200,用于判断待处理***图片中是否含有图像码;
分类字符识别模块300,用于当识别图像码时,对待处理***图片进行识别以得到待处理***图片中的分类字符;
分类模块400,用于根据分类字符对待处理***图片进行分类。
在其中一个实施例中,上述分类字符识别模块300包括:
表头检测单元,用于对待处理***图片进行分割以得到表头区域;
文字识别单元,用于识别表头区域中的分类字符。
在其中一个实施例中,上述表头检测单元用于通过预先训练的表头检测模型对待处理***图片进行分割以得到表头区域;上述***分类装置还包括:
第一图像获取子模块,用于读取第一***图像,并标记第一***图像中表头位置;
表头检测子模块,用于根据第一***图像和对应的表头位置进行训练得到表头检测单元。
在其中一个实施例中,上述文字识别单元用于通过预先训练的文字检测模型识别表头区域中的分类字符;上述***分类装置还包括:
数据获取子模块:用于随机生成不同长度的文本切片,并标记文本切片的文本内容;
文字识别子模块,用于根据不同长度的文本切片和对应的标记的文本内容进行训练得到文字识别单元。
在其中一个实施例中,上述分类模块400包括:
接收单元,用于接收待处理图片中包括的分类字符;
分类单元,用于根据分类字符所对应的***分类作为待处理***图片的分类。
在其中一个实施例中,上述图像码检测模块用于通过预先训练的图像码检测模型判断待处理***图片中是否含有图像码;上述***分类装置还包括:
第二图像获取子模块,用于读取第二***图像,并根据第二***图像是否含有图像码生成目标标记;
图像码检测子模块,用于根据第二***图像和目标标记进行模型训练得到图像码检测模块。
关于一种***分类装置的具体限定可以参见上文中对于***分类方法的限定,在此不再赘述。上述一种***分类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储待识别***图像数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种***分类方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取待处理***图片;对待处理***图片进行图像码识别;当识别到图像码时,对待处理***图片进行识别以得到待处理***图片中的分类字符;根据分类字符对待处理***图片进行分类。
在一个实施例中,处理器执行计算机程序时所实现的对待处理***图片进行识别以得到待处理***图片中的分类字符,包括:对待处理***图片进行分割以得到表头区域;识别表头区域中的分类字符。
在一个实施例中,处理器执行计算机程序时所实现的对待处理***图片进行分割以得到表头区域是通过预先训练的表头检测模型进行处理的;处理器执行计算机程序时所涉及的表头检测模型的训练方式包括:读取第一***图像,并标记第一***图像中表头位置;根据第一***图像和对应的表头位置进行训练得到表头检测模型。
在一个实施例中,处理器执行计算机程序时所实现的识别表头区域中的分类字符是通过预先训练的文字识别模型得到的;处理器执行计算机程序时所涉及的文字识别模型的训练方式包括:随机生成不同长度的文本切片,并标记文本切片的文本内容;根据不同长度的文本切片和对应的标记的文本内容进行训练得到文字识别模型。
在一个实施例中,处理器执行计算机程序时所实现的根据分类字符对待处理***图片进行分类,包括:获取分类字符所对应的***分类作为待处理***图片的分类。
在一个实施例中,处理器执行计算机程序时所实现的对待处理***图片进行图像码识别是通过预先训练的图像码检测模型得到的;处理器执行计算机程序时所涉及的图像码检测模型的训练方式包括:读取第二***图像,并根据第二***图像是否含有图像码生成目标标记;根据第二***图像和目标标记进行模型训练得到图像码检测模型。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取待处理***图片;对待处理***图片进行图像码识别;当识别到图像码时,对待处理***图片进行识别以得到待处理***图片中的分类字符;根据分类字符对待处理***图片进行分类。
在一个实施例中,计算机程序被处理器执行时所实现的对待处理***图片进行识别以得到待处理***图片中的分类字符,包括:对待处理***图片进行分割以得到表头区域;识别表头区域中的分类字符。
在一个实施例中,计算机程序被处理器执行时所实现的对待处理***图片进行分割以得到表头区域是通过预先训练的表头检测模型进行处理的;计算机程序被处理器执行时所涉及的表头检测模型的训练方式,包括:读取第一***图像,并标记第一***图像中表头位置;根据第一***图像和对应的表头位置进行训练得到表头检测模型。
在一个实施例中,计算机程序被处理器执行时所实现的识别表头区域中的分类字符是通过预先训练的文字识别模型得到的;计算机程序被处理器执行时所涉及的文字识别模型的训练方式,包括:随机生成不同长度的文本切片,并标记文本切片的文本内容;根据不同长度的文本切片和对应的标记的文本内容进行训练得到文字识别模型。
在一个实施例中,计算机程序被处理器执行时所实现的根据分类字符对待处理***图片进行分类,包括:获取分类字符所对应的***分类作为待处理***图片的分类。
在一个实施例中,计算机程序被处理器执行时所实现的对待处理***图片进行图像码识别是通过预先训练的图像码检测模型得到的;计算机程序被处理器执行时所涉及的图像码检测模型的训练方式,包括:读取第二***图像,并根据第二***图像是否含有图像码生成目标标记;根据第二***图像和目标标记进行模型训练得到图像码检测模型。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(RandomAccess Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种***分类方法,其特征在于,所述方法包括:
获取待处理***图片;
对所述待处理***图片进行图像码识别;
当识别到图像码时,对所述待处理***图片进行识别以得到所述待处理***图片中的分类字符;
根据所述分类字符对所述待处理***图片进行分类。
2.根据权利要求1所述的方法,其特征在于,所述对所述待处理***图片进行识别以得到所述待处理***图片中的分类字符,包括:
对所述待处理***图片进行分割以得到表头区域;
识别所述表头区域中的分类字符。
3.根据权利要求2所述的方法,其特征在于,所述对所述待处理***图片进行分割以得到表头区域是通过预先训练的表头检测模型进行处理的;其中,所述表头检测模型的训练方式包括:
读取第一***图像,并标记所述第一***图像中表头位置;
根据所述第一***图像和对应的所述表头位置进行训练得到表头检测模型。
4.根据权利要求2所述的方法,其特征在于,所述识别所述表头区域中的分类字符是通过预先训练的文字识别模型得到的;其中,所述文字识别模型的训练方式包括:
随机生成不同长度的文本切片,并标记所述文本切片的文本内容;
根据所述不同长度的文本切片和对应的标记的文本内容进行训练得到文字识别模型。
5.根据权利要求1所述的方法,其特征在于,所述根据所述分类字符对所述待处理***图片进行分类,包括:
获取所述分类字符所对应的***分类作为所述待处理***图片的分类。
6.根据权利要求1所述的方法,其特征在于,所述对所述待处理***图片进行图像码识别是通过预先训练的图像码检测模型得到的;其中,所述图像码检测模型的训练方式包括:
读取第二***图像,并根据所述第二***图像是否含有图像码生成目标标记;
根据所述第二***图像和所述目标标记进行模型训练得到图像码检测模型。
7.一种***分类装置,其特征在于,所述装置包括:
接收模块,用于获取待处理***图片;
图像码检测模块,用于判断待处理***图片中是否含有图像码;
分类字符识别模块,用于当识别到图像码时,对所述待处理***图片进行识别以得到所述待处理***图片中的分类字符;
分类模块,用于根据所述分类字符对所述待处理***图片进行分类。
8.根据权利要求7所述的装置,其特征在于,所述分类字符识别模块包括:
表头检测单元,用于对所述待处理***图片进行分割以得到表头区域待;
文字识别单元,用于识别所述表头区域中的分类字符。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202110987139.XA 2021-08-26 2021-08-26 ***分类方法、装置、计算机设备和存储介质 Pending CN113780116A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110987139.XA CN113780116A (zh) 2021-08-26 2021-08-26 ***分类方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110987139.XA CN113780116A (zh) 2021-08-26 2021-08-26 ***分类方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN113780116A true CN113780116A (zh) 2021-12-10

Family

ID=78839351

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110987139.XA Pending CN113780116A (zh) 2021-08-26 2021-08-26 ***分类方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN113780116A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115082728A (zh) * 2022-05-26 2022-09-20 中国平安人寿保险股份有限公司 图片分类方法、装置、设备及介质
CN116311297A (zh) * 2023-04-12 2023-06-23 国网河北省电力有限公司 基于计算机视觉的电子凭据图像识别解析方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446621A (zh) * 2018-03-14 2018-08-24 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质
CN108460418A (zh) * 2018-03-07 2018-08-28 南京邮电大学 一种基于文字识别与语义分析的***分类方法
CN108921240A (zh) * 2018-06-12 2018-11-30 新乡学院 一种***编码识别分拣***
CN109740417A (zh) * 2018-10-29 2019-05-10 深圳壹账通智能科技有限公司 ***类型识别方法、装置、存储介质和计算机设备
CN109902737A (zh) * 2019-02-25 2019-06-18 厦门商集网络科技有限责任公司 一种票据分类方法及终端
CN110348441A (zh) * 2019-07-10 2019-10-18 深圳市华云中盛科技有限公司 增值税***识别方法、装置、计算机设备及存储介质
CN110457973A (zh) * 2018-05-07 2019-11-15 北京中海汇银财税服务有限公司 一种票据识别的方法及***
CN111597958A (zh) * 2020-05-12 2020-08-28 西安网算数据科技有限公司 一种高度自动化的票据分类方法及***
CN111753744A (zh) * 2020-06-28 2020-10-09 北京百度网讯科技有限公司 用于票据图像分类的方法、装置、设备及可读存储介质
CN111797772A (zh) * 2020-07-07 2020-10-20 因凡科技(北京)有限公司 ***图像自动分类方法、***、装置
CN112381153A (zh) * 2020-11-17 2021-02-19 深圳壹账通智能科技有限公司 票据分类的方法、装置和计算机设备
CN113011246A (zh) * 2021-01-29 2021-06-22 招商银行股份有限公司 票据分类方法、装置、设备及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108460418A (zh) * 2018-03-07 2018-08-28 南京邮电大学 一种基于文字识别与语义分析的***分类方法
CN108446621A (zh) * 2018-03-14 2018-08-24 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质
CN110457973A (zh) * 2018-05-07 2019-11-15 北京中海汇银财税服务有限公司 一种票据识别的方法及***
CN108921240A (zh) * 2018-06-12 2018-11-30 新乡学院 一种***编码识别分拣***
CN109740417A (zh) * 2018-10-29 2019-05-10 深圳壹账通智能科技有限公司 ***类型识别方法、装置、存储介质和计算机设备
CN109902737A (zh) * 2019-02-25 2019-06-18 厦门商集网络科技有限责任公司 一种票据分类方法及终端
CN110348441A (zh) * 2019-07-10 2019-10-18 深圳市华云中盛科技有限公司 增值税***识别方法、装置、计算机设备及存储介质
CN111597958A (zh) * 2020-05-12 2020-08-28 西安网算数据科技有限公司 一种高度自动化的票据分类方法及***
CN111753744A (zh) * 2020-06-28 2020-10-09 北京百度网讯科技有限公司 用于票据图像分类的方法、装置、设备及可读存储介质
CN111797772A (zh) * 2020-07-07 2020-10-20 因凡科技(北京)有限公司 ***图像自动分类方法、***、装置
CN112381153A (zh) * 2020-11-17 2021-02-19 深圳壹账通智能科技有限公司 票据分类的方法、装置和计算机设备
CN113011246A (zh) * 2021-01-29 2021-06-22 招商银行股份有限公司 票据分类方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115082728A (zh) * 2022-05-26 2022-09-20 中国平安人寿保险股份有限公司 图片分类方法、装置、设备及介质
CN116311297A (zh) * 2023-04-12 2023-06-23 国网河北省电力有限公司 基于计算机视觉的电子凭据图像识别解析方法

Similar Documents

Publication Publication Date Title
CN109492643B (zh) 基于ocr的证件识别方法、装置、计算机设备及存储介质
CN110569832B (zh) 基于深度学习注意力机制的文本实时定位识别方法
CN111476227B (zh) 基于ocr的目标字段识别方法、装置及存储介质
CN110348294B (zh) Pdf文档中图表的定位方法、装置及计算机设备
US20200356818A1 (en) Logo detection
US9626555B2 (en) Content-based document image classification
CN111353491B (zh) 一种文字方向确定方法、装置、设备及存储介质
CN113963147B (zh) 一种基于语义分割的关键信息提取方法及***
CN107368827A (zh) 字符识别方法及装置、用户设备、服务器
CN111583180B (zh) 一种图像的篡改识别方法、装置、计算机设备及存储介质
CN109389115B (zh) 文本识别方法、装置、存储介质和计算机设备
CN111368632A (zh) 一种签名识别方法及设备
CN112633297A (zh) 目标对象的识别方法、装置、存储介质以及电子装置
CN111144372A (zh) 车辆检测方法、装置、计算机设备和存储介质
CN113780116A (zh) ***分类方法、装置、计算机设备和存储介质
CN105335760A (zh) 一种图像数字字符识别方法
CN114463767A (zh) 信用证识别方法、装置、计算机设备和存储介质
CN110796145B (zh) 基于智能决策的多证件分割关联方法及相关设备
CN113158895A (zh) 票据识别方法、装置、电子设备及存储介质
CN113111880A (zh) 证件图像校正方法、装置、电子设备及存储介质
CN114092938B (zh) 图像的识别处理方法、装置、电子设备及存储介质
CN113673528B (zh) 文本处理方法、装置、电子设备和可读存储介质
CN112508000B (zh) 一种用于ocr图像识别模型训练数据生成的方法及设备
CN111401158A (zh) 难样本发现方法、装置及计算机设备
US20240144711A1 (en) Reliable determination of field values in documents with removal of static field elements

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination