CN106529380A - 图像的识别方法及装置 - Google Patents

图像的识别方法及装置 Download PDF

Info

Publication number
CN106529380A
CN106529380A CN201510587818.2A CN201510587818A CN106529380A CN 106529380 A CN106529380 A CN 106529380A CN 201510587818 A CN201510587818 A CN 201510587818A CN 106529380 A CN106529380 A CN 106529380A
Authority
CN
China
Prior art keywords
image information
information
image
illegal
characteristic value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510587818.2A
Other languages
English (en)
Other versions
CN106529380B (zh
Inventor
金炫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510587818.2A priority Critical patent/CN106529380B/zh
Publication of CN106529380A publication Critical patent/CN106529380A/zh
Application granted granted Critical
Publication of CN106529380B publication Critical patent/CN106529380B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

本申请公开了一种图像的识别方法及装置。其中,该方法包括:按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值;根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域;对图像信息中的文本区域进行文字识别,得到与文本区域对应的字段信息;将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像。本申请解决了现有技术中由于受图像信息的背景内容的影响,导致的对图像信息中的文字信息识别准确率低的技术问题。

Description

图像的识别方法及装置
技术领域
本申请涉及互联网领域,具体而言,涉及一种图像的识别方法及装置。
背景技术
随着电子商务的发展,炒信、欺诈等非法行为也趁机悄然滋生,此类违背诚信的虚假行为严重影响了电子商务的健康发展。例如,在淘宝、天猫等平台中,为了规避文本规则的管控,以图片作为信息载体的比重逐年增加。相比于单纯的文本信息,对于嵌入图片乃至视频中的文本信息的提取具有较大的技术难度,其具有较大的技术难度的主要有以下两个原因:1.图片样式的多样性;2.文字嵌入样式的多样性。
在现有技术中,对于带有嵌入文字的图片进行识别方法分为两类:
第一类为利用以图比图的方法对嵌入文字进行识别。通过标注一定数量的嵌入文字的图片样本,并提取图片样本的图像特征作为图像指纹,利用图像指纹计算图片与图片样本之间的相似度来进行图片的识别。通过以图比图的方法对嵌入文字的图片进行识别是一种较为简单的防控方法,但是,主要存在如下问题:
1、通过以图比图的方法对图片进行识别,其识别图片的范围受到图片样本库范围的限制,对于采用新的文字嵌入方式的图片只能通过人工在对该类图片审核之后,将该类图片添加进图片样本库的方法来保证算法准确,操作较为复杂,并且不能保证时效性。
2、在嵌入文字的图片中,存在很多背景相同但是嵌入的文字不同的图片,通过意图比图的方法,很难区分出此类文件,导致识别图片的识别精度低。
第二类为利用自然场景OCR方法对嵌入文字进行识别。利用自然场景OCR技术对图片中的文字信息进行识别的方法,是一种较为有效的方法,但是存在如下问题:
1、嵌入文字的图片可以选择任意图片作为背景,因在某些自然场景的图片中,通常包含了固有的文字内容,例如图片中的门牌号、车牌号等,而嵌入1文字的方式又多种多样,通过现有的自然场景OCR的识别方法很难对嵌入图片文字与图片自然场景中固有的文字内容进行区分。
2、包含自然场景的图片具有一定的方向性,通常图片中固有的文字内容的主轴方向与图片自然场景的主轴方向相同。但是,用于嵌入图片的文字,在图片上可以以各种方向进行嵌入,单纯利用主轴对嵌入图片中的文字进行区分,难以达到识别效果。
3、在嵌入文字的图片中,因嵌入文字的字体大小、笔画宽度等都多种多样,所以导致以标注字库训练的识别引擎无法进行识别。
4、利用语义模型进行文本信息优选的方式也因准确率较低,难以满足特定类型文本图片识别的要求。
5.不同的自然场景对于识别算法一般都有着特定的要求,使用单一的自然场景OCR算法以及关键词匹配算法很难保证算法的总体准确率。
针对上述由于受图像信息的背景内容的影响,导致的对图像信息中的文字信息识别准确率低的问题,目前尚未提出有效的解决方案。
申请内容
本申请实施例提供了一种图像的识别方法及装置,以至少解决现有技术中由于受图像信息的背景内容的影响,导致的对图像信息中的文字信息识别准确率低的的技术问题。
根据本申请实施例的一个方面,提供了一种图像的识别方法,包括:按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值;根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域;对图像信息中的文本区域进行文字识别,得到与文本区域对应的字段信息;将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像。
根据本申请实施例的另一方面,还提供了一种图像的识别装置,包括:第一提取模块,用于按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值;筛选模块,用于根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域;识别模块,用于对图像信息中的文本区域进行文字识别,得到与文本区域对应的字段信息;匹配模块,用于将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像。
在本申请实施例中,采用按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值;根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域;对图像信息中的文本区域进行文字识别,得到与文本区域对应的字段信息;将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像的方式,通过第一提取模块,用于按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值;筛选模块,用于根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域;识别模块,用于对图像信息中的文本区域进行文字识别,得到与文本区域对应的字段信息;匹配模块,用于将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像,达到了对图像信息中在各种场景下的文字信息的进行识别的目的,从而实现了提升对图像信息中的文字信息进行识别的准确率的技术效果,进而解决了现有技术中由于受图像信息的背景内容的影响,导致的对图像信息中的文字信息识别准确率低的的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种图像的识别方法的移动终端的硬件结构框图;
图2是根据本申请实施例的一种图像的识别方法的流程示意图;
图3是根据本申请实施例的一种可选的图像的识别方法的流程示意图;
图4是根据本申请实施例的一种可选的图像的识别方法的流程示意图;
图5是根据本申请实施例的一种图像的识别装置的结构示意图;
图6是根据本申请实施例的一种可选的图像的识别装置的结构示意图;
图7是根据本申请实施例的一种可选的图像的识别装置的结构示意图;
图8是根据本申请实施例的一种可选的图像的识别装置的第一提取模块的结构示意图;
图9是根据本申请实施例的一种可选的图像的识别装置的第一提取模块的结构示意图;
图10是根据本申请实施例的一种可选的图像的识别装置的结构示意图;
图11是根据本申请实施例的一种可选的图像的识别装置的结构示意图;
图12是根据本申请实施例的一种可选的图像的识别装置的识别模块的结构示意图;
图13是根据本申请实施例的一种可选的图像的识别装置的结构示意图;以及
图14是根据本申请实施例的一种可选的图像的识别装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本申请实施例,还提供了一种图像的识别方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本申请实施例的一种图像的识别方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的图像的识别方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的图像的识别方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(RadioFrequency,RF)模块,其用于通过无线方式与互联网进行通讯。
在上述运行环境下,本申请提供了如图2所示的图像的识别方法。图2是根据本申请实施例一的图像的识别方法的流程图。其中,该方法包括:
步骤S21,按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值。
具体的,每个图像信息都是由通过基础颜色进行叠加而成的像素点组成。因此,在每个与基础颜色对应的颜色通道中,都存放着图像信息中与其对应的颜色元素的信息。在对图像信息进行显示时,通过对所有颜色通道中的颜色进行叠加混合,从而得到图像信息中的每个像素点的颜色。
每个图像信息的颜色通道数量取决于图像信息的基础颜色的数量。而图像信息的基础颜色的数量,取决于图像信息的颜色模式。例如,颜色模式为CMYK的图像信息,具有4个与基础颜色对应的颜色通道,分别为青色通道、洋红通道、黄色通道和黑色通道;颜色模式为位图模式、灰度模式、双色调模式和索引颜色模式的图像信息,在默认情况下具有1个颜色通道。颜色模式为RGB模式和Lab模式的图像的信息具有3个颜色通道。
在步骤S21中,分别在图像信息的每个颜色通道对其进行区域特征值提取处理,从而得到与每个颜色通道对应的各个区域的区域特征值。其中,区域特征值提取处理,是在通过对图像中的像素点的颜色值、像素点位置,对与各个颜色通道对应的图像信息进行分割后,通过计算得到与各个颜色通道对应的每个区域的区域特征值。
在实际应用当中,因为颜色模式不同,从而导致颜色通道数量不同。因此,为了便于处理,所以可以在对图像信息进行区域特征值提取处理之前,先对图像信息的颜色模式进行统一化处理。将图像信息统一转换为RGB模式,然后再对其进行后续区域特征值提取处理。
其中,区域特征值的提取算法,可以为MSER(Maximally Stable Extreme Region)最大稳定极值区域算法来实现,具体方法此处不做赘述。
步骤S23,根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域。
具体的,在确定第一阈值时,可以利用区域特征值的提取算法,对各类带有文字的图像信息进行区域特征值提取处理。通过对带有文字的区域的区域特征值进行统计,从而得到用于确定图像信息中文本区域的第一阈值。其中,第一阈值用于对与每个颜色通道对应图像信息中的各个区域进行判断,通过判断,确认当前区域是否为文本区域。
在步骤S23中,分别将图像信息的与各个颜色通道对应的区域特征值与第一阈值进行比对,通过比对在各个颜色通道中筛选出包含有文字信息的文本区域。
在实际应用当中,图像信息中的文字信息,通常是以一个词组或者一个短语出现的。在制作带有文字信息的图像信息时,为了便于用户对词组或者短语进行识别,通常会在一个词组或者短语中,使用相同大小、字体、样式的文字,并且以符合阅读习惯的排列方式进行排布。例如,文字以从左到右排布、从上到下排布等。
人们在对图像信息中的文字进行识别时,通常会对于文字的字体、文字的大小、文字的字体样式以及排列方式较为敏感。往往通过字体的大小、字体、样式以及排列方式,即可判断出图像中出现的文字之间的逻辑关系。
人们在识别图像信息中的文字时,通常不会受到文字颜色的干扰。但是对于计算机而言,文字颜色的变化往往会造成识别上的障碍。因此,可以在对文本区域进行筛选时,将各个颜色通道的通过第一阈值筛选得到的文本区域,统一的只根据文字的大小、字体、样式进行关联,从而避免文字颜色的干扰。
步骤S25,对图像信息中的文本区域进行文字识别,得到与文本区域对应的字段信息。
在步骤S25中,通过文字识别引擎对文本区域中的文字依次进行识别,从而得到与文本区域对应的字段信息。其中,文字识别引擎,可以是为每种字体通过单独训练得到的专门用于识别特定字体的文字识别引擎,也可以是可以对所有字体进行识别的通用文字识别引擎。当文字识别引擎为专门用于识别特定字体的文字识别引擎时,利用每种文字识别引擎对文文本区域中的文字进行识别,从而获取置信度最高的预设数量的识别结果作为文字识别结果。其中,预定数量可以为5个。
将通过文字识别引擎识别得到的文字,按照位置关系进行排列,得到与文本区域对应的字段信息。除此之外,还可以通过排列组合的方式,对识别得到的单个文字进行组合,得到若干个与文本区域对应的字段信息。
步骤S27,将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像。
在步骤S27,将上述通过文字识别引擎得到的与文本区域对应的字段信息,分别与预先设置的非法关键词集合中的非法关键词依次进行匹配,当字段信息与非法关键词集合中的非法关键词匹配时,则确定图像信息为包含有非法字段信息的非法图像。
当然,还可以通过对非法关键词集合中的非法关键词设置权重值,当将上述字段信息与非法关键词中的非法关键词进行匹配后,对匹配结果进行加权运算。当与图像信息的权重值超过预先设置的预制时,则确认图像信息为包含非法字段信息的非法图像。
通过上述步骤S21至步骤S27,分别按照颜色通道,提取得到图像信息中与颜色通道对应的各个区域的区域特征值。根据第一阈值对区域特征值进行筛选,确定图像信息中的文本区域。然后,通过文字识别引擎对文本区域中的文字进行识别,并将识别得到的文字与预先设置的非法字段进行匹配,来确定图像信息是否为包含有非法字段的非法图像。通过上述方法,达到了对图像信息中在各种场景下的文字信息的进行识别的目的,从而实现了提升对图像信息中的文字信息进行识别的准确率的技术效果,解决了现有技术中由于受图像信息的背景内容的影响,导致的对图像信息中的文字信息识别准确率低的技术问题。
作为一种可选的实施方式,如图3所示,在步骤S27将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像之前,方法还可以包括:
步骤S26,按照预先设置的分词规则对字段信息进行拆分,得到与字段信息对应的分词集合,其中,分词集合用于记录对字段信息进行拆分后得到的分词词条。
具体的,通过步骤S26,对通过识别得到的字段信息,进行分词处理。通过分词处理可以将字段信息中的词组拆分成若干个具有新的意思的新分词分词条。将通过分词处理得到的新分词词条组合成为与图片信息对应的分词集合。
在实际应用当中,分词处理方法通常可分为三大类:基于字符串匹配的分词处理方法、基于理解的分词处理方法和基于统计的分词处理方法,具体的分词处理方法不做赘述。
此处,可以先利用上述分词处理方法,将识别得到的字段信息进行分词处理。然后在保留字段信息中原有的分词词条的同时,将字段信息中的分词词条拆分成若干个二元词,例如:一个三元词生成两个二元词,通过对所有二元词中的文字进行排列组合,混合成新的二元词。将利用上述方法拆分后得到的分词词条组合成为与图像信息对应的分词集合。
作为一种可选的实施方式,在对字段信息进行分词处理之前,可以预先对需要管控的图片信息中的字段信息进行标注,并将标注出的字段信息进行保存,生成用于判断图像信息是否为非法图像的非法关键词集合。
作为一种可选的实施方式,在步骤S27将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像中,可以包括:
步骤S271,获取预先设置的非法关键词集合。
步骤S273,获取与非法关键词集合中各非法关键词对应的权重值。
步骤S275,将分词集合中的分词词条,分别与非法关键词集合中的非法关键词进行匹配,得到匹配结果。
步骤S277,根据与非法关键词对应的权重值与匹配结果进行加权运算,得到字段信息的字段权重。
步骤S279,将字段权重与预先设置的第二阈值进行比对,确定图像信息是否为包含非法字段的非法图像。
具体的,通过步骤S271至步骤S279,将通过分词处理得到的与图像信息对应的分词信息,与预先设置的非法关键词集合进行匹配,并对通过匹配的到的匹配结果进行加权计算,得到与图像信息中包含的字段信息对应的字段权重。通过将字段权重与预先设置的用于判断是否为非法图像的第二阈值进行比对,确定上述图像信息是否为非法图像。
在实际应用当中,文字在不同的语境之下所包含的意思也不尽相同。因此,通常并不能通过图像信息中是否包含了某个被认为是非法的关键词,而判定该图像信息就是非法图像。因此,可以对非法关键词集合中的各个非法关键词设置权重值。通过将图像信息中包含的分词词条依次与非法关键词集合中的非法关键词进行匹配,并根据匹配结果计算得到与该图像信息对应的字段权重值,来确定图像信息是否为非法图像。从而提高对非法图像识别的准确率。具体的,可以将通过分词处理得到的分词,直接通过与非法关键词库进行匹配,利用匹配后的结果生成一维向量,并输入关键词模型进行打分,当分数高于阈值时,判定图像信息为非法图像并输出判定结果。
作为一种可选的实施方式,上述颜色通道可以包括:彩色通道和灰度通道,其中,彩色通道至少包括:红色通道、绿色通道、蓝色通道和黄色通道,灰度通道至少包括:黑色通道、白色通道。
具体的,每个图像信息可以具有一个或多个颜色通道,每个颜色通道都存放着图像信息中颜色信息,通过将各个通道中的颜色信息进行叠加混合,产生图像信息中每个像素的颜色。因此,为了提高对图像信息中的文本区域进行识别的准确率,可以从图像信息中提取出特定的颜色通道,并对每个颜色通道中的文本区域分别进行提取。
作为一种可选的实施方式,当颜色通道为彩色通道时,其中,在步骤S21按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值中,可以包括:
步骤S211,通过对图像信息中像素点的RGB颜色值进行修正处理,得到与像素点对应的预处理颜色值,其中,预处理颜色值中包括:红色值、绿色值、蓝色值和黄色值。
步骤S212,根据预处理颜色值和像素点的位置信息,确定像素点在彩色通道中的第一像素特征值,其中,第一像素特征值与彩色通道对应。
步骤S213,根据第一像素特征值,对图像信息进行提取处理,得到与彩色通道对应的区域特征值。
具体的,通过步骤S211至步骤S213,对图像信息中彩色的颜色通道进行区域特征值进行提取。首先,对图像信息的彩色的颜色通道进行像素特征值的提取处理,得到在图像信息中的每个像素点分别在每个彩色的颜色通道中的像素特征值。然后,根据在每个彩色通道中的像素特征值,对图像信息进行区域特征值的提取处理,最终得到与每个彩色的颜色通道对应的区域特征值。
在实际应用当中,对于颜色通道进行提取的提取步骤如下:
首先,利用修正公式对图像信息中的原始颜色值进行修正处理,得到修正后的修正颜色值:
其中,r、g、b为图像信息中用于表示像素颜色的三个原始颜色,r、g、b分别代表红色、绿色、蓝色;R、G、B、Y为对r、g、b三个原始颜色进行修正处理后得到的四个修正颜色,R、G、B、Y分别代表修正后的红色、绿色、蓝色、黄色。
进一步的,分别对RG、GR、BY、YB四个彩色的颜色通道,采用MSER提取算法进行提取处理,其中,通过MSER提取算法对图像信息进行提取的描述如下:
步骤1,多颜色通道提取:分别对RG、GR、BY、YB四个彩色的颜色通道进行提取处理,其描述如下:
RG、GR、BY、YB、为选取的四个彩色的颜色通道,(x,y)为像素点在图像信息中的位置信息。
步骤2,有序像素集合确定:本申请选用分割阈值(像素值)为8,对图像信息的每个颜色通道进行分割,即得到Scolor={0,7,15,...,255}。
步骤3,确定候选区域:在对四个彩色的颜色通道按照有序像素集合进行分割后,将有序像素集合中颜色数值大于预先设置的颜色阈值的与分割像素对应的区域选定为候选区域。
步骤4,从候选区域中提取联通区域:联通区域即在候选区域周围8个相邻的区域,每一个分割阈值会产生多个区域,假设总共区域个数为n;那么联通区域集合可以表示为:
RG(Rl)=(Rl,Rl+1,...,Rl+n),
GR(Rl)=(Rl,Rl+1,...,Rl+n),
BY(Rl)=(Rl,Rl+1,...,Rl+n),
YB(Rl)=(Rl,Rl+1,...,Rl+n),
其中,l用于表征分割阈值,Rl用于表征在有序像素集合中,所对应的区域信息。
步骤5,计算区域变化程度:区域变化程度描述如下:
其中,在||绝对值符号内代表计算区域内的像素个数。
步骤6,提取各颜色通道MSER区域:
当Rl满足以下条件时,则为需要通过MSER提取算法进行提取的区域:
v(Rl)<v(Rl-1)&v(Rl)<v(Rl+1);
通过提取得到的区域特征值,与各个颜色通道相互对应。
作为一种可选的实施方式,当颜色通道为灰度通道时,其中,在步骤S21按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值中,步骤还可以包括:
步骤S214,获取预先设置的计算参数。
步骤S215,根据图像信息中像素点的RGB颜色值、像素点的位置信息和计算参数,确定像素点在灰度通道中的第二像素特征值,其中,第二像素特征值与彩色通道对应。
步骤S216,根据第二像素特征值对图像信息进行提取处理,得到与灰度通道对应的区域特征值。
具体的,在对图像信息的彩色通道进行提取处理之外,还可以对图像信息的灰度通道进行提取处理。具体的,通过步骤S214至步骤S216,对图像信息中灰度通道进行区域特征值进行提取。首先,对图像信息的灰度通道进行像素特征值的提取处理,得到在图像信息中的每个像素点分别在各个灰度颜色通道中的像素特征值。然后,根据在每个灰度通道中的像素特征值,对图像信息进行区域特征值的提取处理,最终得到与每个灰度通道对应的区域特征值。
在实际应用当中,对于灰度通道进行提取的提取步骤如下:
首先,获取预先设置的试验参数α,β,γ,其中,实验参数需要满足如下约束:0≤α,β,γ≤1,且α+β+γ=1。在获取到预先设置的试验参数α,β,γ后,分别生成黑色通道和白色通道,其描述如下:
W(x,y)=255-(α×r(x,y)+β×g(x,y)+γ×b(x,y));
B(x,y)=α×r(x,y)+β×g(x,y)+γ×b(x,y);
其中,W用于表示白色通道,B用于表示黑色通道。
然后,分别对RG、GR、BY、YB四个彩色的颜色通道,采用MSER提取算法进行提取处理,其中,通过MSER提取算法对图像信息进行提取的描述如下:
步骤1,多颜色通道提取:分别对RG、GR、BY、YB四个彩色的颜色通道进行提取处理,其描述如下:
RG、GR、BY、YB、为选取的四个彩色的颜色通道,(x,y)为像素点在图像信息中的位置信息。
步骤2,有序像素集合确定:本申请选用分割阈值(像素值)为8,对图像信息的每个颜色通道进行分割,即得到Scolor={0,7,15,...,255}。
步骤3,确定候选区域:在对四个彩色的颜色通道按照有序像素集合进行分割后,将有序像素集合中颜色数值大于预先设置的颜色阈值的与分割像素对应的区域选定为候选区域。
步骤4,从候选区域中提取联通区域:联通区域即在候选区域周围8个相邻的区域,每一个分割阈值会产生多个区域,假设总共区域个数为n;那么联通区域集合可以表示为:
RG(Rl)=(Rl,Rl+1,...,Rl+n),
GR(Rl)=(Rl,Rl+1,...,Rl+n),
BY(Rl)=(Rl,Rl+1,...,Rl+n),
YB(Rl)=(Rl,Rl+1,...,Rl+n),
其中,l用于表征分割阈值,Rl用于表征在有序像素集合中,所对应的区域信息。
步骤5,计算区域变化程度:区域变化程度描述如下:
其中,在||绝对值符号内代表计算区域内的像素个数。
步骤6,提取各颜色通道MSER区域:
当Rl满足以下条件时,则为需要通过MSER提取算法进行提取的区域:
v(Rl)<v(Rl-1)&v(Rl)<v(Rl+1);
通过提取得到的区域特征值,与各个颜色通道相互对应。
作为一种可选的实施方式,在步骤S23根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域中,可以包括:
步骤S231,将与颜色通道对应的区域特征值分别与第一阈值进行比对,得到比对结果。
步骤S233,根据比对结果,确定图像信息中与颜色通道对应的文本区域。
具体的,通过步骤S231至步骤S233,将在图像信息中相同区域的与各个颜色通道对应的区域特征值,分别与预先设置的第一阈值进行比对,从而确定当前区域是否为包含有文字的文本区域。其中,可以分别为与各个颜色通道对应的区域特征值设置相应的阈值,来确定该区域是否为文本区域。也可以为所有颜色通道设置相同的阈值,来确定该区域是否为文本区域,此处不做赘述。
在实际应用当中,针对上述通过MSER提取算法计算得到的多个颜色通道的提取结果,利用通过训练得到的字符区域分类器,对非字符区域进行滤除,字符区域分类器将提取结果高于判断阈值的区域输出为文本区域。
其中,在对字符区域分类器进行训练时,可以准备若干个带有文本区域的图像信息,对图像信息中同样以MSER提取算法计算得到与各个颜色通道对应的区域特征值。将与文本区域对应的区域特征值进行提取,并对提取得到的区域特征值进行统计分析,最终确定用于判断是否为文本区域的阈值。
作为一种可选的实施方式,当图像信息中包括至少两个文本区域时,在步骤S23根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域之后,方法还可以包括:
步骤S241,获取文本区域在图像信息中的相对位置信息。
步骤S243,根据文本区域的区域特征值,确定与文本区域对应的颜色通道信息。
步骤S245,根据相对位置信息和颜色通道信息,确定文本区域之间的关联关系。
步骤S247,将具有关联关系的文本区域合并为新文本区域。
具体的,在通常情况下,人们的阅读习惯为自左至右、自上至下进行阅读。并且,人们会将图像中具有相同颜色的字符串联起来进行阅读。因此,可以通过步骤S241至步骤S247,根据文本区域在图像信息中的相对位置关系,根据与区域特征值对应的颜色通道,确定多个文本区域之间是否存在关联关系,并将具有关联关系的文本区域进行合并以生成新的文本区域。当然,还可以根据文本区域中的字符大小、字符中笔画的宽度对图像信息中的文本区域进行关联。
作为一种可选的实施方式,在对具有关联关系的文本区域进行合并,生成新的文本区域之后,还可以再次对合并后的新文本区域利用MSER提取算法进行提取处理,得到新文本区域对应的区域特征值,并再次利用字符区域分类器对与新文本区域对应的区域特征值进行筛选,确定得到文本区域。通过上述方法,可以进一步对文本区域进行提取,去除图像信息中的干扰信息。
作为一种可选的实施方式,在步骤S25对图像信息中的文本区域进行文字识别,得到与文本区域对应的字段信息中,步骤可以包括:
步骤S251,按照预定方向对文本区域进行投影处理,得到与方向对应的文本区域的投影结果,其中,投影处理为沿预定方向对文本区域中每个区间内的像素密度进行统计处理,得到与方向对应的像素密度的分布结果。
步骤S252,根据投影结果确定文本区域中的文字走向。
步骤S253,根据文字走向和投影结果对文本区域进行顺序分割,分割得到子字符区域,其中,每个子字符区域包含一个字符。
步骤S254,通过字符识别引擎对子字符区域中的字符进行识别,确定与子字符区域对应的识别结果。
步骤S255,根据文字走向和识别结果,生成字段信息。
具体的,通过步骤S251至步骤S255,对文本区域进行投影处理,即以预定方向将文本区域划分为若干个区间,对各个区间内所包含的用于表示字符的像素进行统计处理,得到在当前方向各个区间内的像素密度。进一步,还可以通过在当前方向上,确定包含有用于标字符的像素的分布长度。首先,通过与各个方向对应的分布长度,确定文本区域中的文字走向。在确定文字走向之后,可以根据像素密度对包含有多个字符的文本区域进行分割,得到只包含有一个字符的子字符区域。按照顺序分别对子字符区域中的字符进行识别,得到与文本区域对应的字段信息。
其中,确定预定方向的方法为:首先,以1度为步长,从0度到360度对文本区域中的用于表示字符的像素点进行投影,得到与投影角度对应的投影距离。选择投影距离最短的角度作为当前文本区域的主角度,然后,将相对于主角度旋转0度、90度、180度、270度后得到的四个方向作为对文本区域进行投影处理预定方向。按照上述预定方向对文本区域中用于表示字符的像素进行统计处理,确定投影距离最长的方向作为该文本区域的文字走向方向。
作为一种可选的实施方式,在根据像素密度以及文字走向对包含有多个字符的文本区域按顺序进行分割得到子字符区域之后,还可以根据子字符区域在横向和纵向的投影距离,以及字符的宽高比例,将子字符区域区分为:包含有汉字字符类和包含有数字字符类。其中,在通常情况下,汉字字符的宽高比例为1:1,数字字符的宽高比例为1:2。当然,也可以根据英文字符的宽高比例,对子字符区域做进一步的分类,具体方法此处不做赘述。
作为一种可选的实施方式,在步骤S254通过字符识别引擎对子字符区域中的字符进行识别,确定与子字符区域对应的识别结果中,步骤还可以包括:
步骤S2541,通过字符识别引擎对子字符区域进行识别,得到与子字符区域对应的初始识别结果,其中,初始识别结果中至少包括一个备选字符和与备选字符对应的置信度。
步骤S2543,根据置信度,从初始识别结果中确定置信度最高的预定数量的备选字符作为识别结果。
具体的,通过字符识别引擎对子字符区域中的字符进行识别,得到与子字符区域匹配的包含若干备选字符的初始识别结果,以及与备选字符对应的置信度。根据置信度,确定置信度最高的预定数量的备选字符作为识别结果,其中,预定数量可以设置为5。
除此之外,还可以基于反馈对识别结果进行矫正,具体步骤描述如下:
步骤1,选取识别结果中数值最大的置信度与预先设置的阈值进行比对,如果置信度小于阈值,则对子字符区域进行模板大小为3像素×3像素的腐蚀处理,并对经过腐蚀处理的子字符区域再次进行识别,得到新识别结果;
步骤2,在对腐蚀处理后的子字符区域进行识别,如果在处理结果中的数值最大的置信度大于或等于新识别结果中数值最大的置信度时,将腐蚀处理后的新识别结果作为当前子字符区域的识别结果,并继续重复步骤1进行迭代处理;如果在处理结果中的数值最大的置信度小于新识别结果中数值最大的置信度时,则选取新识别结果作为对字符进行识别的输出结果,并停止迭代过程。
作为一种可选的实施方式,如图4所示,在步骤S27当确定图像信息为包含非法字段信息的非法图像之后,上述方法还包括:
步骤S28,获取预先设置的第一图像特征向量,其中,第一图像特征向量用于表征特定类型图像的图像特征。
步骤S29,对非法图像进行特征向量提取,得到第二图像特征向量。
步骤S30,将第二图像特征向量与第一图像特征向量进行比对,确定非法图像的图像类型,其中,图像类型至少包括:聊天截图、非聊天截图。
具体的,在确定图像信息为包含有非法字段信息的非法图像之后,还可以通过步骤S28至步骤S30提取非法图像的第二图像特征向量,将第二图像特征向量与预先设置的第一图像特征向量进行比对,从而确定该非法图像的图像类型。通过上述方法,可以进一步提高图像识别的准确率。
在实际应用中,可以通过后处理模型对非法图像进行进一步的分类。其中,后处理模型可以分为图像模型以及文本模型,后处理图像模型具体描述如下:
首先,对后期处理图像的样本进行筛选,从通过上述图像信息中,筛选出一些典型多文字的图像信息。然后,对筛选得到的图像信息进行样本标注,从而区分非法图像的图像类型;进一步的,对各种图像类型的非法图像进行特征提取,提取得到非法图像的颜色直方图、分块灰度直方图、PCA、图像像素梯度等特征向量。将特征向量输入至神经网络,利用神经网络对分类模型进行训练,得到用于区分非法图像的图像类型的分类模型。
在得到分类模型之后,将非法图像的特征向量输入至分类模型,即可对非法图像进行进一步分类。
进一步的,还可以对非法图像中出现的误判的关键词进行收集整理,生成关键词白名单词库;在对图像信息中的文字进行识别的过程中,当图像信息中的分词字段与白名单词库中的关键词匹配时,判断该图像信息为合法图像。
作为一种可选的实施方式,在步骤S21按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值之前,上述方法还可以包括:
步骤S201,获取图像信息的图像分别率。
步骤S203,将图像分别率与预先设置的标准图像分辨率进行比对。
步骤S205,当图像分别率不等于标准图像分辨率时,对图像信息按标准图像分辨率进行等比例缩放。
具体的,在对图像信息进行区域特征值提取之前,还可以通过步骤S201至步骤S205对图像信息进行归一化处理,对不同分辨率的图像进行等比例缩放,得到标准图像分辨率的图像信息。
在实际应用当中,上传至服务器的图像,因图像分辨率的不同,将会导致在对文字进行识别时产生误差。因此,可以在对图像信息中的文字进行识别之前,可以对图像信息进行等比例缩放,从而得到具有标准图像分辨率的图像信息。
作为一种可选的实施方式,具体实施步骤如下:
步骤1,文本检测,文本检测用来检测文本区域在图像信息中的位置。
具体的,首先,通过图像信息归一化处理,将输入的图像信息的尺寸进行等比例缩放,对于最长边大于1024像素的图像按照等比例缩小,使最长边等于1024像素。在缩放的过程中,可以用到的插值算法,可以是最邻近插值算法,双线性插值算法,三次插值算法等,本实施方式中优选使用双线性插值算法对图像信息进行归一化处理,对于最长边小于1024像素的图像不做处理。
在对图像信息进行归一化处理之后,对图像信息中的文本区域进行提取。将输入的图像信息分为6个颜色通道,对每个通道用MSER提取算法对文本区域进行提取,得到提取结果。
根据上述与每个颜色通道对应的提取结果,利用训练完成的字符分类器对图像信息中的非字符区域的滤除,字符分类器将图像信息中提取结果高于阈值的区域输出为文本区域。
进一步的,还可以对文本区域进行关联。将每个颜色通道中的文本区域,按照字符的颜色、相对位置关系、笔画宽度等信息,对文本区域进行关联,将相似度高的文本区域合成文本行区域;
在得到文本行区域之后,还可以利用训练完成的文本行分类器,对文本行区域中的非字符区域进行滤除,得到文本行区域。
步骤2,文本识别,文本识别用于对步骤1中得到的文本行区域进行识别,得到与之对应的字段信息。
首先,以1度为步长,从0度到360度对文本区域中的用于表示字符的像素点进行投影,得到与投影角度对应的投影距离。选择投影距离最短的角度作为当前文本区域的主角度,然后,将相对于主角度旋转0度、90度、180度、270度后得到的四个方向作为对文本区域进行投影处理预定方向。按照上述预定方向对文本区域中用于表示字符的像素进行统计处理,确定投影距离最长的方向作为该文本区域的文字走向方向。
在根据像素密度以及文字走向对包含有多个字符的文本区域按顺序进行分割得到子字符区域之后,还可以根据子字符区域在横向和纵向的投影距离,以及字符的宽高比例,将子字符区域区分为:包含有汉字字符类和包含有数字字符类。
然后,通过文字识别引擎对文本区域中的文字依次进行识别,从而得到与文本区域对应的字段信息。其中,文字识别引擎,可以是为每种字体通过单独训练得到的专门用于识别特定字体的文字识别引擎,也可以是可以对所有字体进行识别的通用文字识别引擎。当文字识别引擎为专门用于识别特定字体的文字识别引擎时,利用每种文字识别引擎对文文本区域中的文字进行识别,从而获取置信度最高的预设数量的识别结果作为文字识别结果。其中,预定数量可以为5个。
将通过文字识别引擎识别得到的文字,按照位置关系进行排列,得到与文本区域对应的字段信息。除此之外,还可以通过排列组合的方式,对识别得到的单个文字进行组合,得到若干个与文本区域对应的字段信息。
除此之外,还可以基于反馈对识别结果进行矫正,具体步骤描述如下:
步骤2.1,选取识别结果中数值最大的置信度与预先设置的阈值进行比对,如果置信度小于阈值,则对子字符区域进行模板大小为3像素×3像素的腐蚀处理,并对经过腐蚀处理的子字符区域再次进行识别,得到新识别结果;
步骤2.2,在对腐蚀处理后的子字符区域进行识别,如果在处理结果中的数值最大的置信度大于或等于新识别结果中数值最大的置信度时,将腐蚀处理后的新识别结果作为当前子字符区域的识别结果,并继续重复步骤2.1进行迭代处理;如果在处理结果中的数值最大的置信度小于新识别结果中数值最大的置信度时,则选取新识别结果作为对字符进行识别的输出结果,并停止迭代过程。
步骤3,利用关键词模型对步骤2输出的字段信息进行匹配,其中:
首先,利用分词模型,将与图像信息对应的分词集合中的分词词条进行分词处理,抛弃分词中出现的一元词,从而得到若干个分词词条。在保留字段信息中原有的分词词条的同时,将字段信息中的分词词条拆分成若干个二元词,例如:一个三元词生成两个二元词,通过对所有二元词中的文字进行排列组合,混合成新的二元词。将利用上述方法拆分后得到的分词词条组合成为与图像信息对应的分词集合。
然后,将与图像信息对应的分词集合中的分词词条与非法关键词库进行匹配,对匹配后的结果进行加权运算,当权重值高于阈值时,判定图像信息为非法图像并输出判定结果。
步骤4,还可以通过后处理模型对非法图像进行进一步的分类。其中,后处理模型可以分为图像模型以及文本模型,后处理图像模型具体描述如下:
首先,对后期处理图像的样本进行筛选,从通过上述图像信息中,筛选出一些典型多文字的图像信息。例如,QQ聊天记录、微信聊天记录、旺旺聊天记录、订单详情截图、物流信息截图等。然后,对筛选得到的图像信息进行样本标注,从而区分非法图像的图像类型,例如:聊天类截图、非聊天类截图;进一步的,对各种图像类型的非法图像进行特征提取,提取得到非法图像的颜色直方图、分块灰度直方图、PCA、图像像素梯度等特征向量。将特征向量输入至BP神经网络,利用神经网络对分类模型进行训练,得到用于区分非法图像的图像类型的分类模型。
在得到分类模型之后,将非法图像的特征向量输入至分类模型,即可对非法图像进行进一步分类。
进一步的,还可以对非法图像中出现的误判的关键词进行收集整理,生成关键词白名单词库;在对图像信息中的文字进行识别的过程中,当图像信息中的分词字段与白名单词库中的关键词匹配时,判断该图像信息为合法图像。
除此之外,还可以建立人工审核平台,最后对通过上述方法得到的非法图像进行人工审核,以保证识别的准确率,并可以进行风险控制。还可以通过将人工审核的数据重新加入到标注样本中,从而达到定期对模型进行训练的目的,以适应用户习惯的改变。
在对非法图像进行识别之前,还可以通过如下步骤对判断模型进行训练:
步骤1,通过批量获取图像信息,对图像信息进行0、1标注,即,对图像信息是否为非法图像进行标注,0为合法图像,1为非法图像。
步骤2,对上述步骤1中,标注为非法图像中的非法字段信息进行标注,并将标注出的字段信息进行保存,生成用于判断图像信息是否为非法图像的非法关键词集合。
步骤3,利用分词模型,将非法关键词集合中的非法关键词进行分词处理,抛弃分词中出现的一元词,从而得到若干个分词。在保留原有非法关键词的同时,将分词词条拆分成若干个二元词或三元词,例如:一个三元词生成两个二元词,通过对所有二元词中的文字进行排列组合,混合成新的二元词。将利用上述方法拆分后得到的分词与原有非法关键词组合成为非法关键词集合。
步骤4,利用关键词决策树算法建立弱分类器:将上述步骤3中得到的每一个非法关键词作为关键词决策树的决策条件,当与该非法关键词匹配命中时,输出结果为1,否则输出结果为0。
步骤5,赋予关键词决策树中每个弱分类器的初始权重为1/N,其中,N为弱分类器个数。
步骤6,根据上述步骤1中通过标注得到的标注数据和通过步骤2至步骤3经分词处理得到非法关键词集合,通过语义模型和adaboost算法对弱分类器的权重进行训练,得到用于与非法关键词集合中各个非法关键词对应的权重值。
步骤7,对关键词决策树的判断条件进行提取,提取权重大于预先设置的阈值的非法关键词,将其添加入非法关键词词库,以便提高匹配效率。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
实施例2
根据本申请实施例,还提供了一种用于实施上述图像的识别方法的图像的识别装置,如图5所示,该装置包括:第一提取模块21、筛选模块23、识别模块25和匹配模块27。
其中,第一提取模块21,用于按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值。筛选模块23,用于根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域。识别模块25,用于对图像信息中的文本区域进行文字识别,得到与文本区域对应的字段信息。匹配模块27,用于将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像。
通过上述第一提取模块21、筛选模块23、识别模块25和匹配模块27,分别按照颜色通道,提取得到图像信息中与颜色通道对应的各个区域的区域特征值。根据第一阈值对区域特征值进行筛选,确定图像信息中的文本区域。然后,通过文字识别引擎对文本区域中的文字进行识别,并将识别得到的文字与预先设置的非法字段进行匹配,来确定图像信息是否为包含有非法字段的非法图像。通过上述方法,达到了对图像信息中在各种场景下的文字信息的进行识别的目的,从而实现了提升对图像信息中的文字信息进行识别的准确率的技术效果,解决了现有技术中由于受图像信息的背景内容的影响,导致的对图像信息中的文字信息识别准确率低的技术问题。
作为一种可选的实施方式,如图6所示,上述装置还可以包括:分词模块26。
其中,分词模块26,用于按照预先设置的分词规则对字段信息进行拆分,得到与字段信息对应的分词集合,其中,分词集合用于记录对字段信息进行拆分后得到的分词词条。
具体的,通过上述分词模块26,对通过识别得到的字段信息,进行分词处理。通过分词处理可以将字段信息中的词组拆分成若干个具有新的意思的新分词分词条。将通过分词处理得到的新分词词条组合成为与图片信息对应的分词集合。
在实际应用当中,分词处理方法通常可分为三大类:基于字符串匹配的分词处理方法、基于理解的分词处理方法和基于统计的分词处理方法,具体的分词处理方法不做赘述。
此处,可以先利用上述分词处理方法,将识别得到的字段信息进行分词处理。然后在保留字段信息中原有的分词词条的同时,将字段信息中的分词词条拆分成若干个二元词,例如:一个三元词生成两个二元词,通过对所有二元词中的文字进行排列组合,混合成新的二元词。将利用上述方法拆分后得到的分词词条组合成为与图像信息对应的分词集合。
作为一种可选的实施方式,在对字段信息进行分词处理之前,可以预先对需要管控的图片信息中的字段信息进行标注,并将标注出的字段信息进行保存,生成用于判断图像信息是否为非法图像的非法关键词集合。
作为一种可选的实施方式,如图7所示,上述匹配模块27可以包括:第一子获取模块271、第二子获取模块273、子匹配模块275、子运算模块277和第一比对模块279。
其中,第一子获取模块271,用于获取预先设置的非法关键词集合;第二子获取模块273,用于获取与非法关键词集合中各非法关键词对应的权重值;子匹配模块275,用于将分词集合中的分词词条,分别与非法关键词集合中的非法关键词进行匹配,得到匹配结果;子运算模块277,用于根据与非法关键词对应的权重值与匹配结果进行加权运算,得到字段信息的字段权重;第一比对模块279,用于将字段权重与预先设置的第二阈值进行比对,确定图像信息是否为包含非法字段的非法图像。
具体的,通过上述第一子获取模块271、第二子获取模块273、子匹配模块275、子运算模块277和第一比对模块279,将通过分词处理得到的与图像信息对应的分词信息,与预先设置的非法关键词集合进行匹配,并对通过匹配的到的匹配结果进行加权计算,得到与图像信息中包含的字段信息对应的字段权重。通过将字段权重与预先设置的用于判断是否为非法图像的第二阈值进行比对,确定上述图像信息是否为非法图像。
在实际应用当中,文字在不同的语境之下所包含的意思也不尽相同。因此,通常并不能通过图像信息中是否包含了某个被认为是非法的关键词,而判定该图像信息就是非法图像。因此,可以对非法关键词集合中的各个非法关键词设置权重值。通过将图像信息中包含的分词词条依次与非法关键词集合中的非法关键词进行匹配,并根据匹配结果计算得到与该图像信息对应的字段权重值,来确定图像信息是否为非法图像。从而提高对非法图像识别的准确率。具体的,可以将通过分词处理得到的分词,直接通过与非法关键词库进行匹配,利用匹配后的结果生成一维向量,并输入关键词模型进行打分,当分数高于阈值时,判定图像信息为非法图像并输出判定结果。
作为一种可选的实施方式,上述颜色通道可以包括:彩色通道和灰度通道,其中,彩色通道至少包括:红色通道、绿色通道、蓝色通道和黄色通道,灰度通道至少包括:黑色通道、白色通道。
如图8所示,当颜色通道为彩色通道时,其中,第一提取模块21包括:子修正模块211、第一子确定模块212和第一子提取模块213。
其中,子修正模块211,用于通过对图像信息中像素点的RGB颜色值进行修正处理,得到与像素点对应的预处理颜色值,其中,预处理颜色值中包括:红色值、绿色值、蓝色值和黄色值;第一子确定模块212,用于根据预处理颜色值和像素点的位置信息,确定像素点在彩色通道中的第一像素特征值,其中,第一像素特征值与彩色通道对应;第一子提取模块213,用于根据第一像素特征值,对图像信息进行提取处理,得到与彩色通道对应的区域特征值。
具体的,通过上述子修正模块211、第一子确定模块212和第一子提取模块213,对图像信息中彩色的颜色通道进行区域特征值进行提取。首先,对图像信息的彩色的颜色通道进行像素特征值的提取处理,得到在图像信息中的每个像素点分别在每个彩色的颜色通道中的像素特征值。然后,根据在每个彩色通道中的像素特征值,对图像信息进行区域特征值的提取处理,最终得到与每个彩色的颜色通道对应的区域特征值。
作为一种可选的实施方式,如图9所示,当颜色通道为灰度通道时,其中,第一提取模块21还包括:第三子获取模块214、第二子确定模块215和第二子提取模块216。
其中,第三子获取模块214,用于获取预先设置的计算参数;第二子确定模块215,用于根据图像信息中像素点的RGB颜色值、像素点的位置信息和计算参数,确定像素点在灰度通道中的第二像素特征值,其中,第二像素特征值与彩色通道对应;第二子提取模块216,用于根据第二像素特征值对图像信息进行提取处理,得到与灰度通道对应的区域特征值。
具体的,在对图像信息的彩色通道进行提取处理之外,还可以对图像信息的灰度通道进行提取处理。具体的,通过上述第三子获取模块214、第二子确定模块215和第二子提取模块216,对图像信息中灰度通道进行区域特征值进行提取。首先,对图像信息的灰度通道进行像素特征值的提取处理,得到在图像信息中的每个像素点分别在各个灰度颜色通道中的像素特征值。然后,根据在每个灰度通道中的像素特征值,对图像信息进行区域特征值的提取处理,最终得到与每个灰度通道对应的区域特征值。
作为一种可选的实施方式,如图10所示,上述筛选模块23可以包括:子比对模块231和第三子确定模块233。
其中,子比对模块231,用于将与颜色通道对应的区域特征值分别与第一阈值进行比对,得到比对结果;第三子确定模块233,用于根据比对结果,确定图像信息中与颜色通道对应的文本区域。
具体的,通过上述子比对模块231和第三子确定模块233。,将在图像信息中相同区域的与各个颜色通道对应的区域特征值,分别与预先设置的第一阈值进行比对,从而确定当前区域是否为包含有文字的文本区域。其中,可以分别为与各个颜色通道对应的区域特征值设置相应的阈值,来确定该区域是否为文本区域。也可以为所有颜色通道设置相同的阈值,来确定该区域是否为文本区域,此处不做赘述。
作为一种可选的实施方式,当图像信息中包括至少两个文本区域时,如图11所示,上述装置还可以包括:第一获取模块241、第一确定模块243、第二确定模块245和合并模块247。
其中,第一获取模块241,用于获取文本区域在图像信息中的相对位置信息;第一确定模块243,用于根据文本区域的区域特征值,确定与文本区域对应的颜色通道信息;第二确定模块245,用于根据相对位置信息和颜色通道信息,确定文本区域之间的关联关系;合并模块247,用于将具有关联关系的文本区域合并为新文本区域。
具体的,在通常情况下,人们的阅读习惯为自左至右、自上至下进行阅读。并且,人们会将图像中具有相同颜色的字符串联起来进行阅读。因此,可以通过上述第一获取模块241、第一确定模块243、第二确定模块245和合并模块247,根据文本区域在图像信息中的相对位置关系,根据与区域特征值对应的颜色通道,确定多个文本区域之间是否存在关联关系,并将具有关联关系的文本区域进行合并以生成新的文本区域。当然,还可以根据文本区域中的字符大小、字符中笔画的宽度对图像信息中的文本区域进行关联。
作为一种可选的实施方式,如图12所示,上述识别模块25包括:子处理模块251、第四子确定模块252、子分割模块253、第一子识别模块254和子生成模块255。
其中,子处理模块251,用于按照预定方向对文本区域进行投影处理,得到与方向对应的文本区域的投影结果,其中,投影处理为沿预定方向对文本区域中每个区间内的像素密度进行统计处理,得到与方向对应的像素密度的分布结果;第四子确定模块252,用于根据投影结果确定文本区域中的文字走向;子分割模块253,用于根据文字走向和投影结果对文本区域进行顺序分割,分割得到子字符区域,其中,每个子字符区域包含一个字符;第一子识别模块254,用于通过字符识别引擎对子字符区域中的字符进行识别,确定与子字符区域对应的识别结果;子生成模块255,用于根据文字走向和识别结果,生成字段信息。
具体的,通过上述子处理模块251、第四子确定模块252、子分割模块253、第一子识别模块254和子生成模块255,对文本区域进行投影处理,即以预定方向将文本区域划分为若干个区间,对各个区间内所包含的用于表示字符的像素进行统计处理,得到在当前方向各个区间内的像素密度。进一步,还可以通过在当前方向上,确定包含有用于标字符的像素的分布长度。首先,通过与各个方向对应的分布长度,确定文本区域中的文字走向。在确定文字走向之后,可以根据像素密度对包含有多个字符的文本区域进行分割,得到只包含有一个字符的子字符区域。按照顺序分别对子字符区域中的字符进行识别,得到与文本区域对应的字段信息。
作为一种可选的实施方式,上述第一子识别模块254包括:第二子识别模块2541和第五子确定模块2543。
其中,第二子识别模块2541,用于通过字符识别引擎对子字符区域进行识别,得到与子字符区域对应的初始识别结果,其中,初始识别结果中至少包括一个备选字符和与备选字符对应的置信度;第五子确定模块2543,用于根据置信度,从初始识别结果中确定置信度最高的预定数量的备选字符作为识别结果。
具体的,通过字符识别引擎对子字符区域中的字符进行识别,得到与子字符区域匹配的包含若干备选字符的初始识别结果,以及与备选字符对应的置信度。根据置信度,确定置信度最高的预定数量的备选字符作为识别结果,其中,预定数量可以设置为5。
作为一种可选的实施方式,如图13示,上述装置还可以包括:第二获取模块28、第二提取模块29和第二比对模块30。
其中,第二获取模块28,用于获取预先设置的第一图像特征向量,其中,第一图像特征向量用于表征特定类型图像的图像特征;第二提取模块29,用于对非法图像进行特征向量提取,得到第二图像特征向量;第二比对模块30,用于将第二图像特征向量与第一图像特征向量进行比对,确定非法图像的图像类型,其中,图像类型至少包括:聊天截图、非聊天截图。
具体的,在确定图像信息为包含有非法字段信息的非法图像之后,还可以通过上述第二获取模块28、第二提取模块29和第二比对模块30提取非法图像的第二图像特征向量,将第二图像特征向量与预先设置的第一图像特征向量进行比对,从而确定该非法图像的图像类型。通过上述方法,可以进一步提高图像识别的准确率。
作为一种可选的实施方式,如图14所示,上述装置还包括:第三获取模块201、第三比对模块203和缩放模块205。
其中,第三获取模块201,用于获取图像信息的图像分别率;第三比对模块203,用于将图像分别率与预先设置的标准图像分辨率进行比对;缩放模块205,用于当图像分别率不等于标准图像分辨率时,对图像信息按标准图像分辨率进行等比例缩放。
具体的,在对图像信息进行区域特征值提取之前,还可以通过上述第三获取模块201、第三比对模块203和缩放模块205对图像信息进行归一化处理,对不同分辨率的图像进行等比例缩放,得到标准图像分辨率的图像信息。
实施例3
本申请的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行应用程序的图像的识别方法中以下步骤的程序代码:
S1,按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值;
S2,根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域;
S3,对图像信息中的文本区域进行文字识别,得到与文本区域对应的字段信息;
S4,将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像。
可选地,图1是根据本申请实施例的一种计算机终端的结构框图。如图1所示,该计算机终端A可以包括:一个或多个(图中仅示出一个)处理器、存储器、以及传输模块。
其中,存储器可用于存储软件程序以及模块,如本申请实施例中的图像的识别方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的***漏洞攻击的检测方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值;根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域;对图像信息中的文本区域进行文字识别,得到与文本区域对应的字段信息;将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像。
可选的,上述处理器还可以执行如下步骤的程序代码:按照预先设置的分词规则对字段信息进行拆分,得到与字段信息对应的分词集合,其中,分词集合用于记录对字段信息进行拆分后得到的分词词条。
可选的,上述处理器还可以执行如下步骤的程序代码:获取预先设置的非法关键词集合;获取与非法关键词集合中各非法关键词对应的权重值;将分词集合中的分词词条,分别与非法关键词集合中的非法关键词进行匹配,得到匹配结果;根据与非法关键词对应的权重值与匹配结果进行加权运算,得到字段信息的字段权重;将字段权重与预先设置的第二阈值进行比对,确定图像信息是否为包含非法字段的非法图像。
可选的,上述处理器还可以执行如下步骤的程序代码:通过对图像信息中像素点的RGB颜色值进行修正处理,得到与像素点对应的预处理颜色值,其中,预处理颜色值中包括:红色值、绿色值、蓝色值和黄色值;根据预处理颜色值和像素点的位置信息,确定像素点在彩色通道中的第一像素特征值,其中,第一像素特征值与彩色通道对应;根据第一像素特征值,对图像信息进行提取处理,得到与彩色通道对应的区域特征值。
可选的,上述处理器还可以执行如下步骤的程序代码:获取预先设置的计算参数;根据图像信息中像素点的RGB颜色值、像素点的位置信息和计算参数,确定像素点在灰度通道中的第二像素特征值,其中,第二像素特征值与彩色通道对应;根据第二像素特征值对图像信息进行提取处理,得到与灰度通道对应的区域特征值。
可选的,上述处理器还可以执行如下步骤的程序代码:将与颜色通道对应的区域特征值分别与第一阈值进行比对,得到比对结果;根据比对结果,确定图像信息中与颜色通道对应的文本区域。
可选的,上述处理器还可以执行如下步骤的程序代码:获取文本区域在图像信息中的相对位置信息;根据文本区域的区域特征值,确定与文本区域对应的颜色通道信息;根据相对位置信息和颜色通道信息,确定文本区域之间的关联关系;将具有关联关系的文本区域合并为新文本区域。
可选的,上述处理器还可以执行如下步骤的程序代码:按照预定方向对文本区域进行投影处理,得到与方向对应的文本区域的投影结果,其中,投影处理为沿预定方向对文本区域中每个区间内的像素密度进行统计处理,得到与方向对应的像素密度的分布结果;根据投影结果确定文本区域中的文字走向;根据文字走向和投影结果对文本区域进行顺序分割,分割得到子字符区域,其中,每个子字符区域包含一个字符;通过字符识别引擎对子字符区域中的字符进行识别,确定与子字符区域对应的识别结果;根据文字走向和识别结果,生成字段信息。
可选的,上述处理器还可以执行如下步骤的程序代码:通过字符识别引擎对子字符区域进行识别,得到与子字符区域对应的初始识别结果,其中,初始识别结果中至少包括一个备选字符和与备选字符对应的置信度;根据置信度,从初始识别结果中确定置信度最高的预定数量的备选字符作为识别结果。
可选的,上述处理器还可以执行如下步骤的程序代码:获取预先设置的第一图像特征向量,其中,第一图像特征向量用于表征特定类型图像的图像特征;对非法图像进行特征向量提取,得到第二图像特征向量;将第二图像特征向量与第一图像特征向量进行比对,确定非法图像的图像类型,其中,图像类型至少包括:聊天截图、非聊天截图。
可选的,上述处理器还可以执行如下步骤的程序代码:获取图像信息的图像分别率;将图像分别率与预先设置的标准图像分辨率进行比对;当图像分别率不等于标准图像分辨率时,对图像信息按标准图像分辨率进行等比例缩放。
采用本申请实施例,提供了一种图像的识别的方案。通过按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值;根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域;对图像信息中的文本区域进行文字识别,得到与文本区域对应的字段信息;将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像,从而达到了对图像信息中在各种场景下的文字信息的进行识别的目的,进而解决了现有技术中由于受图像信息的背景内容的影响,导致的对图像信息中的文字信息识别准确率低的的技术问题。
本领域普通技术人员可以理解,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备,并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图10中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图10所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
实施例4
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的图像的识别方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值;根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域;对图像信息中的文本区域进行文字识别,得到与文本区域对应的字段信息;将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像。
可选的,存储介质被设置为存储用于执行以下步骤的程序代码:按照预先设置的分词规则对字段信息进行拆分,得到与字段信息对应的分词集合,其中,分词集合用于记录对字段信息进行拆分后得到的分词词条。
可选的,存储介质被设置为存储用于执行以下步骤的程序代码:获取预先设置的非法关键词集合;获取与非法关键词集合中各非法关键词对应的权重值;将分词集合中的分词词条,分别与非法关键词集合中的非法关键词进行匹配,得到匹配结果;根据与非法关键词对应的权重值与匹配结果进行加权运算,得到字段信息的字段权重;将字段权重与预先设置的第二阈值进行比对,确定图像信息是否为包含非法字段的非法图像。
可选的,存储介质被设置为存储用于执行以下步骤的程序代码:通过对图像信息中像素点的RGB颜色值进行修正处理,得到与像素点对应的预处理颜色值,其中,预处理颜色值中包括:红色值、绿色值、蓝色值和黄色值;根据预处理颜色值和像素点的位置信息,确定像素点在彩色通道中的第一像素特征值,其中,第一像素特征值与彩色通道对应;根据第一像素特征值,对图像信息进行提取处理,得到与彩色通道对应的区域特征值。
可选的,存储介质被设置为存储用于执行以下步骤的程序代码:获取预先设置的计算参数;根据图像信息中像素点的RGB颜色值、像素点的位置信息和计算参数,确定像素点在灰度通道中的第二像素特征值,其中,第二像素特征值与彩色通道对应;根据第二像素特征值对图像信息进行提取处理,得到与灰度通道对应的区域特征值。
可选的,存储介质被设置为存储用于执行以下步骤的程序代码:将与颜色通道对应的区域特征值分别与第一阈值进行比对,得到比对结果;根据比对结果,确定图像信息中与颜色通道对应的文本区域。
可选的,存储介质被设置为存储用于执行以下步骤的程序代码:获取文本区域在图像信息中的相对位置信息;根据文本区域的区域特征值,确定与文本区域对应的颜色通道信息;根据相对位置信息和颜色通道信息,确定文本区域之间的关联关系;将具有关联关系的文本区域合并为新文本区域。
可选的,存储介质被设置为存储用于执行以下步骤的程序代码:按照预定方向对文本区域进行投影处理,得到与方向对应的文本区域的投影结果,其中,投影处理为沿预定方向对文本区域中每个区间内的像素密度进行统计处理,得到与方向对应的像素密度的分布结果;根据投影结果确定文本区域中的文字走向;根据文字走向和投影结果对文本区域进行顺序分割,分割得到子字符区域,其中,每个子字符区域包含一个字符;通过字符识别引擎对子字符区域中的字符进行识别,确定与子字符区域对应的识别结果;根据文字走向和识别结果,生成字段信息。
可选的,存储介质被设置为存储用于执行以下步骤的程序代码:通过字符识别引擎对子字符区域进行识别,得到与子字符区域对应的初始识别结果,其中,初始识别结果中至少包括一个备选字符和与备选字符对应的置信度;根据置信度,从初始识别结果中确定置信度最高的预定数量的备选字符作为识别结果。
可选的,存储介质被设置为存储用于执行以下步骤的程序代码:获取预先设置的第一图像特征向量,其中,第一图像特征向量用于表征特定类型图像的图像特征;对非法图像进行特征向量提取,得到第二图像特征向量;将第二图像特征向量与第一图像特征向量进行比对,确定非法图像的图像类型,其中,图像类型至少包括:聊天截图、非聊天截图。
可选的,存储介质被设置为存储用于执行以下步骤的程序代码:获取图像信息的图像分别率;将图像分别率与预先设置的标准图像分辨率进行比对;当图像分别率不等于标准图像分辨率时,对图像信息按标准图像分辨率进行等比例缩放。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (23)

1.一种图像的识别方法,其特征在于,包括:
按照颜色通道对获取的图像信息进行区域特征值提取处理,得到所述图像信息中与所述颜色通道对应的各个区域的区域特征值;
根据所述区域特征值与预先设置的第一阈值对所述图像信息中所述各个区域进行筛选,确定所述图像信息中的文本区域;
对所述图像信息中的所述文本区域进行文字识别,得到与所述文本区域对应的字段信息;
将所述字段信息与预先设置的非法关键词集合进行匹配,确定所述图像信息是否为包含非法字段信息的非法图像。
2.根据权利要求1所述的方法,其特征在于,在将所述字段信息与预先设置的非法关键词集合进行匹配,确定所述图像信息是否为包含非法字段信息的非法图像之前,所述方法还包括:
按照预先设置的分词规则对所述字段信息进行拆分,得到与所述字段信息对应的分词集合,其中,所述分词集合用于记录对所述字段信息进行拆分后得到的分词词条。
3.根据权利要求2所述的方法,其特征在于,将所述字段信息与预先设置的非法关键词集合进行匹配,确定所述图像信息是否为包含非法字段信息的非法图像,包括:
获取预先设置的非法关键词集合;
获取与所述非法关键词集合中各非法关键词对应的权重值;
将所述分词集合中的所述分词词条,分别与所述非法关键词集合中的非法关键词进行匹配,得到匹配结果;
根据与所述非法关键词对应的权重值与所述匹配结果进行加权运算,得到所述字段信息的字段权重;
将所述字段权重与预先设置的第二阈值进行比对,确定所述图像信息是否为包含所述非法字段的所述非法图像。
4.根据权利要求1所述的方法,其特征在于,所述颜色通道包括:彩色通道和灰度通道,所述彩色通道至少包括:红色通道、绿色通道、蓝色通道和黄色通道,所述灰度通道至少包括:黑色通道、白色通道。
5.根据权利要求4所述的方法,其特征在于,当所述颜色通道为所述彩色通道时,其中,按照颜色通道对获取的图像信息进行区域特征值提取处理,得到所述图像信息中与所述颜色通道对应的各个区域的区域特征值,包括:
通过对所述图像信息中像素点的RGB颜色值进行修正处理,得到与所述像素点对应的预处理颜色值,其中,所述预处理颜色值中包括:红色值、绿色值、蓝色值和黄色值;
根据所述预处理颜色值和所述像素点的位置信息,确定所述像素点在所述彩色通道中的第一像素特征值,其中,所述第一像素特征值与所述彩色通道对应;
根据所述第一像素特征值,对所述图像信息进行提取处理,得到与所述彩色通道对应的所述区域特征值。
6.根据权利要求4所述的方法,其特征在于,当所述颜色通道为所述灰度通道时,其中,按照颜色通道对获取的图像信息进行区域特征值提取处理,得到所述图像信息中与所述颜色通道对应的各个区域的区域特征值,还包括:
获取预先设置的计算参数;
根据所述图像信息中像素点的RGB颜色值、所述像素点的位置信息和所述计算参数,确定所述像素点在所述灰度通道中的第二像素特征值,其中,所述第二像素特征值与所述灰度通道对应;
根据所述第二像素特征值对所述图像信息进行提取处理,得到与所述灰度通道对应的所述区域特征值。
7.根据权利要求1所述的方法,其特征在于,根据所述区域特征值与预先设置的第一阈值对所述图像信息中所述各个区域进行筛选,确定所述图像信息中的文本区域,包括:
将与所述颜色通道对应的所述区域特征值分别与所述第一阈值进行比对,得到比对结果;
根据所述比对结果,确定所述图像信息中与所述颜色通道对应的所述文本区域。
8.根据权利要求7所述的方法,其特征在于,当所述图像信息中包括至少两个所述文本区域时,在根据所述区域特征值与预先设置的第一阈值对所述图像信息中所述各个区域进行筛选,确定所述图像信息中的文本区域之后,所述方法还包括:
获取所述文本区域在所述图像信息中的相对位置信息;
根据所述文本区域的所述区域特征值,确定与所述文本区域对应的颜色通道信息;
根据所述相对位置信息和所述颜色通道信息,确定所述文本区域之间的关联关系;
将具有所述关联关系的文本区域合并为新文本区域。
9.根据权利要求1所述的方法,其特征在于,对所述图像信息中的所述文本区域进行文字识别,得到与所述文本区域对应的字段信息,包括:
按照预定方向对所述文本区域进行投影处理,得到与所述方向对应的所述文本区域的投影结果,其中,所述投影处理为沿预定方向对所述文本区域中每个区间内的像素密度进行统计处理,得到与所述方向对应的像素密度的分布结果;
根据所述投影结果确定所述文本区域中的文字走向;
根据所述文字走向和所述投影结果对所述文本区域进行顺序分割,分割得到子字符区域,其中,每个所述子字符区域包含一个字符;
通过字符识别引擎对所述子字符区域中的字符进行识别,确定与所述子字符区域对应的识别结果;
根据所述文字走向和所述识别结果,生成所述字段信息。
10.根据权利要求9所述的方法,其特征在于,通过字符识别引擎对所述子字符区域中的字符进行识别,确定与所述子字符区域对应的识别结果,包括:
通过所述字符识别引擎对所述子字符区域进行识别,得到与所述子字符区域对应的初始识别结果,其中,所述初始识别结果中至少包括一个备选字符和与所述备选字符对应的置信度;
根据所述置信度,从所述初始识别结果中确定所述置信度最高的预定数量的备选字符作为所述识别结果。
11.根据权利要求1所述的方法,其特征在于,当确定所述图像信息为包含非法字段信息的非法图像之后,所述方法还包括:
获取预先设置的第一图像特征向量,其中,所述第一图像特征向量用于表征特定类型图像的图像特征;
对所述非法图像进行特征向量提取,得到第二图像特征向量;
将所述第二图像特征向量与所述第一图像特征向量进行比对,确定所述非法图像的图像类型,其中,所述图像类型至少包括:聊天截图、非聊天截图。
12.根据权利要求1至11中任意一项所述的方法,其特征在于,在按照颜色通道对获取的图像信息进行区域特征值提取处理,得到所述图像信息中与所述颜色通道对应的各个区域的区域特征值之前,所述方法还包括:
获取所述图像信息的图像分别率;
将所述图像分别率与预先设置的标准图像分辨率进行比对;
当所述图像分别率不等于所述标准图像分辨率时,对所述图像信息按所述标准图像分辨率进行等比例缩放。
13.一种图像的识别装置,其特征在于,包括:
第一提取模块,用于按照颜色通道对获取的图像信息进行区域特征值提取处理,得到所述图像信息中与所述颜色通道对应的各个区域的区域特征值;
筛选模块,用于根据所述区域特征值与预先设置的第一阈值对所述图像信息中所述各个区域进行筛选,确定所述图像信息中的文本区域;
识别模块,用于对所述图像信息中的所述文本区域进行文字识别,得到与所述文本区域对应的字段信息;
匹配模块,用于将所述字段信息与预先设置的非法关键词集合进行匹配,确定所述图像信息是否为包含非法字段信息的非法图像。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括:
分词模块,用于按照预先设置的分词规则对所述字段信息进行拆分,得到与所述字段信息对应的分词集合,其中,所述分词集合用于记录对所述字段信息进行拆分后得到的分词词条。
15.根据权利要求14所述的装置,其特征在于,所述匹配模块包括:
第一子获取模块,用于获取预先设置的非法关键词集合;
第二子获取模块,用于获取与所述非法关键词集合中各非法关键词对应的权重值;
子匹配模块,用于将所述分词集合中的所述分词词条,分别与所述非法关键词集合中的非法关键词进行匹配,得到匹配结果;
子运算模块,用于根据与所述非法关键词对应的权重值与所述匹配结果进行加权运算,得到所述字段信息的字段权重;
第一比对模块,用于将所述字段权重与预先设置的第二阈值进行比对,确定所述图像信息是否为包含所述非法字段的所述非法图像。
16.根据权利要求13所述的装置,其特征在于,当所述颜色通道为彩色通道时,其中,所述第一提取模块包括:
子修正模块,用于通过对所述图像信息中像素点的RGB颜色值进行修正处理,得到与所述像素点对应的预处理颜色值,其中,所述预处理颜色值中包括:红色值、绿色值、蓝色值和黄色值;
第一子确定模块,用于根据所述预处理颜色值和所述像素点的位置信息,确定所述像素点在所述彩色通道中的第一像素特征值,其中,所述第一像素特征值与彩色通道对应;
第一子提取模块,用于根据所述第一像素特征值,对所述图像信息进行提取处理,得到与所述彩色通道对应的所述区域特征值。
17.根据权利要求13所述的装置,其特征在于,当所述颜色通道为灰度通道时,其中,所述第一提取模块还包括:
第三子获取模块,用于获取预先设置的计算参数;
第二子确定模块,用于根据所述图像信息中像素点的RGB颜色值、所述像素点的位置信息和所述计算参数,确定所述像素点在所述灰度通道中的第二像素特征值,其中,所述第二像素特征值与所述灰度通道对应;
第二子提取模块,用于根据所述第二像素特征值对所述图像信息进行提取处理,得到与所述灰度通道对应的所述区域特征值。
18.根据权利要求13所述的装置,其特征在于,所述筛选模块包括:
子比对模块,用于将与所述颜色通道对应的所述区域特征值分别与所述第一阈值进行比对,得到比对结果;
第三子确定模块,用于根据所述比对结果,确定所述图像信息中与所述颜色通道对应的所述文本区域。
19.根据权利要求18所述的装置,其特征在于,当所述图像信息中包括至少两个所述文本区域时,所述装置还包括:
第一获取模块,用于获取所述文本区域在所述图像信息中的相对位置信息;
第一确定模块,用于根据所述文本区域的所述区域特征值,确定与所述文本区域对应的颜色通道信息;
第二确定模块,用于根据所述相对位置信息和所述颜色通道信息,确定所述文本区域之间的关联关系;
合并模块,用于将具有所述关联关系的文本区域合并为新文本区域。
20.根据权利要求13所述的装置,其特征在于,所述识别模块包括:
子处理模块,用于按照预定方向对所述文本区域进行投影处理,得到与所述方向对应的所述文本区域的投影结果,其中,所述投影处理为沿预定方向对所述文本区域中每个区间内的像素密度进行统计处理,得到与所述方向对应的像素密度的分布结果;
第四子确定模块,用于根据所述投影结果确定所述文本区域中的文字走向;
子分割模块,用于根据所述文字走向和所述投影结果对所述文本区域进行顺序分割,分割得到子字符区域,其中,每个所述子字符区域包含一个字符;
第一子识别模块,用于通过字符识别引擎对所述子字符区域中的字符进行识别,确定与所述子字符区域对应的识别结果;
子生成模块,用于根据所述文字走向和所述识别结果,生成所述字段信息。
21.根据权利要求20所述的装置,其特征在于,所述子识别模块包括:
第二子识别模块,用于通过所述字符识别引擎对所述子字符区域进行识别,得到与所述子字符区域对应的初始识别结果,其中,所述初始识别结果中至少包括一个备选字符和与所述备选字符对应的置信度;
第五子确定模块,用于根据所述置信度,从所述初始识别结果中确定所述置信度最高的预定数量的备选字符作为所述识别结果。
22.根据权利要求13所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取预先设置的第一图像特征向量,其中,所述第一图像特征向量用于表征特定类型图像的图像特征;
第二提取模块,用于对所述非法图像进行特征向量提取,得到第二图像特征向量;
第二比对模块,用于将所述第二图像特征向量与所述第一图像特征向量进行比对,确定所述非法图像的图像类型,其中,所述图像类型至少包括:聊天截图、非聊天截图。
23.根据权利要求13至22中任意一项所述的装置,其特征在于,所述装置还包括:
第三获取模块,用于获取所述图像信息的图像分别率;
第三比对模块,用于将所述图像分别率与预先设置的标准图像分辨率进行比对;
缩放模块,用于当所述图像分别率不等于所述标准图像分辨率时,对所述图像信息按所述标准图像分辨率进行等比例缩放。
CN201510587818.2A 2015-09-15 2015-09-15 图像的识别方法及装置 Active CN106529380B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510587818.2A CN106529380B (zh) 2015-09-15 2015-09-15 图像的识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510587818.2A CN106529380B (zh) 2015-09-15 2015-09-15 图像的识别方法及装置

Publications (2)

Publication Number Publication Date
CN106529380A true CN106529380A (zh) 2017-03-22
CN106529380B CN106529380B (zh) 2019-12-10

Family

ID=58348687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510587818.2A Active CN106529380B (zh) 2015-09-15 2015-09-15 图像的识别方法及装置

Country Status (1)

Country Link
CN (1) CN106529380B (zh)

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654087A (zh) * 2015-12-30 2016-06-08 李宇 一种基于彩色模板的脱机手写字符提取方法
CN107977658A (zh) * 2017-12-27 2018-05-01 深圳Tcl新技术有限公司 图像文字区域的识别方法、电视机和可读存储介质
CN108154144A (zh) * 2018-01-12 2018-06-12 江苏省新通智能交通科技发展有限公司 一种基于图像的船名字符定位方法及***
CN108304843A (zh) * 2017-12-25 2018-07-20 山东浪潮云服务信息科技有限公司 一种图像审批方法及审批装置
CN109285603A (zh) * 2018-08-28 2019-01-29 长安大学 一种口腔诊断装置及图像处理方法
CN109840699A (zh) * 2019-01-23 2019-06-04 深圳壹账通智能科技有限公司 合格投资者线上评估方法、装置、计算机设备和存储介质
CN109934229A (zh) * 2019-03-28 2019-06-25 网易有道信息技术(北京)有限公司 图像处理方法、装置、介质和计算设备
CN110008478A (zh) * 2017-12-30 2019-07-12 ***通信集团贵州有限公司 语言转换方法、装置、计算设备及存储介质
CN110019430A (zh) * 2017-12-07 2019-07-16 东莞市杰诺软件科技有限公司 一种序时簿的动态展示方法以及终端设备
CN110135264A (zh) * 2019-04-16 2019-08-16 深圳壹账通智能科技有限公司 数据录入方法、装置、计算机设备以及存储介质
CN110135428A (zh) * 2019-04-11 2019-08-16 北京航空航天大学 图像分割处理方法和装置
CN110399867A (zh) * 2018-04-24 2019-11-01 深信服科技股份有限公司 一种文本类图像区域的识别方法、***及相关装置
CN110413819A (zh) * 2019-07-12 2019-11-05 深兰科技(上海)有限公司 一种图片描述信息的获取方法及装置
CN110443239A (zh) * 2019-06-28 2019-11-12 平安科技(深圳)有限公司 文字图像的识别方法及其装置
CN110476056A (zh) * 2017-04-26 2019-11-19 深圳配天智能技术研究院有限公司 一种视觉检测方法、检测设备以及机器人
CN110942061A (zh) * 2019-10-24 2020-03-31 泰康保险集团股份有限公司 文字识别方法、装置、设备和计算机可读介质
CN111160366A (zh) * 2019-12-18 2020-05-15 山东鹰格信息工程有限公司 一种彩色图像识别方法
CN111414472A (zh) * 2018-12-18 2020-07-14 北京奇虎科技有限公司 基于光学字符识别的图片检测方法、装置及电子设备
CN111582151A (zh) * 2020-05-07 2020-08-25 北京百度网讯科技有限公司 文档图像朝向检测方法和装置
CN111931664A (zh) * 2020-08-12 2020-11-13 腾讯科技(深圳)有限公司 混贴票据图像的处理方法、装置、计算机设备及存储介质
CN112016546A (zh) * 2020-08-14 2020-12-01 ***股份有限公司 一种文本区域的定位方法及装置
CN112085012A (zh) * 2020-09-04 2020-12-15 泰康保险集团股份有限公司 项目名称和类别识别方法及装置
CN112257830A (zh) * 2020-10-23 2021-01-22 上海烟草集团有限责任公司 一种烟箱信息识别方法及***
CN112257629A (zh) * 2020-10-29 2021-01-22 广联达科技股份有限公司 一种建筑图纸的文本信息识别方法及装置
CN113191309A (zh) * 2021-05-19 2021-07-30 杭州点望科技有限公司 一种手写汉字的识别、评分、纠错方法及***
CN113326785A (zh) * 2021-06-01 2021-08-31 上海期货信息技术有限公司 文件识别方法、装置
CN113642088A (zh) * 2021-10-13 2021-11-12 北京天辰信科技有限公司 一种施工进度信息反馈及bim模型实时展示偏差的方法
CN113780038A (zh) * 2020-06-10 2021-12-10 深信服科技股份有限公司 一种图片审计方法、装置、计算设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101196994A (zh) * 2007-12-26 2008-06-11 腾讯科技(深圳)有限公司 图片内容识别方法及识别***
CN104036285A (zh) * 2014-05-12 2014-09-10 新浪网技术(中国)有限公司 垃圾图片识别方法及***
CN104834891A (zh) * 2015-02-16 2015-08-12 北京建筑大学 一种中文图像型垃圾邮件过滤方法及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101196994A (zh) * 2007-12-26 2008-06-11 腾讯科技(深圳)有限公司 图片内容识别方法及识别***
CN104036285A (zh) * 2014-05-12 2014-09-10 新浪网技术(中国)有限公司 垃圾图片识别方法及***
CN104834891A (zh) * 2015-02-16 2015-08-12 北京建筑大学 一种中文图像型垃圾邮件过滤方法及***

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
LUKAS NEUMANN等: "A Method for Text Localization and Recognition in Real-World Images", 《COMPUTER-VISION-ACCV2010》 *
XUWANG YIN等: "Effective Text Localization in Natural Scene Images with MSER,Geometry-based Grouping and AdaBoost", 《21ST INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR 2012)》 *
廖威敏: "面向自然场景的端对端英文文字识别研究", 《中国优秀硕士学位论文全文数据库-信息科技辑》 *
彭浩等: "一种面向聚焦爬虫的自然场景文本定位技术", 《小型微型计算机***》 *
潘能杰: "图像局部不变特征提取算法研究", 《中国优秀硕士学位论文全文数据库-信息科技辑》 *

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654087B (zh) * 2015-12-30 2019-03-12 李宇 一种基于彩色模板的脱机手写字符提取方法
CN105654087A (zh) * 2015-12-30 2016-06-08 李宇 一种基于彩色模板的脱机手写字符提取方法
CN110476056B (zh) * 2017-04-26 2022-02-18 深圳配天智能技术研究院有限公司 一种视觉检测方法、检测设备以及机器人
CN110476056A (zh) * 2017-04-26 2019-11-19 深圳配天智能技术研究院有限公司 一种视觉检测方法、检测设备以及机器人
CN110019430A (zh) * 2017-12-07 2019-07-16 东莞市杰诺软件科技有限公司 一种序时簿的动态展示方法以及终端设备
CN108304843A (zh) * 2017-12-25 2018-07-20 山东浪潮云服务信息科技有限公司 一种图像审批方法及审批装置
CN107977658A (zh) * 2017-12-27 2018-05-01 深圳Tcl新技术有限公司 图像文字区域的识别方法、电视机和可读存储介质
CN110008478B (zh) * 2017-12-30 2023-10-31 ***通信集团贵州有限公司 语言转换方法、装置、计算设备及存储介质
CN110008478A (zh) * 2017-12-30 2019-07-12 ***通信集团贵州有限公司 语言转换方法、装置、计算设备及存储介质
CN108154144A (zh) * 2018-01-12 2018-06-12 江苏省新通智能交通科技发展有限公司 一种基于图像的船名字符定位方法及***
CN110399867A (zh) * 2018-04-24 2019-11-01 深信服科技股份有限公司 一种文本类图像区域的识别方法、***及相关装置
CN109285603A (zh) * 2018-08-28 2019-01-29 长安大学 一种口腔诊断装置及图像处理方法
CN111414472A (zh) * 2018-12-18 2020-07-14 北京奇虎科技有限公司 基于光学字符识别的图片检测方法、装置及电子设备
CN109840699A (zh) * 2019-01-23 2019-06-04 深圳壹账通智能科技有限公司 合格投资者线上评估方法、装置、计算机设备和存储介质
CN109934229A (zh) * 2019-03-28 2019-06-25 网易有道信息技术(北京)有限公司 图像处理方法、装置、介质和计算设备
CN110135428A (zh) * 2019-04-11 2019-08-16 北京航空航天大学 图像分割处理方法和装置
CN110135264A (zh) * 2019-04-16 2019-08-16 深圳壹账通智能科技有限公司 数据录入方法、装置、计算机设备以及存储介质
CN110443239A (zh) * 2019-06-28 2019-11-12 平安科技(深圳)有限公司 文字图像的识别方法及其装置
CN110413819A (zh) * 2019-07-12 2019-11-05 深兰科技(上海)有限公司 一种图片描述信息的获取方法及装置
CN110413819B (zh) * 2019-07-12 2022-03-29 深兰科技(上海)有限公司 一种图片描述信息的获取方法及装置
CN110942061A (zh) * 2019-10-24 2020-03-31 泰康保险集团股份有限公司 文字识别方法、装置、设备和计算机可读介质
CN111160366A (zh) * 2019-12-18 2020-05-15 山东鹰格信息工程有限公司 一种彩色图像识别方法
CN111582151A (zh) * 2020-05-07 2020-08-25 北京百度网讯科技有限公司 文档图像朝向检测方法和装置
CN111582151B (zh) * 2020-05-07 2023-08-25 北京百度网讯科技有限公司 文档图像朝向检测方法和装置
CN113780038A (zh) * 2020-06-10 2021-12-10 深信服科技股份有限公司 一种图片审计方法、装置、计算设备及存储介质
CN111931664B (zh) * 2020-08-12 2024-01-12 腾讯科技(深圳)有限公司 混贴票据图像的处理方法、装置、计算机设备及存储介质
CN111931664A (zh) * 2020-08-12 2020-11-13 腾讯科技(深圳)有限公司 混贴票据图像的处理方法、装置、计算机设备及存储介质
WO2022033095A1 (zh) * 2020-08-14 2022-02-17 ***股份有限公司 一种文本区域的定位方法及装置
TWI821671B (zh) * 2020-08-14 2023-11-11 大陸商中國銀聯股份有限公司 一種文本區域的定位方法及裝置
CN112016546A (zh) * 2020-08-14 2020-12-01 ***股份有限公司 一种文本区域的定位方法及装置
CN112085012A (zh) * 2020-09-04 2020-12-15 泰康保险集团股份有限公司 项目名称和类别识别方法及装置
CN112085012B (zh) * 2020-09-04 2024-03-08 泰康保险集团股份有限公司 项目名称和类别识别方法及装置
CN112257830A (zh) * 2020-10-23 2021-01-22 上海烟草集团有限责任公司 一种烟箱信息识别方法及***
CN112257629A (zh) * 2020-10-29 2021-01-22 广联达科技股份有限公司 一种建筑图纸的文本信息识别方法及装置
CN113191309A (zh) * 2021-05-19 2021-07-30 杭州点望科技有限公司 一种手写汉字的识别、评分、纠错方法及***
CN113326785B (zh) * 2021-06-01 2023-08-04 上海期货信息技术有限公司 文件识别方法、装置
CN113326785A (zh) * 2021-06-01 2021-08-31 上海期货信息技术有限公司 文件识别方法、装置
CN113642088B (zh) * 2021-10-13 2022-01-07 北京天辰信科技有限公司 一种施工进度信息反馈及bim模型实时展示偏差的方法
CN113642088A (zh) * 2021-10-13 2021-11-12 北京天辰信科技有限公司 一种施工进度信息反馈及bim模型实时展示偏差的方法

Also Published As

Publication number Publication date
CN106529380B (zh) 2019-12-10

Similar Documents

Publication Publication Date Title
CN106529380A (zh) 图像的识别方法及装置
CN106599792B (zh) 一种手部驾驶违规行为的检测方法
CN103413147B (zh) 一种车牌识别方法和***
CN109886210A (zh) 一种交通图像识别方法、装置、计算机设备和介质
CN109255344A (zh) 一种基于机器视觉的数显式仪表定位与读数识别方法
CN112580643B (zh) 一种基于深度学习的车牌识别方法、装置及存储介质
Sheikh et al. Traffic sign detection and classification using colour feature and neural network
CN112163511B (zh) 一种图像真伪鉴别方法
CN107292307B (zh) 一种倒置汉字验证码自动识别方法及***
CN109740572A (zh) 一种基于局部彩色纹理特征的人脸活体检测方法
CN109635825A (zh) 车辆属性检测方法、装置及存储介质
CN106951869A (zh) 一种活体验证方法及设备
CN104899586A (zh) 对图像中包含的文字内容进行识别方法及装置
CN112990220B (zh) 一种图像中目标文本智能识别方法及***
CN106203539A (zh) 识别集装箱箱号的方法和装置
CN110503103A (zh) 一种基于全卷积神经网络的文本行中的字符切分方法
CN115186303B (zh) 一种基于大数据云平台的金融签章安全管理方法及***
WO2021159802A1 (zh) 图形验证码识别方法、装置、计算机设备及存储介质
CN108647570A (zh) 斑马线检测方法、装置及计算机可读存储介质
CN111553368A (zh) 伪造车牌的识别方法、训练方法、装置、设备及存储介质
CN108460772A (zh) 基于卷积神经网络的广告骚扰传真图像检测***及方法
CN114926829A (zh) 一种证件检测方法、装置、电子设备及存储介质
Islam et al. Automatic Vehicle Bangla License Plate Detection and Recognition
Chen et al. Chinese license plate recognition based on human vision attention mechanism
Herusutopo et al. Recognition design of license plate and car type using tesseract OCR and EmguCV

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant