CN103593666B - 一种图像识别方法、过滤方法及相关装置 - Google Patents

一种图像识别方法、过滤方法及相关装置 Download PDF

Info

Publication number
CN103593666B
CN103593666B CN201210287521.0A CN201210287521A CN103593666B CN 103593666 B CN103593666 B CN 103593666B CN 201210287521 A CN201210287521 A CN 201210287521A CN 103593666 B CN103593666 B CN 103593666B
Authority
CN
China
Prior art keywords
region
area
strong edge
image
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210287521.0A
Other languages
English (en)
Other versions
CN103593666A (zh
Inventor
贾梦雷
王永攀
郑琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210287521.0A priority Critical patent/CN103593666B/zh
Publication of CN103593666A publication Critical patent/CN103593666A/zh
Application granted granted Critical
Publication of CN103593666B publication Critical patent/CN103593666B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本申请实施例公开了一种图像识别方法、过滤方法及其相关装置。其中的识别方法包括:提取目标图像上的文字区域块;采用图像边缘算法,提取目标图像上的强边缘区域;判断所述强边缘区域是否为所述文字区域块的背景区域;如果是,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域。进行识别后,再根据所述辅助信息区域的区域信息和内容信息中的任意一个或者任意多个,确定所述辅助信息区域所在图像的类型。根据本申请实施例,可以识别出辅助信息区域,并根据辅助信息区域过滤异常图像,避免异常图像对消费者或者管理者造成的危害。

Description

一种图像识别方法、过滤方法及相关装置
技术领域
本申请涉及图像处理技术领域,特别是涉及一种图像识别方法、过滤方法及相关装置。
背景技术
在购物网站上,商家用于展示商品的图像从内容上来看一般包括两个部分:展示商品状态的商品图像和在商品图像上增加的展示商品的一些辅助信息的辅助信息区域。这些辅助信息区域一般用于标识商品的品牌、介绍商品的特点或者宣传促销、打折信息等,辅助信息区域中通常包括文字(包括中文汉字、数字和英文字母)、商标和图案等。
但一些辅助信息区域的内容很可能包含有不实或者夸张的广告等误导信息,消费者会因为错信这些误导信息而带来经济上的损失。另外,还有一些辅助信息区域往往以各种夸张的展现方式“喧宾夺主”,成为视觉的关注点,影响商品图像本身的展示效果。而商家和第三方购物平台也会受到信誉上的损失,甚至危害到商家和第三方购物平台的生存。可见,一些辅助信息区域很有可能是具有危害性的,它既影响了消费者的正常消费,也影响了管理者对商品的正常管理。通常,将包含这些具有危害性或干扰信息比较突出的辅助信息区域的图像称为异常图像。
基于现有技术中存在的上述技术问题,目前迫切需要提供一种在用于展示商品的图像中识别出辅助信息区域的图像识别方法,以及,一种在包含识别出的辅助信息区域的所有图像中过滤异常图像的图像过滤方法。
发明内容
为了解决上述技术问题,本申请实施例提供了一种图像识别方法、过滤方法及相关装置,以识别出辅助信息区域,并从包含辅助信息区域的图像中过滤异常图像,避免异常图像对消费者或者管理者造成的危害。
本申请实施例公开公开了如下技术方案:
一种图像识别方法,包括:
提取目标图像上的文字区域块;
采用图像边缘算法,提取目标图像上的强边缘区域;
判断所述强边缘区域是否为所述文字区域块的背景区域;
如果是,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域。
一种图像过滤方法,包括:
提取目标图像上的文字区域块;
采用图像边缘算法,提取目标图像上的强边缘区域;
判断所述强边缘区域是否为文字区域块的背景区域;
如果是,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域;
根据所述辅助信息区域的区域信息和内容信息中的任意一个信息或者任意多个信息组合,确定所述辅助信息区域所在图像的类型。
一种图像识别装置,包括:
文字区域块提取模块,用于提取目标图像上的文字区域块;
强边缘区域提取模块,用于采用图像边缘算法,提取目标图像上的强边缘区域;
背景区域判断模块,用于判断所述强边缘区域是否为文字区域块的背景区域;
图像识别模块,用于当所述背景区域判断模块的判断结果为是时,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域。
一种图像过滤装置,包括:
文字区域块提取模块,用于提取目标图像上的文字区域块;
强边缘区域提取模块,用于采用图像边缘算法,提取目标图像上的强边缘区域;
背景区域判断模块,用于判断所述强边缘区域是否为文字区域块的背景区域;
图像识别模块,用于当所述背景区域判断模块的判断结果为是时,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域;
图像过滤模块,用于根据所述辅助信息区域的区域信息和内容信息中的任意一个信息或者任意多个信息组合,确定所述辅助信息区域所在图像的类型。
由上述实施例可以看出,提取目标图像中的文字区域块,对文字区域块进行背景扩展,可识别出目标图像中的辅助信息区域。基于识别出的辅助信息区域,根据辅助信息区域的个数、大小、位置或内容,进一步过滤出异常图像,从而可以避免异常图像对消费者或者管理者造成的危害。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例一揭示的一种图像识别方法的方法流程图;
图2为本申请中文字排布信息的统计示意图;
图3为本申请中带有文字区域块的背景区域的商品图像示意图;
图4为本申请实施例二揭示的一种图像过滤方法的方法流程图;
图5为本申请中过滤商品图像的对比示意图;
图6为本申请实施例三揭示的一种图像过滤方法的方法流程图;
图7为本申请实施例四揭示的一种图像识别装置的装置结构图;
图8为本申请实施例四揭示的一种图像识别装置的装置结构图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图对本申请实施例进行详细描述。
实施例一
请参阅图1,其为本申请实施例一揭示的一种图像识别方法的方法流程图,该方法包括以下步骤:
步骤101:提取目标图像上的文字区域块;
可基于现有技术中的纹理统计法或者区域分析法,从目标图像上提取文字区域块。其中,基于纹理统计法的文字区域块提取方法具体为:对目标图像进行纹理提取,如,常见的有sobel(索贝尔)、lbp(局部二值模式)或者小波等纹理提取方式;根据提取出的纹理统计文字排布信息;根据文字排布信息确定是否为文字区域块,例如,只要统计的文字排布信息符合如图2所示的文字排布结构,即被确定为文字区域块。
另外,基于区域分析的文字区域块提取方法具体为:对图像进行区域提取,如,常见的有canny或mser等区域提取方式;根据文字区域的基础特征、笔划特征或排列特征等特征对非文字区域进行过滤。如,常用的基础特征包括:区域面积或区域面积与目标图像总面积的比值、区域面积与拟合椭圆的比值、或区域周长与区域面积的比值等。常用的笔划特征包括:笔划的平均相对角度、笔划的对称边缘比例、主笔划宽度、或笔划宽度的离散程度等。常用的排列特征包括:邻近区域大小、笔划宽度、或颜色等属性相似度,几何排列性质等。
按照上述方法进行提取后,获得的文字区域块是文字区域的外接矩形,通过该外接矩形的起始位置和矩形的长、宽来标识该外接矩形。
需要说明的是,本申请实施例并不限定采用何种方法提取目标图像上的文字区域块,除了上述列举的两种方法外,也可以采用现有技术公开的其它方法提取文字区域块。
步骤102:采用图像边缘算法,提取目标图像上的强边缘区域;
在很多辅助信息区域中,文字区域块并不是直接置于商品图像之上,往往还会加有一个背景区域,以示突出。如图3所示,文字区域块都伴随有一定大小的背景区域,这些文字区域块的背景区域也同样属于辅助信息区域的一部分。因此,在对文字区域块进行提取的同时,还需要一并提取出文字区域块的背景区域。
在本申请实施例中,提供了一种基于强边缘区域的背景区域识别方案。例如,采用canny图像边缘算法,提取目标图像上的强边缘区域。当然,本申请实施例并不限定采用何种方法提取目标图像的强边缘区域,除了canny图像边缘算法外,也可以采用现有技术公开的其它方法提取强边缘区域。
步骤103:判断所述强边缘区域是否为所述文字区域块的背景区域,如果是,进入步骤104,否则,进入步骤105;
判断所述强边缘区域是否为文字区域块的背景区域的一种实现方式为:根据所述强边缘区域的主颜色率判断所述强边缘区域是否为纯色区域;如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
除了利用主颜色率判断提取出的强边缘区域是否为文字区域块的背景区域外,判断所述强边缘区域是否为文字区域块的背景区域的另一种实现方式为:判断是否有文字区域块位于所述强边缘区域上;如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
此外,还可以利用主颜色判断一个强边缘区域是否为文字区域块的背景区域,则判断所述强边缘区域是否为文字区域块的背景区域包括:判断所述强边缘区域和文字区域块的主颜色是否相同;如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
另外,还可以通过颜色统计直方图,得到强边缘区域和文字区域块的主颜色。通过颜色距离公式计算出两个主颜色之间的距离,如果距离小于一个预设的距离阈值,强边缘区域和文字区域块的主颜色相近,颜色距离公式为:
其中,Δr=r1-r2,Δg=g1-g2,Δb=b1-b2,强边缘区域的主颜色为:(r1,g1,b1),文字区域块的主颜色为:(r2,g2,b2)。
需要说明的是,本发明对上述预设的距离阈值的具体数值并不进行限定,不同的图像所预设的距离阈值的大小也不同。在实际应用中,可以根据识别的精确度要求不断调整该距离阈值。
当然,除了分别利用上述三种方法判断提取的强边缘区域是否为文字区域块的背景区域之外,为了提高识别的准确度,还可以同时利用上述三种方法进行判断,当三个判断条件都符合时,认为提取的强边缘区域是文字区域块的背景区域,否则,认为提取的强边缘区域不是文字区域块的背景区域。
步骤104:把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域。
步骤105:将所述文字区域块识别为辅助信息区域。
最后,当确定提取的强边缘区域为文字区域块的背景区域后,把步骤101中提取出的文字区域块扩展背景区域;否则,仅保留步骤101中提取的文字区域块。
由上述实施例可以看出,提取目标图像中的文字区域块,对文字区域块进行背景扩展,可识别出目标图像中的辅助信息区域。
实施例二
当从目标图像中识别出辅助信息区域后,有些辅助信息区域是具有危害性的,也被称为异常图像,因此,本申请实施例提供一种图像过滤方法,以从包含辅助信息区域的图像中过滤出异常图像。请参阅图4,其为本申请实施例二揭示的一种图像过滤方法的方法流程图,包括以下步骤:
步骤401:提取目标图像上的文字区域块;
步骤402:采用图像边缘算法,提取目标图像上的强边缘区域;
步骤403:判断所述强边缘区域是否为文字区域块的背景区域,如果是,进入步骤404,否则,进入步骤405;
步骤404:把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,进入步骤406;
步骤405:将所述文字区域块识别为辅助信息区域;
上述步骤401-405的执行过程可以参见实施例一中的步骤101-105,由于该部分内容已经在实施例一中进行了详细地描述,故此处不再赘述。
步骤406:根据所述辅助信息区域的区域信息和内容信息中的任意一个信息或者任意多个信息组合,确定所述辅助信息区域所在图像的类型。
优选的,辅助信息区域的区域信息包括:辅助信息区域的区域个数、大小和位置。
当然,除了上述优选的区域信息之外,还可以根据其他的区域信息确定辅助信息区域所在图像的类型,如,辅助信息区域的颜色等。
辅助信息区域的内容信息即为辅助信息区域中记载的所有内容,如文字或单词等。
通过上述图像过滤方法,其区分出的图像类型包括异常图像和正常图像。
下面分别以几种情况为例,说明根据辅助信息区域的区域信息和内容信息,确定所述辅助信息区域所在图像的类型的方法。需要说明的是,当同时采用多个区域信息确定辅助信息区域所在图像的类型时,本发明并不限定彼此之间的先后顺序;还可以同时采用多个区域信息对辅助信息区域所在图像的类型进行确定,并设定:当任意一个或者任意多个的确定结果(包括全部确定结果)为异常图像时,最终确定图像即为异常图像。
如果根据辅助信息区域的个数确定所述辅助信息区域所在图像的类型,其实现方法包括:统计所述辅助信息区域的个数;判断统计的个数是否大于第一预设数目阈值;如果是,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。第一预设数目阈值的数值可以由客户根据自身的需求任意设定,例如,将第一预设数目阈值设置为3,如果统计的辅助信息区域的个数大于3时,包含该3个辅助信息区域的图像的类型为异常图像,如果统计的辅助信息区域的个数为1个,包含该1个辅助信息区域的图像为正常图像。
如果根据辅助信息区域的大小确定所述辅助信息区域所在图像的类型,其实现方法包括:计算所述辅助信息区域的面积;判断计算的面积是否大于预设面积阈值;如果是,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像为正常图像。上述预设面积阈值的数值也可以由客户根据自身的需求任意设定。例如,将预设面积阈值设置为100(像素),分别计算每一个辅助信息区域的面积,如果辅助信息区域的面积大于100,该辅助信息区域所在图像为异常图像,否则,为正常图像。
除了直接利用面积的大小确定辅助信息区域的类型之外,还可以在计算每一个辅助信息的面积,得到面积大于预设面积阈值的辅助信息区域后,进一步判断该面积大于预设面积阈值的辅助信息区域与目标图像的面积比值是否大于预设比例,如果是,确定辅助信息区域为异常图像,否则,为正常图像。如,设定预设比例为10%,当面积大于100的辅助信息区域的面积与目标图像的面积的比例大于10%时,该辅助信息区域所在图像为异常图像,否则,为正常图像。
或者,还可以根据辅助信息区域的个数和面积,确定辅助信息区域所在图像的类型,其实现方法包括:计算辅助信息区域的面积,统计面积大于预设面积阈值的辅助信息区域的个数,判断统计的个数是否大于第一预设数目阈值,如果是,确定辅助信息区域所在图像为异常图像,否则,为正常图像。例如,仍旧将预设面积阈值设置为100,将第一预设数目阈值设置为3,经过图像识别,确定的某图像上的辅助信息区域为5个(A、B、C、D和E),计算5个辅助信息区域的面积,统计面积大于100的辅助信息区域的个数,假设辅助信息区域A、B、C和D的面积大于100,统计的个数为4,统计的个数大于3,则辅助信息区域A、B、C、D和E所在图像为异常图像。
如果根据辅助信息区域的个数和位置确定所述辅助信息区域所在图像的类型,其实现方法包括:统计位于目标图像的指定区域的所述辅助信息区域的个数,所述目标图像的指定区域为目标图像的核心区域、目标图像的中心区域或目标图像的边缘区域;判断统计的个数是否大于第二预设数目阈值;如果是,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像为正常图像。
上述目标图像的核心区域、中心区域和边缘区域的大小可以由客户根据自身的需求任意设定,第二预设数目阈值的数值可以由客户根据自身的需求任意设定。例如,以矩形划分目标图像的核心区域、中心区域和边缘区域为例,当由矩形左上角的x,y坐标和右下角的x,y坐标确定一个矩形时,设定(0.3,0.3,0.7,0.7)为目标图像的核心区域,设定(0.15,0.15,0.85,0.85)为目标图像的中心区域,其余部分为目标图像的边缘区域。统计位于核心区域的辅助信息区域的个数,当设定核心区域下的第二预设数目阈值为1时,如果位于核心区域的辅助信息区域的个数大于1,则该核心区域内的辅助信息区域所在图像为异常图像,否则,为正常图像。或者,统计位于中心区域的辅助信息区域的个数,当设定中心区域下的第二预设数目阈值为2时,如果位于中心区域的辅助信息区域的个数大于2,则该中心区域内的辅助信息区域所在图像为异常图像,否则,为正常图像。或者,统计位于边缘区域的辅助信息区域的个数,当设定边缘区域下的第二预设数目阈值为3时,如果位于边缘区域的辅助信息区域的个数大于3,则该边缘区域内的辅助信息区域所在图像为异常图像,否则,为正常图像。
如果根据辅助信息区域的内容信息确定所述辅助信息区域所在图像的类型,其实现方法包括:根据机器学习法,从所述文字区域块中识别文字;判断识别出的文字是否与预设词库中的违禁词相匹配;如果是,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。
其中,本申请实施例采用现有的机器学习法,从所述文字区域块中识别文字,具体包括:通过文字高度或间距等特性将文字区域块切成一个个包含单字的字块;对字块进行特征描述,如,基于边缘点采样及其相连方向统计的描述方法,或者,基于HOG(Histogramsof Oriented Gradients,梯度方向直方图)的描述方法,或者,基于笔划宽度方向的描述方法等;通过机器学习,根据字块的特征将字块识别为文字,如,***提供的机器学习方法SVM(Support Vector Machine,支持向量机)可以根据字块的特征将字块识别为文字。
当将文字区域块识别为文字后,后台的预设词库中储存有违禁词表,将识别出的文字与预设词库中的违禁词进行匹配,如果文字区域块中存在违禁词,将该辅助信息区域所在图像判定为异常图像,否则,为正常图像。
当然,本申请实施例可以根据辅助信息区域的个数、大小、位置和内容,综合确定所述辅助信息区域所在图像的类型的方法,也就是说,当分别通过上述四种方式都确定一个辅助信息区域所在图像为异常图像时,该辅助信息区域所在图像被最终确定为异常图像,否则,该辅助信息区域所在图像被最终确定为正常图像。需要说明的是,当同时采用多个信息(包括区域信息和内容信息中的任意多个组合)确定辅助信息区域所在图像的类型时,本发明并不限定彼此之间的先后顺序。当然,还可以同时采用多个信息对辅助信息区域所在图像的类型进行确定,并设定:当任意一个或者任意多个的确定结果(包括全部确定结果)为异常图像时,该图像即为异常图像。
由上述实施例可以看出,提取目标图像中的文字区域块,对文字区域块进行背景扩展,可识别出目标图像中的辅助信息区域。基于识别出的辅助信息区域,根据辅助信息区域的个数、大小、位置或内容,进一步过滤出异常图像,从而可以避免异常图像对消费者或者管理者造成的危害。
实施例三
下面以图5所示的5组目标图像为例,详细说明对目标图像的过滤方法,以过滤出其中的异常图像。请参阅图6,其为本申请实施例三揭示的一种图像过滤方法的方法流程图,包括以下步骤:
步骤601:提取目标图像上的文字区域块;
步骤602:将提取的文字区域块进行背景扩展;
步骤603:将扩展后的区域识别为辅助信息区域;
步骤604:确定各个辅助信息区域在目标图像中的区域;
步骤605:判断辅助信息区域在特定区域中的面积是否大于预设的面积阈值,如果是,确定该辅助信息区域所在图像为异常图像,否则,进入步骤606;
步骤606:判断辅助信息区域在特定区域中的个数是否大于预设的数目阈值,如果是,确定该辅助信息区域所在图像为异常图像,否则,进入步骤607;
步骤607:对提取的文字区域块进行文字识别;
步骤608:判断识别出的文字是否与违禁词库中的违禁词相匹配,如果是,确定该辅助信息区域所在图像为异常图像,否则,确定该辅助信息区域所在图像为正常图像。
如图5所示,第一列为目标图像的原图,第二列为目标图像中识别出的辅助信息区域(包括文字区域块和背景区域),第三列为从文字区域块中识别出的违禁词,第四列为过滤结果。
由上述实施例可以看出,提取目标图像中的文字区域块,对文字区域块进行背景扩展,可识别出目标图像中的辅助信息区域。基于识别出的辅助信息区域,根据辅助信息区域的个数、大小、位置或内容,进一步过滤出异常图像,从而可以避免异常图像对消费者或者管理者造成的危害。
实施例四
与上述实施例一中的一种图像识别方法相对应,本申请实施例还提供了一种图像识别装置。请参阅图7,其为本申请实施例四揭示的一种图像识别装置的装置结构图,该装置包括:文字区域块提取模块701、强边缘区域提取模块702、背景区域判断模块703和图像识别模块704。下面结合该装置的工作原理进一步介绍其内部结构以及连接关系。
文字区域块提取模块701,用于提取目标图像上的文字区域块;
强边缘区域提取模块702,用于采用图像边缘算法,提取目标图像上的强边缘区域;
背景区域判断模块703,用于判断所述强边缘区域是否为文字区域块的背景区域;
图像识别模块704,用于当所述背景区域判断模块的判断结果为是时,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域。
优选的,背景区域判断模块703包括:第一判断子模块,用于根据所述强边缘区域的主颜色率判断所述强边缘区域是否为纯色区域;第一结果确定子模块,用于当所述第一判断子模块的判断结果为是时,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
或者,优选你的,背景区域判断模块703包括:第二判断子模块,用于判断是否有文字区域块位于所述强边缘区域上;第二结果确定子模块,用于当所述第二判断子模块的判断结果为是时,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
再或者,优选的,背景区域判断模块703包括:第三判断子模块,用于判断所述强边缘区域和文字区域块的主颜色是否相同;第三结果确定子模块,用于当所述第三判断子模块的判断结果为是时,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
再或者,优选的,背景区域判断模块703包括:距离计算子模块,用于通过颜色距离公式计算所述强边缘区域和文字区域块的主颜色之间的距离,其中,颜色距离公式为:其中,Δr=r1-r2,Δg=g1-g2,Δb=b1-b2,强边缘区域的主颜色为:(r1,g1,b1),文字区域块的主颜色为:(r2,g2,b2);第四判断子模块,用于判断所述强边缘区域和文字区域块的主颜色之间的距离是否小于预设距离阈值;第四结果确定子模块,用于当所述第四判断子模块的判断结果为是时,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
由上述实施例可以看出,提取目标图像中的文字区域块,对文字区域块进行背景扩展,可识别出目标图像中的辅助信息区域。
实施例五
与上述实施例二中的一种图像过滤方法相对应,本申请实施例还提供了一种图像过滤装置。请参阅图8,其为本申请实施例四揭示的一种图像识别装置的装置结构图,该装置包括:文字区域块提取模块701、强边缘区域提取模块702、背景区域判断模块703、图像识别模块704和图像过滤模块705。下面结合该装置的工作原理进一步介绍其内部结构以及连接关系。
文字区域块提取模块701,用于提取目标图像上的文字区域块;
强边缘区域提取模块702,用于采用图像边缘算法,提取目标图像上的强边缘区域;
背景区域判断模块703,用于判断所述强边缘区域是否为文字区域块的背景区域;
图像识别模块704,用于当所述背景区域判断模块的判断结果为是时,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域;
图像过滤模块705,用于根据所述辅助信息区域的区域信息和内容信息中的任意一个或者任意多个组合,确定所述辅助信息区域所在图像的类型。
所述类型包括异常图像和正常图像。
其中,优选的,图像过滤模块705包括:个数统计子模块,用于统计所述辅助信息区域的个数;个数判断子模块,用于判断统计的个数是否大于第一预设数目阈值;第一类型确定子模块,用于当所述个数判断子模块的判断结果为是时,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。
或者,优选的,图像过滤模块705包括:面积统计子模块,用于计算所述辅助信息区域的面积;面积判断子模块,用于判断计算的面积是否大于预设面积阈值;第二类型确定子模块,用于当所述面积判断子模块的判断结果为是时,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。
再或者,优选的,所述图像过滤模块705包括:统合统计子模块,用于统计位于目标图像的指定区域的所述辅助信息区域的个数,所述目标图像的指定区域为图标图像的核心区域、目标图像的中间区域或目标图像的边缘区域;统合判断子模块,用于判断统计的个数是否大于第二预设数目阈值;第三类型确定子模块,用于当所述综合判断子模块的判断结果为是时,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像为正常图像。
再或者,优选的,所述图像过滤模块705包括:文字识别子模块,用于根据机器学习法,从所述文字区域块中识别出文字;文字匹配判断子模块,用于判断识别出的文字是否与预设词库中的违禁词相匹配;第四类型确定子模块,用于当所述文字匹配判断子模块的判断结果为是时,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。
其中的背景区域判断模块703的结构可以参见实施例四中的描述,本实施例不再赘述。
由上述实施例可以看出,提取目标图像中的文字区域块,对文字区域块进行背景扩展,可识别出目标图像中的辅助信息区域。基于识别出的辅助信息区域,根据辅助信息区域的个数、大小、位置或内容,进一步过滤出异常图像,从而可以避免异常图像对消费者或者管理者造成的危害。
需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上对本申请所提供的一种图像识别方法、过滤方法及相关装置进行了详细介绍,本文中应用了具体实施例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (31)

1.一种图像识别方法,其特征在于,包括:
提取目标图像上的文字区域块;
采用图像边缘算法,提取目标图像上的强边缘区域;
判断所述强边缘区域是否为所述文字区域块的背景区域;
如果是,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域。
2.根据权利要求1所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括:
根据所述强边缘区域的主颜色率判断所述强边缘区域是否为纯色区域;
如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
3.根据权利要求1所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括:
判断是否有文字区域块位于所述强边缘区域上;
如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
4.根据权利要求1所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括:
判断所述强边缘区域和文字区域块的主颜色是否相同;
如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
5.根据权利要求1所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括:
通过颜色距离公式计算所述强边缘区域和文字区域块的主颜色之间的距离,其中,颜色距离公式为:其中,Δr=r1-r2,Δg=g1-g2,Δb=b1-b2;强边缘区域的主颜色为:(r1,g1,b1),文字区域块的主颜色为:(r2,g2,b2);
判断所述强边缘区域和文字区域块的主颜色之间的距离是否小于预设距离阈值;
如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
6.根据权利要求1-5中任意一项所述的方法,其特征在于,所述提取目标图像上的文字区域块包括:
基于纹理统计法或者基于区域分析法,从目标图像上提取文字区域块。
7.一种图像过滤方法,其特征在于,包括:
提取目标图像上的文字区域块;
采用图像边缘算法,提取目标图像上的强边缘区域;
判断所述强边缘区域是否为文字区域块的背景区域;
如果是,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域;
根据所述辅助信息区域的区域信息和内容信息中的任意一个信息或者任意多个信息组合,确定所述辅助信息区域所在图像的类型。
8.根据权利要求7所述的方法,其特征在于,所述辅助信息区域的区域信息包括:辅助信息区域的区域个数、大小和位置。
9.根据权利要求7所述的方法,其特征在于,所述根据所述辅助信息区域的个数确定所述辅助信息区域所在图像的类型包括:
统计所述辅助信息区域的个数;
判断统计的个数是否大于第一预设数目阈值;
如果是,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。
10.根据权利要求7所述的方法,其特征在于,所述根据所述辅助信息区域的大小确定所述辅助信息区域所在图像的类型包括:
计算所述辅助信息区域的面积;
判断计算的面积是否大于预设面积阈值;
如果是,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。
11.根据权利要求7所述的方法,其特征在于,所述根据所述辅助信息区域的个数和位置确定所述辅助信息区域所在图像的类型包括:
统计位于目标图像的指定区域的所述辅助信息区域的个数,所述目标图像的指定区域为目标图像的核心区域、目标图像的中间区域或目标图像的边缘区域;
判断统计的个数是否大于第二预设数目阈值;
如果是,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。
12.根据权利要求7所述的方法,其特征在于,所述根据所述辅助信息区域的内容确定所述辅助信息区域所在图像的类型包括:
根据机器学习法,从所述文字区域块中识别出文字;
判断识别出的文字是否与预设词库中的违禁词相匹配;
如果是,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。
13.根据权利要求7所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括:
根据所述强边缘区域的主颜色率判断所述强边缘区域是否为纯色区域;
如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
14.根据权利要求7所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括:
判断是否有文字区域块位于所述强边缘区域上;
如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
15.根据权利要求7所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括:
判断所述强边缘区域和文字区域块的主颜色是否相同;
如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
16.根据权利要求7所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括:
通过颜色距离公式计算所述强边缘区域和文字区域块的主颜色之间的距离,其中,颜色距离公式为:其中,Δr=r1-r2,Δg=g1-g2,Δb=b1-b2,强边缘区域的主颜色为:(r1,g1,b1),文字区域块的主颜色为:(r2,g2,b2);
判断所述强边缘区域和文字区域块的主颜色之间的距离是否小于预设距离阈值;
如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
17.一种图像识别装置,其特征在于,包括:
文字区域块提取模块,用于提取目标图像上的文字区域块;
强边缘区域提取模块,用于采用图像边缘算法,提取目标图像上的强边缘区域;
背景区域判断模块,用于判断所述强边缘区域是否为文字区域块的背景区域;
图像识别模块,用于当所述背景区域判断模块的判断结果为是时,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域。
18.根据权利要求17所述的装置,其特征在于,所述背景区域判断模块包括:
第一判断子模块,用于根据所述强边缘区域的主颜色率判断所述强边缘区域是否为纯色区域;
第一结果确定子模块,用于当所述第一判断子模块的判断结果为是时,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
19.根据权利要求17所述的装置,其特征在于,所述背景区域判断模块包括:
第二判断子模块,用于判断是否有文字区域块位于所述强边缘区域上;
第二结果确定子模块,用于当所述第二判断子模块的判断结果为是时,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
20.根据权利要求17所述的装置,其特征在于,所述背景区域判断模块包括:
第三判断子模块,用于判断所述强边缘区域和文字区域块的主颜色是否相同;
第三结果确定子模块,用于当所述第三判断子模块的判断结果为是时,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
21.根据权利要求17所述的装置,其特征在于,所述背景区域判断模块包括:
距离计算子模块,用于通过颜色距离公式计算所述强边缘区域和文字区域块的主颜色之间的距离,其中,颜色距离公式为:其中,Δr=r1-r2,Δg=g1-g2,Δb=b1-b2,强边缘区域的主颜色为:(r1,g1,b1),文字区域块的主颜色为:(r2,g2,b2);
第四判断子模块,用于判断所述强边缘区域和文字区域块的主颜色之间的距离是否小于预设距离阈值;
第四结果确定子模块,用于当所述第四判断子模块的判断结果为是时,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
22.一种图像过滤装置,其特征在于,包括:
文字区域块提取模块,用于提取目标图像上的文字区域块;
强边缘区域提取模块,用于采用图像边缘算法,提取目标图像上的强边缘区域;
背景区域判断模块,用于判断所述强边缘区域是否为文字区域块的背景区域;
图像识别模块,用于当所述背景区域判断模块的判断结果为是时,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域;
图像过滤模块,用于根据所述辅助信息区域的区域信息和内容信息中的任意一个信息或者任意多个信息组合,确定所述辅助信息区域所在图像的类型。
23.根据权利要求22所述的装置,其特征在于,所述辅助信息区域的区域信息包括:辅助信息区域的区域个数、大小和位置。
24.根据权利要求22所述的装置,其特征在于,所述图像过滤模块包括:
个数统计子模块,用于统计所述辅助信息区域的个数;
个数判断子模块,用于判断统计的个数是否大于第一预设数目阈值;
第一类型确定子模块,用于当所述个数判断子模块的判断结果为是时,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。
25.根据权利要求22所述的装置,其特征在于,所述图像过滤模块包括:
面积统计子模块,用于计算所述辅助信息区域的面积;
面积判断子模块,用于判断计算的面积是否大于预设面积阈值;
第二类型确定子模块,用于当所述面积判断子模块的判断结果为是时,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。
26.根据权利要求22所述的装置,其特征在于,所述图像过滤模块包括:
统合统计子模块,用于统计位于目标图像的指定区域的所述辅助信息区域的个数,所述目标图像的指定区域为图标图像的核心区域、目标图像的中间区域或目标图像的边缘区域;
统合判断子模块,用于判断统计的个数是否大于第二预设数目阈值;
第三类型确定子模块,用于当所述统合判断子模块的判断结果为是时,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。
27.根据权利要求22所述的装置,其特征在于,所述图像过滤模块包括:
文字识别子模块,用于根据机器学习法,从所述文字区域块中识别出文字;
文字匹配判断子模块,用于判断识别出的文字是否与预设词库中的违禁词相匹配;
第四类型确定子模块,用于当所述文字匹配判断子模块的判断结果为是时,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。
28.根据权利要求22所述的装置,其特征在于,所述背景区域判断模块包括:
第一判断子模块,用于根据所述强边缘区域的主颜色率判断所述强边缘区域是否为纯色区域;
第一结果确定子模块,用于当所述第一判断子模块的判断结果为是时,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
29.根据权利要求22所述的装置,其特征在于,所述背景区域判断模块包括:
第二判断子模块,用于判断是否有文字区域块位于所述强边缘区域上;
第二结果确定子模块,用于当所述第二判断子模块的判断结果为是时,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
30.根据权利要求22所述的装置,其特征在于,所述背景区域判断模块包括:
第三判断子模块,用于判断所述强边缘区域和文字区域块的主颜色是否相同;
第三结果确定子模块,用于当所述第三判断子模块的判断结果为是时,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
31.根据权利要求22所述的装置,其特征在于,所述背景区域判断模块包括:
距离计算子模块,用于通过颜色距离公式计算所述强边缘区域和文字区域块的主颜色之间的距离,其中,颜色距离公式为:其中,Δr=r1-r2,Δg=g1-g2,Δb=b1-b2,强边缘区域的主颜色为:(r1,g1,b1),文字区域块的主颜色为:(r2,g2,b2);
第四判断子模块,用于判断所述强边缘区域和文字区域块的主颜色之间的距离是否小于预设距离阈值;
第四结果确定子模块,用于当所述第四判断子模块的判断结果为是时,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。
CN201210287521.0A 2012-08-13 2012-08-13 一种图像识别方法、过滤方法及相关装置 Active CN103593666B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210287521.0A CN103593666B (zh) 2012-08-13 2012-08-13 一种图像识别方法、过滤方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210287521.0A CN103593666B (zh) 2012-08-13 2012-08-13 一种图像识别方法、过滤方法及相关装置

Publications (2)

Publication Number Publication Date
CN103593666A CN103593666A (zh) 2014-02-19
CN103593666B true CN103593666B (zh) 2017-10-13

Family

ID=50083798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210287521.0A Active CN103593666B (zh) 2012-08-13 2012-08-13 一种图像识别方法、过滤方法及相关装置

Country Status (1)

Country Link
CN (1) CN103593666B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528603B (zh) * 2015-12-16 2018-07-27 西安交通大学 一种利用笔画对比和边缘密度特征滤除非文字边缘的方法
CN109272526B (zh) * 2017-07-17 2021-11-02 北京京东尚科信息技术有限公司 图像处理方法、***及电子设备
CN110019899B (zh) * 2017-08-25 2023-10-03 腾讯科技(深圳)有限公司 一种目标对象识别方法、装置、终端及存储介质
CN112884761A (zh) * 2021-03-19 2021-06-01 东营市阔海水产科技有限公司 水产经济动物头部识别方法、终端设备及可读存储介质
CN113240488B (zh) * 2021-05-14 2024-04-05 深圳迅销科技股份有限公司 一种利用电子商务展示商品信息的***和方法
CN113658229B (zh) * 2021-08-13 2024-02-02 杭州华橙软件技术有限公司 异常对象的确定方法及装置、存储介质、电子装置
CN116758576B (zh) * 2023-08-21 2023-11-21 苏州极易科技股份有限公司 基于机器学习的营销信息识别方法、装置、设备和介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101031035A (zh) * 2006-03-03 2007-09-05 广州市纽帝亚资讯科技有限公司 基于视频序列分析的新闻视频单元自动分割方法
CN101599125A (zh) * 2009-06-11 2009-12-09 上海交通大学 复杂背景下图像处理的二值化方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7302098B2 (en) * 2004-12-03 2007-11-27 Motorola, Inc. Character segmentation method and apparatus

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101031035A (zh) * 2006-03-03 2007-09-05 广州市纽帝亚资讯科技有限公司 基于视频序列分析的新闻视频单元自动分割方法
CN101599125A (zh) * 2009-06-11 2009-12-09 上海交通大学 复杂背景下图像处理的二值化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Embedded-Text Detection and Its Application to Anti-Spam Filtering;Ching-Tung Wu;《University of California》;20051231;全文 *
一种基于内容的广告垃圾图像过滤方法;许洋洋等;《山东大学学报(理学版)》;20060630;第37-42页 *

Also Published As

Publication number Publication date
CN103593666A (zh) 2014-02-19

Similar Documents

Publication Publication Date Title
CN103593666B (zh) 一种图像识别方法、过滤方法及相关装置
CN105868758B (zh) 图像中文本区域检测方法、装置及电子设备
CN101615252B (zh) 一种自适应图像文本信息提取方法
Shivakumara et al. New Fourier-statistical features in RGB space for video text detection
Antonacopoulos et al. ICDAR 2009 page segmentation competition
Jung et al. A stroke filter and its application to text localization
JP2012500428A (ja) 印刷媒体ページの記事へのセグメント化
US9129156B2 (en) Method for detecting and recognizing an object in an image, and an apparatus and a computer program therefor
CN105868759A (zh) 分割图像字符的方法及装置
CN108154132A (zh) 一种身份证文字提取方法、***及设备和存储介质
CN110728198A (zh) 图像处理方法、装置、电子设备及可读存储介质
Song et al. A novel image text extraction method based on k-means clustering
Hesham et al. Arabic document layout analysis
CN107330430A (zh) 藏文字符识别装置与方法
Nevetha et al. Automatic book spine extraction and recognition for library inventory management
Sharma et al. Piece-wise linearity based method for text frame classification in video
Gui et al. A fast caption detection method for low quality video images
CN110321887A (zh) 文档图像处理方法、文档图像处理装置及存储介质
Guo et al. A method of effective text extraction for complex video scene
Anoual et al. Features extraction for text detection and localization
CN107798355A (zh) 一种基于文档图像版式自动分析与判断的方法
Liu et al. Detection and segmentation text from natural scene images based on graph model
Kumar et al. An efficient algorithm for text localization and extraction in complex video text images
Wang et al. A survey on video caption extraction technology
CN112633289A (zh) 一种粘连字符分割方法和***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant