CN106157281B - 一种图像主体识别方法及装置 - Google Patents

一种图像主体识别方法及装置 Download PDF

Info

Publication number
CN106157281B
CN106157281B CN201510147814.2A CN201510147814A CN106157281B CN 106157281 B CN106157281 B CN 106157281B CN 201510147814 A CN201510147814 A CN 201510147814A CN 106157281 B CN106157281 B CN 106157281B
Authority
CN
China
Prior art keywords
image
processed
main body
subject
ratio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510147814.2A
Other languages
English (en)
Other versions
CN106157281A (zh
Inventor
石克阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510147814.2A priority Critical patent/CN106157281B/zh
Publication of CN106157281A publication Critical patent/CN106157281A/zh
Application granted granted Critical
Publication of CN106157281B publication Critical patent/CN106157281B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本申请提供一种图像主体识别方法和装置。所述方法可以包括:计算待处理图像中每个主体的区域面积与所述待处理图像的面积的比值;计算所述主体距离所述待处理图像中心位置的趋中值;根据所述比值和趋中值计算所述主体在所述待处理图像中所占的权重值;基于所述主体的权重值确定所述待处理图像的第一主体。利用本申请中各个实施例,可以识别出包括多个主体的图像主要的主体信息,可以提高图像中主体检测、提取的准确性和数据处理效率。

Description

一种图像主体识别方法及装置
技术领域
本申请属于计算机信息处理领域,尤其涉及一种图像主体识别方法及装置。
背景技术
随着互联网消费时代的发展,例如一淘、淘宝以及天猫商城等提供在线商品搜索和在线购物的网站中通常会展示出大量商品的图像信息,以便于消费者进行直观的选择。商品图像信息在线搜索和购物的网站中承载较多且非常重要的信息,对于商品成交有着极大的影响。
在网上商品信息展示中,通常商品图像可以较好的体现商品的直观特性。商品中的主体区域(或者称为前景区域,比如风衣、休闲裤、皮鞋、眼睛、箱包等)通常为商品图像中信息量最大、最主要的部分。用户或商家等在商品展示、广告位投放广告、图片搜索等图像信息处理时,常常需要对图像信息的主体区域进行提取、检测,判断商品主体是否居中、主体区域相对于背景是否突出、是否包含违禁信息等,以便用户或商家调整商品的展示角度、背景搭配、摆放位置、主体商品大小等,使其具有最佳展示效果。在实际应用中,卖家用户,尤其是卖家用户,为了在一个展示位中尽量多的呈现商品的信息或者促销的信息,常常会将多个商品的图片拼接在一张图像中,或者图像拍摄本身就包括多个主图。常见的例如两件同样大小的同款式衣服并排显示,或者两个不同大小的模特图并排一起显示等。这样包括多个商品主体的图像无疑给图像主体提取方法提出了更高的要求。与此同时,在一些应用场景中还常常需要对图像中的多个主体区域进行甄别,判断哪一个为最有效或者最主要表达的主体。例如在对包括多个主体的商品图像进行信息检索时,可以选择仅对图像中有效性最高的主体进行搜索判断,可以不再对每个商品图像中的所有区域进行检索。
而现有技术中对包括多个主体的图像信息进行识别时常常是将图像中的多个主体分别提取后,采用人工主观判断的方式识别出图像中最重要的主体。显然,这种识别方法降低了图像主体识别、提取等处理效率。同时由于主观因素的影响,还存在图像主体识别、提取准确性波动性较大、准确性低等问题。现有技术中还亟需一种评价图像中的多个主体在图像重要性的方法,可以识别确定图像中最主要的主体信息。
发明内容
本申请目的在于提供一种图像主体识别方法及装置,可以计算图像中的多个主体的有效性,可以根据所述主体的有效性确定图像中最主要的主体,可以提高图像主体识别、提取的准确性和处理效率。
本申请提供的一种图像主体识别方法及装置是这样实现的:
一种图像主体识别方法,所述方法包括:
计算待处理图像中每个主体的区域面积与所述待处理图像的面积的比值;
计算所述主体距离所述待处理图像中心位置的趋中值;
根据所述比值和趋中值计算所述主体在所述待处理图像中所占的权重值;
基于所述主体的权重值确定所述待处理图像的第一主体。
一种图像主体识别装置,所述装置包括:
面积比值计算模块,用于计算待处理图像中每个主体的区域面积与所述待处理图像的面积的比值;
趋中值计算模块,用于计算所述主体距离所述待处理图像中心位置的趋中值;
权重计算模块,用于根据所述比值和趋中值计算所述主体在所述待处理图像中所占的权重值;
主体识别模块,用于基于所述主体的权重值确定所述待处理图像的第一主体。
本申请提供的一种图像主体识别方法及装置,可以以待处理图像中每个主体的面积与所述待处理图像面积的比值作为衡量主体在所述待处理图像中权重值的方式。这样以所述主体占待处理图像中的面积比值作为主体权重值的识别方式之一,可以更准确、有效的评价待处理图像的主体的重要性,识别出待处理图像中重要的主体。进一步的,本申请基于重要的主体靠近图像中心的方法计算图像中各个主体的趋中性,将所述主体的趋中性同样作为衡量所述主体权重值的方式。然后本申请基于所述主体在所述待处理图像中的面积比值和趋中性计算得到不同主体的权重值,可以根据所述图像中不同主体的权重值确定所述待处理图像的第一主体。通过本申请方法及装置可以更加准、有效确定出图像中的第一主体(可以视为待处理图像中最重要或者主要表达的主体),可以提高图像主体识别、提取的准确性和处理效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本邻域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一种图像主体识别方法一种实施例的流程示意图;
图2是本申请一种图像主体识别方法另一种实施例的流程示意图;
图3是本申请所述一种图像主体识别装置一种实施例的模块结构示意图;
图4是本申请所述一种图像主体识别装置另一种实施例的模块结构示意图;
图5是本申请所述面积比值计算模块101的一种实施例的模块结构示意图;
图6是本申请所述趋中值计算模块102的一种实施例的模块结构示意图;
图7是本申请所述一种图像主体识别装置另一种实施例的模块结构示意图。
具体实施方式
为了使本技术邻域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本邻域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本申请着眼于解决网站中包含有多个主体区域的商品图片主体提取问题。事实上,不仅限于所述商品图片,在其他的图像处理应用领域中,包含有多个主体区域的图像是大量存在的,存在形式也是多种多样的,比如拼接,或拍摄本身就是多个主体等。本申请提供的图像主体方法及装置可以适用于多种图像处理应用场景中,可以更加有效、准确的识别出图像中最主要的主体。
下面结合附图对本申请所述的图主体识别方法进行详细的说明。图1是本申请所述一种图像主体识别方法一种实施例的方法流程图。虽然本申请提供了如下述实施例或流程图所述的方法操作步骤,但基于常规或者无需创造性的劳动在所述方法中可以包括更多或者更少的操作步骤。在逻辑性上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本申请实施例提供的执行顺序。所述的方法的在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
具体的本申请提供的一种图像主体识别方法的一种实施例如图1所示,所述方法可以包括:
S1:计算待处理图像中每个主体的区域面积与所述待处理图像的面积的比值。
本实施例中所述的图像主体识别方法在识别待处理图像中最主要的主体之前,可以先通过多种方式获取所述待处理图像中的多个主体信息。具体的获取所述待处理图像中多个主体的方法可以包括但不限于利用快速图像分割Felzenszwalb算法对待处理图像进行分割、提取获取主体的方法。本申请实施例可以提供一种获取所述待处理图像中主体的方法。具体的可以基于专利号为CN102567952A,发明名称为《一种图像分割方法及***》中所述的图像分割方法将所述待处理图像分割成若干个子图。通过上述所述方法分割成的每个子图中可以近包括一个主体。当然,一般的,所述待处理图像中如果包括N个主体,通过上述方法可以输出N个包括单个主体的子图。
在上述获取包括单个主体的子图后,可以提取所述子图中的主体。本实施例提供一种利用专利号为CN103578098A,发明名称为《在商品图片中提取商品主体的方法和装置》中所述的方法提取分割所述待处理图像后每个子图中的主体。然后可以获取所述待处理图像中所有的主体信息。综上所述,所述的一种图像主体识别方法中,在对所述待处理图像进行主体识别之前还可以包括:
S0:将待处理图像分割成N个子图,所述每个子图包括所述待处理图像中的一个主体。
相应的,所述计算待处理图像中每个主体的区域面积与所述待处理图像的面积的比值和所述主体距离所述待处理图像中心位置的趋中值可以包括所述计算待处理图像的每个子图中主体的区域面积与所述待处理图像的面积的比值和所述子图中的主体距离所述待处理图像中心位置的趋中值。上述中的N取值可以为N≥1。
需要说明的是,上述所述的图像分割、主体提取的方法可以包括但不限于本申请中所述基于专利号为CN102567952A、CN103578098A中所述的方法。上述所述的处理方法中的任意一项可以被其他可以实现相同或效果的方法代替,本申请获取待处理图像中主体信息的方法并不局限于本申请中实施例中所提及的方法。
上述所述包括对待处理图像的分割及子图中主体提取的实施例,在识别图像主体时可以有效避免主体之间的信息对最终结果的干扰,并且数据处理的结果也更能符合预期。现在的主体提取算法通常是基于颜色、梯度等特征进行全图计算,然后提取出对比度高、出现频次较低的区域作为主体区域。现有技术在处理图片中包含多个模特的时候常常会进行误判或者漏判。例如,如果图片中包含了两个模特,那么现有技术提取的结果往往是仅包含一个模特,或者是提取的是两个模特之间的区域。本方法在处理这类型图片提取的时候可以预先将图片划分为了多个子图,每个子图包含了一个主体区域。这样可以在面对多个主体区域的图片时,有效的将每一个主体区域都提取出来。最后的输出可以是将多个提取出来的主体按照原来的位置摆放在一起进行输出。
当然,本申请的其他实施例中,也可以不将所述待处理图像进行分割。利用目前其它或者未来更好的技术方法可以直接检索、获取到所述待处理图像中各个主体的信息。本申请所述的图像主体识别方法对于上述两种可以确定图像中各个主体的放手均可适用。
本实施例可以假设所述待处理图像中一共包括N个主体,N≥1,每个主体可以分别用O1、O2,…,ON表示。可以计算得出所述待处理图像中每个主体的区域面积与所述待处理图像的面积的比值。
在一种实施方式中,由于图像是有多个像素点组成,所述图像的区域面积可以等价与其中所包括的像素点的个数。因此,所述计算待处理图像中每个主体的区域面积与所述待处理图像的面积的比值具体的可以包括:
计算待处理图像中每个主体所包括像素点的个数与所述待处理图像的总像素点个数的比值。
具体的可以采用下式计算所述比值:
K(Oi)=Area(Oi)/(H*W)
上式中,K(Oi)可以表示为所述待处理图像中第i个主体Oi的区域面积与所述待处理图像的面积的比值,Area(Oi)可以表示为第i个主体Oi中像素点的个数。H可以表示为所述待处理图像的纵向(高度)所包括的像素点个数,W可以表示为所述待处理图像的横向(宽度)所述包括像素点的个数。
计算得出所述待处理图像中每个主体的区域面积与所述待处理图像的面积的比值K(Oi)。
S2:计算所述主体距离所述待处理图像中心位置的趋中值。
通常,用户或者卖家上传的图片中会相对将最重要的或者主要体现的主体信息放置在靠近图片中心位置的区域。本实施例中,可以基于所述主体距离所述待处理图像中心位置的距离表示所述主体靠近所述中心位置的趋中。本实施例中可以将所述主体距离所述待处理图像中心位置的距离表示为趋中值。所述趋中值的值越小,可以表示主体越靠近待处理图像的中心位置,则所述主体属于所述待处理图像最主要突出的主体的可能性越大;相应的,所述趋中值越大,可以表示主体越偏离所述待处理图像的中心位置,则所述主体属于所述待处理图像最主要突出的主体的可能性越小。
本实施例提供一种计算所述主体趋中值的方法。具体的,所述计算所述主体距离所述待处理图像中心位置的趋中值可以包括:
S101:计算主体中所有像素点与所述待处理图像的中心像素点的欧式距离之和;
S102:计算所述待处理图像中所有像素点与所述待处理图像的中心像素点的总欧式距离之和;
S103:将所述主体的欧式距离之和与所述待处理图像的总欧式距离之和的比值作为所述主体的趋中值。
具体的,可以采用下式计算所述待处理图像中每个主体Oi的趋中值V(Oi):
Figure GDA0003204061700000061
上式中,q可以表示为所述待处理图像中主体Oi中的像素点,q可以表示为所述待处理图像中所包括的像素点。Pos(q)和Pos(p)可以分别表示的为所述q点和p点的坐标。Pos(c)可以表示为所述待处理图像的中心像素点的坐标。所述的Pos(c)取值一般可以为(W/2,H/2)。∑q||Pos(q),Pos(c)||可以表示为主体中所有像素点与所述待处理图像的中心像素点的欧式距离之和,∑p||Pos(p),Pos(c)||可以表示为所述待处理图像中所有像素点与所述待处理图像的中心像素点的总欧式距离之和。
通过上述方法,可以计算的得到所述主体距离所述待处理图像中心位置的趋中值。
S3:根据所述比值和趋中值计算所述主体在所述待处理图像中所占的权重值。
在获取所述主体占所述待处理图像的面积的比值和靠近所述待处理图像中心位置的趋中值后,可以根据所述比值和趋中值计算所述主体在所述待处理图像中所占的权重值。在实际的应用中,可以根据设置或者数据计算、处理需求等设置具体的所述根据主体的比值和趋中值计算所述权重值的方法。
本申请中的一种实施例提供的一种计算所述权重值的方法。具体的,本实施中,所述根据所述比值和趋中值计算所述主体在所述待处理图像中所占的权重值可以包括:
将所述主体的比值与所述趋中值的乘积作为所述主体的权重值。
本实施例中所述的权重值计算方法可以设置为将所述主体的比值与趋中值以乘积的方式融合在一起,用来表示所述主体在所述待处理图像中的重要性。具体的可以采用下式公式计算所述权重值P(Oi):
Figure GDA0003204061700000062
当然,本申请所述的一种图像主体识别方法中,所述主体的权重值计算方法并不限于上述所述将所述主体的比值与所述趋中值相乘的方法。采用常规或者无创造性劳动的其他变形、甚至公式重做,例如P(Oi)=K(Oi)+V(Oi),将所述主体的比值与所述趋中值的和作为所述主体的权重值等都应属于本申请的范畴。
在获取图像中主体占所述待处理图像的面积的比值和靠近所述待处理图像中心位置的趋中值后,可以根据所述比值和趋中值计算所述主体在所述待处理图像中所占的权重值。
S4:基于所述主体的权重值确定所述待处理图像的第一主体。
计算得到所述待处理图像中每个主体的权重值后,可以根据所述权重值确定所述待处理图像的第一主体。所述的第一主体可以最大的所述权重值所对应的一个主体或者多个主体。例如在一种应用实施例中,可以对所述计算得出的主体的权重值进行排序,选取所述排序最靠前的一个或者前M个主体为所述待处理图像的第一主体。
当然,在其他的应用场景中,在确定所述主体的权重值后,还可以结合其他因素确定所述待处理图像的第一主体。
利用本申请实施例所述的图像主体识别方法,可以结合图像中各个主体占整个待处理图像的面积比值与靠近待处理图像中心位置的趋中性表示所述待处理图像中不同主体的重要程度。这样,结合实际的用户或卖家制作或者拍摄包括多个主体的图像的应用场景,可以在后期图像主体提取时有效、准确、快速的识别出图像中重要的主体信息,提高图像主体检索、提取的准确性和数据处理效率。
本申请的另一种优选实施例中,还可以为所述主体的比值和权重值设置调谐系数。可以根据所述待处理图像主体的分布特性,在计算所述主体的权重值时调节所述主体的比值和趋中值的权值。例如在处理主***置均匀分散的多主体图像时,可以适当将表示主体占图像面积的比值的调谐系数增大,和/减小主体趋中值的调谐系数,增加面积的权重/减小趋中值的权重。当然,在所述待处理图像中的多个主体面积相近时,可以适当增加主体趋中值的权重。图2是本申请所述的一种图像处理方法另一种实施例中,如图2所示,所述方法还可以包括:
S5:为所述主体的比值设置第一调谐系数;
和/或,
为所述主体的权重值设置第二调谐系数;
根据所述待处理图像中主体的分布特性设置所述第一调谐系数和/或第二调谐系数的值;
相应的,所述根据所述比值和趋中值计算所述主体在所述待处理图像中所占的权重值包括:根据包括所述第一调谐系数和/或所述第二调谐系数调整计算后的比值和趋中值计算所述主体在所述待处理图像中所占的权重值。
具体的,例如可以为所述主体的比值设置第一调谐因子α,或者为所述主体的趋中值设置第二调谐因子β,或者两者均设置。在计算所述主体在所述待处理图像中所占的权重值时可以包括如下公式所示的方式:
P(Oi)=K(Oi)*α+V(Oi)*β
一般的,在不需要进行权值调节的时候,所述第一调谐因子α、第二调谐因子β的取值可以为1。在面对不同的主体分布特性的待处理图像时,可以根据需要进行所述第一调谐因子α、第二调谐因子β的调节。
本是实施例中增加了对所述主体的面积比值和所述表示主体靠近中心位置的趋中值的调谐因子,可以更好的适应具体的、不同待处理图像的应用场景。可以使本申请所述方法使用更加灵活,进而可以提高图像数据处理的准确性。
基于本申请所述的一种图像主体识别方法,本申请提供一种图像主体识别装置。图3是本申请所述图像识别装置一种实施例的模块结构示意图。如图3所示,所述图像识别装置可以包括:
面积比值计算模块101,可以用于计算待处理图像中每个主体的区域面积与所述待处理图像的面积的比值;
趋中值计算模块102,可以用于计算所述主体距离所述待处理图像中心位置的趋中值;
权重计算模块103,可以用于根据所述比值和趋中值计算所述主体在所述待处理图像中所占的权重值;
主体识别模块104,可以用于基于所述主体的权重值确定所述待处理图像的第一主体。
本申请实施例所述的图像主体识别装置,可以分别计算待处理图像中各个主体占整个待处理图像的面积比值和靠近待处理图像中心位置的趋中值。然后可以根据计算得到的主体的所述比值和趋中值计算得出所述主体的权重值,用于表示所述待处理图像中不同主体的重要程度。本申请所述的图像主体识别装置可以在图像主体提取时有效、准确、快速的识别出图像中重要的主体信息,提高图像主体检索、提取的准确性和数据处理效率。
图4是本申请所述图像识别装置另一种实施例的模块结构示意图。如图4所示,所述装置还可以包括:
分割提取模块105,可以用于将待处理图像分割成N个子图,所述每个子图包括所述待处理图像中的一个主体。
相应的,所述面积比值计算模块101计算的待处理图像中每个主体的区域面积与所述待处理图像的面积的比值,和所述趋中值计算模块102计算的所述主体距离所述待处理图像中心位置的趋中值可以包括;所述面积比值计算模块101计算所述待处理图像的每个子图中主体的区域面积与所述待处理图像的面积的比值,和所述趋中值计算模块102计算所述子图中的主体距离所述待处理图像中心位置的趋中值。
图5是本申请所述面积比值计算模块一种实施例的模块结构示意图。如图5所示,本实施例提供的一种所述面积比值计算模块101具体的可以包括:
像素计算模块1011,可以用于计算待处理图像中每个主体所包括像素点的个数和所述待处理图像的总像素点个数;
比值计算模块1012,可以用计算所述每个主体所包括的像素点个数与所述总像素个数的比值。
本实施例中可以将所述比值计算模块1012计算得到的所述比值作为所述主体的比值。
图6是本申请所述趋中值计算模块一种实施例的模块结构示意图。如图6所示,本实施例提供的一种趋中值计算模块102具体的可以包括:
主体距离计算模块1021,可以用于计算主体中所有像素点与所述待处理图像的中心像素点的欧式距离之和;
总距离计算模块1022,可以用于计算所述待处理图像中所有像素点与所述待处理图像的中心像素点的总欧式距离之和;
距离比值模块1023,可以用于计算所述主体的欧式距离之和与所述待处理图像的总欧式距离之和的比值。
可以采用本实施例模块中的方式计算得出所述主体的欧式距离之和与所述待处理图像的总欧式距离之和的比值,并将其作为所述主体的趋中值。
本申请所述的权重计算模块103在另一种实施方式中具体的可以包括下述中的至少一种模块:
积权值模块,可以用于将所述主体的比值与所述趋中值的乘积作为所述主体的权重值;
和权值模块,可以用于将所述主体的比值与所述趋中值的和作为所述主体的权重值。
当然,所述权值计算模块103还可以包括更多或者其他的权值计算模块,所述的权值计算模块中可以设置包括其他计算所述主体的权重值。
图7是本申请所述图像识别装置另一种实施例的模块结构示意图。如图7所示,所述装置还可以包括下述中的至少一种:
第一系数模块1061,可以用于为所述主体的比值设置第一调谐系数;还可以用于根据所述第一协调系数计算所述主体的比值。
第二系数模块1062,可以用于为所述主体的权重值设置第二调谐系数;还用于根据所述第二调谐系数计算所述主体的趋中值。
本实施例中添加了可以调节所述主体占待处理图像面积比值和靠近所述待处理图像中心位置的趋中值在计算所述权重值的权值,可以更加适应多种图像中主体分部的应用场景。
本申请提供的一种图像主体识别方法和装置,可以以待处理图像中每个主体的面积与所述待处理图像面积的比值,和主体靠近图像中心的方法计算图像中各个主体的趋中值,将所述主体的比值和趋中值作为衡量所述主体权重值的方式,可以更加准、有效确定出图像中待处理图像中最重要或者主要表达的主体,可以提高图像主体识别、提取的准确性和处理效率。
尽管本申请内容中提到图像分割算法、基于专利文献的主体提取方法等之类的数据处理描述,但是,本申请并不局限于必须是完全标准或者所提及的方法的数据处理的情况。本申请中各个实施例中所涉及的上述描述仅是本申请中的一些实施例中的应用,在某些标准、方法的基础上略加修改后的处理方法也可以实行上述本申请各实施例的方案。当然,在符合本申请上述各实施例的中所述的处理方法步骤的其他无创造性的变形,仍然可以实现相同的申请,在此不再赘述。
虽然本申请提供了如实施例或流程图所述的方法操作步骤,但基于常规手段或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
上述实施例阐明的单元或模块,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现。
本邻域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施方式的描述可知,本邻域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本申请可用于众多通用或专用的计算机***环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。
虽然通过实施例描绘了本申请,本邻域普通技术人员知道,本申请有许多变形和变化而不脱离本申请的精神,希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。

Claims (10)

1.一种图像主体识别方法,其特征在于,所述方法包括:
将包括N个主体的待处理图像分割成N个子图,所述N个子图中的单个子图包括所述待处理图像中的一个主体,N>1;
计算待处理图像的子图中单个主体的区域面积与所述待处理图像的面积的比值;
计算所述子图中的主体距离所述待处理图像中心位置的趋中值;
根据所述比值和趋中值计算所述主体在所述待处理图像中所占的权重值;
基于所述主体的权重值确定所述待处理图像的第一主体。
2.如权利要求1所述的一种图像主体识别方法,其特征在于,所述计算待处理图像的子图中单个主体的区域面积与所述待处理图像的面积的比值包括:
计算待处理图像的子图中单个主体所包括像素点的个数与所述待处理图像的总像素点个数的比值。
3.如权利要求1所述的一种图像主体识别方法,其特征在于,所述计算所述主体距离所述待处理图像中心位置的趋中值包括:
计算主体中所有像素点与所述待处理图像的中心像素点的欧式距离之和;
计算所述待处理图像中所有像素点与所述待处理图像的中心像素点的总欧式距离之和;
将所述主体的欧式距离之和与所述待处理图像的总欧式距离之和的比值作为所述主体的趋中值。
4.如权利要求1所述的一种图像主体识别方法,其特征在于,所述根据所述比值和趋中值计算所述主体在所述待处理图像中所占的权重值包括下述中的任意一种方式:
将所述主体的比值与所述趋中值的乘积作为所述主体的权重值;
将所述主体的比值与所述趋中值的和作为所述主体的权重值。
5.如权利要求1所述的一种图像主体识别方法,其特征在于,所述方法还包括:
为所述主体的比值设置第一调谐系数;
和/或,
为所述主体的权重值设置第二调谐系数;
根据所述待处理图像中主体的分布特性设置所述第一调谐系数和/或第二调谐系数的值;
相应的,所述根据所述比值和趋中值计算所述主体在所述待处理图像中所占的权重值包括:根据包括所述第一调谐系数和/或所述第二调谐系数调整计算后的比值和趋中值计算所述主体在所述待处理图像中所占的权重值。
6.一种图像主体识别装置,其特征在于,所述装置包括:
分割提取模块,用于将包括N个主体的待处理图像分割成N个子图,所述N个子图中的单个子图包括所述待处理图像中的一个主体,N>1;
面积比值计算模块,用于计算待处理图像的子图中单个主体的区域面积与所述待处理图像的面积的比值;
趋中值计算模块,用于计算所述子图中的主体距离所述待处理图像中心位置的趋中值;
权重计算模块,用于根据所述比值和趋中值计算所述主体在所述待处理图像中所占的权重值;
主体识别模块,用于基于所述主体的权重值确定所述待处理图像的第一主体。
7.如权利要求6所述的一种图像主体识别装置,其特征在于,所述面积比值计算模块包括:
像素计算模块,用于计算待处理图像的子图中单个主体所包括像素点的个数和所述待处理图像的总像素点个数;
比值计算模块,用计算每个主体所包括的像素点个数与所述总像素个数的比值。
8.如权利要求6所述的一种图像主体识别装置,其特征在于,所述趋中值计算模块包括:
主体距离计算模块,用于计算主体中所有像素点与所述待处理图像的中心像素点的欧式距离之和;
总距离计算模块,用于计算所述待处理图像中所有像素点与所述待处理图像的中心像素点的总欧式距离之和;
距离比值模块,用于计算所述主体的欧式距离之和与所述待处理图像的总欧式距离之和的比值。
9.如权利要求6所述的一种图像主体识别装置,其特征在于,所述的权重计算模块包括下述中的至少一种模块:
积权值模块,用于将所述主体的比值与所述趋中值的乘积作为所述主体的权重值;
和权值模块,用于将所述主体的比值与所述趋中值的和作为所述主体的权重值。
10.如权利要求6所述的一种图像主体识别装置,其特征在于,所述装置还包括下述中的至少一种:
第一系数模块,用于为所述主体的比值设置第一调谐系数;还用于根据所述第一调谐系数计算所述主体的比值;
第二系数模块,用于为所述主体的权重值设置第二调谐系数;还用于根据所述第二调谐系数计算所述主体的趋中值。
CN201510147814.2A 2015-03-31 2015-03-31 一种图像主体识别方法及装置 Active CN106157281B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510147814.2A CN106157281B (zh) 2015-03-31 2015-03-31 一种图像主体识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510147814.2A CN106157281B (zh) 2015-03-31 2015-03-31 一种图像主体识别方法及装置

Publications (2)

Publication Number Publication Date
CN106157281A CN106157281A (zh) 2016-11-23
CN106157281B true CN106157281B (zh) 2021-12-03

Family

ID=57337932

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510147814.2A Active CN106157281B (zh) 2015-03-31 2015-03-31 一种图像主体识别方法及装置

Country Status (1)

Country Link
CN (1) CN106157281B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108921157A (zh) * 2018-06-04 2018-11-30 四川斐讯信息技术有限公司 一种图像中感兴趣物体的选择方法及***
CN108986105A (zh) * 2018-06-12 2018-12-11 四川斐讯信息技术有限公司 一种基于内容的图像预处理方法及***
CN109445588A (zh) * 2018-10-23 2019-03-08 北京快乐认知科技有限公司 基于图像识别追踪技术的点读指点件点击判断方法
CN110149482B (zh) * 2019-06-28 2021-02-02 Oppo广东移动通信有限公司 对焦方法、装置、电子设备和计算机可读存储介质
CN110276767B (zh) 2019-06-28 2021-08-31 Oppo广东移动通信有限公司 图像处理方法和装置、电子设备、计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1776745A (zh) * 2004-11-19 2006-05-24 夏普株式会社 图像处理装置、图像扫描仪与图像记录装置
CN101452181A (zh) * 2007-12-03 2009-06-10 鸿富锦精密工业(深圳)有限公司 电子装置的自动对焦***及方法
JP4737073B2 (ja) * 2006-12-22 2011-07-27 パナソニック電工株式会社 人体検出装置
CN102263900A (zh) * 2010-05-26 2011-11-30 佳能株式会社 图像处理设备和图像处理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1776745A (zh) * 2004-11-19 2006-05-24 夏普株式会社 图像处理装置、图像扫描仪与图像记录装置
JP4737073B2 (ja) * 2006-12-22 2011-07-27 パナソニック電工株式会社 人体検出装置
CN101452181A (zh) * 2007-12-03 2009-06-10 鸿富锦精密工业(深圳)有限公司 电子装置的自动对焦***及方法
CN102263900A (zh) * 2010-05-26 2011-11-30 佳能株式会社 图像处理设备和图像处理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于区域的彩色图像检索技术;李晓鹏;《中国优秀硕士学位论文全文数据库 (信息科技辑)》;20110615(第6期);第32-34页 *

Also Published As

Publication number Publication date
CN106157281A (zh) 2016-11-23

Similar Documents

Publication Publication Date Title
CN107358149B (zh) 一种人体姿态检测方法和装置
CN106157281B (zh) 一种图像主体识别方法及装置
CN105938552B (zh) 底图自动更新的人脸识别方法及装置
CN108427927B (zh) 目标再识别方法和装置、电子设备、程序和存储介质
CN108229353B (zh) 人体图像的分类方法和装置、电子设备、存储介质、程序
EP3028184B1 (en) Method and system for searching images
CN108229314B (zh) 目标人物的搜索方法、装置和电子设备
US10409856B2 (en) Approaches for associating terms with image regions
TW201947509A (zh) 理賠業務的資料處理方法、裝置、設備及伺服器
CN106778453B (zh) 人脸图像中检测眼镜佩戴的方法及装置
WO2021051547A1 (zh) 暴力行为检测方法及***
EP2966591B1 (en) Method and apparatus for identifying salient events by analyzing salient video segments identified by sensor information
Liang et al. Video supervoxels using partially absorbing random walks
CN107918767B (zh) 目标检测方法、装置、电子设备及计算机可读介质
CN110348362A (zh) 标签生成、视频处理方法、装置、电子设备及存储介质
Seo et al. Effective and efficient human action recognition using dynamic frame skipping and trajectory rejection
CN108229289B (zh) 目标检索方法、装置和电子设备
CN113469025B (zh) 应用于车路协同的目标检测方法、装置、路侧设备和车辆
CN113496208B (zh) 视频的场景分类方法及装置、存储介质、终端
Xu et al. Hierarchical salient object detection model using contrast-based saliency and color spatial distribution
US9836846B2 (en) System and method of estimating 3D facial geometry
JP2013016171A (ja) 人体動作周期の特定と人体動作の認識の方法、装置、及びプログラム
Singh et al. Learning to Predict Video Saliency using Temporal Superpixels.
Liu et al. HVS-based perception-driven no-reference omnidirectional image quality assessment
JP2013016170A (ja) 人体動作の認識の方法、装置、及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1229938

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant