CN106682581B - 一种箱包识别方法以及设备 - Google Patents

一种箱包识别方法以及设备 Download PDF

Info

Publication number
CN106682581B
CN106682581B CN201611081654.7A CN201611081654A CN106682581B CN 106682581 B CN106682581 B CN 106682581B CN 201611081654 A CN201611081654 A CN 201611081654A CN 106682581 B CN106682581 B CN 106682581B
Authority
CN
China
Prior art keywords
luggage
area
region
type
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611081654.7A
Other languages
English (en)
Other versions
CN106682581A (zh
Inventor
苏志杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Yu Vision Mdt Infotech Ltd
Original Assignee
Zhejiang Uniview Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Uniview Technologies Co Ltd filed Critical Zhejiang Uniview Technologies Co Ltd
Priority to CN201611081654.7A priority Critical patent/CN106682581B/zh
Publication of CN106682581A publication Critical patent/CN106682581A/zh
Application granted granted Critical
Publication of CN106682581B publication Critical patent/CN106682581B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • G06V20/47Detecting features for summarising video content

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种箱包识别方法,通过预设的箱包识别模型获取待检测图像的特征区域,以及特征区域的本体特征,特征区域的类型包括人体区域以及箱包区域;根据预设的条件随机场概率模型的第一层对箱包区域的本体特征以及箱包区域与人体区域之间的位置关系进行一次分析,并根据一次分析的结果确定箱包区域所属的箱包类型。由于在一次分析中结合分析了箱包区域的本体特征以及箱包区域与人体区域之间的位置关系,使得分析的因素更加地全面,从而提高了箱包预测的结果。同时,本发明还公开了一种箱包识别设备。

Description

一种箱包识别方法以及设备
技术领域
本发明涉及通信技术领域,特别涉及一种箱包识别的方法,同时本申请还特别涉及一种箱包识别的设备。
背景技术
行人识别是智能交通***和智能监控***的重要组成部分,箱包识别则是行人识别的一个子课题,可以为行人识别提供更加丰富的特征,提高识别的准确性,是行人识别非常重要的补充。
当前箱包识别的方法很多,主流是基于深度学习的方案。最典型的有基于fasterrcnn的箱包识别技术。但考虑到箱包识别的影响因素太多,包括常见的光照,旋转,遮挡,缩放等因素,还有箱包不同的款式,不同的携带方式以及不同的环境背景都会明显影响箱包识别的准确性。因此,使用深度学习想要完全学习这些变量需要数量极大的样本。然而,检测样本并不容易制作,若要制造数量巨大的样本,需要耗费大量的人力物力。
申请人在实现本申请的过程中,发现现有技术中,至少存在以下问题:
现有技术中的箱包识别方案,均是采用识别通用目标(各类型的物体均适用的目标)的识别模型的识别方案,并没有考虑箱包在图像中的相对位置特征,特别是箱包与行人的位置特征,从而使得箱包识别的准确率不高。
可见,如何在现有箱包识别技术的基础上,结合箱包在图像中的相对位置特征,来对图像中的箱包区域进行识别,进而提高箱包识别的准确性,成为本领域技术人员亟待解决的技术问题。
发明内容
本发明提供了一种箱包识别方法,用以在现有箱包识别技术的基础上,结合箱包在图像中的相对位置特征,来对图像中的箱包区域进行识别,进而提高箱包识别的准确性。
本发明提出了一种箱包识别的方法,其特征在于,所述方法至少包括:
通过预设的箱包识别模型获取待检测图像的特征区域,以及所述特征区域的本体特征,所述特征区域的类型包括人体区域以及箱包区域;
根据预设的条件随机场概率模型的第一层对所述箱包区域的本体特征以及所述箱包区域与所述人体区域之间的位置关系进行一次分析,并根据所述一次分析的结果确定所述箱包区域所属的箱包类型。
优选地,所述方法还包括:
若根据所述一次分析的结果确定所述待检测图像中存在多个所述箱包区域,则根据所述条件随机场概率模型的第二层对所述箱包区域的本体特征、所述箱包区域与所述人体区域之间的位置关系、以及所述箱包区域与其他箱包区域之间的位置关系进行二次分析,并根据所述二次分析的结果确定所述箱包区域所属的箱包类型。
优选地,所述方法还包括:
通过难例样本对所述条件随机场概率模型进行训练,所述难例样本是通过对所述训练模型识别错误的样本进行纠正后获取的。
优选地,所述条件随机场概率模型如下:
Figure BDA0001167085060000021
其中,p(y|x,θ)为箱包区域为指定箱包类型的概率,Z(x)为箱包区域的归一化因子,exp{φ(y,x;θ)}为箱包区域属于指定箱包类型的势能函数,y为所述指定箱包类型,x为所述箱包区域的输入特征,θ为预设的参数,所述箱包区域的输入特征包含所述箱包区域的本体特征以及所述箱包区域与所述人体区域的位置关系特征。
优选地,所述条件随机场概率模型中的
Figure BDA0001167085060000031
其中,y为所述指定箱包类型,x为所述箱包区域的输入特征,θ为预设的参数,θ(yv)为特征参数,λi,j为转移函数的权值,
Figure BDA0001167085060000032
为距离惩罚系数,θ(xi,xj,xhead,yi,yj)为转移函数,v为箱包区域v,V为所述待检测图片中所有箱包区域组成的集合,i为特征区域i,j为特征区域j,E为待检测图片中所有特征区域两两连接组成的集合,xv为箱包区域v的输入特征,xi为特征区域i的输入特征,xj为特征区域j的输入特征,xhead为特征区域head的输入特征yv为箱包区域v的箱包类型,yi为特征区域i的属性类型,yj为特征区域j的属性类型,d为特征区域i与特征区域j之间的距离。
相应的,本发明还提出了一种箱包识别的设备,其特征在于,所述设备至少包括:
获取模块,用于通过预设的箱包识别模型获取待检测图像的特征区域,以及所述特征区域的本体特征,所述特征区域的类型包括人体区域以及箱包区域;
第一分析模块,用于根据预设的条件随机场概率模型的第一层对所述箱包区域的本体特征以及所述箱包区域与所述人体区域之间的位置关系进行一次分析,并根据所述一次分析的结果确定所述箱包区域所属的箱包类型。
优选地,所述设备还包括:
第二分析模块,用于在根据所述一次分析的结果确定所述待检测图像中存在多个所述箱包区域时,根据所述条件随机场概率模型的第二层对所述箱包区域的本体特征、所述箱包区域与所述人体区域之间的位置关系、以及所述箱包区域与其他箱包区域之间的位置关系进行二次分析,并根据所述二次分析的结果确定所述箱包区域所属的箱包类型。
优选地,所述设备还包括:
训练模块,用于通过难例样本对所述条件随机场概率模型进行训练,所述难例样本是通过对所述训练模型识别错误的样本进行纠正后获取的。
优选地,所述条件随机场概率模型如下:
Figure BDA0001167085060000041
其中,p(y|x,θ)为箱包区域为指定箱包类型的概率,Z(x)为箱包区域的归一化因子,exp{φ(y,x;θ)}为箱包区域属于指定箱包类型的势能函数,y为所述指定箱包类型,x为所述箱包区域的输入特征,θ为预设的参数,所述箱包区域的输入特征包含所述箱包区域的本体特征以及所述箱包区域与所述人体区域的位置关系特征。
优选地,所述条件随机场概率模型中的
Figure BDA0001167085060000042
其中,y为所述指定箱包类型,x为所述箱包区域的输入特征,θ为预设的参数,θ(yv)为特征参数,λi,j为转移函数的权值,
Figure BDA0001167085060000043
为距离惩罚系数,θ(xi,xj,xhead,yi,yj)为转移函数,v为箱包区域v,V为所述待检测图片中所有箱包区域组成的集合,i为特征区域i,j为特征区域j,E为待检测图片中所有特征区域两两连接组成的集合,xv为箱包区域v的输入特征,xi为特征区域i的输入特征,xj为特征区域j的输入特征,xhead为特征区域head的输入特征yv为箱包区域v的箱包类型,yi为特征区域i的属性类型,yj为特征区域j的属性类型,d为特征区域i与特征区域j之间的距离。
通过应用本发明提出的技术方案,通过预设的箱包识别模型获取待检测图像的特征区域,以及特征区域的本体特征,特征区域的类型包括人体区域以及箱包区域;根据预设的条件随机场概率模型的第一层对箱包区域的本体特征以及箱包区域与人体区域之间的位置关系进行一次分析,并根据一次分析的结果确定箱包区域所属的箱包类型。由于在一次分析中结合分析了箱包区域的本体特征以及箱包区域与人体区域之间的位置关系,使得分析的因素更加地全面,从而提高了箱包预测的结果。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通的技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提出的一种箱包识别方法的流程示意图;
图2为本申请具体实施例提出的一种经过归一化处理后的图片的示意图;
图3为本申请具体实施例提出的对样本图片进行区域划分的示意图;
图4为本申请具体实施例提出的一种误检图片的示意图;
图5为本申请具体实施例提出的一种特征区域之间的距离d的计算方法的示意图;
图6为本申请具体实施例提出的一种箱包识别方法的流程示意图;
图7为本申请具体实施例中提出一种箱包识别设备的结构示意图。
具体实施方式
如背景技术所述,现有的箱包识别技术,一般采用通用目标的识别模型来对图片中的箱包区域进行识别,由于通用目标的识别模型一般是通过检测图片中待测箱包区域的本体特征来对箱包所属的属性类型进行预测。然而箱包在图片中的位置关系,特别是与图片中人体的位置关系也对箱包所属的属性类型有影响,例如,拉杆箱和手提包的上边缘部分一般和手臂相连,背包的上边缘部分一般靠近头部和两肩。可见,能够通过箱包在检测图片中的位置关系对箱包所属的属性类型进行进一步地验证。
因此,本申请提出一种箱包识别方法,用以在现有箱包识别技术的基础上,结合箱包在图像中的相对位置特征,来对图像中的箱包区域进行识别,进而提高箱包识别的准确性。首先,通过预设的训练模型获取待检测图像的特征区域,以及特征区域的本体特征。其中特征区域的类型包括人体区域以及箱包区域。然后根据预设的条件随机场概率模型的第一层对箱包区域的本体特征以及箱包区域与人体区域之间的位置关系进行一次分析,并根据一次分析结果确定箱包区域所属的箱包类型。由于在一次分析中结合分析了箱包区域的本体特征以及箱包区域与人体区域之间的位置关系,使得分析的因素更加地全面,从而提高了箱包预测的结果。
如图1所示为本申请提出的一种箱包识别方法的流程示意图,需要说明的是本申请应用于对图片中的箱包区域进行预测,在执行本申请的步骤之前,需要对待预测的图片进行行人图片归一化处理。具体地,本申请至少包括以下的步骤:
S101,通过预设的箱包识别模型获取待检测图像的特征区域,以及所述特征区域的本体特征。其中,特征区域的类型包括人体区域以及箱包区域。
在本申请的实施例中,在对待检测图像进行行人图片归一化之后,首先通过预设的训练模型在待检测图像中获取特征区域,特征区域的类型包括人体区域以及箱包区域。
其中,预设的训练模型可以是faster rcnn箱包识别模型,或者ssd箱包识别模型。通过以上的两种箱包识别模型能够在待检测图像中获取特征区域(人体区域和箱包区域),在待检测图像中获取特征区域。
需要说明的是采用faster rcnn箱包识别模型,或者ssd箱包识别模型来在待检测图像中获取特征区域在待检测图像中获取特征区域的本体特征,只是本申请提出的一种优选的方案,基于本申请的核心思想,本领域技术人员还可以采用其他特征区域以及特征区域的本体特征的获取方法,这并不会影响本申请的保护范围。
上述提到的人体区域以及箱包区域是本申请中预设的箱包识别模型的初步识别结果,在本申请的实施例中,还需要对上述的识别结果进行进一步地验证。
特征区域的本体特征是指本申请中预设的箱包识别模型提取到的特征区域的标识特征,其代表了特征区域本身具备的特征,而不包括特征区域的位置特征。如果采用faster rcnn作为预设的箱包识别模型,则特征区域的标识特征具体可以为一个多维向量(维数可以具体为4096维)。
特征区域的本体特征代表了特征区域本身的特征,作为本申请的条件随机场概率模型的一部分输入特征使用。并且,在本申请的优选实施例中,需要对标识特征(具体为一多维向量)进行降维处理之后,再将其作为本申请的条件随机场概率模型的部分输入特征。
通过以上的步骤S101,能够对待检测图像进行特征区域的提取,并且获取特征区域的本体特征。在本申请的实施例中,正是通过对特征区域中的箱包区域进行进一步地进行合理性验证,从而增加了对箱包区域识别的准确性。具体的,以下对具体的合理性验证过程进行详细的阐述。
S102,根据预设的条件随机场概率模型的第一层对箱包区域的本体特征以及箱包区域与人体区域之间的位置关系进行一次分析,并根据一次分析结果确定箱包区域所属的箱包类型。
在本申请的实施例中,在获取了待检测图像的特征区域以及特征区域的本体特征之后,根据预设的条件随机场概率模型的第一层对箱包区域的本体特征以及箱包区域与人体区域之间的位置关系进行一次分析,并根据一次分析结果确定箱包区域所属的箱包类型。
待检测图像中箱包区域所属的箱包类型除了与箱包区域的本体特征相关之外,还与箱包区域在图片中所处的位置有关,特别是箱包区域与人体区域之间的位置关系显得尤为重要。举例而言,拉杆箱和手提包的上边缘部分一般和手臂相连,背包的上边缘部分一般靠近头部和两肩。可见,箱包区域与人体区域之间的位置关系对箱包所属类型的能够提供重要的参考。因此,在本申请的实施例中,将箱包区域与人体区域之间的位置关系作为条件随机场概率模型的一个重要的输入特征使用,从而使得对箱包区域所属类型的预测更加地准确。
在本申请的优选实施例中,若根据一次分析的结果确定待检测图像中存在多个箱包区域,则根据条件随机场概率模型的第二层对箱包区域的本体特征、箱包区域与人体区域之间的位置关系、以及箱包区域与其他箱包区域之间的位置关系进行二次分析,并根据二次分析的结果确定箱包区域所属的箱包类型。
如果根据一次分析的结果确定待检测图像中存在多个箱包区域,则需要进一步地判断各箱包区域之间的位置关系是否合理,也即进一步地考虑箱包区域之间的相互影响。因此,在本申请的优选实施例中,如果根据一次分析的结果确定待检测图像中存在多个箱包区域,则根据条件随机场概率模型的第二层对箱包区域的本体特征、箱包区域与人体区域之间的位置关系、以及箱包区域与其他箱包区域之间的位置关系进行二次分析,并根据二次分析的结果确定箱包区域所属的箱包类型。由于综合的考虑了上述的三种因素,从而使得对箱包区域所属类型的预测更加地准确。
在本申请的优选实施例中,通过难例样本对条件随机场概率模型进行训练。其中,难例样本是通过对预设的箱包识别模型识别错误的样本进行纠正后获取的。
在使用条件随机场概率模型进行箱包识别之前,首先需要对条件随机场概率模型进行训练,在本申请的优选实施例中,除了采用普通的样本来对条件随机场概率模型进行训练之外,还采用难例样本来对条件随机场概率模型进行训练。其中,难例样本是通过对预设的箱包识别模型识别错误的样本进行纠正后获取的。
并且,由于难例样本的数量有限,因此可以通过PCA降维重构技术对难例样本进行扩充,扩充至原来的3~5倍。
通过以上还采用难例样本来对条件随机场概率模型进行训练,能够使得条件随机场概率模型中待训练参数更加地准确,从而条件随机场概率模型对箱包区域的识别更加地准确。
在本申请的优选实施例中,条件随机场概率模型具体如下:
Figure BDA0001167085060000091
其中,p(y|x,θ)为箱包区域为指定箱包类型的概率,Z(x)为箱包区域的归一化因子,exp{φ(y,x;θ)}为箱包区域属于指定箱包类型的势能函数,y为指定箱包类型,x为箱包区域的输入特征,θ为预设的参数(通对条件随机场概率模型进行训练后得到)。
其中,箱包区域的输入特征包含箱包区域的本体特征以及箱包区域与人体区域的位置关系特征。
在本申请的优选实施例中箱包区域的输入特征包含箱包区域的本体特征,结合箱包区域与人体区域的位置关系特征而得到。
在箱包区域的本体特征为多维向量时(具体为4096维),首先需要对本体特征进行降维处理,再结合箱包区域4个角点位置相对于头部中间点的相对位移,以及该区域的长度,宽度信息重新构造一个新的多维向量作为箱包区域的输入特征。
在本申请的优选实施例中,条件随机场概率模型中的概率函数中的
Figure BDA0001167085060000092
其中,y为指定箱包类型,x为箱包区域的输入特征,θ为预设的参数,θ(yv)为状态参数,λi,j为转移函数的权值,
Figure BDA0001167085060000101
为距离惩罚系数,θ(xi,xj,xhead,yi,yj)为转移函数,v为箱包区域v,V为待检测图片中所有箱包区域组成的集合,i为特征区域i,j为特征区域j,E为待检测图片中所有特征区域两两连接组成的集合,xv为箱包区域v的输入特征,xi为特征区域i的输入特征,xj为特征区域j的输入特征,xhead为特征区域head的输入特征,yv为箱包区域v的箱包类型,yi为特征区域i的属性类型,yj为特征区域j的属性类型,d为特征区域i与特征区域j之间的距离。
需要说明的是,状态参数θ(yv)对应于输入特征xv,其维度与xv的维度相同,转移函数θ(xi,xj,xhead,yi,yj)对应于xi、xj以及xhead等三个输入特征,其维度为输入特征维度的3倍。
λi,j为转移函数的权值,只与yi,yj有关系,其值的大小可以通过通过对条件随机场概率模型进行训练后得到。
在上式中,
Figure BDA0001167085060000102
为距离惩罚系数,两个区域相隔越远,其权重应该越低,其中d的计算方法如下:
通过观察大量箱包样本,发现箱包区域的上边缘部分特征更加明显和稳定,例如拉杆箱和手提包的上边缘部分一般和手臂相连,背包的上边缘部分一般靠近头部和两肩,但由于箱包大小和位置的不确定,下边缘部分位置特征就不太明显了。因此,在本申请送选取箱包区域上边缘的中心点位置为参考点,其它区域和此中心点的最近距离即为d(d>=0),部分特殊情况下,该点被其它区域所包含,此时d应该是负值,这里我们取d=0。
通过以上实施例的描述可知,通过预设的训练模型获取待检测图像的特征区域,以及特征区域的本体特征。其中特征区域的类型包括人体区域以及箱包区域。然后根据预设的条件随机场概率模型的第一层对箱包区域的本体特征以及箱包区域与人体区域之间的位置关系进行一次分析,并根据一次分析结果确定箱包区域所属的箱包类型。由于在一次分析中结合分析了箱包区域的本体特征以及箱包区域与人体区域之间的位置关系,使得分析的因素更加地全面,从而提高了箱包预测的结果。
为了进一步阐述本发明的技术思想,现结合具体的实施流程,对本发明的技术方案进行说明。
本申请所描述的箱包识别方法由如下步骤组成,入口为智能交通电警或者园区等采集的图片,然后通过行人检测获取行人所在的区域(上下左右适当扩展一部分,确保箱包主要部分被包括在内),通过矩形框截取效果如图2所示,该部分为较成熟技术,在此不予赘述,需要说明,无论训练还是检测,入口图片为行人截取好的区域。优选地,检测和训练的图片均被归一化为400*200大小。
训练过程中对行人的区域分割,一共分为头部,上臂,下臂,腿部和脚部,除了头部之外,其他部分均分为左右,如下图3所示(行人样本获取较为容易,训练难度也低于箱包)。
对于箱包分类,一共分为5类,分别为双肩包,单肩包,手提包,帽子和拉杆箱,其中拉杆箱的框定如上图所示,其它类别均按照上述方式框定,将所有区域标注完成之后,按照特定格式生成训练样本,投入faster rcnn进行训练(总共的类别为箱包5类+人体部位属性9类+背景1类=15类)。
通过faster rcnn对训练图片进行特征获取,训练图片中所有候选框通过roipooling层归一化为相同大小的区域,然后通过全连接层形成4096维向量经过降维作为后续条件随机场的一部分输入特征。
条件随机场的输入训练样本有两个来源,一是上述faster rcnn相同的训练样本;二是faster rcnn检测过程中确认有误的样本,这部分样本经过校正之后,可以作为条件随机场的难例样本输入,校正方法举例:如图4所示,下面这张图片有一张多检(backpack)和一张误检(package),校正过程就将多检的区域直接标识为背景框,将误检的区域标识为对应的类别(bag),需要注意,经过校正之后,下图变为两个bag区域框,这是被条件随机场认为合理的存在关系,主要为了适配faster rcnn的误检率较高的情况。对于条件随机场检测之后输出重复区域的处理,只要这些重复区域属于同一个类别属性,都可以通过nms非极大值抑制算法进行消除。
另外需要说明,鉴于检测样本一般不是很多,这部分难例样本一般需要经过PCA降维重构技术进行扩充,扩充至原来的3~5倍即可,视实际情况而定。
本申请采用的条件随机场概率模型如下:
Figure BDA0001167085060000121
此模型可以对某一个结点计算其属性概率(即任意检测到的箱包区域其属性是否可靠,上式中的y序列只有一个未知),亦可对几个结点的综合概率进行计算(即多个箱包区域相互之间的位置关系是否合理,上式中的y序列有多个未知)。
其中,p(y|x,θ)为箱包区域为指定箱包类型的概率,Z(x)为箱包区域的归一化因子,exp{φ(y,x;θ)}为箱包区域属于指定箱包类型的势能函数,y为指定箱包类型,x为箱包区域的输入特征,θ为预设的参数(通对条件随机场概率模型进行训练后得到)。其中x特征包含前述faster rcnn中全连接层输出的4096维特征向量,经过PCA技术降维而成的500维向量,结合该区域4个角点位置相对于头部中间点的相对位移,以及该区域的长度,宽度信息,共506维向量组成。
上述概率模型中的
Figure BDA0001167085060000122
其中,y为指定箱包类型,x为箱包区域的输入特征,θ为预设的参数,θ(yv)为状态参数,λi,j为转移函数的权值,
Figure BDA0001167085060000131
为距离惩罚系数,θ(xi,xj,xhead,yi,yj)为转移函数,v为箱包区域v,V为待检测图片中所有箱包区域组成的集合,i为特征区域i,j为特征区域j,E为待检测图片中所有特征区域两两连接组成的集合,xv为箱包区域v的输入特征,xi为特征区域i的输入特征,xj为特征区域j的输入特征,xhead为特征区域head的输入特征,yv为箱包区域v的箱包类型,yi为特征区域i的属性类型,yj为特征区域j的属性类型,d为特征区域i与特征区域j之间的距离。
需要说明的是,对于第一层条件随机场,i和j必然一个为箱包区域,另一个为人体属性区域,对于第二层条件随机场,只需要保证其中一个为箱包区域,然后遍历所有可能组合即可。
上述提到的λi,j是转移函数的权值,只和yi,yj有关,
Figure BDA0001167085060000132
是距离惩罚系数,两个区域相隔越远,其权重应该越低,其中d的计算方法如下。
d的计算方法:通过观察大量箱包样本,发现箱包区域的上边缘部分特征更加明显和稳定,例如拉杆箱和手提包的上边缘部分一般和手臂相连,背包的上边缘部分一般靠近头部和两肩,但由于箱包大小和位置的不确定,下边缘部分位置特征就不太明显了。因此,如图5所示,在本申请送选取箱包区域上边缘的中心点位置为参考点,其它区域和此中心点的最近距离即为d(d>=0)。部分特殊情况下,该点被其它区域所包含,此时d应该是负值,这里我们取d=0。
上述概率模型中的
Figure BDA0001167085060000133
其中y’代表箱包区域所有可能属于的箱包类型。
在本申请中,采用两层的条件随机场来对箱包区域进行预测,取两层条件随机场的原因是faster rcnn对人体属性的预测可靠度明显高于对箱包属性的预测,如果一开始就将人体属性和所有箱包属性放在一起进行预测,会由于faster rcnn错误的箱包预测影响了条件随机场的判断,所以第一层的条件随机场的预测是基于所有检测出来的人体属性区域和单一的箱包属性区域,分别确认各个箱包区域的置信度,对其中的误检和多检进行纠正。第二层的条件随机场则是对所有箱包区域进行综合判断,即考虑箱包区域之间的相互影响,尤其是箱包重叠情况,通过第二层的条件随机场可以有效纠正。如果一幅图片检测出来只有一个箱包属性区域,则无需进行第二层的判断。
如图6所示,为本申请具体实施例的箱包识别的流程示意图,由图可知包括以下的步骤:
S601,接收检测图片。
S602,对检测图片进行行人图片归一化处理。
S603,获取检测结果和roi特征。
通过Faster rcnn训练模型获取检测图像的特征区域,以及特征区域的本体特征。
S604,特征PCA降维。
对特征区域的本体特征进行特征PCA降维处理。
S605,条件随机场第一层判别。
S606,是否只有一个箱包结点,若是,则执行S607;若否,则执行S608。
S607,输出结果。
S608,条件随机场第二层判别。
S609,输出结果。
通过以上的流程描述可知,通过预设的箱包识别模型获取待检测图像的特征区域,以及特征区域的本体特征,特征区域的类型包括人体区域以及箱包区域;根据预设的条件随机场概率模型的第一层对箱包区域的本体特征以及箱包区域与人体区域之间的位置关系进行一次分析,并根据一次分析的结果确定箱包区域所属的箱包类型。由于在一次分析中结合分析了箱包区域的本体特征以及箱包区域与人体区域之间的位置关系,使得分析的因素更加地全面,从而提高了箱包预测的结果。
相应的,本发明还提出了一种箱包识别的设备,如图7所示,为本申请具体实施例中提出一种箱包识别设备的结构示意图。所述设备至少包括:
获取模块701,用于通过预设的箱包识别模型获取待检测图像的特征区域,以及所述特征区域的本体特征,所述特征区域的类型包括人体区域以及箱包区域;
第一分析模块702,用于根据预设的条件随机场概率模型的第一层对所述箱包区域的本体特征以及所述箱包区域与所述人体区域之间的位置关系进行一次分析,并根据所述一次分析的结果确定所述箱包区域所属的箱包类型。
优选地,所述设备还包括:
第二分析模块,用于在根据所述一次分析的结果确定所述待检测图像中存在多个所述箱包区域时,根据所述条件随机场概率模型的第二层对所述箱包区域的本体特征、所述箱包区域与所述人体区域之间的位置关系、以及所述箱包区域与其他箱包区域之间的位置关系进行二次分析,并根据所述二次分析的结果确定所述箱包区域所属的箱包类型。
优选地,所述设备还包括:
训练模块,用于通过难例样本对所述条件随机场概率模型进行训练,所述难例样本是通过对所述训练模型识别错误的样本进行纠正后获取的。
优选地,所述条件随机场概率模型如下:
Figure BDA0001167085060000151
其中,p(y|x,θ)为箱包区域为指定箱包类型的概率,Z(x)为箱包区域的归一化因子,exp{φ(y,x;θ)}为箱包区域属于指定箱包类型的势能函数,exp{φ(y,x;θ)}为所述箱包区域属于所述指定箱包类型的概率函数,y为所述指定箱包类型,x为所述箱包区域的输入特征,θ为预设的参数,所述箱包区域的输入特征包含所述箱包区域的本体特征以及所述箱包区域与所述人体区域的位置关系特征。
优选地,所述条件随机场概率模型中的
Figure BDA0001167085060000161
其中,y为所述指定箱包类型,x为所述箱包区域的输入特征,θ为预设的参数,θ(yv)为特征参数,λi,j为转移函数的权值,
Figure BDA0001167085060000162
为距离惩罚系数,θ(xi,xj,xhead,yi,yj)为转移函数,v为箱包区域v,V为所述待检测图片中所有箱包区域组成的集合,i为特征区域i,j为特征区域j,E为待检测图片中所有特征区域两两连接组成的集合,xv为箱包区域v的输入特征,xi为特征区域i的输入特征,xj为特征区域j的输入特征,xhead为特征区域head的输入特征yv为箱包区域v的箱包类型,yi为特征区域i的属性类型,yj为特征区域j的属性类型,d为特征区域i与特征区域j之间的距离。
通过以上具体设备的描述可知,通过预设的箱包识别模型获取待检测图像的特征区域,以及特征区域的本体特征,特征区域的类型包括人体区域以及箱包区域;根据预设的条件随机场概率模型的第一层对箱包区域的本体特征以及箱包区域与人体区域之间的位置关系进行一次分析,并根据一次分析的结果确定箱包区域所属的箱包类型。由于在一次分析中结合分析了箱包区域的本体特征以及箱包区域与人体区域之间的位置关系,使得分析的因素更加地全面,从而提高了箱包预测的结果。
最后说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施场景所述的方法。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本发明序号仅仅为了描述,不代表实施场景的优劣。
以上公开的仅为本发明的几个具体实施场景,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (8)

1.一种箱包识别的方法,其特征在于,所述方法至少包括:
通过预设的箱包识别模型获取待检测图像的特征区域,以及所述特征区域的本体特征,所述特征区域的类型包括人体区域以及箱包区域;
根据预设的条件随机场概率模型的第一层对所述箱包区域的本体特征以及所述箱包区域与所述人体区域之间的位置关系进行一次分析,并根据所述一次分析的结果确定所述箱包区域所属的箱包类型;
所述方法还包括:
若根据所述一次分析的结果确定所述待检测图像中存在多个所述箱包区域,则根据所述条件随机场概率模型的第二层对所述箱包区域的本体特征、所述箱包区域与所述人体区域之间的位置关系、以及所述箱包区域与其他箱包区域之间的位置关系进行二次分析,并根据所述二次分析的结果确定所述箱包区域所属的箱包类型。
2.如权利要求 1所述的方法,其特征在于,所述方法还包括:
通过难例样本对所述条件随机场概率模型进行训练,所述难例样本是通过对所述训练模型识别错误的样本进行纠正后获取的。
3.如权利要求1-2任一项所述的方法,其特征在于,所述条件随机场概率模型如下:
Figure FDA0002725893680000011
其中,p(y|x,θ)为箱包区域为指定箱包类型的概率,Z(x)为箱包区域的归一化因子,
Figure FDA0002725893680000012
为箱包区域属于指定箱包类型的势能函数,y为所述指定箱包类型,x为所述箱包区域的输入特征,θ为预设的参数,所述箱包区域的输入特征包含所述箱包区域的本体特征以及所述箱包区域与所述人体区域的位置关系特征。
4.如权利要求3所述的方法,其特征在于,所述条件随机场概率模型中的:
Figure FDA0002725893680000021
其中,y为所述指定箱包类型,x为所述箱包区域的输入特征,θ为预设的参数,θ(yv)为特征参数,λi,j为转移函数的权值,
Figure FDA0002725893680000022
为距离惩罚系数,θ(xi,xj,xhead,yi,yj)为转移函数,v为箱包区域v,V为所述待检测图像中所有箱包区域组成的集合,i为特征区域i,j为特征区域j,E为所述待检测图像中所有特征区域两两连接组成的集合,xv为箱包区域v的输入特征,xi为特征区域i的输入特征,xj为特征区域j的输入特征,xhead为特征区域head的输入特征,yv为箱包区域v的箱包类型,yi为特征区域i的属性类型,yj为特征区域j的属性类型,d为特征区域i与特征区域j之间的距离。
5.一种箱包识别的设备,其特征在于,所述设备至少包括:
获取模块,用于通过预设的箱包识别模型获取待检测图像的特征区域,以及所述特征区域的本体特征,所述特征区域的类型包括人体区域以及箱包区域;
第一分析模块,用于根据预设的条件随机场概率模型的第一层对所述箱包区域的本体特征以及所述箱包区域与所述人体区域之间的位置关系进行一次分析,并根据所述一次分析的结果确定所述箱包区域所属的箱包类型;
所述设备还包括:
第二分析模块,用于在根据所述一次分析的结果确定所述待检测图像中存在多个所述箱包区域时,根据所述条件随机场概率模型的第二层对所述箱包区域的本体特征、所述箱包区域与所述人体区域之间的位置关系、以及所述箱包区域与其他箱包区域之间的位置关系进行二次分析,并根据所述二次分析的结果确定所述箱包区域所属的箱包类型。
6.如权利要求5所述的设备,其特征在于,所述设备还包括:
训练模块,用于通过难例样本对所述条件随机场概率模型进行训练,所述难例样本是通过对所述训练模型识别错误的样本进行纠正后获取的。
7.如权利要求5-6任一项所述的设备,其特征在于,所述条件随机场概率模型如下:
Figure FDA0002725893680000031
其中,p(y|x,θ)为箱包区域为指定箱包类型的概率,Z(x)为箱包区域的归一化因子,
Figure FDA0002725893680000032
为箱包区域属于指定箱包类型的势能函数,y为所述指定箱包类型,x为所述箱包区域的输入特征,θ为预设的参数,所述箱包区域的输入特征包含所述箱包区域的本体特征以及所述箱包区域与所述人体区域的位置关系特征。
8.根据权利要求7所述的设备,其特征在于,所述条件随机场概率模型中的:
Figure FDA0002725893680000033
其中,y为所述指定箱包类型,x为所述箱包区域的输入特征,θ为预设的参数,θ(yv)为特征参数,λi,j为转移函数的权值,
Figure FDA0002725893680000034
为距离惩罚系数,θ(xi,xj,xhead,yi,yj)为转移函数,v为箱包区域v,V为所述待检测图像中所有箱包区域组成的集合,i为特征区域i,j为特征区域j,E为所述待检测图像中所有特征区域两两连接组成的集合,xv为箱包区域v的输入特征,xi为特征区域i的输入特征,xj为特征区域j的输入特征,xhead为特征区域head 的输入特征,yv为箱包区域v的箱包类型,yi为特征区域i的属性类型,yj为特征区域j的属性类型,d为特征区域i与特征区域j之间的距离。
CN201611081654.7A 2016-11-30 2016-11-30 一种箱包识别方法以及设备 Active CN106682581B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611081654.7A CN106682581B (zh) 2016-11-30 2016-11-30 一种箱包识别方法以及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611081654.7A CN106682581B (zh) 2016-11-30 2016-11-30 一种箱包识别方法以及设备

Publications (2)

Publication Number Publication Date
CN106682581A CN106682581A (zh) 2017-05-17
CN106682581B true CN106682581B (zh) 2021-04-20

Family

ID=58866196

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611081654.7A Active CN106682581B (zh) 2016-11-30 2016-11-30 一种箱包识别方法以及设备

Country Status (1)

Country Link
CN (1) CN106682581B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108959197A (zh) * 2018-09-10 2018-12-07 杭州后博科技有限公司 一种箱包被盗概率计算***及方法
CN113743434A (zh) * 2020-05-29 2021-12-03 华为技术有限公司 一种目标检测网络的训练方法、图像增广方法及装置
CN113378752B (zh) * 2021-06-23 2022-09-06 济南博观智能科技有限公司 一种行人背包检测方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2709042A1 (de) * 2012-09-17 2014-03-19 Sihl GmbH Mehrlagiges RFID Schlaufenetikett mit Kaltsiegelklebeschichten
CN104535594A (zh) * 2015-01-08 2015-04-22 安徽中福光电科技有限公司 基于x射线+dr+cbs的箱包安检方法和智能化x光机
CN105469087A (zh) * 2015-07-13 2016-04-06 百度在线网络技术(北京)有限公司 识别服饰图片的方法、服饰图片的标注方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2709042A1 (de) * 2012-09-17 2014-03-19 Sihl GmbH Mehrlagiges RFID Schlaufenetikett mit Kaltsiegelklebeschichten
CN104535594A (zh) * 2015-01-08 2015-04-22 安徽中福光电科技有限公司 基于x射线+dr+cbs的箱包安检方法和智能化x光机
CN105469087A (zh) * 2015-07-13 2016-04-06 百度在线网络技术(北京)有限公司 识别服饰图片的方法、服饰图片的标注方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于条件随机场和空间推理的地理编码方法";周海;《中国优秀硕士学位论文全文数据库 基础科学辑》;20160715;第30、52页 *

Also Published As

Publication number Publication date
CN106682581A (zh) 2017-05-17

Similar Documents

Publication Publication Date Title
Hall et al. Probabilistic object detection: Definition and evaluation
Zhang et al. Supervision by fusion: Towards unsupervised learning of deep salient object detector
CN109697435B (zh) 人流量监测方法、装置、存储介质及设备
US9946952B2 (en) Multi-source, multi-scale counting in dense crowd images
US8131010B2 (en) High density queue estimation and line management
Gupta et al. A novel algorithm for mask detection and recognizing actions of human
Li et al. Coda: Counting objects via scale-aware adversarial density adaption
Tan et al. Image co-saliency detection by propagating superpixel affinities
Lian et al. Weakly supervised road segmentation in high-resolution remote sensing images using point annotations
CN106682581B (zh) 一种箱包识别方法以及设备
CN109033944A (zh) 一种全天空极光图像分类与关键局部结构定位方法及***
CN107944403A (zh) 一种图像中的行人属性检测方法及装置
CN104123714B (zh) 一种人流量统计中最优目标检测尺度的生成方法
CN111091101A (zh) 基于一步法的高精度行人检测方法、***、装置
Yadav et al. An improved deep learning-based optimal object detection system from images
CN112668532A (zh) 基于多阶段混合注意网络的人群计数方法
CN114219803B (zh) 一种三阶段图像质量评估的检测方法与***
CN116030538A (zh) 弱监督动作检测方法、***、设备及存储介质
CN111325265A (zh) 一种针对篡改图像的检测方法及装置
CN114328942A (zh) 关系抽取方法、装置、设备、存储介质和计算机程序产品
Bhat et al. Using uncertainty estimation to reduce false positives in liver lesion detection
Tang et al. Salient object detection via two-stage absorbing Markov chain based on background and foreground
Li et al. Semantic‐Segmentation‐Based Rail Fastener State Recognition Algorithm
Wang et al. Coda: Counting objects via scale-aware adversarial density adaption
CN114494999B (zh) 一种双分支联合型目标密集预测方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20221107

Address after: 15 / F, Zhongchuang Plaza, 385 Hangtian Middle Road, national civil aerospace industrial base, Xi'an City, Shaanxi Province 710100

Patentee after: Xi'an Yu vision Mdt InfoTech Ltd.

Address before: 2 / F, South Block, building 10, wanlun Science Park, 88 Jiangling Road, Binjiang District, Hangzhou City, Zhejiang Province, 310051

Patentee before: ZHEJIANG UNIVIEW TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right