CN117218633A - 一种物品检测方法、装置、设备及存储介质 - Google Patents

一种物品检测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117218633A
CN117218633A CN202310952434.0A CN202310952434A CN117218633A CN 117218633 A CN117218633 A CN 117218633A CN 202310952434 A CN202310952434 A CN 202310952434A CN 117218633 A CN117218633 A CN 117218633A
Authority
CN
China
Prior art keywords
coordinate information
target
image
detected
article
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310952434.0A
Other languages
English (en)
Inventor
张建安
刘微
王昕�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Group Holding Co Ltd
Original Assignee
Hisense Group Holding Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Group Holding Co Ltd filed Critical Hisense Group Holding Co Ltd
Priority to CN202310952434.0A priority Critical patent/CN117218633A/zh
Publication of CN117218633A publication Critical patent/CN117218633A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本申请涉及计算机视觉技术领域,尤其涉及一种物品检测方法、装置、设备及存储介质,用于解决物品检测准确率低下问题,该方法为:将拍摄视野区域内的多个待测物品得到的原始图像输入旋转目标检测模型,得到各待测物品对应的检测区域定位信息,旋转目标检测模型是基于多个样本图像及样本图像内各样本物品的检测区域标注信息,对待训练的旋转目标检测模型进行训练得到的,各样本物品中包括至少一个部分外轮廓位于对应样本图像的拍摄视野区域外的物品;若基于各检测区域定位信息,确定原始图像中存在部分外轮廓位于视野区域外的待测物品,则对原始图像进行像素填充,从得到的目标图像中分割出各待测物品的图像;这样,提高了物品检测准确率。

Description

一种物品检测方法、装置、设备及存储介质
技术领域
本申请涉及计算机视觉技术领域,尤其涉及一种物品检测方法、装置、设备及存储介质。
背景技术
实际场景中,针对特殊场合,如海关安检、进站安检等,常常需要对旅客的随身物品进行安全检查。旋转目标检测模型常常用于上述需要进行安全检查的场景中。基于该旋转目标检测模型,对包含多个物品的图像进行目标检测,从而得到每个物品对应的图像,进而完成对每个物品的分析、识别等。
然而,目前的旋转目标检测模型通常仅能检测出完整显示在图像中的物品。但在实际场景中,往往会因部分物品的摆放等原因,导致被检测的图像中包含未完整显示的物品,这样,在采用目前的旋转目标检测模型进行物品检测时,模型通常不对未完整显示在图像中的物品进行目标检测,从而造成了信息丢失,进而导致实际使用中模型存在着检测准确率低下问题。
发明内容
本申请实施例提供一种物品检测方法、装置、设备及存储介质,用以提高旋转目标检测模型的检测准确率。
本申请实施例提供的具体技术方案如下:
第一方面,本申请实施例提供一种物品检测方法,包括:
拍摄视野区域内的多个待测物品,得到原始图像;
将所述原始图像输入预设的旋转目标检测模型,得到各待测物品对应的检测区域定位信息,其中,所述旋转目标检测模型是基于多个样本图像以及样本图像内各样本物品的检测区域标注信息,对待训练的旋转目标检测模型进行训练得到的,所述各样本物品中包括至少一个部分外轮廓位于对应样本图像的拍摄视野区域外的物品;
若基于所述各待测物品对应的检测区域定位信息,确定所述原始图像中存在部分外轮廓位于所述视野区域外的待测物品,则对所述原始图像进行像素填充,得到目标图像,并从所述目标图像中分割出所述各待测物品的图像。
采用本申请实施例提供的一种物品检测方法,通过对待训练的旋转目标检测模型进行训练,可以使得训练完毕的旋转目标检测模型顺利检测出原始图像中包含的,部分外轮廓位于拍摄视野区域外的待测物品,从而对待测物品对应的原始图像进行像素填充,得到目标图像,这样,便可以采用传统图像分割方式,顺利从目标图像中分割出上述各待测物品的图像,降低了信息丢失概率,提高了模型实际使用中的检测准确率,为后续基于各待测物品的图像进行安全分析、识别等做准备。
在一种可能的实现方式中,任一待测物品的检测区域定位信息包括所述任一待测物品的预测旋转检测框对应的多个坐标信息;
通过如下方式确定所述原始图像中存在部分外轮廓位于所述视野区域外的待测物品:
从所述各待测物品对应的检测区域定位信息中,选取出横坐标最大值和横坐标最小值,以及纵坐标最大值和纵坐标最小值;
若所述横坐标最大值、所述横坐标最小值、所述纵坐标最大值和所述纵坐标最小值中至少一个参考值满足预设条件,则确定所述原始图像中存在部分外轮廓位于所述视野区域外的待测物品,其中,所述预设条件包括:
横坐标最小值小于第一预设值;
横坐标最大值大于所述原始图像的宽度;
纵坐标最小值小于第二预设值;
纵坐标最大值大于所述原始图像的高度。
上述方法,通过设置预设条件,可以基于旋转目标检测模型输出的各待测物品的检测区域定位信息,确定出各待测物品中是否存在部分外轮廓位于视野区域外的待测物品,从而决定下一步计算机视觉处理的流程:直接调用传统图像分割方式从原始图像中分割出各待测物品的图像,还是先对原始图像进行像素填充,得到目标图像,再调用传统图像分割方式从目标图像中分割出各待测物品的图像。
在一种可能的实现方式中,所述对所述原始图像进行像素填充之前,还包括:
基于参考值的属性与填充规则之间的对应关系,确定满足所述预设条件的参考值的属性对应的填充规则;
基于所述参考值和所述填充规则,确定填充区域及填充像素个数;
所述对所述原始图像进行像素填充,得到目标图像,包括:
采用预设像素值,在所述原始图像外的所述填充区域内,填充所述填充像素个数的像素,得到所述目标图像。
上述方法,在确定各待测物品中存在部分外轮廓位于视野区域外的待测物品后,确定具体填充区域及填充像素个数,为后续进行像素填充起到指导作用;然后,采用预设像素值进行填充,以保证后续进行图像分割时,可以从目标图像中顺利分割出部分外轮廓位于视野区域外的待测物品的图像。
在一种可能的实现方式中,所述得到目标图像之后,所述从所述目标图像中分割出所述各待测物品的图像之前,还包括:
针对所述各待测物品中的任一待测物品,基于所述目标图像的预设角的坐标信息,对所述任一待测物品在所述原始图像中的检测区域定位信息进行调整,得到所述任一待测物品在所述目标图像中的目标检测区域定位信息;
所述从所述目标图像中分割出所述各待测物品的图像,包括:
针对所述各待测物品中的任一待测物品,基于所述任一待测物品在所述目标图像中的目标检测区域定位信息,从所述目标图像中分割出所述任一待测物品的图像。
在一种可能的实现方式中,在对所述待训练的旋转目标检测模型进行训练之前,还包括:
确定每个样本物品的检测区域标注信息包括的坐标信息的个数是否大于第一数量,其中,所述第一数量是所述待训练的旋转目标检测模型输出的,针对任一样本物品的检测区域定位信息包括的旋转检测框的坐标信息的个数;
若目标样本物品的检测区域标注信息包括的坐标信息的个数大于第一数量,则从所述目标样本物品的检测区域标注信息包括的各坐标信息中,筛选出至少两个备选坐标信息,其中,所述备选坐标信息是所述目标样本物品的旋转检测框,与包含所述目标样本物品的目标样本图像的图像边缘线的交点对应的坐标信息;
基于所述至少两个备选坐标信息,确定所述目标样本物品位于所述目标样本图像的拍摄视野区域外的所述旋转检测框对应的目标坐标信息,并用所述目标坐标信息替换所述至少两个备选坐标信息。
上述方法,通过采用多于第一数量的标注方式对目标样本物品进行标注,可以最大限度精准地框定该类物品的区域,在对待训练的旋转目标检测模型进行训练前,对样本物品的检测区域标注信息包括的坐标信息的个数进行统一,可以使得待训练的旋转目标检测模型学习到目标样本物品的特征,从而使得训练完毕的旋转目标检测模型在模型使用阶段,可以顺利地检测出原始图像中部分外轮廓位于原始图像的视野区域外的待测物品,从而降低信息丢失概率,提高了模型实际使用中的检测准确率。
在一种可能的实现方式中,所述基于所述至少两个备选坐标信息,确定所述目标样本物品位于所述目标样本图像的拍摄视野区域外的所述旋转检测框对应的目标坐标信息,包括:
针对所述至少两个备选坐标信息中的任一备选坐标信息,基于所述任一备选坐标信息,从所述各坐标信息中选取出参考坐标信息,其中,所述参考坐标信息与所述任一备选坐标信息对应的点的编号相邻,且不包括所述至少两个备选坐标信息中的其他备选坐标信息;
基于所述至少两个备选坐标信息,以及所述至少两个备选坐标信息对应的参考坐标信息,确定所述目标样本物品位于所述拍摄视野区域外的所述旋转检测框对应的目标坐标信息。
在一种可能的实现方式中,所述从所述目标样本物品的检测区域标注信息包括的各坐标信息中,筛选出至少两个备选坐标信息,包括:
基于预设的扩展编号集,对所述各坐标信息进行多轮筛选,直至所述扩展编号集中的所有编号均选取为止,得到所述至少两个备选坐标信息,其中,一轮筛选过程为:
将上一轮选取的第二数量个坐标信息对应的点的编号中,预设排序信息对应的编号作为本轮选取的首个编号,其中,所述第二数量个坐标信息对应的各点的编号连续;
基于所述扩展编号集和所述首个编号,确定本轮选取的所述第二数量个的编号,并基于所述本轮选取的所述第二数量个的编号,从所述各坐标信息中,选取出本轮筛选对应的所述第二数量个坐标信息;
若基于所述第二数量个坐标信息对应的各点,确定所述各点组成的各夹角中目标夹角的夹角值大于夹角阈值,且所述目标夹角的顶点的坐标信息不是已确定的备选坐标信息,则将所述目标夹角的顶点的坐标信息确定为所述备选坐标信息。
第二方面,本申请实施例提供一种物品检测装置,包括:
拍摄模块,用于拍摄视野区域内的多个待测物品,得到原始图像;
目标检测模块,用于将所述原始图像输入预设的旋转目标检测模型,得到各待测物品对应的检测区域定位信息,其中,所述旋转目标检测模型是基于多个样本图像以及样本图像内各样本物品的检测区域标注信息,对待训练的旋转目标检测模型进行训练得到的,所述各样本物品中包括至少一个部分外轮廓位于对应样本图像的拍摄视野区域外的物品;
像素填充模块,用于若基于所述各待测物品对应的检测区域定位信息,确定所述原始图像中存在部分外轮廓位于所述视野区域外的待测物品,则对所述原始图像进行像素填充,得到目标图像,并从所述目标图像中分割出所述各待测物品的图像。
在一种可能的实现方式中,任一待测物品的检测区域定位信息包括所述任一待测物品的预测旋转检测框对应的多个坐标信息;
所述像素填充模块具体用于,通过如下方式确定所述原始图像中存在部分外轮廓位于所述视野区域外的待测物品:
从所述各待测物品对应的检测区域定位信息中,选取出横坐标最大值和横坐标最小值,以及纵坐标最大值和纵坐标最小值;
若所述横坐标最大值、所述横坐标最小值、所述纵坐标最大值和所述纵坐标最小值中至少一个参考值满足预设条件,则确定所述原始图像中存在部分外轮廓位于所述视野区域外的待测物品,其中,所述预设条件包括:
横坐标最小值小于第一预设值;
横坐标最大值大于所述原始图像的宽度;
纵坐标最小值小于第二预设值;
纵坐标最大值大于所述原始图像的高度。
在一种可能的实现方式中,所述对所述原始图像进行像素填充之前,所述像素填充模块还用于:
基于参考值的属性与填充规则之间的对应关系,确定满足所述预设条件的参考值的属性对应的填充规则;
基于所述参考值和所述填充规则,确定填充区域及填充像素个数;
所述像素填充模块具体用于:
采用预设像素值,在所述原始图像外的所述填充区域内,填充所述填充像素个数的像素,得到所述目标图像。
在一种可能的实现方式中,所述得到目标图像之后,所述从所述目标图像中分割出所述各待测物品的图像之前,所述像素填充模块还用于:
针对所述各待测物品中的任一待测物品,基于所述目标图像的预设角的坐标信息,对所述任一待测物品在所述原始图像中的检测区域定位信息进行调整,得到所述任一待测物品在所述目标图像中的目标检测区域定位信息;
所述像素填充模块具体用于:
针对所述各待测物品中的任一待测物品,基于所述任一待测物品在所述目标图像中的目标检测区域定位信息,从所述目标图像中分割出所述任一待测物品的图像。
在一种可能的实现方式中,在对所述待训练的旋转目标检测模型进行训练之前,所述目标检测模块还用于:
确定每个样本物品的检测区域标注信息包括的坐标信息的个数是否大于第一数量,其中,所述第一数量是所述待训练的旋转目标检测模型输出的,针对任一样本物品的检测区域定位信息包括的旋转检测框的坐标信息的个数;
若目标样本物品的检测区域标注信息包括的坐标信息的个数大于第一数量,则从所述目标样本物品的检测区域标注信息包括的各坐标信息中,筛选出至少两个备选坐标信息,其中,所述备选坐标信息是所述目标样本物品的旋转检测框,与包含所述目标样本物品的目标样本图像的图像边缘线的交点对应的坐标信息;
基于所述至少两个备选坐标信息,确定所述目标样本物品位于所述目标样本图像的拍摄视野区域外的所述旋转检测框对应的目标坐标信息,并用所述目标坐标信息替换所述至少两个备选坐标信息。
在一种可能的实现方式中,所述目标检测模块具体用于:
针对所述至少两个备选坐标信息中的任一备选坐标信息,基于所述任一备选坐标信息,从所述各坐标信息中选取出参考坐标信息,其中,所述参考坐标信息与所述任一备选坐标信息对应的点的编号相邻,且不包括所述至少两个备选坐标信息中的其他备选坐标信息;
基于所述至少两个备选坐标信息,以及所述至少两个备选坐标信息对应的参考坐标信息,确定所述目标样本物品位于所述拍摄视野区域外的所述旋转检测框对应的目标坐标信息。
在一种可能的实现方式中,所述目标检测模块具体用于:
基于预设的扩展编号集,对所述各坐标信息进行多轮筛选,直至所述扩展编号集中的所有编号均选取为止,得到所述至少两个备选坐标信息,其中,一轮筛选过程为:
将上一轮选取的第二数量个坐标信息对应的点的编号中,预设排序信息对应的编号作为本轮选取的首个编号,其中,所述第二数量个坐标信息对应的各点的编号连续;
基于所述扩展编号集和所述首个编号,确定本轮选取的所述第二数量个的编号,并基于所述本轮选取的所述第二数量个的编号,从所述各坐标信息中,选取出本轮筛选对应的所述第二数量个坐标信息;
若基于所述第二数量个坐标信息对应的各点,确定所述各点组成的各夹角中目标夹角的夹角值大于夹角阈值,且所述目标夹角的顶点的坐标信息不是已确定的备选坐标信息,则将所述目标夹角的顶点的坐标信息确定为所述备选坐标信息。
第三方面,本申请实施例提供一种电子设备,包括:
存储器,用于存储计算机程序或指令;
处理器,用于执行所述存储器中的计算机程序或指令,使得如上述第一方面中任一项的方法被执行。
第四方面,本申请实施例提供一种计算机可读存储介质,当所述存储介质中的指令由处理器执行时,使得所述处理器能够执行上述第一方面中任一项所述的方法。
另外,第二方面至第四方面中任意一种实现方式所带来的技术效果可参见第一方面中不同实现方式所带来的技术效果,此处不再赘述。
附图说明
图1为本申请实施例中一种应用场景示意图;
图2为本申请实施例中一种物品检测方法的流程示意图;
图3为本申请实施例中一种检测区域标注信息的预处理方法的流程示意图;
图4为本申请实施例中一种样本物品的传统标注效果示意图;
图5为本申请实施例中一种原始图像的示意图;
图6为本申请实施例中一种物品标注效果示意图;
图7为本申请实施例中一种确定备选坐标信息的方法的流程示意图;
图8为本申请实施例中一种目标坐标信息的确定过程示意图;
图9为本申请实施例中一种确定目标坐标信息的方法的流程示意图;
图10为本申请实施例中一种确定原始图像中是否包含部分外轮廓位于视野区域外的待测物品的流程示意图;
图11为本申请实施例中一种确定填充区域及填充像素个数的方法的流程示意图;
图12为本申请实施例中一种图像对应的图像坐标系示意图;
图13为本申请实施例中一种从目标图像中分割出待测物品8的图像的过程示意图;
图14为本申请实施例中一种物品检测装置的逻辑架构示意图;
图15为本申请实施例中电子设备的实体架构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,并不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够在除了这里图示或描述的那些以外的顺序实施。
下面对本申请实施例的设计思想进行简要介绍。
本申请涉及计算机视觉技术领域,主要涉及一种物品检测方法、装置、设备及存储介质。
实际场景中,针对特殊场合,如海关安检、进站安检等,常常需要对人员的随身物品进行安全检查。旋转目标检测模型常常用于上述需要进行安全检查的场景中。基于该旋转目标检测模型,对包含多个物品的图像进行目标检测,从而得到每个物品对应的图像,进而完成对每个物品的分析、识别等。
相关技术下,目前的旋转目标检测模型通常仅能检测出完整显示在图像中的待检物品。然而,在一些实际场景中,往往会因部分物品未完全放置在预设区域内,而导致采集的图像中包含未完整显示的物品,这样,在采用目前的旋转目标检测模型进行物品检测时,模型通常不对未完整显示在图像中的物品进行目标检测,从而造成了信息丢失,进而导致了实际使用中模型存在着检测准确率低下问题。
有鉴于此,为了解决实际使用中模型的检测准确率低下问题,本申请实施例提供一种物品检测方法,通过多个包括至少一个部分外轮廓位于对应样本图像的拍摄视野区域外的物品的样本图像,以及样本图像内各样本物品的检测区域标注信息,对待训练的旋转目标检测模型进行训练,得到旋转目标检测模型,可以在具体实施中,利用该旋转目标检测模型,顺利检测出图像中部分外轮廓位于拍摄视野区域外的待测物品,然后,对待测物品对应的原始图像进行像素填充,得到目标图像,这样,便可以采用传统图像分割方式,顺利从目标图像中分割出上述各待测物品的图像,降低了信息丢失概率,提高了模型实际使用中的检测准确率,为后续基于各待测物品的图像进行安全分析、识别等做准备。
下面结合附图对本申请实施例提供的一种可选的物品检测方法的应用场景进行介绍。
如图1所示,该应用场景中包括查验设备10。查验设备10包括台面和图像采集装置,台面用于放置待测物品;图像采集装置安装在该台面的上面(图1中示出的位置仅为举例,本申请不做具体限定),用于获取该台面上视野区域内的图像。
示例性的,在海关安检场景中,人员将随身物品(本申请实施例记为待测物品)放置在查验设备10的台面上,由查验设备10执行本申请实施例中的一种物品检测方法,即拍摄视野区域内的多个待测物品,得到原始图像,将原始图像输入预设的旋转目标检测模型,得到各待测物品对应的检测区域定位信息,其中,该旋转目标检测模型是基于多个样本图像以及样本图像内各样本物品的检测区域标注信息,对待训练的旋转目标检测模型进行训练得到的,各样本物品中包括至少一个部分外轮廓位于对应样本图像的拍摄视野区域外的物品;若基于各待测物品对应的检测区域定位信息,确定原始图像中存在部分外轮廓位于视野区域外的待测物品,则对原始图像进行像素填充,得到目标图像,从而采用传统图像分割方式,从目标图像中分割出各待测物品的图像,以便后续对各物品进行安全分析、识别等。
在一些可行的实施例中,上述查验设备也可以是任意一种形式的具有面部识别功能的设备,例如,可以为智能终端,智能移动终端,平板电脑,笔记本电脑,智能掌上设备,个人电脑(Personal Computer,PC),计算机,监控设备,智能屏,各类可穿戴设备,个人数字助理(Personal Digital Assistant,PDA)等。
在一些优选的实施例中,上述台面需保证落入视野区域内的部分应该具有纯色背景,如黑色或白色,以避免拍摄背景影响后续的物品检测。
在一些可行的实施例中,上述图像采集装置可以是照相机、摄像机或者其他具有照相或摄像功能的电子设备,如平板电脑或智能手机等。
当然,本申请实施例提供的方法并不限于图1所示的应用场景,还可以用于其它可能的应用场景,如上述应用场景中还包括与查验设备10通过有限或无线连接的服务器,查验设备10将采集到的面部图像发送至服务器,由服务器执行本申请实施例中的一种物品检测方法,对采集到的原始图像进行物品检测,得到原始图像中各待测物品的图像;又如,采用旋转目标检测模型进行物品检测的任意一种应用场景,可以理解的是,本申请实施例对应用场景不作具体限定。
在介绍完本申请实施例的一种可选的应用场景之后,下面结合附图对本申请优选的实施方式做出进一步详细说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请,并且在不冲突的情况下,本申请实施例及实施例中的特征可以相互组合。
参阅图2所示,本申请实施例提供了一种物品检测方法,该方法的具体流程如下:
步骤200:拍摄视野区域内的多个待测物品,得到原始图像。
本申请实施例中,如图1所示,上述多个待测物品被随意地摆放在台面上,每次摆放的待测物品的数量没有特殊限制,可以达到十几件乃至几十件,每个待测物品可不超出拍摄的视野区域,也可存在部分待测物品超出拍摄的视野区域。同时,待测物品可以用任意角度位置在台面上摆放,本申请不做具体限定。
具体实施中,在执行步骤200时,如图1所示的查验设备可以控制图像采集装置按照预设周期对台面进行拍照,也可以响应拍摄指令,控制图像采集装置对台面进行拍照,还可以在满足预设拍照条件时,触发查验设备控制图像采集装置对台面进行拍照,从而得到原始图像,摆放在台面上的多个待测物品即被记录在该原始图像中,该图像采集装置的镜头能够拍摄的范围即为步骤200中的视野区域。
步骤210:将该原始图像输入预设的旋转目标检测模型,得到各待测物品对应的检测区域定位信息,其中,该旋转目标检测模型是基于多个样本图像以及样本图像内各样本物品的检测区域标注信息,对待训练的旋转目标检测模型进行训练得到的,各样本物品中包括至少一个部分外轮廓位于对应样本图像的拍摄视野区域外的物品。
具体实施中,在执行步骤210时,将该原始图像输入预设的旋转目标检测模型中,基于该旋转目标检测模型对原始图像中的各个待测物品进行物品检测,得到各待测物品对应的检测区域定位信息,其中,该旋转目标检测模型是基于多个样本图像,以及每个样本图像内各样本物品的检测区域标注信息,对待训练的旋转目标检测模型进行训练得到的。
本申请实施例中,待训练的旋转目标检测模型可以是基于YOLOv5、YOLOv7、YOLOV8等任意一种算法构建的,也可以是其他类型的检测模型。本申请实施例中,优选以YOLOv5-OBB构建该待训练的旋转目标检测模型。
具体的,在对上述待训练的旋转目标检测模型进行训练之前,参阅图3所示,还需执行如下步骤:
步骤300:确定每个样本物品的检测区域标注信息包括的坐标信息的个数是否大于第一数量,其中,第一数量是上述待训练的旋转目标检测模型输出的,针对任一样本物品的检测区域定位信息包括的旋转检测框的坐标信息的个数。
相关技术下,旋转目标检测算法是目标检测算法的一个扩展。传统的目标检测算法通常采用矩形标注框来表示一个目标,而旋转目标检测算法则采用旋转矩形框来表示一个目标。由于旋转目标检测算法采用旋转矩形框(本申请实施例中记为旋转检测框)来表示一个目标,因此,通常旋转目标检测算法在数据标注的时候通常采用四点标注方式。
如图4所示,图像A中包括1个目标,记为目标1。在利用传统的旋转检测框来表示一个目标时,利用框定该目标1的旋转检测框的四个顶点的坐标信息来表示目标1,分别记为P1’,P2’,P3’,P4’,对应的坐标信息可以记为[x1,y1,x2,y2,x3,y3,x4,y4],其中,(xi,yi),i=1,2,3,4分别表示从左上角开始的顺时针方向的四个点的坐标信息。
然而,在实际场景中,往往会出现如图5所示的图像(即图1示出的原始图像),该原始图像中包括8个待测物品,其中,待测物品8未完全显示在原始图像中,待测物品8的左上角位于图像采集装置的视野区域外,是部分外轮廓位于图像的视野区域外的物品。若采用常规的四点标注方式框定该待测物品8,经无法完全覆盖该物品。
为了使得训练后的旋转目标检测模型可以顺利识别待测物品8,本申请实施例中,采用五点标注方式标注该类物品,从而可以精准地框定该待测物品8的区域。如图6所示,采用五点标注方式标注该待测物品8,依次得到P1,P2,P3,P4,P5。
本申请实施例中,步骤300中的第一数量可以取值为4,这样,可与相关技术下的针对旋转目标检测模型训练所使用的标注方式保持一致。但需说明的是,为了提高模型训练的精度,第一数量也可以取其他数值,对上述待测物品8这一类物品同样可以采用其他标注方式,如多于五点标注方式等,本申请不做具体限定。
需要说明的是,后续实施例中,仅以第一数量取值为4,以及对待测物品8代表的这类物品采用五点标注方式为例,对本申请实施例提供的一种物品检测方法的设计思路进行介绍。
本申请实施例中,在对训练的旋转目标检测模型进行训练之前,需收集海量样本图像,其中,每个样本图像包括的各样本物品中包括至少一个部分外轮廓位于对应样本图像的拍摄视野区域外的物品。然后,采用上述四点标注方式或五点标注方式对每个样本图像内各样本图像进行标注,得到每个样本图像内各样本物品的检测区域标注信息;再基于收集到的海量样本图像,以及每个样本图像内各样本物品的检测区域标注信息,对待训练的旋转目标检测模型进行模型训练。
具体实施中,在对待训练的旋转目标检测模型进行模型训练之前,还需通过执行步骤300~步骤330,对各样本物品的检测区域标注信息进行预处理。
具体的,在执行步骤300时,确定每个样本物品的检测区域标注信息包括的坐标信息的个数是否大于第一数量,其中,第一数量是待训练的旋转目标检测模型输出的,针对任一样本物品的检测区域定位信息包括的旋转检测框的坐标信息的个数,即具体实施中旋转目标检测模型输出的检测区域定位信息包括的坐标信息的个数;若目标样本物品的检测区域标注信息包括的坐标信息的个数大于第一数量,则执行步骤310,反之,即样本物品的检测区域标注信息包括的坐标信息的个数不大于第一数量,则不执行任何处理。
步骤310:若目标样本物品的检测区域标注信息包括的坐标信息的个数大于第一数量,则从目标样本物品的检测区域标注信息包括的各坐标信息中,筛选出至少两个备选坐标信息,其中,备选坐标信息是该目标样本物品的旋转检测框,与包含该目标样本物品的目标样本图像的图像边缘线的交点对应的坐标信息。
本申请实施例中,在执行步骤310时,若目标样本物品的检测区域标注信息包括的坐标信息的个数大于第一数量,则说明该目标样本物品是部分外轮廓位于包含该目标样本物品的目标样本图像的拍摄视野区域外的物品,则参阅图7所示,在执行步骤310时,具体执行如下步骤:
步骤3101:基于预设的扩展编号集,对各坐标信息进行多轮筛选,直至扩展编号集中的所有编号均选取为止,得到上述至少两个备选坐标信息,其中,一轮筛选过程为:
步骤31011:将上一轮选取的第二数量个坐标信息对应的点的编号中,预设排序信息对应的编号作为本轮选取的首个编号,其中,第二数量个坐标信息对应的各点的编号连续。
本申请实施例中,在执行步骤3101时,首先构建扩展编号集;然后,基于该扩展编号集,对各坐标信息进行多轮筛选,直至扩展编号集中的所有编号均选取为止,得到至少两个备选坐标信息,其中,在一轮筛选过程中,依次执行步骤31011~步骤31014。
具体实施中,在执行步骤31011时,确定上一轮选取的第二数量个坐标信息对应的点的编号,然后,将确定的各点的编号中排序信息表征第二名的编号作为本轮选取的首个编号,其中,第二数量个坐标信息对应的点的编号连续。本申请实施例中,第二数量可以取值为3。
例如,仍参阅图6所示,假设目标样本物品(即图6示出的待测物品8)采用五点标注方式进行标注,得到的各点依次为P1,P2,P3,P4,P5。
那么,可以利用上述各点的坐标信息的下标构建扩展编号集,记为[1,2,3,4,5,1,2]。
又假设上一轮选取的第二数量(如3)个编号依次为3、4、5,即上一轮筛选对应的第二数量(如3)个坐标信息对应的点依次为P3、P4、P5。
那么,在执行步骤31011时,将3、4、5中排序信息表征为第二名的4作为本轮选取的首个编号。
步骤31012:基于扩展编号集和首个编号,确定本轮选取的第二数量个的编号。
例如,仍参阅图6所示,仍假设目标样本物品(即图6示出的待测物品8)采用五点标注方式进行标注,得到的各点依次为P1,P2,P3,P4,P5,以及利用上述各点的坐标信息的下标构建扩展编号集,记为[1,2,3,4,5,1,2];上一轮选取的第二数量(3)个的编号依次为3、4、5,以及执行步骤31011得到的首个编号为4。
那么,在执行步骤31012时,基于扩展编号集[1,2,3,4,5,1,2],以及首个编号4,确定本轮选取的3个编号依次为4、5、1。
步骤31013:基于本轮选取的第二数量个的编号,从上述各坐标信息中,选取出本轮筛选对应的第二数量个的坐标信息。
例如,仍参阅图6所示,仍假设目标样本物品(即图6示出的待测物品8)采用五点标注方式进行标注,得到的各点依次为P1,P2,P3,P4,P5,以及利用上述各点的坐标信息的下标构建扩展编号集,记为[1,2,3,4,5,1,2];上一轮选取的第二数量(3)个的编号依次为3、4、5,以及执行步骤31012确定的本轮选取的3个编号依次为4、5、1。
那么,在执行步骤31013时,基于编号4、5、1,从各坐标信息中,选取出本轮筛选对应的第二数量个的坐标信息依次为[x4,y4](P4)、[x5,y5](P5)、[x1,y1](P1)。
步骤31014:若基于第二数量个的坐标信息对应的各点,确定各点组成的各夹角中目标夹角的夹角值大于夹角阈值,且目标夹角的顶点的坐标信息不是已确定的备选坐标信息,则将目标夹角的顶点的坐标信息确定为备选坐标信息。
在一些可行的实施例中,在执行步骤31013得到本轮筛选对应的第二数量个的坐标信息后,可以按照各点的编号的排序信息进行首尾相连,得到目标图形,并确定目标图形内各夹角的夹角值,以及确定各夹角的夹角值是否大于夹角阈值;若是,则将夹角值大于夹角阈值的夹角记为目标夹角,并在确定该目标夹角的顶点的坐标信息不是已确定的备选坐标信息时,将该目标夹角的顶点的坐标信息确定为备选坐标信息,如记录该备选坐标信息对应的点的编号;在确定该目标夹角的顶点的坐标信息是已确定的备选坐标信息时,则不执行任何操作,或对已确定的备选坐标信息对应的点的编号进行二次记录等。
在一些优选的实施例中,针对采用五点标注方式进行标注的目标样本物品,在选取出本轮筛选对应的第二数量(如3)个的坐标信息之后,可以以这3个坐标信息对应的各点中的中间点为核心,构建两个向量,然后,可以采用余弦夹角方式计算这两个向量的夹角值,并将计算出的夹角值与夹角阈值进行比较,若该夹角值大于夹角阈值,表明该中间点是该目标样本物品的旋转检测框,与包含该目标样本物品的目标样本图像的图像边缘线的交点,则将该中间点对应的坐标信息确定为备选坐标信息;若该夹角值不大于夹角阈值,表明该中间点是位于包含该目标样本物品的目标样本图像内的一个点,则不做任何处理。
由于本申请实施例中的旋转检测框采用旋转矩形框,因此,若某个点为中间点时计算出的两个向量的夹角值大于90°,通常该点即为位于包含该目标样本物品的目标样本图像的图像边缘线上的点。为了避免计算误差,本申请实施例中,上述夹角阈值可以取值为98°,需要说明的是,夹角阈值也可以基于实际情况进行具体设置,本申请不做具体限定。
例如,参阅图8所示,以图5和图6示出的待测物品8(即本例中的目标样本物品)为例。
仍假设目标样本物品采用五点标注方式进行标注,得到的各点依次为P1,P2,P3,P4,P5,以及选取出本轮筛选对应的第二数量(如3)个的坐标信息依次为[x4,y4](P4)、[x5,y5](P5)、[x1,y1](P1)。
在一些优选的实施例中,在执行步骤31014时,以3个点中的中间点P5为核心,构建两个向量,分别记为v1,v2,上述两个向量可以用如下公式来表示:
v1=P5-P4=(x5-x4,y5-y4)
v2=P1-P5=(x1-x5,y1-y5)
然后,采用如下余弦夹角公式计算这两个向量的夹角值θ:
其中,arccos()表示获取余弦函数对应的弧度值,degree()表示将弧度值转化为角度值,即上述夹角值θ。
再次,将计算出的θ与夹角阈值进行比较。
假设夹角阈值取值为98°,θ=120°。
那么,仍参阅图8所示,由于θ大于98°,表明该P5是该目标样本物品的旋转检测框,与包含该目标样本物品的目标样本图像的图像边缘线的交点,因此,将该P5对应的坐标信息确定为备选坐标信息。
然后,执行步骤31011~步骤31014,确定下一轮筛选对应的3个坐标信息中是否存在备选坐标信息。
仍参阅图8所示,下一轮筛选对应的3个坐标信息依次为[x5,y5](P5)、[x1,y1](P1)、[x2,y2](P2),同样执行上述流程,以P1为核心,构建新的两个向量,并采用余弦夹角公式计算两个向量的夹角值,从而得到P1也是该目标样本物品的旋转检测框,与包含该目标样本物品的目标样本图像的图像边缘线的交点,因此,将P1对应的坐标信息确定为备选坐标信息。
这样,便可以从P1、P2、P3、P4、P5筛选出该目标样本物品的旋转检测框,与包含该目标样本物品的目标样本图像的图像边缘线的交点对应的坐标信息,即P5、P1对应的坐标信息。流程处理过程中,在筛选出备选坐标信息后,只需记录P5、P1的编号(即坐标信息的下标)即可。
在一些可行的实施例中,待训练的旋转目标检测模型对应的旋转检测框也可以不是矩形框,这样,该模型输出的针对任一样本物品的检测区域定位信息也可以不止包含四点的坐标信息,也可以包含多点的坐标信息,相应地,采用本申请实施例提供的上述多轮筛选,同样可以从目标样本物品的各坐标信息中,筛选出至少两个备选坐标信息,然后,通过执行后续步骤320,确定出该目标样本物品位于该目标样本图像的拍摄视野区域外的旋转检测框对应的目标坐标信息。
步骤320:基于上述至少两个备选坐标信息,确定该目标样本物品位于该目标样本图像的拍摄视野区域外的旋转检测框对应的目标坐标信息。
具体实施中,参阅图9所示,在执行步骤320时,具体执行如下步骤3201~步骤3202:
步骤3201:针对至少两个备选坐标信息中的任一备选坐标信息,基于该备选坐标信息,从上述各坐标信息中选取出参考坐标信息,其中,参考坐标信息与该备选坐标信息对应的点的编号相邻,且不包括上述至少两个备选坐标信息中的其他备选坐标信息。
例如,仍参阅图8所示,以图5和图6示出的待测物品8(即本例中的目标样本物品)为例。
仍假设目标样本物品采用五点标注方式进行标注,得到的各点依次为P1,P2,P3,P4,P5。
本申请实施例中,执行步骤310可以得到备选坐标信息对应的点分别为P1和P5,在执行步骤3201时,可以通过如下公式得到每个备选坐标信息对应的参考坐标信息的点的编号:
其中,对两个备选坐标信息对应的点的编号按照从小到大的顺序进行排序,记为[id1,id2],id1n和id2分别表示id1和id2相邻的点的坐标信息的下标(即编号);mod()表示取模运算;本申请实施例中,当取模后的值为零时,默认替换为5;当id1=1且id2=5时,
仍参阅图8所示,针对P1和P5,得到的参考坐标信息对应的点的编号分别为2和4,即对应的点分别P2和P4。
步骤3202:基于上述至少两个备选坐标信息,以及上述至少两个备选坐标信息对应的参考坐标信息,确定该目标样本物品位于该拍摄视野区域外的旋转检测框对应的目标坐标信息。
本申请实施例中,在执行步骤3202时,具体可基于备选坐标信息和该备选坐标信息对应的参考坐标信息,得到一条直线,则基于至少两个备选坐标信息,以及至少两个备选坐标信息对应的参考坐标信息,可以得到至少两条直线,那么,将至少两条直线的交点对应的坐标信息,作为该目标样本物品位于该拍摄视野区域外的旋转检测框对应的目标坐标信息。
例如,仍参阅图8所示,仍以图5和图6示出的待测物品8(即本例中的目标样本物品)为例。
仍假设目标样本物品采用五点标注方式进行标注,得到的各点依次为P1,P2,P3,P4,P5。
本申请实施例中,执行步骤310可以得到备选坐标信息对应的点分别为P1和P5,执行步骤3201得到与P1对应的P2,与P5对应的P4。
那么,针对目标样本图像上两个点p1=(x1,y1)和p2=(x2,y2),其中,点以像素坐标表示,即x1,x2,y1,y2均为整数。
又假设过P1、P2两点的直线方程为y=ax+b。
则根据上述两点p1=(x1,y1)和p2=(x2,y2),可以利用待定系数法,计算出该过P1、P2两点的直线方程的系数。
由于两个点可能位于同一条水平线上(此时x1=x2),那么,常规的计算方法失效。因此,本申请实施例中,根据不同情况进行分类计算,即
当x1=x2时,系数为:
当x1≠x2时,系数为:
b=y1-a×x1
本申请实施例中,针对P1和P2,以及P4和P5,可以得到两条直线,如图8所示的直线1和直线2。
假设上述两条直线的直线方程对应的系数分别为(a1,b1)和(a2,b2),以及上述两条直线的交点的坐标信息(即图8示出的Pt的坐标信息)为(xinter,yinter)。
则上述两条直线的交点的坐标信息满足如下方程组:通过计算可以得到该方程组的解为/>即通过上述两个直线方程的系数,可得到上述两条直线的交点对应的坐标信息,即该目标样本物品位于该拍摄视野区域外的旋转检测框对应的目标坐标信息。
需要注意的是,在基于上述解对应的公式计算交点的横坐标之前,需先确定a1=a2是否成立,若成立,则直接返回平行,即无交点的提示信息,若不成,则基于上,上述解对应的公式计算交点的坐标信息,即目标坐标信息。
步骤330:用该目标坐标信息替换上述至少两个备选坐标信息。
本申请实施例中,在通过执行步骤300~步骤320得到该目标样本物品位于该拍摄视野区域外的旋转检测框对应的目标坐标信息后,执行步骤330,用该目标坐标信息替换上述至少两个备选坐标信息。参阅图8所示,用点Pt的坐标信息,替换点P1和点P5对应的坐标信息。
这样,便将每个样本图像内各样本物品的检测区域标注信息包括的坐标信息的个数进行了统一,然后,基于统一后的各样本物品的检测区域标注信息,以及多个样本图像,对待训练的旋转目标检测模型进行训练,可以使得待训练的旋转目标检测模型学习到目标样本物品的特征;在模型达到收敛条件后,输出最后一轮训练对应的旋转目标检测模型,并将该最后一轮训练对应的旋转目标检测模型作为后续模型的具体实施中所使用的旋转目标检测模型,即在执行步骤210时,通过将原始图像输入该旋转目标检测模型,得到该原始图像内各待测物品对应的检测区域定位信息,若该各待测物品中存在部分外轮廓位于视野区域外的待测物品,也可以顺利检测出待测物品,从而提高了模型实际使用中的检测准确率。
步骤220:若基于各待测物品对应的检测区域定位信息,确定原始图像中存在部分外轮廓位于视野区域外的待测物品,则对原始图像进行像素填充,得到目标图像。
本申请实施例中,由前述内容可知,旋转目标检测模型针对任一待测物品输出的检测区域定位信息包括该待测物品的预测旋转检测框对应的多个坐标信息,且具体实施中使用的旋转目标检测模型可以检测出部分外轮廓位于视野区域外的待测物品,因此,旋转目标检测模型输出的检测区域定位信息中可能存在原始图像的视野区域外的坐标信息,这样,在采用传统图像分割方式时,将不能顺利从原始图像中分割出部分外轮廓位于视野区域外的待测物品,故在执行步骤220之前,参阅图10所示,需通过执行如下步骤,首先确定该原始图像中是否存在部分外轮廓位于该视野区域外的待测物品:
步骤1000:从各待测物品对应的检测区域定位信息中,选取出横坐标最大值和横坐标最小值,以及纵坐标最大值和纵坐标最小值。
步骤1010:若横坐标最大值、横坐标最小值、纵坐标最大值和纵坐标最小值中至少一个参考值满足预设条件,则确定该原始图像中存在部分外轮廓位于该视野区域外的待测物品;其中,预设条件包括:横坐标最小值小于第一预设值;横坐标最大值大于该原始图像的宽度;纵坐标最小值小于第二预设值。纵坐标最大值大于该原始图像的高度。
在一些可行的实施例中,若横坐标最大值、横坐标最小值、纵坐标最大值和纵坐标最小值均不满足预设条件,则确定该原始图像中不存在部分外轮廓位于该视野区域外的待测物品,采用传统图像分割方式,直接基于各待测物品对应的检测区域定位信息,从原始图像中分割出各待测物品对应的图像即可。
本申请实施例中,参阅图11所示,在确定该原始图像中存在部分外轮廓位于该视野区域外的待测物品之后,在执行步骤220中的对该原始图像进行像素填充之前,还需执行如下步骤:
步骤1100:基于参考值的属性与填充规则之间的对应关系,确定满足该预设条件的参考值的属性对应的填充规则。
步骤1110:基于参考值和填充规则,确定填充区域及填充像素个数。
本申请实施例中,假设原始图像内有k个待测物品。
那么,k个待测物品对应的预测旋转检测框记为[Det1,Det2,Detk],则(表示k个待测物品中第i个待测物品的预测旋转检测框。
本申请实施例中,通过如下公式表示上述k个待测物品的预测旋转检测框的横坐标最小值,横坐标最大值,纵坐标最小值和纵坐标最大值:
其中,j表示旋转目标检测模型输出的任一待测物品的检测区域定位信息包括的坐标信息的个数。
具体实施中,可以通过如下公式,确定是否需对原始图像进行填充(即步骤1010),以及填充区域及填充像素个数(步骤1100~步骤1110):
其中,本申请实施例中,第一预设值可以取值为0,第二预设值同样可取值为0,那么,上述预设条件包括:xmin<0;xmax>W;ymin<0;ymax>H,W为原始图像的宽度,H为原始图像的高度;
若满足预设条件的参考值xmin的属性为横坐标最小,则与该参考值的属性对应的填充规则为:xleft=-xmin
若满足预设条件的参考值xmax的属性为横坐标最大,则与该参考值的属性对应的填充规则为:xright=xmax-W;
若满足预设条件的参考值ymin的属性为纵坐标最小,则与该参考值的属性对应的填充规则为:ytop=-ymin
若满足预设条件的参考值ymax的属性为纵坐标最大,则与该参考值的属性对应的填充规则为:ydown=ymax-H。
本申请实施例中,在得到填充区域及填充像素个数之后,执行步骤220中的对该原始图像进行像素填充,得到目标图像时,具体可以采用预设像素值,在该原始图像外的填充区域内,填充该填充像素个数的像素,得到目标图像,其中,预设像素值为常量像素值,如,若原始图像为三通道RGB图像,则预设像素值可取(0,0,0)。
需要说明的是,若确定填充区域为多个,则分别在原始图像中依次进行填充,从而得到目标图像。具体的,若确定填充区域为左侧填充区域、右侧填充区域、上侧填充区域和下侧填充区域,则依次在左侧填充区域内扩充xleft列像素,在上侧填充区域内扩充ytop行像素,在右侧填充区域内扩充xright列像素,在下侧填充区域内扩充ydown行像素。
本申请实施例中,由于对原始图像进行了像素扩充,因此,旋转目标检测模型基于原始图像进行检测输出的各待测物品的检测区域定位信息,将与目标图像中的待测物品所在的图像区域不匹配,因此,在执行步骤220得到目标图像之后,在执行步骤230的从该目标图像中分割出各待测物品的图像之前,还需针对各待测物品中的任一待测物品,基于该目标图像的预设角的坐标信息,对该待测物品在原始图像中的检测区域定位信息进行调整,得到该待测物品在该目标图像中的目标检测区域定位信息。
相关技术下,在对图像进行处理时,通常以图像左上角为坐标原点,坐标原点向下为y轴正方向,坐标原点向右为x轴正方向,如图12所示。相应的,本申请实施例中,也沿用上述基础知识,设置预设角为左上角。具体实施中,在对任一待测物品的检测区域定位信息进行调整时,可以通过如下公式得到相应的待测物品在目标图像中的目标检测区域定位信息,即在每个坐标信息上加上左上角的坐标信息:
其中,i∈[1,k],j∈[1,2,3,4],k表示原始图像中包含k个待测物品,j表示模型输出的检测区域定位信息包括的坐标信息的个数;xleft、ytop的具体取值可参见前述公式的计算结果。
步骤230:从目标图像中分割出各待测物品的图像。
本申请实施例中,在得到各待测物品在目标图像中的目标检测区域定位信息后,执行步骤230,针对各待测物品中的任一待测物品,可采用传统图像分割方式,基于该任一待测物品在目标图像中的目标检测区域定位信息,从目标图像中分割出该待测物品的图像。
如图13所示,图1示出的原始图像内包含8个待测物品,其中,待测物品8是部分外轮廓位于原始图像的视野区域外的待测物品。通过本申请实施例中的旋转目标检测模型检测出各待测物品的检测区域定位信息,并基于各待测物品的检测区域定位信息,确定原始图像中存在部分外轮廓位于视野区域外的待测物品,然后,对原始图像进行像素填充,由于原始图像中仅待测物品8是部分外轮廓位于原始图像的视野区域外的待测物品,因此,需在原始图像的上侧填充区域内填充像素,得到目标图像,如图13所示。
仍参阅图13所示,从目标图像中分割出的待测物品8的图像中的左上角区域为填充的像素;这样,便可以采用传统图像分割方式得到原始图像中每个待测物品的图像,以便于后续完成对每个物品的分析、识别等。
基于同一发明构思,参阅图14所示,本申请实施例中提供一种物品检测装置,包括:
拍摄模块1410,用于拍摄视野区域内的多个待测物品,得到原始图像;
目标检测模块1420,用于将所述原始图像输入预设的旋转目标检测模型,得到各待测物品对应的检测区域定位信息,其中,所述旋转目标检测模型是基于多个样本图像以及样本图像内各样本物品的检测区域标注信息,对待训练的旋转目标检测模型进行训练得到的,所述各样本物品中包括至少一个部分外轮廓位于对应样本图像的拍摄视野区域外的物品;
像素填充模块1430,用于若基于所述各待测物品对应的检测区域定位信息,确定所述原始图像中存在部分外轮廓位于所述视野区域外的待测物品,则对所述原始图像进行像素填充,得到目标图像,并从所述目标图像中分割出所述各待测物品的图像。
在一种可能的实现方式中,任一待测物品的检测区域定位信息包括所述任一待测物品的预测旋转检测框对应的多个坐标信息;
所述像素填充模块1430具体用于,通过如下方式确定所述原始图像中存在部分外轮廓位于所述视野区域外的待测物品:
从所述各待测物品对应的检测区域定位信息中,选取出横坐标最大值和横坐标最小值,以及纵坐标最大值和纵坐标最小值;
若所述横坐标最大值、所述横坐标最小值、所述纵坐标最大值和所述纵坐标最小值中至少一个参考值满足预设条件,则确定所述原始图像中存在部分外轮廓位于所述视野区域外的待测物品,其中,所述预设条件包括:
横坐标最小值小于第一预设值;
横坐标最大值大于所述原始图像的宽度;
纵坐标最小值小于第二预设值;
纵坐标最大值大于所述原始图像的高度。
在一种可能的实现方式中,所述对所述原始图像进行像素填充之前,所述像素填充模块1430还用于:
基于参考值的属性与填充规则之间的对应关系,确定满足所述预设条件的参考值的属性对应的填充规则;
基于所述参考值和所述填充规则,确定填充区域及填充像素个数;
所述像素填充模块1430具体用于:
采用预设像素值,在所述原始图像外的所述填充区域内,填充所述填充像素个数的像素,得到所述目标图像。
在一种可能的实现方式中,所述得到目标图像之后,所述从所述目标图像中分割出所述各待测物品的图像之前,所述像素填充模块1430还用于:
针对所述各待测物品中的任一待测物品,基于所述目标图像的预设角的坐标信息,对所述任一待测物品在所述原始图像中的检测区域定位信息进行调整,得到所述任一待测物品在所述目标图像中的目标检测区域定位信息;
所述像素填充模块1430具体用于:
针对所述各待测物品中的任一待测物品,基于所述任一待测物品在所述目标图像中的目标检测区域定位信息,从所述目标图像中分割出所述任一待测物品的图像。
在一种可能的实现方式中,在对所述待训练的旋转目标检测模型进行训练之前,所述目标检测模块1420还用于:
确定每个样本物品的检测区域标注信息包括的坐标信息的个数是否大于第一数量,其中,所述第一数量是所述待训练的旋转目标检测模型输出的,针对任一样本物品的检测区域定位信息包括的旋转检测框的坐标信息的个数;
若目标样本物品的检测区域标注信息包括的坐标信息的个数大于第一数量,则从所述目标样本物品的检测区域标注信息包括的各坐标信息中,筛选出至少两个备选坐标信息,其中,所述备选坐标信息是所述目标样本物品的旋转检测框,与包含所述目标样本物品的目标样本图像的图像边缘线的交点对应的坐标信息;
基于所述至少两个备选坐标信息,确定所述目标样本物品位于所述目标样本图像的拍摄视野区域外的所述旋转检测框对应的目标坐标信息,并用所述目标坐标信息替换所述至少两个备选坐标信息。
在一种可能的实现方式中,所述目标检测模块1420具体用于:
针对所述至少两个备选坐标信息中的任一备选坐标信息,基于所述任一备选坐标信息,从所述各坐标信息中选取出参考坐标信息,其中,所述参考坐标信息与所述任一备选坐标信息对应的点的编号相邻,且不包括所述至少两个备选坐标信息中的其他备选坐标信息;
基于所述至少两个备选坐标信息,以及所述至少两个备选坐标信息对应的参考坐标信息,确定所述目标样本物品位于所述拍摄视野区域外的所述旋转检测框对应的目标坐标信息。
在一种可能的实现方式中,所述目标检测模块1420具体用于:
基于预设的扩展编号集,对所述各坐标信息进行多轮筛选,直至所述扩展编号集中的所有编号均选取为止,得到所述至少两个备选坐标信息,其中,一轮筛选过程为:
将上一轮选取的第二数量个坐标信息对应的点的编号中,预设排序信息对应的编号作为本轮选取的首个编号,其中,所述第二数量个坐标信息对应的各点的编号连续;
基于所述扩展编号集和所述首个编号,确定本轮选取的所述第二数量个的编号,并基于所述本轮选取的所述第二数量个的编号,从所述各坐标信息中,选取出本轮筛选对应的所述第二数量个坐标信息;
若基于所述第二数量个坐标信息对应的各点,确定所述各点组成的各夹角中目标夹角的夹角值大于夹角阈值,且所述目标夹角的顶点的坐标信息不是已确定的备选坐标信息,则将所述目标夹角的顶点的坐标信息确定为所述备选坐标信息。
基于同一发明构思,参阅图15所示,本申请实施例中提供一种电子设备,包括:
存储器151,用于存储计算机程序或指令;
处理器152,用于执行存储器151中的计算机程序或指令,使得如上述各个实施例中任意一种方法被执行。
其中,处理器152,可以包括一个或多个中央处理单元(Central ProcessingUnit,CPU),或者数字处理单元等等,用于执行存储器151中的计算机程序或指令,使得如上述各个实施例中任意一种方法被执行。
需要说明的是,本申请实施例中不限定上述存储器151、处理器152之间的具体连接介质。本申请实施例在图15中,存储器151、处理器152之间通过总线153连接,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。所述总线153可以分为地址总线、数据总线、控制总线等。为便于表示,图15中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
基于同一发明构思,本申请实施例提供一种计算机可读存储介质,当所述存储介质中的指令由处理器执行时,使得所述处理器能够执行上述各个实施例中的任意一种方法。由于上述计算机可读存储介质解决问题的原理与物品检测方法相似,因此上述计算机可读存储介质的实施可以参见方法的实施,重复之处不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图中的一个流程或多个流程和/或方框图中的一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图中的一个流程或多个流程和/或方框图中的一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图中的一个流程或多个流程和/或方框图中的一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种物品检测方法,其特征在于,包括:
拍摄视野区域内的多个待测物品,得到原始图像;
将所述原始图像输入预设的旋转目标检测模型,得到各待测物品对应的检测区域定位信息,其中,所述旋转目标检测模型是基于多个样本图像以及样本图像内各样本物品的检测区域标注信息,对待训练的旋转目标检测模型进行训练得到的,所述各样本物品中包括至少一个部分外轮廓位于对应样本图像的拍摄视野区域外的物品;
若基于所述各待测物品对应的检测区域定位信息,确定所述原始图像中存在部分外轮廓位于所述视野区域外的待测物品,则对所述原始图像进行像素填充,得到目标图像,并从所述目标图像中分割出所述各待测物品的图像。
2.如权利要求1所述的方法,其特征在于,任一待测物品的检测区域定位信息包括所述任一待测物品的预测旋转检测框对应的多个坐标信息;
通过如下方式确定所述原始图像中存在部分外轮廓位于所述视野区域外的待测物品:
从所述各待测物品对应的检测区域定位信息中,选取出横坐标最大值和横坐标最小值,以及纵坐标最大值和纵坐标最小值;
若所述横坐标最大值、所述横坐标最小值、所述纵坐标最大值和所述纵坐标最小值中至少一个参考值满足预设条件,则确定所述原始图像中存在部分外轮廓位于所述视野区域外的待测物品,其中,所述预设条件包括:
横坐标最小值小于第一预设值;
横坐标最大值大于所述原始图像的宽度;
纵坐标最小值小于第二预设值;
纵坐标最大值大于所述原始图像的高度。
3.如权利要求2所述的方法,其特征在于,所述对所述原始图像进行像素填充之前,还包括:
基于参考值的属性与填充规则之间的对应关系,确定满足所述预设条件的参考值的属性对应的填充规则;
基于所述参考值和所述填充规则,确定填充区域及填充像素个数;
所述对所述原始图像进行像素填充,得到目标图像,包括:
采用预设像素值,在所述原始图像外的所述填充区域内,填充所述填充像素个数的像素,得到所述目标图像。
4.如权利要求3所述的方法,其特征在于,所述得到目标图像之后,所述从所述目标图像中分割出所述各待测物品的图像之前,还包括:
针对所述各待测物品中的任一待测物品,基于所述目标图像的预设角的坐标信息,对所述任一待测物品在所述原始图像中的检测区域定位信息进行调整,得到所述任一待测物品在所述目标图像中的目标检测区域定位信息;
所述从所述目标图像中分割出所述各待测物品的图像,包括:
针对所述各待测物品中的任一待测物品,基于所述任一待测物品在所述目标图像中的目标检测区域定位信息,从所述目标图像中分割出所述任一待测物品的图像。
5.如权利要求1-4任一所述的方法,其特征在于,在对所述待训练的旋转目标检测模型进行训练之前,还包括:
确定每个样本物品的检测区域标注信息包括的坐标信息的个数是否大于第一数量,其中,所述第一数量是所述待训练的旋转目标检测模型输出的,针对任一样本物品的检测区域定位信息包括的旋转检测框的坐标信息的个数;
若目标样本物品的检测区域标注信息包括的坐标信息的个数大于第一数量,则从所述目标样本物品的检测区域标注信息包括的各坐标信息中,筛选出至少两个备选坐标信息,其中,所述备选坐标信息是所述目标样本物品的旋转检测框,与包含所述目标样本物品的目标样本图像的图像边缘线的交点对应的坐标信息;
基于所述至少两个备选坐标信息,确定所述目标样本物品位于所述目标样本图像的拍摄视野区域外的所述旋转检测框对应的目标坐标信息,并用所述目标坐标信息替换所述至少两个备选坐标信息。
6.如权利要求5所述的方法,其特征在于,所述基于所述至少两个备选坐标信息,确定所述目标样本物品位于所述目标样本图像的拍摄视野区域外的所述旋转检测框对应的目标坐标信息,包括:
针对所述至少两个备选坐标信息中的任一备选坐标信息,基于所述任一备选坐标信息,从所述各坐标信息中选取出参考坐标信息,其中,所述参考坐标信息与所述任一备选坐标信息对应的点的编号相邻,且不包括所述至少两个备选坐标信息中的其他备选坐标信息;
基于所述至少两个备选坐标信息,以及所述至少两个备选坐标信息对应的参考坐标信息,确定所述目标样本物品位于所述拍摄视野区域外的所述旋转检测框对应的目标坐标信息。
7.如权利要求5所述的方法,其特征在于,所述从所述目标样本物品的检测区域标注信息包括的各坐标信息中,筛选出至少两个备选坐标信息,包括:
基于预设的扩展编号集,对所述各坐标信息进行多轮筛选,直至所述扩展编号集中的所有编号均选取为止,得到所述至少两个备选坐标信息,其中,一轮筛选过程为:
将上一轮选取的第二数量个坐标信息对应的点的编号中,预设排序信息对应的编号作为本轮选取的首个编号,其中,所述第二数量个坐标信息对应的各点的编号连续;
基于所述扩展编号集和所述首个编号,确定本轮选取的所述第二数量个的编号,并基于所述本轮选取的所述第二数量个的编号,从所述各坐标信息中,选取出本轮筛选对应的所述第二数量个坐标信息;
若基于所述第二数量个坐标信息对应的各点,确定所述各点组成的各夹角中目标夹角的夹角值大于夹角阈值,且所述目标夹角的顶点的坐标信息不是已确定的备选坐标信息,则将所述目标夹角的顶点的坐标信息确定为所述备选坐标信息。
8.一种物品检测装置,其特征在于,包括:
拍摄模块,用于拍摄视野区域内的多个待测物品,得到原始图像;
目标检测模块,用于将所述原始图像输入预设的旋转目标检测模型,得到各待测物品对应的检测区域定位信息,其中,所述旋转目标检测模型是基于多个样本图像以及样本图像内各样本物品的检测区域标注信息,对待训练的旋转目标检测模型进行训练得到的,所述各样本物品中包括至少一个部分外轮廓位于对应样本图像的拍摄视野区域外的物品;
像素填充模块,用于若基于所述各待测物品对应的检测区域定位信息,确定所述原始图像中存在部分外轮廓位于所述视野区域外的待测物品,则对所述原始图像进行像素填充,得到目标图像,并从所述目标图像中分割出所述各待测物品的图像。
9.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序或指令;
处理器,用于执行所述存储器中的计算机程序或指令,使得如权利要求1-7任一所述的方法被执行。
10.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由处理器执行时,使得所述处理器能够执行如权利要求1-7任一所述的方法。
CN202310952434.0A 2023-07-31 2023-07-31 一种物品检测方法、装置、设备及存储介质 Pending CN117218633A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310952434.0A CN117218633A (zh) 2023-07-31 2023-07-31 一种物品检测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310952434.0A CN117218633A (zh) 2023-07-31 2023-07-31 一种物品检测方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN117218633A true CN117218633A (zh) 2023-12-12

Family

ID=89045011

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310952434.0A Pending CN117218633A (zh) 2023-07-31 2023-07-31 一种物品检测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117218633A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117522950A (zh) * 2023-12-28 2024-02-06 江西农业大学 一种基于机器视觉的植物茎杆生长的几何参数测量方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117522950A (zh) * 2023-12-28 2024-02-06 江西农业大学 一种基于机器视觉的植物茎杆生长的几何参数测量方法
CN117522950B (zh) * 2023-12-28 2024-03-12 江西农业大学 一种基于机器视觉的植物茎杆生长的几何参数测量方法

Similar Documents

Publication Publication Date Title
CN110378900B (zh) 产品缺陷的检测方法、装置及***
US10936911B2 (en) Logo detection
CN112950667B (zh) 一种视频标注方法、装置、设备及计算机可读存储介质
CN108475433B (zh) 用于大规模确定rgbd相机姿势的方法和***
US9727775B2 (en) Method and system of curved object recognition using image matching for image processing
CN105787923A (zh) 用于平面表面分割的视觉***和分析方法
CN111310826B (zh) 样本集的标注异常检测方法、装置及电子设备
CN113111844B (zh) 一种作业姿态评估方法、装置、本地终端及可读存储介质
CN110533654A (zh) 零部件的异常检测方法及装置
CN109934873B (zh) 标注图像获取方法、装置及设备
JP2011134012A (ja) 画像処理装置、その画像処理方法及びプログラム
CN113688846B (zh) 物体尺寸识别方法、可读存储介质及物体尺寸识别***
CN111461101A (zh) 工服标志的识别方法、装置、设备及存储介质
CN117218633A (zh) 一种物品检测方法、装置、设备及存储介质
JP2019158628A (ja) 検査装置、検査方法、及び検査プログラム
US8164633B2 (en) Calibration apparatus and method for imaging devices and computer program
CN112183361A (zh) 一种结合目标检测与动态差分的进球检测方法及***
CN113743378B (zh) 一种基于视频的火情监测方法和装置
CN111160450A (zh) 一种基于神经网络的果蔬称重方法及储存介质、装置
CN114078127A (zh) 物件的缺陷检测及计数方法、装置、设备和存储介质
CN114821274A (zh) 一种用于识别分合指示牌的状态的方法和设备
Żak et al. Local image features matching for real-time seabed tracking applications
CN117253022A (zh) 一种对象识别方法、装置及查验设备
CN116580026B (zh) 精密零部件外观缺陷自动光学检测方法、设备及存储介质
CN115272340B (zh) 工业产品缺陷检测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination