CN110659600A - 物体检测方法、装置及设备 - Google Patents
物体检测方法、装置及设备 Download PDFInfo
- Publication number
- CN110659600A CN110659600A CN201910885592.2A CN201910885592A CN110659600A CN 110659600 A CN110659600 A CN 110659600A CN 201910885592 A CN201910885592 A CN 201910885592A CN 110659600 A CN110659600 A CN 110659600A
- Authority
- CN
- China
- Prior art keywords
- overlapping area
- object detection
- candidate
- region
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请提出了一种物体检测方法、装置及设备,涉及计算机视觉技术领域,具体实现方案为:获取样本图像,根据样本图像和预设的处理参数生成候选区域,并从样本图像的标注区域中确定与候选区域交并比最大的第一标注区域,以及与候选区域交并比次大的第二标注区域;获取候选区域与第二标注区域的第一交叠面积、第一标注区域与第二标注区域的第二交叠面积,比较第一交叠面积和第二交叠面积的大小,根据比较结果确定损失值;调整处理参数直至损失值与预设的期望值满足预设条件,根据调整后的处理参数确定物体检测模型;将待检测图像输入至物体检测模型中进行处理,生成物体检测结果。由此,提高了物体检测的准确度。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及计算机视觉技术领域,提出一种物体检测方法、装置及设备。
背景技术
物体检测作为计算机视觉领域的一个重要研究方向,能够在图片、视频中分析物体的位置、类别,物体检测被广泛应用于安防监控、智慧零售、工业检测、互联网图片分析等领域。针对待检测物体相互之间重叠严重的密集场景,由于待检测物体间的重叠,物体检测的精度较低。
目前,针对密集场景的物体检测需要一种准确度更高的方案。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种物体检测方法,以提高物体检测的准确度。
本申请的第二个目的在于提出一种物体检测装置。
本申请的第三个目的在于提出一种电子设备。
本申请的第四个目的在于提出一种计算机可读存储介质。
本申请第一方面实施例提出了一种物体检测方法,包括:
获取样本图像,所述样本图像包括标注区域;
根据所述样本图像和预设的处理参数生成候选区域,并从所述标注区域中确定与所述候选区域交并比最大的第一标注区域,以及与所述候选区域交并比次大的第二标注区域;
获取所述候选区域与所述第二标注区域的第一交叠面积、所述第一标注区域与所述第二标注区域的第二交叠面积,比较所述第一交叠面积和所述第二交叠面积的大小,根据比较结果确定损失值;
调整所述处理参数直至所述损失值与预设的期望值满足预设条件,根据调整后的处理参数确定物体检测模型;
获取待检测图像,将所述待检测图像输入至所述物体检测模型中进行处理,生成物体检测结果。
另外,根据本申请上述实施例的物体检测方法还可以具有如下附加技术特征:
可选地,所述比较所述第一交叠面积和所述第二交叠面积的大小,根据比较结果确定损失值包括:若所述第一交叠面积小于等于所述第二交叠面积,则确定所述损失值为零。
可选地,所述比较所述第一交叠面积和所述第二交叠面积的大小,根据比较结果确定损失值包括:若所述第一交叠面积大于所述第二交叠面积,则确定所述损失值为所述第一交叠面积与所述第二交叠面积的差值。
可选地,所述将所述待检测图像输入至所述物体检测模型中进行处理,生成物体检测结果包括:根据所述待检测图像获取多个候选框,以及获取每个候选框的位置和置信度;根据所述候选框的位置确定所述候选框之间的重叠度,根据所述置信度和所述重叠度对所述候选框进行去重,将去重后的结果作为所述物体检测结果。
可选地,通过如下方式获取所述第一交叠面积和所述第二交叠面积,
其中,P为所述候选区域,G1为所述第一标注区域,G2为所述第二标注区域,IoG(P,G2)为所述第一交叠面积,IoG(G1,G2)为所述第二交叠面积。
本申请第二方面实施例提出了一种物体检测装置,包括:
获取模块,用于获取样本图像,所述样本图像包括标注区域;
生成模块,用于根据所述样本图像和预设的处理参数生成候选区域,并从所述标注区域中确定与所述候选区域交并比最大的第一标注区域,以及与所述候选区域交并比次大的第二标注区域;
确定模块,用于获取所述候选区域与所述第二标注区域的第一交叠面积、所述第一标注区域与所述第二标注区域的第二交叠面积,比较所述第一交叠面积和所述第二交叠面积的大小,根据比较结果确定损失值;
训练模块,用于调整所述处理参数直至所述损失值与预设的期望值满足预设条件,根据调整后的处理参数确定物体检测模型;
检测模块,用于获取待检测图像,将所述待检测图像输入至所述物体检测模型中进行处理,生成物体检测结果。
另外,根据本申请上述实施例的物体检测装置还可以具有如下附加技术特征:
可选地,所述确定模块具体用于:若所述第一交叠面积小于等于所述第二交叠面积,则确定所述损失值为零。
可选地,所述确定模块具体用于:若所述第一交叠面积大于所述第二交叠面积,则确定所述损失值为所述第一交叠面积与所述第二交叠面积的差值。
可选地,所述检测模块包括:获取单元,用于根据所述待检测图像获取多个候选框,以及获取每个候选框的位置和置信度;去重单元,用于根据所述候选框的位置确定所述候选框之间的重叠度,根据所述置信度和所述重叠度对所述候选框进行去重,将去重后的结果作为所述物体检测结果。
可选地,通过如下方式获取所述第一交叠面积和所述第二交叠面积,
其中,P为所述候选区域,G1为所述第一标注区域,G2为所述第二标注区域,IoG(P,G2)为所述第一交叠面积,IoG(G1,G2)为所述第二交叠面积。
本申请第三方面实施例提出了一种电子设备,包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面实施例所述的物体检测方法。
本申请第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如第一方面实施例所述的物体检测方法。
上述申请中的一个实施例具有如下优点或有益效果:由于采用了获取包括标注区域的样本图像,根据样本图像和预设的处理参数生成候选区域,并从标注区域中确定与候选区域交并比最大的第一标注区域,以及与候选区域交并比次大的第二标注区域。进而,获取候选区域与第二标注区域的第一交叠面积、第一标注区域与第二标注区域的第二交叠面积,比较第一交叠面积和第二交叠面积的大小,根据比较结果确定损失值。进一步,调整处理参数直至损失值与预设的期望值满足预设条件,根据调整后的处理参数确定物体检测模型。获取待检测图像,将待检测图像输入至物体检测模型中进行处理,生成物体检测结果。由此,解决了密集场景物体检测获取候选框的准确度有待提高的问题,获取的候选框位置更加准确,从而提高了物体检测的准确度。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请实施例所提供的一种物体检测方法的流程示意图;
图2为一种候选区域的示意图;
图3为另一种候选区域的示意图;
图4为本申请实施例所提供的另一种物体检测方法的流程示意图;
图5为本申请实施例所提供的一种物体检测装置的结构示意图;
图6为本申请实施例所提供的另一种物体检测装置的结构示意图;
图7示出了适于用来实现本申请实施例的示例性电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1为本申请实施例所提供的一种物体检测方法的流程示意图,如图1所示,该方法包括:
步骤101,获取样本图像。
本实施例中,在进行物体检测时可以获取样本图像,其中,样本图像包括标注区域。作为一种示例,待检测物体为车辆,可以获取包含车辆的样本图像,并将样本图像中车辆所在的区域作为标注区域。
其中,标注区域的形式可以包括中心坐标、宽、高。可以通过图像采集装置拍摄图像,并在拍摄的图像中进行标注以获取样本图像,也可以通过互联网相关标注平台获取样本图像,此处不作限制。
步骤102,根据样本图像和预设的处理参数生成候选区域,并从标注区域中确定与候选区域交并比最大的第一标注区域,以及与候选区域交并比次大的第二标注区域。
本实施例中,可以根据样本图像提取图像特征,根据预设的处理参数对提取的图像特征进行处理,生成一个或多个候选区域。例如,根据预设的处理参数对样本图像的图像特征进行处理,生成若干个候选区域的中心坐标、宽、高。其中,候选区域为样本图像中的区域,处理参数可以由技术人员根据需要预先设置。
其中,图像区域A与图像区域B的交并比表示A和B的交集部分的面积,与A和B的并集部分的面积的比值,即本实施例中,在获取候选区域P后,从标注区域G中确定与候选区域P交并比最大的第一标注区域G1,以及从标注区域G中确定与候选区域P交并比次大的第二标注区域G2,即
G1=argmax IoU(G,P).G∈G
G2=argmax IoU(G,P).G∈G\{G1}
下面以一个候选区域为例进行说明,作为一种示例,可以根据候选区域的中心坐标、宽、高,以及样本图像中各标注区域的中心坐标、宽、高,通过相关算法获取候选区域与各标注区域的交并比,进而将交并比最大的标注区域作为第一标注区域,交并比次大的标注区域作为第二标注区域。
步骤103,获取候选区域与第二标注区域的第一交叠面积、第一标注区域与第二标注区域的第二交叠面积,比较第一交叠面积和第二交叠面积的大小,根据比较结果确定损失值。
本实施例中,在确定候选区域以及第一标注区域、第二标注区域后,可以获取候选区域与第二标注区域的第一交叠面积、第一标注区域与第二标注区域的第二交叠面积,通过比较第一交叠面积和第二交叠面积的大小,根据比较结果确定损失值,以进一步根据损失值评估生成的候选区域。例如,可以根据候选区域的中心坐标、宽、高,以及第一标注区域和第二标注区域的中心坐标、宽、高,通过相关算法获取候选区域与第二标注区域的第一交叠面积、第一标注区域与第二标注区域的第二交叠面积。
其中,图像区域A与图像区域B的交叠面积可以表示,A和B的交集部分的面积,或者,A和B的交集部分的面积与B的面积的比值。下面针对第一交叠面积、第二交叠面积进行说明。作为一种示例,通过如下方式获取候选区域P与第二标注区域G2的第一交叠面积IoG(P,G2)、第一标注区域G1与第二标注区域G2的第二交叠面积IoG(G1,G2),其中,
本实施例中,通过比较第一交叠面积与第二交叠面积的大小,根据比较结果确定损失值。作为一种示例,若第一交叠面积小于等于第二交叠面积,则确定损失值为零。作为另一种示例,若第一交叠面积大于第二交叠面积,则确定损失值为第一交叠面积与第二交叠面积的差值。即,损失值=max(0,第一交叠面积-第二交叠面积)。
步骤104,调整处理参数直至损失值与预设的期望值满足预设条件,根据调整后的处理参数确定物体检测模型。
本实施例中,可以判断损失值是否与预设的期望值满足预设条件,若满足预设条件,则根据当前的处理参数确定物体检测模型;若不满足预设条件,则调整处理参数并重新获取损失值,判断新获取的损失值是否与期望值满足预设条件,重复上述步骤直至损失值与期望值满足预设条件。
作为一种示例,预设的期望值为零,若确定的损失值与该期望值一致,判断满足预设条件,最终使得候选区域对应的第一交叠面积小于等于第二交叠面积时,确定满足预设条件,根据当前处理参数确定物体检测模型。若确定的损失值与该期望值不一致,则通过反向传播的方式调整处理参数,直至损失值与预设的期望值满足预设条件,根据调整后的处理参数确定物体检测模型。
可选地,在确定物体检测模型后,可以重新获取样本图像并重复上述步骤,经过预设次数后最终确定物体检测模型。
步骤105,获取待检测图像,将待检测图像输入至物体检测模型中进行处理,生成物体检测结果。
本实施例中,在确定物体检测模型后,可以根据该物体检测模型对待检测图像进行物体检测。作为一种可能的实现方式,获取待检测图像,根据待检测图像获取多个候选框,以及获取每个候选框的位置和置信度。进而,根据候选框的位置确定各候选框之间的重叠度,根据置信度和重叠度对候选框进行去重,将去重后的结果作为物体检测结果。
可以理解的是,在物体重叠较多的密集场景进行物体检测时,相关技术中在确定候选框时通常希望获取的候选框与交并比次大的标注框之间的交叠面积趋向于零,然而该方案在进行物体检测时,获取的候选框不够准确,比如参照图2包括有重叠的两个标注区域,虚线区域为候选区域,对于候选区域2其损失值为零,对于更准确的候选区域1其损失值不为零,导致物体检测模型获取的候选框与实际区域的位置相比准确度低,从而可能错误的抑制重叠较大的物体,导致物体检测的准确度低。本实施例中通过比较第一交叠面积与第二交叠面积的大小,根据比较结果确定损失值,比如参照图3,包括有重叠的两个标注区域,虚线区域为候选区域,对于更准确的候选区域1其损失值为零,对于候选区域2其损失值不为零,进而根据该损失值调整处理参数,使得物体检测模型获取的候选框位置更准确,从而提高物体检测的准确度。
本申请实施例的物体检测方法,通过获取包括标注区域的样本图像,根据样本图像和预设的处理参数生成候选区域,并从标注区域中确定与候选区域交并比最大的第一标注区域,以及与候选区域交并比次大的第二标注区域。进而,获取候选区域与第二标注区域的第一交叠面积、第一标注区域与第二标注区域的第二交叠面积,比较第一交叠面积和第二交叠面积的大小,根据比较结果确定损失值。进一步,调整处理参数直至损失值与预设的期望值满足预设条件,根据调整后的处理参数确定物体检测模型。获取待检测图像,将待检测图像输入至物体检测模型中进行处理,生成物体检测结果。由此,获取的候选框位置更加准确,解决了密集场景物体检测获取候选框的准确度有待提高的问题,从而提高了物体检测的准确度。
图4为本申请实施例所提供的另一种物体检测方法的流程示意图,如图4所示,该方法包括:
步骤401,获取样本图像。
步骤402,根据样本图像和预设的处理参数生成候选区域,并从标注区域中确定与候选区域交并比最大的第一标注区域,以及与候选区域交并比次大的第二标注区域。
其中,样本图像包括标注区域。前述对步骤101、步骤102的解释说明同样适用于步骤401、步骤402,此处不再赘述。
步骤403,获取候选区域与第二标注区域的第一交叠面积、第一标注区域与第二标注区域的第二交叠面积,比较第一交叠面积和第二交叠面积的大小,根据比较结果确定第一损失值,根据第一损失值以及第二损失值、第三损失值确定目标损失值。
作为一种可能的实现方式,在比较第一交叠面积和第二交叠面积的大小后,还可以通过预设函数对比较结果进行优化处理,获取第一损失值。例如,可以通过Smoothln函数对比较结果进行优化,获取第一损失值,即
第一损失值L=Smoothln(max(0,IoG(P,G2)-IoG(G1,G2)))
其中,
由此,可以使得曲线更为平滑,提高模型训练效果。
在本申请的一个实施例中,目标损失值为第一损失值、第二损失值、第三损失值的加权平均。其中,第二损失值用于表示候选区域是否为正样本,例如根据候选区域与各标注区域的交并比确定第二损失值。第三损失值用于表示候选区域是否靠近第一标注区域。需要说明的是,第二损失值、第三损失值的具体实现方式可以由本领域技术人员根据相关技术实现,此处不作限制。
步骤404,调整处理参数直至目标损失值与预设的期望值满足预设条件,根据调整后的处理参数确定物体检测模型。
本实施例中,可以判断目标损失值是否与预设的期望值满足预设条件,若满足预设条件,则根据当前的处理参数确定物体检测模型;若不满足预设条件,则调整处理参数并重新获取目标损失值,判断新获取的目标损失值是否与期望值满足预设条件,重复上述步骤直至目标损失值与期望值满足预设条件。
步骤405,根据待检测图像获取多个候选框,以及获取每个候选框的位置和置信度。
本实施例中,获取待检测图像,根据确定的物体检测模型在待检测图像中提取候选框,并获取每个候选框的位置和置信度。其中,候选框的位置包括中心坐标、宽、高,置信度用于表示待检测图像中该候选框对应的物体是待检测物体的概率。
步骤406,根据候选框的位置确定候选框之间的重叠度,根据置信度和重叠度对候选框进行去重,将去重后的结果作为物体检测结果。
本实施例中,可以根据各候选框的位置,确定两两候选框之间的重叠度。进而,确定置信度最高的候选框,根据该候选框与其他候选框的重叠度,判断重叠度是否大于预设阈值,若是,则去重;若否,则保留。进一步,从保留的候选框中确定置信度最高的候选框,重复上述去重步骤。最终将去重后的结果作为物体检测结果。可选地,可以根据候选框之间的交并比确定重叠度。
作为一种示例,根据待检测图像获取候选框1-5,其中,候选框1置信度最高,分别判断候选框2-5与候选框1的重叠度,获知候选框2和3与候选框1的重叠度大于预设阈值,则去除候选框2和3,保留候选框4和5。进而,候选框5的置信度最高,且候选框4与候选框5重叠度大于预设阈值,则去除候选框4,将候选框1和5作为物体检测结果。
本申请实施例的物体检测方法,在进行物体检测时获取的候选框位置更加准确,解决了密集场景物体检测获取候选框的准确度有待提高的问题,从而提高了物体检测的准确度。
为了实现上述实施例,本申请还提出一种物体检测装置。
图5为本申请实施例所提供的一种物体检测装置500的结构示意图,如图5所示,该物体检测装置500包括:获取模块10,生成模块20,确定模块30,训练模块40,检测模块50。
其中,获取模块10,用于获取样本图像,样本图像包括标注区域。
生成模块20,用于根据样本图像和预设的处理参数生成候选区域,并从标注区域中确定与候选区域交并比最大的第一标注区域,以及与候选区域交并比次大的第二标注区域。
确定模块30,用于获取候选区域与第二标注区域的第一交叠面积、第一标注区域与第二标注区域的第二交叠面积,比较第一交叠面积和第二交叠面积的大小,根据比较结果确定损失值。
训练模块40,用于调整处理参数直至损失值与预设的期望值满足预设条件,根据调整后的处理参数确定物体检测模型。
检测模块50,用于获取待检测图像,将待检测图像输入至物体检测模型中进行处理,生成物体检测结果。
在图5的基础上,图6所示的物体检测装置500中,检测模块50包括:获取单元51,去重单元52。
其中,获取单元51,用于根据待检测图像获取多个候选框,以及获取每个候选框的位置和置信度。
去重单元52,用于根据候选框的位置确定候选框之间的重叠度,根据置信度和重叠度对候选框进行去重,将去重后的结果作为物体检测结果。
可选地,确定模块30具体用于:若第一交叠面积小于等于第二交叠面积,则确定损失值为零。
可选地,确定模块30具体用于:若第一交叠面积大于第二交叠面积,则确定损失值为第一交叠面积与第二交叠面积的差值。
可选地,通过如下方式获取第一交叠面积和第二交叠面积,
其中,P为候选区域,G1为第一标注区域,G2为第二标注区域,IoG(P,G2)为第一交叠面积,IoG(G1,G2)为第二交叠面积。
需要说明的是,前述实施例对物体检测方法的解释说明同样适用于本实施例的物体检测装置,此处不再赘述。
本申请实施例的物体检测装置,通过获取包括标注区域的样本图像,根据样本图像和预设的处理参数生成候选区域,并从标注区域中确定与候选区域交并比最大的第一标注区域,以及与候选区域交并比次大的第二标注区域。进而,获取候选区域与第二标注区域的第一交叠面积、第一标注区域与第二标注区域的第二交叠面积,比较第一交叠面积和第二交叠面积的大小,根据比较结果确定损失值。进一步,调整处理参数直至损失值与预设的期望值满足预设条件,根据调整后的处理参数确定物体检测模型。获取待检测图像,将待检测图像输入至物体检测模型中进行处理,生成物体检测结果。由此,获取的候选框位置更加准确,解决了密集场景物体检测获取候选框的准确度有待提高的问题,从而提高了物体检测的准确度。
为了实现上述实施例,本申请还提出一种计算机程序产品,当计算机程序产品中的指令被处理器执行时实现如前述任一实施例所述的物体检测方法。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图7所示,是根据本申请实施例的物体检测方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,该电子设备包括:一个或多个处理器701、存储器702,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器***)。图7中以一个处理器701为例。
存储器702即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的物体检测方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的物体检测方法。
存储器702作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的物体检测方法对应的程序指令/模块(例如,附图5所示的获取模块10,生成模块20,确定模块30,训练模块40,检测模块50)。处理器701通过运行存储在存储器702中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的物体检测方法。
存储器702可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器702可选包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
物体检测方法的电子设备还可以包括:输入装置703和输出装置704。处理器701、存储器702、输入装置703和输出装置704可以通过总线或者其他方式连接,图7中以通过总线连接为例。
输入装置703可接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,获取的候选框位置更加准确,解决了密集场景物体检测获取候选框的准确度有待提高的问题,从而提高了物体检测的准确度。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (12)
1.一种物体检测方法,其特征在于,包括:
获取样本图像,所述样本图像包括标注区域;
根据所述样本图像和预设的处理参数生成候选区域,并从所述标注区域中确定与所述候选区域交并比最大的第一标注区域,以及与所述候选区域交并比次大的第二标注区域;
获取所述候选区域与所述第二标注区域的第一交叠面积、所述第一标注区域与所述第二标注区域的第二交叠面积,比较所述第一交叠面积和所述第二交叠面积的大小,根据比较结果确定损失值;
调整所述处理参数直至所述损失值与预设的期望值满足预设条件,根据调整后的处理参数确定物体检测模型;
获取待检测图像,将所述待检测图像输入至所述物体检测模型中进行处理,生成物体检测结果。
2.如权利要求1所述的方法,其特征在于,所述比较所述第一交叠面积和所述第二交叠面积的大小,根据比较结果确定损失值包括:
若所述第一交叠面积小于等于所述第二交叠面积,则确定所述损失值为零。
3.如权利要求1所述的方法,其特征在于,所述比较所述第一交叠面积和所述第二交叠面积的大小,根据比较结果确定损失值包括:
若所述第一交叠面积大于所述第二交叠面积,则确定所述损失值为所述第一交叠面积与所述第二交叠面积的差值。
4.如权利要求1所述的方法,其特征在于,所述将所述待检测图像输入至所述物体检测模型中进行处理,生成物体检测结果包括:
根据所述待检测图像获取多个候选框,以及获取每个候选框的位置和置信度;
根据所述候选框的位置确定所述候选框之间的重叠度,根据所述置信度和所述重叠度对所述候选框进行去重,将去重后的结果作为所述物体检测结果。
6.一种物体检测装置,其特征在于,包括:
获取模块,用于获取样本图像,所述样本图像包括标注区域;
生成模块,用于根据所述样本图像和预设的处理参数生成候选区域,并从所述标注区域中确定与所述候选区域交并比最大的第一标注区域,以及与所述候选区域交并比次大的第二标注区域;
确定模块,用于获取所述候选区域与所述第二标注区域的第一交叠面积、所述第一标注区域与所述第二标注区域的第二交叠面积,比较所述第一交叠面积和所述第二交叠面积的大小,根据比较结果确定损失值;
训练模块,用于调整所述处理参数直至所述损失值与预设的期望值满足预设条件,根据调整后的处理参数确定物体检测模型;
检测模块,用于获取待检测图像,将所述待检测图像输入至所述物体检测模型中进行处理,生成物体检测结果。
7.如权利要求6所述的装置,其特征在于,所述确定模块具体用于:
若所述第一交叠面积小于等于所述第二交叠面积,则确定所述损失值为零。
8.如权利要求6所述的装置,其特征在于,所述确定模块具体用于:
若所述第一交叠面积大于所述第二交叠面积,则确定所述损失值为所述第一交叠面积与所述第二交叠面积的差值。
9.如权利要求6所述的装置,其特征在于,所述检测模块包括:
获取单元,用于根据所述待检测图像获取多个候选框,以及获取每个候选框的位置和置信度;
去重单元,用于根据所述候选框的位置确定所述候选框之间的重叠度,根据所述置信度和所述重叠度对所述候选框进行去重,将去重后的结果作为所述物体检测结果。
11.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的物体检测方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的物体检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910885592.2A CN110659600B (zh) | 2019-09-19 | 2019-09-19 | 物体检测方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910885592.2A CN110659600B (zh) | 2019-09-19 | 2019-09-19 | 物体检测方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110659600A true CN110659600A (zh) | 2020-01-07 |
CN110659600B CN110659600B (zh) | 2022-04-29 |
Family
ID=69037213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910885592.2A Active CN110659600B (zh) | 2019-09-19 | 2019-09-19 | 物体检测方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110659600B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111652114A (zh) * | 2020-05-29 | 2020-09-11 | 深圳市商汤科技有限公司 | 一种对象检测方法、装置、电子设备及存储介质 |
CN111696095A (zh) * | 2020-06-12 | 2020-09-22 | 北京百度网讯科技有限公司 | 用于检测物体表面缺陷的方法及装置 |
CN112614117A (zh) * | 2020-12-28 | 2021-04-06 | 广州绿怡信息科技有限公司 | 设备区域提取模型训练方法、设备区域提取方法及装置 |
CN112733860A (zh) * | 2021-01-27 | 2021-04-30 | 上海微亿智造科技有限公司 | 一种提升二分类分割网准确率和召回率的方法及*** |
CN113392903A (zh) * | 2021-06-15 | 2021-09-14 | 上海华兴数字科技有限公司 | 一种工地区域的识别方法、***及装置 |
CN113420682A (zh) * | 2021-06-28 | 2021-09-21 | 阿波罗智联(北京)科技有限公司 | 车路协同中目标检测方法、装置和路侧设备 |
CN115035186A (zh) * | 2021-12-03 | 2022-09-09 | 荣耀终端有限公司 | 目标对象标记方法和终端设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106355188A (zh) * | 2015-07-13 | 2017-01-25 | 阿里巴巴集团控股有限公司 | 图像检测方法及装置 |
US20180181881A1 (en) * | 2016-12-22 | 2018-06-28 | Samsung Electronics Co., Ltd. | System and method for training deep learning classification networks |
CN109344762A (zh) * | 2018-09-26 | 2019-02-15 | 北京字节跳动网络技术有限公司 | 图像处理方法和装置 |
CN109409517A (zh) * | 2018-09-30 | 2019-03-01 | 北京字节跳动网络技术有限公司 | 物体检测网络的训练方法和装置 |
CN109670452A (zh) * | 2018-12-20 | 2019-04-23 | 北京旷视科技有限公司 | 人脸检测方法、装置、电子设备和人脸检测模型 |
CN109829501A (zh) * | 2019-02-01 | 2019-05-31 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN110084253A (zh) * | 2019-05-05 | 2019-08-02 | 厦门美图之家科技有限公司 | 一种生成物体检测模型的方法 |
CN110210304A (zh) * | 2019-04-29 | 2019-09-06 | 北京百度网讯科技有限公司 | 用于目标检测和跟踪的方法及*** |
-
2019
- 2019-09-19 CN CN201910885592.2A patent/CN110659600B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106355188A (zh) * | 2015-07-13 | 2017-01-25 | 阿里巴巴集团控股有限公司 | 图像检测方法及装置 |
US20180181881A1 (en) * | 2016-12-22 | 2018-06-28 | Samsung Electronics Co., Ltd. | System and method for training deep learning classification networks |
CN109344762A (zh) * | 2018-09-26 | 2019-02-15 | 北京字节跳动网络技术有限公司 | 图像处理方法和装置 |
CN109409517A (zh) * | 2018-09-30 | 2019-03-01 | 北京字节跳动网络技术有限公司 | 物体检测网络的训练方法和装置 |
CN109670452A (zh) * | 2018-12-20 | 2019-04-23 | 北京旷视科技有限公司 | 人脸检测方法、装置、电子设备和人脸检测模型 |
CN109829501A (zh) * | 2019-02-01 | 2019-05-31 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN110210304A (zh) * | 2019-04-29 | 2019-09-06 | 北京百度网讯科技有限公司 | 用于目标检测和跟踪的方法及*** |
CN110084253A (zh) * | 2019-05-05 | 2019-08-02 | 厦门美图之家科技有限公司 | 一种生成物体检测模型的方法 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111652114A (zh) * | 2020-05-29 | 2020-09-11 | 深圳市商汤科技有限公司 | 一种对象检测方法、装置、电子设备及存储介质 |
CN111652114B (zh) * | 2020-05-29 | 2023-08-25 | 深圳市商汤科技有限公司 | 一种对象检测方法、装置、电子设备及存储介质 |
WO2021238185A1 (zh) * | 2020-05-29 | 2021-12-02 | 深圳市商汤科技有限公司 | 对象检测方法、装置、电子设备、存储介质和程序 |
CN111696095A (zh) * | 2020-06-12 | 2020-09-22 | 北京百度网讯科技有限公司 | 用于检测物体表面缺陷的方法及装置 |
CN111696095B (zh) * | 2020-06-12 | 2023-08-08 | 北京百度网讯科技有限公司 | 用于检测物体表面缺陷的方法及装置 |
CN112614117A (zh) * | 2020-12-28 | 2021-04-06 | 广州绿怡信息科技有限公司 | 设备区域提取模型训练方法、设备区域提取方法及装置 |
CN112733860A (zh) * | 2021-01-27 | 2021-04-30 | 上海微亿智造科技有限公司 | 一种提升二分类分割网准确率和召回率的方法及*** |
CN112733860B (zh) * | 2021-01-27 | 2021-09-10 | 上海微亿智造科技有限公司 | 用于二分类分割网络难样本挖掘的方法及*** |
WO2022262595A1 (zh) * | 2021-06-15 | 2022-12-22 | 上海华兴数字科技有限公司 | 工地区域的识别方法、***、装置和计算机可读存储介质 |
CN113392903A (zh) * | 2021-06-15 | 2021-09-14 | 上海华兴数字科技有限公司 | 一种工地区域的识别方法、***及装置 |
CN113420682A (zh) * | 2021-06-28 | 2021-09-21 | 阿波罗智联(北京)科技有限公司 | 车路协同中目标检测方法、装置和路侧设备 |
CN113420682B (zh) * | 2021-06-28 | 2023-08-15 | 阿波罗智联(北京)科技有限公司 | 车路协同中目标检测方法、装置和路侧设备 |
CN115035186A (zh) * | 2021-12-03 | 2022-09-09 | 荣耀终端有限公司 | 目标对象标记方法和终端设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110659600B (zh) | 2022-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110659600B (zh) | 物体检测方法、装置及设备 | |
US20220383535A1 (en) | Object Tracking Method and Device, Electronic Device, and Computer-Readable Storage Medium | |
CN111722245B (zh) | 定位方法、定位装置和电子设备 | |
CN112529073A (zh) | 模型训练方法、姿态估计方法、装置及电子设备 | |
CN111553282A (zh) | 用于检测车辆的方法和装置 | |
CN110675635B (zh) | 相机外参的获取方法、装置、电子设备及存储介质 | |
CN112270745B (zh) | 一种图像生成方法、装置、设备以及存储介质 | |
CN111275011A (zh) | 移动红绿灯检测方法、装置、电子设备和存储介质 | |
CN111462174A (zh) | 多目标跟踪方法、装置以及电子设备 | |
CN111626263B (zh) | 一种视频感兴趣区域检测方法、装置、设备及介质 | |
CN111275827A (zh) | 基于边缘的增强现实三维跟踪注册方法、装置和电子设备 | |
CN111539347A (zh) | 用于检测目标的方法和装置 | |
CN111601013B (zh) | 用于处理视频帧的方法和装置 | |
CN111222579A (zh) | 跨相机的障碍物关联方法、装置、设备、电子***及介质 | |
CN111783639A (zh) | 图像检测方法、装置、电子设备及可读存储介质 | |
CN112561879A (zh) | 模糊度评价模型训练方法、图像模糊度评价方法及装置 | |
CN111768485A (zh) | 三维图像的关键点标注方法、装置、电子设备及存储介质 | |
CN112241716A (zh) | 训练样本的生成方法和装置 | |
CN111191619A (zh) | 车道线虚线段的检测方法、装置、设备和可读存储介质 | |
CN111462179A (zh) | 三维物体跟踪方法、装置及电子设备 | |
CN110717474A (zh) | 目标关联计算方法、装置、设备和介质 | |
CN110798681B (zh) | 成像设备的监测方法、装置和计算机设备 | |
CN112270303A (zh) | 图像识别方法、装置以及电子设备 | |
CN112560772A (zh) | 人脸的识别方法、装置、设备及存储介质 | |
CN111696134A (zh) | 一种目标检测方法、装置以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |