CN114627189A - 从多幅图像中获取目标位置的方法、装置、设备和介质 - Google Patents

从多幅图像中获取目标位置的方法、装置、设备和介质 Download PDF

Info

Publication number
CN114627189A
CN114627189A CN202011443716.0A CN202011443716A CN114627189A CN 114627189 A CN114627189 A CN 114627189A CN 202011443716 A CN202011443716 A CN 202011443716A CN 114627189 A CN114627189 A CN 114627189A
Authority
CN
China
Prior art keywords
image
original image
detected
target
target area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011443716.0A
Other languages
English (en)
Inventor
蔡辉
张富良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhihuichuang Technology Co ltd
Original Assignee
Shenzhen Zhihuichuang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zhihuichuang Technology Co ltd filed Critical Shenzhen Zhihuichuang Technology Co ltd
Priority to CN202011443716.0A priority Critical patent/CN114627189A/zh
Publication of CN114627189A publication Critical patent/CN114627189A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/77Determining position or orientation of objects or cameras using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种从多幅图像中获取目标位置的方法,包括:在预定时间内,基于时序获取运动的目标在不同时间的多幅原始图像,用于获取包含目标位置的多个目标区;从每幅原始图像中获取用于检测对应的目标区的待检测图像,生成多幅待检测图像;其中,每幅待检测图像根据前一幅待检测图像对应的目标区在对应的原始图像中的存在状态获取;根据待检测图像获取每幅原始图像对应的目标区;根据目标区获取每幅原始图像中目标的位置,生成多个目标位置;根据多个目标位置形成目标运动的轨迹。在前述基础上,本申请提供了从多幅图像中获取目标位置的装置、设备和介质。本申请至少解决了从多幅图像中获取目标轨迹的过程中,如何在保证目标清晰度的前提下,减少在图像中检测目标位置时所耗运算量的问题。

Description

从多幅图像中获取目标位置的方法、装置、设备和介质
技术领域
本发明涉及图像处理技术领域。更具体地说,本发明涉及从多幅图像中获取目标位置的方法、装置、电子设备和存储介质。
背景技术
在一系列连续排列的多幅原始图像(这些多幅原始图像可以是从视频中获取连续的多帧图像,每一帧图像相当于一幅原始图像)中获取目标轨迹,需要计算出目标在每幅原始图像中的位置,这种位置可以通过目标在每幅原始图像中的坐标进行表达。传统技术在计算目标位置时,通常是对每幅原始图像的整体进行坐标分析(即对每幅原始图像进行全尺寸分析处理),以确定目标在对应图像中的位置,这难免带来了一个严重的问题,即:在获取目标位置时,会产生大量的数据运算量。引起该问题的一个重要原因在于,通常情况下目标仅仅存在于图像中一块很小的区域中,除此之外的其他区域对于目标位置的计算没有帮助,因此属于无效区域。正是由于这些无效区域的存在,使得计算目标位置时需要处理的图像数据太大,增加了大量的对于获取目标位置毫无贡献的无效运算量,同时这些无效区域所包含的图像数据也会增加误检测的概率。
为了解决上述运算量太大的问题,该领域给出的一种做法是将原始图像进行缩小处理,再继续计算目标在对应图像中的位置。由此又会导致新的缺陷,即:图像缩小致使目标清晰度严重降低,进行降低检测准确率,此外,对图片进行缩小处理,对于消除无效区域带来的误检测问题,也无济于事。
发明内容
本发明的一个目的在于,至少解决上述问题并提供相应地有益效果。
本发明的另一个目的是,提供一种从多幅图像中获取目标轨迹的方法、装置、电子设备和存储介质,至少解决了从多幅图像中获取目标轨迹的过程中,如何在保证目标清晰度的前提下,减少在图像中检测目标位置时所耗运算量的问题,同时还可以解决现有技术中无效区域带来的误检测问题。
本发明还有一个目的在于,在前述基础上,本申请提供了从多幅图像中获取目标位置的装置、设备和介质。
本发明主要通过以下诸方面中的技术方案实现:
<本发明的第一方面>
第一方面至少提供了一种从多幅图像中获取目标位置的方法法,包括:
基于时序获取运动的目标在不同时间的多幅原始图像;
根据每幅原始图像的前一幅原始图像中的目标区存在状态获取与每幅原始图像对应的目标区预测状态;
根据每幅原始图像的目标区预测状态获取每幅原始图像的待检测图像;
根据每幅原始图像的待检测图像获取与每幅原始图像对应的目标区;
根据每幅原始图像的目标区获取每幅原始图像中的目标位置,生成与多幅原始图像对应的多个目标位置;
根据多个目标位置形成目标运动的轨迹。
在一些技术方案中,所述方法还包括:设置基准尺寸,每幅原始图像的尺寸与所述基准尺寸的大小相等。
在一些技术方案中,所述根据每幅原始图像的目标区预测状态获取每幅原始图像的待检测图像包括:
当待获取待检测图像的原始图像的目标区预测状态为目标区不存在时;
将待获取待检测图像的原始图像进行第一裁剪,得到第一裁剪图像;
根据所述第一裁剪图像获取待检测图像。
在一些技术方案中,所述根根据每幅原始图像的目标区预测状态获取每幅原始图像的待检测图像还包括:
当待获取待检测图像的原始图像的目标区预测状态为目标区存在时;
根据待获取待检测图像的原始图像的前一幅原始图像的目标区对待获取待检测图像的原始图像进行第二裁剪,得到第二裁剪图像;
根据所述第二裁剪图像获取待检测图像。
在一些技术方案中,所述根据待获取待检测图像的原始图像的前一幅原始图像的目标区对待获取待检测图像的原始图像进行第二裁剪,得到第二裁剪图像包括:
将待获取待检测图像的原始图像的前一幅原始图像的目标区进行扩大处理,得到第一扩大区,根据所述第一扩大区的尺寸参数与位置参数对待获取待检测图像的原始图像进行第二裁剪,得到第二裁剪图像。
在一些技术方案中,所述根据所述第二裁剪图像获取待检测图像包括:将所述第二裁剪图像按照预定标准缩小,得到待检测图像。
在一些技术方案中,所述根据每幅原始图像的目标区预测状态获取每幅原始图像的待检测图像还包括:
当待获取待检测图像的原始图像的目标区预测状态为目标区丢失时,重新获取待检测图像的原始图像的目标区预测状态;
在待获取待检测图像的原始图像的目标区预测状态更新为目标区存在时,继续获取所述待获取待检测图像。
<本发明的第二方面>
第二方面提供了一种从多幅图像中获取目标位置的装置,所述装置包括:
原始图像获取模块,用于基于时序获取运动的目标在不同时间的多幅原始图像;
目标区预测状态获取模块,用于根据每幅原始图像的前一幅原始图像中的目标区存在状态获取与每幅原始图像对应的目标区预测状态;
待检测图像获取模块,用于根据每幅原始图像的目标区预测状态获取每幅原始图像的待检测图像;
目标区获取模块,用于根据每幅原始图像的待检测图像获取与每幅原始图像对应的目标区;
位置获取模块,用于根据每幅原始图像的目标区获取每幅原始图像中的目标位置,生成与多幅原始图像对应的多个目标位置;
轨迹生成模块,用于根据多个目标位置形成目标运动的轨迹。
<本发明的第三方面>
第三方面提供了一种电子设备,用于执行第一方面所述的方法。
<本发明的第四方面>
第四方面提供了一种存储介质,所述存储介质存储有计算机指令,所述计算机指令用于执行第一方面所述的方法。
本发明的实施例的技术效果至少包括:
本申请中,通过先获取每幅原始图像的前一幅原始图像中的目标区存在状态确定紧接在该前一幅原始图像之后的后一幅原始图像中的目标区预测状态,再根据后一幅原始图像中的目标区预测状态对该后一幅原始图像进行相应的处理,便能够更加便捷、高效地获取到与每幅原始图像对应的待检测图像,使得该待检测图像包含目标区的概率更大,从而也就可以更容易获取到每幅原始图像中的目标区,计算出目标在每幅原始图像中的位置,形成目标运动的轨迹。此外,由于待检测图像包含目标区的概率更大,所以可以更好地消除现有技术中无效区域带来的误检测问题。
综上,本申请的方法,由于提升了待检测图像包含目标区的概率,所以不再需要将每幅原始图像进行全尺寸的整体分析与计算,只需要结合前一幅原始图像的目标区信息,对需要获取目标区的后一幅原始图像进行简化处理,就能获取到该后一幅原始图像(这里的该幅原始图像指的是前述的需要获取目标区的后一幅原始图像)中的目标区,减少了在图像中检测目标位置时所耗的运算量。此外,同样重要的是,本申请中由于不再需要将每幅原始图像进行全尺寸的整体分析与计算,所以也就避免了应用现有技术中将每幅原始图像进行大幅缩小处理以降低运算量的目标位置获取手段,由此保证了待检测图像中目标的清晰度。因此,本申请第一方面所述的方法解决了在保证目标清晰度的前提下,减少在图像中检测目标位置时所耗运算量的问题。同时可以更好地消除现有技术中无效区域带来的误检测问题。
除非另有定义,否则,本文中使用的所有技术和科学术语与本发明所属领域的普通技术人员的通常理解具有相同的含义。
在上述各方面中所提及的关于本发明的各种特征和实施方式,视情况而定,在适当变通的情况下可以应用于其他方面。因此,一个方面中的具体特征可以与其他方面中的具体特征适当地行组合。
本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。
附图说明
图1为本发明的方法在一些实施例中的一个流程示意图;
图2为本发明的方法在一些实施例中的另一个原理示意图;
图3为本发明的装置在一些实施例中的一个原理示意图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
本申请实施例中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。还需要说明的是,本申请中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。此外,术语“包括”和“设置有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
除以上所述外,仍需要强调的是,在本文中提及“实施例”或其变形“实施方式”等术语时,意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
<本申请的第一方面>
如图1所示,第一方面提供了一种从多幅图像中获取目标位置的方法,所述方法包括以下的步骤S100至S500:
S100、基于时序获取运动的目标在不同时间的多幅原始图像。多幅原始图像用于获取包含目标位置的多个目标区。需要说明的是,“目标区”主要指的是每幅原始图像中包含有目标的区域,在一些实施方式中,所述目标区与目标的大小相等。由于本申请的多幅原始图像反映的是运动的目标在不同时间的位置状态,为了能够获取到在多幅原始图像中目标的连续运动轨迹,需要目标在相邻两幅图像中的位置变化不大,这就要对多幅原始图像的获取时间进行相应的设置。例如在一些实施方式中,在获取所述多幅原始图像时,前后相邻的两幅原始图像之间的间隔时间小于预定时间,所述预定时间优选为30秒,更优选为5秒,进一步地为0.01秒。又例如在一些实施方式中,所述多幅原始图像可以从拍摄的目标运动视频中获取,具体地,所述多幅原始图像为从目标运动视频中提取的基于时序的多帧图像,能够容易理解的是,在这种多帧图像中,前后两帧图像间隔的时间一般不会太长,否则后一帧图像中就容易丢失目标。
S200、根据每幅原始图像的前一幅原始图像中的目标区存在状态获取与每幅原始图像对应的目标区预测状态。由此,根据每幅原始图像对应的目标区预测状态即可生成与多幅原始图像对应的多个目标区预测状态。需要说明的是,按照多幅原始图像的排列顺序依次获取与每幅原始图像对应的目标区预测状态。显然可以理解的是,第一幅原始图像由于没有在先原始图像(也就是说没有对应的前一幅原始图像),所以,其对应的目标区预测状态为目标区不存在。还需要说明的是,“与每幅原始图像对应的目标区预测状态”与“每幅原始图像的前一幅原始图像中的目标区存在状态”相同,例如,在包含第一至第N幅原始图像的多幅原始图像中,第N幅原始图像的目标区预测状态与第N-1幅原始图像中的目标区存在状态相同;更具体来说,如果第N-1幅原始图像中的目标区存在状态为目标区存在,那么,第N幅原始图像的目标区预测状态也同样为目标区存在。
S300、按照顺序依次根据每幅原始图像的目标区预测状态获取每幅原始图像的待检测图像。由此,根据每幅原始图像的待检测图像即可生成与多幅原始图像对应的多幅待检测图像。需要说明的是,按照多幅原始图像的排列顺序依次获取每幅原始图像的待检测图像。还需要说明的是,每幅原始图像对应一幅待检测图像,并且该待检测图像是从对应的原始图像中获取的。
S400、根据每幅原始图像的待检测图像获取与每幅原始图像对应的目标区,生成与多幅原始图像对应的多个目标区。需要说明的是,每幅原始图像中的目标区是从与其对应的待检测图像中获取的。在待检测图像获取对应的原始图像中的目标区,可以通过目标检测模块实现,具体说来,可以将待检测图像输入目标检测模块中进行目标区查询,即能够获取到目标区;目标检测模块可以由现有技术中的目标检测算法实现,目标检测算法可以是Faster R-CNN、SSD、YOLO、libfacedetection、opencv、Android libneven等算法中的任意一种。
S500、根据每幅原始图像的目标区获取每幅原始图像中的目标位置。由此,便可以生成与多幅原始图像对应的多个目标位置,用于形成目标运动的轨迹;关于步骤S500中“生成多个目标位置”,需要说明的是,多个目标位置的形成是建立在多幅原始图像的基础上实现的,容易理解的是,每幅原始图像中都存在一个对应的目标位置,因此在获取每幅原始图像中目标的位置后,便可以生成多个目标位置。
由上可知,在本申请的第一方面所述的方法中,在获取某一幅原始图像中的待检测图像时,根据该幅原始图像(即前述的待获取待检测图像的原始图像)的前一幅原始图像中目标的存在状态,获取该幅原始图像的待检测图像;应用这种方法获取待检测图像时,建立起了该幅原始图像与前一幅原始图像之间的关系,更重要的是这种关系是在目标区存在状态基础上构建的。由此使得,每幅原始图像的目标区与其前一幅原始图像中的目标区相关联。
譬如说,在第一幅至N幅原始图像组成的多幅原始图像中,第N幅原始图像的待检测图像实际上是根据第N幅原始图像的目标区预测状态获取的,第N幅原始图像的目标区预测状态又与第N-1幅原始图像的目标区存在状态相同,而这个N-1幅原始图像的目标区存在状态又是由第N-1幅原始图像中的目标区决定的;
由此,第N幅原始图像中目标区的获取就建立在第N-1幅原始图像中目标区的基础上。在没有对图像进行实际检测以前,每幅原始图像中目标区存在状态是未知的,如果利用目标检测模块将每幅原始图像都完全检测一遍,查看目标区是否存在,这种做法必定会大量耗费图像处理过程中的产生的时间与运算量。
又由于,在经由步骤S100获取到的多幅原始图像中,每幅原始图像中的目标区存在状态可能是不同的:因为有些原始图像中通过目标检测模块一次检测处理就可以直接识别到目标,因此可能存在目标区;而有些图像中通过目标检测模块一次检测处理可能不能直接识别到目标,因此此时就不存在对应的目标区,如果想要获取到这些图像中的目标区,就必须进行更为复杂的检测处理。所以为了更加高效地获取到每幅原始图像的目标区,就需要对不同的原始图像进行不同的处理。
再由于,每幅原始图像在经过目标区检测以前,其目标区预测状态是未知的。因此,如果想要对多幅原始图像中的不同图像进行区分处理的话,就需要根据待检测图像的原始图像的前一幅原始图像中目标区存在状态来判断和划分。如前所示,前后相邻的两幅原始图像之间的间隔时间小于所述预定时间时,相邻的前后两幅原始图像中,两个前后目标区在各自的原始图像中的位置变化是不大的,根据前一幅原始图像的目标区位置可以大致预测到后一幅原始图像的目标区位置。
正是基于上述缘由,本申请中,通过先获取每幅原始图像的前一幅原始图像中的目标区存在状态确定紧接在该前一幅原始图像之后的后一幅原始图像中的目标区预测状态,再根据后一幅原始图像中的目标区预测状态对该后一幅原始图像进行相应的处理,便能够更加便捷、高效地获取到与每幅原始图像对应的待检测图像,使得该待检测图像包含目标区的概率更大,从而也就可以更容易获取到每幅原始图像中的目标区,计算出目标在每幅原始图像中的位置,形成目标运动的轨迹。此外,由于待检测图像包含目标区的概率更大,所以可以更好地消除现有技术中无效区域带来的误检测问题。
综上,本申请的方法,由于提升了待检测图像包含目标区的概率,所以不再需要将每幅原始图像进行全尺寸的整体分析与计算,只需要结合前一幅原始图像的目标区信息,对需要获取目标区的后一幅原始图像进行简化处理,就能获取到该后一幅原始图像(这里的该幅原始图像指的是前述的需要获取目标区的后一幅原始图像)中的目标区,减少了在图像中检测目标位置时所耗的运算量。此外,同样重要的是,本申请中由于不再需要将每幅原始图像进行全尺寸的整体分析与计算,所以也就避免了应用现有技术中将每幅原始图像进行大幅缩小处理以降低运算量的目标位置获取手段,由此保证了待检测图像中目标的清晰度。因此,本申请第一方面所述的方法解决了在保证目标清晰度的前提下,减少在图像中检测目标位置时所耗运算量的问题。同时可以更好地消除现有技术中无效区域带来的误检测问题。
在一些实施例中,所述方法还包括:
S600、根据多个目标位置形成目标运动的轨迹。需要说明的是,“目标运动的轨迹”主要由目标在多幅原始图像中的多个目标位置构成。
在一些实施例中,在所述步骤S100,还包括:设置基准尺寸,每幅原始图像的尺寸与所述基准尺寸的大小相等,也就是说,多幅原始图像中每幅原始图像的尺寸均相等。例如从包含目标运动轨迹的视频材料中获取的多幅原始图像,在尺寸大小上就可以满足相等的要求。
在一些实施例中,多幅原始图像中每幅原始图像的图像分辨率均相等。
在一些实施例中,目标区存在状态包括目标区存在。
在一些实施例中,目标区存在状态还包括目标区不存在与目标区丢失中的至少一种。在一些实施方式中,步骤S300中所述根据每幅原始图像的目标区预测状态获取每幅原始图像的待检测图像,包括下文所述的步骤S310,所述步骤S310包括:
当待获取待检测图像的原始图像的目标区预测状态为目标区不存在时,也就是说,前述待获取待检测图像的原始图像的前一幅原始图像中的目标区存在状态为目标区不存在;
将待获取待检测图像的原始图像进行第一裁剪,得到第一裁剪图像;
根据所述第一裁剪图像获取待检测图像。
需要说明的是,因为多幅待检测图像是按照顺序依次获取的,一次只能获取一幅待检测图像,所以,这里的待获取待检测图像的原始图像是指正在被获取待检测图像的原始图像。
还需要说明的是,所述待获取待检测图像的原始图像的目标区预测状态为目标区不存在时的原始图像主要包括两种:其中一种是多幅原始图像中的第一幅原始图像,因为只有第一幅原始图像没有在先原始图像,所以其没有对应的前一幅原始图像,也就没有对应的目标区;另一种可能是除第一幅原始图像之外的其他原始图像,例如:在步骤S400中已经获取待检测图像并经过目标检测模块检测后,但仍然未能从待检测图像中获取到目标区的原始图像,对于这些原始图像而言,其对应的待检测图像中的目标区也有可能是不存在的,更具体来说可以是下文步骤S430中根据重新获取的待检测图像无法获取到获取对应的目标区的原始图像,这种原始图像的目标区存在状态同样为目标区不存在。
进一步需要说明的是,在本申请中,将待获取待检测图像的原始图像进行第一裁剪处理,形成第一裁剪图像,再根据第一裁剪图像获取待检测图像,是为了提升对于待检测图像的处理速度,因为,相对于原始图像而言,对待检测图像的扫描处理尺寸变小了,所以能够更高效地从待检测图像中寻找到目标区,此外,也进一步减小了运算量,而且保证了目标的清晰度。
在一些实施方式中,步骤S310中所述将待获取待检测图像的原始图像进行第一裁剪,得到第一裁剪图像包括:将所述基准尺寸划分为多个图像裁剪区,从中选取任一个图像裁剪区的尺寸参数对待获取待检测图像的原始图像进行裁剪,从而获取到待检测图像。在至少一个实施方式中,可以按照中部、中上、中左、中右、中下五个区域将所述基准尺寸划分为五个图像裁剪区,;当需要获取待检测图像时,可以从中部、中上、中左、中右、中下五个图像裁剪区的裁剪尺寸参数中任意选择一个对待获取待检测图像的原始图像进行裁剪。
在一些实施方式中,步骤S310中所述将待获取待检测图像的原始图像进行第一裁剪,得到第一裁剪图像还包括:按照预定顺序对所述多个图像裁剪区的多个尺寸参数进行排序,如果待获取待检测图像的原始图像的前一幅原始图像是按照所述多个尺寸参数中的其中一个进行第一裁剪的,则根据前一幅原始图像对应的裁剪尺寸参数顺序之后的裁剪尺寸参数获取待获取待检测图像的原始图像的第一裁剪图像。在这里可以将中部、中上、中左、中右、中下五个图像裁剪区的裁剪尺寸参数进行依次排序,如果获取待检测图像的原始图像的前一幅原始图像是按照中部图像裁剪区的裁剪尺寸参数裁剪的,那么就按照中部图像裁剪区之后的中上图像裁剪区的裁剪尺寸参数对待检测图像的原始图像进行裁剪,以获取对应的第一裁剪图像。
在一些实施方式中,步骤S310中所述将待获取待检测图像的原始图像进行第一裁剪,得到第一裁剪图像还包括:按照第一预定分辨率对待获取待检测图像的原始图像进行第一裁剪,所述第一预定分辨率与原始图像分辨率的高度之比1-1.5:2,宽度之比为0.5-1.5:2;在至少一个实施方式中,当原始图像分辨率为1600x1200(高度x宽度)时,所述第一预定分辨率为640x480(高度x宽度)。(该分辨率的取值取决于实际硬件运算能力,分辨率选择越大那么覆盖的范围越广,结合紧随其后的按比例缩小,也会导致目标所在的区域越小,辨识度越低。)
在一些实施方式中,步骤S310中根据所述第一裁剪图像获取所述待检测图像包括:按照第二预定分辨率将所述第一裁剪图像进行等比例缩小后,得到所述待检测图像。在某些实施方式中,所述第二预定分辨率与所述第一预定分辨率的高度之比为0.5-1:2,宽度之比为0.5-1:2;在至少一个实施方式中,当所述第一预定分辨率为640x480(高度x宽度)时,所述第二预定分辨率为240x180(高度x宽度)。
本申请的某些实施方式中,在获取待检测图像时,将对应的原始图像进行第一裁剪之后进行缩小,是为了进一步减小图像尺寸,先裁剪后缩小可以最大程度上保留目标清晰度,远比现有技术中直接缩小的图像质量高很多,也就解决了因裁剪而导致图像扫描区域变小,而查找不到目标区的问题;例如在某些实施方式中,如果图像处理的硬件运算能力,只能满足分辨率为240x180(高度x宽度)的图像的处理(换言之,只有在处理分辨率小于或等于240x180(高度x宽度)的图像时,图像处理硬件的响应速度才可以被用户接受),按照现有技术,存在两种获取待检测图像的方法:一种是直接将原始图像缩小到240x180(高度x宽度)的分辨率,一种是直接将原始图像裁剪到240x180(高度x宽度)的分辨率。第一种现有方法的弊端显而易见,以分辨率为1600x1200(高度x宽度)的图像为例,直接将其缩小到240x180(高度x宽度)的分辨率,形成待检测图像,那么实际从待检测图像中获取的目标区也会跟着大致缩小6.7倍,导致目标区的图像清晰度变得很差。类似地,第二种现有方法的弊端也很明显,直接从分辨率为1600x1200(高度x宽度)的原始图像中裁剪出分辨率为240x180(高度x宽度)的待检测图像,那么可扫描识别的目标区的图像分辨率就只有240x180(高度x宽度)。与前不同的是,如果按照本申请的方法,将分辨率为1600x1200(高度x宽度)的原始图像先裁剪到640x480(高度x宽度)分辨率,再缩放到240x180(高度x宽度)分辨率,形成待检测图像,那么可用于扫描识别目标区就相当于有640x480(高度x宽度)分辨率的范围,是第一种现有方法的可扫描识别的目标区的2.7倍,最大程度上提升了用于扫描目标的区域范围。此时再将640x480(高度x宽度)等比例缩放到240x180(高度x宽度),缩放比例仅2.7倍,最大程度上提升了目标区的图像清晰度。
在一些实施方式中,步骤S300中所述根据每幅原始图像的目标区预测状态获取每幅原始图像的待检测图像还包括下文所述的步骤S320,所述步骤S320包括:
当待获取待检测图像的原始图像的目标区预测状态为目标区存在时;
根据待获取待检测图像的原始图像的前一幅原始图像的目标区对待获取待检测图像的原始图像进行第二裁剪,得到第二裁剪图像;
根据所述第二裁剪图像获取待检测图像。
在一些实施方式中,步骤S320中根据待获取待检测图像的原始图像的前一幅原始图像的目标区对待获取待检测图像的原始图像进行第二裁剪,得到第二裁剪图像包括:
将待获取待检测图像的原始图像的前一幅原始图像的目标区进行扩大处理,得到第一扩大区,根据所述第一扩大区的尺寸参数与位置参数对待获取待检测图像的原始图像进行第二裁剪,得到第二裁剪图像。所述第一扩大区的位置参数根据第一扩大区在待获取待检测图像的原始图像的前一幅原始图像中的位置形成。需要说明的是,由于待获取待检测图像的原始图像的前一幅原始图像中目标区是已知的,所以该目标区的位置和尺寸都是已知的,因此,由该目标区扩大形成的第一扩大区的尺寸参数与位置参数也同样是清楚的。
在某些实施方式中,步骤S320中所述第一扩大区与所述目标区的尺寸之比为2:1-4:1;在至少一个实施方式中,所述第一扩大区与所述目标区的尺寸之比为3:1,例如当目标区的尺寸为80x80(高度x宽度)时,那么第一扩大区的尺寸则设置为240x240(高度x宽度)。设置第一扩大区的目的是要预留给目标移动的位置,确保待检测图像中能捕捉到目标从前一幅原始图像移动到待获取待检测图像的原始图像中的位置。
在一些实施方式中,步骤S320中根据所述第二裁剪图像获取待检测图像包括:将所述第二裁剪图像预定标准缩小,得到待检测图像。
在一些实施方式中,步骤S320中将所述第二裁剪图像预定标准缩小包括:判断所述第二裁剪图像是否大于预定尺寸,如果大于,则按照等比例的方式缩小至所述预定尺寸。在至少一个实施方式中,当原始图像分辨率为1600x1200(高度x宽度)时,所述预定尺寸为180x180(高度x宽度)。此处缩小的目的是为了处理当目标占据原始图像较大的区域时,导致第二裁剪图像的尺寸可能会太大,影响了目标检测模块的运算速度。因此还需要将第二裁剪图像进行等比例缩小来获取到最终的目标待检测图像,这样可以来控制目标待检测图像的尺寸。又由于裁剪得到的第二裁剪图像的图像质量与原始图像的图像质量完全一样,而且裁剪过的第二裁剪图像范围却缩小很多,因此在前述基础上,将第二裁剪图像缩小成待检测图像,图像质量并不会牺牲很大,所以不会影响目标检测模块的检测结果。
在一些实施方式中,步骤S300中所述根据每幅原始图像的目标区预测状态获取每幅原始图像的待检测图像还包括下文所述的步骤S330,所述步骤S330包括:
当待获取待检测图像的原始图像的目标区预测状态为目标区丢失时(这里意味着待获取待检测图像的原始图像的前一幅原始图像的目标区存在状态为目标区丢失),重新获取待检测图像的原始图像的目标区预测状态;
在待获取待检测图像的原始图像的目标区预测状态更新为目标区存在时(即前一幅原始图像的目标区存在状态更新为目标区存在后),继续获取所述待获取待检测图像,这里可以按照前述的步骤S320实现。
在一些实施例中,步骤S330中,重新获取待检测图像的原始图像的目标区预测状态包括:
重新获取待获取待检测图像的原始图像的的前一幅原始图像的待检测图像,根据从前一幅原始图像中的重新获取的待检测图像获取前一幅原始图像的目标区;
其中,重新获取待获取待检测图像的原始图像的前一幅原始图像的待检测图像包括:
以该待获取待检测图像的原始图像的前一幅原始图像的前一幅原始图像中目标区丢失前的位置为中心,扩大目标区,得到第二扩大区;
根据所述第二扩大区的图像分辨率参数与位置参数对待获取待检测图像的原始图像的的前一幅原始图像进行第三裁剪,得到第三裁剪图像;
根据所述第三裁剪图像重新获取待获取待检测图像的原始图像的前一幅原始图像的待检测图像。
在一些实施方式中,步骤S330中所述第二扩大区的图像分辨率与原始图像分辨率的高度之比1-1.5:2,宽度之比为0.5-1.5:2;在一些实施方式中,当原始图像的图像分辨率为1600x1200(高度x宽度)时,所述第二扩大区的图像分辨率为640x480(高度x宽度)。
在一些实施方式中,步骤S330中根据所述第三裁剪图像重新获取目标区丢失的原始图像的待检测图像包括:
将所述第三裁剪图像按照第三预定分辨率进行等比例缩小,得到目标待检测图像。在至少一个实施方式中,当所述第二扩大区的图像分辨率为640x480(高度x宽度)时,所述第三预定分辨率为240x180(高度x宽度)。
在一些实施方式中,步骤S400包括:
S410、如果根据从原始图像中首次获取的待检测图像不能得到目标区(也就是说,通过目标检测模块能够从待检测图像中查询不到目标区),则将该幅待检测图像对应的原始图像的目标区存在状态标记为目标区丢失。
在一些实施方式中,步骤S400还包括:
S420、重新获取目标区丢失的原始图像的待检测图像,如果根据重新获取的待检测图像不能获取到目标区,则将该目标区丢失的原始图像的目标区存在状态标记为目标区不存在。
在一些实施方式中,步骤S400还包括:
S430、如果能够根据待检测图像得到目标区,(也就是说,通过目标检测模块能够从待检测图像中查询到目标区),则将该该幅待检测图像对应的原始图像的目标区存在状态标记为目标区存在。步骤S430中得到目标区的待检测图像可以是从原始图像中首次获取的待检测图像,也可以是步骤S420中的重新获取的待检测图像。
在一些实施方式中,步骤S500包括:
S510、计算目标区在对应的待检测图像中的目标区位置;
S520、计算待检测图像在原始图像中的真实位置;具体地,关于步骤S520,在一些实施方式中,在待检测图像中获取到目标区后,将待检测图像按照之前缩小的分辨率比例进行放大,以恢复目标区在对应的原始图像中的真实分辨率比例,再根据放大后的待检测图像在对应的原始图像中的裁剪位置进行补偿计算,恢复待检测图像在对应的原始图像中的真实位置。
S530、根据目标区位置与真实位置得到目标区在原始图像中的位置。
如图2所示,以下将以一个更为具体的实施例对第一方面所提供的方法进行说明。
一、获取多幅原始图像,其中每幅原始图像的分辨率为1600x1200。多幅原始图像包括第一至N幅原始图像。相应地,在本实施例中就存在与第一至N幅原始图像对应的第一至N待检测图像、第一至N目标区、第一至N目标位置等等。需要说明的是,第一待检测图像、第一目标区、第一目标位置与第一幅原始图像对应,第二待检测图像、第二目标区、第二目标位置与第二幅原始图像对应,依次类推,第N待检测图像、第N目标区、第N目标位置与第N幅原始图像对应。
容易理解的是,需要按照时序依次对第一至N幅原始图像进行处理,才能依次获得第一至N待检测图像、第一至N目标区、第一至N目标位置,最终形成目标在第一至N幅原始图像中的轨迹。
需要说明的是,图2主要阐明的是:在多幅原始图像中目标区存在状态连续为目标区存在的情况下对第一至N幅原始图像的处理过程。
二、关于第一幅原始图像。
由于第一幅原始图像没有在先图像,所以它也就没有前一幅原始图像中目标区存在状态,相应地,第一幅原始图像的目标区预测状态为目标区不存在。
按照步骤S310对将第一幅原始图像进行第一裁剪,得到第一裁剪图像,根据所述第一裁剪图像获取第一待检测图像(即第一幅原始图像的待检测图像)。
进一步地,所述将第一幅原始图像进行第一裁剪,得到第一裁剪图像包括:将所述基准尺寸划分为多个图像裁剪区,从中选取任一个图像裁剪区的尺寸参数对待获取待检测图像的原始图像进行裁剪,从而获取到待检测图像。
进一步地,将所述基准尺寸划分为多个图像裁剪区包括:按照中部、中上、中左、中右、中下五个区域将所述基准尺寸划分为五个图像裁剪区。当需要获取第一待检测图像时,从中部、中上、中左、中右、中下五个图像裁剪区的裁剪尺寸参数中任意选择一个对待获取待检测图像的原始图像进行裁剪。
进一步地,所述将第一幅原始图像进行第一裁剪,得到第一裁剪图像还包括:按照第一预定分辨率对第一幅原始图像进行第一裁剪,所述第一预定分辨率为640x480(高度x宽度)。
进一步地,根据所述第一裁剪图像获取第一待检测图像包括:按照第二预定分辨率将所述第一裁剪图像进行等比例缩小后,得到所述第一待检测图像。进一步地,所述第二预定分辨率为240x180(高度x宽度)。
在获取到第一待检测图像后,将第一待检测图像送入到目标检测模块中进行检测,从第一待检测图像中获取到第一目标区后,将第一幅原始图像的目标区存在状态标记为目标区存在并更新。
然后,将第一目标区按照之前缩小的分辨率(即第二预定分辨率为240x180(高度x宽度))比例进行放大,恢复第一目标区在对应的第一幅原始图像中的真实分辨率比例,再根据放大后的第一目标区在第一幅原始图像中裁剪的裁剪位置进行补偿计算,恢复目标在第一幅原始图像中的位置。
三、关于第二幅原始图像。
1、当第一幅原始图像中的第一目标区存在时,将第一目标区进行扩大处理,得到第一目标区的第一扩大区,根据第一目标区的第一扩大区的尺寸参数与位置参数对第二幅原始图像进行第二裁剪,得到第二幅原始图像的第二裁剪图像,根据第二幅原始图像的第二裁剪图像获取第二待检测图像。
进一步地,第一目标区的第一扩大区与第一目标区的尺寸之比为3:1,例如当第一目标区的尺寸为80x80(高度x宽度)时,那么第一目标区的第一扩大区的尺寸则设置为240x240(高度x宽度)。
进一步地,根据第二幅原始图像的第二裁剪图像获取第二待检测图像包括:判断第二幅原始图像的第二裁剪图像是否大于预定尺寸,如果大于,则按照等比例的方式将第二幅原始图像的第二裁剪图像缩小至预定尺寸,得到第二待检测图像。
进一步地,第一目标区的第一扩大区的尺寸与所述预定尺寸之比为(4:3)。进一步地,当第一目标区的第一扩大区的尺寸为240x240(高度x宽度)时,所述预定尺寸为180x180(高度x宽度)。
获取到第二待检测图像后,从第二待检测图像获取第二目标区,然后根据第二目标区生成目标在第二幅原始图像中的位置。
2、需要说明的是,在一些其他实施例中,如果从第二待检测图像不能获取到第二目标区,则将第二幅原始图像的目标区存在状态标记为目标区丢失;(图2中未示出)
重新获取目标区存在状态为目标区丢失的第二幅原始图像的待检测图像,根据重新获取的待检测图像获取第二幅原始图像的第二目标区;
进一步地,所述重新获取目标区存在状态为目标区丢失的第二幅原始图像的待检测图像包括:
以该第一幅原始图像中的第一目标区的位置为中心,扩大第一目标区,得到第一目标区的第二扩大区;
根据第一目标区的第二扩大区的图像分辨率参数与位置参数对第二幅原始图像进行第三裁剪,得到第二幅原始图像的第三裁剪图像;
根据第二幅原始图像的第三裁剪图像重新获取目标区存在状态为目标区丢失的第二幅原始图像的第二待检测图像。
进一步地,第一目标区的第二扩大区的图像分辨率为640x480(高度x宽度)。
进一步地,根据第二幅原始图像的第三裁剪图像重新获取目标区存在状态为目标区丢失的第二幅原始图像的第二待检测图像包括:将所述第三裁剪图像按照第三预定分辨率进行等比例缩小,得到重新获取的第二待检测图像。
进一步地,所述第三预定分辨率为240x180(高度x宽度)。
根据重新获取的第二待检测图像获取第二目标区,如果可以获取到第二目标区,则将第二幅原始图像的目标区存在状态标记为目标区存在并更新,否则标记为目标区不存在。
四、关于第三至N幅原始图像。
第三至N幅原始图像的处理过程类似于前述的第一和第二幅原始图像,可以参见前文的阐述,不再赘述。
<本发明的第二方面>
第二方面提供了一种从多幅图像中获取目标位置的装置10,所述装置10包括:
原始图像获取模块100,用于基于时序获取运动的目标在不同时间的多幅原始图像;
目标区预测状态获取模块200,用于根据每幅原始图像的前一幅原始图像中的目标区存在状态获取与每幅原始图像对应的目标区预测状态;
待检测图像获取模块300,用于根据每幅原始图像的目标区预测状态获取每幅原始图像的待检测图像;
目标区获取模块400,用于根据每幅原始图像的待检测图像获取与每幅原始图像对应的目标区;
位置获取模块500,用于根据每幅原始图像的目标区获取每幅原始图像中的目标位置,生成与多幅原始图像对应的多个目标位置。
在一些实施例中,所述装置还包括轨迹生成模块600,用于根据多个目标位置形成目标运动的轨迹。
需要说明的是,第二方面提供的从多幅图像中获取目标位置的装置与第一方面提供的方法对应,用于执行第一方面所述的方法;所以第一方面所述的方法中的技术特征同样可以应用于第二方面所述的装置中,具体请参见前文,此处不再赘述。
<本发明的第三方面>
第三方面提供了一种电子设备,用于执行第一方面所述的方法。
<本发明的第四方面>
第四方面提供了一种存储介质,所述存储介质存储有计算机指令,所述计算机指令用于执行第一方面所述的方法。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。

Claims (10)

1.从多幅图像中获取目标位置的方法,其特征在于,所述方法包括:
基于时序获取运动的目标在不同时间的多幅原始图像;
根据每幅原始图像的前一幅原始图像中的目标区存在状态获取与每幅原始图像对应的目标区预测状态;
根据每幅原始图像的目标区预测状态获取每幅原始图像的待检测图像;
根据每幅原始图像的待检测图像获取与每幅原始图像对应的目标区;
根据每幅原始图像的目标区获取每幅原始图像中的目标位置,生成与多幅原始图像对应的多个目标位置;
根据多个目标位置形成目标运动的轨迹。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:设置基准尺寸,每幅原始图像的尺寸与所述基准尺寸的大小相等。
3.根据权利要求2所述的方法,其特征在于,所述根据每幅原始图像的目标区预测状态获取每幅原始图像的待检测图像包括:
当待获取待检测图像的原始图像的目标区预测状态为目标区不存在时;
将待获取待检测图像的原始图像进行第一裁剪,得到第一裁剪图像;
根据所述第一裁剪图像获取待检测图像。
4.根据权利要求2所述的方法,其特征在于,所述根根据每幅原始图像的目标区预测状态获取每幅原始图像的待检测图像还包括:
当待获取待检测图像的原始图像的目标区预测状态为目标区存在时;
根据待获取待检测图像的原始图像的前一幅原始图像的目标区对待获取待检测图像的原始图像进行第二裁剪,得到第二裁剪图像;
根据所述第二裁剪图像获取待检测图像。
5.根据权利要求4所述的方法,其特征在于,所述根据待获取待检测图像的原始图像的前一幅原始图像的目标区对待获取待检测图像的原始图像进行第二裁剪,得到第二裁剪图像包括:
将待获取待检测图像的原始图像的前一幅原始图像的目标区对应的图像尺寸参数进行扩大处理,得到第一扩大区,根据所述第一扩大区对应的图像尺寸参数对待获取待检测图像的原始图像进行第二裁剪,得到第二裁剪图像。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第二裁剪图像获取待检测图像包括:将所述第二裁剪图像预定标准缩小,得到待检测图像。
7.根据权利要求2所述的方法,其特征在于,所述根据每幅原始图像的目标区预测状态获取每幅原始图像的待检测图像还包括:
当待获取待检测图像的原始图像的目标区预测状态为目标区丢失时,重新获取待检测图像的原始图像的目标区预测状态;
在待获取待检测图像的原始图像的目标区预测状态更新为目标区存在时,继续获取所述待获取待检测图像。
8.从多幅图像中获取目标位置的装置,其特征在于,所述装置包括:
原始图像获取模块,用于基于时序获取运动的目标在不同时间的多幅原始图像;
目标区预测状态获取模块,用于根据每幅原始图像的前一幅原始图像中的目标区存在状态获取与每幅原始图像对应的目标区预测状态;
待检测图像获取模块,用于根据每幅原始图像的目标区预测状态获取每幅原始图像的待检测图像;
目标区获取模块,用于根据每幅原始图像的待检测图像获取与每幅原始图像对应的目标区;
位置获取模块,用于根据每幅原始图像的目标区获取每幅原始图像中的目标位置,生成与多幅原始图像对应的多个目标位置。
9.电子设备,其特征在于,用于执行权利要求1-7任一所述的方法。
10.存储介质,其特征在于,所述存储介质存储有计算机指令,所述计算机指令用于执行权利要求1-7任一所述的方法。
CN202011443716.0A 2020-12-11 2020-12-11 从多幅图像中获取目标位置的方法、装置、设备和介质 Pending CN114627189A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011443716.0A CN114627189A (zh) 2020-12-11 2020-12-11 从多幅图像中获取目标位置的方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011443716.0A CN114627189A (zh) 2020-12-11 2020-12-11 从多幅图像中获取目标位置的方法、装置、设备和介质

Publications (1)

Publication Number Publication Date
CN114627189A true CN114627189A (zh) 2022-06-14

Family

ID=81894652

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011443716.0A Pending CN114627189A (zh) 2020-12-11 2020-12-11 从多幅图像中获取目标位置的方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN114627189A (zh)

Similar Documents

Publication Publication Date Title
CN107358149B (zh) 一种人体姿态检测方法和装置
CN111640089B (zh) 一种基于特征图中心点的缺陷检测方法及装置
CN107798272B (zh) 快速多目标检测与跟踪***
KR101033098B1 (ko) 실시간 얼굴 검출 장치
CN111275743B (zh) 目标追踪方法、装置、计算机可读存储介质和计算机设备
CN112419202B (zh) 基于大数据及深度学习的野生动物图像自动识别***
CN110570407A (zh) 图像处理方法、存储介质及计算机设备
CN115497056B (zh) 基于深度学习的区域内遗失物品检测方法
WO2008040945A1 (en) A method of identifying a measure of feature saliency in a sequence of images
CN112752158A (zh) 一种视频展示的方法、装置、电子设备及存储介质
CN113298852A (zh) 目标跟踪方法、装置、电子设备及计算机可读存储介质
CN114627189A (zh) 从多幅图像中获取目标位置的方法、装置、设备和介质
Perner Motion tracking of animals for behavior analysis
CN114494977A (zh) 一种异常停车检测方法、电子设备及存储介质
JP2000125288A5 (zh)
JP3747183B2 (ja) 画像処理装置及び画像処理方法
JP4161441B2 (ja) 動きベクトル推定装置および動きベクトル推定方法
US8300926B2 (en) Image processing apparatus and image processing method
JP3763279B2 (ja) 物体抽出システム、物体抽出方法および物体抽出プログラム
CN112633065A (zh) 一种基于数据增强的人脸检测方法、***、存储介质及终端
CN107886102B (zh) Adaboost分类器训练方法及***
JP3026751B2 (ja) 画像切出方法及び装置
CN112597800B (zh) 一种录播***中学生起坐动作的检测方法及***
CN115249254B (zh) 一种基于ar技术的目标跟踪方法及***
JP2806666B2 (ja) 概略画像作成方法及び装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination