CN113643420A - 一种三维重建方法及装置 - Google Patents

一种三维重建方法及装置 Download PDF

Info

Publication number
CN113643420A
CN113643420A CN202110749332.XA CN202110749332A CN113643420A CN 113643420 A CN113643420 A CN 113643420A CN 202110749332 A CN202110749332 A CN 202110749332A CN 113643420 A CN113643420 A CN 113643420A
Authority
CN
China
Prior art keywords
image
frame
reconstructed
images
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110749332.XA
Other languages
English (en)
Other versions
CN113643420B (zh
Inventor
谢日旭
王明晖
赵铮
魏晓林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN202110749332.XA priority Critical patent/CN113643420B/zh
Publication of CN113643420A publication Critical patent/CN113643420A/zh
Application granted granted Critical
Publication of CN113643420B publication Critical patent/CN113643420B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本说明书公开了一种三维重建方法及装置。通过对采集的重建对象的各帧图像进行目标检测,将属于预设类型的目标物的位置进行掩膜处理以确定重建图像,并根据采集各帧重建图像时的时序信息,对各重建图像进行分组,得到若干数据组,在数据组内,进行重建图像的顺序特征匹配,在数据组间,针对每个数据组,将该数据组的首帧重建图像与其他数据组的各帧重建图像进行两两匹配,以寻找不同数据组的共视区域,进行三维重建。通过对特征匹配会产生干扰的目标物添加掩膜,去除其对匹配准确性的干扰,以及按时序对图像进行分组,减少进行整体暴力特征匹配的计算时间和计算量,提高三维重建的准确率以及重建效率。

Description

一种三维重建方法及装置
技术领域
本说明书涉及三维重建技术领域,尤其涉及一种三维重建方法及装置。
背景技术
随着三维重建技术的广泛应用,三维重建结果的准确性也越来越重要。目前,三维重建技术包括基于视觉的三维重建以及基于激光的三维重建。在基于视觉的三维重建技术中,需要采集若干帧重建对象(如:物品、建筑群、室内场景等)的图像,这些图像要有一定的共视区域,以便于能够基于这些图像中的共视区域进行特征检测,并对这些图像进行特征匹配。在进行特征匹配得到若干目标物的特征点后,再基于得到的特征点进行三维重建。
但是在目前的基于视觉的三维重建技术中,是通过暴力匹配的方式进行特征匹配的,即针对每一帧图像,将该帧图像与各其他图像分别两两进行特征匹配,以在采集的图像中尝试所有可能的匹配。由于暴力匹配的计算量较大,耗时较长,使得三维重建效率低。
并且,若在重建对象的不同位置有相似或相同的物体(如,室内不同位置放置了相同的装饰物),在对这些包含相似物体对应的图像进行暴力匹配时,这些相似的物体可能会发生误匹配,即,将在不同位置采集的图像成功进行了特征点的匹配。这时,这些装饰物则成了对该重建对象进行三维重建的干扰物。可见,当采集到的重建对象的图像中存在干扰物时,这种暴力匹配的方法会加大特征点误匹配的概率,导致三维重建不准确甚至重建失败。
发明内容
本说明书提供一种三维重建方法及装置,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种三维重建方法,包括:
获取预先采集的重建对象的若干帧图像,并对各帧图像进行目标检测;
根据检测结果,从各帧图像中确定属于预设类型的目标物的图像区域,并通过对各帧图像中目标物的图像区域添加掩膜,确定各重建图像;
获取采集每帧重建图像的时序信息,根据所述时序信息,对各帧重建图像进行分组,得到各数据组;
针对每个数据组,根据所述时序信息,依次将该数据组中的每帧重建图像与其相邻重建图像进行特征匹配,并将该数据组中的首尾帧重建图像与其他数据组中的各帧重建图像进行特征匹配;
根据得到的各匹配结果对所述重建对象进行三维重建。
可选地,对各帧图像进行目标检测,具体包括:
针对每帧图像,对该图像进行目标检测,判断该图像中是否存在目标物;
若是,则确定该图像中所述目标物的类型以及位置,并将确定出的所述目标物的类型以及位置作为检测结果;
若否,则将该图像中不存在所述目标物作为检测结果。
可选地,根据检测结果,从各帧图像中确定属于预设类型的目标物的图像区域,并通过对各帧图像中目标物的图像区域添加掩膜,确定各重建图像,具体包括:
根据检测结果,确定存在属于预设类型的目标物的各帧图像为目标图像,并确定不存在属于预设类型的目标物的各帧图像以及不存在任何目标物的各帧图像为标准图像;
针对每帧目标图像,对该目标图像中属于预设类型的目标物的位置添加掩膜;
将添加掩膜后的各目标图像以及各标准图像作为重建图像。
可选地,根据所述时序信息,对各帧重建图像进行分组,得到各数据组,具体包括:
根据所述时序信息,确定各帧重建图像的采集顺序;
按照所述采集顺序,依次确定相邻两帧重建图像间的时间间隔;
判断是否存在时间间隔大于预设间隔的两帧重建图像;
若是,则将时间间隔大于所述预设间隔的两帧重建图像作为标识图像,并根据得到的各标识图像对各帧重建图像进行分组,得到各数据组;
其中,所述预设间隔大于采集图像的帧率。
可选地,根据得到的各标识图像对各帧重建图像进行分组,得到各数据组,具体包括:
针对每帧标识图像,根据所述采集顺序,确定该帧标识图像的相邻标识图像;
判断该帧标识图像与所述相邻标识图像间是否存在其他重建图像;
若是,则确定该帧标识图像、所述相邻标识图像以及该帧标识图像与所述相邻标识图像间的所述其他重建图像为一个数据组。
可选地,根据所述时序信息,依次将该数据组中的每帧重建图像与其相邻重建图像进行特征匹配,具体包括:
根据所述时序信息,依次确定该数据组中的每帧重建图像作为目标匹配图像;
根据预设的区间长度,确定所述目标匹配图像的匹配区间;
将所述目标匹配图像与所述匹配区间内的其他重建图像进行特征匹配。
可选地,根据检测结果,从各帧图像中确定属于预设类型的目标物的图像区域之前,所述方法还包括:
获取属于预设类型的目标物的基准图像以及预先采集的重建对象的若干帧图像;
针对采集的每帧图像,将该帧图像与所述基准图像进行相似性匹配;
根据匹配结果,从各帧图像中确定属于所述预设类型的目标物的图像区域。
本说明书提供了一种三维重建装置,包括:
检测模块,用于获取预先采集的重建对象的若干帧图像,并对各帧图像进行目标检测;
确定模块,用于根据检测结果,从各帧图像中确定属于预设类型的目标物的图像区域,并通过对各帧图像中目标物的图像区域添加掩膜,确定各重建图像;
分组模块,用于获取采集每帧重建图像的时序信息,根据所述时序信息,对各帧重建图像进行分组,得到各数据组;
匹配模块,用于针对每个数据组,根据所述时序信息,依次将该数据组中的每帧重建图像与其相邻重建图像进行特征匹配,并将该数据组中的首尾帧重建图像与其他数据组中的各帧重建图像进行特征匹配;
重建模块,用于根据得到的各匹配结果对所述重建对象进行三维重建。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述三维重建方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述三维重建方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
在本说明书提供的三维重建方法中,通过对采集的重建对象的各帧图像进行目标检测,将属于预设类型的目标物的位置进行掩膜处理以确定重建图像,并根据采集各帧重建图像时的时序信息,对各重建图像进行分组,得到若干数据组,在数据组内,进行重建图像的顺序特征匹配,在数据组间,针对每个数据组,将该数据组的首帧重建图像与其他数据组的各帧重建图像进行两两匹配,以寻找不同数据组的共视区域,进行三维重建。
从上述方法中可以看出,本方法能够通过对特征匹配会产生干扰的目标物添加掩膜,去除其对匹配准确性的干扰,以及按时序对图像进行分组,减少进行整体暴力特征匹配的计算时间和计算量,提高三维重建的准确率以及重建效率。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书中一种三维重建方法的流程示意图;
图2为本说明书提供的一种特征匹配示意图;
图3为本说明书提供的一种分组示意图;
图4为本说明书提供的一种采集路径示意图;
图5为本说明书提供的一种采集路径示意图;
图6为本说明书提供的一种三维重建装置的示意图;
图7为本说明书提供的对应于图1的电子设备的结构示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
目前,在基于视觉的三维重建技术中,要求采集到的重建对象的部分图像有一定的共视区域,通常,这些图像是从不同角度对重建对象整体拍摄得到的,或者,这些图像是对重建对象的不同局部区域拍摄得到的。由于无法从一个角度拍摄到重建对象的全貌,因此不论是从不同角度对重建对象拍摄得到的图像,还是对重建对象的不同局部区域拍摄得到的图像,这些图像都需要有一定的共视区域,以便于在三维重建时,基于这些共视区域进行特征匹配,在拍摄的不同图像上找到对应现实中重建对象上同一个三维点的若干特征点。在得到采集的所有图像的匹配结果后,再基于匹配结果进行三维重建。
以对商场的室内场景进行三维重建为例。由于商场属于较为庞大的重建对象,且商场内部结构复杂,因此,通常在对商场这类室内场景进行三维重建时,需要在商场内部沿着其内部路径进行局部图像的采集,在采集到全部图像后,再进行特征匹配,以根据得到的各匹配结果进行三维重建。
但是在目前的基于视觉的三维重建技术中,是通过暴力匹配进行特征匹配的,由于暴力匹配的计算量较大,耗时较长,因此,使得基于暴力匹配的三维重建效率低。并且,若采集到的不同图像中存在相似的干扰物时,这种暴力匹配的方法会增加特征点误匹配(如,图像中不同物体对应的特征点匹配成功)的概率,导致三维重建不准确甚至重建失败。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书中一种三维重建方法的流程示意图,具体包括以下步骤:
S100:获取预先采集的重建对象的若干帧图像,并对各帧图像进行目标检测。
在本说明书一个或多个实施例中,该三维重建方法可由服务器执行。
在本说明书一个或多个实施例中,在对重建对象进行三维重建时,首先需要获取由采集人员预先采集好的重建对象的若干帧图像。
由于在对重建对象的图像进行采集时,可能会采集到干扰物,若不同帧图像间存在干扰物,则在对采集到的图像进行特征匹配时,容易将干扰物进行误匹配,使实际上属于不同位置的特征点匹配成功。
在本说明书一个或多个实施例中,可将会在重建对象对应的环境(重建对象所处外部环境,或当重建对象是室内场景时,重建对象自身的内部环境)的不同位置出现的,且容易发生误匹配的物体作为干扰物。通常干扰物也包括多种类型,对于在不同位置出现的相同类型的干扰物(即相似的干扰物),其发生误匹配的概率更高。
在本说明书一个或多个实施例中,可针对重建对象,根据重建对象对应的环境,确定其环境中存在的几种类型的干扰物作为预设类型的目标物。以便于在后续步骤中,排除干扰物对重建准确性的干扰。
以重建对象是室内场景为例,通常,室内场景内会存在一些装饰品,如春节的装饰彩灯、圣诞节的圣诞树、装饰挂画、广告海报等。通常,节日性装饰品具有时效性,待节日过后便会被撤掉,而装饰挂画、广告海报等也会定期更换。这些以美观或以做广告为目的,装饰在室内的不固定物品是无需参与三维重建的物品。并且,这类物品一般是会在多个位置放置的,若在室内多个位置都装饰有这些物品,反而会在对采集到的多帧重建对象的图像进行特征匹配时造成误匹配,这些装饰品反而会成为干扰物。
因此,在本说明书一个或多个实施例中,在获取到预先采集的重建对象的若干帧图像后,该服务器可对预先采集的各帧图像进行目标检测,以检测各帧图像中是否存在干扰物。基于此,首先则需要确定在采集重建对象的图像时,采集到了哪些目标物,以在后续步骤中进一步判断其中是否存在属于预设类型的可能造成干扰的目标物。
在本说明书一个或多个实施例中,该服务器可针对每帧图像,对该图像进行目标检测,判断该图像中是否存在目标物。若是,则确定该图像中目标物的类型以及位置,并将确定出的目标物的类型以及位置作为检测结果。若否,则将该图像中不存在目标物作为检测结果。
其中,该目标物即通过目标检测从图像中识别得到的物体。该服务器可通过目标检测确定图像中的哪些位置有哪些目标物。例如,该服务器在对各帧图像进行目标检测时,若各帧图像中存在风景画,则该服务器可输出目标物的类型为装饰挂画,并通过包围框标注该风景画在图像中的具***置。
在本说明书一个或多个实施例中,通过目标检测可检测得到的目标物的具体类型可根据需要设置,本说明书在此不做限制。例如,假设目标检测能够检测到的目标物可以包括商户logo、装饰挂画、广告海报等。若考虑到商场内会有大量的相似挂画和广告海报,而不同商户的logo不会重复,则可将装饰挂画、广告海报作为预设类型的目标物,在后续步骤中,若检测到这两种预设类型的目标物中,则可对其添加掩膜。或者,若考虑到商场内存在连锁店,或店铺占地规模较大的商户,在商场的不同位置可能会存在多个相同的logo,则预设类型的目标物可包括:商户logo、装饰挂画、广告海报三种。在后续步骤中,若检测到这三种预设类型的目标物中的一种或几种,则可对其添加掩膜。因此,预设类型的目标物可根据重建对象对应环境的实际情况进行调整。
需要说明的是,目标检测已是较为成熟的技术,具体进行目标检测的过程本说明书在此不做赘述。例如,在本说明书中,该服务器可通过诸如Fast R-CNN、Faster R-CNN、R-FCN、YOLO(You only look once)、SSD(Single Shot MultiBox Detector)、RetinaNet等目标检测方法进行目标检测,基于目标检测得到各目标物的边界框(包围框)和类型,以确定各目标物的位置和类型。当然也可以采用其他目标检测技术,本说明书在此不做限制。
在本说明书一个或多个实施例中,该服务器还可以针对每一帧图像,通过图像语义分割技术,对该帧图像进行语义分割。即针对该帧图像中每一个像素点,确定该像素点的类别,以得到多个属于不同类别的像素组。其中,每个像素组对应一种目标物,以实现对该重建对象的各帧图像的目标检测。在通过图像语义分割进行目标检测时,不再存在不包含目标物的图像,因此,该服务器可确定最终得到的各像素组分别对应的目标物为检测结果。
S102:根据检测结果,从各帧图像中确定属于预设类型的目标物的图像区域,并通过对各帧图像中目标物的图像区域添加掩膜,确定各重建图像。
由于预先采集的该重建对象的若干帧图像中可能存在有干扰物,因此,在得到目标检测的检测结果后,该服务器可从中确定干扰物,并对其进行添加掩膜的处理,以排除其对三维重建的准确性的影响。
在本说明书一个或多个实施例中,在得到目标检测结果后,具体的,该服务器可根据检测结果,确定存在属于预设类型的目标物的各帧图像为目标图像,并确定不存在属于预设类型的目标物的各帧图像以及不存在任何目标物的各帧图像为标准图像为标准图像。针对每帧目标图像,该服务器可对该目标图像中属于预设类型的目标物的位置添加掩膜,并将添加掩膜后的各目标图像以及各标准图像作为重建图像。
其中,该重建图像,即后续步骤中进行特征匹配的各图像。
由于对于同一种类型的目标物,其数量的多少,对重建对象的重建影响性不同。通常,数量越多的目标物对重建对象的重建影响性更大,在特征匹配时,更容易出现误匹配的情况。
因此,在本说明书一个或多个实施例中,该服务器可根据目标检测得到的各类型的目标物的数量,实时确定预设类型的目标物。具体的,该服务器可针对检测得到的每一种目标物的类型,确定该类型对应的目标物数量,并判断该数量是否大于预设值,若是,则确定该类型为预设类型中的一种。若否,则不将该类型作为预设类型。
另外,考虑到不同重建对象本身的差异(或重建对象对应环境的差异),对于不同类型的重建对象(或对应不同环境的重建对象),会成为其三维重建过程中的干扰物的目标物不同。例如,对于体育场内部场景、商场内部场景这两种重建对象,由于体育场内墙壁上可能会有体育类涂鸦,且在不同位置都会放置健身器材,而通常涂鸦具有一定重复性,且健身器材的种类有限却数量繁多,则对于重建对象体育场内部场景来说,在不同位置重复出现的涂鸦和健身器材更容易成为其干扰物,更适合作为其预设类型的目标物。对于商场,其内部通常会有各种类型的海报和贴画,则对于重建对象商场内部场景来说,在不同位置重复出现的海报和贴画更容易成为其干扰物,更适合作为其预设类型的目标物。
因此,在本说明书一个或多个实施例中,该服务器可根据重建对象本身的类型或对应的环境,确定该重建对象对应的,预设类型的目标物。即如步骤S100所述的可根据重建对象对应环境的实际情况,对预设类型的目标物进行调整。
S104:获取采集每帧重建图像的时序信息,根据所述时序信息,对各帧重建图像进行分组,得到各数据组。
为了在保证重建准确性的同时,减少特征匹配所占用的时间以及匹配带来的计算量。该服务器可对各帧重建图像进行分组,得到各数据组,在数据组内,该服务器可按照采集顺序对各帧重建图像与相邻帧重建图像进行特征匹配。由于重建图像是连续采集的,相邻的重建图像能够有足够的共视区域,仅与相邻帧重建图像进行特征匹配,大大减少了计算量。在数据组间,该服务器可使各数据组的首尾帧重建图像与其他数据组中的重建图像两两匹配,进行少量的暴力匹配,以从其他数据组中寻找有共视区域的重建图像,结合前述步骤对可能存在干扰性的目标物进行的掩膜处理,能够在保证三维重建的准确性的同时,减少特征匹配带来的计算量,提高三维重建的效率。
由于环境因素的干扰,或重建对象的体积、结构等问题,采集人员在采集重建对象的各帧图像时,可能在时间上连续的相邻两帧图像的图像内容却不连续,即,不存在共视区域。以重建对象是商场的室内场景为例,由于商场人员流动较多,采集人员在进行图像采集时,可能因为流动人员的遮挡或干扰,无法沿着商场路径连续采集,可能存在需要绕行或跳过遮挡的流动人员位置再采集的情况,在这类情况下,采集人员需要先暂停采集,待绕过遮挡人员后,再继续采集。或者,由于商场结构复杂,例如,采集人员在沿着商场中的一条路径进行采集时,走入了死胡同,此时,采集人员需要暂停采集,再移动到已采集过的位置(以保证接下来采集的图像与已采集的图像有共视区域),沿另一条未采集过的路径继续采集(即在保证与已采集的图像有共视区域的同时,不再进行重复采集)。
因此,在本说明书一个或多个实施例中,在得到各重建图像后,该服务器可根据采集各帧重建图像的时间,对各帧重建图像进行分组。以便于在后续步骤中,基于分组结果进行特征匹配。
在本说明书一个或多个实施例中,该服务器可获取采集每帧重建图像的时序信息,并根据该时序信息,对各帧重建图像进行分组,得到各数据组。其中,该时序信息为记录了采集各帧重建图像的时间戳的,能够体现采集各帧重建图像的顺序的信息,该时序信息的具体形式、结构以及包含的具体内容时可根据需要设置,本说明书在此不做限制。该时序信息即采集人员在采集每帧重建图像对应的重建对象的图像时的时序信息。
如上所述,在受到环境或采集路径等影响,使得连续采集的两帧图像间不存在共视区域的情况下,即使该两帧图像在采集时间上是连续的,但由于存在暂停采集到排除影响因素再继续采集的过程,因此,两帧图像间的时间间隔会较大,且大于其他正常采集的图像间的时间间隔。
于是,在本说明书一个或多个实施例中,该服务器在根据该时序信息,对各帧重建图像进行分组时,可根据该时序信息,确定各帧重建图像的采集顺序,并按照该采集顺序,依次确定相邻两帧重建图像间的时间间隔。之后,该服务器可判断是否存在时间间隔大于预设间隔的两帧重建图像。若是,则将时间间隔大于预设间隔的两帧重建图像作为标识图像,并根据确定出的各标识图像对各帧重建图像进行分组,得到各数据组。其中,该预设间隔大于采集图像的帧率,该预设间隔的长度,具体可根据需要设置,能够使该预设间隔大于正常采集情况下的相邻两帧图像间时间间隔,且能作为是否需要在相邻两帧图像间进行分组的依据即可,本说明书在此不做限制。
如此,能够考虑到采集人员在采集用于三维重建的图像时受到环境干扰的情况,并巧妙化解其带来的影响,能够利用其对采集到的图像进行分组,使得在后续步骤中,能够在数据组内使相邻帧重建图像顺序特征匹配,在数据组间,进行少量的暴力匹配。能够在减少计算量的同时,保证基于匹配结果对重建对象的三维重建的准确性。
S106:针对每个数据组,根据所述时序信息,依次将该数据组中的每帧重建图像与其相邻重建图像进行特征匹配,并将该数据组中的首尾帧重建图像与其他数据组中的各帧重建图像进行特征匹配。
在本说明书一个或多个实施例中,该服务器在确定出各数据组后,可针对每个数据组,根据该时序信息,依次将该数据组中的每帧重建图像与相邻重建图像进行特征匹配,并将该数据组中的首尾帧重建图像与其他数据组中的各帧重建图像进行特征匹配。即对数据组内的重建图像进行顺序匹配,对数据组间的重建图像进行暴力匹配。以根据组内以及组间的匹配结果,得到若干特征点对。
在本说明书一个或多个实施例中,在对数据组内的重建图像进行顺序匹配时,具体的,该服务器可根据该时序信息,依次确定该数据组中的每帧重建图像作为目标匹配图像,并根据预设的区间长度,确定该目标匹配图像的匹配区间。之后,该服务器可将该目标匹配图像与该匹配区间内的其他重建图像进行特征匹配。其中,在该匹配区间内,对于已与该目标匹配图像进行过特征匹配的重建图像不再与该目标匹配图像再次进行特征匹配,即,该服务器可先从该匹配区间内的各重建图像中,筛选出未与该目标匹配图像匹配过的重建图像,再与筛选出的重建图像进行特征匹配。
在说明书一个或多个实施例中,该区间长度可以是时间区间的长度也可以是数量区间的长度。具体可根据需要设置,本说明书在此不做限制。
例如,以区间长度是数量长度,预设的区间长度是目标匹配图像的前后3帧(共6帧)为例,假设一个数据组中有7帧重建图像,如图2所示。图2为本说明书提供的一种特征匹配示意图。如图,各矩形表示重建图像,斜线填充的矩形表示重建图像中的标识图像。其中,匹配区间1为目标匹配图像1的匹配区间,由于目标匹配图像1是该数据组中的第1帧图像,在其前方不存在图像,因此,除其自身外,该目标匹配图像1的匹配区间仅包含3帧重建图像(该目标匹配图像1后的三帧重建图像,即第2、3、4帧重建图像)。匹配区间2为目标匹配图像2的匹配区间,由于目标匹配图像2是该数据组中的第2帧图像,在其前方仅有1帧图像,因此,除其自身外,该目标匹配图像2的匹配区间仅包含4帧重建图像(前一帧与后三帧)。但由于在该数据组内是对目标匹配数据依次按照采集顺序,该目标匹配图像1先于该目标匹配图像2进行特征匹配,而该目标匹配图像2包含于该匹配区间1中,因此,在对目标匹配图像1进行特征匹配时,该目标匹配图像2已与其进行过特征匹配。于是在对该目标匹配数据2与匹配区间2内的重建图像进行匹配时,不再将匹配区间2内包含的目标匹配图像1进行特征匹配。以避免进行重复的特征匹配。
在本说明书一个或多个实施例中,该服务器在对数据组间的重建图像进行暴力匹配时,无需将不同的数据组间的重建图像进行两两暴力匹配。该服务器可针对每个数据组,仅将该数据组中的首帧重建图像,即第一帧标识图像,与其他数据组中的各帧重建图像进行特征匹配。同样,在进行数据组间的暴力匹配时,不进行重复匹配。
在本说明书一个或多个实施例中,该服务器在进行数据组间的特征匹配时,可针对每个数据组,将该数据组的首帧重建图像和/或尾帧重建图像与其他数据组中的重建图像进行特征匹配。即,该服务器可仅将该数据组中的首帧重建图像与其他数据组中的各帧重建图像进行特征匹配,也可以仅将该数据组中的尾帧重建图像进行特征匹配,或者,也可以分别将该数据组中的首帧重建图像以及尾帧重建图像与其他数据组中的各帧重建图像进行特征匹配。具体可根据需要设置,本说明书在此不做限制。
需要说明的是,本说明书中所指的首帧、尾帧图像可以是一帧图像也可以是多帧图像,即首帧可以指第一帧,也可以是前几帧,尾帧可以是最后一帧,也可以是最后几帧,可根据需要设置,本说明书在此不做限制。
在本说明书一个或多个实施例中,该服务器在对重建图像进行特征匹配时,可使用现有的特征匹配算法,例如尺度不变特征变换(Scale-Invariant Feature Transform,SIFT)算法、ORB(Oriented FAST and Rotated BRIEF)算法等,当然也可以是其他算法,具体可根据需要设置,本说明书在此不做限制。
S108:根据得到的各匹配结果对所述重建对象进行三维重建。
在本说明书一个或多个实施例中,该服务器在对所有的数据组进行了组内以及组间的特征匹配后,可根据得到的各匹配结果,对该创建对象进行三维重建。
在本说明书一个或多个实施例中,该服务器可通过运动恢复结构(StructureFrom Motion,SFM)技术对该重建对象进行三维重建,当然也可以采用其他的三维重建技术,本说明书在此不做限制。
在本说明书一个或多个实施例中,该服务器在进行三维重建时,可根据匹配结果,从所有重建图像中,任意选取匹配成功的两帧重建图像,作为两个关键帧,并基于对极几何,确定两个关键帧的位姿。之后,该服务器可针对两个关键帧中每组特征点对,根据关键帧的位姿,通过三角化,确定与该组特征点对对应的同一个三维点的坐标。然后,该服务器可根据得到的各组特征点对应的若干三维点,确定与两个关键帧的三维点有对应特征点的下一帧重建图像。进一步地,该服务器可针对两个关键帧的每个三维点,根据该三维点的坐标,通过PNP(Perspective N-point)解算下一帧重建图像(即第三帧)的位姿。接着,该服务器可继续根据该下一帧重建图像的位姿以及两个关键帧的位姿,通过三角化,确定更多三维点的坐标,直至求解到下一帧(即第四帧)重建图像的位姿,并循环从三角化到通过PNP求解下一帧重建图像的位姿的过程,直到不存在未参与过该循环的重建图像。
基于图1所示的三维重建方法,通过对采集的重建对象的各帧图像进行目标检测,将属于预设类型的目标物的位置进行掩膜处理以确定重建图像,并根据采集各帧重建图像时的时序信息,对各重建图像进行分组,得到若干数据组,在数据组内,进行重建图像的顺序特征匹配,在数据组间,针对每个数据组,将该数据组的首帧重建图像与其他数据组的各帧重建图像进行两两匹配,以寻找不同数据组的共视区域,进行三维重建。
从上述方法中可以看出,本方法能够通过对特征匹配会产生干扰的目标物添加掩膜,去除其对匹配准确性的干扰,以及按时序对图像进行分组,减少进行整体暴力特征匹配的计算时间和计算量,提高三维重建的准确率以及重建效率。
另外,在本说明书提供的一个或多个实施例中,在获取到预先采集的重建对象的若干帧图像后,该服务器还可以采用其他方法对可能存在干扰的图像进行滤除,例如,仍然以该重建对象是商场的室内场景为例,由于商场中存在多家商户,各家商户都有自己的招牌,当不同商户的招牌较为相似时,或当一个商户的店面较大,有多个出入口且各出入口都装饰有招牌时,虽然不同出入口的招牌在商场的不同位置,但相同的招牌会在进行特征匹配时带来错误匹配。因此,该服务器还可以在获取到预先采集的重建对象的若干帧图像后,针对招牌进行识别,如通过光学字符识别(Optical Character Recognition,OCR)技术,具体的,该服务器可针对每一帧图像,对该帧图像进行OCR识别,以判断其中是否存在招牌区域,若是,则可将识别得到的招牌区域添加掩膜,将添加掩膜后的该帧图像作为重建图像。
在本说明书提供的一个或多个实施例中,在根据检测结果,从各帧图像中确定属于预设类型的目标物之前,该服务器还可以获取属于预设类型的目标物的基准图像以及预先采集的重建对象的若干帧图像,之后,该服务器可针对采集的每帧图像,将该帧图像与该基准图像进行相似性匹配,并根据匹配结果,从各帧图像中确定属于预设类型的目标物。并执行后续步骤。
其中,该基准图像可以是从多个视角采集的图像。例如,可以包括正视图、侧视图、仰视图、俯视图等,或者也可是有部分遮挡的目标物的图像。该基准图像可以是预先采集的属于预设类型的目标物的图像,也可以是从图像集中确定的,可根据需要设置,本说明书在此不做限制。
在本说明书提供的一个或多个实施例中,该服务器在将该帧图像与该基准图像进行相似性匹配时,可进行具体到目标物的匹配,也可以仅进行语义匹配。例如,以该基准图像是装饰挂画的图像为例,在进行具体到目标物的匹配时,需要当根据相似性匹配确定该帧图像与该基准图像是同一副挂画才能确定匹配成功,在仅进行语义匹配时,当根据相似性匹配确定该帧图像与该基准图像是同一类型的物体(装饰挂画)时,则确定匹配成功,具体可根据需要设置,本说明书在此不做限制。
由于相似性匹配已是较为成熟的技术,具体进行相似性匹配的过程,本说明书在此不做赘述。
在本说明书一个或多个实施例中,在步骤S104中,该服务器在根据该标识图像对各帧重建图像进行分组,得到各数据组时,具体可针对每帧标识图像,根据该采集顺序,确定该帧标识图像的相邻标识图像,然后判断该帧标识图像与该相邻标识图像间是否存在其他重建图像,若是,则确定该帧标识图像、该相邻标识图像以及该帧标识图像与该相邻标识图像间的其他重建图像为一个数据组。
其中,所述相邻,是指在时序上最接近。相邻两帧重建图像,是指各帧图像按照时序排列时,前后相邻的两帧重建图像。该帧标识图像的相邻标识图像,是指在各帧图像按照时序排列时,与该帧标识图像最接近的其他标识图像。
图3为本说明书提供的一种分组示意图。如图,各矩形表示各帧图像,其中,斜线填充的矩形表示标识图像,白色填充矩形表示重建图像。可见,图中示出了两个数据组,标识图像1、标识图像2及二者间的各重建图像构成一个数据组,标识图像3、标识图像4及二者间的各重建图像构成另一个数据组。可见,由于标识图像2与标识图像3之间不存在其他重建图像,因此,在对各重建图像进行分组时,不将标识图像2与标识图像3分为同一数据组。
图4为本说明书提供的一种采集路径示意图。图4为商场的室内场景的局部示意图图,图中的两个矩形表示商场内的两个商户区,虚线表示采集人员在采集图像时的采集路径,箭头表示采集方向,其中,斜线填充圆形表示采集路径的起始处,灰色填充的圆形表示采集人员暂停采集后重新开始采集的位置。可见采集人员从起始处向下采集,沿着采集路径采集到水平箭头末端处暂停采集,然后移动到灰色填充的圆形位置,向下采集到竖直箭头的末端。
图5为本说明书提供的一种采集路径示意图。如图,两个三角形表示商场内的两个商户区,虚线表示采集人员在采集图像时的采集路径,箭头表示采集方向,其中,斜线填充圆形表示采集路径的起始处。可见,采集人员从起始处朝着右下角方向沿着采集路径开始采集,到指向左边的箭头末端处完成对右侧三角形区域的图像采集,然后无需暂停,继续沿着采集路径对左侧三角形区域的图像进行采集,在指向右侧的箭头末端处完成采集。
在本说明书提供的一个或多个实施例中,在步骤S106之前,该服务器还可以在获取到预先采集的重建对象的若干帧图像后,先根据采集各帧图像的时序信息,对各帧图像进行分组,得到各数据组。然后,该服务器可再对各数据组内的图像进行目标检测,从中确定属于预设类型的目标物的图像区域,并通过对各帧图像中目标物的图像区域添加掩膜,确定各重建图像。
在本说明书一个或多个实施例中,当先对各帧图像进行分组再进行目标检测时,该服务器在进行目标检测时,若确定仅在同一数据组内的不同图像中多次出现同一种预设类型的目标物,可不对其图像区域添加掩膜。若在不同数据组间都出现同一种预设类型的目标物,再对其图像区域添加掩膜。或者,该服务器可实时基于目标物在不同数据组内的出现情况,确定预设类型的目标物。例如,当确定同一种类型的目标物仅在同一数据组内的不同图像中出现时,该服务器可不将其作为预设类型的目标物。当确定同一种类型的目标物在不同数据组间都出现时,再将其作为预设类型的目标物。
在本说明书一个或多个实施例中,还可预先确定采集各类型的目标物时,针对每一种类型的目标物,确定连续采集该类型的目标物所需的图像数量,并将该数量作为该类型的目标物的数量阈值。则,在该服务器获取到预先采集的重建对象的若干帧图像后,可确定采集到的图像中,包含该类型的目标物的图像数量。若该图像数量大于该数量阈值,则可将该类型的目标物作为预设类型的目标物,即可能对重建对象的重建存在干扰的干扰物。
另外,在本说明书一个或多个实施例中,还可以由机器人、无人驾驶设备等设备对重建对象的各帧图像进行采集。以由无人车进行图像采集为例,该无人车可沿预设的采集路径进行图像的采集,该无人车上可设置有传感器,以在采集过程中确定遇到的障碍物。当该无人车在采集过程中遇到移动障碍物(如商场内的流动人员)时,可根据前方的障碍物的数量和/或体积,判断是否采取避障采集策略。其中,该避障采集策略可包括:第一策略、第二策略以及第三策略中的一种。其中,第一策略:原地等待并暂停采集,待移动障碍物离开前方采集路径再沿采集路径继续采集。第二策略:绕暂停采集并过移动障碍物后再继续采集。第三策略:继续沿采集路径前进,但在有移动障碍物的区域暂停采集。
具体的,该无人车可判断移动障碍物的数量是否大于预设的障碍物数量,若是,则确定采取避障采集策略。或者,该无人车可判断移动障碍物的体积是否大于预设的障碍物体积,若是,则确定采取避障采集策略。当然,也可以结合障碍物的数量和体积来确定是否采取避障策略以及具体采取哪种避障策略,本说明书在此不做限制。
另外,在本说明书步骤S104中,该服务器在对各帧重建图像进行分组时,还可以根据时序信息,按照采集顺序将各帧重建图像顺序排列,并依次判断是否存在时间间隔大于预设间隔的两帧重建图像,若是,则将前一帧重建图像与时序上在其前方的所有重建图像确定为一个数据组。并对剩余的未分组重建图像继续判断是否存在时间间隔大于预设间隔的两帧重建图像,若是,则继续将确定出的未分组的前一帧重建图像与时序上在其前方的所有重建图像确定为一个数据组。直到所有重建图像皆被分组。之后,该服务器可针对每个数据组,将该数据组的首帧重建图像以及尾帧重建图像作为标识图像。
在本说明书一个或多个实施例中,不论是由采集人员进行重建对象的图像采集,还是由机器人、无人驾驶设备等其他设备自行采集,当由于遇到障碍物或采集到死胡同,需要暂停采集,待绕过障碍物后或转移到新地点继续采集时,为了保证后续采集的图像与暂停前采集的图像有共视区域,需要从已采集过的位置,沿未采集过的路径继续采集。另外,对于为了避障而暂停采集的部分路径,为了使采集到的图像完整,可在对采集对象采集结束后,针对避障(暂停采集)时的部分路径专门进行采集。
并且,为了在采集时,尽可能为后续对重建对象进行三维重建时提供便利,减少干扰,在暂停采集后,重新采集时,可从不存在预设类型的目标物开始采集,即,从已采集过的不存在预设类型的目标物的位置,沿未采集过的路径继续采集。
另外,需要说明的是,在本说明书中,重建对象的各帧图像是在没有采集位置信息的情况下进行三维重建的。
在本说明书一个或多个实施例中,该服务器在进行目标检测时,还可以仅针对预设类型的目标物进行检测,即通过目标检测直接得到图像中属于预设类型的目标物,并对其图像区域添加掩膜,无需从目标检测得到的多个类型的目标物中筛选属于预设类型的目标物。
以上为本说明书的一个或多个实施例提供的三维重建方法,基于同样的思路,本说明书还提供了相应的三维重建装置,如图6所示。
图6为本说明书提供的一种三维重建装置的示意图,该装置包括:
检测模块200,用于获取预先采集的重建对象的若干帧图像,并对各帧图像进行目标检测;
确定模块201,用于根据检测结果,从各帧图像中确定属于预设类型的目标物的图像区域,并通过对各帧图像中目标物的图像区域添加掩膜,确定各重建图像;
分组模块202,用于获取采集每帧重建图像的时序信息,根据所述时序信息,对各帧重建图像进行分组,得到各数据组;
匹配模块203,用于针对每个数据组,根据所述时序信息,依次将该数据组中的每帧重建图像与其相邻重建图像进行特征匹配,并将该数据组中的首尾帧重建图像与其他数据组中的各帧重建图像进行特征匹配;
重建模块204,用于根据得到的各匹配结果对所述重建对象进行三维重建。
可选地,所述检测模块200,用于针对每帧图像,对该图像进行目标检测,判断该图像中是否存在目标物,若是,则确定该图像中所述目标物的类型以及位置,并将确定出的所述目标物的类型以及位置作为检测结果,若否,则将该图像中不存在所述目标物作为检测结果。
可选地,所述确定模块201,用于根据检测结果,确定存在属于预设类型的目标物的各帧图像为目标图像,并确定不存在属于预设类型的目标物的各帧图像以及不存在任何目标物的各帧图像为标准图像,针对每帧目标图像,对该目标图像中属于预设类型的目标物的位置添加掩膜,将添加掩膜后的各目标图像以及各标准图像作为重建图像。
可选地,所述分组模块202,用于根据所述时序信息,确定各帧重建图像的采集顺序,按照所述采集顺序,依次确定相邻两帧重建图像间的时间间隔,判断是否存在时间间隔大于预设间隔的两帧重建图像,若是,则将时间间隔大于所述预设间隔的两帧重建图像作为标识图像,并根据得到的各标识图像对各帧重建图像进行分组,得到各数据组,其中,所述预设间隔大于采集图像的帧率。
可选地,所述分组模块202,用于针对每帧标识图像,根据所述采集顺序,确定该帧标识图像的相邻标识图像,判断该帧标识图像与所述相邻标识图像间是否存在其他重建图像,若是,则确定该帧标识图像、所述相邻标识图像以及该帧标识图像与所述相邻标识图像间的所述其他重建图像为一个数据组。
可选地,所述匹配模块203,用于根据所述时序信息,依次确定该数据组中的每帧重建图像作为目标匹配图像,根据预设的区间长度,确定所述目标匹配图像的匹配区间,将所述目标匹配图像与所述匹配区间内的其他重建图像进行特征匹配。
可选地,所述确定模块201,用于获取属于预设类型的目标物的基准图像以及预先采集的重建对象的若干帧图像,针对采集的每帧图像,将该帧图像与所述基准图像进行相似性匹配,根据匹配结果,从各帧图像中确定属于所述预设类型的目标物的图像区域。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1提供的三维重建方法。
本说明书还提供了图7所示的电子设备的示意结构图。如图7所示,在硬件层面,该电子设备包括处理器、内部总线、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1提供的三维重建方法。
当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、***或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (10)

1.一种三维重建方法,其特征在于,包括:
获取预先采集的重建对象的若干帧图像,并对各帧图像进行目标检测;
根据检测结果,从各帧图像中确定属于预设类型的目标物的图像区域,并通过对各帧图像中目标物的图像区域添加掩膜,确定各重建图像;
获取采集每帧重建图像的时序信息,根据所述时序信息,对各帧重建图像进行分组,得到各数据组;
针对每个数据组,根据所述时序信息,依次将该数据组中的每帧重建图像与其相邻重建图像进行特征匹配,并将该数据组中的首尾帧重建图像与其他数据组中的各帧重建图像进行特征匹配;
根据得到的各匹配结果对所述重建对象进行三维重建。
2.如权利要求1所述的方法,其特征在于,对各帧图像进行目标检测,具体包括:
针对每帧图像,对该图像进行目标检测,判断该图像中是否存在目标物;
若是,则确定该图像中所述目标物的类型以及位置,并将确定出的所述目标物的类型以及位置作为检测结果;
若否,则将该图像中不存在所述目标物作为检测结果。
3.如权利要求2所述的方法,其特征在于,根据检测结果,从各帧图像中确定属于预设类型的目标物的图像区域,并通过对各帧图像中目标物的图像区域添加掩膜,确定各重建图像,具体包括:
根据检测结果,确定存在属于预设类型的目标物的各帧图像为目标图像,并确定不存在属于预设类型的目标物的各帧图像以及不存在任何目标物的各帧图像为标准图像;
针对每帧目标图像,对该目标图像中属于预设类型的目标物的位置添加掩膜;
将添加掩膜后的各目标图像以及各标准图像作为重建图像。
4.如权利要求1所述的方法,其特征在于,根据所述时序信息,对各帧重建图像进行分组,得到各数据组,具体包括:
根据所述时序信息,确定各帧重建图像的采集顺序;
按照所述采集顺序,依次确定相邻两帧重建图像间的时间间隔;
判断是否存在时间间隔大于预设间隔的两帧重建图像;
若是,则将时间间隔大于所述预设间隔的两帧重建图像作为标识图像,并根据得到的各标识图像对各帧重建图像进行分组,得到各数据组;
其中,所述预设间隔大于采集图像的帧率。
5.如权利要求4所述的方法,其特征在于,根据得到的各标识图像对各帧重建图像进行分组,得到各数据组,具体包括:
针对每帧标识图像,根据所述采集顺序,确定该帧标识图像的相邻标识图像;
判断该帧标识图像与所述相邻标识图像间是否存在其他重建图像;
若是,则确定该帧标识图像、所述相邻标识图像以及该帧标识图像与所述相邻标识图像间的所述其他重建图像为一个数据组。
6.如权利要求1所述的方法,其特征在于,根据所述时序信息,依次将该数据组中的每帧重建图像与其相邻重建图像进行特征匹配,具体包括:
根据所述时序信息,依次确定该数据组中的每帧重建图像作为目标匹配图像;
根据预设的区间长度,确定所述目标匹配图像的匹配区间;
将所述目标匹配图像与所述匹配区间内的其他重建图像进行特征匹配。
7.如权利要求1所述的方法,其特征在于,根据检测结果,从各帧图像中确定属于预设类型的目标物的图像区域之前,所述方法还包括:
获取属于预设类型的目标物的基准图像以及预先采集的重建对象的若干帧图像;
针对采集的每帧图像,将该帧图像与所述基准图像进行相似性匹配;
根据匹配结果,从各帧图像中确定属于所述预设类型的目标物的图像区域。
8.一种三维重建装置,其特征在于,包括:
检测模块,用于获取预先采集的重建对象的若干帧图像,并对各帧图像进行目标检测;
确定模块,用于根据检测结果,从各帧图像中确定属于预设类型的目标物的图像区域,并通过对各帧图像中目标物的图像区域添加掩膜,确定各重建图像;
分组模块,用于获取采集每帧重建图像的时序信息,根据所述时序信息,对各帧重建图像进行分组,得到各数据组;
匹配模块,用于针对每个数据组,根据所述时序信息,依次将该数据组中的每帧重建图像与其相邻重建图像进行特征匹配,并将该数据组中的首尾帧重建图像与其他数据组中的各帧重建图像进行特征匹配;
重建模块,用于根据得到的各匹配结果对所述重建对象进行三维重建。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方法。
CN202110749332.XA 2021-07-02 2021-07-02 一种三维重建方法及装置 Active CN113643420B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110749332.XA CN113643420B (zh) 2021-07-02 2021-07-02 一种三维重建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110749332.XA CN113643420B (zh) 2021-07-02 2021-07-02 一种三维重建方法及装置

Publications (2)

Publication Number Publication Date
CN113643420A true CN113643420A (zh) 2021-11-12
CN113643420B CN113643420B (zh) 2023-02-03

Family

ID=78416498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110749332.XA Active CN113643420B (zh) 2021-07-02 2021-07-02 一种三维重建方法及装置

Country Status (1)

Country Link
CN (1) CN113643420B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114820751A (zh) * 2022-03-10 2022-07-29 中国海洋大学 用于场景三维重建的方法及装置、三维重建***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109272562A (zh) * 2018-08-21 2019-01-25 上海联影医疗科技有限公司 一种迭代重建的***和方法
CN111401359A (zh) * 2020-02-25 2020-07-10 北京三快在线科技有限公司 目标识别方法、装置、电子设备和存储介质
WO2020259264A1 (zh) * 2019-06-28 2020-12-30 Oppo广东移动通信有限公司 主体追踪方法、电子设备和计算机可读存储介质
CN112767541A (zh) * 2021-01-15 2021-05-07 浙江商汤科技开发有限公司 三维重建方法及装置、电子设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109272562A (zh) * 2018-08-21 2019-01-25 上海联影医疗科技有限公司 一种迭代重建的***和方法
WO2020259264A1 (zh) * 2019-06-28 2020-12-30 Oppo广东移动通信有限公司 主体追踪方法、电子设备和计算机可读存储介质
CN111401359A (zh) * 2020-02-25 2020-07-10 北京三快在线科技有限公司 目标识别方法、装置、电子设备和存储介质
CN112767541A (zh) * 2021-01-15 2021-05-07 浙江商汤科技开发有限公司 三维重建方法及装置、电子设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
毕福昆等: "机载复杂遥感场景下特定建筑区检测跟踪算法", 《电子学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114820751A (zh) * 2022-03-10 2022-07-29 中国海洋大学 用于场景三维重建的方法及装置、三维重建***

Also Published As

Publication number Publication date
CN113643420B (zh) 2023-02-03

Similar Documents

Publication Publication Date Title
JP6821762B2 (ja) 畳み込みニューラルネットワークを利用してpoi変化を検出するためのシステムおよび方法
Jafari et al. Real-time RGB-D based people detection and tracking for mobile robots and head-worn cameras
CN101689394B (zh) 用于视频索引和视频概要的方法和***
Gao et al. Robust RGB-D simultaneous localization and mapping using planar point features
WO2020134528A1 (zh) 目标检测方法及相关产品
US8885885B2 (en) Multi-cue object association
CN110119148A (zh) 一种六自由度姿态估计方法、装置及计算机可读存储介质
CN103093198B (zh) 一种人群密度监测方法及装置
CN106663196A (zh) 视频中的计算机显著人物识别
CN108596098B (zh) 人体部件的解析方法、***、设备和存储介质
CN111581423B (zh) 一种目标检索方法及装置
US20090141993A1 (en) System for finding archived objects in video data
CN110321885A (zh) 一种兴趣点的获取方法及装置
CN110544268B (zh) 一种基于结构光及SiamMask网络的多目标跟踪方法
US20200327733A1 (en) Augmented reality image retrieval systems and methods
US9076062B2 (en) Feature searching along a path of increasing similarity
CN113490050A (zh) 视频处理方法和装置、计算机可读存储介质及计算机设备
CN106558069A (zh) 一种基于视频监控下的目标跟踪方法及***
Zhou et al. Deep learning-based instance segmentation for indoor fire load recognition
CN113643420B (zh) 一种三维重建方法及装置
CN109558790A (zh) 一种行人目标检测方法、装置及***
WO2018149376A1 (zh) 一种视频摘要的生成方法及装置
Sharma Object detection and recognition using Amazon Rekognition with Boto3
US20240111835A1 (en) Object detection systems and methods including an object detection model using a tailored training dataset
CN113473181A (zh) 视频处理方法和装置、计算机可读存储介质及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant