CN117934869B - 一种目标检测方法、***、计算设备以及介质 - Google Patents

一种目标检测方法、***、计算设备以及介质 Download PDF

Info

Publication number
CN117934869B
CN117934869B CN202410331986.4A CN202410331986A CN117934869B CN 117934869 B CN117934869 B CN 117934869B CN 202410331986 A CN202410331986 A CN 202410331986A CN 117934869 B CN117934869 B CN 117934869B
Authority
CN
China
Prior art keywords
domain
loss value
target
network
discrimination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410331986.4A
Other languages
English (en)
Other versions
CN117934869A (zh
Inventor
赵训刚
周强
钟继卫
卢涛
黄晓航
王波
吴巨峰
符世长
刘诗洋
姚金鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Institute of Technology
China Railway Major Bridge Engineering Group Co Ltd MBEC
China Railway Bridge Science Research Institute Ltd
Original Assignee
Wuhan Institute of Technology
China Railway Major Bridge Engineering Group Co Ltd MBEC
China Railway Bridge Science Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Institute of Technology, China Railway Major Bridge Engineering Group Co Ltd MBEC, China Railway Bridge Science Research Institute Ltd filed Critical Wuhan Institute of Technology
Priority to CN202410331986.4A priority Critical patent/CN117934869B/zh
Publication of CN117934869A publication Critical patent/CN117934869A/zh
Application granted granted Critical
Publication of CN117934869B publication Critical patent/CN117934869B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种目标检测方法、***、计算设备以及介质。方法包括:获取高空监控视角的目标数据域和无人机视角的源数据域,并将所述目标数据域和所述源数据域作为训练集输入到初始模型中进行训练;在训练过程中确定所述判别损失值、对抗损失值和回归损失值;基于所述判别损失值对所述判别网络的参数进行调整,基于所述对抗损失值和所述回归损失值对初始模型的参数进行调整;直至迭代预设次轮后,获得训练完成的目标检测模型;获取高空监控视角的数据并将其输入到所述目标检测模型,获得检测结果。能够使目标检测模型较为准确地识别高空监控场景中不同尺度的待检测目标,以提高在面向实际高空监控场景中,目标检测模型的性能表现。

Description

一种目标检测方法、***、计算设备以及介质
技术领域
本发明涉及目标检测技术领域,具体涉及一种目标检测方法、***、计算设备以及介质。
背景技术
领域自适应学习在目标检测领域的应用主要关注源数据域和目标数据域之间的域偏移问题,旨在提高目标检测模型在目标数据域的性能表现。这种方法的目标是使目标检测模型在目标数据域上表现得足够好,而无需在目标数据域上进行大量标注工作,从而节省人力和时间成本。
现有技术中,通常是将源域和目标域映射到同一个空间中,并在这个空间中缩小两个域之间的距离,以实现域适应。但是,在面向高空监控场景时,由于待检测目标的尺度变化较大,即使将源域和目标域映射到同一个空间中,并在这个空间中缩小两个域之间的距离,目标检测模型也不能较为准确地对不同尺度的待检测目标进行检测。从而导致在面向实际高空监控场景中,目标检测模型在目标数据域上的性能表现较差。
发明内容
为了克服在面向实际高空监控场景中,目标检测模型在目标数据域上的性能表现较差的问题,本发明提供了一种目标检测方法、***、计算设备以及介质。
第一方面,为了解决上述技术问题,本发明提供了一种目标检测方法,包括:
S1、获取高空监控视角的目标数据域和无人机视角的源数据域,并将所述目标数据域和所述源数据域作为训练集输入到初始模型中进行训练;其中,所述源数据域为具有真实标注信息的数据域;
S2、将所述目标数据域和所述源数据域输入到生成网络,分别获得所述目标数据域的多个不同尺度的第一域不变特征和所述源数据域的多个不同尺度的第二域不变特征;其中,多个所述第一域不变特征和多个所述第二域不变特征的尺度一一对应;
S3、基于判别网络分别判断相同尺度的所述第一域不变特征和所述第二域不变特征来自的数据域,确定所述判别网络的判别损失值和所述生成网络的对抗损失值;
S4、通过目标回归网络、多个所述第二域不变特征以及所述源数据域的真实标注信息,计算所述目标回归网络的回归损失值;
S5、基于所述判别损失值对所述判别网络的参数进行调整,基于所述对抗损失值和所述回归损失值对所述生成网络的参数进行调整,基于所述回归损失值对所述目标回归网络进行调整;并重复执行步骤S2至S5,直至迭代预设次轮后,获得训练完成的目标检测模型;
S6、获取高空监控视角的数据,并将所述高空监控视角的数据输入到所述目标检测模型,获得所述数据对应的检测结果。
第二方面,为了解决上述技术问题,本发明提供了一种目标检测***,包括:
获取模块,用于获取高空监控视角的目标数据域和无人机视角的源数据域,并将所述目标数据域和所述源数据域作为训练集输入到初始模型中进行训练;其中,所述源数据域为具有真实标注信息的数据域;
生成模块,用于将所述目标数据域和所述源数据域输入到生成网络,分别获得所述目标数据域的多个不同尺度的第一域不变特征和所述源数据域的多个不同尺度的第二域不变特征;其中,多个所述第一域不变特征和多个所述第二域不变特征的尺度一一对应;
判别模块,用于基于判别网络分别判断相同尺度的所述第一域不变特征和所述第二域不变特征来自的数据域,确定所述判别网络的判别损失值和所述生成网络的对抗损失值;
回归模块,用于通过目标回归网络、多个所述第二域不变特征以及所述源数据域的真实标注信息,计算所述目标回归网络的回归损失值;
调整模块,用于基于所述判别损失值对所述判别网络的参数进行调整,基于所述对抗损失值和所述回归损失值对所述生成网络的参数进行调整,基于所述回归损失值对所述目标回归网络进行调整;并重复执行生成模块、判别模块、回归模块以及调整模块的步骤,直至迭代预设次轮后,获得训练完成的目标检测模型;
检测模块,用于获取高空监控视角的数据,并将所述高空监控视角的数据输入到所述目标检测模型,获得所述数据对应的检测结果。
第三方面,为了解决上述技术问题,本发明提供了计算设备,包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的程序,所述处理器执行所述程序时实现如上述所述的一种目标检测方法的步骤。
第四方面,为了解决上述技术问题,本发明提供了计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如上述所述的一种目标检测方法的步骤。
本发明的有益效果是:通过生成网络获得目标数据域输入样本的多个不同尺度的第一域不变特征,以及获得源数据域输入样本的多个不同尺度的第二域不变特征。再通过判别网络分别判断相同尺度的第一域不变特征和第二域不变特征来自的数据域,从而获得判别损失值和对抗损失值。利用判别损失值对判别网络的参数进行调整,从而使得判别网络能够对不同尺度的域不变特征进行判别以适应不同尺度大小的待检测目标,以提高判别损失值和对抗损失值的准确度,从而提高判别网络对不同尺度的域不变特征的判别准确率,以及促使生成网络生成难以使判别网络判别的域不变特征,从而使得训练好的目标检测模型能够利用源域的标注信息对目标域的输入样本进行较为准确地检测。再基于目标回归网络对第二域不变特征进行处理从而获得回归损失值。
这样,通过判别网络对不同尺度的域不变特征分别判别获得判别损失值和对抗损失值,再基于目标回归网络获得回归损失值,再利用对抗损失值和回归损失值调整生成网络和目标回归网络的参数,使得获得的目标检测模型能够较为准确地识别高空监控场景中不同尺度的待检测目标,以提高在面向实际高空监控场景中,目标检测模型在目标数据域上的性能表现。
附图说明
图1为本发明提供的一种目标检测方法的流程示意图;
图2为本发明提供的一个实施例的示意图;
图3为本发明提供的一种目标检测***的结构示意图。
具体实施方式
以下对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
领域自适应学习在目标检测领域的应用主要关注源域和目标域之间的域偏移问题,旨在提高模型在目标域的性能表现。这种方法的目标是使模型在目标域上表现得足够好,而无需在目标域上进行大量标注工作,从而节省人力和时间成本。DAF是将领域自适应学习应用于目标检测模型的经典之作,之后涌现了许多方法在该问题上取得了较好的效果。目前的领域自适应目标检测方法主要包括基于特征对齐的方法、基于半监督学习的方法和基于数据增强的方法。
基于特征对齐的方法通过将源域和目标域映射到同一个空间中,并在这个空间中缩小两个域之间的距离,以实现域适应。具体来说,Tzeng等人提出将源域和目标域的特征转换为再生希尔伯特空间(Reproducing Kernel Hilbert Space, RKHS),然后最小化域在RKHS 中的最大平均差异,以拉近两个域之间的距离。
基于半监督学习的 MTOR方法是针对领域自适应学习中源域数据有标注而目标域数据无标注的特点,使用半监督学习的方法对无标签的目标域数据进行学习。MTOR提出使用Mean Teacher模型进行领域自适应学习。MTOR通过伪标签对无标注的目标域数据集进行无监督学习,生成的伪标签虽然能够提供额外的信息来提高模型的性能,但是由于模型本身存在误差,这些误差也会被传递到伪标签中,在领域自适应学习中源域和目标域的特征分布的不同更是加重了这种问题。Inoue等人提出使用一组分类器和回归器对伪标签进行过滤和微调,提升伪标签的鲁棒性。UMT进一步地关注了模型在源域和目标域之间的偏差,提出利用模型在源域数据效果更好的特点,生成更准确的伪标签。
基于数据增强的方法从输入图像层面解决域偏移问题,对图像进行风格转换,使源域数据和目标域数据更加相似,从而完成域适应。Inoue等人将源域数据集转换为目标域风格的中间域数据集,然后在中间域数据集上进行微调(fine-tuning),使模型学习到目标域的知识。MAM将目标域数据集迁移为多个转换域(translated domain)数据集,然后使用多分类的分类器,对转换域进行分类,提高模型的泛化能力,进而实现领域自适应。
但是,由于在高空监控场景中,待检测目标的尺度有明显变化。而以上方法只是通过一些手段拉近目标数据域和源数据域之间的距离,以便进行域适应。并未针对高空监控场景中的待检测目标进行域适应的调整,从而使得目标检测模型也不能较为准确地对不同尺度的待检测目标进行检测。从而导致在面向实际高空监控场景中,目标检测模型在目标数据域上的性能表现较差。
以下结合附图描述本发明实施例的一种目标检测方法、***、计算设备以及介质。
如图1所示,本公开实施例提供了一种目标检测方法,包括:
步骤S1、获取高空监控视角的目标数据域和无人机视角的源数据域,并将目标数据域和源数据域作为训练集输入到初始模型中进行训练;其中,源数据域为具有真实标注信息的数据域。
具体的,初始模型包括神经卷积网络、yolo系列等多种目标检测模型。
可以理解的是,高空监控视角的目标数据域是高空监控视角的图像数据的数据 域。无人机视角的源数据域为无人机视角的图像数据的数据域。其中,目标数据域是输入初始模型的样本图像。源数据域是 输入初始模型的样本图像,为源数据域真实标注的目标框的坐标,表示源数据域真实 标注的目标类别。
步骤S2、将目标数据域和源数据域输入到生成网络,分别获得目标数据域的多个不同尺度的第一域不变特征和源数据域的多个不同尺度的第二域不变特征;其中,多个第一域不变特征和多个第二域不变特征的尺度一一对应。
步骤S3、基于判别网络分别判断相同尺度的第一域不变特征和第二域不变特征来自的数据域,确定判别网络的判别损失值和生成网络的对抗损失值。
可以理解的是,第一域不变特征来自的数据域为目标数据域,第二域不变特征来自的数据域为源数据域。
步骤S4、通过目标回归网络、多个第二域不变特征以及源数据域的真实标注信息,计算目标回归网络的回归损失值。
步骤S5、基于判别损失值对判别网络的参数进行调整,基于对抗损失值和回归损失值对生成网络和目标回归网络的参数进行调整,基于回归损失值对目标回归网络进行调整;并重复执行步骤S2至S5,直至迭代预设次轮后,获得训练完成的目标检测模型。
在一些实施例中,预设次轮为300。这样,通过对判别网络、生成网络以及目标回归网络的参数进行调整,在迭代预设次轮后,通过域适应的对抗学习,得到最优的模型-目标检测模型。
步骤S6、获取高空监控视角的数据,并将高空监控视角的数据输入到目标检测模型,获得数据对应的检测结果。
可以理解的是,这里的高空监控视角的数据为测试数据或待检测数据,并非训练集中的数据。
采用本公开实施例提供的一种目标检测的的方法,通过生成网络获得目标数据域输入样本的多个不同尺度的第一域不变特征,以及获得源数据域输入样本的多个不同尺度的第二域不变特征。再通过判别网络分别判断相同尺度的第一域不变特征和第二域不变特征来自的数据域,从而获得判别损失值和对抗损失值。利用判别损失值对判别网络的参数进行调整,从而使得判别网络能够对不同尺度的域不变特征进行判别以适应不同尺度大小的待检测目标,以提高判别损失值和对抗损失值的准确度,从而提高判别网络对不同尺度的域不变特征的判别准确率,以及促使生成网络生成难以使判别网络判别的域不变特征,从而使得训练好的目标检测模型能够利用源域的标注信息对目标域的输入样本进行较为准确地检测。再基于目标回归网络对第二域不变特征进行处理从而获得回归损失值。
这样,通过判别网络对不同尺度的域不变特征分别判别获得判别损失值和对抗损失值,再基于目标回归网络获得回归损失值,再利用对抗损失值和回归损失值调整生成网络和目标回归网络的参数,使得获得的目标检测模型能够较为准确地识别高空监控场景中不同尺度的待检测目标,以提高在面向实际高空监控场景中,目标检测模型在目标数据域上的性能表现。将高空监控的图像数据输入到训练完成的目标检测模型,能够获得该输入数据的检测结果。
另外,通过生成网络与判别网络之间的对抗,实现了高空监控视角的图像与无人机视角的图像之间特征的对齐,从而生成域不变特征。这样的特征生成机制使得模型能够在高空监控视角下产生准确的检测结果,即便在无法获得目标数据域的标注数据的情况下也能保持出色的性能。
为了便于理解,结合图2对生成网络与判别网络之间的对抗进行描述。生成网络针 对目标数据域输入样本先进行下采样处理,获得多个不同尺度的第一特征图,再对着多个 不同尺度的第一特征图进行特征融合,生成目标数据域输入样本(第一样本)对应的多个不 同尺度的第一域不变特征。生成网络针对源数据域输入样本先进行下采样处理,获得多个 不同尺度的第二特征图,再对着多个不同尺度的第二特征图进行特征融合,生成源数据域 输入样本(第二样本)对应的多个不同尺度的第二域不变特征。判别网络利用多尺度鉴别器 (多个不同尺度的鉴别器)分别对相应尺度的第一域不变特征和第二域不变特征进行判别, 获得对抗损失值。通过优化器(未示出)基于生成网络的参数进行调整,从而使得 生成网络生成难以被判别网络判别的域不变特征。
优选的,获取高空监控视角的目标数据域和无人机视角的源数据域,包括:基于高空监控场景的图像特性,获取高空监控视角的目标数据域和无人机视角的源数据域。其中,高空监控场景的图像特征包括图像视角,和/或,图像光照均匀情况,和/或,图像上待检测目标的尺度情况。
可以理解的是,高空监控场景下,高空监控视角有着自身的图像特性。譬如,其一:建筑物、车、人等待检测目标的尺度差距较大,且车和人等是流动的,在不同的监控高度下,建筑物、车以及人的尺度也会有明显不同。因此,图像中待检测目标的尺度变化大。其二:监控设备受光照影响较大,而光照监控高度、天气等情况有关,使得采集到的图像光照不均匀。其三:高空监控视角是以俯视的角度采集图像,而建筑物、车、人等待检测目标在不同视角下,也会有明显区别(如,俯视视角和正面视角完全不同)。而无人机在飞行时,位置、飞行高度等都会发生变化,从而导致采集到的图像也会存在待检测目标的尺度差距较大、图像光照不均匀等情况;另外,将无人机同样也是以俯视角度采集图像。因此,无人机采集到的图像与高空监控场景的图像具有相同的图像特性。因此,将无人机视角的图像数据作为源数据域,利用该源数据域的真实标注信息,能够有效解决高空监控视角的目标数据域的域偏移的问题,有利于对初始模型进行训练,以获得在高空监控场景中有较好表现性能的目标检测模型。
优选的,将目标数据域和源数据域输入到生成网络,分别获得目标数据域的多个不同尺度的第一域不变特征和源数据域的多个不同尺度的第二域不变特征。其中,多个第一域不变特征和多个第二域不变特征的尺度一一对应,包括:分别从目标数据域中选出任意一个第一样本,以及从源数据域中选出任意一个第二样本。分别将第一样本和第二样本输入到生成网络,对第一样本进行多尺度的下采样处理以获得多张第一特征图,以及对第二样本进行多尺度的下采样处理以获得多张第二特征图。其中,多张第一特征图和多张第二特征图的尺度一一对应。对多张第一特征图进行特征融合,获得第一样本的多个不同尺度的第一域不变特征,以及对多张第二特征图进行特征融合,获得第二样本的多个不同尺度的第二域不变特征。
这样,通过生成网络生成多个不同尺度的第一域不变特征和多个不同尺度的第二域不变特征,且每个第一域不变特征的尺度与一个第二域不变特的特征相同,使得生成的第一域不变特征和第二域不变特征具有不同尺度的细节描述,便于判别网络对相同尺度的第一域不变特征和第二域不变特征进行较为准确地判别,从而获得较为准确地判别损失值和对抗损失值。再根据对抗损失值对生成网络的参数进行调节,以使生成网络生成较为相似的第一域不变特征和第二域不变特征,从而能够使得目标检测模型能够更好地利用源数据域的真实标注信息对目标数据域的输入样本进行目标检测,以提高目标检测模型在目标数据域上的表现性能。
进一步的,分别将第一样本和第二样本输入到生成网络,对第一样本进行多尺度的下采样处理以获得多张第一特征图,以及对第二样本进行多尺度的下采样处理以获得多张第二特征图;其中,多张第一特征图和多张第二特征图的尺度一一对应,包括:分别将第一样本和第二样本输入到生成网络,生成网络利用CSPDarknet生成特征,CSPDarknet53 以多个 CSPStage 开始。每个 CSPStage 包含一个主干路径和一个支路。主干路径是由一系列的 Residual Block组成,每个Residual Block包含卷积层和残差连接。支路通过 CSP结构将两个主干路径的特征连接在一起,实现信息的跨阶段传递。CSPDarknet分别对第一样本生成下采样8,16,32倍的第一特征图,以及对第二样本生成下采样8,16,32倍的第二特征图。其中,下采样8倍的第一特征图与下采样8倍的第二特征图相对应;下采样16倍的第一特征图与下采样16倍的第二特征图相对应;下采样32倍的第一特征图与下采样32倍的第二特征图相对应。这样,分别生成多个尺度的第一特征图和多个尺度的第二特征图,便于获得不同尺度下的特征的细节情况。
进一步的,对多张第一特征图进行特征融合,获得第一样本的多个不同尺度的第一域不变特征,以及对多张第二特征图进行特征融合,获得第二样本的多个不同尺度的第二域不变特征,包括:生成网络利用PANet(Path Aggregation Network)进行特征融合,PANet采用了自顶向下和自底向上两个信息传播路由。自顶向下路由负责将生成的下采样8,16,32倍的第一特征图自顶向下将高层语义特征逐层进行上采样传播至底层以融合全局上下文信息;自底向上路由从低级细节特征开始逐层聚合传播至高层以提取细粒度的局部信息。这两个路由在每一级通过融合操作相互交互,使得网络能够充分结合全局和局部信息。最终输出整合后的8,16,32倍的特征图,即输出下采样8、16、32倍的第一域不变特征。同理,自顶向下路由负责将生成的下采样8,16,32倍的第二特征图自顶向下将高层语义特征逐层进行上采样传播至底层以融合全局上下文信息;自底向上路由从低级细节特征开始逐层聚合传播至高层以提取细粒度的局部信息。这两个路由在每一级通过融合操作相互交互,使得网络能够充分结合全局和局部信息。最终输出整合后的8,16,32倍的特征图,即输出下采样8,16,32倍的第二域不变特征。其中,下采样8倍的第一域不变特征与下采样8倍的第二域不变特征相对应;下采样16倍的第一域不变特征与下采样16倍的第二域不变特征相对应;下采样32倍的第一域不变特征与下采样32倍的第二域不变特征相对应。
优选的,判别网络包括多个不同尺度的鉴别器;基于判别网络分别判断相同尺度的第一域不变特征和第二域不变特征来自的数据域,确定判别网络的判别损失值和生成网络的对抗损失值,包括:将相同尺度的第一域不变特征和第二域不变特征输入到对应尺度的鉴别器中进行鉴别,以判断相同尺度的第一域不变特征和第二域不变特征来自的数据域,获得每个鉴别器的判别结果。基于各个判别结果,计算判别损失值和对抗损失值。
这样,通过不同尺度的鉴别器分别对相应尺度的第一域不变特征和第二域不变特征进行鉴别,从而能够从不同尺度对目标数据域输入样本和源数据域输入样本生成的域不变特征进行鉴别,以使判别网络能够对不同尺度的待检测目标进行适应,以根据不同尺度的待检测目标进行自适应感受野的调整,从而判别网络和生成对抗网络的参数进行直接调整,并间接调整目标回归网络的参数,以实现对目标检测模型的参数进行对应的调整。从而使目标检测模型能够准确对不同尺度的待检测目标进行检测,以提高在高空监测场景下,目标检测模型对目标域(高空监控视角的图像数据)的性能表现。
具体的,判别网络为多尺度判别网络,该判别网络包括多个不同尺度的鉴别器,每个鉴别器用以对相同尺度的第一域不变特征和第二域不变特征进行鉴别。鉴别器的数量与第一域不变特征或第二域不变特征的尺度数量相同。例如,第一域不变特征的尺度数量有3个,包括下采样8倍的第一域不变特征、下采样16倍的第一域不变特征以及下采样32倍的第一域不变特征。第二域不变特征的尺度数量有3个,为下采样8倍的第二域不变特征、下采样16倍的第二域不变特征以及下采样32倍的第二域不变特征。则,鉴别器的数量也为3个,为第一鉴别器、第二鉴别器以及第三鉴别器。其中,第一鉴别器对下采样8倍的第一域不变特征和下采样8倍的第二域不变特征进行鉴别。第二鉴别器对下采样16倍的第一域不变特征和下采样16倍的第二域不变特征进行鉴别。第三鉴别器对下采样32倍的第一域不变特征和下采样32倍的第二域不变特征进行鉴别。
具体的,每个鉴别器由四个DLS模块和一个线性层组成。DLS模块由可变形卷积、LeakyReLU层和光谱归一化(spectralnormalization)操作组成。其中可变形卷积采用stride= 2,padding=1的设置。通过DLS模块,将特征图的通道数降为统一的128。线性层对四个DLS模块输出的特征图进行分类,判断该特征图来自哪个数据域,从而获得每个鉴别器对应的判别结果。其中,可变形卷积,能够根据不同尺度的目标进行自适应感受野的调整。
优选的,基于各个判别结果,计算判别损失值,包括:基于各个判别结果,计算每个鉴别器的损失值,计算公式如下:
其中,为第n个鉴别器的损失值,为第n个鉴别器对来自源数据域的 第二域不变特征的判别结果,为第n个鉴别器对来自目标数据域的第一域不变 特征的判别结果。基于全部鉴别器的损失值,计算判别损失值,计算公式如下:
其中,为判别网络的判别损失值,N为鉴别器的数量。
这样,通过每个鉴别器的判别结果计算对应的损失值,并以此获得判别网络总的 损失值,以便对判别网络的参数进行调整,从而提高判别网络判别第一域不变特征和第二 域不变特征所属的来源域,即提高判别网络的判别能力。不同尺度的第一域不变特征对不 同尺度大小的待检测目标的描述有所不同,不同尺度的第二域不变特征对不同尺度大小的 待检测目标的描述有所不同,因此不同尺度的鉴别对相应尺度的鉴别器对相应尺度的第一 域不变特征和第二域不变特征进行判别,能够反映出不同尺度的鉴别器对不同尺度的待检 测目标的鉴别情况也有所不同。因此,通过获得每个鉴别器的判别损失值,从而对判别网络 的参数进行调整,以使判别网络能够准确判别不同尺度的域不变特征所属的来源域。换言 之,不断提升判别网络对每个鉴别器的特征提取能力,提升每个鉴别器分析特征的来源域 的能力。整个判别网络的判别损失函数()由所有鉴别器的判别损失值(判别损失函数) 求和获得,通过三个鉴别器的结合,判别损失函数()能够从不同尺寸的第一域不变特征 和第二域不变特征上,学习到不同维度的特征,更好地对数据来源域进全面的分析。
优选的,基于各个判别结果,计算对抗损失值,包括:获取每个鉴别器占全部鉴别器的第一权重。基于各个判别结果和各个第一权重,计算对抗损失值,计算公式如下:
其中,为对抗损失值,为第n个鉴别器的第一权重,为第n个 鉴别器对来自源数据域的第二域不变特征的判别结果,N为鉴别器的数量。
基于判别网络分别判断相同尺度的第一域不变特征和第二域不变特征来自的数据域,获得对应的判别结果。鉴别器的判别结果能够反映第一域不变特征和第二域不变特征之间的相似度,即反映生成网络针对目标域输入样本和源域输入样本所分别生成的特征之间的相似度,以便对生成网络的参数进行调整,以使生成网络能够生成难以被鉴别器判别来源数据域的第一域不变特征和第二域不变特征。不同尺度的第一域不变特征对不同尺度大小的待检测目标的描述有所不同,不同尺度的第二域不变特征对不同尺度大小的待检测目标的描述有所不同,因此不同尺度的鉴别对相应尺度的鉴别器对相应尺度的第一域不变特征和第二域不变特征进行判别,能够反映出不同尺度的鉴别器对不同尺度的待检测目标的鉴别情况也有所不同。
这样,通过鉴别器的判别结果获得对抗损失值以对生成网络的参数进行调整,能 够使生成网络针对不同尺度的待检测目标生成与源数据域更为相似的域不变特征,以便目 标检测模型对不同尺度的待检测目标进行检测。换言之,通过判别网络对第一域不变特征 和第二域不变特征来自的数据域进行判别,从而获得判别损失值和对抗损失值。基于对抗 损失值对生成网络的参数进行调整,以使生成网络生成难以被判别网络区分来源数据域的 第一域不变特征和第二域不变特征。基于判别损失值对判别网络的参数进行调整,以使判 别网络能够更准确地判断相同尺度的第一域不变特征和第二域不变特征来自的数据域,即 以使判别网络能够更准确地区分第一域不变特征和第二域不变特征。从而实现判别网络和 生成网络之间的对抗。即,基于对抗损失对生成网络的参数进行调整,以促进生成网络学习 到不同数据域下的同类特征的域不变特征,加大判别网络的判别难度,提升特征提取网络 对无人机影像和监控视角图像域不变特征的提取能力。进一步的,获取每个鉴别器占全部 鉴别器的第一权重,包括:基于高空监控场景中,不同类别的待检测目标的尺度情况,获取 每个鉴别器占全部鉴别器的第一权重。由于,高空监控场景中,不同类型的待检测目标的尺 度差异较大(例如,建筑类、车类和人物类的尺度差异较大),在高空监控视角的图像中的占 比有明显区别。从而使得判别网络对不同类别域不变特征的判别难度也有所差异。因此,通 过基于不同类别的待检测目标的尺度情况,获取每个鉴别器占全部鉴别器的第一权重,能 够根据目标检测模型的检测需求对各个鉴别器的权重进行调整,从而获得更符合高空监控 场景下的对抗损失值(对抗损失函数),以便对生成网络的参数进行调整。
优选的,通过目标回归网络、多个第二域不变特征以及源数据域的真实标注信息,计算目标回归网络的回归损失值,包括:基于目标回归网络对多个第二域不变特征进行处理,获得预测结果。基于预测结果和源数据域的真实标注信息,计算目标回归网络的回归损失值。源数据域为具有真实标注信息的数据域,源数据域的输入样本为具有真实标注信息的输入样本(即第二样本)。这样,通过目标回归网络对第二样本对应的多尺度特征图(即多个第二域不变特征)进行处理,通过一系列卷积操作来处理输入特征图,以提取更高级的语义信息。最终经过预测层,获得对应的预测结果,并基于预测结果与真实标注信息获得回归损失值,能够反映出生成网络生成的第二域不变特征的准确度,以便对生成网络的参数进行调整。从而使得生成网络就输入样本生成判别网络和目标回归网络所需的域不变特征,以提高目标回归网络生成的预测结果的准确度,从而提高目标检测模型在高空监控视角的目标数据域上的性能表现能力。
优选的,预测结果和真实标注信息均包括目标框和目标类别;基于预测结果和源数据域的真实标注信息,计算目标回归网络的回归损失值,包括:基于预测结果和源数据域的真实标注信息,分别计算位置损失值、类别损失值和置信度损失值。分别获取位置损失值、类别损失值以及置信度损失值在回归损失值中的第二权重。基于各个第二权重、位置损失值、类别损失值以及置信度损失值,计算目标回归网络的回归损失值,计算公式如下:
其中,为目标回归网络的回归损失值,为位置损失的第二权重、为 位置损失值、为类别损失的第二权重、为类别损失值、为置信度的第二 权重、为置信度损失值。
这样,位置损失值、类别损失值和置信度损失值能够反映预测结果与真实标注信息之间的误差。而位置损失值、类别损失值和置信度损失值对预测结果与真实标注信息之间的误差重要性有所差异。因此,通过基于各个第二权重、位置损失值、类别损失值以及置信度损失值,计算回归损失值,便于对目标回归网络和生成网络的参数进行调整。
具体的,位置损失值表征预测的目标框和真实的目标框的位置误差情况。类别损失表征预测的目标类别与真实的目标类别的误差情况。置信度损失值表征预测的目标框和真实的目标框的重叠情况。
在一些实施例中,通过一个优化器对目标检测模型的参数进行优化。目标检测模型的参数包括生成网络和目标回归网络的参数。通过三个优化器分别对判别网络的参数进行调整。判别网络的参数包括三个鉴别器的参数。
结合图3所示,本公开实施例提供一种目标检测***100。该***包括:获取模块101、生成模块102、判别模块103、回归模块104、调整模块105以及检测模块106。获取模块101,用于获取高空监控视角的目标数据域和无人机视角的源数据域,并将目标数据域和源数据域作为训练集输入到初始模型中进行训练。其中,源数据域为具有真实标注信息的数据域。生成模块102,用于将目标数据域和源数据域输入到生成网络,分别获得目标数据域的多个不同尺度的第一域不变特征和源数据域的多个不同尺度的第二域不变特征。其中,多个第一域不变特征和多个第二域不变特征的尺度一一对应。判别模块103,用于基于判别网络分别判断相同尺度的第一域不变特征和第二域不变特征来自的数据域,确定判别网络的判别损失值和生成网络的对抗损失值。回归模块104,用于通过目标回归网络、多个第二域不变特征以及源数据域的真实标注信息,计算目标回归网络的回归损失值。调整模块105,用于基于判别损失值对判别网络的参数进行调整,基于对抗损失值和回归损失值对生成网络的参数进行调整,基于回归损失值对目标回归网络进行调整;并重复执行生成模块、判别模块、回归模块以及调整模块的步骤,直至迭代预设次轮后,获得训练完成的目标检测模型。检测模块106,用于获取高空监控视角的数据,并将高空监控视角的数据输入到目标检测模型,获得数据对应的检测结果。
采用本公开实施例的一种目标检测***,通过生成网络获得目标数据域输入样本的多个不同尺度的第一域不变特征,以及获得源数据域输入样本的多个不同尺度的第二域不变特征。再基于判别网络分别判断相同尺度的第一域不变特征和第二域不变特征来自的数据域,从而获得判别损失值和对抗损失值。利用判别损失值对判别网络的参数进行调整,从而使得判别网络能够对不同尺度的域不变特征进行判别以适应不同尺度大小的待检测目标,以提高判别损失值和对抗损失值的准确度,从而提高判别网络对不同尺度的域不变特征的判别准确率,以及促使生成网络生成难以使判别网络判别的域不变特征,从而使得训练好的目标检测模型能够利用源域的标注信息对目标域的输入样本进行较为准确地检测。再基于目标回归网络对第二域不变特征进行处理从而获得回归损失值。
这样,通过判别网络对不同尺度的域不变特征分别判别获得判别损失值和对抗损失值,再基于目标回归网络获得回归损失值,再利用对抗损失值和回归损失值调整生成网络和目标回归网络的参数,使得获得的目标检测模型能够较为准确地识别高空监控场景中不同尺度的待检测目标,以提高在面向实际高空监控场景中,目标检测模型在目标数据域上的性能表现。将高空监控的图像数据输入到训练完成的目标检测模型,能够获得该输入数据的检测结果。
另外,通过生成网络与判别网络之间的对抗,实现了高空监控视角的图像与无人机视角的图像之间特征的对齐,从而生成域不变特征。这样的特征生成机制使得模型能够在高空监控视角下产生准确的检测结果,即便在无法获得目标数据域的标注数据的情况下也能保持出色的性能。
优选的,生成模块包括第一单元、第二单元以及第三单元。其中,第一单元用于分别从目标数据域中选出任意一个第一样本,以及从源数据域中选出任意一个的第二样本。第单元用于分别将第一样本和第二样本输入到生成网络,对第一样本进行多尺度的下采样处理以获得多张第一特征图,以及对第二样本进行多尺度的下采样处理以获得多张第二特征图。其中,多张第一特征图和多张第二特征图的尺度一一对应。第三单元用于对多张第一特征图进行特征融合,获得第一样本的多个不同尺度的第一域不变特征,以及对多张第二特征图进行特征融合,获得第二样本的多个不同尺度的第二域不变特征。
优选的,判别网络包括多个不同尺度的鉴别器。判别模块包括第四单元和第五单元。其中,第四单元用于将相同尺度的第一域不变特征和第二域不变特征输入到对应尺度的鉴别器中进行鉴别,以判断相同尺度的第一域不变特征和第二域不变特征来自的数据域,获得每个鉴别器的判别结果。第五单元用于基于各个判别结果,计算判别损失值和对抗损失值。
通过判别网络对第一域不变特征和第二域不变特征来自的数据域进行判别,从而获得判别损失值和对抗损失值。基于对抗损失值对生成网络的参数进行调整,以使生成网络生成难以被判别网络区分来源数据域的第一域不变特征和第二域不变特征。基于判别损失值对判别网络的参数进行调整,以使判别网络能够更准确地判断相同尺度的第一域不变特征和第二域不变特征来自的数据域,即以使判别网络能够更准确地区分第一域不变特征和第二域不变特征。从而实现判别网络和生成网络之间的对抗。
优选的,第五单元包括第一子单元。第一子单元用于基于各个判别结果,计算每个鉴别器的损失值,计算公式如下:
其中,为第n个鉴别器的损失值,为第n个鉴别器对来自源数据域的域 不变特征的判别结果,为第n个鉴别器对来自目标数据域的域不变特征的判别结 果。基于全部鉴别器的损失值,计算判别损失值,计算公式如下:
其中,为判别网络的判别损失,N为鉴别器的数量。
优选的,第五单元包括第二子单元。第二子单元用于获取每个鉴别器占全部鉴别器的第一权重。基于各个判别结果和各个第一权重,计算对抗损失值,计算公式如下:
其中,为对抗损失值,为第n个鉴别器的第一权重,为第n个鉴 别器对来自源数据域的域不变特征的鉴别结果,N为鉴别器的数量。
优选的,回归模块包括第六单元和第七单元。其中,第六单元用于基于目标回归网络对多个第二域不变特征进行处理,获得预测结果。第七单元用于基于预测结果和源数据域的真实标注信息,计算目标回归网络的回归损失值。
优选的,第七单元包括第三子单元。第三子单元用于基于预测结果和源数据域的真实标注信息,分别计算位置损失值、类别损失值和置信度损失值。分别获取位置损失值、类别损失值以及置信度损失值在回归损失值中的第二权重。基于各个第二权重、位置损失值、类别损失值以及置信度损失值,计算目标回归网络的回归损失值,计算公式如下:
其中,为目标回归网络的回归损失值,为位置损失的第二权重、为 位置损失值、为类别损失的第二权重、为类别损失值、为置信度的第二权 重、为置信度损失值。
本发明实施例的一种计算设备,包括存储器、处理器及存储在存储器上并在处理器上运行的程序,处理器执行程序时实现上述一种目标检测方法的部分或全部步骤。
其中,计算设备可以选用电脑,相对应地,其程序为电脑软件,且上述关于本发明的一种计算设备中的各参数和步骤,可参考上文中一种目标检测方法的实施例中的各参数和步骤,在此不做赘述。
本发明实施例中一种计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在运行时,执行上述一种目标检测方法的步骤。
其中,计算机可读存储介质可以是暂态计算机可读存储介质,也可以是非暂态计算机可读存储介质。
本公开实施例的技术方案可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括一个或多个指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开实施例方法的全部或部分步骤。而前述的计算机可读存储介质可以是非暂态计算机可读存储介质,包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态计算机可读存储介质。
所属技术领域的技术人员知道,本发明可以实现为***、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“***”。此外,在一些实施例中,本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。计算机可读存储介质例如可以是但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种目标检测方法,其特征在于,包括:
S1、获取高空监控视角的目标数据域和无人机视角的源数据域,并将所述目标数据域和所述源数据域作为训练集输入到初始模型中进行训练;其中,所述源数据域为具有真实标注信息的数据域;
S2、将所述目标数据域和所述源数据域输入到生成网络,分别获得所述目标数据域的多个不同尺度的第一域不变特征和所述源数据域的多个不同尺度的第二域不变特征;其中,多个所述第一域不变特征和多个所述第二域不变特征的尺度一一对应;
S3、基于判别网络分别判断相同尺度的所述第一域不变特征和所述第二域不变特征来自的数据域,确定所述判别网络的判别损失值和所述生成网络的对抗损失值;
S4、通过目标回归网络、多个所述第二域不变特征以及所述源数据域的真实标注信息,计算所述目标回归网络的回归损失值;
S5、基于所述判别损失值对所述判别网络的参数进行调整,基于所述对抗损失值和所述回归损失值对所述生成网络的参数进行调整,基于所述回归损失值对所述目标回归网络进行调整;并重复执行步骤S2至S5,直至迭代预设次轮后,获得训练完成的目标检测模型;
S6、获取高空监控视角的数据,并将所述高空监控视角的数据输入到所述目标检测模型,获得所述数据对应的检测结果;
获取高空监控视角的目标数据域和无人机视角的源数据域,包括:基于高空监控场景的图像特性,获取高空监控视角的目标数据域和无人机视角的源数据域;其中,高空监控场景的图像特征包括图像视角,和/或,图像光照均匀情况,和/或,图像上待检测目标的尺度情况。
2.根据权利要求1所述的方法,其特征在于,所述将所述目标数据域和所述源数据域输入到生成网络,分别获得所述目标数据域的多个不同尺度的第一域不变特征和所述源数据域的多个不同尺度的第二域不变特征,包括:
分别从所述目标数据域中选出任意一个第一样本,以及从所述源数据域中选出任意一个第二样本;
分别将所述第一样本和所述第二样本输入到生成网络,对所述第一样本进行多尺度的下采样处理以获得多张第一特征图,以及对所述第二样本进行多尺度的下采样处理以获得多张第二特征图;其中,多张所述第一特征图和多张所述第二特征图的尺度一一对应;
对多张所述第一特征图进行特征融合,获得第一样本的多个不同尺度的第一域不变特征,以及对多张所述第二特征图进行特征融合,获得所述第二样本的多个不同尺度的第二域不变特征。
3.根据权利要求2所述的方法,其特征在于,所述判别网络包括多个不同尺度的鉴别器;所述基于判别网络分别判断相同尺度的所述第一域不变特征和所述第二域不变特征来自的数据域,确定所述判别网络的判别损失值和所述生成网络的对抗损失值,包括:
将相同尺度的所述第一域不变特征和所述第二域不变特征输入到对应尺度的鉴别器中进行鉴别,以判断相同尺度的所述第一域不变特征和所述第二域不变特征来自的数据域,获得每个鉴别器的判别结果;
基于各个所述判别结果,计算所述判别损失值和所述对抗损失值。
4.根据权利要求3所述的方法,其特征在于,所述基于各个所述判别结果,计算所述判别损失值,包括:
基于各个所述判别结果,计算每个鉴别器的损失值,计算公式如下:
其中,为第n个鉴别器的损失值,/>为第n个鉴别器对来自源数据域的第二域不变特征的判别结果,/>为第n个鉴别器对来自目标数据域的第一域不变特征的判别结果;
基于全部所述鉴别器的损失值,计算所述判别损失值,计算公式如下:
其中,所述为所述判别网络的判别损失值,N为鉴别器的数量。
5.根据权利要求3或4所述的方法,其特征在于,所述基于各个所述判别结果,计算所述对抗损失值,包括:
获取每个所述鉴别器占全部所述鉴别器的第一权重;
基于各个所述判别结果和各个所述第一权重,计算所述对抗损失值,计算公式如下:
其中,为所述对抗损失值,/>为第n个鉴别器的第一权重,/>为第n个鉴别器对来自源数据域的第二域不变特征的判别结果,N为鉴别器的数量。
6.根据权利要求1至4任一项所述的方法,其特征在于,所述通过目标回归网络、多个所述第二域不变特征以及所述源数据域的真实标注信息,计算所述目标回归网络的回归损失值,包括:
基于所述目标回归网络对多个所述第二域不变特征进行处理,获得预测结果;
基于所述预测结果和所述源数据域的真实标注信息,计算所述目标回归网络的回归损失值。
7.根据权利要求6所述的方法,其特征在于,所述预测结果和所述真实标注信息均包括目标框和目标类别;所述基于所述预测结果和所述源数据域的真实标注信息,计算所述目标回归网络的回归损失值,包括:
基于所述预测结果和所述源数据域的真实标注信息,分别计算位置损失值、类别损失值和置信度损失值;
分别获取所述位置损失值、所述类别损失值以及所述置信度损失值在所述回归损失值中的第二权重;
基于各个所述第二权重、所述位置损失值、所述类别损失值以及所述置信度损失值,计算所述目标回归网络的回归损失值,计算公式如下:
其中,为所述目标回归网络的回归损失值,/>为位置损失的第二权重、/>为位置损失值、/>为类别损失的第二权重、/>为类别损失值、/>为置信度的第二权重、/>为置信度损失值。
8.一种目标检测***,其特征在于,包括:
获取模块,用于获取高空监控视角的目标数据域和无人机视角的源数据域,并将所述目标数据域和所述源数据域作为训练集输入到初始模型中进行训练;其中,所述源数据域为具有真实标注信息的数据域;
生成模块,用于将所述目标数据域和所述源数据域输入到生成网络,分别获得所述目标数据域的多个不同尺度的第一域不变特征和所述源数据域的多个不同尺度的第二域不变特征;其中,多个所述第一域不变特征和多个所述第二域不变特征的尺度一一对应;
判别模块,用于基于判别网络分别判断相同尺度的所述第一域不变特征和所述第二域不变特征来自的数据域,确定所述判别网络的判别损失值和所述生成网络的对抗损失值;
回归模块,用于通过目标回归网络、多个所述第二域不变特征以及所述源数据域的真实标注信息,计算所述目标回归网络的回归损失值;
调整模块,用于基于所述判别损失值对所述判别网络的参数进行调整,基于所述对抗损失值和所述回归损失值对所述生成网络的参数进行调整,基于所述回归损失值对所述目标回归网络进行调整;并重复执行生成模块、判别模块、回归模块以及调整模块的步骤,直至迭代预设次轮后,获得训练完成的目标检测模型;
检测模块,用于获取高空监控视角的数据,并将所述高空监控视角的数据输入到所述目标检测模型,获得所述数据对应的检测结果;
获取模块包括获取单元,获取单元用于获取高空监控视角的目标数据域和无人机视角的源数据域,包括:基于高空监控场景的图像特性,获取高空监控视角的目标数据域和无人机视角的源数据域;其中,高空监控场景的图像特征包括图像视角,和/或,图像光照均匀情况,和/或,图像上待检测目标的尺度情况。
9.一种计算设备,包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7中任一项所述的目标检测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如权利要求1至7中任一项所述的目标检测方法的步骤。
CN202410331986.4A 2024-03-22 2024-03-22 一种目标检测方法、***、计算设备以及介质 Active CN117934869B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410331986.4A CN117934869B (zh) 2024-03-22 2024-03-22 一种目标检测方法、***、计算设备以及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410331986.4A CN117934869B (zh) 2024-03-22 2024-03-22 一种目标检测方法、***、计算设备以及介质

Publications (2)

Publication Number Publication Date
CN117934869A CN117934869A (zh) 2024-04-26
CN117934869B true CN117934869B (zh) 2024-06-18

Family

ID=90766954

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410331986.4A Active CN117934869B (zh) 2024-03-22 2024-03-22 一种目标检测方法、***、计算设备以及介质

Country Status (1)

Country Link
CN (1) CN117934869B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230048727A (ko) * 2021-10-05 2023-04-12 인하대학교 산학협력단 적대적 초해상도 다중 스케일 특징맵 학습 및 객체 검출기

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109146784B (zh) * 2018-07-27 2020-11-20 徐州工程学院 一种基于多尺度生成对抗网络的图像超分辨率重建方法
EP3980972A1 (en) * 2019-06-06 2022-04-13 Elekta, Inc. Sct image generation using cyclegan with deformable layers
CN110363122B (zh) * 2019-07-03 2022-10-11 昆明理工大学 一种基于多层特征对齐的跨域目标检测方法
CN111445007B (zh) * 2020-03-03 2023-08-01 平安科技(深圳)有限公司 对抗生成神经网络的训练方法及***
CN111814854B (zh) * 2020-06-28 2023-07-28 北京交通大学 一种无监督域适应的目标重识别方法
CN114140683A (zh) * 2020-08-12 2022-03-04 天津大学 一种航拍图像目标检测的方法、设备与介质
US20220198339A1 (en) * 2020-12-23 2022-06-23 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for training machine learning model based on cross-domain data
CN114841907A (zh) * 2022-05-27 2022-08-02 西安理工大学 面向红外与可见光图像的多尺度生成对抗融合网络的方法
CN115049841A (zh) * 2022-06-14 2022-09-13 西安电子科技大学 基于深度无监督多步对抗域自适应的高分辨sar图像地物要素提取方法
CN115308705A (zh) * 2022-08-05 2022-11-08 北京理工大学 一种基于生成对抗网络的多姿态极窄脉冲回波生成方法
CN115409813A (zh) * 2022-09-01 2022-11-29 重庆守愚科技有限公司 一种基于gan及注意力融合机制的快速表面缺陷检测方法及***
CN115761831A (zh) * 2022-09-14 2023-03-07 北京国电通网络技术有限公司 一种安全帽检测方法及装置
CN116310655A (zh) * 2023-04-23 2023-06-23 中国人民解放军国防科技大学 基于半监督混合域适应的红外弱小目标检测方法和装置
CN116524364B (zh) * 2023-06-25 2023-09-26 苏州市中地行信息技术有限公司 基于特征识别的异构多源数据处理***与方法
CN117392488A (zh) * 2023-09-20 2024-01-12 华为技术有限公司 一种数据处理方法、神经网络及相关设备
CN117593243A (zh) * 2023-10-11 2024-02-23 东华大学 可靠伪标签引导的压缩机外观自适应检测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230048727A (ko) * 2021-10-05 2023-04-12 인하대학교 산학협력단 적대적 초해상도 다중 스케일 특징맵 학습 및 객체 검출기

Also Published As

Publication number Publication date
CN117934869A (zh) 2024-04-26

Similar Documents

Publication Publication Date Title
CN112990432B (zh) 目标识别模型训练方法、装置及电子设备
US10650042B2 (en) Image retrieval with deep local feature descriptors and attention-based keypoint descriptors
CN110009679B (zh) 一种基于多尺度特征卷积神经网络的目标定位方法
CN109857889B (zh) 一种图像检索方法、装置、设备及可读存储介质
Tian et al. A dual neural network for object detection in UAV images
CN111476294A (zh) 一种基于生成对抗网络的零样本图像识别方法及***
CN104931960B (zh) 动向报文与雷达目标态势信息全航迹段数据关联方法
CN110738247B (zh) 一种基于选择性稀疏采样的细粒度图像分类方法
CN109558823A (zh) 一种以图搜图的车辆识别方法及***
CN110348437B (zh) 一种基于弱监督学习与遮挡感知的目标检测方法
CN111126482A (zh) 一种基于多分类器级联模型的遥感影像自动分类方法
US11416717B2 (en) Classification model building apparatus and classification model building method thereof
CN109858547A (zh) 一种基于bssd的目标检测方法与装置
US20230137337A1 (en) Enhanced machine learning model for joint detection and multi person pose estimation
CN115797736B (zh) 目标检测模型的训练和目标检测方法、装置、设备和介质
CN110689044A (zh) 一种结合目标间关系的目标检测方法及***
CN116912796A (zh) 一种基于新型动态级联YOLOv8的自动驾驶目标识别方法及装置
CN114549909A (zh) 一种基于自适应阈值的伪标签遥感图像场景分类方法
CN112270671B (zh) 图像检测方法、装置、电子设备及存储介质
CN117934869B (zh) 一种目标检测方法、***、计算设备以及介质
CN114445716B (zh) 关键点检测方法、装置、计算机设备、介质及程序产品
CN113011446B (zh) 一种基于多源异构数据学习的智能目标识别方法
CN114927236A (zh) 一种面向多重目标图像的检测方法及***
CN110263196B (zh) 图像检索方法、装置、电子设备及存储介质
Benitez Ante-hoc generation of task-agnostic interpretation maps

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant