CN111881764B - 一种目标检测方法、装置、电子设备及存储介质 - Google Patents

一种目标检测方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111881764B
CN111881764B CN202010626321.8A CN202010626321A CN111881764B CN 111881764 B CN111881764 B CN 111881764B CN 202010626321 A CN202010626321 A CN 202010626321A CN 111881764 B CN111881764 B CN 111881764B
Authority
CN
China
Prior art keywords
target
task
loss
loss function
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010626321.8A
Other languages
English (en)
Other versions
CN111881764A (zh
Inventor
李一力
张�浩
邵新庆
刘强
徐�明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen ZNV Technology Co Ltd
Nanjing ZNV Software Co Ltd
Original Assignee
Shenzhen ZNV Technology Co Ltd
Nanjing ZNV Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen ZNV Technology Co Ltd, Nanjing ZNV Software Co Ltd filed Critical Shenzhen ZNV Technology Co Ltd
Priority to CN202010626321.8A priority Critical patent/CN111881764B/zh
Publication of CN111881764A publication Critical patent/CN111881764A/zh
Application granted granted Critical
Publication of CN111881764B publication Critical patent/CN111881764B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种目标检测方法、装置、电子设备及存储介质,所述的方法包括:获取待检测目标样本;将待检测目标样本输入训练后的深度学习模型中得到待检测目标样本中的待检测目标,预先训练的深度模型包括目标分类任务和目标位置回归任务,其中目标分类任务的损失函数的损失权重和目标位置回归任务的损失函数的损失权重在深度学习模型训练过程中通过动态调节得到。由于在深度学习模型训练过程中动态调节目标分类任务和目标位置回归任务的损失函数的损失权重,使得在不同目标检测或同一目标检测过程的不同阶段中,能够设定更合适的目标分类任务和目标位置回归任务的损失函数的损失权重。

Description

一种目标检测方法、装置、电子设备及存储介质
技术领域
本发明涉及计算机视觉技术领域,具体涉及一种目标检测方法、装置、电子设备及存储介质。
背景技术
目标检测的任务是判断一张图片中是否存在待检测目标,若判断存在待检测目标还需输出目标的位置。因此在目标检测模型训练阶段存在两种任务的损失函数,分别用于度量模型判定图片中是否存在目标和回归目标的位置,这两个任务分别称为目标分类任务和目标位置回归任务,所对应的损失函数分别为分类损失函数和回归损失函数。
现有分类损失函数和回归损失函数中的权重在整个模型训练过程中是固定的,常常通过经验设定,这样具体到某个目标检测的任务可能并不合适。而且,即使为同一个目标检测任务,模型训练前期和模型训练后期对于分类任务和目标回归任务的偏重也是不同的。
发明内容
本发明旨在提供一种目标检测方法、装置、电子设备及存储介质,能够在不同目标检测或同一目标检测过程的不同阶段中,设定更合适的目标分类任务和目标位置回归任务的损失函数的损失权重。
根据第一方面,一种实施例中提供一种目标检测方法,包括:
获取待检测目标样本;
将所述待检测目标样本输入预先训练的深度学习模型中,得到所述待检测目标样本中的待检测目标;所述预先训练的深度模型包括目标分类任务和目标位置回归任务,其中所述目标分类任务的损失函数的损失权重和目标位置回归任务的损失函数的损失权重在深度学习模型训练过程中通过动态调节得到。
进一步地,所述目标分类任务的损失函数的损失权重在深度学习模型训练过程中通过动态调节得到包括:
获取训练目标样本集合;
构建深度学习模型,将所述训练目标样本集合输入到所述深度学习模型中;
在所述深度学习模型训练过程中获取所述训练目标样本集合在当前目标分类任务中的准确率;
根据所述训练目标样本集合在当前目标分类任务中的准确率计算当前目标分类任务的损失函数的损失权重。
进一步地,所述目标位置回归任务的损失函数的损失权重在深度学习模型训练过程中通过动态调节得到包括:
在所述深度学习模型训练过程中获取所述训练目标样本集合在当前目标位置回归任务中的交并比;所述交并比是目标真实位置区域和目标预测位置区域的交集与目标真实位置区域和目标预测位置区域的并集的比值;
根据所述训练目标样本集合在当前目标位置回归任务中的交并比计算当前目标位置回归任务的损失函数的损失权重。
进一步地,所述根据所述训练目标样本集合在当前目标分类任务中的准确率计算当前目标分类任务的损失函数的损失权重包括:
根据以下公式计算当前目标分类任务的损失函数的损失权重:
FL1=-(1-A)γlog(A)
其中,FL1为当前目标分类任务的损失函数的损失权重,A为所述训练目标样本集合在当前目标分类任务中的准确率,γ为常量。
进一步地述根据所述训练目标样本集合在当前目标位置回归任务中的交并比计算当前目标位置回归任务的损失函数的损失权重包括:
根据以下公式计算当前目标位置回归任务的损失函数的损失权重:
FL2=-(1-IoU)γlog(IoU)
其中,FL2为当前目标位置回归任务的损失函数的损失权重,IoU为所述训练目标样本集合在当前目标位置回归任务中的交并比,γ为常量。
进一步地,所述目标位置回归任务的损失函数为SSD算法中用于目标位置回归任务的损失函数,所述目标分类任务的损失函数为SSD算法中用于目标分类任务的损失函数。
进一步地,所述目标样本为人脸图片,所述待检测目标为人脸。
根据第二方面,一种实施例中提供一种目标检测装置,包括:
样本获取模块,用于获取待检测目标样本和训练目标样本集合;
目标检测模块,用于将所述待检测目标样本输入预先训练的深度学习模型中,得到所述待检测目标样本中的待检测目标;所述预先训练的深度模型包括目标分类任务和目标位置回归任务,其中所述目标分类任务的损失函数的损失权重和目标位置回归任务的损失函数的损失权重在深度学习模型训练过程中通过动态调节得到。
根据第三方面,一种实施例中提供一种电子设备,包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如上述实施例所述的方法。
根据第四方面,一种实施例中提供一种计算机可读存储介质,包括程序,所述程序能够被处理器执行以实现如上述实施例所述的方法。
依据上述实施例的一种目标检测方法、装置、电子设备及存储介质,由于在深度学习模型的训练过程中动态调节目标分类任务的损失函数的损失权重和目标位置回归任务的损失函数的损失权重,使得在不同目标检测或同一目标检测过程的不同阶段中,能够设定更合适的目标分类任务和目标位置回归任务的损失函数的损失权重。
附图说明
图1为本申请目标检测方法的流程图;
图2为一种实施例的目标检测方法的流程图;
图3为目标的真实框与预测框的交并集示意图,其中(a)为真实框与预测框的交集示意图,(b)为真实框与预测框的并集示意图;
图4为一种实施例的目标检测装置的结构框图;
图5为一种实施例的电子设备的结构框图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本申请所说“连接”、“联接”,如无特别说明,均包括直接和间接连接(联接)。
在本发明实施例中,在训练用于检测目标的深度学习模型过程中,动态调节目标分类任务的损失函数的损失权重和目标位置回归任务的损失函数的损失权重,能够更合适地设定目标分类任务和目标位置回归任务的损失函数的损失权重,使得所训练的深度学习模型检测目标的结果更加准确。
请参考图1,图1为一种目标检测方法的流程图,其包括步骤S10至步骤S20。
步骤S10,获取待检测目标样本。
步骤S20,将待检测目标样本输入预先训练的深度学习模型中,得到待检测目标样本中的待检测目标;所述预先训练的深度模型包括目标分类任务和目标位置回归任务,其中目标分类任务的损失函数的损失权重和目标位置回归任务的损失函数的损失权重在深度学习模型训练过程中通过动态调节得到。
请参考图2,图2为一种实施例的目标检测方法的流程图,本实施例以人脸图片为例,对所述的目标检测方法进行说明,所述的方法包括步骤S101至步骤S105。
步骤S101,获取训练目标样本集合。本实施例中训练样本集合为已具有人脸标签的图片,该人脸标签用于标识人脸及人脸在图片中的位置,其中人脸在图片中的位置通过一包含人脸的真实框进行表示。该步骤中所获取的训练人脸集合的方法可以采用现有技术中常用的方法,例如监控摄像头所拍摄视频中的人脸图像。
步骤S102,构建深度学习模型,并设定深度学习模型中目标分类任务和目标位置回归任务的损失函数。将上述训练目标样本集合中的人脸图片作为输入,这些人脸图片对应的人脸特征作为标签,进行机器学习,训练得到人脸图片与人脸特征对应关系的模型函数,该模型函数即为深度学习模型。在训练过程中,深度学习模型通过不断调整预测框在图片中位置来检测目标,若预测框与图片中的真实框重合,则检测完成,该深度学习模型包含级联的目标分类任务和目标位置回归任务,目标分类任务用于判断预测框中是否存在目标,其包括两种结果存在或不存在,目标位置回归任务用于判断预测框和真实框是否重合,也就是检测目标的准确位置。
本实施例中深度学习模型中目标分类任务和目标位置回归任务的损失函数可以采用SSD算法中的分类损失函数和回归损失函数。
其中分类损失函数为:L1为分类损失值,x为分类概率值。
回归损失函数为:L2为回归损失值,y为真实框的位置,/>为预测框的位置。
步骤S103,将训练目标样本集合输入所构建深度学习模型中进行训练,在深度学习模型训练过程中动态调节所述目标分类任务的损失函数的损失权重和所述目标位置回归任务的损失函数的损失权重。
在步骤S102中SSD算法中的分类损失函数和回归损失函数的损失权重均为1,由于训练过程的前半段深度学习模型在判断样本中是否存在目标的问题较大,需要增加分类损失函数的损失权重;训练过程的后半段深度学习模型在判断样本是否存在目标的问题不大,如何更准确的定位目标更关键,此时应该增加回归损失函数的损失权重,因此本实施例根据不同阶段动态地调节目标分类任务的损失函数的损失权重和目标位置回归任务的损失函数的损失权重。
其中,在深度学习模型训练过程中动态调节所述目标分类任务的损失函数的损失权重包括:在深度学习模型训练过程中获取训练目标样本集合在当前目标分类任务中的准确率;根据训练目标样本集合在当前目标分类任务中的准确率计算当前目标分类任务的损失函数的损失权重。由于训练目标样本集合中的所有训练目标样本均具有人脸标签,因此可根据人脸标签和当前目标分类任务中所输出的分类结果来确定分类的准确率,不同训练时期准确率是变化的,例如训练初始阶段,分类准确率非常小,越到训练后期,分类准确率越大。
本实施例根据以下公式计算当前目标分类任务的损失函数的损失权重:
FL1=-(1-A)γlog(A)
其中,FL1为当前目标分类任务的损失函数的损失权重,A为目标样本集合在当前目标分类任务中的准确率,γ为常量,γ的取值为0-5。
同理,在深度学习模型训练过程中动态调节所述目标位置回归任务的损失函数的损失权重包括:在深度学习模型训练过程中获取训练目标样本集合在当前目标位置回归任务中的交并比;所述交并比是目标真实位置区域和目标预测位置区域的交集与目标真实位置区域和目标预测位置区域的并集的比值;根据目标样本集合在当前目标位置回归任务中的交并比计算当前目标位置回归任务的损失函数的损失权重。
在本实施例中,目标真实位置区域为目标的真实框301,目标预测位置区域为目标的预测框302,如图3所示,图3的(a)为真实框301与预测框302的交集示意图,图3的(b)为真实框301与预测框302的并集示意图。其中交并比则为真实框301与预测框302的交集面积与真实框301与预测框302的并集面积的比值。
本实施例根据以下公式计算当前目标位置回归任务的损失函数的损失权重:
FL2=-(1-IoU)γlog(IoU)
其中,FL2为当前目标位置回归任务的损失函数的损失权重,IoU为目标样本集合在当前目标位置回归任务中的交并比,γ为常量,γ的取值为0-5。
基于本实施例计算得到的当前目标分类任务和目标位置回归任务的损失函数的损失权重,那么本实施例中SDD算法中的分类损失函数和回归损失函数分别为FL1*L1和FL2*L2,在深度学习模型训练过程中随着目标分类任务的准确率A和目标位置回归任务的交并比IoU的变化,FL1和FL2随之变化,因此分类损失函数和回归损失函数也产生变化,使得更高效、准确地对深度学习模型进行训练。
步骤S104,获取待检测目标样本。本实施例中的目标样本均为人脸图片,待检测目标样本为待检测是否存在人脸以及人脸位置的图片。
步骤S105,将待检测目标样本输入训练后的深度学习模型中,得到待检测目标样本中的待检测目标。本实施例待深度学习模型训练完成后,将待检测目标样本输入该训练完成的深度学习模型后,能够输出待检测目标样本中的目标,例如检测到人脸图片中的人脸。本实施例可以基于所检测到的待检测目标,从待检测目标样本中提取出待检测目标,并将所提取出的待检测目标与预设目标进行相似性比对,若比对结果为待检测目标与预设目标相似,则将待检测目标标注为预设目标的标签,以便于对预设目标的轨迹进行追踪。
在本实施例中,当深度学习模型刚开始训练,此时的目标分类任务相对来说更不准确,因此目标分类任务的准确率A较低,此时当前目标分类任务的损失函数的损失权重FL1很大,这时深度学习模型会倾向于优先优化目标分类任务;当深度学习模型训练到后期,此时的目标分类任务已经较为准确了,而目标位置回归任务还不准确,因此此时目标样本集合在当前目标位置回归任务中的交并比IoU相对来说较低,当前目标位置回归任务的损失函数的损失权重较FL2较大,那么目标位置回归任务的损失权重就增大,此时深度学习模型会倾向于优化目标位置回归任务,实现了动态调节目标分类任务和目标位置回归任务的损失权重。
基于上述实施例提供的目标检测方法,请参考图4,图4为一种实施例的目标检测装置的结构框图,所述的目标检测装置包括:样本获取模块101和目标检测模块102。
样本获取模块101用于获取待检测目标样本。
目标检测模块102用于将待检测目标样本输入预先训练的深度学习模型中,得到待检测目标样本中的待检测目标;该预先训练的深度模型包括目标分类任务和目标位置回归任务,其中目标分类任务的损失函数的损失权重和目标位置回归任务的损失函数的损失权重在深度学习模型训练过程中通过动态调节得到。
其中,目标分类任务的损失函数的损失权重在深度学习模型训练过程中通过动态调节得到包括:获取训练目标样本集合;构建深度学习模型,将训练目标样本集合输入到深度学习模型中;在深度学习模型训练过程中获取训练目标样本集合在当前目标分类任务中的准确率;根据训练目标样本集合在当前目标分类任务中的准确率计算当前目标分类任务的损失函数的损失权重。目标位置回归任务的损失函数的损失权重在深度学习模型训练过程中通过动态调节得到包括:在深度学习模型训练过程中获取训练目标样本集合在当前目标位置回归任务中的交并比;所述交并比是目标真实位置区域和目标预测位置区域的交集与目标真实位置区域和目标预测位置区域的并集的比值;根据训练目标样本集合在当前目标位置回归任务中的交并比计算当前目标位置回归任务的损失函数的损失权重。
本实施例装置中的各个模块所实现的功能与上述实施例的方法中的步骤相对应,其具体实现和技术效果参见上述实施例方法步骤的描述,此处不再赘述。
请参考图5,本发明的一个实施方式提供了一种电子设备。其中,该电子设备包括存储器201、处理器202、输入/输出接口203。其中,存储器201,用于存储程序。处理器202,用于调用存储器201所存储的程序执行本发明实施例的目标检测方法。其中,处理器202分别与存储器201、输入/输出接口203连接,例如可通过总线***和/或其他形式的连接机构(未示出)进行连接。存储器201可用于存储程序和数据,包括本发明实施例中涉及的特征融合程序,处理器202通过运行存储在存储器201的程序从而执行电子设备的各种功能应用以及数据处理。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的***进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

Claims (6)

1.一种目标检测方法,其特征在于,包括:
获取待检测目标样本;
将所述待检测目标样本输入预先训练的深度学习模型中,得到所述待检测目标样本中的待检测目标;所述预先训练的深度模型包括目标分类任务和目标位置回归任务,其中所述目标分类任务的损失函数的损失权重和目标位置回归任务的损失函数的损失权重在深度学习模型训练过程中通过动态调节得到;
所述目标分类任务的损失函数的损失权重在深度学习模型训练过程中通过动态调节得到包括:
获取训练目标样本集合;
构建深度学习模型,将所述训练目标样本集合输入到所述深度学习模型中;
在所述深度学习模型训练过程中获取所述训练目标样本集合在当前目标分类任务中的准确率;
根据所述训练目标样本集合在当前目标分类任务中的准确率计算当前目标分类任务的损失函数的损失权重;
所述目标位置回归任务的损失函数的损失权重在深度学习模型训练过程中通过动态调节得到包括:
在所述深度学习模型训练过程中获取所述训练目标样本集合在当前目标位置回归任务中的交并比;所述交并比是目标真实位置区域和目标预测位置区域的交集与目标真实位置区域和目标预测位置区域的并集的比值;
根据所述训练目标样本集合在当前目标位置回归任务中的交并比计算当前目标位置回归任务的损失函数的损失权重;
所述根据所述训练目标样本集合在当前目标分类任务中的准确率计算当前目标分类任务的损失函数的损失权重包括:
根据以下公式计算当前目标分类任务的损失函数的损失权重:
FL1=-(1-A)γlog(A)
其中,FL1为当前目标分类任务的损失函数的损失权重,A为所述训练目标样本集合在当前目标分类任务中的准确率,γ为常量,γ的取值为0-5;
所述根据所述训练目标样本集合在当前目标位置回归任务中的交并比计算当前目标位置回归任务的损失函数的损失权重包括:
根据以下公式计算当前目标位置回归任务的损失函数的损失权重:
FL2=-(1-IoU)γlog(IoU)
其中,FL2为当前目标位置回归任务的损失函数的损失权重,IoU为所述训练目标样本集合在当前目标位置回归任务中的交并比,γ为常量,γ的取值为0-5。
2.如权利要求1所述的目标检测方法,其特征在于,所述目标位置回归任务的损失函数为SSD算法中用于目标位置回归任务的损失函数,所述目标分类任务的损失函数为SSD算法中用于目标分类任务的损失函数。
3.如权利要求1所述的目标检测方法,其特征在于,所述目标样本为人脸图片,所述待检测目标为人脸。
4.一种目标检测装置,其特征在于,包括:
样本获取模块,用于获取待检测目标样本;
目标检测模块,用于将所述待检测目标样本输入预先训练的深度学习模型中,得到所述待检测目标样本中的待检测目标;所述预先训练的深度模型包括目标分类任务和目标位置回归任务,其中所述目标分类任务的损失函数的损失权重和目标位置回归任务的损失函数的损失权重在深度学习模型训练过程中通过动态调节得到;
所述目标分类任务的损失函数的损失权重在深度学习模型训练过程中通过动态调节得到包括:
获取训练目标样本集合;
构建深度学习模型,将所述训练目标样本集合输入到所述深度学习模型中;
在所述深度学习模型训练过程中获取所述训练目标样本集合在当前目标分类任务中的准确率;
根据所述训练目标样本集合在当前目标分类任务中的准确率计算当前目标分类任务的损失函数的损失权重;
所述目标位置回归任务的损失函数的损失权重在深度学习模型训练过程中通过动态调节得到包括:
在所述深度学习模型训练过程中获取所述训练目标样本集合在当前目标位置回归任务中的交并比;所述交并比是目标真实位置区域和目标预测位置区域的交集与目标真实位置区域和目标预测位置区域的并集的比值;
根据所述训练目标样本集合在当前目标位置回归任务中的交并比计算当前目标位置回归任务的损失函数的损失权重;
所述根据所述训练目标样本集合在当前目标分类任务中的准确率计算当前目标分类任务的损失函数的损失权重包括:
根据以下公式计算当前目标分类任务的损失函数的损失权重:
FL1=-(1-A)γlog(A)
其中,FL1为当前目标分类任务的损失函数的损失权重,A为所述训练目标样本集合在当前目标分类任务中的准确率,γ为常量,γ的取值为0-5;
所述根据所述训练目标样本集合在当前目标位置回归任务中的交并比计算当前目标位置回归任务的损失函数的损失权重包括:
根据以下公式计算当前目标位置回归任务的损失函数的损失权重:
FL2=-(1-IoU)γlog(IoU)
其中,FL2为当前目标位置回归任务的损失函数的损失权重,IoU为所述训练目标样本集合在当前目标位置回归任务中的交并比,γ为常量,γ的取值为0-5。
5.一种电子设备,其特征在于,包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如权利要求1-3中任一项所述的方法。
6.一种计算机可读存储介质,其特征在于,包括程序,所述程序能够被处理器执行以实现如权利要求1-3中任一项所述的方法。
CN202010626321.8A 2020-07-01 2020-07-01 一种目标检测方法、装置、电子设备及存储介质 Active CN111881764B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010626321.8A CN111881764B (zh) 2020-07-01 2020-07-01 一种目标检测方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010626321.8A CN111881764B (zh) 2020-07-01 2020-07-01 一种目标检测方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111881764A CN111881764A (zh) 2020-11-03
CN111881764B true CN111881764B (zh) 2023-11-03

Family

ID=73150098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010626321.8A Active CN111881764B (zh) 2020-07-01 2020-07-01 一种目标检测方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111881764B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112509008B (zh) * 2020-12-15 2022-05-03 重庆邮电大学 一种基于交并比引导孪生网络的目标跟踪方法
CN112613462B (zh) * 2020-12-29 2022-09-23 安徽大学 一种加权交并比方法
CN113011597B (zh) * 2021-03-12 2023-02-28 山东英信计算机技术有限公司 一种回归任务的深度学习方法和装置
CN113469025B (zh) * 2021-06-29 2024-05-31 阿波罗智联(北京)科技有限公司 应用于车路协同的目标检测方法、装置、路侧设备和车辆
CN113627262A (zh) * 2021-07-13 2021-11-09 深圳力维智联技术有限公司 文字识别方法、装置及设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106910013A (zh) * 2017-02-16 2017-06-30 中国科学院自动化研究所 基于动态表达学习的不实信息检测方法和装置
CN109272060A (zh) * 2018-09-06 2019-01-25 湖北工业大学 一种基于改进的darknet神经网络进行目标检测的方法和***
CN109858486A (zh) * 2019-01-27 2019-06-07 中国人民解放军国防科技大学 一种基于深度学习的数据中心云端目标识别方法
CN109886357A (zh) * 2019-03-13 2019-06-14 哈尔滨工程大学 一种基于特征融合的自适应权重深度学习目标分类方法
CN110555390A (zh) * 2019-08-09 2019-12-10 厦门市美亚柏科信息股份有限公司 基于半监督训练方式的行人重识别方法、装置及介质
CN110827253A (zh) * 2019-10-30 2020-02-21 北京达佳互联信息技术有限公司 一种目标检测模型的训练方法、装置及电子设备
CN111091105A (zh) * 2019-12-23 2020-05-01 郑州轻工业大学 基于新的边框回归损失函数的遥感图像目标检测方法
CN111310826A (zh) * 2020-02-13 2020-06-19 南京旷云科技有限公司 样本集的标注异常检测方法、装置及电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7769228B2 (en) * 2004-05-10 2010-08-03 Siemens Corporation Method for combining boosted classifiers for efficient multi-class object detection
US10515296B2 (en) * 2017-11-14 2019-12-24 Adobe Inc. Font recognition by dynamically weighting multiple deep learning neural networks

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106910013A (zh) * 2017-02-16 2017-06-30 中国科学院自动化研究所 基于动态表达学习的不实信息检测方法和装置
CN109272060A (zh) * 2018-09-06 2019-01-25 湖北工业大学 一种基于改进的darknet神经网络进行目标检测的方法和***
CN109858486A (zh) * 2019-01-27 2019-06-07 中国人民解放军国防科技大学 一种基于深度学习的数据中心云端目标识别方法
CN109886357A (zh) * 2019-03-13 2019-06-14 哈尔滨工程大学 一种基于特征融合的自适应权重深度学习目标分类方法
CN110555390A (zh) * 2019-08-09 2019-12-10 厦门市美亚柏科信息股份有限公司 基于半监督训练方式的行人重识别方法、装置及介质
CN110827253A (zh) * 2019-10-30 2020-02-21 北京达佳互联信息技术有限公司 一种目标检测模型的训练方法、装置及电子设备
CN111091105A (zh) * 2019-12-23 2020-05-01 郑州轻工业大学 基于新的边框回归损失函数的遥感图像目标检测方法
CN111310826A (zh) * 2020-02-13 2020-06-19 南京旷云科技有限公司 样本集的标注异常检测方法、装置及电子设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Dynamic Saliency-Aware Regularization for Correlation Filter-Based Object Tracking;Wei Feng等;《IEEE TRANSACTIONS ON IMAGE PROCESSING》;第28卷(第7期);第3232-3245页 *
基于联合优化的强耦合孪生区域推荐网络的目标跟踪算法;石国强 等;《计算机应用》;第40卷(第10期);第2822-2830页 *
物联网安全技术分析;谭喆;《中国安防》(第10期);第67-73页 *

Also Published As

Publication number Publication date
CN111881764A (zh) 2020-11-03

Similar Documents

Publication Publication Date Title
CN111881764B (zh) 一种目标检测方法、装置、电子设备及存储介质
KR102382693B1 (ko) 이미지 분석 기반으로 환경에 영향 받지 않는 감시를 위한 보행자 검출기의 학습 방법 및 학습 장치, 그리고, 이를 이용하여 테스트 방법 및 테스트장치
US6226388B1 (en) Method and apparatus for object tracking for automatic controls in video devices
CN110569703B (zh) 计算机执行的从图片中识别损伤的方法及装置
TW201832158A (zh) 確定推薦物件的方法、裝置及電腦儲存媒體
US11386710B2 (en) Eye state detection method, electronic device, detecting apparatus and computer readable storage medium
CN110737785B (zh) 一种图片标注的方法及装置
CN109977824B (zh) 物品取放识别方法、装置及设备
Semenishchev et al. Investigation of methods to search for the boundaries on the image and their use on lung hardware of methods finding saliency map
CN113129335B (zh) 一种基于孪生网络的视觉跟踪算法及多模板更新策略
US11393072B2 (en) Methods and systems for automatically correcting image rotation
CN114882321A (zh) 深度学习模型的训练方法、目标对象检测方法和装置
CN114463603B (zh) 图像检测模型的训练方法、装置、电子设备及存储介质
CN115994899A (zh) 一种螺栓松动检测方法、装置及检测设备
Dutta et al. A shot detection technique using linear regression of shot transition pattern
CN113592706B (zh) 调整单应性矩阵参数的方法和装置
CN113344994B (zh) 图像配准方法、装置、电子设备及存储介质
Francis et al. Pre-processing techniques for detection of blurred images
CN110210314B (zh) 人脸检测方法、装置、计算机设备及存储介质
CN113632077A (zh) 识别信息赋予装置、识别信息赋予方法以及程序
CN113869163B (zh) 目标跟踪方法、装置、电子设备及存储介质
CN115205553A (zh) 图像的数据清洗方法、装置、电子设备及存储介质
CN112418217A (zh) 用于识别字符的方法、装置、设备和介质
CN112131418A (zh) 目标标注方法、目标标注装置和计算机可读存储介质
CN115880697B (zh) 图像搜索方法、装置、可读存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant