CN112784903A - 用于目标识别模型训练的方法、装置及设备 - Google Patents

用于目标识别模型训练的方法、装置及设备 Download PDF

Info

Publication number
CN112784903A
CN112784903A CN202110102511.4A CN202110102511A CN112784903A CN 112784903 A CN112784903 A CN 112784903A CN 202110102511 A CN202110102511 A CN 202110102511A CN 112784903 A CN112784903 A CN 112784903A
Authority
CN
China
Prior art keywords
recognition model
sample
label
training
loss value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110102511.4A
Other languages
English (en)
Other versions
CN112784903B (zh
Inventor
翟步中
唐大闰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Minglue Artificial Intelligence Group Co Ltd
Original Assignee
Shanghai Minglue Artificial Intelligence Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Minglue Artificial Intelligence Group Co Ltd filed Critical Shanghai Minglue Artificial Intelligence Group Co Ltd
Priority to CN202110102511.4A priority Critical patent/CN112784903B/zh
Publication of CN112784903A publication Critical patent/CN112784903A/zh
Application granted granted Critical
Publication of CN112784903B publication Critical patent/CN112784903B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及人工智能技术领域,公开一种用于目标识别模型训练的方法。该方法包括:获取训练样本;训练样本包括第一标签样本、第二标签样本和无标签样本;标签样本包括第一标签样本和第二标签样本;根据第一标签样本获得第一备选识别模型;根据第二标签样本和第一备选识别模型获得第二备选识别模型;根据无标签样本和第二备选识别模型获得第三备选识别模型;根据第三备选识别模型获得目标识别模型。通过获取训练样本对预设识别模型进行训练,以能够提高第三备选识别模型对无标签样本同类目标的识别准确率,从而提高目标识别模型对长尾样本同类目标的识别准确率。本申请还公开一种用于目标识别模型训练的装置及设备。

Description

用于目标识别模型训练的方法、装置及设备
技术领域
本申请涉及人工智能技术领域,例如涉及一种用于目标识别模型训练的方法、装置及设备。
背景技术
对物体类型进行识别是很多人工智能处理过程中必不可缺的环节,随着机器学习算法的发展,利用神经网络模型对物体类型进行自动识别成为可能。长尾样本是指样本数量占比较低的样本,相对于其他训练样本数量来说,长尾物体的训练样本数量较少,因此训练出来的神经网络模型很难对长尾样本同一类型的目标进行有效识别。
在实现本公开实施例的过程中,发现相关技术中至少存在如下问题:现有技术中对长尾样本同类目标的识别结果准确率较低。
发明内容
为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
本公开实施例提供了一种用于目标识别模型训练的方法、装置及设备,以能够提高目标识别模型对长尾样本同类目标的识别准确率。
在一些实施例中,所述用于目标识别模型训练的方法,包括:
获取训练样本;所述训练样本包括第一标签样本、第二标签样本和无标签样本;所述第一标签样本为在训练样本中数量占比达到预设值的标签样本;所述第二标签样本为在训练样本中数量占比低于所述预设值的标签样本;
根据所述第一标签样本获得第一备选识别模型;
根据所述第二标签样本和所述第一备选识别模型获得所述第二备选识别模型;
根据所述无标签样本和所述第二备选识别模型获得第三备选识别模型;
根据所述第三备选识别模型获得目标识别模型。
在一些实施例中,所述装置包括:处理器和存储有程序指令的存储器,所述处理器被配置为在执行所述程序指令时,执行上述的用于目标识别模型训练的方法。
本公开实施例提供的用于目标识别模型训练的方法、装置及设备,可以实现以下技术效果:通过本方案获取第一标签样本对预设识别模型进行训练得到第一备选识别模型,能够提高第一备选识别模型对第一标签样本同类目标的识别准确率;通过第二标签样本对第一备选识别模型进行训练得到第二备选识别模型,能够提高第二备选识别模型对第二标签样本同类目标的识别准确率;通过无标签样本对第二备选识别模型进行训练得到第三备选识别模型,能够提高第三备选识别模型对无标签样本同类目标的识别准确率,从而提高目标识别模型对长尾样本同类目标的识别准确率。
以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。
附图说明
一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:
图1是本公开实施例提供的一个用于目标识别模型训练的方法的示意图;
图2是本公开实施例提供的一个用于目标识别模型训练的装置的示意图。
具体实施方式
为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或多个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
本公开实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开实施例的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。
除非另有说明,术语“多个”表示两个或两个以上。
本公开实施例中,字符“/”表示前后对象是一种“或”的关系。例如,A/B表示:A或B。
术语“和/或”是一种描述对象的关联关系,表示可以存在三种关系。例如,A和/或B,表示:A或B,或,A和B这三种关系。
结合图1所示,本公开实施例提供一种用于目标识别模型训练的方法,包括:
步骤S101,获取训练样本;训练样本包括第一标签样本、第二标签样本和无标签样本;
步骤S102,根据第一标签样本获得第一备选识别模型;
步骤S103,根据第二标签样本和第一备选识别模型获得第二备选识别模型;
步骤S104,根据无标签样本和第二备选识别模型获得第三备选识别模型;
步骤S105,根据第三备选识别模型获得目标识别模型。
采用本公开实施例提供的用于目标识别模型训练的方法,通过获取第一标签样本对预设识别模型进行训练得到第一备选识别模型,能够提高第一备选识别模型对第一标签样本同类目标的识别准确率;通过第二标签样本对第一备选识别模型进行训练得到第二备选识别模型,能够提高第二备选识别模型对第二标签样本同类目标的识别准确率;通过无标签样本对第二备选识别模型进行训练得到第三备选识别模型,能够提高第三备选识别模型对无标签样本同类目标的识别准确率,从而提高目标识别模型对长尾样本同类目标的识别准确率。
获取训练样本;所述训练样本包括第一标签样本、第二标签样本和无标签样本;所述第一标签样本为在训练样本中数量占比达到预设值的标签样本;所述第二标签样本为在训练样本中数量占比低于所述预设值的标签样本;
可选地,第一标签样本为在训练样本中数量占比达到预设值的标签样本,第二标签样本为在训练样本中数量占比低于预设值的标签样本。可选地,预设值为0.1%。
在一些实施例中,第一标签样本为非长尾物体样本,第二标签样本为长尾物体样本。
可选地,根据第一标签样本获得第一备选识别模型,包括:根据第一标签样本对预设识别模型进行训练,获得第一识别结果;根据预设的第一损失函数获取第一识别结果的第一损失值;根据第一损失值确定出第一备选识别模型。
可选地,预设识别模型为Resnet(残差网络模型)、VGG(Visual Geometry Group,视觉几何体组)或GoogLeNet。
可选地,第一损失函数为
Figure BDA0002916163760000041
可选地,通过计算
Figure BDA0002916163760000042
得到第一识别结果的第一损失值,其中,θ为预设识别模型的参数,log L(θ)为在参数θ下的第一识别结果的第一损失值,Pθ(x1,y)为在参数θ下的第一识别结果,x1为第一标签样本,y为目标识别类型。可选地,通过计算Pθ(x1,y)=Pθ(x1∣y)P(y)获得在参数θ下的第一识别结果,其中,Pθ(x1∣y)为第一标签样本x1被识别为y类的概率,P(y)为目标识别类型为y类的概率。
可选地,目标识别类型为待识别目标物体的类型。在一些实施例中,待识别目标物体为饮料、食品等快销品。在一些实施例中,目标识别类型为饮料的类型,例如:可乐、雪碧等。
可选地,根据第一损失值确定出第一备选识别模型,包括:根据第一损失值按照第一确定环节确定出第一备选识别模型。可选地,第一确定环节包括:获取第一损失值的第一梯度值;根据第一梯度值对预设识别模型的参数进行调整,确定出第一调整识别模型;根据第一标签样本对第一调整识别模型进行训练获得第一调整识别结果;获取第一调整识别结果的第一调整损失值;根据第一调整损失值确定出第一备选识别模型。
可选地,对第一损失值求导数得到第一梯度值。
可选地,根据第一梯度值对预设识别模型的参数进行调整,包括:通过计算θ1=θ+g得到第一调整识别模型的参数θ1,其中,θ1为第一调整识别模型的参数,θ为预设识别模型中的参数,g为第一梯度值。
在一些实施例中,预设识别模型为Resnet,Resnet中的参数θ包括LR(LearningRate,学习率)、BS(Batch Size,批次大小)和N(Number,迭代次数)等。例如,第一梯度值为-3,则第一调整识别模型的参数为LR-3、BS-3、N-3等。
可选地,根据第一调整损失值确定出第一备选识别模型,包括:在第一调整损失值小于或等于第一设定阈值的情况下,将第一调整损失值对应的第一调整识别模型确定为第一备选识别模型;在第一调整损失值大于第一设定阈值的情况下,重复执行第一确定环节,直到得出的第一调整损失值小于或等于第一设定阈值。
这样,通过第一标签样本对预设识别模型进行训练得到第一备选识别模型,能够提高第一备选识别模型对第一标签样本同类目标的识别准确率。
可选地,根据第二标签样本和第一备选识别模型获得第二备选识别模型,包括:根据第二标签样本对第一备选识别模型进行训练,获得第二识别结果;根据预设的第二损失函数获取第二识别结果的第二损失值;根据第二损失值确定出第二备选识别模型。
可选地,第二损失函数为
Figure BDA0002916163760000051
可选地,通过计算
Figure BDA0002916163760000052
得到第二识别结果的第二损失值,其中,θ1为第一备选识别模型的参数,log L(θ1)为在参数θ1下的第二识别结果的第二损失值,
Figure BDA0002916163760000053
为在参数θ1下的第二识别结果,x2为第二标签样本,y为目标识别类型。可选地,通过计算
Figure BDA0002916163760000054
获得在参数θ1下的第二识别结果,其中,
Figure BDA0002916163760000055
为第二标签样本x2被识别为y类的概率,P(y)为目标识别类型为y类的概率。
可选地,根据第二损失值确定出第二备选识别模型,包括:根据第二损失值按照第二确定环节确定出第二备选识别模型。可选地,第二确定环节包括:获取第二损失值的第二梯度值;根据第二梯度值对第一备选识别模型的参数进行调整,确定出第二调整识别模型;根据第二标签样本对第二调整识别模型进行训练获得第二调整识别结果;获取第二调整识别结果的第二调整损失值;根据第二调整损失值确定出第二备选识别模型。
可选地,对第二损失值求导数得到第二梯度值。
可选地,根据第二梯度值对第一备选识别模型的参数进行调整,包括:通过计算θ2=θ1+g1得到第二调整识别模型的参数θ2,其中,θ2为第一调整识别模型的参数,θ1为第一备选识别模型中的参数,g1为第二梯度值。
可选地,根据第二调整损失值确定出第二备选识别模型,包括:在第二调整损失值小于或等于第二设定阈值的情况下,将第二调整损失值对应的第二调整识别模型确定为第二备选识别模型;在第二调整损失值大于第二设定阈值的情况下,重复执行第二确定环节,直到得出的第二调整损失值小于或等于第二设定阈值。
这样,通过第二标签样本对第一备选识别模型进行训练得到第二备选识别模型,能够提高第二备选识别模型对第二标签样本同类目标的识别准确率。
可选地,根据第三备选识别模型获得目标识别模型,包括:在第三备选识别模型满足预设条件的情况下,将第三备选识别模型作为目标识别模型。
可选地,在第三备选识别模型满足预设条件的情况下,将第三备选识别模型作为目标识别模型,包括:获取测试样本;根据测试样本对第三备选模型进行测试获得测试结果;在测试结果满足预设条件的情况下,将第三备选识别模型作为目标识别模型。
可选地,测试结果满足预设条件,包括测试结果的识别正确率为90%。
可选地,根据无标签样本和第二备选识别模型获得第三备选识别模型,包括:根据无标签样本对第二备选识别模型进行训练,获得第三识别结果;根据预设的第三损失函数获取第三识别结果的第三损失值;根据第三损失值确定出第三备选识别模型。
可选地,第三损失函数为
Figure BDA0002916163760000061
可选地,通过计算
Figure BDA0002916163760000071
得到第三识别结果的第三损失值,其中,θ2为第二备选识别模型的参数,log L(θ2)为在参数θ2下的第三识别结果的第三损失值,
Figure BDA0002916163760000072
为在参数θ2下的第三识别结果,
Figure BDA0002916163760000073
为无标签样本被识别为目标识别类型的总概率。可选地,通过计算
Figure BDA0002916163760000074
得到无标签样本被识别为目标识别类型的总概率,其中,
Figure BDA0002916163760000075
为无标签样本x3被识别为C1类的概率,P(C1)为目标识别类型为C1类的概率,
Figure BDA0002916163760000076
为无标签样本x3被识别为C2类的概率,P(C2)为目标识别类型为C2类的概率,x3为无标签样本。
可选地,根据第三损失值确定出第三备选识别模型,包括:根据第三损失值按照第三确定环节确定出第三备选识别模型。可选地,第三确定环节包括:获取第三损失值的第三梯度值;根据第三梯度值对第二备选识别模型的参数进行调整,确定出第三调整识别模型;根据无标签样本对第三调整识别模型进行训练获得第三调整识别结果;获取第三调整识别结果的第三调整损失值;根据第三调整损失值确定出第三备选识别模型。
可选地,对第三损失值求导数得到第三梯度值。
可选地,根据第三梯度值对第二备选识别模型的参数进行调整,包括:通过计算θ3=θ2+g2得到第三调整识别模型的参数θ3,其中,θ3为第三调整识别模型的参数,θ2为第二备选识别模型中的参数,g2为第三梯度值。
可选地,根据第三调整损失值确定出第三备选识别模型,包括:在第三调整损失值小于或等于第三设定阈值的情况下,将第三调整损失值对应的第三调整识别模型确定为第三备选识别模型;在第三调整损失值大于第三设定阈值的情况下,重复执行第三确定环节,直到得出的第三调整损失值小于或等于第三设定阈值。
这样,通过无标签样本对第二备选识别模型进行训练得到第三备选识别模型,能够提高第三备选识别模型对无标签样本同类目标的识别准确率。
现有技术中通过衡训练样本对预设识别模型进行训练,由于第一标签样本数量大于第二标签样本的数量,均衡训练样本的方式有两种,包括:减少第一标签样本数量的方式均衡训练样本;或,通过增加第二标签样本数量的方式均衡训练样本。若通过减少第一标签样本数量的方式均衡训练样本,然后对预设识别模型进行训练容易导致训练出来的识别模型无法满足用户需求;若通过增加第二标签样本的数量的方式均衡训练样本容易导致成本高。若通过不均衡训练样本的方式对预设识别模型进行训练,由于样本不均衡,容易导致训练模型时迭代次数过少,从而导致训练出来的识别模型识别准确率低,无法满足用户的需求。
本方案通过获取第一标签样本对预设识别模型进行训练得到第一备选识别模型,能够提高第一备选识别模型对第一标签样本的识别准确率;通过第二标签样本对第一备选识别模型进行训练得到第二备选识别模型,能够提高第二备选识别模型对第二标签样本的识别准确率;通过无标签样本对第二备选识别模型进行训练得到第三备选识别模型,能够提高第三备选识别模型对无标签样本的识别准确率;根据第三备选识别模型获得目标识别模型能够提高目标识别模型对长尾样本同类目标的识别准确率。
结合图2所示,本公开实施例提供一种用于目标识别模型训练的装置,包括处理器(processor)100和存储有程序指令的存储器(memory)101。可选地,该装置还可以包括通信接口(Communication Interface)102和总线103。其中,处理器100、通信接口102、存储器101可以通过总线103完成相互间的通信。通信接口102可以用于信息传输。处理器100可以调用存储器101中的程序指令,以执行上述实施例的用于目标识别模型训练的方法。
此外,上述的存储器101中的程序指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器101作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令/模块。处理器100通过运行存储在存储器101中的程序指令/模块,从而执行功能应用以及数据处理,即实现上述实施例中用于目标识别模型训练的方法。
存储器101可包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器101可以包括高速随机存取存储器,还可以包括非易失性存储器。
采用本公开实施例提供的用于目标识别模型训练的装置,通过获取第一标签样本对预设识别模型进行训练得到第一备选识别模型,能够提高第一备选识别模型对第一标签样本同类目标的识别准确率;通过第二标签样本对第一备选识别模型进行训练得到第二备选识别模型,能够提高第二备选识别模型对第二标签样本同类目标的识别准确率;通过无标签样本对第二备选识别模型进行训练得到第三备选识别模型,能够提高第三备选识别模型对无标签样本同类目标的识别准确率,从而提高目标识别模型对长尾样本同类目标的识别准确率。
本公开实施例提供了一种设备,包含上述的用于目标识别模型训练的装置。该设备通过获取第一标签样本对预设识别模型进行训练得到第一备选识别模型,能够提高第一备选识别模型对第一标签样本同类目标的识别准确率;通过第二标签样本对第一备选识别模型进行训练得到第二备选识别模型,能够提高第二备选识别模型对第二标签样本同类目标的识别准确率;通过无标签样本对第二备选识别模型进行训练得到第三备选识别模型,能够提高第三备选识别模型对无标签样本同类目标的识别准确率,从而提高目标识别模型对长尾样本同类目标的识别准确率。
可选地,所述设备为计算机等。
本公开实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,计算机可执行指令设置为执行上述用于目标识别模型训练的方法。
本公开实施例提供了一种计算机程序产品,计算机程序产品包括存储在计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,使计算机执行上述用于目标识别模型训练的方法。
上述的计算机可读存储介质可以是暂态计算机可读存储介质,也可以是非暂态计算机可读存储介质。
本公开实施例的技术方案可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括一个或多个指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质,包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
以上描述和附图充分地示出了本公开的实施例,以使本领域的技术人员能够实践它们。其他实施例可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施例的部分和特征可以被包括在或替换其他实施例的部分和特征。而且,本申请中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的,除非上下文清楚地表明,否则单数形式的“一个”(a)、“一个”(an)和“所述”(the)旨在同样包括复数形式。类似地,如在本申请中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外,当用于本申请中时,术语“包括”(comprise)及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素,和/或组件的存在,但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。在没有更多限制的情况下,由语句“包括一个…”限定的要素,并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。本文中,每个实施例重点说明的可以是与其他实施例的不同之处,各个实施例之间相同相似部分可以互相参见。对于实施例公开的方法、产品等而言,如果其与实施例公开的方法部分相对应,那么相关之处可以参见方法部分的描述。
本领域技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,可以取决于技术方案的特定应用和设计约束条件。所述技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能,但是这种实现不应认为超出本公开实施例的范围。所述技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本文所披露的实施例中,所揭露的方法、产品(包括但不限于装置、设备等),可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,可以仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例。另外,在本公开实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
附图中的流程图和框图显示了根据本公开实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。在附图中的流程图和框图所对应的描述中,不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生,有时不同的操作或步骤之间不存在特定的顺序。例如,两个连续的操作或步骤实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。

Claims (10)

1.一种用于目标识别模型训练的方法,其特征在于,包括:
获取训练样本;所述训练样本包括第一标签样本、第二标签样本和无标签样本;所述第一标签样本为在训练样本中数量占比达到预设值的标签样本;所述第二标签样本为在训练样本中数量占比低于所述预设值的标签样本;
根据所述第一标签样本获得第一备选识别模型;
根据所述第二标签样本和所述第一备选识别模型获得第二备选识别模型;
根据所述无标签样本和所述第二备选识别模型获得第三备选识别模型;
根据所述第三备选识别模型获得目标识别模型。
2.根据权利要求1所述的方法,其特征在于,根据所述第一标签样本获得第一备选识别模型,包括:
根据所述第一标签样本对预设识别模型进行训练,获得第一识别结果;
根据预设的第一损失函数获取所述第一识别结果的第一损失值;
根据所述第一损失值确定出第一备选识别模型。
3.根据权利要求2所述的方法,其特征在于,根据所述第一损失值确定出第一备选识别模型,包括:
获取所述第一损失值的第一梯度值;
根据所述第一梯度值对所述预设识别模型的参数进行调整,确定出第一调整识别模型;
根据所述第一标签样本对所述第一调整识别模型进行训练获得第一调整识别结果;
获取所述第一调整识别结果的第一调整损失值;
根据所述第一调整损失值确定出第一备选识别模型。
4.根据权利要求1所述的方法,其特征在于,根据所述第二标签样本和所述第一备选识别模型获得所述第二备选识别模型,包括:
根据所述第二标签样本对所述第一备选识别模型进行训练,获得第二识别结果;
根据所述预设的第二损失函数获取所述第二识别结果的第二损失值;
根据所述第二损失值确定出第二备选识别模型。
5.根据权利要求4所述的方法,其特征在于,根据所述第二损失值确定出第二备选识别模型,包括:
获取所述第二损失值的第二梯度值;
根据所述第二梯度值对所述第一备选识别模型的参数进行调整,确定出第二调整识别模型;
根据所述第二标签样本对所述第二调整识别模型进行训练获得第二调整识别结果;
获取所述第二调整识别结果的第二调整损失值;
根据所述第二调整损失值确定出第二备选识别模型。
6.根据权利要求1所述的方法,其特征在于,根据所述第三备选识别模型获得目标识别模型,包括:
在所述第三备选识别模型满足预设条件的情况下,将所述第三备选识别模型作为目标识别模型。
7.根据权利要求1至6任一项所述的方法,其特征在于,根据所述无标签样本和所述第二备选识别模型获得第三备选识别模型,包括:
根据所述无标签样本对所述第二备选识别模型进行训练,获得第三识别结果;
根据预设的第三损失函数获取所述第三识别结果的第三损失值;
根据所述第三损失值确定出第三备选识别模型。
8.根据权利要求7所述的方法,其特征在于,根据所述第三损失值确定出第三备选识别模型,包括:
获取所述第三损失值的第三梯度值;
根据所述第三梯度值对所述第二备选识别模型的参数进行调整,确定出第三调整识别模型;
根据所述无标签样本对所述第三调整识别模型进行训练获得第三调整识别结果;
获取所述第三调整识别结果的第三调整损失值;
根据所述第三调整损失值确定出第三备选识别模型。
9.一种用于目标识别模型训练的装置,包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在执行所述程序指令时,执行如权利要求1至8任一项所述的用于目标识别模型训练的方法。
10.一种设备,其特征在于,包括如权利要求9所述的用于目标识别模型训练的装置。
CN202110102511.4A 2021-01-26 2021-01-26 用于目标识别模型训练的方法、装置及设备 Active CN112784903B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110102511.4A CN112784903B (zh) 2021-01-26 2021-01-26 用于目标识别模型训练的方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110102511.4A CN112784903B (zh) 2021-01-26 2021-01-26 用于目标识别模型训练的方法、装置及设备

Publications (2)

Publication Number Publication Date
CN112784903A true CN112784903A (zh) 2021-05-11
CN112784903B CN112784903B (zh) 2023-12-12

Family

ID=75757776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110102511.4A Active CN112784903B (zh) 2021-01-26 2021-01-26 用于目标识别模型训练的方法、装置及设备

Country Status (1)

Country Link
CN (1) CN112784903B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428757A (zh) * 2020-03-05 2020-07-17 支付宝(杭州)信息技术有限公司 模型训练方法、异常数据检测方法、装置和电子设备
CN111461164A (zh) * 2020-02-25 2020-07-28 清华大学 样本数据集的扩容方法及模型的训练方法
CN111582185A (zh) * 2020-05-11 2020-08-25 北京百度网讯科技有限公司 用于识别图像的方法和装置
CN111667066A (zh) * 2020-04-23 2020-09-15 北京旷视科技有限公司 网络模型的训练、文字识别方法、装置和电子设备
CN111931931A (zh) * 2020-09-29 2020-11-13 杭州迪英加科技有限公司 一种针对病理全场图像的深度神经网络训练方法、装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111461164A (zh) * 2020-02-25 2020-07-28 清华大学 样本数据集的扩容方法及模型的训练方法
CN111428757A (zh) * 2020-03-05 2020-07-17 支付宝(杭州)信息技术有限公司 模型训练方法、异常数据检测方法、装置和电子设备
CN111667066A (zh) * 2020-04-23 2020-09-15 北京旷视科技有限公司 网络模型的训练、文字识别方法、装置和电子设备
CN111582185A (zh) * 2020-05-11 2020-08-25 北京百度网讯科技有限公司 用于识别图像的方法和装置
CN111931931A (zh) * 2020-09-29 2020-11-13 杭州迪英加科技有限公司 一种针对病理全场图像的深度神经网络训练方法、装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YU LI ET AL: "Overcoming Classifier Imbalance for Long-tail Object Detection with Balanced Group Softmax", 《REAARXIV: 2006.10408V1》, pages 1 - 12 *
熊智翔等: "使用少量有标签样本学习的方法", 《计算机应用》, pages 11 - 15 *

Also Published As

Publication number Publication date
CN112784903B (zh) 2023-12-12

Similar Documents

Publication Publication Date Title
CN110147456B (zh) 一种图像分类方法、装置、可读存储介质及终端设备
CN105426356B (zh) 一种目标信息识别方法和装置
CN110502976B (zh) 文本识别模型的训练方法及相关产品
CN109858476B (zh) 标签的扩充方法和电子设备
CN109189921B (zh) 评论评估模型的训练方法和装置
CN115082920B (zh) 深度学习模型的训练方法、图像处理方法和装置
EP4036796A1 (en) Automatic modeling method and apparatus for object detection model
CN111062964A (zh) 图像分割方法及相关装置
CN111931809A (zh) 数据的处理方法、装置、存储介质及电子设备
CN109685805B (zh) 一种图像分割方法及装置
CN114419029B (zh) 表面缺陷检测模型的训练方法、表面缺陷检测方法及装置
CN112183326A (zh) 人脸年龄识别模型训练方法及相关装置
CN112765325A (zh) 垂直领域语料数据筛选方法及***
CN112100378A (zh) 文本分类模型训练方法、装置、计算机设备及存储介质
CN116127060A (zh) 一种基于提示词的文本分类方法及***
CN114049174A (zh) 用于商品推荐的方法及装置、电子设备、存储介质
CN103279944A (zh) 一种基于生物地理优化的图像分割方法
CN108984777B (zh) 客户服务方法、装置和计算机可读存储介质
CN113379113A (zh) 用于空调运行模式预测的方法及装置、空调
CN112800226A (zh) 用于获取文本分类模型的方法、用于文本分类的方法、装置及设备
CN112990753A (zh) 用于路侧设备的故障诊断的方法、装置及设备
CN116089616A (zh) 主题文本获取方法、装置、设备及存储介质
CN112784903A (zh) 用于目标识别模型训练的方法、装置及设备
CN113988915A (zh) 用于定位产品客群的方法及装置、电子设备、存储介质
CN110851349B (zh) 页面异常显示的检测方法、终端设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant