CN114743081B - 模型训练方法、相关装置及存储介质 - Google Patents

模型训练方法、相关装置及存储介质 Download PDF

Info

Publication number
CN114743081B
CN114743081B CN202210502310.8A CN202210502310A CN114743081B CN 114743081 B CN114743081 B CN 114743081B CN 202210502310 A CN202210502310 A CN 202210502310A CN 114743081 B CN114743081 B CN 114743081B
Authority
CN
China
Prior art keywords
image
target
weight distribution
target image
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210502310.8A
Other languages
English (en)
Other versions
CN114743081A (zh
Inventor
请求不公布姓名
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Real AI Technology Co Ltd
Original Assignee
Beijing Real AI Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Real AI Technology Co Ltd filed Critical Beijing Real AI Technology Co Ltd
Priority to CN202210502310.8A priority Critical patent/CN114743081B/zh
Publication of CN114743081A publication Critical patent/CN114743081A/zh
Application granted granted Critical
Publication of CN114743081B publication Critical patent/CN114743081B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例涉及计算机视觉领域,提供一种模型训练方法、相关装置及存储介质,该方法包括:获取目标图像;获取目标权重分布,根据所述目标权重分布从所述目标图像获取目标图像特征,其中,所述目标权重分布根据历史权重分布更新得到;对所述目标图像特征进行识别,得到所述目标图像的识别概率分布;若目标类别与所述目标图像的标签的相似度不小于第一预设阈值,则将所述目标权重分布作为预设模型的最终权重分布;其中,所述目标类别为所述识别概率分布中概率值大于预设概率值的类别。本申请实施例将神经网络模型中的固定权重替换为具备更加灵活多变的表达能力的权重分布,从而模型能够提取到更加广泛的图像特征,进而提高图像识别的准确度。

Description

模型训练方法、相关装置及存储介质
技术领域
本申请实施例涉及计算机视觉领域,更具体地涉及一种模型训练方法、相关装置及存储介质。
背景技术
神经网络模型通常需要利用样本数据的特征信息进行训练或者基于待识别数据的特征信息进行识别,而特征信息的准确与否对神经网络模型的训练效果或识别结果有很大的影响。
隐式神经网络模型由于其相较于卷积神经网络模型等显式神经网络模型来说,更低的存储资源消耗而广受青睐。深度均衡模型(Deep Equilibrium Models,DEQ)是一种典型地隐式神经网络模型,可用于特征提取。然而DEQ模型由于在迭代提取特征的过程中共享一组权重,从而无法获取输入数据中灵活多变的特征;即采用DEQ模型从输入数据中提取的特征不够准确、表达能力不强,这会影响识别模型的训练效果,导致训练完成的识别模型的识别结果不够准确。
发明内容
本申请实施例提供一种模型训练方法、装置及存储介质,在从目标图像获取目标图像特征的迭代过程中,每一个迭代轮次均从目标权重分布中重新采样用于提取图像特征的权重,而不是每个迭代轮次共享一组权重。每个从目标权重分布重新采样的权重都可能不同,都可以增加图像特征获取的广泛性,也即所述目标权重分布使得模型具备更加灵活多变的特征表达能力,从而能够提取到更加广泛的图像特征,最终实现提高图像识别模型的训练效果和识别效果的目标。
第一方面,本申请实施例提供一种模型训练方法,该方法包括:
获取目标图像;
获取目标权重分布,根据所述目标权重分布从所述目标图像获取目标图像特征,其中,所述目标权重分布根据历史权重分布更新得到;
对所述目标图像特征进行识别,得到所述目标图像的识别概率分布;
若目标类别与所述目标图像的标签的相似度不小于第一预设阈值,则将所述目标权重分布作为预设模型的最终权重分布;
其中,所述目标类别为所述识别概率分布中概率值大于预设概率值的类别。
第二方面,本申请实施例提供一种模型训练装置,具有实现对应于上述第一方面提供的模型训练方法的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块,所述模块可以是软件和/或硬件。
在一个实施方式中,所述模型训练装置包括:
输入输出模块,被配置为获取目标图像;
处理模块,被配置为获取目标权重分布,根据所述目标权重分布从所述目标图像获取目标图像特征,其中,所述目标权重分布根据历史权重分布更新得到;
所述处理模块,还被配置为对所述目标图像特征进行识别,得到所述目标图像的识别概率分布;
所述处理模块,还被配置为若目标类别与所述目标图像的标签的相似度不小于第一预设阈值,则将所述目标权重分布作为预设模型的最终权重分布;
其中,所述目标类别为所述识别概率分布中概率值大于预设概率值的类别。
第三方面,本申请实施例提供一种计算机可读存储介质,其包括指令,当其在计算机上运行时,使得计算机执行如第一方面所述的模型训练方法。
第四方面,本申请实施例提供一种计算设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现第一方面所述的模型训练方法。
相较于现有技术,本申请实施例中,获取目标图像,根据历史权重分布获取目标权重分布,根据所述目标权重分布从目标图像中获取特征信息广泛的目标图像特征,对所述目标图像特征进行识别,以确定所述目标图像特征是否准确,进而确定是否可将所述目标权重分布作为预设模型的最终权重分布,以完成预设模型的训练。本申请实施例将现有模型中的固定权重替换为权重分布,以权重分布作为预设模型的待优化项进行训练。由于权重分布可以包括多个不同的权重,多个不同的权重可以帮助预设模型从图像中获取不同的图像特征,然而,这些不同的图像特征可能无法对图像识别提供有效信息,因此,本申请实施例还对权重分布进行迭代更新,以得到最终权重分布。相比于历史权重分布,虽然最终权重分布也包括多个不同的权重,这些不同的权重可能使得预设模型从图像中获取到不同的图像特征,但是这些不同的图像特征均可以提供对图像识别有效的特征信息,即训练完成的预设模型能够从图像中获取广泛且准确的图像特征,具备灵活多变的特征表达能力。相比于现有模型只能根据固定的权重从图像中获取固定图像特征,本申请实施例的预设模型能够根据最终权重分布从图像中获取广泛且准确的目标图像特征,广泛且准确的目标图像特征比单一的固定图像特征具备更宽广更多维度的图像信息,因此,目标图像特征可以提高图像识别模型的识别准确度。
附图说明
通过参考附图阅读本申请实施例的详细描述,本申请实施例的目的、特征和优点将变得易于理解。其中:
图1为本申请实施例中模型训练方法的一种通信***示意图;
图2为本申请实施例的模型训练方法的流程示意图;
图3为图2中获取目标图像特征步骤的流程示意图;
图4为本申请实施例的预设模型迭代获取目标图像特征的流程示意图;
图5为本申请实施例的预设模型更新权重分布的流程示意图;
图6为本申请实施例的传统模型与贝叶斯模型的对比示意图;
图7为本申请实施例的传统DEQ模型与Bayesian-DEQ模型学习到的特征在二维欧式空间的对比示意图;
图8为本申请实施例的模型训练装置的结构示意图;
图9为本申请实施例提供的计算设备的一种结构示意图;
图10为本申请实施例中手机的一种结构示意图;
图11为本申请实施例中服务器的一种结构示意图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
本申请实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象(例如第一权重和第二权重分别表示为不同的权重,其他类似),而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块,本申请实施例中所出现的模块的划分,仅仅是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个***中,或一些特征可以忽略,或不执行,另外,所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,模块之间的间接耦合或通信连接可以是电性或其他类似的形式,本申请实施例中均不作限定。并且,作为分离部件说明的模块或子模块可以是也可以不是物理上的分离,可以是也可以不是物理模块,或者可以分布到多个电路模块中,可以根据实际的需要选择其中的部分或全部模块来实现本申请实施例方案的目的。
本申请实施例提供一种模型训练方法、相关装置及存储介质,可应用于图像处理***,该图像处理***可包括模型训练装置和图像处理装置,模型训练装置和图像识别装置可以集成部署,也可分离式部署。该模型训练装置用于训练至少用于提取图像特征的预设模型、通过所述预设模型输出从目标图像提取到的目标图像特征。该图像处理装置用于对所述预设模型提取到的目标图像特征进行处理,得到图像处理结果。图像处理装置得到的至少一个图像处理结果(如识别概率分布)可用于模型训练装置去迭代更新所述预设模型的参数,例如权重分布的参数。其中,模型训练装置可为训练预设模型、输出预设模型提取到的图像特征的应用程序,或为安装了训练预设模型、输出预设模型提取到的图像特征的应用程序的服务器;图像处理装置可为处理目标图像特征,得到处理结果的图像识别程序,所述图像识别程序例如是图像处理模型,所述图像处理装置还可为部署了图像处理模型的终端设备。
需要说明的是,本申请实施例训练得到的预设模型,尤其适用于不确定性图像识别场景,即待识别图像具有模糊区域的情况。例如在自动驾驶领域的图像识别场景下,汽车在高速行驶的过程中反馈给图像识别模型的图像数据经常或多或少有些模糊。本申请训练得到的预设模型比正常的深度神经网络模型更适应这种应用环境,因为本申请训练得到的预设模型学习的是权重的分布,故而可以在目标图像存在模糊区域的情况下给出图像特征的分布,基于图像特征的分布给出不确定性的预测,而非单一的预测结果。
另外,虽然本申请实施例以图像识别场景为例介绍了如何训练模型以及如何提取图像特征,但是本领域的技术人员可以根据本申请实施例的公开内容在金融、气象和行为预测等场景下实施本申请实施例的模型训练方法,以便进行相应的特征提取。本申请实施例所披露的发明原理至少包括将传统隐式神经网络模型中共享的一组权重替换为权重分布,从而在进行模型训练时使得模型学习到样本数据的特征分布而不是固定的特征,提高模型的表达能力,并最终提高识别/预测准确率。
本申请实施例提供的方案涉及人工智能(Artificial Intelligence, AI)、自然语言处理(Nature Language processing, NLP)、机器学习(MachineLearning, ML)等技术,具体通过如下实施例进行说明:
其中,AI是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
AI技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
NLP是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
一些实施方式中,模型训练装置和图像处理装置分离式部署,参照图1,本申请实施例提供的模型训练方法可基于图1所示的一种通信***实现。该通信***可以包括服务器01和终端设备02。
该服务器01可以是模型训练装置,其中可以部署待训练的预设模型以及训练程序。
该终端设备02可以是图像处理装置,其中可以部署有图像处理模型,例如图像分类模型、图像识别模型或图像检测模型等基于机器学习的方法训练得到的AI模型。其中图像识别模型可以为人脸识别模型、车牌识别模型或者路标识别模型等。图像检测模型可以为物体检测模型等。
服务器01采用预设模型基于本地存储或外部输入的目标图像提取目标图像特征,并将该目标图像特征向该终端设备02发送。终端设备02可以采用图像处理模型对该目标图像的目标图像特征进行处理,得到识别概率分布,然后向服务器01反馈识别概率分布。服务器01 可以基于所述识别概率分布对待训练的预设模型进行更新,例如对权重分布的参数进行更新。
需要说明的是,本申请实施例涉及的服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
本申请实施例涉及的终端设备,可以是指向用户提供语音和/或数据连通性的设备,具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备。例如移动电话(或称为“蜂窝”电话)和具有移动终端的计算机,例如,可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置,它们与无线接入网交换语音和/或数据。例如,个人通信业务(英文全称:Personal Communication Service,英文简称:PCS)电话、无绳电话、会话发起协议(SIP)话机、无线本地环路(Wireless Local Loop,英文简称:WLL)站、个人数字助理(英文全称:Personal Digital Assistant,英文简称:PDA)等设备。
参照图2,图2为本申请实施例提供的一种模型训练方法的流程示意图。该方法可由模型训练装置和图像处理装置执行,对权重分布进行更新,得到目标权重分布,作为预设模型的最终权重分布,所述模型训练方法包括:
步骤S110,获取目标图像。
本申请实施例中,在预设模型的不同处理阶段,所述目标图像可以基于不同类型的图像得到,所述不同类型的图像可以包括训练图像和待识别图像。在预设模型的训练阶段,所述目标图像可以基于训练图像得到,例如是开源数据集中的部分或全部,或者是用户收集并标注的图像;在预设模型的推理(应用)阶段,所述目标图像可以基于待识别图像得到,所述待识别图像可以是人脸识别设备采集的待识别人脸,或者自动驾驶设备行驶过程中采集的环境图像,本申请实施例对此不做限定。
本申请实施例中,所述目标图像可以是训练图像或待识别图像处理后得到的,也可以直接是训练图像或待识别图像而无需任何处理,即直接输入所述预设模型的图像。本领域的技术人员可以根据实际需要选择是否对训练图像或待识别图像进行滤波、二值化等图像预处理操作,本实施例对此不做限定。
为了进一步增加本申请实施例训练得到的预设模型学习到的图像特征范围,即使得预设模型学习到更加广泛的图像特征分布。在一些实施方式中,所述目标图像包括噪声,以便所述预设模型可以基于包括噪声的目标图像提取出准确的图像特征。所述目标图像可以是在训练图像输入预设模型前,进行图像处理操作(例如增加噪声)后得到的;所述目标图像也可以是所述预设模型对目标图像进行图像特征获取过程中,对输入的训练图像叠加噪声得到的,例如可以通过下述实施例中的目标权重分布对输入预设模型的训练图像进行处理,直接获取目标图像特征(即通过权重分布实现叠加噪声和目标图像特征获取)。
当目标图像包括噪声时,该目标图像可以是对输入预设模型的图像进行模糊处理得到,例如可以对自动驾驶设备静止时采集到的清晰的环境图像进行模糊处理,得到模糊图像(即包括噪声的目标图像)。上述模糊图像可以看作是模拟的自动驾驶设备行驶过程中采集到的包括模糊区域的环境图像,若本申请实施例的预设模型具备从模拟的模糊图像获取准确的目标图像特征的能力,则说明所述预设模型也可以从真实的模糊图像获取准确的目标图像特征。本申请实施例的所述预设模型可以获取更加广泛的图像特征,具备很强的泛化能力和应用范围,其不仅仅只适用于清晰图像的图像特征获取场景。
步骤S120,获取目标权重分布,根据所述目标权重分布从所述目标图像获取目标图像特征。
本申请实施例中,所述目标权重分布可以是符合第一预设条件的权重分布。
一些实施方式中,所述第一预设条件可以是:在预设模型的训练阶段,从所述目标权重分布中采样得到权重后,预设模型基于所述权重能够从目标图像中获取足够准确的目标图像特征。足够准确的目标图像特征指的是:基于所述目标图像特征进行图像识别时,能够得到与所述目标图像的标签对应的识别结果。例如,若目标图像是标签为“猫”的图像1,那么基于所述图像1的目标图像特征进行识别后,得到的识别结果也为“猫”;或者,所述识别结果为一个识别概率分布,那么所述识别概率分布中概率值最大的目标类别为“猫”。
可以理解的是,目标权重分布可能难以直接获取,需要逐步迭代得到。在一些实施方式中,所述目标权重分布可以基于初始化的权重分布逐步更新得到,也即在得到所述目标权重分布之前,将对初始权重分布迭代更新多次。例如可以通过随机初始化获取第一权重分布,然后对所述第一权重分布进行更新得到第二权重分布,之后对所述第二权重分布更新得到第三权重分布,以上权重分布更新过程继续执行多次,每次对权重分布更新均基于历史权重分布,直至得到符合第一预设条件的目标权重分布。
考虑到,数据分布往往由数据分布的参数确定,例如高斯分布通常由均值和方差确定。因此,在一些实施方式中,若所述第一权重分布是高斯分布,获取所述第一权重分布可以是获取均值和方差,在获取所述均值和方差时,可以基于预先设置(例如随机初始化)得到所述均值和方差,也可以从所述模型训练装置的外部获取,本申请实施例对此不做限定。
与所述目标权重分布可以是符合第一预设条件的权重分布类似,所述目标图像特征也可以是符合第二预设条件的图像特征。具体来说,所述符合第二预设条件的图像特征指的是一组符合第二预设条件的图像特征中的一个,该组图像特征中包括至少两个时序相邻的图像特征,且所述至少两个时序相邻的图像特征之间的相似度不小于第二预设阈值,所述至少两个时序相邻的图像特征由所述预设模型根据目标权重分布从目标图像中获取。例如,所述预设模型根据目标权重分布从目标图像A迭代获取了图像特征a、图像特征b、图像特征c,若图像特征c与图像特征b的区别较小,即二者之间的相似度不小于第二预设阈值,则可将图像特征b设为所述目标图像特征。
为了快速获取所述目标图像特征,在一些实施方式中,每获取到一个图像特征后即确定所述图像特征是否为目标图像特征,如图3所示,根据所述目标权重分布从所述目标图像获取目标图像特征,包括:
步骤S121,从所述目标权重分布中获取第一权重和第二权重。
所述第一权重并不特指第一次获取得到的权重,在预设模型实际的目标图像特征获取过程中可能是三次、四次或更多次获取得到的权重;所述第一权重与第一图像特征对应,能够基于历史图像特征(包括目标图像)获取第一图像特征的权重即为所述第一权重。类似地,所述第二权重也不特指从所述目标权重分布中第二次获取得到的权重。
需要说明的是,第一权重与第二权重仅指不同的权重,存在权重获取次序的不同。第二权重的获取与第一权重的获取相互独立,也即第二权重仅仅与第一权重从同一个目标权重分布中获取得到,并不存在其他对应关系。可以理解的是,虽然第一权重和第二权重是从同一个权重分布获取的不同权重,但是在一些实施方式中,第一权重的数值可以和第二权重的数值相同,也即在一些情况下,可能获取到数值相同的第一权重和第二权重,本申请实施例不对此作限定。
步骤S122,根据所述第一权重基于历史图像特征获取第一图像特征,以及根据第二权重基于所述第一图像特征获取第二图像特征。
在本申请实施例中,所述第一图像特征和第二图像特征即为一组符合第二预设条件的图像特征,两个图像特征在时序上相邻,即在获取到第一图像特征的时间步长之后,下一时间步长则根据第二权重基于所述第一图像特征获取第二图像特征。
与第一权重类似,所述第一图像特征也不特指第一次进行图像特征获取得到的图像特征,其可以是与第二图像特征之间的相似度不小于第二预设阈值的图像特征。
类似地,所述第二图像特征也不特指进行第二次图像特征获取得到的图像特征,其可以是与第一图像特征不小于第二预设阈值的图像特征,即所述目标图像特征。
本申请实施例中,为了得到目标图像特征,可能需要进行多次权重获取和图像特征获取。如图4所示,在基于所述第一权重从历史图像特征中提取得到第一图像特征之前,可能已经基于所述目标权重分布和所述目标图像获取过多次图像特征。例如,在获取到所述第一图像特征之前已经获取过1次图像特征,具体过程可以是:从所述目标权重分布中获取到权重1,根据所述权重1从所述目标图像中获取图像特征1,然后再从所述目标权重分布中获取到第一权重,根据所述第一权重从所述图像特征1中获取所述第一图像特征。
可以理解的是,在基于所述第一权重从历史图像特征中提取得到第一图像特征之前,也可能未基于所述目标权重分布和所述目标图像获取过图像特征,即第一图像特征基于目标图像直接获取,第二图像特征即为第二次进行图像特征获取得到的图像特征。
步骤S123,若所述第一图像特征和所述第二图像特征的相似度不小于第二预设阈值,则将所述第二图像特征作为所述目标图像特征。
在本申请实施例中,对第一图像特征和第二图像特征进行相似度计算的计算方式可以是基于余弦相似度、欧式距离或切比雪夫距离等现有的向量距离/相似度计算方式进行,本领域的技术人员可以根据实际需要选取合适的方式,本申请实施例对此不做限定。
本申请实施例中,为了确定目标权重分布是否可作为预设模型的最终权重分布,需要确定目标权重分布是否符合第一预设条件,即预设模型是否能够基于所述目标权重分布从目标图像中获取足够准确的目标图像特征,以便基于所述足够准确的目标图像特征识别出与所述目标图像的标签一致的目标类别。由于目标权重分布可能包括多个不同的权重,基于不同的权重可能会从目标图像中获取到不同的图像特征,不同的图像特征可能导致不同的识别结果,因此,需要根据目标权重分布从目标图像中获取到足够稳定的图像特征,以便确定所述目标权重分布是否符合第一预设条件。为了便捷地确定所述足够稳定的图像特征,如果基于目标权重分布迭代获取的一组时序相邻的图像特征的相似度不小于第二预设阈值,则可以认为获取到了足够稳定的图像特征,此时可以将一组图像特征中时序在后的图像特征(即与第一图像特征的相似度不小于第二预设阈值的第二图像特征)作为所述目标图像特征。
可以理解的是,由于第一图像特征与第二图像特征的相似度足够高,在一些实施方式中,也可以将第一图像特征作为目标图像特征。
需要说明的是,很可能存在第一次获取的图像特征与第二次获取的图像特征相似度小于所述第二预设阈值的情况,即获取到目标图像特征之前,已经进行了很多个时间步长的图像特征获取步骤。
在一些实施方式中,在每一个时间步长获取图像特征时,当前时间步长的图像特征以上一时间步长获取的图像特征为所述预设模型的输入进行获取。例如,首先从所述目标权重分布获取权重1,然后基于所述权重1从目标图像获取图像特征1;接下来,再从所述目标权重分布获取权重2,然后基于所述权重2从图像特征1获取图像特征2;之后计算图像特征1与图像特征2的相似度,如果两者的相似度不小于第二预设阈值,则可以将图像特征2确定为目标图像特征;如果两者的相似度小于第二预设阈值,则还需要基于图像特征2、根据从目标权重分布重新获取的权重3获取图像特征3,再继续计算图像特征3和图像特征2的相似度;重复以上过程直至得到所述目标图像特征。
为了从目标图像中得到更加稳定的目标图像特征,在一个实施例中,可以不仅仅是在首次出现一对相似度不大于第二预设阈值的图像特征(即所述第一图像特征和第二图像特征)时就停止权重采样和图像特征迭代,而是冗余地多进行几次权重采样和图像特征迭代。即在得到第二图像特征之后,继续进行权重采样和图像特征获取,保证后续迭代得到的图像特征之间的相似度均符合要求。
具体来说,在一些实施方式中,步骤S121~S123还可以通过以下步骤a和b替换:
a、从所述目标权重分布中采样第一预设数量的权重。
在本步骤中,所述预设数量可以是大于2的任意整数,比如3、5或10,本领域的技术人员可以根据实际的应用场景进行设置。
b、基于所述第一预设数量的权重从所述目标图像迭代提取图像特征,直至迭代提取得到的图像特征符合第二预设条件。
例如基于所述第一预设数量的权重迭代提取的第一预设数量的图像特征中出现相似度不小于第二预设阈值的连续第二预设数量的图像特征。
具体来说,假如第一预设数量为10,第二预设数量为5;在基于第2个权重和第3个权重,分别迭代提取到得到的第2个图像特征和第3个图像特征的相似度不小于第二预设阈值时,若接下来基于采样得到的第4-6个权重,分别迭代提取到得到的第4-6个图像特征与第2个图像特征和第3个图像特征,两两之间的相似度均不小于第二预设阈值,则可以认为得到稳态解,可以停止权重采样和迭代。
由此可见,本实施方式在首次出现一对相似度不大于第二预设阈值的图像特征(即所述第一图像特征和第二图像特征)后,冗余地多进行几次权重采样和图像特征迭代。即在得到第二图像特征之后,继续进行权重采样和图像特征获取,保证后续迭代得到的图像特征之间的相似度均符合要求,使得最终得到的目标图像特征更加稳定可靠。
步骤S130,对所述目标图像特征进行识别,得到所述目标图像的识别概率分布。
如步骤S120部分的实施例所述,目标权重分布可能无法直接获取,通常可以通过对一个随机初始化的第一权重分布逐步更新得到。由此,在预设模型从目标图像中得到目标图像特征之后,参照图5所示,将所述目标图像特征输入图像识别模型中,得到基于所述图像特征的识别概率分布,
所述识别概率分布中可以包括多个识别类别以及所述多个识别类别对应的概率值。
本申请实施例中,可以将所述识别概率分布中概率值大于预设概率值的类别确定为目标类别,以便与目标图像的标签对比(如相似度计算),得出目标图像特征是否准确的结论。
可以理解的是,所述识别概率分布中概率值大于预设概率值的类别可以是一个,也可以是多个;例如,所述预设概率值可以设置为80%,所述识别概率分布中包括多个类别及对应的概率值。
步骤S140,若目标类别与所述目标图像的标签的相似度不小于第一预设阈值,则将所述目标权重分布作为预设模型的最终权重分布。
在本申请实施例中,所述预设模型可以是采用隐式神经网络模型构建的特征提取模型,诸如常微分方程(Ordinary Differential Equation,ODE)、神经网络常微分方程(Neural ODEs,NODEs)和DEQ等隐式神经网络模型。这些隐式神经网络模型用模型必须满足的解析条件替换显式的、深度叠放的层(例如卷积神经网络模型中通常设置的卷积层、池化层和全连接层等),并且能够在恒定的内存占用范围内模拟具有“无限”深度的模型。因此,隐式神经网络模型相比于显示神经网络模型在内存消耗上具备强大优势。
传统的隐式神经网络模型,例如传统的DEQ模型通常采用一组共享的权重从目标图像中迭代获取图像特征,即迭代获取目标图像特征(即获取稳态解)的过程中,每个迭代轮次都采用固定的权重。
在采用隐式神经网络模型对输入模型的图像数据进行处理时,隐式神经网络模型往往通过迭代法对图像数据进行处理。具体来说,以DEQ模型为例,DEQ模型将对目标图像进行迭代处理,直到得到稳态解,即每轮迭代后输出的图像特征符合第二预设条件;例如,若DEQ模型的输入为原始图像X,每一轮迭代的输出为图像特征Z,那么迭代获取稳态解的每个步骤可以表述为:
Z[i+1]=f θ(Z[i];X) for i = 0,1,2,······;
其中,θ表示用于对目标图像进行图像特征获取的权重,在进行图像特征获取时,将基于θ构建具体的数据处理函数f θ;通过所述数据处理函数f θ对目标图像的迭代处理得到所述DEQ模型的稳态解即为Z[i+1]= Z[i]。
与传统的隐式神经网络模型不同,本申请实施例中,所述预设模型可以基于特定的DEQ模型构建,特定的DEQ模型中预设了用于从中采样图像特征提取权重的目标权重分布,以便在迭代获取稳态解的每一轮都重新进行权重的采样,即基于同一目标图像获取的每个图像特征都基于不同的权重。
需要说明的是,虽然本申请实施例以特定DEQ模型为例进行隐式神经网络模型如何训练以及提取图像特征的说明,但是本领域的技术人员可以根据本申请公开的对传统DEQ模型的改进(预设权重分布或者下述实施例描述的设置贝叶斯神经网络模型进行权重的采样),对其他隐式神经网络模型如ODE或NODEs进行相同或相似地改进,以便其能够在迭代获取稳态解(目标图像特征)时的每个迭代轮次采用不同的权重。
在一个可能的设计中,所述特定DEQ模型包括贝叶斯神经网络模型(BayesianNeural Network, BNN),以便在迭代提取图像特征的每个步骤从权重分布采样用于图像特征提取的权重。BNN模型与传统模型的对比如图6所示,其中x表示输入层,h表示隐藏层,y表示输出层;BNN模型中包括权重分布,即把权重看成是服从均值为μ,方差为δ的高斯分布,每个权重服从不同的高斯分布。图6所示的传统模型在训练时优化的是固定的权重,BNN模型优化的是权重分布的均值和方差;因此传统模型基于训练图像学习到的是固定的图像特征,而本申请实施例的预设模型基于训练图像学习到的是图像特征的分布。
在一个可能的设计中,可以将传统DEQ模型中的全连接层替换为所述BNN模型,在本申请实施例中,可以称包括BNN模型的DEQ模型为Bayesian-DEQ模型。所述Bayesian-DEQ模型通过所述BNN模型从目标权重分布中获取权重,在获取到权重之后,所述Bayesian-DEQ模型再根据所述权重从目标图像获取图像特征,而不是基于一组固定不变的权重获取不同的图像特征,即根据不同的权重获取不同的图像特征,极大地增加了图像特征的获取范围。本申请实施例的Bayesian-DEQ模型在训练当中学到的并不是特征,而是特征的分布,相当于在非Bayesian-DEQ模型的训练当中加了噪声,使得模型学到的特征分布大大扩展。
如图7所示,如果将训练过程映射到二维欧式空间当中,那么Bayesian-DEQ模型学习到的是一颗树状分布,而非Bayesian-DEQ模型(传统模型)学习到的只有一条直线。由于Bayesian-DEQ模型学习到的特征范围大大增加,所以在进行识别时,可以依据的信息更多,从而能够给出更加准确的识别结果。
例如,在自动驾驶领域,自动驾驶设备往往需要对采集到的环境图像进行识别,以便进行驾驶动作决策。自动驾驶设备在行驶过程中往往处于高速状态,即图像采集动作是在高速运动状态下进行的,这会导致采集到的环境图像可能存在模糊区域。传统模型基于带有噪声的图像将无法学习到准确的图像特征,从而无法对非训练图像进行准确识别。
具体来说,由于传统模型中设置的是固定的权重,因此根据固定的权重从训练图像中学习到的是固定的图像特征;如果训练图像是清晰图像,不包括模糊区域,那么传统模型学习到的就是固定的清晰图像特征。当该传统模型部署至自动驾驶设备后,由于基于这些包括模糊区域的环境图像无法提取出与学习到的图像特征匹配的识别图像特征,所以将导致该传统模型无法对包括模糊区域的环境图像进行很好的识别。
例如,训练图像为清晰的、边界分明的栏杆图像,自动驾驶设备在行驶过程中采集到的栏杆图像则为连续的栏杆色长条,训练图像和环境图像的图像特征显然区别较大。由此,传统模型基于清晰的训练图像学习到的图像特征与基于包括模糊区域的环境图像获取到的图像特征无法匹配,从而无法在行驶过程中对道路两侧的栏杆进行准确识别,极有可能因为错误或不及时的识别,执行不合适的驾驶动作,造成交通事故。
类似地,即使传统模型中基于包括模糊区域的训练图像进行训练,也无法学习到图像特征的分布,而只能是固定的模糊特征。如果传统模型学习到固定的模糊图像特征,那么传统模型基于清晰图像也无法给出准确的识别结果,且基于不同的模糊形式,也可能无法获取准确的图像特征。
与传统模型不同,在自动驾驶设备采集的模糊环境图像中,本申请实施例的预设模型可以提取到模糊环境图像中的图像特征分布,而不是固定的特征,即可以获取连续的栏杆色长条的特征分布。由于预设模型在训练阶段也是基于加入噪声的训练图像学习的特征分布,由此,预设模型基于训练图像学习到的图像特征分布与基于环境图像获取的图像特征分布一致,均为栏杆的图像特征分布。
可以理解的是,自动驾驶设备采集到的环境图像包括模糊区域,也不完全是因为自身处于行驶过程中。例如,自动驾驶设备在行驶时,周围也会存在其他处于行驶状态的车辆,即图像采集的对象也处于运动之中,这更加加剧了环境图像的模糊程度。
综上所述,传统模型对于自动驾驶设备采集到的模糊环境图像不能进行准确的图像特征提取,从而无法帮助进行准确地图像识别。而本申请实施例的预设模型可以基于权重分布从模糊的栏杆图像、道路图像、车辆图像和交通指示灯图像获取相应对象的图像特征分布,而不是固定的图像特征,从而能够基于模糊图像识别出准确的对象,以便做出合理的自动驾驶动作决策。
在介绍了本申请实施例的预设模型的具体结构以及图像特征提取过程之后,接下来继续介绍如何对权重分布进行更新,逐步得到所述目标权重分布。
本申请实施例中,若所述第一权重分布是随机初始化得到的,那么即使所述预设模型得到稳态解,即得到目标图像特征,基于所述目标图像特征进行识别得到的识别概率分布与所述目标图像的标签可能也无法匹配。
由此,还需要对所述第一权重分布进行更新,以得到目标权重分布,使得所述预设模型提取出的图像特征更加准确,也即所述预设模型学习到目标图像中更加准确的图像特征分布情况。
在本申请实施例中,通过根据第一权重分布获取的图像特征的识别概率分布,确定所述第一权重分布是否需要更新。例如,在基于第一权重分布对目标图像迭代提取得到符合第二预设条件的图像特征后,对所述符合第二预设条件的图像特征进行识别,得到识别概率分布;然后将识别概率分布中的目标类别和所述目标图像的标签进行对比,计算相似度;如果两者的相似度小于第一预设阈值,则说明基于所述第一权重分布得到的符合第二预设条件的图像特征不够好,需要对所述第一权重分布进行更新。
如步骤S120部分的实施例所述,若本申请实施例的第一权重分布为高斯分布,在对第一权重分布进行更新时,可以通过对所述第一权重分布的均值和方差进行更新来实现第一权重分布的更新。
在一些实施方式中,第一权重分布的具体更新步骤可以包括步骤(1)-(3):
(1)基于所述相似度或所述识别概率分布计算损失值。
一些实施方式中,计算损失值具体可包括:
①、基于所述相似度度计算损失值。
例如,可以基于所述相似度确定分类错误率或识别错误率,然后基于分类错误率或识别错误率计算损失值。
②、基于所述识别概率分布计算损失值。
例如,可以采用交叉熵损失函数基于所述识别概率分布计算损失值。
在本申请实施例中虽然介绍了几种不同的损失值计算方式,但本领域的技术人员还可以根据实际需要选取其他损失函数计算损失值,本申请实施例对此不做限定。
(2)根据所述损失值计算所述第一权重分布的参数的梯度。
在明确所述损失值的计算方式之后,可以分别计算所述损失值和所述参数的偏导,然后以二者偏导的比值为所述参数的梯度。
可以理解的是,所述参数与所述第一权重分布的类型有关,如所述第一权重分布为高斯分布,则所述参数为均值和方差。所述第一权重分布还可以为伯努利分布、贝塔分布或泊松分布等,对应的待更新参数则需要根据对应分布的类型确定。对于所述第一权重分布的类型,本领域的技术人员可以根据实际的应用场景按照需求设置,本实施例对此不做限定。
需要说明的是,如果所述第一权重分布的数据分布类型所对应的参数是有界的,例如伯努利分布的参数取值范围为[0,1]。为了方便通过梯度优化法对有界参数进行更新,需要先将所述有界参数转换为无界参数,例如可以通过归一化函数将所述伯努利分布的参数映射入预设数值范围(—∞,+∞),那么所述映射后的参数即为所述伯努利分布的无界参数,在进行权重分布的参数更新时,则更新所述无界参数。
(3)根据所述梯度更新所述第一权重分布的参数。
若梯度为正,则根据预设步长,减小所述第一权重分布的参数;若梯度为负,则根据预设步长,增大所述第一权重分布的参数。
可以理解的是,若所述第一权重分布包括多个参数,则需要分别计算各个参数的梯度,然后再根据各个梯度更新对应的参数。
虽然在本申请实施例中以梯度优化法为例介绍了如何对第一权重分布的参数进行更新,然而本领域的技术人员也可以根据实际需要使用最小二乘法、牛顿法和拟牛顿法中的一种进行更新,直到损失值收敛或者满足其他预定结束条件(例如权重分布更新了预设次数)。
上述实施方式仅以第一权重分布为例描述了如何进行权重分布的更新,在实际应用时,若更新第一权重分布得到的第二权重分布不符合第一预设条件,即不是目标权重分布,那么本领域的技术人员可以参照第一权重分布的更新方式对第二权重分布、第三权重分布或第N权重分布进行更新,直至得到符合第一预设条件的目标权重分布,作为所述预设模型的最终权重分布。
本申请实施例的模型训练方法,获取目标图像,根据历史权重分布获取目标权重分布,根据所述目标权重分布从目标图像中获取特征信息广泛的目标图像特征,对所述目标图像特征进行识别,以确定所述目标图像特征是否准确,进而确定是否可将所述目标权重分布作为预设模型的最终权重分布,以完成预设模型的训练。本申请实施例将现有模型中的固定权重替换为权重分布,以权重分布作为预设模型的待优化项进行训练。由于权重分布可以包括多个不同的权重,多个不同的权重可以帮助预设模型从图像中获取不同的图像特征,然而,这些不同的图像特征可能无法对图像识别提供有效信息,因此,本申请实施例还对权重分布进行迭代更新,以得到最终权重分布。相比于历史权重分布,虽然最终权重分布也包括多个不同的权重,这些不同的权重可能使得预设模型从图像中获取到不同的图像特征,但是这些不同的图像特征均可以提供对图像识别有效的特征信息,即训练完成的预设模型能够从图像中获取广泛且准确的图像特征,具备灵活多变的特征表达能力。相比于现有模型只能根据固定的权重从图像中获取固定图像特征,本申请实施例的预设模型能够根据最终权重分布从图像中获取广泛且准确的目标图像特征,广泛且准确的目标图像特征比单一的固定图像特征具备更宽广更多维度的图像信息,因此,目标图像特征可以提高图像识别模型的识别准确度。
上述实施例描述了预设模型在训练阶段如何更新,在训练完成之后,可以将训练完成的所述预设模型部署在需要进行图像识别的设备中,例如自动驾驶设备中,以提高自动驾驶设备对模糊图像的识别能力。
为了使得所述预设模型从目标图像中获取到更加准确的目标图像特征,在本实施例中,以目标权重分布中采样得到的多个权重的平均值为图像特征提取权重,具体来说,所述预设模型根据所述目标权重分布从目标图像中获取目标图像特征,包括:
首先,从所述目标权重分布中采样得到多个权重。
在本实施例中,为了使得最终提取得到的目标图像特征更加准确且稳定,将多次从所述目标权重分布中采样权重,以便计算多个权重的均值作为提取目标图像特征的权重。
可以理解的是,采样的具体次数可以由本领域的技术人员根据实际情况进行设置,例如3次、5次或10次等等,本实施例对此不做具体要求。
然后,计算所述多个权重的平均值,得到图像特征提取权重。
最后,根据所述图像特征提取权重从所述目标图像中获取目标图像特征。
由于本申请实施例的预设模型具备存储资源占用小和图像特征获取准确的优势,将其部署在自动驾驶设备中,不仅可利用该预设模型提取包括模糊区域的环境图像的图像特征,以便进行更加准确地环境识别,还可以节省存储资源,以便自动驾驶设备安装更多程序,拓展其他功能,将对设备性能优化带来极大提升。
为了验证本申请实施例的预设模型对图像识别效果的提升,发明人使用同量级的Bayesian神经网络模型与Bayesian-DEQ神经网络模型(基于本申请实施例的模型训练方法得到的特征提取模型)在图像识别的CIFAR-10数据集上做了实验。在相同超参数以及模型参数量相同的前提下,发明人发现Bayesian神经网络模型的测试准确率非常不稳定,最高的时候是61.58,最低的时候却只有40.92。而Bayesian-DEQ神经网络模型的准确率可以持续的稳定在60以上,最高的时候达到过62.39。由此,可以认为上述实验结果已经可以说明Bayesian-DEQ神经网络模型不但比起同量级的Bayesian神经网络模型更加稳定,而且提取得到的图像特征对提高识别准确率作用也更高,即图像特征提取的准确率更好。
在介绍了本申请实施例的方法之后,接下来,参考图8对本申请实施例的模型训练装置进行介绍,该装置同样可以适用于图1所示的服务器01,所述装置60包括:
输入输出模块601,被配置为获取目标图像;
处理模块602,被配置为获取目标权重分布,根据所述目标权重分布从所述目标图像获取目标图像特征,其中,所述目标权重分布根据历史权重分布更新得到;
所述处理模块602,还被配置为对所述目标图像特征进行识别,得到所述目标图像的识别概率分布;
所述处理模块602,还被配置为若目标类别与所述目标图像的标签的相似度不小于第一预设阈值,则将所述目标权重分布作为预设模型的最终权重分布;其中,所述目标类别为所述识别概率分布中概率值大于预设概率值的类别;
所述输入输出模块601,还被配置为将训练完成的所述预设模型输出或将所述最终权重输出,以便部署至其他生产环境中。
一些实施方式中,所述处理模块602,还被配置为从所述目标权重分布中获取第一权重和第二权重;以及
根据所述第一权重基于历史图像特征获取第一图像特征,以及根据第二权重基于所述第一图像特征获取第二图像特征;以及
若所述第一图像特征和所述第二图像特征的相似度不小于第二预设阈值,则将所述第二图像特征作为所述目标图像特征;
其中,所述历史图像特征基于所述目标图像得到。
一些实施方式中,所述目标图像包括噪声后,所述目标图像特征在二维欧式空间的映射为树状结构。
一些实施方式中,所述根据所述目标权重分布从所述目标图像获取目标图像特征包括至少两个时间步长的图像特征获取步骤;
当前时间步长的图像特征以上一时间步长获取的图像特征为所述预设模型的输入进行获取。
一些实施方式中,所述预设模型包括隐式神经网络模型,所述隐式神经网络模型至少用于从所述目标图像获取目标图像特征;
所述隐式神经网络模型包括贝叶斯神经网络模型,所述贝叶斯神经网络模型至少用于从目标权重分布中采样用于进行目标图像特征获取的权重。
一些实施方式中,所述处理模块602,还被配置为从所述目标权重分布中获取多个权重;以及
计算所述多个权重的平均值,得到图像特征提取权重;以及
根据所述图像特征提取权重从所述目标图像获取目标图像特征。
在本申请实施例中,进行图像特征提取时,由于是基于从目标权重分布中采样得到的权重进行,为了使得最终提取得到的目标图像特征更加准确且稳定,将多次从所述目标权重分布中采样权重,以便计算多个权重的均值作为提取目标图像特征的权重。
可以理解的是,采样的具体次数可以由本领域的技术人员根据实际情况进行设置,例如3次、5次或10次等等,本实施例对此不做具体要求。
一些实施方式中,所述装置60被部署至自动驾驶设备中,所述目标图像为自动驾驶设备采集到的待识别图像;
所述待识别图像包括模糊区域;
从所述待识别图像中获取到的目标图像特征包括基于所述模糊区域获取的图像特征。
例如,在自动驾驶设备采集的模糊环境图像中,本申请实施例的预设模型可以提取到模糊环境图像中的图像特征分布,而不是固定的特征,即可以获取连续的栏杆色长条的特征分布。由于预设模型在训练阶段也是基于加入噪声的训练图像学习的特征分布,由此,预设模型基于训练图像学习到的图像特征分布与基于环境图像获取的图像特征分布一致,均为栏杆的图像特征分布。
可以理解的是,自动驾驶设备采集到的环境图像包括模糊区域,也不完全是因为自身处于行驶过程中。例如,自动驾驶设备在行驶时,周围也会存在其他处于行驶状态的车辆,即图像采集的对象也处于运动之中,这更加加剧了环境图像的模糊程度。本申请实施例的预设模型可以基于权重分布从模糊的栏杆图像、道路图像、车辆图像和交通指示灯图像获取相应对象的图像特征分布,而不是固定的图像特征,从而能够基于模糊图像识别出准确的对象,以便做出合理的自动驾驶动作决策。
由于自动驾驶设备在行驶过程中采集到环境图像往往包括模糊区域,本申请实施例的预设模型能够从包括模糊区域的环境图像更加广泛、准确地获取图像特征,从而使得图像识别结果更加准确,提高自动驾驶设备的驾驶准确性和安全性。另外,与同量级的卷积神经网络模型相比,隐式神经网络模型在训练过程中只需消耗一半的GPU内存,甚至更少。在以自动驾驶设备为代表的移动终端设备中,其硬件资源显得尤为珍贵,更少的资源消耗意味着自动驾驶设备可以为其他功能实现提供更多资源。即部署隐式神经网络模型实现图像识别的自动驾驶设备可以提供更多拓展功能。
本申请实施例的模型训练装置,获取目标图像,根据历史权重分布获取目标权重分布,根据所述目标权重分布从目标图像中获取特征信息广泛的目标图像特征,对所述目标图像特征进行识别,以确定所述目标图像特征是否准确,进而确定是否可将所述目标权重分布作为预设模型的最终权重分布,以完成预设模型的训练。本申请实施例将现有模型中的固定权重替换为权重分布,以权重分布作为预设模型的待优化项进行训练。由于权重分布可以包括多个不同的权重,多个不同的权重可以帮助预设模型从图像中获取不同的图像特征,然而,这些不同的图像特征可能无法对图像识别提供有效信息,因此,本申请实施例还对权重分布进行迭代更新,以得到最终权重分布。相比于历史权重分布,虽然最终权重分布也包括多个不同的权重,这些不同的权重可能使得预设模型从图像中获取到不同的图像特征,但是这些不同的图像特征均可以提供对图像识别有效的特征信息,即训练完成的预设模型能够从图像中获取广泛且准确的图像特征,具备灵活多变的特征表达能力。相比于现有模型只能根据固定的权重从图像中获取固定图像特征,本申请实施例的预设模型能够根据最终权重分布从图像中获取广泛且准确的目标图像特征,广泛且准确的目标图像特征比单一的固定图像特征具备更宽广更多维度的图像信息,因此,目标图像特征可以提高图像识别模型的识别准确度。
在介绍了本申请实施例的方法和装置之后,接下来,对本申请实施例的计算机可读存储介质进行说明,计算机可读存储介质可为光盘,其上存储有计算机程序(即程序产品),所述计算机程序在被处理器运行时,会实现上述方法实施方式中所记载的各步骤,例如,获取目标图像;获取目标权重分布,根据所述目标权重分布从所述目标图像获取目标图像特征,其中,所述目标权重分布根据历史权重分布更新得到;对所述目标图像特征进行识别,得到所述目标图像的识别概率分布;若目标类别与所述目标图像的标签的相似度不小于第一预设阈值,则将所述目标权重分布作为预设模型的最终权重分布;其中,所述目标类别为所述识别概率分布中概率值大于预设概率值的类别。各步骤的具体实现方式在此不再重复说明。
需要说明的是,所述计算机可读存储介质的例子还可以包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
上面从模块化功能实体的角度对本申请实施例中的模型训练装置60进行了描述,下面从硬件处理的角度分别对本申请实施例中的执行模型训练方法的服务器、终端设备进行描述。
需要说明的是,在本申请模型训练装置实施例的图8所示的输入输出模块601对应的实体设备可以为输入/输出单元、收发器、射频电路、通信模块和输入/输出(I/O)接口等,处理模块602对应的实体设备可以为处理器。图8所示的模型训练装置60可以具有如图9所示的结构,当图8所示的模型训练装置60具有如图9所示的结构时,图9中的处理器和收发器能够实现前述对应该装置的装置实施例提供的处理模块602和输入输出模块601相同或相似的功能,图9中的存储器存储处理器执行上述模型训练方法时需要调用的计算机程序。
本申请实施例还提供了一种终端设备,如图10所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该终端设备可以为包括手机、平板电脑、个人数字助理(Personal Digital Assistant,PDA)、销售终端设备(Point of Sales,POS)、车载电脑等任意终端设备,以终端设备为手机为例:
图10示出的是与本申请实施例提供的终端设备相关的手机的部分结构的框图。参考图10,手机包括:射频(Radio Frequency,RF)电路1010、存储器1020、输入单元1030、显示单元1040、传感器1050、音频电路1060、无线保真(wireless fidelity,WiFi)模块1070、处理器1080、以及电源1090等部件。本领域技术人员可以理解,图10中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图10对手机的各个构成部件进行具体的介绍:
RF电路1010可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1080处理;另外,将设计上行的数据发送给基站。通常,RF电路1010包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(LowNoiseAmplifier,LNA)、双工器等。此外,RF电路1010还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯***(GlobalSystem of Mobile communication,GSM)、通用分组无线服务(General PacketRadioService,GPRS)、码分多址(Code DivisionMultiple Access,CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution,LTE)、电子邮件、短消息服务(Short Messaging Service,SMS)等。
存储器1020可用于存储软件程序以及模块,处理器1080通过运行存储在存储器1020的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器1020可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1020可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元1030可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元1030可包括触控面板1031以及其他输入设备1032。触控面板1031,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1031上或在触控面板1031附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板1031可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1080,并能接收处理器1080发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1031。除了触控面板1031,输入单元1030还可以包括其他输入设备1032。具体地,其他输入设备1032可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元1040可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1040可包括显示面板1041,可选的,可以采用液晶显示器(LiquidCrystalDisplay,LCD)、有机发光二极管(OrganicLight-Emitting Diode,OLED)等形式来配置显示面板1041。进一步的,触控面板1031可覆盖显示面板1041,当触控面板1031检测到在其上或附近的触摸操作后,传送给处理器1080以确定触摸事件的类型,随后处理器1080根据触摸事件的类型在显示面板1041上提供相应的视觉输出。虽然在图10中,触控面板1031与显示面板1041是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板1031与显示面板1041集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器1050,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1041的亮度,接近传感器可在手机移动到耳边时,关闭显示面板1041和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路1060、扬声器1061,传声器1062可提供用户与手机之间的音频接口。音频电路1060可将接收到的音频数据转换后的电信号,传输到扬声器1061,由扬声器1061转换为声音信号输出;另一方面,传声器1062将收集的声音信号转换为电信号,由音频电路1060接收后转换为音频数据,再将音频数据输出处理器1080处理后,经RF电路1010以发送给比如另一手机,或者将音频数据输出至存储器1020以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块1070可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图10示出了WiFi模块1070,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器1080是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1020内的软件程序和/或模块,以及调用存储在存储器1020内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器1080可包括一个或多个处理单元;可选的,处理器1080可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1080中。
手机还包括给各个部件供电的电源1090(比如电池),可选的,电源可以通过电源管理***与处理器1080逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,该手机所包括的处理器1080还具有控制执行以上由图像处理装置执行的训练预设模型的方法流程。
本申请实施例还提供了一种服务器,请参阅图11,图11是本申请实施例提供的一种服务器结构示意图,该服务器1100可因配置或性能不同而产生比较大的差异,可以包括一个或一个以***处理器(英文全称:central processing units,英文简称:CPU)1122(例如,一个或一个以上处理器)和存储器1132,一个或一个以上存储应用程序1142或数据1144的存储介质1130(例如一个或一个以上海量存储设备)。其中,存储器1132和存储介质1130可以是短暂存储或持久存储。存储在存储介质1130的程序可以包括一个或一个以上模块(图中未示出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1122可以设置为与存储介质1130通信,在服务器1100上执行存储介质1130中的一系列指令操作。
服务器1100还可以包括一个或一个以上电源1126,一个或一个以上有线或无线网络接口1150,一个或一个以上输入输出接口1158,和/或,一个或一个以上操作***1141,例如Windows Server,Mac OS X,Unix, Linux,FreeBSD等等。
上述实施例中由服务器所执行的步骤可以基于该图11所示的服务器1100的结构。例如,例如上述实施例中由图11所示的模型训练装置60所执行的步骤可以基于该图11所示的服务器结构。例如,所述中央处理器1122通过调用存储器1132中的指令,执行以下操作:
通过输入输出接口1158获取目标图像;
中央处理器1122对历史权重分布进行更新以获取目标权重分布,根据所述目标权重分布从所述目标图像获取目标图像特征;
通过输入输出接口1158将所述目标图像特征传输至图像处理装置,以对所述目标图像特征进行识别,得到所述目标图像的识别概率分布;
若目标类别与所述目标图像的标签的相似度不小于第一预设阈值,中央处理器1122则将所述目标权重分布作为预设模型的最终权重分布;其中,所述目标类别为所述识别概率分布中概率值大于预设概率值的类别。
在训练完成之后,还可以通过输入输出接口1158将所述最终权重分布或所述预设模型输出,以便将预设模型部署至其他应用设备(例如自动驾驶设备)中,帮助其他应用设备从待处理图像中获取准确且广泛的图像特征。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***,装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请实施例所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请实施例各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机计算机程序时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
以上对本申请实施例所提供的技术方案进行了详细介绍,本申请实施例中应用了具体个例对本申请实施例的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请实施例的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请实施例的限制。

Claims (9)

1.一种模型训练方法,所述方法包括:
获取目标图像;
获取目标权重分布,根据所述目标权重分布从所述目标图像获取目标图像特征,其中,所述目标权重分布根据历史权重分布更新得到;所述目标权重分布用于采样进行目标图像特征获取的权重;
对所述目标图像特征进行识别,得到所述目标图像的识别概率分布;
若目标类别与所述目标图像的标签的相似度不小于第一预设阈值,则将所述目标权重分布作为预设模型的最终权重分布;
其中,所述目标类别为所述识别概率分布中概率值大于预设概率值的类别;
所述根据所述目标权重分布从所述目标图像获取目标图像特征包括至少两个时间步长的图像特征获取步骤;
当前时间步长的图像特征以上一时间步长获取的图像特征为所述预设模型的输入进行获取;
所述目标图像特征,与该目标图像特征的上一时间步长的图像特征的相似度不小于第二预设阈值。
2.如权利要求1所述的方法,其中,所述根据所述目标权重分布从所述目标图像获取目标图像特征,包括:
从所述目标权重分布中获取第一权重和第二权重;
根据所述第一权重基于历史图像特征获取第一图像特征,以及根据第二权重基于所述第一图像特征获取第二图像特征;
若所述第一图像特征和所述第二图像特征的相似度不小于第二预设阈值,则将所述第二图像特征作为所述目标图像特征;
其中,所述历史图像特征基于所述目标图像得到。
3.如权利要求1所述的方法,其中,所述目标图像包括噪声,所述目标图像特征在二维欧式空间的映射为树状结构。
4.如权利要求1-3中任一项所述的方法,其中,所述预设模型包括隐式神经网络模型;
所述隐式神经网络模型至少用于从所述目标图像获取目标图像特征;
所述隐式神经网络模型包括贝叶斯神经网络模型,所述贝叶斯神经网络模型至少用于从目标权重分布中采样用于进行目标图像特征获取的权重。
5.如权利要求1所述的方法,其中,根据所述目标权重分布从所述目标图像获取目标图像特征,包括:
从所述目标权重分布中获取多个权重;
计算所述多个权重的平均值,得到图像特征提取权重;
根据所述图像特征提取权重从所述目标图像获取目标图像特征。
6.如权利要求1所述的方法,其中,所述目标图像基于自动驾驶设备采集到的待识别图像获取;
所述待识别图像包括模糊区域;
从所述目标图像中获取到的目标图像特征包括基于所述模糊区域获取的图像特征。
7.一种模型训练装置,包括:
输入输出模块,被配置为获取目标图像;
处理模块,被配置为获取目标权重分布,根据所述目标权重分布从所述目标图像获取目标图像特征,其中,所述目标权重分布根据历史权重分布更新得到;所述目标权重分布用于采样进行目标图像特征获取的权重;
所述处理模块,还被配置为对所述目标图像特征进行识别,得到所述目标图像的识别概率分布;
所述处理模块,还被配置为若目标类别与所述目标图像的标签的相似度不小于第一预设阈值,则将所述目标权重分布作为预设模型的最终权重分布;
其中,所述目标类别为所述识别概率分布中概率值大于预设概率值的类别;
所述根据所述目标权重分布从所述目标图像获取目标图像特征包括至少两个时间步长的图像特征获取步骤;
当前时间步长的图像特征以上一时间步长获取的图像特征为所述预设模型的输入进行获取;
所述目标图像特征,与该目标图像特征的上一时间步长的图像特征的相似度不小于第二预设阈值。
8.一种计算设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如权利要求1-6中任一项所述的方法。
9.一种计算机可读存储介质,其包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-6中任一项所述的方法。
CN202210502310.8A 2022-05-10 2022-05-10 模型训练方法、相关装置及存储介质 Active CN114743081B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210502310.8A CN114743081B (zh) 2022-05-10 2022-05-10 模型训练方法、相关装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210502310.8A CN114743081B (zh) 2022-05-10 2022-05-10 模型训练方法、相关装置及存储介质

Publications (2)

Publication Number Publication Date
CN114743081A CN114743081A (zh) 2022-07-12
CN114743081B true CN114743081B (zh) 2023-06-20

Family

ID=82284823

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210502310.8A Active CN114743081B (zh) 2022-05-10 2022-05-10 模型训练方法、相关装置及存储介质

Country Status (1)

Country Link
CN (1) CN114743081B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569895A (zh) * 2021-02-20 2021-10-29 腾讯科技(北京)有限公司 图像处理模型训练方法、处理方法、装置、设备及介质
CN114357166A (zh) * 2021-12-31 2022-04-15 北京工业大学 一种基于深度学习的文本分类方法
CN114444579A (zh) * 2021-12-31 2022-05-06 北京瑞莱智慧科技有限公司 通用扰动获取方法、装置、存储介质及计算机设备

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106548210B (zh) * 2016-10-31 2021-02-05 腾讯科技(深圳)有限公司 基于机器学习模型训练的信贷用户分类方法及装置
CN107679525B (zh) * 2017-11-01 2022-11-29 腾讯科技(深圳)有限公司 图像分类方法、装置及计算机可读存储介质
CN110163234B (zh) * 2018-10-10 2023-04-18 腾讯科技(深圳)有限公司 一种模型训练方法、装置和存储介质
EP3722894B1 (en) * 2019-04-09 2022-08-10 Robert Bosch GmbH Control and monitoring of physical system based on trained bayesian neural network
CN111783551B (zh) * 2020-06-04 2023-07-25 中国人民解放军军事科学院国防科技创新研究院 基于贝叶斯卷积神经网络的对抗样本防御方法
CN112733729B (zh) * 2021-01-12 2024-01-09 北京爱笔科技有限公司 模型训练、回归分析的方法、装置、存储介质和设备
CN112598091B (zh) * 2021-03-08 2021-09-07 北京三快在线科技有限公司 一种训练模型和小样本分类的方法及装置
CN112926789B (zh) * 2021-03-17 2024-05-14 阳光慧碳科技有限公司 卫星云图的预测方法、预测装置及可读存储介质
CN113449188A (zh) * 2021-06-30 2021-09-28 东莞市小精灵教育软件有限公司 应用推荐方法、装置、电子设备及可读存储介质
CN113887325A (zh) * 2021-09-10 2022-01-04 北京三快在线科技有限公司 一种模型训练方法、表情识别方法以及装置
CN114359582B (zh) * 2022-01-11 2024-07-02 平安科技(深圳)有限公司 一种基于神经网络的小样本特征提取方法及相关设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569895A (zh) * 2021-02-20 2021-10-29 腾讯科技(北京)有限公司 图像处理模型训练方法、处理方法、装置、设备及介质
CN114357166A (zh) * 2021-12-31 2022-04-15 北京工业大学 一种基于深度学习的文本分类方法
CN114444579A (zh) * 2021-12-31 2022-05-06 北京瑞莱智慧科技有限公司 通用扰动获取方法、装置、存储介质及计算机设备

Also Published As

Publication number Publication date
CN114743081A (zh) 2022-07-12

Similar Documents

Publication Publication Date Title
CN110364144B (zh) 一种语音识别模型训练方法及装置
US10943091B2 (en) Facial feature point tracking method, apparatus, storage medium, and device
CN109918684B (zh) 模型训练方法、翻译方法、相关装置、设备及存储介质
CN114297730B (zh) 对抗图像生成方法、装置及存储介质
CN114722937B (zh) 一种异常数据检测方法、装置、电子设备和存储介质
CN115239941B (zh) 对抗图像生成方法、相关装置及存储介质
CN114612531B (zh) 一种图像处理方法、装置、电子设备及存储介质
CN115392405A (zh) 模型训练方法、相关装置及存储介质
CN117332844A (zh) 对抗样本生成方法、相关装置及存储介质
CN114743081B (zh) 模型训练方法、相关装置及存储介质
CN114625657A (zh) 模型解释方法、装置、电子设备及存储介质
CN116259083A (zh) 一种图像质量识别模型的确定方法和相关装置
CN114943639B (zh) 图像获取方法、相关装置及存储介质
CN116386647B (zh) 音频验证方法、相关装置、存储介质及程序产品
CN117079356A (zh) 一种对象鉴伪模型构建方法、虚假对象检测方法及装置
CN117011649B (zh) 一种模型训练方法和相关装置
CN116580268B (zh) 图像目标定位模型的训练方法、图像处理方法及相关产品
CN118429745A (zh) 基于微调模型的图像识别方法、相关装置及存储介质
CN117009845A (zh) 一种类增量模型的训练方法、装置以及存储介质
CN117115590A (zh) 基于自监督学习的内容审核模型训练方法、装置及介质
CN116958581A (zh) 一种图像的处理方法、装置以及存储介质
CN116992125A (zh) 一种对象的推荐方法、装置以及存储介质
CN117132851A (zh) 一种对抗补丁处理方法、相关装置及存储介质
CN117218506A (zh) 用于图像识别的模型训练方法、图像识别方法及相关装置
CN115905416A (zh) 一种数据处理方法和相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant