CN115496970A - 图像任务模型的训练方法、图像识别方法以及相关装置 - Google Patents

图像任务模型的训练方法、图像识别方法以及相关装置 Download PDF

Info

Publication number
CN115496970A
CN115496970A CN202211293168.7A CN202211293168A CN115496970A CN 115496970 A CN115496970 A CN 115496970A CN 202211293168 A CN202211293168 A CN 202211293168A CN 115496970 A CN115496970 A CN 115496970A
Authority
CN
China
Prior art keywords
task
trained
image
parameter
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211293168.7A
Other languages
English (en)
Inventor
杨馥魁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202211293168.7A priority Critical patent/CN115496970A/zh
Publication of CN115496970A publication Critical patent/CN115496970A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

本公开提供了图像任务模型的训练方法、图像识别方法以及相关装置,涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉技术领域。具体实现方案为:基于初始模型的待训练任务的第一任务参数,确定与待训练任务特征匹配的至少一个已训练任务,基于至少一个已训练任务的第二任务参数,确定目标任务参数,在初始模型中添加目标任务参数,采用图像样本数据对添加目标任务参数后的初始模型进行迭代训练,以获得图像任务模型。如此,在初始模型的任务训练过程中,参考了匹配任务的第二任务参数,由于所参考的第二任务参数是经模型训练学习到的任务参数,如此,增加了模型训练所参考的信息量,提高了模型训练的准确性。

Description

图像任务模型的训练方法、图像识别方法以及相关装置
技术领域
本公开涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉技术领域,具体涉及一种图像任务模型的训练方法、图像识别方法以及相关装置。
背景技术
深度学习的出现,不仅拓展了人工智能的领域范围,还促进了人工智能的发展。其中,机器模型的迁移学习对响应当前人工智能的发展规划以及突破人工智能的理论瓶颈具有重要的意义。迁移学习是一种利用源域的数据来提高机器模型在目标域上的训练效果的学习方法。
发明内容
本公开提供了一种图像任务模型的训练方法、图像识别方法以及相关装置。
根据本公开的一方面,提供了一种图像任务模型的训练方法,该方法包括:
基于初始模型的待训练任务的第一任务参数,确定与该待训练任务特征匹配的至少一个已训练任务,该第一任务参数为未经模型训练的用于表征任务特征的任务参数;
基于该至少一个已训练任务的第二任务参数,确定目标任务参数,该第二任务参数为经模型训练得到的用于表征任务特征的任务参数;
在该初始模型中添加该目标任务参数,采用图像样本数据对添加该目标任务参数后的该初始模型进行迭代训练,以获得该图像任务模型。
根据本公开的另一方面,提供了一种图像识别方法,该方法包括:
获取待识别图像;
将该待识别图像输入图像任务模型,通过该图像任务模型提取该待识别图像的图像特征,基于该图像特征对该待识别图像进行图像处理,以获得图像识别结果,该图像处理包括分类处理、分割处理或预测处理中的任一项;
其中,该图像任务模型是采用图像样本数据对添加目标任务参数后的初始模型进行训练得到的;该目标任务参数基于与该初始模型的待训练任务特征匹配的至少一个已训练任务的第二任务参数确定,该至少一个已训练任务基于该待训练任务的第一任务参数确定,该第一任务参数为未经模型训练的用于表征任务特征的任务参数,该第二任务参数为经模型训练得到的用于表征任务特征的任务参数。
根据本公开的另一方面,提供了一种图像任务模型的训练装置,该装置包括:
任务确定模块,用于基于初始模型的待训练任务的第一任务参数,确定与该待训练任务特征匹配的至少一个已训练任务,该第一任务参数为未经模型训练的用于表征任务特征的任务参数;
参数确定模块,用于基于该至少一个已训练任务的第二任务参数,确定目标任务参数,该第二任务参数为经模型训练得到的用于表征任务特征的任务参数;
训练模块,用于在该初始模型中添加该目标任务参数,采用图像样本数据对添加该目标任务参数后的该初始模型进行迭代训练,以获得该图像任务模型。
根据本公开的另一方面,提供了一种图像识别装置,该装置包括:
获取模块,用于获取待识别图像;
处理模块,用于将该待识别图像输入图像任务模型,通过该图像任务模型提取该待识别图像的图像特征,基于该图像特征对该待识别图像进行图像处理,以获得图像识别结果,该图像处理包括分类处理、分割处理或预测处理中的任一项;
其中,该图像任务模型是采用图像样本数据对添加目标任务参数后的初始模型进行训练得到的;该目标任务参数基于与该初始模型的待训练任务特征匹配的至少一个已训练任务的第二任务参数确定,该至少一个已训练任务基于该待训练任务的第一任务参数确定,该第一任务参数为未经模型训练的用于表征任务特征的任务参数,该第二任务参数为经模型训练得到的用于表征任务特征的任务参数。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开所提供的图像任务模型的训练方法或图像识别方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使电子设备执行本公开所提供的图像任务模型的训练方法或图像识别方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现本公开所提供的图像任务模型的训练方法或图像识别方法。
本公开所提供的技术方案,针对初始模型的待训练任务,设置有第一任务参数,由于该第一任务参数能够表征任务特征,故利用该第一任务参数能够确定出与待训练任务特征匹配的已训练任务,进而将基于该已训练任务的第二任务参数所确定的目标任务参数添加至初始模型中,以便后续基于该目标任务参数来执行模型训练的过程,如此,在初始模型的任务训练过程中,参考了匹配任务的第二任务参数,由于所参考的第二任务参数是经模型训练学习到的任务参数,如此,增加了模型训练所参考的信息量,提高了模型训练的准确性。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例示出的一种图像任务模型的训练方法或图像识别方法的实施环境示意图;
图2是根据本公开实施例示出的一种图像任务模型的训练方法的流程示意图;
图3是根据本公开实施例示出的一种图像识别方法的流程示意图;
图4是根据本公开实施例示出的一种图像识别方法的流程示意图;
图5是根据本公开实施例示出的一种图像识别的流程示意图;
图6是根据本公开实施例示出的一种图像任务模型的训练装置的结构框图;
图7是根据本公开实施例示出的一种图像识别装置的结构框图;
图8是用来实现本公开实施例的图像任务模型的训练方法或图像识别方法的电子设备的示意性框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
首先,针对本公开实施例涉及的应用场景进行描述,本公开实施例提供的图像任务模型的训练方法,可应用在基于迁移学习的模型训练场景中。在一种可能的实现方式中,图像任务为图像识别任务,如图像分类任务、图像分割任务或图像预测任务等等。进一步地,以图像分类任务为例,在一种可能的实现方式中,该图像任务可提供为人物分类任务(如a人物、b人物的二分类任务或a人物、b人物、c人物的多分类任务等)、动物分类任务(如a动物、b动物的二分类任务或a动物、b动物、c动物的多分类任务等)或情绪分类任务(如a情绪、b情绪的二分类任务或a情绪、b情绪、c情绪的多分类任务等)等等。相应地,以图像分类任务为例,该图像任务模型的训练方法可用于训练得到一个具备图像分类功能的模型。
在本公开实施例中,针对初始模型的待训练任务,设置有第一任务参数,由于该第一任务参数能够表征任务特征,故利用该第一任务参数能够确定出与待训练任务特征匹配的已训练任务,进而将基于该已训练任务的第二任务参数所确定的目标任务参数添加至初始模型中,以便后续基于该目标任务参数来执行模型训练的过程,如此,在初始模型的任务训练过程中,参考了匹配任务的第二任务参数,由于所参考的第二任务参数是经模型训练学习到的任务参数,如此,增加了模型训练所参考的信息量,提高了模型训练的准确性。
进一步地,本公开实施例还提供了一种图像识别方法,可应用在图像识别的场景下,具体可以是图像分类、图像分割或图像预测的场景。在本公开实施例中,利用上述图像任务模型的训练方法所训练得到的图像任务模型,来进行图像识别,能够提升图像识别的准确性。
图1是根据本公开实施例示出的一种图像任务模型的训练方法或图像识别方法的实施环境示意图,参见图1,该实施环境包括终端101和服务器102。
其中,终端101为智能手机、智能手表、台式电脑、手提电脑、虚拟现实终端、增强现实终端、无线终端和膝上型便携计算机等设备中的至少一种。在一种可能的实现方式中,终端101具有通信功能,能够接入有线网络或无线网络。终端101可以泛指多个终端中的一个,本公开实施例仅以终端101来举例说明。本领域技术人员可以知晓,上述终端的数量可以更多或更少。
服务器102是独立的物理服务器,或者是多个物理服务器构成的服务器集群或者分布式文件***,或者是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络、以及大数据和人工智能平台等基本云计算服务的云服务器中的至少一种,本公开实施例对此不加以限定。在一些实施例中,服务器102与终端101通过有线或无线通信方式进行直接或间接的连接,本公开实施例对此不作限定。在一种可能的实现方式中,上述服务器102的数量能够更多或更少,本公开实施例对此不加以限定。当然,服务器102还能够包括其他功能服务器,以便提供更全面多样化的服务。
在一种可能的实现方式中,本公开实施例提供的图像任务模型的训练方法由终端101执行。例如,终端101响应于针对图像任务模型的训练指令,触发执行模型训练的过程,进而利用本公开实施例提供的图像任务模型的训练方法,对初始模型进行模型训练;或者,在另一种可能的实现方式中,本公开实施例提供的图像任务模型的训练方法由服务器102执行,例如,服务器102响应于针对图像任务模型的训练请求,利用本公开实施例提供的图像任务模型的训练方法,对初始模型进行模型训练;或者,在另一种可能的实现方式中,本公开实施例提供的图像任务模型的训练方法由终端101和服务器102共同执行,例如,终端101响应于针对图像任务模型的训练指令,向服务器102发送针对该图像任务模型的训练请求,则服务器102接收到训练请求后,利用本公开实施例提供的图像任务模型的训练方法,对初始模型进行模型训练。本公开实施例对此不加以限定。
在一种可能的实现方式中,本公开实施例提供的图像识别方法由终端101执行。例如,终端101响应于针对待识别图像的图像识别操作,触发执行获取待识别图像的过程,进而利用本公开实施例提供的图像识别方法,对该待识别图像进行处理;或者,在另一种可能的实现方式中,本公开实施例提供的图像识别方法由服务器102执行,例如,服务器102响应于接收针对待识别图像的图像识别请求,获取该待识别图像,进而利用本公开实施例提供的图像识别方法,对该待识别图像进行处理;或者,在另一种可能的实现方式中,本公开实施例提供的图像识别方法由终端101和服务器102共同执行,例如,终端101响应于针对待识别图像的图像识别操作,向服务器102发送针对该待识别图像的图像识别请求,则服务器102接收到该图像识别请求后,获取该待识别图像,进而利用本公开实施例提供的图像识别方法,对该待识别图像进行处理。本公开实施例对此不加以限定。
图2是根据本公开实施例示出的一种图像任务模型的训练方法的流程示意图。在一种可能的实现方式中,该图像任务模型的训练方法由电子设备执行,该电子设备可提供为上述图1所示的终端或服务器。如图2所示,该方法包括以下步骤。
在步骤S201中,基于初始模型的待训练任务的第一任务参数,确定与该待训练任务特征匹配的至少一个已训练任务,该第一任务参数为未经模型训练的用于表征任务特征的任务参数。
在步骤S202中,基于该至少一个已训练任务的第二任务参数,确定目标任务参数,该第二任务参数为经模型训练得到的用于表征任务特征的任务参数。
在步骤S203中,在该初始模型中添加该目标任务参数,采用图像样本数据对添加该目标任务参数后的该初始模型进行迭代训练,以获得图像任务模型。
本公开实施例提供的技术方案,针对初始模型的待训练任务,设置有第一任务参数,由于该第一任务参数能够表征任务特征,故利用该第一任务参数能够确定出与待训练任务特征匹配的已训练任务,进而将基于该已训练任务的第二任务参数所确定的目标任务参数添加至初始模型中,以便后续基于该目标任务参数来执行模型训练的过程,如此,在初始模型的任务训练过程中,参考了匹配任务的第二任务参数,由于所参考的第二任务参数是经模型训练学习到的任务参数,如此,增加了模型训练所参考的信息量,提高了模型训练的准确性。
上述图2示出了一种图像任务模型的训练方法,能够训练得到具备图像识别功能的图像任务模型,基于该图像任务模型,能够实现对待识别图像的图像识别,下面基于图3对图像识别的过程进行说明。图3是根据本公开实施例示出的一种图像识别方法的流程示意图。在一种可能的实现方式中,该图像识别方法由电子设备执行,该电子设备可提供为上述图1所示的终端或服务器。如图3所示,该方法包括以下步骤。
在步骤S301中,获取待识别图像。
在步骤S302中,将该待识别图像输入图像任务模型,通过该图像任务模型提取该待识别图像的图像特征,基于该图像特征对该待识别图像进行图像处理,以获得图像识别结果,该图像处理包括分类处理、分割处理或预测处理中的任一项。
其中,该图像任务模型是采用图像样本数据对添加目标任务参数后的初始模型进行训练得到的;该目标任务参数基于与该初始模型的待训练任务特征匹配的至少一个已训练任务的第二任务参数确定,该至少一个已训练任务基于该待训练任务的第一任务参数确定,该第一任务参数为未经模型训练的用于表征任务特征的任务参数,该第二任务参数为经模型训练得到的用于表征任务特征的任务参数。
本公开实施例提供的技术方案,针对初始模型的待训练任务,设置有第一任务参数,由于该第一任务参数能够表征任务特征,故利用该第一任务参数能够确定出与待训练任务特征匹配的已训练任务,进而将基于该已训练任务的第二任务参数所确定的目标任务参数添加至初始模型中,以便后续基于该目标任务参数来执行模型训练的过程,如此,在初始模型的任务训练过程中,参考了匹配任务的第二任务参数,由于所参考的第二任务参数是经模型训练学习到的任务参数,如此,增加了模型训练所参考的信息量,提高了模型训练的准确性。
上述图2或图3为本公开所提供的一种简单实施例,下面基于一种具体实施例,来对本公开所提供的图像任务模型的训练方法以及图像识别方法进行详细说明。图4是根据本公开实施例示出的一种图像识别方法的流程示意图。在一种可能的实现方式中,该图像识别方法由电子设备执行,该电子设备可提供为上述图1所示的终端或服务器。如图4所示,以执行主体为电子设备,该方法包括以下步骤。
在步骤S401中,电子设备在任务数据库中,基于初始模型的待训练任务的第一任务参数以及该任务数据库中多个已训练任务的第一任务参数,确定该多个已训练任务分别与该待训练任务之间的相似度。
本公开实施例中,任务数据库用于存储多个已训练任务的第一任务参数和第二任务参数。其中,已训练任务是指经模型训练的任务。第一任务参数为未经模型训练的用于表征任务特征的任务参数。第二任务参数为经模型训练得到的用于表征任务特征的任务参数。应理解地,已训练任务的第一任务参数也即是该任务在模型训练之前的初始任务参数,已训练任务的第二任务参数也即是该任务在模型训练之后学习到的任务参数。
在一种可能的实现方式中,该任务数据库提供为键值对(key-value)查询库。键值对查询库是一种以键值对存储数据的数据库,也即是将数据存储为键值对集合。其中,键(key)作为唯一标识,值(value)表示对应的数据。在本公开实施例中,以已训练任务的第一任务参数作为键,以已训练任务的第二任务参数作为值,来构建键值对查询库。
在实施本方案之前,在一种可能的实现方式中,电子设备获取多个已训练任务的第一任务参数和第二任务参数,分别以已训练任务的第一任务参数作为键,以已训练任务的第二任务参数作为值,来构建键值对查询库。在本公开实施例中,通过预先构建键值对查询库,在该键值对查询库中对应存储各个已训练任务的初始任务参数和经模型训练学习到的任务参数,以便后续在训练一个新任务时,利用该键值对查询库,能够快速高效的获取到与该新任务相匹配的已训练任务,进而实现针对新任务的迁移学习,从而提升了任务学习的效率。
示例地,图5是根据本公开实施例示出的一种图像识别的流程示意图,参见图5,在图5的右侧示例地示出了一种任务数据库,在图5所示出的任务数据库中,包括三个已训练任务,分别是任务A、任务B和任务C。其中,任务A的键(key)由任务A在模型训练之前的初始任务参数(token_1)组成;任务B的键由任务B在模型训练之前的初始任务参数(token_1)组成;任务C的键由任务C在模型训练之前的初始任务参数(token_1)组成;任务A的值(value)由任务A在模型训练之后学习到的任务参数(token_2)组成;任务B的值由任务B在模型训练之后学习到的任务参数(token_2)组成;任务C的值由任务C在模型训练之后学习到的任务参数(token_2)组成。
本公开实施例中,初始模型是指待进行模型训练的基础模型。在一种可能的实现方式中,初始模型可提供为预训练模型,例如,该预训练模型为预训练的特征提取网络。示例地,参见图5,该初始模型可以是图5所示出的预训练模型。相应地,待训练任务是指针对初始模型进行模型训练时的学习任务。示例地,参见图5,该待训练任务可以是图5所示出的新任务。应理解地,待训练任务的第一任务参数也即是该待训练任务在模型训练之前的初始任务参数。
需要说明的是,本公开实施例所涉及的任务参数用于表征对应任务的任务特征。在一种可能的实现方式中,任务参数提供为特征矩阵,如m*n的矩阵,m,n为大于1的正整数。其中,m可以用于表示矩阵中向量的数量,n可以用于表示矩阵中向量所包括的元素数量,如100*128位的矩阵。
在一种可能的实现方式中,初始模型的待训练任务的第一任务参数包括多个任务子参数,该多个任务子参数与该初始模型包括的多个网络层一一对应。其中,任务子参数也即是上述特征中的向量,相应地,该多个任务子参数的数量也即是上述矩阵中向量的数量(如m)。在一种可能的实现方式中,该多个网络层可以是初始模型中全部的网络层,或者,该多个网络层也可以是初始模型中部分的网络层。以该多个网络层为部分的网络层为例,确定该多个网络层的过程为:从该初始模型所包括的网络层中,随机选取目标数量的网络层作为该多个网络层,或者,从该初始模型所包括的网络层中,每间隔目标层数,选取一个网络层,将所选取的网络层确定为该多个网络层。其中,目标数量为预先设定的数量,如100或其他数量。应理解地,该目标数量与上述矩阵中向量的数量(如m)相同。本公开实施例对目标数量的设置不作限定。目标层数为预先设定的层数,如1层、3层或其他层数。本公开实施例对目标层数的设置不作限定。
在上述实施例中,基于初始模型中全部的网络层或者部分的网络层,能够分别设置不同的第一任务参数,而基于所设置的不同的第一任务参数,进行后续模型训练的过程时,能够实现不同迁移方式的迁移学习。
在一种可能的实现方式中,该相似度基于余弦相似度、曼哈顿距离、汉明距离、明可夫斯基距离、皮尔森相关系数中的至少一项确定。如此,丰富了相似度计算的方式,在提高相似度计算的效率的同时,还提升了相似度计算的准确性。需要说明的是,电子设备可以基于该多个已训练任务分别与该待训练任务之间的余弦相似度、曼哈顿距离、汉明距离、明可夫斯基距离、皮尔森相关系数中的一项、两项或多项,来确定该多个已训练任务分别与该待训练任务之间的相似度。本公开实施例对此不作限定。
示例地,以余弦相似度为例,对于该任务数据库中的任一个已训练任务,确定该已训练任务与待训练任务之间的相似度的过程为:基于该已训练任务的第一任务参数、该待训练任务的第一任务参数以及下述相似度公式(1),确定该已训练任务与该待训练任务之间的余弦相似度,将所确定的余弦相似度作为该已训练任务与该待训练任务之间的相似度。
S=∑cos(new_token,key_token) (1)
式中,new_token表示该待训练任务的第一任务参数;key_token表示该已训练任务的第一任务参数;S表示该已训练任务与该待训练任务之间的相似度。
示例地,以余弦相似度和曼哈顿距离为例,对于该任务数据库中的任一个已训练任务,确定该已训练任务与该待训练任务之间的相似度的过程为:基于该已训练任务的第一任务参数与该待训练任务的第一任务参数,分别确定该已训练任务与该待训练任务之间的余弦相似度和曼哈顿距离,基于所确定的余弦相似度和曼哈顿距离,确定该已训练任务与该待训练任务之间的相似度。在一种可能的实现方式中,上述基于余弦相似度和曼哈顿距离,确定相似度的过程可以是:确定该余弦相似度和该曼哈顿距离的加权平均值,将所确定的加权平均值确定为该已训练任务与该待训练任务之间的相似度。当然,电子设备还能够采用其他方式,结合该余弦相似度和该曼哈顿距离,来确定该已训练任务与该待训练任务之间的相似度,本公开实施例对此不作限定。如此,参考了多种类型的相似度计算方式,增加了相似度计算所参考的信息量,进一步提升了相似度计算的准确性。
在步骤S402中,电子设备在该多个已训练任务中,选取相似度达到相似度条件的至少一个已训练任务。
在一种可能的实现方式中,相似度条件为该相似度达到相似度阈值,或,该相似度的排序位于前目标位数。其中,相似度阈值为预先设定的固定阈值,如95%、98%或其他阈值。本公开实施例对相似度阈值的设置不作限定。目标位数为预先设定的固定数值,如10、15或其他数值。本公开实施例对目标位数的设置不作限定。当然,在另一种可能的实现方式中,电子设备还能够基于其他类型的相似度条件,来选取该至少一个已训练任务。本公开实施例对相似度条件的设置不作限定。
相应地,以相似度条件为该相似度达到相似度阈值为例,上述步骤S402可替换为:电子设备在该多个已训练任务中,选取相似度达到相似度阈值的该至少一个已训练任务。或者,以相似度条件为该相似度的排序位于前目标位数为例,上述步骤S402可替换为:电子设备根据该多个已训练任务分别与该待训练任务之间的相似度,按照由高至低进行排序,选取排序位于前目标位数的该至少一个已训练任务。
本公开实施例中,通过预先构建任务数据库,在该任务数据库中对应存储各个已训练任务的第一任务参数和第二任务参数,以便后续在训练一个新任务时,利用该任务数据库,能够快速高效的获取到与该新任务相匹配的已训练任务,进而实现针对新任务的迁移学习,从而提升了任务学习的效率。且,利用已训练任务与待训练任务的第一任务参数之间的相似度,来确定已训练任务与待训练任务之间的相似度,由于第一任务参数能够表征任务特征,因此,所确定出的相似度能够体现已训练任务与待训练任务之间的特征差异,进而,能够更加准确地确定出与待训练任务特征匹配的已训练任务,提升了任务匹配的准确性。
在上述步骤S401至步骤S402中,电子设备基于初始模型的待训练任务的第一任务参数,确定与该待训练任务特征匹配的至少一个已训练任务,以便后续基于该至少一个已训练任务的第二任务参数,来执行模型训练过程。
在步骤S403中,电子设备基于该至少一个已训练任务的第二任务参数,确定目标任务参数。
本公开实施例中,目标任务参数用于指代初始模型在模型训练中所采用的任务参数。
在一种可能的实现方式中,电子设备基于该至少一个已训练任务的第二任务参数以及该至少一个已训练任务对应的相似度,确定该目标任务参数。如此,在确定目标任务参数时,还参考了各个已训练任务与该待训练任务之间的相似度,增加了确定目标任务参数所参考的信息量,提升了确定目标任务参数的准确性。进一步地,在一种可能的实现方式中,以该至少一个已训练任务对应的相似度为该至少一个已训练任务的第二任务参数的权重系数,对该至少一个已训练任务的第二任务参数进行加权求和,得到该目标任务参数。
在一种可能的实现方式中,上述加权求和确定目标任务参数的过程为:基于该至少一个已训练任务对应的相似度、该至少一个已训练任务的第二任务参数以及加权求和公式(2),得到该目标任务参数。
P=∑Si Vi (2)
式中,Si表示第i个已训练任务对应的相似度;Vi表示第i个已训练任务的第二任务参数;P表示该目标任务参数。其中,i表示已训练任务的数量,i为大于1的正整数。
在上述实施例中,在对该至少一个已训练任务的第二任务参数进行加权求和时,将各个第二任务参数对应的相似度作为其权重系数,如此,在加权求和的过程中,能够提高相似度较高的第二任务参数对加权求和的影响,而减弱相似度较低的第二任务参数对加权求和的影响,极大地提升了确定目标任务参数的准确性。
在步骤S404中,电子设备在该初始模型中添加该目标任务参数。
在一种可能的实现方式中,该目标任务参数包括多个任务子参数,该多个任务子参数与该初始模型包括的多个网络层一一对应。相应地,在初始模型中添加该目标任务参数的过程包括:对于任一个任务子参数,在该任务子参数对应的网络层中,添加该任务子参数。在该实施例中,通过建立任务子参数与网络层之间的对应关系,使所确定的目标任务参数能够更加贴合初始模型,进而在初始模型的各个网络层中添加对应的目标任务参数,以便后续基于该目标任务参数来进行模型的任务训练,提升了模型的任务训练的准确性,也即提升了模型训练的准确性。
应理解地,由于步骤S401中待训练任务的第一任务参数的多个任务子参数与该初始模型包括的多个网络层一一对应,因此,针对基于该第一任务参数所确定的至少一个已训练任务的第一任务参数,该已训练任务的第一任务参数的多个任务子参数也是与该多个网络层一一对应的;相应地,该已训练任务的第二任务参数的多个任务子参数也是与该多个网络层一一对应的;进一步地,针对基于该至少一个已训练任务的第二任务参数所确定的目标任务参数,该目标任务参数的多个任务子参数也是与该多个网络层一一对应的。
在本公开实施例中,基于任务参数与网络层之间不同的对应关系,能够设置不同类型的任务参数,而不同类型的任务参数所对应的迁移方式也不同。在一种可能的实现方式中,电子设备针对不同类型的任务参数,分别设置不同类型的任务存储库,也即是在获取到多个已训练任务之后,对于任一个已训练任务,确定与该已训练任务的任务参数的类型对应的任务存储库,在该类型对应的任务存储库中存储该已训练任务的任务参数(第一任务参数和第二任务参数)。其中,类型是指任务参数与网络层之间的对应关系的类型。如此,通过设置不同类型的任务存储库,在基于初始模型的待训练任务的第一任务参数进行数据查询时,通过确定与该第一任务参数的类型对应的任务存储库,进而在所确定的任务数据库中进行查询,能够更加快速地确定出与待训练任务特征匹配的至少一个已训练任务,提升了数据查询的效率。
在步骤S405中,电子设备采用图像样本数据对添加该目标任务参数后的该初始模型进行迭代训练,以获得图像任务模型。
图像样本数据是指初始模型的训练数据。在一种可能的实现方式中,上述迭代训练的过程包括:在任一次迭代训练的过程中,将该图像样本数据输入上一次迭代训练后得到的模型中,以获得本次迭代训练的输出结果;基于该输出结果与该图像样本数据的样本标签,调整该目标任务参数,基于调整后的该目标任务参数,执行下一次迭代训练。在该实施例中,在任一次迭代训练的过程中,利用本次迭代训练的输出结果与该图像样本数据的样本标签,来调整目标任务参数,以训练该目标任务参数的学习能力,从而实现模型的任务训练。
其中,该样本标签用于指示该图像样本数据的图像信息。以图像分类任务为例,样本标签可提供为样本分类标签,用于指示该图像样本数据的类别。
在一种可能的实现方式中,基于该输出结果与该图像样本数据的样本标签,调整该目标任务参数的过程为:基于该输出结果与该图像样本数据的样本标签,确定本次迭代训练的模型损失值,根据该模型损失值,调整该目标任务参数。其中,模型损失值用于表示模型的输出结果与样本标签之间的差异。
在一种可能的实现方式中,该模型损失值为交叉熵损失值(Cross EntropyLoss),相应地,电子设备根据该输出结果与该图像样本数据的样本标签,确定该输出结果与该样本标签之间的交叉熵损失值,以获得本次迭代训练过程的模型损失值,进而根据该模型损失值,执行上述调整目标任务参数的过程。
在另一种可能的实现方式中,该模型损失值为均方误差损失值(Mean SquareError,MSE),相应地,电子设备根据该输出结果与该图像样本数据的样本标签,确定该输出结果与该样本标签之间的均方误差损失值,以获得本次迭代训练过程的模型损失值,进而根据该模型损失值,执行上述调整目标任务参数的过程。
在上述实施例中,通过确定模型损失值,由于该模型损失值用于表示模型的输出结果与样本标签之间的差异,因此根据该模型损失值来进行目标任务参数的调整,能够提升模型的学习能力,从而训练得到学习能力更好的模型。当然,在另一种可能的实现方式中,电子设备还能够获取其他类型的模型损失值,以根据该模型损失值,执行上述调整目标任务参数的过程。本公开实施例对此不作限定。
在一种可能的实现方式中,在调整该目标任务参数之后,还判断模型训练是否达到目标条件,进而在模型训练未达到目标条件的情况下,基于调整后的该目标任务参数,执行下一次迭代训练,直至该模型训练达到该目标条件。
在一种可能的实现方式中,该目标条件满足下述条件中的至少一项:模型训练的迭代次数达到目标次数;或者,模型损失值小于或等于目标阈值。其中,目标次数为预先设定的训练迭代次数,如迭代次数达到100。本公开实施例对目标次数的设置不作限定。目标阈值为预先设定的固定阈值,如模型损失值小于0.0001。本公开实施例对目标阈值的设置不作限定。
需要说明的是,在上述模型训练的过程中,电子设备对初始模型中添加的目标任务参数进行调整,而该初始模型的原始模型参数不变。具体地,上述迭代训练的过程包括:在第一次迭代过程中,将图像样本数据输入初始模型,得到第一次迭代过程的输出结果;基于第一次迭代过程的输出结果与图像样本数据的样本标签,确定模型损失值,基于模型损失值,对初始模型中的目标任务参数进行调整,该初始模型的原始模型参数保持不变;将第一次迭代调整后的目标任务参数作为第二次迭代的目标任务参数,再进行第二次迭代;重复多次上述迭代过程,在第N次过程中,以第N-1次迭代调整后的目标任务参数作为新的目标任务参数,进行模型训练,直到训练满足目标条件,则将满足目标条件的迭代过程所对应的模型获取为图像任务模型。其中,N为正整数,且N大于1。
这样,在模型训练的过程中,固定该初始模型的原始模型参数,使得初始模型中与图像任务相关的参数被训练,而原始模型参数保持不变,能够有效缓解模型过拟合的问题。
在一种可能的实现方式中,在模型训练结束时,电子设备还获取该待训练任务的第一任务参数和第二任务参数,在该任务数据库中,将该待训练任务的第一任务参数和第二任务参数对应存储。如此,通过在任务数据库中,实时存储已训练得到的新任务的第一任务参数和第二任务参数,能够实现对任务数据库的实时更新,达到扩充任务数据库的效果。
本公开实施例中,该图像任务模型是采用图像样本数据对添加目标任务参数后的初始模型进行训练得到的,该目标任务参数基于与该初始模型的待训练任务特征匹配的至少一个已训练任务的第二任务参数确定,该至少一个已训练任务基于该待训练任务的第一任务参数确定。如此,提供了一种基于任务相关性查询的迁移学习方法,由于在不同任务之间进行知识迁移存在很大的差异,而这种差异与不同任务之间的差异相关。因此,通过构建任务数据库来存储多个已训练任务的相关参数,进而在不同任务间进行迁移学习时,能够快速高效地确定出匹配任务,进而利用匹配任务学习到的任务参数来初始化待训练任务的任务参数,能够大幅度提升任务之间的知识迁移能力。
上述步骤S401至步骤S405,对图像任务模型的训练过程进行了说明,进而利用上述图像任务模型的训练方法所训练得到的图像任务模型,来进行图像识别,能够提升图像识别的准确性。下面基于步骤S406与S407,对图像识别的过程进行说明。
在步骤S406中,电子设备获取待识别图像。
在一种可能的实现方式中,电子设备响应于对待识别图像的上传操作,获取该待识别图像。示例地,以电子设备为终端为例,若用户想要对图像进行图像识别,则可以在终端上进行操作,将待识别图像上传至终端,则终端响应于对待识别图像的上传操作,获取该待识别图像,以便基于该待识别图像执行后续图像识别的过程。
在另一种可能的实现方式中,电子设备响应于接收到对待识别图像的处理请求,则电子设备获取该处理请求携带的待识别图像,该处理请求用于请求对待识别图像进行图像识别。示例地,以电子设备为服务器为例,该处理请求可以是终端向服务器所发送的处理请求。相应地,在一种可能的实现方式中,终端向服务器发送携带该待识别图像的处理请求,服务器接收该处理请求,获取该处理请求携带的待识别图像,以便基于该待识别图像执行后续图像识别的过程。
需要说明的是,上述两种获取待识别图像的实现方式仅作为一种示例,来对电子设备获取待识别图像的过程进行说明,而在另一些实施例中,电子设备还能够采用其他方式,来获取该待识别图像,例如,电子设备从该电子设备所关联的图像信息库中获取该待识别图像,该图像信息库中用于存储至少一个待识别图像。本公开实施例对如何获取待识别图像的过程不作限定。
在步骤S407中,电子设备将该待识别图像输入该图像任务模型,通过该图像任务模型提取该待识别图像的图像特征,基于该图像特征对该待识别图像进行图像处理,以获得图像识别结果。
其中,该图像任务模型包括特征提取层,该特征提取层提供有提取图像特征的功能。例如,该特征提取层可提供为卷积层。在一种可能的实现方式中,通过该图像任务模型的特征提取层对该待识别图像进行特征提取,能够得到预定维数的图像特征,以便后续基于所提取的图像特征来进行图像处理的过程。
在一种可能的实现方式中,该图像处理包括分类处理、分割处理或预测处理中的任一项。如此,通过提供多种类型的处理方式,能够实现多种类型的图像识别,拓展了基于深度学习来进行图像识别的领域范围,也即丰富了模型的使用场景。
在一种可能的实现方式中,以分类处理为例,电子设备将该待识别图像输入图像任务模型,通过该图像任务模型提取该待识别图像的图像特征,基于该图像特征对该待识别图像进行图像分类处理,以获得图像分类结果,该图像分类结果用于指示该图像的类别。在又一种可能的实现方式中,以分割处理为例,电子设备将该待识别图像输入图像任务模型,通过该图像任务模型提取该待识别图像的图像特征,基于该图像特征对该待识别图像进行图像分割处理,以获得图像分割结果,该图像分割结果用于指示该图像在像素维度上的类别。在另一种可能的实现方式中,以预测处理为例,电子设备将该待识别图像输入图像任务模型,通过该图像任务模型提取该待识别图像的图像特征,基于该图像特征对该待识别图像进行图像预测处理,以获得图像预测结果,该图像预测结果为预测图像。
本公开实施例提供的技术方案,针对初始模型的待训练任务,设置有第一任务参数,由于该第一任务参数能够表征任务特征,故利用该第一任务参数能够确定出与待训练任务特征匹配的已训练任务,进而将基于该已训练任务的第二任务参数所确定的目标任务参数添加至初始模型中,以便后续基于该目标任务参数来执行模型训练的过程,如此,在初始模型的任务训练过程中,参考了匹配任务的第二任务参数,由于所参考的第二任务参数是经模型训练学习到的任务参数,如此,增加了模型训练所参考的信息量,提高了模型训练的准确性。
图6是根据本公开实施例示出的一种图像任务模型的训练装置的结构框图,参见图6,该装置包括任务确定模块601、参数确定模块602和训练模块603。其中:
任务确定模块601,用于基于初始模型的待训练任务的第一任务参数,确定与该待训练任务特征匹配的至少一个已训练任务,该第一任务参数为未经模型训练的用于表征任务特征的任务参数;
参数确定模块602,用于基于该至少一个已训练任务的第二任务参数,确定目标任务参数,该第二任务参数为经模型训练得到的用于表征任务特征的任务参数;
训练模块603,用于在该初始模型中添加该目标任务参数,采用图像样本数据对添加该目标任务参数后的该初始模型进行迭代训练,以获得该图像任务模型。
本公开实施例提供的技术方案,针对初始模型的待训练任务,设置有第一任务参数,由于该第一任务参数能够表征任务特征,故利用该第一任务参数能够确定出与待训练任务特征匹配的已训练任务,进而将基于该已训练任务的第二任务参数所确定的目标任务参数添加至初始模型中,以便后续基于该目标任务参数来执行模型训练的过程,如此,在初始模型的任务训练过程中,参考了匹配任务的第二任务参数,由于所参考的第二任务参数是经模型训练学习到的任务参数,如此,增加了模型训练所参考的信息量,提高了模型训练的准确性。
在一种可能的实现方式中,该目标任务参数包括多个任务子参数,该多个任务子参数与该初始模型包括的多个网络层一一对应;
该训练模块603包括添加子模块,用于:
对于任一个任务子参数,在该任务子参数对应的网络层中,添加该任务子参数。
在一种可能的实现方式中,该训练模块603包括训练子模块,用于:
在任一次迭代训练的过程中,将该图像样本数据输入上一次迭代训练后得到的模型中,以获得本次迭代训练的输出结果;
基于该输出结果与该图像样本数据的样本标签,调整该目标任务参数,基于调整后的该目标任务参数,执行下一次迭代训练,该样本标签用于指示该图像样本数据的图像信息。
在一种可能的实现方式中,该至少一个已训练任务存储于任务数据库中;该任务数据库用于存储多个已训练任务的第一任务参数和第二任务参数;
该任务确定模块601,包括:
确定子模块,用于在该任务数据库中,基于该待训练任务的第一任务参数以及该多个已训练任务的第一任务参数,确定该多个已训练任务分别与该待训练任务之间的相似度;
选取子模块,用于在该多个已训练任务中,选取相似度达到相似度条件的该至少一个已训练任务。
在一种可能的实现方式中,该参数确定模块602,用于:
基于该至少一个已训练任务的第二任务参数以及该至少一个已训练任务对应的相似度,确定该目标任务参数。
在一种可能的实现方式中,该参数确定模块602,用于:
以该至少一个已训练任务对应的相似度为该至少一个已训练任务的第二任务参数的权重系数,对该至少一个已训练任务的第二任务参数进行加权求和,得到该目标任务参数。
在一种可能的实现方式中,还包括:
第一获取模块,用于获取该待训练任务的第一任务参数和第二任务参数;
存储模块,用于在该任务数据库中,将该待训练任务的第一任务参数和第二任务参数对应存储。
在一种可能的实现方式中,该任务数据库提供为键值对查询库。
在一种可能的实现方式中,还包括:
第二获取模块,用于获取待识别图像;
处理模块,用于将该待识别图像输入该图像任务模型,通过该图像任务模型提取该待识别图像的图像特征,基于该图像特征对该待识别图像进行图像处理,以获得图像识别结果,该图像处理包括分类处理、分割处理或预测处理中的任一项。
图7是根据本公开实施例示出的一种图像识别装置的结构框图,参见图7,该装置包括获取模块701和处理模块702。其中:
获取模块701,用于获取待识别图像;
处理模块702,用于将该待识别图像输入图像任务模型,通过该图像任务模型提取该待识别图像的图像特征,基于该图像特征对该待识别图像进行图像处理,以获得图像识别结果,该图像处理包括分类处理、分割处理或预测处理中的任一项;
其中,该图像任务模型是采用图像样本数据对添加目标任务参数后的初始模型进行训练得到的;该目标任务参数基于与该初始模型的待训练任务特征匹配的至少一个已训练任务的第二任务参数确定,该至少一个已训练任务基于该待训练任务的第一任务参数确定,该第一任务参数为未经模型训练的用于表征任务特征的任务参数,该第二任务参数为经模型训练得到的用于表征任务特征的任务参数。
本公开实施例提供的技术方案,针对初始模型的待训练任务,设置有第一任务参数,由于该第一任务参数能够表征任务特征,故利用该第一任务参数能够确定出与待训练任务特征匹配的已训练任务,进而将基于该已训练任务的第二任务参数所确定的目标任务参数添加至初始模型中,以便后续基于该目标任务参数来执行模型训练的过程,如此,在初始模型的任务训练过程中,参考了匹配任务的第二任务参数,由于所参考的第二任务参数是经模型训练学习到的任务参数,如此,增加了模型训练所参考的信息量,提高了模型训练的准确性。
在一种可能的实现方式中,还包括:
任务确定模块,用于基于该待训练任务的第一任务参数,确定与该待训练任务特征匹配的至少一个已训练任务;
参数确定模块,用于基于该至少一个已训练任务的第二任务参数,确定该目标任务参数;
训练模块,用于在该初始模型中添加该目标任务参数,采用该图像样本数据对添加该目标任务参数后的该初始模型进行迭代训练,以获得该图像任务模型。
根据本公开的实施例,本公开还提供了一种电子设备,包括至少一个处理器;以及与该至少一个处理器通信连接的存储器;其中,该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开所提供的图像任务模型的训练方法或图像识别方法。
根据本公开的实施例,本公开还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使该计算机执行本公开所提供的图像任务模型的训练方法或图像识别方法。
根据本公开的实施例,本公开还提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现本公开所提供的图像任务模型的训练方法或图像识别方法。
在一种可能的实现方式中,电子设备可提供为上述图1中所示出的终端或服务器。图8是用来实现本公开实施例的图像任务模型的训练方法或图像识别方法的电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(Read OnlyMemory,ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RandomAccess Memory,RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(In put/Out put,I/O)接口805也连接至总线804。
设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(Central Processing Unit,CPU)、图形处理单元(Graphics Processing Unit,GPU)、各种专用的人工智能(ArtificialIntelligence,AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(Digital Signal Processing,DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如图像任务模型的训练方法或图像识别方法。例如,在一些实施例中,图像任务模型的训练方法或图像识别方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时,可以执行上文描述的图像任务模型的训练方法或图像识别方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图像任务模型的训练方法或图像识别方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(Field Programmable Gate Array,FPGA)、专用集成电路(Application Specific Integrated Circuit,ASIC)、专用标准产品(ApplicationSpecific Standard Parts,ASSP)、芯片上***的***(System On Chip,SOC)、复杂可编程逻辑设备(Complex Programmable Logic Device,CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器、只读存储器、可擦除可编程只读存储器(ErasableProgrammable Read Only Memory,EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置,例如,阴极射线管(Cathode Ray Tube,CRT)或者液晶显示器(Liquid Crystal Display,LCD)监视器;以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式***的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (20)

1.一种图像任务模型的训练方法,包括:
基于初始模型的待训练任务的第一任务参数,确定与所述待训练任务特征匹配的至少一个已训练任务,所述第一任务参数为未经模型训练的用于表征任务特征的任务参数;
基于所述至少一个已训练任务的第二任务参数,确定目标任务参数,所述第二任务参数为经模型训练得到的用于表征任务特征的任务参数;
在所述初始模型中添加所述目标任务参数,采用图像样本数据对添加所述目标任务参数后的所述初始模型进行迭代训练,以获得所述图像任务模型。
2.根据权利要求1所述的方法,其中,所述目标任务参数包括多个任务子参数,所述多个任务子参数与所述初始模型包括的多个网络层一一对应;
所述在所述初始模型中添加所述目标任务参数,包括:
对于任一个任务子参数,在所述任务子参数对应的网络层中,添加所述任务子参数。
3.根据权利要求1所述的方法,其中,所述采用图像样本数据对添加所述目标任务参数后的所述初始模型进行迭代训练,包括:
在任一次迭代训练的过程中,将所述图像样本数据输入上一次迭代训练后得到的模型中,以获得本次迭代训练的输出结果;
基于所述输出结果与所述图像样本数据的样本标签,调整所述目标任务参数,基于调整后的所述目标任务参数,执行下一次迭代训练,所述样本标签用于指示所述图像样本数据的图像信息。
4.根据权利要求1所述的方法,其中,所述至少一个已训练任务存储于任务数据库中;所述任务数据库用于存储多个已训练任务的第一任务参数和第二任务参数;
所述基于初始模型的待训练任务的第一任务参数,确定与所述待训练任务特征匹配的至少一个已训练任务,包括:
在所述任务数据库中,基于所述待训练任务的第一任务参数以及所述多个已训练任务的第一任务参数,确定所述多个已训练任务分别与所述待训练任务之间的相似度;
在所述多个已训练任务中,选取相似度达到相似度条件的所述至少一个已训练任务。
5.根据权利要求4所述的方法,其中,所述基于所述至少一个已训练任务的第二任务参数,确定目标任务参数,包括:
基于所述至少一个已训练任务的第二任务参数以及所述至少一个已训练任务对应的相似度,确定所述目标任务参数。
6.根据权利要求5所述的方法,其中,所述基于所述至少一个已训练任务的第二任务参数以及所述至少一个已训练任务对应的相似度,确定所述目标任务参数,包括:
以所述至少一个已训练任务对应的相似度为所述至少一个已训练任务的第二任务参数的权重系数,对所述至少一个已训练任务的第二任务参数进行加权求和,得到所述目标任务参数。
7.根据权利要求4所述的方法,还包括:
获取所述待训练任务的第一任务参数和第二任务参数;
在所述任务数据库中,将所述待训练任务的第一任务参数和第二任务参数对应存储。
8.根据权利要求4-7中任一项所述的方法,其中,所述任务数据库提供为键值对查询库。
9.根据权利要求1所述的方法,还包括:
获取待识别图像;
将所述待识别图像输入所述图像任务模型,通过所述图像任务模型提取所述待识别图像的图像特征,基于所述图像特征对所述待识别图像进行图像处理,以获得图像识别结果,所述图像处理包括分类处理、分割处理或预测处理中的任一项。
10.一种图像识别方法,包括:
获取待识别图像;
将所述待识别图像输入图像任务模型,通过所述图像任务模型提取所述待识别图像的图像特征,基于所述图像特征对所述待识别图像进行图像处理,以获得图像识别结果,所述图像处理包括分类处理、分割处理或预测处理中的任一项;
其中,所述图像任务模型是采用图像样本数据对添加目标任务参数后的初始模型进行训练得到的;所述目标任务参数基于与所述初始模型的待训练任务特征匹配的至少一个已训练任务的第二任务参数确定,所述至少一个已训练任务基于所述待训练任务的第一任务参数确定,所述第一任务参数为未经模型训练的用于表征任务特征的任务参数,所述第二任务参数为经模型训练得到的用于表征任务特征的任务参数。
11.根据权利要求10所述的方法,还包括:
基于所述待训练任务的第一任务参数,确定与所述待训练任务特征匹配的至少一个已训练任务;
基于所述至少一个已训练任务的第二任务参数,确定所述目标任务参数;
在所述初始模型中添加所述目标任务参数,采用所述图像样本数据对添加所述目标任务参数后的所述初始模型进行迭代训练,以获得所述图像任务模型。
12.一种图像任务模型的训练装置,包括:
任务确定模块,用于基于初始模型的待训练任务的第一任务参数,确定与所述待训练任务特征匹配的至少一个已训练任务,所述第一任务参数为未经模型训练的用于表征任务特征的任务参数;
参数确定模块,用于基于所述至少一个已训练任务的第二任务参数,确定目标任务参数,所述第二任务参数为经模型训练得到的用于表征任务特征的任务参数;
训练模块,用于在所述初始模型中添加所述目标任务参数,采用图像样本数据对添加所述目标任务参数后的所述初始模型进行迭代训练,以获得所述图像任务模型。
13.根据权利要求12所述的装置,其中,所述目标任务参数包括多个任务子参数,所述多个任务子参数与所述初始模型包括的多个网络层一一对应;
所述训练模块包括添加子模块,用于:
对于任一个任务子参数,在所述任务子参数对应的网络层中,添加所述任务子参数。
14.根据权利要求12所述的装置,其中,所述训练模块包括训练子模块,用于:
在任一次迭代训练的过程中,将所述图像样本数据输入上一次迭代训练后得到的模型中,以获得本次迭代训练的输出结果;
基于所述输出结果与所述图像样本数据的样本标签,调整所述目标任务参数,基于调整后的所述目标任务参数,执行下一次迭代训练,所述样本标签用于指示所述图像样本数据的图像信息。
15.根据权利要求12所述的装置,其中,所述至少一个已训练任务存储于任务数据库中;所述任务数据库用于存储多个已训练任务的第一任务参数和第二任务参数;
所述任务确定模块,包括:
确定子模块,用于在所述任务数据库中,基于所述待训练任务的第一任务参数以及所述多个已训练任务的第一任务参数,确定所述多个已训练任务分别与所述待训练任务之间的相似度;
选取子模块,用于在所述多个已训练任务中,选取相似度达到相似度条件的所述至少一个已训练任务。
16.根据权利要求15所述的装置,其中,所述参数确定模块,用于:
基于所述至少一个已训练任务的第二任务参数以及所述至少一个已训练任务对应的相似度,确定所述目标任务参数。
17.一种图像识别装置,包括:
获取模块,用于获取待识别图像;
处理模块,用于将所述待识别图像输入图像任务模型,通过所述图像任务模型提取所述待识别图像的图像特征,基于所述图像特征对所述待识别图像进行图像处理,以获得图像识别结果,所述图像处理包括分类处理、分割处理或预测处理中的任一项;
其中,所述图像任务模型是采用图像样本数据对添加目标任务参数后的初始模型进行训练得到的;所述目标任务参数基于与所述初始模型的待训练任务特征匹配的至少一个已训练任务的第二任务参数确定,所述至少一个已训练任务基于所述待训练任务的第一任务参数确定,所述第一任务参数为未经模型训练的用于表征任务特征的任务参数,所述第二任务参数为经模型训练得到的用于表征任务特征的任务参数。
18.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9或10-11中任一项所述的方法。
19.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使电子设备执行根据权利要求1-9或10-11中任一项所述的方法。
20.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-9或10-11中任一项所述的方法。
CN202211293168.7A 2022-10-21 2022-10-21 图像任务模型的训练方法、图像识别方法以及相关装置 Pending CN115496970A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211293168.7A CN115496970A (zh) 2022-10-21 2022-10-21 图像任务模型的训练方法、图像识别方法以及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211293168.7A CN115496970A (zh) 2022-10-21 2022-10-21 图像任务模型的训练方法、图像识别方法以及相关装置

Publications (1)

Publication Number Publication Date
CN115496970A true CN115496970A (zh) 2022-12-20

Family

ID=84474179

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211293168.7A Pending CN115496970A (zh) 2022-10-21 2022-10-21 图像任务模型的训练方法、图像识别方法以及相关装置

Country Status (1)

Country Link
CN (1) CN115496970A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116363452A (zh) * 2023-03-07 2023-06-30 阿里巴巴(中国)有限公司 任务模型训练方法以及装置
CN116432770A (zh) * 2023-02-28 2023-07-14 阿里巴巴(中国)有限公司 模型训练、推理、构建方法、装置、设备及存储介质
CN116910566A (zh) * 2023-09-12 2023-10-20 深圳须弥云图空间科技有限公司 一种目标识别模型训练方法和装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116432770A (zh) * 2023-02-28 2023-07-14 阿里巴巴(中国)有限公司 模型训练、推理、构建方法、装置、设备及存储介质
CN116432770B (zh) * 2023-02-28 2023-10-20 阿里巴巴(中国)有限公司 模型训练、推理、构建方法、装置、设备及存储介质
CN116363452A (zh) * 2023-03-07 2023-06-30 阿里巴巴(中国)有限公司 任务模型训练方法以及装置
CN116363452B (zh) * 2023-03-07 2024-01-09 阿里巴巴(中国)有限公司 任务模型训练方法以及装置
CN116910566A (zh) * 2023-09-12 2023-10-20 深圳须弥云图空间科技有限公司 一种目标识别模型训练方法和装置
CN116910566B (zh) * 2023-09-12 2024-01-05 深圳须弥云图空间科技有限公司 一种目标识别模型训练方法和装置

Similar Documents

Publication Publication Date Title
CN115496970A (zh) 图像任务模型的训练方法、图像识别方法以及相关装置
CN108520470B (zh) 用于生成用户属性信息的方法和装置
CN113379627A (zh) 图像增强模型的训练方法和对图像进行增强的方法
CN114494784A (zh) 深度学习模型的训练方法、图像处理方法和对象识别方法
CN112231592A (zh) 基于图的网络社团发现方法、装置、设备以及存储介质
CN107291774B (zh) 错误样本识别方法和装置
CN111368551A (zh) 一种确定事件主体的方法和装置
CN113627536A (zh) 模型训练、视频分类方法,装置,设备以及存储介质
CN113627361B (zh) 人脸识别模型的训练方法、装置及计算机程序产品
CN113947701A (zh) 训练方法、对象识别方法、装置、电子设备以及存储介质
CN114037059A (zh) 预训练模型、模型的生成方法、数据处理方法及装置
CN113792876A (zh) 骨干网络的生成方法、装置、设备以及存储介质
JP7504192B2 (ja) 画像を検索するための方法及び装置
CN111582284B (zh) 用于图像识别的隐私保护方法、装置和电子设备
CN113033373A (zh) 用于训练人脸识别模型及识别人脸的方法及相关装置
CN112241761A (zh) 模型训练方法、装置和电子设备
CN112784967B (zh) 信息处理方法、装置以及电子设备
CN114707638A (zh) 模型训练、对象识别方法及装置、设备、介质和产品
CN114021642A (zh) 数据处理方法、装置、电子设备和存储介质
CN114186039A (zh) 一种视觉问答方法、装置及电子设备
CN113989152A (zh) 图像增强方法、装置、设备以及存储介质
CN113361621A (zh) 用于训练模型的方法和装置
US20240029416A1 (en) Method, device, and computer program product for image processing
CN114821801B (zh) 动作识别方法、模型训练方法、装置、电子设备和存储介质
CN114550236B (zh) 图像识别及其模型的训练方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination