CN113515999A - 图像处理模型的训练方法、装置、设备及可读存储介质 - Google Patents
图像处理模型的训练方法、装置、设备及可读存储介质 Download PDFInfo
- Publication number
- CN113515999A CN113515999A CN202110040398.1A CN202110040398A CN113515999A CN 113515999 A CN113515999 A CN 113515999A CN 202110040398 A CN202110040398 A CN 202110040398A CN 113515999 A CN113515999 A CN 113515999A
- Authority
- CN
- China
- Prior art keywords
- sample image
- model
- incidence relation
- image
- relation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 238000012549 training Methods 0.000 title claims abstract description 73
- 238000012545 processing Methods 0.000 title claims abstract description 60
- 238000004458 analytical method Methods 0.000 claims abstract description 41
- 230000004044 response Effects 0.000 claims abstract description 20
- 238000000605 extraction Methods 0.000 claims description 16
- 238000012098 association analyses Methods 0.000 claims description 9
- 238000010219 correlation analysis Methods 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 abstract description 7
- 238000005516 engineering process Methods 0.000 description 20
- 241000282414 Homo sapiens Species 0.000 description 19
- 230000006870 function Effects 0.000 description 14
- 230000008569 process Effects 0.000 description 11
- 238000013473 artificial intelligence Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000001815 facial effect Effects 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000000887 face Anatomy 0.000 description 2
- 238000013140 knowledge distillation Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种图像处理模型的训练方法、装置、设备及可读存储介质,涉及机器学习领域。该方法包括:获取第一样本图像和第二样本图像;通过第一模型分析得到第一关联关系;通过第二模型分析得到第二关联关系;响应于第一关联关系和第二关联关系符合识别差异条件,基于第一关联关系和第二关联关系对第二模型进行训练。通过第一模型分析得到的第一关联关系,和第二模型分析得到的第二关联关系确定是否符合识别差异条件,当符合识别差异条件时,表示第一关联关系表达的识别结果与第二关联关系表达的识别结果不一致,从而基于不一致的识别结果对第二模型进行训练,提高了图像处理模型的训练准确率和训练效率。
Description
技术领域
本申请实施例涉及机器学习领域,特别涉及一种图像处理模型的训练方法、装置、设备及可读存储介质。
背景技术
随着刷脸支付技术的发展,人脸识别的技术侧部署逐渐向移动端设备转移,由于移动端设备的能力限制,在移动端设备中部署的模型需要满足性能好、参数量小、计算复杂度低的要求,即移动端设备中部署的通常为轻量级模型。
相关技术中,通过训练成熟的重量级模型以知识蒸馏的方式对轻量级模型进行训练,通常通过基于样本约束的知识蒸馏方法对轻量级模型进行训练,即对重量级模型和轻量级模型输出的特征增加余弦相似度约束,从而对齐重量级模型和轻量级模型的特征空间,实现对图像处理模型的训练。
然而,上述方式中,当重量级模型与轻量级模型之间的参数量差异较大时,则会导致训练效果较差,对轻量级模型的性能提升较微弱的问题。
发明内容
本申请实施例提供了一种图像处理模型的训练方法、装置、设备及可读存储介质,能够提高图像处理模型的训练准确率和效率。所述技术方案如下:
一方面,提供了一种图像处理模型的训练方法,所述方法包括:
获取第一样本图像和第二样本图像;
通过第一模型对所述第一样本图像和所述第二样本图像进行关联关系分析,得到所述第一样本图像与所述第二样本图像的第一关联关系,所述第一模型为经过训练的用于对图像进行处理的模型;
通过第二模型对所述第一样本图像和所述第二样本图像进行关联关系分析,得到所述第一样本图像与所述第二样本图像的第二关联关系,所述第二模型相对所述第一模型为轻量级模型,所述第一模型相对所述第二模型为重量级模型;
响应于所述第一关联关系和所述第二关联关系符合识别差异条件,基于所述第一关联关系和所述第二关联关系对所述第二模型进行训练,所述识别差异条件用于指示所述第一关联关系和所述第二关联关系之间的差异要求。
另一方面,提供了一种图像处理模型的训练装置,所述装置包括:
获取模块,用于获取第一样本图像和第二样本图像;
分析模块,用于通过第一模型对所述第一样本图像和所述第二样本图像进行关联关系分析,得到所述第一样本图像与所述第二样本图像的第一关联关系,所述第一模型为经过训练的用于对图像进行处理的模型;
所述分析模块,还用于通过第二模型对所述第一样本图像和所述第二样本图像进行关联关系分析,得到所述第一样本图像与所述第二样本图像的第二关联关系,所述第二模型相对所述第一模型为轻量级模型,所述第一模型相对所述第二模型为重量级模型;
训练模块,用于响应于所述第一关联关系和所述第二关联关系符合识别差异条件,基于所述第一关联关系和所述第二关联关系对所述第二模型进行训练,所述识别差异条件用于指示所述第一关联关系和所述第二关联关系之间的差异要求。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一段程序,所述至少一段程序由所述处理器加载并执行以实现如上述本申请实施例中任一所述的图像处理模型的训练方法。
另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述本申请实施例中任一所述的图像处理模型的训练方法。
另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中任一所述的图像处理模型的训练方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
通过第一模型(重量级模型)和第二(轻量级模型)模型分别对第一样本图像和第二样本图像进行关联关系分析,从而基于重量级模型分析得到的第一关联关系,和轻量级模型分析得到的第二关联关系确定是否符合识别差异条件,当符合识别差异条件时,表示第一关联关系表达的识别结果与第二关联关系表达的识别结果不一致,从而基于不一致的识别结果对轻量级模型进行训练,提高了图像处理模型的训练准确率和训练效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个示例性实施例提供的实施环境的示意图;
图2是本申请一个示例性实施例提供的图像处理模型的训练方法的流程图;
图3是本申请另一个示例性实施例提供的图像处理模型的训练方法的流程图;
图4是基于图3示出的实施例提供的轻量级模型训练***的结构示意图;
图5是本申请另一个示例性实施例提供的图像处理模型的训练方法的流程图;
图6是本申请一个示例性实施例提供的轻量级模型在移动端设备内应用的流程示意图;
图7是本申请一个示例性实施例提供的图像处理模型的训练装置的结构框图;
图8是本申请另一个示例性实施例提供的图像处理模型的训练装置的结构框图;
图9是本申请一个示例性实施例提供的计算机设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
首先,针对本申请实施例中涉及的名词进行简单介绍:
人工智能(Artificial Intelligence,AI):是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例中,主要涉及计算机视觉技术,针对多媒体内容(如:图像内容)进行识别,示意性的,应用于人脸识别场景中,则设置有标注有身份信息的人脸库,当需要对目标人脸图像进行识别时,将目标人脸图像与人脸库中的人脸图像进行匹配,从而确定该目标人脸图像在人脸库中对应的人脸图像以及对饮的身份信息。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
计算机视觉技术(Computer Vision,CV):计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能***。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
重量级模型、轻量级模型:重量级模型和轻量级模型是一组概念相对的模型类型,其中,重量级模型用于指示一些性能好、参数量较大、计算复杂度较高的模型,通常,重量级模型部署在计算能力较高的服务器后端设备中,服务器设备通常为位置固定,体积相对较大的设备,能够承载的电子元件数量多、体积大,故计算能力也相对较高;轻量级模型用于指示一些参数量较小、计算复杂度相对较低的模型,通常轻量级模型部署在计算能力相对较小的移动端设备中,移动设备通常为便携式设备,如:手机、平板电脑、可穿戴设备等,移动设备需要满足移动能力,故相对而言体积较小,便于携带,能够承载的电子元件数量和体积都有限,故计算能力相对较低。
本申请实施例中,重量级模型为经过训练后,识别效果收敛的模型,以人脸识别模型为例,重量级模型为经过训练后,人脸识别结果的准确率高于要求准确率的模型。在本申请实施例中,该重量级模型还可以简称为大模型,则对应的轻量级模型可简称为小模型。轻量级模型为待训练的模型,也即,该轻量级模型为尚未经过训练,或者当前正在训练过程中的模型。
以人脸识别场景为例进行说明,则重量级模型为部署在服务器侧的模型,当需要进行人脸识别时,由终端摄像头对人脸图像进行采集,并将人脸图像发送至服务器中,由服务器通过重量级模型对人脸图像进行人脸识别,从而得到与该人脸图像对应的身份信息,将身份信息反馈至终端进行显示。
而轻量级模型部署在移动终端中,当需要进行人脸识别时,通过移动终端的摄像头对人脸图像进行采集,并直接通过轻量级模型对人脸图像进行人脸识别,从而得到与该人脸图像对应的身份信息进行显示。
图1是本申请一个示例性实施例提供的实施环境的示意图,如图1所示,该实施环境中包括终端110和服务器120,其中,终端110和服务器120之间通过通信网络130连接。
在一些实施例中,如图1所示,终端110中部署有轻量级模型111,服务器120中部署有重量级模型121;或者,轻量级模型111和重量级模型121都部署在服务器120中,并当轻量级模型111在服务器120中训练完毕后转移至终端110中进行应用。
在一些实施例中,当轻量级模型111训练完毕后,即可实现脱离服务器120进行线下应用。
以终端110中部署轻量级模型111,服务器120中部署重量级模型121,并在该结构下对轻量级模型111进行训练为例,服务器120获取样本图像后,将样本图像输入至重量级模型121,输出得到第一识别结果,并通过通信网络130将样本图像发送至终端110中,由终端110将样本图像输入至轻量级模型111中,输出得到第二识别结果,从而终端110将第二识别结果发送至服务器120中,由服务器120基于第一识别结果和第二识别结果确定对轻量级模型111进行参数调整的调整方式,并将调整方式反馈至终端110。
上述实施例中,以轻量级模型111在终端110中完成训练为例进行说明,在一些实施例中,轻量级模型111在服务器120中完成训练,服务器120在获取样本图像后,分别输入轻量级模型111和重量级模型121,从而基于输出的识别结果对轻量级模型111进行参数调整,并在训练完毕后,将轻量级模型111发送至终端110中。
值得注意的是,本申请实施例提供的图像处理模型的训练方法,可以由终端实现,也可以由服务器实现,还可以由终端和服务器协同实现。
其中,终端包括智能手机、平板电脑、便携式膝上笔记本电脑、台式计算机、智能音箱、智能可穿戴设备、智能人脸识别设备等终端中的至少一种,服务器可以是物理服务器,也可以是提供云计算服务的云服务器,且服务器可以实现为一台服务器,也可以是多个服务器构成的服务器集群或分布式***。其中,当终端和服务器协同实现本申请实施例提供的方案时,终端和服务器可以通过有线或无线通信方式进行直接或间接连接,本申请实施例对此不加以限定。
结合上述说明,对本申请实施例的应用场景进行介绍。
上述重量级模型和轻量级模型皆为应用于人脸识别过程中的人脸识别模型,由于人脸识别过程中,是将目标人脸图像与人脸图像库中的人脸图像进行相似度分析,从而在对图像处理模型的训练过程中,将第一样本人脸图像和第二样本人脸图像分别输入至轻量级模型和重量级模型,通过重量级模型分析第一样本人脸图像和第二样本人脸图像中的第一人脸相似度;通过轻量级模型分析第一样本人脸图像和第二样本人脸图像的第二人脸相似度。当第一人脸相似度和第二人脸相似度符合识别差异条件时,则基于第一人脸相似度和第二人脸相似度对轻量级模型进行训练。
上述实施例中,以重量级模型和轻量级模型实现为人脸识别模型为例进行说明,在一些实施例中,重量级模型和轻量级模型还可以实现为指定物体识别模型、相似度分析模型等,本申请实施例对此不加以限定。
基于上述内容,对本申请实施例提供的图像处理模型的训练方法进行说明,图2是本申请一个示例性实施例提供的图像处理模型的训练方法的流程图,以该方法应用于服务器中为例进行说明,如图2所示,该方法包括:
步骤201,获取第一样本图像和第二样本图像。
在一些实施例中,第一样本图像和第二样本图像为预设数据集中的样本,预设数据集中包括一批平衡的样本,示意性的,预设数据集中每个身份信息包括固定数量的人脸图片。其中,每个身份信息对应的人脸图片数量相同或者不同。如:身份信息A在预设数据集中对应包括5个人脸图片;身份信息B在预设数据集中对应包括4个人脸图片;身份信息C在预设数据集中对应包括5个人脸图片。
其中,当第一样本图像和第二样本图像对应同一身份信息,则第一样本图像和第二样本图像构成一对正样本;反之,当第一样本图像和第二样本图像对应不同身份信息,则第一样本图像和第二样本图像构成一对反样本。
可选地,第一样本图像和第二样本图像为从预设数据集中随机抽取的两个样本图像;或者,第一样本图像和第二样本图像为依次从预设数据集中抽取的两个样本图像,如:根据预设数据集中样本图像的排列顺序,正序依次从预设数据集中抽取第一样本图像,并倒序依次从预设数据集中抽取第二样本图像。上述两种方式仅为示意性的举例,本申请实施例对第一样本图像和第二样本图像的抽取方式不加以限定。
在一些实施例中,预设数据集中的样本图像是从图像库中对符合人脸要求的图像进行选择得到的;或者,预设数据集中的样本图像是从图像库中对指定身份的人脸图像获取得到的;或者,预设数据集中的样本图像是通过重量级模型对图像库中的图像进行人脸识别后,针对同一身份的人脸图像选取要求数量内的图像后得到的。本申请实施例对预设数据集中样本图像的获取方式不加以限定。
步骤202,通过第一模型对第一样本图像和第二样本图像进行关联关系分析,得到第一样本图像与第二样本图像的第一关联关系。
其中,第一模型为经过训练的用于对图像进行处理的模型,如:第一模型为经过训练的用于对图像进行人脸识别的模型。第一关联关系用于指示重量级模型识别得到的第一样本图像和第二样本图像之间的关联情况。可选地,第一关联关系包括第一样本图像和第二样本图像之间的相似度、第一样本图像和第二样本图像之间的逻辑关联度(如:第一样本图像和第二样本图像为异质图中的节点,则第一关联关系表示两个节点之间的关联度)、第一样本图像和第二样本图像之间的图像光学字符识别(Optical Character Recognition,OCR)结果相似度等,本申请实施例对第一关联关系的情况不加以限定。本实施例中,以该第一关联关系表示第一样本图像和第二样本图像的相似度为例进行说明。
则通过第一模型对第一样本图像和第二样本图像进行关联关系分析时,将第一样本图像和第二样本图像输入第一模型,通过第一模型对第一样本图像和第二样本图像进行特征提取,得到第一样本图像对应的第一内容特征和第二样本图像对应的第二内容特征,从而基于第一内容特征和第二内容特征之间的相似度,确定第一样本图像与第二样本图像的第一关联关系。在一些实施例中,将识别得到的第一内容特征和第二内容特征之间的相似度,确定为该第一样本图像和第二样本图像之间的第一关联关系。
在一些实施例中,第一样本图像和第二样本图像实现为人脸图像,则第一关联关系的获取过程为,将第一人脸图像和第二人脸图像输入至第一模型中,由第一模型提取第一人脸图像的第一人脸特征,以及提取第二人脸图像的第二人脸特征,从而对第一人脸特征和第二人脸特征进行相似度分析,得到第一关联关系(即第一人脸图像和第二人脸图像之间的人脸相似度)。
在一些实施例中,第一关联关系为第一人脸特征和第二人脸特征之间的余弦相似度。示意性的,该余弦相似度的计算公式如下公式一所示。
公式一:Si,j=<f(xi),f(xj)>,i≠j
其中,xi表示第一人脸图像,xj表示第二人脸图像,f(xi)表示第一人脸特征,f(xj)表示第二人脸特征,Si,j表示第一人脸图像和第二人脸图像之间人脸特征的余弦相似度。
由于第一样本图像和第二样本图像为预设数据集中获取的样本图像,故第一样本图像和第二样本图像之间可以构成一对正样本,也可以构成一对负样本。当第一样本图像和第二样本图像之间构成正样本时,由于第一模型为预先训练好的模型,故第一模型对第一样本图像和第二样本图像的相似度识别结果大于(或者等于)概率阈值,表示第一样本图像和第二样本图像中的人脸图像对应同一身份;反之,当第一样本图像和第二样本图像之间构成负样本时,由于第一模型为预先训练好的模型,故第一模型对第一样本图像和第二样本图像的相似度识别结果小于(或者等于)概率阈值,表示第一样本图像和第二样本图像中的人脸图像对应不同身份。值得注意的是,第一模型存在一定的容错率,但相对未经训练的模型而言,容错率较低。
步骤203,通过第二模型对第一样本图像和第二样本图像进行关联关系分析,得到第一样本图像和第二样本图像的第二关联关系。
其中,第二模型为当前待训练的模型。其中,第二模型相对第一模型而言为轻量级模型,第一模型相对第二模型而言为重量级模型。
第二关联关系用于指示第二模型识别得到的第一样本图像和第二样本图像之间的关联情况。可选地,第二关联关系包括第一样本图像和第二样本图像之间的相似度、第一样本图像和第二样本图像之间的逻辑关联度、第一样本图像和第二样本图像之间的OCR结果相似度等,本申请实施例对第二关联关系的情况不加以限定。本实施例中,以该第二关联关系表示第二模型识别得到的第一样本图像和第二样本图像的相似度为例进行说明。
则通过第二模型对第一样本图像和第二样本图像进行关联关系分析时,将第一样本图像和第二样本图像输入第二模型,通过第二模型对第一样本图像和第二样本图像进行特征提取,得到第一样本图像对应的第三内容特征和第二样本图像对应的第四内容特征,从而基于第三内容特征和第四内容特征之间的相似度,确定第一样本图像与第二样本图像的第二关联关系。在一些实施例中,将识别得到的第三内容特征和第四内容特征之间的相似度,确定为该第一样本图像和第二样本图像之间的第二关联关系。
在一些实施例中,第一样本图像和第二样本图像实现为人脸图像,则第二关联关系的获取过程为,将第一人脸图像和第二人脸图像输入至第二模型中,由第二模型提取第一人脸图像的第三人脸特征,以及提取第二人脸图像的第四人脸特征,从而对第三人脸特征和第四人脸特征进行相似度分析,得到第二关联关系。
步骤204,响应于第一关联关系和第二关联关系符合识别差异条件,基于第一关联关系和第二关联关系对第二模型进行训练。
其中,识别差异条件用于指示第一关联关系和第二关联关系之间的差异要求。
在一些实施例中,第一关联关系用于表示第一模型识别得到的第一相似度,第二关联关系用于表示第二模型识别得到的第二相似度,而针对预先训练的第一模型而言,当识别得到第一相似度时,将第一相似度与预设阈值进行比对,即可分析得到该第一相似度对应的第一人脸图像和第二人脸图像是否对应同一身份。故,针对第一关联关系预定第二关联关系的识别差异,主要是分析第一关联关系与预设阈值的比对关系,以及第二关联关系与阈值的比对关系是否一致。以及,当第一关联关系与预设阈值比对后表示第一样本图像(第一人脸图像)和第二样本图像(第二人脸图像)属于同一身份,则要求第二关联关系与阈值比对的结果也应当表示第一样本图像(第一人脸图像)和第二样本图像(第二人脸图像)属于同一身份。本申请实施例中,基于第一关联关系和第二关联关系与阈值的比对情况对第二模型进行训练,以第一关联关系和第二关联关系与阈值的比对结果所表达的关系含义一致为约束对第二模型进行训练。
在一些实施例中,确定第一关联关系与第一阈值之间的第一比对关系,以及确定第二关联关系与第二阈值之间的第二比对关系,响应于第一比对关系和第二比对关系所对应的关系含义不一致,确定第一关联关系和第二关联关系符合识别差异条件,其中,关系含义中包括正向关系和反向关系。反之,响应于第一比对关系和第二比对关系所对应的关系含义一致,确定第一关联关系和第二关联关系不符合识别差异条件。
示意性的,当第一比对关系为正向关系,第二比对关系为反向关系;或者第一比对关系为反向关系,而第二比对关系为正向关系时,则表示第一关联关系和第二关联关系符合识别差异条件。反之,当第一比对关系和第二比对关系皆为正向关系;或者第一比对关系和第二比对关系皆为反向关系时,则表示第一关联关系和第二关联关系不符合识别差异条件。
以第一关联关系包括第一样本图像和第二样本图像的第一相似度,第二关联关系包括第一样本图像和第二样本图像的第二相似度为例,确定第一相似度与第一阈值的第一比对关系,确定第二相似度与第二阈值之间的第二比对关系。其中,正向关系表示相似度达到相似度阈值的比对关系,反向关系表示相似度未达到相似度阈值的比对关系,也即,对第一相似度而言,正向关系表示第一相似度达到第一阈值的比对关系,反向关系表示第一相似度未达到第一阈值的比对关系;对第二相似度而言,正向关系表示第二相似度达到第二阈值的比对关系,反向关系表示第二相似度未达到第二阈值的比对关系。
综上所述,本申请实施例提供的图像处理模型的训练方法,通过重量级模型和轻量级模型分别对第一样本图像和第二样本图像进行关联关系分析,从而基于重量级模型分析得到的第一关联关系,和轻量级模型分析得到的第二关联关系确定是否符合识别差异条件,当符合识别差异条件时,表示第一关联关系表达的识别结果与第二关联关系表达的识别结果不一致,从而基于不一致的识别结果对轻量级模型进行训练,提高了图像处理模型的训练准确率和训练效率。
在一些实施例中,将第一相似度与第一阈值进行比对,以及将第二相似度与第二阈值进行比对,从而得到识别差异情况,图3是本申请另一个示例性实施例提供的图像处理模型的训练方法流程图,以该方法应用于服务器中为例,如图3所示,该方法包括:
步骤301,获取第一样本图像和第二样本图像。
在一些实施例中,样本图像为预设数据集中的样本,预设数据集中包括一批平衡的样本,即预设数据集中每个身份信息包括固定数量的人脸图片。其中,每个身份信息对应的人脸图片数量相同或者不同。
其中,当第一样本图像和第二样本图像对应同一身份信息,则第一样本图像和第二样本图像构成一对正样本;反之,当第一样本图像和第二样本图像对应不同身份信息,则第一样本图像和第二样本图像构成一对反样本。
步骤302,通过第一模型对第一样本图像和第二样本图像进行关联关系分析,得到第一样本图像与第二样本图像的第一关联关系。
其中,第一模型为经过训练的用于对图像进行处理的模型。第一关联关系用于指示第一模型识别得到的第一样本图像和第二样本图像之间的关联情况。本实施例中,第一关联关系包括第一样本图像和第二样本图像之间的第一相似度。
在一些实施例中,第一样本图像和第二样本图像实现为人脸图像,则第一关联关系的获取过程为,将第一人脸图像和第二人脸图像输入至第一模型中,由第一模型提取第一人脸图像的第一人脸特征,以及提取第二人脸图像的第二人脸特征,从而对第一人脸特征和第二人脸特征进行相似度分析,得到第一关联关系(即第一人脸图像和第二人脸图像之间的人脸相似度)。
步骤303,通过第二模型对第一样本图像和第二样本图像进行关联关系分析,得到第一样本图像和第二样本图像的第二关联关系。
其中,第二模型为当前待训练的模型。第二关联关系用于指示第二模型识别得到的第一样本图像和第二样本图像之间的关联情况。本实施例中,第二关联关系包括第二模型识别得到的第一样本图像和第二样本图像之间的第二相似度。
在一些实施例中,第一样本图像和第二样本图像实现为人脸图像,则第二关联关系的获取过程为,将第一人脸图像和第二人脸图像输入至轻量级模型中,由第二模型提取第一人脸图像的第三人脸特征,以及提取第二人脸图像的第四人脸特征,从而对第三人脸特征和第四人脸特征进行相似度分析,得到第二关联关系。
步骤304,确定第一相似度与第一阈值之间的第一比对关系。
对于一批平衡的样本,可以构造出正样本和负样本,正样本用于表示两个样本来自同一身份,负样本表示两个样本来自不同身份,通过特征提取网络提取得到样本特征后,对于同一批样本,可以得到两个样本之间的关系,其中包括在大模型中得到的关系和在小模型中得到的关系。基于两个模型中得到的关系,首先确定该关系是否符合识别差异条件,如果符合则进行知识迁移,否则不进行知识迁移。
以人脸识别场景为例,在人脸识别过程中常用的两个指标分别为正确通过率(True Positive Rate,TPR)和误过率(FalsePositive Rate,FPR),而TPR和FPR的计算公式如下公式二和公式三所示。
其中,u表示同人相似度,v表示非同人相似度,t为一个选定的阈值,I是一个step函数,条件满足则为1,条件不满足则为0。N表示TPR计算过程中的样本对数量,M表示误过率计算过程中的样本对数量。
由上述公式二和公式三可知,影响性能的为不满足与阈值t的比较关系的相似度,因此,将大模型上的这种比较关系迁移到小模型上。也即,两个相同样本构成的关系而言,如果在大模型中是大于阈值的,则需要在小模型上也大于阈值,如果在大模型中是小于阈值的,则在小模型中也需要小于阈值,而不满足这种关系的样本需要被选择重点关注,作为训练样本用于训练小模型(也即轻量级的第二模型)。该关键关系可以表达为如下公式四:
公式四:I(si,j(T)>tT)≠I(si,j(S)>ts)
其中,si,j(T)表示大模型识别得到的相似度,si,j(S)表示小模型识别得到的相似度,tT表示大模型对应的第一阈值,tS表示小模型对应的第二阈值。
由于第一模型为已训练好的模型,可以通过一个数据集,根据设定的一组FPR指标来选择对应位置的阈值。
可选地,获取预设数据集,该预设数据集中包括至少两个样本图像,该至少两个样本图像中包括第一样本图像和第二样本图像。获取预设误过率指标,误过率指标用于指示预设数据集中至少一组数据集内容之间的误过率的要求,误过率用于表示预设数据集内的反向关系的比例。基于误过率指标通过第一模型确定第一阈值。也即,通过第一模型对预设数据集中的至少两个样本图像进行关联关系分析,以误过率指标控制预设数据集内反向关系的比例,得到第一阈值,也即,该第一阈值用于控制预设数据集内反向关系的比例在误过率指标范围内。
可选地,预先设定的FPR指标中包括一组值(包括至少两个指标数值),该一组值可以是间隔相同的一组值,也可以是随机确定的一组值,本申请实施例对FPR指标的确定方式不加以限定。
步骤305,确定第二相似度与第二阈值之间的第二比对关系。
其中,由于第二模型是一个正在训练中的模型,无法通过常规方式得到第二阈值,故,本申请实施例中,通过在一个批次内通过FPR指标的方式估计阈值,从而通过滑动平均的方式得到第二阈值。
示意性的,基于误过率指标通过第二模型确定基准阈值,基于基准阈值,通过滑动平均方式确定第二阈值,其中,滑动平均方式用于指示通过滑动个平均系数进行阈值确定的方式。
在一些实施例中,通过第二模型对预设数据集中的至少两个样本图像进行关联关系分析,以误过率指标控制预设数据集内的反向关系比例,得到基准阈值。
示意性的,滑动平均方式的实现通过如下公式五所示。
其中,ek为该批次中估计得到的阈值,tk是第k个阈值,α是滑动平均系数,通常数值设定为0.01。
值得注意的是,上述第一阈值和第二阈值的取值相同或者不同。其中,确定第一阈值和确定第二阈值所使用的误过率指标相同。当第一阈值和第二阈值的取值相同时,第一阈值和第二阈值都通过如上述公式五所示的滑动平均方式确定。
示意性的,请参考图4,其示出了本申请一个示例性实施例提供的轻量级的第二模型训练***的结构示意图,如图4所示,该***主要分成三部分,人脸特征提取网络410、关键关系提取模块420和条件关系迁移模块430;其中人脸特征提取网络410中包括重量级的第一模型对应的特征提取网络411和轻量级的第二模型对应的特征提取网络412;在关键关系提取模块420中,针对特征提取网络411和特征提取网络412提取得到的特征进行关键关系提取,取出与阈值比对结果不一致的关键关系输入至条件关系迁移模块430中,由条件关系迁移模块430基于提取得到的关键关系对第二模型进行训练。
值得注意的是,上述模型结构仅为示意性的举例,该模型还可以实现为其他结构,本申请实施例对此不加以限定。
步骤306,响应于第一比对关系和第二比对关系所对应的关系含义不一致,确定第一关联关系和第二关联关系符合识别差异条件。
其中,关系含义中包括正向关系和反向关系。反之,响应于第一比对关系和第二比对关系所对应的关系含义一致,确定第一关联关系和第二关联关系不符合识别差异条件。
示意性的,当第一比对关系为正向关系,第二比对关系为反向关系;或者第一比对关系为反向关系,而第二比对关系为正向关系时,则表示第一关联关系和第二关联关系符合识别差异条件。反之,当第一比对关系和第二比对关系皆为正向关系;或者第一比对关系和第二比对关系皆为反向关系时,则表示第一关联关系和第二关联关系不符合识别差异条件。
其中,正向关系表示相似度达到相似度阈值的比对关系,反向关系表示相似度未达到相似度阈值的比对关系,也即,对第一相似度而言,正向关系表示第一相似度达到第一阈值的比对关系,反向关系表示第一相似度未达到第一阈值的比对关系;对第二相似度而言,正向关系表示第二相似度达到第二阈值的比对关系,反向关系表示第二相似度未达到第二阈值的比对关系。
步骤307,响应于第一关联关系和第二关联关系符合识别差异条件,基于第一关联关系和第二关联关系对轻量级模型进行训练。
其中,识别差异条件用于指示第一关联关系和第二关联关系之间的差异要求。
综上所述,本申请实施例提供的图像处理模型的训练方法,通过重量级模型和轻量级模型分别对第一样本图像和第二样本图像进行关联关系分析,从而基于重量级模型分析得到的第一关联关系,和轻量级模型分析得到的第二关联关系确定是否符合识别差异条件,当符合识别差异条件时,表示第一关联关系表达的识别结果与第二关联关系表达的识别结果不一致,从而基于不一致的识别结果对轻量级模型进行训练,提高了图像处理模型的训练准确率和训练效率。
本实施例提供的方法,通过设置第一阈值和第二阈值的方式对第一比对关系和第二比对关系进行比对,从而确定出关键关系(即比对关系含义不一致的关系)对轻量级模型进行训练,提高了训练准确率和效率。
在一些实施例中,针对关联关系,通过损失函数计算损失值后对轻量级模型进行训练。图5是本申请另一个示例性实施例提供的图像处理模型的训练方法的流程图,以该方法应用于服务器中为例进行说明,如图5所示,该方法包括:
步骤501,获取第一样本图像和第二样本图像。
在一些实施例中,样本图像为预设数据集中的样本,预设数据集中包括一批平衡的样本,即预设数据集中每个身份信息包括固定数量的人脸图片。其中,每个身份信息对应的人脸图片数量相同或者不同。
其中,当第一样本图像和第二样本图像对应同一身份信息,则第一样本图像和第二样本图像构成一对正样本;反之,当第一样本图像和第二样本图像对应不同身份信息,则第一样本图像和第二样本图像构成一对反样本。
步骤502,通过第一模型对第一样本图像和第二样本图像进行关联关系分析,得到第一样本图像与第二样本图像的第一关联关系。
其中,第一模型为经过训练的用于对图像进行处理的模型。第一关联关系用于指示第一模型识别得到的第一样本图像和第二样本图像之间的关联情况。本实施例中,第一关联关系包括第一样本图像和第二样本图像之间的第一相似度。
在一些实施例中,第一样本图像和第二样本图像实现为人脸图像,则第一关联关系的获取过程为,将第一人脸图像和第二人脸图像输入至第一模型中,由第一模型提取第一人脸图像的第一人脸特征,以及提取第二人脸图像的第二人脸特征,从而对第一人脸特征和第二人脸特征进行相似度分析,得到第一关联关系(即第一人脸图像和第二人脸图像之间的人脸相似度)。
步骤503,通过第二模型对第一样本图像和第二样本图像进行关联关系分析,得到第一样本图像和第二样本图像的第二关联关系。
其中,第二模型为当前待训练的模型。第二关联关系用于指示第二模型识别得到的第一样本图像和第二样本图像之间的关联情况。本实施例中,第二关联关系包括第二模型识别得到的第一样本图像和第二样本图像之间的第二相似度。
在一些实施例中,第一样本图像和第二样本图像实现为人脸图像,则第二关联关系的获取过程为,将第一人脸图像和第二人脸图像输入至第二模型中,由第二模型提取第一人脸图像的第三人脸特征,以及提取第二人脸图像的第四人脸特征,从而对第三人脸特征和第四人脸特征进行相似度分析,得到第二关联关系。
步骤504,响应于第一关联关系和第二关联关系符合识别差异条件,确定第一关联关系和第二关联关系之间的差异损失值。
在得到关键关系后,通过约束使关键关系之间的比较关系一致,约束公式如下公式六所示。
其中,sn(T)表示第n组样本在大模型中的相似度,sn(S)表示第n组样本在小模型中的相似度,K表示阈值的数量,由FPR区间确定得到,N为关键关系的总数。tk(T)表示大模型的第k个阈值,tk(S)表示小模型的第k个阈值。
步骤505,基于差异损失值对轻量级模型的模型参数进行调整。
由于上述公式中存在step函数I,而step函数I具有不可导的性质,因此上述公式六无法使用梯度下降算法进行优化,故,设计一个sigmoid函数近似该step函数。请参考如下公式七。
基于该公式七,损失函数的形式变为如下公式八的形式。
通过公式八将第一关联关系和第二关联关系代入即可得到差异损失值,从而通过差异损失值调整第二模型的模型参数。
综上所述,本申请实施例提供的图像处理模型的训练方法,通过重量级模型和轻量级模型分别对第一样本图像和第二样本图像进行关联关系分析,从而基于重量级模型分析得到的第一关联关系,和轻量级模型分析得到的第二关联关系确定是否符合识别差异条件,当符合识别差异条件时,表示第一关联关系表达的识别结果与第二关联关系表达的识别结果不一致,从而基于不一致的识别结果对轻量级模型进行训练,提高了图像处理模型的训练准确率和训练效率。
本实施例提供的方法,通过设计sigmoid函数替换原损失函数中的step函数,解决了由于step函数不可导而导致无法采用梯度下降算法进行模型优化的问题,提高了模型优化效率。
在一些实施例中,当轻量级模型训练完毕后,即可在移动端设备内进行线下应用。图6是本申请一个示例性实施例提供的轻量级模型在移动端设备内应用的流程示意图,如图6所示,该过程中包括:
步骤601,红绿蓝(RedGreenBlue,RGB)传感器抓取用户的人脸图片。
可选地,通过移动端设备的摄像头采集用户的人脸图片。可选地,RGB传感器抓拍的为一副完整的图像,其中包括用户的人脸区域。
步骤602,对RGB人脸图片进行预处理,得到图片a。
该预处理过程包括人脸检测和配准过程,其中,人脸检测是指从完整的图像中检测得到人脸图像所在的区域;配准是指将人脸图像与预先设定的基准点进行配准。
步骤603,将图片a输入至人脸识别网络中,提取得到特征Fa。
人脸识别网络中包括特征提取部分,用于对图片a的特征进行提取,得到人脸特征Fa。
步骤604,基于特征Fa计算图片a与人脸库中人脸图像的相似度Sima。
在一些实施例中,获取人脸库中任意一个人脸图像(对人脸库中的人脸图像进行遍历)的人脸特征Fb,计算特征Fa和特征Fb之间的余弦相似度,得到两个人脸之间的相似度。
步骤605,根据阈值,判断人脸图像与人脸库中的人脸图像是否属于同一个人。
将步骤604中得到的人脸相似度Sima,与预设的阈值th比较,若高于th,则认为A与B是同人,反之则为非同人。
图7是本申请一个示例性实施例提供的图像处理模型的训练装置的结构框图,如图7所示,该装置包括:
获取模块710,用于获取第一样本图像和第二样本图像;
分析模块720,用于通过第一模型对所述第一样本图像和所述第二样本图像进行关联关系分析,得到所述第一样本图像与所述第二样本图像的第一关联关系,所述第一模型为经过训练的用于对图像进行处理的模型;
所述分析模块720,还用于通过第二模型对所述第一样本图像和所述第二样本图像进行关联关系分析,得到所述第一样本图像与所述第二样本图像的第二关联关系,所述第二模型相对所述第一模型为轻量级模型,所述第一模型相对所述第二模型为重量级模型;
训练模块730,用于响应于所述第一关联关系和所述第二关联关系符合识别差异条件,基于所述第一关联关系和所述第二关联关系对所述第二模型进行训练,所述识别差异条件用于指示所述第一关联关系和所述第二关联关系之间的差异要求。
在一个可选的实施例中,所述第一关联关系包括所述第一样本图像和所述第二样本图像之间的第一相似度,所述第二关联关系包括所述第一样本图像和所述第二样本图像之间的第二相似度;
如图8所示,所述装置,还包括:
确定模块740,用于确定所述第一相似度与第一阈值之间的第一比对关系;确定所述第二相似度与第二阈值之间的第二比对关系;
所述确定模块740,还用于响应于所述第一比对关系和所述第二比对关系所对应的关系含义不一致,确定所述第一关联关系和所述第二关联关系符合所述识别差异条件,所述关系含义中包括正向关系和反向关系。
在一个可选的实施例中,所述获取模块710,还用于获取预设数据集,所述预设数据集中包括至少两个样本图像,所述至少两个样本图像中包括所述第一样本图像和所述第二样本图像;
所述获取模块710,还用于获取预设误过率指标,所述误过率指标用于指示所述预设数据集中至少一组数据集内容之间的误过率的要求,所述误过率用于表示所述预设数据集内所述反向关系的比例;
所述确定模块740,还用于基于所述误过率指标通过所述第一模型确定所述第一阈值。
在一个可选的实施例中,所述分析模块720,还用于通过所述第一模型对所述预设数据集中的至少两个样本图像进行关联关系分析;
所述确定模块740,还用于以所述误过率指标控制所述预设数据集内所述反向关系的比例,得到所述第一阈值。
在一个可选的实施例中,所述确定模块740,还用于基于所述误过率指标通过所述第二模型确定基准阈值;基于所述基准阈值,通过滑动平均方式确定所述第二阈值,所述滑动平均方式用于指示通过滑动平均系数进行阈值确定的方式。
在一个可选的实施例中,所述分析模块720,还用于通过所述第二模型对所述预设数据集中的至少两个样本图像进行关联关系分析;
所述确定模块740,还用于以所述误过率指标控制所述预设数据集内所述反向关系的比例,得到所述基准阈值。
在一个可选的实施例中,所述装置,还包括:
确定模块740,用于响应于所述第一关联关系和所述第二关联关系符合识别差异条件,确定所述第一关联关系和所述第二关联关系之间的差异损失值;
所述训练模块730,还用于基于所述差异损失值对所述第二模型的模型参数进行调整。
在一个可选的实施例中,所述分析模块720,包括:
提取单元721,用于通过所述重量级模型对所述第一样本图像和所述第二样本图像进行特征提取,得到所述第一样本图像对应的第一内容特征和所述第二样本图像对应的第二内容特征;
确定单元722,用于基于所述第一内容特征和所述第二内容特征之间的相似度,确定所述第一样本图像与所述第二样本图像的所述第一关联关系。
在一个可选的实施例中,所述分析模块720,包括:
提取单元721,用于通过所述第二模型对所述第一样本图像和所述第二样本图像进行特征提取,得到所述第一样本图像对应的第三内容特征和所述第二样本图像对应的第四内容特征;
确定单元722,用于基于所述第三内容特征和所述第四内容特征之间的相似度,确定所述第一样本图像与所述第二样本图像的所述第二关联关系。
综上所述,本申请实施例提供的图像处理模型的训练装置,通过重量级模型和轻量级模型分别对第一样本图像和第二样本图像进行关联关系分析,从而基于重量级模型分析得到的第一关联关系,和轻量级模型分析得到的第二关联关系确定是否符合识别差异条件,当符合识别差异条件时,表示第一关联关系表达的识别结果与第二关联关系表达的识别结果不一致,从而基于不一致的识别结果对轻量级模型进行训练,提高了图像处理模型的训练准确率和训练效率。
需要说明的是:上述实施例提供的图像处理模型的训练装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的图像处理模型的训练装置,与图像处理模型的训练方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图9示出了本申请一个示例性实施例提供的计算机设备的结构示意图。具体来讲:
计算机设备900包括中央处理单元(Central Processing Unit,CPU)901、包括随机存取存储器(Random Access Memory,RAM)902和只读存储器(Read Only Memory,ROM)903的***存储器904,以及连接***存储器904和中央处理单元901的***总线905。计算机设备900还包括用于存储操作***913、应用程序914和其他程序模块915的大容量存储设备906。
大容量存储设备906通过连接到***总线905的大容量存储控制器(未示出)连接到中央处理单元901。大容量存储设备906及其相关联的计算机可读介质为计算机设备900提供非易失性存储。也就是说,大容量存储设备906可以包括诸如硬盘或者紧凑型光盘只读存储器(Compact Disc Read Only Memory,CD-ROM)驱动器之类的计算机可读介质(未示出)。
不失一般性,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、带电可擦可编程只读存储器(Electrically Erasable Programmable Read Only Memory,EEPROM)、闪存或其他固态存储其技术,CD-ROM、数字通用光盘(Digital Versatile Disc,DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知计算机存储介质不局限于上述几种。上述的***存储器904和大容量存储设备906可以统称为存储器。
根据本申请的各种实施例,计算机设备900还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即计算机设备900可以通过连接在***总线905上的网络接口单元911连接到网络912,或者说,也可以使用网络接口单元911来连接到其他类型的网络或远程计算机***(未示出)。
上述存储器还包括一个或者一个以上的程序,一个或者一个以上程序存储于存储器中,被配置由CPU执行。
本申请的实施例还提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的图像处理模型的训练方法。
本申请的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行,以实现上述各方法实施例提供的图像处理模型的训练方法。
本申请的实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中任一所述的图像处理模型的训练方法。
可选地,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、固态硬盘(SSD,Solid State Drives)或光盘等。其中,随机存取记忆体可以包括电阻式随机存取记忆体(ReRAM,Resistance RandomAccess Memory)和动态随机存取存储器(DRAM,Dynamic Random Access Memory)。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (14)
1.一种图像处理模型的训练方法,其特征在于,所述方法包括:
获取第一样本图像和第二样本图像;
通过第一模型对所述第一样本图像和所述第二样本图像进行关联关系分析,得到所述第一样本图像与所述第二样本图像的第一关联关系,所述第一模型为经过训练的用于对图像进行处理的模型;
通过第二模型对所述第一样本图像和所述第二样本图像进行关联关系分析,得到所述第一样本图像与所述第二样本图像的第二关联关系,所述第二模型相对所述第一模型为轻量级模型,所述第一模型相对所述第二模型为重量级模型;
响应于所述第一关联关系和所述第二关联关系符合识别差异条件,基于所述第一关联关系和所述第二关联关系对所述第二模型进行训练,所述识别差异条件用于指示所述第一关联关系和所述第二关联关系之间的差异要求。
2.根据权利要求1所述的方法,其特征在于,所述第一关联关系包括所述第一样本图像和所述第二样本图像之间的第一相似度,所述第二关联关系包括所述第一样本图像和所述第二样本图像之间的第二相似度;
所述响应于所述第一关联关系和所述第二关联关系符合识别差异条件,基于所述第一关联关系和所述第二关联关系对所述第二模型进行训练之前,还包括:
确定所述第一相似度与第一阈值之间的第一比对关系;
确定所述第二相似度与第二阈值之间的第二比对关系;
响应于所述第一比对关系和所述第二比对关系所对应的关系含义不一致,确定所述第一关联关系和所述第二关联关系符合所述识别差异条件,所述关系含义中包括正向关系和反向关系。
3.根据权利要求2所述的方法,其特征在于,所述确定所述第一相似度与第一阈值之间的第一比对关系之前,还包括:
获取预设数据集,所述预设数据集中包括至少两个样本图像,所述至少两个样本图像中包括所述第一样本图像和所述第二样本图像;
获取预设误过率指标,所述误过率指标用于指示所述预设数据集中至少一组数据集内容之间的误过率的要求,所述误过率用于表示所述预设数据集内所述反向关系的比例;
基于所述误过率指标通过所述第一模型确定所述第一阈值。
4.根据权利要求3所述的方法,其特征在于,所述基于所述误过率指标通过所述第一模型确定所述第一阈值,包括:
通过所述第一模型对所述预设数据集中的至少两个样本图像进行关联关系分析;
以所述误过率指标控制所述预设数据集内所述反向关系的比例,得到所述第一阈值。
5.根据权利要求3所述的方法,其特征在于,所述确定所述第二相似度与第二阈值之间的第二比对关系之前,还包括:
基于所述误过率指标通过所述第二模型确定基准阈值;
基于所述基准阈值,通过滑动平均方式确定所述第二阈值,所述滑动平均方式用于指示通过滑动平均系数进行阈值确定的方式。
6.根据权利要求5所述的方法,其特征在于,所述基于所述误过率指标通过所述第二模型确定基准阈值,包括:
通过所述第二模型对所述预设数据集中的至少两个样本图像进行关联关系分析;
以所述误过率指标控制所述预设数据集内所述反向关系的比例,得到所述基准阈值。
7.根据权利要求1至6任一所述的方法,其特征在于,所述响应于所述第一关联关系和所述第二关联关系符合识别差异条件,基于所述第一关联关系和所述第二关联关系对所述第二模型进行训练,包括:
响应于所述第一关联关系和所述第二关联关系符合识别差异条件,确定所述第一关联关系和所述第二关联关系之间的差异损失值;
基于所述差异损失值对所述第二模型的模型参数进行调整。
8.根据权利要求1至6任一所述的方法,其特征在于,所述通过重量级模型对所述第一样本图像和所述第二样本图像进行关联关系分析,得到所述第一样本图像与所述第二样本图像的第一关联关系,包括:
通过所述重量级模型对所述第一样本图像和所述第二样本图像进行特征提取,得到所述第一样本图像对应的第一内容特征和所述第二样本图像对应的第二内容特征;
基于所述第一内容特征和所述第二内容特征之间的相似度,确定所述第一样本图像与所述第二样本图像的所述第一关联关系。
9.根据权利要求1至6任一所述的方法,其特征在于,所述通过所述第二模型对所述第一样本图像和所述第二样本图像进行关联关系分析,得到所述第一样本图像与所述第二样本图像的第二关联关系,包括:
通过所述第二模型对所述第一样本图像和所述第二样本图像进行特征提取,得到所述第一样本图像对应的第三内容特征和所述第二样本图像对应的第四内容特征;
基于所述第三内容特征和所述第四内容特征之间的相似度,确定所述第一样本图像与所述第二样本图像的所述第二关联关系。
10.一种图像处理模型的训练装置,其特征在于,所述装置包括:
获取模块,用于获取第一样本图像和第二样本图像;
分析模块,用于通过第一模型对所述第一样本图像和所述第二样本图像进行关联关系分析,得到所述第一样本图像与所述第二样本图像的第一关联关系,所述第一模型为经过训练的用于对图像进行处理的模型;
所述分析模块,还用于通过第二模型对所述第一样本图像和所述第二样本图像进行关联关系分析,得到所述第一样本图像与所述第二样本图像的第二关联关系,所述第二模型相对所述第一模型为轻量级模型,所述第一模型相对所述第二模型为重量级模型;
训练模块,用于响应于所述第一关联关系和所述第二关联关系符合识别差异条件,基于所述第一关联关系和所述第二关联关系对所述第二模型进行训练,所述识别差异条件用于指示所述第一关联关系和所述第二关联关系之间的差异要求。
11.根据权利要求10所述的装置,其特征在于,所述第一关联关系包括所述第一样本图像和所述第二样本图像之间的第一相似度,所述第二关联关系包括所述第一样本图像和所述第二样本图像之间的第二相似度;
所述装置,还包括:
确定模块,用于确定所述第一相似度与第一阈值之间的第一比对关系;确定所述第二相似度与第二阈值之间的第二比对关系;
所述确定模块,还用于响应于所述第一比对关系和所述第二比对关系所对应的关系含义不一致,确定所述第一关联关系和所述第二关联关系符合所述识别差异条件,所述关系含义中包括正向关系和反向关系。
12.根据权利要求11所述的装置,其特征在于,所述获取模块,还用于获取预设数据集,所述预设数据集中包括至少两个样本图像,所述至少两个样本图像中包括所述第一样本图像和所述第二样本图像;
所述获取模块,还用于获取预设误过率指标,所述误过率指标用于指示所述预设数据集中至少一组数据集内容之间的误过率的要求,所述误过率用于表示所述预设数据集内所述反向关系的比例;
所述确定模块,还用于基于所述误过率指标通过所述第一模型确定所述第一阈值。
13.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一段程序,所述至少一段程序由所述处理器加载并执行以实现如权利要求1至9任一所述的图像处理模型的训练方法。
14.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一段程序,所述至少一段程序由处理器加载并执行以实现如权利要求1至9任一所述的图像处理模型的训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110040398.1A CN113515999A (zh) | 2021-01-13 | 2021-01-13 | 图像处理模型的训练方法、装置、设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110040398.1A CN113515999A (zh) | 2021-01-13 | 2021-01-13 | 图像处理模型的训练方法、装置、设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113515999A true CN113515999A (zh) | 2021-10-19 |
Family
ID=78060857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110040398.1A Pending CN113515999A (zh) | 2021-01-13 | 2021-01-13 | 图像处理模型的训练方法、装置、设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113515999A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106096538A (zh) * | 2016-06-08 | 2016-11-09 | 中国科学院自动化研究所 | 基于定序神经网络模型的人脸识别方法及装置 |
US20180095913A1 (en) * | 2016-09-30 | 2018-04-05 | Intel Corporation | Generation of processor interrupts using averaged data |
CN109508694A (zh) * | 2018-12-10 | 2019-03-22 | 上海众源网络有限公司 | 一种人脸识别方法及识别装置 |
CN110147836A (zh) * | 2019-05-13 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 模型训练方法、装置、终端及存储介质 |
CN111814717A (zh) * | 2020-07-17 | 2020-10-23 | 腾讯科技(深圳)有限公司 | 人脸识别方法、装置及电子设备 |
CN112163635A (zh) * | 2020-10-14 | 2021-01-01 | 平安科技(深圳)有限公司 | 基于深度学习的图像分类方法、装置、服务器及介质 |
-
2021
- 2021-01-13 CN CN202110040398.1A patent/CN113515999A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106096538A (zh) * | 2016-06-08 | 2016-11-09 | 中国科学院自动化研究所 | 基于定序神经网络模型的人脸识别方法及装置 |
US20180095913A1 (en) * | 2016-09-30 | 2018-04-05 | Intel Corporation | Generation of processor interrupts using averaged data |
CN109508694A (zh) * | 2018-12-10 | 2019-03-22 | 上海众源网络有限公司 | 一种人脸识别方法及识别装置 |
CN110147836A (zh) * | 2019-05-13 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 模型训练方法、装置、终端及存储介质 |
CN111814717A (zh) * | 2020-07-17 | 2020-10-23 | 腾讯科技(深圳)有限公司 | 人脸识别方法、装置及电子设备 |
CN112163635A (zh) * | 2020-10-14 | 2021-01-01 | 平安科技(深圳)有限公司 | 基于深度学习的图像分类方法、装置、服务器及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110929622B (zh) | 视频分类方法、模型训练方法、装置、设备及存储介质 | |
CN110472531B (zh) | 视频处理方法、装置、电子设备及存储介质 | |
EP3968179A1 (en) | Place recognition method and apparatus, model training method and apparatus for place recognition, and electronic device | |
EP4002161A1 (en) | Image retrieval method and apparatus, storage medium, and device | |
CN110414432A (zh) | 对象识别模型的训练方法、对象识别方法及相应的装置 | |
CN110659665B (zh) | 一种异维特征的模型构建方法及图像识别方法、装置 | |
CN109145717B (zh) | 一种在线学习的人脸识别方法 | |
CN111368943B (zh) | 图像中对象的识别方法和装置、存储介质及电子装置 | |
CN110569814B (zh) | 视频类别识别方法、装置、计算机设备及计算机存储介质 | |
WO2021218238A1 (zh) | 图像处理方法和图像处理装置 | |
CN111368672A (zh) | 一种用于遗传病面部识别模型的构建方法及装置 | |
CN113177616B (zh) | 图像分类方法、装置、设备及存储介质 | |
CN110457523B (zh) | 封面图片的选取方法、模型的训练方法、装置及介质 | |
CN114298122B (zh) | 数据分类方法、装置、设备、存储介质及计算机程序产品 | |
CN111652974A (zh) | 三维人脸模型的构建方法、装置、设备及存储介质 | |
CN111709313A (zh) | 基于局部和通道组合特征的行人重识别方法 | |
CN115050064A (zh) | 人脸活体检测方法、装置、设备及介质 | |
CN111444957B (zh) | 图像数据处理方法、装置、计算机设备和存储介质 | |
CN114282059A (zh) | 视频检索的方法、装置、设备及存储介质 | |
CN115100709A (zh) | 一种特征分离的图像人脸识别与年龄估计方法 | |
CN114461853A (zh) | 视频场景分类模型的训练样本生成方法、装置及设备 | |
CN111626212B (zh) | 图片中对象的识别方法和装置、存储介质及电子装置 | |
CN116701706A (zh) | 一种基于人工智能的数据处理方法、装置、设备及介质 | |
CN116958724A (zh) | 一种产品分类模型的训练方法和相关装置 | |
CN112257666B (zh) | 目标图像内容的聚合方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40054006 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |