CN112182269B - 图像分类模型的训练、图像分类方法、装置、设备及介质 - Google Patents
图像分类模型的训练、图像分类方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN112182269B CN112182269B CN202011035268.0A CN202011035268A CN112182269B CN 112182269 B CN112182269 B CN 112182269B CN 202011035268 A CN202011035268 A CN 202011035268A CN 112182269 B CN112182269 B CN 112182269B
- Authority
- CN
- China
- Prior art keywords
- image
- classification
- classification model
- image classification
- classified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013145 classification model Methods 0.000 title claims abstract description 396
- 238000012549 training Methods 0.000 title claims abstract description 94
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000012216 screening Methods 0.000 claims abstract description 19
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 238000005457 optimization Methods 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 8
- 230000003247 decreasing effect Effects 0.000 claims description 7
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 241000282472 Canis lupus familiaris Species 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000013136 deep learning model Methods 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开关于一种图像分类模型的训练、图像分类方法、装置、设备及介质,其中图像分类模型的训练方法包括:获取样本集;将当前输入样本集输入至当前图像分类模型进行训练,得到与当前图像分类模型对应的当前图像分类模型集;采用当前图像分类模型集对当前输入样本集进行分类识别;根据分类结果对当前输入样本集进行筛选,将分类结果不满足识别要求的样本,作为下一个图像分类模型的输入样本集,直至分类结果满足识别要求为止;将训练完成的各图像分类模型集作为目标图像分类模型。本公开可以解决单个图像分类模型只注重对简单样本的特征学习而忽略对困难样本的特征学习的问题,提升了对困难样本的鉴别能力,提高了图像分类模型的准确率。
Description
技术领域
本公开涉及图像处理技术领域,尤其涉及一种图像分类模型的训练、图像分类方法、装置、设备及介质。
背景技术
随着科学技术的不断发展,图像处理技术被广泛用来解决各种问题,例如,通过深度学习模型实现图像分类、行人检测以及医学诊断等问题。
相关技术中,通过同一个图像分类模型对样本集(训练集)训练,得到单个图像分类模型;并根据单个图像分类模型对所有待分类图像(测试集)进行分类识别,得到分类结果。
但是,这种方法得到的图像分类模型对不同复杂程度的待分类图像的分类准确率不同,例如,对于简单样本(待分类图像)的分类准确率较高,但对于复杂样本的分类准确率较差,导致得到的图像分类模型的准确率较低。
发明内容
本公开提供一种图像分类模型的训练、图像分类方法、装置、设备及介质,以解决相关技术中单个图像分类模型只注重对简单样本的特征学习而忽略对困难样本的特征学习的问题,可以提升对困难样本的鉴别能力,也可以提高图像分类模型的准确率。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种图像分类模型的训练方法,包括;
获取样本集,所述样本集中的样本包括图像和类别特征;所述样本集为第一图像分类模型的输入样本集;
将当前输入样本集输入至当前图像分类模型进行训练,得到与所述当前图像分类模型对应的当前图像分类模型集;采用所述当前图像分类模型集对所述当前输入样本集进行分类识别;其中,所述当前图像分类模型集中的各当前图像分类模型的网络参数、优化算法或者迭代次数不同;
根据分类结果对所述当前输入样本集进行筛选,将分类结果不满足识别要求的样本,作为下一个图像分类模型的输入样本集,直至分类结果满足识别要求为止;
将训练完成的各图像分类模型集作为目标图像分类模型;
其中,各图像分类模型集中的图像分类模型数量递减、特征提取维度递增,且各次训练的图像分类模型不同。
可选的,将当前输入样本集输入至当前图像分类模型进行训练步骤包括:
将当前输入样本集输入至当前图像分类模型进行训练,根据至少两个网络参数、至少两个优化算法或者至少两个迭代次数,得到至少两个训练完成的当前图像分类模型,各所述训练完成的当前图像分类模型为训练完成的当前图像分类模型集。
可选的,所述根据分类结果对所述当前输入样本集进行筛选,将分类结果不满足识别要求的样本,作为下一个图像分类模型的输入样本集,直至分类结果满足识别要求为止步骤包括:
确定各所述分类结果中分类相同且分类预测概率大于或者等于第一设定阈值的目标分类结果的数量;
若所述目标分类结果的数量小于第二设定阈值,则确定与各所述目标分类结果对应的各样本为不满足识别要求的样本。
可选的,其特征在于,所述分类结果满足识别要求包括:
若各所述分类结果中分类相同且预测概率大于或者等于第一设定阈值的目标分类结果的数量大于第二设定阈值,则确定所述分类结果满足识别要求。
根据本公开实施例的第二方面,提供一种图像分类方法,包括:
将待分类图像输入至目标图像分类模型中的任一当前图像分类模型集进行分类识别,其中,所述目标图像分类模型为采用上述第一方面所述的图像分类模型的训练方法训练而得;
如果所述当前图像分类模型集对所述待分类图像的分类结果满足预设识别条件,则停止将所述待分类图像向下一个图像分类模型集输入;
根据满足预设识别条件的分类结果,确定所述待分类图像的目标分类。
可选的,所述将待分类图像输入目标图像分类模型中的任一当前图像分类模型集进行分类识别步骤包括:
将所述待分类图像输入至所述当前图像分类模型集进行分类识别,得到多个分类结果;
若各所述分类结果不满足预设识别条件,则触发将所述待分类图像输入至下一个图像分类模型集的操作。
可选的,所述若各所述分类结果不满足预设识别条件,则触发将所述待分类图像输入至下一个图像分类模型集步骤包括:
确定各所述分类结果中分类相同且分类概率大于第一设定阈值的目标分类结果的数量;
若所述目标分类结果的数量小于第二设定阈值,则确定各所述分类结果不满足预设识别条件,触发将所述待分类图像继续输入至下一个图像分类模型集。
可选的,所述根据满足预设识别条件的分类结果,确定所述待分类图像的目标分类步骤包括:
将各所述分类结果中大于设定阈值的目标分类结果作为所述待分类图像的类别,将各目标分类结果的预测概率的均值作为所述待分类目标图像的最终预测概率。
根据本公开实施例的第三方面,提供一种图像分类模型的训练装置,包括;
获取模块,被配置为获取样本集,所述样本集中的样本包括图像和类别特征;所述样本集为第一图像分类模型的输入样本集;
训练模块,被配置为将当前输入样本集输入至当前图像分类模型进行训练,得到与所述当前图像分类模型对应的当前图像分类模型集;采用所述当前图像分类模型集对所述当前输入样本集进行分类识别;其中,所述当前图像分类模型集中的各当前图像分类模型的网络参数、优化算法或者迭代次数不同;
筛选模块,被配置为根据分类结果对所述样本集进行筛选,将分类结果不满足识别要求的样本,作为下一个图像分类模型集的输入样本集,直至分类结果满足识别要求为止;
确定模块,被配置为将训练完成的各图像分类模型集作为目标图像分类模型;
其中,各图像分类模型集中的图像分类模型数量递减、特征提取维度递增,且各次训练得到的图像分类模型不同。
可选的,所述训练模块,具体被配置为
将当前输入样本集输入至当前图像分类模型进行训练,根据至少两个网络参数、至少两个优化算法或者至少两个迭代次数,得到至少两个训练完成的当前图像分类模型,各所述训练完成的当前图像分类模型为训练完成的当前图像分类模型集。
可选的,所述筛选模块,具体被配置为
确定各所述分类结果中分类相同且分类预测概率大于或者等于第一设定阈值的目标分类结果的数量;
若所述目标分类结果的数量小于第二设定阈值,则确定与各所述目标分类结果对应的各样本为不满足识别要求的样本。
可选的,所述分类结果满足识别要求包括:
若各所述分类结果中分类相同且预测概率大于或者等于第一设定阈值的目标分类结果的数量大于第二设定阈值,则确定所述分类结果满足识别要求。
根据本公开实施例的第四方面,提供一种图像分类装置,包括:
识别模块,被配置为将待分类图像输入至目标图像分类模型中的任一图像分类模型集进行分类识别,其中,所述目标图像分类模型为采用上述第一方面所述的图像分类模型的训练方法训练而得;
停止模块,被配置为如果图像分类模型对所述待分类图像的分类结果满足预设识别条件,则停止将所述待分类图像向下一个图像分类模型集输入;
确定模块,被配置为根据满足预设识别条件的分类结果,确定所述待分类图像的目标分类。
可选的,所述识别模块包括:识别子模块和输入子模块;
所述识别子模块,被配置为将所述待分类图像输入至所述当前图像分类模型集进行分类识别,得到多个分类结果;
所述输入子模块,被配置为若各所述分类结果不满足预设识别条件,则触发将所述待分类图像输入至下一个图像分类模型集的操作。
可选的,所述输入子模块,具体被配置为
确定各所述分类结果中分类相同且分类概率大于第一设定阈值的目标分类结果的数量;
若所述目标分类结果的数量小于第二设定阈值,则确定各所述分类结果不满足预设识别条件,触发将所述待分类图像继续输入至下一个图像分类模型集。
可选的,所述确定模块,具体被配置为
将各所述分类结果中大于设定阈值的目标分类结果作为所述待分类图像的类别,将各目标分类结果的预测概率的均值作为所述待分类目标图像的最终预测概率。
根据本公开实施例的第五方面,提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行命令的存储器;
其中,所述处理器被配置为执行所述命令,以实现如本公开实施例中任一实施例所述的图像分类模型的训练方法,或者图像分类方法。
根据本公开实施例的第六方面,提供一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如本公开实施例中任一实施例所述的图像分类模型的训练方法,或者图像分类方法。
根据本公开实施例的第七方面,提供一种计算机程序产品,用于与电子设备结合使用,所述计算机程序产品包括计算机可读存储介质和内嵌于其中的计算机程序机制,经由计算机载入该程序并执行后能够实现如本公开任一实施例所述的图像分类模型的训练方法,或者图像分类方法。
本公开的实施例提供的技术方案至少带来以下有益效果:通过获取样本集,样本集中的样本包括图像和类别特征;样本集为第一图像分类模型的输入样本集;将当前输入样本集输入至当前图像分类模型进行训练,得到与当前图像分类模型对应的当前图像分类模型集;采用当前图像分类模型集对当前输入样本集进行分类识别;其中,当前图像分类模型集中的各当前图像分类模型的网络参数、优化算法或者迭代次数不同;根据分类结果对当前输入样本集进行筛选,将分类结果不满足识别要求的样本,作为下一个图像分类模型的输入样本集,直至分类结果满足识别要求为止;将训练完成的各图像分类模型集作为目标图像分类模型,可以解决单个图像分类模型只注重对简单样本的特征学习而忽略对困难样本的特征学习的问题,提升了对困难样本的鉴别能力,提高了图像分类模型的准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种图像分类模型的训练方法的流程图。
图2是根据一示例性实施例示出的一种图像分类模型的训练方法的流程图。
图3是根据一示例性实施例示出的一种图像分类方法的流程图。
图4是根据一示例性实施例示出的一种图像分类方法的流程图。
图5是根据一示例性实施例示出的一种图像分类模型的训练装置的框图。
图6是根据一示例性实施例示出的一种图像分类装置的框图。
图7是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种图像分类模型的训练方法的流程图,如图1所示,图像分类模型的训练方法可以通过图像分类模型的训练装置执行,该装置可以通过软件和/或硬件的方式实现,并用于电子设备中,该电子设备可以为计算机、服务器或者智能手机等,该方法包括以下步骤。
在步骤S11中,获取样本集,样本集中的样本包括图像和类别特征,样本集为第一个图像模型的输入样本集。
其中,样本集是一个由多个样本组成的集合,每个样本可以包括图像和对该图像进行标注的类别特征;其中,标注类别特征,就是我们常见的打标签,一般是从既定的标签中选择数据对应的标签,是一个封闭集合。每张图像都可以有一个或者多个类别特征或者标签;例如,成人、女、黄种人、长发等等。需要说明的是,本实施例中涉及到的样本集也可以被称为训练集。
示例性的,与动物分类任务匹配的样本集中的一个样本可以为任意一张图像,进一步的可以通过标注人员或者标注算法对该图像进行类别特征的标注:若该图像中不包含动物,则可以将该图像的类别特征标注为类别“0”;若该图像中包含动物“狗”,则可以将该图像的类别特征标注为类别“1”;或者,若该图像中包含动物“猫”,则可以将该图像的类别特征标注为类别“1”等等。
需要说明的是,本实施例中涉及的图像分类任务也可以是语义分割任务,可以理解的是,语义分割是在像素级别上的分类,属于同一类的像素都被归为一类,因此语义分割任务也可以看作是图像分类任务。
在步骤S12中,将当前输入样本集输入至当前图像分类模型进行训练,得到与当前图像分类模型对应的当前图像分类模型集;采用当前图像分类模型集对当前输入样本集进行分类识别。
其中,当前图像分类模型集中的各当前图像分类模型的网络参数、优化算法或者迭代次数不同。
其中,当前输入样本集可以为上述步骤中获取到的样本集,也可以为对上述步骤中获取到的样本集进行筛选而得到的样本集,本是实施例中对其不加以限定。
在本实施例的一个可选实现方式中,在获取到包括图像和图像类别特征的样本集之后,可以将获取到的样本集输入至第一图像分类模型中进行训练,并对第一图像分类模型的网络次数、优化算法或者迭代次数进行调整,从而得到第一图像分类模型集;例如,可以先将样本集输入至resnet50网络中进行训练,迭代2万次可以输出一个图像分类模型,迭代2.2万次可以输出另一个图像分类模型,迭代2.4万次又可以输出一个图像分类模型等等;在本实施例中,这些图像分类模型可以组成一个图像分类模型集。
在本实施例的一个可选实现方式中,在得到第一图像分类模型集之后,可以通过第一图像分类模型集对输入到第一图像分类模型的样本集进行分类识别,即对样本集中的每个图像进行类别特征的识别,从而得到识别结果。
需要说明的是,本实施例中涉及到的当前图像分类模型可以为第一图像分类模型,也可以为其他图像分类模型,本实施例中对其不加以限定。示例性的,若第一图像分类模型为resnet50网络,那么第二图像分类模型可以为inception-v3网络,以及第三图像分类模型可以xception网络等;可以理解的是,本实施例中涉及到的各个图像分类模型不同,以及各图像分类模型的特征提取维度也不同。还需要说明的是,本实施例中各图像分类模型集中的图像分类模型数量递减、特征提取维度递增,且各次训练的图像分类模型不同。示例性的,若第一图像分类模型集中包括100个模型,那么第二图像分类模型集和第三图像分类模型集可以分别包括50个和25个模型。
在本实施例的另一个可选实现方式中,若当前图像分类模型不是第一图像分类模型(例如,第二图像分类模型或者第三图像分类模型等),则可以将筛选后的样本集输入至当前图像分类模型中进行训练,并对当前图像分类模型的网络次数、优化算法或者迭代次数进行调整,从而得到当前图像分类模型集;进一步的,可以通过当前图像分类模型集对输入到当前图像分类模型的样本集进行分类识别,从而得到识别结果。需要说明的是,如何对获取到筛选后的样本集将在后文中进行详细的介绍,在此不再对其进行赘述。
可选的,本实施例中可以通过获取到的样本集依次对第一图像分类模型、第二图像分类模型以及第N图像分类模型进行训练,其中,N为任一大于等于三的正整数,本实施例中对其不加以限定。
在步骤S13中,根据分类结果对当前输入样本集进行筛选,将分类结果不满足识别要求的样本,作为下一个图像分类模型的输入样本集,直至分类结果满足识别要求为止。
需要说明的是,本实施例中任意两个图像分类模型的输入样本集均不相同。示例性的,若第一深度学习模型的输入样本为包含100张图像样本的样本集,则第二深度学习模型的输入样本可以为包含50张图像样本的样本集,第三深度学习模型的输入样本可以为包含20张图像样本的样本集等等。
在本实施例的一个可选实现方式中,在采用当前图像分类模型集对当前输入样本集进行分类识别之后,可以进一步的根据分类识别结果对当前输入样本集进行筛选,并将分类结果不满足识别要求的样本,作为下一个图像分类模型的输入样本,直至分类结果满足识别要求为止,其中,识别要求可以为分类准确度要求等,本实施例中对其不加以限定。
示例性的,若听过获取到的样本集对第一图像分类模型进行训练,得到100个第一图像分类模型集;进一步的通过这100个第一图像分类模型集对样本集进行分类识别,确定其中200张样本不满足识别要求,则可以将这200张样本进一步的输入至第二图像分类模型中进行训练,直至所有分类结果均满足识别要求为止。
在步骤S14中,将训练完成的各图像分类模型集作为目标图像分类模型。
在本实施例的一个可选实现方式中,若采用对当前分类模型训练得到的图像分类模型集对当前的输入样本集进行分类识别,并进一步的确定所有分类结果均满足识别要求,则当前即为图像分类模型的最后一个。此时,可以将当前图像分类模型集以及当前之前的所有图像分类模型集作为目标图像分类模型。可以理解的是,目标图像分类模型中包括多个图像分类模型集。
示例性的,若当前为第五图像分类模型,通过对第五图像分类模型进行训练得到的第五图像分类模型集,对输入第五图像分类模型的样本集进行分类识别,对这些分类结果进行筛选,从筛选结果中可以确定所有分类结果均满足识别要求,此时可以停止对图像分类模型的训练,最终的目标图像分类模型中包括第一至第五图像分类模型集。
本实施例的方案,通过获取样本集,样本集中的样本包括图像和类别特征;样本集为第一图像分类模型的输入样本集;将当前输入样本集输入至当前图像分类模型进行训练,得到与当前图像分类模型对应的当前图像分类模型集;采用当前图像分类模型集对当前输入样本集进行分类识别;其中,当前图像分类模型集中的各当前图像分类模型的网络参数、优化算法或者迭代次数不同;根据分类结果对当前输入样本集进行筛选,将分类结果不满足识别要求的样本,作为下一个图像分类模型的输入样本集,直至分类结果满足识别要求为止;将训练完成的各图像分类模型集作为目标图像分类模型,可以解决单个图像分类模型只注重对简单样本的特征学习而忽略对困难样本的特征学习的问题,提升了对困难样本的鉴别能力,提高了图像分类模型的准确率。
图2是根据一示例性实施例示出的一种图像分类模型的训练方法的流程图,本实施例是对上述技术方案的进一步细化,本实施例中的技术方案可以与上述一个或者多个实施例中的各个可选方案结合。如图2所示,图像分类模型的训练方法包括如下步骤。
在步骤S21中,获取样本集,样本集中的样本包括图像和类别特征;样本集为第一图像分类模型的输入样本集。
在步骤S22中,将当前输入样本集输入至当前图像分类模型进行训练,得到与当前图像分类模型对应的当前图像分类模型集。
可选的,在获取到包括图像和类别特征的样本集之后,可以进一步的通过获取到的样本集对图像分类模型进行训练。
在本实施例的一个可选实现方式中,将当前输入样本集输入至当前图像分类模型进行训练,可以包括:将当前输入样本集输入至当前图像分类模型进行训练,根据至少两个网络参数、至少两个优化算法或者至少两个迭代次数,得到至少两个训练完成的当前图像分类模型,各训练完成的当前图像分类模型为训练完成的当前图像分类模型集。
示例性的,在确定当前输入样本集之后,可以将当前输入样本集输入至当前图像分类模型中进行训练,可以进一步的根据不同的学习率参数、不同的损失函数以及不同的迭代次数,得到多个不同的模型;例如,根据学习率为0.1、损失函数为交叉熵函数以及迭代次数为1万对当前网络模型进行训练,得到一个模型;还可以根据学习率为0.01、损失函数为交叉熵函数以及迭代次数为1万对当前网络模型进行训练,得到另一个模型,等等,本实施例中在此不再对其进行赘述。
在步骤S23中,采用当前图像分类模型集对当前输入样本集进行分类识别。
在本实施例的一个可选实现方式中,可以采用训练得到的图像分类模型集对输入样本集进行分类识别,从而得到每个样本图像的多个分类结果,其中,每个样本图像的分类结果中可以包含该样本的分类以及预测概率。示例性的,对任一样本的分类结果可以为该样本的分类为“0”,预测概率为“0.99”,其代表的含义是该样本有0.99的概率为与标签“0”对应的类别,其中,标签“0”为预设的标签规则,其可以代表“人”、“花”或者“猫”等任一类别,本实施例中对其不加以限制。
在步骤S24中,根据分类结果对当前输入样本集进行筛选,将分类结果不满足识别要求的样本,作为下一个图像分类模型的输入样本集,直至分类结果满足识别要求为止。
其中,识别要求可以为分类识别准确度要求。需要说明的是,对于任意一个样本图像来说,当其类别特征与分类结果相同时,分类识别结果正确。本实施例中可以依次识别样本集中的每个样本图像,并根据每个样本图像识别结果确定分类识别准确度。
在具体实现中,根据分类结果对样本集进行筛选,确定分类结果不满足识别要求的样本可以包括:确定各分类结果中分类相同且分类预测概率大于或者等于第一设定阈值的目标分类结果的数量;若目标分类结果的数量小于第二设定阈值,则确定与各目标分类结果对应的各样本为不满足识别要求的样本。
其中,各分类结果分类相同即为各分类结果的类别相同。第一设定阈值可以为0.8或者0.9等任一概率值,本实施例中对其不加以限制;第二设定阈值也可以为任一数值,例如,若深度分类模型集中包括N个图像分类模型,则第二设定阈值可以为2/3N或者3/4N等数值,本实施例中对其不加以限制。其中,N为任意一个大于2的正整数,本实施例中对其不加以限制。
可以理解的是,采用当前训练得到的图像分类模型集对输入当前图像分类模型的某一个样本图像进行识别,并且得到的识别结果的数量与当前图像分类模型集的数量相等,例如,当前图像分类模型集中包括9个图像分类模型,通过当前图像分类模型集对样本图像A进行识别,可以得到9个分类结果,其中每个分类结果中都包含样本图像A的分类以及分类预测概率。其中,每个分类模型对样本图像A的分类结果可以相同也可以不相同,本实施例中对此不加以限制。
进一步的,可以确定各分类结果中分类相同且分类预测概率大于或者等于第一设定阈值的目标分类结果的数量。例如,上例中可以确定对样本图像A的9个分类结果中,分类相同且分类预测概率大于或者等于0.8(第一设定阈值)的分类结果的数量为5个,则目标分类结果的数量为5;进一步的,判断目标分类结果的数量5是否小于6(第二设定阈值),在本例子中,可以明显的看出目标分类结果的数量5小于第二设定阈值6,此时可以确定样本图像A为不满足识别要求的样本。
可选的,分类结果满足识别要求可以包括:若各分类结果中分类相同且预测概率大于或者等于第一设定阈值的目标分类结果的数量大于第二设定阈值,则确定分类结果满足识别要求。
示例性的,如果确定样本图像B的9个分类结果中,分类相同且分类预测概率大于或者等于0.8(第一设定阈值)的分类结果的数量为8个,则目标分类结果的数量为8;进一步的,判断目标分类结果的数量8是否大于6(第二设定阈值),在本例子中,可以明显的看出目标分类结果的数量8大于第二设定阈值6,此时可以确定样本图像B为满足识别要求的样本。
需要说明的是,可以根据上述方法,确定样本集中的每一个样本图像为不满足识别要求的样本,还是满足识别要求的样本。
在本实施例的一个可选实现方式中,通过上述各步骤确定出不满足识别要求的样本图像之后,将这些不满足识别要求的样本图像继续输入至下一个图像分类模型中进行训练,以得到下一个图像分类模型集。
可选的,本实施例中各图像分类模型中的图像分类模型的特征提取维度递增。即在具体实现中,各图像分类模型中的图像分类模型的网络深度不断递增,可以理解的是,在深度学习领域,网络模型的深度越深,模型提取的维度特征越大,学习到的特征也就越多。
可选的,第一图像分类模型为resnet50模型;第二图像分类模型为xception模型;其中,下一个图像分类模型的层数大于上一个图像分类模型的层数。
需要说明的是,本实施例中各图像分类模型集中的图像分类模型数量递减。例如,第一图像分类模型集中可以包括8个图像分类模型、第二图像分类模型集中可以包括4个图像分类模型、第三图像分类模型集中可以包括2个图像分类模型,以及第四图像分类模型集中可以包括1个图像分类模型。
这样设置的好处在于,由于层数的增加,图像分类模型提取特征的能力越强,模型参数量越多,随着层数的增加依次减少获取到的图像分类模型,可以减少计算量,并将最终的图像分类模型的数量减少至一个,可以快速地确定目标图像分类模型,防止不不满足识别要求的样本数量已经很少时(例如3个或者2个等),仍不断地进行训练的现象。
在步骤S25中,将训练完成的各图像分类模型集作为目标图像分类模型。
本实施例的方案,通过获取样本集;将样本集顺序输入当前图像分类模型进行训练,并采用训练得到的图像分类模型集对当前样本集进行分类识别,根据分类结果对当前样本集进行筛选,确定分类结果不满足识别要求的样本,并将分类结果不满足识别要求的样本,作为下一个图像分类模型的输入样本集,最后将训练完成的各图像分类模型集作为目标图像分类模型,可以解决单个图像分类模型只注重对简单样本的特征学习而忽略对困难样本的特征学习的问题,提升了对困难样本的鉴别能力,提高了图像分类模型的准确率。
图3是根据一示例性实施例示出的一种图像分类方法的流程图,如图3所示,图像分类方法可以通过图像分类装置执行,该装置可以通过软件和/或硬件的方式实现,并用于电子设备中,该电子设备可以为计算机、服务器或者智能手机等,该方法包括以下步骤。
在步骤S31中,将待分类图像输入至目标图像分类模型中的任一当前图像分类模型集进行分类识别。
其中,待分类图像即为测试集,待分类图像的数量可以为一个也可以为多个,本实施例中对此不加以限制。需要说明的是,本实施例中的待分类图像与上述各实施例中涉及到的样本集应属于同一个数据集。目标图像分类模型即为上述各实施例中根据图像分类模型的训练方法训练得到的图像分类模型集。
在步骤S32中,如果当前图像分类模型集对待分类图像的分类结果满足预设识别条件,则停止将待分类图像向下一个图像分类模型集输入。
其中,当前图像分类模型集可以为第二图像分类模型集、第三图像分类模型集等,本实施例对其不加以限制。
在具体实现中,每将待分类图像输入至一个图像分类模型集中,对待分类图像进行分类识别之后,都可以验证该图像分类模型集对待分类图像的分类结果是都满足预设的识别条件,其中,预设的识别条件可以为分类识别准确度要求,如果满足则停止将待分类图像向下一个图像分类模型输入,即停止对待分类图像的分类识别。
在本实施例的另一个具体例子中,如果当前图像分类模型集为目标图像分类模型的最后一个图像分类模型集时,当最后一个图像分类模型集对待分类图像进行分类识别之后,也会停止将待分类图像向下一个图像分类模型输入,即停止对待分类图像的分类识别。
示例性的,本实施例中可以先将待分类图像A输入至目标图像分类模型的第一图像分类模型集进行分类识别,并确定第一图像分类模型集对待分类图像A的分类结果是否准确;如果不准确,则继续将待分类图像A输入至第五图像分类模型集进行分类识别,并确定第五图像分类模型集对待分类图像A的分类结果是否准确;如果不准确,则继续将待分类图像A输入至第五图像分类模型集进行分类识别,直至确定待分类图像A的分类结果准确,或者目标图像分类模型的最后一个图像分类模型集进行分类识别为止,停止将待分类图像A输入至目标图像分类模型中。
在步骤S33中,根据满足预设识别条件的分类结果,确定待分类图像的目标分类。
在具体实现中,在某一个图像分类模型集对待分类图像的分类结果满足预设识别条件,停止将待分类图像向下一个图像分类模型输入之后,可以将某一个图像分类模型集对待分类图像的分类结果作为待分类图像的目标分类。
示例性的,若当待分类图像B输入至第二图像分类模型集进行分类识别,并确定第二图像分类模型集对待分类图像B的分类结果是满足预设识别条件,则此时可以将第二图像分类模型集对待分类图像B的分类结果作为待分类图像B的目标分类。
本实施例的方案,将待分类图像输入至目标图像分类模型中的任一当前图像分类模型集进行分类识别;如果当前图像分类模型集对待分类图像的分类结果满足预设识别条件,则停止将待分类图像向下一个图像分类模型集输入;根据满足预设识别条件的分类结果,确定待分类图像的目标分类,可以解决单个模型对较复杂的待分类图像分类不准确的问题,当待分类图像较复杂时,也可以准确的确定待分类图像目标分类。
图4是根据一示例性实施例示出的一种图像分类方法的流程图,本实施例是对上述技术方案的进一步细化,本实施例中的技术方案可以与上述一个或者多个实施例中的各个可选方案结合。如图4所示,图像分类方法包括如下步骤。
在步骤S41中,将待分类图像输入至当前图像分类模型集进行分类识别,得到多个分类结果。
其中,当前图像分类模型集可以为目标图像分类模型中的任意一个图像分类模型集,例如,通过对第一图像分类模型训练得到的第一图像分类模型集,或者通过对第二图像分类模型训练得到的第二图像分类模型集等,本实施例中对其不加以限制。
在本实施例的一个可选实现中中,将待分类图像输入至当前图像分类模型集中,当前图像分类模型集中的每个深度图像分类模型都会对待输入图像进行分类识别,从而得到多个分类结果。可以理解的是,本实施例中分类结果的数量与当前图像分类模型集中包括的图像分类模型的个数相同,例如,当前图像分类模型集包括10个图像分类模型,则将待分类图像输入至当前图像分类模型集进行分类识别,可以得到10个分类结果。
在步骤S42中,若各分类结果不满足预设识别条件,则触发将待分类图像输入至下一个图像分类模型集的操作。
在本实施例的一个可选实现方式中,若步骤S41中确定的当前图像分类模型集对待分类图像进行分类识别得到的多个分类结果不满足预设识别条件,则触发将待分类图像输入至下一个图像分类模型集的操作。
可选的,若各分类结果不满足预设识别条件,则触发将待分类图像输入至下一个图像分类模型集步骤可以包括:确定各分类结果中分类相同且分类概率大于第一设定阈值的目标分类结果的数量;若目标分类结果的数量小于第二设定阈值,则确定各分类结果不满足预设识别条件,触发将待分类图像继续输入至下一个图像分类模型集。
其中,本实施例中涉及到的第一设定阈值以及第二设定阈值,与上述图像分类模型的训练方法中各实施例中涉及到的第一设定阈值以及第二设定阈值相同,具体操作步骤的核心思想也完全相同,本实施例中在此将不再对其进行赘述。
在步骤S43中,根据满足预设识别条件的分类结果,确定待分类图像的目标分类。
在本实施例的一个可选实现方式中,当确定满足预设识别条件的分类结果之后,可以进一步的确定待分类图像的目标分类。
可选的,根据满足预设识别条件的分类结果,确定待分类图像的目标分类步骤包括:将各分类结果中大于设定阈值的目标分类结果作为待分类图像的类别,将各目标分类结果的预测概率的均值作为待分类目标图像的最终预测概率。
其中,设定阈值可以为任一数值,例如2/3N或者3/4N等,本实施例中对此不加以限制。其中,N为分类结果的数量。
在具体实现中,当确定满足预设识别条件的分类结果时,可以对各分类结果进行统计,例如,统计各分类结果的类别以及各分类结果的预测概率。具体的,可以将各分类结果中大于设定阈值的目标分类结果作为待分类图像的类别,将各目标分类结果的预测概率的均值作为待分类目标图像的最终预测概率。
示例性的,若分类结果的数量为6,设定阈值为6,则可以将10个分类结果中大于设定阈值6的目标分类结果作为待分类图像的类别,将各目标分类结果的预测概率的均值作为待分类目标图像的最终预测概率。
在本实施例的另一个具体例子中,若分类结果的数量为1,即该分类结果是通过最后一个图像分类模型集对待分类图像进行分类识别得到的分类结果,则此时,这一个分类结果的类别即为待分类图像的类别,这一个分类结果的预测概率即为待分类图像的预测概率。
本实施例的方案,将待分类图像输入至当前图像分类模型集进行分类识别,得到多个分类结果;若各分类结果不满足预设识别条件,则触发将待分类图像输入至下一个图像分类模型集的操作;根据满足预设识别条件的分类结果,确定待分类图像的目标分类,可以解决单个模型对较复杂的待分类图像分类不准确的问题,当待分类图像较复杂时,也可以准确的确定待分类图像目标分类。
为了使本领域技术人员更好地理解本公开实施例,下面采用一个具体示例进行说明,具体过程包括有:模型训练阶段和使用阶段。
其中,模型训练阶段包括:
1、准备图像分类模型使用的训练数据,即上述各实施例中涉及到的样本集(比如我们要识别“狗”,则需要收集很多“狗”和不是“狗”的图片)以及训练数据对应的标签label(是不是“狗”)。
2、使用resnet50深度学习分类网络对该批次数据产生N(N>=2)个不同参数配置(包括网络架构、迭代训练的优化器、迭代训练步数)的模型,直到损失函数(深度学习分类网络的常用损失函数,比如交叉熵损失)的值几乎不再下降,证明此时网络收敛,则分类模型训练完毕。
3、将这N个分类模型分别对训练数据集进行预测,得到预测概率和预测label。其中预测label=最大概率所对应的标签。将这N个模型的预测结果进行如下整合:
在单个数据上,判断N个分类模型预测的label是否有超过2/3N个是一致的且预测概率大于或者等于0.8。
如果是,则判定该N个模型在该数据上具备一致性。否则,N个模型在该数据上不具备一致性。因此我们将不一致性的数据保留下来,形成一个新的训练集合。
4、基于上述不一致性的数据,我们使用xception或者inception-v3进行第二阶段的训练,得到第二阶段的N/2个模型。
基于不一致性的数据,....,得到第x阶段的N/(2^(x-1))个模型。
如此迭代下去直到最后一个只有一个模型进行最终的决策。
需要说明的是,上述例子中,可以根据实际情况,动态调整各阶段模型的数量。
其中,使用阶段包括:
对同一张测试图像,首先使用第一阶段产生的N个模型进行决策,当第一阶段决策不一致时(即没有超过2/3N个模型对该图像的预测是同一个label的且预测概率>=0.8)才进入第二阶段;当第二阶段不一致时(同上)才进行第三阶段的决策,直到进入最后一个阶段或者同一阶段的决策具备一致性为止。如果在当前决策阶段,有超过2/3N个的预测的label=L且预测概率P>=0.8,则该图像的最终预测label=L,预测的概率为这些一致模型的预测概率P的均值。其中R为当前阶段的模型数目。
本公开实施例的核心思想是,第一阶段先学习简单的样本,第二阶段学习稍微难点的样本,如此这般逐渐学习更难的样本可以很好的避免了单个模型只注重简单样本的学习而忽略困难样本学习的问题,更好的提升了对困难样本的鉴别能力,保证了整体准确率的提高。
图5是根据一示例性实施例示出的一种图像分类模型的训练装置的框图。参照图5,该装置包括获取模块51,训练模块52、筛选模块53和确定模块54。
其中,获取模块51,被配置为获取样本集,样本集中的样本包括图像和类别特征;样本集为第一图像分类模型的输入样本集;
训练模块52,被配置为将当前输入样本集输入至当前图像分类模型进行训练,得到与当前图像分类模型对应的当前图像分类模型集;采用当前图像分类模型集对当前输入样本集进行分类识别;其中,当前图像分类模型集中的各当前图像分类模型的网络参数、优化算法或者迭代次数不同;
筛选模块53,被配置为根据分类结果对样本集进行筛选,将分类结果不满足识别要求的样本,作为下一个图像分类模型集的输入样本集,直至分类结果满足识别要求为止;
确定模块54,被配置为将训练完成的各图像分类模型集作为目标图像分类模型;
其中,各图像分类模型集中的图像分类模型数量递减、特征提取维度递增,且各次训练得到的图像分类模型不同。
可选的,训练模块52,被配置为将当前输入样本集输入至当前图像分类模型进行训练,根据至少两个网络参数、至少两个优化算法或者至少两个迭代次数,得到至少两个训练完成的当前图像分类模型,各训练完成的当前图像分类模型为训练完成的当前图像分类模型集。
可选的,筛选模块53,具体被配置为
确定各分类结果中分类相同且分类预测概率大于或者等于第一设定阈值的目标分类结果的数量;
若目标分类结果的数量小于第二设定阈值,则确定与各目标分类结果对应的各样本为不满足识别要求的样本。
可选的,本实施例中涉及到的分类结果满足识别要求包括:
若各分类结果中分类相同且预测概率大于或者等于第一设定阈值的目标分类结果的数量大于第二设定阈值,则确定分类结果满足识别要求。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种图像分类装置的框图。参照图6,该装置包括识别模块61,停止模块62和确定模块63。
其中,识别模块61,被配置为被配置为将待分类图像输入至目标图像分类模型中的任一图像分类模型集进行分类识别,其中,目标图像分类模型为采用本实施例中任一图像分类模型的训练方法训练而得;
停止模块62,被配置为如果图像分类模型对待分类图像的分类结果满足预设识别条件,则停止将待分类图像向下一个图像分类模型集输入;
确定模块63,被配置为根据满足预设识别条件的分类结果,确定待分类图像的目标分类。
可选的,识别模块61,包括识别子模块以及输入子模块。
识别子模块,被配置为将待分类图像输入至当前图像分类模型集进行分类识别,得到多个分类结果;
输入子模块,被配置为若各分类结果不满足预设识别条件,则触发将待分类图像输入至下一个图像分类模型集的操作。
可选的,输入子模块,具体被配置为
确定各分类结果中分类相同且分类概率大于第一设定阈值的目标分类结果的数量;
若目标分类结果的数量小于第二设定阈值,则确定各分类结果不满足预设识别条件,触发将待分类图像继续输入至下一个图像分类模型集。
可选的,确定模块63,具体被配置为
将各分类结果中大于设定阈值的目标分类结果作为待分类图像的类别,将各目标分类结果的预测概率的均值作为待分类目标图像的最终预测概率。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图7是根据一示例性实施例示出的一种电子设备的结构框图。如图7所示,该电子设备包括处理器71;用于存储处理器71的可执行指令的存储器72,存储器72可以包括随机存取存储器(Random Access Memory,RAM)和只读存储器(Read-Only Memory,ROM);其中,处理器71被配置为执行指令,以实现上述图像分类模型的训练方法,或者图像分类方法。
在示例性实施例中,还提供了一种包括指令的存储介质,例如存储可执行指令的存储器72,上述指令可由电子设备(服务器或智能终端)的处理器71执行以完成上述图像分类模型的训练方法,或者图像分类方法。
可选地,存储介质可以是非临时性计算机可读存储介质,例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序产品,当该计算机程序产品中的指令由电子设备(服务器或智能终端)的处理器执行时,实现上述图像分类模型的训练方法,或者图像分类方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (14)
1.一种图像分类模型的训练方法,其特征在于,包括;
获取样本集,所述样本集中的样本包括图像和类别特征;所述样本集为第一图像分类模型的输入样本集;
将当前输入样本集输入至当前图像分类模型进行训练,得到与所述当前图像分类模型对应的当前图像分类模型集;采用所述当前图像分类模型集对所述当前输入样本集进行分类识别;其中,所述当前图像分类模型集中的各当前图像分类模型的网络参数、优化算法或者迭代次数不同;
根据分类结果对所述当前输入样本集进行筛选,将分类结果不满足识别要求的样本,作为下一个图像分类模型的输入样本集,直至分类结果满足识别要求为止;
将训练完成的各图像分类模型集作为目标图像分类模型;
其中,各图像分类模型集中的图像分类模型数量递减、特征提取维度递增,且各次训练的图像分类模型不同;
所述根据分类结果对所述当前输入样本集进行筛选,将分类结果不满足识别要求的样本,作为下一个图像分类模型的输入样本集,直至分类结果满足识别要求为止步骤包括:
确定各所述分类结果中分类相同且分类预测概率大于或者等于第一设定阈值的目标分类结果的数量;
若所述目标分类结果的数量小于第二设定阈值,则确定与各所述目标分类结果对应的各样本为不满足识别要求的样本;
所述分类结果满足识别要求包括:
若各所述分类结果中分类相同且预测概率大于或者等于第一设定阈值的目标分类结果的数量大于第二设定阈值,则确定所述分类结果满足识别要求。
2.根据权利要求1所述的方法,其特征在于,将当前输入样本集输入至当前图像分类模型进行训练步骤包括:
将当前输入样本集输入至当前图像分类模型进行训练,根据至少两个网络参数、至少两个优化算法或者至少两个迭代次数,得到至少两个训练完成的当前图像分类模型,各所述训练完成的当前图像分类模型为训练完成的当前图像分类模型集。
3.一种图像分类方法,其特征在于,包括:
将待分类图像输入至目标图像分类模型中的任一当前图像分类模型集进行分类识别,其中,所述目标图像分类模型为采用权利要求1-2任一所述的图像分类模型的训练方法训练而得;
如果所述当前图像分类模型集对所述待分类图像的分类结果满足预设识别条件,则停止将所述待分类图像向下一个图像分类模型集输入;
根据满足预设识别条件的分类结果,确定所述待分类图像的目标分类。
4.根据权利要求3所述的方法,其特征在于,所述将待分类图像输入目标图像分类模型中的任一当前图像分类模型集进行分类识别步骤包括:
将所述待分类图像输入至所述当前图像分类模型集进行分类识别,得到多个分类结果;
若各所述分类结果不满足预设识别条件,则触发将所述待分类图像输入至下一个图像分类模型集的操作。
5.根据权利要求4所述的方法,其特征在于,所述若各所述分类结果不满足预设识别条件,则触发将所述待分类图像输入至下一个图像分类模型集步骤包括:
确定各所述分类结果中分类相同且分类概率大于第一设定阈值的目标分类结果的数量;
若所述目标分类结果的数量小于第二设定阈值,则确定各所述分类结果不满足预设识别条件,触发将所述待分类图像继续输入至下一个图像分类模型集。
6.根据权利要求3-5中任一项所述的方法,其特征在于,所述根据满足预设识别条件的分类结果,确定所述待分类图像的目标分类步骤包括:
将各所述分类结果中大于设定阈值的目标分类结果作为所述待分类图像的类别,将各目标分类结果的预测概率的均值作为所述待分类目标图像的最终预测概率。
7.一种图像分类模型的训练装置,其特征在于,包括;
获取模块,被配置为获取样本集,所述样本集中的样本包括图像和类别特征;所述样本集为第一图像分类模型的输入样本集;
训练模块,被配置为将当前输入样本集输入至当前图像分类模型进行训练,得到与所述当前图像分类模型对应的当前图像分类模型集;采用所述当前图像分类模型集对所述当前输入样本集进行分类识别;其中,所述当前图像分类模型集中的各当前图像分类模型的网络参数、优化算法或者迭代次数不同;
筛选模块,被配置为根据分类结果对所述样本集进行筛选,将分类结果不满足识别要求的样本,作为下一个图像分类模型集的输入样本集,直至分类结果满足识别要求为止;
确定模块,被配置为将训练完成的各图像分类模型集作为目标图像分类模型;
其中,各图像分类模型集中的图像分类模型数量递减、特征提取维度递增,且各次训练得到的图像分类模型不同;
所述筛选模块,具体被配置为
确定各所述分类结果中分类相同且分类预测概率大于或者等于第一设定阈值的目标分类结果的数量;
若所述目标分类结果的数量小于第二设定阈值,则确定与各所述目标分类结果对应的各样本为不满足识别要求的样本;
所述分类结果满足识别要求包括:
若各所述分类结果中分类相同且预测概率大于或者等于第一设定阈值的目标分类结果的数量大于第二设定阈值,则确定所述分类结果满足识别要求。
8.根据权利要求7所述的装置,其特征在于,所述训练模块,具体被配置为
将当前输入样本集输入至当前图像分类模型进行训练,根据至少两个网络参数、至少两个优化算法或者至少两个迭代次数,得到至少两个训练完成的当前图像分类模型,各所述训练完成的当前图像分类模型为训练完成的当前图像分类模型集。
9.一种图像分类装置,其特征在于,包括:
识别模块,被配置为将待分类图像输入至目标图像分类模型中的任一图像分类模型集进行分类识别,其中,所述目标图像分类模型为采用权利要求1-2任一所述的图像分类模型的训练方法训练而得;
停止模块,被配置为如果图像分类模型对所述待分类图像的分类结果满足预设识别条件,则停止将所述待分类图像向下一个图像分类模型集输入;
确定模块,被配置为根据满足预设识别条件的分类结果,确定所述待分类图像的目标分类。
10.根据权利要求9所述的装置,其特征在于,所述识别模块包括:识别子模块和输入子模块;
所述识别子模块,被配置为将所述待分类图像输入至当前图像分类模型集进行分类识别,得到多个分类结果;
所述输入子模块,被配置为若各所述分类结果不满足预设识别条件,则触发将所述待分类图像输入至下一个图像分类模型集的操作。
11.根据权利要求10所述的装置,其特征在于,所述输入子模块,具体被配置为
确定各所述分类结果中分类相同且分类概率大于第一设定阈值的目标分类结果的数量;
若所述目标分类结果的数量小于第二设定阈值,则确定各所述分类结果不满足预设识别条件,触发将所述待分类图像继续输入至下一个图像分类模型集。
12.根据权利要求9-11中任一项所述的装置,其特征在于,所述确定模块,具体被配置为
将各所述分类结果中大于设定阈值的目标分类结果作为所述待分类图像的类别,将各目标分类结果的预测概率的均值作为所述待分类目标图像的最终预测概率。
13.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行命令的存储器;
其中,所述处理器被配置为执行所述命令,以实现如权利要求1至2中任一项所述的图像分类模型的训练方法,或者权利要求3至6中任一项所述的图像分类方法。
14.一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至2中任一项所述的图像分类模型的训练方法,或者权利要求3至6中任一项所述的图像分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011035268.0A CN112182269B (zh) | 2020-09-27 | 2020-09-27 | 图像分类模型的训练、图像分类方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011035268.0A CN112182269B (zh) | 2020-09-27 | 2020-09-27 | 图像分类模型的训练、图像分类方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112182269A CN112182269A (zh) | 2021-01-05 |
CN112182269B true CN112182269B (zh) | 2023-11-28 |
Family
ID=73943757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011035268.0A Active CN112182269B (zh) | 2020-09-27 | 2020-09-27 | 图像分类模型的训练、图像分类方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112182269B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113344890B (zh) * | 2021-06-18 | 2024-04-12 | 北京百度网讯科技有限公司 | 医学图像识别方法、识别模型训练方法及装置 |
CN114170463A (zh) * | 2021-12-06 | 2022-03-11 | 上海坤扫环境科技股份有限公司 | 非接触式宽幅外墙清洗方法及*** |
CN114519404B (zh) * | 2022-04-20 | 2022-07-12 | 四川万网鑫成信息科技有限公司 | 一种图像样本分类标注方法、装置、设备、存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109815991A (zh) * | 2018-12-29 | 2019-05-28 | 北京城市网邻信息技术有限公司 | 机器学习模型的训练方法、装置、电子设备及存储介质 |
WO2019154262A1 (zh) * | 2018-02-07 | 2019-08-15 | 腾讯科技(深圳)有限公司 | 一种图像分类方法及服务器、用户终端、存储介质 |
WO2019169700A1 (zh) * | 2018-03-08 | 2019-09-12 | 平安科技(深圳)有限公司 | 一种数据分类方法、装置、设备及计算机可读存储介质 |
WO2020108474A1 (zh) * | 2018-11-30 | 2020-06-04 | 广州市百果园信息技术有限公司 | 图片分类、分类识别模型的生成方法、装置、设备及介质 |
CN111507407A (zh) * | 2020-04-17 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 图像分类模型的训练方法及装置 |
-
2020
- 2020-09-27 CN CN202011035268.0A patent/CN112182269B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019154262A1 (zh) * | 2018-02-07 | 2019-08-15 | 腾讯科技(深圳)有限公司 | 一种图像分类方法及服务器、用户终端、存储介质 |
WO2019169700A1 (zh) * | 2018-03-08 | 2019-09-12 | 平安科技(深圳)有限公司 | 一种数据分类方法、装置、设备及计算机可读存储介质 |
WO2020108474A1 (zh) * | 2018-11-30 | 2020-06-04 | 广州市百果园信息技术有限公司 | 图片分类、分类识别模型的生成方法、装置、设备及介质 |
CN109815991A (zh) * | 2018-12-29 | 2019-05-28 | 北京城市网邻信息技术有限公司 | 机器学习模型的训练方法、装置、电子设备及存储介质 |
CN111507407A (zh) * | 2020-04-17 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 图像分类模型的训练方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112182269A (zh) | 2021-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112182269B (zh) | 图像分类模型的训练、图像分类方法、装置、设备及介质 | |
CN112348117B (zh) | 场景识别方法、装置、计算机设备和存储介质 | |
CN108280477A (zh) | 用于聚类图像的方法和装置 | |
CN110909618B (zh) | 一种宠物身份的识别方法及装置 | |
CN111428448B (zh) | 文本生成方法、装置、计算机设备及可读存储介质 | |
CN110135505B (zh) | 图像分类方法、装置、计算机设备及计算机可读存储介质 | |
JP6897749B2 (ja) | 学習方法、学習システム、および学習プログラム | |
CN111160959B (zh) | 一种用户点击转化预估方法及装置 | |
CN113780243B (zh) | 行人图像识别模型的训练方法、装置、设备以及存储介质 | |
EP4187213A1 (en) | Rgb-d-based ai system for inferring weight of livestock, and computer-readable medium having recorded thereon computer program for providing same | |
CN112115996B (zh) | 图像数据的处理方法、装置、设备及存储介质 | |
CN109271957B (zh) | 人脸性别识别方法以及装置 | |
CN115187772A (zh) | 目标检测网络的训练及目标检测方法、装置及设备 | |
CN114648680A (zh) | 图像识别模型的训练方法、装置、设备、介质及程序产品 | |
CN111753775A (zh) | 鱼的生长评估方法、装置、设备及存储介质 | |
CN113177554B (zh) | 甲状腺结节识别与分割方法、***、存储介质及设备 | |
CN114328942A (zh) | 关系抽取方法、装置、设备、存储介质和计算机程序产品 | |
CN109657710B (zh) | 数据筛选方法、装置、服务器及存储介质 | |
CN110059743B (zh) | 确定预测的可靠性度量的方法、设备和存储介质 | |
CN109033078B (zh) | 语句类别识别方法及装置、存储介质、处理器 | |
CN112766387B (zh) | 一种训练数据的纠错方法、装置、设备及存储介质 | |
CN115240647A (zh) | 声音事件检测方法、装置、电子设备及存储介质 | |
CN112507912B (zh) | 一种识别违规图片的方法及装置 | |
CN114330542A (zh) | 一种基于目标检测的样本挖掘方法、装置及存储介质 | |
CN112989869B (zh) | 人脸质量检测模型的优化方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |