CN103544506A - 一种基于卷积神经网络的图像分类方法和装置 - Google Patents
一种基于卷积神经网络的图像分类方法和装置 Download PDFInfo
- Publication number
- CN103544506A CN103544506A CN201310477564.XA CN201310477564A CN103544506A CN 103544506 A CN103544506 A CN 103544506A CN 201310477564 A CN201310477564 A CN 201310477564A CN 103544506 A CN103544506 A CN 103544506A
- Authority
- CN
- China
- Prior art keywords
- classification
- image
- neural network
- image pattern
- pattern data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于卷积神经网络的图像分类方法和装置,所述方法通过接收输入的多个类别的图像样本,计算出每一个类别的图像对应的神经网络权值;采用分层结构对多个类别图像的对应神经网络权值进行分布,每一层形成对应的学习库;对输入的测试类别图像样本数据进行处理得到对应的一维特征描述,将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习,从而判断出所述测试类别是否在所学习的类别图像中;通过分层分布的结构解决了传统卷积神经网络在分类数量上的局限性,防止了卷积神经网络的过学习问题,扩大了卷积神经网络本身的分类能力,并提高了分类的精确性,使得图像分类算法在新的环境中具有更高的鲁棒性。
Description
技术领域
本发明涉及图像分类方法技术领域,尤其涉及的是一种基于卷积神经网络的图像分类方法和装置。
背景技术
现有的图像分类方法,常用的分类方法有监督学习方法譬如神经网络和支持向量机等、非监督学习方法譬如K均值聚类和近邻法等。传统神经网络属于监督学习方法,是通过对已有样本学习的基础上获取到所学对象的神经网络权值特征描述,并根据所学到的知识对外界环境中已学习的库的类别进行区分判断,但由于所学习的对象特征知识的有限性,对于外界变化环境中的测试对象,有可能会超出原来已有的学习知识范围,使得对所学对象在新的复杂环境下的识别分类效果不好。
进一步地,由于现有方式采用的非对称映射矩阵,该矩阵的维数决定了基于该结构的卷积神经网络所能进行分类的数量,当在对于较多图像类别进行分类的过程中往往会造成神经网络本身因为数据过多、对所学的某些类别无法进行学习和识别,导致出现神经网络学习过程中常见的“over fitting”问题,即过学习问题。
因此,现有技术还有待于改进和发展。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种基于卷积神经网络的图像分类方法和装置,旨在解决现有的神经网络图像分类方法分类效果不好、容易产生过学习现象的问题。
本发明解决技术问题所采用的技术方案如下:
一种基于卷积神经网络的图像分类方法,其中,包括以下步骤:
A、接收输入的多个类别的图像样本,对输入的每一个类别的图像样本数据进行归一化,将归一化后的图像样本数据进行卷积,再采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射,并将映射后的图像样本数据进行排列得到对应的一维特征描述,根据所述一维特征描述计算出每一个类别的图像对应的神经网络权值;
B、采用分层结构对多个类别图像的对应神经网络权值进行分布,且每一层分布的类别数目为根据所述非对称映射矩阵确定的最大区分类别数目,将多个类别图像在多层中依次分布,每一层形成对应的学习库;
C、对输入的测试类别图像样本数据进行处理得到对应的一维特征描述,将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习,从而判断出所述测试类别是否在所学习的类别图像中。
所述的基于卷积神经网络的图像分类方法,其中,所述步骤A具体包括:
A1、接收输入的多个类别的图像样本,将输入的每一个类别的图像样本数据进行归一化;
A2、对归一化的图像样本数据进行卷积,得到相应的多个卷积结果;
A3、对多个卷积结果进行一半的降采样;
A4、对降采样后的卷积结果进行再次卷积,并采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射;
A5、对映射后的图像样本数据进行一半的降采样,并对降采样的结果进行排列得到该图像的一维特征描述;
A6、对所述一维特征描述进行预订的降采样得到缩减后的特征向量;
A7、将所述特征向量输入神经网络,进入神经网络的学习过程,进行前馈学习和BP反馈方式调节,得到相应的神经网络权值。
所述的基于卷积神经网络的图像分类方法,其中,所述步骤B具体包括:
B1、对N个类别的图像样本,根据所述非对称映射矩阵确定的最大区分类别数目M;
B2、建立NUM层学习类别,NUM为(N/(M-1))且为(N/(M-1))取向上的整数;
B3、对于每一层,采用最大区分类别数目M个类别来构建,依次在NUM层中来完成N个类别的分布;
B4、通过卷积神经网络来对每一层进行学习并形成每一层所对应的学习库。
所述的基于卷积神经网络的图像分类方法,其中,所述步骤B还包括:
B5、当有新的类别加入时,放入最后一组分层中并对该层重新进行学习形成新的学习库。
所述的基于卷积神经网络的图像分类方法,其中,所述步骤C具体包括:
C1、对输入的测试类别图像样本数据进行处理得到对应的一维特征描述;
C2、进入第i层,其中i=1,2,3……NUM,i初始化为1,即将测试类别图像样本数据对应的一维特征描述与所述第i层对应的学习库中的神经网络权值进行前馈学习,若能区分出类别出来则给出结果,并退出该层;若不能分类,则认为所述测试类别是该层中未学习的类别;
C3、进入下一层,即第i+1层,重复进行前馈学习,若能区分出类别出来则给出结果,并退出该层;若不能分类,则认为所述测试类别是该层中未学习的类别;直至第NUM层,若在最后也没有被识别出来,则所测试的类别不在所学习的类别当中。
一种基于卷积神经网络的图像分类装置,其中,包括:
神经网络权值获取模块,用于接收输入的多个类别的图像样本,对输入的每一个类别的图像样本数据进行归一化,将归一化后的图像样本数据进行卷积,再采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射,并将映射后的图像样本数据进行排列得到对应的一维特征描述,根据所述一维特征描述计算出每一个类别的图像对应的神经网络权值;
分层模块,用于采用分层结构对多个类别图像的对应神经网络权值进行分布,且每一层分布的类别数目为根据所述非对称映射矩阵确定的最大区分类别数目,将多个类别图像在多层中依次分布,每一层形成对应的学习库;
分类判断模块,用于对输入的测试类别图像样本数据进行处理得到对应的一维特征描述,将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习,从而判断出所述测试类别是否在所学习的类别图像中。
所述的基于卷积神经网络的图像分类装置,其中,所述神经网络权值获取模块具体包括:
归一化单元,用于接收输入的多个类别的图像样本,将输入的每一个类别的图像样本数据进行归一化;
第一卷积单元,用于对归一化的图像样本数据进行卷积,得到相应的多个卷积结果;
第一降采样单元,用于对多个卷积结果进行一半的降采样;
第二卷积单元,用于对降采样后的卷积结果进行再次卷积;
映射单元,用于采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射;
第二降采样单元,用于对映射后的图像样本数据进行一半的降采样;
一维特征描述获取单元,用于对降采样的结果进行排列得到该图像的一维特征描述;
第三降采样单元,用于对所述一维特征描述进行预订的降采样得到缩减后的特征向量;
学习单元,用于将所述特征向量输入神经网络,进入神经网络的学习过程,进行前馈学习和BP反馈方式调节,得到相应的神经网络权值。
所述的基于卷积神经网络的图像分类装置,其中,所述分层模块具体包括:
层数确定单元,用于对N个类别的图像样本,根据所述非对称映射矩阵确定的最大区分类别数目M;建立NUM层学习类别,NUM为(N/(M-1))且为(N/(M-1))取向上的整数;
分层分布单元,用于对于每一层,采用最大区分类别数目M个类别来构建,依次在NUM层中来完成N个类别的分布;
学习库生成单元,用于通过卷积神经网络来对每一层进行学习并形成每一层所对应的学习库。
所述的基于卷积神经网络的图像分类装置,其中,所述分层模块还包括:
更新单元,用于当有新的类别加入时,放入最后一组分层中并对该层重新进行学习形成新的学习库。
本发明所提供的一种基于卷积神经网络的图像分类方法和装置,有效地解决了现有的神经网络图像分类方法分类效果不好、容易产生过学习的问题,其方法通过接收输入的多个类别的图像样本,计算出每一个类别的图像对应的神经网络权值;采用分层结构对多个类别图像的对应神经网络权值进行分布;对输入的测试类别图像样本数据进行处理得到对应的一维特征描述,将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习,从而判断出所述测试类别是否在所学习的类别图像中,通过对卷积神经网络本身结构进行改进设计,提升了其原有的分类能力,使得所分类的类别远远大于传统的卷积神经网络本身分类能力,使得卷积神经网络对于外界的变化适应能力更好,很好的解决了因新的未知环境变化造成图像分类识别的能力下降的问题及对于卷积神经网络在大量类别样本学习过程中所产生的过学习问题,其实现方法简单,通过软件实现,成本较低。
附图说明
图1为本发明提供的基于卷积神经网络的图像分类方法较佳实施例的流程图。
图2为本发明提供的基于卷积神经网络的图像分类方法较佳实施例中获取神经网络权值的神经网络结构示意图。
图3为本发明提供的基于卷积神经网络的图像分类方法较佳实施例中分层结构的结构示意图。
图4为本发明提供的基于卷积神经网络的图像分类方法较佳实施例中测试类别的流程图。
图5为本发明提供的基于卷积神经网络的图像分类方法较佳实施例中增加学习类别的结构示意图。
图6为本发明提供的基于卷积神经网络的图像分类方法应用实施例中分层结构的结构示意图。
图7为本发明提供的基于卷积神经网络的图像分类装置较佳实施例的结构框图。
具体实施方式
本发明提供一种基于卷积神经网络的图像分类方法和装置,为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,图1为本发明提供的基于卷积神经网络的图像分类方法较佳实施例的流程图,所述图像分类方法包括以下步骤:
步骤S100、接收输入的多个类别的图像样本,对输入的每一个类别的图像样本数据进行归一化,将归一化后的图像样本数据进行卷积,再采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射,并将映射后的图像样本数据进行排列得到对应的一维特征描述,根据所述一维特征描述计算出每一个类别的图像对应的神经网络权值;
步骤S200、采用分层结构对多个类别图像的对应神经网络权值进行分布,且每一层分布的类别数目为根据所述非对称映射矩阵确定的最大区分类别数目,将多个类别图像在多层中依次分布,每一层形成对应的学习库;
步骤S300、对输入的测试类别图像样本数据进行处理得到对应的一维特征描述,将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习,从而判断出所述测试类别是否在所学习的类别图像中。
以下结合具体的实施例对上述步骤进行详细的描述。
在步骤S100中,对多个类别的图像样本进行神经学习,从而得出每一个类别的图像对应的神经网络权值。具体来说,所述步骤S100包括:S110、接收输入的多个类别的图像样本,将输入的每一个类别的图像样本数据进行归一化;S120、对归一化的图像样本数据进行卷积,得到相应的多个卷积结果;S130、对多个卷积结果进行一半的降采样;S140、对降采样后的卷积结果进行再次卷积,并采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射;S150、对映射后的图像样本数据进行一半的降采样,并对降采样的结果进行排列得到该图像的一维特征描述;S160、对所述一维特征描述进行预订的降采样得到缩减后的特征向量;S170、将所述特征向量输入神经网络,进入神经网络的学习过程,进行前馈学习和BP反馈方式调节,得到相应的神经网络权值。
在实际应用时,请参阅图2,图2为本发明提供的基于卷积神经网络的图像分类方法较佳实施例中获取神经网络权值的神经网络结构示意图,如图2所示,对输入的某一类的图像样本数据,也就是对实际情况获取到对应的学习图像表示为: ,其中 表示样本图像的特征描述, 是一个二维矩阵; 是 所对应的标签,用于区分不同的 ;n为正整数,表示样本的总数。首先对对输入的数据 进行归一化,归一到[-1 1],再对归一化后的图像采用相应的参数来进行卷积,卷积的目的是为了更好体现出数据的特征,减少数据处理总量。
具体来说,卷积的图像可以是4个也可是6个也可以是8个不等,这里需要根据实际情况对卷积的个数进行设定,可以设为C_num,请继续参阅图2,此处以得到四个卷积后的图像为例进行说明,这里采用大小为kernel_num*kernel_num的卷积核对归一化后的图像进行卷积。在实际应用时,这里kernel_num=3,也可以根据具体的实际应用对图像的卷积核大小进行设置,但要保证核的宽高相等,卷积核里面的数值为随机生成0到1的数构成的卷积核进行卷积,因为是四个卷积的图像,所以需要生成四组不同随机数kernel_num*kernel_num的卷积核。所述卷积核为一行和列相同的矩阵,且矩阵中每一个数字均是在0和1之间随机生成的数字。
然后,对这个四个卷积结果C1_1、C1_2、C1_3和C1_4分别进行一半的降采样得到对应的S1_1、S1_2、S1_3和S1_4。若设置卷积个数为C_num,那么对应的卷积结果为C1_1,C1_2,C1_3……C1_C_num,而对应进行一半的降采样的结果是S1_1,S1_2,S1_3,……S1_C_num。
请继续参阅图2,对于S1层到C2层之间,再次对S1层的数据进行卷积从而得到C2层的结果,但是所选用的卷积核的大小是小于等于kernel_num,同时该处的卷积核中的数据也是随机生成的0到1的数,也就是说C2层的卷积块要相对C1层的卷积块小,并且S1与C2层之间还采用了一预定的非对称的映射矩阵来进行映射。
再对映射后的图像样本数据进行一半的降采样,也就是对C2层的图像数据进行一半的降采样,从而得到S2层。再对S2层中的每一个降采样后的图像,把它们按照图像从左到右,从上到下,从第一张到最后一张进行排列得到该图像的一个一维特征描述S_feature,该一维向量大小为S2_num*S2_width*S2_high,其中,S2_num为S2层中的降采样后图像的数量,S2_width为降采样后每张图片的像素宽度,S2_high为降采样后每张图片的像素高度。对所形成的该特征S_feature向量进行适当的降采样得到缩减后的特征向量feature,其中feature的维数为S_feature维数的90%,主要是为了保留各卷积图像的主要特征。
再把得到的一维向量feature作为神经网络的输入,进入神经网络的学过程,该神经网络的结果可以采用传统的三层神经网络来实现,只是在构建神经网络的输出层的时候要保证输出的维数与要进行图像分类的特征数一致。同时对于输出层在其输出的地方采用RBF函数来实现,此乃神经网络常用结构,此处不再详述。在对某一类别的图像样本进行神经学习的过程中除了进行前馈学习外,也同样要进行BP(Back Propagation,反向传播)反馈方式的学习,从而能保证最后所学习到的神经网络权值能对所有所学样本进行很好的权值调整和描述。
本发明通过上述步骤便可对多个类别图像进行前馈学习和BP反馈方式调节,得到每一类别图像对应的神经网络权值,但由于所述预定的非对称映射矩阵的维数决定了基于该结构的卷积神经网络所能进行分类的数量,也就是最大区分类别数目。当在对较多图像类别进行分类的过程中,往往会造成神经网络本身因为数据过多、对所学的某些类别无法进行学习和识别,即是神经网络学习过程中常见的过学习问题,因此,本发明将多个类别图像以及对应的神经网络权值分层分布,以解决该在方法下的过学习问题。
具体来说,所述步骤S200包括:S210、对N个类别的图像样本,根据所述非对称映射矩阵确定的最大区分类别数目M;S220、建立NUM层学习类别,NUM为(N/(M-1))且为(N/(M-1))取向上的整数;S230、对于每一层,采用最大区分类别数目M个类别来构建,依次在NUM层中来完成N个类别的分布;S240、通过卷积神经网络来对每一层进行学习并形成每一层所对应的学习库。其中,N、M、NUM均为正整数。
在实际应用时,所述非对称矩阵确定该卷积网络所能区分的类别为最大区分类别数目M,而对多个类别的图像样本进行学习的类别数为N,若N≤M,则表明学习的类别数目小于最大区分类别数目;若N>M,表明当前卷积网络的图像区分能力只有M个,而有N-M个图像类别无法进行学习和识别。
为了实现对N个类别在保持学习样本不变的情况下确保神经网络的过学习问题不产生,请参阅图3,图3为本发明提供的基于卷积神经网络的图像分类方法较佳实施例中分层结构的结构示意图,如图3所示,本发明分层分布多个类别图像以及对应的神经网络权值,建立NUM层学习类别,NUM为(N/(M-1))且为(N/(M-1))取向上的整数,确定下了所建立模式分类的层数为NUM层;对于每一层,采用 M个类别来构建,依次在NUM层中来完成N个类别的分布,如图3所示;对于每一层,采用卷积神经网络的来完成每一层的学习并形成每一层所对应的学习库,具体通过前馈学习和BP反馈方式调节,得到每一类别图像对应的神经网络权值,所述学习库即是在该层中不同类别及其对应的神经网络权值,譬如第一层通过卷积神经网络的方法来训练得到的学习库为W_1,W_2,……W_M,第NUM层通过卷积神经网络学习方法来训练得到的学习库为:W_[(NUM-1)*M+1], W_[(NUM-1)*M+1],……W_[N]。
然后在步骤S300中,对输入的测试类别图像样本数据通过步骤S100同样的处理得到对应的一维特征描述,具体来说应该是通过步骤S110~S150的处理从而得到测试类别图像相应的一维特征描述,再将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习,从而判断出所述测试类别是否在所学习的类别图像中。
请参阅图4,图4为本发明提供的基于卷积神经网络的图像分类方法较佳实施例中测试类别的流程图,如图所示,具体来说,所述步骤S300包括:S310、对输入的测试类别图像样本数据进行处理得到对应的一维特征描述;S320、进入第i层,其中i=1,2,3……NUM,i初始化为1,即将测试类别图像样本数据对应的一维特征描述与所述第i层对应的学习库中的神经网络权值进行前馈学习,若能区分出类别出来则给出结果,并退出该层;若不能分类,则认为所述测试类别是该层中未学习的类别;S330、进入下一层,即第i+1层,重复进行前馈学习,若能区分出类别出来则给出结果,并退出该层;若不能分类,则认为所述测试类别是该层中未学习的类别;直至第NUM层,若在最后也没有被识别出来,则所测试的类别不在所学习的类别当中。
在实际应用时,当有测试类别需要区分时,先进入第i层(i=1,2,3……NUM,其中i初始化为1),若能区分出类别出来则给出结果,并退出该层,若不能分类,则认为是该层中未学习的类别,进入下一层(i=i+1),直至最后一层的类识别完,若在最后也没有被识别出来,那么就说明所测试的类别并不在所学习的类当中。
本发明采用具有分层结构的卷积神经网络,该技术是相对于传统的神经网络对数据更好的抽象分析能力,并且对于传统的分类,在特征的提取上能获取到更深层次的信息。本发明通过对卷积神经网络本身结构上进行改进设计,提升了其原有的分类能力,使得卷积神经网络对于外界的变化适应能力更好,能实现一定程度的在线学习,降低了本身作为监督学习的局限性,提升了对图像分类的类别能力和分类过程中的鲁棒性,同时也提升了该方法在未知环境中的适应能力,对于未知情况具有更准确的区分能力。本发明提供的图像分类算法在新的环境中具有很好的鲁棒性,同时引入分层策略使得在具有相同特性的类别中区分度加大,防止了神经网络的“over fitting”(过学习)问题。
优选地,请参阅图5,图5为本发明提供的基于卷积神经网络的图像分类方法较佳实施例中增加学习类别的结构示意图,如图所示,所述步骤S200还包括:S250、当有新的类别加入时,放入最后一组分层中并对该层重新进行学习形成新的学习库。具体来说,当有新的类别加入时,直接放入最后一组分层的样本中并只对该层的样本重新进行学习,即再对该层的样本进行前馈学习和BP反馈方式调节,得到最后一组分层中每一类别图像对应的神经网络权值,并在该层形成新的一组学习库;如在第NUM层中加入了新的一个类别,总类别为N+1,通过对第NUM层的卷积神经网络的学习得到了对应的新的神经网络权值:W’_[(NUM-1)*M+1],W’_[(NUM-1)*M+1],……W’_[N],W’_[N+1]。其中W’是区分与之前所学习的神经网络权值W。
以下以一具体的应用实施例,对本发明的详细流程进行详细说明。
请一并参阅图1、图2和图6,其中,图6为本发明提供的基于卷积神经网络的图像分类方法应用实施例中分层结构的结构示意图,具体来说,以下是采用本发明提供的图像分类方法对商品Logo图标的在外界环境中进行识别。通过对商品Logo进行采样,获取到45种相应的商品Logo图标,其中每个图标的数量为1000张,这1000张包括了Logo在不同环境下的图像。对这45种标签采用数字进行标记区分,分别标记为1,2,3…45,表示为,其中i=1,2…..45表示种类,j=1,2,3……1000表示的是某一类图像的张数。其中表示第i类中的第j个的图像,表示第i类的标签(=1,2,3……1000)。然后把作为样本,传入卷积神经网络中进行学习并得到对应的学习库,即神经网络权值。实际应用时图像样本大小为54*131。先把传入的样本数据进行归一化到[-1,1],设置C1_num=4对图像进行卷积,获取到图像C1_1、C1_2、C1_3和C1_4。C1_num=4是通过实验和实际应用得到的。再设置kernel_num=3,即采用大小为3*3 里面的数值为随机生成0到1的数构成的卷积核进行卷积。因为是四个数据,所以生成四个不同随机数的3*3卷积核。所述kernel_num=3,是在实验和实际应用中分析得到的。再对这个四个卷积结果C1_1、C1_2、C1_3、C1_4分别进行一半的降采样得到对应的S1_1、S1_2、S1_3、S1_4。然后采用同样的卷积方法对S1层进行卷积得到C2层,也就是产生不同的随机数来构成卷积核但卷积核大小要比第一次卷积的卷积核小,譬如可采用2*2卷积核,并且S1到C2层还采用一种非对称映射矩阵来映射生成,所述非对称映射矩阵乃现有技术,举例说明如下。
对于非对称矩阵如表1所示,这里并结合图2来理解:
表1
从表1中可以看到,表格最左边的列标记为S1_1-S1_4对应于图2中的S1_1,S1_2,S1_3,S1_4,而表格上方的C2_1到C2_11则对应于图2中的C2那一列,表中S1与C2之间画X表示对应的行列是连接的,如表中S1_1与C2_1行列对应下来有一个X则表示图2中的S1_1与C2_1之间有映射连接,没有画X则表示不连接。
然后,S2层是在C2层的基础上进行一半的降采样得到的结果,对于S2层中的每一个降采样后的图像,把它们按照图像从左到右,从上到下,从第一张到最后一张进行排列得到该图像的一个一维特征描述S_feature,该一维向量大小为S2_num*S2_width*S2_high=11*30*14=4620,由于S2层降采样后得到的图像是11张,每张图像的宽为30,高位14,所以总数为4620。对所形成的特征通过降采样保留其90%的数据,得到缩减后的特征向量为:4158,则该图像以为4158作为特征输入神经网络中,进行前馈学习,从而得到对应的神经网络权值。还利用已有的样本标签,通过BP(Back Propagation)反馈方式对得到的神经网络的权值进行调节,从而能保证最后所学习到的神经网络权值能对所有所学样本进行很好的权值调整和描述,从而保证在得到的最终神经网络权值下得到的样本学习输出与实际给定输出是一致的,此乃现有技术,此处不再详述。具体来说,就是通过某一类图像下某张图片得到一个神经网络权值,然后通过该类图像下其他图片的神经网络权值进行反馈调节,从而得到最能表现该类图像的神经网络权值。同时在设定神经网络结构的过程中保证神经网络的输出为实际的学习类别总数,但由于网络结构本身的限制使得输出的最大维数为30,30是由采用矩阵映射方法来确定的,具体来说,所述非对称映射矩阵的维数决定了基于该结构的卷积神经网络所能进行分类的数量。
由于所述非对称映射矩阵决定了该卷积神经网络的分类能力,最多在30个类别上进行区分,为了解决传统卷积神经网络在分类数量上的局限性,请继续参阅图6,对于给定的45个类别,在非对称映射矩阵下卷积网络所能区分的类别为M=30,对N个类别进行分类,N=45,建立NUM个学习类别:NUM=(N/(M-1))=(45/(30-1))=1.5517 向上取整数为:2。如图6所示,对45个类别根据卷积神经网络本身的识别类别进行了分层,分为两层,第一层为30个类别,第二层为15个类别,通过卷积神经网络的学习每层得到对应的学习库,即是:第一层学习库为:W_1,W_2,……W_30;第二层的学习库为:W_31,W_32,……W_45;当有测试类别进入时,采用图4所述的方法,对输入的测试类别图像样本数据进行处理得到对应的一维特征描述,将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习,若在第一层识别出该类别,则给出结果,若不能识别,则进入第二层,若第二层能识别出也给出结果,若不能给出,则说明该测试类别不在所学习的类当中。
传统的方法在识别商业图标的过程中,往往只能针对小量的样本类别进行识别,当样本量加大的时候往往应为卷积神经网络本身的原因未能在类别上进行扩大。本发明通过引入一种新的结构方式,即分层分布的结构解决了传统卷积神经网络在分类数量上的局限性,本发明的结构扩大了卷积神经网络本身的分类能力,并提高了分类的精确性,实现了对大量类别的样本在卷积神经网络下的学习,并且在实际情况下也能很好的保持原有的识别效果。
基于上述基于卷积神经网络的图像分类方法,本发明还提供了一种基于卷积神经网络的图像分类装置,请参阅图7,图7为本发明提供的基于卷积神经网络的图像分类装置较佳实施例的结构框图,如图7所示,所述装置包括:
神经网络权值获取模块10,用于接收输入的多个类别的图像样本,对输入的每一个类别的图像样本数据进行归一化,将归一化后的图像样本数据进行卷积,再采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射,并将映射后的图像样本数据进行排列得到对应的一维特征描述,根据所述一维特征描述计算出每一个类别的图像对应的神经网络权值;具体如步骤S100所述。
分层模块20,用于采用分层结构对多个类别图像的对应神经网络权值进行分布,且每一层分布的类别数目为根据所述非对称映射矩阵确定的最大区分类别数目,将多个类别图像在多层中依次分布,每一层形成对应的学习库;具体如步骤S200所述。
分类判断模块30,用于对输入的测试类别图像样本数据进行处理得到对应的一维特征描述,将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习,从而判断出所述测试类别是否在所学习的类别图像中;具体如步骤S300所述。
优选地,所述神经网络权值获取模块10具体包括:
归一化单元,用于接收输入的多个类别的图像样本,将输入的每一个类别的图像样本数据进行归一化;
第一卷积单元,用于对归一化的图像样本数据进行卷积,得到相应的多个卷积结果;
第一降采样单元,用于对多个卷积结果进行一半的降采样;
第二卷积单元,用于对降采样后的卷积结果进行再次卷积;
映射单元,用于采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射;
第二降采样单元,用于对映射后的图像样本数据进行一半的降采样;
一维特征描述获取单元,用于对降采样的结果进行排列得到该图像的一维特征描述;
第三降采样单元,用于对所述一维特征描述进行预订的降采样得到缩减后的特征向量;
学习单元,用于将所述特征向量输入神经网络,进入神经网络的学习过程,进行前馈学习和BP反馈方式调节,得到相应的神经网络权值。
优选地,所述分层模块20具体包括:
层数确定单元,用于对N个类别的图像样本,根据所述非对称映射矩阵确定的最大区分类别数目M;建立NUM层学习类别,NUM为(N/(M-1))且为(N/(M-1))取向上的整数;
分层分布单元,用于对于每一层,采用最大区分类别数目M个类别来构建,依次在NUM层中来完成N个类别的分布;
学习库生成单元,用于通过卷积神经网络来对每一层进行学习并形成每一层所对应的学习库。
优选地,所述分层模块20还包括:
更新单元,用于当有新的类别加入时,放入最后一组分层中并对该层重新进行学习形成新的学习库。
综上所述,本发明提供的一种基于卷积神经网络的图像分类方法和装置,所述方法通过接收输入的多个类别的图像样本,计算出每一个类别的图像对应的神经网络权值;采用分层结构对多个类别图像的对应神经网络权值进行分布,每一层形成对应的学习库;对输入的测试类别图像样本数据进行处理得到对应的一维特征描述,将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习,从而判断出所述测试类别是否在所学习的类别图像中;通过分层分布的结构解决了传统卷积神经网络在分类数量上的局限性,防止了卷积神经网络的过学习问题,扩大了卷积神经网络本身的分类能力,并提高了分类的精确性,使得图像分类算法在新的环境中具有更高的鲁棒性,实现了对大量类别的样本在卷积神经网络下的学习,并且在实际情况下也能很好的保持原有的识别效果,其实现方法简单,通过软件实现,成本较低,可广泛应用于数字家电、广告推送、数据挖掘或图像分类等应用领域。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (9)
1.一种基于卷积神经网络的图像分类方法,其特征在于,包括以下步骤:
A、接收输入的多个类别的图像样本,对输入的每一个类别的图像样本数据进行归一化,将归一化后的图像样本数据进行卷积,再采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射,并将映射后的图像样本数据进行排列得到对应的一维特征描述,根据所述一维特征描述计算出每一个类别的图像对应的神经网络权值;
B、采用分层结构对多个类别图像的对应神经网络权值进行分布,且每一层分布的类别数目为根据所述非对称映射矩阵确定的最大区分类别数目,将多个类别图像在多层中依次分布,每一层形成对应的学习库;
C、对输入的测试类别图像样本数据进行处理得到对应的一维特征描述,将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习,从而判断出所述测试类别是否在所学习的类别图像中。
2.根据权利要求1所述的基于卷积神经网络的图像分类方法,其特征在于,所述步骤A具体包括:
A1、接收输入的多个类别的图像样本,将输入的每一个类别的图像样本数据进行归一化;
A2、对归一化的图像样本数据进行卷积,得到相应的多个卷积结果;
A3、对多个卷积结果进行一半的降采样;
A4、对降采样后的卷积结果进行再次卷积,并采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射;
A5、对映射后的图像样本数据进行一半的降采样,并对降采样的结果进行排列得到该图像的一维特征描述;
A6、对所述一维特征描述进行预订的降采样得到缩减后的特征向量;
A7、将所述特征向量输入神经网络,进入神经网络的学习过程,进行前馈学习和BP反馈方式调节,得到相应的神经网络权值。
3.根据权利要求1所述的基于卷积神经网络的图像分类方法,其特征在于,所述步骤B具体包括:
B1、对N个类别的图像样本,根据所述非对称映射矩阵确定的最大区分类别数目M;
B2、建立NUM层学习类别,NUM为(N/(M-1))且为(N/(M-1))取向上的整数;
B3、对于每一层,采用最大区分类别数目M个类别来构建,依次在NUM层中来完成N个类别的分布;
B4、通过卷积神经网络来对每一层进行学习并形成每一层所对应的学习库。
4.根据权利要求1所述的基于卷积神经网络的图像分类方法,其特征在于,所述步骤B还包括:
B5、当有新的类别加入时,放入最后一组分层中并对该层重新进行学习形成新的学习库。
5.根据权利要求3所述的基于卷积神经网络的图像分类方法,其特征在于,所述步骤C具体包括:
C1、对输入的测试类别图像样本数据进行处理得到对应的一维特征描述;
C2、进入第i层,其中i=1,2,3……NUM,i初始化为1,即将测试类别图像样本数据对应的一维特征描述与所述第i层对应的学习库中的神经网络权值进行前馈学习,若能区分出类别出来则给出结果,并退出该层;若不能分类,则认为所述测试类别是该层中未学习的类别;
C3、进入下一层,即第i+1层,重复进行前馈学习,若能区分出类别出来则给出结果,并退出该层;若不能分类,则认为所述测试类别是该层中未学习的类别;直至第NUM层,若在最后也没有被识别出来,则所测试的类别不在所学习的类别当中。
6.一种基于卷积神经网络的图像分类装置,其特征在于,包括:
神经网络权值获取模块,用于接收输入的多个类别的图像样本,对输入的每一个类别的图像样本数据进行归一化,将归一化后的图像样本数据进行卷积,再采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射,并将映射后的图像样本数据进行排列得到对应的一维特征描述,根据所述一维特征描述计算出每一个类别的图像对应的神经网络权值;
分层模块,用于采用分层结构对多个类别图像的对应神经网络权值进行分布,且每一层分布的类别数目为根据所述非对称映射矩阵确定的最大区分类别数目,将多个类别图像在多层中依次分布,每一层形成对应的学习库;
分类判断模块,用于对输入的测试类别图像样本数据进行处理得到对应的一维特征描述,将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习,从而判断出所述测试类别是否在所学习的类别图像中。
7.根据权利要求6所述的基于卷积神经网络的图像分类装置,其特征在于,所述神经网络权值获取模块具体包括:
归一化单元,用于接收输入的多个类别的图像样本,将输入的每一个类别的图像样本数据进行归一化;
第一卷积单元,用于对归一化的图像样本数据进行卷积,得到相应的多个卷积结果;
第一降采样单元,用于对多个卷积结果进行一半的降采样;
第二卷积单元,用于对降采样后的卷积结果进行再次卷积;
映射单元,用于采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射;
第二降采样单元,用于对映射后的图像样本数据进行一半的降采样;
一维特征描述获取单元,用于对降采样的结果进行排列得到该图像的一维特征描述;
第三降采样单元,用于对所述一维特征描述进行预订的降采样得到缩减后的特征向量;
学习单元,用于将所述特征向量输入神经网络,进入神经网络的学习过程,进行前馈学习和BP反馈方式调节,得到相应的神经网络权值。
8.根据权利要求6所述的基于卷积神经网络的图像分类装置,其特征在于,所述分层模块具体包括:
层数确定单元,用于对N个类别的图像样本,根据所述非对称映射矩阵确定的最大区分类别数目M;建立NUM层学习类别,NUM为(N/(M-1))且为(N/(M-1))取向上的整数;
分层分布单元,用于对于每一层,采用最大区分类别数目M个类别来构建,依次在NUM层中来完成N个类别的分布;
学习库生成单元,用于通过卷积神经网络来对每一层进行学习并形成每一层所对应的学习库。
9.根据权利要求6所述的基于卷积神经网络的图像分类装置,其特征在于,所述分层模块还包括:
更新单元,用于当有新的类别加入时,放入最后一组分层中并对该层重新进行学习形成新的学习库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310477564.XA CN103544506B (zh) | 2013-10-12 | 2013-10-12 | 一种基于卷积神经网络的图像分类方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310477564.XA CN103544506B (zh) | 2013-10-12 | 2013-10-12 | 一种基于卷积神经网络的图像分类方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103544506A true CN103544506A (zh) | 2014-01-29 |
CN103544506B CN103544506B (zh) | 2017-08-08 |
Family
ID=49967941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310477564.XA Active CN103544506B (zh) | 2013-10-12 | 2013-10-12 | 一种基于卷积神经网络的图像分类方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103544506B (zh) |
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103984959A (zh) * | 2014-05-26 | 2014-08-13 | 中国科学院自动化研究所 | 一种基于数据与任务驱动的图像分类方法 |
CN104036474A (zh) * | 2014-06-12 | 2014-09-10 | 厦门美图之家科技有限公司 | 一种图像亮度和对比度的自动调节方法 |
CN104182735A (zh) * | 2014-08-18 | 2014-12-03 | 厦门美图之家科技有限公司 | 训练优化的基于卷积神经网络的色情图像或视频检测方法 |
CN104244113A (zh) * | 2014-10-08 | 2014-12-24 | 中国科学院自动化研究所 | 一种基于深度学习技术的视频摘要生成方法 |
CN104268521A (zh) * | 2014-09-23 | 2015-01-07 | 朱毅 | 一种基于非限定类别的卷积神经网络的图像识别方法 |
CN104463243A (zh) * | 2014-12-01 | 2015-03-25 | 中科创达软件股份有限公司 | 基于平均脸特征的性别检测方法 |
CN104732249A (zh) * | 2015-03-25 | 2015-06-24 | 武汉大学 | 基于流行学习和混沌粒子群的深度学习图像分类方法 |
CN105068644A (zh) * | 2015-07-24 | 2015-11-18 | 山东大学 | 一种基于卷积神经网络的p300脑电信号检测方法 |
CN105224963A (zh) * | 2014-06-04 | 2016-01-06 | 华为技术有限公司 | 可切换深度学习网络结构的方法与终端 |
CN105426883A (zh) * | 2015-12-25 | 2016-03-23 | 中国科学院深圳先进技术研究院 | 视频分类快速识别的方法及装置 |
CN105512676A (zh) * | 2015-11-30 | 2016-04-20 | 华南理工大学 | 一种智能终端上的食物识别方法 |
CN105512681A (zh) * | 2015-12-07 | 2016-04-20 | 北京信息科技大学 | 一种目标类别图片的获取方法及*** |
WO2016090520A1 (en) * | 2014-12-10 | 2016-06-16 | Xiaogang Wang | A method and a system for image classification |
WO2016112797A1 (zh) * | 2015-01-15 | 2016-07-21 | 阿里巴巴集团控股有限公司 | 一种用于确定图片陈列信息的方法及设备 |
WO2016124103A1 (zh) * | 2015-02-03 | 2016-08-11 | 阿里巴巴集团控股有限公司 | 一种图片检测方法及设备 |
CN106156846A (zh) * | 2015-03-30 | 2016-11-23 | 日本电气株式会社 | 卷积神经网络特征的处理方法和装置 |
CN106203327A (zh) * | 2016-07-08 | 2016-12-07 | 清华大学 | 基于卷积神经网络的肺部肿瘤识别***及方法 |
CN106529564A (zh) * | 2016-09-26 | 2017-03-22 | 浙江工业大学 | 一种基于卷积神经网络的食物图像自动分类方法 |
CN106548201A (zh) * | 2016-10-31 | 2017-03-29 | 北京小米移动软件有限公司 | 卷积神经网络的训练方法、图像识别方法及装置 |
CN107077625A (zh) * | 2014-10-27 | 2017-08-18 | 电子湾有限公司 | 分层深卷积神经网络 |
CN107123027A (zh) * | 2017-04-28 | 2017-09-01 | 广东工业大学 | 一种基于深度学习的化妆品推荐方法及*** |
WO2017181723A1 (zh) * | 2016-04-20 | 2017-10-26 | 广州视源电子科技股份有限公司 | 细纱断裂的检测方法和*** |
CN107451996A (zh) * | 2017-07-26 | 2017-12-08 | 广州慧扬健康科技有限公司 | 应用于皮肤癌识别的深度学习训练*** |
CN108765035A (zh) * | 2018-06-19 | 2018-11-06 | 北京奇艺世纪科技有限公司 | 一种广告图像特征提取方法、装置及电子设备 |
CN109978058A (zh) * | 2019-03-28 | 2019-07-05 | 腾讯科技(深圳)有限公司 | 确定图像分类的方法、装置、终端及存储介质 |
CN110573859A (zh) * | 2017-04-13 | 2019-12-13 | 美国西门子医学诊断股份有限公司 | 用于使用卷积神经网络的hiln表征的方法和装置 |
TWI688276B (zh) * | 2019-03-06 | 2020-03-11 | 明新科技大學 | 機率式類神經網路為色彩影像感測器特性化的方法 |
CN111052128A (zh) * | 2017-06-12 | 2020-04-21 | 矿业电信学校集团 | 用于检测和定位视频中的对象的描述符学习方法 |
CN111368852A (zh) * | 2018-12-26 | 2020-07-03 | 沈阳新松机器人自动化股份有限公司 | 基于深度学习的物品识别预分拣***、方法及机器人 |
CN111401396A (zh) * | 2019-01-03 | 2020-07-10 | 阿里巴巴集团控股有限公司 | 图像识别方法及装置 |
CN111950723A (zh) * | 2019-05-16 | 2020-11-17 | 武汉Tcl集团工业研究院有限公司 | 神经网络模型训练方法、图像处理方法、装置及终端设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090210218A1 (en) * | 2008-02-07 | 2009-08-20 | Nec Laboratories America, Inc. | Deep Neural Networks and Methods for Using Same |
CN101681449A (zh) * | 2007-06-15 | 2010-03-24 | 佳能株式会社 | 计算处理装置及方法 |
US20110222724A1 (en) * | 2010-03-15 | 2011-09-15 | Nec Laboratories America, Inc. | Systems and methods for determining personal characteristics |
CN103279759A (zh) * | 2013-06-09 | 2013-09-04 | 大连理工大学 | 一种基于卷积神经网络的车辆前方可通行性分析方法 |
-
2013
- 2013-10-12 CN CN201310477564.XA patent/CN103544506B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101681449A (zh) * | 2007-06-15 | 2010-03-24 | 佳能株式会社 | 计算处理装置及方法 |
US20090210218A1 (en) * | 2008-02-07 | 2009-08-20 | Nec Laboratories America, Inc. | Deep Neural Networks and Methods for Using Same |
US20110222724A1 (en) * | 2010-03-15 | 2011-09-15 | Nec Laboratories America, Inc. | Systems and methods for determining personal characteristics |
CN103279759A (zh) * | 2013-06-09 | 2013-09-04 | 大连理工大学 | 一种基于卷积神经网络的车辆前方可通行性分析方法 |
Cited By (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103984959B (zh) * | 2014-05-26 | 2017-07-21 | 中国科学院自动化研究所 | 一种基于数据与任务驱动的图像分类方法 |
CN103984959A (zh) * | 2014-05-26 | 2014-08-13 | 中国科学院自动化研究所 | 一种基于数据与任务驱动的图像分类方法 |
CN105224963B (zh) * | 2014-06-04 | 2019-06-07 | 华为技术有限公司 | 可切换深度学习网络结构的方法与终端 |
CN105224963A (zh) * | 2014-06-04 | 2016-01-06 | 华为技术有限公司 | 可切换深度学习网络结构的方法与终端 |
CN104036474A (zh) * | 2014-06-12 | 2014-09-10 | 厦门美图之家科技有限公司 | 一种图像亮度和对比度的自动调节方法 |
CN104036474B (zh) * | 2014-06-12 | 2017-12-19 | 厦门美图之家科技有限公司 | 一种图像亮度和对比度的自动调节方法 |
CN104182735A (zh) * | 2014-08-18 | 2014-12-03 | 厦门美图之家科技有限公司 | 训练优化的基于卷积神经网络的色情图像或视频检测方法 |
CN104268521A (zh) * | 2014-09-23 | 2015-01-07 | 朱毅 | 一种基于非限定类别的卷积神经网络的图像识别方法 |
CN104244113A (zh) * | 2014-10-08 | 2014-12-24 | 中国科学院自动化研究所 | 一种基于深度学习技术的视频摘要生成方法 |
CN107077625A (zh) * | 2014-10-27 | 2017-08-18 | 电子湾有限公司 | 分层深卷积神经网络 |
CN104463243A (zh) * | 2014-12-01 | 2015-03-25 | 中科创达软件股份有限公司 | 基于平均脸特征的性别检测方法 |
CN104463243B (zh) * | 2014-12-01 | 2017-09-29 | 中科创达软件股份有限公司 | 基于平均脸特征的性别检测方法 |
CN107004142A (zh) * | 2014-12-10 | 2017-08-01 | 北京市商汤科技开发有限公司 | 用于图像分类的方法和*** |
WO2016090520A1 (en) * | 2014-12-10 | 2016-06-16 | Xiaogang Wang | A method and a system for image classification |
WO2016112797A1 (zh) * | 2015-01-15 | 2016-07-21 | 阿里巴巴集团控股有限公司 | 一种用于确定图片陈列信息的方法及设备 |
CN105843816A (zh) * | 2015-01-15 | 2016-08-10 | 阿里巴巴集团控股有限公司 | 一种用于确定图片陈列信息的方法及设备 |
WO2016124103A1 (zh) * | 2015-02-03 | 2016-08-11 | 阿里巴巴集团控股有限公司 | 一种图片检测方法及设备 |
CN104732249A (zh) * | 2015-03-25 | 2015-06-24 | 武汉大学 | 基于流行学习和混沌粒子群的深度学习图像分类方法 |
CN106156846A (zh) * | 2015-03-30 | 2016-11-23 | 日本电气株式会社 | 卷积神经网络特征的处理方法和装置 |
CN106156846B (zh) * | 2015-03-30 | 2018-12-25 | 日本电气株式会社 | 卷积神经网络特征的处理方法和装置 |
CN105068644A (zh) * | 2015-07-24 | 2015-11-18 | 山东大学 | 一种基于卷积神经网络的p300脑电信号检测方法 |
CN105512676A (zh) * | 2015-11-30 | 2016-04-20 | 华南理工大学 | 一种智能终端上的食物识别方法 |
CN105512681A (zh) * | 2015-12-07 | 2016-04-20 | 北京信息科技大学 | 一种目标类别图片的获取方法及*** |
CN105426883B (zh) * | 2015-12-25 | 2019-03-01 | 中国科学院深圳先进技术研究院 | 视频分类快速识别的方法及装置 |
CN105426883A (zh) * | 2015-12-25 | 2016-03-23 | 中国科学院深圳先进技术研究院 | 视频分类快速识别的方法及装置 |
WO2017181723A1 (zh) * | 2016-04-20 | 2017-10-26 | 广州视源电子科技股份有限公司 | 细纱断裂的检测方法和*** |
CN106203327A (zh) * | 2016-07-08 | 2016-12-07 | 清华大学 | 基于卷积神经网络的肺部肿瘤识别***及方法 |
CN106203327B (zh) * | 2016-07-08 | 2019-04-19 | 清华大学 | 基于卷积神经网络的肺部肿瘤识别***及方法 |
CN106529564A (zh) * | 2016-09-26 | 2017-03-22 | 浙江工业大学 | 一种基于卷积神经网络的食物图像自动分类方法 |
CN106529564B (zh) * | 2016-09-26 | 2019-05-31 | 浙江工业大学 | 一种基于卷积神经网络的食物图像自动分类方法 |
CN106548201B (zh) * | 2016-10-31 | 2020-07-21 | 北京小米移动软件有限公司 | 卷积神经网络的训练方法、图像识别方法及装置 |
CN106548201A (zh) * | 2016-10-31 | 2017-03-29 | 北京小米移动软件有限公司 | 卷积神经网络的训练方法、图像识别方法及装置 |
CN110573859B (zh) * | 2017-04-13 | 2022-07-26 | 美国西门子医学诊断股份有限公司 | 用于使用卷积神经网络的hiln表征的方法和装置 |
CN110573859A (zh) * | 2017-04-13 | 2019-12-13 | 美国西门子医学诊断股份有限公司 | 用于使用卷积神经网络的hiln表征的方法和装置 |
CN107123027A (zh) * | 2017-04-28 | 2017-09-01 | 广东工业大学 | 一种基于深度学习的化妆品推荐方法及*** |
CN111052128A (zh) * | 2017-06-12 | 2020-04-21 | 矿业电信学校集团 | 用于检测和定位视频中的对象的描述符学习方法 |
CN111052128B (zh) * | 2017-06-12 | 2024-04-05 | 矿业电信学校集团 | 用于检测和定位视频中的对象的描述符学习方法 |
CN107451996A (zh) * | 2017-07-26 | 2017-12-08 | 广州慧扬健康科技有限公司 | 应用于皮肤癌识别的深度学习训练*** |
CN108765035A (zh) * | 2018-06-19 | 2018-11-06 | 北京奇艺世纪科技有限公司 | 一种广告图像特征提取方法、装置及电子设备 |
CN111368852A (zh) * | 2018-12-26 | 2020-07-03 | 沈阳新松机器人自动化股份有限公司 | 基于深度学习的物品识别预分拣***、方法及机器人 |
CN111401396A (zh) * | 2019-01-03 | 2020-07-10 | 阿里巴巴集团控股有限公司 | 图像识别方法及装置 |
CN111401396B (zh) * | 2019-01-03 | 2023-04-18 | 阿里巴巴集团控股有限公司 | 图像识别方法及装置 |
TWI688276B (zh) * | 2019-03-06 | 2020-03-11 | 明新科技大學 | 機率式類神經網路為色彩影像感測器特性化的方法 |
CN109978058A (zh) * | 2019-03-28 | 2019-07-05 | 腾讯科技(深圳)有限公司 | 确定图像分类的方法、装置、终端及存储介质 |
CN109978058B (zh) * | 2019-03-28 | 2023-08-04 | 腾讯科技(深圳)有限公司 | 确定图像分类的方法、装置、终端及存储介质 |
CN111950723A (zh) * | 2019-05-16 | 2020-11-17 | 武汉Tcl集团工业研究院有限公司 | 神经网络模型训练方法、图像处理方法、装置及终端设备 |
CN111950723B (zh) * | 2019-05-16 | 2024-05-21 | 武汉Tcl集团工业研究院有限公司 | 神经网络模型训练方法、图像处理方法、装置及终端设备 |
Also Published As
Publication number | Publication date |
---|---|
CN103544506B (zh) | 2017-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103544506A (zh) | 一种基于卷积神经网络的图像分类方法和装置 | |
Iwana et al. | Judging a book by its cover | |
CN106290378B (zh) | 缺陷分类方法和缺陷检查*** | |
CN103559504B (zh) | 图像目标类别识别方法及装置 | |
CN108334805B (zh) | 检测文档阅读顺序的方法和装置 | |
CN108304876A (zh) | 分类模型训练方法、装置及分类方法及装置 | |
CN107683469A (zh) | 一种基于深度学习的产品分类方法及装置 | |
JP2004047939A (ja) | 欠陥分類器の生成方法および欠陥自動分類方法 | |
CN109117879A (zh) | 图像分类方法、装置及*** | |
CN110503161B (zh) | 一种基于弱监督yolo模型的矿石泥团目标检测方法和*** | |
CN102385592B (zh) | 图像概念的检测方法和装置 | |
CN111062296B (zh) | 一种基于计算机的白细胞自动识别分类方法 | |
CN111723815B (zh) | 模型训练方法、图像处理方法、装置、计算机***和介质 | |
CN112163520B (zh) | 一种基于改进损失函数的mdssd人脸检测方法 | |
CN112819063B (zh) | 一种基于改进的Focal损失函数的图像识别方法 | |
CN112488229A (zh) | 一种基于特征分离和对齐的域自适应无监督目标检测方法 | |
CN114090770B (zh) | 一种多阶段的无监督域适应因果关系识别方法 | |
JP2017054331A (ja) | 画像分類方法、分類器の構成方法および画像分類装置 | |
CN117011563B (zh) | 基于半监督联邦学习的道路损害巡检跨域检测方法及*** | |
CN115546525A (zh) | 多视图聚类方法、装置、电子设备及存储介质 | |
CN115249313A (zh) | 一种基于元模块融合增量学习的图像分类方法 | |
CN111414930B (zh) | 深度学习模型训练方法及装置、电子设备及存储介质 | |
CN107704509A (zh) | 一种联合稳定区域与深度学习的重排序方法 | |
CN107729918A (zh) | 基于代价敏感支持向量机的元胞自动机涌现现象的分类方法 | |
CN105160358A (zh) | 一种图像分类方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |