CN106372656B - 获取深度一次性学习模型的方法、图像识别方法及装置 - Google Patents

获取深度一次性学习模型的方法、图像识别方法及装置 Download PDF

Info

Publication number
CN106372656B
CN106372656B CN201610761364.0A CN201610761364A CN106372656B CN 106372656 B CN106372656 B CN 106372656B CN 201610761364 A CN201610761364 A CN 201610761364A CN 106372656 B CN106372656 B CN 106372656B
Authority
CN
China
Prior art keywords
dimensionality reduction
image
characteristic pattern
image set
pattern image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610761364.0A
Other languages
English (en)
Other versions
CN106372656A (zh
Inventor
史方
邹佳运
王标
樊强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gao Qianwen
Original Assignee
Tong Wei Technology (shenzhen) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tong Wei Technology (shenzhen) Co Ltd filed Critical Tong Wei Technology (shenzhen) Co Ltd
Priority to CN201610761364.0A priority Critical patent/CN106372656B/zh
Publication of CN106372656A publication Critical patent/CN106372656A/zh
Application granted granted Critical
Publication of CN106372656B publication Critical patent/CN106372656B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种获取深度一次性学习模型的方法、图像识别方法及装置,获取深度一次性学习模型的方法包括:将包含少量目标图像和背景图像的预设数据集中每一幅目标图像输入预设CNN模型,选择预设CNN模型隐含层中任一层输出图像作为该目标图像的特征图像集;采用预设数据集中背景图像,通过PCA方法确定降维矩阵,对所有特征图像集进行降维,生成降维特征图像集;将所有降维特征图像集输入预设贝叶斯学习模型,对降维特征图像集对应的目标图像进行识别,构建深度一次性学习模型;采用预设数据集对深度一次性学习模型进行训练,直到模型收敛,获取收敛后的深度一次性学习模型。采用收敛后的深度一次性学习模型对图像进行识别,识别率较高。

Description

获取深度一次性学习模型的方法、图像识别方法及装置
技术领域
本发明涉及图像识别技术领域,尤其涉及一种获取深度一次性学习模型的方法、图像识别方法及装置。
背景技术
现有技术中,想要对待识别图像进行识别分类时,可以采用训练好的各类网络学习模型对待识别图像进行识别分类,例如:可以采用卷积神经网络CNN(ConvolutionalNeural Network,CNN)模型对待识别图像进行识别,也可以采用贝叶斯学习模型对待识别图像进行识别,同样,也可以采用其它网络学习模型对待识别图像进行识别。
采用CNN模型对待识别图像进行识别时,首先需要构建CNN模型,并采用大量标定好的数据对该CNN模型进行训练,之后采用训练好的CNN模型对待识别图像进行识别,即可精确确定待识别图像中是否包含待识别物体,进而对待识别图像进行分类。而在实际应用中,通常难以获取到大量标定好的数据,只能获取少量标定好的数据样本,这样,如果仍然选择CNN模型对待识别图像进行识别的话,由于对CNN模型进行训练的标定好的数据样本的数量较少,获得的CNN模型存在一定的过拟合现象,会导致最后的识别率非常低,识别效果较差。
所以,基于少量样本训练获取的CNN模型存在一定的过拟合现象,对图像识别的精确度较低,适用性较差。
发明内容
本发明实施例的目的在于提供一种获取深度一次性学习模型的方法、图像识别方法及装置,以解决基于少量样本训练获取的CNN模型存在一定的过拟合现象,对图像识别的精确度较低,适用性较差的问题。
为了解决上述技术问题,本发明实施例公开了如下技术方案:
第一方面,本发明实施例提供了一种获取深度一次性学习模型的方法,该方法包括:
针对包含少量目标图像和背景图像的预设数据集中的所有目标图像,将每一幅目标图像输入预设卷积神经网络CNN模型,选择该预设CNN模型隐含层中任意一层的输出图像作为该目标图像的特征图像集,所述目标图像为被标注为包含待识别物体的图像,所述背景图像为被标注为不包含待识别物体的图像;
采用所述预设数据集中的背景图像,通过主成分分析PCA方法确定降维矩阵;
采用所述降维矩阵对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;
将所有降维特征图像集中的每一个降维特征图像集输入预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别,构建深度一次性学习模型;
采用所述预设数据集对所述深度一次性学习模型进行训练,直到模型收敛,从而获取收敛后的深度一次性学习模型。
结合第一方面,在第一方面的第一种可能的实现方式中,选择该预设CNN模型隐含层中任意一层的输出图像作为该目标图像的特征图像集的过程,具体包括:
选择该预设CNN模型第n层隐含层的输出图像作为该目标图像的特征图像集,将所述特征图像集表示为下述特征矩阵;
采用激活响应函数按照下述公式计算所述特征矩阵中的矩阵元素从而确定所述特征图像集;
其中,In表示预设CNN模型第n层隐含层的输出图像,即所述特征图像集,表示所述特征图像集对应的特征矩阵的第i个矩阵元素,即特征图像集In中的第i个特征图像,I0表示输入预设CNN模型的所述目标图像,Wi n表示预设CNN模型第n层隐含层中第i个滤波器,表示预设CNN模型第n层隐含层中第i个偏置矩阵,1≤i≤K,K表示预设CNN模型第n层隐含层中卷积核数量,即特征图像集In中的特征图像的数量,(*)表示卷积运算,函数σ(·)表示激活响应函数。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,采用所述降维矩阵对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集的过程,具体包括:
采用所述降维矩阵,根据下述公式对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;
I′n=In·WC
其中,I′n表示降维特征图像集,In表示特征图像集,WC表示降维矩阵。
结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,将所有降维特征图像集中的每一个降维特征图像集输入预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别,构建深度一次性学习模型的过程,具体包括:
将所有降维特征图像集中的每一个降维特征图像集输入下述预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别;
其中,p(C|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为目标图像的后验概率,C表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为目标图像,p(Cbg|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为背景图像的后验概率,Cbg表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为背景图像;
p(I′n|θ)为目标图像的似然函数,表示降维特征图像集I′n对应的目标图像为目标图像,满足参数为θ的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(C)表示降维特征图像集I′n对应的目标图像中包含待识别物体的先验概率,p(I′nbg)为背景图像的似然函数,表示降维特征图像集I′n对应的目标图像为背景图像,满足参数为θbg的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(Cbg)表示降维特征图像集I′n对应的目标图像中不包含待识别物体的先验概率;
通过假设方法,按照下述公式,挑选出所有降维特征图像集I′n中能够表征待识别物体特征的降维特征图像,确定出目标图像的似然函数;
其中,h表示假设方法中采用的索引向量,其值域为[1,K],H表示所有h的集合;
通过零假设方法,按照下述公式,挑选出所有降维特征图像集I′n中能够表征背景特征的降维特征图像,确定出背景图像的似然函数;
p(I′nbg)=p(I′n,h0bg)=p(I′n|h0bg)p(h0bg);
其中,h0表示零假设方法中采用的索引向量;
将目标图像的似然函数中的p(I′n|h,θ)变换为下述第一高斯分布函数;
其中,G表示高斯分布,hq表示索引向量h中的第q个特征索引,Q表示索引向量h的长度,即索引向量h中特征索引的数量,I′n(hq)表示根据h从降维特征图像集I′n中选出的第hq个降维特征图像,j\h表示索引j需要去除被h选中的特征索引,I′n(j)表示降维特征图像集I′n中未被h选出的降维特征图像,μ,Γ,μbg,Γbg表示第一高斯分布函数的参数;
将背景图像的似然函数中的p(I′n|h0bg)变换为下述第二高斯分布函数;
根据所述目标图像的似然函数、背景图像的似然函数、预设贝叶斯学习模型、第一高斯分布函数和第二高斯分布函数,构建下述深度一次性学习模型;
第二方面,本发明公开了一种采用上述收敛后的深度一次性学习模型进行图像识别的方法,该方法包括:
将待识别图像输入预设CNN模型,选择该预设CNN模型第n层隐含层的输出图像作为该待识别图像的待识别特征图像集;
采用降维矩阵对所述待识别特征图像集进行降维,生成所述待识别图像的待识别降维特征图像集;
将所述待识别降维特征图像集输入所述收敛后的深度一次性学习模型中,对待识别图像进行识别,从而确定所述待识别图像中是否包含待识别物体。
第三方面,本发明公开了一种获取深度一次性学习模型的装置,该装置包括:
特征图像集获取模块,用于针对包含少量目标图像和背景图像的预设数据集中的所有目标图像,将每一幅目标图像输入预设卷积神经网络CNN模型,选择该预设CNN模型隐含层中任意一层的输出图像作为该目标图像的特征图像集,所述目标图像为被标注为包含待识别物体的图像,所述背景图像为被标注为不包含待识别物体的图像;
降维矩阵确定模块,用于采用所述预设数据集中的背景图像,通过主成分分析PCA方法确定降维矩阵;
第一降维运算模块,用于采用所述降维矩阵对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;
深度一次性学习模型构建模块,用于将所有降维特征图像集中的每一个降维特征图像集输入预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别,构建深度一次性学习模型;
模型训练模块,用于采用所述预设数据集对所述深度一次性学习模型进行训练,直到模型收敛,从而获取收敛后的深度一次性学习模型。
结合第三方面,在第三方面的第一种可能的实现方式中,所述特征图像集获取模块具体用于:
针对包含少量目标图像和背景图像的预设数据集中的所有目标图像,将每一幅目标图像输入预设卷积神经网络CNN模型,选择该预设CNN模型第n层隐含层的输出图像作为该目标图像的特征图像集,将所述特征图像集表示为下述特征矩阵;
采用激活响应函数按照下述公式计算所述特征矩阵中的矩阵元素从而确定所述特征图像集;
其中,In表示预设CNN模型第n层隐含层的输出图像,即所述特征图像集,表示所述特征图像集对应的特征矩阵的第i个矩阵元素,即特征图像集In中的第i个特征图像,I0表示输入预设CNN模型的所述目标图像,Wi n表示预设CNN模型第n层隐含层中第i个滤波器,表示预设CNN模型第n层隐含层中第i个偏置矩阵,1≤i≤K,K表示预设CNN模型第n层隐含层中卷积核数量,即特征图像集In中的特征图像的数量,(*)表示卷积运算,函数σ(·)表示激活响应函数。
结合第三方面的第一种可能的实现方式,在第三方面的第二种可能的实现方式中,所述第一降维运算模块具体用于:
采用所述降维矩阵,根据下述公式对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;
I′n=In·WC
其中,I′n表示降维特征图像集,In表示特征图像集,WC表示降维矩阵。
结合第三方面的第二种可能的实现方式,在第三方面的第三种可能的实现方式中,所述深度一次性学习模型构建模块具体用于:
将所有降维特征图像集中的每一个降维特征图像集输入下述预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别;
其中,p(C|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为目标图像的后验概率,C表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为目标图像,p(Cbg|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为背景图像的后验概率,Cbg表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为背景图像;
p(I′n|θ)为目标图像的似然函数,表示降维特征图像集I′n对应的目标图像为目标图像,满足参数为θ的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(C)表示降维特征图像集I′n对应的目标图像中包含待识别物体的先验概率,p(I′nbg)为背景图像的似然函数,表示降维特征图像集I′n对应的目标图像为背景图像,满足参数为θbg的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(Cbg)表示降维特征图像集I′n对应的目标图像中不包含待识别物体的先验概率;
通过假设方法,按照下述公式,挑选出所有降维特征图像集I′n中能够表征待识别物体特征的降维特征图像,确定出目标图像的似然函数;
其中,h表示假设方法中采用的索引向量,其值域为[1,K],H表示所有h的集合;
通过零假设方法,按照下述公式,挑选出所有降维特征图像集I′n中能够表征背景特征的降维特征图像,确定出背景图像的似然函数;
p(I′nbg)=p(I′n,h0bg)=p(I′n|h0bg)p(h0bg);
其中,h0表示零假设方法中采用的索引向量;
将目标图像的似然函数中的p(I′n|h,θ)变换为下述第一高斯分布函数;
其中,G表示高斯分布,hq表示索引向量h中的第q个特征索引,Q表示索引向量h的长度,即索引向量h中特征索引的数量,I′n(hq)表示根据h从降维特征图像集I′n中选出的第hq个降维特征图像,j\h表示索引j需要去除被h选中的特征索引,I′n(j)表示降维特征图像集I′n中未被h选出的降维特征图像,μ,Γ,μbg,Γbg表示第一高斯分布函数的参数;
将背景图像的似然函数中的p(I′n|h0bg)变换为下述第二高斯分布函数;
根据所述目标图像的似然函数、背景图像的似然函数、预设贝叶斯学习模型、第一高斯分布函数和第二高斯分布函数,构建下述深度一次性学习模型;
第四方面,本发明公开了一种采用上述收敛后的深度一次性学习模型进行图像识别的装置,该装置包括:
待识别特征图像集获取模块,用于将待识别图像输入预设CNN模型,选择该预设CNN模型第n层隐含层的输出图像作为该待识别图像的待识别特征图像集;
第二降维运算模块,用于采用降维矩阵对所述待识别特征图像集进行降维,生成所述待识别图像的待识别降维特征图像集;
图像识别模块,用于将所述待识别降维特征图像集输入所述收敛后的深度一次性学习模型中,对待识别图像进行识别,从而确定所述待识别图像中是否包含待识别物体。
本发明的实施例提供的技术方案可以包括以下有益效果:本发明提供了一种获取深度一次性学习模型的方法、图像识别方法及装置,本发明提供的获取深度一次性学习模型的方法中,基于包含少量目标图像和背景图像的少量数据集(数据集中包含的标定好的样本数据量少或样本较单一),构建了深度一次性学习模型,并且采用该少量数据集对深度一次性学习模型进行训练,最后得到了收敛后的深度一次性学习模型,通过实验证明,采用本发明提供的方法获得的深度一次性学习模型对图像的识别率比基于相同少量数据集获取的CNN模型对图像的识别率高,识别效果更好。
本发明实施例应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种获取深度一次性学习模型的方法的流程示意图;
图2为本发明实施例提供的一种采用上述收敛后的深度一次性学习模型进行图像识别的方法的流程图;
图3为本发明实施例提供的一种获取深度一次性学习模型的装置的结构框图;
图4为本发明实施例提供的一种采用上述收敛后的深度一次性学习模型进行图像识别的装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本发明提供了一种获取深度一次性学习模型的方法、图像识别方法及装置,本发明提供的方法中,能够基于少量样本构建深度一次性学习模型,并采用含有少量样本的数据集对深度一次性学习模型进行训练,最后获得收敛后的深度一次性学习模型,经过实际实验检验,将该收敛后的深度一次性学习模型应用于实际的图像识别过程中,与基于少量样本训练获取的CNN模型相比,对图像识别的精确度显著提升,识别率更高,适用性更好。
下面结合附图,详细介绍本发明的具体实施例。
如图1所示,图1示出的是本发明提供的一种获取深度一次性学习模型的方法的流程图,该方法包括:
步骤101、针对包含少量目标图像和背景图像的预设数据集中的所有目标图像,将每一幅目标图像输入预设卷积神经网络CNN模型,选择该预设CNN模型隐含层中任意一层的输出图像作为该目标图像的特征图像集。
通常,人们想要获取用于对待识别图像进行图像识别分类的某种网络学习模型时,需要先获取一定量的标定好的样本数据构建网络学习模型,并通过一定量的标定好的样本数据对网络学习模型进行训练直到收敛,获得收敛后的网络学习模型,之后采用收敛后的网络学习模型即可对待识别图像进行图像识别并分类,因此,想要获取深度一次性学习模型,首先需要获取一定量的标定好的样本数据。
本实施例中在开始获取深度一次性学习模型之前,首先会获取包含少量目标图像和背景图像的数据集,该数据集中图像的数量小于2000幅,可以为几百幅,之后将该数据集预存于用于获取深度一次性学习模型的***中,在获取深度一次性学习模型时直接使用即可,因此,本文中将该数据集定义为预设数据集,其中,目标图像为被标注为包含待识别物体的图像,背景图像为被标注为不包含待识别物体的图像,本文中,将人们想要在待识别图像中识别确认是否包含的目标物体定义为待识别物体。具体实施过程中,可以通过人工标注的方式获取预设数据集,例如,将包含有待识别物体的图像人工标注为目标图像,将不包含待识别物体的图像人工标注为背景图像,之后将人工标注好的目标图像和背景图像预存于用于获取深度一次性学习模型的***中,便可获得预设数据集。
本实施例提供的获取深度一次性学习模型的方法中,通过采用预设贝叶斯学习模型对预设数据集中的目标图像进行识别,从而构建深度一次性学习模型,而对图像的识别实质上是确定图像中是否包含待识别物体,确定图像中是否包含待识别物体可以通过比较图像中包含待识别物体的概率与图像中不包含待识别物体,即包含背景(本文中,将图像中待识别物体之外的其余物体均定义为背景)的概率的大小关系来确定,如果图像中包含待识别物体的概率大于图像中包含背景的概率,则可以确定图像中包含待识别物体,因此,采用预设贝叶斯学习模型对预设数据集中的目标图像的识别过程可以表示为通过预设贝叶斯学习模型确定目标图像中包含待识别物体的概率与目标图像中包含背景的概率的大小关系。
通过预设贝叶斯学习模型确定目标图像中包含待识别物体的概率以及目标图像中包含背景的概率,需要先确定目标图像的特征图像集,具体实施时,可以采用CNN模型提取目标图像的特征图像集,因此,在开始获取深度一次性学习模型之前,还需要先获取CNN模型,之后将CNN模型预存于用于获取深度一次性学习模型的***中,在获取深度一次性学习模型的过程中,直接使用即可,因此,本文中,将该CNN模型定义为预设CNN模型,该预设CNN模型可以为下述CNN模型中的任意一种:第一种CNN模型为采用大量标定好的样本数据训练获得的CNN模型;第二种CNN模型为采用少量标定好的样本数据训练获得的CNN模型。
采用预设CNN模型提取预设数据集中所有目标图像中每一幅目标图像的特征图像集时,将该目标图像输入所述预设CNN模型,选择该预设CNN模型隐含层中任意一层的输出图像作为该目标图像的特征图像集,具体实施时,选择该预设CNN模型隐含层中任意一层的输出图像作为该目标图像的特征图像集的过程,包括:
选择该预设CNN模型第n层隐含层的输出图像作为该目标图像的特征图像集,将所述特征图像集表示为下述特征矩阵;
采用激活响应函数按照下述公式计算所述特征矩阵中的矩阵元素从而确定所述特征图像集;
其中,In表示预设CNN模型第n层隐含层的输出图像,即所述特征图像集,表示所述特征图像集对应的特征矩阵的第i个矩阵元素,即特征图像集In中的第i个特征图像,I0表示输入预设CNN模型的所述目标图像,Wi n表示预设CNN模型第n层隐含层中第i个滤波器,表示预设CNN模型第n层隐含层中第i个偏置矩阵,1≤i≤K,K表示预设CNN模型第n层隐含层中卷积核数量,即特征图像集In中的特征图像的数量(每个特征图像集In中包含多幅特征图像),(*)表示卷积运算,函数σ(·)表示激活响应函数。
步骤102、采用所述预设数据集中的背景图像,通过主成分分析PCA方法确定降维矩阵。
具体实施时,将预设数据集中所有背景图像中的每一幅背景图像输入预设CNN模型中,提取预设CNN模型第n层隐含层的输出图像作为该背景图像的背景特征图像集,并确定出该背景特征图像集对应的背景特征矩阵,之后对预设数据集中所有背景图像对应的所有背景特征矩阵进行主成分分析PCA(Principal Component Analysis,PCA),生成系数矩阵,最后选择该系数矩阵的前C列作为降维矩阵,其中,C的取值需要满足下述条件:使得PCA的特征值的累计贡献率达到90%以上。例如:假设预设数据集中背景图像的数量为20,对于其中的一幅背景图像,其对应一个256×169的背景特征矩阵,20幅背景图像就组成一个5120×169的背景特征矩阵,对该背景特征矩阵进行主成分分析后,可以生成一个169×169的系数矩阵,选择该系数矩阵的前C列做为降维矩阵。
步骤103、采用所述降维矩阵对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集。
具体实施时,该过程具体包括:采用所述降维矩阵,根据下述公式对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;
I′n=In·WC
其中,I′n表示降维特征图像集,In表示特征图像集,WC表示降维矩阵。
步骤104、将所有降维特征图像集中的每一个降维特征图像集输入预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别,构建深度一次性学习模型。
具体实施时,该过程具体包括:将所有降维特征图像集中的每一个降维特征图像集输入下述预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别;
其中,p(C|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为目标图像的后验概率,C表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为目标图像,p(Cbg|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为背景图像的后验概率,Cbg表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为背景图像,R表示预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为目标图像的后验概率与预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为背景图像的后验概率的比值;
通常情况下,每个概率符合某一种概率分布的概率分布函数中均含有参数,而后验概率p(C|I′n)是一个概率分布函数,因此,后验概率p(C|I′n)中隐含有参数θ,表示这个后验概率p(C|I′n)符合某一个概率分布,并且这个概率分布的参数为θ,同理,后验概率p(Cbg|I′n)中隐含有参数θbg,由此,下式可以变形为如下形式:
其中,p(C,θ)表示降维特征图像集I′n对应的目标图像中包含待识别物体的先验概率,可以简写为p(C),p(Cbgbg)表示降维特征图像集I′n对应的目标图像中不包含待识别物体的先验概率,可以简写为p(Cbg),p(I′n,θ)为证据因子,目的是为了保证各类别的后验概率的和为1,通常该证据因子为常数,同理,p(I′nbg)也是一个常数,这样上述公式可以简化为:其中,p(I′n|θ)为目标图像的似然函数,表示降维特征图像集I′n对应的目标图像为目标图像,满足参数为θ的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(C)表示降维特征图像集I′n对应的目标图像中包含待识别物体的先验概率,p(I′nbg)为背景图像的似然函数,表示降维特征图像集I′n对应的目标图像为背景图像,满足参数为θbg的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(Cbg)表示降维特征图像集I′n对应的目标图像中不包含待识别物体的先验概率;
通过假设方法,按照下述公式,挑选出所有降维特征图像集I′n(每个降维特征图像集I′n中均包含多个降维特征图像)中能够表征待识别物体特征的降维特征图像,确定出目标图像的似然函数;
其中,h表示假设方法中采用的索引向量,其值域为[1,K],H表示所有h的集合;
通过零假设方法,按照下述公式,挑选出所有降维特征图像集I′n中能够表征背景特征的降维特征图像,确定出背景图像的似然函数;
p(I′nbg)=p(I′n,h0bg)=p(I′n|h0bg)p(h0bg);
其中,h0表示零假设方法中采用的索引向量;
由于p(h|θ)为常量,假设p(I′n|h,θ)满足高斯分布,则可以将目标图像的似然函数中的p(I′n|h,θ)变换为下述第一高斯分布函数;
其中,G表示高斯分布,hq表示索引向量h中的第q个特征索引,Q表示索引向量h的长度,即索引向量h中特征索引的数量,I′n(hq)表示根据h从降维特征图像集I′n中选出的第hq个降维特征图像,j\h表示索引j需要去除被h选中的特征索引,I′n(j)表示降维特征图像集I′n中未被h选出的降维特征图像,μ,Γ,μbg,Γbg表示第一高斯分布函数的参数;
对于背景图像,所有表征背景特征的背景降维特征图像都不会被h选择,因此可以将背景图像的似然函数中的p(I′n|h0bg)变换为下述第二高斯分布函数;
当将一幅目标图像输入预设CNN模型,通过该预设CNN模型提取到该目标图像的特征图像集,并通过降维矩阵进行降维,得到目标图像的降维特征图像集之后,p(I′n|h0bg)是一个定值,并且,p(C)/p(Cbg)为常量,因此,可以根据所述目标图像的似然函数、背景图像的似然函数、预设贝叶斯学习模型、第一高斯分布函数和第二高斯分布函数,构建出下述深度一次性学习模型:
步骤105、采用所述预设数据集对所述深度一次性学习模型进行训练,直到模型收敛,从而获取收敛后的深度一次性学习模型。
采用预设数据集对深度一次性学习模型进行训练的方法包括多种,例如,第一种方法,采用预设数据集,通过期望最大化EM(Expectation Maximization,EM)方法对深度一次性学习模型进行训练;第二种方法,采用预设数据集,通过MM(Majorize-Minimize,MM)方法对深度一次性学习模型进行训练;第三种方法,采用预设数据集,通过条件期望最大化ECM(Expectation conditional maximization,ECM)方法对深度一次性学习模型进行训练;第四种方法,采用预设数据集,通过α-EM(α-Expectation–maximization,α-EM)方法对深度一次性学习模型进行训练;采用前述任意一种方法对深度一次性学习模型进行训练,直到模型收敛后,就可以获得深度一次性学习模型中μ和Γ的值,将获得的μ和Γ的值代入到深度一次性学习模型中,就可以获得收敛后的深度一次性学习模型。
当用于训练获取网络学习模型的标定好的样本数量较少或较单一时,采用本实施例提供的方法获得的深度一次性学习模型对其它图像的识别率具有显著的提高。例如以对车的识别为例:通过实验证明,采用相同数据样本训练获得的CNN模型和深度一次性学习模型,用二者分别对80幅图像进行识别,CNN模型的识别率为65%,而深度一次性学习模型的识别率为71.25%,识别率明显提高。
本发明提供的获取深度一次性学习模型的方法中,基于包含少量目标图像和背景图像的少量数据集,构建了深度一次性学习模型,并且采用该少量数据集对深度一次性学习模型进行训练,最后得到了收敛后的深度一次性学习模型,通过实验证明,采用本发明提供的方法获得的深度一次性学习模型对图像的识别率比基于相同少量数据集获取的CNN模型对图像的识别率高,识别效果更佳,适用性更好。
如图2所示,图2示出的是本发明提供的一种采用上述收敛后的深度一次性学习模型进行图像识别的方法的流程图,该方法包括:
步骤201、将待识别图像输入预设CNN模型,选择该预设CNN模型第n层隐含层的输出图像作为该待识别图像的待识别特征图像集。
步骤202、采用降维矩阵对所述待识别特征图像集进行降维,生成所述待识别图像的待识别降维特征图像集。
步骤203、将所述待识别降维特征图像集输入所述收敛后的深度一次性学习模型中,对待识别图像进行识别,从而确定所述待识别图像中是否包含待识别物体。
步骤201和步骤202的实现方式可以参考上述实施例中相应的实现方式,在此不再赘述,在步骤203中,将待识别降维特征图像集输入收敛后的深度一次性学习模型中,通过该收敛后的深度一次性学习模型计算出R后,比较R与后验概率比值的预设阈值之间的大小关系,其中,后验概率比值的预设阈值可以在0.5~1.5中任意选取,如果R大于等于该后验概率比值的预设阈值,则可以确定待识别图像中包含待识别物体,如果R小于该后验概率比值的预设阈值,则可以确定待识别图像中不包含待识别物体。
本实施例提供的方法,由于采用了上述深度一次性学习模型对待识别图像进行识别,识别的准确率更高。
与上述方法相对应,本发明实施例还公开了一种获取深度一次性学习模型的装置以及一种采用上述收敛后的深度一次性学习模型进行图像识别的装置。
如图3所示,图3示出的是一种获取深度一次性学习模型的装置的结构框图,该装置300包括:
特征图像集获取模块301,用于针对包含少量目标图像和背景图像的预设数据集中的所有目标图像,将每一幅目标图像输入预设卷积神经网络CNN模型,选择该预设CNN模型隐含层中任意一层的输出图像作为该目标图像的特征图像集,所述目标图像为被标注为包含待识别物体的图像,所述背景图像为被标注为不包含待识别物体的图像;
降维矩阵确定模块302,用于采用所述预设数据集中的背景图像,通过主成分分析PCA方法确定降维矩阵;
第一降维运算模块303,用于采用所述降维矩阵对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;
深度一次性学习模型构建模块304,用于将所有降维特征图像集中的每一个降维特征图像集输入预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别,构建深度一次性学习模型;
模型训练模块305,用于采用所述预设数据集对所述深度一次性学习模型进行训练,直到模型收敛,从而获取收敛后的深度一次性学习模型。
进一步,所述特征图像集获取模块301具体用于:
针对包含少量目标图像和背景图像的预设数据集中的所有目标图像,将每一幅目标图像输入预设卷积神经网络CNN模型,选择该预设CNN模型第n层隐含层的输出图像作为该目标图像的特征图像集,将所述特征图像集表示为下述特征矩阵;
采用激活响应函数按照下述公式计算所述特征矩阵中的矩阵元素从而确定所述特征图像集;
其中,In表示预设CNN模型第n层隐含层的输出图像,即所述特征图像集,表示所述特征图像集对应的特征矩阵的第i个矩阵元素,即特征图像集In中的第i个特征图像,I0表示输入预设CNN模型的所述目标图像,Wi n表示预设CNN模型第n层隐含层中第i个滤波器,表示预设CNN模型第n层隐含层中第i个偏置矩阵,1≤i≤K,K表示预设CNN模型第n层隐含层中卷积核数量,即特征图像集In中的特征图像的数量,(*)表示卷积运算,函数σ(·)表示激活响应函数。
进一步,所述第一降维运算模块303具体用于:
采用所述降维矩阵,根据下述公式对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;
I′n=In·WC
其中,I′n表示降维特征图像集,In表示特征图像集,WC表示降维矩阵。
进一步,所述深度一次性学习模型构建模块304具体用于:
将所有降维特征图像集中的每一个降维特征图像集输入下述预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别;
其中,p(C|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为目标图像的后验概率,C表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为目标图像,p(Cbg|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为背景图像的后验概率,Cbg表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为背景图像;
p(I′n|θ)为目标图像的似然函数,表示降维特征图像集I′n对应的目标图像为目标图像,满足参数为θ的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(C)表示降维特征图像集I′n对应的目标图像中包含待识别物体的先验概率,p(I′nbg)为背景图像的似然函数,表示降维特征图像集I′n对应的目标图像为背景图像,满足参数为θbg的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(Cbg)表示降维特征图像集I′n对应的目标图像中不包含待识别物体的先验概率;
通过假设方法,按照下述公式,挑选出所有降维特征图像集I′n中能够表征待识别物体特征的降维特征图像,确定出目标图像的似然函数;
其中,h表示假设方法中采用的索引向量,其值域为[1,K],H表示所有h的集合;
通过零假设方法,按照下述公式,挑选出所有降维特征图像集I′n中能够表征背景特征的降维特征图像,确定出背景图像的似然函数;
p(I′nbg)=p(I′n,h0bg)=p(I′n|h0bg)p(h0bg);
其中,h0表示零假设方法中采用的索引向量;
将目标图像的似然函数中的p(I′n|h,θ)变换为下述第一高斯分布函数;
其中,G表示高斯分布,hq表示索引向量h中的第q个特征索引,Q表示索引向量h的长度,即索引向量h中特征索引的数量,I′n(hq)表示根据h从降维特征图像集I′n中选出的第hq个降维特征图像,j\h表示索引j需要去除被h选中的特征索引,I′n(j)表示降维特征图像集I′n中未被h选出的降维特征图像,μ,Γ,μbg,Γbg表示第一高斯分布函数的参数;
将背景图像的似然函数中的p(I′n|h0bg)变换为下述第二高斯分布函数;
根据所述目标图像的似然函数、背景图像的似然函数、预设贝叶斯学习模型、第一高斯分布函数和第二高斯分布函数,构建下述深度一次性学习模型;
通过本发明提供的装置获得的深度一次性学习模型,用其对图像进行识别时,识别率比基于相同少量数据集获取的CNN模型对图像的识别率高,识别效果更佳,适用性更好。
如图4所示,图4示出的是本发明提供的一种采用上述收敛后的深度一次性学习模型进行图像识别的装置的结构框图,该装置400包括:
待识别特征图像集获取模块401,用于将待识别图像输入预设CNN模型,选择该预设CNN模型第n层隐含层的输出图像作为该待识别图像的待识别特征图像集;
第二降维运算模块402,用于采用降维矩阵对所述待识别特征图像集进行降维,生成所述待识别图像的待识别降维特征图像集;
图像识别模块403,用于将所述待识别降维特征图像集输入所述收敛后的深度一次性学习模型中,对待识别图像进行识别,从而确定所述待识别图像中是否包含待识别物体。
采用该装置对图像进行识别时,能够实现采用上述收敛后的深度一次性学习模型进行图像识别的方法中相应的效果,对图像的识别率更高。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或***实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及***实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种获取深度一次性学习模型的方法,其特征在于,包括:
针对包含少量目标图像和背景图像的预设数据集中的所有目标图像,将每一幅目标图像输入预设卷积神经网络CNN模型,选择该预设CNN模型隐含层中任意一层的输出图像作为该目标图像的特征图像集,所述目标图像为被标注为包含待识别物体的图像,所述背景图像为被标注为不包含待识别物体的图像;
采用所述预设数据集中的背景图像,通过主成分分析PCA方法确定降维矩阵;
采用所述降维矩阵对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;
将所有降维特征图像集中的每一个降维特征图像集输入预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别,构建深度一次性学习模型,具体包括:
将所有降维特征图像集中的每一个降维特征图像集输入下述预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别,
其中,p(C|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为目标图像的后验概率,C表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为目标图像,p(Cbg|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为背景图像的后验概率,Cbg表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为背景图像,
p(I′n|θ)为目标图像的似然函数,表示降维特征图像集I′n对应的目标图像为目标图像,满足参数为θ的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(C)表示降维特征图像集I′n对应的目标图像中包含待识别物体的先验概率,p(I′nbg)为背景图像的似然函数,表示降维特征图像集I′n对应的目标图像为背景图像,满足参数为θbg的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(Cbg)表示降维特征图像集I′n对应的目标图像中不包含待识别物体的先验概率,
通过假设方法,按照下述公式,挑选出降维特征图像集I′n中能够表征待识别物体特征的降维特征图像,确定出目标图像的似然函数:
其中,h表示假设方法中采用的索引向量,其值域为[1,K],H表示所有h的集合,
通过零假设方法,按照下述公式,挑选出降维特征图像集I′n中能够表征背景特征的降维特征图像,确定出背景图像的似然函数:
p(I′nbg)=p(I′n,h0bg)=p(I′n|h0bg)p(h0bg),
其中,h0表示零假设方法中采用的索引向量,
将目标图像的似然函数中的p(I′n|h,θ)变换为下述第一高斯分布函数:
其中,G表示高斯分布,hq表示索引向量h中的第q个特征索引,Q表示索引向量h的长度,即索引向量h中特征索引的数量,I′n(hq)表示根据h从降维特征图像集I′n中选出的第hq个降维特征图像,j\h表示索引j需要去除被h选中的特征索引,I′n(j)表示降维特征图像集I′n中未被h选出的降维特征图像,μ,Γ,μbg,Γbg表示第一高斯分布函数的参数,
将背景图像的似然函数中的p(I′n|h0bg)变换为下述第二高斯分布函数:
根据所述目标图像的似然函数、背景图像的似然函数、预设贝叶斯学习模型、第一高斯分布函数和第二高斯分布函数,构建下述深度一次性学习模型:
采用所述预设数据集对所述深度一次性学习模型进行训练,直到模型收敛,从而获取收敛后的深度一次性学习模型。
2.根据权利要求1所述的方法,其特征在于,选择该预设CNN模型隐含层中任意一层的输出图像作为该目标图像的特征图像集的过程,具体包括:
选择该预设CNN模型第n层隐含层的输出图像作为该目标图像的特征图像集,将所述特征图像集表示为下述特征矩阵;
采用激活响应函数按照下述公式计算所述特征矩阵中的矩阵元素从而确定所述特征图像集;
其中,In表示预设CNN模型第n层隐含层的输出图像,即所述特征图像集,表示所述特征图像集对应的特征矩阵的第i个矩阵元素,即特征图像集In中的第i个特征图像,I0表示输入预设CNN模型的所述目标图像,Wi n表示预设CNN模型第n层隐含层中第i个滤波器,表示预设CNN模型第n层隐含层中第i个偏置矩阵,1≤i≤K,K表示预设CNN模型第n层隐含层中卷积核数量,即特征图像集In中的特征图像的数量,(*)表示卷积运算,函数σ(·)表示激活响应函数。
3.根据权利要求2所述的方法,其特征在于,采用所述降维矩阵对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集的过程,具体包括:
采用所述降维矩阵,根据下述公式对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;
I′n=In·WC
其中,I′n表示降维特征图像集,In表示特征图像集,WC表示降维矩阵。
4.一种采用权利要求1至3任意一项所述的收敛后的深度一次性学习模型进行图像识别的方法,其特征在于,包括:
将待识别图像输入预设CNN模型,选择该预设CNN模型第n层隐含层的输出图像作为该待识别图像的待识别特征图像集;
采用降维矩阵对所述待识别特征图像集进行降维,生成所述待识别图像的待识别降维特征图像集;
将所述待识别降维特征图像集输入所述收敛后的深度一次性学习模型中,对待识别图像进行识别,从而确定所述待识别图像中是否包含待识别物体。
5.一种获取深度一次性学习模型的装置,其特征在于,包括:
特征图像集获取模块,用于针对包含少量目标图像和背景图像的预设数据集中的所有目标图像,将每一幅目标图像输入预设卷积神经网络CNN模型,选择该预设CNN模型隐含层中任意一层的输出图像作为该目标图像的特征图像集,所述目标图像为被标注为包含待识别物体的图像,所述背景图像为被标注为不包含待识别物体的图像;
降维矩阵确定模块,用于采用所述预设数据集中的背景图像,通过主成分分析PCA方法确定降维矩阵;
第一降维运算模块,用于采用所述降维矩阵对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;
深度一次性学习模型构建模块,用于将所有降维特征图像集中的每一个降维特征图像集输入预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别,构建深度一次性学习模型,具体包括:
将所有降维特征图像集中的每一个降维特征图像集输入下述预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别,
其中,p(C|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为目标图像的后验概率,C表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为目标图像,p(Cbg|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为背景图像的后验概率,Cbg表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为背景图像,
p(I′n|θ)为目标图像的似然函数,表示降维特征图像集I′n对应的目标图像为目标图像,满足参数为θ的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(C)表示降维特征图像集I′n对应的目标图像中包含待识别物体的先验概率,p(I′nbg)为背景图像的似然函数,表示降维特征图像集I′n对应的目标图像为背景图像,满足参数为θbg的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(Cbg)表示降维特征图像集I′n对应的目标图像中不包含待识别物体的先验概率,
通过假设方法,按照下述公式,挑选出降维特征图像集I′n中能够表征待识别物体特征的降维特征图像,确定出目标图像的似然函数:
其中,h表示假设方法中采用的索引向量,其值域为[1,K],H表示所有h的集合,
通过零假设方法,按照下述公式,挑选出降维特征图像集I′n中能够表征背景特征的降维特征图像,确定出背景图像的似然函数:
p(I′nbg)=p(I′n,h0bg)=p(I′n|h0bg)p(h0bg),
其中,h0表示零假设方法中采用的索引向量,
将目标图像的似然函数中的p(I′n|h,θ)变换为下述第一高斯分布函数:
其中,G表示高斯分布,hq表示索引向量h中的第q个特征索引,Q表示索引向量h的长度,即索引向量h中特征索引的数量,I′n(hq)表示根据h从降维特征图像集I′n中选出的第hq个降维特征图像,j\h表示索引j需要去除被h选中的特征索引,I′n(j)表示降维特征图像集I′n中未被h选出的降维特征图像,μ,Γ,μbg,Γbg表示第一高斯分布函数的参数,
将背景图像的似然函数中的p(I′n|h0bg)变换为下述第二高斯分布函数:
根据所述目标图像的似然函数、背景图像的似然函数、预设贝叶斯学习模型、第一高斯分布函数和第二高斯分布函数,构建下述深度一次性学习模型:
模型训练模块,用于采用所述预设数据集对所述深度一次性学习模型进行训练,直到模型收敛,从而获取收敛后的深度一次性学习模型。
6.根据权利要求5所述的装置,其特征在于,所述特征图像集获取模块具体用于:
针对包含少量目标图像和背景图像的预设数据集中的所有目标图像,将每一幅目标图像输入预设卷积神经网络CNN模型,选择该预设CNN模型第n层隐含层的输出图像作为该目标图像的特征图像集,将所述特征图像集表示为下述特征矩阵;
采用激活响应函数按照下述公式计算所述特征矩阵中的矩阵元素从而确定所述特征图像集;
其中,In表示预设CNN模型第n层隐含层的输出图像,即所述特征图像集,表示所述特征图像集对应的特征矩阵的第i个矩阵元素,即特征图像集In中的第i个特征图像,I0表示输入预设CNN模型的所述目标图像,Wi n表示预设CNN模型第n层隐含层中第i个滤波器,表示预设CNN模型第n层隐含层中第i个偏置矩阵,1≤i≤K,K表示预设CNN模型第n层隐含层中卷积核数量,即特征图像集In中的特征图像的数量,(*)表示卷积运算,函数σ(·)表示激活响应函数。
7.根据权利要求6所述的装置,其特征在于,所述第一降维运算模块具体用于:
采用所述降维矩阵,根据下述公式对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;
I′n=In·WC
其中,I′n表示降维特征图像集,In表示特征图像集,WC表示降维矩阵。
8.一种采用权利要求5至7任意一项所述的收敛后的深度一次性学习模型进行图像识别的装置,其特征在于,包括:
待识别特征图像集获取模块,用于将待识别图像输入预设CNN模型,选择该预设CNN模型第n层隐含层的输出图像作为该待识别图像的待识别特征图像集;
第二降维运算模块,用于采用降维矩阵对所述待识别特征图像集进行降维,生成所述待识别图像的待识别降维特征图像集;
图像识别模块,用于将所述待识别降维特征图像集输入所述收敛后的深度一次性学习模型中,对待识别图像进行识别,从而确定所述待识别图像中是否包含待识别物体。
CN201610761364.0A 2016-08-30 2016-08-30 获取深度一次性学习模型的方法、图像识别方法及装置 Active CN106372656B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610761364.0A CN106372656B (zh) 2016-08-30 2016-08-30 获取深度一次性学习模型的方法、图像识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610761364.0A CN106372656B (zh) 2016-08-30 2016-08-30 获取深度一次性学习模型的方法、图像识别方法及装置

Publications (2)

Publication Number Publication Date
CN106372656A CN106372656A (zh) 2017-02-01
CN106372656B true CN106372656B (zh) 2019-05-10

Family

ID=57901020

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610761364.0A Active CN106372656B (zh) 2016-08-30 2016-08-30 获取深度一次性学习模型的方法、图像识别方法及装置

Country Status (1)

Country Link
CN (1) CN106372656B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107578448B (zh) * 2017-08-31 2020-08-11 广东工业大学 基于cnn的无标定曲面所包含拼接曲面个数识别方法
CN107633236B (zh) * 2017-09-28 2019-01-22 北京达佳互联信息技术有限公司 图像内容理解方法、装置及服务器
CN109857864A (zh) * 2019-01-07 2019-06-07 平安科技(深圳)有限公司 文本情感分类方法、装置、计算机设备及存储介质
CN110378372A (zh) * 2019-06-11 2019-10-25 中国科学院自动化研究所南京人工智能芯片创新研究院 图数据识别方法、装置、计算机设备和存储介质
CN111179235B (zh) * 2019-12-23 2024-03-08 东软医疗***股份有限公司 图像检测模型的生成方法及装置、应用方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464950A (zh) * 2009-01-16 2009-06-24 北京航空航天大学 基于在线学习和贝叶斯推理的视频人脸识别与检索方法
CN102147867A (zh) * 2011-05-20 2011-08-10 北京联合大学 一种基于主体的国画图像和书法图像的识别方法
CN103839072A (zh) * 2013-12-31 2014-06-04 浙江工业大学 一种基于朴素贝叶斯分类器的假指纹检测方法
CN104021577A (zh) * 2014-06-19 2014-09-03 上海交通大学 一种基于局部背景学习的视频跟踪方法
CN104899255A (zh) * 2015-05-15 2015-09-09 浙江大学 适用于训练深度卷积神经网络的图像数据库的构建方法
US9400925B2 (en) * 2013-11-15 2016-07-26 Facebook, Inc. Pose-aligned networks for deep attribute modeling
CN105825511A (zh) * 2016-03-18 2016-08-03 南京邮电大学 一种基于深度学习的图片背景清晰度检测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464950A (zh) * 2009-01-16 2009-06-24 北京航空航天大学 基于在线学习和贝叶斯推理的视频人脸识别与检索方法
CN102147867A (zh) * 2011-05-20 2011-08-10 北京联合大学 一种基于主体的国画图像和书法图像的识别方法
US9400925B2 (en) * 2013-11-15 2016-07-26 Facebook, Inc. Pose-aligned networks for deep attribute modeling
CN103839072A (zh) * 2013-12-31 2014-06-04 浙江工业大学 一种基于朴素贝叶斯分类器的假指纹检测方法
CN104021577A (zh) * 2014-06-19 2014-09-03 上海交通大学 一种基于局部背景学习的视频跟踪方法
CN104899255A (zh) * 2015-05-15 2015-09-09 浙江大学 适用于训练深度卷积神经网络的图像数据库的构建方法
CN105825511A (zh) * 2016-03-18 2016-08-03 南京邮电大学 一种基于深度学习的图片背景清晰度检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CNN 深度学习模型用于表情特征提取方法探究;张昭旭;《图形图像》;20160131(第1期);全文
ROBUST FACE ALIGNMENT BASED ON LOCAL TEXTURE CLASSIFIERS;Li ZHANG et al.;《IEEE》;20051231;全文
一种用于行人检测的隐式训练卷积神经网络模型;黄咨 等;《计算机应用与软件》;20160531;第33卷(第5期);全文
基于卷积神经网络的不良地质体识别与分类;陈冠宇 等;《地质科技情报》;20160131;第35卷(第1期);全文

Also Published As

Publication number Publication date
CN106372656A (zh) 2017-02-01

Similar Documents

Publication Publication Date Title
CN106372656B (zh) 获取深度一次性学习模型的方法、图像识别方法及装置
CN109711281B (zh) 一种基于深度学习的行人重识别与特征识别融合方法
CN105138993B (zh) 建立人脸识别模型的方法及装置
CN104239858B (zh) 一种人脸特征验证的方法和装置
CN111931758B (zh) 一种结合面部静脉的人脸识别方法及装置
CN109800811A (zh) 一种基于深度学习的小样本图像识别方法
CN107122744A (zh) 一种基于人脸识别的活体检测***及方法
CN107451994A (zh) 基于生成对抗网络的物体检测方法及装置
CN106446754A (zh) 图像识别方法、度量学习方法、图像来源识别方法及装置
CN108875907B (zh) 一种基于深度学习的指纹识别方法和装置
CN106384087A (zh) 一种基于多层网络人体特征的身份识别方法
CN109190470A (zh) 行人重识别方法及装置
CN113449704B (zh) 人脸识别模型训练方法、装置、电子设备及存储介质
CN109993021A (zh) 人脸正脸检测方法、装置及电子设备
CN111160216A (zh) 一种多特征多模型的活体人脸识别方法
CN111401105B (zh) 一种视频表情识别方法、装置及设备
CN105138951B (zh) 基于图模型表示的人脸画像-照片识别方法
CN113158955B (zh) 基于聚类引导和成对度量三元组损失的行人重识别方法
CN108734145A (zh) 一种基于密度自适应人脸表征模型的人脸识别方法
CN112115838B (zh) 一种热红外图像光谱融合的人脸分类方法
CN110490028A (zh) 基于深度学习的人脸识别网络训练方法、设备及存储介质
CN111582027B (zh) 身份认证方法、装置、计算机设备和存储介质
CN110826534B (zh) 一种基于局部主成分分析的人脸关键点检测方法及***
CN111382791B (zh) 深度学习任务处理方法、图像识别任务处理方法和装置
CN113192028B (zh) 人脸图像的质量评价方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211227

Address after: 230000 No. 67, Jiatang village north, Dayang Town, Luyang District, Hefei City, Anhui Province

Patentee after: Gao Qianwen

Address before: 518057 No. 04, 22 / F, international student entrepreneurship building, No. 29, South Ring Road, high tech Zone, Nanshan District, Shenzhen, Guangdong Province

Patentee before: TONGGUAN TECHNOLOGY (SHENZHEN) CO.,LTD.