CN110598737A - 一种深度学习模型的在线学习方法、装置、设备及介质 - Google Patents

一种深度学习模型的在线学习方法、装置、设备及介质 Download PDF

Info

Publication number
CN110598737A
CN110598737A CN201910722508.5A CN201910722508A CN110598737A CN 110598737 A CN110598737 A CN 110598737A CN 201910722508 A CN201910722508 A CN 201910722508A CN 110598737 A CN110598737 A CN 110598737A
Authority
CN
China
Prior art keywords
deep learning
learning model
training
layer
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910722508.5A
Other languages
English (en)
Other versions
CN110598737B (zh
Inventor
石大明
刘露
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN201910722508.5A priority Critical patent/CN110598737B/zh
Publication of CN110598737A publication Critical patent/CN110598737A/zh
Application granted granted Critical
Publication of CN110598737B publication Critical patent/CN110598737B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明适用深度学习技术领域,提供了一种深度学习模型的在线学习方法、装置、设备及介质,该方法包括:对引入抑制信号的深度学习模型进行线下训练,训练好后将该深度学习模型发布到线上,以对接收到的线上训练图像进行图像识别,通过滑动窗口对不能识别的线上训练图像进行切割,得到对应的基本特征集,将得到的基本特征集与训练图像集进行相似度匹配,将得到的所有相似度中低于相似度阈值所对应的基本特征设置为奇异特征,根据由奇异特征构成的奇异特征集和预设的模型训练算法,对深度学习模型进行再次训练,以完成深度学习模型的在线学习,从而通过引入抑制信号提高深度学习模型的噪声鲁棒性,并通过个性化训练提高模型识别精度。

Description

一种深度学习模型的在线学习方法、装置、设备及介质
技术领域
本发明属于深度学习技术领域,尤其涉及一种深度学习模型的在线学习方法、装置、设备及介质。
背景技术
在线学习(Online Learning)并不是一种模型,而是一种模型的训练方法,在线学习能够在预测模型训练好上线后,根据线上反馈数据,实时快速地对原预测模型进行优化调整,使得调整后的预测模型及时反映线上的变化,提高线上预测的准确率,而由于线上使用的数据不同于纯净的离线测试数据,往往包含一定的噪声,这种动态学习特性和数据的复杂性使得在线学习对模型在可扩展性、抗噪声能力、以及内存效用方面有更高的要求。
目前,绝大多数在线学习算法都是机器学习算法,即被设计成使用在线凸优化来学习浅层模型,但它们并不能学习到复杂应用场景中的非线性函数,进而不能对数据进行足够的拟合。深度学习因为其高度线性表达能力已被广泛应用到很多领域,然而,其有一个很大的弊端,即深度模型上线后,因为深度神经网络是以批量学习的设置来训练的,这种设置需要所有的训练数据集在学习任务开始前准备好,这对于现实中很多数据是以流的形式先后到达的任务而言是不可能的,而且也可能没有足够的内存空间来存储,因此,亟需一种新的在线深度学习方法来解决这一弊端。
发明内容
本发明的目的在于提供一种深度学习模型的在线学习方法、装置、设备及介质,旨在解决由于现有技术无法提供一种有效的深度学习模型的在线学习方法,导致深度学习模型抗噪声能力差、模型识别精度低的问题。
一方面,本发明提供了一种深度学习模型的在线学习方法,所述方法包括下述步骤:
通过线下预先训练好的、引入了抑制信号和兴奋信号的深度学习模型对接收到的线上训练图像进行图像识别,得到图像识别结果;
当根据所述图像识别结果确定所述线上训练图像为不能识别图像时,通过滑动窗口对所述线上训练图像进行切割,得到与所述深度学习模型每层感受野大小相同的对应基本特征;
根据所述基本特征的尺寸大小,将由所述基本特征构成的基本特征集与预先存储的训练图像集进行相似度匹配,得到每个基本特征对应的相似度,将所有相似度中低于预设相似度阈值的相似度所对应的基本特征设置为奇异特征;
根据由所述奇异特征构成的奇异特征集和预设的模型训练算法,对所述深度学习模型进行再次训练,以对所述深度学习模型的各参数进行调整,完成所述深度学习模型的在线学习。
另一方面,本发明提供了一种深度学习模型的在线学习装置,所述装置包括:
线上图像识别单元,用于通过线下预先训练好的、引入了抑制信号和兴奋信号的深度学习模型对接收到的线上训练图像进行图像识别,得到图像识别结果;
基本特征提取单元,用于当根据所述图像识别结果确定所述线上训练图像为不能识别图像时,通过滑动窗口对所述线上训练图像进行切割,得到与所述深度学习模型每层感受野大小相同的对应基本特征;
相似度匹配单元,用于根据所述基本特征的尺寸大小,将由所述基本特征构成的基本特征集与预先存储的训练图像集进行相似度匹配,得到每个基本特征对应的相似度,将所有相似度中低于预设相似度阈值的相似度所对应的基本特征设置为奇异特征;以及
模型训练单元,用于根据由所述奇异特征构成的奇异特征集和预设的模型训练算法,对所述深度学习模型进行再次训练,以对所述深度学习模型的各参数进行调整,完成所述深度学习模型的在线学习。
另一方面,本发明还提供了一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述深度学习模型的在线学习方法所述的步骤。
另一方面,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述深度学习模型的在线学习方法所述的步骤。
本发明首先对引入抑制信号的深度学习模型进行线下训练,训练好后将该深度学习模型发布到线上,再通过该深度学习模型对接收到的线上训练图像进行图像识别,当根据得到的图像识别结果确定线上训练图像为不能识别图像时,通过滑动窗口对线上训练图像进行切割,得到对应的基本特征,根据基本特征的尺寸大小,将由基本特征构成的基本特征集与预先存储的训练图像集进行相似度匹配,得到每个基本特征对应的相似度,将所有相似度中低于预设相似度阈值的相似度所对应的基本特征设置为奇异特征,根据由奇异特征构成的奇异特征集和预设的模型训练算法,对深度学习模型进行再次训练,以对深度学习模型的各参数进行调整,完成深度学习模型的在线学习,从而通过引入抑制信号提高深度学习模型的噪声鲁棒性,并通过个性化训练提高了模型识别精度,使得训练出的深度学习模型更符合人脑视觉皮层特性。
附图说明
图1是本发明实施例一提供的深度学习模型的在线学习方法的实现流程图;
图2是本发明实施例二提供的深度学习模型的在线学习方法的实现流程图;
图3是本发明实施例三提供的深度学习模型的在线学习装置的结构示意图;
图4是本发明实施例四提供的深度学习模型的在线学习装置的结构示意图;以及
图5是本发明实施例五提供的计算设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
实施例一:
图1示出了本发明实施例一提供的深度学习模型的在线学习方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S101中,通过线下预先训练好的、引入了抑制信号和兴奋信号的深度学习模型对接收到的线上训练图像进行图像识别,得到图像识别结果。
本发明实施例适用于计算设备,例如,个人计算机、服务器等。在本发明实施例中,线下预先训练好的深度学习模型虽然可以实现对大部分样本的准确识别,然而仍存在极少部分不能识别的图像,因此,将线下预先训练好的、引入了抑制信号和兴奋信号的深度学习模型发布上线,以对其进行在线学习,深度学习模型接收线上用户发送的线上训练图像,并对接收到的该训练图像进行图像识别,得到对应的图像识别结果,图像识别结果包括图像识别成功或者图像识别失败,其中,该深度学习模型包括隐含层和全连接层,隐含层由若干特征提取层和与特征提取层对应的下采样层组成,特征提取层由若干特征提取面组成,下采样层由若干下采样面组成,全连接层为深度学习模型的输出层,且在该深度学习模型中引入抑制信号,提高了模型的噪声鲁棒性。
在对接收到的线上训练图像进行图像识别时,优选地,采用结合了抑制信号和兴奋信号的特征提取公式Vl(n,k)=El(n,k)-Il(n)对输入该深度学***面的特征矩阵,El(n,k)为深度学***面的兴奋信号,Il(n)为深度学***面上的正中间细胞,从而通过使用抑制信号对兴奋信号进行弱化来达到消除噪声影响的目的,提高了深度学习模型的噪声鲁棒性。
在步骤S102中,当根据图像识别结果确定线上训练图像为不能识别图像时,通过滑动窗口对线上训练图像进行切割,得到与深度学习模型每层感受野大小相同的对应基本特征。
在本发明实施例中,当根据图像识别结果确定线上训练图像为不能识别图像时,也即深度学习模型对该线上训练图像图像识别失败,将该线上训练图像输入到深度学习模型中,通过不同尺寸的滑动窗口对该线上训练图像进行图像切割,得到与深度学习模型每层感受野大小相同的对应基本特征。
在步骤S103中,根据基本特征的尺寸大小,将由基本特征构成的基本特征集与预先存储的训练图像集进行相似度匹配,得到每个基本特征对应的相似度,将所有相似度中低于预设相似度阈值的相似度所对应的基本特征设置为奇异特征。
在本发明实施例中,根据基本特征的尺寸大小,取尺寸大小相同的基本特征集与预先存储的训练图像集进行相似度匹配,得到基本特征集中每个基本特征对应的相似度,将所有相似度中低于预设相似度阈值的相似度所对应的基本特征设置为奇异特征,迭代该取尺寸大小相同的基本特征集与预先存储的训练图像集进行相似度匹配的操作,直至该基本特征集中所有基本特征都进行了相似度匹配,从而得到该线上训练图像的多个尺寸的奇异特征,其中,训练图像集为预先对该深度学习模型进行训练的样本。
在步骤S104中,根据由奇异特征构成的奇异特征集和预设的模型训练算法,对深度学习模型进行再次训练,以对深度学习模型的各参数进行调整,完成该深度学习模型的在线学习。
在本发明实施例中,根据由奇异特征构成的奇异特征集和预设的模型训练算法,对深度学习模型进行再次训练,以对深度学习模型的各参数进行调整,实现该深度学习模型对该单个线上训练图像的正确识别,并将奇异特征集加入训练图像集中,完成该深度学习模型的在线学习。
优选地,通过下述步骤实现对深度学习模型的再次训练:
(1)采用相似度聚类算法对所有奇异特征进行分类,得到若干个特征类别;
(2)分别对每个特征类别中的所有奇异特征进行加权平均计算,得到特征类别对应的目标奇异特征;
(3)根据由得到的目标奇异特征构成的目标奇异特征集,对隐含层进行局部训练,直至特征提取面和下采样面设置的种子细胞对应的连接域激活值达到预设的激活阈值;
(4)根据该线上训练图像,对已完成局部训练的深度学习模型进行全连接层的分类训练,以实现该深度学习模型对该单个线上训练图像的正确识别,完成深度学习模型的再次训练。
步骤(1)-(4)的具体实现参考下述实施例二相关步骤的描述,在此不再赘述,从而通过步骤(1)-(4)实现对深度学习模型的个性化训练,提高了深度学习模型的模型识别精度。
在本发明实施例,通过线下预先训练好的深度学习模型对接收到的线上训练图像进行图像识别,当该线上训练图像不能识别时,采用结合抑制信号和兴奋信号的特征提取公式对线上训练图像进行特征提取,得到对应的基本特征,将由基本特征构成的基本特征集与训练图像集进行相似度匹配,将所有相似度中低于相似度阈值的相似度所对应的基本特征设置为奇异特征,根据由奇异特征构成的奇异特征集和预设的模型训练算法,对深度学习模型进行再次训练,以完成深度学习模型的在线学习,从而通过引入抑制信号提高深度学习模型的噪声鲁棒性,并通过个性化训练提高了模型识别精度,使得训练出的深度学习模型更符合人脑视觉皮层特性。
实施例二:
图2示出了本发明实施例二提供的深度学习模型的在线学习方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在通过线下预先训练好的、引入了抑制信号和兴奋信号的深度学习模型对接收到的线上训练图像进行图像识别之前,通过下述步骤实现深度学习模型的线下训练:
在步骤S201中,根据训练图像集,构建深度学习模型。
在本发明实施例中,根据接收到的、用户输入的训练图像集的复杂程度(复杂程度包括训练图像集中图像样本数量、每个图像样本的尺寸、图像清晰度等),设置深度学习模型的结构层次,根据结构层次,构建基础的、未训练的深度学习模型,该深度学习模型包括输入层、隐含层和输出层,其中,输入层只含一层,它直接接受二维视觉模式,输出层为全连接层,用于将隐含层提取出的局部特征进行整合,并根据整合结果对训练图像集中的训练图像样本进行分类,隐含层由若干特征提取层(记为S层)和与特征提取层对应的下采样层(记为C层)组成,S层又由若干特征提取面(记为S面)组成,C层由若干下采样面(记为C面)组成,而S面是由若干兴奋神经元和若干抑制神经元结合在一起组成,C面由若干复杂神经元结合在一起组成。S层用于特征模式的提取,C层用于解决S层提取到的特征的位移扭曲问题,且采用L2池化操作,隐含层的任一中间级由S层与C层串接而成,即一个S层后连接一个C层。设置的深度学习模型的结构层次包括隐含层中S层和C层的层数、构成S层/C层的S面/C面的个数,以及构成S面/C面的兴奋神经元、抑制神经元/复杂神经元的数量。
在步骤S202中,根据训练图像集,采用构建完成的深度学习模型和预设的特征提取算法,提取对应的目标特征。
在本发明实施例中,根据训练图像集,采用构建完成的、未训练的深度学习模型和预设的特征提取算法,提取能够代表整个训练图像集基本特征的目标特征。
在提取对应的目标特征时,优选地,通过下述步骤实现目标特征的提取:
(1)使用构建完成的深度学习模型得到训练图像集中每个训练图像对应的初始特征。
在本发明实施例中,深度学习模型中每层设置的感受野尺寸随着深度增加而增大,第一层的感受野尺寸设置得很小,而在输出层,其感受野为整个图像。将训练图像集输入到未训练的深度学习模型中,使用与该深度学习模型隐含层感受野尺寸相同的窗口对输出层的训练模式进行滑动截取,得到训练图像集中每个训练图像对应的初始特征。
(2)采用相似度聚类算法对所有初始特征进行分类,得到若干个特征类别。
在本发明实施例中,采用相似度聚类算法对所有初始特征进行分类,得到若干个特征类别,使得每个特征类别中的初始特征相似度较高,而不同特征类别中的初始特征相似度较弱。
(3)分别对每个特征类别中的所有初始特征进行加权平均计算,得到特征类别对应的目标特征。
通过上述步骤(1)-(3)实现提取能够代表整个训练图像集基本特征的目标特征,从而达到缩小训练样本数量规模的目的,同时通过使用抑制信号对兴奋信号进行弱化来达到消除噪声影响的目的。
在步骤S203中,根据由提取得到的目标特征构成的目标特征集,对隐含层进行局部训练,直至特征提取面和下采样面设置的种子细胞对应的连接域激活值达到预设的激活阈值。
在本发明实施例中,特征提取层/下采样层上的每个特征提取面/下采样面都代表一种特征的提取,首先,在要训练的平面(即特征提取面或者下采样面)设置一个种子细胞(即种子神经元),再根据由提取出的所有目标特征构成的目标特征集,对隐含层进行局部训练,直至设置的种子细胞对应的连接域激活值达到预设的激活阈值,则停止训练,其中,种子细胞对应的连接域激活值为该种子细胞所在面所在层的上一层对应面传输过来的输入信号。
在对隐含层进行局部训练时,优选地,根据目标特征集,采用结合了抑制信号和兴奋信号的特征提取公式Vl(n,k)=El(n,k)-Il(n),从隐含层的第一层开始,且分别对每层中每个特征提取面和下采样面进行逐面逐层训练的方式,对深度学习模型的隐含层进行局部训练,从而实现通过少量的训练样本完成对隐含层的训练,提高了训练速度,并提高了训练后隐含层提取出的特征的显著性。
进一步优选地,深度学***面(S面或者C面)的连接域激活值,也即第k个平面提取出的兴奋信号,n为第k个平面上的正中间细胞(也即种子细胞或者种子神经元),为RELU非线性激活函数,且其满足v代表正中间细胞周围的细胞(或者神经元),al(v,K,k)为第l层上第k个平面与第l-1层(也即第l层的上一层)上第K个平面之间的权重矩阵,uCl-1(n+v,K)为第l层的前一个C层传过来的输入信号,Al为第l层对应的感受野窗口,从而提高了提取出的特征的显著性。
又一优选地,深度学习模型的抑制信号采用公式而获得,其中,Il(n)为第l层的抑制信号,cl(v)为第l层的抑制矩阵,从而引入抑制信号增强深度学习模型的抗噪声/扭曲能力。
在采用从隐含层的第一层开始,且分别对每层中每个特征提取面和下采样面进行逐面逐层训练的方式,对深度学***面与第l-1层(也即第l层的上一层)上第K个平面之间的更新后的权重矩阵,从而进一步提高了训练后隐含层提取出的特征的显著性。
在步骤S204中,根据预先从训练图像集中选出的目标图像集,对已完成局部训练的深度学习模型进行全连接层的分类训练,以完成该深度学习模型的线下训练。
在本发明实施例中,预先从训练图像集中选取有代表性的训练图像,由选取出的所有训练图像构成目标图像集,根据该目标图像集,对已完成局部训练的深度学习模型进行输出层(也即全连接层)的分类训练,以完成该深度学习模型的线下训练。
在对已完成局部训练的深度学***移和抗旋转能力。
在本发明实施例中,根据接收到的训练图像集,采用预设的特征提取算法和预先构建的、未训练的深度学习模型,提取对应的目标特征,通过由提取出的目标特征构成的目标特征集对深度学习模型的隐含层进行局部训练,局部训练完成后,根据从训练图像集中选出的目标图像集,对该深度学习模型的全连接层进行分类训练,以完成该深度学习模型的线下训练,从而降低了对深度学习模型进行训练的样本数量,使得训练出的深度学习模型更符合人脑视觉皮层特性,并提高了深度学习模型的抗噪声和抗位移能力,进而提高了深度学习模型的训练速度和训练效果。
实施例三:
图3示出了本发明实施例三提供的深度学习模型的在线学习装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:
线上图像识别单元31,用于通过线下预先训练好的、引入了抑制信号和兴奋信号的深度学习模型对接收到的线上训练图像进行图像识别,得到图像识别结果;
基本特征提取单元32,用于当根据图像识别结果确定线上训练图像为不能识别图像时,通过滑动窗口对线上训练图像进行切割,得到与深度学习模型每层感受野大小相同的对应基本特征;
相似度匹配单元33,用于根据基本特征的尺寸大小,将由基本特征构成的基本特征集与预先存储的训练图像集进行相似度匹配,得到每个基本特征对应的相似度,将所有相似度中低于预设相似度阈值的相似度所对应的基本特征设置为奇异特征;以及
模型训练单元34,用于根据由奇异特征构成的奇异特征集和预设的模型训练算法,对深度学习模型进行再次训练,以对深度学习模型的各参数进行调整,完成该深度学习模型的在线学习。
在本发明实施例中,深度学习模型的在线学习装置的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。具体地,各单元的实施方式可参考前述实施例一的描述,在此不再赘述。
实施例四:
图4示出了本发明实施例四提供的深度学习模型的在线学习装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:
模型构建单元41,用于根据训练图像集,构建深度学习模型;
目标特征提取单元42,用于根据训练图像集,采用构建完成的深度学习模型和预设的特征提取算法,提取对应的目标特征;
局部训练单元43,用于根据由提取得到的目标特征构成的目标特征集,对隐含层进行局部训练,直至特征提取面和下采样面设置的种子细胞对应的连接域激活值达到预设的激活阈值;
全局训练单元44,用于根据预先从训练图像集中选出的目标图像集,对已完成局部训练的深度学习模型进行全连接层的分类训练,以完成该深度学习模型的线下训练;
线上图像识别单元45,用于通过线下预先训练好的、引入了抑制信号和兴奋信号的深度学习模型对接收到的线上训练图像进行图像识别,得到图像识别结果;
基本特征提取单元46,用于当根据图像识别结果确定线上训练图像为不能识别图像时,通过滑动窗口对该线上训练图像进行切割,得到与深度学习模型每层感受野大小相同的对应基本特征;
相似度匹配单元47,用于根据基本特征的尺寸大小,将由基本特征构成的基本特征集与预先存储的训练图像集进行相似度匹配,得到每个基本特征对应的相似度,将所有相似度中低于预设相似度阈值的相似度所对应的基本特征设置为奇异特征;以及
模型训练单元48,用于根据由奇异特征构成的奇异特征集和预设的模型训练算法,对深度学习模型进行再次训练,以对深度学习模型的各参数进行调整,完成该深度学习模型的在线学习。
其中,如图4所示,优选地,目标特征提取单元42包括:
初始特征获得单元421,用于使用构建完成的深度学习模型得到训练图像集中每个训练图像对应的初始特征;
特征类别获得单元422,用于采用相似度聚类算法对所有初始特征进行分类,得到若干个特征类别;以及
目标特征获得单元423,用于分别对每个特征类别中的所有初始特征进行加权平均计算,得到特征类别对应的目标特征。
局部训练单元43包括:
局部训练子单元431,用于根据目标特征集,采用从隐含层的第一层开始,分别对每层中每个特征提取面和下采样面进行逐面逐层训练的方式,对隐含层进行局部训练。
全局训练单元44包括:
全局训练子单元441,用于根据目标图像集,采用反向传播算法对全连接层进行分类训练,并对深度学习模型各层之间的权值进行更正,以完成对深度学习模型的线下训练。
线上图像识别单元45包括:
图像识别子单元451,用于采用结合抑制信号和兴奋信号的特征提取公式Vl(n,k)=El(n,k)-Il(n)对输入深度学***面的特征矩阵,El(n,k)为深度学***面的兴奋信号,Il(n)为深度学***面上的正中间细胞。
在本发明实施例中,深度学习模型的在线学习装置的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。具体地,各单元的实施方式可参考前述方法实施例的描述,在此不再赘述。
实施例五:
图5示出了本发明实施例五提供的计算设备的结构,为了便于说明,仅示出了与本发明实施例相关的部分。
本发明实施例的计算设备5包括处理器50、存储器51以及存储在存储器51中并可在处理器50上运行的计算机程序52。该处理器50执行计算机程序52时实现上述深度学习模型的在线学习方法实施例中的步骤,例如图1所示的步骤S101至S104。或者,处理器50执行计算机程序52时实现上述各装置实施例中各单元的功能,例如图3所示单元31至34的功能。
在本发明实施例中,对引入抑制信号的深度学习模型进行线下训练,训练好后将该深度学习模型发布到线上,通过该深度学习模型对接收到的线上训练图像进行图像识别,当根据得到的图像识别结果确定线上训练图像为不能识别图像时,通过滑动窗口对线上训练图像进行切割,得到对应的基本特征,根据基本特征的尺寸大小,将由基本特征构成的基本特征集与预先存储的训练图像集进行相似度匹配,得到每个基本特征对应的相似度,将所有相似度中低于预设相似度阈值的相似度所对应的基本特征设置为奇异特征,根据由奇异特征构成的奇异特征集和预设的模型训练算法,对深度学习模型进行再次训练,以对深度学习模型的各参数进行调整,完成深度学习模型的在线学习,从而通过引入抑制信号提高深度学习模型的噪声鲁棒性,并通过个性化训练提高了模型识别精度,使得训练出的深度学习模型更符合人脑视觉皮层特性。
本发明实施例的计算设备可以为个人计算机、服务器。该计算设备5中处理器50执行计算机程序52时实现深度学习模型的在线学习方法时实现的步骤可参考前述方法实施例的描述,在此不再赘述。
实施例六:
在本发明实施例中,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述深度学习模型的在线学习方法实施例中的步骤,例如,图1所示的步骤S101至S104。或者,该计算机程序被处理器执行时实现上述各装置实施例中各单元的功能,例如图3所示单元31至34的功能。
在本发明实施例中,对引入抑制信号的深度学习模型进行线下训练,训练好后将该深度学习模型发布到线上,通过该深度学习模型对接收到的线上训练图像进行图像识别,当根据得到的图像识别结果确定线上训练图像为不能识别图像时,通过滑动窗口对线上训练图像进行切割,得到对应的基本特征,根据基本特征的尺寸大小,将由基本特征构成的基本特征集与预先存储的训练图像集进行相似度匹配,得到每个基本特征对应的相似度,将所有相似度中低于预设相似度阈值的相似度所对应的基本特征设置为奇异特征,根据由奇异特征构成的奇异特征集和预设的模型训练算法,对深度学习模型进行再次训练,以对深度学习模型的各参数进行调整,完成深度学习模型的在线学习,从而通过引入抑制信号提高深度学习模型的噪声鲁棒性,并通过个性化训练提高了模型识别精度,使得训练出的深度学习模型更符合人脑视觉皮层特性。
本发明实施例的计算机可读存储介质可以包括能够携带计算机程序代码的任何实体或装置、记录介质,例如,ROM/RAM、磁盘、光盘、闪存等存储器。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种深度学习模型的在线学习方法,其特征在于,所述方法包括下述步骤:
通过线下预先训练好的、引入了抑制信号和兴奋信号的深度学习模型对接收到的线上训练图像进行图像识别,得到图像识别结果;
当根据所述图像识别结果确定所述线上训练图像为不能识别图像时,通过滑动窗口对所述线上训练图像进行切割,得到与所述深度学习模型每层感受野大小相同的对应基本特征;
根据所述基本特征的尺寸大小,将由所述基本特征构成的基本特征集与预先存储的训练图像集进行相似度匹配,得到每个基本特征对应的相似度,将所有相似度中低于预设相似度阈值的相似度所对应的基本特征设置为奇异特征;
根据由所述奇异特征构成的奇异特征集和预设的模型训练算法,对所述深度学习模型进行再次训练,以对所述深度学习模型的各参数进行调整,完成所述深度学习模型的在线学习。
2.如权利要求1所述的方法,其特征在于,所述深度学习模型包括隐含层和全连接层,所述隐含层由若干特征提取层和与所述特征提取层对应的下采样层组成,所述特征提取层由若干特征提取面组成,所述下采样层由若干下采样面组成,所述全连接层为所述深度学习模型的输出层。
3.如权利要求2所述的方法,其特征在于,对接收到的线上训练图像进行图像识别的步骤,包括:
采用结合抑制信号和兴奋信号的特征提取公式Vl(n,k)=El(n,k)-Il(n)对输入所述深度学***面的特征矩阵,所述El(n,k)为所述深度学***面的兴奋信号,所述Il(n)为所述深度学***面上的正中间细胞。
4.如权利要求2所述的方法,其特征在于,对接收到的线上训练图像进行图像识别的步骤之前,所述方法还包括:
根据所述训练图像集,构建所述深度学习模型;
根据所述训练图像集,采用构建完成的所述深度学习模型和预设的特征提取算法,提取对应的目标特征;
根据由提取得到的所述目标特征构成的目标特征集,对所述隐含层进行局部训练,直至所述特征提取面和所述下采样面设置的种子细胞对应的连接域激活值达到预设的激活阈值;
根据预先从所述训练图像集中选出的目标图像集,对已完成所述局部训练的所述深度学习模型进行所述全连接层的分类训练,以完成所述深度学习模型的线下训练。
5.如权利要求4所述的方法,其特征在于,提取对应的目标特征的步骤,包括:
使用构建完成的所述深度学习模型得到所述训练图像集中每个训练图像对应的初始特征;
采用相似度聚类算法对所有所述初始特征进行分类,得到若干个特征类别;
分别对每个所述特征类别中的所有初始特征进行加权平均计算,得到所述特征类别对应的目标特征。
6.如权利要求4所述的方法,其特征在于,对所述深度学习模型的隐含层进行局部训练的步骤,包括:
根据所述目标特征集,采用从隐含层的第一层开始,分别对每层中每个所述特征提取面和所述下采样面进行逐面逐层训练的方式,对所述隐含层进行局部训练。
7.如权利要求4所述的方法,其特征在于,对已完成所述局部训练的所述深度学习模型进行所述全连接层的分类训练的步骤,包括:
根据所述目标图像集,采用反向传播算法对所述全连接层进行分类训练,并对所述深度学习模型各层之间的权值进行更正,以完成所述深度学习模型的线下训练。
8.一种深度学习模型的在线学习装置,其特征在于,所述装置包括:
线上图像识别单元,用于通过线下预先训练好的、引入了抑制信号和兴奋信号的深度学习模型对接收到的线上训练图像进行图像识别,得到图像识别结果;
基本特征提取单元,用于当根据所述图像识别结果确定所述线上训练图像为不能识别图像时,通过滑动窗口对所述线上训练图像进行切割,得到与所述深度学习模型每层感受野大小相同的对应基本特征;
相似度匹配单元,用于根据所述基本特征的尺寸大小,将由所述基本特征构成的基本特征集与预先存储的训练图像集进行相似度匹配,得到每个基本特征对应的相似度,将所有相似度中低于预设相似度阈值的相似度所对应的基本特征设置为奇异特征;以及
模型训练单元,用于根据由所述奇异特征构成的奇异特征集和预设的模型训练算法,对所述深度学习模型进行再次训练,以对所述深度学习模型的各参数进行调整,完成所述深度学习模型的在线学习。
9.一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
CN201910722508.5A 2019-08-06 2019-08-06 一种深度学习模型的在线学习方法、装置、设备及介质 Active CN110598737B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910722508.5A CN110598737B (zh) 2019-08-06 2019-08-06 一种深度学习模型的在线学习方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910722508.5A CN110598737B (zh) 2019-08-06 2019-08-06 一种深度学习模型的在线学习方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN110598737A true CN110598737A (zh) 2019-12-20
CN110598737B CN110598737B (zh) 2023-02-24

Family

ID=68853513

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910722508.5A Active CN110598737B (zh) 2019-08-06 2019-08-06 一种深度学习模型的在线学习方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN110598737B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112347893A (zh) * 2020-11-02 2021-02-09 深圳大学 用于视频行为识别的模型训练方法、装置和计算机设备
CN112560338A (zh) * 2020-12-10 2021-03-26 东北大学 基于自适应深度学习的复杂工业***智能预报方法、装置、设备及存储介质
CN116736511A (zh) * 2023-06-28 2023-09-12 江苏集萃华科智能装备科技有限公司 一种基于深度学习的自然图像自动对焦方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473558A (zh) * 2013-09-04 2013-12-25 深圳先进技术研究院 基于神经网络的图像识别方法和***
US20150254532A1 (en) * 2014-03-07 2015-09-10 Qualcomm Incorporated Photo management
CN107704859A (zh) * 2017-11-01 2018-02-16 哈尔滨工业大学深圳研究生院 一种基于深度学习训练框架的文字识别方法
US20180114334A1 (en) * 2016-10-24 2018-04-26 International Business Machines Corporation Edge-based adaptive machine learning for object recognition
CN108416370A (zh) * 2018-02-07 2018-08-17 深圳大学 基于半监督深度学习的图像分类方法、装置和存储介质
CN108765373A (zh) * 2018-04-26 2018-11-06 西安工程大学 一种基于集成分类器在线学习的绝缘子异常自动检测方法
US20190095764A1 (en) * 2017-09-26 2019-03-28 Panton, Inc. Method and system for determining objects depicted in images
CN109543818A (zh) * 2018-10-19 2019-03-29 中国科学院计算技术研究所 一种基于深度学习模型的链路评估方法和***
CN109754068A (zh) * 2018-12-04 2019-05-14 中科恒运股份有限公司 基于深度学习预训练模型的迁移学习方法及终端设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473558A (zh) * 2013-09-04 2013-12-25 深圳先进技术研究院 基于神经网络的图像识别方法和***
US20150254532A1 (en) * 2014-03-07 2015-09-10 Qualcomm Incorporated Photo management
US20180114334A1 (en) * 2016-10-24 2018-04-26 International Business Machines Corporation Edge-based adaptive machine learning for object recognition
US20190095764A1 (en) * 2017-09-26 2019-03-28 Panton, Inc. Method and system for determining objects depicted in images
CN107704859A (zh) * 2017-11-01 2018-02-16 哈尔滨工业大学深圳研究生院 一种基于深度学习训练框架的文字识别方法
CN108416370A (zh) * 2018-02-07 2018-08-17 深圳大学 基于半监督深度学习的图像分类方法、装置和存储介质
CN108765373A (zh) * 2018-04-26 2018-11-06 西安工程大学 一种基于集成分类器在线学习的绝缘子异常自动检测方法
CN109543818A (zh) * 2018-10-19 2019-03-29 中国科学院计算技术研究所 一种基于深度学习模型的链路评估方法和***
CN109754068A (zh) * 2018-12-04 2019-05-14 中科恒运股份有限公司 基于深度学习预训练模型的迁移学习方法及终端设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KUH, ANTHONY ET AL.: ""Online Unsupervised Kernel Learning Algorithms"", 《2017 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERENCE》 *
李海涛: ""基于深度学习的图像识别鲁棒性研究"", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112347893A (zh) * 2020-11-02 2021-02-09 深圳大学 用于视频行为识别的模型训练方法、装置和计算机设备
CN112347893B (zh) * 2020-11-02 2023-07-21 深圳大学 用于视频行为识别的模型训练方法、装置和计算机设备
CN112560338A (zh) * 2020-12-10 2021-03-26 东北大学 基于自适应深度学习的复杂工业***智能预报方法、装置、设备及存储介质
CN112560338B (zh) * 2020-12-10 2022-03-25 东北大学 基于自适应深度学习的复杂工业***智能预报方法、装置、设备及存储介质
CN116736511A (zh) * 2023-06-28 2023-09-12 江苏集萃华科智能装备科技有限公司 一种基于深度学习的自然图像自动对焦方法
CN116736511B (zh) * 2023-06-28 2024-07-02 江苏集萃华科智能装备科技有限公司 一种基于深度学习的自然图像自动对焦方法

Also Published As

Publication number Publication date
CN110598737B (zh) 2023-02-24

Similar Documents

Publication Publication Date Title
CN108229444B (zh) 一种基于整体和局部深度特征融合的行人再识别方法
Zellinger et al. Robust unsupervised domain adaptation for neural networks via moment alignment
CN110188794B (zh) 一种深度学习模型的训练方法、装置、设备及存储介质
CN108717568B (zh) 一种基于三维卷积神经网络的图像特征提取与训练方法
CN110245608B (zh) 一种基于半张量积神经网络的水下目标识别方法
CN106845529B (zh) 基于多视野卷积神经网络的影像特征识别方法
CN108491765B (zh) 一种蔬菜图像的分类识别方法及***
CN107145830B (zh) 基于空间信息增强和深度信念网络的高光谱图像分类方法
CN111753881B (zh) 一种基于概念敏感性量化识别对抗攻击的防御方法
CN107798349B (zh) 一种基于深度稀疏自编码机的迁移学习方法
CN110598737B (zh) 一种深度学习模型的在线学习方法、装置、设备及介质
CN110459225B (zh) 一种基于cnn融合特征的说话人辨认***
CN109934158B (zh) 基于局部强化运动历史图和递归卷积神经网络的视频情感识别方法
CN109086653B (zh) 手写模型训练方法、手写字识别方法、装置、设备及介质
CN108446676B (zh) 基于有序编码及多层随机投影的人脸图像年龄判别方法
Tao et al. Hierarchical attention-based recurrent highway networks for time series prediction
CN109190521B (zh) 一种基于知识提纯的人脸识别模型的构建方法及应用
CN110880010A (zh) 基于卷积神经网络的视觉slam闭环检测算法
Tereikovskyi et al. The method of semantic image segmentation using neural networks
CN109344713A (zh) 一种姿态鲁棒的人脸识别方法
CN113807356B (zh) 一种端到端的低能见度图像语义分割方法
CN107239827B (zh) 一种基于人工神经网络的空间信息学习方法
CN114170657A (zh) 融合注意力机制与高阶特征表示的面部情感识别方法
CN114202792A (zh) 一种基于端到端卷积神经网络的人脸动态表情识别方法
CN109101984B (zh) 一种基于卷积神经网络的图像识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant