CN104268521A - 一种基于非限定类别的卷积神经网络的图像识别方法 - Google Patents
一种基于非限定类别的卷积神经网络的图像识别方法 Download PDFInfo
- Publication number
- CN104268521A CN104268521A CN201410488286.2A CN201410488286A CN104268521A CN 104268521 A CN104268521 A CN 104268521A CN 201410488286 A CN201410488286 A CN 201410488286A CN 104268521 A CN104268521 A CN 104268521A
- Authority
- CN
- China
- Prior art keywords
- layer
- convolutional neural
- neural networks
- output
- convolutional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于非限定类别的卷积神经网络的图像识别方法;所述的方法包括训练模型、注册数据和识别匹配三个部分;在训练模型的过程中,将训练样本输入卷积神经网络模型,将输出层的二进制编码与该样本的类别二进制编码计算误差,调整模型参数;在注册数据过程中,将需注册的样本图像输入卷积神经网络模型,将输出层的前一层隐含层输出结果作为特征向量予以存储;在识别匹配过程中,将待识别匹配输入卷积神经网络,将输出层的前一层隐含层输出结果作为特征向量,而后将该特征向量与已注册的特征向量进行匹配,从而给出识别匹配的判决结果。
Description
技术领域
本发明涉及图像识别技术领域,尤其是基于卷积神经网络的图像识别技术领域。
背景技术
目前,公知的卷积神经网络的输出层为类别编码。这就要求,模型训练结束后,使用模型的待识别的图像需要和训练模型的样本具有相同的类别,并且,模型能够识别的类别数也是固定的。
这样的卷积神经网络在固定类别的图像识别领域是适用的,并且,在许多固定类别的图像识别领域中取得了很好的效果,如手写字母识别、手写数字识别等。
然而,还有许多图像识别领域,特别是生物特征的图像识别领域,如人脸识别、指纹识别、静脉识别等,在模型训练后,需要识别的图像样本和模型训练的样本属于不同类别,并且,需要识别的类别数是随着使用过程中注册的数据变化而变化的。这就使得公知的卷积神经网络不能用于这些图像识别领域。
发明内容
为了克服现有的卷积神经网络模型不能用于非限定类别的图像识别领域,本发明提出了一种基于非限定类别的卷积神经网络的图像识别方法。该方法不限定训练模型后识别分类的样本和训练样本具有相同的类别,也不限定分类的类别数固定不变。同时,该方法具有较高的识别率。
本发明所提出的一种基于非限定类别的卷积神经网络的图像识别方法包括S100训练模型、S200注册数据和S300识别匹配三个部分。图1给出了本发明的总体流程图。
本发明所述的非限定类别的卷积神经网络,其结构为:包括一个输入层I,在输入层之后,交替分布卷积层C1、降采样层S1、……、卷积层Ck、降采样层Sk、卷积层Ck+1,在最后一个卷积层Ck+1之后为若干个隐含层H1、H2、……Hn,在最后一个隐含层Hn之后,为输出层O。图2给出了卷积神经网络的结构示意图。
所述的输入层的每个节点对应于输入图像的一个像素。所述的输入图像,可以是采集的原始图像,也可以是经过滤波或归一化后的图像。
所述的卷积层的每一层包括多个特征图,同一层的特征图的尺寸相同,且每个特征图的像素,对应于前一层的指定的若干特征图相应窗口位置的像素集合。
所述的降采样层的每一层包括多个相同尺寸的特征图;降采样层的每张特征图对应于前一层卷积层的一张特征图;降采样层的特征图的像素对应于前一层相应特征图的采样区域;所有的采样区域没有重叠部分。
所述的隐含层的每个节点与前一层的每个节点和后一层的每个节点都是通过带权重的边相互联系的。
所述的输出层的每个节点只输出0或者1,故输出层的输出为一个二进制编码的输出向量。
所述的训练模型S100训练模型包括S110-S130的步骤。
S110初始化卷积神经网络,该过程包括S111-S116的步骤。
S111设置训练次终止条件参数。
S112设置每个卷积层的特征图的个数及卷积窗口尺寸。
S113设置每个降采样层的特征图的个数及降采样比例。
S114设置每个卷积层与前一层特征图的对应关系。
S115设置输出层的节点个数,使得该节点个数与训练样本的类别二进制编码的位数相同。
S116初始化卷积神经网络中的边的权重参数为随机数。
S120执行训练过程,重复执行S121-S128的步骤,直至满足训练终止条件为止。
S121将训练图像输入卷积神经网络的输入层。
S122 若当前层为卷积层,则根据卷积计算公式,对前一层所选中的图像数据进行卷积计算,从而得到卷积层的特征图的结果。其计算过程为:将前一层选中图像数据及相应的卷积核根据公式(1)计算相应区域的卷积;而后将计算的卷积结果根据公式(2)得出Sigm函数的计算结果;最后,根据公式(3),对各选中图像的卷积结果进行求和,得到卷积层相应的卷积结果。图3给出了卷积过程的示意图。
(1)。
(2)。
S = Σ Si (3)。
S123若当前层为降采样层,则根据前一层相应的特征图进行降采样计算,从而得到降采样层的特征图结果。公式(4)给出了降采样的计算公式。其中,C为上一层特征图的区域数据,N1与N2分别为上一层特征图在图像的两个维度上的降采样倍数。图4给出了降采样过程的示意图。
(4)。
S124重复执行步骤S122及步骤S123,直至最后一个卷积层的计算结果完成为止。
S125根据隐含层前一层节点的输出数据、隐含层与前一层节点间的边的权重,计算出隐含层节点的输出数据。重复进行,直至将最后一个隐含层的输出计算完成为止。公式(5)给出了隐含层节点的计算方法。图5给出了隐含层结构的示意图。
y = Sigm (Σwixi + b) (5)。
S126根据最后一个隐含层的输出结果,及隐含层与输出层之间的边的权重,计算输出层的输出向量。输出层的计算公式与公式(5)相同。
S127输出层输出向量与输入的样本所属的类别的二进制编码之间的误差。公式(6)给出了误差的计算公式。
(6)。
S128将步骤S127计算的误差由输出层输入卷积神经网络,逐层调整卷积神经网络中各层之间的权重参数。
所述的S200注册数据包含S210-S220的步骤。
S210将需要注册的图像输入由S100训练好的卷积神经网络,经执行步骤S122-S125。
S220将步骤S210得到的最后一个隐含层的输出结果作为该注册图像的特征向量予以存储。
所述的S300识别匹配包含S310-S330的步骤。
S310将待识别匹配的图像输入由S100训练好的卷积神经网络,经执行步骤S122-S125。
S320将步骤S310得到的最后一个隐含层的输出结果作为该带识别匹配图像的特征向量,与S200已存储的注册数据的特征向量计算距离。
S330根据步骤S320的计算结果,给出识别匹配的判决结果。
本发明的有益效果是,通过在注册数据、识别匹配的过程中,使用训练好的卷积神经网络的最后一个隐含层的输出向量作为特征向量,一方面采纳了训练过程中对训练样本的分类特征,另一方面又摆脱了卷积神经网络仅能够对训练样本所属类别进行分类的限制,从而实现了对非限定类别的图像进行分类的目的;与此同时,本发明具有较高的识别率。
附图说明
图1给出了一种基于非限定类别的卷积神经网络的图像识别方法的总体流程图。
图2给出了卷积神经网络的结构示意图。
图3给出了卷积过程的示意图。
图4给出了降采样过程的示意图。
图5给出了隐含层结构的示意图。
Claims (10)
1.一种基于非限定类别的卷积神经网络的图像识别方法,其特征在于:包括训练卷模型、注册数据、识别匹配三大部分。
2.根据权利要求1所述的卷积神经网络,其特征在于:包括一个输入层,在输入层之后,交替分布卷积层、降采样层、……、降采样层、卷积层,在最后一个卷积层之后为若干个隐含层,在最后一个隐含层之后,为输出层。
3. 根据权利要求2所述的输入层,其特征在于:输入层对应于输入图像,每个节点对应于输入图像的一个像素;输入图像可以是原始图像,也可以是经过滤波或归一化后的图像。
4. 根据权利要求2所述的卷积层,其特征在于:每个卷积层包括多个特征图同一层的特征图的尺寸相同,且每个特征图的像素,对应于前一层指定的若干特征图相应窗口位置的像素集合。
5. 根据权利要求2所述的降采样层,其特征在于:每个降采样层包括过个相同尺寸的特征图;降采样层的每张特征图对应于前一层卷积层的一张特征图;降采样层的特征图的像素对应于前一层相应特征图的采样区域;所有的采样区域没有重叠部分。
6. 根据权利要求2所述的隐含层,其特征在于:该层的每个节点与前一层的每个节点和后一层的每个节点都是通过带权重的边相互联系的。
7. 根据权利要求2所述的输出层,其特征在于:该层的每个节点只输出0或者1,从而输出层形成了一组二进制编码。
8. 根据权利要求1所述的训练模型,其特征在于:训练样本的类别以0、1进行二进制编码,编码的长度与输出层的节点数相一致;初始化卷积神经网络的参数为随机数;将训练样本输入卷积神经网络,将输出层的输出编码与训练样本的二进制类别编码计算误差;将误差从输出层反向传递进入卷积神经网络,调整卷积神经网络的参数;而后,再次将训练样本输入卷积神经网络,重复上述过程,直至误差小于指定阈值或训练次数达到要求为止。
9. 根据权利要求1所述的注册数据,其特征在于:将注册的图像数据送入卷积神经网络,将最后一个隐含层的输出向量作为该样本的特征向量,存储于数据库中。
10. 根据权利要求1所述的识别匹配,其特征在于:将待识别的图像数据送入卷积神经网络,将最后一个隐含层的输出向量作为该样本的特征向量,将该特征向量与权利要求9所述的数据库中已注册的特征向量计算距离,从而做出识别匹配的判决结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410488286.2A CN104268521A (zh) | 2014-09-23 | 2014-09-23 | 一种基于非限定类别的卷积神经网络的图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410488286.2A CN104268521A (zh) | 2014-09-23 | 2014-09-23 | 一种基于非限定类别的卷积神经网络的图像识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104268521A true CN104268521A (zh) | 2015-01-07 |
Family
ID=52160041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410488286.2A Pending CN104268521A (zh) | 2014-09-23 | 2014-09-23 | 一种基于非限定类别的卷积神经网络的图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104268521A (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104268524A (zh) * | 2014-09-24 | 2015-01-07 | 朱毅 | 一种基于动态调整训练目标的卷积神经网络的图像识别方法 |
CN104573679A (zh) * | 2015-02-08 | 2015-04-29 | 天津艾思科尔科技有限公司 | 监控场景下基于深度学习的人脸识别*** |
CN104778448A (zh) * | 2015-03-24 | 2015-07-15 | 孙建德 | 一种基于结构自适应卷积神经网络的人脸识别方法 |
CN105389596A (zh) * | 2015-12-21 | 2016-03-09 | 长沙网动网络科技有限公司 | 卷积神经网络适用于识别多种尺寸图片的方法 |
WO2016149881A1 (en) * | 2015-03-20 | 2016-09-29 | Intel Corporation | Object recogntion based on boosting binary convolutional neural network features |
CN106096510A (zh) * | 2016-05-31 | 2016-11-09 | 北京小米移动软件有限公司 | 指纹识别的方法和装置 |
CN106250911A (zh) * | 2016-07-20 | 2016-12-21 | 南京邮电大学 | 一种基于卷积神经网络的图片分类方法 |
CN106407369A (zh) * | 2016-09-09 | 2017-02-15 | 华南理工大学 | 一种基于深度学习人脸识别的照片管理方法和*** |
WO2017173605A1 (en) * | 2016-04-06 | 2017-10-12 | Xiaogang Wang | Method and system for person recognition |
CN107392158A (zh) * | 2017-07-27 | 2017-11-24 | 济南浪潮高新科技投资发展有限公司 | 一种图像识别的方法及装置 |
WO2018120740A1 (zh) * | 2016-12-29 | 2018-07-05 | 深圳光启合众科技有限公司 | 图片分类方法和装置、机器人 |
CN108553028A (zh) * | 2018-04-12 | 2018-09-21 | 深圳市沃特沃德股份有限公司 | 驱赶老鼠方法及扫地机器人 |
CN109102532A (zh) * | 2017-06-20 | 2018-12-28 | 西门子保健有限责任公司 | 用于医学成像的深度学习的组织变形 |
CN109187534A (zh) * | 2018-08-01 | 2019-01-11 | 江苏凯纳水处理技术有限公司 | 水质检测方法及其水样图像识别装置 |
WO2019200735A1 (zh) * | 2018-04-17 | 2019-10-24 | 平安科技(深圳)有限公司 | 牲畜特征向量的提取方法、装置、计算机设备和存储介质 |
CN110573859A (zh) * | 2017-04-13 | 2019-12-13 | 美国西门子医学诊断股份有限公司 | 用于使用卷积神经网络的hiln表征的方法和装置 |
CN111914984A (zh) * | 2019-05-07 | 2020-11-10 | 财团法人成大研究发展基金会 | 用于辨识装置的人工神经网络正规化*** |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070047802A1 (en) * | 2005-08-31 | 2007-03-01 | Microsoft Corporation | Training convolutional neural networks on graphics processing units |
CN103544506A (zh) * | 2013-10-12 | 2014-01-29 | Tcl集团股份有限公司 | 一种基于卷积神经网络的图像分类方法和装置 |
CN104036323A (zh) * | 2014-06-26 | 2014-09-10 | 叶茂 | 一种基于卷积神经网络的车辆检测方法 |
-
2014
- 2014-09-23 CN CN201410488286.2A patent/CN104268521A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070047802A1 (en) * | 2005-08-31 | 2007-03-01 | Microsoft Corporation | Training convolutional neural networks on graphics processing units |
CN103544506A (zh) * | 2013-10-12 | 2014-01-29 | Tcl集团股份有限公司 | 一种基于卷积神经网络的图像分类方法和装置 |
CN104036323A (zh) * | 2014-06-26 | 2014-09-10 | 叶茂 | 一种基于卷积神经网络的车辆检测方法 |
Non-Patent Citations (3)
Title |
---|
肖柏旭: "基于卷积网络的人脸检测的研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
许可: "卷积神经网络在图像识别上的应用的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
陈先昌: "基于卷积神经网络的深度学习算法与应用研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104268524A (zh) * | 2014-09-24 | 2015-01-07 | 朱毅 | 一种基于动态调整训练目标的卷积神经网络的图像识别方法 |
CN104573679A (zh) * | 2015-02-08 | 2015-04-29 | 天津艾思科尔科技有限公司 | 监控场景下基于深度学习的人脸识别*** |
CN104573679B (zh) * | 2015-02-08 | 2018-06-22 | 天津艾思科尔科技有限公司 | 监控场景下基于深度学习的人脸识别*** |
WO2016149881A1 (en) * | 2015-03-20 | 2016-09-29 | Intel Corporation | Object recogntion based on boosting binary convolutional neural network features |
CN107430677B (zh) * | 2015-03-20 | 2022-04-12 | 英特尔公司 | 基于对二进制卷积神经网络特征进行提升的目标识别 |
US10685262B2 (en) | 2015-03-20 | 2020-06-16 | Intel Corporation | Object recognition based on boosting binary convolutional neural network features |
CN107430677A (zh) * | 2015-03-20 | 2017-12-01 | 英特尔公司 | 基于对二进制卷积神经网络特征进行提升的目标识别 |
CN104778448B (zh) * | 2015-03-24 | 2017-12-15 | 孙建德 | 一种基于结构自适应卷积神经网络的人脸识别方法 |
CN104778448A (zh) * | 2015-03-24 | 2015-07-15 | 孙建德 | 一种基于结构自适应卷积神经网络的人脸识别方法 |
CN105389596A (zh) * | 2015-12-21 | 2016-03-09 | 长沙网动网络科技有限公司 | 卷积神经网络适用于识别多种尺寸图片的方法 |
CN105389596B (zh) * | 2015-12-21 | 2018-05-29 | 长沙网动网络科技有限公司 | 卷积神经网络适用于识别多种尺寸图片的方法 |
WO2017173605A1 (en) * | 2016-04-06 | 2017-10-12 | Xiaogang Wang | Method and system for person recognition |
CN106096510A (zh) * | 2016-05-31 | 2016-11-09 | 北京小米移动软件有限公司 | 指纹识别的方法和装置 |
CN106096510B (zh) * | 2016-05-31 | 2019-08-30 | 北京小米移动软件有限公司 | 指纹识别的方法和装置 |
CN106250911A (zh) * | 2016-07-20 | 2016-12-21 | 南京邮电大学 | 一种基于卷积神经网络的图片分类方法 |
CN106250911B (zh) * | 2016-07-20 | 2019-05-24 | 南京邮电大学 | 一种基于卷积神经网络的图片分类方法 |
CN106407369A (zh) * | 2016-09-09 | 2017-02-15 | 华南理工大学 | 一种基于深度学习人脸识别的照片管理方法和*** |
WO2018120740A1 (zh) * | 2016-12-29 | 2018-07-05 | 深圳光启合众科技有限公司 | 图片分类方法和装置、机器人 |
CN108256544A (zh) * | 2016-12-29 | 2018-07-06 | 深圳光启合众科技有限公司 | 图片分类方法和装置、机器人 |
CN108256544B (zh) * | 2016-12-29 | 2019-07-23 | 杭州光启人工智能研究院 | 图片分类方法和装置、机器人 |
CN110573859A (zh) * | 2017-04-13 | 2019-12-13 | 美国西门子医学诊断股份有限公司 | 用于使用卷积神经网络的hiln表征的方法和装置 |
CN110573859B (zh) * | 2017-04-13 | 2022-07-26 | 美国西门子医学诊断股份有限公司 | 用于使用卷积神经网络的hiln表征的方法和装置 |
CN109102532A (zh) * | 2017-06-20 | 2018-12-28 | 西门子保健有限责任公司 | 用于医学成像的深度学习的组织变形 |
US11154196B2 (en) * | 2017-06-20 | 2021-10-26 | Siemens Healthcare Gmbh | Deep-learnt tissue deformation for medical imaging |
CN109102532B (zh) * | 2017-06-20 | 2022-07-15 | 西门子保健有限责任公司 | 用于医学成像的深度学习的组织变形 |
US11925434B2 (en) | 2017-06-20 | 2024-03-12 | Siemens Healthineers Ag | Deep-learnt tissue deformation for medical imaging |
CN107392158A (zh) * | 2017-07-27 | 2017-11-24 | 济南浪潮高新科技投资发展有限公司 | 一种图像识别的方法及装置 |
CN108553028A (zh) * | 2018-04-12 | 2018-09-21 | 深圳市沃特沃德股份有限公司 | 驱赶老鼠方法及扫地机器人 |
WO2019200735A1 (zh) * | 2018-04-17 | 2019-10-24 | 平安科技(深圳)有限公司 | 牲畜特征向量的提取方法、装置、计算机设备和存储介质 |
CN109187534A (zh) * | 2018-08-01 | 2019-01-11 | 江苏凯纳水处理技术有限公司 | 水质检测方法及其水样图像识别装置 |
CN111914984A (zh) * | 2019-05-07 | 2020-11-10 | 财团法人成大研究发展基金会 | 用于辨识装置的人工神经网络正规化*** |
CN111914984B (zh) * | 2019-05-07 | 2023-10-27 | 财团法人成大研究发展基金会 | 用于辨识装置的人工神经网络正规化*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104268521A (zh) | 一种基于非限定类别的卷积神经网络的图像识别方法 | |
CN104268524A (zh) | 一种基于动态调整训练目标的卷积神经网络的图像识别方法 | |
CN106847302B (zh) | 基于卷积神经网络的单通道混合语音时域分离方法 | |
CN106845487B (zh) | 一种端到端的车牌识别方法 | |
CN107798381B (zh) | 一种基于卷积神经网络的图像识别方法 | |
CN105320965B (zh) | 基于深度卷积神经网络的空谱联合的高光谱图像分类方法 | |
CN106295637B (zh) | 一种基于深度学习与强化学习的车辆识别方法 | |
CN107368845A (zh) | 一种基于优化候选区域的Faster R‑CNN目标检测方法 | |
JP6933164B2 (ja) | 学習用データ作成装置、学習用モデル作成システム、学習用データ作成方法、及びプログラム | |
CN113222011B (zh) | 一种基于原型校正的小样本遥感图像分类方法 | |
CN105528589A (zh) | 基于多列卷积神经网络的单张图像人群计数算法 | |
CN107274378B (zh) | 一种融合记忆cnn的图像模糊类型识别及参数整定方法 | |
CN108564549A (zh) | 一种基于多尺度稠密连接网络的图像去雾方法 | |
CN113095370B (zh) | 图像识别方法、装置、电子设备及存储介质 | |
CN110659565A (zh) | 一种基于带孔卷积的3d多人人体姿态估计方法 | |
CN107844769B (zh) | 一种复杂场景下的车辆检测方法及*** | |
CN108171119B (zh) | 基于残差网络的sar图像变化检测方法 | |
Nazarenko et al. | Features of application of machine learning methods for classification of network traffic (features, advantages, disadvantages) | |
CN110751072B (zh) | 基于知识嵌入图卷积网络的双人交互识别方法 | |
CN107480723B (zh) | 基于局部二进制阈值学习网络的纹理识别方法 | |
CN104408470A (zh) | 基于平均脸预学习的性别检测方法 | |
CN108564166A (zh) | 基于带对称跨层连接的卷积神经网络半监督特征学习方法 | |
CN105389596A (zh) | 卷积神经网络适用于识别多种尺寸图片的方法 | |
CN115331069A (zh) | 一种基于联邦学习的个性化图像分类模型训练方法 | |
CN114998958A (zh) | 一种基于轻量化卷积神经网络的人脸识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150107 |