CN107480723B - 基于局部二进制阈值学习网络的纹理识别方法 - Google Patents

基于局部二进制阈值学习网络的纹理识别方法 Download PDF

Info

Publication number
CN107480723B
CN107480723B CN201710726395.7A CN201710726395A CN107480723B CN 107480723 B CN107480723 B CN 107480723B CN 201710726395 A CN201710726395 A CN 201710726395A CN 107480723 B CN107480723 B CN 107480723B
Authority
CN
China
Prior art keywords
threshold
partial binary
learning network
binary threshold
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710726395.7A
Other languages
English (en)
Other versions
CN107480723A (zh
Inventor
何楚
熊德辉
刘新龙
陈语
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201710726395.7A priority Critical patent/CN107480723B/zh
Publication of CN107480723A publication Critical patent/CN107480723A/zh
Application granted granted Critical
Publication of CN107480723B publication Critical patent/CN107480723B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于局部二进制阈值学习网络的纹理识别方法,包括步骤:步骤1,准备待分类纹理图像数据集D,将数据集D分成训练数据集Dt和测试数据集Dv;步骤2,构建局部二进制阈值学习网络,输入训练数据集Dt,通过误差敏感项的反向传播和随机梯度算法对局部二进制阈值学习网络进行训练;所述局部二进制学习阈值网络包括1个输入层、1个阈值编码层、2个卷积层、3个下采样层、1个全连接层和1个输出层;步骤3,将测试数据集Dv输入到训练好的局部二进制阈值学习网络中,对训练结果进行验证。本发明提出一种可阈值学习的局部二进制阈值网络用于纹理图像的分类方法,通过学习纹理特征的结构信息,适用于小样本条件下纹理图像的识别。

Description

基于局部二进制阈值学习网络的纹理识别方法
技术领域
本发明属于图像处理技术领域,特别涉及一种基于阈值学习的局部二进制网络用于纹理图像的分类方法。
背景技术
纹理分析是计算机视觉领域一个活跃的研究主题,长期以来在诸如对象识别、遥感分析、基于内容的图像检索等众多领域中发挥着重要的作用。纹理特征包含着物体表面的结构分布及其与周围环境之间的关系等一系列重要信息,对于计算机图像的研究与应用,尤其是图像的分类而言具有重要的意义,有效的分类往往离不开对图像纹理的描述。
传统的图像分类方法通常包括特征提取、特征表达以及分类器选择三个步骤。其中图像底层特征提取一直是图像分类技术的核心,目前国内外已经有很多成熟的算法。Ojala和D.Harwood于1994年提出的LBP算子,由于其旋转不变性和灰度不变性等显著优点,常用于描述和加强图像局部纹理特征。但是,仅仅通过这些底层特征并不足以描述图像的全部信息,尤其是面对图像数量和规模都呈指数增长的现状,手工特征工程的不足之处越来越明显。
近年来,深度学习逐渐成为图像处理的发展主流。卷积神经网络作为目前最流行的深度学习模型之一,它省去了人为选取特征的过程,取而代之的是由设计的网络自主学习特征。凭借着表达能力极强的特征参数,卷积神经网络在图像分类问题上取得了突破性的发展。然而,上百层的网络和上千万的数据在保证实际效果的同时离不开昂贵的硬件设备的支持,也会消耗大量的运算时间。更为重要的是,面对实际的应用需求,很多时候根本无法获得足够的训练样本或者充足的硬件设备保证时间成本。在这样的情况下,往往会导致特征学习丧失其优势。
本发明提供的基于阈值学习的阈值LBP特征能够很好地保留纹理图像的结构信息,通过对局部二进制编码阈值的自适应学习,从而提高对纹理结构的描述能力;将手工纹理特征的结构信息结合到卷积神经网络的特征学习过程,克服对训练数据的依赖,提高小样本条件下对纹理图像的分类效果。本发明方法给出8通道和16通道两种方式进行阈值学习,生成阈值LBP特征;通过引入卷积神经网络来反复学习修改编码阈值,得到自适应LBP编码特征,
将手工特征的结构信息和神经网络的学习能力相结合实现小样本下纹理图像分类。这种基于阈值学习的局部二进制阈值网络分类算法,使得深度学习更加具有针对性,同时也解决了对训练数据过度依赖的问题,学习得到的特征具有较强的纹理结构特性。
发明内容
本发明目的在于结合传统手工设计特征和特征学***衡。一方面利用手工特征的设计思想指导神经网络的特征学习过程,另一方面利用神经网络的学习能力提高传统手工特征的表达能力,从而提高小样本条件下纹理图像识别的准确率。提出基于阈值学习的局部二进制阈值网络分类算法,用该方法学习得到的图像特征较好地保留了图像的纹理特性,在小样本条件下,对于纹理图像的分类效果具有较明显的提升。
本发明的技术方案为一种基于阈值学习的局部二进制阈值网络用于纹理图像的分类方法,包括以下步骤:
步骤1,准备待分类纹理图像数据集D,将数据集D分成训练数据集Dt和测试数据集Dv
步骤2,构建局部二进制阈值学习网络,输入训练数据集Dt,通过误差敏感项的反向传播和随机梯度算法对局部二进制阈值学习网络进行训练;所述局部二进制阈值学习网络包括1个输入层、1个阈值编码层、2个卷积层、3个下采样层、1个全连接层和1个输出层,其中阈值编码层对图像进行编码可通过8通道阈值编码方式或16通道阈值编码方式实现,具体过程如下,
(1)8通道阈值编码方式,
a.设置8个3×3的卷积通道;
b.每个卷积核固定中心点参数为-1,设置周围一个方位阈值参数为wi,其余7个点固定为0,编码公式为,
式(1)中c为3×3图像块中间值,xi表示图像块周围的像素值,i表示像素的索引号,wi为阈值参数,sgn(·)表示符号函数,即
c.8个卷积核通过式(1)与输入做内积处理,得到局部二进制阈值编码结果;
(2)16通道阈值编码方式,
a.设置16个1×1的卷积通道;
b.每个卷积核分别对应学习w0,w1,…,w7以及wc0,wc1,…,wc716个阈值参数,其编码公式为,
式(3)中c为3×3图像块中间值,xi表示图像块周围的像素值,i表示像素的索引号,wi和wci为阈值参数;
c.16个卷积核通过式(3)与输入做内积处理,得到局部二进制阈值编码结果;
步骤3,将测试数据集Dv输入到训练好的局部二进制阈值学习网络中,对训练结果进行验证。
进一步的,所述输出层为Softmax分类器。
本发明的阈值LBP编码特征基于阈值学习的思想,将LBP编码的结构信息和卷积神经网络的学习能力相结合。通过卷积神经网络修改每次编码时对应的差分阈值,相对于原始LBP编码只有0和1的二值模式,学习出自适应多阈值的LBP特征表达,再通过卷积神经网络学习抽象特征。本发明提出一种可阈值学习的局部二进制阈值网络用于纹理图像的分类方法,通过学习纹理特征的结构信息,适用于小样本条件下纹理图像的识别。
附图说明
图1本发明实施例的阈值学习8通道原理说明图。
图2本发明实施例的阈值学习16通道原理说明图。
图3本发明实施例的8通道局部二进制阈值网络结构说明图。
图4本发明实施例的16通道局部二进制阈值网络结构说明图。
具体实施方式
以下结合附图和实施例详细说明本发明技术方案。
本发明给出8通道和16通道两种阈值学习方案,原理如图1、图2所示,对应的网络结构如图3、图4所示。本发明实施例的具体流程包括如下步骤,
步骤1准备待分类纹理图像数据集,实现方式如下:
在执行之前需要准备好M张待分类纹理图像数据集D,将数据集D平均分成两个不重叠的子数据集,训练数据集Dt和测试数据集Dv,分别用于训练和交叉验证;所有数据集图像的大小为n×n像素。
步骤2构建局部二进制阈值学习网络,输入训练数据集Dt对局部二进制阈值学习网络进行训练,并通过Softmax分类器实现分类。
图3和图4网络结构中包括1个输入层、1个阈值编码层、2个卷积层、3个下采样层、1个全连接层和1个输出层,本发明的局部二进制阈值网络共有9层,每层的参数设置分别为:
(1)输入层:输入数据为n×n像素的纹理图像;
(2)阈值编码层:该层为局部二进制阈值编码层,学习对应编码系数(即阈值参数wi或wi和wci)后得到编码后的图像;
(3)S1层:该层为下采样层,窗口尺寸为2×2,滑动步长为1;
(4)C1层:该层为卷积层,卷积核大小为9×9,卷积深度为20;
(5)S2层:该层为下采样层,窗口大小为2×2,滑动步长为1;
(6)C2层:该层为卷积层,卷积核大小为5×5,卷积深度为50;
(7)S3层:该层为下采样层,窗口大小为2×2,滑动步长为1;
(8)FC层:该层为全连接层;
(9)输出层:由10个欧氏径向基函数构成。
设置好网络结构后,通过误差敏感项的反向传播和随机梯度算法(具体实现为现有技术,本发明不予赘述)对网络进行训练,学习网络中的未知参数,未知参数包括网络中卷积核的系数,通过网络的反复迭代学习阈值参数,得到充分具有纹理结构信息的特征表达。
其中阈值编码层实现对待分类纹理图像的局部二进制阈值编码,从而提取图像的纹理结构信息,具体实现方式如下:
本发明实施例中的局部二进制阈值编码有8通道和16通道两种实现方式,以3×3的局部图像块为例,对应的编码原理分别如图1和图2所示。
(1)对于8通道阈值方式,其处理公式为
式(1)中c为3×3图像块中间值,xi表示图像块周围的像素值,i表示像素的索引号,取0~7,wi为阈值参数,sgn(·)表示符号函数,即
具体实现如图1所示,包括以下3个步骤:
1)设置8个3×3的卷积通道;
2)每个卷积核固定中心点参数为-1,设置周围一个方位阈值参数为wi,其余7个点则固定为0;
3)8个卷积核通过式(1)与输入做内积处理并得到局部二进制阈值编码结果。
(2)对于16通道,其编码公式为,
式(3)中c为3×3图像块中间值,xi表示图像块周围的像素值,i表示像素的索引号,取0~7,wi和wci为阈值参数;
具体实现过程如图2所示,包括如下步骤:
1)设置16个1×1的卷积通道;
2)每个卷积核分别对应学习w0,w1,…,w7以及wc0,wc1,…,wc716个阈值参数;
3)输入数据经过16通道处理后,得到局部二进制阈值编码结果。
步骤3将测试数据集Dv输入到训练好的局部二进制阈值学习网络中,对训练结果进行验证。一般训练之后都能获得较高的精度,在极端情况下需再次训练。
本文中所描述的具体实施例仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (2)

1.基于局部二进制阈值学习网络的纹理识别方法,其特征在于,包括以下步骤:
步骤1,准备待分类纹理图像数据集D,将数据集D分成训练数据集Dt和测试数据集Dv
步骤2,构建局部二进制阈值学习网络,输入训练数据集Dt,通过误差敏感项的反向传播和随机梯度算法对局部二进制阈值学习网络进行训练;所述局部二进制阈值学习网络包括1个输入层、1个阈值编码层、2个卷积层、3个下采样层、1个全连接层和1个输出层,其中阈值编码层对图像进行编码通过16通道阈值编码方式实现,具体过程如下,
a.设置16个1×1的卷积通道;
b.每个卷积核分别对应学习w0,w1,…,w7以及wc0,wc1,…,wc716个阈值参数,其编码公式为,
式(3)中c为3×3图像块中间值,xi表示图像块周围的像素值,i表示像素的索引号,wi和wci为阈值参数;
c.16个卷积核通过式(3)与输入做内积处理,得到局部二进制阈值编码结果;
步骤3,将测试数据集Dv输入到训练好的局部二进制阈值学习网络中,对训练结果进行验证。
2.如权利要求1所述的基于局部二进制阈值学习网络的纹理识别方法,其特征在于:所述输出层为Softmax分类器。
CN201710726395.7A 2017-08-22 2017-08-22 基于局部二进制阈值学习网络的纹理识别方法 Active CN107480723B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710726395.7A CN107480723B (zh) 2017-08-22 2017-08-22 基于局部二进制阈值学习网络的纹理识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710726395.7A CN107480723B (zh) 2017-08-22 2017-08-22 基于局部二进制阈值学习网络的纹理识别方法

Publications (2)

Publication Number Publication Date
CN107480723A CN107480723A (zh) 2017-12-15
CN107480723B true CN107480723B (zh) 2019-11-08

Family

ID=60601297

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710726395.7A Active CN107480723B (zh) 2017-08-22 2017-08-22 基于局部二进制阈值学习网络的纹理识别方法

Country Status (1)

Country Link
CN (1) CN107480723B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197087B (zh) * 2018-01-18 2021-11-16 奇安信科技集团股份有限公司 字符编码识别方法及装置
KR102516366B1 (ko) 2018-05-30 2023-03-31 삼성전자주식회사 특징 데이터 획득 방법 및 장치
CN110222647B (zh) * 2019-06-10 2022-05-10 大连民族大学 一种基于卷积神经网络的人脸活体检测方法
CN110781936B (zh) * 2019-10-16 2022-11-18 武汉大学 基于纹理描述和深度学习的阈值可学习局部二进制网络的构建方法以及遥感图像分类方法
CN112353368B (zh) * 2020-05-08 2022-03-22 北京理工大学 一种基于反馈调节的多输入信号癫痫发作检测***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778434A (zh) * 2014-01-16 2014-05-07 重庆邮电大学 一种基于多分辨率多阈值局部二值模式的人脸识别方法
CN105550658A (zh) * 2015-12-24 2016-05-04 蔡叶荷 一种基于高维lbp与卷积神经网络特征融合的人脸比对方法
CN106682616A (zh) * 2016-12-28 2017-05-17 南京邮电大学 基于双通道特征深度学习的新生儿疼痛表情识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778434A (zh) * 2014-01-16 2014-05-07 重庆邮电大学 一种基于多分辨率多阈值局部二值模式的人脸识别方法
CN105550658A (zh) * 2015-12-24 2016-05-04 蔡叶荷 一种基于高维lbp与卷积神经网络特征融合的人脸比对方法
CN106682616A (zh) * 2016-12-28 2017-05-17 南京邮电大学 基于双通道特征深度学习的新生儿疼痛表情识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Affine invariant feature extraction algorithm based on multiscale autoconvolution combining with texture structure analysis;Chun-yuan Wang, Ye Zhang;《Optik》;20131216;第3184-3189页 *
Local Binary Convolutional Neural Networks;Felix Juefei-Xu et al.;《2017 IEEE Conference on Computer Vision and Pattern Recognition》;20170701;第1-4节 *

Also Published As

Publication number Publication date
CN107480723A (zh) 2017-12-15

Similar Documents

Publication Publication Date Title
CN107480723B (zh) 基于局部二进制阈值学习网络的纹理识别方法
CN109949317B (zh) 基于逐步对抗学习的半监督图像实例分割方法
CN110443143B (zh) 多分支卷积神经网络融合的遥感图像场景分类方法
CN110674305B (zh) 一种基于深层特征融合模型的商品信息分类方法
CN109063565B (zh) 一种低分辨率人脸识别方法及装置
CN108171701B (zh) 基于u网络和对抗学习的显著性检测方法
CN109389037B (zh) 一种基于深度森林和迁移学习的情感分类方法
CN108090472B (zh) 基于多通道一致性特征的行人重识别方法及其***
CN109101938B (zh) 一种基于卷积神经网络的多标签年龄估计方法
CN109271522A (zh) 基于深度混合模型迁移学习的评论情感分类方法及***
CN108280233A (zh) 一种基于深度学习的视频gis数据检索方法
CN110109060A (zh) 一种基于深度学习网络的雷达辐射源信号分选方法及***
CN106960176B (zh) 一种基于超限学习机和颜色特征融合的行人性别识别方法
CN112580590A (zh) 一种基于多语义特征融合网络的指静脉识别方法
CN111753802B (zh) 识别方法及装置
CN107491729B (zh) 基于余弦相似度激活的卷积神经网络的手写数字识别方法
CN111079847A (zh) 一种基于深度学习的遥感影像自动标注方法
CN112115967B (zh) 一种基于数据保护的图像增量学习方法
CN105279519A (zh) 基于协同训练半监督学习的遥感影像水体提取方法及***
CN109344856B (zh) 一种基于多层判别式特征学习的脱机签名鉴别方法
CN105956570B (zh) 基于唇部特征和深度学习的笑脸识别方法
CN107423747A (zh) 一种基于深度卷积网络的显著性目标检测方法
Li et al. Dating ancient paintings of Mogao Grottoes using deeply learnt visual codes
CN108427740A (zh) 一种基于深度度量学习的图像情感分类与检索算法
CN108564166A (zh) 基于带对称跨层连接的卷积神经网络半监督特征学习方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant