CN110210493B - 基于非经典感受野调制神经网络的轮廓检测方法及*** - Google Patents
基于非经典感受野调制神经网络的轮廓检测方法及*** Download PDFInfo
- Publication number
- CN110210493B CN110210493B CN201910361332.5A CN201910361332A CN110210493B CN 110210493 B CN110210493 B CN 110210493B CN 201910361332 A CN201910361332 A CN 201910361332A CN 110210493 B CN110210493 B CN 110210493B
- Authority
- CN
- China
- Prior art keywords
- receptive field
- neural network
- image
- field modulation
- classical receptive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于非经典感受野调制神经网络的轮廓检测方法及***,包括:利用多尺度采样构造一组多分辨率图像金字塔;对每个尺度的图像集合利用稀疏自编码器无监督学习简单细胞感受野的特征表达,得到图像的不同低层特征映射;分别为不同的感受野细胞产生的特征映射构造一个与之匹配的调制环境;根据非经典感受野中的信息对感受野所产生的响应进行调制,并融合不同特征的调制结果成统一的特征表达;联合不同尺度的结果输入分类器计算轮廓概率。本发明利用非经典感受野中的信息对感受野中的响应产生抑制或易化的调制作用,大量地减少无意义的琐碎纹理边缘,并突出区域的边界,保存图像的显著性结构,提高图像的轮廓检测性能。
Description
技术领域
本发明涉及图像处理、模式识别技术领域,具体涉及基于非经典感受野调制神经网络的轮廓检测方法及***。
背景技术
轮廓包含了图像中重要的结构信息(如目标形状、区域边界等),被广泛应用于许多计算机视觉任务,如物体识别、候选目标建议、图像分割。然而准确地检测自然图像的轮廓是一项困难的任务,主要难点在于:图像的语义结构经常湮没在由纹理背景所产生的局部边缘中,需要排除大量无实际意义的纹理边缘;有的目标可能与背景具有相似的强度,使得边界的响应微弱甚至缺乏局部的有效证据,需要结合大范围的信息进行判断。
神经生理学研究表明:感受野的周边存在着一个对细胞响应起调制作用的外区域,其面积比传统感受野大得多,此区域内的小光点刺激并不能直接引起神经节细胞的反应,但可以易化或抑制其反应,调节由感受野所产生的原有效果,这个区域称为非经典感受野。非经典感受野扩大了视皮层神经元接受特征信息输入的有效空间,从而允许在复杂任务的早期处理中结合视野中大范围的信息。由此启发了许多基于视觉机制的轮廓检测方法,试图通过引入大范围的区域信息,克服局部边缘检测器的缺点。这些视觉仿生模型在一定程度改善了轮廓检测的视觉效果,但它们通常采用人为定义的高斯差分(DoG)函数或者蝶形的DoG函数来描述非经典感受野调制作用,一个真实的神经元的发放模式随神经元而各异,不能用太简单的数学函数去描述所发生的一切。
发明内容
本发明要解决的技术问题在于,针对上述目前检测自然图像的轮廓的过程复杂、纷乱纹理边缘较多的技术缺陷,提供了基于非经典感受野调制神经网络的轮廓检测方法及***来解决上述问题。
基于非经典感受野调制神经网络的轮廓检测方法,包括:
步骤1、对原始图像集合进行多尺度采样产生多分辨率图像,以得到不同尺度的训练图像集合;
步骤2、建立非经典感受野调制神经网络,设置网络的层数和节点数,初始化所述非经典感受野调制神经网络中的感受野层的参数,定义所述非经典感受野调制神经网络的目标函数;
步骤3、基于所述不同尺度的训练图像集合训练非经典感受野调制神经网络:利用传统的神经网络反向传播算法有监督地最小化所述非经典感受野调制神经网络的目标函数,以获得优化后的非经典感受野调制神经网络中的感受野层的参数,最终得到完成优化的非经典感受野调制神经网络;
步骤4、将待识别图像输入所述优化的非经典感受野调制神经网络,得到待识别图像中每个像素属于轮廓的概率;
步骤5、对待识别图像的轮廓概率结果进行阈值化处理,将概率值低于预设值的像素置为0,并通过非最大抑制方法进行轮廓细化,最后输出待识别图像的轮廓检测结果。
进一步的,训练所述神经网络具体包括:将不同尺度的训练图像集合中的每个尺度的图像进行输入,网络第一隐藏层为感受野层,模拟经典感受野产生的特征响应,接着在每个感受野特征映射后加入一个非经典感受野调制层,对感受野产生的原有响应进行调制作用,并对不同的调制结果进行融合,对于下采样的图像输入,增加一个去卷积层用于恢复融合结果到原始图像大小,通过尺度融合层将不同尺度得到的结果进行优化组合,最后采用基于交叉熵损失函数的输出层得到最后的轮廓概率。
进一步的,采用image-to-image方式利用所述不同尺度的训练图像集合训练神经网络,网络的输入层对应于图像,输出层为该图像的轮廓映射,产生每个像素的轮廓概率。
进一步的,初始化神经网络中的感受野层的参数具体包括:分别对不同尺度的图像集进行采样得到训练图像块,采用稀疏自编码器无监督学习神经网络的感受野的特征表达,不同的隐藏神经元学会了在图像的不同位置和方向进行边缘检测,利用学习到的特征检测器对感受野层中的参数进行初始化,其他层的网络参数随机初始化。
进一步的,所述非经典感受野调制神经网络的目标函数J定义为输入数据的真实标签与非经典感受野调制神经网络预测的标签之间的交叉熵:
J=一∑i[β·1(yi=1)log P(yi=1|Xi,W)+(1-β)·1(yi=0)log P(yi=0|Xi,W)],
式中W表示该网络中所有的参数集,即网络每层的连接权重,yi∈{0,1}是图像X中像素i的标签,1(·)是指示函数,P(yi)为Xi属于标签的概率,为调控因子,平衡轮廓与非轮廓之间严重的类别不均衡,|Y+|和|Y-|分别表示图像轮廓的正、负样本集。
一种基于非经典感受野调制神经网络的轮廓检测***,包括:处理器及存储设备;所述处理器加载并执行所述存储设备中的指令及数据用于实现权利要求1~5所述的任意一种基于非经典感受野调制神经网络的轮廓检测方法。
与现有技术相比,本发明的优势在于:本发明将视皮层非经典感受野调制机制嵌入神经网络,为不同的感受野细胞产生的特征映射构造一个与之适应的非经典感受野调制环境,根据周边上下文信息对感受野的响应产生抑制或易化的调制作用,从而有效地减少了纹理边缘响应并突出了图像的轮廓与边界等重要的结构特征。
附图说明
图1为本发明基于非经典感受野调制神经网络的轮廓检测方法的流程图;
图2为本发明基于非经典感受野调制神经网络的轮廓检测方法的框架示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地描述。
本发明基于非经典感受野调制神经网络的轮廓检测方法是通过结合深度神经网络强大的学习能力与人类视觉***的信息加工处理机制,建立了一种基于非经典感受野调制神经网络,为自然图像轮廓检测提供一种视觉仿生的计算模型。
如图1所示,基于非经典感受野调制神经网络的轮廓检测方法包括:
步骤1、对原始图像集合进行多尺度采样产生多分辨率图像,以得到不同尺度的训练图像集合;
步骤2、建立非经典感受野调制神经网络,设置网络的层数和节点数,初始化所述非经典感受野调制神经网络中的感受野层的参数,定义所述非经典感受野调制神经网络的目标函数;
步骤3、基于所述不同尺度的训练图像集合训练非经典感受野调制神经网络:利用传统的神经网络反向传播算法有监督地最小化所述非经典感受野调制神经网络的目标函数,以获得优化后的非经典感受野调制神经网络中的感受野层的参数,最终得到完成优化的非经典感受野调制神经网络;
步骤4、将待识别图像输入所述优化的非经典感受野调制神经网络,得到待识别图像中每个像素属于轮廓的概率;
步骤5、对待识别图像的轮廓概率结果进行阈值化处理,将概率值低于0.5的像素置为0,并通过非最大抑制方法进行轮廓细化,最后输出待识别图像的轮廓检测结果。
如图2所示,训练所述神经网络具体包括:将不同尺度的训练图像集合中的每个尺度的图像进行输入,网络第一隐藏层为感受野层,其卷积核模拟经典感受野产生的特征响应。在每个感受野特征映射后加入一个非经典感受野调制层,对感受野产生的原有响应进行调制作用,即在感受野的周边建立一个非经典感受野调制区域,其尺度是感受野的2-5倍(根据Li等人1994年发表在Vision Research上的研究“Extensive integration fieldbeyond the classical receptive field of cat’s striate cortical neurons-Classification and tuning properties”),非经典感受野卷积核基于感受野的特征响应计算获得调制响应,结合感受野的响应与非经典感受野的调制响应,并通过ReLU运算将负值置为0,得到稀疏的调制结果。下一层网络将不同的调制结果融合成单一的映射,对于下采样的图像输入,***一个由双线插值构成的去卷积层用于恢复融合结果到原始图像大小,通过尺度融合层将不同尺度得到的结果进行优化组合。最后,一个由交叉熵损失函数组成的输出层用于计算目标函数代价,输出图像的轮廓概率。
采用image-to-image方式利用所述不同尺度的训练图像集合训练神经网络,网络的输入层对应于图像,输出层为该图像的轮廓映射,产生每个像素的轮廓概率。
初始化神经网络中的感受野层的参数具体包括:分别对不同尺度的图像集进行采样得到训练图像块,采用稀疏自编码器无监督学习神经网络的感受野的特征表达,不同的隐藏神经元学会了在图像的不同位置和方向进行边缘检测,利用学习到的特征检测器对感受野层中的参数进行初始化,其他层的网络参数随机初始化。
所述非经典感受野调制神经网络的目标函数J定义为输入数据的真实标签与非经典感受野调制神经网络预测的标签之间的交叉熵:
J=-∑i[β·1(yi=1)log P(yi=1|Xi,W)+(1-β)·1(yi=0)log P(yi=0|Xi,W)],
式中W表示该网络中所有的参数集,yi∈{0,1}是图像X中像素i的标签,1(·)是指示函数,P(yi)为Xi属于标签的概率,为调控因子,平衡轮廓与非轮廓之间严重的类别不均衡,|Y+|和|Y-|分别表示正、负样本集。
一种基于非经典感受野调制神经网络的轮廓检测***,包括:处理器及存储设备;所述处理器加载并执行所述存储设备中的指令及数据用于实现所述的任意一种基于非经典感受野调制神经网络的轮廓检测方法。
本发明结合深度神经网络强大的表达学习能力与人类视觉***的信息加工处理机制,提出了一种基于非经典感受野调制神经网络的轮廓检测方法及***。本发明将为不同的感受野细胞产生的特征映射构造一个与之匹配的调制环境,根据非经典感受野中的信息对感受野的响应产生抑制或易化的调制作用,从而能更有效地减少纷乱的纹理边缘并保护轮廓、边界等重要结构信息的完整性。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (5)
1.基于非经典感受野调制神经网络的轮廓检测方法,其特征在于,包括:
步骤1、对原始图像集合进行多尺度采样产生多分辨率图像,以得到不同尺度的训练图像集合;
步骤2、建立非经典感受野调制神经网络,设置网络的层数和节点数,初始化所述非经典感受野调制神经网络中的感受野层的参数,定义所述非经典感受野调制神经网络的目标函数;
步骤3、基于所述不同尺度的训练图像集合训练非经典感受野调制神经网络:利用传统的神经网络反向传播算法有监督地最小化所述非经典感受野调制神经网络的目标函数,以获得优化后的非经典感受野调制神经网络中的感受野层的参数,最终得到完成优化的非经典感受野调制神经网络;
训练所述神经网络具体包括:将不同尺度的训练图像集合中的每个尺度的图像进行输入,网络第一隐藏层为感受野层,模拟经典感受野产生的特征响应,接着在每个感受野特征映射后加入一个非经典感受野调制层,对感受野产生的原有响应进行调制作用,并对不同的调制结果进行融合,对于下采样的图像输入,增加一个去卷积层用于恢复融合结果到原始图像大小,通过尺度融合层将不同尺度得到的结果进行优化组合,最后采用基于交叉熵损失函数的输出层得到最后的轮廓概率;
步骤4、将待识别图像输入所述优化的非经典感受野调制神经网络,得到待识别图像中每个像素属于轮廓的概率;
步骤5、对待识别图像的轮廓概率结果进行阈值化处理,将概率值低于预设值的像素置为0,并通过非最大抑制方法进行轮廓细化,最后输出待识别图像的轮廓检测结果。
2.如权利要求1所述的基于非经典感受野调制神经网络的轮廓检测方法,其特征在于,采用image-to-image方式利用所述不同尺度的训练图像集合训练神经网络,网络的输入层对应于图像,输出层为该图像的轮廓映射,产生每个像素的轮廓概率。
3.如权利要求1所述的基于非经典感受野调制神经网络的轮廓检测方法,其特征在于,初始化神经网络中的感受野层的参数具体包括:分别对不同尺度的图像集进行采样得到训练图像块,采用稀疏自编码器无监督学习神经网络的感受野的特征表达,不同的隐藏神经元学会了在图像的不同位置和方向进行边缘检测,利用学习到的特征检测器对感受野层中的参数进行初始化,其他层的网络参数随机初始化。
5.一种基于非经典感受野调制神经网络的轮廓检测***,其特征在于,包括:处理器及存储设备;所述处理器加载并执行所述存储设备中的指令及数据用于实现权利要求1~4所述的任意一种基于非经典感受野调制神经网络的轮廓检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910361332.5A CN110210493B (zh) | 2019-04-30 | 2019-04-30 | 基于非经典感受野调制神经网络的轮廓检测方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910361332.5A CN110210493B (zh) | 2019-04-30 | 2019-04-30 | 基于非经典感受野调制神经网络的轮廓检测方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110210493A CN110210493A (zh) | 2019-09-06 |
CN110210493B true CN110210493B (zh) | 2021-03-19 |
Family
ID=67786738
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910361332.5A Expired - Fee Related CN110210493B (zh) | 2019-04-30 | 2019-04-30 | 基于非经典感受野调制神经网络的轮廓检测方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110210493B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111062957B (zh) * | 2019-10-28 | 2024-02-09 | 广西科技大学鹿山学院 | 一种基于非经典感受野轮廓检测方法 |
CN110880035B (zh) * | 2019-11-14 | 2020-12-01 | 北京推想科技有限公司 | 卷积神经网络的训练方法、装置及结节征象识别方法、装置 |
CN111027570B (zh) * | 2019-11-20 | 2022-06-14 | 电子科技大学 | 一种基于细胞神经网络的图像多尺度特征提取方法 |
CN111539969B (zh) * | 2020-04-23 | 2023-06-09 | 武汉铁路职业技术学院 | 图像边缘检测方法、装置、计算机设备及存储介质 |
CN112926667B (zh) * | 2021-03-05 | 2022-08-30 | 中南民族大学 | 深度融合边缘与高层特征的显著性目标检测方法及装置 |
CN113496215B (zh) * | 2021-07-07 | 2024-07-02 | 浙江大华技术股份有限公司 | 一种活体人脸检测的方法、装置及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101930592A (zh) * | 2009-09-23 | 2010-12-29 | 电子科技大学 | 一种基于视觉非经典感受野模型的图像去噪方法 |
CN106485724A (zh) * | 2016-09-20 | 2017-03-08 | 华中科技大学 | 一种基于组合感受野和朝向特征调制的轮廓检测方法 |
CN107067407A (zh) * | 2017-04-11 | 2017-08-18 | 广西科技大学 | 基于非经典感受野和线性非线性调制的轮廓检测方法 |
CN107273925A (zh) * | 2017-06-12 | 2017-10-20 | 太原理工大学 | 一种基于局部感受野和半监督深度自编码的肺结节诊断方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103903251B (zh) * | 2012-12-30 | 2017-03-29 | 南京理工大学 | 基于非经典感受野复合调制的夜视图像显著轮廓提取方法 |
JP5971301B2 (ja) * | 2013-10-16 | 2016-08-17 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理装置の制御方法、およびプログラム |
CN106033610B (zh) * | 2016-03-22 | 2018-10-26 | 广西科技大学 | 基于非经典感受野空间总和调制的轮廓检测方法 |
CN106355596B (zh) * | 2016-08-30 | 2018-11-23 | 广西师范大学 | 一种融合均匀颜色信息和复合感受野模型的边缘检测方法 |
CN108898606B (zh) * | 2018-06-20 | 2021-06-15 | 中南民族大学 | 医学图像的自动分割方法、***、设备及存储介质 |
CN109060838B (zh) * | 2018-07-23 | 2020-12-29 | 三固(厦门)科技有限公司 | 一种基于机器视觉的产品表面划痕检测方法 |
CN109489576B (zh) * | 2018-10-19 | 2020-03-03 | 杭州电子科技大学 | 一种基于初级视觉通路计算模型的轮廓检测方法 |
-
2019
- 2019-04-30 CN CN201910361332.5A patent/CN110210493B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101930592A (zh) * | 2009-09-23 | 2010-12-29 | 电子科技大学 | 一种基于视觉非经典感受野模型的图像去噪方法 |
CN106485724A (zh) * | 2016-09-20 | 2017-03-08 | 华中科技大学 | 一种基于组合感受野和朝向特征调制的轮廓检测方法 |
CN107067407A (zh) * | 2017-04-11 | 2017-08-18 | 广西科技大学 | 基于非经典感受野和线性非线性调制的轮廓检测方法 |
CN107273925A (zh) * | 2017-06-12 | 2017-10-20 | 太原理工大学 | 一种基于局部感受野和半监督深度自编码的肺结节诊断方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110210493A (zh) | 2019-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110210493B (zh) | 基于非经典感受野调制神经网络的轮廓检测方法及*** | |
CN110378381B (zh) | 物体检测方法、装置和计算机存储介质 | |
CN110490850B (zh) | 一种肿块区域检测方法、装置和医学图像处理设备 | |
CN109145979B (zh) | 敏感图像鉴定方法及终端*** | |
Wang et al. | Automated diabetic retinopathy grading and lesion detection based on the modified R‐FCN object‐detection algorithm | |
Yu et al. | Context-based hierarchical unequal merging for SAR image segmentation | |
CN107169954B (zh) | 一种基于并行卷积神经网络的图像显著性检测方法 | |
CN113705769A (zh) | 一种神经网络训练方法以及装置 | |
CN111782840A (zh) | 图像问答方法、装置、计算机设备和介质 | |
EP4322056A1 (en) | Model training method and apparatus | |
CN111310604A (zh) | 一种物体检测方法、装置以及存储介质 | |
CN109615614B (zh) | 基于多特征融合的眼底图像中血管的提取方法与电子设备 | |
CN114782311B (zh) | 一种基于CenterNet改进的多尺度缺陷目标检测方法及*** | |
US11695898B2 (en) | Video processing using a spectral decomposition layer | |
CN113743417B (zh) | 语义分割方法和语义分割装置 | |
US11568212B2 (en) | Techniques for understanding how trained neural networks operate | |
CN106778910A (zh) | 基于本地训练的深度学习***和方法 | |
CN113095333A (zh) | 无监督特征点检测方法及装置 | |
CN110135435B (zh) | 一种基于广度学习***的显著性检测方法及装置 | |
EP3671635A1 (en) | Curvilinear object segmentation with noise priors | |
EP3671634B1 (en) | Curvilinear object segmentation with geometric priors | |
CN111209813B (zh) | 基于迁移学习的遥感图像语义分割方法 | |
CN110210574A (zh) | 合成孔径雷达图像解译方法、目标识别装置及设备 | |
CN111898465B (zh) | 一种人脸识别模型的获取方法和装置 | |
Nguyen et al. | Pavement crack detection and segmentation based on deep neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information | ||
CB03 | Change of inventor or designer information |
Inventor after: Tang Qiling Inventor after: Fu Lingling Inventor after: Zheng Fei Inventor after: Liu Haihua Inventor after: Gao Zhiyong Inventor before: Tang Qiling Inventor before: Liu Haihua Inventor before: Gao Zhiyong |
|
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210319 |