CN104700416B - 基于视觉理解的图像分割阈值确定方法 - Google Patents
基于视觉理解的图像分割阈值确定方法 Download PDFInfo
- Publication number
- CN104700416B CN104700416B CN201510129134.8A CN201510129134A CN104700416B CN 104700416 B CN104700416 B CN 104700416B CN 201510129134 A CN201510129134 A CN 201510129134A CN 104700416 B CN104700416 B CN 104700416B
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- image
- munderover
- segmentation threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
- Studio Devices (AREA)
Abstract
本发明公开了基于视觉理解的图像分割阈值确定方法,具体包括以下几个步骤:(1)将彩色图像变换为灰度图像;(2)对灰度图像进行数字滤波;(3)计算直方图;(4)计算直方图的全局重心,作为图像分割的第一个分割阈值TL;(5)将高于第一个分割阈值TL的直方图区域分成两部分,根据视觉平衡原则,利用搜索算法寻找两部分的视觉重心,作为图像分割的第二个分割阈值TH。本发明根据艺术创作中的视觉平衡原则,利用画面的视觉重心作为分割阈值,可以有效地将图像的背景部分和主题部分分离出来,使得分割后的图像,能够以极小的图像像素,最大限度地将图像特征保留下来,并且符合人们的认知期望。
Description
技术领域
本发明涉及基于视觉理解的图像分割阈值确定方法,属于图像处理、最优化技术领域。
背景技术
图像分割是图像特征识别技术中的一个重要环节,它通过较少的图像像素,保留图像的重要特征信息。图像分割的好坏,直接关系到图像特征的识别效果与处理速度。
影响图像分割性能是分割阈值的选择。现有的图像分割技术常采用单阈值或双阈值进行图像分割,存在两个方面的局限性:
1)传统的阈值选择标准往往只满足统计意义下的数学最优,但缺乏符合视觉认知的物理解释,从而导致图像分割后的视觉效果差强人意,即:分割后的图像,要么产生大量的信息冗余,要么出现特征信息缺失,使得图像分割效果难以符合人的主观愿望。
2)现有算法所确定的阈值,要么只适用于单阈值图像分割,要么只适合于双阈值图像分割,即:单阈值图像分割和双阈值图像分割所需要的最优阈值难以用一种方法同时计算得到。
我们知道,当人欣赏一幅画面时,需要经历两个过程。首先是眼球的受光过程:眼球会根据反射光线的强弱自适应调节进入到视网膜上的光线强度,从而抑制部分可见光。随后是对可见光的理解过程:对于投射到视网膜上的可见光,即人眼所见的画面内容,会不知不觉地寻找图案布局、色彩明暗的视觉平衡点,从而抽取画面的主要特征。艺术创作也是遵循这一自然现象:将图案所要表达的主题部分和背景部分,通过不同层次分层表达。
发明内容
针对现有技术存在的不足,本发明目的是提供一种基于视觉理解的图像分割阈值确定方法:首先利用生物学的光线抑制原理,通过计算第一个分割阈值TL,抑制掉画面中部分光线较暗的部分;随后,根据艺术创作中的视觉平衡原则,通过计算画面的视觉重心,即第二个分割阈值TH,将图像的背景部分和主题部分分离出来,使得分割后的图像,能够以极小的图像像素,最大限度地将图像特征保留下来,并且符合人们的认知期望。
为了实现上述目的,本发明是通过如下的技术方案来实现:
在图像分割时,我们需要找到两个阈值:一个阈值TL用于抑制亮度较低的可见光,一个阈值TH通过寻找画面的视觉重心,将画面背景和画面主题分离开。图像特征识别时,当需要同时保留画面背景和主题,可采用TL和TH进行双阈值图像分割;当只需要保留画面主题时,则采用TH进行单阈值图像分割。
本发明的基于视觉理解的图像分割阈值确定方法,具体包括以下几个步骤:
(1)将需要识别的彩色图像变换为灰度图像;
(2)对步骤(1)中的灰度图像进行数字滤波;
(3)计算步骤(2)中滤波后所得灰度图像的直方图;
(4)计算步骤(3)中直方图的全局重心,作为图像分割的第一个分割阈值TL;
(5)将高于第一个分割阈值TL的直方图区域分成两部分,根据视觉平衡原则,利用搜索算法寻找两部分的视觉重心,作为图像分割的第二个分割阈值TH。
步骤(4)中,第一个分割阈值TL的计算方法如下:
设灰度图像有N个灰度等级,nj是第j个灰度等级的像素个数,其中,N≤256,j=1,2,…N,则第一个分割阈值TL采用如下公式直接计算:
步骤(5)中,所述第二个分割阈值TH采用如下方法进行迭代搜索:
设所述第一个分割阈值TL所对应的灰度等级为L,所述第二个分割阈值TH所对应的灰度等级为H,
(a)先令m=0,计算TH的初值TH(0):
(b)然后令m=m+1,分别计算灰度等级在区间[L,H]和[H,N]内的直方图重心TLK和THK:
(c)设TLK和THK对应的灰度等级分别为LK和HK,此时还需计算区间[LK,HK]的直方图重心TH(m):
(d)当|TH(m)-TH(m-1)|≤ε时,TH(m)就是所需要的第二个分割阈值TH;若不满足,则返回步骤(b)重新进行迭代计算,直到满足误差精度为止,其中,m表示的是第m次迭代搜索,ε为设定的误差精度。
上述计算所得分割阈值,既可将TH用于单阈值图像分割,也可同时利用TL和TH进行双阈值图像分割。
本发明首先模仿眼球对光线的自动抑制行为,通过第一级分割阈值TL,将图像中灰度值较小(即光线较暗)的像素屏蔽;然后根据艺术创作中的视觉平衡要求,通过寻找图像的视觉重心,即第二级分割阈值TH,将图像的背景部分与主题部分分割开,从而能够以很少的像素来表达图像画面所要表达的主题。所保留的画面特征不但符合人们的认知期望,而且计算机在进行特征提取时,计算量更小、速度更快。本发明可同时为图像分割提供所需要的单阈值(TH)或双阈值(TL和TH)。
附图说明
图1为本发明的基于视觉理解的图像分割阈值确定方法工作流程图;
图2为本发明在实施过程中分割阈值在直方图中的位置分布。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
参见图1和图2,本发明的基于视觉理解的图像分割阈值确定方法工作流程如下:
(1)将要识别的彩色图像变换为灰度图像(如果原始图像为灰度图像,则无需变换);
(2)对步骤(1)中所得灰度图像进行数字滤波;
(3)计算滤波后灰度图像的直方图;
(4)计算直方图全局重心,作为图像分割的第一个分割阈值TL;
(5)将高于第一个分割阈值TL的直方图区域分成两部分,根据视觉平衡原则,利用搜索算法寻找两部分的重心,当两部分重心的重心成为两部分的分界阈值时,则为图像分割的第二个分割阈值TH。
本实施例中,步骤(1)~(3)可通过已公开资料获得相应计算公式,并分别求出各自所需要的数据。
步骤(4)中,第一个分割阈值TL通过计算直方图的全局重心得到。具体方法如下:
设灰度图像的灰度等级为N(N≤256),nj为第j(j=1,2,…N)个灰度等级的像素数量。则第一个分割阈值TL可由如下公式计算:
步骤(5)中,为了满足视觉平衡需要,需要通过迭代优化算法确定视觉重心TH。具体方法如下:
设第一个分割阈值TL所对应的灰度等级为L,第二个分割阈值TH所对应的灰度等级为H。
(a)先令m=0,计算TH的初值TH(0):
(b)然后令m=m+1,分别计算灰度等级在区间[L,H]和[H,N]内的直方图重心TLK和THK:
(c)设TLK和THK对应的灰度等级分别为LK和HK。此时还需计算区间[LK,HK]的直方图重心TH(m):
(m表示的是第m次迭代搜索)
(d)当|TH(m)-TH(m-1)|≤ε时(ε为设定的误差精度),TH(m)就是所需要的第二个分割阈值TH;若不满足,则返回步骤(b)重新进行迭代计算,直到满足误差精度为止。
本发明的数字图像分割阈值计算方法,是根据眼球的光线自动抑制原理,计算灰度图像的第一个分割阈值TL(低阈值);随后,借鉴艺术创作中的视觉平衡原则,通过寻找图像画面的视觉重心,确定第二个分割阈值TH(高阈值)。利用本发明的所得阈值进行图像分割,具有很高的信噪比,能够以很少的图像信息表达图像的主要特征,有利于提高图像识别精度和快速性。本发明所得到的阈值,既可以用于单阈值图像分割(TH),又可用于双阈值图像分割(TL和TH)。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (2)
1.基于视觉理解的图像分割阈值确定方法,其特征在于,具体包括以下几个步骤:
(1)将需要识别的彩色图像变换为灰度图像;
(2)对步骤(1)中的灰度图像进行数字滤波;
(3)计算步骤(2)中滤波后所得灰度图像的直方图;
(4)计算步骤(3)中直方图的全局重心,作为图像分割的第一个分割阈值TL;
(5)将高于第一个分割阈值TL的直方图区域分成两部分,根据视觉平衡原则,利用搜索算法寻找两部分的视觉重心,作为图像分割的第二个分割阈值TH;
步骤(4)中,所述第一个分割阈值TL的计算方法如下:
设灰度图像有N个灰度等级,nj是第j个灰度等级的像素个数,其中,N≤256,j=1,2,…N,则第一个分割阈值TL采用如下公式直接计算:
<mrow>
<msub>
<mi>T</mi>
<mi>L</mi>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msub>
<mi>jn</mi>
<mi>j</mi>
</msub>
</mrow>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msub>
<mi>n</mi>
<mi>j</mi>
</msub>
</mrow>
</mfrac>
<mo>;</mo>
</mrow>
步骤(5)中,所述第二个分割阈值TH采用如下方法进行迭代搜索:
设所述第一个分割阈值TL所对应的灰度等级为L,所述第二个分割阈值TH所对应的灰度等级为H,
(a)先令m=0,计算TH的初值TH(0):
<mrow>
<msub>
<mi>T</mi>
<mi>H</mi>
</msub>
<mrow>
<mo>(</mo>
<mn>0</mn>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mi>L</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msub>
<mi>jn</mi>
<mi>j</mi>
</msub>
</mrow>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mi>L</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msub>
<mi>n</mi>
<mi>j</mi>
</msub>
</mrow>
</mfrac>
</mrow>
(b)然后令m=m+1,分别计算灰度等级在区间[L,H]和[H,N]内的直方图重心TLK和THK:
<mrow>
<msub>
<mi>T</mi>
<mrow>
<mi>L</mi>
<mi>K</mi>
</mrow>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mi>L</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mi>H</mi>
</munderover>
<msub>
<mi>jn</mi>
<mi>j</mi>
</msub>
</mrow>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mi>L</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mi>H</mi>
</munderover>
<msub>
<mi>n</mi>
<mi>j</mi>
</msub>
</mrow>
</mfrac>
<mo>,</mo>
<msub>
<mi>T</mi>
<mrow>
<mi>H</mi>
<mi>K</mi>
</mrow>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mi>H</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msub>
<mi>jn</mi>
<mi>j</mi>
</msub>
</mrow>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mi>H</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msub>
<mi>n</mi>
<mi>j</mi>
</msub>
</mrow>
</mfrac>
</mrow>
(c)设TLK和THK对应的灰度等级分别为LK和HK,此时还需计算区间[LK,HK]的直方图重心TH(m):
<mrow>
<msub>
<mi>T</mi>
<mi>H</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mi>L</mi>
<mi>K</mi>
</mrow>
<mrow>
<mi>H</mi>
<mi>K</mi>
</mrow>
</munderover>
<msub>
<mi>jn</mi>
<mi>j</mi>
</msub>
</mrow>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mi>L</mi>
<mi>K</mi>
</mrow>
<mrow>
<mi>H</mi>
<mi>K</mi>
</mrow>
</munderover>
<msub>
<mi>n</mi>
<mi>j</mi>
</msub>
</mrow>
</mfrac>
</mrow>
(d)当|TH(m)-TH(m-1)|≤ε时,TH(m)就是所需要的第二个分割阈值TH;若不满足,则返回步骤(b)重新进行迭代计算,直到满足误差精度为止,其中,m表示的是第m次迭代搜索,ε为设定的误差精度。
2.根据权利要求1所述的基于视觉理解的图像分割阈值确定方法,其特征在于,计算所得分割阈值,既可将TH用于单阈值图像分割,也可同时利用TL和TH进行双阈值图像分割。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510129134.8A CN104700416B (zh) | 2015-03-23 | 2015-03-23 | 基于视觉理解的图像分割阈值确定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510129134.8A CN104700416B (zh) | 2015-03-23 | 2015-03-23 | 基于视觉理解的图像分割阈值确定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104700416A CN104700416A (zh) | 2015-06-10 |
CN104700416B true CN104700416B (zh) | 2017-08-29 |
Family
ID=53347498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510129134.8A Active CN104700416B (zh) | 2015-03-23 | 2015-03-23 | 基于视觉理解的图像分割阈值确定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104700416B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106846399B (zh) * | 2017-01-16 | 2021-01-08 | 浙江大学 | 一种获取图像的视觉重心的方法及装置 |
CN107610101B (zh) * | 2017-08-24 | 2020-08-25 | 昆明理工大学 | 一种测量数字图像视觉平衡质量的方法 |
CN113393395B (zh) * | 2021-06-17 | 2023-10-31 | 西安应用光学研究所 | 一种高动态红外图像分割阈值自适应计算方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999042031A1 (en) * | 1998-02-23 | 1999-08-26 | Arch Development Corporation | Method and system for the automated delineation of lung regions and costophrenic angles in chest radiographs |
CN1540576A (zh) * | 2003-04-21 | 2004-10-27 | ��ʽ���緺̩ | 用于找出图像分割的最佳阈值的方法 |
CN103729842A (zh) * | 2013-12-20 | 2014-04-16 | 中原工学院 | 基于局部统计特征与整体显著性分析的织物疵点检测方法 |
-
2015
- 2015-03-23 CN CN201510129134.8A patent/CN104700416B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999042031A1 (en) * | 1998-02-23 | 1999-08-26 | Arch Development Corporation | Method and system for the automated delineation of lung regions and costophrenic angles in chest radiographs |
CN1540576A (zh) * | 2003-04-21 | 2004-10-27 | ��ʽ���緺̩ | 用于找出图像分割的最佳阈值的方法 |
CN103729842A (zh) * | 2013-12-20 | 2014-04-16 | 中原工学院 | 基于局部统计特征与整体显著性分析的织物疵点检测方法 |
Non-Patent Citations (2)
Title |
---|
基于红外成像制导的末端瞄准点选择技术;李萍等;《红外与激光工程》;20130531;第42卷(第5期);1131-1136 * |
基于连续帧的红外小目标检测技术;王浩等;《火力与指挥控制》;20121130;第37卷(第11期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN104700416A (zh) | 2015-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109299274B (zh) | 一种基于全卷积神经网络的自然场景文本检测方法 | |
JP6866495B2 (ja) | 画像品質の評価方法及び画像品質の評価システム | |
CN112614077B (zh) | 一种基于生成对抗网络的非监督低照度图像增强方法 | |
CN109145713A (zh) | 一种结合目标检测的小目标语义分割方法 | |
CN110807422A (zh) | 一种基于深度学习的自然场景文本检测方法 | |
CN105825502B (zh) | 一种基于显著性指导的词典学习的弱监督图像解析方法 | |
CN105654436A (zh) | 一种基于前景背景分离的背光图像增强去噪方法 | |
CN107748895A (zh) | 基于dct‑cnn模型的无人机着陆地貌图像分类方法 | |
CN105160310A (zh) | 基于3d卷积神经网络的人体行为识别方法 | |
CN108961675A (zh) | 基于卷积神经网络的跌倒检测方法 | |
CN101551853A (zh) | 复杂静态彩色背景下的人耳检测方法 | |
US20160155241A1 (en) | Target Detection Method and Apparatus Based On Online Training | |
CN103295191A (zh) | 多尺度视觉自适应图像增强方法及评价方法 | |
CN106934455B (zh) | 基于cnn的遥感影像光学适配结构选取方法及*** | |
CN112686276A (zh) | 一种基于改进RetinaNet网络的火焰检测方法 | |
CN106910188A (zh) | 基于深度学习的遥感影像中机场跑道的检测方法 | |
CN104700416B (zh) | 基于视觉理解的图像分割阈值确定方法 | |
CN106327448A (zh) | 一种基于深度学习的图片风格化处理方法 | |
CN113361466B (zh) | 一种基于多模态交叉指导学习的多光谱目标检测方法 | |
CN109359527A (zh) | 基于神经网络的头发区域提取方法及*** | |
CN109800650A (zh) | 一种增强和识别交通标志的方法 | |
CN107330387A (zh) | 基于图像数据的行人检测方法 | |
CN113066025A (zh) | 一种基于增量学习与特征、注意力传递的图像去雾方法 | |
CN101533475A (zh) | 一种基于形状自适应邻域的遥感图像特征提取方法 | |
CN116757986A (zh) | 一种红外与可见光图像融合方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |