CN109272018A - 一种红外图片识别方法 - Google Patents

一种红外图片识别方法 Download PDF

Info

Publication number
CN109272018A
CN109272018A CN201810933085.7A CN201810933085A CN109272018A CN 109272018 A CN109272018 A CN 109272018A CN 201810933085 A CN201810933085 A CN 201810933085A CN 109272018 A CN109272018 A CN 109272018A
Authority
CN
China
Prior art keywords
gradient
image
template
infrared
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810933085.7A
Other languages
English (en)
Inventor
董知周
王锋华
徐盛
陈显辉
吴海峰
成敬周
缪竞雄
沈杰
郑文斌
陈显来
胡陈晨
王绍荃
钟尚染
李炜
谢华森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WENZHOU TUSHENG TECHNOLOGY Co Ltd
Wenzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
WENZHOU TUSHENG TECHNOLOGY Co Ltd
Wenzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WENZHOU TUSHENG TECHNOLOGY Co Ltd, Wenzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd filed Critical WENZHOU TUSHENG TECHNOLOGY Co Ltd
Priority to CN201810933085.7A priority Critical patent/CN109272018A/zh
Publication of CN109272018A publication Critical patent/CN109272018A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种红外图片识别方法,包括以下步骤:读取图像、设置ROI、高斯滤波、Sobel算子计算图像梯度、非极大值抑制、滞后阈值分割、计算梯度向量的所有归一化点积的总和。本发明的优点是:将区域内进行数字化处理,并进行高斯滤波去除噪声,消除图像的噪声干扰,从而提高图像质量,然后Sobel算子计算图像梯度,产生对应的灰度矢量或是其法矢量,采用非极大值抑制,对每一个像素进行检查,看这个点的梯度是不是周围具有相同梯度方向的点中最大的,再采用滞后阈值分割,然后将模板和红外图片归一化点积的总和之间的欧式距离,从而实现高效准确的识别红外图片,即使红外图片旋转了也不会影响判断的准确性,识别度高,不受角度尺度影响。

Description

一种红外图片识别方法
技术领域
本发明涉及一种红外图片识别方法。
背景技术
在现有技术中,红外图片识别主要基于灰度值模板匹配;通过滑窗的方式在待匹配的图像上滑动,通过比较模板与子图的相似度,找到相似度最大的子图。
传统模板匹配的缺陷在于不具有旋转不变形,若待匹配的图进行了旋转,那么这种滑窗的模板匹配方法当即失效。
使用传统的模板匹配速度较快,但是无法应对旋转和缩放问题。
现有识别方法通用性差,鲁棒性差,且在识别过程中,容易受角度、尺度影响。
发明内容
本发明的目的在于提供一种红外图片识别方法,能够有效解决现有红外图片识别差的问题。
为了解决上述技术问题,本发明是通过以下技术方案实现的:一种红外图片识别方法,包括以下步骤:
10、制作照片模板:提取模板照片,绘制ROI区域,然后进行高斯滤波,再通过Sobel算子计算图像梯度,对非极大值抑制,确定边界对滞后阈值分割,最后计算模板梯度向量的所有归一化点积的总和;
20、对红外图片匹配定位:提取红外照片,绘制ROI区域,然后进行高斯滤波,再通过Sobel算子计算图像梯度,对非极大值抑制,确定边界对滞后阈值分割,最后计算红外图片梯度向量的所有归一化点积的总和;
30、计算模板与红外图片ROI的梯度向量所有归一化点积的总和之间的欧式距离,归一化相似性函数为:
当R(i,j)为1时,表示模板与红外图片完全相等。
优选的,对于步骤10和20中的绘制ROI区域,区域由数字1和0组成一个二维矩阵,1代表需要识别的区域,0代表不需要识别的区域。
优选的,对于步骤10和20中高斯滤波的具体方法为,用一个模板扫描图像中的每一个像素,用模板确定的邻域内像素的加权平均灰度值去替代模板中心像素点的值。
优选的,对于步骤10和20中对非极大值抑制方法为,在获得梯度的方向和大小之后,应该对整幅图像做一个扫描,去除那些非边界上的点,对每一个像素进行检查,看这个点的梯度是不是周围具有相同梯度方向的点中最大的。
优选的,对于步骤10和20中滞后阈值分割方法为,先设定两个阈值:minVal和maxVal,当图像的灰度梯度高于maxVal时被认为是真的边界,那些低于minVal的边界会被抛弃;如果介于两者之间的话,就要看这个点是否与某个被确定为真正的边界点相连,如果是就认为它也是边界点,如果不是就抛弃。
与现有技术相比,本发明的优点是:由于采用了ROI区域方式,将区域内进行数字化处理,并进行高斯滤波去除噪声,消除图像的噪声干扰,从而提高图像质量,然后Sobel算子计算图像梯度,产生对应的灰度矢量或是其法矢量,采用非极大值抑制,对每一个像素进行检查,看这个点的梯度是不是周围具有相同梯度方向的点中最大的,再采用滞后阈值分割,然后将模板和红外图片归一化点积的总和之间的欧式距离,从而实现高效准确的识别红外图片,即使红外图片旋转了也不会影响判断的准确性,识别度高,不受角度尺度影响。
具体实施方式
下面详细描述本发明的实施例,旨在用于解释本发明,而不能理解为对本发明的限制。
本发明一种红外图片识别方法的实施例,一种红外图片识别方法,包括以下步骤
10、制作照片模板,具体为:
11、提取模板照片,计算机中的图像处理软件提取模板照片;
12、绘制ROI区域,区域由数字1和0组成一个二维矩阵,1代表需要识别的区域,0代表不需要识别的区域,并将绘制的ROI区域与提取的图片矩阵相乘提取图片ROI;
13、进行高斯滤波,用于去噪声,以消除图像的噪声干扰,从而提高图像质量;高斯滤波属于线性滤波,通俗的讲,高斯滤波就是对整幅图像进行加权平均的过程,每一个像素点的值,都由其本身和邻域内的其他像素值经过加权平均后得到;高斯滤波的具体操作是:用一个模板(或称卷积、掩模)扫描图像中的每一个像素,用模板确定的邻域内像素的加权平均灰度值去替代模板中心像素点的值;
14、通过Sobel算子计算图像梯度,对平滑后的图像使用Sobel算子计算水平方向和竖直方向的一阶导数(图像梯度)(Gx和Gy);根据得到的这两幅梯度图(Gx和Gy)找到边界的梯度和方向;主要用作边缘检测,在技术上,它是一离散性差分算子,用来运算图像亮度函数的灰度之近似值,在图像的任何一点使用此算子,将会产生对应的灰度矢量或是其法矢量;
15、对非极大值抑制,在获得梯度的方向和大小之后,应该对整幅图像做一个扫描,去除那些非边界上的点,对每一个像素进行检查,看这个点的梯度是不是周围具有相同梯度方向的点中最大的;
16、确定边界对滞后阈值分割,设置两个阈值:minVal和maxVal。当图像的灰度梯度高于maxVal时被认为是真的边界,那些低于minVal的边界会被抛弃。如果介于两者之间的话,就要看这个点是否与某个被确定为真正的边界点相连,如果是就认为它也是边界点,如果不是就抛弃;阈值分割法是一种基于区域的图像分割技术,原理是把图像象素点分为若干类;
17、计算模板梯度向量的所有归一化点积的总和,获得描述模板的数字量与待检测区域进行比较;
20、对红外图片匹配定位,具体为:
21、提取红外照片,计算机中的图像处理软件提取模板照片;
22、绘制ROI区域,区域由数字1和0组成一个二维矩阵,1代表我们感兴趣的区域,0代表我们不感兴趣的区域,并将绘制的ROI区域与提取的图片矩阵相乘提取图片ROI;
23、然后进行高斯滤波,用于去噪声,以消除图像的噪声干扰,从而提高图像质量;高斯滤波属于线性滤波,通俗的讲,高斯滤波就是对整幅图像进行加权平均的过程,每一个像素点的值,都由其本身和邻域内的其他像素值经过加权平均后得到;高斯滤波的具体操作是:用一个模板(或称卷积、掩模)扫描图像中的每一个像素,用模板确定的邻域内像素的加权平均灰度值去替代模板中心像素点的值;
24、再通过Sobel算子计算图像梯度,对平滑后的图像使用Sobel算子计算水平方向和竖直方向的一阶导数(图像梯度)(Gx和Gy);根据得到的这两幅梯度图(Gx和Gy)找到边界的梯度和方向;主要用作边缘检测,在技术上,它是一离散性差分算子,用来运算图像亮度函数的灰度之近似值,在图像的任何一点使用此算子,将会产生对应的灰度矢量或是其法矢量;
25、对非极大值抑制,在获得梯度的方向和大小之后,应该对整幅图像做一个扫描,去除那些非边界上的点,对每一个像素进行检查,看这个点的梯度是不是周围具有相同梯度方向的点中最大的;
26、确定边界对滞后阈值分割,设置两个阈值:minVal和maxVal。当图像的灰度梯度高于maxVal时被认为是真的边界,那些低于minVal的边界会被抛弃。如果介于两者之间的话,就要看这个点是否与某个被确定为真正的边界点相连,如果是就认为它也是边界点,如果不是就抛弃;阈值分割法是一种基于区域的图像分割技术,原理是把图像象素点分为若干类;
27、最后计算红外图片梯度向量的所有归一化点积的总和,获得描述红外图片的数字量与模板进行比较;
30、计算模板与红外图片ROI的梯度向量所有归一化点积的总和之间的欧式距离,归一化相似性函数为:
当R(i,j)为1时,表示模板与红外图片完全相等,取最大值为最终匹配结果。
由于采用了ROI区域方式,将区域内进行数字化处理,并进行高斯滤波去除噪声,消除图像的噪声干扰,从而提高图像质量,然后Sobel算子计算图像梯度,产生对应的灰度矢量或是其法矢量,采用非极大值抑制,对每一个像素进行检查,看这个点的梯度是不是周围具有相同梯度方向的点中最大的,再采用滞后阈值分割,然后将模板和红外图片归一化点积的总和之间的欧式距离,从而实现高效准确的识别红外图片,即使红外图片旋转了也不会影响判断的准确性,识别度高,不受角度尺度影响。
以上所述仅为本发明的具体实施例,但本发明的技术特征并不局限于此,任何本领域的技术人员在本发明的领域内,所作的变化或修饰皆涵盖在本发明的专利范围之中。

Claims (5)

1.一种红外图片识别方法,其特征在于,包括以下步骤
10、制作照片模板:提取模板照片,绘制ROI区域,然后进行高斯滤波,再通过Sobel算子计算图像梯度,对非极大值抑制,确定边界对滞后阈值分割,最后计算模板梯度向量的所有归一化点积的总和;
20、对红外图片匹配定位:提取红外照片,绘制ROI区域,然后进行高斯滤波,再通过Sobel算子计算图像梯度,对非极大值抑制,确定边界对滞后阈值分割,最后计算红外图片梯度向量的所有归一化点积的总和;
30、计算模板与红外图片ROI的梯度向量所有归一化点积的总和之间的欧式距离,归一化相似性函数为:
当R(i,j)为1时,表示模板与红外图片完全相等。
2.如权利要求1所述的一种红外图片识别方法,其特征在于:对于步骤10和20中的绘制ROI区域,区域由数字1和0组成一个二维矩阵,1代表需要识别的区域,0代表不需要识别的区域。
3.如权利要求1所述的一种红外图片识别方法,其特征在于:对于步骤10和20中高斯滤波的具体方法为,用一个模板扫描图像中的每一个像素,用模板确定的邻域内像素的加权平均灰度值去替代模板中心像素点的值。
4.如权利要求1所述的一种红外图片识别方法,其特征在于:对于步骤10和20中对非极大值抑制方法为,在获得梯度的方向和大小之后,应该对整幅图像做一个扫描,去除那些非边界上的点,对每一个像素进行检查,看这个点的梯度是不是周围具有相同梯度方向的点中最大的。
5.如权利要求1所述的一种红外图片识别方法,其特征在于:对于步骤10和20中滞后阈值分割方法为,先设定两个阈值:minVal和maxVal,当图像的灰度梯度高于maxVal时被认为是真的边界,那些低于minVal的边界会被抛弃;如果介于两者之间的话,就要看这个点是否与某个被确定为真正的边界点相连,如果是就认为它也是边界点,如果不是就抛弃。
CN201810933085.7A 2018-08-16 2018-08-16 一种红外图片识别方法 Pending CN109272018A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810933085.7A CN109272018A (zh) 2018-08-16 2018-08-16 一种红外图片识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810933085.7A CN109272018A (zh) 2018-08-16 2018-08-16 一种红外图片识别方法

Publications (1)

Publication Number Publication Date
CN109272018A true CN109272018A (zh) 2019-01-25

Family

ID=65153639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810933085.7A Pending CN109272018A (zh) 2018-08-16 2018-08-16 一种红外图片识别方法

Country Status (1)

Country Link
CN (1) CN109272018A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110264486A (zh) * 2019-06-13 2019-09-20 浙江奥脉特机器人科技有限公司 基于近红外图像分析的开关站设备凝露检测方法和***
CN117853484A (zh) * 2024-03-05 2024-04-09 湖南建工交建宏特科技有限公司 一种基于视觉的桥梁损伤智能监测方法及***

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108022233A (zh) * 2016-10-28 2018-05-11 沈阳高精数控智能技术股份有限公司 一种基于改进型Canny算子的工件边缘提取方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108022233A (zh) * 2016-10-28 2018-05-11 沈阳高精数控智能技术股份有限公司 一种基于改进型Canny算子的工件边缘提取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴兰兰 等: "PET 瓶封盖缺陷视觉检测算法研究", 《机电工程》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110264486A (zh) * 2019-06-13 2019-09-20 浙江奥脉特机器人科技有限公司 基于近红外图像分析的开关站设备凝露检测方法和***
CN117853484A (zh) * 2024-03-05 2024-04-09 湖南建工交建宏特科技有限公司 一种基于视觉的桥梁损伤智能监测方法及***
CN117853484B (zh) * 2024-03-05 2024-05-28 湖南建工交建宏特科技有限公司 一种基于视觉的桥梁损伤智能监测方法及***

Similar Documents

Publication Publication Date Title
CN110163853B (zh) 一种边缘缺陷的检测方法
CN109410230B (zh) 一种可抗噪声的改进Canny图像边缘检测方法
US11580647B1 (en) Global and local binary pattern image crack segmentation method based on robot vision
CN107808378B (zh) 基于垂直纵横线轮廓特征的复杂结构铸件潜在缺陷检测方法
CN105046252B (zh) 一种人民币冠字码识别方法
CN110119741B (zh) 一种有背景的卡证图像信息识别方法
CN107220988B (zh) 基于改进canny算子的零部件图像边缘提取方法
CN108694393A (zh) 一种基于深度卷积的证件图像文本区域提取方法
CN112819772B (zh) 一种高精度快速图形检测识别方法
WO2021109697A1 (zh) 字符分割方法、装置以及计算机可读存储介质
CN112233116B (zh) 基于邻域决策与灰度共生矩阵描述的凹凸痕视觉检测方法
CN105139391B (zh) 一种雾霾天气交通图像边缘检测方法
CN110298344A (zh) 一种基于机器视觉的仪表旋钮定位与检测方法
CN109886935A (zh) 一种基于深度学习的道面异物检测方法
CN110222661B (zh) 一种用于运动目标识别及跟踪的特征提取方法
CN114067147A (zh) 一种基于局部形状匹配的舰船目标确认方法
CN109272018A (zh) 一种红外图片识别方法
CN109191436A (zh) 基于视觉显著性谱残差方法的低剂量ct肺结节检测算法
CN115018785A (zh) 基于视觉振频识别的提升钢丝绳张力检测方法
CN114943744A (zh) 基于局部Otsu阈值化的边缘检测方法
CN112102189B (zh) 一种线结构光光条中心线提取方法
CN113642570A (zh) 一种昏暗环境下矿车车牌识别的方法
CN111639555B (zh) 一种指静脉图像噪声精确提取和自适应滤波去噪方法及装置
CN111639556A (zh) 一种非均匀插值的手指轴旋转指静脉图像纠正方法
CN116309780A (zh) 一种基于目标检测的水尺水位识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190125