CN108197649A - 一种太赫兹图像聚类分析方法及*** - Google Patents

一种太赫兹图像聚类分析方法及*** Download PDF

Info

Publication number
CN108197649A
CN108197649A CN201711469721.7A CN201711469721A CN108197649A CN 108197649 A CN108197649 A CN 108197649A CN 201711469721 A CN201711469721 A CN 201711469721A CN 108197649 A CN108197649 A CN 108197649A
Authority
CN
China
Prior art keywords
image
terahertz
retrieved
library
domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711469721.7A
Other languages
English (en)
Inventor
邵桂芳
李铁军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen University
Original Assignee
Xiamen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen University filed Critical Xiamen University
Priority to CN201711469721.7A priority Critical patent/CN108197649A/zh
Publication of CN108197649A publication Critical patent/CN108197649A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开一种太赫兹图像聚类分析方法及***,包括:生成样本的太赫兹无损检测图像库;遍历所述太赫兹无损检测图像库选出待检索图像;提取所述待检索图像和所述图像库中所有图像的特征点;随机生成多个初始聚类中心;根据所述初始聚类中心对所有的所述特征点进行聚类;统计所述待检索图像和所述图像库中每张图像在每个聚类中的特征点个数,根据所述特征点个数与设定维度构建特征向量;每张图像对应一个多维的特征向量;计算所述待检索图像的特征向量与所述图像库中所有图像特征向量的匹配度,得到一组匹配度最高的图像。采用本发明中的方法或***实现了检测目标缺陷的全方位、定性的准确识别。

Description

一种太赫兹图像聚类分析方法及***
技术领域
本发明涉及陶瓷基复合材料太赫兹检测技术领域,特别是涉及一种太赫兹图像聚类分析方法及***。
背景技术
太赫兹波是频率范围覆盖0.1THz~10THz(1THz=1012Hz)的电磁波,该频段介于红外与微波之间。在20世纪80年代之前,由于缺乏太赫兹波段高效的发射源和灵敏的探测器,该频段的电磁辐射并未得到深入研究,因而太赫兹波段曾被称为电磁波谱的“太赫兹空隙”。近年来,随着激光科学和材料科学的发展,太赫兹波相关的产生与探测技术都出现较快的发展,由于其光谱和成像技术可提供传统的微波、红外以及X射线等技术所不能提供的信息,使得太赫兹技术迅速应用到生物医学,无损探伤,安全检查以及国防安全等领域。特别是太赫兹辐射可以穿透塑料、陶瓷、纤维和泡沫等非极性分子材料,促使太赫兹无损检测技术在工业制造领域日益受到关注,鉴于其自身的独特性,太赫兹技术逐渐发展成为传统无损检测技术(如工业CT、超声波与红外热像等)的重要补充。
陶瓷基复合材料(Ceramic matrix composites,CMC)以其优良的高温性能,特别是它的高熔点、耐磨损和轻重量等特点,日益成为工业与航空航天领域不可或缺的先进材料。CMC是以陶瓷材料为基体,以陶瓷、碳纤维或难熔金属的纤维、晶须或颗粒为增强体,通过适当的复合工艺制成的复合材料。由于CMC的各项异性和不均匀特性,导致在材料制备过程中其内部容易产生如分层、微裂纹、夹杂和气孔等缺陷,从而引起使用过程中的氧化、冲击和压痕等环境损伤。目前,用于CMC内部缺陷及环境损伤的无损检测手段有多种,常用的方法包括X射线检测、工业CT、红外热成像以及超声波检测等方法,其他技术如贝塔背散射、核磁共振以及中子射线等,也都被尝试用于CMC无损评价,但这些方法仍需改进。
近年来,太赫兹检测技术逐渐应用到CMC及其它复合材的无损检测中,取得了一定的研究成效。例如,Ullmann等利用太赫兹反射式探测方法,检测了采用高孔隙率氧化物陶瓷基复合材料所制备的飞行器头锥面板,获得了太赫兹时域图谱,可以明显地看见面板纤维束之间的缝隙以及氧化物纤维之间的交点;Becker等利用太赫兹时域光谱成像图技术,研究了预置缺陷的氧化物纤维增强陶瓷基复合材料,得到材料的上、下表面以及材料中部缺陷的太赫兹3D图像;周小丹等采用太赫兹透射成像检测方法,检测了预置孔洞的陶瓷基复合材料,获得了样本的太赫兹时域光谱图像,并对内部缺陷信息进行定量的分析;李薇等利用太赫兹时域光谱成像技术检测了内含缺陷的玻璃纤维与碳纤维增强复合材料,获得了材料内部缺陷的太赫兹透射图像。
上述这些针对复合材料的太赫兹无损检测方法研究,对太赫兹无损检测技术在陶瓷基复合材料上的应用进行了初步探索,但目前仍存在一定的不足,主要体现在:1、现有的方法大多采用太赫兹时域光谱信息成像,成像模式单一,图像质量较差;2、现有的方法通常从少量图像上定量分析所检测目标的缺陷信息,所选取的图像随机性比较大,图像质量不稳定。这些不足已经严重影响了对太赫兹检测目标缺陷的准确识别。
发明内容
本发明的目的是提供一种太赫兹图像聚类分析方法及***,采用尺度不变特征变换特征点提取,并结合K均值进行特征聚类检索,从图像库中选择出一组高质量的代表性太赫兹图像。
为实现上述目的,本发明提供了如下方案:
一种太赫兹图像聚类分析方法,包括:
根据时域信息间接成像、频域间接成像获取大量的太赫兹图像数据,形成样本的太赫兹无损检测图像库;
遍历所述太赫兹无损检测图像库选出待检索图像;
根据尺度不变特征变换特征点提取算法,提取所述待检索图像和所述图像库中所有图像的特征点;
根据各所述特征点的个数采用K均值聚类方法选择聚类数目,随机生成多个初始聚类中心;
根据所述初始聚类中心对所有的所述特征点进行聚类;
统计所述待检索图像和所述图像库中每张图像在每个聚类中的特征点个数,根据所述特征点个数与设定维度构建特征向量;每张图像对应一个多维的特征向量;
计算所述待检索图像的特征向量与所述图像库中所有图像特征向量的匹配度,得到一组匹配度最高的图像。
可选的,所述根据时域信息间接成像、频域间接成像获取大量的太赫兹图像数据,形成样本的太赫兹无损检测图像库具体包括:
对样本进行二维平台成像扫描得到每个空间像素点的时域电场强度信号和相位等时域信息,将所述时域电场强度信号和相位等时域信息作为成像参数;所述时域电场强度信号包括峰峰值、最大值、最小值;
通过对所述每个空间像素点的时域谱进行离散傅立叶变换,获得该像素点对应频域谱;根据频域的采样间隔把每一采样频率点所对应的能量谱密度值作为成像参数。
可选的,所述遍历所述太赫兹无损检测图像库选出待检索图像具体包括:
对所述图像库中的图像进行标准差、信息熵、平均梯度、空间频率和峰值信噪比的计算;
确定所述标准差、所述信息熵、所述平均梯度、所述空间频率和所述峰值信噪比的结果数值最大的图像,所述图像即为所述待检索图像。
可选的,所述计算所述待检索图像的特征向量与所述图像库中所有图像特征向量的匹配度,得到一组匹配度最高的图像具体包括:
计算所述待检索图像的特征向量与所述图像库中所有图像特征向量之间夹角的余弦值;
根据余弦相似定理对所述余弦值进行大小排序,得到排序序列,确定所述排序序列的前设定个数的余弦值对应的图像为一组匹配度最高的图像。
可选的,所述聚类数目为500。
一种太赫兹图像聚类分析***,包括:
图像库构建模块,用于根据时域信息间接成像、频域间接成像获取大量的太赫兹图像数据,构建样本的太赫兹无损检测图像库;
遍历模块,用于遍历所述太赫兹无损检测图像库选出待检索图像;
特征点提取模块,用于根据尺度不变特征变换特征点提取算法,提取所述待检索图像和所述图像库中所有图像的特征点;
聚类中心生成模块,用于根据各所述特征点的个数采用K均值聚类方法选择聚类数目,随机生成多个初始聚类中心;
聚类模块,用于根据所述初始聚类中心对所有的所述特征点进行聚类;
特征向量获取模块,用于统计所述待检索图像和所述图像库中每张图像在每个聚类中的特征点个数,根据所述特征点个数与设定维度构建特征向量;每张图像对应一个多维的特征向量;
目标图像获取模块,用于计算所述待检索图像的特征向量与所述图像库中所有图像特征向量的匹配度,得到一组匹配度最高的图像。
可选的,所述图像库构建模块具体包括:
时域成像单元,用于对样本进行二维平台成像扫描得到每个空间像素点的时域电场强度信号和相位等时域信息,将所述时域电场强度信号和相位等时域信息作为成像参数;所述时域电场强度信号包括峰峰值、最大值、最小值;
频域成像单元,用于通过对所述每个空间像素点的时域谱进行离散傅立叶变换,获得该像素点对应频域谱;根据频域的采样间隔把每一采样频率点所对应的能量谱密度值作为成像参数。
可选的,所述遍历模块具体包括:
参数计算单元,用于对所述图像库中的图像进行标准差、信息熵、平均梯度、空间频率和峰值信噪比的计算;
待检索图像确定单元,用于确定所述标准差、所述信息熵、所述平均梯度、所述空间频率和所述峰值信噪比的结果数值最大的图像,所述图像即为所述待检索图像。
可选的,所述目标图像获取模块具体包括:
余弦值计算单元,用于计算所述待检索图像的特征向量与所述图像库中所有图像特征向量之间夹角的余弦值;
图像确定单元,用于根据余弦相似定理对所述余弦值进行大小排序,得到排序序列,确定所述排序序列的前设定个数的余弦值对应的图像为一组匹配度最高的图像。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明中基于太赫兹波谱信息,结合时域信号电场强度的峰峰值成像、最大最小值成像以及均值成像,以及频域的不同频率点能量谱密度值成像等,从而生成样本的一系列太赫兹图像,形成图像库;针对图像库基于标准差、信息熵、平均梯度、空间频率和峰值信噪比五种图像客观评价指标的融合处理,选出质量最佳的图像;针对最佳图像采用SIFT特征点提取,并结合K均值进行特征聚类检索,从图像库中选择出一组高质量的代表性太赫兹图像。通过这组高质量的图像,实现了检测目标缺陷的全方位、定性的准确识别。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例太赫兹图像聚类分析方法流程图;
图2为本发明实施例太赫兹图像聚类分析***结构图;
图3为本发明实施例太赫兹图像聚类分析方法细节流程示意图;
图4为本发明实施例太赫兹时域光谱透射探测***示意图;
图5为本发明实施例氧化铝样本在多种成像模式下成像结果对比;
图6为本发明实施例氮化铝样本在多种成像模式下的成像结果对比;
图7为本发明实施例氧化铍样本在多种成像模式下的成像结果对比;
图8为本发明实施例氧化锆样本在多种成像模式下的成像结果对比;
图9为本发明实施例氧化铝样本代表性图像;
图10为本发明实施例氮化铝样本代表性图像;
图11为本发明实施例氧化铍样本代表性图像;
图12为本发明实施例氧化锆样本代表性图像;
图13为本发明实施例四种样本图像相似度余弦值分布图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明实施例太赫兹图像聚类分析方法流程图。参见图1,一种太赫兹图像聚类分析方法,包括:
步骤101:根据时域信息间接成像、频域间接成像获取大量的太赫兹图像数据,形成样本的太赫兹无损检测图像库。
步骤102:遍历所述太赫兹无损检测图像库选出待检索图像。
步骤103:根据尺度不变特征变换(ScaleinvariantfeatureTransform,SIFT)特征点提取算法,提取所述待检索图像和所述图像库中所有图像的特征点。
步骤104:根据各所述特征点的个数采用K均值聚类方法选择聚类数目,随机生成多个初始聚类中心。
步骤105:根据所述初始聚类中心对所有的所述特征点进行聚类。
步骤106:统计所述待检索图像和所述图像库中每张图像在每个聚类中的特征点个数,根据所述特征点个数与设定维度构建特征向量;每张图像对应一个多维的特征向量。每张图像的特征向量是Y(K,X),是一个K乘X维矩阵,每个K维度的X就是对应的聚类中心特征点的个数。
步骤107:计算所述待检索图像的特征向量与所述图像库中所有图像特征向量的匹配度,得到一组匹配度最高的图像。
形成样本的太赫兹无损检测图像库具体包括:对样本进行二维平台成像扫描得到每个空间像素点的时域电场强度信号和相位等时域信息,将所述时域电场强度信号和相位等时域信息作为成像参数;所述时域电场强度信号包括峰峰值、最大值、最小值;
通过对所述每个空间像素点的时域谱进行离散傅立叶变换,获得该像素点对应频域谱;根据频域的采样间隔把每一采样频率点所对应的能量谱密度值作为成像参数。
遍历所述太赫兹无损检测图像库选出待检索图像具体包括:对所述图像库中的图像进行标准差、信息熵、平均梯度、空间频率和峰值信噪比的计算;
确定所述标准差、所述信息熵、所述平均梯度、所述空间频率和所述峰值信噪比的结果数值最大的图像,所述图像即为所述待检索图像。
计算所述待检索图像的特征向量与所述图像库中所有图像特征向量的匹配度,得到一组匹配度最高的图像具体包括:计算所述待检索图像的特征向量与所述图像库中所有图像特征向量之间夹角的余弦值;
根据余弦相似定理对所述余弦值进行大小排序,得到排序序列,确定所述排序序列的前设定个数的余弦值对应的图像为一组匹配度最高的图像。
本发明采用上述方法可以从图像库中选择出一组高质量的代表性太赫兹图像。通过这组高质量的图像,实现了检测目标缺陷的全方位、定性的准确识别。
为避免APIT-Ray5000***自带图像软件的单一成像模式造成样本有效信息丢失,首先引入了时域信息间接成像,把样本经二维平台成像扫描所获取的每个空间像素点的时域电场强度信号(如峰峰值、最大值、最小值)和相位等时域信息作为成像参数,这种成像方式的优点是生成的太赫兹图像包含的信息量大,能够反映样本总体的综合信息;其次是频域间接成像模式,通过对每一空间像素点的时域谱进行离散傅立叶变换,获得该像素点对应频域谱,再按频域的采样间隔把每一采样频率点所对应的能量谱密度值作为成像参数。采用这两种间接的成像模式,可以获取大量的太赫兹图像数据,从而形成样本的太赫兹无损检测图像库。
图2为本发明实施例太赫兹图像聚类分析***结构图。参见图2,一种太赫兹图像聚类分析***,包括:
图像库构建模块201,用于根据时域信息间接成像、频域间接成像获取大量的太赫兹图像数据,构建样本的太赫兹无损检测图像库。
遍历模块202,用于遍历所述太赫兹无损检测图像库选出待检索图像。
特征点提取模块203,用于根据尺度不变特征变换特征点提取算法,提取所述待检索图像和所述图像库中所有图像的特征点。
聚类中心生成模块204,用于根据各所述特征点的个数采用K均值聚类方法选择聚类数目,随机生成多个初始聚类中心。
聚类模块205,用于根据所述初始聚类中心对所有的所述特征点进行聚类。
特征向量获取模块206,用于统计所述待检索图像和所述图像库中每张图像在每个聚类中的特征点个数,根据所述特征点个数与设定维度构建特征向量;每张图像对应一个多维的特征向量。
目标图像获取模块207,用于计算所述待检索图像的特征向量与所述图像库中所有图像特征向量的匹配度,得到一组匹配度最高的图像。
图像库构建模块201具体包括:
时域成像单元,用于对样本进行二维平台成像扫描得到每个空间像素点的时域电场强度信号和相位等时域信息,将所述时域电场强度信号和相位等时域信息作为成像参数;所述时域电场强度信号包括峰峰值、最大值、最小值;
频域成像单元,用于通过对所述每个空间像素点的时域谱进行离散傅立叶变换,获得该像素点对应频域谱;根据频域的采样间隔把每一采样频率点所对应的能量谱密度值作为成像参数。
所述遍历模块202具体包括:
参数计算单元,用于对所述图像库中的图像进行标准差、信息熵、平均梯度、空间频率和峰值信噪比的计算;
待检索图像确定单元,用于确定所述标准差、所述信息熵、所述平均梯度、所述空间频率和所述峰值信噪比的结果数值最大的图像,所述图像即为所述待检索图像。
所述目标图像获取模块207具体包括:
余弦值计算单元,用于计算所述待检索图像的特征向量与所述图像库中所有图像特征向量之间夹角的余弦值;
图像确定单元,用于根据余弦相似定理对所述余弦值进行大小排序,得到排序序列,确定所述排序序列的前设定个数的余弦值对应的图像为一组匹配度最高的图像。
采用上述***可以从图像库中选择出一组高质量的代表性太赫兹图像。通过这组高质量的图像,实现了检测目标缺陷的全方位、定性的准确识别。
图3为本发明实施例太赫兹图像聚类分析方法细节流程示意图。参见图5,为避免APIT-Ray5000***自带图像软件的单一直接成像模式造成样本有效信息丢失,采用多模式的成像方法,构建太赫兹检测图像库。步骤如下:
1)时域信息间接成像,把样本经二维平台成像扫描所获取的每个空间像素点的时域电场强度信号(如峰峰值、最大值、最小值)和相位等时域信息作为成像参数,获取时域的太赫兹图像。这种成像方式的优点是生成的太赫兹图像包含的信息量大,能够反映样本总体的综合信息;
2)频域间接成像模式,通过对每一空间像素点的时域谱进行离散傅立叶变换,获得该像素点对应频域谱,再按频域的采样频率点的间隔(0.03125THz)把每一采样频率点所对应的能量谱密度值作为成像参数,获取频域的太赫兹图像。
3)采用这两种间接的成像模式,可以获取大量的太赫兹图像数据,将直接和间接成像所获取的所有太赫兹图像作为检测样本的图像,构建样本的太赫兹无损检测图像库。
接下来关键的问题是如何从图像库中的大量图像中选取能够体现样本边缘和内部缺陷信息的代表性无损检测图像。
为从大量的太赫兹图像数据中挑选出质量较佳的图像,引入了数字图像客观质量评价方法,并选取了标准差、信息熵、平均梯度、空间频率和峰值信噪比五种不同的评价参数。对于一幅大小为m×n的图像,所选取的客观图像质量评价指标的计算方法如下:
1)标准差
标准差(SD)反映了图像灰度值相对于均值的离散情况。标准差越小,图像的灰度值分布越集中。反之,标准差越大,图像的灰度值分布越分散,图像所包含的信息更多。图像标准差可由下式计算得到
其中,P(i,j)为图像在(i,j)处的灰度值,m,n分别为图像的高度和宽度,为图像灰度均值。
2)信息熵
信息熵(H)是一种衡量图像平均信息量的指标。图像信息熵越大,表示图像包含的信息量越多,图像成像的效果越好。反之,信息熵越小,图像成像过程中信息损失越多,图像效果越差。图像信息熵的计算方法如下:
其中,L为图像的灰度级数(本文评价的图像有256个灰度等级);p(l)表示灰度值l在图像中出现的概率,可用灰度值l的像素数与图像总像素数之比表示。
3)平均梯度
平均梯度(AG)的大小可以反映出图像细微信息的表达能力。平均梯度值越大,图像的层次越多,图像清晰度也越高,图像成像的效果越好。反之,图像的平均梯度值越小,清晰度越差,成像效果不佳。图像平均梯度可由下式计算得到,
4)空间频率
空间频率(SF)可以反映出图像的像素灰度在空间中的变化情况,分为空间行频率和列频率(对比度)。空间频率值越大,图像的低频成分越强,高频成分较弱,表明图像的灰度值分布平均平坦。反之,空间频率值越小,图像的高频成分相对较强,低频成分较弱,图像的灰度值在空间中快速变化。图像空间频率的计算方法如下:
其中,RF为空间行频率,CF为空间列频率。
5)峰值信噪比
峰值信噪比(PSNR)是一个衡量图像失真或噪声水平的客观标准,评价结果以dB为单位,PSNR值越大,代表图像失真越少,可由下式计算,
其中,MSE为均方误差,P0(i,j)为比对的原始图像在(i,j)处的灰度值,这里我们取检测***直接获取的图像作为原始图像,MAX是像素点的灰度最大值。
由于信息熵和平均梯度这两个参数反映了我们所关心的样本内部缺陷细节的关键信息,因此将这两个指标作为权重最大指标,通过遍历计算图像库中所有的太赫兹图像的客观评价指标,可以得到该样本的最佳(或较佳)太赫兹图像。
基于客观图像评价指标融合处理,可以得到一幅质量最佳的太赫兹图像。但是能够体现样本缺陷特征的往往是一类图像,因此有必要采用图像检索的方法,得到一组样本的代表性图像。
为快速准确的检索出一组相似太赫兹图像,根据SIFT算法的优势,兼顾实时性的要求,我们提出一种基于SIFT特征点提取和K均值聚类相结合的图像相似度匹配检索方法。
首先,提取所有图像的SIFT特征点;然后,采用K均值聚类通过迭代不断调整聚类中心,最终将数据集中的个体划分为K类,使得所有个体到其所属类的类中心的欧氏距离之和最小;最后,采用向量空间余弦相似度度量图像差异。
本文所提出的图像匹配检索方法具体过程如下:
图像预处理,将经过客观图像质量评价所获得的质量较佳图像作为待检索图像;
根据SIFT特征点提取算法,提取待检索图像和图像库中所有图像的SIFT特征点,SIFT特征点提取的高斯尺度值sigma=0.5;
采用K均值聚类的方法,根据SIFT特征点个数,选择聚类的数目K(K=500),随机生成K个初始聚类中心;
根据生成的初始聚类中心对所有的SIFT特征点进行聚类;
统计待检索图像和图像库中每张图像在每个聚类中的特征点个数,每张图像对应一个K维的特征向量;
根据余弦相似定理,计算待检索图像的特征向量与图像库中所有图像特征向量之间夹角的余弦值,根据夹角余弦值的大小进行排序,依次选出8幅余弦值最大的图像,作为匹配度最高的图像。
图4为本发明实施例太赫兹时域光谱透射探测***示意图。参见图4,本申请中实验采用太赫兹波透射模式的检测方法。该***由钛蓝宝石激光器产生中心波长为1064nm,脉宽为80fs,重复频率为100MHz,输出功率为20mW的飞秒脉冲激光,通过光电导天线(PhotoConductive Antenna,PCA)来产生和探测太赫兹脉冲。该***的有效频率带宽为0~3.5THz,频谱分辨率为12.5GHz,快速扫描范围为80ps,时间分辨率为0.1ps,光斑直径为1.2cm,光学分辨率小于0.5mm。工作过程:首先飞秒激光通过偏振分光镜后分为两束,能量较弱(30%左右能量)的一束作为探测光,该束光经过光学镜头折射和汇聚之后,不经过样本直接照射在用于探测的光导天线上;另外能量较强的一束(70%左右能量)作为泵浦光,经光学镜头(M1~M7)延时和聚焦之后汇聚在加有电偏压的光导天线上,从而产生平均输出功率为130nW的太赫兹脉冲,太赫兹脉冲辐射经过高阻硅材料制成的半球面透镜发射出来,然后经过高密度聚乙烯(HighDensity Polyethylene,HDPE)透镜TX聚焦在样本表面,探测透镜RX会将透过样本之后的太赫兹信号会聚,并照射在探测光导天线上。最后,由探测光的对其进行离散采样,从而获取该信号的时域波形,再对时域波形进行离散傅里叶变换,最终即可获取样本的透射太赫兹频谱信息。
实验过程中,太赫兹波发射器和接收器镜头固定安装在水平光学导轨上,待测样本放置于可以在XY轴方向移动的二维扫描平台上,并处于太赫兹脉冲聚焦位置,通过步进电机的二维扫描实现样本的太赫兹光谱成像。成像扫描时,样本暴露在干燥空气中检测,二维扫描平台的扫描步长设置为0.25mm,横向的线扫描速度为100mm/s。
表1陶瓷基复合材料样本信息
本文选取四种CMC作为实验样本,分别是氧化铝(Al2O3)陶瓷片、氮化铝(AlN)陶瓷片、氧化铍(BeO)陶瓷片和氧化锆陶(ZrO2)陶瓷片。四种样本均由国内正规厂家定制生产,为便于实验比对,每种材料都预置缺陷,缺陷主要包括内部隐藏的裂纹、气泡、杂质以及外部不同深度、不同大小的套孔等,具体的材料清单及规格等参数如表1所示。其中样本的长度、宽度和缺陷的大小均采用游标卡尺测量3次,取平均值;样品厚度采用螺旋测微仪在不同位置测量5次,取其平均值,精度均保留到0.1mm;样品的密度等其他参数直接采用生产商给出的数值。
实验中,样本表面有预置缺陷的一面朝向接收端的太赫兹透镜,分别对每种样本进行成像扫描。利用时域和频域多种成像模式的成像处理,获得了样本的无损检测太赫兹图像库。并通过多评价指标对库中的太赫兹图像进行图像质量评价,图5-图8给出了不同成像模式下氧化铝、氮化铝、氧化铍和氧化锆等四种陶瓷基片的三种成像模式(时域峰峰值、时域均值、频域能量值)定量的实验结果。
从实验结果我们可以明显看出,采用时域电场强度峰峰值和均值信息间接成像的模式,太赫兹图像质量较差;而由***图像软件直接成像模式,图像效果优于时域信息成像;采用频域不同频率对应的能量值成像的模式,图像效果总体优于前两种成像方式。特别是在通过对比了不同频率下太赫兹透射能量成像效果之后,我们发现:
(1)四种样本在低频段的太赫兹图像分辨率较低,这主要是由于该频段所对应的太赫兹波波长较长,受到了衍射极限约束的影响;
(2)在中频段范围内,样本内部缺陷表达较为明显;
(3)而在高频波段太赫兹波所具备的能量较低逐渐降低,导致穿透样本的能力下降,因此高频波段太赫兹图像虽然有较高的分辨率,但信噪比明显降低,图像的噪声较大,特别是氧化锆样本在0.5THz以上,图像的有用信息逐渐被淹没,无法有效辨别图像内部缺陷信息。
此外,为了进一步验证上述结论,并提取较佳图像,利用我们引入的5种评价指标分别评价获取的图像库数据,部分客观评价结果如表2所示。
表2图像质量客观评价指标对比
从表2的客观评价指标来看,氧化铝样本在0.76THz能量成像的综合评价指标最好,峰值信噪比保持了较高的水平,同时从图5(g)中可以看到图像的轮廓和内部边缘缺陷清晰度较高,细节体现完整,内部隐含的微小气泡缺陷也得到的清晰的体现(图中圆圈处标示),因此可以将该幅太赫兹图像最为氧化铝样本的较佳无损检测图像。氮化铝和与氧化铍样本的透射谱线非常接近,因此在成像评价指标上也表现了一定的相似性,这两种样本在1.48THz能量成像处获得综合评价指标最好的结果,图像峰值信噪比居中,平均梯度、空间频率和信息熵的值在同类指标中处于较高的水平,从图6中的(g)部分和图7中的(g)部分中可以看到图像的套孔缺陷内外边缘细节清晰,锐度较大,尤其是图6中的(g)部分中,可以我们清楚的看到了其他同类图像上表现不明显的气泡缺陷(图中红色圆圈处标示),因此可将这两幅图作为对应样本的较佳太赫兹无损检测图像。氧化锆样本在0.24THz能量成像的图像峰值信噪比最大,同时其他评价指标也较大,综合评价指标最好,从图8中的(e)部分中可以清楚的看到样本粘合的裂纹缺陷,对比样本的光学图像,可见用α-氰基丙烯酸乙酯粘合的痕迹与太赫兹图像上表现的缺陷宽度基本吻合,同时样本内部的裂纹缺陷也得到了体现(图中圆圈处标示),因此可将该幅太赫兹图像最为氧化锆样本的较佳无损检测图像。
利用本文提出的基于SIFT特征点提取算法和K均值聚类相结合的图像相似度匹配检索方法,并将通过质量评价指标融合处理获取的较佳图像作为待检索图像。同时,我们设定SIFT特征点提取的高斯尺度值sigma=0.5,K均值聚类数目K=500。对四种样本的太赫兹图像库进行匹配检索,最后得出8幅特征向量间夹角余弦值最大的太赫兹图像,这组图像可以有效代表四种样本,如图9-图12所示。
上述图像检索结果表明,本文提出的方法能有效检索出一组代表性太赫兹图像。代表性图像间,除灰度略有差别外,其他图像细节表现具有一致性。
为进一步证明代表性图像的选取,图13给出了四种样本数据库中所有图像的相似度特征向量夹角余弦值分布。其中,余弦值越接近1,表明向量夹角越接近0度,也就是检索的图像与待测图像越相似,这里我们取余弦值从0到1,余弦值为负数的均按0来处理。从图13可以看到,氧化铝的代表性图像主要分布在0.7-1.0THz这个频段的成像上,氮化铝的代表性图像主要分布在1.4-1.7THz这个频段的成像上,氧化铍的代表性图像主要分布在1.1-1.5THz这个频段的成像上,氧化锆的代表性图像主要分布在0.2-0.5THz这个频段的成像上。因此在对这四种样本的太赫兹无损检测成像处理过程中,本文提出的方法可以针对样本相应的特定频段调整成像参数,并快速检索出代表性太赫兹图像,进而提高太赫兹无损检测的效率。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的***而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (9)

1.一种太赫兹图像聚类分析方法,其特征在于,包括:
根据时域信息间接成像、频域间接成像获取大量的太赫兹图像数据,形成样本的太赫兹无损检测图像库;
遍历所述太赫兹无损检测图像库选出待检索图像;
根据尺度不变特征变换特征点提取算法,提取所述待检索图像和所述图像库中所有图像的特征点;
根据各所述特征点的个数采用K均值聚类方法选择聚类数目,随机生成多个初始聚类中心;
根据所述初始聚类中心对所有的所述特征点进行聚类;
统计所述待检索图像和所述图像库中每张图像在每个聚类中的特征点个数,根据所述特征点个数与设定维度构建特征向量;每张图像对应一个多维的特征向量;
计算所述待检索图像的特征向量与所述图像库中所有图像特征向量的匹配度,得到一组匹配度最高的图像。
2.根据权利要求1所述的太赫兹图像聚类分析方法,其特征在于,所述根据时域信息间接成像、频域间接成像获取大量的太赫兹图像数据,形成样本的太赫兹无损检测图像库具体包括:
对样本进行二维平台成像扫描得到每个空间像素点的时域电场强度信号和相位等时域信息,将所述时域电场强度信号和相位等时域信息作为成像参数;所述时域电场强度信号包括峰峰值、最大值、最小值;
通过对所述每个空间像素点的时域谱进行离散傅立叶变换,获得该像素点对应频域谱;根据频域的采样间隔把每一采样频率点所对应的能量谱密度值作为成像参数。
3.根据权利要求1所述的太赫兹图像聚类分析方法,其特征在于,所述遍历所述太赫兹无损检测图像库选出待检索图像具体包括:
对所述图像库中的图像进行标准差、信息熵、平均梯度、空间频率和峰值信噪比的计算;
确定所述标准差、所述信息熵、所述平均梯度、所述空间频率和所述峰值信噪比的结果数值最大的图像,所述图像即为所述待检索图像。
4.根据权利要求1所述的太赫兹图像聚类分析方法,其特征在于,所述计算所述待检索图像的特征向量与所述图像库中所有图像特征向量的匹配度,得到一组匹配度最高的图像具体包括:
计算所述待检索图像的特征向量与所述图像库中所有图像特征向量之间夹角的余弦值;
根据余弦相似定理对所述余弦值进行大小排序,得到排序序列,确定所述排序序列的前设定个数的余弦值对应的图像为一组匹配度最高的图像。
5.根据权利要求1所述的太赫兹图像聚类分析方法,其特征在于,所述聚类数目为500。
6.一种太赫兹图像聚类分析***,其特征在于,包括:
图像库构建模块,用于根据时域信息间接成像、频域间接成像获取大量的太赫兹图像数据,构建样本的太赫兹无损检测图像库;
遍历模块,用于遍历所述太赫兹无损检测图像库选出待检索图像;
特征点提取模块,用于根据尺度不变特征变换特征点提取算法,提取所述待检索图像和所述图像库中所有图像的特征点;
聚类中心生成模块,用于根据各所述特征点的个数采用K均值聚类方法选择聚类数目,随机生成多个初始聚类中心;
聚类模块,用于根据所述初始聚类中心对所有的所述特征点进行聚类;
特征向量获取模块,用于统计所述待检索图像和所述图像库中每张图像在每个聚类中的特征点个数,根据所述特征点个数与设定维度构建特征向量;每张图像对应一个多维的特征向量;
目标图像获取模块,用于计算所述待检索图像的特征向量与所述图像库中所有图像特征向量的匹配度,得到一组匹配度最高的图像。
7.根据权利要求6所述的太赫兹图像聚类分析***,其特征在于,所述图像库构建模块具体包括:
时域成像单元,用于对样本进行二维平台成像扫描得到每个空间像素点的时域电场强度信号和相位等时域信息,将所述时域电场强度信号和相位等时域信息作为成像参数;所述时域电场强度信号包括峰峰值、最大值、最小值;
频域成像单元,用于通过对所述每个空间像素点的时域谱进行离散傅立叶变换,获得该像素点对应频域谱;根据频域的采样间隔把每一采样频率点所对应的能量谱密度值作为成像参数。
8.根据权利要求6所述的太赫兹图像聚类分析***,其特征在于,所述遍历模块具体包括:
参数计算单元,用于对所述图像库中的图像进行标准差、信息熵、平均梯度、空间频率和峰值信噪比的计算;
待检索图像确定单元,用于确定所述标准差、所述信息熵、所述平均梯度、所述空间频率和所述峰值信噪比的结果数值最大的图像,所述图像即为所述待检索图像。
9.根据权利要求6所述的太赫兹图像聚类分析***,其特征在于,所述目标图像获取模块具体包括:
余弦值计算单元,用于计算所述待检索图像的特征向量与所述图像库中所有图像特征向量之间夹角的余弦值;
图像确定单元,用于根据余弦相似定理对所述余弦值进行大小排序,得到排序序列,确定所述排序序列的前设定个数的余弦值对应的图像为一组匹配度最高的图像。
CN201711469721.7A 2017-12-29 2017-12-29 一种太赫兹图像聚类分析方法及*** Pending CN108197649A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711469721.7A CN108197649A (zh) 2017-12-29 2017-12-29 一种太赫兹图像聚类分析方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711469721.7A CN108197649A (zh) 2017-12-29 2017-12-29 一种太赫兹图像聚类分析方法及***

Publications (1)

Publication Number Publication Date
CN108197649A true CN108197649A (zh) 2018-06-22

Family

ID=62585804

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711469721.7A Pending CN108197649A (zh) 2017-12-29 2017-12-29 一种太赫兹图像聚类分析方法及***

Country Status (1)

Country Link
CN (1) CN108197649A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110320564A (zh) * 2019-06-03 2019-10-11 中国工程物理研究院核物理与化学研究所 一种基于概率矩阵溯源的中子背散射塑性地雷成像方法
CN110674835A (zh) * 2019-03-22 2020-01-10 集美大学 一种太赫兹成像方法及***和一种无损检测方法及***
CN111161239A (zh) * 2019-12-27 2020-05-15 上海联影智能医疗科技有限公司 医学图像分析方法、装置、存储介质及计算机设备
CN112149728A (zh) * 2020-09-22 2020-12-29 成都智遥云图信息技术有限公司 一种快速的多模态图像模板匹配方法
CN113538405A (zh) * 2021-07-30 2021-10-22 吉林大学 基于图像融合的玻璃纤维复合材料无损检测方法及***
CN117930375A (zh) * 2024-03-22 2024-04-26 国擎(山东)信息科技有限公司 多维度检测技术融合的通道式太赫兹人体安检***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012150552A (ja) * 2011-01-17 2012-08-09 Horiuchi Denki Seisakusho:Kk 物体認識処理装置及び物体認識処理方法
CN103605765A (zh) * 2013-11-26 2014-02-26 电子科技大学 一种基于聚类紧凑特征的海量图像检索***
CN107356599A (zh) * 2017-06-23 2017-11-17 厦门大学 一种陶瓷基复合材料的太赫兹无损检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012150552A (ja) * 2011-01-17 2012-08-09 Horiuchi Denki Seisakusho:Kk 物体認識処理装置及び物体認識処理方法
CN103605765A (zh) * 2013-11-26 2014-02-26 电子科技大学 一种基于聚类紧凑特征的海量图像检索***
CN107356599A (zh) * 2017-06-23 2017-11-17 厦门大学 一种陶瓷基复合材料的太赫兹无损检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
李铁军等: "陶瓷基复合材料的太赫兹无损检测方法研究", 《激光与光电子学进展》 *
蒋少华: "《多源图像处理技术》", 31 July 2012, 湖南师范大学出版社 *
高超: "图像融合评价方法的研究", 《电子测试》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110674835A (zh) * 2019-03-22 2020-01-10 集美大学 一种太赫兹成像方法及***和一种无损检测方法及***
CN110320564A (zh) * 2019-06-03 2019-10-11 中国工程物理研究院核物理与化学研究所 一种基于概率矩阵溯源的中子背散射塑性地雷成像方法
CN111161239A (zh) * 2019-12-27 2020-05-15 上海联影智能医疗科技有限公司 医学图像分析方法、装置、存储介质及计算机设备
CN111161239B (zh) * 2019-12-27 2024-02-27 上海联影智能医疗科技有限公司 医学图像分析方法、装置、存储介质及计算机设备
CN112149728A (zh) * 2020-09-22 2020-12-29 成都智遥云图信息技术有限公司 一种快速的多模态图像模板匹配方法
CN112149728B (zh) * 2020-09-22 2023-11-17 成都智遥云图信息技术有限公司 一种快速的多模态图像模板匹配方法
CN113538405A (zh) * 2021-07-30 2021-10-22 吉林大学 基于图像融合的玻璃纤维复合材料无损检测方法及***
CN117930375A (zh) * 2024-03-22 2024-04-26 国擎(山东)信息科技有限公司 多维度检测技术融合的通道式太赫兹人体安检***
CN117930375B (zh) * 2024-03-22 2024-06-25 国擎(山东)信息科技有限公司 多维度检测技术融合的通道式太赫兹人体安检***

Similar Documents

Publication Publication Date Title
CN108197649A (zh) 一种太赫兹图像聚类分析方法及***
CN109916909B (zh) 光学元件表面形貌及亚表面缺陷信息的检测方法及其装置
CN107144546B (zh) 基于反射时域波形加窗的太赫兹成像方法
Cheng et al. Research of nondestructive methods to test defects hidden within composite insulators based on THz time-domain spectroscopy technology
CN103954593A (zh) 基于激光诱导击穿光谱技术的等离子体信号采集装置
CN102033081A (zh) 基于图像序列处理的红外锁相热波无损检测方法
CN105548099A (zh) 基于双光子激发荧光的文物无损三维成像及成分鉴定方法
CN115825033A (zh) 一种基于金刚石nv色心的微波反射检测装置及方法
CN103903326A (zh) 多光谱伪钞检测***及其检测方法
CN108872277A (zh) 基于龙虾眼透镜的x射线无损探伤装置
CN207798707U (zh) 一种基于矩阵分解的微波热成像无损检测***
CN106128514A (zh) 激光聚变靶丸物态信息多轴测量***
CN113063735A (zh) 一种基于色度色散的表面等离激元共振传感***
CN112326591A (zh) 一种epr热缩电缆终端内部缺陷检测***及其检测方法
KR101108554B1 (ko) 진주 감별 장치 및 방법
Wang et al. Time segmented image fusion based multi-depth defects imaging method in composites with pulsed terahertz
CN112729143B (zh) 基于比率荧光技术的发光光弹性涂层应变测量***及方法
CN113406039A (zh) 一种太赫兹主动式风力叶片泡沫芯材无损检测方法及装置
Wu et al. Optimization for continuous‐wave terahertz reflection imaging for biological tissues
CN111257713A (zh) 一种用于测量多发光峰半导体材料中载流子多重寿命的方法
Jia et al. Near-Field Microwave Imaging Method of Monopole Antennas Based on Nitrogen-Vacancy Centers in Diamond
CN117147965B (zh) 基于多光子激励的量子传感器共振频率测评***及方法
CN203825699U (zh) 多光谱伪钞检测***
CN206920020U (zh) 材料表面处理工艺过程中的等离子体三维信息诊断***
CN211086820U (zh) 一种用于太赫兹波束整形的准光学***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180622

RJ01 Rejection of invention patent application after publication