CN113689432B - 识别特殊点状类缺陷的检测方法 - Google Patents

识别特殊点状类缺陷的检测方法 Download PDF

Info

Publication number
CN113689432B
CN113689432B CN202111252331.0A CN202111252331A CN113689432B CN 113689432 B CN113689432 B CN 113689432B CN 202111252331 A CN202111252331 A CN 202111252331A CN 113689432 B CN113689432 B CN 113689432B
Authority
CN
China
Prior art keywords
clustering
sample
data
class
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111252331.0A
Other languages
English (en)
Other versions
CN113689432A (zh
Inventor
邱增帅
王罡
潘正颐
侯大为
倪文渊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou Weiyizhi Technology Co Ltd
Original Assignee
Changzhou Weiyizhi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changzhou Weiyizhi Technology Co Ltd filed Critical Changzhou Weiyizhi Technology Co Ltd
Priority to CN202111252331.0A priority Critical patent/CN113689432B/zh
Publication of CN113689432A publication Critical patent/CN113689432A/zh
Application granted granted Critical
Publication of CN113689432B publication Critical patent/CN113689432B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30164Workpiece; Machine component

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Quality & Reliability (AREA)
  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种识别特殊点状类缺陷的检测方法,获取工业相机扫描识别后经过缺陷检测装置检测到的黑点与麻点缺陷数据,将黑点与麻点缺陷数据作为样本数据;将样本数据进行中心标准化处理,去除样本数据中特征物理量之间的单位限制,转化为无量纲的纯数值数据;使用模糊C均值聚类法对样本数据进行聚类;使用间隔统计量来评价聚类结果;以不同的聚类中心数C值作为模糊C均值聚类数,聚类结束后,将C类中样本量为1的类别判断为黑点缺陷,将C类中样本量大于1的类别判断为麻点缺陷。该方法在不更改现有工业相机扫描方式的前提下,提高设备检测黑点与麻点缺陷的准确率,具有省时省力、降低项目成本以及提高缺陷检测效率的优点。

Description

识别特殊点状类缺陷的检测方法
技术领域
本发明涉及特殊缺陷检测的技术领域,尤其是一种识别特殊点状类缺陷的检测方法。
背景技术
在现有的工业质检技术当中,工件的缺陷检测方法通常是将工件固定在检验机台上,由工业相机在不同尺寸视野下,按照特定轨迹进行扫描识别(工业相机只能识别异常,但不能判断异常原因),并通过缺陷检测装置对扫描识别出的缺陷进行类别检测,其中大部分的缺陷可以被正确识别并检测出其所属缺陷类别。
然而,由于工业相机移动轨迹固定的原因,一些较为特殊的密集但不连续的缺陷会被工业相机分别扫描识别成多个相似的其他缺陷。工业质检标准当中,麻点缺陷属于密集但不连续的缺陷类型,麻点缺陷由很多点状小缺陷组成并呈聚集状态出现或成片出现。工业相机常常将一处麻点缺陷分块识别成多个点状小缺陷,在这种影响下,缺陷检测装置就会将这些多个点状小缺陷错误判断为多块距离紧密的黑点缺陷,即缺陷检测装置将原本是一处的麻点缺陷错误判断为多块距离紧密的黑点缺陷,这导致检测结果与实际工业质检标准间存在偏差。
现有的解决方案是采用人工核对的方法将工业相机识别出的特殊点状缺陷逐个进行复查,并人为再次标注识别不准确的缺陷,这种方法耗费大量人力,增加项目成本,同时效率也很难提高。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。
为此,本发明提出一种识别特殊点状类缺陷的检测方法,在不更改现有工业相机扫描方式的前提下,提高设备检测黑点与麻点缺陷的准确率,具有省时省力、降低项目成本以及提高缺陷检测效率的优点。
根据本发明实施例的识别特殊点状类缺陷的检测方法,包括以下步骤:
第1步骤、获取工业相机扫描识别后经过缺陷检测装置检测到的黑点与麻点缺陷数据,将黑点与麻点缺陷数据作为样本数据;
第2步骤、将样本数据进行中心标准化处理,去除样本数据中特征物理量之间的单位限制,转化为无量纲的纯数值数据;
第3步骤、使用模糊C均值聚类法对样本数据进行聚类;
第4步骤、使用间隔统计量来评价聚类结果:计算聚类后每一类中样本间彼此的欧式距离平方之和称为类内紧密度,类内紧密度用
Figure 755312DEST_PATH_IMAGE001
来表示,类内紧密度
Figure 960028DEST_PATH_IMAGE001
的计算公式是:
Figure 158928DEST_PATH_IMAGE002
其中,
Figure 765490DEST_PATH_IMAGE003
表示第k个聚类中心;
Figure 195072DEST_PATH_IMAGE004
Figure 949402DEST_PATH_IMAGE005
是第k类
Figure 889676DEST_PATH_IMAGE003
中的样本;
Figure 413061DEST_PATH_IMAGE006
表示
Figure 515009DEST_PATH_IMAGE004
Figure 756635DEST_PATH_IMAGE005
之间的欧氏距离;
Figure 235021DEST_PATH_IMAGE007
其中,
Figure 46201DEST_PATH_IMAGE008
表示聚类数为K时的间隔统计量;
Figure 646947DEST_PATH_IMAGE009
表示聚类中的聚类中心数;
Figure 47972DEST_PATH_IMAGE010
Figure 392366DEST_PATH_IMAGE011
的期望;
Figure 562447DEST_PATH_IMAGE011
表示
Figure 271777DEST_PATH_IMAGE001
的对数;
第5步骤、以不同的聚类中心数C值作为模糊C均值聚类数,其中,C∈[1,n],n表示数据样本量个数,且n是大于等于1的正整数;重复第3步骤和第4步骤,这样就得到了n个Gap值,选择Gap值最大的C值作为模糊C均值最佳聚类数进行模糊C均值聚类;聚类结束后,将C类中样本量为1的类别判断为黑点缺陷,将C类中样本量大于1的类别判断为麻点缺陷。
本发明的有益效果是,本发明与缺陷检测装置协同合作,叠加在缺陷检测装置之后,在满足工业现场动态需求的情况下,提高执行效率,降低已有工业相机移动轨迹和缺陷检测装置的训练成本和影响,采用识别特殊点状类缺陷的检测方法对特殊缺陷单独处理,这种方法不需要耗费大量人工并且准确率高,尤其适用样本量大的情况,可辅助完成对多项目多缺陷的缺陷精准检测及划分。
进一步具体地限定,上述技术方案中,在第4步骤中,
Figure 658634DEST_PATH_IMAGE001
越小,表示
Figure 541139DEST_PATH_IMAGE003
这类的类内距离越小,聚类越紧密;Gap值越大,表示在该聚类数下的聚类效果越好。
进一步具体地限定,上述技术方案中,在第5步骤中,C的取值集合是2、3、4、……、n*2/3,其中,n表示数据样本量个数,且n是大于等于1的正整数,n*2/3向上取整,重复第3步骤和第4步骤,这样就得到了(n*2/3-1)个Gap值,其中n*2/3向上取整。
进一步具体地限定,上述技术方案中,在第1步骤中,对样本数据集进行一致性检查,缺失值、异常值处理,检查数据有无缺失,若缺失则删除此条数据,检查数值是否在实际特征物理量取值范围之内,若超出范围则删除此条数据。
进一步具体地限定,上述技术方案中,在第2步骤中,对某特征物理量序列
Figure 831306DEST_PATH_IMAGE013
进行标准化转换,其中,n表示数据样本量个数,且n 是大于等于1的正整数,中心标准化处理的计算公式是:
Figure 711537DEST_PATH_IMAGE014
其中,
Figure 149472DEST_PATH_IMAGE015
表示中心标准化转换后的特征物理量;
Figure 773351DEST_PATH_IMAGE016
为取值范围在[1,n]的正整数;
Figure 980342DEST_PATH_IMAGE017
表示某个特征物理量;
Figure 532939DEST_PATH_IMAGE018
表示某特征物理量第i个数值;
Figure 395853DEST_PATH_IMAGE019
表示特征物理量序列z的均值;
Figure 620161DEST_PATH_IMAGE020
表示标准差;
中心标准化后的某特征物理量序列为
Figure 884920DEST_PATH_IMAGE022
,去除标 准差
Figure 841375DEST_PATH_IMAGE020
为0的特征物理量。
进一步具体地限定,上述技术方案中,特征物理量序列z的均值
Figure 253902DEST_PATH_IMAGE019
的计算公式是:
Figure 718119DEST_PATH_IMAGE023
其中,n表示数据样本量个数,且n是大于等于1的正整数;
Figure 837385DEST_PATH_IMAGE018
表示某特征物理量第i个数值。
进一步具体地限定,上述技术方案中,标准差
Figure 292637DEST_PATH_IMAGE020
的计算公式是:
Figure 864564DEST_PATH_IMAGE024
其中,n表示数据样本量个数,且n是大于等于1的正整数;
Figure 430674DEST_PATH_IMAGE018
表示某特征物理量第i个数值;
Figure 670026DEST_PATH_IMAGE019
表示特征物理量序列z的均值。
进一步具体地限定,上述技术方案中,在第3步骤中,对每个样本和每个簇赋予一个权值,每个样本在哪个类的权值最大则归为哪个类,权值取值范围在[0,1]之间,越接近于1表示权值越大,越接近于0表示权值越小,对样本数据进行模糊C均值聚类法聚类之前需要确定聚类的簇数m和聚类中心数C,其中m是取值范围在[1,∞)的正整数。
进一步具体地限定,上述技术方案中,聚类方法的具体步骤如下:
第3.1步骤、随机生成n*C的权值矩阵
Figure 729468DEST_PATH_IMAGE025
第3.2步骤、计算第j个聚类中心
Figure 851007DEST_PATH_IMAGE026
第3.3步骤、重新计算权值矩阵U,记为
Figure 158492DEST_PATH_IMAGE027
t表示第t次迭代;
第3.4步骤、计算本次迭代的误差平方和,当误差平方和相对较小时,则达到较优聚类结果;
第3.5步骤、重复第3.1步骤、第3.2步骤、第3.3步骤以及第3.4步骤,迭代计算聚类中心
Figure 314667DEST_PATH_IMAGE026
和权值矩阵
Figure 49405DEST_PATH_IMAGE028
,迭代至第t+1次迭代计算出的误差平方和
Figure 595923DEST_PATH_IMAGE029
与第t次迭代计算出的误差平方和
Figure 940055DEST_PATH_IMAGE030
的结果几乎相同时,取第t次迭代中C个聚类中心和n*C的权值矩阵,根据第t次迭代后的权值矩阵按照模糊集合中的最大隶属原则确定每个样本的归属类别。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明检测方法的流程图;
图2是聚类的流程图;
图3是工业相机拍摄并由算法识别的缺陷示意图;
图4是聚类中心数C值等于2时的模糊C均值聚类结果示意图;
图5是聚类中心数C值等于3时的模糊C均值聚类结果示意图;
图6是聚类中心数C值等于4时的模糊C均值聚类结果示意图;
图7是以不同聚类中心数C值进行模糊C均值聚类的Gap值分布图。
具体实施方式
为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
见图1和图2,本发明的一种识别特殊点状类缺陷的检测方法,包括以下步骤:
第1步骤、获取工业相机扫描识别后经过缺陷检测装置检测到的黑点与麻点缺陷数据,将黑点与麻点缺陷数据作为样本数据,由于无法完全信赖缺陷检测装置的检测结果,所以样本数据中没有区分缺陷类别的标签,只保留样本特征物理量,对样本数据集进行一致性检查,缺失值、异常值处理,检查数据有无缺失,若缺失则删除此条数据,检查数值是否在实际特征物理量取值范围之内,若超出范围则删除此条数据。
第2步骤、将样本数据进行中心标准化处理,去除样本数据中特征物理量之间的单 位限制,转化为无量纲的纯数值数据,以便于不同特征物理量之间能够进行比较和加权;对 某特征物理量序列
Figure 950736DEST_PATH_IMAGE013
进行标准化转换,其中,n表示数 据样本量个数,且n是大于等于1的正整数,中心标准化处理的计算公式是:
Figure 856375DEST_PATH_IMAGE014
(1)
其中,
Figure 952507DEST_PATH_IMAGE015
表示中心标准化转换后的特征物理量;
Figure 601794DEST_PATH_IMAGE016
为取值范围在[1,n]的正整数;
Figure 404665DEST_PATH_IMAGE017
表示某个特征物理量;
Figure 543523DEST_PATH_IMAGE018
表示某特征物理量第i个数值;
Figure 566099DEST_PATH_IMAGE019
表示特征物理量序列z的均值;
Figure 81394DEST_PATH_IMAGE020
表示标准差;
特征物理量序列z的均值
Figure 738771DEST_PATH_IMAGE019
的计算公式是:
Figure 986213DEST_PATH_IMAGE023
(2)
其中,n表示数据样本量个数,且n是大于等于1的正整数;
Figure 56937DEST_PATH_IMAGE018
表示某特征物理量第i个数值。
标准差
Figure 48027DEST_PATH_IMAGE020
的计算公式是:
Figure 887807DEST_PATH_IMAGE024
(3)
其中,n表示数据样本量个数,且n是大于等于1的正整数;
Figure 804685DEST_PATH_IMAGE018
表示某特征物理量第i个数值;
Figure 300388DEST_PATH_IMAGE019
表示特征物理量序列z的均值。
中心标准化后的某特征物理量序列为
Figure 891907DEST_PATH_IMAGE031
,去除标 准差
Figure 523876DEST_PATH_IMAGE020
为0的特征物理量,标准差
Figure 378700DEST_PATH_IMAGE020
为0表示该特征物理量在数据集中每一条数据上的表 现相同(数值保持不变),则该特征物理量为冗余特征,做删除处理。
第3步骤、使用模糊C均值聚类法对样本数据进行聚类,其原理是对每个样本和每个簇赋予一个权值(权值表示指定样本属于该簇的程度),每个样本在哪个类的权值最大则归为哪个类,权值取值范围在[0,1]之间,越接近于1表示权值越大,越接近于0表示权值越小。对样本数据进行模糊C均值聚类法聚类之前需要确定聚类的簇数(聚类中聚类数)m和聚类中心数C,其中m是取值范围在[1,∞)的正整数,但通常设置簇数m的参数为2。首先选择簇数m=2和聚类中心数C = 2进行模糊C均值聚类法聚类。聚类方法的具体步骤如下:
第3.1步骤、随机生成n*C的权值矩阵
Figure 158437DEST_PATH_IMAGE025
;由于样本数据已做中心标准化处理,所以权值矩阵
Figure 10372DEST_PATH_IMAGE032
中的随机数值分布在[0,1]之间;n表示数据样本量个数,且n是大于等于1的正整数;C表示聚类中心数,取值范围在[2,p]的正整数,p为样本数据的特征个数, 且p是大于等于1的正整数;
Figure 762428DEST_PATH_IMAGE025
中U表示权值矩阵,
Figure 584890DEST_PATH_IMAGE025
中的0表示该权值矩阵值为初始随机值,即第0次迭代;权值矩阵
Figure 789607DEST_PATH_IMAGE027
的公式如下:
Figure 926190DEST_PATH_IMAGE033
(4)
其中,
Figure 31287DEST_PATH_IMAGE034
表示第t次迭代,且t∈[0,∞);
Figure 962334DEST_PATH_IMAGE035
表示第一个样本的第一个聚类中心;
Figure 716663DEST_PATH_IMAGE036
表示第一个样本的第二个聚类中心;
Figure 391358DEST_PATH_IMAGE037
表示第一个样本的第三个聚类中心;
Figure 914743DEST_PATH_IMAGE038
表示第一个样本的第c个聚类中心;
Figure 282271DEST_PATH_IMAGE039
表示第二个样本的第一个聚类中心;
Figure 963044DEST_PATH_IMAGE040
表示第二个样本的第二个聚类中心;
Figure 238168DEST_PATH_IMAGE041
表示第二个样本的第三个聚类中心;
Figure 819322DEST_PATH_IMAGE042
表示第二个样本的第c个聚类中心;
Figure 92171DEST_PATH_IMAGE043
表示第三个样本的第一个聚类中心;
Figure 821093DEST_PATH_IMAGE044
表示第三个样本的第二个聚类中心;
Figure 837590DEST_PATH_IMAGE045
表示第三个样本的第三个聚类中心;
Figure 771786DEST_PATH_IMAGE046
表示第三个样本的第c个聚类中心;
Figure 543433DEST_PATH_IMAGE047
表示第n个样本的第一个聚类中心;
Figure 431755DEST_PATH_IMAGE048
表示第n个样本的第二个聚类中心;
Figure 251943DEST_PATH_IMAGE049
表示第n个样本的第三个聚类中心;
Figure 604427DEST_PATH_IMAGE050
表示第n个样本的第c个聚类中心。
第3.2步骤、计算第j个聚类中心
Figure 484658DEST_PATH_IMAGE026
Figure 922593DEST_PATH_IMAGE026
的计算公式是:
Figure 776499DEST_PATH_IMAGE052
(5)
其中,
Figure 186751DEST_PATH_IMAGE026
表示第j个聚类中心,j∈[1,p],p为样本数据的特征个数,且p是大于等于1的正整数;
Figure 300201DEST_PATH_IMAGE053
表示第i个样本,i∈[1,n],n表示数据样本量个数,且n是大于等于1的正整数;
Figure 163115DEST_PATH_IMAGE054
表示样本
Figure 387423DEST_PATH_IMAGE053
属于第j个聚类中心的权值;
Figure 386603DEST_PATH_IMAGE055
表示样本
Figure 107172DEST_PATH_IMAGE053
属于第j个聚类中心的隶属度(即权值)的m次幂;
Figure 519698DEST_PATH_IMAGE054
的值从权值矩阵U中获取;
Figure 485380DEST_PATH_IMAGE056
表示簇数(聚类中聚类数);其中,
Figure 666963DEST_PATH_IMAGE057
(6)
第3.3步骤、重新计算权值矩阵U,记为
Figure 794319DEST_PATH_IMAGE027
t表示第t次迭代;权值矩阵
Figure 694142DEST_PATH_IMAGE027
的各权值计算方法如下:
Figure 499604DEST_PATH_IMAGE059
(7)
其中,
Figure 299326DEST_PATH_IMAGE054
表示样本
Figure 624128DEST_PATH_IMAGE053
属于第j个聚类中心的权值;
Figure 993930DEST_PATH_IMAGE060
表示聚类中心的数量;
Figure 822208DEST_PATH_IMAGE026
表示第j个聚类中心,j∈[1,p],p为样本数据的特征个数,且p是大于等于1的正整数;
Figure 619263DEST_PATH_IMAGE061
表示第k个聚类中心,k∈[1,p],p为样本数据的特征个数,且p是大于等于1的正整数;
Figure 165782DEST_PATH_IMAGE062
表示样本
Figure 339274DEST_PATH_IMAGE053
到第j个聚类中心的欧氏距离;
Figure 786174DEST_PATH_IMAGE063
表示样本
Figure 754130DEST_PATH_IMAGE053
到第k个聚类中心的欧氏距离;以样本g和样本h为例,欧氏距离(Euclidean Distance)计算方法如下:
Figure 787945DEST_PATH_IMAGE064
(8)
其中,p为样本数据的特征个数,且p是大于等于1的正整数;
Figure 437232DEST_PATH_IMAGE065
表示第
Figure 302420DEST_PATH_IMAGE065
个特征,
Figure 378960DEST_PATH_IMAGE065
∈[1,p],
Figure 962389DEST_PATH_IMAGE065
为正整数;
Figure 645393DEST_PATH_IMAGE066
表示样本
Figure 630666DEST_PATH_IMAGE067
到样本
Figure 878108DEST_PATH_IMAGE068
的欧式距离;
第3.4步骤、计算本次迭代的误差平方和(Sum of the Squared Errors ,简称SSE),当误差平方和相对较小时,则达到较优聚类结果;误差平方和的计算公式是:
Figure DEST_PATH_IMAGE069
(9)
其中,
Figure 886515DEST_PATH_IMAGE055
表示样本
Figure 877605DEST_PATH_IMAGE053
属于第j个聚类中心的隶属度(即权值)的m次幂;
Figure 717385DEST_PATH_IMAGE062
表示样本
Figure 634263DEST_PATH_IMAGE053
到第j个聚类中心的欧氏距离。
第3.5步骤、重复第3.1步骤、第3.2步骤、第3.3步骤以及第3.4步骤,迭代计算聚类中心
Figure 926704DEST_PATH_IMAGE026
和权值矩阵
Figure 721485DEST_PATH_IMAGE028
,迭代至
Figure 353455DEST_PATH_IMAGE029
Figure 5016DEST_PATH_IMAGE030
的结果几乎相同时,
Figure 988015DEST_PATH_IMAGE029
表示第t+1次迭代计算出的误差平方和,
Figure 383225DEST_PATH_IMAGE070
表示第t次迭代计算出的误差平方和,取第t次迭代中C个聚类中心和n*C的权值矩阵,根据第t次迭代后的权值矩阵按照模糊集合中的最大隶属原则确定每个样本的归属类别。这样就能确定在聚类中心C = 2时样本数据集中每个样本所属的类别。
第4步骤、使用Gap Statistic(间隔统计量)来评价聚类结果:计算聚类后每一类中样本间彼此的欧式距离平方之和称为类内紧密度,类内紧密度用
Figure 371166DEST_PATH_IMAGE001
来表示,类内紧密度
Figure 459207DEST_PATH_IMAGE001
的计算公式是:
Figure DEST_PATH_IMAGE071
(10)
其中,
Figure 663924DEST_PATH_IMAGE003
表示第k个聚类中心;
Figure 800507DEST_PATH_IMAGE004
Figure 141490DEST_PATH_IMAGE005
是第k类
Figure 400433DEST_PATH_IMAGE003
中的样本;
Figure 590980DEST_PATH_IMAGE006
表示
Figure 327992DEST_PATH_IMAGE004
Figure 789061DEST_PATH_IMAGE005
之间的欧氏距离;
Figure 218905DEST_PATH_IMAGE001
越小,表示
Figure 132634DEST_PATH_IMAGE003
这类的类内距离越小,聚类越紧密;
Figure 611020DEST_PATH_IMAGE007
(11)
其中,
Figure 254491DEST_PATH_IMAGE008
表示聚类数为K时的间隔统计量;
Figure 22946DEST_PATH_IMAGE009
表示聚类中的聚类中心数;
Figure 751868DEST_PATH_IMAGE010
Figure 768365DEST_PATH_IMAGE011
的期望;
Figure 266343DEST_PATH_IMAGE011
表示
Figure 710093DEST_PATH_IMAGE001
的对数;Gap值越大,表示在该聚类数下的聚类效果越好。
计算样本数据中当前使用模糊C均值聚类聚为2类(K= C= 2)时的Gap值。
第5步骤、以不同的聚类中心数C值作为模糊C均值聚类数,其中,C∈[1,n],n表示数据样本量个数,且n是大于等于1的正整数;重复第3步骤和第4步骤,这样就得到了n个Gap值,选择Gap值最大的C值作为模糊C均值最佳聚类数进行模糊C均值聚类;聚类结束后,将C类中样本量为1的类别判断为黑点缺陷,将C类中样本量大于1的类别判断为麻点缺陷。需要说明的是,在不确定最佳聚类数时,C的值可以是[1,n]以内的任意值;当C = 1时,表示所有样本都为同一类;当C = n时,表示所有样本都各自为一类;这两种都属于非常极端的例子,对判断结果几乎没有帮助;为了提高工作效率,选取[2,n*2/3]的聚类数分别进行评估,具体地,C的取值集合是2、3、4、……、n*2/3,其中,n表示数据样本量个数,且n是大于等于1的正整数,n*2/3向上取整,重复第3步骤和第4步骤,这样就得到了(n*2/3-1)个Gap值,其中n*2/3向上取整。
黑点与麻点的缺陷非常相似,区别在于黑点是单独一块缺陷,而麻点是一片紧密但可能不连续的多块类黑点缺陷聚集在一起,所以,聚类后样本量不为1的类别属于麻点,并且符合麻点的形态,这样,麻点这种特殊点状类缺陷就可以被检测出,该方法叠加在缺陷检测装置之后,不影响缺陷检测装置对其他缺陷的检出结果,只单独对黑点与麻点缺陷进行再次检测判断,提升效率的同时,减少了人工参与的成本。
见图3,使用工业相机拍摄的某一个工件部位。其中,白色矩形框是工业相机逐个标注的缺陷,并且被缺陷检测装置全部识别为黑点缺陷。图中可以明显看出由于相机逐个标注的原因,标注处理后的缺陷部位很难准确判断缺陷所属类型。左侧有一处缺陷紧密聚集的区域是麻点缺陷(工业质检标准),图片其余三处缺陷是黑点缺陷(工业质检标准)。原本是一整片的麻点缺陷被分开标注处理,这可能导致检出结果有偏差。
见图4、图5和图6,当C = 4时,模糊C均值聚类结果里样本大于1的类别是麻点缺陷,样本数量为1的类别是黑点缺陷。这说明模糊C均值聚类法聚为4类时,黑点与麻点缺陷可以被区分开。
见图7,该图为C分别等于2、3、4、5时,模糊C均值聚类的Gap值示意图。图中可以明显看出,当簇数为2时,Gap值在0.35~0.4之间;当簇数为3时,Gap值为0.45;当簇数为4时,Gap值在0.55~0.6之间;当簇数为5时,Gap值为0.45。显然,当C = 2时,聚类效果较差;当C= 4时,聚类效果呈现比较好的状态,Gap值最高。所以选择将数据聚为4类,且聚类后的每个类的样本量,都符合黑点与麻点缺陷分布形态。这说明本发明的识别特殊点状类缺陷的检测方法可以在不更改现有工业相机扫描方式的前提下,有效地提高设备检测黑点与麻点缺陷的准确率,克服现阶段依赖人工核查工业相机拍摄结果的桎梏。
本发明与缺陷检测装置协同合作,叠加在缺陷检测装置之后,在满足工业现场动态需求的情况下,提高执行效率,降低已有工业相机移动轨迹和缺陷检测装置的训练成本和影响,采用识别特殊点状类缺陷的检测方法对特殊缺陷单独处理,这种方法不需要耗费大量人工并且准确率高,尤其适用样本量大的情况,可辅助完成对多项目多缺陷的缺陷精准检测及划分。
本发明的识别特殊点状类缺陷的检测方法充分迎合了工业现场相机特定移动轨迹和庞大缺陷检测装置导致黑点与麻点缺陷类别检测不准确的情况。在无法改变相机现有移动轨迹的情况下,黑点缺陷的表现形态与部分麻点缺陷十分相似,单独对比时缺陷检测装置很难将缺陷区分开。因此引入了本发明的识别特殊点状类缺陷的检测方法,将相机标注的每一处缺陷都作为一条数据,使用这些数据进行不同类别数的模糊C均值聚类。以Gap值作为评价标准选出聚类效果比较好的类别数进行聚类,这样聚类结束后每个类别都是一处缺陷,数据量为1的类别数是黑点缺陷,数据量大于1的类别数则是麻点缺陷,以此来达到黑点与麻点缺陷分类的目的。这极大地降低了现有缺陷检测装置的训练成本和影响,在不破坏缺陷检测装置的前提下提升了工业现场准确率及执行效率。
以上所述的,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (9)

1.一种识别特殊点状类缺陷的检测方法,其特征在于,包括以下步骤:
第1步骤、获取工业相机扫描识别后经过缺陷检测装置检测到的黑点与麻点缺陷数据,将黑点与麻点缺陷数据作为样本数据;
第2步骤、将样本数据进行中心标准化处理,去除样本数据中特征物理量之间的单位限制,转化为无量纲的纯数值数据;
第3步骤、使用模糊C均值聚类法对样本数据进行聚类;
第4步骤、使用间隔统计量来评价聚类结果:计算聚类后每一类中样本间彼此的欧式距离平方之和称为类内紧密度,类内紧密度用
Figure 111056DEST_PATH_IMAGE001
来表示,类内紧密度
Figure 939335DEST_PATH_IMAGE001
的计算公式是:
Figure 923340DEST_PATH_IMAGE002
其中,
Figure 532176DEST_PATH_IMAGE003
表示第k个聚类中心;
Figure 643352DEST_PATH_IMAGE004
Figure 654033DEST_PATH_IMAGE005
是第k类
Figure 811869DEST_PATH_IMAGE003
中的样本;
Figure 908001DEST_PATH_IMAGE006
表示
Figure 557288DEST_PATH_IMAGE004
Figure 609427DEST_PATH_IMAGE005
之间的欧氏距离;
Figure 748284DEST_PATH_IMAGE007
其中,
Figure 269395DEST_PATH_IMAGE008
表示聚类数为K时的间隔统计量;
Figure 519111DEST_PATH_IMAGE009
表示聚类中的聚类中心数;
Figure 691335DEST_PATH_IMAGE010
Figure 1094DEST_PATH_IMAGE011
的期望;
Figure 9501DEST_PATH_IMAGE011
表示
Figure 249859DEST_PATH_IMAGE001
的对数;
第5步骤、以不同的聚类中心数C值作为模糊C均值聚类数,其中,C∈[1,n],n表示数据样本量个数,且n是大于等于1的正整数;重复第3步骤和第4步骤,这样就得到了n个Gap值,选择Gap值最大的C值作为模糊C均值最佳聚类数进行模糊C均值聚类;聚类结束后,将C类中样本量为1的类别判断为黑点缺陷,将C类中样本量大于1的类别判断为麻点缺陷。
2.根据权利要求1所述的识别特殊点状类缺陷的检测方法,其特征在于:在第4步骤中,
Figure 89639DEST_PATH_IMAGE001
越小,表示
Figure 507982DEST_PATH_IMAGE003
这类的类内距离越小,聚类越紧密;Gap值越大,表示在该聚类数下的聚类效果越好。
3.根据权利要求1所述的识别特殊点状类缺陷的检测方法,其特征在于:在第5步骤中,C的取值集合是2、3、4、……、n*2/3,其中,n表示数据样本量个数,且n是大于等于1的正整数,n*2/3向上取整,重复第3步骤和第4步骤,这样就得到了(n*2/3-1)个Gap值,其中n*2/3向上取整。
4.根据权利要求1所述的识别特殊点状类缺陷的检测方法,其特征在于:在第1步骤中,对样本数据集进行一致性检查,缺失值、异常值处理,检查数据有无缺失,若缺失则删除此条数据,检查数值是否在实际特征物理量取值范围之内,若超出范围则删除此条数据。
5.根据权利要求1所述的识别特殊点状类缺陷的检测方法,其特征在于:在第2步骤中,对某特征物理量序列
Figure 800423DEST_PATH_IMAGE012
进行标准化转换,其中,n表示数据样本量个数,且n是大于等于1的正整数,中心标准化处理的计算公式是:
Figure DEST_PATH_IMAGE013
其中,
Figure 615162DEST_PATH_IMAGE014
表示中心标准化转换后的特征物理量;
Figure 309448DEST_PATH_IMAGE015
为取值范围在[1,n]的正整数;
Figure 147960DEST_PATH_IMAGE016
表示某个特征物理量;
Figure 193277DEST_PATH_IMAGE017
表示某特征物理量第i个数值;
Figure 526169DEST_PATH_IMAGE018
表示特征物理量序列z的均值;
Figure 74962DEST_PATH_IMAGE019
表示标准差;
中心标准化后的某特征物理量序列为
Figure 349954DEST_PATH_IMAGE020
,去除标准差
Figure 616988DEST_PATH_IMAGE019
为0的特征物理量。
6.根据权利要求5所述的识别特殊点状类缺陷的检测方法,其特征在于:特征物理量序列z的均值
Figure 753571DEST_PATH_IMAGE018
的计算公式是:
Figure 156871DEST_PATH_IMAGE021
其中,n表示数据样本量个数,且n是大于等于1的正整数;
Figure 602764DEST_PATH_IMAGE017
表示某特征物理量第i个数值。
7.根据权利要求5所述的识别特殊点状类缺陷的检测方法,其特征在于:标准差
Figure 357094DEST_PATH_IMAGE019
的计算公式是:
Figure 31789DEST_PATH_IMAGE022
其中,n表示数据样本量个数,且n是大于等于1的正整数;
Figure 555174DEST_PATH_IMAGE017
表示某特征物理量第i个数值;
Figure 174899DEST_PATH_IMAGE018
表示特征物理量序列z的均值。
8.根据权利要求1所述的识别特殊点状类缺陷的检测方法,其特征在于:在第3步骤中,对每个样本和每个簇赋予一个权值,每个样本在哪个类的权值最大则归为哪个类,权值取值范围在[0,1]之间,越接近于1表示权值越大,越接近于0表示权值越小,对样本数据进行模糊C均值聚类法聚类之前需要确定聚类的簇数m和聚类中心数C,其中m是取值范围在[1,∞)的正整数。
9.根据权利要求8所述的识别特殊点状类缺陷的检测方法,其特征在于:聚类方法的具体步骤如下:
第3.1步骤、随机生成n*C的权值矩阵
Figure 150945DEST_PATH_IMAGE023
第3.2步骤、计算第j个聚类中心
Figure 629331DEST_PATH_IMAGE024
第3.3步骤、重新计算权值矩阵U,记为
Figure 459752DEST_PATH_IMAGE025
t表示第t次迭代;
第3.4步骤、计算本次迭代的误差平方和,当误差平方和相对较小时,则达到较优聚类结果;
第3.5步骤、重复第3.1步骤、第3.2步骤、第3.3步骤以及第3.4步骤,迭代计算聚类中心
Figure 794919DEST_PATH_IMAGE024
和权值矩阵
Figure 461523DEST_PATH_IMAGE026
,迭代至第t+1次迭代计算出的误差平方和
Figure 540338DEST_PATH_IMAGE027
与第t次迭代计算出的误差平方和
Figure 225266DEST_PATH_IMAGE028
的结果几乎相同时,取第t次迭代中C个聚类中心和n*C的权值矩阵,根据第t次迭代后的权值矩阵按照模糊集合中的最大隶属原则确定每个样本的归属类别。
CN202111252331.0A 2021-10-27 2021-10-27 识别特殊点状类缺陷的检测方法 Active CN113689432B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111252331.0A CN113689432B (zh) 2021-10-27 2021-10-27 识别特殊点状类缺陷的检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111252331.0A CN113689432B (zh) 2021-10-27 2021-10-27 识别特殊点状类缺陷的检测方法

Publications (2)

Publication Number Publication Date
CN113689432A CN113689432A (zh) 2021-11-23
CN113689432B true CN113689432B (zh) 2022-02-08

Family

ID=78588251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111252331.0A Active CN113689432B (zh) 2021-10-27 2021-10-27 识别特殊点状类缺陷的检测方法

Country Status (1)

Country Link
CN (1) CN113689432B (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018225406A1 (ja) * 2017-06-08 2018-12-13 コニカミノルタ株式会社 表面欠陥検査装置の配置決定方法、該装置、該プログラムおよび記録媒体
CN110987970A (zh) * 2019-10-26 2020-04-10 惠州高视科技有限公司 物体表面缺陷检测***及检测方法

Also Published As

Publication number Publication date
CN113689432A (zh) 2021-11-23

Similar Documents

Publication Publication Date Title
CN113989279B (zh) 基于人工智能及图像处理的塑料薄膜质量检测方法
CN109977808B (zh) 一种晶圆表面缺陷模式检测与分析方法
CN115170576B (zh) 基于机器视觉的铝管表面缺陷检测方法
CN115351598A (zh) 一种数控机床轴承检测方法
CN113838054B (zh) 基于人工智能的机械零件表面损伤检测方法
CN107085846B (zh) 工件表面缺陷图像识别方法
CN111242123B (zh) 一种基于红外图像的电力设备故障诊断方法
CN111784633A (zh) 一种面向电力巡检视频的绝缘子缺损自动检测算法
CN111080691A (zh) 一种光伏组件红外热斑检测方法、装置
CN114723704A (zh) 一种基于图像处理的纺织品质量评估方法
CN114372955A (zh) 一种基于改进神经网络的铸件缺陷x射线图自动识别法
CN113537321B (zh) 一种基于孤立森林和x均值的网络流量异常检测方法
CN117115148B (zh) 基于5g技术的芯片表面缺陷智能识别方法
CN112561875A (zh) 一种基于人工智能的光伏电池板粗栅检测方法
CN114066848A (zh) 一种fpca外观缺陷视觉检测***
CN117455917B (zh) 一种蚀刻引线框架误报库建立及误报在线判定筛选方法
CN116778520B (zh) 一种海量证照数据质量检验方法
CN113689432B (zh) 识别特殊点状类缺陷的检测方法
CN117593499A (zh) 一种基于分布式巡检策略的水电站机电设备故障识别方法
CN113808129A (zh) 易混淆缺陷的有效检测方法
CN112132823A (zh) 一种基于人工智能的光伏电池图像局部光照不均处理方法
CN113780488A (zh) 基于位置聚合程度的刮伤与擦伤缺陷检测方法
CN117523324B (zh) 图像处理方法和图像样本分类方法、装置和存储介质
CN117252840B (zh) 一种光伏阵列缺陷消除评定方法、装置及计算机设备
Zhu et al. Defect Detection Algorithm of Periodic Texture by Multi-metric-Multi-module Image Voting Method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant