CN113516178A - 工业零部件的缺陷检测方法、缺陷检测装置 - Google Patents

工业零部件的缺陷检测方法、缺陷检测装置 Download PDF

Info

Publication number
CN113516178A
CN113516178A CN202110688641.0A CN202110688641A CN113516178A CN 113516178 A CN113516178 A CN 113516178A CN 202110688641 A CN202110688641 A CN 202110688641A CN 113516178 A CN113516178 A CN 113516178A
Authority
CN
China
Prior art keywords
physical quantity
defect
industrial
data
industrial parts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110688641.0A
Other languages
English (en)
Inventor
周佩涵
潘正颐
侯大为
王罡
邱增帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou Weiyizhi Technology Co Ltd
Original Assignee
Changzhou Weiyizhi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changzhou Weiyizhi Technology Co Ltd filed Critical Changzhou Weiyizhi Technology Co Ltd
Priority to CN202110688641.0A priority Critical patent/CN113516178A/zh
Publication of CN113516178A publication Critical patent/CN113516178A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Quality & Reliability (AREA)
  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)

Abstract

本发明提供一种工业零部件的缺陷检测方法、缺陷检测装置,所述方法包括:对工业零部件的检测数据进行预处理;采用CART算法对预处理后的检测数据进行物理量特征筛选;根据工业零部件的缺陷分布情况和筛选出的每个物理量特征的基尼系数对筛选出的物理量特征进行由大至小排序,以获取排序结果;根据排序结果进行工业零部件的缺陷物理量特征选择;根据缺陷物理量特征进行工业零部件的缺陷检测。该检测方法在进行物理量特征选择时,先采用CART算法进行物理量特征筛选,再结合工业零部件的缺陷分布情况对筛选出的物理量特征进行进一步选择,从而可以获取得到了缺陷的决定性特征物理量特征,完成对多项目多缺陷的缺陷精准检测及划分。

Description

工业零部件的缺陷检测方法、缺陷检测装置
技术领域
本发明涉及工业质检技术领域,具体涉及一种工业零部件的缺陷检测方法、工业零部件的缺陷检测装置。
背景技术
目前,基于工业质检的缺陷检测方法大多是人为根据历史经验选取对缺陷影响大的物理量特征进行数据分析,但由于工业质检数据本身存在特殊性,比如为了尽量减少缺陷漏检,多角度多次拍摄获取同一缺陷的数据;不同相机型号,不同光照湿度等环境下通过图像识别缺陷的清晰程度;工件本身的材质、颜色、工艺差异等原因造成缺陷物理量描述不一,不同缺陷特征物理量个数较多,进而会导致检测模型的运行时间长、精度差。
并且,人为根据历史经验选取物理量特征存在很多局限性,考虑不够全面,例如,线状缺陷的长宽物理量权重较大,而不考虑面积物理量;块状缺陷则是缺陷的面积物理量权重较大,而不考虑长宽物理量;毛絮、指纹等污渍可能判定为缺陷,从而会导致物理量特征选择不到决定性特征物理量特征,进而导致检测模型可能存在欠拟合或预测不出较优的结果。
发明内容
为解决上述技术问题,本发明的第一个目的在于提出一种工业零部件的缺陷检测方法,该检测方法在进行物理量特征选择时,先采用CART(Classification AndRegression Tree,分类回归树)算法进行物理量特征筛选,再结合工业零部件的缺陷分布情况对筛选出的物理量特征进行进一步选择,从而可以获取得到了缺陷的决定性特征物理量特征,减少工业零部件的不同缺陷特征物理量个数,从而提高模型精确度,减少运行时间的目的,且可以剔除不相关或冗余的特征,克服了由于光照条件、相机角度、工件差异、亮度湿度等导致的缺陷物理量描述不一的不利因素,完成对多项目多缺陷的缺陷精准检测及划分。
本发明的第二个目的在于提出一种工业零部件的缺陷检测装置。
本发明采用的技术方案如下:
本发明第一方面的实施例提出了一种工业零部件的缺陷检测方法,包括以下步骤:获取所述工业零部件的检测数据;对所述检测数据进行预处理,所述预处理包括:数据清洗、平衡数据分布和标准化处理;以基尼系数作为特征评分标准,采用CART算法对预处理后的检测数据进行物理量特征筛选;根据所述工业零部件的缺陷分布情况和筛选出的每个物理量特征的基尼系数对筛选出的物理量特征进行由大至小排序,以获取排序结果;根据所述排序结果进行所述工业零部件的缺陷物理量特征选择,其中选择排序结果中前预设个物理量特征作为所述工业零部件的缺陷物理量特征;根据所述缺陷物理量特征进行所述工业零部件的缺陷检测。
本发明上述提出的工业零部件的缺陷检测方法还可以具有如下附加技术特征:
根据本发明的一个实施例,根据所述工业零部件的缺陷分布情况和筛选出的每个物理量特征的基尼系数对筛选出的物理量特征进行由大至小排序,以获取排序结果,包括:判断所述工业零部件的缺陷分布是否均匀;如果所述工业零部件的缺陷分布均匀,则将筛选出的物理量特征的数据集随机打散后等距抽样,并将抽样样本分成M份,其中,M为正整数;如果所述工业零部件的缺陷分布不均匀,则根据所述工业零部件的每个区域数据占所述筛选出的物理量特征的数据集比例,对所述筛选出的物理量特征的数据集随机分层抽样,并将抽样样本平均分成M份;将1/4份抽样样本作为测试集、3/4份抽样样本作为训练集,并将所述训练集输入CART模型进行训练;根据CART模型的训练结果获取所述训练集的物理量特征的基尼系数,直至每份抽样样本均被作为测试集训练完成;将计数器的计数值加1,所述计数器的计数值初始值为0;判断所述计数器的计数值是否达到预设值,其中,所述预设值为大于等于2的正整数;如果所述计数器的计数值未达到所述预设值,则返回“判断所述工业零部件的缺陷分布是否均匀”步骤;如果所述计数器的计数值达到所述预设值,则计算所有抽样样本的每个物理量特征的基尼系数的平均值;对每个所述物理量特征的基尼系数的平均值进行由大至小排序,以获取所述排序结果。
根据本发明的一个实施例,判断所述工业零部件的缺陷分布是否均匀,包括:根据以下公式计算所述工业零部件的缺陷分布指数Index,
Figure 16722DEST_PATH_IMAGE001
,其中,
Figure 765016DEST_PATH_IMAGE002
为所述检测数据的样本个数,
Figure 17006DEST_PATH_IMAGE003
为 工业零部件的面积,
Figure 471821DEST_PATH_IMAGE004
为所述检测数据的样本中每个缺陷与其最近的缺陷之间的距离,i 为正整数;如果所述缺陷分布指数Index小于1,该数据集存在缺陷高发区,则判断所述工业 零部件的缺陷分布不均匀;如果所述缺陷分布指数Index大于或等于1时,判断所述工业零 部件的缺陷分布均匀。
根据本发明的一个实施例,所述预设值为5。
根据本发明的一个实施例,所述数据清洗包括:数据一致性检查、缺失值处理、异常值处理。
本发明第二方面的实施例提出了一种工业零部件的缺陷检测装置,包括:获取模块,所述获取模块用于获取所述工业零部件的检测数据;预处理模块,所述预处理模块用于对所述检测数据进行预处理,所述预处理包括:数据清洗、平衡数据分布和标准化处理;筛选模块,所述筛选模块用于以基尼系数作为特征评分标准,采用CART算法对预处理后的检测数据进行物理量特征筛选;排序模块,所述排序模块用于根据所述工业零部件的缺陷分布情况和筛选出的每个物理量特征的基尼系数对筛选出的物理量特征进行由大至小排序,以获取排序结果;选择模块,所述选择模块用于根据所述排序结果进行所述工业零部件的缺陷物理量特征选择,其中选择排序结果中前预设个物理量特征作为所述工业零部件的缺陷物理量特征;检测模块,所述检测模块用于根据所述缺陷物理量特征进行所述工业零部件的缺陷检测。
本发明上述提出的工业零部件的缺陷检测装置还可以具有如下附加技术特征:
根据本发明的一个实施例,所述排序模块具体用于:判断所述工业零部件的缺陷分布是否均匀;如果所述工业零部件的缺陷分布均匀,则将筛选出的物理量特征的数据集随机打散后等距抽样,并将抽样样本分成M份,其中,M为正整数;如果所述工业零部件的缺陷分布不均匀,则根据所述工业零部件的每个区域数据占所述筛选出的物理量特征的数据集比例,对所述筛选出的物理量特征的数据集随机分层抽样,并将抽样样本平均分成M份;将1/4份抽样样本作为测试集、3/4份抽样样本作为训练集,并将所述训练集输入CART模型进行训练;根据CART模型的训练结果获取所述训练集的物理量特征的基尼系数,直至每份抽样样本均被作为测试集训练完成;将计数器的计数值加1,所述计数器的计数值初始值为0;判断所述计数器的计数值是否达到预设值,其中,所述预设值为大于等于2的正整数;如果所述计数器的计数值未达到所述预设值,则返回“判断所述工业零部件的缺陷分布是否均匀”步骤;如果所述计数器的计数值达到所述预设值,则计算所有抽样样本的每个物理量特征的基尼系数的平均值;对每个所述物理量特征的基尼系数的平均值进行由大至小排序,以获取所述排序结果。
根据本发明的一个实施例,所述排序模块还用于:根据以下公式计算所述工业零 部件的缺陷分布指数Index,
Figure 224883DEST_PATH_IMAGE005
,其中,
Figure 149720DEST_PATH_IMAGE006
为所述检 测数据的样本个数,
Figure 60694DEST_PATH_IMAGE007
为工业零部件的面积,
Figure 212644DEST_PATH_IMAGE008
为所述检测数据的样本中每个缺陷与 其最近的缺陷之间的距离,i为正整数;如果所述缺陷分布指数Index小于1,该数据集存在 缺陷高发区,则判断所述工业零部件的缺陷分布不均匀;如果所述缺陷分布指数Index大于 或等于1时,判断所述工业零部件的缺陷分布均匀。
根据本发明的一个实施例,所述预设值为5。
根据本发明的一个实施例,所述数据清洗包括:数据一致性检查、缺失值处理、异常值处理。
本发明的有益效果:
本发明在进行物理量特征选择时,先采用CART算法进行物理量特征筛选,再结合工业零部件的缺陷分布情况对筛选出的物理量特征进行进一步选择,从而可以获取得到了缺陷的决定性特征物理量特征,减少工业零部件的不同缺陷特征物理量个数,从而提高模型精确度,减少运行时间的目的,且可以剔除不相关或冗余的特征,克服了由于光照条件、相机角度、工件差异、亮度湿度等导致的缺陷物理量描述不一的不利因素,完成对多项目多缺陷的缺陷精准检测及划分。
附图说明
图1是根据本发明一个实施例的工业零部件的缺陷检测方法的流程图;
图2是根据本发明另一个实施例的工业零部件的缺陷检测方法的流程图;
图3是根据本发明一个实施例的工业零部件的缺陷检测装置的方框示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是根据本发明一个实施例的工业零部件的缺陷检测方法的流程图。如图1所示,该方法包括以下步骤:
S1,获取工业零部件的检测数据。
具体地,工业零部件的检测数据为数据集,数据可以为图像。
S2,对检测数据进行预处理,预处理包括:数据清洗、平衡数据分布和标准化处理。
具体地,数据清洗包括:数据一致性检查、缺失值处理、异常值处理。
由于变量数据类别分布不平衡(正样本数量较少,负样本数量较大),需要对检测数据进行平衡数据分布,考虑工业零部件的检测数据的特殊性(某一缺陷多次重复测量采集数据、数据极为相似),若正样本数据量大于30%的负样本数据量,则采用欠采样方法进行平衡,随机抽取负样本数据将其删除,直到负样本的数量与正样本数量相同,若正样本数据量不超过30%的负样本数据量,则采用过采样方法进行平衡以防止模型欠拟合,有放回的随机抽取正样本数据进行复制,直到正样本数量与负样本数量相同。
标准化处理即将数据进行中心标准化处理,去除物理量之间的单位限制,将检测 数据转化为无量纲的纯数值数据,以便于不同物理量之间能够进行比较和加权。对某物理 量序列
Figure 336108DEST_PATH_IMAGE009
Figure 849873DEST_PATH_IMAGE010
Figure 828019DEST_PATH_IMAGE011
、……、
Figure 997706DEST_PATH_IMAGE012
进行标准化转换,标准化计算公式可以如下:
Figure 295833DEST_PATH_IMAGE013
其中
Figure 810908DEST_PATH_IMAGE014
Figure 339717DEST_PATH_IMAGE015
Figure 889645DEST_PATH_IMAGE016
为标准化转换 后的物理量,i为正整数,n为正整数。
因此,标准化的物理量的序列为
Figure 162101DEST_PATH_IMAGE017
Figure 157782DEST_PATH_IMAGE018
Figure 919808DEST_PATH_IMAGE019
、……、
Figure 995912DEST_PATH_IMAGE020
S3,以基尼系数作为特征评分标准,采用CART算法对预处理后的检测数据进行物理量特征筛选。
具体地,使用分类决策树中CART算法的特征选择思想对预处理后的检测数据进行物理量特征筛选,以基尼系数作为特征评分标准(物理量特征的基尼系数越小,该特征对区分样本的贡献度越大,基尼系数取值范围[0,1])。基尼系数计算公式可以如下:
Figure 806480DEST_PATH_IMAGE021
,其中,
Figure 296148DEST_PATH_IMAGE022
为基尼系数,
Figure 668224DEST_PATH_IMAGE023
为样本的类别数,p i 为第i个类别的概率,i为正整数;
某特征物理量A的基尼系数为
Figure 424434DEST_PATH_IMAGE024
S4,根据工业零部件的缺陷分布情况和筛选出的每个物理量特征的基尼系数对筛选出的物理量特征进行由大至小排序,以获取排序结果。
进一步地,如图2所示,根据工业零部件的缺陷分布情况和筛选出的每个物理量特征的基尼系数对筛选出的物理量特征进行由大至小排序,以获取排序结果,包括:
S41,判断工业零部件的缺陷分布是否均匀。
S42,如果工业零部件的缺陷分布均匀,则将筛选出的物理量特征的数据集随机打散后等距抽样,并将抽样样本分成M份,其中,M为正整数。
S43,如果工业零部件的缺陷分布不均匀,则根据工业零部件的每个区域数据占筛选出的物理量特征的数据集比例,对筛选出的物理量特征的数据集随机分层抽样,并将抽样样本平均分成M份。
具体地,工业零部件的区域可提前进行划分,若缺陷分布均匀,则将数据集随机打散后等距抽样分成M份,数据打散后等距抽样确保光学面各区域被抽到的概率相等。若某光学面存在缺陷高发区则将数据集按缺陷高发区划分,即缺陷分布不均匀,出现明显缺陷聚集区,则按照各区域数据占总数据集的比例随机分层抽样并平均分成M份,该抽样方式可以避免由于缺陷聚集导致的单个份数中样本比例不均衡。将抽样样本平均分成M份是指随机分层抽样或等距抽样之后,按照比例平均分,例如:检测数据共80条,各区域之间数据比例为1:2:5,则分层抽样分别随机抽取10:20:50(抽取后的数据顺序是随机的),如果平均分成5份,则每份比例2:4:10,保证每份样本中各区域之间数据比例与总区域之间数据的比例相同即可。
S44,将1/4份抽样样本作为测试集、3/4份抽样样本作为训练集,并将训练集输入CART模型进行训练。
S45,根据CART模型的训练结果获取训练集的物理量特征的基尼系数,直至每份抽样样本均被作为测试集训练完成。
本发明中,将步骤S41-S45的采样方法命名为盖瑟循环采样算法。
S46,将计数器的计数值加1,计数器的计数值初始值为0;
S47,判断判断计数器的计数值是否达到预设值,如果是,则执行步骤S48,如果否,则返回步骤S41。其中,预设值为大于等于2的正整数,例如5。
S48,计算所有抽样样本的每个物理量特征的基尼系数的平均值。
具体地,此处的平均值指的是预设值(例如5)次循环后获取到的每份抽样样本的物理量特征的基尼系数的平均值,再根据每份抽样样本的物理量特征的基尼系数的平均值计算所有抽样样本的每个物理量特征的基尼系数的平均值。
S49,对每个物理量特征的基尼系数的平均值进行由大至小排序,以获取排序结果。
举例而言,抽样样本分成4份分别命名为A、B、C、D,选A为测试集,其余为训练集进行CART模型训练,获取到物理量特征的基尼系数A1(基尼系数A1包括:A中物理特征1的基尼系数、物理特征2的基尼系数、物理特征3的基尼系数……);将A放回,选B为测试集,其余为训练集进行CART模型训练,得出物理量特征的基尼系数B1(基尼系数B1包括:B中物理特征1的基尼系数、物理特征2的基尼系数、物理特征3的基尼系数……);将B放回去,选C为测试集,其余为训练集进行CART模型训练,得出物理量特征的基尼系数C1(基尼系数C1包括:C中物理特征1的基尼系数、物理特征2的基尼系数、物理特征3的基尼系数……);依此类推直到A-D均被选作测试集得出物理量特征的基尼系数A1-D1。至此第一次循环采样完成,重复该采样法5次得到物理量特征的基尼系数A1-A5、B1-B5、C1-C5、D1-D5。
然后,计算每份的物理量特征的基尼系数平均数,即A1-A5的平均值
Figure 682369DEST_PATH_IMAGE025
、B1-B5的 平均值
Figure 709100DEST_PATH_IMAGE026
、C1-C5的平均值
Figure 812929DEST_PATH_IMAGE027
、D1-D5的平均值
Figure 970284DEST_PATH_IMAGE028
,再计算
Figure 716129DEST_PATH_IMAGE029
Figure 269470DEST_PATH_IMAGE030
Figure 413707DEST_PATH_IMAGE031
Figure 645974DEST_PATH_IMAGE028
的平均值
Figure 607895DEST_PATH_IMAGE032
Figure 717540DEST_PATH_IMAGE032
包括: 物理特征1的基尼系数平均值、物理特征2的基尼系数平均值、物理特征3的基尼系数平均 值……),由此,可以获取所有抽样样本的每个物理量特征的基尼系数的平均值
Figure 992533DEST_PATH_IMAGE033
。然后对
Figure 713362DEST_PATH_IMAGE033
中的所有物理量特征的基尼系数的平均值进行由大至小排序,即可获取排序结果。
S5,根据排序结果进行工业零部件的缺陷物理量特征选择,其中选择排序结果中前预设个物理量特征作为工业零部件的缺陷物理量特征。
S6,根据缺陷物理量特征进行工业零部件的缺陷检测。
具体地,在获取工业零部件的检测数据后,然后对检测数据进行预处理,然后以基尼系数作为特征评分标准,采用CART算法对预处理后的检测数据进行物理量特征筛选。然后重复上述的盖瑟循环采样算法5次对筛选出的物理量特征进行由大至小排序,选择前K个贡献度最大的特征作为评判工业零部件的某种缺陷的重要物理量(缺陷物理量特征)。最后根据选择的缺陷物理量特征根据实际需求进行缺陷检测即可。
该检测方法在进行物理量特征选择时,先采用CART算法进行物理量特征筛选,再结合工业零部件的缺陷分布情况对筛选出的物理量特征进行进一步选择,从而可以获取得到了缺陷的决定性特征物理量特征,减少工业零部件的不同缺陷特征物理量个数,从而提高模型精确度,减少运行时间的目的,且可以剔除不相关或冗余的特征,克服了由于光照条件、相机角度、工件差异、亮度湿度等导致的缺陷物理量描述不一的不利因素,完成对多项目多缺陷的缺陷精准检测及划分。
根据本发明的一个实施例,判断工业零部件的缺陷分布是否均匀,可以包括:根据以下公式计算工业零部件的缺陷分布指数Index,
Figure 161530DEST_PATH_IMAGE034
其中,
Figure 131541DEST_PATH_IMAGE035
为检测数据的样本个数,
Figure 13653DEST_PATH_IMAGE036
为工业零部件的面积,
Figure 892616DEST_PATH_IMAGE037
为检测数据的 样本中每个缺陷与其最近的缺陷之间的距离,i为正整数。
然后对缺陷分布指数Index进行判断,如果缺陷分布指数Index小于1,该数据集存在缺陷高发区,则判断工业零部件的缺陷分布不均匀;如果缺陷分布指数Index大于或等于1时,判断工业零部件的缺陷分布均匀。
综上,根据本发明实施例的工业零部件的缺陷检测方法,在进行物理量特征选择时,先采用CART算法进行物理量特征筛选,再结合工业零部件的缺陷分布情况对筛选出的物理量特征进行进一步选择,从而可以获取得到了缺陷的决定性特征物理量特征,减少工业零部件的不同缺陷特征物理量个数,从而提高模型精确度,减少运行时间的目的,且可以剔除不相关或冗余的特征,克服了由于光照条件、相机角度、工件差异、亮度湿度等导致的缺陷物理量描述不一的不利因素,完成对多项目多缺陷的缺陷精准检测及划分。
与上述的工业零部件的缺陷检测方法相对应,本发明还提出一种工业零部件的缺陷检测装置,由于本发明的装置实施例与上述的方法实施例相对应,对于装置实施例中未披露的细节可参照上述的方法实施例,本发明中不再进行赘述。
图3是根据本发明一个实施例的工业零部件的缺陷检测装置的方框示意图,如图3所示,该装置包括:获取模块1、预处理模块2、筛选模块3、排序模块4、选择模块5、检测模块6,其中,
获取模块1用于获取工业零部件的检测数据;预处理模块2用于对检测数据进行预处理,预处理包括:数据清洗、平衡数据分布和标准化处理;筛选模块3用于以基尼系数作为特征评分标准,采用CART算法对预处理后的检测数据进行物理量特征筛选;排序模块4用于根据工业零部件的缺陷分布情况和筛选出的每个物理量特征的基尼系数对筛选出的物理量特征进行由大至小排序,以获取排序结果;选择模块5用于根据排序结果进行工业零部件的缺陷物理量特征选择,其中选择排序结果中前预设个物理量特征作为工业零部件的缺陷物理量特征;检测模块6用于根据缺陷物理量特征进行工业零部件的缺陷检测。
根据本发明的一个实施例,排序模块4具体用于:判断工业零部件的缺陷分布是否均匀;如果工业零部件的缺陷分布均匀,则将筛选出的物理量特征的数据集随机打散后等距抽样,并将抽样样本分成M份,其中,M为正整数;如果工业零部件的缺陷分布不均匀,则根据工业零部件的每个区域数据占筛选出的物理量特征的数据集比例,对筛选出的物理量特征的数据集随机分层抽样,并将抽样样本平均分成M份;将1/4份抽样样本作为测试集、3/4份抽样样本作为训练集,并将训练集输入CART模型进行训练;根据CART模型的训练结果获取训练集的物理量特征的基尼系数,直至每份抽样样本均被作为测试集训练完成;将计数器的计数值加1,所述计数器的计数值初始值为0;判断所述计数器的计数值是否达到预设值,其中,所述预设值为大于等于2的正整数;如果所述计数器的计数值未达到所述预设值,则返回“判断所述工业零部件的缺陷分布是否均匀”步骤;如果所述计数器的计数值达到所述预设值,则计算所有抽样样本的每个物理量特征的基尼系数的平均值;对每个物理量特征的基尼系数的平均值进行由大至小排序,以获取排序结果。
根据本发明的一个实施例,排序模块4还用于:根据以下公式计算工业零部件的缺陷分布指数Index,
Figure 810719DEST_PATH_IMAGE038
其中,
Figure 957273DEST_PATH_IMAGE039
为检测数据的样本个数,
Figure 829195DEST_PATH_IMAGE040
为工业零部件的面积,
Figure 54509DEST_PATH_IMAGE041
为检测数据的 样本中每个缺陷与其最近的缺陷之间的距离,i为正整数;
如果缺陷分布指数Index小于1,该数据集存在缺陷高发区,则判断工业零部件的缺陷分布不均匀;如果缺陷分布指数Index大于或等于1时,判断工业零部件的缺陷分布均匀。
根据本发明的一个实施例,预设值为5。
根据本发明的一个实施例,数据清洗包括:数据一致性检查、缺失值处理、异常值处理。
综上,根据本发明实施例的工业零部件的缺陷检测装置,在进行物理量特征选择时,先采用CART算法进行物理量特征筛选,再结合工业零部件的缺陷分布情况对筛选出的物理量特征进行进一步选择,从而可以获取得到了缺陷的决定性特征物理量特征,减少工业零部件的不同缺陷特征物理量个数,从而提高模型精确度,减少运行时间的目的,且可以剔除不相关或冗余的特征,克服了由于光照条件、相机角度、工件差异、亮度湿度等导致的缺陷物理量描述不一的不利因素,完成对多项目多缺陷的缺陷精准检测及划分。
在本发明的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种工业零部件的缺陷检测方法,其特征在于,包括以下步骤:
获取所述工业零部件的检测数据;
对所述检测数据进行预处理,所述预处理包括:数据清洗、平衡数据分布和标准化处理;
以基尼系数作为特征评分标准,采用CART算法对预处理后的检测数据进行物理量特征筛选;
根据所述工业零部件的缺陷分布情况和筛选出的每个物理量特征的基尼系数对筛选出的物理量特征进行由大至小排序,以获取排序结果;
根据所述排序结果进行所述工业零部件的缺陷物理量特征选择,其中选择排序结果中前预设个物理量特征作为所述工业零部件的缺陷物理量特征;
根据所述缺陷物理量特征进行所述工业零部件的缺陷检测。
2.根据权利要求1所述的工业零部件的缺陷检测方法,其特征在于,根据所述工业零部件的缺陷分布情况和筛选出的每个物理量特征的基尼系数对筛选出的物理量特征进行由大至小排序,以获取排序结果,包括:
判断所述工业零部件的缺陷分布是否均匀;
如果所述工业零部件的缺陷分布均匀,则将筛选出的物理量特征的数据集随机打散后等距抽样,并将抽样样本分成M份,其中,M为正整数;
如果所述工业零部件的缺陷分布不均匀,则根据所述工业零部件的每个区域数据占所述筛选出的物理量特征的数据集比例,对所述筛选出的物理量特征的数据集随机分层抽样,并将抽样样本平均分成M份;
将1/4份抽样样本作为测试集、3/4份抽样样本作为训练集,并将所述训练集输入CART模型进行训练;
根据CART模型的训练结果获取所述训练集的物理量特征的基尼系数,直至每份抽样样本均被作为测试集训练完成;
将计数器的计数值加1,所述计数器的计数值初始值为0;
判断所述计数器的计数值是否达到预设值,其中,所述预设值为大于等于2的正整数;
如果所述计数器的计数值未达到所述预设值,则返回“判断所述工业零部件的缺陷分布是否均匀”步骤;
如果所述计数器的计数值达到所述预设值,则计算所有抽样样本的每个物理量特征的基尼系数的平均值;
对每个所述物理量特征的基尼系数的平均值进行由大至小排序,以获取所述排序结果。
3.根据权利要求2所述的工业零部件的缺陷检测方法,其特征在于,判断所述工业零部件的缺陷分布是否均匀,包括:
根据以下公式计算所述工业零部件的缺陷分布指数Index,
Figure 603540DEST_PATH_IMAGE001
其中,
Figure 636962DEST_PATH_IMAGE002
为所述检测数据的样本个数,
Figure 691024DEST_PATH_IMAGE003
为工业零部件的面积,
Figure 866789DEST_PATH_IMAGE004
为所述检测数据 的样本中每个缺陷与其最近的缺陷之间的距离,i为正整数;
如果所述缺陷分布指数Index小于1,该数据集存在缺陷高发区,则判断所述工业零部件的缺陷分布不均匀;
如果所述缺陷分布指数Index大于或等于1时,判断所述工业零部件的缺陷分布均匀。
4.根据权利要求2所述的工业零部件的缺陷检测方法,其特征在于,所述预设值为5。
5.根据权利要求1所述的工业零部件的缺陷检测方法,其特征在于,所述数据清洗包括:数据一致性检查、缺失值处理、异常值处理。
6.一种工业零部件的缺陷检测装置,其特征在于,包括:
获取模块,所述获取模块用于获取所述工业零部件的检测数据;
预处理模块,所述预处理模块用于对所述检测数据进行预处理,所述预处理包括:数据清洗、平衡数据分布和标准化处理;
筛选模块,所述筛选模块用于以基尼系数作为特征评分标准,采用CART算法对预处理后的检测数据进行物理量特征筛选;
排序模块,所述排序模块用于根据所述工业零部件的缺陷分布情况和筛选出的每个物理量特征的基尼系数对筛选出的物理量特征进行由大至小排序,以获取排序结果;
选择模块,所述选择模块用于根据所述排序结果进行所述工业零部件的缺陷物理量特征选择,其中选择排序结果中前预设个物理量特征作为所述工业零部件的缺陷物理量特征;
检测模块,所述检测模块用于根据所述缺陷物理量特征进行所述工业零部件的缺陷检测。
7.根据权利要求6所述的工业零部件的缺陷检测装置,其特征在于,所述排序模块具体用于:
判断所述工业零部件的缺陷分布是否均匀;
如果所述工业零部件的缺陷分布均匀,则将筛选出的物理量特征的数据集随机打散后等距抽样,并将抽样样本分成M份,其中,M为正整数;
如果所述工业零部件的缺陷分布不均匀,则根据所述工业零部件的每个区域数据占所述筛选出的物理量特征的数据集比例,对所述筛选出的物理量特征的数据集随机分层抽样,并将抽样样本平均分成M份;
将1/4份抽样样本作为测试集、3/4份抽样样本作为训练集,并将所述训练集输入CART模型进行训练;
根据CART模型的训练结果获取所述训练集的物理量特征的基尼系数,直至每份抽样样本均被作为测试集训练完成;
将计数器的计数值加1,所述计数器的计数值初始值为0;
判断所述计数器的计数值是否达到预设值,其中,所述预设值为大于等于2的正整数;
如果所述计数器的计数值未达到所述预设值,则返回“判断所述工业零部件的缺陷分布是否均匀”步骤;
如果所述计数器的计数值达到所述预设值,则计算所有抽样样本的每个物理量特征的基尼系数的平均值;
对每个所述物理量特征的基尼系数的平均值进行由大至小排序,以获取所述排序结果。
8.根据权利要求7所述的工业零部件的缺陷检测装置,其特征在于,所述排序模块还用于:
根据以下公式计算所述工业零部件的缺陷分布指数Index,
Figure 278048DEST_PATH_IMAGE005
其中,
Figure 171835DEST_PATH_IMAGE006
为所述检测数据的样本个数,
Figure 315241DEST_PATH_IMAGE007
为工业零部件的面积,
Figure 350936DEST_PATH_IMAGE008
为所述检测数 据的样本中每个缺陷与其最近的缺陷之间的距离,i为正整数;
如果所述缺陷分布指数Index小于1,该数据集存在缺陷高发区,则判断所述工业零部件的缺陷分布不均匀;
如果所述缺陷分布指数Index大于或等于1时,判断所述工业零部件的缺陷分布均匀。
9.根据权利要求7所述的工业零部件的缺陷检测装置,其特征在于,所述预设值为5。
10.根据权利要求6所述的工业零部件的缺陷检测装置,其特征在于,所述数据清洗包括:数据一致性检查、缺失值处理、异常值处理。
CN202110688641.0A 2021-06-22 2021-06-22 工业零部件的缺陷检测方法、缺陷检测装置 Pending CN113516178A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110688641.0A CN113516178A (zh) 2021-06-22 2021-06-22 工业零部件的缺陷检测方法、缺陷检测装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110688641.0A CN113516178A (zh) 2021-06-22 2021-06-22 工业零部件的缺陷检测方法、缺陷检测装置

Publications (1)

Publication Number Publication Date
CN113516178A true CN113516178A (zh) 2021-10-19

Family

ID=78065775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110688641.0A Pending CN113516178A (zh) 2021-06-22 2021-06-22 工业零部件的缺陷检测方法、缺陷检测装置

Country Status (1)

Country Link
CN (1) CN113516178A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103984951A (zh) * 2014-04-25 2014-08-13 西南科技大学 一种磁粉检测缺陷自动识别方法及***
CN107292186A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 一种基于随机森林的模型训练方法和装置
CN110264116A (zh) * 2019-07-31 2019-09-20 三峡大学 一种基于关系探索与回归树的电力***动态安全评估方法
CN110287552A (zh) * 2019-06-10 2019-09-27 合肥工业大学 基于改进随机森林算法的电机轴承故障诊断方法及***
CN111260201A (zh) * 2020-01-13 2020-06-09 北京科技大学 一种基于分层随机森林的变量重要性分析方法
CN113178264A (zh) * 2021-05-04 2021-07-27 温州医科大学附属第一医院 一种深肌层浸润数据预测方法及***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103984951A (zh) * 2014-04-25 2014-08-13 西南科技大学 一种磁粉检测缺陷自动识别方法及***
CN107292186A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 一种基于随机森林的模型训练方法和装置
CN110287552A (zh) * 2019-06-10 2019-09-27 合肥工业大学 基于改进随机森林算法的电机轴承故障诊断方法及***
CN110264116A (zh) * 2019-07-31 2019-09-20 三峡大学 一种基于关系探索与回归树的电力***动态安全评估方法
CN111260201A (zh) * 2020-01-13 2020-06-09 北京科技大学 一种基于分层随机森林的变量重要性分析方法
CN113178264A (zh) * 2021-05-04 2021-07-27 温州医科大学附属第一医院 一种深肌层浸润数据预测方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
秦昆: "《GIS空间分布理论与方法》", 31 March 2010 *

Similar Documents

Publication Publication Date Title
KR102513713B1 (ko) 결함 분류를 위한 방법 및 시스템
CN109949305B (zh) 产品表面缺陷检测方法、装置及计算机设备
TWI576708B (zh) 自動缺陷分類的分類器準備與維持
CN111461533B (zh) 一种基于大数据的工业生产流水线的故障监测方法及***
Wang et al. Comparison of methods for outlier identification in surface characterization
CN109829943B (zh) 基于机器视觉的叶片结构检测方法、***、介质及设备
JPH08504522A (ja) 境界ピクセル・パラメータの規則正しいシーケンスを用いた物体を識別するための方法及び装置
CN111860698A (zh) 确定学习模型的稳定性的方法和装置
CN112202630A (zh) 一种基于无监督模型的网路质量异常检测方法及装置
CN116881530B (zh) 一种基于深度学习的器件表面缺陷检测***
CN110108713A (zh) 一种表面异物缺陷快速过滤方法及***
CN113516178A (zh) 工业零部件的缺陷检测方法、缺陷检测装置
CN117630800A (zh) 一种电能表自动检定装置故障诊断方法及***
CN116797575A (zh) 一种基于机器视觉的碎米率智能检测方法
Yoon et al. Improved modified pressure imaging and software for egg micro-crack detection and egg quality grading
CN116778269A (zh) 一种基于自编码器重构产品表面缺陷检测模型构建方法
Buschmann et al. Data-driven decision support for process quality improvements
JPH07318508A (ja) 画像判定装置および画像判定方法
CN113420772A (zh) 基于多分类器与svdd协同算法的缺陷检测方法和装置
CN112445632A (zh) 基于故障数据建模的hpc可靠性评估方法
JP6872829B1 (ja) 異物発生原因推定システム及び異物発生原因推定方法
CN117217476B (zh) 一种产线测试资源自动化配置方法
JPH09218158A (ja) 対象物の外観評価方法
CN111258894B (zh) 软件风险的评价方法、装置、存储介质及电子设备
JP3012295B2 (ja) 画像処理装置および方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20211019

RJ01 Rejection of invention patent application after publication