CN113642680A - 边缘合成及超球体软拟合缺陷检测方法 - Google Patents
边缘合成及超球体软拟合缺陷检测方法 Download PDFInfo
- Publication number
- CN113642680A CN113642680A CN202111192923.8A CN202111192923A CN113642680A CN 113642680 A CN113642680 A CN 113642680A CN 202111192923 A CN202111192923 A CN 202111192923A CN 113642680 A CN113642680 A CN 113642680A
- Authority
- CN
- China
- Prior art keywords
- sample
- samples
- class
- hypersphere
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Processing (AREA)
- Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)
Abstract
Description
技术领域
本发明涉及缺陷检测的技术领域,尤其是一种边缘合成及超球体软拟合缺陷检测方法。
背景技术
由于工业现场质检数据本身存在多样性,工件新产生的缺陷类型常常在历史数据中没有发生过,缺乏先验信息且数据量极小。这直接导致了工业设备对缺陷的识别不准确,造成工业质检数据与实际现场环境存在误差。基于这个需求,亟需发明一种可以增加少量数据(扩大数据样本量)并且准确分类识别的方法,降低工业零部件的不同缺陷在设备上的识别断层,从而提高设备模型精确度,减少现场工作难度的目的。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。
为此,本发明提出一种边缘合成及超球体软拟合缺陷检测方法,该边缘合成及超球体软拟合缺陷检测方法具有减少工业零部件的不同缺陷在设备上识别出现断层、提高模型精确度、降低现场工作难度的优点。
根据本发明实施例的边缘合成及超球体软拟合缺陷检测方法,具体步骤如下:
第2步骤、将T类样本分为三类,它们分别为噪声类、危险类和安全类,其中,噪声类的样本T和安全类的样本T均不做处理;
第4步骤、使用危险类样本生成新数据并添加到训练数据当中;
第5步骤、将训练数据映射到特征空间;
第6步骤、计算包围正样本的超球体半径R,计算测试样本点到超球体球心的距离dist;
本发明的有益效果是,本发明属于算法的协同合作,可以减少工业零部件的不同缺陷在设备上识别出现断层,从而提高模型精确度,降低现场工作难度,满足工业现场的动态需求,提高执行效率,降低已有算法的训练成本和影响,采用边缘合成及超球体软拟合缺陷检测的训练成本低并且准确率高,将新出现的缺陷类型数据量增加后添加到超球体软拟合技术当中后直接训练,解决了由于数据量过小导致的设备识别不准确的问题,克服了由于光照条件、相机角度、工件差异、亮度、湿度等导致的缺陷物理量描述不一的不利因素,完成对多项目多缺陷的缺陷精准检测及划分。
进一步具体地限定,上述技术方案中,在第1步骤中,最近邻所采用的距离为欧氏距离,表示为:
进一步具体地限定,上述技术方案中,所述第4步骤的具体步骤是:
第4.4步骤、最后得到s个新的T类样本数据。
进一步具体地限定,上述技术方案中,对每一个重复上述步骤,生成大量新的
T类样本数据,由于新的数据是沿着区分小样本类别的边界样本数据和其最近邻之间样本
之间生成的,从而加强了样本区分的边界,危险类样本与其最近邻之间的差乘以0到0.5之
间的随机数,这样可以使新生成的样本更接近于小样本的类别。
进一步具体地限定,上述技术方案中,在第5步骤中,采用超球体软拟合技术对新
生成的数据进行分类训练,该超球体软拟合技术是单类别分类技术,可以识别并判断训练
样本和非训练样本两类;具体操作如下,首先将训练集与新生成的T样本数据从原始数据映
射到高维度的特征空间,采用非线性变换函数对数据进行映射,其中,表示拉
伸过后的函数;x表示特征向量;F表示特征空间。
进一步具体地限定,上述技术方案中,在第6步骤中,从特征空间中找出一个包围正样本的超球体,并通过最小化该超球体的体积让正样本点尽可能地被包围在超球体中,且负样本点尽可能地排除在超球体之外。
进一步具体地限定,上述技术方案中,在第7步骤中,将测试样本导入训练完成的超球体软拟合技术当中,判断测试样本是否在超球体表面或内部,对于某一个测试样本,该测试样本点到超球体球心的距离为dist,若测试样本在超球体表面或内部,则该测试样本为正样本,反之则为负样本,得出一系列测试样本属性,边缘合成超球体软拟合技术结束。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的流程图;
图2是使用BSMOTE方法前训练数据二维分布示意图;
图3是带有BSMOTE标注的训练数据二维分布示意图;
图4是使用BSMOTE方法后的训练数据二维分布示意图;
图5是超球体软拟合技术分类测试结果。
具体实施方式
为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
见图1,本发明的一种边缘合成及超球体软拟合缺陷检测方法,具体步骤如下:
第1步骤、假设整体训练集共分为两类,其中一类样本数量小,另一类样本数量大,
小样本类别用T表示,大样本类别用F表示,其中T的样本数量用来表示,F的样本数量
用来表示。对于小样本量T类中的每一个样本,从训练集中找出小样本
T类中的每一个样本的m个最近邻,其中的且m为正整数,,分
别统计每个小样本的m个最近邻所属类别,近邻为大样本F的个数用表示,即m个最近邻
中的属于大样本F类的例子用个来表示。上述提到的最近邻所采用的距离为欧氏距离
(Euclidean Distance),表示为:
第2步骤、将T类样本分为三类,它们分别为噪声类(noise)、危险类(danger)和安全类(safe),分类规则如下:
其中,噪声类的样本T和安全类的样本T均不做处理。
需要说明的是:F类样本表示数据集中大样本的数据,T类样本表示数据集中小样
本的数据,表示小样本数据中第i个小样本。T类样本总数 = 噪声类T样本总数+危险类T
样本总数+安全类T样本总数。以样本的m个最近邻样本类别数来判断该T类样本属于哪一
类。例如,的最近邻样本中F类样本数大于T类样本数,这里表示第i个小样本数据。最
近邻样本中F类样本数大于T类样本数表示当前的F类样本数+ T类样本数 = m,且F类样本
数 > T类样本数。
第4步骤、使用危险类样本生成新数据并添加到训练数据当中;具体步骤是:
第4.4步骤、最后得到s个新的T类样本数据;
对每一个重复上述步骤,生成大量新的T类样本数据,由于新的数据是沿着区分
小样本类别的边界样本数据(危险类)和其最近邻之间样本之间生成的,从而加强了样本区
分的边界,危险类样本与其最近邻之间的差乘以0到0.5之间的随机数,这样可以使新生成
的样本更接近于小样本的类别,新样本数据生成公式为:
第5步骤、将训练数据映射到特征空间;采用超球体软拟合技术对新生成的数据进
行分类训练,该超球体软拟合技术是单类别分类技术,可以识别并判断训练样本和非训练
样本(即正样本和非正样本)两类;具体操作如下,首先将训练集与新生成的T样本数据从原
始数据映射到高维度的特征空间,采用非线性变换函数对数据进行映射(整体表
示为通过非线性函数将特征向量x映射到特征空间F),其中,表示拉伸过后的函数;x表示
特征向量;F表示特征空间。需要说明的是:对原始数据进行高维映射时,是对特征向量x里
的每个样本,也就是每一行的特征向量都进行了拉伸变换,使得对x中的每个元素,在F中有
唯一确定的元素f与之对应,将拉伸过后的函数叫做,则称为从x到F的映射。
第6步骤、计算包围正样本(训练样本)的超球体半径R,计算测试样本点到超球体球心的距离dist;从特征空间中找出一个包围正样本(训练样本)的超球体,并通过最小化该超球体的体积让正样本点尽可能地被包围在超球体中,且负样本点尽可能地排除在超球体之外;最小化超球体的体积公式为:
其中,p表示第p个训练样本;表示超球体的球心;R表示超球体半径;表示松弛
因子;C表示一个权衡超球体体积和误分率的惩罚参数;n表示训练集的样本个数;求和符号
∑右下角的p=1表示p取值从1开始直到p取值为n。
上述公式(5)中的对偶公式为:
其中,求和符号∑右下角的p=1表示p取值从1开始直到p取值为n;q表示第q个训练
样本;表示核函数,等同于特征空间中样本的内积;表示样本对应的拉格朗日系
数,且,;表示样本对应的拉格朗日系数,且,;在所有训练样本中,把拉格朗日系数满足的样本称为支持向量,假
设训练数据集中属于支持向量的样本集合为SV,则:
第7步骤、判断是否,如果,则认为是正样本,如果dist大于R,则
认为是负样本,最终得出测试样本分类结果。具体地,将测试样本导入训练完成的超球体软
拟合技术当中,判断测试样本是否在超球体表面或内部(即是否),对于某一个测试
样本,该测试样本点到超球体球心的距离为:
若测试样本在超球体表面或内部,则该测试样本为正样本,反之则为负样本,得出一系列测试样本属性,边缘合成超球体软拟合技术结束。
见图2,圆点为小样本量数据T,三角形为大样本量数据F,T的数量为60个,F的数量为1580个。
见图3,圆点为小样本量数据T,三角形为大样本量数据F,五角星为边缘合成少数类过采样技术(BSMOTE)标注的小样本量数据中的危险类数据,可以明显看出危险类数据处于T和F样本分布的边界,T的数量为60个,F的数量为1580个,危险类的数量为24个。
见图4,圆点为小样本量数据T,三角形为大样本量数据F,T类数据明显增多,且使用边缘合成少数类过采样技术(BSMOTE)方法进行过采样后,T类数据的边界增强,轮廓清晰,T的数量为660个,F的数量为1580个。
超球体软拟合技术分类识别结果对比表
以上对比表为未使用边缘合成少数类过采样技术(BSMOTE)进行边缘数据合成及使用后的超球体软拟合技术分类识别结果对比表,表中可以明显看出在测试样本不变的情况下,使用边缘合成少数类过采样技术(BSMOTE)进行边缘数据合成对模型识别缺陷的综合准确率提高了超过40%(F1分数达到94%)。计算过程是;
使用后的F1分数-使用前的F1分数=0.9416576 - 0.5271884=0.4144692*100% ≈41.4%(超过40%),这说明几乎所有的缺陷都被识别出来了。
见图5,超球体软拟合技术在模型训练时采用边缘合成少数类过采样技术(BSMOTE)进行边缘数据合成后的训练数据。图中位于黑色横线下方的样本点为正确识别的数据,横线上方为误识别的数据,可以很明显看出只有个别缺陷被误识别,这说明使用BSMOTE边缘合成数据和超球体软拟合技术协同使用的方法可以有效地提高算法识别的准确性。
边缘合成及超球体软拟合缺陷识别技术的关键点在于,它充分迎合了工业现场无法处理未知新缺陷或某类缺陷数量极少的情况。未知新缺陷的特征往往和某些已知的缺陷/污渍/毛絮等相似,很难在数据量极少的情况下将缺陷识别出来,因此引入了边缘合成技术进行人工合成新样本来增加小样本缺陷的样本量。由于危险类缺陷样本对决策影响大,处于边界附近的缺陷样本(危险类缺陷样本)更容易被错误分类,所以仅对缺陷中的危险类缺陷进行人工合成新的缺陷样本。这使得缺陷样本的边界清晰,缺陷数据的不确定性较小且克服了不同类样本之间混叠的现象。受未知新缺陷不存在历史数据库中的影响,现有的算法模型无法进行决策训练。超球体软拟合技术作为一种单一分类器,可以在无历史数据的情况下识别缺陷。即只用边缘合成技术后的未知新缺陷样本进行训练,然后使用超球体软拟合技术对测试数据进行决策,该技术可以识别出测试数据中属于未知新缺陷这一类别的数据。这极大地降低了现有算法的训练成本和影响,在不破坏现有算法的前提下提升了工业现场准确率及执行效率。
以上所述的,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (8)
1.一种边缘合成及超球体软拟合缺陷检测方法,其特征在于,具体步骤如下:
第2步骤、将T类样本分为三类,它们分别为噪声类、危险类和安全类,其中,噪声类的样本T和安全类的样本T均不做处理;
第4步骤、使用危险类样本生成新数据并添加到训练数据当中;
第5步骤、将训练数据映射到特征空间;
第6步骤、计算包围正样本的超球体半径R,计算测试样本点到超球体球心的距离dist;
6.根据权利要求1所述的边缘合成及超球体软拟合缺陷检测方法,其特征在于:在第6步骤中,从特征空间中找出一个包围正样本的超球体,并通过最小化该超球体的体积让正样本点尽可能地被包围在超球体中,且负样本点尽可能地排除在超球体之外。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111192923.8A CN113642680B (zh) | 2021-10-13 | 2021-10-13 | 边缘合成及超球体软拟合缺陷检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111192923.8A CN113642680B (zh) | 2021-10-13 | 2021-10-13 | 边缘合成及超球体软拟合缺陷检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113642680A true CN113642680A (zh) | 2021-11-12 |
CN113642680B CN113642680B (zh) | 2022-02-08 |
Family
ID=78426612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111192923.8A Active CN113642680B (zh) | 2021-10-13 | 2021-10-13 | 边缘合成及超球体软拟合缺陷检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113642680B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104063873A (zh) * | 2014-07-08 | 2014-09-24 | 华东交通大学 | 一种基于压缩感知的轴套类零件表面缺陷在线检测方法 |
WO2018000731A1 (zh) * | 2016-06-28 | 2018-01-04 | 华南理工大学 | 一种曲面表面缺陷自动检测方法及其装置 |
CN109345523A (zh) * | 2018-09-21 | 2019-02-15 | 中国科学院苏州生物医学工程技术研究所 | 表面缺陷检测和三维建模方法 |
-
2021
- 2021-10-13 CN CN202111192923.8A patent/CN113642680B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104063873A (zh) * | 2014-07-08 | 2014-09-24 | 华东交通大学 | 一种基于压缩感知的轴套类零件表面缺陷在线检测方法 |
WO2018000731A1 (zh) * | 2016-06-28 | 2018-01-04 | 华南理工大学 | 一种曲面表面缺陷自动检测方法及其装置 |
CN109345523A (zh) * | 2018-09-21 | 2019-02-15 | 中国科学院苏州生物医学工程技术研究所 | 表面缺陷检测和三维建模方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113642680B (zh) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110443281B (zh) | 基于hdbscan聚类的文本分类自适应过采样方法 | |
CN109255344B (zh) | 一种基于机器视觉的数显式仪表定位与读数识别方法 | |
US7174043B2 (en) | On-line handwriting recognizer | |
Singh et al. | Svm-bdt pnn and fourier moment technique for classification of leaf shape | |
Singhal et al. | Local binary pattern for automatic detection of acute lymphoblastic leukemia | |
CN110070090A (zh) | 一种基于手写文字识别的物流标签信息检测方法及*** | |
CN111126446B (zh) | 一种机器人视觉工业产品缺陷图像数据增广方法 | |
CN114372968A (zh) | 结合注意力机制与自适应记忆性融合网络的瑕疵检测方法 | |
CN111340086A (zh) | 无标签数据的处理方法、***、介质及终端 | |
CN111343147A (zh) | 一种基于深度学习的网络攻击检测装置及方法 | |
CN113591948A (zh) | 一种缺陷模式识别方法、装置、电子设备和存储介质 | |
CN117576079A (zh) | 一种工业产品表面异常检测方法、装置及*** | |
CN117197559A (zh) | 基于深度学习的猪肉分类模型、构建方法、电子设备和计算机可读介质 | |
CN113781483B (zh) | 工业产品外观缺陷检测方法和装置 | |
CN113762151A (zh) | 一种故障数据处理方法、***及故障预测方法 | |
CN114565798A (zh) | 基于铁谱图像分析的动力装置磨损故障诊断方法及*** | |
CN113642680B (zh) | 边缘合成及超球体软拟合缺陷检测方法 | |
CN113313406A (zh) | 一种电动汽车运行大数据的动力电池安全风险评估方法 | |
CN112396580A (zh) | 一种圆形零件缺陷检测方法 | |
CN116597275A (zh) | 一种基于数据增强的高速移动目标识别方法 | |
CN112862767B (zh) | 基于度量学***衡样本的表面缺陷检测方法 | |
Mosin et al. | Comparing input prioritization techniques for testing deep learning algorithms | |
Yunhui et al. | The strip steel surface defects classification method based on weak classifier adaptive enhancement | |
CN116150687A (zh) | 一种基于多分类g-wlstsvm模型的流体管道泄漏识别方法 | |
CN111985826B (zh) | 一种多指标工业产品的可视化质量分级方法和*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |