CN113724197B - 基于元学习的螺纹旋合性判定方法 - Google Patents

基于元学习的螺纹旋合性判定方法 Download PDF

Info

Publication number
CN113724197B
CN113724197B CN202110847674.5A CN202110847674A CN113724197B CN 113724197 B CN113724197 B CN 113724197B CN 202110847674 A CN202110847674 A CN 202110847674A CN 113724197 B CN113724197 B CN 113724197B
Authority
CN
China
Prior art keywords
data set
model
training
thread
meta
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110847674.5A
Other languages
English (en)
Other versions
CN113724197A (zh
Inventor
涂中
陈盛
徐国政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202110847674.5A priority Critical patent/CN113724197B/zh
Publication of CN113724197A publication Critical patent/CN113724197A/zh
Application granted granted Critical
Publication of CN113724197B publication Critical patent/CN113724197B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01BMEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
    • G01B21/00Measuring arrangements or details thereof, where the measuring technique is not covered by the other groups of this subclass, unspecified or not relevant
    • G01B21/10Measuring arrangements or details thereof, where the measuring technique is not covered by the other groups of this subclass, unspecified or not relevant for measuring diameters
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01BMEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
    • G01B21/00Measuring arrangements or details thereof, where the measuring technique is not covered by the other groups of this subclass, unspecified or not relevant
    • G01B21/16Measuring arrangements or details thereof, where the measuring technique is not covered by the other groups of this subclass, unspecified or not relevant for measuring distance of clearance between spaced objects
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01BMEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
    • G01B21/00Measuring arrangements or details thereof, where the measuring technique is not covered by the other groups of this subclass, unspecified or not relevant
    • G01B21/22Measuring arrangements or details thereof, where the measuring technique is not covered by the other groups of this subclass, unspecified or not relevant for measuring angles or tapers; for testing the alignment of axes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30164Workpiece; Machine component

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Geometry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于元学***衡螺纹参数数据集;S2:对不平衡螺纹参数数据集平衡化处理,得到检测数据集;对检测数据集中进行归一化;S3、将归一化的检测数据集划分为预训练数据集和精调数据集;S4:构建人工神经网络模型,将预训练数据集作为模型的输入,采用MAML元学习算法,进行螺纹旋合性特征预训练,得到预训练好的元模型Meta和初始化参数;S5:将精调数据集输入元模型Meta中进行螺纹旋合性特征微调训练,得到螺纹旋合性判断模型Mfine‑tune。本发明能够通过小样本数据集得到准确的模型,提高了螺纹旋合性检测的准确性,高效性,泛化性,可靠性。

Description

基于元学习的螺纹旋合性判定方法
技术领域
本发明涉及螺纹检测和元学习技术领域,具体提供一种基于元学习螺纹旋合性判定方法。
背景技术
随着社会的不断进步,社会经济飞速发展,各项技术不断发展,并且要求越来越高。螺纹检测是一项复杂的技术,随着科技地不断发展,人们对螺纹检测的要求越来越高,对螺纹的质量要求也越来越严格,因此,在螺纹出成品后,对螺纹质量的检测成为了必要而关键的一步。现有技术中,螺纹工厂产品检测主要是由人工完成的,效率低,成本高,并且检测的标准可能出现误差,导致螺纹质量的参差不齐。
现有的方法利用图像识别技术训练模型的方法,通过图像拟合的方法,要使用大量的训练数据集去进行模型训练,效果一般,而且对于小样本数据集,模型的效果往往都不理想。
经检索发现,公开号为CN109919941A的中国专利于2019年6月21日公开了一种内螺纹缺陷检测方法、装置、***、计算机设备及存储介质,先获取图像采集模块发送的目标物的内螺纹图像,所述内螺纹图像为所述图像采集模块通过所述棱镜部件和所述图像采集部件采集的包括所述目标物完整内螺纹信息的图像,可以保证内螺纹图像采集的效率和精度;进一步地,通过预设的缺陷检测模型对所述内螺纹图像进行识别,得到所述目标物的缺陷检测信息。保证了对内螺纹图像中的缺陷识别的效率和准确性。但存在拟合精度低,数据处理量大的问题。需要设计一种精度更高、更精准的判断方法;对于小样本数据集也要有比较理想的判断效果。
发明内容
为克服上述现有技术的不足,本发明提供一种基于元学习的螺纹旋合性判定方法,能够解决螺纹旋合性检测速度较慢、准确率不高、检验效果无法保证的问题,同时也解决了现有技术中对于小样本数据集的检测效果不理想的问题。
为实现上述目的,本发明提供了如下技术方案:
基于元学习的螺纹旋合性判定方法,具体包括以下步骤:
S1、收集螺纹参数信息包括螺纹中径、牙型角、螺距、大径、小径等,将这些作为样本的特征并制作成原始的CSV数据集;通过对原始数据集分析,根据国标GB/T197-2003螺纹公差,将原始数据进行标注,符合公差带标准的合格标注为1,反之不合格标注为0;
S2、数据处理与特征处理,对不平衡螺纹参数数据集进行平衡化处理,运用C-K-SMOTE算法对不平衡螺纹参数数据集进行平衡化处理,得到检测数据集;对检测数据集集中的每个样本进行归一化;
S3、对步骤S2中归一化之后的检测数据集进行划分,按照数据质量标准划分为一定比例的精调数据集和预训练数据集;
S4、构建正反双向传播的人工神经网络模型M,利用预训练数据集作为模型的输入,采用MAML元学习算法,得到预训练好的元模型Meta和初始化参数;
S5、将精调数据集中的训练集作为模型Meta的输入,对螺纹旋合性判断模型进行微调训练,得到训练好的螺纹旋合性判断模型Mfine-tune
S6、将精调数据集中的测试集作为模型Mfine-tune的输入,得到螺纹旋合性判断模型的正确率。
优选的,步骤S1中,将数据集中的数据记为 (n为螺纹参数样本数量)}。
优选的,步骤S2中,C-K-SMOTE算法可以将不平衡的螺纹参数数据集转换成平衡数据集;具体步骤包括:
S21:将不平衡数据集中螺纹旋合性不合格类运用Canopy算法进行粗聚类,得到若干个粗糙簇;
S22:根据粗糙簇个数来设置K-means算法预设聚类簇数k并进行再次聚类得到精准簇;
S23:基于步骤S22得到的若干个螺纹旋合性不合格的精准簇,运用SMOTE过采样算法,采用修正的随机插值公式即可得到合成的新的螺纹旋合性不合格样本,增加了螺纹参数样本中的不合格少数类的数量,平衡了螺纹参数数据集。
其中修正的随机插值公式为:
Pj=Pi+rand(0,1)(ut-Pi) (1)
式中:Pi(i=1,2,...,n)为螺纹旋合性不合格类样本,n为螺纹旋合性不合格类样本总数;ut(t=1,2,...,k)为螺纹旋合性不合格样本精准聚类簇簇心,k表示其聚类簇数;Pj(j=1,2,...,m)为合成的新的螺纹旋合性不合格样本,m为新合成螺纹旋合性不合格的总数;rand(0,1)为(0,1)区间的随机数。
优选的,步骤S2中,对数据集预处理为对数据集中处理后的螺纹参数进行优化,将数据集统一度量,进行归一化提升模型的精度,收敛速度。运用Z-Score方法,公式为:
P=(P0-μ)/σ (2)
式中,P0=(中径,牙型角,螺距,大径,小径,螺纹升角),P为螺纹参数数据集特征标准化向量,μ为螺纹参数数据集特征均值向量,σ为螺纹参数数据集特征标准差向量。
优选的,步骤S3中,数据质量标准(即:先验知识)的制定步骤包括:使用不同仪器测量同一螺纹10次,得到10个数据,根据贝塞尔公式的到其对应的标准差σ,将其作为不确定度μ,根据不确定度的大小将其分为标注为高质量数据和一般数据;将数据集按照1∶3比例划分为精调数据集和预训练数据集,其中精调数据集全部为高质量数据,提高精调模型训练的时间和精度。
优选的,步骤S4中,所述的模型M的结构如下:一个3层的神经网络,其中输入层包含6个神经元来接受每个样本的6个特征的输入,1层隐含层包含为4个神经元可以充分使模型接收到样本特征,保持样本信息的完整性,增强模型的泛化能力,输出层为1个神经元,最后将神经网络输出连接激活函数;该神经网络为全连接人工神经网络。
模型M的训练采用的是元学习中的MAML(Model Agnostic Meta Learning)算法,来训练人工神经网络的初始化参数。
具体的,步骤S4中,利用预训练数据集作为模型M的输入,对螺纹旋合性特征进行预训练的具体过程如下:
S401、从预训练数据集中抽取螺纹参数样本分成不同任务的预训练判断任务集——螺纹参数训练集A、螺纹训练集B、螺纹训练集C和螺纹训练集D,这些任务集为小样本数据集;数据量大小为50;将每个任务集分为support数据集和query数据集:
S402、这里复制原人工神经网络模型M,采用随机初始化方法初始化模型参数θ0,然后对人工神经网络模型M开始训练,在第一个训练阶段,使用螺纹训练集A;基于模型的参数的初始化θ0计算人工神经网络模型M在任务A的support数据集上的损失函数,然后采用随机梯度下降的方法优化模型M的初始化参数θ0,得到了在任务A上独有的模型参数θA,然后对任务B,采用和任务A一样的训练方法,得到在任务B上独有的模型参数θB;此后对于任务C和任务D等,依次采用上述训练方法,最终得到每一个不同任务上的特有的模型参数θi。参数θi更新公式如下所示:
θi=θ0-αΔi (3)
式中:θ0为螺纹旋合性判断模型初始化参数,Δi(i=A,B,C,D,...,N)为每个任务上的随机梯度,N为任务数量,d为初始学习率。
S403、对于任务A独有的模型参数θA,将任务A中的query数据集作为输入模型参数为θA的模型中,得到相应的损失函数lAA),然后对于其他任务也采用和A任务相同的处理方式,得到相对应的损失函数lii);其中损失函数使用交叉熵损失函数,其中公式如下:
lii)=yilogfθ(Pi)+(1-yi)log(1-fθ(Pi)) (4)
式中:yi表示螺纹样本标签,螺纹旋合性合格为1,不合格为0;fθ(Pi)表示该样本经过人工神经网络模型预测螺纹旋合性合格的概率。
S404、在原人工神经网络模型上进行第二次梯度更新,将这一个批次的每个任务上的得到的损失函数lii)相加得到损失函数和,公式如下所示:
式中:L(θ)为全部N个螺纹旋合性判断任务所得到的损失函数和,lii)为每一个螺纹旋合性判断任务的损失函数。
S405、更新原模型的初始化参数,由上一步得到的这一批次的损失函数和L(θ)对初始化参数进行随机梯度下降进行更新原模型参数,公式如下所示:
式中:θM为螺纹旋合性判断元模型Meta的模型参数,β为元学习率。
其中任务可以是多个,不一定只有四个任务;也可以是多批次循环迭代。
优选的,步骤S5中,将精调数据集输入初始化参数为θM模型Meta去进行微调训练,其中模型Meta不用再随机初始化参数,而是利用训练好的模型初始化参数θM;从精调数据集中抽取若干个任务,将这些任务中的每一个任务分为support和query数据集,利用这些任务的support数据集对Meta模型的初始化参数θM进行微调训练,训练过程与模型预训练过程相同。最终得到螺纹旋合性判断模型Mfine-tune
其中精调模型的过程不需要第二次梯度更新,而是直接利用第一次梯度计算的结果更新模型参数。
优选的,步骤S6中,将精调数据集中抽取出来的任务中的query数据集输入到模型Mfine-tune中,将通过模型得到的预测结果与实际结果对比,得到最后模型的分类效果
与现有技术相比,本发明的有益效果在于:
(1)本发明通过精准的螺纹参数数据集可以得到更精确的螺纹旋合性判断模型,比现有的图像拟合方法更简便且更精准,可以更高效地检验螺纹旋合性的质量问题,进一步保证了螺纹旋合性的质量。
(2)本发明使用MAML方法,属于小样本学习,可以通过少量数据作为小样本数据集,得到准确的模型,提高了螺纹旋合性检测的快速性,高效性,泛化性,可靠性。
(3)本发明无需增加检测成本,并且检测效率高,具有良好的推广应用价值。
附图说明
图1是本发明所述基于元学习螺纹旋合性判断方法的流程图;
图2是本发明所述螺纹旋合性判断模型训练示意图;
图3是本发明所述螺纹参数数据集平衡流程图;
具体实施方式
以下将结合附图对本发明各实施例的技术方案进行清楚、完整的描述,显然,所描述发实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例,都属于本发明所保护的范围。
实施例
本实施例采用国标粗牙螺丝M2.0,M3.0,M4.0,M5.0,M6.0,M7.0,M8.0,M9.0,M10每种螺纹各15个,其中14个螺纹旋合性合格,1个螺纹旋合性不合格,通过在两种螺纹测量仪上测得螺纹参数。
如图1所示,该基于元学习螺纹旋合性判定方法具体包括以下步骤:
S1、采集训练数据集和精调数据集,通过收集不同螺纹参数,如中径,螺距,大径,小径,牙型角,螺纹升角6个特征参数,将这6个螺纹参数特征作为一个样本,按照螺纹参数特征和螺纹规格的不同分为不同的类别,预训练数据集包含10个类别,精调数据集包含5个类别,每个类别包含10个样本;将每一个类别的数据制成一个CSV文件,对初次收集到的数据先按照国标GB/T197-2003螺纹公差,将螺纹旋合性合格的样本标注为1,反之不合格的样本标注为0。
S2、由于已标注数据集属于不平衡数据集,如图3运用C-K-SMOTE算法可以将不平衡的螺纹参数数据集转换成平衡数据集;(1)将不平衡数据集中螺纹旋合性不合格类运用Canopy算法进行粗聚类,得到3个粗糙簇;(2)根据粗糙簇个数来设置K-means算法预设聚类簇数为3并进行再次聚类得到精准簇;(3)基于步骤(2)得到的3个螺纹旋合性不合格的精准簇,运用SMOTE过采样算法,采用修正的随机插值公式即可得到合成的新的螺纹旋合性不合格样本,增加了螺纹参数样本中的不合格少数类的数量,平衡了螺纹参数数据集。其中修正的随机插值公式为:
Pj=Pi+rand(0,1)(ut-Pi)
式中:Pi(i=1,2,...,10)为螺纹旋合性不合格类样本,10为螺纹旋合性不合格类样本总数;ut(t=1,2,...,10)为螺纹旋合性不合格样本精准聚类簇簇心;Pj(j=1,2,...,10)为合成的新的螺纹旋合性不合格样本;rand(0,1)为(0,1)区间的随机数。
对数据集预处理进行归一化,将不同规格的螺纹参数统一度量。对数据集进行归一化,使其可以被机器快速识别计算,运用Z-Score方法,公式为:
P=(P0-μ)/σ
式中:P0=(中径,牙型角,螺距,大径,小径,螺纹升角),P为螺纹参数数据集特征标准化向量,μ为螺纹参数数据集特征均值向量,σ为螺纹参数数据集特征标准差向量。
S3、根据在螺纹测量仪上测量时,将同一螺纹在同一机器上测量10次得到10个数据,根据贝塞尔公式的到其对应的标准差σ,将其作为不确定度μ,根据不确定度的大小将其分为标注为高质量数据和一般数据;将数据集按照1∶3比例划分为精调数据集和预训练数据集,其中精调数据集全部为高质量数据,(即:根据先验知识将数据集划分为精调数据集和预训练数据集),这样可以提高精调模型训练的时间和模型准确度。
S4、首先构建一个正反双向传播的人工神经网络模型M,该模型采用3层的神经网络,其中输入层包含6个神经元来接受每个样本的6个特征的输入,1层隐含层包含为4个神经元,输出层为1个神经元,在输出层后连接一个sigmoid激活函数作为最后的输出;利用预训练数据集作为模型M的输入,对螺纹旋合性特征进行预训练的具体过程如图2:图中,φ是网络模型初始参数,n是meta tran bach size,task-learn训练k次,α是task-learner学习率,β是meta-leamer学习率。
S401、将预训练数据集根据不同的螺纹参数分成不同任务预训练判断任务集——螺纹训练集A、螺纹训练集B、螺纹训练集C、螺纹训练集D等任务集组成一个批次,该批次大小为40;每一个预训练判断任务集分为support数据集和query数据集。
S402、这里复制原人工神经网络模型M,采用随机初始化方法初始化模型参数θ0,然后开始对人工神经网络模型M开始训练,在第一个训练阶段,使用螺纹训练集A;基于模型的参数的初始化θ0计算人工神经网络模型M在螺纹训练集A的support数据集上的损失函数,然后采用随机梯度下降的方法优化模型M的初始化参数θA,得到了在螺纹训练集A上独有的模型参数θA,然后对螺纹训练集B,采用和螺纹训练集A一样的训练方法,得到在螺纹训练集B上独有的模型参数θB;此后对于螺纹训练集C和螺纹训练集D等,依次采用上述训练方法,最终得到每一个不同螺纹训练集上的特有的模型参数θi。参数θi更新公式如下所示:
θi=θ0-αΔi
式中:θ0为螺纹旋合性判断模型初始化参数,Δi(i=丑,B,C,D,...,∈)为每个任务上的随机梯度,N=40为任务数量,初始学习率α为1e-3。
S403、对于螺纹训练集A独有的模型参数θA,将螺纹训练集A中的query数据集作为输入模型参数为θA的模型中,得到相应的损失函数lAA),然后对于其他任务也采用和螺纹训练集A相同的处理方式,得到相对应的损失函数lii);其中损失函数使用交叉熵损失函数,其中公式如下:
lii)=yilogfθ(Pi)+(1-yi)log(1-fθ(Pi))
式中:yi表示螺纹样本标签,螺纹旋合性合格为1,不合格为0;i=0,1,2...40为任务数量,fθ(Pi)表示该样本经过人工神经网络模型预测螺纹旋合性合格的概率。
S404、在原人工神经网络模型上进行第二次梯度更新,将这一个批次的每个预训练判断任务集上的得到的损失函数lii)相加得到损失函数和,公式如下所示:
式中:L(θ)为全部40个螺纹旋合性判断任务所得到的损失函数和,lii)为每一个螺纹旋合性判断任务的损失函数。
S405、更新原模型的初始化参数,由上一步得到的这一批次的损失函数和L(θ)对初始化参数进行随机梯度下降进行更新原模型参数,公式如下所示:
式中:θM为元模型Meta的模型参数,元学习率β为0.001。
其中,S4步骤中的训练过程是一个循环迭代的过程,设置循环10000次作为循环终止的条件,其中每次循环中人工神经网络的初始化参数都是前一次循环得到的元模型Meta模型参数θM
S5、根据上一步得到的元模型Meta,将精调数据集输入初始化参数为θM模型Meta去进行微调训练,其中模型Meta不用再随机初始化参数,而是利用训练好的模型初始化参数;从精调数据集中抽取若干个任务,将这些任务中的每一个任务也分为support和query数据集,利用这些任务的support数据集对Meta模型的初始化参数θM进行微调训练,训练过程与模型预训练过程相同。最终得到螺纹旋合性判断模型Mfine-tune
S6、将精调数据集中抽取出来的任务中的query数据集输入到模型Mfine-tune中,将通过模型得到的预测结果与实际结果对比,得到最后模型的分类准确率。
S7、将需要测量的螺纹参数信息,输入到模型Mfine-tune中,对螺纹旋合性进行判断。
本实施例通过精准的螺纹参数数据集可以得到更精确的螺纹旋合性判断模型,比现有的图像拟合方法更加精准。解决了现有的螺纹旋合性检测方法速度较慢,准确率不高的问题,实现了可以快速高效的螺纹检测方法。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
在本说明书的描述中,参考术语“一个实施方式”、“某些实施方式”、“示意性实施方式”、“示例”、“具体示例”、或“一些示例”等的描述意指结合所述实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本实施例技术方案。

Claims (3)

1.基于元学习的螺纹旋合性判定方法,其特征在于,具体包括以下步骤:
S1、收集多组螺纹参数信息,以每组螺纹参数信息作为原始样本,将多个原始样本制成原始数据集;对原始数据集进行分析,根据螺纹公差判断标准对原始数据集进行标注;将合格的原始样本标注为1,将不合格的原始样本标注为0,得到不平衡螺纹参数数据集;螺纹参数信息包括中径,螺距,大径,小径,牙型角,螺纹升角;
S2、对步骤S1中的不平衡螺纹参数数据集进行平衡化处理,得到检测数据集;对检测数据集中的每个检测样本进行归一化;对检测样本归一化运用的是Z-Score方法;
不平衡螺纹参数数据集的平衡化处理具体步骤包括:
S21:将不平衡数据集中不合格类运用Canopy算法进行粗聚类,得到若干个粗糙簇;
S22:根据步骤S21中的粗糙簇个数来设置K-means算法预设聚类簇数k并进行再次聚类,得到若干个精准簇;
S23:基于步骤S22得到的若干个精准簇,运用SMOTE过采样算法,得到平衡螺纹参数数据集;
S3、将步骤S2中归一化之后的检测数据集按照数据质量标准划分为预训练数据集和精调数据集;
数据质量标准的制定步骤包括:
S31:使用不同仪器测量同一螺纹若干次,得到螺纹参数信息,获取起始数据;
S32:根据贝塞尔公式得到标准差σ,将标准差σ作为不确定度μ,根据不确定度μ的大小将起始数据分别标注为高质量数据和一般数据;
S33:将检测数据集按照预定比例划分为精调数据集和预训练数据集,其中,精调数据集全部为所述高质量数据;
S4、构建正反双向传播的人工神经网络模型M,将步骤S3中的预训练数据集作为模型M的输入,采用MAML元学习算法,进行螺纹旋合性特征预训练,得到预训练好的元模型Meta和初始化参数θM
模型M的结构是:一个多层、全连接的人工神经网络,其中,输入层包括若干个神经元,用于接收样本特征的输入;隐含层包含若干个神经元,用于保持样本信息的完整性;输出层用于连接激活函数;
预训练过程包括:
S401、将预训练数据集划分N个预训练判断任务集,将每个预训练判断任务集分为support数据集和query数据集:
S402、复制人工神经网络模型M,采用随机初始化方法得到初始模型参数θ0,对人工神经网络模型M开始训练,在第一个训练阶段,使用每个预训练判断任务集,基于初始模型参数θ0,计算人工神经网络模型M在每个预训练判断任务集的support数据集上的损失函数,采用随机梯度下降的方法优化模型M的初始模型参数θ0,得到在预训练判断任务集i上的特有模型参数θi;参数θi更新公式如下所示:
θi=θ0-αΔi
式中:θ0为螺纹旋合性判断模型初始模型参数,Δi为预训练判断任务集i的随机梯度,N为预训练判断任务集的数量,α为初始学习率;
S403、对于预训练判断任务集i的特有模型参数θi,将预训练判断任务集i的query数据集作为输入模型参数为θi的元模型中,得到预训练判断任务集i的损失函数lii),其中损失函数使用交叉熵损失函数,公式如下:
lii)=yilog fθ(Pi)+(1-yi)log(1-fθ(Pi))
式中:yi表示螺旋样本标签,合格为1,不合格为0;fθ(Pi)表示样本经过人工神经网络模型预测螺纹旋合性合格的概率;
S404、在原人工神经网络模型上进行第二次梯度更新,将N个预训练判断任务集的损失函数lii)相加,得到损失函数和,公式如下:
式中:L(θ)为全部N个预训练判断任务集的损失函数和,lii)为每一个预训练判断任务集损失函数;
S405、由S404得到的损失函数和L(θ)对初始模型参数θ0进行随机梯度下降,得到元模型Meta的初始化参数θM;公式如下:
式中:θM为螺纹旋合性判断元模型Meta的初始化参数,β为元学习率;
其中,S4步骤中的预训练过程是一个循环迭代的过程;人工神经网络的初始模型参数均是前一次循环得到的元模型Meta的初始化参数θM;达到预设的迭代次数后,终止循环;
S5、将步骤S3中的精调数据集输入步骤S4中初始化参数为θM的元模型Meta中,进行螺纹旋合性特征微调训练,得到螺纹旋合性判断模型Mfine-tune
2.根据权利要求1所述的基于元学习的螺纹旋合性判定方法,其特征在于,步骤S5中微调训练具体包括以下步骤:从精调数据集中抽取若干个任务,将抽取的每一个任务分为精调support数据集和精调query数据集,利用精调support数据集对Meta模型的初始化参数θM进行步骤S4的预训练过程。
3.根据权利要求2所述的基于元学习的螺纹旋合性判定方法,其特征在于,将精调query数据集输入到模型Mfine-tune中,将通过模型得到的预测结果与实际结果对比,得到最后模型的分类效果。
CN202110847674.5A 2021-07-26 2021-07-26 基于元学习的螺纹旋合性判定方法 Active CN113724197B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110847674.5A CN113724197B (zh) 2021-07-26 2021-07-26 基于元学习的螺纹旋合性判定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110847674.5A CN113724197B (zh) 2021-07-26 2021-07-26 基于元学习的螺纹旋合性判定方法

Publications (2)

Publication Number Publication Date
CN113724197A CN113724197A (zh) 2021-11-30
CN113724197B true CN113724197B (zh) 2023-09-15

Family

ID=78674052

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110847674.5A Active CN113724197B (zh) 2021-07-26 2021-07-26 基于元学习的螺纹旋合性判定方法

Country Status (1)

Country Link
CN (1) CN113724197B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114461629A (zh) * 2022-02-10 2022-05-10 电子科技大学 一种航空发动机温度标定方法、装置和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110728656A (zh) * 2019-09-06 2020-01-24 西安电子科技大学 基于元学习的无参考图像质量数据处理方法、智能终端
CN111127429A (zh) * 2019-12-24 2020-05-08 魏志康 基于自训练深度神经网络的水利***管螺纹缺陷检测方法
CN112580521A (zh) * 2020-12-22 2021-03-30 浙江工业大学 一种基于maml元学习算法的多特征真假视频检测方法
CN112613556A (zh) * 2020-09-01 2021-04-06 电子科技大学 基于元学习的少样本图像情感分类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110163234B (zh) * 2018-10-10 2023-04-18 腾讯科技(深圳)有限公司 一种模型训练方法、装置和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110728656A (zh) * 2019-09-06 2020-01-24 西安电子科技大学 基于元学习的无参考图像质量数据处理方法、智能终端
CN111127429A (zh) * 2019-12-24 2020-05-08 魏志康 基于自训练深度神经网络的水利***管螺纹缺陷检测方法
CN112613556A (zh) * 2020-09-01 2021-04-06 电子科技大学 基于元学习的少样本图像情感分类方法
CN112580521A (zh) * 2020-12-22 2021-03-30 浙江工业大学 一种基于maml元学习算法的多特征真假视频检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向无人机小样本目标识别的元学习方法研究;李宏男;吴立珍;牛轶峰;王菖;;无人***技术(第06期);全文 *

Also Published As

Publication number Publication date
CN113724197A (zh) 2021-11-30

Similar Documents

Publication Publication Date Title
CN111914644B (zh) 一种基于双模态协同的弱监督时序动作定位方法及***
Liu et al. Large margin metric learning for multi-label prediction
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN112465040B (zh) 一种基于类不平衡学习算法的软件缺陷预测方法
CN109993225B (zh) 一种基于无监督学习的空域复杂度分类方法及装置
CN112289391B (zh) 一种基于机器学习的阳极铝箔性能预测***
CN112924177A (zh) 一种改进深度q网络的滚动轴承故障诊断方法
CN111768000A (zh) 在线自适应微调深度学习的工业过程数据建模方法
US11709858B2 (en) Mapping of unlabeled data onto a target schema via semantic type detection
CN113724197B (zh) 基于元学习的螺纹旋合性判定方法
CN110533063A (zh) 一种基于卫星影像和gmdh神经网络的云量计算方法及装置
CN113255573A (zh) 基于混合簇中心标签学习的行人重识别方法和存储介质
CN109993208A (zh) 一种有噪声图像的聚类处理方法
CN113176998A (zh) 基于源选择的跨项目软件缺陷预测方法
CN116227716A (zh) 一种基于Stacking的多因素能源需求预测方法及***
CN110717602A (zh) 一种基于噪音数据的机器学习模型鲁棒性评估方法
CN111178427A (zh) 一种基于Sliced-Wasserstein距离的深度自编码嵌入聚类的方法
Hong et al. Gated Multi-Head Attention Pooling for Weakly Labelled Audio Tagging.
Wang et al. Production quality prediction of cross-specification products using dynamic deep transfer learning network
CN117392450A (zh) 一种基于进化多尺度特征学习的钢铁材料质量解析方法
CN111950652A (zh) 一种基于相似度的半监督学习数据分类算法
Chang et al. Similarity metric-based metalearning network combining prior metatraining strategy for intelligent fault detection under small samples prerequisite
CN117078960A (zh) 一种基于图像特征提取的近红外光谱分析方法及***
Liu et al. MRD-NETS: multi-scale residual networks with dilated convolutions for classification and clustering analysis of spacecraft electrical signal
Wan et al. Software Defect Prediction Using Dictionary Learning.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant