CN116307195A - 一种基于深度学习的带钢精轧宽展预测方法和*** - Google Patents

一种基于深度学习的带钢精轧宽展预测方法和*** Download PDF

Info

Publication number
CN116307195A
CN116307195A CN202310285159.1A CN202310285159A CN116307195A CN 116307195 A CN116307195 A CN 116307195A CN 202310285159 A CN202310285159 A CN 202310285159A CN 116307195 A CN116307195 A CN 116307195A
Authority
CN
China
Prior art keywords
data
prediction
rolling
neural network
strip steel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310285159.1A
Other languages
English (en)
Inventor
仲兆准
张峥
李阳
辛雨
管淼
吕凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN202310285159.1A priority Critical patent/CN116307195A/zh
Publication of CN116307195A publication Critical patent/CN116307195A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B21MECHANICAL METAL-WORKING WITHOUT ESSENTIALLY REMOVING MATERIAL; PUNCHING METAL
    • B21BROLLING OF METAL
    • B21B1/00Metal-rolling methods or mills for making semi-finished products of solid or profiled cross-section; Sequence of operations in milling trains; Layout of rolling-mill plant, e.g. grouping of stands; Succession of passes or of sectional pass alternations
    • B21B1/22Metal-rolling methods or mills for making semi-finished products of solid or profiled cross-section; Sequence of operations in milling trains; Layout of rolling-mill plant, e.g. grouping of stands; Succession of passes or of sectional pass alternations for rolling plates, strips, bands or sheets of indefinite length
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B21MECHANICAL METAL-WORKING WITHOUT ESSENTIALLY REMOVING MATERIAL; PUNCHING METAL
    • B21BROLLING OF METAL
    • B21B1/00Metal-rolling methods or mills for making semi-finished products of solid or profiled cross-section; Sequence of operations in milling trains; Layout of rolling-mill plant, e.g. grouping of stands; Succession of passes or of sectional pass alternations
    • B21B1/22Metal-rolling methods or mills for making semi-finished products of solid or profiled cross-section; Sequence of operations in milling trains; Layout of rolling-mill plant, e.g. grouping of stands; Succession of passes or of sectional pass alternations for rolling plates, strips, bands or sheets of indefinite length
    • B21B2001/225Metal-rolling methods or mills for making semi-finished products of solid or profiled cross-section; Sequence of operations in milling trains; Layout of rolling-mill plant, e.g. grouping of stands; Succession of passes or of sectional pass alternations for rolling plates, strips, bands or sheets of indefinite length by hot-rolling
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Manufacturing & Machinery (AREA)
  • Operations Research (AREA)
  • Mechanical Engineering (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于深度学习的带钢精轧宽展预测方法和***。该方法首先将数值型数据转化为图像数据,然后通过卷积神经网络来提取图像特征,实现强特征提取,并有效地降低带钢精轧过程中巨量的数据维度,同时加入批归一化层,加速了网络模型的收敛,避免了过拟合现象的出现。最后通过构建的深度神经网络模型进行预测,通过该种方法实现了将一维的数值数据转变为了二维的图像数据,而二维的图像数据中的信息更加丰富,能够获得的有效信息更多。本发明提出的新方法可以提高模型的收敛速度,避免了前期冗杂的数据预处理过程,提升了模型的泛化能力和预测精度,对热轧带钢的宽展预测具有十分重要的意义。

Description

一种基于深度学习的带钢精轧宽展预测方法和***
技术领域
本发明涉及轧钢自动控制技术领域,尤其涉及一种基于深度学习的带钢精轧宽展预测方法和***。
背景技术
长期以来,我国的钢铁产能和产量都处于世界领先位置,但随着国内粗钢产能过剩以及人们对钢材更高的要求,竞争激烈的钢铁企业开始关注高品质、高质量的钢铁产品。热轧带钢由于不仅可以作为热轧钢板直接应用,也能作为冷轧钢的胚料,具有较为广泛的应用而受到了较多关注,如汽车制造、电机、船舶、化工等行业领域。伴随着近几年来我国的热轧轧机设备的技术水平取到了巨大的进步,发展高质量、高精度的热轧带钢成为了热门的话题。
在带钢精轧的过程中,板带的宽度精度是衡量热轧带钢产品的一种重要质量指标,提高板带的宽度精度不仅能提升胚料的成材率,也能为后续的加工提供有利的条件。随着钢铁行业对轧制工艺的不断改进,带钢连轧工艺增加了中间胚的厚度并且提高了精轧温度,这就导致了精轧区的压下量变大,材料在精轧过程中的宽度变化成为了不可忽视的部分,同时又由于板料进行精轧区时的厚度小,难以实施有效的宽度控制,因此精确的设定粗轧区的目标宽度,才能有效控制精轧的出口宽度。通常,粗轧区的宽度设定需要考虑到精轧机出口目标宽度和精轧过程中宽度变化量的总和。精轧区的宽度精度对总体的宽度精度控制影响较大,为了满足最终产品的精度要求,对精轧区的宽展进行预测有着至关重要的作用。
传统的热轧带钢的宽展预测主要采用经验公式模型、浅层神经网络建模等方法。在实际工业生产中,通常采用经验公式对精轧过程中的宽展进行预测,但由于经验公式模型中大多描述的都是理想状态,并且材料的特性在实际生产中是在不断变化的,加上材料的检测仪器存在着一定的误差,就这造成了经验公式模型存在着计算精度较差、计算速度慢、效率低、不能够满足实际生产中的各类复杂情况等问题。
神经网络可以构建非线性关系模型并具有自适应、自学习的能力,并且考虑到精轧过程中影响带钢自由宽展的因素众多,如各个机架的轧制温度和轧制过程参数、钢材种类、轧辊尺寸以及表面状态等,且各个因素之间关系复杂。神经网络在带钢热连轧精轧过程宽展预测中逐步展现出优势,但浅层神经网络在进行预测的过程中容易出现过拟合、学习效率低、学习速度慢等问题,且在面对维度和数量巨大的样本数据时,浅层神经网络往往计算时间过长,预测不准确等情况,甚至可能会出现梯度***问题。结合深度神经网络(DeepNeural Networks,DNN)模型不仅可以处理复杂的非线性问题,实现强特征的提取,同时与浅层网络相比,模型的泛化能力更好,学习效率和速度也更高。因此,基于深度神经网络的带钢自由宽展预测,具有更好地应用前景。
发明内容
有鉴于此,本发明的目的在于提出一种基于深度学习的带钢精轧宽展预测方法和***,本发明能够针对性的解决现有的问题。
本发明的关键在于提出了一种新的宽展预测模型结构,提出用CNN对宽展生产数值数据转换后的图像数据进行特征提取。其中CNN实现特征的强提取与降维,有效减少了前期复杂的数据处理工作,同时数据特征提取能力大大提高;BN层的引入避免了过拟合等问题的出现,提升了模型的收敛速度;DNN提升了模型的深度,提高了预测精度,预测结果准确性大大提高。
基于上述目的,本发明提出了一种基于深度学习的带钢精轧宽展预测方法,包括:
步骤一:通过热连轧数据采集***对热连轧精轧生产机组在轧制过程中的轧制参数进行实时采集;
步骤二:对样本数据进行清洗,处理异常值、缺失值和重复值;
步骤三:通过独热编码对所述样本数据中的类别特征变量进行编码处理,得到矩阵元素为0或1的矩阵;
步骤四:对所述步骤三处理后的样本数据进行标准化处理,使得各数据数量级一致;
步骤五:根据所述轧制参数的影响因子数目,确定图像尺寸大小,即图像的长和宽;
步骤六:将所述轧制参数的影响因子按从左至右、从上而下的顺序依次填入图像的每一个像素点,直至所有的像素点被填满为止将所述样本数据由一维数值型数据转换为二维图像型数据;
步骤七:将步骤六处理后的二维图像型数据划分为训练集和预测集;
步骤八:将所述训练集输入至卷积神经网络,利用不同的卷积核所代表的不同特征规则实现特征的提取;在卷积层和池化层之间设置批量归一化层,经过池化层的池化生成新的融合特征样本;
步骤九:将所述融合特征样本输入至预先构建的深度神经网络模型,并依据预测结果进行优化,确定深度神经网络模型的结构;
步骤十:将优化后的深度神经网络模型作为最终的预测模型,将所述预测集输入至所述预测模型中,得出预测结果。
进一步地,所述轧制参数至少包括:带钢宽度、厚度、轧辊状态、和轧制各时间段的温度。
进一步地,所述重复值采用删除/合并的方法保留其中一种变量,缺失值采用平均数填充,异常值选用拉伊达准则进行筛选,将超出三倍标准差的数据视为异常,直接删除。
进一步地,所述图像的长和宽的乘积远大于所述影响因子数目。
进一步地,所述二维图像型数据以灰度图像的形式存储。
进一步地,所述步骤二包括:
利用公式(1)所述的拉伊达准则作为筛选标准,将符合该筛选标准的数据判定为异常数据并剔除:
|xi-μ|>3σ (1)
式中:xi表示样本数据中任意一个变量的数值;i=1,2,3,…;μ为xi的均值;σ为xi的标准差。
进一步地,所述步骤四包括:
利用公式(2)所述的标准差标准化法消除各变量数据单位量纲的差异:
Figure BDA0004139522320000031
式中:xi表示样本数据中任意一个变量的数值;i=1,2,3,…;μ为xi的均值;σ为xi的标准差;X′为xi标准化后的样本。
基于上述目的,本发明还提出了一种基于深度学习的带钢精轧宽展预测***,包括:
数据采集模块,通过热连轧数据采集***对热连轧精轧生产机组在轧制过程中的轧制参数进行实时采集;
数据清洗模块,对样本数据进行清洗,处理异常值、缺失值和重复值;
独热编码模块,通过独热编码对所述样本数据中的类别特征变量进行编码处理,得到矩阵元素为0或1的矩阵;
标准化模块,对所述步骤三处理后的样本数据进行标准化处理,使得各数据数量级一致;
尺寸确定模块,根据所述轧制参数的影响因子数目,确定图像尺寸大小,即图像的长和宽;
图像转换模块,将所述轧制参数的影响因子按从左至右、从上而下的顺序依次填入图像的每一个像素点,直至所有的像素点被填满为止将所述样本数据由一维数值型数据转换为二维图像型数据;
数据划分模块,将步骤六处理后的二维图像型数据划分为训练集和预测集;
特征提取模块,将所述训练集输入至卷积神经网络,利用不同的卷积核所代表的不同特征规则实现特征的提取;在卷积层和池化层之间设置批量归一化层,经过池化层的池化生成新的融合特征样本;
参数优化模块,将所述融合特征样本输入至预先构建的深度神经网络模型,并依据预测结果进行优化,确定深度神经网络模型的结构;
预测结果模块,将优化后的深度神经网络模型作为最终的预测模型,将所述预测集输入至所述预测模型中,得出预测结果。
总的来说,本发明的优势及给用户带来的体验在于:
本发明首先将数值型数据转化为图像数据,然后通过卷积神经网络来提取图像特征,实现强特征提取,并有效地降低带钢精轧过程中巨量的数据维度,最后通过构建的深度神经网络模型进行预测,通过该种方法实现了将一维的数值数据转变为了二维的图像数据,而二维的图像数据中的信息更加丰富,能够获得的有效信息更多。本发明提出的新方法可以提高模型的收敛速度,避免了前期冗杂的数据预处理过程,提升了数据的有效性和可靠性,提升了模型的泛化能力和预测精度,对热轧带钢的宽展预测具有十分重要的意义。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1为模型预测流程图。
图2为精轧过程及其宽度反馈控制示意图。
图3为轧制变形过程示意图。
图4为数值型数据向二维图像数据转化过程示意图。
图5为卷积神经网络特征提取与深度神经网络预测模型结构图。
图6为CNN图像特征提取与DNN预测输出过程示意图。
图7为实施例和对比例与真实值变化趋势对比示意图。
图8为实施例和对比例的最终预测误差分布示意图。
图9示出根据本发明实施例的基于深度学习的带钢精轧宽展预测***的构成图。
图10示出了本发明一实施例所提供的一种电子设备的结构示意图。
图11示出了本发明一实施例所提供的一种存储介质的示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了进一步提高热轧带钢的宽度精度,本发明提出了一种新的宽展预测方法,该方法首先将数值型数据转化为图像数据,然后通过卷积神经网络(Convolutional NeuralNetwork,CNN)来提取图像特征,实现强特征提取,并有效地降低带钢精轧过程中巨量的数据维度,同时加入批归一化层(Batch Normalization,BN),加速了网络模型的收敛,避免了过拟合现象的出现。最后通过构建的深度神经网络模型进行预测,通过该种方法实现了将一维的数值数据转变为了二维的图像数据,而二维的图像数据中的信息更加丰富,能够获得的有效信息更多。本发明提出的新方法可以提高模型的收敛速度,避免了前期冗杂的数据预处理过程,提升了模型的泛化能力和预测精度,对热轧带钢的宽展预测具有十分重要的意义。
如图1所示,一种基于深度学习的带钢精轧宽展预测方法,包括如下步骤:
步骤一:通过热连轧数据采集***对现场轧制过程中的带钢宽度、厚度、轧辊状态、轧制各时间段的温度等各种轧制参数进行实时采集并返回至采集***。
本发明所使用的数据均采自热连轧精轧生产机组,精轧过程及其宽度反馈控制示意图如图2所示。精轧机组包括七个机架,依靠轧辊旋转过程中与轧件之间形成摩擦,使轧件进入辊缝中,同时受到压缩而发生塑性变形,变形实现过程如图3所示,阴影部分表示变形区,相关参数见表1。热连轧精轧机组轧制过程中,需要测量的关键参数包括:精轧各阶段的带钢温度、宽度、厚度,轧制速度以及部分轧制工艺参数等。在实际生产过程中测得除宽展值外的变量如表2所示。
表1变形区符号与物理意义对照表
Figure BDA0004139522320000051
Figure BDA0004139522320000061
表2采集的变量数据类型
Figure BDA0004139522320000062
步骤二:在数据采集过程中,受到人为、温度、设备磨损情况等诸多影响因素,***接收的数据可靠性降低。为了确保样本数据的合理性,需对样本数据进行清洗,处理异常值、缺失值和重复值,重复值采用删除/合并的方法保留其中一种变量,缺失值采用平均数填充,连续数据中的异常值选用拉伊达准则进行筛选,将超出三倍标准差的数据视为异常,可以直接删除。
步骤三:在热连轧实际生产数据中,存在一些类别特征变量,该类变量无法直接输入到预测模型中。通过独热编码对样本数据中的类别特征进行编码处理,得到矩阵元素都为0和1的矩阵,此时可将该部分数据视为连续。
步骤四:获得的不同特征的影响因子由于数量级、量纲单位不同,会影响到模型的精度,因此需要将该部分变量进行标准化处理,以保证各数据数量级一致。
步骤五:为了获取更多的有效信息,需要将一维数值型数据转换为二维的图像数据,在转换为图像之前,要确定好图像的尺寸大小。根据步骤一中获得的影响因子数目,确定图像尺寸大小,即图像的长和宽,需保证图像的长和宽的乘积远远大于影响因子数;
步骤六:将步骤五中筛选后的影响因子按从左至右、从上而下的顺序依次填入图像的每一个像素点,并以同样的方式重复填充,直至所有的像素点被填满为止,即可实现一维数值型数据向二维图像型数据的转换,转换后数据以灰度图像的形式存储,实现过程如图4示意;
步骤七:将步骤六处理后的数据划分为训练集和预测集,其中85%作为训练,其余的15%用作预测。
步骤八:将步骤七中转换后的图像训练数据输入至卷积神经网络,利用不同的卷积核所代表的不同特征规则实现特征的提取。在卷积层和池化层之间增加批量归一化层,利用小批量的均值和方差调整在网络中间的输出,从而使数据更加稳定。经过池化层的池化使数据维度得到降低,生成新的融合特征样本;
步骤九:将步骤八中获得的融合特征样本输入至预先构建的深度神经网络模型,并依据预测结果进行优化,最终确定如图5所示的模型结构。此处预先构建的深度神经网络模型采用了LSTM模型,当然也可以采用其他类型的深度神经网络模型。
步骤十:将步骤九中确立的模型结构,用作最终的预测模型,将预测数据输入至模型中,最终得出预测结果,整个模型预测过程如图6所示。
所述步骤二包括:
利用公式(1)所述的拉伊达准则作为筛选标准,将符合该筛选标准的数据判定为异常数据并剔除:
|xi-μ|>3σ (1)
式中:xi表示样本数据中任意一个变量的数值;i=1,2,3,…;μ为xi的均值;σ为xi的标准差。
所述步骤四包括:
利用公式(2)所述的标准差标准化法消除各变量数据单位量纲的差异:
Figure BDA0004139522320000071
式中:xi表示样本数据中任意一个变量的数值;i=1,2,3,…;μ为xi的均值;σ为xi的标准差;X′为xi标准化后的样本。
实施例1:
一种基于卷积神经网络与深度神经网络的带钢精轧宽展预测方法,具体包括以下步骤:
数据清洗,剔除原始样本中的异常值、缺失值和重复值,得到维度为4494×29的样本;
将清洗后数据中的3个类别特征进行独热编码,得到维度为4494×26的0-1矩阵,并将其与26个连续特征进行合并,得到新的模型输入矩阵;
将矩阵输入所构建的CNN+DNN模型中,设定学习率为0.01,最小批次规模为24。随机选取85%的数据作为训练集,剩余的15%作为测试集,最终输出该模型的宽展预测结果。
实施例2:
一种基于卷积神经网络与深度神经网络的带钢精轧宽展预测方法,具体包括以下步骤:
数据清洗,剔除原始样本中的异常值、缺失值和重复值,得到维度为4494×29的样本;
将清洗后数据中的3个类别特征进行独热编码,得到维度为4494×26的0-1矩阵,并将其与26个连续特征进行合并,得到新的模型输入矩阵;
将矩阵输入所构建的CNN+DNN模型中,设定学习率为0.01,最小批次规模为8。随机选取85%的数据作为训练集,剩余的15%作为测试集,最终输出该模型的宽展预测结果。
实施例3:
一种基于卷积神经网络与深度神经网络的带钢精轧宽展预测方法,具体包括以下步骤:
数据清洗,剔除原始样本中的异常值、缺失值和重复值,得到维度为4494×29的样本;
将清洗后数据中的3个类别特征进行独热编码,得到维度为4494×26的0-1矩阵,并将其与26个连续特征进行合并,得到新的模型输入矩阵;
将矩阵输入所构建的CNN+DNN模型中,设定学习率为0.001,最小批次规模为24。随机选取85%的数据作为训练集,剩余的15%作为测试集,最终输出该模型的宽展预测结果。
实施例4:
一种基于卷积神经网络与深度神经网络的带钢精轧宽展预测方法,具体包括以下步骤:
数据清洗,剔除原始样本中的异常值、缺失值和重复值,得到维度为4494×29的样本;
将清洗后数据中的3个类别特征进行独热编码,得到维度为4494×26的0-1矩阵,并将其与26个连续特征进行合并,得到新的模型输入矩阵;
将矩阵输入所构建的CNN+DNN模型中,设定学习率为0.001,最小批次规模为8。随机选取85%的数据作为训练集,剩余的15%作为测试集,最终输出该模型的宽展预测结果。
实施例5:
一种基于卷积神经网络与深度神经网络的带钢精轧宽展预测方法,具体包括以下步骤:
数据清洗,剔除原始样本中的异常值、缺失值和重复值,得到维度为4494×29的样本;
将清洗后数据中的3个类别特征进行独热编码,得到维度为4494×26的0-1矩阵,并将其与26个连续特征进行合并,得到新的模型输入矩阵;
将矩阵输入所构建的CNN+DNN模型中,设定学习率为0.001,最小批次规模为10。随机选取85%的数据作为训练集,剩余的15%作为测试集,最终输出该模型的宽展预测结果。
对比例1:
运用经验公式模型进行宽展预测,具体包括以下步骤:
数据清洗,剔除原始样本中的异常值、缺失值和重复值,得到维度为4494×29的样本;
将清洗后数据中的3个类别特征进行独热编码,得到维度为4494×26的0-1矩阵,并将其与26个连续特征进行合并;
对合并后的样本进行皮尔逊相关性分析,设定相关系数阈值为0.3,即提取中强相关性的变量,得到维度为4494×10的矩阵;
将矩阵输入经验公式模型中,随机选取85%的数据作为训练集,剩余的15%作为测试集,最终输出该模型的宽展预测结果。
对比例2:
运用BP神经网络进行宽展预测,具体包括以下步骤:
数据清洗,剔除原始样本中的异常值、缺失值和重复值,得到维度为4494×29的样本;
将清洗后数据中的3个类别特征进行独热编码,得到维度为4494×26的0-1矩阵,并将其与26个连续特征进行合并;
对合并后的样本进行皮尔逊相关性分析,设定相关系数阈值为0.3,即提取中强相关性的变量,得到维度为4494×10的矩阵;
将矩阵输入所构建的BP神经网络模型中,随机选取85%的数据作为训练集,剩余的15%作为测试集,最终输出该模型的宽展预测结果。
图7为实施例和对比例与真实值变化趋势对比示意图。其中,(a)经验公式与真实值变化趋势对比;(b)BP神经网络与真实值变化趋势对比;(c)实施例1与真实值变化趋势对比;(d)实施例2与真实值变化趋势对比;(e)实施例3与真实值变化趋势对比;(f)实施例4与真实值变化趋势对比;(g)实施例5与真实值变化趋势对比。图8为实施例和对比例的最终预测误差分布示意图。(a)经验公式预测误差分布;(b)BP神经网络预测误差分布;(c)实施例1预测误差分布;(d)实施例2预测误差分布;(e)实施例3预测误差分布;(f)实施例4预测误差分布;(g)实施例5预测误差分布。
根据预测结果分析,在保证前期数据处理方法一致的基础上,经验公式预测下的宽度误差较大,BP神经网络预测下的宽度误差较之有所提升,而CNN+DNN模型的预测性能和预测精度均优于前两者;而当设定CNN+DNN模型的学习率和最小批次规模分别为0.001和10时,即实施例5对应网络的预测结果达到最佳。对比下的各项性能指标如表3所示。
表3
Figure BDA0004139522320000101
申请实施例提供了一种基于深度学习的带钢精轧宽展预测***,该***用于执行上述实施例所述的基于深度学习的带钢精轧宽展预测方法,如图9所示,该***包括:
数据采集模块,通过热连轧数据采集***对热连轧精轧生产机组在轧制过程中的轧制参数进行实时采集;
数据清洗模块,对样本数据进行清洗,处理异常值、缺失值和重复值;
独热编码模块,通过独热编码对所述样本数据中的类别特征变量进行编码处理,得到矩阵元素为0或1的矩阵;
标准化模块,对所述步骤三处理后的样本数据进行标准化处理,使得各数据数量级一致;
尺寸确定模块,根据所述轧制参数的影响因子数目,确定图像尺寸大小,即图像的长和宽;
图像转换模块,将所述轧制参数的影响因子按从左至右、从上而下的顺序依次填入图像的每一个像素点,直至所有的像素点被填满为止将所述样本数据由一维数值型数据转换为二维图像型数据;
数据划分模块,将步骤六处理后的二维图像型数据划分为训练集和预测集;
特征提取模块,将所述训练集输入至卷积神经网络,利用不同的卷积核所代表的不同特征规则实现特征的提取;在卷积层和池化层之间设置批量归一化层,经过池化层的池化生成新的融合特征样本;
参数优化模块,将所述融合特征样本输入至预先构建的深度神经网络模型,并依据预测结果进行优化,确定深度神经网络模型的结构;
预测结果模块,将优化后的深度神经网络模型作为最终的预测模型,将所述预测集输入至所述预测模型中,得出预测结果。
本发明的上述实施例提供的基于深度学习的带钢精轧宽展预测***与本发明实施例提供的基于深度学习的带钢精轧宽展预测方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。
本发明实施方式还提供一种与前述实施方式所提供的基于深度学习的带钢精轧宽展预测方法对应的电子设备,以执行上基于深度学习的带钢精轧宽展预测方法。本发明实施例不做限定。
请参考图10,其示出了本发明的一些实施方式所提供的一种电子设备的示意图。如图10所示,所述电子设备20包括:处理器200,存储器201,总线202和通信接口203,所述处理器200、通信接口203和存储器201通过总线202连接;所述存储器201中存储有可在所述处理器200上运行的计算机程序,所述处理器200运行所述计算机程序时执行本发明前述任一实施方式所提供的基于深度学习的带钢精轧宽展预测方法。
其中,存储器201可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口203(可以是有线或者无线)实现该***网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。
总线202可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。其中,存储器201用于存储程序,所述处理器200在接收到执行指令后,执行所述程序,前述本发明实施例任一实施方式揭示的所述基于深度学习的带钢精轧宽展预测方法可以应用于处理器200中,或者由处理器200实现。
处理器200可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器200中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器200可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器201,处理器200读取存储器201中的信息,结合其硬件完成上述方法的步骤。
本发明实施例提供的电子设备与本发明实施例提供的基于深度学习的带钢精轧宽展预测方法出于相同的发明构思,具有与其采用、运行或实现的方法相同的有益效果。
本发明实施方式还提供一种与前述实施方式所提供的基于深度学习的带钢精轧宽展预测方法对应的计算机可读存储介质,请参考图11,其示出的计算机可读存储介质为光盘30,其上存储有计算机程序(即程序产品),所述计算机程序在被处理器运行时,会执行前述任意实施方式所提供的基于深度学习的带钢精轧宽展预测方法。
需要说明的是,所述计算机可读存储介质的例子还可以包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
本发明的上述实施例提供的计算机可读存储介质与本发明实施例提供的基于深度学习的带钢精轧宽展预测方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟***或者其它设备有固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述,构造这类***所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的虚拟机的创建***中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者***程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干***的单元权利要求中,这些***中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种基于深度学习的带钢精轧宽展预测方法,其特征在于,包括:
步骤一:通过热连轧数据采集***对热连轧精轧生产机组在轧制过程中的轧制参数进行实时采集;
步骤二:对样本数据进行清洗,处理异常值、缺失值和重复值;
步骤三:通过独热编码对所述样本数据中的类别特征变量进行编码处理,得到矩阵元素为0或1的矩阵;
步骤四:对所述步骤三处理后的样本数据进行标准化处理,使得各数据数量级一致;
步骤五:根据所述轧制参数的影响因子数目,确定图像尺寸大小,即图像的长和宽;
步骤六:将所述轧制参数的影响因子按从左至右、从上而下的顺序依次填入图像的每一个像素点,直至所有的像素点被填满为止将所述样本数据由一维数值型数据转换为二维图像型数据;
步骤七:将步骤六处理后的二维图像型数据划分为训练集和预测集;
步骤八:将所述训练集输入至卷积神经网络,利用不同的卷积核所代表的不同特征规则实现特征的提取;在卷积层和池化层之间设置批量归一化层,经过池化层的池化生成新的融合特征样本;
步骤九:将所述融合特征样本输入至预先构建的深度神经网络模型,并依据预测结果进行优化,确定深度神经网络模型的结构;
步骤十:将优化后的深度神经网络模型作为最终的预测模型,将所述预测集输入至所述预测模型中,得出预测结果。
2.根据权利要求1所述的方法,其特征在于,
所述轧制参数至少包括:带钢宽度、厚度、轧辊状态、和轧制各时间段的温度。
3.根据权利要求1所述的方法,其特征在于,
所述重复值采用删除/合并的方法保留其中一种变量,缺失值采用平均数填充,异常值选用拉伊达准则进行筛选,将超出三倍标准差的数据视为异常,直接删除。
4.根据权利要求1所述的方法,其特征在于,
所述图像的长和宽的乘积远大于所述影响因子数目。
5.根据权利要求1所述的方法,其特征在于,
所述二维图像型数据以灰度图像的形式存储。
6.根据权利要求3所述的方法,其特征在于,
所述步骤二包括:
利用公式(1)所述的拉伊达准则作为筛选标准,将符合该筛选标准的数据判定为异常数据并剔除:
|xi-μ|>3σ (1)
式中:xi表示样本数据中任意一个变量的数值;i=1,2,3,…;μ为xi的均值;σ为xi的标准差。
7.根据权利要求1所述的方法,其特征在于,
所述步骤四包括:
利用公式(2)所述的标准差标准化法消除各变量数据单位量纲的差异:
Figure FDA0004139522310000021
式中:xi表示样本数据中任意一个变量的数值;i=1,2,3,…;μ为xi的均值;σ为xi的标准差;X′为xi标准化后的样本。
8.一种基于深度学习的带钢精轧宽展预测***,其特征在于,包括:
数据采集模块,通过热连轧数据采集***对热连轧精轧生产机组在轧制过程中的轧制参数进行实时采集;
数据清洗模块,对样本数据进行清洗,处理异常值、缺失值和重复值;
独热编码模块,通过独热编码对所述样本数据中的类别特征变量进行编码处理,得到矩阵元素为0或1的矩阵;
标准化模块,对所述步骤三处理后的样本数据进行标准化处理,使得各数据数量级一致;
尺寸确定模块,根据所述轧制参数的影响因子数目,确定图像尺寸大小,即图像的长和宽;
图像转换模块,将所述轧制参数的影响因子按从左至右、从上而下的顺序依次填入图像的每一个像素点,直至所有的像素点被填满为止将所述样本数据由一维数值型数据转换为二维图像型数据;
数据划分模块,将步骤六处理后的二维图像型数据划分为训练集和预测集;
特征提取模块,将所述训练集输入至卷积神经网络,利用不同的卷积核所代表的不同特征规则实现特征的提取;在卷积层和池化层之间设置批量归一化层,经过池化层的池化生成新的融合特征样本;
参数优化模块,将所述融合特征样本输入至预先构建的深度神经网络模型,并依据预测结果进行优化,确定深度神经网络模型的结构;
预测结果模块,将优化后的深度神经网络模型作为最终的预测模型,将所述预测集输入至所述预测模型中,得出预测结果。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器运行所述计算机程序以实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行实现如权利要求1-7中任一项所述的方法。
CN202310285159.1A 2023-03-22 2023-03-22 一种基于深度学习的带钢精轧宽展预测方法和*** Pending CN116307195A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310285159.1A CN116307195A (zh) 2023-03-22 2023-03-22 一种基于深度学习的带钢精轧宽展预测方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310285159.1A CN116307195A (zh) 2023-03-22 2023-03-22 一种基于深度学习的带钢精轧宽展预测方法和***

Publications (1)

Publication Number Publication Date
CN116307195A true CN116307195A (zh) 2023-06-23

Family

ID=86837633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310285159.1A Pending CN116307195A (zh) 2023-03-22 2023-03-22 一种基于深度学习的带钢精轧宽展预测方法和***

Country Status (1)

Country Link
CN (1) CN116307195A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117272782A (zh) * 2023-08-07 2023-12-22 兰州理工大学 基于自适应多支路深度可分离的热轧钢力学性能预测方法
CN117520825A (zh) * 2024-01-04 2024-02-06 东北大学 基于多尺度特征融合的工业母机加工工件质量预测方法
CN117840232A (zh) * 2024-03-05 2024-04-09 东北大学 一种基于增量学习的热轧过程宽度预测方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117272782A (zh) * 2023-08-07 2023-12-22 兰州理工大学 基于自适应多支路深度可分离的热轧钢力学性能预测方法
CN117520825A (zh) * 2024-01-04 2024-02-06 东北大学 基于多尺度特征融合的工业母机加工工件质量预测方法
CN117520825B (zh) * 2024-01-04 2024-05-10 东北大学 基于多尺度特征融合的工业母机加工工件质量预测方法
CN117840232A (zh) * 2024-03-05 2024-04-09 东北大学 一种基于增量学习的热轧过程宽度预测方法
CN117840232B (zh) * 2024-03-05 2024-05-31 东北大学 一种基于增量学习的热轧过程宽度预测方法

Similar Documents

Publication Publication Date Title
CN116307195A (zh) 一种基于深度学习的带钢精轧宽展预测方法和***
CN110377984B (zh) 一种工业设备剩余有效寿命预测方法、***及电子设备
He et al. Defect detection of hot rolled steels with a new object detection framework called classification priority network
CN112330682B (zh) 一种基于深度卷积神经网络的工业ct图像分割方法
CN106228185B (zh) 一种基于神经网络的通用图像分类识别***及方法
CN111241657B (zh) 一种基于深度学习的冷轧带钢板形预测方法
CN111860171B (zh) 一种大规模遥感图像中不规则形状目标的检测方法及***
CN107784288B (zh) 一种基于深度神经网络的迭代定位式人脸检测方法
CN110533022B (zh) 一种目标检测方法、***、装置及存储介质
CN114897779A (zh) 基于融合注意力的宫颈细胞学图像异常区域定位方法及装置
CN112070768B (zh) 基于Anchor-Free的实时实例分割方法
WO2023116632A1 (zh) 基于时空记忆信息的视频实例分割方法和分割装置
Luo et al. CAT-EDNet: Cross-attention transformer-based encoder–decoder network for salient defect detection of strip steel surface
Hu et al. A method for classification of surface defect on metal workpieces based on twin attention mechanism generative adversarial network
CN111127454A (zh) 基于深度学习生成工业缺陷样本的方法及***
CN112950262A (zh) 销量预测方法、装置、计算机设备和存储介质
CN112215398A (zh) 电力用户负荷预测模型建立方法、装置、设备及存储介质
CN116883393A (zh) 一种基于无锚框目标检测算法的金属表面缺陷检测方法
Xiao et al. A fusion data preprocessing method and its application in complex industrial power consumption prediction
Zhang et al. Automatic detection of surface defects based on deep random chains
Patil et al. Deep learning-based methods for detecting surface defects in steel plates
CN113592064A (zh) 环抛机工艺参数预测方法、***、应用、终端及介质
Zhang et al. Deformable residual attention network for defect detection of train wheelset tread
Hao et al. A highly efficient surface defect detection approach for hot rolled strip steel based on deep learning
CN114821067A (zh) 基于点标注数据的病理图像分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination