CN117933499A - 高速铁路接触网的入侵风险预测方法、装置和存储介质 - Google Patents

高速铁路接触网的入侵风险预测方法、装置和存储介质 Download PDF

Info

Publication number
CN117933499A
CN117933499A CN202410332226.5A CN202410332226A CN117933499A CN 117933499 A CN117933499 A CN 117933499A CN 202410332226 A CN202410332226 A CN 202410332226A CN 117933499 A CN117933499 A CN 117933499A
Authority
CN
China
Prior art keywords
sample data
network
weight
neural networks
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410332226.5A
Other languages
English (en)
Inventor
周明
王继军
詹秀峰
黄国胜
荣正官
司福强
伍平
张平
伏松平
罗颖欣
赵灵燕
樊桃
刘玖林
车颜泽
杨晓燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Railway Construction Electrification Bureau Group Co Ltd
Beijing China Railway Construction Electrification Design and Research Institute Co Ltd
Original Assignee
China Railway Construction Electrification Bureau Group Co Ltd
Beijing China Railway Construction Electrification Design and Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Railway Construction Electrification Bureau Group Co Ltd, Beijing China Railway Construction Electrification Design and Research Institute Co Ltd filed Critical China Railway Construction Electrification Bureau Group Co Ltd
Priority to CN202410332226.5A priority Critical patent/CN117933499A/zh
Publication of CN117933499A publication Critical patent/CN117933499A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Marketing (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Biomedical Technology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开涉及一种高速铁路接触网的入侵风险预测方法、装置和存储介质,其中,方法包括:构建T个初始神经网络,训练T个初始神经网络以获取训练后的T个目标神经网络;分别将预设样本数据集输入到每个目标神经网络,并根据T个目标神经网络的输出向量得到输出矩阵;计算输出矩阵的伪逆矩阵,并对伪逆矩阵进行正则化处理,并根据正则化处理结果确定T个目标神经网络对应的网络权重矩阵;根据网络权重矩阵中的权重向量确定每个目标神经网络的网络权重;根据网络权重和T个目标神经网络构建集成网络,以便于根据集成网络进行高速铁路接触网的风险预测。由此,实现了对接触网的风险预测,且提升了高速铁路接触网的风险预测的准确率和鲁棒性。

Description

高速铁路接触网的入侵风险预测方法、装置和存储介质
技术领域
本公开涉及交通安全技术领域,尤其涉及一种高速铁路接触网的入侵风险预测方法、装置和存储介质。
背景技术
目前,高速铁路上无后备装置的架空接触线作为牵引电力传输的关键载体,主要由接触悬挂、支持装置、定位装置、支柱与基础几部分组成。由于存在各种运行风险,如自然老化、人为因素、外部天气条件等,接触网的安全性能备受关注。根据历史失效记录的统计分析,由于接触网完全暴露在室外,因此更容易受到外界天气条件的影响,尤其是风。风已经成为导致接触网失效的重要因素之一,因为风随气候时期和各种地形变化,而接触网跨越的范围很广,所以会受到不同风速和风向的干扰。更具体地说,风筝、塑料袋、尿素带、布条、反光膜等飘浮物在风的作用下容易挂在接触网上,统称为风致飘浮物入侵。飘浮物入侵引起的接触网失效主要分为以下几种失效场景:1)跳闸事故。风引起的飘浮物入侵引起空间电场畸变,使接触网线的绝缘裕度减小。严重时,直接使气隙短路,造成导线对地、导线对线、导线对柱放电,进而引起跳闸事件。2)二次闪络事故。一般情况下,由于接触网距离较远,风引起的飘浮物入侵不能及时清除,重合闸产生的过电压会在气隙中引起二次闪络事故,可能导致导线烧毁甚至熔断。3)受电弓碰撞,甚至接触网崩溃。当高速列车通过飘浮物侵入区时,缠绕在受电弓周围的飘浮物更容易造成受电弓碰撞、电弧放电,甚至造成接触网断线事故,这些后果都是灾难性的,往往会造成巨大的经济损失和社会负面效应。这些事故也会对接触网的安全性和弹性造成严重的不利影响。如果能够有效预测风致飘浮物的风险等级,接触网的运维管理部门就可以制定相应的运维计划,如***、巡检策略等,以降低飘浮物导致的接触网运营风险。因此,为了制定预测性运维决策,进而提高接触网的安全性和弹性性能,对风致飘浮物入侵风险进行预测是必不可少的。
相关技术中,主要集中在入侵监测方法上,现有的异物入侵监测方法包括视频识别法。视频识别法是实时分析录像机拍摄的画面,利用视频识别技术判断有无异物,可以直观感受现场实际情况,隔段安装就能实现整个路段的监测,但是易受天气等外界干扰,且准确度低。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种高速铁路接触网的入侵风险预测方法、装置和存储介质,以解决现有技术中,对高速铁路接触网的入侵风险检测准确率较低的技术问题。
本公开提供了一种高速铁路接触网的入侵风险预测方法,包括,构建T个初始神经网络,并根据预设样本数据集训练所述T个初始神经网络以获取训练后的T个目标神经网络,其中,T为大于1的自然数;分别将所述预设样本数据集输入到每个所述目标神经网络,并根据T个目标神经网络的输出向量得到输出矩阵;计算所述输出矩阵的伪逆矩阵,并对所述伪逆矩阵进行正则化处理,并根据正则化处理结果确定所述T个目标神经网络对应的网络权重矩阵;根据所述网络权重矩阵中的权重向量确定每个所述目标神经网络的网络权重;根据所述网络权重和所述T个目标神经网络构建集成网络,以便于根据所述集成网络进行高速铁路接触网的风险预测。
本公开提供了一种高速铁路接触网的入侵风险预测装置,包括:第一训练模块,用于构建T个初始神经网络,并根据预设样本数据集训练所述T个初始神经网络以获取训练后的T个目标神经网络,其中,T为大于1的自然数;第二训练模块,用于分别将所述预设样本数据集输入到每个所述目标神经网络,并根据T个目标神经网络的输出向量得到输出矩阵;权重矩阵确定模块,用于计算所述输出矩阵的伪逆矩阵,并对所述伪逆矩阵进行正则化处理,并根据正则化处理结果确定所述T个目标神经网络对应的网络权重矩阵;权重确定模块,用于根据所述网络权重矩阵中的权重向量确定每个所述目标神经网络的网络权重;集成网络构建模块,用于根据所述网络权重和所述T个目标神经网络构建集成网络,以便于根据所述集成网络进行高速铁路接触网的风险预测。
本公开提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:
构建T个初始神经网络,并根据预设样本数据集训练T个初始神经网络以获取训练后的T个目标神经网络,其中,T为大于1的自然数,进而,分别将预设样本数据集输入到每个目标神经网络,并根据T个目标神经网络的输出向量得到输出矩阵,计算输出矩阵的伪逆矩阵,并对伪逆矩阵进行正则化处理,并根据正则化处理结果确定T个目标神经网络对应的网络权重矩阵,根据网络权重矩阵中的权重向量确定每个目标神经网络的网络权重,并且,根据网络权重和T个目标神经网络构建集成网络,以便于根据集成网络进行高速铁路接触网的风险预测。在本技术方案中,实现了对接触网的风险预测,在不平衡和小数据集条件下具有预测不确定性的能力和较强的鲁棒性,因此,提升了高速铁路接触网的风险预测的准确率和鲁棒性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种高速铁路接触网的入侵风险预测方法的流程示意图;
图2为本公开实施例所提供的一种初始神经网络的训练场景示意图;
图3为本公开实施例提供的一种初始神经网络的训练流程示意图;
图4为本公开实施例提供的一种集成网络的结构示意图;
图5为本公开实施例提供的一种高速铁路接触网的入侵风险预测装置的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
下面参考附图描述本公开实施例的高速铁路接触网的入侵风险预测方法,该高速铁路接触网的入侵风险预测方法可以应用于高速铁路接触网的入侵风险预测装置。如图1所示,该高速铁路接触网的入侵风险预测方法包括:
步骤101,构建T个初始神经网络,并根据预设样本数据集训练T个初始神经网络以获取训练后的T个目标神经网络,其中,T为大于1的自然数。
其中,为了保证后续风险预测的准确性,本公开实施例的预设样本数据集中包括多类样本数据,多类样本数据包括一周内的平均极大风速、最大极大风速、线向与风向夹角的和、环境敏感参数的和中的至少多种以及对应的风的入侵次数,从而,可以保证后续训练的相关模型可充分利用时空相关性、极大风速和风向的不确定性、环境敏感参数等因素,在不平衡和小数据集条件下具有预测不确定性的能力和较强的鲁棒性。
在一些可能的实施例中,在基于风引起的漂浮物入侵记录进行样本数据集的采集,风引起的飘浮物入侵记录包括故障位置(支柱编号和故障公里标记)、飘浮物入侵的日期和时间、飘浮物入侵的描述、接触网组件等,其中,为了研究飘浮物入侵次数与风的数值数据之间的复杂关系,应该考虑三个关键问题。第一个是确定获得风力数据的气象站。考虑到接触网线路横跨广阔的地区,在不同的城市有多个气象站。因此,选择位于接触网附近的气象站作为风力数据源。第二个是确定预测周期。根据对飘浮物入侵次数和接触网维护间隔的调查,设置预测期为一周。第三个是对风致飘浮物入侵的风险等级进行分类。接触网的每周风致飘浮物入侵频率分布在0到11之间。
很明显,大多数每周的飘浮物入侵计数都是中等水平和低水平的。因此,与风引起的飘浮物入侵有关的计数分为三类。这三个类别分别占90.70%、6.98%和2.33%。0和1的风险等级占97%以上。由于所占比例最大,因此将风引起的飘浮物入侵次数为零归为一类。中等风险级别表示风引起的飘浮物入侵次数为一到两次。另外,由于接触网风致飘浮物入侵风险预测的输入数据具有广泛性和时空相关性,因此需要进行时空相似性检验选择进行模型训练的候选样本数据集。
其中,空间相似性检验:旨在评估不同接触网廊道的风力数据中存在的相互空间相似性。空间相似性检验的目的是从候选列表中删除与其他廊道不相关的接触网廊道。时间相关性检验是为了选择接触网廊道的高秩风力数据集,并去除冗余。经过空间相似性和时间相关性检验,最终得到接触网的候选样本数据集。
其中,在一些可能的实施例中,可选择风变量的四个关键特征,即周平均极大风速、周最大极大风速、线向与风向夹角的周和以及环境敏感参数的周和(一周内线向与风向夹角之和,和一周内环境敏感参数之和),这四种风特征与每个接触网廊道的每周飘浮物入侵风险水平密切相关,基于这四种风特征对应的作为输入和相应的风致飘浮物入侵风险等级,因此,可以将候选样本数据集对应的这四种风的特征以及对应的风的入侵次数作为本实施例中用于模型训练的预设样本数据集。
在本公开的一个实施例中,构建T个初始神经网络,其中,T为大于1的自然数,每个初始神经网络为具有单层隐藏层的多层神经网络。
在本实施例中,根据预设样本数据集训练T个初始神经网络以获取训练后的T个目标神经网络。
其中,T个目标神经网络的训练方式可以为任意对神经网络训练的自适应增强训练方法,示例如下:
在一些可能的实施例中,获取每个初始神经网络的输出层和单层隐藏层的第一突触强度,以及单层隐藏层和对应的输出层的第二突触强度,获取第一突触强度对应的第一偏置和第二突触强度对应的第二偏置,根据第一突触强度、第二突触强度、第一偏置和第二偏置,构建每个初始神经网络的输出函数,其中,输出函数可以如下述公式(1),在本实施例中,当输入为时,预测输出为:
公式(1)
其中,此处的O为输出层,j为第j个隐藏神经元,H为隐藏层,M为隐藏神经元的个数,为输入X的数量,输入X的第i分量为/>,其中,分量例如包括一周内的平均极大风速、最大极大风速、线向与风向夹角、环境敏感参数等中的一个,/>为第二突触强度,/>为第一突触强度,/>是第一偏置,/>是第二偏置,函数为/>为常见的S型函数,为/>
获取每个初始神经网络对应的每个预设样本数据的目标样本数据权重,根据输出函数、预设样本数据集和目标样本数据权重对第一突触强度、第二突触强度、第一偏置和第二偏置迭代更新,以获取更新后的第一突触强度、更新后的第二突触强度、更新后的第一偏置和更新后的第二偏置。
其中,可采用随机梯度下降迭代更新的方式对有关突触强度和偏置进行更新,在一些可能的实施例中,更新规则可以总结为下述公式(2),其中,为有关网络输出的预测输出结果,/>为对应样本数据的真实输出结果:
公式(2)
其中,为更新后的第一突触强度、更新后的第二突触强度、更新后的第一偏置和更新后的第二偏置中的任意一个,/>为预设学***衡两个方面:一方面是避免过度拟合:过小的学习率会使模型在训练初期缓慢变化,这可能导致模型难以捕捉到数据的全局特征,从而影响泛化能力。另一方面是减少计算成本:过大的学习率会增加计算开销,因为模型需要在每一轮迭代中执行更多的权重更新。
在实际应用中,常见的做法是将学习率设置为一个较小的数值,如 0.01或0.001,以确保模型能够在有限的计算资源下有效地进行训练。n为第n个实际训练样本数据集,为第n个实际训练样本数据集的样本数据集权重,/>为对应神经网络的实际输出,为预测输出。
在本实施例中,根据更新后的第一突触强度、更新后的第二突触强度、更新后的第一偏置和更新后的第二偏置,确定每个初始神经网络对应的目标神经网络。
在本实施例中,单个神经元的建模,D就是输入x的个数;突触强度用于控制一个神经元对于另一个神经元的影响强度,以及影响方向;S型函数就是激活函数,必须是非线性的,这是为了向神经网络中引入非线性,提高神经网络计算的复杂度。神经网络的训练就是更新对应的突触强度和偏置,π就是每次训练得到的突触强度或者对应的偏置。
其中,在本公开的一个实施例中,获取每个初始神经网络对应的每个预设样本数据的目标样本数据权重,其中,目标样本数据权重对不同的神经网络来说是不同的,在本示例中,在当前训练的初始神经网络为首个训练的初始神经网络的情况下,确定所述预设样本数据集的总样本个数,确定所述总样本个数的倒数为每个预设样本数据的目标样本数据权重。即如图2所示,按照顺序逐个对T个神经网络进行训练,对首个初始神经网络进行训练时,其对应的每个预设样本数据的目标样本数据权重为下述公式(3)所示,其中,在公式(3)中,N为预设样本数据集的总样本个数,n为第n个预设样本数据,为第t个神经网络的第n个预设样本数据的目标样本数据权重:
公式(3)
即在本实施例中对第一个训练的初始神经网络对每个预设样本数据接受等量的训练。
继续参照图2,在不为首个训练的初始神经网络的情况下,确定上一个训练完成的目标神经网络的错误样本个数,根据错误样本个数和总样本个数确定网络错误率。
并确定上一个训练完成的目标神经网络对应的每个预设样本数据的预测输出结果和实际输出结果的差值的绝对值,计算差值的绝对值和对应的实际输出结果的比值,并获取上一个训练完成的目标神经网络与每个预设样本数据对应的历史目标样本数据权重,对比值大于预设误差阈值的第一预设样本数据,确定第一预设样本数据的历史目标样本数据权重为第一预设样本数据的候选样本数据权重,对比值不大于预设误差阈值的第二预设样本数据,确定第二预设样本数据的历史目标样本数据权重和网络错误率的乘积值为第二预设样本数据的候选样本数据权重,对第一预设样本数据和第二预设样本数据的候选样本数据权重进行归一化处理,以得到第一预设样本数据和第二预设样本数据的目标样本数据权重。
在本实施例中,为每个后续指标为的网络中,每个样本权重/>是根据前一个样本为/>的第/>个神经网络产生的分数误差来确定的,用/>表示(即,/>)个输入输出训练样本中的第/>个。为了做到这一点,算法维持一个阈值/>。当绝对相对误差在/>以内时,该预设样本数据的初始神经网络输出被认为是无误差的,误差计算参照下面的公式(4):
公式(4)
即在本实施例中,新的权重由之前的/>根据下面公式(5)确定,其中,在公式(5)中,没有被预测正确的预设样本数据将被赋予较大的目标样本数据权重,也就是说会有更大概率被后面的初始神经网络拿来做训练,/>为对应的初始神经网络在训练结束时产生的网络错误率,例如,确定每个初始神经网络对应的训练错误的样本集/>,其中,/>的确定参照下述公式(6),/>为下述公式(7)得到,比如,10个预设样本数据,预测对了6个(第一预设样本数据),则错误率为40%,那原本历史目标样本数据权重都是0.1,更新过后4个预测错误的,权重还是0.1,6个预测正确(第二预设样本数据)的就要降低历史目标样本数据权重,得到目标样本数据权重为0.1*0.4=0.04等,目的是为了让预测错误的有损坏样本数据更多的出现,用来训练后面的初始神经网络,保证后续初始神经网络的可靠性:
公式(5)
公式(6)
公式(7)
其中,正如以上示例提到的,当预设样本数据集包含10个预设杨根数据后,若是第二预设样本数据的目标样本权重更新为0.04,则显然10个预设样本数据对应的目标样本数据权重之和不为1,即4个0.1和6个0.04之和不为1,因此,对第一预设样本数据和第二预设样本数据的候选样本数据权重进行归一化处理,归一化处理后的第一预设样本数据和第二预设样本数据的目标样本数据权重之和为1。
其中,在不同的应用场景中,对第一预设样本数据和第二预设样本数据的候选样本数据权重进行归一化处理的方式不同,在一些可能的实施例中,可以采用下述公式(8)进行归一化处理,其中,归一化处理后的第一预设样本数据和第二预设样本数据的目标样本数据权重之和如公式(9)所示为1。
公式(8)
公式(9)
总结来看,在本公开的一个实施例中,参照图3,在对T个初始神经网络进行t=1到T的训练时,首先使用公式(1)和公式(2)训练网络使用公式(6)和公式(7)计算网络错误率,使用公式(5)计算每个初始申明网络的每个预设样本数据的目标样本数据权重/>使用公式(8)对分布/>进行归一化处理。
步骤102,分别将预设样本数据集输入到每个目标神经网络,并根据T个目标神经网络的输出向量得到输出矩阵。
在本公开的一个实施例中,在得到T个目标神经网络后,对T个目标神经网络进行集成训练,即分别将预设样本数据集输入到每个目标神经网络,并根据T个目标神经网络的输出向量得到输出矩阵。
参照图4,集成网络的预测输出结果是所有/>个目标神经网络的加权和,在本实施例中,每个网络的输出可以组织为一个/>的向量/>,输出矩阵/>
步骤103,计算输出矩阵的伪逆矩阵,并对伪逆矩阵进行正则化处理,并根据正则化处理结果确定T个目标神经网络对应的网络权重矩阵。
步骤104,根据网络权重矩阵中的权重向量确定每个目标神经网络的网络权重。
在本实施例中,考虑到在传统自适应增强算法中,在集成网络的输出中,考虑到目标神经网络接收的权重与它们的逆错误率的对数成正比,因此,对t个目标神经网络设置的网络权重为下述公式(10):
公式(10)
从而,基于图4中的集成网络的架构可得到的集成网络的输出为下述公式(11)所示:
公式(11)
而在本实施例中,为了最小化所有预设样本数据之间的平方差之和,以降低目标神经网络对样本的敏感性,增加鲁棒性,改进了上述网络权重的确定方式。分别设置列向量/>和/>,其中,/>为集成网络的实际输出的向量表示,/>为集成网络的预测输出的向量表示,则实际输出和预设输出之间的误差平方和可表示为下述公式(12),其中,如上所描述的,/>代表样本的真实输出结果,/>是本公开的算法得到的计算结果,即为集成网络的预测输出的结果的向量表示,两者误差的平方和就是方差表示为下述公式:
公式(12)
每个目标神经网络的输出可以组织为一个的向量/>,以类似的方式,网络权重可以被安排为一个/>向量/>。定义/>输出矩阵/>,从而,在改进的算法中,输出向量可以表示为公式(13):
公式(13)
其中,公式(13)可以看作公式(11)的向量标识,在本实施例中,若是使得E最小,则对应的网络权重矩阵可以通过以下公式(14)得到:
公式(14)
公式(14)是的伪逆法则,矩阵/>是/>的伪逆。
即在本实施例中,对伪逆矩阵进行正则化处理,并根据正则化处理结果确定T个目标神经网络对应的网络权重矩阵,根据网络权重矩阵中的权重向量确定每个目标神经网络的网络权重。
在本公开的一个实施例中,可对于矩阵反演的数值稳定性,可以加入正则化,此时可以得到,/>为预设小常数。即通过公式(15)得到网络权重矩阵,其中,网络权重矩阵是一个T*1的矩阵向量,每个矩阵向量代表对应的目标神经网络的网络权重,因此,可以根据网络权重矩阵中的权重向量确定每个目标神经网络的网络权重:
公式(15)
步骤105,根据网络权重和T个目标神经网络构建集成网络,以便于根据集成网络进行高速铁路接触网的风险预测。
在本实施例中,继续采纳找上述图4,可根据网络权重和T个目标神经网络构建集成网络,以便于根据集成网络进行高速铁路接触网的风险预测。
在本公开的一个实施例中,预设样本数据集包括高速铁路接触网的多类入侵参数样本数据,比如,包括上述提到的周平均极大风速、周最大极大风速、线向与风向夹角的周和以及环境敏感参数的周和等,则在根据集成网络进行高速铁路网的风险预测时,则获取高速铁路接触网的多类入侵参数实际值,将多类入侵参数实际值分别输入集成网络的每个目标神经网络,得到T个初始预测值,其中,本实施例中的初始预测值可以是发生入侵风险的次数等,计算每个目标神经网络的初始预测值和对应的网络权重的乘积值,以得到T个乘积值,对T个乘积值求和计算以获取高速铁路接触网的风险预测值。其中,这里的风险预测值也可以为入侵风险的次数等。
由此,在本公开提出的高速铁路接触网的入侵风险预测方法中,将多类入侵参数综合考虑,比如,结合周平均极大风速、周最大极大风速、线向与风向夹角的周和以及环境敏感参数的周和进行入侵风险预测,这四类参数和每个接触网廊道的每周飘浮物入侵风险水平密切相关,提高了预测的准确性和鲁棒性,该集成网络能够充分利用时空相关性、极大风速和风向的不确定性、环境敏感参数等因素,在不平衡和小数据集条件下具有预测不确定性的能力和较强的鲁棒性。本公开中的集成网络的误差更小,不确定度比更小,预测不确定性覆盖率更大。它可以获得鲁棒可靠的预测结果,置信度较高,便于决策者相信基于改进的自适应学习算法的预测模型提供的结果,为利用评估后的预测不确定性指导运维计划提供了可行的思路。同时提出的预测模型具有更低的操作成本,能有效减少接触网因飘浮物导致的故障时间。
综上,本公开实施例的高速铁路接触网的入侵风险预测方法,构建T个初始神经网络,并根据预设样本数据集训练T个初始神经网络以获取训练后的T个目标神经网络,其中,T为大于1的自然数,进而,分别将预设样本数据集输入到每个目标神经网络,并根据T个目标神经网络的输出向量得到输出矩阵,计算输出矩阵的伪逆矩阵,并对伪逆矩阵进行正则化处理,并根据正则化处理结果确定T个目标神经网络对应的网络权重矩阵,根据网络权重矩阵中的权重向量确定每个目标神经网络的网络权重,并且,根据网络权重和T个目标神经网络构建集成网络,以便于根据集成网络进行高速铁路接触网的风险预测。在本技术方案中,实现了对接触网的风险预测,在不平衡和小数据集条件下具有预测不确定性的能力和较强的鲁棒性,因此,提升了高速铁路接触网的风险预测的准确率和鲁棒性。
为了实现上述实施例,本公开还提出了一种高速铁路接触网的入侵风险预测装置。
图5为本公开实施例提供的一种高速铁路接触网的入侵风险预测装置的结构示意图,该装置可由软件和/或硬件实现,一般可集成在电子设备中。如图5所示,该装置包括:第一训练模块510、第二训练模块520、权重矩阵确定模块530、权重确定模块540、集成网络构建模块550,其中,
第一训练模块510,用于构建T个初始神经网络,并根据预设样本数据集训练T个初始神经网络以获取训练后的T个目标神经网络,其中,T为大于1的自然数;
第二训练模块520,用于分别将预设样本数据集输入到每个目标神经网络,并根据T个目标神经网络的输出向量得到输出矩阵;
权重矩阵确定模块530,用于计算输出矩阵的伪逆矩阵,并对伪逆矩阵进行正则化处理,并根据正则化处理结果确定T个目标神经网络对应的网络权重矩阵;
权重确定模块540,用于根据网络权重矩阵中的权重向量确定每个目标神经网络的网络权重;
集成网络构建模块550,用于根据网络权重和T个目标神经网络构建集成网络,以便于根据集成网络进行高速铁路接触网的风险预测。
本公开实施例所提供的高速铁路接触网的入侵风险预测装置可执行本公开任意实施例所提供的高速铁路接触网的入侵风险预测方法,具备执行方法相应的功能模块和有益效果,其实现原理和方法类似,在此不再赘述。
为了实现上述实施例,本公开还提出一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述实施例中的高速铁路接触网的入侵风险预测方法。
为了实现上述实施例,本公开还提出一种电子设备,该电子设备上包含上述高速铁路接触网的入侵风险预测装置。
为了实现上述实施例,本公开还提出了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述高速铁路接触网的入侵风险预测方法。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种高速铁路接触网的入侵风险预测方法,其特征在于,包括:
构建T个初始神经网络,并根据预设样本数据集训练所述T个初始神经网络以获取训练后的T个目标神经网络,其中,T为大于1的自然数;
分别将所述预设样本数据集输入到每个所述目标神经网络,并根据T个目标神经网络的输出向量得到输出矩阵;
计算所述输出矩阵的伪逆矩阵,并对所述伪逆矩阵进行正则化处理,并根据正则化处理结果确定所述T个目标神经网络对应的网络权重矩阵;
根据所述网络权重矩阵中的权重向量确定每个所述目标神经网络的网络权重;
根据所述网络权重和所述T个目标神经网络构建集成网络,以便于根据所述集成网络进行高速铁路接触网的风险预测。
2.如权利要求1所述的方法,其特征在于,每个所述初始神经网络为具有单层隐藏层的多层神经网络,每个初始神经网络的训练过程,包括:
获取每个初始神经网络的输出层和单层隐藏层的第一突触强度,以及所述单层隐藏层和对应的输出层的第二突触强度;
获取所述第一突触强度对应的第一偏置和所述第二突触强度对应的第二偏置;
根据所述第一突触强度、所述第二突触强度、所述第一偏置和所述第二偏置,构建每个所述初始神经网络的输出函数;
获取每个所述初始神经网络对应的每个预设样本数据的目标样本数据权重;
根据所述输出函数、所述预设样本数据集和所述目标样本数据权重对所述第一突触强度、所述第二突触强度、所述第一偏置和所述第二偏置迭代更新,以获取更新后的第一突触强度、更新后的第二突触强度、更新后的第一偏置和更新后的第二偏置;
根据所述更新后的第一突触强度、更新后的第二突触强度、更新后的第一偏置和更新后的第二偏置,确定每个所述初始神经网络对应的目标神经网络。
3.如权利要求2所述的方法,其特征在于,所述每个所述初始神经网络的输出函数,包括:
其中,y为输出函数,M为所述单层隐藏层包含的神经元个数,j为对应的隐层神经元,O为输出层,为挤压函数,/>为/>,/>为第一突触强度,/>为第二突触强度,其中,D为输入x的数量,输入x的第i分量为/>,/>为第一偏置,/>为第二偏置。
4.如权利要求3所述的方法,其特征在于,所述根据所述输出函数和所述实际训练样本数据集对所述第一突触强度、所述第二突触强度、所述第一偏置和所述第二偏置迭代更新时,每次迭代更新的迭代结果为:
其中,为更新后的第一突触强度、更新后的第二突触强度、更新后的第一偏置和更新后的第二偏置中的任意一个,/>为预设学习率,n为第n个实际训练样本数据集,/>为第n个实际训练样本数据集的样本数据集权重。
5.如权利要求2-4任一所述的方法,其特征在于,所述获取每个所述初始神经网络对应的每个预设样本数据的目标样本数据权重,包括:
确定当前训练的初始神经网络是否为首个训练的初始神经网络;
在为首个训练的初始神经网络的情况下,确定所述预设样本数据集的总样本个数,确定所述总样本个数的倒数为每个预设样本数据的目标样本数据权重。
6.如权利要求5所述的方法,其特征在于,还包括:
在不为首个训练的初始神经网络的情况下,确定上一个训练完成的目标神经网络的错误样本个数;
根据所述错误样本个数和所述总样本个数确定网络错误率,并确定上一个训练完成的目标神经网络对应的每个预设样本数据的预测输出结果和实际输出结果的差值的绝对值;
计算所述差值的绝对值和对应的实际输出结果的比值,并获取所述上一个训练完成的目标神经网络与所述每个预设样本数据对应的历史目标样本数据权重;
对所述比值大于预设误差阈值的第一预设样本数据,确定所述第一预设样本数据的历史目标样本数据权重为所述第一预设样本数据的候选样本数据权重;
对所述比值不大于预设误差阈值的第二预设样本数据,确定所述第二预设样本数据的历史目标样本数据权重和所述网络错误率的乘积值为所述第二预设样本数据的候选样本数据权重;
对所述第一预设样本数据和所述第二预设样本数据的候选样本数据权重进行归一化处理,以得到所述第一预设样本数据和所述第二预设样本数据的目标样本数据权重。
7.如权利要求1所述的方法,其特征在于,所述根据正则化处理结果确定的所述T个目标神经网络对应的网络权重矩阵,包括:
其中,为预设常数,/>为单位矩阵,/>为所述伪逆矩阵,/>为所述输出矩阵。
8.如权利要求1所述的方法,其特征在于,所述预设样本数据集包括所述高速铁路接触网的多类入侵参数样本数据;所述根据所述集成网络进行高速铁路接触网的风险预测,包括:
获取所述高速铁路接触网的多类入侵参数实际值;
将所述多类入侵参数实际值分别输入所述集成网络的每个所述目标神经网络,得到T个初始预测值;
计算每个所述目标神经网络的初始预测值和对应的网络权重的乘积值,以得到T个乘积值;
对所述T个乘积值求和计算以获取所述高速铁路接触网的风险预测值。
9.一种高速铁路接触网的入侵风险预测装置,其特征在于,包括:
第一训练模块,用于构建T个初始神经网络,并根据预设样本数据集训练所述T个初始神经网络以获取训练后的T个目标神经网络,其中,T为大于1的自然数;
第二训练模块,用于分别将所述预设样本数据集输入到每个所述目标神经网络,并根据T个目标神经网络的输出向量得到输出矩阵;
权重矩阵确定模块,用于计算所述输出矩阵的伪逆矩阵,并对所述伪逆矩阵进行正则化处理,并根据正则化处理结果确定所述T个目标神经网络对应的网络权重矩阵;
权重确定模块,用于根据所述网络权重矩阵中的权重向量确定每个所述目标神经网络的网络权重;
集成网络构建模块,用于根据所述网络权重和所述T个目标神经网络构建集成网络,以便于根据所述集成网络进行高速铁路接触网的风险预测。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8任一项所述的方法的步骤。
CN202410332226.5A 2024-03-22 2024-03-22 高速铁路接触网的入侵风险预测方法、装置和存储介质 Pending CN117933499A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410332226.5A CN117933499A (zh) 2024-03-22 2024-03-22 高速铁路接触网的入侵风险预测方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410332226.5A CN117933499A (zh) 2024-03-22 2024-03-22 高速铁路接触网的入侵风险预测方法、装置和存储介质

Publications (1)

Publication Number Publication Date
CN117933499A true CN117933499A (zh) 2024-04-26

Family

ID=90751140

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410332226.5A Pending CN117933499A (zh) 2024-03-22 2024-03-22 高速铁路接触网的入侵风险预测方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN117933499A (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105989408A (zh) * 2015-03-18 2016-10-05 国际商业机器公司 用于将神经网络映射到神经突触基板上的***和方法
CN108449295A (zh) * 2018-02-05 2018-08-24 西安电子科技大学昆山创新研究院 基于rbm网络和bp神经网络的联合调制识别方法
CN109034387A (zh) * 2018-06-29 2018-12-18 北京师范大学 一种基于伪逆学习快速训练自编码器的近似方法
CN112529166A (zh) * 2020-12-25 2021-03-19 中国科学院西安光学精密机械研究所 融合神经元模型、神经网络结构及训练、推理方法、存储介质和设备
CN113158582A (zh) * 2021-05-24 2021-07-23 苏州大学 基于复数值前向神经网络的风速预测方法
CN114429246A (zh) * 2022-01-21 2022-05-03 广东电网有限责任公司 一种基于异构神经网络的电网潜在安全确定方法及装置
CN114462597A (zh) * 2022-02-13 2022-05-10 北京师范大学 快速训练深度神经网络的方法、装置、设备和存储介质
CN114662657A (zh) * 2022-03-03 2022-06-24 中国科学院重庆绿色智能技术研究院 一种多项式树突神经网络及其预测方法
CN115081592A (zh) * 2022-06-13 2022-09-20 华设设计集团股份有限公司 基于遗传算法和前馈神经网络的公路低能见度预估方法
CN115311355A (zh) * 2022-09-20 2022-11-08 中国铁建电气化局集团有限公司 接触网异物风险预警方法、装置、设备及存储介质
CN115809700A (zh) * 2022-06-09 2023-03-17 电子科技大学 基于突触-阈值协同的脉冲神经网络学习方法
CN116758767A (zh) * 2023-08-21 2023-09-15 中南大学 基于多策略强化学习的交通信号灯控制方法
CN116757465A (zh) * 2023-04-21 2023-09-15 国网浙江省电力有限公司金华供电公司 一种基于双训练权重分配模型的线路风险评估方法及装置
US20240046089A1 (en) * 2022-08-08 2024-02-08 National Chengchi University Adaptive learning algorithm

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105989408A (zh) * 2015-03-18 2016-10-05 国际商业机器公司 用于将神经网络映射到神经突触基板上的***和方法
CN108449295A (zh) * 2018-02-05 2018-08-24 西安电子科技大学昆山创新研究院 基于rbm网络和bp神经网络的联合调制识别方法
CN109034387A (zh) * 2018-06-29 2018-12-18 北京师范大学 一种基于伪逆学习快速训练自编码器的近似方法
WO2022134391A1 (zh) * 2020-12-25 2022-06-30 中国科学院西安光学精密机械研究所 融合神经元模型、神经网络结构及训练、推理方法、存储介质和设备
CN112529166A (zh) * 2020-12-25 2021-03-19 中国科学院西安光学精密机械研究所 融合神经元模型、神经网络结构及训练、推理方法、存储介质和设备
CN113158582A (zh) * 2021-05-24 2021-07-23 苏州大学 基于复数值前向神经网络的风速预测方法
CN114429246A (zh) * 2022-01-21 2022-05-03 广东电网有限责任公司 一种基于异构神经网络的电网潜在安全确定方法及装置
CN114462597A (zh) * 2022-02-13 2022-05-10 北京师范大学 快速训练深度神经网络的方法、装置、设备和存储介质
CN114662657A (zh) * 2022-03-03 2022-06-24 中国科学院重庆绿色智能技术研究院 一种多项式树突神经网络及其预测方法
CN115809700A (zh) * 2022-06-09 2023-03-17 电子科技大学 基于突触-阈值协同的脉冲神经网络学习方法
CN115081592A (zh) * 2022-06-13 2022-09-20 华设设计集团股份有限公司 基于遗传算法和前馈神经网络的公路低能见度预估方法
US20240046089A1 (en) * 2022-08-08 2024-02-08 National Chengchi University Adaptive learning algorithm
CN115311355A (zh) * 2022-09-20 2022-11-08 中国铁建电气化局集团有限公司 接触网异物风险预警方法、装置、设备及存储介质
CN116757465A (zh) * 2023-04-21 2023-09-15 国网浙江省电力有限公司金华供电公司 一种基于双训练权重分配模型的线路风险评估方法及装置
CN116758767A (zh) * 2023-08-21 2023-09-15 中南大学 基于多策略强化学习的交通信号灯控制方法

Similar Documents

Publication Publication Date Title
CN109492830B (zh) 一种基于时空深度学习的移动污染源排放浓度预测方法
Chen et al. Learning deep representation from big and heterogeneous data for traffic accident inference
Basu et al. Understanding household vehicle ownership in Singapore through a comparison of econometric and machine learning models
US20210142161A1 (en) Systems and methods for model-based time series analysis
CN114594532B (zh) 一种寒潮天气预测方法、装置、电子设备及计算机可读介质
CN115019209A (zh) 一种基于深度学习的电力杆塔状态检测的方法及***
CN113516304A (zh) 基于时空图网络的区域污染物时空联合预测方法及装置
CN116451862A (zh) 模型训练方法和装置、交通事件发生概率评估方法和装置
CN113469457B (zh) 融合注意力机制的输电线路故障概率预测方法
CN116486624A (zh) 基于时空图卷积神经网络的交通流预测方法及***
Yokoyama et al. Comparison between ANN and random forest for leakage current alarm prediction
Zhao et al. Highway traffic crash risk prediction method considering temporal correlation characteristics
Shen et al. Risk response for critical infrastructures with multiple interdependent risks: A scenario-based extended CBR approach
Zhang et al. Off-deployment traffic estimation—a traffic generative adversarial networks approach
Huo et al. Traffic anomaly detection method based on improved GRU and EFMS-Kmeans clustering
CN117933499A (zh) 高速铁路接触网的入侵风险预测方法、装置和存储介质
CN117726162A (zh) 一种基于多模态数据融合的社区风险等级评估方法及***
CN117408598A (zh) 基于动态路网的高速公路大件运输路径快速决策方法
CN116884192A (zh) 一种电力生产作业风险预警方法、***和设备
CN112529315B (zh) 一种滑坡的预测方法、装置、设备和存储介质
CN117010892A (zh) 支付风险检测方法、装置、电子设备和可读介质
US20220101273A1 (en) Methods and systems for forecasting estimated time of restoration during service interruption
Xue et al. A data aggregation-based spatiotemporal model for rail transit risk path forecasting
CN108985526B (zh) 运力预测方法及装置、计算机可读存储介质、终端
Zhu et al. Demand estimation and spatio-temporal clustering for urban road networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination