CN112257974A - 一种燃气闸井风险预测模型数据集、模型训练方法和应用 - Google Patents

一种燃气闸井风险预测模型数据集、模型训练方法和应用 Download PDF

Info

Publication number
CN112257974A
CN112257974A CN202010938869.6A CN202010938869A CN112257974A CN 112257974 A CN112257974 A CN 112257974A CN 202010938869 A CN202010938869 A CN 202010938869A CN 112257974 A CN112257974 A CN 112257974A
Authority
CN
China
Prior art keywords
well
factors
gate
data
risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010938869.6A
Other languages
English (en)
Inventor
王超楠
韩一梁
倪娜
杨帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Radio Metrology and Measurement
Original Assignee
Beijing Institute of Radio Metrology and Measurement
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Radio Metrology and Measurement filed Critical Beijing Institute of Radio Metrology and Measurement
Priority to CN202010938869.6A priority Critical patent/CN112257974A/zh
Publication of CN112257974A publication Critical patent/CN112257974A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Educational Administration (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明的一个实施例公开一种燃气闸井风险预测模型数据集、模型训练方法和应用。包括:从城市燃气公司获得N年内的闸井安全事故应急事件的内部数据;利用非结构化数据处理技术对内部数据进行结构化处理,作为结构化样本;从结构化样本中筛选出字段缺失、字段值异常的条目并删除,作为清洗样本;对所述清洗样本进行统计分析,结合分离混合、合并近似和剔除不相关因素,确定燃气闸井主要的危险性因素,提取出35个二级指标;对所述清洗样本中的闸井安全状态进行量化评估,获得1个安全状态量化分数;将所述清洗样本中的35个危险性因素指标值和1个安全状态量化分数作为数据集。

Description

一种燃气闸井风险预测模型数据集、模型训练方法和应用
技术领域
本发明涉及风险预测领域,更具体地,涉及一种燃气闸井风险预测模型数据集、模型训练方法和应用。
背景技术
燃气传输管道是城镇重要的基础设施,随着燃气管网覆盖面积越来越广,燃气闸井的数量也分布越来越广。燃气闸井属于半封闭式的有限空间,进入有限空间作业属高危险作业,急性中毒、窒息事故风险增大。且很多燃气闸井建造时间较早,工作环境、地理环境都存在一定的危险隐患。燃气闸井内的管道和阀门使用时间比较长,工作条件差,仪表设备老化;燃气管道与其它不同压力的管道的安全距离不足,缺少安全措施;在布局设计方面,有些老旧燃气闸井不符合安全设计要求。因此,建立完善的燃气闸井安全评价体系,实现闸井风险的有效预测,确保燃气闸井内从业人员的安全是十分必要的。
燃气闸井***作为一个具有不确定性、多层次性、开放性的***,影响因素众多,且各因素之间的联系又错综复杂。层次分析法、模糊评价法、故障树法等传统的风险评估方法均过分依赖研究者的经验,主观性强,预测效果差强人意。
发明内容
近年来,各城市燃气集团陆续开始建设完善闸井管理***,通过在海量燃气闸井中安装电子标识器及各类感知终端,对闸井井盖、噪音、液位、压力、温度等进行实时监测,并借助窄带物联技术形成闸井物联网,实现闸井的实时监测。闸井管理***长期运行收集的闸井相关基础数据和状态数据持续积累,将形成闸井建设、运维、管理的大数据,可为燃气闸井风险预测提供客观、科学、有效的基础数据。
本发明的目的在于提供一种燃气闸井风险预测模型数据集、闸井风险预测模型和应用模型预警每日对待评估闸井的安全状态,以解决现有技术存在的问题中的至少之一。
为达到上述目的,本发明采用下述技术方案:
本发明第一方面提供了一种燃气闸井风险预测模型数据集的制作方法,包括:
S10、从城市燃气公司获得N年内的闸井安全事故应急事件的内部数据;
S20、利用非结构化数据处理技术对所述内部数据进行结构化处理,并作为结构化样本保存至数据库;
S30、从所述结构化样本中筛选出字段缺失、字段值异常的条目并删除,作为清洗样本保存至数据库;
S40、对所述清洗样本进行统计分析,并结合分离混合因素、合并近似因素和剔除不相关因素,确定燃气闸井主要的危险性因素,提取出本质因素、环境因素和状态因素3个一级指标,3个一级指标细分为35个二级指标;
S50、对所述清洗样本数据中的闸井安全状态进行量化评估,获得1个安全状态量化分数;
S60、将所述清洗样本数据中的35个危险性因素指标值和1个安全状态量化分数作为数据集。
在一个具体实施例中,应急事件的内部数据记录事件基本信息、闸井设备信息和事件直接原因。
在一个具体实施例中,所述3个一级指标细分为35个二级指标为:
本质因素包括:闸井深度、闸井使用年限、井内设施复杂度、闸井所属管网的压力级别、井内燃气管道与其它不同压力管道的安全距离是否充足、井内照明设施是否符合要求、井内通风设施是否符合要求、闸井周边10米内是否存在排水井/污水井/热力井、闸井周边10米内是否存在化粪池/沼气池、闸井所在区域地面累计沉降量和闸井所在区域地面沉降速率;
环境因素包括:当日降雨量、当日最高气温、当日最低气温、当日空气污染指数、1天前降雨量、1天前最高气温、1天前最低气温、1天前空气污染指数、2天前降雨量、2天前最高气温、2天前最低气温、2天前空气污染指数、节假日、政策性事件和闸井所在区域是否正在施工;
状态因素包括:井盖当日是否异常、当日井内液位最大值、当日井内液位最小值、当日井内压力最大值、当日井内压力最小值、当日井内温度最大值、当日井内温度最小值、当日井内燃气浓度最大值和当日井内燃气浓度最小值,
其中,本质因素11个指标和状态因素9个指标的取值是从应急事件结构化数据中提取得到,环境因素15个指标的取值需要依据事件发生时间,与外部数据关联得到,所述外部数据从网站上爬取得到。
在一个具体实施例中,对N年内的闸井安全事故应急事件的内部数据的闸井安全状态进行量化评估,获得1个安全状态量化分数包括:
聘请10位燃气***相关专家,请专家参考闸井安全状态等级量化标准,对每条样本数据进行安全状态量化打分,再将10位专家的打分结果取平均值作为对应样本的1个安全状态量化分数。
在一个具体实施例中,所述闸井安全状态等级量化标准包括:
基于燃气闸井***实地调研和对专家、技术员、施工员、安全员等各级相关人员的专业咨询,结合我国目前的燃气管道管理和运行体制,将闸井安全状态划分为正常、轻微故障、较大故障、严重故障、灾难性故障5个等级,每个等级对应了一个量化分数。
本发明第二方面提供了利用本发明第一方面的数据集进行闸井风险预测模型训练的方法,包括:
S12、将所述数据集划分为训练集和测试集;
S22、使用LSTM机器学习模型对所述训练集进行训练,将35个危险性因素指标作为输入,1个安全状态量化分数作为输出,生成燃气闸井安全风险预测模型,得到危险性因素与安全状态分数之间的关系;
S32、使用测试集进行模型评估,如果评估效果不理想,重新划分训练集和测试集;并基于新的训练集和测试集进行模型训练和测试,直至模型评估合格。
本发明第三方面提供了利用本发明第二方面的训练方法生成的闸井风险预测模型进行应用的方法,包括:
每日对待评估闸井的35个危险性因素指标进行数据收集和预处理,作为所述闸井风险预测模型的输入,计算得到对应的安全状态量化分数,从而进行预警,
其中,环境因素通过使用定吋器每天触发网络爬虫去爬取新的外部数据。
本发明第四方面提供了一种计算机设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明第一方面、本发明第二方面和本发明第三方面中任一项所述的方法。
本发明第五方面提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明第一方面、本发明第二方面和本发明第三方面中任一项所述的方法。
本发明的有益效果如下:
本发明提供一种燃气闸井风险预测模型数据集、模型训练方法和应用,本发明充分利用闸井***的历史监测大数据和机器学习方法,并考虑到城市燃气闸井的复杂性及事故原因的复杂性,结合基于模糊数学理论的专家模糊综合评价法,给出一种联合了大数据和专家经验优势的更客观、科学、易操作的燃气闸井风险预测模型构建方法。闸井风险预测模型要对闸井的事故发生可能和后果严重程度进行量化,计算评定其风险等级,事先给出风险预测,能在很大程度上提升闸井风险预测的准确性和有效性。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细的说明。
图1示出根据本申请一个实施例的实现本发明方法的硬件架构图。
图2示出根据本申请的一个实施例的燃气闸井风险预测模型数据集的制作方法的流程图。
图3示出根据本申请的一个实施例的基于LSTM机器学习方法的闸井风险预测模型的示意图。
图4示出本发明的一个实施例的实施本发明的燃气闸井风险预测方法的计算机设备的结构示意图。
具体实施方式
为了更清楚地说明本发明,下面结合优选实施例和附图对本发明做进一步的说明。附图中相似的部件以相同的附图标记进行表示。本领域技术人员应当理解,下面所具体描述的内容是说明性的而非限制性的,不应以此限制本发明的保护范围。
图1示出了可以应用本申请的燃气闸井风险预测模型数据集的制作方法、闸井风险预测模型训练的方法或利用闸井风险预测模型进行预测的方法的实施例的示例性***架构100。
如图1所示,***架构100可以包括用户端101、网络104和服务器107。网络104用以在用户端101和服务器107之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等。
用户可以使用用户端101通过网络104与服务器107交互,以进行燃气闸井风险预测模型数据集的制作、闸井风险预测模型的训练或利用闸井风险预测模型进行预测等。
用户端101可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等。
服务器107可以是提供各种服务的服务器,服务器107可以对接收到的N年内的闸井安全事故应急事件的内部数据进行分析等处理,并将处理结果反馈给用户端101。
需要说明的是,图1中的用户端、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
实施例一
如图2所示,本发明的一个实施例提供了一种燃气闸井风险预测模型数据集的制作方法,在一个示例中,该数据集的制作方法包括:
S10、从城市燃气公司获得N年内的闸井安全事故应急事件的内部数据;
在一个具体实施例中,从城市燃气公司获得N年内的闸井安全事故应急事件的内部数据。一般情况下,数据越新越好,越多越好,比如选择近3年的各类燃气闸井安全事故数据。
在一个具体实施例中,应急事件的内部数据记录应急事件的详细信息,包括事件基本信息、闸井设备信息和事件直接原因,一份应急事件报告对应一起应急事件。
S20、利用非结构化数据处理技术对所述内部数据进行结构化处理,并作为结构化样本保存至数据库;
在一个具体实施例中,所述内部数据是以word和pdf文档形式保存的非结构化数据,利用非结构化数据处理技术对所述非结构化数据进行结构化处理,并作为结构化后的样本保存至数据库;
S30、从所述结构化样本中筛选出字段缺失、字段值异常的条目并删除,作为清洗样本保存至数据库;
在一个具体实施例中,从所述样本中筛选出字段缺失、字段值异常的条目,删除所述字段缺失、字段值异常的条目,并作为清洗后的样本保存至数据库;
S40、对所述清洗样本进行统计分析,并结合分离混合因素、合并近似因素和剔除不相关因素,确定燃气闸井主要的危险性因素,提取出本质因素、环境因素和状态因素3个一级指标,3个一级指标细分为35个二级指标;
在一个具体实施例中,利用Python中的Pandas和StatsModels数据分析挖掘工具,对结构化和清洗后的样本进行统计分析,并通过分离混合因素、合并近似因素、剔除不相关因素,确定燃气闸井主要的危险性因素,提取出3个一级指标,3个一级指标可细分为35个二级指标;
在一个具体实施例中,所述3个一级指标分别为本质因素、环境因素和状态因素。
所述3个一级指标细分为35个二级指标为:
本质因素包括:闸井深度、闸井使用年限、井内设施复杂度、闸井所属管网的压力级别、井内燃气管道与其它不同压力管道的安全距离是否充足、井内照明设施是否符合要求、井内通风设施是否符合要求、闸井周边10米内是否存在排水井/污水井/热力井、闸井周边10米内是否存在化粪池/沼气池、闸井所在区域地面累计沉降量和闸井所在区域地面沉降速率;
环境因素包括:当日降雨量、当日最高气温、当日最低气温、当日空气污染指数、1天前降雨量、1天前最高气温、1天前最低气温、1天前空气污染指数、2天前降雨量、2天前最高气温、2天前最低气温、2天前空气污染指数、节假日、政策性事件和闸井所在区域是否正在施工;
状态因素包括:井盖当日是否异常、当日井内液位最大值、当日井内液位最小值、当日井内压力最大值、当日井内压力最小值、当日井内温度最大值、当日井内温度最小值、当日井内燃气浓度最大值和当日井内燃气浓度最小值,
其中,本质因素11个指标和状态因素9个指标的取值是从应急事件结构化数据中提取得到,环境因素15个指标的取值需要依据事件发生时间,与外部数据关联得到,这些外部数据可以利用网络爬虫技术从网站上爬取得到。表1示出了闸井风险预测模型3个一级指标细分35个二级指标危险性因素字段表。
表1闸井风险预测模型3个一级指标细分35个二级指标危险性因素字段表
Figure BDA0002672935100000061
Figure BDA0002672935100000071
Figure BDA0002672935100000081
从表1可以看到,35个二级指标对应的代号、类型和取值,这些具体数据结合可以使我们更直观的了解应急事件的内部数据记录事件基本信息、闸井设备信息和事件直接原因。
S50、对所述清洗样本数据中的闸井安全状态进行量化评估,获得1个安全状态量化分数;
在一个具体实施例中,所述S50包括:
聘请10位燃气***相关专家,请专家参考闸井安全状态等级量化标准,对每条样本数据进行安全状态量化打分,再将10位专家的打分结果取平均值作为对应样本的1个安全状态量化分数。
在一个具体实施例中,所述闸井安全状态等级量化标准包括:
基于燃气闸井***实地调研和对专家、技术员、施工员、安全员等各级相关人员的专业咨询,结合我国目前的燃气管道管理和运行体制,将闸井安全状态划分为正常、轻微故障、较大故障、严重故障、灾难性故障5个等级,每个等级对应了一个量化分数。表2示出了闸井安全状态等级量化标准。
表2闸井安全状态等级量化标准
状态分类 正常 轻微故障 较大故障 严重故障 灾难性故障
量化分数 1 2 3 4 5
从表2可以看出,把闸井安全状态5个等级的具体量化分数。
S60、将所述清洗样本数据对应的35个危险性因素指标值和1个安全状态量化分数作为数据集。
在一个具体实施例中,每条样本数据对应35个危险性因素指标值和1个安全状态量化分数。将所述35个危险性因素指标作为模型输入,1个安全状态量化分数作为模型输出,建立数据集。
本发明针对目前现有的问题,提供一种燃气闸井风险预测模型数据集,考虑到城市燃气闸井的复杂性及事故原因的复杂性,结合基于模糊数学理论的专家模糊综合评价法,对闸井的事故发生可能和后果严重程度进行量化,计算评定其风险等级,事先给出风险预测,能在很大程度上提升闸井风险预测的准确性和有效性。
实施例二
利用实施例一的数据集进行闸井风险预测模型训练的方法,包括:
S12、将所述数据集划分为训练集和测试集;
S22、使用LSTM机器学习模型对所述训练集进行训练,将35个危险性因素指标作为输入,1个安全状态量化分数作为输出,生成燃气闸井安全风险预测模型,得到危险性因素与安全状态分数之间的关系;
S32、使用测试集进行模型评估,如果评估效果不理想,重新划分训练集和测试集;并基于新的训练集和测试集进行模型训练和测试,直至模型评估合格。
在一个具体实施例中,如图3示出了本发明的一个实施例的基于LSTM机器学习方法的闸井风险预测模型,使用传统的机器学习和深度学习模型,只能学习到天气、施工、节假日、政策性事件等对当天燃气闸井风险的影响,很难学习到这些因素对未来几天燃气闸井风险的影响。而LSTM模型可以很好地解决这个问题,将闸井本质风险因子的11个指标、闸井环境风险因子的15个指标和闸井状态风险因子的9个指标作为输入,闸井当日安全风险分数即1个安全状态量化分数作为输出,得到燃气闸井安全风险预测模型。
本发明针对目前现有的问题,提供一种利用实施例一的数据集进行闸井风险预测模型训练的方法,充分利用闸井***的历史监测大数据和机器学习方法,并考虑到城市燃气闸井的复杂性及事故原因的复杂性,结合基于模糊数学理论的专家模糊综合评价法,给出一种联合了大数据和专家经验优势的更客观、科学、易操作的燃气闸井风险预测模型构建方法。闸井风险预测模型要对闸井的事故发生可能和后果严重程度进行量化,计算评定其风险等级,事先给出风险预测,能在很大程度上提升闸井风险预测的准确性。
实施例三
利用实施例二的训练方法生成的闸井风险预测模型进行应用的方法,包括:
每日对待评估闸井的35个危险性因素指标进行数据收集和预处理,作为所述闸井风险预测模型的输入,计算得到对应的安全状态量化分数,从而进行预警,
其中,环境因素通过使用定吋器每天触发网络爬虫去爬取新的外部数据。
本发明针对目前现有的问题,提供一种利用实施例二的训练方法生成的闸井风险预测模型进行应用的方法,充分利用闸井***的历史监测大数据和机器学习方法,并考虑到城市燃气闸井的复杂性及事故原因的复杂性,结合基于模糊数学理论的专家模糊综合评价法,给出一种联合了大数据和专家经验优势的更客观、科学、易操作的燃气闸井风险预测模型构建方法。闸井风险预测模型要对闸井的事故发生可能和后果严重程度进行量化,计算评定其风险等级,事先给出风险预测,能在很大程度上提升闸井风险预测的准确性。
实施例四
如图4所示,本发明的一个实施例提供了一种计算机设备的结构示意图,图4显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,***存储器28,连接不同***组件(包括***存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。
计算机设备12典型地包括多种计算机***可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
***存储器28可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图4所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图4中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理器单元16通过运行存储在***存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现实施例三所提供的方法。
本发明针对目前现有的问题,提供一种计算机设备,充分利用闸井***的历史监测大数据和机器学习方法,并考虑到城市燃气闸井的复杂性及事故原因的复杂性,结合基于模糊数学理论的专家模糊综合评价法,给出一种联合了大数据和专家经验优势的更客观、科学、易操作的燃气闸井风险预测模型构建方法。闸井风险预测模型要对闸井的事故发生可能和后果严重程度进行量化,计算评定其风险等级,事先给出风险预测,能在很大程度上提升闸井风险预测的准确性。
实施例五
本发明的另一个实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例一、实施例二和实施例三所提供的方法。
在实际应用中,所述计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本发明针对目前现有的问题,提供一种存储介质,充分利用闸井***的历史监测大数据和机器学习方法,并考虑到城市燃气闸井的复杂性及事故原因的复杂性,结合基于模糊数学理论的专家模糊综合评价法,给出一种联合了大数据和专家经验优势的更客观、科学、易操作的燃气闸井风险预测模型构建方法。闸井风险预测模型要对闸井的事故发生可能和后果严重程度进行量化,计算评定其风险等级,事先给出风险预测,能在很大程度上提升闸井风险预测的准确性。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定,对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

Claims (9)

1.一种燃气闸井风险预测模型数据集的制作方法,其特征在于,包括:
S10、从城市燃气公司获得N年内的闸井安全事故应急事件的内部数据;
S20、利用非结构化数据处理技术对所述内部数据进行结构化处理,并作为结构化样本保存至数据库;
S30、从所述结构化样本中筛选出字段缺失、字段值异常的条目并删除,作为清洗样本保存至数据库;
S40、对所述清洗样本进行统计分析,并结合分离混合因素、合并近似因素和剔除不相关因素,确定燃气闸井主要的危险性因素,提取出本质因素、环境因素和状态因素3个一级指标,3个一级指标细分为35个二级指标;
S50、对所述清洗样本中的闸井安全状态进行量化评估,获得1个安全状态量化分数;
S60、将所述清洗样本中的35个危险性因素指标值和1个安全状态量化分数作为数据集。
2.根据权利要求1所述的方法,其特征在于,应急事件的内部数据记录事件基本信息、闸井设备信息和事件直接原因。
3.根据权利要求1所述的方法,其特征在于,所述3个一级指标细分为35个二级指标为:
本质因素包括:闸井深度、闸井使用年限、井内设施复杂度、闸井所属管网的压力级别、井内燃气管道与其它不同压力管道的安全距离是否充足、井内照明设施是否符合要求、井内通风设施是否符合要求、闸井周边10米内是否存在排水井/污水井/热力井、闸井周边10米内是否存在化粪池/沼气池、闸井所在区域地面累计沉降量和闸井所在区域地面沉降速率;
环境因素包括:当日降雨量、当日最高气温、当日最低气温、当日空气污染指数、1天前降雨量、1天前最高气温、1天前最低气温、1天前空气污染指数、2天前降雨量、2天前最高气温、2天前最低气温、2天前空气污染指数、节假日、政策性事件和闸井所在区域是否正在施工;
状态因素包括:井盖当日是否异常、当日井内液位最大值、当日井内液位最小值、当日井内压力最大值、当日井内压力最小值、当日井内温度最大值、当日井内温度最小值、当日井内燃气浓度最大值和当日井内燃气浓度最小值,
其中,本质因素11个指标和状态因素9个指标的取值是从应急事件结构化数据中提取得到,环境因素15个指标的取值需要依据事件发生时间,与外部数据关联得到,所述外部数据从网站上爬取得到。
4.根据权利要求1所述的方法,其特征在于,所述S50包括:
基于燃气***相关专家参考闸井安全状态等级量化标准,对每条清洗样本数据进行安全状态量化打分,将打分结果取平均值作为对应样本的1个安全状态量化分数。
5.根据权利要求4所述的方法,其特征在于,所述闸井安全状态等级量化标准包括:
基于燃气闸井***实地调研和对专家、技术员、施工员、安全员等各级相关人员的专业咨询,结合我国目前的燃气管道管理和运行体制,将闸井安全状态划分为正常、轻微故障、较大故障、严重故障、灾难性故障5个等级,每个等级对应了一个量化分数。
6.利用权利要求1-5中任一项的数据集进行闸井风险预测模型训练的方法,其特征在于,
S12、将所述数据集划分为训练集和测试集;
S22、使用LSTM机器学习模型对所述训练集进行训练,将35个危险性因素指标作为输入,1个安全状态量化分数作为输出,生成燃气闸井安全风险预测模型,得到危险性因素与安全状态分数之间的关系;
S32、使用测试集进行模型评估,如果评估效果不理想,重新划分训练集和测试集;并基于新的训练集和测试集进行模型训练和测试,直至模型评估合格。
7.利用权利要求6的训练方法生成的闸井风险预测模型进行预测的方法,其特征在于,每日对待评估闸井的35个危险性因素指标进行数据收集和预处理,作为所述闸井风险预测模型的输入,计算得到对应的安全状态量化分数,从而进行预警,
其中,环境因素通过使用定时器每天触发网络爬虫去爬取新的外部数据。
8.一种计算机设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一项所述的方法。
9.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
CN202010938869.6A 2020-09-09 2020-09-09 一种燃气闸井风险预测模型数据集、模型训练方法和应用 Pending CN112257974A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010938869.6A CN112257974A (zh) 2020-09-09 2020-09-09 一种燃气闸井风险预测模型数据集、模型训练方法和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010938869.6A CN112257974A (zh) 2020-09-09 2020-09-09 一种燃气闸井风险预测模型数据集、模型训练方法和应用

Publications (1)

Publication Number Publication Date
CN112257974A true CN112257974A (zh) 2021-01-22

Family

ID=74233087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010938869.6A Pending CN112257974A (zh) 2020-09-09 2020-09-09 一种燃气闸井风险预测模型数据集、模型训练方法和应用

Country Status (1)

Country Link
CN (1) CN112257974A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114693193A (zh) * 2022-06-02 2022-07-01 中国人民解放军海军工程大学 一种装备科研项目风险因子评估***及方法
CN115099586A (zh) * 2022-06-10 2022-09-23 上海异工同智信息科技有限公司 用于作业风险识别的方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180089389A1 (en) * 2016-09-26 2018-03-29 International Business Machines Corporation System, method and computer program product for evaluation and identification of risk factor
CN108510194A (zh) * 2018-03-30 2018-09-07 平安科技(深圳)有限公司 风控模型训练方法、风险识别方法、装置、设备及介质
US20180365229A1 (en) * 2017-06-19 2018-12-20 Vettd, Inc. Systems and methods to determine and utilize semantic relatedness between multiple natural language sources to determine strengths and weaknesses
CN109523386A (zh) * 2018-10-18 2019-03-26 广东工业大学 一种gmm与lstm结合的投资组合风险预测方法
CN110967153A (zh) * 2019-12-04 2020-04-07 北京无线电计量测试研究所 一种燃气闸井自动巡视***和方法
US20200117903A1 (en) * 2018-10-10 2020-04-16 Autodesk, Inc. Architecture, engineering and construction (aec) construction safety risk analysis system and method for interactive visualization and capture
CN111325455A (zh) * 2020-02-13 2020-06-23 中国安全生产科学研究院 有限空间作业安全风险评估***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180089389A1 (en) * 2016-09-26 2018-03-29 International Business Machines Corporation System, method and computer program product for evaluation and identification of risk factor
US20180365229A1 (en) * 2017-06-19 2018-12-20 Vettd, Inc. Systems and methods to determine and utilize semantic relatedness between multiple natural language sources to determine strengths and weaknesses
CN108510194A (zh) * 2018-03-30 2018-09-07 平安科技(深圳)有限公司 风控模型训练方法、风险识别方法、装置、设备及介质
US20200117903A1 (en) * 2018-10-10 2020-04-16 Autodesk, Inc. Architecture, engineering and construction (aec) construction safety risk analysis system and method for interactive visualization and capture
CN109523386A (zh) * 2018-10-18 2019-03-26 广东工业大学 一种gmm与lstm结合的投资组合风险预测方法
CN110967153A (zh) * 2019-12-04 2020-04-07 北京无线电计量测试研究所 一种燃气闸井自动巡视***和方法
CN111325455A (zh) * 2020-02-13 2020-06-23 中国安全生产科学研究院 有限空间作业安全风险评估***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
徐征: "燃气闸井安全评价指标体系研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》, no. 1, pages 11 - 53 *
陈毓飞: "燃气管道风险预测方法的研究与实现", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》, no. 8, pages 15 - 30 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114693193A (zh) * 2022-06-02 2022-07-01 中国人民解放军海军工程大学 一种装备科研项目风险因子评估***及方法
CN115099586A (zh) * 2022-06-10 2022-09-23 上海异工同智信息科技有限公司 用于作业风险识别的方法及装置

Similar Documents

Publication Publication Date Title
CN105678481A (zh) 一种基于随机森林模型的管线健康状态评估方法
Wang et al. Data-driven risk assessment on urban pipeline network based on a cluster model
CN116777223B (zh) 一种城市地下管网安全综合风险评估方法及***
CN110990393A (zh) 一种行业企业数据异常行为的大数据识别方法
CN112257974A (zh) 一种燃气闸井风险预测模型数据集、模型训练方法和应用
CN112529327A (zh) 一种用于构建商业地区建筑火灾风险预测等级模型的方法
CN113240211B (zh) 废水排放预测方法、装置、计算机设备和存储介质
CN201229289Y (zh) 一种腐蚀预测装置
CN116523312A (zh) 一种智慧城市数据管理方法及***
CN113688169A (zh) 基于大数据分析的矿山安全隐患辨识与预警***
Xu et al. A framework for statistical analysis of water pipeline field performance data
Liu et al. Statistics of catastrophic hazardous liquid pipeline accidents
CN116720324A (zh) 基于预测模型的牵引变电所关键设备故障预警方法及***
CN116756825A (zh) 一种中小跨径桥梁的群结构性能预测***
Reed et al. Metrics as tools for bridging climate science and applications
CN111737993B (zh) 一种配电网设备的故障缺陷文本提取设备健康状态方法
CN115660513B (zh) 一种基于水利工程渡槽变形的监测方法及***
Holloway et al. Exploring the use of water resource recovery facility instrument data to visualise dynamic resilience to environmental stressors
CN115689118A (zh) 一种油气管道风险评价方法、***、存储介质和电子设备
CN114528314A (zh) 一种工程建设项目监管***及方法
CN111611689A (zh) 基于建筑物属性和信令数据的动态后果评估方法及装置
Weeraddana et al. Utilizing machine learning to prevent water main breaks by understanding pipeline failure drivers
CN116739391B (zh) 一种多制式轨道交通应急协同决策方法及装置
CN113656666B (zh) 继电保护定值数据交互方法
Kumar et al. A hybrid framework for mining spatial characteristics of sewer defects from inspection databases

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination