CN112069814A - 一种基于深度学习的消防预案分类方法 - Google Patents

一种基于深度学习的消防预案分类方法 Download PDF

Info

Publication number
CN112069814A
CN112069814A CN202010903655.5A CN202010903655A CN112069814A CN 112069814 A CN112069814 A CN 112069814A CN 202010903655 A CN202010903655 A CN 202010903655A CN 112069814 A CN112069814 A CN 112069814A
Authority
CN
China
Prior art keywords
fire
fighting
plan
word segmentation
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010903655.5A
Other languages
English (en)
Inventor
安震鹏
杨树峰
张迪
陈泽宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Fire Research Institute of MEM
Original Assignee
Shenyang Fire Research Institute of MEM
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Fire Research Institute of MEM filed Critical Shenyang Fire Research Institute of MEM
Priority to CN202010903655.5A priority Critical patent/CN112069814A/zh
Publication of CN112069814A publication Critical patent/CN112069814A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Human Resources & Organizations (AREA)
  • Educational Administration (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

一种基于深度学习的消防预案分类方法,着重解决消防预案查询精度不高、缺少智能分类能力的问题。通过种基于深度学习的消防预案分类方法,实现预案信息的有效分析和管理,战时能够达到处置方案的快速获取与发布,具有直观生动、实时查询、快速发布、动态分析、辅助决策等特点,实现灭火救援行动的科学性和效率极大提高。

Description

一种基于深度学习的消防预案分类方法
技术领域
本发明创造涉及消防预案管理领域,具体是指一种基于深度学习的消防预案分类方法。
背景技术
当前,随着我国经济建设的快速发展,城市化进程的加快,高层、地下、大型综合体等复杂建筑大量出现,并呈现出建筑高度不断攀升、体积日益庞大、功能日趋复杂的趋势,各种新材料、新工艺、新产品、新技术广泛应用,由此带来的火灾隐患和风险日益增多,火灾扑救难度日益增大。灭火救援数字化预案是指以信息技术为手段,以信息环境为依托,立足于对现有灭火救援力量和处置对象的掌握,通过对火灾风险、灾害后果的模拟分析和预测,以及对灭火救援资源的合理评估与调配,而形成的灭火救援行动方案。平时可以实现作战信息的有效存储和管理,战时能够达到处置方案的快速获取与发布,具有直观生动、实时查询、快速发布、动态分析、辅助决策等特点,实现灭火救援行动的科学性和效率极大提高。
当前的预案管理和查询存在以下几个问题:
(1)查询准确度不高
消防预案一般以单位或者建筑来命名,预案里有单位基本信息、灾情设定、力量调集、组织指挥、社会联动、勤务保障、特别提示、辅助决策、各类图片等大量信息。在查询中会出现预案定位不精确和信息搜索不全面两大类问题。预案定位不精确是指通过单位名称难以准确定位到相应预案。例如:预案名称被存储为“中国医科大学附属第二医院”,当输入搜索“医大二院”或者“盛京医院”的时候很难搜到正确的预案。信息搜索不全面是指只有找到相应的预案才能进一步找到相应的位基本信息、灾情设定、力量调集、组织指挥、社会联动、勤务保障等信息,可定位的信息量少、不全面。
(2)缺少智能分类能力
在应急救援的过程中预案会为前期的应急处置提供重要的帮助。根据现场条件推荐相关的消防预案是一种提高应急救援效率方案。例如:某生产烯烃类化工产品的厂区发生消防事故,该区域没有制作相关的消防预案,如果有类似的烯烃类化工厂区预案提供参考也能作为一种辅助决策支撑。但是当前的预案***还没有智能分类的能力,没有将海量预案信息做成管理度高的簇群组。
发明内容
本发明创造提供一种基于深度学习的消防预案分类方法,解决了现有技术中存在查询准确度不高、缺少智能分类能力的问题。
为了实现上述目的,本发明创造采用了如下技术方案:
一种基于深度学习的消防预案分类方法,其特征在于,其步骤为:
1)消防预案记录分词:
1.1)在中文通用字典中增加专业词汇;
1.2)采用顺序细粒度分词算法结合中文词库对预案文本进行初步分词;
1.3)采用分词穷举法,对初步分词后得到的文本中可能存在歧义分词的句子,列举出所有可能的备选分词方案;
1.4)对于可能存在异议的句子,通过关键词汇加权、切分概率统计原则,计算各个备选方案的得分,选定高得分的方案作为分词结果;
2)消防预案要素关键词提取:
2.1)采用统计特征和主题模型的无监督文本关键词提取技术,进行消防预案文本关键词提取;
2.2)通过消防预案专业词汇库量化分词权重和切分概率统计,算得每个词对应的权重值;
2.3)通过关键词权值权值排名,最终获取个N权值最高的词,作为对应消防预案的关键词,得到由N个关键词及其对应的权值组成的向量组;
3)深度学习下消防预案智能分类:
3.1)将每个预案步骤2.3)中得到的向量组作为一级相关属性作为输入,经过卷积运算得到向量值;
3.2)对于给定的X个消防预案文本的数据集,给定聚类(簇)的个数K(K<X),初始化每个样本所属的类别,通过卷积K-means算法不断地迭代并重新划分数据集的类别,最终将X个消防预案文本分为K个类。
所述的步骤1.3)中,当句子存在有多个初步的分词结果的情况,即认定为是可能存在歧义分词的文本。
所述的步骤1.4)中,计算方法为:
关键词权值=关键词库内的权值+出现频率;其中关键词库内的权值为人为赋值,出现频率=关键字在文本中出现的频率/所有词汇在文本中出现的次数总和。
本发明创造的有益效果:
本发明创造通过上述方法,利用大数据、深度学习和人工智能等新一代信息技术设计一种基于深度学习的消防预案分类方法,着重解决消防预案查询精度不高、缺少智能分类能力的问题。通过种基于深度学习的消防预案分类方法,实现预案信息的有效分析和管理,战时能够达到处置方案的快速获取与发布,具有直观生动、实时查询、快速发布、动态分析、辅助决策等特点,实现灭火救援行动的科学性和效率极大提高。
附图说明
图1为一种基于深度学习的消防预案分类方法总体设计图。
具体实施方式
下面将结合本发明创造实施例中的附图,对本发明创造实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明创造一部分实施例,而不是全部的实施例。
实施例1:现在输入100个消防预案文本,设定类别数量为5,就是讲100个消防预案文本分成5类。通过文本分词、关键词向量提取、卷积处理得到100个输入向量作为K-means算法的输入,K-means算法迭代处理后将100个消防预案文本自动分成5类。具体方法为:
1)消防预案记录分词:
1.1)在中文通用字典中增加专业词汇。如增加“建筑情况、占地面积、建筑面积、消防设施、室内消火栓”等消防预案专用词汇,增加“汽油、柴油、烯烃类”等危化品专用词汇,增加“内浮顶罐、外浮顶罐、烷基化装置”等化工处置设备专业词汇,提高消防预案分词精度。
1.2)采用顺序细粒度分词算法结合中文词库对预案文本进行初步分词。
1.3)采用分词穷举法,对初步分词后得到的文本中可能存在歧义分词的句子,列举出所有可能的备选分词方案。当句子存在有多个初步的分词结果的情况,即认定为是可能存在歧义分词的文本。比如:消防水池可能会分为分成“消防”和“水池”两个词或“消防水池”一个词;“中国人民银行”可能会分成“中国”“人民”“银行”三个词或“中国人民银行”一个词。
1.4)对于可能存在异议的句子,通过关键词汇加权、切分概率统计原则,计算各个备选方案的得分,选定高得分的方案作为分词结果。具体的,关键词权值=关键词库内的权值+出现频率。其中关键词库内的权值为人为赋值,出现频率=词条(关键字)在文本中出现的频率/所有词汇在文本中出现的次数总和。例如“水泵接合器”赋值0.5,“的”赋值-0.5。显然,在本发明中相对于“消防”和“水池”的分词情况,“消防水池”分词更为准确,因此在设定赋值时,“消防水池”的设定赋值大于“消防”+“水池”的赋值。通过赋值的设定,可以筛选出最准确的分词结果。
2)消防预案要素关键词提取:
2.1)采用统计特征和主题模型的无监督文本关键词提取技术,进行消防预案文本关键词提取。
2.2)通过消防预案专业词汇库量化分词权重和切分概率统计,算得每个词对应的权重值。
2.3)通过关键词权值权值排名,最终获取个N权值最高的词,作为对应消防预案的关键词,得到由N个关键词及其对应的权值组成的向量组。一般的,N=100,也可以通过具体情况设定每个向量组中包括的关键词个数。
3)深度学习下消防预案智能分类:
3.1)将每个预案步骤2.3)中得到的向量组作为一级相关属性作为输入,经过卷积运算得到向量值。具体的,也可以在关键词中选取前M个词汇和其关键词权值作为一级相关属性作为输入,M可为64,也可以具体情况选取。
3.2)对于给定的100个消防预案文本的数据集,给定聚类(簇)的个数5,初始化每个样本所属的类别,通过卷积K-means算法不断地迭代并重新划分数据集的类别,最终将100个消防预案文本分为5个类。

Claims (3)

1.一种基于深度学习的消防预案分类方法,其特征在于,其步骤为:
1)消防预案记录分词:
1.1)在中文通用字典中增加专业词汇;
1.2)采用顺序细粒度分词算法结合中文词库对预案文本进行初步分词;
1.3)采用分词穷举法,对初步分词后得到的文本中可能存在歧义分词的句子,列举出所有可能的备选分词方案;
1.4)对于可能存在异议的句子,通过关键词汇加权、切分概率统计原则,计算各个备选方案的得分,选定高得分的方案作为分词结果;
2)消防预案要素关键词提取:
2.1)采用统计特征和主题模型的无监督文本关键词提取技术,进行消防预案文本关键词提取;
2.2)通过消防预案专业词汇库量化分词权重和切分概率统计,算得每个词对应的权重值;
2.3)通过关键词权值权值排名,最终获取个N权值最高的词,作为对应消防预案的关键词,得到由N个关键词及其对应的权值组成的向量组;
3)深度学习下消防预案智能分类:
3.1)将每个预案步骤2.3)中得到的向量组作为一级相关属性作为输入,经过卷积运算得到向量值;
3.2)对于给定的X个消防预案文本的数据集,给定聚类(簇)的个数K(K<X),初始化每个样本所属的类别,通过卷积K-means算法不断地迭代并重新划分数据集的类别,最终将X个消防预案文本分为K个类。
2.根据权利要求1所述的一种基于深度学习的消防预案分类方法,其特征在于:所述的步骤1.3)中,当句子存在有多个初步的分词结果的情况,即认定为是可能存在歧义分词的文本。
3.根据权利要求1所述的一种基于深度学习的消防预案分类方法,其特征在于:所述的步骤1.4)中,计算方法为:
关键词权值=关键词库内的权值+出现频率;其中关键词库内的权值为人为赋值,出现频率=关键字在文本中出现的频率/所有词汇在文本中出现的次数总和。
CN202010903655.5A 2020-09-01 2020-09-01 一种基于深度学习的消防预案分类方法 Pending CN112069814A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010903655.5A CN112069814A (zh) 2020-09-01 2020-09-01 一种基于深度学习的消防预案分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010903655.5A CN112069814A (zh) 2020-09-01 2020-09-01 一种基于深度学习的消防预案分类方法

Publications (1)

Publication Number Publication Date
CN112069814A true CN112069814A (zh) 2020-12-11

Family

ID=73666266

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010903655.5A Pending CN112069814A (zh) 2020-09-01 2020-09-01 一种基于深度学习的消防预案分类方法

Country Status (1)

Country Link
CN (1) CN112069814A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101183457A (zh) * 2007-12-17 2008-05-21 北京航空航天大学 一种警务指挥预案的智能管理和自动实施***
CN103034926A (zh) * 2012-12-07 2013-04-10 北京三博中自科技有限公司 一种事故应急信息化管理方法及***
CN106202561A (zh) * 2016-07-29 2016-12-07 北京联创众升科技有限公司 基于文本大数据的数字化应急管理案例库构建方法及装置
CN107562814A (zh) * 2017-08-14 2018-01-09 中国农业大学 一种地震应急和灾情信息获取分类方法及***
WO2018028077A1 (zh) * 2016-08-11 2018-02-15 中兴通讯股份有限公司 一种基于深度学习的中文语义分析的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101183457A (zh) * 2007-12-17 2008-05-21 北京航空航天大学 一种警务指挥预案的智能管理和自动实施***
CN103034926A (zh) * 2012-12-07 2013-04-10 北京三博中自科技有限公司 一种事故应急信息化管理方法及***
CN106202561A (zh) * 2016-07-29 2016-12-07 北京联创众升科技有限公司 基于文本大数据的数字化应急管理案例库构建方法及装置
WO2018028077A1 (zh) * 2016-08-11 2018-02-15 中兴通讯股份有限公司 一种基于深度学习的中文语义分析的方法及装置
CN107562814A (zh) * 2017-08-14 2018-01-09 中国农业大学 一种地震应急和灾情信息获取分类方法及***

Similar Documents

Publication Publication Date Title
CN107239446B (zh) 一种基于神经网络与注意力机制的情报关系提取方法
CN112559556B (zh) 表格模式解析和序列掩码的语言模型预训练方法及***
Zou et al. Retrieving similar cases for construction project risk management using Natural Language Processing techniques
CN112148832B (zh) 一种基于标签感知的双重自注意力网络的事件检测方法
CN110781670B (zh) 基于百科知识库和词向量的中文地名语义消歧方法
JP5907393B2 (ja) 複雑述語テンプレート収集装置、及びそのためのコンピュータプログラム
CN108681574A (zh) 一种基于文本摘要的非事实类问答答案选择方法及***
CN111783428A (zh) 基于深度学习的应急管理类客观题自动生成***
CN113553412A (zh) 问答处理方法、装置、电子设备和存储介质
CN111475650A (zh) 一种俄语语义角色标注方法、***、装置以及存储介质
CN112148886A (zh) 一种内容知识图谱的构建方法及***
CN116561274A (zh) 一种基于数字人技术与自然语言大模型的知识问答方法
CN110347812A (zh) 一种面向司法文本的搜索排序方法及***
Tianxiong et al. Identifying chinese event factuality with convolutional neural networks
CN109344233A (zh) 一种中文人名识别方法
CN115795018B (zh) 一种面向电网领域的多策略智能搜索问答方法及***
CN112069814A (zh) 一种基于深度学习的消防预案分类方法
CN116431746A (zh) 基于编码库的地址映射方法、装置、电子设备及存储介质
CN110888944A (zh) 基于多卷积窗尺寸注意力卷积神经网络实体关系抽取方法
CN115730078A (zh) 用于类案检索的事件知识图谱构建方法、装置及电子设备
CN111160786B (zh) 基于本体的建筑物地震风险性评估方法
CN114969087A (zh) 基于多视角特征解耦的nl2sql方法和装置
Lv et al. Automatic key-phrase extraction to support the understanding of infrastructure disaster resilience
CN109299456A (zh) 一种地名识别方法
Sholikah et al. Semantic Relation Detection based on Multi-task Learning and Cross-Lingual-View Embedding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination