CN112069814A - 一种基于深度学习的消防预案分类方法 - Google Patents
一种基于深度学习的消防预案分类方法 Download PDFInfo
- Publication number
- CN112069814A CN112069814A CN202010903655.5A CN202010903655A CN112069814A CN 112069814 A CN112069814 A CN 112069814A CN 202010903655 A CN202010903655 A CN 202010903655A CN 112069814 A CN112069814 A CN 112069814A
- Authority
- CN
- China
- Prior art keywords
- fire
- fighting
- plan
- word segmentation
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000013135 deep learning Methods 0.000 title claims abstract description 14
- 230000011218 segmentation Effects 0.000 claims description 42
- 239000013598 vector Substances 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 abstract description 6
- 230000009471 action Effects 0.000 abstract description 4
- 230000000007 visual effect Effects 0.000 abstract description 2
- 239000000126 substance Substances 0.000 description 4
- 150000001336 alkenes Chemical class 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- JRZJOMJEPLMPRA-UHFFFAOYSA-N olefin Natural products CCCCCCCC=C JRZJOMJEPLMPRA-UHFFFAOYSA-N 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000007667 floating Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000029936 alkylation Effects 0.000 description 1
- 238000005804 alkylation reaction Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000002283 diesel fuel Substances 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000008925 shengjing Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Tourism & Hospitality (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Human Resources & Organizations (AREA)
- Educational Administration (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
Abstract
一种基于深度学习的消防预案分类方法,着重解决消防预案查询精度不高、缺少智能分类能力的问题。通过种基于深度学习的消防预案分类方法,实现预案信息的有效分析和管理,战时能够达到处置方案的快速获取与发布,具有直观生动、实时查询、快速发布、动态分析、辅助决策等特点,实现灭火救援行动的科学性和效率极大提高。
Description
技术领域
本发明创造涉及消防预案管理领域,具体是指一种基于深度学习的消防预案分类方法。
背景技术
当前,随着我国经济建设的快速发展,城市化进程的加快,高层、地下、大型综合体等复杂建筑大量出现,并呈现出建筑高度不断攀升、体积日益庞大、功能日趋复杂的趋势,各种新材料、新工艺、新产品、新技术广泛应用,由此带来的火灾隐患和风险日益增多,火灾扑救难度日益增大。灭火救援数字化预案是指以信息技术为手段,以信息环境为依托,立足于对现有灭火救援力量和处置对象的掌握,通过对火灾风险、灾害后果的模拟分析和预测,以及对灭火救援资源的合理评估与调配,而形成的灭火救援行动方案。平时可以实现作战信息的有效存储和管理,战时能够达到处置方案的快速获取与发布,具有直观生动、实时查询、快速发布、动态分析、辅助决策等特点,实现灭火救援行动的科学性和效率极大提高。
当前的预案管理和查询存在以下几个问题:
(1)查询准确度不高
消防预案一般以单位或者建筑来命名,预案里有单位基本信息、灾情设定、力量调集、组织指挥、社会联动、勤务保障、特别提示、辅助决策、各类图片等大量信息。在查询中会出现预案定位不精确和信息搜索不全面两大类问题。预案定位不精确是指通过单位名称难以准确定位到相应预案。例如:预案名称被存储为“中国医科大学附属第二医院”,当输入搜索“医大二院”或者“盛京医院”的时候很难搜到正确的预案。信息搜索不全面是指只有找到相应的预案才能进一步找到相应的位基本信息、灾情设定、力量调集、组织指挥、社会联动、勤务保障等信息,可定位的信息量少、不全面。
(2)缺少智能分类能力
在应急救援的过程中预案会为前期的应急处置提供重要的帮助。根据现场条件推荐相关的消防预案是一种提高应急救援效率方案。例如:某生产烯烃类化工产品的厂区发生消防事故,该区域没有制作相关的消防预案,如果有类似的烯烃类化工厂区预案提供参考也能作为一种辅助决策支撑。但是当前的预案***还没有智能分类的能力,没有将海量预案信息做成管理度高的簇群组。
发明内容
本发明创造提供一种基于深度学习的消防预案分类方法,解决了现有技术中存在查询准确度不高、缺少智能分类能力的问题。
为了实现上述目的,本发明创造采用了如下技术方案:
一种基于深度学习的消防预案分类方法,其特征在于,其步骤为:
1)消防预案记录分词:
1.1)在中文通用字典中增加专业词汇;
1.2)采用顺序细粒度分词算法结合中文词库对预案文本进行初步分词;
1.3)采用分词穷举法,对初步分词后得到的文本中可能存在歧义分词的句子,列举出所有可能的备选分词方案;
1.4)对于可能存在异议的句子,通过关键词汇加权、切分概率统计原则,计算各个备选方案的得分,选定高得分的方案作为分词结果;
2)消防预案要素关键词提取:
2.1)采用统计特征和主题模型的无监督文本关键词提取技术,进行消防预案文本关键词提取;
2.2)通过消防预案专业词汇库量化分词权重和切分概率统计,算得每个词对应的权重值;
2.3)通过关键词权值权值排名,最终获取个N权值最高的词,作为对应消防预案的关键词,得到由N个关键词及其对应的权值组成的向量组;
3)深度学习下消防预案智能分类:
3.1)将每个预案步骤2.3)中得到的向量组作为一级相关属性作为输入,经过卷积运算得到向量值;
3.2)对于给定的X个消防预案文本的数据集,给定聚类(簇)的个数K(K<X),初始化每个样本所属的类别,通过卷积K-means算法不断地迭代并重新划分数据集的类别,最终将X个消防预案文本分为K个类。
所述的步骤1.3)中,当句子存在有多个初步的分词结果的情况,即认定为是可能存在歧义分词的文本。
所述的步骤1.4)中,计算方法为:
关键词权值=关键词库内的权值+出现频率;其中关键词库内的权值为人为赋值,出现频率=关键字在文本中出现的频率/所有词汇在文本中出现的次数总和。
本发明创造的有益效果:
本发明创造通过上述方法,利用大数据、深度学习和人工智能等新一代信息技术设计一种基于深度学习的消防预案分类方法,着重解决消防预案查询精度不高、缺少智能分类能力的问题。通过种基于深度学习的消防预案分类方法,实现预案信息的有效分析和管理,战时能够达到处置方案的快速获取与发布,具有直观生动、实时查询、快速发布、动态分析、辅助决策等特点,实现灭火救援行动的科学性和效率极大提高。
附图说明
图1为一种基于深度学习的消防预案分类方法总体设计图。
具体实施方式
下面将结合本发明创造实施例中的附图,对本发明创造实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明创造一部分实施例,而不是全部的实施例。
实施例1:现在输入100个消防预案文本,设定类别数量为5,就是讲100个消防预案文本分成5类。通过文本分词、关键词向量提取、卷积处理得到100个输入向量作为K-means算法的输入,K-means算法迭代处理后将100个消防预案文本自动分成5类。具体方法为:
1)消防预案记录分词:
1.1)在中文通用字典中增加专业词汇。如增加“建筑情况、占地面积、建筑面积、消防设施、室内消火栓”等消防预案专用词汇,增加“汽油、柴油、烯烃类”等危化品专用词汇,增加“内浮顶罐、外浮顶罐、烷基化装置”等化工处置设备专业词汇,提高消防预案分词精度。
1.2)采用顺序细粒度分词算法结合中文词库对预案文本进行初步分词。
1.3)采用分词穷举法,对初步分词后得到的文本中可能存在歧义分词的句子,列举出所有可能的备选分词方案。当句子存在有多个初步的分词结果的情况,即认定为是可能存在歧义分词的文本。比如:消防水池可能会分为分成“消防”和“水池”两个词或“消防水池”一个词;“中国人民银行”可能会分成“中国”“人民”“银行”三个词或“中国人民银行”一个词。
1.4)对于可能存在异议的句子,通过关键词汇加权、切分概率统计原则,计算各个备选方案的得分,选定高得分的方案作为分词结果。具体的,关键词权值=关键词库内的权值+出现频率。其中关键词库内的权值为人为赋值,出现频率=词条(关键字)在文本中出现的频率/所有词汇在文本中出现的次数总和。例如“水泵接合器”赋值0.5,“的”赋值-0.5。显然,在本发明中相对于“消防”和“水池”的分词情况,“消防水池”分词更为准确,因此在设定赋值时,“消防水池”的设定赋值大于“消防”+“水池”的赋值。通过赋值的设定,可以筛选出最准确的分词结果。
2)消防预案要素关键词提取:
2.1)采用统计特征和主题模型的无监督文本关键词提取技术,进行消防预案文本关键词提取。
2.2)通过消防预案专业词汇库量化分词权重和切分概率统计,算得每个词对应的权重值。
2.3)通过关键词权值权值排名,最终获取个N权值最高的词,作为对应消防预案的关键词,得到由N个关键词及其对应的权值组成的向量组。一般的,N=100,也可以通过具体情况设定每个向量组中包括的关键词个数。
3)深度学习下消防预案智能分类:
3.1)将每个预案步骤2.3)中得到的向量组作为一级相关属性作为输入,经过卷积运算得到向量值。具体的,也可以在关键词中选取前M个词汇和其关键词权值作为一级相关属性作为输入,M可为64,也可以具体情况选取。
3.2)对于给定的100个消防预案文本的数据集,给定聚类(簇)的个数5,初始化每个样本所属的类别,通过卷积K-means算法不断地迭代并重新划分数据集的类别,最终将100个消防预案文本分为5个类。
Claims (3)
1.一种基于深度学习的消防预案分类方法,其特征在于,其步骤为:
1)消防预案记录分词:
1.1)在中文通用字典中增加专业词汇;
1.2)采用顺序细粒度分词算法结合中文词库对预案文本进行初步分词;
1.3)采用分词穷举法,对初步分词后得到的文本中可能存在歧义分词的句子,列举出所有可能的备选分词方案;
1.4)对于可能存在异议的句子,通过关键词汇加权、切分概率统计原则,计算各个备选方案的得分,选定高得分的方案作为分词结果;
2)消防预案要素关键词提取:
2.1)采用统计特征和主题模型的无监督文本关键词提取技术,进行消防预案文本关键词提取;
2.2)通过消防预案专业词汇库量化分词权重和切分概率统计,算得每个词对应的权重值;
2.3)通过关键词权值权值排名,最终获取个N权值最高的词,作为对应消防预案的关键词,得到由N个关键词及其对应的权值组成的向量组;
3)深度学习下消防预案智能分类:
3.1)将每个预案步骤2.3)中得到的向量组作为一级相关属性作为输入,经过卷积运算得到向量值;
3.2)对于给定的X个消防预案文本的数据集,给定聚类(簇)的个数K(K<X),初始化每个样本所属的类别,通过卷积K-means算法不断地迭代并重新划分数据集的类别,最终将X个消防预案文本分为K个类。
2.根据权利要求1所述的一种基于深度学习的消防预案分类方法,其特征在于:所述的步骤1.3)中,当句子存在有多个初步的分词结果的情况,即认定为是可能存在歧义分词的文本。
3.根据权利要求1所述的一种基于深度学习的消防预案分类方法,其特征在于:所述的步骤1.4)中,计算方法为:
关键词权值=关键词库内的权值+出现频率;其中关键词库内的权值为人为赋值,出现频率=关键字在文本中出现的频率/所有词汇在文本中出现的次数总和。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010903655.5A CN112069814A (zh) | 2020-09-01 | 2020-09-01 | 一种基于深度学习的消防预案分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010903655.5A CN112069814A (zh) | 2020-09-01 | 2020-09-01 | 一种基于深度学习的消防预案分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112069814A true CN112069814A (zh) | 2020-12-11 |
Family
ID=73666266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010903655.5A Pending CN112069814A (zh) | 2020-09-01 | 2020-09-01 | 一种基于深度学习的消防预案分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112069814A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101183457A (zh) * | 2007-12-17 | 2008-05-21 | 北京航空航天大学 | 一种警务指挥预案的智能管理和自动实施*** |
CN103034926A (zh) * | 2012-12-07 | 2013-04-10 | 北京三博中自科技有限公司 | 一种事故应急信息化管理方法及*** |
CN106202561A (zh) * | 2016-07-29 | 2016-12-07 | 北京联创众升科技有限公司 | 基于文本大数据的数字化应急管理案例库构建方法及装置 |
CN107562814A (zh) * | 2017-08-14 | 2018-01-09 | 中国农业大学 | 一种地震应急和灾情信息获取分类方法及*** |
WO2018028077A1 (zh) * | 2016-08-11 | 2018-02-15 | 中兴通讯股份有限公司 | 一种基于深度学习的中文语义分析的方法及装置 |
-
2020
- 2020-09-01 CN CN202010903655.5A patent/CN112069814A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101183457A (zh) * | 2007-12-17 | 2008-05-21 | 北京航空航天大学 | 一种警务指挥预案的智能管理和自动实施*** |
CN103034926A (zh) * | 2012-12-07 | 2013-04-10 | 北京三博中自科技有限公司 | 一种事故应急信息化管理方法及*** |
CN106202561A (zh) * | 2016-07-29 | 2016-12-07 | 北京联创众升科技有限公司 | 基于文本大数据的数字化应急管理案例库构建方法及装置 |
WO2018028077A1 (zh) * | 2016-08-11 | 2018-02-15 | 中兴通讯股份有限公司 | 一种基于深度学习的中文语义分析的方法及装置 |
CN107562814A (zh) * | 2017-08-14 | 2018-01-09 | 中国农业大学 | 一种地震应急和灾情信息获取分类方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107239446B (zh) | 一种基于神经网络与注意力机制的情报关系提取方法 | |
CN112559556B (zh) | 表格模式解析和序列掩码的语言模型预训练方法及*** | |
Zou et al. | Retrieving similar cases for construction project risk management using Natural Language Processing techniques | |
CN112148832B (zh) | 一种基于标签感知的双重自注意力网络的事件检测方法 | |
CN110781670B (zh) | 基于百科知识库和词向量的中文地名语义消歧方法 | |
JP5907393B2 (ja) | 複雑述語テンプレート収集装置、及びそのためのコンピュータプログラム | |
CN108681574A (zh) | 一种基于文本摘要的非事实类问答答案选择方法及*** | |
CN111783428A (zh) | 基于深度学习的应急管理类客观题自动生成*** | |
CN113553412A (zh) | 问答处理方法、装置、电子设备和存储介质 | |
CN111475650A (zh) | 一种俄语语义角色标注方法、***、装置以及存储介质 | |
CN112148886A (zh) | 一种内容知识图谱的构建方法及*** | |
CN116561274A (zh) | 一种基于数字人技术与自然语言大模型的知识问答方法 | |
CN110347812A (zh) | 一种面向司法文本的搜索排序方法及*** | |
Tianxiong et al. | Identifying chinese event factuality with convolutional neural networks | |
CN109344233A (zh) | 一种中文人名识别方法 | |
CN115795018B (zh) | 一种面向电网领域的多策略智能搜索问答方法及*** | |
CN112069814A (zh) | 一种基于深度学习的消防预案分类方法 | |
CN116431746A (zh) | 基于编码库的地址映射方法、装置、电子设备及存储介质 | |
CN110888944A (zh) | 基于多卷积窗尺寸注意力卷积神经网络实体关系抽取方法 | |
CN115730078A (zh) | 用于类案检索的事件知识图谱构建方法、装置及电子设备 | |
CN111160786B (zh) | 基于本体的建筑物地震风险性评估方法 | |
CN114969087A (zh) | 基于多视角特征解耦的nl2sql方法和装置 | |
Lv et al. | Automatic key-phrase extraction to support the understanding of infrastructure disaster resilience | |
CN109299456A (zh) | 一种地名识别方法 | |
Sholikah et al. | Semantic Relation Detection based on Multi-task Learning and Cross-Lingual-View Embedding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |