CN115249133A - 一种基于宽度学习网络的建筑施工过程风险分类方法 - Google Patents

一种基于宽度学习网络的建筑施工过程风险分类方法 Download PDF

Info

Publication number
CN115249133A
CN115249133A CN202211158599.2A CN202211158599A CN115249133A CN 115249133 A CN115249133 A CN 115249133A CN 202211158599 A CN202211158599 A CN 202211158599A CN 115249133 A CN115249133 A CN 115249133A
Authority
CN
China
Prior art keywords
feature
layer
node
characteristic
node group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211158599.2A
Other languages
English (en)
Other versions
CN115249133B (zh
Inventor
刘发贵
吴鑫杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202211158599.2A priority Critical patent/CN115249133B/zh
Publication of CN115249133A publication Critical patent/CN115249133A/zh
Application granted granted Critical
Publication of CN115249133B publication Critical patent/CN115249133B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Development Economics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Operations Research (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于宽度学习网络的建筑施工过程风险分类方法。所述方法包括以下步骤:建立关键词到词向量的转化模型;构建宽度特征提取模块;构建特征节点组切片并定义切片运算过程;使用集成层对多个切片运算结果进行校正和统合;进行建筑施工过程风险分类。本发明用以解决现有机器学习算法依赖专家经验,需要大量人工设计工作,亦或是深度算法耗时的训练阶段等问题,本发明方法能够运行在普通的CPU边缘设备上。

Description

一种基于宽度学习网络的建筑施工过程风险分类方法
技术领域
本发明属于计算机应用技术领域,具体涉及一种快速训练的建筑工地风险分析方法。
背景技术
建筑行业作为我国的支柱产业之一,对我国经济发展起到至关重要的作用。然而,建筑工程的安全问题至今仍是一个具有挑战性的问题。我国在过去的二十多年间,在建筑工程领域的的工人伤亡率是其他领域平均值的三到四倍。据房屋安全市政工程安全事故类型的分析统计数据,建筑工人伤亡率居高不下的五种事故类型分别为高处坠落、坍塌、物体打击、机械伤害、触电等。施工方忽视工人安全教育,施工现场管理混乱,工人安全意识疏忽,有关部门疏于安全监督等均是导致安全事故发生的原因。事故的发生不仅仅造成了巨大的经济损失,更对伤亡工人本人及家属造成了难以逆转的生理和心理伤害。
在工地事故发生之后,会有专业的人员记录下事故发生的过程,整理成事故报告。这些报告为研究建筑工地安全问题提供了数据来源。通过分析这些事故报告,给可能发生的风险进行分类预测,可以给建筑施工方敲响预警,有效预防类似事故的发生。在事故报告中,事故的类型多种多样,事故发生的现场也复杂多变,这使得建模工作变得复杂。在目前的研究中,一种基于复杂网络的房屋建筑施工风险评价方法(CN113505997A)的文献提出了一种提炼属性参数,并使用ABC统计分类的方法,但该方法依赖专家经验对属性进行评估。一种基于机器学习的建筑墙面渗漏水风险登记评估方法(CN113505997A)的文献提出一种使用k折交叉验证的风险评估方法,但模型需要人工设计特征提取的过程,耗费人力。基于深度循环神经网络的事故信息自动提取方法及***(CN111651995A)的文献提出了使用的双向长短期记忆深度神经网络对事故报告中的信息进行处理,但深度网络需要提前进行迭代训练,耗费大量时间和算力。因此,提出一种自动化提取特征,并且能快速训练的模型对建筑风险分析具有较高的实用价值。
发明内容
目前在建筑工地风险分析领域中已有的模型和算法普遍存在一些问题。目前已有的的风险分析方法要么采用机器学习的方法,要么采用深度网络的结构来提取事故报告中的特征。前者需要依赖专家经验,并投入大量的人力进行特征提取。后者虽然不需要人工提取特征,而是使用神经网络进行自动提取,但神经网络需要经过耗时的训练阶段,且严重依赖算力设备。因此,针对现有技术的不足,本发明提供一种能自动提取文本中的特征,且能够快速完成训练阶段的建筑工地算法,该算法减轻了模型对建筑领域专家经验的依赖,且轻度依赖算力设备,极其适合运用在一些边缘设备端。
本发明的目的至少通过如下技术方案之一实现。
一种基于宽度学习网络的建筑施工过程风险分类方法,包括以下步骤:
S1:建立关键词到词向量的转化模型;
S2:构建宽度特征提取模块;
S3:构建特征节点组切片并定义切片运算过程;
S4:使用集成层对多个切片运算结果进行校正和统合;
S5:进行建筑施工过程风险分类。
进一步地,步骤S1中,关键词包括多个建筑工地的属性,建筑工地的属性包括建筑工地的现场环境条件、工人的操作手法和其它的人为因素;通过有限个建筑工地的属性,表示各种各样的建筑工地情况,暗示即将出现的伤害和风险,因此建筑工地的属性被称之为伤害前兆;
采用word2vect构建关键词到词向量的转化模型,word2vect属于监督学习,转化 模型包括输入层,隐藏层和输出层;每个关键词在词典中都会有自己的编号以及对应的 one-hot向量,one-hot向量作为输入层的输入;输入层与一个第一矩阵
Figure 456108DEST_PATH_IMAGE001
相乘得到隐藏 层,隐藏层继而跟一个第二矩阵
Figure 43951DEST_PATH_IMAGE002
相乘得到输出层;目标函数旨在拉近输入层和输出层 之间的距离,使两者尽可能相近;转化模型将输入的one-hot向量乘第一矩阵
Figure 530558DEST_PATH_IMAGE001
的结果作 为关键词的词向量,第一矩阵
Figure 195370DEST_PATH_IMAGE001
的每一列都是训练好的词向量;通过已有的文本数据对转 化模型进行训练,得到训练完成的转化模型,进而获得各个关键词所对应的词向量。
进一步地,步骤S2中,采用扁平的宽度结构构建宽度特征提取模块,旨在提取出关键词中包括的重要特征以及关键词间的复杂联系;宽度特征提取模块以关键词转化的词向量作为输入,宽度特征提取模块的构建过程包括以下步骤:
S2.1、定义宽度特征提取模块的数据输入格式,定义单个样本数据为只包括关键词的文本,宽度特征提取模块的输入规格将受样本数量,样本长度影响,具体如下:
对于一组训练的数据
Figure 349402DEST_PATH_IMAGE003
Figure 830849DEST_PATH_IMAGE004
Figure 70331DEST_PATH_IMAGE005
表示样本数量,
Figure 23988DEST_PATH_IMAGE006
表示第i个样本 数据,包括多个反映建筑工地情景的关键词;
Figure 32526DEST_PATH_IMAGE007
表示第i个样本数据的样本标签;
Figure 931212DEST_PATH_IMAGE008
表示 输入到宽度特征提取模块的样本数据,
Figure 118043DEST_PATH_IMAGE009
Figure 65270DEST_PATH_IMAGE010
Figure 863069DEST_PATH_IMAGE011
表示域,
Figure 401497DEST_PATH_IMAGE012
表示一 个样本数据中关键词的最大数量,
Figure 818835DEST_PATH_IMAGE013
表示词向量的大小;
Figure 838262DEST_PATH_IMAGE014
Figure 290234DEST_PATH_IMAGE015
Figure 999564DEST_PATH_IMAGE016
表示 样本数据的输出矩阵,又称为目标空间,
Figure 635688DEST_PATH_IMAGE017
表示标签类别;在建筑工地风险分析场景中,
Figure 924718DEST_PATH_IMAGE017
代表着建筑工地施工情景的风险等级,包括物体打击、机械伤害、触电、高处坠落和坍塌;
S2.2、构建宽度特征提取模块的特征层,具体如下:
通过将词向量一一映射到新的子空间的形式,来获取单个关键词的特征表示;子空间由小到大分别为特征节点、特征节点组和特征层;其中,特征层只有一个且包括多个特征节点组,每个特征节点组包括多个特征节点;
定义特征层为
Figure 245845DEST_PATH_IMAGE018
Figure 126077DEST_PATH_IMAGE019
M表示特征节点组的数量;单 个特征节点组与特征节点的关系表示为
Figure 986848DEST_PATH_IMAGE020
Figure 607797DEST_PATH_IMAGE021
Figure 503203DEST_PATH_IMAGE022
表示第m个特征节点 组,
Figure 85494DEST_PATH_IMAGE023
表示第m个特征节点组中第j个特征节点,J为每个特征节点组内特征节点的数量; 第m个特征节点组中第j个特征节点表示为
Figure 639753DEST_PATH_IMAGE024
Figure 815126DEST_PATH_IMAGE025
Figure 830618DEST_PATH_IMAGE026
分别为随 机生成的第m个特征节点组中第j个特征节点的权重和偏置,X m X对应的第m列数据,特征 节点组和X的列维度是一一对应的;
Figure 318231DEST_PATH_IMAGE027
为第一激活函数,第一激活函数采用tanh;
S2.3、构建宽度特征提取模块的全局增强层,具体如下:
在已获得的宽度特征提取模块的特征层的基础上,构造第一随机矩阵
Figure 941543DEST_PATH_IMAGE028
和第二 随机矩阵
Figure 720274DEST_PATH_IMAGE029
参与计算,得到具有全局信息的增强节点
Figure 649660DEST_PATH_IMAGE030
Figure 590065DEST_PATH_IMAGE031
为第二 激活函数,第二激活函数
Figure 56599DEST_PATH_IMAGE031
采用sigmod函数;全局增强层
Figure 901671DEST_PATH_IMAGE032
表示为多个特征节点合并,即
Figure 954072DEST_PATH_IMAGE033
;其中,
Figure 814448DEST_PATH_IMAGE034
表示第
Figure 670408DEST_PATH_IMAGE035
个增强节点,由特征层
Figure 525363DEST_PATH_IMAGE036
、第一随机矩阵
Figure 898182DEST_PATH_IMAGE037
和第二随机矩阵
Figure 711548DEST_PATH_IMAGE038
计算得到。
进一步地,步骤S3中,所述特征节点组切片,通过将大尺寸的矩阵分成多个小矩阵,达到减少计算复杂度,加快计算速度的作用;构建特征节点组切片包括以下步骤:
S3.1、定义特征节点选择策略,具体如下:
在特征层的所有特征节点组中,通过特征节点选择策略选取部分特征节点,即进 行特征节点选择;定义在第
Figure 74046DEST_PATH_IMAGE039
轮特征节点选择中,每个特征节点组激活的特征节点的数量 为
Figure 277232DEST_PATH_IMAGE040
;定义每个特征节点都具有一个置信值,在第m个特征节点组的第
Figure 569804DEST_PATH_IMAGE039
轮特征节点选择 中,第
Figure 545283DEST_PATH_IMAGE041
个特征节点
Figure 657727DEST_PATH_IMAGE042
的置信值
Figure 195762DEST_PATH_IMAGE043
的计算公式为:
Figure 811682DEST_PATH_IMAGE044
(1)
Figure 766518DEST_PATH_IMAGE045
表示到第
Figure 707536DEST_PATH_IMAGE046
轮特征节点选择为止第
Figure 52192DEST_PATH_IMAGE047
个特征节点被选中参与计算的次数;第
Figure 677664DEST_PATH_IMAGE047
个特征节点在第
Figure 3734DEST_PATH_IMAGE046
轮中被选中的概率
Figure 369731DEST_PATH_IMAGE048
为:
Figure 973537DEST_PATH_IMAGE049
(2)
定义概率
Figure 501733DEST_PATH_IMAGE050
,以
Figure 654497DEST_PATH_IMAGE051
为概率在
Figure 898003DEST_PATH_IMAGE052
个特征节点中选择
Figure 161625DEST_PATH_IMAGE053
个特征 节点;若出现同一特征节点被多次选中,则抛弃最后一次的选择结果并重新选择,直至不出 现重复选择的特征节点;定义二值矩阵
Figure 793595DEST_PATH_IMAGE054
描述第
Figure 593624DEST_PATH_IMAGE055
轮特征节点选择,
Figure 45465DEST_PATH_IMAGE056
Figure 847199DEST_PATH_IMAGE057
为二 值矩阵
Figure 612636DEST_PATH_IMAGE058
中第
Figure 107202DEST_PATH_IMAGE059
行第
Figure 780760DEST_PATH_IMAGE060
列的元素;如果
Figure 936585DEST_PATH_IMAGE061
为1,则代表第
Figure 215251DEST_PATH_IMAGE059
个特征节点组的第
Figure 349560DEST_PATH_IMAGE060
个特征节 点被激活;如果
Figure 976326DEST_PATH_IMAGE061
为0,则代表第个特征节点组的第
Figure 588704DEST_PATH_IMAGE060
个特征节点不参与计算;
则经过
Figure 456297DEST_PATH_IMAGE062
轮特征节点选择后,得到记录切片中已激活的特征节点信息的矩阵集
Figure 761507DEST_PATH_IMAGE063
,其中,
Figure 627568DEST_PATH_IMAGE064
为第
Figure 778058DEST_PATH_IMAGE062
轮特征节点选择得到的二值矩阵;特征节点组切片集 表示为
Figure 31316DEST_PATH_IMAGE065
,其中,
Figure 773007DEST_PATH_IMAGE066
表示以二值矩阵
Figure 843207DEST_PATH_IMAGE067
对特征层
Figure 781076DEST_PATH_IMAGE068
进行筛选所 得到的特征节点组切片;特征节点组切片集
Figure 154419DEST_PATH_IMAGE069
中的每个元素为多个选中的特征节点拼接 而成的矩阵;
S3.2、构造切片运算输入层,具体如下:
构造包括有局部特征层信息以及全局增强层信息的切片运算输入层,对每个表示 了一部分特征层的特征节点组切片
Figure 270274DEST_PATH_IMAGE070
和建立在所有特征节点组基础上映射得到的全局 增强层
Figure 565120DEST_PATH_IMAGE071
,切片运算输入层表示为
Figure 794763DEST_PATH_IMAGE072
S3.3、进行切片运算,具体如下:
对于特征节点组切片
Figure 757034DEST_PATH_IMAGE070
的切片运算输入层
Figure 558637DEST_PATH_IMAGE073
,通过一个第一权重
Figure 340779DEST_PATH_IMAGE074
映射到 目标空间
Figure 371183DEST_PATH_IMAGE075
;定义优化函数为:
Figure 716189DEST_PATH_IMAGE076
(3)
其中,
Figure 908267DEST_PATH_IMAGE077
为第一权重
Figure 161394DEST_PATH_IMAGE078
平方的约束;增大
Figure 995489DEST_PATH_IMAGE077
可以改善优化函数在优化过程中的 过拟合问题;通过岭回归得到第一权重
Figure 401194DEST_PATH_IMAGE078
的计算公式:
Figure 286543DEST_PATH_IMAGE079
(4)
其中I是单位矩阵,特征节点组切片
Figure 26965DEST_PATH_IMAGE080
对应的切片运算的结果
Figure 399172DEST_PATH_IMAGE081
表示为:
Figure 659383DEST_PATH_IMAGE082
(5)
对于
Figure 458843DEST_PATH_IMAGE083
个特征节点组切片得到一组切片输出结果
Figure 952141DEST_PATH_IMAGE084
以 及对应的第一权重集
Figure 125109DEST_PATH_IMAGE085
进一步地,步骤S4中,对于特征节点组切片
Figure 646352DEST_PATH_IMAGE086
对应的切片运算的结果
Figure 616713DEST_PATH_IMAGE087
Figure 882128DEST_PATH_IMAGE088
,将切片运算的结果
Figure 330558DEST_PATH_IMAGE089
映射到一个子网络空间
Figure 80208DEST_PATH_IMAGE090
Figure 955891DEST_PATH_IMAGE091
是一个径向基函数,
Figure 174514DEST_PATH_IMAGE092
Figure 220443DEST_PATH_IMAGE093
采用稀疏自编码器生成;将所 有特征节点组切片对应的切片运算的结果映射得到的多个子网络空间进行合并,得到了
Figure 575332DEST_PATH_IMAGE094
;定义第二权重
Figure 153075DEST_PATH_IMAGE095
,使得
Figure 842682DEST_PATH_IMAGE096
Y表示目标空间;
Figure 632915DEST_PATH_IMAGE097
通 过以下公式计算得到:
Figure 122538DEST_PATH_IMAGE098
。 (6)
进一步地,步骤S5中,进行建筑施工过程风险分类过程具体如下:
S5.1、获取包括建筑工地的现场环境条件、工人的操作手法和各种人为因素的文 本
Figure 402341DEST_PATH_IMAGE099
,将文本
Figure 595556DEST_PATH_IMAGE099
输入步骤S1中构建的关键词到词向量的转化模型,得到文本
Figure 189479DEST_PATH_IMAGE099
对 应的词向量;
S5.2、将文本
Figure 502649DEST_PATH_IMAGE099
对应的词向量输入步骤S2中构建的宽度特征提取模块,分别得 到文本
Figure 419265DEST_PATH_IMAGE099
对应的特征层
Figure 834197DEST_PATH_IMAGE100
和全局增强层
Figure 497391DEST_PATH_IMAGE101
S5.3、采用二值矩阵集
Figure 478116DEST_PATH_IMAGE102
,根据特征层
Figure 102651DEST_PATH_IMAGE103
构造S个推理切 片运算输入层
Figure 536038DEST_PATH_IMAGE104
,采用第一权重集
Figure 534081DEST_PATH_IMAGE105
和全局增强层
Figure 369312DEST_PATH_IMAGE106
对得到 的S个推理切片运算输入层
Figure 440780DEST_PATH_IMAGE104
进行切片运算,得到推理的切片输出结果
Figure 892621DEST_PATH_IMAGE107
S5.4、采用步骤S4中生成的权重
Figure 428776DEST_PATH_IMAGE108
和偏置
Figure 109725DEST_PATH_IMAGE109
将切片运算的结果
Figure 73133DEST_PATH_IMAGE110
映射到 切片子空间
Figure 763003DEST_PATH_IMAGE111
,采用第二权重
Figure 834340DEST_PATH_IMAGE112
得到文本
Figure 909743DEST_PATH_IMAGE113
对应的推理结 果即目标空间
Figure 575211DEST_PATH_IMAGE114
,其中,
Figure 673748DEST_PATH_IMAGE115
代表描述建筑施工过程的文本 数据
Figure 820214DEST_PATH_IMAGE113
的风险分类结果。
与现有技术相比,本发明具有如下的优点与技术效果:
1、在建立特征提取模型中,将词向量与特征节点组一一映射,使得关键词被多角度地丰富表示。在此基础上,生成全局增强层,用以学习关键词间的联系。特征提取流程不需要复杂的人工设计,更加省时省力。
2、在构建特征节点组切片中,考虑选取特征节点组中的部分节点与全局增强层组合成切片进行运算,且使用伪逆方法进行模型学习,使得训练过程一步到位,快速高效。
3、本发明可以运用在普通的CPU边缘计算设备中,不需要依赖GPU便能进行部署。
附图说明
图1为本发明实施例中一种基于宽度学习网络的建筑施工过程风险分类方法的流程示意图。
图2 为本发明实施例中的模块结构示意图。
图3为本发明实施中去除特征节点组切片模块的模型的示意图。
图4 为本发明实施中去除全局增强层模块的模型的示意图。
图5 为本发明实施中完整的模型的示意图。
具体实施方式
为了使本发明的技术方案及优点更加清楚明白,以下结合附图,进行进一步的详细说明,但本发明的实施和保护不限于此。
实施例1:
一种基于宽度学习网络的建筑施工过程风险分类方法,如图1、图2和图5所示,包括以下步骤:
S1:建立关键词到词向量的转化模型;
关键词包括多个建筑工地的属性,建筑工地的属性包括建筑工地的现场环境条件、工人的操作手法和其它的人为因素;通过有限个建筑工地的属性,表示各种各样的建筑工地情况,暗示即将出现的伤害和风险,因此建筑工地的属性被称之为伤害前兆;
采用word2vect构建关键词到词向量的转化模型,word2vect属于监督学习,转化 模型包括输入层,隐藏层和输出层;每个关键词在词典中都会有自己的编号以及对应的 one-hot向量,one-hot向量作为输入层的输入;输入层与一个第一矩阵
Figure 953386DEST_PATH_IMAGE116
相乘得到隐藏 层,隐藏层继而跟一个第二矩阵
Figure 461859DEST_PATH_IMAGE117
相乘得到输出层;目标函数旨在拉近输入层和输出层 之间的距离,使两者尽可能相近;转化模型将输入的one-hot向量乘第一矩阵
Figure 578851DEST_PATH_IMAGE116
的结果作 为关键词的词向量,第一矩阵
Figure 726411DEST_PATH_IMAGE116
的每一列都是训练好的词向量;通过已有的文本数据对 转化模型进行训练,得到训练完成的转化模型,进而获得各个关键词所对应的词向量。
S2:构建宽度特征提取模块;
采用扁平的宽度结构构建宽度特征提取模块,旨在提取出关键词中包括的重要特征以及关键词间的复杂联系;宽度特征提取模块以关键词转化的词向量作为输入,宽度特征提取模块的构建过程包括以下步骤:
S2.1、定义宽度特征提取模块的数据输入格式,定义单个样本数据为只包括关键词的文本,宽度特征提取模块的输入规格将受样本数量,样本长度影响,具体如下:
对于一组训练的数据
Figure 714090DEST_PATH_IMAGE118
Figure 173890DEST_PATH_IMAGE119
Figure 247019DEST_PATH_IMAGE120
表示样本数量,
Figure 466779DEST_PATH_IMAGE121
表示第i个样 本数据,包括多个反映建筑工地情景的关键词;
Figure 58033DEST_PATH_IMAGE122
表示第i个样本数据的样本标签;
Figure 439467DEST_PATH_IMAGE123
表 示输入到宽度特征提取模块的样本数据,
Figure 265472DEST_PATH_IMAGE124
Figure 492185DEST_PATH_IMAGE125
Figure 438144DEST_PATH_IMAGE126
表示一个样本 数据中关键词的最大数量,
Figure 456391DEST_PATH_IMAGE127
表示词向量的大小;
Figure 238534DEST_PATH_IMAGE128
Figure 800096DEST_PATH_IMAGE129
Figure 351294DEST_PATH_IMAGE130
表示样本 数据的输出矩阵,又称为目标空间,
Figure 58219DEST_PATH_IMAGE131
表示标签类别;在建筑工地风险分析场景中,
Figure 330587DEST_PATH_IMAGE131
代 表着建筑工地施工情景的风险等级,包括物体打击、机械伤害、触电、高处坠落和坍塌;
S2.2、构建宽度特征提取模块的特征层,具体如下:
通过将词向量一一映射到新的子空间的形式,来获取单个关键词的特征表示;子空间由小到大分别为特征节点、特征节点组和特征层;其中,特征层只有一个且包括多个特征节点组,每个特征节点组包括多个特征节点;
定义特征层为
Figure 633524DEST_PATH_IMAGE132
Figure 554075DEST_PATH_IMAGE133
M表示特征节点组的数 量;单个特征节点组与特征节点的关系表示为
Figure 917055DEST_PATH_IMAGE134
Figure 673789DEST_PATH_IMAGE135
Figure 777487DEST_PATH_IMAGE136
表示第m个 特征节点组,
Figure 286966DEST_PATH_IMAGE137
表示第m个特征节点组中第j个特征节点,
Figure 555267DEST_PATH_IMAGE138
为每个特征节点组内特征 节点的数量;第m个特征节点组中第
Figure 517407DEST_PATH_IMAGE139
个特征节点表示为
Figure 896567DEST_PATH_IMAGE140
Figure 994973DEST_PATH_IMAGE141
Figure 434176DEST_PATH_IMAGE142
分别为随机生成的第m个特征节点组中第j个特征节点的权重和偏置,
Figure 618032DEST_PATH_IMAGE143
为第一激 活函数,第一激活函数
Figure 792094DEST_PATH_IMAGE143
采用tanh;
S2.3、构建宽度特征提取模块的全局增强层,具体如下:
在已获得的宽度特征提取模块的特征层的基础上,构造第一随机矩阵
Figure 10586DEST_PATH_IMAGE144
和第二 随机矩阵
Figure 620690DEST_PATH_IMAGE145
参与计算,得到具有全局信息的增强节点
Figure 291843DEST_PATH_IMAGE146
Figure 12805DEST_PATH_IMAGE147
为 第二激活函数,第二激活函数
Figure 85803DEST_PATH_IMAGE147
采用sigmod函数;全局增强层
Figure 866809DEST_PATH_IMAGE148
表示为多个特征节点合 并,即
Figure 25257DEST_PATH_IMAGE149
;其中,
Figure 281402DEST_PATH_IMAGE150
表示第
Figure 474486DEST_PATH_IMAGE151
个增强节点,由特征层
Figure 426392DEST_PATH_IMAGE152
、第一随机 矩阵
Figure 806558DEST_PATH_IMAGE153
和第二随机矩阵
Figure 134902DEST_PATH_IMAGE154
计算得到。
S3:构建特征节点组切片并定义切片运算过程;
所述特征节点组切片,通过将大尺寸的矩阵分成多个小矩阵,达到减少计算复杂度,加快计算速度的作用;构建特征节点组切片包括以下步骤:
S3.1、定义特征节点选择策略,具体如下:
在特征层的所有特征节点组中,通过特征节点选择策略选取部分特征节点,即进 行特征节点选择;定义在第
Figure 448072DEST_PATH_IMAGE155
轮特征节点选择中,每个特征节点组激活的特征节点的数量 为
Figure 305301DEST_PATH_IMAGE156
;定义每个特征节点都具有一个置信值,在第m个特征节点组的第
Figure 438342DEST_PATH_IMAGE155
轮特征节点选择 中,第
Figure 42148DEST_PATH_IMAGE157
个特征节点
Figure 678666DEST_PATH_IMAGE158
的置信值
Figure 221643DEST_PATH_IMAGE159
的计算公式为:
Figure 858292DEST_PATH_IMAGE160
(1)
Figure 246548DEST_PATH_IMAGE161
表示到第
Figure 19463DEST_PATH_IMAGE162
轮特征节点选择为止第
Figure 749653DEST_PATH_IMAGE163
个特征节点被选中参与计算的次数; 第
Figure 326127DEST_PATH_IMAGE163
个特征节点在第
Figure 518074DEST_PATH_IMAGE162
轮中被选中的概率
Figure 142566DEST_PATH_IMAGE164
为:
Figure 27346DEST_PATH_IMAGE165
(2)
定义概率
Figure 107428DEST_PATH_IMAGE166
,以
Figure 368645DEST_PATH_IMAGE167
为概率在
Figure 116152DEST_PATH_IMAGE168
个特征节点中选择
Figure 171833DEST_PATH_IMAGE169
个特征节点;若出现同一特征节点被多次选中,则抛弃最后一次的选择结果并重新选择,直 至不出现重复选择的特征节点;定义二值矩阵
Figure 739212DEST_PATH_IMAGE170
描述第
Figure 804120DEST_PATH_IMAGE171
轮特征节点选择,
Figure 420782DEST_PATH_IMAGE172
Figure 663676DEST_PATH_IMAGE173
为二值矩阵
Figure 233197DEST_PATH_IMAGE170
中第
Figure 852529DEST_PATH_IMAGE174
行第
Figure 309049DEST_PATH_IMAGE175
列的元素;如果
Figure 237691DEST_PATH_IMAGE176
为1,则代表第
Figure 776732DEST_PATH_IMAGE174
个特征节点组的第
Figure 449022DEST_PATH_IMAGE175
个特征节点被激活;如果
Figure 228890DEST_PATH_IMAGE173
为0,则代表第
Figure 328433DEST_PATH_IMAGE174
个特征节点组的第
Figure 92121DEST_PATH_IMAGE175
个特征节点不参与计 算;
则经过
Figure 53255DEST_PATH_IMAGE171
轮特征节点选择后,得到记录切片中已激活的特征节点信息的矩阵集
Figure 468055DEST_PATH_IMAGE177
,其中,
Figure 226583DEST_PATH_IMAGE178
为第
Figure 992413DEST_PATH_IMAGE171
轮特征节点选择得到的二值矩阵;特征节点组切片 集表示为
Figure 491659DEST_PATH_IMAGE179
,其中,
Figure 292125DEST_PATH_IMAGE180
表示以二值矩阵
Figure 484203DEST_PATH_IMAGE178
对特征层
Figure 488062DEST_PATH_IMAGE181
进行筛 选所得到的特征节点组切片;特征节点组切片集
Figure 305845DEST_PATH_IMAGE182
中的每个元素为多个选中的特征节点 拼接而成的矩阵;
S3.2、构造切片运算输入层,具体如下:
构造包括有局部特征层信息以及全局增强层信息的切片运算输入层,对每个表示 了一部分特征层的特征节点组切片
Figure 974199DEST_PATH_IMAGE183
和建立在所有特征节点组基础上映射得到的全局 增强层
Figure 806020DEST_PATH_IMAGE184
,切片运算输入层表示为
Figure 546443DEST_PATH_IMAGE185
S3.3、进行切片运算,具体如下:
对于特征节点组切片
Figure 387491DEST_PATH_IMAGE183
的切片运算输入层
Figure 913282DEST_PATH_IMAGE186
,通过一个第一权重
Figure 430851DEST_PATH_IMAGE187
映射到 目标空间
Figure 134934DEST_PATH_IMAGE188
;定义优化函数为:
Figure 763361DEST_PATH_IMAGE189
(3)
其中,
Figure 878079DEST_PATH_IMAGE190
为第一权重
Figure 832129DEST_PATH_IMAGE191
平方的约束;增大
Figure 297876DEST_PATH_IMAGE190
可以改善优化函数在优化过程中的 过拟合问题;通过岭回归得到第一权重
Figure 480727DEST_PATH_IMAGE191
的计算公式:
Figure 964798DEST_PATH_IMAGE192
(4)
其中I是单位矩阵,特征节点组切片
Figure 103131DEST_PATH_IMAGE193
对应的切片运算的结果
Figure 321754DEST_PATH_IMAGE194
表示为:
Figure 557563DEST_PATH_IMAGE195
(5)
对于
Figure 646873DEST_PATH_IMAGE196
个特征节点组切片得到一组切片输出结果
Figure 959036DEST_PATH_IMAGE197
以 及对应的第一权重集
Figure 383065DEST_PATH_IMAGE198
S4:使用集成层对多个切片运算结果进行校正和统合;
对于特征节点组切片
Figure 707385DEST_PATH_IMAGE199
对应的切片运算的结果
Figure 385622DEST_PATH_IMAGE200
Figure 852376DEST_PATH_IMAGE201
,将切片 运算的结果
Figure 717695DEST_PATH_IMAGE202
映射到一个子网络空间
Figure 826465DEST_PATH_IMAGE203
Figure 93630DEST_PATH_IMAGE204
是一个径向基函 数,
Figure 731284DEST_PATH_IMAGE205
Figure 346549DEST_PATH_IMAGE206
采用稀疏自编码器生成;将所有特征节点组切片对应的切片运算的结果映 射得到的多个子网络空间进行合并,得到了
Figure 462272DEST_PATH_IMAGE207
;定义第二权重
Figure 115102DEST_PATH_IMAGE208
, 使得
Figure 923658DEST_PATH_IMAGE209
Y表示目标空间;
Figure 29148DEST_PATH_IMAGE210
通过以下公式计算得到:
Figure 948563DEST_PATH_IMAGE211
。 (6)
S5:进行建筑施工过程风险分类过程具体如下:
S5.1、获取包括建筑工地的现场环境条件、工人的操作手法和各种人为因素的文 本
Figure 455898DEST_PATH_IMAGE212
,将文本
Figure 169777DEST_PATH_IMAGE212
输入步骤S1中构建的关键词到词向量的转化模型,得到文本
Figure 777211DEST_PATH_IMAGE212
对应的词向量;
S5.2、将文本
Figure 969158DEST_PATH_IMAGE212
对应的词向量输入步骤S2中构建的宽度特征提取模块,分别 得到文本
Figure 331001DEST_PATH_IMAGE212
对应的特征层
Figure 950201DEST_PATH_IMAGE213
和全局增强层
Figure 279551DEST_PATH_IMAGE214
S5.3、采用二值矩阵集
Figure 291501DEST_PATH_IMAGE215
,根据特征层
Figure 22696DEST_PATH_IMAGE216
构造S个推理切 片运算输入层
Figure 829109DEST_PATH_IMAGE217
,采用第一权重集
Figure 659138DEST_PATH_IMAGE218
和全局增强层
Figure 458466DEST_PATH_IMAGE219
对得 到的S个推理切片运算输入层
Figure 794901DEST_PATH_IMAGE220
进行切片运算,得到推理的切片输出结果
Figure 21483DEST_PATH_IMAGE221
S5.4、采用步骤S4中生成的权重
Figure 341737DEST_PATH_IMAGE222
和偏置
Figure 679177DEST_PATH_IMAGE223
将切片运算的结果
Figure 135698DEST_PATH_IMAGE224
映射到 切片子空间
Figure 533181DEST_PATH_IMAGE225
,采用第二权重
Figure 78081DEST_PATH_IMAGE226
得到文本
Figure 219213DEST_PATH_IMAGE227
对应的推理 结果即目标空间
Figure 530240DEST_PATH_IMAGE228
,其中,
Figure 98624DEST_PATH_IMAGE229
代表描述建筑施工过程 的文本数据
Figure 111579DEST_PATH_IMAGE227
的风险分类结果。
本实施例中,当步骤S3.1中时间轮次
Figure 541555DEST_PATH_IMAGE230
最大为1时,本发明所述的方法结构如图3 中所示,此时特征节点组切片集
Figure 690777DEST_PATH_IMAGE231
只包含一个特征节点组切片,切片输出结果
Figure 446374DEST_PATH_IMAGE232
数量 只有一个,集成层只对单个切片运算结果进行校正和统合。
实施例2:
本实施例中,当步骤S2.3中构建宽度特征提取模块的全局增强层中的第一随机矩 阵
Figure 946626DEST_PATH_IMAGE233
为空时,本发明结构如图4中所示,此时特征节点组切片集
Figure 177362DEST_PATH_IMAGE234
包含只包含文本的局 部信息,集成层对多个包含局部信息的切片运算结果进行校正和统合。
实施例3:
本实施例中,当步骤S3.1中所述的时间轮次
Figure 446670DEST_PATH_IMAGE235
为有限个数时,本发明如图5中所 示,此时特征节点组切片集
Figure 638748DEST_PATH_IMAGE236
包含多个特征节点组切片,切片输出结果
Figure 626295DEST_PATH_IMAGE237
数量有多个, 集成层对多个切片运算结果进行校正和统合。
在样本1“雷电绕击瞬时造成线路16 号杆绝缘子闪络,使零序和接地距离保护动作断路器跳”,样本2“接地开关A相动、静触头有明显的电弧烧伤痕迹,母线托架、支柱绝缘子熏黑”与样本3“冲洗水四处蔓延、溢流,水浸电缆管,造成地下埋设的照明线路220V电源相线与钢套管短路”中,实施例1可以准确将样本1归类,实施例2可以准确将样本2归类,实施例3可以准确将样本3归类。
本发明的优势体现在本发明与同类别的方法在建筑工地事故数据集A上表现更优,该建筑工地事故数据集包含三个类别,中毒,触电,机械伤害共323个样本,属于少样本数据集。本发明与其他方法如CEBLS(Universal approximation capability of broadlearning system and its structural variations), LSTM-BLS(Novel efficient rnnand lstm-like architectures: Recurrent and gated broad learning systems andtheir applications for text classification), TextCNN(Convolutional NeuralNetworks for Sentence Classification)的对比结果如表1。本发明在精确度和F分值上比同类方法更加优秀,在训练时间上也与同类对比方法中最省时的处于同一量级。
表1
精确率 F分值 训练时间/秒
本发明 0.8796 0.8617 0.2992
CEBLS 0.824 0.7947 0.1517
LSTM-BLS 0.7592 0.7476 1.033
TextCNN 0.7265 0.6813 242.25
上述流程为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种基于宽度学习网络的建筑施工过程风险分类方法,其特征在于,包括以下步骤:
S1:建立关键词到词向量的转化模型;
S2:构建宽度特征提取模块;
S3:构建特征节点组切片并定义切片运算过程;
S4:使用集成层对多个切片运算结果进行校正和统合;
S5:进行建筑施工过程风险分类。
2.根据权利要求1所述的一种基于宽度学习网络的建筑施工过程风险分类方法,其特征在于,步骤S1中,关键词包括多个建筑工地的属性,建筑工地的属性包括建筑工地的现场环境条件、工人的操作手法和其它的人为因素;通过有限个建筑工地的属性,表示各种各样的建筑工地情况,暗示即将出现的伤害和风险。
3.根据权利要求2所述的一种基于宽度学习网络的建筑施工过程风险分类方法,其特 征在于,步骤S1中,采用word2vect构建关键词到词向量的转化模型,word2vect属于监督学 习,转化模型包括输入层,隐藏层和输出层;每个关键词在词典中都会有自己的编号以及对 应的one-hot向量,one-hot向量作为输入层的输入;输入层与一个第一矩阵
Figure 928499DEST_PATH_IMAGE001
相乘得到 隐藏层,隐藏层继而跟一个第二矩阵
Figure 927679DEST_PATH_IMAGE002
相乘得到输出层;目标函数旨在拉近输入层和输 出层之间的距离,使两者尽可能相近;转化模型将输入的one-hot向量乘第一矩阵
Figure 900446DEST_PATH_IMAGE001
的结 果作为关键词的词向量,第一矩阵
Figure 507446DEST_PATH_IMAGE001
的每一列都是训练好的词向量;通过已有的文本数 据对转化模型进行训练,得到训练完成的转化模型,进而获得各个关键词所对应的词向量。
4.根据权利要求1所述的一种基于宽度学***的宽度结构构建宽度特征提取模块,旨在提取出关键词中包括的重要特征以及关键词间的复杂联系;宽度特征提取模块以关键词转化的词向量作为输入,宽度特征提取模块的构建过程包括以下步骤:
S2.1、定义宽度特征提取模块的数据输入格式,定义单个样本数据为只包括关键词的文本,宽度特征提取模块的输入规格将受样本数量,样本长度影响;
S2.2、构建宽度特征提取模块的特征层,具体如下:
通过将词向量一一映射到新的子空间的形式,来获取单个关键词的特征表示;子空间由小到大分别为特征节点、特征节点组和特征层;其中,特征层只有一个且包括多个特征节点组,每个特征节点组包括多个特征节点;
S2.3、构建宽度特征提取模块的全局增强层。
5.根据权利要求4所述的一种基于宽度学习网络的建筑施工过程风险分类方法,其特征在于,步骤S2.1中,具体如下:
对于一组训练的数据
Figure 286177DEST_PATH_IMAGE003
Figure 949983DEST_PATH_IMAGE004
Figure 296913DEST_PATH_IMAGE005
表示样本数量,
Figure 868840DEST_PATH_IMAGE006
表示第i个样本数 据,包括多个反映建筑工地情景的关键词;
Figure 375563DEST_PATH_IMAGE007
表示第i个样本数据的样本标签;
Figure 365647DEST_PATH_IMAGE008
表示输 入到宽度特征提取模块的样本数据,
Figure 677286DEST_PATH_IMAGE009
Figure 2088DEST_PATH_IMAGE010
Figure DEST_PATH_IMAGE011
表示域,
Figure 825686DEST_PATH_IMAGE012
表示一 个样本数据中关键词的最大数量,
Figure 653965DEST_PATH_IMAGE013
表示词向量的大小;
Figure 402085DEST_PATH_IMAGE014
Figure 496074DEST_PATH_IMAGE015
Figure 423228DEST_PATH_IMAGE016
表示 样本数据的输出矩阵,又称为目标空间,
Figure 184642DEST_PATH_IMAGE017
表示标签类别;在建筑工地风险分析场景中,
Figure 900401DEST_PATH_IMAGE017
代表着建筑工地施工情景的风险等级,包括物体打击、机械伤害、触电、高处坠落和坍塌。
6.根据权利要求5所述的一种基于宽度学习网络的建筑施工过程风险分类方法,其特征在于,步骤S2.2中,具体如下:
定义特征层为
Figure 403057DEST_PATH_IMAGE018
Figure 599815DEST_PATH_IMAGE019
M表示特征节点组的数量;单个特 征节点组与特征节点的关系表示为
Figure 206946DEST_PATH_IMAGE020
Figure 283486DEST_PATH_IMAGE021
Figure 552400DEST_PATH_IMAGE022
表示第m个特征节点 组,
Figure 5378DEST_PATH_IMAGE023
表示第m个特征节点组中第j个特征节点,J为每个特征节点组内特征节点的数量; 第m个特征节点组中第j个特征节点表示为
Figure 210226DEST_PATH_IMAGE024
,第m个特征词汇的表 示向量,第m个特征节点
Figure 211330DEST_PATH_IMAGE025
Figure 688578DEST_PATH_IMAGE026
分别为随机生成的第m个特征节点组中第j个特征节点 的权重和偏置,X m X对应的第m列数据,特征节点组和X的列维度是一一对应的;
Figure 414089DEST_PATH_IMAGE027
为第一 激活函数,第一激活函数
Figure 673776DEST_PATH_IMAGE027
采用tanh。
7.根据权利要求6所述的一种基于宽度学习网络的建筑施工过程风险分类方法,其特征在于,步骤S2.3中,具体如下:
在已获得的宽度特征提取模块的特征层的基础上,构造第一随机矩阵
Figure 826539DEST_PATH_IMAGE028
和第二随机 矩阵
Figure 791084DEST_PATH_IMAGE029
参与计算,得到具有全局信息的增强节点
Figure 351246DEST_PATH_IMAGE030
Figure 983216DEST_PATH_IMAGE031
为第二激活 函数,第二激活函数
Figure 775722DEST_PATH_IMAGE031
采用sigmod函数;全局增强层
Figure 709787DEST_PATH_IMAGE032
表示为多个特征节点合并,即
Figure 308258DEST_PATH_IMAGE033
;其中,
Figure 813976DEST_PATH_IMAGE034
表示第
Figure 839701DEST_PATH_IMAGE035
个增强节点,由特征层
Figure 263991DEST_PATH_IMAGE036
、第一随机矩阵
Figure 194382DEST_PATH_IMAGE037
和第二随机矩阵
Figure 817256DEST_PATH_IMAGE038
计算得到。
8.根据权利要求7所述的一种基于宽度学习网络的建筑施工过程风险分类方法,其特征在于,步骤S3中,所述特征节点组切片,通过将大尺寸的矩阵分成多个小矩阵,达到减少计算复杂度,加快计算速度的作用;构建特征节点组切片包括以下步骤:
S3.1、定义特征节点选择策略,具体如下:
在特征层的所有特征节点组中,通过特征节点选择策略选取部分特征节点,即进行特 征节点选择;定义在第
Figure 21404DEST_PATH_IMAGE039
轮特征节点选择中,每个特征节点组激活的特征节点的数量为
Figure 713417DEST_PATH_IMAGE040
; 定义每个特征节点都具有一个置信值,在第m个特征节点组的第
Figure 404423DEST_PATH_IMAGE041
轮特征节点选择中,第
Figure 862562DEST_PATH_IMAGE042
个特征节点
Figure 715243DEST_PATH_IMAGE043
的置信值
Figure 363393DEST_PATH_IMAGE044
的计算公式为:
Figure 595441DEST_PATH_IMAGE045
(1)
Figure 911016DEST_PATH_IMAGE046
表示到第
Figure 387128DEST_PATH_IMAGE047
轮特征节点选择为止第
Figure 535956DEST_PATH_IMAGE048
个特征节点被选中参与计算的次数;第
Figure 286874DEST_PATH_IMAGE048
个 特征节点在第
Figure 565995DEST_PATH_IMAGE047
轮中被选中的概率
Figure 540904DEST_PATH_IMAGE049
为:
Figure 242275DEST_PATH_IMAGE050
(2)
定义概率
Figure 75845DEST_PATH_IMAGE051
,以
Figure 710220DEST_PATH_IMAGE052
为概率在
Figure 406430DEST_PATH_IMAGE053
个特征节点中选择
Figure 532780DEST_PATH_IMAGE054
个特征节 点;若出现同一特征节点被多次选中,则抛弃最后一次的选择结果并重新选择,直至不出现 重复选择的特征节点;定义二值矩阵
Figure 888151DEST_PATH_IMAGE055
描述第
Figure 642611DEST_PATH_IMAGE056
轮特征节点选择,
Figure 701267DEST_PATH_IMAGE057
Figure 846071DEST_PATH_IMAGE058
为二 值矩阵
Figure 476904DEST_PATH_IMAGE059
中第
Figure 755045DEST_PATH_IMAGE060
行第
Figure 508237DEST_PATH_IMAGE061
列的元素;如果
Figure 143268DEST_PATH_IMAGE062
为1,则代表第
Figure 594103DEST_PATH_IMAGE063
个特征节点组的第
Figure 182210DEST_PATH_IMAGE061
个特征节 点被激活;如果
Figure 775478DEST_PATH_IMAGE064
为0,则代表第
Figure 629296DEST_PATH_IMAGE063
个特征节点组的第
Figure 867510DEST_PATH_IMAGE061
个特征节点不参与计算;
则经过
Figure 59193DEST_PATH_IMAGE065
轮特征节点选择后,得到记录切片中已激活的特征节点信息的矩阵集
Figure 91871DEST_PATH_IMAGE066
,其中,
Figure 901827DEST_PATH_IMAGE067
为第
Figure 409644DEST_PATH_IMAGE065
轮特征节点选择得到的二值矩阵;特征节点组切片集 表示为
Figure 972343DEST_PATH_IMAGE068
,其中,
Figure 192234DEST_PATH_IMAGE069
表示以二值矩阵
Figure 741683DEST_PATH_IMAGE067
对特征层
Figure 321700DEST_PATH_IMAGE070
进行筛选所得 到的特征节点组切片;特征节点组切片集
Figure 755218DEST_PATH_IMAGE071
中的每个元素为多个选中的特征节点拼接而 成的矩阵;
S3.2、构造切片运算输入层,具体如下:
构造包括有局部特征层信息以及全局增强层信息的切片运算输入层,对每个表示了一 部分特征层的特征节点组切片
Figure 392348DEST_PATH_IMAGE072
和建立在所有特征节点组基础上映射得到的全局增强 层
Figure 176895DEST_PATH_IMAGE073
,切片运算输入层表示为
Figure 295024DEST_PATH_IMAGE074
S3.3、进行切片运算,具体如下:
对于特征节点组切片
Figure 636576DEST_PATH_IMAGE075
的切片运算输入层
Figure 447537DEST_PATH_IMAGE076
,通过一个第一权重
Figure 450872DEST_PATH_IMAGE077
映射到目标空 间
Figure 44796DEST_PATH_IMAGE078
;定义优化函数为:
Figure 986993DEST_PATH_IMAGE079
(3)
其中,
Figure 234435DEST_PATH_IMAGE080
为第一权重
Figure 524733DEST_PATH_IMAGE081
平方的约束;增大
Figure 529205DEST_PATH_IMAGE080
可以改善优化函数在优化过程中的过拟 合问题;通过岭回归得到第一权重
Figure 775510DEST_PATH_IMAGE081
的计算公式:
Figure 959234DEST_PATH_IMAGE082
(4)
其中I是单位矩阵,特征节点组切片
Figure 923779DEST_PATH_IMAGE083
对应的切片运算的结果
Figure 718559DEST_PATH_IMAGE084
表示为:
Figure 363911DEST_PATH_IMAGE085
(5)
对于
Figure 235046DEST_PATH_IMAGE086
个特征节点组切片得到一组切片输出结果
Figure 483625DEST_PATH_IMAGE087
以及对 应的第一权重集
Figure 570179DEST_PATH_IMAGE088
9.根据权利要求8所述的一种基于宽度学习网络的建筑施工过程风险分类方法,其特 征在于,步骤S4中,对于特征节点组切片
Figure 525497DEST_PATH_IMAGE089
对应的切片运算的结果
Figure 95762DEST_PATH_IMAGE090
Figure 379107DEST_PATH_IMAGE091
, 将切片运算的结果
Figure 319951DEST_PATH_IMAGE092
映射到一个子网络空间
Figure 208403DEST_PATH_IMAGE093
Figure 873871DEST_PATH_IMAGE094
是一个径向基 函数,
Figure 516949DEST_PATH_IMAGE095
Figure 988381DEST_PATH_IMAGE096
采用稀疏自编码器生成;将所有特征节点组切片对应的切片运算的结果映 射得到的多个子网络空间进行合并,得到了
Figure 265428DEST_PATH_IMAGE097
;定义第二权重
Figure 649268DEST_PATH_IMAGE098
,使得
Figure 562997DEST_PATH_IMAGE099
Y表示目标空间;
Figure 320344DEST_PATH_IMAGE100
通过以下公式计算得到:
Figure 917810DEST_PATH_IMAGE101
(6)。
10.根据权利要求1~9任一项所述的一种基于宽度学习网络的建筑施工过程风险分类方法,其特征在于,步骤S5中,进行建筑施工过程风险分类过程具体如下:
S5.1、获取包括建筑工地的现场环境条件、工人的操作手法和各种人为因素的文本
Figure 470887DEST_PATH_IMAGE102
,将文本
Figure 622645DEST_PATH_IMAGE102
输入步骤S1中构建的关键词到词向量的转化模型,得到文本
Figure 107984DEST_PATH_IMAGE102
对应的 词向量;
S5.2、将文本
Figure 9556DEST_PATH_IMAGE102
对应的词向量输入步骤S2中构建的宽度特征提取模块,分别得到文 本
Figure 938460DEST_PATH_IMAGE102
对应的特征层
Figure 561203DEST_PATH_IMAGE103
和全局增强层
Figure 853162DEST_PATH_IMAGE104
S5.3、采用二值矩阵集
Figure 612171DEST_PATH_IMAGE105
,根据特征层
Figure 633348DEST_PATH_IMAGE103
构造S个推理切片运算 输入层
Figure 415490DEST_PATH_IMAGE106
,采用第一权重集
Figure 164003DEST_PATH_IMAGE107
和全局增强层
Figure 712272DEST_PATH_IMAGE104
对得到的S个推理 切片运算输入层
Figure 904350DEST_PATH_IMAGE106
进行切片运算,得到推理的切片输出结果
Figure 157476DEST_PATH_IMAGE108
S5.4、采用步骤S4中生成的权重
Figure 991571DEST_PATH_IMAGE109
和偏置
Figure 397276DEST_PATH_IMAGE110
将切片运算的结果
Figure 282625DEST_PATH_IMAGE111
映射到切片子 空间
Figure 773780DEST_PATH_IMAGE112
,采用第二权重
Figure 395254DEST_PATH_IMAGE113
得到文本
Figure 655466DEST_PATH_IMAGE114
对应的推理结果即目标 空间
Figure 720505DEST_PATH_IMAGE115
,其中,
Figure 492764DEST_PATH_IMAGE116
代表描述建筑施工过程的文本数据
Figure 403082DEST_PATH_IMAGE114
的风险分类结果。
CN202211158599.2A 2022-09-22 2022-09-22 一种基于宽度学习网络的建筑施工过程风险分类方法 Active CN115249133B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211158599.2A CN115249133B (zh) 2022-09-22 2022-09-22 一种基于宽度学习网络的建筑施工过程风险分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211158599.2A CN115249133B (zh) 2022-09-22 2022-09-22 一种基于宽度学习网络的建筑施工过程风险分类方法

Publications (2)

Publication Number Publication Date
CN115249133A true CN115249133A (zh) 2022-10-28
CN115249133B CN115249133B (zh) 2023-02-14

Family

ID=83700561

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211158599.2A Active CN115249133B (zh) 2022-09-22 2022-09-22 一种基于宽度学习网络的建筑施工过程风险分类方法

Country Status (1)

Country Link
CN (1) CN115249133B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120023043A1 (en) * 2010-07-21 2012-01-26 Ozgur Cetin Estimating Probabilities of Events in Sponsored Search Using Adaptive Models
CN109597891A (zh) * 2018-11-26 2019-04-09 重庆邮电大学 基于双向长短时记忆神经网络的文本情感分析方法
CN111641598A (zh) * 2020-05-11 2020-09-08 华南理工大学 一种基于宽度学习的入侵检测方法
CN111723874A (zh) * 2020-07-02 2020-09-29 华南理工大学 一种基于宽度和深度神经网络的声场景分类方法
CN111897961A (zh) * 2020-07-22 2020-11-06 深圳大学 一种宽度神经网络模型的文本分类方法及相关组件
CN112989414A (zh) * 2021-03-21 2021-06-18 贵州大学 基于宽度学习的移动业务数据脱敏规则生成方法
CN113098910A (zh) * 2021-05-13 2021-07-09 福州大学 基于时空粒度和三宽度学习的网络入侵检测方法及***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120023043A1 (en) * 2010-07-21 2012-01-26 Ozgur Cetin Estimating Probabilities of Events in Sponsored Search Using Adaptive Models
CN109597891A (zh) * 2018-11-26 2019-04-09 重庆邮电大学 基于双向长短时记忆神经网络的文本情感分析方法
CN111641598A (zh) * 2020-05-11 2020-09-08 华南理工大学 一种基于宽度学习的入侵检测方法
CN111723874A (zh) * 2020-07-02 2020-09-29 华南理工大学 一种基于宽度和深度神经网络的声场景分类方法
CN111897961A (zh) * 2020-07-22 2020-11-06 深圳大学 一种宽度神经网络模型的文本分类方法及相关组件
CN112989414A (zh) * 2021-03-21 2021-06-18 贵州大学 基于宽度学习的移动业务数据脱敏规则生成方法
CN113098910A (zh) * 2021-05-13 2021-07-09 福州大学 基于时空粒度和三宽度学习的网络入侵检测方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李文龙等: "基于结构熵权-可信性测度理论的装配式建筑吊装施工安全风险评估", 《武汉大学学报(工学版)》 *

Also Published As

Publication number Publication date
CN115249133B (zh) 2023-02-14

Similar Documents

Publication Publication Date Title
JP7302022B2 (ja) テキスト分類方法、装置、コンピュータ読み取り可能な記憶媒体及びテキスト分類プログラム。
RU2722571C1 (ru) Способ распознавания именованных сущностей в сетевом тексте на основе устранения неоднозначности вероятности в нейронной сети
CN106980683B (zh) 基于深度学习的博客文本摘要生成方法
CN107766324B (zh) 一种基于深度神经网络的文本一致性分析方法
CN108647742B (zh) 基于轻量级神经网络的快速目标检测方法
WO2019210820A1 (zh) 一种信息输出方法及装置
CN108737406B (zh) 一种异常流量数据的检测方法及***
CN107832457A (zh) 基于TextRank算法的输变电设备缺陷词库建立方法及***
CN107566376A (zh) 一种威胁情报生成方法、装置及***
CN107506389B (zh) 一种提取职位技能需求的方法和装置
CN111767725B (zh) 一种基于情感极性分析模型的数据处理方法及装置
CN112231562A (zh) 一种网络谣言识别方法及***
CN106570513A (zh) 大数据网络***的故障诊断方法和装置
CN105260356A (zh) 基于多任务学习的中文交互文本情感与话题识别方法
CN106778878B (zh) 一种人物关系分类方法及装置
CN115796181A (zh) 一种针对化工领域的文本关系抽取方法
CN112925908A (zh) 一种基于Attention的图注意力网络的文本分类方法及***
CN110717040A (zh) 词典扩充方法及装置、电子设备、存储介质
CN104536979A (zh) 主题模型的生成方法及装置、主题分布的获取方法及装置
CN111866004A (zh) 安全评估方法、装置、计算机***和介质
Yin et al. Sentiment lexical-augmented convolutional neural networks for sentiment analysis
CN113869052A (zh) 基于ai的房屋地址匹配方法、存储介质及设备
CN114860882A (zh) 一种基于文本分类模型的公平竞争审查辅助方法
CN114925702A (zh) 文本相似度识别方法、装置、电子设备及存储介质
CN112559741B (zh) 核电设备缺陷记录文本分类方法、***、介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant