CN111950195A - 一种基于画像***与深度回归模型的工程进度预测方法 - Google Patents
一种基于画像***与深度回归模型的工程进度预测方法 Download PDFInfo
- Publication number
- CN111950195A CN111950195A CN202010735787.1A CN202010735787A CN111950195A CN 111950195 A CN111950195 A CN 111950195A CN 202010735787 A CN202010735787 A CN 202010735787A CN 111950195 A CN111950195 A CN 111950195A
- Authority
- CN
- China
- Prior art keywords
- project
- day
- model
- regression model
- depth regression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000010276 construction Methods 0.000 claims abstract description 28
- 230000008569 process Effects 0.000 claims abstract description 19
- 238000012216 screening Methods 0.000 claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 10
- 239000013598 vector Substances 0.000 claims description 70
- 238000012549 training Methods 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 5
- 210000002569 neuron Anatomy 0.000 claims description 4
- 230000007547 defect Effects 0.000 abstract description 5
- 238000013480 data collection Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 12
- 238000011156 evaluation Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 6
- 238000004088 simulation Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000002354 daily effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 239000003317 industrial substance Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/08—Construction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Mathematical Analysis (AREA)
- Marketing (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Pure & Applied Mathematics (AREA)
- Operations Research (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Primary Health Care (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
Abstract
本发明公开了一种基于画像***与深度回归模型的工程进度预测方法,包含有深度回归模型建模阶段和工程进度预测阶段,深度回归模型建模阶段包括五个操作步骤:S1:获取历史工程进度数据,将这些工程项目施工过程中记录的数据组成集合S;S2:选取的多个已经完结的工程项目依据项目类型进行分类,得到M个集合;S3:对M个集合中的历史工程进度数据进行筛选;S4:对M个集合中的历史工程进度数据进行建模前的预处理;S5:将每一个工程项目已经预处理好的建模数据整理。通过上述方式,本发明提供的基于画像***与深度回归模型的工程进度预测方法,解决了工程进度预测的仿真模拟软件方法采集数据多,操作较为复杂的缺点,处理结果也更为简单,高效。
Description
技术领域
本发明属于数据挖掘领域,用来进行工程进度预测的考虑个性化工人画像的深度回归模型建模方法,特别是涉及一种基于画像***与深度回归模型的工程进度预测方法。
背景技术
深度学习(DL,Deep Learning)是机器学习(ML,Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI,ArtificialIntelligence)。深度学习的概念源于人工神经网络的研究,含多个隐藏层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。目前常见的深度学习模型有卷积神经网络(CNN,Convolutional Neural Network),循环神经网络(RNN,Recurrent Neural Network)等。
回归任务建模是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。深度回归模型就是利用深度学习技术进行回归任务的建模,以期其能解决输入特征较为复杂,回归关系非线性的回归建模任务。
产业化工人画像评价***是指通过企业内工人的各类别表现数据构建到该工人指定评价维度的映射模型,通过标签数据的训练以及人工评价的干预修正,提供给企业一个较为客观,准确,完全的工人画像***,以便其在用人选择,绩效评估等方面进行参考。
工程进度预测是在工程项目管理领域常见的一项任务,其目的是通过现有的工程实施数据来预测完成整个工程需要的趋势与时间。
现有的工程进度预测方法主要基于经验计算以及仿真模拟技术,经验计算是指专业的工程评估人员依据常规的工程阶段划分,进行粗粒度的经验估计,以预测工程完工的时间。仿真模拟技术是指通过一些项目管理软件,通过输入施工过程中的大量数据,软件根据这些数据进行施工模拟,从而预测工程完工的时间。常见的项目管理软件为BIM(建筑信息模型技术),是一种应用于工程设计、建造、管理的数据化工具,其可以帮助实现建筑信息的集成,从建筑的设计、施工直至项目终结,所有的信息都会集合在一个三维模型的信息数据库,BIM可以通过对施工过程的三维模拟实现对工程完工时间的预测。
然而,现有的工程进度预测方法存在很多缺点,主要表现为以下两点:
1、经验计算的方法过于依赖人工的分析,并且无法考虑到一些复杂因素的影响,例如参与施工工人的个体素质,施工时的气温及天气因素的影响等,会使工程进度预测误差较大;
2、仿真模拟软件等方法需要采集的施工过程数据较为庞大,并且需要进行专业的建模分析,操作难度较大,预测过程较为复杂。
发明内容
本发明主要解决的技术问题是如何提供一种基于画像***与深度回归模型的工程进度预测方法,通过将工程进度预测问题,看做是多因素影响下的回归建模分析问题,将个性化工人特征,温度和天气特征考虑进来建立深度回归模型预测工程进度,从而解决了工程进度预测的仿真模拟软件方法采集数据多,操作较为复杂的缺点,处理结果也更为简单,高效。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种基于画像***与深度回归模型的工程进度预测方法,包含有深度回归模型建模阶段和工程进度预测阶段,所述的深度回归模型建模阶段包括以下操作步骤:
S1:获取历史工程进度数据,从历史工程进度数据库中选取多个已经完结的工程项目,将这些工程项目施工过程中记录的数据组成集合S,作为建模数据;
S2:将步骤S1中选取的多个已经完结的工程项目依据项目类型进行分类,并将同类的工程项目数据放到一个集合中,得到M个集合:{S1,S2,...,SM};
S3:对M个集合中的历史工程进度数据进行筛选;
S4:对M个集合中的历史工程进度数据进行建模前的预处理,确定模型输入特征;
S5:对于M个集合,将每一个工程项目已经预处理好的建模数据整理得到M个深度回归预测模型:{model1,model2,...,modelM}。
在一个较佳实施例中,在深度回归模型建模阶段的步骤S3中,
A:对于M个集合中每一个工程项目以每日为单位,获取当日距开工日之间每日温度的平均值Tavg、最大值Tmax和最小值Tmin;
B:获取当日距开工日之间每日天气状况在不同分类下的计数值;
C:获取当日距开工日之间所有参与工程的人员编码,记录为人员编码IDi、人员编码参与的次数记录为indexi,从而得到:
{ID1:index1,ID2:index2,...,IDn:indexn};
D:获取当日的工程进度。
在获取当日的工程进度中,将工程进度的取值设置为0-1之间的小数。
在一个较佳实施例中,在深度回归模型建模阶段的在步骤S4中,
将模型输入特征设置为4部分,分别为时间特征,温度特征,天气状况特征和个性化工人画像特征;其中,4部分模型输入特征的具体处理步骤为:
A:将每一日的时间特征设置为当日距离开工日的天数值,将其记为x;
B:将每一日的温度特征设置为一个三维的向量,每一维的数值分别设置为当日距开工日之间每日温度的平均值、最大值和最小值:{Tavg,Tmax,Tmin};
C:将每一日的天气状况特征设置为一个四维的向量,每一维的数值分别为当日距开工日之间每日天气状况在不同分类下的计数值,将其表示为{Isunny,Irain,Icloudy,Isnow};
D:将当日距开工日之间所有参与工程的人员编码IDi与画像***中的人员编码IDi进行匹配,得到每个工人的画像评分。
在一个较佳实施例中,在深度回归模型建模阶段的在步骤S4的D处理步骤中,人员画像特征的操作步骤为:
a:将人员编码IDi,经过画像评分***之后,得到其对应的评分score(IDi),将所有人员的评分联结起来,得到向量:{score(ID1),score(ID2),...,score(IDn)},向量的每一维设置为一个人员的评分;
将这个比值乘到向量{score(ID1),score(ID2),...,score(IDn)}中对应人员维度的评分上,得到的数值向量,所述的数值向量设置为人员画像特征:
在一个较佳实施例中,在深度回归模型建模阶段的的步骤S5中,
A:将每个模型训练时的输入设置为一个集合,其中,将每一日的时间特征设置为:x,温度特征设置为:{Tavg,Tmax,Tmin},天气状况特征设置为:{Isunny,Irain,Icloudy,Isnow}、画像特征设置为:
B:将深度回归模型的主体架构设置为输入层、嵌入层、全连接层和输出层。
在一个较佳实施例中,在深度回归模型建模阶段的的步骤S5所述的步骤B中,
a:将时间特征经过含有a个神经元的全连接层后得到a维的特征向量,温度特征、天气状况特征和个性化工人画像特征经过与各自输入维度匹配的嵌入层后得到稠密的向量表示;
b:温度特征通过的嵌入层将输出b维的特征向量;
c:天气状况特征通过的嵌入层将输出c维的特征向量;
d:个性化工人画像特征通过的嵌入层将输出d维的特征向量;
e:将所有得到的特征向量进行拼接操作成为一个(a+b+c+d)维的特征向量,并将其输入到全连接层,最后经过维度调整至1维后输出;其中,深度回归模型的中间层使用的激活函数为tanh函数为:模型的loss函数为MSE loss:
在一个较佳实施例中,在所述的工程进度预测阶段包括以下操作步骤:
S1:首先根据深度回归模型建模阶段的分类标准,将已经完结的工程项目归为M类中的一类;
S2:在集合{model1,model2,...,modelM}找到深度回归模型建模阶段的深度回归预测模型,并记为modelpre;
S3:根据深度回归模型建模阶段步骤S3的数据筛选方法与步骤S4的预处理方法得到当前工程实施日期距离开工日之间的时间特征、温度特征、天气状况特征和个性化工人画像特征;
S4:将以上特征输入到上一步选择好的深度回归预测模型modelpre中,模型的输出设置为当前的工程进度;
S5:根据时间特征,将所有预估的特征输入到选择好的深度回归模型modelpre中,递进的预测未来的工程进度,直至到达期望的工程进度值μ(0<μ<1)。
本发明的有益效果是:解决了工程进度预测的仿真模拟软件方法采集数据多,操作较为复杂的缺点,处理结果也更为简单,高效。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:
图1是本发明基于画像***与深度回归模型的工程进度预测方法一具体实施例建模所需历史工程进度数据的获取,分类与筛选的示意图;
图2是本发明基于画像***与深度回归模型的工程进度预测方法一具体实施例建模所需要的输入特征的预处理流程示意图;
图3是本发明基于画像***与深度回归模型的工程进度预测方法一具体实施例深度回归模型的架构示意图。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1-3,在本发明的一个具体实施例中提供一种基于画像***与深度回归模型的工程进度预测方法,所述的基于画像***与深度回归模型的工程进度预测方法包含有深度回归模型建模阶段和工程进度预测阶段,所述的深度回归模型建模阶段包括以下操作步骤:
S1:获取历史工程进度数据,从历史工程进度数据库中选取多个已经完结的工程项目,将这些工程项目施工过程中记录的数据组成集合S,作为建模数据;
S2:将步骤S1中选取的多个已经完结的工程项目依据项目类型进行分类,并将同类的工程项目数据放到一个集合中,得到M个集合:{S1,S2,...,SM};
S3:对M个集合中的历史工程进度数据进行筛选;
S4:对M个集合中的历史工程进度数据进行建模前的预处理,确定模型输入特征;
S5:对于M个集合,将每一个工程项目已经预处理好的建模数据整理得到M个深度回归预测模型:{model1,model2,...,modelM}。
在一个实施例中,在深度回归模型建模阶段的步骤S3中,
A:对于M个集合中每一个工程项目以每日为单位,获取当日距开工日之间每日温度的平均值Tavg、最大值Tmax和最小值Tmin;
B:获取当日距开工日之间每日天气状况在不同分类下的计数值;
C:获取当日距开工日之间所有参与工程的人员编码,记录为人员编码IDi、人员编码参与的次数记录为indexi,从而得到:
{ID1:index1,ID2:index2,...,IDn:indexn};
D:获取当日的工程进度;
在获取当日的工程进度中,将工程进度的取值设置为0-1之间的小数。
在一个实施例中,在深度回归模型建模阶段的在步骤S4中,
将模型输入特征设置为4部分,分别为时间特征,温度特征,天气状况特征和个性化工人画像特征;其中,4部分模型输入特征的具体处理步骤为:
A:将每一日的时间特征设置为当日距离开工日的天数值,将其记为x;
B:将每一日的温度特征设置为一个三维的向量,每一维的数值分别设置为当日距开工日之间每日温度的平均值、最大值和最小值:{Tavg,Tmax,Tmin};
C:将每一日的天气状况特征设置为一个四维的向量,每一维的数值分别为当日距开工日之间每日天气状况在不同分类下的计数值,将其表示为{Isunny,IrainIcloudy,Isnow};
D:将当日距开工日之间所有参与工程的人员编码IDi与画像***中的人员编码IDi进行匹配,得到每个工人的画像评分。
在深度回归模型建模阶段的在步骤S4的D处理步骤中,人员画像特征的操作步骤为:
a:将人员编码IDi,经过画像评分***之后,得到其对应的评分score(IDi),将所有人员的评分联结起来,得到向量:{score(ID1),score(ID2),...,score(IDn)},向量的每一维设置为一个人员的评分;
将这个比值乘到向量{score(ID1),score(ID2),...,score(IDn)}中对应人员维度的评分上,得到的数值向量,所述的数值向量设置为人员画像特征:
在深度回归模型建模阶段的的步骤S5中,
A:将每个模型训练时的输入设置为一个集合,其中,将每一日的时间特征设置为:x,温度特征设置为:{Tavg,Tmax,Tmin},天气状况特征设置为:{Isunny,Irain,Icloudy,Isnow}、画像特征设置为:
B:将深度回归模型的主体架构设置为输入层、嵌入层、全连接层和输出层。
在深度回归模型建模阶段的的步骤S5所述的步骤B中,又包含以下的操作过程:
a:将时间特征经过含有a个神经元的全连接层后得到a维的特征向量,温度特征、天气状况特征和个性化工人画像特征经过与各自输入维度匹配的嵌入层后得到稠密的向量表示;
b:温度特征通过的嵌入层将输出b维的特征向量;
c:天气状况特征通过的嵌入层将输出c维的特征向量;
d:个性化工人画像特征通过的嵌入层将输出d维的特征向量;
e:将所有得到的特征向量进行拼接操作成为一个(a+b+c+d)维的特征向量,并将其输入到全连接层,最后经过维度调整至1维后输出;其中,深度回归模型的中间层使用的激活函数为tanh函数为:模型的loss函数为MSE loss:
一种基于画像***与深度回归模型的工程进度预测方法,在所述的工程进度预测阶段包括以下操作步骤:
S1:首先根据深度回归模型建模阶段的分类标准,将已经完结的工程项目归为M类中的一类;
S2:在集合{model1,model2,...,modelM}找到深度回归模型建模阶段的深度回归预测模型,并记为modelpre;
S3:根据深度回归模型建模阶段步骤S3的数据筛选方法与步骤S4的预处理方法得到当前工程实施日期距离开工日之间的时间特征、温度特征、天气状况特征和个性化工人画像特征;
S4:将以上特征输入到上一步选择好的深度回归预测模型modelpre中,模型的输出设置为当前的工程进度;
S5:根据时间特征,将所有预估的特征输入到选择好的深度回归模型modelpre中,递进的预测未来的工程进度,直至到达期望的工程进度值μ(0<μ<1)。
在实施的具体方案中,我们还提供以下的实施例:
本发明针对现有工程进度预测方法中存在的缺点,提出一种基于工人画像***和深度回归建模的工程进度预测方法。通过将工程进度预测问题,看做是多因素影响下的回归建模分析问题,将个性化工人特征,温度和天气特征考虑进来建立深度回归模型预测工程进度。
一种基于工人画像***和深度回归模型的工程进度预测方法,其包括以下步骤:首先是深度回归模型建模阶段:
1、首先获取历史工程进度数据,选取已经完结的多个工程项目,作为建模数据。
2、对选取的多个工程项目依据项目类型进行分类,分类标准可以是项目的种类或者每日参与项目建设的工人规模。将同类的工程项目数据放到一个集合中,得到M个集合。
3、对M个集合中的历史工程进度数据进行筛选。对于每一个工程项目:以每日为单位,获取当日距开工日之间每日温度的平均值,最大值和最小值;获取当日距开工日之间每日天气状况在不同分类下(分类为:晴天,雨天,多云,雪天)的计数值。
获取当日距开工日之间所有参与工程的工人ID及每个ID参与的次数;最后获取当日的工程进度。工程进度的取值为0-1之间的小数,0表示工程进度为0,1表示工程完结。某日工程进度的具体数值可以由人工进行人为评估给定,通过总工期的阶段划分进行计算得到或者通过BIM软件估算得到。
4、对M个集合中的历史工程进度数据进行建模前的预处理。对于每一个工程项目,以每日为单位,确定其有4部分的模型输入特征:时间特征,温度特征,天气状况特征和个性化工人画像特征;确定其模型输出即为当日的工程进度。4部分模型输入特征的具体处理步骤为:
每一日的时间特征为当日距离开工日的天数值;
每一日的温度特征为一个三维的向量,每一维的数值分别为当日距开工日之间每日温度的平均值,最大值和最小值;
每一日的天气状况特征为一个四维的向量,每一维的数值分别为当日距开工日之间每日天气状况在不同分类下(分类为:晴天,雨天,多云,雪天)的计数值。
每一日的个性化工人画像特征中,将当日距开工日之间所有参与工程的工人ID与工人画像***中的工人ID进行匹配,得到每个工人的画像评分(值域为0-100),将所有工人的评分联结起来,得到一个评分数值向量,向量的每一维代表一个工人的评分,之后计算每一个工人在当日距开工日之间的出工天数与这段时间总天数的比值,将这个比值乘到评分数值向量中对应工人维度的评分上,最后得到的数值向量即为个性化工人的画像特征。
5、对于M个集合,根据集合中每一个工程项目已经预处理好的建模数据训练得到M个深度回归预测模型。模型的输入为集合中每一日的时间特征,温度特征,天气状况特征和个性化工人画像特征。模型的输出即为每一日对应的工程进度。深度回归预测模型的主体架构为输入层,embedding层,全连接层和输出层。其中离散向量型的温度特征,天气状况特征和个性化工人画像特征需要经过embedding层进行稠密表示后与连续数值型的时间特征拼接为最终的输入特征输入到全连接层,最后经过维度调整后到输出层输出。深度回归模型的中间层使用的激活函数为tanh函数:模型的loss函数为MSE loss(均方误差):
在上述步骤完成后,进入工程进度预测阶段:
1、对于要预测进度的工程项目,首先根据模型建模阶段的分类标准,将其归为M类中的一类,之后找到这一类训练好的深度回归预测模型。
2、对于要预测进度的工程项目,根据模型建模阶段的数据筛选与预处理方法得到当前工程实施日期距离开工日之间的时间特征,温度特征,天气状况特征和个性化工人画像特征。将以上特征输入到上一步选择好的深度回归预测模型中,模型的输入即为当前的工程进度。
如果还想进一步预测之后的工程进度,则可以预先设置未来一段时间的气温情况(可根据天气预报),天气状况(可根据天气预报),参与工程的工人情况(可根据工程预先的人事安排),并将其转化为对应的温度特征,天气状况特征和个性化工人画像特征。最后递增时间特征,将所有预估的特征输入到选择好的深度回归模型中,递进的预测未来的工程进度,直至到达期望的工程进度值。
由上述的实施例可知,我们的发明主要为了解决以下技术问题:
1.深度回归模型建模阶段中建模数据的筛选和预处理方法。
2.使用产业化工人的画像评价***中的工人评分作为特征来构建模型。
3.深度回归模型的网络结构设计。
4.使用训练好的深度回归模型进行工程进度预测的方法。
在实际的生产应用中,我们的发明还提供了以下实施过程:一种基于画像***与深度回归模型的工程进度预测方法,包含有深度回归模型建模阶段和工程进度预测阶段,其中,第一阶段为深度回归模型建模阶段,其分为以下几个步骤:
1.首先获取历史工程进度数据,选取已经完结的多个工程项目,作为建模数据。如图1所示,将从历史工程进度数据库H中选取多个已经完结的工程项目,将这些工程项目施工过程中记录的数据组成集合S。
2.对选取的多个工程项目依据项目类型进行分类,分类标准可以是项目的种类或者每日参与项目建设的工人规模,例如可以将工程项目划分为大型项目,中型项目,小型项目。之后将同类的工程项目数据放到一个集合中,得到M个集合。如图1所示,为{S1,S2,...,SM}。
3.对M个集合中的历史工程进度数据进行筛选。对于每一个工程项目,以每日为单位:获取当日距开工日之间每日温度的平均值,最大值和最小值,如图1所示,平均值可表示为Tavg,最大值可表示为Tmax,最小值可表示为Tmin;
获取当日距开工日之间每日天气状况在不同分类下(分类为:晴天,雨天,多云,雪天)的计数值,如图1所示可以用Isunny表示所有日期中为晴天的计数值,可以用Irain表示所有日期中为雨天的计数值,可以用Icloudy表示所有日期中为多云天气的计数值,可以用Isnow表示所有日期中为雪天的计数值。
获取当日距开工日之间所有参与工程的工人ID及每个ID参与的次数,如图1所示可以使用一个字典来记录以上数据,字典的键为工人ID,字典的值为工人ID对应的参与施工次数,假设共有n个不重复的工人参与了这段时间的工程建设,工人ID记为IDi,对应的参与施工次数为indexi,字典可以表示为{ID1:index1,ID2:index2,...,IDn:indexn}。
获取当日的工程进度。工程进度的取值为0-1之间的小数,0表示工程进度为0,1表示工程完结。某日工程进度的具体数值可以由人工进行人为评估给定,通过总工期的阶段划分进行计算得到或者通过BIM软件计算得到。如图1所示,将当日的工程进度记为y。
4.如图2所示对M个集合中的历史工程进度数据进行建模前的预处理。对于每一个工程项目,以每日为单位,确定其有4部分的模型输入特征:时间特征,温度特征,天气状况特征和个性化工人画像特征;确定其模型输出即为当日的工程进度。4部分模型输入特征的具体处理步骤为:
每一日的时间特征为当日距离开工日的天数值,将其记为x;
每一日的温度特征为一个三维的向量,每一维的数值分别为当日距开工日之间每日温度的平均值,最大值和最小值,为{Tavg,Tmax,Tmin};
每一日的天气状况特征为一个四维的向量,每一维的数值分别为当日距开工日之间每日天气状况在不同分类下(分类为:晴天,雨天,多云,雪天)的计数值,将其表示为{Isunny,Irain,Icloudy,Isnow}。
每一日的个性化工人画像特征方法可参考专利:一种基于数据挖掘的产业化工人画像评价***的设计方法。{ID1:index1,ID2:index2,...,IDn:indexn}这个已经得到的字典记录了需要的信息,将当日距开工日之间所有参与工程的工人ID与工人画像***中的工人ID进行匹配,得到每个工人的画像评分(值域为0-100),如图2所示对于某一工人IDi,经过工人画像评分***之后,可以得到其对应的评分score(IDi),将所有工人的评分联结起来,得到一个向量:{score(ID1),score(ID2),...,score(IDn)},向量的每一维代表一个工人的评分。之后计算每一个工人在当日距开工日之间的出工天数与这段时间总天数的比值,记为将这个比值乘到向量{score(ID1),score(ID2),...,score(IDn)}中对应工人维度的评分上,最后得到的数值向量即为个性化工人的画像特征,可以将其表示为
5.对于M个集合,根据集合中每一个工程项目已经预处理好的建模数据训练得到M个深度回归预测模型,将其记为{model1,model2,...,modelM}。如图3所示,为每个模型训练时的网络架构图,模型的输入为集合中每一日的时间特征:x,温度特征:{Tavg,Tmax,Tmin},天气状况特征:{Isunny,Irain,Icloudy,Isnow}和个性化工人画像特征:模型的输出即为每一日对应的工程进度:y。深度回归预测模型的主体架构为输入层,embedding层,全连接层和输出层。如图3所示,数值型的时间特征经过含有a个神经元的全连接层后得到a维的特征向量,离散向量型的温度特征,天气状况特征和个性化工人画像特征经过与各自输入维度匹配的embedding层后得到稠密的向量表示,其中温度特征通过的embedding层将输出b维的特征向量,天气状况特征通过的embedding层将输出c维的特征向量,个性化工人画像特征通过的embedding层将输出d维的特征向量。之后将所有得到的特征向量进行拼接操作,得到一个(a+b+c+d)维的特征向量,将其输入到全连接层,最后经过维度调整至1维后输出。深度回归模型的中间层使用的激活函数为tanh函数:模型的loss函数为MSE loss(均方误差):
其中N为某个集合中所有训练样本(以日为单位)的个数,yi为某日工程进度的真实值,为某日工程进度的模型预测值。深度回归模型每次训练时,首先前向传播计算得到loss,之后从loss开始反向传播,求导更新模型的参数,直到模型最终收敛。
本发明的第二阶段为工程进度预测阶段,其主要步骤为:
1.对于要预测进度的工程项目,首先根据模型建模阶段的分类标准,将其归为M类中的一类,之后在集合{model1,model2,...,modelM}找到这一类训练好的深度回归预测模型,记为modelpre。
2.对于要预测进度的工程项目,根据模型建模阶段的数据筛选与预处理方法得到当前工程实施日期距离开工日之间的时间特征,温度特征,天气状况特征和个性化工人画像特征。将以上特征输入到上一步选择好的深度回归预测模型modelpre中,模型的输出即为当前的工程进度。
如果还想进一步预测之后的工程进度,则可以预先设置未来一段时间的气温情况(可根据天气预报),天气状况(可根据天气预报),参与工程的工人情况(可根据工程预先的人事安排),并将其转化为对应的温度特征,天气状况特征和个性化工人画像特征。最后递增时间特征,将所有预估的特征输入到选择好的深度回归模型modelpre中,递进的预测未来的工程进度,直至到达期望的工程进度值μ(0<μ<1)。
因此,本发明具有以下优点:
1.本发明解决了工程进度预测的仿真模拟软件方法采集数据多,操作较为复杂的缺点。将工程进度预测问题看作是一个多因素影响下的回归预测问题,以日为单位进行工程进度预测。
2.为了使回归预测更加合理,预测输入值考虑的是每一日距工程开工日的时间,温度,天气状况及个性化工人画像特征,这样实际上是利用一段时间的特征来预测工程进度,并且随着时间的递增,输入特征会逐渐叠加,使预测过程更为平稳。在模型训练的时候,为了使预测更为准确,合理,本发明也对不同的工程项目进行了分类,对于每一类的工程项目利用足够多的历史工程数据训练得到对应的深度回归模型。这样做的理由在于不同的工程项目的进度规律不同,如果强行在一个模型中进行所有种类工程项目的进度预测,会使模型训练较为困难,且结果较差。
3.本发明考虑到了时间特征,温度特征,天气状况特征和个性化工人画像特征这四大方面的因素来预测工程进度,相比经验计算的方法更为准确,合理。时间特征为工程实施的天数,是最为重要的特征,一个工程必然会和工程施工的天数有着明确的回归关系。但是单纯考虑时间特征会使预测结果较为粗略,不够准确,因此本发明加入了温度特征和天气特征来丰富预测的输入特征,根据经验可知,工程的进度与施工期间的温度与天气息息相关,因此这样做是合理的。同时根据经验可知工程的施工进度必然与参与施工的工人素质有关,但是在以往的预测方法中,这一块内容基本无人提及,本发明创造性的将产业化工人的画像评价***与工程进度预测问题相结合,通过使用每个工人的个性化画像评分来构建深度回归模型需要的个性化工人画像特征,巧妙的将工人的个人素质考虑到了工程进度预测问题中。
4.本发明在预测工程进度时,采用的是递进预测的方法,使用者既可以利用某一日的施工信息,直接输入模型得到当前的施工进度,以便于十分方便的评估目前的施工情况。也可以通过预设未来的气温,天气状况和参与工程的工人情况(一般来讲温度与天气状况可以参考天气预报,参与工程的工人情况也完全由工程管理部门自己决定),通过递增施工天数向后逐步预测工程进度,以便得到一个工程何时完结的趋势与期限。在递进预测的过程中,可以随意的调整输入的特征值,例如考虑极端气温情况,工人短缺情况等,得到不同的工程进度趋势,以便施工单位参考,这实际上也可以看作一种仿真模拟的方法,但相比BIM不同的是,这种模拟更为简单,高效,不需要大量的工程生产数据。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (7)
1.一种基于画像***与深度回归模型的工程进度预测方法,包含有深度回归模型建模阶段和工程进度预测阶段,其特征在于,所述的深度回归模型建模阶段包括以下操作步骤:
S1:获取历史工程进度数据,从历史工程进度数据库中选取多个已经完结的工程项目,将这些工程项目施工过程中记录的数据组成集合S,作为建模数据;
S2:将步骤S1中选取的多个已经完结的工程项目依据项目类型进行分类,并将同类的工程项目数据放到一个集合中,得到M个集合:{S1,S2,...,SM};
S3:对M个集合中的历史工程进度数据进行筛选;
S4:对M个集合中的历史工程进度数据进行建模前的预处理,确定模型输入特征;
S5:对于M个集合,将每一个工程项目已经预处理好的建模数据整理得到M个深度回归预测模型:{model1,model2,...,modelM}。
2.根据权利要求1所述的基于画像***与深度回归模型的工程进度预测方法,其特征在于,包括:在深度回归模型建模阶段的步骤S3中,
A:对于M个集合中每一个工程项目以每日为单位,获取当日距开工日之间每日温度的平均值Tavg、最大值Tmax和最小值Tmin;
B:获取当日距开工日之间每日天气状况在不同分类下的计数值;
C:获取当日距开工日之间所有参与工程的人员编码,记录为人员编码IDi、人员编码参与的次数记录为indexi,从而得到:{ID1:index1,ID2:index2,...,IDn:indexn};
D:获取当日的工程进度;
在获取当日的工程进度中,将工程进度的取值设置为0-1之间的小数。
3.根据权利要求1所述的基于画像***与深度回归模型的工程进度预测方法,其特征在于,包括:在深度回归模型建模阶段的在步骤S4中,
将模型输入特征设置为4部分,分别为时间特征,温度特征,天气状况特征和个性化工人画像特征;其中,4部分模型输入特征的具体处理步骤为:
A:将每一日的时间特征设置为当日距离开工日的天数值,将其记为x;
B:将每一日的温度特征设置为一个三维的向量,每一维的数值分别设置为当日距开工日之间每日温度的平均值、最大值和最小值:{TavgTmax,Tmin};
C:将每一日的天气状况特征设置为一个四维的向量,每一维的数值分别为当日距开工日之间每日天气状况在不同分类下的计数值,将其表示为{IsunnyIrainyIcloudy,Isnow};
D:将当日距开工日之间所有参与工程的人员编码IDi与画像***中的人员编码IDi进行匹配,得到每个工人的画像评分。
4.根据权利要求3所述的基于画像***与深度回归模型的工程进度预测方法,其特征在于,包括:在深度回归模型建模阶段的在步骤S4的D处理步骤中,人员画像特征的操作步骤为:
a:将人员编码IDi,经过画像评分***之后,得到其对应的评分score(IDi),将所有人员的评分联结起来,得到向量:{score(ID1),score(ID2),...,score(IDn),向量的每一维设置为一个人员的评分;
6.根据权利要求5所述的基于画像***与深度回归模型的工程进度预测方法,其特征在于,包括:在深度回归模型建模阶段的的步骤S5所述的步骤B中,
a:将时间特征经过含有a个神经元的全连接层后得到a维的特征向量,温度特征、天气状况特征和个性化工人画像特征经过与各自输入维度匹配的嵌入层后得到稠密的向量表示;
b:温度特征通过的嵌入层将输出b维的特征向量;
c:天气状况特征通过的嵌入层将输出c维的特征向量;
d:个性化工人画像特征通过的嵌入层将输出d维的特征向量;
7.根据权利要求1-6中任意一项所述的基于画像***与深度回归模型的工程进度预测方法,其特征在于,在所述的工程进度预测阶段包括以下操作步骤:
S1:首先根据深度回归模型建模阶段的分类标准,将已经完结的工程项目归为M类中的一类;
S2:在集合{model1,model2,...,modelM}找到深度回归模型建模阶段的深度回归预测模型,并记为modelpre;
S3:根据深度回归模型建模阶段步骤S3的数据筛选方法与步骤S4的预处理方法得到当前工程实施日期距离开工日之间的时间特征、温度特征、天气状况特征和个性化工人画像特征;
S4:将以上特征输入到上一步选择好的深度回归预测模型modelpre中,模型的输出设置为当前的工程进度;
S5:根据时间特征,将所有预估的特征输入到选择好的深度回归模型modelpre中,递进的预测未来的工程进度,直至到达期望的工程进度值μ(0<μ<1)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010735787.1A CN111950195B (zh) | 2020-07-28 | 2020-07-28 | 一种基于画像***与深度回归模型的工程进度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010735787.1A CN111950195B (zh) | 2020-07-28 | 2020-07-28 | 一种基于画像***与深度回归模型的工程进度预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111950195A true CN111950195A (zh) | 2020-11-17 |
CN111950195B CN111950195B (zh) | 2024-01-19 |
Family
ID=73339635
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010735787.1A Active CN111950195B (zh) | 2020-07-28 | 2020-07-28 | 一种基于画像***与深度回归模型的工程进度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111950195B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112819261A (zh) * | 2021-04-19 | 2021-05-18 | 中数通信息有限公司 | 一种智慧工程协同管理*** |
CN116777677A (zh) * | 2023-06-29 | 2023-09-19 | 华腾建信科技有限公司 | 基于项目启动阶段目标设置的工程数据处理方法及*** |
CN116934274A (zh) * | 2023-09-14 | 2023-10-24 | 济南科金信息技术有限公司 | 一种基于人工智能的工程进度管理*** |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170364795A1 (en) * | 2016-06-15 | 2017-12-21 | Akw Analytics Inc. | Petroleum analytics learning machine system with machine learning analytics applications for upstream and midstream oil and gas industry |
CN109902861A (zh) * | 2019-01-31 | 2019-06-18 | 南京航空航天大学 | 一种基于双层迁移学习的订单生产进度实时预测方法 |
CN109960759A (zh) * | 2019-03-22 | 2019-07-02 | 中山大学 | 基于深度神经网络的推荐***点击率预测方法 |
CN110196946A (zh) * | 2019-05-29 | 2019-09-03 | 华南理工大学 | 一种基于深度学习的个性化推荐方法 |
-
2020
- 2020-07-28 CN CN202010735787.1A patent/CN111950195B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170364795A1 (en) * | 2016-06-15 | 2017-12-21 | Akw Analytics Inc. | Petroleum analytics learning machine system with machine learning analytics applications for upstream and midstream oil and gas industry |
CN109902861A (zh) * | 2019-01-31 | 2019-06-18 | 南京航空航天大学 | 一种基于双层迁移学习的订单生产进度实时预测方法 |
CN109960759A (zh) * | 2019-03-22 | 2019-07-02 | 中山大学 | 基于深度神经网络的推荐***点击率预测方法 |
CN110196946A (zh) * | 2019-05-29 | 2019-09-03 | 华南理工大学 | 一种基于深度学习的个性化推荐方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112819261A (zh) * | 2021-04-19 | 2021-05-18 | 中数通信息有限公司 | 一种智慧工程协同管理*** |
CN112819261B (zh) * | 2021-04-19 | 2021-08-03 | 中数通信息有限公司 | 一种智慧工程协同管理*** |
CN116777677A (zh) * | 2023-06-29 | 2023-09-19 | 华腾建信科技有限公司 | 基于项目启动阶段目标设置的工程数据处理方法及*** |
CN116777677B (zh) * | 2023-06-29 | 2024-01-05 | 华腾建信科技有限公司 | 基于项目启动阶段目标设置的工程数据处理方法及*** |
CN116934274A (zh) * | 2023-09-14 | 2023-10-24 | 济南科金信息技术有限公司 | 一种基于人工智能的工程进度管理*** |
Also Published As
Publication number | Publication date |
---|---|
CN111950195B (zh) | 2024-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111950195B (zh) | 一种基于画像***与深度回归模型的工程进度预测方法 | |
CN109165664B (zh) | 一种基于生成对抗网络的属性缺失数据集补全与预测方法 | |
Huang et al. | An integrated computational intelligence approach to product concept generation and evaluation | |
CN108647226B (zh) | 一种基于变分自动编码器的混合推荐方法 | |
CN111126658A (zh) | 一种基于深度学习的煤矿瓦斯预测方法 | |
CN112966954A (zh) | 一种基于时间卷积网络的防洪调度方案优选方法 | |
CN109492748B (zh) | 一种基于卷积神经网络的电力***的中长期负荷预测模型建立方法 | |
CN114678080B (zh) | 转炉终点磷含量预测模型及构建方法、磷含量预测方法 | |
CN114282443B (zh) | 基于mlp-lstm有监督联合模型的剩余使用寿命预测方法 | |
CN111626764A (zh) | 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置 | |
CN112308298B (zh) | 一种面向半导体生产线的多场景性能指标预测方法及*** | |
CN115761240B (zh) | 一种混沌反向传播图神经网络的图像语义分割方法及装置 | |
CN115375127A (zh) | 一种工程施工智能精细化管控*** | |
CN116503118A (zh) | 一种基于分类选择强化预测模型的废旧家电价值评估*** | |
CN113449919A (zh) | 一种基于特征和趋势感知的用电量预测方法及*** | |
CN110852808A (zh) | 基于深度神经网络的电子产品异步自适应价值评估方法 | |
CN116402574A (zh) | 一种根据直播信息反馈的柔性智能制造方法及*** | |
JPH08106448A (ja) | 気象予測装置 | |
CN115310999B (zh) | 基于多层感知机和排序网络的企业用电行为分析方法及*** | |
CN114881359B (zh) | 融合GBDT和XGBoost的路面IRI预测方法 | |
CN115841184A (zh) | 一种基于工序聚类的工时预测方法 | |
CN115082726A (zh) | 一种基于PointNet优化的座便器陶瓷素坯产品分类方法 | |
CN112163704B (zh) | 一种用于建材投招标平台的优质供应商预测方法 | |
CN114254199A (zh) | 基于二分图投影和node2vec的课程推荐方法 | |
CN114372181A (zh) | 一种基于多模态数据的设备生产智能规划方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |