CN110781538A - 基于实地监测的开窗仿真算法 - Google Patents

基于实地监测的开窗仿真算法 Download PDF

Info

Publication number
CN110781538A
CN110781538A CN201910930650.9A CN201910930650A CN110781538A CN 110781538 A CN110781538 A CN 110781538A CN 201910930650 A CN201910930650 A CN 201910930650A CN 110781538 A CN110781538 A CN 110781538A
Authority
CN
China
Prior art keywords
windowing
principal component
cluster
simulation algorithm
factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910930650.9A
Other languages
English (en)
Other versions
CN110781538B (zh
Inventor
刘俊杰
齐悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201910930650.9A priority Critical patent/CN110781538B/zh
Publication of CN110781538A publication Critical patent/CN110781538A/zh
Application granted granted Critical
Publication of CN110781538B publication Critical patent/CN110781538B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于实地监测的开窗仿真算法。本发明基于对住宅建筑中卧室的窗户状态和相关参数长达一年的连续监测,筛选出开窗行为的显著性驱动因素,建立了开窗状态和其驱动因素的主成分Logistic模型。相比于传统的Logistic回归,该数学模型可有效消除数据的多重共线性,提高模型的稳定性和准确性。同时,考虑到实际住户开窗行为的随机性和多样性,采用了k‑means聚类方法对住户进行分类。根据聚类结果,针对每一类住户分别建立主成分Logistic模型,提高预测的准确率。

Description

基于实地监测的开窗仿真算法
技术领域
本发明属于建筑行为、建筑环境及能耗模拟领域,具体涉及一种基于k-means聚类和主成分Logistic模型的开窗仿真算法。
背景技术
我国住宅的自然通风主要通过开窗来实现,开窗行为是一种简单而有效的改善室内空气品质,调节人体热舒适的方式,同时也是建筑模拟软件一个重要的输入项。研究表明,开窗行为显著影响室内颗粒物、总挥发性有机化合物(TVOC)和二氧化碳浓度;开窗通风也会改变室内的温度、风速等热环境条件,从而影响人体的热舒适;同时,合适的开窗控制策略可实现17%47%的节能。
目前大部分建筑能耗模拟软件都采用固定的时间表来定义人的行为模式,但由于实际建筑中人行为的随机性和多样性,造成建筑模拟能耗和实际运行能耗会产生较大偏差,建立开窗行为模型对于建筑能耗模拟结果的准确性具有重要作用。
发明内容
本发明针对现有大部分建筑能耗模拟软件采用固定的时间表来定义人的行为模式,忽略实际建筑中人行为的随机性的多样性的现状,提出一种基于k-means聚类和主成分Logistic模型的开窗仿真算法。
本发明提出的技术方案如下:基于实地监测的开窗仿真算法,结合了k-means聚类和主成分Logistic回归模型,挖掘出行为数据背后的数学规律,为智能开窗控制方法提供依据。
对住宅建筑中卧室的窗户状态和相关参数(包括室内温湿度、CO2浓度等室内环境数据和室外气象数据)进行长达一年的连续监测。
实施步骤如下:
步骤一:构建窗户状态及其驱动因素的原始数据集;
收集的数据中窗户状态视为目标变量,潜在驱动因素(室内外环境参数和时间)视为解释变量。因窗户状态为二分类变量,可将每种潜在驱动因素分别和窗户状态进行单因素Logistic回归,筛选出具有显著性影响的因子(p<0.05),构建窗户状态及其驱动因素的原始数据集;
步骤二:采用欠采样的方法对不平衡的数据集进行处理;
欠采样可通过保存所有稀有类样本,并在丰富类别中随机选择与稀有类别样本相等数量的样本,重组为平衡的新数据集以进一步建模。
步骤三:多重共线性诊断
多重共线性关系常增大估计参数的标准误,从而降低模型的稳定性,有时还可出现与实际情况相悖的结果,所以,需要对变量进行多重共线性诊断,一般可根据相关系数、方差膨胀因子VIF(the variance inflation factor)、容许值TOL(Tolerance)诊断:
方差膨胀因子的表达式如下:
Figure BDA0002220204740000021
其中Ri为以变量xi为因变量,其余xj(j=1,2,…,m)为自变量作回归分析的复相关系数。它是诊断多重共线性严重程度的常用指标之一。一般,学者建议当VIF≥5或VIF≥10时,可认为自变量间存在严重共线性。
步骤四:主成分分析
如果存在多重共线性,则采用主成分分析法提取出相互独立的主成分因子来代替原始变量,如果不存在,则直接进入下一步骤。主成分分析常常通过以下4步解决:
(1)对原来的p个指标进行标准化,以消除变量在数量极或量纲上的影响。
(2)根据标准化后的数据矩阵求出协方差或相关阵。
(3)求出协方差矩阵的特征根和特征向量。
(4)确定主成分,建立主成分得分函数。
步骤五:采用k-means聚类法对住户进行分类
考虑到住户开窗行为的多样性,采用k-means聚类方法将住户分为消极、中等、积极三类。
这是一种迭代求解的聚类分析算法,其步骤是随机选取k(k=3)个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离
Figure BDA0002220204740000022
把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。
步骤六:对每一类住户分别建立主成分Logistic模型。
Figure BDA0002220204740000031
p是窗户为开启状态的概率
F1,…,Fp是主成分因子。
与现有技术相比,本发明的有益效果在于:
(1)相比于传统的Logistic回归,该数学模型可有效消除数据的多重共线性,提高模型的稳定性和准确性。
(2)考虑到实际住户开窗行为的随机性和多样性,采用了k-means聚类方法对住户进行分类,针对每一类住户分别建立主成分Logistic模型,提高预测的准确率。
附图说明
图1:原始数据集的构建流程图
图2:主成分Logistic模型的构建流程图
具体实施方式
以下结合附图和具体实施例来对本发明做进一步的说明。
本发明实施步骤如下:
步骤一:对住宅建筑中卧室的窗户状态和相关参数进行长达一年的连续监测;
采用小米公司的门窗传感器记录窗户状态。当卧室内所有的窗户关闭时,该房间窗户的状态被视为关闭;只要有一个窗户打开,该房间窗户的状态就被视为打开。
基于文献研究,对潜在的开窗驱动因素同时进行监测。室内环境参数采用了ikair公司开发的传感器进行监测,获取包括室内温湿度、CO2浓度等室内环境数据;室外气象参数(温湿度、太阳辐射强度、风速、风向、降雨、PM2.5浓度等)可从附近的气象站点获取;
步骤二:构建窗户状态及其驱动因素的原始数据集;
收集的数据中窗户状态视为目标变量,潜在驱动因素(室内外环境参数和时间)视为解释变量。因窗户状态为二分类变量,可将每种潜在驱动因素分别和窗户状态进行单因素Logistic回归,筛选出具有显著性影响的因子(p<0.05),构建窗户状态及其驱动因素的原始数据集;
步骤三:采用欠采样的方法对不平衡的数据集进行处理;
当遇到不平衡数据时,以总体分类准确率为学***衡的问题,
欠采样可通过保存所有稀有类样本,并在丰富类别中随机选择与稀有类别样本相等数量的样本,重组为平衡的新数据集以进一步建模。
步骤四:多重共线性诊断
多重共线性关系常增大估计参数的标准误,从而降低模型的稳定性,有时还可出现与实际情况相悖的结果。因此,为了合理地估计和解释一个回归模型,需要对变量进行多重共线性诊断,一般可根据相关系数、方差膨胀因子VIF(the variance inflationfactor)、容许值TOL(Tolerance)诊断:
方差膨胀因子首先由Marquardt于1960年引入的。其表达式如下:
其中Ri为以变量xi为因变量,其余xj(j=1,2,…,m)为自变量作回归分析的复相关系数。它是诊断多重共线性严重程度的常用指标之一。如果xi与其他m-1个自变量间无线性相关(即Ri=0),则VIF=1;反之VIF大于1。VIF随着Ri的增大而增大,VIF的值愈大,说明变量间的多重共线性程度愈强。同自变量的相关系数指标一样,利用VIF来诊断多重共线性的问题,其临界值不易确定。一般,学者建议当VIF≥5或VIF≥10时,可认为自变量间存在严重共线性。
步骤五:主成分分析
如果存在多重共线性,则采用主成分分析法提取出相互独立的主成分因子来代替原始变量,如果不存在,则直接进入下一步骤。主成分分析常常通过以下4步解决:
(1)原始数据标准化
设有n个样本,每个样本有p项指标,则原始样本矩阵为:
X=(Xij)n×p i=1,2,…,n j=1,2,…,p
为了消除变量在数量级或量纲上的影响,先将原变量标准化变换,标准化变换选择Z-score法,公式为:
Figure BDA0002220204740000051
Xj为指标j的均数,Sj为指标j的标准差。变换后的标准化矩阵为:
Z=(ZXij)n×p i=1,2,…,n j=1,2,…,p
(2)根据标准化后的数据矩阵求出相关矩阵R。
R=(rjk)n×k j=1,2,…,p k=1,2,…,p
rjk为指标j与指标k的相关系数,
Figure BDA0002220204740000052
(3)求出相关矩阵R的特征根、特征向量和方差贡献率。
由特征方程式|λI-R|=0可以求得p个特征根λi(i=1,2,…,p),将其按按大小顺序排列为λ1≥λ2≥…≥λp≥0。λi等于第i个主成分的方差,反映了各主成分对原变量的权重。每一个特征根对应的特征向量根据以下公式计算:
Figure BDA0002220204740000053
Cij为第i个主成分对应于第j个标准化变量的因子载荷。
(4)确定主成分,建立主成分得分函数。
主成分的个数由方差贡献率决定,选取尽量少的k个主成分(k<P)来进行综合评价,同时还要使损失的信息量尽可能少。
建立主成分得分函数:
Fi=e1izx1+e2izx2+…+epizxp(i=1,2,…,p)
步骤六:采用k-means聚类法对住户进行分类
考虑到住户开窗行为的多样性,采用k-means聚类方法将住户分为消极、中等、积极三类。
这是一种迭代求解的聚类分析算法,其步骤是随机选取k(k=3)个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离
Figure BDA0002220204740000054
把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。
步骤七:对每一类住户分别建立主成分Logistic模型。
Figure BDA0002220204740000061
p是窗户为开启状态的概率
F1,…,Fp是主成分因子。

Claims (7)

1.基于实地监测的开窗仿真算法,其特征在于:结合了k-means聚类和主成分Logistic回归模型;
步骤1):构建窗户状态及其驱动因素的原始数据集;
步骤2):采用欠采样的方法对不平衡的数据集进行处理;
步骤3):多重共线性诊断;
步骤4):主成分分析:如果存在多重共线性,则采用主成分分析法提取出相互独立的主成分因子来代替原始变量,如果不存在,则直接进入下一步骤;
步骤5):采用k-means聚类法对住户进行分类;
步骤6):对每一类住户分别建立主成分Logistic模型。
2.根据权利要求1所述的基于实地监测的开窗仿真算法,其特征在于:所述步骤1)具体为:收集的数据中窗户状态视为目标变量,潜在驱动因素(室内外环境参数和时间)视为解释变量;
将每种潜在驱动因素分别和窗户状态进行单因素Logistic回归,筛选出具有显著性影响的因子(p<0.05),构建窗户状态及其驱动因素的原始数据集。
3.根据权利要求1所述的基于实地监测的开窗仿真算法,其特征在于:所述步骤2)具体:欠采样可通过保存所有稀有类样本,并在丰富类别中随机选择与稀有类别样本相等数量的样本,重组为平衡的新数据集以进一步建模。
4.根据权利要求1所述的基于实地监测的开窗仿真算法,其特征在于:所述步骤3)具体:对变量进行多重共线性诊断,一般可根据相关系数、方差膨胀因子VIF(the varianceinflation factor)、容许值TOL(Tolerance)诊断:
方差膨胀因子的表达式如下:
Figure FDA0002220204730000011
其中Ri为以变量xi为因变量,其余xj(j=1,2,…,m)为自变量作回归分析的复相关系数。
5.根据权利要求1所述的基于实地监测的开窗仿真算法,其特征在于:所述步骤4)主成分分析主要步骤:
(1)对原来的p个指标进行标准化,以消除变量在数量极或量纲上的影响;
(2)根据标准化后的数据矩阵求出协方差或相关阵;
(3)求出协方差矩阵的特征根和特征向量;
(4)确定主成分,建立主成分得分函数。
6.根据权利要求1所述的基于实地监测的开窗仿真算法,其特征在于:所述步骤5)考虑到住户开窗行为的多样性,采用k-means聚类方法将住户分为消极、中等、积极三类;
迭代求解的聚类分析算法,其步骤是:
随机选取k(k=3)个对象作为初始的聚类中心;
然后计算每个对象与各个种子聚类中心之间的距离
Figure FDA0002220204730000021
Figure FDA0002220204730000022
把每个对象分配给距离它最近的聚类中心;
聚类中心以及分配给它们的对象就代表一个聚类,每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算;
这个过程将不断重复直到满足某个终止条件;
终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。
7.根据权利要求1所述的基于实地监测的开窗仿真算法,其特征在于:所述步骤6)
Figure FDA0002220204730000023
p是窗户为开启状态的概率
F1,…,Fp是主成分因子。
CN201910930650.9A 2019-09-29 2019-09-29 基于实地监测的开窗仿真算法 Active CN110781538B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910930650.9A CN110781538B (zh) 2019-09-29 2019-09-29 基于实地监测的开窗仿真算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910930650.9A CN110781538B (zh) 2019-09-29 2019-09-29 基于实地监测的开窗仿真算法

Publications (2)

Publication Number Publication Date
CN110781538A true CN110781538A (zh) 2020-02-11
CN110781538B CN110781538B (zh) 2024-01-19

Family

ID=69384626

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910930650.9A Active CN110781538B (zh) 2019-09-29 2019-09-29 基于实地监测的开窗仿真算法

Country Status (1)

Country Link
CN (1) CN110781538B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116881652A (zh) * 2023-06-26 2023-10-13 成都理工大学 基于优选负样本和随机森林模型的滑坡易发性评价方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011034542A (ja) * 2009-07-29 2011-02-17 Masahiro Shirai “多重共線性”を解消する回帰分析によって適正な標準宅地の評価を行う装置。
CN105426624A (zh) * 2015-12-04 2016-03-23 浙江工业大学 一种基于证据推理迭代算法和熵权的建筑开窗行为仿真方法
CN105512389A (zh) * 2015-12-04 2016-04-20 浙江工业大学 一种基于证据推理分析算法和熵权的建筑开窗行为仿真方法
CN109191001A (zh) * 2018-09-21 2019-01-11 常州工学院 基于主成分分析的教育质量评价方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011034542A (ja) * 2009-07-29 2011-02-17 Masahiro Shirai “多重共線性”を解消する回帰分析によって適正な標準宅地の評価を行う装置。
CN105426624A (zh) * 2015-12-04 2016-03-23 浙江工业大学 一种基于证据推理迭代算法和熵权的建筑开窗行为仿真方法
CN105512389A (zh) * 2015-12-04 2016-04-20 浙江工业大学 一种基于证据推理分析算法和熵权的建筑开窗行为仿真方法
CN109191001A (zh) * 2018-09-21 2019-01-11 常州工学院 基于主成分分析的教育质量评价方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
李莉;: "居住建筑工程造价的聚类分析及预测模型研究", 江西建材, no. 24 *
李郡;俞准;刘政轩;张国强;: "住宅建筑能耗基准确定及用能评价新方法", 土木建筑与环境工程, no. 02 *
杨梅;肖静;蔡辉;: "多元分析中的多重共线性及其处理方法", 中国卫生统计, no. 04 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116881652A (zh) * 2023-06-26 2023-10-13 成都理工大学 基于优选负样本和随机森林模型的滑坡易发性评价方法
CN116881652B (zh) * 2023-06-26 2024-04-05 成都理工大学 基于优选负样本和随机森林模型的滑坡易发性评价方法

Also Published As

Publication number Publication date
CN110781538B (zh) 2024-01-19

Similar Documents

Publication Publication Date Title
CN110298487B (zh) 一种用于满足用户个性化需求的室内温度预测方法
Zhang et al. A systematic feature selection procedure for short-term data-driven building energy forecasting model development
Bourdeau et al. Modeling and forecasting building energy consumption: A review of data-driven techniques
Wang et al. Practical issues in implementing machine-learning models for building energy efficiency: Moving beyond obstacles
CN107392368B (zh) 一种基于气象预报的办公建筑动态热负荷组合预测方法
Gao et al. Using data mining in optimisation of building energy consumption and thermal comfort management
Wang et al. Fault detection and diagnosis for multiple faults of VAV terminals using self-adaptive model and layered random forest
CN112097365A (zh) 基于预测和分类模型的空调故障检测与辩识方法及装置
CN114169254A (zh) 基于短期建筑能耗预测模型的异常能耗诊断方法及***
CN112418495A (zh) 一种基于天牛须优化算法和神经网络的建筑能耗预测方法
CN114819102A (zh) 基于gru的空调设备故障诊断方法
CN110781538B (zh) 基于实地监测的开窗仿真算法
Perera et al. Prediction of space heating energy consumption in cabins based on multivariate regression modelling
Turner Ph D A technical framework to describe occupant behavior for building energy simulations
Wang et al. Point and contextual anomaly detection in building load profiles of a university campus
CN107544447A (zh) 一种基于核学习的化工过程故障分类方法
CN112686442A (zh) 基于运行多样性空调末端能耗预测方法和***
Godinho et al. Forecasting heating and cooling energy demand in an office building using machine learning methods
Kowalski et al. The comparison of linear models for PM10 and PM2. 5 forecasting
Anitha et al. Chicken Swarm Optimization with Deep Learning Based Packaged Rooftop Units Fault Diagnosis Model.
CN112413814B (zh) 基于综合距离的在线可更新暖通空调传感器故障检测方法
Bursill An approach to data-driven sensing and predictive supervisory control for commercial buildings with in-situ evaluation
Maalej et al. Prediction of HVAC System Parameters Using Deep Learning
Ferreira et al. Unsupervised learning of load signatures to estimate energy-related building features using surrogate modelling techniques
Abdollah et al. Data driven fault detection and diagnostics for hydronic and monitoring systems in a residential building

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant