CN116738551B - 用于bim模型的采集数据智能处理方法 - Google Patents

用于bim模型的采集数据智能处理方法 Download PDF

Info

Publication number
CN116738551B
CN116738551B CN202310996803.6A CN202310996803A CN116738551B CN 116738551 B CN116738551 B CN 116738551B CN 202310996803 A CN202310996803 A CN 202310996803A CN 116738551 B CN116738551 B CN 116738551B
Authority
CN
China
Prior art keywords
interval
scale
data
building data
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310996803.6A
Other languages
English (en)
Other versions
CN116738551A (zh
Inventor
冯建刚
王小兰
郑梦雨
张远帆
崔芮铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaanxi Telecommunications And Designing Institute Co ltd
Original Assignee
Shaanxi Telecommunications And Designing Institute Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaanxi Telecommunications And Designing Institute Co ltd filed Critical Shaanxi Telecommunications And Designing Institute Co ltd
Priority to CN202310996803.6A priority Critical patent/CN116738551B/zh
Publication of CN116738551A publication Critical patent/CN116738551A/zh
Application granted granted Critical
Publication of CN116738551B publication Critical patent/CN116738551B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/13Architectural design, e.g. computer-aided architectural design [CAAD] related to design of buildings, bridges, landscapes, production plants or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Structural Engineering (AREA)
  • Computing Systems (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Architecture (AREA)
  • Mathematical Analysis (AREA)
  • Civil Engineering (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及数据处理技术领域,具体涉及用于BIM模型的采集数据智能处理方法,包括:采集不同建筑类型的建筑数据,根据历史建筑数据构建数据集,获取尺度区间内的所有尺度参数,根据每个尺度参数的训练集获取对应的高斯核函数矩阵,根据每个尺度参数对应的高斯核函数矩阵获取每个尺度参数的初始合适值,筛选优选尺度参数,对所有的优选尺度参数进行交叉验证,得到每个优选尺度参数的分类准确率,进而获取更优区间,根据更优区间获取目标建筑类型的最佳的尺度参数,构建最佳SVM超平面模型,对建筑数据进行分类,根据分类结果构建BIM建筑模型。本发明提高了最佳SVM超平面模型建立的效率以及准确率,使得BIM建筑模型准确性提升。

Description

用于BIM模型的采集数据智能处理方法
技术领域
本发明涉及数据处理技术领域,具体涉及用于BIM模型的采集数据智能处理方法。
背景技术
在建筑行业的数字化转型和智能化发展中,用于BIM模型的采集数据智能处理方法正逐渐成为一个重要的领域。BIM技术是一种针对建筑和基础设施项目的信息管理和协同工作平台。通过创建一个三维、数字化的建筑模型,BIM技术集成了各种信息,包括几何数据、构件属性、材料、成本和进度等。
当建筑数据经过采集后,将全部进入BIM建筑信息模型中,对采集到的建筑数据进行数据建模,但是由于建筑数据采集过程中的错误或误差不可避免导致采集的建筑数据包含异常数据,影响建立的模型的准确性。为了防止建筑数据采集过程中的错误或误差造成最终的模型准确性低,需要对采集的建筑数据进行数据分析处理,实现对异常采集数据的异常分类监测,以确保进入BIM建筑信息模型的数据可信。
目前通常通过SVM支持向量机进行异常采集数据的异常分类监测,但现有的SVM支持向量机在对采集的建筑数据进行分类时,如果核函数对应的尺度参数设置不当,则会导致超平面构建效果不佳,影响对采集的建筑数据进行异常分类的准确性,进而影响BIM建筑模型的准确性。
发明内容
本发明提供用于BIM模型的采集数据智能处理方法,以解决现有的问题。
本发明的用于BIM模型的采集数据智能处理方法采用如下技术方案:
本发明一个实施例提供了用于BIM模型的采集数据智能处理方法,该方法包括以下步骤:
采集不同建筑类型的建筑数据;将任意一个建筑类型作为目标建筑类型,根据目标建筑类型的历史建筑数据构建SVM支持向量机的数据集;
预设尺度区间,获取尺度区间内的所有尺度参数;根据SVM支持向量机的数据集获取每个尺度参数的训练集,根据每个尺度参数的训练集获取每个尺度参数对应的高斯核函数矩阵;根据每个尺度参数对应的高斯核函数矩阵获取每个尺度参数的初始合适值;
根据每个尺度参数的初始合适值获取优选尺度参数;对所有优选尺度参数进行交叉验证,得到每个优选尺度参数的分类准确率;
根据尺度区间内所有优选尺度参数的初始合适值和分类准确率获取更优区间,根据更优区间获取目标建筑类型的最佳的尺度参数;
根据最佳的尺度参数构建目标建筑类型的最佳SVM超平面模型,根据最佳SVM超平面模型对建筑数据进行分类处理,根据分类处理结果构建BIM建筑模型。
优选的,所述根据目标建筑类型的历史建筑数据构建SVM支持向量机的数据集,包括的具体步骤如下:
获取目标建筑类型的若干个历史建筑数据,对所有历史建筑数据采用人工标注的方法进行标注,将异常历史建筑数据标注为-1,将正常历史建筑数据标注为1,得到每个历史建筑数据的标签;将目标建筑类型的所有历史建筑数据以及对应的标签作为SVM支持向量机的数据集。
优选的,所述根据每个尺度参数的训练集获取每个尺度参数对应的高斯核函数矩阵,包括的具体步骤如下:
将每个尺度参数代入到高斯核函数中,将每个尺度参数对应的训练集作为对应高斯核函数的输入,得到每个尺度参数对应的高斯核函数矩阵。
优选的,所述根据每个尺度参数对应的高斯核函数矩阵获取每个尺度参数的初始合适值,包括的具体步骤如下:
将任意一个尺度参数作为目标尺度参数,获取目标尺度参数的训练集中每个历史建筑数据的核函数值序列;根据目标尺度参数的训练集中每个历史建筑数据的核函数值序列,获取目标尺度参数对于训练集中每个历史建筑数据的初始合适值;将目标尺度参数对于训练集中所有历史建筑数据的初始合适值的平均值,作为目标尺度参数的初始合适值。
优选的,所述获取目标尺度参数的训练集中每个历史建筑数据的核函数值序列,包括的具体步骤如下:
获取目标尺度参数的训练集中,第个历史建筑数据在高斯核函数矩阵中与除第个历史建筑数据外的每个历史建筑数据之间的核函数值,构成第/>个历史建筑数据的核函数值序列。
优选的,所述获取目标尺度参数对于训练集中每个历史建筑数据的初始合适值,包括的具体步骤如下:
其中,表示目标尺度参数对于训练集中第/>个历史建筑数据的初始合适值;表示目标尺度参数的训练集中第/>个历史建筑数据;/>表示目标尺度参数的训练集中第/>个历史建筑数据的核函数值序列中,与第/>个历史建筑数据为同一个规格的所有正常历史建筑数据的核函数值中的最小值;/>表示目标尺度参数的训练集中第/>个历史建筑数据的核函数值序列中,与第/>个历史建筑数据为不同规格的所有正常历史建筑数据的核函数值中的最大值;/>表示目标尺度参数的训练集中第/>个历史建筑数据的核函数值序列中,所有异常历史建筑数据对应的核函数值中的最大值;/>表示目标尺度参数的训练集中第/>个历史建筑数据的标签;/>表示目标尺度参数的训练集中第/>个历史建筑数据的核函数值序列中,所有异常历史建筑数据对应的核函数值中的最小值;/>表示目标尺度参数的训练集中第/>个历史建筑数据的核函数值序列中,所有正常历史建筑数据对应的核函数值中的最大值。
优选的,所述根据尺度区间内所有优选尺度参数的初始合适值和分类准确率获取更优区间,包括的具体步骤如下:
获取尺度区间内所有优选尺度参数的初始合适值和分类准确率之间的皮尔逊相关系数,作为初始合适值和分类准确率之间的相关性值;以尺度区间内最大的分类准确率对应的优选尺度参数为尺度区间的中心参数;根据中心参数获取尺度区间的第一区间和第二区间以及第一区间和第二区间的分类准确率;
获取第一区间和第二区间内的所有尺度参数,获取第一区间以及第二区间内每个尺度参数的初始合适值;将第一区间内所有尺度参数的初始合适值的均值作为第一区间的平均初始合适值,将第二区间内所有尺度参数的初始合适值的均值作为第二区间的平均初始合适值;
根据第一区间以及第二区间的平均初始合适值以及分类准确率分别获取第一区间和第二区间的优选度;将第一区间和第二区间中优选度最大的区间作为更优区间。
优选的,所述根据中心参数获取尺度区间的第一区间和第二区间以及第一区间和第二区间的分类准确率,包括的具体步骤如下:
将小于中心参数且与中心参数差值最小的优选尺度参数作为第一区间的左边界,将中心参数作为第一区间的右边界,得到尺度区间的第一区间;将大于中心参数且与中心参数差值最小的优选尺度参数作为第二区间的右边界,将中心参数作为第二区间的左边界,得到尺度区间的第二区间;将第一区间的左边界和右边界对应的分类准确率的均值作为第一区间的分类准确率,将第二区间的左边界和右边界对应的分类准确率的均值作为第二区间的分类准确率。
优选的,所述根据第一区间以及第二区间的平均初始合适值以及分类准确率分别获取第一区间和第二区间的优选度,包括的具体步骤如下:
其中,和/>分别为第一区间和第二区间的优选度,/>和/>分别为第一区间和第二区间的平均初始合适值,/>为初始合适值和分类准确率之间的相关性值,/>和/>分别为第一区间和第二区间的分类准确率。
优选的,所述根据更优区间获取目标建筑类型的最佳的尺度参数,包括的具体步骤如下:
进行更优区间更新操作,包括:根据更优区间中每个尺度参数的初始合适值获取更优区间中的优选尺度参数,对更优区间中的所有优选尺度参数进行交叉验证,得到更优区间中的每个优选尺度参数的分类准确率,根据更优区间中的所有优选尺度参数的初始合适值和分类准确率获取新的更优区间;
重复进行更优区间更新操作,直到得到的最新的更优区间的第一区间和第二区间中,不存在分类准确率比最新的更优区间的中心参数的分类准确率更高的尺度参数时,停止迭代;将最新的更优区间的中心参数作为最佳的尺度参数。
本发明的技术方案的有益效果是:本发明通过采集不同建筑类型的建筑数据,将历史建筑数据作为数据集,获取尺度区间内的所有尺度参数,根据每个尺度参数的训练集获取对应的高斯核函数矩阵,根据每个尺度参数对应的高斯核函数矩阵获取每个尺度参数的初始合适值,初步筛选出符合不同建筑类型数据分布特征的核函数的尺度参数,作为优选尺度参数,对所有的优选尺度参数进行交叉验证,得到每个优选尺度参数的分类准确率,根据初始合适值与分类准确率的相关性值获取更优区间,通过不断迭代寻找最佳的尺度参数,建立最佳SVM超平面模型。根据初始合适值进行尺度参数的预筛选,减少了后续交叉验证的计算量,提高了最佳SVM超平面模型建立的效率,通过不断迭代寻找最佳的尺度参数,确保了最佳SVM超平面模型的准确性,提高了对建筑数据的分类准确率,依据分类之后的建筑数据构建的BIM建筑模型更加准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的用于BIM模型的采集数据智能处理方法的步骤流程图;
图2为尺度参数为0.1时对应的高斯核函数矩阵;
图3为尺度参数为5.1时对应的高斯核函数矩阵;
图4为尺度参数为95.1时对应的高斯核函数矩阵;
图5为尺度参数的初始合适值与分类准确率的变化示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的用于BIM模型的采集数据智能处理方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的用于BIM模型的采集数据智能处理方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的用于BIM模型的采集数据智能处理方法的步骤流程图,该方法包括以下步骤:
S001.采集用于构建BIM建筑模型的不同建筑类型的建筑数据,获取SVM支持向量机的数据集。
本实施例的目的是,通过对构建BIM建筑模型的建筑数据进行分析,以筛选出建筑数据中的异常数据,避免异常数据对BIM建筑模型构建的干扰,实现对BIM建筑模型的优化。
在进行建筑数据的分析时,由于不同建筑类型的建筑数据之间存在较大差异,而为了筛选出异常数据,本实施例选择对同一建筑类型的建筑数据进行异常分析,而后将同一建筑类型的建筑数据的异常筛选过程,普适用所有建筑类型的建筑数据,从而降低对SVM支持向量机的泛化能力要求,提高用于构建BIM建筑模型的建筑数据的准确率,使得构建的BIM建筑模型更加准确。不同建筑类型的建筑数据是指建筑过程不同建筑类型的数据材料,例如瓷砖、玻璃等不同建筑类型的数据。
在本实施例中,采集不同建筑类型的建筑数据,每个建筑类型的建筑数据包含多个数据维度,例如玻璃的长、宽、厚度、价格以及品牌等。对于每个建筑类型的建筑数据中类别数据进行数字化处理,例如玻璃的品牌为类别数据,可对不同类别的品牌进行编号实现数字化。
对同一建筑类型的建筑数据进行异常分析时,同一建筑类型的建筑数据具有不同的规格要求,由于建筑模型的建筑体积较大,同一规格的建筑数据往往不在少数,所以当某一规格的建筑数据为极少量时,该规格的建筑数据往往是异常数据,例如玻璃的建筑数据中,品牌A对应的所有玻璃的长、宽、厚度、价格相同,品牌B对应的所有玻璃的长、宽、厚度、价格相同,品牌A对应的所有玻璃为同一规格,品牌B对应的所有玻璃为同一规格,品牌A对应的所有玻璃的长、宽、厚度、价格与品牌B对应的所有玻璃的长、宽、厚度、价格不同,品牌A对应的玻璃和品牌B对应的玻璃为不同规格。品牌C对应的极大部分玻璃的长、宽、厚度、价格相同,品牌C对应的极少部分玻璃的长、宽、厚度、价格不相同,品牌C对应的极少部分长、宽、厚度、价格不相同的玻璃对应的建筑数据为异常数据。
对于同一规格的建筑数据可通过与标准规格数据进行比较,判断当前规格的建筑数据是否合格,但若都按照标准规格数据进行建筑数据的筛选,则会导致最终构建的BIM建筑模型与实际建筑体出现误差。
在本实施例中,将任意一个建筑类型作为目标建筑类型,获取目标建筑类型的条历史建筑数据,其中/>为预设的数据量,本实施例以n=200为例进行叙述,具体不做限定,实施人员可根据实际实施情况设置/>的值。
对目标建筑类型的条历史建筑数据采用人工标注的方法进行标注,将属于异常数据的历史建筑数据即异常历史建筑数据标注为-1,将属于正常数据的历史建筑数据即正常历史建筑数据标注为1,得到/>条历史建筑数据的标签。将目标建筑类型的/>条历史建筑数据以及对应的标签作为SVM支持向量机的数据集。
至此,实现了不同建筑类型的建筑数据的采集,获取了SVM支持向量机的数据集。
S002.根据SVM支持向量机的数据集,获取尺度参数的初始合适值。
在利用SVM支持向量机进行超平面的构建时,采用高斯核函数相比于其他核函数具有更好的局部异常检测能力,在对用于构建BIM建筑模型的建筑数据进行异常检测时,建筑数据中的异常数据为少部分数据,选择高斯核函数可以实现更优的少数异常数据检测效果,因此本实施例采用高斯核函数进行超平面的构建。
利用SVM支持向量机进行异常分类时,根据高斯核函数矩阵使支持向量与超平面之间的间隔值达到最大,从而实现超平面的构建。在利用高斯核函数进行超平面的构建时,高斯核函数的尺度参数往往决定了构建的超平面的分类效果,高斯核函数不同大小的尺度参数会构建出不同的高斯核函数矩阵,从而使得最终通过凸优化方法求解出的超平面具有平坦或者局部尖锐的特征。较大的尺度参数可以使得高斯核函数构建的超平面的局部更尖锐,从而使得超平面模型更能适合复杂度较高的数据,有助于准确区分正常数据与异常数据之间的细微差别,但容易造成过拟合,且泛化能力较差;相反,较小的尺度参数会使得高斯核函数构建的超平面更平坦,使得超平面模型的影响范围更广,具有较高的泛化能力,但可能导致超平面模型过度平滑化,无法很好地捕捉到数据集中的细节和局部特征,尤其是在数据量较大且分布较复杂的情况下,容易出现欠拟合。
在现有的SVM支持向量机中,通过设定高斯核函数的多个初始的尺度参数,利用交叉验证的方法,选择高斯核函数最佳的尺度参数。但由于历史建筑数据的分布状态未知,可能在初始的尺度参数设定后,存在较多的冗余尺度参数值,同时由于历史建筑数据的数据量比较大,冗余尺度参数值会造成计算资源的浪费。因此本实施例通过对高斯核函数矩阵进行分析,结合目标建筑类型的历史建筑数据的分布特征,实现尺度参数的初步筛选。进而根据初步筛选之后的尺度参数进行交叉验证,根据交叉验证中误分类的历史建筑数据选择更优的尺度参数,提高SVM支持向量机对建筑数据的分类准确率,进而使得根据分类后的建筑数据构建的BIM建筑模型更加准确。
在本实施例中,预设一个尺度区间,以及一个步长/>,本实施例以/>=0.1、/>=100、/>=5为例进行叙述,具体不做限定,实施人员可根据具体情况设置。在尺度区间内,以尺度区间的左边界为开始,每间隔/>获取一个数值,将获取的数值分别作为尺度区间内的一个尺度参数。如此得到尺度区间内的多个尺度参数:0.1、5.1、10.1、…、95.1,将得到的尺度参数的个数记为N。
本实施例先构建不同尺度参数的高斯核函数矩阵,通过对高斯核函数矩阵的初步分析,筛选掉不适用于目标建筑类型的建筑数据分类的尺度参数,具体为:
对于每个尺度参数,从SVM支持向量机的数据集中抽取的数据作为训练集,将剩余的/>的数据作为验证集,以用于对当前尺度参数对应超平面模型的交叉验证。虽然数据集中为同一建筑类型的历史建筑数据,但由于同一建筑类型的历史建筑数据存在不同的规格,在进行训练集和验证集的抽取时,对不同规格的正常历史建筑数据以及异常历史建筑数据都进行随机抽取,使得SVM支持向量机在超平面模型构建时,能够对不同规格的建筑数据都有决策边界。
将每个尺度参数代入到高斯核函数中,将每个尺度参数对应的训练集作为对应高斯核函数的输入,得到每个尺度参数对应的高斯核函数矩阵。图2、图3、图4分别为尺度参数为0.1、5.1、95.1时对应的高斯核函数矩阵。
需要说明的是,核函数的作用是计算原始空间中两个数据之间的核函数值,来表示两个数据在高维空间中的内积,可降低计算量,通过对高斯核函数矩阵中的向量进行二次规划优化可求解出支持向量对应的间隔值最大的超平面模型,其中支持向量为距离决策边界(即超平面)最近的向量。
如果某一尺度参数适用于目标建筑类型的历史建筑数据的分类,则在该尺度参数对应的高斯核函数矩阵中,不同规格的历史建筑数据之间应当具有较大的差异值,同一规格的历史建筑数据之间应较为近似。
在本实施例中,将任意一个尺度参数作为目标尺度参数,获取目标尺度参数的训练集中,第个历史建筑数据在高斯核函数矩阵中与除第/>个历史建筑数据外的每个历史建筑数据之间的核函数值,构成第/>个历史建筑数据的核函数值序列/>。第/>个历史建筑数据的核函数值序列/>的长度为目标尺度参数的训练集中历史建筑数据的数量减去一。
在第个历史建筑数据的核函数值序列/>中,与第/>个历史建筑数据属于同一个规格的历史建筑数据对应的核函数值应当较大,最大为1。若某个历史建筑数据与第/>个历史建筑数据在高斯核函数矩阵中的值如果越近似,则该历史建筑数据与第/>个历史建筑数据在后续被分为同一类的概率越高。在第/>个历史建筑数据的核函数值序列/>中,与第个历史建筑数据不属于同一个规格的历史建筑数据对应的核函数值应当较小,同时,与第/>个历史建筑数据属于同一个规格的异常历史建筑数据对应的核函数值也应当较小。
同理,获取目标尺度参数的训练集中每个历史建筑数据的核函数值序列。
虽然不同规格的历史建筑数据之间的核函数应当具有较低值,但是由于存在相同规格的历史建筑数据,高斯核函数矩阵中仍会存在较大的核函数值。而为了降低对异常数据的误检测概率,应当使得在高斯核函数矩阵中,异常数据与其余历史建筑数据之间具有较低的核函数值。
获取目标尺度参数对于训练集中每个历史建筑数据的初始合适值:
其中,表示目标尺度参数对于训练集中第/>个历史建筑数据的初始合适值;表示目标尺度参数的训练集中第/>个历史建筑数据;/>表示目标尺度参数的训练集中第/>个历史建筑数据的核函数值序列中,与第/>个历史建筑数据为同一个规格的所有正常历史建筑数据的核函数值中的最小值,此处选择最小值是因为最小值决定了同一个规格的正常历史建筑数据之间核函数值的下限,以防止部分正常历史建筑数据被误分类;/>表示目标尺度参数的训练集中第/>个历史建筑数据的核函数值序列中,与第/>个历史建筑数据为不同规格的所有正常历史建筑数据的核函数值中的最大值,此处选择最大值是因为最大值决定了不同规格的正常历史建筑数据之间核函数值的上限,以防止将不同规格的正常历史建筑数据误分为一类,从而使得对不同规格的正常历史建筑数据在分类时对应的超平面模型泛化能力变差,因此利用1减去/>进行负相关映射;/>表示目标尺度参数的训练集中第/>个历史建筑数据的核函数值序列中,所有异常历史建筑数据对应的核函数值中的最大值,此处选用最大值是因为最大值决定了第/>个历史建筑数据与所有异常历史建筑数据之间核函数值的上限,以防止将正常历史建筑数据与异常历史建筑数据误分为一类,从而使得分类时对应的超平面模型分类效果不佳,使得进行BIM建模模型建模时建立的BIM建筑模型不准确,因此利用1减去/>进行负相关映射;/>表示目标尺度参数的训练集中第个历史建筑数据的标签,当标签为1时,第/>个历史建筑数据为正常历史建筑数据,此时利用/>除以3得到平均值,作为目标尺度参数的训练集中第/>个历史建筑数据的初始合适值,当初始合适值越大,目标尺度参数下,对第m个历史建筑数据来说分类效果越好;当标签为-1时,第/>个历史建筑数据为异常历史建筑数据,此时没有必要去寻找其同一规格的数据,/>表示目标尺度参数的训练集中第/>个历史建筑数据的核函数值序列中,所有异常历史建筑数据对应的核函数值中的最小值,由于此时第/>个历史建筑数据为异常历史建筑数据,异常历史建筑数据应当与异常历史建筑数据被分在一起,选用最小值是因为最小值决定了异常历史建筑数据之间核函数值的下限,以防止部分异常历史建筑数据被误分类;/>表示目标尺度参数的训练集中第/>个历史建筑数据的核函数值序列中,所有正常历史建筑数据对应的核函数值中的最大值,此时选用最大值是因为最大值表示了异常历史建筑数据与正常历史建筑数据之间核函数值的上限,以防止部分正常历史建筑数据被误分类;当第/>个历史建筑数据为异常历史建筑数据时,利用/>除以2得到平均值,作为目标尺度参数的训练集中第/>个历史建筑数据的初始合适值,当初始合适值越大,目标尺度参数下,对第m个历史建筑数据的分类效果越好。
至此,获取了目标尺度参数对于训练集中每个历史建筑数据的初始合适值,将目标尺度参数对于训练集中所有历史建筑数据的初始合适值的平均值,作为目标尺度参数的初始合适值。
同理,获取尺度区间内每个尺度参数的初始合适值。
S003.根据每个尺度参数的初始合适值,获取最佳的尺度参数。
根据尺度区间内每个尺度参数的初始合适值进行初步筛选操作,得到尺度区间内的优选尺度参数,具体为:
在得到各个尺度参数对应的初始合适值后,预设一个合适值阈值Sr,本实施例以Sr=0.5为例进行叙述,不做具体限定,实施人员可根据具体实施情况设置Sr的值。当尺度参数的初始合适值小于合适值阈值Sr时,将该尺度参数淘汰,不再使用该尺度参数进行交叉验证。当尺度参数的初始合适值大于或等于合适值阈值Sr时,将该尺度参数保留,作为优选尺度参数,用于后续的交叉验证。需要说明的是,对尺度参数进行初步筛选后,可以有效降低尺度参数的冗余,提高通过交叉验证获取最佳的尺度参数的效率。
对所有的优选尺度参数进行交叉验证,得到每个优选尺度参数的分类准确率。需要说明的是,随着尺度参数的变化,会使得每一次验证过程中的分类准确率出现变化,现有的通过交叉验证进行最佳的尺度参数的获取过程中,从所有的验证结果中选择最高准确率所对应的尺度参数值,作为最佳的尺度参数,但此时得到的最佳的尺度参数为人为设置的初始的尺度参数中的最佳,而非实际对目标建筑类型的历史建筑数据进行分类的最佳。
在本实施例中,如果存在优选尺度参数的分类准确率为100%,则将分类准确率为100%的优选尺度参数作为最佳的尺度参数。如果不存在优选尺度参数的分类准确率为100%,则常规的交叉验证方法无法得到真正最佳的尺度参数,使得无法进行建筑数据中异常数据的有效筛选,导致后续构建的BIM建筑模型不准确。
当不存在优选尺度参数的分类准确率为100%时,为尽可能得到更优的尺度参数,需结合优选尺度参数的初始合适值不断进行区间逼近,得到更优的尺度参数。需要说明的是,若优选尺度参数的初始合适值越大,则表示对目标建筑类型的历史建筑数据利用当前优选尺度参数对应的高斯核函数矩阵构建超平面模型进行分类的分类效果越合适,若在交叉验证中,当前优选尺度参数的分类准确率越高,对目标建筑类型的历史建筑数据利用当前优选尺度参数对应的高斯核函数矩阵构建超平面模型进行分类的分类效果越好。因此每个优选尺度参数的初始合适值与分类准确率应当具有正相关的关系,在分类准确率一致的情况下,应当采用初始合适值更高的优选尺度参数作为更优的尺度参数。图5为尺度参数的初始合适值与分类准确率的变化示意图。
在本实施例中,根据尺度区间内的所有优选尺度参数的初始合适值和分类准确率进行更优区间的获取操作,具体过程为:
获取尺度区间内所有优选尺度参数的初始合适值和分类准确率之间的皮尔逊相关系数,得到初始合适值和分类准确率之间的相关性值Z。在经过合适值阈值Sr的筛选后,得到初始合适值为有效值,根据筛选之后得到的优选尺度参数获取的相关性更加的可靠。如果初始合适值和分类准确率之间的相关性值Z越大,在以最大的分类准确率对应的优选尺度参数为中心选择左右最近的尺度参数进行二次间隔划分时,能更加的依赖初始合适值进行更优的选取。
以尺度区间内最大的分类准确率对应的优选尺度参数为尺度区间的中心参数,将小于中心参数且与中心参数差值最小的优选尺度参数作为第一区间的左边界,将中心参数作为第一区间的右边界,得到尺度区间的第一区间。将大于中心参数且与中心参数差值最小的优选尺度参数作为第二区间的右边界,将中心参数作为第二区间的左边界,得到尺度区间的第二区间。将第一区间的左边界和右边界对应的分类准确率的均值作为第一区间的分类准确率,将第二区间的左边界和右边界对应的分类准确率的均值作为第二区间的分类准确率。
需要说明的是,在尺度区间的第一区间和第二区间中进行更优区间的选取,以提高对历史建筑数据的分类准确率,通常情况下是依据每个区间的分类准确率的大小,将分类准确率最大值对应的区间作为更优区间,因为最大值对应的区间内更可能存在对目标建筑类型的历史建筑数据分类效果更好的尺度参数。但根据第一区间的分类准确率和第二区间的分类准确率中的最大值进行更优区间的选取,为纯数据上的分析,太过绝对,不一定适用目标建筑类型的历史建筑数据的分类模型,初始合适值与目标建筑类型的历史建筑数据的分布相关,因此可在第一区间与第二区间中获取新的尺度参数,结合新的尺度参数的初始合适值选取更优区间。
在本实施例中,对步长进行更新,使得/>。在第一区间范围内,以第一区间的左边界为开始,每间隔/>获取一个数值,将获取的每个数值分别作为第一区间内的一个尺度参数。同理,获取第二区间内的所有尺度参数。
利用步骤S002中的方法,获取第一区间以及第二区间内每个尺度参数的初始合适值,将第一区间内所有尺度参数的初始合适值的均值作为第一区间的平均初始合适值,将第二区间内所有尺度参数的初始合适值的均值作为第二区间的平均初始合适值。
根据每个区间的平均初始合适值以及分类准确率获取每个区间的优选度:
其中,、/>分别为第一区间、第二区间的优选度,/>、/>分别为第一区间、第二区间的平均初始合适值,/>为初始合适值和分类准确率之间的相关性值,/>、/>分别为第一区间、第二区间的分类准确率。
将第一区间和第二区间中优选度最大的区间作为更优区间。更优区间中的尺度参数对应的高斯核函数矩阵中的数据分布更加符合目标建筑类型的历史建筑数据的预期分类效果,因此在更优区间中进一步寻找最佳的尺度参数。
进行更优区间更新操作,包括:根据更优区间中每个尺度参数的初始合适值进行初步筛选操作,得到更优区间中的优选尺度参数,对更优区间中的所有优选尺度参数进行交叉验证,得到更优区间中的每个优选尺度参数的分类准确率,根据更优区间中的所有优选尺度参数的初始合适值和分类准确率进行新的更优区间的获取操作。
重复进行更优区间更新操作,直到得到的最新的更优区间的第一区间和第二区间中,不存在分类准确率比最新的更优区间的中心参数的分类准确率更高的尺度参数时,停止迭代。将最新的更优区间的中心参数作为最佳的尺度参数。
至此,获取了最佳的尺度参数。
S004.根据最佳的尺度参数,构建最佳超平面模型。
将最佳的尺度参数代入到对应的高斯核函数中,得到最佳的尺度参数的高斯核函数矩阵,将最佳的尺度参数的高斯核函数矩阵输入到SVM支持向量机中,进行超平面构建,得到目标建筑类型的最佳SVM超平面模型。
同理,根据每个建筑类型的历史建筑数据获取每个建筑类型的最佳的尺度参数,构建每个建筑类型的最佳SVM超平面模型。
S005.根据最佳超平面模型,实现对建筑数据的智能处理,构建BIM建筑模型。
将当前采集的每个建筑类型的建筑数据输入到每个建筑类型的最佳SVM超平面模型中,得到对应分类结果。当建筑数据的分类结果为异常数据时,由相关人员重新进行对应建筑类型的建筑数据的采集与核对,当建筑数据的分类结果为正常数据时,将建筑数据输入到构建BIM建筑模型的软件中,进行BIM建模,得到BIM建筑模型。
通过以上步骤,实现了对用于BIM建模的建筑数据的智能处理。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.用于BIM模型的采集数据智能处理方法,其特征在于,该方法包括以下步骤:
采集不同建筑类型的建筑数据;将任意一个建筑类型作为目标建筑类型,根据目标建筑类型的历史建筑数据构建SVM支持向量机的数据集;
预设尺度区间,获取尺度区间内的所有尺度参数;根据SVM支持向量机的数据集获取每个尺度参数的训练集,根据每个尺度参数的训练集获取每个尺度参数对应的高斯核函数矩阵;根据每个尺度参数对应的高斯核函数矩阵获取每个尺度参数的初始合适值;
根据每个尺度参数的初始合适值获取优选尺度参数;对所有优选尺度参数进行交叉验证,得到每个优选尺度参数的分类准确率;
根据尺度区间内所有优选尺度参数的初始合适值和分类准确率获取更优区间,根据更优区间获取目标建筑类型的最佳的尺度参数;
根据最佳的尺度参数构建目标建筑类型的最佳SVM超平面模型,根据最佳SVM超平面模型对建筑数据进行分类处理,根据分类处理结果构建BIM建筑模型。
2.根据权利要求1所述的用于BIM模型的采集数据智能处理方法,其特征在于,所述根据目标建筑类型的历史建筑数据构建SVM支持向量机的数据集,包括的具体步骤如下:
获取目标建筑类型的若干个历史建筑数据,对所有历史建筑数据采用人工标注的方法进行标注,将异常历史建筑数据标注为-1,将正常历史建筑数据标注为1,得到每个历史建筑数据的标签;将目标建筑类型的所有历史建筑数据以及对应的标签作为SVM支持向量机的数据集。
3.根据权利要求1所述的用于BIM模型的采集数据智能处理方法,其特征在于,所述根据每个尺度参数的训练集获取每个尺度参数对应的高斯核函数矩阵,包括的具体步骤如下:
将每个尺度参数代入到高斯核函数中,将每个尺度参数对应的训练集作为对应高斯核函数的输入,得到每个尺度参数对应的高斯核函数矩阵。
4.根据权利要求1所述的用于BIM模型的采集数据智能处理方法,其特征在于,所述根据每个尺度参数对应的高斯核函数矩阵获取每个尺度参数的初始合适值,包括的具体步骤如下:
将任意一个尺度参数作为目标尺度参数,获取目标尺度参数的训练集中每个历史建筑数据的核函数值序列;根据目标尺度参数的训练集中每个历史建筑数据的核函数值序列,获取目标尺度参数对于训练集中每个历史建筑数据的初始合适值;将目标尺度参数对于训练集中所有历史建筑数据的初始合适值的平均值,作为目标尺度参数的初始合适值。
5.根据权利要求4所述的用于BIM模型的采集数据智能处理方法,其特征在于,所述获取目标尺度参数的训练集中每个历史建筑数据的核函数值序列,包括的具体步骤如下:
获取目标尺度参数的训练集中,第个历史建筑数据在高斯核函数矩阵中与除第/>个历史建筑数据外的每个历史建筑数据之间的核函数值,构成第/>个历史建筑数据的核函数值序列。
6.根据权利要求4所述的用于BIM模型的采集数据智能处理方法,其特征在于,所述获取目标尺度参数对于训练集中每个历史建筑数据的初始合适值,包括的具体步骤如下:
其中,表示目标尺度参数对于训练集中第/>个历史建筑数据的初始合适值;/>表示目标尺度参数的训练集中第/>个历史建筑数据;/>表示目标尺度参数的训练集中第/>个历史建筑数据的核函数值序列中,与第/>个历史建筑数据为同一个规格的所有正常历史建筑数据的核函数值中的最小值;/>表示目标尺度参数的训练集中第/>个历史建筑数据的核函数值序列中,与第/>个历史建筑数据为不同规格的所有正常历史建筑数据的核函数值中的最大值;/>表示目标尺度参数的训练集中第/>个历史建筑数据的核函数值序列中,所有异常历史建筑数据对应的核函数值中的最大值;/>表示目标尺度参数的训练集中第/>个历史建筑数据的标签;/>表示目标尺度参数的训练集中第/>个历史建筑数据的核函数值序列中,所有异常历史建筑数据对应的核函数值中的最小值;/>表示目标尺度参数的训练集中第/>个历史建筑数据的核函数值序列中,所有正常历史建筑数据对应的核函数值中的最大值。
7.根据权利要求1所述的用于BIM模型的采集数据智能处理方法,其特征在于,所述根据尺度区间内所有优选尺度参数的初始合适值和分类准确率获取更优区间,包括的具体步骤如下:
获取尺度区间内所有优选尺度参数的初始合适值和分类准确率之间的皮尔逊相关系数,作为初始合适值和分类准确率之间的相关性值;以尺度区间内最大的分类准确率对应的优选尺度参数为尺度区间的中心参数;根据中心参数获取尺度区间的第一区间和第二区间以及第一区间和第二区间的分类准确率;
获取第一区间和第二区间内的所有尺度参数,获取第一区间以及第二区间内每个尺度参数的初始合适值;将第一区间内所有尺度参数的初始合适值的均值作为第一区间的平均初始合适值,将第二区间内所有尺度参数的初始合适值的均值作为第二区间的平均初始合适值;
根据第一区间以及第二区间的平均初始合适值以及分类准确率分别获取第一区间和第二区间的优选度;将第一区间和第二区间中优选度最大的区间作为更优区间。
8.根据权利要求7所述的用于BIM模型的采集数据智能处理方法,其特征在于,所述根据中心参数获取尺度区间的第一区间和第二区间以及第一区间和第二区间的分类准确率,包括的具体步骤如下:
将小于中心参数且与中心参数差值最小的优选尺度参数作为第一区间的左边界,将中心参数作为第一区间的右边界,得到尺度区间的第一区间;将大于中心参数且与中心参数差值最小的优选尺度参数作为第二区间的右边界,将中心参数作为第二区间的左边界,得到尺度区间的第二区间;将第一区间的左边界和右边界对应的分类准确率的均值作为第一区间的分类准确率,将第二区间的左边界和右边界对应的分类准确率的均值作为第二区间的分类准确率。
9.根据权利要求7所述的用于BIM模型的采集数据智能处理方法,其特征在于,所述根据第一区间以及第二区间的平均初始合适值以及分类准确率分别获取第一区间和第二区间的优选度,包括的具体步骤如下:
其中,和/>分别为第一区间和第二区间的优选度,/>和/>分别为第一区间和第二区间的平均初始合适值,/>为初始合适值和分类准确率之间的相关性值,/>和/>分别为第一区间和第二区间的分类准确率。
10.根据权利要求7所述的用于BIM模型的采集数据智能处理方法,其特征在于,所述根据更优区间获取目标建筑类型的最佳的尺度参数,包括的具体步骤如下:
进行更优区间更新操作,包括:根据更优区间中每个尺度参数的初始合适值获取更优区间中的优选尺度参数,对更优区间中的所有优选尺度参数进行交叉验证,得到更优区间中的每个优选尺度参数的分类准确率,根据更优区间中的所有优选尺度参数的初始合适值和分类准确率获取新的更优区间;
重复进行更优区间更新操作,直到得到的最新的更优区间的第一区间和第二区间中,不存在分类准确率比最新的更优区间的中心参数的分类准确率更高的尺度参数时,停止迭代;将最新的更优区间的中心参数作为最佳的尺度参数。
CN202310996803.6A 2023-08-09 2023-08-09 用于bim模型的采集数据智能处理方法 Active CN116738551B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310996803.6A CN116738551B (zh) 2023-08-09 2023-08-09 用于bim模型的采集数据智能处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310996803.6A CN116738551B (zh) 2023-08-09 2023-08-09 用于bim模型的采集数据智能处理方法

Publications (2)

Publication Number Publication Date
CN116738551A CN116738551A (zh) 2023-09-12
CN116738551B true CN116738551B (zh) 2023-10-17

Family

ID=87917153

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310996803.6A Active CN116738551B (zh) 2023-08-09 2023-08-09 用于bim模型的采集数据智能处理方法

Country Status (1)

Country Link
CN (1) CN116738551B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117743955A (zh) * 2023-12-21 2024-03-22 广东人信工程咨询有限公司 一种bim的采集数据处理方法、***、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651865A (zh) * 2016-12-23 2017-05-10 湖北工业大学 一种新的高分辨率遥感影像的最优分割尺度自动选择方法
KR101741761B1 (ko) * 2015-12-04 2017-05-30 광운대학교 산학협력단 멀티 프레임 기반 건물 인식을 위한 특징점 분류 방법
CN107563324A (zh) * 2017-08-30 2018-01-09 广东工业大学 一种基于核基础超限学习机的高光谱图像分类方法及装置
CN108985327A (zh) * 2018-06-05 2018-12-11 东南大学 一种基于因子分析的地形匹配区自组织优化分类方法
KR20220151777A (ko) * 2021-05-07 2022-11-15 연세대학교 산학협력단 다중 작업 채널 어텐션을 이용한 건물 하자 분류 방법 및 장치
CN115655717A (zh) * 2022-10-21 2023-01-31 厦门大学 一种基于深度领域泛化网络的轴承故障诊断方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101741761B1 (ko) * 2015-12-04 2017-05-30 광운대학교 산학협력단 멀티 프레임 기반 건물 인식을 위한 특징점 분류 방법
CN106651865A (zh) * 2016-12-23 2017-05-10 湖北工业大学 一种新的高分辨率遥感影像的最优分割尺度自动选择方法
CN107563324A (zh) * 2017-08-30 2018-01-09 广东工业大学 一种基于核基础超限学习机的高光谱图像分类方法及装置
CN108985327A (zh) * 2018-06-05 2018-12-11 东南大学 一种基于因子分析的地形匹配区自组织优化分类方法
KR20220151777A (ko) * 2021-05-07 2022-11-15 연세대학교 산학협력단 다중 작업 채널 어텐션을 이용한 건물 하자 분류 방법 및 장치
CN115655717A (zh) * 2022-10-21 2023-01-31 厦门大学 一种基于深度领域泛化网络的轴承故障诊断方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Enhancing Local Feature Extraction with Global Representation for Neural Text Classification;Guocheng Niu et al;《Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing》;全文 *
基于建筑信息模型(BIM)的建筑空间功能分类方法;金超逸,徐旻洋,周向东;《计算机应用与软件》;第220-225页 *

Also Published As

Publication number Publication date
CN116738551A (zh) 2023-09-12

Similar Documents

Publication Publication Date Title
CN106203523B (zh) 基于梯度提升决策树半监督算法融合的高光谱图像分类方法
CN109523518B (zh) 一种轮胎x光病疵检测方法
CN116738551B (zh) 用于bim模型的采集数据智能处理方法
CN111860596B (zh) 基于深度学习的无监督路面裂缝分类方法及模型建立方法
CN113591866B (zh) 基于db与crnn的特种作业证件检测方法及***
CN112037222B (zh) 一种神经网络模型的自动更新方法及***
CN113222149B (zh) 模型训练方法、装置、设备和存储介质
CN111796957A (zh) 基于应用日志的交易异常根因分析方法及***
CN109656808A (zh) 一种基于混合式主动学习策略的软件缺陷预测方法
CN112084761A (zh) 一种水利工程信息管理方法及装置
CN114090601B (zh) 一种数据筛选方法、装置、设备以及存储介质
CN108428234B (zh) 基于图像分割结果评价的交互式分割性能优化方法
CN103093239B (zh) 一种融合了点对和邻域信息的建图方法
CN107729942A (zh) 一种结构化视图缺失数据的分类方法
CN117078007A (zh) 一种融合尺度标签的多尺度风控***及其方法
CN110837853A (zh) 一种快速分类模型构建方法
CN113673534B (zh) 一种基于Faster RCNN的RGB-D图像果实检测方法
CN115579069A (zh) scRNA-Seq细胞类型注释数据库的构建方法、装置及电子设备
CN115542279A (zh) 一种气象雷达杂波分类识别方法及装置
CN117015812A (zh) 用于对数据点进行聚类的***
CN113177602A (zh) 图像分类方法、装置、电子设备和存储介质
CN112801028A (zh) 基于归纳表示学习网络的光谱和空间图高光谱图像分类方法
CN117312395B (zh) 基于大数据大模型的查询***优化方法、装置及设备
CN115330401A (zh) 违规商户识别模型构建方法及装置、违规商户识别方法
CN115481118A (zh) 一种会计科目数据标准化方法、装置、设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant