CN112070109A - 一种基于改进密度峰值聚类的马蹄窑能耗异常检测方法 - Google Patents

一种基于改进密度峰值聚类的马蹄窑能耗异常检测方法 Download PDF

Info

Publication number
CN112070109A
CN112070109A CN202010707133.8A CN202010707133A CN112070109A CN 112070109 A CN112070109 A CN 112070109A CN 202010707133 A CN202010707133 A CN 202010707133A CN 112070109 A CN112070109 A CN 112070109A
Authority
CN
China
Prior art keywords
energy consumption
clustering
distance
kiln
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010707133.8A
Other languages
English (en)
Other versions
CN112070109B (zh
Inventor
杨海东
印四华
徐康康
朱成就
曾超湛
胡罗克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202010707133.8A priority Critical patent/CN112070109B/zh
Publication of CN112070109A publication Critical patent/CN112070109A/zh
Application granted granted Critical
Publication of CN112070109B publication Critical patent/CN112070109B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明涉及马蹄窑能耗异常检测技术领域,更具体地,涉及一种基于改进密度峰值聚类的马蹄窑能耗异常检测方法。采用人工蜂群算法实现了截断距离的自适应优选过程,并设立离群系数策略以实现自动划分簇中心和离群点的功能,实现智能、快速、精准的窑炉能耗异常检测。本发明通过改造自适应密度峰值聚类算法,并使用其对玻璃熔窑生产过程的能耗数据进行聚类分析,以高效准确识别存在异常的能耗样本。

Description

一种基于改进密度峰值聚类的马蹄窑能耗异常检测方法
技术领域
本发明涉及马蹄窑能耗异常检测技术领域,更具体地,涉及一种基于改进 密度峰值聚类的马蹄窑能耗异常检测方法。
背景技术
马蹄窑是一个多变量的复杂工业***,涉及变量包括:采样时间;燃料流 量、温度;助燃风流量、温度;火焰空间温度;液面温度;蓄热室碹顶温度; 烟道出口气体流量、温度等。在多变量、相关联的复杂参数***中,虽然可通 过人工巡查机组、人力监测日志***方式或者统计学方法(盒图、切比雪夫定 理等)检测窑炉异常,但由于传感仪器数据采集异常等因素,数据扰动将影响 人工检测;并且,异常发生时通常会冗余报错,冗余异常信息会掩盖事实、失 去焦点,让工人难以判定核心异常问题。
能耗异常指的是能源损耗过大、有效能源达不到预期能效或者统计学上偏 差的能耗计量。研究设备的耗能信息是最直接了解设备工作状况的方式,由此 针对机械设备异常能耗的检测研究逐渐被国内外学者所关注。在现有技术中, Soner Emec等基于机床电力能耗数据流,提出一种在线模式匹配的机床设备故 障监测方法,将电力能耗与机床产出产品质量关联起来,用于提高机床生产效 率,以降低生产过程的能耗。Aleksandar Brkovic等提出一种基于振动信号分析 的滚动轴承早期故障检测与诊断技术,该技术能及早发现轴承磨损或者轴承缺 陷,从而避免旋转机械的效率降低、能耗增加等问题。张燕忠利用布尔关联规 则的Apriori算法分析了生产耗能与过程变量的潜在关系,并应用遗传神经网络方法对能耗控制图进行了模式识别,以检测能耗波动状况,实现了造纸过程能 量***的状态监测与异常诊断。Jianhua Guo等基于热力学理论建立硫化过程的 能耗模型,以建立动态分层能耗模型估算热损失,提出了一种热损失故障检测 方法,以检测轮胎硫化车间里蒸汽疏水阀和绝缘层中不易检测的故障。杨慧芳 研究了铝型材挤压过程的能量转化机理以建立其挤压过程的能源消耗模型,并 利用能源消耗模型的主要影响因素构建Bayesian网络,提出一种基于Bayesian 网络的铝型材挤压过程能耗异常检测和定位方法。虽然目前对于能耗异常检测 的研究已取得一定的成果,但针对玻璃熔窑的能耗异常检测研究尚少。
发明内容
本发明为克服上述现有技术中的至少一个缺陷,提供一种基于改进密度峰 值聚类的马蹄窑能耗异常检测方法,实现智能、快速、精准的窑炉能耗异常检 测。
为解决上述技术问题,本发明采用的技术方案是:一种基于改进密度峰值 聚类的马蹄窑能耗异常检测方法,包括以下步骤:
S1.提取马蹄窑分层能量模型中的能量构成项以及池窑热效率η;马蹄窑能 耗计算并构造特征值,记作输入空间C:
Figure BDA0002595228730000021
式中,Cij为根据马蹄窑能耗计算方法计算结果,然后构造的特征值;
以时间序列为等价连接条件,建立包含马蹄窑原始工况信息以及能耗信息 的输入空间SC;
S2.把输入空间SC归一化到数据空间[0,1]m+15∈Rm+15内,其中,R表示实 数,m是预设的截断参数,m是输入空间S的维度数,输入空间C的维度数 为15,以抵消特征属性量纲不同影响聚类效果;对矩阵SC进行转置:
ST=SCT, (2)
对数据集中每一特征i进行最大-最小值归一化:
Figure RE-GDA0002670102690000022
式中,SC为输入空间,ST为SC的转置矩阵,
Figure BDA0002595228730000023
为特征i的最大转置矩 阵,
Figure BDA0002595228730000024
为特征i的最小转置矩阵,STi为特征i的转置矩阵,n是样本数;
S3.启用基于人工蜂群算法的截断距离参数优选方法,计算最优Sil指标的 截断距离,输出dc;
S4.设定最优dc,初始化并运算DPC算法,直至得到ST的局部密度集P 和最近邻距离集Δ;
S5.启用离群系数计算方法,计算ST中每个样本的离群系数,并输出离群 系数集Γ;
S6.升序排序Γ,并让相邻的值两两相减得到差值集;检索差值集中小于设 定阈值的索引位置k;从升序Γ中取得前k位样本的索引序号{y1,y2,…,yk},然 后根据索引序号依序从ST中导出异常能耗样本,记作A={Cy1,Cy2,…,Cyk}。
进一步的,所述的S3步骤具体包括:
S31.计算所有样本点之间的欧氏距离,并按照升序排序得到距离集合 E={dc1,dc2,...,dcL},根据原始DPC算法指出,样本点附近邻居点个数不超过总 数的2%,因此设定dc的搜索空间为E的前2%,故L为E的前2%的距离值的 统计量:初始化解:
Figure BDA0002595228730000031
式中,dc为截断距离,
Figure BDA0002595228730000032
为最大截断距离,
Figure BDA0002595228730000033
为最小截断距离,
Figure BDA0002595228730000034
为 预先设定的系数;
S32.执行DPC算法,并根据聚类结果计算Sil指标作为每个解的适应值, 以及记录当前解为最优解。Sil指标由式(5)计算得:
Figure BDA0002595228730000035
式中,n为数据集中样本总数,bt为结束聚类结果,at为初始聚类结果;
S33.雇佣蜂阶段:在当前解的邻近解中进行搜寻以更新解,搜寻公式为:
Figure BDA0002595228730000036
式中,τ为随机系数,dck是在种群中随机选择的邻居解,且dck≠dci;当 产生新解vi时,同时计算其Sil指标;由于Sil取值范围为[-1,1],Sil取值越接 近1表示聚类效果越好;为此适应度目标函数为:
Figure BDA0002595228730000037
S34.跟随蜂阶段:跟随蜂是根据雇佣蜂带回的适应值进行随机选择;即通 过式(7)与(8)计算被选中概率,以轮盘赌方式选择新解;若新解优于被更 新解dci,则让vi替换dci;其中式(8)的公式为:
Figure BDA0002595228730000038
S35.侦查蜂时期:再次利用式(6)随机产生新的解,并依次执行步骤S32、 步骤S33、步骤S34,若迭代次数达到预设的limit次,仍然没有产生更好Sil 指标的新解,输出最优解dc,算法正式结束。
进一步的,所述的S4步骤中初始化并运算DPC算法,直至得到ST的局 部密度集P和最近邻距离集Δ具体包括以下步骤:
S41.样本点的局部密度定义为:
Figure BDA0002595228730000041
其中:d(xi,yi)是样本点之间的欧几里得距离度量即欧氏距离;dc是截断距 离超参数,基本上ρi等于与样本点i距离小于dc内的邻居点个数;在所有样本 点的距离集合中,以升序排序取得百分之t位置的距离值作为dc的值;χ(·)相 当于密度估计的核函数;
S2.DPC给出了两种默认可选的核函数形态:
截断核:其中χ(x)为0-1函数,如果x小于0,那么χ(x)取值为1;否则χ(x) 取值为0;表达式如下:
Figure BDA0002595228730000042
高斯核:为避免异形簇中不同样本点出现相同的局部密度时,引入高斯函 核来定义局部密度,表达式如下:
Figure BDA0002595228730000043
S3.样本点到较高密度点的最近邻距离δi:即样本点i与距离它最近的、密 度更高的点j的距离最小值;若样本点i是密度最大点时,则δi设定为所有节点 中到样本点i的最大距离,即从高密度最近邻距离集Δ中取得最大值。
进一步的,所述的S5步骤中离群系数计算方法包括以下步骤:
S51.考虑到人为决策方案的不足,将模拟人为观测决策图的筛选策略,定 义一个离群系数γi=f(ρii),通过分析样本集中所有样本的γ值大小,以实现自 动识别离群点和簇中心的功能;离群系数由公式(12)计算所得:
Figure BDA0002595228730000044
式中:f(ρii)表示二元分段函数,ρθ表示分界条件;由DPC算法思想与DPC决策图的特性可知,决策图可大致分成左、右两部分,同一左侧越往左上 方偏移则样本点越有可能成为离群点,同一右侧越往右上方偏移则样本越适合 成为簇中心;
S52.设定决策图的输入空间为Z,并将其归一化到数据空间[0,1]2∈R2内;
Z={ζ12,...,ζn}={(ρ11),...,(ρnn)}; (13)
式中,ρi为较小的样本,δi为分界条件,ζi为数据空间的特征值;
S53.将Z经高斯核密度估计变换,得到决策图的概率密度分布曲线;在数 学上,核是由带宽参数σ控制的正值函数K(ρ,δ);这里的带宽作为平滑参数, 用来平衡结果中偏差和方差的值;在给定核的形状后,其概率密度函数Pk(y)由 式(14)与式(15)计算而得:
Figure BDA0002595228730000051
Figure BDA0002595228730000052
式中,ρi为较小的样本,δi为分界条件,ζi为数据空间的特征值;
S54.观测概率密度分布曲线图,可知它在形态上是较符合正态分布,与 DPC决策图表现的特征基本一致;即曲线以ρb为分界处分成左右两部分区域, 较低与较高密度点的频数都相对较低,其中局部密度较低点位于左侧,局部密 度较高点位于右侧;概率密度分布代表了样本的分布频数,以ρb值划分的左侧 区域为出现频率较低的样本分布区域,在该区域内所有对象点均有可能成为离 群点,为此设定离群系数公式的边界条件ρθ=ρb
S55.最后,由式(12)计算得样本集的离群系数集:
Γ={γ12,...,γθ,...,γn}; (16)
设定Y表示离群系数集Γ升序排序后,取其下标组成的索引集合:
Y={y1,y2,...,yn}; (17)
则它满足:
Figure BDA0002595228730000053
进一步的,所述的S1步骤中输入空间SC通过联立式(17)与式(1)所 得:
Figure BDA0002595228730000061
式中,Cij为根据马蹄窑能耗计算方法计算结果,然后构造的特征值,sij为 样本集的离群系数集。
进一步的,所述的S1步骤中的能量构成项包括:燃料燃烧热Qq、助燃空 气物理显热Qreg,air、玻璃液面吸收热量Qlevel、混合料带入物理显热Qbatch、玻璃 熔融反应消耗热量Qreaction、熔化池池底与窑墙散热Qmelt,wall、蓄热室墙壁散热损 失Qreg,wall、燃料物理显热Qx、总烟气带走热量Qreg,flue、火焰空间碹顶及窑墙散 热Qcomb,wall、玻璃液带走的物理显热Qglass、玻璃反应气体带走热量Qbatch,air、蓄 热室排出废气带走热量Qwgas、格子体炉尘耗热损失热量Qbrick
与现有技术相比,有益效果是:
1.本发明提供的一种基于改进密度峰值聚类的马蹄窑能耗异常检测方法, 采用人工蜂群算法实现了截断距离的自适应优选过程,并设立离群系数策略以 实现自动划分簇中心和离群点的功能,实现智能、快速、精准的窑炉能耗异常 检测。
2.本发明通过改造自适应密度峰值聚类算法,并使用其对玻璃熔窑生产过 程的能耗数据进行聚类分析,以高效准确识别存在异常的能耗样本。
附图说明
图1是本发明马蹄窑能耗异常聚类检测方法的整体流程图。
图2是本发明人工蜂群算法用于截断距离优选的方法流程图。
图3是本发明基于离群系数自动识别离群点方法的流程图。
图4是本发明样本的分布图与决策图。
图5是本发明不同数据规模时的决策图。
图6是本发明决策图的概率密度分布曲线。
图7是本发明升序排序γ值的变化趋势图。
图8是本发明DPC算法决策图(572个样本)。
图9是本发明不同聚类算法的有效性指标示意图。
图10是本发明不同聚类算法的运行时间。
具体实施方式
附图仅用于示例性说明,不能理解为对本发明的限制;为了更好说明本实 施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于 本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。 附图中描述位置关系仅用于示例性说明,不能理解为对本发明的限制。
本发明提出了一种基于改进密度峰值聚类的马蹄窑能耗异常检测方法。该 方法首先针对密度峰值聚类存在着人工设定参数和无法自动划分簇中心和离群 点的不足,以人工蜂群算法实现了截断距离的自适应优选过程,并设立离群系 数策略以实现自动划分簇中心和离群点的功能。然后,基于马蹄窑的分层能量 模型,计算并构造能耗特征值。最后,应用ABC-DPC算法实现了能耗异常检 测,同时聚类结果可直接反映设备能耗状况。
1.快速搜索密度峰值聚类算法
快速搜索密度峰值聚类算法(DPC)实现原理:簇中心被较低局部密度的 邻近点围绕,且与较高密度的任何样本点有相对较大的距离。为此,对于每一 个样本点i要计算两个统计量:局部密度ρi和相对较高密度的最邻近点距离δi。 算法流程见下文描述。
理想的簇中心(算法中的密度峰值点)具备两个特征:其邻居点的局部密 度普遍小于该点的局部密度;不同簇中心相互排斥且相距较远距离。
样本点的局部密度定义为:
Figure BDA0002595228730000071
其中:d(xi,yi)是样本点之间的欧几里得距离度量(欧氏距离)。dc是截断距 离超参数,基本上ρi等于与样本点i距离小于dc内的邻居点个数。在所有样本 点的距离集合中,以升序排序取得百分之t位置的距离值作为dc的值。χ(·)相 当于密度估计的核函数,DPC给出了两种默认可选的核函数形态:
(1)截断核:其中χ(x)为0-1函数,如果x小于0,那么χ(x)取值为1;否 则χ(x)取值为0。表达式如下:
Figure BDA0002595228730000072
(2)高斯核:为避免异形簇中不同样本点出现相同的局部密度时,引入 高斯函核来定义局部密度,表达式如下:
Figure BDA0002595228730000083
样本点到较高密度点的最近邻距离δi:即样本点i与距离它最近的、密度更 高的点j的距离最小值。若样本点i是密度最大点时,则δi设定为所有节点中到 样本点i的最大距离,即从高密度最近邻距离集Δ中取得最大值。
综上所述,具体算法步骤如下:
(1)设定Q={q1,q2,…,qn}表示局部密度集P降序排序后,取其下标组成的 索引集合,则它满足:
Figure BDA0002595228730000081
(2)依索引集Q中的顺序依次计算δi,公式如下:
Figure BDA0002595228730000082
综合式(1)-(5),对于S中的每一个样本点xi可计算(ρii)。令Z={(ρii)}n i=1,并把Z作为绘制DPC算法决策图的输入空间,绘制效果如图4(b)所示。 其中图4(a)表示样本的2-D分布图,图4(b)表示DPC的决策图。图中的编号表 示样本点在数据集中的索引号,即偏左区域是可能成为离群点的序号,例如81、 146、211样本点分布于簇边界的位置;或偏右区域是可能成为簇中心的序号, 例如219、388、529的样本点正分布于簇群较中心位置。通过观察样本2-D分 布图与DPC决策图,DPC算法能有效准确地识辨识簇中心或者离群点。
(3)观测决策图4(b),从样本集中筛选出较小ρi且δi较大的样本判定为离 群点,或者筛选出较大ρi且较大δi的样本判定为簇中心。当簇中心确认后,除 中心以外的其他样本点归类到距离其最近的簇中心所属簇群中,基于以上步骤 完成聚类过程。
2.基于人工蜂群算法的参数优选方法
本发明提出的基于人工蜂群算法的截断距离参数自适应的优选策略,其主 要思想是通过人工蜂群算法优秀的寻优能力进行最优解搜索。
2.1人工蜂群算法
在求解问题过程中,若把问题的解比喻为蜜源位置,寻找优质蜜源即是寻 找最优解。其中ABC算法是采用不同角色交流、转化及协作实现的,即蜂群按 照雇佣蜂、跟随蜂和侦查蜂的角色分类。雇佣蜂负责搜寻蜜源,并分享蜜源位 置信息给跟随蜂;跟随蜂以轮盘赌形式挑选蜜源,并在其相邻位置继续寻找更 优蜜源;侦查蜂则由雇佣蜂直接转化而来,负责侦查无效蜜源并寻找新的蜜源。 如何判断无效蜜源,在算法中可设定阈值,超过阈值没有更新新蜜源则条件成 立。具体算法描述如下:
(1)定义输入空间:初始化解数量为sn,一只蜂个体寻找一处蜜源,sn 代表蜂种群的数量;d则是解的维度数。
Figure BDA0002595228730000091
(2)问题解的初始化公式:
Figure BDA0002595228730000092
式中:
Figure BDA0002595228730000093
是[0,1]内随机数,
Figure BDA0002595228730000094
Figure BDA0002595228730000095
构成解的每维度取值范围,即
Figure BDA0002595228730000096
(3)雇佣蜂阶段:因为雇佣蜂和跟随蜂群的觅食方式一样,即利用当前解 和其邻解来更新解,其搜寻公式为:
vij=xij+τ·(xij-xik); (8)
(4)跟随蜂阶段:全部雇佣蜂通过式(8)完成搜寻过程后,雇佣蜂将搜 寻到的解的信息(适应值)传递给跟随蜂,跟随蜂根据解的适应值确定选择概 率,并以轮盘赌的方式选择解,选择概率由式(9)和式(10)决定:
Figure BDA0002595228730000097
Figure BDA0002595228730000098
式中:fiti(Xi)、fi(Xi)、Pi分别代表蜜源的适应值、目标函数和选择概率。由 公式可知,fiti(Xi)越高则蜜源被跟随蜂选择的可能性越大。当选择的新解vi优于 被更新解xi时,则采用贪婪选择策略,让vi直接替换xi
(5)侦查蜂阶段:利用公式(7)随机产生新解,若优于原先解,则新解替 换原先解,否则保持原先解不变。让步骤(5)迭代limit次,当所有解中连续 更新失败达最大次数,输出最优解dc,算法正式结束。
2.2人工蜂群算法用于截断距离优选
DPC算法的截断距离参数设定实质是变量函数优化问题,即应对不同的数 据集、不同核函数等因素,截断距离参数将影响最终聚类效果。鉴于人工蜂群 算法优秀的求解能力,本发明将结合人工蜂群算法实现截断距离参数自适应优 选过程。为了量化不同dc取值对聚类结果影响,本发明将利用聚类性能度量作 为评价指标,即dc求解过程的收敛条件。由此本算法将采用了轮廓系数指标作 为适应值目标函数,它结合内聚度和分离度两种因素,以实现在不同规模的数 据集下评价不同dc取值的聚类性能表现。如图2所示,具体算法流程如下:
步骤1.计算所有样本点之间的欧氏距离,并按照升序排序得到距离集合 E={dc1,dc2,...,dcL},根据原始DPC算法指出,样本点附近邻居点个数不超过总 数的2%,因此可设定dc的搜索空间为E的前2%,故L为E的前2%的距离值 的统计量。改写公式(7)并初始化解:
Figure BDA0002595228730000101
步骤2.执行DPC算法,并根据聚类结果计算Sil指标作为每个解的适应值, 以及记录当前解为最优解。Sil指标由式(12)计算得:
Figure BDA0002595228730000102
步骤3.雇佣蜂阶段:在当前解的邻近解中进行搜寻以更新解,搜寻公式由 式(3)(8)改写得:
Figure BDA0002595228730000103
式中:dck是在种群中随机选择的邻居解,且dck≠dci;当产生新解vi时, 同时计算其Sil指标。由于Sil取值范围为[-1,1],Sil取值越接近1表示聚类效 果越好。为此适应度目标函数由式(3)(9)改写得:
Figure BDA0002595228730000104
步骤4.跟随蜂阶段:跟随蜂是根据雇佣蜂带回的适应值进行随机选择,即 通过式(10)与(14)计算被选中概率,以轮盘赌方式选择新解。若新解优于 被更新解dci,则让vi替换dci
步骤5.侦查蜂时期:再次利用式(11)随机产生新的解,并依次执行步骤2、 步骤3、步骤4,若迭代次数达到预设的limit次,仍然没有产生更好Sil指标 的新解,输出最优解dc,算法正式结束。
3.基于离群系数自动识别离群点方法
DPC算法采用观测决策图形式确定离群点或者簇中心,即从样本集中筛选 出较小ρi且δi较大的样本判定为离群点,或筛选出较大ρi且较大δi的样本判定 为簇中心。筛选标准上容易受到人为主观因素影响,导致噪声对象误判为目标 对象的情况发生。或数据规模剧增时,噪声对象也随着增加,决策图决策效果 并不理想,如图5所示。
考虑到人为决策方案的不足,本实施例将模拟人为观测决策图的筛选策略, 定义一个离群系数γi=f(ρii),通过分析样本集中所有样本的γ值大小,以实现 自动识别离群点和簇中心的功能。离群系数由公式(15)计算所得:
Figure BDA0002595228730000111
式中:f(ρii)表示二元分段函数,ρθ表示分界条件。由DPC算法思想与 DPC决策图的特性可知,决策图可大致分成左、右两部分,同一左侧越往左上 方偏移则样本点越有可能成为离群点,同一右侧越往右上方偏移则样本越适合 成为簇中心。
由上所述,ρθ相当于划分左、右两侧的边界条件值,是判断样本点有可能 成为离群点或者簇群中心的关键要素。实现自动识别离群点或簇中心的关键问 题是使得二元分段函数的计算方式生效,即寻找合适的边界条件值,如图3所 示,具体步骤如下:
步骤1.设定决策图的输入空间为Z,并将其归一化到数据空间[0,1]2∈R2内;
Z={ζ12,…,ζn}={(ρ11),…,(ρnn)}; (16)
步骤2.将Z经高斯核密度估计变换,得到决策图的概率密度分布曲线,如 图6所示。
在数学上,核是由带宽参数σ控制的正值函数K(ρ,δ)。这里的带宽作为平 滑参数,用来平衡结果中偏差和方差的值。在给定核的形状后(本实施例选择 高斯核),其概率密度函数Pk(y)由式(17)与式(18)计算而得:
Figure BDA0002595228730000112
Figure BDA0002595228730000113
步骤3.观测图6的的概率密度分布曲线,它在形态上是较符合正态分布, 与DPC决策图表现的特征基本一致。即曲线以ρb为分界处分成左右两部分区域, 较低与较高密度点的频数都相对较低,其中局部密度较低点位于左侧,局部密 度较高点位于右侧。概率密度分布代表了样本的分布频数,以ρb值划分的左侧 区域为出现频率较低的样本分布区域,在该区域内所有对象点均有可能成为离 群点,为此设定离群系数公式的边界条件ρθ=ρb
步骤4.最后,由式(15)计算得样本集的离群系数集:
Γ={γ12,...,γθ,...,γn}; (19)
设定Y表示离群系数集Γ升序排序后,取其下标组成的索引集合:
Y={y1,y2,...,yn}; (20)
则它满足:
Figure BDA0002595228730000121
步骤5.按照式(21)中γ升序排序得到的离群系数集Γ绘制图表,如图7 所示。观察图7可知,簇中心或离群点与大部分样本的γ差值较大,即存在明显 的“跳跃点”。非簇中心的γ值之间差值较小且变化趋于平稳。由此,在“跳跃点” 位置设定阈值边界,让算法识别阈值边界以自动识别出离群点和簇中心。
具体操作步骤为,让相邻的γ值两两相减得到差值集合。从小到到依次搜索 差值集合,寻找差值小于设定阈值的位置序号k。然后,从式(21)中导出前k 位样本的索引序号{y1,y2,…,yk}。最后,根据索引序号依次从S中导出k个离 群样本{xy1,xy2,…,xyk}。
4.基于改进密度峰值聚类的马蹄窑能耗异常检测方法
本发明提出一种以人工蜂群算法实现截断距离自适应优选策略,并设立离 群系数策略以实现自动划分簇中心和离群点的改进密度峰值算法,本发明称其 为ABC-DPC算法。
本发明将结合马蹄窑的领域知识来构建基于ABC-DPC算法的马蹄窑能耗 异常聚类检测模型,即通过研究马蹄窑的分层能量模型,逐层解析分层能量模 型,捕获整个马蹄窑所涉及的能量构成项,以此计算并构造能耗特征值,然后 实现马蹄窑的能耗异常检测。
已知马蹄窑分层能量模型的基础是各个窑炉子***的热平衡方程式。在分 层能量模型中,各个能量构成项与池窑热效率指标代表着窑炉整体及其子*** 的能耗信息和设备状态。其次,由于监控窑炉的工况信息是通过传感仪器测量 及采集的,传感仪器由于安装位置、网络环境、使用寿命等因素,可能造成数 据采集偏差问题。由此,从窑炉设备的单位能耗角度实现异常检测,不仅能避 免部分工况数据扰动影响,而且可直接反映窑炉整体及其子***的能耗信息, 从而间接了解设备的运作状态。具体,如图1所示,基于ABC-DPC算法马蹄 窑能耗异常聚类检测的方法流程如下:
步骤1:提取马蹄窑分层能量模型中的14个能量构成项以及池窑热效率, 如表1所示;
表1马蹄窑所有局部能量构成项
Figure BDA0002595228730000131
马蹄窑能耗计算方法计算并构造特征值,记作输入空间C:
Figure BDA0002595228730000132
式中,Cij为能耗特征值,根据马蹄窑能耗计算方法计算结果,然后构造的 特征值。根据马蹄窑能耗计算方法计算并构造特征值,记作输入空间C,输入 空间C是前文所声明的由马蹄窑分层能量模型中的能量构成项以及池窑热效率 来构成特征值的,共15个,其中能量构成项是由马蹄窑能耗计算方法计算而 得;这些特征值来自于表1中的局部能量构成项。
以时间序列为等价连接条件,联立式(19)和式(22)建立包含马蹄窑原 始工况信息以及能耗信息的输入空间SC:
Figure BDA0002595228730000141
式中,sij为样本集的原始特征值,cij为能耗特征值,表格1共15个特 征。S与C组合形成新的输入空间SC,即包含原始工况特征以及能耗特征的 输入空间。
步骤2:基于距离度量的聚类算法,因数据特征的量纲不同,导致部分特 征较大影响聚类效果。因此需要把输入空间SC归一化到数据空间 [0,1]m+15∈Rm+15内,以抵消特征属性量纲不同影响聚类效果。
对矩阵SC进行转置:
ST=SCT; (24)
对数据集中每一特征i进行最大-最小值归一化:
Figure BDA0002595228730000142
步骤3:启用基于人工蜂群算法的截断距离参数优选方法,计算最优Sil指 标的截断距离,输出dc。
步骤4:设定最优dc,初始化并运算DPC算法,直至得到ST的局部密度 集P和最近邻距离集Δ。
步骤5:启用离群系数计算方法,计算ST中每个样本的离群系数,并输出 离群系数集Γ。
步骤6:升序排序Γ,并让相邻的值两两相减得到差值集。检索差值集中小 于设定阈值的索引位置k。从升序Γ中取得前k位样本的索引序号{y1,y2,…,yk}, 然后根据索引序号依序从ST中导出异常能耗样本,记作A={Cy1,Cy2,…,Cyk}。
实施例
为验证本发明提出的马蹄窑异常聚类检测模型的有效性,本实验将以广东 佛山某玻璃厂的蓄热式马蹄窑为研究对象,具体从马蹄窑生产控制***的数据 库中提取2019年1~2月的22880条原始工况数据作为样本,以开展本课题的聚 类异常检测实验研究。其次,基于马蹄窑原始工况数据集,计算并构造马蹄窑 的能耗数据集。
1)实验环境与数据
本发明节涉及算法均在PC上进行实验的。其中,计算机配置为Intel i7 87003.2GHz CPU、16GB DDR4 RAM;软件环境为Windows 10;编程语言为Python 3.7.1。
2)实验数据
马蹄窑周期性工况数据集(PWSD)如表2所示;马蹄窑局部能耗数据集 (ECD)如表3所示。PWSD是经过周期处理得到的生产工况数据集;ECD则 基于PWSD,集合马蹄窑的分层能量模型所有能量构成项的数据集。它们以周 期时间序列为枢纽构建联系,让某周期时间序列内的能耗信息反映着马蹄窑整 体及其子***的实际生产工况。
表2 PWSD数据集
Figure BDA0002595228730000151
表3 ECD数据集
Figure BDA0002595228730000161
在表2中,“标签值”属性实质是马蹄窑生产控制***检测到生产工况发生 异常波动时,***报错给工作人员处理后的结果。异常标记的取值是0(异常) 和1(非异常),因此在本实验中可充当类标签使用。
3)实验结果
根据马蹄窑能耗异常聚类模型,同样可得DPC算法决策图,如图8所示。
升序排列Γ,取前k位索引序号为{y1,y2,…,yk}的样本,yi,i=1,2,...k表示 序号,以组成异常能耗样本集A={cy1,cy2,…,cyk},样本集A={cy1,cy2,…,cyk}与表 4的参数yi一一对应;如表4所示:
表4异常能耗样本集A
Figure BDA0002595228730000171
联立集合Γ、S以及C,根据索引序号{y1,y2…,yk}导出对应的离群系数、池 窑热效率,以及S的标签值,得到能耗异常检测参考表,如表5所示:
表5能耗异常检测参考表
Figure BDA0002595228730000172
联立表4和表5可以分析样本点的能耗信息、池窑热效率与离群系数的关 系。离群系数越大,样本的池窑热效率接近于较中心样本点平均水平。同理,离 群系数越小,样本池窑热效率越低,说明样本越有可能存在能耗异常。即样本 点的池窑热效率与其离群系数成正比关系。经多组实验结果表明,基于 ABC-DPC的马蹄窑能耗异常检测模型的聚类结果接近于调研的池窑热效率水 平,符合实际生产条件。
4)聚类有效性分析
本发明通过无监督聚类算法,以聚类识别离群点原理,再结合马蹄窑的能 耗信息以实现能耗异常检测。为此,本实验环节将围绕聚类算法有效性指标对 聚类异常检测性能进行验证:
1.横向对比聚类检测算法:约定相同数据集下,利用有效性指标(Sil、FMI 以及DBI)来评估不同聚类算法的聚类性能表现。其中,Sil、DBI指标可表示 聚类异常检测结果的可靠程度,FM指标则表示聚类检测的准确率。本文选择 比较的聚类算法有:K-means算法、DBSCAN算法、DPC算法以及ABC-DPC 算法。
2.考察不同特征组合:横向对比原始工况数据集和马蹄窑局部能耗数据集, 考察经领域知识特征改造后即结合马蹄窑的能耗信息进行聚类检测,对聚类有 效性的提升是否有效进行了验证。为此得到实验方案如表6所示:
表6聚类异常检测实验方案
Figure BDA0002595228730000181
已知Sil指标的值域为[-1,1]。对于不正确的聚类,Sil越接近-1;Sil接近 1时,表示该样本越适合被划分到当前簇。当簇内分布密集且簇间分离较好时, 则分数更高,符合簇的标准概念定义。FM指数表示为成对查准率和查全率的 几何平均值。FM指数的值域为[0,1],该指数表示经聚类划分的标签集和真实标 签集之间的相似性,值越高表示越相似,即聚类划分效果越好。DBI指数是计 算任意两个不同类簇中数据到其所属簇质心的平均距离与不同簇之间的质心距 离的最大比值,以衡量类簇之间相似度。DBI越低,说明簇间越分散、簇内元 素越紧凑,聚类表现越好。
依表6的方案在不同数据规模下展开实验,以FM、DBI与Sil指标度量聚 类的性能表现。实验方案1的结果如表7所示,实验方案2的结果如表8所示。
表7不同聚类算法的DBI、FM、Sil指标对比(PWSD)
Figure BDA0002595228730000191
表8不同聚类算法的DBI、FM、Sil指标对比(ECD)
Figure BDA0002595228730000192
便于比较结果,将表7与表8的实验结果绘制图表,如图9所示。
从实验结果分析可得结论,ABC-DPC较于经典聚类算法的聚类有效性指标 是最优的,特别是随着数据规模增加,效果俞明显。另外,由原始工况特征 (PWSD数据集)经领域知识构造能耗特征值(ECD数据集),在K-means、 DBSCAN、DPC以及ABC-DPC算法上运算,整体聚类有效性指标后者都优于 前者。
5)时间复杂度分析
算法的执行时间与程序代码语句执行次数成正比例关系,即程序代码语句 执行次数越多,算法执行时间就越久。假设问题的规模为n,程序代码语句执 行次数可称为时间频度,记作T(n)。
有关ABC-DPC聚类异常检测算法的时间复杂度计算:(1)计算距离矩阵: 计算数据空间中样本点两两之间距离,时间频数为n2;(2)启用ABC算法的截 断距离优选过程,时间频数为0.02n2;(3)计算局部密度ρ,时间频数为n2;(4) 计算较高密度点的最近邻距离δ:计算每个样本点距离密度较高点的最近邻距离, 时间频数为n2;(5)样本归属簇群划分:样本按照局部密度降序排列,从高到 底依次划分,时间频数为n2。算法的总时间频数为:
T(n)=n2+0.02n2+n2+n2+n2=c·n2,c∈N+; (26)
由式(26)可得,ABC-DPC的时间复杂度为T(n)=O(n2)。
同样地,聚类算法的运行时间也是值得关注的统计量。因为算法的时间复 杂度是一个描述算法运行时间增长率的函数,它只是定性描述该算法的运行时 间。当问题规模继续增长时,时间复杂度就无法提供真实的时间性能反馈信息。 为此,参考聚类有效性分析环节的实验方案,再次考察不同实验方案下考察聚 类算法的实际运行时间,实验结果如图10所示。
从实验结果分析可知,ABC-DPC的时间性能表现,与其他聚类算法对比相 差无几,但取得最佳的聚类有效性指标。另外,使用ECD数据集比PWSD数 据集进行聚类运算,所有聚类算法时间性能表现是前者优于后者的。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并 非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述 说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有 的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替 换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (10)

1.一种基于改进密度峰值聚类的马蹄窑能耗异常检测方法,其特征在于,包括以下步骤:
S1.提取马蹄窑分层能量模型中的能量构成项以及池窑热效率η;马蹄窑能耗计算并构造特征值,记作输入空间C:
以时间序列为等价连接条件,建立包含马蹄窑原始工况信息以及能耗信息的输入空间SC;
S2.把输入空间SC归一化到数据空间内,以抵消特征属性量纲不同影响聚类效果;对矩阵SC进行转置:
ST=SCT, (1)
对数据集中每一特征i进行最大-最小值归一化;
S3.启用基于人工蜂群算法的截断距离参数优选方法,计算最优Sil指标的截断距离,输出dc;
S4.设定最优dc,初始化并运算密度峰值聚类算法即DPC算法,直至得到ST的局部密度集P和最近邻距离集Δ;
S5.启用离群系数计算方法,计算ST中每个样本的离群系数,并输出离群系数集Γ;
S6.升序排序Γ,并让相邻的值两两相减得到差值集;检索差值集中小于设定阈值的索引位置k;从升序Γ中取得前k位样本的索引序号{y1,y2,…,yk},然后根据索引序号依序从ST中导出异常能耗样本,记作A={Cy1,Cy2,…,Cyk}。
2.根据权利要求1所述的基于改进密度峰值聚类的马蹄窑能耗异常检测方法,其特征在于,把输入空间SC归一化到数据空间内,所述的数据空间为[0,1]m+15∈Rm+15,其中,R表示实数,m是预设的截断参数。
3.根据权利要求2所述的基于改进密度峰值聚类的马蹄窑能耗异常检测方法,其特征在于,所述的最大-最小值归一化的计算公式为:
Figure FDA0002595228720000011
式中,SC为输入空间,ST为SC的转置矩阵,
Figure FDA0002595228720000012
为特征i的最大转置矩阵,
Figure FDA0002595228720000013
为特征i的最小转置矩阵,STi为特征i的转置矩阵,n是样本数。
4.根据权利要求3所述的基于改进密度峰值聚类的马蹄窑能耗异常检测方法,其特征在于,所述的S3步骤具体包括:
S31.计算所有样本点之间的欧氏距离,并按照升序排序得到距离集合E={dc1,dc2,...,dcL},初始化解:
Figure FDA0002595228720000021
式中,dc为截断距离,
Figure FDA0002595228720000022
为最大截断距离,
Figure FDA0002595228720000023
为最小截断距离,
Figure FDA0002595228720000024
为预先设定的系数;
S32.执行DPC算法,并根据聚类结果计算Sil指标作为每个解的适应值,以及记录当前解为最优解。Sil指标由式(5)计算得:
Figure FDA0002595228720000025
式中,n为数据集中样本总数,bt为结束聚类结果,at为初始聚类结果;
S33.雇佣蜂阶段:在当前解的邻近解中进行搜寻以更新解,搜寻公式为:
Figure FDA0002595228720000026
式中,τ为随机系数,dck是在种群中随机选择的邻居解,且dck≠dci;当产生新解vi时,同时计算其Sil指标;由于Sil取值范围为[-1,1],Sil取值越接近1表示聚类效果越好;为此适应度目标函数为:
Figure FDA0002595228720000027
S34.跟随蜂阶段:跟随蜂是根据雇佣蜂带回的适应值进行随机选择;即通过式(6)与(7)计算被选中概率,以轮盘赌方式选择新解;若新解优于被更新解dci,则让vi替换dci;其中式(7)的公式为:
Figure FDA0002595228720000028
S35.侦查蜂时期:再次利用式(5)随机产生新的解,并依次执行步骤S32、步骤S33、步骤S34,若迭代次数达到预设的limit次,仍然没有产生更好Sil指标的新解,输出最优解dc,算法正式结束。
5.根据权利要求4所述的基于改进密度峰值聚类的马蹄窑能耗异常检测方法,其特征在于,所述的S4步骤中初始化并运算DPC算法,直至得到ST的局部密度集P和最近邻距离集Δ具体包括以下步骤:
S41.样本点的局部密度定义为:
Figure FDA0002595228720000031
其中:d(xi,yi)是样本点之间的欧几里得距离度量即欧氏距离;dc是截断距离超参数,基本上ρi等于与样本点i距离小于dc内的邻居点个数;在所有样本点的距离集合中,以升序排序取得百分之t位置的距离值作为dc的值;χ(·)相当于密度估计的核函数;
S2.DPC给出了两种默认可选的核函数形态:
截断核:其中χ(x)为0-1函数,如果x小于0,那么χ(x)取值为1;否则χ(x)取值为0;表达式如下:
Figure FDA0002595228720000032
高斯核:为避免异形簇中不同样本点出现相同的局部密度时,引入高斯函核来定义局部密度,表达式如下:
Figure FDA0002595228720000033
S3.样本点到较高密度点的最近邻距离δi:即样本点i与距离它最近的、密度更高的点j的距离最小值;若样本点i是密度最大点时,则δi设定为所有节点中到样本点i的最大距离,即从高密度最近邻距离集Δ中取得最大值。
6.根据权利要求5所述的基于改进密度峰值聚类的马蹄窑能耗异常检测方法,其特征在于,所述的S5步骤中离群系数计算方法包括以下步骤:
S51.考虑到人为决策方案的不足,将模拟人为观测决策图的筛选策略,定义一个离群系数γi=f(ρii),通过分析样本集中所有样本的γ值大小,以实现自动识别离群点和簇中心的功能;离群系数由公式(12)计算所得:
Figure FDA0002595228720000034
式中:f(ρii)表示二元分段函数,ρθ表示分界条件;由DPC算法思想与DPC决策图的特性可知,决策图可大致分成左、右两部分,同一左侧越往左上方偏移则样本点越有可能成为离群点,同一右侧越往右上方偏移则样本越适合成为簇中心;
S52.设定决策图的输入空间为Z,并将其归一化到数据空间[0,1]2∈R2内;
Z={ζ12,...,ζn}={(ρ11),...,(ρnn)}; (12)
式中,ρi为较小的样本,δi为分界条件,ζi为数据空间的特征值;
S53.将Z经高斯核密度估计变换,得到决策图的概率密度分布曲线;在数学上,核是由带宽参数σ控制的正值函数K(ρ,δ);这里的带宽作为平滑参数,用来平衡结果中偏差和方差的值;在给定核的形状后,其概率密度函数Pk(y)由式(13)与式(14)计算而得:
Figure FDA0002595228720000041
Figure FDA0002595228720000042
式中,σ为带宽参数,δ为分界条件,K(ρ,δ)为正值函数,y为索引序号,xi为离群样本点;
S54.观测概率密度分布曲线图,可知它在形态上是较符合正态分布,与DPC决策图表现的特征基本一致;即曲线以ρb为分界处分成左右两部分区域,较低与较高密度点的频数都相对较低,其中局部密度较低点位于左侧,局部密度较高点位于右侧;概率密度分布代表了样本的分布频数,以ρb值划分的左侧区域为出现频率较低的样本分布区域,在该区域内所有对象点均有可能成为离群点,为此设定离群系数公式的边界条件ρθ=ρb
S55.最后,由式(11)计算得样本集的离群系数集:
Γ={γ12,...,γθ,...,γn}; (15)
设定Y表示离群系数集Γ升序排序后,取其下标组成的索引集合:
Y={y1,y2,...,yn}; (16)
则它满足:
Figure FDA0002595228720000043
7.根据权利要求6所述的基于改进密度峰值聚类的马蹄窑能耗异常检测方法,其特征在于,所述的输入空间的表达式为:
Figure FDA0002595228720000051
式中,Cij为根据马蹄窑能耗计算方法计算结果,然后构造的特征值。
8.根据权利要求7所述的基于改进密度峰值聚类的马蹄窑能耗异常检测方法,其特征在于,所述的S1步骤中输入空间SC通过联立式(16)与式(18)所得:
Figure FDA0002595228720000052
式中,Cij为能耗特征值,根据马蹄窑能耗计算方法计算结果,然后构造的特征值,sij为样本集的离群系数集。
9.根据权利要求1所述的基于改进密度峰值聚类的马蹄窑能耗异常检测方法,其特征在于,所述的S1步骤中的能量构成项包括:燃料燃烧热Qq、助燃空气物理显热Qreg,air、玻璃液面吸收热量Qlevel、混合料带入物理显热Qbatch、玻璃熔融反应消耗热量Qreaction、熔化池池底与窑墙散热Qmelt,wall、蓄热室墙壁散热损失Qreg,wall、燃料物理显热Qx、总烟气带走热量Qreg,flue、火焰空间碹顶及窑墙散热Qcomb,wall、玻璃液带走的物理显热Qglass、玻璃反应气体带走热量Qbatch,air、蓄热室排出废气带走热量Qwgas、格子体炉尘耗热损失热量Qbrick
10.根据权利要求4所述的基于改进密度峰值聚类的马蹄窑能耗异常检测方法,其特征在于,根据原始DPC算法指出,样本点附近邻居点个数不超过总数的2%,因此设定dc的搜索空间为E的前2%,故L为E的前2%的距离值的统计量。
CN202010707133.8A 2020-07-21 2020-07-21 一种基于改进密度峰值聚类的马蹄窑能耗异常检测方法 Active CN112070109B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010707133.8A CN112070109B (zh) 2020-07-21 2020-07-21 一种基于改进密度峰值聚类的马蹄窑能耗异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010707133.8A CN112070109B (zh) 2020-07-21 2020-07-21 一种基于改进密度峰值聚类的马蹄窑能耗异常检测方法

Publications (2)

Publication Number Publication Date
CN112070109A true CN112070109A (zh) 2020-12-11
CN112070109B CN112070109B (zh) 2023-06-23

Family

ID=73656451

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010707133.8A Active CN112070109B (zh) 2020-07-21 2020-07-21 一种基于改进密度峰值聚类的马蹄窑能耗异常检测方法

Country Status (1)

Country Link
CN (1) CN112070109B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113034210A (zh) * 2021-04-28 2021-06-25 重庆大学 一种基于数据驱动场景下车辆行驶成本评价方法
CN113158817A (zh) * 2021-03-29 2021-07-23 南京信息工程大学 一种基于快速密度峰聚类的客观天气分型方法
CN113626502A (zh) * 2021-08-13 2021-11-09 南方电网深圳数字电网研究院有限公司 基于集成学习的电网数据异常检测方法及装置
CN113917263A (zh) * 2021-10-09 2022-01-11 乐创达投资(广东)有限公司 一种基于预测数据的异常能耗二次监测的方法及***
CN114613456A (zh) * 2022-03-07 2022-06-10 哈尔滨理工大学 一种基于改进密度峰值聚类算法的高熵合金硬度预测方法
CN115310879A (zh) * 2022-10-11 2022-11-08 浙江浙石油综合能源销售有限公司 一种基于半监督聚类算法的多加油站用电量能耗管控方法
CN115494013A (zh) * 2022-11-17 2022-12-20 河北先河环保科技股份有限公司 水质异常的检测方法、设备及存储介质
CN116304776A (zh) * 2023-03-21 2023-06-23 宁波送变电建设有限公司运维分公司 基于k-Means算法的电网数据值异常检测方法及***
CN116756526A (zh) * 2023-08-17 2023-09-15 北京英沣特能源技术有限公司 一种蓄能设备全生命周期性能检测分析***
CN116881677A (zh) * 2023-09-08 2023-10-13 苏州科尔珀恩机械科技有限公司 一种窑炉运行能耗数据优化采集分析方法
CN116953488A (zh) * 2023-09-19 2023-10-27 深圳市东陆科技有限公司 一种用于集成光电芯片的监测方法
CN117076522A (zh) * 2023-10-13 2023-11-17 北京嘉洁能科技股份有限公司 一种热量数据处理方法及智能热量表数据处理***
CN117349630A (zh) * 2023-12-04 2024-01-05 邢台医学高等专科学校 一种用于生化数据分析的方法及***
CN117520947A (zh) * 2023-11-21 2024-02-06 中国科学院半导体研究所 异常监测与故障识别的方法及装置
CN117571107A (zh) * 2024-01-15 2024-02-20 山西富衡达自动化设备有限公司 一种智能化无人值守地磅异常监测***

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120022700A1 (en) * 2009-06-22 2012-01-26 Johnson Controls Technology Company Automated fault detection and diagnostics in a building management system
CN105930862A (zh) * 2016-04-13 2016-09-07 江南大学 一种基于密度自适应距离的密度峰聚类算法
CN107545273A (zh) * 2017-07-06 2018-01-05 北京航空航天大学 一种基于密度的局部离群点检测方法
CN107644032A (zh) * 2016-07-21 2018-01-30 中兴通讯股份有限公司 离群点检测方法和装置
CN108388759A (zh) * 2018-05-29 2018-08-10 广东工业大学 一种马蹄焰玻璃窑能耗建模与局部能耗标杆方法
CN109543741A (zh) * 2018-11-16 2019-03-29 重庆邮电大学 一种基于改进人工蜂群的fcm算法优化方法
CN109886334A (zh) * 2019-02-20 2019-06-14 安徽师范大学 一种隐私保护的共享近邻密度峰聚类方法
US20190370702A1 (en) * 2017-03-02 2019-12-05 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for recommending a pick-up location

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120022700A1 (en) * 2009-06-22 2012-01-26 Johnson Controls Technology Company Automated fault detection and diagnostics in a building management system
CN105930862A (zh) * 2016-04-13 2016-09-07 江南大学 一种基于密度自适应距离的密度峰聚类算法
CN107644032A (zh) * 2016-07-21 2018-01-30 中兴通讯股份有限公司 离群点检测方法和装置
US20190370702A1 (en) * 2017-03-02 2019-12-05 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for recommending a pick-up location
CN107545273A (zh) * 2017-07-06 2018-01-05 北京航空航天大学 一种基于密度的局部离群点检测方法
CN108388759A (zh) * 2018-05-29 2018-08-10 广东工业大学 一种马蹄焰玻璃窑能耗建模与局部能耗标杆方法
CN109543741A (zh) * 2018-11-16 2019-03-29 重庆邮电大学 一种基于改进人工蜂群的fcm算法优化方法
CN109886334A (zh) * 2019-02-20 2019-06-14 安徽师范大学 一种隐私保护的共享近邻密度峰聚类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ANKITA BOSE ET AL.: "Artificial Bee Colony Inspired Density Based Clustering with efficient Parameter Selection", 《2019 IEEE 16TH INDIA COUNCIL INTERNATIONAL CONFERENCE (INDICON)》 *
姜建华: "基于CDbw和人工蜂群优化的密度峰值聚类算法", 《吉林大学学报(理学版)》 *
杨海东 等: "基于数值模拟的马蹄焰玻璃窑蓄热室热效率研究", 《化工学报》 *
郑虹: "布谷鸟优化的密度峰值快速搜索聚类算法", 《长春工业大学学报》 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113158817A (zh) * 2021-03-29 2021-07-23 南京信息工程大学 一种基于快速密度峰聚类的客观天气分型方法
CN113158817B (zh) * 2021-03-29 2023-07-18 南京信息工程大学 一种基于快速密度峰聚类的客观天气分型方法
CN113034210A (zh) * 2021-04-28 2021-06-25 重庆大学 一种基于数据驱动场景下车辆行驶成本评价方法
CN113034210B (zh) * 2021-04-28 2022-02-01 重庆大学 一种基于数据驱动场景下车辆行驶成本评价方法
CN113626502A (zh) * 2021-08-13 2021-11-09 南方电网深圳数字电网研究院有限公司 基于集成学习的电网数据异常检测方法及装置
CN113626502B (zh) * 2021-08-13 2024-05-14 南方电网数字平台科技(广东)有限公司 基于集成学习的电网数据异常检测方法及装置
CN113917263A (zh) * 2021-10-09 2022-01-11 乐创达投资(广东)有限公司 一种基于预测数据的异常能耗二次监测的方法及***
CN113917263B (zh) * 2021-10-09 2022-05-24 乐创达投资(广东)有限公司 一种基于预测数据的异常能耗二次监测的方法及***
CN114613456A (zh) * 2022-03-07 2022-06-10 哈尔滨理工大学 一种基于改进密度峰值聚类算法的高熵合金硬度预测方法
CN115310879A (zh) * 2022-10-11 2022-11-08 浙江浙石油综合能源销售有限公司 一种基于半监督聚类算法的多加油站用电量能耗管控方法
CN115310879B (zh) * 2022-10-11 2022-12-16 浙江浙石油综合能源销售有限公司 一种基于半监督聚类算法的多加油站用电量能耗管控方法
CN115494013A (zh) * 2022-11-17 2022-12-20 河北先河环保科技股份有限公司 水质异常的检测方法、设备及存储介质
CN116304776B (zh) * 2023-03-21 2023-11-21 宁波送变电建设有限公司运维分公司 基于k-Means算法的电网数据值异常检测方法及***
CN116304776A (zh) * 2023-03-21 2023-06-23 宁波送变电建设有限公司运维分公司 基于k-Means算法的电网数据值异常检测方法及***
CN116756526B (zh) * 2023-08-17 2023-10-13 北京英沣特能源技术有限公司 一种蓄能设备全生命周期性能检测分析***
CN116756526A (zh) * 2023-08-17 2023-09-15 北京英沣特能源技术有限公司 一种蓄能设备全生命周期性能检测分析***
CN116881677A (zh) * 2023-09-08 2023-10-13 苏州科尔珀恩机械科技有限公司 一种窑炉运行能耗数据优化采集分析方法
CN116881677B (zh) * 2023-09-08 2023-11-17 苏州科尔珀恩机械科技有限公司 一种窑炉运行能耗数据优化采集分析方法
CN116953488A (zh) * 2023-09-19 2023-10-27 深圳市东陆科技有限公司 一种用于集成光电芯片的监测方法
CN116953488B (zh) * 2023-09-19 2023-12-12 深圳市东陆科技有限公司 一种用于集成光电芯片的监测方法
CN117076522A (zh) * 2023-10-13 2023-11-17 北京嘉洁能科技股份有限公司 一种热量数据处理方法及智能热量表数据处理***
CN117076522B (zh) * 2023-10-13 2023-12-22 北京嘉洁能科技股份有限公司 一种热量数据处理方法及智能热量表数据处理***
CN117520947A (zh) * 2023-11-21 2024-02-06 中国科学院半导体研究所 异常监测与故障识别的方法及装置
CN117349630A (zh) * 2023-12-04 2024-01-05 邢台医学高等专科学校 一种用于生化数据分析的方法及***
CN117349630B (zh) * 2023-12-04 2024-02-23 邢台医学高等专科学校 一种用于生化数据分析的方法及***
CN117571107A (zh) * 2024-01-15 2024-02-20 山西富衡达自动化设备有限公司 一种智能化无人值守地磅异常监测***
CN117571107B (zh) * 2024-01-15 2024-03-15 山西富衡达自动化设备有限公司 一种智能化无人值守地磅异常监测***

Also Published As

Publication number Publication date
CN112070109B (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
CN112070109A (zh) 一种基于改进密度峰值聚类的马蹄窑能耗异常检测方法
CN110619360A (zh) 一种考虑历史样本相似性的超短期风功率预测方法
CN113627735B (zh) 工程建设项目安全风险的预警方法及***
CN112734128A (zh) 一种基于优化rbf的7日电力负荷峰值预测方法
Wang et al. Fault detection and diagnosis for multiple faults of VAV terminals using self-adaptive model and layered random forest
CN117574308B (zh) 基于人工智能的计量芯片异常检测方法及***
CN102339347A (zh) 用于技术***的计算机辅助分析的方法
CN117008479B (zh) 基于生物质气化炉的负碳排放优化控制方法及***
Li et al. Distance measures in building informatics: An in-depth assessment through typical tasks in building energy management
CN110427019B (zh) 一种基于多变量判别分析的工业过程故障分类方法及控制装置
Yu et al. An improved just-in-time learning scheme for online fault detection of nonlinear systems
CN116205508A (zh) 一种分布式光伏发电异常诊断方法和***
CN116467658A (zh) 一种基于马尔科夫链的设备故障溯源方法
CN116562746A (zh) 一种被服物流站点的被服数据监控方法及相关装置
CN117076691A (zh) 一种面向智慧社区的商品资源知识图谱算法模型
CN116429269A (zh) 一种乙烯裂解炉炉管红外智能分析***
CN116796291A (zh) 一种基于lstm-mea-svr空气质量预报的***
CN115017818A (zh) 基于注意力机制和多层lstm的电厂烟气含氧量智能预测方法
CN115982608A (zh) 一种基于线损动态分析的线损异常判断方法
CN113255223B (zh) 一种空调负荷短期预测方法及***
CN112598057B (zh) 一种基于feknn策略的燃煤电厂锅炉故障诊断方法
CN115795999A (zh) 一种长期服役抽水蓄能机组性能异常预警方法
CN115577308A (zh) 一种故障特征选择的蛇优化支持向量机的轴承故障分类方法
Zhou et al. Study on Optimization of Data-Driven Anomaly Detection
CN111461565A (zh) 一种电力调控下的电源侧发电性能评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant