CN113435547B - 一种水质指标融合数据异常检测方法及*** - Google Patents

一种水质指标融合数据异常检测方法及*** Download PDF

Info

Publication number
CN113435547B
CN113435547B CN202110992212.2A CN202110992212A CN113435547B CN 113435547 B CN113435547 B CN 113435547B CN 202110992212 A CN202110992212 A CN 202110992212A CN 113435547 B CN113435547 B CN 113435547B
Authority
CN
China
Prior art keywords
data
index
water quality
abnormal
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110992212.2A
Other languages
English (en)
Other versions
CN113435547A (zh
Inventor
嵇晓燕
肖建军
杨凯
孙宗光
贺鹏
王姗姗
安新国
徐鹏
李亚男
王正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jinshui Yongli Technology Co ltd
CHINA NATIONAL ENVIRONMENTAL MONITORING CENTRE
Original Assignee
Beijing Jinshui Yongli Technology Co ltd
CHINA NATIONAL ENVIRONMENTAL MONITORING CENTRE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jinshui Yongli Technology Co ltd, CHINA NATIONAL ENVIRONMENTAL MONITORING CENTRE filed Critical Beijing Jinshui Yongli Technology Co ltd
Priority to CN202110992212.2A priority Critical patent/CN113435547B/zh
Publication of CN113435547A publication Critical patent/CN113435547A/zh
Application granted granted Critical
Publication of CN113435547B publication Critical patent/CN113435547B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/18Water
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本申请提供一种水质指标融合数据异常检测方法及***,该方法包括如下步骤:获取水质监测历史融合数据和当前时刻水质自动站监测数据;根据获取的水质监测历史融合数据,建立全指标孤立森林检测模型、关联指标异常检测模型和单指标异常检测模型;将获取的当前时刻水质自动站监测数据输入到建立的全指标孤立森林检测模型、关联指标异常检测模型和单指标异常检测模型中,分别输出第一异常数据、第二异常数据和第三异常数据;根据第一异常数据、第二异常数据和第三异常数据,对当前时刻水质进行评估,计算待评估水域的水质恶劣评估总分值。本申请对多层次的水质指标数据进行异常值检测,对当前水质情况和水质改善情况进行评价。

Description

一种水质指标融合数据异常检测方法及***
技术领域
本申请涉及数据处理技术领域,尤其涉及一种水质指标融合数据异常检测方法及***。
背景技术
目前,对水质数据进行异常值检测的算法,主要是利用基于统计原理的极值分析方法,假设水质数据满足正态分布,利用三倍标准差法、四分位数判断法、固定阈值法等极值分析方法,针对每个指标各自计算出合理的区间,当超过区间的上限或者低于区间的下限,则认定该数据为异常值,从而进行数据序列中异常值的筛选。
基于极值分析的方法对单一水质指标的数据进行异常值监测,此分析方法仅适用于数据分布近似于正态分布的情形。但就水质指标数据而言,因为数据呈现的周期性以及趋势性,其分布大多是不规则的偏态分布或多峰分布,应用此方法会导致将正常的水质数据认定为异常值,或者将异常值认定为正常值。此外,水环境中的很多水质指标是具有相关性的,仅对单一的指标数据进行异常值检测,不能发现数据指标组合发生的异常信息,另外,需要对当前水质情况和水质改善情况进行评价,以为水质的整治提供有力的支持。
发明内容
本申请的目的在于提供一种水质指标融合数据异常检测方法及***, 对全指标、关联指标、单一指标等多层次的水质指标数据进行异常值检测,检测异常数据,提前预判水环境要发生的恶化,保证水环境质量监测数据的客观真实性,为水环境管理工作提供数据决策支持,对当前水质情况和水质改善情况进行评价,为水质的整治提供有力的支持。
为达到上述目的,本申请提供一种水质指标融合数据异常检测方法,该方法包括如下步骤:获取水质监测历史融合数据和当前时刻水质自动站监测数据;根据获取的水质监测历史融合数据,建立全指标孤立森林检测模型、关联指标异常检测模型和单指标异常检测模型;将获取的当前时刻水质自动站监测数据输入到建立的全指标孤立森林检测模型、关联指标异常检测模型和单指标异常检测模型中,分别输出第一异常数据、第二异常数据和第三异常数据;根据第一异常数据、第二异常数据和第三异常数据,对当前时刻水质进行评估,计算待评估水域的水质恶劣评估总分值。
如上的,其中,一种水质指标融合数据异常检测方法还包括如下步骤:根据第一异常数据、第二异常数据和第三异常数据,对待评估水域的水质改善情况进行评估,计算待评估水域的水质改善值。
如上的,其中,根据获取的水质监测历史融合数据,建立全指标孤立森林检测模型的方法包括如下步骤:从水质监测历史融合数据中,选取
Figure 714049DEST_PATH_IMAGE001
个全指标样本数据作为子数据集,将子数据集放入一棵孤立树的根节点;其中,为孤立树设定高度限制;在子数据集中随机选择一个指标数据,并随机产生一个切割点
Figure 919509DEST_PATH_IMAGE002
;将当前所选指标数据中小于切割点
Figure 562849DEST_PATH_IMAGE002
的点放在当前节点的左分支,大于或等于切割点
Figure 882097DEST_PATH_IMAGE002
的点放在当前节点的右分支,形成新的叶子节点;在左分支节点和右分支节点不断构造新的叶子节点,直到叶子节点上只有一个指标数据、节点上的指标数据所有特征都相同或孤立树已经生长到了所设定的高度限制。
如上的,其中,建立全指标孤立森林检测模型的方法还包括如下步骤:计算孤立森林中所有全指标样本数据的异常分数。
如上的,其中,孤立森林中所有全指标样本数据的异常分数的计算方法为:计算单个孤立树的平均路径长度;根据单个孤立树的平均路径长度,计算全指标样本数据
Figure 412436DEST_PATH_IMAGE003
的异常得分。
如上的,其中,全指标样本数据
Figure 618158DEST_PATH_IMAGE003
的异常得分计算公式为:
Figure 122695DEST_PATH_IMAGE004
其中,
Figure 619536DEST_PATH_IMAGE005
表示全指标样本数据
Figure 394594DEST_PATH_IMAGE003
的异常得分;
Figure 803841DEST_PATH_IMAGE006
表示全指标样本数据
Figure 297139DEST_PATH_IMAGE003
在孤立森林中的路径长度的期望;
Figure 332091DEST_PATH_IMAGE007
表示全指标样本数据
Figure 725770DEST_PATH_IMAGE003
的路径长度;路径长度为从孤立树的根节点到叶子节点所经过的边的数量。
如上的,其中,根据水质监测历史融合数据,建立关联指标异常检测模型的方法包括如下步骤:从水质监测历史融合数据中选取关联指标数据集合;根据关联指标数据集合,建立关联指标异常检测模型。
如上的,其中,根据关联指标数据集合,建立关联指标异常检测模型包括如下子步骤:计算自动站样本点
Figure 804453DEST_PATH_IMAGE008
到所有其他自动站样本点的距离;计算自动站样本点
Figure 286512DEST_PATH_IMAGE008
的第
Figure 125155DEST_PATH_IMAGE009
距离
Figure 874805DEST_PATH_IMAGE010
Figure 888504DEST_PATH_IMAGE011
表示自动站样本点
Figure 169444DEST_PATH_IMAGE012
与自动站样本点
Figure 936412DEST_PATH_IMAGE008
的距离;获取所有自动站样本点
Figure 166667DEST_PATH_IMAGE008
的第
Figure 993678DEST_PATH_IMAGE009
距离邻域
Figure 558651DEST_PATH_IMAGE013
;第
Figure 713599DEST_PATH_IMAGE009
距离邻域内包括与自动站样本点
Figure 172263DEST_PATH_IMAGE008
的距离为不大于第
Figure 779961DEST_PATH_IMAGE009
距离的所有自动站样本点;计算自动站样本点
Figure 723909DEST_PATH_IMAGE008
的可达距离;根据自动站样本点
Figure 691734DEST_PATH_IMAGE008
的可达距离,计算所有自动站样本点的局部可达密度;根据局部可达密度,计算自动站样本点的局部离群因子。
如上的,其中,根据水质监测历史融合数据,建立单指标动态阈值模型,包括如下步骤:从水质监测历史融合数据中选取单指标样本数据;将单指标样本数据的指标数据时间序列定义为
Figure 349111DEST_PATH_IMAGE014
,时刻数定义为
Figure 750880DEST_PATH_IMAGE015
,根据指标数据时间序列建立线性回归模型;根据线性回归模型,计算下一时刻指标数据的动态阈值区间。
本申请还提供一种水质指标融合数据异常检测***,其特征在于,该***包括:数据获取装置,用于获取水质监测历史融合数据和当前时刻水质自动站监测数据;模型建立模块,用于根据获取的水质监测历史融合数据,建立全指标孤立森林检测模型、关联指标异常检测模型和单指标异常检测模型;异常数据获取模块,用于将获取的当前时刻水质自动站监测数据输入到建立的全指标孤立森林检测模型、关联指标异常检测模型和单指标异常检测模型中,分别获取第一异常数据、第二异常数据和第三异常数据;数据处理器,用于根据第一异常数据、第二异常数据和第三异常数据,对当前时刻水质进行评估,计算待评估水域的水质恶劣评估总分值。
本申请实现的有益效果如下:
(1)本申请建立了一套针对多指标、关联指标、单指标的多层次异常值检测方法,有效提升地表水环境监测数据中的异常值检测正确率,降低了异常值检测的误检率和漏检率,保证了监测数据的真实性、客观性,同时为提前发现水环境即将发生恶化提供了数据支持。
(2)本申请根据获取的第一异常数据、第二异常数据和第三异常数据对待评估水域的水质进行评估和水质改善情况进行评估,从而实现对水质情况的综合评估,根据待评估水域的功能用途,判断当前待评估水质的水质情况是否符合其功能用途,根据水质改善情况,判断水质的改善是否符合要求,以实现对水质情况进行更好的管理。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本申请实施例的一种水质指标融合数据异常检测方法的流程图。
图2为本申请实施例的建立全指标孤立森林检测模型的方法流程图。
图3为本申请实施例的建立关联指标异常检测模型的方法流程图。
图4为本申请实施例的选取关联指标数据集合的方法流程图。
图5为本申请实施例的一种水质指标融合数据异常检测***的结构示意图。
附图标记:10-数据获取装置;20-模型建立模块;30-异常数据获取模块;40-数据处理器;100-水质指标融合数据异常检测***。
具体实施方式
下面结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
如图1所示,本申请提供一种水质指标融合数据异常检测方法,该方法包括如下步骤:
步骤S1,获取水质监测历史融合数据和当前时刻水质自动站监测数据。
其中,水质监测历史融合数据包括历史水质自动站监测数据和历史手工水质指标采集数据。历史水质自动站监测数据为采用自动水质监测设备对水质进行自动监测的数据;历史手工水质指标采集数据为采用手工方式对水质进行采集得到的数据。
步骤S2,根据获取的水质监测历史融合数据,建立全指标孤立森林检测模型、关联指标异常检测模型和单指标异常检测模型。
具体的,根据水质监测历史融合数据的全指标数据建立全指标孤立森林模型,全指标数据包括多个指标的全部数据,例如全指标数据为9个指标数据的集合。指标数据包括:铅、铬等重金属含量、化学指标(例如:水温、悬浮物、浊度、透明度及电导率等物理指标,PH值、总碱(酸)度、总硬度等)、溶解氧含量、其他有害物质(例如:挥发酚、氰化物、油类、氟化物、硫化物以及有机农药、多环芳烃等致癌物质)、以及微生物学指标(例如细菌总数、大肠菌群等)等。
如图2所示,作为本发明的一个具体实施例,根据获取的水质监测历史融合数据,建立全指标孤立森林检测模型的方法包括如下步骤:
步骤S210,从水质监测历史融合数据中,选取
Figure 539714DEST_PATH_IMAGE016
个全指标样本数据作为子数据集,将子数据集放入一棵孤立树的根节点。
优选的,该孤立树的高度限制为
Figure 953640DEST_PATH_IMAGE017
;其中,
Figure 996682DEST_PATH_IMAGE018
表示高度;
Figure 867555DEST_PATH_IMAGE019
表示最大高度函数;
Figure 579903DEST_PATH_IMAGE016
表示选取全指标样本数据的总个数。
其中,子数据集中包括多个全指标数据,每个全指标数据包括多个指标数据。
步骤S220,在子数据集中随机选择一个指标数据,并随机产生一个切割点
Figure 296055DEST_PATH_IMAGE002
具体的,在当前孤立树节点的数据范围内,随机产生一个切割点
Figure 459183DEST_PATH_IMAGE002
,切割点为当前子数据集中指标数据的最大值与最小值之间的数。
步骤S230,将当前所选指标数据中小于切割点
Figure 205684DEST_PATH_IMAGE002
的点放在当前节点的左分支,大于或等于切割点
Figure 172372DEST_PATH_IMAGE002
的点放在当前节点的右分支,形成新的叶子节点。
步骤S240,在左分支节点和右分支节点递归步骤 S220、S230,不断构造新的叶子节点,直到叶子节点上只有一个指标数据、节点上的指标数据所有特征都相同或者孤立树已经生长到了所设定的高度限制
Figure 302002DEST_PATH_IMAGE020
步骤S250,计算孤立森林中所有全指标样本数据的异常分数。
步骤S250包括如下子步骤:
步骤S251,计算单个孤立树的平均路径长度。
具体的,单个孤立树的平均路径长度的计算公式为:
Figure 942806DEST_PATH_IMAGE021
;
其中,
Figure 748957DEST_PATH_IMAGE022
表示孤立树的平均路径长度;
Figure 688094DEST_PATH_IMAGE023
表示调和数,其值等于
Figure 247513DEST_PATH_IMAGE024
Figure 368922DEST_PATH_IMAGE025
表示选取全指标样本数据的总个数。
步骤S252,根据单个孤立树的平均路径长度,计算全指标样本数据的异常得分。
具体的,全指标样本数据
Figure 719875DEST_PATH_IMAGE003
的异常得分计算公式为:
Figure 333259DEST_PATH_IMAGE026
其中,
Figure 539113DEST_PATH_IMAGE027
表示全指标样本数据
Figure 423017DEST_PATH_IMAGE003
的异常得分;
Figure 570971DEST_PATH_IMAGE028
表示全指标样本数据
Figure 639028DEST_PATH_IMAGE003
在孤立森林中的路径长度的期望;
Figure 648572DEST_PATH_IMAGE029
表示全指标样本数据
Figure 885518DEST_PATH_IMAGE003
的路径长度;路径长度为从孤立树的根节点到叶子节点所经过的边的数量。
如图3所示,作为本发明的一个具体实施例,根据水质监测历史融合数据,建立关联指标异常检测模型的方法包括如下步骤:
步骤S310,从水质监测历史融合数据中选取关联指标数据集合。
如图4所示,步骤S310包括如下子步骤:
步骤S311,从水质监测历史融合数据中选取水质监测站最近一年的手工水质指标采集数据。
步骤S312,对每个手工水质指标采集数据进行初始化,形成新的指标序列。
步骤S313,采用灰色关联法,计算所有手工水质指标采集数据间的灰色关联度。
步骤S314,选择灰色关联度大于0.6的手工水质指标采集数据,作为手工水质关联指标数据。
步骤S315,根据手工水质关联指标数据,获取每一个手工水质关联指标数据对应的关联指标的水质自动站监测数据,形成一个数据集,作为关联指标数据集合。
步骤S320,根据关联指标数据集合,建立关联指标异常检测模型。
步骤S320包括如下子步骤:
步骤S321,计算自动站样本点
Figure 643521DEST_PATH_IMAGE008
到所有其他自动站样本点的距离。例如:选择欧式距离计算方法。
其中,自动站样本点指的是水质自动站监测数据的样本数据。
步骤S322,计算自动站样本点
Figure 841284DEST_PATH_IMAGE008
的第
Figure 779153DEST_PATH_IMAGE009
距离
Figure 493775DEST_PATH_IMAGE030
,并且满足以下条件:
在集合中至少有不包括自动站样本点
Figure 593318DEST_PATH_IMAGE008
在内的
Figure 278377DEST_PATH_IMAGE009
个点
Figure 255823DEST_PATH_IMAGE031
,满足
Figure 326416DEST_PATH_IMAGE032
在集合中最多有不包括自动站样本点
Figure 360974DEST_PATH_IMAGE008
在内的
Figure 267751DEST_PATH_IMAGE033
个点
Figure 609739DEST_PATH_IMAGE034
,满足
Figure 442828DEST_PATH_IMAGE035
步骤S323,获取所有自动站样本点
Figure 759540DEST_PATH_IMAGE008
的第
Figure 278246DEST_PATH_IMAGE009
距离邻域
Figure 742636DEST_PATH_IMAGE036
,该第
Figure 741816DEST_PATH_IMAGE009
距离邻域内包括与自动站样本点
Figure 619642DEST_PATH_IMAGE008
的距离为不大于第
Figure 517322DEST_PATH_IMAGE009
距离的所有自动站样本点。
步骤S324,计算自动站样本点
Figure 873217DEST_PATH_IMAGE008
的可达距离,自动站样本点
Figure 726903DEST_PATH_IMAGE037
与自动站样本点
Figure 398800DEST_PATH_IMAGE008
的可达距离定义为:
Figure 157677DEST_PATH_IMAGE038
其中,reach-d k (p,o)表示自动站样本点
Figure 927050DEST_PATH_IMAGE037
与自动站样本点
Figure 323659DEST_PATH_IMAGE008
的可达距离;max{}表示取最大值;d k (o)表示自动站样本点
Figure 667921DEST_PATH_IMAGE037
的第
Figure 727144DEST_PATH_IMAGE009
距离;d(p,o)表示自动站样本点
Figure 923377DEST_PATH_IMAGE037
与自动站样本点
Figure 63240DEST_PATH_IMAGE008
的实际距离。
步骤S325,根据自动站样本点的可达距离,计算所有自动站样本点的局部可达密度。
自动站样本点的局部可达密度计算公式为:
Figure 955235DEST_PATH_IMAGE039
其中,
Figure 32912DEST_PATH_IMAGE040
表示自动站样本点的局部可达密度;
Figure 127776DEST_PATH_IMAGE041
表示自动站样本点
Figure 230468DEST_PATH_IMAGE008
的第
Figure 667266DEST_PATH_IMAGE009
距离邻域;reach-d k (p,o)表示自动站样本点
Figure 622452DEST_PATH_IMAGE037
与自动站样本点
Figure 288051DEST_PATH_IMAGE008
的可达距离。
步骤S326,根据局部可达密度,计算自动站样本点的局部离群因子。
自动站样本点的局部离群因子的计算公式为:
Figure 12293DEST_PATH_IMAGE042
其中,
Figure 823254DEST_PATH_IMAGE043
表示自动站样本点的局部离群因子;
Figure 623327DEST_PATH_IMAGE044
表示自动站样本点
Figure 466518DEST_PATH_IMAGE008
的第
Figure 186212DEST_PATH_IMAGE009
距离邻域;
Figure 777862DEST_PATH_IMAGE045
表示自动站样本点
Figure 737334DEST_PATH_IMAGE037
的局部可达密度;
Figure 384216DEST_PATH_IMAGE046
表示自动站样本点的局部可达密度。
如果局部离群因子越接近1,说明自动站样本点
Figure 692838DEST_PATH_IMAGE008
与其邻域点密度差不多,自动站样本点
Figure 65175DEST_PATH_IMAGE008
可能和其邻域同属一簇;如果局部离群因子越小于1,说明自动站样本点
Figure 278988DEST_PATH_IMAGE008
的密度高于其邻域点密度,自动站样本点
Figure 228096DEST_PATH_IMAGE008
为密集点;如果这个局部离群因子越大于1,说明自动站样本点
Figure 656803DEST_PATH_IMAGE008
的密度小于其邻域点密度,自动站样本点
Figure 901840DEST_PATH_IMAGE008
越可能是异常点。
作为本发明的一个具体实施例,根据水质监测历史融合数据,建立单指标动态阈值模型,包括如下步骤:
步骤T1,从水质监测历史融合数据中选取单指标样本数据。
具体的,剔除水质监测历史融合数据中的异常数据,选取单指标样本数据。
步骤T1包括如下步骤:
步骤T110,针对各个指标数据,计算当前断面的前12条手工水质指标采集数据的平均值,作为第一均值数据。
步骤T120,基于水质自动站监测数据,计算前三个月水质自动站监测数据的平均值,作为第一滑动均值数据,以及前一个月水质自动站监测数据的平均值,作为第二滑动均值数据。
具体的,获取剔除异常数据后前三个月的水质自动站监测数据,计算获取的前三个月的水质自动站监测数据的平均值作为第一滑动均值数据;获取剔除异常数据后前一个月的水质自动站监测数据,计算获取的前一个月的水质自动站监测数据的平均值作为第二滑动均值数据。
步骤T130,将得到的第一均值数据、第一滑动均值数据和第二滑动均值数据结合当前时刻之前的多个时刻(优选为:当前时刻前6个时刻)的指标数据形成各个指标的指标数据时间序列,作为单指标样本数据。
指标数据时间序列包括多个时刻的指标数据。
步骤T2,将单指标样本数据的指标数据时间序列定义为
Figure 166730DEST_PATH_IMAGE047
,时刻数定义为
Figure 155415DEST_PATH_IMAGE048
,根据指标数据时间序列建立线性回归模型。
线性回归模型为:
Figure 376312DEST_PATH_IMAGE049
其中,i为指标标识,
Figure 680998DEST_PATH_IMAGE048
为时刻数;
将指标数据时间序列
Figure 807086DEST_PATH_IMAGE047
和时刻数
Figure 209248DEST_PATH_IMAGE048
输入到线性回归模型中,求取ab的数值。
步骤T3,根据线性回归模型,计算下一时刻指标数据的动态阈值区间
Figure 973067DEST_PATH_IMAGE050
具体的,动态阈值区间的计算公式为:
Figure 684540DEST_PATH_IMAGE051
其中,
Figure 554317DEST_PATH_IMAGE052
为线性回归模型下一时刻的计算值,
Figure 868493DEST_PATH_IMAGE053
为下一时刻的指标数据;
Figure 342943DEST_PATH_IMAGE054
表示标准差。
步骤S3,将获取的当前时刻水质自动站监测数据输入到建立的全指标孤立森林检测模型、关联指标异常检测模型和单指标异常检测模型中,分别输出第一异常数据、第二异常数据和第三异常数据。
作为本发明的一个具体实施例,获取第一异常数据的方法为:
将当前时刻水质自动站监测数据输入到全指标孤立森林检测模型中,采用欧式距离计算公式,计算当前时刻水质自动站监测数据和所有历史全指标样本数据的距离,获取距离最近的样本数据的异常得分,将获取距离最近的样本数据的异常得分作为当前时刻水质自动站监测数据的异常分数,若当前时刻水质自动站监测数据的异常分数接近于1时,则将当前时刻水质自动站监测数据视为第一异常数据,否则,视为正常数据。
作为本发明的一个具体实施例,获取第二异常数据的方法为:
将当前时刻水质自动站监测数据输入到关联指标异常检测模型中,计算自动站样本点的局部离群因子,若自动站样本点的局部离群因子超过预设阈值,则定义自动站样本点的数据为第二异常数据,否则,为正常数据。
作为本发明的一个具体实施例,获取第三异常数据的方法为:
将当前时刻水质自动站监测数据输入到单指标异常检测模型中,若当前时刻水质自动站监测数据的指标数据
Figure 100684DEST_PATH_IMAGE055
不在动态阈值区间
Figure 811151DEST_PATH_IMAGE056
内时,将当前时刻水质自动站监测数据的指标数据定义为第三异常数据,否则,为正常数据。
步骤S4,根据第一异常数据、第二异常数据和第三异常数据,对当前时刻水质进行评估,计算待评估水域的水质恶劣评估总分值。
步骤S4包括如下子步骤:
步骤S410,获取待评估水域范围内的所有水质监测站点在预设时间段内获取数据的第一异常数据、第二异常数据和第三异常数据。
步骤S420,根据获取的第一异常数据、第二异常数据和第三异常数据,计算待评估水域的水质恶劣评估总分值。
具体的,待评估水域的水质恶劣评估总分值的计算公式如下:
Figure 712373DEST_PATH_IMAGE057
其中,Y表示待评估水域的水质恶劣评估总分值;
Figure 808374DEST_PATH_IMAGE058
表示获取第一异常数据的准确度因子;
Figure 501130DEST_PATH_IMAGE059
表示获取第二异常数据的准确度因子;
Figure 433314DEST_PATH_IMAGE060
表示获取第三异常数据的准确度因子;
Figure 699079DEST_PATH_IMAGE061
表示获取第一异常数据的总数量;Q表示获取第二异常数据的总数量;D表示获取第三异常数据的总数量;
Figure 291996DEST_PATH_IMAGE062
表示所有水质监测站点的总数量;i表示获取第i个第一异常数据;j表示第一异常数据中第j个指标数据;N表示第一异常数据中指标数据的总种类数量;
Figure 266906DEST_PATH_IMAGE063
表示第i个第一异常数据中第j个指标数据的恶劣因子;
Figure 76599DEST_PATH_IMAGE064
表示第i个第一异常数据中第j个指标数据的实测值;
Figure 441328DEST_PATH_IMAGE065
表示第i个第一异常数据中第j个指标数据的标准值;q表示第q个第二异常数据;e表示第二异常数据中第e个指标数据;E表示第二异常数据中指标数据的总种类数量;
Figure 387287DEST_PATH_IMAGE066
表示第q个第二异常数据中第e个指标数据的恶劣因子;
Figure 533097DEST_PATH_IMAGE067
表示第q个第二异常数据中第e个指标数据的实测值;
Figure 65972DEST_PATH_IMAGE068
表示第q个第二异常数据中第e个指标数据的标准值;
Figure 470278DEST_PATH_IMAGE069
表示第d个第三异常数据的恶劣因子;
Figure 349372DEST_PATH_IMAGE070
表示第d个第三异常数据的实测值;
Figure 554832DEST_PATH_IMAGE071
表示第d个第三异常数据的标准值;
Figure 198172DEST_PATH_IMAGE072
表示第一异常数据、第二异常数据和第三异常数据中彼此重复的指标数据的总个数。
其中,第一异常数据为全指标数据,第二异常数据为关联指标数据,第三异常数据为单指标数据。
步骤S5,根据第一异常数据、第二异常数据和第三异常数据,对待评估水域的水质改善情况进行评估,计算待评估水域的水质改善值。
具体的,待评估水域的水质改善值的计算公式为:
Figure 517420DEST_PATH_IMAGE073
;
其中,
Figure 313338DEST_PATH_IMAGE074
表示待评估水域的水质改善值;
Figure 456743DEST_PATH_IMAGE075
表示第
Figure 820335DEST_PATH_IMAGE075
个时刻;
Figure 441809DEST_PATH_IMAGE076
表示采集水质数据的总时刻数;
Figure 92233DEST_PATH_IMAGE077
表示获取第一异常数据的准确度因子;
Figure 970322DEST_PATH_IMAGE078
表示获取第二异常数据的准确度因子;
Figure 463620DEST_PATH_IMAGE079
表示获取第三异常数据的准确度因子;
Figure 498572DEST_PATH_IMAGE080
表示获取第一异常数据的总数量;N表示第一异常数据中指标数据的总种类数量;Q表示获取第二异常数据的总数量;E表示第二异常数据中指标数据的总种类数量;D表示获取第三异常数据的总数量;
Figure 892251DEST_PATH_IMAGE081
表示第i个第一异常数据中第j个指标数据的权重;
Figure 236513DEST_PATH_IMAGE082
表示第q个第二异常数据中第e个指标数据的权重;
Figure 452993DEST_PATH_IMAGE083
表示第d个第三异常数据中指标数据的权重;
Figure 291636DEST_PATH_IMAGE084
表示第
Figure 369183DEST_PATH_IMAGE085
个时刻获取的第i个第一异常数据中第j个指标数据的实测值;
Figure 281685DEST_PATH_IMAGE086
表示第
Figure 359363DEST_PATH_IMAGE087
个时刻获取的第i个第一异常数据中第j个指标数据的实测值;
Figure 860751DEST_PATH_IMAGE088
表示第
Figure 356586DEST_PATH_IMAGE089
个时刻获取的第q个第二异常数据中第e个指标数据的实测值;
Figure 918017DEST_PATH_IMAGE090
表示第个时刻获取的第q个第二异常数据中第e个指标数据的实测值;
Figure 482991DEST_PATH_IMAGE091
表示第
Figure 614501DEST_PATH_IMAGE089
个时刻获取的第d个第三异常数据的实测值;
Figure 338744DEST_PATH_IMAGE092
表示第
Figure 946442DEST_PATH_IMAGE075
个时刻获取的第d个第三异常数据的实测值。
实施例二
如图5所示,本申请还提供一种水质指标融合数据异常检测***100,该***包括:
数据获取装置10,用于获取水质监测历史融合数据和当前时刻水质自动站监测数据;
模型建立模块20,用于根据获取的水质监测历史融合数据,建立全指标孤立森林检测模型、关联指标异常检测模型和单指标异常检测模型;
异常数据获取模块30,用于将获取的当前时刻水质自动站监测数据输入到建立的全指标孤立森林检测模型、关联指标异常检测模型和单指标异常检测模型中,分别输出第一异常数据、第二异常数据和第三异常数据;
数据处理器40,用于根据第一异常数据、第二异常数据和第三异常数据,对当前时刻水质进行评估,计算待评估水域的水质恶劣评估总分值。
数据处理器40,还用于根据第一异常数据、第二异常数据和第三异常数据,对待评估水域的水质改善情况进行评估,计算待评估水域的水质改善值。
其中,待评估水域的水质恶劣评估总分值的计算公式如下:
Figure 624811DEST_PATH_IMAGE093
其中,Y表示待评估水域的水质恶劣评估总分值;
Figure 858215DEST_PATH_IMAGE094
表示获取第一异常数据的准确度因子;
Figure 935499DEST_PATH_IMAGE095
表示获取第二异常数据的准确度因子;
Figure 714099DEST_PATH_IMAGE096
表示获取第三异常数据的准确度因子;
Figure 440615DEST_PATH_IMAGE097
表示获取第一异常数据的总数量;Q表示获取第二异常数据的总数量;D表示获取第三异常数据的总数量;
Figure 588962DEST_PATH_IMAGE098
表示所有水质监测站点的总数量;i表示获取第i个第一异常数据;j表示第一异常数据中第j个指标数据;N表示第一异常数据中指标数据的总种类数量;
Figure 897584DEST_PATH_IMAGE099
表示第i个第一异常数据中第j个指标数据的恶劣因子;
Figure 971719DEST_PATH_IMAGE100
表示第i个第一异常数据中第j个指标数据的实测值;
Figure 11963DEST_PATH_IMAGE101
表示第i个第一异常数据中第j个指标数据的标准值;q表示第q个第二异常数据;e表示第二异常数据中第e个指标数据;E表示第二异常数据中指标数据的总种类数量;
Figure 196957DEST_PATH_IMAGE102
表示第q个第二异常数据中第e个指标数据的恶劣因子;
Figure 625664DEST_PATH_IMAGE103
表示第q个第二异常数据中第e个指标数据的实测值;
Figure 700061DEST_PATH_IMAGE104
表示第q个第二异常数据中第e个指标数据的标准值;
Figure 73274DEST_PATH_IMAGE105
表示第d个第三异常数据的恶劣因子;
Figure 937325DEST_PATH_IMAGE106
表示第d个第三异常数据的实测值;
Figure 640445DEST_PATH_IMAGE107
表示第d个第三异常数据的标准值;
Figure 384279DEST_PATH_IMAGE108
表示第一异常数据、第二异常数据和第三异常数据中彼此重复的指标数据的总个数。
其中,待评估水域的水质改善值的计算公式为:
Figure 746253DEST_PATH_IMAGE109
;
其中,
Figure 413994DEST_PATH_IMAGE110
表示待评估水域的水质改善值;
Figure 676348DEST_PATH_IMAGE075
表示第
Figure 886356DEST_PATH_IMAGE075
个时刻;
Figure 499740DEST_PATH_IMAGE111
表示采集水质数据的总时刻数;
Figure 971173DEST_PATH_IMAGE112
表示获取第一异常数据的准确度因子;
Figure 589498DEST_PATH_IMAGE113
表示获取第二异常数据的准确度因子;
Figure 471873DEST_PATH_IMAGE114
表示获取第三异常数据的准确度因子;
Figure 385602DEST_PATH_IMAGE115
表示获取第一异常数据的总数量;N表示第一异常数据中指标数据的总种类数量;Q表示获取第二异常数据的总数量;E表示第二异常数据中指标数据的总种类数量;D表示获取第三异常数据的总数量;
Figure 18315DEST_PATH_IMAGE116
表示第i个第一异常数据中第j个指标数据的权重;
Figure 379895DEST_PATH_IMAGE117
表示第q个第二异常数据中第e个指标数据的权重;
Figure 810002DEST_PATH_IMAGE118
表示第d个第三异常数据中指标数据的权重;
Figure 7765DEST_PATH_IMAGE119
表示第
Figure 945634DEST_PATH_IMAGE120
个时刻获取的第i个第一异常数据中第j个指标数据的实测值;
Figure 394677DEST_PATH_IMAGE121
表示第
Figure 838427DEST_PATH_IMAGE075
个时刻获取的第i个第一异常数据中第j个指标数据的实测值;
Figure 382541DEST_PATH_IMAGE122
表示第
Figure 484621DEST_PATH_IMAGE123
个时刻获取的第q个第二异常数据中第e个指标数据的实测值;
Figure 430580DEST_PATH_IMAGE124
表示第
Figure 107549DEST_PATH_IMAGE075
个时刻获取的第q个第二异常数据中第e个指标数据的实测值;
Figure 660931DEST_PATH_IMAGE125
表示第
Figure 268499DEST_PATH_IMAGE089
个时刻获取的第d个第三异常数据的实测值;
Figure 944331DEST_PATH_IMAGE126
表示第
Figure 152721DEST_PATH_IMAGE075
个时刻获取的第d个第三异常数据的实测值。
其中,第一异常数据为全指标数据,第二异常数据为关联指标数据,第三异常数据为单指标数据。
本申请实现的有益效果如下:
(1)本申请建立了一套针对多指标、关联指标、单指标的多层次异常值检测方法,有效提升地表水环境监测数据中的异常值检测正确率,降低了异常值检测的误检率和漏检率,保证了监测数据的真实性、客观性,同时为提前发现水环境即将发生恶化提供了数据支持。
(2)本申请根据获取的第一异常数据、第二异常数据和第三异常数据对待评估水域的水质进行评估和水质改善情况进行评估,从而实现对水质情况的综合评估,根据待评估水域的功能用途,判断当前待评估水质的水质情况是否符合其功能用途,根据水质改善情况,判断水质的改善是否符合要求,以实现对水质情况进行更好的管理。
上所述仅为本发明的实施方式而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理的内所做的任何修改、等同替换、改进等,均应包括在本发明的权利要求范围之内。

Claims (10)

1.一种水质指标融合数据异常检测方法,其特征在于,该方法包括如下步骤:
获取水质监测历史融合数据和当前时刻水质自动站监测数据;
根据获取的水质监测历史融合数据,建立全指标孤立森林检测模型、关联指标异常检测模型和单指标异常检测模型;
将获取的当前时刻水质自动站监测数据输入到建立的全指标孤立森林检测模型、关联指标异常检测模型和单指标异常检测模型中,分别输出第一异常数据、第二异常数据和第三异常数据;
根据第一异常数据、第二异常数据和第三异常数据,对当前时刻水质进行评估,计算待评估水域的水质恶劣评估总分值;
其中,待评估水域的水质恶劣评估总分值的计算公式如下:
Figure DEST_PATH_IMAGE001
其中,Y表示待评估水域的水质恶劣评估总分值;
Figure 266822DEST_PATH_IMAGE002
表示获取第一异常数据的准确度因子;
Figure 397589DEST_PATH_IMAGE003
表示获取第二异常数据的准确度因子;
Figure 739709DEST_PATH_IMAGE004
表示获取第三异常数据的准确度因子;
Figure 588716DEST_PATH_IMAGE005
表示获取第一异常数据的总数量;Q表示获取第二异常数据的总数量;D表示获取第三异常数据的总数量;
Figure 41694DEST_PATH_IMAGE006
表示所有水质监测站点的总数量;i表示获取第i个第一异常数据;j表示第一异常数据中第j个指标数据;N表示第一异常数据中指标数据的总种类数量;
Figure 495809DEST_PATH_IMAGE007
表示第i个第一异常数据中第j个指标数据的恶劣因子;
Figure 71147DEST_PATH_IMAGE008
表示第i个第一异常数据中第j个指标数据的实测值;
Figure 837809DEST_PATH_IMAGE009
表示第i个第一异常数据中第j个指标数据的标准值;q表示第q个第二异常数据;e表示第二异常数据中第e个指标数据;E表示第二异常数据中指标数据的总种类数量;
Figure 360058DEST_PATH_IMAGE010
表示第q个第二异常数据中第e个指标数据的恶劣因子;
Figure 465417DEST_PATH_IMAGE011
表示第q个第二异常数据中第e个指标数据的实测值;
Figure 149339DEST_PATH_IMAGE012
表示第q个第二异常数据中第e个指标数据的标准值;
Figure 707359DEST_PATH_IMAGE013
表示第d个第三异常数据的恶劣因子;
Figure 767719DEST_PATH_IMAGE014
表示第d个第三异常数据的实测值;
Figure 930847DEST_PATH_IMAGE015
表示第d个第三异常数据的标准值;
Figure 847988DEST_PATH_IMAGE016
表示第一异常数据、第二异常数据和第三异常数据中彼此重复的指标数据的总个数。
2.根据权利要求1所述的水质指标融合数据异常检测方法,其特征在于,该方法还包括如下步骤:
根据第一异常数据、第二异常数据和第三异常数据,对待评估水域的水质改善情况进行评估,计算待评估水域的水质改善值。
3.根据权利要求1所述的水质指标融合数据异常检测方法,其特征在于,根据获取的水质监测历史融合数据,建立全指标孤立森林检测模型的方法包括如下步骤:
从水质监测历史融合数据中,选取
Figure 96566DEST_PATH_IMAGE017
个全指标样本数据作为子数据集,将子数据集放入一棵孤立树的根节点;
其中,为孤立树设定高度限制;
在子数据集中随机选择一个指标数据,并随机产生一个切割点
Figure 757355DEST_PATH_IMAGE018
将当前所选指标数据中小于切割点
Figure 774990DEST_PATH_IMAGE018
的点放在当前节点的左分支,大于或等于切割点
Figure 66294DEST_PATH_IMAGE018
的点放在当前节点的右分支,形成新的叶子节点;
在左分支节点和右分支节点不断构造新的叶子节点,直到叶子节点上只有一个指标数据、节点上的指标数据所有特征都相同或孤立树已经生长到了所设定的高度限制。
4.根据权利要求3所述的水质指标融合数据异常检测方法,其特征在于,建立全指标孤立森林检测模型的方法还包括如下步骤:
计算孤立森林中所有全指标样本数据的异常分数。
5.根据权利要求4所述的水质指标融合数据异常检测方法,其特征在于,孤立森林中所有全指标样本数据的异常分数的计算方法为:
计算单个孤立树的平均路径长度;
根据单个孤立树的平均路径长度,计算全指标样本数据的异常得分。
6.根据权利要求5所述的水质指标融合数据异常检测方法,其特征在于,全指标样本数据的异常得分计算公式为:
Figure 598906DEST_PATH_IMAGE019
其中,
Figure 499604DEST_PATH_IMAGE020
表示全指标样本数据
Figure 371745DEST_PATH_IMAGE021
的异常得分;
Figure 896267DEST_PATH_IMAGE022
表示全指标样本数据
Figure 853859DEST_PATH_IMAGE021
在孤立森林中的路径长度的期望;
Figure 856450DEST_PATH_IMAGE023
表示全指标样本数据
Figure 848677DEST_PATH_IMAGE021
的路径长度;路径长度为从孤立树的根节点到叶子节点所经过的边的数量。
7.根据权利要求1所述的水质指标融合数据异常检测方法,其特征在于,根据水质监测历史融合数据,建立关联指标异常检测模型的方法包括如下步骤:
从水质监测历史融合数据中选取关联指标数据集合;
根据关联指标数据集合,建立关联指标异常检测模型。
8.根据权利要求7所述的水质指标融合数据异常检测方法,其特征在于,根据关联指标数据集合,建立关联指标异常检测模型包括如下子步骤:
计算自动站样本点
Figure 481783DEST_PATH_IMAGE024
到所有其他自动站样本点的距离;
计算自动站样本点
Figure 723409DEST_PATH_IMAGE024
的第
Figure 732953DEST_PATH_IMAGE025
距离
Figure 579686DEST_PATH_IMAGE026
Figure 180432DEST_PATH_IMAGE027
表示自动站样本点
Figure 112616DEST_PATH_IMAGE028
与自动站样本点
Figure 158807DEST_PATH_IMAGE024
的距离;
获取所有自动站样本点
Figure 922364DEST_PATH_IMAGE024
的第
Figure 631694DEST_PATH_IMAGE025
距离邻域
Figure 113491DEST_PATH_IMAGE029
;第
Figure 464838DEST_PATH_IMAGE025
距离邻域内包括与自动站样本点
Figure 20584DEST_PATH_IMAGE024
的距离为不大于第
Figure 228711DEST_PATH_IMAGE025
距离的所有自动站样本点;
计算自动站样本点
Figure 869908DEST_PATH_IMAGE024
的可达距离;
根据自动站样本点
Figure 556104DEST_PATH_IMAGE024
的可达距离,计算所有自动站样本点的局部可达密度;
根据局部可达密度,计算自动站样本点的局部离群因子。
9.根据权利要求1所述的水质指标融合数据异常检测方法,其特征在于,根据水质监测历史融合数据,建立单指标动态阈值模型,包括如下步骤:
从水质监测历史融合数据中选取单指标样本数据;
将单指标样本数据的指标数据时间序列定义为
Figure 497516DEST_PATH_IMAGE030
,时刻数定义为
Figure 548648DEST_PATH_IMAGE031
,根据指标数据时间序列建立线性回归模型;
根据线性回归模型,计算下一时刻指标数据的动态阈值区间。
10.一种水质指标融合数据异常检测***,其特征在于,该***包括:
数据获取装置,用于获取水质监测历史融合数据和当前时刻水质自动站监测数据;
模型建立模块,用于根据获取的水质监测历史融合数据,建立全指标孤立森林检测模型、关联指标异常检测模型和单指标异常检测模型;
异常数据获取模块,用于将获取的当前时刻水质自动站监测数据输入到建立的全指标孤立森林检测模型、关联指标异常检测模型和单指标异常检测模型中,分别获取第一异常数据、第二异常数据和第三异常数据;
数据处理器,用于根据第一异常数据、第二异常数据和第三异常数据,对当前时刻水质进行评估,计算待评估水域的水质恶劣评估总分值;
其中,待评估水域的水质恶劣评估总分值的计算公式如下:
Figure 739458DEST_PATH_IMAGE032
其中,Y表示待评估水域的水质恶劣评估总分值;
Figure 167028DEST_PATH_IMAGE033
表示获取第一异常数据的准确度因子;
Figure 461481DEST_PATH_IMAGE034
表示获取第二异常数据的准确度因子;
Figure 11411DEST_PATH_IMAGE035
表示获取第三异常数据的准确度因子;
Figure 627200DEST_PATH_IMAGE036
表示获取第一异常数据的总数量;Q表示获取第二异常数据的总数量;D表示获取第三异常数据的总数量;
Figure 655199DEST_PATH_IMAGE037
表示所有水质监测站点的总数量;i表示获取第i个第一异常数据;j表示第一异常数据中第j个指标数据;
Figure 40044DEST_PATH_IMAGE038
表示第一异常数据中指标数据的总种类数量;
Figure 964138DEST_PATH_IMAGE039
表示第i个第一异常数据中第j个指标数据的恶劣因子;
Figure 129540DEST_PATH_IMAGE040
表示第i个第一异常数据中第j个指标数据的实测值;
Figure 898913DEST_PATH_IMAGE041
表示第i个第一异常数据中第j个指标数据的标准值;q表示第q个第二异常数据;e表示第二异常数据中第e个指标数据;E表示第二异常数据中指标数据的总种类数量;
Figure 200581DEST_PATH_IMAGE042
表示第q个第二异常数据中第e个指标数据的恶劣因子;
Figure 29997DEST_PATH_IMAGE043
表示第q个第二异常数据中第e个指标数据的实测值;
Figure 885958DEST_PATH_IMAGE044
表示第q个第二异常数据中第e个指标数据的标准值;
Figure 255759DEST_PATH_IMAGE045
表示第d个第三异常数据的恶劣因子;
Figure 615196DEST_PATH_IMAGE046
表示第d个第三异常数据的实测值;
Figure DEST_PATH_IMAGE047
表示第d个第三异常数据的标准值;
Figure 651066DEST_PATH_IMAGE048
表示第一异常数据、第二异常数据和第三异常数据中彼此重复的指标数据的总个数。
CN202110992212.2A 2021-08-27 2021-08-27 一种水质指标融合数据异常检测方法及*** Active CN113435547B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110992212.2A CN113435547B (zh) 2021-08-27 2021-08-27 一种水质指标融合数据异常检测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110992212.2A CN113435547B (zh) 2021-08-27 2021-08-27 一种水质指标融合数据异常检测方法及***

Publications (2)

Publication Number Publication Date
CN113435547A CN113435547A (zh) 2021-09-24
CN113435547B true CN113435547B (zh) 2021-11-16

Family

ID=77798190

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110992212.2A Active CN113435547B (zh) 2021-08-27 2021-08-27 一种水质指标融合数据异常检测方法及***

Country Status (1)

Country Link
CN (1) CN113435547B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114039886A (zh) * 2021-10-19 2022-02-11 国网山东省电力公司日照供电公司 基于四分差和自相关性分析的数据正确性辨识方法及装置
CN114022052B (zh) * 2022-01-04 2022-05-03 北京英视睿达科技股份有限公司 水质异常监测方法、装置、存储介质及计算机设备
CN114527249B (zh) * 2022-01-17 2024-03-19 南方海洋科学与工程广东省实验室(广州) 一种水质监测数据质量控制方法及***
CN116011894B (zh) * 2023-03-28 2023-06-02 河北长发铝业股份有限公司 一种铝合金棒生产数据管理***
CN116933186B (zh) * 2023-09-14 2023-11-24 江苏新路德建设有限公司 基于数据驱动的污水管网堵塞实时监测方法
CN117030964A (zh) * 2023-10-07 2023-11-10 哈尔滨凯纳科技股份有限公司 一种用于水质分析仪的控制***及方法
CN117282261B (zh) * 2023-11-23 2024-02-23 天津恩纳社环保有限公司 一种微生物废气处理***
CN117874653B (zh) * 2024-03-11 2024-05-31 武汉佳华创新电气有限公司 一种基于多源数据的电力***安全监测方法及***
CN118133211B (zh) * 2024-05-07 2024-07-09 山东世纪智慧农业科技有限公司 基于多维传感器的黑皮鸡枞菌菌棒污染评估方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504901A (zh) * 2014-12-29 2015-04-08 浙江银江研究院有限公司 一种基于多维数据的交通异常点检测方法
CN110969556A (zh) * 2019-09-30 2020-04-07 上海仪电(集团)有限公司中央研究院 机器学习多维度多模型融合河道水质异常检测方法及装置
CN111507376A (zh) * 2020-03-20 2020-08-07 厦门大学 一种基于多种无监督方法融合的单指标异常检测方法
CN111553468A (zh) * 2020-05-15 2020-08-18 南京大学 一种准确预测污水处理厂出水水质的方法
CN111740991A (zh) * 2020-06-19 2020-10-02 上海仪电(集团)有限公司中央研究院 一种异常检测方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504901A (zh) * 2014-12-29 2015-04-08 浙江银江研究院有限公司 一种基于多维数据的交通异常点检测方法
CN110969556A (zh) * 2019-09-30 2020-04-07 上海仪电(集团)有限公司中央研究院 机器学习多维度多模型融合河道水质异常检测方法及装置
CN111507376A (zh) * 2020-03-20 2020-08-07 厦门大学 一种基于多种无监督方法融合的单指标异常检测方法
CN111553468A (zh) * 2020-05-15 2020-08-18 南京大学 一种准确预测污水处理厂出水水质的方法
CN111740991A (zh) * 2020-06-19 2020-10-02 上海仪电(集团)有限公司中央研究院 一种异常检测方法及***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
大连市重要江河湖泊水功能区达标评价研究;赵云;《水资源开发与管理》;20191231;第2-3节 *
春节期间凉水河流域典型污水处理厂进水水质分析;宋晓雅;《给水排水增刊》;20210430;第47卷;摘要 *

Also Published As

Publication number Publication date
CN113435547A (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
CN113435547B (zh) 一种水质指标融合数据异常检测方法及***
US20200356902A1 (en) Machine learning-based patent quality metric
Nelson et al. Genomewide analysis of admixture and adaptation in the Africanized honeybee
Berner et al. Genomics of adaptive divergence with chromosome‐scale heterogeneity in crossover rate
MacKenzie et al. Occupancy as a surrogate for abundance estimation
Pool et al. Inference of historical changes in migration rate from the lengths of migrant tracts
Hoti et al. Bayesian mapping of genotype× expression interactions in quantitative and qualitative traits
JP2008059270A (ja) プロセス異常診断装置及びプロセス監視システム
CN107402547A (zh) 基于离群点分析的设备异常检测方法及***
CN102339347A (zh) 用于技术***的计算机辅助分析的方法
Zhang et al. Mapping multiple quantitative trait loci by Bayesian classification
Fitzpatrick et al. Genomics for genetic rescue
Maebe et al. Microsatellite analysis of museum specimens reveals historical differences in genetic diversity between declining and more stable Bombus species
CN111667122A (zh) 一种农产品品种农药残留的风险评估方法
Douglas et al. Biodiversity of Central Alpine Coregonus (Salmoniformes): impact of one‐hundred years of management
CN116485020A (zh) 一种基于大数据的供应链风险识别预警方法、***及介质
CN112906738A (zh) 一种水质检测及处理方法
Esnault et al. Development of a potato cultivar (Solanum tuberosum L.) core collection, a valuable tool to prospect genetic variation for novel traits
CN116246705B (zh) 全基因组测序数据的分析方法和装置
CN115858606A (zh) 时序数据的异常检测方法、装置、设备及存储介质
Aldridge et al. Genetic and morphological patterns show variation in frequency of hybrids between Ipomopsis (Polemoniaceae) zones of sympatry
CN112329944B (zh) 一种基于历史模型多样性的数据流概念漂移检测方法
CN110807174B (zh) 一种基于统计分布的污水厂厂群出水分析及异常识别方法
CN110517731A (zh) 基因检测质量监控数据处理方法和***
Zimmerman et al. A genetic warning system for a hierarchically structured wildlife monitoring framework

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant