CN108985632A - 一种基于孤立森林算法的用电数据异常检测模型 - Google Patents
一种基于孤立森林算法的用电数据异常检测模型 Download PDFInfo
- Publication number
- CN108985632A CN108985632A CN201810793660.8A CN201810793660A CN108985632A CN 108985632 A CN108985632 A CN 108985632A CN 201810793660 A CN201810793660 A CN 201810793660A CN 108985632 A CN108985632 A CN 108985632A
- Authority
- CN
- China
- Prior art keywords
- data
- electricity consumption
- module
- isolated forest
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 63
- 230000005856 abnormality Effects 0.000 title claims abstract description 43
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 32
- 238000001514 detection method Methods 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 26
- 238000000513 principal component analysis Methods 0.000 claims abstract description 8
- 239000012141 concentrate Substances 0.000 claims abstract description 6
- 230000002159 abnormal effect Effects 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Health & Medical Sciences (AREA)
- Power Engineering (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于孤立森林算法的用电数据异常检测模型,包括特征提取模块、特征降维模块、孤立森林计算模块、构建专家样本模块和二次训练模块,特征提取模块从原始数据集中提取用户的用电数据的时间序列作为初始特征集,然后对初始特征集进行无量纲化和特征选择处理;特征降维模块采用主成分分析法和自编码网络法对初始特征集进行降维得到有效特征集;孤立森林计算模块采用孤立森林算法计算出每个用户的异常分数以判定用户数据有无异常。本发明的基于孤立森林算法的用电数据异常检测模型,是一种无监督的用电数据异常检测模型,不仅能够快速地处理大量的数据,而且能够适应缺乏训练样本的情况,能够更好地满足于电力部门的实践需求。
Description
技术领域
本发明涉及一种基于孤立森林算法的用电数据异常检测模型,涉及电力数据分析、电力数据异常预测、电力数据挖掘和数技术和智能电网技术领域。
背景技术
近年来,围绕用电侧的异常模式检测问题,发展了基于统计、基于距离和基于学习的三大类技术方法。从数据的角度看,并借鉴机器学习领域的常用概念,可以将这些方法分成两大类:有监督和无监督的。有监督的方法通常需要足够的带标签的训练样本,这意味着用电数据中需要包含用户的类型信息,即该用户是否为异常用户。这样的数据需要人类专家鉴定,并且无法形成较大的规模。因此有监督的方法虽然大多数情况下能够达到理论上的最佳性能,却很难广泛应用于没有标签数据的异常用电模式识别。无监督的方法则不需要知道用户本身的类型信息,它能够从大量的用电数据中学习到特定的知识,并用于寻找异常的用电模式。随着智能电表的普及和配用电大数据的发展,电网的用电侧数据逐步表现出海量数据和高复杂度的特征。传统的用电异常检测模式已经难以满足现有的要求,而近年来被广泛应用于异常检测的神经网络和机器学习的方法,绝大多数对于训练样本的需求较高,无法很好地应用于缺少样本标签的用电数据集上。
发明内容
本发明的目的是克服现有技术的缺陷,提供一种基于孤立森林算法的用电数据异常检测模型,是一种无监督的用电数据异常检测模型,通过分析用户用电数据之间的内在联系,给出代表每一个用户的异常分数以评估该用户的疑似异常概率,这些异常分数将成为电力公司的重要参考,以提高用电异常排查工作的效率,降低运营成本,在进行用电数据的异常检测时,不仅能够快速地处理大量的数据,而且能够适应缺乏训练样本的情况,能够更好地满足于电力部门的实践需求。
实现上述目的的技术方案是:一种基于孤立森林算法的用电数据异常检测模型,包括特征提取模块、特征降维模块、孤立森林计算模块、构建专家样本模块和二次训练模块,其中:
所述特征提取模块从原始数据集中提取用户的用电数据的时间序列作为初始特征集,然后对初始特征集进行无量纲化和特征选择处理;
所述特征降维模块采用主成分分析法和自编码网络法对初始特征集进行降维得到有效特征集;
所述孤立森林计算模块采用孤立森林算法计算出每个用户的异常分数以判定用户数据有无异常;
所述构建专家样本模块通过电力专家的经验筛选标准异常样本;
所述二次训练模块将所述标准异常样本加入到所述原始数据集中,然后进行二次训练,得到最终的用户异常分数排序。
上述的一种基于孤立森林算法的用电数据异常检测模型,其中,所述特征提取模块的特征提取过程包括以下步骤:
S11,预处理:原始数据集中存在着大量的明显的错误的数据,如数据为负值、零值和异常大值,这些为负值、零值和异常大值的数据将在预处理中被清洗,最终我们得到清洗后的数据集;
S12,提取基于均值的指标:由于用户的用电量通常有按工作日周期分布的趋势,我们将统计原始数据集中每个用户工作日和非工作日的平均用电量,即周一到周五的平均用电量、周六的平均用电量和周日的平均用电量,这样可以得到新的7个特征值;
S13,提取基于趋势的指标:通过研究一些通过人工辨别的窃电用户的用电曲线,采用滑动窗口的思想,提取用电曲线的上升和下降趋势指标。
上述的一种基于孤立森林算法的用电数据异常检测模型,其中,所述提取基于趋势的指标中,采用滑动窗口的思想,将一个用户的用电数据看作一个时间序列,并将其分成三个相邻的窗口,依次记为w1,w2和w3;其中w2的长度是固定的,我们将其看作是主要的滑动窗口,然后我们计算w1和w3中数据的平均值和标准差,w1的平均值记为avg1,w3的平均值记为avg3,w1的标准差记为std1,w1的标准差记为std3;然后我们计算下降趋势d的公式如下:
计算上升趋势r的公式如下:
我们计算窗口w2在滑动过程中下降趋势d和上升趋势r的最大值,并将其作为这段时间序列的下降趋势指标和上升趋势指标。
上述的一种基于孤立森林算法的用电数据异常检测模型,其中,所述孤立森林计算模块的计算过程为:
S21,从训练集中进行采样,并根据算法构建孤立树,孤立树的建立过程如下:
S211,从训练数据点随机抽取子样本作为孤立树中的根节点;
S212,随机指定某个维度,在当前节点数据中生成一个切割点p,切割点p是在当前节点的指定维度的最大值和最小值之间随机生成的;
S213当前节点数据空间被切割点p划分为2个子空间:指定维度小于切割点p的数据被放在当前节点的左子树,大于或等于切割点p的数据被放在当前节点的右子树;
S214,在子节点中,重复步骤S212和步骤S213构造新的子节点,直到子节点中只有一个数据或子节点达到定义的高度;
S22,将训练样本带入孤立森林中的每颗孤立树进行测试,记录路径长度,然后计算每个样本的异常分数。
本发明的基于孤立森林算法的用电数据异常检测模型,是一种无监督的用电数据异常检测模型,通过分析用户用电数据之间的内在联系,给出代表每一个用户的异常分数以评估该用户的疑似异常概率,这些异常分数将成为电力公司的重要参考,以提高用电异常排查工作的效率,降低运营成本,在进行用电数据的异常检测时,不仅能够快速地处理大量的数据,而且能够适应缺乏训练样本的情况,能够更好地满足于电力部门的实践需求。
附图说明
图1为本发明的基于孤立森林算法的用电数据异常检测模型的框图;
图2为孤立森林算法分析出的异常点示意图;
图3a为典型的窃电曲线示意图;
图3b为典型的窃电曲线示意图。
具体实施方式
为了使本技术领域的技术人员能更好地理解本发明的技术方案,下面结合附图对其具体实施方式进行详细地说明:
请参阅图1和图2,本发明的最佳实施例,一种基于孤立森林算法的用电数据异常检测模型,包括特征提取模块1、特征降维模块2、孤立森林计算模块3、构建专家样本模块4和二次训练模块5。
特征提取模块1从原始数据集中10提取用户的用电数据的时间序列作为初始特征集,然后对初始特征集进行无量纲化和特征选择处理;特征降维模块2采用主成分分析法和自编码网络法对初始特征集进行降维得到有效特征集;孤立森林计算模块3采用孤立森林算法计算出每个用户的异常分数以判定用户数据有无异常,图2为孤立森林算法分析出的异常点xi、x0的示意图;构建专家样本模块4通过电力专家的经验筛选标准异常样本,二次训练模块5将标准异常样本加入到所述原始数据集中,然后进行二次训练,得到最终的用户异常分数排序20。
对于N个用户M天的日用电量数据,我们将一个用户的所有用电数据提取出来,组成矩阵的一行。那么所有用户的数据可以用一个N×M的矩阵来表示,我们记为X。矩阵X是由用户的日用电量数据组成的原始特征集。基于原始特征集,我们可以进一步提取特征:特征提取模块1的特征提取过程包括以下步骤:
S11,预处理:原始数据集10中存在着大量的明显的错误的数据,如数据为负值、零值和异常大值,这些为负值、零值和异常大值的数据将在预处理中被清洗,最终我们得到清洗后的数据集X0;
S12,提取基于均值的指标:由于用户的用电量通常有按工作日周期分布的趋势,我们将统计原始数据集中每个用户工作日和非工作日的平均用电量,即周一到周五的平均用电量、周六的平均用电量和周日的平均用电量,这样可以得到新的7个特征值;
S13,提取基于趋势的指标:通过研究一些通过人工辨别的窃电用户的用电曲线,采用滑动窗口的思想,提取用电曲线的上升和下降趋势指标。从图3a和图3b中两个典型的窃电曲线中我们可以发现,用电量的突然上升和突然下降都是十分重要的信息,于是采用滑动窗口的思想,将一个用户的用电数据看作一个时间序列,并将其分成三个相邻的窗口,依次记为w1,w2和w3;其中w2的长度是固定的,我们将其看作是主要的滑动窗口,然后我们计算w1和w3中数据的平均值和标准差,w1的平均值记为avg1,w3的平均值记为avg3,w1的标准差记为std1,w1的标准差记为std3;然后我们计算下降趋势d的公式如下:
计算上升趋势r的公式如下:
我们计算窗口w2在滑动过程中下降趋势d和上升趋势r的最大值,并将其作为这段时间序列的下降趋势指标和上升趋势指标。
原始特征集X具有很高的维度和数据冗余,经过特征提取之后,得到了重叠度较低的特征集。为了进一步较低特征的维度,使用尽可能少的参数描述原始特征集尽可能多的信息,通常采用特征降维的相关算法:
(1)主成分分析(Principal Component Analysis,PCA)是一种具有代表性的数据降维算法。主成分分析本质上属于非监督算法,可以用来处理不带标签的数据。它可以降低数据的维度,并使得降低了维度的数据之间的方差最大,从而保留更多的信息,也是主成分分析法的基本思想;
(2)自编码网络,就是利用神经网络试图计算出原始数据的一种更简洁的表达方式,达到数据降维的目的:首先初始化编码和解码两个神经网络,然后按照原始训练数据与输出数据之间误差最小化的原则对自编码网络进行训练;
上述两种方法相比较,自编码网络其实是增强的主成分分析:自编码网络具有非线性变换单元,因此学出来的编码可能更精炼,对输入的表达能力更强。但是自编码网络是训练出来的,故它的表达能力受限于训练样本的普适程度,因此具有一定的局限性。
孤立森林计算模块3的计算过程为:
S21,从训练集中进行采样,并根据算法构建孤立树(iTree),孤立树的建立过程如下:
S211,从训练数据点随机抽取子样本作为孤立树中的根节点;
S212,随机指定某个维度,在当前节点数据中生成一个切割点p,切割点p是在当前节点的指定维度的最大值和最小值之间随机生成的;
S213当前节点数据空间被切割点p划分为2个子空间:指定维度小于切割点p的数据被放在当前节点的左子树,大于或等于切割点p的数据被放在当前节点的右子树;
S214,在子节点中,重复步骤S212和步骤S213构造新的子节点,直到子节点中只有一个数据或子节点达到定义的高度;
S22,将训练样本带入孤立森林中的每颗孤立树进行测试,记录路径长度,然后计算每个样本的异常分数。
最后通过电力专家的经验筛选标准异常样本,再将这些标准异常样本加入到原始数据集中,然后进行二次训练,得到最终的异常识别模型。
本发明的基于孤立森林算法的用电数据异常检测模型,采用数据预处理方法并结合孤立森林算法计算出每个用户的异常分数以判定用户数据有无异常。采用特征提取对原始数据中的负值、零值、异常大值等进行清洗,再进行特征降维,进一步从原始数据中获取有效的特征。从样本数据集中采样并进行训练,计算出每个样本的异常分数进行比对。从而在大量数据中,找出与其他数据的规律不太相符的数据点。
综上所述,本发明的基于孤立森林算法的用电数据异常检测模型,是一种无监督的用电数据异常检测模型,通过在大量实际数据的应用实践,证明了该模型的高效性和精准性,具有良好的实际应用潜力,在进行用电数据的异常检测时,不仅能够快速地处理大量的数据,而且能够适应缺乏训练样本的情况,能够更好地满足于电力部门的实践需求。
本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围内,对以上所述实施例的变化、变型都将落在本发明的权利要求书范围内。
Claims (4)
1.一种基于孤立森林算法的用电数据异常检测模型,其特征在于,包括特征提取模块、特征降维模块、孤立森林计算模块、构建专家样本模块和二次训练模块,其中:
所述特征提取模块从原始数据集中提取用户的用电数据的时间序列作为初始特征集,然后对初始特征集进行无量纲化和特征选择处理;
所述特征降维模块采用主成分分析法和自编码网络法对初始特征集进行降维得到有效特征集;
所述孤立森林计算模块采用孤立森林算法计算出每个用户的异常分数以判定用户数据有无异常;
所述构建专家样本模块通过电力专家的经验筛选标准异常样本;
所述二次训练模块将所述标准异常样本加入到所述原始数据集中,然后进行二次训练,得到最终的用户异常分数排序。
2.根据权利要求1所述的一种基于孤立森林算法的用电数据异常检测模型,其特征在于,所述特征提取模块的特征提取过程包括以下步骤:
S11,预处理:原始数据集中存在着大量的明显的错误的数据,如数据为负值、零值和异常大值,这些为负值、零值和异常大值的数据将在预处理中被清洗,最终我们得到清洗后的数据集;
S12,提取基于均值的指标:由于用户的用电量通常有按工作日周期分布的趋势,我们将统计原始数据集中每个用户工作日和非工作日的平均用电量,即周一到周五的平均用电量、周六的平均用电量和周日的平均用电量,这样可以得到新的7个特征值;
S13,提取基于趋势的指标:通过研究一些通过人工辨别的窃电用户的用电曲线,采用滑动窗口的思想,提取用电曲线的上升和下降趋势指标。
3.根据权利要求2所述的一种基于孤立森林算法的用电数据异常检测模型,其特征在于,所述提取基于趋势的指标中,采用滑动窗口的思想,将一个用户的用电数据看作一个时间序列,并将其分成三个相邻的窗口,依次记为w1,w2和w3;其中w2的长度是固定的,我们将其看作是主要的滑动窗口,然后我们计算w1和w3中数据的平均值和标准差,w1的平均值记为avg1,w3的平均值记为avg3,w1的标准差记为std1,w1的标准差记为std3;然后我们计算下降趋势d的公式如下:
计算上升趋势r的公式如下:
我们计算窗口w2在滑动过程中下降趋势d和上升趋势r的最大值,并将其作为这段时间序列的下降趋势指标和上升趋势指标。
4.根据权利要求3所述的一种基于孤立森林算法的用电数据异常检测模型,其特征在于,所述孤立森林计算模块的计算过程为:
S21,从训练集中进行采样,并根据算法构建孤立树,孤立树的建立过程如下:
S211,从训练数据点随机抽取子样本作为孤立树中的根节点;
S212,随机指定某个维度,在当前节点数据中生成一个切割点p,切割点p是在当前节点的指定维度的最大值和最小值之间随机生成的;
S213当前节点数据空间被切割点p划分为2个子空间:指定维度小于切割点p的数据被放在当前节点的左子树,大于或等于切割点p的数据被放在当前节点的右子树;
S214,在子节点中,重复步骤S212和步骤S213构造新的子节点,直到子节点中只有一个数据或子节点达到定义的高度;
S22,将训练样本带入孤立森林中的每颗孤立树进行测试,记录路径长度,然后计算每个样本的异常分数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810793660.8A CN108985632A (zh) | 2018-07-16 | 2018-07-16 | 一种基于孤立森林算法的用电数据异常检测模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810793660.8A CN108985632A (zh) | 2018-07-16 | 2018-07-16 | 一种基于孤立森林算法的用电数据异常检测模型 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108985632A true CN108985632A (zh) | 2018-12-11 |
Family
ID=64549727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810793660.8A Pending CN108985632A (zh) | 2018-07-16 | 2018-07-16 | 一种基于孤立森林算法的用电数据异常检测模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108985632A (zh) |
Cited By (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109544930A (zh) * | 2018-12-14 | 2019-03-29 | 深圳市元征科技股份有限公司 | 重型商用车辆的违章判断方法、***、装置及存储介质 |
CN109658699A (zh) * | 2019-02-20 | 2019-04-19 | 张家港江苏科技大学产业技术研究院 | 确定异常车流量数据的方法和装置 |
CN109766334A (zh) * | 2019-01-07 | 2019-05-17 | 国网湖南省电力有限公司 | 用于电力设备在线监测异常数据的处理方法及*** |
CN109815566A (zh) * | 2019-01-09 | 2019-05-28 | 同济大学 | 一种sgf格式的围棋ai棋谱文件的异常检测方法 |
CN109859029A (zh) * | 2019-01-04 | 2019-06-07 | 深圳壹账通智能科技有限公司 | 异常申请检测方法、装置、计算机设备以及存储介质 |
CN110009012A (zh) * | 2019-03-20 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种风险样本识别方法、装置及电子设备 |
CN110045209A (zh) * | 2019-05-10 | 2019-07-23 | 广东电网有限责任公司 | 用电数据异常的检测方法、装置、设备及可读存储介质 |
CN110188799A (zh) * | 2019-04-29 | 2019-08-30 | 国网上海市电力公司 | 一种计量数据多维分析与智能运维方法 |
CN110210723A (zh) * | 2019-05-15 | 2019-09-06 | 电子科技大学 | 一种基于层次分析法和孤立森林的窃电辨识方法 |
CN110276409A (zh) * | 2019-06-27 | 2019-09-24 | 腾讯科技(深圳)有限公司 | 一种时间序列异常检测方法、装置、服务器和存储介质 |
CN110297469A (zh) * | 2019-05-17 | 2019-10-01 | 同济大学 | 基于重采样的集成特征选择算法的生产线故障判断方法 |
CN110309884A (zh) * | 2019-07-05 | 2019-10-08 | 国网四川省电力公司经济技术研究院 | 基于泛在电力物联网体系的用电数据异常识别*** |
CN110362401A (zh) * | 2019-06-20 | 2019-10-22 | 深圳壹账通智能科技有限公司 | 数据跑批方法、装置、存储介质及集群中的成员主机 |
CN110363384A (zh) * | 2019-06-03 | 2019-10-22 | 杭州电子科技大学 | 基于深度加权神经网络的异常用电检测方法 |
CN110475246A (zh) * | 2019-08-28 | 2019-11-19 | 中山大学 | 基于孤立森林和序贯概率比检验的恶意锚节点检测方法 |
CN110472188A (zh) * | 2019-08-01 | 2019-11-19 | 北方工业大学 | 一种面向传感数据的异常模式检测方法 |
CN110503570A (zh) * | 2019-07-16 | 2019-11-26 | 国网江苏省电力有限公司滨海县供电分公司 | 一种异常用电数据检测方法、***、设备、存储介质 |
CN110517154A (zh) * | 2019-07-23 | 2019-11-29 | 平安科技(深圳)有限公司 | 数据模型训练方法、***及计算机设备 |
CN110533108A (zh) * | 2019-09-02 | 2019-12-03 | 四川长虹电器股份有限公司 | 一种基于孤立森林算法的销量异常值检测方法 |
CN110825917A (zh) * | 2019-11-04 | 2020-02-21 | 广州亚美信息科技有限公司 | 车辆胎压异常识别方法、装置及数据分析设备 |
CN110852860A (zh) * | 2019-11-15 | 2020-02-28 | 惠州大亚湾聚联信息科技有限公司 | 车辆维修报销行为异常检测方法、设备及存储介质 |
CN110958222A (zh) * | 2019-10-31 | 2020-04-03 | 苏州浪潮智能科技有限公司 | 基于孤立森林算法的服务器日志异常检测方法及*** |
CN111505433A (zh) * | 2020-04-10 | 2020-08-07 | 国网浙江余姚市供电有限公司 | 一种低压台区户变关系纠错及相位识别方法 |
CN111598438A (zh) * | 2020-05-14 | 2020-08-28 | 哈尔滨工业大学(威海) | 基于分段拟合分析及评估的民航发动机气路异常检测方法 |
CN111666276A (zh) * | 2020-06-11 | 2020-09-15 | 上海积成能源科技有限公司 | 一种电力负荷预测中应用孤立森林算法剔除异常数据处理的方法 |
CN111695639A (zh) * | 2020-06-17 | 2020-09-22 | 浙江经贸职业技术学院 | 一种基于机器学习的电力用户用电异常检测方法 |
CN111767951A (zh) * | 2020-06-29 | 2020-10-13 | 上海积成能源科技有限公司 | 一种居民用电安全分析中应用孤立森林算法发现异常数据的方法 |
CN112070155A (zh) * | 2020-09-07 | 2020-12-11 | 常州微亿智造科技有限公司 | 时间序列数据标注方法和装置 |
TWI712981B (zh) * | 2018-12-13 | 2020-12-11 | 開曼群島商創新先進技術有限公司 | 風險辨識模型訓練方法、裝置及伺服器 |
CN112199670A (zh) * | 2020-09-30 | 2021-01-08 | 西安理工大学 | 一种基于深度学习改进iforest对行为异常检测的日志监控方法 |
CN112738088A (zh) * | 2020-12-28 | 2021-04-30 | 上海观安信息技术股份有限公司 | 一种基于无监督算法的行为序列异常检测方法及*** |
CN112836926A (zh) * | 2020-12-27 | 2021-05-25 | 四川大学 | 基于电力大数据的企业经营状况评估方法 |
CN112926633A (zh) * | 2021-02-01 | 2021-06-08 | 长江慧控科技(武汉)有限公司 | 异常能耗检测方法、装置、设备及存储介质 |
CN112990314A (zh) * | 2021-03-16 | 2021-06-18 | 中国科学院长春光学精密机械与物理研究所 | 基于改进孤立森林算法的高光谱图像异常检测方法及装置 |
CN113011325A (zh) * | 2021-03-18 | 2021-06-22 | 重庆交通大学 | 一种基于孤立森林算法的堆垛机轨道损伤定位方法 |
CN113159244A (zh) * | 2021-04-09 | 2021-07-23 | 西安交通大学 | 一种基于物联网的禽类养殖管理*** |
CN113157674A (zh) * | 2021-02-27 | 2021-07-23 | 北京工业大学 | 一种基于动态插值的城市污水处理过程数据清洗方法 |
CN113298114A (zh) * | 2021-04-15 | 2021-08-24 | 杭州电子科技大学 | 一种基于改进孤立森林算法检测电器投切事件的方法 |
CN113392914A (zh) * | 2021-06-22 | 2021-09-14 | 北京邮电大学 | 一种基于数据特征的权重来构建孤立森林的异常检测算法 |
CN113496440A (zh) * | 2021-06-28 | 2021-10-12 | 国网上海市电力公司 | 一种用户异常用电检测方法及*** |
CN113592533A (zh) * | 2021-06-30 | 2021-11-02 | 国网上海市电力公司 | 一种基于无监督学习的异常用电检测方法及*** |
CN113688125A (zh) * | 2021-08-24 | 2021-11-23 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的异常值检测方法、装置、电子设备及介质 |
CN114066261A (zh) * | 2021-11-18 | 2022-02-18 | 广东电网有限责任公司 | 一种电表的篡改检测方法、装置、计算机设备和存储介质 |
CN114124482A (zh) * | 2021-11-09 | 2022-03-01 | 中国电子科技集团公司第三十研究所 | 基于lof和孤立森林的访问流量异常检测方法及设备 |
WO2022117063A1 (zh) * | 2020-12-03 | 2022-06-09 | 百果园技术(新加坡)有限公司 | 孤立森林的训练方法,网络爬虫的识别方法及装置 |
CN115080964A (zh) * | 2022-08-16 | 2022-09-20 | 杭州比智科技有限公司 | 基于图深度学习的数据流转异常检测方法及*** |
CN115080965A (zh) * | 2022-08-16 | 2022-09-20 | 杭州比智科技有限公司 | 基于历史表现的无监督异常检测方法及*** |
WO2023273249A1 (zh) * | 2021-06-30 | 2023-01-05 | 国网上海市电力公司 | 基于tsvm模型的智能电能表自动化检定***异常检测方法 |
CN117113235A (zh) * | 2023-10-20 | 2023-11-24 | 深圳市互盟科技股份有限公司 | 一种云计算数据中心能耗优化方法及*** |
CN117390557A (zh) * | 2023-12-13 | 2024-01-12 | 深圳汉尼康科技有限公司 | 一种多功能进阶语言沟通辅助训练数据管理*** |
CN117407826A (zh) * | 2023-12-14 | 2024-01-16 | 中国电子科技集团公司第十研究所 | 一种机载无线电导航***异常检测方法、设备及存储介质 |
CN117692196A (zh) * | 2023-12-11 | 2024-03-12 | 国网河南省电力公司经济技术研究院 | 一种基于随机森林的用户状态画像异常监测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9412024B2 (en) * | 2013-09-13 | 2016-08-09 | Interra Systems, Inc. | Visual descriptors based video quality assessment using outlier model |
CN106845693A (zh) * | 2016-12-30 | 2017-06-13 | 陕西师范大学 | 一种预测随机过程变化趋势转变点的方法及*** |
CN107196953A (zh) * | 2017-06-14 | 2017-09-22 | 上海丁牛信息科技有限公司 | 一种基于用户行为分析的异常行为检测方法 |
CN107657288A (zh) * | 2017-10-26 | 2018-02-02 | 国网冀北电力有限公司 | 一种基于孤立森林算法的电力调度流数据异常检测方法 |
-
2018
- 2018-07-16 CN CN201810793660.8A patent/CN108985632A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9412024B2 (en) * | 2013-09-13 | 2016-08-09 | Interra Systems, Inc. | Visual descriptors based video quality assessment using outlier model |
CN106845693A (zh) * | 2016-12-30 | 2017-06-13 | 陕西师范大学 | 一种预测随机过程变化趋势转变点的方法及*** |
CN107196953A (zh) * | 2017-06-14 | 2017-09-22 | 上海丁牛信息科技有限公司 | 一种基于用户行为分析的异常行为检测方法 |
CN107657288A (zh) * | 2017-10-26 | 2018-02-02 | 国网冀北电力有限公司 | 一种基于孤立森林算法的电力调度流数据异常检测方法 |
Non-Patent Citations (3)
Title |
---|
FEITONYLIU 等: "Isolation-Based Anomaly Detection", 《ACM JOURNALS》 * |
张荣昌: "基于数据挖掘的用电数据异常的分析与研究", 《信息科技辑》 * |
高东 等: "基于滑动窗口的定性趋势分析方法及应用", 《计算机应用研究》 * |
Cited By (69)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI712981B (zh) * | 2018-12-13 | 2020-12-11 | 開曼群島商創新先進技術有限公司 | 風險辨識模型訓練方法、裝置及伺服器 |
CN109544930A (zh) * | 2018-12-14 | 2019-03-29 | 深圳市元征科技股份有限公司 | 重型商用车辆的违章判断方法、***、装置及存储介质 |
CN109859029A (zh) * | 2019-01-04 | 2019-06-07 | 深圳壹账通智能科技有限公司 | 异常申请检测方法、装置、计算机设备以及存储介质 |
CN109766334A (zh) * | 2019-01-07 | 2019-05-17 | 国网湖南省电力有限公司 | 用于电力设备在线监测异常数据的处理方法及*** |
CN109815566A (zh) * | 2019-01-09 | 2019-05-28 | 同济大学 | 一种sgf格式的围棋ai棋谱文件的异常检测方法 |
CN109658699A (zh) * | 2019-02-20 | 2019-04-19 | 张家港江苏科技大学产业技术研究院 | 确定异常车流量数据的方法和装置 |
CN110009012A (zh) * | 2019-03-20 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种风险样本识别方法、装置及电子设备 |
CN110188799A (zh) * | 2019-04-29 | 2019-08-30 | 国网上海市电力公司 | 一种计量数据多维分析与智能运维方法 |
CN110045209A (zh) * | 2019-05-10 | 2019-07-23 | 广东电网有限责任公司 | 用电数据异常的检测方法、装置、设备及可读存储介质 |
CN110210723B (zh) * | 2019-05-15 | 2022-11-22 | 电子科技大学 | 一种基于层次分析法和孤立森林的窃电辨识方法 |
CN110210723A (zh) * | 2019-05-15 | 2019-09-06 | 电子科技大学 | 一种基于层次分析法和孤立森林的窃电辨识方法 |
CN110297469A (zh) * | 2019-05-17 | 2019-10-01 | 同济大学 | 基于重采样的集成特征选择算法的生产线故障判断方法 |
CN110297469B (zh) * | 2019-05-17 | 2022-02-18 | 同济大学 | 基于重采样的集成特征选择算法的生产线故障判断方法 |
CN110363384A (zh) * | 2019-06-03 | 2019-10-22 | 杭州电子科技大学 | 基于深度加权神经网络的异常用电检测方法 |
CN110362401A (zh) * | 2019-06-20 | 2019-10-22 | 深圳壹账通智能科技有限公司 | 数据跑批方法、装置、存储介质及集群中的成员主机 |
CN110276409A (zh) * | 2019-06-27 | 2019-09-24 | 腾讯科技(深圳)有限公司 | 一种时间序列异常检测方法、装置、服务器和存储介质 |
CN110309884A (zh) * | 2019-07-05 | 2019-10-08 | 国网四川省电力公司经济技术研究院 | 基于泛在电力物联网体系的用电数据异常识别*** |
CN110503570A (zh) * | 2019-07-16 | 2019-11-26 | 国网江苏省电力有限公司滨海县供电分公司 | 一种异常用电数据检测方法、***、设备、存储介质 |
CN110517154A (zh) * | 2019-07-23 | 2019-11-29 | 平安科技(深圳)有限公司 | 数据模型训练方法、***及计算机设备 |
CN110472188A (zh) * | 2019-08-01 | 2019-11-19 | 北方工业大学 | 一种面向传感数据的异常模式检测方法 |
CN110475246B (zh) * | 2019-08-28 | 2021-01-26 | 中山大学 | 基于孤立森林和序贯概率比检验的恶意锚节点检测方法 |
CN110475246A (zh) * | 2019-08-28 | 2019-11-19 | 中山大学 | 基于孤立森林和序贯概率比检验的恶意锚节点检测方法 |
CN110533108A (zh) * | 2019-09-02 | 2019-12-03 | 四川长虹电器股份有限公司 | 一种基于孤立森林算法的销量异常值检测方法 |
CN110958222A (zh) * | 2019-10-31 | 2020-04-03 | 苏州浪潮智能科技有限公司 | 基于孤立森林算法的服务器日志异常检测方法及*** |
CN110825917A (zh) * | 2019-11-04 | 2020-02-21 | 广州亚美信息科技有限公司 | 车辆胎压异常识别方法、装置及数据分析设备 |
CN110825917B (zh) * | 2019-11-04 | 2023-08-11 | 亚美智联数据科技有限公司 | 车辆胎压异常识别方法、装置及数据分析设备 |
CN110852860A (zh) * | 2019-11-15 | 2020-02-28 | 惠州大亚湾聚联信息科技有限公司 | 车辆维修报销行为异常检测方法、设备及存储介质 |
CN111505433A (zh) * | 2020-04-10 | 2020-08-07 | 国网浙江余姚市供电有限公司 | 一种低压台区户变关系纠错及相位识别方法 |
CN111505433B (zh) * | 2020-04-10 | 2022-06-28 | 国网浙江余姚市供电有限公司 | 一种低压台区户变关系纠错及相位识别方法 |
CN111598438A (zh) * | 2020-05-14 | 2020-08-28 | 哈尔滨工业大学(威海) | 基于分段拟合分析及评估的民航发动机气路异常检测方法 |
CN111666276A (zh) * | 2020-06-11 | 2020-09-15 | 上海积成能源科技有限公司 | 一种电力负荷预测中应用孤立森林算法剔除异常数据处理的方法 |
CN111695639A (zh) * | 2020-06-17 | 2020-09-22 | 浙江经贸职业技术学院 | 一种基于机器学习的电力用户用电异常检测方法 |
CN111767951A (zh) * | 2020-06-29 | 2020-10-13 | 上海积成能源科技有限公司 | 一种居民用电安全分析中应用孤立森林算法发现异常数据的方法 |
CN112070155A (zh) * | 2020-09-07 | 2020-12-11 | 常州微亿智造科技有限公司 | 时间序列数据标注方法和装置 |
CN112199670B (zh) * | 2020-09-30 | 2023-04-07 | 西安理工大学 | 一种基于深度学习改进iforest对行为异常检测的日志监控方法 |
CN112199670A (zh) * | 2020-09-30 | 2021-01-08 | 西安理工大学 | 一种基于深度学习改进iforest对行为异常检测的日志监控方法 |
WO2022117063A1 (zh) * | 2020-12-03 | 2022-06-09 | 百果园技术(新加坡)有限公司 | 孤立森林的训练方法,网络爬虫的识别方法及装置 |
CN112836926A (zh) * | 2020-12-27 | 2021-05-25 | 四川大学 | 基于电力大数据的企业经营状况评估方法 |
CN112836926B (zh) * | 2020-12-27 | 2022-03-11 | 四川大学 | 基于电力大数据的企业经营状况评估方法 |
CN112738088A (zh) * | 2020-12-28 | 2021-04-30 | 上海观安信息技术股份有限公司 | 一种基于无监督算法的行为序列异常检测方法及*** |
CN112926633A (zh) * | 2021-02-01 | 2021-06-08 | 长江慧控科技(武汉)有限公司 | 异常能耗检测方法、装置、设备及存储介质 |
CN113157674A (zh) * | 2021-02-27 | 2021-07-23 | 北京工业大学 | 一种基于动态插值的城市污水处理过程数据清洗方法 |
CN112990314A (zh) * | 2021-03-16 | 2021-06-18 | 中国科学院长春光学精密机械与物理研究所 | 基于改进孤立森林算法的高光谱图像异常检测方法及装置 |
CN112990314B (zh) * | 2021-03-16 | 2023-04-18 | 中国科学院长春光学精密机械与物理研究所 | 基于改进孤立森林算法的高光谱图像异常检测方法及装置 |
CN113011325A (zh) * | 2021-03-18 | 2021-06-22 | 重庆交通大学 | 一种基于孤立森林算法的堆垛机轨道损伤定位方法 |
CN113011325B (zh) * | 2021-03-18 | 2022-05-03 | 重庆交通大学 | 一种基于孤立森林算法的堆垛机轨道损伤定位方法 |
CN113159244B (zh) * | 2021-04-09 | 2023-05-02 | 西安交通大学 | 一种基于物联网的禽类养殖管理*** |
CN113159244A (zh) * | 2021-04-09 | 2021-07-23 | 西安交通大学 | 一种基于物联网的禽类养殖管理*** |
CN113298114A (zh) * | 2021-04-15 | 2021-08-24 | 杭州电子科技大学 | 一种基于改进孤立森林算法检测电器投切事件的方法 |
CN113298114B (zh) * | 2021-04-15 | 2024-02-20 | 杭州电子科技大学 | 一种基于改进孤立森林算法检测电器投切事件的方法 |
CN113392914A (zh) * | 2021-06-22 | 2021-09-14 | 北京邮电大学 | 一种基于数据特征的权重来构建孤立森林的异常检测算法 |
CN113496440B (zh) * | 2021-06-28 | 2023-12-12 | 国网上海市电力公司 | 一种用户异常用电检测方法及*** |
CN113496440A (zh) * | 2021-06-28 | 2021-10-12 | 国网上海市电力公司 | 一种用户异常用电检测方法及*** |
CN113592533B (zh) * | 2021-06-30 | 2023-09-12 | 国网上海市电力公司 | 一种基于无监督学习的异常用电检测方法及*** |
WO2023273249A1 (zh) * | 2021-06-30 | 2023-01-05 | 国网上海市电力公司 | 基于tsvm模型的智能电能表自动化检定***异常检测方法 |
CN113592533A (zh) * | 2021-06-30 | 2021-11-02 | 国网上海市电力公司 | 一种基于无监督学习的异常用电检测方法及*** |
CN113688125A (zh) * | 2021-08-24 | 2021-11-23 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的异常值检测方法、装置、电子设备及介质 |
CN113688125B (zh) * | 2021-08-24 | 2023-12-05 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的异常值检测方法、装置、电子设备及介质 |
CN114124482B (zh) * | 2021-11-09 | 2023-09-26 | 中国电子科技集团公司第三十研究所 | 基于lof和孤立森林的访问流量异常检测方法及设备 |
CN114124482A (zh) * | 2021-11-09 | 2022-03-01 | 中国电子科技集团公司第三十研究所 | 基于lof和孤立森林的访问流量异常检测方法及设备 |
CN114066261A (zh) * | 2021-11-18 | 2022-02-18 | 广东电网有限责任公司 | 一种电表的篡改检测方法、装置、计算机设备和存储介质 |
CN115080965A (zh) * | 2022-08-16 | 2022-09-20 | 杭州比智科技有限公司 | 基于历史表现的无监督异常检测方法及*** |
CN115080964A (zh) * | 2022-08-16 | 2022-09-20 | 杭州比智科技有限公司 | 基于图深度学习的数据流转异常检测方法及*** |
CN117113235A (zh) * | 2023-10-20 | 2023-11-24 | 深圳市互盟科技股份有限公司 | 一种云计算数据中心能耗优化方法及*** |
CN117113235B (zh) * | 2023-10-20 | 2024-01-26 | 深圳市互盟科技股份有限公司 | 一种云计算数据中心能耗优化方法及*** |
CN117692196A (zh) * | 2023-12-11 | 2024-03-12 | 国网河南省电力公司经济技术研究院 | 一种基于随机森林的用户状态画像异常监测方法 |
CN117390557A (zh) * | 2023-12-13 | 2024-01-12 | 深圳汉尼康科技有限公司 | 一种多功能进阶语言沟通辅助训练数据管理*** |
CN117390557B (zh) * | 2023-12-13 | 2024-03-12 | 深圳汉尼康科技有限公司 | 一种多功能进阶语言沟通辅助训练数据管理*** |
CN117407826A (zh) * | 2023-12-14 | 2024-01-16 | 中国电子科技集团公司第十研究所 | 一种机载无线电导航***异常检测方法、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108985632A (zh) | 一种基于孤立森林算法的用电数据异常检测模型 | |
CN110263166A (zh) | 基于深度学习的舆情文本分类方法 | |
CN111614491B (zh) | 一种面向电力监控***安全态势评估指标选取方法及*** | |
CN112383052B (zh) | 基于电力物联网的电网故障修复方法和装置 | |
CN109525595A (zh) | 一种基于时间流特征的黑产账号识别方法及设备 | |
CN105930347B (zh) | 基于文本分析的停电原因识别*** | |
CN107861942A (zh) | 一种基于深度学习的电力疑似投诉工单识别方法 | |
CN111046931A (zh) | 一种基于随机森林的道岔故障诊断方法 | |
CN105138413B (zh) | 一种配电网在线数据异常检测方法 | |
CN110636066B (zh) | 基于无监督生成推理的网络安全威胁态势评估方法 | |
US20210109140A1 (en) | Method for identifying parameters of 10 kv static load model based on similar daily load curves | |
CN106205609A (zh) | 一种基于音频事件和主题模型的音频场景识别方法及其装置 | |
CN112199670B (zh) | 一种基于深度学习改进iforest对行为异常检测的日志监控方法 | |
CN113496440B (zh) | 一种用户异常用电检测方法及*** | |
CN112906790B (zh) | 一种基于用电数据的独居老人识别方法和*** | |
CN109283293B (zh) | 基于变异系数与topsis法的电力变压器故障诊断方法 | |
CN110321947A (zh) | 一种基于卷积神经网络的用电异常预判方法 | |
CN106597154B (zh) | 基于dag-svm的变压器故障诊断提升方法 | |
CN112200263B (zh) | 一种应用于配电物联网的自组织联邦聚类方法 | |
CN116087647A (zh) | 基于pca和麻雀算法优化随机森林的建筑电气故障诊断方法 | |
CN116011330A (zh) | 一种基于改进随机森林的电力***电压稳定评估方法 | |
CN111600878A (zh) | 一种基于maf-adm的低速率拒绝服务攻击检测方法 | |
CN103294811A (zh) | 考虑特征可靠性的视频分类器构造方法 | |
CN114416423A (zh) | 一种基于机器学习的根因定位方法和*** | |
CN111047428A (zh) | 基于少量欺诈样本的银行高风险欺诈客户识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181211 |
|
WD01 | Invention patent application deemed withdrawn after publication |