CN110826904A - 风机的数据处理方法、装置、处理设备及可读存储介质 - Google Patents
风机的数据处理方法、装置、处理设备及可读存储介质 Download PDFInfo
- Publication number
- CN110826904A CN110826904A CN201911065104.XA CN201911065104A CN110826904A CN 110826904 A CN110826904 A CN 110826904A CN 201911065104 A CN201911065104 A CN 201911065104A CN 110826904 A CN110826904 A CN 110826904A
- Authority
- CN
- China
- Prior art keywords
- data
- distance
- probability density
- joint probability
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 28
- 238000003672 processing method Methods 0.000 title claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims abstract description 116
- 238000012544 monitoring process Methods 0.000 claims abstract description 55
- 238000001914 filtration Methods 0.000 claims abstract description 54
- 238000000034 method Methods 0.000 claims abstract description 21
- 230000002159 abnormal effect Effects 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 abstract description 8
- 238000010248 power generation Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002650 habitual effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Primary Health Care (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Wind Motors (AREA)
Abstract
本发明提供一种风机的数据处理方法、装置、处理设备及可读存储介质,涉及风力发电技术领域。所述方法包括:根据风机的多组监控数据,建立数据矩阵;其中,数据矩阵中每个数据点包括一组监控数据,监控数据包括:一个风速以及风速下风机的功率;确定数据矩阵中每两个数据点之间的距离;确定数据矩阵中每个数据点关于风速和功率的联合概率密度;根据距离和联合概率密度,进行数据点过滤。通过基于风机的风速和功率计算得到各组监控数据对应的数据点与其他数据点的距离,以及每个数据点的联合概率密度,进行数据点的过滤,无需通过人为设定的阈值进行过滤,提高了数据过滤的准确性,从而提高了基于过滤后数据点得到的功率曲线评测风机的准确性。
Description
技术领域
本发明涉及风力发电技术领域,具体而言,涉及一种风机的数据处理方法、装置、处理设备及可读存储介质。
背景技术
随着风力发电技术的不断发展,可以根据风力发电机组(简称:风机) 的功率曲线,对风力发电机组的输出性能和运行状态进行评测。
相关技术中,为了提高评测的准确度,可以先根据风力发电机组的设计参数(如额定功率)对过滤阈值进行设定,再根据阈值对风机的监控数据中每组监控数据对应的各个点进行过滤,得到过滤异常点之后的监控数据,用以生成风机的功率曲线,继而根据风机的功率曲线对风机的输出性能和运行状态进行评测。
但是,在对风机的监控数据进行过滤的过程中,受到人为设定的阈值的影响,导致过滤后的监控数据不准确,从而影响对风机的评测。
发明内容
本发明的目的在于,针对上述现有技术中的不足,提供一种风机的数据处理方法、装置、处理设备及可读存储介质,以解决对风机的评测不准确的问题。
为实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种风机的数据处理方法,所述方法包括:
根据风机的多组监控数据,建立数据矩阵;其中,所述数据矩阵中每个数据点包括一组所述监控数据,所述监控数据包括:一个风速以及所述风速下所述风机的功率;
确定所述数据矩阵中每两个数据点之间的距离;
确定所述数据矩阵中每个数据点关于风速和功率的联合概率密度;
根据所述距离和所述联合概率密度,进行数据点过滤。
可选的,所述根据所述距离和所述联合概率密度,进行数据点过滤,包括:
根据所述数据矩阵中每两个数据点之间的距离,和,所述数据矩阵中每个数据点关于风速和功率的联合概率密度,确定各联合概率密度对应的距离;其中,最大联合概率密度对应的距离为最大距离,其它联合概率密度对应的距离为最小距离;
建立包括多组数据的数据集合,其中,每组数据包括:一个联合概率密度和所述一个联合概率密度对应的距离;
确定所述数据集合中,联合概率密度小于或等于预设密度,且,距离大于或等于预设距离的数据点,作为异常数据点;
对所述数据集合中的所述异常数据点进行过滤。
可选的,所述根据所述数据矩阵中每两个数据点之间的距离,和,所述数据矩阵中每个数据点关于风速和功率的联合概率密度,确定各联合概率密度对应的距离,包括:
根据所述数据矩阵中每两个数据点之间的距离,建立距离矩阵,所述距离矩阵中每个数据为两个数据点之间的距离;
根据所述每个数据点关于风速和功率的联合概率密度,建立密度矩阵,所述密度矩阵中每个数据为以所述数据点为中心,预设距离范围内的数据点关于风速和功率的联合概率密度;
根据所述距离矩阵,和所述密度矩阵,确定所述各联合概率密度对应的距离。
可选的,所述方法还包括:
根据过滤之后的数据点,生成所述风机的功率曲线,所述功率曲线用于表示所述风机的风速与功率的对应关系。
可选的,所述根据过滤之后的数据点,生成所述风机的功率曲线,包括:
从所述过滤之后的数据点中选取联合概率密度与距离的乘积最大的数据点作为聚类中心;
将与所述聚类中心的距离在预设范围内的数据点归于所述聚类中心所在的类中;
根据聚类后的数据点,生成所述风机的功率曲线。
第二方面,本发明实施例还提供了一种风机的数据处理装置,所述装置包括:
建立模块,用于根据风机的多组监控数据,建立数据矩阵;其中,所述数据矩阵中每个数据点包括一组所述监控数据,所述监控数据包括:一个风速以及所述风速下所述风机的功率;
距离确定模块,用于确定所述数据矩阵中每两个数据点之间的距离;
密度确定模块,用于确定所述数据矩阵中每个数据点关于风速和功率的联合概率密度;
过滤模块,用于根据所述距离和所述联合概率密度,进行数据点过滤。
可选的,所述过滤模块,还用于根据所述数据矩阵中每两个数据点之间的距离,和,所述数据矩阵中每个数据点关于风速和功率的联合概率密度,确定各联合概率密度对应的距离;其中,最大联合概率密度对应的距离为最大距离,其它联合概率密度对应的距离为最小距离;建立包括多组数据的数据集合,其中,每组数据包括:一个联合概率密度和所述一个联合概率密度对应的距离;确定所述数据集合中,联合概率密度小于或等于预设密度,且,距离大于或等于预设距离的数据点,作为异常数据点;对所述数据集合中的所述异常数据点进行过滤。
可选的,所述过滤模块,还用于根据所述数据矩阵中每两个数据点之间的距离,建立距离矩阵,所述距离矩阵中每个数据为两个数据点之间的距离;根据所述每个数据点关于风速和功率的联合概率密度,建立密度矩阵,所述密度矩阵中每个数据为以所述数据点为中心,预设距离范围内的数据点关于风速和功率的联合概率密度;根据所述距离矩阵,和所述密度矩阵,确定所述各联合概率密度对应的距离。
可选的,所述装置还包括:
生成模块,用于根据过滤之后的数据点,生成所述风机的功率曲线,所述功率曲线用于表示所述风机的风速与功率的对应关系。
可选的,所述生成模块,还用于从所述过滤之后的数据点中选取联合概率密度与距离的乘积最大的数据点作为聚类中心;将与所述聚类中心的距离在预设范围内的数据点归于所述聚类中心所在的类中;根据聚类后的数据点,生成所述风机的功率曲线。
第三方面,本发明实施例还提供了一种处理设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当所述处理设备运行时,所述处理器与所述存储介质之间通过所述总线通信,所述处理器执行所述机器可读指令,以执行时执行如第一方面任一所述的风机的数据处理方法的步骤。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如第一方面任一所述的风机的数据处理方法的步骤。
本发明的有益效果是:
本申请实施例通过根据风机包括风速和功率的多组监控数据,建立数据矩阵,并确定数据矩阵中每两个数据点之间的距离,再确定数据矩阵中每个数据点关于风速和功率的联合概率密度,最后根据距离和联合概率密度,进行数据点过滤。通过基于风机的风速和功率计算得到各组监控数据对应的数据点与其他数据点的距离,以及每个数据点的联合概率密度,进行数据点的过滤,无需通过人为设定的阈值进行过滤,提高了数据过滤的准确性,从而提高了基于过滤后数据点得到的功率曲线评测风机的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明一实施例提供的风机的数据处理方法的流程示意图;
图2为本发明另一实施例提供的风机的数据处理方法的流程示意图;
图3为本发明一实施例提供的风机的数据处理装置的示意图;
图4为本发明另一实施例提供的风机的数据处理装置的示意图;
图5为本发明一实施例提供的处理设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
在本申请提出申请之前,相关技术方案为:先根据风力发电机组的设计参数确定过滤阈值,再根据过滤阈值对功率曲线中的各个散点进行过滤,最后根据过滤后的曲线对风机进行评测。但是,由于过滤阈值是根据风机的设计参数人为设定的,导致过滤不准确,从而导致对风机评测不准确的问题。
为了解决上述技术问题,本发明实施例提供一风机的数据处理方法。其核心改进点在于:根据风机包括风速和功率在内的监控数据,确定每个数据点之间的距离,以及每个数据点关于风速和功率的联合概率密度,从而根据距离和联合概率密度,筛选确定监控数据中的异常数据点,并对异常数据点进行过滤。
下面通过多种可能的实现方式对本发明所提供的技术方案进行说明。
图1为本发明一实施例提供的风机的数据处理方法的流程示意图,该数据处理方法可由服务器执行,该服务器可以为SCADA(Supervisory Control And DataAcquisition,数据采集与监视控制)***中的服务器如数据采集服务器或数据监测服务器,该服务器还可以为其它***中的其它类型的服务器,如图1所示,该方法可包括:
步骤101、根据风机的多组监控数据,建立数据矩阵;其中,该数据矩阵中每个数据点包括一组监控数据,该监控数据包括:一个风速以及该风速下风机的功率。
为了提高对风机进行评测的准确度,可以先对风机的监控数据进行过滤,筛除多组监控数据中的异常数据点,则可以先获取风机的监控数据,并根据多组监控数据建立数据矩阵,以便在后续步骤中,可以根据数据矩阵对监控数据进行筛选。
其中,风机的每组监控数据可以包括风速和与风速相对应的功率,风速为风机所在场景中的风速,而与风速相对应的功率则是在该风速下,风机输出的功率。
在一种可选实施例中,可以获取预设时间段内风机的多组监控数据,并根据获取的多组监控数据,分别将风速和功率作为行向量和列向量,建立包括多组监控数据的数据矩阵,并将各组监控数据填充至数据矩阵中与风速和功率对应的位置,作为与各个风速和功率对应的数据点。
例如,可以获取SCADA***记录的多组监控数据,并根据多组监控数据建立数据矩阵D=[v,P],其中v是风速,P是功率。
步骤102、确定数据矩阵中每两个数据点之间的距离。
在得到数据矩阵后,可以对数据矩阵中的数据点进行进一步处理,得到数据矩阵中任意两个数据点之间的距离,以便在后续步骤中,可以根据计算得到的距离过滤异常数据点。
在一种可选实施例中,对于任意一个数据点,可以遍历对数据矩阵中的其它各个数据点,根据该数据点的风速和功率,以及其他各个数据点的风速和功率采用预设的距离算法,从而计算得到该数据点与其他各个数据点之间的距离,进而可以计算得到每两个数据点之间的距离。
需要说明的是,在实际应用中,任意两个数据点之间的距离可以是欧式距离,还可以是其他用于表示两个数据点之间的差异的距离,本申请实施例对此不做限定。
步骤103、确定数据矩阵中每个数据点关于风速和功率的联合概率密度。
在得到数据矩阵后,还可以基于风速和功率,计算每个数据点的联合概率密度,以便根据联合概率密度确定各个数据点的密集程度,从而在后续步骤中,结合联合概率密度筛选异常数据点。
其中,该联合概率密度用于指示该数据点所在预设区域内的密集程度。例如,某个数据点的联合概率密度较大,则说明该数据点周围分布有较多的其他数据点;若该某个数据点的联合概率密度较小,则说明该数据点周围分布有较少的其他数据点。
在一种可选实施例中,对于每个数据点,可以该数据点为圆心,以预设距离为半径,并获取该圆形区域内的各个数据点,再根据预设设置的联合概率密度算法进行计算,得到针对该数据点关于风速和功率的联合概率密度。
其中,该预设距离可以根据数据点的风速和功率进行设置,也可以根据经验值进行设置,本申请实施例对此不做限定。
需要说明的是,本申请实施例仅是以先执行步骤102,后执行步骤103,而在实际应用中,可以先执行步骤103,后执行步骤102,或者同时执行步骤102和步骤103,本申请实施例对执行步骤102和步骤103的顺序不做限定。
另外,在计算联合概率密度的过程中,可以采用高斯核函数进行计算,也可以通过其他联合概率密度函数进行计算,本申请实施例对此不做限定。
步骤104、根据距离和联合概率密度,进行数据点过滤。
在计算得到各个数据与其他数据点之间的距离和每个数据点的联合概率密度后,可以基于距离和联合概率密度,确定各个数据点中的异常数据点,并对各个数据点中的异常数据点进行筛选,完成对数据点的过滤。
在一种可选实施例中,对于每个数据点,可以获取该数据点的联合概率密度,若该数据点的联合概率密度大于预设密度阈值,则说明该数据点周围分布有较多的其他数据点,可以确定该数据点为非异常数据点。
但是,若该数据点的联合概率密度小于或等于预设密度阈值,则说明该数据点周围分布有较少的其他数据点,可以再获取该数据点与其他各个数据点之间的距离,判断获取得到各个距离中的最小距离是否大于预设距离阈值,若大于,则说明该数据点周围分布的其他数据点较少,该数据点可能为异常数据点,则可以对该数据点进行过滤,从而在对每个数据点进行分析判断后,确定各个数据点是否为异常数据点,最后对确定的各个异常数据点进行过滤。
综上所述,本申请实施例提供的风机的数据处理方法,通过根据风机包括风速和功率的多组监控数据,建立数据矩阵,并确定数据矩阵中每两个数据点之间的距离,再确定数据矩阵中每个数据点关于风速和功率的联合概率密度,最后根据距离和联合概率密度,进行数据点过滤。通过基于风机的风速和功率计算得到各组监控数据对应的数据点与其他数据点的距离,以及每个数据点的联合概率密度,进行数据点的过滤,无需通过人为设定的阈值进行过滤,提高了数据过滤的准确性,从而提高了基于过滤后数据点得到的功率曲线评测风机的准确性。
图2为本发明另一实施例提供的风机的数据处理方法的流程示意图,如图2所示,该方法可包括:
步骤201、根据风机的多组监控数据,建立数据矩阵;其中,该数据矩阵中每个数据点包括一组监控数据,该监控数据包括:一个风速以及风速下风机的功率。
步骤202、确定数据矩阵中每两个数据点之间的距离。
步骤203、确定数据矩阵中每个数据点关于风速和功率的联合概率密度。
步骤204、根据距离和联合概率密度,进行数据点过滤。
在确定距离和联合概率密度后,可以基于距离和联合概率密度确定各个数据点中的异常数据点,以便对各个异常数据点进行过滤,并在后续步骤中,根据过滤后的数据点生成风机的功率曲线。
在确定异常数据点的过程中,需要对距离和联合概率密度进行进一步处理,则可选的,如上所示的步骤204至少可以通过下述步骤实现:
步骤204a、根据数据矩阵中每两个数据点之间的距离,和数据矩阵中每个数据点关于风速和功率的联合概率密度,确定各联合概率密度对应的距离。
其中,最大联合概率密度对应的距离为最大距离,其它联合概率密度对应的距离为最小距离。
由于每个数据点与其他数据点之间均存在一个距离,但是为了减少运算量,提高筛选异常数据点的效率,可以结合每个数据点的联合概率密度,从该数据点的多个距离中,选取能够体现该数据点的特征的距离,作为与该数据点的联合概率密度相对应的距离。
进一步地,可以根据数据点的联合概率密度的参数值大小,选取满足不同条件的距离,作为与联合概率密度相对应的距离。
可选的,可以根据数据矩阵中每两个数据点之间的距离,建立距离矩阵,该距离矩阵中每个数据为两个数据点之间的距离;并根据每个数据点关于风速和功率的联合概率密度,建立密度矩阵,该密度矩阵中每个数据为以数据点为中心,预设距离范围内的数据点关于风速和功率的联合概率密度;再根据距离矩阵,和密度矩阵,确定各联合概率密度对应的距离。
例如,根据计算得到的每个数据点与其他数据点之间的距离,建立距离矩阵D=[dij],其中,dij用于表示第i个数据点与第j个数据点之间的距离, i和j均为正整数。
类似的,可以根据每个数据点的联合概率密度,建立密度矩阵ρ=[ρi],ρi表示第i个数据点的联合概率密度,表示在预设距离(dc)范围内第i个数据点惯用风速和功率的联合概率密度。
相对应的,在根据距离矩阵和密度矩阵,确定各联合概率密度对应的距离的过程中,对于每个数据点,可以将该数据点的联合概率密度与其他数据点的联合概率密度进行比较,判断该数据点的联合概率密度是否为最大的联合概率密度。
若该数据点的联合概率密度为最大的联合概率密度,则可以从该数据点与其他各个数据点之间的距离中,选取参数值最大的距离(dmax)作为该联合概率密度对应的距离。
若该数据点的联合概率密度不是最大的联合概率密度,则可以该数据点为圆心,以预设距离为半径,在该圆形区域内选取多个数据点,并从多个数据点与该数据点之间的距离中,选取参数值最小的距离(mindij)作为该联合概率密度对应的距离,也即是,将从多个数据点与圆心的距离中,选取与圆心距离最小的距离作为该联合概率密度对应的距离。
而且,ρi小于ρj,即第i个数据点的联合概率密度小于第j个数据点的联合概率密度,且第i个数据点与第j个数据点之间的距离是在预设距离对应的圆形区域内是最小距离,则可以将第i个数据点与第j个数据点之间的距离,作为第i个数据点的联合概率密度对应的距离。
步骤204b、建立包括多组数据的数据集合。
其中,每组数据可以包括:一个联合概率密度和一个联合概率密度对应的距离。
在确定每个数据点的联合概率密度对应的距离后,可以根据每个数据点的联合概率密度和对应的距离,建立包括数据点的数据集合,以便在后续步骤中,可以根据数据集合中每个数据点的联合概率密度和对应的距离,确定异常数据点。
例如,该数据集合M可以包括每个数据点对应的联合概率密度(ρ) 和联合概率密度对应的距离(δ),ρi表示第i个数据点的联合概率密度,δi表示第i个数据点的联合概率密度对应的距离。
步骤204c、确定数据集合中,联合概率密度小于或等于预设密度,且,距离大于或等于预设距离的数据点,作为异常数据点。
对于数据集合中的每个数据点,可以判断该数据点的联合概率密度是否小于或等于预设密度,若该数据点的联合概率密度大于预设密度,则说明该数据点周围的其他数据点较多,该数据点属于异常数据点的概率较小;但是,若该数据点的联合概率密度小于或等于预设密度,则说明该数据点周围的其他数据点较少,该数据点属于异常数据点的概率较大,则可以进一步根据与联合概率密度对应的距离进行确定。
若该数据点的联合概率密度对应的距离大于或等于预设距离,则说明该数据点与其他数据点之间的最小距离也大于或等于预设距离,该数据点与其他各个数据点之间的距离均较远,则该数据点可能是异常数据点,可以将该数据点作为异常数据点。
步骤204d、对数据集合中的异常数据点进行过滤。
在确定异常数据点之后,可以从多个数据点中将各个异常数据点滤除,以便在后续步骤中,可以根据过滤后的各个数据点,生成风机更加准确的功率曲线。
需要说明的是,在实际应用中,可以在执行步骤204c确定异常数据点后,立即执行本步骤204d对该异常数据点进行过滤,并循环执行步骤204c 和步骤204d,直至对每个数据点判断完毕;也可以在执行步骤204c确定各个数据点中的全部异常数据点之后,再执行步骤204d,从而对各个异常数据点进行滤除。
可选的,该方法还可包括:
步骤205、根据过滤之后的数据点,生成风机的功率曲线。
其中,该功率曲线用于表示风机的风速与功率的对应关系。
在得到过滤之后的数据点后,可以根据过滤后的数据点生成风机的功率曲线,以便可以根据生成的准确的功率曲线,对风机的性能和运行状态进行评测。
在生成功率曲线的过程中,可以先确定功率曲线中的聚类中心,再根据聚类中心将各个数据点排布在聚类中心的附近,从而生成风机的功率曲线。
可选的,可以从过滤之后的数据点中选取联合概率密度与距离的乘积最大的数据点作为聚类中心,并将与聚类中心的距离在预设范围内的数据点归于聚类中心所在的类中,再根据聚类后的数据点,生成风机的功率曲线。
在一种可选实施例中,针对每个数据点,可以获取该数据点的联合概率密度与对应的距离之间的乘积,从而得到每个数据点对应的乘积,并将参数值最大的乘积所对应的数据点作为聚类中心,再根据各个数据点对应的风速和功率,将各个数据点排布在聚类中心附近,最后根据排布的多个数据点生成功率曲线。
综上所述,本申请实施例提供的风机的数据处理方法,通过根据风机包括风速和功率的多组监控数据,建立数据矩阵,并确定数据矩阵中每两个数据点之间的距离,再确定数据矩阵中每个数据点关于风速和功率的联合概率密度,最后根据距离和联合概率密度,进行数据点过滤。通过基于风机的风速和功率计算得到各组监控数据对应的数据点与其他数据点的距离,以及每个数据点的联合概率密度,进行数据点的过滤,无需通过人为设定的阈值进行过滤,提高了数据过滤的准确性,从而提高了基于过滤后数据点得到的功率曲线评测风机的准确性。
图3为本发明一实施例提供的风机的数据处理装置的示意图,如图3 所示,该装置具体包括:
建立模块301,用于根据风机的多组监控数据,建立数据矩阵;其中,该数据矩阵中每个数据点包括一组该监控数据,该监控数据包括:一个风速以及该风速下风机的功率;
距离确定模块302,用于确定该数据矩阵中每两个数据点之间的距离;
密度确定模块303,用于确定该数据矩阵中每个数据点关于风速和功率的联合概率密度;
过滤模块304,用于根据该距离和该联合概率密度,进行数据点过滤。
可选的,该过滤模块304,还用于根据该数据矩阵中每两个数据点之间的距离,和,该数据矩阵中每个数据点关于风速和功率的联合概率密度,确定各联合概率密度对应的距离;其中,最大联合概率密度对应的距离为最大距离,其它联合概率密度对应的距离为最小距离;建立包括多组数据的数据集合,其中,每组数据包括:一个联合概率密度和该一个联合概率密度对应的距离;确定该数据集合中,联合概率密度小于或等于预设密度,且,距离大于或等于预设距离的数据点,作为异常数据点;对该数据集合中的该异常数据点进行过滤。
可选的,该过滤模块304,还用于根据该数据矩阵中每两个数据点之间的距离,建立距离矩阵,该距离矩阵中每个数据为两个数据点之间的距离;根据该每个数据点关于风速和功率的联合概率密度,建立密度矩阵,该密度矩阵中每个数据为以该数据点为中心,预设距离范围内的数据点关于风速和功率的联合概率密度;根据该距离矩阵,和该密度矩阵,确定该各联合概率密度对应的距离。
可选的,参见图4,该装置还包括:
生成模块305,用于根据过滤之后的数据点,生成该风机的功率曲线,该功率曲线用于表示该风机的风速与功率的对应关系。
可选的,该生成模块305,还用于从该过滤之后的数据点中选取联合概率密度与距离的乘积最大的数据点作为聚类中心;将与该聚类中心的距离在预设范围内的数据点归于该聚类中心所在的类中;根据聚类后的数据点,生成该风机的功率曲线。
综上所述,本申请实施例提供的风机的数据处理装置,通过根据风机包括风速和功率的多组监控数据,建立数据矩阵,并确定数据矩阵中每两个数据点之间的距离,再确定数据矩阵中每个数据点关于风速和功率的联合概率密度,最后根据距离和联合概率密度,进行数据点过滤。通过基于风机的风速和功率计算得到各组监控数据对应的数据点与其他数据点的距离,以及每个数据点的联合概率密度,进行数据点的过滤,无需通过人为设定的阈值进行过滤,提高了数据过滤的准确性,从而提高了基于过滤后数据点得到的功率曲线评测风机的准确性。
上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称 FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上***(system-on-a-chip,简称SOC)的形式实现。
图5为本发明一实施例提供的处理设备的结构示意图,该处理设备可以为服务器,该服务器可以是具备风机的数据处理功能的设备。
该处理设备包括:处理器501、存储介质502和总线503。
所述存储介质502存储有所述处理器501可执行的机器可读指令,当所述处理设备运行时,所述处理器501与所述存储介质502之间通过所述总线503通信,所述处理器501执行所述机器可读指令,以执行时执行上述方法实施例。具体实现方式和技术效果类似,这里不再赘述。
可选地,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述方法实施例。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文: Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (12)
1.一种风机的数据处理方法,其特征在于,所述方法包括:
根据风机的多组监控数据,建立数据矩阵;其中,所述数据矩阵中每个数据点包括一组所述监控数据,所述监控数据包括:一个风速以及所述风速下所述风机的功率;
确定所述数据矩阵中每两个数据点之间的距离;
确定所述数据矩阵中每个数据点关于风速和功率的联合概率密度;
根据所述距离和所述联合概率密度,进行数据点过滤。
2.根据权利要求1所述的方法,其特征在于,所述根据所述距离和所述联合概率密度,进行数据点过滤,包括:
根据所述数据矩阵中每两个数据点之间的距离,和,所述数据矩阵中每个数据点关于风速和功率的联合概率密度,确定各联合概率密度对应的距离;其中,最大联合概率密度对应的距离为最大距离,其它联合概率密度对应的距离为最小距离;
建立包括多组数据的数据集合,其中,每组数据包括:一个联合概率密度和所述一个联合概率密度对应的距离;
确定所述数据集合中,联合概率密度小于或等于预设密度,且,距离大于或等于预设距离的数据点,作为异常数据点;
对所述数据集合中的所述异常数据点进行过滤。
3.根据权利要求2所述的方法,其特征在于,所述根据所述数据矩阵中每两个数据点之间的距离,和,所述数据矩阵中每个数据点关于风速和功率的联合概率密度,确定各联合概率密度对应的距离,包括:
根据所述数据矩阵中每两个数据点之间的距离,建立距离矩阵,所述距离矩阵中每个数据为两个数据点之间的距离;
根据所述每个数据点关于风速和功率的联合概率密度,建立密度矩阵,所述密度矩阵中每个数据为以所述数据点为中心,预设距离范围内的数据点关于风速和功率的联合概率密度;
根据所述距离矩阵,和所述密度矩阵,确定所述各联合概率密度对应的距离。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据过滤之后的数据点,生成所述风机的功率曲线,所述功率曲线用于表示所述风机的风速与功率的对应关系。
5.根据权利要求4所述的方法,其特征在于,所述根据过滤之后的数据点,生成所述风机的功率曲线,包括:
从所述过滤之后的数据点中选取联合概率密度与距离的乘积最大的数据点作为聚类中心;
将与所述聚类中心的距离在预设范围内的数据点归于所述聚类中心所在的类中;
根据聚类后的数据点,生成所述风机的功率曲线。
6.一种风机的数据处理装置,其特征在于,所述装置包括:
建立模块,用于根据风机的多组监控数据,建立数据矩阵;其中,所述数据矩阵中每个数据点包括一组所述监控数据,所述监控数据包括:一个风速以及所述风速下所述风机的功率;
距离确定模块,用于确定所述数据矩阵中每两个数据点之间的距离;
密度确定模块,用于确定所述数据矩阵中每个数据点关于风速和功率的联合概率密度;
过滤模块,用于根据所述距离和所述联合概率密度,进行数据点过滤。
7.根据权利要求6所述的装置,其特征在于,所述过滤模块,还用于根据所述数据矩阵中每两个数据点之间的距离,和,所述数据矩阵中每个数据点关于风速和功率的联合概率密度,确定各联合概率密度对应的距离;其中,最大联合概率密度对应的距离为最大距离,其它联合概率密度对应的距离为最小距离;建立包括多组数据的数据集合,其中,每组数据包括:一个联合概率密度和所述一个联合概率密度对应的距离;确定所述数据集合中,联合概率密度小于或等于预设密度,且,距离大于或等于预设距离的数据点,作为异常数据点;对所述数据集合中的所述异常数据点进行过滤。
8.根据权利要求7所述的装置,其特征在于,所述过滤模块,还用于根据所述数据矩阵中每两个数据点之间的距离,建立距离矩阵,所述距离矩阵中每个数据为两个数据点之间的距离;根据所述每个数据点关于风速和功率的联合概率密度,建立密度矩阵,所述密度矩阵中每个数据为以所述数据点为中心,预设距离范围内的数据点关于风速和功率的联合概率密度;根据所述距离矩阵,和所述密度矩阵,确定所述各联合概率密度对应的距离。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
生成模块,用于根据过滤之后的数据点,生成所述风机的功率曲线,所述功率曲线用于表示所述风机的风速与功率的对应关系。
10.根据权利要求9所述的装置,其特征在于,所述生成模块,还用于从所述过滤之后的数据点中选取联合概率密度与距离的乘积最大的数据点作为聚类中心;将与所述聚类中心的距离在预设范围内的数据点归于所述聚类中心所在的类中;根据聚类后的数据点,生成所述风机的功率曲线。
11.一种处理设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当所述处理设备运行时,所述处理器与所述存储介质之间通过所述总线通信,所述处理器执行所述机器可读指令,以执行时执行如权利要求1至5任一所述的风机的数据处理方法的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至5任一所述的风机的数据处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911065104.XA CN110826904B (zh) | 2019-11-01 | 2019-11-01 | 风机的数据处理方法、装置、处理设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911065104.XA CN110826904B (zh) | 2019-11-01 | 2019-11-01 | 风机的数据处理方法、装置、处理设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110826904A true CN110826904A (zh) | 2020-02-21 |
CN110826904B CN110826904B (zh) | 2022-08-02 |
Family
ID=69552639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911065104.XA Active CN110826904B (zh) | 2019-11-01 | 2019-11-01 | 风机的数据处理方法、装置、处理设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110826904B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116304898A (zh) * | 2023-05-15 | 2023-06-23 | 北京信息科技大学 | 基于机器学习的传感器数据智能存储*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013054088A1 (en) * | 2011-10-10 | 2013-04-18 | Isis Innovation Limited | Improvements in localisation estimation |
CN105930933A (zh) * | 2016-04-26 | 2016-09-07 | 华北电力科学研究院有限责任公司 | 风电场理论功率曲线确定方法及装置 |
CN107103175A (zh) * | 2017-02-03 | 2017-08-29 | 华北电力科学研究院有限责任公司 | 一种风力发电机组异常数据识别方法及装置 |
CN107122475A (zh) * | 2017-05-02 | 2017-09-01 | 杭州泰指尚科技有限公司 | 大数据异常点检测方法及其*** |
CN109783486A (zh) * | 2019-01-17 | 2019-05-21 | 华北电力大学 | 数据清洗方法、装置及服务器 |
-
2019
- 2019-11-01 CN CN201911065104.XA patent/CN110826904B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013054088A1 (en) * | 2011-10-10 | 2013-04-18 | Isis Innovation Limited | Improvements in localisation estimation |
CN105930933A (zh) * | 2016-04-26 | 2016-09-07 | 华北电力科学研究院有限责任公司 | 风电场理论功率曲线确定方法及装置 |
CN107103175A (zh) * | 2017-02-03 | 2017-08-29 | 华北电力科学研究院有限责任公司 | 一种风力发电机组异常数据识别方法及装置 |
CN107122475A (zh) * | 2017-05-02 | 2017-09-01 | 杭州泰指尚科技有限公司 | 大数据异常点检测方法及其*** |
CN109783486A (zh) * | 2019-01-17 | 2019-05-21 | 华北电力大学 | 数据清洗方法、装置及服务器 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116304898A (zh) * | 2023-05-15 | 2023-06-23 | 北京信息科技大学 | 基于机器学习的传感器数据智能存储*** |
Also Published As
Publication number | Publication date |
---|---|
CN110826904B (zh) | 2022-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101964412B1 (ko) | 이동통신데이터 처리시스템의 이상로그 발생을 진단하는 방법 및 그 시스템 | |
CN108809734B (zh) | 网络告警根源分析方法、***、存储介质及计算机设备 | |
CN111626360B (zh) | 用于检测锅炉故障类型的方法、装置、设备和存储介质 | |
CN110995153A (zh) | 一种光伏电站的异常数据检测方法、装置及电子设备 | |
CN109815085B (zh) | 告警数据的分类方法、装置和电子设备及存储介质 | |
CN112459971A (zh) | 风力发电机组塔筒的异常振动检测方法 | |
CN113746798B (zh) | 基于多维度分析的云网络共享资源异常根因定位方法 | |
EP4050527A1 (en) | Estimation program, estimation method, information processing device, relearning program, and relearning method | |
EP4053757A1 (en) | Degradation suppression program, degradation suppression method, and information processing device | |
CN111881159B (zh) | 一种基于代价敏感极端随机森林的故障检测方法及装置 | |
CN115453356B (zh) | 一种动力设备运行状态监测分析方法、***、终端及介质 | |
CN114595210A (zh) | 一种多维数据的异常检测方法、装置及电子设备 | |
CN110826904B (zh) | 风机的数据处理方法、装置、处理设备及可读存储介质 | |
CN109410502A (zh) | 火灾预警方法及装置 | |
CN111179108A (zh) | 用电能耗的预测方法和装置 | |
CN110889597A (zh) | 业务时序指标异常检测方法及装置 | |
CN113098912A (zh) | 用户账户异常的识别方法、装置、电子设备及存储介质 | |
CN116365519B (zh) | 一种电力负荷预测方法、***、存储介质及设备 | |
CN112398226A (zh) | 一种供电***反窃电方法、***、终端及存储介质 | |
CN114116853B (zh) | 基于时序关联分析的数据安全分析方法及装置 | |
CN114676781A (zh) | 车辆故障诊断预测方法、装置、设备及车辆 | |
CN115310516A (zh) | 自动化设备状态稳定判断方法、***及可读存储介质 | |
CN113408210A (zh) | 基于深度学习的非侵入负荷分解方法、***、介质和设备 | |
CN116107859B (zh) | 容器故障预测方法、装置、电子设备及存储介质 | |
CN110826899B (zh) | 一种风力发电机组的性能评估方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 102206 31 Industrial Park, North Qing Road, Beijing, Changping District Applicant after: Sany Heavy Energy Co.,Ltd. Address before: 102206 31 Industrial Park, North Qing Road, Beijing, Changping District Applicant before: SANY HEAVY ENERGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |