CN101814063A - 基于距离权重的全局k-均值聚类算法 - Google Patents

基于距离权重的全局k-均值聚类算法 Download PDF

Info

Publication number
CN101814063A
CN101814063A CN201010181080A CN201010181080A CN101814063A CN 101814063 A CN101814063 A CN 101814063A CN 201010181080 A CN201010181080 A CN 201010181080A CN 201010181080 A CN201010181080 A CN 201010181080A CN 101814063 A CN101814063 A CN 101814063A
Authority
CN
China
Prior art keywords
sample
bunch
means clustering
clustering algorithm
initial center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201010181080A
Other languages
English (en)
Inventor
石红
刘春洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201010181080A priority Critical patent/CN101814063A/zh
Publication of CN101814063A publication Critical patent/CN101814063A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种基于距离权重的全局k-均值聚类算法,有如下步骤:1)计算所有样本点的聚集权重信息;2)计算所有样本数据的均值作为第一个簇的聚类中心;3)判断是否满足终止条件,即判断q+1是否大于k,k=1、2…,若q>k,算法终止,否则,进入下一步骤;寻找下一个簇的最佳初始中心;通过k-均值聚类算法计算此时的聚类中心。本发明可以有效的对数据分类,通过对算法进行分析可知,相比快速全局k-均值聚类算法,本本发明所需要的时间进一步降低,因此本发明在不改变分类结果的情况下,降低了聚类所需要的时间。

Description

基于距离权重的全局k-均值聚类算法
技术领域
本发明涉及一种聚类算法。特别是涉及一种在不影响聚类效果的基础上缩短其聚类所需时间,选择全局最优解的基于距离权重的全局k-均值聚类算法。
背景技术
聚类方法是将物理或抽象对象的集合组成为由类似的对象组成的多个类的过程被称为聚类。由聚类所组成的簇是一组数据对象的集合,这些对象与同一簇中的对象彼此类似,与其他簇中的对象相异。在许多应用中,可以将一些簇中的数据对象作为一个整体来对待。
聚类,就是将数据划分为若干个“簇”,使“簇”之间的距离尽可能的大,“簇”之内的距离尽可能的小。有几种关于簇的定义:1,一些相似成员的集合,不同簇中的成员是不相似的。2,簇中两点之间的距离要小于簇中的一点与簇外任一点的距离。聚类不同与分类的基本特征是:簇的(最优)数目是不知道的(也许能解决这个问题);关于每个簇可能没有任何先验知识(大部分情况下没有先验知识);聚类结果是动态的。
数据挖掘中聚类算法的应用很广泛。在商务上,聚类能帮助市场分析人员从客户基本库中发现不同的客户群,并且用不同的购买模式来刻画不同的消费群体的特征。在生物学上,聚类能用于帮助推导植物和动物的种类,基因和蛋白质的分类,获得对种群中固定结构的认识。聚类在地球观测数据中相似地区的确定,根据房屋的类型、价值和位置对一个城市中房屋的分类发挥作用。聚类也能用来对web上的文档进行分类,以发现有用的信息。聚类分析能作为一种独立的工具来获得数据分布的情况,观察每个簇的特点,并对某些特定的节点进一步分析。此外,聚类还可以作为其他方法的预处理步骤。
数据聚类正在蓬勃的发展,有贡献的领域包括数据挖掘,统计学,机器学习,空间数据库技术,生物学以及市场营销。现在数据聚类分析已经成为一个非常活跃的研究课题。
作为统计学的一个分支,聚类分析已经被广泛地研究若干年,主要集中在基于距离的聚类分析。基于k-means(k-平均值)、k-medoids(k-中心点)和其他一些的聚类分析工具已经被加入到许多统计分析的软件中,例如S-Plus、SPSS和SAS。
在机器学习领域,聚类分析是无指导学习的例子。与分类不同,聚类不需要依赖事先定义的类和带符号的训练实践。所以聚类分析是观察式学习,而不是示例式学习。
在数据挖掘领域,研究工作已经集中在为大型数据库的有效和实际的聚类分析寻找适当的方法。活跃的研究课题集中在聚类方法的可伸缩性,方法对聚类复杂形状和类型的数据的有效性,高维聚类分析技术,以及针对大型数据库中混合数值和分类数据的聚类方法。
由于研究的需要,现在将重点放在数据挖掘中聚类方法的应用上。数据挖掘中对聚类的典型要求如下:
(1)可伸缩性。一股的聚类算法使用鱼规模小于200的数据集合上,而现在很多大型数据库的数据量达到百万个,这就要求聚类有好的可伸缩性。
(2)处理不同类型属性的能力。应用的多元化,可能要求一个聚类能处理多种数据类型,像二元类型、分类/标称类型、序数型数据,或者这些类型的混合。
(3)发现任意形状的聚类。基于距离的聚类算法趋向于发现相近尺度和密度的球状簇。但一个簇的形状是任意的,所以就要求聚类能发现这些被忽略的聚类。
(4)用于决定输入参数的领域知识的最小化。由于聚类结果对输入参数的要求很敏感,但参数通常很难确定,特别是对于高维对象的数据来说。所以输入参数的质量直接影聚类的结果,这就加重了用户的负担。
(5)处理噪声数据的能力。绝大多数数据集中存在很多孤立点、空缺、未知数据或错误数据。一些聚类算法对于这样的数据敏感,导致低质量聚类结果。
(6)对输入数据的顺序不敏感。
(7)高维性。一个数据库或是数据仓库可能只包含若干维,很多聚类算法只涉及两到三维。人类对于三维以内的数据有判断性,高于三维的数据聚类的挑战性很高,数据可能很稀疏,也可能高度偏斜。
(8)基于约束的聚类。现实世界可能要在约束条件下进行聚类,这就要求既要满足客户特定的约束,又具有良好聚类特性的数据分组。
(9)可理解行和可用性。用户希望聚类结果是可解释的,可理解的,并且是可用的。也就是,聚类与最后的应用相联系。应用目标对聚类方法的影响也是一个重要的课题。
1、k-均值聚类
k-均值聚类算法是一个基于划分的聚类方法,采用聚类误差平方和函数E作为聚类准则函数,其中,
E = Σ i = 1 k Σ j = 1 n i | | x ij - m i | | 2
xij是第i类第j个样本,mi是第i类的聚类中心或称质心,ni是第i类样本个数。k-均值聚类算法实质就是通过反复迭代寻找k个最佳的聚类中心,将全体n个样本点分配到离它最近的聚类中心,使聚类误差平方和E最小.具体过程如下:
Step1:初始化
随机指定k个聚类中心(m1,m2,……,mk)。
Step2:分配xi
对每一个样本xi,找到离它最近的聚类中心,并将其分配到该类。
Step3:修正簇中心
重新计算各簇新中心为以下值,
m i = 1 N i Σ j = 1 N i x ij , i = 1,2 , . . . , k
其中Ni是第i簇当前样本数。
Step4:计算偏差
E = Σ i = 1 k Σ j = 1 n i | | x ij - m i | | 2
Step5:收敛判断
如果E值收敛,则return(m1,m2,...,mk),算法终止;否则,转Step2。
然而k-均值聚类算法对于初始点的选择过于敏感,而且最终的mi依赖于初始的mi。同时k-均值聚类算法仅仅是一个局部搜索过程,因此最终只能得到局部的最优解而不是全局的最优解。
2、全局k-均值聚类算法
全局k-均值算法将k个簇的聚类问题转化为一系列的子聚类问题,通过一系列的局域搜索来实现k个簇的聚类问题,得到k簇聚类问题的最佳解答。具体做法是:从k=1开始,实现一个簇的聚类问题,得到一个簇的最佳质心。在此基础上,寻找k=2的最佳聚类结果,方式是默认一个簇聚类的最佳质心是k=2两簇聚类问题中其中一个簇的最佳初始中心,并通过以每一个样本作为第二个簇的初始中心运行k-均值聚类算法,以聚类效果最佳(即聚类误差平方和最小)的作为两个簇聚类的最优结果,得到两类聚类问题的最佳初始中心和最佳质心;然后再解决三个簇的聚类问题,直到实现k个簇的聚类问题。该过程默认一条原则:k-1簇聚类问题的最佳质心是k簇聚类问题中前k-1个簇的最佳初始中心;然后通过反复运行k-均值聚类算法总样本个数次来选择第k个簇的最佳初始中心,得到k簇聚类问题的最佳聚类结果。算法描述如下
Step1:初始化
计算所有样本数据的均值作为第一个簇的中心,
m 1 = 1 n Σ i = 1 n x i
设置q等于1。
Step2:终止条件
q=q+1,若q>k,算法终止。
Step3:寻找下一个簇中心
以m1,m2,...,mq-1为前q-1个簇中心,分别以数据集中每个样本xi作为第q个簇的初始中心,执行k-均值聚类算法,选择使E最小的那个样本xi作为第q个簇的最佳初始中心,得到各簇新质心y1,y2,...,yq
Step4令mi=yi,i=1,2,...,q,转Step2。
全局k-均值聚类算法尽管可以找到全局的最优解,但是也存在一个问题,那就是算法的时间复杂度太高,每一次都要对所有的节点运行一次k-均值聚类算法,因此时间复杂度很高,对于拥有大量数据的应用,此算法运行时间太长。
4、快速全局k-均值聚类算法
全局k-均值聚类算法计算量很大,不适用于大规模数据的聚类,快速全局k-均值聚类算法是Likas等人对其全局k-均值聚类算法的改进,改进之处在于:对于下一个簇初始中心的选择,快速全局k-均值聚类算法引入了bn的计算,选择使bn最大的样本点xn作为下一个簇的初始中心,从而降低了计算量。bn的定义如下:
b n = Σ j = 1 N max ( d k - 1 j - | | x n - x j | | 2 , 0 )
其中,dk-1 j表示xj与距离它最近的簇中心的距离,即xj距它所在簇中心的距离。
该改进避免了选择下一个最佳簇中心时将每一个样本作为候选点执行一次k-均值聚类算法的计算量。实验证明快速全局k-均值聚类算法在不影响聚类效果的情况下缩短了全局k-均值聚类算法的执行时间。
总之,k-均值聚类算法由于不能找到全局最优解,而只能找到局部最优解,并且其最终的结果依赖于初始点的选择,因此,在此基础上,提出了全局k-均值聚类算法,但由于其时间开销特别大,尽管可以找到全局最优解,但不适合拥有大量数据的情况,因此在其基础上出现了快速全局k-均值聚类算法,此算法可以提高其聚类速率,其引入了bn的计算,降低了计算量,但每一次循环,bn的计算仍然需要对每一个样本点,计算其和其他所有样本点的关系,每一次循环需要n2次计算。
发明内容
本发明所要解决的技术问题是,提供一种能够可以有效的对数据分类,再降低了聚类所需要的时间,选择全局最优解的基于距离权重的全局k-均值聚类算法。
本发明所采用的技术方案是:一种基于距离权重的全局k-均值聚类算法,包括如下步骤:
1)计算所有样本点的聚集权重信息
聚集权重信息计算公式如下所示,
w i = 1 Σ j = 1 n d 2 ( x i , x j )
其中n表示样本点数目,xi表示第i个样本,xj表示第j个样本,d(xi,xj)表示i、j两个样本点的距离。
2)计算所有样本数据的均值作为第一个簇的聚类中心
m 1 = 1 n Σ i = 1 n x i
并设置q=1;其中,q代表的是当前已有的聚类中心点的数目。
3)判断是否满足终止条件,即判断q+1是否大于k,k=1、2…,若q>k,算法终止,否则,进入下一步骤。
4)寻找下一个簇的最佳初始中心
下一个簇初始中心的选取,首先通过以下公式计算每一个目标节点的权重信息,
g i = w i × Σ j = 1 q - 1 d 2 ( x i , m j )
其中wi表示的是第i个节点的聚集权重,xi表示第i个样本,mj表示第j个聚类中心,q代表的是当前已有的聚类中心点的数目,d(xi,mj)表示的是样本点i和第j个聚类中心点的距离,选择gi最大的节点xi,作为下一个最佳的簇初始中心,
并令q=q+1;
5)通过k-均值聚类算法计算此时的聚类中心
其中前q-1个簇的聚类中心是前q-1个最佳初始中心,第q个初始中心是由上步计算得到的xi节点,则可得到q个最佳初始中心,执行k-均值聚类算法得到最终的q个聚类中心,并然后返回第3)步骤。
步骤1)所述的聚集权重信息计算公式用于计算节点的聚集程度。
步骤4所述的寻找下一个簇的最佳初始中心,选择目标是距离当前已有的中心点距离远,但又是节点密度大的节点作为下一个初始中心点。
本发明的基于距离权重的全局k-均值聚类算法,可以有效的对数据分类,通过对算法进行分析可知,相比快速全局k-均值聚类算法,本本发明所需要的时间进一步降低,因此本发明在不改变分类结果的情况下,降低了聚类所需要的时间。
附图说明
图1是本发明的算法流程图;
图2是试验原始数据信息,坐标为400×400;
图3是聚类结果信息,坐标为400*400,其中k=3;
图4是图3分成了三个区域。
具体实施方式
下面结合实施例和附图对本发明的基于距离权重的全局k-均值聚类算法做出详细说明。
考虑人类智能对样本点做分类的过程,我们可以看到,我们可以很轻易的看出一点简单的分类,把那些聚集在一起的样本点作为一类。我们在分类过程中主要考虑一下两点,第一寻找样本点的聚集区域,第二寻找下一个距离当前区域一定距离的另一个区域。我们首先寻找样本点周围最密集的样本作为初始的点,然后对下一个初始样本点的选择,我们将选择距离当前中心比较远但又样本周围密集的样本点为我们的选择目标,因此,我们将会根据这个思想来设计我们的算法。
我们首先引入两个概念。
聚集权重wi:其表示的是第i个样本周围的样本密集程度,其周围的样本点越密集,其对应的权重也就越高。我们用一下公式表示其权重信息,
w i = 1 Σ j = 1 n d 2 ( x i , x j )
其中n表示样本点数目,xi表示第i个样本,xj表示第j个样本。d(xi,xj)表示i,j两个样本点的距离。
我们通过wi就可以把每一个样本点周围的密集程度表示出来。我们用样本点与其他样本点之间距离的平方和的倒数表示。wi越大,则表示其所在区域越密集。
目标节点权重gi:其表示的是根据当前的中心点,如何选择下一个簇的初始中心点。我们的选择目标是距离当前已有的中心点距离远,但又是节点密度大的节点作为下一个初始中心点。我们通过下面的公式表示其权重信息,
g i = w i × Σ j = 1 q d 2 ( x i , m j )
其中wi表示的是第i个节点的聚集权重,q代表的是当前已有的聚类中心点的数目,d(xi,mj)表示的是样本点i和第j个中心点的距离。
如图1所示,本发明的基于距离权重的全局k-均值聚类算法,包括如下步骤:
1)计算所有样本点的聚集权重信息
聚集权重信息计算公式如下所示,
w i = 1 Σ j = 1 n d 2 ( x i , x j )
其中n表示样本点数目,xi表示第i个样本,xj表示第j个样本,d(xi,xj)表示i、j两个样本点的距离,所述的聚集权重信息计算公式用于计算节点的聚集程度。
2)计算所有样本数据的均值作为第一个簇的聚类中心
m 1 = 1 n Σ i = 1 n x i
并设置q=1;其中,q代表的是当前已有的聚类中心点的数目。
3)判断是否满足终止条件,即判断q+1是否大于k,k=1、2…,若q>k,算法终止,否则,进入下一步骤。
4)寻找下一个簇的最佳初始中心
所述的寻找下一个簇的最佳初始中心,选择目标是距离当前已有的中心点距离远,但又是节点密度大的节点作为下一个初始中心点。
下一个簇初始中心的选取,是通过我们以上提及的目标节点权重的概念,我们首先通过以下公式计算每一个目标节点的权重信息,
g i = w i × Σ j = 1 q d 2 ( x i , m j )
其中wi表示的是第i个节点的聚集权重,xi表示第i个样本,mj表示第j个聚类中心,q代表的是当前已有的聚类中心点的数目,d(xi,mj)表示的是样本点i和第j个聚类中心点的距离,选择gi最大的节点xi,作为下一个最佳的簇初始中心。
并令q=q+1;
5)通过k-均值聚类算法计算此时的聚类中心
其中前q-1个簇的聚类中心是前q-1个最佳初始中心,第q个初始中心是由上步计算得到的xi节点,则可得到q个最佳初始中心,执行k-均值聚类算法得到最终的q个聚类中心,并然后返回第3步骤。
下面给出一个实例:
实验数据共有600个样本点,实验原始数据信息如附图2所示,我们观察原始数据大概共有三个聚集区域,本实验将验证算法的有效性,即可以正确的划分出结果。本实验也令k=3。
Step1:计算所有样本点的wi
Step2:计算所有样本数据的均值作为第一个簇的聚类中心:
Figure GDA0000021678780000072
初始化q=1。
Step3:若q+1>3,则算法终止。
Step4:寻找下一个簇的最佳初始中心,计算每一个目标节点的权重信息,通过以下公式计算,
Figure GDA0000021678780000073
其中wi表示的是第i个节点的聚集权重,xi表示第i个样本,mj表示第j个聚类中心,q代表的是当前已有的聚类中心点的数目,d(xi,mj)表示的是样本点i和第j个聚类中心点的距离,选择gi最大的节点xi,作为下一个最佳的簇初始中心。
令q=q+1。
Step5:通过k-均值聚类算法计算此时的聚类中心。
其中前q-1个簇的聚类中心是前q-1个最佳初始中心,第q个初始中心是由上步计算得到的xi节点,则可得到q个最佳初始中心,执行k-均值聚类算法得到最终的q个聚类中心。转Step3。
由实验结果可知,本发明的基于距离权重的全局k-均值聚类算法,可以有效的对数据分类,通过对算法进行分析可知,相比快速全局k-均值聚类算法,本算法所需要的时间进一步降低,因此本算法在不改变分类结果的情况下,降低了聚类所需要的时间。

Claims (3)

1.一种基于距离权重的全局k-均值聚类算法,其特征在于:包括如下步骤:
1)计算所有样本点的聚集权重信息
聚集权重信息计算公式如下所示,
w i = 1 Σ j = 1 n d 2 ( x i , x j )
其中n表示样本点数目,xi表示第i个样本,xj表示第j个样本,d(xi,xj)表示i、j两个样本点的距离。
2)计算所有样本数据的均值作为第一个簇的聚类中心
m 1 = 1 n Σ i = 1 n x i
并设置q=1;其中,q代表的是当前已有的聚类中心点的数目。
3)判断是否满足终止条件,即判断q+1是否大于k,k=1、2…,若q>k,算法终止,否则,进入下一步骤。
4)寻找下一个簇的最佳初始中心
下一个簇初始中心的选取,首先通过以下公式计算每一个目标节点的权重信息,
g i = w i × Σ j = 1 q - 1 d 2 ( x i , m j )
其中wi表示的是第i个节点的聚集权重,xi表示第i个样本,mj表示第j个聚类中心,q代表的是当前已有的聚类中心点的数目,d(xi,mj)表示的是样本点i和第j个聚类中心点的距离,选择gi最大的节点xi,作为下一个最佳的簇初始中心,
并令q=q+1;
5)通过k-均值聚类算法计算此时的聚类中心
其中前q-1个簇的聚类中心是前q-1个最佳初始中心,第q个初始中心是由上步计算得到的xi节点,则可得到q个最佳初始中心,执行k-均值聚类算法得到最终的q个聚类中心,并然后返回第3)步骤。
2.根据权利要求1所述的基于距离权重的全局k-均值聚类算法,其特征在于,步骤1)所述的聚集权重信息计算公式用于计算节点的聚集程度。
3.根据权利要求1所述的基于距离权重的全局k-均值聚类算法,其特征在于,步骤4所述的寻找下一个簇的最佳初始中心,选择目标是距离当前已有的中心点距离远,但又是节点密度大的节点作为下一个初始中心点。
CN201010181080A 2010-05-24 2010-05-24 基于距离权重的全局k-均值聚类算法 Pending CN101814063A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010181080A CN101814063A (zh) 2010-05-24 2010-05-24 基于距离权重的全局k-均值聚类算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010181080A CN101814063A (zh) 2010-05-24 2010-05-24 基于距离权重的全局k-均值聚类算法

Publications (1)

Publication Number Publication Date
CN101814063A true CN101814063A (zh) 2010-08-25

Family

ID=42621321

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010181080A Pending CN101814063A (zh) 2010-05-24 2010-05-24 基于距离权重的全局k-均值聚类算法

Country Status (1)

Country Link
CN (1) CN101814063A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102184216A (zh) * 2011-05-04 2011-09-14 武汉大学 基于数据场划分网格的自动聚类方法
CN103049636A (zh) * 2012-09-12 2013-04-17 江苏大学 可能模糊k调和均值聚类方法及***
WO2015089872A1 (zh) * 2013-12-20 2015-06-25 南京理工大学 一种基于密度聚类的区域数据可视化方法
CN105654229A (zh) * 2015-11-26 2016-06-08 国家电网公司 一种电网自动化***及设备运行状态风险评估算法
CN106570528A (zh) * 2016-11-08 2017-04-19 上海师范大学 一种初始聚类中心选取方法及聚类方法
CN106649536A (zh) * 2016-11-01 2017-05-10 四川用联信息技术有限公司 基于改进的k‑means算法实现搜索引擎关键词优化
CN107358368A (zh) * 2017-07-21 2017-11-17 国网四川省电力公司眉山供电公司 一种面向电力用户细分的鲁棒k‑means聚类方法
CN108573227A (zh) * 2018-04-09 2018-09-25 深圳竹信科技有限公司 心电图数据质量评价方法及装置
CN108694606A (zh) * 2018-05-11 2018-10-23 南京邮电大学 一种基于关联规则的客户画像及服务推送方法
CN109063781A (zh) * 2018-08-14 2018-12-21 浙江理工大学 一种仿自然色彩功能和形式的模糊意象织物设计方法
CN109558424A (zh) * 2018-11-03 2019-04-02 复旦大学 一种高效的流数据模式挖掘方法
CN109655594A (zh) * 2018-12-30 2019-04-19 杭州铭展网络科技有限公司 一种水质获取方法
CN109740931A (zh) * 2018-12-30 2019-05-10 杭州铭展网络科技有限公司 一种用于进行水质评价的解耦合参评模型获取方法
CN109995884A (zh) * 2017-12-29 2019-07-09 北京京东尚科信息技术有限公司 确定精确地理位置的方法和装置
CN111127184A (zh) * 2019-11-01 2020-05-08 复旦大学 一种分布式组合信用评估方法
CN111163075A (zh) * 2019-12-25 2020-05-15 北京科东电力控制***有限责任公司 电力监控***设备性能指标阈值动态调整方法
CN112019757A (zh) * 2020-10-15 2020-12-01 深圳眸瞳科技有限公司 无人机协同摄影方法、装置、计算机设备和存储介质
CN113591946A (zh) * 2021-07-15 2021-11-02 广西大学 一种凤眼蓝生物量监测平台
CN117574212A (zh) * 2024-01-15 2024-02-20 山东再起数据科技有限公司 一种基于数据中台的数据分类方法

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102184216A (zh) * 2011-05-04 2011-09-14 武汉大学 基于数据场划分网格的自动聚类方法
CN102184216B (zh) * 2011-05-04 2013-01-09 武汉大学 基于数据场划分网格的自动聚类方法
CN103049636A (zh) * 2012-09-12 2013-04-17 江苏大学 可能模糊k调和均值聚类方法及***
WO2015089872A1 (zh) * 2013-12-20 2015-06-25 南京理工大学 一种基于密度聚类的区域数据可视化方法
CN105654229A (zh) * 2015-11-26 2016-06-08 国家电网公司 一种电网自动化***及设备运行状态风险评估算法
CN106649536A (zh) * 2016-11-01 2017-05-10 四川用联信息技术有限公司 基于改进的k‑means算法实现搜索引擎关键词优化
CN106570528A (zh) * 2016-11-08 2017-04-19 上海师范大学 一种初始聚类中心选取方法及聚类方法
CN107358368B (zh) * 2017-07-21 2021-07-20 国网四川省电力公司眉山供电公司 一种面向电力用户细分的鲁棒k-means聚类方法
CN107358368A (zh) * 2017-07-21 2017-11-17 国网四川省电力公司眉山供电公司 一种面向电力用户细分的鲁棒k‑means聚类方法
CN109995884A (zh) * 2017-12-29 2019-07-09 北京京东尚科信息技术有限公司 确定精确地理位置的方法和装置
CN108573227A (zh) * 2018-04-09 2018-09-25 深圳竹信科技有限公司 心电图数据质量评价方法及装置
CN108573227B (zh) * 2018-04-09 2022-04-29 深圳竹信科技有限公司 心电图数据质量评价方法及装置
CN108694606A (zh) * 2018-05-11 2018-10-23 南京邮电大学 一种基于关联规则的客户画像及服务推送方法
CN108694606B (zh) * 2018-05-11 2022-07-26 南京邮电大学 一种基于关联规则的客户画像及服务推送方法
CN109063781A (zh) * 2018-08-14 2018-12-21 浙江理工大学 一种仿自然色彩功能和形式的模糊意象织物设计方法
CN109558424A (zh) * 2018-11-03 2019-04-02 复旦大学 一种高效的流数据模式挖掘方法
CN109558424B (zh) * 2018-11-03 2023-04-18 复旦大学 一种高效的流数据模式挖掘方法
CN109655594A (zh) * 2018-12-30 2019-04-19 杭州铭展网络科技有限公司 一种水质获取方法
CN109740931A (zh) * 2018-12-30 2019-05-10 杭州铭展网络科技有限公司 一种用于进行水质评价的解耦合参评模型获取方法
CN111127184A (zh) * 2019-11-01 2020-05-08 复旦大学 一种分布式组合信用评估方法
CN111163075A (zh) * 2019-12-25 2020-05-15 北京科东电力控制***有限责任公司 电力监控***设备性能指标阈值动态调整方法
CN112019757A (zh) * 2020-10-15 2020-12-01 深圳眸瞳科技有限公司 无人机协同摄影方法、装置、计算机设备和存储介质
CN113591946A (zh) * 2021-07-15 2021-11-02 广西大学 一种凤眼蓝生物量监测平台
CN117574212A (zh) * 2024-01-15 2024-02-20 山东再起数据科技有限公司 一种基于数据中台的数据分类方法
CN117574212B (zh) * 2024-01-15 2024-04-05 山东再起数据科技有限公司 一种基于数据中台的数据分类方法

Similar Documents

Publication Publication Date Title
CN101814063A (zh) 基于距离权重的全局k-均值聚类算法
Gavioli et al. Identification of management zones in precision agriculture: An evaluation of alternative cluster analysis methods
Carstensen et al. Introducing the biogeographic species pool
CN100557626C (zh) 基于免疫谱聚类的图像分割方法
Zhou et al. An ant colony based algorithm for overlapping community detection in complex networks
Zadeh et al. A multi-population cultural algorithm for community detection in social networks
CN107330734B (zh) 基于Co-location模式和本体的商业地址选择方法
Carvalho et al. Tree-Based Methods: Concepts, Uses and Limitations under the Framework of Resource Selection Models.
von Lücken et al. An overview on evolutionary algorithms for many‐objective optimization problems
Rahman et al. Seed-Detective: A Novel Clustering Technique Using High Quality Seed for K-Means on Categorical and Numerical Attributes.
Zhang et al. An optimized method for selection of the initial centers of k-means clustering
Neverov et al. The research of automl methods in the task of wave data classification
Dahal Effect of different distance measures in result of cluster analysis
Solano et al. Radiolarian classification decision support using supervised and unsupervised learning approaches
Wessing et al. On multiobjective selection for multimodal optimization
Wang et al. Adaptive population structure learning in evolutionary multi-objective optimization
Goyal et al. A parallel framework for grid-based bottom-up subspace clustering
Liu et al. A surrogate-assisted evolutionary algorithm with hypervolume triggered fidelity adjustment for noisy multiobjective integer programming
Sikarwar et al. A Review on Social Network Analysis Methods and Algorithms
Louhi et al. Incremental nearest neighborhood graph for data stream clustering
Zhang et al. Finding community modules of brain networks based on PSO with uniform design
Ovhal et al. Improved filter ranking incorporated binary black hole algorithm for feature selection
Ghanbarzadeh Bonab An Improved Symbiotic Organisms Search for Community Detection in Social Networks
CN112802543B (zh) 一种基于概率图的基因调控网络分析方法
Tran et al. A new approach of dynamic clustering based on particle swarm optimization and application in image segmentation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20100825