CN102930291B - 用于图形图像的k近邻局部搜索遗传自动聚类方法 - Google Patents

用于图形图像的k近邻局部搜索遗传自动聚类方法 Download PDF

Info

Publication number
CN102930291B
CN102930291B CN201210391449.6A CN201210391449A CN102930291B CN 102930291 B CN102930291 B CN 102930291B CN 201210391449 A CN201210391449 A CN 201210391449A CN 102930291 B CN102930291 B CN 102930291B
Authority
CN
China
Prior art keywords
image
chromosome
clustered
value
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210391449.6A
Other languages
English (en)
Other versions
CN102930291A (zh
Inventor
刘若辰
史文博
焦李成
刘静
马文萍
张向荣
马晶晶
王爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201210391449.6A priority Critical patent/CN102930291B/zh
Publication of CN102930291A publication Critical patent/CN102930291A/zh
Application granted granted Critical
Publication of CN102930291B publication Critical patent/CN102930291B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种用于图形图像的k近邻局部搜索遗传自动聚类方法,主要解决现有自动聚类算法在聚类时易陷入局部最优的缺陷。其实现步骤是:(1)用canny算子检测图像的轮廓;(2)用shape context方法描述图像的轮廓并计算轮廓点的匹配代价矩阵;(3)根据匹配代价矩阵用dynamic programming方法对轮廓点进行匹配;(4)用procrustes analysis方法对匹配的轮廓点进行变换;(5)将变换后的匹配轮廓点用字符串表示并测量字符串间的edit距离;(6)根据字符串的edit距离计算图像间的距离;(7)用遗传自动聚类算法对图像进行聚类;(8)对遗传算法的种群进行k近邻局部搜索。本发明具有易于达到全局最优,寻找到正确聚类数的优点。

Description

用于图形图像的k近邻局部搜索遗传自动聚类方法
技术领域
本发明属于图像处理技术领域,可用于对形状特征明显图像的自动聚类。
背景技术
科学技术的不断发展,促使人们的研究对象越来越复杂。视觉作为人类认识和观察世界的主要手段之一,其信息不仅数量巨大而且比较复杂。颜色、形状、纹理和事物的空间关系都等是视觉信息的构成要素,可以作为研究的着眼点。形状是物体在视觉感知意义下具有的最基本特征之一,这方面的研究已经成为计算机视觉和模式识别的重要方面,而利用形状特征对事物进行识别和分类也成为了计算机视觉和模式识别研究的主要工具之一。对形状的研究有形状提取、形状匹配等。形状提取就是从图像中提取出形状信息,这方面比较著名的方法有canny等,形状匹配可分为描述、匹配等两方面。近年来有多种形状描述和匹配的方法被提出。形状描述方法有基于形状边缘轮廓的,有基于形状区域的等等。这些方法均各有优缺点。形状匹配按照一定的度量准则来衡量形状间的相似性。一对一的形状匹配没有任何先验信息,往往不能区分重要的和非重要的形状差异,无论如何设计更优良的形状描述子,都无法解决这一问题,这就需要设计更好的算法去找到形状相似度距离空间中同类形状的内在关系。
聚类分析,作为数据挖掘的重要研究方向之一,其目的是让人们识别数据集中密集和稀疏的区域,发现数据的全局分布模式,以及数据属性之间的相互关系。聚类分析已经广泛的应用到各个领域,包括数据分析、图像处理和市场分析、数据挖掘、统计学、机器学习、空间数据库技术、生物学和市场学等。传统的聚类算法,是提前给定聚类数的,但是现实生活中受诸多因素影响很多数据的聚类数是不可预知的,在这个时候自动聚类的作用凸显而出,诸多学者提出了各种各样的方法,试图解决自动聚类问题。但这些方法往往存在着缺陷:算法常常会陷入局部最优,得不到正确的聚类数。有人利用梯度下降的思想来解决自动聚类问题,并将其用于图形图像的聚类,但这种方法依旧存在着上述所说的缺陷,算法容易陷入局部最优,不能得到正确的聚类数。
发明内容
本发明的目的在于针对上述已有的技术不足,提出一种用于图形图像的k近邻局部搜索遗传自动聚类方法,以提高图像的聚类效果。
本发明的技术思路是:通过canny算子检测图像的轮廓,通过shape context方法描述图像的轮廓信息,通过dynamic programming方法、procrustes analysis方法及edit距离结合计算图像集的距离矩阵,对图像的自动聚类通过k近邻局部搜索遗传自动聚类算法来实现。其具体实现步骤如下:
(1)输入待聚类的N幅图像Si,i=1,…,N,利用canny算子分别对每幅图像进行边缘检测,得到各幅待聚类图像的轮廓图像Ii
(2)对各轮廓图像Ii沿其轮廓线进行均匀采样,并以笛卡尔坐标表示采样得到的轮廓点Pij=(xij,yij),i=1,…,N,j=1,…,M,其中,Pij表示采样得到的第i幅轮廓图像的第j个点,xij,yij分别为轮廓点Pij位置的横纵坐标,M为采样点的个数;
(3)计算待聚类的任意两幅图像间的距离:
(3a)用shape context方法描述轮廓图像Ii,得到轮廓图像Ii的每个轮廓点的近邻点位置分布直方图,并对该直方图进行归一化;
(3b)将归一化的近邻点位置分布直方图,用χ2统计方法,计算轮廓图像Ii轮廓点的匹配代价矩阵;
(3c)根据匹配代价矩阵,用dynamic programming方法,去除两幅轮廓图像的离群点,得到轮廓图像的对应匹配点;
(3d)对所得到的对应匹配点,用procrustes analysis方法进行变换;
(3e)将变换后的对应匹配点转换为字符串;
(3f)经过步骤(3a)到(3e)得到两幅待聚类图像Si,Sj的字符串;
(3g)对得到的待聚类图像Si和Sj的字符串,用Edit距离测量这两个字符串间的Edit距离E(Si,Sj),然后计算待聚类图像Si和Sj之间的距离:
d(Si,Sj)=λu×E(Si,Sj)/L,
其中λ=1.03为常数,u为待聚类图像Si的轮廓图像的离群点个数,L为待聚类图像Si的字符串的长度;
(3h)对得到的待聚类图像的距离d(Si,Sj),进行归一化
(4)令进化代数t=0,初始化种群:
(4a)随机产生ρ个大于等于2小于等于ζ的整数ki,i=1,…,ρ,作为ρ条染色体的聚类数,ρ为种群规模,ζ=15为最大聚类数;
(4b)对每条染色体随机产生N个大于等于1小于等于ki的整数cj,j=1,…,N,作为该染色体的各个基因位Bj的值,组成该染色体Hi
(5)计算所有染色体的适应度值fi,找出适应度值最大的染色体作为当前最佳染色体H,其中:
fi=1/θi
θ i = α × k i + 1 k i × Σ s = 1 k i ω s
&omega; s = 2 n s &Sigma; S k , S h , S h &Element; C s , k < h d ( S k , S h ) 2
其中,α=0.5为控制参数,ki为所计算染色体的聚类数,d(Sk,Sh)为待聚类图像Sk和Sh的距离,ns为第s类聚类图像所含的待聚类图像副数,Cs为第s类待聚类图像的集合,Sk和Sh为第s类待聚类图像中的待聚类图像;
(6)根据所得到的染色体的适应度值fi,用轮盘赌选择法对所有染色体Hi进行选择,选出要进行遗传操作的中间代染色体H′i
(7)对得到的中间代染色体H′i,以概率σ11∈[0,1]进行单点交叉操作;
(8)对经过单点交叉操作后所有中间代染色体H″i,以概率σ22∈[0,1]进行单点变异操作;
(9)计算经过单点交叉操作后所有中间代染色体H″i的适应度值fi
(10)对每条中间代染色体H″i,产生一个随机数r,r∈[0,1],如果r<0.5,执行步骤(11),否则执行步骤(12);
(11)对中间代染色体H″i的每个基因位Bj,产生随机数ψ,ψ≠cj,1≤ψ≤ki,ki为中间代染色体H″i的聚类数,cj为基因位Bj的值,将基因位Bj的值cj改为ψ,计算此时中间代染色体H″′i的适应度值fi′,并与改动前的中间代染色体适应度值fi比较,若f′i>fi,则基因位Bj的值设置为ψ,执行步骤(13),否则基因位Bj的值设置为cj,执行步骤(13);
(12)对中间代染色体H″i进行k近邻局部搜索:
(12a)将中间代染色体H″i的每个基因位Bj所对应的待聚类图像Sj,与其它待聚类图像Sl的距离d(Sj,Sl)从小到大进行排序;
(12b)从排好序的距离中,选取前K=5个距离所对应的待聚类图像,作为K副最近邻图像S′v
(12c)对所选出的K副最近邻图像S′v对应的基因位Bv,统计不同基因位值的个数,找到个数最多的基因位值τ,若τ=cj,cj为待聚类图像Sj对应的基因位Bj的值,则执行步骤(13);
(12d)将中间代染色体H″i的基因位Bj的值改为τ,计算此时中间代染色体H″′i的适应度值f″i,将改变前中间代染色体H″i的适应度值fi,若f″i>fi,则基因位Bj的值设置为τ,否则基因位Bj的值设置为cj
(13)比较所有中间代染色体的适应度值fi,找出适应度值最大的染色,将该染色体与当前最佳染色体H比较,若该染色体的适应度值大于当前最佳染色体H的适应度值,则将该染色体复制到当前最佳染色体H,若当前最佳染色体H的适应度值大于该染色体的适应度值,则将当前最佳染色体H复制到该染色体;
(14)对进化代数t值加1,此时若t小于最大进化代数T=100,则返回步骤(6),否则,将当前最佳染色体H的每一个基因位Bi的值ci作基因位Bi所对应待聚类图像Si的类标,将所有类标相同的待聚类图像分为一个类,输出分类后的待聚类图像和当前最佳染色体H的聚类数。
本发明与现有技术相比具有以下优点:
1、本发明由于在遗传操作之后加入局部搜索算子,故可在小范围内调整种群的进化进程,增加了种群的多样性,有利于克服陷入局部最优的缺陷,提高了图像的聚类效果。
2、本发明由于根据图像的近邻信息进行局部搜索,改善了种群进化的方向,加快了收敛速度。
附图说明
图1是本发明的总流程图;
图2是测试图像集kimia216中的其中4副图像示例;
图3是用本发明对测试图像集kimia216中的30副图像的聚类仿真效果图;
图4是用对比算法对测试图像集kimia216中的30副图像的聚类仿真效果图。
具体实施方式
参照图1,本发明的实现包括如下步骤:
步骤一:输入待聚类的N幅图像Si,i=1,…,N,利用canny算子分别对每幅图像进行边缘检测,得到各幅待聚类图像的轮廓图像Ii,本实例中N取30但不局限于30,canny算子由John Canny于1986年提出。
步骤二:对各轮廓图像Ii沿其轮廓线进行均匀采样,并以笛卡尔坐标表示采样得到的轮廓点Pij=(xij,yij),i=1,…,N,j=1,…,M,其中,Pij表示采样得到的第i幅轮廓图像的第j个点,xij,yij分别为轮廓点Pij位置的横纵坐标,M=100为采样点的个数。
步骤三:计算待聚类的任意两幅图像间的距离。
3.1)用shape context方法描述轮廓图像Ii,得到轮廓图像Ii的每个轮廓点的近邻点位置分布直方图,并对该直方图进行归一化:
3.1.1)对轮廓图像Ii,计算所有轮廓点之间的最大距离
d=max1≤m<n≤M{||Pim-Pin||}
| | P im - P in | | = ( x im - x in ) 2 + ( y im - y in ) 2 ,
将最大距离d转换为对数log(d),并将该对数平均的量化为b1个等级,将360°角平均的量化为b2个等级,以轮廓点Pij为原点,由这b1×b2个等级划分出b1×b2个区域;
3.1.2)对轮廓图像Ii的每个轮廓点Pij,将除该轮廓点之外的所有轮廓点Pik由笛卡尔坐标转换为极坐标P′ik=(rikik),再转换为对数极坐标P″ik=(r′ik,θ′ik),其中:
r ik = ( x ik - x ij ) 2 + ( y ik - y ij ) 2
&theta; ik = arctan ( y ik - y ij x ik - x ij )
r′ik=log(rik)
θ′ikikO,
&theta; 0 = arctan ( y 0 - y ij x 0 - x ij )
x 0 = 1 M &times; &Sigma; l = 1 M x il
y 0 = 1 M &times; &Sigma; l = 1 M y il
在对数极坐标系中,统计落入已划分好的b1×b2个区域的各个区域中轮廓点P″ik的个数cl,l=1,…,b1×b2,再利用经验密度公式进行归一化处理,得到轮廓点Pij的近邻点位置分布归一化直方图hj(s):
h j ( s ) = c s &Sigma; l = 1 b 1 &times; b 2 c l , s=1,…,b1×b2
3.2)对得到的近邻点位置分布归一化直方图,根据公式计算匹配代价矩阵C(i,j):
C ( i , j ) = 1 2 &Sigma; s = 1 b 1 &times; b 2 [ h i ( s ) - h j ( s ) ] 2 h i ( s ) + h j ( s ) ;
3.3)根据得到的匹配代价矩阵,用dynamic programming方法,去除两幅轮廓图像的离群点,得到轮廓图像的对应匹配点,dynamic programming方法的具体实施步骤见M.R.Daliri和V. Torre于2008年发表在Pattern Recognition上的文章Robustsymbolic representation for shape recognition and retrieval。
3.4)对所得到的对应匹配点,用procrustes analysis方法进行变换,procrustes analsis方法的具体实施步骤见Mohammad Reza Daliri和Vincent Torre于2009年发表在Imageand Vision Computing上的文章Shape and texture clustering:Best estimate for the clustersnumber。
3.5)将变换后的对应匹配点转换为字符串,其具体实施步骤见Mohammad RezaDaliri和Vincent Torre于2009年发表在Image and Vision Computing上的文章Shape andtexture clustering:Best estimate for the clusters number。
3.6)经过步骤3.1)到3.5)得到两幅待聚类图像Si,Sj的字符串。
3.7)对得到的待聚类图像Si和Sj的字符串,用Edit距离测量这两个字符串间的Edit距离E(Si,Sj),然后计算待聚类图像Si和Sj之间的距离:
d(Si,Sj)=λu×E(Si,Sj)/L,
其中λ=1.03为常数,u为待聚类图像Si的轮廓图像的离群点个数,L为待聚类图像Si的字符串的长度。
Edit距离的测量步骤见Eric SvenRistad和PeterN.Yianilos于1998年在IEEE Trans.PAMI上发表的文章Learning string edit distance。
3.8)对得到的待聚类图像的距离d(Si,Sj),进行归一化。
步骤四:令进化代数t=0,初始化种群:
4.1)随机产生ρ个大于等于2小于等于ζ的整数ki,i=1,…,ρ,作为ρ条染色体的聚类数,ρ为种群规模,ζ=15为最大聚类数。
4.2)对每条染色体随机产生N个大于等于1小于等于ki的整数cj,j=1,…,N,作为该染色体的各个基因位Bj的值,组成该染色体Hi
步骤五:计算所有染色体的适应度值fi,找出适应度值最大的染色体作为当前最佳染色体H,其中:
fi=1/θi
&theta; i = &alpha; &times; k i + 1 k i &Sigma; s = 1 k i &omega; s
&omega; s = 2 n s &Sigma; S k , S h &Element; C s , k < h d ( S k , S h ) 2
其中,α=0.5为控制参数,ki为所计算染色体的聚类数,d(Sk,Sh)为待聚类图像Sk和Sh的距离,ns为第s类聚类图像所含的待聚类图像副数,Cs为第s类待聚类图像的集合,Sk和Sh为第s类待聚类图像中的待聚类图像。
步骤六:根据所得到的染色体的适应度值fi,对所有染色体Hi进行选择,选出要进行遗传操作的中间代染色体H′i
6.1)根据所得到的染色体的适应度值fi,通过公式
F i = &Sigma; s = 1 i f s &Sigma; j = 1 N f j ,
计算所有染色体的累加概率Fi
6.2)随机产生ρ个数γj,γj∈[0,1],对每个随机数γj,寻找下标值l,使得Fl-1j≤Fl成立,将第l个染色体Hl,复制到中间代染色体H′j
步骤七:对得到的中间代染色体,以概率σ1进行单点交叉操作,σ1∈[0,1]。
单点交叉操作的具体步骤见Ujjwal Maulik和Sanghamitra Bandyopadhyay发表在Pattern Recognition上的文章Genetic algorithm-based clustering technique。
步骤八:对经过单点交叉操作后所有中间代染色体H″i,以概率σ22∈[0,1]进行单点变异操作。
单点变异操作的具体步骤见Ujjwal Maulik和Sanghamitra Bandyopadhyay发表在Pattern Recognition上的文章Genetic algorithm-based clustering technique。
步骤九:计算经过单点交叉操作后所有中间代染色体H″i的适应度值fi
步骤十:对每条中间代染色体H″i,产生一个随机数r,r∈[0,1],如果r<0.5,执行步骤十一,否则执行步骤十二。
步骤十一:对中间代染色体H″i的每个基因位Bj,产生随机数ψ,ψ≠cj,1≤ψ≤ki,ki为中间代染色体H″i的聚类数,cj为基因位Bj的值,将基因位Bj的值cj改为ψ,计算此时中间代染色体H″′i的适应度值f′i,并与改动前的中间代染色体适应度值fi比较,若f′i>fi,则基因位Bj的值设置为ψ,执行步骤十三,否则基因位Bj的值设置为cj,执行步骤十三。
步骤十二:对中间代染色体H″i进行k近邻局部搜索:
12.1)将中间代染色体H″i的每个基因位Bj所对应的待聚类图像Sj与其它待聚类图像Sl的距离d(Sj,Sl),从小到大进行排序;
12.2)从排好序的距离中,选取前K=5个距离所对应的待聚类图像,作为K副最近邻图像S′v
12.3)对所选出的K副最近邻图像S′v对应的基因位Bv,统计不同基因位值的个数,找到个数最多的基因位值τ,若τ=cj,cj为待聚类图像Sj对应的基因位Bj的值,则执行步骤骤十三;
12.4)将中间代染色体H″i的基因位Bj的值改为τ,计算此时中间代染色体H″′i的适应度值f″i,将改变前中间代染色体H″i的适应度值fi进行比较,若f″i>fi,则基因位Bj的值设置为τ,否则基因位Bj的值设置为cj
步骤十三:比较所有中间代染色体的适应度值fi,找出适应度值最大的染色,将该染色体与当前最佳染色体H比较,若该染色体的适应度值大于当前最佳染色体H的适应度值,则将该染色体复制到当前最佳染色体H,若当前最佳染色体H的适应度值大于该染色体的适应度值,则将当前最佳染色体H复制到该染色体。
步骤十四:对进化代数t值加1,此时,若t小于最大进化代数T=100,则返回步骤(6),否则,将当前最佳染色体H的每一个基因位Bi的值ci作基因位Bi所对应待聚类图像Si的类标,将所有类标相同的待聚类图像分为一个类,输出分类后的待聚类图像和当前最佳染色体H的聚类数。
本发明的效果可以通过以下实验进一步说明:
1、仿真实验采用的图像:
实验使用了测试图像集kimia216中的30幅图像作为测试图像,这些图像均为形状特征明显的二值图像,其中图2是测试图像集kimia216中当中的4副。
2、仿真实验的参数设置条件:
设定参数为:轮廓点采样个数M=100、极坐标近邻点位置分布直方图直径量化值b1=5、极坐标近邻点位置分布直方图角度量化值b2=12、dynamic programming方法的惩罚值0.5、Edit距离测度惩罚值0.5、Edit距离测度相邻点个数5、种群大小ρ=30、最大聚类数ζ=15、最大进化代数T=100、k最近邻图像副数K=5、交叉概率σ1=0.8、变异概率σ2=0.2、控制参数α=0.1。
3、仿真实验环境:
在CPU为core2 2.4HZ、内存2G、WINDOWS XP***上使用C++进行了仿真。
4、仿真内容
仿真1
用本发明与现有的形状图像聚类算法,分别独立运行20次,记录每次结果的聚类数、ARI、MS等三个指标,计算其均值及标准差如表1所示。
表1 本发明与对比算法的有效性指标对比
从表1可看出,在三种有效性指标下,本发明的表现均好于对比算法,证明了本发明的有效性。
仿真2
用本发明对测试图像集kimia216中的30副图像进行聚类,得到聚类结果如图3,图3中位于同一行的图像属于同一个类,位于不同行的图像属于不同类。
仿真3
用对比算法对测试图像集kimia216中的30副图像进行聚类,得到聚类结果如图4,图4中位于同一行的图像属于同一个类,位于不同行的图像属于不同类。
通过上述的仿真实验可以看出,本发明对测试图像能取得较好的聚类效果。在数值上的比较上,和视觉效果的比较上,都有效地验证本发明的合理性和有效性。
从仿真1和仿真3中的对比算法见Mohammad Reza Daliri和Vincent Torre于2009年发表在Image and Vision Computing上的文章Shape and texture clustering:Bestestimate for the clustersnumber。

Claims (1)

1.一种用于图形图像的k近邻局部搜索遗传自动聚类方法,包括如下步骤:
(1)输入待聚类的N幅图像Sp,p=1,…,N,利用canny算子分别对每幅图像进行边缘检测,得到各幅待聚类图像的轮廓图像Ip
(2)对各轮廓图像Ip沿其轮廓线进行均匀采样,并以笛卡尔坐标表示采样得到的轮廓点Ppq=(xpq,ypq),p=1,…,N,q=1,…,M,其中,Ppq表示采样得到的第p幅轮廓图像的第q个点,xpq,ypq分别为轮廓点Ppq位置的横纵坐标,M为采样点的个数;
(3)计算待聚类的任意两幅图像间的距离;
(3a)用shape context方法描述轮廓图像Ip1和Ip2,得到轮廓图像的每个轮廓点的近邻点位置分布直方图,并对直方图进行归一化;
(3b)将归一化的近邻点位置分布直方图,用χ2统计方法,计算轮廓图像上轮廓点的匹配代价矩阵;
(3c)根据匹配代价矩阵,用dynamic programming方法,去除两幅轮廓图像的离群点,得到轮廓图像的对应匹配点;
(3d)对所得到的对应匹配点,用procrustes analysis方法进行变换;
(3e)将变换后的对应匹配点转换为字符串;
(3f)经过步骤(3a)到(3e)得到两幅待聚类图像的字符串Sp1和Sp2
(3g)根据得到的待聚类图像的字符串,计算待聚类图像之间的距离:
d(Sp1,Sp2)=λu×E(Sp1,Sp2)/L,
其中E(Sp1,Sp2)为待聚类图像的字符串间的Edit距离,λ=1.03为常数,u为待聚类图像的轮廓图像的离群点个数,L为待聚类图像的字符串的长度;
(3h)对得到的所有待聚类图像间的距离,进行归一化;
(4)令进化代数t=0,初始化种群:
(4a)随机产生ρ个大于等于2小于等于ζ的整数ki,i=1,…,ρ,作为ρ条染色体的聚类数,ρ=30为种群规模,ζ=15为最大聚类数;
(4b)对每条染色体随机产生N个大于等于1小于等于ki的整数cj,j=1,…,N,作为该染色体的各个基因位Bj的值,组成该染色体Hi
(5)计算所有染色体的适应度值fi 0,找出适应度值最大的染色体作为当前最佳染色体H;
适应度值fi 0,通过如下公式计算:
fi 0=1/θi
&theta; i = &alpha; &times; k i + 1 k i &times; &Sigma; s = 1 k i &omega; s
&omega; s = 2 n s &Sigma; S k , S h &Element; C s , k < h d ( S k , S h ) 2
其中,α=0.5为控制参数,ki为所计算染色体的聚类数,d(Sk,Sh)为待聚类图像Sk和Sh的距离,ns为第s类聚类图像所含的待聚类图像副数,Cs为第s类待聚类图像的集合,Sk和Sh为第s类待聚类图像中的待聚类图像;
(6)根据所得到的染色体的适应度值fi 0,用轮盘赌选择法对所有染色体Hi进行选择,选出要进行遗传操作的中间代染色体H′i
(7)对得到的中间代染色体H′i,以概率σ11∈[0,1]进行单点交叉操作;
(8)对经过单点交叉操作后所有中间代染色体H″i,以概率σ22∈[0,1]进行单点变异操作,得到单点变异操作后的中间代染色体Hi″′;
(9)使用步骤(5)的方法计算经过单点变异操作后所有中间代染色体Hi″′的适应度值fi
(10)对每条中间代染色体Hi″′,产生一个随机数r,r∈[0,1],如果r<0.5,执行步骤(11),否则执行步骤(12);
(11)对中间代染色体Hi″′的每个基因位Bj,产生随机数ψ,ψ≠cj,1≤ψ≤ki′,ki′为中间代染色体Hi″′的聚类数,cj为基因位Bj的值,将基因位Bj的值cj改为ψ,计算此时中间代染色体Hi″′的适应度值f′i,并与改动前的中间代染色体适应度值fi比较,若f′i>fi,则基因位Bj的值设置为ψ,执行步骤(13),否则基因位Bj的值设置为cj,执行步骤(13);
(12)对中间代染色体Hi″′进行k近邻局部搜索:
(12a)将中间代染色体Hi″′的每个基因位Bj所对应的待聚类图像Sj,与其它待聚类图像Sl的距离d(Sj,Sl)从小到大进行排序;
(12b)从排好序的距离中,选取前K=5个距离所对应的待聚类图像,作为K副最近邻图像S′v
(12c)对所选出的K副最近邻图像S'v对应的基因位Bv,统计不同基因位值的个数,找到个数最多的基因位值τ,若τ=cj,cj为待聚类图像Sj对应的基因位Bj的值,执行步骤(13);
(12d)将中间代染色体Hi″′的基因位Bj的值改为τ,计算此时中间代染色体Hi″′的适应度值fi″,将其与改变前中间代染色体Hi″′的适应度值fi相比较,若fi″>fi,则基因位Bj的值设置为τ,否则基因位Bj的值设置为cj
(13)比较所有中间代染色体Hi″′的适应度值fi″,并找出适应度值最大的染色体,将该染色体与当前最佳染色体H比较,若该染色体的适应度值大于当前最佳染色体H的适应度值,则将该染色体复制到当前最佳染色体H,若当前最佳染色体H的适应度值大于该染色体的适应度值,则将当前最佳染色体H复制到该染色体;
(14)对进化代数t值加1,此时若t小于最大进化代数T=100,则返回步骤(6),否则,将当前最佳染色体H的每一个基因位Bj的值cj作基因位Bj所对应待聚类图像Sj的类标,将所有类标相同的待聚类图像分为一个类,输出分类后的待聚类图像和当前最佳染色体H的聚类数。
CN201210391449.6A 2012-10-15 2012-10-15 用于图形图像的k近邻局部搜索遗传自动聚类方法 Expired - Fee Related CN102930291B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210391449.6A CN102930291B (zh) 2012-10-15 2012-10-15 用于图形图像的k近邻局部搜索遗传自动聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210391449.6A CN102930291B (zh) 2012-10-15 2012-10-15 用于图形图像的k近邻局部搜索遗传自动聚类方法

Publications (2)

Publication Number Publication Date
CN102930291A CN102930291A (zh) 2013-02-13
CN102930291B true CN102930291B (zh) 2015-04-08

Family

ID=47645088

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210391449.6A Expired - Fee Related CN102930291B (zh) 2012-10-15 2012-10-15 用于图形图像的k近邻局部搜索遗传自动聚类方法

Country Status (1)

Country Link
CN (1) CN102930291B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6548743B2 (ja) * 2015-05-22 2019-07-24 華為技術有限公司Huawei Technologies Co.,Ltd. カラーキャリブレーション装置及び方法
CN105373812B (zh) * 2015-12-15 2019-01-25 上海电机学院 基于组遗传算法的图像属性聚类方法
US10679129B2 (en) * 2017-09-28 2020-06-09 D5Ai Llc Stochastic categorical autoencoder network
CN109784497B (zh) * 2019-01-15 2020-12-25 探智立方(北京)科技有限公司 基于计算图进化的ai模型自动生成的方法
CN110486630B (zh) * 2019-08-20 2020-10-30 西南石油大学 天然气管道腐蚀缺陷典型特征提取方法
CN112584143B (zh) * 2020-12-02 2022-09-06 浙江大华技术股份有限公司 一种视频编码方法、装置、***及计算机可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102426697A (zh) * 2011-10-24 2012-04-25 西安电子科技大学 基于遗传粗糙集c均值聚类的图像分割方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102426697A (zh) * 2011-10-24 2012-04-25 西安电子科技大学 基于遗传粗糙集c均值聚类的图像分割方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Mohammad Reza Daliri,Vincent Torre."Shape and texture clustering: Best estimate for the clusters number".《Image and Vision Computing》.2009,第27卷(第10期), *
周叙国,邢汉承."基于遗传模糊C- 均值聚类算法的地图分割".《计算机与数字工程》.2005,第33卷(第6期), *

Also Published As

Publication number Publication date
CN102930291A (zh) 2013-02-13

Similar Documents

Publication Publication Date Title
CN108960140B (zh) 基于多区域特征提取和融合的行人再识别方法
CN102930291B (zh) 用于图形图像的k近邻局部搜索遗传自动聚类方法
CN106845717B (zh) 一种基于多模型融合策略的能源效率评价方法
CN105205501B (zh) 一种多分类器联合的弱标注图像对象检测方法
CN103456013B (zh) 一种表示超像素以及度量超像素之间相似性的方法
CN101751666A (zh) 基于谱聚类的半监督多光谱遥感图像分割方法
CN106021603A (zh) 一种基于分割和特征匹配的服装图像检索方法
CN106844739B (zh) 一种基于神经网络协同训练的遥感图像变化信息检索方法
CN101140624A (zh) 图像匹配方法
CN105930873B (zh) 一种基于子空间的自步跨模态匹配方法
CN102346851B (zh) 基于njw谱聚类标记的图像分割方法
CN105046714A (zh) 一种非监督的基于超像素和目标发现机制的图像分割方法
CN102663447A (zh) 基于判别相关分析的跨媒体检索方法
CN109858386A (zh) 一种基于荧光显微图像的微藻细胞识别方法
CN104392459A (zh) 基于改进的fcm和均值漂移的红外图像分割方法
CN102945553A (zh) 基于自动差分聚类算法的遥感图像分割方法
CN105469117A (zh) 一种基于鲁棒特征提取的图像识别方法与装置
CN105930859B (zh) 基于线性流形聚类的雷达信号分选方法
CN104966075A (zh) 一种基于二维判别特征的人脸识别方法与***
CN106570537A (zh) 一种基于混淆矩阵的随机森林模型选择方法
CN102163285A (zh) 一种基于主动学习的跨域视频语义概念检测方法
CN106611016B (zh) 一种基于可分解词包模型的图像检索方法
CN105046323A (zh) 一种正则化rbf网络多标签分类方法
CN106778897B (zh) 基于余弦距离和中心轮廓距离的两次植物物种识别方法
CN103714340A (zh) 基于图像分块的自适应特征提取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150408

Termination date: 20201015

CF01 Termination of patent right due to non-payment of annual fee