CN114387442A - 一种多维空间中的直线、平面和超平面的快速检测方法 - Google Patents

一种多维空间中的直线、平面和超平面的快速检测方法 Download PDF

Info

Publication number
CN114387442A
CN114387442A CN202210033412.XA CN202210033412A CN114387442A CN 114387442 A CN114387442 A CN 114387442A CN 202210033412 A CN202210033412 A CN 202210033412A CN 114387442 A CN114387442 A CN 114387442A
Authority
CN
China
Prior art keywords
node
data
parameter
space
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210033412.XA
Other languages
English (en)
Inventor
甘祥超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Agricultural University
Original Assignee
Nanjing Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Agricultural University filed Critical Nanjing Agricultural University
Priority to CN202210033412.XA priority Critical patent/CN114387442A/zh
Priority to PCT/CN2022/080650 priority patent/WO2023134000A1/zh
Publication of CN114387442A publication Critical patent/CN114387442A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/422Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation for representing the structure of the pattern or shape of an object therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种多维空间中的直线、平面和超平面的快速检测方法,该方法建立了新的直线、平面及超平面的数学模型,以此为基础开发了一体化快速霍夫变换,使用单一k字节树负责所有信息存储。这一新方法具有两个重要的优势:首先,模型对应总最小二乘拟合算法,对数据噪声容忍度更好,解决了快速霍夫变换对位于参数空间分割线上目标检测精确度过低的问题;其次,一体化快速霍夫变换中,数据空间中距离很近的目标在参数空间中是聚集在一起的,参数空间计算过程可以采用直观的图形显示,从而快速判断目标的数量,指导***参数设定并区分重复识别的目标。本发明可应用于图像分析、计算机视觉、自动驾驶、人工智能和数据分类等。

Description

一种多维空间中的直线、平面和超平面的快速检测方法
技术领域
本发明属于图像处理技术领域,主要涉及一体化快速霍夫变换,具体是一种多维空间中的直线、平面和超平面的快速检测方法,其可用于多种数据的数据挖掘、分类和模式识别,包括图像数据、金融数据、阵列数据等;还可应用于图像分析、计算机视觉、自动驾驶、人工智能和数据分类等。
背景技术
直线检测是物体识别的基础,在图像处理及识别中有着举足轻重的地位。1962年霍夫首次开发了图像中高效的直线检测算法并获得了专利,这一算法被称为霍夫变换。至今已经有超过2500份学术文章提出各种霍夫变换的改进算法。2D霍夫变换也被拓展到多维空间中的平面及超平面检测,应用于众多领域,包括计算机视觉、机器学习、人工智能、自动驾驶及数据分类等。
霍夫变换和其绝大多数的变种的目标是二维数据中的直线检测,通过适当的改进也可用于特定曲线和图形的检测。霍夫变换用于直线检测主要包括两个步骤:设定长度有限的参数空间,设计映射函数将输入数据转换成该参数空间的直线;将参数空间分割成多个小的计票单元,利用输入数据对各计票单元投票。票数超过规定阈值的计算单元对应霍夫变换检测到的目标。算法流程如图1所示。
近年来随着激光雷达,尤其是激光雷达LiDAR在自动驾驶及空间测量上的广泛应用,霍夫变换在3D数据点云中的应用也越来越广泛。当拓展到3D甚至更高维度的数据空间时,霍夫变换对应的最简单的检测目标是平面和超平面(hyperplane)。但是由于“数据维度的诅咒”,在多维空间中相应算法的计算量和复杂度往往会指数级的增加。目前只有为数不多的霍夫变换算法可以实际应用于多维空间数据。其中,由IBM公司的Li等人于1986年提出的快速霍夫变换(Li,et al.,1986)是公认的在计算和存储复杂度上性能表现突出的佼佼者,算法也被一些通用的计算机图像处理类库如GANDALF实现并获得广泛应用。有趣的是,我们发现一些文献常常把快速霍夫变换用来指代Brady等人提出的类似于Radon变换的一个算法(Brady,1998),为了避免误解我们在此声明,本文中提到的快速霍夫变换(FHT)都是专指Li等人于1986年开发的算法,除非特别说明。Li等人提出的快速霍夫变换在计算和存储复杂度上不论是在二维还是多维空间表现都很优异,这主要归功于它采用的由粗到细渐进式处理的策略。在n维度空间中,快速霍夫变换把数据点转换为参数空间中的超平面(在二维空间中是直线,三位空间中则是平面)并搜索他们的交集。
在一个n维的数据空间{F1,F2,…,Fn},各个数据点表示为F(j)=[F1(j),F2(j),…,Fn(j)].快速霍夫变换的计算流程将如下所示:
1、设定一个k维的参数空间{X1,X2,…,Xk},找到对应的映射函数将数据点F(j)映射成参数空间的直线或超平面。参数空间的直线或超平面数学表达式为
Figure BDA0003467350530000021
其中,ai(j)是F(j)的函数,满足
Figure BDA0003467350530000022
2、设定一个投票阈值T用于决定认定目标需要的最小数据支持,以及预期的检测的精度q。
3、利用迭代算法将参数空间按从低到高的解析度分割成超立方体,并使用n个k字节树来表达和存储。进一步的分割和分析只需要对获得足够投票支持的超立方体实行。
在快速霍夫变换中,参数空间需要被划分为n个子空间,这是由使用的数学模型决定的。举个例子,在二维空间中,一条直线通常利用y=mx+c,m→∞来描述。对空间[m,c]直接搜索是不现实的,因为m的值可以是无穷大。快速霍夫变换因此使用两个方程来描述这个空间y=mx+c,|m|≤1 and y=mx+c,|m|≤1。这两个方程实质上把整个搜索空间转换成两个子参数空间(m,c)and(m',c'),其中|m|≤1,|m′|<1来搜索。同样的策略也被广泛应用于其他霍夫变换变种中,比如自适应霍夫变换(Illingworth and Kittler,1987)。
以二维快速霍夫变换为例,数据点(x,y)可以位于直线y=mx+c,|m|≤1或x=m′y+c′,|m′|<1上.参数空间由两个子空间(m,c)和(m',c')构成。将数据点(x,y)映射成直线第一个子空间(m,c)中的直线a0+a1m+a2c=0(|m|≤1)的方程是
Figure BDA0003467350530000023
将数据点(x,y)映射成直线第二个子空间(m',c')中的直线a0+a1m′+a2c′=0(|m′|<1)的方程是
Figure BDA0003467350530000024
Figure BDA0003467350530000025
快速霍夫变换利用迭代算法将参数空间按从低到高的解析度分割成互相嵌套的超立方体,并使用n个k字节树来表达和存储。每一个超立方体对应于数据空间中一条特定精度的超平面,我们称为计票单元(Accumulator)。对一个参数空间的计票单元m∈[m1,m2],c∈[c1,c2],如果我们想检测数据点(x,y)是否满足y=mx+c,m∈[m1,m2],c∈[c1,c2]的条件,我们测试a0+a1m+a2c=0在
Figure BDA0003467350530000026
Figure BDA0003467350530000027
m∈[m1,m2],c∈[c1,c2]条件下是否满足。后者可以重构成一个矩形m∈[m1,m2],c∈[c1,c2]和直线a0+a1m+a2c=0是否相交的问题,其中a0,a1,a2均已知。如果我们利用数据正则化变化使[m1,m2]和[c1,c2]具有同样长度,上述测试可以进一步放宽至测试直线和正方形的外接圆是否相交,从而大大缩减运算量(如图2所示)。以二维空间为例,我们只需检测|a0+a1m*+a2c*|<r是否满足即可,其中m*和c*是正方形中心的坐标,r是正方形外接圆的半径。
快速霍夫变换在搜索过程中,参数空间被划分为n个子空间,每个子空间由一个独立的k字节树负责其信息存储。各子空间可以分成k个超立方体,对应k字节树的k个节点,每个超立方体可以迭代分解成k个更小的超立方体,形成k字节树的更深一层节点。超立方体只有当它对应的超平面获得足够多的数据点的投票支持时,才会做更深层次的分解,并直到立方体的大小到达指定的精度时,细分停止。这种分层模型极大地节省了计算量和存储空间。
对多个独立的子空间分别进行搜索带来了很多额外的负担。虽然理论上来说,任何一条直线都不可能同时满足y=mx+c,|m|≤1 and x=m′y+c′,|m′|<1,但是实际上,斜率接近1的直线在两个子空间都会被检测到,在数据受噪声影响时尤其如此。实际算法实现上,多个独立的子空间都会在边界上有少量重叠,避免在搜索空间中出现漏洞。随着数据维度的增加,计算量和存储空间的浪费也越来越严重。
更糟糕的是,快速霍夫变换的多个子空间使用完全不同的映射函数。测试在多个不同的子空间中检测到的目标(二维空间直线,三位空间的平面,高维空间的超平面)是不是来自于同一个对象变得极具挑战性。事实上,在最初的快速霍夫变换的文献中,也提到了这一难题,并把它作为未来的科研工作重点。但这么多年以来,这一难题从未被解决。
发明内容
本发明的目的在于提供一种多维空间中的直线、平面和超平面的快速检测方法,以克服当前现有技术的不足。
本发明采取的技术方案如下:
第一方面,本发明提供了一种多维空间中的直线、平面和超平面的快速检测方法,在数据点云模式,在n维空间{F1,F2,…,Fn}中,数据点云由N个数据点组成,每个数据点表示为:F(j)=[F1(j),F2(j),…,Fn(j)],j=1…N;所述方法将数据空间中的直线、平面或超平面采用
Figure BDA0003467350530000031
来表征,其中:
Figure BDA0003467350530000032
d为用户指定的参数,{β12,…,βn+1}是参数,n对应数据的维度,m值为n-1或者n,τi为一个数据正则化因子,由用户自己选择。
进一步的,所述方法中,只检测某些特定的子集,包括:检测符合βn+1=0的目标,或者任意一个βi≥0的目标,或者βi在特定取值区间内的目标。
进一步的,所述方法通过以下步骤预先设定***参数:
第一步,如果使用m=n模型,设定直线、平面或超平面的截距的取值范围d,d小于等于输入的点云数据中各数据点离坐标原点的最大距离dmax,若使用m=n+1的模型,则可以默认设定d=1;
第二步,设定一个投票阈值T用于决定认定目标需要的最小数据点个数,设定预期的检测的精度q,q的值为整数;
第三步,创建k字节树,设定k字节树根节点中心位置参数及各维度半长;
第四步,转换各数据点到参数空间;
第五步,计算根节点到任意数据点j的距离,
Figure BDA0003467350530000041
测试公式
Figure BDA0003467350530000042
是否满足,如满足则增加根节点累计的票数;
第六步,若根节点票数小于T,则***中无满足条件的目标,***退出,如票数大于等于门限值T,则生成根节点的满足b1=1条件的2k-1子节点,为每个新生成的节点配备一个矢量b=[b1,…,bk];
第七步,利用全部N个数据点对新节点投票;
第八步,检测新节点的票数,若小于门限值T,则停止对该子节点处理;若该节点的层级已到达q层,则输出该节点的参数信息,其对应***中检测到的目标,并停止对该节点的分析;
第九步,若一个新节点的票数大于等于门限值T,则生成该节点下一层的2k个子节点,为每个新生成的节点配备一个矢量b=[b1,…,bk];对每个新生成的节点测试否满足公式
Figure BDA0003467350530000043
如果不满足,则放弃该子节点;
第十步,迭代重复第七到九步骤,直到***中不再有新节点生成,且所有的节点都被处理完毕。
更进一步的,在所述第一步中,如果检测经过坐标原点的直线、平面或者超平面目标,d设定为0。
更进一步的,在所述第三步中,如果需要检测输入数据中的所有目标,根节点中心位置在C0=(0,…,0),其在各维度半长为S0=(1,…,1);如果只检测输入数据中的某些特定区域的目标,根节点中心位置则相应调整。
更进一步的,在所述第四步中,如果需要检测输入数据中的所有目标,使用以下方程:
Figure BDA0003467350530000044
Figure BDA0003467350530000045
如果只检测输入数据中的某些特定区域的目标,则使用以下公式推导:
Figure BDA0003467350530000051
W(j)由
Figure BDA0003467350530000052
确定。
更进一步的,在所述第七步中,投票规则是对任意数据点j,计算其到该子节点到的距离:
Figure BDA0003467350530000053
并测试是否满足公式
Figure BDA0003467350530000054
如满足则增加该节点累计的票数;如此,可以统计出每一个新节点的票数。
更进一步的,在所述第十步之后,统计第八步中输出的所有节点,如果输出节点有多个,对可能重复的目标合并,若无节点被输出,则***没有检测到任何目标。
第二方面,本发明提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如上所述的快速检测方法。
第三方面,本发明提供了一个或多个存储有计算机可读指令的可读存储介质,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如上所述的快速检测方法。
本发明的有益效果是:本发明建立了新的直线、平面及超平面的数学模型,以此为基础开发了一体化快速霍夫变换。一体化快速霍夫变换使得我们可以使用一个单一k字节树负责所有搜索空间的信息,通过去冗余大大消减***中的计算量和存储需求。这一新方法还具有两个重要的优势。首先,快速霍夫变换的拟合模式对应的是最小二乘法,而一体化快速霍夫变换则对应总最小二乘拟合算法。前者是假设数据的噪声只存在一个维度上,而后者的模型则假设数据噪声是遍布所有维度的,因此对数据噪声容忍度更好,并在实际应用中很好地解决了快速霍夫变换对位于参数空间分割线上目标的检测精确度过低的问题。其次,一体化快速霍夫变换中,在数据空间中彼此距离很近的目标在参数空间中是聚集在一起的,这使我们可以采用直观的图形显示参数空间中的数据分析过程,从而快速判断目标的数量,形象化的指导我们设定***参数并区分被重复识别的目标。
附图说明
图1是霍夫变换用于直线或者平面检测的标准流程图。
图2是测试一条直线和一个正方形相交示意图,可以直接测试直线和一个正方形是否相交,也可测试直线和正方形的外接圆是否相交,后者在计算上会节省大量时间。
图3是多尺度分层细化一体化霍夫变换的参数空间示意图;计票单元在各维度上都具有同样的长度,IFHT只需要分析和n-1维度上的单位圆相交的计票单元。
图4是利用k字节树表示整个参数空间示意图;我们使用0和1构成的矢量b来代表不同的节点,除根节点外每个结点产生2k个子节点,根节点包含2k-1个子节点。
图5是IFHT参数空间的分割及分析的直观展示图;其中(a)为2D输入数据,其中有包含两条直线;(b)为IFHT在q=5层级所有计票单元的投票分布,票数超过门限值的计票单元聚集成两个独立的群,对应两条直线。
图6是一个3D数据集和对应的IFHT参数空间示意图;其中(a)为3D数据集和其中的平面,(b)为IFHT在q=5所有计票单元的分析结果,超过门限值的计票单元聚集成一个独立的群,对应数据集中的平面。
图7是FHT和IFHT直线检测时使用不同的目标函数示意图;其中(a)为FHT对应最小二乘法拟合,最小化沿y轴的偏差的总平方值,(b)为IFHT对应总最小二乘法拟合,最小化所有欧式距离平方值的总和。
图8是FHT和IFHT直线检测性能比较示意图,两个级别的噪声被分别添加到数据的第二个维度上;其中(a)为一般性直线检测,(b)为直线对应IFHT和FHT的参数平面上的计票单元的边界值时,FHT性能急剧下降,而IFHT性能基本不变。
图9是当噪声均匀分布在数据的各个维度上时,IFHT和FHT的算法性能比较示意图;模拟噪声的标准差分别为0.02和0.067。
图10是一个可以用于承载本发明的计算机***的示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
1.一体化快速霍夫变换数学模型
一体化快速霍夫变换IFHT采用了一种更直观的数学模型来表征直线及多维空间中的平面和超平面。假设输入数据是n维空间{F1,F2,…,Fn}中的数据点F(j)=[F1(j),F2(j),…,Fn(j)],一体化快速霍夫变换利用以下数学模型来表征超平面:
Figure BDA0003467350530000061
其中
Figure BDA0003467350530000062
上述公式中τi是一个数据正则化因子,具体选择我们后述讨论。简单起见,我们对上述公式可以简化一下暂不考虑β1≥0的条件。假设我们知道了{β12,…,βn+1}的取值范围,并假设它们取值范围半长为{L1,L2,…,Ln+1},上述公式可以转化为:
Figure BDA0003467350530000063
定义
Figure BDA0003467350530000064
则上述公式转化为
Figure BDA0003467350530000065
其中,W(j)是一个权值变量以确保
Figure BDA0003467350530000071
总结一下上述推导,数据空间{F1,F2,…,Fn}中检测目标
Figure BDA0003467350530000072
Figure BDA0003467350530000073
转换到参数空间{X1,X2,…,Xk}中为
Figure BDA0003467350530000074
其中:F(j)=[F1(j),F2(j),…,Fn(j)]到参数空间{X1,X2,…,Xk}的映射函数为
Figure BDA0003467350530000075
Figure BDA0003467350530000076
W(j)的值由
Figure BDA0003467350530000077
确定。在参数空间{X1,X2,…,Xk}中,各个维度Xi范围是[-1,1],整个参数空间因此可以细分成多个小超立方体(计票单元)用于投票。条件β1≥0也可以简单的通过忽略不满足要求的计票单元来实现。
以二维空间为例,任何穿过点(x,y)的直线可以被表示为β′1x+β′2y+β′3=0,β′1 2+β′2 2=1,β′1≥0,|β′3|≤d,其中d是一个指定参数,其小于等于所有数据点离原点的最大距离dmax。假设β′3=d·β3,β′1=β1,β′2=β2并暂不考虑β′1≥0的限制,我们可以把以上公式转换成β1x+β2y+d·β3=0,β1 22 2=1,|βi|≤1,i=1,2,3。(β123)构成我们的参数空间,把数据点(x,y)转换到参数空间a1β1+a2β2+a3β3=0,β1 22 2=1,|β3|≤1的映射函数是
Figure BDA0003467350530000078
Figure BDA0003467350530000079
因为|βi|≤1for i=1,2,3,所以参数空间(β123)在各个维度的长度都是2,可以细分成等长的立方体作为计票单元。
2.多尺度分层细化的计算模式
数据空间中的每个数据点对应IFHT参数空间的一条直线或平面。在现实中,数据中的测量误差及噪声对应会造成参数空间内相应对象的偏移。在IFHT参数空间中,通过对一个微小区间的检测而不是单单检测某个特定的值,可以实现对噪声容忍并提高检测精度。而所检测的小区间的长度则对应了我们最后的检测目标的精度。对一个数据空间中的数据点云,检测具有T个以上数据点支持的直线、平面和超平面等目标时,IFHT会首先把参数空间分割成众多小计票单元,让每个数据点对计票单元进行投票。由于IFHT在参数空间各维度的长度都相等,分割成的小计票单元在各维度都相等,在参数空间中计票单元由正方形、立方体及超立方体(取决于数据维度)构成。
IFHT参数空间是线性的,如果一个大立方体获得了T个数据点支持,如果对这个立方体再次细分获得的多个小立方体,并对它们投票,任何小立方体的票数都不可能超过原立方体的票数,而且支持任一小立方体的数据点一定是支持大立方体的数据点的子集。因此对IFHT参数空间的分割可以实行多尺度分层细化的方式。IFHT参数空间先量化成比较大的数个计票单元,获得足够票数的计票单元然后再次细化,直至达到要求的精度为止。这一方式使得IFHT相对于利用极坐标来实现霍夫变换的其他方法具有计算上的巨大优势。
由于IFHT参数空间内的计票单元在各维度是等长的,我们可以利用如图2所示的近似算法来加速。判断一个数据点是否对一个计票单元投票的公式可写成
Figure BDA0003467350530000081
[C1,C2…,Ck]是计票单元的中心位置,r是计票单元外接圆的半径。
3.利用k字节树实现存储及计算
IFHT参数空间可以看作一个中空的超圆柱面(如图3所示)。我们使用多尺度的互相嵌套的超立方体来遍历整个参数空间,对应一个k字节树数据结构来存储信息并计算。k字节树的根节点是向量C0其边的半长为S0,树中每个节点可产生2k个子节点。我们可以使用矢量b=[b1,…,bk],其中bi是值为-1或1的二值变量,来索引任何一个子节点。一个l层,中心为Cl的节点,它的个索引值为[b1,…,bk]的子节点的中心值可以由下面公式来计算:
Figure BDA0003467350530000082
其中Sl+1是所有l+1层节点的半长,且Sl+1=Sl/2。
IFHT借鉴了FHT算法中的多尺度分层细化并迭代计算的方法。一个l层中心位置在[Cl1,Cl2…,Clk]的计票单元,其到参数空间中任意公式3定义的超平面的距离Dl等于
Figure BDA0003467350530000083
对这一距离作半边长正则化则下述公式成立:
Figure BDA0003467350530000084
我们可以利用迭代方法计算任意计票单元的正则化距离。假设参数空间{X1,X2,…,Xk}的初使值的中心点在C0=[C01,C02,…,C0k],我们有:
Figure BDA0003467350530000085
公式4中的任意数据点是否对一个计票单元投票的公式则可以简化成:
Figure BDA0003467350530000086
在公式2中,我们利用
Figure BDA0003467350530000087
的限制条件来保证直线或平面的唯一性。如果我们对需要检测的目标没有额外附加信息,{β1,…,βn)的初始范围是|βi|≤1,上述限制条件
Figure BDA0003467350530000088
可简化为:
Figure BDA0003467350530000089
在参数空间,这等同于测试一个超立方体是否与(n-1)维度的单位圆/球是否相交。利用公式4相同的简化办法,对一个在l层,中心位置于[C1,C2,…,Ck]的计票单元,如果立方体的外接圆半径为r,测试公式可以简化为
Figure BDA0003467350530000091
4.一体化快速霍夫变换算法流程
n维空间{F1,F2,…,Fn}中,给定系列数据点云F(j)=[F1(j),F2(j),…,Fn(j)]。IFHT将数据空间中的直线、平面或超平面用
Figure BDA0003467350530000092
来表征,其中
Figure BDA0003467350530000093
β1≥0,d是用户指定的参数,其小于等于所有数据点离原点的最大距离dmax。如果无对目标参数的额外要求,参数空间的初始范围可设定为|βi|≤1,i=1,…,n。一体化快速霍夫变换IFHT需要预先设定一下***参数:
设定一个k维的参数空间{X1,X2,…,Xk},找到对应的映射函数将数据点F(j)映射成参数空间的直线或超平面。参数空间的直线或超平面数学表达式为
Figure BDA0003467350530000094
其中ai(j)是F(j)的函数,
Figure BDA0003467350530000095
当j=1,…,n,
Figure BDA0003467350530000096
其中W(j)是一个正则化标量用于满足
Figure BDA0003467350530000097
设定一个投票阈值T用于决定认定目标需要的最小数据支持,以及预期的检测的精度q。
IFHT计算过程如下:
设定k字节树根节点。根节点位置在(0,…,0),其在各维度半长为(1,…,1),计算根节点到所有数据点的距离并计算票数,如票数大于门限值T,则生成根节点的满足b1=1条件的2k-1子节点。
判断各子节点是否满足公式9,如果不满足,则放弃该子节点。对满足的子节点利用公式6计算各数据点正则化距离,并通过测试公式7是否满足完成对子节点的投票,如票数小于门限值T,则放弃该子节点,相反则对该子节点再次细化生成2k个子节点。
对上述步骤中生成的子节点迭代处理。最后记录下所有达到指定的精度q且获得票数大于门限值T的节点,如果没有节点能达到指定的精度q且获得票数大于门限值T,可以汇报精度最高的节点(如有多个则记录票数最高的)。
5.一体化快速霍夫变换其他可能的变种
上述一体化霍夫变换,直线、平面及超平面使用以下数学模型来表征
Figure BDA0003467350530000098
其中
Figure BDA0003467350530000099
在某些情况下,我们可以对上述公式作一些修改。其中一个可能的改变是将βn+1也放入正则化等式中,这样就可以免去在一开始计算所有数据点距离原点最大距离的步骤。对应的方程将会转化成
Figure BDA0003467350530000101
其中
Figure BDA0003467350530000102
另外,IFHT的具体实现作一定调整。在IFHT数学模型中,共有n+1个变量(β1,…,βn+1)。但是当{β2,…,βn+1}被确定时,β1就能够被唯一的确定出来,所以它本质上是一个虚拟变量。因此,在具体实现上,我们也可以直接计算β1,而不需要将它引入到参数空间中去。
6.一体化快速霍夫变换结果
在几乎所有的霍夫变换的变种中,参数空间的量化精度q是一个重要参数。如果值取得过低,检测到的目标数量会过多且精度不够;当q值选择的过高,算法会对噪声过于敏感,造成个别目标的漏检。在FHT实际应用中,我们经常能看同一个目标在精度q时,有多个计票单元同时报告发现检测目标且它们对应的是同一个目标,但是在精度q+1级别时,没有任何目标能被检测到。因此自动的识别同一个目标在霍夫或者快速霍夫变换中,依赖大量的后处理。
在IFHT中,参数空间的一体化使得直观地展示参数空间内的分割及计算进展变得可能,从而使我们可以非常直观地确定***参数,并对结果出现中的可能的重复目标作出直观判断。图5和图6中,我们分别展示了一个2D数据集和一个3D数据集在IFHT运行中的参数空间的数据分析结果。我们可以看到,当量化精度q的值取得比较低时,有多个计票单元会发现同一个目标。但是,检测到相同目标的计票单元在参数空间总是聚集在一起的,因此用户可以非常直观地确定自己的数据中到底包含多少待检测目标,同时针对性的确定***参数及合并重复检测到的目标。
IFHT算法具有一些非常有趣的特性。在快速霍夫变换FHT的模型中,噪声并不是被假设均匀地分布在所有维度上。以2D数据为例,y=mx+c,|m|≤1和x=m′y+c′,|m′|<1一起被用于描述所有的直线。当我们利用第一个公式来拟合输入的数据点云时,最小二乘法将最小化沿y轴的偏差的总平方值,如图7a所示。但是IFHT对个维度同时拟合,本质上将最小二乘拟合转换成总最小二乘法拟合。在2D空间中,我们寻找满足β1x+β2y+β3=0和β1 22 2=1的(β12)值是通过最小化所有欧式距离平方值的总和,拟合过程如图7b所示。
我们利用模特卡洛的办法在合成数据上比较了IFHT和FHT的性能。在第一个实验中,我们产生二维空间直线y=0.8x+0.24+g上的N个数据点,其中x满足(-2,2)的均匀分布,g是高斯白噪声,其标准差为0.02和0.067,分别对应信噪比0.03%和0.1%。x,y~N(0,1)的N个数据点被添加到数据集中作为背景噪声。同样的参数我们产生100次,用IFHT和FHT以(T=N/2 and q=5)分别检测。图7a显示了在两种设置中,IFHT都比FHT具有更高的检测率。
当参数初始值设定后,计票单元的尺寸和边界将会确定下来。算法分析表明,当一条直线对应于计票单元的边界值时,FHT检测的精度会大幅度降低(Illingworth andKittler,1987)。由于模型不同,很少有直线在会在FHT和IFHT中同时遇到同样的问题。直线y=0.5在参数(q=5 and d=2)是少数满足这一条件的,图7b展示了当噪声标准差为0.02和0.067时,FHT和IFHT的性能。可以看到,在这种情形下,FHT的性能急剧下降,但IFHT的性能几乎不受影响。
在上述模拟实验中,噪声只添加到数据的第二维度,在实际数据中,这种情形很少会发生。我们重复了第一个实验,但是在两个维度都添加了噪声。我们使用的模型是y=0.8t+0.24+g2,x=t+g1,t~U(-2,2)。这里g1和g2都是相同标准差的高斯噪声,IFHT和FHT参数(q=5 and d=2)用于目标检测,结果如图8所示。显然,在不同的噪声水平,IFHT都比FHT有更好的性能。
上述发明可以使用软件实现,或者通过专用硬件来实现,也可以通过软件和硬件结合的方式来实现,硬件甚至可以是通用的计算机***。本发明可以集成为一个模块,模块及其功能可以通过软件或硬件来实现。在软件实现中,这个模块可以是一个进程,一个计算机程序,或者它们的一部分用于实现一个特定的功能或相关功能。在硬件实现中,这个模块可以是一个功能性硬件单元,用于和其他元件协同工作。比如模块可以是一个数字电子元件,或者是数字电路如特殊应用数字集成电路(ASIC)的一部分。
图10展示了可用于实现上述发明的计算机***400的示意图。其中计算机402装配有实现上述发明软件及软件执行时需要的内存。软件在计算机***的操作***上执行,负责实现并执行本发明描述的技术,并由计算机***400获取程序结果。
计算机软件是一系列处理器(如计算机CPU)能翻译的逻辑指令。计算机软件可以由任何语言或者表达式构成,包含一系列指令让处理器完成特定的功能,这一过程中也可能需要翻译成其他语言、代码或标示。
计算机软件通常利用特定计算机语言编写源程序,经过语言编译程序将源程序转换成操作***或者机器可以执行的机器语言代码。计算机软件的编写可能涉及到别的程序组件、类库等,用于为本发明完成指定的功能提供支持。
计算机***400包括:计算机402,输入设备如键盘404,鼠标406或者外置内存408(如CD、DVD、USB闪存盘等),输出设备410,网络连接设备(广域网连接设备412,局域网连接设备),或者其他数据设备(如视频设备、图像采集设备、激光雷达、数据采集设备、数据预处理设备等)。计算机402包括:处理器422,ROM 424,RAM 426,网络接口428用于和外部网络连接设备相连,输入输出接口430用于和输入设备、输出设备及其他数据设备、数据存储设备相连。计算机402的各部分都通过***总线436相连,使各部分的信息和数据交换维持畅通。这里我们描述的计算机***400是示意性的,别的配置也同样可以完成的本专利的功能。
以上显示和描述了本发明的基本原理、主要特征和优点。本领域的普通技术人员应该了解,上述实施例不以任何形式限制本发明的保护范围,凡采用等同替换等方式所获得的技术方案,均落于本发明的保护范围内。本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。

Claims (10)

1.一种多维空间中的直线、平面和超平面的快速检测方法,其特征在于,在数据点云模式,在n维空间{F1,F2,…,Fn}中,数据点云由N个数据点组成,每个数据点表示为:F(j)=[F1(j),F2(j),…,Fn(j)],j=1…N;所述方法将数据空间中的直线、平面或超平面采用
Figure FDA0003467350520000011
来表征,其中:
Figure FDA0003467350520000012
d为用户指定的参数,{β12,…,βn+1}是参数,n对应数据的维度,m值为n-1或者n,τi为一个数据正则化因子,由用户自己选择。
2.根据权利要求1所述的一种多维空间中的直线、平面和超平面的快速检测方法,其特征在于,所述方法中,只检测某些特定的子集,包括:检测符合βn+1=0的目标,或者任意一个βi≥0的目标,或者βi在特定取值区间内的目标。
3.根据权利要求1或2所述的一种多维空间中的直线、平面和超平面的快速检测方法,其特征在于,所述方法通过以下步骤预先设定***参数:
第一步,如果使用m=n模型,设定直线、平面或超平面的截距的取值范围d,d小于等于输入的点云数据中各数据点离坐标原点的最大距离dmax,若使用m=n+1的模型,则可以默认设定d=1;
第二步,设定一个投票阈值T用于决定认定目标需要的最小数据点个数,设定预期的检测的精度q,q的值为整数;
第三步,创建k字节树,设定k字节树根节点中心位置参数及各维度半长;
第四步,转换各数据点到参数空间;
第五步,计算根节点到任意数据点j的距离,
Figure FDA0003467350520000013
测试公式
Figure FDA0003467350520000014
是否满足,如满足则增加根节点累计的票数;
第六步,若根节点票数小于T,则***中无满足条件的目标,***退出,如票数大于等于门限值T,则生成根节点的满足b1=1条件的2k-1子节点,为每个新生成的节点配备一个矢量b=[b1,…,bk];
第七步,利用全部N个数据点对新节点投票;
第八步,检测新节点的票数,若小于门限值T,则停止对该子节点处理;若该节点的层级已到达q层,则输出该节点的参数信息,其对应***中检测到的目标,并停止对该节点的分析;
第九步,若一个新节点的票数大于等于门限值T,则生成该节点下一层的2k个子节点,为每个新生成的节点配备一个矢量b=[b1,…,bk];对每个新生成的节点测试否满足公式
Figure FDA0003467350520000021
如果不满足,则放弃该子节点;
第十步,迭代重复第七到九步骤,直到***中不再有新节点生成,且所有的节点都被处理完毕。
4.根据权利要求3所述的一种多维空间中的直线、平面和超平面的快速检测方法,其特征在于,在所述第一步中,如果检测经过坐标原点的直线、平面或者超平面目标,d设定为0。
5.根据权利要求3所述的一种多维空间中的直线、平面和超平面的快速检测方法,其特征在于,在所述第三步中,如果需要检测输入数据中的所有目标,根节点中心位置在C0=(0,…,0),其在各维度半长为S0=(1,…,1);如果只检测输入数据中的某些特定区域的目标,根节点中心位置则相应调整。
6.根据权利要求3所述的一种多维空间中的直线、平面和超平面的快速检测方法,其特征在于,在所述第四步中,如果需要检测输入数据中的所有目标,使用以下方程:
Figure FDA0003467350520000022
Figure FDA0003467350520000023
如果只检测输入数据中的某些特定区域的目标,则使用以下公式推导:
Figure FDA0003467350520000024
W(j)由
Figure FDA0003467350520000025
确定。
7.根据权利要求3所述的一种多维空间中的直线、平面和超平面的快速检测方法,其特征在于,在所述第七步中,投票规则是对任意数据点j,计算其到该子节点到的距离:
Figure FDA0003467350520000026
并测试是否满足公式
Figure FDA0003467350520000027
如满足则增加该节点累计的票数;如此,可以统计出每一个新节点的票数。
8.根据权利要求3所述的一种多维空间中的直线、平面和超平面的快速检测方法,其特征在于,在所述第十步之后,统计第八步中输出的所有节点,如果输出节点有多个,对可能重复的目标合并,若无节点被输出,则***没有检测到任何目标。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如权利要求1至8中任一项所述的快速检测方法。
10.一个或多个存储有计算机可读指令的可读存储介质,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1至8中任一项所述的快速检测方法。
CN202210033412.XA 2022-01-12 2022-01-12 一种多维空间中的直线、平面和超平面的快速检测方法 Pending CN114387442A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210033412.XA CN114387442A (zh) 2022-01-12 2022-01-12 一种多维空间中的直线、平面和超平面的快速检测方法
PCT/CN2022/080650 WO2023134000A1 (zh) 2022-01-12 2022-03-14 一种多维空间中的直线、平面和超平面的快速检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210033412.XA CN114387442A (zh) 2022-01-12 2022-01-12 一种多维空间中的直线、平面和超平面的快速检测方法

Publications (1)

Publication Number Publication Date
CN114387442A true CN114387442A (zh) 2022-04-22

Family

ID=81201144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210033412.XA Pending CN114387442A (zh) 2022-01-12 2022-01-12 一种多维空间中的直线、平面和超平面的快速检测方法

Country Status (2)

Country Link
CN (1) CN114387442A (zh)
WO (1) WO2023134000A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013179402A (ja) * 2012-02-28 2013-09-09 Sony Corp 端末装置、情報処理装置、表示方法、及び表示制御方法
EP3968288A2 (de) * 2014-02-04 2022-03-16 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. 3d-bildanalysator zur blickrichtungsbestimmung
US10990797B2 (en) * 2016-06-13 2021-04-27 Nanolive Sa Method of characterizing and imaging microscopic objects
CN109557532B (zh) * 2018-10-18 2023-05-09 西安电子科技大学 基于三维霍夫变换的检测前跟踪方法、雷达目标检测***

Also Published As

Publication number Publication date
WO2023134000A1 (zh) 2023-07-20

Similar Documents

Publication Publication Date Title
Weiler et al. 3d steerable cnns: Learning rotationally equivariant features in volumetric data
Zeng et al. 3dcontextnet: Kd tree guided hierarchical learning of point clouds using local and global contextual cues
Gao et al. Change detection from synthetic aperture radar images based on channel weighting-based deep cascade network
Gillis The why and how of nonnegative matrix factorization
Beach et al. Quantum image processing (quip)
US8675974B2 (en) Image processing apparatus and image processing method
US7903883B2 (en) Local bi-gram model for object recognition
Ali et al. A hybrid geometric spatial image representation for scene classification
CN104392253B (zh) 一种草图数据集的交互式类别标注方法
Dutta et al. Homogeneity guided probabilistic data summaries for analysis and visualization of large-scale data sets
Sun et al. An efficient and compact 3D local descriptor based on the weighted height image
CN112529068B (zh) 一种多视图图像分类方法、***、计算机设备和存储介质
Hosny et al. Classification of galaxy color images using quaternion polar complex exponential transform and binary Stochastic Fractal Search
CN114998638A (zh) 基于动静态卷积融合神经网络的多视图三维点云分类方法
Akgül et al. Density-based 3D shape descriptors
Guo et al. Multi-view feature learning for VHR remote sensing image classification
CN113516019B (zh) 高光谱图像解混方法、装置及电子设备
CN112149747A (zh) 一种基于改良Ghost3D模块和协方差池化的高光谱图像分类方法
Lim et al. A fuzzy qualitative approach for scene classification
Gong et al. An M-nary SAR image change detection based on GAN architecture search
Kharinov Image segmentation method by merging and correction of sets of pixels
Chen et al. Feature fusion based on convolutional neural network for SAR ATR
CN114387442A (zh) 一种多维空间中的直线、平面和超平面的快速检测方法
Jia et al. RETRACTED ARTICLE: Multimedia and multi-feature cluster fusion model based on saliency for mobile network applications
CN109902720A (zh) 基于子空间分解进行深度特征估计的图像分类识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination