CN104867129A - 一种光场图像分割方法 - Google Patents
一种光场图像分割方法 Download PDFInfo
- Publication number
- CN104867129A CN104867129A CN201510178753.6A CN201510178753A CN104867129A CN 104867129 A CN104867129 A CN 104867129A CN 201510178753 A CN201510178753 A CN 201510178753A CN 104867129 A CN104867129 A CN 104867129A
- Authority
- CN
- China
- Prior art keywords
- light field
- view
- light
- plane
- dividing method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种光场图像分割方法,包括以下步骤:(100)对已采集的光场信息进行参数化;(200)对光场中任意视图中的对象进行标注;(300)对选取的对象,使用机器学习方法进行训练,从而得到分类器;(400)用分类器对整个光场的视图进行分割。通过上述方式,本发明能够直接利用光场信息中自身包含的几何信息,计算量小,对各种场景,均可以达到较好的分割效果。
Description
技术领域
本发明涉及图像处理、光场、模式识别领域,特别是涉及一种光场图像分割方法。
背景技术
近年来,在光场获取***方面取得的进展,使得光场技术成为未来图形、图像技术领域的核心技术手段成为可能,光场摄像的时代即将到来。与单幅图像相比,光场捕获了更多的方向性的场景信息,这使得传统的图像处理算法,计算机视觉,以及一些新的相关科学技术等,需要与全新的光场技术想适应。随着光场技术的发展,传统的图像分割方法有了很大的改进空间。由于光场信息中包含了场景的几何信息,似的直接利用几何信息进行图像分割成为了可能,目前图像分割技术还处于基于传统图像的阶段,往往只利用了像素颜色,深度,灰度等信息,针对光场图像分割技术的研究则刚刚起步。
目前国内外关于图像分割及光场图像分割还存在着不少有待解决的问题:
1) 传统的图像分割,对于不同类型之间的差异大,同类型之间差异小的情况,不能做出很好的分析、识别、预测、分割。例如在分割树叶,植物,等图像时不能取得很好的效果。
2) 当不同的目标物具有相似的外观时,例如,木墙与木凳,由于丢失了图像的几何信息,传统的图像分割技术,很难对其进行区分,算法复杂度高,得出的效果也不尽如人意,精确度不高;此外,通过传统图像进行几何信息恢复的技术,计算时间复杂度大,结果往往不精确,无法为传统图像分割提供有效的帮助。
发明内容
本发明主要解决的技术问题是:针对现有技术的不足,提供一种光场图像分割方法,能够直接利用光场信息中自身包含的几何信息,计算量小,对各种场景,均可以达到较好的分割效果。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种光场图像分割方法,包括以下步骤:
(100)对已采集的光场信息进行参数化;
(200)对光场中任意视图中的对象进行标注;
(300)对标注的对象,使用机器学习方法进行训练,从而得到分类器;
(400)用分类器对整个光场的视图进行分割。
在本发明一个较佳实施例中,所述步骤(100)具体为:在流明的基础上,对光场信息的坐标进行简单的变化,其描述如下:
若光线L[s, t, x, y]是由(s, t)∈Π,(x, y)∈Ω定义的光线,(x, y)是物体与其在平面Π上的真空投影的连线与平面Ω的交点,则在平面Π上,x与s一致,y与t一致;从而得到光场核面Ly, t 和Lx, s,即,光场信息的水平切面和垂直切面;由于视角与核面存在线性关系,由此引入参数“不一致性”,即:场景中的点投影在平面上的深度决定了视图中图像的变化率;由此,规范化光场坐标信息,并引入了参数“不一致性”。
在本发明一个较佳实施例中,所述步骤(200)具体为:在光场中选取任意视图作为训练样本,对该视图中的不同对象用线条进行标注。
在本发明一个较佳实施例中,所述步骤(300)具体为:对于标注的对象,选用图像中的:RGB值、Hessian特征值、强度标准差和不一致性属性作为训练输入,并以此得到分类器。
在本发明一个较佳实施例中,所述步骤(400)具体为:在分类结束后,对最小分割节点进行网格搜索,将过分细化的分类重新融合成同一分类。
本发明的有益效果是:
1)本发明给出了一种针对光场的图像分割方法,使得计算机可以直接利用光场信息中包含的几何信息进行图像分割,充分利用了光场的特性,以达到质量较高的分割效果;
2)本发明针对某一场景的光场,仅需要对任意视图进行人工标注,继而进行训练,便可以对该光场的任意视图进行分割,计算量小,训练成本低,效率高;
3)本发明对于各种场景均可以达到较为理想的效果,适应性好;
4)本发明对于图形分割训练时,选取的训练属性集合元素较传统图像分割少,进一步减少了计算复杂度,适用于大规模图像分割。
附图说明
图1是本发明一种光场图像分割方法的流程图;
图2是本发明一种光场图像分割方法的视图标注图;
图3是本发明一种光场图像分割方法的光场参数化坐标图。
具体实施方式
下面结合附图对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
请参阅图1-3,本发明实施例包括:
一种光场图像分割方法,包括以下步骤:
(100)对已经采集的光场信息进行参数化:
本发明中,光场信息的参数化,是在流明(Lumigraph)的基础上进行改造的。
一个4D光场是在光线空间R中定义的,由光点P(X,Y,Z)发出的一组光线经过两个平行平面Π和Ω,在坐标系R3中,这样,每一个光线L都可以被L与平面Π和平面Ω的交点(s, t),(x, y)定义。平面Π与平面Ω之间的距离为f > 0,各自的坐标系为s, t 和 x, y;两个坐标系的单位向量平行,原点在一条垂直于两平面的直线上。
一条光线L1[s1,t,x1,y]由(s1,t)∈Π,(x1,y)∈Ω定义,L1[s1,t,0,0]是垂直于平面Π并经过光点(s1,t)的光线,同理,在平面Ω上,x1与s1相对应,y与t相对应。
另一条光线L2[s2,t,x2,y]由(s2,t)∈Π,(x2,y)∈Ω定义,L2[s2,t,0,0]是垂直于平面Π并经过光点(s2,t)的光线,同理,在平面Ω上,x2与s2相对应,y与t相对应。
而s1与s2之间的距离为△s
则x1与x2之间的距离x2- x1= △s,
现在,一个光场可以被表示为一个在光线广场中的函数:
Ly*,t*:(x,s) →L(x,y*,s,t*)
Ly*,t*和Lx*,s*既是光场核面,他们可以看做是光场的水平切面与垂直切面。
同一场景的某个视图中,图像的变化率取决于场景投射在平面图像上的深度,即不一致性(disparity)。
至此,完成光场的参数化,引入参数为:核面,不一致性。
(200)对光场信息的任意视图进行标注:
在光场中选取任意角度的视图,对该视图中的不同对象用线条进行标注。
(300)对于视图中标注的对象,采用机器学习方法(随机森林法)进行训练:
对选取的视图中标注的对象使用机器学习方法(随机森林法)进行训练,选用图像中的:RGB值,Hessian特征值,强度标准差,disparity(不一致性)属性作为训练输入,并以此得到分类器。
在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。 而 “Random Forests” 是他们的商标。 这个术语是1995年由贝尔实验室的Tin Kam Ho所提出的随机决策森林(random decision forests)而来的。这个方法则是结合 Breimans 的 “Bootstrap aggregating” 想法和 Ho 的“random subspace method” 以建造决策树的集合。
(400)对整个光场进行分类:
用分类器对整个光场的视图进行分割,在分类结束后,对最小分割节点进行网格搜索,将过分细化的分类重新融合成同一分类,以防止过度分类对结果造成负面影响。
本发明揭示了一种光场图像分割方法,计算量小,适用于数据量较大的光场,充分利用了光场信息中携带的场景的几何信息,分割效果好,改善了传统图像分割技术中的诸多问题的同时,也迎合了光场技术的发展趋势。可应用于基于光场技术的模式识别,视频监控,图像处理等。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (5)
1.一种光场图像分割方法,其特征在于,包括以下步骤:
(100)对已采集的光场信息进行参数化;
(200)对光场中任意视图中的对象进行标注;
(300)对标注的对象,使用机器学习方法进行训练,从而得到分类器;
(400)用分类器对整个光场的视图进行分割。
2.根据权利要求1所述的一种光场图像分割方法,其特征在于,所述步骤(100)具体为:在流明的基础上,对光场信息的坐标进行简单的变化,其描述如下:
若光线L[s, t, x, y]是由(s, t)∈Π,(x, y)∈Ω定义的光线,(x, y)是物体与其在平面Π上的真空投影的连线与平面Ω的交点,则在平面Π上,x与s一致,y与t一致;从而得到光场核面Ly, t 和Lx, s,即,光场信息的水平切面和垂直切面;由于视角与核面存在线性关系,由此引入参数“不一致性”,即:场景中的点投影在平面上的深度决定了视图中图像的变化率;由此,规范化光场坐标信息,并引入了参数“不一致性”。
3.根据权利要求1所述的一种光场图像分割方法,其特征在于,所述步骤(200)具体为:在光场中选取任意视图作为训练样本,对该视图中的不同对象用线条进行标注。
4.根据权利要求1所述的一种光场图像分割方法,其特征在于,所述步骤(300)具体为:对于标注的对象,选用图像中的:RGB值、Hessian特征值、强度标准差和不一致性属性作为训练输入,并以此得到分类器。
5.根据权利要求1所述的一种光场图像分割方法,其特征在于,所述步骤(400)具体为:在分类结束后,对最小分割节点进行网格搜索,将过分细化的分类重新融合成同一分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510178753.6A CN104867129A (zh) | 2015-04-16 | 2015-04-16 | 一种光场图像分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510178753.6A CN104867129A (zh) | 2015-04-16 | 2015-04-16 | 一种光场图像分割方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104867129A true CN104867129A (zh) | 2015-08-26 |
Family
ID=53912944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510178753.6A Pending CN104867129A (zh) | 2015-04-16 | 2015-04-16 | 一种光场图像分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104867129A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105184808A (zh) * | 2015-10-13 | 2015-12-23 | 中国科学院计算技术研究所 | 一种光场图像前后景自动分割方法 |
CN107424155A (zh) * | 2017-04-17 | 2017-12-01 | 河海大学 | 一种面向光场重聚焦图像的聚焦分割方法 |
US10055856B2 (en) | 2016-03-14 | 2018-08-21 | Thomson Licensing | Method and device for processing lightfield data |
CN111448586A (zh) * | 2017-12-01 | 2020-07-24 | 交互数字Ce专利控股公司 | 表面颜色分割 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101281545A (zh) * | 2008-05-30 | 2008-10-08 | 清华大学 | 一种基于多特征相关反馈的三维模型检索方法 |
CN101666631A (zh) * | 2009-09-07 | 2010-03-10 | 东南大学 | 基于正反码彩色编码条纹的三维测量方法 |
CN101883291A (zh) * | 2010-06-29 | 2010-11-10 | 上海大学 | 感兴趣区域增强的视点绘制方法 |
US20110043540A1 (en) * | 2007-03-23 | 2011-02-24 | James Arthur Fancher | System and method for region classification of 2d images for 2d-to-3d conversion |
-
2015
- 2015-04-16 CN CN201510178753.6A patent/CN104867129A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110043540A1 (en) * | 2007-03-23 | 2011-02-24 | James Arthur Fancher | System and method for region classification of 2d images for 2d-to-3d conversion |
CN101281545A (zh) * | 2008-05-30 | 2008-10-08 | 清华大学 | 一种基于多特征相关反馈的三维模型检索方法 |
CN101666631A (zh) * | 2009-09-07 | 2010-03-10 | 东南大学 | 基于正反码彩色编码条纹的三维测量方法 |
CN101883291A (zh) * | 2010-06-29 | 2010-11-10 | 上海大学 | 感兴趣区域增强的视点绘制方法 |
Non-Patent Citations (1)
Title |
---|
WANNER S ET AL: "Globally consistent multi-label assignment on the ray space of 4d light fields", 《PROCEEDINGS OF THE IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105184808A (zh) * | 2015-10-13 | 2015-12-23 | 中国科学院计算技术研究所 | 一种光场图像前后景自动分割方法 |
CN105184808B (zh) * | 2015-10-13 | 2018-09-07 | 中国科学院计算技术研究所 | 一种光场图像前后景自动分割方法 |
US10055856B2 (en) | 2016-03-14 | 2018-08-21 | Thomson Licensing | Method and device for processing lightfield data |
CN107424155A (zh) * | 2017-04-17 | 2017-12-01 | 河海大学 | 一种面向光场重聚焦图像的聚焦分割方法 |
CN107424155B (zh) * | 2017-04-17 | 2020-04-21 | 河海大学 | 一种面向光场重聚焦图像的聚焦分割方法 |
CN111448586A (zh) * | 2017-12-01 | 2020-07-24 | 交互数字Ce专利控股公司 | 表面颜色分割 |
CN111448586B (zh) * | 2017-12-01 | 2024-03-08 | 交互数字Ce专利控股公司 | 表面颜色分割 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111832655B (zh) | 一种基于特征金字塔网络的多尺度三维目标检测方法 | |
CN105608456B (zh) | 一种基于全卷积网络的多方向文本检测方法 | |
CN108230337A (zh) | 一种基于移动端的语义slam***实现的方法 | |
CN109816769A (zh) | 基于深度相机的场景地图生成方法、装置及设备 | |
CN106683091A (zh) | 一种基于深度卷积神经网络的目标分类及姿态检测方法 | |
CN110688905B (zh) | 一种基于关键帧的三维物体检测与跟踪方法 | |
EP3274964B1 (en) | Automatic connection of images using visual features | |
CN110570457B (zh) | 一种基于流数据的三维物体检测与跟踪方法 | |
CN102256065A (zh) | 基于视频监控网络的视频自动浓缩方法 | |
Chen et al. | Valid: A comprehensive virtual aerial image dataset | |
CN103035003B (zh) | 一种实现增强现实的方法及装置 | |
CN104182968B (zh) | 宽基线多阵列光学探测***模糊动目标分割方法 | |
CN106897681A (zh) | 一种遥感图像对比分析方法及*** | |
CN104867129A (zh) | 一种光场图像分割方法 | |
CN103020963B (zh) | 一种基于自适应分水岭的图割的多目立体匹配方法 | |
CN101572770B (zh) | 一种可用于实时监控的运动检测方法与装置 | |
CN107403451A (zh) | 自适应二值特征单目视觉里程计方法及计算机、机器人 | |
CN109523528A (zh) | 一种基于无人机双目视觉sgc算法的输电线路提取方法 | |
CN111339917A (zh) | 一种真实场景下玻璃检测的方法 | |
Wu et al. | A new stereo dense matching benchmark dataset for deep learning | |
CN111950345A (zh) | 摄像头的识别方法、装置、电子设备和存储介质 | |
CN106127813B (zh) | 基于视觉感知能量的监控视频运动片段分割方法 | |
CN115018999A (zh) | 一种多机器人协作的稠密点云地图构建方法及装置 | |
CN104463962A (zh) | 基于gps信息视频的三维场景重建方法 | |
CN110390724A (zh) | 一种带有实例分割的slam方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150826 |
|
RJ01 | Rejection of invention patent application after publication |