CN105844635A - 一种基于结构字典的稀疏表示深度图像重建算法 - Google Patents

一种基于结构字典的稀疏表示深度图像重建算法 Download PDF

Info

Publication number
CN105844635A
CN105844635A CN201610162303.2A CN201610162303A CN105844635A CN 105844635 A CN105844635 A CN 105844635A CN 201610162303 A CN201610162303 A CN 201610162303A CN 105844635 A CN105844635 A CN 105844635A
Authority
CN
China
Prior art keywords
depth
dictionary
image
sample
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610162303.2A
Other languages
English (en)
Other versions
CN105844635B (zh
Inventor
尹宝才
尹海真
施云惠
丁文鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201610162303.2A priority Critical patent/CN105844635B/zh
Publication of CN105844635A publication Critical patent/CN105844635A/zh
Application granted granted Critical
Publication of CN105844635B publication Critical patent/CN105844635B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于结构字典的稀疏表示深度图像重建算法,属于图像处理技术领域。首先将对应的深度图和彩色图像作为整体来考虑,在求解过程中,主要注重通过构造具有逻辑对应关系的结构字典来提高深度图像和彩色图像的重建效果。在字典构造的过程中,利用深度图像和彩色图像之间的逻辑对应关系和深度图像本身存在的相似关系,提升字典训练的效率和质量。本发明在收集和整理大量国内外相关资料的基础上,结合稀疏编码等相关理论,针对对应的深度图像与彩色图像之间存在的密切关联,分析数据之间的相关性,主要解决了基于结构字典的稀疏表示深度图的重建问题,减小了运算复杂度,提高了深度图和对应彩色图的重建质量。

Description

一种基于结构字典的稀疏表示深度图像重建算法
技术领域
本发明属于图像处理技术领域,具体涉及一种基于结构字典的稀疏表示深度图像重建算法。
背景技术
稀疏表示(sparse representation)是一种信号表示方法,即给定的信号可以被某个变换域内的基线性稀疏重构。变换域内的基的集合称之为字典。为了使得信号的表示具有平移不变性,研究者又引入了冗余表示的概念,即要求信号在变换域内表示系数的维度大于信号本身的维度,即“超完备”。通过寻找一组“超完备”基向量来更高效的表示样本数据,将一个信号表示为一组基的线性组合。在超完备字典下,信号可以用几个基元的线性组合来表示信号本身,由于这种字典基元不在限定为正交完备的字典,因此对信号的表达能力变得更强,而且通过训练得到的超完备字典能够更加自适应的表达信号特性。具有存储能力大、具有联想记忆能力、使信号结构更加清晰等优点。在图像去噪、图像超分辨率、图像分割,图像分类和人脸识别等领域都有着广泛的应用。
假设D=[d1,d2,...,dn]表示一个包含n个基元的超完备字典,一个信号y=[y1 y2... yn]T表示成这些基元的线性组合,即
y ≈ D α = Σ i = 1 K α i d i - - - ( 1 )
α=[α1 α2 ... αn]T是稀疏系数,该向量只包含很少的非零元素或者只有很少的几个远大于零的元素。稀疏编码算法就是通过求解优化问题
min α , D | | y - D α | | 2 2 + λ | | α | | 1 - - - ( 2 )
找到系数α和字典D来重建目标信号。
稀疏表示的求解过程包括两个部分,分别是字典训练(Training)和编码(Coding)。字典训练部分是在给定一系列图像样本X=[x1,x2,...,xn]的情况下,从样本中学习得到一组基D=[d1,d2,...,dn]即字典。训练的过程是一个重复迭代的过程,目标函数为
min α , D | | x i - Σ i = 1 n α i d i | | 2 2 + λ | | α | | 1 - - - ( 3 )
通过交替更改α和D使得目标函数最小。每次迭代分为两个步骤:1)固定字典di,i=1,2,..,n调整系数α.使目标函数最小,即求解Lasso问题;2)固定系数αi,i=1,2,...,n,调整D,使目标函数最小,即求解凸QP问题。两个步骤交替执行直至收敛,此时得到的字典D即可以良好表达样本信号的一组基。编码部分就是给定新的图像Y,由上部分训练得到的字典D,通过求解Lasso问题获得稀疏向量α,该向量即输入图像Y的稀疏表达。通过y≈Dα重建目标图像。目前常用的字典训练算法有MOD算法和KSVD算法。
学习字典的结构的不同,在应用和计算方面也有很大差异。2014年,Tiezheng Ge[3]等人提出在稀疏求解的过程中,可将其分解为两个子问题进行求解,通过将原优化问题的超完备字典表示为两个规模较小的字典的笛卡尔积,并对其分别求解,将一个规模较大的问题分解成了两个较小的子问题,大大降低了运算量,提升了运算速度。因此找到结构更加合理的学习字典,是提升算法性能的一个重要突破口。
深度图是表示场景中各个点相对于摄像机的距离的图像,即每个像素值表示场景中某一点与摄像机之间的距离。在3D电视、增强实现和3D重建中,深度图像都有非常重要的作用。目前随着RGB-D相机的发展,例如ToF相机和微软公司研发的Kinect,使得普通用户也能同时获得彩色图像获得深度图像。但是由于用户经验不足或者设备本身的限制,获得的深度图像往往存在噪声和深度值缺失等问题。因此获得高质量深度图是计算机视觉***的重要任务之一。由于深度图中的像素点记录的是场景中点与摄像机的距离,即场景中处于同一平面上的点拥有相同的深度信息。彩色图是记录场景中各个点颜色信息的图像,根据其性质可知同一平面可以存在很多不同的颜色。由于对应的深度和彩色图像之间的关联密切,可以考虑在提升图像质量的方法中利用其相互关系来进一步提升效果。而通过增加彩色图像的细节信息,利用低秩和回归模型来增强深度图像,取得了较好的实验结果。
在本发明中,首先将对应的深度图和彩色图像作为整体来考虑,在求解过程中,主要注重通过构造结构字典来提高深度图像和彩色图像的重建效果。在字典训练的过程中,利用深度图像和彩色图像之间的逻辑对应关系和深度图像本身存在的相似关系,提升字典训练的效率和质量。
发明内容
本发明在收集和整理大量国内外相关资料的基础上,结合稀疏表示等相关理论,针对深度图像与彩色图像之间存在的密切关联,分析数据之间的相关性,提出了一种基于结构字典的稀疏表示深度图像重建算法,主要解决的技术问题包括结构字典的的设计与更新,以及深度彩色图像联合重建。与普遍运用的无结构随机字典相比较,结构字典通过其深度部分和彩色部分之间的逻辑关系对应,提取了深度彩色图像中的关键信息,压缩了字典的维度,减小了运算复杂度,提高了深度图像的重建质量。
为了实现上述目的,本发明采用的技术方案为一种基于结构字典的稀疏表示深度图像重建算法,一个普通的稀疏表示优化求解问题可由如下公式表示:
min x | | Y - D x | | 2 2 + λ | | x | | 1 - - - ( 4 )
Y代表输入图像,D为字典,x是待求解的稀疏系数,λ为平衡求解精度与稀疏度之间关系的参数。考虑图像Y由深度和彩色两部分组成,即其中Y1表示深度部分,Y2表示彩色部分,优化表达式可写成如下形式:
min x | | Y 1 Y 2 - D 1 D 2 x | | 2 + λ | | x | | 1 - - - ( 5 )
上述表达式可转化成如下形式来表示:
min x | | Y 1 - D 1 x | | 2 2 + | | Y 2 - D 2 x | | 2 2 + λ | | x | | 1 - - - ( 6 )
该问题可分解成两个子问题进行求解:
min x | | Y 1 - D 1 x | | 2 2 + λ 1 | | x | | 2 2 - - - ( 7 )
min x | | Y 2 - D 2 x | | 2 2 + λ 2 | | x | | 2 2 - - - ( 8 )
由背景技术可知,同一场景所拍摄的深度图像中。同一平面的点具有相同的深度信息,在对应的彩色图像中,同一平面的点则可以包含不同的彩色信息。根据深度图像的特点,场景中同一平面上的点具有相同的深度信息,则可知该深度图像中只需要少量的深度信息即可表示该图像所包含的的信息。基于这样的经验观测,假设在同一场景拍摄的深度图像和彩色图像中,同一个深度信息可对应多个不同的彩色信息,即深度信息和彩色信息之间存在一对多的关系。
需要说明的是,此对应关系并不是线性关系而是逻辑对应关系,旨在利用深度图像本身存在的具有大片深度值相同的区域的特点,找到对应彩色图中该区域所存在色彩值的差异。利用彩色图像中更加丰富的信息,在训练过程中增加深度字典更新的准确程度。
基于上述假设,分别代表对应的深度和彩色图像样本,a和b分别代表Y1和Y2的样本列,则a和b两者之间对的逻辑对应关系可以由如下矩阵来表示:
Y i = Y 1 i Y 2 i = ω j a i ω j + 1 a i ... ω m i a i b j b j + 1 ... b m i , i , j = 1 , ... , n
其中a为深度信息,b为彩色图像中对应位置的彩色信息,ω为平衡参数,mi是整体样本中的一组样本,1≤mi≤n。令引入参数ui,令u=[u1 u2 ... un]T则(7)(8)可表示成如下形式:
min u | | Y 1 - D 1 u | | 2 2 + λ 1 | | u | | 2 2 - - - ( 9 )
min x | | X 2 - D 2 x | | 2 2 + λ 2 | | x | | 2 2 - - - ( 10 )
u和x之间的对应关系可用矩阵Ω来表达,即u=Ωx。通过探究得到关系矩阵Ω之后,系数u便可根据公式(10)的稀疏解得到。通过交替求解(9)(10),并更新字典D1和D2,将最终训练完成的字典D1和D2进行组合,得到结构字典D。
附图说明
图1为深度平均PSNR曲线图
图2为彩色平均PSNR曲线图
图3为本发明探究对应深度图像和彩色图像逻辑对应关系矩阵实施例流程图
图4为本发明基于结构字典的稀疏表示深度图像重建实施例流程图
具体实施方式
如图1-4所示,为了验证所提方法的有效性,在matlab R2012a下进行了基于稀疏编码的“深度-彩色”结构字典构造和训练并对目标图像进行重建的模拟实验。在普通的重建方法下,对使用无结构的随机字典(USRD)和结构字典(SD)两种方案进行了比较。实验结果的客观评价采用峰值信噪比(Peak Signal to Noise Ratio,PSNR)度量,单位为分贝(dB)。
采用图像集Middlebury_Dataset进行实验,对图像集中的30组对应的深度和彩色图像进行了重建。结果如表1所示。
表1通过不同的迭代次数训练字典重建的平均PSNR(dB),采样块8×8
实验结果表明,当迭代次数相同,使用普通的稀疏求解算法时,无结构的随机字典则需要在较多的迭代次数下才会达到最优效果,“深度-彩色”字典在较小的迭代次数即可取得较稳定的实验结果,且与无结构随机字典相比显著提升了深度图像和彩色图像的重建效果,获得了非常明显的PSNR增益,证明了“深度-彩色”结构字典方法的有效性。
实施例
探究对应深度和彩色图像逻辑对应关系矩阵Ω,具体包括:
1)对对应深度和彩色图像进行采样
利用普通采样算法对对应深度图像Y1和彩色图像Y2分别进行采样,得到深度样本X1,彩色样本X2
2)对深度样本进行聚类
由于本发明将深度和彩色图像作为整体进行考虑,在采样完成后将深度和彩色样本进行组合得到整体样本X,即根据深度图像的特点,场景中同一平面上的点具有相同的深度信息,则可知该在样本中只需要少量的深度信息即可抽取该图像的特征。因此根据整体样本中的深度信息,利用普通聚类算法(如K-Means算法)对整体样本X进行聚类操作,即聚类过程中计算每个样本列到聚类中心的距离是只考虑深度样本部分,彩色样本部分只做对应的调整,保持与原始深度样本的位置一致而不参与任何有关聚类的计算。聚类完成后得到深度样本和彩色样本以及每类样本的数目ni,i=1,2,...,m,m为类的数目。
3)对每类彩色样本进行第二次聚类
利用普通聚类算法对上一步骤操作完成的彩色样本每类彩色样本 进行聚类。得到第i类的聚类中心pi为第i类聚类所得到类的数目,其中每类的样本列的数目为qj,j=1,2,...,pi
4)根据彩色样本每类内部的分类数目计算对应关系矩阵Ω
聚类完成之后的每类彩色样本的聚类中心,即彩色图对应的深度图提取的深度信息所对应的彩色信息。由于同一深度信息对应多种彩色信息,并且每类彩色信息与深度信息的逻辑对应关系有强弱之分,因此采用系数β来描述不同彩色信息之间的比重。本发明中采用加权值的方法来构造关系矩阵Ω。根据彩色样本每一类中的样本列的数目计算其加权值,确定其与深度信息之间逻辑关系的比重。其中第类彩色样本中第k子类的加权值为:是参数,根据经验值设定。根据加权值,则可得到第i类的参数 总体的关系矩阵为
本发明结构字典训练和重建实施具体包括:
1)利用普通稀疏求解算法(如OMP)求得彩色样本的稀疏系数y
利用OMP算法进行系数求解,得到稀疏系数y:y=argminy||y||1,s.t.D2y=X2
2)根据对应关系矩阵Ω求出对应深度样本的稀疏系数u
由假设可知u=Ωx,根据该公式求得深度样本的系数系数u。
3)利用普通字典更新算法根据系数y和u分别更新彩色字典D2和深度字典D1
4)对步骤1)-3)重复迭代直至收敛,得到训练完成的D1,D2,将其组合得到结构字典D即先求得彩色稀疏系数y,根据y与u的关系矩阵Ω求得深度系数u,根据y和u分别更新彩色和深度字典D2,D1,利用更新完成后的字典再进行下一次迭代的稀疏求解。直至优化问题收敛。“深度-彩色”结构字典D即将深度字典D1和彩色字典D2进行逻辑对应,
5)通过训练得到的字典D重建目标深度图像Y1和彩色图像Y2,包括稀疏求解和重建两部分。利用OMP算法进行系数求解,得到稀疏系数在结合信号的稀疏表达,重建出原始深度图像和彩色图像。也可利用OMP算法分别求解深度和彩色的稀疏系数y和u:, 结合稀疏表达重建出原始深度图像和彩色图像。
需要说明的是:以上实施例仅用以说明本发明的技术方案而非对其进行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明的技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。

Claims (3)

1.一种基于结构字典的稀疏表示深度图像重建算法,稀疏表示是一种信号表示方法,即给定的信号可以被某个变换域内的基线性稀疏重构;变换域内的基的集合称之为字典;为了使得信号的表示具有平移不变性,研究者又引入了冗余表示的概念,即要求信号在变换域内表示系数的维度大于信号本身的维度,即“超完备”;通过寻找一组超完备基向量来更高效的表示样本数据,将一个信号表示为一组冗余基的线性组合;在超完备字典下,信号可以用几个基元的线性组合来表示信号本身,由于这种字典基元不在限定为正交完备的字典,因此对信号的表达能力变得更强,而且通过训练得到的超完备字典能够更加自适应的表达信号特性;具有存储能力大、具有联想记忆能力、使信号结构更加清晰等优点;在图像去噪、图像超分辨率、图像分割,图像分类和人脸识别等领域都有着广泛的应用;
假设D=[d1,d2,…,dn]表示一个包含n个基元的超完备字典,一个信号y=[y1 y2 …yn]T表示成这些基元的线性组合,即
y ≈ D α = Σ i = 1 K α i d i - - - ( 1 )
α=[α1 α2 … αn]T是稀疏系数,该向量只包含很少的非零元素或者只有很少的几个远大于零的元素;稀疏表示的优化问题如下:
min α , D | | y - D α | | 2 2 + λ | | α | | 1 - - - ( 2 )
通过求解(2)找到系数α和字典D来重建目标信号;
稀疏表示模型的求解包括两个部分,分别是字典训练(Training)和编码(Coding);字典训练部分是在给定一系列图像样本X=[x1,x2,…,xn]的情况下,从样本中学习得到一组基D=[d1,d2,…,dn],即字典;训练的过程是一个重复迭代的过程,目标函数为
min α , D | | x i - Σ i = 1 n α i d i | | 2 2 + λ | | α | | 1 - - - ( 3 )
通过交替更改α和D使得目标函数最小;每次迭代分为两个步骤:1)固定字典di,i=1,2,..,n,调整系数α.使目标函数最小,即求解Lasso问题;2)固定系数αi,i=1,2,…,n,调整D,使目标函数最小,即求解凸QP问题;两个步骤交替执行直至收敛,此时得到的字典D即可以良好表达样本信号的一组基;编码部分就是给定新的图像Y,由上部分训练得到的字典D,通过求解Lasso问题获得稀疏向量α,该向量即输入图像Y的稀疏表达;通过y≈Dα重建目标图像;目前常用的字典训练算法有MOD算法和KSVD算法;
其特征在于:
一个普通的稀疏表示优化求解问题可由如下公式表示:
min x | | Y - D x | | 2 2 + λ | | x | | 1 - - - ( 4 )
Y代表输入图像,D为字典,x是待求解的稀疏系数,λ为平衡求解精度与稀疏度之间关系的参数;考虑图像Y由深度和彩色两部分组成,即其中Y1表示深度部分,Y2表示彩色部分,优化表达式可写成如下形式:
min x | | Y 1 Y 2 - D 1 D 2 x | | 2 + λ | | x | | 1 - - - ( 5 )
上述表达式可转化成如下形式来表示:
min x | | Y 1 - D 1 x | | 2 2 + | | Y 2 - D 2 x | | 2 2 + λ | | x | | 1 - - - ( 6 )
该问题可分解成两个子问题进行求解:
min x | | Y 1 - D 1 x | | 2 2 + λ 1 | | x | | 2 2 - - - ( 7 )
min x | | Y 2 - D 2 x | | 2 2 + λ 2 | | x | | 2 2 - - - ( 8 )
同一场景所拍摄的深度图像中,同一平面的点具有相同的深度信息,在对应的彩色图像中,同一平面的点则可以包含不同的彩色信息;根据深度图像的特点,场景中同一平面上的点具有相同的深度信息,则可知该深度图像中只需要少量的深度信息即可表示该图像所包含的的信息;基于这样的经验观测,假设在同一场景拍摄的深度图像和彩色图像中,同一个深度信息可对应多个不同的彩色信息,即深度信息和彩色信息之间存在一对多的关系;
需要说明的是,此对应关系并不是线性关系而是逻辑对应关系,旨在利用深度图像本身存在的具有大片深度值相同的区域的特点,找到对应彩色图中该区域所存在色彩值的差异;利用彩色图像中更加丰富的信息,在训练过程中增加深度字典更新的准确程度;
基于上述假设,分别代表对应的深度和彩色图像样本,a和b分别代表Y1和Y2的样本列,则a和b两者之间对的逻辑对应关系可以由如下矩阵来表示:
Y i = Y 1 i Y 2 i = ω j a i ω j + 1 a i ... ω m i a i b j b j + 1 ... b m i , i , j = 1 , ... , n
其中a为深度信息,b为彩色图像中对应位置的彩色信息,ω为平衡参数,mi是整体样本中的一组样本,1≤mi≤n;令引入参数ui,令u=[u1 u2 … un]T则(7)(8)可表示成如下形式:
min u | | Y 1 - D 1 u | | 2 2 + λ 1 | | u | | 2 2 - - - ( 9 )
min x | | X 2 - D 2 x | | 2 2 + λ 2 | | x | | 2 2 - - - ( 10 )
u和x之间的对应关系可用矩阵Ω来表达,即u=Ωx;通过探究得到关系矩阵Ω之后,系数u便可根据公式(10)的稀疏解得到;通过交替求解(9)(10),并更新字典D1和D2,将最终训练完成的字典D1和D2进行组合,得到结构字典D。
2.根据权利要求1所述的一种基于结构字典的稀疏表示深度图重建算法,其特征在于:探究对应深度和彩色图像逻辑对应关系矩阵Ω,具体包括:
1)对对应深度和彩色图像进行采样
利用普通采样算法对对应深度图像Y1和彩色图像Y2分别进行采样,得到深度样本X1,彩色样本X2
2)对深度样本进行聚类
由于本发明将深度和彩色图像作为整体进行考虑,在采样完成后将深度和彩色样本进行组合得到整体样本X,即根据深度图像的特点,场景中同一平面上的点具有相同的深度信息,则可知该在样本中只需要少量的深度信息即可抽取该图像的特征;因此根据整体样本中的深度信息,利用普通聚类算法(如K-Means算法)对整体样本X进行聚类操作,即聚类过程中计算每个样本列到聚类中心的距离是只考虑深度样本部分,彩色样本部分只做对应的调整,保持与原始深度样本的位置一致而不参与任何有关聚类的计算;聚类完成后得到深度样本和彩色样本以及每类样本的数目ni,i=1,2,…,m,m为类的数目;
3)对每类彩色样本进行第二次聚类
利用普通聚类算法对上一步骤操作完成的彩色样本每类彩色样本 进行聚类;得到第i类的聚类中心pi为第i类聚类所得到类的数目,其中每类的样本列的数目为qj,j=1,2,…,pi
4)根据彩色样本每类内部的分类数目计算对应关系矩阵Ω
聚类完成之后的每类彩色样本的聚类中心,即彩色图对应的深度图提取的深度信息所对应的彩色信息;由于同一深度信息对应多种彩色信息,并且每类彩色信息与深度信息的逻辑对应关系有强弱之分,因此采用系数β来描述不同彩色信息之间的比重;本发明中采用加权值的方法来构造关系矩阵Ω;根据彩色样本每一类中的样本列的数目计算其加权值,确定其与深度信息之间逻辑关系的比重;其中第类彩色样本中第k子类的加权值为:h是参数,根据经验值设定;根据加权值,则可得到第i类的参数 总体的关系矩阵为
3.根据权利要求1所述的一种基于结构字典的深度图重建算法,其特征在于:基于结构字典的稀疏表示深度图重建实施具体包括,
1)利用普通稀疏求解算法求得彩色样本的稀疏系数y
利用OMP算法进行系数求解,得到稀疏系数y:y=argminy||y||1,s.t.D2y=X2
2)根据对应关系矩阵Ω求出对应深度样本的稀疏系数u
由假设可知u=Ωx,根据该公式求得深度样本的系数系数u;
3)利用普通字典更新算法根据系数y和u分别更新彩色字典D2和深度字典D1
4)对步骤1)-3)重复迭代直至收敛,得到训练完成的D1,D2,将其组合得到结构字典D即先求得彩色稀疏系数y,根据y与u的关系矩阵Ω求得深度系数u,根据y和u分别更新彩色和深度字典D2,D1,利用更新完成后的字典再进行下一次迭代的稀疏求解;直至优化问题收敛;“深度-彩色”结构字典D即将深度字典D1和彩色字典D2进行逻辑对应,
5)通过训练得到的字典D重建目标深度图像Y1和彩色图像Y2,包括稀疏求解和重建两部分;利用OMP算法进行系数求解,得到稀疏系数α:在结合信号的稀疏表达,重建出原始深度图像和彩色图像;也可利用OMP算法分别求解深度和彩色的稀疏系数y和u:,结合稀疏表达重建出原始深度图像和彩色图像。
CN201610162303.2A 2016-03-21 2016-03-21 一种基于结构字典的稀疏表示深度图像重建方法 Active CN105844635B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610162303.2A CN105844635B (zh) 2016-03-21 2016-03-21 一种基于结构字典的稀疏表示深度图像重建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610162303.2A CN105844635B (zh) 2016-03-21 2016-03-21 一种基于结构字典的稀疏表示深度图像重建方法

Publications (2)

Publication Number Publication Date
CN105844635A true CN105844635A (zh) 2016-08-10
CN105844635B CN105844635B (zh) 2018-10-12

Family

ID=56587644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610162303.2A Active CN105844635B (zh) 2016-03-21 2016-03-21 一种基于结构字典的稀疏表示深度图像重建方法

Country Status (1)

Country Link
CN (1) CN105844635B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107767357A (zh) * 2017-09-14 2018-03-06 北京工业大学 一种基于多方向字典的深度图像超分辨率方法
CN108090926A (zh) * 2017-12-31 2018-05-29 厦门大学 一种基于双重字典学习的深度估计方法
WO2019006835A1 (zh) * 2017-07-06 2019-01-10 清华大学深圳研究生院 一种基于压缩感知的目标识别方法
CN109345582A (zh) * 2018-08-14 2019-02-15 西安电子科技大学 基于优化的置信传播算法和稀疏表示的深度图像获取方法
WO2019071664A1 (zh) * 2017-10-09 2019-04-18 平安科技(深圳)有限公司 结合深度信息的人脸识别方法、装置及存储介质
CN109671130A (zh) * 2018-12-27 2019-04-23 华北电力大学(保定) 利用稀疏测量数据重建内窥式光声层析图像的方法及***
CN109800719A (zh) * 2019-01-23 2019-05-24 南京大学 基于分部件和压缩字典稀疏表示的低分辨率人脸识别方法
CN110108754A (zh) * 2019-04-25 2019-08-09 四川沐迪圣科技有限公司 基于结构化稀疏分解的光激励红外热成像缺陷检测方法
CN111627077A (zh) * 2020-05-27 2020-09-04 成都知识视觉科技有限公司 一种医疗图像的处理方法及其压缩、还原***
CN113454975A (zh) * 2018-12-13 2021-09-28 马特瑞勒耶斯公司 用于表示视觉信息的方法、计算机程序、计算机程序产品和***
CN113496468A (zh) * 2020-03-20 2021-10-12 北京航空航天大学 深度图像的修复方法、装置和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110188757A1 (en) * 2010-02-01 2011-08-04 Chan Victor H Image recognition system based on cascaded over-complete dictionaries
CN102722865A (zh) * 2012-05-22 2012-10-10 北京工业大学 一种超分辨率稀疏重建方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110188757A1 (en) * 2010-02-01 2011-08-04 Chan Victor H Image recognition system based on cascaded over-complete dictionaries
CN102722865A (zh) * 2012-05-22 2012-10-10 北京工业大学 一种超分辨率稀疏重建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DI ZHANG ET AL: "Super-resolution image reconstruction via adaptive sparse representation and joint dictionary training", 《2013 6TH INTERNATIONAL CONGRESS ON IMAGE AND SIGNAL PROCESSING》 *
尹宝才 等: "一种基于分析稀疏表示的图像重建算法", 《数据采集与处理》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019006835A1 (zh) * 2017-07-06 2019-01-10 清华大学深圳研究生院 一种基于压缩感知的目标识别方法
CN107767357B (zh) * 2017-09-14 2021-04-09 北京工业大学 一种基于多方向字典的深度图像超分辨率方法
CN107767357A (zh) * 2017-09-14 2018-03-06 北京工业大学 一种基于多方向字典的深度图像超分辨率方法
WO2019071664A1 (zh) * 2017-10-09 2019-04-18 平安科技(深圳)有限公司 结合深度信息的人脸识别方法、装置及存储介质
CN108090926A (zh) * 2017-12-31 2018-05-29 厦门大学 一种基于双重字典学习的深度估计方法
CN109345582A (zh) * 2018-08-14 2019-02-15 西安电子科技大学 基于优化的置信传播算法和稀疏表示的深度图像获取方法
CN113454975A (zh) * 2018-12-13 2021-09-28 马特瑞勒耶斯公司 用于表示视觉信息的方法、计算机程序、计算机程序产品和***
CN109671130A (zh) * 2018-12-27 2019-04-23 华北电力大学(保定) 利用稀疏测量数据重建内窥式光声层析图像的方法及***
CN109671130B (zh) * 2018-12-27 2023-03-17 华北电力大学(保定) 利用稀疏测量数据重建内窥式光声层析图像的方法及***
CN109800719B (zh) * 2019-01-23 2020-08-18 南京大学 基于分部件和压缩字典稀疏表示的低分辨率人脸识别方法
CN109800719A (zh) * 2019-01-23 2019-05-24 南京大学 基于分部件和压缩字典稀疏表示的低分辨率人脸识别方法
CN110108754A (zh) * 2019-04-25 2019-08-09 四川沐迪圣科技有限公司 基于结构化稀疏分解的光激励红外热成像缺陷检测方法
CN110108754B (zh) * 2019-04-25 2021-10-22 四川沐迪圣科技有限公司 基于结构化稀疏分解的光激励红外热成像缺陷检测方法
CN113496468A (zh) * 2020-03-20 2021-10-12 北京航空航天大学 深度图像的修复方法、装置和存储介质
CN111627077A (zh) * 2020-05-27 2020-09-04 成都知识视觉科技有限公司 一种医疗图像的处理方法及其压缩、还原***
CN111627077B (zh) * 2020-05-27 2023-04-18 成都知识视觉科技有限公司 一种医疗图像的处理方法及其压缩、还原***

Also Published As

Publication number Publication date
CN105844635B (zh) 2018-10-12

Similar Documents

Publication Publication Date Title
CN105844635A (zh) 一种基于结构字典的稀疏表示深度图像重建算法
Cheng et al. An analysis of generative adversarial networks and variants for image synthesis on MNIST dataset
US20210350620A1 (en) Generative geometric neural networks for 3d shape modelling
CN109410261B (zh) 基于金字塔池化模块的单目图像深度估计方法
CN110097178A (zh) 一种基于熵注意的神经网络模型压缩与加速方法
CN110599461B (zh) 一种基于子空间特征学习的丘脑功能分区方法
CN109598732B (zh) 一种基于三维空间加权的医学图像分割方法
CN106503659A (zh) 基于稀疏编码张量分解的动作识别方法
CN106097278A (zh) 一种多维信号的稀疏模型、重建方法和字典训练方法
CN107301372A (zh) 基于迁移学习的高光谱图像超分辨率方法
CN105550649A (zh) 基于全耦合局部约束表示的极低分辨率人脸识别方法及***
CN106886986A (zh) 基于自适应组结构稀疏字典学习的图像融合方法
CN113837191B (zh) 基于双向无监督域适应融合的跨星遥感图像语义分割方法
CN111931814A (zh) 一种基于类内结构紧致约束的无监督对抗域适应方法
CN112417289A (zh) 一种基于深度聚类的资讯信息智能推荐方法
CN108491863A (zh) 基于非负矩阵分解和卷积神经网络的彩色图像处理方法
CN111210382A (zh) 图像处理方法、装置、计算机设备和存储介质
CN108171261A (zh) 鲁棒的自适应半监督图像分类方法、装置、设备及介质
CN109887050A (zh) 一种基于自适应字典学习的编码孔径光谱成像方法
CN110046583A (zh) 基于半监督多视图增量字典学习的彩色人脸识别方法
CN112733602A (zh) 关系引导的行人属性识别方法
CN106296583B (zh) 基于图像块组稀疏编码与成对映射的含噪高光谱图像超分辨率重构方法
CN104537694B (zh) 一种基于关键帧的在线学习的离线视频跟踪方法
CN105069767A (zh) 基于表征学习与邻域约束嵌入的图像超分辨重构方法
CN104917532A (zh) 人脸模型压缩方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant