CN109168002A - 基于压缩感知和卷积神经网络的视频信号测量域估计方法 - Google Patents

基于压缩感知和卷积神经网络的视频信号测量域估计方法 Download PDF

Info

Publication number
CN109168002A
CN109168002A CN201810831091.1A CN201810831091A CN109168002A CN 109168002 A CN109168002 A CN 109168002A CN 201810831091 A CN201810831091 A CN 201810831091A CN 109168002 A CN109168002 A CN 109168002A
Authority
CN
China
Prior art keywords
estimated
macro block
indicate
adjacent
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810831091.1A
Other languages
English (en)
Other versions
CN109168002B (zh
Inventor
郭洁
吕军梅
宋彬
姚继鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201810831091.1A priority Critical patent/CN109168002B/zh
Publication of CN109168002A publication Critical patent/CN109168002A/zh
Application granted granted Critical
Publication of CN109168002B publication Critical patent/CN109168002B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于压缩感知和卷积神经网络的视频信号测量域估计方法,包括:将参考帧图像数据划分为若干宏块;随机选取待估计宏块,选择与待估计宏块在第一方向和第二方向上相邻四个宏块;根据相邻四个宏块计算待估计宏块的像素值和真实测量值;构建卷积神经网络模型,计算待估计宏块的预测测量值;根据真实测量值和预测测量值对卷积神经网络模型进行训练,当卷积神经网络模型输出层的损失函数低于预设阈值时,得到最优参数。本发明克服了现有技术不能兼顾计算复杂度与模型鲁棒性的问题,可快速分析出视频帧的时间相关性,在非常低的测量率和任意改变的运动向量的条件下仍能实现实时、准确地任意位置宏块分析。

Description

基于压缩感知和卷积神经网络的视频信号测量域估计方法
技术领域
本发明属于视频处理技术领域,具体涉及一种基于压缩感知和卷积神经网络的视频信号测量域估计方法。
背景技术
随着信息技术的飞速发展,人们对于图像、视频等多媒体信息的要求越来越高,照相机、摄像机等信号采集设备的压力也越来越大。传统的奈奎斯特(Nyquist)采样定理表明,为了不失真地恢复模拟信号,采样频率要求不低于信号最大频率的两倍。经过该采样方法得到的数字信号数据量巨大,且存在信息冗余,不利于存储和传输。基于压缩感知(Compressed Sensing,CS)理论的采样技术降低了对采样频率的要求,可以实现低功耗、低复杂度的信息采集,利用该技术可以实现更有效的信息采集、传输、存储以及处理。
为了高效地处理视频,基于CS理论的视频压缩感知(Compressed Video Sensing,CVS)编解码***被提出。它为我们提供了一个低复杂度处理视频信息的有效方法。然而,在CVS***中,一次采样过后,原始像素域信号转换到了测量域上,由于我们仅仅获得了块的测量值,视频帧间的时间相关性很难准确得到,这使得在测量域上直接获取视频序列的运动信息是不可能的,而视频序列间的运动信息,可以保证解码端在能够良好恢复原视频信号的前提下,减少编码端所需传输的数据量,进一步提高压缩采样效率。
另一方面,在视觉信息、语音信息和自然语言处理过程中有很多新兴的工具,深度学习作为一种非常有效工具得到了广泛的应用。其中,卷积神经网络(ConvolutionalNeural Network,CNN)是最具有代表性的深度学习网络模型,非常适用于处理图像和视频数据。1959年,Hubel&Wiesel发现,动物视觉皮层细胞负责检测光学信号。20世纪90年代,L.Cun等人发表论文,确立了CNN的现代结构。2012年CNN在ImageNet竞赛中一鸣惊人,直接奠定了它的重要地位。经过结构、算法上的不断完善,现在CNN的强大特征提取和拟合能力使得它广泛用在各种领域。
近年来,很多研究学者寻求CS与CNN的有效结合来解决CVS中存在的难题。Y.Shen,T.Han等人提出的“CS-CNN”方法中,直接利用CNN结构实现CS的采样和重构过程,该方法带来了计算复杂度的增加,并且忽略了视频帧间的时间相关性。另外,文章“Estimation ofmeasurements for block-based compressed video sensing:study of correlationnoise in measurement domain”提出了基于宏块的CVS测量域估计模型,该方法的不足在于,测量矩阵的伪逆矩阵通过奇异值分解近似得到,模型鲁棒性不高,当使用高斯矩阵作为测量矩阵时,估计误差非常大。
发明内容
为了解决现有技术中存在的问题,本发明提出了一种基于压缩感知和卷积神经网络的视频信号测量域估计方法。本发明要解决的技术问题通过以下技术方案实现:
本发明实施例提供了一种基于压缩感知和卷积神经网络的视频信号测量域估计方法,包括:
将视频序列划分为若干图像组,每个图像组包括至少两帧图像数据,选择每个图像组的第一帧作为参考帧,将参考帧图像数据划分为若干宏块;
在所述参考帧图像数据中任一位置选取待估计宏块,选择与所述待估计宏块在第一方向和第二方向上相邻四个宏块;
根据所述相邻四个宏块计算待估计宏块的像素值和真实测量值;
构建卷积神经网络模型,计算待估计宏块的预测测量值;
根据所述真实测量值和所述预测测量值对所述卷积神经网络模型进行训练,当卷积神经网络模型输出层的损失函数低于预设阈值时,得到最优参数。
在本发明的一个实施例中,所述计算待估计宏块的像素值,包括:
对所述待估计宏块与所述相邻四个宏块进行建模运算,得到待估计宏块的像素值。
在本发明的一个实施例中,所述建模运算的公式为:
其中,x(B′)表示待估计宏块像素值,∑表示求和操作,Γi表示相邻四个宏块的位置关系矩阵,x(Bi)表示相邻四个宏块的像素值,i=1,2,3,4。
在本发明的一个实施例中,所述计算待估计宏块的真实测量值,包括:
根据预设规则,计算相邻四个宏块的测量值;
根据所述相邻四个宏块的测量值计算待估计宏块的真实测量值。
在本发明的一个实施例中,所述预设规则为:
y(Bi)=Φx(Bi)
其中,y(Bi)表示宏块的测量值,x(Bi)表示宏块的像素值,i表示宏块的索引,Φ表示测量矩阵。
在本发明的一个实施例中,所述待估计宏块的真实测量值为:
其中,yture表示待估计宏块的真实测量值,∑表示求和操作,Λi表示由运动向量和测量矩阵确定的加权系数矩阵,y(Bi)表示相邻四个宏块的测量值,x(Bi)表示相邻四个宏块的像素值,i=1,2,3,4,Φ表示测量矩阵。
在本发明的一个实施例中,所述卷积神经网络模型,包括:四个卷积神经网络和一个感知器层。
在本发明的一个实施例中,所述待估计宏块的预测测量值为:
其中,ypred表示待估计宏块的预测测量值,∑表示求和操作,wi代表相邻四个宏块的权重分布,fi表示相邻四个宏块对应的卷积神经网络,ΦΓi表示卷积神经网络的输入,y(Bi)表示相邻四个宏块的测量值,x(Bi)表示相邻四个宏块的像素值,i=1,2,3,4,Φ表示测量矩阵。
在本发明的一个实施例中,所述损失函数为测量域相关噪声,表达式为:
J=||ypred-ytrue||2/||ytrue||2
其中,J表示测量域相关噪声,ytrue表示待估计宏块的真实测量值,ypred表示待估计宏块的预测测量值。
在本发明的一个实施例中,所述预设阈值为0.003。
与现有技术相比,本发明的有益效果:
1、本发明通过将卷积神经网络引入视频压缩感知***当中,使用卷积神经网络训练测量矩阵的伪逆和块权重,克服了现有技术不能兼顾计算复杂度与模型鲁棒性的问题,使得本发明在准确性和实时性上优于现有技术,实现在测量域上建立任意位置宏块的精确估计,从而用于快速分析视频帧的时间相关性。
2、本发明基于有标签数据集的有监督训练,借助卷积神经网络结构的优点,通过降采样来充分利用数据本身包含的局部性等特征,并且保证一定程度上的位移和变形的不变性,使得模型获得很强的泛化能力。克服了现有技术由于测量率的要求使得资源受限条件下多媒体信息处理具有一定难度的不足,本发明即使在非常低的测量率和任意改变的运动向量条件下,相比于现有技术,仍然能够实现准确、实时的任意位置宏块分析,有效地在资源受限的环境中处理图像和视频信息。
附图说明
图1是本发明实施例提供的基于压缩感知和卷积神经网络的视频信号测量域估计方法的流程图;
图2是本发明实施例提供的待估计宏块的相对位置分解示意图;
图3是本发明实施例提供的卷积神经网络结构示意图;
图4是本发明实施例提供的卷积神经网络模型整体框架图;
图5是本发明实施例提供的仿真实验内容1相关噪声对比图;
图6是本发明实施例提供的仿真实验内容2相关噪声和时间复杂度对比结果。
具体实施方式
下面结合具体实施例对本发明做进一步详细的描述,但本发明的实施方式不限于此。
实施例一
请参见图1,图1为本发明实施例提供的基于压缩感知和卷积神经网络的视频信号测量域估计方法的流程图。
本发明提供了一种基于压缩感知和卷积神经网络的视频信号测量域估计方法,包括:
将视频序列划分为若干图像组,每个图像组包括至少两帧图像数据,选择每个图像组的第一帧作为参考帧,将参考帧图像数据划分为若干宏块。
为了采集足够多的样本,本发明具体实施例选取了视频序列的前15帧进行分析和建模,每两帧图像数据为一个图像组。
首先,将参考帧图像数据分成n个二维宏块并进行二维到一维变换,得到每个宏块的列向量xi,其中每个宏块大小相同,互不重叠,i代表宏块的索引,n为大于1的整数。本发明的具体实施例是将每一帧图像分成大小为8×8的固定宏块。
在所述参考帧图像数据中任一位置选取待估计宏块,选择与所述待估计宏块在第一方向和第二方向上相邻四个宏块。
下面结合附图2对所述待估计宏块向量的分解做进一步说明:
图2中,假设运动向量MV=(m,n),待估计宏块B′的像素值可以分解为第一方向和第二方向上相邻四个宏块Bi,i=1,2,3,4像素值的组合。其中,B1′为第一方向上宏块Bi,i=1,2的像素值组合,B2′为第一方向上宏块Bi,i=3,4的像素值组合。B′为第二方向上宏块Bi′,i=1,2的像素值组合。
根据所述相邻四个宏块计算待估计宏块的像素值和真实测量值。
所述计算待估计宏块的像素值,包括:
对所述待估计宏块与所述相邻四个宏块进行建模运算,得到所述待估计宏块像素值。
所述建模运算的公式为:
其中,x(B′)表示待估计宏块像素值,∑表示求和操作,Γi表示相邻四个宏块的位置关系矩阵,x(Bi)表示相邻四个宏块的像素值,i=1,2,3,4。
所述计算待估计宏块的真实测量值,包括:
根据预设规则,计算所述相邻四个宏块的测量值。
所述预设规则为:
y(Bi)=Φx(Bi)
其中,y(Bi)表示宏块的测量值,x(Bi)表示宏块的像素值,i表示宏块的索引,Φ表示测量矩阵。
本发明的具体实施例分别采用高斯矩阵和部分哈达玛矩阵作为测量矩阵;测量矩阵的行数与列数之比表示测量率MR。本发明具体的实施例中MR的范围为0.1-0.7,验证了本发明良好的泛化能力。
根据所述相邻四个宏块的测量值计算所述待估计宏块的真实测量值。
所述待估计宏块的真实测量值为:
其中,yture表示待估计宏块的真实测量值,∑表示求和操作,Λi表示由运动向量和测量矩阵确定的加权系数矩阵,y(Bi)表示相邻四个宏块的测量值,x(Bi)表示相邻四个宏块的像素值,i=1,2,3,4,Φ表示测量矩阵。
构建卷积神经网络模型,计算待估计宏块的预测测量值。
所述的卷积神经网络模型包括四个卷积神经网络和一个感知器层。每一个卷积神经网络包括3个卷积层,每个卷积层由多个二维特征映射平面组成,激活函数采用ReLu激活函数y=max(0,x);特别地由于测量域向量维度相对较低,本发明的卷积神经网络中不包含池化层;感知器层采用全连接网络结构,该层的激活函数采用恒等函数y=x。
下面结合附图3对卷积神经网络模型中的卷积神经网络进行说明。
图3中卷积神经网络的输入大小为64*64,中间每一层的由多个特征映射图组成,每个特征映射图由多个神经单元组成,同一个特征映射图的所有神经单元共用一个卷积核。第一层卷积核的大小设置为1*1,第一层步长设置为(1,3),第二层卷积核的大小为1*1,第二层步长设置为(1,3),第一层的特征映射图数目设置为1,第二层的特征映射图数目设置为1。经过卷积核在二维平面上平移,并且卷积核的每个元素与被卷积图像对应位置相乘,再求和。通过卷积核的不断移动,得到下一层的特征输出。通过卷积运算,可以使原信号特征增强,并且降低噪音。
下面结合附图4对卷积神经网络模型的整体框架进行说明。
图4中将ΦΓi输入到对应的卷积神经网络fi中,经过卷积神经网络的变换和运算得到对应的输出,标记为fi(ΦΓi),i=1,2,3,4。将待估计宏块在第一方向和第二方向相邻四个宏块的测量值yi与对应的卷积神经网络的输出fi(ΦΓi),i=1,2,3,4,通过感知器层权重参数wi加权线性求和得到卷积神经网络模型的输出ypred,即:
其中,ypred表示待估计宏块的预测测量值,∑表示求和操作,wi代表相邻四个宏块的权重分布,fi表示相邻四个宏块对应的卷积神经网络,ΦΓi表示卷积神经网络的输入,y(Bi)表示相邻四个宏块的测量值,x(Bi)表示相邻四个宏块的像素值,i=1,2,3,4,Φ表示测量矩阵。
卷积神经网络实现了输入ΦΓi转换为加权系数矩阵Λi,这与测量矩阵Φ的伪逆矩阵有相同变换的作用。
根据真实测量值和预测测量值对卷积神经网络模型进行训练,本发明的具体实施例中采用mini-batch随机梯度下降优化方法,渐进的学习率调整方式,损失函数定义为测量域相关噪声J=||ypred-ytrue||2/||ytrue||2
令X代表输入,X包括:测量矩阵Φ、相邻四个宏块的空间位置关系矩阵Γi以及相邻四个宏块的测量值y(Bi),i=1,2,3,4;y代表标签,y=yture
根据真实测量值和预测测量值对卷积神经网络模型进行训练的步骤为:
(1)向前传播阶段;将一个batch的样本集合X输入卷积神经网络模型计算相应的输出,在此阶段,信息从卷积神经网络模型的输入层经过逐级变换,利用卷积层共享权值、局部连接的特点进行足够复杂的非线性特征提取与合并,传送到卷积神经网络模型的输出层。
(2)向后传播阶段;计算卷积神经网络模型实际输出ypred与样本标签ytrue之间的误差,利用误差反向传播算法,使得残差逐级回传调整卷积神经网络模型的权值,从而不断降低测量域相关噪声。
(3)重复(1)和(2)的操作,不断将下一batch输入到卷积神经网络模型中进行训练,直到卷积神经网络模型输出层的损失函数低于0.003为止,训练得到最优的参数w1、w2、w3、w4以及卷积神经网络f1、f2、f3、f4中的权重和偏置。
基于训练完成的模型,在给定MR=0.3、MV=(3,1)时测得平均相对误差为0.0038。当MR和MV改变时,测得平均相对误差在0.0039到0.0068之间浮动。表明卷积神经网络模型具有比传统方法更强大的建模能力。
本发明的效果可以通过以下仿真实验作进一步说明。
1.仿真实验条件:
本发明的实验仿真环境为:
操作***:ubuntu 14.04,python2.7
实验平台:Tensorflow-1.4
处理器:Intel Core i7-7700k [email protected]×8
显卡:NVIDIA 1080Ti GPU
内存:15.6GB
本发明的仿真实验所用到的数据来源为代表性的视频序列Foreman CIF序列。压缩采样了Foreman CIF序列的前15帧,总样本数为11424,训练集和测试集随机划分为9632和1792;运动向量设置为MV=(3,1),3表示水平运动,1表示垂直运动;测量率MR=0.3。
2.仿真实验内容:
本发明的仿真实验具体分为两个仿真实验。
仿真实验一:测量矩阵为高斯矩阵和部分哈达玛矩阵的宏块精确估计实验,在相同的实验仿真环境中,图5中,基准方法和本发明提出方法同采用高斯测量矩阵,本发明提出方法的相关噪声几乎是基准方法相关噪声的六十分之一。特别的,为了在一幅图上看到清晰的对比,利用高斯测量矩阵的本发明提出方法的对数相关误差缩小了15倍。
在相同的实验仿真环境中,图5中,基准方法和本发明提出方法同采用部分哈达玛矩阵测量矩阵,基准方法相关噪声是本发明提出方法的相关噪声的2-3倍(为了在一幅图上看到清晰的对比,两种方法的对数相关误差同时缩小了15倍)。
仿真实验二:不同运动向量和测量率条件下的宏块精确估计实验
利用高斯测量矩阵,batch=300的条件下,设置不同的MV和MR进行相关分析实验。在图6中,以测量域的相关噪声(用CN表示)和时间复杂度(单位为秒)为衡量准则,当MV和MR发生改变,本发明提出方法总是大幅度优于基准方法。
3.仿真实验结果分析:
由图5可以看出,当给定测量率和运动向量,测量矩阵分别为高斯矩阵和部分哈达玛矩阵时,本发明提出的方法的在测量域的相关噪声对数误差相比于现有的近似模型有很大的优势。由图6可以看出,随着测量率在0.1-0.7的范围内改变,运动向量分别取(2,2)和(-2,-2)时,本发明提出的方法在相关噪声误差指标上和时间复杂度上远优于现有的近似模型。综上所述,本发明使用卷积神经网络来训练测量矩阵的伪逆和块的权重使得视频帧内任意宏块估计模型在精度和鲁棒性方面可以得到明显改善,甚至超过两个数量级。同时,本发明提出模型是接近实时的,处理时间几乎是现有近似模型的八分之一,可在资源受限的环境中处理图像和视频信息。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种基于压缩感知和卷积神经网络的视频信号测量域估计方法,其特征在于,包括:
将视频序列划分为若干图像组,每个图像组包括至少两帧图像数据,选择每个图像组的第一帧作为参考帧,将参考帧图像数据划分为若干宏块;
在所述参考帧图像数据中任一位置选取待估计宏块,选择与所述待估计宏块在第一方向和第二方向上相邻四个宏块;
根据所述相邻四个宏块计算待估计宏块的像素值和真实测量值;
构建卷积神经网络模型,计算待估计宏块的预测测量值;
根据所述真实测量值和所述预测测量值对所述卷积神经网络模型进行训练,当卷积神经网络模型输出层的损失函数低于预设阈值时,得到最优参数。
2.根据权利要求1所述的方法,其特征在于,所述计算待估计宏块的像素值,包括:
对所述待估计宏块与所述相邻四个宏块进行建模运算,得到待估计宏块的像素值。
3.根据权利要求2所述的方法,其特征在于,所述建模运算的公式为:
其中,x(B′)表示待估计宏块像素值,Σ表示求和操作,Γi表示相邻四个宏块的位置关系矩阵,x(Bi)表示相邻四个宏块的像素值,i=1,2,3,4。
4.根据权利要求1所述的方法,其特征在于,所述计算待估计宏块的真实测量值,包括:
根据预设规则,计算相邻四个宏块的测量值;
根据所述相邻四个宏块的测量值计算待估计宏块的真实测量值。
5.根据权利要求4所述的方法,其特征在于,所述预设规则为:
y(Bi)=Φx(Bi)
其中,y(Bi)表示宏块的测量值,x(Bi)表示宏块的像素值,i表示宏块的索引,Φ表示测量矩阵。
6.根据权利要求4所述的方法,其特征在于,所述待估计宏块的真实测量值为:
其中,yture表示待估计宏块的真实测量值,Σ表示求和操作,Λi表示由运动向量和测量矩阵确定的加权系数矩阵,y(Bi)表示相邻四个宏块的测量值,x(Bi)表示相邻四个宏块的像素值,i=1,2,3,4,Φ表示测量矩阵。
7.根据权利要求1所述的方法,其特征在于,所述卷积神经网络模型,包括:四个卷积神经网络和一个感知器层。
8.根据权利要求1所述的方法,其特征在于,所述待估计宏块的预测测量值为:
其中,ypred表示待估计宏块的预测测量值,Σ表示求和操作,wi代表相邻四个宏块的权重分布,fi表示相邻四个宏块对应的卷积神经网络,ΦΓi表示卷积神经网络的输入,y(Bi)表示相邻四个宏块的测量值,x(Bi)表示相邻四个宏块的像素值,i=1,2,3,4,Φ表示测量矩阵。
9.根据权利要求1所述的方法,其特征在于,所述损失函数为测量域相关噪声,表达式为:
J=||ypred-ytrue||2/||ytrue||2
其中,J表示测量域相关噪声,ytrue表示待估计宏块的真实测量值,ypred表示待估计宏块的预测测量值。
10.根据权利要求1所述的方法,其特征在于,所述预设阈值为0.003。
CN201810831091.1A 2018-07-26 2018-07-26 基于压缩感知和卷积神经网络的视频信号测量域估计方法 Active CN109168002B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810831091.1A CN109168002B (zh) 2018-07-26 2018-07-26 基于压缩感知和卷积神经网络的视频信号测量域估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810831091.1A CN109168002B (zh) 2018-07-26 2018-07-26 基于压缩感知和卷积神经网络的视频信号测量域估计方法

Publications (2)

Publication Number Publication Date
CN109168002A true CN109168002A (zh) 2019-01-08
CN109168002B CN109168002B (zh) 2020-06-12

Family

ID=64898202

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810831091.1A Active CN109168002B (zh) 2018-07-26 2018-07-26 基于压缩感知和卷积神经网络的视频信号测量域估计方法

Country Status (1)

Country Link
CN (1) CN109168002B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111192334A (zh) * 2020-01-02 2020-05-22 苏州大学 可训练的压缩感知模块及一种图像分割方法
CN111354051A (zh) * 2020-03-03 2020-06-30 昆明理工大学 一种自适应优化网络的图像压缩感知方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103546749A (zh) * 2013-10-14 2014-01-29 上海大学 利用残差系数分布特征和贝叶斯定理优化hevc残差编码的方法
CN107784676A (zh) * 2017-09-20 2018-03-09 中国科学院计算技术研究所 基于自动编码器网络的压缩感知测量矩阵优化方法和***
US20180198994A1 (en) * 2017-01-11 2018-07-12 Sony Corporation Compressive sensing capturing device and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103546749A (zh) * 2013-10-14 2014-01-29 上海大学 利用残差系数分布特征和贝叶斯定理优化hevc残差编码的方法
US20180198994A1 (en) * 2017-01-11 2018-07-12 Sony Corporation Compressive sensing capturing device and method
CN107784676A (zh) * 2017-09-20 2018-03-09 中国科学院计算技术研究所 基于自动编码器网络的压缩感知测量矩阵优化方法和***

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111192334A (zh) * 2020-01-02 2020-05-22 苏州大学 可训练的压缩感知模块及一种图像分割方法
CN111354051A (zh) * 2020-03-03 2020-06-30 昆明理工大学 一种自适应优化网络的图像压缩感知方法
CN111354051B (zh) * 2020-03-03 2022-07-15 昆明理工大学 一种自适应优化网络的图像压缩感知方法

Also Published As

Publication number Publication date
CN109168002B (zh) 2020-06-12

Similar Documents

Publication Publication Date Title
CN108564611A (zh) 一种基于条件生成对抗网络的单目图像深度估计方法
CN110751649B (zh) 视频质量评估方法、装置、电子设备及存储介质
CN104135663B (zh) 对图像进行编码
EP4138391A1 (en) Mimic compression method and apparatus for video image, and storage medium and terminal
CN111868751A (zh) 在视频代码化的机器学习模型中使用应用于量化参数的非线性函数
CN113259665B (zh) 一种图像处理方法以及相关设备
CN108319932A (zh) 一种基于生成式对抗网络的多图像人脸对齐的方法及装置
CN104199627B (zh) 基于多尺度在线字典学习的可分级视频编码***
CN103905831B (zh) 基于图形处理器的条带波变换图像压缩方法
CN107680044B (zh) 一种图像超分辨率卷积神经网络加速计算方法
Nguyen et al. Deep learning sparse ternary projections for compressed sensing of images
CN109168002A (zh) 基于压缩感知和卷积神经网络的视频信号测量域估计方法
CN105847800A (zh) 基于全相位离散正弦双正交变换的图像压缩方法及***
CN107770526A (zh) 一种基于量化ica的超光谱大气红外遥感图像无损压缩方法
Liang et al. Improvement of residual attention network for image classification
Zhao et al. Symmetrical lattice generative adversarial network for remote sensing images compression
CN113822825B (zh) 基于3d-r2n2的光学建筑目标三维重建方法
CN115022637A (zh) 一种图像编码方法、图像解压方法以及装置
CN115409697A (zh) 一种图像处理方法及相关装置
CN116434343B (zh) 基于高低频双支路的视频动作识别方法
CN108259914B (zh) 基于物体库的云图像编码方法
BH et al. Overview on machine learning in image compression techniques
Liu et al. An end-to-end multi-scale residual reconstruction network for image compressive sensing
Wang et al. Deep image compression with multi-stage representation
Wang et al. Lightweight image denoising network with four-channel interaction transform

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant