CN113327199B - 一种多帧图像重建方法、***及设备 - Google Patents

一种多帧图像重建方法、***及设备 Download PDF

Info

Publication number
CN113327199B
CN113327199B CN202110665151.9A CN202110665151A CN113327199B CN 113327199 B CN113327199 B CN 113327199B CN 202110665151 A CN202110665151 A CN 202110665151A CN 113327199 B CN113327199 B CN 113327199B
Authority
CN
China
Prior art keywords
data
image
characteristic
image data
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110665151.9A
Other languages
English (en)
Other versions
CN113327199A (zh
Inventor
吴洁
李文国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Spreadtrum Communications Tianjin Co Ltd
Original Assignee
Spreadtrum Communications Tianjin Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Spreadtrum Communications Tianjin Co Ltd filed Critical Spreadtrum Communications Tianjin Co Ltd
Priority to CN202110665151.9A priority Critical patent/CN113327199B/zh
Publication of CN113327199A publication Critical patent/CN113327199A/zh
Application granted granted Critical
Publication of CN113327199B publication Critical patent/CN113327199B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4046Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Processing (AREA)

Abstract

本发明涉及图像处理领域,尤其涉及一种多帧图像重建方法、***及设备。其中,该方法包括:获取多帧图像数据;对每帧所述图像数据进行下采样,得到每帧所述图像数据的下采样数据;对所述多帧图像数据的下采样数据进行特征拼接,得到拼接特征数据;将所述拼接特征数据输入图像重建模型,所述图像重建模型基于注意力机制从所述拼接特征数据中提取残差特征,并对提取的所述残差特征进行特征融合,得到重建特征数据;对所述重建特征数据进行上采样,得到重建图像数据。

Description

一种多帧图像重建方法、***及设备
【技术领域】
本发明涉及图像处理领域,尤其涉及一种多帧图像重建方法、***及设备。
【背景技术】
图像分辨率是衡量图像质量的重要指标,图像分辨率越高,图像中所包含的像素细节和纹理信息就越丰富。而提升图像分辨率的技术手段主要分为两种,其中一种是通过改进硬件设备来提升图像的分辨率;另一种则是通过信号处理等软件方法将硬件设备采集到的低分辨率图像重构为高分辨率图像,即超分辨率技术。而超分辨率技术又分为单帧超分辨率技术和多帧超分辨率技术。单帧超分辨率技术指利用当前帧的图像信息重构出一张高分辨率图像。而多帧超分辨率技术则是依靠当前帧和与当前帧相邻的多帧图像信息重构出一张高分辨率的图像。现有技术中,多帧超分辨率技术往往需要依赖对齐模块来估计帧间的运动信息,并对目标帧和参考帧进行对齐,进而进行图像重建。而对齐模块由于使用运动估计和补偿技术或者可变形卷积,算法较为复杂,影响图像重建速度,并且不利于端侧部署。
【发明内容】
为了解决上述问题,本发明实施例提供了一种多帧图像重建方法、***及设备。本发明实施例通过使用注意力机制的图像重建模型,并采用残差连接来代替对齐模块,从而降低的模型复杂程度,在保证图像重建质量的前提下可以提高图像重建速度,并且利于端侧部署。
第一方面,本发明实施例提供一种多帧图像重建方法,包括:
获取多帧图像数据;
对每帧所述图像数据进行下采样,得到每帧所述图像数据的下采样数据;
对所述多帧图像数据的下采样数据进行特征拼接,得到拼接特征数据;
将所述拼接特征数据输入图像重建模型,所述图像重建模型基于注意力机制从所述拼接特征数据中提取残差特征,并对提取的所述残差特征进行特征融合,得到重建特征数据;
对所述重建特征数据进行上采样,得到重建图像数据。
本发明实施例中,通过对下采样后每帧图像数据进行特征拼接,并将得到的拼接特征数据输入采用注意力机制的图像重建模型中提取残差特征,之后对残差特征进行特征融合,得到重建特征数据。最后对重建特征数据进行上采样,得到重建图像数据。
在一种可能的实现方式中,对每帧所述图像数据进行下采样,得到每帧所述图像数据的下采样数据,包括:
基于采样因子s对图像尺寸为H×W×C的图像数据进行下采样,得到特征尺寸为
Figure BDA0003117042410000021
的下采样数据;
其中,H、W和C分别为所述图像数据的长度、宽度和通道数;
Figure BDA0003117042410000022
和(C·s2)分别为所述下采样数据的长度、宽度和通道数。
在一种可能的实现方式中,对所述多帧图像数据的下采样数据进行特征拼接,得到拼接特征数据,包括:
对特征尺寸为
Figure BDA0003117042410000023
的所述多帧图像的下采样数据按照时间顺序在通道维度进行拼接,得到特征尺寸为
Figure BDA0003117042410000024
的拼接图像数据;
其中,n为所述多帧图像数据的帧数,
Figure BDA0003117042410000025
和(n·C·s2)分别为所述拼接数据的长度、宽度和通道数。
在一种可能的实现方式中,所述图像重建模型包括:残差蒸馏模块和通道注意力模块;所述图像重建模型用于从所述拼接特征数据中提取残差特征,并对提取的所述残差特征进行特征融合,得到重建特征数据,包括:
所述拼接特征数据输入所述残差蒸馏模块和所述通道注意力模块;
所述残差蒸馏模块用于基于残差蒸馏机制从所述拼接特征数据中提取残差特征,并将提取的所述残差特征进行特征融合,得到融合特征数据;
所述通道注意力模块用于基于注意力机制对所述拼接特征数据和所述融合特征数据进行注意力特征提取,得到所述重建特征数据。
在一种可能的实现方式中,所述残差蒸馏模块包括:多个串联连接的浅层残差模块和特征拼接模块,所述残差蒸馏模块用于基于残差蒸馏机制从所述拼接特征数据中提取残差特征,并将提取的所述残差特征进行特征融合,得到融合特征数据,包括:
所述残差蒸馏模块基于所述多个浅层残差模块从所述拼接特征数据中提取残差特征,并将每个所述浅层残差模块提取到的残差特征输出给所述特征拼接模块;
所述特征拼接模块用于对每个所述浅层残差模块输出的残差特征进行特征融合,得到所述融合特征数据。
在一种可能的实现方式中,所述图像重建模型的训练步骤包括:
获取训练图像集,所述训练图像集包含多个高分辨率图像数据和与所述多个高分辨率图像数据对应的多个低分辨率图像数据;
将所述训练图像集输入所述图像重建模型进行迭代训练,以使所述图像重建模型学习到高分辨率图像数据和对应的多个低分辨率图像数据之间的映射关系。
第二方面,本发明实施例提供一种多帧图像重建***,包括:
获取模块,用于获取多帧图像数据;
处理模块,用于对每帧所述图像数据进行下采样,得到每帧所述图像数据的下采样数据;
所述处理模块,还用于对所述多帧图像数据的下采样数据进行特征拼接,得到拼接特征数据;
输入模块,用于将所述拼接特征数据输入图像重建模型,所述图像重建模型基于注意力机制从所述拼接特征数据中提取残差特征,并对提取的所述残差特征进行特征融合,得到重建特征数据;
所述处理模块,还用于对所述重建特征数据进行上采样,得到重建图像数据。
在一种可能的实现方式中,所述处理模块,具体用于:
基于采样因子s对图像尺寸为H×W×C的图像数据进行下采样,得到特征尺寸为
Figure BDA0003117042410000041
的下采样数据;
其中,H、W和C分别为所述图像数据的长度、宽度和通道数;
Figure BDA0003117042410000042
和(C·s2)分别为所述下采样数据的长度、宽度和通道数。
第三方面,本发明实施例提供一种电子设备,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行第一方面所述的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面所述的方法。
应当理解的是,本发明实施例的第二~四方面与本发明实施例的第一方面的技术方案一致,各方面及对应的可行实施方式所取得的有益效果相似,不再赘述。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种多帧图像重建方法的流程图;
图2为本发明实施例提供的一种下采样的示意图;
图3为本发明实施例提供的一种图像重建模型的结构示意图;
图4为本发明实施例提供的一种蒸馏块的结构示意图;
图5为本发明实施例提供的一种浅层残差模块结构示意图;
图6为本发明实施例提供的一种通道注意力模块的结构示意图;
图7为本发明实施例提供的另一种多帧图像重建方法的流程图;
图8为本发明实施例提供的一种多帧图像重建***的结构示意图;
图9为本发明实施例提供的一种电子设备的结构示意图。
【具体实施方式】
为了更好的理解本说明书的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
本发明实施例中,对图像重建模型进行了优化,通过采用注意力机制从拼接特征数据中提取残差特征,并对残差特征进行特征融合来代替传统多帧图像重建模型中的对齐模块的作用,降低了模型复杂程度。
图1为本发明实施例提供的一种多帧图像重建方法的流程图。如图1所示,该方法包括:
步骤101,获取多帧图像数据。其中,多帧图像数据可以为亮度与色度(YUV)格式的图像数据。可选的,多帧图像数据可以为连续的几帧图像数据。也可以为采用不同拍摄角度对同一目标进行拍摄得到的多帧图像。随着获取的用于图像重建的图像数据帧数的增加,对应的图像重建的效果就越好。但是会使得图像重建时间变长,图像重建模型的构造也会更加复杂。可选的,可以获取3至6帧的图像数据进行单帧的图像重建。优选的,可以获取4帧图像数据进行图像重建。
步骤102,对每帧图像数据进行下采样,得到每帧图像数据的下采样数据。在图像数据处理中,直接对原分辨率的图像数据进行处理会使得图像重建模型的计算量过大,所以一般采用最大池化/迭代步长为2的卷积等操作,对图像数据进行下采样,从而达到减少图像重建模型的计算量的效果。但这种方法往往为对一定区域内的多个像素点取平均值来代替该区域的像素点值,进而达到下采样中降低像素信息的目的,所以会导致图像数据的信息产生丢失。
本发明实施例中,通过采用像素混洗下采样的方法,可以避免下采样过程中图像数据的信息丢失。通过将多帧图像数据进行重新组合,将宽高维度的部分数据特征转移到通道维度上,从而保留了图像数据中的全部图像信息。具体的,基于采样因子s对图像尺寸为H×W×C的图像数据进行下采样,得到特征尺寸为
Figure BDA0003117042410000061
的下采样数据。其中,H、W和C分别为图像数据的长度、宽度和通道数;
Figure BDA0003117042410000062
和(C·s2)分别为下采样数据的长度、宽度和通道数。如图2所示,下采样因子为2,输入的图像数据的长度为6,宽度为4,通道数为1,在经过了像素混洗下采样之后得到长度为3,宽度为2,通道数为4的下采样数据。
步骤103,对多帧图像数据的下采样数据进行特征拼接,得到拼接特征数据。具体的,可以对特征尺寸为
Figure BDA0003117042410000071
的多帧图像的下采样数据按照时间顺序在通道维度进行拼接,得到特征尺寸为
Figure BDA0003117042410000072
的拼接图像数据。其中,n为多帧图像数据的帧数,
Figure BDA0003117042410000073
和(n·C·s2)分别为拼接数据的长度、宽度和通道数。例如,共获取了四帧的图像数据,第一帧的拍摄时间为0.00秒,第二帧的拍摄时间为0.03秒,第三帧的拍摄时间为0.06秒,第四帧的拍摄时间为0.09秒,则按照时间顺序对四帧图像数据的排列结果为:第一帧图像数据、第二帧图像数据、第三帧图像数据和第四帧图像数据。在对四帧图像数据分别进行下采样后,得到四组特征尺寸为均为3×2×4的下采样数据,之后可以按照四帧图像数据的排序结果将对应的下采样数据进行拼接,得到3×2×16的拼接特征数据。
步骤104,将拼接特征数据输入图像重建模型,图像重建模型基于注意力机制从拼接特征数据中提取残差特征,并对提取的残差特征进行特征融合,得到重建特征数据。本发明实施例提供了一种图像重建模型的结构示意图,如图3所示,图像重建模型包括下采样部分、含有多个蒸馏块的注意力机制部分以及上采样部分。其中,每个蒸馏块由残差蒸馏模块和通道注意力模块构成。下采样部分对I1、I2、I3和I4四帧图像数据分别进行像素混洗下采样处理,并对采样后的四份采样数据进行特征拼接,再将拼接后的拼接特征数据输入一个3×3卷积模块进行通道数缩减后输入注意力机制部分进行特征提取。
拼接特征数据输入残差蒸馏模块和通道注意力模块后,残差蒸馏模块用于基于残差蒸馏机制从拼接特征数据中提取残差特征,并将提取的残差特征进行融合,得到融合特征数据。通道注意力模块用于基于注意力机制对拼接特征数据和融合特征数据进行注意力提取,得到重建特征数据。上采样部分由一个3×3的卷积模块和一个像素混洗上采样模块构成。3×3的卷积模块用于缩减重建特征数据的通道数量。
图4示出了一种蒸馏块的结构示意图,如图4所示,每个蒸馏块包含三个串联连接的浅层残差模块,四个1×1卷积模块,一个3×3卷积模块,一个特征拼接模块和一个通道注意力模块构成。残差蒸馏模块基于多个浅层残差模块从拼接特征数据中提取残差特征,并将每个浅层残差模块提取到的残差特征输出给特征拼接模块。特征拼接模块用于对每个浅层残差模块输出的残差特征进行特征融合,得到所述融合特征数据。其中,如图5所示,每个浅层残差模块由一个3×3卷积模块和一个激活函数模块构成,优选的,激活函数模块可以采用Relu函数作为激活函数。
本发明实施例提供了一种通道注意力模块的结构示意图,如图6所示,通道注意力模块由最大池化层模块,两个1×1卷积模块和一个激活函数模块构成,并采用残差连接。其中激活函数模块可以采用Sigmoid函数作为激活函数。最大池化层用模块于对输入的拼接特征数据的宽度和长度进行压缩,之后由1×1卷积模块对最大池化层模块压缩后的拼接特征数据进行整理,再由下一个1×1卷积模块对通道数进行压缩并输出给激活函数模块,激活函数模块对拼接特征数据引入非线性特征,再和最开始输入通道注意力模块的拼接特征数据做残差连接,得到最终输出的重建特征数据。
通过采用蒸馏模块和通道注意力模块构成的注意力机制,可以使图像重建模型更专注于更有用的高品质特征,如纹理数据等。具体的,在训练图像重建模型时,可以通过训练数据训练图像重建模型对于各个特征通道的依赖性,进一步确定在图像重建时对各个特征通道的权重值来达到注意力机制的效果。
步骤105,对重建特征数据进行上采样,得到重建图像数据。其中,上采样的实施过程可以看作像素混洗下采样的逆过程。即,上采样因子为s,将输入尺寸为H×W×C的重建图像数据进行上采样处理,得到为尺寸为H·s×W·s×C/s2的重建图像数据。由此实现了上采样过程,得到的图像重建数据即为高分辨率的YUV格式的图像数据,之后可以将该数据进行色域转换,得到红绿蓝(RED GREEN BLUE,RGB)格式的图像数据,即重建后的高分辨率图像。
在一些实施例中,对图像重建模型的训练步骤如图7所示:
步骤701,获取训练图像集,训练图像集包含多个高分辨率图像数据和与所述多个高分辨率图像数据对应的多个低分辨率图像数据。
步骤702,将训练图像集输入图像重建模型进行迭代训练,以使图像重建模型学习到高分辨率图像数据和对应的多个低分辨率图像数据之间的映射关系。
对应上述多帧图像重建方法,本发明实施例提供一种多帧图像重建***的结构示意图,如图8所示,该***包括:获取模块801、处理模块802和输入模块803。
获取模块801,用于获取多帧图像数据。
处理模块802,用于对每帧所述图像数据进行下采样,得到每帧所述图像数据的下采样数据。
处理模块802,还用于对多帧图像数据的下采样数据进行特征拼接,得到拼接特征数据。
输入模块803,用于将拼接特征数据输入图像重建模型,图像重建模型基于注意力机制从拼接特征数据中提取残差特征,并对提取的所述残差特征进行特征融合,得到重建特征数据。
处理模块802,还用于对重建特征数据进行上采样,得到重建图像数据。
在一些实施例中,处理模块802具体用于:
基于采样因子s对图像尺寸为H×W×C的图像数据进行下采样,得到特征尺寸为
Figure BDA0003117042410000091
的下采样数据。其中,H、W和C分别为图像数据的长度、宽度和通道数;
Figure BDA0003117042410000092
和(C·s2)分别为下采样数据的长度、宽度和通道数。
图8所示实施例提供的多帧图像重建***可用于执行本说明书图1~图7所示方法实施例的技术方案,其实现原理和技术效果可以进一步参考方法实施例中的相关描述。
图9为本发明实施例提供的另一种电子设备的结构示意图,如图9所示,上述电子设备可以包括至少一个处理器;以及与上述处理器通信连接的至少一个存储器,其中:存储器存储有可被处理器执行的程序指令,上述处理器调用上述程序指令能够执行本说明书图1~图7所示实施例提供的多帧图像重建方法。
如图8所示,电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于:一个或者多个处理器910、通信接口920和存储器930,连接不同***组件(包括存储器930、通信接口920和处理单元910)的通信总线940。
通信总线940表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及***组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
电子设备典型地包括多种计算机***可读介质。这些介质可以是任何能够被电子设备访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器930可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)和/或高速缓存存储器。电子设备可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。存储器930可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本说明书各实施例的功能。
具有一组(至少一个)程序模块的程序/实用工具,可以存储在存储器930中,这样的程序模块包括——但不限于——操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块通常执行本说明书所描述的实施例中的功能和/或方法。
处理器910通过运行存储在存储器930中的程序,从而执行各种功能应用以及数据处理,例如实现本说明书图1~图7所示实施例提供的多帧图像重建方法。
本说明书实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行本说明书图1~图7所示实施例提供的多帧图像重建确定方法。
上述计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ReadOnly Memory;以下简称:ROM)、可擦式可编程只读存储器(Erasable Programmable ReadOnly Memory;以下简称:EPROM)或闪存、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本说明书的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本说明书的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本说明书的实施例所属技术领域的技术人员所理解。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
需要说明的是,本说明书实施例中所涉及的设备可以包括但不限于个人计算机(Personal Computer;以下简称:PC)、个人数字助理(Personal Digital Assistant;以下简称:PDA)、无线手持设备、平板电脑(Tablet Computer)、手机、MP3显示器、MP4显示器等。
在本说明书所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本说明书各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,连接器,或者网络装置等)或处理器(Processor)执行本说明书各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory;以下简称:ROM)、随机存取存储器(Random Access Memory;以下简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。

Claims (8)

1.一种多帧图像重建方法,其特征在于,包括:
获取多帧图像数据;
对每帧所述图像数据进行下采样,得到每帧所述图像数据的下采样数据;
对所述多帧图像数据的下采样数据进行特征拼接,得到拼接特征数据;
将所述拼接特征数据输入图像重建模型,所述图像重建模型基于注意力机制从所述拼接特征数据中提取残差特征,并对提取的所述残差特征进行特征融合,得到重建特征数据;
对所述重建特征数据进行上采样,得到重建图像数据;
其中,对每帧所述图像数据进行下采样,得到每帧所述图像数据的下采样数据,包括:
基于采样因子s对图像尺寸为H×W×C的图像数据进行下采样,得到特征尺寸为
Figure FDA0003833084910000011
的下采样数据;
其中,H、W和C分别为所述图像数据的长度、宽度和通道数;
Figure FDA0003833084910000012
和(C·s2)分别为所述下采样数据的长度、宽度和通道数;
对所述重建特征数据进行上采样,得到重建图像数据,包括:
根据所述采样因子s对特征尺寸为H×W×C的重建特征数据进行上采样处理,得到为图像尺寸为H·s×W·s×C/s2的重建图像数据。
2.根据权利要求1所述的方法,其特征在于,对所述多帧图像数据的下采样数据进行特征拼接,得到拼接特征数据,包括:
对特征尺寸为
Figure FDA0003833084910000013
的所述多帧图像的下采样数据按照时间顺序在通道维度进行拼接,得到特征尺寸为
Figure FDA0003833084910000014
的拼接图像数据;
其中,n为所述多帧图像数据的帧数,
Figure FDA0003833084910000015
和(n·C·s2)分别为所述拼接图像数据的长度、宽度和通道数。
3.根据权利要求1所述的方法,其特征在于,所述图像重建模型包括:残差蒸馏模块和通道注意力模块;所述图像重建模型用于从所述拼接特征数据中提取残差特征,并对提取的所述残差特征进行特征融合,得到重建特征数据,包括:
所述拼接特征数据输入所述残差蒸馏模块和所述通道注意力模块;
所述残差蒸馏模块用于基于残差蒸馏机制从所述拼接特征数据中提取残差特征,并将提取的所述残差特征进行特征融合,得到融合特征数据;
所述通道注意力模块用于基于注意力机制对所述拼接特征数据和所述融合特征数据进行注意力特征提取,得到所述重建特征数据。
4.根据权利要求3所述的方法,其特征在于,所述残差蒸馏模块包括:多个串联连接的浅层残差模块和特征拼接模块,所述残差蒸馏模块用于基于残差蒸馏机制从所述拼接特征数据中提取残差特征,并将提取的所述残差特征进行特征融合,得到融合特征数据,包括:
所述残差蒸馏模块基于多个所述浅层残差模块从所述拼接特征数据中提取残差特征,并将每个所述浅层残差模块提取到的残差特征输出给所述特征拼接模块;
所述特征拼接模块用于对每个所述浅层残差模块输出的残差特征进行特征融合,得到所述融合特征数据。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述图像重建模型的训练步骤包括:
获取训练图像集,所述训练图像集包含多个高分辨率图像数据和与所述多个高分辨率图像数据对应的多个低分辨率图像数据;
将所述训练图像集输入所述图像重建模型进行迭代训练,以使所述图像重建模型学习到高分辨率图像数据和对应的多个低分辨率图像数据之间的映射关系。
6.一种多帧图像重建***,其特征在于,包括:
获取模块,用于获取多帧图像数据;
处理模块,用于对每帧所述图像数据进行下采样,得到每帧所述图像数据的下采样数据;
所述处理模块,还用于对所述多帧图像数据的下采样数据进行特征拼接,得到拼接特征数据;
输入模块,用于将所述拼接特征数据输入图像重建模型,所述图像重建模型基于注意力机制从所述拼接特征数据中提取残差特征,并对提取的所述残差特征进行特征融合,得到重建特征数据;
所述处理模块,还用于对所述重建特征数据进行上采样,得到重建图像数据;
其中,所述处理模块,具体用于:
基于采样因子s对图像尺寸为H×W×C的图像数据进行下采样,得到特征尺寸为
Figure FDA0003833084910000031
的下采样数据;
其中,H、W和C分别为所述图像数据的长度、宽度和通道数;
Figure FDA0003833084910000032
和(C·s2)分别为所述下采样数据的长度、宽度和通道数;
所述处理模块,具体用于:
对所述重建特征数据进行上采样,得到重建图像数据,包括:
根据所述采样因子s对特征尺寸为H×W×C的重建特征数据进行上采样处理,得到为图像尺寸为H·s×W·s×C/s2的重建图像数据。
7.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至5任一所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至5任一所述的方法。
CN202110665151.9A 2021-06-16 2021-06-16 一种多帧图像重建方法、***及设备 Active CN113327199B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110665151.9A CN113327199B (zh) 2021-06-16 2021-06-16 一种多帧图像重建方法、***及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110665151.9A CN113327199B (zh) 2021-06-16 2021-06-16 一种多帧图像重建方法、***及设备

Publications (2)

Publication Number Publication Date
CN113327199A CN113327199A (zh) 2021-08-31
CN113327199B true CN113327199B (zh) 2023-01-20

Family

ID=77420910

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110665151.9A Active CN113327199B (zh) 2021-06-16 2021-06-16 一种多帧图像重建方法、***及设备

Country Status (1)

Country Link
CN (1) CN113327199B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118134766B (zh) * 2024-05-07 2024-07-23 西安兵器工业科技产业开发有限公司 红外视频超分辨率重建方法、装置及设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110033410B (zh) * 2019-03-28 2020-08-04 华中科技大学 图像重建模型训练方法、图像超分辨率重建方法及装置
CN109871909B (zh) * 2019-04-16 2021-10-01 京东方科技集团股份有限公司 图像识别方法及装置
CN110276721A (zh) * 2019-04-28 2019-09-24 天津大学 基于级联残差卷积神经网络的图像超分辨率重建方法
CN111311490B (zh) * 2020-01-20 2023-03-21 陕西师范大学 基于多帧融合光流的视频超分辨率重建方法
CN112911304B (zh) * 2021-01-29 2022-03-25 南京信息工程大学滨江学院 基于编码的双路视频压缩装置及压缩视频重建方法

Also Published As

Publication number Publication date
CN113327199A (zh) 2021-08-31

Similar Documents

Publication Publication Date Title
Choi et al. A deep convolutional neural network with selection units for super-resolution
TWI728465B (zh) 圖像處理方法和裝置、電子設備及儲存介質
CN111369440B (zh) 模型训练、图像超分辨处理方法、装置、终端及存储介质
CN112330574B (zh) 人像修复方法、装置、电子设备及计算机存储介质
CN111598776B (zh) 图像处理方法、图像处理装置、存储介质与电子设备
CN110570356B (zh) 图像处理方法和装置、电子设备及存储介质
CN109886871A (zh) 基于通道注意力机制和多层特征融合的图像超分辨率方法
Xu et al. Dense bynet: Residual dense network for image super resolution
CN110148085A (zh) 人脸图像超分辨率重建方法及计算机可读取的存储介质
CN106663314A (zh) 实时皮肤平滑图像增强滤波器
CN111402128A (zh) 一种基于多尺度金字塔网络的图像超分辨率重建方法
CN112561792B (zh) 图像风格迁移方法、装置、电子设备及存储介质
WO2023284401A1 (zh) 图像美颜处理方法、装置、存储介质与电子设备
CN112700460B (zh) 图像分割方法及***
CN113327199B (zh) 一种多帧图像重建方法、***及设备
CN110428382A (zh) 一种用于移动终端的高效视频增强方法、装置和存储介质
CN111510739A (zh) 一种视频传输方法及装置
CN111429371A (zh) 图像处理方法、装置及终端设备
WO2022213716A1 (zh) 图像格式转换方法、装置、设备、存储介质及程序产品
CN105719321A (zh) 一种压缩纹理的方法及装置
CN104537610A (zh) 基于稀疏表示和uv通道处理的图像超分辨率重建方法
Li et al. RGSR: A two-step lossy JPG image super-resolution based on noise reduction
WO2023279920A1 (zh) 基于显微镜的超分辨率方法、装置、设备及介质
CN114240750A (zh) 视频分辨率提升方法及装置、存储介质及电子设备
CN114463453A (zh) 图像重建、编码解码方法、相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant