CN110648294B - 图像修复方法、装置及电子设备 - Google Patents
图像修复方法、装置及电子设备 Download PDFInfo
- Publication number
- CN110648294B CN110648294B CN201910891324.1A CN201910891324A CN110648294B CN 110648294 B CN110648294 B CN 110648294B CN 201910891324 A CN201910891324 A CN 201910891324A CN 110648294 B CN110648294 B CN 110648294B
- Authority
- CN
- China
- Prior art keywords
- image
- neural network
- layer
- decoding
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 95
- 238000013528 artificial neural network Methods 0.000 claims abstract description 44
- 238000010606 normalization Methods 0.000 claims description 28
- 238000012549 training Methods 0.000 claims description 20
- 230000015654 memory Effects 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 description 19
- 230000008569 process Effects 0.000 description 11
- 230000002950 deficient Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000007547 defect Effects 0.000 description 5
- 230000008439 repair process Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/77—Retouching; Inpainting; Scratch removal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本申请公开了一种图像修复方法及装置,涉及计算机领域,尤其涉及图像修复技术。具体实现方案为:将待修复图像输入第一卷积神经网络进行编码,获得第一高维隐层向量;将所述第一高维隐层向量和所述待修复图像的内容类别输入所述第一卷积神经网络进行解码,获得修复图像。本申请实施例能够提高图像修复的准确性。
Description
技术领域
本申请涉及计算机领域,尤其涉及图像修复领域,提供一种图像修复方法、装置及电子设备。
背景技术
图像修复是一种在缺块的图片中合成语义正确、看起来真实的内容的技术。图像修复技术应用广泛,常常可用于去除图片中不需要的物体、修复图像中受损的部分。
随着计算机技术的发展,图像修复在各个领域的需求也越来越多,然而目前的图像修复技术,修复效果有限,常常难以满足用户对图像修复效果的需求。
发明内容
为了解决现有技术中的至少一个问题,本申请实施例提供一种图像修复方法及装置。
第一方面,本申请实施例提供一种图像修复方法,包括:
将待修复图像输入第一卷积神经网络进行编码,获得第一高维隐层向量;
将所述第一高维隐层向量和所述待修复图像的内容类别输入所述第一卷积神经网络进行解码,获得修复图像。
在本申请实施例中,在第一神经网络进行解码时,添加待修复图像的内容类别信息,从而第一神经网络能够结合待修复图像的内容类别对第一高维隐层向量进行解码,改善图像修复效果。尤其在处理待修复图像的缺损部分较大的情况时,根据图像类别对图像进行修复,能够提高图像修复效果。
在一种实施方式中,将待修复图像输入第一卷积神经网络进行编码,获得第一高维隐层向量之前,还包括:
将用于训练的样本图像输入第二卷积神经网络进行编码,获得第二高维隐层向量;
将所述第二高维隐层向量和所述样本图像的内容类别输入所述第二卷积神经网络进行解码,获得修复样本图像;
将修复样本图像和所述样本图像的内容类别输入判别器网络,获得损失值;
根据所述损失值对所述第二卷积神经网络进行优化,获得所述第一卷积神经网络。
在本申请实施例中,对第二卷积神经网络进行训练时,采用待修复图像的内容类别和编码生成的高维隐层向量进行解码,使得解码过程能够参考内容类别执行,从而训练后得到的第一卷积神经网络能够根据对待修复图像编码生成的高维隐层向量和内容类别进行解码,生成修复后的图像,在图像缺损程度较大时,尤其能够提高图像修复效果。
在一种实施方式中,将待修复图像输入第一卷积神经网络进行编码,获得第一高维隐层向量,包括:
在目标编码层对目标图像掩模进行部分卷积操作,得到第一结果;
在所述目标编码层对所述第一结果进行批量归一化操作,得到第二结果;
其中,当所述目标编码层为所述第一卷积神经网络的第一个编码层时,所述目标图像掩膜为所述待修复图像的图像掩膜;当所述目标编码层为所述第一卷积神经网络的第一个编码层之后的编码层时,所述目标图像掩膜为上一个编码层作为目标编码层时的第二结果;所述第一高维隐层向量包括所述第一结果和所述第二结果。
在本申请实施例中,通过对待修复图像进行部分卷积操作和批量归一化操作,能够得到待修复图像的高维隐层向量,进而能够在操作过程中减少缺损像素的个数,最终达到图像修复的目的。
在一种实施方式中,将所述第一高维隐层向量和所述待修复图像的图像内容类别输入所述第一卷积神经网络进行解码,获得修复图像,包括:
对目标解码层上一解码层的第三结果、所述目标解码层对应的编码层的第一结果、所述待修复图像的内容类型进行批量归一化操作,得到第四结果;
对所述第四结果进行上采样和部分卷积操作,得到所述目标解码层的第三结果;
其中,所述目标解码层为所述第一卷积神经网络的第n个解码层,n大于0,目标解码层对应的编码层为第m-n+1个编码层,所述m为解码层的层数。
在本申请实施例中,对第一高维隐层向量和内容类别依次进行批量归一化操作、上采样和部分卷积操作,能够每一层操作过程中减少缺损像素的个数,最终实现图像修复的效果。
在一种实施方式中,所述第一卷积神经网络为U-Net卷积神经网络。
采用U-Net卷积神经网络对图像进行修复,模型能够在训练过程中学习到图像中的语义信息,对于结构化较强的图像,如人脸、场景、物体等内容类别的图像的修复,能够取得较好的效果。
第二方面,本申请实施例提供一种图像修复装置,包括:
编码模块:用于将待修复图像输入第一卷积神经网络进行编码,获得第一高维隐层向量;
解码模块:用于将所述第一高维隐层向量和所述待修复图像的内容类别输入所述第一卷积神经网络进行解码,获得修复图像。
在一种实施方式中,所述装置还包括:
编码训练模块:用于将用于训练的样本图像输入第二卷积神经网络进行编码,获得第二高维隐层向量;
解码训练模块:用于将所述第二高维隐层向量和所述第一图像的内容类别输入所述第二卷积神经网络进行解码,获得修复样本图像;
损失值模块:用于将修复样本图像和所述样本图像的内容类别输入判别器网络,获得损失值;
优化模块:用于根据所述损失值对所述第二卷积神经网络进行优化,获得所述第一卷积神经网络。
在一种实施方式中,所述编码模块包括:
第一操作单元:用于在目标编码层对目标图像掩模进行部分卷积操作,得到第一结果;
第二操作单元:用于在所述目标编码层对所述第一结果进行批量归一化操作,得到第二结果;
其中,当所述目标编码层为所述第一卷积神经网络的第一个编码层时,所述目标图像掩膜为所述待修复图像的图像掩膜;当所述目标编码层为所述第一卷积神经网络的第一个编码层之后的编码层时,所述目标图像掩膜为上一个编码层作为目标编码层时的第二结果;所述第一高维隐层向量包括所述第一结果和所述第二结果。
在一种实施方式中,所述解码模块包括:
第三操作单元:用于对目标解码层上一解码层的第三结果、所述目标解码层对应的编码层的第一结果、所述待修复图像的内容类型进行批量归一化操作,得到第四结果;
第四操作单元:用于对所述第四结果进行上采样和部分卷积操作,得到目标解码层的第三结果;
其中,所述目标解码层为所述第一卷积神经网络的第n个解码层,n大于0,所述目标解码层对应的编码层为第m-n+1个编码层,所述m为解码层的层数。
在一种实施方式中,所述第一卷积神经网络为U-Net卷积神经网络。
上述申请中的一个实施例具有如下优点或有益效果:能够提高图像修复效果,尤其针对图像缺损程度较大的情况下,能够取得更好的修复效果。因为采用将图像的内容类别作为图像修复的输入信息的技术手段,所以克服了修复图像时缺少指导信息技术问题,进而达到提高图像修复效果的技术效果。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例的图像修复方法示意图;
图2是根据本申请第二实施例的图像修复方法示意图;
图3是根据本申请第三实施例的图像修复装置示意图;
图4是根据本申请第四实施例的图像修复装置示意图;
图5是根据本申请第五实施例的卷积神经网络架构示意图;
图6是根据本申请第六实施例的卷积神经网络架构示意图;
图7是用来实现本申请实施例的图像修复方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本申请实施例提供一种图像修复方法,如图1所示,包括:
步骤S11:将待修复图像输入第一卷积神经网络进行编码,获得第一高维隐层向量。
步骤S12:将第一高维隐层向量和待修复图像的内容类别输入第一卷积神经网络进行解码,获得修复图像。
在本申请实施例中,在第一神经网络进行解码时,添加待修复图像的内容类别信息,从而第一神经网络能够结合待修复图像的内容类别对第一高维隐层向量进行解码,改善图像修复效果。尤其在处理待修复图像的缺损部分较大的情况时,根据图像类别对图像进行修复,能够提高图像修复效果。
在本申请实施例中,待修复图像的内容类别,可以包括待修复图像的内容所属的种类,例如,待修复图像的内容类别为风景、待修复图像的内容类别为动物等。将待修复的图像的内容类别作为解码时的输入信息,能够对图像修复起到指导作用,尤其是在待修复图像具有较大缺损的情况下,具有更好的图像修复效果。
在本申请实施例中,将待修复图像输入第一卷积神经网络进行编码,可以包括将待修复图像输入第一卷积神经网络的编码层进行编码。将第一高维隐层向量输入第一卷积神经网络进行解码,可以包括将第一高维隐层向量输入第一卷积神经网络的解码层进行解码。将待修复图像输入第一卷积神经网络进行编码,获得第一高维隐层向量,可以包括将待修复图像输入第一卷积神经网络的每个编码层进行编码,从每个编码层输出第一高维隐层向量。将第一高维隐层向量和待修复图像的内容类别输入第一卷积神经网络进行解码,可以包括将第一卷积神经网络每个编码层输出的第一高维隐层向量和待修复图像的内容类别输入第一卷积神经网络相应的解码层。
在本申请实施例中,第一卷积神经网络的编码层和第一神经网络的解码层之间可以存在对应关系。按照数据的传输顺序,第一编码层对应最后一个解码层,第n个编码层对应第m-n+1个解码层,m为解码层的层数。大多数情况下,n可以为正整数。编码层的总层数可以等于解码层。
在一种实施方式中,如图2所示,将待修复图像输入第一卷积神经网络进行编码,获得第一高维隐层向量之前,还包括:
步骤S21:将用于训练的样本图像输入第二卷积神经网络进行编码,获得第二高维隐层向量。
步骤S22:将第二高维隐层向量和样本图像的内容类别输入第二卷积神经网络进行解码,获得修复样本图像。
步骤S23:将修复样本图像和样本图像的内容类别输入判别器网络,获得损失值。
步骤S24:根据损失值对第二卷积神经网络进行优化,获得第一卷积神经网络。
在本申请实施例中,对第二卷积神经网络进行训练时,采用待修复图像的内容类别和编码生成的高维隐层向量进行解码,使得解码过程能够参考内容类别执行,从而训练后得到的第一卷积神经网络能够根据对待修复图像编码生成的高维隐层向量和内容类别进行解码,生成修复后的图像,在图像缺损程度较大时,尤其能够提高图像修复效果。
在本申请实施例中,参考完整图像可以为用于训练的样本图像的原始的、没有缺损的图像。修复样本图像可以理解为图像修复阶段对样本图像进行修复得到的图像。
在本申请实施例中,判别器网络可以为生成式对抗网络的判别器。
在一种实施方式中,将待修复图像输入第一卷积神经网络进行编码,获得第一高维隐层向量,包括:
在目标编码层对目标图像掩模进行部分卷积操作,得到第一结果;
在目标编码层对第一结果进行批量归一化操作,得到第二结果;
其中,当目标编码层为第一卷积神经网络的第一个编码层时,目标图像掩膜为待修复图像的图像掩膜;当目标编码层为第一卷积神经网络的第一个编码层之后的编码层时,目标图像掩膜为上一个编码层作为目标编码层时的第二结果;第一高维隐层向量包括第一结果和第二结果。
在本申请实施例中,通过对待修复图像进行部分卷积操作和批量归一化操作,能够得到待修复图像的高维隐层向量,能够在操作过程中减少缺损像素的个数,最终实现图像修复的效果。
在本申请实施例中,卷积神经网络中包括多个编码层,按照数据传输的方向,待修复图像依次输入第一个编码层、第二个编码层……直到最后一个编码层。在每个编码层中,对待处理的图像数据进行部分卷积操作和批量归一化操作,部分卷积操作的结果一方面输出到编码层的下一个操作单元进行批量归一化操作,另一方面还要输出到对应的解码层。当待修复图像输入卷积神经网络的第一个编码层时,第一个编码层作为目标编码层,对待修复图像的图像掩膜进行部分卷积操作,得到的高维隐层向量为第一结果,第一结果一方面发送到最后一个解码层,另一方面在编码层中进行批量归一化操作处理,得到的高维隐层向量作为第二结果,输出给第二个编码层。第二个编码层作为目标编码层,对第一编码层输出的第二结果对应的图像掩膜进行部分卷积操作,得到第二个编码层的第一结果,一方面输出给第m-1个解码层,另一方面在第二编码层中进行批量归一化操作,得到第二个编码层的第二结构。……如此类推,直到最后一个编码层。其中,m为解码层的数量。m也可以为编码层的数量。
在本申请实施例中,将用于训练的样本图像输入第二卷积神经网络进行编码的过程,与获得第一高维隐层向量的过程类似。
在一种实施方式中,将第一高维隐层向量和待修复图像的图像内容类别输入第一卷积神经网络进行解码,获得修复图像,包括:
对目标解码层上一解码层的第三结果、目标解码层对应的编码层的第一结果、待修复图像的内容类型进行批量归一化操作,得到第四结果;
对第四结果进行上采样和部分卷积操作,得到目标解码层的第三结果;
其中,目标解码层为第一卷积神经网络的第n个解码层,对应编码层为第m-n+1个编码层,m为解码层的层数。
在本申请实施例中,对第一高维隐层向量和内容类别依次进行批量归一化操作、上采样和部分卷积操作,能够在每一层操作过程中减少缺损像素的个数,最终实现图像修复的效果。
在本申请实施例中,按照数据传输方向排序,当目标解码层为第一卷积神经网络的第一个解码层时,由于目标解码层此时不存在上一解码层,因此不存在目标解码层上一解码层的第三结果。且这种情况下目标解码层对应的编码层为第m个编码层,即最后一个编码层。将最后一个编码层输出的第一结果、待修复图像的内容类型进行批量归一化操作,得到第四结果。然后对第四结果进行上采样和部分卷积操作,得到第一个解码层的第三结果。
对于第二个解码层,与之对应的编码层为第m-1个编码层。将第一个解码层的第三结果、目标解码层对应的编码层的第一结果、待修复图像的内容类型在第二个解码层中进行批量归一化操作,得到第四结果。继续对第四结果进行上采样和部分卷积操作,得到第m-1个编码层的第三结果。
按照上述操作依次类推,直到最后一个解码层。根据最后一个解码层的第三结果得到修复的图像。
在本申请实施例中,编码层的层数与解码层的层数相等。
在一种实施方式中,m为7。
经过多次测试,当编码层的层数和解码层的层数分别为7时,能够取得相对更好的图像修复效果。
在一种实施方式中,第一卷积神经网络为U-Net卷积神经网络;第二卷积神经网络为U-Net卷积神经网络。
采用U-Net卷积神经网络对图像进行修复,模型能够在训练过程中学习到图像中的语义信息,对于结构化较强的图像,如人脸、场景、物体等内容类别的图像的修复,能够取得较好的效果。
本申请实施例还提供一种图像修复装置,如图3所示,包括:
编码模块31:用于将待修复图像输入第一卷积神经网络进行编码,获得第一高维隐层向量;
解码模块32:用于将第一高维隐层向量和待修复图像的内容类别输入第一卷积神经网络进行解码,获得修复图像。
在一种实施方式中,如图4所示,装置还包括:
编码训练模块41:用于将用于训练的样本图像输入第二卷积神经网络进行编码,获得第二高维隐层向量;
解码训练模块42:用于将第二高维隐层向量和第一图像的内容类别输入第二卷积神经网络进行解码,获得修复样本图像;
损失值模块43:用于将修复样本图像和样本图像的参考完整图像输入判别器网络,获得损失值;
优化模块44:用于根据损失值对第二卷积神经网络进行优化,获得第一卷积神经网络。
在一种实施方式中,编码模块包括:
第一操作单元:用于在目标编码层对目标图像掩模进行部分卷积操作,得到第一结果;
第二操作单元:用于在目标编码层对第一结果进行批量归一化操作,得到第二结果;
其中,当目标编码层为第一卷积神经网络的第一个编码层时,目标图像掩膜为待修复图像的图像掩膜;当目标编码层为第一卷积神经网络的第一个编码层之后的编码层时,目标图像掩膜为上一个编码层作为目标编码层时的第二结果;当目标编码层为第一卷积神经网络的最后一个编码层时,第二结果为第一高维隐层向量。
在一种实施方式中,解码模块包括:
第三操作单元:用于对目标解码层上一解码层的第三结果、目标解码层对应的编码层的第一结果、待修复图像的内容类型进行批量归一化操作,得到第四结果;
第四操作单元:用于对第四结果进行上采样和部分卷积操作,得到目标解码层的第三结果;
其中,目标解码层为第一卷积神经网络的第n个解码层,对应编码层为第m-n+1个编码层,m为解码层的层数。
在一种实施方式中,m为7。
在一种实施方式中,第一卷积神经网络为U-Net卷积神经网络;第二卷积神经网络为U-Net卷积神经网络。
本申请一种示例所提供的基于GANs(Generative Adversarial Nets,生成式对抗网络)U-Net卷积神经网络结构如图5所示,从U-Net卷积神经网络的输入端输入缺损的待修复图像,待修复图像的图像(Imag)掩膜(Mask)在每一个编码层分别经过部分卷积操作(Pconv,Partial Convolutions)和批量归一化(bn,batch normalization)操作,输出第一高维隐层向量。在解码阶段,将对应的编码层输出的第一高维隐层向量、上一层解码层输出的高维隐层向量、待修复图像的内容类别进行批量归一化操作,对得到的图像掩膜进行上采样(Up)和部分卷积操作,得到新的高维隐层向量,输入下一个解码层,当解码层为U-Net卷积神经网络的最后一个解码层时,由最后一个解码层最终批量归一化操作输出的高维隐层向量为修复后的图像。
本申请另一种示例提供的U-Net卷积神经网络训练阶段的架构如图6所示。在训练阶段,将样本图像输入U-Net卷积神经网络的编码层进行编码,得到的第二高维隐层向量相应输入解码层。操作方式与处理待修复图像类似,最终得到修复后的图像,将修复后的图像和样本图像的内容类别一起输入判别器网络D,判断真假(Real/Fake)得到生成对抗loss(损失)。在图5、图6中,数据传输方向为从输入端依次进行多次部分卷积操作和批量归一化操作,得到编码结果,然后对编码结果依次进行多次上采样和部分卷积操作(Up&Pconv)操作和批量归一化操作,最后到输出端。按照数据传输的顺序,数据依次从输入端的第一个编码层到最后一个编码层,在从第一个解码层到输出端的最后一个解码层。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图7所示,是根据本申请实施例的图像修复方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,该电子设备包括:一个或多个处理器701、存储器702,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示图形用户界面(Graphical User Interface,GUI)的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器***)。图7中以一个处理器701为例。
存储器702即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的图像修复方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的图像修复方法。
存储器702作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的图像修复方法对应的程序指令/模块(例如,附图3所示的编码模块31、解码模块32)。处理器701通过运行存储在存储器702中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的图像修复方法。
存储器702可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据图像修复电子设备的使用所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器702可选包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至图像修复电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
图像修复方法的电子设备还可以包括:输入装置703和输出装置704。处理器701、存储器702、输入装置703和输出装置704可以通过总线或者其他方式连接,图7中以通过总线连接为例。
输入装置703可接收输入的数字或字符信息,以及产生与图像修复电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(Liquid Crystal Display,LCD)、发光二极管(Light Emitting Diode,LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、专用集成电路(Application Specific Integrated Circuits,ASIC)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(programmable logic device,PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(Cathode Ray Tube,阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,在第一神经网络进行解码时,添加待修复图像的内容类别信息,从而第一神经网络能够结合待修复图像的内容类别对第一高维隐层向量进行解码,改善图像修复效果。尤其在处理待修复图像的缺损部分较大的情况时,根据图像类别对图像进行修复,能够提高图像修复效果。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (10)
1.一种图像修复方法,其特征在于,包括:
将待修复图像输入第一卷积神经网络进行编码,获得第一高维隐层向量;
将所述第一高维隐层向量和所述待修复图像的内容类别输入所述第一卷积神经网络进行解码,获得修复图像;
将待修复图像输入第一卷积神经网络进行编码,获得第一高维隐层向量,包括:
在目标编码层对目标图像掩模进行部分卷积操作,得到第一结果;
在所述目标编码层对所述第一结果进行批量归一化操作,得到第二结果;
其中,当所述目标编码层为所述第一卷积神经网络的第一个编码层时,所述目标图像掩膜为所述待修复图像的图像掩膜;当所述目标编码层为所述第一卷积神经网络的第一个编码层之后的编码层时,所述目标图像掩膜为上一个编码层作为目标编码层时的第二结果;所述第一高维隐层向量包括所述第一结果和所述第二结果。
2.根据权利要求1所述的方法,其特征在于,将待修复图像输入第一卷积神经网络进行编码,获得第一高维隐层向量之前,还包括:
将用于训练的样本图像输入第二卷积神经网络进行编码,获得第二高维隐层向量;
将所述第二高维隐层向量和所述样本图像的内容类别输入所述第二卷积神经网络进行解码,获得修复样本图像;
将所述修复样本图像和所述样本图像的内容类别输入判别器网络,获得损失值;
根据所述损失值对所述第二卷积神经网络进行优化,获得所述第一卷积神经网络。
3.根据权利要求1所述的方法,其特征在于,将所述第一高维隐层向量和所述待修复图像的图像内容类别输入所述第一卷积神经网络进行解码,获得修复图像,包括:
对目标解码层上一解码层的第三结果、所述目标解码层对应的编码层的第一结果、所述待修复图像的内容类型进行批量归一化操作,得到第四结果;
对所述第四结果进行上采样和部分卷积操作,得到所述目标解码层的第三结果;
其中,所述目标解码层为所述第一卷积神经网络的第n个解码层,n大于0,所述与目标解码层对应的编码层为第m-n+1个编码层,所述m为解码层的层数。
4.根据权利要求1-3中任意一项所述的方法,其特征在于,所述第一卷积神经网络为U-Net卷积神经网络。
5.一种图像修复装置,其特征在于,包括:
编码模块:用于将待修复图像输入第一卷积神经网络进行编码,获得第一高维隐层向量;
解码模块:用于将所述第一高维隐层向量和所述待修复图像的内容类别输入所述第一卷积神经网络进行解码,获得修复图像;
所述编码模块包括:
第一操作单元:用于在目标编码层对目标图像掩模进行部分卷积操作,得到第一结果;
第二操作单元:用于在所述目标编码层对所述第一结果进行批量归一化操作,得到第二结果;
其中,当所述目标编码层为所述第一卷积神经网络的第一个编码层时,所述目标图像掩膜为所述待修复图像的图像掩膜;当所述目标编码层为所述第一卷积神经网络的第一个编码层之后的编码层时,所述目标图像掩膜为上一个编码层作为目标编码层时的第二结果;所述第一高维隐层向量包括所述第一结果和所述第二结果。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
编码训练模块:用于将用于训练的样本图像输入第二卷积神经网络进行编码,获得第二高维隐层向量;
解码训练模块:用于将所述第二高维隐层向量和所述样本图像的内容类别输入所述第二卷积神经网络进行解码,获得修复样本图像;
损失值模块:用于将修复样本图像和所述样本图像的内容类别输入判别器网络,获得损失值;
优化模块:用于根据所述损失值对所述第二卷积神经网络进行优化,获得所述第一卷积神经网络。
7.根据权利要求5所述的装置,其特征在于,所述解码模块包括:
第三操作单元:用于对目标解码层上一解码层的第三结果、所述目标解码层对应的编码层的第一结果、所述待修复图像的内容类型进行批量归一化操作,得到第四结果;
第四操作单元:用于对所述第四结果进行上采样和部分卷积操作,得到目标解码层的第三结果;
其中,所述目标解码层为所述第一卷积神经网络的第n个解码层,n大于0,所述目标解码层对应的编码层为第m-n+1个编码层,所述m为解码层的层数。
8.根据权利要求5-7中任意一项所述的装置,其特征在于,所述第一卷积神经网络为U-Net卷积神经网络。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-4中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910891324.1A CN110648294B (zh) | 2019-09-19 | 2019-09-19 | 图像修复方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910891324.1A CN110648294B (zh) | 2019-09-19 | 2019-09-19 | 图像修复方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110648294A CN110648294A (zh) | 2020-01-03 |
CN110648294B true CN110648294B (zh) | 2022-08-30 |
Family
ID=68992194
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910891324.1A Active CN110648294B (zh) | 2019-09-19 | 2019-09-19 | 图像修复方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110648294B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111275784B (zh) * | 2020-01-20 | 2023-06-13 | 北京百度网讯科技有限公司 | 生成图像的方法和装置 |
CN111260545B (zh) * | 2020-01-20 | 2023-06-20 | 北京百度网讯科技有限公司 | 生成图像的方法和装置 |
CN111242874B (zh) * | 2020-02-11 | 2023-08-29 | 北京百度网讯科技有限公司 | 图像修复的方法、装置、电子设备和存储介质 |
CN111754445B (zh) * | 2020-06-02 | 2022-03-18 | 国网湖北省电力有限公司宜昌供电公司 | 隐藏信息的光纤标签的编码解码方法及*** |
CN111754439B (zh) * | 2020-06-28 | 2024-01-12 | 北京百度网讯科技有限公司 | 图像处理的方法、装置、设备以及存储介质 |
CN112967196A (zh) * | 2021-03-05 | 2021-06-15 | 北京百度网讯科技有限公司 | 图像修复方法及装置、电子设备和介质 |
CN113177892A (zh) * | 2021-04-29 | 2021-07-27 | 北京百度网讯科技有限公司 | 生成图像修复模型的方法、设备、介质及程序产品 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108876864A (zh) * | 2017-11-03 | 2018-11-23 | 北京旷视科技有限公司 | 图像编码、解码方法、装置、电子设备及计算机可读介质 |
CN109785258A (zh) * | 2019-01-10 | 2019-05-21 | 华南理工大学 | 一种基于多判别器生成对抗网络的人脸图像修复方法 |
CN109949222A (zh) * | 2019-01-30 | 2019-06-28 | 北京交通大学 | 基于语义图的图像超分辨率重建方法 |
CN109961030A (zh) * | 2019-03-18 | 2019-07-02 | 北京邮电大学 | 路面修补信息检测方法、装置、设备及存储介质 |
CN110062125A (zh) * | 2019-04-18 | 2019-07-26 | 西安万像电子科技有限公司 | 图像传输方法及装置 |
CN110175251A (zh) * | 2019-05-25 | 2019-08-27 | 西安电子科技大学 | 基于语义对抗网络的零样本草图检索方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160035944A (ko) * | 2014-09-24 | 2016-04-01 | 삼성전자주식회사 | 신호 수신 장치 및 그 제어 방법 |
-
2019
- 2019-09-19 CN CN201910891324.1A patent/CN110648294B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108876864A (zh) * | 2017-11-03 | 2018-11-23 | 北京旷视科技有限公司 | 图像编码、解码方法、装置、电子设备及计算机可读介质 |
CN109785258A (zh) * | 2019-01-10 | 2019-05-21 | 华南理工大学 | 一种基于多判别器生成对抗网络的人脸图像修复方法 |
CN109949222A (zh) * | 2019-01-30 | 2019-06-28 | 北京交通大学 | 基于语义图的图像超分辨率重建方法 |
CN109961030A (zh) * | 2019-03-18 | 2019-07-02 | 北京邮电大学 | 路面修补信息检测方法、装置、设备及存储介质 |
CN110062125A (zh) * | 2019-04-18 | 2019-07-26 | 西安万像电子科技有限公司 | 图像传输方法及装置 |
CN110175251A (zh) * | 2019-05-25 | 2019-08-27 | 西安电子科技大学 | 基于语义对抗网络的零样本草图检索方法 |
Non-Patent Citations (1)
Title |
---|
基于对抗训练和卷积神经网络的面部图像修复;刘昱等;《计算机工程与应用》;20181101;第55卷(第2期);第110-115页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110648294A (zh) | 2020-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110648294B (zh) | 图像修复方法、装置及电子设备 | |
US11710215B2 (en) | Face super-resolution realization method and apparatus, electronic device and storage medium | |
CN110648293B (zh) | 图像修复方法、装置及电子设备 | |
JP7235817B2 (ja) | 機械翻訳モデルのトレーニング方法、装置及び電子機器 | |
CN112001180A (zh) | 多模态预训练模型获取方法、装置、电子设备及存储介质 | |
CN111242874B (zh) | 图像修复的方法、装置、电子设备和存储介质 | |
CN111225236B (zh) | 生成视频封面的方法、装置、电子设备以及计算机可读存储介质 | |
CN110767212B (zh) | 一种语音处理方法、装置和电子设备 | |
CN113870399B (zh) | 表情驱动方法、装置、电子设备及存储介质 | |
CN112308051B (zh) | 文本框检测方法、装置、电子设备和计算机存储介质 | |
CN111832701A (zh) | 模型的蒸馏方法、装置、电子设备及存储介质 | |
CN111241838B (zh) | 文本实体的语义关系处理方法、装置及设备 | |
CN112560499B (zh) | 语义表示模型的预训练方法、装置、电子设备及存储介质 | |
CN114863437B (zh) | 文本识别方法、装置、电子设备和存储介质 | |
CN112528669A (zh) | 多语言模型的训练方法、装置、电子设备和可读存储介质 | |
CN110807331A (zh) | 一种多音字读音预测方法、装置和电子设备 | |
US20210201448A1 (en) | Image filling method and apparatus, device, and storage medium | |
CN112149741A (zh) | 图像识别模型的训练方法、装置、电子设备及存储介质 | |
CN111694889A (zh) | 数据处理方法、装置、电子设备及可读存储介质 | |
US20210312240A1 (en) | Header Model For Instance Segmentation, Instance Segmentation Model, Image Segmentation Method and Apparatus | |
CN112232089B (zh) | 语义表示模型的预训练方法、设备和存储介质 | |
CN111784799B (zh) | 图像填充方法、装置、设备及存储介质 | |
CN111767832B (zh) | 模型生成方法、装置、电子设备及存储介质 | |
CN112529161A (zh) | 生成对抗网络训练方法、生成对抗网络、人脸图像翻译方法和装置 | |
CN111753759A (zh) | 模型生成方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |