CN113112536A - 图像处理模型训练方法、图像处理方法及装置 - Google Patents

图像处理模型训练方法、图像处理方法及装置 Download PDF

Info

Publication number
CN113112536A
CN113112536A CN202110294804.7A CN202110294804A CN113112536A CN 113112536 A CN113112536 A CN 113112536A CN 202110294804 A CN202110294804 A CN 202110294804A CN 113112536 A CN113112536 A CN 113112536A
Authority
CN
China
Prior art keywords
image
neural network
image processing
model
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110294804.7A
Other languages
English (en)
Inventor
张雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202110294804.7A priority Critical patent/CN113112536A/zh
Publication of CN113112536A publication Critical patent/CN113112536A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及图像处理技术领域,公开了一种图像处理模型训练方法、图像处理方法及装置。图像处理模型训练方法包括:首先获取样本图像,并对样本图像中的皮肤纹理处理得到参考图像,然后将样本图像输入神经网络模型得到指定神经网络层输出的特征图,通过将特征图和噪声叠加图进行叠加处理的目标特征图输入至下一神经网络层继续处理,得到神经网络模型对样本图像的预测图像,最后利用预测图像和参考图像之间的损失值对神经网络模型进行训练,得到图像处理模型。从而可以实现利用图像处理模型自适应提升待处理图像的皮肤质感。

Description

图像处理模型训练方法、图像处理方法及装置
技术领域
本申请涉及图像处理技术领域,尤其涉及一种图像处理模型训练方法、图像处理方法及装置。
背景技术
获取图像的设备不同,得到的图像质量也就不同,针对需要得到较好的皮肤质感效果的图像的情况,需要对获取到的图像进一步处理。
现有技术中,可以从皮肤噪声素材中获取到皮肤噪声,然后将皮肤噪声添加至图像,用来提升图像中的皮肤质感;或者通过后处理算法生成皮肤噪声,利用生成的皮肤噪声对图像进行皮肤质感的提升,但是皮肤噪声素材有限,不能适应不同场景中皮肤质感提升的需要;而且通过后处理算法生成皮肤噪声后,还需要设计适配不同场景的噪声逻辑,导致不同场景下图像不能自适应提升皮肤质感。
发明内容
本申请实施例提供一种图像处理模型训练方法、图像处理方法及装置,从而可以实现利用图像处理模型自适应提升待处理图像的皮肤质感。
第一方面,本申请一实施例提供了一种图像处理模型训练方法,包括:
获取样本图像;
对所述样本图像中的皮肤纹理进行处理,得到参考图像;
将所述样本图像输入神经网络模型,得到所述神经网络模型中指定神经网络层输出的特征图;
将所述特征图与噪声特征图进行叠加处理,得到目标特征图;
将所述目标特征图作为所述指定神经网络层的输出结果,输入给下一神经网络层继续处理,得到所述神经网络模型对所述样本图像的预测图像;
根据所述预测图像与所述参考图像之间的差异,得到损失值;
基于所述损失值对所述神经网络模型进行训练,得到图像处理模型。
可选的,所述神经网络模型中包括至少一个所述指定神经网络层,各所述指定神经网络层均在所述神经网络模型的最后一层卷积层之前。
可选的,所述将所述特征图与噪声特征图进行叠加处理,得到目标特征图之前,所述方法还包括:
随机生成一个与所述特征图相同尺寸的所述噪声特征图。
可选的,当存在一个所述指定神经网络层时,所述指定神经网络层为所述神经网络模型中最后一个卷积层的前一个神经网络层。
可选的,所述样本图像是从样本图像集合中获取的,所述样本图像集合中包括不同拍摄条件下采集的图像。
可选的,所述将所述特征图与噪声特征图进行叠加处理,得到目标特征图,包括:
将所述特征图和所述噪声特征图中同一像素位置的特征值进行加权求和处理,得到所述目标特征图。
第二方面,本申请一实施例提供了一种图像处理方法,包括:
获取待处理图像;
将所述待处理图像输入预先训练好的图像处理模型对所述待处理图像的皮肤纹理进行处理,得到添加皮肤噪声的所述待处理图像的优化图像;
其中,所述图像处理模型是根据第一方面中任一所述的方法训练得到的。
第三方面,本申请一实施例提供了一种图像处理模型训练装置,包括:
第一获取单元,被配置为执行获取样本图像;
第一处理单元,被配置为执行对所述样本图像中的皮肤纹理进行处理,得到参考图像;
输出单元,被配置为执行将所述样本图像输入神经网络模型,得到所述神经网络模型中指定神经网络层输出的特征图;
叠加处理单元,被配置为执行将所述特征图与噪声特征图进行叠加处理,得到目标特征图;
预测单元,被配置为执行将所述目标特征图作为所述指定神经网络层的输出结果,输入给下一神经网络层继续处理,得到所述神经网络模型对所述样本图像的预测图像;
计算单元,被配置为执行根据所述预测图像与所述参考图像之间的差异,得到损失值;
训练单元,被配置为执行基于所述损失值对所述神经网络模型进行训练,得到图像处理模型。
可选的,所述神经网络模型中包括至少一个所述指定神经网络层,各所述指定神经网络层均在所述神经网络模型的最后一层卷积层之前。
可选的,所述叠加处理单元还被配置为执行:
随机生成一个与所述特征图相同尺寸的所述噪声特征图。
可选的,当存在一个所述指定神经网络层时,所述指定神经网络层为所述神经网络模型中最后一个卷积层的前一个神经网络层。
可选的,所述样本图像是从样本图像集合中获取的,所述样本图像集合中包括不同拍摄条件下采集的图像。
可选的,所述叠加处理单元,被配置为执行:
将所述特征图和所述噪声特征图中同一像素位置的特征值进行加权求和处理,得到所述目标特征图。
第四方面,本申请一实施例提供了一种图像处理装置,包括:
第二获取单元,被配置为执行获取待处理图像;
第二处理单元,被配置为执行将所述待处理图像输入预先训练好的图像处理模型对所述待处理图像的皮肤纹理进行处理,得到添加皮肤噪声的所述待处理图像的优化图像;
其中,所述图像处理模型是根据第一方面中任一所述的图像处理模型训练方法训练得到的。
第五方面,本申请一实施例还提供了一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如本申请第一方面中提供的任一方法,或者本申请第二方面中提供的任一方法。
第六方面,本申请一实施例还提供了一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如本申请第一方面中提供的任一方法,或者本申请第二方面中提供的任一方法。
第七方面,本申请一实施例提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如本申请第一方面中提供的任一方法,或者本申请第二方面中提供的任一方法。
本申请的实施例提供的技术方案至少带来以下有益效果:
本申请提出了一种图像处理模型训练方法,首先获取样本图像,并对样本图像中的皮肤纹理处理得到参考图像,然后将样本图像输入神经网络模型得到指定神经网络层输出的特征图,通过将特征图和噪声叠加图进行叠加处理的目标特征图输入至下一神经网络层,得到神经网络模型对样本图像的预测图像,最后利用预测图像和参考图像之间的损失值对神经网络模型进行训练,得到图像处理模型。本申请中对样本图像预先经过相关方法提升图像质量,故此得到可以训练神经网络模型的样本图像,然后在训练过程中通过叠加噪声图能够提高神经网络模型对不同拍摄情况下的图像的泛化能力,从而可以实现利用图像处理模型自适应提升待处理图像的皮肤质感。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,显而易见地,下面所介绍的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的图像处理模型训练方法的应用场景示意图;
图2为本申请一实施例提供的图像处理方法的流程示意图;
图3为本申请一实施例提供的神经网络模型的结构示意图;
图4为本申请一实施例提供的神经网络模型的结构示意图;
图5为本申请一实施例提供的神经网络模型的结构示意图;
图6为本申请一实施例提供的在指定神经网络层的处理结果中添加噪声信息的流程示意图;
图7是根据一示例性实施例示出的一种图像处理模型训练装置的框图;
图8是根据一示例性实施例示出的一种图像处理装置的框图;
图9是根据一示例性实施例示出的图像处理模型训练方法的电子设备示意图。
具体实施方式
为了使本领域普通人员更好地理解本申请的技术方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应所述理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
以下,对本申请实施例中的部分用语进行解释说明,以便于本领域技术人员理解。
(1)本申请实施例中术语“多个”是指两个或两个以上,其它量词与之类似。
(2)“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
(3)服务器,是为终端服务的,服务的内容诸如向终端提供资源,保存终端数据;服务器是与终端上安装的应用程序相对应的,与终端上的应用程序配合运行。
(4)终端设备,既可以指软件类的APP(Application,应用程序),也可以指客户端。它具有可视的显示界面,能与用户进行交互;是与服务器相对应,为客户提供本地服务。针对软件类的应用程序,除了一些只在本地运行的应用程序之外,一般安装在普通的客户终端上,需要与服务端互相配合运行。因特网发展以后,较常用的应用程序包括了如收寄电子邮件时的电子邮件客户端,以及即时通讯的客户端等。对于这一类应用程序,需要网络中有相应的服务器和服务程序来提供相应的服务,如数据库服务,配置参数服务等,这样在客户终端和服务器端,需要建立特定的通信连接,来保证应用程序的正常运行。
在具体实践过程中,由于不同设备采集到的图像中的皮肤质感较差,现有技术中通过使用皮肤噪声素材提升图像中的皮肤质感,或者通过后处理算法生成皮肤噪声,用于提升图像中的皮肤质感,但是皮肤噪声素材有限,不适用于不同场景中的图像提升皮肤质感的情况,并且通过后处理算法生成皮肤噪声后,需要设计适配不同场景的噪声逻辑进行不同场景中的图像提升皮肤质感,操作复杂并且提升效率较低。
为此,本申请提供了一种图像处理模型训练方法,首先获取样本图像,并对样本图像中的皮肤纹理处理得到参考图像,然后将样本图像输入神经网络模型得到指定神经网络层输出的特征图,通过将特征图和噪声叠加图进行叠加处理的目标特征图输入至下一神经网络层,得到神经网络模型对样本图像的预测图像,最后利用预测图像和参考图像之间的损失值对神经网络模型进行训练,得到图像处理模型。通过对样本图像预先经过相关方法提升图像质量,故此得到可以训练神经网络模型的样本图像,然后在训练过程中通过叠加噪声图能够提高神经网络模型对不同拍摄情况下的图像的泛化能力,从而可以实现利用图像处理模型自适应提升待处理图像的皮肤质感。
在介绍完本申请实施例的设计思想之后,下面对本申请实施例的技术方案能够适用的应用场景做一些简单介绍,需要说明的是,以下介绍的应用场景仅用于说明本申请实施例而非限定。在具体实施时,可以根据实际需要灵活地应用本申请实施例提供的技术方案。
参考图1,其为本申请实施例提供的图像处理模型训练方法的应用场景示意图。该应用场景包括多个终端设备101(包括终端设备101-1、终端设备101-2、……终端设备101-n)、服务器102。其中,终端设备101、服务器102之间通过无线或有线网络连接,终端设备101包括但不限于桌面计算机、移动电话、移动电脑、平板电脑、媒体播放器、智能可穿戴设备、智能电视等电子设备。服务器102可以是一台服务器、若干台服务器组成的服务器集群或云计算中心。服务器102可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
服务器102采集样本图像,对样本图像中的皮肤纹理处理得到参考图像,并将样本图像输入神经网络模型得到指定神经网络层输出的特征图,然后将特征图和噪声叠加图进行叠加处理的目标特征图输入至下一神经网络层继续处理,得到神经网络模型对样本图像的预测图像,最后利用预测图像和参考图像之间的损失值对神经网络模型进行训练,得到图像处理模型。图像处理模型存储在服务器102中,以便于用户1通过终端设备101-1将待处理图像发送至服务器102时,服务器102可以利用图像处理模型对待处理图像进行处理,得到待处理图像的优化图像,服务器102将优化图像发送至终端设备101-1,通过终端设备101-1展示待处理图像的优化图像。
当然,本申请实施例提供的方法并不限用于图1所示的应用场景中,还可以用于其它可能的应用场景,本申请实施例并不进行限制。对于图1所示的应用场景的各个设备所能实现的功能将在后续的方法实施例中一并进行描述,在此先不过多赘述。
为进一步说明本申请实施例提供的技术方案,下面结合附图以及具体实施方式对此进行详细的说明。虽然本申请实施例提供了如下述实施例或附图所示的方法操作步骤,但基于常规或者无需创造性的劳动在所述方法中可以包括更多或者更少的操作步骤。在逻辑上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本申请实施例提供的执行顺序。
下面结合图1所示的应用场景,对本申请实施例提供的技术方案进行说明。
参考图2,本申请实施例提供一种图像处理方法,包括以下步骤:
S201,获取待处理图像。
S202,将待处理图像输入预先训练好的图像处理模型对待处理图像的皮肤纹理进行处理,得到添加皮肤噪声的待处理图像的优化图像。
本申请实施例通过训练好的图像处理模型能够自适应的对图像进行优化处理。
其中,图像处理模型在训练过程中采用的样本图像是从样本图像集合中获取的,样本图像集合中包括不同拍摄条件下采集的图像。
通过从不同拍摄条件下采集图像,可以得到不同场景的样本图像,进而可以得到多种多样的样本图像,利用多种多样的样本图像可以更好的训练图像处理模型,使得利用训练好的图像处理模型可以自适应优化待处理图像。
本申请的一实施例中,通过以下方法训练图像处理模型:
获取样本图像,并对样本图像中的皮肤纹理处理得到参考图像,可选地,参考图像可以是经过预设处理方法对样本图像美颜后又经过提升皮肤质感处理得到的。
然后将样本图像输入神经网络模型得到指定神经网络层输出的特征图,通过将特征图和噪声叠加图进行叠加处理的目标特征图输入至下一神经网络层继续处理,得到神经网络模型对样本图像的预测图像,最后利用预测图像和参考图像之间的损失值对神经网络模型进行训练,得到图像处理模型。
例如,通过结合人脸大小、环境光照等不同信息,对样本图像进行预先叠加不同的噪声信息,从而得到样本图像经过皮肤纹理处理后得到的参考图像。
在此并不限定对原始图像美颜的预设处理方法的具体方法,可根据实际应用场景进行调整。
通过在图像处理模型的指定神经网络层中添加噪声信息,可以获得更多场景情况下预测图像,进而更好的训练图像处理模型,使得利用训练好的图像处理模型可以自适应优化待处理图像,并且提高图像处理效率。还可以使得神经网络模型训练过程中学习到皮肤浅层噪声的随机特性,避免对图像中的皮肤质感处理过程中产生条状纹理。
本申请的一实施例中,神经网络模型中包括至少一个指定神经网络层,各指定神经网络层均在神经网络模型的最后一层卷积层之前。
由于在神经网络模型中添加噪声信息后,需要至少一层可学习的卷积层对添加的噪声信息进行处理,从而可以更好的利用噪声信息,又由于皮肤噪声属于浅层特征,因此优选在神经网络模型中最后一层卷积层之前,都能够对浅层特征叠加噪声提高图像处理模型的泛化能力。
可选地,当存在一个指定神经网络层时,指定神经网络层为神经网络模型中最后一个卷积层的前一个神经网络层。由于在神经网络模型中添加噪声信息后,需要至少一个可学习的卷积层对添加的噪声信息进行处理,从而可以更好的利用噪声信息,又由于皮肤噪声属于浅层特征,因此优选在神经网络模型中最后一个卷积层的前一层神经网络层中添加噪声信息,能够有效提高图像处理模型的处理能力,使得处理后的皮肤纹理更加逼真。
这里,在神经网络模型中最后一个卷积层的前一个神经网络层中添加噪声信息仅是举例说明,在此并不限定神经网络模型中最后一个卷积层之前的任一神经网络层中添加噪声信息,可根据实际应用场景进行调整。
示例性地,如图3所示,假设神经网络模型中包括神经网络层1、神经网络层2、…、神经网络层n,其中n为正整数,并且神经网络层n为神经网络模型中最后一层卷积层,当神经网络模型中包括一个指定神经网络层(即神经网络层n-1)时,将样本图像输入至神经网络模型中,针对样本图像经过神经网络层1至神经网络层n-1后的处理结果,添加噪声信息1后,将添加噪声信息1后的处理结果输入至神经网络层n,使得神经网络层n输出样本图像的预测图像。
示例性地,如图4所示,依然假设神经网络模型中包括神经网络层1、神经网络层2、…、神经网络层n,其中n为正整数,并且神经网络层n为神经网络模型中最后一层卷积层,当神经网络模型中包括两个指定神经网络层(即神经网络层2、神经网络层n-1)时,若神经网络层3为卷积层,将样本图像输入至神经网络模型中,针对样本图像经过神经网络层1至神经网络层2后的处理结果,添加噪声信息2后,将添加噪声信息2后的处理结果输入至神经网络层3,神经网络层3的输出结果继续输入至神经网络层4至神经网络层n-1,对神经网络层n-1的输出结果添加噪声信息3后,作为神经网络层n的输入,使得神经网络层n输出样本图像的预测图像。
可选地,上述噪声信息1、噪声信息2、噪声信息3可以相同,也可以不同,在此并不具体限定,可根据实际应用场景进行调整。
示例性地,如图5所示,神经网络模型由编码器(Encoder)和解码器(Generator)组成,假设神经网络模型中包括一个指定神经网络层,在神经网络模型结构中该指定神经网络层位于解码器中最后一个卷积层的前一个神经网络层。将噪声信息添加至指定神经网络层的输出结果,并将添加噪声信息后的输出结果作为解码器中最后一个卷积层的输入,使得解码器中最后一个卷积层输出样本图像的预测图像。
本申请的一实施例中,如图6所示,针对上述每个指定神经网络层的处理结果,分别添加噪声信息后输入给下一神经网络层进行处理,包括以下步骤:
S601,获得指定神经网络层输出的特征图,以及确定指定神经网络层输出的特征图对应的噪声特征图。
这里,噪声特征图可以为随机生成的,并且噪声特征图的尺寸与特征图的尺寸相同,利用随机生成的噪声特征图与特征图一起处理,可以获得不同的处理结果,从而可以更好的训练神经网络模型。
S602,将指定神经网络层输出的特征图与噪声特征图中同一像素位置的特征值加权求和处理,得到目标特征图;
S603,将目标特征图输入至指定神经网络层的下一神经网络层中。
具体地,通过确定噪声特征图的第一权重、以及确定特征图的第二权重;基于第一权重、以及第二权重,对噪声特征图与特征图进行加权求和处理。
可选地,通过以下方式中的任意一种进行加权求和处理:
一、将噪声特征图与第一权重的乘积结果和特征图相加处理;
二、将特征图与第二权重的乘积结果和噪声特征图相加处理;
三、将噪声特征图与第一权重的乘积结果和特征图与第二权重的乘积结果相加处理。
示例性地,假设噪声特征图为N,特征图为X,噪声特征图N的第一权重为β,特征图X的第二权重为α,叠加处理结果为X’,则加权处理的方法可以是以下方法中的任意一种:
X’=β*N+X (1)
X’=N+X*α (2)
X’=β*N+X*α (3)
上述的α和β为神经网络模型中的可学习参数,在训练神经网络模型时会不断更新学习,并在神经网络模型训练完成时存储参数用于模型的应用。
通过分别确定噪声特征图和特征图的权重系数,进一步确定神经网络模型中指定神经网络层的下一神经网络层的输入,从而使得神经网络模型训练更加准确。
图7是根据一示例性实施例示出的一种图像处理模型训练装置的框图,参照图7,该装置700包括:第一获取单元701、第一处理单元702、输出单元703、叠加处理单元704、预测单元705、计算单元706、训练单元707。
第一获取单元701,被配置为执行获取样本图像;
第一处理单元702,被配置为执行对所述样本图像中的皮肤纹理进行处理,得到参考图像;
输出单元703,被配置为执行将所述样本图像输入神经网络模型,得到所述神经网络模型中指定神经网络层输出的特征图;
叠加处理单元704,被配置为执行将所述特征图与噪声特征图进行叠加处理,得到目标特征图;
预测单元705,被配置为执行将所述目标特征图作为所述指定神经网络层的输出结果,输入给下一神经网络层继续处理,得到所述神经网络模型对所述样本图像的预测图像;
计算单元706,被配置为执行根据所述预测图像与所述参考图像之间的差异,得到损失值;
训练单元707,被配置为执行基于所述损失值对所述神经网络模型进行训练,得到图像处理模型。
可选的,所述神经网络模型中包括至少一个所述指定神经网络层,各所述指定神经网络层均在所述神经网络模型的最后一层卷积层之前。
可选的,所述叠加处理单元704还被配置为执行:
随机生成一个与所述特征图相同尺寸的所述噪声特征图。
可选的,当存在一个所述指定神经网络层时,所述指定神经网络层为所述神经网络模型中最后一个卷积层的前一个神经网络层。
可选的,所述样本图像是从样本图像集合中获取的,所述样本图像集合中包括不同拍摄条件下采集的图像。
可选的,所述叠加处理单元704,被配置为执行:
将所述特征图和所述噪声特征图中同一像素位置的特征值进行加权求和处理,得到所述目标特征图。
图8是根据一示例性实施例示出的一种图像处理装置的框图,参照图8,该装置800包括:第二获取单元801、第二处理单元802。
第二获取单元801,被配置为执行获取待处理图像;
第二处理单元802,被配置为执行将所述待处理图像输入预先训练好的图像处理模型对所述待处理图像的皮肤纹理进行处理,得到添加皮肤噪声的所述待处理图像的优化图像;
其中,所述图像处理模型是根据第一方面中任一所述的图像处理模型训练方法训练得到的。
在介绍了本申请示例性实施方式的界面信息切换方法和装置之后,接下来,介绍根据本申请的另一示例性实施方式的电子设备。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为***、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“***”。
在一些可能的实施方式中,根据本申请的电子设备可以至少包括至少一个处理器、以及至少一个存储器。其中,存储器存储有程序代码,当程序代码被处理器执行时,使得处理器执行本说明书上述描述的根据本申请各种示例性实施方式的图像缩放方法中的步骤。例如,处理器可以执行如界面信息切换方法中的步骤。
下面参照图9来描述根据本申请的这种实施方式的电子设备130。图9显示的电子设备130仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图9所示,电子设备130以通用电子设备的形式表现。电子设备130的组件可以包括但不限于:上述至少一个处理器131、上述至少一个存储器132、连接不同***组件(包括存储器132和处理器131)的总线133。
总线133表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、***总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储器132可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)1321和/或高速缓存存储器1322,还可以进一步包括只读存储器(ROM)1323。
存储器132还可以包括具有一组(至少一个)程序模块1324的程序/实用工具1325,这样的程序模块1324包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
电子设备130也可以与一个或多个外部设备134(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与电子设备130交互的设备通信,和/或与使得该电子设备130能与一个或多个其它电子设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口135进行。并且,电子设备130还可以通过网络适配器136与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器136通过总线133与用于电子设备130的其它模块通信。应当理解,尽管图中未示出,可以结合电子设备130使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器132,上述指令可由装置700的处理器131或者装置800的处理器131执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器131执行时实现如本申请提供的图像处理模型训练方法的任一方法,或者本申请提供的图像处理方法的任一方法。
在示例性实施例中,本申请提供的一种图像处理训练模型方法或图像处理方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的一种界面信息切换方法中的步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请的实施方式的用于图像缩放的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在电子设备上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户电子设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户电子设备上部分在远程电子设备上执行、或者完全在远程电子设备或服务端上执行。在涉及远程电子设备的情形中,远程电子设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户电子设备,或者,可以连接到外部电子设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程图像缩放设备的处理器以产生一个机器,使得通过计算机或其他可编程图像缩放设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程图像缩放设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程图像缩放设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种图像处理模型训练方法,其特征在于,包括:
获取样本图像;
对所述样本图像中的皮肤纹理进行处理,得到参考图像;
将所述样本图像输入神经网络模型,得到所述神经网络模型中指定神经网络层输出的特征图;
将所述特征图与噪声特征图进行叠加处理,得到目标特征图;
将所述目标特征图作为所述指定神经网络层的输出结果,输入给下一神经网络层继续处理,得到所述神经网络模型对所述样本图像的预测图像;
根据所述预测图像与所述参考图像之间的差异,得到损失值;
基于所述损失值对所述神经网络模型进行训练,得到图像处理模型。
2.根据权利要求1所述的方法,其特征在于,所述神经网络模型中包括至少一个所述指定神经网络层,各所述指定神经网络层均在所述神经网络模型的最后一层卷积层之前。
3.根据权利要求1所述的方法,其特征在于,所述将所述特征图与噪声特征图进行叠加处理,得到目标特征图之前,所述方法还包括:
随机生成一个与所述特征图相同尺寸的所述噪声特征图。
4.根据权利要求2所述的方法,其特征在于,当存在一个所述指定神经网络层时,所述指定神经网络层为所述神经网络模型中最后一个卷积层的前一个神经网络层。
5.一种图像处理方法,其特征在于,包括:
获取待处理图像;
将所述待处理图像输入预先训练好的图像处理模型对所述待处理图像的皮肤纹理进行处理,得到添加皮肤噪声的所述待处理图像的优化图像;
其中,所述图像处理模型是根据权利要求1-4中任一所述的方法训练得到的。
6.一种图像处理模型训练装置,其特征在于,包括:
第一获取单元,被配置为执行获取样本图像;
第一处理单元,被配置为执行对所述样本图像中的皮肤纹理进行处理,得到参考图像;
输出单元,被配置为执行将所述样本图像输入神经网络模型,得到所述神经网络模型中指定神经网络层输出的特征图;
叠加处理单元,被配置为执行将所述特征图与噪声特征图进行叠加处理,得到目标特征图;
预测单元,被配置为执行将所述目标特征图作为所述指定神经网络层的输出结果,输入给下一神经网络层继续处理,得到所述神经网络模型对所述样本图像的预测图像;
计算单元,被配置为执行根据所述预测图像与所述参考图像之间的差异,得到损失值;
训练单元,被配置为执行基于所述损失值对所述神经网络模型进行训练,得到图像处理模型。
7.一种图像处理装置,其特征在于,包括:
第二获取单元,被配置为执行获取待处理图像;
第二处理单元,被配置为执行将所述待处理图像输入预先训练好的图像处理模型对所述待处理图像的皮肤纹理进行处理,得到添加皮肤噪声的所述待处理图像的优化图像;
其中,所述图像处理模型是根据权利要求1-4中任一所述的图像处理模型训练方法训练得到的。
8.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至4中任一项所述的图像处理模型训练方法,或者权利要求5中任一项所述的图像处理方法。
9.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至4中任一项所述的图像处理模型训练方法,或者权利要求5中任一项所述的图像处理方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的图像处理模型训练方法,或者权利要求5中任一项所述的图像处理方法。
CN202110294804.7A 2021-03-19 2021-03-19 图像处理模型训练方法、图像处理方法及装置 Pending CN113112536A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110294804.7A CN113112536A (zh) 2021-03-19 2021-03-19 图像处理模型训练方法、图像处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110294804.7A CN113112536A (zh) 2021-03-19 2021-03-19 图像处理模型训练方法、图像处理方法及装置

Publications (1)

Publication Number Publication Date
CN113112536A true CN113112536A (zh) 2021-07-13

Family

ID=76711911

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110294804.7A Pending CN113112536A (zh) 2021-03-19 2021-03-19 图像处理模型训练方法、图像处理方法及装置

Country Status (1)

Country Link
CN (1) CN113112536A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114511041A (zh) * 2022-04-01 2022-05-17 北京世纪好未来教育科技有限公司 模型训练方法、图像处理方法、装置、设备和存储介质
CN114841328A (zh) * 2022-05-31 2022-08-02 北京达佳互联信息技术有限公司 模型训练和图像处理的方法、装置、电子设备及存储介质
CN115631103A (zh) * 2022-10-17 2023-01-20 北京百度网讯科技有限公司 图像生成模型的训练方法和装置、图像生成方法及装置
CN116342984A (zh) * 2023-05-31 2023-06-27 之江实验室 一种模型训练的方法以及图像处理的方法及装置
CN116580269A (zh) * 2023-07-13 2023-08-11 荣耀终端有限公司 训练模型的方法、处理图像的方法、电子设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739712A (zh) * 2010-01-25 2010-06-16 四川大学 基于视频的3d人脸表情动画驱动方法
CN105763747A (zh) * 2016-05-03 2016-07-13 成都索贝数码科技股份有限公司 一种获得高质量且实时的美颜的移动终端
CN107437077A (zh) * 2017-08-04 2017-12-05 深圳市唯特视科技有限公司 一种基于生成对抗网络的旋转面部表示学习的方法
CN107862659A (zh) * 2017-10-31 2018-03-30 广东欧珀移动通信有限公司 图像处理方法、装置、计算机设备及计算机可读存储介质
CN109685743A (zh) * 2018-12-30 2019-04-26 陕西师范大学 基于噪声学习神经网络模型的图像混合噪声消除方法
CN110163827A (zh) * 2019-05-28 2019-08-23 腾讯科技(深圳)有限公司 图像去噪模型的训练方法、图像去噪方法、装置及介质
CN110288547A (zh) * 2019-06-27 2019-09-27 北京字节跳动网络技术有限公司 用于生成图像去噪模型的方法和装置
CN110706179A (zh) * 2019-09-30 2020-01-17 维沃移动通信有限公司 一种图像处理方法及电子设备
CN111199233A (zh) * 2019-12-30 2020-05-26 四川大学 一种改进的深度学习色情图像识别方法
CN111401411A (zh) * 2020-02-28 2020-07-10 北京小米松果电子有限公司 获取样本图像集的方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739712A (zh) * 2010-01-25 2010-06-16 四川大学 基于视频的3d人脸表情动画驱动方法
CN105763747A (zh) * 2016-05-03 2016-07-13 成都索贝数码科技股份有限公司 一种获得高质量且实时的美颜的移动终端
CN107437077A (zh) * 2017-08-04 2017-12-05 深圳市唯特视科技有限公司 一种基于生成对抗网络的旋转面部表示学习的方法
CN107862659A (zh) * 2017-10-31 2018-03-30 广东欧珀移动通信有限公司 图像处理方法、装置、计算机设备及计算机可读存储介质
CN109685743A (zh) * 2018-12-30 2019-04-26 陕西师范大学 基于噪声学习神经网络模型的图像混合噪声消除方法
CN110163827A (zh) * 2019-05-28 2019-08-23 腾讯科技(深圳)有限公司 图像去噪模型的训练方法、图像去噪方法、装置及介质
CN110288547A (zh) * 2019-06-27 2019-09-27 北京字节跳动网络技术有限公司 用于生成图像去噪模型的方法和装置
CN110706179A (zh) * 2019-09-30 2020-01-17 维沃移动通信有限公司 一种图像处理方法及电子设备
CN111199233A (zh) * 2019-12-30 2020-05-26 四川大学 一种改进的深度学习色情图像识别方法
CN111401411A (zh) * 2020-02-28 2020-07-10 北京小米松果电子有限公司 获取样本图像集的方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114511041A (zh) * 2022-04-01 2022-05-17 北京世纪好未来教育科技有限公司 模型训练方法、图像处理方法、装置、设备和存储介质
CN114841328A (zh) * 2022-05-31 2022-08-02 北京达佳互联信息技术有限公司 模型训练和图像处理的方法、装置、电子设备及存储介质
CN115631103A (zh) * 2022-10-17 2023-01-20 北京百度网讯科技有限公司 图像生成模型的训练方法和装置、图像生成方法及装置
CN115631103B (zh) * 2022-10-17 2023-09-05 北京百度网讯科技有限公司 图像生成模型的训练方法和装置、图像生成方法及装置
CN116342984A (zh) * 2023-05-31 2023-06-27 之江实验室 一种模型训练的方法以及图像处理的方法及装置
CN116342984B (zh) * 2023-05-31 2023-08-08 之江实验室 一种模型训练的方法以及图像处理的方法及装置
CN116580269A (zh) * 2023-07-13 2023-08-11 荣耀终端有限公司 训练模型的方法、处理图像的方法、电子设备及存储介质
CN116580269B (zh) * 2023-07-13 2023-09-19 荣耀终端有限公司 训练模型的方法、处理图像的方法、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN113112536A (zh) 图像处理模型训练方法、图像处理方法及装置
CN108230346B (zh) 用于分割图像语义特征的方法和装置、电子设备
CN113627085B (zh) 横向联邦学习建模优化方法、设备、介质
US20170255884A1 (en) System and method for spatial and visual processing in cognitive architecture
JP2020508504A (ja) ニューラルネットワークを使用した繰り返しマルチスケール画像生成
CN113066034A (zh) 人脸图像的修复方法与装置、修复模型、介质和设备
CN113223121A (zh) 视频生成方法、装置、电子设备及存储介质
CN115272565A (zh) 一种头部三维模型的重建方法及电子设备
CN114863214A (zh) 图像生成模型训练、图像生成方法、装置、介质及设备
CN110827341A (zh) 一种图片深度估计方法、装置和存储介质
CN114792355A (zh) 虚拟形象生成方法、装置、电子设备和存储介质
CN111475392A (zh) 生成预测信息的方法、装置、电子设备和计算机可读介质
CN113919490A (zh) 推理引擎的适配方法、装置及电子设备
CN113808157B (zh) 图像处理方法、装置、及计算机设备
CN111709784B (zh) 用于生成用户留存时间的方法、装置、设备和介质
WO2022221205A1 (en) Video super-resolution using deep neural networks
CN113554550A (zh) 图像处理模型的训练方法、装置、电子设备及存储介质
CN113887319A (zh) 三维姿态的确定方法、装置、电子设备及存储介质
CN112149426A (zh) 阅读任务处理方法及相关设备
CN111353585A (zh) 神经网络模型的结构搜索方法和装置
CN114140363B (zh) 视频去模糊方法及装置、视频去模糊模型训练方法及装置
CN115908962B (zh) 神经网络的训练方法、脉冲信号重构图像生成方法及装置
CN116757254B (zh) 任务处理方法、电子设备及存储介质
CN114283060B (zh) 视频生成方法、装置、设备及存储介质
CN112685767B (zh) 一种基于区块链的数据处理方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination