WO2023168667A1

WO2023168667A1 - 图像处理方法、装置、神经网络训练方法及存储介质

Info

Publication number: WO2023168667A1
Application number: PCT/CN2022/080213
Authority: WO
Inventors: 应礼剑; 李志强; 徐斌
Original assignee: 深圳市大疆创新科技有限公司
Priority date: 2022-03-10
Filing date: 2022-03-10
Publication date: 2023-09-14

Abstract

一种图像处理方法、装置、神经网络训练方法及存储介质，所述图像处理方法包括：响应于用户的触发指令，获取待处理图像和所述待处理图像的参考图像；根据预设的至少一种初始色彩映射关系，以及每种初始色彩映射关系对应的权重对所述待处理图像进行处理，得到目标图像，以将所述目标图像显示在用户交互界面上；其中，所述目标图像的目标属性与所述参考图像的所述目标属性一致，所述权重基于所述待处理图像和所述参考图像确定。通过这种方式，可以快速地将待处理图像的目标属性转换成和任意参考图像的目标属性一致，并且可以大大减小计算量，使得该方法在一般的终端设备上也可以部署。

Description

图像处理方法、装置、神经网络训练方法及存储介质

技术领域

本申请涉及图像处理技术领域，具体而言，涉及一种图像处理方法、装置、神经网络训练方法及存储介质。

背景技术

在一些场景，用户需要将一张图像的某种属性转换成另一张图像的该种属性。以对图像的风格进行转换为例，用户在看到其他人拍摄的某种风格的图像后，希望将自己拍摄的图像也转换成该种风格的图像。目前，在对图像的风格进行转换时，有些技术只能将图像转换成特定风格的图像，无法实时快速地进行任意风格的转换。也有些技术可以以图像对作为输入，训练神经网络，使得训练后的神经网络可以将输入的图像对中的一帧图像的风格转换成另一帧图像的风格，但是这种技术对设备的性能要求很高，无法在一些普通的终端设备上使用。

发明内容

有鉴于此，本申请提供一种图像处理方法、装置及存储介质。

根据本申请的第一方面，提供一种图像处理方法，所述方法包括：

响应于用户的触发指令，获取待处理图像和所述待处理图像的参考图像；

根据预设的至少一种初始色彩映射关系，以及每种初始色彩映射关系对应的权重对所述待处理图像进行处理，得到目标图像，以将所述目标图像显示在用户交互界面上；其中，所述目标图像的目标属性与所述参考图像的所述目标属性一致，所述权重基于所述待处理图像和所述参考图像确定。

根据本申请的第二方面，提供一种生成对抗网络的训练方法，所述方法包括：

获取样本图像对，所述样本图像对包括第三图像和第四图像；将所述第三图像和所述第四图像输入到生成对抗网络的生成器中，得到预设的每种初始色彩映射关系对应的权重；

基于所述权重、预设的每种色彩映射关系对所述第三图像进行处理，得到目标属性和所述第四图像的所述目标属性相匹配的第五图像；

基于生成对抗网络的判别器对所述第四图像和所述第五图像的判别结果构建目标损失，基于所述目标损失对所述生成对抗网络进行训练。

根据本申请的第三方面，提供一种图像处理装置，所述图像处理装置包括处理器、存储器、存储于所述存储器可供所述处理器执行的计算机程序，所述处理器执行所述计算机程序时，实现以下步骤：

根据本申请的第三方面，提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被执行时实现上述第一方面和/或第二方面提及的方法。

应用本申请提供的方案，在对图像的目标属性进行转换时，可以预先设置至少一种初始色彩映射关系，每种初始色彩映射关系可以用于将图像的目标属性转换成某种特定属性，然后可以根据待处理图像和参考图像确定每种初始色彩映射关系对应的权重，根据该至少一种初始色彩映射关系和每种初始色彩映射关系对应的权重对待处理图像进行处理，得到目标图像，使得处理得到的目标图像的目标属性和参考图像的目标属性一致。通过这种方式，可以实现快速地将待处理图像的目标属性转换成任意参考图像的目标属性，并且由于是根据待处理图像和参考图像确定预设的每种初始色彩映射关系对应的权重，然后再根据预设的初始色彩映射关系和权重对待处理图像进行处理，得到目标图像，从而无需直接通过神经网络生成目标图像，可以大大减小计算量，使得该方法在手机、电脑等性能一般的终端设备上也能部署使用。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个实施例的图像处理方法的流程图。

图2是本申请一个实施例的用户导入待处理图像和参考图像的示意图。

图3是本申请一个实施例的对用户交互界面显示的图像或视频进行风格转换的示意图。

图4是本申请一个实施例的对采集的图像或视频进行风格转换的示意图。

图5是本申请一个实施例的采集得到目标属性按照特定方式变化的视频的示意图。

图6是本申请一个实施例的一种生成对抗网络的训练方法流程图。

图7是本申请一个实施例的一种生成对抗网络的训练方法的示意图。

图8是本申请一个实施例的一种利用生成对抗网络对图像的风格进行转换的示意图。

图9是本申请一个实施例的图像处理装置的逻辑结构的示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在一些场景，用户存在将一张图像的某种属性快速转换成另一张图像的该种属性的需求。比如，用户在摄影社区或公众号看到一些优秀的图像作品时，可能希望将自己拍摄的图像的风格也转换成该图像的风格，或者用户希望将一张图像的动态范围转换成另一张图像的动态范围。以下将用户希望进行属性转换的图像称为待处理图像，用户在属性转换过程中，用于作为参考以将待处理图像的属性转换成该图像的属性的图像称为参考图像。

目前，在对图像的属性进行转换时，有些技术只能将待处理图像转换成特定属性的图像，比如，以风格转换为例，通常是预先设置几种风格模板，在对待处理图像进行风格转换时，只能从预先设置的风格模板中选择一种或多种，将待处理图像的风格转换成所选的风格，这种方式只能将待处理图像转换成预先设置好的特定风格，无法实现对待处理图像进行任意风格的转换。也有些技术可以利用大量的样本图像对训练得到生成对抗网络，然后可以将待处理图像以及参考图像输入到生成对抗网络中，由生成对抗网络生成一帧风格和参考图像风格一致的图像，但是这种方式需要生成对抗网络直接生成风格转换后的图像，比较复杂，对设备性能要求也很高，无法在一般的终端设备上部署。

基于此，本申请实施例提供了一种图像处理方法，在对图像的目标属性进行转换时，可以预先设置至少一种初始色彩映射关系，每种初始色彩映射关系可以用于将图像的目标属性转换成某种特定属性(比如，每种初始色彩映射关系用于将图像转换成某种特定风格的图像)，然后可以根据待处理图像和参考图像确定每种初始色彩映射关系对应的权重，根据该至少一种初始色彩映射关系和每种初始色彩映射关系对应的权重对待处理图像进行处理，得到目标图像，使得处理得到的目标图像的目标属性和参考图像的目标属性一致。通过这种方式，可以实现快速地将待处理图像的目标属性转换成任意参考图像的目标属性，并且由于是根据待处理图像和参考图像确定预设的每种初始色彩映射关系对应的权重，然后再根据预设的初始色彩映射关系和权重对待处理图像进行处理，得到目标图像，从而无需直接通过神经网络生成目标图像，可以大大减小计算量，使得该方法在手机、电脑等性能一般的终端设备上也能部署使用。

本申请实施例提供的图像处理方法可以由具备将一张图像的某种属性转成另一张图像的该种属性的功能的任一电子设备执行，该电子设备可以是手机、平板、电脑、手持云台、无人机、服务器等。比如，在一些场景，该方法可以由指定的图像处理软件执行，只要安装有该图像处理软件的设备均可以实现该图像处理方法。在一些实施例中，也可以在设备出厂时，即集成指定的功能服务，由该指定的功能服务执行上述图像处理方法。

具体的，如图1所示，本公开实施例提供的图像处理方法可包括以下步骤：

S102、响应于用户的触发指令，获取待处理图像和所述待处理图像的参考图像；

在步骤S102中，当用户想要将某帧图像的目标属性转成另一帧图像的目标属性时，用户可以发出触发指令，然后执行该方法的设备可以获取待处理图像和待处理图像的参考图像。其中，触发指令的触发方式可以灵活设置，比如，可以由用户点击用户交互界面上的指定控件触发，或者也可以由用户的特定语音、手势、动作等提示信息触发。待处理图像和参考图像可以是单独的图像，也可以是某段视频中的视频帧。待处理图像可以是用户利用摄像头刚采集的图像或视频中视频帧、也可以是用户导入的图像或视频中的视频帧。参考图像可以是用户导入的图像或视频中的视频帧，或者也可以是预先设置好的默认的图像或视频中的视频帧，本申请实施例不做限制。

S104、根据预设的至少一种初始色彩映射关系，以及每种初始色彩映射关系对应的权重对所述待处理图像进行处理，得到目标图像，以将所述目标图像显示在用户交互界面上；其中，所述目标图像的目标属性与所述参考图像的所述目标属性一致，所述权重基于所述待处理图像和所述参考图像确定。

在步骤S104中，在获取到待处理图像和参考图像后，可以根据待处理图像和参考图像确定预设的至少一种初始色彩映射关系中的每种初始色彩映射关系对应的权重，然后利用该至少一种初始映射色彩映射关系和权重对待处理图像进行处理，得到目标属性与参考图像的目标属性一致的目标图像。其中，每种初始色彩映射关系可以将待处理图像的目标属性转换成某种特定的属性，通过对待处理图像和参考图像的特性进行分析和比对，即可以确定每种初始色彩映射关系对应的权重，使得利用该权重对每种初始色彩映射关系进行调整和修正，或者利用该权重对使用每种初始色彩映射关系映射后的图像进行调整和修正，从而可以得到目标属性和参考图像的目标属性一致的目标图像。

其中，在基于待处理图像和参考图像确定每种初始色彩映射对应的权重时，可以采用多种方式，比如，可以利用某些算法对待处理图像和参考图像的目标属性进行分析和比对，基于两者的特性确定每种初始色彩映射对应的权重。或者也可以预先训练神经网络，将待处理图像和参考图像输入到预先训练的神经网络中，通过神经网络确定每种初始色彩映射关系对应的权重。

以目标属性为图像风格为例，假设初始色彩映射关系有三种(初始色彩映射关系1、初始色彩映射关系2、初始色彩映射关系3)，利用初始色彩映射关系1对图像进行映射处理后，可以得到风格大体倾向于风格A的图像，利用初始色彩映射关系2对图像进行映射处理后，可以得到风格大体倾向于风格B的图像，利用初始色彩映射关系3对图像进行映射处理后，可以得到风格大体倾向于风格C的图像。因而，可以基于待处理图像和参考图像的风格实时确定如果需要将待处理图像的风格转换成参考图像的风格，每种初始色彩映射关系对应的权重，然后基于该权重和初始色彩映射关系对待处理图像进行处理，得到风格和参考图像的风格一致的图像。在得到目标图像后，可以将目标图像显示在用户交互界面上，供用户查看。

本申请实施例中，通过基于待处理图像和参考图像的特点实时地确定预设的初始色彩映射关系对应的权重，然后根据该权重和预设的初始色彩映射关系对待处理图像进行处理，得到目标属性和参考图像的目标属性一致的目标图像。通过这种方式，可以快速地将待处理图像的目标属性转换成和任意参考图像的目标属性一致，并且由于只需确定预设的初始色彩映射关系的权重，然后再基于权重和预设的初始色彩映射关系对待处理图像进行处理，相比于直接通过神经网络生成目标图像的方式，可以大大减小计算量，使得该方法在一般的终端设备上也可以部署。

在一些实施例中，本申请实施例中的目标属性可以是图像的风格，比如，可以是与图像色彩有关的风格，例如，图像的明亮度、对比度、颜色鲜艳度等，或者也可以图像的整体风格，比如，卡通风格、漫画风格、素描风格等。在一些实施例中，目标属性也可以是图像的动态范围，比如，可以将低动态范围的图像转换成高动态范围的图像。在一些实施例中，目标属性也可以是图像中人物的风格，比如，人物的年龄属性等。

初始色彩映射关系可以通过用于表示两帧图像像素值之间的转换关系的任意方式表征，比如，可以通过映射表、映射曲线等表征。在一些实施例中，每种初始色彩映射关系通过一个N维查找表表征，其中，N为正整数。比如，该初始色彩映射关系可以通过1D-lut(一维查找表)、2D-lut(二维查找表)、3D-lut(三维查找表)、4D-lut(四维查找表)表征。初始色彩映射关系可以只包含一种，也可以包含多种，具体可以根据实际情况设置。比如，以每种初始色彩映射关系通过一个3D-lut为例，可以只设置一个3D-lut，也可以设置多个3D-lut。

待处理图像可以是图像或视频中的视频帧，参考图像也可以是图像或视频中的视频帧。在一些实施中，待处理图像和参考图像均为一帧单独的图像，用户可以将该帧待处理图像的目标属性转换成该帧参考图像的目标属性。

在一些实施例中，待处理图像可以是一段视频中的视频帧，参考图像可以是一帧图像。比如，待处理图像可以是视频中的多个视频帧，这多个视频帧的参考图像为同一帧图像，用户可以将一段视频中的所有视频帧的目标属性转换成和某帧参考图像的目标属性一致。比如，待处理图像为视频A，可以将视频帧A中的各视频帧的风格均转换成参考图像R的风格。

在一些实施例中，待处理图像可以是一段视频中的视频帧，参考图像可以是多帧图像。待处理图像为视频中的多个视频帧，多个视频帧的参考图像为多帧第一图像，每帧第一图像作为一个或多个视频帧的参考图像，即用户可以将一段视频中的不同视频帧的目标属性分别转换成不同参考图像的目标属性。比如，待处理图像为视频A，可以将视频帧A中的部分视频帧的风格转换成参考图像R1的风格、部分视频帧的风格转换成参考图像R2的风格。

在一些实施例中，待处理图像和参考图像均可以是视频中的视频帧，待处理图像可以是第一视频中的第一视频帧，参考图像为第二视频中的第二视频帧，每个第二视频帧可以作为一个或多个第一视频帧的参考图像。比如，待处理图像为视频A中的视频帧，参考图像可以将视频B中的视频帧，风格转换后的视频A中的视频帧的风格可以和视频B中的视频帧的风格一一对应。

在一些实施中，待处理图像和参考图像均可以由用户导入。比如，如图2所示，可以在用户交互界面上设置一个控件，当用户触发该控件(图中的“风格转换”控件)后，可以提示用户导入待处理图像和参考图像，用户可以选择路径，从指定存储位置中选择图像或视频分别作为待处理图像或参考图像，然后将用户导入的其中一帧图像或一个视频作为待处理图像，以及将用户导入的另一帧图像或另一个视频作为参考图像。

在一些实施例中，用户也可以直接对用户交互界面显示的图像或视频进行编辑处理，以对其目标属性进行转换。比如，如图3所时，用户可以打开某个图像或视频，使得该图像或视频显示在用户交互界面上，同时用户交互界面中还可以包括用于对图像或视频进行编辑的控件，用户触发指定控件(如图中的“风格转换”控件)后，即可以提示用户导入参考图像，用户可以选择路径，从指定存储位置中选择图像或视频作为参考图像，然后获取用户交互界面上显示的图像或视频中的视频帧作为待处理图像，获取用户导入的图像或视频中的视频帧作为参考图像。

在一些实施例中，在用户发出触发指令后，也可以直接调用摄像头采集图像或视频，在完成图像或视频的采集后，可以获取摄像头采集的图像或视频中的视频帧作为待处理图像，获取用户导入的图像或视频中的视频帧作为参考图像。举个例子，如图4所示，用户交互界面可以包括特定的功能控件(比如，图中的“风格转换”控件)，该控件的功能用于将用户采集的图像或视频的风格转换成用户导入的图像或视频的风格，用户点击该控件，即可以自动调用摄像头采集图像或视频，完成图像或视频的采集后，可以提示用户导入参考图像，使得最终呈现给用户的图像或视频为风格转换后的图像或视频。

在一些实施中，参考图像也可以是预先设置的具有特定属性的第二图像，在用户发出触发指令后，可以调用摄像头采集一段视频，在完成视频的采集后，将采集的视频中的视频帧作为待处理图像，然后获取预先存储的第二图像作为参考图像，从而可以自动将用户采集的图像或视频的目标属性转换成特定的属性。其中，第二图像可以是一帧或者多帧。

在一些实施例中，第二图像包括目标属性按照预定方式变化的多帧图像，比如，第二图像可以包括多帧图像，该多帧图像的风格按照某种方式逐渐变化，从而利用该多帧图像作为参考图像对采集的视频进行处理后，处理后的视频中的视频帧的目标属性也可以按照预定方式变化。比如，如图5所示，可以在用户交互界面设置专门的功能控件(如图中的风格转换控件)，该功能控件可以用于采集按照特定方式变化的视频。用户触发该功能控件后，即可以自动调用摄像头采集视频，并利用预先存储的多帧按照一定方式变化的图像的作为参考图像(如图中的参考图像1、参考图像2、参考图像3)，对采集的视频进行目标属性的转换，比如，可以将视频帧1-10的目标属性转换成参考图像1的目标属性，可以将视频帧11-20的目标属性转换成参考图像2的目标属性，可以将视频帧21-30的目标属性转换成参考图像3的目标属性，使得最后得到视频的目标属性按照同样的方式变化。

在一些实施例中，目标属性可以是图像风格，处理后的视频中的视频帧的目标属性按照预定方式变化可以是处理后的视频中的视频帧的图像风格按照季节更替变化。举个例子，第二图像可以是预先存储的风格由春天过渡到冬天的四帧图像，在采集到视频后，可以以上述四帧图像作为参考图像对采集的视频进行处理，自动将视频中位于前面的部分视频帧转换成春天风格、位于中间的部分视频帧转换成夏天风格和秋天风格，最后一部分视频帧转换成冬天风格，使得处理后的视频中的视频帧的风格从春天过渡到冬天。

在一些实施例中，目标属性可以是图像风格，处理后的视频中的视频帧的图像风格可以按照日夜更替变化。举个例子，第二图像可以是预先存储的风格从早上过渡到晚上的多帧图像，在采集到视频后，可以将上述多帧图像作为参考图像对采集的视频进行处理，使得处理后的视频中的视频帧的风格从早上过渡到晚上。

在一些实施例中，目标属性可以是图像中的人物风格，处理后的视频中的视频帧的人物风格按照年龄增长变化。举个例子，第二图像可以是预先存储的人物风格按照幼年过渡到老年的多帧图像，在采集到人物的视频后，可以将上述多帧图像作为参考图像对采集的视频进行处理，使得处理后的视频中的视频帧的人物的年龄从幼年过渡到老年。

在一些实施例中，在将采集的视频中的各视频帧作为待处理图像，并获取预先存储的第二图像作为参考图像时，可以将采集的视频划分成多段子视频，该子视频的数量与第二图像的数量一致，每段子视频对应一帧第二图像，针对每段子视频，将每段子视频中的视频帧作为待处理图像，将每段子视频对应的第二图像作为该子视频中的各视频帧的参考图像。举个例子，假设参考图像包括风格为“春、夏、秋、冬”四种风格的图像，在获取到视频A后，可以将视频A划分成四段子视频{子视频A1、子视频A2、子视频A3、子视频A4}，其中，子视频A1中的视频帧以风格为“春”的图像作为参考图像、子视频A2中的视频帧以风格为“夏”的图像作为参考图像、子视频A3中的视频帧以风格为“秋”的图像作为参考图像、子视频A4中的视频帧以风格为“冬”的图像作为参考图像，然后分别对上述四段子视频的视频帧进行风格转换，使得最后展示给用户的视频中的视频帧呈现的效果逐渐从春天过渡到冬天，展示了四季的交替变化。

在一些实施例中，在基于预设的至少一种初始色彩映射关系，以及每种初始色彩映射关系对应的权重对待处理图像进行处理，得到目标图像时，可以先基于预设的至少一种初始色彩映射关系分别对待处理图像进行映射处理，得到利用每种初始色彩映射关系映射后的图像，然后基于每种初始色彩映射关系对应的权重对利用该种初始色彩映射关系映射后的图像进行处理，并对处理后的图像进行融合，得到目标图像。比如，假设有三种初始色彩映射关系(映射关系1、映射关系2、映射关系3)，可以先利用上述三种初始色彩映射关系对待处理图像进行映射处理，得到目标属性各不相同的三帧图像，然后利用各初始色彩映射关系对应的权重对该三帧图像进行加权融合处理，使得最终得到的图像的目标属性和参考图像的目标属性一致。

其中，权重可以是一个数值，也可以是一个权重矩阵。即针对映射处理得到的图像，其每个像素点对应的权重可以一样，也可以不一样。比如，可以是每个像素点对应一个权重，或者是每个像素块对应一个权重，或者是整帧映射处理得到的图像对应一个权重。

在一些实施例中，在基于预设的至少一种初始色彩映射关系，以及每种初始色彩映射关系对应的权重对待处理图像进行处理，得到目标图像时，可以先基于预设的至少一种初始色彩映射关系，以及每种初始色彩映射关系对应的权重，确定目标色彩映射关系，该目标色彩映射关系用于将待处理图像的目标属性转换成参考图像的目标属性，然后利用目标色彩映射关系对待处理图像进行映射处理，得到目标图像。比如，假设有三种初始色彩映射关系(映射关系1、映射关系2、映射关系3)，可以先利用上述三种初始色彩映射关系以及各初始色彩映射关系对应的权重得到一个目标色彩映射关系，该目标色彩映射关系可以用于将待处理图像的目标属性转换成参考图像的目标属性，然后再利用目标色彩映射关系对待处理图像进行映射处理，得到目标属性和参考图像的目标属性一致的目标图像。

在一些实施例中，在基于待处理图像和参考图像确定每种初始色彩映射关系对应的权重时，可以分别对待处理图像和参考图像进行特征提取，然后根据提取得到的待处理图像的特征和参考图像的特征确定每种初始色彩映射关系对应的权重。比如，可以通过一些特征提取网络提取待处理图像和参考图像的特征，基于提取到的特征确定每种初始色彩映射关系对应的权重。

在一些实施例中，基于待处理图像和参考图像确定每种初始色彩映射关系的权重的步骤由预先训练的生成对抗网络执行。比如，可以将待处理图像和参考图像输入到预先训练的生成对抗网络中，该生成对抗网络即可以输出每种初始色彩映射关系对应的权重。

在一些实施例中，该生成对抗网络可以基于以下方式训练得到，可以获取大量的样本图像对，每个样本图像对包括第三图像和第四图像，两种图像的目标属性不同，其中，第三图像可以是需要进行目标属性转换的图像，第四图像可以是该第三图像的参考图像，即需要通过生成对抗网络将第四图像的目标属性转换成第三图像的目标属性。然后可以将第三图像和第四图像输入到生成对抗网络的生成器中，得到预设的每种初始色彩映射关系对应的权重，然后可以基于每种初始色彩映射关系对应的权重、预设的每种色彩映射关系对第三图像进行处理，得到目标属性和第四图像的目标属性相匹配的第五图像，然后可以基于生成对抗网络的判别器对第四图像和第五图像进行判断，判断第四图像和第五图像中哪个是生成的图像，哪个是原本真实的图像，并基于判别结果构建目标损失，然后可以基于目标损失对该生成对抗网络进行训练。

在一些实施例中，在构建目标损失时，除了可以根据生成对抗网络的判别器对第四图像和第五图像的判别结果构建，还可以根据利用映射关系对图像进行映射过程中需遵循的条件在目标损失中加入一些约束项，比如，在对图像进行映射的过程中，需保证映射后的图像的亮度的单调性，即映射前的图像中的亮度更大的像素点在映射后的图像中的亮度也要保持更大，基于这个原则可以在目标损失中加入约束项，保证最后输出得到目标图像可以满足上述条件。其次，映射后的图像的颜色也需保持平滑，避免色彩出现断层的问题，因而在目标损失中也可以加入约束项，通过该约束项保证最后得到的目标图像颜色平滑过渡。

进一步地，本申请实施例还提供了一种生成对抗网络的训练方法，如图6所示，该方法可以包括以下步骤：

S602、获取样本图像对，所述样本图像对包括第三图像和第四图像；将所述第三图像和所述第四图像输入到生成对抗网络的生成器中，得到预设的每种初始色彩映射关系对应的权重；

S604、基于所述权重、预设的每种色彩映射关系对所述第三图像进行处理，得到目标属性和所述第四图像的所述目标属性相匹配的第五图像；

S606、基于生成对抗网络的判别器对所述第四图像和所述第五图像的判别结果构建目标损失，基于所述目标损失对所述生成对抗网络进行训练。

其中，生成对抗网络的训练过程的具体细节可以参考上述实施例中的描述，在此不再赘述。

为了进一步解释本申请实施例提供的图像处理方法，以下结合一个具体的实施例加以解释。

本实施例中通过预先训练一个生成对抗网络，使得训练后的生成对抗网络可以将输入的两帧图像中的一帧图像的风格转换成另一帧图像的风格。具体包括以下两个阶段：

1、生成对抗网络的训练阶段

如图7所示，为生成对抗网络的训练过程的示意图。生成对抗网络包括两个部分，生成器和判别器，其中，生成器可以由通用的特征提取网络构成，比如，该特征提取网络可以是LeNet，AlexNet，VGG，GoogleNet，ResNet，DenseNet等网络，判别器可以是一个二分类网络。

可以预先设置的一个或者多个3D-lut，其中，每个3D-lut为一个查找表，用于将图像映射成一种特定风格的图像。

在训练生成对抗网络时，可以获取大量的样本图像对，样本图像对中包括风格不同的两帧图像，这两帧图像中包括待进行风格转换的第三图像，以及用于作为参考的第四图像。然后可以将样本图像对输入到生成器中，生成器可以对两帧图像进行特征提取，基于提取到的特征确定每个3D-lut对应的权重。然后可以利用预设的每个3D-lut分别对第三图像进行映射处理，得到映射后的图像，再利用每个3D-lut对应的权重对映射后的图像进行加权融合处理，得到第五图像，然后可以将第四图像和第五图像输入到判别器中，由判别器判定第四图像和第五图像为真实的图像，还是生成的图像，基于判定结果构建目标损失，然后可以基于目标损失调整生成器的网络参数，以对生成对抗网络进行训练。

2、生成对抗网络的应用阶段

在训练得到生成对抗网络后，可以利用生成对抗网络将一帧图像的风格转换为另一帧图像的风格，具体如图8所示。比如，在获取到待进行风格转换的待处理图像，以及参考图像后，可以将待处理图像和参考图像输入到生成对抗网络的生成器中，由生成器基于该待处理图像和参考图像确定每个3D-lut对应的权重，利用每个3D-lut分别对待处理图像进行映射处理，得到映射后的图像，再利用每个3D-lut对应的权重对映射后的图像进行加权融合，得到最终的目标图像。其中，目标图像的风格和参考图像的风格一致。

本申请实施例中通过生成对抗网络确定将待处理图像的风格转化成参考图像的风格时，预设的初始3D-lut对应的权重，然后基于该权重对每个初始3D-lut映射后的图像进行融合处理，得到风格和参考图像风格一致的目标图像。从而可以实现快速地将一帧图像的风格转换成任意一帧其他图像的风格。并且相关技术中，直接利用生成对抗网络生成风格转换后的目标图像，比较复杂，计算量大，对设备性能要求很高，本申请通过生成对抗网络输出预设的每种初始3D-lut对应的权重，利用初始3D-lut和权重对待处理图像进行处理，得到目标图像，可以大大减少计算量，使得该方法在一般的终端设备中也能部署。

此外，本申请实施例还提供了一种图像处理装置，如图9所示，所述装置90包括处理器91、存储器92、存储于所述存储器92可供所述处理器91执行的计算机程序，所述处理器91执行所述计算机程序时，可实现以下步骤：

在一些实施例中，所述待处理图像为视频中的多个视频帧，所述多个视频帧的参考图像为同一帧图像；或

所述待处理图像为视频中的多个视频帧，所述多个视频帧的参考图像为多帧第一图像，每帧所述第一图像作为一个或多个视频帧的参考图像；或

所述待处理图像为第一视频中的第一视频帧，所述第一视频帧的参考图像为第二视频中的第二视频帧，每个第二视频帧作为一个或多个第一视频帧的参考图像。

在一些实施例中，所述处理器用于响应于用户的触发指令，获取待处理图像和所述待处理图像的参考图像时，具体用于：

响应于用户的触发指令，获取用户导入的图像或视频作为所述待处理图像，以及获取用户导入的图像或视频作为所述参考图像。

在用户交互界面显示图像或视频的情况下，响应于用户的触发指令，获取所述用户交互界面上显示的图像或视频中的视频帧作为所述待处理图像，获取用户导入的图像或视频中的视频帧作为所述参考图像。

响应于用户的触发指令，调用摄像头采集图像或视频；

在完成图像或视频的采集后，获取摄像头采集的图像或视频中的视频帧作为所述待处理图像，获取用户导入的图像或视频中的视频帧作为所述参考图像。

响应于用户的触发指令，调用摄像头采集一段视频；

在完成视频的采集后，将采集的视频中的视频帧作为所述待处理图像，并获取预先存储的第二图像作为所述参考图像。

在一些实施例中，所述第二图像包括所述目标属性按照预定方式变化的多帧图像，使得处理后的所述视频中的视频帧的所述目标属性按照预定方式变化。

在一些实施例中，所述处理后的所述视频中的视频帧的所述目标属性按照预定方式变化，包括；

所述目标属性为图像风格，处理后的所述视频中的视频帧的图像风格按照季节更替变化；或

所述目标属性为图像风格，处理后的所述视频中的视频帧的图像风格按照日夜更替变化；或

所述目标属性为图像中的人物风格，处理后的所述视频中的视频帧的人物风格按照年龄增长变化。

在一些实施例中，所述处理器用于将采集的视频中的各视频帧作为所述待处理图像，并获取预先存储的第二图像作为所述参考图像时，具体用于：

将采集的视频划分成多段子视频，所述子视频的数量与所述第二图像的数量一致，每段子视频对应一帧所述第二图像；

针对每段子视频，将所述每段子视频中的视频帧作为所述待处理图像，将所述每段子视频对应的所述第二图像作为所述参考图像。

在一些实施例中，所述处理器用于基于预设的至少一种初始色彩映射关系，以及每种初始色彩映射关系对应的权重对所述待处理图像进行处理，得到目标图像时，具体用于：

基于预设的至少一种初始色彩映射关系分别对所述待处理图像进行映射处理，得到利用每种初始色彩映射关系映射后的图像；基于每种初始色彩映射关系对应的权重对利用该种初始色彩映射关系映射后的图像进行处理，并对处理后的图像进行融合，得到所述目标图像；或

基于预设的至少一种初始色彩映射关系，以及每种初始色彩映射关系对应的权重，确定目标色彩映射关系，所述目标色彩映射关系用于将所述待处理图像的所述目标属性转换成所述参考图像的所述目标属性；利用所述目标色彩映射关系对所述待处理图像进行映射处理，得到所述目标图像。

在一些实施例中，所述目标属性包括以下一种或多种：图像风格、图像的动态范围、图像中的人物风格。

在一些实施例中，每种初始色彩映射关系通过一个N维查找表表征，其中，N为正整数。

在一些实施例中，所述权重基于所述待处理图像和所述参考图像确定，包括：

分别对所述待处理图像和所述参考图像进行特征提取；

基于提取到的特征确定所述权重。

在一些实施例中，基于所述待处理图像和所述参考图像确定所述权重的步骤由预先训练的生成对抗网络执行。

在一些实施例中，所述生成对抗网络基于以下方式训练得到：

获取样本图像对，所述样本图像对包括第三图像和第四图像；

将所述第三图像和所述第四图像输入到生成对抗网络的生成器中，得到预设的每种初始色彩映射关系对应的权重；

相应地，本说明书实施例还提供一种计算机存储介质，所述存储介质中存储有程序，所述程序被处理器执行时实现上述任一实施例中的方法。

本说明书实施例可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机可用存储介质包括永久性和非永久性、可移动和非可移动媒体，可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于：相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本发明实施例所提供的方法和装置进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

一种图像处理方法，其特征在于，所述方法包括：

响应于用户的触发指令，获取待处理图像和所述待处理图像的参考图像；

根据预设的至少一种初始色彩映射关系，以及每种初始色彩映射关系对应的权重对所述待处理图像进行处理，得到目标图像，以将所述目标图像显示在用户交互界面上；其中，所述目标图像的目标属性与所述参考图像的所述目标属性一致，所述权重基于所述待处理图像和所述参考图像确定。
根据权利要求1所述的方法，其特征在于，所述待处理图像为视频中的多个视频帧，所述多个视频帧的参考图像为同一帧图像；或

所述待处理图像为视频中的多个视频帧，所述多个视频帧的参考图像为多帧第一图像，每帧所述第一图像作为一个或多个视频帧的参考图像；或

所述待处理图像为第一视频中的第一视频帧，所述第一视频帧的参考图像为第二视频中的第二视频帧，每个第二视频帧作为一个或多个第一视频帧的参考图像。
根据权利要求1或2所述的方法，其特征在于，所述响应于用户的触发指令，获取待处理图像和所述待处理图像的参考图像，包括：

响应于用户的触发指令，获取用户导入的图像或视频作为所述待处理图像，以及获取用户导入的图像或视频作为所述参考图像。
根据权利要求1或2所述的方法，其特征在于，所述响应于用户的触发指令，获取待处理图像和所述待处理图像的参考图像，包括：

在用户交互界面显示图像或视频的情况下，响应于用户的触发指令，获取所述用户交互界面上显示的图像或视频中的视频帧作为所述待处理图像，获取用户导入的图像或视频中的视频帧作为所述参考图像。
根据权利要求1或2所述的方法，其特征在于，所述响应于用户的触发指令，获取待处理图像和所述待处理图像的参考图像，包括：

响应于用户的触发指令，调用摄像头采集图像或视频；

在完成图像或视频的采集后，获取摄像头采集的图像或视频中的视频帧作为所述待处理图像，获取用户导入的图像或视频中的视频帧作为所述参考图像。
根据权利要求1或2所述的方法，其特征在于，所述响应于用户的触发指令，获取待处理图像和所述待处理图像的参考图像，包括：

响应于用户的触发指令，调用摄像头采集一段视频；

在完成视频的采集后，将采集的视频中的视频帧作为所述待处理图像，并获取预先存储的第二图像作为所述参考图像。
根据权利要求6所述的方法，其特征在于，所述第二图像包括所述目标属性按照预定方式变化的多帧图像，使得处理后的所述视频中的视频帧的所述目标属性按照预定方式变化。
根据权利要求7所述的方法，其特征在于，所述处理后的所述视频中的视频帧的所述目标属性按照预定方式变化，包括：

所述目标属性为图像风格，处理后的所述视频中的视频帧的图像风格按照季节更替变化；或

所述目标属性为图像风格，处理后的所述视频中的视频帧的图像风格按照日夜更替变化；或

所述目标属性为图像中的人物风格，处理后的所述视频中的视频帧的人物风格按照年龄增长变化。
根据权利要求7所述的方法，其特征在于，所述将采集的视频中的各视频帧作为所述待处理图像，并获取预先存储的第二图像作为所述参考图像，包括：

将采集的视频划分成多段子视频，所述子视频的数量与所述第二图像的数量一致，每段子视频对应一帧所述第二图像；

针对每段子视频，将所述每段子视频中的视频帧作为所述待处理图像，将所述每段子视频对应的所述第二图像作为所述参考图像。
根据权利要求1-9任一项所述的方法，其特征在于，所述基于预设的至少一种初始色彩映射关系，以及每种初始色彩映射关系对应的权重对所述待处理图像进行处理，得到目标图像，包括：

基于预设的至少一种初始色彩映射关系分别对所述待处理图像进行映射处理，得到利用每种初始色彩映射关系映射后的图像；基于每种初始色彩映射关系对应的权重对利用该种初始色彩映射关系映射后的图像进行处理，并对处理后的图像进行融合，得到所述目标图像；或

基于预设的至少一种初始色彩映射关系，以及每种初始色彩映射关系对应的权重，确定目标色彩映射关系，所述目标色彩映射关系用于将所述待处理图像的所述目标属性转换成所述参考图像的所述目标属性；利用所述目标色彩映射关系对所述待处理图像进行映射处理，得到所述目标图像。
根据权利要求1-10任一项所述的方法，其特征在于，所述目标属性包括以下一种或多种：图像风格、图像的动态范围、图像中的人物风格。
根据权利要求1-11任一项所述的方法，其特征在于，每种初始色彩映射关系通过一个N维查找表表征，其中，N为正整数。
根据权利要求1-12任一项所述的方法，其特征在于，所述权重基于所述待处理图像和所述参考图像确定，包括：

分别对所述待处理图像和所述参考图像进行特征提取；

基于提取到的特征确定所述权重。
根据权利要求1-13任一项所述的方法，其特征在于，基于所述待处理图像和所述参考图像确定所述权重的步骤由预先训练的生成对抗网络执行。
根据权利要求14所述的方法，其特征在于，所述生成对抗网络基于以下方式训练得到：

获取样本图像对，所述样本图像对包括第三图像和第四图像；

将所述第三图像和所述第四图像输入到生成对抗网络的生成器中，得到预设的每种初始色彩映射关系对应的权重；

基于所述权重、预设的每种色彩映射关系对所述第三图像进行处理，得到目标属性和所述第四图像的所述目标属性相匹配的第五图像；

基于生成对抗网络的判别器对所述第四图像和所述第五图像的判别结果构建目标损失，基于所述目标损失对所述生成对抗网络进行训练。
一种生成对抗网络的训练方法，其特征在于，所述方法包括：

获取样本图像对，所述样本图像对包括第三图像和第四图像；

将所述第三图像和所述第四图像输入到生成对抗网络的生成器中，得到预设的每种初始色彩映射关系对应的权重；

基于所述权重、预设的每种色彩映射关系对所述第三图像进行处理，得到目标属性和所述第四图像的所述目标属性相匹配的第五图像；

基于生成对抗网络的判别器对所述第四图像和所述第五图像的判别结果构建目标损失，基于所述目标损失对所述生成对抗网络进行训练。
一种图像处理装置，其特征在于，所述装置包括处理器、存储器、存储于所述存储器可供所述处理器执行的计算机程序，所述处理器执行所述计算机程序时，可实现以下步骤：

响应于用户的触发指令，获取待处理图像和所述待处理图像的参考图像；

根据预设的至少一种初始色彩映射关系，以及每种初始色彩映射关系对应的权重对所述待处理图像进行处理，得到目标图像，以将所述目标图像显示在用户交互界面上；其中，所述目标图像的目标属性与所述参考图像的所述目标属性一致，所述权重基于所述待处理图像和所述参考图像确定。
根据权利要求7所述的装置，其特征在于，所述待处理图像为视频中的多个视频帧，所述多个视频帧的参考图像为同一帧图像；或

所述待处理图像为视频中的多个视频帧，所述多个视频帧的参考图像为多帧第一图像，每帧所述第一图像作为一个或多个视频帧的参考图像；或

所述待处理图像为第一视频中的第一视频帧，所述第一视频帧的参考图像为第二视频中的第二视频帧，每个第二视频帧作为一个或多个第一视频帧的参考图像。
根据权利要求17或18所述的装置，其特征在于，所述处理器用于响应于用户的触发指令，获取待处理图像和所述待处理图像的参考图像时，具体用于：

响应于用户的触发指令，获取用户导入的图像或视频作为所述待处理图像，以及获取用户导入的图像或视频作为所述参考图像。
根据权利要求17或18所述的装置，其特征在于，所述处理器用于响应于用户的触发指令，获取待处理图像和所述待处理图像的参考图像时，具体用于：

在用户交互界面显示图像或视频的情况下，响应于用户的触发指令，获取所述用户交互界面上显示的图像或视频中的视频帧作为所述待处理图像，获取用户导入的图像或视频中的视频帧作为所述参考图像。
根据权利要求17或18所述的装置，其特征在于，所述处理器用于响应于用户的触发指令，获取待处理图像和所述待处理图像的参考图像时，具体用于：

响应于用户的触发指令，调用摄像头采集图像或视频；

在完成图像或视频的采集后，获取摄像头采集的图像或视频中的视频帧作为所述待处理图像，获取用户导入的图像或视频中的视频帧作为所述参考图像。
根据权利要求17或18所述的装置，其特征在于，所述处理器用于响应于用户的触发指令，获取待处理图像和所述待处理图像的参考图像时，具体用于：

响应于用户的触发指令，调用摄像头采集一段视频；

在完成视频的采集后，将采集的视频中的视频帧作为所述待处理图像，并获取预先存储的第二图像作为所述参考图像。
根据权利要求22所述的装置，其特征在于，所述第二图像包括所述目标属性按照预定方式变化的多帧图像，使得处理后的所述视频中的视频帧的所述目标属性按照预定方式变化。
根据权利要求23所述的装置，其特征在于，所述处理后的所述视频中的视频帧的所述目标属性按照预定方式变化，包括：

所述目标属性为图像风格，处理后的所述视频中的视频帧的图像风格按照季节更替变化；或

所述目标属性为图像风格，处理后的所述视频中的视频帧的图像风格按照日夜更替变化；或

所述目标属性为图像中的人物风格，处理后的所述视频中的视频帧的人物风格按照年龄增长变化。
根据权利要求24所述的装置，其特征在于，所述处理器用于将采集的视频中的各视频帧作为所述待处理图像，并获取预先存储的第二图像作为所述参考图像时，具体用于：

将采集的视频划分成多段子视频，所述子视频的数量与所述第二图像的数量一致，每段子视频对应一帧所述第二图像；

针对每段子视频，将所述每段子视频中的视频帧作为所述待处理图像，将所述每段子视频对应的所述第二图像作为所述参考图像。
根据权利要求17-25任一项所述的装置，其特征在于，所述处理器用于基于预设的至少一种初始色彩映射关系，以及每种初始色彩映射关系对应的权重对所述待处理图像进行处理，得到目标图像时，具体用于：

基于预设的至少一种初始色彩映射关系分别对所述待处理图像进行映射处理，得到利用每种初始色彩映射关系映射后的图像；基于每种初始色彩映射关系对应的权重对利用该种初始色彩映射关系映射后的图像进行处理，并对处理后的图像进行融合，得到所述目标图像；或

基于预设的至少一种初始色彩映射关系，以及每种初始色彩映射关系对应的权重，确定目标色彩映射关系，所述目标色彩映射关系用于将所述待处理图像的所述目标属性转换成所述参考图像的所述目标属性；利用所述目标色彩映射关系对所述待处理图像进行映射处理，得到所述目标图像。
根据权利要求17-26任一项所述的装置，其特征在于，所述目标属性包括以下一种或多种：图像风格、图像的动态范围、图像中的人物风格。
根据权利要求17-27任一项所述的装置，其特征在于，每种初始色彩映射关系通过一个N维查找表表征，其中，N为正整数。
根据权利要求17-28任一项所述的装置，其特征在于，所述权重基于所述待处理图像和所述参考图像确定，包括：

分别对所述待处理图像和所述参考图像进行特征提取；

基于提取到的特征确定所述权重。
根据权利要求17-29任一项所述的装置，其特征在于，基于所述待处理图像和所述参考图像确定所述权重的步骤由预先训练的生成对抗网络执行。
根据权利要求30所述的装置，其特征在于，所述生成对抗网络基于以下方式训练得到：

获取样本图像对，所述样本图像对包括第三图像和第四图像；

将所述第三图像和所述第四图像输入到生成对抗网络的生成器中，得到预设的每种初始色彩映射关系对应的权重；

基于所述权重、预设的每种色彩映射关系对第三图像进行处理，得到目标属性和第四图像的所述目标属性相匹配的第五图像；

基于生成对抗网络的判别器对所述第四图像和所述第五图像的判别结果构建目标损失，基于所述目标损失对所述生成对抗网络进行训练。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被执行时实现权利要求1-15和/或权利要求16任一项所述的方法。