WO2022166896A1

WO2022166896A1 - 视频生成方法、装置、设备及可读存储介质

Info

Publication number: WO2022166896A1
Application number: PCT/CN2022/075037
Authority: WO
Inventors: 王旭; 刘凯
Original assignee: 北京字跳网络技术有限公司
Priority date: 2021-02-05
Filing date: 2022-01-29
Publication date: 2022-08-11
Also published as: US20240095981A1; BR112023015702A2; JP2024506014A; CN112995534B; EP4277261A1; EP4277261A4; CN112995534A

Abstract

本公开实施例提供一种视频生成方法、装置、设备及可读存储介质，电子设备获取到源图像后，基于源图像按照颜色从浅到深的顺序生成模拟画家绘制目标素描过程中不同阶段的素描图像，针对每个目标素描图像，按照绘制完成度从高到底的顺序生成模拟画家绘制该素描图像的过程中的多个子图，然后将多个素描图像中各个素描图像的各个子图作为素描绘制视频的视频帧，按照颜色深度从浅到深的顺序以及绘制完成度从低到高的顺序设置视频帧的顺序，生成素描绘制视频。该过程中，通过图像处理模拟画家创作素描图像的各个阶段，过程简单，且无需进行深度学习过程，效率高。

Description

视频生成方法、装置、设备及可读存储介质

相关申请交叉引用

本申请要求于2021年02月05日提交中国专利局、申请号为202110163139.8、发明名称为“视频生成方法、装置、设备及可读存储介质”的中国专利申请的优先权，其全部内容通过引用并入本文。

技术领域

本公开实施例涉及图像处理技术领域，尤其涉及一种视频生成方法、装置、设备及可读存储介质。

背景技术

素描是图像风格化的一种，现实中的素描是以铅笔为媒介，用线条来表现景物或人物的艺术形式。素描可以分为线条结构画和精细写实素描两种。手工创作素描要求作者具有一定的美术功底。

随着终端设备的智能化，用户利用终端设备能够得到素描图像等。获取素描图像的过程中，终端设备对用户选中的源图像进行风格转换处理，从而得到一幅素描图像。随着视频等的发展，用户不再满足于获取静态图像，而是期望能够获得一段动态视频，模拟画家作画的过程，一笔一笔的绘制出素描图像。

然而，现有的视频大多数都是具有美术功底的画家现场作画录制的真实视频，对于普通用户而言，难度大，基本无法实现。

发明内容

本公开实施例提供一种视频生成方法、装置、设备及可读存储介质，基于图像，生成模拟画家一笔一划创作素描图像的视频，过程简单。

第一方面，本公开实施例提供一种视频生成方法，包括：

获取源图像；

根据所述源图像，生成多个素描图像，所述多个素描图像分别对应于所述源图像在不同颜色深度下的素描图像；

基于目标素描图像，生成所述目标素描图像的多个子图，所述多个子图分别对应于所述目标素描图像在不同绘制完成度下的素描图像，所述目标素描图像是所述多个素描图像中的任意一个素描图像；

将所述多个素描图像中各个素描图像的各个子图作为素描绘制视频的视频帧，按照颜色深度从浅到深的顺序以及绘制完成度从低到高的顺序设置所述视频帧的顺序，生成所述素描绘制视频。

第二方面，本公开提供一种视频生成装置，包括：

获取单元，用于获取源图像；

第一生成单元，用于根据所述源图像，生成多个素描图像，所述多个素描图像分别对应于所述源图像在不同颜色深度下的素描图像；

第二生成单元，用于基于目标素描图像，生成所述目标素描图像的多个子图，所述多个子图分别对应于所述目标素描图像在不同绘制完成度下的素描图像，所述目标素描图像是所述多个素描图像中的任意一个素描图像；

第三生成单元，用于将所述多个素描图像中各个素描图像的各个子图作为素描绘制视频的视频帧，按照颜色深度从浅到深的顺序以及绘制完成度从低到高的顺序设置所述视频帧的顺序，生成所述素描绘制视频。

第三方面，根据本公开的一个或多个实施例，提供了一种电子设备，包括：至少一个处理器和存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的视频生成方法。

第四方面，根据本公开的一个或多个实施例，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如上第一方面以及第一方面各种可能的设计所述的视频生成方法。

第五方面，本公开实施例提供一种计算机程序产品，所述计算机程序产品包括：计算机程序，所述计算机程序存储在可读存储介质中，电子设备的至少一个处理器从所述可读存储介质读取所述计算机程序，所述至少一个处理器执行所述计算机程序使得电子设备执行如上第一方面以及第一方面各种可能的设计所述的视频生成方法。

第六方面，本公开实施例提供一种计算机程序，该计算机程序被处理器执行时实现如上第一方面以及第一方面各种可能的设计所述的视频生成方法。

本公开实施例提供的视频生成方法、装置、设备及可读存储介质，电子设备获取到源图像后，基于源图像按照颜色从浅到深的顺序生成模拟画家绘制目标素描过程中不同阶段的素描图像，针对每个目标素描图像，按照绘制完成度从高到底的顺序生成模拟画家绘制该素描图像的过程中的多个子图，然后将多个素描图像中各个素描图像的各个子图作为素描绘制视频的视频帧，按照颜色深度从浅到深的顺序以及绘制完成度从低到高的顺序设置视频帧的顺序，生成素描绘制视频。该过程中，通过图像处理模拟画家创作素描图像的各个阶段，过程简单，且无需进行深度学习过程，效率高。

附图说明

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本公开实施例提供一种视频生成方法的网络架构示意图；

图2是本申请实施例提供的视频生成方法的流程图；

图3是本公开是实施例提供的多个素描图像的示意图；

图4是本公开是实施例提供的多个子图的示意图；

图5是本公开提供的视频生成方法中绘制子图的过程示意图；

图6是本公开提供的视频生成方法的过程示意图；

图7是本公开提供的视频生成方法中人脸关键点的示意图；

图8是本公开提供的视频生成方法中头发区域的第二掩膜的示意图；

图9是本公开提供的视频生成方法中第一凸包区域和第二凸包区域的示意图；

图10为本公开实施例提供的一种视频生成装置的结构框图；

图11为用来实现本公开实施例的电子设备的结构示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

目前，很多铅笔画素描作画过程的短视频深受用户的欢迎，该类视频是对专业画家现场创作铅笔画素描的过程进行拍摄得到。由于普通用户没有美术功底，显然，上述现场拍摄录制短视频的方式对普通用户不适用。

因此，本公开考虑基于源图像和目标素描，生成模拟画家一笔一划作画过程的视频，过程简单，满足广大普通用户的需求。

图1是本公开实施例提供一种视频生成方法的网络架构示意图。请参照图1，该网络架构包括终端设备1、服务器2和网络3，终端设备1和服务器2通过网络3建立网络连接。网络3包括各种网络连接类型，如有线、无线通信链路或光纤电缆等。

用户使用终端设备1通过网络3与服务器2进行交互，以接收或发送消息等。终端设备1上安装有各种通讯客户端应用，如视频播放类应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备1可以是硬件也可以是软件。当终端设备1为硬件时，终端设备1例如为手机、平板电脑、电子书阅读器、膝上型便携电脑、台式计算机等。当终端设备1为软件时，其可以安装在上述列举的硬件设备中，此时，终端设备1例如为多个软件模块或单个软件模块等，本公开实施例并不限制。

服务器2是能够提供多种服务器的服务器，用于接收终端设备发送的源图像，基于源图像生成模拟画家一笔一划创作素描图像的视频。

服务器2可以是硬件也可以是软件。当服务器2为硬件时，该服务器2为单个服务器或多个服务器组成的分布式服务器集群。当服务器2为软件时，可以为多个软件模块或单个软件模块等，本公开实施例并不限制。

应当理解的是，图1中的终端设备1、服务器2和网络3的数量仅仅是示意性的。实际实现中，根据实际需求部署任意数量的电子设备1、服务器2和网络3。

另外，当本公开的视频生成方法由终端设备1执行时，由于无需联网，因此上述图1中的服务器2和网络3可以不存在。

下面，基于图1所示网络架构，对本申请实施例所述的视频生成方法进行详细说明。示例性的，请参照图2。

图2是本申请实施例提供的视频生成方法的流程图。本实施例的执行主体为电子设备，该电子设备例如为上述图1中的终端设备或服务器。本实施例包括：

101、获取源图像。

示例性的，电子设备从本地获取源图像，或者，从互联网获取源图像。源图像也称为(image_src)。源图像为红绿蓝(red green blue，RGB)图像、黑白照片等，本公开实施例并不限制。

102、根据所述源图像，生成多个素描图像。

其中，所述多个素描图像分别对应于所述源图像在不同颜色深度下的素描图像。

示例性的，专业画家创作素描图像的过程是一个循序渐进的过程，整个作品视觉上的感受是颜色从浅到深。本步骤中，电子设备根据源图像，产生多个素描图像，该些素描图像颜色依次加深。示例性的，请参照图3。

图3是本公开是实施例提供的多个素描图像的示意图。请参照图3，最左边为源图像，其可以是彩色的RGB图像或黑白照片等，①-④为不同的素描图像。实际创作过程中，一幅作品的实际产生过程为从①到④。因此，电子设备利用图像处理算法对源图像进行处理，从而基于源图像得到素描图像①-④。其中，素描图像④例如是最终的产品，即等同于专业画家创作的成品。

需要说明的是，上述的素描图像①-④仅是示例性的说明不同的素描图像，并不代表一定是4个素描图像。实际实现中，颜色从浅至深的素描图像的数量可小于或大于4。

103、基于目标素描图像，生成所述目标素描图像的多个子图。

其中，所述多个子图分别对应于所述目标素描图像在不同绘制完成度下的素描图像，所述目标素描图像是所述多个素描图像中的任意一个素描图像。

示例性的，对于上述多个素描图像中的任意一个素描图像，以下称之为目标素描图像，专业画家创作该目标素描图像时，不可能一笔完成，而是一步一步的多次绘制完成。为了模拟该过程，电子设备针对目标素描图像，生成不同绘制完成度下的素描图像，以下称之为子图。对于相邻的第一子图和第二子图而言，第二子图包含的笔触区域多于第一子图包含的笔触区域。例如，绘制完成度指示先画嘴巴再画眼睛，则第一子图包含绘制好的嘴巴，第二子图除了绘制好的嘴巴外，还包括绘制好的眼睛。

另外，即使同一个部位，也可能需要多笔才能绘制完成。比如，第一子图包含绘制好的嘴巴轮廓，第二子图除了包含绘制好的嘴巴轮廓外，还包括对嘴巴的填充等。

下面，以人脸轮廓为例，对多个子图进行相似说明。示例性的，请参照他4，图4是本公开是实施例提供的多个子图的示意图。

请参照图4，假设视频的长度为15秒，每秒30帧，共包含450帧图像。该450帧图像中的30帧用于人脸轮廓的绘制，则相当于有30个子图，该30帧的图像相当于模拟专业画家30笔画完人脸轮廓。多个子图中的笔触区域增多。笔触区域即为人脸轮廓，如图4所示，30帧图像中，第一帧图像中的人脸轮廓最少，第二帧图像中人脸轮廓逐渐增多，到第30帧图像中，整个人脸轮廓被绘制出。

104、将所述多个素描图像中各个素描图像的各个子图作为素描绘制视频的视频帧，按照颜色深度从浅到深的顺序以及绘制完成度从低到高的顺序设置所述视频帧的顺序，生成所述素描绘制视频。

示例性的，电子设备生成多个素描图像中各素描图像的子图后，将所有的子图作为视频帧。之后，按照绘制完成度从低到高的顺序，设置目标素描图像的各个子图的顺序，从而得到模拟创作目标素描图像的子视频，进而按照颜色从浅到深的顺序，设置各子视频的顺序并合成该些子视频，从而得到素描绘制视频。

当电子设备为服务器时，电子设备将素描绘制视频发送给手机等移动终端，供手机等移动终端播放素描绘制视频。或者，当电子设备为手机等移动终端时，直接播放该素描绘制视频或者将视素描绘制频存储在本地等。

本公开实施例提供的视频生成方法，电子设备获取到源图像后，基于源图像按照颜色从浅到深的顺序生成模拟画家绘制目标素描过程中不同阶段的素描图像，针对每个目标素描图像，按照绘制完成度从高到底的顺序生成模拟画家绘制该素描图像的过程中的多个子图，然后将多个素描图像中各个素描图像的各个子图作为素描绘制视频的视频帧，按照颜色深度从浅到深的顺序以及绘制完成度从低到高的顺序设置视频帧的顺序，生成素描绘制视频。该过程中，通过图像处理模拟画家创作素描图像的各个阶段，过程简单，且无需进行深度学习过程，效率高。

上述实施例中，电子设备基于目标素描图像，生成所述目标素描图像的多个子图时，确定第一掩膜中像素的掩膜值的增长顺序，所述第一掩膜中像素的初始掩膜值为0，所述第一掩膜中像素的增长用于指示所述像素的掩膜值从0变更为1，所述第一掩膜用于使得所述目标素描图像的背景根据所述增长顺序逐渐转变为所述目标素描图像。然后，根据所述增长顺序、所述目标素描图像和所述目标素描图像的背景，生成所述多个子图，所述增长顺序中的每次增长与所述多个子图中的子图一一对应。

示例性的，对于多个素描图像中的任意一个素描图像，以下称为目标素描图像，电子设备为该目标素描图像设置一个第一掩膜(mask)，第一掩膜上的像素的初始掩膜值均为0。之后，电子设备确定第一掩膜中像素的增长顺序，一次增长顺序用于指示哪些像素的掩膜值从0变为1，每次增长对应专业画家作画过程中的一笔或多笔。例如，某次增长指示上嘴唇轮廓的像素点的掩膜值从0变化为1，那么根据该此增长能够绘制出上嘴唇轮廓。

采用该种方案，通过生成绘制笔画素描过程中不同阶段的子图，实现精确模拟画家绘制素描图像的目的。

上述实施例中，电子设备根据所述增长顺序、所述目标素描图像和所述目标素描图像的背景，生成所述多个子图时，首先，针对所述增长顺序中的每次增长，从所述第一掩膜中确定出所述增长对应的第一像素集合。

示例性的，颜色从浅至深的多个素描图像中，对于相邻的两个素描图像而已，真实创作过程中后一个素描图像实际上是在前一个素描图像的基础上继续绘制得到的。

因此，创作目标素描图像的过程，实际上是在目标素描图像的背景上进行绘制，使得背景转变为目标素描图像的过程。为了实现该过程，需要控制第一掩膜中像素的掩膜值的变化。比如，初始时，第一掩膜中各像素的掩膜值均为0，此时，背景未发生任何变化。每次增长过程中，电子设备根据该此增长，从第一掩膜中确定出第一像素集合。例如，某次增长时，第一掩膜中代表上嘴唇轮廓的像素的掩膜值变化为1，则将代表上嘴唇轮廓的像素作为第一像素集合。

然后，根据所述第一像素集合，从所述目标素描图像中确定出第二像素集合，并从所述背景中确定出第三像素集合，所述第一像素集合、所述第二像素集合和所述第三像素集合中的像素一一对应。

示例性的，目标素描图像、第一掩膜和背景的像素一一对应，因此，电子设备从第一掩膜中确定出第一像素集合后，就能够从目标素描图像中确定出第二像素集合，并从背景中确定出第三像素集合。

之后，电子设备根据所述第一像素集合中第一像素的掩膜值、所述第二像素集合中的第二像素的像素值、所述第三像素集合中第三像素的像素值，确定第四像素的像素值，所述第四像素的像素值＝所述第一像素的掩膜值×所述第二像素的像素值+所述第三像素的像素值×(1-所述第一像素的掩膜值)。将背景中的第三像素更新为第四像素，得到所述增长对应的子图。

示例性的，请参照图5，图5是本公开提供的视频生成方法中绘制子图的过程示意图。请参照图5，背景上各像素的像素值为255，也就是说，背景为纯白背景。假设第一掩膜的某次增长对应的像素为掩膜值为1的6个像素，则最终在背景上绘制出包含该6个像素的折线，该6个像素的灰度值分别为90、0、23、23、255、89。

采用该种方案，通过模拟在背景上绘制各个子图的过程，实现精确模拟画家绘制素描图像的目的。

上述实施例中，当所述目标素描图像不是所述多个素描图像中颜色最浅的素描图像时，所述背景是所述背景是所述多个素描图像中与所述目标素描图像相邻、且位于所述目标素描图像之前的素描图像；当所述目标素描图像是所述多个素描图像中颜色最深的素描图像时，所述背景是尺寸与所述目标素描图像尺寸相同的白色图像。

示例性的，再请参照图3，素描图像②是对素描图像①继续绘制得到的，素描图像③是在素描图像②的基础上得到的。素描图像①实际上是在白色背景上绘制得到的。也就是说，素描图像①背景是白色背景，该白色背景的每个像素的像素值为255，素描图像②的背景是素描图像①，依次类推。

采用该种方案，不同阶段的素描图像对应不同的背景，实现精确模拟画家绘制素描图像的目的。

上述实施例中，第一掩膜的增长顺序中的每次增值与多个子图中的子图一一对应，增长顺序包括所述源图像中人物的人脸轮廓的增长顺序。当源图像中包含人物时，电子设备确定第一掩膜中像素的掩膜值的增长顺序时，首先，提取所述源图像中的人脸关键点，得到关键点集合。之后，电子设备根据所述源图像，确定所述源图像中人物的头发区域的第二掩膜。然后，电子设备根据所述关键点集合，确定出所述人物的人脸的第一凸包区域；根据所述第一凸包区域和所述第二掩膜的交集，从所述第一掩膜中确定出第二凸包区域。最后，电子设备在所述第二凸包区域上按照笔触速度依次连接所述关键点集合中的人脸轮廓关键点，得到所述源图像中人物人脸轮廓的增长顺序，所述笔触速度根据所述视频的时长确定出。

示例性的，请参照图6，图6是本公开提供的视频生成方法的过程示意图。请参照图6，获取到源图像后，电子设备利用人脸关键点检测模型，提取出五官关键点和人脸轮廓关键点，并利用头发分割模型，确定出人物的头发区域的第二掩膜。

图7是本公开提供的视频生成方法中人脸关键点的示意图。请参照图7，人脸关键点包括左眉毛、右眉毛、左眼、右眼、鼻子、嘴巴和人脸轮廓7部分的关键点。图中关键点旁边的数字代表关键点的序号，比如，人脸轮廓共有34个关键点，则序号1-序号34各自代表的关键点为人脸轮廓的关键点。

图8是本公开提供的视频生成方法中头发区域的第二掩膜的示意图，请参照图8，头发区域的第二掩膜的作用是避免模拟作画过程中顺序混乱的问题，比如，实际作画时，先绘制人脸轮廓，再绘制画眉毛，再绘制眼睛，最后补头发，而不是头发先出现。因此，利用第二掩膜能够遮挡住头发区域，避免模拟作画过程中先出现头发，导致整个模拟过程很不自然。

绘制人脸轮廓时，首先要确定第一掩膜中人脸轮廓的增长顺序。确定过程中，电子设备根据关键点集合，从第一掩膜中确定出第一凸包区域。例如，电子设备将按次序连接人脸轮廓关键点、左眉毛关键点和右眉毛关键点，就能够得到第一凸包区域。之后，电子设备确定第一凸包区域和图8所述第二掩膜的交集，就能够确定出第二凸包区域。

图9是本公开提供的视频生成方法中第一凸包区域和第二凸包区域的示意图，请参照图9，由于第一凸包区域中存在头发遮挡的区域，为了避免模拟绘制过程中先出现头发的问题，需要将第一凸包区域中被头发遮挡的区域去除，从而得到第二凸包区域。根据第二凸包区域就能够从背景中确定出人脸的位置。接下来，需要在背景中人脸的位置绘制人脸轮廓、五官等，然后，绘制头发和人物以外的区域，使得目标素描图像在背景上一点点的出现，从而模拟出绘制目标素描图像的过程。

绘制人脸轮廓的过程，实际上是第一掩膜中代表人脸轮廓的像素的掩膜值依次从0变化为1的过程，即第一掩膜中代表人脸轮廓的像素的增长过程。该增长过程包括增长顺序和笔触速度，增长顺序是将人脸轮廓关键点依次连接的过程，比如，将第1-34个人脸轮廓关键点依次连接，从而得到人脸轮廓的增长顺序。增长速度根据视频的长度确定出。例如，一个450帧的视频，想要3笔画完人脸轮廓，则相当于第一掩膜在人脸轮廓的绘制过程中增长3次，每次大概增长11个像素，从视觉上看，相当于模拟画家3笔完成人脸轮廓的绘制，对应三个子图，即三个图像帧。再如，想要一秒绘制出人脸轮廓，则相当于第一掩膜增长30次，相当于模拟画家30笔绘制完人脸轮廓的过程。

绘制出人脸轮廓后，第一mask上人脸轮廓位置的掩膜值为1。后续绘制五官的过程中，人脸轮廓的掩膜值继续保持1。

采用该种方案，实现精确模拟画家绘制人脸轮廓的过程。

再请参照图6，电子设备确定出人脸轮廓的增长顺序后，还需要确定各个五官区域的增长顺序。确定过程中，电子设备从所述关键点集合中确定出所述人脸不同区域的关键点；根据各区域的关键点，对所述人脸的各区域进行插值；根据插值后区域，在所述第二凸包区域上按照笔触速度，确定所述源图像中人物的人脸中对应区域的增长顺序。

示例性的，人脸轮廓比较简单，人脸关键点依次连接得到的折现就能够表示人脸轮廓。但是，对于五官区域而言，由于五官区域的关键点依次连接得到的图像并不能满足写实的素描图像，比如，请参照图7，左眉毛的两行关键点依次连接后，中间有空白部分，显然，这是无法满足素描图像的要求的。而且，若将每行关键点依次连接，形成两笔绘制出左眉毛的效果显然是不合理的。因此，对于五官区域而言，依次连接关键点是远远不够的，此时需要对不同的五官区域使用不同的方式进行插值，根据插值后的区域，在背景中第二凸包的区域内按照笔触速度，确定出五官区域对应的增值顺序，为后续分策略绘制五官做准备。

采用该种方案，对不同的五官区域使用不同的差值算法，实现精确模拟画家绘制五官的过程。

上述实施例中，电子设备对所述人脸的不同区域，根据所述区域的关键点进行插值时，对于人脸中的眉毛区域，根据所述眉毛区域的关键点横向插值多条曲线。

示例性的，再请参照图7，以左眉毛区域为例，左眉毛的关键点包含两行关键点，上一行的关键点和下一行的关键点一一对应，对于每组关键点，电子设备确定出平均值，从而将左眉毛区域的关键点插值为3行关键点。进一步的，电子设备还可以将左眉毛区域的关键点插值为4行或5行，本公开实施例并不限制，行数和精度有关。插值后，需要七八笔才能绘制出左眉毛，能够更合理的模拟出画家作画的过程。

对于所述人脸区域中的眼球区域，根据所述眼球区域的关键点，按照圆形区域对所述眼球区域插值。

示例性的，由于眼球是圆形的，不能一横一横的去绘制瞳孔。因此，对于眼球区域，使用圆形插值的方式，先画一个代表眼球的圆，再插值出一个个的小圆圈，直到形成一个实心的圆。插值过程中，确定眼球的圆心和圆周上的点的平均值，将该平均值作为半径，将眼球的圆心为中心插值出一个圆。从第一掩膜的角度来看，第一掩膜增长时，每次增长的像素形成的图像不是折线，而是一个或多个圆圈。

对于所述人脸区域中的嘴巴区域，根据所述嘴巴区域的关键点，竖向插值多条曲线。

示例性的，嘴巴区域的关键点仅能绘制出嘴巴轮廓，完成嘴巴轮廓后，填充时按照竖线来插值。从第一掩膜的角度来看，第一掩膜完成嘴巴轮廓的增长后，对于嘴唇部分，每次增长的像素形成的图像是一条条的竖线。

采用该种方案，通过对五官区域使用不同的差值算法，实现精确模拟画家绘制五官的过程。

上述实施例中，电子设备绘制出人脸轮廓和五官后，用最后几帧图像补充头发和人物以外的背景区域。例如，450帧的视频中，90帧用于产生图3中的素描图像①，该90帧中的前88帧用于绘制脸部轮廓和五官，第89帧用于添加头发，第90帧用于添加人物以外的背景区域。

上述实施例中，电子设备根据所述源图像，生成多个素描图像时，首先，基于所述源图像，生成灰度图。然后，电子设备确定多个高斯核，所述多个高斯核中的高斯核和所述多个素描图像中的素描图像一一对应，颜色较深的素描图像的对应的高斯核的尺寸大于颜色较浅的素描图像对应的高斯核。接着，电子设备根据所述多个高斯核，分别对所述灰度图进行高斯模糊，得到所述多个高斯核中各高斯核对应的高斯模糊图。最后，电子设备根据所述多个高斯核中各高斯核对应的高斯模糊图和所述灰度图，生成所述多个素描图像。

示例性的，电子设备获取到源图像后，对源图像进行中值滤波等进行降噪处理。之后，电子设备对源图像的每个像素进行灰度处理，从而将源图像转换成灰度图。得到灰度图像后，电子设备根据高斯卷积等确定高斯模糊对应的高斯核(kernel)，使用该高斯kernel对灰度图进行高斯模糊，得到高斯模糊图。高斯核的尺寸越大，则使用该高斯核对灰度图进行高斯模型得到的高斯模糊图的颜色越深。

得到多个素描图像中各素描图像对应的高斯模糊图后，电子设备将高斯模糊图和灰度图作为素材，生成黑白素描图像。例如，电子设备对高斯模糊图的像素和灰度图中对应像素进行融合处理，从而生成素描图像。融合过程中，源图像、灰度图、高斯模糊图和素描图像的尺寸相同、像素一一对应。因此，电子设备能够根据灰度图和高斯模糊图中像素的像素值，确定出黑白素描图像中对应像素的像素值，进而得到素描图像。例如，生成高斯模糊图后，电子设备采用减淡(dodge)模式进行效果提取，即采用如下公式(1)进行提取：

image_target＝(image_gray/gray_blur)×255 公式(1)

其中，image_target表示素描图像中像素的像素值，image_gray表示灰度图中像素的像素值，gray_blur1表示高斯模糊图中像素的像素值。

采用该种方案，基于不同高斯kernel的dodge能够得到不同层次的素描图像。

对应于上文实施例的视频生成方法，图10为本公开实施例提供的一种视频生成装置的结构框图。为了便于说明，仅示出了与本公开实施例相关的部分。请参照图10，所述设备包括：获取单元11、第一生成单元12、第二生成单元13和第三生成单元14。

获取单元11，用于获取源图像。

第一生成单元12，用于根据所述源图像，生成多个素描图像，所述多个素描图像分别对应于所述源图像在不同颜色深度下的素描图像。

第二生成单元13，用于基于目标素描图像，生成所述目标素描图像的多个子图，所述多个子图分别对应于所述目标素描图像在不同绘制完成度下的素描图像，所述目标素描图像是所述多个素描图像中的任意一个素描图像。

第三生成单元14，用于将所述多个素描图像中各个素描图像的各个子图作为素描绘制视频的视频帧，按照颜色深度从浅到深的顺序以及绘制完成度从低到高的顺序设置所述视频帧的顺序，生成所述素描绘制视频。

在本公开的一个实施例中，所述第二生成单元13，用于确定第一掩膜中像素的掩膜值的增长顺序，所述第一掩膜中像素的初始掩膜值为0，所述第一掩膜中像素的增长用于指示所述像素的掩膜值从0变更为1，所述第一掩膜用于使得所述目标素描图像的背景根据所述增长顺序逐渐转变为所述目标素描图像；根据所述增长顺序、所述目标素描图像和所述目标素描图像的背景，生成所述多个子图，所述增长顺序中的每次增长与所述多个子图中的子图一一对应。

在本公开的一个实施例中，所述第二生成单元13根据所述增长顺序、所述目标素描图像和所述目标素描图像的背景，生成所述多个子图时，用于针对所述增长顺序中的每次增长，从所述第一掩膜中确定出所述增长对应的第一像素集合；根据所述第一像素集合，从所述目标素描图像中确定出第二像素集合，并从所述背景中确定出第三像素集合，所述第一像素集合、所述第二像素集合和所述第三像素集合中的像素一一对应；根据所述第一像素集合中第一像素的掩膜值、所述第二像素集合中的第二像素的像素值、所述第三像素集合中第三像素的像素值，确定第四像素的像素值，所述第四像素的像素值＝所述第一像素的掩膜值×所述第二像素的像素值+所述第三像素的像素值×(1-所述第一像素的掩膜值)；将所述背景中的所述第三像素更新为所述第四像素，得到所述增长对应的子图。

在本公开的一个实施例中，当所述目标素描图像不是所述多个素描图像中的颜色最浅的素描图像时，所述背景是所述多个素描图像中与所述目标素描图像相邻、且位于所述目标素描图像之前的素描图像；当所述目标素描图像是所述多个素描图像中颜色最浅的素描图像时，所述背景是尺寸与所述目标素描图像尺寸相同的白色图像。

在本公开的一个实施例中，所述源图像中包含人物，所述增长顺序包括所述源图像中人物的人脸轮廓的增长顺序，所述第二生成单元13确定第一掩膜中像素的掩膜值的增长顺序时，用于提取所述源图像中的人脸关键点，得到关键点集合；根据所述源图像，确定所述源图像中人物的头发区域的第二掩膜；根据所述关键点集合，确定出所述人物的人脸的第一凸包区域；根据所述第一凸包区域和所述第二掩膜的交集，从所述第二掩膜中确定出第二凸包区域；在所述第二凸包区域上按照笔触速度依次连接所述关键点集合中的人脸轮廓关键点，得到所述源图像中人物人脸轮廓的增长顺序，所述笔触速度根据所述视频的时长确定出。

在本公开的一个实施例中，所述第二生成单元13在所述第二凸包区域上按照笔触速度依次连接所述关键点集合中的人脸轮廓关键点，得到所述源图像中人物的人脸轮廓的增长顺序之后，还用于从所述关键点集合中确定出所述人脸不同区域的关键点；根据各区域的关键点，对所述人脸的各区域进行插值；根据插值后区域，在所述第二凸包区域上按照笔触速度，确定所述源图像中人物的人脸中对应区域的增长顺序。

在本公开的一个实施例中，所述第二生成单元13对所述人脸的不同区域，根据所述区域的关键点进行插值时，对于所述人脸中的眉毛区域，根据所述眉毛区域的关键点横向插值多条曲线；对于所述人脸区域中的眼球区域，根据所述眼球区域的关键点，按照圆形区域对所述眼球区域插值；对于所述人脸区域中的嘴巴区域，根据所述嘴巴区域的关键点，竖向插值多条曲线。

在本公开的一个实施例中，所述第一生成单元12，用于基于所述源图像，生成灰度图；确定多个高斯核，所述多个高斯核中的高斯核和所述多个素描图像中的素描图像一一对应，颜色较深的素描图像的对应的高斯核的尺寸大于颜色较浅的素描图像对应的高斯核；根据所述多个高斯核，分别对所述灰度图进行高斯模糊，得到所述多个高斯核中各高斯核对应的高斯模糊图；根据所述多个高斯核中各高斯核对应的高斯模糊图和所述灰度图，生成所述多个素描图像。

本实施例提供的装置，可用于执行上述方法实施例的技术方案，其实现原理和技术效果类似，本实施例此处不再赘述。

图11为用来实现本公开实施例的电子设备的结构示意图，该电子设备200可以为终端设备或服务器。其中，终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、个人数字助理(Personal Digital Assistant，简称PDA)、平板电脑(Portable Android Device，简称PAD)、便携式多媒体播放器(Portable Media Player，简称PMP)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图11示出的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图11所示，电子设备200可以包括处理装置(例如中央处理器、图形处理器等)201，其可以根据存储在只读存储器(Read Only Memory，简称ROM)202中的程序或者从存储装置208加载到随机访问存储器(Random Access Memory，简称RAM)203中的程序而执行各种适当的动作和处理。在RAM 203中，还存储有电子设备200操作所需的各种程序和数据。处理装置201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(Input/Output，简称I/O)接口205也连接至总线204。

通常，以下装置可以连接至I/O接口205：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置206；包括例如液晶显示器(Liquid Crystal Display，简称LCD)、扬声器、振动器等的输出装置207；包括例如磁带、硬盘等的存储装置208；以及通信装置202。通信装置202可以允许电子设备200与其他设备进行无线或有线通信以交换数据。虽然图11示出了具有各种装置的电子设备200，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置202从网络上被下载和安装，或者从存储装置208被安装，或者从ROM 202被安装。在该计算机程序被处理装置201执行时，执行本公开实施例的方法中限定的上述功能。

需要说明的是，本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read-Only Memory，简称EPROM，或闪存)、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory，简称CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、射频(Radio Frequency，简称RF)等等，或者上述的任意合适的组合。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备执行上述实施例所示的方法。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码，上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(Local Area Network，简称LAN)或广域网(Wide Area Network，简称WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，单元的名称在某种情况下并不构成对该单元本身的限定，例如，第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。

本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：现场可编程门阵列(Field Programmable Gate Array，简称FPGA)、专用集成电路(Application Specific Integrated Circuit，简称ASIC)、专用标准产品(Application Specific Standard Parts，简称ASSP)、片上***(System on Chip，简称SOC)、复杂可编程逻辑设备(Complex Programmable Logic Device，简称CPLD)等等。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

第一方面，根据本公开的一个或多个实施例，提供了一种视频生成方法，包括：获取源图像；根据所述源图像，生成多个素描图像，所述多个素描图像分别对应于所述源图像在不同颜色深度下的素描图像；基于目标素描图像，生成所述目标素描图像的多个子图，所述多个子图分别对应于所述目标素描图像在不同绘制完成度下的素描图像，所述目标素描图像是所述多个素描图像中的任意一个素描图像；将所述多个素描图像中各个素描图像的各个子图作为素描绘制视频的视频帧，按照颜色深度从浅到深的顺序以及绘制完成度从低到高的顺序设置所述视频帧的顺序，生成所述素描绘制视频。

根据本公开的一个或多个实施例，所述基于目标素描图像，生成所述目标素描图像的多个子图，包括：确定第一掩膜中像素的掩膜值的增长顺序，所述第一掩膜中像素的初始掩膜值为0，所述第一掩膜中像素的增长用于指示所述像素的掩膜值从0变更为1，所述第一掩膜用于使得所述目标素描图像的背景根据所述增长顺序逐渐转变为所述目标素描图像；根据所述增长顺序、所述目标素描图像和所述目标素描图像的背景，生成所述多个子图，所述增长顺序中的每次增长与所述多个子图中的子图一一对应。

根据本公开的一个或多个实施例，所述根据所述增长顺序、所述目标素描图像和所述目标素描图像的背景，生成所述多个子图，包括：针对所述增长顺序中的每次增长，从所述第一掩膜中确定出所述增长对应的第一像素集合；根据所述第一像素集合，从所述目标素描图像中确定出第二像素集合，并从所述背景中确定出第三像素集合，所述第一像素集合、所述第二像素集合和所述第三像素集合中的像素一一对应；根据所述第一像素集合中第一像素的掩膜值、所述第二像素集合中的第二像素的像素值、所述第三像素集合中第三像素的像素值，确定第四像素的像素值，所述第四像素的像素值＝所述第一像素的掩膜值×所述第二像素的像素值+所述第三像素的像素值×(1-所述第一像素的掩膜值)；将所述背景中的所述第三像素更新为所述第四像素，得到所述增长对应的子图。

根据本公开的一个或多个实施例，当所述目标素描图像不是所述多个素描图像中的颜色最浅的素描图像时，所述背景是所述多个素描图像中与所述目标素描图像相邻、且位于所述目标素描图像之前的素描图像；当所述目标素描图像是所述多个素描图像中颜色最浅的素描图像时，所述背景是尺寸与所述目标素描图像尺寸相同的白色图像。

根据本公开的一个或多个实施例，所述源图像中包含人物，所述增长顺序包括所述源图像中人物的人脸轮廓的增长顺序，所述确定第一掩膜中像素的掩膜值的增长顺序，包括：提取所述源图像中的人脸关键点，得到关键点集合；根据所述源图像，确定所述源图像中人物的头发区域的第二掩膜；根据所述关键点集合，确定出所述人物的人脸的第一凸包区域；根据所述第一凸包区域和所述第二掩膜的交集，从所述第二掩膜中确定出第二凸包区域；在所述第二凸包区域上按照笔触速度依次连接所述关键点集合中的人脸轮廓关键点，得到所述源图像中人物人脸轮廓的增长顺序，所述笔触速度根据所述视频的时长确定出。

根据本公开的一个或多个实施例，所述在所述第二凸包区域上按照笔触速度依次连接所述关键点集合中的人脸轮廓关键点，得到所述源图像中人物的人脸轮廓的增长顺序之后，还包括：从所述关键点集合中确定出所述人脸不同区域的关键点；根据各区域的关键点，对所述人脸的各区域进行插值；根据插值后区域，在所述第二凸包区域上按照笔触速度，确定所述源图像中人物的人脸中对应区域的增长顺序。

根据本公开的一个或多个实施例，所述对所述人脸的不同区域，根据所述区域的关键点进行插值，包括：对于所述人脸中的眉毛区域，根据所述眉毛区域的关键点横向插值多条曲线；对于所述人脸区域中的眼球区域，根据所述眼球区域的关键点，按照圆形区域对所述眼球区域插值；对于所述人脸区域中的嘴巴区域，根据所述嘴巴区域的关键点，竖向插值多条曲线。

根据本公开的一个或多个实施例，所述根据所述源图像，生成多个素描图像，包括：基于所述源图像，生成灰度图；确定多个高斯核，所述多个高斯核中的高斯核和所述多个素描图像中的素描图像一一对应，颜色较深的素描图像的对应的高斯核的尺寸大于颜色较浅的素描图像对应的高斯核；根据所述多个高斯核，分别对所述灰度图进行高斯模糊，得到所述多个高斯核中各高斯核对应的高斯模糊图；根据所述多个高斯核中各高斯核对应的高斯模糊图和所述灰度图，生成所述多个素描图像。

第二方面，根据本公开的一个或多个实施例，提供了一种视频生成装置，包括：

获取单元，用于获取源图像；

根据本公开的一个或多个实施例，所述第二生成单元，用于确定第一掩膜中像素的掩膜值的增长顺序，所述第一掩膜中像素的初始掩膜值为0，所述第一掩膜中像素的增长用于指示所述像素的掩膜值从0变更为1，所述第一掩膜用于使得所述目标素描图像的背景根据所述增长顺序逐渐转变为所述目标素描图像；根据所述增长顺序、所述目标素描图像和所述目标素描图像的背景，生成所述多个子图，所述增长顺序中的每次增长与所述多个子图中的子图一一对应。

根据本公开的一个或多个实施例，所述第二生成单元根据所述增长顺序、所述目标素描图像和所述目标素描图像的背景，生成所述多个子图时，用于针对所述增长顺序中的每次增长，从所述第一掩膜中确定出所述增长对应的第一像素集合；根据所述第一像素集合，从所述目标素描图像中确定出第二像素集合，并从所述背景中确定出第三像素集合，所述第一像素集合、所述第二像素集合和所述第三像素集合中的像素一一对应；根据所述第一像素集合中第一像素的掩膜值、所述第二像素集合中的第二像素的像素值、所述第三像素集合中第三像素的像素值，确定第四像素的像素值，所述第四像素的像素值＝所述第一像素的掩膜值×所述第二像素的像素值+所述第三像素的像素值×(1-所述第一像素的掩膜值)；将所述背景中的所述第三像素更新为所述第四像素，得到所述增长对应的子图。

根据本公开的一个或多个实施例，所述源图像中包含人物，所述增长顺序包括所述源图像中人物的人脸轮廓的增长顺序，所述第二生成单元确定第一掩膜中像素的掩膜值的增长顺序时，用于提取所述源图像中的人脸关键点，得到关键点集合；根据所述源图像，确定所述源图像中人物的头发区域的第二掩膜；根据所述关键点集合，确定出所述人物的人脸的第一凸包区域；根据所述第一凸包区域和所述第二掩膜的交集，从所述第二掩膜中确定出第二凸包区域；在所述第二凸包区域上按照笔触速度依次连接所述关键点集合中的人脸轮廓关键点，得到所述源图像中人物人脸轮廓的增长顺序，所述笔触速度根据所述视频的时长确定出。

根据本公开的一个或多个实施例，所述第二生成单元在所述第二凸包区域上按照笔触速度依次连接所述关键点集合中的人脸轮廓关键点，得到所述源图像中人物的人脸轮廓的增长顺序之后，还用于从所述关键点集合中确定出所述人脸不同区域的关键点；根据各区域的关键点，对所述人脸的各区域进行插值；根据插值后区域，在所述第二凸包区域上按照笔触速度，确定所述源图像中人物的人脸中对应区域的增长顺序。

根据本公开的一个或多个实施例，所述第二生成单元对所述人脸的不同区域，根据所述区域的关键点进行插值时，对于所述人脸中的眉毛区域，根据所述眉毛区域的关键点横向插值多条曲线；对于所述人脸区域中的眼球区域，根据所述眼球区域的关键点，按照圆形区域对所述眼球区域插值；对于所述人脸区域中的嘴巴区域，根据所述嘴巴区域的关键点，竖向插值多条曲线。

根据本公开的一个或多个实施例，所述第一生成单元，用于基于所述源图像，生成灰度图；

确定多个高斯核，所述多个高斯核中的高斯核和所述多个素描图像中的素描图像一一对应，颜色较深的素描图像的对应的高斯核的尺寸大于颜色较浅的素描图像对应的高斯核；

根据所述多个高斯核，分别对所述灰度图进行高斯模糊，得到所述多个高斯核中各高斯核对应的高斯模糊图；根据所述多个高斯核中各高斯核对应的高斯模糊图和所述灰度图，生成所述多个素描图像。

所述存储器存储计算机执行指令；

第五方面，根据本公开的一个或多个实施例，提供了一种计算机程序产品，该计算机程序产品包括：计算机程序，该计算机程序存储在可读存储介质中，电子设备的至少一个处理器从该可读存储介质读取该计算机程序，该至少一个处理器执行该计算机程序使得电子设备执行如上第一方面以及第一方面各种可能的设计所述的视频生成方法。

第六方面，根据本公开的一个或多个实施例，提供了一种计算机程序，该计算机程序被处理器执行时实现如上第一方面以及第一方面各种可能的设计所述的视频生成方法。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的公开范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述公开构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

此外，虽然采用特定次序描绘了各操作，但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地，在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims

一种视频生成方法，其特征在于，包括：

获取源图像；

根据所述源图像，生成多个素描图像，所述多个素描图像分别对应于所述源图像在不同颜色深度下的素描图像；

基于目标素描图像，生成所述目标素描图像的多个子图，所述多个子图分别对应于所述目标素描图像在不同绘制完成度下的素描图像，所述目标素描图像是所述多个素描图像中的任意一个素描图像；

将所述多个素描图像中各个素描图像的各个子图作为素描绘制视频的视频帧，按照颜色深度从浅到深的顺序以及绘制完成度从低到高的顺序设置所述视频帧的顺序，生成所述素描绘制视频。
根据权利要求1所述的方法，其特征在于，所述基于目标素描图像，生成所述目标素描图像的多个子图，包括：

确定第一掩膜中像素的掩膜值的增长顺序，所述第一掩膜中像素的初始掩膜值为0，所述第一掩膜中像素的增长用于指示所述像素的掩膜值从0变更为1，所述第一掩膜用于使得所述目标素描图像的背景根据所述增长顺序逐渐转变为所述目标素描图像；

根据所述增长顺序、所述目标素描图像和所述目标素描图像的背景，生成所述多个子图，所述增长顺序中的每次增长与所述多个子图中的子图一一对应。
根据权利要求2所述的方法，其特征在于，所述根据所述增长顺序、所述目标素描图像和所述目标素描图像的背景，生成所述多个子图，包括：

针对所述增长顺序中的每次增长，从所述第一掩膜中确定出所述增长对应的第一像素集合；

根据所述第一像素集合，从所述目标素描图像中确定出第二像素集合，并从所述背景中确定出第三像素集合，所述第一像素集合、所述第二像素集合和所述第三像素集合中的像素一一对应；

根据所述第一像素集合中第一像素的掩膜值、所述第二像素集合中的第二像素的像素值、所述第三像素集合中第三像素的像素值，确定第四像素的像素值，所述第四像素的像素值＝所述第一像素的掩膜值×所述第二像素的像素值+所述第三像素的像素值×(1-所述第一像素的掩膜值)；

将所述背景中的所述第三像素更新为所述第四像素，得到所述增长对应的子图。
根据权利要求2或3所述的方法，其特征在于，

当所述目标素描图像不是所述多个素描图像中的颜色最浅的素描图像时，所述背景是所述多个素描图像中与所述目标素描图像相邻、且位于所述目标素描图像之前的素描图像；

当所述目标素描图像是所述多个素描图像中颜色最浅的素描图像时，所述背景是尺寸与所述目标素描图像尺寸相同的白色图像。
根据权利要求2-4中任意一项所述的方法，其特征在于，所述源图像中包含人物，所述增长顺序包括所述源图像中人物的人脸轮廓的增长顺序，所述确定第一掩膜中像素的掩膜值的增长顺序，包括：

提取所述源图像中的人脸关键点，得到关键点集合；

根据所述源图像，确定所述源图像中人物的头发区域的第二掩膜；

根据所述关键点集合，确定出所述人物的人脸的第一凸包区域；

根据所述第一凸包区域和所述第二掩膜的交集，从所述第二掩膜中确定出第二凸包区域；

在所述第二凸包区域上按照笔触速度依次连接所述关键点集合中的人脸轮廓关键点，得到所述源图像中人物人脸轮廓的增长顺序，所述笔触速度根据所述视频的时长确定出。
根据权利要求5所述的方法，其特征在于，所述在所述第二凸包区域上按照笔触速度依次连接所述关键点集合中的人脸轮廓关键点，得到所述源图像中人物的人脸轮廓的增长顺序之后，还包括：

从所述关键点集合中确定出所述人脸不同区域的关键点；

根据各区域的关键点，对所述人脸的各区域进行插值；

根据插值后区域，在所述第二凸包区域上按照笔触速度，确定所述源图像中人物的人脸中对应区域的增长顺序。
根据权利要求6所述的方法，其特征在于，所述对所述人脸的不同区域，根据所述区域的关键点进行插值，包括：

对于所述人脸中的眉毛区域，根据所述眉毛区域的关键点横向插值多条曲线；

对于所述人脸区域中的眼球区域，根据所述眼球区域的关键点，按照圆形区域对所述眼球区域插值；

对于所述人脸区域中的嘴巴区域，根据所述嘴巴区域的关键点，竖向插值多条曲线。
根据权利要求1-7中任意一项所述的方法，其特征在于，所述根据所述源图像，生成多个素描图像，包括：

基于所述源图像，生成灰度图；

确定多个高斯核，所述多个高斯核中的高斯核和所述多个素描图像中的素描图像一一对应，颜色较深的素描图像的对应的高斯核的尺寸大于颜色较浅的素描图像对应的高斯核；

根据所述多个高斯核，分别对所述灰度图进行高斯模糊，得到所述多个高斯核中各高斯核对应的高斯模糊图；

根据所述多个高斯核中各高斯核对应的高斯模糊图和所述灰度图，生成所述多个素描图像。
一种视频生成装置，其特征在于，包括：

获取单元，用于获取源图像；

第一生成单元，用于根据所述源图像，生成多个素描图像，所述多个素描图像分别对应于所述源图像在不同颜色深度下的素描图像；

第二生成单元，用于基于目标素描图像，生成所述目标素描图像的多个子图，所述多个子图分别对应于所述目标素描图像在不同绘制完成度下的素描图像，所述目标素描图像是所述多个素描图像中的任意一个素描图像；

第三生成单元，用于将所述多个素描图像中各个素描图像的各个子图作为素描绘制视频的视频帧，按照颜色深度从浅到深的顺序以及绘制完成度从低到高的顺序设置所述视频帧的顺序，生成所述素描绘制视频。
一种电子设备，其特征在于，包括：至少一个处理器和存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如权利要求1-8中任意一项所述的视频生成方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如权利要求1-8中任意一项所述的视频生成方法。
一种计算机程序产品，其特征在于，包括计算机程序，所述计算机程序在被处理器执行时实现如权利要求1-8中任意一项所述的视频生成方法。
一种计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-8中任意一项所述的视频生成方法。