CN114422698A - 视频生成方法、装置、设备及存储介质 - Google Patents
视频生成方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114422698A CN114422698A CN202210060992.1A CN202210060992A CN114422698A CN 114422698 A CN114422698 A CN 114422698A CN 202210060992 A CN202210060992 A CN 202210060992A CN 114422698 A CN114422698 A CN 114422698A
- Authority
- CN
- China
- Prior art keywords
- coloring
- video
- determining
- image
- order
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/64—Computer-aided capture of images, e.g. transfer from script file into camera, check of taken image quality, advice or proposal for image composition or decision on when to take image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/001—Texturing; Colouring; Generation of texture or colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
- H04N23/611—Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/80—Camera processing pipelines; Components thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本公开实施例公开了一种视频生成方法、装置、设备及存储介质。对待处理视频进行灰度处理,获得灰度视频;对所述灰度视频中的视频帧进行区域分割,获得多个图像区域;确定所述多个图像区域的着色顺序;按照所述着色顺序依次对所述多个图像区域进行着色,获得目标视频。本公开实施例提供的视频生成方法,对全景语义分割出的多个灰度图像区域按照着色顺序进行着色,可以实现“分割留色”的特效,可以提高视频的趣味性、视频展示的丰富性及用户体验。
Description
技术领域
本公开实施例涉及图像处理技术领域,尤其涉及一种视频生成方法、装置、设备及存储介质。
背景技术
近几年,智能终端设备已经成为用户不可或缺的工具,用户可以通过智能终端拍摄图像及录制视频,以采用视频、照片等方式记录生活。另外,用户还可以通过终端设备对短视频进行再加工,以更丰富的形式进行表达,比如美颜、风格化、表情编辑等。
发明内容
本公开实施例提供一种视频生成方法、装置、设备及存储介质,可以提高视频的趣味性及用户体验。
第一方面,本公开实施例提供了一种视频生成方法,包括:
对待处理视频进行灰度处理,获得灰度视频;
对所述灰度视频中的视频帧进行全景语义分割,获得多个图像区域;
确定所述多个图像区域的着色顺序;
按照所述着色顺序依次对所述多个图像区域进行着色,获得目标视频。
第二方面,本公开实施例还提供了一种视频生成装置,其特征在于,包括:
灰度视频获取模块,用于对待处理视频进行灰度处理,获得灰度视频;
语义分割模块,用于对所述灰度视频中的视频帧进行全景语义分割,获得多个图像区域;
着色顺序确定模块,用于确定所述多个图像区域的着色顺序;
着色模块,用于按照所述着色顺序依次对所述多个图像区域进行着色,获得目标视频。
第三方面,本公开实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理装置;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理装置执行,使得所述一个或多个处理装置实现如本公开实施例所述的视频生成方法。
第四方面,本公开实施例还提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现如本公开实施例所述的视频生成方法。
本公开实施例公开了一种视频生成方法、装置、设备及存储介质。对待处理视频进行灰度处理,获得灰度视频;对灰度视频中的视频帧进行全景语义分割,获得多个图像区域;确定多个图像区域的着色顺序;按照着色顺序依次对多个图像区域进行着色,获得目标视频。本公开实施例提供的视频生成方法,对全景语义分割出的多个灰度图像区域按照着色顺序进行着色,可以实现“分割留色”的特效,可以提高视频的趣味性、视频展示的丰富性及用户体验。
附图说明
图1是本公开实施例中的一种视频生成方法的流程图;
图2是本公开实施例中的基于主体物体确定着色顺序的示例图;
图3是本公开实施例中的基于肢体动作确定着色顺序的示例图;
图4是本公开实施例中的一种视频生成装置的结构示意图;
图5是本公开实施例中的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
图1为本公开实施例一提供的一种视频生成方法的流程图,本实施例可适用于生成特效视频的情况,该方法可以由视频生成装置来执行,该装置可由硬件和/或软件组成,并一般可集成在具有视频生成功能的设备中,该设备可以是服务器、移动终端或服务器集群等电子设备。如图1所示,该方法具体包括如下步骤:
步骤110,对待处理视频进行灰度处理,获得灰度视频。
其中,待处理视频可以是用户采用摄像设备采集的,或者将静态图片合并编码而成的。对待处理视频进行灰度处理可以理解为对待处理视频中的每一个视频帧进行灰度处理。灰度处理的原理可以是将每个像素点的颜色值(Red Green Blue,RGB)调整为相同的值,即R=G=B。本实施中,可以将RGB三个值的平均值、最大值或者最小值作为最终的灰度值,此处不做限定。
步骤120,对灰度视频中的视频帧进行区域分割,获得多个图像区域。
其中,区域分割的方式可以是简单的将视频帧划分为多个子区域,例如:划分为上下左右四个子区域;或者进行语义分割、实例分割或者全景语义分割。语义分割可以理解为:对视频帧上的所有像素点进行分类。实例分割可以理解为目标检测和语义分割的结合。全景语义分割可以理解为对视频帧中所有物体包括背景都要进行检测和分割。优选的,本实施例采用全景语义分割的方式对视频帧进行分割,从而在视频帧中获得多个图像区域。本实施例中,对视频帧进行全景语义分割可以采用现有的全景语义分割模型进行处理,此处不做限定。
步骤130,确定多个图像区域的着色顺序。
其中,着色顺序可以理解为在视频播放过程中各图像区域由灰度变为彩色的顺序。示例性的,假设视频中分割出的区域包含天空区域、人体区域、植物区域及地面区域,则在视频播放过程中可以按照如下顺序依次进行着色:植物区域-人体区域-天空区域-地面区域。本实施例中,对图像区域的着色顺序不做限定。
可选的,确定多个图像区域的着色顺序的方式可以是:获取多个图像区域的深度信息;根据深度信息确定着色信息。
其中,图像区域的深度信息由图像区域中的像素点的深度信息来表征。
具体的,获取多个图像区域的深度信息的方式可以是:对于每个图像区域,获取图像区域中像素点的深度信息;将像素点的深度信息的平均值确定为图像区域的深度信息;或者,将图像区域中心点的深度信息确定图像区域的深度信息。
其中,可以采用现有的深度估计算法确定像素点的深度信息。即可以将各像素点深度信息的平均值作为当前图像区域的深度信息,也可以将中心像素点的深度信息作为当前图像区域的深度信息,或者将从当前图像区域中随机选择的像素点的深度信息作为当前图像区域的深度信息。可以提高确定图像区域深度信息的效率。
具体的,在确定了各图像区域的深度信息后,可以将深度信息由远到近或者由近到远确定为着色信息。使得待处理视频呈现由远到近的着色或者由近到远的着色效果。
可选的,确定多个图像区域的着色顺序的方式可以是:获取多个图像区域与画面边界的距离信息;根据距离信息确定着色信息。
其中,画面边界包括左边界、右边界、上边界或者下边界。图像区域与画面边界的距离信息可以是图像区域的中心点与画面边界的距离信息,或者图像区域中各像素点与画面边界距离信息的平均值。根据距离信息确定着色信息可以理解为将距离信息从大到小或者从小到大形成的顺序确定为着色顺序。即在视频播放过程中,可以按照2D画面中从左到右、从右到左、从上到下或者从下到上的顺序依次进行作色。使得待处理视频呈现由从左到右、从右到左、从上到下或者从下到上的着色效果。
可选的,确定多个图像区域的着色顺序的方式可以是:对灰度视频进行主体物体的识别;基于主体物体确定着色顺序。
其中,可以采用显著物体分割算法对灰度视频中的各视频帧进行主体物体的识别。具体的,基于主体物体确定着色顺序可以是:将绕主体物体的顺时针顺序或者逆时针顺序确定为追色顺序。示例性的,图2为本实施例中基于主体物体确定着色顺序的示例图,如图2所示,在视频播放过程中,可以先对主体物体进行着色,然后按照绕主体物体顺时针的顺序对主体物体周围的图像区域依次进行着色。使得待处理视频呈现绕主体物体的着色效果。
可选的,确定多个图像区域的着色顺序的方式可以是:若灰度视频中包含有人体,则识别人体的肢体动作;基于肢体动作确定着色顺序。
其中,肢体动作包括手势动作或者脚部动作。本实施例中,可以采用现有的肢体动作识别算法识别视频帧中人体的肢体动作。具体的,基于肢体动作确定着色顺序可以理解为:根据人体在当前视频帧中的肢体动作确定在当前帧中着色的图像区域,例如:可以对手指指向的图像区域进行着色。示例性的,图3是本实施例中基于肢体动作确定着色顺序的示例图。如图3所示,第一张图像中,手指指向左侧区域,则对左侧区域进行着色,第二张图像中,手指指向右侧区域,则对右侧区域进行着色,第三张图像中,双手指向天空,则对天空区域进行着色。使得待处理视频呈现随着人体动作进行着色的着色效果。
可选的,确定多个图像区域的着色顺序的方式可以是:接收用户绘制的着色路径;根据着色路径确定着色顺序。
其中,着色路径可以是依次经过视频中的图像区域的路径。具体的,根据着色路径确定着色顺序可以理解为:将着色路径经过图像区域的顺序确定为着色顺序,即在视频播放过程中,按照着色路径经过图像区域的顺序依次对图像区域进行着色。使得待处理视频呈现按照用户设定的路径进行着色的着色效果。
步骤140,按照着色顺序依次对多个图像区域进行着色,获得目标视频。
其中,按照着色顺序依次对多个图像区域进行着色的过程可以是:假设着色顺序依次第一、第二、……第N,在前m秒内,对所有视频帧中排序为第一的图像区域进行着色,在第m到m+n1秒内,对第m秒后的所有视频帧中排序为第二的图像区域进行着色,在第m+n1到m+n1+n2秒内,将m+n1秒后的所有视频帧中排序第三的图像区域进行着色,依次类推,直到视频播放完成,从而实现各图像区域依次着色的特效。
本实施例中,可以采用各图像区域在待处理视频中的原始颜色进行着色,或者采用设定贴图对图像区域进行着色。
可选的,按照着色顺序依次对多个图像区域进行着色的方式可以是:获取多个图像区域在待处理视频中的原始颜色;按照着色顺序依次将多个图像区域着色为原始颜色。
其中,原始颜色即为图像区域中的像素点在待处理视频帧中的RGB值,当按照着色顺序处理到当前图像区域时,将当前物体中各像素点的灰度值替换为原RGB值,从而实现对当前图像区域的着色处理。
可选的,按照着色顺序依次对多个图像区域进行着色的方式可以是:获取设定贴图;将设定贴图叠加至对应的图像区域中。
其中,设定贴图可以是用户选择的贴图。将设定贴图叠加至对应的图像区域中的方式可以是,将设定贴图中落入当前图像区域的像素点的颜色保留,将落入当前图像区域外的像素点的颜色调整为透明,从而实现将设定贴图叠加至对应的图像区域的处理。可以提高视频着色的多样性。
可选的,按照所述着色顺序依次对所述多个图像区域进行着色的方式可以是:对图像区域中的像素点同时进行着色。
可选的,按照所述着色顺序依次对所述多个图像区域进行着色的方式可以是:对于每个图像区域,按照设定方式进行着色。
其中,设定方式包括着色方向及着色速度。其中,着色方向可以是从左到右、从右到左、从上到下、从下到上或者从中心点开始向外扩散,此处不做限定。着色速度可以是着色步长,例如:假设着色方向为从左到右,则着色速度可以是着色步长为N列像素点,N大于等于1。按照一定的速度和方向对图像区域进行着色,可以提高对待处理视频着色的趣味性。
可选的,按照着色顺序依次对多个图像区域进行着色的方式可以是:确定待处理视频的背景音乐;对背景音乐进行重音识别,获得重音点;在重音点对应的时刻对按照着色顺序排到的图像区域进行着色。
其中,背景音乐可以是用户选择的音乐。可以采用现有的重音检测算法对背景音乐的重音进行识别。可以将重音点所在的时刻作为对排到的图像区域开始作色的时刻,即可以理解为在相邻两个重音点内的时段内完成对排到的图像区域的着色。这样可以使得生成的目标视频,在对图像区域逐渐着色时更有节奏感。
本公开实施例的技术方案,对待处理视频进行灰度处理,获得灰度视频;对灰度视频中的视频帧进行全景语义分割,获得多个图像区域;确定多个图像区域的着色顺序;按照着色顺序依次对多个图像区域进行着色,获得目标视频。本公开实施例提供的视频生成方法,对全景语义分割出的多个灰度图像区域按照着色顺序进行着色,可以实现“分割留色”的特效,可以提高视频的趣味性、视频展示的丰富性及用户体验。
图4是本公开实施例提供的一种视频生成装置的结构示意图。如图4所示,该装置包括:
灰度视频获取模块210,用于对待处理视频进行灰度处理,获得灰度视频;
分割模块220,用于对灰度视频中的视频帧进行区域分割,获得多个图像区域;
着色顺序确定模块230,用于确定多个图像区域的着色顺序;
着色模块240,用于按照着色顺序依次对多个图像区域进行着色,获得目标视频。
可选的,着色顺序确定模块230,还用于:
获取多个图像区域的深度信息;
根据深度信息确定着色信息。
可选的,着色顺序确定模块230,还用于:
对于每个图像区域,获取图像区域中像素点的深度信息;
将像素点的深度信息的平均值确定为图像区域的深度信息;或者,
将图像区域中心点的深度信息确定图像区域的深度信息;
根据深度信息确定着色信息,包括:
将深度信息由远到近或者由近到远确定为着色信息。
可选的,着色顺序确定模块230,还用于:
获取多个图像区域与画面边界的距离信息;其中,画面边界包括左边界、右边界、上边界或者下边界;
根据距离信息确定着色信息。
可选的,着色顺序确定模块230,还用于:
对灰度视频进行主体物体的识别;
基于主体物体确定着色顺序。
可选的,着色顺序确定模块230,还用于:
若灰度视频中包含有人体,则识别人体的肢体动作;其中,肢体动作包括手势动作或者脚部动作;
基于肢体动作确定着色顺序。
可选的,着色顺序确定模块230,还用于:
接收用户绘制的着色路径;
根据着色路径确定着色顺序。
可选的,着色模块240,还用于:
获取多个图像区域在待处理视频中的原始颜色;
按照着色顺序依次将多个图像区域着色为原始颜色。
可选的,着色模块240,还用于:
获取设定贴图;
将设定贴图叠加至对应的图像区域中。
可选的,着色模块240,还用于:
对于每个图像区域,按照设定方式进行着色;其中,设定方式包括着色方向及着色速度。
可选的,着色模块240,还用于:
确定待处理视频的背景音乐;
对背景音乐进行重音识别,获得重音点;
在重音点对应的时刻对按照着色顺序排到的图像区域进行着色。
上述装置可执行本公开前述所有实施例所提供的方法,具备执行上述方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本公开前述所有实施例所提供的方法。
下面参考图5,其示出了适于用来实现本公开实施例的电子设备300的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端,或者各种形式的服务器,如独立服务器或者服务器集群。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备300可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储装置(ROM)302中的程序或者从存储装置305加载到随机访问存储装置(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有电子设备300操作所需的各种程序和数据。处理装置301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
通常,以下装置可以连接至I/O接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行词语的推荐方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置305被安装,或者从ROM 302被安装。在该计算机程序被处理装置301执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:对待处理视频进行灰度处理,获得灰度视频;对所述灰度视频中的视频帧进行区域分割,获得多个图像区域;确定所述多个图像区域的着色顺序;按照所述着色顺序依次对所述多个图像区域进行着色,获得目标视频。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开实施例的一个或多个实施例,本公开实施例公开了一种视频生成方法,包括:
对待处理视频进行灰度处理,获得灰度视频;
对所述灰度视频中的视频帧进行区域分割,获得多个图像区域;
确定所述多个图像区域的着色顺序;
按照所述着色顺序依次对所述多个图像区域进行着色,获得目标视频。
进一步地,确定所述多个图像区域的着色顺序,包括:
获取所述多个图像区域的深度信息;
根据所述深度信息确定着色信息。
进一步地,获取所述多个图像区域的深度信息,包括:
对于每个图像区域,获取所述图像区域中像素点的深度信息;
将所述像素点的深度信息的平均值确定为所述图像区域的深度信息;或者,
将所述图像区域中心点的深度信息确定所述图像区域的深度信息;
根据所述深度信息确定着色信息,包括:
将所述深度信息由远到近或者由近到远确定为着色信息。
进一步地,确定所述多个图像区域的着色顺序,包括:
获取所述多个图像区域与画面边界的距离信息;其中,所述画面边界包括左边界、右边界、上边界或者下边界;
根据所述距离信息确定着色信息。
进一步地,确定所述多个图像区域的着色顺序,包括:
对所述灰度视频进行主体物体的识别;
基于所述主体物体确定着色顺序。
进一步地,确定所述多个图像区域的着色顺序,包括:
若所述灰度视频中包含有人体,则识别所述人体的肢体动作;其中,所述肢体动作包括手势动作或者脚部动作;
基于所述肢体动作确定着色顺序。
进一步地,确定所述多个图像区域的着色顺序,包括:
接收用户绘制的着色路径;
根据所述着色路径确定着色顺序。
进一步地,按照所述着色顺序依次对所述多个图像区域进行着色,包括:
获取多个图像区域在所述待处理视频中的原始颜色;
按照所述着色顺序依次将所述多个图像区域着色为所述原始颜色。
进一步地,按照所述着色顺序依次对所述多个图像区域进行着色,包括:
获取设定贴图;
将所述设定贴图叠加至对应的图像区域中。
进一步地,按照所述着色顺序依次对所述多个图像区域进行着色,包括:
对于每个图像区域,按照设定方式进行着色;其中,设定方式包括着色方向及着色速度。
进一步地,按照所述着色顺序依次对所述多个图像区域进行着色,包括:
确定所述待处理视频的背景音乐;
对所述背景音乐进行重音识别,获得重音点;
在所述重音点对应的时刻对按照所述着色顺序排到的图像区域进行着色。
注意,上述仅为本公开的较佳实施例及所运用技术原理。本领域技术人员会理解,本公开不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本公开的保护范围。因此,虽然通过以上实施例对本公开进行了较为详细的说明,但是本公开不仅仅限于以上实施例,在不脱离本公开构思的情况下,还可以包括更多其他等效实施例,而本公开的范围由所附的权利要求范围决定。
Claims (14)
1.一种视频生成方法,其特征在于,包括:
对待处理视频进行灰度处理,获得灰度视频;
对所述灰度视频中的视频帧进行区域分割,获得多个图像区域;
确定所述多个图像区域的着色顺序;
按照所述着色顺序依次对所述多个图像区域进行着色,获得目标视频。
2.根据权利要求1所述的方法,其特征在于,确定所述多个图像区域的着色顺序,包括:
获取所述多个图像区域的深度信息;
根据所述深度信息确定着色信息。
3.根据权利要求2所述的方法,其特征在于,获取所述多个图像区域的深度信息,包括:
对于每个图像区域,获取所述图像区域中像素点的深度信息;
将所述像素点的深度信息的平均值确定为所述图像区域的深度信息;或者,
将所述图像区域中心点的深度信息确定所述图像区域的深度信息;
根据所述深度信息确定着色信息,包括:
将所述深度信息由远到近或者由近到远确定为着色信息。
4.根据权利要求1所述的方法,其特征在于,确定所述多个图像区域的着色顺序,包括:
获取所述多个图像区域与画面边界的距离信息;其中,所述画面边界包括左边界、右边界、上边界或者下边界;
根据所述距离信息确定着色信息。
5.根据权利要求1所述的方法,其特征在于,确定所述多个图像区域的着色顺序,包括:
对所述灰度视频进行主体物体的识别;
基于所述主体物体确定着色顺序。
6.根据权利要求1所述的方法,其特征在于,确定所述多个图像区域的着色顺序,包括:
若所述灰度视频中包含有人体,则识别所述人体的肢体动作;其中,所述肢体动作包括手势动作或者脚部动作;
基于所述肢体动作确定着色顺序。
7.根据权利要求1所述的方法,其特征在于,确定所述多个图像区域的着色顺序,包括:
接收用户绘制的着色路径;
根据所述着色路径确定着色顺序。
8.根据权利要求1所述的方法,其特征在于,按照所述着色顺序依次对所述多个图像区域进行着色,包括:
获取多个图像区域在所述待处理视频中的原始颜色;
按照所述着色顺序依次将所述多个图像区域着色为所述原始颜色。
9.根据权利要求1所述的方法,其特征在于,按照所述着色顺序依次对所述多个图像区域进行着色,包括:
获取设定贴图;
将所述设定贴图叠加至对应的图像区域中。
10.根据权利要求1所述的方法,其特征在于,按照所述着色顺序依次对所述多个图像区域进行着色,包括:
对于每个图像区域,按照设定方式进行着色;其中,设定方式包括着色方向及着色速度。
11.根据权利要求1所述的方法,其特征在于,按照所述着色顺序依次对所述多个图像区域进行着色,包括:
确定所述待处理视频的背景音乐;
对所述背景音乐进行重音识别,获得重音点;
在所述重音点对应的时刻对按照所述着色顺序排到的图像区域进行着色。
12.一种视频生成装置,其特征在于,包括:
灰度视频获取模块,用于对待处理视频进行灰度处理,获得灰度视频;
语义分割模块,用于对所述灰度视频中的视频帧进行区域分割,获得多个图像区域;
着色顺序确定模块,用于确定所述多个图像区域的着色顺序;
着色模块,用于按照所述着色顺序依次对所述多个图像区域进行着色,获得目标视频。
13.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理装置;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理装置执行,使得所述一个或多个处理装置实现如权利要求1-11中任一所述的视频生成方法。
14.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现如权利要求1-11中任一所述的视频生成方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210060992.1A CN114422698B (zh) | 2022-01-19 | 2022-01-19 | 视频生成方法、装置、设备及存储介质 |
PCT/CN2023/071620 WO2023138441A1 (zh) | 2022-01-19 | 2023-01-10 | 视频生成方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210060992.1A CN114422698B (zh) | 2022-01-19 | 2022-01-19 | 视频生成方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114422698A true CN114422698A (zh) | 2022-04-29 |
CN114422698B CN114422698B (zh) | 2023-09-26 |
Family
ID=81274992
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210060992.1A Active CN114422698B (zh) | 2022-01-19 | 2022-01-19 | 视频生成方法、装置、设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114422698B (zh) |
WO (1) | WO2023138441A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023138441A1 (zh) * | 2022-01-19 | 2023-07-27 | 北京字跳网络技术有限公司 | 视频生成方法、装置、设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5425111A (en) * | 1991-06-03 | 1995-06-13 | Sharp Kabushiki Kaisha | Image processing apparatus |
JP2011118825A (ja) * | 2009-12-07 | 2011-06-16 | Yamazaki Co Ltd | モノクロ動画の着色装置及びモノクロ動画の着色方法 |
CN106462986A (zh) * | 2014-06-12 | 2017-02-22 | 汤姆逊许可公司 | 用于数字图像的颜色处理的方法和*** |
CN110276840A (zh) * | 2019-06-21 | 2019-09-24 | 腾讯科技(深圳)有限公司 | 多虚拟角色的控制方法、装置、设备及存储介质 |
CN110515452A (zh) * | 2018-05-22 | 2019-11-29 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、存储介质和计算机设备 |
CN111340921A (zh) * | 2018-12-18 | 2020-06-26 | 北京京东尚科信息技术有限公司 | 染色方法、装置和计算机***及介质 |
CN113411550A (zh) * | 2020-10-29 | 2021-09-17 | 腾讯科技(深圳)有限公司 | 视频上色方法、装置、设备及存储介质 |
US20210319596A1 (en) * | 2020-04-13 | 2021-10-14 | Sony Corporation | Node-based image colorization on image/video editing applications |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109754444B (zh) * | 2018-02-07 | 2021-10-26 | 京东方科技集团股份有限公司 | 图像着色方法和装置 |
CN108492348A (zh) * | 2018-03-30 | 2018-09-04 | 北京金山安全软件有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN111815733A (zh) * | 2020-08-07 | 2020-10-23 | 深兰科技(上海)有限公司 | 一种视频着色的方法及*** |
CN113822951B (zh) * | 2021-06-25 | 2023-05-30 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN114422698B (zh) * | 2022-01-19 | 2023-09-26 | 北京字跳网络技术有限公司 | 视频生成方法、装置、设备及存储介质 |
-
2022
- 2022-01-19 CN CN202210060992.1A patent/CN114422698B/zh active Active
-
2023
- 2023-01-10 WO PCT/CN2023/071620 patent/WO2023138441A1/zh unknown
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5425111A (en) * | 1991-06-03 | 1995-06-13 | Sharp Kabushiki Kaisha | Image processing apparatus |
JP2011118825A (ja) * | 2009-12-07 | 2011-06-16 | Yamazaki Co Ltd | モノクロ動画の着色装置及びモノクロ動画の着色方法 |
CN106462986A (zh) * | 2014-06-12 | 2017-02-22 | 汤姆逊许可公司 | 用于数字图像的颜色处理的方法和*** |
CN110515452A (zh) * | 2018-05-22 | 2019-11-29 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、存储介质和计算机设备 |
CN111340921A (zh) * | 2018-12-18 | 2020-06-26 | 北京京东尚科信息技术有限公司 | 染色方法、装置和计算机***及介质 |
CN110276840A (zh) * | 2019-06-21 | 2019-09-24 | 腾讯科技(深圳)有限公司 | 多虚拟角色的控制方法、装置、设备及存储介质 |
US20210319596A1 (en) * | 2020-04-13 | 2021-10-14 | Sony Corporation | Node-based image colorization on image/video editing applications |
CN113411550A (zh) * | 2020-10-29 | 2021-09-17 | 腾讯科技(深圳)有限公司 | 视频上色方法、装置、设备及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023138441A1 (zh) * | 2022-01-19 | 2023-07-27 | 北京字跳网络技术有限公司 | 视频生成方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2023138441A1 (zh) | 2023-07-27 |
CN114422698B (zh) | 2023-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110189246B (zh) | 图像风格化生成方法、装置及电子设备 | |
CN111368685A (zh) | 关键点的识别方法、装置、可读介质和电子设备 | |
CN111669502B (zh) | 目标对象显示方法、装置及电子设备 | |
US20230421716A1 (en) | Video processing method and apparatus, electronic device and storage medium | |
CN112182299B (zh) | 一种视频中精彩片段的获取方法、装置、设备和介质 | |
CN114331820A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
US11893770B2 (en) | Method for converting a picture into a video, device, and storage medium | |
CN115311178A (zh) | 图像拼接方法、装置、设备及介质 | |
CN111432141B (zh) | 一种混剪视频确定方法、装置、设备及存储介质 | |
CN114630057B (zh) | 确定特效视频的方法、装置、电子设备及存储介质 | |
CN111967397A (zh) | 人脸影像处理方法和装置、存储介质和电子设备 | |
CN114187177B (zh) | 特效视频的生成方法、装置、设备及存储介质 | |
CN115358919A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN114004905B (zh) | 人物风格形象图的生成方法、装置、设备及存储介质 | |
CN116934577A (zh) | 一种风格图像生成方法、装置、设备及介质 | |
CN112906553B (zh) | 图像处理方法、装置、设备及介质 | |
CN114422698B (zh) | 视频生成方法、装置、设备及存储介质 | |
CN111833459B (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN112714263A (zh) | 视频生成方法、装置、设备及存储介质 | |
CN110197459B (zh) | 图像风格化生成方法、装置及电子设备 | |
CN113628097A (zh) | 图像特效配置方法、图像识别方法、装置及电子设备 | |
CN116596748A (zh) | 图像风格化处理方法、装置、设备、存储介质和程序产品 | |
US20240135972A1 (en) | Image processing method, apparatus, device and storage medium | |
CN113905177B (zh) | 视频生成方法、装置、设备及存储介质 | |
CN114399696A (zh) | 一种目标检测方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |