CN110392297B

CN110392297B - 视频处理方法及设备、存储介质、终端

Info

Publication number: CN110392297B
Application number: CN201810348124.7A
Authority: CN
Inventors: 肖仙敏; 叶晨晖; 王文涛; 肖鹏; 张元昊; 林锋
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-04-18
Filing date: 2018-04-18
Publication date: 2021-12-14
Anticipated expiration: 2038-04-18
Also published as: CN110392297A

Abstract

本申请公开一种视频处理方法及设备、存储介质、终端，其中视频处理方法包括：获取目标视频中的目标视频帧以及背景音频；从所述背景音频中，获取与所述目标视频帧所在时间戳对应的目标音频强度值；根据所述目标音频强度值，确定所述目标视频帧对应的画面放大幅度值；根据所述画面放大幅度值对所述目标视频帧进行视频画面放大处理。采用本申请的技术方案，可以增强视频播放的动感。

Description

视频处理方法及设备、存储介质、终端

技术领域

本发明涉及媒体技术领域，尤其涉及一种视频处理方法及设备、存储介质、终端。

背景技术

随着移动互联网的发展，越来越多的用户可以通过终端拍摄吸引眼球的视频，再将所拍摄的视频发布在各种社交平台。目前，用户在拍摄视频的过程中，或者对所拍摄的视频后续进行编辑过程中，可以给视频画面进行各种特效处理，比如添加音乐、美颜以及可以通过人脸识别添加挂件等等。

发明内容

本发明实施例提供一种视频处理方法及设备、存储介质、终端，可使目标视频的视频画面随着背景音频的强度进行不同程度的放大，从而增强视频播放的动感。

第一方面，本发明实施例提供了一种视频处理方法，包括：

获取目标视频中的目标视频帧以及背景音频；

从所述背景音频中，获取与所述目标视频帧所在时间戳对应的目标音频强度值；

根据所述目标音频强度值，确定所述目标视频帧对应的画面放大幅度值；

根据所述画面放大幅度值对所述目标视频帧进行视频画面放大处理。

在一种可能的设计中，所述获取与所述目标视频帧所在时间戳对应的目标音频强度值，包括：

通过调用***接口获取与所述目标视频帧所在时间戳关联的M个音频强度值，所述M个音频强度值包括目标时间范围内的多个声道的音频强度值，所述目标时间范围包括所述目标视频帧所在时间戳；

计算所述M个音频强度值的平均值，并将所述M个音频强度值的平均值作为与所述目标视频帧所在时间戳对应的目标音频强度值。

获取音频强度序列，所述音频强度序列包括N个音频强度值，所述N的值与所述目标视频包含的视频帧数量相同，所述目标视频包含多个视频帧，一个音频强度值对应一个所述视频帧，所述N个音频强度值是通过对P个原始音频强度值进行合并处理后得到的，所述P个原始音频强度值是通过对所述背景音频进行解码得到的，所述P大于所述N；

根据所述目标视频帧在所述目标视频中的顺序编号，从所述音频强度序列中获取与所述顺序编号相匹配的音频强度值，作为与所述目标视频帧所在时间戳对应的目标音频强度值。

在一种可能的设计中，所述方法还包括：

对所述背景音频进行解码处理，获得所述背景音频包含的P个原始音频强度值，所述P个原始音频强度值与所述背景音频包含的多个音频帧一一对应；

将所述P个原始音频强度值划分为N个集合，一个集合与一个所述视频帧对应，每个集合包含在时间轴上连续的多个原始音频强度值；

针对每个所述集合，计算所述集合包含的多个原始音频强度值的平均值，并将所述多个原始音频强度值的平均值作为所述集合对应的音频强度值；

按照所述目标视频中所有视频帧的时间顺序，对每个所述集合对应的音频强度值进行排列，得到音频强度序列。

在一种可能的设计中，所述根据所述目标音频强度值，确定所述目标视频帧对应的画面放大幅度值，包括：

获取所述目标音频强度值和基准强度值之间的差值，作为第一差值；

根据所述第一差值，确定所述目标视频帧对应的画面放大幅度值。

在一种可能的设计中，所述根据所述第一差值，确定所述目标视频帧对应的画面放大幅度值，包括：

获取所述背景音频的最大音频强度值；

计算所述最大音频强度值和所述基准强度值之间的差值，作为第二差值；

根据所述第一差值和所述第二差值之间的比值，确定所述目标视频帧对应的画面放大幅度值。

在一种可能的设计中，所述方法还包括：

若多个相邻历史音频强度值和所述基准强度值之间的差值均大于第一阈值或者均小于第二阈值，根据所述多个相邻历史音频强度值更新所述基准强度值；所述多个相邻历史音频强度值分别对应的视频帧是与所述目标视频帧相邻且在时间轴上连续的多个视频帧，所述多个相邻历史音频强度值分别对应的视频帧的时间戳均小于所述目标视频帧的时间戳。

在一种可能的设计中，所述根据所述多个相邻历史音频强度值更新所述基准强度值，包括：

计算所述多个相邻历史音频强度值的平均值；

根据所述多个相邻历史音频强度值的平均值更新所述基准强度值。

获取所述背景音频的音乐类型；

获取与所述音乐类型对应的机器学习模型，作为目标模型；

基于所述目标模型对所述多个相邻历史音频强度值进行训练，获得输出结果；

根据所述输出结果更新所述基准强度值。

在一种可能的设计中，所述根据所述画面放大幅度值对所述目标视频帧进行视频画面放大处理，包括：

若所述画面放大幅度值大于幅度阈值，则根据所述画面放大幅度值对应的放大倍数，对所述目标视频帧的视频画面内容进行放大；

若所述画面放大幅度值小于或者等于所述幅度阈值，则控制所述目标视频帧的视频画面内容不变。

第二方面，本发明实施例提供一种视频处理设备，包括：

第一获取单元，用于获取目标视频中的目标视频帧以及背景音频；

第二获取单元，用于从所述背景音频中，获取与所述目标视频帧所在时间戳对应的目标音频强度值；

确定单元，用于根据所述目标音频强度值，确定所述目标视频帧对应的画面放大幅度值；

放大处理单元，用于根据所述画面放大幅度值对所述目标视频帧进行视频画面放大处理。

在一种可能的设计中，所述第二获取单元包括：

第一获取子单元，用于通过调用***接口获取与所述目标视频帧所在时间戳关联的M个音频强度值，所述M个音频强度值包括目标时间范围内的多个声道的音频强度值，所述目标时间范围包括所述目标视频帧所在时间戳；

计算子单元，用于计算所述M个音频强度值的平均值，并将所述M个音频强度值的平均值作为与所述目标视频帧所在时间戳对应的目标音频强度值。

在一种可能的设计中，所述第二获取单元包括：

第二获取子单元，用于获取音频强度序列，所述音频强度序列包括N个音频强度值，所述N的值与所述目标视频包含的视频帧数量相同，所述目标视频包含多个视频帧，一个音频强度值对应一个所述视频帧，所述N个音频强度值是通过对P个原始音频强度值进行合并处理后得到的，所述P个原始音频强度值是通过对所述背景音频进行解码得到的，所述P大于所述N；

第三获取子单元，用于根据所述目标视频帧在所述目标视频中的顺序编号，从所述音频强度序列中获取与所述顺序编号相匹配的音频强度值，作为与所述目标视频帧所在时间戳对应的目标音频强度值。

在一种可能的设计中，所述设备还包括：

解码处理单元，用于对所述背景音频进行解码处理，获得所述背景音频包含的P个原始音频强度值，所述P个原始音频强度值与所述背景音频包含的多个音频帧一一对应；

划分单元，用于将所述P个原始音频强度值划分为N个集合，一个集合与一个所述视频帧对应，每个集合包含在时间轴上连续的多个原始音频强度值；

计算单元，用于针对每个所述集合，计算所述集合包含的多个原始音频强度值的平均值，并将所述多个原始音频强度值的平均值作为所述集合对应的音频强度值；

排列单元，用于按照所述目标视频中所有视频帧的时间顺序，对每个所述集合对应的音频强度值进行排列，得到音频强度序列。

在一种可能的设计中，所述确定单元包括：

第四获取子单元，用于获取所述目标音频强度值和基准强度值之间的差值，作为第一差值；

确定子单元，用于根据所述第一差值，确定所述目标视频帧对应的画面放大幅度值。

在一种可能的设计中，所述确定子单元具体用于：

获取所述背景音频的最大音频强度值；

在一种可能的设计中，所述设备还包括：

更新单元，用于若多个相邻历史音频强度值和所述基准强度值之间的差值均大于第一阈值或者均小于第二阈值，根据所述多个相邻历史音频强度值更新所述基准强度值；所述多个相邻历史音频强度值分别对应的视频帧是与所述目标视频帧相邻且在时间轴上连续的多个视频帧，所述多个相邻历史音频强度值分别对应的视频帧的时间戳均小于所述目标视频帧的时间戳。

在一种可能的设计中，所述更新单元具体用于：

计算所述多个相邻历史音频强度值的平均值；

在一种可能的设计中，所述更新单元具体用于：

获取所述背景音频的音乐类型；

获取与所述音乐类型对应的机器学习模型，作为目标模型；

根据所述输出结果更新所述基准强度值。

在一种可能的设计中，所述放大处理单元具体用于：

第三方面，本发明实施例提供一种计算机存储介质，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时，执行如本发明实施例中第一方面中的方法。

第四方面，本发明实施例提供一种终端，包括：处理器和存储器；所述处理器和存储器相连，其中，所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，以执行如本发明实施例中第一方面中的方法。

本发明实施例中，可以根据目标视频帧所在时间戳对应的背景音频中的目标音频强度值，来确定目标视频帧对应的画面放大幅度值，从而根据该画面放大幅度值对目标视频帧进行视频画面放大处理，这种方式可以使得不同视频帧的视频画面随着背景音频的音频强度值进行不同程度的放大，从而使得视频播放随着背景音频进行不同程度的抖动，增强视频播放的动感。

附图说明

为了说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例提供的一种视频处理方法的流程示意图；

图2为本发明实施例提供的一种音频强度获取方法的流程示意图；

图3为本发明实施例提供的另一种音频强度获取方法的流程示意图；

图4为本发明实施例提供的一种拍摄界面示意图；

图5为本发明实施例提供的一种背景音频的音频强度获取示意图；

图6为本发明实施例提供的另一种背景音频的音频强度获取示意图；

图7为本发明实施例提供的一种相邻历史帧的示意图；

图8为本发明实施例提供的一种视频画面放大对比示意图；

图9为本发明实施例提供的一种视频处理设备的结构示意图；

图10为本发明实施例提供的一种第二获取单元的结构示意图；

图11为本发明实施例提供的另一种第二获取单元的结构示意图；

图12为本发明实施例提供的一种终端的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

本发明实施例的视频处理方法可以应用于拍摄目标视频过程中，用户选择了抖动特效，并给该目标视频添加了背景音频(比如背景音乐)的场景中。或者，本发明实施例的视频处理方法还可以应用于对拍摄好的目标视频进行编辑的场景中。终端会根据所拍摄的目标视频中不同视频帧所在时间戳对应的不同音频强度值，对该不同视频帧的视频画面进行不同画面放大幅度值的放大处理，从而使得该目标视频播放过程中产生随音乐强度值变化的动感效果。

下面将结合附图1-附图8，对本发明实施例提供的视频处理方法进行详细介绍。

请参见图1，为本发明实施例提供了一种视频处理方法的流程示意图。如图1所示，本发明实施例的视频处理方法可以包括以下步骤S101-步骤S104。

S101，获取目标视频中的目标视频帧以及背景音频；

在一个实施例中，目标视频帧可以是目标视频中的任意一个视频帧，对于目标视频中所包含的所有视频帧均可以采用本发明实施例提供的视频处理方法进行放大处理。背景音频可以是为目标视频所添加的背景音乐。

如图4所示，即是本发明实施例提供的一种目标视频的拍摄界面示意图，当用户进入拍摄界面，拍摄界面的多tab展示给用户，若用户点击tab外的其他区域会让tab隐藏，用户即可点击拍摄按钮进行目标视频的拍摄。该多个tab中存在用于选择背景音乐的tab，如图4所示，界面可以显示很多种背景音乐供用户选择。该多个tab中还存在用于选择抖动特效的tab，当用户选择了背景音乐以及抖动特效后，目标视频中不同视频帧的视频画面即会根据背景音乐的不同音频强度值进行不同画面放大幅度值的放大，从而使得目标视频的播放产生抖动效果，需要说明的是，只有在选择背景音乐后才会使得目标视频产生抖动特效。

S102，从所述背景音频中，获取与所述目标视频帧所在时间戳对应的目标音频强度值；

在一个实施例中，目标视频中的一个视频帧对应一个音频强度值，在获取目标视频帧对应的目标音频强度值时，可以通过目标视频帧所在的时间戳，确定与目标视频帧对应的目标音频强度值。音频强度值可以是分贝值，分贝值是计量声音强度或电功率相对大小的单位，它的数值等于音强或功率比值的常用对数的10倍。

可选的，获取与目标视频帧所在时间戳对应的目标音频强度值的获取方式可以包括以下两种可选的实施方式：

第一种可选的实施方式，如图2所示，该获取步骤包括S10-S11；

S10，通过调用***接口获取与所述目标视频帧所在时间戳关联的M个音频强度值，所述M个音频强度值包括目标时间范围内的多个声道的音频强度值，所述目标时间范围包括所述目标视频帧所在时间戳；

在一个实施例中，该目标时间范围可以是距离该目标视频帧所在时间戳的一定时间范围内，比如目标视频帧所在时间戳是2ms，则该目标时间范围可以是距离该时间戳2ms的1ms范围内，即1ms到3ms的时间范围内。该M个音频强度值是通过调用***接口直接获取的，比如直接利用平台的音频player提供接口获取，该M个音频强度值的范围通常在-160-0之间。其中，该M个音频强度值可以包括目标时间范围内的多个声道的音频强度值，比如，该M个音频强度值可以包括目标时间范围内左声道的音频强度值和右声道的音频强度值。

S11，计算所述M个音频强度值的平均值，并将所述M个音频强度值的平均值作为与所述目标视频帧所在时间戳对应的目标音频强度值。

通常在android平台没有原生音频player接口获取音频强度值，在ios平台可以调用音频player接口获取音频强度值。如图5所示，即是本发明实施例提供的ios平台直接通过调用AVAudioPlayer获取音频强度值以及计算目标音频强度值的流程示意图，如图所示，音频强度值可以是分贝值，初始化分贝值为-160，在每次获取分贝值之前，都要调用updateMeters方法更新音频测量值，并获取声道数powerNum，然后根据这个声道数powerNum获取每个声道在目标时间范围内的分贝平均值，再将所有声道的分贝平均值进行求和，再求平均值，赋值给P，P的值即是需要获取的目标视频帧所在时间戳的分贝值，分贝值返回范围为-160～0。

第二种可选的实施方式，如图3所示，该获取步骤包括S20-S25；

S20，对所述背景音频进行解码处理，获得所述背景音频包含的P个原始音频强度值，所述P个原始音频强度值与所述背景音频包含的多个音频帧一一对应；

在一个实施例中，ios平台和android平台均可以通过解码背景音频的原文件，获取到原始音频强度值。需要说明的是，通过调用player接口获取到的分贝值大小范围是-160～0，而通过解码音频文件得到的原始音频强度值是0到几万的范围大小。

S21，将所述P个原始音频强度值划分为N个集合，一个集合与一个所述视频帧对应，每个集合包含在时间轴上连续的多个原始音频强度值；

在一个实施例中，可以按照时间顺序，将该P个原始音频强度值排序，并进一步将排序后的该P个原始音频强度值划分成N个集合，集合的数量N与目标视频所包含的视频帧的数量相同，P的值远远大于N的值。

可选的，在将P个原始音频强度值划分为N个集合时，可以是平均划分，即每个集合包含的原始音频强度值的数量相同，比如，所获取的原始音频强度值为1000个，视频帧的数量为100帧，则每个集合包含10个原始音频强度值。并且该10个原始音频强度值是时间轴上连续的原始音频强度值。例如，将该1000个原始音频强度值按照时间先后顺序编号，依次为1、2、3、4…1000，将100个视频帧也按照时间先后顺序编号，依次为1、2、3…100，则编号为1-10的原始音频强度值为集合1，并且对应视频帧1，编号为11-20的原始音频强度值为集合2，并且对应视频帧2，等等。其中，平均划分过程中，若P与N不能整除，比如，980个原始音频强度值，划分成100个集合，则可以末尾补0的方式进行计算。

需要说明的是，上述将P个原始音频强度值进行平均划分仅为举例，也可以是非平均划分的方式，本发明实施例对此不作限定。

S22，针对每个所述集合，计算所述集合包含的多个原始音频强度值的平均值，并将所述多个原始音频强度值的平均值作为所述集合对应的音频强度值；

S23，按照所述目标视频中所有视频帧的时间顺序，对每个所述集合对应的音频强度值进行排列，得到音频强度序列。

在一个实施例中，计算N个集合中每个集合包含的原始音频强度值的平均值，一个集合对应一个平均值，并将该平均值作为该集合对应的音频强度值。由于一个集合对应一个视频帧，因此可以根据所有视频帧的时间顺序，将该N个集合中每个集合对应的音频强度值进行排序，得到音频强度序列。比如集合1对应视频帧1，对集合1的原始音频强度值计算得到的平均值为A1，集合2对应视频帧2，对集合2的原始音频强度值计算得到的平均值为A2，等等。则最后得到的音频强度序列为A1、A2、A3…A N。

S24，获取音频强度序列，所述音频强度序列包括N个音频强度值；

S25，根据所述目标视频帧在所述目标视频中的顺序编号，从所述音频强度序列中获取与所述顺序编号相匹配的音频强度值，作为与所述目标视频帧所在时间戳对应的目标音频强度值。

在一个实施例中，当需要获取目标视频中目标视频帧所在时间戳对应的目标音频强度值时，首先获取目标视频帧在目标视频中的顺序编号，比如目标视频帧为视频帧2，再从音频强度序列中获取与该顺序编号匹配的音频强度值，即从音频强度序列中获取与视频帧2匹配的音频强度值A2，音频强度值A2即是视频帧2对应的目标音频强度值。

下面结合ios平台和android平台阐述通过解码背景音频文件得到音频强度序列的过程：

(1)根据背景音频文件的路径初始化一个文件读取的指针reader，同时定义一个用来存储原始音频强度值sampleBuffer的数组sampleData；

(2)判断reader是否有数据，如果有，调用copyNextSampleBuffer获取sampleBuffer并保存在sampleData数组中；

(3)不断循环步骤(2)，直到reader读取到背景音频文件的末尾，得到保存的一个个sampleBuffer数据的sampleData数组；

(4)sampleData数组是比较大的一个数组，数据也比较乱，因此将其转换为unsigned long值，同时对数据做平滑处理，不然数据会忽低忽高，不能真实反映那个时刻的分贝。

设渲染视频每秒的帧数量为frameNum，音频文件时长为audioDuration，就需要将sampleData数组大小转换为大小为frameNum*audioDuration的数组，即sampleData数组大小sampleDataSize值为frameNum*audioDuration；

(5)将sampleData数组大小转换为frameNum*audioDuration大小的数组，可以是将每几个元素的值求和，然后求平均值作为新的sampleData数组中的一个元素。

最终得到的sampleData数组就会跟目标视频的视频帧一一对应，第一个视频帧就是对应新的sampleData数组的第一个元素，以此类推。新的sampleData数组中的所有元素就组成音频强度序列。

后续可以直接从新的sampleData数组中获取任意视频帧所在时间戳对应的音频强度值。

S103，根据所述目标音频强度值，确定所述目标视频帧对应的画面放大幅度值；

在一个实施例中，当获取到目标音频强度值后，可以将目标音频强度值转换为画面放大幅度值。通常目标音频强度值越大，则目标视频帧对应的画面放大幅度值越大。背景音频的音频强度值通常随着时间在不断变化，因此不同视频帧对应的画面放大幅度值也在不断的变化，从而产生视频播放过程中，视频画面随着背景音频有节奏的抖动。

可选的，可以计算目标音频强度值和基准强度值之间的差值，作为第一差值，并根据第一差值来确定目标视频帧对应的画面放大幅度值。或者，为了控制画面放大幅度值的最大值，可以获取背景音频的最大音频强度值，计算该最大音频强度值和基准强度值之间的差值，作为第二差值，根据第一差值和第二差值之间的比值，确定目标视频帧对应的画面放大幅度值。这里以一种画面放大幅度值的计算方式作为举例：

scale＝1.0+[(power-basePower)/(maxPower-basePower)]*0.5

其中，scale为画面放大幅度值，power为目标音频强度值，basePower为基准强度值，maxPower为最大音频强度值，如果是通过***接口player获取到的maxPower为0，如果是通过解码背景音频原文件获取到的，maxPower在解码时可获知最大为多少，最后乘以0.5是控制scale保证最大值为1.5。

基准强度值的大小不是固定不变，为了避免背景音频的音频强度值一直过大或过小导致画面一直放大或者不变，从而导致抖动不明显的效果，需要动态调整基准强度值的大小。

如果连续多个相邻历史音频强度值和基准强度值之间的差值均大于第一阈值，或者，连续多个相邻历史音频强度值和基准强度值之间的差值均小于第二阈值，均会导致抖动不明显，其中，连续多个相邻历史音频强度值可以是超过一定阈值个数的历史音频强度值，比如，该一定阈值个数可以是15，如果连续超过15个历史音频强度值和基准强度值之间的差值均大于第一阈值，或者，连续超过15个历史音频强度值和基准强度值之间的差值均小于第二阈值，则需要动态调整基准强度值。

需要说明的是，多个相邻历史音频强度值分别对应的视频帧是与目标视频帧相邻且在时间轴上连续的多个视频帧，如图7所示，比如目标视频帧是视频帧4，则该多个相邻历史音频强度值分别对应的视频帧可以是视频帧5、视频帧6、视频帧7…视频帧10，即视频帧5、视频帧6、视频帧7…视频帧10分别对应的音频强度值即是目标音频强度值的多个相邻历史音频强度值，目标音频强度值对应的视频帧是视频帧4，其中视频帧4、视频帧5、视频帧6、视频帧7…视频帧10均是目标视频连续的视频帧。

可选的，动态调整基准强度值的方式可以是：计算该多个相邻历史音频强度值的平均值，并根据该多个相邻历史音频强度值的平均值更新基准强度值。如图6所示，为本发明实施例提供的一种基准强度值更新流程图，假设历史音频强度值中连续过大的次数统计为N，连续过小的次数统计为M，基准音频强度值为B，某时刻的音频强度值为P，当出现连续次数超过一定阀值(这边设置为15)，基准强度值B就要更改为连续出现过大或者过小的多个历史音频强度值的平均值Q。

如图所示，首先获取某时刻的背景音乐的分贝值P，判断M是否大于15，或者N是否大于15，若是，则说明需要重新更新基准强度值Q，并将平均值Q更新为基准强度值。若否，则继续判断分贝值P是否大于基准强度值B，若是，则进一步判断连续过大的次数是否为0，若是，则直接将P的值赋值为平均值Q，若否，则将N累加，同时计算新的平均值和画面放大幅度值。若P小于基准强度值，则进一步判断连续过小的次数是否为0，则直接将P的值赋值为平均值Q，若否，则将M累加，同时计算新的平均值和画面放大幅度值。

可选的，动态调整基准强度值的方式可以是：获取该背景音频的音乐类型，音乐类型可以包括摇滚音乐、民族音乐、柔和音乐等等，不同的音乐类型可以对应不同的机器学***均值，并乘以一个大于1的加权系数，获得加权平均值，将该加权平均值更新为新的基准强度值，以适应摇滚音乐的音频强度值的变化幅度大的特点。若背景音频的音乐类型为柔和音乐，则与柔和音乐对应的机器学***均值，并乘以一个小于1的加权系数，获得加权平均值，将该加权平均值更新为新的基准强度值，以适应柔和音乐的音频强度值的变化幅度小的特点。

需要说明的是，上述动态调整基准强度值的方式可以是，在对目标视频的每一个视频帧进行视频画面放大处理后均检测是否进行基准强度值的调整。或者，对目标视频的预设个数的连续视频帧进行视频画面放大处理后检测一次是否进行基准强度值的调整。

S104，根据所述画面放大幅度值对所述目标视频帧进行视频画面放大处理。

在一个实施例中，根据所确定的画面放大幅度值对目标视频帧进行视频画面放大处理时，可以将画面放大幅度值与幅度阈值进行比较，比如幅度阈值可以是1，当画面放大幅度值大于幅度阈值时，则根据画面放大幅度值对应的放大倍数对目标视频帧的视频画面内容进行放大，当画面放大幅度值小于或者等于幅度阈值，则可以控制目标视频帧的视频画面内容不变，即将目标视频帧的视频画面保持为默认大小。比如，视频帧1的画面放大幅度值为1.2，则将视频帧1的视频画面内容放大1.2倍，视频帧2的画面放大幅度值为0.8，即小于幅度阈值1，则保持视频帧2的视频画面内容不变，视频帧3的画面放大幅度值为1.4，则将视频帧3的视频画面内容放大1.4倍，这样，在播放目标视频时，会产生抖动的效果，增强目标视频播放的动感。

可选的，在对视频帧的视频画面放大处理时，可以采用图像双线性插值放大算法进行放大处理，可以理解的是，还可以采用其他算法对视频画面进行放大处理，本发明实施例对此不作限定。

如图8所示，即是本发明实施例提供的一种视频画面放大处理的示意图，如图所示，第一张图片可以是视频帧的原始视频画面，第二张图片即是对视频画面进行放大处理后的视频画面。

下面将结合附图9-附图11，对本发明实施例提供的视频处理设备进行详细介绍。需要说明的是，附图9-附图11所示的设备，用于执行本发明图1-图8所示实施例的方法，为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明图1-图8所示的实施例。

请参见图9，为本发明实施例提供了一种视频处理设备的结构示意图。如图9所示，本发明实施例的所述视频处理设备1可以包括：第一获取单元11、第二获取单元12、确定单元13以及放大处理单元14；

第一获取单元11，用于获取目标视频中的目标视频帧以及背景音频；

第二获取单元12，用于从所述背景音频中，获取与所述目标视频帧所在时间戳对应的目标音频强度值；

可选的，如图10所示，第二获取单元12可以包括第一获取子单元121和计算子单元122；

第一获取子单元121，用于通过调用***接口获取与所述目标视频帧所在时间戳关联的M个音频强度值，所述M个音频强度值包括目标时间范围内的多个声道的音频强度值，所述目标时间范围包括所述目标视频帧所在时间戳；

计算子单元122，用于计算所述M个音频强度值的平均值，并将所述M个音频强度值的平均值作为与所述目标视频帧所在时间戳对应的目标音频强度值。

可选的，如图11所示，第二获取单元12可以包括第二获取子单元123和第三获取子单元124；

第二获取子单元123，用于获取音频强度序列，所述音频强度序列包括N个音频强度值，所述N的值与所述目标视频包含的视频帧数量相同，所述目标视频包含多个视频帧，一个音频强度值对应一个所述视频帧，所述N个音频强度值是通过对P个原始音频强度值进行合并处理后得到的，所述P个原始音频强度值是通过对所述背景音频进行解码得到的，所述P大于所述N；

第三获取子单元124，用于根据所述目标视频帧在所述目标视频中的顺序编号，从所述音频强度序列中获取与所述顺序编号相匹配的音频强度值，作为与所述目标视频帧所在时间戳对应的目标音频强度值。

可选的，该视频处理设备还可以包括解码处理单元、划分单元、计算单元以及排列单元；

确定单元13，用于根据所述目标音频强度值，确定所述目标视频帧对应的画面放大幅度值；

可选的，所述确定单元13可以包括第四获取子单元和确定子单元；

在一种可能的设计中，所述确定子单元具体用于：

获取所述背景音频的最大音频强度值；

可选的，所述设备还包括更新单元；

在一种可能的设计中，所述更新单元具体用于：

计算所述多个相邻历史音频强度值的平均值；

在一种可能的设计中，所述更新单元具体用于：

获取所述背景音频的音乐类型；

获取与所述音乐类型对应的机器学习模型，作为目标模型；

根据所述输出结果更新所述基准强度值。

放大处理单元14，用于根据所述画面放大幅度值对所述目标视频帧进行视频画面放大处理。

所述放大处理单元14具体用于：

该视频处理设备所涉及的与本申请实施例提供的技术方案相关的概念、解释和详细说明及其他步骤请参见前述方法或其他实施例中关于这些内容的描述，此处不做赘述。

本发明实施例还提供了一种计算机存储介质，所述计算机存储介质可以存储有多条指令，所述指令适于由处理器加载并执行如上述图1-图8所示实施例的方法步骤，具体执行过程可以参见图1-图8所示实施例的具体说明，在此不进行赘述。

请参见图12，为本发明实施例提供了一种终端的结构示意图，上述图11中的视频处理设备可以应用于所述终端1000，所述终端1000可以包括：处理器1001，网络接口1004和存储器1005，此外，所述终端1000还可以包括：用户接口1003，和至少一个通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。其中，用户接口1003可以包括显示屏(Display)、键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1004可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器1004可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图12所示，作为一种计算机存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及设备控制应用程序。

在图12所示的终端1000中，网络接口1004可提供网络通讯功能；而用户接口1003主要用于为用户提供输入的接口；而处理器1001可以用于调用存储器1004中存储的设备控制应用程序，以实现：

获取目标视频中的目标视频帧以及背景音频；

可选的，所述处理器1001在执行获取与所述目标视频帧所在时间戳对应的目标音频强度值，具体包括以下步骤：

在一个实施例中，所述处理器1001还用于执行以下步骤：

可选的，所述处理器1001在执行根据所述目标音频强度值，确定所述目标视频帧对应的画面放大幅度值，具体包括以下步骤：

可选的，所述处理器1001在执行根据所述第一差值，确定所述目标视频帧对应的画面放大幅度值，具体包括以下步骤：

获取所述背景音频的最大音频强度值；

在一个实施例中，所述处理器1001还用于执行以下步骤：

可选的，所述处理器1001在执行根据所述多个相邻历史音频强度值更新所述基准强度值，具体包括以下步骤：

计算所述多个相邻历史音频强度值的平均值；

获取所述背景音频的音乐类型；

获取与所述音乐类型对应的机器学习模型，作为目标模型；

根据所述输出结果更新所述基准强度值。

可选的，所述处理器1001在执行根据所述画面放大幅度值对所述目标视频帧进行视频画面放大处理，具体包括以下步骤：

需要说明的是，具体执行过程可以参见图1-图8所示方法实施例的具体说明，在此不进行赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于计算机可读取存储介质中，该程序在执行时，包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

Claims

1.一种视频处理方法，其特征在于，包括：

获取目标视频中的目标视频帧以及背景音频；

2.如权利要求1所述的方法，其特征在于，所述获取与所述目标视频帧所在时间戳对应的目标音频强度值，包括：

3.如权利要求1所述的方法，其特征在于，所述获取与所述目标视频帧所在时间戳对应的目标音频强度值，包括：

4.如权利要求3所述的方法，其特征在于，所述方法还包括：

5.如权利要求1-4任意一项所述的方法，其特征在于，所述根据所述目标音频强度值，确定所述目标视频帧对应的画面放大幅度值，包括：

6.如权利要求5所述的方法，其特征在于，所述根据所述第一差值，确定所述目标视频帧对应的画面放大幅度值，包括：

获取所述背景音频的最大音频强度值；

7.如权利要求5所述的方法，其特征在于，所述方法还包括：

8.如权利要求7所述的方法，其特征在于，所述根据所述多个相邻历史音频强度值更新所述基准强度值，包括：

计算所述多个相邻历史音频强度值的平均值；

9.如权利要求7所述的方法，其特征在于，所述根据所述多个相邻历史音频强度值更新所述基准强度值，包括：

获取所述背景音频的音乐类型；

获取与所述音乐类型对应的机器学习模型，作为目标模型；

根据所述输出结果更新所述基准强度值。

10.如权利要求1所述的方法，其特征在于，所述根据所述画面放大幅度值对所述目标视频帧进行视频画面放大处理，包括：

11.一种视频处理设备，其特征在于，包括：

12.如权利要求11所述的设备，其特征在于，所述第二获取单元包括：

13.如权利要求11所述的设备，其特征在于，所述第二获取单元包括：

14.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时，执行如权利要求1-10任一项所述的方法。

15.一种终端，其特征在于，包括：处理器和存储器；

所述处理器和存储器相连，其中，所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，以执行如权利要求1-10任一项所述的方法。