CN116405723A - 视频制作***、方法、电子设备及可读存储介质 - Google Patents

视频制作***、方法、电子设备及可读存储介质 Download PDF

Info

Publication number
CN116405723A
CN116405723A CN202310317989.8A CN202310317989A CN116405723A CN 116405723 A CN116405723 A CN 116405723A CN 202310317989 A CN202310317989 A CN 202310317989A CN 116405723 A CN116405723 A CN 116405723A
Authority
CN
China
Prior art keywords
video
time difference
audio
key
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310317989.8A
Other languages
English (en)
Other versions
CN116405723B (zh
Inventor
张礼官
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Simima Information Technology Co ltd
Original Assignee
Hangzhou Simima Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Simima Information Technology Co ltd filed Critical Hangzhou Simima Information Technology Co ltd
Priority to CN202310317989.8A priority Critical patent/CN116405723B/zh
Publication of CN116405723A publication Critical patent/CN116405723A/zh
Application granted granted Critical
Publication of CN116405723B publication Critical patent/CN116405723B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/816Monomedia components thereof involving special video data, e.g 3D video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Studio Circuits (AREA)

Abstract

本发明适用于视频制作技术领域,提供了视频制作***、方法、电子设备及可读存储介质,包括以下步骤:接收音频文件和视频文件;接收关键点绑定信息,关键点绑定信息包括若干个音频关键点和视频关键帧;计算相邻两个音频关键点之间的第一时间差,计算相对应两个视频关键帧之间的第二时间差;对第一时间差和第二时间差之间的误差百分比进行判定;当误差百分比小于设定百分比时,通过对音频或者视频进行变速,使得音频关键点和视频关键帧卡合;当误差百分比大于或者等于设定百分比时,通过对音频或者视频进行剪切,使得音频关键点和视频关键帧卡合。如此,保证了最终制作出来的视频中音频关键点和视频关键帧完全卡上,视频制作效率高。

Description

视频制作***、方法、电子设备及可读存储介质
技术领域
本发明涉及视频制作技术领域,具体是涉及一种视频制作***、方法、电子设备及可读存储介质。
背景技术
随着计算机技术的不断发展,短视频越来越火爆,越来越多的人开始自己制作视频,在拍摄短视频时,往往会添加背景音乐使得整个视频更有趣味。很多时候,为了使得背景音乐和短视频本身更加融合,需要将短视频与背景音乐进行卡点,如果卡点数量超过一个,视频拍摄者很难保证两个视频卡点与背景音乐上对应点正好卡上,往往需要反复拍摄,给视频制作带来不便。因此,需要提供一种视频制作***、方法、电子设备及可读存储介质,旨在解决上述问题。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种视频制作***、方法、电子设备及可读存储介质,以解决上述背景技术中存在的问题。
本发明是这样实现的,一种视频制作方法,所述方法包括以下步骤:
接收音频文件和视频文件;
接收关键点绑定信息,所述关键点绑定信息包括若干个音频关键点和视频关键帧,音频关键点和视频关键帧一一对应;
计算相邻两个音频关键点之间的第一时间差,计算相对应两个视频关键帧之间的第二时间差;
对第一时间差和第二时间差之间的误差百分比进行判定;
当误差百分比小于设定百分比时,通过对音频或者视频进行变速,使得音频关键点和视频关键帧卡合;
当误差百分比大于或者等于设定百分比时,通过对音频或者视频进行剪切,使得音频关键点和视频关键帧卡合。
作为本发明进一步的方案:所述通过对音频或者视频进行变速,使得音频关键点和视频关键帧卡合的步骤,具体包括:
根据第一时间差和第二时间差确定均值时间差,均值时间差=(第一时间差+第二时间差)/2;
根据第一时间差和均值时间差确定音频的第一变速速率,根据第一变速速率对两个所述音频关键点之间的音频片段进行处理;
根据第二时间差和均值时间差确定视频的第二变速速率,根据第二变速速率对两个所述视频关键帧之间的视频片段进行处理。
作为本发明进一步的方案:所述通过对音频或者视频进行剪切,使得音频关键点和视频关键帧卡合的步骤,具体包括:
当第一时间差大于第二时间差时,确定第一差值,第一差值等于第一时间差减第二时间差,识别音乐间奏,剪切掉与所述第一差值相等的音频片段,所述音频片段优先为音乐间奏;
当第一时间差小于第二时间差时,确定第二差值,第二差值等于第二时间差减第一时间差,接收可裁剪片段,剪切掉与所述第二差值相等的视频片段,所述视频片段属于可裁剪片段。
作为本发明进一步的方案:所述接收可裁剪片段,剪切掉与所述第二差值相等的视频片段的步骤,具体包括:
接收可裁剪片段,所述可裁剪片段的时长大于第二差值;
根据第二差值确定若干对间隔视频帧,每对间隔视频帧之间的时间差为第二差值;
计算每对间隔视频帧之间的相似度,确定相似度最高的一对间隔视频帧,将该对间隔视频帧中间的视频片段剪切掉。
作为本发明进一步的方案:所述方法还包括对音频文件进行语音识别,得到音频字幕,所述音频字幕可进行编辑。
本发明的另一目的在于提供一种视频制作***,所述***包括:
音视频文件接收模块,用于接收音频文件和视频文件;
关键点绑定确定模块,用于接收关键点绑定信息,所述关键点绑定信息包括若干个音频关键点和视频关键帧,音频关键点和视频关键帧一一对应;
时间差计算模块,用于计算相邻两个音频关键点之间的第一时间差,计算相对应两个视频关键帧之间的第二时间差;
误差百分比判定模块,用于对第一时间差和第二时间差之间的误差百分比进行判定;
第一音视频处理模块,当误差百分比小于设定百分比时,通过对音频或者视频进行变速,使得音频关键点和视频关键帧卡合;
第二音视频处理模块,当误差百分比大于或者等于设定百分比时,通过对音频或者视频进行剪切,使得音频关键点和视频关键帧卡合。
作为本发明进一步的方案:所述第一音视频处理模块包括:
均值时间差确定单元,用于根据第一时间差和第二时间差确定均值时间差,均值时间差=(第一时间差+第二时间差)/2;
音频片段变速单元,用于根据第一时间差和均值时间差确定音频的第一变速速率,根据第一变速速率对两个所述音频关键点之间的音频片段进行处理;
视频片段变速单元,用于根据第二时间差和均值时间差确定视频的第二变速速率,根据第二变速速率对两个所述视频关键帧之间的视频片段进行处理。
作为本发明进一步的方案:所述第二音视频处理模块包括:
音频片段剪切单元,当第一时间差大于第二时间差时,确定第一差值,第一差值等于第一时间差减第二时间差,识别音乐间奏,剪切掉与所述第一差值相等的音频片段,所述音频片段优先为音乐间奏;
视频片段剪切单元,当第一时间差小于第二时间差时,确定第二差值,第二差值等于第二时间差减第一时间差,接收可裁剪片段,剪切掉与所述第二差值相等的视频片段,所述视频片段属于可裁剪片段。
本发明的目的还在于提供一种电子设备,包括处理器、可读存储介质以及存储在可读存储介质上并能够在所述处理器上运行的计算机程序,当处理器执行所述计算机程序时,实现所述的视频制作方法中的具体步骤
本发明的目的还在于提供一种可读存储介质,所述可读存储介质上存储有程序或指令,所述程序或指令被处理器执行时实现所述的视频制作方法中的具体步骤。
与现有技术相比,本发明的有益效果是:
本发明通过接收用户输入的关键点绑定信息,所述关键点绑定信息包括若干个音频关键点和视频关键帧,音频关键点和视频关键帧一一对应;计算相邻两个音频关键点之间的第一时间差,计算相对应两个视频关键帧之间的第二时间差;对第一时间差和第二时间差之间的误差百分比进行判定;当误差百分比小于设定百分比时,通过对音频或者视频进行变速,使得音频关键点和视频关键帧卡合;当误差百分比大于或者等于设定百分比时,通过对音频或者视频进行剪切,使得音频关键点和视频关键帧卡合。如此,保证了最终制作出来的视频中音频关键点和视频关键帧完全卡上,无需反复拍摄视频,视频制作效率高。
附图说明
图1为一种视频制作方法的流程图。
图2为一种视频制作方法中通过对音频或者视频进行变速,使得音频关键点和视频关键帧卡合的流程图。
图3为一种视频制作方法中通过对音频或者视频进行剪切,使得音频关键点和视频关键帧卡合的流程图。
图4为一种视频制作方法中接收可裁剪片段,剪切掉与所述第二差值相等的视频片段的流程图。
图5为一种视频制作***的结构示意图。
图6为一种视频制作***中第一音视频处理模块的结构示意图。
图7为一种视频制作***中第二音视频处理模块的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清晰,以下结合附图及具体实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述。
如图1所示,本发明实施例提供了一种视频制作方法,所述方法包括以下步骤:
S100,接收音频文件和视频文件;
S200,接收关键点绑定信息,所述关键点绑定信息包括若干个音频关键点和视频关键帧,音频关键点和视频关键帧一一对应;
S300,计算相邻两个音频关键点之间的第一时间差,计算相对应两个视频关键帧之间的第二时间差;
S400,对第一时间差和第二时间差之间的误差百分比进行判定;
S500,当误差百分比小于设定百分比时,通过对音频或者视频进行变速,使得音频关键点和视频关键帧卡合;
S600,当误差百分比大于或者等于设定百分比时,通过对音频或者视频进行剪切,使得音频关键点和视频关键帧卡合。
需要说明的是,在拍摄短视频时,往往会添加背景音乐使得整个视频更有趣味。很多时候,为了使得背景音乐和短视频本身更加融合,需要将短视频与背景音乐进行卡点,如果卡点数量超过一个,视频拍摄者很难保证两个视频卡点与背景音乐上对应点正好卡上,往往需要反复拍摄,给视频制作带来不便,本发明实施例旨在解决上述问题。
本发明实施例中,首先需要视频制作者上传音频文件和视频文件,并输入关键点绑定信息,所述关键点绑定信息包括若干个音频关键点和视频关键帧,音频关键点和视频关键帧一一对应,本发明实施例的目的就是使得最终制作出来的视频中音频关键点和视频关键帧完全卡上;然后,本发明实施例会自动计算相邻两个音频关键点之间的第一时间差,并计算相对应两个视频关键帧之间的第二时间差,对第一时间差和第二时间差之间的误差百分比进行判定,所述误差百分比为提前设置的定值,误差百分比=第一时间差和第二时间差之间的差值/max(第一时间差,第二时间差),当误差百分比小于设定百分比时,通过对音频或者视频进行变速,使得音频关键点和视频关键帧卡合,容易理解,如果变速幅度过大,会显得不自然,所以该方案仅仅适用于误差百分比较小时;当误差百分比大于或者等于设定百分比时,通过对音频或者视频进行剪切,使得音频关键点和视频关键帧卡合。如此,保证了最终制作出来的视频中音频关键点和视频关键帧完全卡上,无需反复拍摄视频,视频制作效率高。
如图2所示,作为本发明一个优选的实施例,所述通过对音频或者视频进行变速,使得音频关键点和视频关键帧卡合的步骤,具体包括:
S501,根据第一时间差和第二时间差确定均值时间差,均值时间差=(第一时间差+第二时间差)/2;
S502,根据第一时间差和均值时间差确定音频的第一变速速率,根据第一变速速率对两个所述音频关键点之间的音频片段进行处理;
S503,根据第二时间差和均值时间差确定视频的第二变速速率,根据第二变速速率对两个所述视频关键帧之间的视频片段进行处理。
本发明实施例中,使用变速的手段使得音频关键点和视频关键帧卡合时,为了使得变速的幅度更小,视频制作出来更加自然,音频文件和视频文件都进行变速,相互靠拢,具体的,首先根据第一时间差和第二时间差确定均值时间差,均值时间差=(第一时间差+第二时间差)/2,然后就可以根据第一时间差和均值时间差确定音频的第一变速速率,根据第一变速速率对两个所述音频关键点之间的音频片段进行变速处理,处理后,两个所述音频关键点之间的时间间隔等于均值时间差;同时需要根据第二时间差和均值时间差确定视频的第二变速速率,根据第二变速速率对两个所述视频关键帧之间的视频片段进行处理,处理后,两个所述视频关键帧之间的时间间隔也等于均值时间差。
如图3所示,作为本发明一个优选的实施例,所述通过对音频或者视频进行剪切,使得音频关键点和视频关键帧卡合的步骤,具体包括:
S601,当第一时间差大于第二时间差时,确定第一差值,第一差值等于第一时间差减第二时间差,识别音乐间奏,剪切掉与所述第一差值相等的音频片段,所述音频片段优先为音乐间奏;
S602,当第一时间差小于第二时间差时,确定第二差值,第二差值等于第二时间差减第一时间差,接收可裁剪片段,剪切掉与所述第二差值相等的视频片段,所述视频片段属于可裁剪片段。
本发明实施例中,当误差百分比大于或者等于设定百分比时,需要对音频或者视频进行剪切,具体的,当第一时间差大于第二时间差时,确定第一差值,第一差值等于第一时间差减第二时间差,会自动识别音乐间奏,音乐间奏不包含歌词,剪切掉与所述第一差值相等的音频片段,所述音频片段优先为音乐间奏,如此,尽量不影响音乐内容;另外,当第一时间差小于第二时间差时,确定第二差值,第二差值等于第二时间差减第一时间差,需要用户选定可裁剪片段,可裁剪片段为视频文件的一部分,剪切掉与所述第二差值相等的视频片段,所述视频片段属于可裁剪片段,可裁剪片段是用户认为不重要的片段,裁剪后,基本不影响视频内容的表达。
如图4所示,作为本发明一个优选的实施例,所述接收可裁剪片段,剪切掉与所述第二差值相等的视频片段的步骤,具体包括:
S6021,接收可裁剪片段,所述可裁剪片段的时长大于第二差值;
S6022,根据第二差值确定若干对间隔视频帧,每对间隔视频帧之间的时间差为第二差值;
S6023,计算每对间隔视频帧之间的相似度,确定相似度最高的一对间隔视频帧,将该对间隔视频帧中间的视频片段剪切掉。
本发明实施例中,容易理解,用户选定的可裁剪片段的时长需要大于第二差值,接着,本发明实施例会根据第二差值确定若干对间隔视频帧,每对间隔视频帧之间的时间差为第二差值,若干个成对的间隔视频帧确定后,需要计算每对间隔视频帧之间的相似度,确定相似度最高的一对间隔视频帧,将该对间隔视频帧中间的视频片段剪切掉,如此,相似度最高的一对间隔视频帧会变成连续的视频帧,由于相似度较高,即使将原本间隔的视频帧变为连续也不会显得突兀。
作为本发明一个优选的实施例,所述方法还包括对音频文件进行语音识别,得到音频字幕,所述音频字幕可进行编辑,这样即使语音识别出现错误,也能够进行人为修正,使用方便。
如图5所示,本发明实施例还提供了一种视频制作***,所述***包括:
音视频文件接收模块100,用于接收音频文件和视频文件;
关键点绑定确定模块200,用于接收关键点绑定信息,所述关键点绑定信息包括若干个音频关键点和视频关键帧,音频关键点和视频关键帧一一对应;
时间差计算模块300,用于计算相邻两个音频关键点之间的第一时间差,计算相对应两个视频关键帧之间的第二时间差;
误差百分比判定模块400,用于对第一时间差和第二时间差之间的误差百分比进行判定;
第一音视频处理模块500,当误差百分比小于设定百分比时,通过对音频或者视频进行变速,使得音频关键点和视频关键帧卡合;
第二音视频处理模块500,当误差百分比大于或者等于设定百分比时,通过对音频或者视频进行剪切,使得音频关键点和视频关键帧卡合。
本发明实施例中,首先需要视频制作者上传音频文件和视频文件,并输入关键点绑定信息,所述关键点绑定信息包括若干个音频关键点和视频关键帧,音频关键点和视频关键帧一一对应,本发明实施例的目的就是使得最终制作出来的视频中音频关键点和视频关键帧完全卡上;然后,本发明实施例会自动计算相邻两个音频关键点之间的第一时间差,并计算相对应两个视频关键帧之间的第二时间差,对第一时间差和第二时间差之间的误差百分比进行判定,所述误差百分比为提前设置的定值,误差百分比=第一时间差和第二时间差之间的差值/max(第一时间差,第二时间差),当误差百分比小于设定百分比时,通过对音频或者视频进行变速,使得音频关键点和视频关键帧卡合,容易理解,如果变速幅度过大,会显得不自然,所以该方案仅仅适用于误差百分比较小时;当误差百分比大于或者等于设定百分比时,通过对音频或者视频进行剪切,使得音频关键点和视频关键帧卡合。如此,保证了最终制作出来的视频中音频关键点和视频关键帧完全卡上,无需反复拍摄视频,视频制作效率高。
如图6所示,作为本发明一个优选的实施例,所述第一音视频处理模块500包括:
均值时间差确定单元501,用于根据第一时间差和第二时间差确定均值时间差,均值时间差=(第一时间差+第二时间差)/2;
音频片段变速单元502,用于根据第一时间差和均值时间差确定音频的第一变速速率,根据第一变速速率对两个所述音频关键点之间的音频片段进行处理;
视频片段变速单元503,用于根据第二时间差和均值时间差确定视频的第二变速速率,根据第二变速速率对两个所述视频关键帧之间的视频片段进行处理。
如图7所示,作为本发明一个优选的实施例,所述第二音视频处理模块600包括:
音频片段剪切单元601,当第一时间差大于第二时间差时,确定第一差值,第一差值等于第一时间差减第二时间差,识别音乐间奏,剪切掉与所述第一差值相等的音频片段,所述音频片段优先为音乐间奏;
视频片段剪切单元602,当第一时间差小于第二时间差时,确定第二差值,第二差值等于第二时间差减第一时间差,接收可裁剪片段,剪切掉与所述第二差值相等的视频片段,所述视频片段属于可裁剪片段。
本发明实施例还提供了一种电子设备,包括处理器、可读存储介质以及存储在可读存储介质上并能够在所述处理器上运行的计算机程序,当处理器执行所述计算机程序时,实现所述的视频制作方法中的具体步骤。
本发明实施例还提供了一种可读存储介质,所述可读存储介质上存储有程序或指令,所述程序或指令被处理器执行时实现所述的视频制作方法中的具体步骤。
以上仅对本发明的较佳实施例进行了详细叙述,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域技术人员在考虑说明书及实施例处的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。

Claims (10)

1.视频制作方法,其特征在于,所述方法包括以下步骤:
接收音频文件和视频文件;
接收关键点绑定信息,所述关键点绑定信息包括若干个音频关键点和视频关键帧,音频关键点和视频关键帧一一对应;
计算相邻两个音频关键点之间的第一时间差,计算相对应两个视频关键帧之间的第二时间差;
对第一时间差和第二时间差之间的误差百分比进行判定;
当误差百分比小于设定百分比时,通过对音频或者视频进行变速,使得音频关键点和视频关键帧卡合;
当误差百分比大于或者等于设定百分比时,通过对音频或者视频进行剪切,使得音频关键点和视频关键帧卡合。
2.根据权利要求1所述的视频制作方法,其特征在于,所述通过对音频或者视频进行变速,使得音频关键点和视频关键帧卡合的步骤,具体包括:
根据第一时间差和第二时间差确定均值时间差,均值时间差=(第一时间差+第二时间差)/2;
根据第一时间差和均值时间差确定音频的第一变速速率,根据第一变速速率对两个所述音频关键点之间的音频片段进行处理;
根据第二时间差和均值时间差确定视频的第二变速速率,根据第二变速速率对两个所述视频关键帧之间的视频片段进行处理。
3.根据权利要求1所述的视频制作方法,其特征在于,所述通过对音频或者视频进行剪切,使得音频关键点和视频关键帧卡合的步骤,具体包括:
当第一时间差大于第二时间差时,确定第一差值,第一差值等于第一时间差减第二时间差,识别音乐间奏,剪切掉与所述第一差值相等的音频片段,所述音频片段优先为音乐间奏;
当第一时间差小于第二时间差时,确定第二差值,第二差值等于第二时间差减第一时间差,接收可裁剪片段,剪切掉与所述第二差值相等的视频片段,所述视频片段属于可裁剪片段。
4.根据权利要求3所述的视频制作方法,其特征在于,所述接收可裁剪片段,剪切掉与所述第二差值相等的视频片段的步骤,具体包括:
接收可裁剪片段,所述可裁剪片段的时长大于第二差值;
根据第二差值确定若干对间隔视频帧,每对间隔视频帧之间的时间差为第二差值;
计算每对间隔视频帧之间的相似度,确定相似度最高的一对间隔视频帧,将该对间隔视频帧中间的视频片段剪切掉。
5.根据权利要求1所述的视频制作方法,其特征在于,所述方法还包括对音频文件进行语音识别,得到音频字幕,所述音频字幕可进行编辑。
6.视频制作***,其特征在于,所述***包括:
音视频文件接收模块,用于接收音频文件和视频文件;
关键点绑定确定模块,用于接收关键点绑定信息,所述关键点绑定信息包括若干个音频关键点和视频关键帧,音频关键点和视频关键帧一一对应;
时间差计算模块,用于计算相邻两个音频关键点之间的第一时间差,计算相对应两个视频关键帧之间的第二时间差;
误差百分比判定模块,用于对第一时间差和第二时间差之间的误差百分比进行判定;
第一音视频处理模块,当误差百分比小于设定百分比时,通过对音频或者视频进行变速,使得音频关键点和视频关键帧卡合;
第二音视频处理模块,当误差百分比大于或者等于设定百分比时,通过对音频或者视频进行剪切,使得音频关键点和视频关键帧卡合。
7.根据权利要求6所述的视频制作***,其特征在于,所述第一音视频处理模块包括:
均值时间差确定单元,用于根据第一时间差和第二时间差确定均值时间差,均值时间差=(第一时间差+第二时间差)/2;
音频片段变速单元,用于根据第一时间差和均值时间差确定音频的第一变速速率,根据第一变速速率对两个所述音频关键点之间的音频片段进行处理;
视频片段变速单元,用于根据第二时间差和均值时间差确定视频的第二变速速率,根据第二变速速率对两个所述视频关键帧之间的视频片段进行处理。
8.根据权利要求6所述的视频制作***,其特征在于,所述第二音视频处理模块包括:
音频片段剪切单元,当第一时间差大于第二时间差时,确定第一差值,第一差值等于第一时间差减第二时间差,识别音乐间奏,剪切掉与所述第一差值相等的音频片段,所述音频片段优先为音乐间奏;
视频片段剪切单元,当第一时间差小于第二时间差时,确定第二差值,第二差值等于第二时间差减第一时间差,接收可裁剪片段,剪切掉与所述第二差值相等的视频片段,所述视频片段属于可裁剪片段。
9.一种电子设备,其特征在于,包括处理器、可读存储介质以及存储在可读存储介质上并能够在所述处理器上运行的计算机程序,当处理器执行所述计算机程序时,实现如权利要求1至5中任一项所述的视频制作方法中的具体步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有程序或指令,所述程序或指令被处理器执行时实现如权利要求1至5中任一项所述的视频制作方法中的具体步骤。
CN202310317989.8A 2023-03-28 2023-03-28 视频制作***、方法、电子设备及可读存储介质 Active CN116405723B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310317989.8A CN116405723B (zh) 2023-03-28 2023-03-28 视频制作***、方法、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310317989.8A CN116405723B (zh) 2023-03-28 2023-03-28 视频制作***、方法、电子设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN116405723A true CN116405723A (zh) 2023-07-07
CN116405723B CN116405723B (zh) 2023-12-22

Family

ID=87008461

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310317989.8A Active CN116405723B (zh) 2023-03-28 2023-03-28 视频制作***、方法、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN116405723B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110677711A (zh) * 2019-10-17 2020-01-10 北京字节跳动网络技术有限公司 视频配乐方法、装置、电子设备及计算机可读介质
CN111741233A (zh) * 2020-07-16 2020-10-02 腾讯科技(深圳)有限公司 视频配乐方法、装置、存储介质以及电子设备
US20220279239A1 (en) * 2019-11-15 2022-09-01 Beijing Bytedance Network Technology Co., Ltd. Method and apparatus for generating video, electronic device, and computer readable medium
CN115361594A (zh) * 2022-07-15 2022-11-18 北京达佳互联信息技术有限公司 卡点视频生成方法、装置、电子设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110677711A (zh) * 2019-10-17 2020-01-10 北京字节跳动网络技术有限公司 视频配乐方法、装置、电子设备及计算机可读介质
US20220279239A1 (en) * 2019-11-15 2022-09-01 Beijing Bytedance Network Technology Co., Ltd. Method and apparatus for generating video, electronic device, and computer readable medium
CN111741233A (zh) * 2020-07-16 2020-10-02 腾讯科技(深圳)有限公司 视频配乐方法、装置、存储介质以及电子设备
CN115361594A (zh) * 2022-07-15 2022-11-18 北京达佳互联信息技术有限公司 卡点视频生成方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN116405723B (zh) 2023-12-22

Similar Documents

Publication Publication Date Title
JP6927385B2 (ja) 復号化装置および方法、並びにプログラム
CN107591149B (zh) 音频合成方法、装置及存储介质
US20060149535A1 (en) Method for controlling speed of audio signals
US7526181B2 (en) System and method for automatically customizing a buffered media stream
US20050273321A1 (en) Audio signal time-scale modification method using variable length synthesis and reduced cross-correlation computations
EP2966645B1 (en) Method, apparatus and computer program product for editing media content
CN117459665B (zh) 视频剪辑方法、***与存储介质
CN111601162B (zh) 视频切分方法、装置和计算机存储介质
CN105975568B (zh) 一种音频处理方法及装置
US9183837B2 (en) Apparatus and method for determining bit rate for audio content
WO2023151424A1 (zh) 视频的音画面播放速率调整方法及装置
US20180158469A1 (en) Audio processing method and apparatus, and terminal
CN108682436B (zh) 语音对齐方法及装置
CN116405723B (zh) 视频制作***、方法、电子设备及可读存储介质
US7787976B2 (en) Method and apparatus for estimating length of audio file
CN105530534A (zh) 一种视频剪辑的方法和装置
US9524752B2 (en) Method and system for automatic B-roll video production
CN108566567B (zh) 电影剪辑方法及装置
Charfeddine et al. Modified video watermarking scheme using audio silence deletion
CN113645499A (zh) 一种基于云端的视频剪辑方法
CN105578260A (zh) 一种视频剪辑的方法和装置
CN107491830B (zh) 一种时间序列曲线的处理方法和装置
CN110998726B (zh) 用于使外部内容适配视频流的方法、***和计算机可读媒体
CN112218118A (zh) 一种音视频裁剪方法及装置
CN104332165A (zh) 用于在便携式终端中平衡音量的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant