CN111935537A - 音乐短片视频生成方法、装置、电子设备和存储介质 - Google Patents

音乐短片视频生成方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN111935537A
CN111935537A CN202010611868.0A CN202010611868A CN111935537A CN 111935537 A CN111935537 A CN 111935537A CN 202010611868 A CN202010611868 A CN 202010611868A CN 111935537 A CN111935537 A CN 111935537A
Authority
CN
China
Prior art keywords
video
lyrics
acquiring
music
song audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010611868.0A
Other languages
English (en)
Inventor
陈明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010611868.0A priority Critical patent/CN111935537A/zh
Publication of CN111935537A publication Critical patent/CN111935537A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4398Processing of audio elementary streams involving reformatting operations of audio signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • H04N21/4355Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream involving reformatting operations of additional data, e.g. HTML pages on a television screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种音乐短片视频生成方法、装置、电子设备和存储介质,涉及人工智能领域、视频处理领域。具体实现方案为:获取待处理的歌曲音频;获取歌曲音频对应的歌词文本;对歌词文本中的歌词进行语义分析,生成歌词的内容关键词;根据歌词的内容关键词获取与歌词相关联的视频片段;将歌曲音频和与歌词相关联的视频片段进行合成,生成对应的音乐短片视频。本申请通过对视频素材与歌曲音频内容的分析,建立标签信息进行关联,从而根据该标签自动找到歌曲相关联的视频素材,进而自动将歌曲音频与其相关联的视频素材进行合成,可以降低音乐短片视频的制作难度,实现制作MV音乐短片视频的自动化、智能化。

Description

音乐短片视频生成方法、装置、电子设备和存储介质
技术领域
本申请涉及计算机技术领域,具体涉及人工智能领域、视频处理领域,尤其涉及一种音乐短片视频生成方法、装置、电子设备和存储介质。
背景技术
人的视觉和听觉有相通之处,人们在聆听音乐和欣赏图片或者视频时会感受到相似的感觉和情感体验。音乐和视频的关系在音乐短片视频制作中起到关键的作用,同时海量的视频和图像数据库使得音乐短片视频制作者往往需要花费大量的时间和精力去寻找或是制作与音乐短片相关的图像或视频,十分浪费人力物力,并需要专业知识,业余人员往往很难制作出自己期望的高质量音乐短片视频。
发明内容
本公开提供了一种音乐短片视频生成方法、装置、电子设备以及存储介质。
根据本公开的第一方面,提供了一种音乐短片视频生成方法,包括:
获取待处理的歌曲音频;
获取所述歌曲音频对应的歌词文本;
对所述歌词文本中的歌词进行语义分析,生成所述歌词的内容关键词;
根据所述歌词的内容关键词获取与所述歌词相关联的视频片段;
将所述歌曲音频和与所述歌词相关联的视频片段进行合成,生成对应的音乐短片视频。
根据本公开的第二方面,提供了一种音乐短片视频生成装置,包括:
第一获取模块,用于获取待处理的歌曲音频;
歌词文本获取模块,用于获取所述歌曲音频对应的歌词文本;
第一生成模块,用于对所述歌词文本中的歌词进行语义分析,生成所述歌词的内容关键词;
第二获取模块,用于根据所述歌词的内容关键词获取与所述歌词相关联的视频片段;
第二生成模块,用于将所述歌曲音频和与所述歌词相关联的视频片段进行合成,生成对应的音乐短片视频。
根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面所述的音乐短片视频生成方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述第一方面所述的音乐短片视频生成方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请一个实施例的音乐短片视频生成方法的流程图;
图2是根据本申请实施例的获取歌词文本内容的示例图;
图3是根据本申请实施例的获取视频片段素材标签的示例图;
图4是根据本申请另一个实施例的音乐短片视频生成方法的流程图;
图5是根据本申请实施例的音乐短片视频合成的示例图;
图6是根据本申请一个实施例的音乐短片视频生成装置的结构框图;
图7是根据本申请另一个实施例的音乐短片视频生成装置的结构框图;
图8是根据本申请又一个实施例的音乐短片视频生成装置的结构框图;
图9是用来实现本申请实施例的音乐短片视频生成方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本申请一个实施例的音乐短片视频生成方法的流程图。需要说明的是,本申请实施例的音乐短片视频生成方法可应用于本申请实施例的音乐短片视频生成装置,该装置可被配置于电子设备。其中,该电子设备可以是移动终端,例如,手机、平板电脑、个人数字助理等具有各种操作***的硬件设备。
还需要说明的是,本申请实施例可通过人工智能技术实现音乐短片视频的生成。可以理解,人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家***等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。
如图1所示,该音乐短片视频生成方法可以包括:
步骤101,获取待处理的歌曲音频。
举例而言,假设本申请实施例的音乐短片视频生成方法应用于电子设备,其中,该电子设备为用户提供用以制作音乐短片(Music Video,英文简称:MV)视频的应用程序。该应用程序可提供歌曲音频的上传接口,用户可通过该接口上传需要处理的歌曲音频。可选地,应用程序还可提供歌曲音频数据库,用户可从该歌曲音频数据库中选取一个音频作为待处理的歌曲音频。
步骤102,获取歌曲音频对应的歌词文本。
在本申请一些实施例中,可根据该歌曲音频的标识信息从互联网上或电子设备的本地中抓取该歌曲音频对应的歌词文本。在本申请其他实施例中,还可通过对歌曲音频进行语音识别以获得该歌曲音频对应的歌词文本。
可选地,通过人工智能算法对歌曲音频进行语音识别,以分析理解歌词内容,从而获得歌曲音频对应的歌词文本。例如,可利用人工智能技术、自然语言处理技术和语音识别技术预先建立一个语音识别模型,利用该语音识别模型对歌曲音频进行语音识别,从而获得该歌曲音频对应的歌词文本内容。
例如,如图2所示,可利用人工智能算法中的深度学习算法预先建立语音识别模型,可将歌曲音频输入到语音识别模型中进行帧分析,从而得到该歌曲音频所对对应的歌词文本内容。
步骤103,对歌词文本中的歌词进行语义分析,生成歌词的内容关键词。
可选地,利用自然语言处理技术对歌词文本中的歌词进行语义分析,得到歌词的内容关键词。例如,以歌词“锁了门关了窗熄了灯”为例,对该歌词进行语义分析,得到该歌词的内容关键词为“锁门”和“关窗”。又如,以歌词“公路上城市中人行道”为例,对该歌词进行语义分析,得到该歌词的内容关键词为“城市”。
为了能够使得生成的MV视频内容更加符合歌曲,使得MV视频内容更加多元化,在本申请一些实施例中,可对歌词文本中的每句歌词进行语义分析,生成每句歌词的内容关键词,以便根据每句歌词的内容关键词获取与每句歌词相关联的视频片段,进而基于与每句歌词相关联的视频片段生成该歌曲的MV视频,使得生成的MV视频内容更加符合歌曲,使得MV视频内容更加多元化。
需要说明的是,在本申请一些实施例中,该内容关键词还可包括情感类型。可选地,为了能够找到与歌曲音频更加匹配的视频片段,即找到能够更加呈现出歌曲音频所表达的情感,在本申请实施例中,在对歌词文本中的每句歌词进行语义分析时,还可对每句歌词进行情感分析,以确定每句歌词所表达的情感类型,以便后续基于每句歌词的情感类型寻找与其相关联的视频片段,使得该视频片段更能够呈现出该歌词所表达的情感。例如,以歌词“我是怎么能让你死心离去”为例,可对该歌词进行语义分析和情感分析,得到该歌词的内容关键词为“离开”和“痛苦”,其中,关键词“离开”是基于语义分析得到的,“离开”是基于情感分析而得到的。
步骤104,根据歌词的内容关键词获取与歌词相关联的视频片段。
可选地,在得到每句歌词的内容关键词之后,可根据每句歌词的内容关键词获取与每句歌词相关联的视频片段。其中,需要说明的是,视频片段可以是用户预先提供的,例如,用户提供一个视频和待处理的歌曲音频,目的是想将该视频中的一些或全部片段用于与歌曲音频进行合成,以生成该歌曲的MV视频。或者,本申请实施例可预先建立视频素材库,可基于歌词的内容关键词从该视频素材库中获取与每句歌词相关联的视频片段。
在本申请一些实施例中,在获取待处理的歌曲音频之前,可获取多个视频片段素材,并获取每个视频片段素材的标签信息,根据多个视频片段素材和每个视频片段素材的标签信息,建立视频素材库。
可选地,预先获取一些视频片段素材,并利用人工智能技术对这些视频片段素材进行内容理解分析,并根据分析到的内容为这些视频片段素材分配标签,以得到每个视频片段素材的标签信息,之后,可根据视频片段素材和及其标签信息建立视频素材库。
举例而言,如图3所示,可通过从互联网上爬取一些视频片段素材,并通过人工智能算法对视频片段素材进行逐帧分析,以获得该视频片段素材之中每帧画面所显示的元素信息,并通过统计每帧画面所显示的元素信息,来获得该视频片段素材的标签信息。例如,可通过人工智能算法中的图像识别算法对视频片段素材进行逐帧分析,以获得每帧画面所显示的元素信息,进而统计每帧画面所显示的元素信息,比如,该视频片段素材中大多数帧图像的画面所显示的元素信息为海边和美女,则可确定该视频片段素材的标签信息为“海边”和“美女”。
在本申请实施例中,从视频素材库中找出与内容关键词匹配的标签信息,并将找到的标签信息所对应的视频片段素材,确定为内容关键词所对应的歌词相关联的视频片段。也就是说,可利用歌词的内容关键词,从视频素材库中找出与该内容关键词匹配的标签信息,并在视频素材库中找出与该标签信息对应的视频片段素材,并将该视频片段素材确定为该内容关键词所对应的歌词相关联的视频片段。例如,假设某句歌词的内容关键词为“海边”,则可从视频素材库中找出与该内容关键词为“海边”匹配的标签信息“海边”,将该标签信息所对应的视频片段素材作为该某句歌词相关联的视频片段。需要说明的是,视频素材库之中视频片段素材的标签信息还可包括情感类型的标签,以便获得的视频片段更能够呈现出歌词所表达的情感。
步骤105,将歌曲音频和与每句歌词相关联的视频片段进行合成,生成对应的音乐短片视频。
可选地,将歌曲音频中的每句歌词所对应的音频与该句歌词相关联的视频片段进行合成,以生成混合有音频和视频片段的混合音视频,最后,按照每句歌词的顺序,将这些混合有音频和视频片段的混合音视频进行拼接,以得到该歌曲的音乐短片视频。
在本申请一些实施例中,可根据歌曲音频获取每句歌词的播放时长,并根据播放时长,调整与每句歌词相关联的视频片段的播放时长,之后,按照每句歌词在歌曲音频之中的顺序,将与每句歌词相关联的视频片段合成为一个视频,并将合成得到的视频与歌曲音频进行合成,以生成对应的音乐短片视频。
其中,在本申请的实施例中,调整与每句歌词相关联的视频片段的播放时长的方式可包括但不限于快放、慢放等,例如,该视频片段的时长过长,可从该视频片段中截取出相同播放时长的视频片段。犹如,若视频片段的时长过短,可将与歌词相关联的多个视频片段进行拼接,从而使得拼接后的视频片段的播放时长与该句歌词的音频的播放时长保持一致。
根据本申请实施例的音乐短片视频生成方法,获取待处理的歌曲音频,并对歌曲音频进行语音识别,获得歌曲音频对应的歌词文本,对歌词文本中的歌词进行语义分析,生成歌词的内容关键词,并根据歌词的内容关键词获取与歌词相关联的视频片段,以及将歌曲音频和与歌词相关联的视频片段进行合成,生成对应的音乐短片视频。在整个过程中,可通过对视频素材与歌曲音频内容的分析,建立标签信息进行关联,从而根据该标签自动找到歌曲相关联的视频素材,进而自动将歌曲音频与其相关联的视频素材进行合成,无需要求用户必须具有视频制作的专业技术,降低音乐短片视频的制作难度,可以大幅度的增加用户体验,整个流程更加简洁智能,节约人力和时间成本。
为了进一步提升用户体验,增加用户的参与感,满足用户的个性化需求,在本申请的一些实施例中,如图4所示,所述根据每句歌词的内容关键词获取与每句歌词相关联的视频片段的具体实现过程可包括:
步骤401,获取用户提供的视频,并按照场景分割视频,以得到多个视频片段。
可选地,用户预先选择一个视频,希望将该视频与待处理的歌曲音频进行合成,以生成该歌曲的MV视频。具体地,在获取用户提供的视频之后,可按照场景分割该视频,以对应得到多个视频片段。可以理解,除了上述场景分割视频的方式以外,还可利用其它方式分割视频,例如基于内容分割视频等,本申请对此不作具体现代。
步骤402,获取每个视频片段的标签信息。
可选地,针对每个视频片段,对视频片段进行逐帧分析,以获得视频片段之中每帧画面所显示的元素信息;根据每帧画面所显示的元素信息,获取视频片段的标签信息。
步骤403,计算歌词的内容关键词与每个视频片段的标签信息之间的相似度。
可选地,采用相似度度量算法计算每句歌词的内容关键词与每个视频片段的标签信息之间的相似度。例如,可将内容关键词和标签信息分别转换成对应的向量特征,并利用向量特征计算内容关键词与标签信息之间的相似度。其中,相似度度量算法可包括但不限于余弦相似度算法、曼哈顿距离算法、欧几里得距离算法等。
步骤404,从每个视频片段的标签信息和歌词的内容关键词中,获取相似度大于预设阈值的目标标签信息和其对应的目标内容关键词。
步骤405,将目标标签信息所对应的视频片段,确定为目标内容关键词所对应的歌词相关联的视频片段。
举例而言,假设按照场景分割方式将用户提供的视频分割成对应的多个视频片段,并获取每个视频片段的标签信息,将待处理音频中每句歌词的内容关键词与视频片段的标签信息进行匹配,以获得每句歌词相关联的视频片段,如图5所示,并按照每句歌词的播放时长调整与每句歌词相关联的视频片段的播放时长,之后,按照每句歌词在歌曲音频之中的顺序,将与每句歌词相关联的视频片段合成为一个视频,并将合成得到的视频与歌曲音频进行合成,以生成一个完成的MV视频。
由此,通过为用户设置视频的提供接口,让用户自由选择视频,增加用户的参与感,满足用户的个性化需求,从而可以进一步提升用户体验。
图6是根据本申请一个实施例的音乐短片视频生成装置的结构框图。如图6所示,该音乐短片视频生成装置600可以包括:第一获取模块610、歌词文本获取模块620、第一生成模块630、第二获取模块640和第二生成模块650。
具体地,第一获取模块610用于获取待处理的歌曲音频。
歌词文本获取模块620用于获取歌曲音频对应的歌词文本。
第一生成模块630用于对歌词文本中的歌词进行语义分析,生成歌词的内容关键词。
第二获取模块640用于根据歌词的内容关键词获取与歌词相关联的视频片段。
第二生成模块650用于将歌曲音频和与歌词相关联的视频片段进行合成,生成对应的音乐短片视频。在本申请一些实施例中,第二生成模块650具体用于:根据歌曲音频获取歌词的播放时长;根据播放时长,调整与歌词相关联的视频片段的播放时长;按照歌词在歌曲音频之中的顺序,将与歌词相关联的视频片段合成为一个视频;将合成得到的视频与歌曲音频进行合成,以生成对应的音乐短片视频。
在本申请一些实施例中,如图7所示,该第二获取模块640可包括:第一获取单元641、视频分割单元642、第二获取单元643、相似度计算单元644、第三获取单元645和确定单元646。其中,第一获取单元641用于获取用户提供的视频;视频分割单元642用于按照场景分割视频,以得到多个视频片段;第二获取单元643用于获取每个视频片段的标签信息;相似度计算单元644用于计算歌词的内容关键词与每个视频片段的标签信息之间的相似度;第三获取单元645用于从每个视频片段的标签信息和歌词的内容关键词中,获取相似度大于预设阈值的目标标签信息和其对应的目标内容关键词;确定单元646用于将目标标签信息所对应的视频片段,确定为目标内容关键词所对应的歌词相关联的视频片段。
在本申请一些实施例中,第二获取单元643具体用于:针对每个视频片段,对视频片段进行分析,以获得视频片段之中每帧画面所显示的元素信息;根据每帧画面所显示的元素信息,获取视频片段的标签信息。
在本申请一些实施例中,如图8所示,该音乐短片视频生成装置600还可包括:第三获取模块660、第四获取模块670和建立模块680。其中,第三获取模块660用于获取多个视频片段素材;第四获取模块670用于获取每个视频片段素材的标签信息;建立模块680用于根据多个视频片段素材和每个视频片段素材的标签信息,建立视频素材库。
在本申请实施例中,第二获取模块640从视频素材库中找出与内容关键词匹配的标签信息;将找到的标签信息所对应的视频片段素材,确定为内容关键词所对应的歌词相关联的视频片段。
根据本申请实施例的音乐短片视频生成装置,可通过对视频素材与歌曲音频内容的分析,建立标签信息进行关联,从而根据该标签自动找到歌曲相关联的视频素材,进而自动将歌曲音频与其相关联的视频素材进行合成,无需要求用户必须具有视频制作的专业技术,降低音乐短片视频的制作难度,可以大幅度的增加用户体验,整个流程更加简洁智能,节约人力和时间成本。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图9所示,是根据本申请实施例的用以实现音乐短片视频生成方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图9所示,该电子设备包括:一个或多个处理器901、存储器902,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器***)。图9中以一个处理器901为例。
存储器902即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的音乐短片视频生成方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的音乐短片视频生成方法。
存储器902作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的音乐短片视频生成方法对应的程序指令/模块(例如,附图6所示的第一获取模块610、语音识别模块620、第一生成模块630、第二获取模块640和第二生成模块650)。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的音乐短片视频生成方法。
存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据用以实现音乐短片视频生成方法的电子设备的使用所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至用以实现音乐短片视频生成方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
用以实现音乐短片视频生成方法的电子设备还可以包括:输入装置903和输出装置904。处理器901、存储器902、输入装置903和输出装置904可以通过总线或者其他方式连接,图9中以通过总线连接为例。
输入装置903可接收输入的数字或字符信息,以及产生与用以实现音乐短片视频生成方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置904可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,可通过对视频素材与歌曲音频内容的分析,建立标签信息进行关联,从而根据该标签自动找到歌曲相关联的视频素材,进而自动将歌曲音频与其相关联的视频素材进行合成,无需要求用户必须具有视频制作的专业技术,降低音乐短片视频的制作难度,可以大幅度的增加用户体验,整个流程更加简洁智能,节约人力和时间成本。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (14)

1.一种音乐短片视频生成方法,包括:
获取待处理的歌曲音频;
获取所述歌曲音频对应的歌词文本;
对所述歌词文本中的歌词进行语义分析,生成所述歌词的内容关键词;
根据所述歌词的内容关键词获取与所述歌词相关联的视频片段;
将所述歌曲音频和与所述歌词相关联的视频片段进行合成,生成对应的音乐短片视频。
2.如权利要求1所述的音乐短片视频生成方法,其中,所述根据所述歌词的内容关键词获取与所述歌词相关联的视频片段,包括:
获取视频,并按照场景分割所述视频,以得到多个视频片段;
获取每个所述视频片段的标签信息;
计算所述歌词的内容关键词与每个所述视频片段的标签信息之间的相似度;
从每个所述视频片段的标签信息和所述歌词的内容关键词中,获取相似度大于预设阈值的目标标签信息和其对应的目标内容关键词;
将所述目标标签信息所对应的视频片段,确定为所述目标内容关键词所对应的歌词相关联的视频片段。
3.如权利要求2所述的音乐短片视频生成方法,其中,所述获取每个所述视频片段的标签信息,包括:
针对每个所述视频片段,对所述视频片段进行分析,以获得所述视频片段之中每帧画面所显示的元素信息;
根据所述每帧画面所显示的元素信息,获取所述视频片段的标签信息。
4.如权利要求1所述的音乐短片视频生成方法,在获取待处理的歌曲音频之前,所述方法还包括:
获取多个视频片段素材;
获取每个所述视频片段素材的标签信息;
根据所述多个视频片段素材和每个所述视频片段素材的标签信息,建立视频素材库。
5.如权利要求4所述的音乐短片视频生成方法,其中,所述根据所述歌词的内容关键词获取与所述歌词相关联的视频片段,包括:
从所述视频素材库中找出与所述内容关键词匹配的标签信息;
将找到的标签信息所对应的视频片段素材,确定为所述内容关键词所对应的歌词相关联的视频片段。
6.如权利要求1至5中任一项所述的音乐短片视频生成方法,其中,所述将所述歌曲音频和与所述歌词相关联的视频片段进行合成,生成对应的音乐短片视频,包括:
根据所述歌曲音频获取所述歌词的播放时长;
根据所述播放时长,调整与所述歌词相关联的视频片段的播放时长;
按照所述歌词在所述歌曲音频之中的顺序,将与所述歌词相关联的视频片段合成为一个视频;
将合成得到的视频与所述歌曲音频进行合成,以生成对应的音乐短片视频。
7.一种音乐短片视频生成装置,包括:
第一获取模块,用于获取待处理的歌曲音频;
歌词文本获取模块,用于获取所述歌曲音频对应的歌词文本;
第一生成模块,用于对所述歌词文本中的歌词进行语义分析,生成所述歌词的内容关键词;
第二获取模块,用于根据所述歌词的内容关键词获取与所述歌词相关联的视频片段;
第二生成模块,用于将所述歌曲音频和与所述歌词相关联的视频片段进行合成,生成对应的音乐短片视频。
8.如权利要求7所述的音乐短片视频生成装置,其中,所述第二获取模块包括:
第一获取单元,用于获取视频;
视频分割单元,用于按照场景分割所述视频,以得到多个视频片段;
第二获取单元,用于获取每个所述视频片段的标签信息;
相似度计算单元,用于计算所述歌词的内容关键词与每个所述视频片段的标签信息之间的相似度;
第三获取单元,用于从每个所述视频片段的标签信息和所述歌词的内容关键词中,获取相似度大于预设阈值的目标标签信息和其对应的目标内容关键词;
确定单元,用于将所述目标标签信息所对应的视频片段,确定为所述目标内容关键词所对应的歌词相关联的视频片段。
9.如权利要求8所述的音乐短片视频生成装置,其中,所述第二获取单元具体用于:
针对每个所述视频片段,对所述视频片段进行分析,以获得所述视频片段之中每帧画面所显示的元素信息;
根据所述每帧画面所显示的元素信息,获取所述视频片段的标签信息。
10.如权利要求7所述的音乐短片视频生成装置,还包括:
第三获取模块,用于获取多个视频片段素材;
第四获取模块,用于获取每个所述视频片段素材的标签信息;
建立模块,用于根据所述多个视频片段素材和每个所述视频片段素材的标签信息,建立视频素材库。
11.如权利要求10所述的音乐短片视频生成装置,其中,所述第二获取模块具体用于:
从所述视频素材库中找出与所述内容关键词匹配的标签信息;
将找到的标签信息所对应的视频片段素材,确定为所述内容关键词所对应的歌词相关联的视频片段。
12.如权利要求7至11中任一项所述的音乐短片视频生成装置,其中,所述第二生成模块具体用于:
根据所述歌曲音频获取所述歌词的播放时长;
根据所述播放时长,调整与所述歌词相关联的视频片段的播放时长;
按照所述歌词在所述歌曲音频之中的顺序,将与所述歌词相关联的视频片段合成为一个视频;
将合成得到的视频与所述歌曲音频进行合成,以生成对应的音乐短片视频。
13.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至6中任一项所述的音乐短片视频生成方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1至6中任一项所述的音乐短片视频生成方法。
CN202010611868.0A 2020-06-30 2020-06-30 音乐短片视频生成方法、装置、电子设备和存储介质 Pending CN111935537A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010611868.0A CN111935537A (zh) 2020-06-30 2020-06-30 音乐短片视频生成方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010611868.0A CN111935537A (zh) 2020-06-30 2020-06-30 音乐短片视频生成方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN111935537A true CN111935537A (zh) 2020-11-13

Family

ID=73317506

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010611868.0A Pending CN111935537A (zh) 2020-06-30 2020-06-30 音乐短片视频生成方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN111935537A (zh)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112423107A (zh) * 2020-11-18 2021-02-26 北京字跳网络技术有限公司 歌词视频展示方法、装置、电子设备及计算机可读介质
CN112487248A (zh) * 2020-12-01 2021-03-12 深圳市易平方网络科技有限公司 视频文件的标签生成方法、装置、智能终端及存储介质
CN112541353A (zh) * 2020-12-24 2021-03-23 北京百度网讯科技有限公司 视频生成方法、装置、设备和介质
CN112632326A (zh) * 2020-12-24 2021-04-09 北京风平科技有限公司 一种基于视频脚本语义识别的视频生产方法及装置
CN112784056A (zh) * 2020-12-31 2021-05-11 北京视连通科技有限公司 一种基于视频智能识别及智能语义搜索的短视频生成方法
CN112800263A (zh) * 2021-02-03 2021-05-14 上海艾麒信息科技股份有限公司 一种基于人工智能的视频合成***、方法及介质
CN112911379A (zh) * 2021-01-15 2021-06-04 北京字跳网络技术有限公司 视频生成方法、装置、电子设备和存储介质
CN113050857A (zh) * 2021-03-26 2021-06-29 北京字节跳动网络技术有限公司 一种音乐分享方法、装置、电子设备及存储介质
CN113329258A (zh) * 2021-06-10 2021-08-31 王之华 一种歌曲视频合成的方法及播放器
CN113365134A (zh) * 2021-06-02 2021-09-07 北京字跳网络技术有限公司 音频分享方法、装置、设备及介质
CN113377971A (zh) * 2021-05-31 2021-09-10 北京达佳互联信息技术有限公司 多媒体资源生成方法、装置、电子设备以及存储介质
CN113434733A (zh) * 2021-06-28 2021-09-24 平安科技(深圳)有限公司 基于文本的视频文件生成方法、装置、设备及存储介质
CN113572977A (zh) * 2021-07-06 2021-10-29 上海哔哩哔哩科技有限公司 视频制作方法及装置
CN113628637A (zh) * 2021-07-02 2021-11-09 北京达佳互联信息技术有限公司 一种音频识别方法、装置、设备及存储介质
CN113676772A (zh) * 2021-08-16 2021-11-19 上海哔哩哔哩科技有限公司 视频生成方法及装置
CN113709529A (zh) * 2021-04-13 2021-11-26 腾讯科技(深圳)有限公司 视频合成方法、装置、电子设备及计算机可读介质
CN113709548A (zh) * 2021-08-09 2021-11-26 北京达佳互联信息技术有限公司 基于图像的多媒体数据合成方法、装置、设备及存储介质
CN113792178A (zh) * 2021-08-31 2021-12-14 北京达佳互联信息技术有限公司 一种歌曲生成方法、装置、电子设备及存储介质
CN114245171A (zh) * 2021-12-15 2022-03-25 百度在线网络技术(北京)有限公司 视频编辑方法、装置、电子设备、介质
CN114242070A (zh) * 2021-12-20 2022-03-25 阿里巴巴(中国)有限公司 一种视频生成方法、装置、设备及存储介质
CN114286169A (zh) * 2021-08-31 2022-04-05 腾讯科技(深圳)有限公司 视频生成方法、装置、终端、服务器及存储介质
CN114513706A (zh) * 2022-03-22 2022-05-17 中国平安人寿保险股份有限公司 视频生成方法和装置、计算机设备、存储介质
CN115442540A (zh) * 2022-08-31 2022-12-06 中国联合网络通信集团有限公司 音乐视频生成方法、装置、计算机设备及存储介质
CN116226453A (zh) * 2023-05-10 2023-06-06 北京小糖科技有限责任公司 识别跳舞教学视频片段的方法、装置及终端设备
CN117041426A (zh) * 2023-09-19 2023-11-10 天翼爱音乐文化科技有限公司 一种视频彩铃优化制作方法、***、设备及存储介质
WO2024046484A1 (zh) * 2022-09-02 2024-03-07 北京字跳网络技术有限公司 视频生成方法、装置、设备、存储介质和程序产品
CN117956247A (zh) * 2023-12-27 2024-04-30 北京信息科技大学 一种音乐驱动的视频自动生成方法、***、设备及介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793446A (zh) * 2012-10-29 2014-05-14 汤晓鸥 音乐视频的生成方法和***
CN105224581A (zh) * 2014-07-03 2016-01-06 北京三星通信技术研究有限公司 在播放音乐时呈现图片的方法和装置
US20160134855A1 (en) * 2013-06-26 2016-05-12 Kddi Corporation Scenario generation system, scenario generation method and scenario generation program
CN105930485A (zh) * 2016-04-28 2016-09-07 深圳市金立通信设备有限公司 一种音频媒体播放方法、通信设备及网络***
CN107610725A (zh) * 2017-09-19 2018-01-19 广东小天才科技有限公司 一种视频制作方法及终端
CN110121107A (zh) * 2018-02-06 2019-08-13 上海全土豆文化传播有限公司 视频素材收集方法及装置
CN110619673A (zh) * 2018-06-19 2019-12-27 阿里巴巴集团控股有限公司 有声动图生成、播放方法、数据处理方法、***及设备
US20200051536A1 (en) * 2017-09-30 2020-02-13 Tencent Technology (Shenzhen) Company Limited Method and apparatus for generating music

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793446A (zh) * 2012-10-29 2014-05-14 汤晓鸥 音乐视频的生成方法和***
US20160134855A1 (en) * 2013-06-26 2016-05-12 Kddi Corporation Scenario generation system, scenario generation method and scenario generation program
CN105224581A (zh) * 2014-07-03 2016-01-06 北京三星通信技术研究有限公司 在播放音乐时呈现图片的方法和装置
CN105930485A (zh) * 2016-04-28 2016-09-07 深圳市金立通信设备有限公司 一种音频媒体播放方法、通信设备及网络***
CN107610725A (zh) * 2017-09-19 2018-01-19 广东小天才科技有限公司 一种视频制作方法及终端
US20200051536A1 (en) * 2017-09-30 2020-02-13 Tencent Technology (Shenzhen) Company Limited Method and apparatus for generating music
CN110121107A (zh) * 2018-02-06 2019-08-13 上海全土豆文化传播有限公司 视频素材收集方法及装置
CN110619673A (zh) * 2018-06-19 2019-12-27 阿里巴巴集团控股有限公司 有声动图生成、播放方法、数据处理方法、***及设备

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112423107B (zh) * 2020-11-18 2022-05-17 北京字跳网络技术有限公司 歌词视频展示方法、装置、电子设备及计算机可读介质
CN112423107A (zh) * 2020-11-18 2021-02-26 北京字跳网络技术有限公司 歌词视频展示方法、装置、电子设备及计算机可读介质
CN112487248A (zh) * 2020-12-01 2021-03-12 深圳市易平方网络科技有限公司 视频文件的标签生成方法、装置、智能终端及存储介质
CN112541353A (zh) * 2020-12-24 2021-03-23 北京百度网讯科技有限公司 视频生成方法、装置、设备和介质
CN112632326A (zh) * 2020-12-24 2021-04-09 北京风平科技有限公司 一种基于视频脚本语义识别的视频生产方法及装置
CN112784056A (zh) * 2020-12-31 2021-05-11 北京视连通科技有限公司 一种基于视频智能识别及智能语义搜索的短视频生成方法
CN112784056B (zh) * 2020-12-31 2021-11-23 北京视连通科技有限公司 一种基于视频智能识别及智能语义搜索的短视频生成方法
US12033671B2 (en) 2021-01-15 2024-07-09 Beijing Zitiao Network Technology Co., Ltd. Video generation method and apparatus, electronic device, and storage medium
CN112911379A (zh) * 2021-01-15 2021-06-04 北京字跳网络技术有限公司 视频生成方法、装置、电子设备和存储介质
CN112800263A (zh) * 2021-02-03 2021-05-14 上海艾麒信息科技股份有限公司 一种基于人工智能的视频合成***、方法及介质
CN113050857A (zh) * 2021-03-26 2021-06-29 北京字节跳动网络技术有限公司 一种音乐分享方法、装置、电子设备及存储介质
US11914845B2 (en) 2021-03-26 2024-02-27 Beijing Bytedance Network Technology Co., Ltd. Music sharing method and apparatus, electronic device, and storage medium
CN113709529A (zh) * 2021-04-13 2021-11-26 腾讯科技(深圳)有限公司 视频合成方法、装置、电子设备及计算机可读介质
CN113377971B (zh) * 2021-05-31 2024-02-27 北京达佳互联信息技术有限公司 多媒体资源生成方法、装置、电子设备以及存储介质
CN113377971A (zh) * 2021-05-31 2021-09-10 北京达佳互联信息技术有限公司 多媒体资源生成方法、装置、电子设备以及存储介质
CN113365134A (zh) * 2021-06-02 2021-09-07 北京字跳网络技术有限公司 音频分享方法、装置、设备及介质
CN113365134B (zh) * 2021-06-02 2022-11-01 北京字跳网络技术有限公司 音频分享方法、装置、设备及介质
CN113329258A (zh) * 2021-06-10 2021-08-31 王之华 一种歌曲视频合成的方法及播放器
CN113329258B (zh) * 2021-06-10 2023-02-17 王之华 一种歌曲视频合成的方法及播放器
CN113434733A (zh) * 2021-06-28 2021-09-24 平安科技(深圳)有限公司 基于文本的视频文件生成方法、装置、设备及存储介质
CN113628637A (zh) * 2021-07-02 2021-11-09 北京达佳互联信息技术有限公司 一种音频识别方法、装置、设备及存储介质
CN113572977A (zh) * 2021-07-06 2021-10-29 上海哔哩哔哩科技有限公司 视频制作方法及装置
CN113572977B (zh) * 2021-07-06 2024-02-27 上海哔哩哔哩科技有限公司 视频制作方法及装置
CN113709548B (zh) * 2021-08-09 2023-08-25 北京达佳互联信息技术有限公司 基于图像的多媒体数据合成方法、装置、设备及存储介质
CN113709548A (zh) * 2021-08-09 2021-11-26 北京达佳互联信息技术有限公司 基于图像的多媒体数据合成方法、装置、设备及存储介质
CN113676772B (zh) * 2021-08-16 2023-08-08 上海哔哩哔哩科技有限公司 视频生成方法及装置
CN113676772A (zh) * 2021-08-16 2021-11-19 上海哔哩哔哩科技有限公司 视频生成方法及装置
CN114286169B (zh) * 2021-08-31 2023-06-20 腾讯科技(深圳)有限公司 视频生成方法、装置、终端、服务器及存储介质
CN113792178A (zh) * 2021-08-31 2021-12-14 北京达佳互联信息技术有限公司 一种歌曲生成方法、装置、电子设备及存储介质
CN114286169A (zh) * 2021-08-31 2022-04-05 腾讯科技(深圳)有限公司 视频生成方法、装置、终端、服务器及存储介质
CN114245171A (zh) * 2021-12-15 2022-03-25 百度在线网络技术(北京)有限公司 视频编辑方法、装置、电子设备、介质
CN114245171B (zh) * 2021-12-15 2023-08-29 百度在线网络技术(北京)有限公司 视频编辑方法、装置、电子设备、介质
CN114242070A (zh) * 2021-12-20 2022-03-25 阿里巴巴(中国)有限公司 一种视频生成方法、装置、设备及存储介质
CN114513706A (zh) * 2022-03-22 2022-05-17 中国平安人寿保险股份有限公司 视频生成方法和装置、计算机设备、存储介质
CN115442540B (zh) * 2022-08-31 2024-05-03 中国联合网络通信集团有限公司 音乐视频生成方法、装置、计算机设备及存储介质
CN115442540A (zh) * 2022-08-31 2022-12-06 中国联合网络通信集团有限公司 音乐视频生成方法、装置、计算机设备及存储介质
WO2024046484A1 (zh) * 2022-09-02 2024-03-07 北京字跳网络技术有限公司 视频生成方法、装置、设备、存储介质和程序产品
CN116226453B (zh) * 2023-05-10 2023-09-26 北京小糖科技有限责任公司 识别跳舞教学视频片段的方法、装置及终端设备
CN116226453A (zh) * 2023-05-10 2023-06-06 北京小糖科技有限责任公司 识别跳舞教学视频片段的方法、装置及终端设备
CN117041426A (zh) * 2023-09-19 2023-11-10 天翼爱音乐文化科技有限公司 一种视频彩铃优化制作方法、***、设备及存储介质
CN117956247A (zh) * 2023-12-27 2024-04-30 北京信息科技大学 一种音乐驱动的视频自动生成方法、***、设备及介质

Similar Documents

Publication Publication Date Title
CN111935537A (zh) 音乐短片视频生成方法、装置、电子设备和存储介质
CN109688463B (zh) 一种剪辑视频生成方法、装置、终端设备及存储介质
CN110933487B (zh) 卡点视频的生成方法、装置、设备及存储介质
CN110532996B (zh) 视频分类的方法、信息处理的方法以及服务器
CN111476871B (zh) 用于生成视频的方法和装置
CN110519636B (zh) 语音信息播放方法、装置、计算机设备及存储介质
KR102510317B1 (ko) 비디오 태그의 생성 방법, 장치, 전자 기기 및 저장 매체
JP2021192222A (ja) 動画インタラクティブ方法と装置、電子デバイス、コンピュータ可読記憶媒体、及び、コンピュータプログラム
CN111522994A (zh) 用于生成信息的方法和装置
JP7394809B2 (ja) ビデオを処理するための方法、装置、電子機器、媒体及びコンピュータプログラム
CN109493888B (zh) 漫画配音方法及装置、计算机可读存储介质、电子设备
CN114895817B (zh) 交互信息处理方法、网络模型的训练方法及装置
JP7240505B2 (ja) 音声パケット推薦方法、装置、電子機器およびプログラム
CN114245099B (zh) 视频生成方法、装置、电子设备以及存储介质
CN111414506A (zh) 基于人工智能情绪处理方法、装置、电子设备及存储介质
CN113572976A (zh) 视频处理方法、装置、电子设备及可读存储介质
CN112330781A (zh) 生成模型和生成人脸动画的方法、装置、设备和存储介质
CN111970536B (zh) 一种基于音频生成视频的方法和装置
CN113572981A (zh) 视频配乐方法及装置、电子设备、存储介质
CN111444379A (zh) 音频的特征向量生成方法及音频片段表示模型的训练方法
CN111883101B (zh) 一种模型训练及语音合成方法、装置、设备和介质
CN114267375A (zh) 音素检测方法及装置、训练方法及装置、设备和介质
CN111918073B (zh) 直播间的管理方法和装置
CN113223125A (zh) 一种虚拟形象的面部驱动方法、装置、设备和介质
CN116939288A (zh) 视频生成方法及其装置、计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201113

RJ01 Rejection of invention patent application after publication