CN113569700A

CN113569700A - 一种通过外语视频生成配音素材的方法和***

Info

Publication number: CN113569700A
Application number: CN202110833978.6A
Authority: CN
Inventors: 洪来君; 陈晓燕; 谭红平
Original assignee: Hangzhou Feizhu Technology Co ltd
Current assignee: Hangzhou Feizhu Technology Co ltd
Priority date: 2021-07-23
Filing date: 2021-07-23
Publication date: 2021-10-29

Abstract

本发明公开了一种通过外语视频生成配音素材的方法，包括步骤：(1)用户向网站服务器上传原始视频；(2)用户在网站服务器上对原始视频进行在线剪辑，保留需要的视频片段；(3)网站服务器从视频片段中分离出人声和背景，并对人声自动识别出字幕；(4)用户对识别出的字幕进行在线编辑；(5)用户在网站服务器上保存得到的配音素材。

Description

一种通过外语视频生成配音素材的方法和***

技术领域

本发明涉及计算机视频处理，尤其涉及通过外语视频生成配音素材的方法和***。

背景技术

作为一种创新的外语学习方式，外语教学软件和网站会向学习者提供一种特殊的视频片段，这种视频片段一般取自经典的外语原版电影或电视剧等，该视频片段已经预先分离了人声和背景，同时还可提供中外语字幕。外语学习者可亲自为这种视频片段配音，并通过这种方式对配音内容进行学习。相对于被动的、以听为主的传统外语学习方式，这种主动的、身临其境的外语学习方式可有效提高学习者的参与感，使学习者更有效地掌握配音内容包含的外语材料。

但是准备这种教学用的配音素材需要精通外语和视频处理技术的专业人员消耗大量的时间用于视频材料的剪辑、原声的分离、外语字幕的生成等，成本较高，需时较长，难以大量生成。

因此，本领域的技术人员致力于开发一种能以较低成本、较快地得到大量的这种配音素材的技术。

发明内容

有鉴于现有技术的上述缺陷，本发明所要解决的技术问题是提供一种能以较低成本、较快地得到大量的外语配音素材的技术。

为实现上述目的，本发明首先提供了一种通过外语视频生成配音素材的方法，包括步骤：(1)用户向网站服务器上传原始视频；(2)用户在网站服务器上对原始视频进行在线剪辑，保留需要的视频片段；(3)网站服务器从视频片段中分离出人声和背景，并对人声自动识别出字幕；(4)用户对识别出的字幕进行在线编辑；(5)用户在网站服务器上保存得到的配音素材。

进一步地，网站服务器调用ffmpeg工具对原始视频进行剪辑。

进一步地，还包括去除视频水印的步骤。

进一步地，网站服务器调用ffmpeg工具去除视频水印。

进一步地，网站服务器调用spleeter工具从视频片段中分离出人声和背景，并对人声自动识别出字幕。

本发明其次提供了一种通过外语视频生成配音素材的***，包括网站服务器和客户端，其中客户端用于供用户上传原始视频至网站服务器；网站服务器包括视频剪辑模块、字幕生成模块以及字幕编辑模块，其中视频剪辑模块用于供用户对原始视频进行在线剪辑，以得到需要的视频片段；字幕生成模块用于从视频片段中分离出人声和背景，并对人声自动识别出字幕；字幕编辑模块用于供用户对识别出的字幕进行在线编辑。

进一步地，视频剪辑模块调用ffmpeg工具对原始视频进行剪辑。

进一步地，还包括水印去除模块，用于去除视频水印。

进一步地，水印去除模块调用ffmpeg工具去除视频水印。

进一步地，字幕生成模块调用spleeter工具从视频片段中分离出人声和背景，并对人声自动识别出字幕。

本发明采用开源的ffmpeg和spleeter工具，可自动分离人声和识别出字幕，可使用户在线对视频和字幕进行编辑，无需专业的外语教师和视频处理专业技术人员，成本低廉，且可在短期内获得大量可用的视频素材。

即，本申请最重要的地方在于构建该方案的思路：令用户能够自行制作配音素材，于用户而言，增加了趣味性，使得学习外语变成一件充满娱乐性的事情，更为积极主动，同时也在素材制作的过程中潜移默化的学习了外语，寓教于乐；而于开发者而言，无需自行制作素材，大大节约了人工成本和时间成本，且素材更为多样化，也更能满足不同用户的不同需求，一举多得。

以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明，以充分地了解本发明的目的、特征和效果。

附图说明

图1是本发明的一个较佳实施例中的流程图；

图2是本发明的一个较佳实施例中的用户上传视频的操作界面示意图；

图3是本发明的一个较佳实施例中的用户通过网站服务器在线剪辑视频的操作界面示意图；

图4是本发明的一个较佳实施例中的用户通过网站服务器去除视频水印的操作界面示意图

图5-6是本发明的一个较佳实施例中的网站服务自动识别字幕及用户对字幕进行在线编辑的操作的示意图。

具体实施方式

以下参考说明书附图介绍本发明的多个优选实施例，使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现，本发明的保护范围并非仅限于文中提到的实施例。

如图1的流程图所示，首先，本发明采用了UGC(User Generated Content，也就是用户生成内容)，即用户原创内容的方式，由用户上传素材。网站提供视频上传功能，供用户自行将原始视频上传至网站服务器，如图2所示。

用户可通过网站服务器，采用ffmpeg工具，对上传素材进行在线剪辑，从而得到所需的视频片段，如图3所示。且进一步地，可用ffmpeg工具，根据相应的时间区间去除及固定位置的视频水印，如图4所示。

采用spleeter工具，分离出人声和背景，并对人声自动识别出字幕，用户可对识别出的字幕进行在线编辑，如图5-6所示。经网站审核后，最终得到可应用的完整的配音素材。

本发明通过UGC方式，由用户自行上传视频，对网站而言，可获得大量的视频素材，对用户而言，可获得定制化的视频素材。

以上详细描述了本发明的较佳具体实施例。应当理解，本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。

Claims

1.一种通过外语视频生成配音素材的方法，其特征在于，包括步骤：

(1)用户向网站服务器上传原始视频；

(2)用户在网站服务器上对原始视频进行在线剪辑，保留需要的视频片段；

(3)网站服务器从视频片段中分离出人声和背景，并对人声自动识别出字幕；

(4)用户对识别出的字幕进行在线编辑；

(5)用户在网站服务器上保存得到的配音素材。

2.如权利要求1所述的通过外语视频生成配音素材的方法，其中，网站服务器调用ffmpeg工具对原始视频进行剪辑。

3.如权利要求2所述的通过外语视频生成配音素材的方法，其中，还包括去除视频水印的步骤。

4.如权利要求3所述的通过外语视频生成配音素材的方法，其中，网站服务器调用ffmpeg工具去除视频水印。

5.如权利要求4所述的通过外语视频生成配音素材的方法，其中，网站服务器调用spleeter工具从视频片段中分离出人声和背景，并对人声自动识别出字幕。

6.一种通过外语视频生成配音素材的***，其特征在于，包括网站服务器和客户端，其中客户端用于供用户上传原始视频至网站服务器；网站服务器包括视频剪辑模块、字幕生成模块以及字幕编辑模块，其中视频剪辑模块用于供用户对原始视频进行在线剪辑，以得到需要的视频片段；字幕生成模块用于从视频片段中分离出人声和背景，并对人声自动识别出字幕；字幕编辑模块用于供用户对识别出的字幕进行在线编辑。

7.如权利要求6所述的通过外语视频生成配音素材的***，其中，视频剪辑模块调用ffmpeg工具对原始视频进行剪辑。

8.如权利要求7所述的通过外语视频生成配音素材的***，其中，还包括水印去除模块，用于去除视频水印。

9.如权利要求8所述的通过外语视频生成配音素材的***，其中，水印去除模块调用ffmpeg工具去除视频水印。

10.如权利要求9所述的通过外语视频生成配音素材的***，其中，字幕生成模块调用spleeter工具从视频片段中分离出人声和背景，并对人声自动识别出字幕。