CN113207032A - 一种智慧课堂录制视频增加字幕的***及方法 - Google Patents
一种智慧课堂录制视频增加字幕的***及方法 Download PDFInfo
- Publication number
- CN113207032A CN113207032A CN202110477210.XA CN202110477210A CN113207032A CN 113207032 A CN113207032 A CN 113207032A CN 202110477210 A CN202110477210 A CN 202110477210A CN 113207032 A CN113207032 A CN 113207032A
- Authority
- CN
- China
- Prior art keywords
- time
- segment
- audio
- text content
- recorded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000000605 extraction Methods 0.000 claims description 12
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/433—Content storage operation, e.g. storage operation in response to a pause request, caching operations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/2187—Live feed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/433—Content storage operation, e.g. storage operation in response to a pause request, caching operations
- H04N21/4334—Recording operations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4884—Data services, e.g. news ticker for displaying subtitles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8456—Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
本发明公开了一种智慧课堂录制视频增加字幕的***及方法,对录制视频进行自动音频提取、语音识别、字幕对位。利用本发明可以精准、快速为录制视频添加字幕内容,且避免了大量的人工复查翻译工作,提高了字幕生成效率,从而保障了课程质量。
Description
技术领域
本发明涉及智慧课堂技术领域,具体涉及一种智慧课堂录制视频增加字幕的***及方法。
背景技术
目前,学生在直播课堂听课时,通过观看老师展示的PPT以及讲解来进行课堂理解。当听不清楚老师讲解的内容时,往往是通过回放直播,并结合PPT的内容进行理解。或者,通过询问在观看直播的其他同学来对老师刚刚讲解的内容进行理解。但是,上述方式会增加学生的听课耗时,且不能够使得学生实时了解清楚老师所要传达的信息。故而会选择回放录播课,可是在录播课中也听不清楚老师讲解的内容时,往往会打击学生的学习积极性,进而降低学生的听课欲望,从而使得直播教学的效果下降。
发明内容
针对现有技术的不足,本发明旨在提供一种智慧课堂录制视频增加字幕的***及方法。
为了实现上述目的,本发明采用如下技术方案:
一种智慧课堂录制视频增加字幕的***,包括:
视频录制模块:用于对智慧课堂的直播视频进行视频录制,得到录制视频文件;
音频提取模块:用于对视频录制模块录制得到的录制视频文件进行音频提取得到录制音频文件;
语音识别模块:用于录制音频文件进行语音识别,识别对应的文字内容,并同步记录可以识别得到文字内容的各段音频片段的起始时间和结束时间,建立各段音频片段和文字内容之间的关联关系;
字幕增加模块:用于根据各段音频片段的起始时间和结束时间,将各段文字内容展示在录制视频文件对应的各段视频片段中,各段文字内容的起始展示时间和结束展示时间与对应视频片段的起始时间和结束时间相对应;最终得到增加字幕内容后的视频文件;
编辑模块:用于供用户对增加字幕内容后的视频文件进行修改,包括改变文字内容的起始展示时间以及对文字内容进行修改。
进一步地,上述***中,语音识别模块用于按照时间顺序依次对录制音频文件进行语音识别,首次识别到文字内容时记录当前时间为本音频片段的起始时间,当在某个时间起超过预设的时长无法再识别到文字内容时,记录该时间为本音频片段的结束时间;直至下一次再识别到文字内容时,记录该时间为下一音频片段的起始时间,以此类推,从而识别到可以识别到文字内容的各段音频片段以及获得各段音频片段的起始时间和结束时间。
本发明还提供一种利用上述***的方法,具体过程为:
智慧课堂的直播过程中,视频录制模块同步进行视频录制,直播结束后,视频录制结束得到录制视频文件;
音频提取模块对视频录制模块录制得到的录制视频文件进行音频提取得到录制音频文件;
语音识别模块对录制音频文件进行语音识别,识别对应的文字内容,并同步记录可以识别得到文字内容的各段音频片段的起始时间和结束时间,建立各段音频片段和文字内容之间的关联关系;
当用户触发增加字幕事件时,字幕增加模块根据各段音频片段的起始时间和结束时间,将各段文字内容展示在录制视频文件对应的各段视频片段中,各段文字内容的起始展示时间和结束展示时间与对应视频片段的起始时间和结束时间相对应;最终得到增加字幕内容后的视频文件;
当用户发现文字内容和录制视频文件的画面不匹配时,可通过编辑模块将对应文字内容的起始展示时间提前或推后,使其与录制视频文件的画面完全匹配;当用户发现文字内容有错误时,可通过编辑模块对文字内容进行修改。
进一步地,上述方法中,语音识别模块按照时间顺序依次对录制音频文件进行语音识别,首次识别到文字内容时记录当前时间为本音频片段的起始时间,当在某个时间起超过预设的时长无法再识别到文字内容时,记录该时间为本音频片段的结束时间;直至下一次再识别到文字内容时,记录该时间为下一音频片段的起始时间,以此类推,从而识别到可以识别到文字内容的各段音频片段以及获得各段音频片段的起始时间和结束时间。
本发明的有益效果在于:利用本发明可以精准、快速为录制视频添加字幕内容,且避免了大量的人工复查翻译工作,提高了字幕生成效率,从而保障了课程质量。
具体实施方式
以下将对本发明作进一步的描述,需要说明的是,本实施例以本技术方案为前提,给出了详细的实施方式和具体的操作过程,但本发明的保护范围并不限于本实施例。
实施例1
本实施例提供一种智慧课堂录制视频增加字幕的***,包括:
视频录制模块:用于对智慧课堂的直播视频进行视频录制,得到录制视频文件;
音频提取模块:用于对视频录制模块录制得到的录制视频文件进行音频提取得到录制音频文件;
语音识别模块:用于录制音频文件进行语音识别,识别对应的文字内容,并同步记录可以识别得到文字内容的各段音频片段的起始时间和结束时间,建立各段音频片段和文字内容之间的关联关系;
字幕增加模块:用于根据各段音频片段的起始时间和结束时间,将各段文字内容展示在录制视频文件对应的各段视频片段中,各段文字内容的起始展示时间和结束展示时间与对应视频片段的起始时间和结束时间相对应;最终得到增加字幕内容后的视频文件;
编辑模块:用于供用户对增加字幕内容后的视频文件进行修改,包括改变文字内容的起始展示时间以及对文字内容进行修改。
进一步地,语音识别模块用于按照时间顺序依次对录制音频文件进行语音识别,首次识别到文字内容时记录当前时间为本音频片段的起始时间,当在某个时间起超过预设的时长无法再识别到文字内容时,记录该时间为本音频片段的结束时间;直至下一次再识别到文字内容时,记录该时间为下一音频片段的起始时间,以此类推,从而识别到可以识别到文字内容的各段音频片段以及获得各段音频片段的起始时间和结束时间。
实施例2
本实施例提供一种实现实施例1所述***的方法,具体过程为:
智慧课堂的直播过程中,视频录制模块同步进行视频录制,直播结束后,视频录制结束得到录制视频文件;
音频提取模块对视频录制模块录制得到的录制视频文件进行音频提取得到录制音频文件;
语音识别模块对录制音频文件进行语音识别,识别对应的文字内容,并同步记录可以识别得到文字内容的各段音频片段的起始时间和结束时间,建立各段音频片段和文字内容之间的关联关系;
当用户触发增加字幕事件时,字幕增加模块根据各段音频片段的起始时间和结束时间,将各段文字内容展示在录制视频文件对应的各段视频片段中,各段文字内容的起始展示时间和结束展示时间与对应视频片段的起始时间和结束时间相对应;最终得到增加字幕内容后的视频文件;
当用户发现文字内容和录制视频文件的画面不匹配时,可通过编辑模块将对应文字内容的起始展示时间提前或推后,使其与录制视频文件的画面完全匹配;当用户发现文字内容有错误时,可通过编辑模块对文字内容进行修改。
上述方法中,语音识别模块按照时间顺序依次对录制音频文件进行语音识别,首次识别到文字内容时记录当前时间为本音频片段的起始时间,当在某个时间起超过预设的时长无法再识别到文字内容时,记录该时间为本音频片段的结束时间;直至下一次再识别到文字内容时,记录该时间为下一音频片段的起始时间,以此类推,从而识别到可以识别到文字内容的各段音频片段以及获得各段音频片段的起始时间和结束时间。
对于本领域的技术人员来说,可以根据以上的技术方案和构思,给出各种相应的改变和变形,而所有的这些改变和变形,都应该包括在本发明权利要求的保护范围之内。
Claims (4)
1.一种智慧课堂录制视频增加字幕的***,其特征在于,包括:
视频录制模块:用于对智慧课堂的直播视频进行视频录制,得到录制视频文件;
音频提取模块:用于对视频录制模块录制得到的录制视频文件进行音频提取得到录制音频文件;
语音识别模块:用于录制音频文件进行语音识别,识别对应的文字内容,并同步记录可以识别得到文字内容的各段音频片段的起始时间和结束时间,建立各段音频片段和文字内容之间的关联关系;
字幕增加模块:用于根据各段音频片段的起始时间和结束时间,将各段文字内容展示在录制视频文件对应的各段视频片段中,各段文字内容的起始展示时间和结束展示时间与对应视频片段的起始时间和结束时间相对应;最终得到增加字幕内容后的视频文件;
编辑模块:用于供用户对增加字幕内容后的视频文件进行修改,包括改变文字内容的起始展示时间以及对文字内容进行修改。
2.根据权利要求1所述的***,其特征在于,语音识别模块用于按照时间顺序依次对录制音频文件进行语音识别,首次识别到文字内容时记录当前时间为本音频片段的起始时间,当在某个时间起超过预设的时长无法再识别到文字内容时,记录该时间为本音频片段的结束时间;直至下一次再识别到文字内容时,记录该时间为下一音频片段的起始时间,以此类推,从而识别到可以识别到文字内容的各段音频片段以及获得各段音频片段的起始时间和结束时间。
3.一种利用权利要求1-2任一所述***的方法,其特征在于,具体过程为:
智慧课堂的直播过程中,视频录制模块同步进行视频录制,直播结束后,视频录制结束得到录制视频文件;
音频提取模块对视频录制模块录制得到的录制视频文件进行音频提取得到录制音频文件;
语音识别模块对录制音频文件进行语音识别,识别对应的文字内容,并同步记录可以识别得到文字内容的各段音频片段的起始时间和结束时间,建立各段音频片段和文字内容之间的关联关系;
当用户触发增加字幕事件时,字幕增加模块根据各段音频片段的起始时间和结束时间,将各段文字内容展示在录制视频文件对应的各段视频片段中,各段文字内容的起始展示时间和结束展示时间与对应视频片段的起始时间和结束时间相对应;最终得到增加字幕内容后的视频文件;
当用户发现文字内容和录制视频文件的画面不匹配时,可通过编辑模块将对应文字内容的起始展示时间提前或推后,使其与录制视频文件的画面完全匹配;当用户发现文字内容有错误时,可通过编辑模块对文字内容进行修改。
4.根据权利要求3所述的方法,其特征在于,语音识别模块按照时间顺序依次对录制音频文件进行语音识别,首次识别到文字内容时记录当前时间为本音频片段的起始时间,当在某个时间起超过预设的时长无法再识别到文字内容时,记录该时间为本音频片段的结束时间;直至下一次再识别到文字内容时,记录该时间为下一音频片段的起始时间,以此类推,从而识别到可以识别到文字内容的各段音频片段以及获得各段音频片段的起始时间和结束时间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110477210.XA CN113207032A (zh) | 2021-04-29 | 2021-04-29 | 一种智慧课堂录制视频增加字幕的***及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110477210.XA CN113207032A (zh) | 2021-04-29 | 2021-04-29 | 一种智慧课堂录制视频增加字幕的***及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113207032A true CN113207032A (zh) | 2021-08-03 |
Family
ID=77029604
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110477210.XA Pending CN113207032A (zh) | 2021-04-29 | 2021-04-29 | 一种智慧课堂录制视频增加字幕的***及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113207032A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113784158A (zh) * | 2021-08-31 | 2021-12-10 | 珠海读书郎软件科技有限公司 | 一种纯英文直播课记录重点的***及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105845129A (zh) * | 2016-03-25 | 2016-08-10 | 乐视控股(北京)有限公司 | 一种在音频中切分句子的方法和***及视频文件的字幕自动生成方法和*** |
CN106506335A (zh) * | 2016-11-10 | 2017-03-15 | 北京小米移动软件有限公司 | 分享视频文件的方法及装置 |
CN106851401A (zh) * | 2017-03-20 | 2017-06-13 | 惠州Tcl移动通信有限公司 | 一种自动添加字幕的方法及*** |
CN108289244A (zh) * | 2017-12-28 | 2018-07-17 | 努比亚技术有限公司 | 视频字幕处理方法、移动终端及计算机可读存储介质 |
CN110335612A (zh) * | 2019-07-11 | 2019-10-15 | 招商局金融科技有限公司 | 基于语音识别的会议记录生成方法、装置及存储介质 |
CN111986656A (zh) * | 2020-08-31 | 2020-11-24 | 上海松鼠课堂人工智能科技有限公司 | 教学视频自动字幕处理方法与*** |
-
2021
- 2021-04-29 CN CN202110477210.XA patent/CN113207032A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105845129A (zh) * | 2016-03-25 | 2016-08-10 | 乐视控股(北京)有限公司 | 一种在音频中切分句子的方法和***及视频文件的字幕自动生成方法和*** |
CN106506335A (zh) * | 2016-11-10 | 2017-03-15 | 北京小米移动软件有限公司 | 分享视频文件的方法及装置 |
CN106851401A (zh) * | 2017-03-20 | 2017-06-13 | 惠州Tcl移动通信有限公司 | 一种自动添加字幕的方法及*** |
CN108289244A (zh) * | 2017-12-28 | 2018-07-17 | 努比亚技术有限公司 | 视频字幕处理方法、移动终端及计算机可读存储介质 |
CN110335612A (zh) * | 2019-07-11 | 2019-10-15 | 招商局金融科技有限公司 | 基于语音识别的会议记录生成方法、装置及存储介质 |
CN111986656A (zh) * | 2020-08-31 | 2020-11-24 | 上海松鼠课堂人工智能科技有限公司 | 教学视频自动字幕处理方法与*** |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113784158A (zh) * | 2021-08-31 | 2021-12-10 | 珠海读书郎软件科技有限公司 | 一种纯英文直播课记录重点的***及方法 |
CN113784158B (zh) * | 2021-08-31 | 2022-06-17 | 珠海读书郎软件科技有限公司 | 一种纯英文直播课记录重点的***及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11151892B2 (en) | Internet teaching platform-based following teaching system | |
WO2018072390A1 (zh) | 一种课堂教学的录制和点播的方法及*** | |
CN113225575B (zh) | 一种智慧课堂答疑交互的***及方法 | |
WO2019095447A1 (zh) | 一种具有远程评价功能的跟随教学方法 | |
CN206039925U (zh) | 多媒体教学互动操作装置 | |
CN113301369B (zh) | 一种智慧课堂录播视频的交互***及方法 | |
CN113207033B (zh) | 一种智慧课堂录制视频无效片段处理的***及方法 | |
CN112115301B (zh) | 一种基于课堂笔记的视频标注方法及*** | |
CN105139706A (zh) | 一种基于智能电视的在线教育课程互动方法及*** | |
CN105808733A (zh) | 显示方法及装置 | |
CN104080003A (zh) | 一种点击屏幕触发对照字幕显示的语言视频教学方法 | |
CN112232756A (zh) | 一种人机互动的智能学习平台及关联方法 | |
CN113207032A (zh) | 一种智慧课堂录制视频增加字幕的***及方法 | |
CN113470457A (zh) | 一种交互式计算机远程教育*** | |
CN108243327A (zh) | 一种新型视频录播*** | |
CN117596433A (zh) | 一种基于时间轴微调的国际中文教学视听课件编辑*** | |
CN113391745A (zh) | 网络课程的重点内容处理方法、装置、设备及存储介质 | |
CN205486881U (zh) | 一种舞蹈教学同步训练装置 | |
CN202929870U (zh) | 机床实训资料存储展示*** | |
CN103581569A (zh) | 一种电力***教学课件的录制方法及*** | |
CN113014949B (zh) | 一种智慧课堂课程回放的学生隐私保护***及方法 | |
CN111050111A (zh) | 一种在线互动学***台及其学习装置 | |
CN103648012A (zh) | 一种字幕渐进变色显示的英语视频教学方法 | |
CN114936952A (zh) | 一种数字化教育互联网学习*** | |
CN113784158B (zh) | 一种纯英文直播课记录重点的***及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210803 |