CN109639935A - 视频录制自动提词器***及方法 - Google Patents
视频录制自动提词器***及方法 Download PDFInfo
- Publication number
- CN109639935A CN109639935A CN201910073127.9A CN201910073127A CN109639935A CN 109639935 A CN109639935 A CN 109639935A CN 201910073127 A CN201910073127 A CN 201910073127A CN 109639935 A CN109639935 A CN 109639935A
- Authority
- CN
- China
- Prior art keywords
- word extractor
- videoeding
- person
- voice messaging
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000004590 computer program Methods 0.000 claims description 15
- 238000009434 installation Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B21/00—Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
- G08B21/18—Status alarms
- G08B21/182—Level alarms, e.g. alarms responsive to variables exceeding a threshold
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Emergency Management (AREA)
- Machine Translation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请提供公开了一种视频录制自动提词器方法,包括以下步骤:将设计好的脚本文字输入提词器***,并将脚本文字中即将要录制的语句放到提词器屏幕中心显示;采集被录像者的语音信息,并对被录像者的语音信息进行识别,将语音信息转化为文字信息;将上述文字信息与提词器屏幕中心的语句进行匹配,若匹配成功,则***将脚本文字中的下个句子移至提词器的屏幕中心;若匹配不成功,则进一步判断匹配不相似度t是否大于预先设定的阈值T,若为是,则提示自动中断并结束,若为否,则根据t的大小给出不同级别的警示信息,并由被录像者决定是否结束:若被录像者决定不结束,则继续进行语音信息采集、识别及其后续相应流程,否则直接结束。
Description
技术领域
本发明涉及提词器技术领域,具体为一种视频录制自动提词器***及方法。
背景技术
在录制视频(尤其是教学视频)之前,通常需要提前将所要讲的内容写成脚本,然后在录制时将脚本文字用大号字体显示在显示器上,放在被录制者前面进行提示,由于受显示器大小的限制,为了方便被录制者讲解,需要一个工作人员操作计算机不断将被录制者要说的下个句子显示在显示器的正中央,显然这样有两个缺点:第一,需要配备一个专门的工作人员配合录制者操作计算机;第二,工作人员和被录制者在录制过程中都必须注意是否出现讲解内容与脚本内容不一致的情况,并需要进行人工干预。
发明内容
本发明为了解决现有技术的不足,提供了一种采用语音识别等技术设计一个视频录制自动提词器***替代人工操作,并及时提示错误的视频录制自动提词器方法、***及计算机装置。
首先,本申请提供了一种视频录制自动提词器方法,包括以下步骤:
step1:将设计好的脚本文字输入提词器***,并将脚本文字中即将要录制的语句放到提词器屏幕中心位置显示;
step2:采集被录像者的语音信息;
step3:进行语音识别;
step4:将语音信息转化为文字信息;
step5:将转化得到的文字与提词器屏幕中心的语句进行匹配;
step6:若匹配成功,转到step11;若匹配不成功,则转到step7;
step7:判断匹配不相似度t是否大于预先设定的阈值T,若为是,则转到step8,若为否,则转到step9;
step8:提示自动中断,转达step13;
step9:根据t的大小给出不同级别的警示信息;
step10:由被录像者决定是否中断,若为是,则转到step13,若为否,则转到step11;
step11:判断是否录制完毕,若为是,则转到step13;若为否,则转到step12;
step12:将下个语句移至提词器屏幕中心,转到step2;
step13:结束。
其次,本申请提供了一种计算机装置,包括存储器、处理器及储存在存储器上并能够在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
采集被录像者语音信息,对该语音信息进行识别,通过处理器将识别后的语音信息转化为文字信息;
将上述文字信息与存储器内相应的脚本语句进行匹配,匹配成功后提词器将下一个即将录制的语句移至提词器屏幕中心。
再者,本申请还提供了一种视频录制自动提词器***,包括:
如上所述的计算机装置;
与所述计算机装置信号连接的语音采集、语音识别模块、语句匹配模块和分级警示模块。
最后,本申请提供了一种计算机可读存储介质,其上储存有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
将设计好的脚本文字输入提词器***,并将脚本文字中即将要录制的语句放到提词器屏幕中心显示;
采集被录像者的语音信息,并对被录像者的语音信息进行识别,将语音信息转化为文字信息;
将上述文字信息与提词器屏幕中心的语句进行匹配,若匹配成功,则***将脚本文字中的下个句子移至提词器的屏幕中心;
若匹配不成功,则进一步判断匹配不相似度t是否大于预先设定的阈值T,若为是,则提示自动中断并结束,若为否,则根据t的大小给出不同级别的警示信息,并由被录像者决定是否结束:若被录像者决定不结束,则继续进行语音信息采集、识别及其后续相应流程,否则直接结束。
与现有技术相比,本发明的有益效果是:本发明提出了用一个视频录制自动提词器***替代人工操作,采用语音识别技术将被录像者的语音信息转化为文字信息,然后与脚本文字进行匹配,可自动实现提词器字幕的切换,无需人工操作,此外,该***还能够在录制过程中自动判断是否出现了讲解内容与脚本内容不一致的情况,并且能够根据不一致的程度自动地实时地给出不同级别的警示信息或自动中止等处理。
附图说明
图1为本发明工作流程图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施方式。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施方式。相反地,提供这些实施方式的目的是使对本发明的公开内容理解的更加透彻全面。
请参阅图1,首先,本申请提供公开了一种视频录制自动提词器方法,包括以下步骤:
step1:将设计好的脚本文字输入提词器***,并将脚本文字中即将要录制的语句放到提词器屏幕中心位置显示;
step2:采集被录像者的语音信息;
step3:进行语音识别;
step4:将语音信息转化为文字信息;
step5:将转化得到的文字与提词器屏幕中心的语句进行匹配;
step6:若匹配成功,转到step11;若匹配不成功,则转到step7;
step7:判断匹配不相似度t是否大于预先设定的阈值T,若为是,则转到step8,若为否,则转到step9;
step8:提示自动中断,转达step13;
step9:根据t的大小给出不同级别的警示信息;
step10:由被录像者决定是否中断,若为是,则转到step13,若为否,则转到step11;
step11:判断是否录制完毕,若为是,则转到step13;若为否,则转到step12;
step12:将下个语句移至提词器屏幕中心,转到step2;
step13:结束。
其次,本申请还提出一种计算机装置,包括存储器、处理器及储存在存储器上并能够在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
采集被录像者语音信息,对该语音信息进行识别,通过处理器将识别后的语音信息转化为文字信息;
将上述文字信息与存储器内相应的脚本语句进行匹配,匹配成功后提词器将下一个即将录制的语句移至提词器屏幕中心。
再次,本申请还公开了一种视频录制自动提词器***,包括:
前面所述的计算机装置;
与所述计算机装置信号连接的语音采集模块、语音识别模块、语句匹配模块和分级警示模块。
最后,本申请还还公开了一种计算机可读存储介质,其上储存有计算机程序。所述计算机程序被处理器执行时实现以下步骤:
将设计好的脚本文字输入提词器***,并将脚本文字中即将要录制的语句放到提词器屏幕中心显示;
采集被录像者的语音信息,并对被录像者的语音信息进行识别,将语音信息转化为文字信息;
将上述文字信息与提词器屏幕中心的语句进行匹配,若匹配成功,则***将脚本文字中的下个句子移至提词器的屏幕中心;
若匹配不成功,则进一步判断匹配不相似度t是否大于预先设定的阈值T,若为是,则提示自动中断并结束,比如50%以上都不匹配,可自动中断;若为否,则根据t的大小给出不同级别的警示信息,并由被录像者决定是否结束:若被录像者决定不结束,则继续进行语音信息采集、识别及其后续相应流程,否则直接结束。
阈值T可人为进行设定,比如分为3个等级,匹配度在20%以内则可以接受,21%-50%,可由被录像者自己决定;51%以上,则自动中断并结束。
应当认识到,本发明的实施可以由计算机硬件和/或软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现与计算机***通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机***的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、RAM、ROM等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。
计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。在本发明的保护范围内其技术方案和/或实施方式可以有各种不同的修改和变化。
Claims (4)
1.一种视频录制自动提词方法,其特征在于,包括以下步骤:
step1:将设计好的脚本文字输入提词器***,并将脚本文字中即将要录制的语句放到提词器屏幕中心位置显示;
step2:采集被录像者的语音信息;
step3:进行语音识别;
step4:将语音信息转化为文字信息;
step5:将转化得到的文字与提词器屏幕中心的语句进行匹配;
step6:若匹配成功,转到step11;若匹配不成功,则转到step7;
step7:判断匹配不相似度t是否大于预先设定的阈值T,若为是,则转到step8,若为否,则转到step9;
step8:提示自动中断,转达step13;
step9:根据t的大小给出不同级别的警示信息;
step10:由被录像者决定是否中断,若为是,则转到step13,若为否,则转到step11;
step11:判断是否录制完毕,若为是,则转到step13;若为否,则转到step12;
step12:将下个语句放到提词器屏幕中心位置显示,转到step2;
step13:结束。
2.一种计算机装置,包括存储器、处理器及储存在存储器上并能够在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
采集被录像者语音信息,对该语音信息进行识别,通过处理器将识别后的语音信息转化为文字信息;
将上述文字信息与存储器内相应的脚本语句进行匹配,匹配成功后提词器将下一个即将录制的语句移至提词器屏幕中心予以显示。
3.一种视频录制自动提词器***,其特征在于,包括:
如权利要求2所述的计算机装置;
与所述计算机装置信号连接的语音采集模块、语音识别模块、语句匹配模块和分级警示模块。
4.一种计算机可读存储介质,其上储存有计算机程序,其特征在于,该计算机程序被处理器执行时实现以下步骤:
将设计好的脚本文字输入提词器***,并将脚本文字中即将要录制的语句放到提词器屏幕中心显示;
采集被录像者的语音信息,并对被录像者的语音信息进行识别,将语音信息转化为文字信息;
将上述文字信息与提词器屏幕中心的语句进行匹配,若匹配成功,则***将脚本文字中的下个句子移至提词器的屏幕中心予以显示;
若匹配不成功,则进一步判断匹配不相似度t是否大于预先设定的阈值T,若为是,则提示自动中断并结束,若为否,则根据t的大小给出不同级别的警示信息,并由被录像者决定是否结束:若被录像者决定不结束,则继续进行语音信息采集、识别及其后续相应流程,否则直接结束。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910073127.9A CN109639935B (zh) | 2019-01-25 | 2019-01-25 | 视频录制自动提词方法及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910073127.9A CN109639935B (zh) | 2019-01-25 | 2019-01-25 | 视频录制自动提词方法及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109639935A true CN109639935A (zh) | 2019-04-16 |
CN109639935B CN109639935B (zh) | 2020-10-13 |
Family
ID=66063795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910073127.9A Active CN109639935B (zh) | 2019-01-25 | 2019-01-25 | 视频录制自动提词方法及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109639935B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110164442A (zh) * | 2019-06-21 | 2019-08-23 | 上海乂学教育科技有限公司 | 基于语音识别的声控提词器*** |
CN114999475A (zh) * | 2022-05-20 | 2022-09-02 | 苏州萝卜电子科技有限公司 | 智能提词方法及装置 |
WO2023030121A1 (zh) * | 2021-08-31 | 2023-03-09 | 北京字跳网络技术有限公司 | 数据处理方法、装置、电子设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5606344A (en) * | 1993-04-02 | 1997-02-25 | Pinewood Associates Limited | Information display apparatus |
GB2345183A (en) * | 1998-12-23 | 2000-06-28 | Canon Res Ct Europe Ltd | Monitoring speech presentation |
GB2423407A (en) * | 2005-02-17 | 2006-08-23 | Private Etutor | Computer based teaching system. |
CN102036051A (zh) * | 2010-12-20 | 2011-04-27 | 华为终端有限公司 | 实现视频会议中提词的方法以及装置 |
CN104796584A (zh) * | 2015-04-23 | 2015-07-22 | 南京信息工程大学 | 具有语音识别功能的提词装置 |
CN106910504A (zh) * | 2015-12-22 | 2017-06-30 | 北京君正集成电路股份有限公司 | 一种基于语音识别的演讲提示方法及装置 |
CN109089018A (zh) * | 2018-10-29 | 2018-12-25 | 上海理工大学 | 一种智能提词装置及其方法 |
-
2019
- 2019-01-25 CN CN201910073127.9A patent/CN109639935B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5606344A (en) * | 1993-04-02 | 1997-02-25 | Pinewood Associates Limited | Information display apparatus |
GB2345183A (en) * | 1998-12-23 | 2000-06-28 | Canon Res Ct Europe Ltd | Monitoring speech presentation |
GB2389220A (en) * | 1998-12-23 | 2003-12-03 | Canon Res Ct Europ Ltd | An autocue |
GB2423407A (en) * | 2005-02-17 | 2006-08-23 | Private Etutor | Computer based teaching system. |
CN102036051A (zh) * | 2010-12-20 | 2011-04-27 | 华为终端有限公司 | 实现视频会议中提词的方法以及装置 |
CN104796584A (zh) * | 2015-04-23 | 2015-07-22 | 南京信息工程大学 | 具有语音识别功能的提词装置 |
CN106910504A (zh) * | 2015-12-22 | 2017-06-30 | 北京君正集成电路股份有限公司 | 一种基于语音识别的演讲提示方法及装置 |
CN109089018A (zh) * | 2018-10-29 | 2018-12-25 | 上海理工大学 | 一种智能提词装置及其方法 |
Non-Patent Citations (1)
Title |
---|
黄崧: "自主研发全方位智能化提词器***的思路", 《视听》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110164442A (zh) * | 2019-06-21 | 2019-08-23 | 上海乂学教育科技有限公司 | 基于语音识别的声控提词器*** |
WO2023030121A1 (zh) * | 2021-08-31 | 2023-03-09 | 北京字跳网络技术有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN114999475A (zh) * | 2022-05-20 | 2022-09-02 | 苏州萝卜电子科技有限公司 | 智能提词方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109639935B (zh) | 2020-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10902300B2 (en) | Method and apparatus for training fine-grained image recognition model, fine-grained image recognition method and apparatus, and storage mediums | |
CN109639935A (zh) | 视频录制自动提词器***及方法 | |
US9940932B2 (en) | System and method for speech-to-text conversion | |
US20220375225A1 (en) | Video Segmentation Method and Apparatus, Device, and Medium | |
US20170286803A1 (en) | System and method for optical character recognition | |
CN108281138B (zh) | 年龄判别模型训练及智能语音交互方法、设备及存储介质 | |
CN106128188A (zh) | 桌面教育专注度分析***及其分析方法 | |
US20210224752A1 (en) | Work support system and work support method | |
CN109785846B (zh) | 单声道的语音数据的角色识别方法及装置 | |
WO2020056995A1 (zh) | 语音流利度识别方法、装置、计算机设备及可读存储介质 | |
CN107483813B (zh) | 一种根据手势进行跟踪录播的方法、装置及存储装置 | |
US11593973B2 (en) | Method and system for augmented reality (AR) content creation | |
KR20200030816A (ko) | 스마트 글라스 장치 및 이를 이용한 작업 지시 방법 | |
CN112434178A (zh) | 图像分类方法、装置、电子设备和存储介质 | |
CN111402096A (zh) | 一种在线授课质量管理方法、***、设备和介质 | |
CN109584864B (zh) | 图像处理装置和方法 | |
WO2017112131A1 (en) | Determining values of angular gauges | |
CN112289239A (zh) | 一种可动态调整的讲解方法、装置及电子设备 | |
JP7111873B2 (ja) | 信号灯識別方法、装置、デバイス、記憶媒体及びプログラム | |
CN112598953B (zh) | 一种基于列车驾驶仿真***乘务员的评价***及方法 | |
CN113114986B (zh) | 基于画面和声音同步的预警方法及相关设备 | |
US20220171980A1 (en) | Detecting The Same Type of Objects in Images Using Machine Learning Models | |
CN113761986A (zh) | 文本获取、直播方法、设备及存储介质 | |
US11756297B2 (en) | Augmented realty based assistance system and method thereof | |
CN104751844A (zh) | 用于证券信息交互的语音识别方法及其*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |