CN109639935A - 视频录制自动提词器***及方法 - Google Patents

视频录制自动提词器***及方法 Download PDF

Info

Publication number
CN109639935A
CN109639935A CN201910073127.9A CN201910073127A CN109639935A CN 109639935 A CN109639935 A CN 109639935A CN 201910073127 A CN201910073127 A CN 201910073127A CN 109639935 A CN109639935 A CN 109639935A
Authority
CN
China
Prior art keywords
word extractor
videoeding
person
voice messaging
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910073127.9A
Other languages
English (en)
Other versions
CN109639935B (zh
Inventor
何立新
项响琴
檀明
肖连军
高玲玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University
Hefei College
Original Assignee
Hefei College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei College filed Critical Hefei College
Priority to CN201910073127.9A priority Critical patent/CN109639935B/zh
Publication of CN109639935A publication Critical patent/CN109639935A/zh
Application granted granted Critical
Publication of CN109639935B publication Critical patent/CN109639935B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/18Status alarms
    • G08B21/182Level alarms, e.g. alarms responsive to variables exceeding a threshold
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请提供公开了一种视频录制自动提词器方法,包括以下步骤:将设计好的脚本文字输入提词器***,并将脚本文字中即将要录制的语句放到提词器屏幕中心显示;采集被录像者的语音信息,并对被录像者的语音信息进行识别,将语音信息转化为文字信息;将上述文字信息与提词器屏幕中心的语句进行匹配,若匹配成功,则***将脚本文字中的下个句子移至提词器的屏幕中心;若匹配不成功,则进一步判断匹配不相似度t是否大于预先设定的阈值T,若为是,则提示自动中断并结束,若为否,则根据t的大小给出不同级别的警示信息,并由被录像者决定是否结束:若被录像者决定不结束,则继续进行语音信息采集、识别及其后续相应流程,否则直接结束。

Description

视频录制自动提词器***及方法
技术领域
本发明涉及提词器技术领域,具体为一种视频录制自动提词器***及方法。
背景技术
在录制视频(尤其是教学视频)之前,通常需要提前将所要讲的内容写成脚本,然后在录制时将脚本文字用大号字体显示在显示器上,放在被录制者前面进行提示,由于受显示器大小的限制,为了方便被录制者讲解,需要一个工作人员操作计算机不断将被录制者要说的下个句子显示在显示器的正中央,显然这样有两个缺点:第一,需要配备一个专门的工作人员配合录制者操作计算机;第二,工作人员和被录制者在录制过程中都必须注意是否出现讲解内容与脚本内容不一致的情况,并需要进行人工干预。
发明内容
本发明为了解决现有技术的不足,提供了一种采用语音识别等技术设计一个视频录制自动提词器***替代人工操作,并及时提示错误的视频录制自动提词器方法、***及计算机装置。
首先,本申请提供了一种视频录制自动提词器方法,包括以下步骤:
step1:将设计好的脚本文字输入提词器***,并将脚本文字中即将要录制的语句放到提词器屏幕中心位置显示;
step2:采集被录像者的语音信息;
step3:进行语音识别;
step4:将语音信息转化为文字信息;
step5:将转化得到的文字与提词器屏幕中心的语句进行匹配;
step6:若匹配成功,转到step11;若匹配不成功,则转到step7;
step7:判断匹配不相似度t是否大于预先设定的阈值T,若为是,则转到step8,若为否,则转到step9;
step8:提示自动中断,转达step13;
step9:根据t的大小给出不同级别的警示信息;
step10:由被录像者决定是否中断,若为是,则转到step13,若为否,则转到step11;
step11:判断是否录制完毕,若为是,则转到step13;若为否,则转到step12;
step12:将下个语句移至提词器屏幕中心,转到step2;
step13:结束。
其次,本申请提供了一种计算机装置,包括存储器、处理器及储存在存储器上并能够在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
采集被录像者语音信息,对该语音信息进行识别,通过处理器将识别后的语音信息转化为文字信息;
将上述文字信息与存储器内相应的脚本语句进行匹配,匹配成功后提词器将下一个即将录制的语句移至提词器屏幕中心。
再者,本申请还提供了一种视频录制自动提词器***,包括:
如上所述的计算机装置;
与所述计算机装置信号连接的语音采集、语音识别模块、语句匹配模块和分级警示模块。
最后,本申请提供了一种计算机可读存储介质,其上储存有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
将设计好的脚本文字输入提词器***,并将脚本文字中即将要录制的语句放到提词器屏幕中心显示;
采集被录像者的语音信息,并对被录像者的语音信息进行识别,将语音信息转化为文字信息;
将上述文字信息与提词器屏幕中心的语句进行匹配,若匹配成功,则***将脚本文字中的下个句子移至提词器的屏幕中心;
若匹配不成功,则进一步判断匹配不相似度t是否大于预先设定的阈值T,若为是,则提示自动中断并结束,若为否,则根据t的大小给出不同级别的警示信息,并由被录像者决定是否结束:若被录像者决定不结束,则继续进行语音信息采集、识别及其后续相应流程,否则直接结束。
与现有技术相比,本发明的有益效果是:本发明提出了用一个视频录制自动提词器***替代人工操作,采用语音识别技术将被录像者的语音信息转化为文字信息,然后与脚本文字进行匹配,可自动实现提词器字幕的切换,无需人工操作,此外,该***还能够在录制过程中自动判断是否出现了讲解内容与脚本内容不一致的情况,并且能够根据不一致的程度自动地实时地给出不同级别的警示信息或自动中止等处理。
附图说明
图1为本发明工作流程图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施方式。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施方式。相反地,提供这些实施方式的目的是使对本发明的公开内容理解的更加透彻全面。
请参阅图1,首先,本申请提供公开了一种视频录制自动提词器方法,包括以下步骤:
step1:将设计好的脚本文字输入提词器***,并将脚本文字中即将要录制的语句放到提词器屏幕中心位置显示;
step2:采集被录像者的语音信息;
step3:进行语音识别;
step4:将语音信息转化为文字信息;
step5:将转化得到的文字与提词器屏幕中心的语句进行匹配;
step6:若匹配成功,转到step11;若匹配不成功,则转到step7;
step7:判断匹配不相似度t是否大于预先设定的阈值T,若为是,则转到step8,若为否,则转到step9;
step8:提示自动中断,转达step13;
step9:根据t的大小给出不同级别的警示信息;
step10:由被录像者决定是否中断,若为是,则转到step13,若为否,则转到step11;
step11:判断是否录制完毕,若为是,则转到step13;若为否,则转到step12;
step12:将下个语句移至提词器屏幕中心,转到step2;
step13:结束。
其次,本申请还提出一种计算机装置,包括存储器、处理器及储存在存储器上并能够在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
采集被录像者语音信息,对该语音信息进行识别,通过处理器将识别后的语音信息转化为文字信息;
将上述文字信息与存储器内相应的脚本语句进行匹配,匹配成功后提词器将下一个即将录制的语句移至提词器屏幕中心。
再次,本申请还公开了一种视频录制自动提词器***,包括:
前面所述的计算机装置;
与所述计算机装置信号连接的语音采集模块、语音识别模块、语句匹配模块和分级警示模块。
最后,本申请还还公开了一种计算机可读存储介质,其上储存有计算机程序。所述计算机程序被处理器执行时实现以下步骤:
将设计好的脚本文字输入提词器***,并将脚本文字中即将要录制的语句放到提词器屏幕中心显示;
采集被录像者的语音信息,并对被录像者的语音信息进行识别,将语音信息转化为文字信息;
将上述文字信息与提词器屏幕中心的语句进行匹配,若匹配成功,则***将脚本文字中的下个句子移至提词器的屏幕中心;
若匹配不成功,则进一步判断匹配不相似度t是否大于预先设定的阈值T,若为是,则提示自动中断并结束,比如50%以上都不匹配,可自动中断;若为否,则根据t的大小给出不同级别的警示信息,并由被录像者决定是否结束:若被录像者决定不结束,则继续进行语音信息采集、识别及其后续相应流程,否则直接结束。
阈值T可人为进行设定,比如分为3个等级,匹配度在20%以内则可以接受,21%-50%,可由被录像者自己决定;51%以上,则自动中断并结束。
应当认识到,本发明的实施可以由计算机硬件和/或软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现与计算机***通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机***的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、RAM、ROM等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。
计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。在本发明的保护范围内其技术方案和/或实施方式可以有各种不同的修改和变化。

Claims (4)

1.一种视频录制自动提词方法,其特征在于,包括以下步骤:
step1:将设计好的脚本文字输入提词器***,并将脚本文字中即将要录制的语句放到提词器屏幕中心位置显示;
step2:采集被录像者的语音信息;
step3:进行语音识别;
step4:将语音信息转化为文字信息;
step5:将转化得到的文字与提词器屏幕中心的语句进行匹配;
step6:若匹配成功,转到step11;若匹配不成功,则转到step7;
step7:判断匹配不相似度t是否大于预先设定的阈值T,若为是,则转到step8,若为否,则转到step9;
step8:提示自动中断,转达step13;
step9:根据t的大小给出不同级别的警示信息;
step10:由被录像者决定是否中断,若为是,则转到step13,若为否,则转到step11;
step11:判断是否录制完毕,若为是,则转到step13;若为否,则转到step12;
step12:将下个语句放到提词器屏幕中心位置显示,转到step2;
step13:结束。
2.一种计算机装置,包括存储器、处理器及储存在存储器上并能够在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
采集被录像者语音信息,对该语音信息进行识别,通过处理器将识别后的语音信息转化为文字信息;
将上述文字信息与存储器内相应的脚本语句进行匹配,匹配成功后提词器将下一个即将录制的语句移至提词器屏幕中心予以显示。
3.一种视频录制自动提词器***,其特征在于,包括:
如权利要求2所述的计算机装置;
与所述计算机装置信号连接的语音采集模块、语音识别模块、语句匹配模块和分级警示模块。
4.一种计算机可读存储介质,其上储存有计算机程序,其特征在于,该计算机程序被处理器执行时实现以下步骤:
将设计好的脚本文字输入提词器***,并将脚本文字中即将要录制的语句放到提词器屏幕中心显示;
采集被录像者的语音信息,并对被录像者的语音信息进行识别,将语音信息转化为文字信息;
将上述文字信息与提词器屏幕中心的语句进行匹配,若匹配成功,则***将脚本文字中的下个句子移至提词器的屏幕中心予以显示;
若匹配不成功,则进一步判断匹配不相似度t是否大于预先设定的阈值T,若为是,则提示自动中断并结束,若为否,则根据t的大小给出不同级别的警示信息,并由被录像者决定是否结束:若被录像者决定不结束,则继续进行语音信息采集、识别及其后续相应流程,否则直接结束。
CN201910073127.9A 2019-01-25 2019-01-25 视频录制自动提词方法及计算机可读存储介质 Active CN109639935B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910073127.9A CN109639935B (zh) 2019-01-25 2019-01-25 视频录制自动提词方法及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910073127.9A CN109639935B (zh) 2019-01-25 2019-01-25 视频录制自动提词方法及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109639935A true CN109639935A (zh) 2019-04-16
CN109639935B CN109639935B (zh) 2020-10-13

Family

ID=66063795

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910073127.9A Active CN109639935B (zh) 2019-01-25 2019-01-25 视频录制自动提词方法及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109639935B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110164442A (zh) * 2019-06-21 2019-08-23 上海乂学教育科技有限公司 基于语音识别的声控提词器***
CN114999475A (zh) * 2022-05-20 2022-09-02 苏州萝卜电子科技有限公司 智能提词方法及装置
WO2023030121A1 (zh) * 2021-08-31 2023-03-09 北京字跳网络技术有限公司 数据处理方法、装置、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5606344A (en) * 1993-04-02 1997-02-25 Pinewood Associates Limited Information display apparatus
GB2345183A (en) * 1998-12-23 2000-06-28 Canon Res Ct Europe Ltd Monitoring speech presentation
GB2423407A (en) * 2005-02-17 2006-08-23 Private Etutor Computer based teaching system.
CN102036051A (zh) * 2010-12-20 2011-04-27 华为终端有限公司 实现视频会议中提词的方法以及装置
CN104796584A (zh) * 2015-04-23 2015-07-22 南京信息工程大学 具有语音识别功能的提词装置
CN106910504A (zh) * 2015-12-22 2017-06-30 北京君正集成电路股份有限公司 一种基于语音识别的演讲提示方法及装置
CN109089018A (zh) * 2018-10-29 2018-12-25 上海理工大学 一种智能提词装置及其方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5606344A (en) * 1993-04-02 1997-02-25 Pinewood Associates Limited Information display apparatus
GB2345183A (en) * 1998-12-23 2000-06-28 Canon Res Ct Europe Ltd Monitoring speech presentation
GB2389220A (en) * 1998-12-23 2003-12-03 Canon Res Ct Europ Ltd An autocue
GB2423407A (en) * 2005-02-17 2006-08-23 Private Etutor Computer based teaching system.
CN102036051A (zh) * 2010-12-20 2011-04-27 华为终端有限公司 实现视频会议中提词的方法以及装置
CN104796584A (zh) * 2015-04-23 2015-07-22 南京信息工程大学 具有语音识别功能的提词装置
CN106910504A (zh) * 2015-12-22 2017-06-30 北京君正集成电路股份有限公司 一种基于语音识别的演讲提示方法及装置
CN109089018A (zh) * 2018-10-29 2018-12-25 上海理工大学 一种智能提词装置及其方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄崧: "自主研发全方位智能化提词器***的思路", 《视听》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110164442A (zh) * 2019-06-21 2019-08-23 上海乂学教育科技有限公司 基于语音识别的声控提词器***
WO2023030121A1 (zh) * 2021-08-31 2023-03-09 北京字跳网络技术有限公司 数据处理方法、装置、电子设备及存储介质
CN114999475A (zh) * 2022-05-20 2022-09-02 苏州萝卜电子科技有限公司 智能提词方法及装置

Also Published As

Publication number Publication date
CN109639935B (zh) 2020-10-13

Similar Documents

Publication Publication Date Title
US10902300B2 (en) Method and apparatus for training fine-grained image recognition model, fine-grained image recognition method and apparatus, and storage mediums
CN109639935A (zh) 视频录制自动提词器***及方法
US9940932B2 (en) System and method for speech-to-text conversion
US20220375225A1 (en) Video Segmentation Method and Apparatus, Device, and Medium
US20170286803A1 (en) System and method for optical character recognition
CN108281138B (zh) 年龄判别模型训练及智能语音交互方法、设备及存储介质
CN106128188A (zh) 桌面教育专注度分析***及其分析方法
US20210224752A1 (en) Work support system and work support method
CN109785846B (zh) 单声道的语音数据的角色识别方法及装置
WO2020056995A1 (zh) 语音流利度识别方法、装置、计算机设备及可读存储介质
CN107483813B (zh) 一种根据手势进行跟踪录播的方法、装置及存储装置
US11593973B2 (en) Method and system for augmented reality (AR) content creation
KR20200030816A (ko) 스마트 글라스 장치 및 이를 이용한 작업 지시 방법
CN112434178A (zh) 图像分类方法、装置、电子设备和存储介质
CN111402096A (zh) 一种在线授课质量管理方法、***、设备和介质
CN109584864B (zh) 图像处理装置和方法
WO2017112131A1 (en) Determining values of angular gauges
CN112289239A (zh) 一种可动态调整的讲解方法、装置及电子设备
JP7111873B2 (ja) 信号灯識別方法、装置、デバイス、記憶媒体及びプログラム
CN112598953B (zh) 一种基于列车驾驶仿真***乘务员的评价***及方法
CN113114986B (zh) 基于画面和声音同步的预警方法及相关设备
US20220171980A1 (en) Detecting The Same Type of Objects in Images Using Machine Learning Models
CN113761986A (zh) 文本获取、直播方法、设备及存储介质
US11756297B2 (en) Augmented realty based assistance system and method thereof
CN104751844A (zh) 用于证券信息交互的语音识别方法及其***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant