CN109639935A

CN109639935A - 视频录制自动提词器***及方法

Info

Publication number: CN109639935A
Application number: CN201910073127.9A
Authority: CN
Inventors: 何立新; 项响琴; 檀明; 肖连军; 高玲玲
Original assignee: Hefei College
Current assignee: Hefei University; Hefei College
Priority date: 2019-01-25
Filing date: 2019-01-25
Publication date: 2019-04-16
Anticipated expiration: 2039-01-25
Also published as: CN109639935B

Abstract

本申请提供公开了一种视频录制自动提词器方法，包括以下步骤：将设计好的脚本文字输入提词器***，并将脚本文字中即将要录制的语句放到提词器屏幕中心显示；采集被录像者的语音信息，并对被录像者的语音信息进行识别，将语音信息转化为文字信息；将上述文字信息与提词器屏幕中心的语句进行匹配，若匹配成功，则***将脚本文字中的下个句子移至提词器的屏幕中心；若匹配不成功，则进一步判断匹配不相似度t是否大于预先设定的阈值T，若为是，则提示自动中断并结束，若为否，则根据t的大小给出不同级别的警示信息，并由被录像者决定是否结束：若被录像者决定不结束，则继续进行语音信息采集、识别及其后续相应流程，否则直接结束。

Description

视频录制自动提词器***及方法

技术领域

本发明涉及提词器技术领域，具体为一种视频录制自动提词器***及方法。

背景技术

在录制视频(尤其是教学视频)之前，通常需要提前将所要讲的内容写成脚本，然后在录制时将脚本文字用大号字体显示在显示器上，放在被录制者前面进行提示，由于受显示器大小的限制，为了方便被录制者讲解，需要一个工作人员操作计算机不断将被录制者要说的下个句子显示在显示器的正中央，显然这样有两个缺点：第一，需要配备一个专门的工作人员配合录制者操作计算机；第二，工作人员和被录制者在录制过程中都必须注意是否出现讲解内容与脚本内容不一致的情况，并需要进行人工干预。

发明内容

本发明为了解决现有技术的不足，提供了一种采用语音识别等技术设计一个视频录制自动提词器***替代人工操作，并及时提示错误的视频录制自动提词器方法、***及计算机装置。

首先，本申请提供了一种视频录制自动提词器方法，包括以下步骤：

step1：将设计好的脚本文字输入提词器***，并将脚本文字中即将要录制的语句放到提词器屏幕中心位置显示；

step2：采集被录像者的语音信息；

step3：进行语音识别；

step4：将语音信息转化为文字信息；

step5：将转化得到的文字与提词器屏幕中心的语句进行匹配；

step6：若匹配成功，转到step11；若匹配不成功，则转到step7；

step7：判断匹配不相似度t是否大于预先设定的阈值T，若为是，则转到step8，若为否，则转到step9；

step8：提示自动中断，转达step13；

step9：根据t的大小给出不同级别的警示信息；

step10：由被录像者决定是否中断，若为是，则转到step13，若为否，则转到step11；

step11：判断是否录制完毕，若为是，则转到step13；若为否，则转到step12；

step12：将下个语句移至提词器屏幕中心，转到step2；

step13：结束。

其次，本申请提供了一种计算机装置，包括存储器、处理器及储存在存储器上并能够在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

采集被录像者语音信息，对该语音信息进行识别，通过处理器将识别后的语音信息转化为文字信息；

将上述文字信息与存储器内相应的脚本语句进行匹配，匹配成功后提词器将下一个即将录制的语句移至提词器屏幕中心。

再者，本申请还提供了一种视频录制自动提词器***，包括：

如上所述的计算机装置；

与所述计算机装置信号连接的语音采集、语音识别模块、语句匹配模块和分级警示模块。

最后，本申请提供了一种计算机可读存储介质，其上储存有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

将设计好的脚本文字输入提词器***，并将脚本文字中即将要录制的语句放到提词器屏幕中心显示；

采集被录像者的语音信息，并对被录像者的语音信息进行识别，将语音信息转化为文字信息；

将上述文字信息与提词器屏幕中心的语句进行匹配，若匹配成功，则***将脚本文字中的下个句子移至提词器的屏幕中心；

若匹配不成功，则进一步判断匹配不相似度t是否大于预先设定的阈值T，若为是，则提示自动中断并结束，若为否，则根据t的大小给出不同级别的警示信息，并由被录像者决定是否结束：若被录像者决定不结束，则继续进行语音信息采集、识别及其后续相应流程，否则直接结束。

与现有技术相比，本发明的有益效果是：本发明提出了用一个视频录制自动提词器***替代人工操作，采用语音识别技术将被录像者的语音信息转化为文字信息，然后与脚本文字进行匹配，可自动实现提词器字幕的切换，无需人工操作，此外，该***还能够在录制过程中自动判断是否出现了讲解内容与脚本内容不一致的情况，并且能够根据不一致的程度自动地实时地给出不同级别的警示信息或自动中止等处理。

附图说明

图1为本发明工作流程图。

具体实施方式

为了便于理解本发明，下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施方式。但是，本发明可以以许多不同的形式来实现，并不限于本文所描述的实施方式。相反地，提供这些实施方式的目的是使对本发明的公开内容理解的更加透彻全面。

请参阅图1，首先，本申请提供公开了一种视频录制自动提词器方法，包括以下步骤：

step2：采集被录像者的语音信息；

step3：进行语音识别；

step4：将语音信息转化为文字信息；

step6：若匹配成功，转到step11；若匹配不成功，则转到step7；

step8：提示自动中断，转达step13；

step9：根据t的大小给出不同级别的警示信息；

step12：将下个语句移至提词器屏幕中心，转到step2；

step13：结束。

其次，本申请还提出一种计算机装置，包括存储器、处理器及储存在存储器上并能够在处理器上运行的计算机程序，所述处理器执行所述程序时实现以下步骤：

再次，本申请还公开了一种视频录制自动提词器***，包括：

前面所述的计算机装置；

与所述计算机装置信号连接的语音采集模块、语音识别模块、语句匹配模块和分级警示模块。

最后，本申请还还公开了一种计算机可读存储介质，其上储存有计算机程序。所述计算机程序被处理器执行时实现以下步骤：

若匹配不成功，则进一步判断匹配不相似度t是否大于预先设定的阈值T，若为是，则提示自动中断并结束，比如50％以上都不匹配，可自动中断；若为否，则根据t的大小给出不同级别的警示信息，并由被录像者决定是否结束：若被录像者决定不结束，则继续进行语音信息采集、识别及其后续相应流程，否则直接结束。

阈值T可人为进行设定，比如分为3个等级，匹配度在20％以内则可以接受，21％-50％，可由被录像者自己决定；51％以上，则自动中断并结束。

应当认识到，本发明的实施可以由计算机硬件和/或软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现，其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现与计算机***通信。然而，若需要，该程序可以以汇编或机器语言实现。在任何情况下，该语言可以是编译或解释的语言。此外，为此目的该程序能够在编程的专用集成电路上运行。

此外，可按任何合适的顺序来执行本文描述的过程的操作，除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机***的控制下执行，并且可作为共同地在一个或多个处理器上执行的代码(例如，可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。

进一步，所述方法可以在可操作地连接至合适的任何类型的计算平台中实现，包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现，无论是可移动的还是集成至计算平台，如硬盘、光学读取和/或写入存储介质、RAM、ROM等，使得其可由可编程计算机读取，当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外，机器可读代码，或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时，本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时，本发明还包括计算机本身。

计算机程序能够应用于输入数据以执行本文所述的功能，从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中，转换的数据表示物理和有形的对象，包括显示器上产生的物理和有形对象的特定视觉描绘。

以上所述，只是本发明的较佳实施例而已，本发明并不局限于上述实施方式，只要其以相同的手段达到本发明的技术效果，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。在本发明的保护范围内其技术方案和/或实施方式可以有各种不同的修改和变化。

Claims

1.一种视频录制自动提词方法，其特征在于，包括以下步骤：

step2：采集被录像者的语音信息；

step3：进行语音识别；

step4：将语音信息转化为文字信息；

step6：若匹配成功，转到step11；若匹配不成功，则转到step7；

step8：提示自动中断，转达step13；

step9：根据t的大小给出不同级别的警示信息；

step12：将下个语句放到提词器屏幕中心位置显示，转到step2；

step13：结束。

2.一种计算机装置，包括存储器、处理器及储存在存储器上并能够在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现以下步骤：

将上述文字信息与存储器内相应的脚本语句进行匹配，匹配成功后提词器将下一个即将录制的语句移至提词器屏幕中心予以显示。

3.一种视频录制自动提词器***，其特征在于，包括：

如权利要求2所述的计算机装置；

4.一种计算机可读存储介质，其上储存有计算机程序，其特征在于，该计算机程序被处理器执行时实现以下步骤：

将上述文字信息与提词器屏幕中心的语句进行匹配，若匹配成功，则***将脚本文字中的下个句子移至提词器的屏幕中心予以显示；