CN112988005B - 自动加载字幕的方法 - Google Patents

自动加载字幕的方法 Download PDF

Info

Publication number
CN112988005B
CN112988005B CN202011367465.2A CN202011367465A CN112988005B CN 112988005 B CN112988005 B CN 112988005B CN 202011367465 A CN202011367465 A CN 202011367465A CN 112988005 B CN112988005 B CN 112988005B
Authority
CN
China
Prior art keywords
subtitle
information
caption
text information
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011367465.2A
Other languages
English (en)
Other versions
CN112988005A (zh
Inventor
吴丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202011367465.2A priority Critical patent/CN112988005B/zh
Publication of CN112988005A publication Critical patent/CN112988005A/zh
Priority to PCT/CN2021/107903 priority patent/WO2022110844A1/zh
Application granted granted Critical
Publication of CN112988005B publication Critical patent/CN112988005B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04817Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04845Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Studio Circuits (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本公开关于一种自动加载字幕的方法。该自动加载字幕的方法包括:响应于用于复制第一文字信息的第一预定操作,获取第一文字信息;在视频编辑界面的第一字幕区域显示基于第一文字信息生成的第一字幕信息。该方案中,根据复制的文字,就可以在视频编辑界面的第一字幕区域中生成第一字幕信息,缓解甚至可以彻底解决需要人工打字或者人工进行粘贴文字来编辑字幕的问题,使得编辑字幕的效率较高。

Description

自动加载字幕的方法
技术领域
本公开涉及视频制作领域,尤其涉及一种自动加载字幕的方法。
背景技术
相关技术中,制作视频的过程中,需要手动添加字幕,具体过程为:拖动视频轨道选 择要添加字幕的视频帧,点击输入文本,手动输入或粘贴所需的字幕文本,再拖到下一个 要添加字幕的视频帧,重复该过程。在视频涉及的字幕量很大时,会花费很多时间来进行 打字。
因此,亟需一种能够提高视频制作过程中的字幕编辑效率的方法。
发明内容
本公开提供一种自动加载字幕的方法,以至少解决相关技术中的视频制作过程中的字 幕编辑效率较低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种自动加载字幕的方法,包括:响应于用于复 制第一文字信息的第一预定操作,获取所述第一文字信息;在视频编辑界面的第一字幕区 域显示基于所述第一文字信息生成的第一字幕信息。
可选地,所述响应于用于复制第一文字信息的第一预定操作,获取所述第一文字信息 步骤包括:响应于所述第一预定操作,在所述视频编辑界面上显示提示信息,所述提示信 息用于提醒是否根据所述第一文字信息确定所述第一字幕信息;响应于作用在所述提示信 息上的第二预定操作,获取所述第一文字信息。
可选地,所述在视频编辑界面的第一字幕区域显示基于所述第一文字信息生成的第一 字幕信息步骤包括:根据所述第一文字信息确定所述第一字幕信息;在所述第一字幕区域 显示所述第一字幕信息。
可选地,所述根据所述第一文字信息确定所述第一字幕信息步骤包括:确定所述第一 文字信息为所述第一字幕信息。
可选地,所述根据所述第一文字信息确定所述第一字幕信息步骤包括:确定所述第一 文字信息按照预定方式显示的预定时长是否小于正在编辑的所述视频的时长;在所述预定 时长小于所述视频的时长的情况下,将所述第一文字信息与字幕数据库中的预定字幕段进 行比较,其中,所述字幕数据库包括多个所述预定字幕段;在所述第一文字信息与目标部 分的相似度大于第一预定阈值的情况下,根据正在编辑的所述视频的长度,确定目标字幕 段的包括所述目标部分的至少部分为所述第一字幕信息,其中,所述目标部分为所述目标 字幕段中与所述第一文字信息的预定时长相同的部分,所述目标字幕段为多个所述预定字 幕段中包括所述目标部分的一个。
可选地,所述在所述第一字幕区域显示所述第一字幕信息步骤包括:确定第一字幕子 区域的位置信息,所述位置信息包括长度和起始位置,所述第一字幕子区域的长度为所述 第一字幕子区域的显示长度,所述第一字幕子区域的长度表征所述第一字幕子区域中的第 一字幕段对应的视频时长,所述第一字幕子区域的起始位置表征所述第一字幕段对应的第 一个视频帧图像,所述第一字幕段为根据所述第一字幕信息划分得到的;根据所述位置信 息,在所述第一字幕区域显示多个所述第一字幕子区域,其中,一个所述第一字幕子区域 中具有一个所述第一字幕段。
可选地,所述视频编辑界面还包括图像区域,所述图像区域显示有多个视频帧图像, 多个所述视频帧图像沿着预定方向依次排列,多个所述第一字幕子区域沿着所述预定方向 依次排列,一个所述第一字幕子区域的位于对应的多个的所述视频帧图像的一侧,所述预 定方向为所述第一字幕子区域的长度方向。
可选地,所述确定第一字幕子区域的位置信息步骤还包括:将所述第一字幕信息分为 多个所述第一字幕段;获取正在编辑的视频的时长;根据所述第一字幕段的数量和所述时 长,确定每个所述第一字幕子区域的长度;确定所述第一字幕区域的起始点为第一个所述 第一字幕子区域的所述起始位置,其他的所述第一字幕子区域的所述起始位置在前一个所 述第一字幕子区域的终止位置。
可选地,所述根据所述第一文字信息确定所述第一字幕信息步骤包括:获取正在编辑 的所述视频的语音内容对应的文字内容;确定所述第一文字信息与所述文字内容的相似度 是否大于第二预定阈值;在所述第一文字信息与所述文字内容的相似度大于所述第二预定 阈值的情况下,确定所述文字内容为所述第一字幕信息,所述确定第一字幕子区域的位置 信息步骤包括:根据所述文字内容与所述视频帧图像的对应关系,确定所述第一字幕段的 所述位置信息。
可选地,在在视频编辑界面的第一字幕区域显示基于所述第一文字信息生成的第一字 幕信息之后,所述方法还包括:响应于作用在第一目标字幕子区域上的第三预定操作,所 述第一目标字幕子区域的起始位置从初始位置变更至预定位置。
可选地,在在视频编辑界面的第一字幕区域显示基于所述第一文字信息生成的第一字 幕信息之后,所述方法还包括:响应于作用在第二目标字幕子区域上的第四预定操作,所 述第二目标字幕子区域的长度从初始长度变为预定长度。
可选地,在在视频编辑界面的第一字幕区域显示基于所述第一文字信息生成的第一字 幕信息之后,所述方法还包括:响应于复制第二文字信息的第五预定操作,获取所述第二 文字信息;根据所述第二文字信息,在视频编辑界面的第二字幕区域显示第二字幕信息, 所述第二字幕区域位于所述第一字幕区域的一侧。
根据本公开实施例的第二方面,提供一种自动加载字幕的方法,包括:检测是否存在 用于复制第一文字信息的第一预定操作;在检测到所述第一预定操作的情况下,获取所述 第一文字信息;基于所述第一文字信息生成第一字幕信息,并在视频编辑界面的字幕区域 显示所述第一字幕信息。
根据本公开实施例的第三方面,提供一种自动加载字幕的方法,包括:在对目标视频 进行编辑时,从用于存储文本信息的内存区域中获取第一文本信息,其中,所述内存区域 用于存储通过对目标文本进行复制操作得到的文本信息;基于所述第一文本信息生成第一 字幕信息,并在视频编辑界面的第一字幕区域展示所述第一字幕信息。
根据本公开实施例的第四方面,提供一种自动加载字幕的装置,包括第一获取单元, 被配置为执行响应于用于复制第一文字信息的第一预定操作,获取所述第一文字信息;第 一显示单元,被配置为在视频编辑界面的第一字幕区域显示基于所述第一文字信息生成的 第一字幕信息。
根据本公开实施例的第五方面,提供一种电子设备,包括:处理器;用于存储所述处 理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现任一种上述 的自动加载字幕的方法。
根据本公开实施例的第六方面,提供一种非易失性存储介质,当所述非易失性存储介 质中的指令由电子设的处理器执行时,使得电子设备能够执行任一种上述的自动加载字幕 的方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
上述的方案中,根据复制的文字,就可以在视频编辑界面的第一字幕区域中生成第一 字幕信息,缓解甚至可以彻底解决需要人工打字或者人工进行粘贴文字来编辑字幕的问 题,使得编辑字幕的效率较高。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限 制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例, 并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种自动加载字幕的方法的应用场景的架构图。
图2是根据一示例性实施例示出的一种自动加载字幕的方法的流程示意图。
图3是根据另一示例性实施例示出的一种自动加载字幕的方法的流程示意图。
图4是根据再一示例性实施例示出的一种自动加载字幕的方法的流程示意图。
图5是根据一示例性实施例示出的一种自动加载字幕的方法对应的显示界面的示意 图。
图6是根据另一示例性实施例示出的一种自动加载字幕的方法对应的显示界面的示 意图。
图7是根据又一示例性实施例示出的一种自动加载字幕的方法的流程示意图。
图8是根据另一示例性实施例示出的一种自动加载字幕的方法的流程示意图。
图9是根据一示例性实施例示出的一种自动加载字幕的装置的结构框图。
图10是根据另一示例性实施例示出的一种自动加载字幕的装置的结构框图。
图11是根据再一示例性实施例示出的一种自动加载字幕的装置的结构框图。
图12是根据一示例性实施例示出的一种用于执行自动加载字幕的方法的电子设备的 结构框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实 施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二” 等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的 数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或 描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相 一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方 面相一致的装置和方法的例子。
正如背景技术所说,现有技术中,在编辑视频的过程中,需要用户手动添加或者粘贴 字幕文本,添加字幕的效率较低。
图1是根据一示例性实施例示出的一种实施环境的架构图,如图1所示,下述自动加 载字幕的方法可以应用于该实施环境中。该实施环境包括电子设备01和服务器02。其中, 电子设备01和服务器02可以通过网络互连并通信。
其中,电子设备01可以为显示第一字幕信息的设备。电子设备01可以从服务器02获取对应的第一字幕信息,并在视频编辑界面中显示该第一字幕信息。或者,电子设备 01本身可以生成第一字幕信息,并显示该第一字幕信息。
电子设备01可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如手机、平板电脑、掌上电脑、个人计算机(Personal Computer,PC)、可穿戴设备、智能电视等。
服务器02可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一 个云计算服务中心。服务器02可以包括处理器、存储器以及网络接口等。
本领域技术人员应能理解上述电子设备和服务器仅为举例,其他现有的或今后可能出 现的电子设备或服务器如可适用于本公开,也应包含在本公开保护范围以内,并在此以引 用方式包含于此。
基于此,本公开的实施例提供了一种自动加载字幕的方法。
本公开实施例提供的显示方法的执行主体可以为上述的电子设备或者服务器,也可以 为该电子设备或者服务器中能够实现该视频内容显示方法的功能模块和/或功能实体,具 体的可以根据实际使用需求确定,本公开实施例不作限定。下面以执行主体为电子设备为 例,对本公开实施例提供的显示方法进行示例性的说明。
图2是根据一示例性实施例示出的一种自动加载字幕的方法的流程图,如图2所示, 该自动加载字幕的方法用于电子设备中,包括以下步骤S11-步骤S12。
在步骤S11中,响应于用于复制第一文字信息的第一预定操作,获取上述第一文字信息。
上述的第一预定操作可以为用于复制第一文字信息的任何单个操作或者一系列操作 形成的操作组。在该电子设备为个人计算机的情况下,该第一预定操作可以为键鼠操作, 例如,例如“Ctrl+C”的键鼠操作。在该电子设备为手机或者PAD等设备时,该第一预 定操作可以为点击操作或者长按操作等。
在步骤S12中,在视频编辑界面的第一字幕区域显示基于上述第一文字信息生成的 第一字幕信息,即根据第一文字信息生成第一字幕信息,并将该第一字幕信息显示在视频 编辑区域的第一字幕区域中。
上述的实施例中,首先,响应于用于复制第一文字信息的第一预定操作,获取第一文 字信息;之后,根据该第一文字信息在视频编辑界面上显示第一字幕信息。该方案中,根据复制的文字,就可以在视频编辑界面的第一字幕区域中生成第一字幕信息,缓解甚至可以彻底解决需要人工打字或者人工进行粘贴文字来编辑字幕的问题,使得编辑字幕的效率较高。
在实际的应用过程中,可能会有多个复制文字信息的预定操作,而这复制的多个文字 信息中,可能仅有部分的文字信息是用于视频的字幕的,为了使得这种情况中,显示的字 幕更加准确,本申请的一种实施例中,如图3所示,上述步骤S11通过步骤S110和步骤S111实现。
在步骤S110中,响应于上述第一预定操作,在上述视频编辑界面上显示提示信息,上述提示信息用于提醒是否根据上述第一文字信息确定上述第一字幕信息。实际的应用过程中,该提示信息可以为提示弹窗,该提示弹窗可以显示有“***检测到您进行了文字复制,是否自动添加为字幕”。当然,并不限于显示有上述文字的提示弹窗,还可以为其他 的一些在视频编辑器中的规定的提示信息,比如,该提示信息为一个显示有“copy?”的 矩形图标。本领域技术人员可以根据实际情况设置合的提示信息,可以为提示图标等。
在步骤S111中,响应于作用在上述提示信息上的第二预定操作,获取上述第一文字 信息。该第二预定操作可以为点击操作、长按操作、双击操作和滑动操作中的至少一个,具体可以根据实际情况来确定。在接收到在该提示信息上的第二预定操作的情况下,即可以确定根据第一文字信息来确定第一字幕信息,因而,基于该第二预定操作,获取第一文字信息。
如图4所示,上述步骤S12可以通过步骤S120和步骤S121来实现,其中,在步骤S120中,根据上述第一文字信息确定上述第一字幕信息;在步骤S121中,在上述第一字 幕区域显示上述第一字幕信息。
在实际的应用过程中,有些情况中,比如,在第一文字信息按照预定方式显示时的时 长和正在编辑的视频的时长基本一致的情况中,或者,在虽然第一文字信息按照预定方式 显示时的时长相对正在编辑的视频的时长较短,但是,该视频仅部分需要字幕的情况中, 第一文字信息为第一字幕信息,那么,对应地,上述步骤S120包括:确定上述第一文字信息为上述第一字幕信息。
在有些情况中,第一文字信息不能满足第一字幕信息对应的需求,第一文字信息可以 作为第一字幕信息中的一部分,为了进一步准确、高效且完整地显示第一字幕信息,本申 请的一种实施例中,上述步骤S120包括:确定上述第一文字信息按照预定方式显示的预 定时长是否小于正在编辑的上述视频的时长;在上述预定时长小于上述视频的时长的情况 下,将上述第一文字信息与字幕数据库中的预定字幕段进行比较,其中,上述字幕数据库 包括多个上述预定字幕段;在上述第一文字信息与目标部分的相似度大于第一预定阈值的 情况下,根据正在编辑的上述视频的长度,确定目标字幕段的包括上述目标部分的至少部 分为上述第一字幕信息,其中,上述目标部分为上述目标字幕段中与上述第一文字信息的 预定时长相同的一部分,上述目标字幕段为多个上述预定字幕段中包括上述目标部分的一 个。该方案中,可以根据第一文字信息自动补全正在编辑的视频对应的第一字幕信息。
比如,第一文字信息为“曾经有一份真诚的爱情放在我面前,我没有珍惜”,字幕数据库为电影中的经典台词片段的数据库,其中的一个预定字幕段为“曾经有一份真诚的爱情放在我面前,我没有珍惜,等我失去的时候我才后悔莫及,人世间最痛苦的事莫过于此,如果上天能够给我一个再来一次的机会,我会对那个女孩子说三个字,我爱你,如果非要在这份爱上加上一个期限,我希望是一万年”,这个预定字幕片段就是目标字幕片段,其 中的目标部分为的“曾经有一份真诚的爱情放在我面前,我没有珍惜”,如果第一预定阈 值为90%,目标部分和第一文字信息的相似度为100%大于第一预定阈值,因此,可以确 定上述的预定字幕段为“曾经有一份真诚的爱情放在我面前,我没有珍惜,等我失去的时 候我才后悔莫及,人世间最痛苦的事莫过于此,如果上天能够给我一个再来一次的机会, 我会对那个女孩子说三个字,我爱你,如果非要在这份爱上加上一个期限,我希望是一万 年”为目标字幕段,后续根据编辑的视频的时长来确定对应的第一字幕信息,首先确定编 辑的视频时长与该目标字幕段按照预定方式显示的时长是否相同,如果相同,则确定目标 字幕段为第一字幕信息。如果编辑的视频时长大于该目标字幕段按照预定方式显示的时 长,则根据该目标字幕段作为第一字幕信息,并根据编辑的视频的时长来调整对应的第一 字幕信息的显示方式,比如通常来说,一句话对应的显示时长为2s,那么,为了使得第 一字幕信息的显示时长和视频的时长相同,则可以将一句话的显示时长增加。如果编辑的 视频时长小于该目标字幕段按照预定方式显示的时长,则将目标字幕段的包括目标部分的 且时长与编辑的视频时长相同的部分作为第一字幕信息,具体可以结合视频的语音信息和 目标部分来截取目标字幕段的部分作为第一字幕信息。
具体的应用中,上述的字幕数据库实际上就是一个素材库,其中的预定字幕段可以为 电影中经典片段的台词,也可以为网路上流行的经典的段子,还可以为诗词库等其他任何 合适的文字片段,本领域技术人员可以根据实际情况选择合适的字幕数据库。
当然,实际的应用过程中,该方法还可以包括构建字幕数据库的步骤,该构建过程可 以参考其他的语言数据库的构建过程,此处就不在赘述了。
为了更加精确地在第一字幕区域中显示第一字幕信息,本申请的一种具体的实施例 中,上述在上述第一字幕区域显示上述第一字幕信息步骤包括:确定第一字幕子区域的位 置信息,上述位置信息包括长度和起始位置,上述第一字幕子区域的长度为上述第一字幕 子区域的显示长度,上述第一字幕子区域的长度表征上述第一字幕子区域中的第一字幕段 对应的视频时长,上述第一字幕子区域的起始位置表征上述第一字幕段对应的第一个视频 帧图像,根据位置信息就可以确定该第一字幕段对应的视频帧图像为哪些,其中,上述第 一字幕段为根据上述第一字幕信息划分得到的;根据上述位置信息,在上述第一字幕区域 显示多个第一字幕子区域,即根据第一字幕子区域的长度和起始位置,显示对应的第一字 幕子区域,第一字幕段一一对应地位于第一字幕子区域中,如图5所示。
具体的一种实施例中,上述视频编辑界面还包括图像区域,上述图像区域显示有多个 视频帧图像,多个上述视频帧图像沿着预定方向依次排列,多个上述第一字幕子区域沿着 上述预定方向依次排列,一个上述第一字幕子区域的位于对应的多个的上述视频帧图像的 一侧,多个视频帧图像和其对应的第一字幕子区域对应显示,上述预定方向为上述第一字 幕子区域的长度方向。具体地,第一字幕子区域的起始位置可以与对应的多个视频帧图像 中的第一个视频帧图像的起始位置对齐,即第一字幕子区域的起始位置在视频帧图像区域 的投影位于第一个视频帧图像的起始边上。第一字幕子区域的长度与对应的多个视频帧图 像的显示长度也可以相同。第一字幕子区域的起始位置在视频帧图像区域的投影也可以位 于对应的多个视频帧图像的第一个视频帧图像内,第一字幕子区域的长度也可以小于对应 的多个视频帧图像的显示总长度。如图5所示,第一字幕子区域101的一侧五个视频帧图 像就是该第一字幕子区域中的第一字幕段对应的五个视频帧图像。
当然,实际的应用过程中,第一字幕子区域并不限于图5所示的位于视频帧图像的一 侧(以面对屏幕的视角观看图5,以下的上侧、左侧和右侧均以该视角观察),还可以位于视频帧图像的上侧。
需要说明的是,第一字幕子区域的还可以显示在其他的显示位置,比如,第一字幕子 区域位于对应的多个视频帧图像的左侧或者右侧。现有技术中,通常称图像帧显示的区域 为主轨道,字幕显示的区域为副轨道,副轨道和主轨道在垂直于预定方向的方向上分布, 具体可以参见图5所示,图5中的第一字幕区域100可以认为为副轨道,帧图像区域200为主轨道。
为了更准确地确定第一字幕子区域的位置信息,从而更加准确地显示第一字幕段,本 申请的一种实施例中,上述确定第一字幕子区域的位置信息步骤还包括:将上述第一字幕 信息分为多个上述第一字幕段,一般来说,一句话划分为一个第一字幕段;获取正在编辑 的视频的时长;根据上述第一字幕段的数量和上述时长,确定每个上述第一字幕子区域的 长度,具体地,由于第一字幕子区域的长度表征其对应的视频的时长,所以根据视频的时 长和第一字幕段的数量,可以确定每个第一字幕子区域中的第一字幕段对应的视频时长, 根据其对应的视频时长,即可以确定其对应的视频帧图像的数量,从而可以根据对应的视 频帧图像的数量确定对应的第一字幕子区域的长度,具体地,第一字幕子区域的长度可以 和其对应的多个视频帧图像的显示总长度大约相等,也可以小于对应的多个视频帧图像的 显示总长度;确定上述第一字幕区域的起始点为第一个上述第一字幕子区域的上述起始位 置,其他的上述第一字幕子区域的上述起始位置在前一个上述第一字幕子区域的终止位 置,这里的“之后”是指在第一字幕子区域的长度方向上的之后,具体地,相邻的两个第 一字幕段的分布间隔可以根据实际情况确定,相邻的两个第一字幕段可以接触,即间隔距 离为0,也可以不接触,间隔距离大于0。
为了更准确且高效地确定第一字幕段对应的视频帧图像,本申请的一种具体的实施例 中,上述根据上述第一文字信息确定上述第一字幕信息步骤包括:获取正在编辑的上述视 频的语音内容对应的文字内容;确定上述第一文字信息与上述文字内容的相似度是否大于 第二预定阈值;在上述第一文字信息与上述文字内容的相似度大于上述第二预定阈值的情 况下,确定上述文字内容为上述第一字幕信息。上述确定第一字幕子区域的位置信息步骤 包括:根据上述文字内容与上述视频帧图像的对应关系,确定上述第一字幕段的上述位置 信息,具体地,文字内容与语音内容有对应关系,语音内容与视频帧图像有对应关系,因 此,文字内容和视频帧图像具有对应关系,根据该对应关系,可以更加准确地确定每一部 分的文字内容(第一字幕段)对应的视频帧图像,从而可以更准确地确定第一字幕子区域 的位置信息,即确定第一字幕子区域的起始位置和长度,第一字幕子区域的起始位置可以 与对应的第一个帧图像的起始位置对应,也可以在第一个帧图像的起始位置之后,第一字 幕子区域的长度可以与对应的多个帧图像的显示总长度相同,也可以小于对应的多个帧图 像的显示总长度。
在实际的应用过程中,有时候第一字幕子区域的显示位置并不是十分准确,为了解决 这一问题,本申请的一种实施例中,在在视频编辑界面的第一字幕区域显示基于上述第一 文字信息生成的第一字幕信息之后,上述方法还包括:响应于作用在第一目标字幕子区域 上的第三预定操作,上述第一目标字幕子区域的起始位置从初始位置变更至预定位置。通 过调整目标第一字幕子区域的起始位置,进而可以调整其显示位置,这样可以进一步保证 调整后的目标第一字幕子区域的显示位置更加准确,从而进一步保证其内的第一字幕子区 域中的第一字幕段对应的视频时长以及视频帧图像更加准确。
本申请的另一种实施例中,在在视频编辑界面的第一字幕区域显示基于上述第一文字 信息生成的第一字幕信息之后,上述方法还包括:响应于作用在第二目标字幕子区域上的 第四预定操作,上述第二目标字幕子区域的长度从初始长度变为预定长度,且上述第二目 标字幕子区域对应的上述视频帧图像的数量从第一预定数量变为第二预定数量。通过该方 式,也可以调整第二目标字幕子区域的显示位置,从而进一步保证调整后的目标第一字幕 子区域的显示位置更加准确,从而进一步保证其内的第一字幕子区域中的第一字幕段对应 的视频时长以及视频帧图像更加准确。
在一些具体的应用中,有的视频需要加载双字幕,为了更好地对这种视频的字幕进行 加载,本申请的一种具体的实施例中,在在视频编辑界面的第一字幕区域显示基于上述第 一文字信息生成的第一字幕信息之后,上述方法还包括:响应于复制第二文字信息的第五 预定操作,获取上述第二文字信息;根据上述第二文字信息,在视频编辑界面的第二字幕 区域显示第二字幕信息,上述第二字幕区域位于上述第一字幕区域的一侧,可以为第一字 幕区域的任一侧,可以根据实际情况进行设置。具体的一种实施例中,如图6所示,第二 字幕区域300位于第一字幕区域100远离帧图像区域200的一侧。
还需要说明的是,本申请中的第二字幕信息的显示过程可以参考上述关于第一字幕信 息的显示过程的描述,此处就不再赘述了。
本申请的另一种实施例中,在视频的字幕加载完之后,上述方法还包括:响应于第五 预定操作,播放包括上述第一字幕信息的视频。
图7是根据一示例性实施例示出的一种自动加载字幕的方法的流程图,如图7所示, 该自动加载字幕的方法用于电子设备中,包括以下步骤S21-步骤S23。
在步骤S21中,检测是否存在用于复制第一文字信息的第一预定操作;
在步骤S22中,在检测到上述第一预定操作的情况下,获取上述第一文字信息;
在步骤S23中,基于上述第一文字信息生成第一字幕信息,并在视频编辑界面的字幕区域显示上述第一字幕信息。
上述的方法中,在检测到第一预定操作的情况下,在在视频编辑界面的字幕区域显示 基于上述第一文字信息生成的第一字幕信息。该方案中,根据复制的文字,就可以在视频 编辑界面的第一字幕区域中生成第一字幕信息,缓解甚至可以彻底解决需要人工打字或者 人工进行粘贴文字来编辑字幕的问题,使得编辑字幕的效率较高。
上述步骤S22的具体过程和步骤S23的具体过程可以参考上述方案中的描述,此处就不再赘述了。
图8是根据一示例性实施例示出的一种自动加载字幕的方法的流程图,如图8所示, 该自动加载字幕的方法用于电子设备中,包括以下步骤S31-步骤S32。
在步骤S31中,在对目标视频进行编辑时,从用于存储文本信息的内存区域中获取第一文本信息,其中,上述内存区域用于存储通过对目标文本进行复制操作(第一预定操作)得到的文本信息;
在步骤S32中,基于上述第一文本信息生成第一字幕信息,并在视频编辑界面的第一字幕区域展示上述第一字幕信息。
上述的实施例中,可以根据复制得到的第一文本信息来生成第一字幕信息,并且,将 对应的第一字幕信息显示在第一字幕区域中。该方案中,根据复制的文字,就可以在视频 编辑界面的第一字幕区域中生成第一字幕信息,缓解甚至可以彻底解决需要人工打字或者 人工进行粘贴文字来编辑字幕的问题,使得视频编辑过程中的编辑字幕的效率较高。
上述步骤S31的具体过程和步骤S32的具体过程可以参考上述方案中的描述,此处就不再赘述了。
需要说明的是,本申请的第一预定操作、第二预定操作、第一预定操作、第二预定操 作以及第五预定操作均可以为现有技术中任何可行的操作,比如包括点击操作、滑动操作、 长按操作与双击操作中的至少一个的操作。本领域技术人员可以根据实际情况选择合适的 操作或者操作组合来对应于本申请的上述五个预定操作。
图9是根据一示例性实施例示出的一种自动加载字幕的装置框图。参照图9,该装置 包括第一获取单元10和第一显示单元20。
该第一获取单元10被配置为执行响应于用于复制第一文字信息的第一预定操作,获 取上述第一文字信息。
上述的第一预定操作可以为用于复制第一文字信息的任何单个操作或者一系列操作 形成的操作组。在该电子设备为个人计算机的情况下,该第一预定操作可以为键鼠操作, 例如,例如“Ctrl+C”的键鼠操作。在该电子设备为手机或者PAD等设备时,该第一预 定操作可以为点击操作或者长按操作等。
该第一显示单元20被配置为在视频编辑界面的第一字幕区域显示基于上述第一文字 信息生成的第一字幕信息。
上述的方案中,根据复制的文字,就可以在视频编辑界面的第一字幕区域中生成第一 字幕信息,缓解甚至可以彻底解决需要人工打字或者人工进行粘贴文字来编辑字幕的问 题,使得编辑字幕的效率较高。
在实际的应用过程中,可能会有多个复制文字信息的预定操作,而这复制的多个文字 信息中,可能仅有部分的文字信息是用于视频的字幕的,为了使得这种情况中,显示的字 幕更加准确,本申请的一种实施例中,第一获取单元包括第一显示模块和获取模块。
第一显示模块被配置为响应于上述第一预定操作,在上述视频编辑界面上显示提示信 息,上述提示信息用于提醒是否根据上述第一文字信息确定上述第一字幕信息。实际的应 用过程中,该提示信息可以为提示弹窗,该提示弹窗可以显示有“***检测到您进行了文 字复制,是否自动添加为字幕”。当然,并不限于显示有上述文字的提示弹窗,还可以为 其他的一些在视频编辑器中的规定的提示信息,比如,该提示信息为一个显示有“copy?” 的矩形图标。本领域技术人员可以根据实际情况设置合的提示信息。
获取模块被配置为响应于作用在上述提示信息上的第二预定操作,获取上述第一文字 信息。该第二预定操作可以为点击操作、长按操作、双击操作和滑动操作中的至少一个, 具体可以根据实际情况来确定。在接收到在该提示信息上的第二预定操作的情况下,即可 以确定根据第一文字信息来确定第一字幕信息,因而,基于该第二预定操作,获取第一文 字信息。
上述第一显示单元包括确定模块和第二显示模块,其中,确定模块被配置为根据上述 第一文字信息确定上述第一字幕信息;第二显示模块被配置为在上述第一字幕区域显示上 述第一字幕信息。
在实际的应用过程中,有些情况中,比如,在第一文字信息按照预定方式显示时的时 长和正在编辑的视频的时长基本一致的情况中,或者,在虽然第一文字信息按照预定方式 显示时的时长相对正在编辑的视频的时长较短,但是,该视频仅部分需要字幕的情况中, 第一文字信息为第一字幕信息,那么,对应地,确定模块被配置为确定上述第一文字信息 为上述第一字幕信息。
在有些情况中,第一文字信息不能满足第一字幕信息对应的需求,第一文字信息可以 作为第一字幕信息中的一部分,为了进一步准确、高效且完整地显示第一字幕信息,本申 请的一种实施例中,确定模块还包括第一确定子模块、第二确定子模块和第三确定子模块, 其中,第一确定子模块被配置为确定上述第一文字信息按照预定方式显示的预定时长是否 小于正在编辑的上述视频的时长;第二确定子模块被配置为在上述预定时长小于上述视频 的时长的情况下,将上述第一文字信息与字幕数据库中的预定字幕段进行比较,其中,上 述字幕数据库包括多个上述预定字幕段;第三确定子模块被配置为在上述第一文字信息与 目标部分的相似度大于第一预定阈值的情况下,根据正在编辑的上述视频的长度,确定目 标字幕段的包括上述目标部分的至少部分为上述第一字幕信息,其中,上述目标部分为上 述目标字幕段中与上述第一文字信息的预定时长相同的一部分,上述目标字幕段为多个上 述预定字幕段中包括上述目标部分的一个。该方案中,可以根据第一文字信息自动补全正 在编辑的视频对应的第一字幕信息。
比如,第一文字信息为“曾经有一份真诚的爱情放在我面前,我没有珍惜”,字幕数据库为电影中的经典台词片段的数据库,其中的一个预定字幕段为“曾经有一份真诚的爱情放在我面前,我没有珍惜,等我失去的时候我才后悔莫及,人世间最痛苦的事莫过于此,如果上天能够给我一个再来一次的机会,我会对那个女孩子说三个字,我爱你,如果非要在这份爱上加上一个期限,我希望是一万年”,这个预定字幕片段就是目标字幕片段,其 中的目标部分为的“曾经有一份真诚的爱情放在我面前,我没有珍惜”,如果第一预定阈 值为90%,目标部分和第一文字信息的相似度为100%大于第一预定阈值,因此,可以确 定上述的预定字幕段为“曾经有一份真诚的爱情放在我面前,我没有珍惜,等我失去的时 候我才后悔莫及,人世间最痛苦的事莫过于此,如果上天能够给我一个再来一次的机会, 我会对那个女孩子说三个字,我爱你,如果非要在这份爱上加上一个期限,我希望是一万 年”为目标字幕段,后续根据编辑的视频的时长来确定对应的第一字幕信息,首先确定编 辑的视频时长与该目标字幕段按照预定方式显示的时长是否相同,如果相同,则确定目标 字幕段为第一字幕信息。如果编辑的视频时长大于该目标字幕段按照预定方式显示的时 长,则根据该目标字幕段作为第一字幕信息,并根据编辑的视频的时长来调整对应的第一 字幕信息的显示方式,比如通常来说,一句话对应的显示时长为2s,那么,为了使得第 一字幕信息的显示时长和视频的时长相同,则可以将一句话的显示时长增加。如果编辑的 视频时长小于该目标字幕段按照预定方式显示的时长,则将目标字幕段的包括目标部分的 且时长与编辑的视频时长相同的部分作为第一字幕信息,具体可以结合视频的语音信息和 目标部分来截取目标字幕段的部分作为第一字幕信息。
具体的应用中,上述的字幕数据库实际上就是一个素材库,其中的预定字幕段可以为 电影中经典片段的台词,也可以为网路上流行的经典的段子,还可以为诗词库等其他任何 合适的文字片段,本领域技术人员可以根据实际情况选择合适的字幕数据库。
当然,实际的应用过程中,该方法还可以包括构建字幕数据库的步骤,该构建过程可 以参考其他的语言数据库的构建过程,此处就不在赘述了。
为了更加精确地在第一字幕区域中显示第一字幕信息,本申请的一种具体的实施例 中,上述第二显示模块包括第四确定子模块和第一显示子模块。
其中,第四确定子模块被配置为确定第一字幕子区域的位置信息,上述位置信息包括 长度和起始位置,上述第一字幕子区域的长度为上述第一字幕子区域的显示长度,上述第 一字幕子区域的长度表征上述第一字幕子区域中的第一字幕段对应的视频时长,上述第一 字幕子区域的起始位置表征上述第一字幕段对应的第一个视频帧图像,根据位置信息就可 以确定该第一字幕段对应的视频帧图像为哪些,其中,上述第一字幕段为根据上述第一字 幕信息划分得到的;
第一显示子模块被配置为根据上述位置信息,在上述第一字幕区域显示多个第一字幕 子区域,即根据第一字幕子区域的长度和起始位置,确定第一字幕子区域的长度和起始位 置,第一字幕段一一对应地位于第一字幕子区域中,如图5所示。
具体的一种实施例中,上述视频编辑界面还包括图像区域,上述图像区域显示有多个 视频帧图像,多个上述视频帧图像沿着预定方向依次排列,多个上述第一字幕子区域沿着 上述预定方向依次排列,一个上述第一字幕子区域的位于对应的多个的上述视频帧图像的 一侧,多个视频帧图像和其对应的第一字幕子区域对应显示,上述预定方向为上述第一字 幕子区域的长度方向。具体地,第一字幕子区域的起始位置可以与对应的多个视频帧图像 中的第一个视频帧图像的起始位置对齐,即第一字幕子区域的起始位置在视频帧图像区域 的投影位于第一个视频帧图像的起始边上。第一字幕子区域的长度与对应的多个视频帧图 像的显示长度也可以相同。第一字幕子区域的起始位置在视频帧图像区域的投影也可以位 于对应的多个视频帧图像的第一个视频帧图像内,第一字幕子区域的长度也可以小于对应 的多个视频帧图像的显示总长度。如图5所示,第一字幕子区域的一侧五个视频帧图像 201就是该第一字幕子区域中的第一字幕段对应的五个视频帧图像201。
当然,实际的应用过程中,第一字幕子区域并不限于图5所示的位于视频帧图像的一 侧(以面对屏幕的视角观看图5,以下的上侧、左侧和右侧均以该视角观察),还可以位于视频帧图像的上侧。
需要说明的是,第一字幕子区域的还可以显示在其他的显示位置,比如,第一字幕子 区域位于对应的多个视频帧图像的左侧或者右侧。现有技术中,通常称图像帧显示的区域 为主轨道,字幕显示的区域为副轨道,副轨道和主轨道在垂直于预定方向的方向上分布, 具体可以参见图5所示,图5中的第一字幕区域100可以认为为副轨道,帧图像区域200为主轨道。。
为了更准确地确定第一字幕子区域的位置信息,从而更加准确地显示第一字幕段,本 申请的一种实施例中,上述第四确定子模块包括划分子模块、第一获取子模块、第五确定 子模块和第六确定子模块。
其中,划分子模块被配置为将上述第一字幕信息分为多个上述第一字幕段,一般来说, 一句话划分为一个第一字幕段。
第一获取子模块被配置为获取正在编辑的视频的时长。
第五确定子模块被配置为根据上述第一字幕段的数量和上述时长,确定每个上述第一 字幕子区域的长度,具体地,由于第一字幕子区域的长度表征其对应的视频的时长,所以 根据视频的时长和第一字幕段的数量,可以确定每个第一字幕子区域中的第一字幕段对应 的视频时长,根据其对应的视频时长,即可以确定其对应的视频帧图像的数量,从而可以 根据对应的视频帧图像的数量确定对应的第一字幕子区域的长度,具体地,第一字幕子区 域的长度可以和其对应的多个视频帧图像的显示总长度大约相等,也可以小于对应的多个 视频帧图像的显示总长度。
第六确定子模块被配置为确定上述第一字幕区域的起始点为第一个上述第一字幕子 区域的上述起始位置,其他的上述第一字幕子区域的上述起始位置在前一个上述第一字幕 子区域的终止位置,这里的“之后”是指在第一字幕子区域的长度方向上的之后,具体地, 相邻的两个第一字幕段的分布间隔可以根据实际情况确定,相邻的两个第一字幕段可以接 触,即间隔距离为0,也可以不接触,间隔距离大于0。
为了更准确且高效地确定第一字幕段对应的视频帧图像,本申请的一种具体的实施例 中,上述确定模块包括第二获取子模块、第七确定子模块和第八确定子模块。
其中,第二获取子模块被配置为获取正在编辑的上述视频的语音内容对应的文字内 容。
第七确定子模块被配置为确定上述第一文字信息与上述文字内容的相似度是否大于 第二预定阈值。
第八确定子模块被配置为在上述第一文字信息与上述文字内容的相似度大于上述第 二预定阈值的情况下,确定上述文字内容为上述第一字幕信息。
第四确定子模块被配置为根据上述文字内容与上述视频帧图像的对应关系,确定上述 第一字幕段的上述位置信息,具体地,文字内容与语音内容有对应关系,语音内容与视频 帧图像有对应关系,因此,文字内容和视频帧图像具有对应关系,根据该对应关系,可以 更加准确地确定每一部分的文字内容(第一字幕段)对应的视频帧图像,从而可以更准确 地确定第一字幕子区域的位置信息,即确定第一字幕子区域的起始位置和长度,第一字幕 子区域的起始位置可以与对应的第一个帧图像的起始位置对应,也可以在第一个帧图像的 起始位置之后,第一字幕子区域的长度可以与对应的多个帧图像的显示总长度相同,也可 以小于对应的多个帧图像的显示总长度。
在实际的应用过程中,有时候第一字幕子区域的显示位置并不是十分准确,为了解决 这一问题,本申请的一种实施例中,上述装置还包括第一调整单元,第一调整单元被配置 为在在视频编辑界面的第一字幕区域显示基于上述第一文字信息生成的第一字幕信息之 后,响应于作用在第一目标字幕子区域上的第三预定操作,上述第一目标字幕子区域的起 始位置从初始位置变更至预定位置。通过调整目标第一字幕子区域的起始位置,进而可以 调整其显示位置,这样可以进一步保证调整后的目标第一字幕子区域的显示位置更加准 确,从而进一步保证其内的第一字幕子区域中的第一字幕段对应的视频时长以及视频帧图 像更加准确。
本申请的另一种实施例中,上述装置还包括第二调整单元,第二调整单元被配置为在 在视频编辑界面的第一字幕区域显示基于上述第一文字信息生成的第一字幕信息之后,响 应于作用在第二目标字幕子区域上的第四预定操作,上述第二目标字幕子区域的长度从初 始长度变为预定长度,且上述第二目标字幕子区域对应的上述视频帧图像的数量从第一预 定数量变为第二预定数量。通过该方式,也可以调整第二目标字幕子区域的显示位置,从 而进一步保证调整后的目标第一字幕子区域的显示位置更加准确,从而进一步保证其内的 第一字幕子区域中的第一字幕段对应的视频时长以及视频帧图像更加准确。
在一些具体的应用中,有的视频需要加载双字幕,为了更好地对这种视频的字幕进行 加载,本申请的一种具体的实施例中,上述装置还包括第二获取单元和第二显示单元,其 中,第二获取单元被配置为在在视频编辑界面的第一字幕区域显示基于上述第一文字信息 生成的第一字幕信息之后,响应于复制第二文字信息的第五预定操作,获取上述第二文字 信息;第二显示单元被配置为根据上述第二文字信息,在视频编辑界面的第二字幕区域显 示第二字幕信息,上述第二字幕区域位于上述第一字幕区域的一侧,可以为第一字幕区域 的任一侧,可以根据实际情况进行设置。具体的一种实施例中,如图6所示,第二字幕区 域位于第一字幕区域远离视频帧图像的一侧。
还需要说明的是,本申请中的第二字幕信息的显示过程可以参考上述关于第一字幕信 息的显示过程的描述,此处就不再赘述了。
本申请的另一种实施例中,上述装置还包括播放单元,播放单元被配置为在视频的字 幕加载完之后,响应于第五预定操作,播放包括上述第一字幕信息的视频。
图10是根据一示例性实施例示出的一种自动加载字幕的装置框图,如图10所示,该 自动加载字幕的装置包括检测单元30、第二获取单元40和第二显示单元50。
检测单元30被配置为检测是否存在用于复制第一文字信息的第一预定操作;
第二获取单元40被配置为在检测到上述第一预定操作的情况下,获取上述第一文字 信息;
第二显示单元50被配置为基于上述第一文字信息生成第一字幕信息,并在视频编辑 界面的字幕区域显示上述第一字幕信息。
上述的装置中,在检测到第一预定操作的情况下,第一显示单元在视频编辑界面的字 幕区域显示基于上述第一文字信息生成的第一字幕信息。该方案中,根据复制的文字,就 可以在视频编辑界面的第一字幕区域中生成第一字幕信息,缓解甚至可以彻底解决需要人 工打字或者人工进行粘贴文字来编辑字幕的问题,使得编辑字幕的效率较高。
上述的第一获取单元和第一显示单元的具体实现过程可以参考上述方案中的描述,此 处就不再赘述了。
图11是根据一示例性实施例示出的一种自动加载字幕的方法的流程图,如图11所示, 该自动加载字幕的方法用于电子设备中,包括第三获取单元60和第三显示单元70。
其中,第三获取单元60被配置为在对目标视频进行编辑时,从用于存储文本信息的 内存区域中获取第一文本信息,其中,上述内存区域用于存储通过对目标文本进行复制操 作(第一预定操作)得到的文本信息;
第三显示单元70被配置为基于上述第一文本信息生成第一字幕信息,并在视频编辑 界面的第一字幕区域展示上述第一字幕信息。
上述的实施例中,可以根据复制得到的第一文本信息来生成第一字幕信息,并且,将 对应的第一字幕信息显示在第一字幕区域中。该方案中,根据复制的文字,就可以在视频 编辑界面的第一字幕区域中生成第一字幕信息,缓解甚至可以彻底解决需要人工打字或者 人工进行粘贴文字来编辑字幕的问题,使得视频编辑过程中的编辑字幕的效率较高。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实 施例中进行了详细描述,此处将不做详细阐述说明。
图12是根据一示例性实施例示出的一种用于执行字幕自动加载的电子设备01的框 图。
在示例性实施例中,还提供了一种包括可执行指令的存储介质,例如用于存储可执行 指令的存储器402,上述指令可由电子设备01的处理器404执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,上述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备 等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实 施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者 适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或 惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权 利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可 以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (15)

1.一种自动加载字幕的方法,其特征在于,包括:
响应于用于复制第一文字信息的第一预定操作,获取所述第一文字信息;
在视频编辑界面的第一字幕区域显示基于所述第一文字信息生成的第一字幕信息,
所述在视频编辑界面的第一字幕区域显示基于所述第一文字信息生成的第一字幕信息步骤包括:
根据所述第一文字信息确定所述第一字幕信息;
在所述第一字幕区域显示所述第一字幕信息,
所述根据所述第一文字信息确定所述第一字幕信息步骤包括:
确定所述第一文字信息按照预定方式显示的预定时长是否小于正在编辑的所述视频的时长;
在所述预定时长小于所述视频的时长的情况下,将所述第一文字信息与字幕数据库中的预定字幕段进行比较,其中,所述字幕数据库包括多个所述预定字幕段;
在所述第一文字信息与目标部分的相似度大于第一预定阈值的情况下,根据正在编辑的所述视频的长度,确定目标字幕段的包括所述目标部分的至少部分为所述第一字幕信息,其中,所述目标部分为所述目标字幕段中与所述第一文字信息的预定时长相同的部分,所述目标字幕段为多个所述预定字幕段中包括所述目标部分的一个。
2.根据权利要求1所述的方法,其特征在于,所述响应于用于复制第一文字信息的第一预定操作,获取所述第一文字信息步骤包括:
响应于所述第一预定操作,在所述视频编辑界面上显示提示信息,所述提示信息用于提醒是否根据所述第一文字信息确定所述第一字幕信息;
响应于作用在所述提示信息上的第二预定操作,获取所述第一文字信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一文字信息确定所述第一字幕信息步骤包括:
确定所述第一文字信息为所述第一字幕信息。
4.根据权利要求1所述的方法,其特征在于,所述在所述第一字幕区域显示所述第一字幕信息步骤包括:
确定第一字幕子区域的位置信息,所述位置信息包括长度和起始位置,所述第一字幕子区域的长度为所述第一字幕子区域的显示长度,所述第一字幕子区域的长度表征所述第一字幕子区域中的第一字幕段对应的视频时长,所述第一字幕子区域的起始位置表征所述第一字幕段对应的第一个视频帧图像,所述第一字幕段为根据所述第一字幕信息划分得到的;
根据所述位置信息,在所述第一字幕区域显示多个所述第一字幕子区域,其中,一个所述第一字幕子区域中具有一个所述第一字幕段。
5.根据权利要求4所述的方法,其特征在于,所述视频编辑界面还包括图像区域,所述图像区域显示有多个视频帧图像,多个所述视频帧图像沿着预定方向依次排列,多个所述第一字幕子区域沿着所述预定方向依次排列,一个所述第一字幕子区域的位于对应的多个的所述视频帧图像的一侧,所述预定方向为所述第一字幕子区域的长度方向。
6.根据权利要求4所述的方法,其特征在于,所述确定第一字幕子区域的位置信息步骤还包括:
将所述第一字幕信息分为多个所述第一字幕段;
获取正在编辑的视频的时长;
根据所述第一字幕段的数量和所述时长,确定每个所述第一字幕子区域的长度;
确定所述第一字幕区域的起始点为第一个所述第一字幕子区域的所述起始位置,其他的所述第一字幕子区域的所述起始位置在前一个所述第一字幕子区域的终止位置。
7.根据权利要求4所述的方法,其特征在于,
所述根据所述第一文字信息确定所述第一字幕信息步骤包括:
获取正在编辑的所述视频的语音内容对应的文字内容;
确定所述第一文字信息与所述文字内容的相似度是否大于第二预定阈值;
在所述第一文字信息与所述文字内容的相似度大于所述第二预定阈值的情况下,确定所述文字内容为所述第一字幕信息,
所述确定第一字幕子区域的位置信息步骤包括:
根据所述文字内容与所述视频帧图像的对应关系,确定所述第一字幕段的所述位置信息。
8.根据权利要求1至7中任一项所述的方法,其特征在于,在在视频编辑界面的第一字幕区域显示基于所述第一文字信息生成的第一字幕信息之后,所述方法还包括:
响应于作用在第一目标字幕子区域上的第三预定操作,所述第一目标字幕子区域的起始位置从初始位置变更至预定位置。
9.根据权利要求1至7中任一项所述的方法,其特征在于,在在视频编辑界面的第一字幕区域显示基于所述第一文字信息生成的第一字幕信息之后,所述方法还包括:
响应于作用在第二目标字幕子区域上的第四预定操作,所述第二目标字幕子区域的长度从初始长度变为预定长度。
10.根据权利要求1至7中任一项所述的方法,其特征在于,在在视频编辑界面的第一字幕区域显示基于所述第一文字信息生成的第一字幕信息之后,所述方法还包括:
响应于复制第二文字信息的第五预定操作,获取所述第二文字信息;
根据所述第二文字信息,在视频编辑界面的第二字幕区域显示第二字幕信息,所述第二字幕区域位于所述第一字幕区域的一侧。
11.一种自动加载字幕的方法,其特征在于,包括:
检测是否存在用于复制第一文字信息的第一预定操作;
在检测到所述第一预定操作的情况下,获取所述第一文字信息;
基于所述第一文字信息生成第一字幕信息,并在视频编辑界面的字幕区域显示所述第一字幕信息,
所述基于所述第一文字信息生成第一字幕信息,并在视频编辑界面的字幕区域显示所述第一字幕信息步骤包括:
根据所述第一文字信息确定所述第一字幕信息;
在第一字幕区域显示所述第一字幕信息,
所述根据所述第一文字信息确定所述第一字幕信息步骤包括:
确定所述第一文字信息按照预定方式显示的预定时长是否小于正在编辑的所述视频的时长;
在所述预定时长小于所述视频的时长的情况下,将所述第一文字信息与字幕数据库中的预定字幕段进行比较,其中,所述字幕数据库包括多个所述预定字幕段;
在所述第一文字信息与目标部分的相似度大于第一预定阈值的情况下,根据正在编辑的所述视频的长度,确定目标字幕段的包括所述目标部分的至少部分为所述第一字幕信息,其中,所述目标部分为所述目标字幕段中与所述第一文字信息的预定时长相同的部分,所述目标字幕段为多个所述预定字幕段中包括所述目标部分的一个。
12.一种自动加载字幕的方法,其特征在于,包括:
在对目标视频进行编辑时,从用于存储文本信息的内存区域中获取第一文本信息,其中,所述内存区域用于存储通过对目标文本进行复制操作得到的文本信息;
基于所述第一文本信息生成第一字幕信息,并在视频编辑界面的第一字幕区域展示所述第一字幕信息,
所述基于所述第一文本 信息生成第一字幕信息,并在视频编辑界面的字幕区域显示所述第一字幕信息步骤包括:
根据第一文字信息确定所述第一字幕信息;
在所述第一字幕区域显示所述第一字幕信息,
所述根据所述第一文字信息确定所述第一字幕信息步骤包括:
确定所述第一文字信息按照预定方式显示的预定时长是否小于正在编辑的所述视频的时长;
在所述预定时长小于所述视频的时长的情况下,将所述第一文字信息与字幕数据库中的预定字幕段进行比较,其中,所述字幕数据库包括多个所述预定字幕段;
在所述第一文字信息与目标部分的相似度大于第一预定阈值的情况下,根据正在编辑的所述视频的长度,确定目标字幕段的包括所述目标部分的至少部分为所述第一字幕信息,其中,所述目标部分为所述目标字幕段中与所述第一文字信息的预定时长相同的部分,所述目标字幕段为多个所述预定字幕段中包括所述目标部分的一个。
13.一种自动加载字幕的装置,其特征在于,包括:
第一获取单元,被配置为执行响应于用于复制第一文字信息的第一预定操作,获取所述第一文字信息;
第一显示单元,被配置为在视频编辑界面的第一字幕区域显示基于所述第一文字信息生成的第一字幕信息,
上述第一显示单元包括确定模块和第二显示模块,其中,确定模块被配置为根据上述第一文字信息确定上述第一字幕信息;第二显示模块被配置为在上述第一字幕区域显示上述第一字幕信息,
确定模块还包括第一确定子模块、第二确定子模块和第三确定子模块,其中,第一确定子模块被配置为确定上述第一文字信息按照预定方式显示的预定时长是否小于正在编辑的上述视频的时长;第二确定子模块被配置为在上述预定时长小于上述视频的时长的情况下,将上述第一文字信息与字幕数据库中的预定字幕段进行比较,其中,上述字幕数据库包括多个上述预定字幕段;第三确定子模块被配置为在上述第一文字信息与目标部分的相似度大于第一预定阈值的情况下,根据正在编辑的上述视频的长度,确定目标字幕段的包括上述目标部分的至少部分为上述第一字幕信息,其中,上述目标部分为上述目标字幕段中与上述第一文字信息的预定时长相同的一部分,上述目标字幕段为多个上述预定字幕段中包括上述目标部分的一个。
14.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至12中任一项所述的自动加载字幕的方法。
15.一种非易失性存储介质,其特征在于,当所述非易失性存储介质中的指令由电子设的处理器执行时,使得电子设备能够执行如权利要求1至12中任一项所述的自动加载字幕的方法。
CN202011367465.2A 2020-11-27 2020-11-27 自动加载字幕的方法 Active CN112988005B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011367465.2A CN112988005B (zh) 2020-11-27 2020-11-27 自动加载字幕的方法
PCT/CN2021/107903 WO2022110844A1 (zh) 2020-11-27 2021-07-22 自动加载字幕的方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011367465.2A CN112988005B (zh) 2020-11-27 2020-11-27 自动加载字幕的方法

Publications (2)

Publication Number Publication Date
CN112988005A CN112988005A (zh) 2021-06-18
CN112988005B true CN112988005B (zh) 2023-02-28

Family

ID=76344834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011367465.2A Active CN112988005B (zh) 2020-11-27 2020-11-27 自动加载字幕的方法

Country Status (2)

Country Link
CN (1) CN112988005B (zh)
WO (1) WO2022110844A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112988005B (zh) * 2020-11-27 2023-02-28 北京达佳互联信息技术有限公司 自动加载字幕的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106303659A (zh) * 2016-08-22 2017-01-04 暴风集团股份有限公司 在播放器中加载图文字幕的方法及***
CN106775336A (zh) * 2016-11-30 2017-05-31 努比亚技术有限公司 一种内容复制处理方法、装置及终端
CN107170452A (zh) * 2017-04-27 2017-09-15 广东小天才科技有限公司 一种电子会议的加入方法及装置
CN107992210A (zh) * 2017-10-11 2018-05-04 捷开通讯(深圳)有限公司 输入法词汇推荐方法、智能终端及具有存储功能的装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102752552A (zh) * 2011-09-23 2012-10-24 新奥特(北京)视频技术有限公司 一种在文稿中添加字幕的方法及***
EP2662836A1 (en) * 2012-05-09 2013-11-13 NI Group Limited A method of publishing digital content
CN105657395A (zh) * 2015-08-17 2016-06-08 乐视致新电子科技(天津)有限公司 一种3d视频的字幕播放方法及装置
CN111565330A (zh) * 2020-07-13 2020-08-21 北京美摄网络科技有限公司 一种同步字幕的添加方法及装置、电子设备、存储介质
CN112988005B (zh) * 2020-11-27 2023-02-28 北京达佳互联信息技术有限公司 自动加载字幕的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106303659A (zh) * 2016-08-22 2017-01-04 暴风集团股份有限公司 在播放器中加载图文字幕的方法及***
CN106775336A (zh) * 2016-11-30 2017-05-31 努比亚技术有限公司 一种内容复制处理方法、装置及终端
CN107170452A (zh) * 2017-04-27 2017-09-15 广东小天才科技有限公司 一种电子会议的加入方法及装置
CN107992210A (zh) * 2017-10-11 2018-05-04 捷开通讯(深圳)有限公司 输入法词汇推荐方法、智能终端及具有存储功能的装置

Also Published As

Publication number Publication date
WO2022110844A1 (zh) 2022-06-02
CN112988005A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
CN109344241B (zh) 信息的推荐方法、装置、终端及存储介质
JP7477028B2 (ja) デバイス上でのメッセージ管理とドキュメント生成のためのプログラム、方法、及びデバイス
CN111970577B (zh) 字幕编辑方法、装置和电子设备
US20130268826A1 (en) Synchronizing progress in audio and text versions of electronic books
CN111539188B (zh) 笔记生成方法、计算设备及计算机存储介质
US10777096B2 (en) System for assisting in foreign language learning
CN109005283B (zh) 显示通知消息的方法、装置、终端及存储介质
US11924485B2 (en) Method and system of displaying a video
CN108427589B (zh) 一种数据处理方法及电子设备
CN110287465B (zh) 文本处理方法、装置、设备及存储介质
CN111935529B (zh) 教育类音视频资源的播放方法、设备及存储介质
CN113286201B (zh) 推荐信息展示方法、装置、电子设备和存储介质
Shin et al. Roslingifier: Semi-automated storytelling for animated scatterplots
US11388132B1 (en) Automated social media replies
CN112988005B (zh) 自动加载字幕的方法
Chi et al. DemoWiz: re-performing software demonstrations for a live presentation
US20170004859A1 (en) User created textbook
CN109871257B (zh) 一种页面元素显示方法、装置及设备
CN111954076A (zh) 资源显示方法、装置及电子设备
US20230054388A1 (en) Method and apparatus for presenting audiovisual work, device, and medium
CN103631872A (zh) 一种多媒体文件播放方法及电子终端
EP4099711A1 (en) Method and apparatus and storage medium for processing video and timing of subtitles
CN106933443B (zh) 一种电子书数据处理的方法、装置及电子书阅读器
CN115640783A (zh) 用于文档内容显示的方法、装置、设备和存储介质
CN115048949A (zh) 基于术语库的多语言文字替换方法、***、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant