CN104795083A - 一种信息处理方法和电子设备 - Google Patents

一种信息处理方法和电子设备 Download PDF

Info

Publication number
CN104795083A
CN104795083A CN201510216845.9A CN201510216845A CN104795083A CN 104795083 A CN104795083 A CN 104795083A CN 201510216845 A CN201510216845 A CN 201510216845A CN 104795083 A CN104795083 A CN 104795083A
Authority
CN
China
Prior art keywords
captions
sentence
moment
time shaft
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510216845.9A
Other languages
English (en)
Other versions
CN104795083B (zh
Inventor
吴冰
盛莲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201510216845.9A priority Critical patent/CN104795083B/zh
Publication of CN104795083A publication Critical patent/CN104795083A/zh
Application granted granted Critical
Publication of CN104795083B publication Critical patent/CN104795083B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Studio Circuits (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本申请公开的信息处理方法和电子设备,在多媒体文件开始播放后捕捉其语音信息,并在目标语音句被捕捉时实时获取其所对应的起始播放时刻;之后,基于所述起始播放时刻,对字幕文件的字幕时间轴进行调整,最终依据调整后所得的正确时间轴对字幕文件进行显示控制,实现字幕与多媒体文件语音信息的同步播放。可见,应用本申请无需采用手动方式解决字幕与视频语音的同步问题,较为省时省力,提升了用户体验。

Description

一种信息处理方法和电子设备
技术领域
本发明属于多媒体信息处理技术领域,尤其涉及一种信息处理方法和电子设备。
背景技术
视频文件可能会存在不带字幕的现象,例如,用户待观看的外文电影视频没有自带字幕。
基于此,为了更加顺畅地观看、理解视频内容,用户需下载一个与待观看视频相对应的字幕文件,然而,同一内容的视频文件可能会有多个版本,如枪版、DVD(Digital Versatile Disc,数字通用光盘)、蓝光等,不同版本会因发行商、广告等不同而导致视频片头的时间跨度不同,从而,当用户使用下载的字幕文件与视频文件进行匹配播放时,往往会产生字幕与视频语音不同步的现象。目前,仅能通过手动方式对字幕文件的时间轴进行调整,以解决字幕与视频语音的同步问题,该方式费时费力,降低了用户体验。
发明内容
有鉴于此,本发明的目的在于提供一种信息处理方法和电子设备,以解决现有技术因采用手动方式解决字幕与视频语音的同步问题,而导致费时费力,用户体验度低的问题。
为此,本发明公开如下技术方案:
一种信息处理方法,应用于具有多媒体文件播放功能的电子设备,所述多媒体文件对应一字幕文件,所述字幕文件包括第一字幕时间轴及按时序排列的N条字幕句,第一字幕时间轴包括各字幕句的起始显示时刻及终止显示时刻,N为自然数;所述方法包括:
捕捉所播放的多媒体文件的语音信息,并在目标语音句被捕捉时实时获取目标语音句对应的起始播放时刻;
基于所述起始播放时刻,对所述第一字幕时间轴进行调整,得到第二字幕时间轴;
依据所述第二字幕时间轴对字幕文件进行显示控制,以实现字幕与多媒体文件语音信息的同步播放。
上述方法,优选的,所述目标语音句为多媒体文件的第一条语音句;则所述基于所述起始播放时刻,对所述第一字幕时间轴进行调整,得到第二字幕时间轴包括:
计算目标语音句的起始播放时刻与第一目标字幕句的起始显示时刻之间的第一时间差,其中,所述第一目标字幕句为第一字幕时间轴上起始显示时刻最早的字幕句;
基于所述第一时间差,对第一字幕时间轴上N条字幕句的起始显示时刻、终止显示时刻进行调整,得到第二字幕时间轴。
上述方法,优选的,所述基于所述第一时间差,对第一字幕时间轴上N条字幕句的起始显示时刻、终止显示时刻进行调整,得到第二字幕时间轴为:
将第一字幕时间轴上N条字幕句的起始显示时刻、终止显示时刻,分别与所述第一时间差进行求和运算,得到第二字幕时间轴。
上述方法,优选的,所述依据所述第二字幕时间轴对字幕文件进行显示控制为:
依据所述第二字幕时间轴提供的每条字幕句的起始显示时刻及终止显示时刻,对字幕文件中的每条字幕句分别进行显示控制。
上述方法,优选的,所述目标语音句为多媒体文件中当前开始播放的语音句;则所述基于所述起始播放时刻,对所述第一字幕时间轴进行调整,得到第二字幕时间轴包括:
计算目标语音句的起始播放时刻与第二目标字幕句的起始显示时刻之间的第二时间差,所述第二目标字幕句为字幕文件内未播放显示的各字幕句中起始显示时刻最早的字幕句;
基于所述第二时间差,对所述第二目标字幕句在第一字幕时间轴上的起始显示时刻及终止显示时刻进行调整,得到第二字幕时间轴。
上述方法,优选的,所述基于所述第二时间差,对所述第二目标字幕句在第一字幕时间轴上的起始显示时刻及终止显示时刻进行调整,得到第二字幕时间轴为:
将所述第二目标字幕句的起始显示时刻及终止显示时刻,分别与所述第二时间差进行求和运算,得到第二字幕时间轴。
上述方法,优选的,所述依据所述第二字幕时间轴对字幕文件进行显示控制为:
依据所述第二字幕时间轴提供的第二目标字幕句的起始显示时刻及终止显示时刻,对所述第二目标字幕句进行显示控制。
一种电子设备,具有多媒体文件播放功能,所述多媒体文件对应一字幕文件,所述字幕文件包括第一字幕时间轴及按时序排列的N个字幕句,第一字幕时间轴包括各字幕句的起始显示时刻及终止显示时刻,N为自然数;所述电子设备包括:
捕捉模块,用于捕捉所播放的多媒体文件的语音信息,并在目标语音句被捕捉时实时获取目标语音句对应的起始播放时刻;
调整模块,用于基于所述起始播放时刻,对所述第一字幕时间轴进行调整,得到第二字幕时间轴;
控制模块,用于依据所述第二字幕时间轴对字幕文件进行显示控制,以实现字幕与多媒体文件语音信息的同步播放。
上述电子设备,优选的,所述目标语音句为多媒体文件的第一条语音句;则所述调整模块包括:
第一计算单元,用于计算目标语音句的起始播放时刻与第一目标字幕句的起始显示时刻之间的第一时间差,其中,所述第一目标字幕句为第一字幕时间轴上起始显示时刻最早的字幕句;
第一调整单元,用于基于所述第一时间差,对第一字幕时间轴上N条字幕句的起始显示时刻、终止显示时刻进行调整,得到第二字幕时间轴。
上述电子设备,优选的,所述第一调整单元为:
第一和运算单元,用于将第一字幕时间轴上N条字幕句的起始显示时刻、终止显示时刻,分别与所述第一时间差进行求和运算,得到第二字幕时间轴。
上述电子设备,优选的,所述控制模块为:
第一控制单元,用于依据所述第二字幕时间轴提供的每条字幕句的起始显示时刻及终止显示时刻,对字幕文件中的每条字幕句分别进行显示控制。
上述电子设备,优选的,所述目标语音句为多媒体文件中当前开始播放的语音句;则所述调整模块包括:
第二计算单元,用于计算目标语音句的起始播放时刻与第二目标字幕句的起始显示时刻之间的第二时间差,所述第二目标字幕句为字幕文件内未播放显示的各字幕句中起始显示时刻最早的字幕句;
第二调整单元,用于基于所述第二时间差,对所述第二目标字幕句在第一字幕时间轴上的起始显示时刻及终止显示时刻进行调整,得到第二字幕时间轴。
上述电子设备,优选的,所述第二调整单元为:
第二和运算单元,用于将所述第二目标字幕句的起始显示时刻及终止显示时刻,分别与所述第二时间差进行求和运算,得到第二字幕时间轴。
上述电子设备,优选的,所述控制模块为:
第二控制单元,用于依据所述第二字幕时间轴提供的第二目标字幕句的起始显示时刻及终止显示时刻,对所述第二目标字幕句进行显示控制。
由以上方案可知,本申请公开的信息处理方法和电子设备,在多媒体文件开始播放后捕捉其语音信息,并在目标语音句被捕捉时实时获取其所对应的起始播放时刻;之后,基于所述起始播放时刻,对字幕文件的字幕时间轴进行调整,最终依据调整后所得的正确时间轴对字幕文件进行显示控制,实现字幕与多媒体文件语音信息的同步播放。可见,应用本申请无需采用手动方式解决字幕与视频语音的同步问题,较为省时省力,提升了用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本申请提供的一种信息处理方法实施例一的流程图;
图2是本申请提供的一种信息处理方法实施例二的流程图;
图3是本申请提供的一种信息处理方法实施例三的流程图;
图4是本申请提供的一种信息处理方法实施例四的流程图;
图5是本申请提供的一种信息处理方法实施例五的流程图;
图6是本申请提供的一种电子设备实施例六的结构示意图;
图7是本申请提供的一种电子设备实施例七的结构示意图;
图8是本申请提供的一种电子设备实施例八的结构示意图;
图9是本申请提供的一种电子设备实施例九的结构示意图;
图10是本申请提供的一种电子设备实施例十的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
参考图1,图1为本申请提供的一种信息处理方法实施例一的流程图,所述方法应用于具有多媒体文件播放功能的电子设备,所述多媒体文件对应一字幕文件,该字幕文件包括第一字幕时间轴及按时序排列的N条字幕句,第一字幕时间轴包括各字幕句的起始显示时刻及终止显示时刻,N为自然数。
如图1所示,所述方法可以包括以下步骤:
S101:捕捉所播放的多媒体文件的语音信息,并在目标语音句被捕捉时实时获取目标语音句对应的起始播放时刻。
其中,具体可通过在电子设备中加装音频接收器,来实时接收多媒体文件播放时所发出的音频,并通过语音识别技术从接收的音频中(可能包括如背景音乐等各种音频)捕捉其中的语音信息,如捕捉人物对话或歌唱时的语音等。
在捕捉到目标语音句时,例如多媒体文件的第一条语音、或当前开始播放的第k(大于1的自然数)条语音等,同时获取该目标语音句所对应的起始播放时刻,其中,所述目标语音句的起始播放时刻以多媒体文件的起始播放时刻为零点参考点。
在本申请其他实施例中,还可以在多媒体文件开始播放后,直接获取其音频文件,并依据预先设定的语音信息识别规则,譬如依据语音音频曲线形态与其他音频(如背景音乐)曲线形态的不同,从所述音频文件提供的音频曲线中识别出目标语音句的音频曲线,实现目标语音句的捕捉。其中,第x(自然数)条语音句具体对应从音频文件中顺次识别出的第x条语音音频曲线,同时,根据音频文件中音频曲线与播放时间的对应关系,获取目标语音句的起始播放时刻。
S102:基于所述起始播放时刻,对所述第一字幕时间轴进行调整,得到第二字幕时间轴。
在字幕文件的字幕时间轴与多媒体文件的音频时间轴不对应的情况下,可将音频文件中语音句的实际播放时刻作为调整依据,对字幕时间轴进行相应调整。
上一步骤所获取的目标语音句的起始播放时刻,即为多媒体文件播放过程中开始播放所述目标语音句的实际时刻,因此,具体可依据所捕捉语音句的起始播放时刻对字幕时间轴进行相应调整,以得到正确的字幕时间轴。
S103:依据所述第二字幕时间轴对字幕文件进行显示控制,以实现字幕与多媒体文件语音信息的同步播放。
得到正确的字幕时间轴之后,可基于字幕时间轴上所标示的字幕播放时刻,对字幕文件中的字幕进行显示控制,最终实现了字幕与多媒体文件语音信息的同步播放。
由以上方案可知,本申请公开的信息处理方法,在多媒体文件开始播放后捕捉其语音信息,并在目标语音句被捕捉时实时获取其所对应的起始播放时刻;之后,基于所述起始播放时刻,对字幕文件的字幕时间轴进行调整,最终依据调整后所得的正确时间轴对字幕文件进行显示控制,实现字幕与多媒体文件语音信息的同步播放。可见,应用本申请无需采用手动方式解决字幕与视频语音的同步问题,较为省时省力,提升了用户体验。
实施例二
参考图2,图2为本申请提供的一种信息处理方法实施例二的流程图,本实施例中,所述目标语音句为多媒体文件的第一条语音句,则如图2所示,所述步骤S102可以通过以下步骤实现:
S201:计算目标语音句的起始播放时刻与第一目标字幕句的起始显示时刻之间的第一时间差,其中,所述第一目标字幕句为第一字幕时间轴上起始显示时刻最早的字幕句;
S202:基于所述第一时间差,对第一字幕时间轴上N条字幕句的起始显示时刻、终止显示时刻进行调整,得到第二字幕时间轴。
本实施例适用于字幕时间轴上各字幕句的起始、终止显示时刻整体提前或延后相同时长的应用场景,即字幕文件中,每条字幕句的起始、终止显示时刻与音频文件中相对应语音句的起始、终止播放时刻间的时间差均相同,譬如,相对于音频文件中语音句的起始、终止播放时刻,字幕文件中每条字幕句的起始、终止显示时刻均向后延迟5s。
上述应用场景中,由于字幕文件各字幕句的显示时刻整体提前或延后相同时间,因此,仅需获取多媒体文件中第一条语音句的起始播放时刻与字幕文件中第一条字幕句的起始显示时刻之间的时间差,之后,可依据该时间差对字幕时间轴进行一次性地整体调整,具体地,可通过将字幕时间轴上每条字幕句的起始、终止显示时刻与所述时间差进行求和运算,得到每条字幕句的正确显示时刻,以实现字幕时间轴与音频时间轴的相互对应。
实施例三
参考图3,图3为本申请提供的一种信息处理方法实施例三的流程图,本实施例基于实施例二所描述的方案,如图3所示,本实施例中所述步骤S103具体可通过以下步骤实现:
S301:依据所述第二字幕时间轴提供的每条字幕句的起始显示时刻及终止显示时刻,对字幕文件中的每条字幕句分别进行显示控制。
基于实施例二的描述可知,在利用所述时间差对字幕时间轴进行一次性整体调整后,字幕时间轴上每条字幕句的显示时刻均为正确时刻,因此,本实施例利用调整后的字幕时间轴(即所述第二字幕时间轴)对各条字幕句分别进行显示控制,最终实现了字幕与多媒体文件语音信息的同步播放。
实施例四
参考图4,图4为本申请提供的一种信息处理方法实施例四的流程图,本实施例中,所述目标语音句为多媒体文件中当前开始播放的语音句;则如图4所示,所述步骤S102可以通过以下步骤实现:
S401:计算目标语音句的起始播放时刻与第二目标字幕句的起始显示时刻之间的第二时间差,所述第二目标字幕句为字幕文件内未播放显示的各字幕句中起始显示时刻最早的字幕句;
S402:基于所述第二时间差,对所述第二目标字幕句在第一字幕时间轴上的起始显示时刻及终止显示时刻进行调整,得到第二字幕时间轴。
本实施例适用于字幕时间轴上各字幕句的起始、终止显示时刻分别提前或延后不同时长的应用场景,即字幕文件中,各条字幕句的起始、终止显示时刻与音频文件中相对应语音句的起始、终止播放时刻间的时间差不尽相同,譬如,相对于音频文件中语音句的起始、终止播放时刻,字幕文件中某些字幕句的起始、终止显示时刻向后延迟5s、某些字幕句的起始、终止显示时刻向后延迟3s,而另一些字幕句的起始、终止显示时刻则提前1s等等。
上述应用场景中,由于字幕文件中各字幕句的显示时刻提前或延后的时长不尽相同,因此,需基于每条字幕句提前或延后的实际情况,对每条字幕句进行区别化调整,具体地,需捕捉每条语音句,并计算每条语音句的起始播放时刻与字幕文件中相应字幕句的起始显示时刻间的时间差,并基于该时间差对所述字幕句的起始、终止显示时刻进行调整。
本实施例中,每捕捉一条语音句,均需进行一次调整,区别于实施例二的一次性整体调整,本实施例的场景需通过多次调整才能最终得到正确的时间轴。
需要说明的是,本申请提供的两种应用场景中,在字幕文件的字幕时间轴上,各字幕句显示时刻的先后次序并未产生紊乱,即每条字幕句的显示次序与其在多媒体文件中所对应语音句的播放次序一致,因此,应用本申请时,可按播放时间的先后次序捕捉语音句,并按序顺次从字幕文件中获取所捕捉的语音句相对应的字幕句,第x(自然数)条语音句具体对应从字幕文件中顺次获取的第x条字幕句,从而,实施例二中捕捉的第一条语音句对应于字幕时间轴上起始显示时刻最早的字幕句,本实施例中,所捕捉的当前语音句对应于字幕文件内未播放显示的各字幕句中起始显示时刻最早的字幕句。
实施例五
参考图5,图5为本申请提供的一种信息处理方法实施例五的流程图,本实施例基于实施例四所描述的方案,如图5所示,本实施例中所述步骤S103具体可通过以下步骤实现:
S501:依据所述第二字幕时间轴提供的第二目标字幕句的起始显示时刻及终止显示时刻,对所述第二目标字幕句进行显示控制。
实施例四提供的应用场景中,由于字幕文件中各字幕句的显示时刻提前或延后的时长不尽相同,因此,在捕捉到当前语音句,并依据当前语音句的起始播放时刻对字幕时间轴进行调整后,并不能得到整体正确的时间轴,如显示时刻在当前所调整字幕句的显示时刻之后的字幕句仍未调整。
基于此,本实施例仅依据本次调整后所得的当前字幕句的显示时刻,对当前字幕句进行显示控制,以实现当前字幕句与当前语音句的同步播放。而其他字幕句则需在其显示时刻进行按需调整后,才能被控制显示。
实施例六
参考图6,图6为本申请提供的一种电子设备实施例六的结构示意图,所述电子设备具有多媒体文件播放功能,所述多媒体文件对应一字幕文件,该字幕文件包括第一字幕时间轴及按时序排列的N条字幕句,第一字幕时间轴包括各字幕句的起始显示时刻及终止显示时刻,N为自然数。
如图6所示,所述电子设备可以包括捕捉模块100、调整模块200和控制模块300。
捕捉模块100,用于捕捉所播放的多媒体文件的语音信息,并在目标语音句被捕捉时实时获取目标语音句对应的起始播放时刻。
其中,具体可通过在电子设备中加装音频接收器,来实时接收多媒体文件播放时所发出的音频,并通过语音识别技术从接收的音频中(可能包括如背景音乐等各种音频)捕捉其中的语音信息,如捕捉人物对话或歌唱时的语音等。。
在捕捉到目标语音句时,例如多媒体文件的第一条语音、或当前开始播放的第k(大于1的自然数)条语音等,同时获取该目标语音句所对应的起始播放时刻,其中,所述目标语音句的起始播放时刻以多媒体文件的起始播放时刻为零点参考点。
在本申请其他实施例中,还可以在多媒体文件开始播放后,直接获取其音频文件,并依据预先设定的语音信息识别规则,譬如依据语音音频曲线形态与其他音频(如背景音乐)曲线形态的不同,从所述音频文件提供的音频曲线中识别出目标语音句的音频曲线,实现目标语音句的捕捉。其中,第x(自然数)条语音句具体对应从音频文件中顺次识别出的第x条语音音频曲线,同时,根据音频文件中音频曲线与播放时间的对应关系,获取目标语音句的起始播放时刻。
调整模块200,用于基于所述起始播放时刻,对所述第一字幕时间轴进行调整,得到第二字幕时间轴。
在字幕文件的字幕时间轴与多媒体文件的音频时间轴不对应的情况下,可将音频文件中语音句的实际播放时刻作为调整依据,对字幕时间轴进行相应调整。
上一模块所获取的目标语音句的起始播放时刻,即为多媒体文件播放过程中开始播放所述目标语音句的实际时刻,因此,具体可依据所捕捉语音句的起始播放时刻对字幕时间轴进行相应调整,以得到正确的字幕时间轴。
控制模块300,用于依据所述第二字幕时间轴对字幕文件进行显示控制,以实现字幕与多媒体文件语音信息的同步播放。
得到正确的字幕时间轴之后,可基于字幕时间轴上所标示的字幕播放时刻,对字幕文件中的字幕进行显示控制,最终实现了字幕与多媒体文件语音信息的同步播放。
由以上方案可知,本申请公开的电子设备,在多媒体文件开始播放后捕捉其语音信息,并在目标语音句被捕捉时实时获取其所对应的起始播放时刻;之后,基于所述起始播放时刻,对字幕文件的字幕时间轴进行调整,最终依据调整后所得的正确时间轴对字幕文件进行显示控制,实现字幕与多媒体文件语音信息的同步播放。可见,应用本申请无需采用手动方式解决字幕与视频语音的同步问题,较为省时省力,提升了用户体验。
实施例七
参考图7,图7为本申请提供的一种电子设备实施例七的结构示意图,本实施例中,所述目标语音句为多媒体文件的第一条语音句,则如图7所示,所述调整模块200包括第一计算单元201和第一调整单元202。
第一计算单元201,用于计算目标语音句的起始播放时刻与第一目标字幕句的起始显示时刻之间的第一时间差,其中,所述第一目标字幕句为第一字幕时间轴上起始显示时刻最早的字幕句;
第一调整单元202,用于基于所述第一时间差,对第一字幕时间轴上N条字幕句的起始显示时刻、终止显示时刻进行调整,得到第二字幕时间轴。
其中,所述第一调整单元具体为第一和运算单元,用于将第一字幕时间轴上N条字幕句的起始显示时刻、终止显示时刻,分别与所述第一时间差进行求和运算,得到第二字幕时间轴。
本实施例适用于字幕时间轴上各字幕句的起始、终止显示时刻整体提前或延后相同时长的应用场景,即字幕文件中,每条字幕句的起始、终止显示时刻与音频文件中相对应语音句的起始、终止播放时刻间的时间差均相同,譬如,相对于音频文件中语音句的起始、终止播放时刻,字幕文件中每条字幕句的起始、终止显示时刻均向后延迟5s。
上述应用场景中,由于字幕文件各字幕句的显示时刻整体提前或延后相同时间,因此,仅需获取多媒体文件中第一条语音句的起始播放时刻与字幕文件中第一条字幕句的起始显示时刻之间的时间差,之后,可依据该时间差对字幕时间轴进行一次性地整体调整,具体地,可通过将字幕时间轴上每条字幕句的起始、终止显示时刻与所述时间差进行求和运算,得到每条字幕句的正确显示时刻,以实现字幕时间轴与音频时间轴的相互对应。
实施例八
参考图8,图8为本申请提供的一种电子设备实施例八的结构示意图,本实施例基于实施例七所描述的方案,如图8所示,本实施例中所述控制模块300具体为第一控制单元301,用于依据所述第二字幕时间轴提供的每条字幕句的起始显示时刻及终止显示时刻,对字幕文件中的每条字幕句分别进行显示控制。
基于实施例七的描述可知,在利用所述时间差对字幕时间轴进行一次性整体调整后,字幕时间轴上每条字幕句的显示时刻均为正确时刻,因此,本实施例利用调整后的字幕时间轴(即所述第二字幕时间轴)对各条字幕句分别进行显示控制,最终实现了字幕与多媒体文件语音信息的同步播放。
实施例九
参考图9,图9为本申请提供的一种电子设备实施例九的结构示意图,本实施例中,所述目标语音句为多媒体文件中当前开始播放的语音句;则如图9所示,所述调整模块200包括第二计算单元203和第二调整单元204。
第二计算单元203,用于计算目标语音句的起始播放时刻与第二目标字幕句的起始显示时刻之间的第二时间差,所述第二目标字幕句为字幕文件内未播放显示的各字幕句中起始显示时刻最早的字幕句;
第二调整单元204,用于基于所述第二时间差,对所述第二目标字幕句在第一字幕时间轴上的起始显示时刻及终止显示时刻进行调整,得到第二字幕时间轴。
其中,第二调整单元204具体为第二和运算单元,用于将所述第二目标字幕句的起始显示时刻及终止显示时刻,分别与所述第二时间差进行求和运算,得到第二字幕时间轴。
本实施例适用于字幕时间轴上各字幕句的起始、终止显示时刻分别提前或延后不同时长的应用场景,即字幕文件中,各条字幕句的起始、终止显示时刻与音频文件中相对应语音句的起始、终止播放时刻间的时间差不尽相同,譬如,相对于音频文件中语音句的起始、终止播放时刻,字幕文件中某些字幕句的起始、终止显示时刻向后延迟5s、某些字幕句的起始、终止显示时刻向后延迟3s,而另一些字幕句的起始、终止显示时刻则提前1s等等。
上述应用场景中,由于字幕文件中各字幕句的显示时刻提前或延后的时长不尽相同,因此,需基于每条字幕句提前或延后的实际情况,对每条字幕句进行区别化调整,具体地,需捕捉每条语音句,并计算每条语音句的起始播放时刻与字幕文件中相应字幕句的起始显示时刻间的时间差,并基于该时间差对所述字幕句的起始、终止显示时刻进行调整。
本实施例中,每捕捉一条语音句,均需进行一次调整,区别于实施例二的一次性整体调整,本实施例的场景需通过多次调整才能最终得到正确的时间轴。
需要说明的是,本申请提供的两种应用场景中,在字幕文件的字幕时间轴上,各字幕句显示时刻的先后次序并未产生紊乱,即每条字幕句的显示次序与其在多媒体文件中所对应语音句的播放次序一致,因此,应用本申请时,可按播放时间的先后次序捕捉语音句,并按序顺次从字幕文件中获取所捕捉的语音句相对应的字幕句,第x(自然数)条语音句具体对应从字幕文件中顺次获取的第x条字幕句,从而,实施例七中捕捉的第一条语音句对应于字幕时间轴上起始显示时刻最早的字幕句,本实施例中,所捕捉的当前语音句对应于字幕文件内未播放显示的各字幕句中起始显示时刻最早的字幕句。
实施例十
参考图10,图10为本申请提供的一种电子设备实施例十的结构示意图,本实施例基于实施例九所描述的方案,如图10所示,本实施例中所述控制模块300具体为第二控制单元302,用于依据所述第二字幕时间轴提供的第二目标字幕句的起始显示时刻及终止显示时刻,对所述第二目标字幕句进行显示控制。
实施例九提供的应用场景中,由于字幕文件中各字幕句的显示时刻提前或延后的时长不尽相同,因此,在捕捉到当前语音句,并依据当前语音句的起始播放时刻对字幕时间轴进行调整后,并不能得到整体正确的时间轴,如显示时刻在当前所调整字幕句的显示时刻之后的字幕句仍未调整。
基于此,本实施例仅依据本次调整后所得的当前字幕句的显示时刻,对当前字幕句进行显示控制,以实现当前字幕句与当前语音句的同步播放。而其他字幕句则需在其显示时刻进行按需调整后,才能被控制显示。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
为了描述的方便,描述以上***时以功能分为各种模块或单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
最后,还需要说明的是,在本文中,诸如第一、第二、第三和第四等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (14)

1.一种信息处理方法,其特征在于,应用于具有多媒体文件播放功能的电子设备,所述多媒体文件对应一字幕文件,所述字幕文件包括第一字幕时间轴及按时序排列的N条字幕句,第一字幕时间轴包括各字幕句的起始显示时刻及终止显示时刻,N为自然数;所述方法包括:
捕捉所播放的多媒体文件的语音信息,并在目标语音句被捕捉时实时获取目标语音句对应的起始播放时刻;
基于所述起始播放时刻,对所述第一字幕时间轴进行调整,得到第二字幕时间轴;
依据所述第二字幕时间轴对字幕文件进行显示控制,以实现字幕与多媒体文件语音信息的同步播放。
2.根据权利要求1所述的方法,其特征在于,所述目标语音句为多媒体文件的第一条语音句;则所述基于所述起始播放时刻,对所述第一字幕时间轴进行调整,得到第二字幕时间轴包括:
计算目标语音句的起始播放时刻与第一目标字幕句的起始显示时刻之间的第一时间差,其中,所述第一目标字幕句为第一字幕时间轴上起始显示时刻最早的字幕句;
基于所述第一时间差,对第一字幕时间轴上N条字幕句的起始显示时刻、终止显示时刻进行调整,得到第二字幕时间轴。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一时间差,对第一字幕时间轴上N条字幕句的起始显示时刻、终止显示时刻进行调整,得到第二字幕时间轴为:
将第一字幕时间轴上N条字幕句的起始显示时刻、终止显示时刻,分别与所述第一时间差进行求和运算,得到第二字幕时间轴。
4.根据权利要求3所述的方法,其特征在于,所述依据所述第二字幕时间轴对字幕文件进行显示控制为:
依据所述第二字幕时间轴提供的每条字幕句的起始显示时刻及终止显示时刻,对字幕文件中的每条字幕句分别进行显示控制。
5.根据权利要求1所述的方法,其特征在于,所述目标语音句为多媒体文件中当前开始播放的语音句;则所述基于所述起始播放时刻,对所述第一字幕时间轴进行调整,得到第二字幕时间轴包括:
计算目标语音句的起始播放时刻与第二目标字幕句的起始显示时刻之间的第二时间差,所述第二目标字幕句为字幕文件内未播放显示的各字幕句中起始显示时刻最早的字幕句;
基于所述第二时间差,对所述第二目标字幕句在第一字幕时间轴上的起始显示时刻及终止显示时刻进行调整,得到第二字幕时间轴。
6.根据权利要求5所述的方法,其特征在于,所述基于所述第二时间差,对所述第二目标字幕句在第一字幕时间轴上的起始显示时刻及终止显示时刻进行调整,得到第二字幕时间轴为:
将所述第二目标字幕句的起始显示时刻及终止显示时刻,分别与所述第二时间差进行求和运算,得到第二字幕时间轴。
7.根据权利要求6所述的方法,其特征在于,所述依据所述第二字幕时间轴对字幕文件进行显示控制为:
依据所述第二字幕时间轴提供的第二目标字幕句的起始显示时刻及终止显示时刻,对所述第二目标字幕句进行显示控制。
8.一种电子设备,其特征在于,具有多媒体文件播放功能,所述多媒体文件对应一字幕文件,所述字幕文件包括第一字幕时间轴及按时序排列的N个字幕句,第一字幕时间轴包括各字幕句的起始显示时刻及终止显示时刻,N为自然数;所述电子设备包括:
捕捉模块,用于捕捉所播放的多媒体文件的语音信息,并在目标语音句被捕捉时实时获取目标语音句对应的起始播放时刻;
调整模块,用于基于所述起始播放时刻,对所述第一字幕时间轴进行调整,得到第二字幕时间轴;
控制模块,用于依据所述第二字幕时间轴对字幕文件进行显示控制,以实现字幕与多媒体文件语音信息的同步播放。
9.根据权利要求8所述的电子设备,其特征在于,所述目标语音句为多媒体文件的第一条语音句;则所述调整模块包括:
第一计算单元,用于计算目标语音句的起始播放时刻与第一目标字幕句的起始显示时刻之间的第一时间差,其中,所述第一目标字幕句为第一字幕时间轴上起始显示时刻最早的字幕句;
第一调整单元,用于基于所述第一时间差,对第一字幕时间轴上N条字幕句的起始显示时刻、终止显示时刻进行调整,得到第二字幕时间轴。
10.根据权利要求9所述的电子设备,其特征在于,所述第一调整单元为:
第一和运算单元,用于将第一字幕时间轴上N条字幕句的起始显示时刻、终止显示时刻,分别与所述第一时间差进行求和运算,得到第二字幕时间轴。
11.根据权利要求10所述的电子设备,其特征在于,所述控制模块为:
第一控制单元,用于依据所述第二字幕时间轴提供的每条字幕句的起始显示时刻及终止显示时刻,对字幕文件中的每条字幕句分别进行显示控制。
12.根据权利要求8所述的电子设备,其特征在于,所述目标语音句为多媒体文件中当前开始播放的语音句;则所述调整模块包括:
第二计算单元,用于计算目标语音句的起始播放时刻与第二目标字幕句的起始显示时刻之间的第二时间差,所述第二目标字幕句为字幕文件内未播放显示的各字幕句中起始显示时刻最早的字幕句;
第二调整单元,用于基于所述第二时间差,对所述第二目标字幕句在第一字幕时间轴上的起始显示时刻及终止显示时刻进行调整,得到第二字幕时间轴。
13.根据权利要求12所述的电子设备,其特征在于,所述第二调整单元为:
第二和运算单元,用于将所述第二目标字幕句的起始显示时刻及终止显示时刻,分别与所述第二时间差进行求和运算,得到第二字幕时间轴。
14.根据权利要求13所述的电子设备,其特征在于,所述控制模块为:
第二控制单元,用于依据所述第二字幕时间轴提供的第二目标字幕句的起始显示时刻及终止显示时刻,对所述第二目标字幕句进行显示控制。
CN201510216845.9A 2015-04-30 2015-04-30 一种信息处理方法和电子设备 Active CN104795083B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510216845.9A CN104795083B (zh) 2015-04-30 2015-04-30 一种信息处理方法和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510216845.9A CN104795083B (zh) 2015-04-30 2015-04-30 一种信息处理方法和电子设备

Publications (2)

Publication Number Publication Date
CN104795083A true CN104795083A (zh) 2015-07-22
CN104795083B CN104795083B (zh) 2018-06-01

Family

ID=53559839

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510216845.9A Active CN104795083B (zh) 2015-04-30 2015-04-30 一种信息处理方法和电子设备

Country Status (1)

Country Link
CN (1) CN104795083B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105100647A (zh) * 2015-07-31 2015-11-25 深圳市金立通信设备有限公司 一种校正字幕的方法及终端
CN106792069A (zh) * 2015-11-19 2017-05-31 北京国双科技有限公司 多媒体文件播放方法及装置
WO2017107578A1 (zh) * 2015-12-22 2017-06-29 合一网络技术(北京)有限公司 流媒体与字幕即时同步显示、匹配处理方法、装置及***
CN108259963A (zh) * 2018-03-19 2018-07-06 成都星环科技有限公司 一种tv端播放器
CN109413475A (zh) * 2017-05-09 2019-03-01 北京嘀嘀无限科技发展有限公司 一种视频中字幕的调整方法、装置和服务器
CN111526414A (zh) * 2020-04-30 2020-08-11 青岛海信传媒网络技术有限公司 一种字幕显示方法及显示设备
CN116471436A (zh) * 2023-04-12 2023-07-21 央视国际网络有限公司 信息的处理方法及装置、存储介质、电子设备
CN116471435A (zh) * 2023-04-12 2023-07-21 央视国际网络有限公司 语音和字幕的调整方法和装置、电子设备、存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000041175A1 (en) * 1999-01-08 2000-07-13 Easy Softec Co., Ltd. Caption mp3 player having a caption display function, caption mp3 data format and method of reproducing caption mp3 data
CN101808202A (zh) * 2009-02-18 2010-08-18 联想(北京)有限公司 实现影音文件中声音与字幕同步的方法、设备和计算机

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000041175A1 (en) * 1999-01-08 2000-07-13 Easy Softec Co., Ltd. Caption mp3 player having a caption display function, caption mp3 data format and method of reproducing caption mp3 data
CN101808202A (zh) * 2009-02-18 2010-08-18 联想(北京)有限公司 实现影音文件中声音与字幕同步的方法、设备和计算机

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105100647A (zh) * 2015-07-31 2015-11-25 深圳市金立通信设备有限公司 一种校正字幕的方法及终端
CN106792069A (zh) * 2015-11-19 2017-05-31 北京国双科技有限公司 多媒体文件播放方法及装置
WO2017107578A1 (zh) * 2015-12-22 2017-06-29 合一网络技术(北京)有限公司 流媒体与字幕即时同步显示、匹配处理方法、装置及***
CN109413475A (zh) * 2017-05-09 2019-03-01 北京嘀嘀无限科技发展有限公司 一种视频中字幕的调整方法、装置和服务器
CN108259963A (zh) * 2018-03-19 2018-07-06 成都星环科技有限公司 一种tv端播放器
CN111526414A (zh) * 2020-04-30 2020-08-11 青岛海信传媒网络技术有限公司 一种字幕显示方法及显示设备
CN111526414B (zh) * 2020-04-30 2022-06-07 青岛海信传媒网络技术有限公司 一种字幕显示方法及显示设备
CN116471436A (zh) * 2023-04-12 2023-07-21 央视国际网络有限公司 信息的处理方法及装置、存储介质、电子设备
CN116471435A (zh) * 2023-04-12 2023-07-21 央视国际网络有限公司 语音和字幕的调整方法和装置、电子设备、存储介质
CN116471436B (zh) * 2023-04-12 2024-05-31 央视国际网络有限公司 信息的处理方法及装置、存储介质、电子设备

Also Published As

Publication number Publication date
CN104795083B (zh) 2018-06-01

Similar Documents

Publication Publication Date Title
CN104795083A (zh) 一种信息处理方法和电子设备
CN105611404B (zh) 一种根据视频应用场景自动调节音频音量的方法及装置
US10021445B2 (en) Automatic synchronization of subtitles based on audio fingerprinting
US8340492B2 (en) Method and system for sharing annotations in a communication network
US8931024B2 (en) Receiving apparatus and subtitle processing method
US9031375B2 (en) Video frame still image sequences
US10679675B2 (en) Multimedia file joining method and apparatus
US9843613B2 (en) Synchronization of multimedia contents on second screen
EP2172936A3 (en) Online video and audio editing
CN104333802A (zh) 一种视频播放方法及视频播放器
CN105898557A (zh) 一种语音弹幕的生成、播放方法及其装置、客户端
KR102308651B1 (ko) 매체 환경 중심 콘텐츠 배포 플랫폼
US11729475B2 (en) System and method for providing descriptive video
CN106412678A (zh) 一种视频新闻实时转写存储方法及***
CN112383790A (zh) 直播的录屏方法、装置、电子设备及存储介质
CN108429931A (zh) 一种多媒体文件播放方法及装置
JP6268131B2 (ja) 字幕制作装置および字幕制作方法
US10812839B2 (en) Techniques for automated data record generation from live programs
US11093120B1 (en) Systems and methods for generating and broadcasting digital trails of recorded media
US20150128040A1 (en) Generating custom sequences of video streams
US10750208B2 (en) Processing video and audio streaming data
CN104837061B (zh) 一种视频播单的修改管理方法及装置
Ohanian How Artificial Intelligence and Machine Learning Will Change Content Creation Methodologies
CN104837074B (zh) 一种显示时间的设置方法及装置
US20070294613A1 (en) Communication system for remote collaborative creation of multimedia contents

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant