CN112182298A - 一种信息处理的方法、装置、计算机存储介质及终端 - Google Patents

一种信息处理的方法、装置、计算机存储介质及终端 Download PDF

Info

Publication number
CN112182298A
CN112182298A CN201910515269.6A CN201910515269A CN112182298A CN 112182298 A CN112182298 A CN 112182298A CN 201910515269 A CN201910515269 A CN 201910515269A CN 112182298 A CN112182298 A CN 112182298A
Authority
CN
China
Prior art keywords
voice
information
related information
content
video file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910515269.6A
Other languages
English (en)
Inventor
欧振羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Original Assignee
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Office Software Inc, Zhuhai Kingsoft Office Software Co Ltd filed Critical Beijing Kingsoft Office Software Inc
Priority to CN201910515269.6A priority Critical patent/CN112182298A/zh
Publication of CN112182298A publication Critical patent/CN112182298A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种信息处理的方法、装置、计算机存储介质及终端,包括:获取视频文件中两句或两句以上语音内容的语音相关信息;根据获取的语音相关信息,生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件;其中,所述语音相关信息包括以下一种或一种以上信息:语音内容的时间信息,语音内容对应的文字信息。本发明实施例通过参考文件,为提高用户通过视频文件进行学习的效率提供了数据支持,为提高用户查看视频文件的效率提供了技术基础。

Description

一种信息处理的方法、装置、计算机存储介质及终端
技术领域
本文涉及但不限于多媒体技术,尤指一种信息处理的方法、装置、计算机存储介质及终端。
背景技术
视频文件是用户在生活和工作过程中,用于学习的一种常见文件。通过观看视频文件,用户可以了解掌握视频文件包含的知识点,进而提升用户的知识储备。
目前,用户在通过视频文件进行学习时,通常会遇到以下两种情况:一、初次获得视频文件后,用户无法确定获得视频文件是否包含需要学习的知识点时,用户需要对视频文件进行通篇浏览;当用户对已查看过的视频文件需要进行知识点回顾时,如果不记得需要回顾的知识点的视频位置,则至少需要通过快进方式才能确定需要回顾的知识点所对应的视频位置。
上述通过视频文件进行学习的方法,如果无法确定视频文件中是否包含需要学习的知识点,或无法确定已查看过的视频文件中,需要回顾的知识点的视频位置;则用户通过视频文件进行知识点学习时,需要耗费的时间和精力将较多,学习效率低。如何提高用户通过视频文件进行学习的效率,成为待解决的问题。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本发明实施例提供一种信息处理的方法、装置、计算机存储介质及终端,能够提高用户通过视频文件进行学习的效率。
本发明实施例提供了一种信息处理的方法,包括:
获取视频文件中两句或两句以上语音内容的语音相关信息;
根据获取的语音相关信息,生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件;
其中,所述语音相关信息包括以下一种或一种以上信息:语音内容的时间信息,语音内容对应的文字信息。
在一种示例性实施例中,所述获取视频文件中两句或两句以上语音内容的语音相关信息包括:
按照预设间隔,获取所述视频文件中两句或两句以上语音内容的语音相关信息;或,
获取视频文件中每一句语音内容的语音相关信息。
在一种示例性实施例中,所述获取视频文件中两句或两句以上语音内容的语音相关信息包括:
提取所述视频文件的音频数据;从提取的所述音频数据中,识别获得两句或两句以上语音内容的所述语音相关信息;或,
提取所述视频文件的字幕数据;从提取的所述字幕数据中读取两句或两句以上语音内容的所述语音相关信息。
在一种示例性实施例中,所述语音相关信息包括语音内容的时间信息和对应的文字信息,所述生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件包括:
根据获取的各语音相关信息包含的语音内容的时间信息,按照时间先后顺序将获取的所有语音相关信息添加到预设的列表中;
将获得的列表存储为预设格式的文件后,生成所述参考文件;
其中,所述预设格式的文件包括以下任一格式的文件:文本、弹幕。
在一种示例性实施例中,所述生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件之后,所述方法还包括:
为所述参考文件中的每一句语音内容的语音相关信息添加相应的跳转链接;
接收到预设的使能跳转链接的使能操作时,根据跳转链接对应的语音内容的时间信息,打开视频文件至该时间信息对应的视频位置。
在一种示例性实施例中,所述语音相关信息包括语音内容的时间信息和对应的文字信息,所述生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件之后,所述方法还包括:
播放所述视频文件时,获取视频文件当前播放进度的播放进度信息;
根据获取的所述播放进度信息和语音相关信息中包含的语音内容的时间信息,在所述参考文件中区分显示当前播放的语音内容所对应的文字信息。
在一种示例性实施例中所述生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件之后,所述方法还包括:
对所述参考文件进行编辑处理;
其中,所述编辑处理包括以下一种或一种以上编辑:整合、增加、删除、修改。
另一方面,本发明实施例还提供一种信息处理的装置,包括:获取单元及生成单元;其中,
获取单元用于:获取视频文件中两句或两句以上语音内容的语音相关信息;
生成单元用于:根据获取的语音相关信息,生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件;
其中,所述语音相关信息包括以下一种或一种以上信息:语音内容的时间信息,语音内容对应的文字信息。
再一方面,本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行上述信息处理的方法。
还一方面,本发明实施例还提供一种终端,包括:存储器和处理器;其中,
处理器被配置为执行存储器中的程序指令;
程序指令在处理器读取执行上述信息处理的方法。
与相关技术相比,本申请技术方案包括:获取视频文件中两句或两句以上语音内容的语音相关信息;根据获取的语音相关信息,生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件;其中,所述语音相关信息包括以下一种或一种以上信息:语音内容的时间信息,语音内容对应的文字信息。本发明实施例通过参考文件,为提高用户通过视频文件进行学习的效率提供了数据支持,为提高用户查看视频文件的效率提供了技术基础。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明实施例信息处理的方法的流程图;
图2为本发明实施例在参考文件中添加视频文件的示意图;
图3为本发明实施例信息处理的装置的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1为本发明实施例信息处理的方法的流程图,如图1所示,包括:
步骤101、获取视频文件中两句或两句以上语音内容的语音相关信息;
在一种示例性实施例中,所述获取视频文件中两句或两句以上语音内容的语音相关信息包括:
按照预设间隔,获取所述视频文件中两句或两句以上语音内容的语音相关信息;或,
获取视频文件中每一句语音内容的语音相关信息。
在一种示例性实施例中,获取视频文件中两句或两句以上语音内容的语音相关信息包括:
提取所述视频文件的音频数据;从提取的所述音频数据中,识别获得两句或两句以上语音内容的所述语音相关信息;或,
提取所述视频文件的字幕数据;从提取的所述字幕数据中读取两句或两句以上语音内容的所述语音相关信息。
需要说明的是,本发明实施例在提取音频数据或字幕数据之前,可以预先判断是否存在字幕数据,存在字幕数据时,直接提取字幕数据可以较为高效的获取语音相关信息,判断方法例如:通过获取视频文件的属性参数确定,或参照其他相关技术实现;本发明实施例可以在播放视频文件时,提取所述音频数据或字幕数据;也可以在未打开视频文件的情况下,提取音频数据或字幕数据。提取音频数据后,本发明实施例可以参照相关技术中的语音识别技术,确定语音内容对应的文字信息。
另外,本发明实施例语音相关信息根据音频数据提取时,预设间隔可以是时长相等的时间间隔,时长可以由本领域技术人员根据视频文件时长、语言种类等进行分析确定;本发明实施例语音相关信息根据字幕数据提取时,预设间隔可以是预设行数的间隔,行数可以由本领域技术人员根据字幕文件大小、语言种类等进行分析确定;上述预设间隔还可以由用户根据对知识点查看需求进行调整;例如、视频文件包含较多知识点,用户可以设置预设间隔较短,这样,用户可以获取更多语音内容的语音相关信息。
在一种示例性实施例中,本发明实施例语音相关信息可以同时包括语音内容的时间信息和对应的文字信息。
步骤102、根据获取的语音相关信息,生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件;
其中,所述语音相关信息包括以下一种或一种以上信息:语音内容的时间信息,语音内容对应的文字信息。
在一种示例性实施例中,获取视频文件中两句或两句以上语音内容的语音相关信息为:获取视频文件中每一句语音内容的语音相关信息时,本发明实施例方法还包括:
根据每一句语音内容的时间信息,判断相邻的两句语音内容的时间间隔是否大于预设时长;
相邻的两句语音内容的时间间隔大于预设时长时,在所述参考文件中添加音频空白的时间区间信息。这里,语音相关信息通过列表进行排序时,音频空白的时间区间信息,可以通过对比各语音内容的时间信息,将其***到列表的相应位置。预设时长可以由本领域技术人员根据视频文件的内容进行分析确定,例如、预设时长可以设置为大于3秒的一个时长。
在一种示例性实施例中,所述语音相关信息包括语音内容的时间信息和对应的文字信息,所述生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件包括:
根据获取的各语音相关信息包含的语音内容的时间信息,按照时间先后顺序将获取的所有语音相关信息添加到预设的列表中;
将获得的列表存储为预设格式的文件后,生成所述参考文件;
其中,所述预设格式的文件包括以下任一格式的文件:文本、弹幕。
需要说明的是,本发明实施例将语音相关信息按照时间先后顺序添加到列表后,通过列表中记录的每一句语音内容的时间信息和对应的文字信息,用户可以确定视频文件中包含的各知识点所在的视频位置。理论上,获取语音相关信息的语音内容越多,确定知识点所在视频位置越准确,预设间隔较大时,可以节省参阅参考文件的时间,获得知识点的初步位置。表1为本发明实施例添加语音相关信息示例列表,如表1所示,列表中记录了语音内容的时间信息(本示例列表以开始时间作为时间信息)和语音内容对应的文字信息;此外,参考文件的格式为文本时,本发明实施例文本可以包括WORD、Excel、WPS等在内的办公电子文本;将按序添加语音相关信息的列表添加到文本后,用户可以通过查阅文本确定视频文件各知识点所在的位置;将列表内容存储为弹幕格式的文件后,本发明实施例可以参照弹幕的相关机制,设置按页显示列表,通过移动弹幕的方式进行列表内容的翻阅查看。
Figure BDA0002094812830000071
表1
在一种示例性实施例中,如果参考文件为包括WORD、WPS在内的电子文件,本发明实施例方法,将视频文件添加到参考文件中;通过将视频文件添加到参考文件的处理,用户可以在查看视频文件的同时查看参考文件。图2为本发明实施例在参考文件中添加视频文件的示意图,如图2所示,假设生成的参考文件时WORD文件,参考文件的名称默认为视频文件的参考文件,通过WORD文件的***方式可以将视频文件添加到参考文件后,可以设置在WORD文件的右侧显示语音内容的文字信息,视频文件与参考文件无需关联,用户通过查看参考文件可以确定所需了解的知识点,通过点击***参考文件的视频文件,可以直接进行视频查看。
在一种示例性实施例中,所述生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件之后,本发明实施例方法还包括:
为所述参考文件中的每一句语音内容的语音相关信息添加相应的跳转链接;
接收到预设的使能跳转链接的使能操作时,根据跳转链接对应的语音内容的时间信息,打开视频文件至该时间信息对应的视频位置。
需要说明的是,跳转链接的设计实现可以参照相关技术中超级链接的实现方法实现,在此不做赘述;在参考文件中添加跳转连接时,可以在参考文件的语言相关信息中添加,例如、在语言内容的时间信息或对应的文字信息上添加;鉴于跳转链接用于打开视频文件至链接对应的位置,因此,设置调整链接之后,语言相关信息中的时间信息可以隐藏或删除,可以由技术人员根据时间信息是否需要保留进行分析确定。本发明实施例通过跳转链接,使用户可以准确的控制视频文件的播放位置,简化了用户查看相关知识点的操作。假设本发明实施例参照图2所示方法进行了视频文件和参考文件的整理,则用户将更为便捷的进行视频文件的查看。
在一种示例性实施例中,所述语音相关信息包括语音内容的时间信息和对应的文字信息,所述生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件之后,本发明实施例方法还包括:
播放所述视频文件时,获取视频文件当前播放进度的播放进度信息;
根据获取的所述播放进度信息和语音相关信息中包含的语音内容的时间信息,在所述参考文件中区分显示当前播放的语音内容所对应的文字信息。
需要说明的是,这里区分显示可以包括高亮显示或采用不同的字体大小、颜色进行显示;可以由本领域技术人员进行分析设置,也可以通过预设的交互界面由用户进行设置。区分显示的功能可以是类似于音频播放应用播放实时显示歌词的功能,即在播放包含歌词的文件时,根据播放进度采用不同格式显示当前播放进度对应的歌词。
在一种示例性实施例中,所述生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件之后,本发明实施例方法还包括:
对所述参考文件进行编辑处理;
其中,所述编辑处理包括以下一种或一种以上编辑:整合、增加、删除、修改。
需要说明的是,本发明实施例对参考文件进行编辑包括对参考文件中的内容进行整合、增加、删除及修改的编辑。以参考文件为将获取的所有语音相关信息添加到预设的列表后,生成文本或弹幕为例,本发明实施例可以对列表中语音内容对应的文字信息进行修改,例如、语音内容较长时,用户可以简化语音内容的文字信息;本发明实施例可以增加类似章节的条目,例如、用户查看视频文件和参考文件时,判断出第1~15句的语音内容可以概括为一个知识点的内容,此时,用户可以在列表中添加一项内容,包含该知识点在视频文件中的时间区间信息及知识点的内容概括;增加的内容可以由用户分析确定***列表的位置,也可以根据时间区间信息,按照预先设定的基于时间确定的***规则进行自动***,例如根据时间区间信息的起始时间,将新增的内容***到该知识点的第一句语音内容的语音相关信息之前;通过***的内容,用户可以快速确定所要查阅的章节位置,根据每一句语音内容对应的语音相关信息,用户可以精确定位所要查阅的具***置。本发明实施例可以对列表中的内容进行整合,整合可以以是否可以划分为一个知识点作为依据,将属于一个知识点的列表合并为一项后,供用户查看;通过整合处理,可以简化参考文件的内容,便于用户快速查阅视频文件中包含的知识点;基于简化后的参考内容,用户可以快速确定所要查阅的章节位置。同样,基于用户对语句内容的判断,用户可以删除不影响其判断知识点的语句,以减少参考文件中信息量低的内容,提升用户查阅参考文件和视频文件的效率。
在一种示例性实施例中,本发明实施例还可以参照相关理论建立参考文件和视频文件的关联,例如、通过存储路径、文件命名的方式建立两者之间的关联。
与相关技术相比,本申请技术方案包括:获取视频文件中两句或两句以上语音内容的语音相关信息;根据获取的语音相关信息,生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件;其中,所述语音相关信息包括以下一种或一种以上信息语音内容的时间信息,语音内容对应的文字信息。本发明实施例通过参考文件,为提高用户通过视频文件进行学习的效率提供了数据支持,为提高用户查看视频文件提供了技术基础。
图3为本发明实施例信息处理的装置的结构框图,如图3所示,包括:获取单元及生成单元;其中,
获取单元用于:获取视频文件中两句或两句以上语音内容的语音相关信息;
在一种示例性实施例中,获取单元用于:
按照预设间隔,获取所述视频文件中两句或两句以上语音内容的语音相关信息;或,
获取视频文件中每一句语音内容的语音相关信息。
在一种示例性实施例中,获取单元用于:
提取所述视频文件的音频数据;从提取的所述音频数据中,识别获得两句或两句以上语音内容的所述语音相关信息;或,
提取所述视频文件的字幕数据;从提取的所述字幕数据中读取两句或两句以上语音内容的所述语音相关信息。
需要说明的是,本发明实施例在提取音频数据或字幕数据之前,可以预先判断是否存在字幕数据,存在字幕数据时,直接提取字幕数据可以较为高效的获取语音相关信息,判断方法可以参照相关技术实现,例如、通过获取视频文件的属性参数确定;本发明实施例可以在播放视频文件时,提取所述音频数据或字幕数据。
在一种示例性实施例中,本发明实施例语音相关信息可以同时包括语音内容的时间信息和对应的文字信息。
生成单元用于:根据获取的语音相关信息,生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件;
其中,所述语音相关信息包括以下一种或一种以上信息:语音内容的时间信息,语音内容对应的文字信息。
在一种示例性实施例中,所述语音相关信息中包含语音内容的时间信息时,本发明实施例装置还包括添加单元,用于:
根据每一句语音内容的时间信息,判断相邻的两句语音内容的时间间隔是否大于预设时长;
相邻的两句语音内容的时间间隔大于预设时长时,在所述参考文件中添加音频空白的时间区间信息。这里,语音相关信息通过列表进行排序时,音频空白的时间区间信息,可以通过对比各语音内容的时间信息,将其***到列表的相应位置。
在一种示例性实施例中,生成单元具体用于:
根据获取的各语音相关信息包含的语音内容的时间信息,按照时间先后顺序将获取的所有语音相关信息添加到预设的列表中;
将获得的列表存储为预设格式的文件后,生成所述参考文件;
其中,所述预设格式的文件包括以下任一格式的文件:文本、弹幕。
需要说明的是,本发明实施例将语音相关信息按照时间先后顺序添加到列表后,通过列表中记录的每一句语音内容的时间信息和对应的文字信息,用户可以确定视频文件中包含的各知识点所在的视频位置。此外,参考文件的格式为文本时,本发明实施例文本可以包括WORD、Excel、WPS等在内的办公电子文本;将按序添加语音相关信息的列表添加到文本后,用户可以通过查阅文本确定视频文件各知识点所在的位置;将列表内容存储为弹幕格式的文件后,本发明实施例可以参照弹幕的相关机制,设置按页显示列表,通过移动弹幕的方式进行列表内容的翻阅查看。
在一种示例性实施例中,如果参考文件为包括WORD、WPS在内的电子文件,本发明实施例方法,将视频文件添加到参考文件中;通过将视频文件添加到参考文件的处理,用户可以在查看视频文件的同时查看参考文件。
在一种示例性实施例中,本发明实施例装置还包括跳转单元,用于:
为所述参考文件中包含的每一句语音内容的语音相关信息添加相应的跳转链接;
接收到预设的使能跳转链接的使能操作时,根据跳转链接对应的语音内容的时间信息,打开视频文件至该时间信息对应的视频位置。
本发明实施例通过跳转链接,使用户可以准确的控制视频文件的播放位置,简化了用户查看相关知识点的操作。
在一种示例性实施例中,本发明实施例装置还包括区分显示单元,用于:
播放所述视频文件时,获取视频文件当前播放进度的播放进度信息;
根据获取的所述播放进度信息和语音相关信息中包含的语音内容的时间信息,在所述参考文件中区分显示当前播放的语音内容所对应的文字信息。
需要说明的是,这里区分显示可以包括高亮显示或采用不同的字体大小、颜色进行显示;可以由本领域技术人员进行分析设置,也可以通过预设的交互界面由用户进行设置。区分显示的功能可以是类似于音频播放应用播放实时显示歌词的功能,即在播放包含歌词的文件时,根据播放进度采用不同格式显示当前播放进度对应的歌词。
在一种示例性实施例中,本发明实施例装置还包括编辑单元,用于:
对所述参考文件进行编辑处理;
其中,所述编辑处理包括以下一种或一种以上编辑:整合、增加、删除、修改。
需要说明的是,本发明实施例对参考文件进行编辑包括对参考文件中的内容进行整合、增加、删除及修改的编辑。以参考文件为将获取的所有语音相关信息添加到预设的列表后,生成文本或弹幕为例,本发明实施例可以对列表中语音内容对应的文字信息进行修改,例如、语音内容较长时,用户可以简化语音内容的文字信息;本发明实施例可以增加类似章节的条目,例如、用户查看视频文件和参考文件时,判断出第1~15句的语音内容可以概括为一个知识点的内容,此时,用户可以在列表中添加一项内容,包含该知识点在视频文件中的时间区间信息及知识点的内容概括;增加的内容可以由用户分析确定***列表的位置,也可以根据时间区间信息,按照预先设定的基于时间确定的***规则进行自动***,例如根据时间区间信息的起始时间,将新增的内容***到该知识点的第一句语音内容的语音相关信息之前;通过***的内容,用户可以快速确定所要查阅的章节位置,根据每一句语音内容对应的语音相关信息,用户可以精确定位所要查阅的具***置。本发明实施例可以对列表中的内容进行整合,整合可以以是否可以划分为一个知识点作为依据,将属于一个知识点的列表合并为一项后,供用户查看;通过整合处理,可以简化参考文件的内容,便于用户快速查阅视频文件中包含的知识点;基于简化后的参考内容,用户可以快速确定所要查阅的章节位置。同样,基于用户对语句内容的判断,用户可以删除不影响其判断知识点的语句,以减少参考文件中信息量低的内容,提升用户查阅参考文件和视频文件的效率。
在一种示例性实施例中,本发明实施例还可以参照相关理论建立参考文件和视频文件的关联,例如、通过存储路径、文件命名的方式建立两者之间的关联。
与相关技术相比,本申请技术方案包括:获取视频文件中每一句语音内容的语音相关信息;根据获取的语音相关信息,生成用于确定视频文件中每一句语音内容所在位置的参考文件;其中,所述语音相关信息包括以下一种或一种以上信息:每一句语音内容的时间信息,每一句语音内容对应的文字信息。本发明实施例通过参考文件,为提高用户通过视频文件进行学习的效率提供了数据支持,为提高用户查看视频文件提供了技术基础。
本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行上述信息处理的方法。
本发明实施例还提供一种终端,包括:存储器和处理器;其中,
处理器被配置为执行存储器中的程序指令;
程序指令在处理器读取执行上述信息处理的方法。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件(例如处理器)完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的每个模块/单元可以采用硬件的形式实现,例如通过集成电路来实现其相应功能,也可以采用软件功能模块的形式实现,例如通过处理器执行存储于存储器中的程序/指令来实现其相应功能。本发明不限制于任何特定形式的硬件和软件的结合。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (10)

1.一种信息处理的方法,其特征在于,包括:
获取视频文件中两句或两句以上语音内容的语音相关信息;
根据获取的语音相关信息,生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件;
其中,所述语音相关信息包括以下一种或一种以上信息:语音内容的时间信息,语音内容对应的文字信息。
2.根据权利要求1所述的方法,其特征在于,所述获取视频文件中两句或两句以上语音内容的语音相关信息包括:
按照预设间隔,获取所述视频文件中两句或两句以上语音内容的语音相关信息;或,
获取视频文件中每一句语音内容的语音相关信息。
3.根据权利要求1或2所述的方法,其特征在于,所述获取视频文件中两句或两句以上语音内容的语音相关信息包括:
提取所述视频文件的音频数据;从提取的所述音频数据中,识别获得两句或两句以上语音内容的所述语音相关信息;或,
提取所述视频文件的字幕数据;从提取的所述字幕数据中读取两句或两句以上语音内容的所述语音相关信息。
4.根据权利要求1或2所述的方法,其特征在于,所述语音相关信息包括语音内容的时间信息和对应的文字信息,所述生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件包括:
根据获取的各语音相关信息包含的语音内容的时间信息,按照时间先后顺序将获取的所有语音相关信息添加到预设的列表中;
将获得的列表存储为预设格式的文件后,生成所述参考文件;
其中,所述预设格式的文件包括以下任一格式的文件:文本、弹幕。
5.根据权利要求1或2所述的方法,其特征在于,所述生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件之后,所述方法还包括:
为所述参考文件中的每一句语音内容的语音相关信息添加相应的跳转链接;
接收到预设的使能跳转链接的使能操作时,根据跳转链接对应的语音内容的时间信息,打开视频文件至该时间信息对应的视频位置。
6.根据权利要求1或2所述的方法,其特征在于,所述语音相关信息包括语音内容的时间信息和对应的文字信息,所述生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件之后,所述方法还包括:
播放所述视频文件时,获取视频文件当前播放进度的播放进度信息;
根据获取的所述播放进度信息和语音相关信息中包含的语音内容的时间信息,在所述参考文件中区分显示当前播放的语音内容所对应的文字信息。
7.根据权利要求1或2所述的方法,其特征在于,所述生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件之后,所述方法还包括:
对所述参考文件进行编辑处理;
其中,所述编辑处理包括以下一种或一种以上编辑:整合、增加、删除、修改。
8.一种信息处理的装置,其特征在于,包括:获取单元及生成单元;其中,
获取单元用于:获取视频文件中两句或两句以上语音内容的语音相关信息;
生成单元用于:根据获取的语音相关信息,生成用于确定获取的语音相关信息所对应的语音内容的所在位置的参考文件;
其中,所述语音相关信息包括以下一种或一种以上信息:语音内容的时间信息,语音内容对应的文字信息。
9.一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行权利要求1~7中任一项所述的信息处理的方法。
10.一种终端,包括:存储器和处理器;其中,
处理器被配置为执行存储器中的程序指令;
程序指令在处理器读取执行权利要求1~7中任一项所述的信息处理的方法。
CN201910515269.6A 2019-06-14 2019-06-14 一种信息处理的方法、装置、计算机存储介质及终端 Pending CN112182298A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910515269.6A CN112182298A (zh) 2019-06-14 2019-06-14 一种信息处理的方法、装置、计算机存储介质及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910515269.6A CN112182298A (zh) 2019-06-14 2019-06-14 一种信息处理的方法、装置、计算机存储介质及终端

Publications (1)

Publication Number Publication Date
CN112182298A true CN112182298A (zh) 2021-01-05

Family

ID=73914253

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910515269.6A Pending CN112182298A (zh) 2019-06-14 2019-06-14 一种信息处理的方法、装置、计算机存储介质及终端

Country Status (1)

Country Link
CN (1) CN112182298A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101101590A (zh) * 2006-07-04 2008-01-09 王建波 一种声音与文字对应关系表生成方法及定位方法
CN101931698A (zh) * 2010-08-12 2010-12-29 高常喜 一种手机的语音文件分段式点播***及方法
CN104079999A (zh) * 2014-05-21 2014-10-01 四川长虹电器股份有限公司 用于智能电视上的视频截图预览方法及***
CN105045828A (zh) * 2015-06-26 2015-11-11 徐信 一种音视频语音信息精确定位的检索***及方法
CN105704538A (zh) * 2016-03-17 2016-06-22 广东小天才科技有限公司 一种音视频字幕生成方法及***
CN108289244A (zh) * 2017-12-28 2018-07-17 努比亚技术有限公司 视频字幕处理方法、移动终端及计算机可读存储介质
CN109754783A (zh) * 2019-03-05 2019-05-14 百度在线网络技术(北京)有限公司 用于确定音频语句的边界的方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101101590A (zh) * 2006-07-04 2008-01-09 王建波 一种声音与文字对应关系表生成方法及定位方法
CN101931698A (zh) * 2010-08-12 2010-12-29 高常喜 一种手机的语音文件分段式点播***及方法
CN104079999A (zh) * 2014-05-21 2014-10-01 四川长虹电器股份有限公司 用于智能电视上的视频截图预览方法及***
CN105045828A (zh) * 2015-06-26 2015-11-11 徐信 一种音视频语音信息精确定位的检索***及方法
CN105704538A (zh) * 2016-03-17 2016-06-22 广东小天才科技有限公司 一种音视频字幕生成方法及***
CN108289244A (zh) * 2017-12-28 2018-07-17 努比亚技术有限公司 视频字幕处理方法、移动终端及计算机可读存储介质
CN109754783A (zh) * 2019-03-05 2019-05-14 百度在线网络技术(北京)有限公司 用于确定音频语句的边界的方法和装置

Similar Documents

Publication Publication Date Title
CN109344241B (zh) 信息的推荐方法、装置、终端及存储介质
US8719029B2 (en) File format, server, viewer device for digital comic, digital comic generation device
CN109558513B (zh) 一种内容推荐方法、装置、终端及存储介质
US20120196260A1 (en) Electronic Comic (E-Comic) Metadata Processing
US20090327272A1 (en) Method and System for Searching Multiple Data Types
CN112632326B (zh) 一种基于视频脚本语义识别的视频生产方法及装置
US20070124700A1 (en) Method of generating icons for content items
EP3029567B1 (en) Method and device for updating input method system, computer storage medium, and device
CN107885483B (zh) 音频信息的校验方法、装置、存储介质及电子设备
WO2022105709A1 (zh) 多媒体的交互方法、信息交互方法、装置、设备及介质
CN113536172B (zh) 一种百科信息展示的方法、装置及计算机存储介质
US20160217704A1 (en) Information processing device, control method therefor, and computer program
CN104994404A (zh) 一种为视频获取关键词的方法及装置
CN111290688A (zh) 多媒体笔记的方法、终端及计算机可读存储介质
CN111414735A (zh) 文本数据的生成方法和装置
CN113177055B (zh) 一种信息更新的方法、装置及计算机存储介质
KR20060089922A (ko) 음성 인식을 이용한 데이터 추출 장치 및 방법
CN110795918B (zh) 确定阅读位置的方法、装置及设备
CN113011169B (zh) 一种会议纪要的处理方法、装置、设备及介质
CN111723235A (zh) 音乐内容识别方法、装置及设备
CN111240962B (zh) 测试方法、装置、计算机设备及计算机存储介质
CN112954453A (zh) 视频配音方法和装置、存储介质和电子设备
CN114697762B (zh) 一种处理方法、装置、终端设备及介质
CN116055825A (zh) 一种生成视频标题的方法及装置
CN112182298A (zh) 一种信息处理的方法、装置、计算机存储介质及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination