CN113885741A - 一种多媒体处理方法、装置、设备及介质 - Google Patents

一种多媒体处理方法、装置、设备及介质 Download PDF

Info

Publication number
CN113885741A
CN113885741A CN202110637048.3A CN202110637048A CN113885741A CN 113885741 A CN113885741 A CN 113885741A CN 202110637048 A CN202110637048 A CN 202110637048A CN 113885741 A CN113885741 A CN 113885741A
Authority
CN
China
Prior art keywords
content
multimedia
target
multimedia content
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110637048.3A
Other languages
English (en)
Inventor
陈可蓉
杨晶生
徐文铭
郑翔
杜春赛
赵立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zitiao Network Technology Co Ltd
Original Assignee
Beijing Zitiao Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zitiao Network Technology Co Ltd filed Critical Beijing Zitiao Network Technology Co Ltd
Priority to CN202110637048.3A priority Critical patent/CN113885741A/zh
Publication of CN113885741A publication Critical patent/CN113885741A/zh
Priority to EP22819375.1A priority patent/EP4336329A1/en
Priority to JP2023574809A priority patent/JP2024521940A/ja
Priority to PCT/CN2022/095452 priority patent/WO2022257777A1/zh
Priority to US18/529,707 priority patent/US20240103802A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本公开实施例涉及一种多媒体处理方法、装置、设备及介质,其中该方法包括:展示初始文本内容,其中,初始文本内容与目标多媒体内容对应;响应于对关联多媒体内容的触发操作,播放关联多媒体内容;其中,关联多媒体内容包括目标多媒体内容中,与目标文本内容关联的片段,目标文本内容从初始文本内容中提取得到。采用上述技术方案,在初始文本内容的基础上可以生成目标文本内容以及对应关联多媒体内容,并在当用户进行触发操作时可以播放该关联多媒体内容,用户通过观看关联多媒体内容可以快速了解初始文本内容的重点,节省了时间,更有助于用户对初始文本内容的理解,进而提高了用户的体验效果。

Description

一种多媒体处理方法、装置、设备及介质
技术领域
本公开涉及会议识别技术领域,尤其涉及一种多媒体处理方法、装置、设备及介质。
背景技术
随着多媒体技术的不断发展,线上沟通因其在沟通效率和信息保留等方面的突出表现,越来越多地被应用在日常生活和办公生活中。
在一些相关产品中,可以对线上沟通的过程进行录制,生成多媒体文件,以供结束后再次回顾内容。然而,在某些沟通时长较长的场景下,通过回放多媒体文件的方式来回顾相关内容,可能会耗费较多的时间,相应地,从中获取沟通时的重要信息的效率不高。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种多媒体处理方法、装置、设备及介质。
本公开实施例提供了一种多媒体处理方法,所述方法包括:
展示初始文本内容,其中,所述初始文本内容与目标多媒体内容对应;
响应于对关联多媒体内容的触发操作,播放所述关联多媒体内容;
其中,所述关联多媒体内容包括所述目标多媒体内容中,与目标文本内容关联的片段,所述目标文本内容从所述初始文本内容中提取得到。
本公开实施例还提供了一种多媒体处理装置,所述装置包括:
展示初始文本内容,其中,所述初始文本内容与目标多媒体内容对应;
响应于对关联多媒体内容的触发操作,播放所述关联多媒体内容;
其中,所述关联多媒体内容包括所述目标多媒体内容中,与目标文本内容关联的片段,所述目标文本内容从所述初始文本内容中提取得到。
本公开实施例还提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现如本公开实施例提供的多媒体处理方法。
本公开实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行如本公开实施例提供的多媒体处理方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:本公开实施例提供的多媒体处理方案,展示初始文本内容,其中,初始文本内容与目标多媒体内容对应;响应于对关联多媒体内容的触发操作,播放关联多媒体内容;其中,关联多媒体内容包括目标多媒体内容中,与目标文本内容关联的片段,目标文本内容从初始文本内容中提取得到。采用上述技术方案,在初始文本内容的基础上可以生成目标文本内容以及对应关联多媒体内容,并在当用户进行触发操作时可以播放该关联多媒体内容,用户通过观看关联多媒体内容可以快速了解初始文本内容的部分内容(例如,其中的重点内容),节省了时间,更有助于用户对初始文本内容的理解,进而提高了用户的体验效果。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例提供的一种多媒体处理方法的流程示意图;
图2为本公开实施例提供的一种多媒体播放的示意图;
图3为本公开实施例提供的另一种多媒体处理方法的流程示意图;
图4为本公开实施例提供的一种多媒体处理装置的结构示意图;
图5为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
图1为本公开实施例提供的一种多媒体处理方法的流程示意图,该方法可以由多媒体处理装置执行,其中该装置可以采用软件和/或硬件实现,一般可集成在电子设备中。如图1所示,该方法包括:
步骤101、展示初始文本内容,其中,初始文本内容与目标多媒体内容对应。
其中,目标多媒体内容可以是对任何一个用户之间的沟通过程进行记录的多媒体内容,例如可以是对会议进行记录的多媒体内容,具体的格式不限,例如目标多媒体内容可以是音频和/或视频。初始文本内容可以是与对目标多媒体内容进行识别和处理之后的文本内容,例如可以是对目标媒体内容进行语音识别得到的文本内容。
本公开实施例中,终端设备可以获取目标多媒体内容对应的初始文本内容,并在显示界面的文本区域展示该初始文本内容。可选的,该显示界面中还可以设置多媒体区域,用于展示上述目标多媒体内容。
步骤102、响应于对关联多媒体内容的触发操作,播放关联多媒体内容;其中,关联多媒体内容包括目标多媒体内容中,与目标文本内容关联的片段,目标文本内容从初始文本内容中提取得到。
目标文本内容可以是基于初始文本内容进行提取和处理生成的关键内容,例如当初始文本内容为会议字幕时,目标文本内容可以是从会议字幕中提取的会议主要内容,也即会议纪要。关联多媒体内容可以是目标多媒体内容中与目标文本内容关联的多媒体片段,例如当目标文本内容为会议纪要时,关联多媒体内容可以是多媒体纪要,具体可以是音频格式和/或视频格式的会议纪要。
本公开实施例中,终端设备通过内置的检测程序或算法可以检测用户的触发操作,当接收到用户对关联多媒体内容的触发操作之后,可以获取预先生成的关联多媒体内容,并播放该关联多媒体内容。具体可以在上述初始文本内容所在的显示界面的预设区域播放该关联多媒体内容,也可以打开一个新显示界面,在该新显示界面中播放该关联多媒体内容,该新显示界面可以悬浮在上述初始文本内容所在的显示界面中进行展示。
对关联多媒体内容的触发操作可以为对设置在上述初始文本内容的显示界面中的设定按钮或设定信息的触发操作,具体操作方式不限,例如可以为点击操作和/或悬停操作。上述设定按钮和设定信息也可以根据实际情况进行设定,例如设定按钮可以为目标文本内容周围设置的一个按钮。
示例性的,图2为本公开实施例提供的一种多媒体播放的示意图,如图2所示,以会议场景为例,初始文本内容为会议字幕、目标文本内容为会议纪要、目标多媒体内容为会议视频以及关联多媒体内容为多媒体纪要,展示了第一显示界面10,第一显示界面10中的第一区域11展示有会议纪要,第一区域11的顶部展示有会议视频,第二区域12中展示有会议字幕,第一显示界面10中的最下方可以展示会议视频或会议音频的播放时间轴。第二显示界面20可以悬浮展示在第一显示界面10的上面,当第二显示界面20展示时,第一显示界面10可以显示较暗以突出纪要第二显示界面20。第一显示界面10中可以设置按钮13,当用户触发该按钮13时,第二显示界面20中的第一区域21中可以播放多媒体纪要,第二显示界面20中展示有多媒体纪要的播放时间轴。上述按钮13的设置位置仅为示例。
本公开实施例提供的多媒体处理方案,展示初始文本内容,其中,初始文本内容与目标多媒体内容对应;响应于对关联多媒体内容的触发操作,播放关联多媒体内容;其中,关联多媒体内容包括目标多媒体内容中,与目标文本内容关联的片段,目标文本内容从初始文本内容中提取得到。采用上述技术方案,在初始文本内容的基础上可以生成目标文本内容以及对应关联多媒体内容,并在当用户进行触发操作时可以播放该关联多媒体内容,用户通过观看关联多媒体内容可以快速了解初始文本内容的重点,节省了时间,更有助于用户对初始文本内容的理解,进而提高了用户的体验效果。
在一些实施例中,目标文本内容包括至少两段提取自初始文本内容的连续文本片段。可选的,响应于对关联多媒体内容的触发操作,播放关联多媒体内容,包括:响应于对关联多媒体内容的触发操作,按照目标文本内容中各连续文本片段的关联时间段在目标多媒体内容中的先后顺序,跳转播放目标多媒体内容中与各连续文本片段的关联时间段所对应的多媒体片段。
上述目标文本内容包括至少两段连续文本片段,连续文本片段可以是提取自初始文本内容的文本片段,此处的连续表征提取的文本片段之间是具有前后关联关系的,也即本方案中将目标文本内容看作一个整体,其中包括的多个文本片段看作是连续的。例如当目标文本内容为会议纪要时,会议纪要可以包括多个纪要,本方案中将整个会议纪要作为一个整体进行后续处理。
连续文本片段的关联时间段是指连续文本片段对应的多媒体片段在目标多媒体内容中的时间段,该关联时间段可以包括开始时间和结束时间。
本公开实施例中,终端设备接收到对关联多媒体内容的触发操作之后,可以播放目标多媒体内容,并在播放过程中可以按照各连续文本片段的关联时间段在关联多媒体内容中的先后顺序,跳转播放目标多媒体内容中与各连续文本片段的关联时间端所对应的多媒体片段。也即可以依次播放目标多媒体内容中的各连续文本片段对应的关联多媒体内容的一部分,进而播放关联多媒体内容。这样设置的好处在于,可以直接在目标多媒体内容的显示界面中跳转播放目标多媒体内容中目标文本内容对应的片段,可以使用户快速了解会议重点,节省了时间。
在一些实施例中,多媒体处理方法还可以包括:基于目标文本内容确定关联多媒体内容。可选的,基于目标文本内容确定关联多媒体内容,包括:基于目标文本内容的关联时间段生成关联多媒体内容,其中,目标文本内容的关联时间段用于表征目标文本内容对应的语音信息在目标多媒体内容中的时间段。
其中,目标文本内容虽然是从初始文本内容中提取得到的,但是与初始文本内容并不完全相同,因此目标文本内容的关联时间段是指目标文本内容在上述初始文本内容中所对应的文本的语音信息在目标多媒体内容中的时间段。本实施例中,根据目标文本内容的关联时间段可以生成上述关联多媒体内容,此处关联多媒体内容可以为单独的一个多媒体文件。可以理解的是,关联多媒体内容可以由终端设备或服务器生成,具体不限。
可选的,基于目标文本内容的关联时间段生成关联多媒体内容,包括:按照关联时间段在目标多媒体内容中的先后顺序拼接关联时间段对应的多媒体片段,生成关联多媒体内容。具体的,根据关联时间段可以在目标多媒体内容中进行多媒体片段的截取,之后可以按照关联时间段在目标多媒体内容中的先后顺序拼接上述截取的各多媒体片段,得到关联多媒体内容。
可选的,基于目标文本内容的关联时间段生成关联多媒体内容,包括:根据目标文本内容的关联文本的语句完整性,对目标文本内容的关联时间段进行调整;基于调整之后的关联时间段生成关联多媒体内容。其中,关联文本为目标文本内容在初始文本内容中所对应的文本。
由于目标文本内容是通过对初始文本内容进行处理得到的,并且初始文本内容是通过对目标多媒体内容中的语音信息进行语音识别得到的,目标文本内容的关联文本是指目标文本内容在初始文本内容中所对应的文本,例如当目标文本内容为会议纪要时,会议纪要的关联文本可以是会议纪要所对应的字幕文本。目标文本内容的关联文本与上述关联时间段相对应。
由于目标文本内容的关联文本能存在不完整的情况,本公开实施例中,终端设备可以根据语音活动检测算法(Voice Activity Detection,VAD)和/或语义检测算法对目标文本内容的关联文本进行检测,并根据语句完整性和连贯性对目标文本内容的关联时间段进行加宽处理。在这里,加宽处理例如可以指,将关联时间段所对应的起始时刻前移,和/或,将关联时间段所对应的结束时刻后移。之后可以根据加宽处理之后的关联时间段生成关联多媒体内容。具体的,将加宽处理之后的关联时间段称为目标时间段,按照目标时间段在目标多媒体内容中的先后顺序拼接目标时间段对应的多媒体片段,生成关联多媒体内容。这样一来,通过对关联时间段进行加宽操作得到目标时间段,可以在确保截取得到的多媒体片段所对应的目标内容的完整性的基础上,提供进一步的上下文信息。
示例性的,当目标文本内容为会议纪要时,一个会议纪要的关联时间段为10S-20S,10S这个时间点根据检测确定是一个完整的句子或段落的中间,可以往前加宽到5S,也即最终确定的加宽处理之后的时间段为5S-20S。
可选的,在生成多媒体纪要的过程中,对多媒体片段拼接时,可以对声音和画面进行处理,添加渐入和渐出的效果,以在后续播放时避免可能因片段截取造成的突兀,进一步提高用户的浏览效果。
上述方案中,根据目标文本内容的关联文本,通过拼接可以浓缩生成一个包括重要信息的关联多媒体内容;或者,可以兼顾语句的完整性根据加宽处理之后的关联时间段生成上述关联多媒体内容,保证了重要信息的完整,用户可以通过浏览关联多媒体内容可以快速了解重点,更有利于用户对重点的理解。
在一些实施例中,关联多媒体内容为多媒体纪要,多媒体纪要包括至少两个子多媒体纪要,每个子多媒体纪要对应一种纪要类型,纪要类型包括至少两种。可选的,响应于对关联多媒体内容的触发操作,播放关联多媒体内容,包括:响应于对关联多媒体内容的触发操作,确定触发操作对应的目标纪要类型;获取目标纪要类型对应的目标子多媒体纪要并播放目标子多媒体纪要;或者,获取多媒体纪要,基于目标纪要类型在多媒体纪要中的时间段播放多媒体纪要。
本实施例中,当目标文本内容为文本纪要时,纪要类型可以包括多种,本公开实施例中纪要类型可以包括议题、议程、讨论、结论和待办任务等,每种纪要类型均可以包括多个文本纪要,数量不限。本公开实施例中针对每种纪要类型可以生成对应的子多媒体纪要,也即多媒体纪要可以包括多个子多媒体纪要,分别对应各个纪要类型。具体子多媒体纪要的生成方式与上述完整的多媒体纪要的生成方式相同,在此不进行赘述。
本公开实施例中,接收用户对关联多媒体内容的触发操作之后,该触发操作可以用于对一个纪要类型的子多媒体纪要进行播放,可以先确定播放触发操作对应的目标纪要类型,获取目标纪要类型对应的目标子多媒体纪要,在纪要播放界面中播放该目标子多媒体纪要。或者,在确定目标纪要类型之后,可以获取完整的多媒体纪要,并根据目标纪要类型在多媒体纪要的时间段,也即目标子多媒体纪要在多媒体纪要的时间段,从对应的时间段进行播放。
示例性的,如图2所示,在第一显示界面10中每种纪要类型附近均可以设置一个按钮13,以使用户可以仅播放该纪要类型对应的子多媒体纪要。
上述方案中,当关联多媒体内容为多媒体纪要,针对不同纪要类型可以生成对应的多媒体纪要,并支持用户仅仅针对一种纪要类型播放其多媒体纪要,提高了多媒体纪要的展示灵活性,更有利于用户有针对性地了解会议重点,进而提高了用户的体验效果。
在一些实施例中,目标文本内容为目标文本纪要,目标文本纪要包括至少一种纪要类型的纪要;多媒体处理方法还可以包括:在关联多媒体内容的播放时间轴上关联展示目标文本纪要对应的纪要类型的标识。可选的,在关联多媒体内容的播放时间轴上关联展示目标文本纪要对应的纪要类型的标识,包括:在关联多媒体内容的播放时间轴上的目标文本纪要对应的关联时间点,展示目标文本纪要对应的纪要类型的标识。其中,目标文本纪要对应的关联时间点为目标文本纪要的关联时间段中的任意一个时间点。
当目标文本内容为目标文本纪要时,目标文本纪要可以包括一种或多种纪要类型的纪要。本公开实施例中,针对关联多媒体内容,可以先确定对应的目标文本纪要包括的各个纪要的纪要类型,并在关联多媒体内容的播放时间轴上,目标文本纪要对应的关联时间点或关联时间区间展示对应的纪要类型的标识。上述纪要类型的标识用于表征纪要类型,具体形式不限,例如可以采用文字、字幕或图形表示。目标文本纪要对应的关联时间点可以根据实际情况进行设定,例如可以将目标文本纪要的关联时间段的初始时间点、中间时间点或结束时间点设置为该关联时间点,或者,可以将自初始时间点起的某一时段、自初始时间点和结束时间点之间某一时刻起的某一时段、或者自初始时间点和结束时间点之间某一时刻起且至结束时间点的某一时段作为关联时间区间。
上述方案中,当目标文本内容为目标文本纪要时,终端设备还可以展示不同纪要的纪要类型的标识,以提醒用户对应的纪要类型,更符合用户的实际需求,提高了用户了解会议重点的效率。
在一些实施例中,多媒体处理方法还可以包括:在关联多媒体内容的播放过程中,依次对与关联多媒体内容的播放进度对应的目标文本内容进行突出展示。
本公开实施例中,终端设备还可以展示目标文本内容,并在关联多媒体内容的播放过程中,可以依次确定与关联多媒体内容的播放进度对应的关联时间段,进而确定播放进度在目标文本内容中对应的文本内容,并且将该播放进度对应的文本内容进行突出展示。本公开实施例中对突出展示的方式不作限定,可以是任何可行的、能够与其他会议纪要区分开的展示方式,例如,可以包括但不限于高亮、加粗和添加下划线中的至少一种。
示例性的,参见图2,第二显示界面20中的第二区域22中可以展示会议纪要。并且如图2所示,从播放时间轴可以看出多媒体纪要的播放进度在中间,纪要类型为议程的会议纪要与播放进度对应,采用添加下划线的方式突出展示。
上述方案中,在播放关联多媒体内容的基础上,还可以展示目标文本内容,并且在关联多媒体内容的播放过程中支持目标文本内容关联交互展示,使用户对目标文本内容和关联多媒体内容之间的关系具有直观的了解,提高了用户的交互体验效果。
在一些实施例中,多媒体处理方法还可以包括:接收用户对关联多媒体内容的下载操作,下载关联多媒体内容并进行存储。
具体的,客户端可以检测用户的操作,接收用户对关联多媒体内容的下载操作,下载关联多媒体内容并存储该关联多媒体内容的文件。其中,下载操作可以为用户在关联多媒体内容的显示界面中对设定按钮或设定信息的触发操作。
例如,参见图2,当用户点击第二显示20中右下角的“下载多媒体”的按钮时,可以对多媒体纪要进行下载并存储。并且,参见图2,当用户点击纪要播放界面中“导出文档”时,可以将会议纪要的文本文件导出,以备用户使用。
上述方案中,关联多媒体内容支持用户下载其文件,使得用户可以根据实际需求使用该文件,进一步提高了用户的体验效果。
图3为本公开实施例提供的另一种多媒体处理方法的流程示意图,本实施例在上述实施例的基础上,进一步优化了上述多媒体处理方法。如图3所示,该方法包括:
步骤201、展示初始文本内容。
其中,初始文本内容与目标多媒体内容对应。
步骤202、基于目标文本内容确定关联多媒体内容。
其中,关联多媒体内容包括目标多媒体内容中,与目标文本内容关联的片段,目标文本内容从初始文本内容中提取得到。
步骤202可以在步骤201之前或之后执行,具体不限。
可选的,基于目标文本内容确定关联多媒体内容,包括:基于目标文本内容的关联时间段生成关联多媒体内容,其中,目标文本内容的关联时间段用于表征目标文本内容对应的语音信息在目标多媒体内容中的时间段。
可选的,基于目标文本内容的关联时间段生成关联多媒体内容,包括:按照关联时间段在目标多媒体内容中的先后顺序拼接关联时间段对应的多媒体片段,生成关联多媒体内容可选的,基于目标文本内容的关联时间段生成关联多媒体内容,包括:根据目标文本内容的关联文本的语句完整性,对目标文本内容的关联时间段进行调整;基于调整之后的关联时间段生成关联多媒体内容。其中,关联文本为目标文本内容在初始文本内容中所对应的文本。
步骤203、响应于对关联多媒体内容的触发操作,播放关联多媒体内容。
其中,目标文本内容包括至少两段提取自初始文本内容的连续文本片段。
可选的,响应于对关联多媒体内容的触发操作,播放关联多媒体内容,包括:响应于对关联多媒体内容的触发操作,按照目标文本内容中各连续文本片段的关联时间段在目标多媒体内容中的先后顺序,跳转播放目标多媒体内容中与各连续文本片段的关联时间段所对应的多媒体片段。
在一些实施例中,关联多媒体内容为多媒体纪要,多媒体纪要包括至少两个子多媒体纪要,每个子多媒体纪要对应一种纪要类型,纪要类型包括至少两种。
可选的,响应于对关联多媒体内容的触发操作,播放关联多媒体内容,包括:响应于对关联多媒体内容的触发操作,确定触发操作对应的目标纪要类型;获取目标纪要类型对应的目标子多媒体纪要并播放目标子多媒体纪要;或者,获取多媒体纪要,基于目标纪要类型在多媒体纪要中的时间段播放多媒体纪要。
步骤203之后,可以执行步骤204和/或步骤205,具体不限。
步骤204、在关联多媒体内容的播放过程中,依次对与关联多媒体内容的播放进度对应的目标文本内容进行突出展示。
步骤205、接收用户对关联多媒体内容的下载操作,下载关联多媒体内容并进行存储。
本实施例中,目标文本内容为目标文本纪要,目标文本纪要包括至少一种纪要类型的纪要;多媒体处理方法还可以包括:在关联多媒体内容的播放时间轴上关联展示目标文本纪要对应的纪要类型的标识。可选的,在关联多媒体内容的播放时间轴上关联展示目标文本纪要对应的纪要类型的标识,包括:在关联多媒体内容的播放时间轴上的目标文本纪要对应的关联时间点,展示目标文本纪要对应的纪要类型的标识。可选的,目标文本纪要对应的关联时间点为目标文本纪要的关联时间段中的任意一个时间点。
本公开实施例提供的多媒体处理方案,展示初始文本内容,基于从初始文本内容中提取得到的目标文本内容确定关联多媒体内容,响应于对关联多媒体内容的触发操作,播放关联多媒体内容;在关联多媒体内容的播放过程中,依次对与关联多媒体内容的播放进度对应的目标文本内容进行突出展示;接收用户对关联多媒体内容的下载操作,下载关联多媒体内容并进行存储。采用上述技术方案,在初始文本内容的基础上可以生成目标文本内容以及对应关联多媒体内容,并在当用户进行触发操作时可以播放该关联多媒体内容,用户通过观看关联多媒体内容可以快速了解初始文本内容的重点,节省了时间,更有助于用户对初始文本内容的理解,进而提高了用户的体验效果;并且目标文本内容可以跟随关联多媒体内容的播放进度突出展示,使用户对目标文本内容和关联多媒体内容之间的关系具有直观的了解,提高了用户的交互体验效果。
图4为本公开实施例提供的一种多媒体处理装置的结构示意图,该装置可由软件和/或硬件实现,一般可集成在电子设备中。如图4所示,该装置包括:
文本展示模块301,用于展示初始文本内容,其中,所述初始文本内容与目标多媒体内容对应;
多媒体播放模块302,用于响应于对关联多媒体内容的触发操作,播放所述关联多媒体内容;
其中,所述关联多媒体内容包括所述目标多媒体内容中,与目标文本内容关联的片段,所述目标文本内容从所述初始文本内容中提取得到。
可选的,所述目标文本内容包括至少两段提取自所述初始文本内容的连续文本片段。
可选的,所述多媒体播放模块302具体用于:
响应于对关联多媒体内容的触发操作,按照所述目标文本内容中各所述连续文本片段的关联时间段在所述目标多媒体内容中的先后顺序,跳转播放所述目标多媒体内容中与各所述连续文本片段的关联时间段所对应的多媒体片段。
可选的,所述装置还包括关联多媒体生成模块,用于:
基于所述目标文本内容确定所述关联多媒体内容。
可选的,所述关联多媒体生成模块具体用于:
基于所述目标文本内容的关联时间段生成关联多媒体内容,其中,所述目标文本内容的关联时间段用于表征所述目标文本内容对应的语音信息在目标多媒体内容中的时间段。
可选的,所述关联多媒体生成模块具体用于:
按照所述关联时间段在所述目标多媒体内容中的先后顺序拼接所述关联时间段对应的多媒体片段,生成所述关联多媒体内容。
可选的,所述关联多媒体生成模块具体用于:
根据所述目标文本内容的关联文本的语句完整性,对所述目标文本内容的关联时间段进行调整;
基于所述调整之后的关联时间段生成所述关联多媒体内容。
可选的,所述关联文本为所述目标文本内容在所述初始文本内容中所对应的文本。
可选的,所述关联多媒体内容为多媒体纪要,所述多媒体纪要包括至少两个子多媒体纪要,每个所述子多媒体纪要对应一种纪要类型,所述纪要类型包括至少两种。
可选的,所述多媒体播放模块302具体用于:
响应于对关联多媒体内容的触发操作,确定所述触发操作对应的目标纪要类型;
获取所述目标纪要类型对应的目标子多媒体纪要并播放所述目标子多媒体纪要;
或者,获取所述多媒体纪要,基于所述目标纪要类型在所述多媒体纪要中的时间段播放所述多媒体纪要。
可选的,所述目标文本内容为目标文本纪要,所述目标文本纪要包括至少一种纪要类型的纪要;
所述装置还包括标识模块,用于:
在所述关联多媒体内容的播放时间轴上关联展示所述目标文本纪要对应的纪要类型的标识。
可选的,所述标识模块具体用于:
在所述关联多媒体内容的播放时间轴上的所述目标文本纪要对应的关联时间点,展示所述目标文本纪要对应的纪要类型的标识。
可选的,所述目标文本纪要对应的关联时间点为所述目标文本纪要的关联时间段中的任意一个时间点。
可选的,所述装置还包括突出展示模块,用于:
在所述关联多媒体内容的播放过程中,依次对与所述关联多媒体内容的播放进度对应的目标文本内容进行突出展示。
可选的,所述装置还包括纪要下载模块,用于:
接收用户对所述关联多媒体内容的下载操作,下载所述关联多媒体内容并进行存储。
本公开实施例所提供的多媒体处理装置可执行本公开任意实施例所提供的多媒体处理方法,具备执行方法相应的功能模块和有益效果。
本公开实施例提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本公开任意实施例所提供的多媒体处理方法。
图5为本公开实施例提供的一种电子设备的结构示意图。下面具体参考图5,其示出了适于用来实现本公开实施例中的电子设备400的结构示意图。本公开实施例中的电子设备400可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备400可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备400与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本公开实施例的多媒体处理方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:展示初始文本内容,其中,所述初始文本内容与目标多媒体内容对应;响应于对关联多媒体内容的触发操作,播放所述关联多媒体内容;其中,所述关联多媒体内容包括所述目标多媒体内容中,与目标文本内容关联的片段,所述目标文本内容从所述初始文本内容中提取得到。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,本公开提供了一种多媒体处理方法,包括:
展示初始文本内容,其中,所述初始文本内容与目标多媒体内容对应;
响应于对关联多媒体内容的触发操作,播放所述关联多媒体内容;
其中,所述关联多媒体内容包括所述目标多媒体内容中,与目标文本内容关联的片段,所述目标文本内容从所述初始文本内容中提取得到。
根据本公开的一个或多个实施例,本公开提供的多媒体处理方法中,所述目标文本内容包括至少两段提取自所述初始文本内容的连续文本片段。
根据本公开的一个或多个实施例,本公开提供的多媒体处理方法中,响应于对关联多媒体内容的触发操作,播放所述关联多媒体内容,包括:
响应于对关联多媒体内容的触发操作,按照所述目标文本内容中各所述连续文本片段的关联时间段在所述目标多媒体内容中的先后顺序,跳转播放所述目标多媒体内容中与各所述连续文本片段的关联时间段所对应的多媒体片段。
根据本公开的一个或多个实施例,本公开提供的多媒体处理方法中,所述方法还包括:
基于所述目标文本内容确定所述关联多媒体内容。
根据本公开的一个或多个实施例,本公开提供的多媒体处理方法中,基于所述目标文本内容确定所述关联多媒体内容,包括:
基于所述目标文本内容的关联时间段生成关联多媒体内容,其中,所述目标文本内容的关联时间段用于表征所述目标文本内容对应的语音信息在目标多媒体内容中的时间段。
根据本公开的一个或多个实施例,本公开提供的多媒体处理方法中,基于所述目标文本内容的关联时间段生成关联多媒体内容,包括:
按照所述关联时间段在所述目标多媒体内容中的先后顺序拼接所述关联时间段对应的多媒体片段,生成所述关联多媒体内容。
根据本公开的一个或多个实施例,本公开提供的多媒体处理方法中,基于所述目标文本内容的关联时间段生成关联多媒体内容,包括:
根据所述目标文本内容的关联文本的语句完整性,对所述目标文本内容的关联时间段进行调整;
基于所述调整之后的关联时间段生成所述关联多媒体内容。
根据本公开的一个或多个实施例,本公开提供的多媒体处理方法中,所述关联文本为所述目标文本内容在所述初始文本内容中所对应的文本。
根据本公开的一个或多个实施例,本公开提供的多媒体处理方法中,所述关联多媒体内容为多媒体纪要,所述多媒体纪要包括至少两个子多媒体纪要,每个所述子多媒体纪要对应一种纪要类型,所述纪要类型包括至少两种。
根据本公开的一个或多个实施例,本公开提供的多媒体处理方法中,响应于对关联多媒体内容的触发操作,播放所述关联多媒体内容,包括:
响应于对关联多媒体内容的触发操作,确定所述触发操作对应的目标纪要类型;
获取所述目标纪要类型对应的目标子多媒体纪要并播放所述目标子多媒体纪要;
或者,获取所述多媒体纪要,基于所述目标纪要类型在所述多媒体纪要中的时间段播放所述多媒体纪要。
根据本公开的一个或多个实施例,本公开提供的多媒体处理方法中,所述目标文本内容为目标文本纪要,所述目标文本纪要包括至少一种纪要类型的纪要;
所述方法还包括:
在所述关联多媒体内容的播放时间轴上关联展示所述目标文本纪要对应的纪要类型的标识。
根据本公开的一个或多个实施例,本公开提供的多媒体处理方法中,在所述关联多媒体内容的播放时间轴上关联展示所述目标文本纪要对应的纪要类型的标识,包括:
在所述关联多媒体内容的播放时间轴上的所述目标文本纪要对应的关联时间点,展示所述目标文本纪要对应的纪要类型的标识。
根据本公开的一个或多个实施例,本公开提供的多媒体处理方法中,所述目标文本纪要对应的关联时间点为所述目标文本纪要的关联时间段中的任意一个时间点。
根据本公开的一个或多个实施例,本公开提供的多媒体处理方法中,所述方法还包括:
在所述关联多媒体内容的播放过程中,依次对与所述关联多媒体内容的播放进度对应的目标文本内容进行突出展示。
根据本公开的一个或多个实施例,本公开提供的多媒体处理方法中,所述方法还包括:
接收用户对所述关联多媒体内容的下载操作,下载所述关联多媒体内容并进行存储。
根据本公开的一个或多个实施例,本公开提供了一种多媒体处理装置,包括:
文本展示模块,用于展示初始文本内容,其中,所述初始文本内容与目标多媒体内容对应;
多媒体播放模块,用于响应于对关联多媒体内容的触发操作,播放所述关联多媒体内容;
其中,所述关联多媒体内容包括所述目标多媒体内容中,与目标文本内容关联的片段,所述目标文本内容从所述初始文本内容中提取得到。
根据本公开的一个或多个实施例,本公开提供的多媒体处理装置中,所述目标文本内容包括至少两段提取自所述初始文本内容的连续文本片段。
根据本公开的一个或多个实施例,本公开提供的多媒体处理装置中,所述多媒体播放模块具体用于:
响应于对关联多媒体内容的触发操作,按照所述目标文本内容中各所述连续文本片段的关联时间段在所述目标多媒体内容中的先后顺序,跳转播放所述目标多媒体内容中与各所述连续文本片段的关联时间段所对应的多媒体片段。
根据本公开的一个或多个实施例,本公开提供的多媒体处理装置中,所述装置还包括关联多媒体生成模块,用于:
基于所述目标文本内容确定所述关联多媒体内容。
根据本公开的一个或多个实施例,本公开提供的多媒体处理装置中,所述关联多媒体生成模块具体用于:
基于所述目标文本内容的关联时间段生成关联多媒体内容,其中,所述目标文本内容的关联时间段用于表征所述目标文本内容对应的语音信息在目标多媒体内容中的时间段。
根据本公开的一个或多个实施例,本公开提供的多媒体处理装置中,所述关联多媒体生成模块具体用于:
按照所述关联时间段在所述目标多媒体内容中的先后顺序拼接所述关联时间段对应的多媒体片段,生成所述关联多媒体内容。
根据本公开的一个或多个实施例,本公开提供的多媒体处理装置中,所述关联多媒体生成模块具体用于:
根据所述目标文本内容的关联文本的语句完整性,对所述目标文本内容的关联时间段进行调整;
基于所述调整之后的关联时间段生成所述关联多媒体内容。
根据本公开的一个或多个实施例,本公开提供的多媒体处理装置中,所述关联文本为所述目标文本内容在所述初始文本内容中所对应的文本。
根据本公开的一个或多个实施例,本公开提供的多媒体处理装置中,所述关联多媒体内容为多媒体纪要,所述多媒体纪要包括至少两个子多媒体纪要,每个所述子多媒体纪要对应一种纪要类型,所述纪要类型包括至少两种。
根据本公开的一个或多个实施例,本公开提供的多媒体处理装置中,所述多媒体播放模块具体用于:
响应于对关联多媒体内容的触发操作,确定所述触发操作对应的目标纪要类型;
获取所述目标纪要类型对应的目标子多媒体纪要并播放所述目标子多媒体纪要;
或者,获取所述多媒体纪要,基于所述目标纪要类型在所述多媒体纪要中的时间段播放所述多媒体纪要。
根据本公开的一个或多个实施例,本公开提供的多媒体处理装置中,所述目标文本内容为目标文本纪要,所述目标文本纪要包括至少一种纪要类型的纪要;
所述装置还包括标识模块,用于:
在所述关联多媒体内容的播放时间轴上关联展示所述目标文本纪要对应的纪要类型的标识。
根据本公开的一个或多个实施例,本公开提供的多媒体处理装置中,所述标识模块具体用于:
在所述关联多媒体内容的播放时间轴上的所述目标文本纪要对应的关联时间点,展示所述目标文本纪要对应的纪要类型的标识。
根据本公开的一个或多个实施例,本公开提供的多媒体处理装置中,所述目标文本纪要对应的关联时间点为所述目标文本纪要的关联时间段中的任意一个时间点。
根据本公开的一个或多个实施例,本公开提供的多媒体处理装置中,所述装置还包括突出展示模块,用于:
在所述关联多媒体内容的播放过程中,依次对与所述关联多媒体内容的播放进度对应的目标文本内容进行突出展示。
根据本公开的一个或多个实施例,本公开提供的多媒体处理装置中,所述装置还包括纪要下载模块,用于:
接收用户对所述关联多媒体内容的下载操作,下载所述关联多媒体内容并进行存储。
根据本公开的一个或多个实施例,本公开提供了一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现如本公开提供的任一所述的多媒体处理方法。
根据本公开的一个或多个实施例,本公开提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行如本公开提供的任一所述的多媒体处理方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (18)

1.一种多媒体处理方法,其特征在于,包括:
展示初始文本内容,其中,所述初始文本内容与目标多媒体内容对应;
响应于对关联多媒体内容的触发操作,播放所述关联多媒体内容;
其中,所述关联多媒体内容包括所述目标多媒体内容中,与目标文本内容关联的片段,所述目标文本内容从所述初始文本内容中提取得到。
2.根据权利要求1所述的方法,其特征在于,所述目标文本内容包括至少两段提取自所述初始文本内容的连续文本片段。
3.根据权利要求2所述的方法,其特征在于,响应于对关联多媒体内容的触发操作,播放所述关联多媒体内容,包括:
响应于对关联多媒体内容的触发操作,按照所述目标文本内容中各所述连续文本片段的关联时间段在所述目标多媒体内容中的先后顺序,跳转播放所述目标多媒体内容中与各所述连续文本片段的关联时间段所对应的多媒体片段。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述目标文本内容确定所述关联多媒体内容。
5.根据权利要求4所述的方法,其特征在于,基于所述目标文本内容确定所述关联多媒体内容,包括:
基于所述目标文本内容的关联时间段生成关联多媒体内容,其中,所述目标文本内容的关联时间段用于表征所述目标文本内容对应的语音信息在目标多媒体内容中的时间段。
6.根据权利要求5所述的方法,其特征在于,基于所述目标文本内容的关联时间段生成关联多媒体内容,包括:
按照所述关联时间段在所述目标多媒体内容中的先后顺序拼接所述关联时间段对应的多媒体片段,生成所述关联多媒体内容。
7.根据权利要求5所述的方法,其特征在于,基于所述目标文本内容的关联时间段生成关联多媒体内容,包括:
根据所述目标文本内容的关联文本的语句完整性,对所述目标文本内容的关联时间段进行调整;
基于所述调整之后的关联时间段生成所述关联多媒体内容。
8.根据权利要求7所述的方法,其特征在于,所述关联文本为所述目标文本内容在所述初始文本内容中所对应的文本。
9.根据权利要求1所述的方法,其特征在于,所述关联多媒体内容为多媒体纪要,所述多媒体纪要包括至少两个子多媒体纪要,每个所述子多媒体纪要对应一种纪要类型,所述纪要类型包括至少两种。
10.根据权利要求9所述的方法,其特征在于,响应于对关联多媒体内容的触发操作,播放所述关联多媒体内容,包括:
响应于对关联多媒体内容的触发操作,确定所述触发操作对应的目标纪要类型;
获取所述目标纪要类型对应的目标子多媒体纪要并播放所述目标子多媒体纪要;
或者,获取所述多媒体纪要,基于所述目标纪要类型在所述多媒体纪要中的时间段播放所述多媒体纪要。
11.根据权利要求1所述的方法,其特征在于,所述目标文本内容为目标文本纪要,所述目标文本纪要包括至少一种纪要类型的纪要;
所述方法还包括:
在所述关联多媒体内容的播放时间轴上关联展示所述目标文本纪要对应的纪要类型的标识。
12.根据权利要求11所述的方法,其特征在于,在所述关联多媒体内容的播放时间轴上关联展示所述目标文本纪要对应的纪要类型的标识,包括:
在所述关联多媒体内容的播放时间轴上的所述目标文本纪要对应的关联时间点,展示所述目标文本纪要对应的纪要类型的标识。
13.根据权利要求12所述的方法,其特征在于,所述目标文本纪要对应的关联时间点为所述目标文本纪要的关联时间段中的任意一个时间点。
14.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述关联多媒体内容的播放过程中,依次对与所述关联多媒体内容的播放进度对应的目标文本内容进行突出展示。
15.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收用户对所述关联多媒体内容的下载操作,下载所述关联多媒体内容并进行存储。
16.一种多媒体处理装置,其特征在于,包括:
文本展示模块,用于展示初始文本内容,其中,所述初始文本内容与目标多媒体内容对应;
多媒体播放模块,用于响应于对关联多媒体内容的触发操作,播放所述关联多媒体内容;
其中,所述关联多媒体内容包括所述目标多媒体内容中,与目标文本内容关联的片段,所述目标文本内容从所述初始文本内容中提取得到。
17.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-15中任一所述的多媒体处理方法。
18.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-15中任一所述的多媒体处理方法。
CN202110637048.3A 2021-06-08 2021-06-08 一种多媒体处理方法、装置、设备及介质 Pending CN113885741A (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202110637048.3A CN113885741A (zh) 2021-06-08 2021-06-08 一种多媒体处理方法、装置、设备及介质
EP22819375.1A EP4336329A1 (en) 2021-06-08 2022-05-27 Multimedia processing method and apparatus, and device and medium
JP2023574809A JP2024521940A (ja) 2021-06-08 2022-05-27 マルチメディア処理方法、装置、デバイスおよび媒体
PCT/CN2022/095452 WO2022257777A1 (zh) 2021-06-08 2022-05-27 多媒体处理方法、装置、设备及介质
US18/529,707 US20240103802A1 (en) 2021-06-08 2023-12-05 Method, apparatus, device and medium for multimedia processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110637048.3A CN113885741A (zh) 2021-06-08 2021-06-08 一种多媒体处理方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN113885741A true CN113885741A (zh) 2022-01-04

Family

ID=79010212

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110637048.3A Pending CN113885741A (zh) 2021-06-08 2021-06-08 一种多媒体处理方法、装置、设备及介质

Country Status (5)

Country Link
US (1) US20240103802A1 (zh)
EP (1) EP4336329A1 (zh)
JP (1) JP2024521940A (zh)
CN (1) CN113885741A (zh)
WO (1) WO2022257777A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022257777A1 (zh) * 2021-06-08 2022-12-15 北京字跳网络技术有限公司 多媒体处理方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020193895A1 (en) * 2001-06-18 2002-12-19 Ziqiang Qian Enhanced encoder for synchronizing multimedia files into an audio bit stream
CN1773536A (zh) * 2004-11-11 2006-05-17 国际商业机器公司 生成话音纪要的方法、设备和***
CN105810207A (zh) * 2014-12-30 2016-07-27 富泰华工业(深圳)有限公司 会议记录装置及其自动生成会议记录的方法
CN109473103A (zh) * 2018-11-16 2019-03-15 上海玖悦数码科技有限公司 一种会议纪要生成方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7260771B2 (en) * 2001-04-26 2007-08-21 Fuji Xerox Co., Ltd. Internet-based system for multimedia meeting minutes
WO2007142648A1 (en) * 2006-06-09 2007-12-13 Thomson Licensing System and method for closed captioning
US7900145B2 (en) * 2006-11-08 2011-03-01 Yahoo! Inc. System and method for synchronizing data
US8234411B2 (en) * 2010-09-02 2012-07-31 Comcast Cable Communications, Llc Providing enhanced content
US10559297B2 (en) * 2016-11-28 2020-02-11 Microsoft Technology Licensing, Llc Audio landmarking for aural user interface
CN113885741A (zh) * 2021-06-08 2022-01-04 北京字跳网络技术有限公司 一种多媒体处理方法、装置、设备及介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020193895A1 (en) * 2001-06-18 2002-12-19 Ziqiang Qian Enhanced encoder for synchronizing multimedia files into an audio bit stream
CN1773536A (zh) * 2004-11-11 2006-05-17 国际商业机器公司 生成话音纪要的方法、设备和***
CN105810207A (zh) * 2014-12-30 2016-07-27 富泰华工业(深圳)有限公司 会议记录装置及其自动生成会议记录的方法
CN109473103A (zh) * 2018-11-16 2019-03-15 上海玖悦数码科技有限公司 一种会议纪要生成方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022257777A1 (zh) * 2021-06-08 2022-12-15 北京字跳网络技术有限公司 多媒体处理方法、装置、设备及介质

Also Published As

Publication number Publication date
JP2024521940A (ja) 2024-06-04
EP4336329A1 (en) 2024-03-13
WO2022257777A1 (zh) 2022-12-15
US20240103802A1 (en) 2024-03-28

Similar Documents

Publication Publication Date Title
CN111510760B (zh) 视频信息展示方法和装置、存储介质和电子设备
CN110324718B (zh) 音视频生成方法、装置、电子设备及可读介质
CN111447489A (zh) 视频处理方法、装置、可读介质及电子设备
CN110267113B (zh) 视频文件加工方法、***、介质和电子设备
CN112040330B (zh) 视频文件的处理方法、装置、电子设备及计算机存储介质
CN113259740A (zh) 一种多媒体处理方法、装置、设备及介质
CN113010704B (zh) 一种会议纪要的交互方法、装置、设备及介质
CN113613068A (zh) 视频的处理方法、装置、电子设备和存储介质
US20240127856A1 (en) Audio processing method and apparatus, and electronic device and storage medium
CN112165652B (zh) 视频处理方法、装置、设备及计算机可读存储介质
CN113507637A (zh) 媒体文件处理方法、装置、设备、可读存储介质及产品
CN112380365A (zh) 一种多媒体的字幕交互方法、装置、设备及介质
CN112015505A (zh) 模式切换方法、装置和电子设备
CN113886612A (zh) 一种多媒体浏览方法、装置、设备及介质
US20240103802A1 (en) Method, apparatus, device and medium for multimedia processing
CN112954453B (zh) 视频配音方法和装置、存储介质和电子设备
CN114584716A (zh) 图片处理方法、装置、设备及存储介质
CN115981769A (zh) 页面显示方法、装置、设备、计算机可读存储介质及产品
CN112307393A (zh) 信息发布方法、装置和电子设备
CN112287171A (zh) 信息处理方法、装置和电子设备
CN115269920A (zh) 交互方法、装置、电子设备和存储介质
CN111385638B (zh) 视频处理方法和装置
CN116156077A (zh) 用于多媒体资源剪辑场景的方法、装置、设备及存储介质
CN113139090A (zh) 交互方法、装置、电子设备及计算机可读存储介质
CN114697760B (zh) 一种处理方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination