CN114495993A - 进度调节方法、装置、设备及计算机可读存储介质 - Google Patents

进度调节方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN114495993A
CN114495993A CN202111601413.1A CN202111601413A CN114495993A CN 114495993 A CN114495993 A CN 114495993A CN 202111601413 A CN202111601413 A CN 202111601413A CN 114495993 A CN114495993 A CN 114495993A
Authority
CN
China
Prior art keywords
audio
progress
text
control node
playing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111601413.1A
Other languages
English (en)
Inventor
井业宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Wutong Chelian Technology Co Ltd
Original Assignee
Beijing Wutong Chelian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Wutong Chelian Technology Co Ltd filed Critical Beijing Wutong Chelian Technology Co Ltd
Priority to CN202111601413.1A priority Critical patent/CN114495993A/zh
Publication of CN114495993A publication Critical patent/CN114495993A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B19/00Driving, starting, stopping record carriers not specifically of filamentary or web form, or of supports therefor; Control thereof; Control of operating function ; Driving both disc and head
    • G11B19/02Control of operating function, e.g. switching from recording to reproducing
    • G11B19/022Control panels
    • G11B19/025'Virtual' control panels, e.g. Graphical User Interface [GUI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了进度调节方法、装置、设备及计算机可读存储介质,属于计算机技术领域。方法包括:播放有声读物的音频,显示进度条,进度条上显示有进度控制节点,进度控制节点在进度条上的位置为第一位置;响应于进度控制节点被调节至第二位置,在音频中获取与第二位置对应的第一音频信息;对第一音频信息进行文本转换,得到第一文本;显示第一文本,播放第二位置对应的时间点的音频。本申请实施例可以对第一音频信息进行文本转换,得到第一文本。由于第一文本是调节后的音频信息对应的文本内容,因此,显示第一文本可以起到提示作用,使进度调节可视化,提高进度调节的准确性,从而提高进度调节效率。

Description

进度调节方法、装置、设备及计算机可读存储介质
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种进度调节方法、装置、设备及计算机可读存储介质。
背景技术
随着计算机技术的进步,有声读物的应用不断发展,有声读物的用户数量也随之不断增长。在播放有声读物的音频时,如果用户想要跳过当前播放的一段音频去收听该段音频之前或之后的音频内容,则可以通过拖动进度条来调节播放进度。
相关技术中,在播放有声读物的音频时会在界面上显示进度条,进度条上有进度控制节点。该进度控制节点可以随着有声读物的音频的播放进度在进度条上进行移动,进度条上的各个点与有声读物的音频的时间点一一对应。在进度控制节点被拖动至进度条上的某点时,将播放该点对应的时间点的音频。
但是,由于进度控制节点被拖动的位置比较随机,导致进度调节的准确性不高,从而降低了进度调节的效率。
发明内容
本申请实施例提供了一种进度调节方法、装置、设备及计算机可读存储介质,可用于解决相关技术中的问题。技术方案如下:
一方面,本申请实施例提供了一种进度调节方法,方法包括:
播放有声读物的音频,显示与所述音频对应的进度条,所述进度条上显示有进度控制节点,所述进度控制节点在所述进度条上的位置为第一位置;
响应于所述进度控制节点被调节至第二位置,在所述音频中获取与所述第二位置对应的第一音频信息;
对所述第一音频信息进行文本转换,得到所述第一音频信息的第一文本;
显示所述第一文本,播放所述第二位置对应的时间点的音频。
在一种可能的实现方式中,所述第一音频信息是在参考时段内播放的音频,所述参考时段的起始时间为所述第二位置对应的时间点。
在一种可能的实现方式中,所述显示所述第一文本,包括:
在所述进度条上的所述第二位置处显示文本框,通过所述文本框显示所述第一文本。
在一种可能的实现方式中,所述显示所述第一文本之后,还包括:
响应于所述进度控制节点被继续调节至第三位置,在所述音频中获取与所述第三位置对应的第二音频信息;
对所述第二音频信息进行文本转换,得到所述第二音频信息的第二文本;
显示所述第二文本,播放所述第三位置对应的时间点的音频。
在一种可能的实现方式中,所述显示所述第一文本之后,还包括:
响应于所述进度控制节点被调节至第二位置的动作被撤销,将所述进度控制节点在所述进度条上的位置还原至所述第一位置,播放所述第一位置对应的时间点的音频。
在一种可能的实现方式中,所述播放所述第二位置对应的时间点的音频,包括:
响应于所述第二位置为确认后的调节位置,播放所述第二位置对应的时间点的音频。
另一方面,提供了一种进度调节装置,装置包括:
播放模块,用于播放有声读物的音频,显示与所述音频对应的进度条,所述进度条上显示有进度控制节点,所述进度控制节点在所述进度条上的位置为第一位置;
获取模块,用于响应于所述进度控制节点被调节至第二位置,在所述音频中获取与所述第二位置对应的第一音频信息;
确定模块,用于对所述第一音频信息进行文本转换,得到所述第一音频信息的第一文本;
所述播放模块,还用于显示所述第一文本,播放所述第二位置对应的时间点的音频。
在一种可能的实现方式中,所述第一音频信息是在参考时段内播放的音频,所述参考时段的起始时间为所述第二位置对应的时间点。
在一种可能的实现方式中,所述播放模块,用于在所述进度条上的所述第二位置处显示文本框,通过所述文本框显示所述第一文本。
在一种可能的实现方式中,所述获取模块,还用于响应于所述进度控制节点被继续调节至第三位置,在所述音频中获取与所述第三位置对应的第二音频信息;
所述确定模块,还用于对所述第二音频信息进行文本转换,得到所述第二音频信息的第二文本;
所述播放模块,还用于显示所述第二文本,播放所述第三位置对应的时间点的音频。
在一种可能的实现方式中,所述播放模块,还用于响应于所述进度控制节点被调节至第二位置的动作被撤销,将所述进度控制节点在所述进度条上的位置还原至所述第一位置,播放所述第一位置对应的时间点的音频。
在一种可能的实现方式中,所述播放模块,用于响应于所述第二位置为确认后的调节位置,播放所述第二位置对应的时间点的音频。
另一方面,提供了一种计算机设备,计算机设备包括处理器和存储器,存储器中存储有至少一条计算机程序,至少一条计算机程序由处理器加载并执行,以使计算机设备实现上述任一的进度调节方法。
另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质中存储有至少一条计算机程序,至少一条计算机程序由处理器加载并执行,以使计算机实现上述任一的进度调节方法。
另一方面,还提供了一种计算机程序产品或计算机程序,计算机程序产品或计算机程序包括计算机指令,计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取计算机指令,处理器执行计算机指令,使得计算机设备执行上述任一的进度调节方法。
本申请实施例提供的技术方案至少带来如下有益效果:
本申请实施例在进度控制节点被调节至第二位置后,在音频中获取与第二位置对应的第一音频信息,通过对第一音频信息进行文本转换,得到第一文本。由于第一文本是调节后的音频信息对应的文本内容,因此,对第一文本进行显示可以起到提示的作用,使进度调节可视化,提高了进度调节的准确性,从而提高进度调节的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实施环境的示意图;
图2是本申请实施例提供的一种进度调节方法的流程图;
图3是本申请实施例提供的一种显示进度条及进度控制节点的界面示意图;
图4是本申请实施例提供的一种通过文本框显示第一文本的界面示意图;
图5是本申请实施例提供的另一种进度调节方法的流程图;
图6是本申请实施例提供的一种进度调节的装置结构示意图;
图7是本申请实施例提供的一种计算机设备的结构示意图;
图8是本申请实施例提供的另一种计算机设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
需要说明的是,本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
本申请实施例提供了一种进度调节方法,请参考图1,其示出了本申请实施例提供的方法实施环境的示意图。该实施环境可以包括:终端11和服务器12。
其中,终端11安装有可以播放有声读物的应用程序或者网页,并且在该应用程序或者网页上可以显示与有声读物的音频对应的进度条,进度条上显示有进度控制节点,进度控制节点在进度条上的位置对应于播放的音频的时间点。当终端11播放有声读物的音频时,终端11可以从服务器12上获取该有声读物的音频,并可以应用本申请实施例提供的方法调节该有声读物的播放进度。或者,当终端11需要播放有声读物的音频时,终端11可以应用本申请实施例提供的方法调节该有声读物的音频的播放进度。
可选地,终端11可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如PC(PersonalComputer,个人计算机)、手机、智能手机、PDA(Personal Digital Assistant,个人数字助手)、可穿戴设备、PPC(Pocket PC,掌上电脑)、平板电脑、智能车机、智能电视、智能音箱等。服务器12可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。终端11与服务器12通过有线或无线网络建立通信连接。
本领域技术人员应能理解上述终端11和服务器12仅为举例,其他现有的或今后可能出现的终端或服务器如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。
基于上述图1所示的实施环境,本申请实施例提供一种进度调节方法,以该方法应用于终端为例。如图2所示,本申请实施例提供的方法可以包括如下步骤201至步骤204。
在步骤201中,播放有声读物的音频,显示与音频对应的进度条,进度条上显示有进度控制节点,进度控制节点在进度条上的位置为第一位置。
本申请实施例不对有声读物的种类与内容进行限定,例如该有声读物可以为依据任一书籍、杂志、相声剧本、小品剧本等录制而成的作品,有声读物的内容包括但不限于文化、生活、科技、时尚、财经等方面的内容。本申请实施例也不对有声读物的音频的格式进行限定,该音频的格式可以为终端11能够播放的任一种音频的格式,例如该音频的格式可以为MP3(Moving Picture Experts Group Audio Layer 3,动态影像专家压缩标准音频层面3),又例如该音频的格式可以为AIFF(Audio Interchange File Format,音频交换文件格式)。
在示例性实施例中,进度条上可以具有多个位置,任意两个相邻的位置之间间隔一个最小时间单位,上述多个位置可以与有声读物的音频的多个时间点相对应,因而进度条可以与有声读物的音频相对应。本申请实施例不对最小时间单位进行限定,例如该进度条的最小时间单位可以为1秒,或者可以为1微秒。
在一种可能的实施方式中,进度条可以以一条直线的方式进行显示,该进度条的最小时间单位以1秒为例,则进度条上每1秒对应一个位置,进度控制节点可以位于任一位置上。进度条上的多个位置可以与音频的多个时间点一一对应,当播放有声读物的音频时,该进度控制节点可以随着有声读物的音频的播放进度在进度条上进行移动。
在一种可能的实施方式中,与音频对应的进度条以及进度条上的进度控制节点的示意图可以如图3所示。在图3中,音频的时间长度为60分钟,因此,可以在进度条的结束显示60:00。可选地,可以在进度条的起始位置显示当前音频播放位置对应的时间点。例如,当前音频播放位置对应的时间点为18:15时,进度条的起始位置处显示有18:15,即当前音频播放位置对应的时间点。而此时,进度控制节点在进度条上的位置即为当前音频播放位置,也即当前播放的音频的时间点所对应的位置。例如,进度控制节点位于进度条上与时间点18:15对应的位置,也即A点对应的位置,该位置即为第一位置。
在步骤202中,响应于进度控制节点被调节至第二位置,在音频中获取与第二位置对应的第一音频信息。
在一种可能的实现方式中,该第二位置为交互对象的操作动作对应的位置,本申请实施例不对该操作动作进行限定。例如,当终端11为平板电脑或触屏手机等等可以触控的设备时,该终端11的交互对象可以基于触控的方式对进度控制节点在进度条上的位置进行调节,以实现音频播放的进度调节。示例性地,该操作动作可以为拖拽动作或者点击动作。又例如,当终端11为电脑显示屏等不可触控的设备时,该终端11的交互对象可以基于鼠标等设备对进度控制节点在进度条上的位置进行调节,以实现音频播放的进度调节。示例性地,该操作动作可以为鼠标选中动作。
在示例性实施例中,第二位置可以为进度条上除第一位置之外的任意位置。例如在图3中,此时的第一位置为进度条上与时间点18:15对应的位置,进度条的时间长度为60分钟,因此,第二位置可以为进度条上所有位置中除时间点18:15对应的位置之外的任一位置。例如,该第二位置可以为图3中的B点所对应的位置。
示例性地,第一音频信息是在参考时段内播放的音频,参考时段的起始时间为第二位置对应的时间点。本申请实施例不对该参考时段的长度进行限定,该参考时段的长度可以基于经验或应用场景进行设定,例如该参考时段的长度可以为10秒。
本申请实施例也不对获取该第一音频信息的方式进行限定,以参考时段的长度为10秒为例,可以在音频中截取从第二位置对应的时间点起始的10秒长度的音频作为第一音频信息。例如,当从第二位置对应的时间点起始的10秒长度的音频的内容为“ABCDEFGH”时,则与第二位置对应的第一音频信息可以为“ABCDEFGH”的音频数据。
在步骤203中,对第一音频信息进行文本转换,得到第一音频信息的第一文本。
在示例性实施例中,第一音频信息的内容与第一文本的内容相同,可以使用例如ANN(Approximate Nearest Neighbors,人工神经网络)或者HMM(Hidden Markov Model,隐马尔科夫模型)等将第一音频信息进行文本转换,得到对应的第一文本。
在一种可能的实施方式中,可以通过例如BERT(Bidirectional EncoderRepresentation from Transformers,一个预训练的语言表征模型)进行预测的方法对得到的第一文本中的文字添加对应的标点符号。例如,第一文本中的文字可以为“今天是好日子天气很好”,添加标点符号后的第一文本可以为“今天是好日子,天气很好。”。
可选地,在基于第一音频信息进行文本转换,得到第一文本之后,可以对第一文本进行文本纠错,以避免文本转换的过程中出现错误,从而提高第一文本的准确性。本申请实施例不对文本纠错的方法进行限定,例如,可以通过词典匹配以及KenLM(KennethLanguage Model,一个语言模型工具)模型来进行文本纠错。又例如可以通过pycorrector(一个中文文本纠错工具)来进行文本纠错。
若通过提前对该有声读物的音频文件匹配一个文本文件的方法得到第一文本,该文本文件中的文本信息可以与音频文件中播放该文本信息对应的音频信息的时间点相对应,提前匹配文本文件会增加成本。且匹配可能出现错误,降低了文本信息显示的准确性,从而降低了进度调节的准确性。本申请实施例提供的方法通过文本转换的方法获取音频信息对应的文本,可以节约成本并提高文本显示的准确性,从而提高进度调节的准确性以及进度调节的效率。
在步骤204中,显示第一文本,播放第二位置对应的时间点的音频。
可选地,显示第一文本,包括:在进度条上的第二位置处显示文本框,通过文本框显示第一文本。
示例性地,在进度条上的第二位置处显示文本框,通过文本框显示第一文本的示意图可以如图4所示。在图4中,当前播放音频的位置为05:05时间点对应的位置,在进度条的起始位置处显示有时间点05:05,该音频总长为60分钟,因而在进度条的结束位置显示60:00。当进度控制节点被调节至第二位置,也即时间点21:30的位置处,第一文本可以为“ABCDEFG”。因而可以在进度条上的第二位置处显示一个如图4所示的文本框,并通过该文本框显示第一文本“ABCDEFG”。
或者,也可以在该进度条所在界面上的任一指定位置处显示一个文本框,并通过该文本框显示第一文本,本申请实施例不对显示文本框的位置进行限定。
可选地,播放第二位置对应的时间点的音频,包括:响应于第二位置为确认后的调节位置,播放第二位置对应的时间点的音频。
在示例性实施例中,进度控制节点通过交互对象的操作动作进行调节,例如在终端11为可以触控的设备的情况下,则可以通过拖拽动作来实现将进度控制节点调节至第二位置,如果拖拽动作在第二位置结束,则可以确定第二位置为确认后的调节位置。如果拖拽动作在第二位置暂停,但未结束,则可以仅显示第一文本,根据后续得到的确认后的调节位置来播放对应时间点的音频。其中,拖拽动作结束,可以认为用户对当前调节的位置进行了确认,该第二位置即为用户希望调节的问题,因此,在显示第一文本的情况下,可继续播放第二位置对应的时间点的音频。但是,如果拖拽动作在第二位置暂停,但未结束,可能用户还不确定是否结束调节,或者说该第二位置未被确认为是调节后的位置,因此,可先显示第一文本,但确认后再播放对应时间点的音频。
在一种可能的实施方式中,在调节位置未确认时,可以继续播放当前播放的第一位置对应的时间点的音频,直到调节位置确认后,停止播放第一位置对应的时间点的音频,进而播放确认后的第二位置对应的时间点的音频。
在另一种可能的实施方式中,在调节位置未确认时,可以停止播放当前播放的第一位置对应的时间点的音频,并实时地播放当前进度控制节点的位置对应的时间点的音频。
可选地,显示第一文本之后,还包括:响应于进度控制节点被继续调节至第三位置,在音频中获取与第三位置对应的第二音频信息;对第二音频信息进行文本转换,得到第二音频信息的第二文本;显示第二文本,播放第三位置对应的时间点的音频。
本申请实施例不对第三位置进行限定,第三位置可以为进度条上区别于第二位置的任一位置。可选地,第三位置与第一位置也可以相同。
在一种可能的实施方式中,获取与第三位置对应的第二音频信息的方法可以与上述步骤202中获取与第二位置对应的第一音频信息的方法相同,此处不再赘述。可选地,本步骤中得到第二音频信息的第二文本的方法可以与上述步骤203中得到第一音频信息的第一文本的方法相同,此处不再赘述。示例性地,显示第二文本,播放第三位置对应的时间点的音频的方法可以与步骤204中显示第一文本,播放第二位置对应的时间点的音频的方法相同,此处不再进行赘述。
可选地,显示第一文本之后,还包括:响应于进度控制节点被调节至第二位置的动作被撤销,将进度控制节点在进度条上的位置还原至第一位置,播放第一位置对应的时间点的音频。
本申请实施例不对撤销调节进度控制节点的动作的方式进行限定,该方式可以基于经验或应用场景进行确定。例如,对于终端11为平板电脑或触屏手机等等可以触控的设备的情况时,该终端11的交互对象可以基于触控的方式对进度控制节点进行调节,并可以通过触控的方式撤销对进度控制节点的调节。示例性地,当交互对象通过手指调节进度控制节点时,手指拖拽进度控制节点,并在拖拽动作未结束时,手指接触触控屏的点与进度控制节点的距离大于第一阈值,则该次调节进度控制节点的动作被撤销。本申请实施例不对第一阈值进行限定,该第一阈值可以基于经验或应用场景进行设定。例如,该第一阈值可以为1厘米。
又例如,对于终端11为电脑显示屏等不可触控的设备,该终端11的交互对象可以基于鼠标对进度控制节点进行调节,并可以通过鼠标撤销对进度控制节点的调节。示例性地,当交互对象通过鼠标调节进度控制节点时,鼠标光标选中进度控制节点后,光标拖动进度控制节点,且在拖动进度控制节点的过程中,光标的位置移动到与进度控制节点的位置距离大于第二阈值的位置处,则该次调节进度控制节点的动作被撤销。本申请实施例不对第二阈值进行限定,该第二阈值可以基于经验或应用场景进行设定,例如该第一阈值可以为2厘米。
本申请实施例在进度控制节点被调节至第二位置后,在音频中获取与第二位置对应的第一音频信息,通过对第一音频信息进行文本转换,得到第一文本。由于第一文本是调节后的音频信息对应的文本内容,因此,对第一文本进行显示可以起到提示的作用,使进度调节可视化,提高了进度调节的准确性,从而提高进度调节的效率。
如图5所示,本申请实施例提供了一种进度调节的方法,该方法可以包括如下步骤。
501,调节进度。对进度的调节可以通过调节进度控制节点在进度条上的位置实现,该步骤的实现方式可参见上述步骤201与步骤202,此处不再赘述。
502,获取调节进度后的N秒的音频信息,例如N可以为大于零的正整数。该步骤的实现方式可参见上述步骤202,此处不再赘述。
503,将N秒的音频信息转换为文本。该步骤的实现方式可参见上述步骤203,此处不再赘述。
504,显示转换后的文本。该步骤的实现方式可参见上述步骤204,此处不再赘述。
505,播放进度调节后对应的音频。当通过调节进度控制节点实现对进度的调节时,进度调节后对应的音频即为位置调节后的进度控制节点所在的位置对应的时间点的音频。
参见图6,本申请实施例提供了一种进度调节装置,该装置包括:
播放模块601,用于播放有声读物的音频,显示与音频对应的进度条,进度条上显示有进度控制节点,进度控制节点在进度条上的位置为第一位置;
获取模块602,用于响应于进度控制节点被调节至第二位置,在音频中获取与第二位置对应的第一音频信息;
确定模块603,用于对第一音频信息进行文本转换,得到第一音频信息的第一文本;
播放模块601,还用于显示第一文本,播放第二位置对应的时间点的音频。
在一种可能的实现方式中,第一音频信息是在参考时段内播放的音频,参考时段的起始时间为第二位置对应的时间点。
在一种可能的实现方式中,播放模块601,用于在进度条上的第二位置处显示文本框,通过文本框显示第一文本。
在一种可能的实现方式中,获取模块602,还用于响应于进度控制节点被继续调节至第三位置,在音频中获取与第三位置对应的第二音频信息;
确定模块603,还用于对第二音频信息进行文本转换,得到第二音频信息的第二文本;
播放模块601,还用于显示第二文本,播放第三位置对应的时间点的音频。
在一种可能的实现方式中,播放模块601,还用于响应于进度控制节点被调节至第二位置的动作被撤销,将进度控制节点在进度条上的位置还原至第一位置,播放第一位置对应的时间点的音频。
在一种可能的实现方式中,播放模块601,用于响应于第二位置为确认后的调节位置,播放第二位置对应的时间点的音频。
本申请实施例在进度控制节点被调节至第二位置后,在音频中获取与第二位置对应的第一音频信息,通过对第一音频信息进行文本转换,得到第一文本。由于第一文本是调节后的音频信息对应的文本内容,因此,对第一文本进行显示可以起到提示的作用,使进度调节可视化,提高了进度调节的准确性,从而提高进度调节的效率。
需要说明的是,上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图7是本申请实施例提供的一种计算机设备的结构示意图,该计算机设备可以为服务器,该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器701和一个或多个存储器702,处理器701例如为CPU(Central Processing Units,中央处理器)。其中,该一个或多个存储器702中存储有至少一条计算机程序,该至少一条计算机程序由该一个或多个处理器701加载并执行,以使该服务器实现上述各个方法实施例提供的进度调节方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
图8是本申请实施例提供的一种计算机设备的结构示意图。该设备可以为终端,例如可以是:智能手机、平板电脑、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group AudioLayer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端包括有:处理器801和存储器802。
处理器801可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器801可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU;协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器801可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器801还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器802可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器802中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器801所执行,以使该终端实现本申请中方法实施例提供的进度调节方法。
在一些实施例中,终端还可选包括有:***设备接口803和至少一个***设备。处理器801、存储器802和***设备接口803之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与***设备接口803相连。具体地,***设备包括:射频电路804、显示屏805、摄像头组件806、音频电路807、定位组件808和电源809中的至少一种。
***设备接口803可被用于将I/O(Input/Output,输入/输出)相关的至少一个***设备连接到处理器801和存储器802。在一些实施例中,处理器801、存储器802和***设备接口803被集成在同一芯片或电路板上;在一些其他实施例中,处理器801、存储器802和***设备接口803中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路804用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路804将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路804包括:天线***、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路804可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路804还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏805用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时,显示屏805还具有采集在显示屏805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器801进行处理。此时,显示屏805还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏805可以为一个,设置在终端的前面板;在另一些实施例中,显示屏805可以为至少两个,分别设置在终端的不同表面或呈折叠设计;在另一些实施例中,显示屏805可以是柔性显示屏,设置在终端的弯曲表面上或折叠面上。甚至,显示屏805还可以设置成非矩形的不规则图形,也即异形屏。显示屏805可以采用LCD(LiquidCrystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件806用于采集图像或视频。可选地,摄像头组件806包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件806还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器801进行处理,或者输入至射频电路804以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器801或射频电路804的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路807还可以包括耳机插孔。
定位组件808用于定位终端的当前地理位置,以实现导航或LBS(Location BasedService,基于位置的服务)。定位组件808可以是基于美国的GPS(Global PositioningSystem,全球定位***)、中国的北斗***、俄罗斯的格雷纳斯***或欧盟的伽利略***的定位组件。
电源809用于为终端中的各个组件进行供电。电源809可以是交流电、直流电、一次性电池或可充电电池。当电源809包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端还包括有一个或多个传感器810。该一个或多个传感器810包括但不限于:加速度传感器811、陀螺仪传感器812、压力传感器813、指纹传感器814、光学传感器815以及接近传感器816。
加速度传感器811可以检测以终端建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器811可以用于检测重力加速度在三个坐标轴上的分量。处理器801可以根据加速度传感器811采集的重力加速度信号,控制显示屏805以横向视图或纵向视图进行用户界面的显示。加速度传感器811还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器812可以检测终端的机体方向及转动角度,陀螺仪传感器812可以与加速度传感器811协同采集用户对终端的3D动作。处理器801根据陀螺仪传感器812采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器813可以设置在终端的侧边框和/或显示屏805的下层。当压力传感器813设置在终端的侧边框时,可以检测用户对终端的握持信号,由处理器801根据压力传感器813采集的握持信号进行左右手识别或快捷操作。当压力传感器813设置在显示屏805的下层时,由处理器801根据用户对显示屏805的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器814用于采集用户的指纹,由处理器801根据指纹传感器814采集到的指纹识别用户的身份,或者,由指纹传感器814根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器801授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器814可以被设置在终端的正面、背面或侧面。当终端上设置有物理按键或厂商Logo(商标)时,指纹传感器814可以与物理按键或厂商Logo集成在一起。
光学传感器815用于采集环境光强度。在一个实施例中,处理器801可以根据光学传感器815采集的环境光强度,控制显示屏805的显示亮度。具体地,当环境光强度较高时,调高显示屏805的显示亮度;当环境光强度较低时,调低显示屏805的显示亮度。在另一个实施例中,处理器801还可以根据光学传感器815采集的环境光强度,动态调整摄像头组件806的拍摄参数。
接近传感器816,也称距离传感器,通常设置在终端的前面板。接近传感器816用于采集用户与终端的正面之间的距离。在一个实施例中,当接近传感器816检测到用户与终端的正面之间的距离逐渐变小时,由处理器801控制显示屏805从亮屏状态切换为息屏状态;当接近传感器816检测到用户与终端的正面之间的距离逐渐变大时,由处理器801控制显示屏805从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图8中示出的结构并不构成对终端的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
在示例性实施例中,还提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条计算机程序。该至少一条计算机程序由一个或者一个以上处理器加载并执行,以使该计算机设备实现上述任一种进度调节方法。
在示例性实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由计算机设备的处理器加载并执行,以使计算机实现上述任一种进度调节方法。
在一种可能实现方式中,上述计算机可读存储介质可以是只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、只读光盘(Compact DiscRead-Only Memory,CD-ROM)、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一种进度调节方法。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种进度调节方法,其特征在于,所述方法包括:
播放有声读物的音频,显示与所述音频对应的进度条,所述进度条上显示有进度控制节点,所述进度控制节点在所述进度条上的位置为第一位置;
响应于所述进度控制节点被调节至第二位置,在所述音频中获取与所述第二位置对应的第一音频信息;
对所述第一音频信息进行文本转换,得到所述第一音频信息的第一文本;
显示所述第一文本,播放所述第二位置对应的时间点的音频。
2.根据权利要求1所述的方法,其特征在于,所述第一音频信息是在参考时段内播放的音频,所述参考时段的起始时间为所述第二位置对应的时间点。
3.根据权利要求1所述的方法,其特征在于,所述显示所述第一文本,包括:
在所述进度条上的所述第二位置处显示文本框,通过所述文本框显示所述第一文本。
4.根据权利要求1-3任一所述的方法,其特征在于,所述显示所述第一文本之后,还包括:
响应于所述进度控制节点被继续调节至第三位置,在所述音频中获取与所述第三位置对应的第二音频信息;
对所述第二音频信息进行文本转换,得到所述第二音频信息的第二文本;
显示所述第二文本,播放所述第三位置对应的时间点的音频。
5.根据权利要求1-3任一所述的方法,其特征在于,所述显示所述第一文本之后,还包括:
响应于所述进度控制节点被调节至第二位置的动作被撤销,将所述进度控制节点在所述进度条上的位置还原至所述第一位置,播放所述第一位置对应的时间点的音频。
6.根据权利要求1所述的方法,其特征在于,所述播放所述第二位置对应的时间点的音频,包括:
响应于所述第二位置为确认后的调节位置,播放所述第二位置对应的时间点的音频。
7.一种进度调节装置,其特征在于,所述装置包括:
播放模块,用于播放有声读物的音频,显示与所述音频对应的进度条,所述进度条上显示有进度控制节点,所述进度控制节点在所述进度条上的位置为第一位置;
获取模块,用于响应于所述进度控制节点被调节至第二位置,在所述音频中获取与所述第二位置对应的第一音频信息;
确定模块,用于对所述第一音频信息进行文本转换,得到所述第一音频信息的第一文本;
所述播放模块,还用于显示所述第一文本,播放所述第二位置对应的时间点的音频。
8.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以使所述计算机设备实现如权利要求1至6任一所述的进度调节方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使计算机实现如权利要求1至6任一所述的进度调节方法。
10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中,计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,所述处理器执行所述计算机指令,使得所述计算机设备执行实现如权利要求1至6任一所述的进度调节方法。
CN202111601413.1A 2021-12-24 2021-12-24 进度调节方法、装置、设备及计算机可读存储介质 Pending CN114495993A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111601413.1A CN114495993A (zh) 2021-12-24 2021-12-24 进度调节方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111601413.1A CN114495993A (zh) 2021-12-24 2021-12-24 进度调节方法、装置、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN114495993A true CN114495993A (zh) 2022-05-13

Family

ID=81496972

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111601413.1A Pending CN114495993A (zh) 2021-12-24 2021-12-24 进度调节方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN114495993A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103561217A (zh) * 2013-10-14 2014-02-05 深圳创维数字技术股份有限公司 一种生成字幕的方法及终端
CN104091609A (zh) * 2013-05-22 2014-10-08 腾讯科技(深圳)有限公司 音乐播放器的歌词预览方法和装置
CN104267903A (zh) * 2014-09-24 2015-01-07 广州酷狗计算机科技有限公司 多媒体歌词信息显示方法及装置
CN105609121A (zh) * 2014-11-20 2016-05-25 深圳市腾讯计算机***有限公司 多媒体播放进度控制方法及装置
CN105847991A (zh) * 2016-03-30 2016-08-10 乐视控股(北京)有限公司 一种多媒体数据的播放方法及终端
WO2019105393A1 (zh) * 2017-11-30 2019-06-06 腾讯科技(深圳)有限公司 网页内容的处理方法、装置、浏览器、设备及存储介质
CN110688046A (zh) * 2019-09-24 2020-01-14 腾讯音乐娱乐科技(深圳)有限公司 歌曲播放方法、装置及存储介质
CN111261162A (zh) * 2020-03-09 2020-06-09 北京达佳互联信息技术有限公司 语音识别方法、语音识别装置及存储介质
CN112634876A (zh) * 2021-01-04 2021-04-09 北京有竹居网络技术有限公司 语音识别方法、装置、存储介质及电子设备
CN112752047A (zh) * 2019-10-30 2021-05-04 北京小米移动软件有限公司 视频录制方法、装置、设备及可读存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104091609A (zh) * 2013-05-22 2014-10-08 腾讯科技(深圳)有限公司 音乐播放器的歌词预览方法和装置
CN103561217A (zh) * 2013-10-14 2014-02-05 深圳创维数字技术股份有限公司 一种生成字幕的方法及终端
CN104267903A (zh) * 2014-09-24 2015-01-07 广州酷狗计算机科技有限公司 多媒体歌词信息显示方法及装置
CN105609121A (zh) * 2014-11-20 2016-05-25 深圳市腾讯计算机***有限公司 多媒体播放进度控制方法及装置
CN105847991A (zh) * 2016-03-30 2016-08-10 乐视控股(北京)有限公司 一种多媒体数据的播放方法及终端
WO2019105393A1 (zh) * 2017-11-30 2019-06-06 腾讯科技(深圳)有限公司 网页内容的处理方法、装置、浏览器、设备及存储介质
CN110688046A (zh) * 2019-09-24 2020-01-14 腾讯音乐娱乐科技(深圳)有限公司 歌曲播放方法、装置及存储介质
CN112752047A (zh) * 2019-10-30 2021-05-04 北京小米移动软件有限公司 视频录制方法、装置、设备及可读存储介质
CN111261162A (zh) * 2020-03-09 2020-06-09 北京达佳互联信息技术有限公司 语音识别方法、语音识别装置及存储介质
CN112634876A (zh) * 2021-01-04 2021-04-09 北京有竹居网络技术有限公司 语音识别方法、装置、存储介质及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宫鹏;宫;王瑞宝;: "基于嵌入式***的多媒体音乐播放器", 现代电子技术, no. 12 *

Similar Documents

Publication Publication Date Title
CN108965922B (zh) 视频封面生成方法、装置和存储介质
CN109346111B (zh) 数据处理方法、装置、终端及存储介质
CN111083526B (zh) 视频转场方法、装置、计算机设备及存储介质
CN110321126B (zh) 生成页面代码的方法和装置
CN110288689B (zh) 对电子地图进行渲染的方法和装置
CN110543350A (zh) 一种生成页面组件的方法及装置
CN111459363A (zh) 信息展示方法、装置、设备及存储介质
CN111402844B (zh) 歌曲合唱的方法、装置及***
CN114594923A (zh) 车载终端的控制方法、装置、设备及存储介质
CN112764654A (zh) 组件的吸附操作方法、装置、终端及存储介质
CN110677713B (zh) 视频图像处理方法及装置、存储介质
WO2020253129A1 (zh) 歌曲显示方法、装置、设备及存储介质
CN109783176B (zh) 切换页面的方法和装置
CN111437600A (zh) 剧情展示方法、装置、设备及存储介质
CN113843814A (zh) 机械臂设备的控制***、方法、装置和存储介质
CN113160031A (zh) 图像处理方法、装置、电子设备及存储介质
CN111158575B (zh) 终端执行处理的方法、装置、设备以及存储介质
CN110868642B (zh) 视频播放方法、装置及存储介质
CN112100528A (zh) 对搜索结果评分模型进行训练的方法、装置、设备、介质
CN110992954A (zh) 语音识别的方法、装置、设备及存储介质
CN114595019A (zh) 应用程序的主题设置方法、装置、设备及存储介质
CN114388001A (zh) 多媒体文件的播放方法、装置、设备及存储介质
CN114594885A (zh) 应用图标的管理方法、装置、设备及计算机可读存储介质
CN113469322B (zh) 确定模型的可执行程序的方法、装置、设备及存储介质
CN110688046B (zh) 歌曲播放方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination