CN114879929A - 多媒体文件播放方法及其装置 - Google Patents

多媒体文件播放方法及其装置 Download PDF

Info

Publication number
CN114879929A
CN114879929A CN202210372666.4A CN202210372666A CN114879929A CN 114879929 A CN114879929 A CN 114879929A CN 202210372666 A CN202210372666 A CN 202210372666A CN 114879929 A CN114879929 A CN 114879929A
Authority
CN
China
Prior art keywords
value
gain
target
volume
volume value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210372666.4A
Other languages
English (en)
Inventor
程戈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN202210372666.4A priority Critical patent/CN114879929A/zh
Publication of CN114879929A publication Critical patent/CN114879929A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请提供了一种多媒体文件播放方法及其装置,属于音视频处理技术领域。该方法包括:获取待播放的目标多媒体文件对应的第一音量值;基于预设的基准音量值、预设的初始增益值和所述第一音量值,确定目标多媒体文件对应的目标增益值;基于目标增益值对第一音量值进行调整,获得第二音量值;基于第二音量值播放目标多媒体文件。

Description

多媒体文件播放方法及其装置
技术领域
本申请属于音视频处理技术领域,具体涉及多媒体文件播放方法及其装置。
背景技术
随着智能设备的普及,越来越多的用户使用电子设备进行听音乐、看电影或刷短视频等娱乐活动。
然而,用户在使用电子设备播放多媒体文件时,每个多媒体文件对应的音量信息是不相同的,用户在切换多媒体文件之后,播放的下一个多媒体文件的音量可能过高或过低,导致播放的多媒体文件的音量值不稳定,这需要用户通过较为繁琐的操作手动调节音量,进而降低了用户使用电子设备播放多媒体文件的便捷性。
发明内容
本申请实施例的目的是一种多媒体文件播放方法及其装置,能够解决用户使用电子设备播放多媒体文件不够便捷的问题。
第一方面,本申请实施例提供了一种多媒体文件播放方法,该方法包括:
获取待播放的目标多媒体文件对应的第一音量值;
基于预设的基准音量值、预设的初始增益值和所述第一音量值,确定所述目标多媒体文件对应的目标增益值;
基于所述目标增益值对所述目标多媒体文件对应的第一音量值进行调整,获得第二音量值;所述第二音量值位于以所述基准音量值为中心的动态范围内;
基于所述第二音量值播放所述目标多媒体文件。
第二方面,本申请实施例提供了一种多媒体文件播放装置,该装置包括:
获取模块,用于获取待播放的目标多媒体文件对应的第一音量值;
确定模块,用于基于预设的基准音量值、预设的初始增益值和所述第一音量值,确定所述目标多媒体文件对应的目标增益值;
调整模块,用于基于所述目标增益值对所述目标多媒体文件对应的第一音量值进行调整,获得第二音量值;所述第二音量值位于以所述基准音量值为中心的动态范围内;
播放模块,用于基于所述第二音量值播放所述目标多媒体文件。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
第六方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面所述的方法。
本申请实施例中,获取待播放的目标多媒体文件对应的第一音量值;基于预设的基准音量值、预设的初始增益值和第一音量值,确定目标多媒体文件对应的目标增益值;其中,上述基准音量值用于确定调整后的音量值所处的动态范围。进而使用该目标增益值对第一音量值进行调整,获得第二音量值,并使得第二音量值位于以基准音量值为中心的动态范围内,应理解,上述第二音量值为切换后的多媒体文件的音量值,以此保证在切换多媒体文件的过程中,处于播放状态的多媒体文件的音量值处于稳定的状态。这样,在切换多媒体文件的过程中,不需要用户手动调节多媒体文件对应的音量,减少了用户在播放多媒体文件过程中的操作,提高了用户播放多媒体文件的便捷性。
附图说明
图1是本申请实施例提供的多媒体文件播放方法的流程图;
图2是本申请实施例提供的多媒体文件播放方法的应用场景图之一;
图3a是本申请实施例提供的多媒体文件播放方法的语音时域波形图;
图3b是本申请实施例提供的多媒体文件播放方法的语音检测结果图;
图3c是本申请实施例提供的多媒体文件播放方法的语音频谱图;
图4是本申请实施例提供的多媒体文件播放方法的应用场景图之二;
图5是本申请实施例提供的多媒体文件播放方法的应用流程图之一;
图6是本申请实施例提供的多媒体文件播放方法的应用流程图之二;
图7是本申请实施例提供的多媒体文件播放装置的结构图;
图8是本申请实施例提供的电子设备的结构图;
图9是本申请实施例提供的电子设备的硬件结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的多媒体文件播放方法进行详细地说明。
请参阅图1,图1是本申请实施例提供的多媒体文件播放方法的流程图。本申请实施例提供的多媒体文件播放方法包括以下步骤:
S101,获取待播放的目标多媒体文件对应的第一音量值。
应理解,本申请实施例提供的多媒体文件播放方法可以应用于电子设备安装的视频应用程序,或音视频应用程序,在此不做具体限制。
以多媒体文件播放方法应用于短视频应用程序为例,如图2所示,可以在短视频应用程序的设置界面上添加“实时调节音量”的触控开关,若该触控开关处于开启状态,则应用本申请实施例提供的多媒体文件播放方法播放视频文件。
本步骤中,在多媒体文件播放方法应用于视频应用程序的情况下,上述目标多媒体文件为待播放的视频文件。可选地,可以对视频文件对应的音频信号以10至20毫秒为一帧,对每帧音频信号进行短时处理,保证音频信号的稳定性和实时性,其中,上述短时处理包括对音频信号进行分帧、加窗和傅里叶变化的操作步骤。
本步骤中,上述第一音量值可以是目标多媒体文件中包括人声的音频信号对应的音量值。可选地,可以使用语音端点检测(Voice Activaty Detection,VAD)算法,提取目标多媒体文件对应的音频信号中的人声部分。
为便于理解,请一并参阅图3a至3c,图3a示出的是目标多媒体文件对应的音频信号的语音时域波形图。使用VAD算法提取目标多媒体文件对应的音频信号中的人声部分,可以得到第一音量值对应的音频信号。将上述音频信号中的人声部分标记为1,非人声部分标记为0,可以得到图3b示出的语音检测结果图和图3c示出的语音频谱图。
S102,基于预设的基准音量值、预设的初始增益值和所述第一音量值,确定所述目标多媒体文件对应的目标增益值。
本步骤中,视频应用程序可以播放视频文件,接收用户对该视频文件进行音量调节的指令,将该视频文件调节后的音量,确定为上述基准音量值。
可选地,如图4所示,在视频应用程序的设置界面显示弹窗,弹窗内容为“确认该音量为标准播放音量?”,若接收到用户对“确定”控件的触控指令,则将视频文件调节后的音量确定为上述基准音量值。
一可选地实施方式为,可以接收用户通过触控操作或其他类型的操作输入的音量值,将该音量值确定为基准音量值。
上述初始增益值即视频应用程序对第一音量值进行增益的相关参数值,应理解,由于每个多媒体文件对应的第一音量值可能不同,因此使用初始增益值对第一音量值进行增益,得到的多媒体文件对应的音量值也可能不同。
本步骤中,可以基于上述第一音量值、预设的基准音量值和预设的初始增益值,确定目标多媒体文件对应的目标增益值。具体的如何确定目标增益值的实施方式,请参阅后续实施例。
S103,基于所述目标增益值对所述第一音量值进行调整,获得第二音量值。
如上所述,将目标多媒体文件对应的音频信号以10至20毫秒为一帧,本步骤中,如图5所示,可以计算每一帧音频信号对应的目标增益值,使用自动增益控制(AutomaticGain Control,AGC)算法和目标增益值对对应的音频信号进行增益,以调整目标多媒体文件对应的第一音量值,得到第二音量值。其中,图5中的“一个数据”可以理解为一帧音频信号,“增益系数”可以理解为目标增益值,“峰值”可以理解为对第一音量值增益后的最大音量值。
应理解,为了保证音量值的稳定性,上述第二音量值位于以基准音量值为中心的动态范围内,具体而言,可以通过目标增益值对第一音量值进行调整,获得第二音量值,并使得第二音量值处于以基准音量值为中心的动态范围内。
一种可能存在的情况为,第二音量小于第一音量值,且位于以基准音量值为中心的动态范围内。另一种可能存在的情况为,第二音量值大于第一音量值,且位于以基准音量值为中心的动态范围内。
S104,基于所述第二音量值播放所述目标多媒体文件。
本步骤中,对目标多媒体文件对应的第一音量值进行调整后,按照第二音量值播放目标多媒体文件,实现在播放多媒体文件的过程中,自动调节音量的效果。
本申请实施例中,获取待播放的目标多媒体文件对应的第一音量值;基于预设的基准音量值、预设的初始增益值和第一音量值,确定目标多媒体文件对应的目标增益值;其中,上述基准音量值用于确定调整后的音量值所处的动态范围。进而使用该目标增益值对第一音量值进行调整,获得第二音量值,并使得第二音量值位于以基准音量值为中心的动态范围内,应理解,上述第二音量值为切换后的多媒体文件的音量值,以此保证在切换多媒体文件的过程中,处于播放状态的多媒体文件的音量值处于稳定的状态。这样,在切换多媒体文件的过程中,不需要用户手动调节多媒体文件对应的音量,减少了用户在播放多媒体文件过程中的操作,提高了用户播放多媒体文件的便捷性。
以下,具体阐述确定目标多媒体文件对应的目标增益值的技术方案:
可选地,所述基于预设的基准音量值、预设的初始增益值和所述第一音量值,确定所述目标多媒体文件对应的目标增益值包括:
根据所述第一音量值和所述基准音量值,确定第一增益参数值;
根据所述第一增益参数值、所述第一音量值、所述基准音量值和预设的初始增益值,确定所述目标多媒体文件对应的目标增益值。
上述第一增益参数值用于表征对第一音量值进行调整的速度。本实施例中,可以根据第一音量值和基准音量值,确定第一增益参数值,具体的如何确定第一增益参数值的技术方案,请参阅后续实施例。
在得到第一增益参数之后,可以将第一增益参数值、第一音量值、基准音量值和预设的初始增益值代入改进后的增益计算公式中,计算得到目标多媒体文件对应的目标增益值。具体的如何确定目标增益值的技术方案,请参阅后续实施例。
以下,具体阐述确定第一增益参数值的技术方案:
可选地,所述根据所述第一音量值和所述基准音量值,确定第一增益参数值包括:
计算第一数值与第二数值之间的第一差值;
根据所述第一差值的数值范围,确定所述增益时长;
将第三数值和预设的第四数值中的最大值,确定为所述第一增益参数值。
上述第一数值为第一音量值对应的对数函数值,上述第二数值为基准音量值对应的对数函数值。具体而言,可以通过以下公式确定第一数值与第二数值之间的第一差值:
H=log(x(n))-log(y0(n))
其中,H为第一差值,x(n)为第一音量值,log(x(n))为第一数值,y0(n)为基准音量值,log(y0(n))为第二数值。
在计算得到第一数值与第二数值之间的第一差值后,可以基于该第一差值所处的数值范围,确定增益时长,其中,增益时长用于表征在对第一音量值进行调节的过程中,第一音量值进行增益的时长。
本实施例中,还预设有第四数值,上述第四数值为一个经验数值,在确定增益时长后,将第三数值和预设的第四数值中的最大值,确定为第一增益参数值。其中,上述第三数值用于表征增益时长的预设倍数。可选地,上述预设倍数可以为4倍,上述第四数值可以为1,这种情况下,可以通过以下公式确定第一增益参数值:
a=max(4t,1)
其中,a为第一增益参数盒子,t为增益时长,4t为第三数值,1为第四数值。
可选地,所述根据所述第一差值的数值范围,确定所述增益时长包括:
在所述第一差值小于第一预设阈值的情况下,确定所述增益时长为第一预设时长;
在所述第一差值大于或等于第一预设阈值,且小于或等于第二预设阈值的情况下,确定所述增益时长为第二预设时长;
在所述第一差值大于第二预设阈值的情况下,确定所述增益时长为第三预设时长。
本实施例中,预先设置有第一预设阈值和第二预设阈值,基于第一差值、第一预设阈值和第二预设阈值三者之间的大小关系,确定增益时长。
上述第一预设阈值、第二预设阈值、第一预设时长、第二预设时长和第三预设时长均为经验数值。可选地,上述第一预设阈值为5,第二预设阈值为20,第一预设时长为4秒,第二预设时长为1秒,第三预设时长为0.5毫米,这种情况下,可以通过以下公式确定增益时长:
t=4s,5>H
t=1s,20≥H≥5
t=0.5ms,H>20
其中,t为增益时长,H为第一差值。
应理解,上述第一预设阈值、第二预设阈值、第一预设时长、第二预设时长和第三预设时长也可以为其他数值,在此不做具体限定,
可选地,所述根据所述第一增益参数值、所述第一音量值、所述基准音量值和预设的初始增益值,确定所述目标多媒体文件对应的目标增益值包括:
对所述第一增益参数值和第五数值进行乘法运算,得到第六数值;
将所述第六数值和所述初始增益值对应的对数函数值之间的和值,确定为第八数值;
对所述第八数值进行对数函数逆运算,得到所述目标增益值。
现有的增益计算公式为:
Figure BDA0003589142510000081
其中,A(n+1)为目标增益值,a为第一增益参数值,A0为预设的期望增益,Ain为信号幅度,A(n)为初始增益值。
应理解,在使用现有的增益计算公式计算目标增益值的过程中,需要进行多次乘法运算,导致计算得到目标增益值的运算时间较长。
本实施例中,上述第五数值为基准音量值对应的对数函数值与第七数值之间的差值,上述第七数值为目标绝对值对应的对数函数值,上述目标绝对值为初始增益值与第一音量值的乘法结果的绝对值。上述第八数值为目标增益值对应的对数函数值。
具体而言,可以通过以下改进后的增益计算公式得到第八数值:
log(A(n+1))=log(A(n))+a[log(y0(n))-log(|A(n)x(n)|)]
其中,log(A(n+1))为第八数值,log(A(n))为初始增益值对应的对数函数值,a[log(y0(n))-log(|A(n)x(n)|)]为第六数值,a为第一增益参数值,|A(n)x(n)|为目标绝对值,log(|A(n)x(n)|)为第七数值,log(y0(n))-log(|A(n)x(n)|)为第五数值。
如上所述,第八数值为目标增益值对应的对数函数值,在得到第八数值后,对第八数值进行对数函数逆运算,得到目标增益值。
本实施例中,通过上述计算方式,减少了计算目标增益值过程中的乘法步骤,以此降低了计算目标增益值的运算时间。
可选地,所述基于所述目标增益值对所述第一音量值进行调整,获得第二音量值包括:
计算目标音量值对应的对数函数值与第四数值之间的第二差值;
将所述第二差值的绝对值,确定为第二增益参数值;
在所述第二增益参数值小于第三预设阈值的情况下,使用所述目标增益值对所述目标多媒体文件对应的第一音量值进行调整,获得第二音量值。
一种可选地实施方式为,计算目标多媒体文件对应的第二增益参数值,该第二增益参数值用于表征对第一音量值进行调整的范围,在第二增益参数值小于第三预设阈值的情况下,表示对第一音量值的调整位于合理的动态范围内,则使用目标增益值对目标多媒体文件对应的第一音量值进行调整,得到第二音量值。
具体而言,目标音量值对应的对数函数值与第四数值之间的第二差值,上述目标音量值为使用目标增益值对第一音量值进行调整后的音量值,即第二音量值;上述第四数值为基准音量值对应的对数函数值;将第二差值的绝对值,确定为第二增益参数值。可以参阅以下公式:
b=|log(y(n))-log(y0(n))|
其中,b为第二增益参数值,log(y(n))为目标音量值对应的对数函数值,log(y0(n))为第四数值。
可选地,由于人耳对于2kHz至5kHz之间的中频信号较为敏感,而对于0至2KHz的低频信号,以及5kHz至8kHz的高频信号敏感度稍差,因此可以在不同的频段设置不同的第三预设阈值,以此降低电子设备的硬件成本并提高增益算法的效果。
R=1,0KHz<f<2KHz
R=0.5,2KHz≤f≤5KHz
R=0.8,5KHz<f<8KHz
其中,R为第三预设阈值,f为音频信号的频段。
如上述公式所示,对于0至2KHz的低频信号,设置第三预设阈值为1;对于2kHz至5kHz的中频信号,设置第三预设阈值为0.5;对于5kHz至8kHz的高频信号,设置第三预设阈值为0.8。
本实施例中,通过计算第二增益参数值,在第二增益参数值小于第三预设阈值的情况下,才使用目标增益值对目标多媒体文件对应的第一音量值进行调整,避免对于第一音量值的调整超出合理的动态范围,以此提高对第一音量值进行调整的准确性。
另一种可选地实施方式为,在确定目标增益值之后,直接使用该目标增益值对目标多媒体文件对应的第一音量值进行调整。
为便于理解整体技术方案,请参阅图6。
如图6所示,检测短视频平台是否打开“实时调节音量”的触控开关;在该触控开关打开的情况下,设定基准音量值;对目标多媒体文件进行短时处理,保证语音的实时性。进一步的,通过VAD算法提取目标多媒体文件对应的音频信号中的人声部分;并确定目标多媒体文件对应的第一增益参数值和表征对第一音量值进行调整的动态范围的第三预设阈值;确定目标增益值并使用AGC算法结合目标增益值,对第一音量值进行增益;在第二增益参数值小于第三预设阈值的情况下,使用目标增益值替代初始增益值对第一音量值进行增益。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的多媒体文件播放装置进行详细地说明。
如图7所示,多媒体文件播放装置700包括:
获取模块701,用于获取待播放的目标多媒体文件对应的第一音量值;
确定模块702,用于基于预设的基准音量值、预设的初始增益值和所述第一音量值,确定所述目标多媒体文件对应的目标增益值;
调整模块703,用于基于所述目标增益值对所述第一音量值进行调整,获得第二音量值;
播放模块704,用于基于所述第二音量值播放所述目标多媒体文件。
可选地,所述确定模块702,具体用于:
根据所述第一音量值和所述基准音量值,确定第一增益参数值;
根据所述第一增益参数值、所述第一音量值、所述基准音量值和预设的初始增益值,确定所述目标多媒体文件对应的目标增益值。
可选地,所述确定模块702,还具体用于:
计算第一数值与第二数值之间的第一差值;
根据所述第一差值的数值范围,确定所述增益时长;
将第三数值和预设的第四数值中的最大值,确定为所述第一增益参数值。
可选地,所述确定模块702,还具体用于:
在所述第一差值小于第一预设阈值的情况下,确定所述增益时长为第一预设时长;
在所述第一差值大于或等于第一预设阈值,且小于或等于第二预设阈值的情况下,确定所述增益时长为第二预设时长;
在所述第一差值大于第二预设阈值的情况下,确定所述增益时长为第三预设时长。
可选地,所述确定模块702,还具体用于:
对所述第一增益参数值和第五数值进行乘法运算,得到第六数值;
将所述第六数值和所述初始增益值对应的对数函数值之间的和值,确定为第八数值;
对所述第八数值进行对数函数逆运算,得到所述目标增益值。
可选地,所述调整模块703,具体用于:
计算目标音量值对应的对数函数值与第四数值之间的第二差值;
将所述第二差值的绝对值,确定为第二增益参数值;
在所述第二增益参数值小于第三预设阈值的情况下,使用所述目标增益值对所述目标多媒体文件对应的第一音量值进行调整,获得第二音量值。
本申请实施例中,获取待播放的目标多媒体文件对应的第一音量值;基于预设的基准音量值、预设的初始增益值和第一音量值,确定目标多媒体文件对应的目标增益值;其中,上述基准音量值用于确定调整后的音量值所处的动态范围。进而使用该目标增益值对第一音量值进行调整,获得第二音量值,并使得第二音量值位于以基准音量值为中心的动态范围内,应理解,上述第二音量值为切换后的多媒体文件的音量值,以此保证在切换多媒体文件的过程中,处于播放状态的多媒体文件的音量值处于稳定的状态。这样,在切换多媒体文件的过程中,不需要用户手动调节多媒体文件对应的音量,减少了用户在播放多媒体文件过程中的操作,提高了用户播放多媒体文件的便捷性。
本申请实施例中的多媒体文件播放装置可以是电子设备,也可以是电子设备中的部件、例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性的,电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、移动上网装置(Mobile Internet Device,MID)、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、机器人、可穿戴设备、超级移动个人计算机(ultra-mobilepersonal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,还可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的多媒体文件播放装置可以为具有操作***的装置。该操作***可以为安卓(Android)操作***,可以为ios操作***,还可以为其他可能的操作***,本申请实施例不作具体限定。
本申请实施例提供多媒体文件播放装置能够实现图1的方法实施例实现的各个过程,为避免重复,这里不再赘述。
可选地,如图8所示,本申请实施例还提供一种电子设备800,包括处理器801,存储器802,存储在存储器802上并可在所述处理器801上运行的程序或指令,该程序或指令被处理器801执行时实现上述多媒体文件播放方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
图8为实现本申请实施例的一种电子设备的硬件结构示意图。
该电子设备900包括但不限于:射频单元901、网络模块902、音频输出单元903、输入单元904、传感器905、显示单元906、用户输入单元907、接口单元909、存储器909、以及处理器910等部件。
本领域技术人员可以理解,电子设备900还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理***与处理器910逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。图9中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,输入单元904,还用于获取待播放的目标多媒体文件对应的第一音量值;
处理器910,还用于基于预设的基准音量值、预设的初始增益值和所述第一音量值,确定所述目标多媒体文件对应的目标增益值;
基于所述目标增益值对所述第一音量值进行调整,获得第二音量值;
显示单元906,还用于预设的基准音量值、预设的初始增益值和所述第一音量值播放所述目标多媒体文件。
其中,处理器910,还用于根据所述第一音量值和所述基准音量值,确定第一增益参数值;
根据所述第一增益参数值、所述第一音量值、所述基准音量值和预设的初始增益值,确定所述目标多媒体文件对应的目标增益值。
其中,处理器910,还用于计算第一数值与第二数值之间的第一差值;
根据所述第一差值的数值范围,确定所述增益时长;
将第三数值和预设的第四数值中的最大值,确定为所述第一增益参数值。
其中,处理器910,还用于在所述第一差值小于第一预设阈值的情况下,确定所述增益时长为第一预设时长;
在所述第一差值大于或等于第一预设阈值,且小于或等于第二预设阈值的情况下,确定所述增益时长为第二预设时长;
在所述第一差值大于第二预设阈值的情况下,确定所述增益时长为第三预设时长。
其中,处理器910,还用于对所述第一增益参数值和第五数值进行乘法运算,得到第六数值;
将所述第六数值和所述初始增益值对应的对数函数值之间的和值,确定为第八数值;
对所述第八数值进行对数函数逆运算,得到所述目标增益值。
其中,处理器910,还用于计算目标音量值对应的对数函数值与第四数值之间的第二差值;
将所述第二差值的绝对值,确定为第二增益参数值;
在所述第二增益参数值小于第三预设阈值的情况下,使用所述目标增益值对所述目标多媒体文件对应的第一音量值进行调整,获得第二音量值。
本申请实施例中,获取待播放的目标多媒体文件对应的第一音量值;基于预设的基准音量值、预设的初始增益值和第一音量值,确定目标多媒体文件对应的目标增益值;其中,上述基准音量值用于确定调整后的音量值所处的动态范围。进而使用该目标增益值对第一音量值进行调整,获得第二音量值,并使得第二音量值位于以基准音量值为中心的动态范围内,应理解,上述第二音量值为切换后的多媒体文件的音量值,以此保证在切换多媒体文件的过程中,处于播放状态的多媒体文件的音量值处于稳定的状态。这样,在切换多媒体文件的过程中,不需要用户手动调节多媒体文件对应的音量,减少了用户在播放多媒体文件过程中的操作,提高了用户播放多媒体文件的便捷性。
应理解的是,本申请实施例中,输入单元904可以包括图形处理器(GraphicsProcessing Unit,GPU)9041和麦克风9042,图形处理器9041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元906可包括显示面板9061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板9071。用户输入单元907包括触控面板9071以及其他输入设备9072中的至少一种。触控面板9071,也称为触摸屏。触控面板9071可包括触摸检测装置和触摸控制器两个部分。其他输入设备9072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
存储器909可用于存储软件程序以及各种数据。存储器909可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作***、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器909可以包括易失性存储器或非易失性存储器,或者,存储器909可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。本申请实施例中的存储器909包括但不限于这些和任意其它适合类型的存储器。
处理器910可包括一个或多个处理单元;可选的,处理器910集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作***、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器910中。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述多媒体文件播放方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述多媒体文件播放方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为***级芯片、***芯片、芯片***或片上***芯片等。
本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如上述多媒体文件播放方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (14)

1.一种多媒体文件播放方法,其特征在于,包括:
获取待播放的目标多媒体文件对应的第一音量值;
基于预设的基准音量值、预设的初始增益值和所述第一音量值,确定所述目标多媒体文件对应的目标增益值;
基于所述目标增益值对所述第一音量值进行调整,获得第二音量值;所述第二音量值位于以所述基准音量值为中心的动态范围内;
基于所述第二音量值播放所述目标多媒体文件。
2.根据权利要求1所述的方法,其特征在于,所述基于预设的基准音量值、预设的初始增益值和所述第一音量值,确定所述目标多媒体文件对应的目标增益值包括:
根据所述第一音量值和所述基准音量值,确定第一增益参数值;所述第一增益参数值用于表征对所述第一音量值进行调整的速度;
根据所述第一增益参数值、所述第一音量值、所述基准音量值和预设的初始增益值,确定所述目标多媒体文件对应的目标增益值。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一音量值和所述基准音量值,确定第一增益参数值包括:
计算第一数值与第二数值之间的第一差值;所述第一数值为所述第一音量值对应的对数函数值,所述第二数值为所述基准音量值对应的对数函数值;
根据所述第一差值的数值范围,确定所述增益时长;
将第三数值和预设的第四数值中的最大值,确定为所述第一增益参数值;
其中,所述第三数值用于表征所述增益时长的预设倍数。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一差值的数值范围,确定所述增益时长包括:
在所述第一差值小于第一预设阈值的情况下,确定所述增益时长为第一预设时长;
在所述第一差值大于或等于第一预设阈值,且小于或等于第二预设阈值的情况下,确定所述增益时长为第二预设时长;
在所述第一差值大于第二预设阈值的情况下,确定所述增益时长为第三预设时长。
5.根据权利要求2所述的方法,其特征在于,所述根据所述第一增益参数值、所述第一音量值、所述基准音量值和预设的初始增益值,确定所述目标多媒体文件对应的目标增益值包括:
对所述第一增益参数值和第五数值进行乘法运算,得到第六数值;所述第五数值为所述基准音量值对应的对数函数值与第七数值之间的差值,所述第七数值为目标绝对值对应的对数函数值,所述目标绝对值为所述初始增益值与所述第一音量值的乘法结果的绝对值;
将所述第六数值和所述初始增益值对应的对数函数值之间的和值,确定为第八数值;所述第八数值为所述目标增益值对应的对数函数值;
对所述第八数值进行对数函数逆运算,得到所述目标增益值。
6.根据权利要求1所述的方法,其特征在于,所述基于所述目标增益值对所述第一音量值进行调整,获得第二音量值包括:
计算目标音量值对应的对数函数值与第四数值之间的第二差值;所述目标音量值为使用目标增益值对所述第一音量值进行调整后的音量值,所述第四数值为所述基准音量值对应的对数函数值;
将所述第二差值的绝对值,确定为第二增益参数值;所述第二增益参数值用于表征对所述第一音量值进行调整的范围;
在所述第二增益参数值小于第三预设阈值的情况下,使用所述目标增益值对所述目标多媒体文件对应的第一音量值进行调整,获得第二音量值。
7.一种多媒体文件播放装置,其特征在于,包括:
获取模块,用于获取待播放的目标多媒体文件对应的第一音量值;
确定模块,用于基于预设的基准音量值、预设的初始增益值和所述第一音量值,确定所述目标多媒体文件对应的目标增益值;
调整模块,用于基于所述目标增益值对所述目标多媒体文件对应的第一音量值进行调整,获得第二音量值;所述第二音量值位于以所述基准音量值为中心的动态范围内;
播放模块,用于基于所述第二音量值播放所述目标多媒体文件。
8.根据权利要求7所述的装置,其特征在于,所述确定模块,具体用于:
根据所述第一音量值和所述基准音量值,确定第一增益参数值;所述第一增益参数值用于表征对所述第一音量值进行调整的速度;
根据所述第一增益参数值、所述第一音量值、所述基准音量值和预设的初始增益值,确定所述目标多媒体文件对应的目标增益值。
9.根据权利要求8所述的装置,其特征在于,所述确定模块,还具体用于:
计算第一数值与第二数值之间的第一差值;所述第一数值为所述第一音量值对应的对数函数值,所述第二数值为所述基准音量值对应的对数函数值;
根据所述第一差值的数值范围,确定所述增益时长;
将第三数值和预设的第四数值中的最大值,确定为所述第一增益参数值;
其中,所述第三数值用于表征所述增益时长的预设倍数。
10.根据权利要求9所述的装置,其特征在于,所述确定模块,还具体用于:
在所述第一差值小于第一预设阈值的情况下,确定所述增益时长为第一预设时长;
在所述第一差值大于或等于第一预设阈值,且小于或等于第二预设阈值的情况下,确定所述增益时长为第二预设时长;
在所述第一差值大于第二预设阈值的情况下,确定所述增益时长为第三预设时长。
11.根据权利要求8所述的装置,其特征在于,所述确定模块,还具体用于:
对所述第一增益参数值和第五数值进行乘法运算,得到第六数值;所述第五数值为所述基准音量值对应的对数函数值与第七数值之间的差值,所述第七数值为目标绝对值对应的对数函数值,所述目标绝对值为所述初始增益值与所述第一音量值的乘法结果的绝对值;
将所述第六数值和所述初始增益值对应的对数函数值之间的和值,确定为第八数值;所述第八数值为所述目标增益值对应的对数函数值;
对所述第八数值进行对数函数逆运算,得到所述目标增益值。
12.根据权利要求7所述的装置,其特征在于,所述调整模块,具体用于:
计算目标音量值对应的对数函数值与第四数值之间的第二差值;所述目标音量值为使用目标增益值对所述第一音量值进行调整后的音量值,所述第四数值为所述基准音量值对应的对数函数值;
将所述第二差值的绝对值,确定为第二增益参数值;所述第二增益参数值用于表征对所述第一音量值进行调整的范围;
在所述第二增益参数值小于第三预设阈值的情况下,使用所述目标增益值对所述目标多媒体文件对应的第一音量值进行调整,获得第二音量值。
13.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-6中任一项所述的多媒体文件播放方法的步骤。
14.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-6中任一项所述的多媒体文件播放方法的步骤。
CN202210372666.4A 2022-04-11 2022-04-11 多媒体文件播放方法及其装置 Pending CN114879929A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210372666.4A CN114879929A (zh) 2022-04-11 2022-04-11 多媒体文件播放方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210372666.4A CN114879929A (zh) 2022-04-11 2022-04-11 多媒体文件播放方法及其装置

Publications (1)

Publication Number Publication Date
CN114879929A true CN114879929A (zh) 2022-08-09

Family

ID=82668571

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210372666.4A Pending CN114879929A (zh) 2022-04-11 2022-04-11 多媒体文件播放方法及其装置

Country Status (1)

Country Link
CN (1) CN114879929A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117119349A (zh) * 2023-04-25 2023-11-24 荣耀终端有限公司 音量控制方法、图形界面及相关装置
CN117687595A (zh) * 2024-01-30 2024-03-12 知鱼智联科技股份有限公司 一种基于物联网的音量调整方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117119349A (zh) * 2023-04-25 2023-11-24 荣耀终端有限公司 音量控制方法、图形界面及相关装置
CN117687595A (zh) * 2024-01-30 2024-03-12 知鱼智联科技股份有限公司 一种基于物联网的音量调整方法及装置
CN117687595B (zh) * 2024-01-30 2024-05-28 知鱼智联科技股份有限公司 一种基于物联网的音量调整方法及装置

Similar Documents

Publication Publication Date Title
CN110265057B (zh) 生成多媒体的方法及装置、电子设备、存储介质
US11030987B2 (en) Method for selecting background music and capturing video, device, terminal apparatus, and medium
CN114879929A (zh) 多媒体文件播放方法及其装置
CN110809214B (zh) 音频播放方法、音频播放装置及终端设备
KR20160132808A (ko) 오디오정보식별방법 및 장치
US11284151B2 (en) Loudness adjustment method and apparatus, and electronic device and storage medium
CN112383817B (zh) 音量调节方法及装置
US20170180807A1 (en) Method and electronic device for amplifying video image
CN111818385B (zh) 视频处理方法、视频处理装置及终端设备
WO2024088142A1 (zh) 音频信号处理方法、装置、电子设备及可读存储介质
GB2589789A (en) Volume display method and apparatus, terminal device, and storage medium
CN113709629A (zh) 频响参数调节方法、装置、设备及存储介质
CN105005612A (zh) 一种音乐文件的获取方法及移动终端
CN105005444A (zh) 一种视频播放时间轴的显示方法及终端
US11682412B2 (en) Information processing method, electronic equipment, and storage medium
CN107564534B (zh) 音频品质鉴定方法和装置
CN115941869A (zh) 音频处理方法、装置及电子设备
CN115514860A (zh) 动态帧率补偿方法、图像处理电路和电子设备
CN114979798A (zh) 播放速度控制方法和电子设备
CN114217841A (zh) 应用程序的控制方法、装置、电子设备和可读存储介质
CN112487247A (zh) 视频处理方法及视频处理装置
CN112584225A (zh) 视频录制处理方法、视频播放控制方法及电子设备
CN112261470A (zh) 音频处理方法及装置
CN113573158A (zh) 视频处理方法、装置、电子设备及存储介质
CN115497487A (zh) 音频信号处理方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination