CN113496705B - 音频处理方法和装置、存储介质及电子设备 - Google Patents

音频处理方法和装置、存储介质及电子设备 Download PDF

Info

Publication number
CN113496705B
CN113496705B CN202110957155.4A CN202110957155A CN113496705B CN 113496705 B CN113496705 B CN 113496705B CN 202110957155 A CN202110957155 A CN 202110957155A CN 113496705 B CN113496705 B CN 113496705B
Authority
CN
China
Prior art keywords
audio
real
compression
time
mute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110957155.4A
Other languages
English (en)
Other versions
CN113496705A (zh
Inventor
泮建光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Huacheng Software Technology Co Ltd
Original Assignee
Hangzhou Huacheng Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Huacheng Software Technology Co Ltd filed Critical Hangzhou Huacheng Software Technology Co Ltd
Priority to CN202110957155.4A priority Critical patent/CN113496705B/zh
Publication of CN113496705A publication Critical patent/CN113496705A/zh
Application granted granted Critical
Publication of CN113496705B publication Critical patent/CN113496705B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种音频处理方法和装置、存储介质及电子设备。其中,该方法包括:在检测到实时音频播放发生播放间断的情况下,获取待播放的实时音频,其中,实时音频包括静音音频和有效音频;在实时音频的数据量达到参考量值的情况下,统计参考量值的实时音频中静音音频的数据量,其中,静音音频的音频幅值小于幅值阈值;确定静音音频的数据量对应的音频压缩参数;按照音频压缩参数对有效音频进行音频压缩处理,得到播放音频。本发明解决了音频数据直接丢弃造成音频数据不完整,导致用户体验差的技术问题。

Description

音频处理方法和装置、存储介质及电子设备
技术领域
本发明涉及音频处理领域,具体而言,涉及一种音频处理方法和装置、存储介质及电子设备。
背景技术
数字语音对讲是将语音数据采样编码数字化后通过网络传送到远端进行播放从而实现双向语音对话。在数据语音对讲中,音频采集和音频播放的速度在网络良好的情况下是一致的。但是在网络不稳定时,由于网络传输速度小于音频采集速度,音频播放端就会出现播放空隙,音频采集和音频播放的平衡被打破。
为了恢复音频采集和音频播放的平衡,现有技术通常会采用的方式是音频包丢弃,通过将丢弃部分缓冲数据以尽快恢复音频采集和音频播放的平衡。而音频丢弃直接影响音频数据的完整性,导致音频播放断续、不完整,使得用户无法接收完整的音频数据,可能错失重点信息,用户体验较差。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种音频处理方法和装置、存储介质及电子设备,以至少解决音频数据直接丢弃造成音频数据不完整,导致用户体验差的技术问题。
根据本发明实施例的一个方面,提供了一种音频处理方法,包括:在检测到实时音频播放发生播放间断的情况下,获取待播放的实时音频,其中,上述实时音频包括静音音频和有效音频;在上述实时音频的数据量达到参考量值的情况下,统计上述参考量值的实时音频中上述静音音频的数据量,其中,上述静音音频的音频幅值小于幅值阈值;确定上述静音音频的数据量对应的音频压缩参数;按照上述音频压缩参数对上述有效音频进行音频压缩处理,得到播放音频。
根据本发明实施例的另一方面,还提供了一种音频处理装置,包括:在检测到实时音频播放发生播放间断的情况下,获取待播放的实时音频,其中,上述实时音频包括静音音频和有效音频;在上述实时音频的数据量达到参考量值的情况下,统计上述参考量值的实时音频中上述静音音频的数据量,其中,上述静音音频的音频幅值小于幅值阈值;确定上述静音音频的数据量对应的音频压缩参数;按照上述音频压缩参数对上述有效音频进行音频压缩处理,得到播放音频。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述音频处理方法。
根据本发明实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过所述计算机程序执行上述的音频处理方法。
在本发明实施例中,采用在检测到实时音频播放间断的情况下,获取待播放的实时音频,并统计参考量值的实时音频中的静音音频的数据量,根据静音音频的数据量确定有效音频的音频压缩参数,并将有效音频按照音频压缩参数进行压缩处理后得到的播放音频,用于实时音频的播放的方式,通过静音音频的数据量确定对有效音频的音频压缩程度,达到了根据实时音频数据中静音音频的数据量判断实时音频中有效音频的音频压缩程度,从而避免音频压缩造成有效音频缺失的目的,从而实现了实时音频数据在数据不丢失的基础上进行音频压缩的技术效果,进而解决了音频数据直接丢弃造成音频数据不完整,导致用户体验差的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的音频处理方法的应用环境的示意图;
图2是根据本发明实施例的一种可选的音频处理方法的流程示意图;
图3是根据本发明实施例的一种可选的音频处理方法的流程示意图;
图4是根据本发明实施例的一种可选的音频处理方法的流程示意图;
图5是根据本发明实施例的一种可选的音频处理方法的流程示意图;
图6是根据本发明实施例的一种可选的音频处理方法的流程示意图;
图7是根据本发明实施例的一种可选的音频处理装置的结构示意图;
图8是根据本发明实施例的一种可选的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种音频处理方法,可选地,上述音频处理方法可以但不限于应用于如图1所示的环境中。处理器110接收采集端100发送的实时的采集音频,对实时音频进行处理,并将处理得到的播放音频发送给播放端120以实现音频播放。
处理器110中内不限于包含有数据库112和处理引擎114。数据库112用于接收和存储实时音频和播放音频。处理引擎114不限于通过依次执行S102至S108以实现对实时音频进行处理得到播放音频。获取待播放的实时音频。在检测到实时音频播放发生播放间断的情况下,获取待播放的实时音频,实时音频包括静音音频和有效音频。统计静音应聘的数据量。在实时音频的数据量达到参考量值的情况下,统计参考量值的实时音频中静音音频的数据量,静音音频的音频幅值小于幅值阈值。确定音频压缩参数。确定静音音频的数据量对应的音频压缩参数。音频压缩得到播放音频。按照音频压缩参数对有效音频进行音频压缩处理,得到播放音频。
可选地,在本实施例中,上述采集端100和播放端120不限于是具备音频实时采集和播放的终端设备,可以包括但不限于以下至少之一:手机(如Android手机、IOS手机等)、笔记本电脑、平板电脑、掌上电脑、MID(Mobile Internet Devices,移动互联网设备)、PAD、台式电脑、智能电视、智能对讲等。采集端和播放端与处理器不限于通过网络进行音频数据的传输,上述网络可以包括但不限于:有线网络,无线网络,其中,该有线网络包括:局域网、城域网和广域网,该无线网络包括:蓝牙、WIFI及其他实现无线通信的网络。处理器不限于是服务器,可以是单一服务器,也可以是由多个服务器组成的服务器集群,或者是云服务器。上述仅是一种示例,本实施例中对此不作任何限定。
作为一种可选的实施方式,如图2所示,上述音频处理方法包括:
S202,在检测到实时音频播放发生播放间断的情况下,获取待播放的实时音频,其中,实时音频包括静音音频和有效音频;
S204,在实时音频的数据量达到参考量值的情况下,统计参考量值的实时音频中静音音频的数据量,其中,静音音频的音频幅值小于幅值阈值;
S206,确定静音音频的数据量对应的音频压缩参数;
S208,按照音频压缩参数对有效音频进行音频压缩处理,得到播放音频。
可选地,播放间断不限于是播放缓冲区为空,播放缓冲区中不存在待播放数据。在音频的实时播放场景中,采集端采集的实时音频数据通过网络传输给播放端。在不受网络传输影响的理想状态下,采集端的音频采集速率和播放端的音频播放速率保持一致,由此实现音频的实时播放。当播放端的播放缓冲区存储有待播放数据的情况下,音频的实时播放处于平衡状态,当播放端的播放缓冲区中不存在待播放数据,也就是播放端当前没有音频数据用于播放的情况下,确定播放间断。
可选地,为使播放端和采集端的音频实时同步性重新恢复平衡状态,且保证采集端对于音频的实时采集,不限于通过对采集的实时音频进行处理,以通过压缩播放端的音频播放,恢复播放端与采集端在音频上的实时同步性。在采集端与播放端处理实时播放的平衡状态下,播放端播放采集端采集到的实时音频。
可选地,在检测到播放端发生播放间断的情况下,获取在播放间断后采集端采集到且待播放的实时音频。在实时音频中包括静音音频和有效音频。静音音频为音频幅值小于幅值阈值的音频,有效音频为音频幅值大于等于幅值阈值的音频。通过预设的幅值阈值,将实时音频划分为静音音频和有效音频,将音频幅值小于幅值阈值的静音音频视为不包含有效声音内容的音频数据。
可选地,在实时音频的数据量达到参考量值的情况下,对实时音频进行音频压缩处理。参考量值为预设的实时音频的音频处理量值,不限于每一次对参考量值的实时音频进行音频压缩处理。在实时音频的数据量小于参考量值的情况下,继续累积实时音频,直至实时音频的数据量达到参考量值。实时音频的数据量不限于是实时音频的采样点数。
可选地,对参考量值的实时音频进行音频压缩处理,不限于是根据实时音频中的静音音频的数据量确定对有效音频的音频压缩参数,从而对有效音频进行压缩,将压缩后的有效音频作为播放音频,通过丢弃实时音频中的静音音频,并压缩有效音频,以恢复采集端和播放端的音频实时同步性。
在本申请实施例中,采用在检测到实时音频播放间断的情况下,获取待播放的实时音频,并统计参考量值的实时音频中的静音音频的数据量,根据静音音频的数据量确定有效音频的音频压缩参数,并将有效音频按照音频压缩参数进行压缩处理后得到的播放音频,用于实时音频的播放的方式,通过静音音频的数据量确定对有效音频的音频压缩程度,达到了根据实时音频数据中静音音频的数据量判断实时音频中有效音频的音频压缩程度,从而避免音频压缩造成有效音频缺失的目的,从而实现了实时音频数据在数据不丢失的基础上进行音频压缩的技术效果,进而解决了音频数据直接丢弃造成音频数据不完整,导致用户体验差的技术问题。
作为一种可选的实施方式,如图3所示,上述确定静音音频的数据量对应的音频压缩参数包括:
S302,查询静音音频的数据量对应的音频压缩等级;
S304,根据音频压缩等级确定静音音频的数据量对应的音频压缩参数。
可选地,在统计参考量值的实时音频中静音音频的数据量之后,根据静音音频的数据量对应的音频压缩等级确定有效音频的音频压缩参数。
可选地,在获取待播放的实时音频之前,建立静音音频的数据量与音频压缩参数的关联关系,不限于是音频压缩关联表。在音频压缩关联表中记录参考量值的实时音频中静音音频数据量与音频压缩参数的对应关系。
可选地,在音频压缩关联表中,不限于记录有静音音频数据量、静音音频数据量等级、音频压缩等级和音频压缩参数。静音音频数据量等级用于表示静音音频数据量所在的数据量等级,音频压缩等级用于表示音频压缩程度的等级。例如,静音音频的数据量等级为多,对应音频压缩等级为高。
可选地,不限于是静音音频数据量越大,音频压缩程度越小。在参考量值的实时音频数据中,所包含的静音音频的数据量越大,其所剩余的有效音频的数据量越小,为保证其压缩后的音频完整性,所对应的压缩程度越小。在参考量值的实时音频数据中,所包含的静音音频的数据量越小,其所剩余的有效音频的数据量越大,因此可以对有效音频进行较大程度的压缩,并不会影响压缩后的有效音频的播放完整,因此,其对应的压缩程度越大。
作为一种可选的实施方式,上述确定静音音频的数据量对应的音频压缩参数包括:在音频压缩参数用于指示有效音频的保留程度的情况下,静音音频的数据量与音频压缩参数的数值呈正相关。
可选地,有效音频的保留程度不限于是压缩得到的播放音频的音频点数与有效音频的音频点数的比值,同样也可以用采样率表示。在音频压缩参数以音频采样率表示的情况下,静音音频的数据量与音频采样率的数值呈正相关,在参考量值的实时音频中,静音音频的数据量越大,音频采样率的数值越大,对有效音频的音频压缩程度越小。在参考量值的实时音频中,静音音频的数据量越小,音频采样率的数值越小,对有效音频的音频压缩程度越大。
在本申请实施例中,通过参考量值的实时音频中的静音音频的数据量确定,实时音频中所包含的有效音频的数据量,从而确定对有效音频进行音频压缩的音频压缩参数,保证对有效音频进行不破话音频有效完整度的音频压缩,在保证音频完整性的同时,实现音频的压缩。
作为一种可选的实施方式,如图4所示,上述在获取待播放的实时音频之前,方法还包括:
S402,获取播放间断的间断时长;
S404,计算间断时长对应的目标数据量,其中,目标数据量用于指示待音频压缩处理的数据压缩量。
可选地,在检测到播放间断的情况下,确定播放间断的间断时长。播放间断的间断时长为从播放间断开始至实时播放开启之间的时长。在确定间断时长的情况下,计算间断时长对应的目标数据量,得到音频压缩处理对应的数据压缩量,也就是需要对实时音频进行音频压缩的压缩量。
以目标数据量为音频采样点数为例,目标数据量的计算不限于如公式(1)所示:
DN=T*采样点位数*声道数*采样频率/8 (1)
其中,DN表示与T对应的目标数据量;T表示间断时长,以秒为单位。
在采样点位数选取16,采样频率选取48000,声道数为双声道2时,间断时长T对应的目标数据量的计算方式不限于是:
DN=T*16*2*48000/8 (2)
在本申请实施例中,通过将间隔时长转化为目标数据量,得到需要通过音频压缩处理的数据压缩量,从而便于判断是否对实时音频进行音频压缩处理。
作为一种可选的实施方式,上述在得到播放音频之后,方法还包括:
S502,计算参考量值与播放音频的数据量的差值,得到播放压缩量;
S504,在播放压缩量小于目标数据量的情况下,获取当前实时音频;
S506,在当前实时音频达到参考量值的情况下,根据当前实时音频中的当前静音音频的数据量对当前实时音频中的当前有效音频进行音频压缩处理。
可选地,在确定目标数据量且得到播放音频之后,计算播放音频的数据量与参考量值的差值,确定播放压缩量。播放压缩量用于表示参考量值的实时音频与播放音频之间的数据量差值。
可选的,在播放压缩量小于目标数据量额情况下,继续对待播放的实时音频进行音频压缩处理,不限于是对实时音频之后的当前实时音频在达到参考量值的情况下,根据当前实时音频中的当前静音音频的数据量确定对当前实时音频中的当前有效音频,进行音频压缩处理的音频压缩参数,从而对当前有效音频进行音频压缩处理。计算压缩得到的当前播放音频的数据量与参考量值的播放压缩量,并与播放音频对应的播放压缩量进行累积,直至累积的播放压缩量大于等于目标数据量。
作为一种可选的实施方式,上述在得到播放压缩量之后,方法还包括:在播放压缩量等于或大于目标数据量的情况下,将当前实时音频作为当前播放音频。
可选地,在播放压缩量大于等于目标数据量的情况下,确定播放端与采集端达到实时同步的平衡状态,停止对实时音频的音频压缩处理,将采集到的实时音频作为播放端的播放音频。
可选地,不限于将与间断时长对应的目标数据量作为目标数据量的初始值,在得到播放音频的情况下,根据播放音频对应的播放压缩量,更新目标数据量,直至更新后的目标数据量的数值等于或小于零,确定音频处理结束。
音频处理流程不限于如图6所示。在检测到实时音频播放间断的情况下,执行S602,统计间断时长T。在确定间断时长T的情况下,执行S604,将间断时长T换算为目标数据量DN。并执行S606,确定每次处理实时音频的参考量值N,并建立静音音频数据量与音频压缩参数的关联关系。
执行S608,判断当前DN是否大于0。在S608判断为是,当前DN大于0,也就是需要进行音频压缩处理的情况下,执行S610,统计N中静音音频的数据量AN。在确定静音音频数据量AN的情况下,执行S612,确定静音音频数据量AN对应的音频压缩参数R。以音频压缩参数为重采样率为例,在确定重采样率R的情况下,执行S614,对有效音频按照进行重采样,得到播放音频。在得到播放音频的情况下,执行S616,计算音频压缩量dN=N-R(N-AN)。并执行S618,更新DN:DN=DN-dN。在更新DN之后,执行S608,判断当前DN是否大于0。在S608判断为否,当前DN小于等于0的情况下,执行S620,将实时音频作为播放音频。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一个方面,还提供了一种用于实施上述音频处理方法的音频处理装置。如图7所示,该装置包括:
获取单元702,用于在检测到实时音频播放发生播放间断的情况下,获取待播放的实时音频,其中,实时音频包括静音音频和有效音频;
统计单元704,用于在实时音频的数据量达到参考量值的情况下,统计参考量值的实时音频中静音音频的数据量,其中,静音音频的音频幅值小于幅值阈值;
确定单元706,用于确定静音音频的数据量对应的音频压缩参数;
压缩单元708,用于按照音频压缩参数对有效音频进行音频压缩处理,得到播放音频。
可选地,上述确定单元706包括:
查询模块,用于查询静音音频的数据量对应的音频压缩等级;
确定模块,用于根据音频压缩等级确定静音音频的数据量对应的音频压缩参数。
可选地,上述确定单元706还用于在音频压缩参数用于指示有效音频的保留程度的情况下,静音音频的数据量与音频压缩参数的数值呈正相关。
可选地,上述音频处理装置还包括时长单元,用于在获取待播放的实时音频之前,获取播放间断的间断时长;计算间断时长对应的目标数据量,其中,目标数据量用于指示待音频压缩处理的数据压缩量。
可选地,上述音频处理装置还包括计算单元,用于在得到播放音频之后,计算参考量值与播放音频的数据量的差值,得到播放压缩量;在播放压缩量小于目标数据量的情况下,获取当前实时音频;在当前实时音频达到参考量值的情况下,根据当前实时音频中的当前静音音频的数据量对当前实时音频中的当前有效音频进行音频压缩处理。
可选地,上述音频处理装置还包括播放单元,用于在得到播放压缩量之后,在播放压缩量等于或大于目标数据量的情况下,将当前实时音频作为当前播放音频。
在本申请实施例中,采用在检测到实时音频播放间断的情况下,获取待播放的实时音频,并统计参考量值的实时音频中的静音音频的数据量,根据静音音频的数据量确定有效音频的音频压缩参数,并将有效音频按照音频压缩参数进行压缩处理后得到的播放音频,用于实时音频的播放的方式,通过静音音频的数据量确定对有效音频的音频压缩程度,达到了根据实时音频数据中静音音频的数据量判断实时音频中有效音频的音频压缩程度,从而避免音频压缩造成有效音频缺失的目的,从而实现了实时音频数据在数据不丢失的基础上进行音频压缩的技术效果,进而解决了音频数据直接丢弃造成音频数据不完整,导致用户体验差的技术问题。
根据本发明实施例的又一个方面,还提供了一种用于实施上述音频处理方法的电子设备,该电子设备可以是图1所示的播放端或处理器。本实施例以该电子设备为处理器为例来说明。如图8所示,该电子设备包括存储器802和处理器804,该存储器802中存储有计算机程序,该处理器804被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,在检测到实时音频播放发生播放间断的情况下,获取待播放的实时音频,其中,实时音频包括静音音频和有效音频;
S2,在实时音频的数据量达到参考量值的情况下,统计参考量值的实时音频中静音音频的数据量,其中,静音音频的音频幅值小于幅值阈值;
S3,确定静音音频的数据量对应的音频压缩参数;
S4,按照音频压缩参数对有效音频进行音频压缩处理,得到播放音频。
可选地,本领域普通技术人员可以理解,图8所示的结构仅为示意,电子设备也可以是智能手机(如Android手机、IOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD、对讲机等终端设备。图8其并不对上述电子设备的结构造成限定。例如,电子设备还可包括比图8中所示更多或者更少的组件(如网络接口等),或者具有与图8所示不同的配置。
其中,存储器802可用于存储软件程序以及模块,如本发明实施例中的音频处理方法和装置对应的程序指令/模块,处理器804通过运行存储在存储器802内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的音频处理方法。存储器802可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器802可进一步包括相对于处理器804远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器802具体可以但不限于用于存储实时音频、音频压缩参数、播放音频等信息。作为一种示例,如图8所示,上述存储器802中可以但不限于包括上述音频处理装置中的获取单元702,统计单元704,确定单元706和压缩单元708。此外,还可以包括但不限于上述音频处理装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置806用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置806包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置806为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子设备还包括:显示器808,用于显示上述播放音频;和连接总线810,用于连接上述电子设备中的各个模块部件。
在其他实施例中,上述终端设备或者服务器可以是一个分布式***中的一个节点,其中,该分布式***可以为区块链***,该区块链***可以是由该多个节点通过网络通信的形式连接形成的分布式***。其中,节点之间可以组成点对点(P2P,Peer To Peer)网络,任意形式的计算设备,比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链***中的一个节点。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述音频处理方面的各种可选实现方式中提供的方法。其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,在检测到实时音频播放发生播放间断的情况下,获取待播放的实时音频,其中,实时音频包括静音音频和有效音频;
S2,在实时音频的数据量达到参考量值的情况下,统计参考量值的实时音频中静音音频的数据量,其中,静音音频的音频幅值小于幅值阈值;
S3,确定静音音频的数据量对应的音频压缩参数;
S4,按照音频压缩参数对有效音频进行音频压缩处理,得到播放音频。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种音频处理方法,其特征在于,包括:
在检测到实时音频播放发生播放间断的情况下,获取待播放的实时音频,其中,所述实时音频包括静音音频和有效音频;
在所述实时音频的数据量达到参考量值的情况下,统计所述参考量值的实时音频中所述静音音频的数据量,其中,所述静音音频的音频幅值小于幅值阈值;
确定所述静音音频的数据量对应的音频压缩参数;
按照所述音频压缩参数对所述有效音频进行音频压缩处理,得到播放音频;
所述音频压缩参数用于指示所述有效音频的保留程度,所述保留程度包括压缩得到的播放音频的音频点数与有效音频的音频点数的比值。
2.根据权利要求1所述的方法,其特征在于,所述确定所述静音音频的数据量对应的音频压缩参数包括:
查询所述静音音频的数据量对应的音频压缩等级;
根据所述音频压缩等级确定所述静音音频的数据量对应的所述音频压缩参数。
3.根据权利要求1或2所述的方法,其特征在于,所述确定所述静音音频的数据量对应的音频压缩参数包括:
在所述音频压缩参数用于指示所述有效音频的保留程度的情况下,所述静音音频的数据量与所述音频压缩参数的数值呈正相关。
4.根据权利要求1所述的方法,其特征在于,在获取待播放的实时音频之前,所述方法还包括:
获取所述播放间断的间断时长;
计算所述间断时长对应的目标数据量,其中,所述目标数据量用于指示待音频压缩处理的数据压缩量。
5.根据权利要求4所述的方法,其特征在于,在得到播放音频之后,所述方法还包括:
计算所述参考量值与所述播放音频的数据量的差值,得到播放压缩量;
在所述播放压缩量小于所述目标数据量的情况下,获取当前实时音频;
在所述当前实时音频达到所述参考量值的情况下,根据所述当前实时音频中的当前静音音频的数据量对所述当前实时音频中的当前有效音频进行音频压缩处理。
6.根据权利要求5所述的方法,其特征在于,在得到播放压缩量之后,所述方法还包括:
在所述播放压缩量等于或大于所述目标数据量的情况下,将所述当前实时音频作为当前播放音频。
7.一种音频处理装置,其特征在于,包括:
获取单元,用于在检测到实时音频播放发生播放间断的情况下,获取待播放的实时音频,其中,所述实时音频包括静音音频和有效音频;
统计单元,用于在所述实时音频的数据量达到参考量值的情况下,统计所述参考量值的实时音频中所述静音音频的数据量,其中,所述静音音频的音频幅值小于幅值阈值;
确定单元,用于确定所述静音音频的数据量对应的音频压缩参数;
压缩单元,用于按照所述音频压缩参数对所述有效音频进行音频压缩处理,得到播放音频;
所述音频压缩参数用于指示所述有效音频的保留程度,所述保留程度包括压缩得到的播放音频的音频点数与有效音频的音频点数的比值。
8.一种计算机可读的存储介质,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行所述权利要求1至6任一项中所述的方法。
9.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至6任一项中所述的方法。
CN202110957155.4A 2021-08-19 2021-08-19 音频处理方法和装置、存储介质及电子设备 Active CN113496705B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110957155.4A CN113496705B (zh) 2021-08-19 2021-08-19 音频处理方法和装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110957155.4A CN113496705B (zh) 2021-08-19 2021-08-19 音频处理方法和装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN113496705A CN113496705A (zh) 2021-10-12
CN113496705B true CN113496705B (zh) 2024-03-08

Family

ID=77996912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110957155.4A Active CN113496705B (zh) 2021-08-19 2021-08-19 音频处理方法和装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN113496705B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0573089A (ja) * 1991-09-18 1993-03-26 Matsushita Electric Ind Co Ltd 音声再生方法
JPH08211894A (ja) * 1995-02-03 1996-08-20 Sanyo Electric Co Ltd 音声通信機および音声通信システム
JPH0945001A (ja) * 1995-08-02 1997-02-14 Matsushita Electric Ind Co Ltd ディスク装置
US6282611B1 (en) * 1990-07-11 2001-08-28 Hitachi, Ltd. Digital information system, digital audio signal processor and signal converter
JP2008058956A (ja) * 2006-07-31 2008-03-13 Matsushita Electric Ind Co Ltd 音声再生装置
CN101771869A (zh) * 2008-12-30 2010-07-07 深圳市万兴软件有限公司 一种音视频编解码装置及方法
CN104123949A (zh) * 2014-01-24 2014-10-29 腾讯科技(深圳)有限公司 卡帧检测方法和装置
JP2015122682A (ja) * 2013-12-25 2015-07-02 ブラザー工業株式会社 遠隔会議プログラム、端末装置および遠隔会議方法
CN105847857A (zh) * 2016-03-07 2016-08-10 乐视致新电子科技(天津)有限公司 倍速播放视频时处理音频的方法及装置
CN108924665A (zh) * 2018-05-30 2018-11-30 深圳市捷视飞通科技股份有限公司 降低视频播放延时的方法、装置、计算机设备和存储介质
CN109427342A (zh) * 2017-09-01 2019-03-05 三星Sds株式会社 用于防止语音延迟的语音数据处理装置及方法
CN111355996A (zh) * 2018-12-20 2020-06-30 海信视像科技股份有限公司 一种音频播放方法及计算设备
CN116259322A (zh) * 2021-12-10 2023-06-13 腾讯科技(深圳)有限公司 音频数据压缩方法及相关产品

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6282611B1 (en) * 1990-07-11 2001-08-28 Hitachi, Ltd. Digital information system, digital audio signal processor and signal converter
JPH0573089A (ja) * 1991-09-18 1993-03-26 Matsushita Electric Ind Co Ltd 音声再生方法
JPH08211894A (ja) * 1995-02-03 1996-08-20 Sanyo Electric Co Ltd 音声通信機および音声通信システム
JPH0945001A (ja) * 1995-08-02 1997-02-14 Matsushita Electric Ind Co Ltd ディスク装置
JP2008058956A (ja) * 2006-07-31 2008-03-13 Matsushita Electric Ind Co Ltd 音声再生装置
CN101771869A (zh) * 2008-12-30 2010-07-07 深圳市万兴软件有限公司 一种音视频编解码装置及方法
JP2015122682A (ja) * 2013-12-25 2015-07-02 ブラザー工業株式会社 遠隔会議プログラム、端末装置および遠隔会議方法
CN104123949A (zh) * 2014-01-24 2014-10-29 腾讯科技(深圳)有限公司 卡帧检测方法和装置
CN105847857A (zh) * 2016-03-07 2016-08-10 乐视致新电子科技(天津)有限公司 倍速播放视频时处理音频的方法及装置
CN109427342A (zh) * 2017-09-01 2019-03-05 三星Sds株式会社 用于防止语音延迟的语音数据处理装置及方法
CN108924665A (zh) * 2018-05-30 2018-11-30 深圳市捷视飞通科技股份有限公司 降低视频播放延时的方法、装置、计算机设备和存储介质
CN111355996A (zh) * 2018-12-20 2020-06-30 海信视像科技股份有限公司 一种音频播放方法及计算设备
CN116259322A (zh) * 2021-12-10 2023-06-13 腾讯科技(深圳)有限公司 音频数据压缩方法及相关产品

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MP3数码音频播放机设计;王希公;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20060715;全文 *

Also Published As

Publication number Publication date
CN113496705A (zh) 2021-10-12

Similar Documents

Publication Publication Date Title
US20220394316A1 (en) Message sending method and device, readable medium and electronic device
EP3457704A1 (en) Quality of user experience testing for video transmissions
CN103457910B (zh) 一种上传文件的方法及终端
CN110121100A (zh) 媒体文件的下载方法、装置、终端和计算机可读存储介质
CN104000562A (zh) 一种健康提醒***、方法和装置
CN103731631B (zh) 一种传输视频图像的方法、装置及***
CN109511011B (zh) 一种面向YouTube DASH加密视频的指纹数据库构建方法
CN104811751A (zh) 一种流媒体播放时的卡顿识别方法和装置
JP6574031B2 (ja) モバイル映像通話品質測定方法およびシステム
CN103702178B (zh) 一种播放方法及电子设备
CN108924205B (zh) 数据传输方法、装置、电子设备、网闸适配器
CN102136962B (zh) 质量问题定界方法及相关设备与***
CN111294664A (zh) 音视频传输数据方法、电子设备及存储介质
CN112738538B (zh) 直播间挂机行为检测方法、装置、电子设备和计算机可读存储介质
JP5938015B2 (ja) チャンクダウンロード完了判定装置、チャンクダウンロード完了判定方法、及びプログラム
CN106454553A (zh) 精准时延直播视频网络传输控制方法
CN113496705B (zh) 音频处理方法和装置、存储介质及电子设备
CN112565016B (zh) 异常时延的定位方法、***、装置、电子设备及存储介质
CN110602515B (zh) 基于区块链的数据处理方法、服务器及存储介质
CN113364698A (zh) 带宽估计方法、***、电子设备与存储介质
WO2019000877A1 (zh) 音频数据处理方法及装置
JP2015106768A (ja) 通信装置のプログラム、通信装置、及び通信方法
CN110365690A (zh) 流量采集方法、装置及存储介质
CN114866827A (zh) 音视频同步的检测方法和装置、存储介质及电子设备
CN106470348B (zh) 收视数统计方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant