CN109495660B - 一种音频数据的编码方法、装置、设备和存储介质 - Google Patents

一种音频数据的编码方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN109495660B
CN109495660B CN201811446605.8A CN201811446605A CN109495660B CN 109495660 B CN109495660 B CN 109495660B CN 201811446605 A CN201811446605 A CN 201811446605A CN 109495660 B CN109495660 B CN 109495660B
Authority
CN
China
Prior art keywords
coding rate
rate
original
target
packet header
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811446605.8A
Other languages
English (en)
Other versions
CN109495660A (zh
Inventor
成家雄
朱敏
刘丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bigo Technology Pte Ltd
Original Assignee
Guangzhou Baiguoyuan Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Baiguoyuan Information Technology Co Ltd filed Critical Guangzhou Baiguoyuan Information Technology Co Ltd
Priority to CN201811446605.8A priority Critical patent/CN109495660B/zh
Publication of CN109495660A publication Critical patent/CN109495660A/zh
Application granted granted Critical
Publication of CN109495660B publication Critical patent/CN109495660B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/006Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/006Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer
    • H04M7/0072Speech codec negotiation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/006Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer
    • H04M7/0081Network operation, administration, maintenance, or provisioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例公开了一种音频数据的编码方法、装置、设备和存储介质,所述方法包括:获取音频数据传输网络的网络带宽值;确定所述音频数据当前设置的原始语音编码码率和原始包头编码码率;根据所述网络带宽值分别对所述原始语音编码码率和所述包头编码码率进行调整,得到目标语音编码码率和目标包头编码码率;采用所述目标语音编码码率和所述目标包头编码码率对所述音频数据进行编码,得到目标音频数据。本发明实施例根据网络的网络带宽值分别对原始语音编码码率和包头编码码率进行调整,在低网络带宽下可以降低包头编码码率以降低总编码码率,以使得总编码码率适配低网络带宽,保证了低网络带宽下的通话质量。

Description

一种音频数据的编码方法、装置、设备和存储介质
技术领域
本发明涉及通信技术领域,尤其涉及一种音频数据的编码方法、装置、设备和存储介质。
背景技术
随着互联网技术的日益发展,基于互联网进行语音通话的应用程序也越来越受到人们的关注,而使用网络语音通话的场景也越来越多。
在语音通话中,通话质量受限于网络带宽,在可用网络带宽较小时网络出现丢包、延时、抖动等情况。目前,为了改善网络带宽对通话质量的影响,通常是通过降低编码码率以提高通话质量,但是编码码率下降到下限值后,如果通话质量还无法得到有效改善,继续下降编码码率则会影响通话语音的清晰度,通话质量无法得到有效改善,因此,目前降低编码码率改善通话质量的方法,无法有效改善低网络带宽的通话质量。
发明内容
本发明实施例提供一种音频数据的编码方法、装置、设备和存储介质,以解决现有调整编码码率改善通话质量的方法,无法有效改善低网络带宽的通话质量的问题。
第一方面,本发明实施例提供了一种音频数据的编码方法,包括:
获取音频数据传输网络的网络带宽值;
确定所述音频数据当前设置的原始语音编码码率和原始包头编码码率;
根据所述网络带宽值分别对所述原始语音编码码率和所述包头编码码率进行调整,得到目标语音编码码率和目标包头编码码率;
采用所述目标语音编码码率和所述目标包头编码码率对所述音频数据进行编码,得到目标音频数据。
第二方面,本发明实施例提供了一种音频数据的编码装置,包括:
网络带宽值获取模块,用于获取音频数据传输网络的网络带宽值;
原始码率确定模块,用于确定所述音频数据当前设置的原始语音编码码率和原始包头编码码率;
码率调整模块,用于根据所述网络带宽值分别对所述原始语音编码码率和所述包头编码码率进行调整,得到目标语音编码码率和目标包头编码码率;
音频数据编码模块,用于采用所述目标语音编码码率和所述目标包头编码码率对所述音频数据进行编码,得到目标音频数据。
第三方面,本发明实施例提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任一实施例所述的音频数据的编码方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任一实施例所述的音频数据的编码方法。
本发明实施例提供的音频数据的编码方法,通过获取音频数据传输网络的网络带宽值,确定音频数据当前设置的原始语音编码码率和原始包头编码码率;并根据网络带宽值分别对原始语音编码码率和包头编码码率进行调整,得到目标语音编码码率和目标包头编码码率,从而采用目标语音编码码率和目标包头编码码率对音频数据进行编码,得到目标音频数据。本发明实施例根据网络的网络带宽值分别对原始语音编码码率和原始包头编码码率进行调整,在低网络带宽下可以降低包头编码码率以降低总编码码率,以使得总编码码率适配低网络带宽,保证了低网络带宽下的通话质量。
附图说明
图1是本发明实施例提供的一种音频数据的编码方法的示意图;
图2是本发明另一实施例提供的一种音频数据的编码方法的示意图;
图3是本发明实施例提供的一种音频数据的编码装置的结构示意图;
图4是本发明实施例提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
图1为本发明实施例提供的一种音频数据的编码方法的流程图,本发明实施例可适用于语音通话中音频发送设备发送音频数据的情况,该方法可以由音频数据的编码装置来执行,该装置可以通过软件和/或硬件的方式来实现,并集成在执行本方法的设备中,具体地,如图1所示,该方法可以包括如下步骤:
S101、获取音频数据传输网络的网络带宽值。
在本发明实施例中,音频发送设备可以响应于用户在网络通话APP的语音通话操作,采集音频数据并对音频数据编码后通过网络发送至与音频接收设备,在发送音频数据的过程中,音频发送设备可以实时计算网络的网络带宽值,其中,网络带宽值可以是指在音频数据的传输链路上,固定的时间内可传输的数据量。
具体地,音频发送设备可以根据网络状态对网络带宽值进行估算,其中,网络状态可以用网络质量参数表示,例如可以包括但不限于网络的发送速率、接收速率、网络延时和丢包率等,音频发送设备可以实时对网络质量参数进行监测,以根据网络质量参数对网络带宽值进行估算。
S102、确定所述音频数据当前设置的原始语音编码码率和原始包头编码码率。
本发明实施例中,可以对音频数据进行PCM编码、WMA编码、MP3编码、AAC编码等,在音频发送设备将音频数据发送至音频接收设备时,先按照一定的编码码率对音频数据进行编码,以生成数据包,然后将数据包发送至音频接收设备。将音频数据编码为数据包可以包括对音频数据进行编码以及对包头信息进行编码,其中,包头信息可以包括ip信息、udp信息,语音包信息(比如rtp信息)等,相应地可以将上述包头信息编码为ip包头,udp包头,语音包包头(比如rtp包头)。因此,可以将当前音频数据的编码码率作为原始语音编码码率,将当前包头信息的编码码率作为原始包头编码码率。
S103、根据所述网络带宽值分别对所述原始语音编码码率和所述包头编码码率进行调整,得到目标语音编码码率和目标包头编码码率。
具体地,可以根据网络带宽值分别对原始语音编码码率和包头编码码率进行调整,得到目标语音编码码率和目标包头编码码率,比如,在网络带宽值提高时,优先提高原始语音编码码率,然后提高原始包头编码码率,以提升通话质量;或者在网络带宽值较低时,可以优先降低原始包头编码码率,使得总编码码率下降以适配较低的网络带宽值,以使得总编码码率适配较低的网络带宽值,从而保证低网络带宽下的通话质量。
S104、采用所述目标语音编码码率和所述目标包头编码码率对所述音频数据进行编码,得到目标音频数据。
在确定目标语音编码码率和目标包头编码码率后,音频发送设备可以采用目标语音编码和目标包头编码码率对音频数据进行编码,得到包含音频数据和包头数据的目标音频数据,例如,在一个音频数据包中,可以包括一个包头信息和至少一个音频帧,也可以包括多个音频帧。
本发明实施例提供的音频数据的编码方法,通过获取音频数据传输网络的网络带宽值,确定音频数据当前设置的原始语音编码码率和原始包头编码码率;并根据网络带宽值分别对原始语音编码码率和包头编码码率进行调整,得到目标语音编码码率和目标包头编码码率,从而采用目标语音编码码率和目标包头编码码率对音频数据进行编码,得到目标音频数据。本发明实施例根据网络的网络带宽值分别对原始语音编码码率和原始包头编码码率进行调整,在低网络带宽下可以降低包头编码码率以降低总编码码率,以使得总编码码率适配低网络带宽,保证了低网络带宽下的通话质量。
图2为本发明另一实施例提供的一种音频数据的编码方法的流程图,本实施例是在上述实施例的基础上进行优化。具体地,如图2所示,本发明实施例提供的方法可以包括如下步骤:
S201、按照预设速率计算周期,获取所述音频发送设备发送所述音频数据的发送速率和接收速率。
其中,发送速率为预设速率计算周期内发送总字节数和发送时间间隔的比值,接收速率为接收总字节数和接收间隔时间的比值,例如,预设速率计算周期可以为一个RTT(Round-Trip Time,往返延时),往返延时为从音频发送设备发送数据包开始,到接收到音频接收设备反馈的确认信息总共经历的时间。具体地,音频发送设备记录每个数据包的发送时间和接收时间,发送时间和接收时间的差值即为往返延时,其中,接收时间为音频发送设备接收到音频接收设备反馈的确认信息的时间。
在一个RTT内,音频发送设备可以发送多个数据包和接收到多个数据包,则可以计算一个RTT内发送的数据包的总字节数与RTT的比值,得到发送速率,以及,通过接收到的数据包的总字节数与RTT的比值,得到接收速率。
S202、基于所述发送速率和所述接收速率,确定所述预设速率计算周期的参考传输速率。
具体地,可以将预设速率计算周期内的发送速率和接收速率较小的一个作为参考传输速率,可选地,还可以将发送速率和接收速率的平均值作为参考传输速率,或者发送速率和接收速率中较小值的一定比例作为参考传输速率,例如,发送速率为150Mbps,接收速率为100Mbps,则较小的是接收速率为100Mbps,则参考传输速率可以为90Mbps。
S203、在预设带宽值计算周期内,获取多个参考传输速率。
本发明实施例中,可以按照预设带宽值计算周期计算网络带宽值,可选地,预设带宽值计算周期包含多个预设速率计算周期,则可以获取多个预设速率计算周期确定出的参考传输速率。例如,一个预设带宽值计算周期为10个RTT预设速率计算周期为一个RTT,可以获取每个RTT内确定参考传输速率。
S204、采用所述多个参考传输速率确定所述预设带宽值计算周期的网络带宽值。
具体地,可以将多个参考传输速率最大值作为网络带宽值,例如可以对多个参考传输速率从大到小进行排序,将排序最前的参考传输速率作为网络带宽值,当然,也可以将多个参考传输速率的平均值作为网络带宽值等,本发明实施例对采用多个参考传输速率确定网络带宽值的方式不加以限制。
本发明实施例根据发送速率和接收速率确定参考传输速率,并根据多个预设速率计算周期的参考传输速率确定网络带宽值,可以提高计算得到的网络带宽值的准确度。
S205、根据所述网络带宽值确定所述音频数据的目标总编码码率。
具体地,可以按照网络带宽值-码率关联列表确定网络带宽值对应的码率,将该码率作为目标总编码码率。例如,音频发送设备的编码码率范围为8kbps-32kbs,则可以将8kbps-32kbs分为若干码率段,每个码率段对应适配的网络带宽值,则可以根据网络带宽值确定音频发送设备的目标总编码码率。
S206、基于所述原始语音编码码率和所述原始包头编码码率确定原始总编码码率。
在确定原始语音编码码率和原始包头编码码率后,可以根据预设计算公式计算出原始总编码码率,当然,还可以从音频发送设备的编码模块中直接读取原始总编码码率,本发明实施例对确定原始总编码码率的方式不加以限制。
S207、如果所述目标总编码码率大于所述原始总编码码率,则提高所述原始语音编码码率和所述原始包头编码码率,得到目标语音编码码率和目标包头编码码率。
本发明实施例中,如果根据网络带宽值确定的目标总编码码率大于原始总编码码率,则可以提高语音编码码率和原始包头编码码率。具体地,可以计算目标总编码码率与原始总编码码率的比值,如果该比值大于第一阈值且小于第二阈值,则提高原始语音编码码率得到目标语音编码码率,以及将原始包头编码码率设置为目标包头编码码率;而如果比值大于第二阈值,则分别提高原始语音编码码率和原始包头编码码率,得到目标语音编码码率和目标包头编码码率。
例如,第一阈值为1.0,第二阈值为1.5,目标总编码码率与原始总编码码率的比值为1.3,说明当前网络带宽值有所提升,则可以优先对原始语音编码码率进行提升得到目标语音编码码率,同时将原始包头编码码率设置为目标包头编码码率,以提高语音通话的清晰度;而如果目标总编码码率与原始总编码码率的比值为2.0,说明当前网络带宽值大幅提高,则可以同时对原始语音编码码率和原始包头编码码率进行提升,以最大化使用网络带宽,从而提高语音通话质量。
上述阈值和比值设置仅仅是作为示例说明,在实施本发明实施例时,本领域技术人员可以根据实际情况设置不同的阈值和比值,本发明实施例对此不加以限制。
S208、如果所述目标总编码码率小于所述原始总编码码率,则降低所述原始语音编码码率和原始包头编码码率,得到目标语音编码码率和目标包头编码码率。
本发明实施例中,如果根据网络带宽值确定的目标总编码码率小于原始总编码码率,则可以降低语音编码码率和原始包头编码码率,以使得总编码码率与网络带宽值适配。
具体地,可以获取网络延时,计算目标总编码码率与原始总编码码率的比值,如果比值大于第三阈值且小于第四阈值,并且网络延时小于延时阈值,则降低原始包头编码码率,得到目标包头编码码率,以及,将原始语音编码码率设置为目标语音编码码率,而如果比值小于第三阈值,则降低原始语音编码码率得到目标语音编码码率,以及,降低原始包头编码码率得到目标包头编码码率。
例如,第三阈值为0.5,第四阈值为1,目标总编码码率与原始总编码码率的比值为0.4,网络延时小于延时阈值,说明当前网络带宽值有所下降,则可以优先降低原始包头编码码率得到目标包头编码码率,使得总编码码率下降以适配当前网络带宽,同时将原始语音编码码率设置为目标语音编码码率,以在允许的网络延时范围内保证通话质量;而如果目标总编码码率与原始总编码码率的比值为0.2,说明当前网络带宽值大幅降低,则可以同时降低原始语音编码码率和原始包头编码码率,使得总编码码率降低以适配当前的低网络带宽,保证在当前低网络带宽下可以实现通话。
在实际应用中,一个数据包包括一个包头信息和若干音频帧,通过调整一个数据包中音频帧的个数可以实现对包头编码码率的调整,例如,对于一个数据包包括一个包头信息和一个音频帧,另一个数据包包括一个包头信息和两个音频帧,相对于只包含一个音频帧,可以减小一半的包头编码码率。
本发明实施例可以根据网络的网络带宽值分别对原始语音编码码率和包头编码码率进行调整,在低网络带宽下可以降低包头编码码率以降低总编码码率,以使得总编码码率适配低网络带宽,保证了低网络带宽下的通话质量。
图3为本发明实施例的一种音频数据的编码装置的结构示意图,如图3所示,该装置具体包括:
网络带宽值获取模块301,用于获取音频数据传输网络的网络带宽值;
原始码率确定模302,用于确定所述音频数据当前设置的原始语音编码码率和原始包头编码码率;
码率调整模块303,用于根据所述网络带宽值分别对所述原始语音编码码率和所述包头编码码率进行调整,得到目标语音编码码率和目标包头编码码率;
音频数据编码模块304,用于采用所述目标语音编码码率和所述目标包头编码码率对所述音频数据进行编码,得到目标音频数据。
可选地,所述网络带宽值获取模块301包括:
发送速率和接收速率获取子模块,用于按照预设速率计算周期,获取所述音频发送设备发送所述音频数据的发送速率和接收速率;
参考传输数量确定子模块,用于基于所述发送速率和所述接收速率,确定所述预设速率计算周期的参考传输速率;
参考传输速率获取子模块,用于在预设带宽值计算周期内,获取多个参考传输速率;
网络带宽值计算子模块,用于采用所述多个参考传输速率确定所述预设带宽值计算周期的网络带宽值。
可选地,所述码率调整模块303包括:
目标总编码码率确定子模块,用于根据所述网络带宽值确定所述音频数据的目标总编码码率;
原始总编码码率确定子模块,用于基于所述原始语音编码码率和所述原始包头编码码率确定原始总编码码率;
第一码率调整子模块,用于如果所述目标总编码码率大于所述原始总编码码率,则提高所述原始语音编码码率和所述原始包头编码码率,得到目标语音编码码率和目标包头编码码率;
第二码率调整子模块,用于如果所述目标总编码码率小于所述原始总编码码率,则降低所述原始语音编码码率和原始包头编码码率,得到目标语音编码码率和目标包头编码码率。
可选地,所述第一码率调整子模块包括:
比值获取单元,用于获取所述目标总编码码率与所述原始总编码码率的比值;
第一码率调整单元,用于如果所述比值大于第一阈值且小于第二阈值,则提高所述原始语音编码码率得到所述目标语音编码码率,以及,将所述原始包头编码码率设置为目标包头编码码率;
第二码率调整单元,用于如果所述比值大于第二阈值,则分别提高所述原始语音编码码率和原始包头编码码率,得到目标语音编码码率和目标包头编码码率。
可选地,所述第二码率调整子模块包括:
网络延时获取单元,用于获取网络延时;
比值计算单元,用于计算所述目标总编码码率与所述原始总编码码率的比值;
第三码率调整单元,用于如果所述比值大于第三阈值且小于第四阈值,并且所述网络延时小于延时阈值,则降低所述原始包头编码码率,得到目标包头编码码率,以及,将所述原始语音编码码率设置为目标语音编码码率;
第四码率调整单元,用于如果所述比值小于第三阈值,则降低所述原始语音编码码率得到目标语音编码码率,以及,降低所述原始包头编码码率得到目标包头编码码率。
本发明实施例所提供的音频数据的编码装置可执行本发明任意实施例所提供的音频数据的编码方法,具备执行方法相应的功能模块和有益效果。
参照图4,示出了本发明一个示例中的一种设备的结构示意图。如图4所示,该设备具体可以包括:处理器40、存储器41、具有触摸功能的显示屏42、输入装置43、输出装置44以及通信装置45。该设备中处理器40的数量可以是一个或者多个,图4中以一个处理器40为例。该设备中存储器41的数量可以是一个或者多个,图4中以一个存储器41为例。该设备的处理器40、存储器41、显示屏42、输入装置43、输出装置44以及通信装置45可以通过总线或者其他方式连接,图4中以通过总线连接为例。
存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明任意实施例所述的音频数据的编码方法对应的程序指令/模块(例如,上述音频数据的编码装置中的网络带宽值获取模块301、原始码率确定模302、码率调整模块303和音频数据编码模块304等)。存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作装置、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
显示屏42为具有触摸功能的显示屏42,其可以是电容屏、电磁屏或者红外屏。一般而言,显示屏42用于根据处理器40的指示显示数据,还用于接收作用于显示屏42的触摸操作,并将相应的信号发送至处理器40或其他装置。可选的,当显示屏42为红外屏时,其还包括红外触摸框,该红外触摸框设置在显示屏42的四周,其还可以用于接收红外信号,并将该红外信号发送至处理器40或者其他设备。
通信装置45,用于与其他设备建立通信连接,其可以是有线通信装置和/或无线通信装置。
输入装置43可用于接收输入的数字或者字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入,还可以是用于获取图像的摄像头以及获取音频数据的拾音设备。输出装置44可以包括扬声器等音频设备。需要说明的是,输入装置43和输出装置44的具体组成可以根据实际情况设定。
处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述音频数据的编码方法。
具体地,实施例中,处理器40执行存储器41中存储的一个或多个程序时,具体实现如下操作:获取音频数据传输网络的网络带宽值;确定所述音频数据当前设置的原始语音编码码率和原始包头编码码率;根据所述网络带宽值分别对所述原始语音编码码率和所述包头编码码率进行调整,得到目标语音编码码率和目标包头编码码率;采用所述目标语音编码码率和所述目标包头编码码率对所述音频数据进行编码,得到目标音频数据。
本发明实施例还提供一种计算机可读存储介质,所述存储介质中的指令由设备的处理器执行时,使得设备能够执行如上述方法实施例所述的音频数据的编码方法。示例性的,该音频数据的编码方法包括:获取音频数据传输网络的网络带宽值;确定所述音频数据当前设置的原始语音编码码率和原始包头编码码率;根据所述网络带宽值分别对所述原始语音编码码率和所述包头编码码率进行调整,得到目标语音编码码率和目标包头编码码率;采用所述目标语音编码码率和所述目标包头编码码率对所述音频数据进行编码,得到目标音频数据。
需要说明的是,对于装置、设备、存储介质实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是机器人,个人计算机,服务器,或者网络设备等)执行本发明任意实施例所述的音频数据的编码方法。
值得注意的是,上述音频数据的编码装置中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行装置执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (7)

1.一种音频数据的编码方法,其特征在于,应用于音频发送设备,所述方法包括:
获取音频数据传输网络的网络带宽值;
确定所述音频数据当前设置的原始语音编码码率和原始包头编码码率;
根据所述网络带宽值确定所述音频数据的目标总编码码率;
基于所述原始语音编码码率和所述原始包头编码码率确定原始总编码码率;
如果所述目标总编码码率大于所述原始总编码码率,则提高所述原始语音编码码率和所述原始包头编码码率,得到目标语音编码码率和目标包头编码码率;
如果所述目标总编码码率小于所述原始总编码码率,则降低所述原始语音编码码率和原始包头编码码率,得到目标语音编码码率和目标包头编码码率;
采用所述目标语音编码码率和所述目标包头编码码率对所述音频数据进行编码,得到目标音频数据;
其中,所述如果所述目标总编码码率大于所述原始总编码码率,则提高所述原始语音编码码率和所述原始包头编码码率,得到目标语音编码码率和目标包头编码码率,包括:
获取所述目标总编码码率与所述原始总编码码率的比值;
如果所述比值大于第一阈值且小于第二阈值,则提高所述原始语音编码码率得到所述目标语音编码码率,以及,将所述原始包头编码码率设置为目标包头编码码率;
如果所述比值大于第二阈值,则分别提高所述原始语音编码码率和原始包头编码码率,得到目标语音编码码率和目标包头编码码率。
2.如权利要求1所述的方法,其特征在于,所述获取音频数据传输网络的网络带宽值包括:
按照预设速率计算周期,获取所述音频发送设备发送所述音频数据的发送速率和接收速率;
基于所述发送速率和所述接收速率,确定所述预设速率计算周期的参考传输速率;
在预设带宽值计算周期内,获取多个参考传输速率;
采用所述多个参考传输速率确定所述预设带宽值计算周期的网络带宽值。
3.如权利要求1所述的方法,其特征在于,所述如果所述目标总编码码率小于所述原始总编码码率,则降低所述原始语音编码码率和原始包头编码码率,得到目标语音编码码率和目标包头编码码率,包括:
获取网络延时;
计算所述目标总编码码率与所述原始总编码码率的比值;
如果所述比值大于第三阈值且小于第四阈值,并且所述网络延时小于延时阈值,则降低所述原始包头编码码率,得到目标包头编码码率,以及,将所述原始语音编码码率设置为目标语音编码码率;
如果所述比值小于第三阈值,则降低所述原始语音编码码率得到目标语音编码码率,以及,降低所述原始包头编码码率得到目标包头编码码率。
4.一种音频数据的编码装置,其特征在于,应用于音频发送设备,所述装置包括:
网络带宽值获取模块,用于获取音频数据传输网络的网络带宽值;
原始码率确定模块,用于确定所述音频数据当前设置的原始语音编码码率和原始包头编码码率;
码率调整模块,用于根据所述网络带宽值分别对所述原始语音编码码率和所述包头编码码率进行调整,得到目标语音编码码率和目标包头编码码率;
音频数据编码模块,用于采用所述目标语音编码码率和所述目标包头编码码率对所述音频数据进行编码,得到目标音频数据;
所述码率调整模块包括:
目标总编码码率确定子模块,用于根据所述网络带宽值确定所述音频数据的目标总编码码率;
原始总编码码率确定子模块,用于基于所述原始语音编码码率和所述原始包头编码码率确定原始总编码码率;
第一码率调整子模块,用于如果所述目标总编码码率大于所述原始总编码码率,则提高所述原始语音编码码率和所述原始包头编码码率,得到目标语音编码码率和目标包头编码码率;
第二码率调整子模块,用于如果所述目标总编码码率小于所述原始总编码码率,则降低所述原始语音编码码率和原始包头编码码率,得到目标语音编码码率和目标包头编码码率;
所述第一码率调整子模块,包括:
所述第一码率调整子模块包括:
比值获取单元,用于获取所述目标总编码码率与所述原始总编码码率的比值;
第一码率调整单元,用于如果所述比值大于第一阈值且小于第二阈值,则提高所述原始语音编码码率得到所述目标语音编码码率,以及,将所述原始包头编码码率设置为目标包头编码码率;
第二码率调整单元,用于如果所述比值大于第二阈值,则分别提高所述原始语音编码码率和原始包头编码码率,得到目标语音编码码率和目标包头编码码率。
5.如权利要求4所述的装置,其特征在于,所述网络带宽值获取模块包括:
发送速率和接收速率获取子模块,用于按照预设速率计算周期,获取所述音频发送设备发送所述音频数据的发送速率和接收速率;
参考传输数量确定子模块,用于基于所述发送速率和所述接收速率,确定所述预设速率计算周期的参考传输速率;
参考传输速率获取子模块,用于在预设带宽值计算周期内,获取多个参考传输速率;
网络带宽值计算子模块,用于采用所述多个参考传输速率确定所述预设带宽值计算周期的网络带宽值。
6.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-3中任一所述的音频数据的编码方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-3中任一所述的音频数据的编码方法。
CN201811446605.8A 2018-11-29 2018-11-29 一种音频数据的编码方法、装置、设备和存储介质 Active CN109495660B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811446605.8A CN109495660B (zh) 2018-11-29 2018-11-29 一种音频数据的编码方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811446605.8A CN109495660B (zh) 2018-11-29 2018-11-29 一种音频数据的编码方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN109495660A CN109495660A (zh) 2019-03-19
CN109495660B true CN109495660B (zh) 2021-05-18

Family

ID=65698796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811446605.8A Active CN109495660B (zh) 2018-11-29 2018-11-29 一种音频数据的编码方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN109495660B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111583942B (zh) * 2020-05-26 2023-06-13 腾讯科技(深圳)有限公司 语音会话的编码码率控制方法、装置和计算机设备
CN113014850A (zh) * 2021-04-02 2021-06-22 浙江德维迪亚数字科技有限公司 头戴计算机的防断网通讯方法
CN112767956B (zh) * 2021-04-09 2021-07-16 腾讯科技(深圳)有限公司 音频编码方法、装置、计算机设备及介质
CN113724716B (zh) * 2021-09-30 2024-02-23 北京达佳互联信息技术有限公司 语音处理方法和语音处理装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1960315A (zh) * 2005-10-31 2007-05-09 康佳集团股份有限公司 流媒体去抖动方法
CN101119338A (zh) * 2007-09-20 2008-02-06 腾讯科技(深圳)有限公司 网络语音通信方法、***、装置和即时通信终端
CN101437032A (zh) * 2008-12-19 2009-05-20 重庆邮电大学 基于sip协议的voip语音质量监测***及检测方法
CN103997434A (zh) * 2014-05-21 2014-08-20 华为技术有限公司 网络传输状况的探测方法和相关设备
CN104917671A (zh) * 2015-06-10 2015-09-16 腾讯科技(深圳)有限公司 基于移动终端的音频处理方法和装置
CN105187167A (zh) * 2015-09-28 2015-12-23 广州市百果园网络科技有限公司 一种语音数据通信方法及装置
CN105472477A (zh) * 2015-12-08 2016-04-06 广州华多网络科技有限公司 一种数据传输方法、装置及设备
CN105530449A (zh) * 2014-09-30 2016-04-27 阿里巴巴集团控股有限公司 编码参数调整方法及装置
CN105610635A (zh) * 2016-02-29 2016-05-25 腾讯科技(深圳)有限公司 语音编码发送方法和装置
CN105634865A (zh) * 2015-12-29 2016-06-01 广州华多网络科技有限公司 获得带宽的方法及***
CN106231353A (zh) * 2016-07-22 2016-12-14 北京小米移动软件有限公司 VoIP通信方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040032860A1 (en) * 2002-08-19 2004-02-19 Satish Mundra Quality of voice calls through voice over IP gateways
WO2008127154A1 (en) * 2007-04-12 2008-10-23 Telefonaktiebolaget L M Ericsson (Publ) Measuring network performance with reference packet probing

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1960315A (zh) * 2005-10-31 2007-05-09 康佳集团股份有限公司 流媒体去抖动方法
CN101119338A (zh) * 2007-09-20 2008-02-06 腾讯科技(深圳)有限公司 网络语音通信方法、***、装置和即时通信终端
CN101437032A (zh) * 2008-12-19 2009-05-20 重庆邮电大学 基于sip协议的voip语音质量监测***及检测方法
CN103997434A (zh) * 2014-05-21 2014-08-20 华为技术有限公司 网络传输状况的探测方法和相关设备
CN105530449A (zh) * 2014-09-30 2016-04-27 阿里巴巴集团控股有限公司 编码参数调整方法及装置
CN104917671A (zh) * 2015-06-10 2015-09-16 腾讯科技(深圳)有限公司 基于移动终端的音频处理方法和装置
CN105187167A (zh) * 2015-09-28 2015-12-23 广州市百果园网络科技有限公司 一种语音数据通信方法及装置
CN105472477A (zh) * 2015-12-08 2016-04-06 广州华多网络科技有限公司 一种数据传输方法、装置及设备
CN105634865A (zh) * 2015-12-29 2016-06-01 广州华多网络科技有限公司 获得带宽的方法及***
CN105610635A (zh) * 2016-02-29 2016-05-25 腾讯科技(深圳)有限公司 语音编码发送方法和装置
CN106231353A (zh) * 2016-07-22 2016-12-14 北京小米移动软件有限公司 VoIP通信方法及装置

Also Published As

Publication number Publication date
CN109495660A (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
CN109495660B (zh) 一种音频数据的编码方法、装置、设备和存储介质
US11349900B2 (en) Voice encoding and sending method and apparatus
CN107864084B (zh) 数据包的传输方法和装置
EP2137883B1 (en) Method of transmitting data in a communication system
EP3490199B1 (en) Calling method and terminal
CN109600610B (zh) 一种数据编码方法、终端及计算机可读存储介质
EP3155795B1 (en) In-service monitoring of voice quality in teleconferencing
CN101854308B (zh) VoIP***高音质服务网络自适应实现方法
US8340126B2 (en) Method and apparatus for congestion control
EP3132579B1 (en) Jitter buffer level estimation
WO2015160617A1 (en) Jitter buffer control based on monitoring of delay jitter and conversational dynamics
CN104618195A (zh) 带宽估测方法和装置
CN109862377B (zh) 视频传输方法、装置、***及计算机可读存储介质
CN106791575B (zh) 一种数据发送的控制方法及设备
CN112821992A (zh) 数据传输方法、装置、电子设备和存储介质
CN108476176A (zh) 在视频电话中的实时传输协议拥塞控制技术
US20200193999A1 (en) Handling of poor audio quality in a terminal device
CN109361494B (zh) 一种音频数据的处理方法、装置、设备和存储介质
CN107979482B (zh) 一种信息处理方法、装置、发送端、去抖动端、接收端
JP2014160911A (ja) パケット処理装置、方法及びプログラム
CN115378832B (zh) 拥塞检测方法、装置及流媒体传输***、电子设备和介质
CN104518841A (zh) 数据发送方法及装置
EP3014833B1 (en) Methods, network nodes, computer programs and computer program products for managing processing of an audio stream
JP2011228823A (ja) パケットロス率推定装置、パケットロス率推定方法、パケットロス率推定プログラム、及び、通信システム
CN112786062A (zh) 带宽自适应网络音频传输方法、设备、介质及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220601

Address after: 31a, 15 / F, building 30, maple mall, bangrang Road, Brazil, Singapore

Patentee after: Baiguoyuan Technology (Singapore) Co.,Ltd.

Address before: 511442 23-39 / F, building B-1, Wanda Plaza North, Wanbo business district, 79 Wanbo 2nd Road, Nancun Town, Panyu District, Guangzhou City, Guangdong Province

Patentee before: GUANGZHOU BAIGUOYUAN INFORMATION TECHNOLOGY Co.,Ltd.