CN1732512A - 用于隐蔽压缩域分组丢失的方法和装置 - Google Patents
用于隐蔽压缩域分组丢失的方法和装置 Download PDFInfo
- Publication number
- CN1732512A CN1732512A CNA2003801081006A CN200380108100A CN1732512A CN 1732512 A CN1732512 A CN 1732512A CN A2003801081006 A CNA2003801081006 A CN A2003801081006A CN 200380108100 A CN200380108100 A CN 200380108100A CN 1732512 A CN1732512 A CN 1732512A
- Authority
- CN
- China
- Prior art keywords
- frame
- data division
- present frame
- data
- consecutive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000002950 deficient Effects 0.000 claims description 38
- 230000006835 compression Effects 0.000 claims description 27
- 238000007906 compression Methods 0.000 claims description 27
- 230000005236 sound signal Effects 0.000 claims description 10
- 238000011084 recovery Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims 3
- 239000000872 buffer Substances 0.000 abstract description 3
- 230000005540 biological transmission Effects 0.000 description 13
- 230000014509 gene expression Effects 0.000 description 7
- 230000002596 correlated effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000001771 impaired effect Effects 0.000 description 4
- 230000003321 amplification Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M13/00—Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
一种用于在压缩域中隐蔽AAC比特流中的丢失数据的差错隐蔽方法和装置。该比特流被划分成帧,每个帧具有多个包括报头/全局增益,标度因子和QMDCT系数的数据部分。数据部分存储在多个缓冲器中,从而,如果当前帧的一个或多个数据部分受损或丢失,使用相邻帧中相应的数据部分来隐蔽当前帧中的差错。
Description
相关申请的交叉参考
本发明涉及2002年10月23日递交、转让给本发明受让人的共同未决美国专利申请序列No.10/281,395。本发明还涉及,并且一部分要求在申请日为2002年6月14日、转让给本发明受让人的共同未决专利申请No.PCT/IB02/02193的权利。
技术领域
本发明概括而言涉及差错掩藏,更具体而言,涉及用于隐蔽数字音频流应用中出现传输错误的分组丢失恢复。
背景技术
如果流媒体可用于移动设备中,那么用户就能使用移动设备例如收听音乐。对于音乐收听应用而言,通常将音频信号压缩成数字分组格式来传输。压缩数字音频诸如MP3(MPEG-1/2层3)在Internet上的传输,对于传统的音乐发行过程已经产生了深远的影响。在音频信号压缩领域中最新研究表明,对于使用移动终端的流数字音频已有可能实现。由于网络通信量增大,有可能出现因分组网络中通信量拥塞或过度延迟而造成音频分组的丢失。此外,无线信道是另一种可引起分组丢失的差错源。在此条件下,关键在于提高服务质量(QoS),从而产生普遍接受的音乐流应用。
为了减轻分组丢失所引起的声音品质下降,已经提出了多种现有技术及其组合。UEP(不等差错保护),即前向纠错的子类(FEC),是在此方面的一个重要概念。已经证明,UEP是一种用于保护压缩域音频比特流,如MPEG AAC(高级音频编码),的非常有效的工具,其中,按照其比特差错灵敏度将比特分成不同的类。在美国专利申请序列No.10/281,395中披露了使用UEP进行乐器声音的差错隐蔽。
在另一种方法中,Korhonen(“Error Robustness Scheme forPefceptually Coded Audio Based on Interframe Shuffling ofSamples”,Proc.of IEEE International Conference onAcoustics,Speech and Signal Processing 2002,OrlandoFlorida,pp.2053-2056,2002年5月)将音频帧分成两部分:关键数据部分和弱关键数据部分。包括关键数据部分的有效载荷通过可靠方式传输,如TCP(传输控制协议),而弱关键数据部分诸如UDP(用户数据报协议)的方式传输。
不过,由于移动IP网络的差错性以及对等待时间的限制,按照多种UEP机制以及选择性重发机制进行的分组传递依然不太可靠。特别是当差错源自于拥塞IP网络中的分组丢失,无线空中接口中的比特差错,以及蜂窝网络中的切换时的情形。因而,提供一种用于在分组网如移动IP网、2.5G和3G网以及蓝牙上传输高质量音频流的健壮方法和***,是有益和合乎需要的。该方法和***必须考虑所需的计算复杂性以及存储器/能耗。
MPEG-2/MPEG-4 AAC编码器及其相关的数据结构在本领域中是公知的。图1表示AAC帧的数据结构。帧包括关键数据部分(例如报头),标度因子以及量化改良离散余弦变换系数(QMDCT数据)。图2表示MPEG-2解码器。如图所示,解码器10包括比特流多路解复用器,用于接收13818-7编码的音频数据流200,并将信号(细线)和数据(粗线)提供给解码器中的各个解码工具。解码器10中的工具包括增益控制模块,AAC频谱处理块以及AAC解码块。如图2所示,可由比特流多路解复用器所提供的信号220和数据230得到AAC帧中的关键数据部分110。可由无噪声解码工具的输出获得QMDCT数据112。可由标度因子解码工具的输出获得标度因子114。在现有技术中,差错隐蔽主要在时域(例如PCM取样240)或频域(例如MDCT和IMDCT系数)中实现。所述现有技术解决方案对于存储器、计算和能耗的要求更多。当在移动终端中实现音频流时,希望使用能大大减少存储器要求、计算复杂性以及能耗的差错隐蔽方法。
发明内容
本发明提供一种对数字音频流中发生的传输差错进行差错隐蔽的方法和装置。更具体而言,在压缩域中恢复传输所造成的分组丢失。
从而,根据本发明第一方面,提供一种对音频信号的比特流表示中的差错进行隐蔽的方法,其中,该比特流包括当前帧和至少一个相邻帧,每帧具有处于压缩域中的多个数据部分。该方法的特征在于:
将压缩域中的所述多个数据部分存储在所述至少一个相邻帧中,
判断当前帧是否存在缺陷,
如果当前帧有缺陷,则检测当前帧中至少一个有缺陷的数据部分,以及
基于所述至少一个相邻帧中的其中至少一个所存储的数据部分,恢复当前帧中所述至少一个有缺陷的数据部分。
如果当前帧中有缺陷的数据部分为报头,则基于与所述至少一个相邻帧中所述其中至少一个所存储的数据部分的报头相关联的统计特性,恢复该有缺陷的报头。
如果当前帧中有缺陷的数据部分是全局增益值,则基于用于恢复当前帧中所述至少一个有缺陷的数据部分的所述至少一个相邻帧中的全局增益,恢复该有缺陷的数据部分。
最好是,所述至少一个相邻帧包括具有第一全局增益值的第一帧,和具有小于第一全局增益值的第二全局增益值的第二帧,基于第二全局增益值来恢复当前帧中的有缺陷的数据部分。
如果当前帧中有缺陷的数据部分包括一个或多个标度因子,则基于用于恢复当前帧中所述至少一个有缺陷数据部分的所述至少一个相邻帧中的标度因子,恢复该有缺陷的数据部分。
如果当前帧中有缺陷的数据部分包括QMDCT系数,则基于所述至少一个相邻帧中的QMDCT系数、特别是在较低频率域中的QMDCT系数,恢复该有缺陷的数据部分。可用零取代当前帧中丢失的QMDCT系数。
根据本发明第二方面,提供一种音频解码器,用于解码音频信号的比特流表示,以便提供在调制域中的音频数据,其中,该比特流包括当前帧和至少一个相邻帧,每帧具有多个数据部分,所述解码器包括第一模块,用于解码所述每个帧,以提供在压缩域中的多个数据部分的信号表示。该解码器的特征在于:
第二模块,其对信号作出响应,用于将压缩域中的所述多个数据部分存储在所述至少一个相邻帧中,以及
第三模块,若当前帧有缺陷,则用于检测压缩域中的至少一个有缺陷的数据部分,以基于所述至少一个相邻帧中的至少其中一个所存储的数据部分,恢复当前帧中所述至少一个有缺陷的数据部分。
根据本发明第三方面,提供一种用于接收音频流中的分组数据的音频接收机,所述接收机包括拆包模块,用于将接收的分组数据拆成音频信号的比特流表示,其中,该比特流包括当前帧和至少一个相邻帧,每帧具有多个数据部分。该接收机的特征在于:
解码模块,用于将所述每个帧解码,以提供在压缩域中的多个数据部分的信号表示,
存储模块,对信号作出响应,用于将压缩域中的所述多个数据部分存储在所述至少一个相邻帧中,以及
差错隐蔽模块,若当前帧有缺陷,则用于检测当前帧中的至少一个数据部分,以基于所述至少一个相邻帧中的至少其中一个所存储的数据部分,恢复当前帧中的所述至少一个有缺陷的数据部分。
根据本发明第四方面,提供一种电信设备,如移动终端。该电信设备包括:
天线,和
与天线相连的音频接收机,用于接收音频流中的分组数据,其中,该接收机包括拆包模块,用于将所接收的分组数据拆成音频信号的比特流表示,其中,该比特流包括当前帧和至少一个相邻帧,每帧具有多个数据部分,且其中,该接收机还包括:
解码模块,用于解码所述每个帧,以提供在压缩域中的多个数据部分的信号表示,
存储模块,对信号作出响应,用于将压缩域中的所述多个数据部分存储在所述至少一个相邻帧中,以及
差错隐蔽模块,若当前帧有缺陷,则检测当前帧中的至少一个数据部分,以基于所述至少一个相邻帧中的至少其中一个所存储的数据部分,恢复当前帧中的所述至少一个有缺陷的数据部分。
结合附图3至13,通过阅读说明,将易于理解本发明。
附图说明
图1所示的方框图表示AAC帧的数据结构。
图2所示的方框图表示现有技术的MPEG-2 AAC解码器。
图3所示的流程图表示根据本发明的差错隐蔽方法。
图4所示的示意图表示对于AAC帧被破坏的关键数据部分的恢复。
图5所示的示意图表示所丢失标度因子的恢复。
图6所示的曲线图表示AAC帧的左和右通道的长开窗标度因子。
图7所示的曲线图表示长开窗标度因子的另一示例。
图8所示的曲线图表示两相邻AAC帧的短开窗标度因子。
图9所示的示意图表示AAC帧中的标度因子矢量。
图10所示的示意图表示估计丢失编码标度因子的搜索过程。
图11a所示的曲线图表示AAC帧的其中一个立体声通道中的QMDCT系数。
图11b所示的曲线图表示AAC帧的另一立体声通道中的QMDCT系数。
图12所示的方框图表示,根据本发明,可实现差错隐蔽方法的接收机。
图13所示的方框图表示,根据本发明,具有差错隐蔽模块的移动终端。
具体实施方式
在使用各种UEP(不等差错保护)机制后,在接收机侧的情形可能是在AAC帧中的QMDCT(量化改良离散余弦变换)数据中出现最多的分组丢失。有些分组丢失发生在AAC标度因子中。在罕有情况下,分组丢失可能出现在关键数据中,或者AAC报头和全局_增益(global-gain)中。如果关键数据丢失,则很难将该AAC帧的其余部分解码。
因而,本发明直接在压缩域中进行差错隐蔽。特别是,本发明隐蔽AAC帧的三个独立部分中的差错:包括报头和全局_增益的关键数据,QMDCT数据以及标度因子。图3的流程图500中表示出根据本发明的差错隐蔽方法。在通过比特流多路解复用器(图2)将编码音频比特流分类后,获得并检查AAC帧中报头和全局增益的数据110表示,QMDCT系数的数据112表示以及标度因子的数据114表示,以进行差错隐蔽。在步骤510,检查数据110,判断报头和全局_增益中是否存在差错。如果存在差错,则将AAC比特流路由到差错处理器,在步骤512,在该处校正报头/全局_增益。如果在报头/全局_增益数据中不存在任何错误,则在步骤520,检查数据112,以判断在QMDCT系数中是否存在差错。如果存在差错,则将AAC比特流路由到差错处理器,在步骤522,于该处校正QMDCT系数中的差错。之后,在步骤530处检查数据114,判断标度因子中是否存在差错。如果存在差错,则在步骤532处校正标度因子中的差错。在这些差错隐蔽步骤之后,在步骤540将隐蔽了差错的AAC比特流解码成PCM取样。
为了隐蔽当前AAC帧中数据110,112和114中的差错,优选将至少一个以前帧中的相应数据存储在缓冲器中。图12表示出能实现本发明的接收机。
由于AAC报头和全局_增益的数据表示是差错隐蔽中最关键的数据,必须加强该关键数据的保护。可通过下面所述多种方法实现保护。
1)在流传输开始之前,可事先传输关键数据。由此,分组丢失最可能发生在QMDCT数据和标度因子中。
2)通过选择性重发机制保护关键数据。因为在大多数AAC比特流中,关键数据占这些位的比例不足10%,基于网络的重发机制不会显著减小传输带宽。
3)在发送侧,将关键数据作为辅助数据嵌入在多个分组中。
利用这些方法中的任何一种,可将一个或多个帧的关键数据存储在接收机侧。如果在关键数据中出现分组丢失,基于其统计特性和数据结构,可由相邻帧得出至少部分关键数据。例如,可由帧n-1和n+1中的相应数据确定帧n的MDCT窗口_序列(window_sequence)。同样,可由相邻帧可靠地估计出窗口_形状(window_shape)。对于全局_增益,优选使用相邻帧n-1和n+1中其中较小的一个全局_增益值,以取代帧n中的丢失值。根据心理声学,该准则反映出这样的事实,即导致声音下降的填充声音片段在感觉上比急变(surge)的声音片段更舒服。在关键数据中用于差错隐蔽的关键数据缓冲器如图4所示。
在基于帧n-1和帧n+1中的关键数据得出受损帧n中的关键数据并保存了得出的关键数据后,存在至少两种方式来产生填充:
1、由相邻帧估计帧n所缺少的标度因子和QMDCT,后面将会对此进行描述。
2、通过将帧中的标度因子和QMDCT系数设置为零,在压缩域中减弱整个帧n,并隐蔽在MDCT域或PCM域(参见图2和12)中的差错。
如果分组丢失仅出现在AAC标度因子中(即,相同帧中的AAC报头和全局_增益是可用的),则可使用全局_增益和哈夫曼表对各个标度因子进行编码。此外,从每个数据部分中的部分_数据(section_data)和最大值可获得具有零的标度因子的部分。同样,有可能估计单个DPCM(差分脉码调制)标度因子以及甚至是AAC帧中的全部标度因子。用于估计丢失数据的基本方法是部分模式匹配方法。
标度因子中的差错可以以不同方式出现:1).在AAC帧中的所有标度因子全部丢失;2).AAC帧中的一部分标度因子丢失;以及3).在AAC帧中的单个标度因子丢失。当AAC帧中的所有标度因子丢失时,基于一个或多个相邻帧可计算出丢失的标度因子,如图5所示。图5显示出当对立体声音乐进行编码时由此一个帧具有两个通道的情形。将每个通道中的标度矢量视为矢量,可使用相邻失量的轮廓(contour)来判断帧间或通道间相关是否起主导作用。如果通道间相关强于帧间相关,则使用相邻通道标度因子矢量来代替丢失的标度因子矢量,反之亦然。应该注意,由于长窗口的标度_因子矢量纬度不同于短窗口的标度_因子矢量纬度,出于差错隐蔽的目的,必须存储对于长和短窗口的标度_因子矢量。图6和7显示出长开窗标度因子的示例,图8显示出音频比特流的两个AAC帧的短开窗标度因子示例。在图6,7和8中,使用第一标度_因子得出全局_增益。如果短窗口的标度因子丢失,则应使用所存储的短开窗标度因子来恢复它们。同样,如果长窗口的标度因子丢失,则应使用所存储的长开窗标度因子来恢复它们。
除作为全局_增益的第一标度因子外,还可计算出两个通道x,y之间的部分欧几里德距离dx,y,如下:
其中,N为通道中标度因子的数量,SCF为单个标度因子,w为感觉加权因子,c=Gx-Gy,且Gx,Gy为通道x和y的全局_增益。对于更复杂的实现方式,可使用搜索方法得出c,以获得在两个通道之间的最小距离。
例如,如果帧n的右通道的一部分或所有标度因子丢失,则计算出帧n-1的左与右通道之间的部分欧几里德距离d1和帧n-1的左通道与帧n的左通道之间的部分欧几里德距离d2,以便判断通道间相关或帧间是否用于差错隐蔽目的。如果d1>d2(或lag=2),则应使用帧间相关,应基于帧n-1的右通道中的标度因子来恢复帧n的右通道中丢失的标度因子。如果d1<d2(或lag=1),则应使用通道间相关,应基于帧n的左通道中的标度因子来恢复帧n的右通道中丢失的标度因子。在使用所存储的标度因子代替丢失的标度因子之前,为阻止任何错误的能量急变或避免产生错误的凸显(salient)频率成分,需进行某些调整。例如,应考虑到两个通道之间的全局_增益偏移c。
如果在AAC帧中的单个标度因子丢失且其位置已知,如果在一个或多个相邻帧中的标度因子未遭破坏的话,则有可能估计丢失的DPCM编码标度因子。在不失一般性的条件下,假设丢失了两个单个标度因子,如图9所示。在图9中,阴影区域表示丢失的标度因子x1,x2,它们各处在同一帧中未遭破坏的标度因子的矢量(空白区)之间。可将帧中的标度因子解码,直至出现第一丢失标度因子x1。尽管x1与x2之间的数据是正确的,由于DPCM编码特性,不能直接使用它们。不过,可使用搜索方法来估计丢失的标度因子x1,如图10所示。搜索从零开始(这是由于它是丢失标度因子x1的最有可能的值),在x2之前的标度因子处停止。在每个步骤中,计算出部分欧几里德距离,并使用所计算出值中的最小欧几里德距离来估计丢失的标度因子x1。在搜索中,如图10所示,在第六步中找出最小欧几里德距离,且丢失的标度因子x1为3。可按照同样的方式来判定丢失的标度因子x2。
在分组丢失中最可能出现的情形是QMDCT系数受损或丢失,而报头和标度因子可用。在此情形中,还可使用部分模式匹配的方法来恢复丢失的QMDCT系数。AAC帧的QMDCT系数的示例如图11a和11b所示。在传输音频流期间,连续计算出基于所接收帧的QMDCT系数的特征矢量(FV)。结合差错隐蔽方法所使用的特征是最大绝对值,平均绝对值和带宽(非零值的数量)。在AAC帧中的两个立体声通道的QMDCT系数分别如图11a和11b所示。如图所示,较大值通常集中在低频区。为恢复帧中丢失的QMDCT系数,基于其均值和方差将QMDCT系数划分到两个频率区。在低频区中,最好使用时域相关方法来恢复通常较大的值。例如,如果QDMCT系数丢失,可利用可能相关的QMDCT矢量中相应系数来代替它们。在此使用特征矢量来找出可能的相关。不过,在高频区中,最好使用不同的方法。
为恢复高频区中的QMDCT,假设有两种情形。如果帧的全部QMDCT系数丢失(最大1024),最好只使用缓冲的信息来恢复丢失的QMDCT系数。为判定应使用通道间相关或是帧间相关,计算出使用前一帧中FV的自相关的lag值(1或2)。基于lag值,可判定是否使用同样帧的不同通道还是不同帧的相同通道。利用自帧所计算出的lag值,还有可能判定是否使用前一帧来代替丢失的帧。为阻止填充QMDCT系数超出如所要使用的哈夫曼代码本所定义的最大值,应削减填充QMDCT系数。例如,可将全部填充QMDCT系数降低一常数,从而在填充帧中将不会出现能量的急变。
如果仅丢失高频区中QMDCT系数的独立簇(cluster)(例如2或4的簇),则隐蔽差错的最简单方法是以零代替所有丢失的QMDCT系数。
对于仅丢失低频区中QMDCT系数的独立簇的情形,可使用帧间相关来检查与相邻帧的部分欧几里德距离,通过降低因子来修改填充系数以阻止出现伪能量急变。
图12的方框图显示出在接收机侧的AAC解码器,根据本发明,该解码器能够实现压缩域中的差错隐蔽以及在MDCT域中的差错隐蔽。此外,它还能够在PCM域中隐蔽乐器声音中的差错,这在共同未决美国专利申请序列No.10/281,395中有所讨论。如图12所示,在接收机侧5,使用分组拆包模块20将分组数据200转换成AAC比特流210。代码本的信息202表示提供到乐器代码本缓冲器22进行存储。同时,将分组序列号的信息204表示提供给差错检查模块24以检查是否丢失分组。若丢失分组的话,则差错检查模决24通知丢失分组的坏帧指示28。坏帧指示28还表示应使用乐器代码本中的哪个元件用于差错隐蔽。基于坏帧指示28所提供的信息,压缩域差错隐蔽部件30向AAC解码器10提供受损或丢失音频帧的信息表示。与此同时,使用码冗余度检查(CRC)模块26来检测解码器10中的比特流。CRC模块26将比特流差错的信息表示提供给坏帧指示28。使用在操作上与压缩域差错隐蔽模块30相连的多个缓冲器32,34和36来存储报头与全局_增益的表示,标度因子和QMDCT系数。基于在AAC帧中丢失了什么样的数据部分,利用在缓冲器32,34和36中的数据得出或计算丢失的数据部分。有益的是,还提供缓冲器42,以存储MDCT系数,并且如果将坏帧的标度因子和QMDCT数据设置为零,则将MDCT域差错隐蔽模块40用于隐蔽差错。在压缩域或MDCT域中隐蔽了AAC比特流210中的差错后,AAC解码器10将AAC比特流解码成PCM取样240。基于如重放缓冲器50所提供的乐器声音的信息表示,PCM域差错隐蔽部件52使用乐器代码缓冲器22所提供的代码本元件206重构受损或丢失的乐器声音。经差错隐蔽的PCM取样250提供给重放装置。
应注意,如上所述的接收机5还包括差错隐蔽模块和缓冲器以重构在音频比特流中受损或丢失的乐器声音。在共同未决美国专利申请序列10/281,395中披露了关于乐器声音恢复的细节。然而,根据本发明,可在不使用乐器声音恢复机制的条件下实现对于压缩域分组丢失隐蔽的方法和装置。
可用于移动终端的差错隐蔽方法和装置如图13所示。图13的方块图表示根据本发明的一个示例性实施例的移动终端300。移动终端300包括终端所特有部件,如麦克风301,键盘307,显示器306,发送/接收开关308,天线309和控制部件305。此外,图13显示出移动终端所特有的发送器和接收机块304,311。发送器块304包括用于将讲话信号进行编码的编码器321。发送器块304还包括信道编码,译码和调制所需的操作,以及RF功能(为清楚起见,在图13中未示出)。接收机块311包括能够接收例如用于收听音乐目的的压缩数字音频数据的解码块320。从而,解码块320包括类似于AAC解码器10的解码器以及类似于如图12所示压缩域差错隐蔽模块30,MDCT域差错隐蔽模块40和缓冲器32,34,36,42的差错隐蔽模块/缓冲器322。来自麦克风301的信号,经放大阶段302处放大,并在A/D转换器303中数字化,提供给发送器块304,通常是提供给发送块所包括的讲话编码装置。所处理的发送信号经过发送块的调制和放大,经由发送/接收开关308提供给天线309。所要接收的信号自天线经由发送/接收开关308提供给接收器块311,由接收器块解调接收信号。解码块320能够将在解调的接收信号中的分组数据转换成包含有多个帧的AAC比特流。差错隐蔽模块基于在缓冲器中所存储的数据恢复在缺陷帧中的丢失数据。差错隐蔽的PCM取样被馈送到重放装置312。控制部件305控制移动终端300进行操作,读取用户通过键盘307所给出的控制命令,并通过显示器306向用户提供消息。
从而,尽管参照本发明的优选实施例描述了本发明,本领域技术人员应该理解,在不偏离本发明范围的条件下,可对本发明进行在形式和细节上的上述以及各种其他改变,省略和修改。
Claims (13)
1.一种对音频信号的比特流表示中的差错进行隐蔽的方法,其中,该比特流包括当前帧和至少一个相邻帧,每帧具有处于压缩域中的多个数据部分,所述方法的特征在于:
将压缩域中的所述多个数据部分存储在所述至少一个相邻帧中;
判断当前帧是否存在缺陷;
如果当前帧有缺陷,则检测当前帧中至少一个有缺陷的数据部分,以及
基于所述至少一个相邻帧中的其中至少一个所存储的数据部分,恢复当前帧中所述至少一个有缺陷的数据部分。
2.根据权利要求1的方法,特征在于,在当前帧中所述至少一个有缺陷的数据部分包括报头,所述恢复是基于与所述至少一个相邻帧中所述其中至少一个所存储的数据部分的报头相关联的统计特性。
3.根据权利要求1的方法,特征在于,在当前帧中所述至少一个有缺陷的数据部分包括窗口序列,所述至少其中一个所存储的数据部分包括在所述至少一个相邻帧中的窗口序列,以恢复在当前帧中的所述至少一个有缺陷的数据部分。
4.根据权利要求1的方法,特征在于,在当前帧中所述至少一个有缺陷的数据部分包括窗口形状,所述至少其中一个所存储的数据部分包括在所述至少一个相邻帧中的窗口形状,以恢复在当前帧中的所述至少一个有缺陷的数据部分。
5.根据权利要求1的方法,特征在于,在当前帧中所述至少一个有缺陷的数据部分包括全局增益值,所述至少其中一个所存储的数据部分包括在所述至少一个相邻帧中的全局增益值,以恢复在当前帧中的所述至少一个有缺陷的数据部分。
6.根据权利要求1的方法,特征在于,在当前帧中所述至少一个有缺陷的数据部分包括全局增益值,所述至少一个相邻帧包括具有第一全局增益值的第一帧和具有第二全局增益值的第二帧,且第二全局增益值小于第一全局增益值,并且,基于第二全局增益值来恢复当前帧中的所述至少一个有缺陷的数据部分。
7.根据权利要求1的方法,特征在于,在当前帧中所述至少一个有缺陷的数据部分包括一个或多个标度因子,所述至少其中一个所存储的数据部分包括在所述至少一个相邻帧中的一个或多个标度因子,以恢复在当前帧中的所述至少一个有缺陷的数据部分。
8.根据权利要求1的方法,特征在于,在当前帧中所述至少一个有缺陷的数据部分包括多个变换系数,所述至少其中一个所存储的数据部分包括在所述至少一个相邻帧中的多个变换系数,以恢复在当前帧中的所述至少一个有缺陷的数据部分。
9.根据权利要求8的方法,特征在于,变换系数包括QMDCT系数。
10.根据权利要求9的方法,特征在于,QMDCT系数包括在高频区中和低频区中的系数,其中,基于所述至少一个相邻帧中低频区中的相应系数,来恢复有缺陷数据部分的低频区中的系数。
11.一种用于解码音频信号的比特流表示以便提供在调制域中的音频数据的音频解码器,其中,该比特流包括当前帧和至少一个相邻帧,每帧具有多个数据部分,所述解码器包括第一模块,用于解码所述每个帧,以提供在压缩域中的多个数据部分的信号表示,所述解码器的特征在于:
第二模块,对信号作出响应,用于将压缩域中的所述多个数据部分存储在所述至少一个相邻帧中,以及
第三模块,若当前帧有缺陷,则用于检测压缩域中的至少一个有缺陷的数据部分,以基于所述至少一个相邻帧中的至少其中一个所存储的数据部分,恢复当前帧中所述至少一个有缺陷的数据部分。
12.一种用于接收音频流中的分组数据的音频接收机,所述接收机包括拆包模块,用于将接收的分组数据拆成音频信号的比特流表示,其中,该比特流包括当前帧和至少一个相邻帧,每帧具有多个数据部分,所述接收机的特征在于:
解码模块,用于将所述每个帧解码,以提供在压缩域中的多个数据部分的信号表示,
存储模块,对信号作出响应,用于将压缩域中的所述多个数据部分存储在所述至少一个相邻帧中,以及
差错隐蔽模块,若当前帧有缺陷,则用于检测当前帧中的至少一个数据部分,以基于所述至少一个相邻帧中的至少其中一个所存储的数据部分,恢复当前帧中的所述至少一个有缺陷的数据部分。
13.一种移动终端,包括:
天线,和
与天线相连的音频接收机,用于接收音频流中的分组数据,其中,该接收机包括拆包模块,用于将所接收的分组数据拆成音频信号的比特流表示,其中,该比特流包括当前帧和至少一个相邻帧,每帧具有多个数据部分,所述移动终端的特征在于,接收机还包括:
解码模块,用于解码所述每个帧,以提供在压缩域中的多个数据部分的信号表示,
存储模块,对信号作出响应,用于将压缩域中的所述多个数据部分存储在所述至少一个相邻帧中,以及
差错隐蔽模块,若当前帧有缺陷,则检测当前帧中的至少一个数据部分,以基于所述至少一个相邻帧中的至少其中一个所存储的数据部分,恢复当前帧中的所述至少一个有缺陷的数据部分。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/335,543 | 2002-12-31 | ||
US10/335,543 US6985856B2 (en) | 2002-12-31 | 2002-12-31 | Method and device for compressed-domain packet loss concealment |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1732512A true CN1732512A (zh) | 2006-02-08 |
CN100545908C CN100545908C (zh) | 2009-09-30 |
Family
ID=32655380
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2003801081006A Expired - Fee Related CN100545908C (zh) | 2002-12-31 | 2003-12-29 | 用于隐蔽压缩域分组丢失的方法和装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US6985856B2 (zh) |
EP (1) | EP1579425B1 (zh) |
KR (1) | KR100747716B1 (zh) |
CN (1) | CN100545908C (zh) |
AT (1) | ATE537535T1 (zh) |
AU (1) | AU2003298476A1 (zh) |
WO (1) | WO2004059894A2 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009121280A1 (zh) * | 2008-04-01 | 2009-10-08 | 华为技术有限公司 | 编码方法及装置、解码方法及装置 |
WO2009155803A1 (zh) * | 2008-06-27 | 2009-12-30 | 华为技术有限公司 | 一种丢包隐藏的方法和装置 |
CN102063906A (zh) * | 2010-09-19 | 2011-05-18 | 北京航空航天大学 | 一种aac音频实时解码容错控制方法 |
CN101308660B (zh) * | 2008-07-07 | 2011-07-20 | 浙江大学 | 一种音频压缩流的解码端错误恢复方法 |
CN101604523B (zh) * | 2009-04-22 | 2012-01-04 | 网经科技(苏州)有限公司 | 在g.711语音编码中隐藏冗余信息的方法 |
CN103280222A (zh) * | 2013-06-03 | 2013-09-04 | 腾讯科技(深圳)有限公司 | 音频编码、解码方法及其*** |
WO2015007114A1 (zh) * | 2013-07-16 | 2015-01-22 | 华为技术有限公司 | 解码方法和解码装置 |
CN113490981A (zh) * | 2019-02-13 | 2021-10-08 | 弗劳恩霍夫应用研究促进协会 | 音频发送器处理器、音频接收器处理器以及相关方法和计算机程序 |
Families Citing this family (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60029147T2 (de) * | 2000-12-29 | 2007-05-31 | Nokia Corp. | Qualitätsverbesserung eines audiosignals in einem digitalen netzwerk |
WO2002100037A1 (fr) * | 2001-06-04 | 2002-12-12 | Matsushita Electric Industrial Co., Ltd. | Appareil et procede destines a un systeme ipmp(gestion et protection de la propriete intellectuelle) souple et commun de fourniture et de protection de contenu |
JP4404091B2 (ja) * | 2004-04-02 | 2010-01-27 | Kddi株式会社 | 音楽を再生するためのコンテンツフレームを配信するコンテンツ配信サーバ及び端末 |
JP2005292702A (ja) * | 2004-04-05 | 2005-10-20 | Kddi Corp | オーディオフレームに対するフェードイン/フェードアウト処理装置及びプログラム |
EP1746580B1 (en) * | 2004-05-10 | 2010-03-24 | Nippon Telegraph and Telephone Corporation | Acoustic signal packet communication method, transmission method, reception method, and device and program thereof |
US8209168B2 (en) * | 2004-06-02 | 2012-06-26 | Panasonic Corporation | Stereo decoder that conceals a lost frame in one channel using data from another channel |
KR100608062B1 (ko) * | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
US8509703B2 (en) * | 2004-12-22 | 2013-08-13 | Broadcom Corporation | Wireless telephone with multiple microphones and multiple description transmission |
US20060133621A1 (en) * | 2004-12-22 | 2006-06-22 | Broadcom Corporation | Wireless telephone having multiple microphones |
US20070116300A1 (en) * | 2004-12-22 | 2007-05-24 | Broadcom Corporation | Channel decoding for wireless telephones with multiple microphones and multiple description transmission |
US7916796B2 (en) * | 2005-10-19 | 2011-03-29 | Freescale Semiconductor, Inc. | Region clustering based error concealment for video data |
US8620644B2 (en) * | 2005-10-26 | 2013-12-31 | Qualcomm Incorporated | Encoder-assisted frame loss concealment techniques for audio coding |
EP1946517B1 (en) * | 2005-10-31 | 2012-11-28 | SK Telecom Co., Ltd. | Audio data packet format and decoding method thereof and method for correcting mobile communication terminal codec setup error and mobile communication terminal performing same |
KR100706968B1 (ko) * | 2005-10-31 | 2007-04-12 | 에스케이 텔레콤주식회사 | 오디오 데이터 패킷 생성 장치 및 이의 복조 방법 |
EP1970899A4 (en) * | 2005-12-21 | 2009-05-06 | Nec Corp | CODE CONVERTING DEVICE, CODE CONVERTING METHOD USED THEREFOR, AND CORRESPONDING PROGRAM |
US8725729B2 (en) * | 2006-04-03 | 2014-05-13 | Steven G. Lisa | System, methods and applications for embedded internet searching and result display |
US8798172B2 (en) * | 2006-05-16 | 2014-08-05 | Samsung Electronics Co., Ltd. | Method and apparatus to conceal error in decoded audio signal |
JP2008047223A (ja) * | 2006-08-17 | 2008-02-28 | Oki Electric Ind Co Ltd | オーディオ再生回路 |
JP2008076847A (ja) * | 2006-09-22 | 2008-04-03 | Matsushita Electric Ind Co Ltd | 復号器及び信号処理システム |
KR101291193B1 (ko) | 2006-11-30 | 2013-07-31 | 삼성전자주식회사 | 프레임 오류은닉방법 |
CN100524462C (zh) * | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
US8428661B2 (en) * | 2007-10-30 | 2013-04-23 | Broadcom Corporation | Speech intelligibility in telephones with multiple microphones |
KR101073813B1 (ko) | 2008-01-30 | 2011-10-14 | 주식회사 코아로직 | 비트스트림 오류 보완방법, 비트스트림 오류 보완전처리기, 및 그 전처리기를 포함하는 디코딩 장치 |
CN102057424B (zh) * | 2008-06-13 | 2015-06-17 | 诺基亚公司 | 用于经编码的音频数据的错误隐藏的方法和装置 |
TWI392252B (zh) * | 2009-01-21 | 2013-04-01 | Mstar Semiconductor Inc | 可適性差分脈衝碼調變-解調變系統與方法 |
US8352252B2 (en) * | 2009-06-04 | 2013-01-08 | Qualcomm Incorporated | Systems and methods for preventing the loss of information within a speech frame |
US20110257964A1 (en) * | 2010-04-16 | 2011-10-20 | Rathonyi Bela | Minimizing Speech Delay in Communication Devices |
US8612242B2 (en) * | 2010-04-16 | 2013-12-17 | St-Ericsson Sa | Minimizing speech delay in communication devices |
CN101937679B (zh) * | 2010-07-05 | 2012-01-11 | 展讯通信(上海)有限公司 | 音频数据帧的错误掩盖方法及音频解码装置 |
CN101894558A (zh) * | 2010-08-04 | 2010-11-24 | 华为技术有限公司 | 丢帧恢复方法、设备以及语音增强方法、设备和*** |
US9177570B2 (en) | 2011-04-15 | 2015-11-03 | St-Ericsson Sa | Time scaling of audio frames to adapt audio processing to communications network timing |
US20130191120A1 (en) * | 2012-01-24 | 2013-07-25 | Broadcom Corporation | Constrained soft decision packet loss concealment |
CN103325373A (zh) * | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 用于传送和接收音频信号的方法和设备 |
KR101398189B1 (ko) * | 2012-03-27 | 2014-05-22 | 광주과학기술원 | 음성수신장치 및 음성수신방법 |
CN103714821A (zh) | 2012-09-28 | 2014-04-09 | 杜比实验室特许公司 | 基于位置的混合域数据包丢失隐藏 |
BR112015017222B1 (pt) | 2013-02-05 | 2021-04-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Método e decodificador configurado para ocultar um quadro de áudio perdido de um sinal de áudio recebido, receptor, e, meio legível por computador |
US9478221B2 (en) | 2013-02-05 | 2016-10-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Enhanced audio frame loss concealment |
RU2628144C2 (ru) | 2013-02-05 | 2017-08-15 | Телефонактиеболагет Л М Эрикссон (Пабл) | Способ и устройство для управления маскировкой потери аудиокадров |
KR101987894B1 (ko) * | 2013-02-12 | 2019-06-11 | 삼성전자주식회사 | 보코더 잡음 억제 방법 및 장치 |
BR112015031605B1 (pt) * | 2013-06-21 | 2022-03-29 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Decodificador de áudio tendo um módulo de extensão de largura de banda com um módulo de ajuste de energia |
CN104301064B (zh) * | 2013-07-16 | 2018-05-04 | 华为技术有限公司 | 处理丢失帧的方法和解码器 |
JP5744992B2 (ja) * | 2013-09-17 | 2015-07-08 | 株式会社Nttドコモ | 音声信号出力装置、音声信号出力方法および音声信号出力プログラム |
KR101940740B1 (ko) | 2013-10-31 | 2019-01-22 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법 |
ES2805744T3 (es) * | 2013-10-31 | 2021-02-15 | Fraunhofer Ges Forschung | Decodificador de audio y método para proporcionar una información de audio decodificada usando un ocultamiento de errores en base a una señal de excitación de dominio de tiempo |
CN104751849B (zh) | 2013-12-31 | 2017-04-19 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
CN107369454B (zh) * | 2014-03-21 | 2020-10-27 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
CN106683681B (zh) | 2014-06-25 | 2020-09-25 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
CN107004417B (zh) * | 2014-12-09 | 2021-05-07 | 杜比国际公司 | Mdct域错误掩盖 |
CN104978967B (zh) * | 2015-07-09 | 2018-11-13 | 武汉大学 | 用于降低空间参数误码率的三维音频编码方法及装置 |
US10803876B2 (en) * | 2018-12-21 | 2020-10-13 | Microsoft Technology Licensing, Llc | Combined forward and backward extrapolation of lost network data |
US10784988B2 (en) | 2018-12-21 | 2020-09-22 | Microsoft Technology Licensing, Llc | Conditional forward error correction for network data |
WO2020165263A2 (en) * | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and decoding method selecting an error concealment mode, and encoder and encoding method |
KR20220120214A (ko) * | 2021-02-23 | 2022-08-30 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4111131C2 (de) * | 1991-04-06 | 2001-08-23 | Inst Rundfunktechnik Gmbh | Verfahren zum Übertragen digitalisierter Tonsignale |
JP2746033B2 (ja) * | 1992-12-24 | 1998-04-28 | 日本電気株式会社 | 音声復号化装置 |
JPH08328599A (ja) * | 1995-06-01 | 1996-12-13 | Mitsubishi Electric Corp | Mpegオーディオ復号器 |
JP2927242B2 (ja) * | 1996-06-28 | 1999-07-28 | 日本電気株式会社 | 音声符号データの誤り処理装置及び誤り処理方法 |
FI963870A (fi) * | 1996-09-27 | 1998-03-28 | Nokia Oy Ab | Virheiden piilottaminen digitaalisessa audiovastaanottimessa |
US6490243B1 (en) * | 1997-06-19 | 2002-12-03 | Kabushiki Kaisha Toshiba | Information data multiplex transmission system, its multiplexer and demultiplexer and error correction encoder and decoder |
US6327689B1 (en) * | 1999-04-23 | 2001-12-04 | Cirrus Logic, Inc. | ECC scheme for wireless digital audio signal transmission |
WO2001041436A1 (en) * | 1999-12-03 | 2001-06-07 | Sony Corporation | Recording apparatus and method, and reproducing apparatus and method |
-
2002
- 2002-12-31 US US10/335,543 patent/US6985856B2/en not_active Expired - Lifetime
-
2003
- 2003-12-29 EP EP03796219A patent/EP1579425B1/en not_active Expired - Lifetime
- 2003-12-29 CN CNB2003801081006A patent/CN100545908C/zh not_active Expired - Fee Related
- 2003-12-29 AU AU2003298476A patent/AU2003298476A1/en not_active Abandoned
- 2003-12-29 AT AT03796219T patent/ATE537535T1/de active
- 2003-12-29 KR KR1020057012261A patent/KR100747716B1/ko not_active IP Right Cessation
- 2003-12-29 WO PCT/IB2003/006217 patent/WO2004059894A2/en not_active Application Discontinuation
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009121280A1 (zh) * | 2008-04-01 | 2009-10-08 | 华为技术有限公司 | 编码方法及装置、解码方法及装置 |
CN101552008B (zh) * | 2008-04-01 | 2011-11-16 | 华为技术有限公司 | 语音编码方法及装置、语音解码方法及装置 |
WO2009155803A1 (zh) * | 2008-06-27 | 2009-12-30 | 华为技术有限公司 | 一种丢包隐藏的方法和装置 |
CN101308660B (zh) * | 2008-07-07 | 2011-07-20 | 浙江大学 | 一种音频压缩流的解码端错误恢复方法 |
CN101604523B (zh) * | 2009-04-22 | 2012-01-04 | 网经科技(苏州)有限公司 | 在g.711语音编码中隐藏冗余信息的方法 |
CN102063906A (zh) * | 2010-09-19 | 2011-05-18 | 北京航空航天大学 | 一种aac音频实时解码容错控制方法 |
CN102063906B (zh) * | 2010-09-19 | 2012-05-23 | 北京航空航天大学 | 一种aac音频实时解码容错控制方法 |
CN103280222B (zh) * | 2013-06-03 | 2014-08-06 | 腾讯科技(深圳)有限公司 | 音频编码、解码方法及其*** |
CN103280222A (zh) * | 2013-06-03 | 2013-09-04 | 腾讯科技(深圳)有限公司 | 音频编码、解码方法及其*** |
WO2015007114A1 (zh) * | 2013-07-16 | 2015-01-22 | 华为技术有限公司 | 解码方法和解码装置 |
CN107818789A (zh) * | 2013-07-16 | 2018-03-20 | 华为技术有限公司 | 解码方法和解码装置 |
US10102862B2 (en) | 2013-07-16 | 2018-10-16 | Huawei Technologies Co., Ltd. | Decoding method and decoder for audio signal according to gain gradient |
US10741186B2 (en) | 2013-07-16 | 2020-08-11 | Huawei Technologies Co., Ltd. | Decoding method and decoder for audio signal according to gain gradient |
CN113490981A (zh) * | 2019-02-13 | 2021-10-08 | 弗劳恩霍夫应用研究促进协会 | 音频发送器处理器、音频接收器处理器以及相关方法和计算机程序 |
US11875806B2 (en) | 2019-02-13 | 2024-01-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-mode channel coding |
US12009002B2 (en) | 2019-02-13 | 2024-06-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transmitter processor, audio receiver processor and related methods and computer programs |
Also Published As
Publication number | Publication date |
---|---|
KR20050091034A (ko) | 2005-09-14 |
EP1579425B1 (en) | 2011-12-14 |
WO2004059894A3 (en) | 2005-05-06 |
ATE537535T1 (de) | 2011-12-15 |
CN100545908C (zh) | 2009-09-30 |
US20040128128A1 (en) | 2004-07-01 |
KR100747716B1 (ko) | 2007-08-08 |
AU2003298476A8 (en) | 2004-07-22 |
EP1579425A2 (en) | 2005-09-28 |
EP1579425A4 (en) | 2006-03-08 |
WO2004059894A2 (en) | 2004-07-15 |
AU2003298476A1 (en) | 2004-07-22 |
US6985856B2 (en) | 2006-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100545908C (zh) | 用于隐蔽压缩域分组丢失的方法和装置 | |
US7308402B2 (en) | Error resistant scalable audio coding partitioned for determining errors | |
US7069208B2 (en) | System and method for concealment of data loss in digital audio transmission | |
ES2836220T3 (es) | Sistema y procedimiento de recuperación de errores de transmisión de paquetes basada en redundancia | |
JP6386376B2 (ja) | マルチレート・スピーチ/オーディオ・コーデックのためのフレーム損失隠匿 | |
US7283966B2 (en) | Scalable audio communications utilizing rate-distortion based end-to-end bit allocation | |
US7447639B2 (en) | System and method for error concealment in digital audio transmission | |
US20100312552A1 (en) | Systems and methods for preventing the loss of information within a speech frame | |
KR101548846B1 (ko) | 워터마킹된 신호의 적응적 인코딩 및 디코딩을 위한 디바이스 | |
US6496794B1 (en) | Method and apparatus for seamless multi-rate speech coding | |
JP3922979B2 (ja) | 伝送路符号化方法、復号化方法、及び装置 | |
CN1739141A (zh) | 连续的备份音频 | |
US20170103761A1 (en) | Adaptive Forward Error Correction Redundant Payload Generation | |
CN101141644B (zh) | 编码集成***和方法与解码集成***和方法 | |
JP2000165349A (ja) | 送信機およびデジタル信号を受信機に送信するための方法 | |
CN1871864A (zh) | 重传语音编码数据的方法 | |
JP2004184975A (ja) | 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置 | |
KR100706968B1 (ko) | 오디오 데이터 패킷 생성 장치 및 이의 복조 방법 | |
JP3254126B2 (ja) | 可変レート符号化方式 | |
KR20080066537A (ko) | 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치 | |
Wang | A Beat-Pattern based Error Concealment Scheme for Music Delivery with Burst Packet Loss. | |
Ding | Wideband audio over narrowband low-resolution media | |
CN1672193A (zh) | 用于语音帧误差降低的语音通信单元和方法 | |
CN1366659A (zh) | 具有音调变化检测的纠错方法 | |
Miao et al. | An improved error resilience scheme for transmission of MPEG-4 audio over EGPRS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20160120 Address after: Espoo, Finland Patentee after: Technology Co., Ltd. of Nokia Address before: Espoo, Finland Patentee before: Nokia Oyj |
|
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090930 Termination date: 20161229 |
|
CF01 | Termination of patent right due to non-payment of annual fee |