CN104301064B - 处理丢失帧的方法和解码器 - Google Patents
处理丢失帧的方法和解码器 Download PDFInfo
- Publication number
- CN104301064B CN104301064B CN201310297740.1A CN201310297740A CN104301064B CN 104301064 B CN104301064 B CN 104301064B CN 201310297740 A CN201310297740 A CN 201310297740A CN 104301064 B CN104301064 B CN 104301064B
- Authority
- CN
- China
- Prior art keywords
- frame
- lost frames
- current lost
- frames
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 58
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 58
- 238000011084 recovery Methods 0.000 claims abstract description 56
- 230000007704 transition Effects 0.000 abstract description 19
- 238000012545 processing Methods 0.000 abstract description 18
- 230000005284 excitation Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 239000012792 core layer Substances 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 239000002131 composite material Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000005086 pumping Methods 0.000 description 4
- 230000007480 spreading Effects 0.000 description 4
- 238000003892 spreading Methods 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
- G10L2025/937—Signal energy in various frequency bands
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
Abstract
本发明实施例提供处理丢失帧的方法和解码器。该方法包括:确定当前丢失帧的合成高频带信号;确定当前丢失帧对应的恢复信息,其中恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中连续丢帧数为到当前丢失帧为止连续丢失的帧数;根据恢复信息,确定当前丢失帧的全局增益梯度;根据全局增益梯度和当前丢失帧的前M帧中每一帧的全局增益确定当前丢失帧的全局增益;根据当前丢失帧的全局增益和当前丢失帧的子帧增益,对当前丢失帧的合成高频带信号进行调整,以得到当前丢失帧的高频带信号。本发明实施例使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
Description
技术领域
本发明涉及通信领域,并且具体地,涉及处理丢失帧的方法和解码器。
背景技术
随着技术的不断进步,用户对话音质量的需求越来越高,其中提高话音的带宽是提高话音质量提高的主要方法。如果采用传统的编码方式来编码增加的带宽部分的信息则会大大提高码率,这种情况下,由于当前网络带宽的限制,将无法达到传送的目的。因此通常采用频带扩展技术来提升带宽。
编码端利用频带扩展技术对高频带信号编码后,将编码后的信号传输到解码端。解码端也利用频带扩展技术恢复高频带信号。在传输信号的过程中,由于网络拥塞或故障等原因,可能会导致丢帧。由于丢包率是一个影响信号质量的关键因素,因此为了在丢帧的情况下尽可能正确地恢复出丢失帧,提出了丢帧处理技术。在该技术中,解码端可以将根据前一帧的合成高频带信号作为丢失帧的合成高频带信号,然后利用当前丢失帧的子帧增益和全局增益对合成高频带信号进行调整,从而得到最终的高频带信号。然而,由于在该技术中当前丢失帧的子帧增益为固定值,当前丢失帧的全局增益是利用前一帧的全局增益乘以固定的梯度得到的,因此会导致重建的高频带信号在丢帧前后过渡不连续,重建的高频带信号出现严重的杂音。
发明内容
本发明实施例提供处理丢失帧的方法和解码器,能够提升高频带信号的质量。
第一方面,提供了一种处理丢失帧的方法,包括:确定当前丢失帧的合成高频带信号;确定所述当前丢失帧对应的恢复信息,其中所述恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中所述连续丢帧数为到所述当前丢失帧为止连续丢失的帧数;根据所述恢复信息,确定所述当前丢失帧的全局增益梯度;根据所述全局增益梯度和所述当前丢失帧的前M帧中每一帧的全局增益确定所述当前丢失帧的全局增益,其中M为正整数;根据所述当前丢失帧的全局增益和所述当前丢失帧的子帧增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
结合第一方面,在第一种可能的实现方式中,所述根据恢复信息,确定当前丢失帧的全局增益梯度,包括:在确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式相同且所述连续丢帧数小于或等于3的情况下,或者,在确定所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型相同且所述连续丢帧数小于或等于3的情况下,确定所述全局增益梯度为1。
结合第一方面,在第二种可能的实现方式中,所述根据恢复信息,确定当前丢失帧的全局增益梯度,包括:在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧或浊音帧,且所述连续丢帧数小于或等于3,则确定所述全局增益梯度,使得所述全局增益梯度小于或等于预设的第一阈值且大于0。
结合第一方面,在第三种可能的实现方式中,所述根据恢复信息,确定当前丢失帧的全局增益梯度,包括:在确定所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,或者,在确定所述丢帧前所接收到的最后一个帧为音频帧或静音帧的情况下,确定所述全局增益梯度,使得所述全局增益梯度大于预设的第一阈值。
结合第一方面,在第四种可能的实现方式中,所述根据恢复信息,确定当前丢失帧的全局增益梯度,包括:在确定所述丢帧前所接收到的最后一个帧为清音帧的开始帧的情况下,确定所述全局增益梯度,使得所述全局增益梯度小于或等于预设的第一阈值且大于0。
结合第一方面或第一方面的第一种可能的实现方式至第四种可能的实现方式中任一实现方式,在第五种可能的实现方式中,所述确定所述当前丢失帧的子帧增益,包括:根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度;根据所述子帧增益梯度和所述当前丢失帧的前N帧中每一帧的子帧增益,确定所述当前丢失帧的子帧增益,其中N为正整数。
结合第一方面的第五种可能的实现方式,在第六种可能的实现方式中,所述根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度,包括:在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧,且所述连续丢帧数小于或等于3,则确定所述子帧增益梯度,使得所述子帧增益梯度小于或等于预设的第二阈值且大于0。
结合第一方面的第五种可能的实现方式,在第七种可能的实现方式中,所述根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度,包括:在确定所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定所述子帧增益梯度,使得所述子帧增益梯度大于预设的第二阈值。
第二方面,提供了一种处理丢失帧的方法,包括:确定当前丢失帧的合成高频带信号;确定当前丢失帧对应的恢复信息,其中所述恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中所述连续丢帧数为到所述当前丢失帧为止连续丢失的帧数;根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度;根据所述子帧增益梯度和所述当前丢失帧的前N帧中每一帧的子帧增益,确定所述当前丢失帧的子帧增益,其中N为正整数;根据所述当前丢失帧的子帧增益和所述当前丢失帧的全局增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
结合第二方面,在第一种可能的实现方式中,所述根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度,包括:在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧,且所述连续丢帧数小于或等于3,则确定所述子帧增益梯度,使得所述子帧增益梯度小于或等于预设的第二阈值且大于0。
结合第二方面,在第二种可能的实现方式中,所述根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度,包括:在确定所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定所述子帧增益梯度,使得所述子帧增益梯度大于预设的第二阈值。
第三方面,提供了一种解码器,包括:第一确定单元,用于确定当前丢失帧的合成高频带信号;第二确定单元,用于确定当前丢失帧对应的恢复信息,其中所述恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中所述连续丢帧数为到所述当前丢失帧为止连续丢失的帧数;第三确定单元,用于根据所述恢复信息,确定所述当前丢失帧的全局增益梯度;第四确定单元,用于根据所述全局增益梯度和所述当前丢失帧的前M帧中每一帧的全局增益确定所述当前丢失帧的全局增益,其中M为正整数;调整单元,用于根据所述当前丢失帧的全局增益和所述当前丢失帧的子帧增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
结合第三方面,在第一种可能的实现方式中,所述第二确定单元,具体用于在确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式相同且所述连续丢帧数小于或等于3的情况下,或者,在确定所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型相同且所述连续丢帧数小于或等于3的情况下,确定所述全局增益梯度为1。
结合第三方面,在第二种可能的实现方式中,所述第二确定单元具体用于在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧或浊音帧,且所述连续丢帧数小于或等于3,则确定所述全局增益梯度,使得所述全局增益梯度小于或等于预设的第一阈值且大于0。
结合第三方面,在第三种可能的实现方式中,所述第二确定单元具体用于在确定所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,或者,在确定所述丢帧前所接收到的最后一个帧为音频帧或静音帧的情况下,确定所述全局增益梯度,使得所述全局增益梯度大于预设的第一阈值。
结合第三方面,在第四种可能的实现方式中,所述第二确定单元,具体用于在确定所述丢帧前所接收到的最后一个帧为清音帧的开始帧的情况下,确定所述全局增益梯度,使得所述全局增益梯度小于或等于预设的第一阈值且大于0。
结合第三方面或第三方面的第一种可能的实现方式至第四种可能的实现方式中任一实现方式,在第五种可能的实现方式中,还包括:第五确定单元,用于:根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度;根据所述子帧增益梯度和所述当前丢失帧的前N帧中每一帧的子帧增益,确定所述当前丢失帧的子帧增益,其中N为正整数。
结合第三方面的第五种可能的实现方式,在第六种可能的实现方式中,所述第五确定单元具体用于在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧,且所述连续丢帧数小于或等于3,则确定所述子帧增益梯度,使得所述子帧增益梯度小于或等于预设的第二阈值且大于0。
结合第三方面的第五种可能的实现方式,在第七种可能的实现方式中,所述第五确定单元具体用于在确定所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定所述子帧增益梯度,使得所述子帧增益梯度大于预设的第二阈值。
第四方面,提供了一种解码器,包括:第一确定单元,用于确定当前丢失帧的合成高频带信号;第二确定单元,用于确定所述当前丢失帧对应的恢复信息,其中所述恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中所述连续丢帧数为到所述当前丢失帧为止连续丢失的帧数;第三确定单元,用于根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度;第四确定单元,用于根据所述子帧增益梯度和所述当前丢失帧的前N帧中每一帧的子帧增益,确定所述当前丢失帧的子帧增益,其中N为正整数;调整单元,用于根据所述当前丢失帧的子帧增益和所述当前丢失帧的全局增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
结合第四方面,在第一种可能的实现方式中,所述第二确定单元具体用于在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧,且所述连续丢帧数小于或等于3,则确定所述子帧增益梯度,使得所述子帧增益梯度小于或等于预设的第二阈值且大于0。
结合第四方面,在第二种可能的实现方式中,所述第二确定单元具体用于在确定所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定所述子帧增益梯度,使得所述子帧增益梯度大于预设的第二阈值。
本发明实施例中,通过根据恢复信息确定当前丢失帧的全局增益梯度,根据全局增益梯度和当前丢失帧的前M帧中每一帧的全局增益确定当前丢失帧的全局增益,根据当前丢失帧的全局增益和当前丢失帧的子帧增益对当前丢失帧的合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明一个实施例的处理丢失帧的方法的示意性流程图。
图2是根据本发明另一实施例的处理丢失帧的方法的示意性流程图。
图3是根据本发明一个实施例的处理丢失帧的方法的过程的示意性流程图。
图4是根据本发明一个实施例的解码器的示意框图。
图5是根据本发明另一实施例的解码器的示意框图。
图6是根据本发明一个实施例的解码器的示意框图。
图7是根据本发明另一实施例的解码器的示意框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
编码技术和解码技术,广泛应用于各种电子设备中,例如:移动电话,无线装置,个人数据助理(Personal Data Assistant,PDA),手持式或便携式计算机,全球定位***(Global Positioning System,GPS)接收机/导航器,照相机,音频/视频播放器,摄像机,录像机,监控设备等。
为了提升话音的带宽,常采用频带扩展技术。具体地,编码端可以通过核心层编码器编码低频带信息,对高频带信号进行线性预测编码(Linear Predictive Coding,LPC)分析来得到高频带LPC系数。然后根据由核心层编码器得到的基因周期、代数码书和各自增益等参数,得到高频带激励信号。将高频带激励信号经过由LPC参数得到的LPC合成滤波器处理后,得到合成高频带信号。通过比较原始高频带信号与合成高频带信号,得到子帧增益和全局增益。将上述LPC系数转化为LSF参数,并将LSF参数、子帧增益和全局增益进行量化并编码。最后将编码得到的码流发送给解码端。
解码端接收到编码的码流后,首先可以解析码流信息确定是否有帧丢失。如果没有发生丢帧情况,则可以正常解码。如果发生丢帧情况,解码端可以对丢失帧进行处理。下面将结合本发明实施例详细描述解码端处理丢失帧的方法。
图1是根据本发明一个实施例的处理丢失帧的方法的示意性流程图。图1的方法由解码端执行。
110,确定当前丢失帧的合成高频带信号。
例如,解码端可以根据当前丢失帧的前一帧的参数,确定当前丢失帧的合成高频带激励信号。具体地,解码端可以将当前丢失帧的前一帧的LPC参数作为当前帧的LPC参数,并可以利用前一帧的核心层解码器得到的基音周期、代数码书和各自增益等参数得到高频带激励信号。解码端可以将该高频带激励信号作为当前丢失帧的高频带激励信号,然后将高频带激励信号经过由LPC参数生成的LPC合成滤波器处理后,得到当前丢失帧的合成高频带信号。
120,确定当前丢失帧对应的恢复信息,其中恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中连续丢帧数为到所述当前丢失帧为止连续丢失的帧数。
当前丢失帧可以是指解码端当前需要处理的丢失帧。
丢帧前编码模式可以是指本次丢帧事件发生前的编码模式。通常,为了达到更好的编码性能,编码端在对信号编码前可以对信号分类,从而选择合适的编码模式。目前,编码模式可以包括:静音帧编码模式(INACTIVE mode),清音帧编码模式(UNVOICED mode),浊音帧编码模式(VOICED mode),普通帧编码模式(GENERIC mode),瞬态帧编码模式(TRANSITION mode),音频帧编码模式(AUDIO mode)。
丢帧前所接收到的最后一个帧的类型可以是指本次丢帧事件发生前解码端接收到的最近的一个帧的类型。例如,假设编码端向解码端发送了4帧,其中解码端正确地接收了第1帧和第2帧,而第3帧和第4帧丢失,那么丢帧前所接收到的最后一个帧可以指第2帧。通常,帧的类型可以包括:(1)清音、静音、噪声或浊音结尾等几种特性之一的帧(UNVOICED_CLAS frame);(2)清音到浊音过渡,浊音开始但还比较微弱的帧(UNVOICED_TRANSITIONframe);(3)浊音之后的过渡,浊音特性已经很弱的帧(VOICED_TRANSITION frame);(4)浊音特性的帧,其之前的帧为浊音或者浊音开始帧(VOICED_CLAS frame);(5)明显浊音的开始帧(ONSET frame);(6)谐波和噪声混合的开始帧(SIN_ONSET frame);(7)非活动特性帧(INACTIVE_CLAS frame)。
连续丢帧数可以是指本次丢帧事件中到当前丢失帧为止连续丢失的帧数。实质上,连续丢帧数可以指示当前丢失帧是连续丢失的帧中的第几帧。例如,编码端向解码端发送了5帧,解码端正确接收了第1帧和第2帧,第3帧至第5帧均丢失。如果当前丢失帧为第4帧,那么连续丢帧数就是2;如果当前丢失帧为第5帧,那么连续丢帧数为3。
130,根据恢复信息,确定当前丢失帧的全局增益梯度。
140,根据全局增益梯度和当前丢失帧的前M帧中每一帧的全局增益确定当前丢失帧的全局增益,其中M为正整数。
例如,解码端可以对前M帧的全局增益进行加权,然后根据加权后的全局增益和全局增益梯度确定当前丢失帧的全局增益。
具体地,当前丢失帧的全局增益FramGain可以用等式(1)表示:
FramGain=f(α,FramGain(-m)) (1)
其中,FramGain(-m)可以表示前M帧中第m帧的全局增益,α可以表示当前丢失帧的全局增益梯度。
例如,解码端可以按照下述等式(2)确定当前丢失帧的全局增益FramGain:
其中,wm可以表示前M帧中第m帧对应的加权值,FramGain(-m)可以表示第m帧的全局增益,α可以表示当前丢失帧的全局增益梯度。
应理解,上述等式(2)的举例仅是为了帮助本领域技术人员更好地理解本发明实施例,而非要限制本发明实施例的范围。本领域技术人员可以基于等式(1)进行各种等价的修改或变化,从而可以确定等式(1)的多种具体表现形式,这些修改或变化也落入本发明实施例的范围内。
通常,为了简化步骤130的过程,解码端可以根据当前丢失帧的前一帧的全局增益和全局增益梯度,确定当前丢失帧的全局增益。
150,根据当前丢失帧的全局增益和当前丢失帧的子帧增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
例如,解码端可以将当前丢失帧的子帧增益设置为固定值。或者,解码端也可以根据下面将要描述的方式确定当前丢失帧的子帧增益。然后解码端可以使用当前丢失帧的全局增益和当前丢失帧的子帧增益,对当前丢失帧的合成高频带信号进行调整,从而得到最终的高频带信号。
现有技术中,当前丢失帧的全局增益梯度为固定值,解码端根据前一帧的全局增益和固定的全局增益梯度得到当前丢失帧的全局增益。根据这种方法得到的当前丢失帧的全局增益对合成高频带信号进行调整,会导致在丢帧情况下最终的高频带信号前后过渡不连续,产生严重的杂音。而本发明实施例中,解码端可以根据恢复信息确定全局增益梯度,而非简单地设置为固定值,由于恢复信息描述了丢帧事件的相关特性,因此根据恢复信息确定的全局增益梯度更为精确,使得当前丢失帧的全局增益也更为精确。因此解码端根据该全局增益对合成高频信号进行调整,使得重建的高频带信号过渡自然平稳,能够削弱重建的高频带信号中的杂音,提升重建的高频带信号的质量。
本发明实施例中,通过根据恢复信息确定当前丢失帧的全局增益梯度,根据全局增益梯度和当前丢失帧的前M帧中每一帧的全局增益确定当前丢失帧的全局增益,根据当前丢失帧的全局增益和当前丢失帧的子帧增益对当前丢失帧的合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
可选地,在步骤120中,上述全局增益梯度α可以用等式(3)表示:
α=1.0-delta*scale (3)
其中,delta可以代表α的调整梯度,其取值范围可以在0.5到1之间。
scale可以代表α微调的幅度,其决定了当前条件下当前丢失帧跟随之前帧的能力的程度。其取值范围可以在0到1之间,其取值越小可以表示当前丢失帧跟随之前帧的能量越接近,反之可以表示当前丢失帧相比之前帧的能量有较大的削弱。
可选地,作为一个实施例,在步骤120中,解码端可以在确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式相同且连续丢帧数小于或等于3的情况下,或者,在确定当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型相同且连续丢帧数小于或等于3的情况下,确定全局增益梯度为1。
具体地,解码端在确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式相同且连续丢帧数小于或等于3的情况下,或者,在确定当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型相同且连续丢帧数小于或等于3的情况下,当前丢失帧的全局增益可以跟随之前的帧的全局增益,因此可以确定α为1。例如,对于等式(3),delta可以取值为0.6,scale可以取值为0。
可选地,作为另一实施例,在步骤120中,解码端可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧或浊音帧,且连续丢帧数小于或等于3,则确定全局增益梯度,使得全局增益梯度小于或等于预设的第一阈值且大于0。
具体地,在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果可以确定丢帧前所接收到的最后一个帧为清音帧或浊音帧,且连续丢帧数小于或等于3,解码端可以确定α为较小的值,即α可以小于预设的第一阈值。例如,第一阈值可以为0.5。例如,对于等式(3),delta可以取值为0.65,scale可以取值为0.8。
在上述实施例中,解码端可以根据丢帧前所接收到的最后一个帧的类型和/或连续丢帧数,确定丢帧前所接收到的最后一个帧的编码模式是否与当前丢失帧的编码模式相同,或者确定所接收到的最后一个帧的类型是否与当前丢失帧的类型相同。比如,如果连续丢帧数小于或等于3的话,解码端可以确定所接收到的最后一帧的编码模式与当前丢失帧的编码模式相同。如果连续丢帧数大于3,那么解码端不能够确定所接收到的最后一帧的编码模式与当前丢失帧的编码模式相同。再比如,如果所接收到的最后一个帧为浊音帧的开始帧或清音帧的开始帧,并且连续丢帧数小于或等于3,那么解码端可以确定当前丢失帧的类型与所接收到的最后一个帧的类型相同。如果连续丢帧数大于3,那么解码端就不能确定丢帧前所接收到的最后一个帧的编码模式是否与当前丢失帧的编码模式相同,或者所接收到的最后一个帧的类型是否与当前丢失帧的类型相同。
可选地,作为另一实施例,解码端可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,或者,在确定丢帧前所接收到的最后一个帧为音频帧或静音帧的情况下,确定全局增益梯度,使得全局增益梯度大于预设的第一阈值。
具体地,如果解码端确定丢帧前所接收到的最后一个帧为浊音帧的开始帧,则可以确定当前丢失帧很可能为浊音帧,那么可以确定α为较大的值,即α可以大于预设的第一阈值。例如,对于等式(3),delta可以取值为0.5,scale可以取值为0.4。
如果解码端确定丢帧前所接收到的最后一个帧为音频帧或静音帧,则也可以确定α为较大的值,即α可以大于预设的第一阈值。例如,对于等式(3),delta可以取值为0.5,scale可以取值为0.4。
可选地,作为另一实施例,解码端可以在确定丢帧前所接收到的最后一个帧为清音帧的开始帧的情况下,确定全局增益梯度,使得全局增益梯度小于或等于预设的第一阈值且大于0。
如果丢帧前所接收到的最后一个帧为清音帧的开始帧,那么当前丢失帧很可能为清音帧,那么解码端可以确定α为较小的值,即α可以小于预设的第一阈值。例如,对于等式(3),delta可以取值为0.8,scale可以取值为0.65。
此外,对于除了上述恢复信息所指示的情况外,在其它情况下,解码端可以确定α为较小的值,即α可以小于预设的第一阈值。例如,对于等式(3),delta可以取值为0.8,scale可以取值为0.75。
可选地,作为另一实施例,上述第一阈值的取值范围可以如下:0<第一阈值<1。
可选地,作为另一实施例,解码端可以根据恢复信息,确定当前丢失帧的子帧增益梯度,并可以根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益,确定当前丢失帧的子帧增益,其中N为正整数。
解码端可以根据上述恢复信息确定当前丢失帧的全局增益梯度外,解码端也可以根据上述恢复信息,确定当前丢失帧的子帧增益梯度。例如,解码端可以对前N帧的子帧增益进行加权,然后根据加权后的子帧增益和子帧增益梯度确定当前丢失帧的子帧增益。
具体地,当前丢失帧的子帧增益SubGain可以用等式(4)表示:
SubGain=f(β,SubGain(-n)) (4)
其中,SubGain(-n)可以表示前N帧中第n帧的子帧增益,β可以表示当前丢失帧的子帧增益梯度。
例如,解码端可以按照等式(5)确定当前丢失帧的子帧增益SubGain:
可以表示第n帧的子帧增益,β可以表示当前丢失帧的子帧增益梯度。通常,β的取值范围可以在1到2之间。
应理解,上述等式(5)的举例仅是为了帮助本领域技术人员更好地理解本发明实施例,而非要限制本发明实施例的范围。本领域技术人员可以基于等式(4)进行各种等价的修改或变化,从而可以确定等式(4)的多种具体表现形式,这些修改或变化也落入本发明实施例的范围内。
为了简化过程,解码端也可以根据当前丢失帧的前一帧的子帧增益和子帧增益梯度,确定当前丢失帧的子帧增益。
可见,本实施例中,并非简单地设置当前丢失帧的子帧增益为固定值,而是根据恢复信息确定子帧增益梯度后再确定当前丢失帧的子帧增益,因此,根据当前丢失帧的子帧增益以及上述当前丢失帧的全局增益对合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
可选地,作为另一实施例,解码端可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧,且连续丢帧数小于或等于3,则确定子帧增益梯度,使得子帧增益梯度小于或等于预设的第二阈值且大于0。
例如,第二阈值可以是1.5。β可以为1.25。
可选地,作为另一实施例,解码端可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定子帧增益梯度,使得子帧增益梯度大于预设的第二阈值。
如果丢帧前所接收到的最后一个帧为浊音帧的开始帧,则当前丢失帧很可能为浊音帧,那么解码端可以确定β为较大的值,例如,β可以为2.0。
此外,对于β而言,除了上述恢复信息所指示的两种情况外,在其它情况下,β可以为1。
可选地,作为另一实施例,上述第二阈值的取值范围如下:1<第二阈值<2。
图2是根据本发明另一实施例的处理丢失帧的方法的示意性流程图。图2的方法由解码端执行。
210,确定当前丢失帧的合成高频带信号。
解码端可以按照现有技术,确定当前丢失帧的合成高频带信号。例如,解码端可以根据当前丢失帧的前一帧的参数,确定当前丢失帧的合成高频带激励信号。具体地,解码端可以将当前丢失帧的前一帧的LPC参数作为当前帧的LPC参数,并可以利用前一帧的核心层解码器得到的基音周期、代数码书和各自增益等参数得到高频带激励信号。解码端可以将该高频带激励信号作为当前丢失帧的高频带激励信号,然后将高频带激励信号经过由LPC参数生成的LPC合成滤波器处理后,得到当前丢失帧的合成高频带信号。
220,确定当前丢失帧对应的恢复信息,其中恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中连续丢帧数为到当前丢失帧为止连续丢失的帧数。
恢复信息的详细描述可以参照图1的实施例中的描述,此处不再赘述。
230,根据恢复信息,确定当前丢失帧的子帧增益梯度。
240,根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益,确定当前丢失帧的子帧增益,其中N为正整数。
例如,解码端可以对前N帧的子帧增益进行加权,然后根据加权后的子帧增益和子帧增益梯度确定当前丢失帧的子帧增益。
具体地,当前丢失帧的子帧增益SubGain可以用等式(4)表示。
例如,解码端可以按照等式(5)确定当前丢失帧的子帧增益SubGain。
应理解,上述等式(5)的举例仅是为了帮助本领域技术人员更好地理解本发明实施例,而非要限制本发明实施例的范围。本领域技术人员可以基于等式(4)进行各种等价的修改或变化,从而可以确定多种等式(4)的具体表现形式,这些修改或变化也落入本发明实施例的范围内。
为了简化过程,解码端也可以根据当前丢失帧的前一帧的子帧增益和子帧增益梯度,确定当前丢失帧的子帧增益。
250,根据当前丢失帧的子帧增益和当前丢失帧的全局增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
例如,解码端可以按照现有技术,设置固定的全局增益梯度,然后根据该固定的全局增益梯度和前一帧的全局增益,确定当前丢失帧的全局增益。
在现有技术中,解码端将当前丢失帧的子帧增益设置为固定值,根据固定值以及当前丢失帧的全局增益对当前丢失帧的合成高频带信号进行调整,导致最终的高频带信号在丢帧情况下前后过渡不连续,产生严重的杂音。而本发明实施例中,解码端可以根据恢复信息确定子帧增益梯度,然后根据子帧增益梯度确定当前丢失帧的子帧增益,而非简单地将当前丢失帧的子帧增益设置为固定值,由于恢复信息描述了丢帧事件的相关特性,因此使得当前丢失帧的子帧增益更为精确。因此解码端根据该子帧增益对合成高频信号进行调整,使得重建的高频带信号过渡自然平稳,能够削弱重建的高频带信号中的杂音,提升重建的高频带信号的质量。
本实施例中,通过根据恢复信息确定当前丢失帧的子帧增益梯度,根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益确定当前丢失帧的子帧增益,根据当前丢失帧的子帧增益和当前丢失帧的全局增益对当前丢失帧的合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
可选地,作为另一实施例,解码端可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧,且连续丢帧数小于或等于3,则确定子帧增益梯度,使得子帧增益梯度小于或等于预设的第二阈值且大于0。
例如,第二阈值可以是1.5。β可以为1.25。
可选地,作为一个实施例,解码端可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定子帧增益梯度,使得子帧增益梯度大于预设的第二阈值。
如果丢帧前所接收到的最后一个帧为浊音帧的开始帧,则当前丢失帧很可能为浊音帧,那么解码端可以确定β为较大的值,例如,β可以为2.0。
此外,对于β而言,除了上述恢复信息所指示的两种情况外,在其它情况下,β可以为1。
可选地,作为另一实施例,上述第二阈值的取值范围可以如下:1<第二阈值<2。
从上述可以看出,解码端可以按照本发明实施例确定当前丢失帧的全局增益,按照现有技术按照当前丢帧帧的子帧增益,或者,解码端可以按照本发明实施例确定当前丢失帧的子帧增益,按照现有技术按照当前丢帧帧的全局增益,或者,解码端可以按照本发明实施例确定当前丢失帧的子帧增益和当前丢帧帧的全局增益,上述方法均使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
图3是根据本发明一个实施例的处理丢失帧的方法的过程的示意性流程图。
301,解析所接收的码流中的丢帧标志。
该过程可以按照现有技术执行。
302,根据丢帧标志,确定当前帧是否丢失。
如果丢帧标志指示当前帧没有丢失,转到步骤303。
在丢帧标志指示当前帧丢失,则转到步骤304至306。
303,如果丢帧标志指示当前帧没有丢失,则对码流进行解码处理,恢复当前帧。
如果丢帧标志指示当前帧丢失,则可以同时执行步骤304至306。或者,按一定顺序执行步骤304至306。本发明实施例对此不做限定。
304,确定当前丢失帧的合成高频带信号。
例如,解码端可以根据当前丢失帧的前一帧的参数,确定当前丢失帧的合成高频带激励信号。具体地,解码端可以将当前丢失帧的前一帧的LPC参数作为当前帧的LPC参数,并可以利用前一帧的核心层解码器得到的基音周期、代数码书和各自增益等参数得到高频带激励信号。解码端可以将该高频带激励信号作为当前丢失帧的高频带激励信号,然后将高频带激励信号经过由LPC参数生成的LPC合成滤波器处理后,得到当前丢失帧的合成高频带信号。
305,确定当前丢失帧的全局增益。
可选地,解码端可以根据当前丢失帧的恢复信息,确定当前丢失帧的全局增益梯度。其中,恢复信息可以包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数。然后根据当前丢失帧的全局增益梯度和前M帧的每一帧的全局增益,确定当前丢失帧的全局增益。
例如,在
可选地,解码端还可以根据现有技术确定当前丢失帧的全局增益。例如,可以将前一帧的全局增益乘以固定的全局增益梯度,得到当前丢失帧的全局增益。
306,确定当前丢失帧的子帧增益。
可选地,解码端可以也根据当前丢失帧的恢复信息,确定当前丢失帧的子帧增益梯度。然后根据当前丢失帧的全局增益梯度和前N帧的每一帧的子帧增益,确定当前丢失帧的子帧增益。
可选地,解码端可以按照现有技术确定当前丢失帧的子帧增益,例如将当前丢失帧的子帧增益设为固定值。
应理解,为了提升当前丢失帧对应的重建高频带信号的质量,如果步骤305中采用现有技术确定当前丢失帧的全局增益,那么步骤306中,就需要按照图2的实施例的方法确定当前丢帧的子帧增益。如果步骤305中采用本图1的实施例的方法确定当前丢失帧的全局增益,那么步骤306中,可以采用图2的实施例的方法确定当前丢失帧的子帧增益,也可以采用现有技术确定当前丢失帧的子帧增益。
307,根据步骤305确定的当前丢失帧的全局增益和步骤306确定的当前丢失帧的子帧增益,对步骤304得到的合成高频带信号进行调整,得到当前丢失帧的高频带信号。
本发明实施例中,通过根据恢复信息确定当前丢失帧的全局增益梯度,或者根据恢复信息确定当前丢失帧的子帧增益梯度,从而得到当前丢失帧的全局增益和当前丢失帧的子帧增益,并根据当前丢失帧的全局增益和当前丢失帧的子帧增益对当前丢失帧的合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。图4是根据本发明一个实施例的解码器的示意框图。图4的设备400的一个例子是解码器。设备400包括第一确定单元410、第二确定单元420、第三确定单元430、第四确定单元440和调整单元450。
第一确定单元410确定当前丢失帧的合成高频带信号。第二确定单元420确定当前丢失帧对应的恢复信息,其中恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中连续丢帧数为到当前丢失帧为止连续丢失的帧数。第三确定单元430根据恢复信息,确定当前丢失帧的全局增益梯度。第四确定单元440根据全局增益梯度和当前丢失帧的前M帧中每一帧的全局增益确定当前丢失帧的全局增益,其中M为正整数。确定当前丢失帧的子帧增益。调整单元450根据当前丢失帧的全局增益和当前丢失帧的子帧增益,对当前丢失帧的合成高频带信号进行调整,以得到当前丢失帧的高频带信号。
本发明实施例中,通过根据恢复信息确定当前丢失帧的全局增益梯度,根据全局增益梯度和当前丢失帧的前M帧中每一帧的全局增益确定当前丢失帧的全局增益,根据当前丢失帧的全局增益和当前丢失帧的子帧增益对当前丢失帧的合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
可选地,作为一个实施例,第三确定单元430可以在确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式相同且连续丢帧数小于或等于3的情况下,或者,在确定当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型相同且连续丢帧数小于或等于3的情况下,确定全局增益梯度为1。
可选地,作为另一实施例,第三确定单元430可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧或浊音帧,且连续丢帧数小于或等于3,则确定全局增益梯度,使得全局增益梯度小于或等于预设的第一阈值且大于0。
可选地,作为另一实施例,第三确定单元430可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,或者,在确定丢帧前所接收到的最后一个帧为音频帧或静音帧的情况下,确定全局增益梯度,使得全局增益梯度大于预设的第一阈值。
可选地,作为另一实施例,第三确定单元430可以在确定丢帧前所接收到的最后一个帧为清音帧的开始帧的情况下,确定全局增益梯度,使得全局增益梯度小于或等于预设的第一阈值且大于0。
可选地,作为另一实施例,还包括第五确定单元450。第五确定单元450可以根据恢复信息,确定当前丢失帧的子帧增益梯度。第五确定单元450可以根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益,确定当前丢失帧的子帧增益,其中N为正整数。
可选地,作为另一实施例,第五确定单元450可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧,且连续丢帧数小于或等于3,则确定子帧增益梯度,使得子帧增益梯度小于或等于预设的第二阈值。
可选地,作为另一实施例,第五确定单元450可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定子帧增益梯度,使得子帧增益梯度大于预设的第二阈值。
设备400的其它功能和操作可以参照上面图1和图3的方法实施例的过程,为了避免重复,此处不再赘述。
图5是根据本发明另一实施例的解码器的示意框图。图5的设备500的一个例子是解码器。图5的设备500包括第一确定单元510、第二确定单元520、第三确定单元530、第四确定单元540和调整单元550。
第一确定单元510确定当前丢失帧的合成高频带信号。第二确定单元520确定当前丢失帧对应的恢复信息,其中恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中连续丢帧数为到当前丢失帧为止连续丢失的帧数。第三确定单元530根据恢复信息,确定当前丢失帧的子帧增益梯度。第四确定单元540根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益,确定当前丢失帧的子帧增益,其中N为正整数。调整单元550根据当前丢失帧的子帧增益和当前丢失帧的全局增益,对当前丢失帧的合成高频带信号进行调整,以得到当前丢失帧的高频带信号。
本实施例中,通过根据恢复信息确定当前丢失帧的子帧增益梯度,根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益确定当前丢失帧的子帧增益,根据当前丢失帧的子帧增益和当前丢失帧的全局增益对当前丢失帧的合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
可选地,作为一个实施例,第三确定单元530可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧,且连续丢帧数小于或等于3,则确定子帧增益梯度,使得子帧增益梯度小于或等于预设的第二阈值。
可选地,作为另一实施例,第三确定单元530可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定子帧增益梯度,使得子帧增益梯度大于预设的第二阈值。
设备500的其它功能和操作可以参照上面图2和图3的方法实施例的过程,为了避免重复,此处不再赘述。
图6是根据本发明一个实施例的解码器的示意框图。图6的设备600的一个例子是解码器。设备600包括存储器610和处理器620。
存储器610可以包括随机存储器、闪存、只读存储器、可编程只读存储器、非易失性存储器或寄存器等。处理器620可以是中央处理器(Central Processing Unit,CPU)。
存储器610用于存储可执行指令。处理器620可以执行存储器610中存储的可执行指令,用于:确定当前丢失帧的合成高频带信号;确定当前丢失帧对应的恢复信息,其中恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中连续丢帧数为到当前丢失帧为止连续丢失的帧数;根据恢复信息,确定当前丢失帧的全局增益梯度;根据全局增益梯度和当前丢失帧的前M帧中每一帧的全局增益确定当前丢失帧的全局增益,其中M为正整数;根据当前丢失帧的全局增益和当前丢失帧的子帧增益,对当前丢失帧的合成高频带信号进行调整,以得到当前丢失帧的高频带信号。
本发明实施例中,通过根据恢复信息确定当前丢失帧的全局增益梯度,根据全局增益梯度和当前丢失帧的前M帧中每一帧的全局增益确定当前丢失帧的全局增益,根据当前丢失帧的全局增益和当前丢失帧的子帧增益对当前丢失帧的合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
可选地,作为一个实施例,处理器620可以在确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式相同且连续丢帧数小于或等于3的情况下,或者,在确定当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型相同且连续丢帧数小于或等于3的情况下,确定全局增益梯度为1。
可选地,作为另一实施例,处理器620可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧或浊音帧,且连续丢帧数小于或等于3,则确定全局增益梯度,使得全局增益梯度小于或等于预设的第一阈值且大于0。
可选地,作为另一实施例,处理器620可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,或者,在确定丢帧前所接收到的最后一个帧为音频帧或静音帧的情况下,确定全局增益梯度,使得全局增益梯度大于预设的第一阈值。
可选地,作为另一实施例,处理器620可以在确定丢帧前所接收到的最后一个帧为清音帧的开始帧的情况下,确定全局增益梯度,使得全局增益梯度小于或等于预设的第一阈值且大于0。
可选地,作为另一实施例,处理器620可以根据恢复信息,确定当前丢失帧的子帧增益梯度,并可以根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益,确定当前丢失帧的子帧增益,其中N为正整数。
可选地,作为另一实施例,处理器620可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧,且连续丢帧数小于或等于3,则确定子帧增益梯度,使得子帧增益梯度小于或等于预设的第二阈值且大于0。
可选地,作为另一实施例,处理器620可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定子帧增益梯度,使得子帧增益梯度大于预设的第二阈值。
设备600的其它功能和操作可以参照上面图1和图3的方法实施例的过程,为了避免重复,此处不再赘述。
图7是根据本发明另一实施例的解码器的示意框图。图7的设备700的一个例子是解码器。图7的设备700包括存储器710和处理器720。
存储器710可以包括随机存储器、闪存、只读存储器、可编程只读存储器、非易失性存储器或寄存器等。处理器720可以是中央处理器(Central Processing Unit,CPU)。
存储器710用于存储可执行指令。处理器720可以执行存储器710中存储的可执行指令,用于:确定当前丢失帧的合成高频带信号;确定当前丢失帧对应的恢复信息,其中恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中连续丢帧数为到当前丢失帧为止连续丢失的帧数;根据恢复信息,确定当前丢失帧的子帧增益梯度;根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益,确定当前丢失帧的子帧增益,其中N为正整数;根据当前丢失帧的子帧增益和当前丢失帧的全局增益,对当前丢失帧的合成高频带信号进行调整,以得到当前丢失帧的高频带信号。
本实施例中,通过根据恢复信息确定当前丢失帧的子帧增益梯度,根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益确定当前丢失帧的子帧增益,根据当前丢失帧的子帧增益和当前丢失帧的全局增益对当前丢失帧的合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
可选地,作为一个实施例,处理器720可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧,且连续丢帧数小于或等于3,则确定子帧增益梯度,使得子帧增益梯度小于或等于预设的第二阈值且大于0。
可选地,作为另一实施例,处理器720可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定子帧增益梯度,使得子帧增益梯度大于预设的第二阈值。
设备700的其它功能和操作可以参照上面图2和图3的方法实施例的过程,为了避免重复,此处不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (14)
1.一种处理丢失帧的方法,其特征在于,包括:
确定当前丢失帧的合成高频带信号;
确定所述当前丢失帧对应的恢复信息,其中所述恢复信息包括连续丢帧数和以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,其中所述连续丢帧数为到所述当前丢失帧为止连续丢失的帧数;
根据所述恢复信息,确定所述当前丢失帧的全局增益梯度;
根据所述全局增益梯度和所述当前丢失帧的前M帧中每一帧的全局增益确定所述当前丢失帧的全局增益,其中M为正整数;
根据所述当前丢失帧的全局增益和所述当前丢失帧的子帧增益,对所述当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
2.根据权利要求1所述的方法,其特征在于,所述根据恢复信息,确定当前丢失帧的全局增益梯度,包括:
在确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式相同且所述连续丢帧数小于或等于3的情况下,或者,在确定所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型相同且所述连续丢帧数小于或等于3的情况下,确定所述全局增益梯度为1。
3.根据权利要求1所述的方法,其特征在于,所述根据恢复信息,确定当前丢失帧的全局增益梯度,包括:
在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧或浊音帧,且所述连续丢帧数小于或等于3,则确定所述全局增益梯度,使得所述全局增益梯度小于或等于预设的第一阈值且大于0。
4.根据权利要求1至3中任一项所述的方法,其特征在于,还包括:
根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度;根据所述子帧增益梯度和所述当前丢失帧的前N帧中每一帧的子帧增益,确定所述当前丢失帧的子帧增益,其中N为正整数。
5.根据权利要求4所述的方法,其特征在于,所述根据所述恢复信息, 确定所述当前丢失帧的子帧增益梯度,包括:
在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧,且所述连续丢帧数小于或等于3,则确定所述子帧增益梯度,使得所述子帧增益梯度小于或等于预设的第二阈值且大于0。
6.一种处理丢失帧的方法,其特征在于,包括:
确定当前丢失帧的合成高频带信号;
确定所述当前丢失帧对应的恢复信息,其中所述恢复信息包括连续丢帧数和以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,其中所述连续丢帧数为到所述当前丢失帧为止连续丢失的帧数;
根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度;
根据所述子帧增益梯度和所述当前丢失帧的前N帧中每一帧的子帧增益,确定所述当前丢失帧的子帧增益,其中N为正整数;
确定所述当前丢失帧的全局增益;
根据所述当前丢失帧的子帧增益和所述当前丢失帧的全局增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
7.根据权利要求6所述的方法,其特征在于,所述根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度,包括:
在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧,且所述连续丢帧数小于或等于3,则确定所述子帧增益梯度,使得所述子帧增益梯度小于或等于预设的第二阈值且大于0。
8.一种解码器,其特征在于,包括:
第一确定单元,用于确定当前丢失帧的合成高频带信号;
第二确定单元,用于确定当前丢失帧对应的恢复信息,其中所述恢复信息包括连续丢帧数和以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,其中所述连续丢帧数为到所述当前丢失帧为止连续丢失的帧数;
第三确定单元,用于根据所述恢复信息,确定所述当前丢失帧的全局增 益梯度;
第四确定单元,用于根据所述全局增益梯度和所述当前丢失帧的前M帧中每一帧的全局增益确定所述当前丢失帧的全局增益,其中M为正整数;
调整单元,用于根据所述当前丢失帧的全局增益和所述当前丢失帧的子帧增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
9.根据权利要求8所述的解码器,其特征在于,所述第二确定单元,具体用于在确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式相同且所述连续丢帧数小于或等于3的情况下,或者,在确定所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型相同且所述连续丢帧数小于或等于3的情况下,确定所述全局增益梯度为1。
10.根据权利要求8所述的解码器,其特征在于,所述第二确定单元具体用于在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧或浊音帧,且所述连续丢帧数小于或等于3,则确定所述全局增益梯度,使得所述全局增益梯度小于或等于预设的第一阈值且大于0。
11.根据权利要求8至10中任一项所述的解码器,其特征在于,还包括:
第五确定单元,用于:根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度;根据所述子帧增益梯度和所述当前丢失帧的前N帧中每一帧的子帧增益,确定所述当前丢失帧的子帧增益,其中N为正整数。
12.根据权利要求11所述的解码器,其特征在于,所述第五确定单元具体用于在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧,且所述连续丢帧数小于或等于3,则确定所述子帧增益梯度,使得所述子帧增益梯度小于或等于预设的第二阈值且大于0。
13.一种解码器,其特征在于,包括:
第一确定单元,用于确定当前丢失帧的合成高频带信号;
第二确定单元,用于确定所述当前丢失帧对应的恢复信息,其中所述恢复信息包括连续丢帧数和以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,其中所述连续丢帧数为到所述当前丢失帧为止连续丢失的帧数;
第三确定单元,用于根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度;
第四确定单元,用于根据所述子帧增益梯度和所述当前丢失帧的前N帧中每一帧的子帧增益,确定所述当前丢失帧的子帧增益,其中N为正整数;
调整单元,用于根据所述当前丢失帧的子帧增益和所述当前丢失帧的全局增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
14.根据权利要求13所述的解码器,其特征在于,所述第二确定单元具体用于在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧,且所述连续丢帧数小于或等于3,则确定所述子帧增益梯度,使得所述子帧增益梯度小于或等于预设的第二阈值且大于0。
Priority Applications (12)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310297740.1A CN104301064B (zh) | 2013-07-16 | 2013-07-16 | 处理丢失帧的方法和解码器 |
CN201810203241.4A CN108364657B (zh) | 2013-07-16 | 2013-07-16 | 处理丢失帧的方法和解码器 |
JP2016526411A JP6264673B2 (ja) | 2013-07-16 | 2014-01-07 | ロストフレームを処理するための方法および復号器 |
PCT/CN2014/070199 WO2015007076A1 (zh) | 2013-07-16 | 2014-01-07 | 处理丢失帧的方法和解码器 |
EP14825749.6A EP2988445B1 (en) | 2013-07-16 | 2014-01-07 | Method for processing dropped frames and decoder |
ES14825749T ES2738885T3 (es) | 2013-07-16 | 2014-01-07 | Método para el procesamiento de tramas perdidas y decodificador |
DE202014011512.5U DE202014011512U1 (de) | 2013-07-16 | 2014-01-07 | Decodierer zum Verarbeiten eines verlorenen Rahmens |
EP19163032.6A EP3595211B1 (en) | 2013-07-16 | 2014-01-07 | Method for processing lost frame, and decoder |
EP24158654.4A EP4350694A3 (en) | 2013-07-16 | 2014-01-07 | Method for processing lost frame, and decoder |
KR1020157033976A KR101807683B1 (ko) | 2013-07-16 | 2014-01-07 | 손실 프레임을 처리하는 방법, 및 디코더 |
US14/981,956 US10068578B2 (en) | 2013-07-16 | 2015-12-29 | Recovering high frequency band signal of a lost frame in media bitstream according to gain gradient |
US16/043,880 US10614817B2 (en) | 2013-07-16 | 2018-07-24 | Recovering high frequency band signal of a lost frame in media bitstream according to gain gradient |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310297740.1A CN104301064B (zh) | 2013-07-16 | 2013-07-16 | 处理丢失帧的方法和解码器 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810203241.4A Division CN108364657B (zh) | 2013-07-16 | 2013-07-16 | 处理丢失帧的方法和解码器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104301064A CN104301064A (zh) | 2015-01-21 |
CN104301064B true CN104301064B (zh) | 2018-05-04 |
Family
ID=52320649
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310297740.1A Active CN104301064B (zh) | 2013-07-16 | 2013-07-16 | 处理丢失帧的方法和解码器 |
CN201810203241.4A Active CN108364657B (zh) | 2013-07-16 | 2013-07-16 | 处理丢失帧的方法和解码器 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810203241.4A Active CN108364657B (zh) | 2013-07-16 | 2013-07-16 | 处理丢失帧的方法和解码器 |
Country Status (8)
Country | Link |
---|---|
US (2) | US10068578B2 (zh) |
EP (3) | EP2988445B1 (zh) |
JP (1) | JP6264673B2 (zh) |
KR (1) | KR101807683B1 (zh) |
CN (2) | CN104301064B (zh) |
DE (1) | DE202014011512U1 (zh) |
ES (1) | ES2738885T3 (zh) |
WO (1) | WO2015007076A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104301064B (zh) * | 2013-07-16 | 2018-05-04 | 华为技术有限公司 | 处理丢失帧的方法和解码器 |
US10998922B2 (en) * | 2017-07-28 | 2021-05-04 | Mitsubishi Electric Research Laboratories, Inc. | Turbo product polar coding with hard decision cleaning |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1983909B (zh) * | 2006-06-08 | 2010-07-28 | 华为技术有限公司 | 一种丢帧隐藏装置和方法 |
Family Cites Families (96)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5450449A (en) | 1994-03-14 | 1995-09-12 | At&T Ipm Corp. | Linear prediction coefficient generation during frame erasure or packet loss |
US5699485A (en) | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
JP3616432B2 (ja) | 1995-07-27 | 2005-02-02 | 日本電気株式会社 | 音声符号化装置 |
JP3308783B2 (ja) * | 1995-11-10 | 2002-07-29 | 日本電気株式会社 | 音声復号化装置 |
US5819217A (en) | 1995-12-21 | 1998-10-06 | Nynex Science & Technology, Inc. | Method and system for differentiating between speech and noise |
FR2765715B1 (fr) | 1997-07-04 | 1999-09-17 | Sextant Avionique | Procede de recherche d'un modele de bruit dans des signaux sonores bruites |
FR2774827B1 (fr) | 1998-02-06 | 2000-04-14 | France Telecom | Procede de decodage d'un flux binaire representatif d'un signal audio |
US6260010B1 (en) | 1998-08-24 | 2001-07-10 | Conexant Systems, Inc. | Speech encoder using gain normalization that combines open and closed loop gains |
US6493664B1 (en) | 1999-04-05 | 2002-12-10 | Hughes Electronics Corporation | Spectral magnitude modeling and quantization in a frequency domain interpolative speech codec system |
JP2000305599A (ja) | 1999-04-22 | 2000-11-02 | Sony Corp | 音声合成装置及び方法、電話装置並びにプログラム提供媒体 |
US6604070B1 (en) | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
US6636829B1 (en) | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
US6574593B1 (en) | 1999-09-22 | 2003-06-03 | Conexant Systems, Inc. | Codebook tables for encoding and decoding |
EP1356454B1 (en) | 2001-01-19 | 2006-03-01 | Koninklijke Philips Electronics N.V. | Wideband signal transmission system |
SE521693C3 (sv) | 2001-03-30 | 2004-02-04 | Ericsson Telefon Ab L M | En metod och anordning för brusundertryckning |
JP2004521394A (ja) | 2001-06-28 | 2004-07-15 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 広帯域信号伝送システム |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
US7457757B1 (en) | 2002-05-30 | 2008-11-25 | Plantronics, Inc. | Intelligibility control for speech communications systems |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
WO2003107591A1 (en) | 2002-06-14 | 2003-12-24 | Nokia Corporation | Enhanced error concealment for spatial audio |
US7069212B2 (en) | 2002-09-19 | 2006-06-27 | Matsushita Elecric Industrial Co., Ltd. | Audio decoding apparatus and method for band expansion with aliasing adjustment |
US20040064308A1 (en) | 2002-09-30 | 2004-04-01 | Intel Corporation | Method and apparatus for speech packet loss recovery |
US7330812B2 (en) | 2002-10-04 | 2008-02-12 | National Research Council Of Canada | Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel |
KR100501930B1 (ko) | 2002-11-29 | 2005-07-18 | 삼성전자주식회사 | 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 |
US6985856B2 (en) * | 2002-12-31 | 2006-01-10 | Nokia Corporation | Method and device for compressed-domain packet loss concealment |
WO2004090870A1 (ja) | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
US20050004793A1 (en) | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
WO2006009074A1 (ja) | 2004-07-20 | 2006-01-26 | Matsushita Electric Industrial Co., Ltd. | 音声復号化装置および補償フレーム生成方法 |
KR20070084002A (ko) | 2004-11-05 | 2007-08-24 | 마츠시타 덴끼 산교 가부시키가이샤 | 스케일러블 복호화 장치 및 스케일러블 부호화 장치 |
US8160868B2 (en) | 2005-03-14 | 2012-04-17 | Panasonic Corporation | Scalable decoder and scalable decoding method |
TWI317933B (en) | 2005-04-22 | 2009-12-01 | Qualcomm Inc | Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same |
US20060262851A1 (en) | 2005-05-19 | 2006-11-23 | Celtro Ltd. | Method and system for efficient transmission of communication traffic |
EP1727131A2 (en) | 2005-05-26 | 2006-11-29 | Yamaha Hatsudoki Kabushiki Kaisha | Noise cancellation helmet, motor vehicle system including the noise cancellation helmet and method of canceling noise in helmet |
US7831421B2 (en) | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
JP5100380B2 (ja) * | 2005-06-29 | 2012-12-19 | パナソニック株式会社 | スケーラブル復号装置および消失データ補間方法 |
CA2558595C (en) | 2005-09-02 | 2015-05-26 | Nortel Networks Limited | Method and apparatus for extending the bandwidth of a speech signal |
US8255207B2 (en) * | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
CN100571314C (zh) | 2006-04-18 | 2009-12-16 | 华为技术有限公司 | 对丢失的语音业务数据帧进行补偿的方法 |
US8532984B2 (en) | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
CN101496099B (zh) | 2006-07-31 | 2012-07-18 | 高通股份有限公司 | 用于对有效帧进行宽带编码和解码的***、方法和设备 |
US8015000B2 (en) | 2006-08-03 | 2011-09-06 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
US8374857B2 (en) * | 2006-08-08 | 2013-02-12 | Stmicroelectronics Asia Pacific Pte, Ltd. | Estimating rate controlling parameters in perceptual audio encoders |
CN101366080B (zh) * | 2006-08-15 | 2011-10-19 | 美国博通公司 | 一种更新解码器的状态的方法和*** |
WO2008022181A2 (en) * | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Updating of decoder states after packet loss concealment |
JP5224666B2 (ja) | 2006-09-08 | 2013-07-03 | 株式会社東芝 | オーディオ符号化装置 |
JP4827675B2 (ja) | 2006-09-25 | 2011-11-30 | 三洋電機株式会社 | 低周波帯域音声復元装置、音声信号処理装置および録音機器 |
CN101155140A (zh) | 2006-10-01 | 2008-04-02 | 华为技术有限公司 | 音频流错误隐藏的方法、装置和*** |
MY152845A (en) | 2006-10-24 | 2014-11-28 | Voiceage Corp | Method and device for coding transition frames in speech signals |
CN103383846B (zh) * | 2006-12-26 | 2016-08-10 | 华为技术有限公司 | 改进语音丢包修补质量的语音编码方法 |
US8010351B2 (en) | 2006-12-26 | 2011-08-30 | Yang Gao | Speech coding system to improve packet loss concealment |
US20080208575A1 (en) | 2007-02-27 | 2008-08-28 | Nokia Corporation | Split-band encoding and decoding of an audio signal |
CN101321033B (zh) * | 2007-06-10 | 2011-08-10 | 华为技术有限公司 | 帧补偿方法及*** |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
CN101325537B (zh) | 2007-06-15 | 2012-04-04 | 华为技术有限公司 | 一种丢帧隐藏的方法和设备 |
CA2690433C (en) | 2007-06-22 | 2016-01-19 | Voiceage Corporation | Method and device for sound activity detection and sound signal classification |
US8185388B2 (en) | 2007-07-30 | 2012-05-22 | Huawei Technologies Co., Ltd. | Apparatus for improving packet loss, frame erasure, or jitter concealment |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
CN101335003B (zh) | 2007-09-28 | 2010-07-07 | 华为技术有限公司 | 噪声生成装置、及方法 |
CN101207665B (zh) * | 2007-11-05 | 2010-12-08 | 华为技术有限公司 | 一种衰减因子的获取方法 |
KR101235830B1 (ko) | 2007-12-06 | 2013-02-21 | 한국전자통신연구원 | 음성코덱의 품질향상장치 및 그 방법 |
US8180064B1 (en) | 2007-12-21 | 2012-05-15 | Audience, Inc. | System and method for providing voice equalization |
KR100998396B1 (ko) * | 2008-03-20 | 2010-12-03 | 광주과학기술원 | 프레임 손실 은닉 방법, 프레임 손실 은닉 장치 및 음성송수신 장치 |
FR2929466A1 (fr) | 2008-03-28 | 2009-10-02 | France Telecom | Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique |
CN101588341B (zh) * | 2008-05-22 | 2012-07-04 | 华为技术有限公司 | 一种丢帧隐藏的方法及装置 |
KR101400484B1 (ko) | 2008-07-11 | 2014-05-28 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 시간 워프 활성 신호의 제공 및 이를 이용한 오디오 신호의 인코딩 |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
US8718804B2 (en) | 2009-05-05 | 2014-05-06 | Huawei Technologies Co., Ltd. | System and method for correcting for lost data in a digital audio signal |
US8660851B2 (en) | 2009-05-26 | 2014-02-25 | Panasonic Corporation | Stereo signal decoding device and stereo signal decoding method |
US8428938B2 (en) | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
GB0919673D0 (en) | 2009-11-10 | 2009-12-23 | Skype Ltd | Gain control for an audio signal |
US9998081B2 (en) | 2010-05-12 | 2018-06-12 | Nokia Technologies Oy | Method and apparatus for processing an audio signal based on an estimated loudness |
US8990094B2 (en) * | 2010-09-13 | 2015-03-24 | Qualcomm Incorporated | Coding and decoding a transient frame |
US8744091B2 (en) | 2010-11-12 | 2014-06-03 | Apple Inc. | Intelligibility control using ambient noise detection |
CN104934036B (zh) | 2010-11-22 | 2018-11-02 | 株式会社Ntt都科摩 | 音频编码装置、方法以及音频解码装置、方法 |
CN102014286B (zh) * | 2010-12-21 | 2012-10-31 | 广东威创视讯科技股份有限公司 | 一种视频编解码方法及装置 |
AR085218A1 (es) | 2011-02-14 | 2013-09-18 | Fraunhofer Ges Forschung | Aparato y metodo para ocultamiento de error en voz unificada con bajo retardo y codificacion de audio |
HUE052882T2 (hu) | 2011-02-15 | 2021-06-28 | Voiceage Evs Llc | Készülék és módszer egy celp kódoló-dekódoló adaptív és állandó mértékû gerjesztésének az erõsítéshez való hozzájárulásának számszerûsítésére |
EP3244405B1 (en) | 2011-03-04 | 2019-06-19 | Telefonaktiebolaget LM Ericsson (publ) | Audio decoder with post-quantization gain correction |
CN102915737B (zh) * | 2011-07-31 | 2018-01-19 | 中兴通讯股份有限公司 | 一种浊音起始帧后丢帧的补偿方法和装置 |
US9330672B2 (en) | 2011-10-24 | 2016-05-03 | Zte Corporation | Frame loss compensation method and apparatus for voice frame signal |
WO2013096875A2 (en) | 2011-12-21 | 2013-06-27 | Huawei Technologies Co., Ltd. | Adaptively encoding pitch lag for voiced speech |
CN103295578B (zh) | 2012-03-01 | 2016-05-18 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
CN103325373A (zh) | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 用于传送和接收音频信号的方法和设备 |
CN102833037B (zh) | 2012-07-18 | 2015-04-29 | 华为技术有限公司 | 一种语音数据丢包的补偿方法及装置 |
KR20150056770A (ko) | 2012-09-13 | 2015-05-27 | 엘지전자 주식회사 | 손실 프레임 복원 방법 및 오디오 복호화 방법과 이를 이용하는 장치 |
US9280975B2 (en) | 2012-09-24 | 2016-03-08 | Samsung Electronics Co., Ltd. | Frame error concealment method and apparatus, and audio decoding method and apparatus |
US9123328B2 (en) | 2012-09-26 | 2015-09-01 | Google Technology Holdings LLC | Apparatus and method for audio frame loss recovery |
CN103854649B (zh) | 2012-11-29 | 2018-08-28 | 中兴通讯股份有限公司 | 一种变换域的丢帧补偿方法及装置 |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
US9711156B2 (en) | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
US9208775B2 (en) | 2013-02-21 | 2015-12-08 | Qualcomm Incorporated | Systems and methods for determining pitch pulse period signal boundaries |
CN104301064B (zh) * | 2013-07-16 | 2018-05-04 | 华为技术有限公司 | 处理丢失帧的方法和解码器 |
US20150170655A1 (en) | 2013-12-15 | 2015-06-18 | Qualcomm Incorporated | Systems and methods of blind bandwidth extension |
JP6318621B2 (ja) | 2014-01-06 | 2018-05-09 | 株式会社デンソー | 音声処理装置、音声処理システム、音声処理方法、音声処理プログラム |
US9697843B2 (en) | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
-
2013
- 2013-07-16 CN CN201310297740.1A patent/CN104301064B/zh active Active
- 2013-07-16 CN CN201810203241.4A patent/CN108364657B/zh active Active
-
2014
- 2014-01-07 EP EP14825749.6A patent/EP2988445B1/en active Active
- 2014-01-07 EP EP24158654.4A patent/EP4350694A3/en active Pending
- 2014-01-07 WO PCT/CN2014/070199 patent/WO2015007076A1/zh active Application Filing
- 2014-01-07 EP EP19163032.6A patent/EP3595211B1/en active Active
- 2014-01-07 JP JP2016526411A patent/JP6264673B2/ja active Active
- 2014-01-07 DE DE202014011512.5U patent/DE202014011512U1/de not_active Expired - Lifetime
- 2014-01-07 KR KR1020157033976A patent/KR101807683B1/ko active IP Right Grant
- 2014-01-07 ES ES14825749T patent/ES2738885T3/es active Active
-
2015
- 2015-12-29 US US14/981,956 patent/US10068578B2/en active Active
-
2018
- 2018-07-24 US US16/043,880 patent/US10614817B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1983909B (zh) * | 2006-06-08 | 2010-07-28 | 华为技术有限公司 | 一种丢帧隐藏装置和方法 |
Non-Patent Citations (2)
Title |
---|
Enhanced Variable Rate Codec,Speech Service Options 3,68,70,73 and 77 for Wideband Spread Spectrum Digital Systems;3GPP2 STANDARD;《3RD GENERATION PARTNERSHIP PROJECT 2》;20120103;第5.13节 * |
France Telecom G729EV Candidate:High level description and complexity evaluation;INTERNATIONAL TELECOMMUNICATION UNION;《ITU-T DRAFT》;20060503;第1-12页 * |
Also Published As
Publication number | Publication date |
---|---|
EP2988445A4 (en) | 2016-05-11 |
DE202014011512U1 (de) | 2021-09-06 |
US10614817B2 (en) | 2020-04-07 |
EP2988445B1 (en) | 2019-06-05 |
CN108364657B (zh) | 2020-10-30 |
CN108364657A (zh) | 2018-08-03 |
EP3595211B1 (en) | 2024-02-21 |
CN104301064A (zh) | 2015-01-21 |
EP2988445A1 (en) | 2016-02-24 |
KR101807683B1 (ko) | 2017-12-11 |
US20180330738A1 (en) | 2018-11-15 |
KR20160005069A (ko) | 2016-01-13 |
ES2738885T3 (es) | 2020-01-27 |
EP4350694A3 (en) | 2024-06-12 |
US10068578B2 (en) | 2018-09-04 |
US20160118054A1 (en) | 2016-04-28 |
JP6264673B2 (ja) | 2018-01-24 |
WO2015007076A1 (zh) | 2015-01-22 |
JP2016529542A (ja) | 2016-09-23 |
EP4350694A2 (en) | 2024-04-10 |
EP3595211A1 (en) | 2020-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101180676B (zh) | 用于谱包络表示的向量量化的方法和设备 | |
CN103928029B (zh) | 音频信号编码和解码方法、音频信号编码和解码装置 | |
JP5275231B2 (ja) | アクティブフレームの広帯域符号化のための方法、および機器 | |
US9251800B2 (en) | Generation of a high band extension of a bandwidth extended audio signal | |
CN102985969B (zh) | 编码装置、解码装置和编码方法、解码方法 | |
US9524720B2 (en) | Systems and methods of blind bandwidth extension | |
US11594236B2 (en) | Audio encoding/decoding based on an efficient representation of auto-regressive coefficients | |
US10460741B2 (en) | Audio coding method and apparatus | |
US9082398B2 (en) | System and method for post excitation enhancement for low bit rate speech coding | |
JP2000357999A (ja) | 復号装置及び方法、並びにプログラム提供媒体 | |
CN103187065A (zh) | 音频数据的处理方法、装置和*** | |
US20200227061A1 (en) | Signal codec device and method in communication system | |
CN104299614B (zh) | 解码方法和解码装置 | |
CN104978970A (zh) | 一种噪声信号的处理和生成方法、编解码器和编解码*** | |
JP2017151466A (ja) | 符号化方法、復号化方法、符号化装置及び復号化装置 | |
EP2254111B1 (en) | Background noise generating method and noise processing device | |
WO2013096875A2 (en) | Adaptively encoding pitch lag for voiced speech | |
CN104301064B (zh) | 处理丢失帧的方法和解码器 | |
CN103456307B (zh) | 音频解码器中帧差错隐藏的谱代替方法及*** | |
CN106683681B (zh) | 处理丢失帧的方法和装置 | |
CN101304261A (zh) | 一种频带扩展的方法及装置 | |
US7584096B2 (en) | Method and apparatus for encoding speech | |
CN1873777B (zh) | 具有语音解码功能的移动通信终端及其动作方法 | |
CN101266798B (zh) | 一种在语音解码器中进行增益平滑的方法及装置 | |
TWI353752B (en) | Systems, methods, and apparatus for wideband encod |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200721 Address after: Houston, USA Patentee after: Chaoqing codec Co., Ltd Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd. |