CN1221169A - 编码方法和装置以及解码方法和装置 - Google Patents

编码方法和装置以及解码方法和装置 Download PDF

Info

Publication number
CN1221169A
CN1221169A CN98113100A CN98113100A CN1221169A CN 1221169 A CN1221169 A CN 1221169A CN 98113100 A CN98113100 A CN 98113100A CN 98113100 A CN98113100 A CN 98113100A CN 1221169 A CN1221169 A CN 1221169A
Authority
CN
China
Prior art keywords
coding
output
error
parameter
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN98113100A
Other languages
English (en)
Other versions
CN1154283C (zh
Inventor
前田祐児
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1221169A publication Critical patent/CN1221169A/zh
Application granted granted Critical
Publication of CN1154283C publication Critical patent/CN1154283C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/007Unequal error protection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0041Arrangements at the transmitter end
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0061Error detection codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0059Convolutional codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0064Concatenated codes
    • H04L1/0065Serial concatenated codes

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Error Detection And Correction (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

音频编码器3将输入音频信号分成预定的编码单位并对每一编码单位实行编码以便输出多种类型的音频编码参数。CRC代码计算功能块5由来自音频编码器3的多种类型的音频编码参数选择对听觉为重要的位。卷积编码器6对来自CRC代码计算功能块的CRC校验代码和重要位实行卷积编码。

Description

编码方法和装置以及解码方法和装置
本发明涉及一种编码方法和装置,用于将输入的音频信号分成预定的编码单位例如数据块和帧,对每一编码单位实行编码处理;以及涉及用于对该编码信号解码的方法和装置。
已知有各种编码方法,通过利用在音频信号(包含语音信号和音响信号)的时域和频域中的统计特性和人听觉的特性实行信号压缩。关于编码方法方面,有所谓的CELP(代码激励线性预测)编码例如VSEL(矢量和激励线性预测)编码方法和PSI-CELP(音调合成修正-CELP)编码方法,它们目前被认为是低位速率的音频编码方法。
按波形编码方法例如CELP编码方法,将输入音频信号的预定数量的采样用作编码单位例如一数据块或帧,使得对音频信号沿时间轴的波形的每一数据块或帧运用分析附加合成的方法,以便实行对用于量化该波形的最佳矢量的闭环搜索并输出矢量的系数。
利用低位速率例如2kbps(千位/秒)或4kbps的上述音频编码方法得到的编码位作为音频信号可以广泛地应用通信、计算机、广播之类,而不论具体的音频信息的内容。因此,应当严格地保护防止在传输通路产生信息错误。
如果在传输通路中重复发生信息错误,音频信号解码就伴随长时间的漏掉声音信息,使音频信号质量下降。
因此,本发明的目的是提供一种编码方法和装置以及解码方法和装置,它们能抑制传输通路信息错误发生,能够提高降低的质量。
为了实现上述目的,根据本发明的编码方法包含:音频编码步骤,用于沿时间轴将输入的音频信号分成预定的编码单位,并对每个编码单位进行编码,以便输出多种类型的音频编码参数;错误检测代码建立步骤,用于由根据音频编码步骤得到的多种类型的音频编码参数中选择对于听觉为重要的位,以及由该重要的位组建立错误校验代码;以及卷积编码步骤,用于对根据错误校验代码建立步骤建立的错误校验代码和重要的位组实行卷积编码。因而,可以防止对于听觉为重要的位产生传输通路错误。
这里,音频编码步骤包含:短周期预测余(residue)计算步骤,用于得到输入的音频信号的短周期预测余数;正弦波分析编码步骤,用于对所得到的短周期预测余数实行正弦波分析编码;以及波形编码步骤,用于利用波形编码对输入的音频信号进行编码。
此外,错误校验代码建立步骤选择如下部分作为重要的位:当在短周期预测余数计算步骤中得到短周期预测余数时建立的参数中的某些或全部;正弦波分析编码步骤的编码输出中的某些或全部;以及根据波形编码步骤的编码输出中的某些或全部;以及根据该重要的位建立错误校验代码。
应当指出,由短周期预测余数计算步骤为得到短周期预测余数而建立的上述参数是形成输入音频信号的频谱轮廓的线性频谱成对参数;由正弦波分析编码步骤得到的编码输出包含表明输入的音频信号是发声部分还是非发声部分的发声/非发声确定参数;以及如果输入的音频信号是发声部分时的音调数据。以及表示短周期预测编码余数的频谱包络线的频谱码本索引和增益索引;根据波形编码步骤的编码输出是当输入信号为非发声部分时的基于短周期预测余数的噪声码本索引和增益索引。
此外,为了实现上述目的,根据本发明的编码装置包含:音频编码装置,用于沿时间轴将输入的音频信号分成预定的编码单位并且对每个单位进行编码,以便输出多种类型的音频编码的参数;错误校验代码建立装置,用于由来自音频编码装置的多种类型的音频编码的参数中选择对于听觉为重要的位,和由该重要的位建立错误校验代码;以及卷积编码装置,用于对来自错误校验代码建立装置的错误校验代码和该重复位实行卷积编码。
此外,根据本发明的解码方法,用于对由输入的音频信号得到的编码数据进行解码,该输入音频信号已沿时间轴分成预定的单位,该单位已经编码,以便得到多种类型的音频编码参数,根据这些参数已将对于听觉为重要的位用于建立错误校验代码,其中的错误校验代码和重要的位已进行卷积编码得到编码的输出,该输出已与非重要的位相结合用以进行传输,该解码方法包含:卷积解码步骤,用于对经卷积编码的输出实行卷积解码,以便由附加有错误校验代码的重要位和非重要位得到解码的输出;错误校验步骤,用于利用附加到根据卷积解码步骤得到的卷积解码输出上的错误校验代码校验传输信息错误,输出调节步骤,用于根据在错误校验步骤中的错误校验结果调节经卷积解码的输出;以及音频解码步骤,用于对根据输出调节步骤得到的经卷积解码的输出实行音频解码处理。
这里,如果在错误校验步骤中检测到错误,则输出调节步骤输出通过内插处理得到的内插数据,替代经卷积的解码输出。
此外,输出调节步骤根据错误校验的结果对经卷积解码的输出实行不良帧屏蔽处理。
此外,根据本发明的解码装置用于对由输入音频信号得到的编码数据进行解码,该信号已沿时间轴分成预定的单位,这些单位已经过编码以得到多种类型的音频编码的参数,根据这些参数已利用对于听觉为重要的位建立错误校验代码,其中已对该错误校验代码和重要的位进行卷积编码以得到编码的输出,这些输出已与非重要的位相结合用以进行传输;该解码装置包含:卷积解码装置,用于对该经卷积编码的输出实行卷积解码,以便由附加有错误校验代码的重要位和非重要位得到解码的输出;错误校验和输出调节装置,用于利用附加到来自卷积解码装置的经卷积解码的输出上的错误校验代码来校验传输信息错误以及根据错误校验结果调节经卷积解码的输出;以及音频解码装置,用于对来自错误校验和输出调节装置的经卷积解码的输出实行音频解码处理。
图1是一表示根据本发明的作为编码方法和装置以及解码方法和装置的一个实施例的移动电话装置的基本结构的方块图。
图2是一表示构成移动电话装置用的音频解码器基本结构的方块图。
图3是一表示音频解码器的详细结构的方块图。
图4表示一用于解释构成移动电话装置用的传输通路解码器的工作清况的状态传输的序列。
图5是一表示构成移动电话装置用的音频解码器的基本结构的方块图。
图6是一表示音频解码器的详细结构的方块图。
图7是一用于解释由移动电话装置实施的编码方法的流程图。
图8是一用于解释由移动电话装置实施的编码方法的流程图。
下面将对根据本发明的一实施例的编码方法和装置以及解码方法和装置进行介绍。
图1表示一移动电话装置,其包含:构成编码装置的音频编码器3和传输通路解码器4,以及构成解码装置的传输通路解码器14和音频解码器17,均根据本发明的一个实施例。传输通路编码器4具有-CRC代码计算功能块5和卷积编码器6。传输通路解码器14具有卷积解码器16以及CRC代码比较功能块和帧屏蔽功能块15。
即,在这种移动电话装置中,采用本发明的编码方法的编码装置:音频编码器3,其将输入的音频信号沿时间轴分成预定的单位,对每一单位进行编码并输出多种类型的音频编码参数;CRC代码计算功能块5,其由来自音频编码器3的多种类型的音频编码参数中间选择对于听觉来说是重要的位组,以便建立CRC(循环冗余码校验)代码;以及编码器6,其对来自CRC代码计算功能块5的上述CRC代码和重要的位组进行卷积编码。
此外,在这种移动电话装置中,采用根据本发明的解码方法的解码装置对经卷积编码的输出进行解码。即,将输入的音频信号沿时间轴分成预定的单位,对每一单位进行编码,以便得到多种类型的音频编码参数,根据这些参数使用一对于听觉来说是重要的位组,以便建立CRC代码。对因此建立的CRC代码和上述重要的位组进行卷积编码以便得到经卷积编码的输出,其再与已除去该重要的位组以外的其余位组相结合。由解码装置对与该其余位组组合的这一经卷积编码的输出进行解码。该解码装置包含:卷积解码器16,用于对该经卷积编码的输出进行卷积解码并输出该附加CRC代码的重要的位组和其余的位组作为解码输出;CRC代码比较和帧屏蔽功能块15,用于将来自卷积解码器16的附加到经卷积解码的输出上的CRC代码与由其余位位计算的CRC差错校码代码相比较,并根据比较结果进行调节该上述经卷积解码的输出;以及音频解码器17,用于对来自这一CRC代码比较和帧屏蔽功能块15的经卷积解码的输出进行音频解码处理。
在这一移动电话装置中,在传输过程中,由麦克风1输入的音频信号由A/D变换器变换为数字信号,由音频编码器3按照2kbps(千位/秒)/4kbps的低位编码方式进行编码。该经编码的数字信号由传输通路编码器进一步编码,使音频信号质量不受传输通路质量的影响。在此之后,由调制器7对该数字信号进行调制,并且在经过公用天线装置9由天线10发射之前利用发射器8对其输出位进行发射处理。
此外,在接收过程中,利用接收器11经过公用天线装置9接收由天线10获得的无线电波,由解调器13进行解码,在传输通路解码器14中进行传输通路差错进行校正,由音频解码器17解码,并由D/A变换器变换为模拟音频信号,以便由扩音器19输出。
此外,控制功能块20控制各上述组成部分,合成器12向发射器8和接收器11提供发射和接收频率。此外,键盘21和LCD显示器22用作人机接口界面。
在具有上述结构的移动电话装置中,CRC代码计算功能块5按照上述重要位组选择:构成上述音频信号的频谱包络线的所有线性谱成对(LSP)参数中的一部分;表明音频信号是清音(V)还是浊音(UV)部分的所有V/UV确定参数;如果音频信号是清音时的部分或所有音调参数;如果音频信号是浊音时,表示线性预测编码(LPC)的余数信号频谱包络线的频谱码本索引和增益索引的一部分或全部;以及如果音频信号为清音时的表示线性预测编码(LPC)的剩余信号的噪声码本索引和增益索引的一部分或全部。根据这些重要的位,建立CRC代码。
这些重要的位是由音频编码器3得到的。这一音频编码器3进行的音频(信号)编码包含:短期预测余数的计算步骤,用于确定输入音频信号的短期余数;正弦波分析编码步骤,用于对所得到的短期余数进行正弦波分析编码;以及波形编码步骤,用于通过波形编码对输入的音频信号编码。下面参照图2和图3将详细介绍这一音频编码器3。
图2中的音频编码器3基于使用两个编码器;第一编码功能块(器),其确定输入音频信号的短期预测余数例如LPC(线性预测编码)余数并进行正弦波分析编码例如谐波编码;以及第二编码功能块(器)120,从而使第一编码功能块110用于对输入信号中的清音(V)部分进行编码以及使第二编码功能块120用于对输入信号中的浊音(UV)部分进行编码。
第一编码功能块110的结构适于对LPC余数进行正弦波分析编码例如谐波编码和多带激励(MBE)编码。第二编码功能块120例如具有的结构适于利用在合成的基础上的分析借助对于最佳矢量的闭环搜索,利用矢量量化进行代码激励线性预测(CELP)编码。
在图2的实例中,提供到输入端101的音频信号输送到第一编码功能块110中的LPC逆滤波器111和LPC分析量化功能块113。由LPC分析一量化功能块113得到的LPC系数即所谓的α参数提供到LPC逆滤波器111。这一LPC逆虑波器111线性预测余数(输入音频信号的LPC余数。此外,LPC分析一量化功能块113正如下面将详细介绍的输出LSP(线性预测成对系数),以及这一输出被输送到输出端102。来自LPC逆滤波器111的LPC余数被输送到正弦波编码功能块114。正弦波编码功能块114进行音频检测和频谱包络线幅值计算以及在V(清音)/UV(浊音)确定功能块115中进行V/UV确定。正弦波分析编码功能块114向频谱量化功能块16提供频谱包络线幅值数据。矢量量化功能块116输出作为频谱包络线的矢量量化输出的码本索引,经过开关117提供到输出端103。来自正弦波分析编码功能块114的输出经过开关118提供到输出端104。此外,来自V/UV确定功能块115的V/UV确定结果输送到输出端105以及提供作为开关117和118的控制信号。在为上述清音(V)的情况下,选择上述索引和音调,并分别由输出端103和104输出。
图2中的第二编码功能块120具有一CELP(代码激励线性预测)编码结构。来自噪声码本121的输出由加权合成滤波器122进行合成。所得到的经加权的音频(信号)提供到减法器123,在其中确定在经加权的音频(信号)与提供到输入端101并再提供到加权滤波器125上的音频信号之间的差。第一误差差值提供到一用于位距计算的位距计算电路124,并在噪声码本121中搜索使该误差差值最小的矢量。因此,将合成分析方法应用在闭环搜索中,用以实现沿时间轴的波形的矢量量化。正如上面已经介绍的,对于浊音采用这种CELP编码。来自噪声码本121的作为UV数据的码本经过开关127由输出端107取出,当来自V/UV确定功能块115的V/UV确定结果为浊音(UV)时接通该开关。
图3表示在图2中所示的音频编码器3的更具体的结构。在图3中与图2中相似的组成部分用相同的标号标准。
在图3中所示的音频编码器中,在高通滤波器(HPF)109中对提供到输入端101的音频信号进行滤波处理,以便除去不需要的频带的信号,且再传输到LPC分析电路和LPC(线性预测编码)分析量化功能块113中的LPC反相电路111。
LPC分析一量化功能块113中的LPC分析电路132将一Hamming(汉明)窗口应用于由约256采样构成的输入信号波形中的一个(数据)块,以便利用自相关法得到线性预测系数,即所谓α参数。作为数据输出单位的成帧间隔约160采样。当采样频率fs例如为8KHZ(千赫)时,在20ms(毫秒)内成帧间隔为160采样。
来自LPC分析电路132的α参数提供到α-LSP变换电路133,以便变换为线性频谱成对(LSP)参数。即作为正向(direct)型滤波器系数得到的α参数变为10个,即5对LSP参数。例如利用Newton-Raphson法或类似方法进行这种变换。LSP参数具有比α参数更优良的内插特性。
来自α-LSP变换电路133的LSP参数由LSP量化器134进行矩阵量化或矢量量化。这里,可以确定在矢量量化之间的各帧之间的差,或者一次对多帧进行矩阵量化。这里,20ms构成一帧,对每个在每20ms内计算的2帧LSP参数进行矩阵量化和矢量量化。
来自LSP量化器134的量化输出即LSP量化系数经过连接端102取出,并将经矢量量化的LSP提供到LSP内插电路136。
LSP内插电路136每20ms或40ms按8倍的速率将经LSP矢量量化的LSP进行内插,这样LSP矢量每2.5ms进行更新。利用谐波编码解码方法进行分析一合成的余数波形成为一种具有十分平缓和平滑包络线的合成波形。如果LPC系数每20ms急剧变化就会产生异常的噪声。如果LPC系数每2.5ms逐渐地变化就能防止这种异常噪声的发生。
为了实现这样输入音频(信号)的逆滤波,利用每2.5ms内插的LSP矢量来进行,LSP-α变换电路137将LSP参数变换为α参数,即为例如为10阶的正向型滤波器的系数。来自这-LSP-α变换电路137的输出提供到上述LPC逆滤波器111。这一LPC逆滤波器111利用每2.5ms更新的α参数进行逆滤波,以便得到平滑的输出。来自LPC逆滤波器111的输出提供到正弦波分析编码功能块114,更具体地说,提供到一例如为DFE(离散Fourier变换)电路的谐波编码电路中的正交变换电路145。
来自LPC分析一量化功能块113的LPC分析电路132的α参数提供到按听觉加权滤波器计算电路139,以便得到用于按听觉加权的数据。这一加权数据提供到具有按听觉的权重的矢量量化器116和第二编码功能块120,即按听觉加权滤波器125和按听觉加权的合成滤波器122。
在例如为谐波编码电路的正弦波分析编码功能块114中,来自LPC逆滤波器111的输出利用谐波编码方法进行分析。即进行音调检测、每一谐波幅值Am的计算、清音(V)浊音(UV)部分的识别,以便通过范围变换,根据音调或幅值Am的数量形成持续的谐波包络线变化。
在图3中所示的正弦波分析编码功能块114的特定实例中,该为一般的谐波编码。在MBE(多带激励)编码的情况下,设想,在每一频带中出现清音和浊音,即在相同时间处在一频率轴区域内(在一数据块或帧内)。在另外谐波编码中,确定在一数据块或帧内的音频信号)属于清音还是浊音。应当指出,在下面的解释中,当使用于MBE编码时,按这样一种方式确定在一帧内的V/UV,即如果整个频带属于UV,则确定该帧为UV部分。上述MBE分析-合成法在本发明的申请人申请的4-91422号日本专利申请的说明书和附图中有详细说明。
在图3中的正弦波分析编码功能块114具有-开环音调搜索功能块141,由输入端101向其提供输入音频信号;以及还有一过零计数器142,由上述HPF(高通滤波器)109向其提供信号。在正弦波分析编码功能块114中,由LPC(逆滤波器111向正交变换电路145提供LPC余数或线性预测余数。在开环搜索码本141中,根据输入信号的LPC余数,利用开环进行比较粗略的音调搜索。所抽取的粗略音调数据提供到高精度音调搜索功能块146,使得利用后面将详细介绍的闭环进行精细音调搜索。开环音调搜索功能块141输出上述粗略音调数据时连同一起输出由功率归一化的LPC余数的自相关最大值,即提供到V/UV确定功能块115的归一化的自相关最大值r(P)。
在正交变换电路145中,进行例如为DFT(离散Fourier变换)的正交变换处理,以便将沿时间轴的LPC余数变换为沿频率轴的频谱幅值数据。来自正交变换电路145的输出提供到一精细音调搜索功能块146和一用于评估频谱幅值或包络线的频谱评估功能块148。
向精细音调搜索功能块146提供由开环音调搜索功能块141中抽取的比较粗略的音调数据和来自正交变换功能块145的沿频率轴的经DFT的数据。在这一精细音调搜索功能块146中,少许采样力图按0.2到0.5的间隔在上述粗略音调数据以上和以下分布,以便得到一最佳散布的精细音调数据数值。这里采用的精细搜索方法被称之为分析附带合成的方法,在其中按这样一种方式即使合成的功率谱最接近原有的音频(信号)功率谱的方式选择音调。利用这种闭环在精细音调搜索功能块中得到的音调数据经过开关118提供到输出端104。
在频谱评估功能块148中,根据频谱的幅值和作为LPC余数的正交变换输出的音调,评估每一谐波的大小以及其组合,即频谱包络线。这一评估结果提供到精细音调搜索功能块146、V/UV(清音/浊音)确定功能块以及按听觉加权的矢量量化器116。
V/UV确定功能块115根据来自正交变换电路145的输出、来自精细音调搜索功能块146的最佳音调、来自频谱评估功能块148的频谱幅值数据,来自开环音调搜索功能块141的归一化的自相关最大值r(p)以及来自过零记数器142的过零记数值,确定该帧属于V还是UV部分。此外,在MBE的情况下,可以利用对于每一频带的V/UV确定结果的边界位置作为该帧的V/UV确定状态。由这一V/UV确定功能块输出的确定结果经过输出端105取出。
另一方面,在频谱评估功能块148的输出功能块中或者在矢量量化器116的输入功能块中设有数据计数变换(一种采样速率变换)功能块。这一数据计数变换功能块用于保持恒定数目的包络线幅值数据|Am|,这里考虑到沿频率轴被划分的频带的数目和数据的数目根据上述音调而变化。即,如果例如有效的频带设想高达3400KH,这一有效的频带根据上述音调被分成8到63个频带,因此,对于每一频带得到的数目为mMX+1的幅值数据|Am|,其数目由8变换到63。为了按其编码,数据计数变换功能块119将幅值数据的可变数目mMX+1变换为一恒定的数目例如44。
设在频谱评估功能块148的输出功能块中或矢量量化器116的输入功能块中的数据计数变换功能块输出的幅值数据或包络线数据的恒定数目M(例如44)被汇集为一个矢量的例如为44的预定数目的数据,该矢量为一要进行加权矢量量化的矢量。利用来自按听觉加权滤波器计算电路139的输出提供这种加权。来自矢量量化器116的包络线经过开关117由输出端113取出。应当指出,在进行加权矢量量化之前,对于由预定数目的数据构成的矢量利用适当的峰值系数可以得到帧内的差。
按着对第二编码功能块120进行解释。第二编码功能块120具有一所谓的CELP(代码激励线性预测)编码结构,并特别适用于对输入的音频信号中的浊音的部分编码。在用于浊音的部分的这一CELP编码结构中,一噪声码本即所谓的随机码本121输出与浊音的音频信号LPC余数相对应的噪声输出的典型数值,其再经过增益电路126提供到加权合成滤波器122。在这一加权合成滤波器122中,对输入的噪声进行LPC合成处理,将所得到的经加权的浊音部分的音频信号提供到减法器123。还向减法器123提供有由输入端101经过HPF(高通滤波器)和按听觉加权滤波器125提供的音频信号,在滤波器125中已对音调信号进行按听觉加权。在减法器中,得到这一加权的信号和来自合成滤波器122的信号之间差值或误差。应指出,这是设想,来自按听觉加权滤波器的输出是预先减去按听觉加权的合成滤波器的零输入响应的。这一差值或误差提供到一用于位距计算的位距计算电路124,在噪声码本122中搜索一使该差值或误差降至最小的有代表性数值的矢量。因此,借助分析附加合成方法利用闭环搜索进行沿时间轴的波形的矢量量化。
由利用CELP编码结构的第二编码功能块120取得作为UV(浊音)部分的数据的,来自噪声码本的码本的形状索引和来自增益电路126的码本中的增益索引。
作为来自噪声码本121的UV数据的形状索引经过开关127s提供到该输出端107s,而作为增益电路126的UV数据的增益索引经过一开关127g提供到该输出端107g。
这里指出,这些开关127g、127s以及上述的开关117和118都根据来自V/UV确定功能块115的V/UV确定结果进行通断控制。当所传输的一个当前帧的音频信号被确定为清音(V)时,控制开关117和118接通,而当所传输的一个当前帧的音频信号被确定为浊音(UV)时,控制开关127s和127g接通。
表1表示由具有上述结构的音频编码器3输出的参数:LSP参数、清音/浊音确定参数、音调参数、频谱包络线码本参数以及增益系数、噪声码本参数和增益系数,它们都分成2/4kbps(千位/秒)进行编码。表1还介绍了分配的位数。
[表1]
符号     说明 位数
LSP0     第0LSP参数 (6位)
LSP2     第2LSP参数 (6位)
LSP3     第3LSP参数 (5位)
LSP4     第4LSP参数 (1位)
LSP5     第5LSP参数 (8位)
VUV     发声/非发声标记 (2位)
PCH     音调参数 (7位)
idS0     第0频谱参数 (4位)
idS1     第1频谱参数 (4位)
idG     频谱增益参数 (5位)
idS0 4K     对予4K第0频谱参数 (7位)
idS1 4K     对予4K第1频谱参数 (10位)
idS2 4K     对予4K第2频谱参数 (9位)
idS3 4K     对予4K第3频谱参数 (6位)
idSL00     第0噪声码本参数 (6位)
idSL01     第1噪声码本参数 (6位)
idGL00     第0噪声码本增益参数 (4位)
idGL01     第1噪声码本增益参数 (4位)
idSL10     对于4K第0噪声码本参数 (5位)
idSL11     对于4K第一噪声码本参数 (5位)
idSL12     对于4K第二噪声码本参数 (5位)
idSL13     对于4K第3噪声码本参数 (5位)
idGL10     对于4K第0噪声码本增益参数 (3位)
idGL11     对于4K第一噪声码本增益参数 (3位)
idGL12     对于4K第二噪声码本增益参数 (3位)
idGL13     第于4K第三噪声码本增益参数 (3位)
上述的传输通路编码器4使CRC代码计算功能块5能选择表1中所示的某些或全部参数作为用于听觉来说是重要的位组和计算CRC代码。利用卷积编码器6对CRC代码和该重要的位组进行卷积编码。
如在表2中所示,在2kbps的情况下,关于每2帧40ms为120位的情况下,80位的重要位组按照Ⅰ类被处理,其余40位按照Ⅱ类被处理。
[表2]
    2kbps     4kbps
    Ⅰ类 80  112
    CRC 14  14
    TAIL 10  10
    总和 104  136
    Ⅱ类 40  104
144(3.6kbps)   240(8.0kbps)
根据Ⅰ类80位,CRC代码计算功能块5建立14位CRC代码。卷积编码器6利用Ⅰ类的80位、14位CRC代码和10表格位进行卷积编码。
对利用这一卷积编码器6得到的104位和Ⅱ类的40位(即总共144位)进行位交错和2帧交错以便传输,因此实现按2kbps对音频信号编码。应当指出,当准确进行传输时,附加其它冗余位。
此外,在4kbps的情况下,如表2中所示,该重要位组中的112位作为Ⅰ类处理以及其它104位按照Ⅱ类处理。
根据Ⅰ类的112位,CRC代码计算功能块5建立14位的CRC代码。利用Ⅰ类的112位、14位CRC代码和10表格位进行卷积编码。
对利用这一卷积编码器6得到的136位和Ⅱ类的104位(即总共240位)进行位交错和2帧交错用以传输,因此实现按4kbps对音频信号编码。应当指出,当准确进行传输时,附加其它冗余位。
表3表示在2kbps的情况下Ⅰ类和Ⅱ类的分配情况。Ⅰ类是分配作为被保护位的重要位组,Ⅱ类分配作为非被保护的。应当指出,这里所提供的实例是针对20ms一帧的。
[表3]
参数     清音部分     浊音部分
受保护的位数 不受保护的位数 总数 受保护的位数 不受保护的位数 总数
LSP0     6     0     6     6     0     6
LSP2     0     6     6     3     3     6
LSP3     0     5     5     0     5     5
LSP4     1     0     1     1     0     1
VUV     2     0     2     2     0     2
PCH     6     1     7
idS0     0     4     4
idS1     0     4     4
idG     5     0     5
idSL00     0     6     6
idS101     0     6     6
idGL00     4     0     4
 idGL01     4     0     4
 总数     20     20  40     20     20    40
此外,表4表示在4kbps的情况下的Ⅰ类和Ⅱ类的分配情况。
表4
参数     清音部分     浊音部分
受保护的位数 不受保护的位数 总数 受保护的位数 不受保护的位数 总数
LSP0     6     0     6     6     0     6
LSP2     6     0     6     3     3     6
LSP3     0     5     5     0     5     5
LSP4     1     0     1     1     0     1
LSP5     0     8     8     0     8     8
VUV     2     0     2     2     0     2
PCH     6     1     7
idS0     1     3     4
idS1     1     3     4
idG     5     0     5
idS0 4K     0     7     7
idS1 4K     0     10     10
idS2 4K     0     9     9
idS3 4K     0     6     6
idSL00     0     6     6
idSL01     0     6     6
idGL00     4     0     4
idGL01     4     0     4
idSL10     0     5     5
idSL11     0     5     5
idSL12     0     5     5
idSL13     0     5     5
idGL10     2     1     3
idGL11     2     1     3
idGL12     2     1     3
idGL13     2     1     3
 总数     28     52     80     28     52     80
上述表2和表3表示被保护位/非被保护位的分配实例,即对于听觉来说是重要的位的分配实例:构成音频信号的频谱的轮廊的线性频谱成对(LSP)参数中的某些或全部;表示音频信号是清音还是浊音的部分的清音(V)浊音(UV)定参数的全部;当音频信号为清音时的音调参数中的某些或全部;表示当音频信号为清音时的线性预测编码(LPC)冗余信号的频谱包络线的频谱码本索引和增益索引中的某些或全部;当音频信号是浊音时的线性预测编码(LPC)冗余信号的噪声码本索引和增益索引中的某些或全部。
在移动电话装置中,为了维持通话质量,第一LSP参数LSP0是与由码本得到的实际LSP系数接近的LSP频率。由于要求准确地传输,所有的6位都按照被保护位处理。此外,用作V/UV确定参数的V/UV参数表示信号的质量,以及所有两位都受保护。另外,音调参(PCH)是信号的基频,高达7位中的6位受到保护。此外,在为清音的情况下,表示LPC余部信号的频谱包络线的码本中的增益索引代表信号的声级,由于准确传输通信的要求,所有5位受到保护。
即,在传输通路易引起信息错误的环境下,这些重要的位用于在一定程度上维持通信质量。这样就能防止可能由于位错误引起的异常声音的产生。
下面详细解释利用CRC代码计算功能块5进行的CRC代码计算和利用卷积编码器6进行的卷积编码。
表5和表6表示了关于在2kbps情况下的Ⅰ类和关于在4kbps情况下的Ⅰ类时加入-CRC建立多项式中的输入位次序P[i]。这里,下标“P”代表前一帧的参数。此外,位0代表-LSP0在一项之中提供两个参数的情况下,在上一列中提供的参数是针对清音的。在下一列中提供的参数是针对浊音的。
[表5]
i    Item  Bit   i     Item   Bit    i    Item  Bit
    0    LSP0p   5    14     idGp     4    28     PCHp   5
    idGL00p     0    idGL01p   0
    1    LSP0   5    15     idG     4    29     PCH   5
    idGL00     0     idGL01   0
    2   LSP0p   3    16     idGp 3    30     VUVp   0
    LSP2p     5
    3   LSP0   3    17     idG     3    31     VUV   0
    LSP2     5
    4   LSP0p   1   18     idGp     2    32     LSP4p  0
    LSP2p     4
    5   LSP0   1   19     idG     2    33     LSP4  0
    LSP2     4
    6   VUVp   1   20     idGp     1    34     LSP0p  0
    LSP2p     3
    7   VUV   1   21     idG     1    35     LSP0  0
    LSP2     3
    8   PCHp   6   22     idGp     0    36     LSP0p  2
 idGL00p   3     idGL01p     3
    9   PCH   6   23     idG     0    37     LSP0  2
 idGL00   3     idGL01     3
   10  PCHp   4   24     PCHp     1    38     LSP0p  4
 idGL00p   2     idGL01p     2
   11     PCH     4  25     PCH     1  39     LSP0     4
    idGL00     2     idGL01     2
   12     PCHp     2  26     PCHp     3
    idGL00p     1     idGL01p     1
   13     PCH     2  27     PCH     3
    idGL00     1     idGL01     1
[表6]
i Item Bit i Item Bit i Item Bit
   0    LSP0p    5   19     idG   0    38     idGp     3
    idGL10   1    idGL01p     3
   1     LSP0    5   20     idS0p   3    39     idG     33
    idGL11p   2     idGL01     3
   2     LSP0p    3   21     idS0   3    40     PCHp     1
    idGL11   2     idGL01p     2
   3    LSP0    3  22     LSP2p   0    41     PCH     1
    idGL11p   1     idGL01     2
   4    LSP0p    1  23     LSP2   0    42     PCHp     3
    idGL11   1     idGL01p     1
   5    LSP0    1  24     LSP2p   5    43     PCH     3
    idGL01     1
   6    VUVp    1  25     LSP2    5    44     PCHp     5
    idGL01p     0
   7     VUV    1    26     LSP2p     4    45     PCH    5
    idGL01    0
   8     PCHp    6    27     LSP2     4    46     VUVp    0
   idGL00p    3
   9     PCH    6    28    LSP2p     3    47     VUV     0
    idGL00    3
   10     PCHp    4    29    LSP2     3    48    LSP4p    0
    idGL00p    2
   11     PCH    4    30    LSP2p     2    49    LSP4p    0
    idGL00    2    idGL12p     2
   12     PCHp    2    31    LSP2     2    50    LSP0p    0
    idGL00p    1    idGL12     2
   13     PCH    2    32    LSP2p     1    51    LSP0    0
    idGL00    1    idGL12p     1
   14     idGp    4    33    LSP2     1    52    LSP0p    2
    idGL00p    1    idGL12     1
   15     idG    4    34    idS1p     3    53    LSP0    2
    idGL00    0    isGL13p     2
   16     idGp    2    35    idS1     3    54    LSP0p    4
   idGL10p    2    idGL13     2
   17     idG    2    36    idS1p     1    55    LSP0    4
   idGL10    2    isGL13p     1
   18     idGp    0    37    idG     1
    idGL10p    1    idGL13     1
CRC计算功能块5利用在下面提供的方程(1)中所示的CRC多项式,以便得到针对每帧7位的CRC代码即CRC[i]。
[方程1] R ( x ) = Σ i = 0 6 CRC [ i ] • x t - - - ( 1 )
[方程2] x 7 Σ i = 0 N P [ i ] • x t = Q ( x ) • G CRC ( x ) + R ( x ) - - - ( 2 )
[方程3]
      GCRC(x)=1+x4+x5+x6+x7    ...(3)
在方程(2)中,如果为2kbps则N=39;如果为4kbps则N=55。在此之后,如果不另外规定,即采取这一假设。
利用由上述方程(1)到(3)得到的CRC代码CRC[i]和在表5和表6中所示的P[i],按照在下面提供的方程(4)中表示的建立加入到卷积编码器6中的输入位串CVin[i]。
[方程4]
Figure A9811310000223
向卷积编码器6提供有该输入位串CVin[i]和上述重复位组,以便利用如在下面的方程(5)和(6)中表示的两个新建多项式进行卷积编码。
[方程5]
       G1(D)=i+D+D3+D5    ...(5)
[方程6]
       G2(D)=i+D2+D3+D4+D5    ...(6)
由G1(D)开始,及交替利用方程(5)和(6),这一卷积编码器6进行卷积编码。
表7和表8分别表示针对2kbps和4kbps时的Ⅱ类的位次序。按照这种输入次序,将Ⅱ类位与由卷积编码器6的编码输出相组合,用以进行传输。
[表7]
i Item Bit i Item Bit i Item Bit
  0    LSP2p    2    14     LSP3p    0    28     LSP2p    4
    idSL00p    4
  1    LSP2    2    15     LSP3  0  29      LSP2    4
    idSL00    4
  2    LSP2p    1    16     idS0p     0     30     LSP2p 3
    idSL01p     5    idSL00p    3
  3    LSP2    1    17     idS0     0     31     LSP2    3
    idSL01     5     idSL00    3
  4    LSP2p    0    18     idS1p     3  32     PCHp    0
    idSL01p     4     idSL00p    2
  5    LSP2    0    19     idS1     3  33     PCH    0
    idSL01     4     idSL00    2
  6    LSP3p    4    20     idS1p     2  34     idS0p    3
    idSL01p     3     idSL00p    1
  7    LSP3    4    21     idS1     2  35     idS0    3
    idSL01     3     idSL00    1
  8    LSP3p    3    22     idS1p  1  36     idS0p    2
    idSL01p     2     idSL00p    0
  9    LSP3    3    23     idS1     1  37     idS0    2
    idSL01     2     idSL00    0
 10    LSP3p    2    24     idS1p     0  38     idS0p    1
    idSL01p     1     idSL01p    0
   11  LSP3     2   25     idS1   0  39     idS0    1
    idSL01   1     idSL01    0
   12  LSP3p     1   26     LSP2p   5
    idSL00p   5
   13  LSP3     1   27     LSP2   5
    idSL00   5
[表8]
i Item Bit i Item Bit i Item Bit
   0    LSP3   4    18    idS1    1    36    idS1_4K    0
   idSL00    3    idSL11    2
   1    LSP3   3    19    idS1    0    37    idS2_4K    8
   idSL00    2    idSL11    1
   2    LSP3   2    20    idS0_4K    6    38    idS2_4K    7
   idSL00    1    idSL11    0
   3    LSP3   1    21    idS0_4K    5    39    idS2_4K    6
   idSL00    0    idSL11    0
   4    LSP3   0    22    idS0_4K    4    40    idS2_4K    5
   idSL01    5    idSL12    4
   5    LSP5   7    23    idS0_4K    3    41    idS2_4K    4
   idSL01    4    idSL12    3
   6    LSP5   6    24    idS0_4K    2    42    idS2_4K    3
   idSL01    3    idSL12    2
    7     LSP5    5    25   idS0_4K     1  43    idS2_4K     2
  idSL01     2    idSL12     1
    8     LSP5    4    26   idS0_4K     0  44    idS2_4K     1
  idSL01     1    idSL12     0
    9     LSP5    3    27   idS1_4K     9  45    idS2_4K     0
  idSL01     0    idSL12     0
   10     LSP5    2    28   idS1_4K     8  46    idS3_4K     5
  idSL10     4    idSL13     4
   11     LSP5    1    29   idS1_4K     7  47    idS3_4K     4
  idSL10     3    idSL13     3
   12     LSP5    0    30   idS1_4K     6  48    idS3_4K     3
  idSL10     2    idSL13     2
   13     PCH    0    31   idS1_4K     5  49    idS3_4K     2
    LSP2    2   idSL10     1    idSL13     1
   14     idS0    2    32   idS1_4K     4  50    idS3_4K     1
    LSP2    1   idSL10     0    idSL13     0
   15     idS0    1    33   idS1_4K     3  51    idS3_4K     0
    LSP2    0   idSL10     0    idSL13     0
   16     idS0    0    34   idS1_4K     2
    idSL00    5   idSL11     4
   17     idS1    2    35   idS1_4K     1
    idSL00    4   idSL11     3
应当指出,在按照4kbps的如表8中所示的Ⅱ类位次序中,位数大至104。对于2帧组合,仅显示1帧。实际上,前一帧的和后一帧的位是交替排列的。
接着在上述解码装置中,例如在对作为卷积编码的输出的,由另一个移动电话装置的编码装置接收的位串解码之后,卷积解码器16进行卷积解码,以及该CRC代码比较和帧屏蔽功能块15将附加到来自卷积解码器16的经卷积解码的输出的CRC检验代码与由重要位组检测的位组计算的CRC错误检验代码相比较,以便根据比较结果调节经卷积解码的输出。
CRC代码比较和帧屏蔽功能块15通过利用附加到利用卷积解码器16执行的卷积解码步骤的经卷积解码输出的上述错误校验代码,执行错误校验步骤,用以校验传输错误;以及执行输出调节步骤,即根据上述错误校验步骤的错误校验结果,调节经卷积解码的输出。
当CRC代码不一致时,利用帧数据的音频信号解码导致音频信号的质量明显地劣化。如果重复地进行错误检测,在提供到音频解码器17以前,进行参数替换,使得将经调节的输出提供到其上。通过将不良帧屏蔽可以实现参数替换。
图4表示在不良帧屏蔽过程中的状态转换。根据CRC代码校验处理的结果,对现时帧的状态变量进行改变。沿由箭头指示的方向状态。到7由一个向另一个转变。发射传输在起点0开始并且如果有错误沿“1”的方向进行;如果无错误则沿“0”的方向进行。
即,状态“0”代表没有CRC错误。例如如果CRC未连续地满足6次则达到状态6。比外,在状态“0”,不进行处理。即进行正常解码。
例如,当在状态1到6对上述LSP参数解码时。使用前一帧的LSP参数。此外,在状态7,如果LSP参数按正确模式,使用LSP0到LSP5;以及如果LSP参数按不同模式,仅使用第0LSP代码系数LSP0。
此外,例如状态变量,“状态”数值,即一消(mute)变量“状态”按照表9下方所示的设定,用以控制输出声音。如果该状态变量是状态=7,mute(p)表示前一帧的消音变量。
表9
    状态     mute(消音)
    0     1.000
    1.2     0.800
    3     0.500
    4     0.250
    5     0.125
    6     0.000
    7     (消音)mute(p)
此外,例如,如果V/UV参数是V,在状态变量:状态=1到6,使用频谱参数idS0,idS1,频谱增益参数idG以及4kbps频谱参数idS0_4K到前一帧的idS3_4K。
再者,按照方程(7)所示形成余数信号中的频谱变量Am[00…44],以便控制输出音量。这里,由该参数得到的Am[i]构成为Am(org)[i]。
[方程7]
      Am[i]=mute*Am(org)[i](0≤i≤159)    ...(7)
此外,例如如果V/UV确定参数为UV,在状态变量1到6,使用噪声码本增益参数idGL00,idGL01以及前一帧的4kbps噪声码本增益参数idGL10到idGL13。至于噪声码本参数idSL00、idSL01,以及4kbps噪声码本参数idSL10到idSL13,在每一种位数的范围内产生的随机数都被采用。
再者,余数信号res[00...159]是按照方程(8)所示构成的。这里由该参数得到的res[i]构成为res(org)[i]。
[方程8]
       res[i]mute*res(org)[i](0≤i≤159)…(8)
已经利用CRC代码比较和帧屏蔽功能块15对不良帧屏蔽的经卷积编码的输出提供到音频解码器17。
音频解码器17的结构如图5和6中所示。CRC代码比较和帧屏蔽功能块15输出有:经过连接端202的,与来自图3中的连接端102的上述LSP(线性频谱成对参数)的量化输出相对应的码本系数;经过连接端203、204和205的,作为与来自图3中的连接端103、104和105的输出相对应的包络线量化输出的系数、音调和V/UV确定结果;以及经过连接端207的,作为与来自图3中连接端107的输出相对应的UV(浊音)数据的系数。进而,将作为利用CRC代码比较和帧屏蔽功能块15得到的CRC校验结果得到的CRC误差信号提供到浊音部分音频合成功能块220。
作为来自连接端203的包络线量化输出的索引传送到逆矢量量化器212,以便对其进行矢量量化,得到LPC余数的频谱包络线,再提供到清音部分音频合成功能块211。清音部分音频合成功能块211利用正弦波合成对清音部分的LPC(线性预测编码)余数进行合成。还向这一清音部分音频合成功能块211提供有由连接端204和205输出的音调和V/UV确定结果。来自清音部分音频合成功能块211的清音LPC余数提供到LPC合成滤波器214。此外,来自连接端207的UV数据索引提供到浊音部分音频合成功能块220,在其中查询一噪声码本,以便取出作为浊音部分的激励矢量的LPC余数。这一LPC余数还提供到LPC合成滤波器214。在LPC合成滤波器214中,对清音部分的LPC余数和浊音部分的LPC余数彼此独立地进行LPC合成处理。另外,还可以将清音部分的LPC余数附加到浊音部分的LPC余数上,以便一起进行LPC合成处理。这里,来自连接端202的LSP系数提供到LPC参数重现功能块213,在其中取出LPC的α参数并提供到IPC合成滤波器214。由输出端201输出利用LPC合成滤波器通过LPC合成得到的音频信号。
接着,图6表示图5中的音频解码器17的更具体的结构。在这一图6中,与图5中相同的组成部分用相同标号标注。
在图6中,向输入端202提供有所谓的码本索引,即与来自图2和图3中的输出端102的输出相对应的LSP矢量量化的输出。经过上述CRC代码比较和帧屏蔽功能块15。
这一LSP索引提供到LPC参数重现功能块213中的逆矢量量化器231并对其进行逆矢量量化成为LSP(线性频谱成对参数),其再提供到LSP内插电路232、233,在其中进行LSP内插处理。在此之后,将所得数据提供到由LSP向α的变换电路234和235,以便变换成LPC(线性预测代码)的α参数。这一α参数提供到LPC合成滤波器214。这里,LSP内插电路213和由LSP向α变换电路235用于清音(V)部分,而LSP内插电路233和由LSP向α变换电路235用于浊音部分(UV)。此外,LPC合成滤波器214由用于清音部分的LPC合成滤波器236和用于浊音部分的LPC合成滤波器237构成。即,对清音部分和浊音部分彼此独立地进行LPC系数内插,以便在由清音部分向浊音部分或由浊音部分向清音部分转变的部分处在具有完全不同特性的各LSP之间由于内插引起的有害影响。
此外,向图4中的输入端203提供有已经对其进行加权矢量量化的频谱包络线(Am)代码索引数据,这种量化对应于来自图2和图3中所示的编码器的连接端103的输出。经过上述CRC代码比较和帧屏蔽功能块。向图4中的输入端204提供有来自图2和3中的连接端104经过CRC代码比较和帧屏蔽功能块15的音调数据。向图4中的输入端205提供有来自图2和图3中的连接端105的经过CRC代码比较和帧屏蔽功能块15提供的V/UV确定数据。
频谱包络线Am的矢量量化的索引数据提供到逆矢量量化器212,以便对其进行逆量化,即与上述数据计数变换相对应的逆变换,并作为频谱包络线数据提供到清音音频合成功能块211中的正弦波合成电路215。
应当指出,在编码过程中在频谱的矢量量化之前确定帧内差值的情况下,这里接着逆矢量量化的是帧内差值的解码,以便得到关于频谱包络线的数据。
由输入端204向正弦波合成滤波器215提供音调,由输入端205向其提供V/UV确定数据。正弦波合成电路215响应于图2和3的LPC逆滤波器111的输出,输出LPS余数数据,该数据再提供到加法器218。这种正弦波合成的特定方法例如公开在由本发明的发明人申请的4-91422号的日本专利申请的说明书和附图中,或者在6-198451号的日本专利申请的说明书和附图中。
此外,来自逆矢量量化器212的包络线数据、来自输入端204的音调数据和来自输入端205的V/UV确定数据提供到噪声合成电路216,用于对清音部分(V)附加噪声。这一噪声合成电路216输出的数据经过一加权叠加的加法器电路217提供到加法器218。这种方式基于如下的事实。当利用正弦波分析形成清音音频的激励时作为输入提供到LPC合成滤波器,由于代音调声音例如人的声音引起鼻堵塞的感觉或者如果由清音向浊音变化时声音的质量急剧地变化会引起不自然的声音的感觉。为此,将LPC余数信号中的清音部分叠加噪声,根据音频编码数据例如音调、频谱包络线幅值,在一帧内的最大幅值、余数信号电平等的各种参数都予以考虑。
来自加法器218的输出提供到LPC合成虑波器214中的清音部分音频合成滤波器236,用以通过LPC合成处理成为时间波形数据,再提供到清音部分音频后置滤波器238,以便在提供到加法器239之间对其进行滤波处理。
接着,向图6中的输入端207s和207g提供UV数据,即分别来自图3中的输出端107s和107g的形状索引和增益索引,以及该数据提供到浊音部分音频合成功能块220。来自连接端207s的形状索引提供到浊音部分合成功能块220中的噪声码本221,来自连接端207g的增益索引提供到增益电路222。由噪声码本221读出的有代表性的数值输出是一与浊音部分的LPC余数相对应的噪声信号部分;其用作在增益电路222中的预定增益数值并提供到窗口电路223,以便对其进行窗口处理,用以平滑与清音部分的连接部分。
来自窗口电路223的输出作为来自浊音部分音频合成功能块220的输出提供到LPC合成滤波器214中的浊音部分音频合成滤波器237。在合成滤波器237中,进行LPC合成处理,以便得到浊音部分的时间波形数据,在其提供到加法器239之前,在浊音部分音频后置滤波器238u中对其进行滤波处理。
在加法器239中,将来自清音部分音频后置滤波器238v的清音部分的时间波形信号叠加到来自浊音部分音频后置滤波器238u的浊音部分的时间波形数据上,用以由输出端201输出。
利用D/A变换器18将来自输出端201的音频解码输出变换为模拟音频信号,作为声音由扬声器19输出。
图7和图8是表示利用上述移动电话装置执行的音调编码方法和音频解码步骤。
即,利用移动电话装置中的编码装置实施音频编码方法包含:步骤S1,用于对输入音频信号编码;步骤S2,用于由根据步骤S1的多个音频编码参数中选择按听觉为重要的位组以及根据这一位组计算CRC检验代码;以及步骤S3,用于对在步骤S2中得到的CRC检验代码和该重要位组进行卷积编码。
此外,利用移动电话装置中的解码装置实行音频解码方法包含:步骤S11,用于对来自另一移动电话装置的经卷积编码的输出实行卷积解码;步骤S12,用于利用叠加到根据步骤S11的经卷积解码的输出的CRC检验代码实行CRC错误校验;步骤S13,用于确定CRC代码是否有错误,如果在步骤S13检测到有错误,控制进行步骤S14,用于实行不良帧屏蔽处理,以及步骤S15,用于实行音频解码。
因此,在采用本发明的编码方法和装置的移动电话装置中,按照该在发射侧传输通路编码器4和编码器3,可以输出能抑制产生传输通路信息错误的编码数据。
此外,在采用根据本发明的解码方法和装置的移动电话装置中,按照该传输通路解码器和音频解码器,可以对音频信号解码,其中抑制了由于传输通路信息错误引起的质量下降。
根据本发明的编码方法和装置可以输出能抑制产生传输通路信息错误的编码数据。
此外,根据本发明的解码方法和装置可以对音频信号解码,其中抑制了由于传输通路信息错误引起的质量下降。

Claims (13)

1.一种编码方法,包含:
音频编码步骤,用于沿时间轴将输入的音频信号分成预定的编码单位,并对每个所述编码单位进行编码以便输出多种类型的音频编码的参数;
错误检测代码建立步骤,用于由根据所述音频编码步骤产生的所述多种类型的音频编码的参数选择对听觉为重要的一些位,以及根据所述重要的位组建立错误检验代码;以及
卷积编码步骤,用于对根据所述错误校验代码建立步骤产生的所述错误校验代码和所述重要的位组进行卷积编码。
2.如权利要求1所述的编码方法,其中所述音频编码步骤包含:
短期预测余数计算步骤,用于得到所述输入音频信号的短期预测余数;
正弦波分析编码步骤,用于对得到的所述短期预测余数实行正弦波分析编码;以及
波形编码步骤,用于利用波形编码对所述输入的音频信号进行编码。
3.如权利要求2所述的编码方法,其中所述错误校验代码产生步骤选择如下部分作为所述重要的位:当在所述短期预测余数计算步骤中得到所述短期预测余数时建立的参数中的某些或者全部;所述正弦波分析编码步骤的编码输出中的某些或者全部;根据所述波形编码步骤的编码输出中的某些或者全部;以及根据所述重要的位建立错误校验代码。
4.如权利要求2所述的编码方法,其中所述错误校验代码建立步骤选择如下部分作为所述重要的位:当利用所述短期预测余数计算步骤得到所述短期预测余数时建立的线性频谱成对参数中的某些或者全部;全部清音/浊音确定参数;某些或全部音调参数;作为根据所述正弦波分析编码步骤的编码输出的短期预测余数信号的频谱包络线增益参数中的某些或者全部;作为所述短期预测余数的经波形编码的输出的噪声码本增益参数中的某些或者全部;以及根据所述重要的位建立错误校验代码。
5.如权利要求3所述的方法,利用所述短期余数计算步骤以便得到短期预测余数而建立的所述各参数是构成所述输入的音频信号的频谱的轮廊的线性频谱成对参数;所述正弦波分析编码步骤的所述编码输出包含:表明所述输入音频信号是清音部分还是浊音部分音频的清音/浊音确定参数,以及如果所述输入音频信号为清音部分时的音调参数,以及表示所述短期预测编码的余数信号的频谱包络线的频谱码本索引和增益索引;以及当所述输入音频信号为浊音部分时所述波形编码步骤的所述编码输出是基于短期余数的噪声码本索引和增益索引。
6.如权利要求1所述的编码方法,其中所述音频编码步骤对于所述输入音频信号实行按2/4千位/秒的音频编码。
7.一种编码装置,包含:
音频编码装置,用于沿时间轴将输入音频信号分成预定的编码单位以及对每个编码单位进行编码以便输出多种类型的音频编码的参数;
错误校验代码建立装置,用于根据来自所述音频编码装置的所述多种类型的音频编码参数选择对于听觉为重要的位,以及根据所述重要的位建立错误校验代码,以及
卷积编码装置,用于对来自所述错误校验代码建立装置的所述错误校验代码和所述重要位实行卷积编码。
8.一种解码方法,用于对由输入的音频信号得到的编码数据进行解码,该已编码的输入音频信号已沿时间被分成预定的单位,以便得到多种类型的音频编码的参数,根据这些参数采用对于听觉为重要的位以便建立错误校验代码;其中对所述错误校验代码和所述重要位已进行卷积编码以得到编码输出,这些编码输出已和非重要位相结合用以发射传输,所述解码方法包含:
卷积解码步骤,用于对所述经卷积编码的输出进行卷积解码,以便由附加有所述错误校验代码的所述重要位和所述非重要位得到解码的输出;
错误校验步骤,用于利用根据所述卷积步骤得到的附加到所述卷积解码的输出上的所述校验代码校验传输错误;
输出调节步骤,用于根据在所述错误校验步骤中的所述错误校验结果调节所述经卷积解码的输出;以及
音频解码步骤,用于对根据所述输出调节步骤得到的所述经卷积解码的输出实行音频解码处理。
9.如权利要求8中所述的方法,其中所述校验步骤选择如下部分作为所述重要的位:当利用所述短期预测余数计算步骤得到所述短期预测余数时建立的线性频谱成对参数中的某些或者全部;所有清音/浊音确定参数;某些或全部音调数据;作为根据所述正弦波分析编码步骤的编码输出的短期预测余数的频谱包络线增益参数中的某些或全部;以及作为所述短期预测余数的波形编码输出的噪声码本增益参数中的某些或者全部,并且利用根据所述卷积编码的输出得到的所述重要位和所述错误校验代码建立的错误校验代码,以便检测传输错误。
10.如权利要求8所述的方法,如果在所述错误校验步骤中检测到错误,所述输出调节步骤输出通过内插处理得到的内插数据取代所述经卷积解码的输出。
11.如权利要求8所述的解码方法,其中所述输出调节步骤根据所述错误校验的结果对所述经卷积解码的输出实行不良帧屏蔽处理。
12.如权利要求8所述的解码方法,其中所述编码数据是通过按照2/4 4位/秒对所述输入音频信号实行音频编码得到的。
13.一种解码装置,用于对由已沿时间轴分成预定单位的已编码的输入音频信号得到的编码数据进行解码,以便得到多种类型的音频编码参数,根据该参数已利用重要的位建立错误校验代码,其中所述错误校验代码和所述重要的位已卷积得到编码输出,该输出已与非重要位结合用以传输,所述解码装置包含:
卷积解码装置,用于对所述经卷积编码的输出实行卷积解码,以便由附加有所述错误校验代码的所述重要位和所述非重要位得到解码的输出;
错误校验和输出调节装置,用于利用附加到来自所述卷积解码装置的所述卷积解码的输出上的所述错误校验代码校验传输错误以及根据所述错误校验的结果调节所述经卷积解码的输出;以及
音频解码装置,用于对来自所述错误校验和输出调节装置的所述经卷积解码的输出实行音频解码。
CNB98113100XA 1997-10-17 1998-10-17 编码方法和装置以及解码方法和装置 Expired - Fee Related CN1154283C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP9285903A JPH11122120A (ja) 1997-10-17 1997-10-17 符号化方法及び装置、並びに復号化方法及び装置
JP285903/97 1997-10-17
JP285903/1997 1997-10-17

Publications (2)

Publication Number Publication Date
CN1221169A true CN1221169A (zh) 1999-06-30
CN1154283C CN1154283C (zh) 2004-06-16

Family

ID=17697519

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB98113100XA Expired - Fee Related CN1154283C (zh) 1997-10-17 1998-10-17 编码方法和装置以及解码方法和装置

Country Status (5)

Country Link
US (1) US6230124B1 (zh)
EP (1) EP0910066A3 (zh)
JP (1) JPH11122120A (zh)
KR (1) KR19990037152A (zh)
CN (1) CN1154283C (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102624521A (zh) * 2004-09-30 2012-08-01 Jvc建伍株式会社 扰频器、扰频处理方法以及程序
CN101874266B (zh) * 2007-10-15 2012-11-28 Lg电子株式会社 用于处理信号的方法和装置
WO2012163099A1 (zh) * 2011-05-27 2012-12-06 华为技术有限公司 语音信号处理方法、装置和接入网***
CN110998244A (zh) * 2018-05-11 2020-04-10 株式会社三共制作所 角度检测器

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6681203B1 (en) * 1999-02-26 2004-01-20 Lucent Technologies Inc. Coupled error code protection for multi-mode vocoders
JP4218134B2 (ja) * 1999-06-17 2009-02-04 ソニー株式会社 復号装置及び方法、並びにプログラム提供媒体
US7110947B2 (en) * 1999-12-10 2006-09-19 At&T Corp. Frame erasure concealment technique for a bitstream-based feature extractor
US20010041981A1 (en) * 2000-02-22 2001-11-15 Erik Ekudden Partial redundancy encoding of speech
FI115178B (fi) * 2000-10-31 2005-03-15 Nokia Corp Menetelmä ja järjestely bittien suojaamiseksi parhaalla mahdollisella tavalla tiedonsiirtovirheitä vastaan
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
KR100440055B1 (ko) * 2002-05-02 2004-07-14 엘지전자 주식회사 보코더 및 그 보코더를 이용한 비트 오류율 시험 방법
US7321559B2 (en) * 2002-06-28 2008-01-22 Lucent Technologies Inc System and method of noise reduction in receiving wireless transmission of packetized audio signals
US7047475B2 (en) * 2003-02-04 2006-05-16 Hewlett-Packard Development Company, L.P. CRC encoding scheme for conveying status information
US8359197B2 (en) * 2003-04-01 2013-01-22 Digital Voice Systems, Inc. Half-rate vocoder
KR20060005368A (ko) * 2003-04-17 2006-01-17 톰슨 라이센싱 데이터 문자열을 디코딩하는 방법
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US20110026581A1 (en) * 2007-10-16 2011-02-03 Nokia Corporation Scalable Coding with Partial Eror Protection
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
BR112014009647B1 (pt) * 2011-10-24 2021-11-03 Koninklijke Philips N.V. Aparelho de atenuação do ruído e método de atenuação do ruído
BR112016008662B1 (pt) * 2013-10-18 2022-06-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Método, decodificador e codificador para codificação e decodificação de um sinal de áudio utilizando informação de modulação espectral relacionada com a fala
BR112016008544B1 (pt) * 2013-10-18 2021-12-21 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador para codificar e decodificador para decodificar um sinal de áudio, método para codificar e método para decodificar um sinal de áudio.

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5073940A (en) * 1989-11-24 1991-12-17 General Electric Company Method for protecting multi-pulse coders from fading and random pattern bit errors
US5371853A (en) * 1991-10-28 1994-12-06 University Of Maryland At College Park Method and system for CELP speech coding and codebook for use therewith
US5255343A (en) * 1992-06-26 1993-10-19 Northern Telecom Limited Method for detecting and masking bad frames in coded speech signals
JP3343965B2 (ja) * 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
JPH1091194A (ja) * 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102624521B (zh) * 2004-09-30 2015-11-18 Jvc建伍株式会社 发送装置
CN102624521A (zh) * 2004-09-30 2012-08-01 Jvc建伍株式会社 扰频器、扰频处理方法以及程序
US8781843B2 (en) 2007-10-15 2014-07-15 Intellectual Discovery Co., Ltd. Method and an apparatus for processing speech, audio, and speech/audio signal using mode information
CN101874266B (zh) * 2007-10-15 2012-11-28 Lg电子株式会社 用于处理信号的方法和装置
US8566107B2 (en) 2007-10-15 2013-10-22 Lg Electronics Inc. Multi-mode method and an apparatus for processing a signal
CN102907030A (zh) * 2011-05-27 2013-01-30 华为技术有限公司 语音信号处理方法、装置和接入网***
CN103782518A (zh) * 2011-05-27 2014-05-07 华为技术有限公司 语音信号处理方法、装置和接入网***
RU2543944C1 (ru) * 2011-05-27 2015-03-10 Хуавэй Текнолоджиз Ко., Лтд. Способ, устройство и система сети доступа для обработки речевых сигналов
US9171540B2 (en) 2011-05-27 2015-10-27 Huawei Technologies Co., Ltd. Method, apparatus, and access network system for speech signal processing
US9177548B2 (en) 2011-05-27 2015-11-03 Huawei Technologies Co., Ltd. Method, apparatus, and access network system for speech signal processing
WO2012163099A1 (zh) * 2011-05-27 2012-12-06 华为技术有限公司 语音信号处理方法、装置和接入网***
CN103782518B (zh) * 2011-05-27 2017-02-22 华为技术有限公司 语音信号处理方法、装置和接入网***
CN110998244A (zh) * 2018-05-11 2020-04-10 株式会社三共制作所 角度检测器
CN110998244B (zh) * 2018-05-11 2022-06-17 株式会社三共制作所 角度检测器

Also Published As

Publication number Publication date
KR19990037152A (ko) 1999-05-25
JPH11122120A (ja) 1999-04-30
EP0910066A2 (en) 1999-04-21
CN1154283C (zh) 2004-06-16
EP0910066A3 (en) 2000-03-29
US6230124B1 (en) 2001-05-08

Similar Documents

Publication Publication Date Title
CN1154283C (zh) 编码方法和装置以及解码方法和装置
CN1123866C (zh) 一种语音编/解码方法和装置
CN1143265C (zh) 具有改进的语音编码器的传输***
CN1192356C (zh) 解码方法和包括自适应后置滤波器的***
CN1218295C (zh) 语音解码中语音帧差错隐蔽的方法和***
CN1266673C (zh) 可伸缩音频编码的有效改进
JP4218134B2 (ja) 復号装置及び方法、並びにプログラム提供媒体
CN1223989C (zh) 可变速率语音编码器中的帧擦除补偿法及用该方法的装置
CN1153399C (zh) 用于提高当前语音帧质量的方法和无线***
CN1291374C (zh) 用于语音解码器中帧差错隐藏的改善的谱参数代替的方法和设备
CN1121683C (zh) 语音编码
US7840402B2 (en) Audio encoding device, audio decoding device, and method thereof
CN1302459C (zh) 用于编码和解码非话音语音的方法和设备
CN1486554A (zh) 可变速率接收机中速率误差检测的改进方法和设备
CN101061535A (zh) 用于人工扩展语音信号的带宽的方法和装置
CN1265217A (zh) 在语音通信***中语音增强的方法和装置
CN103928029B (zh) 音频信号编码和解码方法、音频信号编码和解码装置
CN1432176A (zh) 用于预测量化有声语音的方法和设备
CN1167048C (zh) 语音编码设备和语音解码设备
CN101080767A (zh) 用于低比特率语音编码的方法和装置
CN1161750C (zh) 语音编码译码方法和装置、电话装置、音调变换方法和介质
US20200227061A1 (en) Signal codec device and method in communication system
CN1200404C (zh) 具有脉冲序列约束的码激励线性预测语音编码器译码器
CN1145925C (zh) 具有改进语音编码器和解码器的发射机
CN1313983A (zh) 噪声信号编码装置及语音信号编码装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee