CN1235190C - 改善音频信号编码效率的方法 - Google Patents

改善音频信号编码效率的方法 Download PDF

Info

Publication number
CN1235190C
CN1235190C CNB008124884A CN00812488A CN1235190C CN 1235190 C CN1235190 C CN 1235190C CN B008124884 A CNB008124884 A CN B008124884A CN 00812488 A CN00812488 A CN 00812488A CN 1235190 C CN1235190 C CN 1235190C
Authority
CN
China
Prior art keywords
signal
pitch
sound signal
information
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB008124884A
Other languages
English (en)
Other versions
CN1372683A (zh
Inventor
J·奥延佩雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Origin Asset Group Co., Ltd.
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of CN1372683A publication Critical patent/CN1372683A/zh
Application granted granted Critical
Publication of CN1235190C publication Critical patent/CN1235190C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

本发明涉及用于改善音频信号的编码精度以及传输效率的方法。依据本发明,将要编码的音频信号的一部分与该音频信号在先存储的采样进行比较,确定出与所述音频信号最相符的采样基准序列。通过长期预测,使用至少两种不同的LTP阶(M),以及用于每种间距预测阶的一组间距预测系数(b(K)),从该基准序列中产生出预测信号。将对预测信号进行编码所需的信息量与对原始信号进行编码所需的信息量进行比较,并选取能最好地表示音频信号,同时能使所需数据量最小的一种编码方法。

Description

改善音频信号编码效率的方法
技术领域
本发明涉及一种用于对音频信号进行编码的方法,用于改善音频信号的编码效率。本发明还涉及一种包含用于对音频信号进行编码的的装置的数据传输***、涉及一种用于对音频信号进行编码的编码器、涉及一种用于对已编码音频信号进行解码的解码器、并涉及一种用于对已编码音频信号进行解码的解码方法。
背景技术
一般来说,音频编码***从诸如象语音信号这样的一种模拟音频信号中产生出编码信号。通常,借助于专用于某种数据传输***的数据传输方法,将编码信号传送到一个接收机。在接收机中,音频信号的产生是以编码信号为基础的。将要传输的信息量例如受对***内的信息进行编码所用的带宽的影响,同时还受执行编码的编码效率的影响。
为了编码,例如以0.125ms的固定的时间间隔,从模拟信号中产生出数字采样。通常,是以固定大小的组,例如是以具有大约20ms的间隔的组为单位来处理这些采样的。这样一组一组的采样也被称作“帧”。一般来说,帧是处理音频数据的基本单位。
音频编码***的目的在于:产生在可用带宽内尽可能好的一种音质。为此,可以利用音频信号内,特别是语音信号内出现的周期性。语音的周期性例如是源于声带的振动。通常,振动的周期处于2ms到20ms的级别内。在已有技术的众多语音编码器中,使用了已知的一种长期预测(LTP)的技术,其目的是估计并利用这种周期性,以提高编码处理的效率。这样,在编码期间,将编码信号的所述部分(帧)与该信号的在先编码部分相比较。如果一个相似的信号位于在先编码部分,则检验该相似编码与将要编码的信号之间的时间延迟(滞后)。以该相似信号为基础,构成表示将要编码的信号的一个预测信号。另外,还产生了一个误差信号,它表示预测信号和将要编码的信号之间的差异。这样,非常方便地执行了编码,使得只传送滞后信息和误差信号。在接收机内,从存储器中检索出正确采样,用于对将要编码的信号部分进行预测,并基于滞后,与误差信号进行组合。在算术上,这种节距预测器可被看作执行了一种滤波操作,它可以由以下传输函数来表示:P(z)=βz
上述等式表示一阶节距预测器的传输函数。β是节距预测器的系数,α是周期性的延迟。在更高阶的节距预测滤波器的情况下,有可能使用更一般的传输函数:
P ( z ) = Σ k = - m 1 m 22 β kZ - ( z + k )
其目的是以这样一种方式,为每一帧选取系数βk,使得编码误差,即实际信号与利用在先采样构成的信号之间的差异,尽可能地小。能非常方便地选出编码时所使用的这些系数,这些系数使得在使用最小二乘法时,可以获取最小误差。能非常方便地一帧一帧地更新这些系数。
美国专利No.5,528,629公开了一种已有的语音编码***,它采用了短期预测(STP),同时还有一阶长期预测。
已有的编码器具有这样一种缺陷:没有注意到音频信号的频率与其周期性之间的关系。这样,不能在所有状态下,有效利用信号的周期性,从而编码信息量变得不必要地长,或接收机中所重建的音频信号的音质恶化。
在某些情况下,例如,当音频信号具有高度的周期特性,并很少随时间变化时,单独的滞后信息就可提供一个良好的主要部分,用于信号预测。在这种情况下,没有必要使用高阶节距预测器。在某些其它情况下,也存在相反的情形。滞后不必是采样间隔的整数倍。例如,滞后可以位于音频信号的两个连续采样之间。在这种情况下,高阶节距预测器可以有效地内插在多个离散采样时间之间,以提供对信号的更精确的表示。另外,作为频率的函数,高阶节距预测器的频率响应趋于减小。这意味着:高阶节距预测器为音频信号内的低频分量提供了较好的模型。在语音编码中,由于与高频分量相比,低频分量对语音信号的可觉察的品质具有更重要的影响,因而上述高阶节距预测器是一种优势。因此,应当理解,非常需要的是能依据信号的演化,而改变用于预测音频信号的节距预测器的阶数。采用固定阶的节距预测器在某些情况下过于复杂,同时也不能充分模拟其它情况下的音频信号。
发明内容
本发明的一个目的是在数据传输***内实现一种方法,用于改善音频信号的编码精度和传输效率,与已有技术的方法相比,在本发明中,音频信号被编码到一个更高的精度,并以更高的效率被传输。在依据本发明的编码器中,其目的是尽可能精确地对将要编码的音频信号一帧一帧地预测,同时,确保所要传输的信息量保持为低。
根据本发明的一个方面,提供了一种用于对音频信号进行编码的方法,其特征在于至少执行以下步骤:检验将要编码的音频信号的一部分,以便发现与将要编码的音频信号的所述部分基本相符的音频信号的另一部分;以音频信号的基本相符部分为基础,利用一组节距预测器的阶,产生一组预测信号;为至少一个所述预测信号,确定一个编码效率,以及利用所确定的编码效率,为将要编码的音频信号的所述部分选取一种编码方法。
根据本发明的另一个方面,提供了一种包含对音频信号进行编码的装置的数据传输***,其特征在于所述数据传输***还包括:用于检验将要编码的音频信号的一部分,以发现与将要编码的音频信号的所述部分基本相符的所述音频信号的另一部分的装置;以与所述音频信号的所述基本相符部分为基础,使用一组预测编码器的阶,来产生一组预测信号的装置;为至少一个所述预测信号,确定一个编码效率的装置;使用所确定的编码效率,为将要编码的音频信号的所述部分选取一种编码方法的装置;以及用于发送编码音频信号的装置。
根据本发明的另一个方面,提供了一种包括对音频信号进行编码的装置的编码器,其特征在于所述编码器包括:用于检验将要编码的音频信号的一部分,以发现与将要编码的音频信号的所述部分基本相符的所述音频信号的另一部分的装置;以所述音频信号的所述基本相符部分为基础,利用一组节距预测器的阶,来产生一组预测信号的装置;为至少一个所述预测信号确定一个编码效率的装置;以及利用所确定的编码效率,为将要编码的音频信号的所述部分,选取一种编码方法的装置。
根据本发明的另一个方面,提供了一种用于对编码的音频信号进行解码的解码器,其特征在于所述解码器包括:——用于为将要解码的音频信号确定编码方法的装置,该装置包括:依据所述编码方法信息,检验所接收到的信息是否是依据原始音频信号而形成的的装置;以及检验编码相位中所用的节距预测器的阶数的装置,以及——用于依据所确定的编码方法,对所述音频信号进行解码的装置,该装置包括:用于接收与一个预测信号相关的信息的装置;通过利用依据音频信号自身而形成的编码信息,对信号进行解码的装置;用于选择解码该信号的节距预测器的阶数的装置;以及通过依据所选的节距预测器的阶数(M)而执行一个预测,从而对所述信号进行解码的装置。
根据本发明的另一个方面,提供了一种用于对编码的音频信号行解码的方法,其特征在于:所述方法包括:依据编码方法信息,检验所接收到的信息是否是依据原始音频信号形成的步骤,其中对所述信号的解码,利用了依据音频信号自身而形成的编码信息,否则,检验编码相位内使用的节距预测器的阶数(M),并依据该节距预测阶数执行一个预测,以重现该音频信号。
与已有的解决方案相比,本发明具有相当大的优势。与已有技术的方法相比,依据本发明的方法使得能更有效地对音频信号进行编码,同时确保表示编码信号所需的信息量保持为低。与已有技术的方法相比,本发明还允许以更灵活的方式来执行对音频信号的编码。可以以这样一种方式实现本发明,该方式特别考虑了对音频信号进行预测的精度(质量上最高),特别考虑了减少表达编码音频信号所需的信息量(数量最少),或交替使用这两种方法。使用依据本发明的方法,有可能更好地考虑存在于音频信号内的不同频率的周期性。
附图说明
以下,将参照附图,详细说明本发明,其中:
图1显示了依据本发明一个最佳实施例的一种编码器,
图2显示了依据本发明一个最佳实施例的一种解码器,
图3是一种简化框图,该图显示了依据本发明一个最佳实施例的一种方法,
图4是一个流程图,它显示了依据本发明一个最佳实施例的一种方法,以及
图5a和5b是由依据本发明一个最佳实施例的编码器所产生的数据传输帧的例子。
具体实施方式
图1是一个简化框图,它显示了依据本发明一个最佳实施例的编码器1。图4是一个流程图400,它说明了依据本发明的方法。编码器1例如可以是无线通信设备2(图3)的语音编码器,用于将音频信号转换为将要在数据传输***中传送的编码信号,这种数据传输***例如可以是移动通信网或互联网。这样,就可以非常方便地将解码器33安装在移动通信网的基站内。与此相对应,如果需要,可以在模拟-数字转换器4内,将模拟音频信号,例如是由麦克风29产生并在音频单元30内放大的一个信号,转换为数字信号。转换精度例如为8或12比特,连续采样之间的间隔(时间分辨率)例如是0.125ms。很明显,本说明书中所出现的数值仅仅是用于说明本发明的例子,并不能限制本发明。
所获得的来自音频信号的采样,被存储在采样缓冲器(未示出)中,可以用这样一种已知方式来实现存储,例如可以存储在无线通信设备2的存储装置5中。可以以逐帧为基础,来执行音频信号的编码,这样,预定数目的采样被传送到将要执行编码的编码器1,所述预定数目的采样例如可以是20ms的时间段(=160个采样,假定连续采样之间的时间间隔为0.125ms)内所产生的采样。将要编码的一帧的采样被很方便地传送到变换单元6,在该单元内,例如可以借助于一种改进的离散余弦变换(MDCT),将音频信号从时域变换到一个变换域(频域)。变换单元6的输出提供了一组值,这些值表示被变换信号在频域内的特性。在图4的流程图中,由方框404表示这种变换。
将时域信号变换到频域的另一种实现手段,是由几个带通滤波器组成的滤波器组。每一个滤波的通带相当窄,其中,这些滤波器输出端上的信号幅度表示所要变换的信号的频谱。
滞后单元7确定:在指定时刻,哪个在先采样序列与将要编码的帧最匹配(方框402)。很方便以这样一种方式来实现这一级的滞后的确定,滞后单元7将存储在基准缓冲器8内的值与将要编码的帧的采样进行比较,并利用例如可以是最小二乘法,来计算将要编码的帧的采样与基准缓冲器内存储的相应的采样序列之间的误差。最好是,选择由连续采样构成、并具有最小误差的采样序列,作为采样的基准序列。
当滞后单元7从所存储的采样中选出采样的基准序列时(方框403),滞后单元7将与之有关的信息传送到系数计算单元9,以便对节距预测系数进行估计。这样,在系数计算单元9中,就以采样基准序列内的采样为基准,对不同的节距预测器的阶,例如是1,3,5和7,计算节距预测系数b(k)。之后,所计算出的系数b(k)被传送到节距预测单元10。在图4的流程图中,这些阶段被显示在方框405-411内。很明显,这里所出现的阶数仅仅是举例,用于说明本发明,而不是限制本发明,可实施的阶数也可以与本文中所出现的四种阶数完全不同。
在计算出节距预测系数之后,对其进行量化,这样就获得了经量化的节距预测系数。最好以这样一种方式对节距预测系数进行量化,使得在无误差数据传输条件下,接收机解码器33内所产生的重建信号尽可能地接近原始信号。在对节距预测系数进行量化时,使用最高分辨率(可能是最小的量化阶距)是非常有利的,以便能使舍入误差最小。
在采样基准序列内的存储采样被传送到节距预测单元10,在该单元中,利用所计算出的、并经量化的节距预测系数b(k),为每一个节距预测阶数产生了一个预测信号。每一个预测信号代表对将要编码的信号的预测,它是利用所讨论的节距预测阶数而估计出的。在发明的当前最佳实施例中,预测信号还被传送到第二变换单元11,在该第二变换单元内,这些数据被变换到频域。第二变换单元11利用两个或更多不同的阶,来执行变换,其中,产生了与利用不同的节距预测阶数而预测出的信号相应的成组的变换值。可以以这样一种方式来实现节距预测单元10以及第二变换单元11,使得它们对每个节距预测阶执行必要的操作,或者是,对每一阶,实现单独的一个节距预测单元10和单独的一个第二变换单元11。
在计算单元12中,将预测信号经频域变换后的值,与所得到的来自变换单元6的、将要编码的音频信号经频域变换后的表示法进行比较。通过获取将要编码的音频信号频谱与利用节距预测器所预测出的信号频谱之间的差异,而计算出一个预测误差信号。非常有利的是,预测误差信号包括一组预测误差值,该组预测误差值与将要编码的信号频率分量和预测信号的频率分量之间的差相对应。例如可以用音频信号的频谱与预测信号的频谱之间的平均差来表示的编码误差,也被计算出来。最好是,利用最小二乘法来计算编码误差。可以使用任何其它合适的方法,包括以音频信号的心理声学模型为基础的方法,来确定能最好地表达将要编码的音频信号的预测信号。
在单元12中,还对编码效率度量(预测增益)进行了计算,以便确定将要传送给传输信道的信息(方框413)。其目的是使所需传送的信息量(比特)最小(数量最小),同时也使信号内的失真最小(质量最高)。
为了能以存储在接收设备内的预先采样为基础,在接收机内重建信号,必须向接收机传送与阶、滞后相关的信息、与预测误差相关的信息,例如是用于所选阶的、经量化的节距预测系数。非常有利的是,编码效率度量指出:是否有可能利用比传送与原始信号有关的信息更少数目的比特,来传送对在节距预测单元10中经过编码的信号进行解码所需的信息。例如,可以以这样一种方式来实现这种判定,使得如果解码所必需的信息是利用特定的节距预测器来产生的,则第一基准值被定义为表示将要传送的信息量。另外,如果解码所必需的信息是以原始音频信号为基础形成的,则将第二基准值定义为表示所要传送的信息量。编码效率度量刚好是第二基准值与第一基准值的比值。表达预测信号所需的比特数目,例如可以取决于节距预测器的阶数(即将要传送的系数的数目)、每个系数所表示的(被量化的)精度、还有与预测信号相关的误差信息的量和精度。另一方面,传送与原始音频信号相关的信息所需的比特数目,例如可以取决于音频信号在频域内的精度。
如果以这种方式所确定的编码效率大于壹,则表示可以利用比与原始信号相关的信息少的比特数,来传送对预测信号进行解码所必需的信息。在计算单元12中,对于这两种不同选择的传送,确定它们所需的比特数目,并选出所需比特数目较小的那个方案(方框414)。
依据本发明的第一实施例,选择用于获取最小编码误差的节距预测器的阶,对音频信号进行编码(方框412)。如果用于所选节距预测器的编码效率度量大于壹,则选择与预测信号相关的信息,用于传输。如果编码效率信息不大于壹,则将要传送的信息是依据原始音频信号构成的。依据本发明的这个实施例,重点在于使预测误差最小(品质最高)。
依据本发明的第二个有益的实施例,为每一个节距预测器的阶,计算其编码效率度量。从那些编码效率度量大于壹的阶中,选取一个能提供最小编码误差的节距预测器的阶,用于对音频信号进行编码。如果没有一个预测编码器的阶能够提供一个预测增益(即没有编码效率度量大于壹),则可以依据原始音频信号,而形成将要传送的信息。本发明的这一实施例使得在预测误差和编码效率之间进行了折中。
依据本发明的第三实施例,为每个节距预测器的阶,计算编码效率度量,从那些其编码效率度量大于壹的阶中,选出能提供最大编码效率的阶,对音频信号进行编码。如果没有一个节距预测器的阶能提供一个预测增益(即没有一个编码效率度量大于壹),则所要传送的信息的构成,是以原始音频信号为基础的。这样,本发明的这个实施例的着眼点在于,使编码效率最高(数量最小)。
依据本发明的第四实施例,为每个节距预测器的阶,计算编码效率度量,选出能提供最大编码效率的阶,对音频信号进行编码,即便是没有编码效率大于壹。
对编码误差的计算以及与节距预测器的阶的选择是在每帧之间的间隙执行的,并且,最好是为每一帧分别执行上述操作,其中,在不同的帧内,有可能使用与指定时间处的音频信号特性最相符的节距预测阶数。
如上所述,如果在单元12内所确定的编码效率不大于壹,这表示传送原始信号的频谱非常有利,其中,将要传送到数据传输信道的位串501是以下述方式构成的(方框415)。在来自计算单元12的、与所选传输相关的信息被传送到选择单元13(图1中的线D1和D4)。在选择单元13中,经频域变换的表示原始音频信号的值被选出,传送到量化单元14。对于将原始音频信号经过频域变换后的值传送到量化单元14这一过程,是由图1的框图中的线A1所表示的。在量化单元14中,以所述方式对经过频域变换的信号值进行量化。量化值被传送到多路复用单元15,在该单元中,形成了将要降送的位串。图5a和5b显示了一种位串结构的一个例子,它可以有利地应用于本发明。与所选编码方法相关的信息,被从计算单元12传送到多路复用单元15(线D1和D3),在这里,位串是依据传输选择而形成的。第一逻辑值,例如是逻辑0状态,被用作编码方法信息502,以指明表示原始音频信号的经过频域变换后的值是以所讨论的位串的形式传送的。除了编码方法信息502外,这些值本身也以被量化到指定精度的位串的形式进行传输。在图5a中,将用于传送这些值的字段标以参考号503。每个位串中所传送的值的数量,取决于采样频率,以及在一个时刻所检验到的帧的长度。在这种情况下,由于在接收机内,是依据位串501中所传送的原始音频信号的频域内的值,来重建信号的,因此,不传送节距预测器的阶信息、节距预测系数、滞后以及误差信息。
如果编码效率大于壹,则可以很方便是使用所选的节距预测器,对音频信号执行编码,并可以以下述方式(方框416),形成将要传送到数据传输信道的位串501(图5b)。与所选传输选择相关的信息,被从计算单元12传送到选择单元13。这一过程,是由图1的方框中的线D1和D4来表示的。在选择单元13中,选取经量化的节距预测系数,将其传送到多路复用单元15。这一过程由图1框图内的线B1来表示。很明显,也可以不通过选择单元13,而使用另一条路径,将节距预测系数传送到多路复用单元15。将要传送的位串是在多路复用单元15内形成的。与所选编码方法有关的信息,被从计算单元12传送到多路复用单元15(线D1和D3),其中,是依据传输选择而形成位串的。第二逻辑值,例如是逻辑1状态,被用作编码方法信息502,以表明是以所讨论的位串的形式,传送所述经量化的节距预测系数的。依据所选节距预测阶数,来设定一个阶字段504的比特。如果,有可能有4个不同的阶,则2比特(00,01,10,11)足以表明:在指定时间,选择了哪一阶。另外,以位串的形式,将有关滞后的信息传送到滞后字段505内。在这个最佳实施例中,使用了11比特来表示滞后,但很明显,也可以使用本发明范围内的其它长度。经量化的节距预测系数被添加到系数字段506内的位串中。如果所选的节距预测器的阶为1,则只传送1个系数,如果阶为3,则传送3个系数等等。在不同的实施方案中,也可以改变传输系数时所使用的比特数。在一个有利的实施例中,一阶系数是用3比特来表示的,3阶系数是由总计5比特来表示的,5阶系数是用总计9比特来表示的,而7阶系数是由10比特来表示的。一般来说,可以这样认为,所选的阶越高,则传送经量化的节距预测系数所需的比特数越多。
除了前述信息之外,当基于所选节距预测器,对音频信号进行编码时,必须传送误差字段507内的预测误差信息。这个预测误差信息是在计算单元12内作为一个差信号而产生的,该差信号表示了将要编码的音频信号的频谱与可被解码(即重建)的信号频谱之间的差,其中所述解码,利用了所选的节距预测器的经量化的节距预测系数,同时还利用了采样的基准序列。这样,误差信号例如可以经由第一选择单元13,被传送到量化单元14,接受量化。经量化的误差信号,被从量化单元14传送到多路复用单元15,其中量化预测误差值被添加到位串的误差字段507。
依据本发明的编码器1还包括本机解码功能。经编码的音频信号,被从量化单元14传送到反量化单元17。如上所述,在编码效率不大于1的情况下,音频信号由其量化频谱值来表示。在这种情况下,量化频谱值被传送到反量化单元17,在该单元中,以所述的已知方式,对这些值去量化,使得尽可能精确地还原音频信号的原始频谱。所提供的表示原始音频信号的频谱的去量化值,作为一个输出,从单元17输出到求和单元18。
如果编码效率大于1,则以节距预测信息来表示音频信号,这种节距预测信息例如可以是表现为量化频域值的节距预测器的阶信息、量化的节距预测系数、滞后值以及预测误差信息。如上所述,预测误差信息表示将要编码的音频信号频谱与可依据所选节距预测器以及采样的基准序列而重建的音频信号的频谱之间的差异。因此,在这种情况下,包含预测误差信息的量化频域值,被传送到反量化单元17,在该单元中,上述值被去量化,使得尽可能精确地还原预测误差的频域值。这样,单元17的输出包括去量化的预测误差值。这些值被进一步输入到求和单元18,在该单元中,将这些值与利用所选节距预测器预测的信号的频域值相加。以这种方式,就形成了所重建的原始音频信号的频域表示。从计算单元12中,可得到预测信号的频域值,在该计算单元中,联系预测误差的确定,对这些频域值进行计算,并将它们传送到求和单元18,正如图1中的线C1所指示的那样。
根据由计算单元12所提供的控制信息,来选通(接通和断开)求和单元18的操作。允许这一选通操作的控制信息的传输,是由计算单元12和求和单元18之间的连接(图1中的线D1和D2)来指示的。选通操作是必需的,以便考虑由反量化单元17所提供的不同类型的去量化频域值。如上所述,如果编码效率不大于1,则单元17的输出包括表示原始音频信号的去量化频域值。在这种情况下,不再需要求和操作,不再需要在计算单元12内,构建与任何预测音频信号的频域值相关的信息。在这种情况下,来自计算单元12的控制信息禁止求和单元18的操作,表示原始音频信号的去量化频域值通过求和单元18。另一方面,如果编码效率大于1,单元17的输出包含去量化预测误差值。在这种情况下,有必要将去量化预测误差值与预测信号的频谱相加,以便构成一个重建的原始音频信号的频域表示。现在,来自计算单元12的控制信息允许求和单元12执行操作,这使得去量化预测误差值与预测信号的频谱相加。必要控制信息是由编码方法信息提供的,而该编码方法信息是在单元12内,联系对音频信号所采用的编码的选择,而产生的。
在本发明的另一个实施例中,可以在计算预测误差和编码效率值之前进行量化,其中预测误差和编码效率的计算的执行,是利用了表示原始信号和预测信号的量化频域值。量化是在单元6和12以及单元11和12之间的量化单元(未示出)中执行的。在这一实施例中,不需要量化单元14,但在线C1所指使的路径中,需要额外的去量化单元。
求和单元18的输出,是与采样的编码序列(音频信号)相应的经采样的频域数据。在改进的DCT逆变换器19内,进一步将该经采样的频域数据变换到时域,在变换器19内,采样编码序列被传送到将要存储的基准缓冲器8内,并在与对后续帧进行编码的相关之处使用。可以依据所讨论的、获取使用的编码效率需要所必需的采样数目,来选择基准缓冲器8的存储容量,在基准缓冲器8中,最好通过改写缓冲器内最旧的采样,而存储一个新的采样序列,即该缓冲器是一个所谓的环行缓冲器。
编码器1中所形成的位串被传送到发送器16,在该发送器内,同样以已知方式执行调制。调制信号经由数据传输信道3,被传送到接收器,例如可以作为一个射频信号。非常方便的是,可以在对一个指定帧进行的编码结束之后,立即逐帧传送编码音频信号。或者也可以,对音频信号进行编码,并将其存储在发送端的存储器内,在之后的某个时刻进行传送。
在接收设备31中,在接收单元20内,同样以已知方式,对所接收的来自数据传输信道的信号进行解调。对解调数据帧内所包含的信息的确定,是在解码器33内执行的。在解码器33的信号分解单元21中,首先依据位串的编码方法信息502,来检验:所接收到的信息是否是基于原始音频信号而形成的。如果解码器确定出,编码器1中所形成的位串501,不包括原始信号的频域变换值,则按以下方式执行解码。由阶字段504确定出节距预测单元24中所使用的阶M,由滞后字段505确定出滞后。位串501的系数字段506内所接收的量化节距预测系数、同时还有与阶和滞后相关的信息,都被传送到解码器的节距预测单元24。这一过程用图2中的线B2来表示。在位串的字段507中所接收到的预测误差信号的量化值,在去量化单元22内被去量化,并被传送到解码器的求和单元23。依据滞后信息,解码器的节距预测单元24从采样缓冲器8中,搜索用作基准序列的采样,并基于所选的阶M,执行一个预测,节距预测单元24依据该阶M而使用所接收到的节距预测系数。因此,产生了第一重建的时域信号,它在变换单元25内,被变换到频域。该频域信号被传送到求和单元23,在该求和单元中,产生了作为该频域信号与去量化的预测误差信号之和的一个频域信号。这样,在无误差数据传输条件下,重建的频域信号充分与频域内的原始编码信号相对应。借助于逆变换单元26内的改进的DCT逆变换,将这一频域信号变换到时域,结果,数字音频信号出现在逆变换单元26的输出端。在数字/模拟转换器27中,将这一信号转换为模拟信号,如果需要还可将其放大,并按照同样是已知的方式,将其传送到其它更多的处理级中。这一点已由图3中的音频单元32所表示。
如果编码器1内形成的位串501包括变换到频域的原始信号的值,则以以下方式执行解码。量化的频域变换值在去量化单元22内被去量化,并经由求和单元23,被传送到拟变换单元。在逆变换单元26内,借助于改进的DCT逆变换,将频域信号变换到时域,其中,以数字格式,产生了了与原始音频信号相应的时域信号。如果需要,可在数字/模拟转换器27内,将这一信号转换为模拟信号。
图2中,标记A2显示了控制信号传输到求和单元23。以这样一种方式使用这种控制信息,这种方式与所描述的有关的编码器的本机解码器的功能相似。换言之,如果所接收的位串501的字段502中所提供的编码方法信息表明:位串包含由音频信号自身导出的量化频域值,则禁止求和单元23的操作。这使得音频信号的量化频域值能够通过求和单元23,到达逆变换单元26。另一方面,如果从所接收的位串的字段503中检索出的编码方法信息表明:对音频信号的编码使用了节距预测器,则允许求和单元23的操作,这使得去量化的预测误差数据能与变换单元25所产生的预测信号的频域表示法相加。
在图3所示的例子中,发送设备是一个无线通信设备2,接收设备是一个基站31,其中,在基站31的解码器33中,对从无线通信设备2发射出的信号进行解码,在解码器33中,模拟音频信号同样被以已知方式传送到更多的处理级中。
很明显,在本例中,仅出现了应用本发明所必需的特征,但在实际应用中,数据传输***还包括本文所出现的特征以外的一些功能。也有可能使用与依据本发明的编码相关的其它编码方法,例如短期预测。此外,当发送依据本发明进行编码的信号时,也可以执行其它的处理步骤,例如信道编码。
还可以在时域内,确定预测信号与实际信号之间的一致性。这样,在本发明的另一个实施例中,就不需要将信号变换到频域,这样就不再需要变换单元6、11,也不再需要编码器的逆变换单元19,同时还有解码器的变换单元25以及逆变换单元26。这样,就可基于时域信号,来确定编码效率和预测误差。
先前说说明的音频信号编码/解码级可应用于各种不同的数据传输***,例如移动通信***、卫星TV***、视频需求(video on demand)***等。例如,对于全双工发送音频信号的移动通信***,在无线通信设备2和基站31或类似设备中,需要一个编码器/解码器对。在图3的框图中,无线通信设备2和基站31的相应功能的单元被标记有相同的参考号。尽管图3中,编码器1和解码器33表现为分立单元,但在实际应用中,可以将它们实现于同一个单元内,即所谓的编解码器,在该编解码器中,可执行编码和解码所必需的所有操作。如果在移动通信***中,以数字格式发送音频信号,则在基站中,就不再需要模拟/数字转换以及数字/模拟转换。这样,就会在通过其,而使移动通信网连接到另一种电通信网的无线通信设备以及接口内,执行这种变换,其中所述另一种无线电通信网例如是公共电话网。但是,如果该电话网是数字电话网,那么,也可以在例如是与这种电话网相连的一个数字电话(未示出)内,执行这种变换。
在有关传输中,前述编码级不是非有不可的,但但可以存储编码信息,用于后续传输。此外,加到编码器上的音频信号不必一定是一个实时音频信号,但对于将要编码的音频信号,可以从该音频信号的早期开始,对其进行信息存储。
以下,将用数学方法来描述依据本发明一个实施例的不同的编码
B ( z ) = Σ k = - m 1 m 2 b ( k ) z - ( α + k ) . . . ( 1 )
级。节距预测单元的传输函数具有以下形式:
其中α是滞后,b(k)是节距预测器的系数,m1和m2取决于于阶(M),它们被表示如下:
m1=(M-1)/2
m2=M-m1-1
有利的是,最相符的采样序列(即基准序列)的确定,是利用了最小二乘法。这可以表示如下:
E = Σ i = 0 N - 1 ( x ( i ) - Σ j = - m 1 m 2 b ( j ) x ‾ ( i + j - α ) ) 2 . . . ( 2 )
其中E=误差,x()是时域中的输入信号,x()是从采样的在先序列中重建出的信号,N是帧检验中的采样数。可通过将变量设置为m1=0,m2=0,从而计算出滞后α,并从等式2中求解出b。求解出α的另一种方法是使用归一化相关方法,通过利用等式:
当发现最相符的(基准)采样序列时,滞后单元7具有有关滞后的信息,即音频信号中所出现的相符的采样序列究竟提前了多少。
可由等式(2),计算出用于每种阶(M)的节距预测系数b(k),可以以下形式重新表示等式(2):
E = Σ i = 0 N - 1 x ( i ) 2 - 2 · Σ i - 0 N - 1 x ( i ) Σ j = - m 1 m 2 b ( j ) x ~ ( i + j - α ) + Σ i = 0 N - 1 ( Σ j = - m 1 m 2 b ( j ) x ‾ ( i + j - α ) ) 2 . . . . ( 4 )
可通过搜寻误差变化相对于b(k)为尽可能小的一个系数b(k),来确定系数b(k)的一个优化值。可通过将相对于b的误差关系的偏导数设定为零(E/b=0),从而实现上述计算,其中实现了以下等式:
- 2 · Σ i = 0 N - 1 x ( i ) Σ j = - m 1 m 2 x ~ ( i + j - α ) + Σ i = 0 N - 1 [ ( Σ j = - m 1 m 2 b ( j ) x ‾ ( i + j - a ) ) 2 · Σ j = - m 1 m 2 x ~ ( i + j - α ) = 0 . . . . ( 5 )
即:
Σ i = 0 N - 1 [ Σ j = - m 1 m 2 b ( j ) x ‾ ( i + j - α ) · Σ j = - m 1 m 2 x ~ ( i + j - a ) ] = Σ i = 0 N - 1 x ( i ) Σ j = - m 1 m 2 x ~ ( i + j - α )
可以以矩阵形式写出该等式,其中可通过对矩阵等式求解,从而
b= A-1· r
确定系数b(k):
其中,
b ‾ = b - m 1 b - m 1 + 1 . . . b m 2 , r ‾ = Σ i = 0 N - 1 x ( i ) x ~ ( i - m 1 - α ) . . . Σ i = 0 N - 1 x ( i ) x ~ ( i + m 2 - α ) .
在依据本发明的方法中,其目的是比依据已有技术的***更有效地利用音频信号的周期性。可以通过对几种阶计算其节距预测系数,来增强编码器对音频信号频率内改变的适应性,从而实现这一点的。可以以这样一种方式来选择对音频信号进行编码所使用的节距预测器的阶,以便使预测误差最小,使编码效率最大,或交替使用预测误差和编码效率。这种选择是在某些间隔处执行的,最好为每帧单独执行这种选择。这样,可以一帧一帧地改变阶和节距预测系数。这样,与使用固定阶的已有技术的编码方法相比,在依据本发明的方法中,有可能提高编码的适应性。此外,在依据本发明的方法中,如果不能利用编码来减小将要传送给一个指定帧的信息量(比特数),则可以发送变换到频域的原始信号,而不是节距预测系数和误差信号。
依据本发明的方法中所使用的先前出现的计算步骤,可以以程序的形式来方便地实现,以及/或以硬件形式来方便地实现,所述程序可以表现为:数字信号处理单元或类似单元内的控制器34的程序代码。依据本发明的上述说明,本领域技术人员可以依据本发明而实现编码器1,这样,就不需要在本文中更详细地讨论编码器1的不同功能的单元。
为了向接收机发送所述节距预测系数,有可能使用所谓的查找表。在这种查找表中,存储有不同的系数值,其中,发送的是查找表内的该系数的索引,而不是该系数。编码器1和解码器33都知道这个查找表。在接收端,有可能通过使用查找表,从而依据所发送的索引,来确定所讨论的节距预测系数。在某些情况下,与传送节距预测系数相比,使用查找表,可以减少将要发送的比特数。
本发明并不仅限于上述出现的几个实施例,也不只限于其它几个方面,但可以在附加权利要求书的范围内,实现一些改进。

Claims (7)

1.用于对编码的音频信号进行解码的一种解码器(33),其特征在于所述解码器包括:
——用于为将要解码的音频信号确定编码方法的装置,该装置包括:依据所述编码方法信息(502),检验所接收到的信息是否是依据原始音频信号而形成的装置;以及检验编码相位中所用的节距预测器的阶数(M)的装置,以及
——用于依据所确定的编码方法,对所述音频信号进行解码的装置,该装置包括:用于接收与一个预测信号相关的信息的装置(21);通过利用依据音频信号自身而形成的编码信息,对信号进行解码的装置;用于选择解码该信号的节距预测器的阶数的装置;以及通过依据所选的节距预测器的阶数(M)而执行一个预测,从而对所述信号进行解码的装置。
2.依据权利要求1的一种解码器,其特征在于所述解码器包括从所述接收到的信息中,至少确定出与所选阶数(504)、滞后(505)相关的数据、至少一个节距预测器系数(506)以及预测误差数据(507)的装置(21)。
3.依据权利要求2的一种解码器,其特征在于它包括利用与所选阶数(504)、滞后(505)相关的所述数据以及至少一个节距预测器系数(506)产生一个预测信号的装置(24,28)。
4.依据权利要求2或3的一种解码器,其特征在于它包括利用所述预测信号以及所述预测误差数据,产生一个重建的音频信号的装置(23,24,28)。
5.依据权利要求1的一种解码器,其特征在于它包括接收与所述音频信号自身相关的信息的装置(21)。
6.依据权利要求5的一种解码器,其特征在于它包括利用所述接收到的与所述音频信号自身相关的信息,产生一个重建的音频信号的装置(22,23,26)。
7.用于对编码的音频信号执行解码的一种方法,其特征在于:所述方法包括:依据编码方法信息(502),检验所接收到的信息是否是依据原始音频信号形成的步骤,其中对所述信号的解码,利用了依据音频信号自身而形成的编码信息,否则,检验编码相位内使用的节距预测器的阶数(M),并依据该节距预测阶数(M)执行一个预测,以重现该音频信号。
CNB008124884A 1999-07-05 2000-07-05 改善音频信号编码效率的方法 Expired - Lifetime CN1235190C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI991537A FI116992B (fi) 1999-07-05 1999-07-05 Menetelmät, järjestelmä ja laitteet audiosignaalin koodauksen ja siirron tehostamiseksi
FI991537 1999-07-05

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CNB2005101201121A Division CN100568344C (zh) 1999-07-05 2000-07-05 改善音频信号编码效率的方法

Publications (2)

Publication Number Publication Date
CN1372683A CN1372683A (zh) 2002-10-02
CN1235190C true CN1235190C (zh) 2006-01-04

Family

ID=8555025

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB2005101201121A Expired - Lifetime CN100568344C (zh) 1999-07-05 2000-07-05 改善音频信号编码效率的方法
CNB008124884A Expired - Lifetime CN1235190C (zh) 1999-07-05 2000-07-05 改善音频信号编码效率的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNB2005101201121A Expired - Lifetime CN100568344C (zh) 1999-07-05 2000-07-05 改善音频信号编码效率的方法

Country Status (13)

Country Link
US (2) US7289951B1 (zh)
EP (3) EP1587062B1 (zh)
JP (2) JP4142292B2 (zh)
KR (2) KR100545774B1 (zh)
CN (2) CN100568344C (zh)
AT (2) ATE298919T1 (zh)
AU (1) AU761771B2 (zh)
BR (1) BRPI0012182B1 (zh)
CA (1) CA2378435C (zh)
DE (2) DE60041207D1 (zh)
ES (1) ES2244452T3 (zh)
FI (1) FI116992B (zh)
WO (1) WO2001003122A1 (zh)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002173892A (ja) 2000-09-27 2002-06-21 Nippon Paper Industries Co Ltd グラビア印刷用塗工紙
FI118067B (fi) 2001-05-04 2007-06-15 Nokia Corp Menetelmä audiosignaalin pakkauksen purkamisessa, pakkauksen purkulaite, ja elektroniikkalaite
DE10138650A1 (de) * 2001-08-07 2003-02-27 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschlüsseln eines diskreten Signals sowie Verfahren und Vorrichtung zur Entschlüsselung
US7933767B2 (en) * 2004-12-27 2011-04-26 Nokia Corporation Systems and methods for determining pitch lag for a current frame of information
US20070213705A1 (en) * 2006-03-08 2007-09-13 Schmid Peter M Insulated needle and system
US7610195B2 (en) * 2006-06-01 2009-10-27 Nokia Corporation Decoding of predictively coded data using buffer adaptation
JP2008170488A (ja) 2007-01-06 2008-07-24 Yamaha Corp 波形圧縮装置、波形伸長装置、プログラムおよび圧縮データの生産方法
EP2077551B1 (en) * 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
WO2009132662A1 (en) * 2008-04-28 2009-11-05 Nokia Corporation Encoding/decoding for improved frequency response
KR20090122143A (ko) * 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
WO2010005224A2 (en) * 2008-07-07 2010-01-14 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US20100114568A1 (en) * 2008-10-24 2010-05-06 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
US8364471B2 (en) * 2008-11-04 2013-01-29 Lg Electronics Inc. Apparatus and method for processing a time domain audio signal with a noise filling flag
GB2466671B (en) 2009-01-06 2013-03-27 Skype Speech encoding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466672B (en) 2009-01-06 2013-03-13 Skype Speech coding
KR101614767B1 (ko) * 2009-10-28 2016-04-22 에스케이텔레콤 주식회사 벡터 양자화 기반 2차 예측을 통한 동영상 부호화/복호화 장치, 방법 및 기록 매체
CN105872563B (zh) * 2010-04-13 2019-06-14 Ge视频压缩有限责任公司 用于解码、生成、存储数据流以及传输视频的方法
KR102595454B1 (ko) 2010-04-13 2023-10-27 지이 비디오 컴프레션, 엘엘씨 평면 간 예측
CN106162172B (zh) 2010-04-13 2020-06-02 Ge视频压缩有限责任公司 解码器及方法、编码器及方法、产生和解码数据流方法
RS63059B1 (sr) 2010-04-13 2022-04-29 Ge Video Compression Llc Kodiranje videa primenom podele sa više stabala na slikama
CN106454373B (zh) 2010-04-13 2019-10-01 Ge视频压缩有限责任公司 解码器、重建数组的方法、编码器及编码方法
US9268762B2 (en) 2012-01-16 2016-02-23 Google Inc. Techniques for generating outgoing messages based on language, internationalization, and localization preferences of the recipient
DE102012207750A1 (de) 2012-05-09 2013-11-28 Leibniz-Institut für Plasmaforschung und Technologie e.V. Vorrichtung zur plasmabehandlung von menschlichen, tierischen oder pflanzlichen oberflächen, insbesondere von haut oder schleimhautarealen
US9524725B2 (en) * 2012-10-01 2016-12-20 Nippon Telegraph And Telephone Corporation Encoding method, encoder, program and recording medium
KR102251833B1 (ko) 2013-12-16 2021-05-13 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
EP2916319A1 (en) 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding of information

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US36721A (en) * 1862-10-21 Improvement in breech-loading fire-arms
JPH0683443B2 (ja) * 1985-03-05 1994-10-19 富士通株式会社 フレ−ム内フレ−ム間符号化方式
WO1990013112A1 (en) * 1989-04-25 1990-11-01 Kabushiki Kaisha Toshiba Voice encoder
CA2021514C (en) 1989-09-01 1998-12-15 Yair Shoham Constrained-stochastic-excitation coding
NL9001985A (nl) * 1990-09-10 1992-04-01 Nederland Ptt Werkwijze voor het coderen van een analoog signaal met een herhalend karakter en een inrichting voor het volgens deze werkwijze coderen.
US5528629A (en) 1990-09-10 1996-06-18 Koninklijke Ptt Nederland N.V. Method and device for coding an analog signal having a repetitive nature utilizing over sampling to simplify coding
NL9002308A (nl) 1990-10-23 1992-05-18 Nederland Ptt Werkwijze voor het coderen en decoderen van een bemonsterd analoog signaal met een herhalend karakter en een inrichting voor het volgens deze werkwijze coderen en decoderen.
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
US6400996B1 (en) * 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
US5784631A (en) * 1992-06-30 1998-07-21 Discovision Associates Huffman decoder
IT1257065B (it) * 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
FI95086C (fi) 1992-11-26 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin tehokkaaksi koodaamiseksi
CA2116736C (en) * 1993-03-05 1999-08-10 Edward M. Roney, Iv Decoder selection
JPH06332492A (ja) * 1993-05-19 1994-12-02 Matsushita Electric Ind Co Ltd 音声検出方法および検出装置
IT1270438B (it) 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce
US5574825A (en) * 1994-03-14 1996-11-12 Lucent Technologies Inc. Linear prediction coefficient generation during frame erasure or packet loss
JP3277692B2 (ja) 1994-06-13 2002-04-22 ソニー株式会社 情報符号化方法、情報復号化方法及び情報記録媒体
JPH08166800A (ja) * 1994-12-13 1996-06-25 Hitachi Ltd 複数種類の符号化方法を備える音声符号器および復号器
JP3183072B2 (ja) 1994-12-19 2001-07-03 松下電器産業株式会社 音声符号化装置
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
FR2729246A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
FR2729247A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
US5864798A (en) * 1995-09-18 1999-01-26 Kabushiki Kaisha Toshiba Method and apparatus for adjusting a spectrum shape of a speech signal
TW321810B (zh) * 1995-10-26 1997-12-01 Sony Co Ltd
JP4005154B2 (ja) * 1995-10-26 2007-11-07 ソニー株式会社 音声復号化方法及び装置
JPH1091194A (ja) * 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置
JP3707154B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 音声符号化方法及び装置
JPH10105194A (ja) * 1996-09-27 1998-04-24 Sony Corp ピッチ検出方法、音声信号符号化方法および装置
US6453288B1 (en) * 1996-11-07 2002-09-17 Matsushita Electric Industrial Co., Ltd. Method and apparatus for producing component of excitation vector
JPH10149199A (ja) * 1996-11-19 1998-06-02 Sony Corp 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体
FI964975A (fi) 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi
US6252632B1 (en) * 1997-01-17 2001-06-26 Fox Sports Productions, Inc. System for enhancing a video presentation
US6202046B1 (en) * 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
JP3064947B2 (ja) * 1997-03-26 2000-07-12 日本電気株式会社 音声・楽音符号化及び復号化装置
FI973873A (fi) 1997-10-02 1999-04-03 Nokia Mobile Phones Ltd Puhekoodaus
JP3765171B2 (ja) 1997-10-07 2006-04-12 ヤマハ株式会社 音声符号化復号方式
WO1999050828A1 (en) * 1998-03-30 1999-10-07 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6014618A (en) * 1998-08-06 2000-01-11 Dsp Software Engineering, Inc. LPAS speech coder using vector quantized, multi-codebook, multi-tap pitch predictor and optimized ternary source excitation codebook derivation
US6493665B1 (en) * 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6493664B1 (en) * 1999-04-05 2002-12-10 Hughes Electronics Corporation Spectral magnitude modeling and quantization in a frequency domain interpolative speech codec system

Also Published As

Publication number Publication date
BRPI0012182B1 (pt) 2017-02-07
CN100568344C (zh) 2009-12-09
US7457743B2 (en) 2008-11-25
FI991537A (fi) 2001-01-06
DE60021083T2 (de) 2006-05-18
US20060089832A1 (en) 2006-04-27
AU5832600A (en) 2001-01-22
EP1203370B1 (en) 2005-06-29
KR100545774B1 (ko) 2006-01-24
EP2037451A1 (en) 2009-03-18
WO2001003122A1 (en) 2001-01-11
DE60021083D1 (de) 2005-08-04
JP2003504654A (ja) 2003-02-04
DE60041207D1 (de) 2009-02-05
EP1203370A1 (en) 2002-05-08
JP4426483B2 (ja) 2010-03-03
KR20020019483A (ko) 2002-03-12
AU761771B2 (en) 2003-06-12
CN1766990A (zh) 2006-05-03
US7289951B1 (en) 2007-10-30
ES2244452T3 (es) 2005-12-16
CA2378435A1 (en) 2001-01-11
EP1587062A1 (en) 2005-10-19
ATE298919T1 (de) 2005-07-15
FI116992B (fi) 2006-04-28
ATE418779T1 (de) 2009-01-15
JP2005189886A (ja) 2005-07-14
KR100593459B1 (ko) 2006-06-28
BR0012182A (pt) 2002-04-16
KR20050085977A (ko) 2005-08-29
JP4142292B2 (ja) 2008-09-03
EP1587062B1 (en) 2008-12-24
CN1372683A (zh) 2002-10-02
CA2378435C (en) 2008-01-08

Similar Documents

Publication Publication Date Title
CN1235190C (zh) 改善音频信号编码效率的方法
CN1080036C (zh) 实旋不同编码法则的发送***
CN1135721C (zh) 音频信号编码方法及其有关设备
RU2509379C2 (ru) Устройство и способ квантования и обратного квантования lpc-фильтров в суперкадре
CN1432176A (zh) 用于预测量化有声语音的方法和设备
KR20080025399A (ko) 적응적 코딩 및 디코딩에서 다수의 엔트로피 모델의 선택적사용
CN1437184A (zh) 解码装置及编码装置与解码方法及编码方法
CN1661924A (zh) 音频编解码***和使用该音频编解码***的编码方法
CN1140894C (zh) 可变位速率语音传输***
CN1112674C (zh) 用于语音有效编码的谱参数预测分解矩阵量化
CN1124588C (zh) 信号编码方法及设备
CN101572092B (zh) 编解码端的固定码本激励的搜索方法及装置
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
CN1815894A (zh) 一种音频信号编码的方法和设备
CN1222996A (zh) 用于传输语音信号的传输***
CN1202513C (zh) 音频编码、译码方法和装置及其应用
CN1318190A (zh) 线性预测分析合成的编码方法和编码器
CN1124590C (zh) 改善话音信号编码器性能的方法
CN1239569A (zh) 一种编码语音信号的方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160127

Address after: Espoo, Finland

Patentee after: Technology Co., Ltd. of Nokia

Address before: Espoo, Finland

Patentee before: Nokia Oyj

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190515

Address after: American New York

Patentee after: Origin Asset Group Co., Ltd.

Address before: Espoo, Finland

Patentee before: Technology Co., Ltd. of Nokia

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20060104