CN101228574A - 一种控制前回声的编码和解码装置及方法 - Google Patents

一种控制前回声的编码和解码装置及方法 Download PDF

Info

Publication number
CN101228574A
CN101228574A CN200580051158.0A CN200580051158A CN101228574A CN 101228574 A CN101228574 A CN 101228574A CN 200580051158 A CN200580051158 A CN 200580051158A CN 101228574 A CN101228574 A CN 101228574A
Authority
CN
China
Prior art keywords
module
window
signal
window function
echo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200580051158.0A
Other languages
English (en)
Inventor
王磊
潘兴德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING E-WORLD TECHNOLOGY CO LTD
Original Assignee
BEIJING E-WORLD TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING E-WORLD TECHNOLOGY CO LTD filed Critical BEIJING E-WORLD TECHNOLOGY CO LTD
Publication of CN101228574A publication Critical patent/CN101228574A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及一种控制前回声的编码装置,包括顺次连接的信号类型分析模块、修正窗函数模块、时频映射模块、量化和熵编码模块和码流复用模块,以及与量化和熵编码模块连接的心理声学分析模块。本发明还涉及一种控制前回声的编码方法,1、判断输入音频信号帧的信号类型是否为快变类型信号,是则对窗函数值进行线性变换,后对音频信号帧进行加窗;2、对加窗后的时域信号进行时频映射处理,后对频域系数进行量化和熵编码,后将编码后的音频码流和信号类型分析结果进行复用。本发明还涉及一种控制前回声的解码装置,包括顺次连接的码流解复用模块、逆量化和熵解码模块、频时映射模块和修正窗函数模块。本发明还涉及一种控制前回声的解码方法。

Description

一种控制前回声的编码和解码装置及方法 技术领域 本发明涉及一种控制前回声的编码和解码装置及方法, 尤其是一种利用 修正窗函数方法来控制前回声的音频编码和解码装置及方法。
背景技术 一般釆用感知编码器对音频信息进行编码压缩, 其中传统的感知编码器 中通常有一个心理声学模块,该心理声学模块的作用是分析音频信号中的 "不 相关成分" , 在获得这些 "不相关成分"后, 再通过量化模块去处理这些 "不 相关成分" , 而使音频信号达到 "感知透明" , 即对人的感觉没有影响或影 响在可接受的范围内。 在心理声学模块分析 "不相关成分" 时, 主要利用人 耳所具有的掩蔽现象。 所谓 "掩蔽现象" , 如图 1所示, 就是在一个声音存 在的情况下, 另一个声音在人耳中不能被感知的现象, 这种声音就是遮蔽信 号 3。 掩蔽又分为同时掩蔽 1 (s imul taneous masking) 、 向前掩蔽 2 (pre- masking)和向后掩蔽 4 (pos t-masking)。其中向前掩蔽 2和向后掩蔽 3 是表现在时域上的, 因此对感知编码器时域特性有额外的要求, 即要做到感 知透明的编码质量, 量化噪声也必须具有一个与时域相关的掩蔽阈值。 但这 个要求对实际的感知编码器来说并不容易实现。 由时频的测不准原理可知: 用块变换方法将音频时域信号变换到频域, 然后对变换后的谱系数做量化和 编码引起的量化误差, 在用合成滤波器重构后, 会在时域发生扩散。 对常用 的滤波器设计, 如用窗长为 2048个样本点的修正离散余弦变换(简称 MDCT ) 滤波器对采样频率为 48000赫兹的信号做变换, 在用合成滤波器重构后, 所 引起量化误差的扩散约为 42. 7ms。 如果在分析窗内信号较强的能量主要只集 中在很 d、一部分, 那么量化噪声就会扩散到信号出现之前。 在极端情况下, 在某些时间段中,量化噪声甚至会高于原始信号的能量级,这就是所谓的 "前 回声 (pre- echo ),, 现象, 如图 2和图 3所示。 图 2是未编码的音频信号时 域图形, 图 3是编码重构后的音频信号时域图形。 图 3中用椭圆圈出的部分 就是前回声 5 , 根据人耳的特性, 如果编码噪声在信号突变点前持续时间较 短的话, 可以利用向前掩蔽将前回声掩蔽掉, 否则编码噪声会被人耳感知到。 为了避免这种现象, 设计编码器时就要考虑量化噪声的时域特性, 以保证满 足时域掩蔽条件, 而前回声现象一直是快变类型信号 (如响板信号)等无法 做到较低码率的一个主要困难。
在编解码音频信号中, 为解决前回声现象, 现有技术包括以下几种: 比位池控制技术: 对滤波器组覆盖快变段窗内的谱系数, 增加编码精度。 这会极大的增加快变帧编码所需要的比特数, 这种方法不能用于固定码率编 码器。 在 MPEG- 1标准中, 采用比特池方法, 在比特需要峰值时使用前面的帧 留下的比特, 从而维持平均的恒定码率。 然而实际上, 如果遇到变化非常快 的信号, 需要极大的比特池而导致无法编码。
自适应窗切换技术: 许多感知编码器中使用的是自适应窗切换技术。 这 种方法能根据输入信号的特性, 自适应的调整滤波器组窗的大小; 稳态部分 或緩变部分采用长时窗, 快变信号部分采用短时窗进行编码。 这种方法增加 了编码器计算量, 并且使得编码器结构复杂化。 由于不同的窗长需要心理声 学模型不同的解释和归一化, 以及不同的频带及无噪编码结构, 窗切换显著 的增加了编码器结构的复杂度。 此外, 在采用交叠相加结构滤波器组时, 窗 切换判断需要编码器额外的緩冲和延迟, 会导致更大的端对端的延迟。 最后, 虽然长窗和短窗具有较好的时频局部特性, 但是开始窗和结束窗却会引入较 大的低效编码。
滤波器组切换技术: 滤波器组切换技术是利用不同的滤波器组模式而控 制前回声的技术。 具体的说, 在緩变信号类型, 用频率分辨率高的余弦调制 滤波器组; 在快变信号类型, 用小波滤波器组。 当两种滤波器组模式相互切 换时, 其过渡块很难保证完全重构。
时域噪声整形(TNS )技术: 时域噪声整形技术就是当信号经过滤波器组 变换成频域系数后, 根据对信号类型的判断, 如果是快变类型信号, 不直接 对频域系数进行量化, 而是对频域系数先进行线性预测, 然后对残差序列进 行量化。 采用 TNS技术会增加较多的边带信息, 影响了整体编码效率。
如图 4所示, 是现有技术的音频编码装置结构框架图。 该编码器包括: 心理声学分析模块 201 , 窗函数模块 202, 时频映射模块 203, 量化和熵编码 模块 204和码流复用模块 205。 其中心理声学分析模块 201用于计算输入音 频信号的感知熵和掩蔽阈值, ^^据感知熵判断该音频信号帧信号类型是快变 类型信号还是緩变类型信号。 为了预防前回声并保证编码质量, 根据心理声 学分析模块 201输出的信号类型来判断窗函数模块 202的分析窗函数的长度, 具体的说, 如果该帧信号是快变信号类型, 为预防前回声, 采用时间分辨率 较高而频率分辨率较低的 256样本点长度的窗; 如果该帧信号是緩变信号类 型, 为保证编码效率, 采用时间分辨率较低而频率分辨率较高的 2048样本点 长度的窗。 时频映射模块 203用于将时域音频信号转变成频域系数, 并输出 到量化和熵编码模块 204; 量化和熵编码模块 204在心理声学分析模块 201 输出的掩蔽阈值的控制下, 对频域系数进行量化和熵编码, 并输出到码流复 用模块 205; 码流复用模块 205用于将接收到的数据进行复用, 形成音频编 码码流。 这种音频编码装置虽然可以达到防止前回声的目的, 但由于窗函数 模块 202采用不同长度样本点的窗, 从而使整个编码器的结构复杂度变得较 高。
在文献 ( "Adapt ive Transform Coding of Speech Signal s", Rainer Zel inski, Peter Nol l, IEEE Transact ions on Acous t ics, Speech, and Signal Process ing, Vol. ASSP-25, No. 4, Augus t 1977 ) 中, 作者讨论了 基于变换的语音编码方法, 具体的说, 通过离散余弦变换(DCT )进行语音编 码的方法。对语音信号 ^进行分帧,假设一帧样本点数为 N ( N可以 128 , 256 ,
1 2― '
512 , 1024等), 对一帧信号进行方差估计, 得到标准差 , 其中 σ 。 将量化后的标准差 作为边信息传送到解码端。 将该帧信号除以量化后的标 准差 得到 ν· 其中 = 。 对输入序列进行 DCT变换得到 V , 并对其进 行量化得到 V^。 将量化后的序列传送到解码端, 进行逆 DCT变换得到 V^ , 最后序列乘以 得到重构后的语音信号 ^。 这种方法如果直接应用到音频编 码中, 对快变信号帧出现的前回声问题仍然是无能为力的。 基于变换的语音 编码方法在除以量化后的标准差 后, 仍不能改变这一帧信号 6 的特性, 即 这一帧信号仍然是非平稳的, 如图 5所示, 为应用基于变换的语音编码方法 的音频信号时域图形。 如果对其进行改进, 在快变点之前估计一个标准差 σι , 在快变点之后估计一个标准差 2, 并分别量化为 和 如图 6所示,是症用 改进后的基于变换的语音编码方法的音频信号时域图形。 这样, 首先对快变
1 N、 点前的信号 Ί 除以 , 而对快变点后的信号 8 除以 , 其中 Nu-i Xj , 为快变点的位置)。 经过这样的处理以后, 这一帧 信号就变成准稳态信号, 然后对处理后的信号做上述处理, 就可以大大改善 前回声的问题。 但改进的方法是针对于语音编码的, 对于音频编码, 这种改 进的方法难以消除快效应, 而且编码效率很低。 发明内容
本发明的主要目的在于提供一种控制前回声的编码装置, 其结构筒单, 并可有效地控制音频编码时的前回声现象。
本发明的另一目的在于提供一种控制前回声的编码方法, 可以有效地控 制音频编码时的前回声现象。
本发明的再一目的在于提供一种控制前回声的解码装置, 可实现对由本 发明所公开的编码方法编码后的信号进行解码, 并且解码得到的信号与原音 频信号完全重构。
本发明的又一目的在于提供一种控制前回声的解码方法, 可实现对由本 发明所公开的编码方法编码后的信号进行解码, 并且解码得到的信号与原音 频信号完全重构。
为实现上述目的, 本发明提供了一种控制前回声的编码装置, 其中包括: 一信号类型分析模块, 用于判断输入音频信号帧的信号类型, 并输出快 变点位置和量化后的突变强度参数;
一修正窗函数模块, 与所述信号类型分析模块连接, 用于修正分析窗函 数和对所述输入音频信号帧进行加窗处理, 并输出加窗后的时域音频信号; 一时频映射模块, 与所述修正窗函数模块连接, 用于将所述加窗后的时 域音频信号转换为频域系数; - 一心理声学分析模块, 用于对所述输入音频信号帧进行心理声学处理, 并输出尺度因子带的掩蔽阈值参数; 一量化和熵编码模块, 分别与所述时频映射模块和所述心理声学分析模 块连接, 用于根据所述心理声学分析模块输出的所述掩蔽阔值参数, 对所述 时频映射模块输出的频域系数进行量化和熵编码, 并输出编码码流;
一码流复用模块, 与所述量化和熵编码模块和所述信号类型分析模块相 连接, 用于将所述量化和熵编码模块输出的所述编码码流和信号类型分析模 块输出的结果进行复用, 并形成音频编码码流。
为实现上述再一目的, 本发明提供了一种控制前回声的编码方法, 其中 包括以下步骤:
步骤 1、信号类型分析模块判断输入音频信号帧的信号类型是否为快变类 型信号, 是则所述信号类型分析模块计算快变点位置的参数及所述音频信号 帧的突变强度参数, 并将该突变强度参数进行量化, 得到突变强度的量化值, 然后执行步骤 2; 否则所述修正窗函数模块用原始的分析窗函数对所述音频 信号帧进行加窗, 得到加窗后的时域信号, 然后执行步骤 4;
步骤 2、修正窗函数模块对分析窗函数进行线性变换,得到修正后的分析 窗函数;
步骤 3、所述修正窗函数模块用修正后的分析窗函数对所述音频信号帧进 行加窗, 得到加窗后的时域信号;
步骤 4、 时频映射模块对所述加窗后的时域信号进行时频映射处理,得到 频域系数;
步骤 5、量化和熵编码模块根据心理声学模块对音频信号帧进行心理声学 处理而得到的尺度因子带的掩蔽阈值参数, 对所述频域系数进行量化和熵编 码, 得到编码后的音频码流;
步骤 6、码流复用模块将所述编码后的音频码流和所述信号类型分析的结 果进行复用, 得到压缩音频码流。
为实现上述另一目的, 本发明提供了一种控制前回声的解码装置, 其中 包括:
一码流解复用模块, 用于对压缩音频码流进行解复用;
一逆量化和熵解码模块, 与所述码流解复用模块连接, 用于对所述解复 用后的音频码流进行解码和逆量化, 并输出逆量化后的频域系数; 一频时映射模块, 与所述逆量化和熵解码模块连接, 用于将所述逆量化 后的频域系数变换为时域信号;
一修正窗函数模块, 与所述频时映射模块连接, 用于修正综合窗函数和 对所述时域信号进行加窗处理。
为实现上述又一目的, 本发明提供了一种控制前回声的解码方法, 其中 包括以下步骤:
步骤 1、码流解复用模块对输入的压缩音频码流进行解复用,得到解复用 后的音频码流和边信息;
步驟 2 ,逆量化和熵解码模块对所述解复用后的音频码流进行逆量化和熵 解码, 得到逆量化后的频域系数;
步骤 3、频时映射模块对所述逆量化后的频域系数进行频时映射处理,得 到时域信号;
步骤 4、修正窗函数模块根据所述解复用后的边信息判断所述音频信号帧 的信号类型是否为快变类型, 是则执行步驟 5; 否则执行步骤 6;
步骤 5、修正窗函数模块对综合窗函数进行线性变换,得到修正后的综合 窗函数, 然后用修正后的综合窗函数对所述时域信号进行加窗, 得到重构后 的音频信号;
步骤 6、所述修正窗函数模块用原始的综合窗函数对所述时域信号进行加 窗, 得到重构后的音频信号。
因此, 本发明具有以下优点: 由于窗函数采用固定窗长, 筒化了编码装 置的结构, 在控制音频编码时的前回声现象的同时保证了音频信号的完全重 构。
以下结合附图和具体的实施例对本发明作进一步的详细说明。 附图说明
图 1是人耳的掩蔽特性图。
图 2是未编码的音频信号时域图形。
图 3是编码重构后的音频信号时域图形。
图 4是现有技术的音频编码装置结构框架图。 图 5是应用基于变换的语音编码方法的音频信号时域图形。
图 6是应用改进后的基于变换的语音编码方法的音频信号时域图形。 图 7是本发明控制前回声的编码装置实施例 1的结构框图。
图 8是本发明控制前回声的编码方法实施例 1的流程图。
图 9是本发明控制前回声的编码和解码方法的原始分析窗和原始综合窗 的示意图。
图 10是本发明控制前回声的编码方法的修正后的分析窗的示意图。 图 11是本发明控制前回声的解码方法的修正后的综合窗的示意图。 图 12是本发明控制前回声的编码方法中窗函数修正符合完全重构条件的 示意图。
图 13是本发明控制前回声的编码方法的加过渡块的修正后的分析窗函数 的示意图。
图 14是本发明控制前回声的解码方法的加过渡块的修正后的综合窗函数 的示意图。
图 15是本发明控制前回声的编码装置实施例 2的结构框图。
图 16是本发明控制前回声的编码方法实施例 2的流程图。
图 17是本发明控制前回声的解码装置实施例 1的结构框图。
图 18是本发明控制前回声的解码方法实施例 1的流程图。
图 19是本发明控制前回声的解码装置实施例 2的结构框图。
图 20是本发明控制前回声的解码方法实施例 2的流程图。 具体实施方式
本发明是利用修正的窗函数(Modif ied Window Funct ion, MWF )控制音 频编码中出现的前回声信号, 实现了在控制音频编码时的前回声现象的同时 保证了音频信号的完全重构。
参见图 7, 图 7是本发明控制前回声的编码装置实施例 1的结构框图。该 装置由以下功能模块组成: 信号类型分析模块 301 , 用于判断输入音频信号 帧的信号类型, 并输出快变点位置和量化后的突变强度参数, 其中所述的信 号类型分析模块 301 包括信号类型分析器, 用于判断所述输入音频帧信号是 緩变类型信号还是快变类型信号; 计算快变点位置器, 与所述信号类型分析 器相连接, 用于计算快变点的位置; 突变强度计算器, 与所述信号类型分析 器相连接, 用于计算信号的突变强度; 突变强度量化器, 与所述突变强度计 算器相连接,用于对所述计算信号的突变强度进行量化;修正窗函数模块 302 , 与所述信号类型分析模块 301连接, 用于修正分析窗函数和对所述输入音频 信号帧进行加窗处理, 并输出加窗后的时域音频信号, 提高了对快变信号进 行编码的时间分辨率; 时频映射模块 304 , 与所述修正窗函数模块 302连接, 用于将所述加窗后的时域音频信号转换为频域系数; 心理声学分析模块 303 , 用于对所述输入音频信号帧进行心理声学处理, 并输出尺度因子带的掩蔽阈 值参数; 量化和熵编码模块 305 , 分别与所述时频映射模块 304和所述心理 声学分析模块 303连接, 用于根据所述心理声学分析模块 303输出的所述掩 蔽阈值参数, 对所述时频映射模块 304输出的频域系数进行量化和熵编码, 并输出编码码流; 码流复用模块 306 , 与所述量化和熵编码模块 305和所述 信号类型分析模块 301相连接, 用于将所述量化和熵编码模块 305输出的所 述编码码流和所述信号类型分析模块 301输出的结果进行复用, 并形成音频 编码码流。
时频映射模块 304 由滤波器组构成, 滤波器组可以是离散傅立叶变换 ( DFT )滤波器组、 离散余弦变换( DCT )滤波器组、修正离散余弦变换( MDCT ) 滤波器组、 余弦调制滤波器组等。 当采用离散傅立叶变换(DFT ) 滤波器组、 离散余弦变换(DCT )滤波器组、 余弦调制滤波组等正交变换滤波器组时, 分 析窗函数中的窗长与音频信号帧长相等, 而窗函数可以选择汉宁 (Hanning ) 窗、 汉明 (Hamming )窗、 布莱克曼(Blacbnan )窗; 当采用修正离散余弦变 换(MDCT ) 滤波器组时, 分析窗函数中的窗长为音频信号帧长的两倍, 而窗 函数可以选择任一符合修正离散余弦变换条件的窗函数。
在量化和熵编码模块 305 中, 量化器由一组子量化器组成, 每个子量化 器分别根据心理声学分析模块 303输出的特定时频区域的掩蔽阈值, 量化本 区域的频域系数, 通常将该区域称为尺度因子带。 所述的量化器可以采用标 量量化器和矢量量化器, 如运动图象专家组高级音频编码 (MPEG AAC ) 的非 线性标量量化器, 以及运动图象专家组双(MPEG TwinVQ ) 的矢量量化器。 参见图 8 , 图 8是本发明控制前回声的编码方法实施例 1的流程图, 步骤 如下: .
步骤 21、 信号类型分析模块 301判断输入音频信号帧的信号类型是否为 快变类型信号, 是则执行步驟 22, 否则执行步骤 25;
步骤 22、 所述信号类型分析模块 301计算快变点位置的参数及所述音频 信号帧的突变强度参数, 并将该突变强度参数进行量化, 得到突变强度的量 化值;
步骤 23、 修正窗函数模块 302对分析窗函数的所述快变点位置以后的函 数值进行等比例的缩小, 缩小的值等于所述突变强度的量化值, 得到修正后 的分析窗函数;
步骤 24、 所述修正窗函数模块 302用修正后的分析窗函数对所述音频信 号帧进行加窗, 得到加窗后的时域信号, 并执行步驟 26;
步驟 25、 所述修正窗函数模块 302用原始的分析窗函数对所述音频信号 帧进行加窗, 得到加窗后的时域信号, 并执行步骤 26;
步骤 26、时频映射模块 304对所述加窗后的时域信号进行时频映射处理, 得到频域系数;
步骤 27、 量化和熵编码模块 305根据心理声学模块 303对音频信号帧进 行心理声学处理而得到的尺度因子带的掩蔽阔值参数, 对所述频域系数进行 量化和熵编码, 得到编码后的音频码流;
步骤 28、 码流复用模块 306将所述编码后的音频码流和所述信号类型分 析的结果进行复用, 得到压缩音频码流。
在以上的解码方法的步骤 21中,在所述信号类型分析模块 301对输入音 频信号帧的信号类型进行判断的同时, 心理声学模块 303对音频信号帧进行 心理声学处理, 得到尺度因子带的掩蔽阈值参数。 所述心理声学处理是根据 人耳听觉特性计算当前帧信号的掩蔽曲线, 根据掩蔽曲线可以计算特定时频 区域的掩蔽阈值, 用于指导对当前音频帧信号的量化, 这里的心理声学模型 可以是 MPEG AAC 所用的第一类或第二类心理声学模型。 信号类型分析模块 301 基于自适应阈值和波形预测进行前、 后向掩蔽效应来对该帧信号进行信 号类型判断, 具体步骤是: 把输入帧分解成多个子帧, 并查找各个子帧上 PCM 数据绝对值的局部最大点; 在各子帧的局部最大点中选出子帧的绝对峰值; 对某个子帧绝对峰值, 利用该子帧前面的多个(典型的可取 3个)子帧绝对 峰值预测相对该子帧前向延迟的多个(典型的可取 4个)子帧的典型样本值; 计算该子帧绝对峰值与所预测出的典型样本值的差值和比值; 如果预测差值 和比值都大于设定的阔值, 则判断该子帧存在突跃信号, 确认该子帧具备后 向掩蔽预回声能力的局部最大峰点, 如果在该子帧前端与掩蔽峰点前 2. 5ms 处之间存在一个绝对峰值足够小的子帧,则判断该帧信号属于快变类型信号, 将存在突跃信号的子帧做为快变点的位置, 将存在突跃信号的子帧的绝对峰 值和该子帧前面所有子帧中最大绝对峰值的比作为突变强度, 并将突变强度 进行量化, 量化方法可以是上取整, 下取整和四舍五入等; 如果预测差值和 比值不大于设定的闹值, 则重复上述步驟直到判断出该帧信号是快变类型信 号或者到达最后一个子帧, 如果到达最后一个子帧仍未判断出该帧信号是快 变类型信号, 则该帧信号属于緩变类型信号。
对时域音频信号变换到频域, 对时域音频信号进行时频变换的方法有很 多, 可采用离散傅立叶变换(DFT ) 、 离散余弦变换(DCT ) 、 余弦调制滤波 器组、 修正离散余弦变换(MDCT )或小波变换等变换方法。 当采用 DFT、 DCT 或余弦调制滤波器组等正交变换方法时, 分析窗函数中的窗长与音频信号帧 长相等, 而窗函数可以选择汉宁 (Hanning ) 窗、 汉明 ( Ha匪 ing ) 窗、 布莱 克曼(Blackmail ) 窗; 当采用修正离散余弦变换(MDCT ) 时, 分析窗函数中 的窗长为音频信号帧长的两倍, 而窗函数可以选择任一符合修正离散余弦变 换条件的窗函数。 分析窗函数釆用固定长度的窗函数, 长度为大于 1的整数, 优选 2的 N次方, 其中 N为自然数。 窗的选 殳计可参看 《离散时间信号处 理(笫二版) 》 , 西安交通大学出版社, A. V.奥本海姆, R. W.谢弗, J. R.巴 克著, 刘树棠, ***译, 2001。 由于时频映射和加窗函数是分不开的, 所 以下面以 MDCT说明时频映射和加窗的过程。
对于采用 MDCT进行时频映射的情况,首先选取前一帧 M个样本和当前帧 M个样本的时域信号, 再对这两帧共 2M个样本的时域信号通过模块 302进行 加窗操作, 其中分析窗的窗长为帧长的二倍, 然后对经过加窗后的信号利用 时频映射模块 304进行 MDCT变换, 从而获得 M个频域系数。 MDCT分析滤波器的脉冲响应为:
2M-\
X(k)= ∑ x{n)h An)
则 MDCT变换为: "=0 , 0≤k≤M-l, 其中: w(n)为窗函 数; x(n)为 MDCT变换的输入时域音频信号; X(k)为 MDCT变换的输出频域信 为满足信号完全重构的条件, MDCT变换的窗函数 w(n)必须满足以下两个 条件:
w(2M -l-n) = w(n) 且 w2 (n) + w2(n + M) =1 在实际中, 可选用 Sine窗、 KBD窗等作为窗函数。 下面以 Sine窗为例说 明在模块 302中如何对其进行修正以达到控制前回声的目的。需要说明的是, 本发明并不限于 Sine窗和 KBD窗, 只要是满足 MDCT变换条件的窗函数, 都 可以用来对其进行修正, 最终达到控制前回声的目的。
当分析出此帧信号 9为緩变类型信号时, 原始分析窗函数不变, 图 9所 示的便是本发明控制前回声的编码和解码方法的原始分析窗函数的示意图。 如果此帧信号 9为快变类型信号时, 则对原始分析窗函数进行修正。 所述的 修正处理是: 对快变点以后的窗函数值进行等比例的缩小, 缩小的值等于量 化后突变强度的大小。 修正后的分析窗函数如图 10所示, 其中图 10的快变 点位置是第 1280样本点 10, 量化后的突变强度为 5。 为满足信号完全重构的 条件, 当对分析窗进行上述修正后, 也必须对解码时的的综合窗进行修正, 所述的修正处理是: 对快变点以后的窗函数值进行等比例的放大, 放大的值 等于量化后突变强度的大小, 修正后的综合窗函数如图 11所示, 其中图 11 的快变点位置是第 1280样本点 11, 量化后的突变强度为 5。 下面给出当分析 窗和综合窗做上述修正后仍可以满足完全重构条件的证明。
文献 ( S. F. Cheung and J. S. Lim, "Incorporation of biorthogonality into lapped transforms for audio compression" . Proc. IEEE Int. Conf. On Acoustics, Speech, and Signal Processing, Detroit, May 1997, pp3079-3082 ) 中证明, 满足余弦调制滤波器组的双正交完全重构条件为: ∑ p {mM + n)p {{m + 2s)M + n) = d(s)
0 s ci
2K-l-2s
∑ (-^ mp ( M + n)p ((m + 2s)M + (M -n-l)) = 0
m = 0 S a
其中: AW和^ )分别为综合窗和分析窗, M为帧长, K为大于零的整 数, s = 0, 1, ... , K-1, n = 0, 1, ... , M- 1。
如果所用的余弦调制滤波器组为 MDCT, 则上式中 K等于 1, 则 s等于 0。 带入上式可以对其做进一步筒化:
p { )pa l (n) + 1 (M + ") l(M + n)^l ρ {n)pa l ( - « - 1) - 1 ( + ή)^- 1 (2 - » - 1) = 0 ( χ ) 其中 i表示帧序号。 i- 1表示上一帧, i表示当前帧。
如图 12所示为本发明控制前回声的编码方法中窗函数修正符合完全重构 条件的示意图。 图 12中表示连续四帧的信号, 并且已经判断出第 i帧为快变 帧, 快变点 12的位置为第 M+L点, 突变强度为 scs, 其中 scs为实数。 当对 第 i帧做 MDCT变换时,按照上面所述对原始分析窗^ )和原始综合窗 做 修正得到修正后的分析窗 »和修正后的综合窗^ («) , 则:
pa = pa(n) 0≤n≤M + L
Pa = Pa(n)/scs M +L≤n< 2M
Ps(n) = Ps(n) 0≤n<M + L
p (n) = p («) · scs M + L≤n< 2M
s s
所以, 对第 i帧 pl 'l M + n)p1' 1 ( + n)
= Ps l { )pa l (") + ρ8 1 {Μ + n)pa l 1 ( + n)
12 ~l (2M - " - 1)
= 0 ( 3 ) 由式( 2 )和式( 3 )可知, 对第 i帧做 MDCT时, 用修正窗可以完全重构。 同理可证对 i + 1帧和 i + 2帧做 MDCT, 用修正窗也都可以完全重构。 进一步 可以证明, 只要对原始窗做线性变换, 则不会改变变换的完全重构特性。
由于在原始窗的快变点处做突然变化会产生高频信息, 这会降低编码效 率, 因此在步骤 23中, 在所述对分析窗函数的所述快变点位置以后的函数值 进行等比例的缩小中, 可在快变点附近加过渡块使快变点附近的分析窗函数 值缓慢变化。 加过渡块的窗函数方法为: 假设窗函数为 其中0≤ " ≤ 2M— 量化后的突变强度为^ 快变点位置是 L。 如果不加过渡块, 则修正后的窗函 数 为:
如果加过渡块, 并且过渡块的长度为快变点位置的前 个样本点和后 -i 个样
(n = (S (n - L + l)
其中 为线性函数: gW— l "~。如图 1 3所示是本发明控制前 回声的编码方法的加过渡块的修正后的分析窗函数的示意图。 与编码时修正 分析窗函数相对应, 在解码时也要增加过渡块的处理, 如图 14所示是本发明 控制前回声的解码方法的加过渡块的修正后的综合窗函数的示意图, 图 13的 过渡块 13与图 14中的过渡块 14长度均为 64个样本点。 前已证明, 只要是 对原始窗做线性变换, 不会改变变换的完全重构特性, 所以我们还可以根据 信号类型对分析窗函数或综合窗做任意的线性变换。 这里所指的加过渡段的 窗函数或对窗函数局作任意线形变换都可以针对以上所有实施例中的编码解 码方法中采用的分析窗或综合窗。 在步骤 27中, 所述量化和熵编码包括非线性量化和熵编码两个步驟, 其 中量化处理可采用标量量化法或矢量量化法。 所述标量量化法可采用 MPEG. AAC所用的非线性标量, 所述矢量量化法可釆用 MPEG TwinVQ的矢量量化。 所述的量化处理也可以采用一种基于极小化全局噪声掩蔽比准则和熵编码的 量化的音频编码方法(专利申请号 03146213. 8 ) 。 在经过量化处理后, 利用 熵编码技术进一步去除量化后的系数以及边信息的统计冗余, 最后得到压缩 音频码流。
如图 15所示是本发明控制前回声的编码装置实施例 2的结构框图。本实 施例在本发明的控制前回声的编码装置的实施例 1的基础上, 增加了一个子 带分析模块 307, 该模块与信号类型分析模块 301相连接, 用于对所述输入 音频信号进行子带分析。 所述子带分析可以对每个频率段按照突变强度的不 同和信号性质的不同而对窗函数做不同的修正, 例如一般低频段不产生前回 声现象, 那么就可以不对低频段的窗函数做修正, 从而更加灵活的控制不同 频率段的窗函数修正。
针对于上述编码装置,本发明公开了控制前回声的编码方法实施例 2 ,如 图 16所示是本发明控制前回声的编码方法实施例 2的流程图, 步驟如下: 步 骤 40、 子带分析模块 307对输入音频信号帧作子带分析, 子带分析是按照频 率进行分段的, 将音频信号帧分为多路子带音频信号; 步骤 41、 信号类型分 析模块 301分别判断多路子带音频信号帧的信号类型是否为快变类型信号, 是则执行步骤 42, 否则执行步骤 45; 步骤 42、 所述信号类型分析模块 301 分别对多路子带音频信号帧计算快变点位置的参数及所述多路子带音频信号 帧的突变强度参数,并分别对多路子带音频信号帧的突变强度参数进行量化, 得到多路子带音频信号帧的突变强度的量化值;步骤 43、修正窗函数模块 302 分别对分析窗函数的所述快变点位置以后的函数值进行等比例的缩小, 缩小 的值等于所述多路子带音频信号帧的突变强度的量化值, 得到 ' 正后的分析 窗函数; 步骤 44、 所述修正窗函数模块 302用修正后的分析窗函数分别对所 述多路子带音频信号帧进行加窗, 得到加窗后的多路子带时域信号, 并执行 步骤 46; 步骤 45、 所述修正窗函数模块 302用原始的分析窗函数对所述多路 子带音频信号帧进行加窗,得到加窗后的时域信号,并执行步骤 46; 步骤 46、 时频映射模块 304对所述加窗后的多路子带时域信号进行时频映射处理, 得 到频域系数; 步驟 47、 量化和熵编码模块 305将多路子带频域系数整合; 步 驟 48、 量化和嫡编码模块 305根据心理声学模块 303对音频信号帧进行心理 声学处理而得到的尺度因子带的掩蔽阈值参数, 对所述频域系数进行量化和 熵编码, 得到编码后的音频码流; 步骤 49、 码流复用模块 306将所述编码后 的音频码流和所述信号类型分析的结果进行复用, 得到压缩音频码流。
在以上的解码方法的步骤 41中,在所述信号类型分析模块 301对多路子 带音频信号帧的信号类型进行判断的同时, 心理声学模块 303对输入音频信 号帧进行心理声学处理, 得到尺度因子带的掩蔽阈值参数。 所述心理声学处 理是根据人耳听觉特性计算当前帧信号的掩蔽曲线, 根据掩蔽曲线可以计算 特定时频区域的掩蔽阔值, 用于指导对当前音频帧信号的量化, 这里的心理 声学模型可以是 MPEG AAC所用的第一类或第二类心理声学模型。
本发明的编码方法实施例 2的优点是可以对每个频率段按照突变强度的 不同和信号性质的不同而对窗函数做不同的修正, 如一般低频段不产生前回 声现象, 那么就可以不对低频段的窗函数做修正, 从而更加灵活的控制不同 频率段的窗函数修正。
如图 17所示是本发明控制前回声的解码装置实施例 1的结构框图。该装 置由以下功能模块组成: 码流解复用模块 401 , 用于对压缩音频码流进行解 复用; 逆量化和熵解码模块 402 , 与所述码流解复用模块 401连接, 用于对 所述解复用后的音频码流进行解码和逆量化, 并输出逆量化后的频域系数; 频时映射模块 403 , 与所述逆量化和嫡解码模块 402连接, 用于将所述逆量 化后的频域系数变换为时域信号, 频时映射模块 403由滤波器组构成, 所述 滤波器组为与编码装置相对应的逆变换滤波器组; 修正窗函数模块 404 , 与 所述频时映射模块 403连接, 用于修正综合窗函数和对所述时域信号进行加 窗处理。
如图 18所示是本发明控制前回声的解码方法实施例 1的流程图, 步骤如 下: 步骤 31、 码流解复用模块对输入的压缩音频码流进行解复用, 得到解复 用后的音频码流和边信息; 步骤 32、 逆量化和熵解码模块对所述解复用后的 音频码流进行逆量化和熵解码, 得到逆量化后的频域系数; 步骤 33、 频时映 射模块对所述逆量化后的频域系数进行频时映射处理, 得到时域信号; 步骤
34、 修正窗函数模块根据所述解复用后的边信息判断所述音频信号帧的信号 类型是否为快变类型, 是则执行步骤 35 , 否则执行步骤 37; 步骤 35、 修正 窗函数模块对综合窗函数的所述快变点位置以后的函数值进行等比例的放 大, 放大的值等于所述突变强度的量化值, 得到修正后的综合窗函数; 步骤 36、 所述修正窗函数模块用修正后的综合窗函数对所述时域信号进行加窗, 得到重构后的音频信号; 步樣 37、 所述修正窗函数模块用原始的综合窗函数 对所述时域信号进行加窗, 得到重构后的音频信号。
在步驟 33中,对频域系数进行频时映射以及修正窗函数处理的方法与编 码方法中的时频映射以及修正窗函数处理方法相对应 , 都是根据所述压缩音 频码流中的编码控制信息来选择对应的逆映射以及窗函数, 频时映射处理可 采用逆离散余弦变换(IDCT ) 、 逆离散傅立叶变换 、 逆修正离散余 弦变换(IMDCT )等方法来实现。
下面以逆 4务正离散余弦变换 IMDCT为例说明频时映射过程。 由于频时映 射和加窗处理是不可分割的, 所以此处对频时映射和修正窗函数一起考虑。
首先对逆量化语进行 IMDCT变换, 得到变换后的时域信号 x' 。 IMDCT变
X. + nQ)(k 4-丄) )
换的表达式为: ' 2入其中, η表示样本序号, 且 0≤« < N , Ν表示窗的长度, "o= (N/2+l) / 2; i表示帧序号; k表示语序号。
其次, 对 DCT变换获得的时域信号在时域进行加窗处理。 为满足完全 重构条件, 窗函数 w (n)必须满足以下两个条件: w(2M- = 且 w2 (ji) + w2 (n + M) = l 最后, 对上述加窗时域信号进行叠加处理, 得到时域音频信号。 具体是: 将加窗操作后获得的信号的前 Ν/2个样本和前一帧信号的后 Ν/2个样本重叠 相加, 获得 /2个输出的时域音频样本, ^ timeS隱 i,n = preSami,n + preSam一 η , 其中 i表示帧序号, n表示样本序号, 有 2 , 且 Ν为冒的长度。
如图 9和 11所示, 所述的综合窗函数修正在前面已经说明, 原始综合窗 函数所述的修正处理是: 对快变点以后的窗函数值进行等比例的放大, 放大 的值等于量化后突变强度的大小,修正后的综合窗函数如图 11所示。对与编 码时采用的分析窗相对应的综合窗作上述修正后仍可满足完全重构条件, 在 前面已经证明。
由于在原始窗的快变点处做突然变化会产生高频信息, 这会降低编码效 率, 因此在步骤 35中, 对应于编码时的修正处理, 在所述对综合窗函数的所 述快变点位置以后的函数值进行等比例的放大中, 可在快变点附近加过渡块 使快变点附近的分析窗函数值緩慢变化。 加过渡块的窗函数方法为: 假设窗 函数为《其中 0≤"≤2Μ - 1 , 量化后的突变强度为 快变点位置是 L。 如果 不加过渡块, 则修正后的窗函数 为:
如果加过渡块, 并且过渡块的长度为快变点位置的前 /个样本点和后 - 1 个样本点, 则修正后的窗函数 为:
w(n) 0≤n < L -I
w' n) = w(n) /g(n) L -I≤n≤L + I-l
w(n)/s L + I≤n≤2M -l
(n - L + l)
其中 为线性函数: ~" 21 ^。如图 14所示是本发明控制前 回声的解码方法的加过渡块的修正后的综合窗函数的示意图, 图 14中的过渡 块 14长度均为 64个样本点。 前已证明, 只要是对原始窗做线性变换, 不会 改变变换的完全重构特性, 所以我们还可以根据信号类型对分析窗函数或综 合窗做任意的线性变换。 这里所指的加过渡段的窗函数或对窗函数局作任意 线形变换都可以针对以上所有实施例中的编码解码方法中采用的分析窗或综 合窗。
如图 19所示是本发明控制前回声的解码装置实施例 1的结构框图。本实 施例在本发明的控制前回声的解码装置的实施例 1的基础上, 增加了一个子 带合成模块 405 , 该模块与修正窗函数模块 404相连接, 用于将多路重构后 的子带时域信号进行子带合成。
针对于上述解码装置,本发明公开了控制前回声的解码方法实施例 2 ,参 见图 20 , 图 20是本发明控制前回声的解码方法实施例 2的流程图, 步驟如 下: 步骤 51、 码流解复用模块对输入的压缩音频码流进行解复用, 得到解复 用后的音频码流和边信息; 步骤 52、 逆量化和熵解码模块对解复用后的音频 码流按频率分为多路; 步骤 53、 逆量化和熵解码模块分别对所述多路解复用 后的音频码流进行逆量化和熵解码, 得到逆量化后的频域系数; 步骤 53、 频 时映射模块分别对多路所述逆量化后的频域系数进行频时映射处理, 得到多 路时域信号; 步骤 54、 修正窗函数模块根据所述解复用后的边信息分别判断 所述多路音频信号帧的信号类型是否为快变类型, 是则执行步骤 55 , 否则执 行步骤 57; 步骤 55、修正窗函数模块分别对多路的综合窗函数的所述快变点 位置以后的函数值进行等比例的放大,放大的值等于所述突变强度的量化值, 得到修正后的综合窗函数; 步骤 56、 所述修正窗函数模块用修正后的综合窗 函数分别对所述多路时域信号进行加窗, 得到多路的重构后的音频信号, 然 后执行步驟 58; 步驟 57、 所述修正窗函数模块用原始的综合窗函数分别对所 述多路时域信号进行加窗,得到多路的重构后的音频信号,然后执行步骤 58; 步骤 58、 子带合成模块对多路的重构后的音频信号进行合成。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其 限制; 尽管参照较佳实施例对本发明进行了详细的说明, 所属领域的普通技 术特征进行等同替换; 而不脱离本发明技术方案的精神, 其均应涵盖在本发 明请求保护的技术方案范围当中。

Claims (29)

  1. 权 利 要 求
    1、 一种控制前回声的编码装置., 其中包括:
    一信号类型分析模块, 用于判断输入音频信号帧的信号类型, 并输出快 变点位置和量化后的突变强度参数;
    一修正窗函数模块, 与所述信号类型分析模块连接, 用于修正分析窗函 数和对所述输入音频信号帧进行加窗处理, 并输出加窗后的时域音频信号; 一时频映射模块, 与所述修正窗函数模块连接, 用于将所述加窗后的时 域音频信号转换为频域系数;
    一心理声学分析模块, 用于对所述输入音频信号帧进行心理声学处理, 并输出尺度因子带的掩蔽阈值参数;
    一量化和熵编码模块, 分别与所述时频映射模块和所述心理声学分析模 块连接, 用于根据所述心理声学分析模块输出的所述掩蔽阈值参数, 对所述 时频映射模块输出的频域系数进行量化和熵编码, 并输出编码码流;
    一码流复用模块, 与所述量化和熵编码模块和所述信号类型分析模块相 连接, 用于将所述量化和熵编码模块输出的所述编码码流和信号类型分析模 块输出的结果进行复用, 并形成音频编码码流。
  2. 2、 根据权利要求 1所述的控制前回声的编码装置, 其中所述的信号类 型分析模块包括:
    一信号类型分析器, 与所述修正窗函数模块和码流复用相连接, 用于判 断所述输入音频帧信号是緩变类型信号还是快变类型信号;
    一计算快变点位置器, 与所述信号类型分析器、 修正窗函数模块和码流 复用模块相连接, 用于计算快变点的位置;
    一突变强度计算器, 与所述信号类型分析器和码流复用模块相连接, 用 于计算信号的突变强度;
    一突变强度量化器, 与所述突变强度计算器、 修正窗函数模块和码流复 用模块相连接, 用于对所述计算信号的突变强度进行量化。
  3. 3、 根据权利要求 1所述的控制前回声的编码装置, 其中所述时频映射 模块由滤波器组构成。
  4. 4、 根据权利要求 3所述的控制前回声的编码装置, 其中所述滤波器组 为离散傅立叶变换滤波器组或离散余弦变换滤波器组; 分析窗函数中的窗长 与帧长相等。
  5. 5、 根据权利要求 4所述的控制前回声的编码装置, 其中所述分析窗函 数为汉宁窗、 汉明窗或布莱克曼窗。
  6. 6、 根据权利要求 3所述的控制前回声的编码装置, 其中所述滤波器组 为修正离散余弦变换滤波器组; 分析窗函数中的窗长为帧长的两倍。
  7. 7、 根据权利要求 6所述的控制前回声的编码装置, 其中所述分析窗函 数为符合修正离散余弦变换条件的窗函数。
  8. 8、 根据权利要求 1所述的控制前回声的编码装置, 其中所述信号类型 分析模块还连接有一个子带分析模块, 用于对所述输入音频信号帧进行子带 分析。
  9. 9、 一种控制前回声的编码方法, 其中包括以下步骤:
    步驟 1、 信号类型分析模块判断输入音频信号帧的信号类型是否为快变 类型信号, 是则所述信号类型分析模块计算快变点位置的参数及所述音频信 号帧的突变强度参数, 并将该突变强度参数进行量化, 得到突变强度的量化 值, 然后执行步驟 2; 否则所述修正窗函数模块用原始的分析窗函数对所述 音频信号帧进行加窗, 得到加窗后的时域信号, 然后执行步骤 4;
    步骤 2、 修正窗函数模块对分析窗函数进行线性变换, 得到修正后的分 析窗函数;
    步骤 3、 所述修正窗函数模块用修正后的分析窗函数对所述音频信号帧 进行加窗, 得到加窗后的时域信号;
    步骤 4、 时频映射模块对所述加窗后的时域信号进行时频映射处理, 得 到频域系数;
    步骤 5、 量化和熵编码模块根据心理声学模块对音频信号帧进行心理声 学处理而得到的尺度因子带的掩蔽阈值参数, 对所述频域系数进行量化和熵 编码, 得到编码后的音频码流;
    步骤 6、 码流复用模块将所述编码后的音频码流和所述信号类型分析的 结果进行复用, 得到压缩音频码流。
  10. 10、 根据权利要求 9所述的控制前回声的编码方法, 其中所述步骤 1中 信号类型分析模块判断输入音频信号帧的信号类型是否为快变类型信号具体 为, 信号类型分析模块对所述音频信号帧进行基于自适应阈值和波形预测的 前、 后向掩蔽效应分析, 以判断所述音频信号帧的信号类型。
  11. 11、 才 据权利要求 9所述的控制前回声的编码方法,其中所述步骤 2中, 在所述对分析窗函数的所述快变点位置以后的函数值进行等比例的缩小中, 可在快变点附近加过渡块使快变点附近的分析窗函数值緩慢变化。
  12. 12、 才艮据权利要求 9所述的控制前回声的编码方法, 其中所述步骤 2中 所述线性变换为对所述分析窗函数的快变点位置以后的函数值进行等比例的 缩小, 缩小的值等于所述突变强度的量化值。
    13、 根据权利要求 9所述的控制前回声的编码方法,其中所述步骤 4中, 所述时频映射处理为离散傅立叶变换或离散余弦变换, 其中, 所述分析窗函 数的窗长与所述音频信号帧的长度相等。
  13. 14、 根据权利要求 13所述的控制前回声的编码方法, 其中所述分析窗 函数为汉宁窗、 汉明窗或布莱克曼窗。
  14. 15、 根据权利要求 9所述的控制前回声的编码方法,其中所述步骤 4中, 所述时频映射处理为修正离散余弦变换, 其中, 所述分析窗函数的窗长为所 述音频信号帧的长度的两倍。
  15. 16、 根据权利要求 15所述的控制前回声的编码方法, 其中所述分析窗 函数为符合修正离散余弦变换条件的窗函数。
    17、 根据权利要求 9所述的控制前回声的编码方法,其中在步骤 1之前, 首先子带分析模块对所述音频信号帧做子带分析, 得到多路子带音频信号, 并在步骤 4之后将多路子带频域系数进行整合。
  16. 18、 根据权利要求 17所述的控制前回声的编码方法, 其中所述子带分 析模块对所述音频信号帧做子带分析为: 子带分析模块以频率分段的方式对 所述音频信号帧作子带分析。
  17. 19、 根据权利要求 9所述的控制前回声的编码方法, 其中所述步骤 5中 心理声学模块对音频信号帧进行心理声学处理, 为心理声学模块采用运动图 象专家组高级音频编码所用的第一类或第二类模型对所述音频信号帧进行心 理声学处理。 20、 根据权利要求 9所述的控制前回声的编码方法, 其中所述步骤 5中 量化和熵编码模块对所述频域系数进行量化为, 量化和熵编码模块采用标量 量化法或矢量量化法对所述频域系数进行量化。
  18. 21、 根据权利要求 20所述的控制前回声的编码方法, 其中所述标量量 化法为运动图象专家组高级音频编码所采用的非线性标量法。
  19. 22、 根据权利要求 20所述的控制前回声的编码方法, 其中所述矢量量 化法为运动图象专家组双矢量量化所采用的矢量量化法。
  20. 23、 根据权利要求 9所述的控制前回声的编码方法, 其中所述步骤 2中 的分析窗函数采用固定长度的窗函数, 长度为大于 1的整数, 优选 2的 N次 方, 其中 N为自然数。
  21. 24、 一种控制前回声的解码装置, 其中包括:
    一码流解复用模块, 用于对压缩音频码流进行解复用;
    一逆量化和熵解码模块, 与所述码流解复用模块连接, 用于对所述解复 用后的音频码流进行解码和逆量化, 并输出逆量化后的频域系数;
    一频时映射模块, 与所述逆量化和熵解码模块连接, 用于将所述逆量化 后的频域系数变换为时域信号;
    一修正窗函数模块, 与所述频时映射模块连接, 用于修正综合窗函数和 对所述时域信号进行加窗处理。
  22. 25、 根据权利要求 24所述的控制前回声的解码装置,其中所述修正窗函 数模块还连接有子带合成模块, 用于将多路重构后的子带时域信号进行子带 合成。
  23. 26、 根据权利要求 24所述的控制前回声的解码装置, 其中所述频时 映射模块由滤波器组构成。
  24. 27、 根据权利要求 <sup>2</sup>6所述的控制前回声的解码装置, 其中所述滤波器 组为与编码装置相对应的逆变换滤波器组。
  25. 28、 一种控制前回声的解码方法, 其中包括以下步骤:
    步骤 1、 码流解复用模块对输入的压缩音频码流进行解复用, 得到解复 用后的音频码流和边信息;
    步驟 2 , 逆量化和熵解码模块对所述解复用后的音频码流进行逆量化和 熵解码, 得到逆量化后的频域系数;
    步骤 3、 频时映射模块对所述逆量化后的频域系数进行频时映射处理, 得到时域信号;
    步骤 4、 修正窗函数模块根据所述解复用后的边信息判断所述音频信号 帧的信号类型是否为快变类型, 是则执行步骤 5; 否则执行步驟 6;
    步骤 5、 修正窗函数模块对综合窗函数进行线性变换, 得到修正后的综 合窗函数, 然后用修正后的综合窗函数对所述时域信号进行加窗, 得到重构 后的音频信号;
    步骤 6、 所述修正窗函数模块用原始的综合窗函数对所述时域信号进行 加窗, 得到重构后的音频信号。
    29、 ^^据权利要求 28所述的控制前回声的解码方法, 其中所述步骤 5 中,在所述对综合窗函数的所述快变点位置以后的函数值进行等比例的放大, 可在快变点附近加过渡块使快变点附近的综合窗函数緩慢变化。
  26. 30、 根据权利要求 28所述的控制前回声的解码方法, 其中所述步骤 5 中所述线性变换为对所述综合窗函数的快变点位置以后的函数值进行等比例 的放大, 放大的值等于所述突变强度的量化值。
  27. 31、 根据权利要求 28所述的控制前回声的解码方法, 其中所述步骤 2 之前, 所述逆量化和熵解码模块对所述解复用后的音频码流按频率分段, 并 在所述步骤 5之后对重构后的音频信号进行子带合成。
  28. 32、 根据权利要求 28所述的解码方法,其中所述步驟 4和 5中的综合窗 函数是根据所述压缩音频码流中的编码控制信息选择相应的窗函数。
  29. 33、 根据权利要求 28所述的解码方法, 其中所述步骤 3中的频时映射 是根据所述压缩音频码流中的编码控制信息选择相应的逆映射。
CN200580051158.0A 2005-09-08 2005-09-08 一种控制前回声的编码和解码装置及方法 Pending CN101228574A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2005/001435 WO2007028280A1 (fr) 2005-09-08 2005-09-08 Codeur et decodeur pour commande de pre echo et son procede

Publications (1)

Publication Number Publication Date
CN101228574A true CN101228574A (zh) 2008-07-23

Family

ID=37835353

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200580051158.0A Pending CN101228574A (zh) 2005-09-08 2005-09-08 一种控制前回声的编码和解码装置及方法

Country Status (2)

Country Link
CN (1) CN101228574A (zh)
WO (1) WO2007028280A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102160114B (zh) * 2008-09-17 2012-08-29 法国电信公司 用于对数字音频信号中的前回声进行衰减的方法和装置
CN103327201A (zh) * 2012-03-20 2013-09-25 联芯科技有限公司 残留回声消除方法及***

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101308656A (zh) * 2007-05-17 2008-11-19 展讯通信(上海)有限公司 音频暂态信号的编解码方法
CN101488344B (zh) * 2008-01-16 2011-09-21 华为技术有限公司 一种量化噪声泄漏控制方法及装置
CN109783767B (zh) * 2018-12-21 2023-03-31 电子科技大学 一种短时傅里叶变换窗长的自适应选择方法
CN114002733B (zh) * 2021-10-27 2024-01-23 武汉科技大学 微震波信号初至到时自动拾取方法及微震监测装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03132228A (ja) * 1989-10-18 1991-06-05 Victor Co Of Japan Ltd 直交変換信号符号化復号化方式
US5960390A (en) * 1995-10-05 1999-09-28 Sony Corporation Coding method for using multi channel audio signals
JP2001265392A (ja) * 2000-03-17 2001-09-28 Victor Co Of Japan Ltd 音声符号化装置及びその方法
JP2003216188A (ja) * 2002-01-25 2003-07-30 Matsushita Electric Ind Co Ltd オーディオ信号符号化方法、符号化装置、及び記憶媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102160114B (zh) * 2008-09-17 2012-08-29 法国电信公司 用于对数字音频信号中的前回声进行衰减的方法和装置
CN103327201A (zh) * 2012-03-20 2013-09-25 联芯科技有限公司 残留回声消除方法及***
CN103327201B (zh) * 2012-03-20 2016-04-20 联芯科技有限公司 残留回声消除方法及***

Also Published As

Publication number Publication date
WO2007028280A1 (fr) 2007-03-15

Similar Documents

Publication Publication Date Title
KR101586317B1 (ko) 신호 처리 방법 및 장치
JP5539203B2 (ja) 改良された音声及びオーディオ信号の変換符号化
CN101878504B (zh) 使用时间分辨率能选择的低复杂性频谱分析/合成
AU2005217517B2 (en) Device and method for processing a multi-channel signal
JP5520994B2 (ja) 合成フィルターバンク
CN100454389C (zh) 声音编码设备和声音编码方法
JP3623449B2 (ja) 符号化されたオーディオ信号中のエラーを隠蔽する方法と装置および符号化されたオーディオ信号を復号化する方法と装置
CA2698031C (en) Method and device for noise filling
CN104995680B (zh) 使用高级频谱延拓降低量化噪声的压扩装置和方法
CN101662288B (zh) 音频编码、解码方法及装置、***
RU2680352C1 (ru) Способ и устройство для определения режима кодирования, способ и устройство для кодирования аудиосигналов и способ и устройство для декодирования аудиосигналов
CN107925388A (zh) 用于增强瞬时处理的后置处理器、预处理器、音频编码器、音频解码器及相关方法
JP2015172779A (ja) オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置
CN102150202A (zh) 对音频/语音信号进行编码和解码的方法和设备
KR20130133848A (ko) 스펙트럼 도메인 잡음 형상화를 사용하는 선형 예측 기반 코딩 방식
JP2003140697A (ja) オーディオ信号を符号化する方法及び装置
CN101460998A (zh) 音频信号的线性预测编码
JP2014531064A (ja) 音声信号符号化方法及び復号化方法とこれを利用する装置
CN104978970A (zh) 一种噪声信号的处理和生成方法、编解码器和编解码***
US20110125507A1 (en) Method and System for Frequency Domain Postfiltering of Encoded Audio Data in a Decoder
CN101228574A (zh) 一种控制前回声的编码和解码装置及方法
CN115171709B (zh) 语音编码、解码方法、装置、计算机设备和存储介质
Makhoul et al. Time-scale modification in medium to low rate speech coding
CN104981981A (zh) 数字音频信号中的前回声的有效衰减
KR20080034819A (ko) 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080723