CN1420487A - 1kb/s线谱频率参数的一步插值预测矢量量化方法 - Google Patents
1kb/s线谱频率参数的一步插值预测矢量量化方法 Download PDFInfo
- Publication number
- CN1420487A CN1420487A CN02156676A CN02156676A CN1420487A CN 1420487 A CN1420487 A CN 1420487A CN 02156676 A CN02156676 A CN 02156676A CN 02156676 A CN02156676 A CN 02156676A CN 1420487 A CN1420487 A CN 1420487A
- Authority
- CN
- China
- Prior art keywords
- vector
- lsf
- frame
- omega
- residual error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000013598 vector Substances 0.000 title claims abstract description 97
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000003595 spectral effect Effects 0.000 title claims description 20
- 238000013139 quantization Methods 0.000 claims description 23
- 238000011002 quantification Methods 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 7
- 238000013461 design Methods 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 abstract 1
- 238000001228 spectrum Methods 0.000 description 8
- 238000005070 sampling Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
1kb/s线谱频率参数的一步插值预测矢量量化方法,属于语音信号处理,可应用于中低速率语音编码和参数语音合成***中。本发明矢量量化的工作过程是在计算机处理器中完成,其特征在于,基于矢量量化原理,利用LSF参数的帧间和帧内相关性,在帧内采用一步预测和在帧间采用一步内插的方法设计了一种1kb/s LSF参数的矢量量化器,对通过一步内插预测过程消除冗余度的LSF预测残差矢量进行矢量量化,获得了透明的量化结果,满足了低速率语音编码对声道参数进行透明量化的要求。
Description
技术领域
1kb/s线谱频率参数的一步插值预测矢量量化方法,属于语音信号处理,可应用于中低速率语音编码和参数语音合成***中。
背景技术
表征声道特性的线性预测(LP-Linear Prediction)参数的高效量化问题是语音信号处理研究领域的热点研究课题。若想获得高质量的合成语音,必须采用高效的量化技术对LP系数进行量化,使由LP系数量化引起的平均谱失真小于1dB,从而满足高质量的语音编码和语音合成***中对LP系数要“透明量化”的要求。迄今为止,线谱频率参数LSF(LSF-LineSpectrum Frequencies)参数是表达LP系数的最有效方式,在相对低的编码速率,使用LSF参数可以获得高质量的合成语音。
对于低速率语音编码,人们希望用尽可能少的比特数量化LSF参数,达到透明量化的指标。标量量化是常见的一种LSF参数量化方法,这种方法是对每一个LSF参数分别量化,若要达到平均谱失真小于1dB,则每帧至少需要32比特。在低速率语音编码情况下,比如在5kb/s以下速率,分配给LSF参数的比特数比较少,这时标量量化显然不是适合的方法。
由于矢量量化在相同的比特数下能比标量量化给出更低的量化失真,所以,在低速率语音编码和参数语音合成中,LSF参数的量化主要采用矢量量化的方法,但直接应用矢量量化方法会存在码书存储量大、计算复杂度高等问题。为了克服这些问题,人们大多采用各种次优矢量量化方法,如,多级矢量量化、***矢量量化和预测矢量量化等。但这些方法透明量化LSF参数所需的比特率都较高,一般都在1kb/s以上。
发明内容
表征语音声道特性的p个线谱频率(LSF-Line SpectrumFrequencies)参数不但在相邻帧之间存在很强的相关性,而且p个线谱频率之间也存在很强的相关性,有效地消除这两种相关性,可大大提高LSF参数的量化效率。
本发明是基于矢量量化原理,利用LSF参数的帧间和帧内相关性,在帧内采用一步预测和在帧间采用一步内插的方法设计了一种1kb/s LSF参数的矢量量化器,对通过一步内插预测过程消除冗余度的LSF预测残差矢量r(n)进行矢量量化。
本发明矢量量化的工作过程是在计算机处理器中完成,其技术方案如图1所示。
图1中ω(n)为去除均值的第n帧LSF矢量,
为去除均值的第n帧LSF的量化矢量,
为第n帧ω(n)的预测矢量,r(n)为第n帧LSF的预测误差矢量,
为第n帧量化的LSF预测误差矢量,k1 (n)和k2 (n)分别表示第n帧两个LSF残差码书的码矢量标号。图1的工作原理如下:
编码端:
首先,将第n帧量化的第i-1个线谱频率
与第n-1帧量化的第i个线谱频率
的加权和作为第n帧的第i个线谱频率的预测值
,即 式中αi和βi称为权系数。由于本发明仅考虑了第n帧与第n-1帧的LSF相关性以及第n帧的第i个LSF和第i-1个LSF的相关性,所以称上述加权求和过程为一步内插预测过程,一步内插是指将第n-1帧量化的第i个线谱频率
乘以权系数βi,一步预测是指将第n帧量化的第i-1个线谱频率
乘以权系数αi,所以,我们又称αi和βi为帧内预测系数和帧间内插系数。权系数αi和βi可以从训练序列中估计出来,并在量化器中保持为常数。αi和βi的具体估计方法为:
令第i个LSF的平方预测误差为: 式中Nf为LSF训练矢量的总数,ri (n)为r(n)的第i个元素。估计时用原始数据ωi (n)代替量化数据
。根据最小二乘估计原理,令Ei/αi=0和Ei/βi=0,并解二元一次方程,得系数αi和βi为:
α1=0.0
第二,将输入量化器的无偏线谱频率ωi (n)与其预测值
相减,得到LSF残差矢量r(n)。预测误差ri (n)的动态范围比ωi (n)的动态范围减小了很多,因而非常适合于作为量化的对象以提高量化的效率,这一点可以从图2和图3的归一化统计直方图中看出。其中,图2是ωi (n)的统计直方图,图3是ri (n)的统计直方图,横坐标表示归一化的LSF预测误差。
第三,将预测误差矢量r(n)***成两个子矢量,令前四个分量构成一个子矢量,后六个分量构成一个子矢量,这两个子矢量分别与两个10bit码书中的码矢量进行Paliwal加权失真比较,得到两个重构的残差子矢量
i=1,…,4和i=5,…,10,这里k1 (n)和k2 (n)分别表示进入信道的两个残差码书的码矢量标号,将这两个重构的残差子矢量合并,得到重建的残差矢量
图1中的LSF残差码书由1个4维矢量码书和1个6维矢量码书构成,每个码书均包含1024个码矢量,即各为10比特码书。4维矢量码书由r(n)的前4个元素的训练序列获得,6维矢量码书由r(n)的后6个元素的训练序列获得。4维和6维预测残差码书均采用传统的LBG算法训练,训练数据为汉语语音,长度约为1个小时,采样率为8kHz,精度为16位线性PCM。
4维和6维残差输入矢量分别与4维和6维残差码书中的每一个码矢量进行失真比较时,使用的失真测度为: 和 式中Ci和Wi为Paliwal加权因子,γ=0.15为Paliwal经验常数。
译码端:
第二,用一步内插预测过程得到LSF的预测矢量
第四,将
加上LSF的均值,得到最终恢复的LSF参数。该均值是事先从所有LSF训练矢量集中计算得到的,在量化器中为常数。
获得了透明的量化结果,满足了低速率语音编码对声道参数进行透明量化的要求。
附图说明图1 LSF参数的一步插值预测矢量量化器原理框图;图2 10个LSF的统计直方图;图3 10个LSF残差的统计直方图;图4. LSF参数谱失真统计直方图;
具体实施方式
按照图1所示本发明的方法框图,在进行LSF参数的量化前,首先,对去除直流成分的输入语音信号进行线性预测分析,帧长为20毫秒,窗为哈明窗,长度为240个样点,窗的中心位于当前帧的右边界,即窗覆盖了前一帧的120个样点和当前帧的120个样点;第二,对加窗的语音进行自相关估计,并使用莱文逊-杜宾递归算法获取10阶LP系数;第三,用0.998k,k=1,…,10乘以LP系数来获取30HZ共振峰带宽展宽的LP系数;最后,将LP系数转化为LSF参数,并减去均值得到无偏的LSF参数ωi (n),i=1,2,…,10。下面给出矢量量化器的实施过程:
编码端:
第二步,按下式计算预测误差矢量元素ri (n):
第三步,按下式将ri (n)的前4维矢量与4维残差码书中的每个矢量进行失真比较,将产生最小失真的码矢量对应的标号k1 (k)传给译码端: 第四步,按下述逻辑计算
的前四个元素
for i=2 to 4
end
第五步,按下式将ri (n)的后6维矢量与6维残差码书中的每个矢量进行失真比较,将产生最小失真的码矢量对应的标号k2 (n)传给译码端: 在此步骤中,为了保证LSF的有序性,在6维码书中仅搜索 的码矢量。这里,
for i=6 to 10
end至此,编码端完成了全部任务。
译码端:当收到来自编码端的码矢量标号k1 (n)和k2 (n)后,同编码端一样,按如下逻辑得到译码的无偏LSF矢量:
for i=2 to 4
end
for i=5 to 10
end最后重建的LSF矢量为: 实验效果:
本发明用训练语音外的500秒汉语语音产生2500个LSF矢量,经过图1所示的矢量量化器量化,按国际通用的谱失真计算方法,当每帧分配20比特(4维和6维残差码书各用10比特)用于量化LSF参数时,得到的平均谱失真为0.94dB,谱失真介于2dB和4dB之间的帧的百分比仅为1.998%(<2%),而谱失真大于4dB的帧的百分比为零,图4给出了谱失真统计直方图,这些数据说明,本发明中的LSF参数一步插值预测矢量量化方法在1kb/s(=帧速率×比特/帧=50×20)达到了透明的量化性能。
Claims (1)
1、1kb/s线谱频率参数的一步插值预测矢量量化方法,包含在计算机处理器中完成对语音信号的线谱频率参数(LSF)进行量化,本发明的特征在于基于矢量量化原理,利用LSF参数的帧间和帧内相关性,在帧内采用一步预测和在帧间采用一步内插的方法设计了一种1kb/s LSF参数的矢量量化器,对通过一步内插预测过程消除冗余度的LSF预测残差矢量r(n)进行矢量量化,矢量量化的工作流程如下:
编码过程:
首先,将第n帧量化的第i-1个线谱频率
与第n-1帧量化的第i个线谱频率
的加权和作为第n帧的第i个线谱频率的预测值
,即 式中αi和βi称为权系数,又称αi和βi为帧内预测系数和帧间内插系数;一步内插预测过程是指仅考虑第n帧与第n-1帧的LSF相关性以及第n帧的第i个LSF和第i-1个LSF的相关性的加权求和过程;一步内插是指将第n-1帧量化的第i个线谱频率
乘以权系数βi;一步预测是指将第n帧量化的第i-1个线谱频率
乘以权系数αi;根据最小二乘原理,权系数αi和βi可以从LSF的训练序列中计算出来,并在量化器中保持为常数;
第二,将输入量化器的无偏线谱频率ωi (n)与其预测值
相减,得到LSF残差矢量r(n);
第三,将预测误差矢量r(n)***成两个子矢量,令前四个分量构成一个子矢量,后六个分量构成一个子矢量,这两个子矢量分别与两个10bit码书中的码矢量进行Paliwal加权失真比较,得到两个重构的残差子矢量i=1,…,4和
i=5,…,10;这里k1 (n)和k2 (n)分别表示进入信道的两个残差码书的码矢量标号,将这两个重构的残差子矢量合并,得到重建的残差矢量
第四,将重构的残差矢量
加上预测矢量
得到LSF的无偏重构矢量
,该重构矢量
将用于下一帧的一步内插预测过程;
译码过程:
第二,用一步内插预测过程得到LSF的预测矢量
第四,将
加上LSF的均值,得到最终恢复的LSF参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN02156676A CN1420487A (zh) | 2002-12-19 | 2002-12-19 | 1kb/s线谱频率参数的一步插值预测矢量量化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN02156676A CN1420487A (zh) | 2002-12-19 | 2002-12-19 | 1kb/s线谱频率参数的一步插值预测矢量量化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1420487A true CN1420487A (zh) | 2003-05-28 |
Family
ID=4752794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN02156676A Pending CN1420487A (zh) | 2002-12-19 | 2002-12-19 | 1kb/s线谱频率参数的一步插值预测矢量量化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1420487A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008110114A1 (en) * | 2007-03-12 | 2008-09-18 | Huawei Technologies Co., Ltd. | A quantization encoding decoding method and device |
WO2009056047A1 (en) * | 2007-10-25 | 2009-05-07 | Huawei Technologies Co., Ltd. | A vector quantizating method and vector quantizer |
CN101345530B (zh) * | 2007-07-11 | 2010-09-15 | 华为技术有限公司 | 一种矢量量化方法及矢量量化器 |
CN101895373A (zh) * | 2010-07-21 | 2010-11-24 | 华为技术有限公司 | 信道译码方法、***及装置 |
CN101419802B (zh) * | 2007-10-25 | 2011-07-06 | 华为技术有限公司 | 用于语音编码的矢量量化方法及矢量量化器 |
CN101436408B (zh) * | 2007-11-13 | 2012-04-25 | 华为技术有限公司 | 矢量量化方法及矢量量化器 |
CN101283407B (zh) * | 2005-10-14 | 2012-05-23 | 松下电器产业株式会社 | 变换编码装置和变换编码方法 |
US8335260B2 (en) | 2006-12-05 | 2012-12-18 | Huawei Technologies Co., Ltd. | Method and device for vector quantization |
CN102682775B (zh) * | 2006-11-10 | 2014-10-08 | 松下电器(美国)知识产权公司 | 参数解码方法及参数解码装置 |
CN104756187A (zh) * | 2012-10-30 | 2015-07-01 | 诺基亚技术有限公司 | 用于能复原的矢量量化的方法和装置 |
WO2015196837A1 (zh) * | 2014-06-27 | 2015-12-30 | 华为技术有限公司 | 一种音频编码方法和装置 |
CN117423348A (zh) * | 2023-12-19 | 2024-01-19 | 山东省计算中心(国家超级计算济南中心) | 基于深度学习和矢量预测的语音压缩方法及*** |
-
2002
- 2002-12-19 CN CN02156676A patent/CN1420487A/zh active Pending
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101283407B (zh) * | 2005-10-14 | 2012-05-23 | 松下电器产业株式会社 | 变换编码装置和变换编码方法 |
CN102623014A (zh) * | 2005-10-14 | 2012-08-01 | 松下电器产业株式会社 | 变换编码装置和变换编码方法 |
CN102682775B (zh) * | 2006-11-10 | 2014-10-08 | 松下电器(美国)知识产权公司 | 参数解码方法及参数解码装置 |
US8335260B2 (en) | 2006-12-05 | 2012-12-18 | Huawei Technologies Co., Ltd. | Method and device for vector quantization |
WO2008110114A1 (en) * | 2007-03-12 | 2008-09-18 | Huawei Technologies Co., Ltd. | A quantization encoding decoding method and device |
CN101266796B (zh) * | 2007-03-12 | 2012-05-23 | 华为技术有限公司 | 一种量化编解码方法及装置 |
CN101345530B (zh) * | 2007-07-11 | 2010-09-15 | 华为技术有限公司 | 一种矢量量化方法及矢量量化器 |
WO2009056047A1 (en) * | 2007-10-25 | 2009-05-07 | Huawei Technologies Co., Ltd. | A vector quantizating method and vector quantizer |
CN101419802B (zh) * | 2007-10-25 | 2011-07-06 | 华为技术有限公司 | 用于语音编码的矢量量化方法及矢量量化器 |
CN101436408B (zh) * | 2007-11-13 | 2012-04-25 | 华为技术有限公司 | 矢量量化方法及矢量量化器 |
CN101895373B (zh) * | 2010-07-21 | 2014-05-07 | 华为技术有限公司 | 信道译码方法、***及装置 |
CN101895373A (zh) * | 2010-07-21 | 2010-11-24 | 华为技术有限公司 | 信道译码方法、***及装置 |
CN104756187A (zh) * | 2012-10-30 | 2015-07-01 | 诺基亚技术有限公司 | 用于能复原的矢量量化的方法和装置 |
US10109287B2 (en) | 2012-10-30 | 2018-10-23 | Nokia Technologies Oy | Method and apparatus for resilient vector quantization |
WO2015196837A1 (zh) * | 2014-06-27 | 2015-12-30 | 华为技术有限公司 | 一种音频编码方法和装置 |
CN105225670A (zh) * | 2014-06-27 | 2016-01-06 | 华为技术有限公司 | 一种音频编码方法和装置 |
CN105225670B (zh) * | 2014-06-27 | 2016-12-28 | 华为技术有限公司 | 一种音频编码方法和装置 |
US9812143B2 (en) | 2014-06-27 | 2017-11-07 | Huawei Technologies Co., Ltd. | Audio coding method and apparatus |
US10460741B2 (en) | 2014-06-27 | 2019-10-29 | Huawei Technologies Co., Ltd. | Audio coding method and apparatus |
US11133016B2 (en) | 2014-06-27 | 2021-09-28 | Huawei Technologies Co., Ltd. | Audio coding method and apparatus |
CN117423348A (zh) * | 2023-12-19 | 2024-01-19 | 山东省计算中心(国家超级计算济南中心) | 基于深度学习和矢量预测的语音压缩方法及*** |
CN117423348B (zh) * | 2023-12-19 | 2024-04-02 | 山东省计算中心(国家超级计算济南中心) | 基于深度学习和矢量预测的语音压缩方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0942411B1 (en) | Audio signal coding and decoding apparatus | |
US6721700B1 (en) | Audio coding method and apparatus | |
US5684920A (en) | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein | |
EP0910067B1 (en) | Audio signal coding and decoding methods and audio signal coder and decoder | |
US5668925A (en) | Low data rate speech encoder with mixed excitation | |
CN102119414B (zh) | 用于在超帧中量化和逆量化线性预测系数滤波器的设备和方法 | |
US8468017B2 (en) | Multi-stage quantization method and device | |
CA2193577C (en) | Coding of a speech or music signal with quantization of harmonics components specifically and then residue components | |
JPH11143499A (ja) | 切替え型予測量子化の改良された方法 | |
CN1141684A (zh) | 声音编码方法 | |
CN1420487A (zh) | 1kb/s线谱频率参数的一步插值预测矢量量化方法 | |
EP0819303B1 (en) | Predictive split-matrix quantization of spectral parameters for efficient coding of speech | |
US5649051A (en) | Constant data rate speech encoder for limited bandwidth path | |
JP3087814B2 (ja) | 音響信号変換符号化装置および復号化装置 | |
US6622120B1 (en) | Fast search method for LSP quantization | |
CN1124588C (zh) | 信号编码方法及设备 | |
CN101572092A (zh) | 编解码端的固定码本激励的搜索方法及装置 | |
KR100474833B1 (ko) | 예측 및 멜-스케일 이진 벡터를 이용한 가변 차원스펙트럼 진폭 양자화 방법 및 그 장치 | |
US6208962B1 (en) | Signal coding system | |
KR100416363B1 (ko) | 선형 예측 분석 대 합성 엔코딩 방법 및 엔코더 | |
CA2239672C (en) | Speech coder for high quality at low bit rates | |
EP0866443B1 (en) | Speech signal coder | |
Tanaka et al. | Low-bit-rate speech coding using a two-dimensional transform of residual signals and waveform interpolation | |
KR100712409B1 (ko) | 벡터의 차원변환 방법 | |
KR100768090B1 (ko) | 디코딩의 계산량 감소를 위한 파형 인터폴레이션 인코딩장치 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |