JP3050978B2 - 音声符号化方法 - Google Patents

音声符号化方法

Info

Publication number
JP3050978B2
JP3050978B2 JP3335009A JP33500991A JP3050978B2 JP 3050978 B2 JP3050978 B2 JP 3050978B2 JP 3335009 A JP3335009 A JP 3335009A JP 33500991 A JP33500991 A JP 33500991A JP 3050978 B2 JP3050978 B2 JP 3050978B2
Authority
JP
Japan
Prior art keywords
vocal tract
parameter
code
excitation
statistical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3335009A
Other languages
English (en)
Other versions
JPH05165500A (ja
Inventor
浩 桂川
賢一郎 細田
弘美 青柳
義博 有山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3335009A priority Critical patent/JP3050978B2/ja
Publication of JPH05165500A publication Critical patent/JPH05165500A/ja
Application granted granted Critical
Publication of JP3050978B2 publication Critical patent/JP3050978B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声信号の圧縮符号
化方法に関するものである。
【0002】
【従来の技術】8kビット/秒以下の圧縮率での、音声
信号の高能率符号化方法は、Atal等による、コード
励振線形予測符号化方式(以下CELP)が有効な手法
である。これは音声信号を声道のパラメータと、励振源
のパラメータとによって表現するものであり、また、励
振源のパラメータを統計コードブックと適応コードブッ
クの2つによってベクトル量子化することについては、
次の文献に開示されている。
【0003】文献名:N.S.Jayant & J.H.Chen,“Speech
Coding with Time-Varying Bit Allocations to Excit
ation and LPC parameters",Proc,ICASSP-89,(1989)
【0004】
【発明が解決しようとする課題】音声信号は、定常的な
有声音の区間と、過渡的な無声音の区間に分けて考える
ことができ、両者はその統計的な性質は大きく異なって
いる。CELPによる圧縮符号化に関しても、有声音で
は適応コードブックによる音質に対する寄与が非常に大
きいのに対し、無声音ではその寄与はほとんどなく、む
しろ声道パラメータの精度が重要となる。そのため、効
果的な圧縮符号化のためには、有声音の区間のための符
号化方法と、無声音に対する符号化方法を別々に用意す
ることが望ましい。
【0005】従って、本発明は、有声音の場合は適応励
振コードに重点的に情報を配分し、無声音の場合は声道
パラメータに重点的に情報を配分することにより、高品
質・高能率とした音声の圧縮符号化方法を提供せんとす
るものである。
【0006】
【課題を解決するための手段】本発明は次に示す事項で
特定されるCELPの改良である。
【0007】即ち、本発明は、入力音声信号(ベクト
ル)を線形予測分析して声道パラメータ(ベクトル)を
求める手段を持つ。また、入力音声信号の声道パラメー
タを量子化して、量子化された声道パラメータ(声道主
パラメータ)とそれに対応した声道パラメータコードを
出力する声道パラメータ量子化手段を持つ。また、入力
音声信号の前記声道パラメータと、補間後のもしくは補
間をともなわない量子化された前記声道パラメータとの
誤差を対象として量子化し、量子化された声道補正パラ
メータとそれに対応した声道パラメータ補正コードとを
出力する声道補正パラメータ量子化手段を持つ。また、
過去の入力音声信号の励振源パラメータを表わす適応励
振ベクトルを記憶している適応コードブックと、予め定
められている励振源パラメータである統計励振ベクトル
を記憶している統計コードブックとを持つ。更に、量子
化された声道パラメータと励振源パラメータとに基づい
て合成音声信号を作成し、前記入力音声信号と当該合成
音声信号(ベクトル)との誤差を評価することによっ
て、励振源出力コードを決定する。
【0008】そして、本発明は、入力音声信号の長周期
分析を行うことによって有声音か無声音かを判別し、有
声音の場合は、量子化された前記声道パラメータと、前
記適応励振ベクトルと前記統計励振ベクトルとの加算ベ
クトルとに基づいて、前記合成音声信号を作成し、且
つ、前記入力音声信号と当該合成音声信号との誤差を評
価することによって適応励振コードと統計励振コードと
を決定する。
【0009】無声音の場合は、量子化された前記声道パ
ラメータと量子化された前記声道補正パラメータとの加
算値と、前記統計励振ベクトルとに基づいて、前記合成
音声信号を作成し、前記入力音声信号と当該合成音声信
号との誤差を評価することによって統計励振コードとを
決定し、有声音か無声音かに応じて、それぞれ前記適応
励振コード及び前記声道パラメータ補正コードの一方を
他のコードと多重化して出力語とする。
【0010】また、本発明では、出力語として多重化す
る、声道パラメータコード、及び有声音か無声音かの判
別結果の有声無声識別コードはフレーム毎に更新される
情報とし、且つ声道パラメータ補正コード、適応励振コ
ード及び統計励振コードはサブフレーム毎に更新される
情報とすることができる。
【0011】
【作用】本発明の符号化方法では、まず音声の長周期相
関を分析して、有声音か無声音かを判別する。
【0012】有声音であった場合には、適応コードブッ
クを用いて長周期の相関を持つ励振信号ベクトルを符号
化する。
【0013】また、無声音であった場合には、適応コー
ドブックを用いず、その替わりに、声道パラメータの補
正を行うコードブックを用いて、声道パラメータの量子
化、補間などによる誤差を符号化する。
【0014】また、有声無声識別コードはフレーム毎に
更新させてもサブフレーム毎に更新されてもよく、前者
の場合は、補間処理を後段に持ってこれるため、声道パ
ラメータの見通しが容易であり、そのコードブックの作
成に従来ものが利用できる利点がある。
【0015】
【実施例】図1に本発明を適用した符号器のブロック図
を示す。
【0016】図1において、A/D変換された入力音声
信号系列は、特定のフレーム長単位で入力され、声道分
析器101で入力音声信号は声道分析され、声道パラメ
ータを求める。入力音声信号の声道パラメータは声道パ
ラメータ量子化器102で内臓の量子化テーブルを用い
て量子化される。
【0017】量子化された声道パラメータP1に対応し
た声道パラメータコードC1は各フレームで1回、多重
化器113に送られる。
【0018】また、量子化された声道パラメータP1は
補間器103で、フレームをさらに分割したサブフレー
ム単位に補間されて用いられる(声道補間パラメータP
h)。
【0019】現サブフレームで用いられる声道パラメー
タは量子化、および補間による誤差を含んでいる。そこ
で、サブフレーム毎に声道の分析をやりなおして、現サ
ブフレームで分析の結果得られた、誤差を含まない声道
パラメータとの差から、その誤差を減算器114で求
め、その誤差を声道補正パラメータ量子化器104で内
臓の量子化テーブルを用いて量子化し、声道補正パラメ
ータP2を求めておく。
【0020】なお、無声音の場合は、声道補正パラメー
タP2に対応した声道パラメータ補正コードC2が、各
サブフレームに1回、多重化器113に送られる。
【0021】また、長周期分析器105は、入力音声信
号の長周期の相関を計算し、各サブフレーム毎に、現時
刻の入力音声信号の区間が有声音であるか、無声音であ
るかを判別し、その有声無声識別コードC3を多重化器
113に送る。
【0022】有声音であると判別した場合には、スイッ
チ106を閉じ、スイッチ107を開き、適応コードブ
ック108からの適応励振ベクトルと、統計コードブッ
ク109からの統計励振ベクトルを加算器115で加算
して励振ベクトルを構成し、その励振ベクトルから、補
正を受けない声道補間パラメータPhを用いた合成フィ
ルタ110で合成音声信号を合成し、その合成音声信号
と入力音声信号との誤差を、減算器116と誤差計算器
111とで計算する。
【0023】誤差計算器111で得られた誤差から、最
小誤差選択器112で最適な適応励振ベクトルと最適な
統計励振ベクトルを選択する。
【0024】統計励振ベクトルに対応した統計励振コー
ドC4と適応励振ベクトルに対応した適応励振コードC
5とは、各サブフレーム毎に、多重化器113に送られ
る。
【0025】また、無声音と判別した場合には、スイッ
チ106を開き、スイッチ107を閉じて、統計コード
ブック109からの統計励振ベクトルのみで励振ベクト
ルを構成し、また、声道パラメータP1と声道補正パラ
メータP2とを加算器117で加算して補正された声道
パラメータを作成し、統計励振のみの励振ベクトルと補
正された声道パラメータを用いた合成フィルタ110で
合成音声信号を合成し、誤差計算器111で入力音声信
号との誤差を求める。
【0026】無声音の場合には、最小誤差選択器112
は統計コードブック109についてのみ最適な励振ベク
トルを選択する。
【0027】多重化器113は以上のように得られた、
声道パラメータコードP1と、有声無声識別コードC3
と、統計励振コードC5と、また、有声音の場合は、適
応励振コードC2とを、また、無声音の場合は、声道パ
ラメータ補正コードC2とを、多重化して通信回線に送
信する。
【0028】なお、この例では、声道パラメータコード
C1のみフレーム毎の情報であり、他のコードC2〜C
5はサブフレーム毎の情報である。
【0029】図2に、図1の符号化器に対応した復号化
器のブロック図を示す。
【0030】図2において、多重分離器201は通信回
線から受け取った符号語を、声道パラメータC1、有声
無声識別コードC3、統計励振コードC5、および適応
励振コードC4、もしくは声道補正パラメータコードC
2に分離し、復号器の各部に送る。そのとき、もし有声
音であればスイッチ202を適応コードブック205に
つなぎ、無声音であれば声道補正パラメータ逆量子化器
204につなぐ。
【0031】声道パラメータコードC1は声道パラメー
タ逆量子化器203で逆量子化され、声道パラメータP
1となる。さらに、声道パラメータP1は補間器207
で各サブフレーム単位に補間される。
【0032】有声無声識別コードC3が有声音を示して
いる場合には、スイッチ210を閉じ、スイッチ209
を開いて、適応コードブック205からの、適応励振コ
ードC4に対応する最適な適応励振ベクトルと、統計コ
ードブック206からの、統計励振コードC5に対応す
る最適な統計励振ベクトルを加算器211で足し合わせ
て、励振ベクトルを構成し、補正を受けない声道補間パ
ラメータPhを用いた合成フィルタ208で再生音声出
力を合成する。
【0033】逆に、有声無声識別コードC3が無声音を
示している場合には、スイッチ210を聞き、スイッチ
209を閉じて、声道補正パラメータ逆量子化器204
で、声道補正パラメータコードC2を逆量子化して声道
補正パラメータP2を求め、声道パラメータPhを加算
器212で補正する。そして、統計コードブック206
からの、統計励振コードC5に対応する最適な統計励振
ベクトルのみから励振ベクトルを構成し、補正された声
道パラメータを用いた合成フィルタ208で再生音声出
力を合成する。
【0034】図3は、本発明を適用した他の符号化器の
ブロック図を示す。図1の例と異なるのは、有声無声識
別をフレーム単位で行い、サブフレーム単位で行わない
ことである。
【0035】図3において、A/D変換された入力音声
信号系列は、特定のフレーム長単位で入力される。
【0036】まず、声道分析器101で入力音声信号は
声道分析され、声道パラメータを求める。長周期分析器
105は、入力音声信号の長周期の相関を計算し、現時
刻の入力音声信号の区間が有声音であるか、無声音であ
るかを判別する。その判別(C3)はフレーム単位で行
う。
【0037】入力音声信号の声道パラメータは声道パラ
メータ量子化器102で量子化される。量子化された声
道パラメータはP1は各フレームで1回、多重化器11
3に送られる。
【0038】有声音無声音判別の結果C3が無声音であ
る場合には、量子化される前の声道パラメータと量子化
された後の声道パラメータP1との差から、その誤差を
減算器314で求め、その誤差を声道補正パラメータ量
子化器304で量子化し、サブフレーム毎に声道補正パ
ラメータP2を求めておく。
【0039】有声音の場合には、スイッチ307を開
き、量子化された声道パラメータを補間器303で、フ
レームをさらに分割したサブフレーム単位に補間して用
い、無声音の場合には、スイッチ307を閉じ、量子化
された声道パラメータP1と声道補正パラメータPhを
足し合わせたものを補間器303で補間して用いる。
【0040】励振源の符号化については、有声音の場合
には、スイッチ106を閉じ、適応コードブック108
からの適応励振ベクトルと、統計コードブック109か
らの統計励振ベクトルを加算器115で加算して励振ベ
クトルを構成し、合成フィルタ110で合成音声信号を
合成し、その合成音声信号と入力音声信号との誤差を、
減算器116と誤差計算器111とで計算する。誤差計
算器111で得られた誤差から、最小誤差選択器112
で最適な適応励振ベクトルと最適な統計励振ベクトルを
選択する。
【0041】また、無声音と判別した場合には、スイッ
チ106を開き、統計コードブック109からの統計励
振ベクトルのみで励振ベクトルを構成し、合成フィルタ
110で合成音声信号を合成し、減算器116と誤差計
算器111で入力音声信号との誤差を求める。無声音の
場合には、最小誤差選択器112は統計コードブック1
09についてのみ最適な励振ベクトルを選択する。
【0042】多重化器113は以上の装置で得られた、
声道パラメータコードC1、有声無声識別コードC3、
統計励振コードC5、並びに、適応励振コードC4もし
くは声道補正パラメータコードC2の一方を、多重化
し、通信回線に送信する。
【0043】コードC1、C3はフレーム単位に情報で
あり、コードC2、C4、C5はフレーム単位に情報で
ある。
【0044】図4に、図1の符号化器に対応した復号化
器のブロック図を示す。
【0045】図4において、多重分離器201は通信回
線から受け取った符号語を、声道パラメータコードC
1、有声無声識別コードC3、統計励振コードC5、お
よび適応励振コードC4、もしくは声道補正パラメータ
コードC2に分離し、復号器の各装置に送る。そのと
き、もし有声音であればスイッチ202を適応コードブ
ック205につなぎ、無声音であれば声道補正パラメー
タ逆量子化器204につなぐ。
【0046】声道パラメータコードC1は声道パラメー
タ逆量子化器403で逆量子化され、声道パラメータと
なる。
【0047】有声無声識別コードC3が無声音を示して
いる場合には、スイッチ210を開き、スイッチ409
を閉じて、声道補正パラメータ逆量子化器204で、声
道パラメータ補正コードC2を逆量子化して声道補正パ
ラメータP2を求め、声道パラメータを補正する。さら
に、補間器407で各サブフレーム単位に補間される
(Ph)。
【0048】そして、統計コードブック206からの、
統計励振ベクトルコードに対応する最適な統計励振ベク
トルのみから励振信号ベクトルを構成し、補正された声
道パラメータを用いた合成フィルタ408で再生音声出
力を合成する。
【0049】逆に、有声無声識別コードC3が有声音を
示している場合には、スイッチ210を閉じ、スイッチ
409を開いて、適応コードブック205からの、適応
励振コードC4に対応する最適な適応励振ベクトルと、
統計コードブック206からの、統計励振コードC5に
対応する最適な統計励振ベクトルから励振ベクトルを構
成し、補正を受けない声道補間パラメータPhを用いた
合成フィルタ208で再生音声出力を合成する。
【0050】
【発明の効果】本発明により、有声音を効果的に符号化
するような符号化方法と、無声音に対して効果的に符号
化するような符号化方法を、選択的に用いることを可能
とすることで、より高品質、高能率な音声の圧縮符号化
方法を実現できる。
【図面の簡単な説明】
【図1】本発明を適用した符号化器のブロック図
【図2】図1に対応した復号化器のブロック図
【図3】本発明を適用した他の符号化器のブロック図
【図4】図3に対応した復号化器のブロック図
【符号の説明】
101 声道分析器 102 声道パラメータ量子化器 103 補間器 104 声道補正パラメータ量子化器 105 長周期分析器 106 スイッチ 107 スイッチ 108 適応コードブック 109 適応コードブック 110 合成フィルタ 111 誤差計算器 112 最小誤差選択器 113 多重化回路 114 減算器 115 加算器 116 減算器
───────────────────────────────────────────────────── フロントページの続き (72)発明者 有山 義博 東京都港区虎ノ門1丁目7番12号 沖電 気工業株式会社内 (56)参考文献 特開 平1−54497(JP,A) 特開 昭59−172690(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 21/06 H03M 7/30 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力音声信号を線形予測分析して声道パ
    ラメータを求める手段と、 当該声道パラメータを量子化して、量子化された声道パ
    ラメータとそれに対応した声道パラメータコードを出力
    する声道パラメータ量子化手段と、 入力音声信号の前記声道パラメータと、補間後のもしく
    は補間をともなわない量子化された前記声道パラメータ
    との誤差を対象として量子化し、量子化された声道補正
    パラメータとそれに対応した声道パラメータ補正コード
    とを出力する声道補正パラメータ量子化手段と、 過去の入力音声信号の励振源パラメータを表わす適応励
    振ベクトルを記憶している適応コードブックと、 予め定められている励振源パラメータである統計励振ベ
    クトルを記憶している統計コードブックとを備え、 量子化された声道パラメータと励振源パラメータとに基
    づいて合成音声信号を作成し、前記入力音声信号と当該
    合成音声信号との誤差を評価することによって、励振源
    出力コードを決定する音声符号化方法において、 入力音声信号の長周期分析を行うことによって有声音か
    無声音かを判別し、 有声音の場合は、量子化された前記声道パラメータと、
    前記適応励振ベクトルと前記統計励振ベクトルとの加算
    ベクトルとに基づいて、前記合成音声信号を作成し、且
    つ、前記入力音声信号と当該合成音声信号との誤差を評
    価することによって適応励振コードと統計励振コードと
    を決定し、 無声音の場合は、量子化された前記声道パラメータと量
    子化された前記声道補正パラメータとの加算値と、前記
    統計励振ベクトルとに基づいて、前記合成音声信号を作
    成し、前記入力音声信号と当該合成音声信号との誤差を
    評価することによって統計励振コードとを決定し、 有声音か無声音かに応じて、それぞれ前記適応励振コー
    ド及び前記声道パラメータ補正コードの一方を他のコー
    ドと多重化して出力語とすることを特徴とした音声符号
    化方法。
  2. 【請求項2】 請求項1の音声符号化方法において、 出力語として多重化する、声道パラメータコード、及び
    有声音か無声音かの判別結果の有声無声識別コードはフ
    レーム毎に更新される情報であり、且つ声道パラメータ
    補正コード、適応励振コード及び統計励振コードはサブ
    フレーム毎に更新される情報であることを特徴とした音
    声符号化方法。
JP3335009A 1991-12-18 1991-12-18 音声符号化方法 Expired - Fee Related JP3050978B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3335009A JP3050978B2 (ja) 1991-12-18 1991-12-18 音声符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3335009A JP3050978B2 (ja) 1991-12-18 1991-12-18 音声符号化方法

Publications (2)

Publication Number Publication Date
JPH05165500A JPH05165500A (ja) 1993-07-02
JP3050978B2 true JP3050978B2 (ja) 2000-06-12

Family

ID=18283719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3335009A Expired - Fee Related JP3050978B2 (ja) 1991-12-18 1991-12-18 音声符号化方法

Country Status (1)

Country Link
JP (1) JP3050978B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3522012B2 (ja) * 1995-08-23 2004-04-26 沖電気工業株式会社 コード励振線形予測符号化装置
JP3319396B2 (ja) 1998-07-13 2002-08-26 日本電気株式会社 音声符号化装置ならびに音声符号化復号化装置
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
WO2003046891A1 (en) 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks

Also Published As

Publication number Publication date
JPH05165500A (ja) 1993-07-02

Similar Documents

Publication Publication Date Title
JP4550289B2 (ja) Celp符号変換
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
JPH10187197A (ja) 音声符号化方法及び該方法を実施する装置
JP2003044098A (ja) 音声帯域拡張装置及び音声帯域拡張方法
EP1096476B1 (en) Speech signal decoding
JP4558205B2 (ja) スピーチコーダパラメータの量子化方法
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
US6768978B2 (en) Speech coding/decoding method and apparatus
JP3050978B2 (ja) 音声符号化方法
JP3531780B2 (ja) 音声符号化方法および復号化方法
JP2796408B2 (ja) 音声情報圧縮装置
JP4438280B2 (ja) トランスコーダ及び符号変換方法
JPH10207496A (ja) 音声符号化装置及び音声復号装置
JP3510643B2 (ja) 音声信号のピッチ周期処理方法
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JP3232701B2 (ja) 音声符号化方法
KR0155798B1 (ko) 음성신호 부호화 및 복호화 방법
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JP3296411B2 (ja) 音声符号化方法および復号化方法
JP3047761B2 (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3107620B2 (ja) 音声符号化方法
JPH09244695A (ja) 音声符号化装置及び復号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3192051B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000314

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080331

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090331

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100331

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100331

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110331

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees