JP2797348B2 - 音声符号化・復号化装置 - Google Patents

音声符号化・復号化装置

Info

Publication number
JP2797348B2
JP2797348B2 JP63299822A JP29982288A JP2797348B2 JP 2797348 B2 JP2797348 B2 JP 2797348B2 JP 63299822 A JP63299822 A JP 63299822A JP 29982288 A JP29982288 A JP 29982288A JP 2797348 B2 JP2797348 B2 JP 2797348B2
Authority
JP
Japan
Prior art keywords
voiced
sound
frame
determined
voiced sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63299822A
Other languages
English (en)
Other versions
JPH02146100A (ja
Inventor
茂 細井
好男 佐藤
光一 本間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP63299822A priority Critical patent/JP2797348B2/ja
Publication of JPH02146100A publication Critical patent/JPH02146100A/ja
Application granted granted Critical
Publication of JP2797348B2 publication Critical patent/JP2797348B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明はディジタル通信、ボイスメール等に利用する
音声符号化・復号化装置に関する。
従来の技術 第6図(a)は、従来の音声符号化装置を示し、第6
図(b)は、従来の音声復号化装置を示す。
第6図(a)において、14は、リニアPCMによりA/D変
換された音声信号により予測誤差と短期/長期予測フィ
ルタ係数を求める予測器、15は、第7図に示すように、
一定長の複数の信号列(代表ベクトル)が予め格納され
たコードブック15aと、予測器14からの予測誤差をベク
トル量子化して代表ベクトルの番号を出力するベクトル
量子化器15bを備えた量子化器、16は、予測器14からの
短期/長期予測フィルタ係数の量子化値と、量子化器15
からの代表ベクトルの番号を多重化する多重化器であ
る。
第6図(b)において、17は、上記符号器からの短期
予測フィルタ係数及び長期予測フィルタ係数と、代表ベ
クトルの番号を分離する分離器、18は、符号器のコード
ブック15aと同一のコードブック(不図示)を備え、分
離器17からの番号に対応する代表ベクトルを予測誤差と
して出力する逆量子化器、19は、短期予測フィルタ係数
及び長期予測フィルタ係数と逆量子化器18からの代表ベ
クトルにより音声信号を合成する合成器である。
次に、上記従来例の動作を説明する。
第6図(a)において、リニアPCMによりA/D変換され
た音声信号が入力すると、予測器14では、音声信号の近
接サンプル値間の相関を除去するために短期予測フィル
タ係数を求め、この短期予測フィルタ係数により短期予
測誤差を求める。
更に、音声信号の音源ピッチの周期的な相関を除去す
るために、短期予想誤差により長期予測フィルタ係数を
求め、この長期予測フィルタ係数により予測誤差を求め
る。
量子化器15では、この予測誤差の信号列とコードブッ
ク15aの各代表ベクトルの2乗距離を計算し、その値が
最も小さい代表ベクトルの番号を量子化値として出力す
る。
したがって、多重化器16からは、音声信号が短期予測
フィルタ係数及び長期予測フィルタ係数と、代表ベクト
ルの番号に圧縮されたデータとして復号器に送出され
る。
第6図(b)において、合成器19は、符号器の予測器
14のフィルタと逆特性のフィルタを備えており、したが
って、符号器からの短期/長期予測フィルタ係数に応じ
たフィルタにより代表ベクトルを音声信号に復号するこ
とができる。
発明が解決しようとする課題 しかしながら、上記従来の音声符号化装置と音声復号
化装置では、有声音、無声音、無音等の音声の特性にか
かわらず同じ処理を行うので、低ビットレートで音声符
号化する場合、音声の特性に応じて符号化しないので、
復号された音声の品質が良好でなく、符号化効率を向上
することができないという問題点がある。
本発明はこのような問題点を解決するものであり、符
号化効率を向上することができる音声符号化・復号化装
置を提供することを目的とする。
課題を解決するための手段 本発明の音声符号化装置は、上記目的を達成するため
に、音声信号を有声音定常部と、有声音過渡部と無声音
等に分類し、有声音定常部を時間軸上に圧縮し、有声音
過渡部と、圧縮された有声音定常部の予測誤差を出力
し、無声音等と、有声音定常部と有声音過渡部の予測誤
差を量子化するようにしたものである。
また、本発明の音声復号化装置は、上記目的を達成す
るために、無声音等と、有声音定常部と有声音過渡部の
量子化値を逆量子化し、この逆量子化された有声音定常
部と有声音過渡部を音声信号に合成し、この合成された
有声音定常部を時間軸上で伸張するようにしたものであ
る。
作用 本発明は上記構成により、有声音、無声音、無音等の
音声の特性に応じて量子化することができるので、復号
された音声の品質が良好となり、また、符号化効率を向
上することができる。
実施例 以下、図面を参照して本発明の実施例を説明する。第
1図(a)は、本発明に係る音声符号化装置の一実施例
を示すブロック図、第1図(b)は、本発明に係る音声
復号化装置の一実施例を示すブロック図、第2図は、第
1図(a)の予測器を示す詳細なブロック図、第3図
は、第1図(a)の量子化器を示す詳細なブロック図、
第4図は、一般的な音声信号の波形図、第5図は、第1
図(a)の分類器の動作を説明するためのフローチャー
トである。
第1図(a)において、1は、後述するように、入力
した音声信号の特性を分析し、有声音定常部、有声音過
渡部、無声音、無音に分類する分類器、2は、分類器2
からの判定データにより音声信号の有声音定常部の類似
波形を間引き、時間軸上で圧縮する時間軸圧縮器であ
る。
3は、音声信号の有声音により、その予測誤差と短期
/長期予測フィルタ係数を求める予測器であり、予測器
3は、第2図に示すように、有声音により短期予測誤差
を求めるための短期予測フィルタ21と、有声音の近接サ
ンプル値間の相関を除去するために短期予測フィルタ21
の短期予測フィルタ係数を求める短期予測分析器22と、
短期予測フィルタ21からの短期予測誤差により予測誤差
を求めるための長期予測フィルタ23と、有声音の音源ピ
ッチの周期的な相関を除去するために、短期予測誤差に
より長期予測フィルタ23の長期予測フィルタ係数を求め
る長期予測分析器(ピッチ予測器)24と、短期予測フィ
ルタ係数と長期予測フィルタ係数をそれぞれ量子化する
量子化器25より構成されている。
4は、予測器3からの予測誤差を例えばベクトル量子
化する量子化器であり、量子化器4は、第3図に示すよ
うに、有声音定常部用、有声音過渡部用、無声音用、無
音用の代表ベクトルがそれぞれ格納されたコードブック
31〜34と、分類器1により分類された音声信号の判定デ
ータによりコードブック31〜34の1つを選択し、予測器
3からの予測誤差の信号列と当該コードブックの各代表
ベクトルの2乗距離を計算し、その値が最も小さい代表
ベクトルの番号を量子化値として出力するベクトル量子
化器35より構成されている。
5は、分類器1により分類された音声信号の判定デー
タと、予測器3からの短期/長期予測フィルタ係数の量
子化値と、量子化器4からの代表ベクトルの番号を多重
化する多重化器、10、11はそれぞれ、分類器1により分
類された音声の特性に応じて切り替えられるスイッチで
ある。
第1図(b)において、符号化装置からの伝送データ
を音声信号の判定データと、短期/長期予測フィルタ係
数の量子化値と代表ベクトルの番号に分離する分離器、
7は、符号器のコードブック31〜34と同一のコードブッ
ク(不図示)を備え、分離器6からの音声信号の判定デ
ータにより、当該コードブックを選択し、分離器6から
の番号に対応する代表ベクトルを予測誤差として出力す
る逆量子化器、8は、短期予測フィルタ係数及び長期予
測フィルタ係数と逆量子化器7からの代表ベクトルによ
り、音声信号の有声音を合成する合成器、9は、音声信
号の有声音定常部を時間軸上で伸張する時間軸伸張器、
12、13はそれぞれ、分離器6からの音声信号の判定デー
タに応じて切り替えられるスイッチである。
次に、上記実施例の動作を説明する。
第1図(a)において、リニアPCMによりA/D変換され
た音声信号は、一定の時間長(フレーム)毎に符号化装
置に入力する。
音声信号(アナログ信号)は、第4図に示すように、
無音と、音声の始まりである比較的長い無声音と、無声
音と有声音定常部の間に続く比較的短い有声音過渡部
と、有声音定常部より構成されている。
この音声信号においては、(1)有声音定常部は、類
似した波形が連続して周期性を示し、サンプル間、ピッ
チ周期間で相関が強いという特性があり、(2)有声音
過渡部は、類似波形は連続しないが、サンプル間、ピッ
チ周期間で相関が強いという特性があり、(3)無声音
は、サンプル間、ピッチ周期間で相関が弱く、信号の変
化が激しいという特性があり、(4)無音は、信号の振
幅が小さいという特性がある。
このような音声信号が入力すると、分類器1は、第5
図に示すように、1フレーム内の波形のパワーPwを計算
し(ステップ51)、パワーPwが閾値以上か否かを判別す
る(ステップ52)。パワーPwが閾値未満の場合には、そ
のフレームを無音と判別し(ステップ53)、閾値以上の
場合には有音と判定してステップ54以下に進む。
ステップ55では、1フレーム内の波形の自己相関係数
γ(i)を計算し、計算した自己相関係数γ(i)によ
り、指定されたiにおける最大値γmaxを求め(ステッ
プ56)、この最大値γmaxが閾値以上か否かを判別する
(ステップ57)。最大値γmaxが閾値未満の場合には、
そのフレームを無声音部と判別し(ステップ58)、閾値
以上の場合には有声音と判定してステップ59以下に進
む。
ステップ60では、前のフレームが有声音か否かを判定
し、NOの場合にはそのフレームを有声音過渡部と判定し
(ステップ61)、YESの場合にはステップ62以下に進
む。
ステップ62では、自己相関係数γ(i)によりピッチ
周期Pnを計算し、前のフレームのピッチ周期Pn−1との
変化率ρを計算し(ステップ63)、変化率ρが閾値以上
か否かを判別する(ステップ64)。変化率ρが閾値未満
の場合には、そのフレームを有声音定常部と判定し、閾
値以上の場合には有声音過渡部と判定する。
分類器1は、この音声信号の4種類の特性に応じて、
例えば2ビットの判定データをスイッチ、10、11、量子
化器4、多重化器5に出力する。
有声音定常部と判定されたフレームにおいては、スイ
ッチ10は時間軸圧縮器2側に切り替わり、有声音過渡部
と判定したフレームにおいては、スイッチ11は予測器3
側に切り替わる。
したがって、音声信号の無音と無声音は直接量子化器
4に入力してそれぞれ無音用コードブック34、無声音用
コードブック33の代表ベクトルの番号に量子化され、有
声音過渡部は予測器3を介して量子化器4に入力して有
声音過渡部用コードブック32の代表ベクトルの番号に量
子化され、有声音定常部は時間軸圧縮器2により圧縮さ
れた後予測器3を介して量子化器4に入力して有声音定
常部用コードブック31の代表ベクトルの番号に量子化さ
れる。
ここで、無音と無声音を符号化する場合には、予測器
3を用いないので、予測フィルタ係数等に割り当てられ
たビットを量子化器4のビットに割り当て、伝送される
ビット数を一定にする。
音声信号の判定データは、予測フィルタ係数と代表ベ
クトルの番号とともに復号器に伝送されるので、復号化
装置は元の音声信号に復号することができ、また、有声
音、無声音、無音等の特性に応じて量子化された値を復
号するので、復号された音声の品質が良好となる。
発明の効果 以上説明したように、本発明の音声符号化・復号化装
置は、音声信号を入力し、1フレーム内のパワーを計算
し、そのパワーが閾値未満の場合には、そのフレームを
無音と判別し、閾値以上の場合は、有音と判定し、1フ
レーム内の自己相関係数を計算し、その値が閾値未満の
場合には、そのフレームを無声音と判別し、閾値以上の
場合には、有声音と判定し、前のフレームが有声音か否
かを判定し、有声音ではないと判断した場合、そのフレ
ームは有声音過渡部と判別し、有声音であると判断した
場合、自己相関係数によりピッチ周期を計算し、前のフ
レームのピッチ周期との変化率を計算し、変化率が閾値
未満の場合には、そのフレームを有声音定常部と判別
し、閾値以上の場合には有声音過渡部と判別する分類手
段を設けているので、音声信号を有声音定常部、有声音
過渡部、無声音、無音に正確に分類することができる。
また、コードブックを用いたベクトル量子化を行ってい
るので、効率的に少ない情報伝送での符号化を行うこと
ができる。
【図面の簡単な説明】
第1図(a)は、本発明に係る音声符号化装置の一実施
例を示すブロック図、第1図(b)は、本発明に係る音
声復号化装置の一実施例を示すブロック図、第2図は、
第1図(a)の予測器を示す詳細なブロック図、第3図
は、第1図(a)の量子化器を示す詳細なブロック図、
第4図は、一般的な音声信号の波形図、第5図は、第1
図(a)の分類器の動作を説明するためのフローチャー
ト、第6図(a)は、従来の音声符号化装置を示すブロ
ック図、第6図(b)は、従来の音声復号化装置を示す
ブロック図、第7図は、第6図(a)の量子化器を示す
詳細なブロック図である。 1……分類器、2……時間軸圧縮器、3……予測器、4
……量子化器、5……多重化器、6……分離器、7……
逆量子化器、8……合成器、9……時間軸伸張器、31…
…有声音定常部用コードブック、32……有声音過渡部用
コードブック、33……無声音用コードブック、34……無
音用コードブック。
フロントページの続き (56)参考文献 特開 昭55−11616(JP,A) 特開 昭63−59127(JP,A) 特開 昭62−194299(JP,A) 特開 昭59−12499(JP,A) 特開 昭59−82608(JP,A) 特開 昭63−204300(JP,A) (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 - 9/18 H03M 7/30 H04B 14/04 JICST

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】音声信号を入力し、1フレーム内のパワー
    を計算し、そのパワーが閾値未満の場合には、そのフレ
    ームを無音と判別し、閾値以上の場合は、有音と判定
    し、1フレーム内の自己相関係数を計算し、その値が閾
    値未満の場合には、そのフレームを無声音と判別し、閾
    値以上の場合には、有声音と判定し、前のフレームが有
    声音か否かを判定し、有声音ではないと判断した場合、
    そのフレームは有声音過渡部と判別し、有声音であると
    判断した場合、自己相関係数によりピッチ周期を計算
    し、前のフレームのピッチ周期との変化率を計算し、変
    化率が閾値未満の場合には、そのフレームを有声音定常
    部と判別し、閾値以上の場合には有声音過渡部と判別す
    る分類手段と、この分類手段により分類された音声信号
    の有声音定常部を時間軸上に圧縮する時間軸圧縮手段
    と、前記分類手段により分類された音声信号の有声音過
    渡部と前記圧縮手段により圧縮された有声音定常部の予
    測誤差を出力する予測手段と、前記分類手段により分類
    された音声信号の無声音、無音及び前記予測手段が出力
    する予測誤差の出力信号を量子化する量子化手段とを有
    する音声符号化装置と、 この音声符号化装置からの有声音定常部、有声音過渡
    部、無声音、無音の量子化値を逆量子化する逆量子化手
    段と、この逆量子化手段で逆量子化された有声音定常
    部、有声音過渡部を音声信号に合成する合成手段と、こ
    の合成手段で合成された有声音定常部を時間軸上で伸張
    する時間軸伸張手段とを有する音声符号化装置とを備え
    た音声符号化・復号化装置。
  2. 【請求項2】量子化手段は、有声音定常部、有声音過渡
    部、無声音、無音用の代表ベクトルが格納されたコード
    ブックを備え、分類手段により分類された音声信号の判
    定データによりコードブックが選択され、予測手段から
    の予測誤差の信号列とコードブックの各代表ベクトルの
    2乗距離を計算し、その値が最も小さい代表ベクトルの
    番号を量子化して出力する請求項1記載の音声符号化・
    復号化装置。
JP63299822A 1988-11-28 1988-11-28 音声符号化・復号化装置 Expired - Fee Related JP2797348B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63299822A JP2797348B2 (ja) 1988-11-28 1988-11-28 音声符号化・復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63299822A JP2797348B2 (ja) 1988-11-28 1988-11-28 音声符号化・復号化装置

Publications (2)

Publication Number Publication Date
JPH02146100A JPH02146100A (ja) 1990-06-05
JP2797348B2 true JP2797348B2 (ja) 1998-09-17

Family

ID=17877341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63299822A Expired - Fee Related JP2797348B2 (ja) 1988-11-28 1988-11-28 音声符号化・復号化装置

Country Status (1)

Country Link
JP (1) JP2797348B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0563580A (ja) * 1991-09-02 1993-03-12 Mitsubishi Electric Corp 音声信号処理方法
EP1308927B9 (en) 2000-08-09 2009-02-25 Sony Corporation Voice data processing device and processing method
JP4736266B2 (ja) * 2000-08-09 2011-07-27 ソニー株式会社 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体
KR100566163B1 (ko) * 2000-11-30 2006-03-29 마츠시타 덴끼 산교 가부시키가이샤 음성 복호화 장치, 음성 복호화 방법 및 프로그램을기록한 기록 매체
JP4747434B2 (ja) * 2001-04-18 2011-08-17 日本電気株式会社 音声合成方法、音声合成装置、半導体装置及び音声合成プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5941599B2 (ja) * 1978-07-10 1984-10-08 日本電信電話株式会社 冗長性除去pcm音声伝送方式
JPS5912499A (ja) * 1982-07-12 1984-01-23 松下電器産業株式会社 音声符号化装置
JPH0748696B2 (ja) * 1986-08-29 1995-05-24 富士通株式会社 音声符号化方式

Also Published As

Publication number Publication date
JPH02146100A (ja) 1990-06-05

Similar Documents

Publication Publication Date Title
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
KR100873836B1 (ko) Celp 트랜스코딩
JP4270866B2 (ja) 非音声のスピーチの高性能の低ビット速度コード化方法および装置
JP4489960B2 (ja) 音声の無声セグメントの低ビットレート符号化
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
JPH096397A (ja) 音声信号の再生方法、再生装置及び伝送方法
JPH0869299A (ja) 音声符号化方法、音声復号化方法及び音声符号化復号化方法
US6910009B1 (en) Speech signal decoding method and apparatus, speech signal encoding/decoding method and apparatus, and program product therefor
JP4874464B2 (ja) 遷移音声フレームのマルチパルス補間的符号化
EP1204968B1 (en) Method and apparatus for subsampling phase spectrum information
US5706392A (en) Perceptual speech coder and method
JPH10207498A (ja) マルチモード符号励振線形予測により音声入力を符号化する方法及びその符号器
EP1597721B1 (en) 600 bps mixed excitation linear prediction transcoding
US5933802A (en) Speech reproducing system with efficient speech-rate converter
WO2002021091A1 (fr) Analyseur de signal de bruit, synthetiseur de signal de bruit, procede d'analyse de signal de bruit et procede de synthese de signal de bruit
JP2797348B2 (ja) 音声符号化・復号化装置
KR100796836B1 (ko) 코드 변환 방법, 장치 및 이 방법을 실행하는 컴퓨터용 프로그램이 기록된 기록 매체
JP2000132193A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3330178B2 (ja) 音声符号化装置および音声復号化装置
JP2558876B2 (ja) 音声符号化装置
Ojala et al. Variable model order LPC quantization

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees