JP3328080B2 - コード励振線形予測復号器 - Google Patents

コード励振線形予測復号器

Info

Publication number
JP3328080B2
JP3328080B2 JP28765494A JP28765494A JP3328080B2 JP 3328080 B2 JP3328080 B2 JP 3328080B2 JP 28765494 A JP28765494 A JP 28765494A JP 28765494 A JP28765494 A JP 28765494A JP 3328080 B2 JP3328080 B2 JP 3328080B2
Authority
JP
Japan
Prior art keywords
code
vector
excitation
excitation vector
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP28765494A
Other languages
English (en)
Other versions
JPH08146998A (ja
Inventor
弘美 青柳
義博 有山
賢一郎 細田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP28765494A priority Critical patent/JP3328080B2/ja
Priority to KR1019950035415A priority patent/KR100272477B1/ko
Priority to US08/557,809 priority patent/US5752223A/en
Priority to EP95118092A priority patent/EP0714089B1/en
Priority to EP01108216A priority patent/EP1160771A1/en
Priority to DE69527410T priority patent/DE69527410T2/de
Priority to CN95119729A priority patent/CN1055585C/zh
Publication of JPH08146998A publication Critical patent/JPH08146998A/ja
Application granted granted Critical
Publication of JP3328080B2 publication Critical patent/JP3328080B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0002Codebook adaptations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、コード励振線形予測
(CELP)符号化方式に従う復号器に関し、例えば、
いわゆる留守録機能を備えた電話機に適用し得るもので
ある。
【0002】
【従来の技術】留守録機能を備えた電話機において、従
来、発呼者又は被呼者のメッセージを記録する記録媒体
としてはカセットテープが多く使われていた。
【0003】しかしながら、記録媒体としてカセットテ
ープを適用していると、メッセージの記録再生構成に多
くの空間が占有されるという課題があり、また、複数の
メッセージがあった場合において、聞きたいメッセージ
の頭だしに時間がかかる、メッセージ単位の消去が困難
である等の課題がある。
【0004】そのため、メッセージの記録媒体として、
半導体メモリ(ICメモリ)を適用することも既に提案
されている。このように、ICメモリをメッセージ記録
媒体として用いる場合において、できるだけ簡単な構成
で多くのメッセージの記録を可能にしようとすると、音
声信号を圧縮して記録し、再生時に伸長する圧縮符号化
方式を適用することが好ましい。
【0005】
【発明が解決しようとする課題】周知のように、音声信
号に対する高能率圧縮符号化方式として、コード励振線
形予測符号化方式が存在する。コード励振線形予測符号
化方式は、音声信号の狭義の伝送のために考えられたも
のであり、少ない伝送量で復号側において入力音声信号
にできるだけ忠実な音声信号を再生できるようにしたも
のである。
【0006】しかしながら、留守録機能を備えた電話機
において、メッセージの記録再生用の圧縮符号化方式と
して、既存のコード励振線形予測符号化方式を適用した
場合においては、留守録機能に関連する各種要求を満足
できないことも生じる。
【0007】そのため、コード励振線形予測符号化方式
が今まで適用されていない留守録機能を備えた電話機等
の装置に対して、適用するのに好適なコード励振線形予
測復号器が求められている。
【0008】
【課題を解決するための手段】かかる課題を解決するた
め、本発明は、入力された符号化音声信号から励振信号
を形成する励振信号再生手段と、入力された符号化音声
信号から声道予測係数を形成する声道情報再生手段と、
励振信号再生手段からの励振信号と声道情報再生手段か
らの声道予測係数に基づいて、再生音声信号を形成する
再生音声信号形成手段とを有するコード励振線形予測復
号器において、(1)符号化音声信号から音声パワ逆量子
化信号を形成する音声パワ逆量子化信号再生手段と、
(2)再生音声信号形成手段の後段に、再生音声信号に上
記音声パワ逆量子化信号の大きさに応じた白色雑音を加
える白色雑音印加手段とを設けたことを特徴とする。
【0009】
【0010】
【0011】
【0012】
【0013】
【0014】
【0015】
【0016】
【0017】
【作用】本発明のコード励振線形予測復号器は、低符号
化速度になるに従い、再生音声信号における雑音成分が
ピンク化し易いことを考慮してなされたものである(な
お、白色雑音が変調されて白色雑音と異なる耳障りな音
色に変化することをこの明細書ではピンク化と呼び、こ
の耳障りな雑音を以後ピンク雑音と呼ぶ)。ピンク雑音
に白色雑音を加えるとピンク雑音は目立たなくなり、自
然な音声信号に近くなる。そこで、本発明のコード励振
線形予測復号器は、再生音声信号形成手段の後段に、再
生音声信号に音声パワ逆量子化信号の大きさに応じた白
色雑音を加える白色雑音印加手段を設けている。
【0018】
【0019】
【0020】
【0021】
【0022】
【0023】
【0024】
【0025】
【0026】
【0027】
【0028】
【実施例】
(A)コード励振線形予測符号化器の第1実施例 図1は、本発明によるコード励振線形予測符号化器の第
1実施例を示すものであり、符号化音声信号を、例えば
留守録機能付き電話機のICメモリに記憶できるように
したものである。
【0029】このコード励振線形予測符号化器の第1実
施例及び後述するコード励振線形予測復号器の第1実施
例は、ICメモリに多数のメッセージを格納できるよう
に、低符号化速度(例えば4kbit/s)を意識した
ものである。
【0030】図1において、入力端子100よりフレー
ム単位にまとめられてベクトルとして入力される原音声
ベクトル(原音声信号)Sは、フレームパワ量子化部1
04に入力される。フレームパワ量子化部104は、原
音声ベクトルSのパワを計算して量子化し、そのインデ
ックスIoをメモリインタフェース116に出力すると
共に、逆量子化値Pを計算して利得符号帳108に出力
する。
【0031】また、原音声ベクトルSは声道分析部10
1に入力され、声道予測係数(LPC係数)aが計算さ
れ、声道予測係数量子化部102に送出される。声道予
測係数量子化部102は、LPC係数aをLSP(Line
Spectrum Pair)係数に変換して量子化し、そのインデ
ックスIcをメモリインタフェース116に出力する。
さらに、声道予測係数量子化部102は、インデックス
IcよりLSP係数の逆量子化値を計算し、LPC係数
aqに変換して合成フィルタ103及びベクトル変換部
109に出力する。
【0032】ここで、記録符号(符号化音声信号)に含
める声道予測係数としてLSP係数を用いるようにした
のは、声道の周波数特性に対する補間特性が良くなるこ
と、LSP係数は少ない符号化ビット数で符号化しても
LPC係数等より声道スペクトルに与える歪みが小さい
こと、ベクトル量子化法との組み合わせによって効率の
良い符号化ができることによる。
【0033】合成フィルタ103は、局部再生のLPC
係数aqと、加算器112から出力された励振ベクトル
(励振信号)eより合成音声ベクトル(局部再生の合成
音声信号)Swを計算して重み付き距離計算部114に
出力する。
【0034】この局部再生の合成音声ベクトルSwが原
音声ベクトルSに最も近くなるような最適な励振ベクト
ルeを探索し、このときの各種符号帳105〜108の
インデックス等が記録符号に含められる。
【0035】なお、例えば、声道予測係数やフレームパ
ワは、フレーム毎に求められるのに対して、後述する最
適な励振信号eの探索は、1フレームを複数に分割した
サブフレーム単位に実行される。
【0036】この実施例の場合、符号帳として、適応符
号帳105、雑音符号帳106、パルス符号帳107及
び利得符号帳108が設けられている。
【0037】適応符号帳105、雑音符号帳106及び
パルス符号帳107はそれぞれ、励振信号に係る波形コ
ードベクトル(励振信号である適応励振ベクトル、雑音
励振ベクトル、パルス性励振ベクトル)を格納している
ものであり、利得符号帳108は適応励振ベクトル及び
固定励振ベクトル(雑音励振ベクトル及びパルス性励振
ベクトルをまとめてこのように呼ぶ)に関する利得コー
ド(利得ゲイン)を格納しているものである。
【0038】適応励振ベクトル及び雑音励振ベクトルは
それぞれ、従来と同様に、統計的に周期性の強い有声音
に寄与する波形励振ベクトル、統計的に周期性の弱いラ
ンダム的な無声音に寄与する波形励振ベクトルである。
なお、適応符号帳105の適応励振ベクトルは後述する
ように適応的に更新される。パルス性励振ベクトルは、
孤立インパルスよりなる波形励振ベクトルである。パル
ス性励振ベクトルは、周期性の強い有声音の立ち上がり
や、パルス性が明確な有声音の定常部分に寄与すること
を考慮したものである。利得コードは、例えばベクトル
量子化されており、コードの一成分が適応励振ベクトル
の利得に関し、他成分が固定励振ベクトルの利得に関す
るもの(2次元量子化テーブル)となっている。
【0039】なお、パルス性の音源信号は、周期性を有
する単純な信号であるのでパルス信号発生部が発生する
ことも考えられるが、この実施例のようにコード化して
符号帳107から読出すことで発生することが以下の理
由によって好ましい。すなわち、適応符号帳105から
の出力と同期させ易く、また、雑音符号帳106と同一
のブック構成とすることで後述するように雑音励振ベク
トル又はパルス性励振ベクトルを選択して記録符号にま
とめる際の多重化処理等が容易になるためである。
【0040】このような各種励振ベクトルを用いて局部
再生した合成音声ベクトルSwが原音声ベクトルSに最
も類似する、各種励振ベクトルについての最適励振ベク
トルを求めてそのインデックスをメモリインタフェース
116に与えて、記録符号(符号化音声信号)にまとめ
させて図示しないICメモリに記録させる。この実施例
は、低符号化速度を意識したものであるので、固定励振
ベクトルについては雑音励振ベクトル又はパルス性励振
ベクトルを選択してそのインデックスを記録することと
している。従って、固定励振ベクトルとしていずれを選
択しているかの選択情報も記録符号に含められる。
【0041】このような最適励振ベクトルの探索(雑音
励振ベクトル又はパルス性励振ベクトルの選択処理を含
む)が、ここでは、適応励振ベクトル、雑音励振ベクト
ル、パルス性励振ベクトル、利得コードの順に実行され
るとして説明する。なお、最適な適応励振ベクトル、雑
音励振ベクトル、パルス性励振ベクトル、利得コードが
得られるならば、その探索順序等は以下に説明するもの
に限定されない。
【0042】最適な適応励振ベクトルの探索時において
は、雑音符号帳106及びパルス性符号帳107からの
出力を0とし、また、乗算器110が適切な値の利得係
数bk(例えば1)を乗算するようになされている。こ
のような状態において、適応符号帳105に格納されて
いる全ての適応励振ベクトルeaiを時間順次に又は並
列的に出力させ、乗算器110及び加算器112を介し
て合成フィルタ103に励振ベクトルとして与える。合
成フィルタ103は、LPC係数aqをタップ係数とし
てこの励振ベクトルe(eai)対して畳み込み処理を
行ない、音源パラメータとして適応励振ベクトルeai
の内容だけが反映された合成音声ベクトル(ここではS
wiで表す)を、全ての適応励振ベクトルeai(i=
1〜n)について求める。
【0043】重み付き距離計算部114は、原音声ベク
トルSと各候補の合成音声ベクトルSwiとの減算を行
ない、更に周波数的な重みをかけた後、各候補のベクト
ルのそれぞれについて各成分の2乗和ew(ewi)を
計算して符号帳検索部115に出力する。符号帳検索部
115は、n個の2乗和ewiの中の最小値に対応する
最小の適応励振ベクトルeaを最適なものと決定する。
【0044】次に、最適な雑音励振ベクトルの探索が実
行される。この探索時においては、固定励振ベクトル選
択スイッチ113が雑音符号帳106側に切換えられ、
適応符号帳105の出力を0とし(最適適応励振ベクト
ルを出力しても良い)、また、乗算器111が適切な値
の利得係数gk(例えば1)を乗算するようになされて
いる。このような状態において、雑音符号帳106に格
納されている全ての雑音励振ベクトルesj(j=1〜
m)を時間順次に又は並列的に出力させ、固定励振ベク
トル選択スイッチ113を介してベクトル変換部(周波
数特性操作部)109に入力させる。
【0045】ベクトル変換部109は、LPC係数aq
及び最適適応励振ベクトルインデックスIaに基づい
て、入力された各雑音励振ベクトルesjの周波数特性
を雑音励振ベクトルの時間的な長さに対応して原音声ベ
クトルSの周波数特性に近付けるように変換操作する。
このように周波数特性が変換操作された全ての雑音励振
ベクトルev(evj)が乗算器111及び加算器11
2を介して励振ベクトルe(ej)として合成フィルタ
103に与えられる。
【0046】これ以降は、最適な適応励振ベクトルの探
索と同様に処理され、符号帳検索部115が最適な雑音
励振ベクトルesを決定する。
【0047】ここで、ベクトル変換部109を設けるよ
うにしたのは以下の理由による。従来、励振ベクトルの
周波数特性は理論的に白色としてモデル化されてきた
が、実際には白色的でなく、原音声ベクトルSの周波数
特性に近い特性を有していることが実験的に確認されて
いる。従って、雑音励振ベクトルやパルス性励振ベクト
ルの周波数特性を、原音声ベクトルSの周波数特性に近
付れば、それだけ高品質な合成音声ベクトルを得ること
ができ、また、励振ベクトルの有効な周波数成分は量子
化誤差信号よりかなり大きくなって量子化誤差信号のマ
スキング効果が得られる。そこで、ベクトル変換部10
9を設けている。ここで、原音声ベクトルSの周波数特
性を表す情報としてはLPC係数acがあり、また、ピ
ッチ予測情報を意味する最適な適応励振ベクトルの情報
(それに対する利得を含む)Iaがある。従って、ベク
トル変換部109はこれらの情報に基づいて、雑音励振
ベクトルやパルス性励振ベクトルの周波数特性を操作す
る。
【0048】このようにして最適な雑音励振ベクトルの
探索が終了すると、次には、最適なパルス性励振ベクト
ルの探索を行なう。この探索時においては、固定励振ベ
クトル選択スイッチ113がパルス性符号帳107側に
切換えられ、適応符号帳105が出力を0とし(最適適
応励振ベクトルを出力しても良い)、また、乗算器11
1が適切な値の利得係数gk(例えば1)を乗算するよ
うになされている。このような状態において、パルス性
符号帳107に格納されている全てのパルス性励振ベク
トルepk(k=1〜m)を時間順次に又は並列的に出
力させる。以降の処理は、最適な雑音励振ベクトルの探
索時と同様であるのでその説明は省略する。
【0049】このようにして最適なパルス性励振ベクト
ルepが決定されたときには、符号帳検索部115は、
最適な雑音励振ベクトルesの2乗和ewと最適なパル
ス性励振ベクトルepの2乗和ewとを比較し、2乗和
ewが小さい方を記録させる固定励振ベクトルの情報に
決定する。
【0050】この後、最適な利得コードの探索を行な
う。この利得コードの探索時においては、適応符号帳1
05からは最適な適応励振ベクトルeaが出力され、固
定励振ベクトル選択スイッチ113は選択された雑音符
号帳106又はパルス性符号帳107側に切換えられ、
選択された固定符号帳106又は107からは最適な固
定励振ベクトルes又はepが出力される。利得符号帳
108からの1個の利得コードは、適応励振ベクトル用
の利得と固定励振ベクトル用の利得からなり、これらに
フレームパワPを反映させた後、適応励振ベクトル用の
利得bk(k=1〜t)は乗算器110に与えられ、固
定励振ベクトル用の利得gkは乗算器111に与えられ
る。かくして、利得制御された最適適応励振ベクトル
と、周波数特性操作と利得制御とが施された最適固定励
振ベクトルとが加算器112によって加算され、励振ベ
クトルeとして合成フィルタ103に与えられる。この
ような処理は、利得符号帳108内の全ての利得コード
に対して時間順次に又は並列的に実行される。重み付き
合成フィルタ103以降の探索時の処理は、各種励振ベ
クトルの探索時の処理と同様である。
【0051】符号帳検索部115は、最適適応励振ベク
トル、最適固定励振ベクトル、最適利得コードが得られ
ると、これらのインデックスIa、Is又はIp、及
び、Igをメモリインタフェース116に与えると共
に、雑音励振ベクトル及びパルス性励振ベクトルのどち
らを選択したかを表す固定コード選択スイッチ情報Iw
もメモリインタフェース116に与える。
【0052】メモリインタフェース116は、これらの
励振源に係る情報Ia、Is又はIp、Ig、及び、I
wと、上述したLSP係数量子化情報Ic及びフレーム
パワ情報Ioとを、外部に接続されるICメモリの格納
形式に従う信号Mに多重変換して出力端子117より出
力する。
【0053】また、符号帳検索部115は、メモリイン
タフェース116に与えるインデックス及び固定コード
選択スイッチ情報を、対応する符号帳(105及び10
8と、106又は107)や固定コード選択スイッチ1
13に与える。このとき、スイッチ113が切換えら
れ、各符号帳から最適励振ベクトルや最適コードが出力
される。これにより、今回のフレーム処理時において最
も原音声ベクトルSに近い合成音声ベクトルSwを形成
できる励振ベクトルe(eo)が加算器112から出力
され、これが適応符号帳105に与えられる。そして、
適応符号帳105は適応励振ベクトルeaiの更新処理
を行なう。
【0054】以上のような符号化処理が、フレーム及び
サブフレーム毎に繰返され、符号化音声信号Mが順次I
Cメモリに記録される。
【0055】なお、このような符号化処理は、留守録機
能付き電話機に対して、その所有者(被呼者)が留守に
する旨のメッセージを記録させる際や、発呼者が留守の
使用者への伝達メッセージを記録させる際に、電話機の
全体を制御する制御部(CPU)からの指令に基づいて
実行される。
【0056】従って、上記第1実施例のコード励振線形
予測符号化器によれば、低符号化速度においても高品質
の再生音声を得ることができ、多数のメッセージをIC
メモリに格納できるようになる。
【0057】以下、低符号化速度においても高品質の再
生音声を得ることができることを具体的に説明する。
【0058】(1) 低符号化速度を期した場合、音源パラ
メータ(励振信号)に割当てられる符号化ビット数が少
ないので、用意される固定励振ベクトルも少なくなり、
原音声ベクトルSに含まれているパルス性雑音を明確に
再生でき難いが、この実施例の場合、パルス性励振ベク
トルを利用しているので、このような場合の音声の再生
品質を高めることができる。
【0059】また、パルス性励振ベクトルと雑音励振ベ
クトルとを切換えて用いているので、低符号化速度に対
応できると共に、音声の過渡部のようなランダム信号と
パルス的信号が混在する信号に対する再生品質を高める
ことができる。
【0060】(2) 低符号化速度を期した場合、音源パラ
メータに対する符号化ビット数も少なくなるが、声道パ
ラメータに対する符号化ビット数も少なくなる。この実
施例の場合、少ない符号化ビット数で符号化してもLP
C係数等より声道スペクトルに与える歪みが小さいLS
P係数の情報を記録するようにしているので、この点か
ら再生品質を高めることができる。
【0061】(3) 上述のように、実際の励振信号(励振
ベクトルeが対応)が入力音声信号(原音声ベクトルS
が対応)の周波数特性に近い周波数特性を有することを
考慮してベクトル変換部109を設けているので、実際
に即している分だけ再生品質を高めることができると共
に、この変換に伴い量子化誤差信号に対するマスキング
効果が生じて再生品質を高めることができる。
【0062】 (B)コード励振線形予測復号器の第1実施例 次に、本発明によるコード励振線形予測復号器の第1実
施例を図面を参照しながら詳述する。この実施例は、図
1に示すコード励振線形予測符号化器の第1実施例に対
応するものであり、図2のブロック図に示す構成を有す
る。
【0063】図2において、第1実施例のコード励振線
形予測復号器は、メモリインタフェース201、声道予
測係数逆量子化部202、フレームパワ逆量子化部20
3、適応符号帳204、雑音符号帳205、パルス符号
帳206、利得符号帳207、固定励振ベクトル選択ス
イッチ208、ベクトル変換部209、乗算器210、
211、加算器212、合成フィルタ213及びポスト
フィルタ214から構成されている。
【0064】ICメモリから読み出され入力端子200
から当該コード励振線形予測復号器に入力された符号化
音声信号Mは、メモリインタフェース201に入力され
る。メモリインタフェース201は、この符号化音声信
号Mを、LSP係数の量子化情報Ic、フレームパワ情
報Io、最適適応励振ベクトルeaのインデックスI
a、最適固定励振ベクトルes又はepのインデックス
Is又はIp、最適利得コードのインデックスIg及び
固定励振ベクトル選択スイッチ情報Iwに分離する。そ
して、LSP係数の量子化情報Icは声道予測係数逆量
子化部202に与え、フレームパワ情報Ioはフレーム
パワ逆量子化部203に与え、最適適応励振ベクトルe
aのインデックスIaを適応符号帳204及びベクトル
変換部209に与え、最適利得コードのインデックスI
gを利得符号帳207に与え、固定励振ベクトル選択ス
イッチ情報Iwを固定励振ベクトル選択スイッチ208
に与える。また、最適固定励振ベクトルes又はepの
インデックスIs又はIpを、固定励振ベクトル選択ス
イッチ情報Iwに基づいて定まる雑音符号帳205又は
パルス符号帳206に与える。
【0065】声道予測係数逆量子化部202は、与えら
れた符号化されているLSP係数を復号化(例えばベク
トル逆量子化)し、さらにLPC係数aqに変換する。
このように変換されたLPC係数aqが、ベクトル変換
部209、合成フィルタ213及びポストフィルタ21
4に声道予測係数情報として与えられる。
【0066】フレームパワ逆量子化部203は、フレー
ムパワ情報Ioに基づいて、フレームパワ逆量子化値
(再生されたフレームパワ)Pを求めて利得符号帳20
7に与える。
【0067】利得符号帳207は、与えられたインデッ
クスIgで定まる適応励振ベクトル用と固定励振ベクト
ル用の利得コードにフレームパワPを反映させ、それぞ
れの利得コードb、gを適応励振ベクトル用の乗算器2
10、固定励振ベクトル用の乗算器211に与える。
【0068】適応符号帳204は、与えられたインデッ
クスIaで定まる適応励振ベクトルeaを出力し、この
適応励振ベクトルeaが乗算器210を介して利得制御
されて加算器212に与えられる。
【0069】雑音符号帳205又はパルス符号帳206
は、与えられたインデックスIs又はIpに対応する雑
音励振ベクトルes又はパルス性励振ベクトルepを固
定励振ベクトル選択スイッチ208を介してベクトル変
換部209に与え、ベクトル変換部209は、LPC係
数aq、適応励振ベクトルesのインデックスIsに基
づいてその周波数特性を操作する。このように周波数特
性が操作された固定励振ベクトルevが、利得制御器2
11で利得制御されて加算器212に与えられる。
【0070】加算器212は、与えられた適応励振ベク
トルと固定励振ベクトルを加算してその加算信号を励振
ベクトルeとして合成フィルタ213に与える。合成フ
ィルタ213は、この励振ベクトルeをLPC係数aq
で畳み込んで合成音声ベクトルSwを得てポストフィル
タ214に出力する。ポストフィルタ214は、合成音
声ベクトルSwに対して聴覚特性に応じた周波数的な変
換を施して、再生音声ベクトルSpとして出力端子21
5から出力させる。
【0071】加算器212から出力された励振ベクトル
eは、また適応符号帳204に与えられる。このとき、
適応符号帳204は、この励振ベクトルeを用いて適応
励振ベクトルの更新を行なう。
【0072】コード励振線形予測復号器は、以上のよう
な処理を符号化音声信号が与えられる毎に、従ってフレ
ーム毎(励振信号についてはサブフレーム毎)に行な
う。
【0073】従って、この第1実施例のコード励振線形
予測復号器によれば、与えられたLSP係数を処理する
構成を有し、音源としてパルス符号帳206を有し、入
力音声信号の周波数特性に固定音源の周波数特性を近付
けるベクトル変換部209を有するので、これにより、
上述した第1実施例のコード励振線形予測符号化器につ
いての効果が実効あるものとなる。
【0074】 (C)コード励振線形予測符号化器の第2実施例 図3は、本発明によるコード励振線形予測符号化器の第
2実施例を示すものであり、符号化音声信号を、例えば
留守録機能付き電話機のICメモリに記憶できるように
したものである。なお、図3において、図1との同一、
対応部分には同一符号を付して示している。
【0075】第2実施例のコード励振線形予測符号化器
は、復号器として、上述した第1実施例のコード励振線
形予測復号器を適用することを前提としている。
【0076】第2実施例のコード励振線形予測符号化器
及び後述する第2実施例のコード励振線形予測復号器
は、再生音声ベクトルの周期性(音の高さ)を一定化さ
せることを意図したものである。
【0077】第2実施例のコード励振線形予測符号化器
は、図3及び図1との比較から明らかなように、第1実
施例の構成にインデックス変換部120を追加したもの
である。このインデックス変換部120には、音高制御
信号con1と最適適応励振ベクトルeaのインデック
スIaとが入力されている。インデックス変換部120
は、音高制御信号con1が音高の非制御状態を指示し
ているときに、最適適応励振ベクトルeaのインデック
スIaをそのまま通過させてメモリインタフェース11
6に与え、音高制御信号con1が音高の制御状態を指
示しているときに、最適適応励振ベクトルeaのインデ
ックスIaに関係なく固定のインデックスIacを発生
させてメモリインタフェース116に与える。
【0078】ここで、適応符号帳105のインデックス
Iaは音声信号の周期性(声の高さ)の情報を表わすパ
ラメータである。音声信号の周期は話者によって異な
り、また同一話者でも会話の抑揚等で時間的に変化す
る。固定のインデックスIacを、符号化音声信号Mに
含めて、音声信号の周期を常にある一定の値に固定して
しまうことにより、第1実施例のコード励振線形予測復
号器(図2参照)で再生した音声信号は、声の高さが変
わらないロボット的な音声となる。
【0079】留守録機能付き電話機においても、いたず
ら電話撃退の要請がある。このような要請に答える一方
法として、被呼者のメッセージ音声信号をロボット的な
音声信号とすることは有効である。そのため、このよう
な動作モードの選択操作子を設けておき、この選択操作
子が操作されたときに、電話機の全体を制御する制御部
(CPU)が、インデックス変換部120に、音高の制
御状態を指示している音高制御信号con1を与えて、
最適適応励振ベクトルeaのインデックスIaに関係な
く固定のインデックスIacを符号化音声信号Mに含め
て格納させ、その再生時に音高がほぼ一定の音声信号を
出力させるようにしている。
【0080】上記第2実施例のコード励振線形予測符号
化器によっても、第1実施例のコード励振線形予測符号
化器と同様な効果を得ることができ、さらに、再生時
に、音高がほぼ一定の音声信号を適宜形成できるという
効果も得ることができる。
【0081】 (D)コード励振線形予測復号器の第2実施例 図4は、本発明によるコード励振線形予測復号器の第2
実施例を示すものである。なお、図4において、図2と
の同一、対応部分には同一符号を付して示している。第
2実施例のコード励振線形予測復号器は、符号化器とし
て、上述した図2に示す第1実施例のコード励振線形予
測符号化器を適用することを前提としている。
【0082】第2実施例のコード励振線形予測復号器
は、図4及び図2との比較から明らかなように、第1実
施例の構成にインデックス変換部220を追加したもの
である。このインデックス変換部220には、音高制御
信号con1と、メモリインタフェース201が符号化
音声信号Mから分離した最適適応励振ベクトルeaのイ
ンデックスIaとが入力される。インデックス変換部2
20は、音高制御信号con1が音高の非制御状態を指
示しているときに、最適適応励振ベクトルeaのインデ
ックスIaをそのまま通過させて適応符号帳204及び
ベクトル変換部209に与え、音高制御信号con1が
音高の制御状態を指示しているときに、最適適応励振ベ
クトルeaのインデックスIaに関係なく固定のインデ
ックスIacを発生させて適応符号帳204及びベクト
ル変換部209に与える。
【0083】従って、第2実施例のコード励振線形予測
復号器は、音高制御信号con1が音高の非制御状態を
指示しているときには分離された最適適応励振ベクトル
eaのインデックスIaを用いて復号を行ない、音高制
御信号con1が音高の制御状態を指示しているときに
は分離された最適適応励振ベクトルeaのインデックス
Iaに代えて固定インデックスIacを用いて復号を行
なう。
【0084】その結果、メッセージ音声信号の記録には
音高が制御されていなくても、その再生時には、第2実
施例のコード励振線形予測符号化器について上述したと
同様な理由により、音高がほぼ一定の音声信号を適宜出
力させることができる。
【0085】上記第2実施例のコード励振線形予測復号
器によっても、第1実施例のコード励振線形予測復号器
と同様な効果を得ることができ、さらに、音高がほぼ一
定の音声信号を適宜形成できるという効果も得ることが
できる。
【0086】 (E)コード励振線形予測符号化器の第3実施例 図5は、本発明によるコード励振線形予測符号化器の第
3実施例を示すものである。なお、図5において、図1
との同一、対応部分には同一符号を付して示している。
【0087】第3実施例のコード励振線形予測符号化器
は、復号器として、上述した第1実施例のコード励振線
形予測復号器(図2)を適用することを前提としてい
る。
【0088】第3実施例のコード励振線形予測符号化器
及び後述する第3実施例のコード励振線形予測復号器
は、再生音声ベクトルの再生速度を任意に選定できるよ
うにすることを意図したものである。
【0089】第3実施例のコード励振線形予測符号化器
は、図5及び図1との比較から明らかなように、第1実
施例の構成に、バッファメモリ130、周期性分析部1
31及び間引き・補間操作部132を追加したものであ
る。これら新たな構成130〜132は、原音声ベクト
ルSの入力段に設けられており、間引き・補間操作部1
32から出力された音声ベクトルSmを入力音声ベクト
ルとして第1実施例と同様に符号化処理される。
【0090】ここで、バッファメモリ130〜間引き・
補間操作部132には、速度制御信号con2が与えら
れている。この速度制御信号con2が非制御状態を指
示しているときには、バッファメモリ130〜間引き・
補間操作部132は動作せず、原音声ベクトルSがその
まま符号化処理構成に与えられる。一方、速度制御信号
con2が制御状態を指示しているときには、バッファ
メモリ130〜間引き・補間操作部132は音声信号の
速度変更動作を行なう。
【0091】バッファメモリ130は、原音声ベクトル
Sを数フレーム分格納するものである。周期性分析部1
31は、バッファメモリ130に格納されている原音声
ベクトルSfの周期性をフレーム毎に分析し、サンプル
数で表現された周期性情報(ピッチ周期)ccを間引き
・補間操作部132に与える。間引き・補間操作部13
2には、速度制御信号con2が制御状態を指示してい
るときに、変倍倍率sfも与えられる。間引き・補間操
作部132は、この変倍倍率sfから間引く又は補間す
るサンプル数diを計算する。間引き・補間操作部13
2は、周期性情報ccの整数倍の中で、計算されたサン
プル数diに最も近い数n×ccを求め、このサンプル
数n×ccだけサンプルを周期性情報ccの周期単位
引き、又は、補間し、さらにフレームの再構成を行な
って、間引かれた又は補間された音声ベクトルSmを出
力する。
【0092】図6は、高速再生の指示時(変倍倍率sf
<1)における間引き・補間操作部132の動作(間引
き動作)の説明図である。図6に示すように、1フレー
ム分(320サンプル)の原音声ベクトルSからその周
期性(ピッチ周期)ccを求めたところ、50サンプル
程度であり、また、変倍率sfによって定まるサンプル
数diから、何周期(n周期)分を間引くかを求めたと
ころ、2周期(n=2)という結果が得られた。そこ
で、この例の場合には、図6に示すように、フレームの
先頭から2周期分のサンプルを間引くことにした。この
ようにすると、1フレームのサンプル数が所定のサンプ
ル数(320)より少ないものとなり、そこで、今回の
間引き処理後のサンプルと、次のフレームについて同様
に間引き処理したサンプルとから1フレームの音声ベク
トルを形成し直して符号化処理構成に与える。
【0093】図7は、低速再生の指示時(変倍倍率sf
>1)における間引き・補間操作部132の動作(補間
動作)の説明図である。図7に示すように、1フレーム
分(320サンプル)の原音声ベクトルSからその周期
性(ピッチ周期)ccを求めたところ、80サンプル程
度であり、また、変倍率sfによって定まるサンプル数
diから、何周期(n周期)分を補間するかを求めたと
ころ、2周期(n=2)という結果が得られた。そこ
で、この例の場合には、図7に示すように、フレームの
先頭側の周期(1)のサンプル及び2番目の周期(2)
のサンプルを2回ずつ繰り返して補間することにした。
このようにすると、1フレームのサンプル数が所定のサ
ンプル数(320)より多いものとなり、そこで、今回
の補間処理後のサンプル列の内320サンプルを1フレ
ームのサンプルとして符号化処理構成に与えると共に、
残りのサンプルと、次のフレームについて同様に補間処
理したサンプルとから1フレームの音声ベクトルを形成
し直して符号化処理構成に与える。
【0094】留守録機能付き電話機においては、上述し
たようにいたずら電話撃退の要請がある。また、電話が
多くかかってくる使用者(被呼者)の場合、発呼者から
の留守録メッセージも多数となるので、高速再生を望む
場合がある。このような要請や要求に答える一方法とし
て、被呼者や発呼者のメッセージ音声信号の再生速度を
通常速度から変えることは有効である。そのため、この
ような動作モードの選択操作子を設けておき、この選択
操作子が操作されたときに、電話機の全体を制御する制
御部(CPU)が、バッファメモリ130〜間引き・補
間操作部132に、再生速度の制御状態を指示している
速度制御信号con2や指示された変倍倍率sfを与え
て、符号化段階(記録段階)で再生速度が通常速度と異
なるように符号化させるようにしている。
【0095】上記第3実施例のコード励振線形予測符号
化器によっても、第1実施例のコード励振線形予測符号
化器と同様な効果を得ることができ、さらに、再生時
に、使用者の指示に応じた再生速度を有する音声信号を
適宜形成できるという効果も得ることができる。
【0096】なお、周期性を分析して、補間又は間引き
を行なうようにしたので、補間又は間引きを行なっても
再生音声の連続性を維持することができ、また、音高を
維持することができる。
【0097】 (F)コード励振線形予測復号器の第3実施例 図8は、本発明によるコード励振線形予測復号器の第3
実施例を示すものである。なお、図8において、図2と
の同一、対応部分には同一符号を付して示している。第
3実施例のコード励振線形予測復号器は、符号化器とし
て、上述した図1に示す第1実施例のコード励振線形予
測符号化器に適用することを前提としている。
【0098】第3実施例のコード励振線形予測復号器
も、音声信号の再生速度を入力音声自体が有する通常速
度と異なるようにしたものであるが、再生速度の変更を
符号化器側ではなく復号器側での処理で行なうようにし
たものである。
【0099】第3実施例のコード励振線形予測復号器
は、図8及び図2との比較から明らかなように、第1実
施例における加算器212及び合成フィルタ213間
に、バッファメモリ230、周期性分析部231及び間
引き・補間操作部232を追加したものであり、また、
合成フィルタ213及びポストフィルタ214が1フレ
ーム分の所定サンプル数以外のサンプル数にも対応する
ようになされているものである。従って、加算器212
までの処理は、第1実施例のコード励振線形予測復号器
と同様である。
【0100】ここで、バッファメモリ230〜間引き・
補間操作部232には、速度制御信号con2が与えら
れている。この速度制御信号con2が非制御状態を指
示しているときには、バッファメモリ230〜間引き・
補間操作部232は動作せず、最適励振ベクトルeをそ
のまま通過させる。一方、速度制御信号con2が制御
状態を指示しているときには、バッファメモリ230〜
間引き・補間操作部232は速度変更動作を行なう。
【0101】バッファメモリ230は、少なくとも1フ
レーム分の最適励振ベクトルeを蓄える。周期性分析部
231は、バッファメモリ230に蓄えられた最適励振
ベクトルefにおける周期性の値(ピッチ周期;サンプ
ル数換算)ccを計算する。間引き・補間操作部232
は、変速倍率sfから間引く又は補間するサンプル数d
iを計算し、この変更分のサンプル数diに最も近くな
る周期性の値の整数倍cc×nを求め、周期性の値cc
のサンプル数単位に、最適励振ベクトルefを間引き又
は補間する。第3実施例のコード励振線形予測復号器
は、第3実施例のコード励振線形予測符号化器に比較し
て、間引き・補間対象が音声ベクトルのサンプルか最適
励振ベクトルのサンプルかの違いがあるが、以上までの
処理は同様である。
【0102】しかし、第3実施例のコード励振線形予測
復号器における間引き・補間操作部232は、さらに、
間引き・補間処理後の最適励振ベクトルemのベクトル
長(サンプル数)slを求める。そして、間引き・補間
操作部232は、間引き・補間処理後の最適励振ベクト
ルemを合成フィルタ213に出力すると共に、ベクト
ル長slを合成フィルタ213及びポストフィルタ21
4に出力する。
【0103】合成フィルタ213及びポストフィルタ2
14は、第1実施例のコード励振線形予測復号器と同様
に処理するものであるが、入力ベクトルのベクトル長
が、間引き・補間処理によって本来のベクトル長と異な
っているので、そのベクトル長slの入力サンプル系列
に対して、声道分析係数aqを用いてフィルタリングを
行なう。
【0104】上記第3実施例のコード励振線形予測復号
器によっても、第1実施例のコード励振線形予測復号器
と同様な効果を得ることができ、さらに、使用者の指示
に応じた再生速度を有する再生音声信号を適宜形成でき
るという効果も得ることができる。
【0105】ここで、周期性を分析して、補間又は間引
きを行なうようにしたので、補間又は間引きを行なって
も再生音声の連続性を維持することができ、また、音高
を維持することができる。
【0106】また、間引き・補間操作を最適励振ベクト
ルの段階で行なうようにしているので、より自然な再生
音声信号を得ることが可能となる。すなわち、間引き・
補間による影響が、合成フィルタ213及びポストフィ
ルタ214のフィルタリングを通じて緩和され、より自
然な再生音声信号を得ることができる。因に、ポストフ
ィルタ214からの出力段階で、間引き・補間を行なう
ことも考えられるが、周期性を分析して補間又は間引き
を行なっても、出力音声信号にその影響が入り込む度合
いはこの実施例より大きくなる。
【0107】 (G)コード励振線形予測復号器の第4実施例 図9は、本発明によるコード励振線形予測復号器の第4
実施例を示すものである。なお、図9において、図2と
の同一、対応部分には同一符号を付して示している。第
4実施例のコード励振線形予測復号器は、符号化器とし
て、上述した図1に示す第1実施例のコード励振線形予
測符号化器を適用することを前提としている。
【0108】図1に示す第1実施例のコード励振線形予
測符号化器は、上述したように、ICメモリに多数のメ
ッセージを格納できるようにすべく、低符号化速度を有
するように符号化するものであった。符号化速度が低く
なった分だけ、再生音声信号に符号化歪みが入り込むこ
とを避けることができない。実験的に、この符号化歪み
のため、再生音声信号における雑音成分がピンク雑音化
する傾向があることが分かった。第4実施例のコード励
振線形予測復号器は、再生音声信号における雑音成分が
ピンク雑音化する傾向にあるという不都合を解決しよう
としたものである。
【0109】第4実施例のコード励振線形予測復号器
は、図8及び図2との比較から明らかなように、第1実
施例の構成に、雑音発生器140及び加算器141を追
加したものである。
【0110】雑音発生部140は、フレームパワPの値
に応じて白色雑音nzを発生する。なお、フレームパワ
に関係なく一定の変化をする雑音を発生するものや、背
景雑音を予め捕捉して格納しておき発生するものは他の
実施例を構成する。加算器141は、ポストフィルタ2
14からの再生音声ベクトルにこの雑音nzを加算し、
その加算後の再生音声ベクトルSpを出力端子215か
ら外部に出力させる。
【0111】ここで、ポストフィルタ214からの再生
音声ベクトルにおける雑音成分がピンク雑音化していて
も、雑音発生部140からの白色雑音が加えられること
により、加算器141からの再生音声ベクトルSpの雑
音成分は白色雑音化され、ピンク雑音成分が目立たなく
なり、自然の雑音成分に近くなる。
【0112】上記第4実施例のコード励振線形予測復号
器によっても、第1実施例のコード励振線形予測復号器
と同様な効果を得ることができ、さらに、符号化・復号
することによりその背景雑音等が変調を受け耳障りに聞
こえるように変化しても、人為的に生成した雑音を大き
さを適当に定めて加えるので、耳障りな部分をマスクで
き、より自然な再生音声信号を得ることができる。
【0113】(H)他の実施例 上記各実施例においては、声道分析係数を原音声ベクト
ルから得るいわゆるフォワード型のコード励振線形予測
符号化方式に従うものを示したが、第1実施例、第3実
施例及び第4実施例の特徴構成に対しては、声道分析係
数を局部再生の音声ベクトルから得るいわゆるバックワ
ード型のコード励振線形予測符号化方式に従うものに適
用することができる。
【0114】上記各実施例においては、励振信号(励振
ベクトル)の発生構成として、適応符号帳、雑音符号
帳、パルス符号帳及び利得符号帳を備えるものであった
が、第2実施例〜第4実施例については、励振信号(励
振ベクトル)の発生構成はこれに限定されず、少なくと
も適応符号帳及び雑音符号帳を備えるものであれば適用
することができる。
【0115】上記各実施例は、留守録機能付き電話機の
メッセージの記録再生構成に適用することを意識してな
されたものであるが、その用途はこれに限定されるもの
ではなく、狭義の伝送系に適用することができる。
【0116】
【発明の効果】本発明のコード励振線形予測復号器によ
れば、再生音声信号形成手段の後段に再生音声信号に音
声パワ逆量子化信号の大きさに応じた白色雑音を加える
白色雑音印加手段を設けたので、低符号化速度では再生
音声信号の雑音成分がピンク化し易いが、ピンク雑音が
白色雑音に埋もれて目立たなくなり、自然な再生音声信
号を得ることができる。
【0117】
【0118】
【0119】
【0120】
【図面の簡単な説明】
【図1】コード励振線形予測符号化器の第1実施例を示
すブロック図である。
【図2】コード励振線形予測復号器の第1実施例を示す
ブロック図である。
【図3】コード励振線形予測符号化器の第2実施例を示
すブロック図である。
【図4】コード励振線形予測復号器の第2実施例を示す
ブロック図である。
【図5】コード励振線形予測符号化器の第3実施例を示
すブロック図である。
【図6】間引き・補間操作部132の動作説明図(その
1)である。
【図7】間引き・補間操作部132の動作説明図(その
2)である。
【図8】コード励振線形予測復号器の第3実施例を示す
ブロック図である。
【図9】コード励振線形予測復号器の第4実施例を示す
ブロック図である。
【符号の説明】
101…声道分析部、102…声道予測係数量子化部、
103、213…合成フィルタ、104…フレームパワ
量子化部、105、204…適応符号帳、106、20
5…雑音符号帳、107、206…パルス符号帳、10
8、207…利得符号帳、109、209…ベクトル変
換部、110、111、210、211…乗算器、11
2、212、241…加算器、113、208…固定励
振ベクトル選択スイッチ、114…重み付き距離計算
部、115…符号帳検索部、116、201…メモリイ
ンタフェース、120、220…インデックス変換部、
130、230…バッファメモリ、131、231…周
期性分析部、132、232…間引き・補間操作部、2
02…声道予測係数逆量子化部、203…フレームパワ
逆量子化部、214…ポストフィルタ、240…雑音発
生部。
フロントページの続き (56)参考文献 特開 昭59−216195(JP,A) 特開 平5−165497(JP,A) 特開 平6−242796(JP,A) 特開 平3−116197(JP,A) 特開 平6−130994(JP,A) 特開 平5−313699(JP,A) 特開 平8−106300(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/08 G10L 19/00 G10L 19/04

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された符号化音声信号から励振信号
    を形成する励振信号再生手段と、入力された符号化音声
    信号から声道予測係数を形成する声道情報再生手段
    上記励振信号再生手段からの励振信号と上記声道情報再
    生手段からの声道予測係数に基づいて、再生音声信号を
    形成する再生音声信号形成手段とを有するコード励振線
    形予測復号器において、 上記符号化音声信号から音声パワ逆量子化信号を形成す
    る音声パワ逆量子化信号再生手段と、 上記再生音声信号形成手段の後段に、再生音声信号に上
    記音声パワ逆量子化信号の大きさに応じた白色雑音を加
    える白色雑音印加手段とを設けたことを特徴とするコー
    ド励振線形予測復号器。
JP28765494A 1994-11-22 1994-11-22 コード励振線形予測復号器 Expired - Fee Related JP3328080B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP28765494A JP3328080B2 (ja) 1994-11-22 1994-11-22 コード励振線形予測復号器
KR1019950035415A KR100272477B1 (ko) 1994-11-22 1995-10-13 코드여진선형 예측부호화기 및 복호기
US08/557,809 US5752223A (en) 1994-11-22 1995-11-14 Code-excited linear predictive coder and decoder with conversion filter for converting stochastic and impulsive excitation signals
EP01108216A EP1160771A1 (en) 1994-11-22 1995-11-16 Code-excited linear predictive coder and decoder with conversion filter for converting stochastic and impulsive excitation signals
EP95118092A EP0714089B1 (en) 1994-11-22 1995-11-16 Code-excited linear predictive coder and decoder, and method thereof
DE69527410T DE69527410T2 (de) 1994-11-22 1995-11-16 CELP-Koder und -Dekoder und Verfahren dazu
CN95119729A CN1055585C (zh) 1994-11-22 1995-11-17 代码激励线性预测编码器和译码器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28765494A JP3328080B2 (ja) 1994-11-22 1994-11-22 コード励振線形予測復号器

Publications (2)

Publication Number Publication Date
JPH08146998A JPH08146998A (ja) 1996-06-07
JP3328080B2 true JP3328080B2 (ja) 2002-09-24

Family

ID=17720008

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28765494A Expired - Fee Related JP3328080B2 (ja) 1994-11-22 1994-11-22 コード励振線形予測復号器

Country Status (6)

Country Link
US (1) US5752223A (ja)
EP (2) EP1160771A1 (ja)
JP (1) JP3328080B2 (ja)
KR (1) KR100272477B1 (ja)
CN (1) CN1055585C (ja)
DE (1) DE69527410T2 (ja)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717823A (en) * 1994-04-14 1998-02-10 Lucent Technologies Inc. Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders
US5774846A (en) 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
SE506379C3 (sv) * 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
JP3092652B2 (ja) * 1996-06-10 2000-09-25 日本電気株式会社 音声再生装置
DE69715478T2 (de) * 1996-11-07 2003-01-09 Matsushita Electric Ind Co Ltd Verfahren und Vorrichtung zur CELP Sprachkodierung und -dekodierung
JP3206497B2 (ja) * 1997-06-16 2001-09-10 日本電気株式会社 インデックスによる信号生成型適応符号帳
EP1760694A3 (en) 1997-10-22 2007-03-14 Matsushita Electric Industrial Co., Ltd. Multistage vector quantization for speech encoding
US6092040A (en) * 1997-11-21 2000-07-18 Voran; Stephen Audio signal time offset estimation algorithm and measuring normalizing block algorithms for the perceptually-consistent comparison of speech signals
US6385576B2 (en) * 1997-12-24 2002-05-07 Kabushiki Kaisha Toshiba Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
DE69837822T2 (de) * 1997-12-24 2008-01-31 Mitsubishi Denki K.K. Verfahren und Vorrichtung zur Dekodierung von Sprachsignalen
KR100249235B1 (ko) * 1997-12-31 2000-03-15 구자홍 에이치디티브이 비디오 디코더
US5963897A (en) * 1998-02-27 1999-10-05 Lernout & Hauspie Speech Products N.V. Apparatus and method for hybrid excited linear prediction speech encoding
US7117146B2 (en) * 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6311154B1 (en) * 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
US6449313B1 (en) * 1999-04-28 2002-09-10 Lucent Technologies Inc. Shaped fixed codebook search for celp speech coding
US6728344B1 (en) * 1999-07-16 2004-04-27 Agere Systems Inc. Efficient compression of VROM messages for telephone answering devices
JP3365360B2 (ja) * 1999-07-28 2003-01-08 日本電気株式会社 音声信号復号方法および音声信号符号化復号方法とその装置
US6452517B1 (en) * 1999-08-03 2002-09-17 Dsp Group Ltd. DSP for two clock cycle codebook search
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US7133823B2 (en) * 2000-09-15 2006-11-07 Mindspeed Technologies, Inc. System for an adaptive excitation pattern for speech coding
US6678651B2 (en) * 2000-09-15 2004-01-13 Mindspeed Technologies, Inc. Short-term enhancement in CELP speech coding
JP3566220B2 (ja) * 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
US6912495B2 (en) * 2001-11-20 2005-06-28 Digital Voice Systems, Inc. Speech model and analysis, synthesis, and quantization methods
JP4433668B2 (ja) * 2002-10-31 2010-03-17 日本電気株式会社 帯域拡張装置及び方法
US20040102975A1 (en) * 2002-11-26 2004-05-27 International Business Machines Corporation Method and apparatus for masking unnatural phenomena in synthetic speech using a simulated environmental effect
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
KR100651712B1 (ko) * 2003-07-10 2006-11-30 학교법인연세대학교 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
JP4525694B2 (ja) * 2007-03-27 2010-08-18 パナソニック株式会社 音声符号化装置
JP4525693B2 (ja) * 2007-03-27 2010-08-18 パナソニック株式会社 音声符号化装置および音声復号化装置
US9343079B2 (en) * 2007-06-15 2016-05-17 Alon Konchitsky Receiver intelligibility enhancement system
EP2269188B1 (en) * 2008-03-14 2014-06-11 Dolby Laboratories Licensing Corporation Multimode coding of speech-like and non-speech-like signals
US20120045001A1 (en) * 2008-08-13 2012-02-23 Shaohua Li Method of Generating a Codebook
JP5299631B2 (ja) * 2009-05-13 2013-09-25 日本電気株式会社 音声復号装置およびその音声処理方法
JP5287502B2 (ja) * 2009-05-26 2013-09-11 日本電気株式会社 音声復号装置及び方法
CN101834586A (zh) * 2010-04-21 2010-09-15 四川和芯微电子股份有限公司 随机信号产生电路及方法
CN106910509B (zh) * 2011-11-03 2020-08-18 沃伊斯亚吉公司 用于修正通用音频合成的设备及其方法
BR112015031606B1 (pt) 2013-06-21 2021-12-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para desvanecimento de sinal aperfeiçoado em diferentes domínios durante ocultação de erros
EP2980799A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
CN105007094B (zh) * 2015-07-16 2017-05-31 北京中宸泓昌科技有限公司 一种指数对扩频编码解码方法
WO2019089341A1 (en) * 2017-11-02 2019-05-09 Bose Corporation Low latency audio distribution

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5650398A (en) * 1979-10-01 1981-05-07 Hitachi Ltd Sound synthesizer
US4624012A (en) * 1982-05-06 1986-11-18 Texas Instruments Incorporated Method and apparatus for converting voice characteristics of synthesized speech
FR2530101A1 (fr) * 1982-07-06 1984-01-13 Thomson Brandt Procede et systeme de transmission cryptee d'un signal, notamment audio-frequence
US4709390A (en) * 1984-05-04 1987-11-24 American Telephone And Telegraph Company, At&T Bell Laboratories Speech message code modifying arrangement
JP2884163B2 (ja) * 1987-02-20 1999-04-19 富士通株式会社 符号化伝送装置
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
EP0287741B1 (en) * 1987-04-22 1993-03-31 International Business Machines Corporation Process for varying speech speed and device for implementing said process
CA1321646C (en) * 1988-05-20 1993-08-24 Eisuke Hanada Coded speech communication system having code books for synthesizing small-amplitude components
SE463691B (sv) * 1989-05-11 1991-01-07 Ericsson Telefon Ab L M Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen
EP0427953B1 (en) * 1989-10-06 1996-01-17 Matsushita Electric Industrial Co., Ltd. Apparatus and method for speech rate modification
CA2066568A1 (en) * 1989-10-17 1991-04-18 Ira A. Gerson Lpc based speech synthesis with adaptive pitch prefilter
JPH0451199A (ja) * 1990-06-18 1992-02-19 Fujitsu Ltd 音声符号化・復号化方式
US5138661A (en) * 1990-11-13 1992-08-11 General Electric Company Linear predictive codeword excited speech synthesizer
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
US5537509A (en) * 1990-12-06 1996-07-16 Hughes Electronics Comfort noise generation for digital communication systems
US5195137A (en) * 1991-01-28 1993-03-16 At&T Bell Laboratories Method of and apparatus for generating auxiliary information for expediting sparse codebook search
JP2776050B2 (ja) * 1991-02-26 1998-07-16 日本電気株式会社 音声符号化方式
JP2661391B2 (ja) * 1991-03-01 1997-10-08 ヤマハ株式会社 楽音信号処理装置
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
US5175769A (en) * 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals
EP0527527B1 (en) * 1991-08-09 1999-01-20 Koninklijke Philips Electronics N.V. Method and apparatus for manipulating pitch and duration of a physical audio signal
US5305420A (en) * 1991-09-25 1994-04-19 Nippon Hoso Kyokai Method and apparatus for hearing assistance with speech speed control function
WO1993018505A1 (en) * 1992-03-02 1993-09-16 The Walt Disney Company Voice transformation system
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
US5727122A (en) * 1993-06-10 1998-03-10 Oki Electric Industry Co., Ltd. Code excitation linear predictive (CELP) encoder and decoder and code excitation linear predictive coding method

Also Published As

Publication number Publication date
US5752223A (en) 1998-05-12
KR100272477B1 (ko) 2000-11-15
DE69527410D1 (de) 2002-08-22
EP1160771A1 (en) 2001-12-05
EP0714089A2 (en) 1996-05-29
JPH08146998A (ja) 1996-06-07
CN1132423A (zh) 1996-10-02
EP0714089A3 (en) 1998-07-15
EP0714089B1 (en) 2002-07-17
KR960019069A (ko) 1996-06-17
CN1055585C (zh) 2000-08-16
DE69527410T2 (de) 2003-08-21

Similar Documents

Publication Publication Date Title
JP3328080B2 (ja) コード励振線形予測復号器
KR100873836B1 (ko) Celp 트랜스코딩
EP1096476B1 (en) Speech signal decoding
JP3541680B2 (ja) 音声音楽信号の符号化装置および復号装置
JP3070955B2 (ja) 音声符号器において使用するためのスペクトルノイズ重み付けフィルタを発生する方法
JP3303580B2 (ja) 音声符号化装置
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JPS6238500A (ja) 高能率音声符号化方式とその装置
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JPH05303399A (ja) 音声時間軸圧縮伸長装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3607774B2 (ja) 音声符号化装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP4826580B2 (ja) 音声信号の再生方法及び装置
JP3410931B2 (ja) 音声符号化方法及び装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JPH0990997A (ja) 音声符号化装置、音声復号化装置、音声符号化復号化方法および複合ディジタルフィルタ
JP4293005B2 (ja) 音声音楽信号の符号化装置および復号装置
JPH09198088A (ja) 声質変換再生器
JPH07261796A (ja) 音声符号化復号化装置
JPH06102900A (ja) 音声符号化方式および音声復号化方式
JPH0266600A (ja) 音声合成方式
JPS62207036A (ja) 音声符号化方式とその装置
JPH01314300A (ja) 音声符号化復号化方法とその装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080712

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090712

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100712

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110712

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120712

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130712

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees