JP3328080B2 - コード励振線形予測復号器 - Google Patents
コード励振線形予測復号器Info
- Publication number
- JP3328080B2 JP3328080B2 JP28765494A JP28765494A JP3328080B2 JP 3328080 B2 JP3328080 B2 JP 3328080B2 JP 28765494 A JP28765494 A JP 28765494A JP 28765494 A JP28765494 A JP 28765494A JP 3328080 B2 JP3328080 B2 JP 3328080B2
- Authority
- JP
- Japan
- Prior art keywords
- code
- vector
- excitation
- excitation vector
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005284 excitation Effects 0.000 claims description 175
- 230000005236 sound signal Effects 0.000 claims description 41
- 230000001755 vocal effect Effects 0.000 claims description 29
- 239000013598 vector Substances 0.000 description 212
- 230000003044 adaptive effect Effects 0.000 description 59
- 238000013139 quantization Methods 0.000 description 29
- 238000006243 chemical reaction Methods 0.000 description 20
- 230000015572 biosynthetic process Effects 0.000 description 18
- 238000003786 synthesis reaction Methods 0.000 description 18
- 238000000034 method Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0002—Codebook adaptations
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
(CELP)符号化方式に従う復号器に関し、例えば、
いわゆる留守録機能を備えた電話機に適用し得るもので
ある。
来、発呼者又は被呼者のメッセージを記録する記録媒体
としてはカセットテープが多く使われていた。
ープを適用していると、メッセージの記録再生構成に多
くの空間が占有されるという課題があり、また、複数の
メッセージがあった場合において、聞きたいメッセージ
の頭だしに時間がかかる、メッセージ単位の消去が困難
である等の課題がある。
半導体メモリ(ICメモリ)を適用することも既に提案
されている。このように、ICメモリをメッセージ記録
媒体として用いる場合において、できるだけ簡単な構成
で多くのメッセージの記録を可能にしようとすると、音
声信号を圧縮して記録し、再生時に伸長する圧縮符号化
方式を適用することが好ましい。
号に対する高能率圧縮符号化方式として、コード励振線
形予測符号化方式が存在する。コード励振線形予測符号
化方式は、音声信号の狭義の伝送のために考えられたも
のであり、少ない伝送量で復号側において入力音声信号
にできるだけ忠実な音声信号を再生できるようにしたも
のである。
において、メッセージの記録再生用の圧縮符号化方式と
して、既存のコード励振線形予測符号化方式を適用した
場合においては、留守録機能に関連する各種要求を満足
できないことも生じる。
が今まで適用されていない留守録機能を備えた電話機等
の装置に対して、適用するのに好適なコード励振線形予
測復号器が求められている。
め、本発明は、入力された符号化音声信号から励振信号
を形成する励振信号再生手段と、入力された符号化音声
信号から声道予測係数を形成する声道情報再生手段と、
励振信号再生手段からの励振信号と声道情報再生手段か
らの声道予測係数に基づいて、再生音声信号を形成する
再生音声信号形成手段とを有するコード励振線形予測復
号器において、(1)符号化音声信号から音声パワ逆量子
化信号を形成する音声パワ逆量子化信号再生手段と、
(2)再生音声信号形成手段の後段に、再生音声信号に上
記音声パワ逆量子化信号の大きさに応じた白色雑音を加
える白色雑音印加手段とを設けたことを特徴とする。
化速度になるに従い、再生音声信号における雑音成分が
ピンク化し易いことを考慮してなされたものである(な
お、白色雑音が変調されて白色雑音と異なる耳障りな音
色に変化することをこの明細書ではピンク化と呼び、こ
の耳障りな雑音を以後ピンク雑音と呼ぶ)。ピンク雑音
に白色雑音を加えるとピンク雑音は目立たなくなり、自
然な音声信号に近くなる。そこで、本発明のコード励振
線形予測復号器は、再生音声信号形成手段の後段に、再
生音声信号に音声パワ逆量子化信号の大きさに応じた白
色雑音を加える白色雑音印加手段を設けている。
1実施例を示すものであり、符号化音声信号を、例えば
留守録機能付き電話機のICメモリに記憶できるように
したものである。
施例及び後述するコード励振線形予測復号器の第1実施
例は、ICメモリに多数のメッセージを格納できるよう
に、低符号化速度(例えば4kbit/s)を意識した
ものである。
ム単位にまとめられてベクトルとして入力される原音声
ベクトル(原音声信号)Sは、フレームパワ量子化部1
04に入力される。フレームパワ量子化部104は、原
音声ベクトルSのパワを計算して量子化し、そのインデ
ックスIoをメモリインタフェース116に出力すると
共に、逆量子化値Pを計算して利得符号帳108に出力
する。
1に入力され、声道予測係数(LPC係数)aが計算さ
れ、声道予測係数量子化部102に送出される。声道予
測係数量子化部102は、LPC係数aをLSP(Line
Spectrum Pair)係数に変換して量子化し、そのインデ
ックスIcをメモリインタフェース116に出力する。
さらに、声道予測係数量子化部102は、インデックス
IcよりLSP係数の逆量子化値を計算し、LPC係数
aqに変換して合成フィルタ103及びベクトル変換部
109に出力する。
める声道予測係数としてLSP係数を用いるようにした
のは、声道の周波数特性に対する補間特性が良くなるこ
と、LSP係数は少ない符号化ビット数で符号化しても
LPC係数等より声道スペクトルに与える歪みが小さい
こと、ベクトル量子化法との組み合わせによって効率の
良い符号化ができることによる。
係数aqと、加算器112から出力された励振ベクトル
(励振信号)eより合成音声ベクトル(局部再生の合成
音声信号)Swを計算して重み付き距離計算部114に
出力する。
音声ベクトルSに最も近くなるような最適な励振ベクト
ルeを探索し、このときの各種符号帳105〜108の
インデックス等が記録符号に含められる。
ワは、フレーム毎に求められるのに対して、後述する最
適な励振信号eの探索は、1フレームを複数に分割した
サブフレーム単位に実行される。
号帳105、雑音符号帳106、パルス符号帳107及
び利得符号帳108が設けられている。
パルス符号帳107はそれぞれ、励振信号に係る波形コ
ードベクトル(励振信号である適応励振ベクトル、雑音
励振ベクトル、パルス性励振ベクトル)を格納している
ものであり、利得符号帳108は適応励振ベクトル及び
固定励振ベクトル(雑音励振ベクトル及びパルス性励振
ベクトルをまとめてこのように呼ぶ)に関する利得コー
ド(利得ゲイン)を格納しているものである。
それぞれ、従来と同様に、統計的に周期性の強い有声音
に寄与する波形励振ベクトル、統計的に周期性の弱いラ
ンダム的な無声音に寄与する波形励振ベクトルである。
なお、適応符号帳105の適応励振ベクトルは後述する
ように適応的に更新される。パルス性励振ベクトルは、
孤立インパルスよりなる波形励振ベクトルである。パル
ス性励振ベクトルは、周期性の強い有声音の立ち上がり
や、パルス性が明確な有声音の定常部分に寄与すること
を考慮したものである。利得コードは、例えばベクトル
量子化されており、コードの一成分が適応励振ベクトル
の利得に関し、他成分が固定励振ベクトルの利得に関す
るもの(2次元量子化テーブル)となっている。
する単純な信号であるのでパルス信号発生部が発生する
ことも考えられるが、この実施例のようにコード化して
符号帳107から読出すことで発生することが以下の理
由によって好ましい。すなわち、適応符号帳105から
の出力と同期させ易く、また、雑音符号帳106と同一
のブック構成とすることで後述するように雑音励振ベク
トル又はパルス性励振ベクトルを選択して記録符号にま
とめる際の多重化処理等が容易になるためである。
再生した合成音声ベクトルSwが原音声ベクトルSに最
も類似する、各種励振ベクトルについての最適励振ベク
トルを求めてそのインデックスをメモリインタフェース
116に与えて、記録符号(符号化音声信号)にまとめ
させて図示しないICメモリに記録させる。この実施例
は、低符号化速度を意識したものであるので、固定励振
ベクトルについては雑音励振ベクトル又はパルス性励振
ベクトルを選択してそのインデックスを記録することと
している。従って、固定励振ベクトルとしていずれを選
択しているかの選択情報も記録符号に含められる。
励振ベクトル又はパルス性励振ベクトルの選択処理を含
む)が、ここでは、適応励振ベクトル、雑音励振ベクト
ル、パルス性励振ベクトル、利得コードの順に実行され
るとして説明する。なお、最適な適応励振ベクトル、雑
音励振ベクトル、パルス性励振ベクトル、利得コードが
得られるならば、その探索順序等は以下に説明するもの
に限定されない。
は、雑音符号帳106及びパルス性符号帳107からの
出力を0とし、また、乗算器110が適切な値の利得係
数bk(例えば1)を乗算するようになされている。こ
のような状態において、適応符号帳105に格納されて
いる全ての適応励振ベクトルeaiを時間順次に又は並
列的に出力させ、乗算器110及び加算器112を介し
て合成フィルタ103に励振ベクトルとして与える。合
成フィルタ103は、LPC係数aqをタップ係数とし
てこの励振ベクトルe(eai)対して畳み込み処理を
行ない、音源パラメータとして適応励振ベクトルeai
の内容だけが反映された合成音声ベクトル(ここではS
wiで表す)を、全ての適応励振ベクトルeai(i=
1〜n)について求める。
トルSと各候補の合成音声ベクトルSwiとの減算を行
ない、更に周波数的な重みをかけた後、各候補のベクト
ルのそれぞれについて各成分の2乗和ew(ewi)を
計算して符号帳検索部115に出力する。符号帳検索部
115は、n個の2乗和ewiの中の最小値に対応する
最小の適応励振ベクトルeaを最適なものと決定する。
行される。この探索時においては、固定励振ベクトル選
択スイッチ113が雑音符号帳106側に切換えられ、
適応符号帳105の出力を0とし(最適適応励振ベクト
ルを出力しても良い)、また、乗算器111が適切な値
の利得係数gk(例えば1)を乗算するようになされて
いる。このような状態において、雑音符号帳106に格
納されている全ての雑音励振ベクトルesj(j=1〜
m)を時間順次に又は並列的に出力させ、固定励振ベク
トル選択スイッチ113を介してベクトル変換部(周波
数特性操作部)109に入力させる。
及び最適適応励振ベクトルインデックスIaに基づい
て、入力された各雑音励振ベクトルesjの周波数特性
を雑音励振ベクトルの時間的な長さに対応して原音声ベ
クトルSの周波数特性に近付けるように変換操作する。
このように周波数特性が変換操作された全ての雑音励振
ベクトルev(evj)が乗算器111及び加算器11
2を介して励振ベクトルe(ej)として合成フィルタ
103に与えられる。
索と同様に処理され、符号帳検索部115が最適な雑音
励振ベクトルesを決定する。
うにしたのは以下の理由による。従来、励振ベクトルの
周波数特性は理論的に白色としてモデル化されてきた
が、実際には白色的でなく、原音声ベクトルSの周波数
特性に近い特性を有していることが実験的に確認されて
いる。従って、雑音励振ベクトルやパルス性励振ベクト
ルの周波数特性を、原音声ベクトルSの周波数特性に近
付れば、それだけ高品質な合成音声ベクトルを得ること
ができ、また、励振ベクトルの有効な周波数成分は量子
化誤差信号よりかなり大きくなって量子化誤差信号のマ
スキング効果が得られる。そこで、ベクトル変換部10
9を設けている。ここで、原音声ベクトルSの周波数特
性を表す情報としてはLPC係数acがあり、また、ピ
ッチ予測情報を意味する最適な適応励振ベクトルの情報
(それに対する利得を含む)Iaがある。従って、ベク
トル変換部109はこれらの情報に基づいて、雑音励振
ベクトルやパルス性励振ベクトルの周波数特性を操作す
る。
探索が終了すると、次には、最適なパルス性励振ベクト
ルの探索を行なう。この探索時においては、固定励振ベ
クトル選択スイッチ113がパルス性符号帳107側に
切換えられ、適応符号帳105が出力を0とし(最適適
応励振ベクトルを出力しても良い)、また、乗算器11
1が適切な値の利得係数gk(例えば1)を乗算するよ
うになされている。このような状態において、パルス性
符号帳107に格納されている全てのパルス性励振ベク
トルepk(k=1〜m)を時間順次に又は並列的に出
力させる。以降の処理は、最適な雑音励振ベクトルの探
索時と同様であるのでその説明は省略する。
ルepが決定されたときには、符号帳検索部115は、
最適な雑音励振ベクトルesの2乗和ewと最適なパル
ス性励振ベクトルepの2乗和ewとを比較し、2乗和
ewが小さい方を記録させる固定励振ベクトルの情報に
決定する。
う。この利得コードの探索時においては、適応符号帳1
05からは最適な適応励振ベクトルeaが出力され、固
定励振ベクトル選択スイッチ113は選択された雑音符
号帳106又はパルス性符号帳107側に切換えられ、
選択された固定符号帳106又は107からは最適な固
定励振ベクトルes又はepが出力される。利得符号帳
108からの1個の利得コードは、適応励振ベクトル用
の利得と固定励振ベクトル用の利得からなり、これらに
フレームパワPを反映させた後、適応励振ベクトル用の
利得bk(k=1〜t)は乗算器110に与えられ、固
定励振ベクトル用の利得gkは乗算器111に与えられ
る。かくして、利得制御された最適適応励振ベクトル
と、周波数特性操作と利得制御とが施された最適固定励
振ベクトルとが加算器112によって加算され、励振ベ
クトルeとして合成フィルタ103に与えられる。この
ような処理は、利得符号帳108内の全ての利得コード
に対して時間順次に又は並列的に実行される。重み付き
合成フィルタ103以降の探索時の処理は、各種励振ベ
クトルの探索時の処理と同様である。
トル、最適固定励振ベクトル、最適利得コードが得られ
ると、これらのインデックスIa、Is又はIp、及
び、Igをメモリインタフェース116に与えると共
に、雑音励振ベクトル及びパルス性励振ベクトルのどち
らを選択したかを表す固定コード選択スイッチ情報Iw
もメモリインタフェース116に与える。
励振源に係る情報Ia、Is又はIp、Ig、及び、I
wと、上述したLSP係数量子化情報Ic及びフレーム
パワ情報Ioとを、外部に接続されるICメモリの格納
形式に従う信号Mに多重変換して出力端子117より出
力する。
タフェース116に与えるインデックス及び固定コード
選択スイッチ情報を、対応する符号帳(105及び10
8と、106又は107)や固定コード選択スイッチ1
13に与える。このとき、スイッチ113が切換えら
れ、各符号帳から最適励振ベクトルや最適コードが出力
される。これにより、今回のフレーム処理時において最
も原音声ベクトルSに近い合成音声ベクトルSwを形成
できる励振ベクトルe(eo)が加算器112から出力
され、これが適応符号帳105に与えられる。そして、
適応符号帳105は適応励振ベクトルeaiの更新処理
を行なう。
サブフレーム毎に繰返され、符号化音声信号Mが順次I
Cメモリに記録される。
能付き電話機に対して、その所有者(被呼者)が留守に
する旨のメッセージを記録させる際や、発呼者が留守の
使用者への伝達メッセージを記録させる際に、電話機の
全体を制御する制御部(CPU)からの指令に基づいて
実行される。
予測符号化器によれば、低符号化速度においても高品質
の再生音声を得ることができ、多数のメッセージをIC
メモリに格納できるようになる。
生音声を得ることができることを具体的に説明する。
メータ(励振信号)に割当てられる符号化ビット数が少
ないので、用意される固定励振ベクトルも少なくなり、
原音声ベクトルSに含まれているパルス性雑音を明確に
再生でき難いが、この実施例の場合、パルス性励振ベク
トルを利用しているので、このような場合の音声の再生
品質を高めることができる。
クトルとを切換えて用いているので、低符号化速度に対
応できると共に、音声の過渡部のようなランダム信号と
パルス的信号が混在する信号に対する再生品質を高める
ことができる。
メータに対する符号化ビット数も少なくなるが、声道パ
ラメータに対する符号化ビット数も少なくなる。この実
施例の場合、少ない符号化ビット数で符号化してもLP
C係数等より声道スペクトルに与える歪みが小さいLS
P係数の情報を記録するようにしているので、この点か
ら再生品質を高めることができる。
ベクトルeが対応)が入力音声信号(原音声ベクトルS
が対応)の周波数特性に近い周波数特性を有することを
考慮してベクトル変換部109を設けているので、実際
に即している分だけ再生品質を高めることができると共
に、この変換に伴い量子化誤差信号に対するマスキング
効果が生じて再生品質を高めることができる。
施例を図面を参照しながら詳述する。この実施例は、図
1に示すコード励振線形予測符号化器の第1実施例に対
応するものであり、図2のブロック図に示す構成を有す
る。
形予測復号器は、メモリインタフェース201、声道予
測係数逆量子化部202、フレームパワ逆量子化部20
3、適応符号帳204、雑音符号帳205、パルス符号
帳206、利得符号帳207、固定励振ベクトル選択ス
イッチ208、ベクトル変換部209、乗算器210、
211、加算器212、合成フィルタ213及びポスト
フィルタ214から構成されている。
から当該コード励振線形予測復号器に入力された符号化
音声信号Mは、メモリインタフェース201に入力され
る。メモリインタフェース201は、この符号化音声信
号Mを、LSP係数の量子化情報Ic、フレームパワ情
報Io、最適適応励振ベクトルeaのインデックスI
a、最適固定励振ベクトルes又はepのインデックス
Is又はIp、最適利得コードのインデックスIg及び
固定励振ベクトル選択スイッチ情報Iwに分離する。そ
して、LSP係数の量子化情報Icは声道予測係数逆量
子化部202に与え、フレームパワ情報Ioはフレーム
パワ逆量子化部203に与え、最適適応励振ベクトルe
aのインデックスIaを適応符号帳204及びベクトル
変換部209に与え、最適利得コードのインデックスI
gを利得符号帳207に与え、固定励振ベクトル選択ス
イッチ情報Iwを固定励振ベクトル選択スイッチ208
に与える。また、最適固定励振ベクトルes又はepの
インデックスIs又はIpを、固定励振ベクトル選択ス
イッチ情報Iwに基づいて定まる雑音符号帳205又は
パルス符号帳206に与える。
れた符号化されているLSP係数を復号化(例えばベク
トル逆量子化)し、さらにLPC係数aqに変換する。
このように変換されたLPC係数aqが、ベクトル変換
部209、合成フィルタ213及びポストフィルタ21
4に声道予測係数情報として与えられる。
ムパワ情報Ioに基づいて、フレームパワ逆量子化値
(再生されたフレームパワ)Pを求めて利得符号帳20
7に与える。
クスIgで定まる適応励振ベクトル用と固定励振ベクト
ル用の利得コードにフレームパワPを反映させ、それぞ
れの利得コードb、gを適応励振ベクトル用の乗算器2
10、固定励振ベクトル用の乗算器211に与える。
クスIaで定まる適応励振ベクトルeaを出力し、この
適応励振ベクトルeaが乗算器210を介して利得制御
されて加算器212に与えられる。
は、与えられたインデックスIs又はIpに対応する雑
音励振ベクトルes又はパルス性励振ベクトルepを固
定励振ベクトル選択スイッチ208を介してベクトル変
換部209に与え、ベクトル変換部209は、LPC係
数aq、適応励振ベクトルesのインデックスIsに基
づいてその周波数特性を操作する。このように周波数特
性が操作された固定励振ベクトルevが、利得制御器2
11で利得制御されて加算器212に与えられる。
トルと固定励振ベクトルを加算してその加算信号を励振
ベクトルeとして合成フィルタ213に与える。合成フ
ィルタ213は、この励振ベクトルeをLPC係数aq
で畳み込んで合成音声ベクトルSwを得てポストフィル
タ214に出力する。ポストフィルタ214は、合成音
声ベクトルSwに対して聴覚特性に応じた周波数的な変
換を施して、再生音声ベクトルSpとして出力端子21
5から出力させる。
eは、また適応符号帳204に与えられる。このとき、
適応符号帳204は、この励振ベクトルeを用いて適応
励振ベクトルの更新を行なう。
な処理を符号化音声信号が与えられる毎に、従ってフレ
ーム毎(励振信号についてはサブフレーム毎)に行な
う。
予測復号器によれば、与えられたLSP係数を処理する
構成を有し、音源としてパルス符号帳206を有し、入
力音声信号の周波数特性に固定音源の周波数特性を近付
けるベクトル変換部209を有するので、これにより、
上述した第1実施例のコード励振線形予測符号化器につ
いての効果が実効あるものとなる。
2実施例を示すものであり、符号化音声信号を、例えば
留守録機能付き電話機のICメモリに記憶できるように
したものである。なお、図3において、図1との同一、
対応部分には同一符号を付して示している。
は、復号器として、上述した第1実施例のコード励振線
形予測復号器を適用することを前提としている。
及び後述する第2実施例のコード励振線形予測復号器
は、再生音声ベクトルの周期性(音の高さ)を一定化さ
せることを意図したものである。
は、図3及び図1との比較から明らかなように、第1実
施例の構成にインデックス変換部120を追加したもの
である。このインデックス変換部120には、音高制御
信号con1と最適適応励振ベクトルeaのインデック
スIaとが入力されている。インデックス変換部120
は、音高制御信号con1が音高の非制御状態を指示し
ているときに、最適適応励振ベクトルeaのインデック
スIaをそのまま通過させてメモリインタフェース11
6に与え、音高制御信号con1が音高の制御状態を指
示しているときに、最適適応励振ベクトルeaのインデ
ックスIaに関係なく固定のインデックスIacを発生
させてメモリインタフェース116に与える。
Iaは音声信号の周期性(声の高さ)の情報を表わすパ
ラメータである。音声信号の周期は話者によって異な
り、また同一話者でも会話の抑揚等で時間的に変化す
る。固定のインデックスIacを、符号化音声信号Mに
含めて、音声信号の周期を常にある一定の値に固定して
しまうことにより、第1実施例のコード励振線形予測復
号器(図2参照)で再生した音声信号は、声の高さが変
わらないロボット的な音声となる。
ら電話撃退の要請がある。このような要請に答える一方
法として、被呼者のメッセージ音声信号をロボット的な
音声信号とすることは有効である。そのため、このよう
な動作モードの選択操作子を設けておき、この選択操作
子が操作されたときに、電話機の全体を制御する制御部
(CPU)が、インデックス変換部120に、音高の制
御状態を指示している音高制御信号con1を与えて、
最適適応励振ベクトルeaのインデックスIaに関係な
く固定のインデックスIacを符号化音声信号Mに含め
て格納させ、その再生時に音高がほぼ一定の音声信号を
出力させるようにしている。
化器によっても、第1実施例のコード励振線形予測符号
化器と同様な効果を得ることができ、さらに、再生時
に、音高がほぼ一定の音声信号を適宜形成できるという
効果も得ることができる。
実施例を示すものである。なお、図4において、図2と
の同一、対応部分には同一符号を付して示している。第
2実施例のコード励振線形予測復号器は、符号化器とし
て、上述した図2に示す第1実施例のコード励振線形予
測符号化器を適用することを前提としている。
は、図4及び図2との比較から明らかなように、第1実
施例の構成にインデックス変換部220を追加したもの
である。このインデックス変換部220には、音高制御
信号con1と、メモリインタフェース201が符号化
音声信号Mから分離した最適適応励振ベクトルeaのイ
ンデックスIaとが入力される。インデックス変換部2
20は、音高制御信号con1が音高の非制御状態を指
示しているときに、最適適応励振ベクトルeaのインデ
ックスIaをそのまま通過させて適応符号帳204及び
ベクトル変換部209に与え、音高制御信号con1が
音高の制御状態を指示しているときに、最適適応励振ベ
クトルeaのインデックスIaに関係なく固定のインデ
ックスIacを発生させて適応符号帳204及びベクト
ル変換部209に与える。
復号器は、音高制御信号con1が音高の非制御状態を
指示しているときには分離された最適適応励振ベクトル
eaのインデックスIaを用いて復号を行ない、音高制
御信号con1が音高の制御状態を指示しているときに
は分離された最適適応励振ベクトルeaのインデックス
Iaに代えて固定インデックスIacを用いて復号を行
なう。
音高が制御されていなくても、その再生時には、第2実
施例のコード励振線形予測符号化器について上述したと
同様な理由により、音高がほぼ一定の音声信号を適宜出
力させることができる。
器によっても、第1実施例のコード励振線形予測復号器
と同様な効果を得ることができ、さらに、音高がほぼ一
定の音声信号を適宜形成できるという効果も得ることが
できる。
3実施例を示すものである。なお、図5において、図1
との同一、対応部分には同一符号を付して示している。
は、復号器として、上述した第1実施例のコード励振線
形予測復号器(図2)を適用することを前提としてい
る。
及び後述する第3実施例のコード励振線形予測復号器
は、再生音声ベクトルの再生速度を任意に選定できるよ
うにすることを意図したものである。
は、図5及び図1との比較から明らかなように、第1実
施例の構成に、バッファメモリ130、周期性分析部1
31及び間引き・補間操作部132を追加したものであ
る。これら新たな構成130〜132は、原音声ベクト
ルSの入力段に設けられており、間引き・補間操作部1
32から出力された音声ベクトルSmを入力音声ベクト
ルとして第1実施例と同様に符号化処理される。
補間操作部132には、速度制御信号con2が与えら
れている。この速度制御信号con2が非制御状態を指
示しているときには、バッファメモリ130〜間引き・
補間操作部132は動作せず、原音声ベクトルSがその
まま符号化処理構成に与えられる。一方、速度制御信号
con2が制御状態を指示しているときには、バッファ
メモリ130〜間引き・補間操作部132は音声信号の
速度変更動作を行なう。
Sを数フレーム分格納するものである。周期性分析部1
31は、バッファメモリ130に格納されている原音声
ベクトルSfの周期性をフレーム毎に分析し、サンプル
数で表現された周期性情報(ピッチ周期)ccを間引き
・補間操作部132に与える。間引き・補間操作部13
2には、速度制御信号con2が制御状態を指示してい
るときに、変倍倍率sfも与えられる。間引き・補間操
作部132は、この変倍倍率sfから間引く又は補間す
るサンプル数diを計算する。間引き・補間操作部13
2は、周期性情報ccの整数倍の中で、計算されたサン
プル数diに最も近い数n×ccを求め、このサンプル
数n×ccだけサンプルを周期性情報ccの周期単位に
間引き、又は、補間し、さらにフレームの再構成を行な
って、間引かれた又は補間された音声ベクトルSmを出
力する。
<1)における間引き・補間操作部132の動作(間引
き動作)の説明図である。図6に示すように、1フレー
ム分(320サンプル)の原音声ベクトルSからその周
期性(ピッチ周期)ccを求めたところ、50サンプル
程度であり、また、変倍率sfによって定まるサンプル
数diから、何周期(n周期)分を間引くかを求めたと
ころ、2周期(n=2)という結果が得られた。そこ
で、この例の場合には、図6に示すように、フレームの
先頭から2周期分のサンプルを間引くことにした。この
ようにすると、1フレームのサンプル数が所定のサンプ
ル数(320)より少ないものとなり、そこで、今回の
間引き処理後のサンプルと、次のフレームについて同様
に間引き処理したサンプルとから1フレームの音声ベク
トルを形成し直して符号化処理構成に与える。
>1)における間引き・補間操作部132の動作(補間
動作)の説明図である。図7に示すように、1フレーム
分(320サンプル)の原音声ベクトルSからその周期
性(ピッチ周期)ccを求めたところ、80サンプル程
度であり、また、変倍率sfによって定まるサンプル数
diから、何周期(n周期)分を補間するかを求めたと
ころ、2周期(n=2)という結果が得られた。そこ
で、この例の場合には、図7に示すように、フレームの
先頭側の周期(1)のサンプル及び2番目の周期(2)
のサンプルを2回ずつ繰り返して補間することにした。
このようにすると、1フレームのサンプル数が所定のサ
ンプル数(320)より多いものとなり、そこで、今回
の補間処理後のサンプル列の内320サンプルを1フレ
ームのサンプルとして符号化処理構成に与えると共に、
残りのサンプルと、次のフレームについて同様に補間処
理したサンプルとから1フレームの音声ベクトルを形成
し直して符号化処理構成に与える。
たようにいたずら電話撃退の要請がある。また、電話が
多くかかってくる使用者(被呼者)の場合、発呼者から
の留守録メッセージも多数となるので、高速再生を望む
場合がある。このような要請や要求に答える一方法とし
て、被呼者や発呼者のメッセージ音声信号の再生速度を
通常速度から変えることは有効である。そのため、この
ような動作モードの選択操作子を設けておき、この選択
操作子が操作されたときに、電話機の全体を制御する制
御部(CPU)が、バッファメモリ130〜間引き・補
間操作部132に、再生速度の制御状態を指示している
速度制御信号con2や指示された変倍倍率sfを与え
て、符号化段階(記録段階)で再生速度が通常速度と異
なるように符号化させるようにしている。
化器によっても、第1実施例のコード励振線形予測符号
化器と同様な効果を得ることができ、さらに、再生時
に、使用者の指示に応じた再生速度を有する音声信号を
適宜形成できるという効果も得ることができる。
を行なうようにしたので、補間又は間引きを行なっても
再生音声の連続性を維持することができ、また、音高を
維持することができる。
実施例を示すものである。なお、図8において、図2と
の同一、対応部分には同一符号を付して示している。第
3実施例のコード励振線形予測復号器は、符号化器とし
て、上述した図1に示す第1実施例のコード励振線形予
測符号化器に適用することを前提としている。
も、音声信号の再生速度を入力音声自体が有する通常速
度と異なるようにしたものであるが、再生速度の変更を
符号化器側ではなく復号器側での処理で行なうようにし
たものである。
は、図8及び図2との比較から明らかなように、第1実
施例における加算器212及び合成フィルタ213間
に、バッファメモリ230、周期性分析部231及び間
引き・補間操作部232を追加したものであり、また、
合成フィルタ213及びポストフィルタ214が1フレ
ーム分の所定サンプル数以外のサンプル数にも対応する
ようになされているものである。従って、加算器212
までの処理は、第1実施例のコード励振線形予測復号器
と同様である。
補間操作部232には、速度制御信号con2が与えら
れている。この速度制御信号con2が非制御状態を指
示しているときには、バッファメモリ230〜間引き・
補間操作部232は動作せず、最適励振ベクトルeをそ
のまま通過させる。一方、速度制御信号con2が制御
状態を指示しているときには、バッファメモリ230〜
間引き・補間操作部232は速度変更動作を行なう。
レーム分の最適励振ベクトルeを蓄える。周期性分析部
231は、バッファメモリ230に蓄えられた最適励振
ベクトルefにおける周期性の値(ピッチ周期;サンプ
ル数換算)ccを計算する。間引き・補間操作部232
は、変速倍率sfから間引く又は補間するサンプル数d
iを計算し、この変更分のサンプル数diに最も近くな
る周期性の値の整数倍cc×nを求め、周期性の値cc
のサンプル数単位に、最適励振ベクトルefを間引き又
は補間する。第3実施例のコード励振線形予測復号器
は、第3実施例のコード励振線形予測符号化器に比較し
て、間引き・補間対象が音声ベクトルのサンプルか最適
励振ベクトルのサンプルかの違いがあるが、以上までの
処理は同様である。
復号器における間引き・補間操作部232は、さらに、
間引き・補間処理後の最適励振ベクトルemのベクトル
長(サンプル数)slを求める。そして、間引き・補間
操作部232は、間引き・補間処理後の最適励振ベクト
ルemを合成フィルタ213に出力すると共に、ベクト
ル長slを合成フィルタ213及びポストフィルタ21
4に出力する。
14は、第1実施例のコード励振線形予測復号器と同様
に処理するものであるが、入力ベクトルのベクトル長
が、間引き・補間処理によって本来のベクトル長と異な
っているので、そのベクトル長slの入力サンプル系列
に対して、声道分析係数aqを用いてフィルタリングを
行なう。
器によっても、第1実施例のコード励振線形予測復号器
と同様な効果を得ることができ、さらに、使用者の指示
に応じた再生速度を有する再生音声信号を適宜形成でき
るという効果も得ることができる。
きを行なうようにしたので、補間又は間引きを行なって
も再生音声の連続性を維持することができ、また、音高
を維持することができる。
ルの段階で行なうようにしているので、より自然な再生
音声信号を得ることが可能となる。すなわち、間引き・
補間による影響が、合成フィルタ213及びポストフィ
ルタ214のフィルタリングを通じて緩和され、より自
然な再生音声信号を得ることができる。因に、ポストフ
ィルタ214からの出力段階で、間引き・補間を行なう
ことも考えられるが、周期性を分析して補間又は間引き
を行なっても、出力音声信号にその影響が入り込む度合
いはこの実施例より大きくなる。
実施例を示すものである。なお、図9において、図2と
の同一、対応部分には同一符号を付して示している。第
4実施例のコード励振線形予測復号器は、符号化器とし
て、上述した図1に示す第1実施例のコード励振線形予
測符号化器を適用することを前提としている。
測符号化器は、上述したように、ICメモリに多数のメ
ッセージを格納できるようにすべく、低符号化速度を有
するように符号化するものであった。符号化速度が低く
なった分だけ、再生音声信号に符号化歪みが入り込むこ
とを避けることができない。実験的に、この符号化歪み
のため、再生音声信号における雑音成分がピンク雑音化
する傾向があることが分かった。第4実施例のコード励
振線形予測復号器は、再生音声信号における雑音成分が
ピンク雑音化する傾向にあるという不都合を解決しよう
としたものである。
は、図8及び図2との比較から明らかなように、第1実
施例の構成に、雑音発生器140及び加算器141を追
加したものである。
に応じて白色雑音nzを発生する。なお、フレームパワ
に関係なく一定の変化をする雑音を発生するものや、背
景雑音を予め捕捉して格納しておき発生するものは他の
実施例を構成する。加算器141は、ポストフィルタ2
14からの再生音声ベクトルにこの雑音nzを加算し、
その加算後の再生音声ベクトルSpを出力端子215か
ら外部に出力させる。
音声ベクトルにおける雑音成分がピンク雑音化していて
も、雑音発生部140からの白色雑音が加えられること
により、加算器141からの再生音声ベクトルSpの雑
音成分は白色雑音化され、ピンク雑音成分が目立たなく
なり、自然の雑音成分に近くなる。
器によっても、第1実施例のコード励振線形予測復号器
と同様な効果を得ることができ、さらに、符号化・復号
することによりその背景雑音等が変調を受け耳障りに聞
こえるように変化しても、人為的に生成した雑音を大き
さを適当に定めて加えるので、耳障りな部分をマスクで
き、より自然な再生音声信号を得ることができる。
ルから得るいわゆるフォワード型のコード励振線形予測
符号化方式に従うものを示したが、第1実施例、第3実
施例及び第4実施例の特徴構成に対しては、声道分析係
数を局部再生の音声ベクトルから得るいわゆるバックワ
ード型のコード励振線形予測符号化方式に従うものに適
用することができる。
ベクトル)の発生構成として、適応符号帳、雑音符号
帳、パルス符号帳及び利得符号帳を備えるものであった
が、第2実施例〜第4実施例については、励振信号(励
振ベクトル)の発生構成はこれに限定されず、少なくと
も適応符号帳及び雑音符号帳を備えるものであれば適用
することができる。
メッセージの記録再生構成に適用することを意識してな
されたものであるが、その用途はこれに限定されるもの
ではなく、狭義の伝送系に適用することができる。
れば、再生音声信号形成手段の後段に再生音声信号に音
声パワ逆量子化信号の大きさに応じた白色雑音を加える
白色雑音印加手段を設けたので、低符号化速度では再生
音声信号の雑音成分がピンク化し易いが、ピンク雑音が
白色雑音に埋もれて目立たなくなり、自然な再生音声信
号を得ることができる。
すブロック図である。
ブロック図である。
すブロック図である。
ブロック図である。
すブロック図である。
1)である。
2)である。
ブロック図である。
ブロック図である。
103、213…合成フィルタ、104…フレームパワ
量子化部、105、204…適応符号帳、106、20
5…雑音符号帳、107、206…パルス符号帳、10
8、207…利得符号帳、109、209…ベクトル変
換部、110、111、210、211…乗算器、11
2、212、241…加算器、113、208…固定励
振ベクトル選択スイッチ、114…重み付き距離計算
部、115…符号帳検索部、116、201…メモリイ
ンタフェース、120、220…インデックス変換部、
130、230…バッファメモリ、131、231…周
期性分析部、132、232…間引き・補間操作部、2
02…声道予測係数逆量子化部、203…フレームパワ
逆量子化部、214…ポストフィルタ、240…雑音発
生部。
Claims (1)
- 【請求項1】 入力された符号化音声信号から励振信号
を形成する励振信号再生手段と、入力された符号化音声
信号から声道予測係数を形成する声道情報再生手段と、
上記励振信号再生手段からの励振信号と上記声道情報再
生手段からの声道予測係数に基づいて、再生音声信号を
形成する再生音声信号形成手段とを有するコード励振線
形予測復号器において、 上記符号化音声信号から音声パワ逆量子化信号を形成す
る音声パワ逆量子化信号再生手段と、 上記再生音声信号形成手段の後段に、再生音声信号に上
記音声パワ逆量子化信号の大きさに応じた白色雑音を加
える白色雑音印加手段とを設けたことを特徴とするコー
ド励振線形予測復号器。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP28765494A JP3328080B2 (ja) | 1994-11-22 | 1994-11-22 | コード励振線形予測復号器 |
KR1019950035415A KR100272477B1 (ko) | 1994-11-22 | 1995-10-13 | 코드여진선형 예측부호화기 및 복호기 |
US08/557,809 US5752223A (en) | 1994-11-22 | 1995-11-14 | Code-excited linear predictive coder and decoder with conversion filter for converting stochastic and impulsive excitation signals |
EP01108216A EP1160771A1 (en) | 1994-11-22 | 1995-11-16 | Code-excited linear predictive coder and decoder with conversion filter for converting stochastic and impulsive excitation signals |
EP95118092A EP0714089B1 (en) | 1994-11-22 | 1995-11-16 | Code-excited linear predictive coder and decoder, and method thereof |
DE69527410T DE69527410T2 (de) | 1994-11-22 | 1995-11-16 | CELP-Koder und -Dekoder und Verfahren dazu |
CN95119729A CN1055585C (zh) | 1994-11-22 | 1995-11-17 | 代码激励线性预测编码器和译码器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP28765494A JP3328080B2 (ja) | 1994-11-22 | 1994-11-22 | コード励振線形予測復号器 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08146998A JPH08146998A (ja) | 1996-06-07 |
JP3328080B2 true JP3328080B2 (ja) | 2002-09-24 |
Family
ID=17720008
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP28765494A Expired - Fee Related JP3328080B2 (ja) | 1994-11-22 | 1994-11-22 | コード励振線形予測復号器 |
Country Status (6)
Country | Link |
---|---|
US (1) | US5752223A (ja) |
EP (2) | EP1160771A1 (ja) |
JP (1) | JP3328080B2 (ja) |
KR (1) | KR100272477B1 (ja) |
CN (1) | CN1055585C (ja) |
DE (1) | DE69527410T2 (ja) |
Families Citing this family (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5717823A (en) * | 1994-04-14 | 1998-02-10 | Lucent Technologies Inc. | Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders |
US5774846A (en) | 1994-12-19 | 1998-06-30 | Matsushita Electric Industrial Co., Ltd. | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
SE506379C3 (sv) * | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc-talkodare med kombinerad excitation |
JP3092652B2 (ja) * | 1996-06-10 | 2000-09-25 | 日本電気株式会社 | 音声再生装置 |
DE69715478T2 (de) * | 1996-11-07 | 2003-01-09 | Matsushita Electric Ind Co Ltd | Verfahren und Vorrichtung zur CELP Sprachkodierung und -dekodierung |
JP3206497B2 (ja) * | 1997-06-16 | 2001-09-10 | 日本電気株式会社 | インデックスによる信号生成型適応符号帳 |
EP1760694A3 (en) | 1997-10-22 | 2007-03-14 | Matsushita Electric Industrial Co., Ltd. | Multistage vector quantization for speech encoding |
US6092040A (en) * | 1997-11-21 | 2000-07-18 | Voran; Stephen | Audio signal time offset estimation algorithm and measuring normalizing block algorithms for the perceptually-consistent comparison of speech signals |
US6385576B2 (en) * | 1997-12-24 | 2002-05-07 | Kabushiki Kaisha Toshiba | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch |
DE69837822T2 (de) * | 1997-12-24 | 2008-01-31 | Mitsubishi Denki K.K. | Verfahren und Vorrichtung zur Dekodierung von Sprachsignalen |
KR100249235B1 (ko) * | 1997-12-31 | 2000-03-15 | 구자홍 | 에이치디티브이 비디오 디코더 |
US5963897A (en) * | 1998-02-27 | 1999-10-05 | Lernout & Hauspie Speech Products N.V. | Apparatus and method for hybrid excited linear prediction speech encoding |
US7117146B2 (en) * | 1998-08-24 | 2006-10-03 | Mindspeed Technologies, Inc. | System for improved use of pitch enhancement with subcodebooks |
US6104992A (en) * | 1998-08-24 | 2000-08-15 | Conexant Systems, Inc. | Adaptive gain reduction to produce fixed codebook target signal |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
US6311154B1 (en) * | 1998-12-30 | 2001-10-30 | Nokia Mobile Phones Limited | Adaptive windows for analysis-by-synthesis CELP-type speech coding |
US6449313B1 (en) * | 1999-04-28 | 2002-09-10 | Lucent Technologies Inc. | Shaped fixed codebook search for celp speech coding |
US6728344B1 (en) * | 1999-07-16 | 2004-04-27 | Agere Systems Inc. | Efficient compression of VROM messages for telephone answering devices |
JP3365360B2 (ja) * | 1999-07-28 | 2003-01-08 | 日本電気株式会社 | 音声信号復号方法および音声信号符号化復号方法とその装置 |
US6452517B1 (en) * | 1999-08-03 | 2002-09-17 | Dsp Group Ltd. | DSP for two clock cycle codebook search |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US7133823B2 (en) * | 2000-09-15 | 2006-11-07 | Mindspeed Technologies, Inc. | System for an adaptive excitation pattern for speech coding |
US6678651B2 (en) * | 2000-09-15 | 2004-01-13 | Mindspeed Technologies, Inc. | Short-term enhancement in CELP speech coding |
JP3566220B2 (ja) * | 2001-03-09 | 2004-09-15 | 三菱電機株式会社 | 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法 |
US6912495B2 (en) * | 2001-11-20 | 2005-06-28 | Digital Voice Systems, Inc. | Speech model and analysis, synthesis, and quantization methods |
JP4433668B2 (ja) * | 2002-10-31 | 2010-03-17 | 日本電気株式会社 | 帯域拡張装置及び方法 |
US20040102975A1 (en) * | 2002-11-26 | 2004-05-27 | International Business Machines Corporation | Method and apparatus for masking unnatural phenomena in synthetic speech using a simulated environmental effect |
WO2004090870A1 (ja) | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
KR100651712B1 (ko) * | 2003-07-10 | 2006-11-30 | 학교법인연세대학교 | 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법 |
US8332216B2 (en) * | 2006-01-12 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte., Ltd. | System and method for low power stereo perceptual audio coding using adaptive masking threshold |
JP4525694B2 (ja) * | 2007-03-27 | 2010-08-18 | パナソニック株式会社 | 音声符号化装置 |
JP4525693B2 (ja) * | 2007-03-27 | 2010-08-18 | パナソニック株式会社 | 音声符号化装置および音声復号化装置 |
US9343079B2 (en) * | 2007-06-15 | 2016-05-17 | Alon Konchitsky | Receiver intelligibility enhancement system |
EP2269188B1 (en) * | 2008-03-14 | 2014-06-11 | Dolby Laboratories Licensing Corporation | Multimode coding of speech-like and non-speech-like signals |
US20120045001A1 (en) * | 2008-08-13 | 2012-02-23 | Shaohua Li | Method of Generating a Codebook |
JP5299631B2 (ja) * | 2009-05-13 | 2013-09-25 | 日本電気株式会社 | 音声復号装置およびその音声処理方法 |
JP5287502B2 (ja) * | 2009-05-26 | 2013-09-11 | 日本電気株式会社 | 音声復号装置及び方法 |
CN101834586A (zh) * | 2010-04-21 | 2010-09-15 | 四川和芯微电子股份有限公司 | 随机信号产生电路及方法 |
CN106910509B (zh) * | 2011-11-03 | 2020-08-18 | 沃伊斯亚吉公司 | 用于修正通用音频合成的设备及其方法 |
BR112015031606B1 (pt) | 2013-06-21 | 2021-12-14 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Aparelho e método para desvanecimento de sinal aperfeiçoado em diferentes domínios durante ocultação de erros |
EP2980799A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
CN105007094B (zh) * | 2015-07-16 | 2017-05-31 | 北京中宸泓昌科技有限公司 | 一种指数对扩频编码解码方法 |
WO2019089341A1 (en) * | 2017-11-02 | 2019-05-09 | Bose Corporation | Low latency audio distribution |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5650398A (en) * | 1979-10-01 | 1981-05-07 | Hitachi Ltd | Sound synthesizer |
US4624012A (en) * | 1982-05-06 | 1986-11-18 | Texas Instruments Incorporated | Method and apparatus for converting voice characteristics of synthesized speech |
FR2530101A1 (fr) * | 1982-07-06 | 1984-01-13 | Thomson Brandt | Procede et systeme de transmission cryptee d'un signal, notamment audio-frequence |
US4709390A (en) * | 1984-05-04 | 1987-11-24 | American Telephone And Telegraph Company, At&T Bell Laboratories | Speech message code modifying arrangement |
JP2884163B2 (ja) * | 1987-02-20 | 1999-04-19 | 富士通株式会社 | 符号化伝送装置 |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
EP0287741B1 (en) * | 1987-04-22 | 1993-03-31 | International Business Machines Corporation | Process for varying speech speed and device for implementing said process |
CA1321646C (en) * | 1988-05-20 | 1993-08-24 | Eisuke Hanada | Coded speech communication system having code books for synthesizing small-amplitude components |
SE463691B (sv) * | 1989-05-11 | 1991-01-07 | Ericsson Telefon Ab L M | Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen |
EP0427953B1 (en) * | 1989-10-06 | 1996-01-17 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method for speech rate modification |
CA2066568A1 (en) * | 1989-10-17 | 1991-04-18 | Ira A. Gerson | Lpc based speech synthesis with adaptive pitch prefilter |
JPH0451199A (ja) * | 1990-06-18 | 1992-02-19 | Fujitsu Ltd | 音声符号化・復号化方式 |
US5138661A (en) * | 1990-11-13 | 1992-08-11 | General Electric Company | Linear predictive codeword excited speech synthesizer |
US5293449A (en) * | 1990-11-23 | 1994-03-08 | Comsat Corporation | Analysis-by-synthesis 2,4 kbps linear predictive speech codec |
US5537509A (en) * | 1990-12-06 | 1996-07-16 | Hughes Electronics | Comfort noise generation for digital communication systems |
US5195137A (en) * | 1991-01-28 | 1993-03-16 | At&T Bell Laboratories | Method of and apparatus for generating auxiliary information for expediting sparse codebook search |
JP2776050B2 (ja) * | 1991-02-26 | 1998-07-16 | 日本電気株式会社 | 音声符号化方式 |
JP2661391B2 (ja) * | 1991-03-01 | 1997-10-08 | ヤマハ株式会社 | 楽音信号処理装置 |
US5396576A (en) * | 1991-05-22 | 1995-03-07 | Nippon Telegraph And Telephone Corporation | Speech coding and decoding methods using adaptive and random code books |
US5175769A (en) * | 1991-07-23 | 1992-12-29 | Rolm Systems | Method for time-scale modification of signals |
EP0527527B1 (en) * | 1991-08-09 | 1999-01-20 | Koninklijke Philips Electronics N.V. | Method and apparatus for manipulating pitch and duration of a physical audio signal |
US5305420A (en) * | 1991-09-25 | 1994-04-19 | Nippon Hoso Kyokai | Method and apparatus for hearing assistance with speech speed control function |
WO1993018505A1 (en) * | 1992-03-02 | 1993-09-16 | The Walt Disney Company | Voice transformation system |
US5765127A (en) * | 1992-03-18 | 1998-06-09 | Sony Corp | High efficiency encoding method |
US5727122A (en) * | 1993-06-10 | 1998-03-10 | Oki Electric Industry Co., Ltd. | Code excitation linear predictive (CELP) encoder and decoder and code excitation linear predictive coding method |
-
1994
- 1994-11-22 JP JP28765494A patent/JP3328080B2/ja not_active Expired - Fee Related
-
1995
- 1995-10-13 KR KR1019950035415A patent/KR100272477B1/ko not_active IP Right Cessation
- 1995-11-14 US US08/557,809 patent/US5752223A/en not_active Expired - Lifetime
- 1995-11-16 DE DE69527410T patent/DE69527410T2/de not_active Expired - Fee Related
- 1995-11-16 EP EP01108216A patent/EP1160771A1/en not_active Withdrawn
- 1995-11-16 EP EP95118092A patent/EP0714089B1/en not_active Expired - Lifetime
- 1995-11-17 CN CN95119729A patent/CN1055585C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US5752223A (en) | 1998-05-12 |
KR100272477B1 (ko) | 2000-11-15 |
DE69527410D1 (de) | 2002-08-22 |
EP1160771A1 (en) | 2001-12-05 |
EP0714089A2 (en) | 1996-05-29 |
JPH08146998A (ja) | 1996-06-07 |
CN1132423A (zh) | 1996-10-02 |
EP0714089A3 (en) | 1998-07-15 |
EP0714089B1 (en) | 2002-07-17 |
KR960019069A (ko) | 1996-06-17 |
CN1055585C (zh) | 2000-08-16 |
DE69527410T2 (de) | 2003-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3328080B2 (ja) | コード励振線形予測復号器 | |
KR100873836B1 (ko) | Celp 트랜스코딩 | |
EP1096476B1 (en) | Speech signal decoding | |
JP3541680B2 (ja) | 音声音楽信号の符号化装置および復号装置 | |
JP3070955B2 (ja) | 音声符号器において使用するためのスペクトルノイズ重み付けフィルタを発生する方法 | |
JP3303580B2 (ja) | 音声符号化装置 | |
JP3417362B2 (ja) | 音声信号復号方法及び音声信号符号化復号方法 | |
JPS6238500A (ja) | 高能率音声符号化方式とその装置 | |
JP2968109B2 (ja) | コード励振線形予測符号化器及び復号化器 | |
JP3496618B2 (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
JPH05303399A (ja) | 音声時間軸圧縮伸長装置 | |
JP2001142499A (ja) | 音声符号化装置ならびに音声復号化装置 | |
JP3607774B2 (ja) | 音声符号化装置 | |
JP3063087B2 (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
JP4826580B2 (ja) | 音声信号の再生方法及び装置 | |
JP3410931B2 (ja) | 音声符号化方法及び装置 | |
JP3006790B2 (ja) | 音声符号化復号化方法及びその装置 | |
JPH0990997A (ja) | 音声符号化装置、音声復号化装置、音声符号化復号化方法および複合ディジタルフィルタ | |
JP4293005B2 (ja) | 音声音楽信号の符号化装置および復号装置 | |
JPH09198088A (ja) | 声質変換再生器 | |
JPH07261796A (ja) | 音声符号化復号化装置 | |
JPH06102900A (ja) | 音声符号化方式および音声復号化方式 | |
JPH0266600A (ja) | 音声合成方式 | |
JPS62207036A (ja) | 音声符号化方式とその装置 | |
JPH01314300A (ja) | 音声符号化復号化方法とその装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080712 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090712 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100712 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110712 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120712 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130712 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |