JPH10154000A - 音声符号化復号方式 - Google Patents

音声符号化復号方式

Info

Publication number
JPH10154000A
JPH10154000A JP9064217A JP6421797A JPH10154000A JP H10154000 A JPH10154000 A JP H10154000A JP 9064217 A JP9064217 A JP 9064217A JP 6421797 A JP6421797 A JP 6421797A JP H10154000 A JPH10154000 A JP H10154000A
Authority
JP
Japan
Prior art keywords
codebook
information
information amount
bit rate
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9064217A
Other languages
English (en)
Other versions
JP3849210B2 (ja
Inventor
Shigeki Fujii
茂樹 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP06421797A priority Critical patent/JP3849210B2/ja
Priority to US08/935,193 priority patent/US5970443A/en
Publication of JPH10154000A publication Critical patent/JPH10154000A/ja
Application granted granted Critical
Publication of JP3849210B2 publication Critical patent/JP3849210B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 状況に応じて符号化情報量を動的に制御する
ことができ、回線状況が変動しても伝送リアルタイム性
を確保したり、記憶情報量をフレキシブルに変化させる
ことを可能にする。 【解決手段】 符号化器1は、入力音声信号を線形予測
分析した残りの残差信号をコードブックを用いてベクト
ル量子化する。トランスミッタ2は、符号化器1から出
力される圧縮符号化ビットストリームを通信回線に供給
する。ビットレート制御部3は、回線状況に応じてビッ
トレートモードを決定し、ビットストリーム生成部21
を制御する。ビットストリーム生成部21は、ベクトル
量子化して得られたインデックスのうち、音声信号の再
生に影響の少ない一部のインデックスを、ビットレート
モードに基づいて削除することにより、圧縮符号化ビッ
トストリームのビットレートを動的に制御すると共に、
ビットストリームにビットレートモードの情報を付加す
る。復号側ではビットレートモードに基づいて復号処理
を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、音声信号を線形
予測分析した残りの残差信号をコードブックを用いてベ
クトル量子化することにより音声信号を圧縮符号化する
音声符号化復号方式に関し、特に通信回線の混雑状況や
記録媒体の蓄積容量の制限等に基づいて伝送ビットレー
トや記録情報量等を適応的に制御するようにした音声符
号化復号方式に関する。
【0002】
【従来の技術】従来より、低ビットレートで高品質の圧
縮符号化が可能である音声信号の圧縮符号化方式として
CELP(Code-Excited Linear Prediction )型符号
化方式が知られている。CELP型符号化方式は、線形
予測(LPC)分析結果の残差成分に対してコードブッ
クを用いたベクトル量子化を行うもので、一定間隔で切
り出された音声信号を線形予測(LPC)分析してLP
C係数を算出し、これを量子化する一方、算出されたL
PC係数を元にして残差信号を算出し、その利得を求め
て量子化する。更に、求めた利得で残差信号を正規化し
た後、例えばMDCT(Modified Discrete Cosine Tra
nsform)により時系列の残差信号を周波数領域の信号に
変換し、これを適当なサブフレームに分割してコードブ
ックを用いてベクトル量子化する。そして、量子化され
たLPC係数、利得及びベクトル量子化インデックスを
合成して圧縮符号化ビットストリームを生成する。復号
側では、入力された圧縮ビットストリームをLPC係
数、利得及びベクトル量子化インデックスに分解し、そ
れぞれを逆量子化して、合成することにより復号信号を
得る。
【0003】このようなCELP型符号化方式の中で、
通信時の伝送誤りの耐性を向上させた方式として、共役
構造コードブックを用いた方式が知られている(「共役
構造CELPによる8kbit/s音声符号化」片岡、守谷、
林:日本音響学会講演論文集,平成4年10月,pp27
3)。この方式では、互いに共役関係にある1対のコー
ドブックを用いてベクトル量子化することにより、通信
回線上で一方のインデックスについて伝送誤りが発生し
ても、他方のインデックスによって誤りの影響を少なく
することができるという利点がある。
【0004】また、原音声再生の品質を更に向上させる
ため、2段ベクトルコードブックを用いた方式も知られ
ている。この方式では、先ずメインコードブックに対し
て最適なベクトルを選択したのち、そのベクトルと組み
合わせて最もターゲットベクトルに近づくベクトルをサ
プリメンタルコードブックから選択する。
【0005】
【発明が解決しようとする課題】上述した従来の音声符
号化復号方式では、共役構造コードブックにより伝送情
報の冗長性を高めて伝送誤りに対する耐性を向上させ、
劣悪な通信環境下においても高品質の情報伝送が可能で
あったり、2段階符号化によって高品質の情報伝送が可
能であるという利点がある反面、その分、ビットレート
は増加して通信のリアルタイム性が損なわれるという問
題がある。特に、従来方式における伝送ビットレート
は、予め設定された符号化モードによって一義的に決定
されるため、例えばインターネットのように通信回線の
混雑状況によって通信帯域がリアルタイムに変動する環
境下で音声信号等をリアルタイムに伝送するような場
合、予め設定されたビットレートでは、回線が混雑して
きたときに情報を切れ目無く伝送することが困難とな
り、伝送のリアルタイム性が損なわれる。また、記録媒
体に対する音声情報の記録に際しても、記録音声の品質
を高める程、記録媒体に蓄積可能な音声情報量は低減す
る。このため、必要な情報量の確保と再生音質との兼ね
合いから、符号化情報量を一義的に設定することが難し
いという問題がある。
【0006】この発明は、このような問題点に鑑みなさ
れたもので、状況に応じて符号化情報量を動的に制御す
ることができ、回線状況が変動しても伝送リアルタイム
性を確保したり、記憶情報量をフレキシブルに変化させ
ることができる音声符号化復号方式を提供することを目
的とする。
【0007】
【課題を解決するための手段】この発明に係る音声符号
化復号方式は、音声信号を所定区間毎に線形予測分析し
た残りの残差信号をコードブックを用いてベクトル量子
化してベクトル量子化インデックスを得、このインデッ
クスを前記線形予測分析の結果の情報と共に符号化出力
として出力する音声符号化装置と、この音声符号化装置
から出力される符号化出力に含まれるべき前記ベクトル
量子化インデックスのうち音声情報の再生に影響の少な
い部分を情報量制御要求に基づいて省略することにより
前記符号化出力の情報量を制御すると共に前記符号化出
力に前記情報量の制御レベルの情報を付加する情報量制
御手段と、この情報量制御手段で情報量が制御された符
号化出力を前記情報量の制御レベルの情報に基づいて音
声信号に復号する音声復号装置とを備えたことを特徴と
する。
【0008】この発明によれば、音声情報を線形予測分
析した残りの残差信号をコードブックを用いてベクトル
量子化する際、音声情報の再生に影響の少ない部分のイ
ンデックス情報を、情報量制御要求に基づいて省略する
ことにより、符号化出力の情報量を制御すると共に、符
号化出力に制御レベルの情報を付加し、復号側では前記
制御レベルの情報に基づいて復号処理を行うので、符号
化出力の情報量が状況に応じて動的に変化する。このた
め、伝送帯域に余裕が無くなってきたときには音声の品
質を若干下げてビットレートを落とすことにより、伝送
のリアルタイム性を確保したり、記録媒体への記録の際
に、重要でない部分で音声の品質を若干下げて記録情報
量を削減するといったフレキシブルな処理が可能にな
る。しかも、この発明によれば、符号化処理の後段部分
や符号化出力そのものに対してビット省略の処理を行っ
たり、ベクトル量子化の処理モードをビットレートモー
ドに応じて切り換えるだけの方式であるため、符号化処
理及び復号処理共に大幅な変更は不要であるという利点
がある。
【0009】コードブックとして、共役関係にある第1
のコードブックと第2のコードブックとからなる共役構
造コードブックを使用した場合、特に伝送誤りの少ない
通信環境下では、一方のコードブックのインデックスを
省略しても音声の再生品質にあまり影響を与えない。こ
のため、状況に応じて符号化出力のうち第1及び第2の
コードブックのうちのいずれか一方のコードブックのベ
クトル量子化インデックスを省略して符号化出力の情報
量を制御することにより、再生音声品質を低下させずに
ビットレートを適応的に制御することが可能となる。
【0010】また、コードブックが、メインコードブッ
クとサプリメンタルコードブックとからなる2段構造の
コードブックである場合、サプリメンタルコードブック
のインデックスを省略しても再生音声はあまり劣化しな
い。このため、符号化出力のうちサプリメンタルコード
ブックのベクトル量子化インデックスを省略して符号化
出力の情報量を制御すれば、この場合にも、再生音声品
質を低下させずにビットレートを動的に制御することが
できる。
【0011】更に、線形予測分析の残差信号を時間−周
波数直交変換した直交変換結果をベクトル量子化する場
合、前記ベクトル量子化インデックスのうち、高域成分
のインデックスを省略しても再生音声品質にあまり影響
を与えない。このため、上述した2つのコードブックの
うちの一方の高域側から順にデータを省略するような制
御を行えば、ビットレートを段階的に制御することがで
き、急激な音質劣化を招くことなく、符号化情報量の動
的制御が可能になる。
【0012】この発明は、リアルタイム通信のみなら
ず、蓄積型通信及び記録媒体への記録等の用途にも適用
可能である。
【0013】
【発明の実施の形態】以下、図面を参照して、この発明
の好ましい実施の形態について説明する。図1は、この
発明をリアルタイム通信に適用した実施例の送信部の構
成を示すブロック図である。この送信部は、音声符号化
装置である符号化器1と、この符号化器1からの符号化
出力である圧縮符号化ビットストリームを通信回線に送
出するトランスミッタ2と、このトランスミッタ2で検
出された回線の混雑状況の情報を監視して最適な伝送ビ
ットレートが得られるビットレートモード(制御レベル
情報)を決定し、符号化器1に含まれる後述するビット
ストリーム生成部21での生成ビットストリームのビッ
トレートを制御するビットレート制御部3とから構成さ
れ、トランスミッタ2、ビットレート制御部3及びビッ
トストリーム生成部21で情報量制御手段が構成されて
いる。
【0014】符号化器1としては、例えば図2に示すよ
うなCELP型符号化器を用いることができる。即ち、
入力音声信号は、A/D変換器11でディジタルの時系
列信号に変換され、フレームバッファ12により、例え
ば1024サンプルを1フレームとしてフレーム毎に切
り出される。1フレーム時系列信号は、LPC分析・量
子化部13に供給される。LPC分析・量子化部13
は、1フレーム時系列信号を共分散法、自己相関法等の
アルゴリズムを用いてLPC分析し、平均2乗予測誤差
が最小となる予測係数(LPC係数)の集合を求めると
共に、得られたLPC係数を量子化して量子化LPC係
数を出力する。
【0015】一方、残差算出部14は、LPC分析・量
子化部13で求められたLPC係数からLPC合成して
時系列信号を再生し、この再生時系列信号と元の1フレ
ーム時系列信号との残差時系列信号を算出する。この残
差時系列信号の利得が利得量子化部15で量子化され
る。この利得量子化部15で求められた利得によって、
残差時系列信号は、残差正規化部16で正規化された
後、時間−周波数直交変換部17でMDCT処理され、
周波数領域の情報であるMDCT係数列に変換される。
求められたMDCT係数列(励振ベクトル)は、ベクト
ル分割部18で周波数方向に例えば2分割、4分割のよ
うに適当な数に均等分割され、ベクトル量子化部19に
供給される。ベクトル量子化部19は、分割されたMD
CT係数列毎にコードブック20の各パターンベクトル
との距離を計算し、距離が最も近いパターンベクトルの
インデックスを出力する。このようにして求められた量
子化LPC係数、量子化利得情報及びコードブックイン
デックス列がビットストリーム生成部21でマージさ
れ、圧縮符号化ビットストリームとして符号化器1から
出力される。
【0016】この符号化器1で特徴的な点は、このビッ
トストリーム生成部21がビットレート制御部3から供
給されるビットレートモード情報に基づいてコードブッ
クインデックス列の一部を削減することにより、ビット
レートを回線状況に応じて動的に変化させる点である。
この点を図3を参照して説明する。図3には、ビットス
トリーム生成部21で生成される圧縮符号化ビットスト
リームのフォーマットが示されている。ビットストリー
ムは、ビットストリームヘッダに続き、第1フレームの
データ、第2フレームのデータ、第3フレームのデー
タ、…のように各フレームのデータが続く。各フレーム
のデータは、利得情報、ビットレートモード情報、LP
C係数情報、コードブックインデックス列の順に組み立
てられている。第1フレームのデータの伝送の途中で通
信回線が混雑して通信帯域が十分に確保できなくなった
とき、図示のように、第2フレームからは、コードブッ
クインデックス列の後半部分を削除する。これにより、
インデックス列の高域側の情報は欠落することになる。
【0017】しかしながら、CELP型符号化器の場
合、コードブック20が担う情報は、LPC分析の残差
成分のみであり、しかもその低域側の情報は伝送されて
いるので、伝送された音声情報の著しい劣化はない。む
しろ、通信帯域が十分でなくなった場合でも、高域側の
情報を削減した分だけ音声情報の全体的な情報量が減少
し、音声情報が瞬断されることなく、通信のリアルタイ
ム性が確保されるという利点の方が大きい。
【0018】図4は、上述した送信部に対応した受信部
の構成例を示すブロック図である。通信回線を介して伝
送された可変レートの圧縮符号化ビットストリームは、
レシーバ5で受信され、音声復号装置としての復号器6
に入力される。復号器6では、まずビットストリーム分
解部31でビットストリームが量子化LPC係数、量子
化利得情報、インデックス列及びビットレートモード情
報に分解される。量子化LPC係数及び量子化利得情報
は、LPC逆量子化部32及び利得逆量子化部33でそ
れぞれ逆量子化される。また、インデックス列及びビッ
トレートモード情報は、ベクトル逆量子化部34に供給
される。ベクトル逆量子化部34は、供給されたインデ
ックス列に基づいてコードブック35を参照し、分割正
規化残差ベクトルを出力する。また、このときベクトル
逆量子化部34は、ビットレートモードを参照し、ビッ
トレートモードが“0”の場合には、通常の逆量子化を
行い、ビットレートモードが“1”の場合には、インデ
ックス列によって求められた分割正規化残差ベクトルの
後半部分に、同じ長さの補償データ36を付加する。こ
の補償データ36としては、0ベクトルデータでも良い
し、予め定めておいた平均的なベクトルデータやランダ
ムデータ等でも良い。また、最後に伝送されてきたビッ
トレートモード“0”のフレームデータに付加されてい
た高域側のインデックス列を記憶しておいて、このイン
デックス列を補償データ36として用いることもでき
る。
【0019】ベクトル逆量子化部34で求められた分割
正規化残差ベクトルは、ベクトル合成部37で合成され
1フレームに対応した正規化残差ベクトルとなる。この
正規化残差ベクトルと利得逆量子化部33から与えられ
る利得情報とが乗算器38によって乗算され、MDCT
係数列(励振ベクトル)が求められる。このMDCT係
数列は、周波数−時間直交変換部39でIMDCT処理
されて残差時系列信号に変換される。この残差時系列信
号とLPC逆量子化部32から供給されるLPC係数と
がLPC合成フィルタ40で合成されて1フレームの時
系列信号が求められる。この1フレームの時系列信号が
フレームバッファ41でオーバーラップ加算処理されて
時間的に連続した信号に変換され、D/A変換器42で
D/A変換され、出力音声信号として出力される。
【0020】このように、この実施例によれば、符号化
処理及び復号処理を最初から変更することなく、回線状
況に応じて伝送ビットレートを適応的に変化させること
ができ、音声伝送のリアルタイム性を確保することがで
きるという効果がある。
【0021】図5及び図6は、この発明を共役構造コー
ドブックを有するCELP型符号化復号方式に適用した
場合の符号化器1及び復号器6の構成をそれぞれ示すブ
ロック図であり、図2及び図4と同一部分には同一符号
を付してある。図5に示すように、符号化器1には、図
2に示したコードブック20に代えて共役構造を有する
共役コードブック51,52が設けられている。ベクト
ル量子化部53は、2つの共役コードブック51,52
からそれぞれ最適な候補ベクトル予備選択を行った後、
それらの候補ベクトルの組み合わせの中で最適な組み合
わせを選択する。選択の際の励振ベクトルとの距離計算
に際しては2つのサブベクトルの和の1/2で表現され
たベクトルを使用する。
【0022】共役構造のコードブック51,52は、も
ともと通信時の耐エラー性能を向上させる目的で伝送情
報に冗長性を持たせたものであるから、本来、片側のコ
ードブックのみでも、ある程度の音質で原音信号が再生
できるようになっている。この実施例では、このような
共役構造コードブックの特質を利用することによって、
次のように、更に柔軟なビットレートスケーラブルな通
信が実現可能である。
【0023】図7は、ビットストリーム生成部54で生
成されるビットストリームのフォーマットの例を示す図
である。この実施例では、4種類のビットレートモード
に基づいて4種類の長さのフレームデータを生成する。
ビットレートモード“00”では、2つの共役コードブ
ック51,52の全てのインデックス列をフルレートで
伝送する。ビットレートモード“01”では、#2のコ
ードブック52の高域側のインデックス列を削除して伝
送する。ビットレートモード“10”では、#2のコー
ドブック52のインデックス列を全て削除して伝送す
る。ビットレートモード“11”では、#2のコードブ
ック52のインデックス列の全てに加えて#1のコード
ブック51の高域側のインデックス列も削除して伝送す
るので、最もビットレートが低くなる。
【0024】復号器6では、図6に示すように、共役コ
ードブック61,62を用いてベクトル量子化部63が
4種類のビットレートモードに応じたベクトル逆量子処
理を実行する。このとき、削除されたインデックス列に
対しては補償データ36を用いる。
【0025】この実施例によれば、ビットレートを4段
階にわたって変化させることができるので、回線状況が
変化しても急激な音声劣化を生じさせることなしに、伝
送のリアルタイム性を確保することができる。
【0026】図8及び図9は、この発明を2段ベクトル
コードブックを有するCELP型符号化復号方式に適用
した場合の符号化器1及び復号器6の構成をそれぞれ示
すブロック図であり、図2、図4及び図5と同一部分に
は同一符号を付してある。図8に示すように、符号化器
1には、図2に示したコードブック20に代えてメイン
コードブック71及びサプリメンタルコードブック72
が設けられている。ベクトル量子化部73は、まずメイ
ンコードブック71から最適なベクトル選択を行い、次
にそのベクトルと組み合わせて最もターゲットベクトル
に近づくベクトルをサプリメンタルコードブック72か
ら選択する。
【0027】この例は、メインコードブック71の内容
だけでもある程度の音質で原音声信号が再現できること
を意味している。そこで、この場合にも、例えば図10
に示すように、全コードブックのインデックス列の伝送
(モード“00”)、サプリメンタルコードブック72
のインデックス列の高域側を削除(モード“01”)、
サプリメンタルコードブック72のインデックス列を全
て削除(モード“10”)、メインコードブック71の
インデックス列の高域側とサプリメンタルコードブック
72のインデックス列の全てを削除(モード“11”)
の4種類のモードを回線状況に応じて適応的に切り換え
るようにすれば良い。
【0028】この実施例の復号器6も、図9に示すよう
に、メインコードブック81とサプリメンタルコードブ
ック82とを備え、ベクトル逆量子化部83がビットレ
ートモードに応じてこれらコードブック81,82の内
容及び補償データ36を用いて分割正規化誤差ベクトル
を生成する。
【0029】図11は、この発明を蓄積データ伝送型の
システムに適用した場合の送信部の構成を示すブロック
図である。これまでの各実施例では、符号化器1の内部
に設けられたビットストリーム生成部21,54で可変
レートのビットストリームを生成することにより、リア
ルタイムの通信を可能としていたが、伝送情報を一旦蓄
積する蓄積データ伝送型の場合、符号化器1からは従来
と全く同様の固定レートのビットストリームを出力し、
これを一旦、データ記憶部91に記憶する。次に、ビッ
トストリーム再構成部92がデータ記憶部91からビッ
トストリームを読み出し、再構成したのちトランスミッ
タ2を介して通信回線に出力する。このとき、ビットレ
ート制御部3は、通信回線の状況を監視し、ビットレー
トモードを決定する。これに基づいてビットストリーム
再構成部92が固定レートのビットストリームを分解
し、ビットレートモード情報を付加して各モードに対応
したビットストリームを再構成する。
【0030】この実施例によれば、出力ビットストリー
ムのビットレート制御は、符号化器1ではなく、その後
段のビットストリーム再構成部92で行われるので、符
号化器1の構成は、従来と全く同様であり、従来システ
ムに僅かの改良を加えるだけで良いという利点がある。
【0031】なお、この発明は、上述したような音声信
号の通信に適用を限定されるものではない。例えば、図
12は、データの書き込みが可能なCD−ROMのよう
な記録媒体の記録再生装置にこの発明を適用した実施例
を示している。この場合、ビットストリーム再構成部9
2で生成された可変レートのビットストリームは、CD
−ROM書込手段101によってCD−ROM102に
書き込まれる。CD−ROM読出部103によってCD
−ROM102から読み出された可変レートのビットス
トリームは、復号器6によって前述のように復号され
る。
【0032】この実施例では、CD−ROM102の記
憶容量と記憶すべき情報量との兼ね合いで、情報量の削
減が必要な場合には、ユーザからのビットレート指示に
より、ビットレート制御部3がビットレートモード情報
をビットストリーム再構成部92に出力し、指示された
ビットレートでの記録が行われる。この実施例によれ
ば、ビットレートは、記録の途中でも自由に変更するこ
とができ、これによる復号時の複雑な制御も不要である
から、例えばじっくり聴きたい曲や聴きどころをフルビ
ットレートで記録し、単に聴き流すだけの曲を最低ビッ
トレートで記録するなどのバリエーションが可能にな
り、フレキシビリティーに優れた装置を提供することが
できる。
【0033】また、この発明は、符号化処理の過程でM
DCT係数列を聴感特性上、重み付けした場合のMDC
T係数列を平坦化するため、MDCT係数列をインタリ
ーブする周波数領域重み付けインタリーブベクトル量子
化(TwinVQ)方式にも適用可能である。この場合に
は、MDCT係数列を周波数方向に2〜4分割したの
ち、各分割係数列の中でインタリーブベクトル量子化す
れば良い。これにより、事前分割した単位での削減処理
が可能になる。
【0034】なお、以上の実施例では、符号化器1で得
られた符号化出力からビット削減をおこなったり、ビッ
トレートの再構成を行うことにより、出力ビットストリ
ームのビットレートを制御したが、符号化器1における
ベクトル量子化の過程でビットレートを制御することも
できる。図13〜図15は、この例を示す図である。図
13は、図2の符号化器1に対応したもので、この例で
はビットレートモード情報は、ビットストリーム生成部
21だけでなくベクトル量子化部19にも供給されてい
る。ベクトル量子化部19は、ビットレート制御部3か
ら供給されるビットレートモード情報に基づいてベクト
ル量子化処理を変更し、コードブック20から選択され
るインデックス列のビット数を調整してビットストリー
ム生成部21に供給する。ビットストリーム生成部21
では、ベクトル量子化部19から出力される可変レート
のインデックス列に基づいてビットストリームを生成す
ると共にビットレートモード情報をビットストリームに
付加する。
【0035】図14は、図5の符号化器1に対応したも
のである。ベクトル量子化部53は、共役コードブック
51,52からそれぞれ最適なコードベクトルの組み合
わせを選択するが、ビットレートモード情報が低ビット
レートを指示している場合には、例えば共役コードブッ
ク51のみの検索を行うというように、ビットレートに
応じて符号化自体の処理を省略する。これにより、ベク
トル量子化処理の時間を削減することができる。
【0036】図15は、図8の符号化器1に対応したも
のである。ベクトル量子化部73は、メインコードブッ
ク71とサプリメンタルコードブック72とから順次コ
ードベクトルを検索して、最適なコードベクトルの組み
合わせを選択するが、ビットレートモード情報が低ビッ
トレートを指示している場合には、メインコードブック
71のみの検索を行うことにより、ベクトル量子化処理
を削減することができる。
【0037】
【発明の効果】以上述べたように、この発明によれば、
音声信号の符号化出力の情報量を状況に応じて動的に変
化させることができるので、伝送帯域に余裕が無くなっ
てきたときには音声の品質を若干下げてビットレートを
落とすことにより、伝送のリアルタイム性を確保した
り、記録媒体への記録の際に、重要でない部分で音声の
品質を若干下げて記録情報量を削減するといったフレキ
シブルな処理が可能になるという効果を奏する。
【図面の簡単な説明】
【図1】 この発明の一実施例に係るリアルタイム通信
型音声送信部のブロック図である。
【図2】 同送信部における符号化器のブロック図であ
る。
【図3】 同送信部における圧縮符号化ビットストリー
ムのフォーマットを示す図である。
【図4】 同実施例における音声受信部のブロック図で
ある。
【図5】 この発明の他の実施例における共役構造コー
ドブックを使用した符号化器のブロック図である。
【図6】 同実施例における復号器のブロック図であ
る。
【図7】 同実施例における圧縮符号化ビットストリー
ムのフォーマットを示す図である。
【図8】 この発明の更に他の実施例における2段コー
ドブックを使用した符号化器のブロック図である。
【図9】 同実施例における復号器のブロック図であ
る。
【図10】 同実施例における圧縮符号化ビットストリ
ームのフォーマットを示す図である。
【図11】 この発明の更に他の実施例に係る蓄積通信
型音声送信部のブロック図である。
【図12】 この発明の更に他の実施例に係る音声記録
再生装置のブロック図である。
【図13】 この発明の更に他の実施例に係る符号化器
のブロック図である。
【図14】 この発明の更に他の実施例に係る共役構造
コードブックを使用した符号化器のブロック図である。
【図15】 この発明の更に他の実施例に係る2段コー
ドブックを使用した符号化器のブロック図である。
【符号の説明】
1…符号化器、2…トランスミッタ、3…ビットレー
ト制御部、5…レシーバ、6…復号器、91…データ記
憶部、92…ビットストリーム再構成部、101…CD
−ROM書込部、102…CD−ROM、103…CD
−ROM読出部。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 音声信号を所定区間毎に線形予測分析し
    た残りの残差信号をコードブックを用いてベクトル量子
    化してベクトル量子化インデックスを得、このインデッ
    クスを前記線形予測分析の結果の情報と共に符号化出力
    として出力する音声符号化装置と、 この音声符号化装置から出力される符号化出力に含まれ
    るべき前記ベクトル量子化インデックスのうち音声情報
    の再生に影響の少ない部分を情報量制御要求に基づいて
    省略することにより前記符号化出力の情報量を制御する
    と共に前記符号化出力に前記情報量の制御レベルの情報
    を付加する情報量制御手段と、 この情報量制御手段で情報量が制御された符号化出力を
    前記情報量の制御レベルの情報に基づいて音声信号に復
    号する音声復号装置とを備えたことを特徴とする音声符
    号化復号方式。
  2. 【請求項2】 前記コードブックは、共役関係にある第
    1のコードブックと第2のコードブックとからなる共役
    構造コードブックであり、 前記情報量制御手段は、符号化出力のうち前記第1及び
    第2のコードブックのうちのいずれか一方のコードブッ
    クのベクトル量子化インデックスを省略することにより
    前記符号化出力の情報量を制御するものであることを特
    徴とする請求項1記載の音声符号化復号方式。
  3. 【請求項3】 前記コードブックは、メインコードブッ
    クとサプリメンタルコードブックとからなる2段構造の
    コードブックであり、 前記情報量制御手段は、符号化出力のうち前記サプリメ
    ンタルコードブックのベクトル量子化インデックスを省
    略することにより前記符号化出力の情報量を制御するも
    のであることを特徴とする請求項1記載の音声符号化復
    号方式。
  4. 【請求項4】 前記音声符号化装置は、前記線形予測分
    析の残差信号を時間−周波数直交変換する直交変換手段
    を更に備え、前記残差信号として前記直交変換手段の直
    交変換結果をベクトル量子化するものであり、 前記情報量制御手段は、前記ベクトル量子化インデック
    スのうち、高域成分のインデックスを省略することによ
    り前記符号化出力の情報量を制御するものであることを
    特徴とする請求項1乃至3のいずれか1項記載の音声符
    号化復号方式。
  5. 【請求項5】 前記音声符号化装置及び情報量制御手段
    は送信側、前記音声復号装置は受信側にそれぞれ設けら
    れ、 前記情報量制御手段は、前記送信側と受信側とを接続す
    る通信回線の回線状況に応じて前記送信側から受信側へ
    送信する符号化出力のビットレートを制御するものであ
    ることを特徴とする請求項1乃至4のいずれか1項記載
    の音声符号化復号方式。
  6. 【請求項6】 前記情報量制御手段は、前記符号化出力
    を記録媒体に記録する記録手段であり、情報量制御要求
    に応じて前記記録媒体に記録する符号化出力の情報量を
    制御するものであることを特徴とする請求項1乃至4の
    いずれか1項記載の音声符号化復号方式。
JP06421797A 1996-09-24 1997-03-18 音声符号化復号方式 Expired - Fee Related JP3849210B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP06421797A JP3849210B2 (ja) 1996-09-24 1997-03-18 音声符号化復号方式
US08/935,193 US5970443A (en) 1996-09-24 1997-09-22 Audio encoding and decoding system realizing vector quantization using code book in communication system

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP8-251425 1996-09-24
JP25142596 1996-09-24
JP06421797A JP3849210B2 (ja) 1996-09-24 1997-03-18 音声符号化復号方式

Publications (2)

Publication Number Publication Date
JPH10154000A true JPH10154000A (ja) 1998-06-09
JP3849210B2 JP3849210B2 (ja) 2006-11-22

Family

ID=26405339

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06421797A Expired - Fee Related JP3849210B2 (ja) 1996-09-24 1997-03-18 音声符号化復号方式

Country Status (2)

Country Link
US (1) US5970443A (ja)
JP (1) JP3849210B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002052744A1 (fr) * 2000-12-26 2002-07-04 Mikio Maruyama Dispositif et procede d'emission vocale, dispositif et procede de reception vocale, systeme et procede d'emission/de reception vocale et support d'enregistrement
KR100391527B1 (ko) * 1999-08-23 2003-07-12 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치, 기록 매체, 음성 복호화 장치, 신호 처리용 프로세서, 음성 부호화 복호화 시스템, 통신용 기지국, 통신용 단말 및 무선 통신 시스템
AU768016B2 (en) * 2000-07-05 2003-11-27 Lg Electronics Inc. Method of configuring transmission in mobile communication system
JP2007506986A (ja) * 2003-09-17 2007-03-22 北京阜国数字技術有限公司 マルチ解像度ベクトル量子化のオーディオcodec方法及びその装置
US7363230B2 (en) 2002-08-01 2008-04-22 Yamaha Corporation Audio data processing apparatus and audio data distributing apparatus
JP2011503653A (ja) * 2007-11-04 2011-01-27 クゥアルコム・インコーポレイテッド スケーラブルなスピーチおよびオーディオコーデックにおける、量子化mdctスペクトルに対するコードブックインデックスのエンコーディング/デコーディングのための技術
JP2013527492A (ja) * 2010-04-14 2013-06-27 ヴォイスエイジ・コーポレーション Celp符号器および復号器で使用するための柔軟で拡張性のある複合革新コードブック
JP5337235B2 (ja) * 2009-03-10 2013-11-06 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
WO2024034389A1 (ja) * 2022-08-09 2024-02-15 ソニーグループ株式会社 信号処理装置、信号処理方法、およびプログラム

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3279228B2 (ja) * 1997-08-09 2002-04-30 日本電気株式会社 符号化音声復号装置
US6529730B1 (en) * 1998-05-15 2003-03-04 Conexant Systems, Inc System and method for adaptive multi-rate (AMR) vocoder rate adaption
US6625119B1 (en) * 1999-03-17 2003-09-23 3Com Corporation Method and system for facilitating increased call traffic by switching to a low bandwidth encoder in a public emergency mode
US6721280B1 (en) * 2000-04-19 2004-04-13 Qualcomm Incorporated Method and apparatus for voice latency reduction in a voice-over-data wireless communication system
US7161902B2 (en) * 2001-08-08 2007-01-09 Nortel Networks Limited Reducing network traffic congestion
US7546238B2 (en) * 2002-02-04 2009-06-09 Mitsubishi Denki Kabushiki Kaisha Digital circuit transmission device
GB2389217A (en) * 2002-05-27 2003-12-03 Canon Kk Speech recognition system
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
US7395346B2 (en) * 2003-04-22 2008-07-01 Scientific-Atlanta, Inc. Information frame modifier
US7937271B2 (en) * 2004-09-17 2011-05-03 Digital Rise Technology Co., Ltd. Audio decoding using variable-length codebook application ranges
BRPI0707135A2 (pt) * 2006-01-18 2011-04-19 Lg Electronics Inc. aparelho e método para codificação e decodificação de sinal
US8335684B2 (en) * 2006-07-12 2012-12-18 Broadcom Corporation Interchangeable noise feedback coding and code excited linear prediction encoders
US8285555B2 (en) 2006-11-21 2012-10-09 Samsung Electronics Co., Ltd. Method, medium, and system scalably encoding/decoding audio/speech
CN101345530B (zh) * 2007-07-11 2010-09-15 华为技术有限公司 一种矢量量化方法及矢量量化器
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
CN101419802B (zh) * 2007-10-25 2011-07-06 华为技术有限公司 用于语音编码的矢量量化方法及矢量量化器
CN101436408B (zh) * 2007-11-13 2012-04-25 华为技术有限公司 矢量量化方法及矢量量化器
WO2009056047A1 (en) * 2007-10-25 2009-05-07 Huawei Technologies Co., Ltd. A vector quantizating method and vector quantizer
US8898060B2 (en) * 2010-03-02 2014-11-25 Telefonaktiebolaget L M Ericsson (Publ) Source code adaption based on communication link quality and source coding delay
US9165563B2 (en) * 2012-03-19 2015-10-20 Casio Computer Co., Ltd. Coding device, coding method, decoding device, decoding method, and storage medium
US10109287B2 (en) 2012-10-30 2018-10-23 Nokia Technologies Oy Method and apparatus for resilient vector quantization
US9667959B2 (en) 2013-03-29 2017-05-30 Qualcomm Incorporated RTP payload format designs
CN117275495A (zh) 2013-04-05 2023-12-22 杜比国际公司 音频信号的解码方法和解码器、介质以及编码方法
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9769586B2 (en) 2013-05-29 2017-09-19 Qualcomm Incorporated Performing order reduction with respect to higher order ambisonic coefficients
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US10770087B2 (en) * 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
WO2017149774A1 (ja) * 2016-03-04 2017-09-08 日本電信電話株式会社 通信システム、中継装置、受信装置、中継方法、受信方法、中継プログラム、および受信プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5261027A (en) * 1989-06-28 1993-11-09 Fujitsu Limited Code excited linear prediction speech coding system
US5819215A (en) * 1995-10-13 1998-10-06 Dobson; Kurt Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
JP4005154B2 (ja) * 1995-10-26 2007-11-07 ソニー株式会社 音声復号化方法及び装置
JP3680380B2 (ja) * 1995-10-26 2005-08-10 ソニー株式会社 音声符号化方法及び装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100391527B1 (ko) * 1999-08-23 2003-07-12 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치, 기록 매체, 음성 복호화 장치, 신호 처리용 프로세서, 음성 부호화 복호화 시스템, 통신용 기지국, 통신용 단말 및 무선 통신 시스템
AU768016B2 (en) * 2000-07-05 2003-11-27 Lg Electronics Inc. Method of configuring transmission in mobile communication system
WO2002052744A1 (fr) * 2000-12-26 2002-07-04 Mikio Maruyama Dispositif et procede d'emission vocale, dispositif et procede de reception vocale, systeme et procede d'emission/de reception vocale et support d'enregistrement
US7363230B2 (en) 2002-08-01 2008-04-22 Yamaha Corporation Audio data processing apparatus and audio data distributing apparatus
JP2007506986A (ja) * 2003-09-17 2007-03-22 北京阜国数字技術有限公司 マルチ解像度ベクトル量子化のオーディオcodec方法及びその装置
JP2011503653A (ja) * 2007-11-04 2011-01-27 クゥアルコム・インコーポレイテッド スケーラブルなスピーチおよびオーディオコーデックにおける、量子化mdctスペクトルに対するコードブックインデックスのエンコーディング/デコーディングのための技術
US8515767B2 (en) 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
JP5337235B2 (ja) * 2009-03-10 2013-11-06 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
JP2013527492A (ja) * 2010-04-14 2013-06-27 ヴォイスエイジ・コーポレーション Celp符号器および復号器で使用するための柔軟で拡張性のある複合革新コードブック
JP2017083876A (ja) * 2010-04-14 2017-05-18 ヴォイスエイジ・コーポレーション Celp符号器および復号器で使用するための柔軟で拡張性のある複合革新コードブック
WO2024034389A1 (ja) * 2022-08-09 2024-02-15 ソニーグループ株式会社 信号処理装置、信号処理方法、およびプログラム

Also Published As

Publication number Publication date
US5970443A (en) 1999-10-19
JP3849210B2 (ja) 2006-11-22

Similar Documents

Publication Publication Date Title
JP3849210B2 (ja) 音声符号化復号方式
US10096323B2 (en) Frame error concealment method and apparatus and decoding method and apparatus using the same
JP4781153B2 (ja) オーディオデータ符号化及び復号化装置、並びにオーディオデータ符号化及び復号化方法
US5873059A (en) Method and apparatus for decoding and changing the pitch of an encoded speech signal
US8862463B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
KR100648760B1 (ko) 고주파 재생 기술 향상을 위한 방법들 및 그를 수행하는 프로그램이 저장된 컴퓨터 프로그램 기록매체
EP0734014B1 (en) Coding apparatus
JP2005533272A (ja) オーディオコーディング
US20070078646A1 (en) Method and apparatus to encode/decode audio signal
CN101836252A (zh) 用于在音频代码化***中生成增强层的方法和装置
JP2007504503A (ja) 低ビットレートオーディオ符号化
US8086465B2 (en) Transform domain transcoding and decoding of audio data using integer-reversible modulated lapped transforms
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
JP3266372B2 (ja) 音声情報符号化方法およびその装置
US7444289B2 (en) Audio decoding method and apparatus for reconstructing high frequency components with less computation
US20090210219A1 (en) Apparatus and method for coding and decoding residual signal
JPH11184498A (ja) 音声符号化/復号化方法
JP2000132193A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
US8719012B2 (en) Methods and apparatus for coding digital audio signals using a filtered quantizing noise
JP3878254B2 (ja) 音声圧縮符号化方法および音声圧縮符号化装置
JPH0736495A (ja) 可変レート音声符号化装置
JP4826580B2 (ja) 音声信号の再生方法及び装置
JP3010655B2 (ja) 圧縮符号化装置及び方法、並びに復号装置及び方法
KR20080092823A (ko) 부호화/복호화 장치 및 방법
JP3094522B2 (ja) ベクトル量子化方法及びその装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060414

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060821

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100908

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees