JP3004664B2 - 可変レート符号化方法 - Google Patents

可変レート符号化方法

Info

Publication number
JP3004664B2
JP3004664B2 JP32950989A JP32950989A JP3004664B2 JP 3004664 B2 JP3004664 B2 JP 3004664B2 JP 32950989 A JP32950989 A JP 32950989A JP 32950989 A JP32950989 A JP 32950989A JP 3004664 B2 JP3004664 B2 JP 3004664B2
Authority
JP
Japan
Prior art keywords
signal
band
bits
circuit
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP32950989A
Other languages
English (en)
Other versions
JPH03191618A (ja
Inventor
政巳 赤嶺
英隆 吉川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP32950989A priority Critical patent/JP3004664B2/ja
Publication of JPH03191618A publication Critical patent/JPH03191618A/ja
Application granted granted Critical
Publication of JP3004664B2 publication Critical patent/JP3004664B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 〔発明の目的〕 (産業上の利用分野) 本発明は、パケット通信システムやATM通信システム
に用いられる可変レート符号化方法に関する。
(従来の技術) 音声信号を符号化した後、パケット化しパケット単位
で通信するパケット通信システムが、実現されつつあ
る。パケット通信システムは、音声や画像、データなど
の各種メディアの信号を一元的に扱える他の音声信号の
バースト姓を利用して有音区間のみを伝送することによ
り回線の効率的利用ができるという利点を有する。この
ため、パケット通信及びATM通信は、ISDN,BISDNの担手
として注目され、研究開発が活発に行われている。
しかし、パケット通信では、ネットワークでのふくそ
う時やパケット遅延が大きい場合に、パケットの廃棄が
行われ、これにより音声の品質劣化が生じる。特に、適
応予測を用いるADPCMを符号化方式として用いる場合に
は、パケット廃棄時の品質劣化が大きい。そこで、パケ
ット廃棄時の品質劣化が少ない符号化方式としてEmbede
d DPCM方式が「Embeded DPCM for variable bit rate t
ransmission」、(IEEE Trans.COM−28,7,pp.1040−104
6(July 1980))(文献1と呼ぶ)で提案されている。
また、CCITTではCCITT SG XV III「Annex to Question
X/XV(Speech Packetization」、(TD131,Geneva 6−17
June 1988)(文献2と呼ぶ)の中で、音声パケット通
信用符号化方式としてEmbeded ADPCMをG,EMBとして暫定
勧告すると共に、音声パケットプロトコルをG,PVNPとし
て暫定勧告している。
第20図と第21図は、暫定勧告G,EMB方式のエンコーダ
部とデコーダ部のブロック図である。第20図において、
エンコーダの入力は、μ−PCM又は、A−PCMコーデック
によりディジタル化された音声信号である。610は、μ
−PCM又はA−PCMの符号を線形のPCM符号に変換するPCM
フォーマット変換器である。また、630は適応量子化器
であり、670は適応予測器である。減算回路620は、入力
信号と適応予測器670の出力である予測信号との差分を
計算し、適応量子化器630へ送る。適応量子化器630は、
入力した予測差分信号を量子化し、ADPCMの符号として
出力する。640は、最大廃棄可能ビット数だけADPCMの出
力符号の下位ビットをマスクし、右にシフトするビット
マスク回路である。ビットマスク回路640の出力はコア
ビットとして適応逆量子化器650へ送られ、適応逆量子
化器650はコアビットの逆量子化を行う。適応逆量子化
器の出力は、適応予測器670と加算回路660へ送られる。
加算回路660では、適応逆量子化器の出力信号と適応予
測器の出力信号を加算することにより、局部復号信号も
作成する。適応予測器670は、2次の極と6次の零点を
もつ適応フィルタであり、局部復号信号と逆量子化され
た予測差分信号を入力し予測信号を作成する。
適応量子化器630のビット数とフィードバックされる
コアビット数は、用いるアルゴリズムに依る。例えば32
Kbps(4,2)アルゴリズムは、量子化が4ビットでコア
ビットが2ビットである。第20図において、適応量子化
器630はフィードフォワードパスを形成し、ビットマス
ク回路640と適応逆量子化器650、適応予測器670はフィ
ードバックパスを形成する。
次にデコーダの動作について説明する。第21図のデコ
ーダは、コーダと同様にビットマスク回路680とフィー
ドバック適応逆量子化器690、適応予測器710から成るフ
ィードバックパスとフィードフォワード適応逆量子化器
720とPCMフォーマット変換回路740を含むフィードフォ
ワードパスから構成される。フィードバックパスは、コ
ーダとデコーダで全く同一である。ビットマスク回路68
0は入力したADPCM符号の上位のコアビットを残して下位
ビットをマスクし右シフトすることにより、コアビット
のみをフィードバック適応逆量子化器690へ送る。フィ
ードバック適応量子化器690はコアビットの逆量子化を
行う。適応予測器710は、690の出力である逆量子化され
た予測差分信号と加算回路700の出力である局部復号信
号を入力として、予測信号を出力する。ネットワーク上
でのビット廃棄はADPCM符号の下位ビットから行われ、
コアビットの伝送は保証される。このため、デコーダ側
のビットマスク回路680の出力は、コーダ側のビットマ
スク回路640の出力と同一のものが得られる。
従って、適応逆量子化器690,650及び適応予測器710,6
70の出力は、コーダとデコーダで全く同一である。
フィードフォワード適応量子化器720は、ADPCM出力符
号のコアビットと廃棄されずに残ったビットの逆量子化
を行う。加算回路730は、フィードフォワード適応量子
化器720の出力と適応予測器710の出力を加算し、復号信
号を作成する。得られた復号信号は、PCMフォーマット
変換回路740へ出力され、そこで、線形のPCM符号からμ
−PCMまたはA−PCM符号へ変換される。750はADPCM−PC
M−ADPCMのように同期タンデム接続による誤差を防止す
るためのタンデム接続補正回路である。
通常のEmbededではないADPCMで出力符号のビット廃棄
が生じた場合、逆量子化された予測差分信号はコーダと
デコーダで異った値となる。この結果、量子化器と予測
器の適応処理がコーダとデコーダで異なる非同期動作に
なると共に、廃棄による誤差が、合成フィルタによりフ
ィルタリングされるため、ビット廃棄による品質劣化が
増大する。
一方、前述したEmbeded ADPCMでは、コアビットのみ
を予測器にフィードバックしているので、コアビットを
除いた下位のビットがネットワーク上で廃棄されても、
コーダとデコーダの非同期動作は生じない。また、コー
ダとデコーダで予測信号は同一となるので、廃棄された
ビット数に相当する量子化誤差が直接、復号信号に加算
されるだけであり、ビット廃棄による品質劣化は少な
い。
Embeded ADPCMのこのような特性を活かした音声パケ
ットの構成法及びプロトコルが文献2で述べられてい
る。
第22図は、文献2に記載のパケットフォーマットであ
る。図においてビット1はLSB、ビット8はMSBを表す。
PD(Protocol Discriminator)は、音声パケットとそれ
以外のパケットを区別するためのものである。BDI(Blo
ck Dropping Indicator)は、パケット化した初期状態
で廃棄できるブロック数とネットワークの各ノード上で
廃棄できるブロック数を示す。ここで、ブロックは、符
号化のフレームを16ms(128サンプル)として、音声の
符号化出力をビット単位で1フレーム分集めた128ビッ
ト単位の情報である。TS(Time Stamp)は、ネットワー
クの各ノードで生じた遅延量の累和を示す。CT(Coding
Type)は、パケット作成の際に用いた音声符号化の方
法を示すフィールドである。SEQ(Sequence Numbher)
はパケットの続き順を示す番号であり、パケットが紛失
した時に用いられる。NS(Noise Field)は、背景ノイ
ズのレベルを示すフィールドである。NON−DROPPABLEOC
TETSはEmbeded ADPCM出力のコアビットのブロックであ
り、ネットワーク上で廃棄できない情報のフィールドで
ある。OPTIONAL DROPPABLEBLOCKSは、Embeded ADPCMの
下位ビットのブロックであり、ネットワーク上でシステ
ムから要求があった場合に廃棄できる情報フィールドで
ある。パケットの先頭と後尾には、レイヤ2のヘッダと
トレイラが付く。第22図のフォーマットをもつパケット
を用いたパケットネットワークのプロトコルでは、パケ
ット廃棄は、パケット内のOPTIONALDROPPABLE BLOCKを
廃棄することにより行われる。
以上が従来のEmbeded ADPCMとパケットフォーマット
を用いたパケット廃棄補償法である。この方法は情報の
廃棄がパケット内すなわち、ビット単位で行われる場合
は前述したように品質劣化が少ない方法である。しか
し、パケット単位で廃棄が生じた場合には、Embeded AD
PCMのコアビットも廃棄されるので品質の劣化が生じ
る。パケット廃棄によって1フレーム分(16ms)の信号
が完全に欠落し元の音声信号が再生できなくなる。この
状態は、1フレームで終わるわけではなく、エンコーダ
とデコーダの非同期動作のため、1フレーム以上続くこ
とになる。パケット単位の廃棄の補償法として、廃棄さ
れたパケットの前後のパケットの信号から補間再生する
方法があるが、ADPCMの出力である予測差分信号は相関
が除去された信号であるので、1フレーム(128サンプ
ル)分離れたサンプルを用いて補間しても補間の効果は
ほとんどなく品質劣化は避けられない。
(発明が解決しようとする課題) Embeded ADPCMを用いた従来の符号化方式はパケット
単位の廃棄が生じた場合、Embeded ADPCMのコアビット
も廃棄されるので、元の音声信号が再生できなくなると
共に、エンコーダとデコーダが非同期動作となるため、
品質劣化が大きいという問題点を有する。
また、従来のEmbeded ADPCMではビットレートを時間
的に変化させることが積極的に考慮されておらず、ビッ
トレートの制御法や固定長のセル化について十分検討さ
れていない。音声信号のもつ情報量は時間的に変化して
いるので、固定ビットレートのEmbeded ADPCMでは、符
号化された音声の品質が変化し耳障りな音になると共
に、符号化効率も下がるという問題点を有する。
本発明はこのような問題点に鑑みてなされ、パケット
単位の廃棄に対しても品質劣化が少なく、品質が安定し
た符号化効率の高い可変レート符号化方法を提供するこ
とを目的とする。
〔発明の構成〕
(課題を解決するための手段) 本発明は、入力信号の信号系列を複数の周波数帯域の
信号に分割し、分割された周波数帯域毎の信号の電力を
計算し、計算された電力の値に基づいて周波数帯域毎の
符号化ビット数の総和をフレーム単位で変化させ、符号
化に割り当てられるべきビット数を表す信号を送信し、
該周波数帯域毎の信号を符号化する可変レート符号化方
法であって、受信側での復号信号のSNRを推定し、そのS
NRが一定となるように前記符号化ビット数の割当てを決
定すると共に、前記入力信号の有音、無音を検出し、該
検出結果によって帯域毎の信号を符号化する際の符号化
ビット数と帯域毎の符号化ビット数の総和を変化させる
ことを特徴とする可変レート符号化方法である。
(作用) 本発明では、入力信号を複数の周波数帯域の信号に分
割し、各々の帯域の信号が量子化され符号化される。そ
の際に帯域別の信号電力を計算し求められた帯域別信号
電力を基に各帯域の符号化ビット数の配分がフレーム単
位で行われる。これにより入力信号の相関又は冗長性が
除去され、入力信号を高能率に符号化することができ
る。同時に帯域別信号電力を基に帯域別の符号化ビット
数の総和を変化させることにより、受信側での復号信号
のSNRを推定し、それが一定になるようにビットレート
を制御しているので、復号信号の品質を一定のレベルに
維持することができると共に、ビットレートの制御によ
り入力信号の性質の時間変化に対応してビットレートが
変化することになるので、符号化効率を更に高くするこ
とができる。
次に信号はセル又はパケットと呼ばれる情報単位に構
成され、符号化された帯域別の信号と帯域別の信号の符
号化ビット数を表現する信号が多重化(セル化、パケッ
ト化)され、伝送路に送出される。この時、各々のセル
又はパケットにプライオリティーを付けてもよい。本発
明では、従来のADPCMのように過去の信号を用いた予測
やコーダとデコーダで量子化策を同期的に適応制御する
ことがなく、複数の周波数帯域の信号をフレーム単位で
独立に符号化しているため、どのセル又はパケットが廃
棄されても、廃棄の影響が次のセル又はパケットに及ぶ
ことがないという効果を有する。その結果、セル廃棄に
伴う品質劣化を極めて少なくすることができる。
(実施例) 以下、本発明に係る一実施例を図面を参照して説明す
る。第1図は本発明の一実施例に係る可変レート符号化
方式を適用した符号化装置のコーダ部のブロック図であ
る。
第1図において、1は入力端子であり、ディジタル化
された信号系列が入力され、101の入力バッファに所定
サンプル数の系列が蓄積される。102は入力された信号
系列を複数の周波数帯域に分割するフィルタバンクであ
り、スペクトルの折返し歪を生じさせない優れたフィル
タバンクとしてQMF(Quadrature Mirror Filter)バン
クが知られており、本実施例ではこれを用いて4kHzまで
の信号帯域を等間隔に8個の帯域に分割している。第2
図にQMFバンクの一構成例を示すブロック図を示す。こ
の図において、201はハイパスフィルタであり202はロー
パスフィルタである。これらのフィルタは32次のFIRフ
ィルタにより構成している。また、204のハイパスフィ
ルタと205のローパスフィルタは16次のFIRフィルタによ
り構成している。このようにQMFバンクの第2段目と第
2,第3段目のフィルタの次数を変えることは音声信号の
スペクトルの傾きが低域と高域で異なることを利用する
ことにより、フィルタの性能を劣化させることなくフィ
ルタリング演算に起因する遅延量を減少させる効果があ
る。なお、フィルタの係数はスペクトルの折返し歪が生
じないように設計されるが、この詳細についてはN.S.Ja
yant,P.Noll“Digieal Coding of Waveformes",PRENTIC
EHALL,INC(文献3)に記述されているので、ここでは
説明を省略する。
第1図において103はQMFバンク102の出力である帯域
ごとの信号を量子化の前処理として正規化するための正
規化回路である。正規化回路の簡単な具体例は帯域ごと
の信号を帯域ごとのRMS(Root Mean Square)で除算す
る回路である。104は正規化された各帯域の信号を所定
のビット数で量子化する量子化器であり、テーブルルッ
クアップにより構成される105は各帯域の信号のパワー
を計算する帯域パワー計算回路であり、第i番目の帯域
の信号系列をxi(n),i=1,2,…,8とおくと次式により
RMS値σを計算し出力する。
但し、RMSを計算する区間長をNとしている。量子化
器106は帯域パワー計算回路から出力される各帯域のRMS
値σを所定のビット数で量子化しその符号をセル化部
111及び逆量子化器107へ出力する。逆量子化器107は上
記σの符号を逆量子化した値 を出力する。正規化回路103やビットレート制御部108、
ビット配分計算部109は各帯域のRMS値としてデューダで
得られる を用いる。これによりコーダとデコーダで量子化ビット
数や正規化のパラメータが異なるミスマッチによって生
じる特性劣化を完全に防止できる。ビットレート制御部
108は各帯域信号のパワーに基づいてデューダで復号さ
れる信号の品質が一定でかつユーダから出力される符号
量が一定になるようにビットレートを制御する。但し、
有音と無音でビットレートの制御法を変える。ビットレ
ート制御部の詳細については後述する。ビット配分計算
部109は、各帯域信号のパワーとビットレート制御部か
ら出力されるビットレートに基づいて各帯域の量子変器
に配分するビット量を計算する。詳細は後で述べる。11
3はサブフレーム単位で有音/無音検出を行う有音/無
音検出部であり、詳細は後述する。110はタイムスタン
プ計算回路であり、セルで伝送されるフレームの先頭の
サブフレーム番号を計算する。具体的には、ビットレー
ト制御部108から出力される1セルで伝送されるサブフ
レーム数を積算する。第i番目のフレーム(セル)のタ
イムスタンプをTS(i)、第(i−1)番目のフレーム
(セル)のタイムスタンプTS(i−1)、サブフレーム
数をNS(i−1)とおくとTS(i)は次式により計算さ
れる。
TS(i)=TS(i−1)+NS(i−1) (2) セル化部111では、各帯域信号の符号系列と各帯域信
号のRMS値の符号と1セル中のサブフレーム数とタイム
スタンプを第3図のフォーマットでセル化する。第3図
のフォーマットにおいて、全体のセル長は52バイトであ
り、情報部が48バイトである。情報部の内訳はタイムス
タンプ1バイト、サブフレーム数1バイト、帯域パワー
4バイト、帯域信号42バイトである。
以上が第1図の各部の機能の説明である。次に動作に
ついて説明する。
第4図はコーダの全体の動作を示すフローチャートで
ある。まず、初期化として、入力バッファ、QMFバン
ク、タイムスタンプのクリアと目標SNR、最大サブフレ
ーム数、サブフレーム長、を設定する。次にサブフレー
ム単位で入力信号系列の切出し、QMFフィルタリング、
各帯域信号のパワー計算、ビットレート制御を目標SNR
が達成できるまでくり返し行い、次に各帯域に割当てる
ビット配分を計算し、そのビット配分に基づいて各帯域
の信号を量子化した後、セル化の処理を行う。このよう
な一連の処理を1フレーム(セル)単位でくり返し行
う。
ビットレートの制御は、第5図のフローチャートに従
って行う。本発明では、有音/無音検出部から読込れた
検出結果によってビットレート制御のモードを有音と無
音で切換える。有音と無音でビットレート制御法を切替
えることによって無音時に不必要にビットレートが高く
なることを防止できると共に、無音時でも背景音を伝送
することができるので、無音時に白色雑音で音声を再生
することによる不自然さをなくすことができる。
有音モードのビットレートの制御は第6図で示すフロ
ーチャートに従って行う。まず、初期設定として目標SN
Rd、1セルの最大サブルーム数Ns max、サブフレーム長
LSサンプルを設定する。次にサブフレーム数Iの初期値
としてI=∂を設定する。次にQMFへ入力する入力サン
プル数をI×LSサンプルに設定し、それを入力バッファ
へ指示する。次に帯域パワー計算部で求められた各帯域
のRMS値 を読込むと共に、符号化すべきI×LSサンプルの信号系
列を1セルで伝送するために必要な1サンプル当りの平
均ビット数Rを次式により計算する。
ここで、Bは帯域信号の符号を伝送するために割当て
られた総ビット数であり、第3図のフォーマットではB
=42×8=336ビットである。
次に、各帯域のRMS値 と平均ビット数Rを用いてデコーダで復号される信号の
SNRを次式により推定する。
ここでMbは帯域の分割数であり本実施例ではMb=8で
ある。
上記のSNRの推定式はサブバンド符号化方式において
最適ビット配分を行った場合の復号誤差の2乗平均値を
理論解析した結果に基づいている。表1は、式(4)で
推定した値と計算機シミュレーションで求めたSNRの値
を比較したものである。この表から推定値は実際に符号
化した場合のSNR値と良く一致していることが分かる。
但し表1はビットレートを16kbpsにした場合である。
SNRの指定後、SNRと目標SNRdを比較し、SNRがSNRdよ
り大の時は、サブフレーム数Iが最大サブフレーム数Ns
max以下であることをチェックした後、サブフレーム数
をインクリメントし、フローチャートのへ戻る。SNR
がSNRd以下になるまで同様の処理をくり返し、SNR>SNR
dとなる直前のサンプル当りビットレートとサブフレー
ム数(I−1)を出力する。またサブフレーム数がNs m
axを超えた場合は、サンプル当りビットレートとサブフ
レーム数I=Ns maxを出力する。ここで述べたビットレ
ート制御法は、SNRを推定しながら、符号化する入力サ
ンプル数を増加させ、ビットレートを変化させるもので
品質を常に一定に保つことができる。符号化データ
を固定長のセルに正確に入れることができる。入力信
号の性質の時間的変化に応じてビットレートを変化させ
るので符号化効率が高いという利点がある。
第7図は、無音モードのビットレート制御法を示すフ
ローチャートである。この方法では、無音が連続してい
る場合にはサブフレーム数Iを最大サブフレーム数Ns m
axに設定し、ビットレートを最低のレートすなわち、 に設定する。フレームの途中(I<Ns max)で有音にな
った場合には、その時点でフレームを打ち切り、サブフ
レーム数をIとし、ビットレートを と設定する。
次にビット配分計算部109の動作について説明する。
第12図はビット配分計算部109のフローチャートであ
る。初めに各帯域のパワーとしてRMS値 とサンプル当りのビットレートRを逆量子化器107及び
ビットレート制御部108から読込んだ後、次式に従って
各帯域のビット配分量Rkを計算する。
上式は復号誤差の2乗平均値を最小化する最適ビット
配分の式であり、N.S.Jayant and P.Noll:“Digital Co
ding of Waveforms",PRENTICE−HALL,NJ(文献4)に記
されている。
式(5)で計算されるビット配分量Rkは実数値となる
が、各帯域の信号を量子化する際にスカラ量子化器を用
いる場合には、Rkを整数値にする必要があるため、次に
Rkを補正する。第13図は、Rkの補正法の一実施例を示す
フローチャートである。まずRkを小数点以下の切捨てに
より整数化した後整数化によって生じた余りビット数Rr
により計算し、次に余りビットRrをパワーの大きい帯域
の順に1ビットづつ再配分していく。このようにパワー
の大きい順にビットを再配分することは、復号誤差を減
少させる効果がある。
第8図は本発明の一実施例に係る有音・無音検出部11
3のブロック図である。第8図において、1110はLPCケプ
ストラム抽出回路であり入力端子1100から入力した信号
のLPCケプストラムCi(i=1,2,…,P)を公知の方法に
よりサブフレームごとに計算する。但しPは分析次数で
あり例えばP=16とする。LPCケプストラムの計算法に
ついては例えば古井貞照「ディジタル音声処理」(東海
大学出版会1985)に記述されている。
求められたLPCケプストラムCiは特徴パラメータ射影
回路1140に入力される。この回路1140は内積演算回路11
20及び有音主成分ベクトルメモリ1130で構成される。
有音主成分ベクトルメモリ1130は第9図に示すフロー
チャート如く、予め電話使用環境下で集収された音声
(学習データ)を集収し(ステップ)、有音であるラベ
ル付けを行い(ステップ2)、有音部のLPCケプストラ
ムを計算し(ステップ3)、このLPCケプストラムに対
し主成分分析を行うことによって得られる。実際にはLP
Cケプストラムの共分散行列計算を行い(ステップ
4)、固有値を求め(ステップ5)、絶対値の大きい固
有値に対応する固有ベクトルから順に主成分ベクトルと
する(ステップ6)。ここでは第1〜第3の3つの主成
分ベクトルV1,V2,V3がメモリ130に格納されている。内
積演算回路120は、LPCケプストラムCiを要素とするベク
トルC=(C1,C2,…,CP)と主成分ベクトルV1,V2,V3
の内積演算を次式に従って行い、V1,V2,V3を座標軸とす
る3次元の主成分空間上のベクトルCの射影点Qを求め
る。
ここで、υijは主成分ベクトルViの第j要素Qiは射影
点Qの座標軸Viの成分である。
有音領域規定パラメータメモリ1160は、主成分ベクト
ル空間上の有音領域を規定するパラメータが格納されて
おり、同様に無音領域規定パラメータメモリ1170には主
成分ベクトル空間上の無音領域を規定するパラメータが
格納されている。有音及び無音の領域をV1,V2軸上で第1
0図に示すように長方形(図中斜線部)とした場合、有
音領域を規定するパラメータは、υ1l1h2l2h
となり、無音領域を規定するパラメータはζ1l1h
2l2hとなる。これらのパラメータは、予め電話使用
環境下で収集された音声の有音区間のLPCケプストラム
と無音区間のLPCケプストラムを統計処理して定められ
る。判定回路1150は、射影点Qが主成分ベクトル空間上
で、有音領域と無音領域のどの領域に属するか又は、ど
の領域にも属さないかということで(a)有音、(b)
無音、(c)不定の判定を行う。すなわち、 (a)υ1lQ1υ1hかつυ2lQZυ2hのとき有音 (b)ζ1lQ1ζ1hかつζ2lQ2ζ2hのとき無音 (c) その他 不 定 と判定する。
有音/無音判定回路1180では、第11図のフローチャー
トに示す如く判定回路1150の出力ステップ1が、有音と
無音のときはその効果をそのまま出力(エンドへ)す
る。
不足の場合(ステップ2)は、過去の3フレームの判
定結果が条件とした現フレームの有音,無音の条件付確
率を条件付確率テーブル1200からテーブルルックアップ
により求め(ステップ3)、有音の条件付確率が無音の
条件付確率より(ステップ4)大きい場合に有音、その
逆の場合に無音と判定する(ステップ5)。1190は判定
結果を少なくとも3フレーム分蓄積する判定結果メモリ
である。
nフレームの判定結果をTnとおくと、過去の3フレー
ムの判定結果Tn-1,Tn-2,Tn-3を条件とした条件付確率P
(Tn/Tn-1,Tn-2,Tn-3)は次式で表わされる。
P(Tn,Tn-1,Tn-2,Tn-3)とP(Tn-1,Tn-2,Tn-3
は、予め電話使用環境下で収集された音声(学習デー
タ)にフレームごとに波形やスペクトルの視認等によっ
て有音,無音のラベル付けを行い、連続する4フレーム
及び3フレームの有音,無音ラベルを基に、確率計算を
行い予め求められる。(5)式の計算で得られた条件付
確率は予め、条件付確率テーブル1200に格納しておく。
以上のように学習データから得られた条件付確率を基
に有音・無音判定を行うことは、有音→無音→有音→無
音というパターンは非常に少ないといった音声に関する
知識を利用して、判定していることになるので有音・無
音の誤判定が減るという効果がある。
尚信号の特徴パラメータとしてLPCケプストラムの他
に、信号パワー、零交差数、線形予測係数、自己相関係
数、DFT係数及びそれらの組合せを用いることもでき
る。また、判定の際に用いる主成分ベクトルの数や条件
付確率を計算する際の過去のフレーム数は任意の数に設
定することもできる等、種々変形可能である。
以上がコーダ部の説明である。
第14図は、本発明の一実施例に係る可変レート符号化
方式を適用した符号化装置のデコーダ部のブロック図で
ある。
第14図において、301は第3図のフォーマットのセル
をタイムスタンプ、帯域パワー、帯域信号の各々のデー
タに分解するセル分解部である。また、302は各帯域の
信号を逆量子化する逆量子化器であり、第1図の104と
同様にテーブルルックアップにより実現される。303は
逆正規化回路であり、逆量子化器302の出力と各帯域のR
MS値 の乗算を行う。
305はビット配分計算部であり、各帯域のRMS値 と1セル中のサブフレーム数NSを用いて第1図の109と
同様に各帯域に配分されるビット量を計算する。まず、
式(3)に従って1サンブル当りの平均ビット数Rを計
算し、次に式(5)に従って各帯域のビット配分量R
k(k=1,2,…,Mb)を計算する。セル廃棄検出回路306
は、伝送されたタイムスタンプTSとサブフレーム数NS
用いてセルの廃棄の有無を検出する。第15図は検出法を
示すフローチャートである。第16図も併用しながら検出
法を説明する。まず、タイムスタンプTSとサブフレーム
数NSを読み込み、これらを常に2セル分保持しておく。
次に、現在(時刻n)到着したセルの1時刻前のセルの
タイムスタンプTS(n−1)とサブフレーム数NS(n−
1)を用いて次式のように現在のタイムスタンプの予定
値Tを計算する。
T=TS(n−1)+NS(n−1) 次にTと現在のタイムスタンプTS(n)を比較し、一
致していれば廃棄なし、一致していなければ現在のセル
の直前で廃棄があったと判定する。例えば、第16図の場
合 TS(n−1)=1 NS(n−1)=m T=TS(n−1)+NS(n−1)=m+1=Ts(n) (7) であるので、廃棄なしである。
第14図において307は補間前処理回路であり、廃棄が
ない場合には各帯域の信号をQMFバンク308にバイパスさ
せ、廃棄があった場合には各帯域の代りに“0"をQMFバ
ンク308に入力する。
QMFバンク308は、分割された帯域の信号を入力し、フ
ルバンドの信号を出力するもので、構成は第2図におい
て入出力を逆にしたものとなる。QMFバンクを通過して
得られた復号信号は補間処理部309に送られ、そこでセ
ル廃棄による信号の脱落の補間が行われる。第17図は補
間処理部の一実施例を示すブロック図である。また第18
図は補間処理を示す信号波形例である。第17図において
入力端子400から入力された復号信号は端子409から供給
されるセル廃棄信号に従って、セル廃棄がなかった場合
には出力端子310にバイパスされ、セル廃棄があった場
合には、以下のように補間処理が行われる。まず、廃棄
直前のセルの復号信号をバッファ401から読み出しLPC分
析部402へ入力する。LPC分析部では自己相関法又は共分
散法によるLPC分析を行い予測係数α12,…,α
(Pは予測次数であり、ここでは8とした)と予測残
差信号e(n)を求める。LPC分析法についてはL.R.Rab
iner R.W.Shater著,鈴木訳“音声のディジタル信号処
理",コロナ社(文献5)で詳述されているので説明を省
略する。なお予測フィルタの伝達関数H(z)は である。次に予測残差信号e(n)にピッチ分析を行い
ピッチ周期TPとゲインg及び予測残差信号eP(n)を求
める。ピッチ分析法についても文献5で述べられている
が、ここでは次のようにしてTPとgを求める。
廃棄のあったセルの直前のセル(フレーム)の復号信
号において、フレーム最後のサンプル点をn=Nとお
き、次の誤差関数E(TP)を定義する。
但し、Lは誤差を評価する区間長であり、ここではL
=70とする。ピッチ周期TPは、上式のE(TP)を最小と
するTPとして求める。ピッチゲインgはTPを求めた後、
次式により計算する。
また、予測残差信号e(n),eP(n)は次式により
計算され、eP(n)がバッファ404に蓄積される。
但し、x(n)はバッファ401から出力される信号で
ある。次に、駆動信号生成回路405において、前のセル
の予測残差信号eP(n)の最後からTPサンプル分をバッ
ファ404から読み出し、その残差信号にピッチゲインg
を乗じた信号をくり返し接続し、第18図(c)のような
駆動信号を生成する。次に、この駆動信号を式(8)の
予測フィルタの逆フィルタである合成フィルタ406に入
力し、廃棄されたセルの信号を合成する。合成された信
号は廃棄セルの前のセル又は前後のセルの復号信号との
間で407においてスムージングが行われる。スムージン
グは、前セルの復号信号をx(n)、合成された信号を
(n)、スムージング出力をy(n)とおくと次式に
従って行われる。
y(n)={1−W(n)}x(n)+W(n)
(n) (13) ここで、W(n)は、スムージングの窓関数であり、
第19図に示すものが代表的である。
以上述べた本実施例での補間処理は、駆動信号レベル
での補間と言うことができるが、この方法は駆動信号の
レベルで前後のセルと波形の不連続点があっても、合成
フィルタを通過することにより不連続点が平滑化され、
音声のレベルではほとんど分からなくなるという効果が
ある。さらに、スムージング回路により前後のセルとの
連続性をより高めているのでセル廃棄に伴う符号信号の
劣化がほとんど知覚されないという効果がある。
以上の実施例において、帯域数8、サブフレーム長24
サンプル、最大サブフレーム数12、目標8NR22dBという
条件のもとで計算機シミュレーションを行った結果、平
均ビットレート21kbpsで32kbps ADPCM以上の品質を達
成すると共に、セル廃棄率5%で品質劣化がほとんど知
覚されないという優れた性質をもつことが確認された。
〔発明の効果〕
以上、説明したように本発明によれば、フレーム単位
で符号化ビットレートを制御しているので復号信号の品
質を一定に保つことができる効果があると共に、入力信
号のコントロピー(情報量)に応じて符号化レートが変
化するので高い符号化効率が得られる効果がある。さら
に、各々の周波数帯域別の信号電力を基に各帯域の符号
化ビット数の配分を行っているので復号信号のSNRを向
上させ、高い復号品質が得られる効果がある。
しかも、符号化データの総和は固定長のセルに納まる
よう制御しているので、符号化データの過不足による効
果の低下はない。また、本発明によれば、複数の周波数
帯域の信号をフレーム単位で独立に符号化しているの
で、過去の信号を用いて予測や量子化の制御を行ってい
るADPCMやEmbeded ADPCMのようにセル廃棄による品質劣
化が継続することはなく、廃棄セル内のみに留めること
ができる効果があると共に、どのセルが廃棄されても影
響は小さいのでセルの優先制御を行う必要がなくシステ
ムが簡単になる効果がある。
また、補間処理によって、品質の劣化がほとんど知覚
されることなく廃棄セルを再生することができる効果が
ある。
【図面の簡単な説明】
第1図は、本発明の一実施例に係る符号化装置のコーダ
部のブロック図、第2図は第1図のQMFバンクの一構成
例を示すブロック図、第3図はセルのフォーマットを示
す図、第4図はコーダの動作を説明するためのフローチ
ャート、第5図は第1図のビットレート制御部の動作を
示すフローチャート、第6図乃至第7図は本発明を説明
するためのフローチャート、第8図は本発明の一実施例
に係る有音・無音検出器のブロック図、第9図は本発明
の一実施例に係る主成分ベクトルを求める手順を示すフ
ローチャート、第10図は本発明の一実施例に係る主成分
ベクトル空間上の有音領域を示す図、第11図乃至第13図
は本発明の一実施例を説明するためのフローチャート、
第14図はデコーダ部のブロック図、第15図は第14図のセ
ル廃棄検出回路の動作を示すフローチャート、第16図は
セル廃棄検出法を説明するための図、第17図は第14図の
補間処理部の一構成例を示すブロック図、第18図は補間
処理を説明する波形例、第19図はスムージングの窓関数
を示す図、第20図は従来のEmbeded ADPCMのコーダ部の
ブロック図、第21図は従来のEmbeded ADPCMのデコーダ
部のブロック図、第22図は従来のパケットフォーマット
を示す図である。 100,200,300,400,600……入力端子、101……入力バッフ
ァ、102,308……QMFバンク、103……正規化回路、104,1
06……量子化器、105……帯域パワー計算回路、107,304
……逆量子化器、108……ビットレート制御部、109,305
……ビット配分計算部、110……タイムスタンプ計算回
路、111……セル化部、112……出力端子、1100……入力
端子、1110……LPCケプストラム抽出回路、1120……内
積演算回路、1130……有音主成分ベクトルメモリ、1140
……特徴パラメータ射影回路、1150……判定回路、1160
……有音領域規定パラメータメモリ、1170……無音領域
規定パラメータメモリ、1180……有音/無音判定回路、
1190……判定結果メモリ、1200……条件付確率テーブ
ル、201,204……ハイパスフィルタ、202,205……ローパ
スフィルタ、203……ダウンサンプラ、301……セル分解
部、303……逆正規化回路、306……セル廃棄検出回路、
307……補間前処理回路、309……補間処理部、310……
出力端子、401,404……バッファ、402……LPC分析部、4
03……ピッチ分析部、405……駆動信号生成回路、406…
…合成フィルタ、407……スムージング回路、408……ス
イッチ、610,740……PCMフォーマット変換回路、620…
…減算回路、630……適応量子化器、640,680……ビット
マスク回路、650……適応逆量子化器、660,700,730……
加算回路、690……フィードバック適応逆量子化器、720
……フィードフォワード適応逆量子化器、750……タン
デム接続補正回路。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力信号の信号系列を複数の周波数帯域の
    信号に分割し、分割された周波数帯域毎の信号の電力を
    計算し、計算された電力の値に基づいて周波数帯域毎の
    符号化ビット数の総和をフレーム単位で変化させ、符号
    化に割り当てられるべきビット数を表す信号を送信し、
    該周波数帯域毎の信号を符号化する可変レート符号化方
    法であって、 受信側での復号信号のSNRを推定し、そのSNRが一定とな
    るように前記符号化ビット数の割当てを決定すると共
    に、前記入力信号の有無、無音を検出し、該検出結果に
    よって帯域毎の信号を符号化する際の符号化ビット数と
    帯域毎の符号化ビット数の総和を変化させることを特徴
    とする可変レート符号化方法。
JP32950989A 1989-12-21 1989-12-21 可変レート符号化方法 Expired - Fee Related JP3004664B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32950989A JP3004664B2 (ja) 1989-12-21 1989-12-21 可変レート符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32950989A JP3004664B2 (ja) 1989-12-21 1989-12-21 可変レート符号化方法

Publications (2)

Publication Number Publication Date
JPH03191618A JPH03191618A (ja) 1991-08-21
JP3004664B2 true JP3004664B2 (ja) 2000-01-31

Family

ID=18222173

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32950989A Expired - Fee Related JP3004664B2 (ja) 1989-12-21 1989-12-21 可変レート符号化方法

Country Status (1)

Country Link
JP (1) JP3004664B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0576763A1 (en) * 1992-06-30 1994-01-05 International Business Machines Corporation Improved method for sub-band coding video signals and device for implementing said method
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
KR100370411B1 (ko) * 1996-04-15 2003-04-07 삼성전자 주식회사 비트율 조절이 가능한 오디오 부호화방법 및 이를이용한오디오부호화기
JPH11261986A (ja) 1998-03-13 1999-09-24 Fujitsu Ltd デジタル多重伝送装置
JP4810335B2 (ja) 2006-07-06 2011-11-09 株式会社東芝 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置

Also Published As

Publication number Publication date
JPH03191618A (ja) 1991-08-21

Similar Documents

Publication Publication Date Title
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
EP0433015B1 (en) Variable bit rate coding system
JPH04127747A (ja) 可変レート符号化方式
JP4658596B2 (ja) 線形予測に基づく音声コーデックにおける効率的なフレーム消失の隠蔽のための方法、及び装置
US6295009B1 (en) Audio signal encoding apparatus and method and decoding apparatus and method which eliminate bit allocation information from the encoded data stream to thereby enable reduction of encoding/decoding delay times without increasing the bit rate
EP0582921B1 (en) Low-delay audio signal coder, using analysis-by-synthesis techniques
EP0279451B1 (en) Speech coding transmission equipment
JPH01233500A (ja) 複数レート音声エンコーデイング方法
KR20010093210A (ko) 가변 속도 음성 코딩
JP2010170142A (ja) ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置
EP1061506A2 (en) Variable rate speech coding
US8055499B2 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
EP1688920B1 (en) Speech signal decoding
JPH0636158B2 (ja) 音声分析合成方法及び装置
JP3004664B2 (ja) 可変レート符号化方法
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP2003150198A (ja) 音声符号化装置および音声復号化装置
JP4281131B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP6713424B2 (ja) 音声復号装置、音声復号方法、プログラム、および記録媒体
JPH03191628A (ja) 可変レート符号化方式
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP4618823B2 (ja) 信号符号化装置及び方法
JP3301886B2 (ja) 可変レート音声符号化方法及び装置
WO1995028770A1 (en) Adpcm signal encoding/decoding system and method
JP2003323200A (ja) 音声符号化のための線形予測係数の勾配降下最適化

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071119

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081119

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091119

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees