JPH07106978A - データ伝送におけるデジタル音声信号の符号化と復号化方法 - Google Patents

データ伝送におけるデジタル音声信号の符号化と復号化方法

Info

Publication number
JPH07106978A
JPH07106978A JP27587393A JP27587393A JPH07106978A JP H07106978 A JPH07106978 A JP H07106978A JP 27587393 A JP27587393 A JP 27587393A JP 27587393 A JP27587393 A JP 27587393A JP H07106978 A JPH07106978 A JP H07106978A
Authority
JP
Japan
Prior art keywords
maximum value
data
signal
frequency
axis maximum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP27587393A
Other languages
English (en)
Other versions
JP2971715B2 (ja
Inventor
Hajime Obinata
肇 小日向
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Abit Corp
Original Assignee
Abit Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Abit Corp filed Critical Abit Corp
Priority to JP27587393A priority Critical patent/JP2971715B2/ja
Publication of JPH07106978A publication Critical patent/JPH07106978A/ja
Application granted granted Critical
Publication of JP2971715B2 publication Critical patent/JP2971715B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

(57)【要約】 【目的】 デジタル音声信号を所定の伝送路、例えば電
話回線で伝送する場合、リアルタイム処理の可能な範囲
で音声信号を圧縮符号化して送出し、受信側で圧縮され
た符号化信号を基に復号化して元の音声信号を再生する
ための、圧縮符号化および復号化の方法を提供する。 【構成】 所定の標本化速度で導入されたデジタル音声
入力信号4を狭帯域フィルタ10に通して、M個に分割
された周波数帯域Fと継続するN個の処理時間Tに対し
て信号成分SF(F,T)、およびこの信号成分の時間
軸最大値TMAX(F)と周波数軸最大値FMAX
(T)を求めてSF(F,T)を正規化する。正規化さ
れた音声信号NS(F,T)を予め保管された可聴音声
しきい値TH(F)と比較して、同一周波数帯域内で全
ての時間値での音声信号が可聴音声以下の場合、これ等
の音声信号を全て伝送しない。伝送しないこのデータ量
から伝送すべき音声信号のデータ量を大幅に低減して符
号化できる。復号化は上記の符号化の逆を行い音声信号
を再生できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、データ伝送における
デジタル音声信号の符号化と復号化方法に関し、特にI
SDNにあってリアルタイムでデジタル音声信号のデー
タを圧縮符号化方法とこの符号化信号を復号化する方法
に関する。
【0002】
【従来の技術】デジタル音声信号の符号化、およびそれ
に関連する音声信号のデジタル記録・伝送は既に実用に
供されている。例えば、デジタルコンパクトカセットに
よる録音に関して、藤本健文著「フィリップスDCCシ
ステムのキイ・ポイント:サイコ・アクースチックPA
SCコードの特徴と詳細」株式会社アイエー出版、ラジ
オ技術誌、1991年,12月,第156−161頁を
参照されたい。ここでは、高効率音声信号符号化(PA
SC:Precision AdaptiveSubb
and Coding)が使用されている。
【0003】この符号化方式では、音声信号を先ずバン
ドパス・フィルタに導入し、この信号を例えば32の等
間隔の帯域に分割する。DCCシステムでは、通常、標
本化周波数が48kHzであるので750Hzの帯域幅
が採用される。そして、512個の入力データを用い、
これ等のデータを32の帯域で求め、人間の可聴音声信
号レベルと音声感度に関する周波数依存性を加味して、
音声信号の量子化と符号化を行っている。
【0004】周知のように、音声信号の検知に関して著
しい周波数依存性がある。つまり、周波数が0Hz付近
および約15kHz以上の音響信号(音圧)は人間の耳
に検知できない。そして、特に2〜5kHzで音響信号
の検知感度が高く、この点に着目してPASCで音声の
受信品質を殆ど低下させることなく、音声信号の符号化
を効率化し高品質の音声信号の記録を可能にしている。
【0005】他方、電電公社(NTT)により既に19
86年に提唱されているISDN計画としての高度情報
通信システム(INS:Information Ne
twork System)では、データの伝送速度は
64kbpsが使用されている。このような伝送速度
は、当然デジタル音声信号の伝送量に、上記DCCシス
テムより大きな制約、つまり伝送される単位時間当たり
のデータ量に制限を課すことになる。
【0006】このようにデータ伝送量に制限のある系に
PASCのような符号化法を用いると、粗い量子化を行
うことによって小さい信号が零となってしまうことが往
々起こり得る可能性がある。そのため、音が途切れた
り、あるいは小さな信号が連続的に流れている時、パル
ス性の付加的な信号が入力すると、小さな実音声信号が
消えたりする。
【0007】
【発明が解決しようとする課題】この発明の課題は、I
SDNのようなデータ伝送量にかなり制約があっても、
高品質の音声信号を保つことができ、それにもかかわら
ずリアルタイムで再生できるように、圧縮符号化された
音声信号データを効率的に圧縮符号化でき、同時にこの
圧縮符号化された音声信号を復号する方法を提供するこ
とにある。
【0008】
【課題を解決するための手段】上記の課題は、この発明
により、デジタル音声信号の伝送にあって下記処理過
程、a)所定標本周波数のデジタル音声信号を狭帯域多
重デジタルフィルタに入力し、多重周波数帯域に分離
し、一定時間間隔の順次時間Tで各周波数帯域Fの信号
成分S(F,T)を求め、b)各周波数帯域F内で信号
成分S(F,T)の絶対値の最大値である時間軸最大値
TMAX(F)を求め、c)各時間T内で信号成分S
(F,T)の最大値である周波数軸最大値FMAX
(T)を求め、d)信号成分S(F,T)を時間軸最大
値TMAX(F)と周波数軸最大値FMAX(T)の小
さい方で割り算して正規信号成分NS(F,T)を求
め、e)各周波数帯域Fで時間軸最大値TMAX(F)
を可聴音声しきい値TH(F)と比較し、換算時間軸最
大値CTMAX(F)として、前者が後者より小さい
時、あるいは等しい時、0の値を、また前者が後者より
大きい時、時間軸最大値TMAX(F)の値を使用し、
f)前記換算時間軸最大値CTMAX(F)が0の時、
その周波数帯域F内の全ての時間Tの信号の以後の伝送
を禁止し、g)前記正規信号成分NS(F,T)をビッ
ト数のより少ない少なくとも1種の符号で量子化信号Q
S(F,T)に変換し、h)送出するデータとしてフレ
ーム同期信号SYNC,換算時間軸最大値CTMAX
(F),周波数軸最大値FMAX(T)および誤り符号
CRCを順次配列したフレーム情報符号を形成し、各周
波数帯域Fの同一時間軸上の全ての量子化信号QS
(F,T)を固有な音声信号データとして更に付加す
る、から成るデジタル音声信号の圧縮符号化方法によっ
て解決されている。
【0009】更に、上記の課題は、この発明により、デ
ジタル音声信号の伝送にあって上の処理過程によって求
めた圧縮符号化データ信号を受信して、復号化するのに
下記処理過程、i)受信したデータブロック中のフレー
ム同期信号SYNCから、次に続くデータにより換算時
間軸最大値CTMAX(F),周波数軸最大値FMAX
(T)を復号化し、j)デーテブロック中の誤り符号C
RCからデータの誤りを調べ、誤りのないデータ信号を
取り出し、k)音声信号に付属する固有のデータをデー
タブロックから取り出し、復号化により逆正規化音声信
号TNS(F,T)を形成し、l)換算時間軸最大値C
TMAX(F)と周波数軸最大値FMAX(T)の小さ
い方の値を前記逆正規化音声信号TNS(F,T)に乗
算して、逆音声信号(F,T)を求め、m)狭帯域デジ
タル逆フィルタにより、逆音声信号TS(F,T)から
所望の標本化周波数のデジタル出力音声信号を求める、
を実行する圧縮音声信号の復号化方法によって解決され
ている。
【0010】この発明による他の有利な構成は、特許請
求の範囲の従属請求項に記載されている。
【0011】
【作用】この発明によれば、本発明者が既に提案してい
る極狭帯域の多重デジタルフィルタを使用している(こ
れに関しては特許出願準備中)。このフィルタは高速デ
ジタル演算が可能であるため、リアルタイムでデジタル
音声信号(PCM)の伝送処理を行う場合に特に適して
いる。この発明の一つの実施例の場合では、前記フィル
タが0〜15kHzの間で512個に分割された周波数
帯域を設けているため、個々のフィルタの帯域幅は29
Hzである。特に、この発明で使用するフィルタでは、
個々の帯域分割フィルタの作用が隣接した帯域にしか及
ばないため、極めたシャープカットな狭い帯域フィルタ
を実現している。従って、音声信号を非常に高い分解能
で分解できる。更に、この発明によれば、同一周波数帯
域内で異なる時間の複数個の音声信号成分を処理する。
実際には、周波数帯域の数が多いため、PCM音声信号
の量子化を相当粗くしても、歪みが狭い帯域内でのみ発
生するため、再生された音声信号の品質を悪化させな
い。
【0012】上に述べたPASCで使用しているよう
に、可聴音声しきい値の信号レベル曲線と検知音圧の周
波数依存性を計算に入れると、非可聴音声信号の信号処
理を省略することができる。このことは、伝送量に制限
のあるISDNでの音声信号の伝送で伝送すべき情報量
を有効に確保できる。こうして、可聴音声信号の品質を
低下させることなく、音声信号を特徴付ける信号データ
量を相当圧縮することができる。この発明では、圧縮さ
れた符号化音声信号を復号化して、再生しているが、そ
の手順を符号化方法の逆を行うもので、符号化の時と類
似の演算ルーチンを使用することができる。
【0013】
【実施例】以下では、図面に示す好適実施例に基づき、
この発明の内容をより詳しく説明する。
【0014】図1に示すように、記号4で示す所定の標
本化周波数のデジタル音声入力信号(PCM信号)をこ
の発明で使用する極狭帯域多重フィルタ10に導入す
る。このフィルタにより可聴周波数帯域をM等分した狭
い帯域内の信号成分を取り出せる。この周波数分割処理
をN回にわたり実行して、結局、MxN個の信号成分 S(F,T); 0<F ≦M,0 <T≦N をバッファ12に収納する。収納された信号成分S
(F,T)は図示のように周波数帯域の指数Fと時間軸
の指数Tで指定される行列状の配置で表すことができ
る。この実施例では、使用する分割帯域数Mと処理時間
Nは M=512 N=10 である。また、信号の処理で使用するビット数は16ビ
ット以上である。
【0015】次に、これ等の周波数分割された信号成分
S(F,T)を処理過程20で正規化するため、先ず信
号成分S(F,T)の絶対値の周波数帯域軸と時間軸に
関する最大値FMAX(T)とTMAX(F)を各処理
時間Tと各周波数帯域Fに付いて求める。つまり FMAX(T)=MAX{│S(F,T)│;F=1〜
M},T=1,2・・・N, TMAX(F)=MAX{│S(F,T)│;T=1〜
N},F=1,2・・・M.
【0016】次いで、周波数帯域Fと時間軸Tで指定さ
れる信号成分S(F,T)に対して、周波数帯域F内の
信号成分の最大値FMAX(T)と時間軸T内の信号成
分の最大値TMAX(F)の小さい方で信号成分S
(F,T)を割り算したものを、正規化された信号成分
NS(F,T)とする。つまり、
【0017】周波数帯域Fと時間軸Tの全ての範囲に対
し、このように正規化した信号成分NS(F,T)を求
め、これ等をバッファ22に納める。
【0018】ここで、音声信号の可聴周波数特性を加味
して、データの圧縮の準備を行う。これには、先ずビッ
ト配分決定部55で、処理装置の所定箇所50に予め保
管されていて、転送路74を介して導入される可聴音声
しきい値の周波数特性の離散値 TH(F); F= 1,2・・・M と、記号70で示す転送路によって導入される各周波数
帯域F内の最大値TMAX(F)とを全ての周波数帯域
Fにわたって比較する。もし、TMAX(F)が可聴音
声しきい値の周波数特性の離散値TH(F)より小さい
のであれば、この帯域Fの音声信号を聴きとることがで
きないとして、後で更に詳しく説明するように、周波数
帯域Fの処理時間Nの全てにわたって以後の信号情報の
伝送を行わない処理を指定するため、新たな時間軸に関
する最大値CTMAX(F)としてこの値を0とする。
また、そうでない場合、そのままの値TMAX(F)を
使用する。換言すれば、 と変換される。これは図2の符号化ビット配分決定処理
ルーチンの前半部(ステップS10)に示してある。
【0019】更に、図2の符号化ビット配分決定処理ル
ーチンの後半部(ステップS11〜S15)には、伝送
するデータを圧縮する前の準備処理が示してある。ここ
では、上に述べたように、CTMAX(F)=0での周
波数帯域F内の信号NS(F,T)は全て伝送されない
ので、それだけ実際に伝送するデータ量に余裕ができ
る。加えて、この発明による実施例では、ビット数16
以上 であった初期音声信号S(F,T)またはNS
(F,T)が通常1.6ビットに圧縮されるが、CTM
AX(F)の値が大きいもの関しては、その周波数帯域
F内の全てのデータのビット数を更に大きくして、つま
り分解能をもっと高めた信号の圧縮を行う。この実施例
では、値が0以外のCTMAX(F)を更に3種のグル
ープに分類する。つまり、値が大、中、小に分類し、デ
ータ圧縮時に対応するデータにそれぞれ4,2.4およ
び1.6ビットを割り当てる。このビット配分を示す指
数として を規定する。
【0020】更に、この発明の実施例によれば、4ビッ
トの圧縮データと2.4ビットの圧縮データの数を1:
2に配分する。このような規則を適用すると、最終的に
伝送するデータ出力速度、例えばこの実施例の場合、6
4kbpsと、入力された音声信号の特性から伝送しな
くても良いデータ量(上に述べたCTMAX(F)=0
での周波数帯域F内の信号NS(F,T)の総ビット
数)によって、ALOC(F)=O,ALOC(F)=
1およびALOC(F)=2に対応するデータ数を計算
で求めることができる。
【0021】ステップS11では、伝送データ出力速度
から決まるバッファ22の1処理時間内の余裕分ビット
数SBITとして SBIT=MxNバッファに与えられる総ビット数−N
x16 が与えられる。ここで、右辺の最後の項は時間軸N(=
10)個のデータが取り合えず全て1.6ビットである
と見なして計算する。SBITにCTMAX(F)=0
による非伝送分のデータ16×P(PはステップS10
で求めたCTMAX(F)=0の帯域数)を加算した数
は、CTMAX(F)≠0の全てのデータを1.6ビッ
トで処理する場合、未だ使用可能な残りの総ビット数で
ある。ステップS11では、残りの総ビット数を40で
割り算して整数商Qと余りRを求める(40は先に述べ
た4ビットデータと2.4ビットデータの1:2配分と
帯域内のデータ数=10から決まる)。これにより、ス
テップS12で2.4ビットを割り当てる帯域Fの数と
してk24および4ビットを割り当てる帯域Fの数とし
てk40が求まる。次いで、ステップS13,S14お
よびS15により最終的にビット配分を指示する指数A
LOC(F)が全て指定される。
【0022】図2の符号化ビット配分決定処理の次に
は、第一量子化処理部30(図1)で正規化された信号
NS(F,T)が先に述べた粗いビット数に量子化され
る。これは図3に示す手順で行われる。ビット配分決定
処理部55から転送路76を介して導入された各周波数
帯域Fのビット配分を指示する指数ALOC(F)をス
テップS20で判定し、その指数ALOC(F)の値に
応じて係数PPXの値を指定し、ステップS21でバッ
ファ22にある信号NS(F,T)を再量子化する。こ
こで、Int(X)はXを越えない最大整数値を意味
し、>>は1ビット右シフトを行い、2で割って余りを
切り捨てることを意味する。最後の処理は、信号の正負
のビット配分を0信号レベルに対して対称にするために
行う(図4参照)。このように量子化された信号QS
(F,T)はバッファ32に収納される。
【0023】第二量子化処理部60(図1)には、各周
波数帯域中の最大値CTMAX(F)と各時間軸内の最
大値FMAX(T)がそれぞれ転送路78および72を
介して導入され、ここで6ビット対数量子化される(2
dBステップ)。これ等の対数量子化された値をそれぞ
れQTMAX(F)とQFMAX(T)とする。
【0024】最後に、量子化された信号QS(F,
T),QTMAX(F)とQFMAX(T)を出力伝送
路に送り出す出力信号8にするには、データ符号化処理
部40(図1)でこれ等の量子化信号を符号化し、処理
時間毎にブロック化されたフレーム信号(フレーム情報
信号と圧縮された音声信号)にする。
【0025】図5に示すように、先ずステップS30に
よりフレームの頭に同期信号SYNC(8ビット)を付
ける。次いでステップS31でQTMAX(F)を送り
出し、ステップS32でQFMAX(T)を送り出す。
更に、巡回符号CRC(7ビット)を付加してフレーム
情報の符号を完成させる。
【0026】次に、圧縮された音声信号は、図6に示す
データ符号化処理により、前記のフレーム情報に続くフ
リーフォーマット区間に後置される。この場合、データ
符号化処理部40には、量子化した音声信号QS(F,
T)の外に、転送路77を介してビット配分指数ALO
C(F)も導入されている。この指数ALOC(F)を
先ずステップS40で判定する。1.6ビットの場合
(ALOC(0)の時)、ステップS41で図示のよう
に時間軸の1〜5までのデータを一つの3進表示値SD
0として、時間軸の6〜10までのデータをもう一つの
3進表示値SD1として、ステップS44でそれぞれ8
ビットにして送り出す。また、2.4ビットの場合(A
LOC(1)の時)には、ステップS42で図示のよう
に時間軸の1〜5までのデータを一つの5進表示値SD
0として、時間軸の6〜10までのデータをもう一つの
5進表示値SD0として、ステップS45でそれぞれ1
2ビットにして送り出す。あるいは、4ビットの場合
(ALOC(2)の時)には、ステップS43で対応す
る周波数帯域F内の各時間でのデータに7を加算して4
ビットにして送り出す。
【0027】上の説明した信号符号化処理では、多数の
帯域にわたる演算を行った、特に周波数軸の最大値FM
AX(T)はM=512の範囲で調べた。しかし、音声
は周波数によって大きく異なる可聴特性を有するので、
この最大値も更に数分割した周波数範囲内で求めると、
伝送する音声の品質をより忠実に表現できる。この実施
例でM=512を使用する場合、8分割すると実験的に
再生された音声の品質が最も良好であった。このような
分割処理は、正規化処理部20、量子化処理部30およ
びデータ符号化処理部40の全ての処理に対して実行す
る必要がある。
【0028】このようにして作成されたM=512,N
=10および周波数帯域分割数=8の場合の圧縮データ
を図7aに示す。ここでは、CTMAX(F)がF=3
で0になっているため、周波数帯域のデータDT(F)
の内DT(3)は送っていないことに注意されたい。そ
の外、周波数帯域を8に分割しているため、周波数軸の
最大値はF(FB,T)として表されている。この場
合、分割指数FB=1,2・・・・8である。また、フ
リーフォーマット区間の各データDT(F)は同一時間
軸上の全てのデータを一組にして形成されている。この
データDT(F)内の1.6,2,4および4ビットの
データ配置を図7bに示す。
【0029】次に、或る伝送回路を経由して導入され
た、あるいは何らかのデジタル信号読取装置によって検
出された、図7に示すフレーム信号配置を有するデジタ
ル音声信号を復号化して、元の音声信号に変換する処理
方法に付いて説明する。
【0030】図8には、上で図1〜7を参照して説明し
た圧縮符号化方法によって得られたデジタル音声信号9
が、受信装置側のフレーム情報に対する復号化部41に
導入される。この受信装置は、ISDN対応のモデムで
あっても良い、あるいはデジタルコンパクトカセットの
読取ヘッドから得られた検出信号を波形整形し、図7に
示すフレーム信号配置を有するデジタル音声信号に整形
したものでもよい。この受信信号を元の音声信号に近い
値にTS(F,T)に戻し、更に狭帯域多重フィルタ1
1によって逆フィルタを行い、最終的にデジタル音声信
号5を求める。この詳細を次に説明する。
【0031】復号化部41では、先ず時間軸最大値QT
MAX(F)と周波数軸最大値QFMAX(T)(図9
のステップS60)を受信し、図9のステップS61に
示すように、巡回符号CRCを検出して、受信したフレ
ーム同期信号、TMAX(F),FMAX(T)でCR
C符号を作成してCRCRとして、送信されたCRC符
号がCRCRと一致している否かを判定する。一致して
いる場合には、そのまま次の過程に進み、一致していな
い場合、そのフレームのデータを用いた計算を実質上行
わない。こうして、対数量子化された受信時間軸最大値
QTMAX(F)と周波数軸最大値QFMAX(T)は
それぞれ転送路86,85を介して逆量子化処理部61
に転送され、ここで両者の値が逆対数(指数関数)変換
されて、時間軸最大値CTMAX(F)と周波数軸最大
値FMAX(T)が定まる。
【0032】次いで、ビット配分決定処理部56で音声
データの伝送を必要としないデータ区間の周波数帯域F
(TMAX(F)=0の場合の帯域)と、このような周
波数帯域の総数Pを図10のステップS50で求める。
そして、この総数Pからビット配分決定処理部56で伝
送に使用された残りのビット数を、図2で説明した符号
化の時と全く同じ計算方法に基づき、つまり図10のス
テップS51,S52,S53,S54およびS55に
より求める。この場合、圧縮符号化のところで説明した
ように、同じビット配分、即ち通常の信号強度の周波数
帯域のデータを1.6ビットとして、信号強度のより強
い周波数帯域Fと更に強い周波数帯域Fのデータを1:
2の割合の2ビットと、2.4ビットに割り振る。それ
等の対応するグループに対するビット配分を指示する指
数ALOC(F)と各ビットの周波数帯域の数とを決定
する。
【0033】次いで、データ復号化処理部43で、図1
1のように、ビット配分決定処理部56から送られたビ
ット配分指示指数ALOC(F)に基づき、データフリ
ーフォマット区間の時間軸上のデータDT(F)から量
子化された圧縮符号化音声信号QS(F.T)を求め
る。この処理は、図6の処理の逆変換に相当する。この
場合、 HDATA(0,J) =34−J HDATA(1,J) =54−J である。
【0034】更に、図12に示すように、フレーム内の
量子化された圧縮符号化音声信号成分QS(F,T)か
ら、図3のステップS12とは逆の処理により、正規化
された音声信号TNS(F,T)を求める。これをバッ
ファ23に納める。
【0035】次に、正規化処理部21で、逆量子化処理
部61で求まり転送路89と90を介して導入された時
間軸最大値CTMAX(F)と周波数軸最大値FMAX
(T)を用いて、正規化された音声信号TNS(F,
T)を初期音声信号TS(F,T)に変換して、バッフ
ァ13に納める。この場合の変換は、図1の正規化の逆
である。即ち、 である。なお、ここで言う正規化音声信号TNS(F,
T)と初期音声信号TS(F,T)は、図1で示した正
規化音声信号NS(F,T)および初期音声信号S
(F,T)とは実質上異なる。何故ならば、図1の量子
化処理30で、音声信号成分の強度がかなり粗いビット
の分解能で変換されたからである。この信号レベルの粗
さは、人の可聴能力を加味して決定されているので、実
際に音声に変換した場合、依然として高い品質の音声と
して聴くことができる。
【0036】最後に、バッファ13の行列状の音声信号
TS(F,T)のブロックは、この発明による狭帯域の
多重帯域逆フィルタ11を通過させて、記号5で示すデ
ジタル音声信号(PCM)として取り出せる。この音声
信号を所定の記憶装置で記憶媒体に記憶しておくか、あ
るいは所定の音声変換装置(再生装置)の助けにより音
声として聴くことができる。
【0037】なお、ISDNで2Bチャンネルにそれぞ
れステレオの左右音声信号を送り出す場合、2Bチャン
ネルのスキューが補償されていないので、予めフレーム
の約半分の周期だけ送出時点をずらすことにより、スキ
ューのずれを吸収する。
【0038】この発明による圧縮されたデジタル音声信
号の復号化方法を、主としてISDNの場合について説
明した。しかし、この発明は単にISDNだけでなく、
デジタルコンパクトカセットや磁気テープ等での再生に
も利用できる。これ等の場合には、単位時間当たりのデ
ータ量にISDNの場合より余裕があるため、ビット配
分を更に増やし、細かいステップによる高音質を保持で
きる信号の符号化圧縮方法およびそれに対する復号化方
法も可能である。
【0039】更に、この発明は上記の実施例で使用した
パラメータM=512,N=10,FB=8の値、およ
びALOC(F)の種類=3に限定されるものではな
く、2.4ビットと4ビットの比率も2:1に限定する
ものではない。これ等のパラメータは、必要に応じて、
適宜選択して変更して使用できる。3種の中の2種のビ
ットは、上記のように各周波数帯域のCTMAX(F)
の大きさの順で(即ち相対的に)決めるのでなく、CT
MAX(F)の値の絶対値で評価することもできる。周
知のように、分割周波数FBでの可聴音声しきい値の特
性曲線TH(FB)は周波数範囲に応じて相当異なる特
性を示す。その場合、分割周波数FBでの可聴音声しき
い値の特性曲線TH(FB)に適当に重みを付けて前記
絶対値を決定できる。このような操作は、実験的に決め
るべきである。
【0040】
【発明の効果】以上説明したように、この発明によれ
ば、デジタル音声データを圧縮して符号化し、伝送回路
を介して受信後復号化する方法は、下記の事項により、
少ないデータ伝送量で音声信号を充分高品質に保持でき
る。即ち、 (1) 狭帯域デジタルフィルタで多数の帯域に信号を
分割することにより、各帯域内の信号を非常に粗く量子
化しても、量子化の歪みが狭い帯域内のみに発生するか
ら、聴感上の音質の劣化が少ない。 (2) 時間軸および周波数軸の最大値の小さい方の値
により、粗い量子化を行う前の信号を正規化しているた
め、どちらかの最大値のみによって正規化するよりも、
全体に正規化後の信号レベルが上昇し、粗い量子化の影
響が少なくなり、また時間軸および周波数軸の急激な変
化に対しても、正規化後の信号レベルが極端に小さくな
ることがなくなり、粗い量子化を行っても、音声が欠落
することがなくなった。 (3) 符号化ビット配分の指示値は受信側で時間軸最
大値より計算により再生できるため、伝送する必要がな
い。この処置により伝送データ量の大幅な増加が可能に
なっている。
【図面の簡単な説明】
【図1】この発明によるデータ圧縮符号化処理の各過程
とそれに付属する信号を模式的に示す処理図である。
【図2】符号化ビット配分を決定するためのサブルーチ
ンのフローチャートである。
【図3】量子化を行うサブルーチンのフローチャートで
ある。
【図4】量子化により分解能を粗くした信号のビット配
置を示す図である。
【図5】データフレームの処理・データ情報を与えるた
めにデータ符号化を行うサブルーチンのフローチャート
である。
【図6】圧縮された音声データの符号化するサブルーチ
ンである。
【図7】伝送されるデータのフレーム内配置(a)と圧
縮された音声信号の1データブロック内での配置(b)
を示す。
【図8】この発明による圧縮符号化音声データを復号化
する各過程とそれに付属する信号を模式的に示す処理図
である。
【図9】受信時の符号誤りの検査と周波数軸最大値の受
信ルーチンの模式フローチャートである。
【図10】ビット配分決定ルーチンのフローチャートで
ある。
【図11】データ復号化ルーチンのフローチャートであ
る。
【図12】正規化音声信号成分を算出するルーチンのフ
ローチャートである。
【符号の説明】
4 入力音声信号(標本化されたPCM信号) 5 出力音声信号 8 圧縮された出力音声符号化信号 9 圧縮された受信音声信号 10 狭帯域多重フィルタ 11 狭帯域逆多重フィルタ 20 正規化処理部 21 逆正規化処理部 30 量子化処理部I 40 データ符号化処理部 41 最大値復号化部 43 データ復号化部 50 可聴音声しきい特性曲線の数値用の保管部 55 ビット配分決定部 56 ビット配分決定部 60 量子化処理部II 61 逆量子化処理部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 デジタル音声信号の伝送にあって下記処
    理過程、 a)所定標本周波数のデジタル音声信号を狭帯域多重デ
    ジタルフィルタに入力し、多重周波数帯域に分離し、一
    定時間間隔の順次時間(T)で各周波数帯域(F)の信
    号成分(S(F,T))を求め、 b)各周波数帯域(F)内で信号成分(S(F,T))
    の絶対値の最大値である時間軸最大値(TMAX
    (F))を求め、 c)各時間(T)内で信号成分(S(F,T))の最大
    値である周波数軸最大値(FMAX(T))を求め、 d)信号成分(S(F,T))を時間軸最大値(TMA
    X(F))と周波数軸最大値(FMAX(T))の小さ
    い方で割り算して正規信号成分(NS(F,T))を求
    め、 e)各周波数帯域(F)で時間軸最大値(TMAX
    (F))を可聴音声しきい値(TH(F))と比較し、
    換算時間軸最大値(CTMAX(F))として、前者が
    後者より小さい時、あるいは等しい時、0の値を、また
    前者が後者より大きい時、時間軸最大値(TMAX
    (F))の値を使用し、 f)前記換算時間軸最大値(CTMAX(F))が0の
    時、その周波数帯域(F)内の全ての時間(T)の信号
    の以後の伝送を禁止し、 g)前記正規信号成分(NS(F,T))をビット数の
    より少ない少なくとも1種の符号で量子化信号(QS
    (F,T)に変換し、 h)送出するデータとしてフレーム同期信号(SYN
    C),換算時間軸最大値(CTMAX(F)),周波数
    軸最大値(FMAX(T))および誤り符号(CRC)
    を順次配列してフレーム情報符号を形成し、各周波数帯
    域Fの同一時間軸上の全ての量子化信号(QS(F,
    T))を固有な音声信号データ(DT(F))として更
    に付加する、 から成ることを特徴とするデジタル音声信号の圧縮符号
    化方法。
  2. 【請求項2】 換算時間軸最大値(CTMAX(F))
    が0であるため、データ伝送に供されないデータ量と伝
    送速度によって規定されるデータ伝送量と勘案して、時
    間軸最大値(CTMAX(F))の値が大きい周波数帯
    域(F)にビット数の大きい符号を配分して量子化信号
    (QS(F,T)に変換することを特徴とする請求項1
    に記載の圧縮符号化方法。
  3. 【請求項3】 周波数軸最大値(FMAX(T))およ
    びこれに付属する周波数帯域にわたる正規化、量子化等
    の演算は複数の副周波数帯域(FB)に分割して行われ
    ることを特徴とする請求項1または2に記載の圧縮符号
    化方法。
  4. 【請求項4】 換算時間軸最大値(CTMAX(F))
    と周波数軸最大値(FMAX(T))は対数量子化され
    た値で伝送されることを特徴とする請求項1〜3のいず
    れか1項に記載の圧縮符号化方法。
  5. 【請求項5】 使用する周波数帯域の数は512,時間
    軸データ数は10,帯域分割数は8であり、換算時間軸
    最大値(CTMAX(F))と周波数軸最大値(FMA
    X(T))の対数符号化は6ビットの2dBステップで
    あり、圧縮されたデータの符号のビット数は1.6,
    2.4および4ビットの3種であることを特徴とする請
    求項4に記載の圧縮符号化方法。
  6. 【請求項6】 デジタル音声信号の伝送にあって請求項
    1により圧縮符号化されたデータ信号を受信して、復号
    化するのに下記処理過程、 i)受信したデータブロック中のフレーム同期信号(S
    YNC)から、次に続くデータにより換算時間軸最大値
    (CTMAX(F)),周波数軸最大値(FMAX
    (T))を復号化し、 j)デーテブロック中の誤り符号(CRC)からデータ
    の誤りを調べ、誤りのないデータ信号を取り出し、 k)音声信号に付属する固有のデータをデータブロック
    から取り出し、復号化により逆正規化音声信号(TNS
    (F,T))を形成し、 l)換算時間軸最大値(CTMAX(F))と周波数軸
    最大値(FMAX(T))の小さい方の値を前記逆正規
    化音声信号(TNS(F,T))に乗算して、逆音声信
    号(TS(F,T))を求め、 m)狭帯域デジタル逆フィルタにより、逆音声信号(T
    S(F,T))から所望の標本化周波数のデジタル出力
    音声信号を求める、 を実行することを特徴とする圧縮符号化されたデジタル
    音声信号の復号化方法。
  7. 【請求項7】 前記逆正規化音声信号(TNS(F,
    T))の形成は、換算時間軸大値(CTMAX(F))
    が0であるため、データ伝送に供されないデータ量と伝
    送速度によって規定されるデータ伝送量と勘案して、時
    間軸最大値(CTMAX(F))の値が大きい周波数帯
    域(F)にビット数の大きい符号を配分して行われるこ
    とを特徴とする請求項6に記載の復号化方法。
  8. 【請求項8】 周波数軸最大値(FMAX(T))およ
    びこれに付属する周波数帯域にわたる正規化、量子化等
    の演算は複数の副周波数帯域(FB)に分割して行われ
    ることを特徴とする請求項6または7に記載の復号化方
    法。
  9. 【請求項9】 換算時間軸最大値(CTMAX(F))
    と周波数軸最大値(FMAX(T))は受信した換算時
    間軸最大値(CTMAX(F))と周波数軸最大値(F
    MAX(T))を逆対数量子化することによって復号化
    されることを特徴とする請求項6〜8のいずれか1項に
    記載の復号化方法。
  10. 【請求項10】 使用する周波数帯域の数は512,時
    間軸データ数は10,帯域分割数は8であり、圧縮され
    たデータの符号のビット数は1.6,2.4および4ビ
    ットの3種であることを特徴とする請求項1〜4のいず
    れか1項に記載の復号化方法。
JP27587393A 1993-09-30 1993-09-30 デジタル音声信号の伝送方法とデジタル音声信号の符号化方法 Expired - Fee Related JP2971715B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27587393A JP2971715B2 (ja) 1993-09-30 1993-09-30 デジタル音声信号の伝送方法とデジタル音声信号の符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27587393A JP2971715B2 (ja) 1993-09-30 1993-09-30 デジタル音声信号の伝送方法とデジタル音声信号の符号化方法

Publications (2)

Publication Number Publication Date
JPH07106978A true JPH07106978A (ja) 1995-04-21
JP2971715B2 JP2971715B2 (ja) 1999-11-08

Family

ID=17561630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27587393A Expired - Fee Related JP2971715B2 (ja) 1993-09-30 1993-09-30 デジタル音声信号の伝送方法とデジタル音声信号の符号化方法

Country Status (1)

Country Link
JP (1) JP2971715B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8036162B2 (en) 2006-04-26 2011-10-11 Mitsubishi Electric Corporation Wireless communication system and wireless communication device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8036162B2 (en) 2006-04-26 2011-10-11 Mitsubishi Electric Corporation Wireless communication system and wireless communication device

Also Published As

Publication number Publication date
JP2971715B2 (ja) 1999-11-08

Similar Documents

Publication Publication Date Title
JP3277692B2 (ja) 情報符号化方法、情報復号化方法及び情報記録媒体
EP0869622B1 (en) Scalable audio coding/decoding method and apparatus
US7689427B2 (en) Methods and apparatus for implementing embedded scalable encoding and decoding of companded and vector quantized audio data
EP1914724B1 (en) Dual-transform coding of audio signals
EP1914725B1 (en) Fast lattice vector quantization
JP3186292B2 (ja) 高能率符号化方法及び装置
EP0884850A2 (en) Scalable audio coding/decoding method and apparatus
JP5175028B2 (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
JP3203657B2 (ja) 情報符号化方法及び装置,情報復化方法及び装置,情報伝送方法,並びに情報記録媒体
WO2002103685A1 (fr) Appareil et procede de codage, appareil et procede de decodage et programme
US6930618B2 (en) Encoding method and apparatus, and decoding method and apparatus
JP3186290B2 (ja) 符号化方法、符号化装置、復号化装置及び記録媒体
US7835915B2 (en) Scalable stereo audio coding/decoding method and apparatus
KR100682915B1 (ko) 다채널 신호 부호화/복호화 방법 및 장치
JPH03121633A (ja) 可聴音信号符号化方法
JP3227942B2 (ja) 高能率符号化装置
US6661923B1 (en) Coding device, coding method, decoding device, decoding method, program recording medium and data recording medium
JPH07106978A (ja) データ伝送におけるデジタル音声信号の符号化と復号化方法
JP3998281B2 (ja) デジタル音声信号の帯域分割符号化方法と復号化方法
JPH08123488A (ja) 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法
JP3146121B2 (ja) 符号化復号化装置
JP3527758B2 (ja) 情報記録装置
JP3250367B2 (ja) 符号化信号復号化方法及びその装置
JP3141451B2 (ja) オーディオ信号処理方法
JP3134383B2 (ja) ディジタルデータの高能率符号化方法及び装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees