JPH03182800A - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JPH03182800A
JPH03182800A JP1323423A JP32342389A JPH03182800A JP H03182800 A JPH03182800 A JP H03182800A JP 1323423 A JP1323423 A JP 1323423A JP 32342389 A JP32342389 A JP 32342389A JP H03182800 A JPH03182800 A JP H03182800A
Authority
JP
Japan
Prior art keywords
amplitude value
spectrum
discrete fourier
amplitude
corrected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1323423A
Other languages
English (en)
Inventor
Koji Okazaki
岡崎 晃二
Akira Sasama
笹間 昭
Shigeyuki Umigami
重之 海上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1323423A priority Critical patent/JPH03182800A/ja
Publication of JPH03182800A publication Critical patent/JPH03182800A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [概 要] 入力音声信号のピッチ周期またはその倍数の窓長をもつ
離散的フーリエ変換により入力音声信号の音声スペクト
ルを求めながら符号化する音声符号化方式に関し、 外部回路としてポストフィルタを設けなくても、雑音感
を軽減できるようにすることを目的とし、音声スペクト
ルの各周波数成分について、第m番目の周波数成分の振
幅値r(m)を、振幅値r(+=)に対し所要の関数関
係にある補正振幅値s (m)に変換し、補正振幅値s
(m)を振幅とする音声スペクトルを再生し、これを逆
離散的フーリエ変換により逆変換して得られた波形を出
力するように構成する。
[産業上の利用分野コ 本発明は、入力音声信号のピッチ周期またはその倍数の
窓長をもつ離散的フーリエ変換(DFT)により入力音
声信号の音声スペクトルを求めながら符号化する音声符
号化方式に関する。
近年、音声信号に離散的フーリエ変換を施すことにより
、時間信号としての音声を周波数領域のスペクトル情報
に変換して、このスペクトル情報を伝送路へ送出し、更
に受信側では、このスペクトル情報に逆離散的フーリエ
変換(IDFT)を施して元の時間領域の音声に戻す方
式のものが提案されている。
ところで、伝送されてくる音声信号には、量子化等に伴
う雑音成分が混入しているので、この雑音による影響を
少なくして、雑音感を軽減する必要がある。
[従来の技術] 第4図は従来の雑音感軽減対策を施された音声符号化方
式を示すブロック図であるが、この第4図において、1
01はピッチ抽出部で、このピッチ抽出部101は、入
力音声信号のピッチ周期Tを抽出するものである。
102は離散的フーリエ変換器で、この離散的フーリエ
変換器102は、入力音声信号について、そのピッチ周
期Tまたはその倍数の窓長をもつ離散的フーリエ変換を
施すことにより、この入力音声信号の離散的な音声スペ
クトルを求めるものである。
103は量子化器で、この量子化器103は、離散的フ
ーリエ変換器102で得られた音声スペクトルを量子化
し更には符号化して伝送路104へ送るものである。
なお、伝送路104へは、量子化し符号化した音声スペ
クトル情報のほか、ピッチ周期情報も送られる。
105は逆量子化器で、この逆量子化器105は、伝送
路104を通じて送られてきた量子化され符号化された
音声スペクトル情報を復号化および逆量子化して、元の
離散的な音声スペクトルに戻すもので、この逆量子化器
105としては、例えばROMが使用される。
1、06は逆離散的フーリエ変換器で、この逆離散的フ
ーリエ変換器106は、離散的な音声スペクトルについ
て、入力音声信号のピッチ周期Tまたはその倍数の窓長
をもつ逆離散的フーリエ変換を施すことにより、元の時
間領域の音声信号に戻すものである。
107はポストフィルタで、このポストフィルタ107
は、第5図に示すように、人間の聴覚が信号電力の小さ
い周波数部分はど雑音に敏感であることを考慮して、信
号電力が大きいとゲインも大きくなり信号電力が小さい
とゲインも小さくなるようなフィルタ特性を有するフィ
ルタである。
なお、ピッチ抽出部101.離散的フーリエ変換器10
2.量子化器103は、送信側に設けられ、逆量子化器
105.逆離散的フーリエ変換器106、ポストフィル
タ107は、受信側に設けられる。
このような構成により、入力音声信号は、離散的フーリ
エ変換器102で、入力音声信号のピッチ周期Tまたは
その倍数の窓長をもつ離散的フーリエ変換を施されて、
離散的な音声スペクトルとして出力され、更に量子化器
103で、量子化され符号化されてから、伝送路104
へ送られる。
さらに、受信側では、逆量子化器105で、伝送路10
4を通じて送られてきた量子化され符号化された音声ス
ペクトル情報が復号化および逆量子化されて1元の離散
的な音声スペクトルに戻されてから、更に逆離散的フー
リエ変換器106で、元の時間領域の音声信号に戻され
る。
そして、その後は、ポストフィルタ107で、信号が有
る周波数部分の出力を大きくし、信号の無い周波数部分
を小さくして出力する。これにより、雑音を知覚されに
<<シて、雑音感を軽減するのである。
[発明が解決しようとする課題] しかしながら、このような従来の手段では、雑音感を軽
減するために、逆フーリエ変換器の後にポストフィルタ
を外付けしなければならないという問題点がある。
本発明は、このような問題点に鑑みてなされたもので、
外部回路としてポストフィルタを設けなくても、雑音感
を軽減できるようにした、音声符号化方式を提供するこ
とを目的とする。
[課題を解決するための手段] 第工図は本発明の原理ブロック図である。
この第1図において、1はピッチ抽出部で、このピッチ
抽出部1は、入力音声信号のピッチ周期Tを抽出するも
のである。
2は離散的フーリエ変換器で、この離散的フーリエ変換
器2は、入力音声信号について、そのピッチ周期Tまた
はその倍数の窓長をもつ離散的フーリエ変換を施すこと
により、この入力音声信号の離散的な音声スペクトルを
求めるものである。
3は量子化器で、この量子化器3は、Hf1il的フー
リエ変換器2で得られた離散的な音声スペクトルを量子
化し符号化して伝送路4へ送るものである。
なお、伝送路4へは、量子化され符号化された音声スペ
クトル情報のほか、ピッチ周期情報も送られる。
5は逆量子化器で、この逆量子化器5は、伝送路4を通
じて送られてきた量子化され符号化された音声スペクト
ル情報を復号化および逆量子化して、元の離散的な音声
スペクトルに戻すものである。
7は変換手段で、この変換手段7は、音声スペクトルの
各周波数成分について、第m(mは0゜1.2.・・)
番目の周波数成分の振幅値r(m)を。
この振幅値r(−)に対し所要の関数関係にある補正振
幅値5(−)に変換し、この補正振幅値s (m)を振
幅とする音声スペクトルに変換して出力するものである
ここで、上記の関数関係としては、振幅値r(m)が小
さい程、振幅値の比s(m)/r(m)も小さくなるよ
うな関数関係が選択される。
また、この振幅値r(m)から補正振幅値s(m)への
変換手段7を、振幅値r(m)に対応する補正振幅値s
(m)を記憶する記憶手段で構成することができる。
6は逆離散的フーリエ変換器で、この逆離散的フーリエ
変換器6は、変換手段7からの離散的な補正音声スペク
トルについて、入力音声信号のピッチ周期Tまたはその
倍数の窓長をもつ逆離散的フーリエ変換を施すことによ
り、元の時間領域の音声信号に戻すものである。
なお、ピッチ抽出部1il的フーリエ変換器2換器子化
器3は、送信側に設けられ、逆量子化器5.変換手段7
.逆離散的フーリエ変換器6は、受信側に設けられる。
[作 用コ 上述の本発明の音声符号化方式では、入力音声信号は、
離散的フーリエ変換器2で、入力音声信号のピッチ周期
Tまたはその倍数の窓長をもつ離散的フーリエ変換を施
されて、離散的な音声スペクトルとして出力され、更に
量子化器3で、量子化され符号化されてから、伝送路4
へ送られる。
さらに、受信側では、逆量子化器5で、伝送路4を通じ
て送られてきた量子化され符号化された音声スペクトル
情報が復号化および逆量子化されて1元の離散的な音声
スペクトルに戻されてから。
変換手段7で、この音声スペクトルの各周波数成分につ
いて、第m番目の周波数成分の振幅値r(m)が、この
振幅値r(m)に対し所要の関数関係にある補正振幅値
s (+=)に変換され、この補正振幅値s (m)を
振幅とする音声スペクトルに変換されてから、更に逆離
散的フーリエ変換器6で、時間領域の音声信号に戻され
る。
[実施例] 以下、図面を参照して本発明の詳細な説明する。
第2図は本発明の一実施例を示すブロック図で、この第
2図に示す実施例では、送信側に、ピッチ抽出部1.W
l散的フーリエ変換器2.量子化器3が設けられるとと
もに、受信側に、逆量子化器5゜変換手段としてのスペ
クトル補正部7.逆離散的フーリエ変換器6が設けられ
ている。
ここで、ピッチ抽出部1は、入力音声信号のピッチ周期
Tを抽出するもので、離散的フーリエ変換器2は、入力
音声信号について、そのピッチ周期Tまたはその倍数の
窓長をもつ離散的フーリエ変換を施すことにより、この
入力音声信号の離散的な音声スペクトルを求めるもので
あるが、この離散的フーリエ変換器2では、スペクトル
の最大振幅値(正規化係数) R+waxで正規化した
スペクトルR(m)exp(ie(m))と正規化係数
Rmaxとが出力されるようになっている。なお、この
正規化したスペクトルは、R(i+)と8 (m)とで
規定されるベクトル情報である。
量子化器3は、離散的フーリエ変換器2で得られた音声
スペクトルR(m) exp (i 8(m) )およ
び正規化係数Rmaxを量子化し符号化して伝送路4へ
送るものである。
なお、伝送路4へは、量子化され符号化され音声スペク
トル情報のほか、ピッチ周期情報も送られる。
また、逆量子化器5は、伝送路4を通じて送られてきた
量子化され符号化された音声スペクトル情報を逆量子化
して、再生正規化音声スペクトルr(■)exp(ie
(鵬))と正規化係数(rmax)とを得るものである
。なお、このときの、再生音声スペクトルは、再生正規
化音声スペクトルに再生音声スペクトルの最大振幅値(
正規化係数) (rmax)をかけたもの(rmax)
r(m)exp(ie(鵬))となる。
スペクトル補正部7は、離散的な音声スペクトルr(m
)exp(ie(m))の各周波数成分にライて、第m
 (mは0,1,2.  ・・)番目の周波数成分の振
幅値r(m)を、この振幅値r(■)に対し所要の関数
関係にある補正振幅値s(m)に変換し、この補正振幅
値5(−)を振幅とする再生正規化補正音声スペクトル
s(m)exp(ie(m))に変換するものである。
なお、このときの、再生補正音声スペクトルは、再生正
規化補正音声スペクトルに再生音声スペクトルの最大振
幅値(正規化係数) (r+1ax)をかけたもの(r
max)s (m)exp (ie(m))となる。
ここで、スペクトルr(m)exp(iBm))はr(
−)とe (m)、スペクトルs(m)exp(it(
m))はs(+w)と#(m)とで規定されるベクトル
情報である。
さらに、上記の関数関係としては、振幅値r (+a)
が小さい程、振幅値の比s(+)/r(m)も小さくな
るような関数関係、即ちXを変数とした場合、Xが小さ
い程、f(x)/xも小さくなるような関数関係、例え
ばf(x)=x”が選択される。なお、上記の関数関係
としては、振幅値r(−)が小さい程、振幅値の比s 
(m) / r (m)も小さくなるような関数関係で
あればよく、従って、f (x)=x”なる関数関係に
限定されるものではない。
これにより、振幅値r (m)の特性が第3図(a)の
ようであったとすると、振幅値s(+n)の特性として
、第3図(b)に示すように、振幅の小さい周波数成分
をより小さくすることができる。
また、この実施例では、逆量子化器5およびスペクトル
補正部7は、工つのROMで構成されており、量子化値
r(m)exp(it(m))の代わりに、直接補正量
子化値s (ga)exp (i t (m) )を得
ることができるようになっている。従って、これに正規
化係数を掛ければ、補正された再生音声スペクトル(r
max)s(m)exp(ie(■))が得られる。
6は逆離散的フーリエ変換器で、この逆離散的フーリエ
変換器6は、再生補正音声スペクトル(rmax)s(
m)exp(io(−))について、入力音声信号のピ
ッチ周期Tまたはその倍数の窓長をもつ逆離散的フーリ
エ変換を施すことにより、元の時間領域の音声信号に戻
すものである。
上述の構成により、入力音声信号は、離散的フーリエ変
換器2で、入力音声信号のピッチ周期Tまたはその倍数
の窓長をもつ離散的フーリエ変換を施されて、離散的な
音声スペクトルとして出力され、更に量子化器3で、量
子化され符号化されてから、伝送路4へ送られる。
さらに、受信側では、逆量子化器5で、伝送路4を通じ
て送られてきた量子化され符号化された音声スペクトル
情報が復号化および逆量子化されて、元の離散的な音声
スペクトルに戻されてから、スペクトル補正部7で、こ
の音声スペクトルの各周波数成分について、第m番目の
周波数成分の振幅値r (+a)が、この振幅値r(■
)に対し所要の関数関係にある補正振幅値5(−)に変
換され、この補正振幅値s (m)を振幅とする再生補
正音声スペクトルに変換されるが、この実施例では、逆
量子化器5およびスペクトル補正部7が、1つのROM
で構成されているので、補正量子化値s (m)exp
 (i 6 (m) )、ひいてはを補正再生音声スペ
クトル(rIIax)s(wI)exp(io(m))
が直接出力される。
その後は、逆離散的フーリエ変換器6で、この離散的な
補正再生音声スペクトルから時間領域の音声信号に戻さ
れる。
このように、スペクトルの段階で、振幅値r (m)に
対し所要の関数関係をもつ振幅値s(m)に変換し、こ
の補正振幅値s(m)を振幅とする再生補正音声スペク
トルを用いて、逆離散的フーリエ変換を施すことが行な
われるので、外部回路としてポストフィルタを設けなく
ても、雑音感を十分に軽減することができる。
なお、逆量子化器5およびスペクトル補正部7をそれぞ
れ別個のROMで構成してもよい。
ここで、逆量子化器5およびスペクトル補正部7を1つ
のROMで構成した場合でも、逆量子化器5およびスペ
クトル補正部7をそれぞれ別個のROMで構成した場合
でも、スペクトル補正部7は、振幅値r(m)に対応す
る補正振幅値5(Ill)を記憶する記憶手段で構成さ
れていることになる。
[発明の効果] 以上詳述したように、本発明の音声符号化方式(請求項
1〜3)によれば、スペクトルの段階で。
振幅値r(m)に対し所要の関数関係をもつ振幅値S(
鵬)に変換し、この補正振幅値s (+)を振幅とする
再生補正音声スペクトルを用いて、逆離散的フーリエ変
換を施すことが行なわれるので、外部回路としてポスト
フィルタを設けなくても、雑音感を十分に軽減できる利
点がある。
【図面の簡単な説明】
第1図は本発明の原理ブロック図、 第2図は本発明の一実施例を示すブロック図、第3図(
a)は振幅値r(m)の特性例を示す図。 第3図(b)は振幅値s(m)の特性例を示す図、第4
図は従来例を示すブロック図、 第5図はポストフィルタのフィルタ特性を説明する図で
ある。 図において、 lはピッチ抽出部、 2は離散的フーリエ変換器、 3は量子化器。 4は伝送路。 5は逆量子化器、 6は逆離散的フーリエ変換器、 7はスペクトル補正部(変換手段) 101はピッチ抽出部、 102は離散的フーリエ変換器、 103は量子化器、 104は伝送路、 105は逆量子化器、 106は逆離散的フーリエ変換器、 107はポストフィルタである。

Claims (3)

    【特許請求の範囲】
  1. (1)入力音声信号のピッチ周期またはその倍数の窓長
    をもつ離散的フーリエ変換により該入力音声信号の音声
    スペクトルを求めながら符号化する音声符号化方式にお
    いて、 該音声スペクトルの各周波数成分について、第m番目の
    周波数成分の振幅値r(m)を、該振幅値r(m)に対
    し所要の関数関係にある補正振幅値s(m)に変換し、
    該補正振幅値s(m)を振幅とする音声スペクトルを再
    生し、これを逆離散的フーリエ変換により逆変換して得
    られた波形を出力することを特徴とする、音声符号化方
    式。
  2. (2)該関数関係として、該振幅値r(m)が小さい程
    、振幅値の比s(m)/r(m)も小さくなるような関
    数関係が選択される請求項1記載の音声符号化方式。
  3. (3)該振幅値r(m)から該補正振幅値s(m)への
    変換手段(7)が、該振幅値r(m)に対応する該補正
    振幅値s(m)を記憶する記憶手段で構成された請求項
    1記載の音声符号化方式。
JP1323423A 1989-12-13 1989-12-13 音声符号化方式 Pending JPH03182800A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1323423A JPH03182800A (ja) 1989-12-13 1989-12-13 音声符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1323423A JPH03182800A (ja) 1989-12-13 1989-12-13 音声符号化方式

Publications (1)

Publication Number Publication Date
JPH03182800A true JPH03182800A (ja) 1991-08-08

Family

ID=18154521

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1323423A Pending JPH03182800A (ja) 1989-12-13 1989-12-13 音声符号化方式

Country Status (1)

Country Link
JP (1) JPH03182800A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005284301A (ja) * 2005-04-22 2005-10-13 Sony Corp 復号方法及び装置、並びにプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005284301A (ja) * 2005-04-22 2005-10-13 Sony Corp 復号方法及び装置、並びにプログラム

Similar Documents

Publication Publication Date Title
US9111532B2 (en) Methods and systems for perceptual spectral decoding
EP0814458B1 (en) Improvements in or relating to speech coding
JP3765622B2 (ja) オーディオ符号化復号化システム
JPS6035799A (ja) 人間の音声エンコード装置及び方法
JP2002041097A (ja) 符号化方法、復号化方法、符号化器、及び復号化器
US20080164942A1 (en) Audio data processing apparatus, terminal, and method of audio data processing
WO1995014990A1 (fr) Procede et appareil de codage/decodage d'un signal et support d'enregistrement
JP2002041099A5 (ja)
JP3353868B2 (ja) 音響信号変換符号化方法および復号化方法
US7099823B2 (en) Coded voice signal format converting apparatus
JPH09127995A (ja) 信号復号化方法及び信号復号化装置
JPH03182800A (ja) 音声符号化方式
JP3230791B2 (ja) 広帯域音声信号復元方法
JP3186013B2 (ja) 音響信号変換符号化方法及びその復号化方法
JP3111459B2 (ja) 音声データの高能率符号化方法
Westwater Digital audio presentation and compression
JP2004361604A (ja) 音声入力装置および音声認識処理システム
US6606591B1 (en) Speech coding employing hybrid linear prediction coding
KR960003626B1 (ko) 변환 부호화된 오디오 신호의 난청자용 복호화 방법
JPS6367400B2 (ja)
JP2000244325A (ja) Mpegオーディオの復号化方法
JPS60239129A (ja) 音声情報量圧縮方法
JPH11109995A (ja) 音響信号符号化器
JPH03144600A (ja) 音声復号器
JPH07111462A (ja) 音声圧縮方法および装置