JPH0876793A - 音声符号化装置及び音声符号化方法 - Google Patents

音声符号化装置及び音声符号化方法

Info

Publication number
JPH0876793A
JPH0876793A JP6209528A JP20952894A JPH0876793A JP H0876793 A JPH0876793 A JP H0876793A JP 6209528 A JP6209528 A JP 6209528A JP 20952894 A JP20952894 A JP 20952894A JP H0876793 A JPH0876793 A JP H0876793A
Authority
JP
Japan
Prior art keywords
pitch
input signal
signal
gain
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6209528A
Other languages
English (en)
Other versions
JP3468862B2 (ja
Inventor
Masahiro Oshikiri
正浩 押切
Kimio Miseki
公生 三関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP20952894A priority Critical patent/JP3468862B2/ja
Publication of JPH0876793A publication Critical patent/JPH0876793A/ja
Application granted granted Critical
Publication of JP3468862B2 publication Critical patent/JP3468862B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】符号化過程でピッチ情報が損われても、復号化
器側で十分なピッチ情報が得られ、主観品質が向上する
音声符号化装置を提供する。 【構成】入力信号からピッチ周期T及びピッチゲインg
を求めるピッチ分析手段と、ピッチ周期Tとピッチゲイ
ンgを用いて入力信号のピッチを強調するピッチ強調手
段と、ピッチ強調された信号を用いて符号化を行う符号
化手段を有する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声の符号化装置及び
方法に関する。
【0002】
【従来の技術】音声信号を低ビットレートで高能率に符
号化する技術は、自動車電話などの移動体通信や、企業
内通信において、電波の有効利用や通信コストの削減の
ための重要な技術である。8kbps以下のビットレー
トで品質の優れた音声合成が可能な音声符号化方式とし
て、CELP(Code Excited Linea
r Prediction)方式が知られている。
【0003】このCELP方式は、AT&Tベル研の
M.R.Schroeder氏とB.S.Atal氏に
より「Code−Excited Linear Pr
ediction(CELP)”High−Quali
ty Speech at Very Low Bit
Rates”Proc.ICASSP;1985,p
p.937−939」(文献1)で発表されて以来、高
品質の音声が合成できる方式として注目され、品質の改
善や計算量の削減等について、種々の検討がなされてき
た。CELP方式の特徴は、LPC(Linear P
redictive Coding:線形予測係数)合
成フィルタの駆動信号を駆動信号ベクトルとしてコード
ブックに格納し、入力音声信号に対する合成音声信号の
誤差を評価しながら最適な駆動信号ベクトルをコードブ
ックから探索する点にある。このCELP方式は、入力
音声信号に対する合成信号の誤差が最小になるような最
適の駆動信号ベクトルを求めているので、符号化ビット
レートが8kbps程度の低レートでも高品質の音声を
合成することができる。しかし、8kbps以下のさら
に低いビットレートになると合成音声の品質劣化が知覚
され、まだ不十分である。
【0004】この原因は主に、ビットレートが低いため
駆動信号に割り当てられる量子化ビット数が少なくなっ
てしまい、これによりピッチ周期の変動やピッチ波形の
変化を表すことが困難になるためである。
【0005】CELP符号化では適応コードブックとい
うピッチ情報を効率よく表す駆動信号モデルと雑音コー
ドブックという雑音成分を効率よく表す駆動信号モデル
の組み合わせで最終的な駆動信号を表現している。符号
化ビットレートを低くする場合、駆動信号分析単位であ
るサブフレーム長を長くする手法が用いられるが、この
ときサブフレーム内のピッチ周期の変動やピッチ波形の
変動がサブフレーム長が短い場合に比べ大きくなってし
まい、それが原因で適応コードブックが効率よく機能し
なくなり、結果としてピッチ情報が損なわれた合成音声
しか得ることができなかった。
【0006】このような問題に対し従来は、復号化器の
出力側にポストフィルタを縦属接続し、合成音声のピッ
チ強調を行い品質改善を図っていた。しかし、復号化器
側でピッチ強調を行っても、すでに符号化過程でピッチ
情報が大きく損なわれており、いくらポストフィルタで
ピッチ強調を行おうとしても、ピッチ情報の回復の度合
いにはおのずと限界があり、主観的な劣化は依然残って
いた。
【0007】
【発明が解決しようとする課題】上述したように、従来
のCELP符号化においては、符号化ビットレートを下
げると駆動信号に割り当てられる量子化ビット数が少な
くなり、ピッチ周期の変動やピッチ波形の変化を表すこ
とが困難になってしまう。また、符号化過程でピッチ情
報が大きく損なわれているため、復号側でポストフィル
タによるピッチ情報の回復処理を行っても回復の度合い
にも限界がある。
【0008】本願発明はこの問題を解決するためなされ
たもので、その目的は、復号化側で満足できる合成音声
品質を得るために、符号化側で十分なピッチ情報を得る
ことができるようにすることにある。
【0009】
【課題を解決するための手段】すなわち本発明は、入力
信号を分析しピッチ周期とピッチゲインを獲得し、得ら
れたピッチ周期及びピッチゲインを用いて入力信号を強
調した後、符号化処理を行うものである。つまり、符号
化処理の前処理に、入力信号の上記ピッチ分析と、分析
に基づくピッチ強調を行う手段を接続して成ることを特
徴とするものである。
【0010】
【作用】このように本発明においては、符号化側で十分
なピッチ情報を得ることができるようにするために、符
号化する前にあらかじめ入力信号を用いてピッチ分析を
行い、そこで得られるピッチ周期及びピッチゲインを用
いて入力信号のピッチを強調した後に符号化処理を用い
て符号化を行うことで、CELP符号化における適応コ
ードブックのようなピッチ情報を表現する機能を有する
部分で十分にピッチ情報を抽出することが可能となり、
結果として合成音声の主観品質が向上することになる。
【0011】
【実施例】以下、図面を参照しながら本発明の一実施例
を説明する。図1は、本発明の第1の実施例に係る音声
符号化装置の構成を示すブロック図である。
【0012】入力端子1から入力される入力信号a
(n)に対し、ピッチ強調部100において、入力信号
a(n)がピッチ強調された後、符号化部200におい
て符号化の処理を行われ出力端子300から送信される
ものである。つまり、本実施は符号化処理の前処理にお
いて、入力信号のピッチ分析と、分析に基づくピッチ強
調を行うピッチ強調部100を接続して成ることを特徴
とするものである。
【0013】ピッチ強調部100は、図2に記載したよ
うにピッチ分析演算部101及びピッチ強調演算部10
2から成る。なお、ピッチ強調部100の処理の内容は
図4を用いて説明する。入力信号a(n)がピッチ分析
演算部101に順次入力され、ピッチ分析演算部101
ではある分析間隔でピッチ分析を行いピッチ周期Tとピ
ッチゲインgを出力する。音声の定常性や計算量を考慮
に入れると、分析間隔として5ms〜10msが適当で
ある。
【0014】ピッチ分析演算部101では、時間Tサン
プルだけ過去の信号a(n−T)を用いてa(n)を予
測し、その予測誤差信号のパワーが最小となるときのT
をピッチ周期として出力する。すなわち、予測誤差信号
パワーEは、
【0015】
【数1】 と表される。ここで、gはピッチゲインを表し、Nはピ
ッチ分析長を表す。安定したピッチ周期及びピッチゲイ
ンを得るために、N=40〜256が適当である。
(1)式をgで偏微分し、その値が0になるときに予測
誤差信号パワーEが最小値をとる。これを解くと、
【0016】
【数2】 となり、(2)式を最小とするTがピッチ周期を表すこ
とになる。(2)式右辺の第1項は定数を表すので、実
際は第2項が最大となるTを探索することになる。この
とき、ピッチゲインgは、
【0017】
【数3】 と表わされる。また、入力信号a(n)が広義定常性を
仮定できる場合、(2)式右辺第2項及び(3)式右辺
の分母を、
【0018】
【数4】 と表すことができ、この値をピッチ周期Tの探索ループ
の外で求めておけば計算量を削減することができる。こ
のようにして、ピッチ分析演算部101ではピッチ周期
T及びピッチゲインgを求めることができる(ステップ
10)。
【0019】この実施例では、1次のピッチ予測フィル
タを用いてピッチ周期及びピッチゲインを求める方法を
説明したが、より次数の高い予測フィルタを用いても構
わない。また別のピッチ分析手段、例えば零交差係数
法、自己相関法及びケプストラム法などを用いて実現す
ることも可能である。
【0020】次にピッチ強調演算部102の説明を行
う。ピッチ強調演算部102では、ピッチ分析演算部1
01で求めたピッチ周期T及びピッチゲインgを用いて
入力信号a(n)をピッチ強調する。ここでは、極型ピ
ッチフィルタを用いたときの説明を行う。極型ピッチフ
ィルタの伝達関数は、
【0021】
【数5】 と表すことができる。ここでA(z)は入力信号a
(n)のz変換値、B(z)は出力信号b(n)のz変
換値、Gはゲイン、gはピッチゲインを表す。そして、
εは0以上1未満の定数であり、ε=0.8が推奨値で
ある。また発振フィルタとなるのを回避するために、g
とεの積が常に1未満となるよう監視する必要がある。
例えば、gとεの積が0.8を越えるような場合、gと
εの積を強制的に0.8に抑えるなどの例外処理をつけ
加える必要がある。(5)式を時間領域で表すと、
【0022】
【数6】 となる。(6)式に従えば、入力信号a(n)をピッチ
強調した信号b(n)を得ることができる(ステップ2
0)。
【0023】ここでは1次のピッチ強調フィルタを用い
て説明を行ったが、必ずしも1次である必要はなく、ピ
ッチ分析演算部101の分析次数と同じ次数のピッチ強
調フィルタを用いればよい。また、ここでは極型ピッチ
フィルタを用いた場合について説明を行ったが、例えば
零型ピッチフィルタ、極零型ピッチフィルタなどを用い
ることも当然可能である。
【0024】このようにして、ピッチ強調された信号b
(n)を生成することができ、この信号を符号化部20
0に与え符号化処理を行う。そして、符号化部200で
符号化した結果得られるインデックス情報は、出力端子
300より出力される。
【0025】符号化部200は、図3のブロック図に記
載されているようなCELP方式による構成を採ること
ができる。同図において入力信号a(n)をピッチ強調
部100でピッチ強調された信号b(n)は入力端子2
01からフレーム単位で入力される。フレームはL個の
信号サンプルからなり、サンプリング周波数が8kHz
の場合、一般にL=160が用いられる。なお、駆動信
号ベクトルに先立ち、ピッチ強調された信号系列b
(n)に対してLPC分析部215でLPC分析が行わ
れ求めたLPC係数をLPC量子化部216で量子化
し、量子化されたLPC係数αi {αi ,i=1,2,
…,P}とインデックス(番号)が抽出される。このL
PC係数αi は、LPC合成フィルタ213に供給され
る。なお、Pは予測次数であり、一般にP=10が用い
られている。LPC合成フィルタ213の伝達関数は
(7)式で与えられる。
【0026】
【数7】
【0027】次に、音声信号を合成しながら最適な駆動
信号ベクトルを探索する過程について説明する。まず、
入力端子201に入力された1フレームの音声信号か
ら、減算器202で前フレームでの合成フィルタ213
の内部状態が現フレームに与える影響が減算される。減
算器202から得られた信号系列は4個のサブフレーム
に分割され、各サブフレームの目標信号ベクトルとな
る。
【0028】LPC合成フィルタ213の入力信号であ
る駆動信号ベクトルは、適応コードブック207から選
択された適応ベクトルに乗算器209でゲインコードブ
ック217から得られる所定のゲインを乗算したもの
と、白色雑音コードブック208から選択された雑音ベ
クトルに乗算器210でゲインコードブック218から
得られる所定のゲインを乗算したものとを加算器212
で加算することで得られる。
【0029】ここで適応コードブック207は文献1に
記載されているピッチ予測分析を閉ループ動作または合
成による分析(Analysis by Synthe
sis)によって行うものであり、詳細は「W.B.K
leijin D.J.Krasinski and
R.H.Ketchum,”Improved Spe
ech Quality and Efficient
Vector Quantization in C
ELP”,Proc.ICASSP,1988,pp.
155−158」(文献2)に述べられている。この文
献2によると、LPC合成フィルタ213の駆動信号を
ピッチ探索範囲a〜b(a,bは駆動ベクトルのサンプ
ル番号であり、通常、a=20、b=147)にわたっ
て遅延回路211で1サンプルずつ遅延させることによ
り、a〜bサンプルのピッチ周期に対する適応ベクトル
が作成され、これがコードワードとして適応コードブッ
ク207に格納される。
【0030】最適な適応ベクトルの探索を行う場合、適
応コードブック207から各ピッチ周期に対応する適応
ベクトルのコードワードが1個ずつ読み出され、乗算器
209でゲインコードブック217から得られる所定の
ゲインと乗算される。そして、LPC合成フィルタ21
3によりフィルタ演算が行われ、合成信号ベクトルが生
成される。生成された合成信号ベクトルは、減算器20
3で目標ベクトルと減算される。この減算器203の出
力は聴感重みフィルタ付けフィルタ204を経て誤差計
算回路205に入力され、平均2乗誤差が求められる。
平均2乗誤差の情報はさらに最小歪探索回路206に入
力され、その最小値が検出される。
【0031】以上の過程は、適応コードブック207中
の全ての適応ベクトルの候補について行われ、最小歪探
索回路206において平均2乗誤差の最小値を与える候
補のインデックスが求められる。また、乗算器209で
乗じられるゲインのインデックスも平均2乗誤差が最小
になるよう決定される。
【0032】以上の過程より求めた適応ベクトルにゲイ
ンを乗じ、LPC合成フィルタ213でのフィルタ演算
を経て合成音声信号ベクトルを生成し、このベクトルを
目標ベクトルから減じた結果得られる信号を残音ベクト
ル探索時の目標信号とする。次に、同様な方法で最適な
雑音ベクトルの探索が行われる。すなわち、雑音コード
ブック208から雑音ベクトルのコードワードが1個ず
つ読み出され、乗算器210でのゲインコードブック2
18から得られるゲインとの乗算、LPC合成フィルタ
213でのフィルタ演算を経て、合成音声信号ベクトル
の生成、目標ベクトルとの平均2乗誤差の計算が全ての
雑音ベクトルについて行われる。そして、平均2乗誤差
の最小値を与える雑音ベクトルのインデックスおよびゲ
インのインデックスが求められる。このようにして、決
定された適応コードブック207,208のインデック
ス、LPC量子化部216で得られたLPC係数αi
{αi ,i=1,2,…,P}のインデックス及び上述
の乗算器209,210に入力されるゲインのインデッ
クスを各々インデックス選択部214から送信される。
なお、聴感重み付けフィルタ204は減算器203から
出力される誤差信号のスペクトルを整形して、人間の耳
に知覚される歪を低減するために用いられる。
【0033】以上のように、入力信号はピッチを強調さ
れるため、適応コードブックというピッチ情報を表す駆
動信号モデルによく適合するようになる。そのため適応
コードブックの符号化効率が向上し、合成音声の主観品
質が向上すると説明できる。
【0034】なお、符号化手段としてはCELP方式に
限定されるわけではなく、その他の符号化手段も当然適
用可能である。図10はCELP方式による音声復号化
部のブロック図である。符号化部から伝送される適応ベ
クトルのインデックスを用いて適応コードブック401
から適応ベクトルを取り出し、符号化器から伝送される
インデックスをもとにゲインコードブック410からゲ
インを復号し、前記適応ベクトルと前記ゲインとを乗算
器402で乗算を行う。同様にして、雑音コードブック
407から雑音ベクトルを取り出し、ゲインコードブッ
ク411から復号されたゲインと乗算器409で乗算を
行う。
【0035】次に、これらベクトルを加算器403で加
算を行い駆動ベクトルを生成し、前記駆動ベクトルを符
号化器から伝送されるLPC係数を用いて設定されるL
PC合成フィルタ404に通し、合成信号を生成する。
さらに、合成信号の主観品質を向上させるため、ポスト
フィルタ405に合成信号を通過させて合成音声を得
て、出力端子406より出力する。最後に、次の処理に
備えて駆動信号を1サンプルづつ遅延させて適応コード
ブック401に格納する。
【0036】また、第1の実施例ではピッチ強調された
信号b(n)を用いてLPC分析を符号部200内で行
っていたが、入力信号a(n)を用いてLPC分析を行
ってもよい。この場合、図17に示すように符号化部2
00には、ピッチ強調された信号b(n)と共に入力信
号a(n)が入力されることになる。
【0037】そして、図18に示すように、入力信号a
(n)を用いてLPC分析を行っており、この点で図3
と異なる。この例の利点を図6、図7及び図8、図9を
用いて説明する。図6は入力信号のスペクトル、図7は
入力信号のスペクトル包絡及びスペクトル微細構造を表
し、図8は入力信号をピッチ強調したときのスペクト
ル、図9は入力信号をピッチ強調したときのスペクトル
包絡及びスペクトル微細構造を表している。
【0038】一般に音声の短時間スペクトルは、音韻情
報を表すスペクトル包絡とピッチ情報を表すスペクトル
微細構造の積とみなすことができる。LPC係数はスペ
クトル包絡を表しており、第1の実施例のようにピッチ
強調をした信号b(n)に対してLPC分析を行うと図
9に示すようにスペクトル微細構造が強調されてしま
い、音声の短時間スペクトル(図8)がスペクトル微細
構造に大きく影響を受けてしまうことがある。このた
め、図9に示すようにピッチ強調された信号からは正確
なLPC係数を抽出することが困難となる場合があり、
主観品質劣化の原因となる。
【0039】これに対し、本実施例では、ピッチ強調さ
れる前の入力信号a(n)を用いてLPC分析を行うた
め、図6の入力信号の短時間スペクトルは図7のスペク
トル微細構造に影響を受けにくく、図5に示すようにほ
ぼ正確なスペクトル包絡を表すLPC係数を抽出するこ
とができる。
【0040】次に、図5は本発明の第2の実施例に係る
音声符合化装置である。ただし、図5で第1実施例と同
じ名称をもつものは図1のものと同じ機能を有するもの
とする。
【0041】本実施例と第1の実施例との違いは、入力
信号a(n)をノイズキャンセラ400に通した結果得
られる信号c(n)を用いてピッチ分析及びピッチ強調
を行う点にある。本実施例では、入力信号a(n)をノ
イズキャンセラに通すことで背景雑音を減衰させ、ピッ
チ分析部で得られるピッチ周期及びピッチゲインをより
正確に求めることができる。また、前述したようにほぼ
正確なスペクトル概形を表す、LPC係数を抽出するた
め、図19に示すように、ノイズキャンセラ400を通
して得られる信号c(n)を用いてLPC分析を行うこ
とができる。
【0042】次に、図11を用いて本発明の第3の実施
例に係る音声符合化装置の説明を行う。なお、図11で
図1と同じ番号を付したものは図1のものと同じ機能を
有すると定義し、ここでは説明を省略する。
【0043】本実施例と第1の実施例との違いは、入力
信号のピッチを強調したものを符号化するが入力信号を
そのまま符号化するかの判定を、判定部500において
入力信号a(n)から判定する点にある。判定部500
において判定された結果に基づいて、判定部500は切
替部510に対し指示する。上記実施例のようにあらゆ
る入力信号のピッチを強調するとき、ピッチ情報があま
り含まれていない入力信号が与えられてもピッチゲイン
gが0になる場合はほとんどなく、何らかのピッチ周期
Tで強調されていしまう。その結果、入力信号に余計な
強調が施されるため、主観品質が低下することがある。
また、背景雑音が混在した入力信号が与えられた場合、
背景雑音の影響で音声のピッチ周期Tとは異なるピッチ
周期T′で信号が強調されることがある。このため、主
観品質が低下してしまう。この問題は、混在する背景雑
音の周期性が高い場合、さらに深刻になる。この問題を
考慮して、以下の実施例ではあらゆる入力信号のピッチ
を強調するのではなく、ある判定条件を設けてその条件
が満足されたときピッチ強調を行うよう構成されてい
る。このため、上記問題を回避することができる。判定
基準として、無音部や無声部のように入力信号にピッチ
情報がそれほど含まれていない場合にはピッチ強調を行
わず、有声部のようにピッチ情報が多く含まれている場
合にはピッチ強調を行うようにする。また、他の判定基
準として、背景雑音のパワーが大きいときにピッチ強調
を行わず、背景雑音パワーが小さいときにピッチ強調を
行う方法もある。さらに、周期性背景雑音が入力信号に
混在する場合にピッチ強調を行わず、非周期背景雑音が
入力信号に混在している場合にピッチ強調を行う方法も
ある。以下に、図11における判定部500の3種の動
作を図13乃至図15を用いて説明する。
【0044】まず、符合化部500の第1の実施例を図
13を用いて説明する。この例の判定基準として、背景
雑音のパワーか大きいときにピッチ強調を行わず、背景
雑音パワーが小さいときにピッチ強調を行う方法であ
る。
【0045】入力信号(ブロック)a(n)を入力し
(ステップ600)、入力信号の背景雑音のパワーを分
析する(ステップ601)。さらに、ステップ602で
は、背景雑音のパワーのしきい値Sによって、入力信号
のピッチを強調したピッチ強調信号b(n)を符号化す
るか(ステップ603)、入力信号a(n)をそのまま
符号化するかの判定を行う。すなわち、背景雑音のパワ
ーがしきい値S(例えば、20dBが好ましい)より大
きい場合は、入力信号a(n)をそのまま符号化するよ
う切替部510に指示する。背景雑音のパワーがしきい
値Sより小さい場合は、入力信号のピッチを強調したピ
ッチ強調信号b(n)を符号化するよう切替部510に
指示する。ピッチ強調信号b(n)を符号化するか、入
力信号a(n)をそのまま符号化するかをしきい値によ
って判定する理由は、背景雑音のパワーのしきい値Sが
大きすぎると背景部分の信号までピッチ強調してしま
い、復号側で雑音部分まで強調した聞き難い復号信号が
復号されてしまうためである。
【0046】次に、符号化部500の第2の実施例を図
14を用いて説明する。この例の判定基準は、周期性背
景雑音が入力信号に混在する場合にピッチ強調を行わ
ず、非周期背景雑音が入力信号に混在している場合にピ
ッチ強調を行う方法である。
【0047】入力信号(ブロック)a(n)を入力し
(ステップ701)、入力信号の背景雑音のパワーを分
析する(ステップ702)。さらに、ステップ703で
は、背景雑音のパワーのしきい値Sによって、入力信号
a(n)をそのまま符号化するか(ステップ707)、
次のステップ704に進かを判定する。すなわち、背景
雑音のパワーがしきい値S(例えば20dBが好まし
い)より大きい場合は、入力信号a(n)をそのまま符
号化するよう切替部510に指示する。背景雑音のパワ
ーがしきい値Sより小さい場合は、ステップ704で背
景部分のピッチゲインを分析し、このピッチゲインがし
きい値G′より大きいか小さいかで符号化を行う対象を
切り替えている(ステップ705)。つまり、ピッチゲ
インがしきい値G′より大きい場合は、入力信号a
(n)をそのまま符号化するよう切替510に指示する
(ステップ707)。ピッチゲインがしきい値G′より
小さい場合は、入力信号のピッチを強調したピッチ強調
信号b(n)を符号化するよう切替部510に指示する
(ステップ706)。ピッチ強調信号b(n)を符号化
するか、入力信号a(n)をそのまま符号化するかを背
景部分のピッチゲインによって判定する理由は、背景部
分が一定の周期性を有する場合までピッチ強調してしま
うと、復号側で若干聞き難い復号信号が復号されてしま
うためである。
【0048】次に、符号化部500の第3の実施例を図
15を用いて説明する。この実施例の判定基準として、
無音部や無声部のように入力信号にピッチ情報がそれほ
ど含まれていない場合にはピッチ強調を行わず、有声部
のようにピッチ情報が多く含まれている場合にはピッチ
強調を行うようにする方法である。
【0049】入力信号(ブロック)a(n)を入力し
(ステップ801)、入力信号の背景雑音のパワーを分
析する(ステップ802)。さらに、ステップ803で
は、背景雑音のパワーのしきい値Sによって、ステップ
805に進か、ステップ804に進かを判定する。すな
わち、背景雑音のパワーがしきい値S(例えば、20d
Bが好ましい)より大きい場合は、背景部分以外のピッ
チゲインの分析を行い、背景雑音のパワーがしきい値S
より小さい場合は、ステップ804で背景部分のピッチ
ゲインを分析する。背景部分以外のピッチゲインがしき
い値G″より小さい場合は、入力信号a(n)をそのま
ま符号化するよう切替510に指示する(ステップ81
1)。ピッチゲインがしきい値G″より大きい場合は、
入力信号のピッチを強調したピッチ強調信号b(n)を
符号化するよう切替部510に指示する(ステップ81
2)。一方、背景部分の分析の結果、ピッチゲインがし
きい値G″より大きい場合は、入力信号a(n)をその
まま符号化するよう切替510に指示する(ステップ8
08)。ピッチゲインがしきい値G″より小さい場合
は、入力信号のピッチを強調したピッチ強調信号b
(n)を符号化するよう切替部510に指示する(ステ
ップ810)。ピッチ強調信号b(n)を符号化する
か、入力信号a(n)をそのまま符号化するかを背景部
分及び背景部分以外のピッチゲインによって判定する理
由は、背景部分が一定の周期性を有する場合までピッチ
強調してしまうと、復号側で若干聞き難い復号信号が復
号されてしまうためである。
【0050】また、背景雑音がほとんど存在しないこと
があらかじめ分かっている音声に対し、無音部や無声部
のように入力信号にピッチ情報がそれほど含まれていな
い場合にはピッチ強調を行わず、有声部のようにピッチ
情報が多く含まれている場合にはピッチ強調を行うよう
にする方法があり、図26を用いて説明を行う。この方
法では背景雑音による判定条件が必要なく、より簡単な
手続きで、ピッチ強調を行うもしくは行わないと判定す
ることができるというメリットがある。
【0051】入力信号(ブロック)a(n)を入力し
(ステップ901)、入力信号のパワーを分析する(ス
テップ902)。さらにステップ903では信号パワー
のしきい値Sによってステップ904に進か、ステップ
906進かを判定する。すなわち、背景雑音のパワーが
しきい値S(例えば、20dBが好ましい)より大きい
場合はステップ904で入力信号のピッチ分析を行い、
背景雑音のパワーがしきい値Sより小さい場合は、ステ
ップ906で、入力信号a(n)を符号化するよう切替
部510に指示する。ステップ904で求めたピッチゲ
インがしきい値G′より大きければステップ907に進
み、しきい値G′より小さければステップ906に進
む。すなわち、ピッチゲインがしきい値G′より大きけ
ればステップ907でピッチ強調信号b(n)を符号化
するよう切替部510に指示し、ピッチゲインがしきい
値G′より小さければ、ステップ906で入力信号a
(n)を符号化するよう切替部510に指示する。
【0052】図11の構成を基に、正確なスペクトル包
絡を表すLPC係数を求めるために入力信号a(n)を
用いてLPC分析を行うときの構成を図20に示す。さ
らに図11にノイズキャンセラを組み合せたときの構成
を図21に、図20にノイズキャンセラを組み合せたと
きの構成を図22に示す。
【0053】次に、図12を用いて本発明の第4の実施
例に係る音声符号化装置の説明を行う。なお、図12で
図1と同じ番号を付したものは図1のものと同じ機能を
有すると定義し、ここでは説明を省略する。
【0054】本実施例と第3の実施例との違いは、入力
信号のピッチを強調したものを符号化するか入力信号を
そのまま符号化するかの判定を、判定部520において
ピッチ強調部100からの信号によって判定する点にあ
る。判定部520において判定された結果に基づいて、
判定部520は切替部510に対し指示する。
【0055】図12における判定部520の動作を図1
6を用いて説明する。ピッチ強調部100のピッチ分析
演算部101で得られたピッチゲインgを入力し(ステ
ップ813)、ステップ814では、ピッチゲインgが
パワーのしきい値Sによって、入力信号のピッチを強調
したピッチ強調信号b(n)を符号化するか(ステップ
815)、入力信号a(n)をそのまま符号化するか
(ステップ816)の判定を行う。
【0056】図12の構成をもとに正確なスペクトル包
絡を表すLPC係数を求めるために入力信号a(n)を
用いてLPC分析を行うときの構成を図23に示す。さ
らに、図12にノイズキャンセラを組み合わせたときの
構成を図24に、図25にノイズキャンセラを組み合わ
せたときの構成を図26に示す。
【0057】
【発明の効果】以上説明したように、本発明の音声符号
化装置によれば、入力信号を符号化する前にあらかじめ
ピッチ強調を行うために、符号化過程でピッチ情報があ
る程度損われても、復号化器側で十分なピッチ情報が得
られることが可能になり、主観品質が向上する。
【図面の簡単な説明】
【図1】 本発明の第1の実施例の構成を示すブロック
【図2】 ピッチ強調部の構成を示すブロック図
【図3】 符号化部の構成を示すブロック図
【図4】 ピッチ強調部の処理を示すフローチャート
【図5】 本発明の第2の実施例の構成を示すブロック
【図6】 入力信号の短時間スペクトルを表す図
【図7】 入力信号のスペクトル包絡およびスペクトル
微細構造の関係を表す図
【図8】 入力信号をピッチ強調したときの短時間スペ
クトルを表す図
【図9】 入力信号をピッチ強調したときのスペクトル
包絡およびスペクトル微細構造の関係を表す図
【図10】 音声復号化部の構成を示すブロック図
【図11】 本発明の第3の実施例の構成を示すブロッ
ク図
【図12】 本発明の第4の実施例の構成を示すブロッ
ク図
【図13】 本発明の第3の実施例の判定部の処理を示
すフローチャート
【図14】 本発明の第3の実施例の判定部の処理を示
すフローチャート
【図15】 本発明の第3の実施例の判定部の処理を示
すフローチャート
【図16】 本発明の第4の実施例の判定部の処理を示
すフローチャート
【図17】 本発明の第1の実施例の変形例を示すブロ
ック図
【図18】 符号化部の構成を示すブロック図
【図19】 本発明の第1の実施例の変形例を示すブロ
ック図
【図20】 本発明の第3の実施例の変形例を示すブロ
ック図
【図21】 本発明の第3の実施例の変形例を示すブロ
ック図
【図22】 本発明の第3の実施例の変形例を示すブロ
ック図
【図23】 本発明の第4の実施例の変形例を示すブロ
ック図
【図24】 本発明の第4の実施例の変形例を示すブロ
ック図
【図25】 本発明の第4の実施例の変形例を示すブロ
ック図
【図26】 本発明の第4の実施例の変形例の判定部の
処理を示すフローチャート
【符号の説明】
1…入力端子 100…ピッチ強調部 200…符号化部 300…出力端子

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】符号化すべき入力信号に対し、ピッチ周期
    及びピッチゲインを抽出する手段と、 この手段により抽出されたピッチ周期及びピッチゲイン
    を用いて前記入力信号を強調する手段と、 この手段により強調された入力信号に対し、符号化処理
    を施す手段とを有することを特徴とする音声符号化装
    置。
  2. 【請求項2】入力信号からピッチ周期T及びピッチゲイ
    ンgを抽出し、 抽出されたピッチ周期T及びピッチゲインgを用いて前
    記入力信号を強調する演算を施し、 演算された入力信号を符号化することを特徴とする音声
    符号化方法。
JP20952894A 1994-09-02 1994-09-02 音声符号化装置 Expired - Lifetime JP3468862B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20952894A JP3468862B2 (ja) 1994-09-02 1994-09-02 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20952894A JP3468862B2 (ja) 1994-09-02 1994-09-02 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH0876793A true JPH0876793A (ja) 1996-03-22
JP3468862B2 JP3468862B2 (ja) 2003-11-17

Family

ID=16574288

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20952894A Expired - Lifetime JP3468862B2 (ja) 1994-09-02 1994-09-02 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3468862B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013068977A (ja) * 2008-12-30 2013-04-18 ▲ホア▼▲ウェイ▼技術有限公司 ピッチ検索のための方法及び装置
JP2015055765A (ja) * 2013-09-12 2015-03-23 日本電信電話株式会社 信号処理装置、信号処理方法、プログラム、記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013068977A (ja) * 2008-12-30 2013-04-18 ▲ホア▼▲ウェイ▼技術有限公司 ピッチ検索のための方法及び装置
JP2015055765A (ja) * 2013-09-12 2015-03-23 日本電信電話株式会社 信号処理装置、信号処理方法、プログラム、記録媒体

Also Published As

Publication number Publication date
JP3468862B2 (ja) 2003-11-17

Similar Documents

Publication Publication Date Title
AU714752B2 (en) Speech coder
JP3653826B2 (ja) 音声復号化方法及び装置
JPH1091194A (ja) 音声復号化方法及び装置
JPH08123495A (ja) 広帯域音声復元装置
JP4040126B2 (ja) 音声復号化方法および装置
JP3266178B2 (ja) 音声符号化装置
EP1727130A2 (en) Speech signal decoding method and apparatus
JP3558031B2 (ja) 音声復号化装置
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP3531780B2 (ja) 音声符号化方法および復号化方法
JP3468862B2 (ja) 音声符号化装置
JP3050978B2 (ja) 音声符号化方法
JP2001242899A (ja) 音声符号化方法及び装置並びに及び音声復号方法及び装置
JP2736157B2 (ja) 符号化装置
Vass et al. Adaptive forward-backward quantizer for low bit rate high-quality speech coding
JP3232701B2 (ja) 音声符号化方法
JP3576485B2 (ja) 固定音源ベクトル生成装置及び音声符号化/復号化装置
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JP3785363B2 (ja) 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法
JPH06202698A (ja) 適応ポストフィルタ
JP2853170B2 (ja) 音声符号化復号化方式
JP3192051B2 (ja) 音声符号化装置
JPH05165497A (ja) コード励振線形予測符号化器及び復号化器
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3350340B2 (ja) 音声符号化方法および音声復号化方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070905

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080905

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080905

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090905

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090905

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100905

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110905

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110905

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120905

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120905

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130905

Year of fee payment: 10

EXPY Cancellation because of completion of term