JP2000357000A

JP2000357000A - 雑音信号符号化装置および音声信号符号化装置

Info

Publication number: JP2000357000A
Application number: JP11168545A
Authority: JP
Inventors: Koji Yoshida; 幸司吉田
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1999-06-15
Filing date: 1999-06-15
Publication date: 2000-12-26
Anticipated expiration: 2019-06-15
Also published as: EP1120775A1; EP1120775A4; AU5103700A; WO2000077774A1; CN1313983A; JP4464484B2

Abstract

(57)【要約】【課題】背景雑音が重畳された音声信号に対して
も復号音声の劣化を抑えること。【解決手段】雑音信号分析部３０１により算出された
入力雑音信号に対する統計的特徴量に対して、入力雑音
信号に関する統計的特徴量を表現できるような雑音モデ
ルに関する情報を記憶する雑音モデル記憶部３０２を用
いて、入力雑音信号を表す雑音モデルパラメータが変化
したかどうの検出を、雑音モデル変化検出部３０３にお
いて行い、雑音モデル更新部３０４により、雑音モデル
の更新を行い更新後のモデル情報を出力する。上記で構
成された雑音信号符号器を用いて、入力信号の無音区間
（雑音のみの区間）又は音声信号から分離された雑音信
号に対して符号化を行い、有音区間においては音声符号
器により符号化を行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声信号を符号化
して伝送する移動通信システムや音声録音装置等の用途
に用いられる低ビットレート音声信号符号化装置に関す
る。

【０００２】

【従来の技術】ディジタル移動通信や音声蓄積の分野に
おいては、電波や記憶媒体の有効利用のために音声情報
を圧縮し、低いビットレートで符号化する音声符号化装
置が用いられている。そのような従来の技術として、Ｉ
ＴＵ−Ｔ勧告Ｇ．７２９（"Coding of speech at 8kbit
/s using conjugate-structure algebraic-code-excite
d linear-prediction(CS-ACELP)"）のＣＳ−ＡＣＥＬＰ
符号化方式や、同じくＩＴＵ−Ｔ勧告のＧ．７２９ An
nex B（"A silence compression scheme for G.729 opt
imized for terminals conforming to Recommendation
V.70"）のＤＴＸ(Discontinuous Transmission)制御付
きのＣＳ−ＡＣＥＬＰ符号化方式がある。

【０００３】図１３は、従来のＣＳ−ＡＣＥＬＰ符号化
方式の符号化装置の構成を示すブロック図である。図１
３において、入力音声信号に対してＬＰＣ分析・量子化
器１でＬＰＣ（線形予測）分析および量子化を行い、Ｌ
ＰＣ係数およびＬＰＣ量子化符号を出力する。

【０００４】そして、適応音源符号帳２および固定音源
符号帳３から取り出された適応音源信号および固定音源
信号にゲイン符号帳４から取り出されたゲインを乗じて
加算し、ＬＰＣ合成フィルタ７により音声合成を行い、
入力信号に対する誤差信号を聴覚重み付けフィルタ９に
より重み付けを行い、重み付け後の誤差が最小となる適
応音源符号、固定音源符号、ゲイン符号をＬＰＣ量子化
符号と共に符号化データとして出力する。なお、図１３
において、５は乗算器であり、６は加算器であり、８は
減算器である。

【０００５】図１４は、従来のＤＴＸ制御付きＣＳ−Ａ
ＣＥＬＰ符号化方式の符号化装置の構成を示すブロック
図である。まず、有音／無音判定器１１により入力信号
が有音区間か無音区間（背景雑音のみの区間）かの判定
を行う。そして、有音／無音判定器１１により有音と判
定された場合、ＣＳ−ＡＣＥＬＰ音声符号化器１２によ
り有音区間の音声符号化を行う。なお、ＣＳ−ＡＣＥＬ
Ｐ音声符号化器１２は、図１３に示す構成となってい
る。

【０００６】一方、有音／無音判定器１１により無音と
判定された場合、無音区間符号化器１３により符号化を
行う。この無音区間符号化器１３は、入力信号から有音
区間の符号化と同様なＬＰＣ係数と入力信号のＬＰＣ予
測残差エネルギーを算出し、それらを無音区間の符号化
データとして出力する。

【０００７】ＤＴＸ制御および多重化器１４は、有音／
無音判定器１１、ＣＳ−ＡＣＥＬＰ音声符号化器１２お
よび無音区間符号化器１３の出力から、送信データとし
て送信すべきデータを制御し、多重化して送信データと
して出力する。

【０００８】

【発明が解決しようとする課題】しかしながら、上記従
来のＣＳ−ＡＣＥＬＰ符号化器では、音声符号化器が音
声特有の冗長性を利用して８ｋｂｐｓという低ビットレ
ートで符号化を行っているため、背景雑音が重畳されな
いクリーンな音声信号が入力された場合には、高品質な
符号化が可能であるが、入力信号として周囲の背景雑音
が重畳された音声信号が入力された場合、背景雑音信号
を符号化した際にその復号信号の品質が劣化するという
問題がある。

【０００９】また、上記従来のＤＴＸ制御付きＣＳ−Ａ
ＣＥＬＰ符号化器においては、有音区間のみＣＳ−ＡＣ
ＥＬＰ符号化器により符号化を行い、無音区間（雑音の
みの区間）は、専用の無音区間符号化器で音声符号化器
より少ないビットレートで符号化を行うことで、伝送す
る平均ビットレートを低減する。しなしながら、無音区
間符号化器が音声符号化器と同様な信号モデル（短区間
（１０〜５０ｍｓ程度）毎にＡＲ型の合成フィルタ（Ｌ
ＰＣ合成フィルタ）を雑音信号で駆動することで復号信
号を生成する）で符号化を行っているため、上記従来の
ＣＳ−ＡＣＥＬＰ符号化器と同様に、背景雑音が重畳さ
れた音声信号に対しては復号信号の品質が劣化するとい
う問題がある。

【００１０】本発明はかかる点に鑑みてなされたもので
あり、背景雑音が重畳された音声信号に対しても復号信
号の品質の劣化が少なく、かつ伝送に必要な平均ビット
レートも低減することのできる音声信号の符号化装置お
よび復号装置を提供することを目的とする。

【００１１】

【課題を解決するための手段】本発明の骨子は、無音区
間（雑音のみの区間）の入力信号に対する統計的特徴量
を算出し、入力雑音信号に関する統計的特徴量を表現で
きるような雑音モデルに関する情報を記憶し、入力雑音
信号を表す雑音モデルパラメータが変化したかどうかを
検出し、雑音モデルの更新を行うことにより、背景雑音
が重畳された音声信号に対しても復号信号の品質の劣化
が少なく、かつ伝送に必要な平均ビットレートも低減す
ることである。

【００１２】

【発明の実施の形態】本発明の第１の態様に係る雑音信
号符号化装置は、雑音信号を含む音声信号の前記雑音信
号に対して信号分析を行う分析手段と、前記雑音信号を
表わす雑音モデルに関する情報を記憶する記憶手段と、
現入力の雑音信号の信号分析結果に基づいて、記憶され
た雑音モデルに関する情報の変化を検出する検出手段
と、雑音モデルに関する情報の変化が検出された場合
に、前記変化の変化量分だけ前記記憶された雑音モデル
に関する情報を更新する更新手段と、を具備する構成を
採る。

【００１３】この構成によれば、雑音信号を統計的特徴
量で表現できるような雑音モデルでモデル化することに
より、背景雑音信号に対して聴感的に劣化の少ない復号
信号を生成することができる。また、このモデル化によ
り、入力信号波形に対する忠実な符号化が不要となるの
で、入力信号に対応する雑音モデルパラメータが変化す
る区間のみ伝送することにより、低ビットレートで高効
率な符号化を行うことができる。

【００１４】本発明の第２の態様に係る雑音信号符号化
装置は、第１の態様において、分析手段が、雑音信号に
関する統計的特徴量を抽出し、記憶手段は、前記統計的
特徴量を表現できる情報を雑音モデルに関する情報とし
て記憶する構成を採る。

【００１５】この構成によれば、雑音信号を適切にモデ
ル化することができ、低ビットレートで高効率な符号化
を効率良く行うことができる。

【００１６】本発明の第３の態様に係る音声信号符号化
装置は、入力音声信号に対して有音区間か雑音信号のみ
を含む無音区間かを判定する有音／無音判定手段と、判
定結果が有音である場合に前記入力音声信号に対して音
声符号化を行う音声符号化手段と、判定結果が無音であ
る場合に前記入力信号に対して雑音信号の符号化を行う
第１又は第２の態様の雑音信号符号化装置と、前記有音
／無音判定手段、前記音声符号化手段、および前記雑音
信号符号化装置からの出力を多重化する多重化手段と、
を具備する構成を採る。

【００１７】この構成によれば、有音区間では音声信号
を高品質で符号化できる音声符号化手段で符号化を行
い、無音区間では高効率で聴感的に劣化が少ない第１の
態様の雑音信号符号化装置で符号化を行うことにより、
背景雑音環境下においても高品質・高効率な符号化を行
うことができる。

【００１８】本発明の第４の態様に係る音声信号符号化
装置は、入力音声信号を、音声信号とこの音声信号に重
畳している背景雑音信号とに分離する音声／雑音信号分
離手段と、前記入力音声信号又は前記音声／雑音信号分
離手段により得られる音声信号から有音区間か雑音信号
のみを含む無音区間かを判定する有音／無音判定手段
と、判定結果が有音である場合に前記入力音声信号に対
して音声符号化を行う音声符号化手段と、前記音声／雑
音信号分離手段により得られる背景雑音信号の符号化を
行う第１又は第２の態様の雑音信号符号化装置と、前記
有音／無音判定手段、前記音声符号化手段、および前記
雑音信号符号化装置からの出力を多重化する多重化手段
と、を具備する構成を採る。

【００１９】この構成によれば、有音区間では音声信号
を高品質で符号化できる音声符号化手段で符号化を行
い、雑音信号に対しては高効率で聴感的に劣化が少ない
第１の態様の雑音信号符号化装置で符号化を行うことに
より、背景雑音環境下においても高品質・高効率な符号
化を行うことができる。また、音声／雑音信号分離手段
を設けることにより、前記音声符号化手段に入力される
音声信号から重畳された背景雑音を除去することがで
き、有音区間をより高品質に又はより高効率に符号化す
ることができる。

【００２０】本発明の第５の態様に係る音声信号符号化
装置は、入力音声信号に対して信号分析を行う分析手段
と、前記入力音声信号が有音信号であるかどうかを判定
するために必要な音声の特徴パターンを記憶する音声モ
デル記憶手段と、前記入力音声信号に含まれる雑音信号
を表現する雑音モデルに関する情報を記憶する雑音モデ
ル記憶手段と、前記分析手段、音声モデル記憶手段およ
び雑音モデル記憶手段の出力を用いて、前記入力音声信
号が有音区間か雑音信号のみを含む無音区間かを判定す
ると共に、前記無音区間の場合に雑音モデルを更新する
かどうかの判定を行うモード判定手段と、前記モード判
定手段が有音区間と判定した場合に入力音声信号に対し
て音声符号化を行う音声符号化手段と、前記モード判定
手段が無音区間でかつ雑音モデルを更新すると判定した
場合にその雑音モデルの更新を行う雑音モデル更新手段
と、音声符号化手段および雑音モデル更新手段からの出
力を多重化する多重化手段と、を具備する構成を採る。

【００２１】この構成によれば、モード判定手段を設け
ることにより、入力信号の統計的特徴量の変化および音
声の特徴パターンを用いて判定を行うことができる。し
たがって、より正確なモード判定を行うことができ、判
定誤りによる品質劣化を抑えることができる。

【００２２】本発明の第６の態様に係る基地局装置は、
第３から第５のいずれかの態様の音声信号符号化装置を
備えたことを特徴とする。本発明の第７の態様に係る通
信端末装置は、第３から第５のいずれかの態様の音声信
号符号化装置を備えたことを特徴とする。

【００２３】本発明の第８の態様に係る雑音信号生成装
置は、符号化側で入力雑音信号に対して符号化された雑
音モデルパラメータおよび雑音モデル更新フラグにした
がって、必要な場合に雑音モデルの更新を行う雑音モデ
ル更新手段と、前記雑音モデル更新手段の出力を用いて
更新後の雑音モデルに関する情報を記憶する雑音モデル
記憶手段と、前記雑音モデル記憶手段で記憶している雑
音モデルに関する情報から雑音信号を生成する雑音信号
生成手段と、を具備する構成を採る。

【００２４】この構成によれば、背景雑音信号に対して
聴感的に劣化の少ない復号信号を生成することができ
る。

【００２５】本発明の第９の態様に係る雑音信号生成装
置は、第８の態様において、前記雑音モデル更新手段へ
入力する雑音モデルパラメータおよび前記雑音モデル記
憶手段で記憶する情報が、生成する雑音信号に関する統
計的特徴量を表現できる情報である構成を採る。

【００２６】この構成によれば、雑音信号を統計的特徴
量で表現できるような雑音モデルでモデル化することに
より、背景雑音信号に対して聴感的に劣化の少ない復号
信号を生成することができる。

【００２７】本発明の第１０の態様に係る音声信号復号
化装置は、符号化側で符号化された音声データ、雑音モ
デルパラメータ、有音／無音判定フラグおよび雑音モデ
ル更新フラグを含む信号を受信し、前記信号から雑音モ
デルパラメータ、有音／無音判定フラグおよび雑音モデ
ル更新フラグを分離する分離手段と、前記有音／無音判
定フラグが有音区間を示す場合に、前記音声データに対
して音声復号を行う音声復号化手段と、前記有音／無音
判定フラグが無音区間を示す場合に、前記雑音モデルパ
ラメータおよび雑音モデル更新フラグから雑音信号の生
成を行う第８又は第９の態様の雑音信号生成装置と、前
記音声復号化手段から出力される復号音声と前記雑音信
号生成装置から出力される雑音信号のいずれかを、前記
有音／無音判定フラグに応じて切り替えて出力信号とし
て出力する出力切り替え手段と、を具備する構成を採
る。

【００２８】この構成によれば、背景雑音信号に対して
聴感的に劣化の少ない復号信号を生成することができ
る。

【００２９】本発明の第１１の態様に係る音声信号復号
化装置は、符号化側で符号化された音声データ、雑音モ
デルパラメータ、有音／無音判定フラグおよび雑音モデ
ル更新フラグを含む信号を受信し、前記信号から雑音モ
デルパラメータ、有音／無音判定フラグおよび雑音モデ
ル更新フラグを分離する分離手段と、前記有音／無音判
定フラグが有音区間を示す場合に、前記音声データに対
して音声復号を行う音声復号化手段と、前記有音／無音
判定フラグが無音区間を示す場合に、前記雑音モデルパ
ラメータおよび雑音モデル更新フラグから雑音信号の生
成を行う第８又は第９の態様の雑音信号生成装置と、前
記音声復号化手段から出力される復号音声と前記雑音信
号生成装置から出力される雑音信号とを加算する音声／
雑音信号加算手段と、を具備する構成を採る。

【００３０】この構成によれば、背景雑音信号に対して
聴感的に劣化の少ない復号信号を生成することができ
る。また、符号化側で音声信号とそれに重畳する雑音信
号を分離した後に、それぞれの信号に適した符号器で符
号化し、復号側でそれらを加算して復号信号を生成する
ので、有音区間の音声信号をより高品質に符号化するこ
とができる。

【００３１】本発明の第１２の態様に係る音声信号符号
化方法は、入力音声信号に対して有音区間か雑音信号の
みを含む無音区間かを判定する有音／無音判定工程と、
判定結果が有音である場合に前記入力音声信号に対して
音声符号化を行う音声符号化工程と、判定結果が無音で
ある場合に前記入力信号に対して雑音信号の符号化を行
う雑音信号符号化工程と、前記有音／無音判定工程、前
記音声符号化工程、および前記雑音信号符号化工程にお
ける出力を多重化する多重化工程と、を具備し、雑音信
号符号化工程は、雑音信号を含む音声信号の前記雑音信
号に対して信号分析を行う分析工程と、前記雑音信号を
表わす雑音モデルに関する情報を記憶する記憶工程と、
現入力の雑音信号の信号分析結果に基づいて、記憶され
た雑音モデルに関する情報の変化を検出する検出工程
と、雑音モデルに関する情報の変化が検出された場合
に、前記変化の変化量分だけ前記記憶された雑音モデル
に関する情報を更新する更新工程と、を含む。

【００３２】この方法によれば、有音区間では音声信号
を高品質で符号化できる音声符号化手段で符号化を行
い、無音区間では高効率で聴感的に劣化が少ない第１の
態様の雑音信号符号化装置で符号化を行うことにより、
背景雑音環境下においても高品質・高効率な符号化を行
うことができる。

【００３３】本発明の第１３の態様に係る音声信号符号
化方法は、入力音声信号を、音声信号とこの音声信号に
重畳している背景雑音信号とに分離する音声／雑音信号
分離工程と、前記入力音声信号又は前記音声／雑音信号
分離工程において得られる音声信号から有音区間か雑音
信号のみを含む無音区間かを判定する有音／無音判定工
程と、判定結果が有音である場合に前記入力音声信号に
対して音声符号化を行う音声符号化工程と、判定結果が
無音である場合に前記入力信号に対して雑音信号の符号
化を行うと共に、前記音声／雑音信号分離工程において
得られる背景雑音信号の符号化を行う雑音信号符号化工
程と、前記有音／無音判定工程、前記音声符号化工程、
および前記雑音信号符号化工程における出力を多重化す
る多重化工程と、を具備し、雑音信号符号化工程は、雑
音信号を含む音声信号の前記雑音信号に対して信号分析
を行う分析工程と、前記雑音信号を表わす雑音モデルに
関する情報を記憶する記憶工程と、現入力の雑音信号の
信号分析結果に基づいて、記憶された雑音モデルに関す
る情報の変化を検出する検出工程と、雑音モデルに関す
る情報の変化が検出された場合に、前記変化の変化量分
だけ前記記憶された雑音モデルに関する情報を更新する
更新工程と、を含む。

【００３４】この方法によれば、有音区間では音声信号
を高品質で符号化できる音声符号化手段で符号化を行
い、無音区間では高効率で聴感的に劣化が少ない第１の
態様の雑音信号符号化装置で符号化を行うことにより、
背景雑音環境下においても高品質・高効率な符号化を行
うことができる。また、音声／雑音信号分離手段を設け
ることにより、前記音声符号化手段に入力される音声信
号から重畳された背景雑音を除去することができ、有音
区間をより高品質に又はより高効率に符号化することが
できる。

【００３５】本発明の第１４の態様に係る音声信号符号
化方法は、入力音声信号に対して信号分析を行う分析工
程と、前記入力音声信号が有音信号であるかどうかを判
定するために必要な音声の特徴パターンを記憶する音声
モデル記憶工程と、前記入力音声信号に含まれる雑音信
号を表現する雑音モデルに関する情報を記憶する雑音モ
デル記憶工程と、前記分析手段、音声モデル記憶手段お
よび雑音モデル記憶手段の出力を用いて、前記入力音声
信号が有音区間か雑音信号のみを含む無音区間かを判定
すると共に、前記無音区間の場合に雑音モデルを更新す
るかどうかの判定を行うモード判定工程と、前記モード
判定手段が有音区間と判定した場合に入力音声信号に対
して音声符号化を行う音声符号化工程と、前記モード判
定手段が無音区間でかつ雑音モデルを更新すると判定し
た場合にその雑音モデルの更新を行う雑音モデル更新工
程と、音声符号化手段および雑音モデル更新手段からの
出力を多重化する多重化工程と、を具備する。

【００３６】この方法によれば、モード判定手段を設け
ることにより、入力信号の統計的特徴量の変化および音
声の特徴パターンを用いて判定を行うことができる。し
たがって、より正確なモード判定を行うことができ、判
定誤りによる品質劣化を抑えることができる。

【００３７】本発明の第１５の態様に係る記録媒体は、
コンピュータに、入力雑音信号に対して統計的特徴量の
分析を行う手順と、入力雑音信号に対する統計的特徴量
を表現する雑音モデルに関する情報を記憶する手順と、
入力雑音信号を表す雑音モデルの変化を検出する手順
と、必要な場合に雑音モデルの更新を行い更新後の雑音
モデルに関する情報を出力する手順、を実行させるため
のプログラムを記録した機械読みとり可能なものであ
る。

【００３８】以下、本発明の実施の形態について、添付
図面を参照して詳細に説明する。（実施の形態１）図１は、本発明の実施の形態１に係る
音声信号符号化装置を備えた無線通信装置の構成を示す
ブロック図である。

【００３９】この無線通信装置において、送信側で音声
がマイクなどの音声入力装置１０１によって電気的アナ
ログ信号に変換され、Ａ／Ｄ変換器１０２に出力され
る。アナログ音声信号は、Ａ／Ｄ変換器１０２によって
ディジタル音声信号に変換され、音声符号化部１０３に
出力される。音声符号化部１０３は、ディジタル音声信
号に対して音声符号化処理を行い、符号化した情報を変
復調部１０４に出力する。変復調部１０４は、符号化さ
れた音声信号をディジタル変調して、無線送信部１０５
に送る。無線送信部１０５では、変調後の信号に所定の
無線送信処理を施す。この信号は、アンテナ１０６を介
して送信される。

【００４０】一方、無線通信装置の受信側では、アンテ
ナ１０７で受信した受信信号は、無線受信部１０８で所
定の無線受信処理が施され、変復調部１０４に送られ
る。変復調部１０４では、受信信号に対して復調処理を
行い、復調後の信号を音声復号化部１０９に出力する。
音声復号化部１０９は、復調後の信号に復号処理を行っ
てディジタル復号音声信号を得て、そのディジタル復号
音声信号をＤ／Ａ変換器１１０へ出力する。Ｄ／Ａ変換
器１１０は、音声復号化部１０９から出力されたディジ
タル復号音声信号をアナログ復号音声信号に変換してス
ピーカなどの音声出力装置１１１に出力する。最後に音
声出力装置１１１が電気的アナログ復号音声信号を復号
音声に変換して出力する。

【００４１】図１に示す音声符号化部１０３は、図２に
示す構成を有する。図２は、本発明の実施の形態１に係
る音声符号化部の構成を示すブロック図である。

【００４２】有音／無音判定器２０１において、入力音
声信号に対して有音区間か無音区間（雑音のみの区間）
かを判定し、その判定結果をＤＴＸ制御および多重化器
２０４に出力する。有音／無音判定器２０１は任意のも
のでよく、一般には、入力信号のパワー、スペクトルや
ピッチ周期などの複数のパラメータの瞬時量または変化
量等を用いて判定が行われる。

【００４３】そして、前記有音／無音判定器２０１によ
る判定結果が有音である場合には、音声符号化器２０２
により、音声信号と雑音信号が含まれる有音区間におい
て入力音声信号に対して音声符号化を行い、その符号化
データをＤＴＸ制御および多重化器２０４に出力する。
この音声符号化器２０２は、有音区間用の符号化器であ
り、音声を高能率に符号化するものであれば任意の符号
化器でよい。

【００４４】一方、前記有音／無音判定器２０１による
判定結果が無音である場合には、雑音信号符号化器２０
３により、雑音信号のみが含まれる無音区間において入
力信号に対して雑音信号の符号化を行い、入力雑音信号
を表現する雑音モデルに関する情報と、雑音モデルの更
新をするかどうかのフラグとをＤＴＸ制御および多重化
器２０４に出力する。最後に、ＤＴＸ制御および多重化
器２０４により、前記有音／無音判定器２０１、音声符
号化器２０２および雑音信号符号化器２０３からの出力
を用いて送信データとして送信すべき情報の制御と送信
情報の多重化を行い、送信データとして出力する。

【００４５】図２における雑音信号符号化器２０３は、
図３に示す構成を有する。図３は、本発明の実施の形態
１に係る音声符号化部の雑音信号符号化器の構成を示す
ブロック図である。

【００４６】雑音信号分析部３０１により、ある一定区
間毎に入力された雑音信号に対して信号分析を行い、雑
音信号に対する分析パラメータを算出する。抽出する分
析パラメータとしては、入力信号に関する統計的特徴量
を表すのに必要なパラメータであり、例えば、短区間信
号に対してＦＦＴ(Fast Fourier Transform)により求め
た短時間スペクトルや、入力パワー、ＬＰＣスペクトル
パラメータ等がある。

【００４７】次に、雑音モデル変化検出部３０３におい
て、現在入力された雑音信号を表すべき雑音モデルパラ
メータが、雑音モデル記憶部３０２により保持されてい
る雑音モデルパラメータから変化しているかどうかを検
出する。

【００４８】ここで、雑音モデルパラメータとは、入力
雑音信号に関する統計的特徴量を表現できるような雑音
モデルに関する情報であり、例えば、短時間スペクトル
の平均スペクトルや分散値、等の統計的特徴量を、例え
ばＨＭＭのような統計モデルで表現した際の情報であ
る。

【００４９】そして、雑音モデル変化検出部３０３は、
雑音信号分析部３０１により得られた現入力信号に対す
る分析パラメータが、それ以前の入力信号を表す雑音モ
デルとして記憶された雑音モデルからの出力として妥当
かどうか（例えば、ＨＭＭモデルであれば現入力信号に
対する分析パラメータの出力確率が規定値以上である
か）を判定し、現在入力された雑音信号を表すべき雑音
モデルパラメータが記憶された雑音モデルから変化して
いると判定された場合に、雑音モデルの更新を行うかど
うかのフラグと更新すべき情報（更新情報）を雑音モデ
ル更新部３０４に出力する。

【００５０】なお、外部更新許可フラグは、雑音モデル
更新を許可するかどうかを外部から指示するフラグで、
後述する本発明における音声符号化部において、有音区
間中の符号化データを送信する期間中等、雑音モデルパ
ラメータの送信を行わないようにする際には、雑音モデ
ルの更新を不許可とする。

【００５１】そして、雑音モデル更新部３０４におい
て、雑音モデル更新フラグが更新を示す場合には、雑音
モデル更新情報として、更新後の雑音モデルパラメータ
または以前に雑音モデル記憶部３０２に記憶されている
雑音モデルパラメータからの変化分のみの情報を出力す
ると共に、その出力情報を用いて雑音モデル記憶部３０
２の更新を行う。一方、雑音モデル更新フラグが非更新
を示す場合には、更新を行わず、更新情報を出力しな
い。

【００５２】次に、図１に示す音声復号化部１０９は、
図４に示す構成を有する。図４は、本発明の実施の形態
１に係る音声復号化装置の構成を示すブロック図であ
る。

【００５３】分離およびＤＴＸ制御器４０１において、
符号化側で入力信号に対して符号化され送信された送信
データを受信データとして受信し、この受信データを音
声復号および雑音生成に必要な、音声符号化データまた
は雑音モデルパラメータ、有音／無音判定フラグおよび
雑音モデル更新フラグに分離する。

【００５４】次いで、前記有音／無音判定フラグが有音
区間を示す場合には、音声復号化器４０２により前記音
声符号化データから音声復号を行い復号音声を出力切替
え器４０４に出力する。

【００５５】一方、前記有音／無音判定フラグが無音区
間を示す場合には、雑音信号生成器４０３により前記雑
音モデルパラメータおよび雑音モデル更新フラグから雑
音信号の生成を行し、雑音信号を出力切替え器４０４に
出力する。そして、出力切り替え器４０４により、前記
音声復号化器４０２の出力と前記雑音信号生成器４０３
の出力を、有音／無音判定フラグの結果に応じて切り替
えて出力し、出力信号とする。

【００５６】図４における雑音信号生成器４０３は、図
５に示す構成を有する。図５は、本発明の実施の形態１
に係る音声復号化装置の雑音信号生成器の構成を示すブ
ロック図である。

【００５７】図３に示す雑音信号符号化器２０３から出
力された、雑音モデル更新フラグおよび雑音モデルパラ
メータ（モデル更新の場合）が雑音モデル更新部５０１
に入力される。雑音モデル更新部５０１においては、前
記雑音モデル更新フラグが更新を示している場合、前記
入力雑音モデルパラメータおよび雑音モデル記憶部５０
２で保持されている以前の雑音モデルパラメータを用い
て、雑音モデルの更新を行い、更新後の雑音モデルパラ
メータを雑音モデル記憶部５０２にて新たに記憶する。

【００５８】雑音信号生成部５０３では、雑音モデル記
憶部５０２の情報をもとに、雑音信号を生成し出力す
る。雑音生成は、統計的特徴量をパラメータにモデル化
された情報をもとに、生成される雑音信号がそのモデル
からの出力として妥当な信号となるように生成される。
例えば、統計モデルとしてＨＭＭを用いた場合、その状
態遷移確率およびパラメータ出力確率等に従って、生成
に必要な信号パラメータ（例えば、短時間スペクトル）
を確率的に出力し、それに基づき雑音信号を生成・出力
する。

【００５９】次に、上記構成を有する音声符号化部およ
び音声復号化部の動作について説明する。図６は、実施
の形態１に係る音声信号の符号化方法の処理の流れを示
すフロー図である。なお、本方法では、図６に示す本処
理を、一定短区間（例えば、１０〜５０ｍｓ程度）のフ
レーム毎に繰り返して行うものとする。

【００６０】まず、ステップ（以下ＳＴと省略する）１
０１において、フレーム単位の音声信号を入力する。次
に、ＳＴ１０２にて、入力信号に対する有音／無音判定
を行い、その判定結果を出力する。そして、その判定結
果が有音である場合には、ＳＴ１０４により入力音声信
号に対して音声符号化処理を行いその符号化データを出
力する。

【００６１】一方、ＳＴ１０３における判定結果が無音
である場合には、ＳＴ１０５にて、入力信号に対して雑
音信号符号化器による雑音信号符号化処理を行い、入力
雑音信号を表現する雑音モデルに関する情報と雑音モデ
ルの更新を行うかどうかのフラグを出力する。なお、雑
音信号の符号化処理については後述する。

【００６２】そして、ＳＴ１０６において、前記有音／
無音判定、音声符号化処理および雑音信号符号化処理の
結果得られた出力を用いて送信データとして送信すべき
情報の制御と送信情報の多重化を行い、最後にＳＴ１０
７にて、送信データとして出力する。

【００６３】図７は、本実施の形態に係る音声信号の符
号化方法における雑音信号符号化方法の処理の流れを示
すフロー図である。なお、本方法では、図７に示す本処
理を、一定短区間（例えば、１０〜５０ｍｓ程度）のフ
レーム毎に繰り返して行うものとする。

【００６４】ＳＴ２０１において、フレーム単位の雑音
信号を入力する。次に、ＳＴ２０２において、フレーム
単位の雑音信号に対して信号分析を行い、雑音信号に対
する分析パラメータを算出する。そして、ＳＴ２０３に
おいて、分析パラメータから雑音モデルの変化があるか
どうかの検出を行い、雑音モデルが変化したと判定され
た場合、ＳＴ２０５にて、雑音モデルの更新をするかど
うかのフラグ（更新あり）と更新すべき情報（更新情
報）を出力すると共に、ＳＴ２０６にて、その出力情報
を用いて雑音モデル記憶部３０２の更新を行う。

【００６５】一方、ＳＴ２０４にて、雑音モデルの変化
なしと判定された場合には、ＳＴ２０７にて、雑音モデ
ルの更新をするかどうかのフラグ（更新なし）のみ出力
する。なお、ＳＴ２０３において、外部から別途入力さ
れる外部更新許可フラグが不許可の場合、モデル変化な
しとして雑音モデルパラメータの送信を行わないように
する。

【００６６】このように、本実施の形態に係る雑音符号
化方法によれば、雑音信号を統計的特徴量で表現できる
ような雑音モデルでモデル化することにより、背景雑音
信号に対して聴感的に劣化の少ない復号信号を生成する
ことができる。また、入力信号波形に対する忠実な符号
化が不要であると共に、入力信号に対応する雑音モデル
パラメータが変化する区間のみ伝送することにより、低
ビットレートで高効率な符号化を行うことができる。

【００６７】また、本実施の形態に係る音声信号の符号
化方法によれば、有音区間では音声信号を高品質で符号
化できる音声符号化器で符号化を行い、無音区間では高
効率で聴感的に劣化が少ない雑音信号符号化器で符号化
を行うことにより、背景雑音環境下においても高品質・
高効率な符号化を行うことができる。

【００６８】（実施の形態２）図８は、本発明の実施の
形態２に係る音声信号の符号化部の構成を示すブロック
図である。

【００６９】この音声符号化部１０３においては、音声
／雑音信号分離器８０１で、入力音声信号を、音声信号
と音声信号に重畳している背景雑音信号とに分離する。
音声／雑音信号分離器８０１は、任意のものでよい。こ
の分離方法としては、スペクトルサブトラクションと呼
ばれる、入力信号から周波数領域で雑音スペクトルを減
ずることで、入力信号を雑音抑圧後の音声信号と雑音信
号とに分離する方法や、複数の信号入力器からの入力信
号から音声と雑音の分離を行う方法などが考えられる。

【００７０】次に、有音／無音判定器８０２において、
前記音声/雑音信号分離器８０１から得られる分離後の
音声信号から有音区間か無音区間（雑音のみの区間）か
を判定し、その判定結果を音声符号化器８０３およびＤ
ＴＸ制御および多重化器８０５に出力する。なお、分離
前の入力信号を用いて判定を行う構成でもよい。有音／
無音判定器８０２は任意のものでよい。この判定は、一
般には、入力信号のパワー、スペクトルやピッチ周期な
どの複数のパラメータの瞬時量または変化量等を用いて
判定が行われる。

【００７１】そして、前記有音／無音判定器８０２によ
る判定結果が有音である場合には、音声符号化器８０３
により、前記音声／雑音信号分離器８０１から得られる
分離後の音声信号に対して有音区間のみ音声符号化器８
０３で音声信号の符号化を行い、その符号化データをＤ
ＴＸ制御および多重化器８０５に出力する。この音声符
号化器８０３は、有音区間用の符号化器で、音声を高能
率に符号化する任意の符号化器でよい。

【００７２】一方、雑音信号符号化器８０４により、前
記音声／雑音信号分離器８０１から得られる分離後の雑
音信号に対して全区間にわたって雑音信号符号化器８０
４で雑音信号の符号化を行い、入力雑音信号表現する雑
音モデルに関する情報と雑音モデルの更新をするかどう
かのフラグを出力する。音声／雑音信号符号化器８０１
は、実施の形態１にて説明した図３に示すものである。

【００７３】なお、有音／無音判定結果が有音である場
合、雑音信号符号化器８０４に入力される有音／無音判
定結果フラグを雑音信号符号化器８０４における雑音モ
デル更新不許可フラグとして、モデル更新を行わないよ
うにする。

【００７４】最後に、ＤＴＸ制御および多重化器８０５
により、前記有音／無音判定器８０２、音声符号化器８
０３および雑音信号符号化器８０４からの出力を用いて
送信データとして送信すべき情報の制御と送信情報の多
重化を行い、送信データとして出力する。

【００７５】図９は、実施の形態２に係る音声信号の復
号化装置の構成を示すブロック図である。図９に示す復
号化装置においては、分離およびＤＴＸ制御器９０１に
おいて、符号化側で入力信号に対して符号化され送信さ
れた送信データを受信データとして受信し、音声復号お
よび雑音生成に必要な、音声符号化データまたは雑音モ
デルパラメータ、有音／無音判定フラグおよび雑音モデ
ル更新フラグに分離する。

【００７６】次に、前記有音／無音判定フラグが有音区
間を示す場合には、音声復号化器９０２により前記音声
符号化データから音声復号を行い復号音声を音声／雑音
信号加算器９０４に出力する。

【００７７】一方、雑音信号生成器９０３により前記雑
音モデルパラメータおよび雑音モデル更新フラグから雑
音信号の生成を行い、雑音信号を音声／雑音信号加算器
９０４に出力する。そして、音声／雑音信号加算器９０
４により、前記音声復号化器９０２の出力と前記雑音信
号生成器９０３の出力とを加算し、出力信号とする。

【００７８】次に、図１０を参照して、実施の形態２に
係る音声信号の符号化方法の処理の流れを説明する。な
お、本方法では、図１０に示す本処理を、一定短区間
（例えば、１０〜５０ｍｓ程度）のフレーム毎に繰り返
して行うものとする。

【００７９】まず、ＳＴ３０１において、フレーム単位
の入力信号を入力する。次いで、ＳＴ３０２にて、入力
音声信号を、音声信号と音声信号に重畳している背景雑
音信号とに分離する。そして、ＳＴ３０３において、入
力信号またはＳＴ３０２で得られた分離後の音声信号に
対して有音／無音判定を行い、その判定結果を出力する
（ＳＴ３０４）。

【００８０】そして、判定結果が有音である場合には、
ＳＴ３０５において、ＳＴ３０２で得られた分離後の音
声信号に対して音声符号化器による音声符号化処理を行
い、その符号化データを出力する。次いで、ＳＴ３０２
で得られた分離後の雑音信号に対して、ＳＴ３０６に
て、雑音信号符号化器による雑音信号符号化処理を行
い、入力雑音信号表現する雑音モデルに関する情報と雑
音モデルの更新をするかどうかのフラグを出力する。

【００８１】ＳＴ３０３における有音／無音判定結果が
有音である場合、ＳＴ３０６にて行う雑音信号符号化処
理において、モデル更新を行わないようにする。そし
て、ＳＴ３０７において、前記有音／無音判定、音声符
号化処理および雑音信号符号化処理の結果得られた出力
を用いて送信データとして送信すべき情報の制御と送信
情報との多重化を行い、最後にＳＴ３０８にて送信デー
タとして出力する。

【００８２】このように、本実施の形態の音声信号の符
号化装置によれば、有音区間では音声信号を高品質で符
号化できる音声符号化器で符号化を行い、雑音信号に対
しては高効率で聴感的に劣化が少ない実施の形態１記載
の雑音信号符号化器で符号化を行うことにより、背景雑
音環境下においても高品質・高効率な符号化を行うこと
ができ、さらに音声／雑音信号分離器を設けることによ
り、前記音声符号化器に入力される音声信号から重畳さ
れた背景雑音が除去され、有音区間をより高品質にまた
はより高効率に符号化することができる。

【００８３】（実施の形態３）図１１は、本発明の実施
の形態３に係る音声符号化部の構成を示すブロック図で
ある。なお、本実施の形態における復号側の構成は、図
４に示す音声信号の復号装置の構成と同一である。

【００８４】入力信号分析器１１０１により、ある一定
区間毎に入力された入力信号に対して信号分析を行い、
入力信号に対する分析パラメータを算出する。抽出する
特徴パラメータとしては、入力信号に関する統計的特徴
量を表すのに必要なパラメータおよび音声的な特徴を表
すパラメータである。統計的特徴量を表すのに必要なパ
ラメータとしては、例えば、短区間信号に対してＦＦＴ
により求めた短時間スペクトルや、入力パワー、ＬＰＣ
スペクトルパラメータ、等がある。また、音声的な特徴
を表すパラメータとしては、ＬＰＣパラメータ、入力パ
ワーやピッチ周期性情報、等がある。

【００８５】次に、モード判定器１１０４により、前記
入力信号分析器１１０１で得られた分析パラメータに対
して、音声モデル記憶器１１０２で保持されている音声
的な特徴パターンおよび雑音モデル記憶器１１０３で保
持されている雑音モデルパラメータを用いて、入力信号
が有音区間か無音区間（雑音のみの区間）か、および無
音区間の場合に雑音モデルを更新して更新情報を伝送す
るかどうかの判定を行う。

【００８６】ここで、音声モデル記憶器１１０２は、音
声的な特徴パターンを予め作成記憶しているもので、音
声的な特徴パターンとしては、例えば、音声（有音）区
間中のＬＰＣパラメータ、入力信号パワーやピッチ周期
性情報等の分布などの情報である。また、雑音モデルパ
ラメータとは、入力雑音信号に関する統計的特徴量を表
現できるような雑音モデルに関する情報であり、例え
ば、短時間スペクトルの平均スペクトルや分散値、等の
統計的特徴量を、例えばＨＭＭのような統計モデルで表
現した際の情報である。

【００８７】そして、入力信号分析器１１０１により得
られた現入力信号に対する統計的分析パラメータが、そ
れ以前の雑音区間中の信号を表す雑音モデルとして記憶
された雑音モデルからの出力として妥当かどうか（例え
ば、ＨＭＭモデルであれば現入力信号に対する分析パラ
メータの出力確率が規定値以上であるか）を判定すると
共に、入力信号に対する音声的特徴を表すパラメータか
ら音声（有音）区間かどうかを判定する。

【００８８】前記モード判定器１１０４が有音区間であ
ると判定した場合には、音声符号化器１１０５により、
入力信号に対して音声符号化を行いその符号化データを
ＤＴＸ制御および多重化器１１０７に出力する。一方、
前記モード判定器１１０４が無音区間でかつ雑音モデル
更新情報を伝送すると判定した場合には、雑音モデル更
新器１１０６により、その雑音モデルの更新を行い、更
新後の雑音モデルに関する情報をＤＴＸ制御および多重
化器１１０７に出力する。

【００８９】最後に、ＤＴＸ制御および多重化器１１０
７により、音声符号化器および雑音モデル更新器１１０
６からの出力を用いて送信データとして送信すべき情報
の制御と送信情報の多重化を行い、送信データを出力す
る。

【００９０】次に、図１２を参照して、本実施の形態に
係る音声信号の符号化方法の処理の流れを説明する。な
お、本方法では、図１２に示す本処理を、一定短区間
（例えば、１０〜５０ｍｓ程度）のフレーム毎に繰り返
して行うものとする。

【００９１】まず、ＳＴ４０１において、フレーム単位
の入力信号を入力する。次に、ＳＴ４０２において、あ
る一定区間毎に入力された入力信号に対して信号分析を
行い、その分析パラメータを算出し出力する。

【００９２】そして、ＳＴ４０３において、現在入力さ
れた統計的分析パラメータが、図１１における雑音モデ
ル記憶器１１０３により保持されている雑音モデルから
の出力として妥当かどうかその適合性を判定する（ＳＴ
４０４）。その結果、適合しない、すなわち現入力信号
が現時点で保持されている雑音モデルでは表現できない
と判定された場合には、次のＳＴ４０５に進み、入力信
号に対して分析して得られた音声的特徴パラメータから
音声（有音）区間かどうか判定する。そして、音声区間
と判定された場合、ＳＴ４０６にて、音声符号化器によ
る音声符号化処理を行い、その符号化データを出力す
る。

【００９３】一方、ＳＴ４０５にて、音声区間ではない
と判定された場合、ＳＴ４０７にて、雑音モデルの更新
を行い、更新後の雑音モデルに関する情報を出力する。
ＳＴ４０３にて、現入力が現時点で保持されている雑音
モデルで表現できると判定された場合は、何も処理をせ
ず次ステップに進む。そして、ＳＴ４０８において、音
声符号化器および雑音モデル更新器からの出力を用いて
送信データとして送信すべき情報の制御と送信情報の多
重化を行い、ＳＴ４０９にて送信データを出力する。

【００９４】このように、本実施の形態に係る音声信号
の符号化装置によれば、モード判定器を設けることによ
り、入力信号の統計的特徴量の変化および音声の特徴パ
ターンを用いて判定を行うことができる。したがって、
より正確なモード判定を行うことができ、判定誤りによ
る品質劣化を抑えることができる。

【００９５】

【発明の効果】以上説明したように本発明の雑音信号符
号化装置では、雑音信号を統計的特徴量で表現できるよ
うな雑音モデルでモデル化することにより、背景雑音信
号に対して聴感的に劣化の少ない復号信号を生成するこ
とができる。また、入力信号波形に対する忠実な符号化
が不要となるので、入力信号に対応する雑音モデルパラ
メータが変化する区間のみ伝送することにより、低ビッ
トレートで高効率な符号化を行うことができる。

【００９６】また、本発明の音声信号符号化装置におい
ては、有音区間では音声信号を高品質で符号化できる音
声符号化器で符号化を行い、無音区間では高効率で聴感
的に劣化が少ない前記雑音信号符号化器で符号化を行う
ことにより、背景雑音環境下においても高品質・高効率
な符号化を行うことができる。

【図面の簡単な説明】

【図１】本発明の実施の形態に係る音声信号符号化装置
及び音声信号復号化装置を備えた無線通信システムの構
成を示すブロック図

【図２】本発明の実施の形態１に係る音声信号符号化装
置の構成を示すブロック図

【図３】本発明の実施の形態１に係る雑音信号符号化装
置の構成を示すブロック図

【図４】本発明の実施の形態１に係る音声信号復号化装
置の構成を示すブロック図

【図５】本発明の実施の形態１に係る音声信号復号化装
置における雑音信号生成器の構成を示すブロック図

【図６】本発明の実施の形態１に係る音声信号符号化方
法の処理の流れを示すフロー図

【図７】本発明の実施の形態１に係る雑音信号符号化方
法の処理の流れを示すフロー図

【図８】本発明の実施の形態２に係る音声信号符号化装
置の構成を示すブロック図

【図９】本発明の実施の形態２に係る音声信号復号化装
置の構成を示すブロック図

【図１０】本発明の実施の形態２に係る音声信号符号化
方法の処理の流れを示すフロー図

【図１１】本発明の実施の形態３に係る音声信号符号化
装置の構成を示すブロック図

【図１２】本発明の実施の形態３に係る音声信号符号化
方法の処理の流れを示すフロー図

【図１３】従来の音声信号符号化装置の構成を示すブロ
ック図

【図１４】従来の音声信号符号化装置の構成を示すブロ
ック図

【符号の説明】

２０１有音／無音判定器２０２音声符号化器２０３雑音信号符号化器２０４ＤＴＸ制御および多重化器３０１雑音信号分析部３０２，５０２雑音モデル記憶部３０３雑音モデル変化検出部３０４，５０１雑音モデル更新部４０１分離およびＤＴＸ制御器４０２音声復号化器４０３雑音信号生成器４０４出力切り替え器５０３雑音信号生成部

Claims

【特許請求の範囲】

【請求項１】雑音信号を含む音声信号の前記雑音信号
に対して信号分析を行う分析手段と、前記雑音信号を表
わす雑音モデルに関する情報を記憶する記憶手段と、現
入力の雑音信号の信号分析結果に基づいて、記憶された
雑音モデルに関する情報の変化を検出する検出手段と、
雑音モデルに関する情報の変化が検出された場合に、前
記変化の変化量分だけ前記記憶された雑音モデルに関す
る情報を更新する更新手段と、を具備することを特徴と
する雑音信号符号化装置。
【請求項２】分析手段は、雑音信号に関する統計的特
徴量を抽出し、記憶手段は、前記統計的特徴量を表現で
きる情報を雑音モデルに関する情報として記憶すること
を特徴とする請求項１記載の雑音信号符号化装置。
【請求項３】入力音声信号に対して有音区間か雑音信
号のみを含む無音区間かを判定する有音／無音判定手段
と、判定結果が有音である場合に前記入力音声信号に対
して音声符号化を行う音声符号化手段と、判定結果が無
音である場合に前記入力信号に対して雑音信号の符号化
を行う請求項１又は請求項２記載の雑音信号符号化装置
と、前記有音／無音判定手段、前記音声符号化手段、お
よび前記雑音信号符号化装置からの出力を多重化する多
重化手段と、を具備することを特徴とする音声信号符号
化装置。
【請求項４】入力音声信号を、音声信号とこの音声信
号に重畳している背景雑音信号とに分離する音声／雑音
信号分離手段と、前記入力音声信号又は前記音声／雑音
信号分離手段により得られる音声信号から有音区間か雑
音信号のみを含む無音区間かを判定する有音／無音判定
手段と、判定結果が有音である場合に前記入力音声信号
に対して音声符号化を行う音声符号化手段と、前記音声
／雑音信号分離手段により得られる背景雑音信号の符号
化を行う請求項１又は請求項２記載の雑音信号符号化装
置と、前記有音／無音判定手段、前記音声符号化手段、
および前記雑音信号符号化装置からの出力を多重化する
多重化手段と、を具備することを特徴とする音声信号符
号化装置。
【請求項５】入力音声信号に対して信号分析を行う分
析手段と、前記入力音声信号が有音信号であるかどうか
を判定するために必要な音声の特徴パターンを記憶する
音声モデル記憶手段と、前記入力音声信号に含まれる雑
音信号を表現する雑音モデルに関する情報を記憶する雑
音モデル記憶手段と、前記分析手段、音声モデル記憶手
段および雑音モデル記憶手段の出力を用いて、前記入力
音声信号が有音区間か雑音信号のみを含む無音区間かを
判定すると共に、前記無音区間の場合に雑音モデルを更
新するかどうかの判定を行うモード判定手段と、前記モ
ード判定手段が有音区間と判定した場合に入力音声信号
に対して音声符号化を行う音声符号化手段と、前記モー
ド判定手段が無音区間でかつ雑音モデルを更新すると判
定した場合にその雑音モデルの更新を行う雑音モデル更
新手段と、音声符号化手段および雑音モデル更新手段か
らの出力を多重化する多重化手段と、を具備することを
特徴とする音声信号符号化装置。
【請求項６】請求項３から請求項５のいずれかに記載
の音声信号符号化装置を備えたことを特徴とする基地局
装置。
【請求項７】請求項３から請求項５のいずれかに記載
の音声信号符号化装置を備えたことを特徴とする通信端
末装置。
【請求項８】符号化側で入力雑音信号に対して符号化
された雑音モデルパラメータおよび雑音モデル更新フラ
グにしたがって、必要な場合に雑音モデルの更新を行う
雑音モデル更新手段と、前記雑音モデル更新手段の出力
を用いて更新後の雑音モデルに関する情報を記憶する雑
音モデル記憶手段と、前記雑音モデル記憶手段で記憶し
ている雑音モデルに関する情報から雑音信号を生成する
雑音信号生成手段と、を具備することを特徴とする雑音
信号生成装置。
【請求項９】前記雑音モデル更新手段へ入力する雑音
モデルパラメータおよび前記雑音モデル記憶手段で記憶
する情報が、生成する雑音信号に関する統計的特徴量を
表現できる情報であることを特徴とする請求項８記載の
雑音信号生成装置。
【請求項１０】符号化側で符号化された音声データ、
雑音モデルパラメータ、有音／無音判定フラグおよび雑
音モデル更新フラグを含む信号を受信し、前記信号から
雑音モデルパラメータ、有音／無音判定フラグおよび雑
音モデル更新フラグを分離する分離手段と、前記有音／
無音判定フラグが有音区間を示す場合に、前記音声デー
タに対して音声復号を行う音声復号化手段と、前記有音
／無音判定フラグが無音区間を示す場合に、前記雑音モ
デルパラメータおよび雑音モデル更新フラグから雑音信
号の生成を行う請求項８又は請求項９記載の雑音信号生
成装置と、前記音声復号化手段から出力される復号音声
と前記雑音信号生成装置から出力される雑音信号のいず
れかを、前記有音／無音判定フラグに応じて切り替えて
出力信号として出力する出力切り替え手段と、を具備す
ることを特徴とする音声信号復号化装置。
【請求項１１】符号化側で符号化された音声データ、
雑音モデルパラメータ、有音／無音判定フラグおよび雑
音モデル更新フラグを含む信号を受信し、前記信号から
雑音モデルパラメータ、有音／無音判定フラグおよび雑
音モデル更新フラグを分離する分離手段と、前記有音／
無音判定フラグが有音区間を示す場合に、前記音声デー
タに対して音声復号を行う音声復号化手段と、前記有音
／無音判定フラグが無音区間を示す場合に、前記雑音モ
デルパラメータおよび雑音モデル更新フラグから雑音信
号の生成を行う請求項８又は請求項９記載の雑音信号生
成装置と、前記音声復号化手段から出力される復号音声
と前記雑音信号生成装置から出力される雑音信号とを加
算する音声／雑音信号加算手段と、を具備することを特
徴とする音声信号復号化装置。
【請求項１２】入力音声信号に対して有音区間か雑音
信号のみを含む無音区間かを判定する有音／無音判定工
程と、判定結果が有音である場合に前記入力音声信号に
対して音声符号化を行う音声符号化工程と、判定結果が
無音である場合に前記入力信号に対して雑音信号の符号
化を行う雑音信号符号化工程と、前記有音／無音判定工
程、前記音声符号化工程、および前記雑音信号符号化工
程における出力を多重化する多重化工程と、を具備し、雑音信号符号化工程は、雑音信号を含む音声信号の前記
雑音信号に対して信号分析を行う分析工程と、前記雑音
信号を表わす雑音モデルに関する情報を記憶する記憶工
程と、現入力の雑音信号の信号分析結果に基づいて、記
憶された雑音モデルに関する情報の変化を検出する検出
工程と、雑音モデルに関する情報の変化が検出された場
合に、前記変化の変化量分だけ前記記憶された雑音モデ
ルに関する情報を更新する更新工程と、を含むことを特
徴とする音声信号符号化方法。
【請求項１３】入力音声信号を、音声信号とこの音声
信号に重畳している背景雑音信号とに分離する音声／雑
音信号分離工程と、前記入力音声信号又は前記音声／雑
音信号分離工程において得られる音声信号から有音区間
か雑音信号のみを含む無音区間かを判定する有音／無音
判定工程と、判定結果が有音である場合に前記入力音声
信号に対して音声符号化を行う音声符号化工程と、判定
結果が無音である場合に前記入力信号に対して雑音信号
の符号化を行うと共に、前記音声／雑音信号分離工程に
おいて得られる背景雑音信号の符号化を行う雑音信号符
号化工程と、前記有音／無音判定工程、前記音声符号化
工程、および前記雑音信号符号化工程における出力を多
重化する多重化工程と、を具備し、雑音信号符号化工程は、雑音信号を含む音声信号の前記
雑音信号に対して信号分析を行う分析工程と、前記雑音
信号を表わす雑音モデルに関する情報を記憶する記憶工
程と、現入力の雑音信号の信号分析結果に基づいて、記
憶された雑音モデルに関する情報の変化を検出する検出
工程と、雑音モデルに関する情報の変化が検出された場
合に、前記変化の変化量分だけ前記記憶された雑音モデ
ルに関する情報を更新する更新工程と、を含むことを特
徴とする音声信号符号化方法。
【請求項１４】入力音声信号に対して信号分析を行う
分析工程と、前記入力音声信号が有音信号であるかどう
かを判定するために必要な音声の特徴パターンを記憶す
る音声モデル記憶工程と、前記入力音声信号に含まれる
雑音信号を表現する雑音モデルに関する情報を記憶する
雑音モデル記憶工程と、前記分析手段、音声モデル記憶
手段および雑音モデル記憶手段の出力を用いて、前記入
力音声信号が有音区間か雑音信号のみを含む無音区間か
を判定すると共に、前記無音区間の場合に雑音モデルを
更新するかどうかの判定を行うモード判定工程と、前記
モード判定手段が有音区間と判定した場合に入力音声信
号に対して音声符号化を行う音声符号化工程と、前記モ
ード判定手段が無音区間でかつ雑音モデルを更新すると
判定した場合にその雑音モデルの更新を行う雑音モデル
更新工程と、音声符号化手段および雑音モデル更新手段
からの出力を多重化する多重化工程と、を具備すること
を特徴とする音声信号符号化方法。
【請求項１５】コンピュータに、入力雑音信号に対し
て統計的特徴量の分析を行う手順と、入力雑音信号に対
する統計的特徴量を表現する雑音モデルに関する情報を
記憶する手順と、入力雑音信号を表す雑音モデルの変化
を検出する手順と、必要な場合に雑音モデルの更新を行
い更新後の雑音モデルに関する情報を出力する手順、を
実行させるためのプログラムを記録した機械読みとり可
能な記憶媒体。