JP2000357000A - 雑音信号符号化装置および音声信号符号化装置 - Google Patents
雑音信号符号化装置および音声信号符号化装置Info
- Publication number
- JP2000357000A JP2000357000A JP11168545A JP16854599A JP2000357000A JP 2000357000 A JP2000357000 A JP 2000357000A JP 11168545 A JP11168545 A JP 11168545A JP 16854599 A JP16854599 A JP 16854599A JP 2000357000 A JP2000357000 A JP 2000357000A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- noise
- voice
- speech
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 claims abstract description 5
- 230000005236 sound signal Effects 0.000 claims description 54
- 238000000034 method Methods 0.000 claims description 49
- 238000000926 separation method Methods 0.000 claims description 9
- 238000004891 communication Methods 0.000 claims description 6
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 2
- 230000015556 catabolic process Effects 0.000 abstract description 4
- 238000006731 degradation reaction Methods 0.000 abstract description 4
- 230000005540 biological transmission Effects 0.000 description 28
- 238000010586 diagram Methods 0.000 description 20
- 238000001228 spectrum Methods 0.000 description 11
- 230000006866 deterioration Effects 0.000 description 8
- 230000005284 excitation Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000013179 statistical model Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- DZRJLJPPUJADOO-UHFFFAOYSA-N chaetomin Natural products CN1C(=O)C2(Cc3cn(C)c4ccccc34)SSC1(CO)C(=O)N2C56CC78SSC(CO)(N(C)C7=O)C(=O)N8C5Nc9ccccc69 DZRJLJPPUJADOO-UHFFFAOYSA-N 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02168—Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
も復号音声の劣化を抑えること。 【解決手段】 雑音信号分析部301により算出された
入力雑音信号に対する統計的特徴量に対して、入力雑音
信号に関する統計的特徴量を表現できるような雑音モデ
ルに関する情報を記憶する雑音モデル記憶部302を用
いて、入力雑音信号を表す雑音モデルパラメータが変化
したかどうの検出を、雑音モデル変化検出部303にお
いて行い、雑音モデル更新部304により、雑音モデル
の更新を行い更新後のモデル情報を出力する。上記で構
成された雑音信号符号器を用いて、入力信号の無音区間
(雑音のみの区間)又は音声信号から分離された雑音信
号に対して符号化を行い、有音区間においては音声符号
器により符号化を行う。
Description
して伝送する移動通信システムや音声録音装置等の用途
に用いられる低ビットレート音声信号符号化装置に関す
る。
おいては、電波や記憶媒体の有効利用のために音声情報
を圧縮し、低いビットレートで符号化する音声符号化装
置が用いられている。そのような従来の技術として、I
TU−T勧告G.729("Coding of speech at 8kbit
/s using conjugate-structure algebraic-code-excite
d linear-prediction(CS-ACELP)")のCS−ACELP
符号化方式や、同じくITU−T勧告のG.729 An
nex B("A silence compression scheme for G.729 opt
imized for terminals conforming to Recommendation
V.70")のDTX(Discontinuous Transmission)制御付
きのCS−ACELP符号化方式がある。
方式の符号化装置の構成を示すブロック図である。図1
3において、入力音声信号に対してLPC分析・量子化
器1でLPC(線形予測)分析および量子化を行い、L
PC係数およびLPC量子化符号を出力する。
符号帳3から取り出された適応音源信号および固定音源
信号にゲイン符号帳4から取り出されたゲインを乗じて
加算し、LPC合成フィルタ7により音声合成を行い、
入力信号に対する誤差信号を聴覚重み付けフィルタ9に
より重み付けを行い、重み付け後の誤差が最小となる適
応音源符号、固定音源符号、ゲイン符号をLPC量子化
符号と共に符号化データとして出力する。なお、図13
において、5は乗算器であり、6は加算器であり、8は
減算器である。
CELP符号化方式の符号化装置の構成を示すブロック
図である。まず、有音/無音判定器11により入力信号
が有音区間か無音区間(背景雑音のみの区間)かの判定
を行う。そして、有音/無音判定器11により有音と判
定された場合、CS−ACELP音声符号化器12によ
り有音区間の音声符号化を行う。なお、CS−ACEL
P音声符号化器12は、図13に示す構成となってい
る。
判定された場合、無音区間符号化器13により符号化を
行う。この無音区間符号化器13は、入力信号から有音
区間の符号化と同様なLPC係数と入力信号のLPC予
測残差エネルギーを算出し、それらを無音区間の符号化
データとして出力する。
無音判定器11、CS−ACELP音声符号化器12お
よび無音区間符号化器13の出力から、送信データとし
て送信すべきデータを制御し、多重化して送信データと
して出力する。
来のCS−ACELP符号化器では、音声符号化器が音
声特有の冗長性を利用して8kbpsという低ビットレ
ートで符号化を行っているため、背景雑音が重畳されな
いクリーンな音声信号が入力された場合には、高品質な
符号化が可能であるが、入力信号として周囲の背景雑音
が重畳された音声信号が入力された場合、背景雑音信号
を符号化した際にその復号信号の品質が劣化するという
問題がある。
CELP符号化器においては、有音区間のみCS−AC
ELP符号化器により符号化を行い、無音区間(雑音の
みの区間)は、専用の無音区間符号化器で音声符号化器
より少ないビットレートで符号化を行うことで、伝送す
る平均ビットレートを低減する。しなしながら、無音区
間符号化器が音声符号化器と同様な信号モデル(短区間
(10〜50ms程度)毎にAR型の合成フィルタ(L
PC合成フィルタ)を雑音信号で駆動することで復号信
号を生成する)で符号化を行っているため、上記従来の
CS−ACELP符号化器と同様に、背景雑音が重畳さ
れた音声信号に対しては復号信号の品質が劣化するとい
う問題がある。
あり、背景雑音が重畳された音声信号に対しても復号信
号の品質の劣化が少なく、かつ伝送に必要な平均ビット
レートも低減することのできる音声信号の符号化装置お
よび復号装置を提供することを目的とする。
間(雑音のみの区間)の入力信号に対する統計的特徴量
を算出し、入力雑音信号に関する統計的特徴量を表現で
きるような雑音モデルに関する情報を記憶し、入力雑音
信号を表す雑音モデルパラメータが変化したかどうかを
検出し、雑音モデルの更新を行うことにより、背景雑音
が重畳された音声信号に対しても復号信号の品質の劣化
が少なく、かつ伝送に必要な平均ビットレートも低減す
ることである。
号符号化装置は、雑音信号を含む音声信号の前記雑音信
号に対して信号分析を行う分析手段と、前記雑音信号を
表わす雑音モデルに関する情報を記憶する記憶手段と、
現入力の雑音信号の信号分析結果に基づいて、記憶され
た雑音モデルに関する情報の変化を検出する検出手段
と、雑音モデルに関する情報の変化が検出された場合
に、前記変化の変化量分だけ前記記憶された雑音モデル
に関する情報を更新する更新手段と、を具備する構成を
採る。
量で表現できるような雑音モデルでモデル化することに
より、背景雑音信号に対して聴感的に劣化の少ない復号
信号を生成することができる。また、このモデル化によ
り、入力信号波形に対する忠実な符号化が不要となるの
で、入力信号に対応する雑音モデルパラメータが変化す
る区間のみ伝送することにより、低ビットレートで高効
率な符号化を行うことができる。
装置は、第1の態様において、分析手段が、雑音信号に
関する統計的特徴量を抽出し、記憶手段は、前記統計的
特徴量を表現できる情報を雑音モデルに関する情報とし
て記憶する構成を採る。
ル化することができ、低ビットレートで高効率な符号化
を効率良く行うことができる。
装置は、入力音声信号に対して有音区間か雑音信号のみ
を含む無音区間かを判定する有音/無音判定手段と、判
定結果が有音である場合に前記入力音声信号に対して音
声符号化を行う音声符号化手段と、判定結果が無音であ
る場合に前記入力信号に対して雑音信号の符号化を行う
第1又は第2の態様の雑音信号符号化装置と、前記有音
/無音判定手段、前記音声符号化手段、および前記雑音
信号符号化装置からの出力を多重化する多重化手段と、
を具備する構成を採る。
を高品質で符号化できる音声符号化手段で符号化を行
い、無音区間では高効率で聴感的に劣化が少ない第1の
態様の雑音信号符号化装置で符号化を行うことにより、
背景雑音環境下においても高品質・高効率な符号化を行
うことができる。
装置は、入力音声信号を、音声信号とこの音声信号に重
畳している背景雑音信号とに分離する音声/雑音信号分
離手段と、前記入力音声信号又は前記音声/雑音信号分
離手段により得られる音声信号から有音区間か雑音信号
のみを含む無音区間かを判定する有音/無音判定手段
と、判定結果が有音である場合に前記入力音声信号に対
して音声符号化を行う音声符号化手段と、前記音声/雑
音信号分離手段により得られる背景雑音信号の符号化を
行う第1又は第2の態様の雑音信号符号化装置と、前記
有音/無音判定手段、前記音声符号化手段、および前記
雑音信号符号化装置からの出力を多重化する多重化手段
と、を具備する構成を採る。
を高品質で符号化できる音声符号化手段で符号化を行
い、雑音信号に対しては高効率で聴感的に劣化が少ない
第1の態様の雑音信号符号化装置で符号化を行うことに
より、背景雑音環境下においても高品質・高効率な符号
化を行うことができる。また、音声/雑音信号分離手段
を設けることにより、前記音声符号化手段に入力される
音声信号から重畳された背景雑音を除去することがで
き、有音区間をより高品質に又はより高効率に符号化す
ることができる。
装置は、入力音声信号に対して信号分析を行う分析手段
と、前記入力音声信号が有音信号であるかどうかを判定
するために必要な音声の特徴パターンを記憶する音声モ
デル記憶手段と、前記入力音声信号に含まれる雑音信号
を表現する雑音モデルに関する情報を記憶する雑音モデ
ル記憶手段と、前記分析手段、音声モデル記憶手段およ
び雑音モデル記憶手段の出力を用いて、前記入力音声信
号が有音区間か雑音信号のみを含む無音区間かを判定す
ると共に、前記無音区間の場合に雑音モデルを更新する
かどうかの判定を行うモード判定手段と、前記モード判
定手段が有音区間と判定した場合に入力音声信号に対し
て音声符号化を行う音声符号化手段と、前記モード判定
手段が無音区間でかつ雑音モデルを更新すると判定した
場合にその雑音モデルの更新を行う雑音モデル更新手段
と、音声符号化手段および雑音モデル更新手段からの出
力を多重化する多重化手段と、を具備する構成を採る。
ることにより、入力信号の統計的特徴量の変化および音
声の特徴パターンを用いて判定を行うことができる。し
たがって、より正確なモード判定を行うことができ、判
定誤りによる品質劣化を抑えることができる。
第3から第5のいずれかの態様の音声信号符号化装置を
備えたことを特徴とする。本発明の第7の態様に係る通
信端末装置は、第3から第5のいずれかの態様の音声信
号符号化装置を備えたことを特徴とする。
置は、符号化側で入力雑音信号に対して符号化された雑
音モデルパラメータおよび雑音モデル更新フラグにした
がって、必要な場合に雑音モデルの更新を行う雑音モデ
ル更新手段と、前記雑音モデル更新手段の出力を用いて
更新後の雑音モデルに関する情報を記憶する雑音モデル
記憶手段と、前記雑音モデル記憶手段で記憶している雑
音モデルに関する情報から雑音信号を生成する雑音信号
生成手段と、を具備する構成を採る。
聴感的に劣化の少ない復号信号を生成することができ
る。
置は、第8の態様において、前記雑音モデル更新手段へ
入力する雑音モデルパラメータおよび前記雑音モデル記
憶手段で記憶する情報が、生成する雑音信号に関する統
計的特徴量を表現できる情報である構成を採る。
量で表現できるような雑音モデルでモデル化することに
より、背景雑音信号に対して聴感的に劣化の少ない復号
信号を生成することができる。
化装置は、符号化側で符号化された音声データ、雑音モ
デルパラメータ、有音/無音判定フラグおよび雑音モデ
ル更新フラグを含む信号を受信し、前記信号から雑音モ
デルパラメータ、有音/無音判定フラグおよび雑音モデ
ル更新フラグを分離する分離手段と、前記有音/無音判
定フラグが有音区間を示す場合に、前記音声データに対
して音声復号を行う音声復号化手段と、前記有音/無音
判定フラグが無音区間を示す場合に、前記雑音モデルパ
ラメータおよび雑音モデル更新フラグから雑音信号の生
成を行う第8又は第9の態様の雑音信号生成装置と、前
記音声復号化手段から出力される復号音声と前記雑音信
号生成装置から出力される雑音信号のいずれかを、前記
有音/無音判定フラグに応じて切り替えて出力信号とし
て出力する出力切り替え手段と、を具備する構成を採
る。
聴感的に劣化の少ない復号信号を生成することができ
る。
化装置は、符号化側で符号化された音声データ、雑音モ
デルパラメータ、有音/無音判定フラグおよび雑音モデ
ル更新フラグを含む信号を受信し、前記信号から雑音モ
デルパラメータ、有音/無音判定フラグおよび雑音モデ
ル更新フラグを分離する分離手段と、前記有音/無音判
定フラグが有音区間を示す場合に、前記音声データに対
して音声復号を行う音声復号化手段と、前記有音/無音
判定フラグが無音区間を示す場合に、前記雑音モデルパ
ラメータおよび雑音モデル更新フラグから雑音信号の生
成を行う第8又は第9の態様の雑音信号生成装置と、前
記音声復号化手段から出力される復号音声と前記雑音信
号生成装置から出力される雑音信号とを加算する音声/
雑音信号加算手段と、を具備する構成を採る。
聴感的に劣化の少ない復号信号を生成することができ
る。また、符号化側で音声信号とそれに重畳する雑音信
号を分離した後に、それぞれの信号に適した符号器で符
号化し、復号側でそれらを加算して復号信号を生成する
ので、有音区間の音声信号をより高品質に符号化するこ
とができる。
化方法は、入力音声信号に対して有音区間か雑音信号の
みを含む無音区間かを判定する有音/無音判定工程と、
判定結果が有音である場合に前記入力音声信号に対して
音声符号化を行う音声符号化工程と、判定結果が無音で
ある場合に前記入力信号に対して雑音信号の符号化を行
う雑音信号符号化工程と、前記有音/無音判定工程、前
記音声符号化工程、および前記雑音信号符号化工程にお
ける出力を多重化する多重化工程と、を具備し、雑音信
号符号化工程は、雑音信号を含む音声信号の前記雑音信
号に対して信号分析を行う分析工程と、前記雑音信号を
表わす雑音モデルに関する情報を記憶する記憶工程と、
現入力の雑音信号の信号分析結果に基づいて、記憶され
た雑音モデルに関する情報の変化を検出する検出工程
と、雑音モデルに関する情報の変化が検出された場合
に、前記変化の変化量分だけ前記記憶された雑音モデル
に関する情報を更新する更新工程と、を含む。
を高品質で符号化できる音声符号化手段で符号化を行
い、無音区間では高効率で聴感的に劣化が少ない第1の
態様の雑音信号符号化装置で符号化を行うことにより、
背景雑音環境下においても高品質・高効率な符号化を行
うことができる。
化方法は、入力音声信号を、音声信号とこの音声信号に
重畳している背景雑音信号とに分離する音声/雑音信号
分離工程と、前記入力音声信号又は前記音声/雑音信号
分離工程において得られる音声信号から有音区間か雑音
信号のみを含む無音区間かを判定する有音/無音判定工
程と、判定結果が有音である場合に前記入力音声信号に
対して音声符号化を行う音声符号化工程と、判定結果が
無音である場合に前記入力信号に対して雑音信号の符号
化を行うと共に、前記音声/雑音信号分離工程において
得られる背景雑音信号の符号化を行う雑音信号符号化工
程と、前記有音/無音判定工程、前記音声符号化工程、
および前記雑音信号符号化工程における出力を多重化す
る多重化工程と、を具備し、雑音信号符号化工程は、雑
音信号を含む音声信号の前記雑音信号に対して信号分析
を行う分析工程と、前記雑音信号を表わす雑音モデルに
関する情報を記憶する記憶工程と、現入力の雑音信号の
信号分析結果に基づいて、記憶された雑音モデルに関す
る情報の変化を検出する検出工程と、雑音モデルに関す
る情報の変化が検出された場合に、前記変化の変化量分
だけ前記記憶された雑音モデルに関する情報を更新する
更新工程と、を含む。
を高品質で符号化できる音声符号化手段で符号化を行
い、無音区間では高効率で聴感的に劣化が少ない第1の
態様の雑音信号符号化装置で符号化を行うことにより、
背景雑音環境下においても高品質・高効率な符号化を行
うことができる。また、音声/雑音信号分離手段を設け
ることにより、前記音声符号化手段に入力される音声信
号から重畳された背景雑音を除去することができ、有音
区間をより高品質に又はより高効率に符号化することが
できる。
化方法は、入力音声信号に対して信号分析を行う分析工
程と、前記入力音声信号が有音信号であるかどうかを判
定するために必要な音声の特徴パターンを記憶する音声
モデル記憶工程と、前記入力音声信号に含まれる雑音信
号を表現する雑音モデルに関する情報を記憶する雑音モ
デル記憶工程と、前記分析手段、音声モデル記憶手段お
よび雑音モデル記憶手段の出力を用いて、前記入力音声
信号が有音区間か雑音信号のみを含む無音区間かを判定
すると共に、前記無音区間の場合に雑音モデルを更新す
るかどうかの判定を行うモード判定工程と、前記モード
判定手段が有音区間と判定した場合に入力音声信号に対
して音声符号化を行う音声符号化工程と、前記モード判
定手段が無音区間でかつ雑音モデルを更新すると判定し
た場合にその雑音モデルの更新を行う雑音モデル更新工
程と、音声符号化手段および雑音モデル更新手段からの
出力を多重化する多重化工程と、を具備する。
ることにより、入力信号の統計的特徴量の変化および音
声の特徴パターンを用いて判定を行うことができる。し
たがって、より正確なモード判定を行うことができ、判
定誤りによる品質劣化を抑えることができる。
コンピュータに、入力雑音信号に対して統計的特徴量の
分析を行う手順と、入力雑音信号に対する統計的特徴量
を表現する雑音モデルに関する情報を記憶する手順と、
入力雑音信号を表す雑音モデルの変化を検出する手順
と、必要な場合に雑音モデルの更新を行い更新後の雑音
モデルに関する情報を出力する手順、を実行させるため
のプログラムを記録した機械読みとり可能なものであ
る。
図面を参照して詳細に説明する。 (実施の形態1)図1は、本発明の実施の形態1に係る
音声信号符号化装置を備えた無線通信装置の構成を示す
ブロック図である。
がマイクなどの音声入力装置101によって電気的アナ
ログ信号に変換され、A/D変換器102に出力され
る。アナログ音声信号は、A/D変換器102によって
ディジタル音声信号に変換され、音声符号化部103に
出力される。音声符号化部103は、ディジタル音声信
号に対して音声符号化処理を行い、符号化した情報を変
復調部104に出力する。変復調部104は、符号化さ
れた音声信号をディジタル変調して、無線送信部105
に送る。無線送信部105では、変調後の信号に所定の
無線送信処理を施す。この信号は、アンテナ106を介
して送信される。
ナ107で受信した受信信号は、無線受信部108で所
定の無線受信処理が施され、変復調部104に送られ
る。変復調部104では、受信信号に対して復調処理を
行い、復調後の信号を音声復号化部109に出力する。
音声復号化部109は、復調後の信号に復号処理を行っ
てディジタル復号音声信号を得て、そのディジタル復号
音声信号をD/A変換器110へ出力する。D/A変換
器110は、音声復号化部109から出力されたディジ
タル復号音声信号をアナログ復号音声信号に変換してス
ピーカなどの音声出力装置111に出力する。最後に音
声出力装置111が電気的アナログ復号音声信号を復号
音声に変換して出力する。
示す構成を有する。図2は、本発明の実施の形態1に係
る音声符号化部の構成を示すブロック図である。
声信号に対して有音区間か無音区間(雑音のみの区間)
かを判定し、その判定結果をDTX制御および多重化器
204に出力する。有音/無音判定器201は任意のも
のでよく、一般には、入力信号のパワー、スペクトルや
ピッチ周期などの複数のパラメータの瞬時量または変化
量等を用いて判定が行われる。
る判定結果が有音である場合には、音声符号化器202
により、音声信号と雑音信号が含まれる有音区間におい
て入力音声信号に対して音声符号化を行い、その符号化
データをDTX制御および多重化器204に出力する。
この音声符号化器202は、有音区間用の符号化器であ
り、音声を高能率に符号化するものであれば任意の符号
化器でよい。
判定結果が無音である場合には、雑音信号符号化器20
3により、雑音信号のみが含まれる無音区間において入
力信号に対して雑音信号の符号化を行い、入力雑音信号
を表現する雑音モデルに関する情報と、雑音モデルの更
新をするかどうかのフラグとをDTX制御および多重化
器204に出力する。最後に、DTX制御および多重化
器204により、前記有音/無音判定器201、音声符
号化器202および雑音信号符号化器203からの出力
を用いて送信データとして送信すべき情報の制御と送信
情報の多重化を行い、送信データとして出力する。
図3に示す構成を有する。図3は、本発明の実施の形態
1に係る音声符号化部の雑音信号符号化器の構成を示す
ブロック図である。
間毎に入力された雑音信号に対して信号分析を行い、雑
音信号に対する分析パラメータを算出する。抽出する分
析パラメータとしては、入力信号に関する統計的特徴量
を表すのに必要なパラメータであり、例えば、短区間信
号に対してFFT(Fast Fourier Transform)により求め
た短時間スペクトルや、入力パワー、LPCスペクトル
パラメータ等がある。
て、現在入力された雑音信号を表すべき雑音モデルパラ
メータが、雑音モデル記憶部302により保持されてい
る雑音モデルパラメータから変化しているかどうかを検
出する。
雑音信号に関する統計的特徴量を表現できるような雑音
モデルに関する情報であり、例えば、短時間スペクトル
の平均スペクトルや分散値、等の統計的特徴量を、例え
ばHMMのような統計モデルで表現した際の情報であ
る。
雑音信号分析部301により得られた現入力信号に対す
る分析パラメータが、それ以前の入力信号を表す雑音モ
デルとして記憶された雑音モデルからの出力として妥当
かどうか(例えば、HMMモデルであれば現入力信号に
対する分析パラメータの出力確率が規定値以上である
か)を判定し、現在入力された雑音信号を表すべき雑音
モデルパラメータが記憶された雑音モデルから変化して
いると判定された場合に、雑音モデルの更新を行うかど
うかのフラグと更新すべき情報(更新情報)を雑音モデ
ル更新部304に出力する。
更新を許可するかどうかを外部から指示するフラグで、
後述する本発明における音声符号化部において、有音区
間中の符号化データを送信する期間中等、雑音モデルパ
ラメータの送信を行わないようにする際には、雑音モデ
ルの更新を不許可とする。
て、雑音モデル更新フラグが更新を示す場合には、雑音
モデル更新情報として、更新後の雑音モデルパラメータ
または以前に雑音モデル記憶部302に記憶されている
雑音モデルパラメータからの変化分のみの情報を出力す
ると共に、その出力情報を用いて雑音モデル記憶部30
2の更新を行う。一方、雑音モデル更新フラグが非更新
を示す場合には、更新を行わず、更新情報を出力しな
い。
図4に示す構成を有する。図4は、本発明の実施の形態
1に係る音声復号化装置の構成を示すブロック図であ
る。
符号化側で入力信号に対して符号化され送信された送信
データを受信データとして受信し、この受信データを音
声復号および雑音生成に必要な、音声符号化データまた
は雑音モデルパラメータ、有音/無音判定フラグおよび
雑音モデル更新フラグに分離する。
区間を示す場合には、音声復号化器402により前記音
声符号化データから音声復号を行い復号音声を出力切替
え器404に出力する。
間を示す場合には、雑音信号生成器403により前記雑
音モデルパラメータおよび雑音モデル更新フラグから雑
音信号の生成を行し、雑音信号を出力切替え器404に
出力する。そして、出力切り替え器404により、前記
音声復号化器402の出力と前記雑音信号生成器403
の出力を、有音/無音判定フラグの結果に応じて切り替
えて出力し、出力信号とする。
5に示す構成を有する。図5は、本発明の実施の形態1
に係る音声復号化装置の雑音信号生成器の構成を示すブ
ロック図である。
力された、雑音モデル更新フラグおよび雑音モデルパラ
メータ(モデル更新の場合)が雑音モデル更新部501
に入力される。雑音モデル更新部501においては、前
記雑音モデル更新フラグが更新を示している場合、前記
入力雑音モデルパラメータおよび雑音モデル記憶部50
2で保持されている以前の雑音モデルパラメータを用い
て、雑音モデルの更新を行い、更新後の雑音モデルパラ
メータを雑音モデル記憶部502にて新たに記憶する。
憶部502の情報をもとに、雑音信号を生成し出力す
る。雑音生成は、統計的特徴量をパラメータにモデル化
された情報をもとに、生成される雑音信号がそのモデル
からの出力として妥当な信号となるように生成される。
例えば、統計モデルとしてHMMを用いた場合、その状
態遷移確率およびパラメータ出力確率等に従って、生成
に必要な信号パラメータ(例えば、短時間スペクトル)
を確率的に出力し、それに基づき雑音信号を生成・出力
する。
び音声復号化部の動作について説明する。図6は、実施
の形態1に係る音声信号の符号化方法の処理の流れを示
すフロー図である。なお、本方法では、図6に示す本処
理を、一定短区間(例えば、10〜50ms程度)のフ
レーム毎に繰り返して行うものとする。
01において、フレーム単位の音声信号を入力する。次
に、ST102にて、入力信号に対する有音/無音判定
を行い、その判定結果を出力する。そして、その判定結
果が有音である場合には、ST104により入力音声信
号に対して音声符号化処理を行いその符号化データを出
力する。
である場合には、ST105にて、入力信号に対して雑
音信号符号化器による雑音信号符号化処理を行い、入力
雑音信号を表現する雑音モデルに関する情報と雑音モデ
ルの更新を行うかどうかのフラグを出力する。なお、雑
音信号の符号化処理については後述する。
無音判定、音声符号化処理および雑音信号符号化処理の
結果得られた出力を用いて送信データとして送信すべき
情報の制御と送信情報の多重化を行い、最後にST10
7にて、送信データとして出力する。
号化方法における雑音信号符号化方法の処理の流れを示
すフロー図である。なお、本方法では、図7に示す本処
理を、一定短区間(例えば、10〜50ms程度)のフ
レーム毎に繰り返して行うものとする。
信号を入力する。次に、ST202において、フレーム
単位の雑音信号に対して信号分析を行い、雑音信号に対
する分析パラメータを算出する。そして、ST203に
おいて、分析パラメータから雑音モデルの変化があるか
どうかの検出を行い、雑音モデルが変化したと判定され
た場合、ST205にて、雑音モデルの更新をするかど
うかのフラグ(更新あり)と更新すべき情報(更新情
報)を出力すると共に、ST206にて、その出力情報
を用いて雑音モデル記憶部302の更新を行う。
なしと判定された場合には、ST207にて、雑音モデ
ルの更新をするかどうかのフラグ(更新なし)のみ出力
する。なお、ST203において、外部から別途入力さ
れる外部更新許可フラグが不許可の場合、モデル変化な
しとして雑音モデルパラメータの送信を行わないように
する。
化方法によれば、雑音信号を統計的特徴量で表現できる
ような雑音モデルでモデル化することにより、背景雑音
信号に対して聴感的に劣化の少ない復号信号を生成する
ことができる。また、入力信号波形に対する忠実な符号
化が不要であると共に、入力信号に対応する雑音モデル
パラメータが変化する区間のみ伝送することにより、低
ビットレートで高効率な符号化を行うことができる。
化方法によれば、有音区間では音声信号を高品質で符号
化できる音声符号化器で符号化を行い、無音区間では高
効率で聴感的に劣化が少ない雑音信号符号化器で符号化
を行うことにより、背景雑音環境下においても高品質・
高効率な符号化を行うことができる。
形態2に係る音声信号の符号化部の構成を示すブロック
図である。
/雑音信号分離器801で、入力音声信号を、音声信号
と音声信号に重畳している背景雑音信号とに分離する。
音声/雑音信号分離器801は、任意のものでよい。こ
の分離方法としては、スペクトルサブトラクションと呼
ばれる、入力信号から周波数領域で雑音スペクトルを減
ずることで、入力信号を雑音抑圧後の音声信号と雑音信
号とに分離する方法や、複数の信号入力器からの入力信
号から音声と雑音の分離を行う方法などが考えられる。
前記音声/雑音信号分離器801から得られる分離後の
音声信号から有音区間か無音区間(雑音のみの区間)か
を判定し、その判定結果を音声符号化器803およびD
TX制御および多重化器805に出力する。なお、分離
前の入力信号を用いて判定を行う構成でもよい。有音/
無音判定器802は任意のものでよい。この判定は、一
般には、入力信号のパワー、スペクトルやピッチ周期な
どの複数のパラメータの瞬時量または変化量等を用いて
判定が行われる。
る判定結果が有音である場合には、音声符号化器803
により、前記音声/雑音信号分離器801から得られる
分離後の音声信号に対して有音区間のみ音声符号化器8
03で音声信号の符号化を行い、その符号化データをD
TX制御および多重化器805に出力する。この音声符
号化器803は、有音区間用の符号化器で、音声を高能
率に符号化する任意の符号化器でよい。
記音声/雑音信号分離器801から得られる分離後の雑
音信号に対して全区間にわたって雑音信号符号化器80
4で雑音信号の符号化を行い、入力雑音信号表現する雑
音モデルに関する情報と雑音モデルの更新をするかどう
かのフラグを出力する。音声/雑音信号符号化器801
は、実施の形態1にて説明した図3に示すものである。
合、雑音信号符号化器804に入力される有音/無音判
定結果フラグを雑音信号符号化器804における雑音モ
デル更新不許可フラグとして、モデル更新を行わないよ
うにする。
により、前記有音/無音判定器802、音声符号化器8
03および雑音信号符号化器804からの出力を用いて
送信データとして送信すべき情報の制御と送信情報の多
重化を行い、送信データとして出力する。
号化装置の構成を示すブロック図である。図9に示す復
号化装置においては、分離およびDTX制御器901に
おいて、符号化側で入力信号に対して符号化され送信さ
れた送信データを受信データとして受信し、音声復号お
よび雑音生成に必要な、音声符号化データまたは雑音モ
デルパラメータ、有音/無音判定フラグおよび雑音モデ
ル更新フラグに分離する。
間を示す場合には、音声復号化器902により前記音声
符号化データから音声復号を行い復号音声を音声/雑音
信号加算器904に出力する。
音モデルパラメータおよび雑音モデル更新フラグから雑
音信号の生成を行い、雑音信号を音声/雑音信号加算器
904に出力する。そして、音声/雑音信号加算器90
4により、前記音声復号化器902の出力と前記雑音信
号生成器903の出力とを加算し、出力信号とする。
係る音声信号の符号化方法の処理の流れを説明する。な
お、本方法では、図10に示す本処理を、一定短区間
(例えば、10〜50ms程度)のフレーム毎に繰り返
して行うものとする。
の入力信号を入力する。次いで、ST302にて、入力
音声信号を、音声信号と音声信号に重畳している背景雑
音信号とに分離する。そして、ST303において、入
力信号またはST302で得られた分離後の音声信号に
対して有音/無音判定を行い、その判定結果を出力する
(ST304)。
ST305において、ST302で得られた分離後の音
声信号に対して音声符号化器による音声符号化処理を行
い、その符号化データを出力する。次いで、ST302
で得られた分離後の雑音信号に対して、ST306に
て、雑音信号符号化器による雑音信号符号化処理を行
い、入力雑音信号表現する雑音モデルに関する情報と雑
音モデルの更新をするかどうかのフラグを出力する。
有音である場合、ST306にて行う雑音信号符号化処
理において、モデル更新を行わないようにする。そし
て、ST307において、前記有音/無音判定、音声符
号化処理および雑音信号符号化処理の結果得られた出力
を用いて送信データとして送信すべき情報の制御と送信
情報との多重化を行い、最後にST308にて送信デー
タとして出力する。
号化装置によれば、有音区間では音声信号を高品質で符
号化できる音声符号化器で符号化を行い、雑音信号に対
しては高効率で聴感的に劣化が少ない実施の形態1記載
の雑音信号符号化器で符号化を行うことにより、背景雑
音環境下においても高品質・高効率な符号化を行うこと
ができ、さらに音声/雑音信号分離器を設けることによ
り、前記音声符号化器に入力される音声信号から重畳さ
れた背景雑音が除去され、有音区間をより高品質にまた
はより高効率に符号化することができる。
の形態3に係る音声符号化部の構成を示すブロック図で
ある。なお、本実施の形態における復号側の構成は、図
4に示す音声信号の復号装置の構成と同一である。
区間毎に入力された入力信号に対して信号分析を行い、
入力信号に対する分析パラメータを算出する。抽出する
特徴パラメータとしては、入力信号に関する統計的特徴
量を表すのに必要なパラメータおよび音声的な特徴を表
すパラメータである。統計的特徴量を表すのに必要なパ
ラメータとしては、例えば、短区間信号に対してFFT
により求めた短時間スペクトルや、入力パワー、LPC
スペクトルパラメータ、等がある。また、音声的な特徴
を表すパラメータとしては、LPCパラメータ、入力パ
ワーやピッチ周期性情報、等がある。
入力信号分析器1101で得られた分析パラメータに対
して、音声モデル記憶器1102で保持されている音声
的な特徴パターンおよび雑音モデル記憶器1103で保
持されている雑音モデルパラメータを用いて、入力信号
が有音区間か無音区間(雑音のみの区間)か、および無
音区間の場合に雑音モデルを更新して更新情報を伝送す
るかどうかの判定を行う。
声的な特徴パターンを予め作成記憶しているもので、音
声的な特徴パターンとしては、例えば、音声(有音)区
間中のLPCパラメータ、入力信号パワーやピッチ周期
性情報等の分布などの情報である。また、雑音モデルパ
ラメータとは、入力雑音信号に関する統計的特徴量を表
現できるような雑音モデルに関する情報であり、例え
ば、短時間スペクトルの平均スペクトルや分散値、等の
統計的特徴量を、例えばHMMのような統計モデルで表
現した際の情報である。
られた現入力信号に対する統計的分析パラメータが、そ
れ以前の雑音区間中の信号を表す雑音モデルとして記憶
された雑音モデルからの出力として妥当かどうか(例え
ば、HMMモデルであれば現入力信号に対する分析パラ
メータの出力確率が規定値以上であるか)を判定すると
共に、入力信号に対する音声的特徴を表すパラメータか
ら音声(有音)区間かどうかを判定する。
ると判定した場合には、音声符号化器1105により、
入力信号に対して音声符号化を行いその符号化データを
DTX制御および多重化器1107に出力する。一方、
前記モード判定器1104が無音区間でかつ雑音モデル
更新情報を伝送すると判定した場合には、雑音モデル更
新器1106により、その雑音モデルの更新を行い、更
新後の雑音モデルに関する情報をDTX制御および多重
化器1107に出力する。
7により、音声符号化器および雑音モデル更新器110
6からの出力を用いて送信データとして送信すべき情報
の制御と送信情報の多重化を行い、送信データを出力す
る。
係る音声信号の符号化方法の処理の流れを説明する。な
お、本方法では、図12に示す本処理を、一定短区間
(例えば、10〜50ms程度)のフレーム毎に繰り返
して行うものとする。
の入力信号を入力する。次に、ST402において、あ
る一定区間毎に入力された入力信号に対して信号分析を
行い、その分析パラメータを算出し出力する。
れた統計的分析パラメータが、図11における雑音モデ
ル記憶器1103により保持されている雑音モデルから
の出力として妥当かどうかその適合性を判定する(ST
404)。その結果、適合しない、すなわち現入力信号
が現時点で保持されている雑音モデルでは表現できない
と判定された場合には、次のST405に進み、入力信
号に対して分析して得られた音声的特徴パラメータから
音声(有音)区間かどうか判定する。そして、音声区間
と判定された場合、ST406にて、音声符号化器によ
る音声符号化処理を行い、その符号化データを出力す
る。
と判定された場合、ST407にて、雑音モデルの更新
を行い、更新後の雑音モデルに関する情報を出力する。
ST403にて、現入力が現時点で保持されている雑音
モデルで表現できると判定された場合は、何も処理をせ
ず次ステップに進む。そして、ST408において、音
声符号化器および雑音モデル更新器からの出力を用いて
送信データとして送信すべき情報の制御と送信情報の多
重化を行い、ST409にて送信データを出力する。
の符号化装置によれば、モード判定器を設けることによ
り、入力信号の統計的特徴量の変化および音声の特徴パ
ターンを用いて判定を行うことができる。したがって、
より正確なモード判定を行うことができ、判定誤りによ
る品質劣化を抑えることができる。
号化装置では、雑音信号を統計的特徴量で表現できるよ
うな雑音モデルでモデル化することにより、背景雑音信
号に対して聴感的に劣化の少ない復号信号を生成するこ
とができる。また、入力信号波形に対する忠実な符号化
が不要となるので、入力信号に対応する雑音モデルパラ
メータが変化する区間のみ伝送することにより、低ビッ
トレートで高効率な符号化を行うことができる。
ては、有音区間では音声信号を高品質で符号化できる音
声符号化器で符号化を行い、無音区間では高効率で聴感
的に劣化が少ない前記雑音信号符号化器で符号化を行う
ことにより、背景雑音環境下においても高品質・高効率
な符号化を行うことができる。
及び音声信号復号化装置を備えた無線通信システムの構
成を示すブロック図
置の構成を示すブロック図
置の構成を示すブロック図
置の構成を示すブロック図
置における雑音信号生成器の構成を示すブロック図
法の処理の流れを示すフロー図
法の処理の流れを示すフロー図
置の構成を示すブロック図
置の構成を示すブロック図
方法の処理の流れを示すフロー図
装置の構成を示すブロック図
方法の処理の流れを示すフロー図
ック図
ック図
Claims (15)
- 【請求項1】 雑音信号を含む音声信号の前記雑音信号
に対して信号分析を行う分析手段と、前記雑音信号を表
わす雑音モデルに関する情報を記憶する記憶手段と、現
入力の雑音信号の信号分析結果に基づいて、記憶された
雑音モデルに関する情報の変化を検出する検出手段と、
雑音モデルに関する情報の変化が検出された場合に、前
記変化の変化量分だけ前記記憶された雑音モデルに関す
る情報を更新する更新手段と、を具備することを特徴と
する雑音信号符号化装置。 - 【請求項2】 分析手段は、雑音信号に関する統計的特
徴量を抽出し、記憶手段は、前記統計的特徴量を表現で
きる情報を雑音モデルに関する情報として記憶すること
を特徴とする請求項1記載の雑音信号符号化装置。 - 【請求項3】 入力音声信号に対して有音区間か雑音信
号のみを含む無音区間かを判定する有音/無音判定手段
と、判定結果が有音である場合に前記入力音声信号に対
して音声符号化を行う音声符号化手段と、判定結果が無
音である場合に前記入力信号に対して雑音信号の符号化
を行う請求項1又は請求項2記載の雑音信号符号化装置
と、前記有音/無音判定手段、前記音声符号化手段、お
よび前記雑音信号符号化装置からの出力を多重化する多
重化手段と、を具備することを特徴とする音声信号符号
化装置。 - 【請求項4】 入力音声信号を、音声信号とこの音声信
号に重畳している背景雑音信号とに分離する音声/雑音
信号分離手段と、前記入力音声信号又は前記音声/雑音
信号分離手段により得られる音声信号から有音区間か雑
音信号のみを含む無音区間かを判定する有音/無音判定
手段と、判定結果が有音である場合に前記入力音声信号
に対して音声符号化を行う音声符号化手段と、前記音声
/雑音信号分離手段により得られる背景雑音信号の符号
化を行う請求項1又は請求項2記載の雑音信号符号化装
置と、前記有音/無音判定手段、前記音声符号化手段、
および前記雑音信号符号化装置からの出力を多重化する
多重化手段と、を具備することを特徴とする音声信号符
号化装置。 - 【請求項5】 入力音声信号に対して信号分析を行う分
析手段と、前記入力音声信号が有音信号であるかどうか
を判定するために必要な音声の特徴パターンを記憶する
音声モデル記憶手段と、前記入力音声信号に含まれる雑
音信号を表現する雑音モデルに関する情報を記憶する雑
音モデル記憶手段と、前記分析手段、音声モデル記憶手
段および雑音モデル記憶手段の出力を用いて、前記入力
音声信号が有音区間か雑音信号のみを含む無音区間かを
判定すると共に、前記無音区間の場合に雑音モデルを更
新するかどうかの判定を行うモード判定手段と、前記モ
ード判定手段が有音区間と判定した場合に入力音声信号
に対して音声符号化を行う音声符号化手段と、前記モー
ド判定手段が無音区間でかつ雑音モデルを更新すると判
定した場合にその雑音モデルの更新を行う雑音モデル更
新手段と、音声符号化手段および雑音モデル更新手段か
らの出力を多重化する多重化手段と、を具備することを
特徴とする音声信号符号化装置。 - 【請求項6】 請求項3から請求項5のいずれかに記載
の音声信号符号化装置を備えたことを特徴とする基地局
装置。 - 【請求項7】 請求項3から請求項5のいずれかに記載
の音声信号符号化装置を備えたことを特徴とする通信端
末装置。 - 【請求項8】 符号化側で入力雑音信号に対して符号化
された雑音モデルパラメータおよび雑音モデル更新フラ
グにしたがって、必要な場合に雑音モデルの更新を行う
雑音モデル更新手段と、前記雑音モデル更新手段の出力
を用いて更新後の雑音モデルに関する情報を記憶する雑
音モデル記憶手段と、前記雑音モデル記憶手段で記憶し
ている雑音モデルに関する情報から雑音信号を生成する
雑音信号生成手段と、を具備することを特徴とする雑音
信号生成装置。 - 【請求項9】 前記雑音モデル更新手段へ入力する雑音
モデルパラメータおよび前記雑音モデル記憶手段で記憶
する情報が、生成する雑音信号に関する統計的特徴量を
表現できる情報であることを特徴とする請求項8記載の
雑音信号生成装置。 - 【請求項10】 符号化側で符号化された音声データ、
雑音モデルパラメータ、有音/無音判定フラグおよび雑
音モデル更新フラグを含む信号を受信し、前記信号から
雑音モデルパラメータ、有音/無音判定フラグおよび雑
音モデル更新フラグを分離する分離手段と、前記有音/
無音判定フラグが有音区間を示す場合に、前記音声デー
タに対して音声復号を行う音声復号化手段と、前記有音
/無音判定フラグが無音区間を示す場合に、前記雑音モ
デルパラメータおよび雑音モデル更新フラグから雑音信
号の生成を行う請求項8又は請求項9記載の雑音信号生
成装置と、前記音声復号化手段から出力される復号音声
と前記雑音信号生成装置から出力される雑音信号のいず
れかを、前記有音/無音判定フラグに応じて切り替えて
出力信号として出力する出力切り替え手段と、を具備す
ることを特徴とする音声信号復号化装置。 - 【請求項11】 符号化側で符号化された音声データ、
雑音モデルパラメータ、有音/無音判定フラグおよび雑
音モデル更新フラグを含む信号を受信し、前記信号から
雑音モデルパラメータ、有音/無音判定フラグおよび雑
音モデル更新フラグを分離する分離手段と、前記有音/
無音判定フラグが有音区間を示す場合に、前記音声デー
タに対して音声復号を行う音声復号化手段と、前記有音
/無音判定フラグが無音区間を示す場合に、前記雑音モ
デルパラメータおよび雑音モデル更新フラグから雑音信
号の生成を行う請求項8又は請求項9記載の雑音信号生
成装置と、前記音声復号化手段から出力される復号音声
と前記雑音信号生成装置から出力される雑音信号とを加
算する音声/雑音信号加算手段と、を具備することを特
徴とする音声信号復号化装置。 - 【請求項12】 入力音声信号に対して有音区間か雑音
信号のみを含む無音区間かを判定する有音/無音判定工
程と、判定結果が有音である場合に前記入力音声信号に
対して音声符号化を行う音声符号化工程と、判定結果が
無音である場合に前記入力信号に対して雑音信号の符号
化を行う雑音信号符号化工程と、前記有音/無音判定工
程、前記音声符号化工程、および前記雑音信号符号化工
程における出力を多重化する多重化工程と、を具備し、 雑音信号符号化工程は、雑音信号を含む音声信号の前記
雑音信号に対して信号分析を行う分析工程と、前記雑音
信号を表わす雑音モデルに関する情報を記憶する記憶工
程と、現入力の雑音信号の信号分析結果に基づいて、記
憶された雑音モデルに関する情報の変化を検出する検出
工程と、雑音モデルに関する情報の変化が検出された場
合に、前記変化の変化量分だけ前記記憶された雑音モデ
ルに関する情報を更新する更新工程と、を含むことを特
徴とする音声信号符号化方法。 - 【請求項13】 入力音声信号を、音声信号とこの音声
信号に重畳している背景雑音信号とに分離する音声/雑
音信号分離工程と、前記入力音声信号又は前記音声/雑
音信号分離工程において得られる音声信号から有音区間
か雑音信号のみを含む無音区間かを判定する有音/無音
判定工程と、判定結果が有音である場合に前記入力音声
信号に対して音声符号化を行う音声符号化工程と、判定
結果が無音である場合に前記入力信号に対して雑音信号
の符号化を行うと共に、前記音声/雑音信号分離工程に
おいて得られる背景雑音信号の符号化を行う雑音信号符
号化工程と、前記有音/無音判定工程、前記音声符号化
工程、および前記雑音信号符号化工程における出力を多
重化する多重化工程と、を具備し、 雑音信号符号化工程は、雑音信号を含む音声信号の前記
雑音信号に対して信号分析を行う分析工程と、前記雑音
信号を表わす雑音モデルに関する情報を記憶する記憶工
程と、現入力の雑音信号の信号分析結果に基づいて、記
憶された雑音モデルに関する情報の変化を検出する検出
工程と、雑音モデルに関する情報の変化が検出された場
合に、前記変化の変化量分だけ前記記憶された雑音モデ
ルに関する情報を更新する更新工程と、を含むことを特
徴とする音声信号符号化方法。 - 【請求項14】 入力音声信号に対して信号分析を行う
分析工程と、前記入力音声信号が有音信号であるかどう
かを判定するために必要な音声の特徴パターンを記憶す
る音声モデル記憶工程と、前記入力音声信号に含まれる
雑音信号を表現する雑音モデルに関する情報を記憶する
雑音モデル記憶工程と、前記分析手段、音声モデル記憶
手段および雑音モデル記憶手段の出力を用いて、前記入
力音声信号が有音区間か雑音信号のみを含む無音区間か
を判定すると共に、前記無音区間の場合に雑音モデルを
更新するかどうかの判定を行うモード判定工程と、前記
モード判定手段が有音区間と判定した場合に入力音声信
号に対して音声符号化を行う音声符号化工程と、前記モ
ード判定手段が無音区間でかつ雑音モデルを更新すると
判定した場合にその雑音モデルの更新を行う雑音モデル
更新工程と、音声符号化手段および雑音モデル更新手段
からの出力を多重化する多重化工程と、を具備すること
を特徴とする音声信号符号化方法。 - 【請求項15】 コンピュータに、入力雑音信号に対し
て統計的特徴量の分析を行う手順と、入力雑音信号に対
する統計的特徴量を表現する雑音モデルに関する情報を
記憶する手順と、入力雑音信号を表す雑音モデルの変化
を検出する手順と、必要な場合に雑音モデルの更新を行
い更新後の雑音モデルに関する情報を出力する手順、を
実行させるためのプログラムを記録した機械読みとり可
能な記憶媒体。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16854599A JP4464484B2 (ja) | 1999-06-15 | 1999-06-15 | 雑音信号符号化装置および音声信号符号化装置 |
CN00801092.7A CN1313983A (zh) | 1999-06-15 | 2000-06-01 | 噪声信号编码装置及语音信号编码装置 |
EP00935511A EP1120775A4 (en) | 1999-06-15 | 2000-06-01 | NOISE SIGNAL ENCODER AND VOICE SIGNAL ENCODER |
AU51037/00A AU5103700A (en) | 1999-06-15 | 2000-06-01 | Noise signal encoder and voice signal encoder |
PCT/JP2000/003526 WO2000077774A1 (fr) | 1999-06-15 | 2000-06-01 | Codeur de signaux de bruit et codeur de signaux vocaux |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16854599A JP4464484B2 (ja) | 1999-06-15 | 1999-06-15 | 雑音信号符号化装置および音声信号符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000357000A true JP2000357000A (ja) | 2000-12-26 |
JP4464484B2 JP4464484B2 (ja) | 2010-05-19 |
Family
ID=15870014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16854599A Expired - Fee Related JP4464484B2 (ja) | 1999-06-15 | 1999-06-15 | 雑音信号符号化装置および音声信号符号化装置 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP1120775A4 (ja) |
JP (1) | JP4464484B2 (ja) |
CN (1) | CN1313983A (ja) |
AU (1) | AU5103700A (ja) |
WO (1) | WO2000077774A1 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007304505A (ja) * | 2006-05-15 | 2007-11-22 | Nippon Telegr & Teleph Corp <Ntt> | サーバ・クライアント型音声認識方法、装置およびサーバ・クライアント型音声認識プログラム、記録媒体 |
JP2014505907A (ja) * | 2011-02-14 | 2014-03-06 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 不活性相の間のノイズ合成を用いるオーディオコーデック |
US9047859B2 (en) | 2011-02-14 | 2015-06-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
US9384739B2 (en) | 2011-02-14 | 2016-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding |
US9536530B2 (en) | 2011-02-14 | 2017-01-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Information signal representation using lapped transform |
US9583110B2 (en) | 2011-02-14 | 2017-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
US9595263B2 (en) | 2011-02-14 | 2017-03-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding and decoding of pulse positions of tracks of an audio signal |
US9595262B2 (en) | 2011-02-14 | 2017-03-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Linear prediction based coding scheme using spectral domain noise shaping |
US9620129B2 (en) | 2011-02-14 | 2017-04-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
JP2022036998A (ja) * | 2016-05-30 | 2022-03-08 | ソニーグループ株式会社 | 映像音響処理装置および方法、並びにプログラム |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9118805B2 (en) | 2007-06-27 | 2015-08-25 | Nec Corporation | Multi-point connection device, signal analysis and device, method, and program |
CN101546557B (zh) * | 2008-03-28 | 2011-03-23 | 展讯通信(上海)有限公司 | 用于音频内容识别的分类器参数更新方法 |
WO2010070187A1 (en) * | 2008-12-19 | 2010-06-24 | Nokia Corporation | An apparatus, a method and a computer program for coding |
MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
CN104469250B (zh) * | 2013-09-23 | 2019-07-26 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
EP3010017A1 (en) * | 2014-10-14 | 2016-04-20 | Thomson Licensing | Method and apparatus for separating speech data from background data in audio communication |
CN106971741B (zh) * | 2016-01-14 | 2020-12-01 | 芋头科技(杭州)有限公司 | 实时将语音进行分离的语音降噪的方法及*** |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2692104B2 (ja) * | 1988-02-12 | 1997-12-17 | 株式会社日立製作所 | 音声多重化システム |
JPH07129195A (ja) * | 1993-11-05 | 1995-05-19 | Nec Corp | 音声復号化装置 |
JP3173639B2 (ja) * | 1995-05-26 | 2001-06-04 | 株式会社エヌ・ティ・ティ・ドコモ | 背景雑音更新システムおよび方法 |
JP2806308B2 (ja) * | 1995-06-30 | 1998-09-30 | 日本電気株式会社 | 音声復号化装置 |
JP3259759B2 (ja) * | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JP3575967B2 (ja) * | 1996-12-02 | 2004-10-13 | 沖電気工業株式会社 | 音声通信システムおよび音声通信方法 |
JP3119204B2 (ja) * | 1997-06-27 | 2000-12-18 | 日本電気株式会社 | 音声符号化装置 |
JP2000122698A (ja) * | 1998-10-19 | 2000-04-28 | Mitsubishi Electric Corp | 音声符号化装置 |
CN1145928C (zh) * | 1999-06-07 | 2004-04-14 | 艾利森公司 | 用参数噪声模型统计量产生舒适噪声的方法及装置 |
-
1999
- 1999-06-15 JP JP16854599A patent/JP4464484B2/ja not_active Expired - Fee Related
-
2000
- 2000-06-01 AU AU51037/00A patent/AU5103700A/en not_active Abandoned
- 2000-06-01 WO PCT/JP2000/003526 patent/WO2000077774A1/ja not_active Application Discontinuation
- 2000-06-01 EP EP00935511A patent/EP1120775A4/en not_active Withdrawn
- 2000-06-01 CN CN00801092.7A patent/CN1313983A/zh active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007304505A (ja) * | 2006-05-15 | 2007-11-22 | Nippon Telegr & Teleph Corp <Ntt> | サーバ・クライアント型音声認識方法、装置およびサーバ・クライアント型音声認識プログラム、記録媒体 |
JP2014505907A (ja) * | 2011-02-14 | 2014-03-06 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 不活性相の間のノイズ合成を用いるオーディオコーデック |
US9047859B2 (en) | 2011-02-14 | 2015-06-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
US9153236B2 (en) | 2011-02-14 | 2015-10-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio codec using noise synthesis during inactive phases |
US9384739B2 (en) | 2011-02-14 | 2016-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding |
US9536530B2 (en) | 2011-02-14 | 2017-01-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Information signal representation using lapped transform |
US9583110B2 (en) | 2011-02-14 | 2017-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
US9595263B2 (en) | 2011-02-14 | 2017-03-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding and decoding of pulse positions of tracks of an audio signal |
US9595262B2 (en) | 2011-02-14 | 2017-03-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Linear prediction based coding scheme using spectral domain noise shaping |
US9620129B2 (en) | 2011-02-14 | 2017-04-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
JP2022036998A (ja) * | 2016-05-30 | 2022-03-08 | ソニーグループ株式会社 | 映像音響処理装置および方法、並びにプログラム |
US11902704B2 (en) | 2016-05-30 | 2024-02-13 | Sony Corporation | Apparatus and method for video-audio processing, and program for separating an object sound corresponding to a selected video object |
Also Published As
Publication number | Publication date |
---|---|
EP1120775A1 (en) | 2001-08-01 |
EP1120775A4 (en) | 2001-09-26 |
AU5103700A (en) | 2001-01-02 |
WO2000077774A1 (fr) | 2000-12-21 |
CN1313983A (zh) | 2001-09-19 |
JP4464484B2 (ja) | 2010-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0770987B1 (en) | Method and apparatus for reproducing speech signals, method and apparatus for decoding the speech, method and apparatus for synthesizing the speech and portable radio terminal apparatus | |
JP4870313B2 (ja) | 可変レート音声符号器におけるフレーム消去補償方法 | |
JP5373217B2 (ja) | 可変レートスピーチ符号化 | |
JP5226777B2 (ja) | 音声信号中に埋め込まれた隠れデータの回復 | |
US6615169B1 (en) | High frequency enhancement layer coding in wideband speech codec | |
JP2000357000A (ja) | 雑音信号符号化装置および音声信号符号化装置 | |
JP2009069856A (ja) | 音声コーデックにおける擬似高帯域信号の推定方法 | |
JP4438127B2 (ja) | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 | |
JP4445328B2 (ja) | 音声・楽音復号化装置および音声・楽音復号化方法 | |
EP1204968B1 (en) | Method and apparatus for subsampling phase spectrum information | |
JPH10149199A (ja) | 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体 | |
JP2007279754A (ja) | 音声符号化装置 | |
JP2002509294A (ja) | 暗騒音条件下における音声符号化の方法 | |
JP3223966B2 (ja) | 音声符号化/復号化装置 | |
JP3670217B2 (ja) | 雑音符号化装置、雑音復号装置、雑音符号化方法および雑音復号方法 | |
JP2001242896A (ja) | 音声符号化/復号装置およびその方法 | |
US20090018823A1 (en) | Speech coding | |
JP2004302259A (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
JP4373693B2 (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
JP6713424B2 (ja) | 音声復号装置、音声復号方法、プログラム、および記録媒体 | |
JP3576485B2 (ja) | 固定音源ベクトル生成装置及び音声符号化/復号化装置 | |
JP4826580B2 (ja) | 音声信号の再生方法及び装置 | |
JP4230550B2 (ja) | 音声符号化方法及び装置、並びに音声復号化方法及び装置 | |
JPH1049200A (ja) | 音声情報圧縮蓄積方法及び装置 | |
JP3896654B2 (ja) | 音声信号区間検出方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060614 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091020 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100126 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100219 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130226 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4464484 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130226 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140226 Year of fee payment: 4 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |