JP2001242896A - 音声符号化/復号装置およびその方法 - Google Patents

音声符号化/復号装置およびその方法

Info

Publication number
JP2001242896A
JP2001242896A JP2000054108A JP2000054108A JP2001242896A JP 2001242896 A JP2001242896 A JP 2001242896A JP 2000054108 A JP2000054108 A JP 2000054108A JP 2000054108 A JP2000054108 A JP 2000054108A JP 2001242896 A JP2001242896 A JP 2001242896A
Authority
JP
Japan
Prior art keywords
signal
noise
speech
section
noise signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000054108A
Other languages
English (en)
Inventor
Koji Yoshida
幸司 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000054108A priority Critical patent/JP2001242896A/ja
Priority to AU32316/01A priority patent/AU3231601A/en
Priority to CN01800859A priority patent/CN1366658A/zh
Priority to EP01904496A priority patent/EP1211670A1/en
Priority to US09/959,533 priority patent/US20020161573A1/en
Priority to PCT/JP2001/001110 priority patent/WO2001065542A1/ja
Publication of JP2001242896A publication Critical patent/JP2001242896A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 背景雑音が重畳された音声信号に対して
も復号信号の品質劣化が少ない。 【解決手段】 分離およびDTX制御器301におい
て、符号化側で入力信号に対して符号化され送信された
送信データを受信データとして受信し、音声復号または
雑音生成に必要な音声符号化データまたは雑音符号化デ
ータと、有音/無音判定フラグとに分離する。有音/無
音判定フラグが有音区間を示す場合には、音声復号器3
02により音声符号化データから音声復号を行い復号音
声を出力する。雑音信号生成器303により雑音符号化
データから雑音信号の生成を行い、雑音信号を出力す
る。音声/雑音信号加算器304において、無音区間中
は雑音生成器303の出力である生成雑音信号をそのま
ま出力し復号信号出力とし、有音区間中は音声復号器3
02の出力である復号音声信号と雑音信号生成器303
の出力である生成雑音信号を加算し、復号信号として出
力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を符号化
して伝送する移動通信システムや音声録音装置などの用
途に用いられる低ビットレート音声符号化装置に関す
る。
【0002】
【従来の技術】ディジタル移動通信や音声蓄積の分野に
おいては、電波や記憶媒体の有効利用のために音声情報
を圧縮し、低いビットレートで符号化する音声符号化装
置が用いられている。特に、主に音声信号の有音区間に
ついては、音声信号を符号化して伝送し、無音区間につ
いては、専用の無音区間の雑音信号符号器により有音区
間より少ないビットレートで符号化して伝送する。これ
により、伝送するビットレートをさらに低減することが
できる。
【0003】そのような低いビットレートで符号化する
従来の技術として、ITU−T勧告のG.729 An
nex B("A silence compression scheme for G.72
9 optimized for terminals conforming to Recommenda
tion V.70")のDTX(Discontinuous Transmission)制
御付きのCS-ACELP(conjugate-structure algeb
raic-code-excited linear-prediction)符号化方式が
ある。
【0004】従来の技術であるDTX制御付きCS-A
CELP符号化方式の符号化装置の構成を図8に示す。
この符号化装置においては、まず、有音/無音判定器8
01で入力信号が有音区間であるか無音区間(背景雑音
のみの区間)であるか判定される。
【0005】そして、有音/無音判定器801により有
音と判定された場合、CS-ACELP音声符号器80
2により入力信号に対して有音区間の音声符号化を行
う。一方、有音/無音判定器801により無音と判定さ
れた場合、無音区間符号器803により入力信号に対し
て無音区間中の背景雑音の符号化を行う。
【0006】この無音区間符号器803は、入力信号か
ら有音区間の符号化と同様なLPC係数と入力信号のL
PC予測残差エネルギーを算出し、それらを無音区間の
符号化データとしてDTX制御および多重化器804に
出力する。
【0007】DTX制御および多重化器804は、有音
/無音判定器801、CS-ACELP音声符号器80
2および無音区間符号器803の出力から、送信データ
として送信すべきデータを制御し、多重化して送信デー
タとして出力する。
【0008】次に、図9に、従来技術の復号装置の構成
を示す。この復号装置においては、分離およびDTX制
御器901で、符号化側で入力信号に対して符号化・送
信された送信データを受信データとして受信し、この受
信データを、音声復号および雑音生成に必要な、音声符
号化データまたは雑音符号化データと、有音/無音判定
フラグとに分離する。
【0009】次いで、前記有音/無音判定フラグが、有
音区間を示す場合には、CS-ACELP音声復号器9
02により前記音声符号化データから音声復号を行い、
復号音声を出力切り替え器904に出力する。一方、前
記有音/無音判定フラグが、無音区間を示す場合には、
雑音信号生成器903により前記雑音符号化データから
雑音信号の生成を行い、雑音信号を出力切り替え器90
4に出力する。
【0010】そして、出力切り替え器904により、前
記音声復号器902の出力と前記雑音信号生成器903
の出力を、有音/無音判定フラグの結果に応じて切り換
えて出力し、出力信号とする。すなわち、有音区間では
音声復号器902の出力を出力信号とし、無音区間では
雑音信号生成器903の出力を出力信号とする。
【0011】
【発明が解決しようとする課題】上記の従来の音声符号
化装置においては、有音区間のみCS-ACELP音声
符号器により符号化を行い、無音区間(雑音のみの区
間)は専用の無音区間符号器で音声符号器より少ないビ
ットレートで符号化を行うことで、伝送する平均ビット
レートを低減させている。
【0012】しかしながら、入力信号として周囲の背景
雑音が重畳された音声信号が入力された場合、有音区間
中では、その重畳された背景雑音の影響により復号音声
の品質が劣化する。また、無音区間中では有音区間とは
異なる方法で符号化されたデータを用いて雑音が生成さ
れるため、有音区間中の復号音声における背景雑音と無
音区間中に生成された背景雑音との聴感的品質が異なる
ことによる不自然感が生じてしまう。符号化のビットレ
ートが8kbit/sおよびそれ以下の低ビットレートにお
いては、これらの傾向が特に顕著となる。
【0013】本発明はかかる点に鑑みてなされたもので
あり、背景雑音が重畳された音声信号に対しても復号信
号の品質劣化が少ない音声符号化装置および復号装置を
提供することを目的とする。
【0014】
【課題を解決するための手段】本発明の音声復号装置
は、符号化側で符号化された音声符号化データ及び雑音
符号化データ、並びに区間判定情報を含む信号を受信す
る受信手段と、前記区間判定情報が有音区間を示す場合
に前記音声符号化データを復号する音声復号手段と、前
記雑音符号化データから雑音信号を生成する雑音信号生
成手段と、前記有音区間において、前記音声復号手段で
復号された復号音声信号に前記雑音信号を加算する雑音
信号加算手段と、を具備する構成を採る。
【0015】この構成によれば、雑音信号生成手段が、
無音区間のみならず有音区間においても雑音信号を生成
し、雑音信号加算手段が、有音区間において復号音声信
号に対して生成した雑音信号を付加して出力するので、
背景雑音が重畳された音声信号に対しても、加算された
雑音信号により、有音区間の背景雑音による品質劣化が
マスクされて品質劣化の影響が減少する。また、有音区
間中の復号音声における背景雑音と無音区間中に生成さ
れた背景雑音との聴感的品質が類似することで不自然感
が減少し、改善された音声品質を有する復号を行うこと
ができる。
【0016】本発明の音声復号装置は、上記構成におい
て、雑音信号加算手段が、雑音符号化データまたは雑音
信号の特性に基づいて、有音区間中に加算する雑音信号
の特性を適応的に制御する構成を採る。
【0017】この構成によれば、入力信号に重畳された
背景雑音の特性に応じて、有音区間中に加算する生成雑
音の特性を適応的に制御することで、より聴感的に改善
された音声品質を有する復号を行うことができる。
【0018】本発明の音声復号装置は、上記構成におい
て、雑音信号加算手段が、区間判定情報が無音区間であ
る場合の雑音信号の特性が非定常であるときに、有音区
間中に加算する雑音信号のレベルを小さくする構成を採
る。
【0019】この構成によれば、有音区間中に生成雑音
を付加することによる、不要な雑音感を減少させること
ができる。
【0020】本発明の音声符号化/復号装置は、入力音
声信号に対して有音区間か無音区間かを判定する区間判
定手段と、前記区間判定手段の判定結果が有音である場
合に前記入力音声信号に対して音声符号化を行う音声符
号化手段と、前記区間判定手段の判定結果が無音である
場合に前記入力音声信号に対して雑音信号の符号化を行
う雑音信号符号化手段と、を有する音声符号化装置と、
上記構成の音声復号装置と、を具備する構成を採る。
【0021】この構成によれば、背景雑音が重畳された
音声信号に対しても復号信号の品質の劣化を抑えた、符
号化・復号を行うことができる。
【0022】本発明の基地局装置は、上記構成の音声復
号装置、または上記構成の音声符号化/復号装置を備え
たことを特徴とする。また、本発明の通信端末装置は、
上記構成の音声復号装置、または上記構成の音声符号化
/復号装置を備えたことを特徴とする。これらの構成に
よれば、聴感的に改善された音声信号の送受信を行うこ
とが可能となる。
【0023】本発明の音声復号方法は、符号化側で符号
化された音声符号化データ及び雑音符号化データ、並び
に区間判定情報を含む信号を受信する受信工程と、前記
区間判定情報が有音区間を示す場合に音声符号化データ
を復号する音声復号工程と、前記雑音符号化データから
雑音信号を生成する雑音信号生成工程と、前記有音区間
において、前記音声復号工程で復号された復号音声信号
に前記雑音信号を加算する雑音信号加算工程と、を具備
する。
【0024】この方法によれば、雑音信号生成工程で無
音区間のみならず有音区間においても雑音信号を生成
し、雑音信号加算工程で有音区間において復号音声信号
に対して雑音信号を付加して出力することにより、背景
雑音が重畳された音声信号に対しても、加算された生成
雑音信号により、有音区間の背景雑音による品質劣化が
マスクされ劣化の影響が減少する。また、有音区間中の
復号音声における背景雑音と無音区間中に生成された背
景雑音との聴感的品質が類似することで不自然感が減少
し、改善された音声品質を有する復号を行うことができ
る。
【0025】本発明の音声復号方法は、上記方法におい
て、雑音信号加算工程で、雑音符号化データまたは雑音
信号の特性に基づいて、有音区間中に加算する雑音信号
の特性を適応的に制御する。
【0026】この方法によれば、入力信号に重畳された
背景雑音の特性に応じて、有音区間中に加算する生成雑
音の特性を適応的に制御することで、より聴感的に改善
された音声品質を有する復号を行うことができる。
【0027】本発明の音声復号方法は、上記方法におい
て、雑音信号加算工程で、区間判定情報が無音区間であ
る場合の雑音信号の特性が非定常であるときに、有音区
間中に加算する雑音信号のレベルを小さくする。
【0028】この方法によれば、有音区間中に生成雑音
を付加することによる、不要な雑音感を減少させること
ができる。
【0029】本発明の音声復号方法は、符号化の際に加
えられた雑音信号を有音区間に加えることを特徴とす
る。この加算された生成雑音信号により、有音区間の背
景雑音による品質劣化がマスクされ劣化の影響が減少す
る。
【0030】本発明の音声符号化/復号方法は、入力音
声信号に対して有音区間か無音区間かを判定し、前記判
定の結果が有音である場合に前記入力音声信号に対して
音声符号化を行い、前記判定の結果が無音である場合に
前記入力音声信号に対して雑音信号の符号化を行う音声
符号化工程と、請求項7から請求項9のいずれかに記載
の音声復号工程と、を具備する。
【0031】この方法によれば、背景雑音が重畳された
音声信号に対しても復号信号の品質の劣化を抑えた、符
号化・復号を行うことができる。
【0032】本発明の記録媒体は、音声復号プログラム
を格納し、コンピュータにより読み取り可能な記録媒体
であって、前記音声復号プログラムは、符号化側で符号
化された音声符号化データ及び雑音符号化データ、並び
に区間判定情報を含む信号の前記区間判定情報が有音区
間を示す場合に音声符号化データを復号する手順と、前
記雑音符号化データから雑音信号を生成する手順と、前
記有音区間において、前記音声復号工程で復号された復
号音声信号に前記雑音信号を加算する手順と、を含む。
【0033】
【発明の実施の形態】本発明の骨子は、無音区間のみな
らず有音区間においても雑音信号を生成し、その雑音信
号を有音区間において復号音声信号に対して付加して出
力するようにして、背景雑音が重畳された音声信号に対
しても復号信号の品質の劣化を少なくすることである。
【0034】以下、本発明の実施の形態について、添付
図面を参照して詳細に説明する。 (実施の形態1)図1は、本発明の実施の形態1に係る
音声符号化/復号装置を備えた無線通信装置の構成を示
すブロック図である。この無線通信装置において、送信
側で音声がマイクなどの音声入力装置101によって電
気的アナログ信号に変換され、A/D変換器102に出
力される。アナログ音声信号は、A/D変換器102に
よってディジタル信号に変換され、音声符号化装置10
3に出力される。
【0035】音声符号化装置103は、ディジタル音声
信号に対して音声符号化処理を行い、符号化した情報を
変復調部104に出力する。変復調部104は、符号化
された音声信号をディジタル変調して無線送信部105
に送る。無線送信部105では、変調後の信号に所定の
無線送信処理を施す。この信号は、アンテナ106を介
して送信される。
【0036】一方、無線通信装置の受信側では、アンテ
ナ107で受信した受信信号は、無線受信部108で所
定の無線受信処理が施され、変復調部104に送られ
る。変復調部104では、受信信号に対して復調処理を
行い、復調後の信号を音声復号装置109に出力する。
音声復号装置109は、復調後の信号に音声復号処理を
行ってディジタル復号音声信号を得て、そのディジタル
復号音声信号をD/A変換器110へ出力する。
【0037】D/A変換器110は、音声復号装置10
9から出力されたディジタル復号音声信号をアナログ音
声信号に変換してスピーカなどの音声出力装置111に
出力する。最後に、音声出力装置111が電気的アナロ
グ音声信号を音声として出力する。
【0038】図1に示す音声符号化装置103は、図2
に示す構成を有する。図2は、本発明の実施の形態1に
係る音声符号化装置の構成を示すブロック図である。有
音/無音判定器201において、入力音声信号に対して
有音区間か無音区間(雑音のみの区間)かを判定し、そ
の判定結果(区間判定情報)をDTXおよび多重化器2
04に出力する。
【0039】有音/無音判定器201は任意のものでよ
く、一般には、入力信号のパワー、スペクトルやピッチ
周期などの複数のパラメータの瞬時量または変化量等を
用いて判定が行われる。
【0040】そして、有音/無音判定器201による判
定結果が有音である場合には、音声符号器202によ
り、入力音声信号に対して音声符号化を行い、その符号
化データをDTXおよび多重化器204に出力する。こ
の音声符号器202は、有音区間用の符号器で、音声を
高能率に符号化する任意の符号器でよい。
【0041】一方、前記有音/無音判定器201による
判定結果が無音である場合には、雑音信号符号器203
により、雑音信号のみが含まれる無音区間において、入
力信号に対して雑音信号の符号化を行い、雑音符号化デ
ータをDTXおよび多重化器204に出力する。この雑
音信号符号器203は、任意のものでよく、一般には、
雑音信号のスペクトルを表す情報(例えば、LPCパラ
メータ)および信号のパワーを表す情報を符号化する。
【0042】最後に、DTX制御および多重化器204
により、有音/無音判定器201、音声符号器202お
よび雑音信号符号器203からの出力を用いて送信デー
タとして送信すべき情報の制御と送信情報の多重化を行
い、送信データとして出力する。
【0043】次に、音声復号装置109の構成について
説明する。図1に示す音声復号装置109は、図3に示
す構成を有する。まず、分離およびDTX制御器301
において、符号化側で入力信号に対して符号化され送信
された送信データを受信データとして受信し、音声復号
または雑音生成に必要な、音声符号化データまたは雑音
符号化データと、有音/無音判定フラグとに分離する。
【0044】次に、有音/無音判定フラグが有音区間を
示す場合には、音声復号器302により音声符号化デー
タから音声復号を行い復号音声を出力する。また、雑音
信号生成器303により雑音符号化データから雑音信号
の生成を行い、雑音信号を出力する。雑音信号生成は、
例えば、符号化側で、雑音信号をスペクトルとパワーで
表し、スペクトルをLPCパラメータで符号化し、パワ
ーをLPC残差信号のパワーで符号化した場合には、復
号側で復号したLPC残差信号のパワーを有するランダ
ムな駆動音源を復号したLPCパラメータでLPC合成
を行うことにより実現する。
【0045】なお、DTX制御により無音区間中は、一
定周期間隔あるいは必要に応じて雑音符号化データを受
信して雑音生成を行い、何も受信しない区間では過去に
受信した雑音符号化データを用いて生成した雑音信号を
出力する構成でもよい。
【0046】そして、音声/雑音信号加算器304にお
いて、無音区間中は、雑音生成器303の出力である生
成雑音信号をそのまま出力して復号信号出力とし、有音
区間中は、音声復号器302の出力である復号音声信号
と雑音信号生成器303の出力である生成雑音信号を加
算して復号信号として出力する。
【0047】次に、上記構成を有する音声符号化部およ
び音声復号部の動作について説明する。図4は、実施の
形態1に係る音声符号化方法の処理の流れを示すフロー
図である。なお、本方法では、図4に示す本処理を、一
定の短区間(例えば、10〜50ms程度)のフレーム
毎に繰り返して行うものとする。
【0048】まず、ステップ(以下STと省略する)4
01において、フレーム単位の入力信号を入力する。次
に、ST402において、入力信号に対する有音/無音
判定を行い(ST403)、その判定結果を出力する。
そして、その判定結果が有音である場合には、ST40
4により入力音声信号に対して音声符号化処理を行って
その符号化データを出力する。
【0049】一方、ST403における判定結果が無音
である場合には、ST405にて入力信号に対して雑音
信号符号器による雑音信号符号化処理を行い、入力雑音
信号を表現する雑音符号化データを出力する。
【0050】そして、ST406において、有音/無音
判定、音声符号化処理および雑音信号符号化処理の結果
で得られた出力を用いて送信データとして送信すべき情
報の制御と送信情報の多重化を行い、最後にST407
にて送信データとして出力する。
【0051】図5は、実施の形態1に係る音声復号方法
の処理の流れを示すフロー図である。なお、本方法で
は、図5に示す本処理を、一定の短区間(例えば、10
〜50ms程度)のフレーム毎に繰り返して行うものと
する。
【0052】まず、ST501において、符号化側で入
力信号に対して符号化され送信された送信データを入力
する。次に、ST502において、音声復号および雑音
生成に必要な、音声符号化データまたは雑音符号化デー
タと、有音/無音判定フラグとに分離する。
【0053】ST503において、有音/無音判定フラ
グによる有音/無音判定結果をチェックし(ST50
4)、有音/無音判定フラグが有音区間を示す場合に
は、ST505において、音声符号化データから音声復
号を行い復号音声を出力する。次に、ST506におい
て、雑音符号化データから雑音信号の生成を行し、生成
雑音信号を出力する。
【0054】そして、ST507において、ST505
の出力である復号音声信号と、ST506の出力である
生成雑音信号とを加算する。ただし、無音区間中では、
復号音声信号の加算は行わず、生成雑音信号のみを出力
する。最後に、ST508において、最終的に得られた
出力信号を復号器の出力として出力する。
【0055】図6は、背景雑音が重畳された音声信号が
入力された場合の、従来の音声復号装置で得られた出力
信号および本発明の音声復号装置で得られた出力信号の
例を模式的に示したものである。
【0056】従来技術の音声復号装置では、図6(a)
に示すように、有音区間中において、背景雑音が重畳さ
れた音声信号を復号することによる復号音声の歪みがそ
のまま聴感的な品質劣化を引き起こすと共に、有音区間
中の復号音声における背景雑音と、有音区間と異なる方
法で生成された無音区間中の背景雑音との聴感的品質が
異なることによる不自然感が生じる。
【0057】それに対して、本発明による音声復号装置
では、図6(b)に示すように、雑音信号生成器により
生成された生成雑音信号を無音区間中のみならず有音区
間にも復号音声信号に付加して出力することで、有音区
間の背景雑音による品質劣化がマスクされ劣化の影響が
減少するとともに、有音区間中の復号音声における背景
雑音と無音区間中に生成された背景雑音との聴感的品質
が類似することで不自然感が減少する。
【0058】このように、本実施の形態に係る音声符号
化・復号装置および音声符号化・復号方法によれば、雑
音信号生成器が、無音区間のみならず有音区間において
も雑音信号を生成し、音声/雑音信号加算器が、有音区
間において復号音声信号に対して生成雑音信号を付加し
て出力することにより、背景雑音が重畳された音声信号
に対しても、加算された生成雑音信号で、有音区間の背
景雑音による品質劣化がマスクされて劣化の影響が減少
する。また、有音区間中の復号音声における背景雑音と
無音区間中に生成された背景雑音との聴感的品質が類似
することで、不自然感が減少し、改善された音声品質を
有する音声復号を行うことができる。
【0059】(実施の形態2)図7は、本発明の実施の
形態2に係る音声復号装置における音声/雑音信号加算
器の構成を示すブロック図である。なお、本発明の実施
の形態2に係る音声復号装置の全体の構成およびその動
作は、音声/雑音信号加算器を除いて実施の形態1と同
一であるので、その説明は省略し、音声/雑音信号加算
器の動作のみを図7を用いて説明する。
【0060】図7において、加算雑音特性制御器701
では、有音区間中に加算する雑音の特性を、生成雑音信
号の特性に応じて適応的に制御する。特性制御後の生成
雑音信号は、加算器702に出力され、加算器702に
別途入力された復号音声信号と加算されて、復号出力信
号として出力される。この場合、加算雑音特性制御器7
01は、有音/無音判定フラグにしたがって加算する雑
音信号を切り換えて加算器702に出力する。これによ
り、有音区間に加算する雑音信号と無音区間に加算する
雑音信号を適応的に切り換えることができ、より聴感的
に改善された音声品質を有する復号音声を得ることがで
きる。
【0061】加算雑音特性制御器701における制御
は、具体的には、有音区間中において、一例として、加
算雑音特性制御器701に入力された生成雑音信号が、
非定常的な特性を有している場合には、入力された生成
雑音信号に対して、そのレベルを抑圧して、抑圧後の生
成雑音信号を加算器702に出力する。
【0062】生成雑音信号の非定常性は、例えば、受信
した雑音符号化データまたは生成雑音信号のスペクトル
およびパワーの変動を分析し、その変動が大きい場合
に、非定常であると判定することができる。あるいは、
符号化側で無音区間中の雑音信号符号化において、入力
信号に対する信号分析により得られた信号の特性(例え
ば、定常/非定常)を符号化情報として伝送するように
してもよい。また、加算雑音特性制御器701では、加
算する生成雑音のレベルのみならず、その他の特性(例
えば、スペクトル形状)を制御するようにしてもよい。
【0063】このように、本実施の形態に係る音声復号
装置によれば、入力信号に重畳された背景雑音の特性に
応じて、有音区間中に加算する生成雑音の特性を適応的
に制御するので、より聴感的に改善された音声品質を有
する復号を行うことができる。具体的には、一例とし
て、無音区間の雑音信号の特性が非定常と判定された場
合には、有音区間中に付加する生成雑音信号のレベルを
小さくすることにより、有音区間中に生成雑音を付加す
ることによる、不要な雑音感を減少させることができ
る。
【0064】本発明は、ディジタル無線通信システムに
おける無線基地局装置や通信端末装置に適用することが
できる。これにより、聴感的に改善された音声信号の送
受信を行うことが可能となる。
【0065】本発明は上記実施の形態1,2に限定され
ず、種々変更して実施することが可能である。上記実施
の形態1,2に係る音声符号化/復号装置は、音声符号
化/復号装置として説明しているが、これらの音声符号
化/復号をソフトウェアとして構成しても良い。例え
ば、上記音声符号化/復号のプログラムをROMに格納
し、そのプログラムにしたがってCPUの指示により動
作させるように構成しても良い。また、音声符号化/復
号プログラムをコンピュータで読み取り可能な記憶媒体
に格納し、この記憶媒体の音声符号化/復号プログラム
をコンピュータのRAMに記録して、プログラムにした
がって動作させるようにしても良い。このような場合に
おいても、上記実施の形態1,2と同様の作用、効果を
呈する。
【0066】
【発明の効果】以上説明したように本発明の音声符号化
・復号装置では、雑音信号生成器が、無音区間のみなら
ず有音区間においても雑音信号を生成し、音声/雑音信
号加算器が、有音区間において復号音声信号に対して生
成雑音信号を付加して出力する。これにより、背景雑音
が重畳された音声信号に対しても、加算された生成雑音
信号により、有音区間の背景雑音による品質劣化がマス
クされ、品質劣化の影響が減少するとともに、有音区間
中の復号音声における背景雑音と無音区間中に生成され
た背景雑音との聴感的品質が類似することで不自然感が
減少し、改善された音声品質を有する復号を行うことが
できる。
【0067】また、本発明の音声符号化・復号装置で
は、入力信号に重畳された背景雑音の特性に応じて、有
音区間中に加算する生成雑音の特性を適応的に制御す
る。これにより、より聴感的に改善された音声品質を有
する復号を行うことができる。具体的には、一例とし
て、無音区間の雑音信号の特性が非定常と判定された場
合には、有音区間中に付加する生成雑音信号のレベルを
小さくすることで、有音区間中に生成雑音を付加するこ
とによる、不要な雑音感を減少させることができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1に係る音声符号化/復号
装置を備えた無線通信装置の構成を示すブロック図
【図2】本発明の実施の形態1に係る音声符号化装置の
構成を示すブロック図
【図3】本発明の実施の形態1に係る音声復号装置の構
成を示すブロック図
【図4】本発明の実施の形態1に係る音声符号化方法の
処理の流れを示すフロー図
【図5】本発明の実施の形態1に係る音声復号方法の処
理の流れを示すフロー図
【図6】従来の音声復号装置および本発明の音声復号装
置で得られた出力信号の例を模式的に示した図
【図7】本発明の実施の形態2に係る音声復号装置にお
ける音声/雑音信号加算器の構成を示すブロック図
【図8】従来の音声符号化装置の構成を示すブロック図
【図9】従来の音声復号装置の構成を示すブロック図
【符号の説明】
201 有音/無音判定器 202 音声符号器 203 雑音信号符号器 204 DTX制御および多重化器 301 分離およびDTX制御器 302 音声復号器 303 雑音信号生成器 304 音声/雑音信号加算器 701 加算雑音特性制御器 702 加算器

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 符号化側で符号化された音声符号化デー
    タ及び雑音符号化データ、並びに区間判定情報を含む信
    号を受信する受信手段と、前記区間判定情報が有音区間
    を示す場合に前記音声符号化データを復号する音声復号
    手段と、前記雑音符号化データから雑音信号を生成する
    雑音信号生成手段と、前記有音区間において、前記音声
    復号手段で復号された復号音声信号に前記雑音信号を加
    算する雑音信号加算手段と、を具備することを特徴とす
    る音声復号装置。
  2. 【請求項2】 雑音信号加算手段は、雑音符号化データ
    または雑音信号の特性に基づいて、有音区間中に加算す
    る雑音信号の特性を適応的に制御することを特徴とする
    請求項1記載の音声復号装置。
  3. 【請求項3】 雑音信号加算手段は、区間判定情報が無
    音区間である場合の雑音信号の特性が非定常であるとき
    に、有音区間中に加算する雑音信号のレベルを小さくす
    ることを特徴とする請求項1または請求項2記載の音声
    復号装置。
  4. 【請求項4】 入力音声信号に対して有音区間か無音区
    間かを判定する区間判定手段と、前記区間判定手段の判
    定結果が有音である場合に前記入力音声信号に対して音
    声符号化を行う音声符号化手段と、前記区間判定手段の
    判定結果が無音である場合に前記入力音声信号に対して
    雑音信号の符号化を行う雑音信号符号化手段と、を有す
    る音声符号化装置と、請求項1から請求項3のいずれか
    に記載の音声復号装置と、を具備することを特徴とする
    音声符号化/復号装置。
  5. 【請求項5】 請求項1から請求項3のいずれかに記載
    の音声復号装置、または請求項4記載の音声符号化/復
    号装置を備えたことを特徴とする基地局装置。
  6. 【請求項6】 請求項1から請求項3のいずれかに記載
    の音声復号装置、または請求項4記載の音声符号化/復
    号装置を備えたことを特徴とする通信端末装置。
  7. 【請求項7】 符号化側で符号化された音声符号化デー
    タ及び雑音符号化データ、並びに区間判定情報を含む信
    号を受信する受信工程と、前記区間判定情報が有音区間
    を示す場合に音声符号化データを復号する音声復号工程
    と、前記雑音符号化データから雑音信号を生成する雑音
    信号生成工程と、前記有音区間において、前記音声復号
    工程で復号された復号音声信号に前記雑音信号を加算す
    る雑音信号加算工程と、を具備することを特徴とする音
    声復号方法。
  8. 【請求項8】 雑音信号加算工程において、雑音符号化
    データまたは雑音信号の特性に基づいて、有音区間中に
    加算する雑音信号の特性を適応的に制御することを特徴
    とする請求項7記載の音声復号方法。
  9. 【請求項9】 雑音信号加算工程において、区間判定情
    報が無音区間である場合の雑音信号の特性が非定常であ
    るときに、有音区間中に加算する雑音信号のレベルを小
    さくすることを特徴とする請求項7または請求項8記載
    の音声復号方法。
  10. 【請求項10】 符号化の際に加えられた雑音信号を有
    音区間に加えることを特徴とする音声復号方法。
  11. 【請求項11】 入力音声信号に対して有音区間か無音
    区間かを判定し、前記判定の結果が有音である場合に前
    記入力音声信号に対して音声符号化を行い、前記判定の
    結果が無音である場合に前記入力音声信号に対して雑音
    信号の符号化を行う音声符号化工程と、請求項7から請
    求項9のいずれかに記載の音声復号工程と、を具備する
    ことを特徴とする音声符号化/復号方法。
  12. 【請求項12】 音声復号プログラムを格納し、コンピ
    ュータにより読み取り可能な記録媒体であって、前記音
    声復号プログラムは、符号化側で符号化された音声符号
    化データ及び雑音符号化データ、並びに区間判定情報を
    含む信号の前記区間判定情報が有音区間を示す場合に音
    声符号化データを復号する手順と、前記雑音符号化デー
    タから雑音信号を生成する手順と、前記有音区間におい
    て、前記音声復号工程で復号された復号音声信号に前記
    雑音信号を加算する手順と、を含む。
JP2000054108A 2000-02-29 2000-02-29 音声符号化/復号装置およびその方法 Pending JP2001242896A (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2000054108A JP2001242896A (ja) 2000-02-29 2000-02-29 音声符号化/復号装置およびその方法
AU32316/01A AU3231601A (en) 2000-02-29 2001-02-16 Voice encoding/decoding device and method therefor
CN01800859A CN1366658A (zh) 2000-02-29 2001-02-16 语音编码/解码装置及其方法
EP01904496A EP1211670A1 (en) 2000-02-29 2001-02-16 Voice encoding/decoding device and method therefor
US09/959,533 US20020161573A1 (en) 2000-02-29 2001-02-16 Speech coding/decoding appatus and method
PCT/JP2001/001110 WO2001065542A1 (fr) 2000-02-29 2001-02-16 Dispositif de codage/decodage de la voix et procede associe

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000054108A JP2001242896A (ja) 2000-02-29 2000-02-29 音声符号化/復号装置およびその方法

Publications (1)

Publication Number Publication Date
JP2001242896A true JP2001242896A (ja) 2001-09-07

Family

ID=18575402

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000054108A Pending JP2001242896A (ja) 2000-02-29 2000-02-29 音声符号化/復号装置およびその方法

Country Status (6)

Country Link
US (1) US20020161573A1 (ja)
EP (1) EP1211670A1 (ja)
JP (1) JP2001242896A (ja)
CN (1) CN1366658A (ja)
AU (1) AU3231601A (ja)
WO (1) WO2001065542A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010276684A (ja) * 2009-05-26 2010-12-09 Nec Corp 音声復号装置及び方法
JP2011015339A (ja) * 2009-07-06 2011-01-20 Kaiser Technology:Kk 受信機
JP2012255966A (ja) * 2011-06-10 2012-12-27 Nippon Hoso Kyokai <Nhk> 復号化装置及び復号化プログラム

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1303584C (zh) * 2003-09-29 2007-03-07 摩托罗拉公司 联接式语音合成的声音目录编码方法和装置
EP3276619B1 (en) * 2004-07-23 2021-05-05 III Holdings 12, LLC Audio encoding device and audio encoding method
CN101246688B (zh) * 2007-02-14 2011-01-12 华为技术有限公司 一种对背景噪声信号进行编解码的方法、***和装置
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
US20120029926A1 (en) 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
US9640190B2 (en) * 2012-08-29 2017-05-02 Nippon Telegraph And Telephone Corporation Decoding method, decoding apparatus, program, and recording medium therefor
WO2014192604A1 (ja) * 2013-05-31 2014-12-04 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
WO2016183662A1 (en) * 2015-05-15 2016-11-24 Nureva Inc. System and method for embedding additional information in a sound mask noise signal

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0954600A (ja) * 1995-08-14 1997-02-25 Toshiba Corp 音声符号化通信装置
JPH09261184A (ja) * 1996-03-27 1997-10-03 Nec Corp 音声復号化装置
JPH10190498A (ja) * 1996-11-15 1998-07-21 Nokia Mobile Phones Ltd 不連続伝送中に快適雑音を発生させる改善された方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3832493A (en) * 1973-06-18 1974-08-27 Itt Digital speech detector
US3975686A (en) * 1975-03-20 1976-08-17 International Business Machines Corporation Loss signal generation for delta-modulated signals
JPH0583288A (ja) * 1991-09-20 1993-04-02 Fujitsu Ltd セル伝送制御方式
JPH0750631A (ja) * 1993-08-05 1995-02-21 Toshiba Corp 擬似背景雑音発生機能を備えたディジタル無線通信装置
JPH07115403A (ja) * 1993-08-27 1995-05-02 Fujitsu Ltd 無音区間情報の符号化及び復号化回路
JP3353994B2 (ja) * 1994-03-08 2002-12-09 三菱電機株式会社 雑音抑圧音声分析装置及び雑音抑圧音声合成装置及び音声伝送システム
JPH07273738A (ja) * 1994-03-28 1995-10-20 Toshiba Corp 音声送信制御回路
JP2586827B2 (ja) * 1994-07-20 1997-03-05 日本電気株式会社 受信装置
JP2638522B2 (ja) * 1994-11-01 1997-08-06 日本電気株式会社 音声符号化装置
US5864799A (en) * 1996-08-08 1999-01-26 Motorola Inc. Apparatus and method for generating noise in a digital receiver
JPH10247098A (ja) * 1997-03-04 1998-09-14 Mitsubishi Electric Corp 可変レート音声符号化方法、可変レート音声復号化方法
US6122611A (en) * 1998-05-11 2000-09-19 Conexant Systems, Inc. Adding noise during LPC coded voice activity periods to improve the quality of coded speech coexisting with background noise
US6662155B2 (en) * 2000-11-27 2003-12-09 Nokia Corporation Method and system for comfort noise generation in speech communication

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0954600A (ja) * 1995-08-14 1997-02-25 Toshiba Corp 音声符号化通信装置
JPH09261184A (ja) * 1996-03-27 1997-10-03 Nec Corp 音声復号化装置
JPH10190498A (ja) * 1996-11-15 1998-07-21 Nokia Mobile Phones Ltd 不連続伝送中に快適雑音を発生させる改善された方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010276684A (ja) * 2009-05-26 2010-12-09 Nec Corp 音声復号装置及び方法
JP2011015339A (ja) * 2009-07-06 2011-01-20 Kaiser Technology:Kk 受信機
JP2012255966A (ja) * 2011-06-10 2012-12-27 Nippon Hoso Kyokai <Nhk> 復号化装置及び復号化プログラム

Also Published As

Publication number Publication date
US20020161573A1 (en) 2002-10-31
CN1366658A (zh) 2002-08-28
WO2001065542A1 (fr) 2001-09-07
AU3231601A (en) 2001-09-12
EP1211670A1 (en) 2002-06-05

Similar Documents

Publication Publication Date Title
JP3182032B2 (ja) 音声符号化通信方式及びその装置
US7277849B2 (en) Efficiency improvements in scalable audio coding
JP2004512562A (ja) 広帯域音声コーデック復号器における高周波拡張階層符号化
JPH11126098A (ja) 音声合成方法及び装置、並びに帯域幅拡張方法及び装置
JP4464707B2 (ja) 通信装置
JP2001242896A (ja) 音声符号化/復号装置およびその方法
US6424942B1 (en) Methods and arrangements in a telecommunications system
JP2000357000A (ja) 雑音信号符号化装置および音声信号符号化装置
JP4420562B2 (ja) 背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法
WO2004044891A1 (ja) 音楽情報符号化装置及び方法、並びに音楽情報復号装置及び方法
JP3223966B2 (ja) 音声符号化/復号化装置
WO2002021091A1 (fr) Analyseur de signal de bruit, synthetiseur de signal de bruit, procede d&#39;analyse de signal de bruit et procede de synthese de signal de bruit
JPH08314497A (ja) 無音圧縮音声符号化復号化装置
EP1159738B1 (en) Speech synthesizer based on variable rate speech coding
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JPH07334197A (ja) 音声符号化装置
JPH10326100A (ja) 音声録音方法及び音声再生方法及び音声録音再生装置
JP3954288B2 (ja) 音声符号化信号変換装置
JP2900987B2 (ja) 無音圧縮音声符号化復号化装置
US6134519A (en) Voice encoder for generating natural background noise
JP2638522B2 (ja) 音声符号化装置
JP2001083996A (ja) 音声信号復号方法及び音声信号符号化復号方法
JP2002169595A (ja) 固定音源符号帳及び音声符号化/復号化装置
JPS62189833A (ja) 音声符号化復号化装置
JP2004078235A (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置