JP5589631B2 - 音声処理装置、音声処理方法および電話装置 - Google Patents
音声処理装置、音声処理方法および電話装置 Download PDFInfo
- Publication number
- JP5589631B2 JP5589631B2 JP2010160346A JP2010160346A JP5589631B2 JP 5589631 B2 JP5589631 B2 JP 5589631B2 JP 2010160346 A JP2010160346 A JP 2010160346A JP 2010160346 A JP2010160346 A JP 2010160346A JP 5589631 B2 JP5589631 B2 JP 5589631B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- correction amount
- far
- band
- noise component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims description 133
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000012937 correction Methods 0.000 claims description 493
- 230000005236 sound signal Effects 0.000 claims description 292
- 238000001228 spectrum Methods 0.000 description 59
- 230000000694 effects Effects 0.000 description 37
- 238000010586 diagram Methods 0.000 description 21
- 238000000034 method Methods 0.000 description 17
- 239000000284 extract Substances 0.000 description 15
- 230000000873 masking effect Effects 0.000 description 10
- 238000007781 pre-processing Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000007423 decrease Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
Description
(音声処理装置の構成)
図1は、実施の形態1にかかる音声処理装置を示すブロック図である。図1に示すように、実施の形態1にかかる音声処理装置10は、遠端音声取得部11と、擬似帯域拡張部12と、近端音声取得部13と、補正量算出部14と、補正部15と、出力部16と、AGC17と、を備えている。
図2は、遠端音声取得部によって取得される遠端音声信号の一例を示す図である。図2において、横軸は周波数を示し、縦軸はパワーを示す。帯域成分21は、遠端音声取得部11によって取得される遠端音声信号の一例を示している。帯域成分21の帯域は、たとえば300[Hz]〜3400[Hz]である。また、ネットワークを介して受信された遠端音声信号は、元の音声信号よりも帯域が狭くなる。ここでは、たとえば元の音声信号には含まれていた3400[Hz]より高い帯域22が帯域成分21に含まれていない。
図4は、音声処理装置の動作の一例を示すフローチャートである。図4に示すように、まず、遠端音声取得部11が、遠端音声信号を取得する(ステップS41)。つぎに、擬似帯域拡張部12が、ステップS41によって取得された遠端音声信号の帯域を擬似的に拡張する(ステップS42)。つぎに、補正量算出部14が、遠端音声信号の拡張帯域成分の補正量を算出する(ステップS43)。
図5は、実施の形態1にかかる補正量の算出動作の一例を示すフローチャートである。補正量算出部14は、たとえば以下の各ステップによって補正量を算出する。まず、近端音声信号から近端騒音成分を抽出する(ステップS51)。つぎに、ステップS51によって抽出された近端騒音成分の大きさに基づく補正量を算出し(ステップS52)、一連の算出動作を終了する。
補正部15は、たとえば下記(2)式によって遠端音声信号の拡張帯域成分のパワーを補正する。Siは、擬似帯域拡張部12から出力された遠端音声信号における周波数iのパワースペクトルである。Si’は、補正部15による補正後の帯域拡張における周波数iのパワースペクトルである。
図7は、音声処理装置を適用した携帯電話装置の一例を示すブロック図である。図7に示すように、携帯電話装置70は、受信回路71と、復号回路72と、音声処理装置10と、受話器73と、送話器74と、前処理回路75と、符号化回路76と、送信回路77と、を備えている。
(音声処理装置の構成)
図9は、実施の形態2にかかる音声処理装置を示すブロック図である。図9において、図1に示した構成と同様の構成については同一の符号を付して説明を省略する。図9に示すように、実施の形態2にかかる音声処理装置10は、遠端音声取得部11と、擬似帯域拡張部12と、補正量算出部14と、補正部15と、出力部16と、を備えている。また、実施の形態2においては、図1に示した近端音声取得部13を省いてもよい。
実施の形態2にかかる遠端音声取得部11によって取得される遠端音声信号の例については実施の形態1と同様である(たとえば図2参照)。また、実施の形態2にかかる擬似帯域拡張部12によって帯域を拡張された遠端音声信号の例については実施の形態1と同様である(たとえば図3参照)。また、実施の形態2にかかる音声処理装置10の動作の例については実施の形態1と同様である(たとえば図4参照)。
図10は、実施の形態2にかかる補正量の算出動作の一例を示すフローチャートである。補正量算出部14は、たとえば以下の各ステップによって補正量を算出する。まず、遠端音声信号から遠端騒音成分を抽出する(ステップS101)。つぎに、ステップS101によって抽出された遠端騒音成分の大きさに基づく補正量を算出し(ステップS102)、一連の算出動作を終了する。
実施の形態2にかかる補正部15による拡張帯域成分の補正については実施の形態1と同様である(たとえば上記(2)式参照)。また、実施の形態2にかかる音声処理装置10の適用例については実施の形態1と同様である(たとえば図7,図8参照)。
(音声処理装置の構成)
図12は、実施の形態3にかかる音声処理装置を示すブロック図である。図12において、図1に示した構成と同様の構成については同一の符号を付して説明を省略する。図12に示すように、実施の形態3にかかる音声処理装置10における遠端音声取得部11は、取得した遠端音声信号を擬似帯域拡張部12および補正量算出部14へ出力する。
実施の形態3にかかる遠端音声取得部11によって取得される遠端音声信号の例については実施の形態1と同様である(たとえば図2参照)。また、実施の形態3にかかる擬似帯域拡張部12によって帯域を拡張された遠端音声信号の例については実施の形態1と同様である(たとえば図3参照)。また、実施の形態3にかかる音声処理装置10の動作の例については実施の形態1と同様である(たとえば図4参照)。
図13は、実施の形態3にかかる補正量の算出動作の一例を示すフローチャートである。補正量算出部14は、たとえば以下の各ステップによって補正量を算出する。まず、遠端音声信号から遠端騒音成分を抽出する(ステップS131)。つぎに、近端音声信号から近端騒音成分を抽出する(ステップS132)。つぎに、ステップS131によって抽出された遠端騒音成分に対する、ステップS132によって抽出された近端騒音成分の比率を算出する(ステップS133)。つぎに、ステップS133によって算出された比率に基づく補正量を算出し(ステップS134)、一連の算出動作を終了する。
実施の形態3にかかる補正部15による拡張帯域成分の補正については実施の形態1と同様である(たとえば上記(2)式参照)。また、実施の形態3にかかる音声処理装置10の適用例については実施の形態1と同様である(たとえば図7,図8参照)。
(音声処理装置の構成)
実施の形態4にかかる音声処理装置10の構成については、実施の形態3と同様である(たとえば図12参照)。ただし、補正量算出部14は、近端音声取得部13から出力された近端音声信号に含まれる近端騒音成分に対する、遠端音声取得部11から出力された遠端音声信号に含まれる音声成分の比率に基づく補正量を算出する。遠端音声信号に含まれる音声成分は、遠端音声信号に含まれる成分のうちの遠端音声成分を除いた成分である。たとえば、補正量算出部14は、近端音声信号から近端騒音成分を抽出する。また、補正量算出部14は、遠端音声信号から音声成分を抽出する。
実施の形態4にかかる遠端音声取得部11によって取得される遠端音声信号の例については実施の形態1と同様である(たとえば図2参照)。また、実施の形態4にかかる擬似帯域拡張部12によって帯域を拡張された遠端音声信号の例については実施の形態1と同様である(たとえば図3参照)。また、実施の形態4にかかる音声処理装置10の動作の例については実施の形態1と同様である(たとえば図4参照)。
図15は、実施の形態4にかかる補正量の算出動作の一例を示すフローチャートである。補正量算出部14は、たとえば以下の各ステップによって補正量を算出する。まず、近端音声信号から近端騒音成分を抽出する(ステップS151)。つぎに、遠端音声信号から音声成分を抽出する(ステップS152)。つぎに、ステップS151によって抽出された近端騒音成分に対する、ステップS152によって抽出された音声成分の比率を算出する(ステップS153)。つぎに、ステップS153によって算出された比率に基づく補正量を算出し(ステップS154)、一連の算出動作を終了する。
実施の形態4にかかる補正部15による拡張帯域成分の補正については実施の形態1と同様である(たとえば上記(2)式参照)。また、実施の形態4にかかる音声処理装置10の適用例については実施の形態1と同様である(たとえば図7,図8参照)。
(音声処理装置の構成)
図17は、実施の形態5にかかる音声処理装置を示すブロック図である。図17において、図1に示した構成と同様の構成については同一の符号を付して説明を省略する。図17に示すように、実施の形態5にかかる音声処理装置10における擬似帯域拡張部12は、帯域を拡張した遠端音声信号を補正部15および補正量算出部14へ出力する。
実施の形態5にかかる遠端音声取得部11によって取得される遠端音声信号の例については実施の形態1と同様である(たとえば図2参照)。また、実施の形態5にかかる擬似帯域拡張部12によって帯域を拡張された遠端音声信号の例については実施の形態1と同様である(たとえば図3参照)。また、実施の形態5にかかる音声処理装置10の動作の例については実施の形態1と同様である(たとえば図4参照)。
図18は、実施の形態5にかかる補正量の算出動作の一例を示すフローチャートである。補正量算出部14は、たとえば以下の各ステップによって補正量を算出する。まず、近端音声信号から近端騒音成分を抽出する(ステップS181)。つぎに、ステップS181によって抽出された近端騒音成分に対する、擬似帯域拡張部12の帯域拡張後の遠端音声信号の比率を算出する(ステップS182)。つぎに、ステップS182によって算出された比率に基づく補正量を算出し(ステップS183)、一連の算出動作を終了する。
実施の形態5にかかる補正部15による拡張帯域成分の補正については実施の形態1と同様である(たとえば上記(2)式参照)。また、実施の形態5にかかる音声処理装置10の適用例については実施の形態1と同様である(たとえば図7,図8参照)。
(音声処理装置の構成)
実施の形態6にかかる音声処理装置10の構成については、実施の形態1と同様である(たとえば図1参照)。ただし、補正量算出部14は、近端音声取得部13から出力された近端音声信号に含まれる近端騒音成分の定常性に基づく補正量を算出する。たとえば、補正量算出部14は、近端音声信号から近端騒音成分を抽出し、抽出した近端騒音成分の定常性を算出する。補正量算出部14は、算出した定常性に基づく補正量を算出する。たとえば、補正量算出部14は、算出した定常性が高いほど小さな補正量を算出する。
実施の形態6にかかる遠端音声取得部11によって取得される遠端音声信号の例については実施の形態1と同様である(たとえば図2参照)。また、実施の形態6にかかる擬似帯域拡張部12によって帯域を拡張された遠端音声信号の例については実施の形態1と同様である(たとえば図3参照)。また、実施の形態6にかかる音声処理装置10の動作の例については実施の形態1と同様である(たとえば図4参照)。
図20は、実施の形態6にかかる補正量の算出動作の一例を示すフローチャートである。補正量算出部14は、たとえば以下の各ステップによって補正量を算出する。まず、近端音声信号から近端騒音成分を抽出する(ステップS201)。つぎに、ステップS201によって算出された近端騒音成分の定常性を算出する(ステップS202)。つぎに、ステップS202によって算出された定常性に基づく補正量を算出し(ステップS203)、一連の算出動作を終了する。
図22は、フレーム間のパワースペクトルの差と定常性との関係を示すグラフである。図22において、横軸は近端騒音成分のフレーム間のパワースペクトルの差(ΔX)を示し、縦軸は補正量算出部14によって算出される定常性を示している。横軸のΔXminは、近端騒音成分のフレーム間のパワースペクトルの差の最小値(たとえば−0.1)である。横軸のΔXmaxは、近端騒音成分のフレーム間のパワースペクトルの差の最大値(たとえば0.3)である。縦軸のTminは、定常性の最小値である。縦軸のTmaxは、定常性の最大値である。
実施の形態6にかかる補正部15による拡張帯域成分の補正については実施の形態1と同様である(たとえば上記(2)式参照)。また、実施の形態6にかかる音声処理装置10の適用例については実施の形態1と同様である(たとえば図7,図8参照)。
(音声処理装置の構成)
実施の形態7にかかる音声処理装置10の構成については、実施の形態2と同様である(たとえば図9参照)。ただし、補正量算出部14は、遠端音声取得部11から出力された遠端音声信号に含まれる遠端騒音成分の定常性に基づく補正量を算出する。たとえば、補正量算出部14は、遠端音声信号から遠端騒音成分を抽出し、抽出した遠端騒音成分の定常性を算出する。補正量算出部14は、算出した定常性に基づく補正量を算出する。たとえば、補正量算出部14は、算出した定常性が高いほど小さな補正量を算出する。
実施の形態7にかかる遠端音声取得部11によって取得される遠端音声信号の例については実施の形態1と同様である(たとえば図2参照)。また、実施の形態7にかかる擬似帯域拡張部12によって帯域を拡張された遠端音声信号の例については実施の形態1と同様である(たとえば図3参照)。また、実施の形態7にかかる音声処理装置10の動作の例については実施の形態1と同様である(たとえば図4参照)。
図23は、実施の形態7にかかる補正量の算出動作の一例を示すフローチャートである。補正量算出部14は、たとえば以下の各ステップによって補正量を算出する。まず、遠端音声信号から遠端騒音成分を抽出する(ステップS231)。つぎに、ステップS231によって算出された遠端騒音成分の定常性を算出する(ステップS232)。つぎに、ステップS232によって算出された定常性に基づく補正量を算出し(ステップS233)、一連の算出動作を終了する。
実施の形態7にかかる補正部15による遠端騒音成分の定常性の算出については、実施の形態6における近端騒音成分の定常性の算出と同様である(たとえば上記(8)式〜(11)式および図22参照)。また、実施の形態7にかかる補正部15による拡張帯域成分の補正については実施の形態1と同様である(たとえば上記(2)式参照)。また、実施の形態7にかかる音声処理装置10の適用例については実施の形態1と同様である(たとえば図7,図8参照)。
(音声処理装置の構成)
実施の形態8にかかる音声処理装置10の構成については、実施の形態3と同様である(たとえば図12参照)。ただし、補正量算出部14は、遠端音声取得部11から出力された遠端音声信号に含まれる遠端騒音成分と、近端音声取得部13から出力された近端音声信号に含まれる近端騒音成分と、の類似性に基づく補正量を算出する。
実施の形態8にかかる遠端音声取得部11によって取得される遠端音声信号の例については実施の形態1と同様である(たとえば図2参照)。また、実施の形態8にかかる擬似帯域拡張部12によって帯域を拡張された遠端音声信号の例については実施の形態1と同様である(たとえば図3参照)。また、実施の形態8にかかる音声処理装置10の動作の例については実施の形態1と同様である(たとえば図4参照)。
図25は、実施の形態8にかかる補正量の算出動作の一例を示すフローチャートである。補正量算出部14は、たとえば以下の各ステップによって補正量を算出する。まず、近端音声信号から近端騒音成分を抽出する(ステップS251)。つぎに、遠端音声信号から遠端騒音成分を抽出する(ステップS252)。つぎに、ステップS251によって算出された近端騒音成分と、ステップS252によって算出された遠端騒音成分と、の類似性を算出する(ステップS253)。つぎに、ステップS253によって算出された類似性に基づく補正量を算出し(ステップS254)、一連の算出動作を終了する。
図27は、各騒音成分のパワースペクトル差と類似性との関係を示すグラフである。図27において、横軸は近端騒音成分と遠端騒音成分とのパワースペクトル差を示し、縦軸は補正量算出部14によって算出される類似性を示している。横軸のDminは、近端騒音成分と遠端騒音成分とのパワースペクトル差の最小値(たとえば0.0)である。横軸のDmaxは、近端騒音成分と遠端騒音成分とのパワースペクトル差の最大値(たとえば1.0)である。縦軸のSminは、類似性の最小値(たとえば0.0)である。縦軸のSmaxは、類似性の最大値(たとえば1.0)である。
実施の形態8にかかる補正部15による拡張帯域成分の補正については実施の形態1と同様である(たとえば上記(2)式参照)。また、実施の形態8にかかる音声処理装置10の適用例については実施の形態1と同様である(たとえば図7,図8参照)。
実施の形態9にかかる音声処理装置10は、上述した各実施の形態にかかる各方法で複数の補正量を算出し、算出した複数の補正量を用いて拡張帯域成分のパワーを補正する。たとえば、音声処理装置10は、実施の形態1〜8にかかる各方法のうちの少なくとも2つの方法で算出した補正量をそれぞれ重み付けして加算し、加算した補正量によって拡張帯域成分のパワーを補正する。
実施の形態9にかかる音声処理装置10の構成については、実施の形態3と同様である(たとえば図12参照)。ただし、補正量算出部14は、遠端音声取得部11から出力された遠端音声信号に含まれる遠端騒音成分に基づく補正量と、近端音声取得部13から出力された近端音声信号に含まれる近端騒音成分に基づく補正量と、をそれぞれ重み付けして加算する。近端音声取得部13は、加算した補正量を補正量算出部14へ出力する。
実施の形態9にかかる遠端音声取得部11によって取得される遠端音声信号の例については実施の形態1と同様である(たとえば図2参照)。また、実施の形態9にかかる擬似帯域拡張部12によって帯域を拡張された遠端音声信号の例については実施の形態1と同様である(たとえば図3参照)。また、実施の形態9にかかる音声処理装置10の動作の例については実施の形態1と同様である(たとえば図4参照)。
図28は、実施の形態9にかかる補正量の算出動作の一例を示すフローチャートである。補正量算出部14は、たとえば以下の各ステップによって補正量を算出する。まず、近端騒音成分に基づく補正量を算出する(ステップS281)。つぎに、遠端騒音成分に基づく補正量を算出する(ステップS282)。つぎに、ステップS281,S282によって算出された各補正量に重み付け係数を乗算する(ステップS283)。つぎに、ステップS283によって乗算された各補正量を加算し(ステップS284)、一連の算出動作を終了する。
実施の形態9にかかる補正部15による拡張帯域成分の補正については実施の形態1と同様である(たとえば上記(2)式参照)。また、実施の形態9にかかる音声処理装置10の適用例については実施の形態1と同様である(たとえば図7,図8参照)。
実施の形態10にかかる音声処理装置10の補正量算出部14は、上述した各実施の形態にかかる各方法のいずれかによって複数の補正量を算出する。そして、補正量算出部14は、拡張帯域成分と狭帯域成分との境界付近の所定幅の帯域成分について当該帯域における周波数ごとに定まる補正量を補正部15へ出力する。ここでは実施の形態10にかかる音声処理装置10による補正量の算出について説明するが、音声処理装置10の他の処理等については上述した各実施の形態と同様である。
実施の形態10にかかる音声処理装置10の補正量算出部14は、拡張帯域成分と狭帯域成分との境界付近の所定幅の帯域成分について当該帯域における周波数ごとに定まる補正量を補正部15へ出力する。たとえば、補正量算出部14は、算出した補正量Aiのうちの、拡張帯域成分と狭帯域成分との境界付近の所定幅の帯域成分を、当該帯域の両側の周波数における補正量Aiに基づいて補間することで平滑化する。
つぎに、上述した各実施の形態にかかる音声処理装置10の補正部15による補正の前後における遠端音声信号のパワースペクトルの例を示す。ここでは、一例として、図9に示した音声処理装置10における遠端音声信号のパワースペクトルを示す。
つぎに、上述した各実施の形態にかかる音声処理装置10の変形例について説明する。ここでは図1に示した音声処理装置10の変形例について説明するが、上述した他の音声処理装置10についても同様の変形が可能である。
前記音声信号取得手段によって取得された音声信号の狭帯域成分に基づいて、前記音声信号の帯域を拡張する拡張帯域成分を生成する拡張手段と、
前記拡張帯域成分のパワーを、前記音声信号取得手段によって取得された音声信号に含まれる騒音成分に基づいて定まる補正量によって補正する補正手段と、
前記補正手段によって補正された前記拡張帯域成分と前記音声信号取得手段により取得された音声信号の狭帯域成分とに基づいて、帯域を拡張された音声信号を出力する出力手段と、
を備えることを特徴とする音声処理装置。
狭帯域化された第一音声信号を取得する第一取得手段と、
前記第一音声信号を再生する再生機器の周辺の音声を示す第二音声信号を取得する第二取得手段と、
を有し、
前記拡張手段は、
前記音声信号取得手段により取得された音声信号として、前記第一取得手段により取得された前記第一音声信号を用い、
前記補正手段は、
前記音声信号取得手段によって取得された音声信号に含まれる騒音成分として、前記第二取得手段により取得された第二音声信号に含まれる騒音成分を用い、
前記出力手段は、
前記音声信号取得手段により取得された音声信号として、前記第一取得手段により取得された前記第一音声信号を用いることを特徴とする付記1に記載の音声処理装置。
前記音声信号取得工程によって取得された音声信号の狭帯域成分に基づいて、前記音声信号の帯域を拡張する拡張帯域成分を生成する拡張工程と、
前記拡張帯域成分のパワーを、前記音声信号取得工程によって取得された音声信号に含まれる騒音成分に基づいて定まる補正量によって補正する補正工程と、
前記補正工程によって補正された前記拡張帯域成分と前記音声信号取得工程により取得された音声信号の狭帯域成分とに基づいて、帯域を拡張された音声信号を出力する出力工程と、
を含むことを特徴とする音声処理方法。
前記受信手段によって受信された第一音声信号を取得する第一取得手段と、
前記第一取得手段によって取得された第一音声信号の狭帯域成分に基づいて、前記第一音声信号の帯域を拡張する拡張帯域成分を生成する拡張手段と、
前記第一音声信号を再生する再生機器の周辺の音声を示す第二音声信号を取得する第二取得手段と、
前記拡張手段によって生成された前記拡張帯域成分のパワーを、前記第二取得手段によって取得された第二音声信号に含まれる騒音成分に基づいて定まる補正量により補正する補正手段と、
前記補正手段によって補正された前記拡張帯域成分と前記第一音声信号の狭帯域成分とに基づいて、帯域を拡張された音声信号を前記再生機器へ出力する出力手段と、
前記第二取得手段によって取得された第二音声信号を、ネットワークを介して送信する送信手段と、
を備えることを特徴とする電話装置。
22 帯域
31,32 拡張帯域成分
70,81,82 携帯電話装置
80 通信システム
83,84 基地局
85 ネットワーク
Claims (6)
- 狭帯域化された入力信号から複数の周波数帯域に変換された音声信号を取得する音声信号取得手段と、
前記音声信号取得手段によって取得された音声信号の狭帯域成分に基づいて、前記音声信号の帯域を拡張する拡張帯域成分を生成する拡張手段と、
前記拡張帯域成分のパワーを、前記音声信号取得手段によって取得された音声信号に含まれる騒音成分に基づいて定まる補正量によって補正する補正手段と、
前記補正手段によって補正された前記拡張帯域成分と前記音声信号取得手段により取得された音声信号の狭帯域成分とに基づいて、帯域を拡張された音声信号を出力する出力手段と、
を備え、
前記音声信号取得手段は、
狭帯域化された第一音声信号を取得する第一取得手段と、
前記第一音声信号を再生する再生機器の周辺の音声を示す第二音声信号を取得する第二取得手段と、
を有し、
前記拡張手段は、
前記音声信号取得手段により取得された音声信号として、前記第一取得手段により取得された前記第一音声信号を用い、
前記補正手段は、
前記音声信号取得手段によって取得された音声信号に含まれる騒音成分として、前記第二取得手段により取得された第二音声信号に含まれる騒音成分を用い、
前記第一音声信号に含まれる騒音成分と、前記第二音声信号に含まれる騒音成分と、の比率に基づく補正量、
または前記第二音声信号に含まれる騒音成分と、前記第一音声信号に含まれる音声成分と、の比率に基づく補正量、
または前記第一音声信号および前記第二音声信号に含まれる各騒音成分の類似性に基づく補正量、
によって前記拡張帯域成分のパワーを補正し、
前記出力手段は、
前記音声信号取得手段により取得された音声信号として、前記第一取得手段により取得された前記第一音声信号を用いることを特徴とする音声処理装置。 - 前記補正手段は、前記拡張帯域成分に含まれる複数の周波数ごとに、前記第二取得手段により取得された第二音声信号に基づいて定まる補正量により補正することを特徴とする請求項1に記載の音声処理装置。
- 前記出力手段は、前記拡張帯域成分と前記狭帯域成分との境界付近の所定幅の帯域成分について当該帯域における周波数ごとに定まる補正量により補正された音声信号を出力することを特徴とする請求項1または2に記載の音声処理装置。
- 前記補正手段は、前記第二取得手段により取得された第二音声信号に含まれる騒音成分の大きさに基づく補正量により補正することを特徴とする請求項1または2に記載の音声処理装置。
- 音声信号を取得する音声信号取得工程と、
前記音声信号取得工程によって取得された音声信号の狭帯域成分に基づいて、前記音声信号の帯域を拡張する拡張帯域成分を生成する拡張工程と、
前記拡張帯域成分のパワーを、前記音声信号取得工程によって取得された音声信号に含まれる騒音成分に基づいて定まる補正量によって補正する補正工程と、
前記補正工程によって補正された前記拡張帯域成分と前記音声信号取得工程により取得された音声信号の狭帯域成分とに基づいて、帯域を拡張された音声信号を出力する出力工程と、
を含み、
前記音声信号取得工程は、
狭帯域化された第一音声信号を取得する第一取得工程と、
前記第一音声信号を再生する再生機器の周辺の音声を示す第二音声信号を取得する第二取得工程と、
を有し、
前記拡張工程では、
前記音声信号取得工程により取得された音声信号として、前記第一取得工程により取得された前記第一音声信号を用い、
前記補正工程では、
前記音声信号取得工程によって取得された音声信号に含まれる騒音成分として、前記第二取得工程により取得された第二音声信号に含まれる騒音成分を用い、
前記第一音声信号に含まれる騒音成分と、前記第二音声信号に含まれる騒音成分と、の比率に基づく補正量、
または前記第二音声信号に含まれる騒音成分と、前記第一音声信号に含まれる音声成分と、の比率に基づく補正量、
または前記第一音声信号および前記第二音声信号に含まれる各騒音成分の類似性に基づく補正量、
によって前記拡張帯域成分のパワーを補正し、
前記出力工程では、
前記音声信号取得工程により取得された音声信号として、前記第一取得工程により取得された前記第一音声信号を用いることを特徴とする音声処理方法。 - ネットワークを介して第一音声信号を受信する受信手段と、
前記受信手段によって受信された第一音声信号を取得する第一取得手段と、
前記第一取得手段によって取得された第一音声信号の狭帯域成分に基づいて、前記第一音声信号の帯域を拡張する拡張帯域成分を生成する拡張手段と、
前記第一音声信号を再生する再生機器の周辺の音声を示す第二音声信号を取得する第二取得手段と、
前記拡張手段によって生成された前記拡張帯域成分のパワーを、前記第二取得手段によって取得された第二音声信号に含まれる騒音成分に基づいて定まる補正量により補正する補正手段と、
前記補正手段によって補正された前記拡張帯域成分と前記第一音声信号の狭帯域成分とに基づいて、帯域を拡張された音声信号を前記再生機器へ出力する出力手段と、
前記第二取得手段によって取得された第二音声信号を、ネットワークを介して送信する送信手段と、
を備え、
前記補正手段は、
前記第一音声信号に含まれる騒音成分と、前記第二音声信号に含まれる騒音成分と、の比率に基づく補正量、
または前記第二音声信号に含まれる騒音成分と、前記第一音声信号に含まれる音声成分と、の比率に基づく補正量、
または前記第一音声信号および前記第二音声信号に含まれる各騒音成分の類似性に基づく補正量、
によって前記拡張帯域成分のパワーを補正することを特徴とする電話装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010160346A JP5589631B2 (ja) | 2010-07-15 | 2010-07-15 | 音声処理装置、音声処理方法および電話装置 |
US13/072,992 US9070372B2 (en) | 2010-07-15 | 2011-03-28 | Apparatus and method for voice processing and telephone apparatus |
EP20110160750 EP2407966A1 (en) | 2010-07-15 | 2011-03-31 | Method and Apparatuses for bandwidth expansion for voice communication |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010160346A JP5589631B2 (ja) | 2010-07-15 | 2010-07-15 | 音声処理装置、音声処理方法および電話装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012022166A JP2012022166A (ja) | 2012-02-02 |
JP5589631B2 true JP5589631B2 (ja) | 2014-09-17 |
Family
ID=44170027
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010160346A Expired - Fee Related JP5589631B2 (ja) | 2010-07-15 | 2010-07-15 | 音声処理装置、音声処理方法および電話装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9070372B2 (ja) |
EP (1) | EP2407966A1 (ja) |
JP (1) | JP5589631B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5589631B2 (ja) * | 2010-07-15 | 2014-09-17 | 富士通株式会社 | 音声処理装置、音声処理方法および電話装置 |
JP6277739B2 (ja) | 2014-01-28 | 2018-02-14 | 富士通株式会社 | 通信装置 |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
US10375487B2 (en) | 2016-08-17 | 2019-08-06 | Starkey Laboratories, Inc. | Method and device for filtering signals to match preferred speech levels |
CN107087069B (zh) * | 2017-04-19 | 2020-02-28 | 维沃移动通信有限公司 | 一种语音通话方法及移动终端 |
US10553235B2 (en) * | 2017-08-28 | 2020-02-04 | Apple Inc. | Transparent near-end user control over far-end speech enhancement processing |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU633673B2 (en) | 1990-01-18 | 1993-02-04 | Matsushita Electric Industrial Co., Ltd. | Signal processing device |
JP2830276B2 (ja) | 1990-01-18 | 1998-12-02 | 松下電器産業株式会社 | 信号処理装置 |
FI102337B1 (fi) * | 1995-09-13 | 1998-11-13 | Nokia Mobile Phones Ltd | Menetelmä ja piirijärjestely audiosignaalin käsittelemiseksi |
JP3301473B2 (ja) | 1995-09-27 | 2002-07-15 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US20020172350A1 (en) * | 2001-05-15 | 2002-11-21 | Edwards Brent W. | Method for generating a final signal from a near-end signal and a far-end signal |
JP2003070097A (ja) * | 2001-08-24 | 2003-03-07 | Matsushita Electric Ind Co Ltd | デジタル補聴装置 |
JP2003255973A (ja) | 2002-02-28 | 2003-09-10 | Nec Corp | 音声帯域拡張システムおよび方法 |
US7283585B2 (en) * | 2002-09-27 | 2007-10-16 | Broadcom Corporation | Multiple data rate communication system |
US20040138876A1 (en) * | 2003-01-10 | 2004-07-15 | Nokia Corporation | Method and apparatus for artificial bandwidth expansion in speech processing |
WO2004090870A1 (ja) * | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
JP2005101917A (ja) | 2003-09-25 | 2005-04-14 | Matsushita Electric Ind Co Ltd | 電話装置 |
US7461003B1 (en) * | 2003-10-22 | 2008-12-02 | Tellabs Operations, Inc. | Methods and apparatus for improving the quality of speech signals |
JP4520732B2 (ja) | 2003-12-03 | 2010-08-11 | 富士通株式会社 | 雑音低減装置、および低減方法 |
US8712768B2 (en) * | 2004-05-25 | 2014-04-29 | Nokia Corporation | System and method for enhanced artificial bandwidth expansion |
JP5046654B2 (ja) * | 2005-01-14 | 2012-10-10 | パナソニック株式会社 | スケーラブル復号装置及びスケーラブル復号方法 |
US8135728B2 (en) * | 2005-03-24 | 2012-03-13 | Microsoft Corporation | Web document keyword and phrase extraction |
KR100956877B1 (ko) * | 2005-04-01 | 2010-05-11 | 콸콤 인코포레이티드 | 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 |
US7813931B2 (en) * | 2005-04-20 | 2010-10-12 | QNX Software Systems, Co. | System for improving speech quality and intelligibility with bandwidth compression/expansion |
US7546237B2 (en) | 2005-12-23 | 2009-06-09 | Qnx Software Systems (Wavemakers), Inc. | Bandwidth extension of narrowband speech |
JP4735419B2 (ja) | 2006-05-30 | 2011-07-27 | 日本キャステム株式会社 | 音声通話装置 |
JP4733727B2 (ja) | 2007-10-30 | 2011-07-27 | 日本電信電話株式会社 | 音声楽音擬似広帯域化装置と音声楽音擬似広帯域化方法、及びそのプログラムとその記録媒体 |
US20090144262A1 (en) * | 2007-12-04 | 2009-06-04 | Microsoft Corporation | Search query transformation using direct manipulation |
US8433582B2 (en) | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US8275139B2 (en) * | 2008-03-26 | 2012-09-25 | Ittiam Systems (P) Ltd. | Linear full duplex system and method for acoustic echo cancellation |
US8645129B2 (en) * | 2008-05-12 | 2014-02-04 | Broadcom Corporation | Integrated speech intelligibility enhancement system and acoustic echo canceller |
US9197181B2 (en) * | 2008-05-12 | 2015-11-24 | Broadcom Corporation | Loudness enhancement system and method |
JP5453740B2 (ja) | 2008-07-02 | 2014-03-26 | 富士通株式会社 | 音声強調装置 |
JP5127754B2 (ja) * | 2009-03-24 | 2013-01-23 | 株式会社東芝 | 信号処理装置 |
US8571231B2 (en) * | 2009-10-01 | 2013-10-29 | Qualcomm Incorporated | Suppressing noise in an audio signal |
US20110125494A1 (en) * | 2009-11-23 | 2011-05-26 | Cambridge Silicon Radio Limited | Speech Intelligibility |
US8489393B2 (en) * | 2009-11-23 | 2013-07-16 | Cambridge Silicon Radio Limited | Speech intelligibility |
US8321215B2 (en) * | 2009-11-23 | 2012-11-27 | Cambridge Silicon Radio Limited | Method and apparatus for improving intelligibility of audible speech represented by a speech signal |
JP5589631B2 (ja) * | 2010-07-15 | 2014-09-17 | 富士通株式会社 | 音声処理装置、音声処理方法および電話装置 |
-
2010
- 2010-07-15 JP JP2010160346A patent/JP5589631B2/ja not_active Expired - Fee Related
-
2011
- 2011-03-28 US US13/072,992 patent/US9070372B2/en not_active Expired - Fee Related
- 2011-03-31 EP EP20110160750 patent/EP2407966A1/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
JP2012022166A (ja) | 2012-02-02 |
US20120016669A1 (en) | 2012-01-19 |
US9070372B2 (en) | 2015-06-30 |
EP2407966A1 (en) | 2012-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5589631B2 (ja) | 音声処理装置、音声処理方法および電話装置 | |
RU2585987C2 (ru) | Устройство и способ обработки речевого/аудио сигнала | |
JP6281336B2 (ja) | 音声復号化装置及びプログラム | |
JP5535241B2 (ja) | 音声信号復元装置および音声信号復元方法 | |
US20150120307A1 (en) | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program | |
JP5223786B2 (ja) | 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機 | |
US8065141B2 (en) | Apparatus and method for processing signal, recording medium, and program | |
US20070124140A1 (en) | Method for extending the spectral bandwidth of a speech signal | |
JP6073456B2 (ja) | 音声強調装置 | |
US8804980B2 (en) | Signal processing method and apparatus, and recording medium in which a signal processing program is recorded | |
JP4018571B2 (ja) | 音声強調装置 | |
JPWO2011121782A1 (ja) | 帯域拡張装置および帯域拡張方法 | |
JP4738213B2 (ja) | 利得調整方法及び利得調整装置 | |
US10147434B2 (en) | Signal processing device and signal processing method | |
JP5232121B2 (ja) | 信号処理装置 | |
JP6162254B2 (ja) | 背景ノイズにおけるスピーチ了解度を増幅及び圧縮により向上させる装置と方法 | |
JP2008309955A (ja) | ノイズサプレス装置 | |
JP4922427B2 (ja) | 信号補正装置 | |
JP4227421B2 (ja) | 音声強調装置および携帯端末 | |
WO2021200151A1 (ja) | 送信装置、送信方法、受信装置、及び受信方法 | |
JP2004070240A (ja) | オーディオ信号の時間軸圧伸装置、方法及びプログラム | |
JP2018037736A (ja) | 信号処理装置及びプログラム | |
JP2013041297A (ja) | 帯域拡張装置、方法及びプログラム、並びに、電話端末 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130507 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140701 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140714 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5589631 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |