JP2005203981A - 音響信号処理装置および音響信号処理方法 - Google Patents
音響信号処理装置および音響信号処理方法 Download PDFInfo
- Publication number
- JP2005203981A JP2005203981A JP2004007206A JP2004007206A JP2005203981A JP 2005203981 A JP2005203981 A JP 2005203981A JP 2004007206 A JP2004007206 A JP 2004007206A JP 2004007206 A JP2004007206 A JP 2004007206A JP 2005203981 A JP2005203981 A JP 2005203981A
- Authority
- JP
- Japan
- Prior art keywords
- signal processing
- unit
- acoustic signal
- som
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】 補聴器等に設けられた音響信号処理装置20において、学習フェーズ処理部27において様々な音響信号を分類整理し(学習ステップ)、信号処理実行フェーズ処理部28において学習フェーズにて分類整理された音響信号を用いて上記入力音響信号の増幅等をユーザが聴取するために信号処理する(信号処理実行ステップ)。
【選択図】 図1
Description
また、従来から、環境毎にモードを切り替え又は制御する方法が種々提案されている。
また、環境騒音の質を考慮して音声の明瞭な聞き取りを行なう補聴装置が提案されている(特許文献2参照)。この聞き取り方法は、入力音響信号のレベル分布を検出し環境騒音の定常/非定常を判別し、それに応じた補聴処理を行なうものである。これにより、環境騒音の質のいかんにかかわらず聴き取り対象となる音声を明瞭に聴き取れる。
一方、従来の技術は、音環境に応じて適切にモード切り替え可能ではない。例えば、特許文献1記載の自動利得制御装置と特許文献2記載の補聴装置とは、いずれも、入力音響信号レベルだけを監視するものであり、入力音響信号レベル以外のスペクトル特性又は入力音響信号の種別を監視するものではない。このため、各装置は、周囲騒音のレベルに応じて利得等を制御することはできるが、音声又は非音声の種別,残響の有無等、周囲の音環境の状態については記載されておらず、きめ細かい制御はできない。また、特許文献2記載の補聴装置は、検出されたレベル分布の各レベル値が散在し音質が劣化する。
本発明は、このような課題に鑑み創案されたもので、例えば補聴器の音響信号処理において、入力音響信号を識別し、適切に音響信号を特徴解析し、その解析によって得られた特徴量により周囲の音環境を識別し、識別された情報に基づいて増幅特性等の音響信号を処理することにより、どのような音環境においても、安定かつ適切な音響信号処理でき、聞きやすく、また、安定して明瞭性の高い音声を再生可能な、音響信号処理装置および音響信号処理方法を提供することを目的とする。
また、本発明の音響信号処理装置は、学習音響信号の特徴量を表す第1の特徴量データを出力する特徴量出力部と、特徴量出力部からの第1の特徴量データに基づいて学習音響信号を2次元平面においてグループ化する学習部と、2次元平面の座標と、座標に割り当てられた第2の特徴量データと、学習部にてグループ化された複数のグループを識別するグループ識別情報とのそれぞれを対応付けたSOM情報データを保持する自己組織化マップ保持部とをそなえて構成されたことを特徴としている(請求項4)。
また、本発明の音響信号処理装置によれば、明瞭な音声が得られ、ユーザの聴感の向上に多大に寄与する。
さらに、音声又は非音声の種別にかかわらず、どのような音響信号であっても、学習フェーズを経てその音響信号の特徴量が保持されるので、一層、カスタマイズした機能を発揮することができる。
(a)本発明の一実施形態の説明
図1は本発明の第1実施形態に係る音響信号処理装置のブロック図である。この図1に示す音響信号処理装置20は、例えば補聴器,ラジオ又はテレビの音声回路等に用いられるものであって、音声又は非音声の種別,周囲の雑音,騒音又は残響等の程度に応じて音声等が聞き取りやすくなるように適切な処理(音響信号処理)を行なうものである。この音響信号処理は、入力された音響信号のレベルについての増減,音響信号の一部のスペクトル帯域の強調又は低減等の音響信号について増幅特性を変更し、音声明瞭度を確保するようになっている。
本発明の音響信号処理装置20における音響信号処理方法は、主に2種類の処理フェーズを設け、様々な音響信号の分類整理を行なう学習フェーズ(学習ステップ)と、この学習フェーズにて分類整理された音響信号を用いて、入力された音響信号をユーザが聴取するために、その入力音響信号の増幅等の信号処理を行なう信号処理実行フェーズ(信号処理実行ステップ)とからなる。
この音響信号処理装置20は、音声入力部50と、特徴解析部(特徴量出力部)21と、SOM学習部(自己組織化学習部)26と、SOM座標検索部22と、SOM情報格納メモリ(自己組織化マップ保持部)23と、信号処理種別情報出力部24と、音響信号処理部25と、アンプ51と、イヤホン52とをそなえて構成されている。そして、これらの各ブロック(回路ブロック)が協働することにより、学習フェーズと信号処理実行フェーズとが行なわれる。以下、各ブロックについて詳述する。
音声入力部50は、音声および周囲の音を取得して音響信号に変換しこの音響信号を特徴解析部21に入力するものであって、例えばマイク,アンプ等が設けられている。
(2−2)特徴解析部21
特徴解析部21は、入力音響信号の特徴量を表す特徴量ベクトル(特徴量ベクトルデータ:第1の特徴量データ)を出力するものであって、特徴量出力部21として機能している。
ここで、音響信号の特徴量とは、例えば、音響信号の波形,音響信号のレベル,繰り返し波形を有する音響信号の繰り返し周期又は音響信号のスペクトル成分(パワースペクトル)等、音響信号自身が有する特性又は性質である。
また、特徴量ベクトルとは、例えば「ア」等の特徴量を複数の要素で表したものであって、{1.1,1.3,…,1.2}等の集合である。例えば時間幅TWの音響信号の特徴量ベクトルとは、時間幅TWの波形が特徴解析され時間幅TWをn分割(nは自然数を表す。)した時刻t0,t1,…,t(n-1)において、それぞれ、音響信号の波形を量子化(サンプリング)し、量子化した要素FINPUT(1,1,0),FINPUT(1,1,1),…,FINPUT(1,1,n−1)を特徴量ベクトルとして出力する。
また、特徴解析部21は、学習フェーズと信号処理実行フェーズとの両フェーズにおいて動作する。学習フェーズにおいて、特徴解析部21は、多数の学習音響信号を入力され、各音響信号の特徴量FINPUT(x,y,k)を抽出する(kは0〜n−1の自然数を表す)。この抽出された特徴量FINPUT(x,y,k)は、後述するSOM情報格納メモリ23に特徴量FSOM(x,y,k)(第2の特徴量データ)として格納される。そして、信号処理実行フェーズにおいて、特徴解析部21が抽出した入力音響信号の特徴量FINPUT(x,y,k)は、SOM情報格納メモリ23に格納された特徴量FSOM(x,y,k)と比較される。従って、特徴解析部21は、信号処理実行フェーズにおいて入力音響信号を特徴解析するとともに、前処理としての学習フェーズにおいても学習音響信号の特徴解析を行なう。
(2−4)特徴量ベクトルと座標との違いについて
一般に、「ベクトル」と「座標」との両概念は等価であることが多いが、以下の説明において、特徴量ベクトルと座標とは異なる。上記のように、特徴量ベクトルは要素FINPUT(x,y,0)〜FINPUT(x,y,n−1)の集合を意味し、また、座標はSOM情報格納メモリ23のアドレスを意味する。換言すれば、n個の要素がSOM情報格納メモリ23のアドレスに対応付けられて保持される。
また、SOM情報格納メモリ23は、2次元平面の座標と、座標に割り当てられた特徴量ベクトルFSOM(x,y,k)と、複数の学習音響信号が2次元平面においてグループ化された複数のグループを識別するグループ識別情報とのそれぞれを対応付けたSOM情報データを保持するものである。
そして、SOM座標検索部22は、特徴解析部21からの特徴量ベクトルFINPUT(x,y,k)と、SOM情報格納メモリ23に保持されたSOM情報データ(座標,特徴量ベクトルFSOM(x,y,k)およびグループ識別情報)とに基づいて、特徴量ベクトルFINPUT(x,y,k)に対応するグループ識別情報を検索するものである。
さらに、信号処理種別情報出力部24は、音響信号の処理種別を表す例えば3種類の信号処理種別情報のうちのSOM座標検索部22にて検索されたグループ識別情報に対応する信号処理種別情報を出力するものである。ここで、信号処理種別情報とは、例えば表1に示すように、圧縮増幅処理,フォルマント強調処理又はノイズ抑圧処理等の3種類の信号処理の識別情報と、入力された音響信号の増幅度等の信号処理に必要なパラメータ情報とを意味する。この信号処理種別情報出力部の機能は、具体的には、分類決定部24(後述する図3参照)又はパラメータ調整部(後述する図9参照)によって発揮される。なお、フォルマント強調とは、音声スペクトル波形の極大になる部分の振幅を増幅することを意味する。
そして、音響信号処理部25は、信号処理種別情報出力部(分類決定部又はパラメータ調整部)24から出力された信号処理種別情報に基づいて入力音響信号を処理するものである。
(2−9)アンプ51
また、アンプ51は、音響信号処理部25にて処理された音響信号を増幅して増幅信号を出力するものである。このアンプ51の増幅度の大きさは、例えば増幅度A,B,Cの3種類の増幅度において信号を増幅可能になっている。外部からイヤホン52はアンプ51からの増幅信号を聞くためのものである。これにより、入力された音響信号は、音響信号処理部25において明瞭な音になるように音声信号処理され、ユーザは、イヤホン52を通じて処理された音声等を得ることができる。
また、SOM学習部26は、特徴解析部21からの特徴量ベクトルFINPUT(x,y,k)に基づいて学習音響信号を2次元平面においてグループ化(2次元平面にマッピングしてグループ化)するものである。このSOM学習部26は、音響信号が特徴解析部21に入力される前に、予め、多数の環境音信号を学習用信号として入力され、各学習用信号を特徴解析してSOM情報格納メモリ23にマッピングするために用いられる。ここで、環境音とは、様々な場所および種々の時刻等の各種の環境下における音を意味する。
次に、図2を参照して、学習フェーズ処理部27について説明する。
図2は本発明の第1実施形態に係る学習フェーズ処理部27のブロック図である。この図2に示すもので図1に示す符号と同一の符号を有するものは、図1に示す符号と同一のものである。
さらに詳述すると、1個の短時間フレームにおいて、分割数nを例えば16とすると、特徴量ベクトルFINPUT(x,y,k)は、その16分割した時刻t0〜t15毎に得られる各要素FINPUT(x,y,0),FINPUT(x,y,2),…,FINPUT(x,y,15)を取得することにより生成される。また、この時間幅TWの値は事例によって種々変更して実施でき、時間幅TWは数msec〜数secにもできる。
続いて、図4(a)および図4(b)を参照して、座標およびグループ化について説明し、図5(a),図5(b)を参照してSOM情報格納メモリ23の実現例について説明する。
図4(a)は本発明の第1実施形態に係るSOMネットワークの一例を示す図である。SOM学習部26は、この図4(a)に示すSOMネットワークをSOM情報格納メモリ23のアドレスに設けている。また、SOMネットワークには、縦横がそれぞれ10個の10×10=100個の座標(丸,円で表されたもの)が設けられている。SOM情報格納メモリ23は、各グループのうちの各座標が属するグループと、各座標間にて相異なる固有の特徴量ベクトルFSOM(x,y,k)とを対応付けて保持する。
(5)特徴量ベクトルの保持領域
図6は本発明の第1実施形態に係る特徴量ベクトルFINPUT(x,y,k)の保持領域を説明するための示す図である。この図6に示すSOM情報格納メモリ23の座標(1,1)に格納されたポインタが示すメモリ領域に、16個のデータ(例えばスペクトル値)と座標(1,1)が属するグループ識別情報とが格納されている。具体的には、16個の要素FINPUT(x,y+1,0),FINPUT(x,y+1,1),…,FINPUT(x,y+1,15)がスペクトル値として保持されるのである。同様に、座標(1,2)〜座標(10,10)に格納されたポインタが示すメモリ領域に、それぞれ、16個のデータとグループ識別情報とが格納され、例えば座標(10,10)には、16個の要素FINPUT(x+10,y+10,0),FINPUT(x+10,y+10,1),…,FINPUT(x,y+1,15)がスペクトル値として保持される。
次に、SOMネットワークにおける座標検索について図7を参照して説明する。
SOM学習部26は、特徴解析部21から入力された特徴量ベクトルFINPUT(x,y,k)と、各座標に関連付けて保持された特徴量ベクトルFSOM(x,y,k)との各要素間のユークリッド距離を計算し、入力された特徴量ベクトルFINPUT(x,y,k)に最も近い(ユークリッド距離が小さい)近傍座標を検索するようになっている。
mi(t+1) = mi(t) + hci(t)[w(t)−mi(t)] …(1)
hci = α(t) (iがicの近傍のとき) …(2)
hci = 0 (iがicの近傍でないとき) …(3)
ここで、iがicの近傍であるか否かは、式(4)を用いて判定される。
そして、SOM学習部26は、式(4)を満足させる座標iを近傍座標としている。なお、座標iを(a,b)とし、icの座標を(ac,bc)としている。また、式(4)のiは2次元平面上の座標であり、aはx軸の値を表し、bはy軸の値を表している。
また、式(2)に示す学習率係数α(t)は、0<α(t)<1の条件を満足させるものである。さらに、学習率係数α(t)は、時間とともに減少する関数を用いて、例えば式(5)に示すように設定される。
なお、α0は適切に選択された定係数であり、例えば約0.3に設定される。tは学習開始からの時間又は時刻t0〜t15を表し、TLは学習に要する時間を表す。
これにより、SOM学習部26は、多数の音響信号を用いて、式(1)に示す学習計算を行なう。例えば合計k個の音響信号がSOM学習部26に入力された場合、SOM学習部26は、各時刻t0〜t15において、k個のうちの1個の音響信号の特徴パラメータを用いて、SOM情報格納メモリの保持値を更新する。また、学習は各時刻t0〜t15において行なわれるので、学習は時間TLを要することになる。
さらに、SOM学習部26は、各々の音響信号が2次元平面において適切にグループ化されるように、2次元平面を領域分割することが好ましい。この領域分割は、信号処理実行フェーズに移行する前に各環境音のグループ化に基づいて行なわれる。具体的には、SOM学習部26は、2次元平面をグループに基づいて領域分割し、領域分割された平面に複数の音響信号をグループすることにより分類整理し、分類整理された各グループに音響信号処理モードを割り当てる。
続いて、分類決定部(決定部)24は、音響信号の処理種別を表す複数の信号処理モードのうちの検索部にて検索されたグループ識別情報に対応する信号処理モードを決定するものであって、信号処理種別情報出力部として機能している。分類決定部24は、検索された近傍座標に対応するグループを決定する。すなわち、近傍座標がどのグループに含まれているかが判断される。また、分類決定部24は、決定したグループに基づいて、複数の信号処理モードのうちの適切な信号処理モードを選択する。そして、音響信号処理部25は、分類決定部24にて選択された信号処理モードに基づいて音響信号を処理する。
これにより、本発明の音響信号処理方法は、入力された音響信号波形の特徴が解析され、その特徴量からSOMを用いて現在の音響信号が識別(音声/非音声、残響の有無等)され、識別された情報に基づいて信号の増幅等の音響信号処理モードが切り替えられる。
従って、本発明の音響信号処理方法は、SOM学習部26が、学習音響信号の特徴量を表す特徴量ベクトルに基づいて学習音響信号について、2次元平面の座標と、座標に割り当てられた特徴量ベクトルと、SOM学習部26にてグループ化された例えば3種類のグループA〜Cを識別するグループ識別情報とのそれぞれを対応付けたSOM情報データを生成する(学習ステップ)。また、この学習ステップは、複数のグループのそれぞれに対応する複数のパラメータを取得する。
そして、音響信号処理部25は、信号処理種別情報出力ステップにて出力された信号処理種別情報に基づいて音響信号処理を行なう(音響信号処理ステップ)。また、音響信号処理ステップは、検索ステップにて検索された近傍座標に割り当てられたグループ識別情報に基づいて学習ステップにて取得された1又は複数のパラメータを変更する(変更ステップ)。さらに、変更ステップにて変更された上記の1又は複数のパラメータを用いて音響信号処理を行なう。
このような構成により、学習フェーズの処理フローについて図8を参照して説明する。
図8は本発明の第1実施形態に係る学習フェーズの処理を説明するためのフローチャートである。音声入力部50は、環境音の音響信号を特徴解析部21に対して入力すると(ステップA1)、この特徴解析部21において、上記の種々の方法の特徴解析処理が行なわれる(ステップA2)。そして、SOM座標検索部22は、特徴量パラメータと最も近いSOM上の座標を検索する(ステップA3)。この後、各座標の特徴量パラメータによる更新が例えば、式(1)に示す方法で行なわれたかどうかが判定される(ステップA4)。
このようにして、学習フェーズが終了すると、SOM情報格納メモリ23に、信号処理実行フェーズの比較に用いられる特徴量ベクトルが格納される。
次に、図3を参照して、信号処理実行フェーズ処理部28について説明する。
図3は本発明の第1実施形態に係る信号処理実行フェーズ処理部28を説明するための図である。この図3に示す分類決定部24は、音響信号の処理種別を表す複数の信号処理モードのうちのSOM座標検索部22にて検索されたグループ識別情報に対応する信号処理モードを決定するものである。また、この音響信号処理モードの一例は、後述する表1に示すように、圧縮増幅処理,フォルマント強調処理又はノイズ抑圧処理等である。さらに、信号処理モードの決定は、分類決定部24に設けられた信号処理モード保持メモリに保持されたグループ識別情報と信号処理モードとに基づいて行なわれる。
これにより、特徴解析部21において、マイクから入力された音響信号波形の特徴解析が行なわれる。この特徴解析部21における信号処理の種別は、学習フェーズにおける信号処理の種別と同一にされている。その主な理由は、例えば音響信号のサブバンド幅,音響信号のパワースペクトルの分割幅等を共通に設定するためである。従って、信号処理実行フェーズにおける特徴解析処理は、学習フェーズにおいて用いられたFFT処理,フィルタバンク処理,線形予測分析処理およびメルケプストラム処理等を用いて行なわれる。
次に、分類決定部24において、ユークリッド距離|w(t) − mi(t)|が最小となる座標icのグループ(グループ属性)に基づいて、音響信号処理に用いる音響信号の種別が決定され、音響信号処理部25に対して音響信号処理モードが出力される。音響信号処理モードは、例えば表1に示すモードを用いることができる。
これにより、信号処理実行フェーズは、類似した特徴量を有する音響信号がグループ化された属性マップに基づいて信号処理が実行される。
(10)信号処理実行フェーズ処理部28の処理動作
このような構成により、本発明の第1実施形態に係る信号処理実行フェーズについて図9を参照して説明する。
このステップB5の後、分類決定部24は、ステップB7において、処理が終了したか否かを判定し、処理終了時はYESルートを通り処理が終了し、また、処理が終了していない場合はNOルートを通り、再度、ステップB1以降の処理が繰り返される。
また、このように、スペクトル特性に応じて、雑音レベルが低いスペクトル領域のレベルを強調でき、雑音レベルが高いスペクトル領域のレベルを強調するので聴感が向上する。例えば、ユーザが家の外に出たときに、雑音成分を抑圧して音声レベルが上昇するようになり、雑音がある環境において、ユーザは明瞭度の高い音を聞くことができる。
次に、領域分割方法について詳述する。学習フェーズにおいて、学習計算後、最後の段階において、グループ数と音とを選択して領域分割する。その選択は、システムの設計者(又はSOM学習部26)が、予め、各グループについて代表的な複数の音を決定する。この音は、学習計算に用いた音又は学習計算とは別個に用意した音から選択される。
このように、各座標についてのグループ識別情報が検索されて処理されるので、明瞭な音響信号が得られる。
第1実施形態における音響信号処理部25は、分類決定部24から入力される音響信号処理モードに基づいて処理種別を変更していた。本変形例の音響信号処理方法は、その音響信号処理モードを切り替える代わりに、増幅度又は増幅特性等の信号処理に関するパラメータを用いて音響信号についての処理種別を変更調整する。
これにより、パラメータ調整部30において、グループ識別情報に基づいて音響信号処理に適用するためのパラメータが適切に変更される。
そして、このような構成によって、第1変形例における音響信号処理方法は、学習フェーズにおいて、パラメータ調整部30が、分類されたグループ毎に適切なパラメータを、学習,外部機器からの入力又は手動設定等を用いて事前にメモリ等に保持しておく。そして、この状態において、第1変形例の学習フェーズは、第1実施形態における音響信号処理と基本的に同一処理を行なう。
次に、第1実施形態における処理と異なり、パラメータ調整部30は、得られたグループ情報を基に音響信号処理のパラメータを変更する。そして、音響信号処理は、変更されたパラメータを用いて実行される。
(a2)第2変形例の説明
第2変形例の音響信号処理装置20は、音響信号処理装置20自身の自動処理に加えて、ユーザの手動操作による手動処理を利用できるようにしている。
第2変形例における信号処理実行フェーズは、以下に述べる処理ステップが追加されている。
そして、分類決定/パラメータ調整部30aとSOM座標検索部22とが協働することにより、一時保持されていた特徴量が2次元平面においてどの座標に最も近いかを検索する。そして、分類決定/パラメータ調整部30aは、検索された座標およびその周辺のグループ情報を、ユーザが選択したモード/パラメータに対応するグループに修正する。
また、信号処理を停止している間に、音響信号処理装置20は、修正フェーズに移行する。修正フェーズにおいては、ユーザの応答に従ってSOM情報を修正する。
このように、第2変形例においては、ユーザからのフィードバックによって、SOM情報格納メモリ23における音響信号のグループ識別情報が修正され、そして、音響信号処理のモード/パラメータ切り替え情報から自己組織化マップ上におけるグループ識別情報が修正される。
第3変形例においては、第1実施形態の特徴解析部21の代わりに、既存の音声符号化処理部が設けられている。
図12は本発明の第1実施形態の第3変形例に係る学習フェーズ処理部のブロック図である。この図12に示す学習フェーズ処理部27aにおいて、特徴量出力部21aが、音声符号化処理により得られた音声符号化パラメータを入力され音声符号化パラメータを特徴量ベクトルとしてSOM情報格納メモリ23に入力する音声符号化処理部(既存の音声符号化処理部)21aとして構成されている。SOM学習部26が、音響信号の符号化に関する符号化パラメータであって音響信号処理装置20自身又は送信側装置において生成された符号化パラメータを入力されるようになっている。
次に、図13は本発明の第1実施形態の第3変形例に係る信号処理実行フェーズ処理部のブロック図である。この図13に示す信号処理実行フェーズ処理部28cは、既存の音声符号化処理により得られた音声符号化パラメータを用いて信号処理をするものであって、音声符号化処理部21aと、復号化処理部35と、音響信号処理部25aと、スピーカ52aとをそなえて構成されている。ここで、音声符号化処理部21aは、復調された情報データを出力するとともに、既存の音声符号化処理で得られた符号化パラメータを出力するものである。この符号化パラメータは、特徴量としてSOM座標検索部22に入力される。また、復号化処理部35は、音声符号化処理部21aから出力された情報データについて復号処理をし、受話音声を出力するものであって、この受話音声は音響信号処理部25aに入力される。さらに、音響信号処理部25aは、信号処理種別情報出力部(音声符号化処理部)21aから出力された信号処理種別情報に基づいて入力音響信号を処理するものであり、音声強調処理および雑音抑圧処理等を行なうものである。スピーカ52aは、アンプ51からの増幅信号を鳴動させるものである。
そして、信号処理実行フェーズにおいて、図13に示す音声符号化処理部21aからの符号化パラメータは、SOM座標検索部22においてSOM情報格納メモリ23を用いて入力された音響信号がどのグループに属するかが識別される。さらに、分類決定部24において得られた識別情報は、音響信号処理部25aにおいて信号処理モード又はパラメータが切り替えられる。そして、指定された信号処理モード又は設定されたパラメータにより異なる音響信号処理が行なわれる。
このようにして、入力された音響信号に応じて適切な信号処理を行なうことができ、安定して明瞭性の高い音声を聴取することができる。
(b)本発明の第2実施形態の説明
第2実施形態においては、音響信号処理装置20が、携帯電話等に設けられた既存の音声符号化装置と連携させるようにしている。
図15は本発明の第2実施形態に係る信号処理実行フェーズ処理部のブロック図である。この図15に示す信号処理実行フェーズ処理部43は、携帯電話等の受信部に設けられたものである。
(c)その他
本発明は上述した実施態様およびその変形例に限定されるものではなく、本発明の趣旨を逸脱しない範囲で、種々変形して実施することができる。
第2実施形態における符号化入力部の機能は、携帯電話等のほかに、光ファイバ通信における受光処理装置等に設けることができる。
(d)付記
(付記1) 入力音響信号の特徴量を表す第1の特徴量データを出力する特徴量出力部と、
2次元平面の座標と、該座標に割り当てられた第2の特徴量データと、複数の学習音響信号が該2次元平面においてグループ化された複数のグループを識別するグループ識別情報とのそれぞれを対応付けたSOM情報データを保持する自己組織化マップ保持部と、
該特徴量出力部からの該第1の特徴量データと、該自己組織化マップ保持部に保持された該SOM情報データとに基づいて、該第1の特徴量データに対応する該グループ識別情報を検索する検索部と、
音響信号の処理種別を表す複数の信号処理種別情報のうちの該検索部にて検索された該グループ識別情報に対応する信号処理種別情報を出力する信号処理種別情報出力部と、
該信号処理種別情報出力部から出力された該信号処理種別情報に基づいて該入力音響信号を処理する信号処理部とをそなえて構成されたことを特徴とする、音響信号処理装置。
該自己組織化マップ保持部の該SOM情報データに保持された該2次元平面における複数の座標のうちの該特徴量出力部からの該第1の特徴量データの近傍に位置する近傍座標に対応する該グループ識別情報を出力するように構成されたことを特徴とする、付記1記載の音響信号処理装置。
該第1の特徴量データと該第2の特徴量データとに基づいて、該入力音響信号について、音声又は非音声と残響の有無とを識別するように構成されたことを特徴とする、付記1又は付記2記載の音響信号処理装置。
(付記4) 該自己組織化マップ保持部が、
該複数のグループのうちの各座標が属するグループと、各座標間にて相異なる固有の第2の特徴量データとを対応付けて保持するように構成されたことを特徴とする、付記1〜付記3のいずれか一に記載の音響信号処理装置。
メモリ空間のアドレスと、該アドレスに割り当てられた第2の特徴量データと、複数の学習音響信号が該メモリ空間においてグループ化された複数のグループを識別するグループ識別情報とのそれぞれを対応付けたSOM情報データを保持するように構成されたことを特徴とする、付記1〜付記4のいずれか一に記載音響信号処理装置。
多次元空間における座標と、該座標に割り当てられた第2の特徴量データと、複数の学習音響信号が該多次元空間においてグループ化された複数のグループを識別するグループ識別情報とを対応付けたSOM情報データを保持する自己組織化マップ保持部と、
該特徴量出力部から出力された該第1の特徴量データと、該自己組織化マップ保持部に保持された該SOM情報データとに基づいて、該第1の特徴量データに対応する該グループ識別情報を検索する検索部と、
音響信号の処理種別を表す複数の信号処理種別情報のうちの該検索部にて検索された該グループ識別情報に対応する信号処理種別情報を出力する信号処理種別情報出力部と、
該信号処理種別情報出力部から出力された該信号処理種別情報に基づいて該入力音響信号を処理する信号処理部とをそなえて構成されたことを特徴とする、音響信号処理装置。
音響信号の処理種別を表す複数の信号処理モードのうちの該検索部にて検索された該グループ識別情報に対応する信号処理モードを決定する決定部として構成されたことを特徴とする、付記1〜付記6のいずれか一に記載の音響信号処理装置。
(付記8) 該信号処理種別情報出力部が、
音響信号の処理に必要な設定値に関するパラメータを、該検索部にて検索された該グループ識別情報に基づいて調整して出力するパラメータ調整部として構成されたことを特徴とする、付記1〜付記7のいずれか一に記載の音響信号処理装置。
グループ識別情報と信号処理種別情報とを対応付けたテーブルを用いて取得した該信号処理種別情報を出力するように構成されたことを特徴とする、付記1〜付記8のいずれか一に記載の音響信号処理装置。
(付記10) 学習音響信号の特徴量を表す第1の特徴量データを出力する特徴量出力部と、
該特徴量出力部からの該第1の特徴量データに基づいて該学習音響信号を2次元平面においてグループ化する学習部と、
該2次元平面の座標と、該座標に割り当てられた第2の特徴量データと、該学習部にてグループ化された複数のグループを識別するグループ識別情報とのそれぞれを対応付けたSOM情報データを保持する自己組織化マップ保持部とをそなえて構成されたことを特徴とする、音響信号処理装置。
該特徴量出力部からの該特徴量データに基づいて該学習音響信号を2次元平面にマッピングしてグループ化する学習部と、
該2次元平面の座標と、各座標に固有に割り当てられた第2の特徴量データと、該学習部にてグループ化された複数のグループを識別するグループ識別情報とのそれぞれを対応付けたSOM情報データを保持する自己組織化マップ保持部とをそなえて構成されたことを特徴とする、音響信号処理装置。
音声符号化処理により得られた音声符号化パラメータを入力され該音声符号化パラメータを該第1の特徴量データとして該自己組織化マップ保持部に入力する符号化処理部として構成されたことを特徴とする、付記1〜付記11のいずれか一に記載の音響信号処理装置。
該信号処理種別情報出力部が、該グループ識別情報に基づいて、該信号処理種別情報と該符号化パラメータとのうちの少なくとも一方を出力し、
該信号処理部が、該信号処理種別情報出力部から出力された該信号処理種別情報と該符号化パラメータとの各設定値に応じて異なる信号処理を実行するように構成されたことを特徴とする、付記1〜付記11のいずれか一に記載の音響信号処理装置。
(付記15) 該分類属性情報修正部が、
該第1の特徴量データ,該入力操作時における信号処理種別情報又は各グループに対応付けたパラメータを、該自己組織化マップ保持部に保持するように構成されたことを特徴とする、付記14記載の音響信号処理装置。
入力の停止の検知により修正を開始するように構成されたことを特徴とする、付記15記載の音響信号処理装置。
(付記17) 学習音響信号の特徴量を表す第1の特徴量データに基づいて該学習音響信号について、2次元平面の座標と、該座標に割り当てられた第2の特徴量データと、該学習部にてグループ化された複数のグループを識別するグループ識別情報とのそれぞれを対応付けたSOM情報データを生成する学習ステップと、
該学習ステップにおける該第1の特徴量データについて、該学習ステップにて生成された該SOM情報データに保持された該2次元平面における複数の座標のうちの該特徴量出力部からの該第1の特徴量データの近傍に位置する近傍座標を検索する検索ステップと、
音響信号の処理種別を表す複数の信号処理種別情報のうちの該検索ステップにて検索された該近傍座標の該グループ識別情報に対応する信号処理種別情報を出力する信号処理種別情報出力ステップと、
該信号処理種別情報出力ステップにて出力された該信号処理種別情報に基づいて該音響信号処理を行なう音響信号処理ステップとをそなえたことを特徴とする、音響信号処理方法。
該音響信号処理ステップが、該検索ステップにて検索された該近傍座標に割り当てられたグループ識別情報に基づいて該学習ステップにて取得された1又は複数のパラメータを変更する変更ステップと、
該変更ステップにて変更された上記の1又は複数のパラメータを用いて該音響信号処理を行なうことを特徴とする、付記17記載の音響信号処理方法。
加えて、本発明の音響信号処理装置および音響信号処理方法によれば、例えば携帯電話等に設けることもでき、各種の電話機,端末機器又は装置について汎用的に用いることができる。
21 特徴解析部(特徴量出力部)
21a 音声符号化処理部(音声符号化処理部)
22 SOM座標検索部
23 SOM情報格納メモリ(自己組織化マップ保持部)
24 信号処理種別情報出力部(決定部,分類決定部)
25,25a 音響信号処理部
26 SOM学習部(自己組織化学習部)
27,27a,40 学習フェーズ処理部
28,28a,28b,28c,43 信号処理実行フェーズ処理部
29 分類情報修正部
30 パラメータ調整部
30a 分類決定/パラメータ調整部
31 メモリ
32 モード/パラメータ強制変更部
35 復号化処理部
40a アンテナ
40b RF受信部
40c ベースバンド信号処理部
50 音声入力部
51 アンプ
52 イヤホン
52a スピーカ
Claims (5)
- 入力音響信号の特徴量を表す第1の特徴量データを出力する特徴量出力部と、
2次元平面の座標と、該座標に割り当てられた第2の特徴量データと、複数の学習音響信号が該2次元平面においてグループ化された複数のグループを識別するグループ識別情報とのそれぞれを対応付けた自己組織化マップ(Self-Organizing Map:SOM)情報データ(以下、SOM情報データと称する。)を保持する自己組織化マップ保持部と、
該特徴量出力部からの該第1の特徴量データと、該自己組織化マップ保持部に保持された該SOM情報データとに基づいて、該第1の特徴量データに対応する該グループ識別情報を検索する検索部と、
音響信号の処理種別を表す複数の信号処理種別情報のうちの該検索部にて検索された該グループ識別情報に対応する信号処理種別情報を出力する信号処理種別情報出力部と、
該信号処理種別情報出力部から出力された該信号処理種別情報に基づいて該入力音響信号を処理する信号処理部とをそなえて構成されたことを特徴とする、音響信号処理装置。 - 入力音響信号の特徴量を表す第1の特徴量データを出力する特徴量出力部と、
多次元空間における座標と、該座標に割り当てられた第2の特徴量データと、複数の学習音響信号が該多次元空間においてグループ化された複数のグループを識別するグループ識別情報とを対応付けたSOM情報データを保持する自己組織化マップ保持部と、
該特徴量出力部から出力された該第1の特徴量データと、該自己組織化マップ保持部に保持された該SOM情報データとに基づいて、該第1の特徴量データに対応する該グループ識別情報を検索する検索部と、
音響信号の処理種別を表す複数の信号処理種別情報のうちの該検索部にて検索された該グループ識別情報に対応する信号処理種別情報を出力する信号処理種別情報出力部と、
該信号処理種別情報出力部から出力された該信号処理種別情報に基づいて該入力音響信号を処理する信号処理部とをそなえて構成されたことを特徴とする、音響信号処理装置。 - 該信号処理種別情報出力部が、
音響信号の処理に必要な設定値に関するパラメータを、該検索部にて検索された該グループ識別情報に基づいて調整して出力するパラメータ調整部として構成されたことを特徴とする、請求項1又は請求項2記載の音響信号処理装置。 - 学習音響信号の特徴量を表す第1の特徴量データを出力する特徴量出力部と、
該特徴量出力部からの該第1の特徴量データに基づいて該学習音響信号を2次元平面においてグループ化する学習部と、
該2次元平面の座標と、該座標に割り当てられた第2の特徴量データと、該学習部にてグループ化された複数のグループを識別するグループ識別情報とのそれぞれを対応付けたSOM情報データを保持する自己組織化マップ保持部とをそなえて構成されたことを特徴とする、音響信号処理装置。 - 学習音響信号の特徴量を表す第1の特徴量データに基づいて該学習音響信号について、2次元平面の座標と、該座標に割り当てられた第2の特徴量データと、該学習部にてグループ化された複数のグループを識別するグループ識別情報とのそれぞれを対応付けたSOM情報データを生成する学習ステップと、
該学習ステップにおける該第1の特徴量データについて、該学習ステップにて生成された該SOM情報データに保持された該2次元平面における複数の座標のうちの該特徴量出力部からの該第1の特徴量データの近傍に位置する近傍座標を検索する検索ステップと、
音響信号の処理種別を表す複数の信号処理種別情報のうちの該検索ステップにて検索された該近傍座標の該グループ識別情報に対応する信号処理種別情報を出力する信号処理種別情報出力ステップと、
該信号処理種別情報出力ステップにて出力された該信号処理種別情報に基づいて該音響信号処理を行なう音響信号処理ステップとをそなえたことを特徴とする、音響信号処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004007206A JP4185866B2 (ja) | 2004-01-14 | 2004-01-14 | 音響信号処理装置および音響信号処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004007206A JP4185866B2 (ja) | 2004-01-14 | 2004-01-14 | 音響信号処理装置および音響信号処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005203981A true JP2005203981A (ja) | 2005-07-28 |
JP4185866B2 JP4185866B2 (ja) | 2008-11-26 |
Family
ID=34820932
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004007206A Expired - Fee Related JP4185866B2 (ja) | 2004-01-14 | 2004-01-14 | 音響信号処理装置および音響信号処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4185866B2 (ja) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010514286A (ja) * | 2006-12-21 | 2010-04-30 | ジーエヌ リザウンド エー/エス | ユーザーインターフェースを有する補聴装置 |
JP2010212887A (ja) * | 2009-03-09 | 2010-09-24 | Toshiba Corp | 信号特性変化装置 |
US7864967B2 (en) | 2008-12-24 | 2011-01-04 | Kabushiki Kaisha Toshiba | Sound quality correction apparatus, sound quality correction method and program for sound quality correction |
JP2011512768A (ja) * | 2008-02-20 | 2011-04-21 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ装置及びその動作方法 |
US8041063B2 (en) | 2008-08-20 | 2011-10-18 | Panasonic Corporation | Hearing aid and hearing aid system |
US8045620B2 (en) | 2008-12-22 | 2011-10-25 | Kabushiki Kaisha Toshiba | Image processing apparatus, image processing method and computer readable medium |
JP2012208406A (ja) * | 2011-03-30 | 2012-10-25 | Nikon Corp | 信号処理装置、撮像装置、および、信号処理プログラム |
US8457335B2 (en) | 2007-06-28 | 2013-06-04 | Panasonic Corporation | Environment adaptive type hearing aid |
US9099093B2 (en) | 2007-01-05 | 2015-08-04 | Samsung Electronics Co., Ltd. | Apparatus and method of improving intelligibility of voice signal |
JP2015228002A (ja) * | 2014-06-03 | 2015-12-17 | 株式会社システック | 複数者間干渉音声雑音を回避した音声入力処理装置 |
JP2016510198A (ja) * | 2013-03-13 | 2016-04-04 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | ユーザに対する特定の音の可聴性を向上させる装置及び方法 |
JP2016519784A (ja) * | 2013-03-26 | 2016-07-07 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ分類および処理のための装置および方法 |
JP2016533101A (ja) * | 2013-08-20 | 2016-10-20 | ヴェーデクス・アクティーセルスカプ | 分類器を有する補聴器 |
WO2017164996A1 (en) * | 2016-03-25 | 2017-09-28 | Qualcomm Incorporated | Audio processing for an acoustical environment |
JP2019507992A (ja) * | 2016-03-10 | 2019-03-22 | シバントス ピーティーイー リミテッド | 聴取装置の動作方法、および聴取装置 |
CN112929775A (zh) * | 2019-12-06 | 2021-06-08 | 西万拓私人有限公司 | 用于听力***的与环境有关的运行的方法 |
EP3833053A1 (de) * | 2019-12-06 | 2021-06-09 | Sivantos Pte. Ltd. | Verfahren zum umgebungsabhängigen betrieb eines hörsystems |
-
2004
- 2004-01-14 JP JP2004007206A patent/JP4185866B2/ja not_active Expired - Fee Related
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010514286A (ja) * | 2006-12-21 | 2010-04-30 | ジーエヌ リザウンド エー/エス | ユーザーインターフェースを有する補聴装置 |
US9099093B2 (en) | 2007-01-05 | 2015-08-04 | Samsung Electronics Co., Ltd. | Apparatus and method of improving intelligibility of voice signal |
US8457335B2 (en) | 2007-06-28 | 2013-06-04 | Panasonic Corporation | Environment adaptive type hearing aid |
JP5252738B2 (ja) * | 2007-06-28 | 2013-07-31 | パナソニック株式会社 | 環境適応型補聴器 |
JP2011512768A (ja) * | 2008-02-20 | 2011-04-21 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ装置及びその動作方法 |
US8041063B2 (en) | 2008-08-20 | 2011-10-18 | Panasonic Corporation | Hearing aid and hearing aid system |
US8488825B2 (en) | 2008-08-20 | 2013-07-16 | Panasonic Corporation | Hearing aid and hearing aid system |
US8045620B2 (en) | 2008-12-22 | 2011-10-25 | Kabushiki Kaisha Toshiba | Image processing apparatus, image processing method and computer readable medium |
US7864967B2 (en) | 2008-12-24 | 2011-01-04 | Kabushiki Kaisha Toshiba | Sound quality correction apparatus, sound quality correction method and program for sound quality correction |
US8571233B2 (en) | 2009-03-09 | 2013-10-29 | Kabushiki Kaisha Toshiba | Signal characteristic adjustment apparatus and signal characteristic adjustment method |
JP2010212887A (ja) * | 2009-03-09 | 2010-09-24 | Toshiba Corp | 信号特性変化装置 |
JP2012208406A (ja) * | 2011-03-30 | 2012-10-25 | Nikon Corp | 信号処理装置、撮像装置、および、信号処理プログラム |
US9734840B2 (en) | 2011-03-30 | 2017-08-15 | Nikon Corporation | Signal processing device, imaging apparatus, and signal-processing program |
JP2016510198A (ja) * | 2013-03-13 | 2016-04-04 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | ユーザに対する特定の音の可聴性を向上させる装置及び方法 |
US10803879B2 (en) | 2013-03-26 | 2020-10-13 | Dolby Laboratories Licensing Corporation | Apparatuses and methods for audio classifying and processing |
JP2016519784A (ja) * | 2013-03-26 | 2016-07-07 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ分類および処理のための装置および方法 |
JP2016533101A (ja) * | 2013-08-20 | 2016-10-20 | ヴェーデクス・アクティーセルスカプ | 分類器を有する補聴器 |
JP2015228002A (ja) * | 2014-06-03 | 2015-12-17 | 株式会社システック | 複数者間干渉音声雑音を回避した音声入力処理装置 |
JP2019507992A (ja) * | 2016-03-10 | 2019-03-22 | シバントス ピーティーイー リミテッド | 聴取装置の動作方法、および聴取装置 |
US9881619B2 (en) | 2016-03-25 | 2018-01-30 | Qualcomm Incorporated | Audio processing for an acoustical environment |
WO2017164996A1 (en) * | 2016-03-25 | 2017-09-28 | Qualcomm Incorporated | Audio processing for an acoustical environment |
CN112929775A (zh) * | 2019-12-06 | 2021-06-08 | 西万拓私人有限公司 | 用于听力***的与环境有关的运行的方法 |
EP3833053A1 (de) * | 2019-12-06 | 2021-06-09 | Sivantos Pte. Ltd. | Verfahren zum umgebungsabhängigen betrieb eines hörsystems |
US11368798B2 (en) | 2019-12-06 | 2022-06-21 | Sivantos Pte. Ltd. | Method for the environment-dependent operation of a hearing system and hearing system |
DE102020208720B4 (de) | 2019-12-06 | 2023-10-05 | Sivantos Pte. Ltd. | Verfahren zum umgebungsabhängigen Betrieb eines Hörsystems |
Also Published As
Publication number | Publication date |
---|---|
JP4185866B2 (ja) | 2008-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4185866B2 (ja) | 音響信号処理装置および音響信号処理方法 | |
US10733970B2 (en) | Noise control method and device | |
US9905215B2 (en) | Noise control method and device | |
US10121492B2 (en) | Voice converting apparatus and method for converting user voice thereof | |
US9923535B2 (en) | Noise control method and device | |
WO2012053629A1 (ja) | 音声処理装置及び音声処理方法 | |
US11558699B2 (en) | Hearing device component, hearing device, computer-readable medium and method for processing an audio-signal for a hearing device | |
CN107948869B (zh) | 音频处理方法、装置、音响***及存储介质 | |
JP2010020133A (ja) | 再生装置、表示方法および表示プログラム | |
JP2016535305A (ja) | 自閉症における言語処理向上のための装置 | |
CN113924620A (zh) | 基于频率组成的声音修改 | |
US11501758B2 (en) | Environment aware voice-assistant devices, and related systems and methods | |
JP2009178783A (ja) | コミュニケーションロボット及びその制御方法 | |
JP2007034238A (ja) | 現場作業支援システム | |
JPWO2011122522A1 (ja) | 感性表現語選択システム、感性表現語選択方法及びプログラム | |
KR102239673B1 (ko) | 인공지능 기반 능동형 스마트 보청기 피팅 방법 및 시스템 | |
CN113709291A (zh) | 音频处理方法、装置、电子设备及可读存储介质 | |
CN116132875B (zh) | 一种辅听耳机的多模式智能控制方法、***及存储介质 | |
JP2006292918A (ja) | ナビゲーション装置およびナビゲーション装置用プログラム | |
CN110782887A (zh) | 语音信号处理方法、***、装置、设备和计算机存储介质 | |
US20140324418A1 (en) | Voice input/output device, method and programme for preventing howling | |
KR102239675B1 (ko) | 인공지능 기반 능동형 스마트 보청기 잡음 제거 방법 및 시스템 | |
CN112581935A (zh) | 环境感知语音辅助设备以及相关***和方法 | |
KR102239676B1 (ko) | 인공지능 기반 능동형 스마트 보청기 피드백 제거 방법 및 시스템 | |
JP2007147736A (ja) | 音声通信装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080310 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080826 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080908 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110912 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |