JP2006333396A - 音声信号拡声装置 - Google Patents
音声信号拡声装置 Download PDFInfo
- Publication number
- JP2006333396A JP2006333396A JP2005158052A JP2005158052A JP2006333396A JP 2006333396 A JP2006333396 A JP 2006333396A JP 2005158052 A JP2005158052 A JP 2005158052A JP 2005158052 A JP2005158052 A JP 2005158052A JP 2006333396 A JP2006333396 A JP 2006333396A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- signal
- correction
- audio
- frequency component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
【課題】もとの音楽が持つ芸術性を損なうことなく、情報伝達のための音声のみをうるさ過ぎずに聴取者の聞き取りやすい音量で拡声する。
【解決手段】音声信号拡声装置は、音声信号を入力する入力手段(31)と、入力された音声信号から、聴取者の聴覚特性に応じて聞き取りにくいとされる所定の音声周波数領域に対応する周波数成分を抽出する抽出手段(32)と、抽出された周波数成分のレベルが予め設定された基準値以下のときに所定レベルとなるように周波数成分を補正する補正手段(36〜38)と、入力された音声信号が聴取者に向けた意味伝達用の音声信号であるかそれ以外の音声信号であるかを判別する判別手段(33、39)と、音声信号が意味伝達用の音声信号であると判別された場合、補正手段により補正された周波数成分を音声信号に加算して出力する出力手段(42、43)とを有する。
【選択図】 図1
【解決手段】音声信号拡声装置は、音声信号を入力する入力手段(31)と、入力された音声信号から、聴取者の聴覚特性に応じて聞き取りにくいとされる所定の音声周波数領域に対応する周波数成分を抽出する抽出手段(32)と、抽出された周波数成分のレベルが予め設定された基準値以下のときに所定レベルとなるように周波数成分を補正する補正手段(36〜38)と、入力された音声信号が聴取者に向けた意味伝達用の音声信号であるかそれ以外の音声信号であるかを判別する判別手段(33、39)と、音声信号が意味伝達用の音声信号であると判別された場合、補正手段により補正された周波数成分を音声信号に加算して出力する出力手段(42、43)とを有する。
【選択図】 図1
Description
本発明は、音声信号拡声装置に係り、とくに高齢者が中心となって受聴する音声拡声システムの音質補正に関する。
昨今の少子化の進行に伴い、高齢者の人口の占める割合がますます高くなり、高齢者社会となってきている。このことを反映して、高齢者向けを掲げたホームやケアセンターなどの高齢者を対象とする新たな施設の建設も益々増加しつつある。このようなケアセンターなどの施設では、通常、各種情報伝達のためのアナウンスやBGMなどの音楽を施設内で流すために拡声システムが使用されている。こういった高齢者向けの施設で使用される拡声システムでは、当然高齢者向けに特化していることが望まれている。
例えば、高齢者向けの場合、アナウンスなどの音声を高齢者が確実に聞き取れるように「ゆっくり話す」ことが必要となる。これは、時間的な補正を施すことで実現可能であり、すでに実用化されている。一方、高齢者の聴覚特性は、高齢になる程、特定周波数において、一定の音量以下が聞き取りにくくなるものの、一定の音量以上であれば、若年者と同等に受聴できるという特性(「リクルートメント現象」と言う)が知られている。
従って、高齢者が中心に受聴する拡声システムにおいては、時間的な補正のほか、高齢者が聞き取りやすくなるよう、何らかの周波数的な補正を施すことも必要とされている。
なお、本発明に関連する先行技術として、音響信号の再生時において周囲騒音のマスキングによって生じる聴取障害を補償し、周囲騒音が変化しても聴取者の好みの音を再生するため、環境音測定手段により帯域分割フィルタを用いて環境音のマスキング帯域を分析し、音声再生時に、聴覚データベースから特定のラウドネス特定を抽出し、嗜好音調整手段によりラウドネス特性を調節する音響再生装置が提案されている(特許文献1参照)。
特開平10−341123号公報
しかしながら、高齢者向けの音質補正としては、単に一律に周波数的に聞き取りにくいとされる周波数帯域成分の音量を増大してしまうと、リクルートメント現象により、場合によっては、うるさ過ぎてかえって聞き取りにくくなることもありうる。
また、拡声すべき音声信号には、情報伝達としてのアナウンスもあれば、BGM(バックグラウンドミュージック)などの音楽の場合もある。拡声すべき音声信号がアナウンスであれば、音質補正により音質が変化してもその内容が明確に伝われば良いが、音楽の場合には、音質が変化してしまうと、もとの音楽が持つ芸術性が損なわれることになってしまう。
さらに、特許文献1は、上記のような高齢者向けの音質補正について、リクルートメント現象等、特に意識したものではない。
本発明は、上記に鑑みてなされたもので、その目的としては、聴取者の聞き取りにくいとされる周波数帯域成分の音質補正に際し、もとの音楽が有する芸術性を損なうことなく、情報伝達のための音声のみをうるさ過ぎずに聴取者の聞き取りやすい音量で拡声することができる音声信号拡声装置を提供することにある。
上記目的を達成するため、請求項1記載の発明に係る音声信号拡声装置は、 音声信号を拡声して聴取者に受聴させる音声信号拡声装置であって、前記音声信号を入力する入力手段と、前記入力された音声信号から、前記聴取者の聴覚特性に応じて聞き取りにくいとされる所定の音声周波数領域に対応する周波数成分を抽出する抽出手段と、抽出された周波数成分のレベルが予め設定された基準値以下のときに所定レベルとなるように前記周波数成分を補正する補正手段と、前記音声信号が前記聴取者に向けた意味伝達用の音声信号であるか否かを判別する判別手段と、前記音声信号が意味伝達用の音声信号であると判別された場合、前記補正手段により補正された周波数成分を前記音声信号に加算して出力する出力手段とを備えたことを要旨とする。
また請求項2記載の発明に係る音声信号拡声装置は、請求項1記載の発明において、前記入力された音声信号の無音部分が所定時間継続したときに、前記補正手段による補正ありの状態から補正なしの状態へ切り替える第1の切替手段と、 前記補正手段による補正ありの状態と補正なしの状態との間の切り替え時に、所定の時定数をもって切り替える第2の切替手段とをさらに有することを要旨とする。
請求項1記載の発明によれば、聴取者の聞き取りにくいとされる音声信号の特定の周波数帯域成分のレベルが一定値以下であれば、所定レベルまで大きくする補正手段を備えると共に、音声信号が意味を伝達すべきものである場合に補正手段による補正を有効にするように構成したため、アナウンスなど意味を的確に伝える必要がある場合はより意味を聞き取りやすくなり、また音楽などのようにむやみに音質を変えるべきではない場合はそのまま受聴させることが可能になる。これにより、もとの音楽が持つ芸術性を損なうことなく、情報伝達のための音声のみをうるさ過ぎずに聴取者の聞き取りやすい音量で拡声することができる音声信号拡声装置を提供することができる。
請求項2記載の発明によれば、上記効果に加え、音声信号の補正状態と通常状態との切り替えの際に、音声信号レベルが小さい無音部分を選んで切り替えると共に、所定の時定数をもって切り替えるようにしたため、聴取者に違和感を生じさせるという事態を回避することができる。
次に、本発明に係る音声信号拡声装置を実施するための最良の形態について、図面を参照して詳細に説明する。
(第1実施形態)
図1は、本発明の第1実施形態による音声信号拡声装置の全体構成を示す。
図1は、本発明の第1実施形態による音声信号拡声装置の全体構成を示す。
図1に示す音声信号拡声装置は、例えばケアセンターなどの高齢者向け施設内で高齢者が中心となって受聴する音声拡声システムに適用したもので、機能上、聴取者に聞かせるアナウンスや音楽などの音声を入力する音声入力部10と、音声入力部10から入力された音声を補正処理する補正処理部30と、この補正処理部30にて補正処理された音声を出力する音声出力部20とを備えている。この内、補正処理部30が本発明の主要部を構成している。
音声入力部10は、各種情報伝達のためのアナウンスなどの音声を電気信号に変換して入力するマイクロフォン11と、このマイクロフォン11から入力された音声に対応する電気信号を所定の利得で増幅して出力するアンプ12と、BGMなどの音響信号を再生するオーディオ再生装置13と、オーディオ再生装置13の音声出力及びアンプ12の音声出力を加算して補正処理部30に出力する加算器14とを有する。
音声出力部20は、補正処理部30にて後述のように補正処理された音声信号を所定の利得で増幅するアンプ21と、このアンプ21により増幅された音声信号を外部に音声出力するスピーカ22とを有する。
補正処理部30は、加算器14の出力側に接続されるA/D(Analog to Digital)変換器31と、このA/D変換器31の出力側に接続されるバンドパスフィルタ32、音声信号推定度判別部33、実効値算出部34、及び遅延器35とを有する。
また、この補正処理部30は、バンドパスフィルタ32の出力側に接続される実効値算出部36と、この実効値算出部36の出力側に接続される係数算出部37と、バンドパスフィルタ32の出力側及び係数算出部37の出力側に接続される乗算器38と、音声信号推定度判別部33及び乗算器38の両出力側に接続される乗算器39と、実効値算出部34の出力側に接続される無音判定部40と、無音判定部40及び乗算器39の両出力側に接続される乗算器41と、遅延器35及び乗算器41の両出力側に接続される加算器42と、この加算器42の出力側に接続されるD/A(Digital to Analog)変換器43とを有する。D/A変換器43の出力側には、アンプ21が接続される。
ここで、補正処理部30の動作を中心にして、本実施形態の全体動作を説明する。
まず、A/D変換器31は、オーディオ再生装置13の音声出力及びアンプ12の音声出力を加算器14を介して入力すると、アナログ信号から所定のサンプリングレート(例えば、44.1kHz)でサンプリングしてデジタル信号に変換し、変換されたデジタル信号を音声データとしてバンドパスフィルタ32、音声信号推定度判別部33、実効値算出部34、及び遅延器35にそれぞれ個別に出力する。
次いで、バンドパスフィルタ32は、A/D変換器31にてデジタル信号に変換された音声データから、高齢者の聴覚特性により高齢者が聞き取りにくいとされる所定の音声周波数帯域、例えば本実施形態では1000Hz〜2000Hzの周波数成分を抽出し、実効値算出部34及び乗算器38に出力する。
図2は、一般に知られている高齢者の聴覚特性を示すグラフの一例、図3は、バンドパスフィルタ32の特性グラフの一例をそれぞれ示す。図2に示すように、聴取者の聴力レベルは、聴取者の加齢と共に、どの音声周波数成分でも低下する傾向にあり、特に1kHz以上の周波数成分ではその傾向が顕著となっている。そのため、本実施形態で用いるバンドパスフィルタ32は、図3に示すように、60〜65歳以上の高齢者の聴力レベルが顕著に低下している音声周波数領域として、1000Hz〜2000Hzの周波数成分を抽出するものが使用されている。
次いで、実効値算出部36は、バンドパスフィルタ32により抽出された1000Hz〜2000Hzの周波数成分の実効値(パワーレベル)を算出し、その算出値を係数算出部37に出力する。
これにより、係数算出部37は、実効値算出部36からの実効値の算出値と、前述したリクルートメント現象により高齢者が聞き取りにくいとされる特定周波数帯域の一定音量に対応して予め設定された実効値の基準値とを比較し、図1中のグラフに示すように、基準値/算出値の入力に応じて、高齢者の聞き取りにくい周波数帯域成分量が一定音量以下のときにその周波数成分に対して聴覚的な補正処理を施すための係数k1を算出し、乗算器38に出力する。
図1の例では、係数k1の値は、
(1) 算出値が基準値を超える場合(入力が1未満)はk1=0.5(下限値)
(2) 算出値が基準値以下(入力が1以上)で所定値以下の場合は基準値/算出値の入力に比例して0.5<k1<4(上限値)の範囲内で変化する値
(3) 算出値が基準値以下(入力が1以上)で所定値を超える場合はk1=4
をそれぞれ示している。
(1) 算出値が基準値を超える場合(入力が1未満)はk1=0.5(下限値)
(2) 算出値が基準値以下(入力が1以上)で所定値以下の場合は基準値/算出値の入力に比例して0.5<k1<4(上限値)の範囲内で変化する値
(3) 算出値が基準値以下(入力が1以上)で所定値を超える場合はk1=4
をそれぞれ示している。
次いで、乗算器38は、バンドパスフィルタ32からの出力と、係数算出部37の係数k1とを乗算し、その乗算結果を乗算器39に出力する。この乗算結果は、高齢者の聞き取りにくいとされる1000Hz〜2000Hz帯域の周波数成分に対する聴覚的な補正結果を反映したものとなっている。
上記の聴覚的な補正処理は、入力された音声信号から、人間の聴覚に影響を与える周波数成分をバンドパスフィルタ32にて抽出して、抽出された周波数成分のレベル検出を行い、レベルが一定値以下であれば、その帯域成分の信号を増幅し、結果として高齢者などにとって聞きやすい音声拡声方法を適用したものである。なお、図1の例では、バンドパスフィルタ32を使用する例を示しているが、他の周波数抽出方法、例えばサブバンドフィルタの使用や、あるいはフーリエ変換などのような直交変換を利用しても構わない。ただし、音声入力としてマイクロフォン11を使用し、話者がその場で話す声を拡声する場合は、大きな処理遅延が生じてしまうと、話しにくくなってしまうため、短時間で処理できる方法が望ましい。
一方、上記の聴覚的な補正処理と並行して、音声信号推定度判別部33は、図4に示す処理を行う。まず、ステップS10では、A/D変換器31から音声データを入力する。ステップS20では、入力された音声データから、図示しない内蔵のバンドパスフィルタにて、人間の声の特性に応じた音声周波数帯域(例えば、100Hz〜1000kHz)の周波数成分を抽出する。ステップS30では、抽出された周波数成分のパワーレベル(実効値)を算出する。ステップS40では、これと並行して、入力された音声データから、全帯域のパワーレベル(実効値)を算出する。次いで、ステップS50では、全帯域のパワーレベルに対する音声帯域のパワーレベルのレベル比(音声帯域のレベル/全帯域のパワーレベル)を算出する。さらに、ステップS60では、算出されたレベル比に基づいて、図1中のグラフに示すように、テーブル変換により、音声らしさの係数k2を算出し、乗算器39に出力する。
図1の例では、係数k2の値は、
(1) レベル比率が3/10以下の場合はk2=0
(2) レベル比率が3/10を超えて9/10未満の場合はレベル比率に比例して0<k2<1の範囲内で変化する値
(3) レベル比率が9/10以上の場合はk2=1
をそれぞれ示している。
(1) レベル比率が3/10以下の場合はk2=0
(2) レベル比率が3/10を超えて9/10未満の場合はレベル比率に比例して0<k2<1の範囲内で変化する値
(3) レベル比率が9/10以上の場合はk2=1
をそれぞれ示している。
上記の判別処理では、人間の音声信号は音楽よりも周波数的なエネルギー分布が低い帯域に集中することに基づいて、人間の音声とそれ以外とを判別している。入力される音声信号には、アナウンスなどのように意味を伝達することに重点が置かれる音と、音楽のように音質を含めて伝達することに意味がある音とが存在する。そこで、拡声すべき音が、どのような種別のものであるか、上記の処理にて自動的に判別する。その結果、アナウンスなどの意味を伝達すべき音のみ、前述した聴覚的な補正処理を施すことができる。
次いで、乗算器39は、音声信号推定度判別部33からの係数k2と、乗算器38の出力(バンドパスフィルタ32の出力と係数k1との乗算値)とを乗算し、その乗算結果を出力する。この乗算結果は、上記の聴覚的な補正結果に加え、人間の音声信号か否かの判別結果も反映したものとなっている。
実効値算出部34は、A/D変換器31から音声データの実効値を算出し、その算出値を無音判定部40に出力する。
無音判定部40は、実効値算出部34からの入力実効値に基づいて、図1中のグラフに示すように、テーブル変換により、係数k3を求め、乗算器41に出力する。図1の例では、係数k3の値は、
(1) 入力実効値が「0」の場合はk3=0
(2) 入力実効値が「0」〜「100」の場合は0<k3<1
(3) 入力実効値が「100」以上の場合はk3=1
をそれぞれ示している。
(1) 入力実効値が「0」の場合はk3=0
(2) 入力実効値が「0」〜「100」の場合は0<k3<1
(3) 入力実効値が「100」以上の場合はk3=1
をそれぞれ示している。
乗算器41は、無音判定部40からの係数k3と、乗算器39からの出力(乗算器38の出力と係数k2との乗算値)とを乗算し、その乗算結果を加算器42に出力する。この乗算結果は、上記の聴覚的な補正結果及び人間の音声信号か否かの判別結果に加え、無音判定部40による判定結果も反映したものとなっている。
遅延器35は、A/D変換器31からの出力(補正前の音声データ)を所定時間遅延させて加算器42に出力する。
加算器42は、遅延器35からの出力と、乗算器41からの出力(乗算器39の出力と係数k3との乗算値)とを加算し、その加算結果である補正後の音声データをD/A変換器43に出力する。出力された補正後の音声データは、D/A変換器43にてデジタル信号からアナログ信号に変換後、アンプ21にて増幅され、スピーカ22から音声出力される。
上記の拡声すべき音声信号の補正は、補正あり/なしの2パターンでなく、「補正なし」の状態から「補正最大」の状態の間で任意の補正量をとることが可能である。拡声すべき音声信号が、補正するべき信号なのかどうかの判定は、常時もしくは定期的に行う必要があるが、拡声器として運用中に補正の状態が頻繁に変わることは望ましくない。
そこで、図5(a)に示すように、通常運用時においては、ある一定時間以上の無音部分を検出した場合は、補正処理を行わない状態とする。また、図5(b)に示すように、アナウンスなどの拡声すべき音声から音楽に切り替わった場合は、急激に補正処理を停止するのではなく、ある時定数をもたせて徐々に補正が働くようにする。
以上の補正処理による効果を図6(a)及び(b)に示す。
図6(a)に示すように、入力されたアナウンスの音声信号における1000Hz〜2000Hz帯域の周波数成分のレベル(ゲイン)が予め設定された基準値よりも低い場合、図6(b)に示すように音声信号のうち1000Hz〜2000Hz帯域の周波数成分のみゲインを上げるよう前述した補正処理が施される。
従って、本実施形態によれば、高齢者が中心となって受聴する音声拡声システムにおいて、アナウンスなど意味を的確に伝達すべき音声と、それ以外の音楽のような音響信号とを判別し、アナウンスなど意味を的確に伝える必要がある場合は高齢者が聞き取りやすくなるような補正処理を行うため、アナウンスなど意味を的確に伝える必要がある場合はより意味を聞き取りやすくなり、また音楽などのようにむやみに音質を変えるべきではない場合はそのまま受聴させることが可能になる。
即ち、聴取者の聴覚特性及び音声信号の特性に応じて適応的に拡声の際の音声信号を補正すると共に、拡声対象となる音声が、アナウンスのように意味を伝達することが第一義である音声信号と、音楽のように音質を含めて聞かせることを第一義とする音声信号であるかを判別し、判別結果に応じて、聞き取りにくいとされる音声信号の特定の周波数帯域(例えば、1000Hz〜2000Hz)の周波数成分の量(レベル)が一定値以下であれば、利得(ゲイン)を持たせ、聴取者の聞きやすくなるレベルまで大きくするよう補正している。これにより、単にどんな音であっても一律に利得を持たせるのではなく、拡声すべき信号が意味を伝達すべきものなのかどうかを判定し、補正手段を施すかどうかの判別を行っているため、聴取者にとってより聞きやすい拡声を行うことができる。
また、本実施形態によれば、音声信号の補正を行う際に、補正状態と通常状態との切り替えタイミングを制御し、音声信号レベルが小さい無音部分を選んで切り替えるようにしたため、補正ありの状態と補正を行わない状態との切り替わりの際に聴取者に違和感を生じさせるという事態を回避することができる。さらに、音声信号の補正状態を切り替える際に、所定の時定数で緩やかに時間をかけて切り替えることにより、聴取者に違和感を生じさせるという事態をより一層回避することができる。
(第2実施形態)
上記の第1実施形態では、人間の音声かどうかの判別方法について、人間の音声信号は周波数的なエネルギー分布が音楽よりも低い帯域に集中することに着目しているが、それ以外の判別方法として、人間の音声信号は発話モデルとしてモデル化することが可能であり、音声信号としての特徴を捉えて、音声信号らしいかどうか判断する方法も考えられる。この場合の音声信号らしさを判別する方法は、例えば特許第3412209号公報で開示されているものが利用できる。本実施形態は、特許第3412209号公報で開示されている判別方法を適用したもので、上記の第1実施形態と比べると、音声信号推定度判別部33の構成が相違する。
上記の第1実施形態では、人間の音声かどうかの判別方法について、人間の音声信号は周波数的なエネルギー分布が音楽よりも低い帯域に集中することに着目しているが、それ以外の判別方法として、人間の音声信号は発話モデルとしてモデル化することが可能であり、音声信号としての特徴を捉えて、音声信号らしいかどうか判断する方法も考えられる。この場合の音声信号らしさを判別する方法は、例えば特許第3412209号公報で開示されているものが利用できる。本実施形態は、特許第3412209号公報で開示されている判別方法を適用したもので、上記の第1実施形態と比べると、音声信号推定度判別部33の構成が相違する。
図7は、本実施形態による音声信号拡声装置で用いる音声信号推定度判別部33の具体的な構成例を示す。
図7に示す音声信号推定度判別部33は、メモリ331と、制御部332と、モノラル音響信号から所定の時間長を有するフレーム信号に対しスペクトル分析を行うフーリエ分析部334と、人間の音声の発生過程を物理的にモデル化したパラメトリック分析法によって音声分析を行う音声分析部335とを有している。また、この判別部33は、フーリエ分析部334の分析結果と、音声分析部335の分析結果との比較を行う分析結果比較部336と、分析結果比較部336の比較結果に基づいて、音声信号の推量度情報を発生する音声信号の推量度情報発生部337とを有している。
ここで、本実施形態の動作を説明する。
まず、前述のA/D変換器31によって音声情報を含むモノラル音響信号がデジタル信号に変換された後、音声信号推定度判別部33の入力端子33aに供給されると、そのデジタル信号はメモリ331に記憶される。メモリ331へのデジタル信号の書込み動作や、メモリ331からのデジタル信号の読出し動作などは、例えばマイクロプロセッサを含んで構成されている制御部332によって制御される。制御部332は、メモリ331の動作制御の他に、フーリエ分析部334、音声分析部335、音声信号の推量度情報発生部337などの各構成部分に対する制御動作も行う。
メモリ331に記憶されたデジタル信号は、制御部332による制御動作により、モノラル音響信号から所定の時間長を有するフレーム信号として読出され、フーリエ分析部334と音声分析部335とに供給される。フーリエ分析部334では、供給されたフレーム信号に対しフーリエ分析を行う。音声分析部335では、供給されたフレーム信号に対し人間の音声の発生過程を物理的にモデル化したパラメトリック分析法によって音声分析を行う。この音声分析は、例えば線形予測分析、あるいは偏自己相関分析によって行われてもよい。
ここで、分析対象の音響信号X(n)に対し、フーリエ分析部334によるフーリエ変換の分析結果として、周波数スペクトル構造情報Xf(w)が得られ、音声分析部335による音声分析により、前記モデルのパラメータから周波数スペクトル構造情報Xm(w)が得られる場合を考える。この場合、2つの周波数スペクトル構造情報Xf(w)、Xm(w)が、制御部332による制御によって所定のタイミング関係で分析結果比較部18に供給される。分析結果比較部336では、供給された2つの周波数スペクトル構造情報Xf(w)、Xm(w)の差{Xf(w)−Xm(w)}を算出し、比較結果として、音声信号の推量度情報発生部337に供給する。
推量度情報発生部337は、分析結果比較部336からの比較結果であるXf(w)−Xm(w)に基づいて、音声信号の推量度情報である係数k2を発生する。Xf(w)−Xm(w)は、信号処理の対象にされているモノラル音響信号が、人間の音声だけによるモノラル音響信号の場合から、信号処理の対象にされているモノラル音響信号が、人間の音声以外の音響だけによるモノラル音響信号の場合との間の値を示すから、Xf(w)−Xm(w)の値によって、例えば係数k2を、1から0までの間で変化している数値を有するものとして発生させることができる。係数k2は、多くの実験結果を参照して適値に定められることが望ましい。発生された係数k2は、音声信号推定度判定部33の出力端子33bから乗算器41に出力される。以後、上記第1実施形態と同様の動作が行われる。
図8は、上記の音声信号推定度判定部33による判別方法の手順をフローチャートで表したものである。
図8において、音声信号推定度判定部33は、ステップS110では、音声データを入力する。ステップS120では、音声データを発話モデルに当てはめ、その発話モデルから前述のスペクトルを算出する。一方、ステップS130では、フーリエ変換によって前述のスペクトルを算出する。次いで、ステップS140では、発話モデルから算出されるスペクトルと、フーリエ変換によって算出されるスペクトルの差分を求め、ステップS150では、その差に基づいて音声信号らしいかどうか判定し、上記の係数k2を算出する。すなわち、両スペクトルの差が予め設定された下限値よりも小さいときは、発話モデルに当てはまっている、すなわち音声信号の可能性が高い(係数k2=1)とし、逆にその差が予め設定された上限値よりも大きいときは、発話モデルに当てはまっていない、すなわち音声信号の可能性が低い(係数k2=0)とする。両スペクトルの差が下限値と上限値の間の中間値をとる場合、係数k2の間は、その差に応じて0から1までの間で変化する。
従って、本実施形態でも上記第1実施形態と同様の効果を得ることができ、とくに音声信号推定度判別部に関しその設計の選択肢を増やすことができる。
10…音声入力部
11…マイクロフォン
12…アンプ
13…オーディオ再生装置
14…加算器
20…音声出力部
21…アンプ
22…スピーカ
30…補正処理部
31…A/D変換器
32…バンドパスフィルタ
33…音声信号推定度判定部
34…実効値算出部
35…遅延器
36…実効値算出部
37…係数算出部
38…乗算器
39…乗算器
40…無音判定部
41…乗算器
42…加算器
43…D/A変換器
11…マイクロフォン
12…アンプ
13…オーディオ再生装置
14…加算器
20…音声出力部
21…アンプ
22…スピーカ
30…補正処理部
31…A/D変換器
32…バンドパスフィルタ
33…音声信号推定度判定部
34…実効値算出部
35…遅延器
36…実効値算出部
37…係数算出部
38…乗算器
39…乗算器
40…無音判定部
41…乗算器
42…加算器
43…D/A変換器
Claims (2)
- 音声信号を拡声して聴取者に受聴させる音声信号拡声装置であって、
前記音声信号を入力する入力手段と、
前記入力された音声信号から、前記聴取者の聴覚特性に応じて聞き取りにくいとされる所定の音声周波数領域に対応する周波数成分を抽出する抽出手段と、
抽出された周波数成分のレベルが予め設定された基準値以下のときに所定レベルとなるように前記周波数成分を補正する補正手段と、
前記音声信号が前記聴取者に向けた意味伝達用の音声信号であるか否かを判別する判別手段と、
前記音声信号が意味伝達用の音声信号であると判別された場合、前記補正手段により補正された周波数成分を前記音声信号に加算して出力する出力手段とを備えた構成の音声信号拡声装置。 - 前記入力された音声信号の無音部分が所定時間継続したときに、前記補正手段による補正ありの状態から補正なしの状態へ切り替える第1の切替手段と、
前記補正手段による補正ありの状態と補正なしの状態との間の切り替え時に、所定の時定数をもって切り替える第2の切替手段とをさらに有することを特徴とする請求項1に記載の音声信号拡声装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005158052A JP2006333396A (ja) | 2005-05-30 | 2005-05-30 | 音声信号拡声装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005158052A JP2006333396A (ja) | 2005-05-30 | 2005-05-30 | 音声信号拡声装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006333396A true JP2006333396A (ja) | 2006-12-07 |
Family
ID=37554558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005158052A Pending JP2006333396A (ja) | 2005-05-30 | 2005-05-30 | 音声信号拡声装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006333396A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008187509A (ja) * | 2007-01-30 | 2008-08-14 | Ricoh Co Ltd | 受信音声再生装置 |
WO2009057488A1 (ja) * | 2007-10-30 | 2009-05-07 | Clarion Co., Ltd. | 聴覚感度補正装置 |
WO2010005033A1 (ja) * | 2008-07-11 | 2010-01-14 | クラリオン株式会社 | 音響処理装置 |
CN101681618A (zh) * | 2007-06-19 | 2010-03-24 | 杜比实验室特许公司 | 利用频谱修改的响度测量 |
JP4982617B1 (ja) * | 2011-06-24 | 2012-07-25 | 株式会社東芝 | 音響制御装置、音響補正装置、及び音響補正方法 |
-
2005
- 2005-05-30 JP JP2005158052A patent/JP2006333396A/ja active Pending
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008187509A (ja) * | 2007-01-30 | 2008-08-14 | Ricoh Co Ltd | 受信音声再生装置 |
US8145476B2 (en) | 2007-01-30 | 2012-03-27 | Ricoh Company, Ltd. | Received voice playback apparatus |
CN101681618A (zh) * | 2007-06-19 | 2010-03-24 | 杜比实验室特许公司 | 利用频谱修改的响度测量 |
CN101843115A (zh) * | 2007-10-30 | 2010-09-22 | 歌乐株式会社 | 听觉灵敏度校正装置 |
WO2009057488A1 (ja) * | 2007-10-30 | 2009-05-07 | Clarion Co., Ltd. | 聴覚感度補正装置 |
US8351619B2 (en) | 2007-10-30 | 2013-01-08 | Clarion Co., Ltd. | Auditory sense correction device |
CN101843115B (zh) * | 2007-10-30 | 2013-09-25 | 歌乐株式会社 | 听觉灵敏度校正装置 |
JP5345067B2 (ja) * | 2007-10-30 | 2013-11-20 | クラリオン株式会社 | 聴覚感度補正装置 |
WO2010005033A1 (ja) * | 2008-07-11 | 2010-01-14 | クラリオン株式会社 | 音響処理装置 |
US20110081029A1 (en) * | 2008-07-11 | 2011-04-07 | Clarion Co., Ltd. | Acoustic processing device |
JP5295238B2 (ja) * | 2008-07-11 | 2013-09-18 | クラリオン株式会社 | 音響処理装置 |
US9214916B2 (en) * | 2008-07-11 | 2015-12-15 | Clarion Co., Ltd. | Acoustic processing device |
JP4982617B1 (ja) * | 2011-06-24 | 2012-07-25 | 株式会社東芝 | 音響制御装置、音響補正装置、及び音響補正方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110473567B (zh) | 基于深度神经网络的音频处理方法、装置及存储介质 | |
US9892721B2 (en) | Information-processing device, information processing method, and program | |
TWI459828B (zh) | 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統 | |
EP2081405B1 (en) | A hearing aid adapted to a specific type of voice in an acoustical environment, a method and use | |
JP4649546B2 (ja) | 補聴器 | |
JP2013537321A (ja) | 知覚スペクトルアンバランス改善のための音声信号動的補正 | |
Rämö et al. | Perceptual headphone equalization for mitigation of ambient noise | |
JP2006333396A (ja) | 音声信号拡声装置 | |
JP2008527882A (ja) | 音声信号の音響レベルを周波数に依存して増幅する信号処理装置及び音声システム及びその方法 | |
JP2010091897A (ja) | 音声信号強調装置 | |
WO2012098856A1 (ja) | 補聴器、及び、補聴器の制御方法 | |
JPH0968997A (ja) | 音声処理方法及び装置 | |
JP5058844B2 (ja) | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 | |
Brouckxon et al. | Time and frequency dependent amplification for speech intelligibility enhancement in noisy environments | |
JP2008102551A (ja) | 音声信号の処理装置およびその処理方法 | |
RU2589298C1 (ru) | Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке | |
JP5202021B2 (ja) | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 | |
JP4644876B2 (ja) | 音声処理装置 | |
Zakis | Music perception and hearing aids | |
JP4493557B2 (ja) | 音声信号判断装置 | |
JP2011141540A (ja) | 音声信号処理装置、テレビジョン受像機、音声信号処理方法、プログラム、および、記録媒体 | |
JPH09307385A (ja) | 音響信号再生方法及び装置 | |
KR20200093576A (ko) | 헬멧에서, 청취자의 청각적 인식 특성을 고려하여, 라이브 전관 방송을 수행하는 방법 | |
KR102403996B1 (ko) | 보청기의 채널영역 방식, 채널영역 방식을 이용한 보청기의 피팅방법, 그리고 이를 통해 피팅된 디지털 보청기 | |
JPH086594A (ja) | 骨伝導音声のノイズ除去装置 |