JP2006333396A

JP2006333396A - 音声信号拡声装置

Info

Publication number: JP2006333396A
Application number: JP2005158052A
Authority: JP
Inventors: Osamu Yoshino; 治吉野
Original assignee: Victor Company of Japan Ltd
Current assignee: Victor Company of Japan Ltd
Priority date: 2005-05-30
Filing date: 2005-05-30
Publication date: 2006-12-07

Abstract

【課題】もとの音楽が持つ芸術性を損なうことなく、情報伝達のための音声のみをうるさ過ぎずに聴取者の聞き取りやすい音量で拡声する。
【解決手段】音声信号拡声装置は、音声信号を入力する入力手段（３１）と、入力された音声信号から、聴取者の聴覚特性に応じて聞き取りにくいとされる所定の音声周波数領域に対応する周波数成分を抽出する抽出手段（３２）と、抽出された周波数成分のレベルが予め設定された基準値以下のときに所定レベルとなるように周波数成分を補正する補正手段（３６〜３８）と、入力された音声信号が聴取者に向けた意味伝達用の音声信号であるかそれ以外の音声信号であるかを判別する判別手段（３３、３９）と、音声信号が意味伝達用の音声信号であると判別された場合、補正手段により補正された周波数成分を音声信号に加算して出力する出力手段（４２、４３）とを有する。
【選択図】図１

Description

本発明は、音声信号拡声装置に係り、とくに高齢者が中心となって受聴する音声拡声システムの音質補正に関する。

昨今の少子化の進行に伴い、高齢者の人口の占める割合がますます高くなり、高齢者社会となってきている。このことを反映して、高齢者向けを掲げたホームやケアセンターなどの高齢者を対象とする新たな施設の建設も益々増加しつつある。このようなケアセンターなどの施設では、通常、各種情報伝達のためのアナウンスやＢＧＭなどの音楽を施設内で流すために拡声システムが使用されている。こういった高齢者向けの施設で使用される拡声システムでは、当然高齢者向けに特化していることが望まれている。

例えば、高齢者向けの場合、アナウンスなどの音声を高齢者が確実に聞き取れるように「ゆっくり話す」ことが必要となる。これは、時間的な補正を施すことで実現可能であり、すでに実用化されている。一方、高齢者の聴覚特性は、高齢になる程、特定周波数において、一定の音量以下が聞き取りにくくなるものの、一定の音量以上であれば、若年者と同等に受聴できるという特性（「リクルートメント現象」と言う）が知られている。

従って、高齢者が中心に受聴する拡声システムにおいては、時間的な補正のほか、高齢者が聞き取りやすくなるよう、何らかの周波数的な補正を施すことも必要とされている。

なお、本発明に関連する先行技術として、音響信号の再生時において周囲騒音のマスキングによって生じる聴取障害を補償し、周囲騒音が変化しても聴取者の好みの音を再生するため、環境音測定手段により帯域分割フィルタを用いて環境音のマスキング帯域を分析し、音声再生時に、聴覚データベースから特定のラウドネス特定を抽出し、嗜好音調整手段によりラウドネス特性を調節する音響再生装置が提案されている（特許文献１参照）。
特開平１０−３４１１２３号公報

しかしながら、高齢者向けの音質補正としては、単に一律に周波数的に聞き取りにくいとされる周波数帯域成分の音量を増大してしまうと、リクルートメント現象により、場合によっては、うるさ過ぎてかえって聞き取りにくくなることもありうる。

また、拡声すべき音声信号には、情報伝達としてのアナウンスもあれば、ＢＧＭ（バックグラウンドミュージック）などの音楽の場合もある。拡声すべき音声信号がアナウンスであれば、音質補正により音質が変化してもその内容が明確に伝われば良いが、音楽の場合には、音質が変化してしまうと、もとの音楽が持つ芸術性が損なわれることになってしまう。

さらに、特許文献１は、上記のような高齢者向けの音質補正について、リクルートメント現象等、特に意識したものではない。

本発明は、上記に鑑みてなされたもので、その目的としては、聴取者の聞き取りにくいとされる周波数帯域成分の音質補正に際し、もとの音楽が有する芸術性を損なうことなく、情報伝達のための音声のみをうるさ過ぎずに聴取者の聞き取りやすい音量で拡声することができる音声信号拡声装置を提供することにある。

上記目的を達成するため、請求項１記載の発明に係る音声信号拡声装置は、音声信号を拡声して聴取者に受聴させる音声信号拡声装置であって、前記音声信号を入力する入力手段と、前記入力された音声信号から、前記聴取者の聴覚特性に応じて聞き取りにくいとされる所定の音声周波数領域に対応する周波数成分を抽出する抽出手段と、抽出された周波数成分のレベルが予め設定された基準値以下のときに所定レベルとなるように前記周波数成分を補正する補正手段と、前記音声信号が前記聴取者に向けた意味伝達用の音声信号であるか否かを判別する判別手段と、前記音声信号が意味伝達用の音声信号であると判別された場合、前記補正手段により補正された周波数成分を前記音声信号に加算して出力する出力手段とを備えたことを要旨とする。

また請求項２記載の発明に係る音声信号拡声装置は、請求項１記載の発明において、前記入力された音声信号の無音部分が所定時間継続したときに、前記補正手段による補正ありの状態から補正なしの状態へ切り替える第１の切替手段と、前記補正手段による補正ありの状態と補正なしの状態との間の切り替え時に、所定の時定数をもって切り替える第２の切替手段とをさらに有することを要旨とする。

請求項１記載の発明によれば、聴取者の聞き取りにくいとされる音声信号の特定の周波数帯域成分のレベルが一定値以下であれば、所定レベルまで大きくする補正手段を備えると共に、音声信号が意味を伝達すべきものである場合に補正手段による補正を有効にするように構成したため、アナウンスなど意味を的確に伝える必要がある場合はより意味を聞き取りやすくなり、また音楽などのようにむやみに音質を変えるべきではない場合はそのまま受聴させることが可能になる。これにより、もとの音楽が持つ芸術性を損なうことなく、情報伝達のための音声のみをうるさ過ぎずに聴取者の聞き取りやすい音量で拡声することができる音声信号拡声装置を提供することができる。

請求項２記載の発明によれば、上記効果に加え、音声信号の補正状態と通常状態との切り替えの際に、音声信号レベルが小さい無音部分を選んで切り替えると共に、所定の時定数をもって切り替えるようにしたため、聴取者に違和感を生じさせるという事態を回避することができる。

次に、本発明に係る音声信号拡声装置を実施するための最良の形態について、図面を参照して詳細に説明する。

（第１実施形態）
図１は、本発明の第１実施形態による音声信号拡声装置の全体構成を示す。

図１に示す音声信号拡声装置は、例えばケアセンターなどの高齢者向け施設内で高齢者が中心となって受聴する音声拡声システムに適用したもので、機能上、聴取者に聞かせるアナウンスや音楽などの音声を入力する音声入力部１０と、音声入力部１０から入力された音声を補正処理する補正処理部３０と、この補正処理部３０にて補正処理された音声を出力する音声出力部２０とを備えている。この内、補正処理部３０が本発明の主要部を構成している。

音声入力部１０は、各種情報伝達のためのアナウンスなどの音声を電気信号に変換して入力するマイクロフォン１１と、このマイクロフォン１１から入力された音声に対応する電気信号を所定の利得で増幅して出力するアンプ１２と、ＢＧＭなどの音響信号を再生するオーディオ再生装置１３と、オーディオ再生装置１３の音声出力及びアンプ１２の音声出力を加算して補正処理部３０に出力する加算器１４とを有する。

音声出力部２０は、補正処理部３０にて後述のように補正処理された音声信号を所定の利得で増幅するアンプ２１と、このアンプ２１により増幅された音声信号を外部に音声出力するスピーカ２２とを有する。

補正処理部３０は、加算器１４の出力側に接続されるＡ／Ｄ（Analog to Digital）変換器３１と、このＡ／Ｄ変換器３１の出力側に接続されるバンドパスフィルタ３２、音声信号推定度判別部３３、実効値算出部３４、及び遅延器３５とを有する。

また、この補正処理部３０は、バンドパスフィルタ３２の出力側に接続される実効値算出部３６と、この実効値算出部３６の出力側に接続される係数算出部３７と、バンドパスフィルタ３２の出力側及び係数算出部３７の出力側に接続される乗算器３８と、音声信号推定度判別部３３及び乗算器３８の両出力側に接続される乗算器３９と、実効値算出部３４の出力側に接続される無音判定部４０と、無音判定部４０及び乗算器３９の両出力側に接続される乗算器４１と、遅延器３５及び乗算器４１の両出力側に接続される加算器４２と、この加算器４２の出力側に接続されるＤ／Ａ（Digital to Analog）変換器４３とを有する。Ｄ／Ａ変換器４３の出力側には、アンプ２１が接続される。

ここで、補正処理部３０の動作を中心にして、本実施形態の全体動作を説明する。

まず、Ａ／Ｄ変換器３１は、オーディオ再生装置１３の音声出力及びアンプ１２の音声出力を加算器１４を介して入力すると、アナログ信号から所定のサンプリングレート（例えば、４４．１ｋＨｚ）でサンプリングしてデジタル信号に変換し、変換されたデジタル信号を音声データとしてバンドパスフィルタ３２、音声信号推定度判別部３３、実効値算出部３４、及び遅延器３５にそれぞれ個別に出力する。

次いで、バンドパスフィルタ３２は、Ａ／Ｄ変換器３１にてデジタル信号に変換された音声データから、高齢者の聴覚特性により高齢者が聞き取りにくいとされる所定の音声周波数帯域、例えば本実施形態では１０００Ｈｚ〜２０００Ｈｚの周波数成分を抽出し、実効値算出部３４及び乗算器３８に出力する。

図２は、一般に知られている高齢者の聴覚特性を示すグラフの一例、図３は、バンドパスフィルタ３２の特性グラフの一例をそれぞれ示す。図２に示すように、聴取者の聴力レベルは、聴取者の加齢と共に、どの音声周波数成分でも低下する傾向にあり、特に１ｋＨｚ以上の周波数成分ではその傾向が顕著となっている。そのため、本実施形態で用いるバンドパスフィルタ３２は、図３に示すように、６０〜６５歳以上の高齢者の聴力レベルが顕著に低下している音声周波数領域として、１０００Ｈｚ〜２０００Ｈｚの周波数成分を抽出するものが使用されている。

次いで、実効値算出部３６は、バンドパスフィルタ３２により抽出された１０００Ｈｚ〜２０００Ｈｚの周波数成分の実効値（パワーレベル）を算出し、その算出値を係数算出部３７に出力する。

これにより、係数算出部３７は、実効値算出部３６からの実効値の算出値と、前述したリクルートメント現象により高齢者が聞き取りにくいとされる特定周波数帯域の一定音量に対応して予め設定された実効値の基準値とを比較し、図１中のグラフに示すように、基準値／算出値の入力に応じて、高齢者の聞き取りにくい周波数帯域成分量が一定音量以下のときにその周波数成分に対して聴覚的な補正処理を施すための係数ｋ１を算出し、乗算器３８に出力する。

図１の例では、係数ｋ１の値は、
（１）算出値が基準値を超える場合（入力が１未満）はｋ１＝０．５（下限値）
（２）算出値が基準値以下（入力が１以上）で所定値以下の場合は基準値／算出値の入力に比例して０．５＜ｋ１＜４（上限値）の範囲内で変化する値
（３）算出値が基準値以下（入力が１以上）で所定値を超える場合はｋ１＝４
をそれぞれ示している。

次いで、乗算器３８は、バンドパスフィルタ３２からの出力と、係数算出部３７の係数ｋ１とを乗算し、その乗算結果を乗算器３９に出力する。この乗算結果は、高齢者の聞き取りにくいとされる１０００Ｈｚ〜２０００Ｈｚ帯域の周波数成分に対する聴覚的な補正結果を反映したものとなっている。

上記の聴覚的な補正処理は、入力された音声信号から、人間の聴覚に影響を与える周波数成分をバンドパスフィルタ３２にて抽出して、抽出された周波数成分のレベル検出を行い、レベルが一定値以下であれば、その帯域成分の信号を増幅し、結果として高齢者などにとって聞きやすい音声拡声方法を適用したものである。なお、図１の例では、バンドパスフィルタ３２を使用する例を示しているが、他の周波数抽出方法、例えばサブバンドフィルタの使用や、あるいはフーリエ変換などのような直交変換を利用しても構わない。ただし、音声入力としてマイクロフォン１１を使用し、話者がその場で話す声を拡声する場合は、大きな処理遅延が生じてしまうと、話しにくくなってしまうため、短時間で処理できる方法が望ましい。

一方、上記の聴覚的な補正処理と並行して、音声信号推定度判別部３３は、図４に示す処理を行う。まず、ステップＳ１０では、Ａ／Ｄ変換器３１から音声データを入力する。ステップＳ２０では、入力された音声データから、図示しない内蔵のバンドパスフィルタにて、人間の声の特性に応じた音声周波数帯域（例えば、１００Ｈｚ〜１０００ｋＨｚ）の周波数成分を抽出する。ステップＳ３０では、抽出された周波数成分のパワーレベル（実効値）を算出する。ステップＳ４０では、これと並行して、入力された音声データから、全帯域のパワーレベル（実効値）を算出する。次いで、ステップＳ５０では、全帯域のパワーレベルに対する音声帯域のパワーレベルのレベル比（音声帯域のレベル／全帯域のパワーレベル）を算出する。さらに、ステップＳ６０では、算出されたレベル比に基づいて、図１中のグラフに示すように、テーブル変換により、音声らしさの係数ｋ２を算出し、乗算器３９に出力する。

図１の例では、係数ｋ２の値は、
（１）レベル比率が３／１０以下の場合はｋ２＝０
（２）レベル比率が３／１０を超えて９／１０未満の場合はレベル比率に比例して０＜ｋ２＜１の範囲内で変化する値
（３）レベル比率が９／１０以上の場合はｋ２＝１
をそれぞれ示している。

上記の判別処理では、人間の音声信号は音楽よりも周波数的なエネルギー分布が低い帯域に集中することに基づいて、人間の音声とそれ以外とを判別している。入力される音声信号には、アナウンスなどのように意味を伝達することに重点が置かれる音と、音楽のように音質を含めて伝達することに意味がある音とが存在する。そこで、拡声すべき音が、どのような種別のものであるか、上記の処理にて自動的に判別する。その結果、アナウンスなどの意味を伝達すべき音のみ、前述した聴覚的な補正処理を施すことができる。

次いで、乗算器３９は、音声信号推定度判別部３３からの係数ｋ２と、乗算器３８の出力（バンドパスフィルタ３２の出力と係数ｋ１との乗算値）とを乗算し、その乗算結果を出力する。この乗算結果は、上記の聴覚的な補正結果に加え、人間の音声信号か否かの判別結果も反映したものとなっている。

実効値算出部３４は、Ａ／Ｄ変換器３１から音声データの実効値を算出し、その算出値を無音判定部４０に出力する。

無音判定部４０は、実効値算出部３４からの入力実効値に基づいて、図１中のグラフに示すように、テーブル変換により、係数ｋ３を求め、乗算器４１に出力する。図１の例では、係数ｋ３の値は、
（１）入力実効値が「０」の場合はｋ３＝０
（２）入力実効値が「０」〜「１００」の場合は０＜ｋ３＜１
（３）入力実効値が「１００」以上の場合はｋ３＝１
をそれぞれ示している。

乗算器４１は、無音判定部４０からの係数ｋ３と、乗算器３９からの出力（乗算器３８の出力と係数ｋ２との乗算値）とを乗算し、その乗算結果を加算器４２に出力する。この乗算結果は、上記の聴覚的な補正結果及び人間の音声信号か否かの判別結果に加え、無音判定部４０による判定結果も反映したものとなっている。

遅延器３５は、Ａ／Ｄ変換器３１からの出力（補正前の音声データ）を所定時間遅延させて加算器４２に出力する。

加算器４２は、遅延器３５からの出力と、乗算器４１からの出力（乗算器３９の出力と係数ｋ３との乗算値）とを加算し、その加算結果である補正後の音声データをＤ／Ａ変換器４３に出力する。出力された補正後の音声データは、Ｄ／Ａ変換器４３にてデジタル信号からアナログ信号に変換後、アンプ２１にて増幅され、スピーカ２２から音声出力される。

上記の拡声すべき音声信号の補正は、補正あり／なしの２パターンでなく、「補正なし」の状態から「補正最大」の状態の間で任意の補正量をとることが可能である。拡声すべき音声信号が、補正するべき信号なのかどうかの判定は、常時もしくは定期的に行う必要があるが、拡声器として運用中に補正の状態が頻繁に変わることは望ましくない。

そこで、図５（ａ）に示すように、通常運用時においては、ある一定時間以上の無音部分を検出した場合は、補正処理を行わない状態とする。また、図５（ｂ）に示すように、アナウンスなどの拡声すべき音声から音楽に切り替わった場合は、急激に補正処理を停止するのではなく、ある時定数をもたせて徐々に補正が働くようにする。

以上の補正処理による効果を図６（ａ）及び（ｂ）に示す。

図６（ａ）に示すように、入力されたアナウンスの音声信号における１０００Ｈｚ〜２０００Ｈｚ帯域の周波数成分のレベル（ゲイン）が予め設定された基準値よりも低い場合、図６（ｂ）に示すように音声信号のうち１０００Ｈｚ〜２０００Ｈｚ帯域の周波数成分のみゲインを上げるよう前述した補正処理が施される。

従って、本実施形態によれば、高齢者が中心となって受聴する音声拡声システムにおいて、アナウンスなど意味を的確に伝達すべき音声と、それ以外の音楽のような音響信号とを判別し、アナウンスなど意味を的確に伝える必要がある場合は高齢者が聞き取りやすくなるような補正処理を行うため、アナウンスなど意味を的確に伝える必要がある場合はより意味を聞き取りやすくなり、また音楽などのようにむやみに音質を変えるべきではない場合はそのまま受聴させることが可能になる。

即ち、聴取者の聴覚特性及び音声信号の特性に応じて適応的に拡声の際の音声信号を補正すると共に、拡声対象となる音声が、アナウンスのように意味を伝達することが第一義である音声信号と、音楽のように音質を含めて聞かせることを第一義とする音声信号であるかを判別し、判別結果に応じて、聞き取りにくいとされる音声信号の特定の周波数帯域（例えば、１０００Ｈｚ〜２０００Ｈｚ）の周波数成分の量（レベル）が一定値以下であれば、利得（ゲイン）を持たせ、聴取者の聞きやすくなるレベルまで大きくするよう補正している。これにより、単にどんな音であっても一律に利得を持たせるのではなく、拡声すべき信号が意味を伝達すべきものなのかどうかを判定し、補正手段を施すかどうかの判別を行っているため、聴取者にとってより聞きやすい拡声を行うことができる。

また、本実施形態によれば、音声信号の補正を行う際に、補正状態と通常状態との切り替えタイミングを制御し、音声信号レベルが小さい無音部分を選んで切り替えるようにしたため、補正ありの状態と補正を行わない状態との切り替わりの際に聴取者に違和感を生じさせるという事態を回避することができる。さらに、音声信号の補正状態を切り替える際に、所定の時定数で緩やかに時間をかけて切り替えることにより、聴取者に違和感を生じさせるという事態をより一層回避することができる。

（第２実施形態）
上記の第１実施形態では、人間の音声かどうかの判別方法について、人間の音声信号は周波数的なエネルギー分布が音楽よりも低い帯域に集中することに着目しているが、それ以外の判別方法として、人間の音声信号は発話モデルとしてモデル化することが可能であり、音声信号としての特徴を捉えて、音声信号らしいかどうか判断する方法も考えられる。この場合の音声信号らしさを判別する方法は、例えば特許第３４１２２０９号公報で開示されているものが利用できる。本実施形態は、特許第３４１２２０９号公報で開示されている判別方法を適用したもので、上記の第１実施形態と比べると、音声信号推定度判別部３３の構成が相違する。

図７は、本実施形態による音声信号拡声装置で用いる音声信号推定度判別部３３の具体的な構成例を示す。

図７に示す音声信号推定度判別部３３は、メモリ３３１と、制御部３３２と、モノラル音響信号から所定の時間長を有するフレーム信号に対しスペクトル分析を行うフーリエ分析部３３４と、人間の音声の発生過程を物理的にモデル化したパラメトリック分析法によって音声分析を行う音声分析部３３５とを有している。また、この判別部３３は、フーリエ分析部３３４の分析結果と、音声分析部３３５の分析結果との比較を行う分析結果比較部３３６と、分析結果比較部３３６の比較結果に基づいて、音声信号の推量度情報を発生する音声信号の推量度情報発生部３３７とを有している。

ここで、本実施形態の動作を説明する。

まず、前述のＡ／Ｄ変換器３１によって音声情報を含むモノラル音響信号がデジタル信号に変換された後、音声信号推定度判別部３３の入力端子３３ａに供給されると、そのデジタル信号はメモリ３３１に記憶される。メモリ３３１へのデジタル信号の書込み動作や、メモリ３３１からのデジタル信号の読出し動作などは、例えばマイクロプロセッサを含んで構成されている制御部３３２によって制御される。制御部３３２は、メモリ３３１の動作制御の他に、フーリエ分析部３３４、音声分析部３３５、音声信号の推量度情報発生部３３７などの各構成部分に対する制御動作も行う。

メモリ３３１に記憶されたデジタル信号は、制御部３３２による制御動作により、モノラル音響信号から所定の時間長を有するフレーム信号として読出され、フーリエ分析部３３４と音声分析部３３５とに供給される。フーリエ分析部３３４では、供給されたフレーム信号に対しフーリエ分析を行う。音声分析部３３５では、供給されたフレーム信号に対し人間の音声の発生過程を物理的にモデル化したパラメトリック分析法によって音声分析を行う。この音声分析は、例えば線形予測分析、あるいは偏自己相関分析によって行われてもよい。

ここで、分析対象の音響信号Ｘ(ｎ)に対し、フーリエ分析部３３４によるフーリエ変換の分析結果として、周波数スペクトル構造情報Ｘｆ(ｗ)が得られ、音声分析部３３５による音声分析により、前記モデルのパラメータから周波数スペクトル構造情報Ｘｍ(ｗ)が得られる場合を考える。この場合、２つの周波数スペクトル構造情報Ｘｆ(ｗ)、Ｘｍ(ｗ)が、制御部３３２による制御によって所定のタイミング関係で分析結果比較部１８に供給される。分析結果比較部３３６では、供給された２つの周波数スペクトル構造情報Ｘｆ(ｗ)、Ｘｍ(ｗ)の差｛Ｘｆ(ｗ)−Ｘｍ(ｗ)｝を算出し、比較結果として、音声信号の推量度情報発生部３３７に供給する。

推量度情報発生部３３７は、分析結果比較部３３６からの比較結果であるＸｆ(ｗ)−Ｘｍ(ｗ)に基づいて、音声信号の推量度情報である係数ｋ２を発生する。Ｘｆ(ｗ)−Ｘｍ(ｗ)は、信号処理の対象にされているモノラル音響信号が、人間の音声だけによるモノラル音響信号の場合から、信号処理の対象にされているモノラル音響信号が、人間の音声以外の音響だけによるモノラル音響信号の場合との間の値を示すから、Ｘｆ(ｗ)−Ｘｍ(ｗ)の値によって、例えば係数ｋ２を、１から０までの間で変化している数値を有するものとして発生させることができる。係数ｋ２は、多くの実験結果を参照して適値に定められることが望ましい。発生された係数ｋ２は、音声信号推定度判定部３３の出力端子３３ｂから乗算器４１に出力される。以後、上記第１実施形態と同様の動作が行われる。

図８は、上記の音声信号推定度判定部３３による判別方法の手順をフローチャートで表したものである。

図８において、音声信号推定度判定部３３は、ステップＳ１１０では、音声データを入力する。ステップＳ１２０では、音声データを発話モデルに当てはめ、その発話モデルから前述のスペクトルを算出する。一方、ステップＳ１３０では、フーリエ変換によって前述のスペクトルを算出する。次いで、ステップＳ１４０では、発話モデルから算出されるスペクトルと、フーリエ変換によって算出されるスペクトルの差分を求め、ステップＳ１５０では、その差に基づいて音声信号らしいかどうか判定し、上記の係数ｋ２を算出する。すなわち、両スペクトルの差が予め設定された下限値よりも小さいときは、発話モデルに当てはまっている、すなわち音声信号の可能性が高い（係数ｋ２＝１）とし、逆にその差が予め設定された上限値よりも大きいときは、発話モデルに当てはまっていない、すなわち音声信号の可能性が低い（係数ｋ２＝０）とする。両スペクトルの差が下限値と上限値の間の中間値をとる場合、係数ｋ２の間は、その差に応じて０から１までの間で変化する。

従って、本実施形態でも上記第１実施形態と同様の効果を得ることができ、とくに音声信号推定度判別部に関しその設計の選択肢を増やすことができる。

本発明の第１実施形態による音声信号拡声装置の全体構成を示す概略ブロック図である。高齢者の聴覚特性を示すグラフである。バンドパスフィルタの特性を示すグラフである。図１に示す音声信号推定度判定部の処理を示す概略フローチャートである。（ａ）はアナウンス間に無音部分が一定時間存在する場合の補正処理の切り替わり例、（ｂ）はアナウンスから音楽に切り替わった場合の補正処理の切り替わり例を示す図である。（ａ）は音声信号拡声装置に入力されるアナウンスに対応する音声の１０００Ｈｚ〜２０００Ｈｚ帯域の特性、（ｂ）は音声信号拡声装置から出力されるアナウンスに対応する音声の１０００Ｈｚ〜２０００Ｈｚ帯域の特性を示す図である。本発明の第２実施形態による音声信号拡声装置で用いる音声信号推定度判定部の内部構成を示す概略ブロック図である。図７に示す音声信号推定度判定部による判別方法の手順を示す概略フローチャートである。

符号の説明

１０…音声入力部
１１…マイクロフォン
１２…アンプ
１３…オーディオ再生装置
１４…加算器
２０…音声出力部
２１…アンプ
２２…スピーカ
３０…補正処理部
３１…Ａ／Ｄ変換器
３２…バンドパスフィルタ
３３…音声信号推定度判定部
３４…実効値算出部
３５…遅延器
３６…実効値算出部
３７…係数算出部
３８…乗算器
３９…乗算器
４０…無音判定部
４１…乗算器
４２…加算器
４３…Ｄ／Ａ変換器

Claims

音声信号を拡声して聴取者に受聴させる音声信号拡声装置であって、
前記音声信号を入力する入力手段と、
前記入力された音声信号から、前記聴取者の聴覚特性に応じて聞き取りにくいとされる所定の音声周波数領域に対応する周波数成分を抽出する抽出手段と、
抽出された周波数成分のレベルが予め設定された基準値以下のときに所定レベルとなるように前記周波数成分を補正する補正手段と、
前記音声信号が前記聴取者に向けた意味伝達用の音声信号であるか否かを判別する判別手段と、
前記音声信号が意味伝達用の音声信号であると判別された場合、前記補正手段により補正された周波数成分を前記音声信号に加算して出力する出力手段とを備えた構成の音声信号拡声装置。
前記入力された音声信号の無音部分が所定時間継続したときに、前記補正手段による補正ありの状態から補正なしの状態へ切り替える第１の切替手段と、
前記補正手段による補正ありの状態と補正なしの状態との間の切り替え時に、所定の時定数をもって切り替える第２の切替手段とをさらに有することを特徴とする請求項１に記載の音声信号拡声装置。