JP6548938B2 - 音声処理装置及び音声処理方法 - Google Patents

音声処理装置及び音声処理方法 Download PDF

Info

Publication number
JP6548938B2
JP6548938B2 JP2015074832A JP2015074832A JP6548938B2 JP 6548938 B2 JP6548938 B2 JP 6548938B2 JP 2015074832 A JP2015074832 A JP 2015074832A JP 2015074832 A JP2015074832 A JP 2015074832A JP 6548938 B2 JP6548938 B2 JP 6548938B2
Authority
JP
Japan
Prior art keywords
formant
audio signal
voice
pass filter
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015074832A
Other languages
English (en)
Other versions
JP2016110050A (ja
Inventor
正司 最上
正司 最上
渡邉 秀雄
秀雄 渡邉
Original Assignee
寿通信機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 寿通信機株式会社 filed Critical 寿通信機株式会社
Publication of JP2016110050A publication Critical patent/JP2016110050A/ja
Application granted granted Critical
Publication of JP6548938B2 publication Critical patent/JP6548938B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Measuring Instrument Details And Bridges, And Automatic Balancing Devices (AREA)
  • Hall/Mr Elements (AREA)

Description

本発明は、音響装置や放送設備などのスピーカーから流れる音声を明瞭に聴きやすくするための音声処理装置及び音声明瞭化装置並びに音声処理方法に関する。
一般に、ビルや公共の建物会館、ショッピングセンター、スポーツ施設などといった大勢の人が集まる場所には、必要な情報の案内や緊急のアナウンスを行うための放送設備(館内放送)が設置されている。この放送設備は、例えば建物の天井や壁などにスピーカーを設置し、放送室から送られる音声信号をスピーカーで音声に変換して出るようになっているが、天井板の共振現象や他のスピーカーからでる音声との干渉などの条件によっては音声の内容が聞き取り難いことがある。
一方、加齢によって聴力が衰えた高齢者や難聴者の場合、音声は聴き取れても何を言っているのかよく分からないことがある。これは人間が発する音声(言語)が母音と子音からなるものであって、このうち母音は比較的容易に聴き取れても子音が聴き取り難いためであると考えられている。従って、スピーカーから出る音量を上げたり、補聴器の感度を高くしただけでは、子音だけでなく母音も大きくなるため、容易に解消できない。
そのため、例えば以下の特許文献1では、携帯電話やテレビ、ステレオなどのオーディオ機器を使用する使用者の年齢による聴覚の変化に合わせてレシーバなどから出力される音声の周波数特性およびレベルを補正する音声補正装置が提案されている。また、以下の特許文献2や3などでは、話者のホルマントを検出して聴きやすいホルマントに変形する方法が提案されている。
特開2000−209698号公報 特開2008−116534号公報 特開平01−93796号公報
ところで、前述したような館内放送におけるスピーカーから出る音声を聴き取り易くするためには、放送機器やスピーカーを高品質なものに代えたり、スピーカーの数や設置場所などを工夫するなどが考えられるが、そのためには多大な費用を要する。一方、聴力が衰えた高齢者や難聴者に対する音声の補正方法では、声色(音質)が大きく変化して不自然な音声になってしまうことがある。
そこで、本発明はこれらの課題を解決するために案出されたものであり、その目的の1つは、既存の音響装置や放送設備であってもそのスピーカーから流れる音声を明瞭に聴きやすくできる新規な音声処理装置及び音声明瞭化装置並びに音声処理方法を提供するものである。また、本発明の他の目的は、聴力が衰えた高齢者や難聴者であっても違和感の無い自然な音声で聴き取ることができる新規な音声処理装置及び音声明瞭化装置並びに音声処理方法を提供するものである。
人間の聴覚による言語の理解は、鼓膜で受けた音波を聴覚器官で電気信号に変換して脳へ伝達され、過去の経験から得た記憶に照合して言葉として判断されるものであるが、聴覚器官は非常に複雑であり、その働きについてはあまり解明されていない。
近年、難聴者向けに補聴器や集音器が「対個人」を目的に特殊な補助音声処理を施した受動的機器類が広く普及しつつあるが、これらは外部から到来する音声や他の音を聴取するもので装着による疲労感や見た目を気にすることから使用をためらうケースが多い。また、高性能なものほど高額となり、経済的負担が大きい。
一方、言語の発声メカニズムに関する研究によれば、声帯という器官から強さ、量などが調整された空気が母音として放出される。これを第1ホルマントといい、後に続く軌道、口腔の容積や形状、鼻腔、舌の振動・形状、上顎、下顎による弛緩容積などの調整による共鳴現象で第1ホルマントより高い周波数域にエネルギーの大きい周波数特性上のピークが複数現れ、これらをホルマントと呼んでいる。低い周波数側から高い周波数側に向かって順次現れるピークを第2ホルマント、第3ホルマント、第4ホルマント…、第nホルマントとされ、それらを合成したものがその個人独自の声色として発せられる。
一般に聴覚による音声信号の理解は、その声の流れの中で重要な周波数成分およびその大きさを検知し、それらを脳に伝達して実現されるのであるが、この流れに関する研究は、言語の分野では比較的進んでおり、第1ホルマントから第4ホルマントが特に重量な周波数成分とされている。
そこで、前記課題を解決するための第1の発明は、収音された音声信号を分岐し、分岐した一方の音声信号から低次のホルマント以下の低周波数成分と高次のホルマントを超える高周波数成分とを除去する帯域濾波器と、前記分岐した他方の音声信号の位相を、前記帯域濾波器を通過した音声信号の位相と合うように補正する位相補正器と、前記帯域濾波器を通過した音声信号を前記位相補正器を通過した音声信号に加算合成して出力する加算合成器とを有することを特徴とする音声処理装置である。
このような構成によれば、もとの音声信号から言語の識別に重要な第2〜第4程度のホルマント成分のみを抽出して元の音声信号に加えて出力できるため、健聴者にとっては、条件悪化により減衰した第2〜第4程度のホルマント成分が強調されることにより、条件の悪い放送設備であってもその音声を明瞭に聴き取ることができる。一方、聴力が衰えた高齢者や難聴者のように特に第2〜第4程度のホルマント成分が聴き取り難い対象者にとっては、全体の音量を上げなくともその音声の内容を明瞭に聴き取ることができる。
ここで、本発明でいう「低次のホルマント以下の低周波数成分と高次のホルマントを超える高周波数成分とを除去した」周波数帯域としては特に限定するものではないが、例えば言語の認識に重要な要素である第2から第4ホルマント、より望ましくは第2から第5ホルマントを含む周波数帯域をいう(以下、同じである)。
第2の発明は、収音されたステレオ信号となる左右音声信号から低次のホルマント以下の低周波数成分と高次のホルマントを超える高周波数成分とを除去する帯域濾波器と、前記左右音声信号の位相を、前記帯域濾波器を通過した音声信号の位相と合うようにそれぞれ補正する一対の位相補正器と、前記帯域濾波器を通過した音声信号を前記各位相補正器を通過した左右音声信号にそれぞれ加算合成して出力する一対の加算合成器とを有することを特徴とする音声処理装置である。このような構成によれば、ステレオ音声の場合であっても、第1の発明と同様に明瞭で聴き取りやすい音声を出力できる。
第3の発明は、第1または第2の発明において、前記帯域濾波器は、分岐した一方の音声信号から低次のホルマント以下の低周波数成分を除去するハイパスフィルターと、前記ハイパスフィルターを通過した音声信号から高次のホルマントを超える高周波数成分を除去するローパスフィルターとからなることを特徴とする音声処理装置である。このような構成によれば、もとの音声信号から言語の識別に重要な第2〜第4程度のホルマント成分のみを確実に抽出することができる。
第4の発明は、第1〜第3の発明において、前記帯域濾波器を通過した合成前の音声信号の値を調整する効果調整器を備えたことを特徴とする音声処理装置である。条件や放送設備の性能などにより、音声の識別に重要な第2〜第4程度のホルマント成分の減衰量は一様ではない。また、聴力が衰えた高齢者や難聴者の場合、第2〜第4程度のホルマント成分の聴取能力には個人差が大きい。そこで、本発明のように効果調整器によって帯域濾波器で抽出した第2〜第4程度のホルマント成分の値を適宜調整(増減)することによって明瞭で且つ違和感のない音声を出力することができる。
第5の発明は、可搬自在な筐体内に、前記第1〜第4のいずれかの音声処理装置を収容すると共に、前記筐体の表面に、収音用のマイクロホンを脱着可能に接続する入力側接続口と、前記音声処理装置で処理した音声信号を放送設備に出力する出力側接続口とを備えた音声明瞭化装置である。このような構成によれば、既存の放送設備に対して本発明装置を簡単に組み込むことが(付設)できるため、低コストで優れた効果を発揮できる。また、持ち運びが容易となるため、屋外のイベント会場の放送設備や他の放送設備にも簡単に適用できる。
第6の発明は、収音された音声信号を分岐する第1のステップと、前記第1のステップで分岐した一方の音声信号から第1ホルマント以下の低周波数成分と高次のホルマントを超える高周波数成分とを除去する第2のステップと、前記第1のステップで分岐した他方の音声信号の位相を、前記第2のステップで処理された音声信号の位相と合うように補正する第3のステップと、前記第2のステップで処理された音声信号と前記第3のステップで処理された音声信号とを合成して出力する第4のステップとを含むことを特徴とする音声処理方法である。このような構成によれば、第1の発明と同様に、明瞭で聴き取りやすい音声を出力できる。
本発明によれば、もとの音声信号から言語の識別に重要な第2〜第4程度のホルマント成分のみを抽出して元の音声信号に加えて出力できるため、健聴者にとっては、条件悪化により減衰した第2〜第4程度のホルマント成分が強調されることにより、条件の悪い放送設備であってもその音声を明瞭に聴き取ることができる。一方、聴力が衰えた高齢者や難聴者のように特に第2〜第4程度のホルマント成分が聴き取り難い対象者にとっては、全体の音量を上げなくともその音声の内容を明瞭に聴き取ることができる。
音声の流れのなかでみられる周波数分析例を示した図である。 音声の流れの中からサンプリングした言語認識の過程を説明した例を示した図である。 感音性難聴におけるVの音声レベルを10dB増加した例を示した図である。 第1ホルマントh1以外のG領域のホルマントを帯域濾波器で抽出し、振幅増幅させた各ホルマントの各高調波成分信号を主音声信号へ加算合成した状態を示した図である。 本発明に係る音声処理装置100の実施の一形態を示した図である。 位相補正器3の回路構成図である。 入力緩衝器2と帯域濾波器30(4、5)の周波数特性図である。 帯域濾波器30(4、5)による位相ずれ特性図である。 位相補正器3が無い場合の位相差Tを示す図である。 位相差による周波数特性図である。 位相変換器3の位相可変範囲を示す図である。 効果調整器6による出力特性を示す図である。 位相補正器3がある場合の同位相加算を示す図である。 既存の有線放送設備の構成を示す図である。 既存の無線放送設備の構成を示す図である。 本発明に係る音声明瞭化装置200の実施の一形態を示した図である。 本発明に係る音声処理装置100の他の実施形態(ステレオ音声)を示した図である。
以下、本発明の実施の形態を添付図面を参照しながら説明する。図1は、音声の流れのなかでみられる周波数分析例を示したものである。前述したように人が言葉を発すると共鳴現象に伴い、ホルマントと称される数次の高調波が同時に放出される。これら数次の高調波のうち、主に母音に影響を与える基本波h1を第1ホルマントといい、次に周波数が高い高調波h2を第2ホルマント、その次に周波数が高い高調波h3を第3ホルマント、その次に周波数が高い高調波h4を第4ホルマントと称されており、以後順に周波数が高い高調波hnを第nホルマントと称されている。そして、高次のホルマントになるほど低いレベルへと減衰するが、このうち第2〜第5程度のホルマント成分が特に言語理解に重要な要素となっていることが判明している。
言語分野における研究によれば、聴覚は各ホルマントを敏感に検出し、また言葉を知覚する能力は幼児期に学習し、記憶しているといわれている。そのため、聴覚から得られた言語情報の一部が欠落していても過去に記憶蓄積された経験で欠落部分が補完され、一般的な日常会話であれば問題にはならないといわれている。
しかしながら、聞こえてきた音を言葉として認識するためには、聴覚が前記のホルマントを検出する必要があるが、もしこれらのホルマントのうち重要なホルマント成分が検出できないと言葉として認識できない。例えば、500Hz〜3kHzの帯域を削除すると言語を全く理解できないという実験結果も報告されている。
音を聴き取り難い難聴は、外耳、中耳の障害による伝音性難聴と、内耳、聴覚神経、脳の障害による感音性難聴と、これらの両方に起因する複合性難聴との3種類に大きく分類される。このうち、軽度の難聴である伝音性難聴の場合は、例えばテレビの音量を大きくしたり、対話者が耳元で話しかけるなどで対応できるが、感音性難聴の場合は、加齢と共に進行し、到来音を大きくしてもただ「ゴホン、ゴホン」という音として聞こえるだけで言葉の内容が理解できない。これは音量を上げても第2ホルマント〜第4ホルマントの中レベルのホルマントを検出する能力が低下してしまったためと考えられる。
また、聴覚には過大音が到達したときにその音の周波数近辺の他の小さな音は検出され難いか、またはある音が別の音に妨害されて聴き取り難いという性質がある。これをマスキング効果といい、過大音に対して脳の自己防衛作用が働くためといわれている。これらの代表例として、例えば大きな会場に設置される放送設備において天井部に埋め込まれたスピーカーから出る音声成分に含まれる低音域の音圧レベルが、天井板によるバッフル効果によって2〜3倍程度に上昇することがある。
この結果、そのスピーカーから出る音声成分のうち、第2ホルマント以上のホルマント成分がマスキングされてしまい放送内容が聴き取れないという事態がしばしば起こる。一方、高齢者の場合では音声検知能力が低下するため、言語の基本波である第1ホルマントの音量が上昇すると第2ホルマント以降のホルマントがマスキングされて言葉が聴き取れなくなってしまう。
以上の考察から言語を正確に伝達するためには、第2ホルマント以上の高調波成分を増幅させてマスキングレベルを超えるようにすることでこれらの難聴の問題を解決できると考える。
図2は、音声の流れの中からサンプリングした言語認識の過程を説明した例を示したものである。横軸は周波数(Hz)、縦軸は音圧(dB)であり、V(ヴイ)という声に含まれるホルマント成分とそのレベルを示している。第1ホルマントh1は最も低い周波数成分(母音)を有しているが、その音圧は最も高いレベルとなっている。以後、第2ホルマントh2〜第nホルマントhnになるに従ってその音圧は徐々に低いレベルに推移している。
この図において、ラインMKは健聴者のマスキング範囲を示し、ラインMK’は難聴者のマスキング範囲を示している。図示するように健聴者のマスキングラインMKはすべてのホルマントより低いため、マスキング効果を受け難くV音声を明瞭に聴き取れるのに対し、難聴者のマスキングラインMK’は、第1ホルマントh1を除く他のホルマントよりも高いため、マスキング効果が著しくV音声を聴き取れることができないことが分かる。
図3は、感音性難聴におけるVの音声レベルを10dB増加した場合を示したものである。図においてh1+〜hn+はそれぞれ各ホルマントh1〜hnをそれぞれ10dB増加したレベルを示しているが、難聴者のマスキングラインMK’は単にそのまま上方向へ平行移動するだけであり、音量を上げただけでは言語の理解は不可能であることが分かる。
図4は、音声認識に重要な要素である、第1ホルマントh1以外のG領域のホルマント(第2ホルマントh2〜第nホルマントhn)を帯域濾波器(バンドパスフィルタ)で抽出し、振幅増幅させた各高調波成分信号ホルマントh2++〜hn++を主音声信号へ加算合成した状態を示したものである。図示するように、このような処理をすれば全てのホルマント成分が難聴者のマスキングラインMK’を上回る結果となって音声Vを理解できることが分かる。
なお、従来の補聴器や集音器は、離れた位置から発生される音声を集めることが主体となっているが、空中を伝播する途中で高次のホルマント成分は周囲の騒音や拡散、空気質量により減衰して言語理解度が著しく阻害されるため、一層複雑な音声処理が必要になると思われる。
本発明の音声処理装置は、発声者の口元の近い距離のマイクロホンで収音された音声、すなわち空気などによる伝搬損失が少なく、言語理解に重要な要素となる高次のホルマント成分が減衰されていない状態のピュアな音声を主な対象とし、その音声から高次のホルマント成分を抽出して元の音声に加算合成すれば、条件の悪い放送設備や難聴者であっても明瞭に音声の内容を聴き取ることが可能となるとの知見のもとに案出されたものである。
図5は、本発明に係る音声処理装置100の実施の一形態を示したものである。図中符号1は収音用のマイクロホン、2はこのマイクロホン1で発声する微小電圧信号を数倍に増幅して効率良く処理するための緩衝増幅器、3はこの緩衝増幅器2で増幅された音声信号の位相を補正する位相補正器、30は同じく緩衝増幅器2で増幅された音声信号のうち低次のホルマント以下の周波数成分と高次のホルマント以上の周波数成分とを除去する帯域濾波器である。
また、図中6はこの帯域濾波器30を通過した音声信号の値を調整する調整器、7はこの調整器7で調整された音声信号を位相補正器3で補正された音声信号に加算合成する加算合成器、8はこの加算合成器で合成された音声信号の出力を調整する出力緩衝器、9は音声信号をマイクロホン1の出力感度に調整するための減衰器、10は出力端子である。
帯域濾波器30は、さらにハイパスフィルター4とローパスフィルター5とから構成されており、ハイパスフィルター4によって音声信号のなかから第1ホルマントh1以下の低周波成分を除去し、ローパスフィルター5によってハイパスフィルター4を通過した音声信号から高次のホルマントを超える高周波数成分を除去して第2ホルマント〜第5ホルマントの周波数成分を抽出するようになっている。
位相補正器3は、図6に示すように入力端子15、入力接地端子16、出力端子17、出力接地端子18、演算増幅器19、コンデンサ、抵抗R、R1、R2とからなる回路構成を有しており、音声信号を後述するように0〜−180度の範囲で任意に位相遅延制御できるようになっている。
以下、このような構成をした音声処理装置100の作用を説明する。図5に示すようにまず発話者の口元で発せられた音声は殆ど減衰することなく直接マイクロホン1で集音されて電気信号(音声信号)に変換されて緩衝増幅器2で数倍に増幅される。増幅された音声信号はその後、分岐してその一方が主音声経路L1を通過して位相補正器3に送られて後述するようにその位相が補正処理される。
他方、副音声経路L2側に送られた音声信号は、帯域濾波器30で第2ホルマント〜第5ホルマントの周波数成分が抽出される。すなわち、この帯域濾波器30のハイパスフィルター4を通過することによって第1ホルマントおよび有害な低周波成分、例えばマイクロホン1に吹き付けられる息などで生ずる風切り音が抑圧された後、ローパスフィルタ−5を通過することによって各部の増幅素子自体の発する耳障りな高周波雑音を抑圧して図7の曲線naで示す一種の広帯域濾波器特性を持たせ改善効果の向上を図っている。
ハイパスフィルター4は、明瞭度合いを任意に設定するため5倍程度の増幅器としての機能を併せ持ち、ローパスフィルタ−5は、さらに言語の認識に対する貢献度の低い超高次のホルマントを含む広域周波数成分を除去することで信号対雑音比性能の特性を改善している。この帯域濾過器30の出力点zの周波数特性を図7の曲線bpで示す。本実施の形態では、この帯域濾過器30の周波数特性は様々な検証テストで設定された400Hz~7kHzの約4オクターブであり、低域、高域ともおよそ−12dB/oct程度で各々遮断している。
この帯域濾過器30を出た音声信号は、効果調整器6でその値が調整されてから、加算合成器7で主音声経路L1側の音声信号に加算合成される。加算合成された音声信号は、出力緩衝器8および減衰器9で適宜その出力が調整された後、出力端子10から既存の放送設備などへ出力される。
ここで、この帯域濾過器30においては図5のx点からの入力信号が図8に示すように音声帯域内で最大90度程度の位相遅れTをもってz点に出力されるという本質的な特性がある。このため、このz点に出力された音声信号を、主音声経路L1を通過する主音声信号にそのまま加算合成器7で合成すると、図9に示すように主音声信号電圧をVx、帯域濾過器30の出力電圧をVzとすると、Vzは位相遅れのため、−Vzと考えられることでVx+(−Vz)=Vkとなり、2信号の電圧差が加算合成器7の出力となる。
この結果、図10に示すようにある周波数域に周波数特性上dなる「深い谷」特性という不感帯を生じてしまい、言語理解上特に重要な第2ホルマントおよび第3ホルマント金パンの音量が極端に小さくなるなどの明瞭度の改善に大きな障害となる不都合が発生する。図9は2音声信号の位相を考慮した場合の加算合成器7における信号の相殺現象を示したものである。
本発明は、このような不感帯を解消するために主音声信号経路L1上に位相補正器3を設け、図13に示すように高次のホルマント抽出のための帯域濾波器30(4、5)で生ずる位相遅れに相当する位相遅延を加えて補正し、補正した音声信号に帯域濾波器30(4、5)を通過した音声信号を加算合成することで不感帯の発生を回避するようにしたものである。
従って、主音声経路L1側に設けられた位相補正器3は、本発明の音声処理装置100を実現する上で重要な役割を担っていると共に大きな特徴となっている。すなわち、図6に示すようにこの位相補正器3を構成する回路では、角周波数はω=1/CRで決定され、0〜−180度の範囲で任意に位相遅延制御が達成できる。ちなみにC及びR値を任意に選択することで利得を一定にしたまま低い周波数帯であっても位相遅れを限りなく0度に近づけることができるという優れた特質があり、その位相特性を図11に示す。
図6において入力端子15から入力された音声信号は演算増幅器19の反転端子(−)に印加されるため、出力端子17には入力された信号とは逆相の反転信号が現れる。一方、同時に入力端子15にはコンデンサCが演算増幅器19の非反転端子(+)へ接続されているが、コンデンサCは周波数よりそのインピーダンスが変化する素子でそのインピーダンスZは1/ωCであることから周波数に反比例し、周波数が高くなるほど内部抵抗(インピーダンス)が低くなるという特性がある。
そのため、高い周波数ほど非反転入力端子への入力信号が増加し、演算増幅器19内部では両方の信号を演算し、非反転側の信号が大きければ出力端子17の信号の位相遅延幅を小さくし、周波数が低くなればインピーダンスが大きくなるため、非反転入力端子への入力信号が小さくなり、出力端子17には大きな遅延幅を持った信号が出力されるのであるが、希望周波数での位相遅延度合いは、抵抗R、コンデンサCの定数で自由に設定が可能になる。なお、この位相補正器3の増幅度はr2/r1で決定され、目的に応じて任意に設定可能であり、常に一定に保つことができる。
そして、図4のG範囲にある言語理解に重要な高次ホルマント成分は効果調整器6により加算合成器に印加され、マスキングラインMK’を超えるように任意に設定することで出力緩衝器8の合成出力t点では、図12(A)〜(C)に示すように周波数対出力レベル曲線は、効果調整器6の設定位置により、「最小位置」、「中央位置」、「最大位置」のように使用場所や難聴者の程度に応じて最適な効果が得られるように自由に選択することができる。
さらに、本発明の音声処理装置100は、出力側に減衰器9を備えることにより、その出力感度をマイクロホン1の出力感度に合わせことが可能となるため、図14や図15に示すような既存の有線及び無線の放送設備に対しても簡単に組み込むことができる。この結果、既存の放送設備に対しては何ら改造や改良を加える必要がなくなり、低コストで優れた館内放送の音質改善効果が得られる。
この場合には、さらに図16に示すように持ち運び(可搬)自在な筐体(金属ケース)33内に、本発明の音声処理装置100を内蔵し、その筐体33の表面に収音用のマイクロホン1を脱着可能に接続する入力側接続口34と、音声処理装置100で処理した音声信号を放送設備に出力する出力側接続口35を設けるような構成としたユニット状の音声明瞭化装置200とすれば、取り付けや取り外しが容易になるだけでなく、持ち運びや収容が簡単にできるため、屋外のイベント会場の放送設備や他の放送設備にも簡単に適用できる。
また、本発明に係る音声処理装置100の他の実施の形態として、図17に示すように主音声経路L1を左右一対設け、各主音声経路L1−R、L1−Lの音声信号を前記と同じように副主音声経路L2で帯域濾過し、その抽出した信号(第2ホルマント〜第5ホルマント)をそれぞれの加算合成器7a、7bで各主音声経路L1−R、L1−Lの音声信号に加算合成すれば、ステレオ音声の場合であっても同様な効果を得ることができる。
すなわち、図17に示すように一対の信号入力端子1a、1bからそれぞれ入力されたステレオ信号となる左右音声信号は、各入力緩衝装置2a、2bで増幅されると共に、後段の動作を正常とするために低インピーダンス出力変換される。各入力緩衝装置2a、2bからでた左右音声信号(ステレオ信号)は、それぞれ各主音声経路L1−R、L1−Lと入力加算器31側に分岐する。
入力加算器31側に分岐した左右音声信号(ステレオ信号)は、ここで合流してから混合緩衝器32でモノラル信号に変換され、ハイパスフィルタ−4とローパスフィルター5を含む帯域濾波器30で増幅されると共に高次のホルマントが抽出されて効果調整器6に送られてその値が調整される。
一方、各主音声経路L1−R、L1−L側を通過する各左右音声信号(ステレオ信号)は、各位相補正器3a、3bで前述したようにその位相が帯域濾波器30で必然的に生ずる位相遅れ分に相当する時間遅れが補正されて同位相となってそれぞれ加算合成器7a、7bにおいて効果調整器6で効果が調整されたモノラル音声信号と加算合成される。その後、各左右音声信号(ステレオ信号)は、それぞれの出力緩衝器8a、8bでインピーダンスが下げられた後、信号出力端子10a、10bから出力されることになる。
一般にテレビ放送の音声はモノラルで放送され、広がり成分は左右のチャンネルにそれぞれ分離して音場を作り出しているため、入力加算器31および混合緩衝器32の出力、すなわち音声成分は広がり成分よりも約6dB程度大きなレベルで帯域濾波器30へと印加される。このため、この音声成分から言語認識に重要な第2ホルマント〜第5ホルマントを抽出してもとのステレオ信号に合成することにより明瞭化を達成することができる。
この結果、聴きやすく明瞭化された音声信号を無線送信装置やTV音声補助装置、音楽再生装置などへ組み込むことで聴力が衰えた高齢者や難聴者であっても明瞭に聴き取ることができ、また、騒音が激しい環境での日常生活で活用することが可能となる。そして、本発明装置100を実際に既存の無線送信装置やTV音声補助装置、音楽再生装置等に組み込んだところ、健聴者と難聴者との日常生活で生ずる障害を除くことが可能となったとのフィールドテスト結果も報告されている。
本発明の音声処理装置100および持ち運びを容易にした音声明瞭化装置200は、既存の放送設備であれば、その殆どに適用可能であり、簡単に優れた音声明瞭化効果を発揮できる。例えば、病院などの呼び出し設備、自治体の非常放送設備、電話機の送話部、無線通信機、音声認識会議システム、イベント会場の案内放送装置、テレビ受像機、ラジオ受信機、公共施設の案内放送設備、高齢者・障害者収容施設の放送設備、学校内放送設備、電車・バスの車内放送、駅・ショッピングセンター・デパート・映画館などの多くの人が集まる場所の館内放送などに簡単に適用でき、優れた音声明瞭化効果が得られる。
本発明の音声処理装置100および音声明瞭化装置200によれば、聴き取り難かった音声が明瞭化されるだけでなく、送話者個人特有の声色を保持できるため、違和感のない自然な音声を生成することができる。
100…音声処理装置
200…音声明瞭化装置
1…マイクロホン
2…入力緩衝装置
3…位相補正器
4…ハイパスフィルター
5…ローパスフィルター
6…効果調整器
7…加算合成器
8…出力緩衝器
9…減衰器
10…音声出力端子
11…音声処理部
12…電力増幅器
13…スピーカ
15…入力端子
16…入力接地端子
17…出力端子
18…出力接地端子
19…演算増幅器
20…本発明装置を搭載した変調器部
21…無線送信部
22…送信用アンテナ又は赤外線発光部
23…受信用アンテナ又は赤外線受光部
24…無線信号受信部
30…帯域濾波器
31…入力加算器
32…混合緩衝器
33…筐体
34…入力側接続口
35…出力側接続口

Claims (2)

  1. 発話者のピュアな音声を集音するマイクロホンと、
    前記マイクロホンで集音された音声信号を分岐し、分岐した一方の音声信号から低次のホルマント以下の低周波数成分と高次のホルマントを超える高周波数成分とを除去する帯域濾波器と、
    前記分岐した他方の音声信号の位相を、前記帯域濾波器を通過した音声信号の位相と合うように補正する位相補正器と、
    前記帯域濾波器を通過した音声信号の各ホルマント成分が周波数マスキングラインを超えるように、当該各ホルマント成分のレベルを調整する効果調整器と、
    前記効果調整器を通過した音声信号を前記位相補正器を通過した音声信号に加算合成して出力する加算合成器とを有し、
    前記帯域濾波器は、分岐した一方の音声信号から400Hz未満の低次のホルマントを含む低周波数成分を除去するハイパスフィルターと、
    前記ハイパスフィルターを通過した音声信号から7kHzを超える高次のホルマントを含む高周波数成分を除去するローパスフィルターとからなることを特徴とする音声処理装置。
  2. 発話者のピュアな音声を集音する第1のステップと、
    前記第1のステップで集音された音声信号を分岐し、分岐した一方の音声信号から低次のホルマント以下の低周波数成分と高次のホルマントを超える高周波数成分とを除去して帯域濾過する第2のステップと、
    前記分岐した他方の音声信号の位相を、前記帯域濾過した一方の音声信号の位相と合うように補正する第3のステップと、
    前記帯域濾過した一方の音声信号の各ホルマント成分が周波数マスキングラインを超えるように、当該各ホルマント成分のレベルを調整する第4のステップと、
    前記前記第4のステップで調整した音声信号を前記第3のステップで位相調整された音声信号に加算合成して出力する第5のステップとを含み、
    前記第2のステップは、分岐した一方の音声信号から400Hz未満の低次のホルマントを含む低周波数成分を除去するハイパスフィルターと、
    前記ハイパスフィルターを通過した音声信号から7kHzを超える高次のホルマントを含む高周波数成分を除去するローパスフィルターとを用いて帯域濾過することを特徴とする音声処理方法。
JP2015074832A 2014-01-17 2015-04-01 音声処理装置及び音声処理方法 Active JP6548938B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014006613A JP2015135267A (ja) 2014-01-17 2014-01-17 電流センサ
JP2014006613 2014-11-27

Publications (2)

Publication Number Publication Date
JP2016110050A JP2016110050A (ja) 2016-06-20
JP6548938B2 true JP6548938B2 (ja) 2019-07-24

Family

ID=53767192

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2014006613A Pending JP2015135267A (ja) 2014-01-17 2014-01-17 電流センサ
JP2015074832A Active JP6548938B2 (ja) 2014-01-17 2015-04-01 音声処理装置及び音声処理方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2014006613A Pending JP2015135267A (ja) 2014-01-17 2014-01-17 電流センサ

Country Status (1)

Country Link
JP (2) JP2015135267A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6673077B2 (ja) * 2016-07-26 2020-03-25 株式会社デンソー 電流センサ
JP6772889B2 (ja) * 2017-02-23 2020-10-21 沖電気工業株式会社 言語明瞭化装置及び拡声放送システム
JP2021117359A (ja) * 2020-01-27 2021-08-10 寿通信機株式会社 音声明瞭化装置および音声明瞭化方法
CN113613152B (zh) * 2021-07-30 2023-06-30 歌尔微电子股份有限公司 微机电***麦克风、麦克风单体及电子设备
US11994541B2 (en) * 2022-04-15 2024-05-28 Allegro Microsystems, Llc Current sensor assemblies for low currents

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4739514A (en) * 1986-12-22 1988-04-19 Bose Corporation Automatic dynamic equalizing
JPH06245299A (ja) * 1993-02-15 1994-09-02 Sony Corp 補聴器
JP2000292455A (ja) * 1999-04-06 2000-10-20 Yazaki Corp 電流検出装置
JP4413480B2 (ja) * 2002-08-29 2010-02-10 富士通株式会社 音声処理装置及び移動通信端末装置
KR20050049103A (ko) * 2003-11-21 2005-05-25 삼성전자주식회사 포만트 대역을 이용한 다이얼로그 인핸싱 방법 및 장치
JP2007295347A (ja) * 2006-04-26 2007-11-08 Mitsubishi Electric Corp 音声処理装置
DE102006062750B4 (de) * 2006-09-15 2010-07-08 Infineon Technologies Ag Vorrichtung zum Erfassen einer Änderung einer physikalischen Grösse mittels einer Stromleiterstruktur
JP4926005B2 (ja) * 2007-11-13 2012-05-09 ソニー・エリクソン・モバイルコミュニケーションズ株式会社 音声信号処理装置及び音声信号処理方法、通信端末
JP5151762B2 (ja) * 2008-07-22 2013-02-27 日本電気株式会社 音声強調装置、携帯端末、音声強調方法および音声強調プログラム
JP2010028663A (ja) * 2008-07-23 2010-02-04 Nec Saitama Ltd 音声レベル調整装置、音声レベル調整方法およびプログラム
JP2011185914A (ja) * 2010-03-04 2011-09-22 Kohshin Electric Corp 電流センサ
JP5577544B2 (ja) * 2010-03-09 2014-08-27 アルプス・グリーンデバイス株式会社 電流センサ
JP5707971B2 (ja) * 2011-01-26 2015-04-30 株式会社リコー 磁気センサ制御装置
JP5747564B2 (ja) * 2011-03-03 2015-07-15 株式会社リコー 電流センサ
JP5986901B2 (ja) * 2012-11-19 2016-09-06 日本電信電話株式会社 音声強調装置、その方法、プログラム及び記録媒体
JP6159570B2 (ja) * 2013-05-08 2017-07-05 日本放送協会 音声強調装置、及びプログラム

Also Published As

Publication number Publication date
JP2015135267A (ja) 2015-07-27
JP2016110050A (ja) 2016-06-20

Similar Documents

Publication Publication Date Title
JP6548938B2 (ja) 音声処理装置及び音声処理方法
US9508335B2 (en) Active noise control and customized audio system
EP2433437B1 (en) Signal enhancement using wireless streaming
CN103959813B (zh) 耳孔可佩戴式声音收集设备,信号处理设备和声音收集方法
CN102293017B (zh) 助听***、助听方法及集成电路
Moore et al. Effect of spatial separation, extended bandwidth, and compression speed on intelligibility in a competing-speech task
US10841688B2 (en) Annoyance noise suppression
US8588445B2 (en) Hearing aid processing apparatus, adjustment apparatus, hearing aid processing system, hearing aid processing method, and program and integrated circuit thereof
US9420382B2 (en) Binaural source enhancement
JP6177480B1 (ja) 音声強調装置、音声強調方法、及び音声処理プログラム
Wolfe et al. Evaluation of speech recognition with personal FM and classroom audio distribution systems.
US20200045482A1 (en) Methods for hearing-assist systems in various venues
Blamey et al. Improving speech intelligibility in background noise with an adaptive directional microphone
CN103517193A (zh) 用于耳鸣缓解的声音富集***
JP2006087018A (ja) 音響処理装置
Westermann et al. The effect of nearby maskers on speech intelligibility in reverberant, multi-talker environments
JP5046233B2 (ja) 音声強調処理装置
Courtois Spatial hearing rendering in wireless microphone systems for binaural hearing aids
JP2021117359A (ja) 音声明瞭化装置および音声明瞭化方法
Kulkarni et al. Optimizing the comb filters for spectral splitting of speech to reduce the effect of spectral masking
JP2002062886A (ja) 感度調整機能を有する音声受信装置
JP2011010246A (ja) 音声変調器および音声データ変調器
JP3212866U (ja) 音声再生装置
CN207665193U (zh) 立体声前级会议广播功放
Schum The audiology in Agil

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20160407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20160407

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20161005

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170731

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180710

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190618

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190626

R150 Certificate of patent or registration of utility model

Ref document number: 6548938

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250