WO2023119416A1

WO2023119416A1 - 雑音抑圧装置、雑音抑圧方法、プログラム

Info

Publication number: WO2023119416A1
Application number: PCT/JP2021/047310
Authority: WO
Inventors: 伸村田; 洋平脇阪; 記良鎌土; 弘章伊藤
Original assignee: 日本電信電話株式会社
Priority date: 2021-12-21
Filing date: 2021-12-21
Publication date: 2023-06-29

Abstract

ユーザの周囲の雑音を抑圧する処理の実行中であってもユーザが認識する必要がある特定のイベントが生じている場合にはユーザに当該イベントが生じていることを認識させることができる雑音抑圧技術を提供する。雑音抑圧装置は、ユーザの周囲の雑音に所定のイベントに由来する音（以下、イベント音という）が含まれる場合、前記ユーザに前記イベントが生じていることを認識させる。

Description

雑音抑圧装置、雑音抑圧方法、プログラム

　本発明は、アクティブノイズコントロール技術に関する。

　アクティブノイズコントロール技術は、ユーザの周囲など特定の位置での雑音を抑圧する技術であり、例えば車に組み込むことにより、車外部からの音を抑圧し、車中で例えば通話音声や音楽などの所望の音がユーザに聴こえるようにする。アクティブノイズコントロール技術では、雑音を収音する参照マイク、ユーザの位置での音を収音する誤差マイク、参照マイクの出力である雑音信号と誤差マイクの出力である誤差信号から雑音を消去するための消去音信号を生成する雑音抑圧装置、消去音信号に基づく音（以下、消去音という）を放音するスピーカを含むシステムが一般的に用いられている（非特許文献１参照）。当該システムでは、参照マイクで収音した雑音がどの程度抑圧されているかをユーザ付近に設置した誤差マイクにより計測しながら、スピーカにどのような消去音を放音させれば雑音が抑圧できるかを決定する動作を繰り返す。

梶川嘉延, "アクティブノイズコントロールの最近の話題と応用," 情報処理学会研究報告, Vol.2015-MUS-107, No.3, pp.1-6, 2015.

　しかし、外部からの音を完全に遮断してしまうと、ユーザにとって不都合な事態が生じてしまうこともある。例えば運転中に緊急車両のサイレンも遮断してしまうと、緊急車両の接近に気づくことができない、あるいは気づくのが遅れてしまうなどの事態が生じてしまう。そこで、外部からの音のすべてを遮断してしまうのではなく、外部の状況を認識するために必要な音についてはユーザが気づくことができるようにするのが好ましい。

　そこで本発明では、ユーザの周囲の雑音を抑圧する処理の実行中であってもユーザが認識する必要がある特定のイベントが生じている場合にはユーザに当該イベントが生じていることを認識させることができる雑音抑圧技術を提供することを目的とする。

　本発明の一態様は、ユーザの周囲の雑音に所定のイベントに由来する音（以下、イベント音という）が含まれる場合、前記ユーザに前記イベントが生じていることを認識させる。

　本発明によれば、ユーザの周囲の雑音を抑圧する処理の実行中であってもユーザが認識する必要がある特定のイベントが生じている場合にはユーザに当該イベントが生じていることを認識させることが可能となる。

雑音抑圧装置１００の構成を示すブロック図である。雑音抑圧装置１００の動作を示すフローチャートである。雑音抑圧装置２００の構成を示すブロック図である。雑音抑圧装置２００の動作を示すフローチャートである。本発明の実施形態における各装置を実現するコンピュータの機能構成の一例を示す図である。

　以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。

＜第１実施形態＞
　雑音抑圧装置１００は、ユーザの周囲の雑音に所定のイベントに由来する音（以下、イベント音という）が含まれる場合、ユーザにイベントが生じていることを認識させる。

　以下、図１～図２を参照して、雑音抑圧装置１００を説明する。図１は、雑音抑圧装置１００の構成を示すブロック図である。図２は、雑音抑圧装置１００の動作を示すフローチャートである。図１に示すように雑音抑圧装置１００は、状況識別結果生成部１１０と、通知信号生成部１２０と、消去音信号生成部１３０と、記録部１９０を含む。記録部１９０は、雑音抑圧装置１００の処理に必要な情報を適宜記録する構成部である。

　雑音抑圧装置１００は、ユーザの周囲の状況を識別するために用いるデータ（以下、センサデータという）を取得するために１以上のセンサ（図示しない）と接続する。センサとして、例えば、マイク、カメラ、振動検知用センサを用いることができる。つまり、ユーザの周囲の音、映像、振動を用いてユーザの周囲の状況を識別する。また、雑音抑圧装置１００は、ユーザにイベントが生じていることを認識させるために状況提示装置（図示しない）と接続する。状況提示装置として、例えば、スピーカ、ディスプレイ、携帯電話やスマートホンのようなモバイル端末を用いることができる。つまり、音、画像、振動を用いてユーザにイベントが生じていることを認識させる。

　雑音抑圧装置１００は、ユーザの周囲の雑音を取得するために１以上のマイク（図示しない、以下、参照マイクという）と、ユーザの受聴音を取得するために１以上のマイク（図示しない、以下、誤差マイクという）と接続する。また、雑音抑圧装置１００は、消去音信号に基づく音、すなわち消去音を放音するために１以上のスピーカ（図示しない）と接続する。

　図２に従い雑音抑圧装置１００の動作について説明する。

　Ｓ１１０において、状況識別結果生成部１１０は、センサを用いて取得したセンサデータを入力とし、センサデータを用いてユーザの周囲においてイベントが生じているか否かを示す状況識別結果を生成し、出力する。例えばセンサデータが踏切音である場合、状況識別結果生成部１１０は、既存の音声認識技術を用いて、ユーザに踏切に電車が近づいていることを示す状況識別結果を生成する。また、例えばセンサデータが踏切が遮断する様子の映像や画像である場合、状況識別結果生成部１１０は、既存の画像認識技術を用いて、ユーザに踏切に電車が近づいていることを示す状況識別結果を生成する。また、例えば振動検知センサが突発的な振動があったことを検知した場合、状況識別結果生成部１１０は、ユーザに障害物に衝突した可能性があることを示す状況識別結果を生成する。

　状況識別結果生成部１１０は、例えば、所定のイベントに由来する音を判定するための基準音とユーザの周囲の雑音との相関の程度を示す値を計算し、当該値が所定の閾値より大きいあるいは所定の閾値以上である場合は、ユーザの周囲においてイベントが生じていることを示す状況識別結果を生成し、それ以外の場合は、ユーザの周囲においてイベントが生じていないことを示す状況識別結果を生成する。なお、当該基準音は、予め記録部１９０に記録しておくのでよい。

　Ｓ１２０において、通知信号生成部１２０は、Ｓ１１０で生成した状況識別結果を入力とし、状況識別結果がユーザの周囲においてイベントが生じていることを示すものである場合、ユーザにイベントが生じていることを知らせる通知信号を生成し、出力する。状況提示装置は、Ｓ１２０で生成した通知信号を入力とし、通知信号に基づいてユーザに通知内容を提示する。状況提示装置がスピーカである場合は、通知信号はユーザにイベントが生じていることを知らせる通知音の信号である。また、状況提示装置がディスプレイである場合は、通知信号はユーザにイベントが生じていることを知らせる通知映像の信号である。状況提示装置がモバイル端末である場合は、通知信号はユーザにイベントが生じていることを知らせる通知振動の信号である。

　Ｓ１３０において、消去音信号生成部１３０は、１以上の参照マイクを用いて取得したユーザの周囲の雑音信号と１以上の誤差マイクを用いて取得したユーザの受聴音信号とを入力とし、雑音信号と受聴音信号とから、雑音を消去する消去音信号を生成し、出力する。スピーカは、Ｓ１３０で生成した消去音信号を入力とし、消去音信号に基づく音を放音する。

　なお、消去音信号生成部１３０は、雑音信号を用いることなく、消去音信号を生成することもできる。この場合、Ｓ１３０において、消去音信号生成部１３０は、１以上の誤差マイクを用いて取得したユーザの受聴音信号を入力とし、受聴音信号から、雑音を消去する消去音信号を生成し、出力する。

　本発明の実施形態によれば、ユーザの周囲の雑音を抑圧する処理の実行中であってもユーザが認識する必要がある特定のイベントが生じている場合にはユーザに当該イベントが生じていることを認識させることが可能となる。

＜第２実施形態＞
　雑音抑圧装置２００は、ユーザの周囲の雑音に所定のイベントに由来する音（以下、イベント音という）が含まれる場合、ユーザにイベントが生じていることを認識させる。

　以下、図３～図４を参照して、雑音抑圧装置２００を説明する。図３は、雑音抑圧装置２００の構成を示すブロック図である。図４は、雑音抑圧装置２００の動作を示すフローチャートである。図３に示すように雑音抑圧装置２００は、状況識別結果生成部２１０と、調整情報生成部２２０と、消去音信号生成部２３０と、記録部２９０を含む。記録部２９０は、雑音抑圧装置２００の処理に必要な情報を適宜記録する構成部である。

　雑音抑圧装置２００は、雑音抑圧装置１００と同様、ユーザの周囲の状況を識別するために用いるデータ（以下、センサデータという）を取得するために１以上のセンサ（図示しない）と接続する。

　雑音抑圧装置２００は、雑音抑圧装置１００と同様、ユーザの周囲の雑音を取得するために１以上のマイク（図示しない、以下、参照マイクという）と、ユーザの受聴音を取得するために１以上のマイク（図示しない、以下、誤差マイクという）と接続する。また、雑音抑圧装置２００は、雑音抑圧装置１００と同様、消去音信号に基づく音、すなわち消去音を放音するために１以上のスピーカ（図示しない）と接続する。

　図４に従い雑音抑圧装置２００の動作について説明する。

　Ｓ２１０において、状況識別結果生成部２１０は、センサを用いて取得したセンサデータを入力とし、センサデータを用いてユーザの周囲においてイベントが生じている確からしさを示す状況識別結果を生成し、出力する。状況識別結果の値は、ユーザの周囲においてイベントが生じていることを示す値と生じていないことを示す値との二値であってもよいし、所定のイベントに由来する音を判定するための基準音とユーザの周囲の雑音との相関の程度を示す値であってもよい。なお、当該基準音は、予め記録部２９０に記録しておくのでよい。状況識別結果の値が上記二値である場合、状況識別結果生成部２１０は、例えば、所定のイベントに由来する音を判定するための基準音とユーザの周囲の雑音との相関の程度を示す値を計算し、当該値が所定の閾値より大きいあるいは所定の閾値以上である場合は、ユーザの周囲においてイベントが生じていることを示す状況識別結果を生成し、それ以外の場合は、ユーザの周囲においてイベントが生じていないことを示す状況識別結果を生成する。また、状況識別結果の値が上記相関の程度を示す値である場合、状況識別結果生成部２１０は、例えば、所定のイベントに由来する音を判定するための基準音とユーザの周囲の雑音との相関の程度を示す値を計算し、当該相関の程度を示す値を状況識別結果とする。

　Ｓ２２０において、調整情報生成部２２０は、Ｓ２１０で生成した状況識別結果を入力とし、状況識別結果の値に応じて決定される雑音を消去する消去音に対するイベント音を消去するイベント音消去音の相対的な大きさに関する情報（以下、調整情報という）を生成し、出力する。状況識別結果の値がユーザの周囲においてイベントが生じていることを示す値と生じていないことを示す値との二値である場合、状況識別結果の値がユーザの周囲においてイベントが生じていることを示す値であるときは、調整情報生成部２２０は、消去音からイベント音消去音を除外することを示す情報を調整情報として生成する。また、状況識別結果の値が所定のイベントに由来する音を判定するための基準音とユーザの周囲の雑音との相関の程度を示す値である場合、調整情報生成部２２０は、状況識別結果の値が大きいほど、消去音からイベント音消音を除外する割合が大きくなるようにすることを示す情報を調整情報として生成する。

　例えばセンサデータが踏切が遮断しているか否かを判別するための映像や画像である場合、状況識別結果生成部２１０は、既存の画像認識技術を用いて、ユーザに踏切に電車が近づいていることを示す値とユーザに踏切に電車が近づいていないことを示す値との二値の状況識別結果を生成する。状況識別結果がユーザに踏切に電車が近づいていることを示す値である場合、調整情報生成部２２０は、踏切音に相当する特定の周波数帯の音を消去する音をイベント音消去音として、消去音からイベント音消去音を除外することを示す情報を調整情報として生成する。

　Ｓ２３０において、消去音信号生成部２３０は、１以上の参照マイクを用いて取得したユーザの周囲の雑音信号と１以上の誤差マイクを用いて取得したユーザの受聴音信号とＳ２２０で生成した調整情報とを入力とし、雑音信号と受聴音信号と調整情報とから、雑音を消去する消去音信号を生成し、出力する。スピーカは、Ｓ２３０で生成した消去音信号を入力とし、消去音信号に基づく音を放音する。

　なお、消去音信号生成部２３０は、雑音信号を用いることなく、消去音信号を生成することもできる。この場合、Ｓ２３０において、消去音信号生成部２３０は、１以上の誤差マイクを用いて取得したユーザの受聴音信号とＳ２２０で生成した調整情報とを入力とし、受聴音信号と調整情報とから、雑音を消去する消去音信号を生成し、出力する。

＜補記＞
　図５は、上述の各装置を実現するコンピュータ２０００の機能構成の一例を示す図である。上述の各装置における処理は、記録部２０２０に、コンピュータ２０００を上述の各装置として機能させるためのプログラムを読み込ませ、制御部２０１０、入力部２０３０、出力部２０４０などに動作させることで実施できる。

　本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置（例えば通信ケーブル）が接続可能な通信部、ＣＰＵ（Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい）、メモリであるＲＡＭやＲＯＭ、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、ＣＰＵ、ＲＡＭ、ＲＯＭ、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、ＣＤ－ＲＯＭなどの記録媒体を読み書きできる装置（ドライブ）などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。

　ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている（外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるＲＯＭに記憶させておくこととしてもよい）。また、これらのプログラムの処理によって得られるデータなどは、ＲＡＭや外部記憶装置などに適宜に記憶される。

　ハードウェアエンティティでは、外部記憶装置（あるいはＲＯＭなど）に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にＣＰＵで解釈実行・処理される。その結果、ＣＰＵが所定の機能（上記、…部、…手段などと表した各構成部）を実現する。

　本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。

　既述のように、上記実施形態において説明したハードウェアエンティティ（本発明の装置）における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。

　この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、ＤＶＤ（Digital Versatile Disc）、ＤＶＤ－ＲＡＭ（Random Access Memory）、ＣＤ－ＲＯＭ（Compact Disc Read Only Memory）、ＣＤ－Ｒ（Recordable）／ＲＷ（ReWritable）等を、光磁気記録媒体として、ＭＯ（Magneto-Optical disc）等を、半導体メモリとしてＥＥＰ－ＲＯＭ（Electronically Erasable and Programmable-Read Only Memory）等を用いることができる。

　また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ－ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

　このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

　また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

　上述の本発明の実施形態の記載は、例証と記載の目的で提示されたものである。網羅的であるという意思はなく、開示された厳密な形式に発明を限定する意思もない。変形やバリエーションは上述の教示から可能である。実施形態は、本発明の原理の最も良い例証を提供するために、そして、この分野の当業者が、熟考された実際の使用に適するように本発明を色々な実施形態で、また、色々な変形を付加して利用できるようにするために、選ばれて表現されたものである。すべてのそのような変形やバリエーションは、公正に合法的に公平に与えられる幅にしたがって解釈された添付の請求項によって定められた本発明のスコープ内である。

Claims

　ユーザの周囲の雑音に所定のイベントに由来する音（以下、イベント音という）が含まれる場合、前記ユーザに前記イベントが生じていることを認識させる
　雑音抑圧装置。
　請求項１に記載の雑音抑圧装置であって、
　センサを用いて取得したセンサデータから、前記ユーザの周囲において前記イベントが生じているか否かを示す状況識別結果を生成する状況識別結果生成部と、
　前記状況識別結果が前記ユーザの周囲において前記イベントが生じていることを示すものである場合、前記ユーザに前記イベントが生じていることを知らせる通知信号を生成する通知信号生成部と、
　１以上のマイクを用いて取得した前記ユーザの受聴音信号とから、前記雑音を消去する消去音信号を生成する消去音信号生成部とを含む
　ことを特徴とする雑音抑圧装置。
　請求項１に記載の雑音抑圧装置であって、
　センサを用いて取得したセンサデータから、前記ユーザの周囲において前記イベントが生じている確からしさを示す状況識別結果を生成する状況識別結果生成部と、
　前記状況識別結果の値に応じて決定される前記雑音を消去する消去音に対する前記イベント音を消去するイベント音消去音の相対的な大きさに関する情報（以下、調整情報という）を生成する調整情報生成部と、
　１以上のマイクを用いて取得した前記ユーザの受聴音信号と前記調整情報とから、前記雑音を消去する消去音信号を生成する消去音信号生成部とを含む
　ことを特徴とする雑音抑圧装置。
　請求項３に記載の雑音抑圧装置であって、
　前記状況識別結果の値は、前記ユーザの周囲において前記イベントが生じていることを示す値と生じていないことを示す値との二値であり、
　前記調整情報は、前記状況識別結果の値が前記ユーザの周囲において前記イベントが生じていることを示す値である場合、前記消去音から前記イベント音消去音を除外することを示す情報である
　ことを特徴とする雑音抑圧装置。
　請求項３に記載の雑音抑圧装置であって、
　前記状況識別結果の値は、所定のイベントに由来する音を判定するための基準音と前記雑音との相関の程度を示す値であり、
　前記調整情報は、前記状況識別結果の値が大きいほど、前記消去音から前記イベント音消音を除外する割合が大きくなるようにすることを示す情報である
　ことを特徴とする雑音抑圧装置。
　ユーザの周囲の雑音に所定のイベントに由来する音（以下、イベント音という）が含まれる場合、前記ユーザに前記イベントが生じていることを認識させる
　雑音抑圧方法。
　請求項１ないし５のいずれか１項に記載の雑音抑圧装置としてコンピュータを機能させるためのプログラム。