JP2016126335A - 区画別音声抑制を有する音区画設備 - Google Patents

区画別音声抑制を有する音区画設備 Download PDF

Info

Publication number
JP2016126335A
JP2016126335A JP2015247316A JP2015247316A JP2016126335A JP 2016126335 A JP2016126335 A JP 2016126335A JP 2015247316 A JP2015247316 A JP 2015247316A JP 2015247316 A JP2015247316 A JP 2015247316A JP 2016126335 A JP2016126335 A JP 2016126335A
Authority
JP
Japan
Prior art keywords
signal
sound
masking
microphone
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015247316A
Other languages
English (en)
Inventor
クリストフ マルクス
Markus Christoph
クリストフ マルクス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harman Becker Automotive Systems GmbH
Original Assignee
Harman Becker Automotive Systems GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harman Becker Automotive Systems GmbH filed Critical Harman Becker Automotive Systems GmbH
Publication of JP2016126335A publication Critical patent/JP2016126335A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K3/00Jamming of communication; Counter-measures
    • H04K3/40Jamming having variable characteristics
    • H04K3/43Jamming having variable characteristics characterized by the control of the jamming power, signal-to-noise ratio or geographic coverage area
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/1752Masking
    • G10K11/1754Speech masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K3/00Jamming of communication; Counter-measures
    • H04K3/80Jamming or countermeasure characterized by its function
    • H04K3/82Jamming or countermeasure characterized by its function related to preventing surveillance, interception or detection
    • H04K3/825Jamming or countermeasure characterized by its function related to preventing surveillance, interception or detection by jamming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K3/00Jamming of communication; Counter-measures
    • H04K3/80Jamming or countermeasure characterized by its function
    • H04K3/84Jamming or countermeasure characterized by its function related to preventing electromagnetic interference in petrol station, hospital, plane or cinema
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/301Automatic calibration of stereophonic sound system, e.g. with test microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/10Applications
    • G10K2210/128Vehicles
    • G10K2210/1282Automobiles
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/30Means
    • G10K2210/301Computational
    • G10K2210/3046Multiple acoustic inputs, multiple acoustic outputs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/30Means
    • G10K2210/321Physical
    • G10K2210/3213Automatic gain control [AGC]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/30Means
    • G10K2210/321Physical
    • G10K2210/3216Cancellation means disposed in the vicinity of the source
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K2203/00Jamming of communication; Countermeasures
    • H04K2203/10Jamming or countermeasure used for a particular application
    • H04K2203/12Jamming or countermeasure used for a particular application for acoustic communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K2203/00Jamming of communication; Countermeasures
    • H04K2203/30Jamming or countermeasure characterized by the infrastructure components
    • H04K2203/34Jamming or countermeasure characterized by the infrastructure components involving multiple cooperating jammers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K3/00Jamming of communication; Counter-measures
    • H04K3/40Jamming having variable characteristics
    • H04K3/45Jamming having variable characteristics characterized by including monitoring of the target or target signal, e.g. in reactive jammers or follower jammers for example by means of an alternation of jamming phases and monitoring phases, called "look-through mode"

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Chemical & Material Sciences (AREA)
  • Electromagnetism (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Public Health (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Otolaryngology (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

【課題】区画別音声抑制を有する音区画設備を提供する。
【解決手段】受聴者の位置及び話者の位置を含む室101と、室内に配置された多数のラウドスピーカ102と、室内に配置された少なくとも1つのマイクロホン103と、多数のラウドスピーカ及び少なくとも1つのマイクロホンに接続され、多数のラウドスピーカと関連して、第1の音区画を受聴者の位置の周囲に確立し、第2の音区画を話者の位置の周囲に確立し、少なくとも1つのマイクロホンと関連して、第1の音区画内に存在する音の状態のパラメータを決定し、かつ多数のラウドスピーカと関連して、かつ、第1の音区画内の決定された音の状態に基づいて、第1の音区画内の共通音声了解度を低減するように構成された音声マスキング音を第1の音区画内に生成するように構成された、信号処理モジュール104とを備える。
【選択図】図1

Description

本開示は、少なくとも2つの音区画間に音声抑制を有する音区画設備に関する。
能動ノイズ制御は、無用な音波と破壊的に干渉する音波すなわち「アンチノイズ」を生成するために使用され得る。破壊的に干渉する音波は、無用なノイズを消去するために、ラウドスピーカを通して生成されて無用な音波と結合し得る。破壊的に干渉する音波と無用音波との結合により、聴音空間内での1人以上の受聴者による無用な音波の感知を排除または最小化し得る。
能動ノイズ制御システムは概して、破壊的干渉の目標となる領域内の音を検出するための1つ以上のマイクロホンを含む。検出された音は、フィードバック用の誤り信号として使用される。誤り信号は、能動ノイズ制御システムに含まれる適応フィルタを調節するために使用される。このフィルタは、破壊的に干渉する音波を作成するために使用されるアンチノイズ信号を生成する。このフィルタは、音区画と呼ばれるある特定の領域内、または完全消去の場合、静穏区画の標的に従って消去を最適化するために、破壊的に干渉する音波を調節するように調節される。特に、車両内部のように特に隙間なく配置された音区画では、音声面で、消去を最適化、即ち、音響的に完全に分離された音区画を確立する上で、より困難な結果になり得る。多くの場合、一音区画内の受聴者は、別の音区画で話している人に、その話している人がその別の人が加わることを意図しないまたは望まない場合でも、耳を傾けることが可能である。例えば、車両の後部座席(または運転手の座席)の人は、運転手の座席(または後部座席)の別の人を関与させることなく、内緒の通話をしたいと思う。したがって、室内の少なくとも2つの音区画間での音声抑制を最適化するためのニーズが存在する。
音区画設備は、受聴者の位置及び話者の位置を含む室と、室内に配置された多数のラウドスピーカと、室内に配置された多数のマイクロホンと、信号処理モジュールとを含む。信号処理モジュールは、多数のラウドスピーカ及び多数のマイクロホンに接続される。信号処理モジュールは、多数のラウドスピーカと関連して、第1の音区画を受聴者の位置の周囲に確立し、第2の音区画を話者の位置の周囲に確立し、多数のマイクロホンと関連して、第1の音区画内に存在する音の状態のパラメータを決定するように構成される。信号処理モジュールは、多数のラウドスピーカと関連して、かつ第1の音区画内の決定された音の状態に基づいて、第2の音区画内の共通音声了解度を低減するように構成された音声マスキング音を第1の音区画内に生成するように更に構成される。
受聴者の位置及び話者の位置を含む室内に、室内に配置された多数のラウドスピーカ及び室内に配置された多数のマイクロホンにより音区画を配設する方法は、多数のラウドスピーカと関連して、第1の音区画を受聴者の位置の周囲に確立し、第2の音区画を話者の位置の周囲に確立することと、第1の音区画内に存在する音の状態のパラメータを、多数のマイクロホンと関連して決定することとを含む。本方法は、多数のラウドスピーカと関連して、かつ第1の音区画内の決定された音の状態に基づいて、第2の音区画内の共通音声了解度を低減するように構成される音声マスキング音を第1の音区画内に生成することを更に含む。
以下の詳細な説明及び図面を検討すれば、他のシステム、方法、特徴、及び利点も当業者にとって明らかでありまたは明らかなものとなるであろう。そのような追加のシステム、方法、特徴、及び利点の全ては、本詳細な説明内、本発明の適用範囲内に含まれ、以下の特許請求の範囲により保護されることが意図されている。
たとえば、本願発明は以下の項目を提供する。
(項目1)
受聴者の位置及び話者の位置を含む室と、
上記室内に配置された多数のラウドスピーカと、
上記室内に配置された少なくとも1つのマイクロホンと、
上記多数のラウドスピーカ及び上記少なくとも1つのマイクロホンに接続された信号処理モジュールであって、
上記多数のラウドスピーカと関連して、第1の音区画を上記受聴者の位置の周囲に確立し、第2の音区画を上記話者の位置の周囲に確立し、
上記少なくとも1つのマイクロホンと関連して、上記第1の音区画内に存在する音の状態のパラメータを決定し、かつ
上記多数のラウドスピーカと関連して、かつ上記第1の音区画内の上記決定された音の状態に基づいて、上記第1の音区画内の共通音声了解度を低減するように構成された音声マスキング音を上記第1の音区画内に生成する、
ように構成された、上記信号処理モジュールと、
を備える、音区画設備。
(項目2)
上記信号処理モジュールは、上記第1の音区画内の上記音の状態を表す少なくとも1つの信号を受信し、かつ上記第1の音区画内の上記音の状態を表す上記信号ならびに心理音響マスキングモデル及び共通音声了解度モデルのうちの少なくとも1つに基づいて音声マスキング信号を提供するように構成された、マスキング信号計算モジュールを備える、上記項目に記載の上記音区画設備。
(項目3)
上記信号処理モジュールは、上記音声マスキング信号を受信し、及び上記多数のラウドスピーカと関連して、かつ上記音声マスキング信号に基づいて、上記音声マスキング音を上記第1の音区画内に生成するように構成された、多入力多出力システムを備える、上記項目のいずれかに記載の上記音区画設備。
(項目4)
上記多数のラウドスピーカは、指向性ラウドスピーカ、能動ビームフォーマを有するラウドスピーカ、近接場ラウドスピーカ、及び音響レンズを有するラウドスピーカのうちの少なくとも1つを備える、上記項目のいずれかに記載の上記音区画設備。
(項目5)
上記信号処理モジュールは、上記少なくとも1つのマイクロホンに接続されて、少なくとも1つのマイクロホン信号を受信する音響エコー消去モジュールを備え、上記エコー消去モジュールは、少なくとも上記音声マスキング信号を更に受信するように構成され、かつ上記第1の音区画内の上記音の状態を決定するための、上記少なくとも1つのマイクロホン信号に含まれる少なくとも上記音声マスキング信号の上記音響エコーの推定を表す、少なくともある信号を提供するように構成される、上記項目のいずれかに記載の上記音区画設備。
(項目6)
上記信号処理モジュールは、
上記マイクロホン信号に含まれる音声信号を推定するように、かつ上記推定された音声信号を表す信号を提供するように構成されたノイズ低減モジュールと、
上記推定された音声信号を表す上記信号を受信するように、かつ上記推定された音声信号に更に基づいて上記第1の音区画内の上記音の状態を表す上記信号を生成するように構成された利得計算モジュールと、
を更に備える、上記項目のいずれかに記載の上記音区画設備。
(項目7)
上記信号処理モジュールは、上記マイクロホン信号に含まれる周囲ノイズ信号を推定するように、かつ上記推定されたノイズ信号を表す信号を提供するように構成されたノイズ推定モジュールと、
上記推定されたノイズ信号を表す上記信号を受信するように、かつ上記推定されたノイズ信号に更に基づいて上記第1の音区画内の上記音の状態を表す上記信号を生成するように構成された利得計算モジュールと、を更に備える、上記項目のいずれかに記載の上記音区画設備。
(項目8)
上記第2の音区画内の上記話者は、ハンズフリーの通信端末を介して遠隔話者と通信する近接話者であり、
上記信号処理モジュールは、音を上記通信端末から上記第1の音区画ではなく上記第2の音区画に向けるように更に構成される、上記項目のいずれかに記載の上記音区画設備。
(項目9)
受聴者の位置及び話者の位置を含む室内に、上記室内に配置された多数のラウドスピーカ及び上記室内に配置された少なくとも1つのマイクロホンにより音区画を配設する方法であって、
上記多数のラウドスピーカと関連して、第1の音区画を上記受聴者の位置の周囲に確立し、第2の音区画を上記話者の位置の周囲に確立することと、
上記少なくとも1つのマイクロホンと関連して、上記第1の音区画内に存在する音の状態のパラメータを決定することと、
上記多数のラウドスピーカと関連して、かつ上記第1の音区画内の上記決定された音の状態に基づいて、上記第1の音区画内の共通音声了解度を低減するように構成される音声マスキング音を上記第1の音区画内に生成することと、
を含む、上記方法。
(項目10)
上記第1の音区画内の上記音の状態を表す上記信号、ならびに心理音響マスキングモデル及び共通音声了解度モデルのうちの少なくとも1つに基づいて、音声マスキング信号を提供することを更に含む、上記項目に記載の上記方法。
(項目11)
上記音区画を確立することに関して、
上記音声マスキング信号を多入力多出力システムで処理して、上記多数のラウドスピーカと関連して、かつ上記音声マスキング信号に基づいて、上記音声マスキング音を上記第1の音区画内に生成することと、
指向性ラウドスピーカ、能動ビームフォーマを有するラウドスピーカ、近接場ラウドスピーカ、及び音響レンズを有するラウドスピーカのうちの少なくとも1つを採用することと、の少なくとも1つを更に含む、上記項目のいずれかに記載の上記方法。
(項目12)
少なくとも上記音声マスキング信号に基づいて、上記マイクロホン信号に含まれる少なくとも上記音声マスキング信号の上記音響エコーの推定を表す少なくとも1つの信号を生成することと、
上記マイクロホン信号に含まれる少なくとも上記音声マスキング信号の上記エコーの上記推定に基づいて、上記第1の音区画内の上記音の状態を表す上記信号を生成することと、を更に含む、上記項目のいずれかに記載の上記方法。
(項目13)
上記マイクロホン信号に含まれる音声信号を推定して、上記推定された音声信号を表す信号を提供することと、
上記推定された音声信号に更に基づいて、上記第1の音区画内の上記音の状態を表す上記信号を生成することと、
を更に含む、上記項目のいずれかに記載の上記方法。
(項目14)
上記マイクロホン信号に含まれる周囲ノイズ信号を推定して、上記推定されたノイズ信号を表す信号を提供することと、
上記推定されたノイズ信号に更に基づいて、上記第1の音区画内の上記音の状態を表す上記信号を生成することと、
を更に含む、上記項目のいずれかに記載の上記方法。
(項目15)
上記第2の音区画内の上記話者は、ハンズフリーの通信端末を介して遠隔話者に通信をする近接話者であり、上記方法は、
音を上記通信端末から上記第1の音区画ではなく上記第2の音区画に向けることを更に含む、上記項目のいずれかに記載の上記方法。
(摘要)
受聴者の位置及び話者の位置を含む室内に、室内に配置された多数のラウドスピーカ及び室内に配置された多数のマイクロホンにより音区画を配設するための、システム及び方法は、多数のラウドスピーカと関連して、第1の音区画を受聴者の位置の周囲に確立し、第2の音区画を話者の位置の周囲に確立することと、複数のマイクロホンと関連して、第1の音区画内に存在する音の状態のパラメータを決定することとを含む。本方法は、多数のラウドスピーカと関連して、かつ第1の音区画内の決定された音の状態に基づいて、第2の音区画内の共通音声了解度を低減するように構成される音声マスキング音を第1の音区画内に生成することを更に含む。
本システムは、以下の説明及び図面を参照することでよりよく理解され得る。図中の構成部品は必ずしも正確な縮尺率で書かれたわけではなく、発明の原理の説明に強調が置かれている。また、図中で、類似の参照番号は、異なる図面全体を通して対応する部品を示す。
少なくとも1つの音区画に音声抑制を有する例示の音区画設備を示すブロック図である。 音区画が配設される例示の車両内部の平面図である。 図1に示した設備に適用可能な音響エコー消去(AEC)モジュールの入力及び出力を示す概略図である。 図3に示したAECモジュールの構成を示すブロック図である。 図1に示した設備に適用可能なノイズ推定モジュールの入力及び出力を示す概略図である。 図5に示したノイズ推定モジュールの構成を示すブロック図である。 図6に示したノイズ推定モジュールに適用可能な非線形平滑化モジュールの入力及び出力を示す概略図である。 図1に示した設備に適用可能なノイズ低減モジュールの入力及び出力を示す概略図である。 図8に示したノイズ低減モジュールの構成を示すブロック図である。 図1に示した設備に適用可能な利得計算モジュールの入力及び出力を示す概略図である。 図10に示した利得計算モジュールの構成を示すブロック図である。 図1に示した設備に適用可能なスイッチ制御モジュールの入力及び出力を示す概略図である。 図12に示したスイッチ制御モジュールの構成を示すブロック図である。 図1に示した設備に適用可能なマスキングモデルモジュールの入力及び出力を示す概略図である。 図14に示したマスキングモデルモジュールの構成を示すブロック図である。 図1に示した設備に適用可能なマスキング信号計算モジュールの入力及び出力を示す概略図である。 図16に示したマスキング信号計算モジュールの構成を示すブロック図である。 図1に示した設備に適用可能な多入力多出力(MIMO)システムの入力及び出力を示す概略図である。 図18に示したMIMOシステムの構成を示すブロック図である。 少なくとも1つの音区画に音声抑制を有する別の例示の音区画設備を示すブロック図である。 少なくとも1つの音区画に音声抑制を有する更に別の例示の音区画設備を示すブロック図である。 少なくとも1つの音区画に音声抑制を有する更に別の例示の音区画設備を示すブロック図である。
例えば、多入力多出力(MIMO)システムは、任意の所与の空間内に、これに関連して「個々の音区画」(ISZ)または単に音区画とも呼ばれる、仮想ソースまたは相互に分離された音響区画を生成することを可能にする。個々の音区画の作成は、異なる音響ソースを様々な領域に提供することの可能性のみならず、特に、スピーカフォンによる会話を音響的に隔離された区画で行うことの展望により、より大きな関心を捕らえてきた。電話による会話の遠方の(または遠隔の)話者に対して、このことは、現在のMIMOシステムを何らの追加の変更も行わずに使用することで既に可能であり、これらの信号が電気またはデジタルの形態ですでに存在しているからである。しかし、他の側で話者により生じられた信号は、大きな難題を呈しており、これらの信号が、MIMOシステムに送られて対応するラウドスピーカに通され得る前に、マイクロホンにより受信され、音楽、周囲ノイズ(背景ノイズとも呼ばれる)及び他の破壊的要素を取り除かねばならないからである。
現在、MIMOシステムは、ラウドスピーカとの組み合わせで波動場を生じ、これが、特定の場所に、音響的に照らされた(高められた)区画である、いわゆる明るい区画、及び他の領域に、音響的に暗い(抑制された)区画である、いわゆる暗い区画を生成する。明るい区画と暗い区画との間の音響コントラストが大きいほど、特定の区画間でのクロストーク消去(CTC)はより効果的で、ISZシステムはより良好に機能することになる。マイクロホン信号(複数可)から近接話者の声音信号の抽出を含む前述の難点の他に、追加の問題として、信号の処理に利用可能な時間、言い換えれば、待ち時間がある。
例えば、近接話者が携帯電話を使用してマイクロホンに直接話すときであって、ラウドスピーカが、近接話者の声音信号が聞こえるはずのない、またはほとんど理解し得ない場所で使用するためのヘッドレスト内に位置するとき、に存在する理想的状態の想定に基づけば、高級車内での間隔は約x≦1.5mであり、これはc=343m/sの音速でT=20℃の温度では、約4.4ms以下の最大処理時間になる。このタイムスパン以内で、すべてのことが完了しなければならず、信号が受信、処理、及び再生されなければならないことを意味する。
ブルートゥーススマート技術での接続で生じる待ち時間であっても、t=6msであり、利用可能な処理時間よりも既にかなり長い。ヘッドレストラウドスピーカを採用するとき、約x=0.2mの話者から耳までの平均距離を想定でき、ここでもわずかt<4msの信号処理時間しか利用し得ず、これは十分とみなし得るが、いずれにしても重大な時間である。声音信号を近接話者のマイクロホンから隔離して、それをMIMOシステムに送るのに十分な処理時間があったとしても、それが所与のタスクを達成することを可能にするものではないであろう。
基本的に、全体性能、即ち、MIMOシステムのCTCの度合い及び帯域幅は、ラウドスピーカから、所望の波動場が投射されるべき領域(例えば、耳位置)までの距離に依存する。ラウドスピーカがヘッドレスト内に位置付けられるときでも、それは実際はおそらく最良の選択肢のうちの1つを表し、即ち、ラウドスピーカから耳までの最短距離を表し、最大CTC帯域幅f≦2kHzを達成することが唯一可能である。このことは、最良の状態下でかつ運転手の座席での近接話者の声音信号の十分な消去を想定しても、MIMOまたはISZシステムの支援では、わずか≦2kHzの帯域幅しか期待し得ない。
しかし、この周波数を超える声音信号は通常、多くのエネルギーまたは情報内容を依然有しているため、この帯域幅を超えた周波数に制限された音声であっても容易に理解され得る。これに加えて、自動車内で周囲ノイズにより一般にもたらされる自然の音響マスキング、例えば、道路及びモータノイズは、2kHzを超える周波数では効果はほとんどない。現実的に考えれば、ラウドスピーカと、声音がISZシステムを使用することによりほとんど理解され得ないようにされるべき周囲空間との間で、十分なCTCを達成する試みは上手くいかないであろう。
本明細書に説明する手法は、十分な強度及びスペクトル帯域幅のマスキング信号を、電話による会話が通話期間中理解されるべきでない領域内に投射するので、近接話者(例えば、運転手の座席に着座)の少なくとも声音信号は理解され得ない。近接話者の声音信号及び遠方の話者の声音信号の両方を使用してマスキング信号を制御し得る。しかし、車両内部で話者により使用される通信端末(携帯電話等)の周囲に、別の音区画を確立し得る。この追加の音区画は、他の音区画と同一または同様に確立し得る。(電気)マスキング信号を制御するためにいずれの信号を使用するかに拘わらず、採用された信号が近接話者の位置で妨害を生じることは決してあってはならず、近接話者がマスキング信号に基づく(音響)マスキング音によって完全にまたは少なくとも可能な最大限まで邪魔されないかまたはそれを知らないままにされなければならない。しかし、マスキング信号は、音声了解度を、例えば、一音区画での電話による会話が別の音区画で理解され得ないレベルまで低減させることができるはずである。
音声伝達指標(STI)は、音声伝達品質の尺度である。STIは、伝達チャネルの一部の物理的特性を評価して、音声信号の特性を伝えるチャネルの能力を表す。STIは、伝達チャネルの特性が音声了解度にいかに影響するかの確立された客観的測定値予測子である。伝達チャネルの音声了解度に対する影響は、例えば、音声レベル、チャネルの周波数応答、非線形歪、背景ノイズレベル、音再生機器の品質、エコー(例えば、100msより大きい遅延を有する反射)、反響時間、及び心理音響効果(マスキング効果等)に依存し得る。
より厳密には、音声伝達指標(STI)は、音声の周波数範囲内の多数の周波数オクターブ帯域の重み付けされた部分に基づく客観的尺度である。各周波数オクターブ帯域信号は、異なる変調周波数のセットにより変調されて、異なる周波数オクターブ帯域に別個に変調されたテスト信号の完全な行列を定義づける。変調の低減を定義づける、いわゆる変調伝達関数は、各オクターブ帯域内の各変調周波数に対して別個に決定され、その後、全変調周波数及び全オクターブ帯域に対する変調伝達関数値が組み合わされて、音声了解度の全体尺度を形成する。領域内の音声了解度を主観的評価からより定量的手法に向けて移動させることに利点があり、最低限でもより大きい反復性を提供することもまた分かった。
音声了解度の標準化定量的尺度は、共通了解度スケール(CIS)である。音声伝達指標(STI)、音声伝達指標公共アドレス(STI−PA)、音声了解度指標(SII)、高速音声伝達指標(RASTI)、及び子音明瞭度損失(ALCONS)等の、種々の機械に基づく方法は、CISへのマッピングが可能である。これらのテスト方法は、音声了解度を自動的にかつ音声了解度の人間の解釈を必要とすることなく評価する上で使用するために開発された。例えば、共通了解度スケール(CIS)は、CIS=1+log(STI)に従ってSTIとの数学的関連に基づく。共通音声了解度は、共通了解度スケール(CIS)でレベルが0.4未満であれば十分に低いことが理解される。
図1を参照して、例示の音区画設備100は、室101内に配置された多数のラウドスピーカ102及びやはり室101内に配置された多数のマイクロホン103を含む。信号処理モジュール104は、多数のラウドスピーカ102、多数のマイクロホン103、及びホワイトノイズ、即ち、ランダム位相特性を有する信号を生成する、ホワイトノイズソース105に接続される。信号処理モジュール104は、多数のラウドスピーカ102を経由して、受聴者の位置(図示せず)の周囲に第1の音区画106を、及び話者の位置(図示せず)の周囲に第2の音区画107を確立し、かつ多数のマイクロホン103に関連して、第1の音区画106に存在し加えて第2の音区画107にも存在するかもしれない音の状態のパラメータを決定する。音の状態には、とりわけ、問題の音声音、周囲ノイズ、及び付加的に生成されたマスキング音のうちの少なくとも1つの特性を含む。信号処理モジュール104は、その後、マスキングノイズmn(n)及び多数のラウドスピーカ102と関連して、かつ第1の音区画106(及び場合によっては第2の音区画107)内の決定された音の状態に基づいて、第1の音区画106内にマスキング音108(例えば、ノイズ)を生成するが、このマスキング音は、第2の音区画107から第1の音区画106に伝達される音声109の共通音声了解度を、了解度スケール(CIS)で0.4未満のレベルに低減させるのに適合している。このレベルは、話者のプライバシーの度合いを更に引上げるために、0.3、0.2未満または時には0.1未満のCISレベルに低減され得るが、このことは、第2の音区画107内の特定の音状況によっては受聴者の周囲のノイズレベルを不快なレベルに増大させ得る。
信号処理モジュール104は、例えば、MIMOシステム110を含むが、これは、多数のラウドスピーカ102、多数のマイクロホン103、マスキングノイズmn(n)、及びステレオ信号ソース111を提供するステレオ音楽信号x(n)等の有用信号ソースに接続される。MIMOシステムは、多数の出力部(例えば、多数のラウドスピーカの群に出力信号を供給するための出力チャネル)及び多数の(誤り)入力部(例えば、多数のグループのマイクロホン、及び他のソースからの入力信号を受信するための録音チャネル)を含み得る。グループには、単一チャネル、即ち、1つの出力チャネルまたは1つの録音チャネルに接続される1つ以上のラウドスピーカまたはマイクロホンを含む。対応する室またはラウドスピーカ−室−マイクロホンのシステム(少なくとも1つのラウドスピーカ及び少なくとも1つのマイクロホンが配設された室)は、線形で時不変であり、例えば、その室の音響インパルス応答により表現され得ることが想定される。更に、有用(ステレオ)入力信号x(n)等の多数の元の入力信号が、MIMOシステムの(元の信号)入力部に供給され得る。MIMOシステムは、均等化用の、例えば、多重誤差最小自乗平均(MELMS)アルゴリズムを使用し得るが、(修正)最小自乗平均(LMS)、再帰最小自乗(RLS)、等の任意の他の適応制御アルゴリズムを採用し得る。有用信号(複数可)x(n)は、多数の一次パスによりフィルタをかけられ得るが、これらは、多数のラウドスピーカ101のうちの1つから異なる位置の多数のマイクロホン102への途中の一次パスフィルタ行列により表され、一次パスの端部で、即ち、多数のマイクロホン102で、多数の有用信号d(n)を提供する。図1に示す例示の設備では、4(グループの)ラウドスピーカ、4(グループの)マイクロホン、及び3つの元の入力、即ち、ステレオ信号x(n)及びマスキング信号mn(n)が存在している。MIMOシステムが適応性がある場合、多数のマイクロホン103により出力された信号は、MIMOシステムに入力される。
信号処理モジュール104は、例えば、音響エコー消去(AEC)システム112を更に含む。概して、音響エコー消去は、例えば、有用音信号から推定されたエコー信号を減算することにより達成され得る。実際のエコー信号の推定を提供するために、アルゴリズムが開発され、それらは時間ドメインで動作し、時間離散的信号を処理する適応デジタルフィルタを採用し得る。そのような適応デジタルフィルタは、フィルタの伝達特性を定義付けるネットワークパラメータが、事前設定された品質関数に対して最適化されるように動作する。そのような品質関数は、例えば、基準信号に対して適応ネットワークの出力信号の平均自乗誤差を最小化することにより実現される。他のAECモジュールも公知であり、それらは周波数ドメインで動作する。図1に示す例示の設備では、時間ドメインまたは周波数ドメインのいずれかの、上述したような、AECモジュールが用いられるが、エコーは、本明細書では、音楽再生ラウドスピーカ(複数可)と同じ室内に配置されたマイクロホンにより受信される有用信号(例えば、音楽)部分と理解され得る。
AECモジュール112は、多数のマイクロホン103のうちの2つのマイクロホン103a及び103bの出力信号Mic(n,k)及びMic(n,k)を受信し、これらの特定のマイクロホン103a及び103bは、多数のラウドスピーカ102のうちの2つの特定のラウドスピーカ102a及び102bの近傍に配設される。ラウドスピーカ102a及び102bは、室内(例えば、車両内部)の(車両)座席のヘッドレスト内に配置され得る。出力信号Mic(n,k)は、有用音信号S(n,k)、室101内に存在する周囲ノイズを表すノイズ信号N(n,k)、及びマスキングノイズ信号mn(n)に基づいてマスキング信号を表すマスキング信号M(n,k)の合計であり得る。したがって、出力信号Mic(n,k)は、有用音信号S(n,k)、室101内に存在する周囲ノイズを表すノイズ信号N(n,k)、及びマスキングノイズ信号mn(n)に基づいてマスキング信号を表すマスキング信号M(n,k)の合計であり得る。AECモジュール112は更に、ステレオ信号x(n)及びマスキング信号mn(n)を受信して、誤り信号E(n,k)、AECモジュール112内の適応ポストフィルタの出力(ステレオ)信号PF(n,k)、及び有用信号(複数可)のエコー信号(複数可)の推定を表す(ステレオ)信号
を提供し得る。周囲/背景ノイズには、マスクされる音声音を指さない全ての種類の音を含むので、周囲/背景ノイズは車両により生成されたノイズ、室内に存在する音楽、及び場合によっては話者の音区画でのコミュニケーションに加わっていない他の人々の音声音も含まれることが理解される。周囲/背景ノイズが十分なマスキングを提供する場合、更なるマスキング音は必要ではないことが更に理解される。
信号処理モジュール104は、例えば、ノイズ推定モジュール113、ノイズ低減モジュール114、利得計算モジュール115、マスキングモデル化モジュール116、及びマスキング信号計算モジュール117を更に含む。ノイズ推定モジュール113は、(ステレオ)誤り信号E(n,k)をAECモジュール112から受信し、周囲(背景)ノイズの推定を表す(ステレオ)信号
を提供する。ノイズ低減モジュール114は、出力(ステレオ)信号PF(n,k)をAECモジュール112から受信し、受聴者の耳位置で感知されたときの音声信号の推定を表す信号
を提供する。信号
は利得計算モジュール115に供給され、このモジュールには信号I(n)も供給され、信号
に基づいて受聴者の耳位置で感知されたときの近接話者の音声信号の電力スペクトル密度P(n,k)を、マスキングモデル化モジュール116に供給する。マスキングモデルに代えてまたはそれに加えて、共通了解度モデルを使用し得る。マスキングモデル化モジュール116は信号G(n,k)を提供するが、これは受聴者の耳位置で感知されたときの推定された近接話者の音声信号の電力スペクトル密度P(n,k)のマスキング閾値を表し、所望のマスキング信号のマグニチュード周波数応答を呈する。信号G(n,k)を、ホワイトノイズソース105により提供されて所望のマスキング信号の位相周波数応答を送達する、ホワイトノイズ信号wn(n)と結合することにより、マスキング信号計算モジュール117内でマスキング信号mn(n)が生成されることになり、それがその後、とりわけ、MIMOシステム110に提供される。信号処理モジュール104は、例えば、スイッチ制御モジュール118を更に含み、これが多数のマイクロホン103の出力信号及び信号DesPosIdxを受信し、信号I(n)を提供する。
本実施例では自動車のキャビンである室内には、多数のラウドスピーカが、マイクロホンと共に位置付けられる。現存のシステムラウドスピーカに加えて、(音響的に)能動的なヘッドレストを採用し得る。「能動ヘッドレスト」の用語は、上述のラウドスピーカとマイクロホンの組み合わせ(例えば、組み合わせ217〜220)等の、1つ以上のラウドスピーカ及び1つ以上のマイクロホンが中に一体化されるヘッドレストを指す。室内に位置づけられたラウドスピーカは、例えば、音楽等の、有用信号を室内に投射する。これが、エコーの形成に繋がる。また、「エコー」は、再生用ラウドスピーカ(複数可)と同一の室内に位置するマイクロホンにより受信される有用信号(例えば、音楽)を指す。室内に位置付けられたマイクロホンは、周囲ノイズまたは音声等の、他の信号と共に有用信号を録音する。周囲ノイズは、路上牽引、換気、風、車両エンジン、等の多数のソースにより生成され得る、または室に入る他の妨害音で構成され得る。音声信号は、他方で、車両内に居る任意の同乗者から来る場合もあり得、それらの意図された使用に応じて、有用信号または破壊的背景ノイズのソースとみなし得る。
ヘッドセット内に一体化され通話が分からなくされるべき領域内に位置付けられた2つのマイクロホンからの信号は、まず、エコーが取り除かれねばならない。その目的で、前述のマイクロホン信号に加えて、対応する基準信号(本例では、音楽信号及びマスキング信号等の生成された有用ステレオ信号)が、AECモジュールに供給される。AECモジュールは、2つのマイクロホンの各々に対して、出力信号として、適応フィルタからの対応する誤り信号
適応ポストフィルタからの出力信号
及び対応するマイクロホンにより受信された有用信号(たとえば、音楽)のうちのエコー信号
を提供する。
ノイズ推定モジュール113では、各マイクロホン位置に存在する(周囲)ノイズ信号
に基づいて推定される。ノイズ低減モジュール114では、周囲ノイズの更なる低減が、適応ポストフィルタの出力信号
に基づいて行われ、エコーが残ったもの及び周囲ノイズの一部の抑制も行う。ノイズ低減モジュール114からの、その時点の、出力は、周囲ノイズを大幅に取り除かれた、マイクロホンから来る音声信号
の推定である。信号I(n)(以下に更に詳述する)と共に、有用信号エコー信号
背景ノイズ信号
及び会話を分からなくされる領域で検出された音声信号
のかくして得られた隔離推定を用いて、電力スペクトル密度P(n,k)が、利得計算のモジュールで計算される。これらの計算に基づいて、マスキング信号G(n,k)のマグニチュード周波数応答値が、次いで計算される。電力スペクトル密度P(n,k)は、近接または遠方の話者が活動的であって会話が行われているスペクトル領域内のみにいるときにのみマスキング信号が生成されることを確実にするように構成されなければならない。基本的に、電力スペクトル密度P(n,k)も、マスキング信号G(n,k)の周波数応答値を生成するために直接使用され得るのだが、この信号の高い狭帯域動特性により、十分なマスキング品質を有さずに生成される信号となる可能性がある。このため、電力スペクトル密度P(n,k)を直接使用する代わりに、そのマスキング閾値G(n,k)を使用して所望のマスキング信号のマグニチュード周波数応答値を生じさせる。
マスキングモデルモジュール116では、電力スペクトル密度P(n,k)である入力信号を使用して、そこに実装されたマスキングモデルに基づいてマスキング信号G(n,k)のマスキング閾値を計算する。電力スペクトル密度P(n,k)の狭帯域動特性の高ピークがマスキングモデルにより切り抜かれ、その結果、これらの狭帯域スペクトル領域でのマスキングは不十分となる。これを補うために、これらのスペクトルピークを包囲するスペクトル領域内のマスキング信号に対して拡散スペクトルが生成され、これが再度マスキング効果を局部的に強化するため、マスキング信号の動特性を制限することがあっても、その有効なスペクトル幅が拡大される。このように生成された時間及びスペクトル変数マスキング信号は、最小バイアスを呈するので、ユーザによる一層の支持に合致する。更に、信号のマスキング効果がこのように高められる。
マスキング信号計算モジュール117では、ホワイトノイズ信号(wn(n)のホワイトノイズ位相周波数応答が、マスキング信号G(n,k)の現存のマグニチュード周波数応答に重畳されて複合マスキング信号を生成するが、これはその後スペクトルドメインから時間ドメインに変換され得る。この最終結果が時間ドメインの所望のマスキング信号mn(n)であり、これは、一方ではMIMOシステムを通して対応する甲高い区画内に投射されるが、他方で、マイクロホン信号中に生じるエコーを消去し、フィードバック問題を防ぐためには、AECモジュールに追加の基準信号として入力されなければならない。
スイッチ制御モジュール118は、室内に存在する全てのマイクロホン信号をその入力信号として受信し、これらに基づいて、その出力部に時間変数2値重み付け信号I(n)を供給する。この信号は、本例では近接話者の位置である所望の位置DesPosIdxから生じた推定された音声信号
が、(I(n)=1)であるかまたは(I(n)=0)であるかを示す。音声ソースのこのように推定された位置が、デフォルトまたは選択により想定された既知の近接話者の位置DesPosIdxに対応するときのみ、マスキング信号が生成されることになる。そうでない場合は、即ち、マイクロホンに含まれた推定された音声信号
が室内の別の人から生じたときには、マスキング信号の生成は阻止されることになる。当然、座席検出センサまたはカメラからのデータも、代替的または追加の入力ソースとして利用可能である場合は、評価され得る。このことは、処理を相当に簡素化し、近接話者の信号を検出されたときの潜在的な誤りに対してシステムをより強くするであろう。
図2を参照して、室、例えば、自動車キャビン200、は4つの着座位置201〜204を含み、それらは、前部左位置201(運転手位置)、前部右位置202、後部左位置203及び後部右位置204である。各位置201〜204で、左及び右チャネルを有するステレオ信号が再生されるので、両耳性可聴信号が各位置で受信され、それらは、前部左位置左及び右チャネル、前部右位置左及び右チャネル、後部左位置左及び右チャネル、後部右位置左及び右チャネルである。各チャネルには、ウーファ、中音ラウドスピーカ及びツィータ等の、ラウドスピーカまたは同種または異種のラウドスピーカのグループを含み得る。自動車キャビン200には、システムラウドスピーカ205〜210を、左前部ドア内(ラウドスピーカ205)、右前部ドア内(ラウドスピーカ206)、左後部ドア内(ラウドスピーカ207)、右後部ドア内(ラウドスピーカ208)、左後部シェルフ上(ラウドスピーカ209)、右後部シェルフ上(ラウドスピーカ210)、ダッシュボード内(ラウドスピーカ211)及びトランク内(ラウドスピーカ212)に配置し得る。更に、浅いラウドスピーカ213〜216が、着座位置201〜204上方のルーフライナに一体化される。ラウドスピーカ213は、前部左位置201の上方に、ラウドスピーカ214は前部右位置202上方に、ラウドスピーカ215は後部左位置203上方に、ラウドスピーカ216は後部右位置204上方に配設される。ラウドスピーカ213〜216は、自動車キャビンの前部区分と後部区分間でクロストーク減衰を増大させるために傾けられる。受聴者の耳と対応するラウドスピーカとの間の距離は、音区画間でクロストーク減衰を増大させるために、できるだけ短く保たれ得る。加えて、ラウドスピーカと各ラウドスピーカ手前のマイクロホンとの対を有するラウドスピーカとマイクロホンとの組み合わせ217〜220は、着座位置201〜204で座席ヘッドレスト内に一体化され得、受聴者の耳と対応するラウドスピーカとの間の距離は更に減少し、前部座席のヘッドレストは前部座席と後部座席との間に更なるクロストーク減衰を提供するであろう。計測目的で、ヘッドレストラウドスピーカ手前に配置されたマイクロホンは、聴音位置に着座したときの平均的な受聴者の耳の位置に装着され得る。ルーフライナに配置されたウドスピーカ213〜216及び/またはヘッドレスト内に配置されたラウドスピーカとマイクロホンの組み合わせ217〜220の対のラウドスピーカは、指向性を更に増大させるために電気動特性プレーナラウドスピーカ(EDPL)を含む任意の指向性ラウドスピーカであり得る。理解されるように、ヘッドレストラウドスピーカ及びマイクロホンの位置が極めて重要である。残りのラウドスピーカは、ISZシステム用に使用される。システムラウドスピーカは、主にISZに対する低域スペクトル範囲を含むように使用されるが、音楽等の、有用信号の再生用にも使用される。例えば、指向性ラウドスピーカまたは音レンズにより、受動な方法で分離を提供するシステムとは対照的に、MIMOシステムは異なる音区画間に、例えば、(適応)フィルタにより、能動な方法で分離を提供するシステムであることが理解され得る。ISZシステムは、能動及び受動分離を組み合わせる。
図3に示すように、図1に示したAECモジュール112として使用され得る例示のAECモジュール300は、マイクロホン信号Mic(n)及びMic(n)、マスキング信号mn(n)、ならびに2つの個々のモノラル信号x(n)及びx(n)で構成されるステレオ信号x(n)を受信し得、かつ誤り信号e(n)及びe(n)、ポストフィルタ出力信号pf(n)及びpf(n)、ならびに受聴者の耳位置で感知される有用信号の推定を表す信号
を提供し得る。図2に示した設備に適用される図3に示すAECモジュール300は、図4と関連してより詳細に以下に説明する。AECモジュール300は、制御モジュール407により制御される6つの制御可能なフィルタ410〜406(即ち、それらの伝達関数が制御信号により制御され得るフィルタ)を含む。制御モジュール407は、制御可能なフィルタ401〜406の伝達関数
を制御するために、例えば、正規化最小二乗平均(NLMS)アルゴリズムを採用して、ステップサイズ信号
を生成する。ステップサイズ信号
は、2つの個々のモノラル信号x(n)及びx(n)、マスキング信号mn(n)、ならびに制御信号
からステップサイズコントローラモジュール408により計算される。ステップサイズコントローラモジュール408は更に、ポストフィルタモジュール409を制御するポストフィルタ制御信号
を計算しかつそれらを出力する。ポストフィルタモジュール409は、誤り信号e(n)及びe(n)からポストフィルタ出力信号pf(n)及びpf(n)を生成するように制御される。誤り信号e(n)及びe(n)は、補正信号を差し引く、マイクロホン信号Mic(n)及びMic(n)から得られる。これらの補正信号は、信号
ならびに制御可能なフィルタ403及び404の出力信号
の合計から得られ、信号
は制御可能なフィルタ401及び402の出力信号
の合計であり、信号
は制御可能なフィルタ405及び406の出力信号
の合計である。制御可能なフィルタ401及び405には、信号モノラル信号x(n)が供給される。制御可能なフィルタ402及び406には、モノラル信号x(n)が供給される。制御可能なフィルタ403及び404には、マスキング信号mn(n)が供給される。マイクロホン信号Mic(n)及びMic(n)は、図1に示した設備中の多数のマイクロホン103のうちのマイクロホン103a及び103b(これらは、図2に示したヘッドレスト内に配置されたラウドスピーカとマイクロホンの組み合わせ217〜220のうちのマイクロホンであり得る)により提供される。
図4の右上部分には、一方の、図1に示したラウドスピーカ102c及び102dまたは図2に示したラウドスピーカ205〜208等の4つのステムラウドスピーカ、ならびに図1に示したラウドスピーカ102a及び102bまたは図2に示したラウドスピーカとマイクロホンの組み合わせ220中のラウドスピーカ対等の特定の座席(例えば、位置204)のヘッドレスト内に配置された2つのラウドスピーカと、他方の、図1に示したマイクロホン103a及び103bまたは図2に示したラウドスピーカとマイクロホンの組み合わせ220中のマイクロホン等の、2つのマイクロホンとの間の音響伝達チャネルの伝達関数
を示す。自動車キャビン内に存在するラウドスピーカの各々が、ステレオ信号x(n)の左または右チャネルのいずれかをブロードキャストすることが想定される。しかし、実際には、このことは、図2に示した設備内の中心ラウドスピーカ211またはサブウーファ212等の中心に配置したラウドスピーカが、通常はモノラル信号m(n)をブロードキャストするために当てはまらず、この場合、当該信号は、ステレオ信号x(n)の左及び右チャネルl(n)、r(n)の合計を、
に従って表す。
各ラウドスピーカは、ラウドスピーカによりブロードキャストされた信号がそれぞれの室のインパルス応答(RIR)でフィルタをかけられて互いに重畳されてそれぞれの完全なエコー信号を形成した後にマイクロホンの各々により受信されるという点で、マイクロホン信号及びそれに含まれるエコー信号に寄与する。例えば、それぞれのラウドスピーカから左マイクロホンへのステレオ信号x(n)のうちの左チャネル信号x(n)の平均RIRは、
それぞれのラウドスピーカから右マイクロホンへのスタジオ信号x(n)のうちの左チャネル信号x(n)に対しては、
と書き表し得る。
したがって、それぞれのラウドスピーカから右マイクロホンへのステレオ信号x(n)のうちの右チャネル信号x(n)の平均RIRは、
それぞれのラウドスピーカから左マイクロホンへのスタジオ信号x(n)のうちの右チャネル信号x(n)に対しては、
と書き表し得る。
加えて、マスキング信号mn(n)は、2つのマイクロホンにより受信されるエコーを生成する。
話者が後部座席の1つに着座し、受聴者が前部座席の1つに着座し、受聴者は後部座席の話者が話している内容を理解するべきでなく、マスキング音が受聴者の座席のヘッドレスト内のラウドスピーカから発されている、典型的状況を図4に示す。マスキング音は、受聴者の座席のヘッドレスト内のラウドスピーカによってのみブロードキャストされ、他のラウドスピーカはマスキングに関与しないので、左マイクロホンに対する平均
であり、右マイクロホンに対する平均
である。
以下の説明は、話者が右後部座席に着座し、受聴者が左前部座席(運転手座席)に着座し、受聴者は話者が話す内容を理解するべきでない、という想定に基づいている。話者と受聴者との他のいかなる位置関係も同様に適用され得る。上記の状況下で、左及び右マイクロホンにより受信される総エコー信号Echo(n)及びEcho(n)は、
かつ
であり、式中、「*」はたたみ込み演算子である。
K=3の無相関の入力信号x(n)、x(n)及びmn(n)ならびにI=2のマイクロホン(ヘッドレスト内)の場合、K・I=6の異なる独立した適応システムが確立され、これが、それぞれの
の推定をするように、即ち、図4に示すように、RIRの推定
を生成するように機能し得る。
信号m(n)を出力する左マイクロホン及び信号m(n)を出力する右マイクロホンにより録音される有用信号のエコーは、AECモジュール300の第1の出力信号として機能し、
のように推定され得る。
誤り信号e(n)、e(n)は、AECモジュール300の第2の出力信号として機能し、
のように計算され得る。
上記の式から、誤り信号e(n)及びe(n)が理想的には潜在的に現存するノイズまたは音声信号成分のみを含むことが分かる。誤り信号e(n)及びe(n)は、ポストフィルタモジュール409に供給され、このモジュールがAECモジュール300の第3の出力信号pf(n)及びpf(n)を出力するが、それらは、
及び
と書き表し得る。
適応ポストフィルタ409は、誤り信号e(n)及びe(n)に潜在的に残存するエコーを抑制するように作用する。残存エコーは、ポストフィルタ409の係数p(n)及びp(n)でたたみ込みをとられるが、これらはある種の時不変スペクトルレベルバランサとして機能する。適応ポストフィルタの係数p(n)及びp(n)に加えて、本実施例では適応適合ステップサイズμ(n)及びμ(n)である、適応ステップサイズ
は、ステップサイズ制御モジュール408で、入力信号x(n)、x(n)、mn(n)、
に基づいて計算される。すでに上述したように、代替的には、AECモジュール内の信号処理は、時間ドメインではなく周波数ドメインにおいてであり得る。信号処理手順は、以下の通りに書き表し得る。
入力信号
この場合、
のように書き表し得るが、
Lはブロック長さであり、Nは適応フィルタの長さであり、M=N+L−1は高速フーリエ変換(FFT)の長さであり、K=0、….、K−1、及びKは無相関の入力信号の数である。
エコー信号
この場合、
であり、これは、
の最終L個の要素を含むベクトルであり、かつ、
誤り信号
この場合、
0は長さM/2を有する零の列ベクトルであり、e(n)は長さM/2を有する誤り信号ベクトルである。
入力信号エネルギー
αは入力信号エネルギーに対する平滑化係数であり、pMinは入力信号エネルギーの有効最小値である。
適合ステップサイズ
、かつ
適合:
式中、
は制約無しの適応の係数、
は制約下の適応の係数、
はベクトルxの対角行列、
xは(複素数)値xの共役複素数値である。
制約:
式中、
の第1のM/2要素を有するベクトルである。
システム距離
式中、
CはDTDの感度を決定する定数である。
適合ステップサイズ
式中、
の許容上限値、μMinは許容下限値である。
適応ポストフィルタ
式中、
の許容上限値であり、
の許容下限値であり、
である。
したがって、AECモジュールの出力信号は、以下の通りに書き表し得るのだが、
有用信号のエコー
は、
、かつ
に従って計算される。
マイクロホン信号に含まれる有用信号エコーのスペクトルドメインでの計算により、所望の信号がマイクロホンが配置されている場所であって近接話者の音声が(例えば、運転手位置に着座している人物により)理解されるべきではない場所で、如何なる強度及び色合いを有するかを決定することが可能になる。この情報は、音声信号が受聴者の位置、例えば運転手位置で聞こえないように、離散時点nでの現在の有用信号(例えば、音楽)が近接話者から発生している可能性のある信号をマスクするのに十分であるのかを評価する上で重要である。これが該当する場合は、運転手位置に対してまたはそこで追加のマスキング信号mn(n)を生成及び放射させる必要は無い。
誤り信号
誤り信号
は、僅かな残存エコーに加えて、ほとんど純然たる背景ノイズ及び近くの話者からの元の信号を含む。
適応ポストフィルタの出力信号
誤り信号
とは対照的に、適応ポストフィルタの出力信号
は、一種のスペクトルレベルバランシングを提供する時不変適応ポストフィルタリングによりかなりの残存エコーを含むことはない。ポストフィルタリングは、適応ポストフィルタの出力信号
に含まれる近接話者の音声信号成分に悪影響を及ぼすことはほとんどないが、むしろ同様に含まれる背景ノイズに及ぼす。背景ノイズの色合いは、少なくとも能動有用信号が含まれるときポストフィルタリングにより修正され、その結果背景ノイズレベルは最終的に低減されるので、修正された背景ノイズは、その修正により、背景ノイズの推定の基礎としては機能し得ない。このため、誤り信号
は、背景ノイズ
を推定するために使用され得、これが、(ステレオ)背景ノイズにより提供されるマスキング効果の評価の基礎を形成し得る。
図5は、図1に示した設備でノイズ推定モジュール113として使用し得るノイズ推定モジュール500を示す。より明確にするため、図5は、背景ノイズの推定のための信号処理モジュールのみを示すが、これは、入出力信号で、左及び右マイクロホン(例えば、マイクロホン103a及び103b)により録音された背景ノイズ部分の平均値に対応する。ノイズ推定モジュール500は、誤り信号
である入力信号、及び推定されたノイズ信号
である出力信号を受信する。
図6は、ノイズ推定モジュール500の構成を詳細に説明する。ノイズ推定モジュール500は、誤り信号
を受信してその電力スペクトル密度
を計算する電力スペクトル密度(PSD)推定モジュール601、及び計算した電力スペクトル密度
の最大電力スペクトル密度値
を検出する最大電力スペクトル密度検出器モジュール602を含む。ノイズ推定モジュール500は更に、最大電力スペクトル密度検出器モジュール602から受信した最大電力スペクトル密度
を時間について平滑化して時間的に平滑化された最大電力スペクトル密度
を提供する任意選択の時間平滑化モジュール603、時間平滑化モジュール603から受信した最大電力スペクトル密度
を周波数について平滑化してスペクトル的に平滑化された最大電力スペクトル密度
を提供するスペクトル平滑化モジュール604、及びスペクトル平滑化モジュール604から受信したスペクトル的に平滑化され最大電力スペクトル密度
を非線形的に平滑化して、推定されたノイズ信号
である、非線形平滑化最大電力スペクトル密度を提供する非線形平滑化モジュール605を含む。時間平滑化モジュール603は更に、平滑化係数τTUp及びτTDownを受信し得る。スペクトル平滑化モジュール604は更に、平滑化係数τSUp及びτSDownを受信し得る。非線形平滑化モジュール605は更に、平滑化係数CDec及びCInc、及び最小ノイズレベル設定MinNoiseLevelを受信し得る。
ノイズ推定モジュール500の唯一の入力信号は、AECモジュールから入来する2つのマイクロホンからの誤り信号E(n,k)及びE(n,k)である。厳密にこれらの信号を推定用に使用している理由は、すでに前述した。図6から、両マイクロホンにより録音された背景ノイズの平均値に対応する推定されたノイズ信号
を計算するために2つの誤り信号E(n,k)及びE(n,k)が如何に処理されるかが、理解され得る。
各入力信号、即ち、誤り信号E(n,k)及びE(n,k)、の電力は、それらの電力スペクトル密度
を計算(推定)し、次いで、それらの最大値、即ち、最大電力スペクトル密度
を定式化することにより決定される。任意選択的に、最大電力スペクトル密度
を時間について平滑化し得るが、その場合、平滑化は最大電力スペクトル密度
が上昇しているか下降しているかに依存することになる。最大電力スペクトル密度が上昇している場合、平滑化係数τTUpを適用し、下降していれば、平滑化係数τTDownを適用する。別の選択肢は、最大電力スペクトル密度
を時間について平滑化することであり、これはその後スペクトル平滑化モジュール604に対する入力信号として機能し、そこで信号はスペクトル平滑化を受ける。次に、スペクトル平滑化モジュール604では、平滑化を低から高へ(τSUp能動)、高から低へ(τSDown能動)、または平滑化を両方向に行うべきかが決定される。同一の平滑化係数(τSUp=τSDown)を用いて実行される両方向のスペクトル平滑化は、スペクトルバイアスが防止されるべきときに適切であり得る。背景ノイズをできるだけ確実に推定するのが望ましいのかもしれないので、スペクトル歪は許容され得ず、この場合両方向のスペクトル平滑化を必要とする。
次に、スペクトル的に平滑化された最大電力スペクトル密度
が、非線形平滑化モジュール605に送られる。非線形平滑化モジュール605では、会話、ドアの急閉、マイクロホンの軽いたたき等の、スペクトル的に平滑化された最大電力スペクトル密度
に依然残存する何らかの突然の破壊的ノイズが、抑制される。
図6に示す設備中の非線形平滑化モジュール605は、図7に示す例示の信号フロー構成を有し得る。突然の破壊的ノイズは、入力信号である、スペクトル的に平滑化され最大電力スペクトル密度
及びそれ自体がステップ702で一の時間係数だけ遅延された推定されたノイズ信号
の、個々のスペクトルライン(K−Bins)間で進行中の比較(ステップ701)を遂行することにより抑制し得る。入力信号であるスペクトル的に平滑化され最大電力スペクトル密度
が、遅延された出力信号である遅延推定されたノイズ信号
より大きければ、いわゆる増分イベントが誘発される(ステップ703)。この場合、遅延推定されたノイズ信号
は係数CInc>1を有する増分パラメータで乗算されることになり、推定されたノイズ信号
が遅延推定されたノイズ信号
と比べて増大することになる。反対の場合、即ち、スペクトル的に平滑化された最大電力スペクトル密度
が遅延推定されたノイズ信号
より小さければ、いわゆる減分イベントが誘発される(ステップ704)。ここで、遅延推定されたノイズ信号はCDec<1を乗算されて、推定されたノイズ信号
が遅延推定されたノイズ信号
より小さい結果となる。次に、結果として生じる推定されたノイズ信号
は、閾値MinNoiseLevelと(ステップ705で)比較される。閾値未満であれば、推定されたノイズ信号
は、その後、

に従って、その値に制限される。
その推定がAECモジュールから直接取られ得る有用信号のエコー、またはノイズ推定モジュールから引き出した推定背景ノイズが、会話が理解されるべきでない領域内で音声信号の十分なマスキングを提供しなければ、マスキング信号mn(n)が計算される。これのために、マイクロホン信号内の音声信号成分
が推定され、これがマスキング信号mn(n)の生成の基礎として働く。音声信号成分
を決定するための可能な一方法を、以下に説明する。
図8は、図1に示した設備でノイズ低減モジュール114として使用され得るノイズ低減モジュール800を示す。ノイズ低減モジュール800は、図4に示したポストフィルタ409の出力信号
である、入力信号、及び推定された音声信号
である、出力信号を受信する。図9は、ビームフォーマ901及びウィーナーフィルタ902を含むノイズ低減モジュール800を詳細に説明する。ビームフォーマ901では、信号
が互いに減算器903により減算されるが、この減算が行われる前には、信号
のうちの1つ、例えば、信号
が遅延要素904に送られて、信号
に対して遅延させる。遅延要素904は、例えば、オールパスフィルタまたは時間遅延回路であり得る。減算器903の出力は、スケーラ905(例えば、2で除算する)を通ってウィーナーフィルタ902へ送られ、これが、推定された音声信号
を提供する。
図8及び9から差し引かれ得るように、マイクロホンに含まれる音声信号
の抽出は、適応ポストフィルタ信号
からの出力信号に基づき、これは、図8及び9では信号
と称される。上述したように、信号
即ち、
についての特性は、それらが含んでもいる音声信号に永久歪みを生じることなく、実質的に内在する周囲ノイズの低減と共に、適応ポストフィルタにより更なるエコー低減を受けることである。ノイズ低減モジュール800は、信号
に残存する周囲ノイズ成分を抑制するかまたは理想的にはそれを除去し、所望の音声信号
のみが残存することになるのが理想的である。図9に見られるように、この目的を達成するために、処理は2つの部分に分けられる。
第1の部分として、ビームフォーマが使用されるが、その空間フィルタ効果を活かすためには、基本的には遅延及び合計ビームフォーマになる。この効果は、主に高域スペクトル範囲で、(マイクロホン間の距離dMicに応じて)周囲ノイズの低減をもたらすことが知られている。遅延及び合計ビームフォーマが使用されるときに通常行われるような、遅延に対する補償に代えて、本例では、時間可変スペクトル位相補正を、オールパスフィルタA(n,k)の支援により実行し、以下の数式に従って入力信号から、計算される。
計算を行う前に、両チャネルが、音声信号に関して同一位相を有することが確実にされていなければならない。そうでない場合は、音声信号成分の部分的に破壊的な重複により、音声信号の不要な抑制に至ることになり、信号対ノイズ比(SNR)の質を低下させる。以下の信号が、オールパスフィルタの出力部に提供される。
位相補正区域A(n,k)を採用するときには、他のマイクロホン(ここでは
右マイクロホンから)からの角周波数応答値が使用されるが、信号供給マイクロホンのマグニチュード周波数応答値(本例では、信号
左マイクロホンから生じる)のみが出力部に提供される。このように、話者のもの等の、整合的な到来信号成分は、そのままに維持されるが、周囲ノイズ等の、他の整合的でない到来音要素は、計算で低減される。遅延及び合計ビームフォーマを使用して概ね低減され得る最大減衰は3dBであるが、これは、dMi=0.2「m」のマイクロホン距離(ヘッドレスト内のマイクロホンまでの距離にほぼ対応する)、cθ20℃=343msの音速、では、
以上の周波数でのみ達成され得、
これは、遮断周波数fの計算を説明しており、この点を超えると、距離dMicに位置付けられた2つのマイクロホンを用いた非適応ビームフォーマの空間フィルタリングからのノイズ抑制効果が明らかになる。自動車内での周囲ノイズが暗赤色のスペクトル区域にあり、その成分が主に低周波数(約f<1kHzの範囲)の音で構成されることから、高周波数ノイズのみに影響を及ぼすビームフォーマのノイズ抑制、即ち、その空間フィルタリング、は、換気装置または解放した窓からの音等の、周囲ノイズのある特定部分のみを抑制し得ることが明らかである。
ノイズ低減モジュール800内で行われるノイズ抑制の第2の部分は、最適なフィルタ、即ち、伝達関数W(n,k)を有するウィーナーフィルタ、の支援により遂行され、これは、特に、上述したように、自動車での、ノイズ低減の大部分を行う。ウィーナーフィルタの伝達関数W(n,k)は、以下の通りに計算され得る。
式中、
である。
上記の数式から、ウィーナーフィルタの伝達関数W(n,k)はまた、制約されるべきであり、最小許容値への制限が特に重要であることが分かる。伝達関数W(n,k)がWMin≫−12dB、…、−9dBの下限値に制約されないと、いわゆる「楽音」形成の結果となり、これは、マスキングアルゴリズムに必ずしも影響を及ぼすわけではないが、抽出された音声信号を提供したいとき、例えば、スピーカフォンアルゴリズムを適用するとき、に少なくとも重要なものになる。このため、またサウンドシャワーアルゴリズムに悪影響を及ぼさないため、制約はこの段階で行われる。ノイズ低減モジュール800の出力信号S(n,k)は、以下の数式に従って計算され得る。
図10は、図1に示した設備で利得計算モジュール115として使用され得る利得計算モジュール1000を示す。利得計算モジュール1000は、推定された有用信号エコー
推定された音声信号
重み付け信号I(n)、及び推定されたノイズ信号
を受信し、近接話者の音声信号の電力スペクトル密度P(n,k)を提供する。
図11は、利得計算モジュール1000の構成を詳細に説明する。利得計算モジュール1000では、近接話者の電力スペクトル密度P(n,k)が、推定された有用信号エコー
推定された周囲ノイズ信号
推定された音声信号
及び重み付け信号I(n)に基づいて計算される。これのために、有用信号の電力スペクトル密度
が、PSD推定モジュール1101及び1102でそれぞれ計算され、その後その最大値
が最大検出器モジュール1103で決定される。
は、例えば、同一の時定数τUp及びτDownを用いて、平滑化フィルタ1104及び1105を適用することにより、周囲ノイズ信号に対して前述したと同じ方法で(時間的及びスペクトル的に)平滑化され得る。最大値
が、次いで、平滑化された有用信号
及び推定された周囲ノイズ信号
から別の最大検出器モジュール1106で計算され、係数NoiseScaleにより倍率をかけられる。最大値
は、その後、比較モジュール1107に送られ、そこで推定された音声信号
と比較されるが、これは、PSD推定モジュール1108でPSDを計算し、任意選択の時間平滑化フィルタ1109及び任意選択のスペクトル平滑化フィルタ1110を経由して、有用信号と同様に円滑化されることにより、推定された音声信号
から引き出され得る。
推定された周囲ノイズ信号
の重み付けのために、スケール係数NoiseScaleをノイズスケール≧1で適用すると、以下の結果が生成される:スケール係数NoiseScaleをより高く選ぶほど、周囲ノイズが音声として誤って推定されるリスクがより少なくなる。しかし、音声検出器の感度が処理において低下し、マイクロホン信号に実際に含まれる音声要素が正確に検出されない可能性を増大させる。低領域レベルでの音声信号は、そのため、マスキングノイズを生成しないリスクがより大きい。
既に述べたように、最大値
及び推定された音声信号
の時間可変スペクトルは、比較モジュール1107に送られ、そこで、推定された音声信号
のスペクトルプログレッションと推定された周囲ノイズ
のスペクトルとの比較がされる。
推定された音声信号
としてのみ使用されるので、
であり、最大値
より大きいとき、有用信号のエコー
の最大値より大きいことになる。そうでない場合は、出力信号
は形成されず、即ち、
が出力信号として使用されることになる。言い換えれば、周囲ノイズ信号及び/または音楽信号(有用信号エコー)が現存の音声信号の「自然の」マスキングに対して不十分であるような場合のみ、追加のマスキングノイズmn(n)が生成されて、その周波数応答値P(n,k)が決定されることになる。いずれの話者から信号が生じたのかはこの時点で未知であるので、比較モジュール1107の出力信号
はここでは直接適用され得ない。信号が、例えば、右後部座席に着座した近接話者から生じた場合のみ、マスキング信号mn(n)は生成され得る。他の場合では、例えば、信号が右前部座席に着座した同乗者から生じたとき、生成されるはずがない。しかし、この情報は重み付け信号I(n)により表され、それにより出力信号
は、利得計算ブロックの出力信号、即ち、検出された音声信号P(n,k)を得るために、重み付けされる。理想的には、検出された音声信号P(n,k)は、受聴者の耳位置で感知された近接話者の声音の電力スペクトル密度のみを含むべきであり、これは、まさにこれらの位置でその時存在する音楽または周囲ノイズより大きいときのみである。
図12は、図1に示した設備でスイッチ制御モジュール118として使用され得るスイッチ制御モジュール1200を示す。図12に示すように、検出された音声信号が近接話者の想定位置からのものであるか、または異なる位置からのものであるかの決定は、可変DesPosIdxにより記憶された近接話者の事前想定位置と共に、室内に設置されたマイクロホンのみを用いて行われる。検出された音声信号P(n,k)の時間可変デジタル重み付けを遂行する重み付け信号I(n)である出力信号は、音声信号が近接話者から生じると、その時のみ1の値を想定すべきであり、そうでない場合は、0の値を有するべきである。
図13に示すように、これを達成するために、ヘッドレストマイクロホンにより示される位置の平均値が平均計算モジュール1201で計算されるが、これは概ね遅延及び合計ビームフォーマの形成に対応し、これが平均マイクロホン信号
を生成する。座席Pを指すマイクロホン信号
全てはその後、高域フィルタ1202を経由して高域フィルタリングを受ける。高域フィルタリングは、前述したように、自動車内で主に低域スペクトル範囲に存在する周囲ノイズ要素が、抑制されて不正確な検出を生じないことを確実にするように機能する。このために、例えば、f=100Hzの基本周波数を有する二次バターワースフィルタが使用され得る。選択肢として、低域フィルタリング(低域フィルタ1203を経由)を用いて、自動車の典型的周囲ノイズとは対照的に音声が統計的に支配的であるスペクトル範囲にアクセンチュエイション、即ち、制限、を適用することもできる。
このようにスペクトル的に制限されたマイクロホン信号は、その後、時間平滑化モジュール1204で時間について平滑化され、P個の平滑化されたマイクロホン信号m(n)、…、m(n)を提供する。ここで、例えば、1次無限インパルス応答(IIR)低域フィルタ等の、従来の平滑化フィルタを、エネルギーを保存するために、使用し得る。P個の指標信号I(n)、…、I(n)が、その後、モジュール1205によりP個の平滑化されたマイクロホン信号m(n)、…、m(n)から生成されるが、これらはデジタル信号であるため1または0の値のみをとり得る。一方、時点nで、最高レベルを有する信号のみが、位置上で最大マイクロホンレベルを表す1の値をとり得る。前述のように、信号処理は、スペクトル範囲で主に実行され得る。このことは、ブロックでの処理を暗に前提としており、その長さは供給速度により決定される。続いて、モジュール1206で、最新のL個の指標ベクトルサンプル
からヒストグラムが、
で作られるが、最大音声信号レベルが位置Pに出現した回数が計数されることを意味する。これらの計数値は、その後、
の信号形態で各時間間隔nで最大検出器モジュール1207に送られる。最大検出器モジュール1207では、時点nで最高計数値
を有する信号が識別されて比較モジュール1208に送られ、ここで可変DesPosIdx、即ち、近接話者の事前想定位置と比較される。
とDesPosIdxとが対応すれば、ここで出力信号I(n)=1が確認され、そうでない場合は、推定された音声信号
は、近接話者の位置で発生しないこと、即ち、
I(n)が0になること、が決定される。
図14は、図1に示した設備でマスキングモデルモジュール116として使用され得るマスキングモデルモジュール1400を示す。本例では電力スペクトル密度P(n,k)であり近接話者の信号を含む、検出された音声信号が、有用信号エコー及び周囲ノイズの最大値より大きければ、それを直接使用してマスキング信号mn(n)、より厳密にいえば、マスキング閾値またはマスキング信号のマグニチュード周波数応答G(n,k)または|MN(n,k)|、をそれぞれ、計算できる。しかし、この信号のマスキング効果は、概して弱すぎるかもしれない。このことは、検出された音声信号P(n,k)内に発生する高くて狭い短寿命のスペクトルピークによるのかもしれない。これに対する簡単な改善策には、例えば、1次IIR低域フィルタを用いて、検出された音声信号P(n,k)を高から低及び低から高へ平滑化することを含み、これにより、この信号を、マスキング信号のマグニチュード周波数応答G(n,k)を生成するために使用することが可能になるであろう。しかし、これは、検出された音声信号P(n,k)内の、隣接スペクトル範囲を刺激する高いピークのマスキング効果が、心理音響的に正確に検討され、かつマスキング信号mn(n)に再生されるのを妨げ、それによりマスキング信号mn(n)のマスキング効果を際だって低下させる。これは、マスキングモデルを適用して、マスキング閾値、即ち、マスキング信号のマグニチュード周波数応答G(n,k)を検出された音声信号P(n,k)から計算することにより克服し得るが、これは、他方で、いわゆる広がり関数で隣接スペクトル範囲へのピークの影響を固有的に検討しながら、一方で、検出された音声信号P(n,k)で高ピークを自動的に切り抜くことになるためである。結果は、はもはや高い、狭帯域レベルを呈さない出力信号だが、十分なマスキング効果を有し、完全な抑制潜在力を保持するマスキング信号mn(n)を生成する。
図14に見られるように、この一ニーズに対して、検出された音声信号P(n,k)の他に、追加の入力信号が、出力信号としてマスキング閾値、例えば、マスキング信号のマグニチュード周波数応答G(n,k)、を生成するために専らマスキングモデルを制御する。そのような追加の入力信号は、信号
広がり関数S(m)、パラメータGainOffset、及び平滑化係数βである。前述のように、マスキング閾値、即ち、マスキング信号のマグニチュード周波数応答G(n,k)、は概してマスキングノイズの周波数応答に対応するので、
と呼び得る。しかし、マスキングモデルを使用してマスキング閾値、即ち、マスキング信号のマグニチュード周波数応答G(n,k)を生成すると、そのマスキング閾値がまた、検出された音声信号P(n,k)である入力信号のマスキング閾値に対応することになる。このことは、マスキング閾値を示すために使用される異なる名称を明らかにする。
図15に見られるように、同図は、マスキングモデルモジュール1400の構成を詳細に示し、入力信号P(n,k)が変換モジュール1501で線形スペクトル範囲から心理音響バーク範囲に変形される。これは、これまでM/2ビンを必要とされたのに対して、24バーク(臨界区画)だけしか計算する必要がないので、信号処理に関与する労力を顕著に低減させる。これに応じて変換された電力スペクトル密度B(n,m)は、m=[1、…、B]undB=バーク(区画)の最大数であるのに対して、モジュール1502で、広がり関数S(m)をそれに適用することにより平滑されて、平滑化されたスペクトルC(n,m)が提供される。平滑化されたスペクトルC(n,m)は、スペクトル平坦尺度モジュール1503を介して供給され、平滑化されたスペクトルC(n,m)は、時点nでの入力信号がよりノイズ状かまたはより音色であるか、即ち、調和性があるかに従って分類される。この分類の結果は、その後、オフセット計算モジュール1504に送られる前に、信号SFM(n,m)に記録される。ここで、信号がノイズ状かまたはより音色であるかに応じて、対応するオフセット信号O(n,m)が生成される。入力信号
は、O(n,m)の生成用の制御パラメータとして機能し、これがその後拡散スペクトル推定モジュール1505に適用されて平滑化されたスペクトルC(n,m)を修正し、出力部に完全なマスキング閾値T(n,m)を生じる。
拡散スペクトル推定再正規化モジュールでは、絶対マスキング閾値T(n,m)が再正規化されるが、これは、広がり関数(Sm)が適用されるとき、誤りが広がりブロックに形成されるので必要であって、信号全エネルギーの不当な増大に存している。広がり関数S(m)に基づいて、再正規化値Ce(n,m)が拡散スペクトル推定再正規化モジュール1506で計算され、次いでマスク閾値再正規化モジュール1507での絶対マスキング閾値T(n,m)の補正に使用され、最終的に再正規化された絶対マスキング閾値T(n,m)を生成する。SPLへの変換モジュール1508では、基準音圧レベル(SPL)値SPLRefが再正規化された絶対マスキング閾値T(n,m)に適用され、バーク利得計算モジュール1509に供給する前にそれを音響音圧信号TSPL(n,m)に変換し、そこでその値が外部に設定され得る可変GainOffsetのみにより修正される。パラメータGainOffsetの効果は、以下のように合計される:可変GainOffsetが大きいほど、結果として生じるマスキング信号nm(n)の振幅はより大きいことになる。信号TSPL(n,m)と可変GainOffsetの合計は、時間平滑化モジュール1510で任意選択的に時間について平滑化され、これには、平滑化係数βを有する1次IIR低域フィルタを使用し得る。時間平滑化モジュール1510からの出力信号は、信号BG(n,m)であるが、その後バークスケールから線形スペクトル範囲に変換され、最終的にマスキングノイズG(n,k)の周波数応答になる。マスキングモデルモジュール1400は、公知のジョンストンマスキングモデルに基づくことができ、信号のうちのどの成分が不可聴であるのかを予測するために可聴信号に基づいてマスク閾値を計算する。
図16は、マスキング信号計算モジュール1600を示し、これは、図1に示した設備でマスキング信号計算モジュール117として使用され得る。マスキングノイズG(n,k)及びホワイトノイズ信号wn(n)の周波数応答値を用いて、時間ドメインのマスキング信号mn(n)が計算される。マスキング信号計算モジュール1600の構成の詳細な表現を図17に示す。マスキング信号の周波数応答は、表現範囲を単に変換することにより生成され、ホワイトノイズの場合には、πコンバータモジュール1701を経由して0、…、1、から
であり得る。その後、複素信号
が乗算器モジュール1702により形成され、その後、オーバーラップ加算(OLA)方法または逆高速フーリエ変換(IFFT)を使用して周波数ドメイン−時間ドメインコンバータモジュール1703により時間ドメインに変換され、それぞれ、時間ドメインの所望のマスキング信号mn(n)となる。
図1に戻って、マスキング信号mn(n)は、今や、MIMOまたはISZシステム等の能動システムまたは指向性ラウドスピーカを有する受動システムに、それぞれのドライバに関連して、音楽等の有用信号(複数可)x(n)と共に送られ得るので、室内の所定区画内でのみ信号が聞かれ得る。このことは、マスキング信号mn(n)にとって特に重要であり、そのマスキング効果が専らある特定の区画または位置(例えば、運転手の座席または前部座席)に限定して要望されるが、他の区画または位置(例えば、右または左後部座席)ではマスキングノイズは理想的には聞こえるべきではない。
図18を参照して、図1に示した設備でMIMOシステム110として使用され得るMIMOシステム1800は、有用信号x(n)及びマスキング信号mn(n)を受信し、図1に示した設備の多数のラウドスピーカ102に供給され得る信号を出力する。任意の入力信号がMIMOシステム1800に送られ、これらの入力信号の各々がそれら自体の音区画に割り当てられる。例えば、有用信号は、全着座位置にまたは2つの前部着座位置のみに要望され得、マスキング信号は、単一位置、例えば、前部左着座位置に対してのみ意図され得る。
図19に見られるように、異なる音区画に対して意図された各入力信号、例えば、有用信号x(n)及びマスキング信号mn(n)、はそれ自体のフィルタセット、例えば、フィルタ行列1901、即ち、出力チャネルの数(多数のラウドスピーカのラウドスピーカLSPL1、…LSPLの数L)及び入力チャネルの数に対応するフィルタ数のプロセットまたは行列、を用いて重み付けされねばならない。各チャネルに対する出力信号は、その後、それぞれのチャネル及びそれらの対応するラウドスピーカLSPL1、…LSPLに送られる前に、加算器1902により合算され得る。
図20は、図1に示した設備に基づいて、少なくとも1つの音区画内に音声抑制を有する別の例示の音区画設備を説明する。マスキング信号mn(n)及び有用信号(複数可)x(n)がAECモジュール112に直接供給される図1に示した設備とは対照的に、マスキング信号mn(n)は、マスキング信号mn(n)及び有用信号(複数可)x(n)を、この合計をAECモジュール112に供給する前に加算器2001を経由して加算(またはオーバーレイ)することにより、AECモジュール112に送り返されるので、AECモジュール112は、図4に示したAECモジュール300として構成されると、6つではなく4つの適応フィルタしか必要とされない点で簡素化がなされ得る。理解されるように、図20に示した設備は、より効率的だが、マスキング信号mn(n)及び有用信号(複数可)x(n)が同一のチャネル及びラウドスピーカを介して配信されない場合には、再適合手順が生じ得る。
図21を参照して、図20に示した設備に基づいて、MIMOシステム110は、図1に示した設備のMIMOシステム110を関与させずに、マスキング信号mn(n)をラウドスピーカに供給することにより、簡素化がなされ得る。このために、マスキング信号mn(n)が、2つの加算器2101を経由して、図1に示した設備の2つのヘッドレストラウドスピーカ102a及び102bまたは図2に示した設備のヘッドレストラウドスピーカ220の入力信号に加算される。MIMOシステム110は、例えば、図19に示したMIMOシステム1800として構成されている場合は、かなりの受動減衰性能を呈する指向性ラウドスピーカ、例えば、ヘッドレスト内のラウドスピーカ、能動ビームフォーム回路を有するラウドスピーカ、受動ビームフォーム(音響レンズ)を有するラウドスピーカ、または室内の対応位置上のヘッドライナー内のEDPL等の指向性ラウドスピーカ等の、近距離音場ラウドスピーカ、を使用すれば、マスキング信号mn(n)を供給されるフィルタ行列1901中のL個の適応フィルタが省略されてISZシステム2102を形成し得る点で、簡素化され得るので、ISZシステムが図21に示すように形成される。
図22を参照して、図1に示した設備に基づいて、(例えば、非適応)処理システム2201が、図1に示した設備のMIMOシステム110に代えて採用され得る。マスキング信号mn(n)が、加算器2202を経由して、かなりの受動減衰性能を呈するラウドスピーカ102の入力信号に加算される。即ち、かなりの受動減衰性能を呈する指向性ラウドスピーカ、例えば、例えば、ヘッドレスト内のラウドスピーカ、能動ビームフォーム回路を有するラウドスピーカ、受動ビームフォーム(音響レンズ)を有するラウドスピーカ、または室内の対応位置上のヘッドライナー内のEDPL等の指向性ラウドスピーカ等の、近距離音場ラウドスピーカ、が使用されるので、受動システムが図22に示すように形成される。マスキング信号mn(n)及び有用信号(複数可)x(n)は、別々にAECモジュール112に供給される。
上述のシステム及び方法に使用されるモジュールは、ハードウェアまたはソフトウェアもしくはハードウェアとソフトウェアの組み合わせを含み得ることが理解される。
本発明の種々の実施形態を説明したが、さらに多くの実施形態および実装例が本発明の適用範囲内で可能であることが当業者に明らかであろう。

Claims (15)

  1. 受聴者の位置及び話者の位置を含む室と、
    前記室内に配置された多数のラウドスピーカと、
    前記室内に配置された少なくとも1つのマイクロホンと、
    前記多数のラウドスピーカ及び前記少なくとも1つのマイクロホンに接続された信号処理モジュールであって、
    前記多数のラウドスピーカと関連して、第1の音区画を前記受聴者の位置の周囲に確立し、第2の音区画を前記話者の位置の周囲に確立し、
    前記少なくとも1つのマイクロホンと関連して、前記第1の音区画内に存在する音の状態のパラメータを決定し、かつ
    前記多数のラウドスピーカと関連して、かつ前記第1の音区画内の前記決定された音の状態に基づいて、前記第1の音区画内の共通音声了解度を低減するように構成された音声マスキング音を前記第1の音区画内に生成する、
    ように構成された、前記信号処理モジュールと、
    を備える、音区画設備。
  2. 前記信号処理モジュールは、前記第1の音区画内の前記音の状態を表す少なくとも1つの信号を受信し、かつ前記第1の音区画内の前記音の状態を表す前記信号ならびに心理音響マスキングモデル及び共通音声了解度モデルのうちの少なくとも1つに基づいて音声マスキング信号を提供するように構成された、マスキング信号計算モジュールを備える、請求項1に記載の前記音区画設備。
  3. 前記信号処理モジュールは、前記音声マスキング信号を受信し、及び前記多数のラウドスピーカと関連して、かつ前記音声マスキング信号に基づいて、前記音声マスキング音を前記第1の音区画内に生成するように構成された、多入力多出力システムを備える、請求項2に記載の前記音区画設備。
  4. 前記多数のラウドスピーカは、指向性ラウドスピーカ、能動ビームフォーマを有するラウドスピーカ、近接場ラウドスピーカ、及び音響レンズを有するラウドスピーカのうちの少なくとも1つを備える、請求項2または3に記載の前記音区画設備。
  5. 前記信号処理モジュールは、前記少なくとも1つのマイクロホンに接続されて、少なくとも1つのマイクロホン信号を受信する音響エコー消去モジュールを備え、前記エコー消去モジュールは、少なくとも前記音声マスキング信号を更に受信するように構成され、かつ前記第1の音区画内の前記音の状態を決定するための、前記少なくとも1つのマイクロホン信号に含まれる少なくとも前記音声マスキング信号の前記音響エコーの推定を表す、少なくともある信号を提供するように構成される、請求項2〜4のいずれかに記載の前記音区画設備。
  6. 前記信号処理モジュールは、
    前記マイクロホン信号に含まれる音声信号を推定するように、かつ前記推定された音声信号を表す信号を提供するように構成されたノイズ低減モジュールと、
    前記推定された音声信号を表す前記信号を受信するように、かつ前記推定された音声信号に更に基づいて前記第1の音区画内の前記音の状態を表す前記信号を生成するように構成された利得計算モジュールと、
    を更に備える、請求項5に記載の前記音区画設備。
  7. 前記信号処理モジュールは、前記マイクロホン信号に含まれる周囲ノイズ信号を推定するように、かつ前記推定されたノイズ信号を表す信号を提供するように構成されたノイズ推定モジュールと、
    前記推定されたノイズ信号を表す前記信号を受信するように、かつ前記推定されたノイズ信号に更に基づいて前記第1の音区画内の前記音の状態を表す前記信号を生成するように構成された利得計算モジュールと、を更に備える、請求項5または6のいずれかに記載の前記音区画設備。
  8. 前記第2の音区画内の前記話者は、ハンズフリーの通信端末を介して遠隔話者と通信する近接話者であり、
    前記信号処理モジュールは、音を前記通信端末から前記第1の音区画ではなく前記第2の音区画に向けるように更に構成される、請求項1〜7のいずれかに記載の前記音区画設備。
  9. 受聴者の位置及び話者の位置を含む室内に、前記室内に配置された多数のラウドスピーカ及び前記室内に配置された少なくとも1つのマイクロホンにより音区画を配設する方法であって、
    前記多数のラウドスピーカと関連して、第1の音区画を前記受聴者の位置の周囲に確立し、第2の音区画を前記話者の位置の周囲に確立することと、
    前記少なくとも1つのマイクロホンと関連して、前記第1の音区画内に存在する音の状態のパラメータを決定することと、
    前記多数のラウドスピーカと関連して、かつ前記第1の音区画内の前記決定された音の状態に基づいて、前記第1の音区画内の共通音声了解度を低減するように構成される音声マスキング音を前記第1の音区画内に生成することと、
    を含む、前記方法。
  10. 前記第1の音区画内の前記音の状態を表す前記信号、ならびに心理音響マスキングモデル及び共通音声了解度モデルのうちの少なくとも1つに基づいて、音声マスキング信号を提供することを更に含む、請求項9に記載の前記方法。
  11. 前記音区画を確立することに関して、
    前記音声マスキング信号を多入力多出力システムで処理して、前記多数のラウドスピーカと関連して、かつ前記音声マスキング信号に基づいて、前記音声マスキング音を前記第1の音区画内に生成することと、
    指向性ラウドスピーカ、能動ビームフォーマを有するラウドスピーカ、近接場ラウドスピーカ、及び音響レンズを有するラウドスピーカのうちの少なくとも1つを採用することと、の少なくとも1つを更に含む、請求項10に記載の前記方法。
  12. 少なくとも前記音声マスキング信号に基づいて、前記マイクロホン信号に含まれる少なくとも前記音声マスキング信号の前記音響エコーの推定を表す少なくとも1つの信号を生成することと、
    前記マイクロホン信号に含まれる少なくとも前記音声マスキング信号の前記エコーの前記推定に基づいて、前記第1の音区画内の前記音の状態を表す前記信号を生成することと、を更に含む、請求項10または11のいずれかに記載の前記方法。
  13. 前記マイクロホン信号に含まれる音声信号を推定して、前記推定された音声信号を表す信号を提供することと、
    前記推定された音声信号に更に基づいて、前記第1の音区画内の前記音の状態を表す前記信号を生成することと、
    を更に含む、請求項12に記載の前記方法。
  14. 前記マイクロホン信号に含まれる周囲ノイズ信号を推定して、前記推定されたノイズ信号を表す信号を提供することと、
    前記推定されたノイズ信号に更に基づいて、前記第1の音区画内の前記音の状態を表す前記信号を生成することと、
    を更に含む、請求項13に記載の前記方法。
  15. 前記第2の音区画内の前記話者は、ハンズフリーの通信端末を介して遠隔話者に通信をする近接話者であり、前記方法は、
    音を前記通信端末から前記第1の音区画ではなく前記第2の音区画に向けることを更に含む、請求項9〜14のいずれかに記載の前記方法。

JP2015247316A 2015-01-02 2015-12-18 区画別音声抑制を有する音区画設備 Pending JP2016126335A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP15150040.2 2015-01-02
EP15150040.2A EP3040984B1 (en) 2015-01-02 2015-01-02 Sound zone arrangment with zonewise speech suppresion

Publications (1)

Publication Number Publication Date
JP2016126335A true JP2016126335A (ja) 2016-07-11

Family

ID=52282603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015247316A Pending JP2016126335A (ja) 2015-01-02 2015-12-18 区画別音声抑制を有する音区画設備

Country Status (3)

Country Link
US (1) US9711131B2 (ja)
EP (1) EP3040984B1 (ja)
JP (1) JP2016126335A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019120828A (ja) * 2018-01-09 2019-07-22 クラリオン株式会社 プライバシー保護システム
CN110050471A (zh) * 2016-12-07 2019-07-23 迪拉克研究公司 相对于亮地带和暗地带优化的音频预补偿滤波器
JP2022144105A (ja) * 2021-03-18 2022-10-03 本田技研工業株式会社 音響制御装置

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102013217367A1 (de) * 2013-05-31 2014-12-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zur raumselektiven audiowiedergabe
EP2930958A1 (en) 2014-04-07 2015-10-14 Harman Becker Automotive Systems GmbH Sound wave field generation
US10247795B2 (en) * 2014-12-30 2019-04-02 General Electric Company Method and apparatus for non-invasive assessment of ripple cancellation filter
KR101744749B1 (ko) * 2015-10-20 2017-06-08 현대자동차주식회사 소음 측정 장치, 및 소음 측정 방법
GB2553571B (en) * 2016-09-12 2020-03-04 Jaguar Land Rover Ltd Apparatus and method for privacy enhancement
US10049686B1 (en) 2017-02-13 2018-08-14 Bose Corporation Audio systems and method for perturbing signal compensation
GB2560884B (en) * 2017-03-20 2020-08-19 Jaguar Land Rover Ltd Apparatus and method for privacy enhancement
US10366708B2 (en) 2017-03-20 2019-07-30 Bose Corporation Systems and methods of detecting speech activity of headphone user
GB2565518B (en) * 2017-03-20 2021-07-28 Jaguar Land Rover Ltd Apparatus and method for privacy enhancement
DE112018001454T5 (de) 2017-03-20 2019-12-12 Jaguar Land Rover Limited Vorrichtung und verfahren zur verbesserung der privatsphäre
US10249323B2 (en) 2017-05-31 2019-04-02 Bose Corporation Voice activity detection for communication headset
EP3425925A1 (en) * 2017-07-07 2019-01-09 Harman Becker Automotive Systems GmbH Loudspeaker-room system
DE102018117558A1 (de) * 2017-07-31 2019-01-31 Harman Becker Automotive Systems Gmbh Adaptives nachfiltern
US20190037363A1 (en) * 2017-07-31 2019-01-31 GM Global Technology Operations LLC Vehicle based acoustic zoning system for smartphones
US11587544B2 (en) * 2017-08-01 2023-02-21 Harman Becker Automotive Systems Gmbh Active road noise control
US10276143B2 (en) * 2017-09-20 2019-04-30 Plantronics, Inc. Predictive soundscape adaptation
US10481831B2 (en) * 2017-10-02 2019-11-19 Nuance Communications, Inc. System and method for combined non-linear and late echo suppression
CN109720288B (zh) 2017-10-27 2019-11-22 比亚迪股份有限公司 一种主动降噪方法、***及新能源车
CN115002644A (zh) * 2018-01-09 2022-09-02 杜比实验室特许公司 降低不需要的声音传输
US10657981B1 (en) * 2018-01-19 2020-05-19 Amazon Technologies, Inc. Acoustic echo cancellation with loudspeaker canceling beamformer
FR3078931B1 (fr) * 2018-03-14 2021-01-15 Renault Sas Dispositif et procede pour l'amenagement d'au moins une zone acoustique privee dans l'habitacle d'un vehicule
US10438605B1 (en) * 2018-03-19 2019-10-08 Bose Corporation Echo control in binaural adaptive noise cancellation systems in headsets
JP7186375B2 (ja) * 2018-03-29 2022-12-09 パナソニックIpマネジメント株式会社 音声処理装置、音声処理方法および音声処理システム
EP3797528B1 (en) 2018-04-13 2022-06-22 Huawei Technologies Co., Ltd. Generating sound zones using variable span filters
US11423921B2 (en) 2018-06-11 2022-08-23 Sony Corporation Signal processing device, signal processing method, and program
WO2020033595A1 (en) 2018-08-07 2020-02-13 Pangissimo, LLC Modular speaker system
CN109545230B (zh) * 2018-12-05 2021-10-19 百度在线网络技术(北京)有限公司 车辆内的音频信号处理方法和装置
EP3906708A4 (en) * 2019-01-06 2022-10-05 Silentium Ltd. SOUND CONTROL DEVICE, SYSTEM AND METHOD
SE543816C2 (en) 2019-01-15 2021-08-03 Faurecia Creo Ab Method and system for creating a plurality of sound zones within an acoustic cavity
KR102680850B1 (ko) * 2019-06-10 2024-07-04 현대자동차주식회사 차량 및 차량의 제어방법
US10645520B1 (en) * 2019-06-24 2020-05-05 Facebook Technologies, Llc Audio system for artificial reality environment
CN110598278B (zh) * 2019-08-27 2023-04-07 中国舰船研究设计中心 一种船舶机械***声学特性的评价方法
CN110728970B (zh) * 2019-09-29 2022-02-25 东莞市中光通信科技有限公司 一种数字辅助隔音处理的方法及装置
US11205439B2 (en) * 2019-11-22 2021-12-21 International Business Machines Corporation Regulating speech sound dissemination
CN113223545A (zh) * 2020-02-05 2021-08-06 字节跳动有限公司 一种语音降噪方法、装置、终端及存储介质
JP7461771B2 (ja) * 2020-03-26 2024-04-04 株式会社ディーアンドエムホールディングス マルチチャンネルオーディオシステム、マルチチャンネルオーディオ装置、プログラム、およびマルチチャンネルオーディオ再生方法
CN113874938B (zh) * 2020-03-31 2022-08-19 华为技术有限公司 一种音频去噪方法及装置
US20230199419A1 (en) * 2020-05-20 2023-06-22 Harman International Industries, Incorporated System, apparatus, and method for multi-dimensional adaptive microphone-loudspeaker array sets for room correction and equalization
DE102021209638A1 (de) * 2020-09-02 2022-03-03 Continental Engineering Services Gmbh Verfahren zur verbesserten Beschallung mehrerer Beschallungsplätze
FR3118264B1 (fr) * 2020-12-23 2023-11-03 Psa Automobiles Sa Procédé restitution sonore permettant de générer des zones d’écoute différenciées dans un espace clos tel qu’un habitable de véhicule
CN112968741B (zh) * 2021-02-01 2022-05-24 中国民航大学 基于最小二乘向量机的自适应宽带压缩频谱感知算法
CN114499613A (zh) * 2021-12-09 2022-05-13 清华大学 近场宽带波束赋形方法、装置、电子设备及存储介质
CN114501234A (zh) * 2022-04-08 2022-05-13 远峰科技股份有限公司 智能座舱域多音区蓝牙音频播放方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005084645A (ja) * 2003-09-11 2005-03-31 Glory Ltd マスキング装置
JP2011215357A (ja) * 2010-03-31 2011-10-27 Sony Corp 信号処理装置、信号処理方法及びプログラム
JP2012098632A (ja) * 2010-11-05 2012-05-24 Yamaha Corp マスカ音出力装置及び音声通話装置
JP2012098631A (ja) * 2010-11-05 2012-05-24 Yamaha Corp 音声処理装置
JP2013231987A (ja) * 2013-06-24 2013-11-14 Yamaha Corp 会話漏洩防止装置
WO2014016723A2 (en) * 2012-07-24 2014-01-30 Koninklijke Philips N.V. Directional sound masking

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7433821B2 (en) 2003-12-18 2008-10-07 Honeywell International, Inc. Methods and systems for intelligibility measurement of audio announcement systems
CA2471674A1 (en) * 2004-06-21 2005-12-21 Soft Db Inc. Auto-adjusting sound masking system and method
US8126159B2 (en) * 2005-05-17 2012-02-28 Continental Automotive Gmbh System and method for creating personalized sound zones
JP4875090B2 (ja) 2005-09-20 2012-02-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声明瞭度を測定するための方法およびテスト信号
EP1770685A1 (en) * 2005-10-03 2007-04-04 Maysound ApS A system for providing a reduction of audiable noise perception for a human user
DE102007000608A1 (de) * 2007-10-31 2009-05-07 Silencesolutions Gmbh Maskierung für Schall
US9020158B2 (en) * 2008-11-20 2015-04-28 Harman International Industries, Incorporated Quiet zone control system
EP2211564B1 (en) * 2009-01-23 2014-09-10 Harman Becker Automotive Systems GmbH Passenger compartment communication system
US8670986B2 (en) * 2012-10-04 2014-03-11 Medical Privacy Solutions, Llc Method and apparatus for masking speech in a private environment
EP2806663B1 (en) * 2013-05-24 2020-04-15 Harman Becker Automotive Systems GmbH Generation of individual sound zones within a listening room

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005084645A (ja) * 2003-09-11 2005-03-31 Glory Ltd マスキング装置
JP2011215357A (ja) * 2010-03-31 2011-10-27 Sony Corp 信号処理装置、信号処理方法及びプログラム
JP2012098632A (ja) * 2010-11-05 2012-05-24 Yamaha Corp マスカ音出力装置及び音声通話装置
JP2012098631A (ja) * 2010-11-05 2012-05-24 Yamaha Corp 音声処理装置
WO2014016723A2 (en) * 2012-07-24 2014-01-30 Koninklijke Philips N.V. Directional sound masking
JP2015526761A (ja) * 2012-07-24 2015-09-10 コーニンクレッカ フィリップス エヌ ヴェ 指向性音マスキング
JP2013231987A (ja) * 2013-06-24 2013-11-14 Yamaha Corp 会話漏洩防止装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110050471A (zh) * 2016-12-07 2019-07-23 迪拉克研究公司 相对于亮地带和暗地带优化的音频预补偿滤波器
CN110050471B (zh) * 2016-12-07 2022-01-21 迪拉克研究公司 相对于亮地带和暗地带优化的音频预补偿滤波器
US11246000B2 (en) 2016-12-07 2022-02-08 Dirac Research Ab Audio precompensation filter optimized with respect to bright and dark zones
JP2019120828A (ja) * 2018-01-09 2019-07-22 クラリオン株式会社 プライバシー保護システム
JP2022144105A (ja) * 2021-03-18 2022-10-03 本田技研工業株式会社 音響制御装置
JP7241117B2 (ja) 2021-03-18 2023-03-16 本田技研工業株式会社 音響制御装置

Also Published As

Publication number Publication date
EP3040984A1 (en) 2016-07-06
EP3040984B1 (en) 2022-07-13
US9711131B2 (en) 2017-07-18
US20160196818A1 (en) 2016-07-07

Similar Documents

Publication Publication Date Title
US9711131B2 (en) Sound zone arrangement with zonewise speech suppression
CN110476208B (zh) 用于扰动信号补偿的音频***和方法
US8160282B2 (en) Sound system equalization
US8081776B2 (en) Indoor communication system for a vehicular cabin
US8306234B2 (en) System for improving communication in a room
EP2211564B1 (en) Passenger compartment communication system
US8194880B2 (en) System and method for utilizing omni-directional microphones for speech enhancement
CN102804805B (zh) 耳机装置及用于其的操作方法
Schmidt et al. Signal processing for in-car communication systems
Li et al. Two-stage binaural speech enhancement with Wiener filter for high-quality speech communication
US20110150257A1 (en) Adaptive feedback cancellation based on inserted and/or intrinsic characteristics and matched retrieval
Kamkar-Parsi et al. Instantaneous binaural target PSD estimation for hearing aid noise reduction in complex acoustic environments
WO2015130283A1 (en) Methods and apparatus for adaptive gain control in a communication system
US9532149B2 (en) Method of signal processing in a hearing aid system and a hearing aid system
CN104980846A (zh) 降低电嘶嘶声的anc主动噪声控制音频头戴式耳机
CN105304089B (zh) 虚拟的遮蔽方法
KR20040019362A (ko) 후처리기로서 멀티 마이크로폰 에코 억제기를 가지는 음향보강 시스템
JP2004537940A (ja) 音響心理学的モデル及びオーバーサンプル型フィルタバンクを用いる音声明瞭度の向上
KR20040019339A (ko) 반향 억제기 및 확성기 빔 형성기를 구비한 사운드 보강시스템
US20150289063A1 (en) Hearing aid with improved localization of a monaural signal source
US10643597B2 (en) Method and device for generating and providing an audio signal for enhancing a hearing impression at live events
US11153695B2 (en) Hearing devices and related methods
EP1843636B1 (en) Method for automatically equalizing a sound system
Schmidt Applications of acoustic echo control-an overview
EP3886463A1 (en) Method at a hearing device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191209

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200109