JP4245060B2 - サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム - Google Patents

サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム Download PDF

Info

Publication number
JP4245060B2
JP4245060B2 JP2007075282A JP2007075282A JP4245060B2 JP 4245060 B2 JP4245060 B2 JP 4245060B2 JP 2007075282 A JP2007075282 A JP 2007075282A JP 2007075282 A JP2007075282 A JP 2007075282A JP 4245060 B2 JP4245060 B2 JP 4245060B2
Authority
JP
Japan
Prior art keywords
sound
signal
frames
frame length
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007075282A
Other languages
English (en)
Other versions
JP2008233671A (ja
Inventor
敦子 伊藤
寧 清水
晃 三木
雅人 秦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2007075282A priority Critical patent/JP4245060B2/ja
Priority to AT08102648T priority patent/ATE431610T1/de
Priority to DE602008000013T priority patent/DE602008000013D1/de
Priority to EP08102648A priority patent/EP1973102B1/en
Priority to US12/051,695 priority patent/US8050931B2/en
Priority to CA2627484A priority patent/CA2627484C/en
Publication of JP2008233671A publication Critical patent/JP2008233671A/ja
Application granted granted Critical
Publication of JP4245060B2 publication Critical patent/JP4245060B2/ja
Priority to US13/240,937 priority patent/US8271288B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/1752Masking
    • G10K11/1754Speech masking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K1/00Secret communication
    • H04K1/02Secret communication by adding a second signal to make the desired signal unintelligible
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K1/00Secret communication
    • H04K1/06Secret communication by transmitting the information or elements thereof at unnatural speeds or in jumbled order or backwards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K3/00Jamming of communication; Counter-measures
    • H04K3/80Jamming or countermeasure characterized by its function
    • H04K3/82Jamming or countermeasure characterized by its function related to preventing surveillance, interception or detection
    • H04K3/825Jamming or countermeasure characterized by its function related to preventing surveillance, interception or detection by jamming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K2203/00Jamming of communication; Countermeasures
    • H04K2203/10Jamming or countermeasure used for a particular application
    • H04K2203/12Jamming or countermeasure used for a particular application for acoustic communication

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Shielding Devices Or Components To Electric Or Magnetic Fields (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)

Description

本発明は、マスキングサウンドを生成する技術に関する。
ある音(対象音)が聞こえているときに対象音に近い音響特性(周波数特性など)を持つ別の音(マスキングサウンド)が存在すると、その対象音が聞こえにくくなるという現象が一般に知られており、マスキング効果と呼ばれている。マスキング効果は、人間の聴覚特性に根ざしたものであり、マスキングサウンドの周波数が対象音の周波数に近いほど、また、マスキングサウンドの音量レベルが対象音の音量レベルに対して相対的に高いほど顕著になることが知られている。
このマスキング効果を利用した音響技術は、従来種々提案されており、その例として特許文献1に開示された技術が挙げられる。特許文献1には、音信号を複数のセグメントに分断し、この複数のセグメントの順序を入れ替えることにより音声を無意味化しマスキングサウンドを生成する技術が開示されている。
特表2005−534061号公報
また、特許文献1に記載の技術によれば、ストリームの分割位置によってマスキング効果が減少することがあった。すなわち、含まれる音素を分断するようにストリームを分割できれば音声は適切にスクランブルされ高いマスキング効果を期待できるが、一定のフレーム長で分割すると、適した場所で音素が分割されないことがあった。音素を確実に分割するためにフレーム長を短く設定した場合、生成されるマスキングサウンドは違和感のある音声になってしまうため、適切なフレーム長の設定は困難であった。
本発明は上記の問題に鑑みてなされたものであり、収音した音信号を元に効果的なマスキングサウンドを生成する技術を提供することにある。
本発明に係るサウンドマスキングシステムは、音声を収音し対応する音声信号を生成する収音手段と、前記収音手段が生成した前記音声信号に基づいて前記収音された音声の発話の速度を示す話速信号を生成する話速信号生成手段と、前記発話の速度と前記音声信号を所定時間長に分割する区間を表すフレーム長とが対応付けて書き込まれたテーブルと、前記話速信号生成出手段が生成した話速信号に対応するフレーム長を前記テーブルから読み出す読出手段と、前記収音手段が生成した音声信号を複製して複数の系列に分岐し、該分岐した各系列の音声信号を前記読出手段が読み出したフレーム長に基づいて複数のフレームに分割し、該分割した複数のフレームの時系列が各系列において変更されるように再構成し、該再構成した各音声信号をスクランブル信号として出力するスクランブル手段とを具備することを特徴とする。
本発明に係るサウンドマスキングシステムは、上記の構成において、前記スクランブル手段は、前記読出手段が読み出したフレーム長に基づいて、前記各系列のフレーム分割におけるフレームの長さが各系列で異なるように分割用フレーム長を生成し、該生成した分割用フレーム長を用いて各系列の音声信号をフレームに分割しても良い。
本発明に係るサウンドマスキングシステムは、上記の構成において、前記テーブルは、一つの発話の速度に対して前記各系列に対するフレーム長を対応させて記憶し、前記スクランブル手段は、前記読出手段が読み出した前記各系列に対するフレーム長に基づいて前記各系列の音声信号をフレームに分割しても良い。
本発明に係るサウンドマスキングシステムは、上記の構成において、前記話速信号生成手段が生成した話速信号を加工し複数の話速信号を生成する加工手段を更に備え、前記読出手段は、前記加工手段が生成した複数の話速信号とそれぞれ対応するフレーム長を前記テーブルから読み出し、前記スクランブル手段は、前記読出手段が読み出した各フレーム長を用いて各系列の音声信号をフレームに分割しても良い。
本発明に係るサウンドマスキングシステムは、上記の構成において、前記スクランブル手段は、前記音声信号が分割された結果生成された複数のフレームの各々を、該フレームを時間的に逆に読み出すことにより生成した音声信号に置き換えるリバース手段を更に有していても良い。
本発明に係るサウンドマスキングシステムは、上記の構成において、前記スクランブル手段は、前記音声信号が分割された結果生成された複数のフレームを、元の音声信号における順序とは異なる順序に並べ替える並べ替え手段を更に有していても良い。
本発明に係るサウンドマスキングシステムの別の構成は、音声を収音し対応する音声信号を生成する収音手段と、前記収音手段が生成した前記音声信号に基づいて前記収音された音声の発話の速度を示す話速信号を生成する話速信号生成手段と、前記発話の速度と前記音声信号を所定時間長に分割する区間を表すフレーム長とが対応付けて書き込まれたテーブルと、前記話速信号生成出手段が生成した話速信号に対応するフレーム長を前記テーブルから読み出す読出手段と、前記収音手段が生成した音声信号を前記読出手段が読み出したフレーム長に基づいて複数のフレームに分割し、分割した複数のフレームの各々を、該フレームを時間的に逆に読み出すことにより生成した音声信号に置き換え、該置き換えられた複数のフレームを時系列が変更されるように再構成し、再構成後の各音声信号をスクランブル信号として出力するスクランブル手段とを具備することを特徴とする。
本発明に係るサウンドマスキングシステムは、上記の構成において、前記スクランブル手段により分割された複数のフレームの頭部および尾部の波形を加工する波形加工手段を更に有していても良い。
本発明に係るマスキングサウンド生成方法は、音声を収音し対応する音声信号を生成する収音段階と、前記収音段階において生成された前記音声信号に基づいて前記収音された音声の発話の速度を示す話速信号を生成する話速信号生成段階と、前記話速信号生成出段階において生成された話速信号に対応するフレーム長を前記発話の速度と前記音声信号を所定時間長に分割する区間を表すフレーム長とが対応付けて書き込まれたテーブルから読み出す読出段階と、前記収音段階において生成された音声信号を複製して複数の系列に分岐し、該分岐した各系列の音声信号を前記読出段階において読み出されたフレーム長に基づいて複数のフレームに分割し、該分割した複数のフレームの時系列が各系列において変更されるように再構成し、該再構成した各音声信号をスクランブル信号として出力するスクランブル段階とを具備することを特徴とする。
本発明に係るプログラムは、コンピュータを、音声を収音し対応する音声信号を生成する収音手段と、前記収音手段が生成した前記音声信号に基づいて前記収音された音声の発話の速度を示す話速信号を生成する話速信号生成手段と、前記話速信号生成出手段が生成した話速信号に対応するフレーム長を前記発話の速度と前記音声信号を所定時間長に分割する区間を表すフレーム長とが対応付けて書き込まれたテーブルから読み出す読出手段と、前記収音手段が生成した音声信号を複製して複数の系列に分岐し、該分岐した各系列の音声信号を前記読出手段が読み出したフレーム長に基づいて複数のフレームに分割し、該分割した複数のフレームの時系列が各系列において変更されるように再構成し、該再構成した各音声信号をスクランブル信号として出力するスクランブル手段として機能させることを特徴とする。
本発明に係るサウンドマスキングシステムまたはマスキングサウンド生成方法またはプログラムにより、収音した音信号を元に効果的なマスキングサウンドを生成することができる。
以下、本発明の実施形態について図面を用いて説明する。
(A;構成)
(A−1;全体構成)
図1は、本発明に係るサウンドマスキングシステム1の構成を示す図である。図1に示すように、音響空間20Aには、マイクロホン30が天井から吊り下げられて設置されている。音響空間20Bにはスピーカ40が天井から吊り下げられて設置されている。
マイクロホン30は、音響空間20Aにおける音(人間の話し声や空調の動作音などの可聴音)を収音してアナログの音信号に変換し、マスキングサウンド生成装置10へ出力する。
スピーカ40は、マスキングサウンド生成装置10からアナログの音信号を受取り、音響空間20Bにおいて再生する。
(A−2;マスキングサウンド生成装置10の構成)
次に、マスキングサウンド生成装置10の構成について図2を参照して説明する。マスキングサウンド生成装置10は、マスキングサウンド(マスカー)を表す音信号を生成する。該マスキングサウンドは音響空間20Bにおいて放音され、音響空間20Aにおける会話の内容を他の音響空間20Bのユーザに聞きとられにくくしたり(セキュリティーの保護)、他の音響空間20Bのユーザが音響空間20Aから漏れ聞こえる音により会話が妨害されたり作業の集中を乱されたりしないようにする(騒音のマスキング)。
CPU(Central Processing Unit)100は、記憶部200に格納されている各種プログラムを実行することにより本発明に特徴的な動作を行ったり、マスキングサウンド生成装置10の各部の動作を制御したりする。
音声入力部300は、アナログ/デジタル(以下、「A/D」と略記する)コンバータ310と入力端子320とを有する。入力端子320にはマイクロホン30が接続されており、マイクロホン30により生成された音信号は、入力端子320を介してA/Dコンバータ310へ入力される。A/Dコンバータ310は、マイクロホン30から受取った音信号にA/D変換を施し、その変換結果であるデジタルの音信号をCPU100へ出力する。
音声出力部400は、D/Aコンバータ410とアンプ420と出力端子430とを有する。D/Aコンバータ410は、CPU100から受取った音信号に対して、D/A変換を施すことによってアナログの音信号へ変換する。アンプ420は、D/Aコンバータ410から受取った音信号の振幅(マスタボリューム)を最適な値に調整して、マスキング効果が最大となるように制御する。音信号の増幅率は、後述する操作部500からの信号に基づいてCPU100により制御される。出力端子430はスピーカ40と接続されており、音信号はスピーカ40へ出力され、音響空間20Bにおいてマスキングサウンド(マスカー)として放音される。
記憶部200は、ROM(Read Only Memory)210およびRAM(Random Access Memory)220を有する。
ROM210は、本発明に特徴的な機能をCPU100に実行させるための制御プログラムやデータが格納されている。
RAM220は、各種の記憶領域を有する。該記憶領域は、CPU100によってワークエリアとして利用されると共に、マイクロホン30から受取った音信号やマスキングサウンドの音信号を生成するための各種データを記憶する。
以上に説明した各ユニットは、バス500を介して接続されており、互いにデータの授受を行う。
次に、ROM210に記憶されている制御プログラムについて説明する。CPU100は、制御プログラムを実行することにより、以下に説明する処理を始めとする各種の処理を実行する。
まず、「話速分析処理」について説明する。本実施形態において、「話速(発話の速度)」とは、音声が発せられるときの速さであり、単位時間あたりの音節数などで定義される。ここで音節とは、一定の声の長さを持つ音素(例えば母音)のまとまり、または一定の声の長さを持つ音素の前および/または後に非常に短い音素(例えば子音)を従えるまとまりを意味する。話速分析処理において、CPU100は、受取った音信号の各フレームについて、音信号の時間軸波形を生成し、当該時間軸波形のエンベロープ(包絡線)にスムージング処理を施す。そしてスムージング処理された波形から各音節を構成する波形のピーク位置をフレームごとに検出して、ピーク数を計測する。その後、当該ピーク数を音節数とし、音節数をフレーム長で除した単位時間あたりの音節数を話速として算出する。ここでピークとは、各音節を構成する波形においてレベルが最大の箇所を言う。話速は音信号における時間経過に伴い変化し、CPU100は、上記所定時間おきにその時点での話速を分析し出力する。
次に、音信号の「リバース処理」について説明する。リバース処理において、CPU100は、受取った音信号の各フレームを一旦時間軸領域の信号に変換する。そして、該音信号の各フレームを時間軸において逆から読み出し、各音信号を新たな音信号へ変換する。本処理は、すなわち元の音信号が生成された順序とは逆の時間的順序で古いデータから読み出して新たな音信号を生成する処理である。このリバース処理により生成された音信号からは、処理前の音信号に含まれていた内容を理解することはできない。
次に、音信号の各フレームの「窓掛け処理」について説明する。窓掛け処理とは、音として内容が連続していないフレーム同士を接続する場合に、その音がスムーズに移行するように接続部分の波形を変換する処理である。
具体的には、CPU100は、例えば三角関数などからなる「整形関数」を各フレームの音信号に乗算することにより、各フレームの頭部では滑らかに立ち上がるように、そして各フレームの尾部では滑らかに立ち下がるように整形する。音響処理により連続した音信号が複数のフレームに分割され、元の音信号と異なる順序で接続された場合には、その接続部分においてクリックノイズが発生することがあるが、この窓掛け処理により該ノイズは除去される。
次に、ROM210に記憶されているデータである「フレーム長選択テーブル」について説明する。図3は、フレーム長選択テーブルの1例を示した図である。フレーム長選択テーブルにおいては、上述した話速の範囲に対してフレーム長が対応付けられている。例えば、話速7.5以上12.5未満〔秒−1〕に対して、フレーム長の値0.10〔秒〕が対応付けられている。ここで、1フレーム長は、話速が各話速の範囲の中間の値であるときの1音節の時間と同程度に設定した。すなわち、話速10〔秒−1〕では1音節の発話速度は0.10秒であり、話速10〔秒−1〕が含まれる話速7.5以上12.5未満の範囲に対応するフレーム長をこの1音節の発話時間(0.10秒)に設定した。これは、1フレーム長が1音節より極端に短い時間の場合には、1音節が複数フレームに分割され、各フレームをリバース再生しても元の音節として認識されるおそれがあり、1フレーム長が1音節より極端に長い時間の場合には、各フレームをランダムに再構成しても1フレーム内の各音節がそのまま認識されるおそれがあるからである。
(B;動作)
次に、本実施形態の動作について説明する。図4は、CPU100が実行するマスキングサウンド生成処理の流れを示すフローチャートである。また、図5は、マスキングサウンド生成処理による音信号の波形変化を概念的に示した図である。
RAM220は、受取った音信号に所定の処理を行うために必要な所定時間分(例えば2秒分)記憶可能な音信号バッファ領域を有する。受取った音信号は一旦RAM220に書き込まれる。以下に説明する処理は、上記音信号バッファ領域の容量分書き込まれた音信号について実行される。なお、新たな音信号を受け取った場合には、この新たな音信号が前記音信号バッファ領域の古いデータから順次上書き更新され、CPU100は新たな音信号について処理を行う。
ステップSA100において、マスキングサウンド生成装置10は、音響空間20Aに設置されたマイクロホン30から音信号を受取る。該音信号は、音声入力部300でデジタルの音信号に変換され、RAM220に一旦書き込まれる。
ステップSA110において、CPU100は、RAM220に書き込まれた音信号の話速を分析する。CPU100は、解析結果をRAM220に書き込む。
ステップSA120において、CPU100は、RAM220に書き込まれた音信号を複製し、その結果生成された3つの音信号をRAM220に書き込む。なお、以下ではこれらの音信号を音信号A、B、およびCと呼ぶ。以下に説明するステップSA130ないし170は、音信号A、B、およびCのそれぞれについて行われ、それらの音信号は互いに異なる音信号へと変換される。
ステップSA130において、CPU100は、音信号のフレーム化を以下のように行う。すなわち、CPU100は、当該音信号の話速に関する情報をRAM220から読み出す。CPU100は、所定時間ごとの話速を読み出し、それらの平均値と各話速の値のばらつきである標準偏差σを算出する。そしてCPU100は、ROM210に記憶されているフレーム長選択テーブルにおいて、平均値、平均値+σ、平均値−σの値に対応付けられたフレーム長を読み出す。そしてCPU100は、各音信号を読み出したフレーム長で分断し、分断した音信号(フレーム)をRAM220に書き込む。なお、図5の(a)―A、(a)―B、および(a)―Cには、音信号A、B、およびCがそれぞれ異なるフレーム長で分断された状況が示されている。
ステップSA140において、CPU100は、RAM220に書き込まれた音信号のフレームの各々について、上述したリバース処理を行う。リバース処理がなされた結果、音信号A、B、およびCの各フレームは、それぞれ図5の(b)―A、(b)―B、および(b)―Cに示されるようにフレーム内で時間的に逆に読み出された音信号に変換される。
ステップSA150において、各フレームには窓掛け処理が行われる。その結果、各フレームの頭部および尾部に対応する部分の波形が整形される。
ステップSA160において、CPU100は、各音信号についてその複数のフレームの順序をランダムに並べ替える(図5(c)参照)。
ステップSA170において、CPU100は、並べ替えられたフレームの音信号をつなぎ合わせ、新たな音信号を生成する。
ステップSA180において、CPU100は、ステップSA130ないし170においてそれぞれ別個に処理がなされた音信号A、B、およびCをミキシング(加算)処理し、マスキングサウンドを生成する(図5(d)参照)。
以上の処理により生成されたマスキングサウンドは、以下のような特徴を持つ。すなわち、生成されるマスキングサウンドにおいては、元の音に含まれていた音量レベルの変動が平均化されている。なぜならば、元の音は短いフレームで分断されそれらのフレームはランダムに順序が並べ替えられているだけでなく、そのような処理がなされた複数の音信号が重ねあわされているからである。そのため、マスキングサウンドの音量レベルは略一定に保たれており、元の音信号の音量レベルの変動によるマスキング効果の不安定さが抑制される。
また、音信号を分断するフレーム長は話速に応じて適切に設定されるため、元の音に含まれていた音素は適切に分断されており、高いマスキング効果を有する。また、音素の分割やフレーム内のリバース処理により音の無意味化が十分になされており、ユーザのプライバシーやセキュリティーは保護される。また、各フレームのつなぎ目においては窓掛け処理がなされていることから、生成されたマスキングサウンドは滑らかにつながった音信号となり、ユーザに対する不快感を抑制できる。
(C;変形例)
以上、本発明の一実施形態について説明したが、かかる実施形態に以下に述べるような変形を加えても良いことは勿論である。また、以下に述べる変形を組み合わせて用いてもよい。
(1)上記実施形態においては、マスキングサウンド生成装置10のCPU100が本発明に特徴的な処理の多くを実行する場合について説明したが、それぞれの処理を行うハードウェアモジュールを設けて同様の処理を行わせるようにしても良い。
(2)上記実施形態においては、音信号に上述した各種の処理を全て施す場合について説明した。しかし、上述した全ての処理を必ずしも行わなくても良く、それらの処理を組み合わせることにより言語としての意味が理解できない程度に音信号が改変されていれば良い。
(3)上記実施形態においては、音響空間20Aで収音した音信号からマスキングサウンドを生成した。しかし、実際にマスキングサウンドが放音される空間は音響空間20Bであり、両音響空間の間には壁などの音響特性を変化させる障害物即ち遮音構造体が存在する。従って、CPU100は、上記実施形態に記載の方法で一旦マスキングサウンドを生成し、該マスキングサウンドに前記遮音構造体の遮音特性を模したフィルタリング処理を施して該音信号が壁を透過した場合の音響効果を付与しても良い。その結果、生成されるマスキングサウンドは、音響空間20Bのユーザに聞こえる音響空間20Aの騒音を模した音信号となるため、音響空間20Aにおいてより高いマスキング効果が期待できる。
(4)上記実施形態においては、話速(発話の速度)の分析方法の一例について説明した。しかし、話速の分析方法は、上述の方法に限定されるものではなく、同様の分析結果が得られる方法であればどのような方法を用いても良い。
(5)上記実施形態においては、単一の音信号を複数の音信号に複製し、それらの音信号に対してそれぞれ異なる音信号処理を施して異なる音信号へと変換し、その後ミキシングしてマスキングサウンドの音信号を生成する場合について説明した。しかし、音信号処理を施した後の複数の音信号をミキシングせず、それぞれの音信号を複数の出力系統から別個に出力し、音響空間20Bに複数のスピーカを隣接して設け、該複数のスピーカから出力するようにしても良い。
(6)上記実施形態においては、音響空間20Aにマイクロホン30を設け、音響空間20Bにスピーカ40を設ける場合について説明した。しかし、音響空間20Aまたは20Bのいずれか一方のみにマイクロホン30およびスピーカ40を設置しても良い。例えば音響空間20Aにマイクロホン30およびスピーカ40を設置した場合、音響空間20Aのユーザの会話内容からマスキングサウンドが生成され、該マスキングサウンドは音響空間20Aにおいて放音されるため、音響空間20Bには、会話内容とマスキングサウンドの両者が漏れ聞こえることになる。その結果、音響空間20Bのユーザは、音響空間20Aのユーザの会話内容を理解することが困難になる。なお、この場合、前記マイクロホン30とスピーカ40によりハウリングが発生しないような配置や信号処理を行うことは当然のことである。
(7)上記実施形態においては、音響空間20Aおよび20Bの複数の部屋にそれぞれマイクロホン30およびスピーカ40が設置される場合について説明した。しかし、同じ空間内にマイクロホン30およびスピーカ40を離して設置して、マイクロホン30の付近で秘匿性の高い会話がなされ、スピーカ40からマスキングサウンドが放音されスピーカ40の付近のユーザにマスキングサウンドを放音することで該会話内容が聞こえないようにするようにしても良い。
(8)上記実施形態においては、音響空間20Aにマイクロホン30を、音響空間20Bにスピーカ40を設置する場合について説明した。しかし、複数の音響空間、例えば音響空間20Aおよび20Bのそれぞれにおいて、マイクロホン30およびスピーカ40の両者を設置するようにしてもよい。その場合、マスキングサウンド生成装置10は入力手段を有し、ユーザは、秘匿性の高い会話を行う場合には入力手段を介してその旨を入力し、マスキングサウンド生成装置10は、該入力がなされた音響空間においてはマイクロホン30で音を収音し、他方の音響空間において生成されたマスキングサウンドを放音するように制御すれば良い。
(9)上記実施形態においては、CPU100は、入力された音信号を相異なるフレーム長の3つの音信号に複製し、それぞれの音信号において相異なる音信号処理を施し、その後それらの音信号をミキシングしてマスキングサウンドを生成した。しかし、扱う音信号の系統数は3に限られるものではなく、1または2でも良いし4以上でも良いが、マスキングサウンドとしての効果は、系統数がより多いほど高い。
(10)上記実施形態においては、話速分析処理による話速のデータから、その時間経過に伴う変動を表す標準偏差σを算出し、話速の平均値、平均値+σ、平均値−σの値を、複製された音信号の各々のフレーム化処理に適用する場合について説明した。しかし、用いるパラメータは、平均値と平均値±σの値に限られるものではない。例えば、σに代えて標準誤差などを用いても良いし、σに代えて予め定められた値を用いても良い。また、話速の平均値ではなく、話速の最大値や最小値としても良い。
(11)上記実施形態において、フレーム長選択テーブルで、1つの話速に対して3つのフレーム長を対応させておくようにし、CPU100は話速の平均値から複数のフレーム長を選択するようにしても良い。
(12)上記実施形態においては、複製された音信号をそれぞれ異なるフレーム長で分割する場合について説明した。しかし、複数の音信号を共通のフレーム長で分割するようにしても良い。その場合、CPU100は話速の平均値を算出し、該平均値に対応するフレーム長をフレーム長選択テーブルから読み出し、読み出されたフレーム長を用いて各々の音信号をフレームに分割するようにすれば良い。
(13)上記実施形態においては、単一の話速から複数の話速の値(平均値、平均値+σ、平均値−σ)を生成し、それら複数の話速の値にそれぞれ対応するフレーム長を用いて音信号を分割する場合について説明した。しかし、単一のフレーム長に複数のフレーム長が対応付けられたテーブルを設けるなどし、単一の話速から一旦フレーム長を決定した後、該フレーム長に対応付けられた複数のフレーム長を用いて各音信号をフレームに分割しても良い。
(14)上記実施形態においては、音響空間20Aにおいて収音した音に基づいてその都度マスキングサウンドを生成し、他の音響空間20Bにおいて放音する場合について説明した。しかし、音響空間20Aにおいて収音した音に基づいて上記実施形態と同様にマスキングサウンドを生成し、生成したマスキングサウンドを表す音信号を記憶部200に記憶しておき、マスキングサウンドを放音する際には、該記憶部200に記憶されたマスキングサウンドの音信号を出力するようにしても良い。例えば、音響空間20Aにおいて生じる騒音の音響特性が略一定である場合などには、上述のように予め生成されたマスキングサウンドを放音するとしても十分なマスキング効果が奏される。
マスキングサウンド生成装置10が設けられた音響空間20の構成を示した図である。 マスキングサウンド生成装置10の構成を示したブロック図である。 フレーム長選択テーブルの一例を示した図である。 マスキングサウンド生成処理の流れを示したフローチャートである。 マスキングサウンド生成処理における音信号の波形変化を示した図である。
符号の説明
1…サウンドマスキングシステム、10…マスキングサウンド生成装置、20…音響空間、30…マイクロホン、40…スピーカ、100…CPU、200…記憶部、210…ROM、220…RAM、300…音声入力部、310…A/Dコンバータ、320…入力端子、400…音声出力部、410…D/Aコンバータ、420…アンプ、430…出力端子、500…バス

Claims (10)

  1. 音声を収音し対応する音声信号を生成する収音手段と、
    前記収音手段が生成した前記音声信号に基づいて前記収音された音声の発話の速度を示す話速信号を生成する話速信号生成手段と、
    前記発話の速度と前記音声信号を所定時間長に分割する区間を表すフレーム長とが対応付けて書き込まれたテーブルと、
    前記話速信号生成出手段が生成した話速信号に対応するフレーム長を前記テーブルから読み出す読出手段と、
    前記収音手段が生成した音声信号を複製して複数の系列に分岐し、該分岐した各系列の音声信号を前記読出手段が読み出したフレーム長に基づいて複数のフレームに分割し、該分割した複数のフレームの時系列が各系列において変更されるように再構成し、該再構成した各音声信号をスクランブル信号として出力するスクランブル手段と
    を具備することを特徴とするサウンドマスキングシステム。
  2. 前記スクランブル手段は、前記読出手段が読み出したフレーム長に基づいて、前記各系列のフレーム分割におけるフレームの長さが各系列で異なるように分割用フレーム長を生成し、該生成した分割用フレーム長を用いて各系列の音声信号をフレームに分割することを特徴とする請求項1に記載のサウンドマスキングシステム。
  3. 前記テーブルは、一つの発話の速度に対して前記各系列に対するフレーム長を対応させて記憶し、
    前記スクランブル手段は、前記読出手段が読み出した前記各系列に対するフレーム長に基づいて前記各系列の音声信号をフレームに分割することを特徴とする請求項1に記載のサウンドマスキングシステム。
  4. 前記話速信号生成手段が生成した話速信号を加工し複数の話速信号を生成する加工手段を更に備え、
    前記読出手段は、前記加工手段が生成した複数の話速信号とそれぞれ対応するフレーム長を前記テーブルから読み出し、
    前記スクランブル手段は、前記読出手段が読み出した各フレーム長を用いて各系列の音声信号をフレームに分割することを特徴とする請求項1に記載のサウンドマスキングシステム。
  5. 前記スクランブル手段は、前記音声信号が分割された結果生成された複数のフレームの各々を、該フレームを時間的に逆に読み出すことにより生成した音声信号に置き換えるリバース手段を更に有すること
    を特徴とする請求項1ないし4に記載のサウンドマスキングシステム。
  6. 前記スクランブル手段は、前記音声信号が分割された結果生成された複数のフレームを、元の音声信号における順序とは異なる順序に並べ替える並べ替え手段を更に有すること
    を特徴とする請求項1ないし4に記載のサウンドマスキングシステム。
  7. 音声を収音し対応する音声信号を生成する収音手段と、
    前記収音手段が生成した前記音声信号に基づいて前記収音された音声の発話の速度を示す話速信号を生成する話速信号生成手段と、
    前記発話の速度と前記音声信号を所定時間長に分割する区間を表すフレーム長とが対応付けて書き込まれたテーブルと、
    前記話速信号生成出手段が生成した話速信号に対応するフレーム長を前記テーブルから読み出す読出手段と、
    前記収音手段が生成した音声信号を前記読出手段が読み出したフレーム長に基づいて複数のフレームに分割し、分割した複数のフレームの各々を、該フレームを時間的に逆に読み出すことにより生成した音声信号に置き換え、該置き換えられた複数のフレームを時系列が変更されるように再構成し、再構成後の各音声信号をスクランブル信号として出力するスクランブル手段と
    を具備することを特徴とするサウンドマスキングシステム。
  8. 前記スクランブル手段により分割された複数のフレームの頭部および尾部の波形を加工する波形加工手段を更に有すること
    を特徴とする請求項1ないし7に記載のサウンドマスキングシステム。
  9. 音声を収音し対応する音声信号を生成する収音段階と、
    前記収音段階において生成された前記音声信号に基づいて前記収音された音声の発話の速度を示す話速信号を生成する話速信号生成段階と、
    前記話速信号生成出段階において生成された話速信号に対応するフレーム長を前記発話の速度と前記音声信号を所定時間長に分割する区間を表すフレーム長とが対応付けて書き込まれたテーブルから読み出す読出段階と、
    前記収音段階において生成された音声信号を複製して複数の系列に分岐し、該分岐した各系列の音声信号を前記読出段階において読み出されたフレーム長に基づいて複数のフレームに分割し、該分割した複数のフレームの時系列が各系列において変更されるように再構成し、該再構成した各音声信号をスクランブル信号として出力するスクランブル段階と
    を具備することを特徴とするマスキングサウンド生成方法。
  10. コンピュータを、
    音声を収音し対応する音声信号を生成する収音手段と、
    前記収音手段が生成した前記音声信号に基づいて前記収音された音声の発話の速度を示す話速信号を生成する話速信号生成手段と、
    前記話速信号生成出手段が生成した話速信号に対応するフレーム長を前記発話の速度と前記音声信号を所定時間長に分割する区間を表すフレーム長とが対応付けて書き込まれたテーブルから読み出す読出手段と、
    前記収音手段が生成した音声信号を複製して複数の系列に分岐し、該分岐した各系列の音声信号を前記読出手段が読み出したフレーム長に基づいて複数のフレームに分割し、該分割した複数のフレームの時系列が各系列において変更されるように再構成し、該再構成した各音声信号をスクランブル信号として出力するスクランブル手段
    として機能させるプログラム。
JP2007075282A 2007-03-22 2007-03-22 サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム Expired - Fee Related JP4245060B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2007075282A JP4245060B2 (ja) 2007-03-22 2007-03-22 サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム
DE602008000013T DE602008000013D1 (de) 2007-03-22 2008-03-17 Ton-Abschirmungssystem und Verfahren zur Erzeugung von abschirmendem Ton
EP08102648A EP1973102B1 (en) 2007-03-22 2008-03-17 Sound masking system and masking sound generation method
AT08102648T ATE431610T1 (de) 2007-03-22 2008-03-17 Ton-abschirmungssystem und verfahren zur erzeugung von abschirmendem ton
US12/051,695 US8050931B2 (en) 2007-03-22 2008-03-19 Sound masking system and masking sound generation method
CA2627484A CA2627484C (en) 2007-03-22 2008-03-25 Sound masking system and masking sound generation method
US13/240,937 US8271288B2 (en) 2007-03-22 2011-09-22 Sound masking system and masking sound generation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007075282A JP4245060B2 (ja) 2007-03-22 2007-03-22 サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2008233671A JP2008233671A (ja) 2008-10-02
JP4245060B2 true JP4245060B2 (ja) 2009-03-25

Family

ID=39535199

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007075282A Expired - Fee Related JP4245060B2 (ja) 2007-03-22 2007-03-22 サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム

Country Status (6)

Country Link
US (2) US8050931B2 (ja)
EP (1) EP1973102B1 (ja)
JP (1) JP4245060B2 (ja)
AT (1) ATE431610T1 (ja)
CA (1) CA2627484C (ja)
DE (1) DE602008000013D1 (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4245060B2 (ja) 2007-03-22 2009-03-25 ヤマハ株式会社 サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム
JP5691191B2 (ja) 2009-02-19 2015-04-01 ヤマハ株式会社 マスキング音生成装置、マスキングシステム、マスキング音生成方法、およびプログラム
JP5644122B2 (ja) * 2010-01-26 2014-12-24 ヤマハ株式会社 マスカ音生成装置
EP2367169A3 (en) * 2010-01-26 2014-11-26 Yamaha Corporation Masker sound generation apparatus and program
JP5662711B2 (ja) * 2010-06-25 2015-02-04 日本板硝子環境アメニティ株式会社 音声変更装置、音声変更方法および音声情報秘話システム
US8627359B2 (en) 2010-08-12 2014-01-07 Lucid Commerce, Inc. Method and system for automatically targeting ads to television media using demographic similarity
US8768770B2 (en) 2010-08-30 2014-07-01 Lucid Commerce, Inc. System and method for attributing multi-channel conversion events and subsequent activity to multi-channel media sources
JP5740914B2 (ja) * 2010-10-28 2015-07-01 ヤマハ株式会社 音声出力装置
JP6007481B2 (ja) * 2010-11-25 2016-10-12 ヤマハ株式会社 マスカ音生成装置、マスカ音信号を記憶した記憶媒体、マスカ音再生装置、およびプログラム
JP5966326B2 (ja) * 2010-12-07 2016-08-10 ヤマハ株式会社 マスカ音出力装置、マスカ音出力システム、およびプログラム
CN102110441A (zh) * 2010-12-22 2011-06-29 中国科学院声学研究所 一种基于时间反转的声掩蔽信号产生方法
US8700406B2 (en) * 2011-05-23 2014-04-15 Qualcomm Incorporated Preserving audio data collection privacy in mobile devices
JP5691866B2 (ja) * 2011-06-14 2015-04-01 ヤマハ株式会社 マスキング解析装置,マスカー音選択装置,マスキング装置およびプログラム
DE102011051727A1 (de) * 2011-07-11 2013-01-17 Pinta Acoustic Gmbh Verfahren und Vorrichtung zur aktiven Schallmaskierung
CN102522080B (zh) * 2011-12-08 2013-12-11 中国科学院声学研究所 用于保护语言私密性的随机干扰声信号产生***及其方法
WO2013098871A1 (ja) 2011-12-26 2013-07-04 日本板硝子環境アメニティ株式会社 音響システム
US20130259254A1 (en) * 2012-03-28 2013-10-03 Qualcomm Incorporated Systems, methods, and apparatus for producing a directional sound field
US10448161B2 (en) 2012-04-02 2019-10-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field
US20140006017A1 (en) * 2012-06-29 2014-01-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal
JP5991115B2 (ja) * 2012-09-25 2016-09-14 ヤマハ株式会社 音声マスキングのための方法、装置およびプログラム
US9361903B2 (en) * 2013-08-22 2016-06-07 Microsoft Technology Licensing, Llc Preserving privacy of a conversation from surrounding environment using a counter signal
JP2015043480A (ja) * 2013-08-26 2015-03-05 ミサワホーム株式会社 音環境調整システム
US20170256251A1 (en) * 2016-03-01 2017-09-07 Guardian Industries Corp. Acoustic wall assembly having double-wall configuration and active noise-disruptive properties, and/or method of making and/or using the same
US10354638B2 (en) * 2016-03-01 2019-07-16 Guardian Glass, LLC Acoustic wall assembly having active noise-disruptive properties, and/or method of making and/or using the same
US10134379B2 (en) 2016-03-01 2018-11-20 Guardian Glass, LLC Acoustic wall assembly having double-wall configuration and passive noise-disruptive properties, and/or method of making and/or using the same
US10373626B2 (en) 2017-03-15 2019-08-06 Guardian Glass, LLC Speech privacy system and/or associated method
US10726855B2 (en) 2017-03-15 2020-07-28 Guardian Glass, Llc. Speech privacy system and/or associated method
US10304473B2 (en) 2017-03-15 2019-05-28 Guardian Glass, LLC Speech privacy system and/or associated method
GB2585334A (en) * 2019-02-22 2021-01-13 Coker Tim Method for obscuring or encrypting a voice recording
JP7287182B2 (ja) * 2019-08-21 2023-06-06 沖電気工業株式会社 音響処理装置、音響処理プログラム及び音響処理方法
CN111508461B (zh) * 2020-04-13 2023-11-03 山东省计算中心(国家超级计算济南中心) 一种多声掩蔽***信息中心化管理***及方法
EP4167228A1 (de) * 2021-10-18 2023-04-19 Audio Mobil Elektronik GmbH Audio-maskierung von sprechern
WO2023066908A1 (de) * 2021-10-18 2023-04-27 Audio Mobil Elektronik Gmbh Audio-maskierung von sprache

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4937867A (en) * 1987-03-27 1990-06-26 Teletec Corporation Variable time inversion algorithm controlled system for multi-level speech security
WO2004010620A1 (ja) 2002-07-18 2004-01-29 Fujitsu Limited 光伝送装置
US7143028B2 (en) 2002-07-24 2006-11-28 Applied Minds, Inc. Method and system for masking speech
US20060109983A1 (en) * 2004-11-19 2006-05-25 Young Randall K Signal masking and method thereof
US7363227B2 (en) * 2005-01-10 2008-04-22 Herman Miller, Inc. Disruption of speech understanding by adding a privacy sound thereto
WO2006076217A2 (en) * 2005-01-10 2006-07-20 Herman Miller, Inc. Method and apparatus of overlapping and summing speech for an output that disrupts speech
US20080243492A1 (en) * 2006-09-07 2008-10-02 Yamaha Corporation Voice-scrambling-signal creation method and apparatus, and computer-readable storage medium therefor
US20080120115A1 (en) * 2006-11-16 2008-05-22 Xiao Dong Mao Methods and apparatuses for dynamically adjusting an audio signal based on a parameter
JP4245060B2 (ja) 2007-03-22 2009-03-25 ヤマハ株式会社 サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム

Also Published As

Publication number Publication date
US20120016665A1 (en) 2012-01-19
EP1973102A1 (en) 2008-09-24
DE602008000013D1 (de) 2009-06-25
EP1973102B1 (en) 2009-05-13
US20080235008A1 (en) 2008-09-25
JP2008233671A (ja) 2008-10-02
US8050931B2 (en) 2011-11-01
CA2627484A1 (en) 2008-09-22
CA2627484C (en) 2013-01-22
US8271288B2 (en) 2012-09-18
ATE431610T1 (de) 2009-05-15

Similar Documents

Publication Publication Date Title
JP4245060B2 (ja) サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム
JP5103973B2 (ja) サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム
JP5103974B2 (ja) マスキングサウンド生成装置、マスキングサウンド生成方法およびプログラム
CA2253749C (en) Method and device for instantly changing the speed of speech
JP4910765B2 (ja) サウンドマスキングシステム及びマスキングサウンド生成装置
CA2964906A1 (en) Systems, methods, and devices for intelligent speech recognition and processing
JP5282832B2 (ja) 音声スクランブルのための方法および装置
JP4924309B2 (ja) 音声スクランブル信号作成方法と装置及び音声スクランブル方法と装置
CN101740034A (zh) 一种实现声音变速不变调方法及变速变调***
JP3439307B2 (ja) 発声速度変換装置
JP2000152394A (ja) 軽度難聴者用補聴装置、軽度難聴者対応伝送システム、軽度難聴者対応記録再生装置、及び軽度難聴者対応再生装置
KR20170098761A (ko) 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법
Nakamura et al. A new approach to compensate degeneration of speech intelligibility for elderly listeners-development of a portable real time speech rate conversion system
JP3432443B2 (ja) 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体
JP2009075280A (ja) コンテンツ再生装置
JP4130927B2 (ja) 音響再生装置
JP2734028B2 (ja) 音声収録装置
JP2015206928A (ja) 音声処理装置、音声処理プログラムおよび音声処理方法
JP2005031169A (ja) 音声信号処理装置,その方法,そのプログラム
JP5925493B2 (ja) 会話保護システム及び会話保護方法
JP5691180B2 (ja) マスカ音生成装置およびプログラム
JP2650355B2 (ja) 音声分析合成装置
JP4267954B2 (ja) 概周期信号生成方法、装置、それを用いた音声合成方法、装置、音声合成プログラムおよびその記録媒体
Barba et al. Voice and audio signal processing using the WSOLA Algorithm MATLAB software
JP3516470B2 (ja) 信号処理装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081216

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081229

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120116

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130116

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140116

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees