JP5282832B2

JP5282832B2 - 音声スクランブルのための方法および装置

Info

Publication number: JP5282832B2
Application number: JP2012024853A
Authority: JP
Inventors: 晃三木; 雅人秦; 敦子伊藤
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2006-09-07
Filing date: 2012-02-08
Publication date: 2013-09-04
Anticipated expiration: 2027-09-07
Also published as: US20080243492A1; CA2600241C; JP2012088747A; CA2600241A1

Description

この発明は、漏洩音声のスクランブル（無意味化又は理解不能化）等に用いる好適な音声スクランブル信号作成方法と装置及び音声スクランブル方法と装置に関するものである。

従来、音声スクランブル信号作成方法としては、原音声の波形データを音素毎にセグメントに順次に分断すると共に各セグメントの波形データをメモリに記憶し、メモリから選択した複数のセグメントの波形データを原音声とは異なる順序で組合せて音声スクランブル信号（原音声又はその漏洩音声をスクランブルするための信号）を作成するものが知られている（例えば、特許文献１参照）。

特表２００５−５３４０６１号公報

人間の音声の知覚では、分離、群化等の過程を経た上で群化された物理的特徴に基づいて音声ストリームを作成して音声を聴き取っている（いわゆるカクテルパーティ効果など）。上記した従来技術によると、例えば「あ」、「い」… のような第１の音声ストリー
ムに対して「い」、「あ」… のような第２の音声ストリームを重畳して音声スクランブ
ルを達成している。この場合、第２の音声ストリームにおいてセグメントの順序を入れ替えているため、第１及び第２の音声ストリームでは、振幅エンベロープが異なること、周波数スペクトルが一致しないことなどの理由により第１の音声ストリームを第２の音声ストリームから分離して聴き分けるのが比較的容易である。従って、スクランブル効果が低いという問題点がある。

この発明の目的は、スクランブル効果を向上させることができる新規な音声スクランブル信号作成方法と装置及び音声スクランブル方法と装置を提供することにある。

本発明は、音を表す波形データのサンプルを順次取得する取得段階と、前記取得段階において順次取得されるサンプルにより構成される波形データを所定の規則に従い複数のフレームに分割する分割段階と、記分割段階における分割によって生成された複数のフレームの各々に関し、当該フレームを構成するサンプルを前記取得段階における取得の順序と逆方向の順序に並び替えることにより当該フレームに関するリバース再生用のフレームを生成する生成段階とを備えることを特徴とする方法を提供する。

この方法によれば、原音声の波形データを分割して得られる複数のフレームの各々に関し逆方向にサンプルを並べたリバース再生用のフレームが、音声スクランブル信号として生成される。そのように生成された音声スクランブル信号に従い生成されるスクランブル用音声は、原音声と全体的な振幅エンベロープがほぼ同じになると共に周波数スペクトルがほぼ同じになる。また、原音声のレベルが変動すれば、そのレベル変動に追従してスクランブル用音声のレベルも変動する。従って、この方法によれば、原音声又はその漏洩音声に対して混合した際に高いスクランブル効果が得られるスクランブル用音声が生成可能となる。

また、上記の方法において、前記分割段階において、前記所定の規則に従い、時間長が固定されていない前記複数のフレームが生成され、前記複数のフレームの各々の時間長を記憶する記憶段階を備え、前記生成段階において、前記記憶段階において記憶された時間長に基づき前記複数のフレームの各々に関し、当該フレームを構成するサンプルの特定が行われる、という構成が採用されてもよい。

この方法によれば、フレームの時間長が固定値でなくてよいため、例えば原音声のスピーチレートが高い（早口な）場合や原音声に長母音が含まれる場合などにおいても十分なマスキング効果が得られるように、適切な時間長のリバース再生用のフレームの生成が可能となる。

また、上記の方法において、前記分割段階における前記所定の規則は、前記波形データにより表される音の自己相関係数が所定範囲内となる区間毎に前記波形データを分割し前記複数のフレームを生成する規則である、という構成が採用されてもよい。その際、前記自己相関係数に関する所定範囲は、０．２５〜０．５０の範囲であることが望ましい。

また、上記の方法において、前記分割段階において、前記所定の規則に従い、時間長が５０〜２００ｍｓｅｃの範囲内の前記複数のフレームが生成される、という構成が採用されてもよい。

また、上記の方法において、前記音が伝達される空間に、前記生成段階において生成された複数のリバース再生用のフレームにより構成されるリバース再生用の波形データに従い音を放音する放音段階を備える、という構成が採用されてもよい。

また、上記の方法において、前記分割段階において生成された複数のフレームの中から順次ランダムにフレームを選択する選択段階を備え、前記生成段階において、前記選択段階において選択された順序で前記リバース再生用のフレームの生成が行われるという構成が採用されてもよい。

また、上記の方法において、前記分割段階において生成された複数のフレーム間の順序をランダムに並び替える並び替え段階を備える、という構成が採用されてもよい。

また本発明は、音を表す波形データのサンプルを順次取得する取得手段と、前記取得手段によって順次取得されるサンプルにより構成される波形データを所定の規則に従い複数のフレームに分割する分割手段と、前記分割手段による分割によって生成された複数のフレームの各々に関し、当該フレームを構成するサンプルを前記取得手段による取得の順序と逆方向の順序に並び替えることにより当該フレームに関するリバース再生用のフレームを生成する生成手段とを備える装置を提供する。

また、上記の装置において、前記音が伝達される空間に、前記生成手段により生成された複数のリバース再生用のフレームにより構成されるリバース再生用の波形データに従い音を放音する放音手段を備える、という構成が採用されてもよい。

この発明によれば、原音声又はその漏洩音声に対して混合した際に高いスクランブル効果が得られるスクランブル用音声が生成可能となる。

この発明の一実施形態に係る音声スクランブル装置の回路構成を示すブロツク図である。波形データの書込／読出処理を示すフローチャートである。波形データの書込／読出動作を説明するための波形図である。波形データの書込／読出処理を示すフローチャートである。波形データの書込／読出動作を説明するための波形図である。波形データの書込／読出動作を説明するための波形図である。

図１は、この発明の一実施形態に係る音声スクランブル装置の回路構成を示すもので、この装置は、小型コンピュータを備えている。
バス１０には、ＣＰＵ（中央処理装置）１２、ＲＯＭ（リード・オンリイ・メモリ）１４、ＲＡＭ（ランダム・アクセス・メモリ）１６、Ａ／Ｄ（アナログ／ディジタル）変換器１８、Ｄ／Ａ（ディジタル／アナログ）変換器２０等が接続されている。

ＣＰＵ１２は、ＲＯＭ１４にストアされたプログラムに従ってＲＡＭ１６に関する波形データの書込／読出処理等を実行するもので、波形データの書込／読出処理の一例については後述する。
マイクロホン２２は、一例として、空間Ａの天井部に設置されたもので、空間Ａにおける会話音や空調の動作音などの可聴音（以下、原音声）を取得し、原音声を電気信号としての原音声信号に変換してＡ／Ｄ変換器１８に供給する。Ａ／Ｄ変換器１８は、マイクロホン２２からの原音声信号を一連の波形データに変換してバス１０に送出する。

Ｄ／Ａ変換器２０は、ＲＡＭ１６から読出した波形データに基づいて作成されるリバース再生波形データをアナログ形式のリバース再生音声信号ＲＶに変換するものである。リバース再生音声信号ＲＶは、増幅器２４を介してスピーカ２６に供給され、リバース再生音声に変換される。リバース再生音声は、スクランブル用音声として用いられるものである。

スピーカ２６は、一例として、空間Ａの近傍の空間Ｂの天井部に設置されたものである。空間Ａから空間Ｂに原音声が漏洩音声ＬＶとして伝達される際にスピーカ２６からのスクランブル用音声が空間Ｂで漏洩音声ＬＶと空間的に混合されるように空間Ｂにスピーカ２６が設置されている。また、スピーカ２６は、原音声が取得される空間Ａに、スクラン
ブル用音声が原音声と空間的に混合されるように設置してもよい。

次に、図２を参照してＲＡＭ１６に関する波形データの書込／読出処理を説明する。図２の処理は、電源オン等に応じてスタートする。ステップ３０では、初期設定処理を行なう。例えば、書込アドレスｎ及び読出アドレスｍとしては、いずれも初期値を設定し、フレームナンバｋとしては、１を設定する。

ステップ３２では、空間Ａにおいて発生した音を表す波形データが逐次書き込まれているＲＡＭ１６から、サンプリング順序に従って１サンプル分の波形データを取得する。そして、ステップ３４でｋ＝１か判定する。ｋが初期設定された状態でステップ３４に来たときは、ｋ＝１であるので、判定結果が肯定的（Ｙ）となり、ステップ３６に移る。

ステップ３６では、ＲＡＭ１６にてアドレスｎにステップ３２で取得した波形データを書込む。そして、ステップ３８では、アドレスｎがフレームＦ_k内の最終アドレスか判定する。ここで、各フレームの時間長は、予め５０〜２００ｍｓｅｃの範囲内で定められるものとし、以下では一例として１００ｍｓｅｃであるとする。フレームＦ₁、Ｆ₂、Ｆ₃・・・のいずれのフレームについても１００ｍｓｅｃの時間長に対応する最終アドレスを予め定めておくか演算で求めることにより最終アドレスか否かの判定を行なう。アドレスｎとして初期値（１）が設定された状態でステップ３８に来たときは、ステップ３８の判定結果が否定的（Ｎ）となり、ステップ４２に移る。

なお、各フレームの時間長として、５０〜２００ｍｓｅｃの範囲内にしたのは、日本語の１音韻の継続時間が平均１００ｍｓｅｃ前後であることを考慮した上で、意味が理解できない状態を確保する必要があるためである。すなわち、５０ｍｓｅｃより短い場合は、１音韻区間が複数フレームに分割され、各フレーム毎にリバース再生しても元の音韻として理解できてしまう。また、２００ｍｓｅｃより長い場合は、１フレーム分の波形データが揃うまでの時間は原音声に対する遅延となるため、原音声に対して１音韻以上のずれが発生し分離して聴こえ易くなり、スクランブル効果が著しく低下する。従って、用いられる言語や会話の速度などによって、上記フレームの時間長の範囲を適宜変えるようにしても良い。

また、前記各フレームの時間長は、５０〜２００ｍｓｅｃの範囲内で固定値とせず、原音声の自己相関係数が例えば０．２５〜０．５０となる時刻を各フレーム区切りとしたフレームに分割してもよい。このようにすると、所定時間長（５０〜２００ｍｓｅｃ）に依存しないため、スピーチレートが高い（早口な）原音声の場合に、フレーム長が長すぎてリバース再生音声と原音声とが分離した音声ストリームとなるなどの原因でマスキング効果が発揮できない不具合や、逆に長母音が原音声に含まれる場合に、フレーム長が短すぎてリバース再生してもリバース再生音声波形が原音声の波形とほぼ同じになってしまうなどの原因でマスキング効果が発揮できないといった不具合を解消することができる。この場合各フレームの長さが変化するので、各フレームごとに所定時間のフレーム長を記憶し、このフレーム長に従ってステップ３８の最終アドレスの判断を行う。

ステップ４２では、アドレスｎの値を１増大させる。そして、ステップ４４で電源オフ等の終了指示であるか判定する。ステップ４４の判定結果が否定的（Ｎ）であれば、ステップ３２に戻る。ステップ３２では、次のサンプルの波形データを取得する。ステップ３４を介してステップ３６に来ると、ＲＡＭ１６にて次のアドレスｎ（ステップ４２で１増大させたアドレス）に今回ステップ３２で取得された波形データを書込む。この後、ステップ３８、４２、４４を介してステップ３２に戻り、上記したと同様の書込動作を繰返
す。

アドレスｎがフレームＦ₁内の最終アドレスに達すると、ステップ３８の判定結果が肯定的（Ｙ）となり、ステップ４０に移る、ステップ４０では、読出アドレスｍとしてその時点で設定されている書込アドレスｎ（フレームＦ₁内の最終アドレス）を設定する。また、ｋの値を１増大させる。この結果、ｋ＝２となる。ステップ４０の後は、ステップ４２、４４を介してステップ３２に戻る。

図３（Ａ）は、上記のような書込動作を示すもので、波形データは、便宜上アナログ波形（マイクロホン２２の出力信号に相当）として示してある。Ｆ₁、Ｆ₂、Ｆ₃・・・は、順次のフレームを示し、各フレームの時間長Ｔは、前述したように５０ｍｓｅｃから２００ｍｓｅｃの中から、例えば１００ｍｓｅｃに設定される。ステップ４０でｋ＝２になると、ステップ４２では、アドレスｎが１増大されてフレームＦ₂内の最初の書込アドレスを指示するようになる。この後、ステップ３２でフレームＦ₂内の最初のサンプルの波形データを取得する。

ｋ＝２の状態でステップ３４に来ると、判定結果が否定的（Ｎ）となり、ステップ４６に移る。ステップ４６では、ＲＡＭ１６にてアドレスｎ（フレームＦ₂内の最初の書込アドレス）に、ステップ３２において取得された波形データを書込む。

次に、ステップ４８では、ＲＡＭ１６からアドレスｍの波形データを読出す。このとき、アドレスｍは、ステップ４０でフレームＦ₁内の最終アドレスとされているので、この最終アドレスの波形データを読出し、Ｄ／Ａ変換器２０に供給する。この後、ステップ５０ではアドレスｍの値を１減少させる。これは、波形データを書込み時とは逆方向に読出すためである。

ステップ５２では、アドレスｎがフレームＦ_k内の最終アドレスか判定する。ステップ４６でフレームＦ₂内の最初のアドレスに波形データを書込んだときは、ステップ５２の判定結果が否定的（Ｎ）となり、ステップ４２に移る。

ステップ４２では、アドレスｎの値を１増大させる。そして、ステップ４４を介してステップ３２に戻る。ステップ３２でフレームＦ₂内の次のサンプルの波形データを取得した後、ステップ３４を介してステップ４６に来ると、ＲＡＭ１６にてアドレスｎ（ステップ４２で１増大させたアドレス）に、ステップ３２において取得された波形データを書込む。そして、ステップ４８では、ＲＡＭ１６からアドレスｍ（先にステップ５０で１減少させたアドレス）の波形データを読出し、Ｄ／Ａ変換器２０に供給する。この後、ステップ５０、５２、４２、４４を介してステップ３２に戻り、上記したと同様に波形データの書込みに並行して波形データの読出しを行なう。

図３（Ｂ）は、上記のように波形データの書込みに並行する波形データの読出動作を示すものである。フレームＦ₁₁、Ｆ₁₂、Ｆ₁₃・・・は、それぞれ書込時のフレームＦ₁、Ｆ₂、Ｆ₃・・・に対応する読出時のフレームを示す。最初のフレームＦ₁の波形データの書込みが終了した後、ＲＡＭ１６にフレームＦ₂の波形データを書込むのに並行してＲＡＭ１６からフレームＦ₁の波形データが書込時とは逆方向に読出される。この結果、フレームＦ₁₁の波形データとしては、フレームＦ₁の波形データをリバース再生した波形データが得られる。

アドレスｎがフレームＦ₂内の最終アドレスに達すると、ステップ５２の判定結果が肯定的（Ｙ）となり、ステップ５４に移る。ステップ５４では、読出アドレスｍとして、その時点で設定されている書込アドレスｎ（フレームＦ₂内の最終アドレス）を設定する。また、ｋの値を１増大させる。この結果、ｋ＝２であったときはｋ＝３となる。ステ
ップ５４の後は、ステップ４２、４４を介してステップ３２に戻る。

この後は、フレームＦ₂、Ｆ₁、Ｆ₁₁について上記したと同様にフレームＦ₃の波形データの書込みに並行してフレームＦ₂の波形データの逆方向読出しが行なわれ、フレームＦ₁₂のリバース再生波形データが得られる。このことは、フレームＦ₄、Ｆ₃、Ｆ₁₃、フレームＦ₅、Ｆ₄、Ｆ₁₄・・・についても同様である。

電源オフ等の終了指示があると、ステップ４４の判定結果が肯定的（Ｙ）となり、処理エンドとする。

フレームＦ₁₁、Ｆ₁₂、Ｆ₁₃・・・のリバース再生波形データは、Ｄ／Ａ変換器２０に順次に入力され、図３（Ｂ）に示すようなアナログ形式のリバース再生音声信号ＲＶに変換される。リバース再生音声信号ＲＶは、増幅器２４を介してスピーカ２６に供給され、リバース再生音声に変換される。リバース再生音声は、スクランブル用音声として空間Ｂにて漏洩音声ＬＶと空間的に混合される。リバース再生音声（マスカー）は、元々空間Ａにおいて発生した音に基づいて生成されており、そのスペクトル特性や振幅特性など各種の音響信号特性は、漏洩音声ＬＶ（マスキー）と類似している。そのため、混合時におけるスクランブル用音声の音量レベルは、漏洩音声ＬＶの音量レベルと同程度の低い音量レベルであっても高いスクランブル効果が得られる。

一例として、空間Ａで会話がなされ、空間Ｂに漏洩音声ＬＶが伝達される場合、空間Ｂにいる人は、スクランブル用音声と漏洩音声ＬＶとの混合音を聴くことになり、スクランブル効果により会話の意味内容を理解できず、原音声の内容により気が散るといった事態が防止される。また、秘匿性の高い会話を希望する人は、空間Ａにて会話すればその会話のセキュリティが確保される。なお、スクランブル用音声自体も、無意味化された上で空間Ｂにおいて放音されていることから、空間Ａにおける会話の内容がスクランブル用音声自体を介して聞き取られてしまうことも無い。

なお、上記した実施形態では、Ａ／Ｄ変換器１８及びＤ／Ａ変換器２０を設けたが、Ａ／Ｄ変換処理及びＤ／Ａ変換処理をコンピュータで行なうようにしてもよい。

さて、上述した実施形態では、ＲＡＭ１６に書込まれた波形データを、各フレームが書込まれた順序で読み出し、該読み出した波形データからリバース再生波形データを生成する場合について説明した。しかし、ＲＡＭ１６に書込まれた波形データから、ランダムな順序で各フレームを読み出してリバース再生波形データを生成しても良い。その場合の実施形態について以下に例示する。なお、各フレームの時間長は、ここでも１００ｍｓｅｃと定められているものとする。

図４に示すフローチャートを参照して説明する。ステップ３０では、初期設定処理を行う。ここでも、書込みアドレスｎ及び読出アドレスｍとしていずれも初期値を設定し、フレームナンバｋとしては、１を設定する。
ステップ３２では、空間Ａにおいて発生した音を表す波形データが書き込まれているＲＡＭ１６から、サンプリング順序に従って１サンプル分の波形データを取得する。次に、ステップ３４で、ｋが１０以下の数値であるか判定する。なお、各フレームは１００ｍｓｅｃであるため、ｋが１０以下であるということは、波形データの書き込みが開始されてから１秒が経過する以前であることに対応する。ｋが初期設定された状態でステップ３４に来たときは、ｋ＝１であるので、判定結果が肯定的（Ｙ）となり、ステップ３６に移る。
ステップ３６では、ＲＡＭ１６のアドレスｎに波形データを書込む。そして、ステップ３８では、アドレスｎがフレームＦ₁₀内の最終アドレスか判定する。アドレスｎとして初期値が設定された状態でステップ３８に来たときは、ステップ３８の判定結果が否定的（Ｎ）となり、ステップ４２に移る。なお、フレームＦ₁₀の最終アドレスは、各フレームに含まれるアドレス数から算出可能である。
ステップ４２では、アドレスｎの値を１増大させる。そして、ステップ４４で電源オフ等の終了指示であるか判定する。ステップ４４の判定結果が否定的（Ｎ）であれば、ステップ３２に戻る。ステップ３２では、次のサンプルの波形データを取得する。ステップ３４を介してステップ３６に来ると、ＲＡＭ１６にて次のアドレスｎ（ステップ４２で１増大させたアドレス）に、ステップ３２において取得された波形データを書込む。この後、ステップ３８、４２、４４を介してステップ３２に戻り、上記したと同様の書込動作を繰返す。

さて、ここで、上記の処理を繰返すことにより、ｋが１０に達した場合について説明する。この段階で、ＲＡＭ１６には、１０フレーム（１秒分）の波形データが書き込まれている。アドレスｎがフレームＦ₁₀内の最終アドレスに達すると、ステップ３８の判定結果が肯定的（Ｙ）となり、ステップ４０に移る、ステップ４０では、読出アドレスｍとして、ｎ―ｒ₁ｆを設定する。ここで、ｒ₁とは、０ないし９の整数であり、その都度ランダムに選択される数である。またｆとは、１つのフレームに含まれるアドレスの数（すなわち、フレームの時間長をサンプリングの周期で除した値）である。この結果、読出しアドレスｍは、フレームＦ₁ないしＦ₁₀のいずれかの最終アドレスに設定される。また、ｋの値を１増大させる。この結果、ｋ＝１１となる。ステップ４０の後は、ステップ４２、４４を介してステップ３２に戻る。

再び、ステップ３２でフレームＦ₁₁内の最初のサンプルの波形データを取得する。ｋ＝１１の状態でステップ３４に来ると、判定結果が否定的（Ｎ）となり、ステップ４６に移る。ステップ４６では、ＲＡＭ１６のアドレスｎ（フレームＦ₁₁内の最初の書込アドレス）に波形データを書込む。次に、ステップ４８では、ＲＡＭ１６からアドレスｍの波形データを読出す。すなわち、アドレスｍは、先のステップ４０で、フレームＦ₁ないしＦ₁₀のいずれかのフレームの最終アドレスとされているので、この最終アドレスの波形データを読出し、Ｄ／Ａ変換器２０に供給する。この後、ステップ５０ではアドレスｍの値を１減少させる。
ステップ５２では、アドレスｎがフレームＦ_k内の最終アドレスか判定する。ステップ４６でフレームＦ₁₁内の最初のアドレスに波形データを書込んだときは、ステップ５２の判定結果が否定的（Ｎ）となり、ステップ４２に移る。ステップ４２では、アドレスｎの値を１増大させる。そして、ステップ４４を介してステップ３２に戻る。ステップ３２でフレームＦ₁₁内の次のサンプルの波形データを取得した後、ステップ３４を介してステップ４６に来ると、ＲＡＭ１６にてアドレスｎ（ステップ４２で１増大させたアドレス）に先のステップ３２において取得された波形データを書込む。そして、ステップ４８では、ＲＡＭ１６からアドレスｍ（先にステップ５０で１減少させたアドレス）の波形データを読出し、Ｄ／Ａ変換器２０に供給する。この後、ステップ５０、５２、４２、４４を介してステップ３２に戻り、上記したと同様に波形データの書込みに並行して波形データの読出しを行なう。
アドレスｎがフレームＦ₁₁内の最終アドレスに達すると、ステップ５２の判定結果が肯定的（Ｙ）となり、ステップ５４に移る。ステップ５４では、読出アドレスｍとしてｎ―ｒ₂ｆを設定する。なお、ここでｒ₂は、ｒ₁と同様に０ないし９からランダムに選択された整数である。また、ｋの値を１増大させる。この結果、ｋ＝１１であったときはｋ＝１２となる。ステップ５４の後は、ステップ４２、４４を介してステップ３２に戻る。
この後は、ステップ５４において新たに設定された読出しアドレスｍからリバースで波形データを読み出すと共に、ＲＡＭ１６のアドレスｎに新たな波形データを蓄積する。

図５には、以上の処理により、ＲＡＭ１６に書込まれる波形データおよび生成されるリバース再生音声信号ＲＶを示す。同図には、処理の開始から十分に時間が経過した段階でのデータを示す。上記の処理によれば、図中時刻ｔ₁において、フレームＦ_p-1の波形データの書込みが完了し、続いてフレームＦ_pの波形データの書き込みが継続される。該書込み処理と並行して、時刻ｔ₁からは、直前の所定時間長（１秒間）に含まれるフレームＦ_p-10ないしＦ_p-1のいずれかの波形データから１つのフレームがランダムに選択され、該選択されたフレームの波形データが逆向きに読出される。ここでは、フレームＦ_p-7の波形データが読出される場合を示している。
このように、リバース再生音声信号ＲＶの各フレームが生成される際には、生成されるタイミング（リアルタイム）の直前の１秒間における波形データから生成される。その際、直前の１秒間における波形データから、ランダムにフレームが選択されると共に、選択されたフレームはリバース再生されることから、リバース再生音声信号ＲＶは、聞いても内容を理解することができない無意味化された音信号となる。

なお、上記ｒ₂は、０〜９の整数からランダムに選択された数である場合について説明した。しかし、整数の選択の態様によっては、生成されるリバース再生音声信号ＲＶにおいて元の波形データのフレーム順序が変更されなかったり、隣接したフレームが同じ波形データの繰り返しになってしまったりして、マスキング効果が十分に発揮できないとの問題が生じる可能性がある。そのような問題が生じないように、ｒ₂の整数の選択に際しては、直前のサイクルにおけるステップ５４でｒ₂として選択された整数や、該整数から１を減じた整数が選択されないようにする、などの条件を設けても良い。なお、初めてステップ５４が実行される場合のｒ₂については、ステップ４０におけるｒ₁と同じ整数や、１を減じた整数が選択されないようにするなどすれば良い。

なお、上記の処理方法において、各フレームの時間長は１００ｍｓｅｃに限定されるものではない。また、ｒ₁およびｒ₂は、整数０ないし９からではなく、他の範囲から選択されるとしても良い。例えば、０ないし１９などとしても良く、その場合には、リアルタイムを基準として直前の２秒間の波形データを元に、各時刻におけるリバース再生音声信号ＲＶは生成されることになる。なお、リバース再生音声信号ＲＶを生成する元となる波形データの区間は、例示した範囲（１秒間または２秒間）に限定されるものではないのであるが、リアルタイムにＲＡＭ１６に書込まれている波形データとその時点で生成されているリバース再生音声信号ＲＶとの間で、振幅エンベロープや周波数スペクトルが大きく異なってしまわないように、所定の時間以上経過した波形データを読み出して用いないようにするのが良い。従って、前記リバース再生音声信号ＲＶを生成する元となる波形データの区間の最大値は、有効なマスキング効果を発揮する条件を考慮すると２秒程度とすることが望ましい。また、最小値については、この区間内に含まれる複数フレームの合計時間長によるが、１フレームが５０ｍｓｅｃであって２つのフレームを含む場合には、該最小値は１００ｍｓｅｃとなる。

また、上記の処理方法においては、リバース再生音声信号ＲＶのフレームごとに、直前の１秒間からランダムにフレームを選択する場合について説明したが、以下のようにフレームを並べ替えても良い。この場合の処理方法を、図６を参照して説明する。
ＲＡＭ１６には、逐次波形データが書込まれており、以下でも、リバース再生音声信号ＲＶは、該波形データをフレーム単位で並べ替えることにより生成される。その際、所定区間を単位としてリバース再生音声信号ＲＶを生成する。該所定区間が例えば１秒間である場合には、以下のように処理が行われる。
例えば、図６に示すように、時刻ｔ₁〜時刻ｔ₁＋１０Ｔの区間（所定区間である１秒間）のリバース再生音声信号ＲＶについては、該区間の直前の所定区間長（１秒間）に含まれるフレーム（１０フレーム）の波形データ（同図（Ａ））をＲＡＭ１６から読出すことにより生成する。その際、それら読み出したフレームの順序をランダムに並べ替えると共に、各フレームをリバース再生する。同図（Ｂ）において、アンダーラインを付されたＦは、対応するフレームＦをリバースで再生したものであることを表す。そして、時刻ｔ₁＋１０Ｔになると、次の所定区間（時刻ｔ₁＋１０Ｔ〜ｔ₁＋２０Ｔ）のフレームを、ＲＡＭ１６に書込まれた時刻ｔ₁〜ｔ₁＋１０Ｔの波形データから同様に生成する。このように所定数のフレームを単位として順次リバース再生音声信号ＲＶを生成しても良い。
以上、主に２つの例を挙げてリバース再生音声信号ＲＶの生成方法について説明したが、要は、既にＲＡＭ１６に書込まれた波形データを所定長のフレームをランダムな順序で読み出すと共に、各フレームをリバースで読み出すようにすれば良い。

１０：バス、１２：ＣＰＵ、１４：ＲＯＭ、１６：ＲＡＭ、１８：Ａ／Ｄ変換器、２０：Ｄ／Ａ変換器、２２：マイクロホン、２４：増幅器、２６：スピーカ

Claims

音を表す波形データのサンプルを順次取得する取得段階と、
前記取得段階において順次取得されるサンプルにより構成される波形データを所定の規則に従い複数のフレームに分割する分割段階と、
前記分割段階における分割によって生成された複数のフレームの各々に関し、当該フレームを構成するサンプルを前記取得段階における取得の順序と逆方向の順序に並び替えることにより当該フレームに関するリバース再生用のフレームを生成する生成段階と
を備える方法。
前記分割段階において、前記所定の規則に従い、時間長が固定されていない前記複数のフレームが生成され、
前記複数のフレームの各々の時間長を記憶する記憶段階を備え、
前記生成段階において、前記記憶段階において記憶された時間長に基づき前記複数のフレームの各々に関し、当該フレームを構成するサンプルの特定が行われる
請求項１に記載の方法。
前記分割段階における前記所定の規則は、前記波形データにより表される音の自己相関係数が所定範囲内となる区間毎に前記波形データを分割し前記複数のフレームを生成する規則である
請求項１または２に記載の方法。
前記自己相関係数に関する所定範囲は、０．２５〜０．５０の範囲である
請求項３に記載の方法。
前記分割段階において、前記所定の規則に従い、時間長が５０〜２００ｍｓｅｃの範囲内の前記複数のフレームが生成される
請求項１乃至３のいずれかに記載の方法。
前記音が伝達される空間に、前記生成段階において生成された複数のリバース再生用のフレームにより構成されるリバース再生用の波形データに従い音を放音する放音段階
を備える請求項１乃至５のいずれかに記載の方法。
前記分割段階において生成された複数のフレームの中から順次ランダムにフレームを選択する選択段階を備え、
前記生成段階において、前記選択段階において選択された順序で前記リバース再生用のフレームの生成が行われる
請求項１乃至６のいずれかに記載の方法。
前記分割段階において生成された複数のフレーム間の順序をランダムに並び替える並び替え段階
を備える請求項１乃至６のいずれかに記載の方法。
音を表す波形データのサンプルを順次取得する取得手段と、
前記取得手段によって順次取得されるサンプルにより構成される波形データを所定の規則に従い複数のフレームに分割する分割手段と、
前記分割手段による分割によって生成された複数のフレームの各々に関し、当該フレームを構成するサンプルを前記取得手段による取得の順序と逆方向の順序に並び替えることにより当該フレームに関するリバース再生用のフレームを生成する生成手段と
を備える装置。
前記音が伝達される空間に、前記生成手段により生成された複数のリバース再生用のフレームにより構成されるリバース再生用の波形データに従い音を放音する放音手段
を備える請求項９に記載の装置。