JP5282832B2 - 音声スクランブルのための方法および装置 - Google Patents

音声スクランブルのための方法および装置 Download PDF

Info

Publication number
JP5282832B2
JP5282832B2 JP2012024853A JP2012024853A JP5282832B2 JP 5282832 B2 JP5282832 B2 JP 5282832B2 JP 2012024853 A JP2012024853 A JP 2012024853A JP 2012024853 A JP2012024853 A JP 2012024853A JP 5282832 B2 JP5282832 B2 JP 5282832B2
Authority
JP
Japan
Prior art keywords
waveform data
frame
frames
sound
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012024853A
Other languages
English (en)
Other versions
JP2012088747A (ja
Inventor
晃 三木
雅人 秦
敦子 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2012024853A priority Critical patent/JP5282832B2/ja
Publication of JP2012088747A publication Critical patent/JP2012088747A/ja
Application granted granted Critical
Publication of JP5282832B2 publication Critical patent/JP5282832B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K1/00Secret communication
    • H04K1/06Secret communication by transmitting the information or elements thereof at unnatural speeds or in jumbled order or backwards

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

この発明は、漏洩音声のスクランブル(無意味化又は理解不能化)等に用いる好適な音声スクランブル信号作成方法と装置及び音声スクランブル方法と装置に関するものである。
従来、音声スクランブル信号作成方法としては、原音声の波形データを音素毎にセグメントに順次に分断すると共に各セグメントの波形データをメモリに記憶し、メモリから選択した複数のセグメントの波形データを原音声とは異なる順序で組合せて音声スクランブル信号(原音声又はその漏洩音声をスクランブルするための信号)を作成するものが知られている(例えば、特許文献1参照)。
特表2005−534061号公報
人間の音声の知覚では、分離、群化等の過程を経た上で群化された物理的特徴に基づいて音声ストリームを作成して音声を聴き取っている(いわゆるカクテルパーティ効果など)。上記した従来技術によると、例えば「あ」、「い」… のような第1の音声ストリー
ムに対して「い」、「あ」… のような第2の音声ストリームを重畳して音声スクランブ
ルを達成している。この場合、第2の音声ストリームにおいてセグメントの順序を入れ替えているため、第1及び第2の音声ストリームでは、振幅エンベロープが異なること、周波数スペクトルが一致しないことなどの理由により第1の音声ストリームを第2の音声ストリームから分離して聴き分けるのが比較的容易である。従って、スクランブル効果が低いという問題点がある。
この発明の目的は、スクランブル効果を向上させることができる新規な音声スクランブル信号作成方法と装置及び音声スクランブル方法と装置を提供することにある。
本発明は、音を表す波形データのサンプルを順次取得する取得段階と、前記取得段階において順次取得されるサンプルにより構成される波形データを所定の規則に従い複数のフレームに分割する分割段階と、記分割段階における分割によって生成された複数のフレームの各々に関し、当該フレームを構成するサンプルを前記取得段階における取得の順序と逆方向の順序に並び替えることにより当該フレームに関するリバース再生用のフレームを生成する生成段階とを備えることを特徴とする方法を提供する。
この方法によれば、原音声の波形データを分割して得られる複数のフレームの各々に関し逆方向にサンプルを並べたリバース再生用のフレームが、音声スクランブル信号として生成される。そのように生成された音声スクランブル信号に従い生成されるスクランブル用音声は、原音声と全体的な振幅エンベロープがほぼ同じになると共に周波数スペクトルがほぼ同じになる。また、原音声のレベルが変動すれば、そのレベル変動に追従してスクランブル用音声のレベルも変動する。従って、この方法によれば、原音声又はその漏洩音声に対して混合した際に高いスクランブル効果が得られるスクランブル用音声が生成可能となる。
また、上記の方法において、前記分割段階において、前記所定の規則に従い、時間長が固定されていない前記複数のフレームが生成され、前記複数のフレームの各々の時間長を記憶する記憶段階を備え、前記生成段階において、前記記憶段階において記憶された時間長に基づき前記複数のフレームの各々に関し、当該フレームを構成するサンプルの特定が行われる、という構成が採用されてもよい。
この方法によれば、フレームの時間長が固定値でなくてよいため、例えば原音声のスピーチレートが高い(早口な)場合や原音声に長母音が含まれる場合などにおいても十分なマスキング効果が得られるように、適切な時間長のリバース再生用のフレームの生成が可能となる。
また、上記の方法において、前記分割段階における前記所定の規則は、前記波形データにより表される音の自己相関係数が所定範囲内となる区間毎に前記波形データを分割し前記複数のフレームを生成する規則である、という構成が採用されてもよい。その際、前記自己相関係数に関する所定範囲は、0.25〜0.50の範囲であることが望ましい。
また、上記の方法において、前記分割段階において、前記所定の規則に従い、時間長が50〜200msecの範囲内の前記複数のフレームが生成される、という構成が採用されてもよい。
また、上記の方法において、前記音が伝達される空間に、前記生成段階において生成された複数のリバース再生用のフレームにより構成されるリバース再生用の波形データに従い音を放音する放音段階を備える、という構成が採用されてもよい。
また、上記の方法において、前記分割段階において生成された複数のフレームの中から順次ランダムにフレームを選択する選択段階を備え、前記生成段階において、前記選択段階において選択された順序で前記リバース再生用のフレームの生成が行われるという構成が採用されてもよい。
また、上記の方法において、前記分割段階において生成された複数のフレーム間の順序をランダムに並び替える並び替え段階を備える、という構成が採用されてもよい。
また本発明は、音を表す波形データのサンプルを順次取得する取得手段と、前記取得手段によって順次取得されるサンプルにより構成される波形データを所定の規則に従い複数のフレームに分割する分割手段と、前記分割手段による分割によって生成された複数のフレームの各々に関し、当該フレームを構成するサンプルを前記取得手段による取得の順序と逆方向の順序に並び替えることにより当該フレームに関するリバース再生用のフレームを生成する生成手段とを備える装置を提供する。
また、上記の装置において、前記音が伝達される空間に、前記生成手段により生成された複数のリバース再生用のフレームにより構成されるリバース再生用の波形データに従い音を放音する放音手段を備える、という構成が採用されてもよい。
この発明によれば、原音声又はその漏洩音声に対して混合した際に高いスクランブル効果が得られるスクランブル用音声が生成可能となる。
この発明の一実施形態に係る音声スクランブル装置の回路構成を示すブロツク図である。 波形データの書込/読出処理を示すフローチャートである。 波形データの書込/読出動作を説明するための波形図である。 波形データの書込/読出処理を示すフローチャートである。 波形データの書込/読出動作を説明するための波形図である。 波形データの書込/読出動作を説明するための波形図である。
図1は、この発明の一実施形態に係る音声スクランブル装置の回路構成を示すもので、この装置は、小型コンピュータを備えている。
バス10には、CPU(中央処理装置)12、ROM(リード・オンリイ・メモリ)14、RAM(ランダム・アクセス・メモリ)16、A/D(アナログ/ディジタル)変換器18、D/A(ディジタル/アナログ)変換器20等が接続されている。
CPU12は、ROM14にストアされたプログラムに従ってRAM16に関する波形データの書込/読出処理等を実行するもので、波形データの書込/読出処理の一例については後述する。
マイクロホン22は、一例として、空間Aの天井部に設置されたもので、空間Aにおける会話音や空調の動作音などの可聴音(以下、原音声)を取得し、原音声を電気信号としての原音声信号に変換してA/D変換器18に供給する。A/D変換器18は、マイクロホン22からの原音声信号を一連の波形データに変換してバス10に送出する。
D/A変換器20は、RAM16から読出した波形データに基づいて作成されるリバース再生波形データをアナログ形式のリバース再生音声信号RVに変換するものである。リバース再生音声信号RVは、増幅器24を介してスピーカ26に供給され、リバース再生音声に変換される。リバース再生音声は、スクランブル用音声として用いられるものである。
スピーカ26は、一例として、空間Aの近傍の空間Bの天井部に設置されたものである。空間Aから空間Bに原音声が漏洩音声LVとして伝達される際にスピーカ26からのスクランブル用音声が空間Bで漏洩音声LVと空間的に混合されるように空間Bにスピーカ26が設置されている。また、スピーカ26は、原音声が取得される空間Aに、スクラン
ブル用音声が原音声と空間的に混合されるように設置してもよい。
次に、図2を参照してRAM16に関する波形データの書込/読出処理を説明する。図2の処理は、電源オン等に応じてスタートする。ステップ30では、初期設定処理を行なう。例えば、書込アドレスn及び読出アドレスmとしては、いずれも初期値を設定し、フレームナンバkとしては、1を設定する。
ステップ32では、空間Aにおいて発生した音を表す波形データが逐次書き込まれているRAM16から、サンプリング順序に従って1サンプル分の波形データを取得する。そして、ステップ34でk=1か判定する。kが初期設定された状態でステップ34に来たときは、k=1であるので、判定結果が肯定的(Y)となり、ステップ36に移る。
ステップ36では、RAM16にてアドレスnにステップ32で取得した波形データを書込む。そして、ステップ38では、アドレスnがフレームFk内の最終アドレスか判定する。ここで、各フレームの時間長は、予め50〜200msecの範囲内で定められるものとし、以下では一例として100msecであるとする。フレームF1、F2、F3・・・のいずれのフレームについても100msecの時間長に対応する最終アドレスを予め定めておくか演算で求めることにより最終アドレスか否かの判定を行なう。アドレスnとして初期値(1)が設定された状態でステップ38に来たときは、ステップ38の判定結果が否定的(N)となり、ステップ42に移る。
なお、各フレームの時間長として、50〜200msecの範囲内にしたのは、日本語の1音韻の継続時間が平均100msec前後であることを考慮した上で、意味が理解できない状態を確保する必要があるためである。すなわち、50msecより短い場合は、1音韻区間が複数フレームに分割され、各フレーム毎にリバース再生しても元の音韻として理解できてしまう。また、200msecより長い場合は、1フレーム分の波形データが揃うまでの時間は原音声に対する遅延となるため、原音声に対して1音韻以上のずれが発生し分離して聴こえ易くなり、スクランブル効果が著しく低下する。従って、用いられる言語や会話の速度などによって、上記フレームの時間長の範囲を適宜変えるようにしても良い。
また、前記各フレームの時間長は、50〜200msecの範囲内で固定値とせず、原音声の自己相関係数が例えば0.25〜0.50となる時刻を各フレーム区切りとしたフレームに分割してもよい。このようにすると、所定時間長(50〜200msec)に依存しないため、スピーチレートが高い(早口な)原音声の場合に、フレーム長が長すぎてリバース再生音声と原音声とが分離した音声ストリームとなるなどの原因でマスキング効果が発揮できない不具合や、逆に長母音が原音声に含まれる場合に、フレーム長が短すぎてリバース再生してもリバース再生音声波形が原音声の波形とほぼ同じになってしまうなどの原因でマスキング効果が発揮できないといった不具合を解消することができる。この場合各フレームの長さが変化するので、各フレームごとに所定時間のフレーム長を記憶し、このフレーム長に従ってステップ38の最終アドレスの判断を行う。
ステップ42では、アドレスnの値を1増大させる。そして、ステップ44で電源オフ等の終了指示であるか判定する。ステップ44の判定結果が否定的(N)であれば、ステップ32に戻る。ステップ32では、次のサンプルの波形データを取得する。ステップ34を介してステップ36に来ると、RAM16にて次のアドレスn(ステップ42で1増大させたアドレス)に今回ステップ32で取得された波形データを書込む。この後、ステップ38、42、44を介してステップ32 に戻り、上記したと同様の書込動作を繰返
す。
アドレスnがフレームF1内の最終アドレスに達すると、ステップ38の判定結果が肯定的(Y)となり、ステップ40に移る、ステップ40では、読出アドレスmとしてその時点で設定されている書込アドレスn(フレームF1内の最終アドレス)を設定する。また、kの値を1増大させる。この結果、k=2となる。ステップ40の後は、ステップ42、44を介してステップ32に戻る。
図3(A)は、上記のような書込動作を示すもので、波形データは、便宜上アナログ波形(マイクロホン22の出力信号に相当)として示してある。F1、F2、F3・・・は、順次のフレームを示し、各フレームの時間長Tは、前述したように50msecから200msecの中から、例えば100msecに設定される。ステップ40でk=2になると、ステップ42では、アドレスnが1増大されてフレームF2内の最初の書込アドレスを指示するようになる。この後、ステップ32でフレームF2内の最初のサンプルの波形データを取得する。
k=2の状態でステップ34に来ると、判定結果が否定的(N)となり、ステップ46に移る。ステップ46では、RAM16にてアドレスn(フレームF2内の最初の書込アドレス)に、ステップ32において取得された波形データを書込む。
次に、ステップ48では、RAM16からアドレスmの波形データを読出す。このとき、アドレスmは、ステップ40でフレームF1内の最終アドレスとされているので、この最終アドレスの波形データを読出し、D/A変換器20に供給する。この後、ステップ50ではアドレスmの値を1減少させる。これは、波形データを書込み時とは逆方向に読出すためである。
ステップ52では、アドレスnがフレームFk内の最終アドレスか判定する。ステップ46でフレームF2内の最初のアドレスに波形データを書込んだときは、ステップ52の判定結果が否定的(N)となり、ステップ42に移る。
ステップ42では、アドレスnの値を1増大させる。そして、ステップ44を介してステップ32に戻る。ステップ32でフレームF2内の次のサンプルの波形データを取得した後、ステップ34を介してステップ46に来ると、RAM16にてアドレスn(ステップ42で1増大させたアドレス)に、ステップ32において取得された波形データを書込む。そして、ステップ48では、RAM16からアドレスm(先にステップ50で1減少させたアドレス)の波形データを読出し、D/A変換器20に供給する。この後、ステップ50、52、42、44を介してステップ32に戻り、上記したと同様に波形データの書込みに並行して波形データの読出しを行なう。
図3(B)は、上記のように波形データの書込みに並行する波形データの読出動作を示すものである。フレームF11、F12、F13・・・は、それぞれ書込時のフレームF1、F2、F3・・・に対応する読出時のフレームを示す。最初のフレームF1の波形データの書込みが終了した後、RAM16にフレームF2の波形データを書込むのに並行してRAM16からフレームF1の波形データが書込時とは逆方向に読出される。この結果、フレームF11の波形データとしては、フレームF1の波形データをリバース再生した波形データが得られる。
アドレスnがフレームF2内の最終アドレスに達すると、ステップ52の判定結果が肯定的(Y)となり、ステップ54に移る。ステップ54では、読出アドレスmとして、その時点で設定されている書込アドレスn(フレームF2内の最終アドレス)を設定する。また、kの値を1増大させる。この結果、k=2であったときはk=3 となる。ステ
ップ54の後は、ステップ42、44を介してステップ32に戻る。
この後は、フレームF2、F1、F11について上記したと同様にフレームF3の波形データの書込みに並行してフレームF2の波形データの逆方向読出しが行なわれ、フレームF12のリバース再生波形データが得られる。このことは、フレームF4、F3、F13、フレームF5、F4、F14・・・についても同様である。
電源オフ等の終了指示があると、ステップ44の判定結果が肯定的(Y)となり、処理エンドとする。
フレームF11、F12、F13・・・のリバース再生波形データは、D/A変換器20に順次に入力され、図3(B)に示すようなアナログ形式のリバース再生音声信号RVに変換される。リバース再生音声信号RVは、増幅器24を介してスピーカ26に供給され、リバース再生音声に変換される。リバース再生音声は、スクランブル用音声として空間Bにて漏洩音声LVと空間的に混合される。リバース再生音声(マスカー)は、元々空間Aにおいて発生した音に基づいて生成されており、そのスペクトル特性や振幅特性など各種の音響信号特性は、漏洩音声LV(マスキー)と類似している。そのため、混合時におけるスクランブル用音声の音量レベルは、漏洩音声LVの音量レベルと同程度の低い音量レベルであっても高いスクランブル効果が得られる。
一例として、空間Aで会話がなされ、空間Bに漏洩音声LVが伝達される場合、空間Bにいる人は、スクランブル用音声と漏洩音声LVとの混合音を聴くことになり、スクランブル効果により会話の意味内容を理解できず、原音声の内容により気が散るといった事態が防止される。また、秘匿性の高い会話を希望する人は、空間Aにて会話すればその会話のセキュリティが確保される。なお、スクランブル用音声自体も、無意味化された上で空間Bにおいて放音されていることから、空間Aにおける会話の内容がスクランブル用音声自体を介して聞き取られてしまうことも無い。
なお、上記した実施形態では、A/D変換器18及びD/A変換器20を設けたが、A/D変換処理及びD/A変換処理をコンピュータで行なうようにしてもよい。
さて、上述した実施形態では、RAM16に書込まれた波形データを、各フレームが書込まれた順序で読み出し、該読み出した波形データからリバース再生波形データを生成する場合について説明した。しかし、RAM16に書込まれた波形データから、ランダムな順序で各フレームを読み出してリバース再生波形データを生成しても良い。その場合の実施形態について以下に例示する。なお、各フレームの時間長は、ここでも100msecと定められているものとする。
図4に示すフローチャートを参照して説明する。ステップ30では、初期設定処理を行う。ここでも、書込みアドレスn及び読出アドレスmとしていずれも初期値を設定し、フレームナンバkとしては、1を設定する。
ステップ32では、空間Aにおいて発生した音を表す波形データが書き込まれているRAM16から、サンプリング順序に従って1サンプル分の波形データを取得する。次に、ステップ34で、kが10以下の数値であるか判定する。なお、各フレームは100msecであるため、kが10以下であるということは、波形データの書き込みが開始されてから1秒が経過する以前であることに対応する。kが初期設定された状態でステップ34に来たときは、k=1であるので、判定結果が肯定的(Y)となり、ステップ36に移る。
ステップ36では、RAM16のアドレスnに波形データを書込む。そして、ステップ38では、アドレスnがフレームF10内の最終アドレスか判定する。アドレスnとして初期値が設定された状態でステップ38に来たときは、ステップ38の判定結果が否定的(N)となり、ステップ42に移る。なお、フレームF10の最終アドレスは、各フレームに含まれるアドレス数から算出可能である。
ステップ42では、アドレスnの値を1増大させる。そして、ステップ44で電源オフ等の終了指示であるか判定する。ステップ44の判定結果が否定的(N)であれば、ステップ32に戻る。ステップ32では、次のサンプルの波形データを取得する。ステップ34を介してステップ36に来ると、RAM16にて次のアドレスn(ステップ42で1増大させたアドレス)に、ステップ32において取得された波形データを書込む。この後、ステップ38、42、44を介してステップ32に戻り、上記したと同様の書込動作を繰返す。
さて、ここで、上記の処理を繰返すことにより、kが10に達した場合について説明する。この段階で、RAM16には、10フレーム(1秒分)の波形データが書き込まれている。アドレスnがフレームF10内の最終アドレスに達すると、ステップ38の判定結果が肯定的(Y)となり、ステップ40に移る、ステップ40では、読出アドレスmとして、n―r1fを設定する。ここで、r1とは、0ないし9の整数であり、その都度ランダムに選択される数である。またfとは、1つのフレームに含まれるアドレスの数(すなわち、フレームの時間長をサンプリングの周期で除した値)である。この結果、読出しアドレスmは、フレームF1ないしF10のいずれかの最終アドレスに設定される。また、kの値を1増大させる。この結果、k=11となる。ステップ40の後は、ステップ42、44を介してステップ32に戻る。
再び、ステップ32でフレームF11内の最初のサンプルの波形データを取得する。k=11の状態でステップ34に来ると、判定結果が否定的(N)となり、ステップ46に移る。ステップ46では、RAM16のアドレスn(フレームF11内の最初の書込アドレス)に波形データを書込む。次に、ステップ48では、RAM16からアドレスmの波形データを読出す。すなわち、アドレスmは、先のステップ40で、フレームF1ないしF10のいずれかのフレームの最終アドレスとされているので、この最終アドレスの波形データを読出し、D/A変換器20に供給する。この後、ステップ50ではアドレスmの値を1減少させる。
ステップ52では、アドレスnがフレームFk内の最終アドレスか判定する。ステップ46でフレームF11内の最初のアドレスに波形データを書込んだときは、ステップ52の判定結果が否定的(N)となり、ステップ42に移る。ステップ42では、アドレスnの値を1増大させる。そして、ステップ44を介してステップ32に戻る。ステップ32でフレームF11内の次のサンプルの波形データを取得した後、ステップ34を介してステップ46に来ると、RAM16にてアドレスn(ステップ42で1増大させたアドレス)に先のステップ32において取得された波形データを書込む。そして、ステップ48では、RAM16からアドレスm(先にステップ50で1減少させたアドレス)の波形データを読出し、D/A変換器20に供給する。この後、ステップ50、52、42、44を介してステップ32に戻り、上記したと同様に波形データの書込みに並行して波形データの読出しを行なう。
アドレスnがフレームF11内の最終アドレスに達すると、ステップ52の判定結果が肯定的(Y)となり、ステップ54に移る。ステップ54では、読出アドレスmとしてn―r2fを設定する。なお、ここでr2は、r1と同様に0ないし9からランダムに選択された整数である。また、kの値を1増大させる。この結果、k=11であったときはk=12となる。ステップ54の後は、ステップ42、44を介してステップ32に戻る。
この後は、ステップ54において新たに設定された読出しアドレスmからリバースで波形データを読み出すと共に、RAM16のアドレスnに新たな波形データを蓄積する。
図5には、以上の処理により、RAM16に書込まれる波形データおよび生成されるリバース再生音声信号RVを示す。同図には、処理の開始から十分に時間が経過した段階でのデータを示す。上記の処理によれば、図中時刻t1において、フレームFp-1の波形データの書込みが完了し、続いてフレームFpの波形データの書き込みが継続される。該書込み処理と並行して、時刻t1からは、直前の所定時間長(1秒間)に含まれるフレームFp-10ないしFp-1のいずれかの波形データから1つのフレームがランダムに選択され、該選択されたフレームの波形データが逆向きに読出される。ここでは、フレームFp-7の波形データが読出される場合を示している。
このように、リバース再生音声信号RVの各フレームが生成される際には、生成されるタイミング(リアルタイム)の直前の1秒間における波形データから生成される。その際、直前の1秒間における波形データから、ランダムにフレームが選択されると共に、選択されたフレームはリバース再生されることから、リバース再生音声信号RVは、聞いても内容を理解することができない無意味化された音信号となる。
なお、上記r2は、0〜9の整数からランダムに選択された数である場合について説明した。しかし、整数の選択の態様によっては、生成されるリバース再生音声信号RVにおいて元の波形データのフレーム順序が変更されなかったり、隣接したフレームが同じ波形データの繰り返しになってしまったりして、マスキング効果が十分に発揮できないとの問題が生じる可能性がある。そのような問題が生じないように、r2の整数の選択に際しては、直前のサイクルにおけるステップ54でr2として選択された整数や、該整数から1を減じた整数が選択されないようにする、などの条件を設けても良い。なお、初めてステップ54が実行される場合のr2については、ステップ40におけるr1と同じ整数や、1を減じた整数が選択されないようにするなどすれば良い。
なお、上記の処理方法において、各フレームの時間長は100msecに限定されるものではない。また、r1およびr2は、整数0ないし9からではなく、他の範囲から選択されるとしても良い。例えば、0ないし19などとしても良く、その場合には、リアルタイムを基準として直前の2秒間の波形データを元に、各時刻におけるリバース再生音声信号RVは生成されることになる。なお、リバース再生音声信号RVを生成する元となる波形データの区間は、例示した範囲(1秒間または2秒間)に限定されるものではないのであるが、リアルタイムにRAM16に書込まれている波形データとその時点で生成されているリバース再生音声信号RVとの間で、振幅エンベロープや周波数スペクトルが大きく異なってしまわないように、所定の時間以上経過した波形データを読み出して用いないようにするのが良い。従って、前記リバース再生音声信号RVを生成する元となる波形データの区間の最大値は、有効なマスキング効果を発揮する条件を考慮すると2秒程度とすることが望ましい。また、最小値については、この区間内に含まれる複数フレームの合計時間長によるが、1フレームが50msecであって2つのフレームを含む場合には、該最小値は100msecとなる。
また、上記の処理方法においては、リバース再生音声信号RVのフレームごとに、直前の1秒間からランダムにフレームを選択する場合について説明したが、以下のようにフレームを並べ替えても良い。この場合の処理方法を、図6を参照して説明する。
RAM16には、逐次波形データが書込まれており、以下でも、リバース再生音声信号RVは、該波形データをフレーム単位で並べ替えることにより生成される。その際、所定区間を単位としてリバース再生音声信号RVを生成する。該所定区間が例えば1秒間である場合には、以下のように処理が行われる。
例えば、図6に示すように、時刻t1〜時刻t1+10Tの区間(所定区間である1秒間)のリバース再生音声信号RVについては、該区間の直前の所定区間長(1秒間)に含まれるフレーム(10フレーム)の波形データ(同図(A))をRAM16から読出すことにより生成する。その際、それら読み出したフレームの順序をランダムに並べ替えると共に、各フレームをリバース再生する。同図(B)において、アンダーラインを付されたFは、対応するフレームFをリバースで再生したものであることを表す。そして、時刻t1+10Tになると、次の所定区間(時刻t1+10T〜t1+20T)のフレームを、RAM16に書込まれた時刻t1〜t1+10Tの波形データから同様に生成する。このように所定数のフレームを単位として順次リバース再生音声信号RVを生成しても良い。
以上、主に2つの例を挙げてリバース再生音声信号RVの生成方法について説明したが、要は、既にRAM16に書込まれた波形データを所定長のフレームをランダムな順序で読み出すと共に、各フレームをリバースで読み出すようにすれば良い。
10:バス、12:CPU、14:ROM、16:RAM、18:A/D変換器、20:D/A変換器、22:マイクロホン、24:増幅器、26:スピーカ

Claims (10)

  1. 音を表す波形データのサンプルを順次取得する取得段階と、
    前記取得段階において順次取得されるサンプルにより構成される波形データを所定の規則に従い複数のフレームに分割する分割段階と、
    前記分割段階における分割によって生成された複数のフレームの各々に関し、当該フレームを構成するサンプルを前記取得段階における取得の順序と逆方向の順序に並び替えることにより当該フレームに関するリバース再生用のフレームを生成する生成段階と
    を備える方法。
  2. 前記分割段階において、前記所定の規則に従い、時間長が固定されていない前記複数のフレームが生成され、
    前記複数のフレームの各々の時間長を記憶する記憶段階を備え、
    前記生成段階において、前記記憶段階において記憶された時間長に基づき前記複数のフレームの各々に関し、当該フレームを構成するサンプルの特定が行われる
    請求項1に記載の方法。
  3. 前記分割段階における前記所定の規則は、前記波形データにより表される音の自己相関係数が所定範囲内となる区間毎に前記波形データを分割し前記複数のフレームを生成する規則である
    請求項1または2に記載の方法。
  4. 前記自己相関係数に関する所定範囲は、0.25〜0.50の範囲である
    請求項3に記載の方法。
  5. 前記分割段階において、前記所定の規則に従い、時間長が50〜200msecの範囲内の前記複数のフレームが生成される
    請求項1乃至3のいずれかに記載の方法。
  6. 前記音が伝達される空間に、前記生成段階において生成された複数のリバース再生用のフレームにより構成されるリバース再生用の波形データに従い音を放音する放音段階
    を備える請求項1乃至5のいずれかに記載の方法。
  7. 前記分割段階において生成された複数のフレームの中から順次ランダムにフレームを選択する選択段階を備え、
    前記生成段階において、前記選択段階において選択された順序で前記リバース再生用のフレームの生成が行われる
    請求項1乃至6のいずれかに記載の方法。
  8. 前記分割段階において生成された複数のフレーム間の順序をランダムに並び替える並び替え段階
    を備える請求項1乃至6のいずれかに記載の方法。
  9. 音を表す波形データのサンプルを順次取得する取得手段と、
    前記取得手段によって順次取得されるサンプルにより構成される波形データを所定の規則に従い複数のフレームに分割する分割手段と、
    前記分割手段による分割によって生成された複数のフレームの各々に関し、当該フレームを構成するサンプルを前記取得手段による取得の順序と逆方向の順序に並び替えることにより当該フレームに関するリバース再生用のフレームを生成する生成手段と
    を備える装置。
  10. 前記音が伝達される空間に、前記生成手段により生成された複数のリバース再生用のフレームにより構成されるリバース再生用の波形データに従い音を放音する放音手段
    を備える請求項9に記載の装置。
JP2012024853A 2006-09-07 2012-02-08 音声スクランブルのための方法および装置 Expired - Fee Related JP5282832B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012024853A JP5282832B2 (ja) 2006-09-07 2012-02-08 音声スクランブルのための方法および装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006242344 2006-09-07
JP2006242344 2006-09-07
JP2012024853A JP5282832B2 (ja) 2006-09-07 2012-02-08 音声スクランブルのための方法および装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007232511A Division JP4924309B2 (ja) 2006-09-07 2007-09-07 音声スクランブル信号作成方法と装置及び音声スクランブル方法と装置

Publications (2)

Publication Number Publication Date
JP2012088747A JP2012088747A (ja) 2012-05-10
JP5282832B2 true JP5282832B2 (ja) 2013-09-04

Family

ID=39153722

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012024853A Expired - Fee Related JP5282832B2 (ja) 2006-09-07 2012-02-08 音声スクランブルのための方法および装置

Country Status (3)

Country Link
US (1) US20080243492A1 (ja)
JP (1) JP5282832B2 (ja)
CA (1) CA2600241C (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4245060B2 (ja) * 2007-03-22 2009-03-25 ヤマハ株式会社 サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム
EP2221803A2 (en) * 2009-02-19 2010-08-25 Yamaha Corporation Masking sound generating apparatus, masking system, masking sound generating method, and program
EP2367169A3 (en) * 2010-01-26 2014-11-26 Yamaha Corporation Masker sound generation apparatus and program
JP6007481B2 (ja) * 2010-11-25 2016-10-12 ヤマハ株式会社 マスカ音生成装置、マスカ音信号を記憶した記憶媒体、マスカ音再生装置、およびプログラム
US8700406B2 (en) * 2011-05-23 2014-04-15 Qualcomm Incorporated Preserving audio data collection privacy in mobile devices
CN108899008B (zh) * 2018-06-13 2023-04-18 中国人民解放军91977部队 一种对空语音通信杂音模拟干扰方法和***
GB2585334A (en) * 2019-02-22 2021-01-13 Coker Tim Method for obscuring or encrypting a voice recording
CN114360481B (zh) * 2021-11-26 2024-06-04 惠州华阳通用智慧车载***开发有限公司 一种蜂鸣器的去噪驱动方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4010324A (en) * 1974-12-19 1977-03-01 Jarvis John P Background noisemasking system
US4268720A (en) * 1979-05-25 1981-05-19 Gte Laboratories Incorporated Scrambler speech transmission and synchronization system
JPS63246046A (ja) * 1987-04-01 1988-10-13 Nec Corp 秘話方式
JPH02251998A (ja) * 1989-03-27 1990-10-09 Sharp Corp 音声合成装置
EP0712218B1 (en) * 1994-11-10 1999-07-14 Telefonaktiebolaget Lm Ericsson A method and an arrangement for sound reconstruction during erasures
US6223155B1 (en) * 1998-08-14 2001-04-24 Conexant Systems, Inc. Method of independently creating and using a garbage model for improved rejection in a limited-training speaker-dependent speech recognition system
JP3841596B2 (ja) * 1999-09-08 2006-11-01 パイオニア株式会社 音素データの生成方法及び音声合成装置
JP2003514260A (ja) * 1999-11-11 2003-04-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ スピーチ認識のための音調特徴
US6820054B2 (en) * 2001-05-07 2004-11-16 Intel Corporation Audio signal processing for speech communication
US7143028B2 (en) * 2002-07-24 2006-11-28 Applied Minds, Inc. Method and system for masking speech
TWI236232B (en) * 2004-07-28 2005-07-11 Via Tech Inc Method and apparatus for bit stream decoding in MP3 decoder
KR100516678B1 (ko) * 2003-07-05 2005-09-22 삼성전자주식회사 음성 코덱의 음성신호의 피치검출 장치 및 방법
US20050065778A1 (en) * 2003-09-24 2005-03-24 Mastrianni Steven J. Secure speech
JP4456537B2 (ja) * 2004-09-14 2010-04-28 本田技研工業株式会社 情報伝達装置
KR100643310B1 (ko) * 2005-08-24 2006-11-10 삼성전자주식회사 음성 데이터의 포먼트와 유사한 교란 신호를 출력하여송화자 음성을 차폐하는 방법 및 장치

Also Published As

Publication number Publication date
US20080243492A1 (en) 2008-10-02
CA2600241C (en) 2012-12-18
JP2012088747A (ja) 2012-05-10
CA2600241A1 (en) 2008-03-07

Similar Documents

Publication Publication Date Title
JP5282832B2 (ja) 音声スクランブルのための方法および装置
JP4924309B2 (ja) 音声スクランブル信号作成方法と装置及び音声スクランブル方法と装置
US8050931B2 (en) Sound masking system and masking sound generation method
JP5103974B2 (ja) マスキングサウンド生成装置、マスキングサウンド生成方法およびプログラム
JP5103973B2 (ja) サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム
US9390703B2 (en) Masking sound generating apparatus, storage medium stored with masking sound signal, masking sound reproducing apparatus, and program
JP2008191659A (ja) 音声強調方法及び音声再生システム
CA2452022C (en) Apparatus and method for changing the playback rate of recorded speech
JP3617603B2 (ja) 音声情報の符号化方法及びその生成方法
JP4130927B2 (ja) 音響再生装置
JP2005114890A (ja) オーディオ信号圧縮装置
EP0682336A2 (en) Natural sound playback apparatus
JP2003271198A (ja) 圧縮データ処理装置、方法および圧縮データ処理プログラム
JP3884131B2 (ja) データ圧縮装置およびデータ伸長装置
JPH04349499A (ja) 音声合成システム
JPS58205200A (ja) 電子音声合成回路装置
JP2004029377A (ja) 圧縮データ処理装置、方法および圧縮データ処理プログラム
Cox Reverb erb erb erb
JP2011154138A (ja) マスカ音生成装置およびプログラム
JP2005241796A (ja) 電子透かしの埋め込み方法および音響信号の再生装置
JPH03174199A (ja) 音声合成装置
JP2005283944A (ja) 楽音データ再生装置
JPS5918719B2 (ja) デ−タ圧縮方式
JP2000172269A (ja) 効果装置
JP2004348055A (ja) ディジタルオーディオデコーダ

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130430

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130513

R150 Certificate of patent or registration of utility model

Ref document number: 5282832

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees