JP4504389B2 - 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム - Google Patents

隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム Download PDF

Info

Publication number
JP4504389B2
JP4504389B2 JP2007042870A JP2007042870A JP4504389B2 JP 4504389 B2 JP4504389 B2 JP 4504389B2 JP 2007042870 A JP2007042870 A JP 2007042870A JP 2007042870 A JP2007042870 A JP 2007042870A JP 4504389 B2 JP4504389 B2 JP 4504389B2
Authority
JP
Japan
Prior art keywords
signal
concealment
transmission signal
section
immediately before
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007042870A
Other languages
English (en)
Other versions
JP2008203783A (ja
Inventor
香緒里 遠藤
恭士 大田
智佳子 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007042870A priority Critical patent/JP4504389B2/ja
Priority to EP07025207A priority patent/EP1962281A3/en
Priority to US11/967,403 priority patent/US8438035B2/en
Publication of JP2008203783A publication Critical patent/JP2008203783A/ja
Application granted granted Critical
Publication of JP4504389B2 publication Critical patent/JP4504389B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmitters (AREA)

Description

この発明は、音声伝送信号が消失した場合に、音声伝送信号の消失を隠蔽する隠蔽信号を生成する隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラムに関し、特に、音質の劣化が少ない隠蔽信号を生成することができる隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラムに関するものである。
従来、VoIP(Voice over Internet Protocol)に代表される音声信号伝送では、音声伝送信号が伝送エラーなどによって消失した場合に、消失した音声伝送信号の代わりとなる代替信号を生成することによって、音声が途切れて聞こえる現象を防ぎ、音声伝送信号が消失したことを隠蔽する方法が用いられている(例えば、特許文献1、2および3参照。)。この代替信号を「隠蔽信号」と呼ぶ。
この隠蔽信号を生成する方法として、一般的には、WR(Wave Replication)法や、PWR(Pitch Wave Replication)法が知られている。WR法とは、正常に伝送された際の音声伝送信号を用いて、消失直前の波形と相関が大きい位置で音声波形を繰り返すことによって隠蔽信号を生成する方法であり、PWR法とは、正常に伝送された際の音声伝送信号を用いて、消失直前の1周期のピッチ波形を繰り返すことで隠蔽信号を生成する方法である。
特開2004−138756号公報 特表2002−542521号公報 特開2005−338200号公報
しかしながら、上述した従来の方法で生成した隠蔽信号を用いた場合、同じ波形が繰り返されるために、ブザー音のような異音が発生するという問題があった。
図15は、従来の隠蔽信号生成方法における問題点を説明するための図である。同図は、PWR法を用いた場合の隠蔽信号の波形を示しており、同図に示すように、音声伝送信号のフレームが消失した区間(フレーム消失区間)では、フレームが正常に伝送された区間(正常区間)の最後のピッチ波形3が繰り返されている。このように、同じピッチ波形が繰り返して伝送されることにより、一定の音声が連続し、ブザー音のような不自然な音声が聞こえることになる。
この発明は、上述した従来技術による問題点を解消するためになされたものであり、音質の劣化が少ない隠蔽信号を生成することができる隠蔽信号生成装置、信号消失隠蔽方法および隠蔽信号生成プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するため、本発明は、音声伝送信号が消失した場合に、音声伝送信号の消失を隠蔽する隠蔽信号を生成する隠蔽信号生成装置であって、音声伝送信号が消失した場合に、過去に入力された音声伝送信号から、消失直前に入力された信号に類似する複数の信号を検出し、検出した各信号から消失直前に入力された信号までの区間をそれぞれ繰り返し区間として設定する繰り返し区間設定手段と、前記繰り返し区間設定手段により設定された複数の繰り返し区間に含まれる信号を連結することで前記隠蔽信号を生成する隠蔽信号生成手段と、を備えたことを特徴とする。
また、本発明は、上記の発明において、時間に応じて振幅が変動する変動信号を用いて、前記繰り返し区間設定手段により設定された繰り返し区間の音声伝送信号を補正する信号補正手段をさらに備え、前記隠蔽信号生成手段は、前記信号補正手段により補正された音声伝送信号を用いて前記隠蔽信号を生成することを特徴とする。
また、本発明は、上記の発明において、前記信号補正手段は、過去に入力された音声伝送信号の周波数特性に基づいて生成された前記変動信号を用いて、前記繰り返し区間設定手段により設定された繰り返し区間の音声伝送信号を補正することを特徴とする。
また、本発明は、上記の発明において、過去に入力された音声伝送信号と消失直前の音声伝送信号との類似度の変動が安定しているか否かを示す定常性を判定する定常性判定手段をさらに備え、前記繰り返し区間設定手段は、前記定常性判定手段により定常性があると判定された音声伝送信号から、消失直前に入力された信号に類似する複数の信号を検出し、検出した各信号から消失直前に入力された信号までの区間をそれぞれ繰り返し区間として設定することを特徴とする。
また、本発明は、上記の発明において、前記定常性判定手段は、前記類似度の変動におけるピーク値の変動に基づいて、前記定常性を判定することを特徴とする。また、本発明は、上記の発明において、前記定常性判定手段は、前記類似度の変動における振幅の変動に基づいて、前記定常性を判定することを特徴とする。
また、本発明は、上記の発明において、前記隠蔽信号生成手段は、前記繰り返し区間の信号を連結する際に、連結部分の信号を所定の長さだけ重ね合わせ加算することを特徴とする。また、本発明は、上記の発明において、前記繰り返し区間設定手段は、消失直前に入力された信号に類似する複数の信号を検出した後に、検出した各信号の中からランダムに信号を選択し、選択した信号から消失直前に入力された信号までの区間を前記繰り返し区間として設定することを特徴とする。
また、本発明は、上記の発明において、音声伝送信号が消失した場合に、音声伝送信号の消失を隠蔽する隠蔽信号を生成する隠蔽信号生成方法であって、音声伝送信号が消失した場合に、過去に入力された音声伝送信号から、消失直前に入力された信号に類似する複数の信号を検出し、検出した各信号から消失直前に入力された信号までの区間をそれぞれ繰り返し区間として設定する繰り返し区間設定工程と、前記繰り返し区間設定工程により設定された複数の繰り返し区間に含まれる信号を連結することで前記隠蔽信号を生成する隠蔽信号生成工程と、を含んだことを特徴とする。
また、本発明は、上記の発明において、過去に入力された音声伝送信号と消失直前の音声伝送信号との類似度の変動が安定しているか否かを示す定常性を判定する定常性判定工程をさらに含み、前記繰り返し区間設定工程は、前記定常性判定工程により定常性があると判定された音声伝送信号から、消失直前に入力された信号に類似する複数の信号を検出し、検出した各信号から消失直前に入力された信号までの区間をそれぞれ繰り返し区間として設定することを特徴とする。
また、本発明は、上記の発明において、音声伝送信号が消失した場合に、音声伝送信号の消失を隠蔽する隠蔽信号を生成する隠蔽信号生成プログラムであって、音声伝送信号が消失した場合に、過去に入力された音声伝送信号から、消失直前に入力された信号に類似する複数の信号を検出し、検出した各信号から消失直前に入力された信号までの区間をそれぞれ繰り返し区間として設定する繰り返し区間設定手順と、前記繰り返し区間設定手順により設定された複数の繰り返し区間に含まれる信号を連結することで前記隠蔽信号を生成する隠蔽信号生成手順と、をコンピュータに実行させることを特徴とする。
また、本発明は、上記の発明において、過去に入力された音声伝送信号と消失直前の音声伝送信号との類似度の変動が安定しているか否かを示す定常性を判定する定常性判定手順をさらにコンピュータに実行させ、前記繰り返し区間設定手順は、前記定常性判定手順により定常性があると判定された音声伝送信号から、消失直前に入力された信号に類似する複数の信号を検出し、検出した各信号から消失直前に入力された信号までの区間をそれぞれ繰り返し区間として設定することを特徴とする。
本発明によれば、音声伝送信号が消失した場合に、過去に入力された音声伝送信号から、消失直前の音声伝送信号に類似すると判定される、長さが異なる複数の類似区間を抽出し、抽出した類似区間の音声伝送信号を用いて前記隠蔽信号を生成するので、一定の音声が連続することによる異音の発生を防ぎ、音声の劣化が少ない隠蔽信号を生成することができるという効果を奏する。
また、本発明によれば、時間に応じて振幅が変動する変動信号を用いて、抽出した類似区間の音声伝送信号を補正し、補正した音声伝送信号を用いて前記隠蔽信号を生成するので、全く同じ音声伝送信号が隠蔽信号に含まれることがなくなり、繰り返しによる劣化が、より少ない隠蔽信号を生成することができるという効果を奏する。
また、本発明によれば、過去に入力された音声伝送信号の周波数特性に基づいて生成された変動信号を用いて、抽出した音声伝送信号を補正するので、類似区間の信号を過去に入力された音声伝送信号と変動が似通った信号に補正することが可能になり、音質の変換がより自然な隠蔽信号を生成することができるという効果を奏する。
また、本発明によれば、過去に入力された音声伝送信号と消失直前の音声伝送信号との類似度の変動が安定しているか否かを示す定常性を判定し、定常性があると判定した音声伝送信号から類似区間を抽出するので、消失直前の音声伝送信号に類似する音声伝送信号を用いて隠蔽信号を生成することが可能になり、音声の劣化がより少ない隠蔽信号を生成することができるという効果を奏する。
また、本発明によれば、類似度の変動におけるピーク値の変動に基づいて、定常性を判定するので、入力した音声伝送信号のうち音質の変化が少ない区間を類似区間として設定することが可能になる。これにより、環境騒音区間で音声の消失が発生した場合でも、音声の消失が発生するたびに位置と長さの異なる繰り返し信号を生成することが可能になり、繰り返しによる周期性を発生することなく音質の劣化が少ない隠蔽信号を生成することができるという効果を奏する。
また、本発明によれば、類似度の変動における振幅の変動に基づいて、前記定常性を判定するので、振幅変動率が大きいため繰り返し信号として用いた場合に音質が劣化する可能性がある区間の信号を排除することが可能になり、音質の劣化が、より少ない隠蔽信号を生成することができるという効果を奏する。
以下に添付図面を参照して、この発明に係る隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラムの好適な実施例を詳細に説明する。
まず、本実施例1に係る隠蔽信号生成方法の概念について説明する。図1は、本実施例1に係る隠蔽信号生成方法の概念を説明するための図である。この隠蔽信号生成方法では、VoIPなどの音声伝送において、隠蔽信号生成装置が、音声伝送信号を入力し、入力した音声伝送信号に定常性があるか否かを常時判定する。そして、隠蔽信号生成装置は、入力した音声伝送信号に定常性がある間は、その間に入力した信号を定常区間の音声伝送信号として保持しておく。
定常性の判定と並行して、隠蔽信号生成装置は、音声伝送信号のフレームが消失しているか否かを常時判定する。そして、フレームが消失していると判定した場合には、隠蔽信号生成装置は、直前に入力された音声伝送信号に定常性があったか否かを判定し、定常性があった場合には、図1(a)に示すように、それまでに保持しておいた定常区間の音声伝送信号に対して複数の異なる位置を設定する。ここで設定される位置を、「繰り返し位置候補」と呼ぶ。
繰り返し位置候補を設定した後、隠蔽信号生成装置は、設定した繰り返し位置候補の中から任意の位置を繰り返し開始位置として選択し、選択した繰り返し開始位置から定常区間の終了位置までの区間を「繰り返し区間」として設定する。そして、隠蔽信号生成装置は、設定した繰り返し区間から音声伝送信号を取り出す。ここで、繰り返し区間から取り出される信号を「繰り返し信号」と呼ぶ。
隠蔽信号生成装置は、上記の処理を繰り返すことによって、複数の繰り返し信号を取得する。そして、同図(b)に示すように、取得した繰り返し信号を接続することによって、1フレーム分の隠蔽信号を生成する。この時、隠蔽信号生成装置は、隠蔽信号に含まれる音声が滑らかに変化するように、所定の長さだけ接続箇所を重ね合わせて音声伝送信号を接続する。
このように、本実施例1に係る隠蔽信号生成方法では、音声伝送信号が消失していた場合に、同じ波形の信号が複数回繰り返された隠蔽信号を出力するのではなく、過去に入力された、定常性のある音声伝送信号から、消失直前の音声伝送信号に類似すると判定される、長さが異なる複数の繰り返し区間を設定し、設定した繰り返し区間の音声伝送信号を用いて隠蔽信号を生成するようにしている。これにより、本実施例1に係る信号消失隠蔽方法では、一定の音声が連続することによる異音の発生を防ぎ、音声の劣化が少ない隠蔽信号を生成することができる。
次に、本実施例1に係る隠蔽信号生成装置の構成について説明する。図2は、本実施例1に係る隠蔽信号生成装置の構成を示す機能ブロック図である。同図に示すように、この隠蔽信号生成装置10は、正常信号記憶部11と、繰り返し信号記憶部12と、定常性判定部13と、繰り返し区間算出部14と、制御部15とを有する。
正常信号記憶部11は、後述する定常性判定部13により定常性があると判定された区間の音声伝送信号を、定常区間の音声伝送信号として保持する記憶部であり、繰り返し信号記憶部12は、後述する繰り返し区間算出部14によって生成された繰り返し信号を保持する記憶部である。
定常性判定部13は、音声伝送信号の定常性の有無を判定する処理部である。具体的には、この定常性判定部13は、図示していない信号入力手段を介して音声伝送信号を1フレームずつ入力し、入力した音声伝送信号の定常性の有無を、所定の自己相関関数を用いて判定する。そして、定常性の有無を判定すると、定常性判定部13は、その判定結果を制御部15に対して通知する。なお、かかる定常性判定部13による定常性有無の判定処理については、後にさらに詳細に説明する。
繰り返し区間算出部14は、音声伝送信号が消失した場合に、隠蔽信号の生成に用いられる繰り返し信号を取得する処理部である。具体的には、この繰り返し区間算出部14は、制御部15から繰り返し信号の生成指示を受け付けると、正常信号記憶部11に保持されている定常区間の音声伝送信号に対して、複数の繰り返し位置候補を設定する。
図3は、繰り返し区間算出部14による繰り返し区間の設定を説明するための図である。同図に示すように、繰り返し区間算出部14は、まず、正常信号記憶部11に保持されている定常区間の音声伝送信号に対して、最新の信号から所定の時間だけ過去にさかのぼった区間を「相関算出区間」として設定する。
相関算出区間を設定すると、繰り返し区間算出部14は、定常区間の音声伝送信号に対して、時系列に過去にさかのぼりながら、所定の自己相関関数を用いて、相関算出区間の信号との相関度を算出してゆく。
そして、相関度を算出する中で、繰り返し区間算出部14は、相関度が所定の閾値を越える信号の位置を順次検出し、検出した位置を繰り返し位置候補として設定する。図3の例では、繰り返し位置候補1、2および3の3つの繰り返し位置候補を設定した場合を示している。
繰り返し位置候補の設定が終わると、繰り返し区間算出部14は、公知の技術を用いてランダムな数値を生成する。この時、繰り返し区間算出部14は、設定した繰り返し位置候補の数の範囲で均等になるように数値を生成する。そして、繰り返し区間算出部14は、生成した数値に対応する繰り返し位置候補を繰り返し開始位置として選択し、選択した繰り返し開始位置から定常区間の終了位置までの区間を繰り返し区間として設定する。
こうして、正常信号記憶部11に保持されている定常区間の音声伝送信号に対して繰り返し区間を設定した後に、繰り返し区間算出部14は、設定した繰り返し区間から音声伝送信号を取り出す。ここで、繰り返し区間算出部14は、取り出した繰り返し信号の長さを確認し、その長さが1フレーム分に足りていない場合には、再度、ランダムな数値を生成して、新たな繰り返し区間を設定し、設定した繰り返し区間から繰り返し信号を取り出し、当該繰り返し信号を、すでに取り出していた繰り返し信号の後ろに接続する。
なお、繰り返し区間算出部14は、繰り返し信号を接続する際には、接続した区間の音声が滑らかに変化するように、接続部分の信号を相関算出区間の1/2の区間だけ重ね合わせ加算して接続する。この重ね合わせ加算は、公知の技術を用いて行う。
繰り返し区間算出部14は、繰り返し信号が1フレーム分の長さに達するまで上記の処理を繰り返し、1フレーム分の長さの繰り返し信号を生成した場合には、その繰り返し信号を繰り返し信号記憶部12に保存するとともに、制御部15に対して、繰り返し信号の生成が完了したことを通知する。
制御部15は、音声伝送信号の入出力や繰り返し信号の生成を制御する処理部である。具体的には、この制御部15は、まず、図示していない入力信号解釈手段から送信される音声伝送信号の消失有無を示す情報に基づいて、音声伝送信号が消失しているか否かを判定する。
そして、音声伝送信号が消失していないと判定した場合には、制御部15は、その時点で定常性判定部13から通知されている定常性の有無の判定結果に基づいて、音声伝送信号に定常性があるか否かを判定する。ここで、音声伝送信号に定常性があると判定した場合には、制御部15は、図示していない信号入力手段から送られる音声伝送信号を入力し、入力した音声伝送信号を正常信号記憶部11に保存する。
一方、音声伝送信号に定常性がないと判定した場合には、制御部15は、正常信号記憶部11に保持されている音声伝送信号を全て削除する。ここで、いずれの場合にも、制御部15は、入力した音声伝送信号を、図示していない信号出力手段に対して出力する。
また、制御部15は、音声伝送信号が消失していると判定した場合には、その時点で定常性判定部13から通知されている定常性の有無の判定結果に基づいて、消失直前の音声伝送信号に定常性があったか否かを判定する。ここで、音声伝送信号に定常性がないと判定した場合には、制御部15は、従来の方式(例えば、WR法やPWR法など)を用いて隠蔽信号を生成し、信号出力手段に対して出力する。
一方、音声伝送信号に定常性があると判定した場合には、制御部15は、繰り返し区間算出部14に対して繰り返し信号の生成を指示する。そして、繰り返し区間算出部14から繰り返し信号の生成が完了したことが通知されると、制御部15は、繰り返し信号記憶部12に保持されている繰り返し信号を取り出し、取り出した繰り返し信号を隠蔽信号として出力する。
次に、本実施例1に係る隠蔽信号生成装置10の処理手順について説明する。図4は、本実施例1に係る隠蔽信号生成装置10の処理手順を示すフローチャートである。同図に示すように、隠蔽信号生成装置10では、制御部15が、まず、入力信号解釈手段から音声伝送信号の消失有無を入力し、また、信号入力手段から音声伝送信号を入力し、入力した音声伝送信号の消失があるか否かを判定する(ステップS101)。
ここで、音声伝送信号の消失がないと判定した場合には(ステップS102,No)、制御部15は、音声伝送信号の定常性の有無を判定し(ステップS103)、定常性があった場合には(ステップS104,Yes)、音声伝送信号を正常信号記憶部11に保存する(ステップS105)。一方、音声伝送信号の定常性がなかった場合には(ステップS104,No)、制御部15は、正常信号記憶部11に保持されている音声伝送信号を削除する(ステップS106)。
また、音声伝送信号の消失があると判定した場合には(ステップS102,Yes)、制御部15は、消失直前の音声伝送信号の定常性の有無を判定し(ステップS107)、定常性がなかった場合には(ステップS108,No)、従来の方式を用いて隠蔽信号を生成して出力する(ステップS109)。一方、消失直前の音声伝送信号の定常性があった場合には(ステップS108,Yes)、制御部15は、繰り返し区間算出部14に対して繰り返し信号の生成を指示する。
この指示を受け付けると、繰り返し区間算出部14は、繰り返し区間を設定するための繰り返し区間算出処理を行い(ステップS110)、この処理によって設定された繰り返し区間から繰り返し信号を取り出して、繰り返し信号記憶部12に保存する(ステップS111)。なお、繰り返し区間算出処理の処理手順については、後に説明する。
そして、繰り返し区間算出部14は、1フレームの繰り返し信号を生成するまで、繰り返し区間算出処理および繰り返し信号の取り出しを行い(ステップS112,No)、1フレームの繰り返し信号を生成した場合には(ステップS112,Yes)、繰り返し信号の生成が完了したことを制御部15に対して通知する。
この通知を受け付けると、制御部15は、繰り返し信号記憶部12に保持されている繰り返し信号を隠蔽信号として出力する(ステップS113)。
次に、図4に示した繰り返し区間算出処理の処理手順について説明する。図5は、図4に示した繰り返し区間算出処理の処理手順を示すフローチャートである。この繰り返し区間算出処理は、繰り返し区間算出部14により行われるものである。
同図に示すように、繰り返し区間算出部14は、まず、繰り返し候補位置を算出し(ステップS201)、続いて、ランダム数を生成する(ステップS202)。そして、繰り返し区間算出部14は、生成したランダム数に基づいて、繰り返し候補位置の中から繰り返し位置を選択し(ステップS203)、選択した繰り返し位置に基づいて、繰り返し区間を設定する(ステップS204)。
次に、本実施例1に係る定常性判定部13の処理手順について説明する。図6は、定常性判定部13の処理手順を示すフローチャートである。同図に示すように、定常性判定部13は、まず、1フレームの音声伝送信号を入力し(ステップS301)、入力した音声伝送信号のピッチ周期を算出する(ステップS302)。
このピッチ周期の算出について具体的に説明すると、まず、定常性判定部13は、図示していない信号入力手段から1フレームの音声伝送信号を入力すると、入力したフレームにおいて、末尾から所定の間隔だけフレーム先頭方向にさかのぼった区間を「相関算出区間」として設定する。そして、定常性判定部13は、設定した相関算出区間の信号とフレーム内の信号との間の相関度を、フレームの先頭方向に位置をずらしながら、所定の自己相関関数を用いて順次算出してゆく。
ここで、フレーム末尾からのずらし位置をiとすると、相関度を算出するための自己相関関数ac[i]は、以下に示す式(1)で表される。
Figure 0004504389
上記の式において、x(i)は、ずらし位置iにおける音声伝送信号の振幅を表す関数であり、jは、相関算出区間内でのずらし位置を、Nは、相関算出区間内でのずらし位置jの数を表している。
定常性判定部13は、上記の自己相関関数をac[i]を用いて、フレームの先頭方向に位置をずらしながら順次相関度を算出した後に、フレーム内で相関度が最大となる音声伝送信号の位置を特定し、特定した位置をピッチ周期とする。
定常性判定部13は、ピッチ周期を算出すると、続いて、ピッチ相関値を算出する(ステップS303)。ここでいうピッチ相関値とは、ピッチ周期における相関度であり、ピッチ周期をpとすると、ピッチ相関値ac_pは、以下に示す式(2)で表される。
ac_p=ac[p] ・・・(2)
この式を用いてピッチ相関値ac_pを算出した後に、定常性判定部13は、算出したピッチ相関値ac_pが所定の閾値以上であった場合には(ステップS304,Yes)、当該フレームの音声伝送信号に定常性があると判定する(ステップS305)。
一方、定常性判定部13は、ピッチ相関値ac_pが所定の閾値未満であった場合には(ステップS304,No)、以下に示す式(3)を用いて、相関ピーク変動率p_varを算出する(ステップS306)。
p_var=max(ac[i])/average(peak_ac[k]),
i=0,・・・,L−1, k=0,・・・,M−1
・・・(3)
上記の式において、iは、ずらし位置であり、Lは、ずらし位置iの個数であり、kは、式(1)を用いて相関度を算出した際に検出される相関ピークの位置であり、Mは、相関ピークの個数である。また、max(ac[i])は、相関度ac[i]の最大値を表しており、average(peak_ac[k])は、相関ピークpeak_ac[k]の平均値を表している。
この式を用いて相関ピーク変動率p_varを算出した後に、定常性判定部13は、算出した相関ピーク変動率p_varが所定の閾値以下であった場合には(ステップS307,Yes)、当該フレームの音声伝送信号に定常性があると判定し(ステップS305)、一方、所定の閾値を超えていた場合には(ステップS307,No)、当該フレームの音声伝送信号に定常性がないと判定する(ステップS308)。
このように、定常性判定部13が、入力される音声伝送信号の定常性を判定することによって、消失直前の音声伝送信号に類似する音声伝送信号を用いて隠蔽信号を生成することが可能になり、音声の劣化がより少ない隠蔽信号を生成することができるようになる。
このように、定常性判定部13が、相関ピーク変動率を用いて定常性を判定することにより、周期性が小さい音声伝送信号を入力した場合でも、入力した音声伝送信号のうち音質の変化が少ない区間を定常区間として設定することが可能になる。これにより、環境騒音区間で音声の消失が発生した場合でも、音声の消失が発生するたびに位置と長さの異なる繰り返し信号を生成することが可能になり、繰り返しによる周期性を発生することなく音質の劣化が少ない隠蔽信号を生成することができる。
上述してきたように、本実施例1では、音声伝送信号が消失した場合に、繰り返し区間算出部14が、正常信号記憶部11に保存された、過去に入力された音声伝送信号のうち定常性がある音声伝送信号に対して、消失直前の音声伝送信号に類似すると判定される、長さが異なる複数の繰り返し区間を設定し、制御部15が、設定した繰り返し区間の音声伝送信号を用いて隠蔽信号を生成するので、一定の音声が連続することによる異音の発生を防ぎ、音声の劣化が少ない隠蔽信号を生成することができる。
なお、本実施例1では、定常性判定部13が、相関ピーク変動率を用いて定常性を判定することとしたが、定常性を判定する方法はこれに限られるわけではなく、例えば、音声伝送信号の振幅変動率を用いて定常性を判定するようにしてもよい。
図7は、振幅変動率を用いた場合の定常性判定部13の処理手順を示すフローチャートである。なお、同図に示すステップS401からS403までのピッチ周期およびピッチ相関値の算出に係る処理については、図6に示したステップS301からS304までの処理と同じであるため、ここでは説明を省略する。
定常性判定部13は、ピッチ相関値ac_pを算出した後に、算出したピッチ相関値ac_pが所定の閾値未満であった場合には(ステップS404,No)、当該フレームの音声伝送信号に定常性がないと判定する(ステップS405)。
一方、定常性判定部13は、ピッチ相関値ac_pが所定の閾値以上であった場合には(ステップS404,Yes)、以下に示す式(4)を用いて、振幅変動率a_varを算出する(ステップS406)。
a_var=max(amp_pitch[i])
/average(amp_pitch[i]),
i=0,・・・,F−1
・・・(4)
上記の式において、Fは、ピッチ周期の数であり、amp_pitch[i]は、i番目のピッチ周期の振幅を表している。ここで、ピッチ周期の振幅は、ピッチ周期に含まれる最大信号の絶対値とする。また、max(amp_pitch[i])は、ピッチ周期の振幅amp_pitch[i]の最大値を表しており、average(amp_pitch[i])は、ピッチ周期の振幅amp_pitch[i]の平均値を表している。
この式を用いて振幅変動率a_varを算出した後に、定常性判定部13は、算出した振幅変動率a_varが所定の閾値以下であった場合には(ステップS407,Yes)、当該フレームの音声伝送信号に定常性があると判定し(ステップS408)、一方、所定の閾値を超えていた場合には(ステップS407,No)、当該フレームの音声伝送信号に定常性がないと判定する(ステップS405)。
このように、定常性判定部13が、振幅変動率を用いて定常性を判定することにより、振幅変動率が大きいため繰り返し信号として用いた場合に音質が劣化する可能性がある区間の信号を排除することが可能になり、音質の劣化が、より少ない隠蔽信号を生成することができる。
また、これまで、定常性判定部13が、相関ピーク変動率を用いて定常性を判定する場合と、振幅変動率を用いて定常性を判定する場合とをそれぞれ説明したが、相関ピーク変動率と振幅変動率とを両方用いて定常性を判定するようにしてもよい。
図8は、相関ピーク変動率および振幅変動率を用いた場合の定常性判定部13の処理手順を示すフローチャートである。同図に示すステップS501からS503までのピッチ周期およびピッチ相関値の算出に係る処理については、図6に示したステップS301からS304までの処理と同じであるため、ここでは説明を省略する。
定常性判定部13は、ピッチ相関値ac_pを算出した後に、算出したピッチ相関値ac_pが所定の閾値未満であった場合には(ステップS504,No)、前記の式(3)を用いて相関ピーク変動率p_varを算出する(ステップS505)。
そして、算出した相関ピーク変動率p_varが所定の閾値を越えていた場合には(ステップS506,No)、定常性判定部13は、当該フレームの音声伝送信号に定常性がないと判定する(ステップS507)。
一方、ピッチ相関値ac_pが所定の閾値以上であった場合(ステップS504,Yes)、または、相関ピーク変動率p_varが所定の閾値以下であった場合には(ステップS506,Yes)、定常性判定部13は、前記の式(4)を用いて振幅変動率を算出する(ステップS508)。
そして、算出した振幅変動率a_varが所定の閾値以下であった場合には(ステップS509,Yes)、定常性判定部13は、当該フレームの音声伝送信号に定常性があると判定し(ステップS510)、一方、所定の閾値を超えていた場合には(ステップS509,No)、当該フレームの音声伝送信号に定常性がないと判定する(ステップS507)。
このように、定常性判定部13が、相関ピーク変動率および振幅変動率を用いて定常性を判定することにより、周期性が小さい音声伝送信号を入力した場合でも、入力した音声伝送信号のうち音質の変化が少ない区間を定常区間として設定することが可能になり、かつ、振幅変動率が大きいため繰り返し信号として用いた場合に音質が劣化する可能性がある区間の信号を排除することが可能になるので、さらに音質の劣化が少ない隠蔽信号を生成することができる。
ところで、上記実施例1では、長さや位置が異なる複数の繰り返し区間から取り出した繰り返し信号を用いて隠蔽信号を生成する場合について説明したが、長い繰り返し区間から取り出した繰り返し信号を用いた場合には、その信号の中に、全く同じ信号が複数含まれる可能性がある。その場合、それら同じ信号によって、隠蔽信号に周期性が発生してしまう可能性がある。
そこで、以下では、実施例2として、繰り返し区間から取り出した繰り返し信号に対して、時間に応じて振幅がランダムに変動する変動信号をかけ合わせることによって、隠蔽信号の中に、全く同じ信号が複数含まれることがないようにした場合について説明する。
まず、本実施例2に係る隠蔽信号生成装置の構成について説明する。図9は、本実施例2に係る隠蔽信号生成装置の構成を示す機能ブロック図である。なお、ここでは説明の便宜上、図2に示した各部と同様の役割を果たす機能部については、同一符号を付すこととしてその詳細な説明を省略する。
同図に示すように、この隠蔽信号生成装置20は、正常信号記憶部11と、繰り返し信号記憶部12と、定常性判定部13と、繰り返し区間算出部24と、制御部25と、フィルタ係数記憶部27と、フィルタ係数生成部28と、繰り返し信号補正部26とを有する。
繰り返し区間算出部24は、音声伝送信号が消失した場合に、隠蔽信号の生成に用いられる繰り返し信号を生成する処理部である。具体的には、この繰り返し区間算出部24は、制御部25から繰り返し信号の生成指示を受け付けると、実施例1で説明した繰り返し区間算出部14と同様に繰り返し信号を生成し、生成した繰り返し信号を繰り返し信号補正部26に対して送信する。
制御部25は、音声伝送信号の入出力や繰り返し信号の生成を制御する処理部である。具体的には、この制御部25は、実施例1で説明した制御部15と同様に、音声伝送信号の定常性の有無に基づいて、音声伝送信号を正常信号記憶部11に保存したり、正常信号記憶部11に保持された音声伝送信号を削除したり、音声伝送信号の消失有無に基づいて、隠蔽信号を出力したりする。
なお、実施例1では、制御部15は、繰り返し区間算出部14から繰り返し信号の生成が完了したことを通知された場合に、繰り返し信号記憶部12に保持されている繰り返し信号を取り出し、取り出した繰り返し信号を隠蔽信号として出力するが、本実施例2では、制御部25は、繰り返し信号補正部26から繰り返し信号の補正が完了したことを通知された場合に、繰り返し信号記憶部12に保持されている繰り返し信号を取り出し、取り出した繰り返し信号を隠蔽信号として出力する。
繰り返し信号補正部26は、フィルタ係数記憶部27に保持されているフィルタ係数を用いて、繰り返し区間算出部24によって生成された繰り返し信号を補正する処理部である。具体的には、この繰り返し信号補正部26は、繰り返し区間算出部24から繰り返し信号が送信されると、フィルタ係数記憶部27に保持されているフィルタ係数を取得し、取得したフィルタ係数を適用することによって、繰り返し区間算出部24から送信された繰り返し信号を補正する。
そして、繰り返し信号を補正すると、繰り返し信号補正部26は、その繰り返し信号を繰り返し信号記憶部12に保存するとともに、制御部25に対して、繰り返し信号の補正が完了したことを通知する。なお、かかる繰り返し信号補正部26による繰り返し信号の補正処理については、後にさらに詳細に説明する。
フィルタ係数記憶部27は、後述するフィルタ係数生成部28によって生成されるフィルタ係数を保持する記憶部である。
フィルタ係数生成部28は、繰り返し区間算出部24によって生成された繰り返し信号を補正するためのフィルタ係数を生成する処理部である。具体的には、このフィルタ係数生成部28は、あらかじめ設定された所定の変動幅に基づいて、あらかじめ決められた周波数帯域の単位ごとに周波数特性補正係数を算出し、算出した周波数特性補正係数を、逆FFT(Fast Fourier Transforms)などの公知の変換技術を用いて時間領域の係数に変換し、その結果得られる時間領域の係数をフィルタ係数としてフィルタ係数記憶部27に保存する。ここで、周波数特性補正係数とは、各周波数帯域のパワースペクトルにかける倍率である。なお、かかるフィルタ係数生成部28によるフィルタ係数の生成処理については、後にさらに詳細に説明する。
次に、本実施例2に係る隠蔽信号生成装置の処理手順について説明する。図10は、本実施例2に係る隠蔽信号生成装置の処理手順を示すフローチャートである。なお、同図に示すステップS601からS609までの処理については、図4に示したステップS101からS109までの処理と同じであるため、ここでは説明を省略する。
制御部25から繰り返し信号の生成を指示されると、繰り返し区間算出部24は、繰り返し区間を設定するための繰り返し区間算出処理を行い(ステップS610)、この処理によって設定された繰り返し区間の信号を取り出して、繰り返し信号補正部26に対して送信する。なお、ステップS610の繰り返し区間算出処理については、図5に示した繰り返し区間算出処理と同じであるので、ここでは説明を省略する。
繰り返し信号補正部26は、繰り返し区間算出部24から繰り返し信号が送信されると、繰り返し信号を補正するための繰り返し区間補正処理を行う(ステップS611)。ここで行われる繰り返し区間補正処理の処理手順については、後に説明する。
そして、繰り返し信号補正部26は、繰り返し区間補正処理によって補正された繰り返し信号を繰り返し信号記憶部12に保存する(ステップS612)。なお、ここで行われる繰り返し区間補正処理の処理手順については、後に説明する。
そして、繰り返し区間算出部24は、1フレームの繰り返し信号を生成するまで、繰り返し信号の生成および補正を行い(ステップS613,No)、1フレームの繰り返し信号を生成および補正した場合には(ステップS613,Yes)、繰り返し信号の補正が完了したことを制御部15に対して通知する。
この通知を受け付けると、制御部25は、繰り返し信号記憶部12に保持されている信号を隠蔽信号として出力する(ステップS614)。
次に、図10に示した繰り返し区間補正処理の処理手順について説明する。図11は、図10に示した繰り返し区間補正処理の処理手順を示すフローチャートである。この繰り返し区間補正処理は、繰り返し信号補正部26によって行われるものである。
同図に示すように、繰り返し信号補正部26は、まず、繰り返し区間算出部24から送信された信号を入力する(ステップS701)。
続いて、繰り返し信号補正部26は、入力した繰り返し区間の信号に対してフィルタを適用する(ステップS702)。具体的には、繰り返し信号補正部26は、フィルタ係数記憶部27に保持されているフィルタ係数の中からランダムに1つのフィルタ係数を選択し、選択したフィルタ係数を、入力した繰り返し区間の信号に対して適用する。
ここで、フィルタ係数をf(s)、繰り返し区間の信号をx(t)とすると、補正した繰り返し区間の信号y(t)は、以下に示す式(5)によって表される。
Figure 0004504389
次に、フィルタ係数生成部28の処理手順について説明する。図12は、フィルタ係数生成部28の処理手順を示すフローチャートである。同図に示すように、フィルタ係数生成部28は、まず、あらかじめ設定されている変動幅を入力する(ステップS801)。ここで入力される変動幅には、あらかじめ0から2までの間で決められた数値が設定されている。
続いて、フィルタ係数生成部28は、入力した変動幅に基づいて、あらかじめ決められた周波数帯域の単位ごとに周波数特性補正係数を算出する(ステップS802)。ここで、変動幅をdelta、あらかじめ決められた周波数帯域の数をiとすると、周波数特性補正係数coef[i]は、以下に示す式(6)で算出される。
coef[i]=delta×rand[i] ・・・(6)
上記の式において、rand[i]は、i番目の周波数帯域に対して、−1〜+1までの間でランダムに生成した数値である。
この式を用いて周波数特性補正係数coef[i]を算出した後に、フィルタ係数生成部28は、算出した周波数特性補正係数coef[i]を時間領域の係数に変換する(ステップS803)。この変換には、フィルタ係数生成部28は、逆FFT(Fast Fourier Transforms)などの公知の変換技術を用いる。
そして、フィルタ係数生成部28は、変換して得られた時間領域の係数を、フィルタ係数としてフィルタ係数記憶部27に保存する(ステップS804)。フィルタ係数生成部28は、上記の処理を複数回繰り返すことによって、複数のフィルタ係数をフィルタ係数記憶部27に保存する。
上述してきたように、本実施例2では、繰り返し信号補正部26が、時間に応じて振幅が変動する変動信号を用いて、繰り返し区間算出部24により設定された繰り返し区間の音声伝送信号を補正し、制御部25が、繰り返し信号補正部26により補正された繰り返し信号を用いて隠蔽信号を生成するので、全く同じ音声伝送信号が隠蔽信号に含まれることがなくなり、繰り返しによる劣化が、より少ない隠蔽信号を生成することができる。
なお、本実施例2では、フィルタ係数生成部28が、あらかじめ設定された変動幅とランダムな数値とから算出された周波数特性補正係数に基づいて、フィルタ係数を生成する場合について説明したが、正常信号記憶部11に保持されている音声伝送信号、すなわち、過去の音声伝送信号に基づいて、フィルタ係数を生成するようにしてもよい。
図13は、過去に入力された音声伝送信号に基いてフィルタ係数を生成する場合のフィルタ係数生成部の処理手順を示すフローチャートである。同図に示すように、この場合は、まず、フィルタ係数生成部28は、正常信号記憶部11に保持されている音声伝送信号から1フレーム分の音声伝送信号を入力し(ステップS901)、その信号のパワースペクトルを算出する(ステップS902)。この時、フィルタ係数生成部28は、FFTなど公知の技術を用いて、パワースペクトルを算出する。
続いて、フィルタ係数生成部28は、算出したパワースペクトルの平均を算出する(ステップS903)。i番目の周波数帯域のパワースペクトルをspec[i]とすると、パワースペクトルの平均ave_spec[i]は、以下に示す式(7)によって算出される。
ave_spec[i]=(prev_ave_spec[i]×(num−1)+spec[i])/num ・・・(7)
上記の式において、prev_ave_spec[i]は、前回算出したパワースペクトルの平均であり、numは、パワースペクトルの平均を算出する際に用いるあらかじめ決められたフレーム数である。
この式を用いてパワースペクトルの平均ave_spec[i]を算出した後に、フィルタ係数生成部28は、音声伝送信号のパワースペクトルの変動を算出する(ステップS904)。i番目のパワースペクトルの標準偏差をstd_spec[i]とすると、パワースペクトルの変動vdelta[i]は、以下に示す式(8)によって算出される。
vdelta[i]=coef2[i]×std_spec[i] ・・・(8)
上記の式において、coef2[i]は、あらかじめ定められた定数である。また、i番目のパワースペクトルの標準偏差std_spec[i]は、以下に示す式(9)を用いて簡便に算出することができる。
Figure 0004504389
上記の式において、spec[i,t]は、フレームにおけるi版目のパワースペクトルであり、ave_spec[i]は、i番目のパワースペクトルの平均を表しており、tは、num個のフレームのうち何番目のフレームであるかを表している。
そして、パワースペクトルの変動vdelta[i]を算出した後に、フィルタ係数生成部28は、以下に示す式(10)を用いて、周波数特性補正係数coef[i]を算出する。
coef[i]=vdelta[i]×rand[i] ・・・(10)
上記の式において、coef[i]は、i番目の周波数帯域の周波数特性補正係数であり、rand[i]は、i番目の周波数帯域に対して、−1〜+1までの間でランダムに生成した数値である。
この式を用いて周波数特性補正係数coef[i]を算出した後に、フィルタ係数生成部28は、算出した周波数特性補正係数coef[i]を時間領域の係数に変換する(ステップS905)。この変換には、フィルタ係数生成部28は、逆FFT(Fast Fourier Transforms)などの公知の変換技術を用いる。
そして、フィルタ係数生成部28は、変換して得られた時間領域の係数を、フィルタ係数としてフィルタ係数記憶部27に保存する(ステップS906)。フィルタ係数生成部28は、上記の処理を複数回繰り返すことによって、複数のフィルタ係数をフィルタ係数記憶部27に保存する。
このように、フィルタ係数生成部28が、過去に入力された音声伝送信号の周波数特性に基づいてフィルタ係数を生成することによって、繰り返し区間の信号を過去に入力された音声伝送信号と変動が似通った信号に補正することが可能になり、音質の変換がより自然な隠蔽信号を生成することができる。
なお、本実施例では、隠蔽信号生成装置について説明したが、隠蔽信号生成装置が有する構成をソフトウェアによって実現することで、同様の機能を有する隠蔽信号生成プログラムを得ることができる。そこで、この隠蔽信号生成プログラムを実行するコンピュータについて説明する。
図14は、本実施例に係る隠蔽信号生成プログラムを実行するコンピュータの構成を示す機能ブロック図である。同図に示すように、このコンピュータ100は、RAM(Random Access Memory)110と、CPU(Central Processing Unit)120と、HDD(Hard Disk Drive)130と、LAN(Local Area Network)インタフェース140と、入出力インタフェース150と、DVD(Digital Versatile Disk)ドライブ160とを有する。
RAM110は、プログラムやプログラムの実行途中結果などを記憶するメモリであり、CPU120は、RAM110からプログラムを読み出して実行する中央処理装置である。
HDD130は、プログラムやデータを格納するディスク装置であり、LANインタフェース140は、コンピュータ100をLAN経由で他のコンピュータに接続するためのインタフェースである。
入出力インタフェース150は、マウスやキーボードなどの入力装置および表示装置を接続するためのインタフェースであり、DVDドライブ160は、DVDの読み書きを行う装置である。
そして、このコンピュータ100において実行される隠蔽信号生成プログラム111は、DVDに記憶され、DVDドライブ160によってDVDから読み出されてコンピュータ100にインストールされる。
あるいは、この隠蔽信号生成プログラム111は、LANインタフェース140を介して接続された他のコンピュータシステムのデータベースなどに記憶され、これらのデータベースから読み出されてコンピュータ100にインストールされる。
そして、インストールされた隠蔽信号生成プログラム111は、HDD130に記憶され、RAM110に読み出されてCPU120によって信号消失隠蔽プロセス121として実行される。
また、本実施例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
さらに、各装置にて行われる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
以上のように、本発明に係る隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラムは、VoIPなどの音声信号伝送において隠蔽信号を生成する場合に有用であり、特に、音質の劣化が少ない隠蔽信号を生成することが求められる場合に適している。
本実施例1に係る隠蔽信号生成方法の概念を説明するための図である。 本実施例1に係る隠蔽信号生成装置の構成を示す機能ブロック図である。 繰り返し区間算出部による繰り返し区間の設定を説明するための図である。 本実施例1に係る隠蔽信号生成装置の処理手順を示すフローチャートである。 図4に示した繰り返し区間算出処理の処理手順を示すフローチャートである。 定常性判定部の処理手順を示すフローチャートである。 振幅変動率を用いた場合の定常性判定部の処理手順を示すフローチャートである。 相関ピーク変動率および振幅変動率を用いた場合の定常性判定部の処理手順を示すフローチャートである。 本実施例2に係る隠蔽信号生成装置の構成を示す機能ブロック図である。 本実施例2に係る隠蔽信号生成装置の処理手順を示すフローチャートである。 図10に示した繰り返し区間補正処理の処理手順を示すフローチャートである。 フィルタ係数生成部の処理手順を示すフローチャートである。 過去に入力された音声伝送信号に基いてフィルタ係数を生成する場合のフィルタ係数生成部の処理手順を示すフローチャートである。 隠蔽信号生成プログラムを実行するコンピュータの構成を示す機能ブロック図である。 従来の隠蔽信号生成方法における問題点を説明するための図である。
符号の説明
10,20 隠蔽信号生成装置
11 正常信号記憶部
12 繰り返し信号記憶部
13 定常性判定部
14,24 繰り返し区間算出部
15,25 制御部
26 繰り返し信号補正部
27 フィルタ係数記憶部
28 フィルタ係数生成部
100 コンピュータ
110 RAM
111 隠蔽信号生成プログラム
120 CPU
121 信号消失隠蔽プロセス
130 HDD
140 LANインタフェース
150 入出力インタフェース
160 DVDドライブ

Claims (12)

  1. 音声伝送信号が消失した場合に、音声伝送信号の消失を隠蔽する隠蔽信号を生成する隠蔽信号生成装置であって、
    音声伝送信号が消失した場合に、過去に入力された音声伝送信号から、消失直前に入力された信号に類似する複数の信号を検出し、検出した各信号から消失直前に入力された信号までの区間をそれぞれ繰り返し区間として設定する繰り返し区間設定手段と、
    前記繰り返し区間設定手段により設定された複数の繰り返し区間に含まれる信号を連結することで前記隠蔽信号を生成する隠蔽信号生成手段と、
    を備えたことを特徴とする隠蔽信号生成装置。
  2. 時間に応じて振幅が変動する変動信号を用いて、前記繰り返し区間設定手段により設定された繰り返し区間の音声伝送信号を補正する信号補正手段をさらに備え、
    前記隠蔽信号生成手段は、前記信号補正手段により補正された音声伝送信号を用いて前記隠蔽信号を生成することを特徴とする請求項1に記載の隠蔽信号生成装置。
  3. 前記信号補正手段は、過去に入力された音声伝送信号の周波数特性に基づいて生成された前記変動信号を用いて、前記繰り返し区間設定手段により設定された繰り返し区間の音声伝送信号を補正することを特徴とする請求項2に記載の隠蔽信号生成装置。
  4. 過去に入力された音声伝送信号と消失直前の音声伝送信号との類似度の変動が安定しているか否かを示す定常性を判定する定常性判定手段をさらに備え、
    前記繰り返し区間設定手段は、前記定常性判定手段により定常性があると判定された音声伝送信号から、消失直前に入力された信号に類似する複数の信号を検出し、検出した各信号から消失直前に入力された信号までの区間をそれぞれ繰り返し区間として設定することを特徴とする請求項1、2または3に記載の隠蔽信号生成装置。
  5. 前記定常性判定手段は、前記類似度の変動におけるピーク値の変動に基づいて、前記定常性を判定することを特徴とする請求項4に記載の隠蔽信号生成装置。
  6. 前記定常性判定手段は、前記類似度の変動における振幅の変動に基づいて、前記定常性を判定することを特徴とする請求項4に記載の隠蔽信号生成装置。
  7. 前記隠蔽信号生成手段は、前記繰り返し区間の信号を連結する際に、連結部分の信号を所定の長さだけ重ね合わせ加算することを特徴とする請求項1〜6のいずれか一つに記載の隠蔽信号生成装置。
  8. 前記繰り返し区間設定手段は、消失直前に入力された信号に類似する複数の信号を検出した後に、検出した各信号の中からランダムに信号を選択し、選択した信号から消失直前に入力された信号までの区間を前記繰り返し区間として設定することを特徴とする請求項1〜7のいずれか一つに記載の隠蔽信号生成装置。
  9. 音声伝送信号が消失した場合に、音声伝送信号の消失を隠蔽する隠蔽信号を生成する隠蔽信号生成方法であって、
    音声伝送信号が消失した場合に、過去に入力された音声伝送信号から、消失直前に入力された信号に類似する複数の信号を検出し、検出した各信号から消失直前に入力された信号までの区間をそれぞれ繰り返し区間として設定する繰り返し区間設定工程と、
    前記繰り返し区間設定工程により設定された複数の繰り返し区間に含まれる信号を連結することで前記隠蔽信号を生成する隠蔽信号生成工程と、
    を含んだことを特徴とする隠蔽信号生成方法。
  10. 過去に入力された音声伝送信号と消失直前の音声伝送信号との類似度の変動が安定しているか否かを示す定常性を判定する定常性判定工程をさらに含み、
    前記繰り返し区間設定工程は、前記定常性判定工程により定常性があると判定された音声伝送信号から、消失直前に入力された信号に類似する複数の信号を検出し、検出した各信号から消失直前に入力された信号までの区間をそれぞれ繰り返し区間として設定することを特徴とする請求項に記載の隠蔽信号生成方法。
  11. 音声伝送信号が消失した場合に、音声伝送信号の消失を隠蔽する隠蔽信号を生成する隠蔽信号生成プログラムであって、
    音声伝送信号が消失した場合に、過去に入力された音声伝送信号から、消失直前に入力された信号に類似する複数の信号を検出し、検出した各信号から消失直前に入力された信号までの区間をそれぞれ繰り返し区間として設定する繰り返し区間設定手順と、
    前記繰り返し区間設定手順により設定された複数の繰り返し区間に含まれる信号を連結することで前記隠蔽信号を生成する隠蔽信号生成手順と、
    をコンピュータに実行させることを特徴とする隠蔽信号生成プログラム。
  12. 過去に入力された音声伝送信号と消失直前の音声伝送信号との類似度の変動が安定しているか否かを示す定常性を判定する定常性判定手順をさらにコンピュータに実行させ、
    前記繰り返し区間設定手順は、前記定常性判定手順により定常性があると判定された音声伝送信号から、消失直前に入力された信号に類似する複数の信号を検出し、検出した各信号から消失直前に入力された信号までの区間をそれぞれ繰り返し区間として設定することを特徴とする請求項11に記載の隠蔽信号生成プログラム。
JP2007042870A 2007-02-22 2007-02-22 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム Expired - Fee Related JP4504389B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007042870A JP4504389B2 (ja) 2007-02-22 2007-02-22 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム
EP07025207A EP1962281A3 (en) 2007-02-22 2007-12-28 Concealment signal generator, concealment signal generation method, and computer product
US11/967,403 US8438035B2 (en) 2007-02-22 2007-12-31 Concealment signal generator, concealment signal generation method, and computer product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007042870A JP4504389B2 (ja) 2007-02-22 2007-02-22 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム

Publications (2)

Publication Number Publication Date
JP2008203783A JP2008203783A (ja) 2008-09-04
JP4504389B2 true JP4504389B2 (ja) 2010-07-14

Family

ID=39272738

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007042870A Expired - Fee Related JP4504389B2 (ja) 2007-02-22 2007-02-22 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム

Country Status (3)

Country Link
US (1) US8438035B2 (ja)
EP (1) EP1962281A3 (ja)
JP (1) JP4504389B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009116972A1 (en) * 2008-03-20 2009-09-24 Thomson Licensing System and method for processing priority transport stream data in real time in a multi-channel broadcast multimedia system
JP5694745B2 (ja) * 2010-11-26 2015-04-01 株式会社Nttドコモ 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム
JP7316586B2 (ja) 2020-01-16 2023-07-28 パナソニックIpマネジメント株式会社 音声信号受信装置、及び音声信号伝送システム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH021661A (ja) * 1988-06-10 1990-01-05 Oki Electric Ind Co Ltd パケット補間方式
JP2003316670A (ja) * 2002-04-19 2003-11-07 Japan Science & Technology Corp エラー隠蔽方法、エラー隠蔽プログラム及びエラー隠蔽装置
JP2006053394A (ja) * 2004-08-12 2006-02-23 Oki Electric Ind Co Ltd 消失補償装置、消失補償方法、および消失補償プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1088302B1 (en) 1999-04-19 2008-07-23 AT & T Corp. Method for performing packet loss concealment
US7047190B1 (en) * 1999-04-19 2006-05-16 At&Tcorp. Method and apparatus for performing packet loss or frame erasure concealment
FR2813722B1 (fr) * 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
JP4287637B2 (ja) 2002-10-17 2009-07-01 パナソニック株式会社 音声符号化装置、音声符号化方法及びプログラム
EP1589330B1 (en) * 2003-01-30 2009-04-22 Fujitsu Limited Audio packet vanishment concealing device, audio packet vanishment concealing method, reception terminal, and audio communication system
JP4445328B2 (ja) 2004-05-24 2010-04-07 パナソニック株式会社 音声・楽音復号化装置および音声・楽音復号化方法
EP1769092A4 (en) 2004-06-29 2008-08-06 Europ Nickel Plc IMPROVED LIXIVIATION OF BASE METALS
EP1775717B1 (en) * 2004-07-20 2013-09-11 Panasonic Corporation Speech decoding apparatus and compensation frame generation method
AU2006208529B2 (en) * 2005-01-31 2010-10-28 Microsoft Technology Licensing, Llc Method for weighted overlap-add

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH021661A (ja) * 1988-06-10 1990-01-05 Oki Electric Ind Co Ltd パケット補間方式
JP2003316670A (ja) * 2002-04-19 2003-11-07 Japan Science & Technology Corp エラー隠蔽方法、エラー隠蔽プログラム及びエラー隠蔽装置
JP2006053394A (ja) * 2004-08-12 2006-02-23 Oki Electric Ind Co Ltd 消失補償装置、消失補償方法、および消失補償プログラム

Also Published As

Publication number Publication date
EP1962281A2 (en) 2008-08-27
US8438035B2 (en) 2013-05-07
EP1962281A3 (en) 2011-10-19
US20080208598A1 (en) 2008-08-28
JP2008203783A (ja) 2008-09-04

Similar Documents

Publication Publication Date Title
US8165873B2 (en) Speech analysis apparatus, speech analysis method and computer program
JP4769673B2 (ja) オーディオ信号補間方法及びオーディオ信号補間装置
US8296143B2 (en) Audio signal processing apparatus, audio signal processing method, and program for having the method executed by computer
JP4504389B2 (ja) 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム
WO2018016636A1 (ja) タイミング予想方法、及び、タイミング予想装置
JP5694745B2 (ja) 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム
US8492639B2 (en) Audio processing apparatus and method
US9865276B2 (en) Voice processing method and apparatus, and recording medium therefor
JP6229576B2 (ja) サンプリング周波数推定装置
WO2017164216A1 (ja) 音響処理方法および音響処理装置
JP2008026836A (ja) 音声の類似度を評価する方法、装置およびプログラム
US7337109B2 (en) Multiple step adaptive method for time scaling
JP7422867B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP6011039B2 (ja) 音声合成装置および音声合成方法
WO2023127243A1 (ja) 異音特定方法、及び異音特定装置
JP7021437B2 (ja) 学習データ生成装置、学習データ生成方法、及びプログラム
JP4868042B2 (ja) データ変換装置およびデータ変換プログラム
JP5378944B2 (ja) 音声処理装置およびプログラム
JP2008224306A (ja) スペクトラム解析装置
JP4526979B2 (ja) 音声素片生成装置
JP6784137B2 (ja) 音響解析方法および音響解析装置
WO2020032177A1 (ja) 時系列データの周波数成分ベクトルを生成する方法及び装置
JP4868041B2 (ja) データ変換装置およびデータ変換プログラム
JP2022045086A (ja) 残響を求めるためのシステム
JP2020134639A (ja) 音響信号処理方法及び音響信号処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090907

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100420

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100422

R150 Certificate of patent or registration of utility model

Ref document number: 4504389

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130430

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140430

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees