JP2009063928A

JP2009063928A - 補間方法、情報処理装置

Info

Publication number: JP2009063928A
Application number: JP2007233273A
Authority: JP
Inventors: Kaori Endou; 香緒里遠藤
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2007-09-07
Filing date: 2007-09-07
Publication date: 2009-03-26
Also published as: US20090070117A1

Abstract

【課題】本発明に係る補間方法は、パケットロス直前の信号が子音や背景雑音などの周期性が小さいものであっても、不自然な周期発生による異音などによる音質劣化を低減すること、パケットロスが長い時間継続した際でも無音化による音質劣化を低減するパケットロスを補間することを目的とする。
【解決手段】本実施例における補間方法は、伝送で損失した音声のデジタル信号を補間する補間方法において、該デジタル信号の特徴量を算出する分析手順と、該特徴量に応じて、擬似音声を生成する擬似音声生成手順と、該特徴量に応じて、擬似雑音を生成する擬似雑音生成手順と、該擬似音声と該擬似雑音を組み合わせて補間信号を生成する出力信号生成手順とからなることを特徴とする。
【選択図】図１

Description

本発明はパケット交換網における音声伝送の補間方法に関する。

ＶｏＩＰ（ＶｏｉｃｅｏｖｅｒＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ）の音声信号の伝送において、しばしばパケットロスが発生する。パケット損失が発生すると、音が途切れて音声品質が著しく劣化する。このような音声品質の劣化を防ぐために、損失したパケットを補間し、音声信号の消失を隠蔽する隠蔽処理が行われている。具体的には損失したパケットの補間処理は、ＩＴＵ―Ｔの勧告に基づくＧ．７１１Ａｐｐｅｎｄｉｘ１である。Ｇ．７１１Ａｐｐｅｎｄｉｘ１の補間処理は、損失したパケット直前の信号の周期を算出し、振幅を徐々に小さくしながら、算出した周期で繰り返してパケットロスを補間する処理である。

しかしながら、Ｇ．７１１Ａｐｐｅｎｄｉｘ１など従来におけるパケットロスの補間処理においては、パケットロス直前の信号が子音や背景雑音などの周期性が小さいものである場合、不自然な周期が発生して異音が発生するといった問題があった。
国際公開第２００４／０６８０９８号パンフレット

本発明に係る補間方法は、パケットロス直前の信号が子音や背景雑音などの周期性が小さいものであっても、不自然な周期発生による異音などによる音質劣化を低減すること、パケットロスが長い時間継続した際でも無音化による音質劣化を低減するパケットロスを補間することを目的とする。

本実施例における補間方法は、伝送で損失した音声のデジタル信号を補間する補間方法において、該デジタル信号の特徴量を算出する分析手順と、該特徴量に応じて、擬似音声を生成する擬似音声生成手順と、該特徴量に応じて、擬似雑音を生成する擬似雑音生成手順と、該擬似音声と該擬似雑音を組み合わせて補間信号を生成する出力信号生成手順とからなることを特徴とする。

また本実施例に係る補間方法は、該分析手順において該背景雑音の周波数特性を算出することを特徴とする。

また本実施例に係る補間方法は、該擬似雑音生成手順において該背景雑音の周波数特性を持つ信号を生成することを特徴とすることを特徴とする。

また本実施例に係る補間方法は、該擬似雑音生成手順において白色雑音に該分析手順で算出した背景雑音の周波数特性を適用して擬似雑音を生成することを特徴とする。

また本実施例に係る補間方法は、該分析手順において該背景雑音のパワースペクトルを算出することを特徴とする。

また本実施例に係る補間方法は、該擬似雑音生成手順において背景雑音のパワースペクトルにランダムな位相を適用して擬似雑音を生成することを特徴とする。

また本実施例に係る補間方法は、該分析手順において該デジタル信号の周期性を算出することを特徴とする。

また本実施例に係る補間方法は、該擬似音声生成手順において該デジタル信号を該デジタル信号の周期の整数倍の長さで繰り返して擬似音声を生成することを特徴とする。

また本実施例に係る補間方法は、該分析手順において該デジタル信号の音声の包絡と該音声の音源と該音声の周期を算出することを特徴とする。

また本実施例に係る情報処理装置は、伝送で損失した音声のデジタル信号を補間する情報処理装置において、該デジタル信号の特徴量を算出する分析手段と、該特徴量に応じて、擬似音声を生成する擬似音声生成手段と、該特徴量に応じて、擬似雑音を生成する擬似雑音生成手段と、該擬似音声と該擬似雑音を組み合わせて補間信号を生成する出力信号生成手段とからなることを特徴とする。

本発明に係る補間方法は、入力信号に含まれる音声の特徴量と雑音の特徴量から擬似音声と擬似雑音をそれぞれ独立に生成することにより、パケットロス直前の信号が子音や背景雑音などの周期性が小さいものであっても、不自然な周期発生の異音などによる音質劣化を低減してパケットロスを補間することができる。

また、パケットロスが長い時間継続した際でも擬似雑音を出力しつづけることにより無音化による音質劣化を低減できる。

本実施例では、情報処理装置１００〜７００がＶｏＩＰなどの伝送エラーで失われた音声信号を補間する。情報処理装置１００〜７００の機能構成については、図１〜図７に示す。

情報処理装置１００〜７００は、入力信号に含まれる音声の擬似音声と、入力信号に含まれる背景雑音を模倣する擬似雑音を算出する。情報処理装置１００〜７００は、擬似音声と擬似雑音を混合した補間信号によって、パケット損失を補間する。また情報処理装置１００〜７００は、擬似音声と擬似雑音を独立して制御することが可能である。これより情報処理装置１００〜７００は、高音質の補間信号を生成することができる。本実施例の情報処理装置１００〜７００が補間する信号損失は、ネットワークの輻輳によるパケット損失、ネットワーク回線のエラー、音声信号の符号化エラーなどである。

以下、図１〜図７により、情報処理装置１００〜７００の機能の概要について説明する。

［情報処理装置１００の構成図］
図１は本実施例に係る情報処理装置１００の構成図である。

情報処理装置１００は、分析手段１０１、擬似音声生成手段１０２、擬似雑音生成手段１０３、出力信号生成手段１０４から構成されている。

分析手段１０１は、情報処理装置１００の外部より入力されたエラー情報と正常区間の入力信号とから音声の特徴量と雑音の特徴量を算出する。ここでエラー情報は、音声伝送においてパケット損失があった区間を示す情報である。音声の特徴量は、音声信号の音声成分、音声成分の包絡、音声成分の包絡の変化パターンなどである。また背景雑音の特徴量は、背景雑音の周波数特性などである。これら音声の特徴量、背景雑音の特徴量の具体例については、図２〜図７に示す情報処理装置２００〜７００に説明において説明する。

そして分析手段１０１は、擬似音声生成手段１０２に対して、音声の特徴量を入力する。擬似音声生成手段１０２は、音声の特徴量に基づいて、擬似音声を生成する。

また分析手段１０１は、擬似雑音生成手段１０３に対して、雑音の特徴量を入力する。擬似雑音生成手段１０３は、雑音の特徴量に基づいて、擬似雑音を生成する。

擬似音声生成手段１０２は擬似音声を出力信号生成手段１０４に入力する。擬似雑音生成手段１０３は擬似雑音を出力信号生成手段１０４に入力する。また分析手段１０１は音声の特徴量と雑音の特徴量を出力信号生成手段１０４に入力する。出力信号生成手段１０４はエラー情報と入力信号を情報処理装置１００の外部から取得する。そして出力信号生成手段１０４は出力信号を生成する。

［情報処理装置２００の構成図］
図２は本実施例に係る情報処理装置２００の構成図である。

情報処理装置２００は、分析手段２０１、擬似音声生成手段２０２、擬似雑音生成手段２０３、出力信号生成手段２０４から構成されている。

分析手段２０１は、情報処理装置２００の外部より入力されたエラー情報と正常区間の入力信号とから音声の特徴量と雑音の特徴量を算出する。

そして分析手段２０１は、擬似音声生成手段２０２に対して、音声の特徴量を入力する。擬似音声生成手段２０２は、音声の特徴量に基づいて、擬似音声を生成する。

また分析手段２０１は、擬似雑音生成手段２０３に対して、背景雑音の周波数特性を入力する。背景雑音の周波数特性は、例えば背景雑音のパワースペクトル、インパルス応答、フィルタ係数などである。ここで分析手段２０１は図９に示す処理手順に従い、背景雑音の周波数特性を算出する。擬似雑音生成手段２０３は、背景雑音の周波数特性に基づいて、擬似雑音を生成する。例えば擬似雑音生成手段２０３は白色雑音を生成する。そして擬似雑音生成手段２０３は、白色雑音に背景雑音の周波数特性を適用して擬似雑音を生成する。擬似雑音生成手段２０３は、白色雑音を予め保持する構成でもよい。ここで擬似雑音生成手段は図１７に示す処理手順に従い擬似雑音を生成する。

擬似音声生成手段２０２は擬似音声を出力信号生成手段２０４に入力する。擬似雑音生成手段２０３は擬似雑音を出力信号生成手段２０４に入力する。また分析手段２０１は音声の特徴量と雑音の特徴量を出力信号生成手段２０４に入力する。出力信号生成手段２０４はエラー情報と入力信号を情報処理装置２００の外部から取得する。そして出力信号生成手段２０４は出力信号を生成する。

［情報処理装置３００の構成図］
図３は本実施例に係る情報処理装置３００の構成図である。

情報処理装置３００は、分析手段３０１が雑音の特徴量として具体的に背景雑音のパワースペクトルを算出する。

情報処理装置３００は、分析手段３０１、擬似音声生成手段３０２、擬似雑音生成手段３０３、出力信号生成手段３０４から構成されている。

分析手段３０１は、情報処理装置３００の外部より入力されたエラー情報と正常区間の入力信号とから音声の特徴量と背景雑音のパワースペクトルを算出する。分析手段３０１は図９に示す処理手順に従い、背景雑音のパワースペクトルを算出する。

そして分析手段３０１は、擬似音声生成手段３０２に対して、音声の特徴量を入力する。擬似音声生成手段３０２は、音声の特徴量に基づいて、擬似音声を生成する。

また分析手段３０１は、擬似雑音生成手段３０３に対して、背景雑音のパワースペクトルを入力する。擬似雑音生成手段３０３は、背景雑音のパワースペクトルにランダムな位相を与えて周波数時間変換により時間領域の信号を算出して、擬似雑音を生成する。具体的には擬似雑音生成手段３０３は図１８に示す処理手順に従い、擬似雑音を生成する。

擬似音声生成手段３０２は擬似音声を出力信号生成手段３０４に入力する。擬似雑音生成手段３０３は擬似雑音を出力信号生成手段１０４に入力する。また分析手段１０１は音声の特徴量と雑音の特徴量を出力信号生成手段３０４に入力する。出力信号生成手段３０４はエラー情報と入力信号を情報処理装置３００の外部から取得する。そして出力信号生成手段３０４は出力信号を生成する。

［情報処理装置４００の構成図］
図４は本実施例に係る情報処理装置４００の構成図である。

本実施例に係る情報処理装置４００において、分析手段４０１が入力信号の周期性を算出する。

情報処理装置４００は、分析手段４０１、擬似音声生成手段４０２、擬似雑音生成手段４０３、出力信号生成手段４０４から構成されている。情報処理装置４００は、入力信号を入力信号の周期の整数倍の長さで繰り返して擬似音声を生成する。

分析手段４０１は、情報処理装置４００の外部より入力されたエラー情報と正常区間の入力信号とから入力信号の周期性と雑音の特徴量を算出する。

そして分析手段４０１は、擬似音声生成手段４０２に対して、入力信号と入力信号の周期性を入力する。分析手段４０１は入力信号の自己相関係数を式（Ｆ３）により算出する。分析手段４０１は自己相関係数が最大となる信号のずらし位置の長さを周期として算出する。周期性の算出手順については後述する。

擬似音声生成手段４０２は、入力信号と入力信号の周期性に基づいて、入力信号を周期の整数倍の長さで繰り返して擬似音声を生成する。また分析手段４０１は、擬似雑音生成手段４０３に対して、雑音の特徴量を入力する。擬似雑音生成手段４０３は、雑音の特徴量に基づいて、擬似雑音を生成する。

擬似音声生成手段４０２は擬似音声を出力信号生成手段４０４に入力する。擬似雑音生成手段４０３は擬似雑音を出力信号生成手段４０４に入力する。また分析手段４０１は入力信号の周期性と雑音の特徴量を出力信号生成手段１０４に入力する。出力信号生成手段４０４はエラー情報と入力信号を情報処理装置４００の外部から取得する。そして出力信号生成手段４０４は出力信号を生成する。

［情報処理装置５００の構成図］
図５は本実施例に係る情報処理装置５００の構成図である。

情報処理装置５００は、分析手段５０１、擬似音声生成手段５０２、擬似雑音生成手段５０３、出力信号生成手段５０４から構成されている。

情報処理装置５００は、入力信号に含まれる音声成分を音声成分の周期の整数倍の長さで繰り返すことによって、擬似音声を生成する。

分析手段５０１は、情報処理装置５００の外部より入力されたエラー情報と正常区間の入力信号とから入力信号に含まれる音声成分と音声成分の周期性と雑音の特徴量を算出する。

そして分析手段５０１は、擬似音声生成手段５０２に対して、音声成分と音声成分の周期性を入力する。擬似音声生成手段５０２は、音声成分を周期の整数倍の長さで繰り返すことによって擬似音声を生成する。分析手段５０１は図１０に示す音声成分の算出手順に従い、音声成分を算出する。さらに分析手段５０１は音声成分の自己相関係数を式（Ｆ３）により算出する。分析手段５０１は自己相関係数が最大となる信号のずらし位置の長さを音声成分の周期として算出する。

また分析手段５０１は、擬似雑音生成手段５０３に対して、雑音の特徴量を入力する。擬似雑音生成手段５０３は、雑音の特徴量に基づいて、擬似雑音を生成する。

擬似音声生成手段５０２は擬似音声を出力信号生成手段５０４に入力する。擬似雑音生成手段５０３は擬似雑音を出力信号生成手段５０４に入力する。また分析手段５０１は音声成分の周期性と雑音の特徴量を出力信号生成手段５０４に入力する。出力信号生成手段５０４はエラー情報と入力信号を情報処理装置５００の外部から取得する。そして出力信号生成手段５０４は出力信号を生成する。

［情報処理装置６００の構成図］
図６は本実施例に係る情報処理装置６００の構成図である。

情報処理装置６００は、分析手段６０１、擬似音声生成手段６０２、擬似雑音生成手段６０３、出力信号生成手段６０４から構成されている。

情報処理装置６００は、入力信号に含まれる音声音源を音声の音源の周期の整数倍の長さで繰り返し、音声の包絡を適用することによって、擬似音声を生成する。分析手段６０１は、図１１に示す音声の包絡、音声の音源の算出手順に従い、音声の包絡、音声の音源を算出する。

分析手段６０１は、情報処理装置６００の外部より入力されたエラー情報と正常区間の入力信号とから入力信号に含まれる音声の包絡と音声の音源と音声の音源の周期性と雑音の特徴量を算出する。

そして分析手段６０１は、擬似音声生成手段６０２に対して、音声の包絡と音声の音源と音声の音源の周期性を入力する。擬似音声生成手段６０２は、入力信号に含まれる音声音源を音声の音源の周期の整数倍の長さで繰り返し、音声の包絡を適用することによって、擬似音声を生成する。また分析手段６０１は、擬似雑音生成手段６０３に対して、雑音の特徴量を入力する。擬似雑音生成手段６０３は、雑音の特徴量に基づいて、擬似雑音を生成する。

擬似音声生成手段６０２は擬似音声を出力信号生成手段６０４に入力する。擬似雑音生成手段６０３は擬似雑音を出力信号生成手段６０４に入力する。また分析手段６０１は音声の音源の周期性と雑音の特徴量を出力信号生成手段６０４に入力する。出力信号生成手段６０４はエラー情報と入力信号を情報処理装置６００の外部から取得する。そして出力信号生成手段６０４は出力信号を生成する。

［情報処理装置７００の構成図］
図７は本実施例に係る情報処理装置７００の構成図である。

情報処理装置７００は、分析手段７０１、擬似音声生成手段７０２、擬似雑音生成手段７０３、出力信号生成手段７０４から構成されている。

情報処理装置７００は、入力信号に含まれる音声音源を音声の音源の周期の整数倍の長さで繰り返し、音声の包絡の変化パターンを適用することによって、擬似音声を生成する。

分析手段７０１は、情報処理装置７００の外部より入力されたエラー情報と正常区間の入力信号とから入力信号に含まれる音声の包絡の変化パターンと音声の音源と音声の音源の周期性と雑音の特徴量を算出する。分析手段７０１は、図１１に示す音声の包絡、音声の音源の算出手順に従い、音声の包絡、音声の音源を算出する。また分析手段７０１は図１２に示す音声の包絡の変化パターンの処理手順に従い、音声の包絡の変化パターンを算出する。

そして分析手段７０１は、擬似音声生成手段７０２に対して、音声の包絡の変化パターンと音声の音源と音声の音源の周期性を入力する。擬似音声生成手段７０２は、入力信号に含まれる音声音源を音声の音源の周期の整数倍の長さで繰り返し、音声の包絡の変化パターンを適用することによって、擬似音声を生成する。また分析手段７０１は、擬似雑音生成手段７０３に対して、雑音の特徴量を入力する。擬似雑音生成手段７０３は、雑音の特徴量に基づいて、擬似雑音を生成する。

擬似音声生成手段７０２は擬似音声を出力信号生成手段７０４に入力する。擬似雑音生成手段７０３は擬似雑音を出力信号生成手段７０４に入力する。また分析手段６０１は音声の音源の周期性と雑音の特徴量を出力信号生成手段７０４に入力する。出力信号生成手段７０４はエラー情報と入力信号を情報処理装置７００の外部から取得する。そして出力信号生成手段７０４は出力信号を生成する。

［情報処理装置１００〜７００における補間処理手順］
図８は図１〜図７に示す情報処理装置１００〜７００における補間処理のフローチャートである。この補間処理のフローチャートは情報処理装置１００〜７００実行する概要となる処理ステップを示している。

情報処理装置１００〜７００はデジタル信号による音声伝送で発生する信号損失を補間する装置である。特に本実施例に係る情報処理装置１００〜７００はパケット交換網における音声伝送で発生するパケットロスを補間する装置である。また情報処理装置１００〜７００は、フレーム単位で入力信号を受信する。

情報処理装置１００〜７００は、情報処理装置１００〜７００に入力される現フレームのエラー情報と入力信号を受信する（ステップＳ８０１）。入力信号はフレーム単位のデジタル信号であって、音声および背景雑音を示す信号であある。

情報処理装置１００〜７００は、エラー情報より現フレームにおけるエラーの有無を判別する（ステップＳ８０２）。エラー情報は、パケット損失した区間を示す情報である。エラーがある場合、入力信号はパケットロスしているので、「無い」状態である。

情報処理装置１００〜７００が現フレームにエラーがないと判別する場合（ステップＳ８０２ＮＯ）、情報処理装置１００〜７００は入力信号を分析する（ステップＳ８０３）。より詳細には情報処理装置１００〜７００が有する分析手段１０１〜７０１は入力信号を分析し、音声の特徴量、背景雑音の特徴量を算出する。情報処理装置１００〜７００は、擬似音声、擬似雑音を生成する（ステップ８０４、８０５）。そして情報処理装置１００〜７００は擬似音声と擬似雑音を組み合わせて出力信号を生成する（ステップＳ８０６）。

情報処理装置１００〜７００が現フレームにエラーがないと判別する場合（ステップＳ８０２ＮＯ）、情報処理装置１００〜７００は擬似音声を生成する（ステップＳ８０４）。そして情報処理装置１００〜７００は擬似雑音を生成する（ステップＳ８０５）。情報処理装置１００〜７００は擬似音声と擬似雑音を組み合わせて（重畳して）出力信号を生成する（ステップＳ８０６）。

情報処理装置１００〜７００はパケット消失の有無（エラーの有無）に関わらず擬似音声、擬似雑音を生成する。そしてパケット消失がなければ、情報処理装置１００〜７００は、入力信号を出力信号として出力する（図１９ステップＳ１９０５参照）。

［背景雑音の周波数特性］
図９は本実施例に係る分析手段１０１〜７０１における背景雑音の周波数特性の算出の処理手順を示すフローチャートである。

分析手段１０１〜７０１は、入力信号における音声検出を行う（ステップＳ９０１）。具体的には分析手段１０１〜７０１はフレームのパワーを雑音の平均パワーを比較して入力信号における音声検出を行う。
そして分析手段１０１〜７０１は、音声を検出した否かを判別する（ステップＳ９０２）。分析手段１０１〜７０１が音声を検出した場合（ステップＳ９０２ＹＥＳ）、分析手段１０１〜７０１は背景雑音のパワースペクトルの算出を行う（ステップＳ９０５）。背景雑音のパワースペクトルの算出は、また分析手段１０１〜７０１が音声を検出しない場合（ステップＳ９０２ＮＯ）、分析手段１０１〜７０１は入力信号を時間周波数変換する（ステップＳ９０３）。具体的には分析手段１０１〜７０１は高速フーリエ変換などを行う。時間周波数変換は、入力信号を周波数ごとに分解し、時間領域から周波数領域へ変換する変換である。同様にして後述する周波数時間変換は、入力信号を周波数領域から時間領域へ変換する変換である。分析手段１０１〜７０１は式（Ｆ１）より入力信号（現フレーム）のパワースペクトルを算出する（ステップＳ９０４）。ここでＰ_ｉはｉ番目の帯域のパワースペクトル（ｄＢ）、ｒｅ_ｉはｉ番目の帯域のスペクトルの実部（ｄＢ）、ｉｍ_ｉはｉ番目の帯域のスペクトルの虚部（ｄＢ）である。

そして分析手段１０１〜７０１は背景雑音のパワースペクトルを算出する（Ｓ９０５）。分析手段１０１は現フレームのパワースペクトルと前フレームの背景雑音のパワースペクトルを重み付けて平均することによって現フレームの背景雑音のパワースペクトルを算出する。なお分析手段１０１〜７０１が音声を検出した場合は（ステップ９０２ＮＯ）、現フレームの背景スペクトルは前フレームの背景雑音のパワースペクトルと等しいものとして算出する。ｎ_ｉはｉ番目の帯域の背景雑音のパワースペクトル（ｄＢ）、ｐｒｅｖ＿ｎ_ｉは前フレームのｉ番目の帯域の背景雑音のパワースペクトル（ｄＢ）、ｃｏｅｆは現フレームの重み係数である。

また分析手段１０１〜７０１は、学習同定法などの適応アルゴリズムを用いて背景雑音の周波数特性を決定してもよい。つまり分析手段１０１〜７０１が、フィルタを適用した白色雑音と、背景雑音との誤差を最小化するように学習したフィルタ係数として背景雑音の周波数特性を算出する。

［周期性の算出手順］
分析手段１０１〜７０１が算出する周期性は、入力信号、音声成分の信号または音声の音源の周期性である。本実施例において周期性は対象信号（入力信号、音声成分の信号、音声の音源）の周期と周期性の強さを意味する。本実施例において周期性の強さは最大の自己相関係数の値である。分析手段１０１〜７０１は対象信号の自己相関係数を式（Ｆ３）により算出する。そして分析手段１０１〜７０１は、自己相関係数が最大となる信号のずらし位置の長さを周期として算出する。ここで周期＝ａ＿ｍａｘ、周期性＝ＭＡＸ（ｃｏｒｒ（ａ））、ｘは周期性算出の対象の信号、Ｍは相関係数を算出する区間の長さ（サンプル）、ａは相関係数を算出する信号の開始位置、ｃｏｒｒ（ａ）はずらし位置がａの場合の相関係数、ａ＿ｍａｘは最大相関係数に対応するａの値（自己相関係数が最大となる位置）、ｉは信号のインデックス(サンプル)である。

［音声成分の算出手順］
図５に示す分析手段５０１は入力信号の音声成分を算出する。図１０は本実施例に係る分析手段５０１が実行する音声成分の算出手順のフローチャートである。以下、分析手段５０１が実行する入力信号の音声成分の算出手順について説明する。

分析手段５０１は、情報処理装置５００に入力される入力信号を受信し、音声検出、背景雑音のパワースペクトルを算出する（ステップＳ１００１）。音声検出、背景雑音のパワースペクトルの算出は図９に示す背景雑音の周波数特性の算出の処理手順に従う。

そして分析手段５０１は現フレームに音声を検出したか否かを判別する（ステップＳ１００２）。分析手段５０１は現フレームに音声を検出した場合（ステップＳ１００２ＹＥＳ）、分析手段５０１は入力信号の時間周波数変換を行う（ステップＳ１００３）。分析手段５０１は入力信号のパワースペクトルを算出する（ステップＳ１００４）。入力信号のパワースペクトルは式（Ｆ１）を用いて算出する。分析手段５０１は、音声のパワースペクトルを算出する（Ｓ１００５）。分析手段５０１は、ステップＳ１００４で算出した入力信号のパワースペクトルからステップＳ１００１で算出した背景雑音のパワースペクトルを減算して音声のパワースペクトルを算出する。分析手段５０１は、入力信号のパワースペクトルと背景雑音のパワースペクトルの比率からＳＮＲ（信号雑音比）を算出し、ＳＮＲに応じて入力信号中の音声成分の比率を決定して音声成分のパワースペクトルを算出する構成でもよい。

分析手段５０１は、音声のパワースペクトルの周波数時間変換を行う。本実施例では周波数時間変換は逆フーリエ変換である。これより分析手段５０１は、時間領域に変換した信号を音声成分として得る。

また分析手段５０１が現フレームに音声を検出しない場合（ステップＳ１００２ＮＯ）、分析手段５０１は入力信号の音声成分の算出処理を終了する。

［音声の包絡、音声の音源の算出手順］
図６及び図７に示す分析手段６０１、７０１は入力信号の音声の包絡、音声の音源を算出する。図１１は本実施例に係る分析手段６０１、７０１が実行する音声の包絡、音声の音源の算出手順のフローチャートである。

分析手段６０１、７０１は、情報処理装置６００、７００に入力される入力信号を受信する（ステップＳ１１０１）。分析手段６０１、７０１は、入力信号を時間周波数変換する（ステップＳ１１０２）。そして分析手段６０１、７０１は、入力信号の対数パワースペクトルを算出する（ステップＳ１１０３）。

分析手段６０１、７０１は入力信号の対数パワースペクトルを周波数時間変換する（ステップＳ１１０４）。分析手段６０１、７０１は入力信号の対数パワースペクトルを周波数時間変換した信号から高ケフレンシー成分と低ケフレンシー成分を抽出する（ステップＳ１１０５）。なおケフレンシーの次元は時間である。

そして分析手段６０１、７０１は、高ケフレンシー成分を時間周波数変換して音声の包絡を算出する（ステップＳ１１０６）。また分析手段６０１、７０１は、低ケフレンシー成分を時間周波数変換して音声の音源を算出する（ステップＳ１１０７）。

［音声の包絡パターンの算出手順］
図７に示す分析手段７０１は入力信号の音声の包絡パターンを算出する。図１２は本実施例に係る分析手段７０１が実行する音声の包絡パターンの算出手順のフローチャートである。

分析手段７０１は入力信号の包絡スペクトルを算出し、また音声検出を行う（ステップＳ１２０１）。

分析手段７０１はフォルマントとアンチフォルマントを算出する（ステップＳ１２０２）。フォルマントは包絡スペクトルの極大点であり、アンチフォルマントは包絡スペクトルの極小点である。

分析手段７０１は、現フレームが包絡パターンの記録を行う対象区間であるか否かを判別する（ステップＳ１２０３）。分析手段７０１は、現フレームにおけるフォルマントとアンチフォルマントの総数が閾値以下または音声が検出されない区間は記録対象区間でないと判別する。換言すれば分析手段７０１は、現フレームにおけるフォルマントとアンチフォルマントの総数が閾値よりも大きい区間を記録対象区間と判別する。

分析手段７０１が現フレームを記録対象区間と判別する場合（ステップＳ１２０３ＹＥＳ）、分析手段７０１はフォルマントとアンチフォルマントをメモリに保存する（ステップＳ１２０４）。ここで分析手段７０１は、フォルマントとアンチフォルマントを保存するメモリを有している。

また分析手段７０１が現フレームを記録対象区間でないと判別する場合（ステップＳ１２０３ＮＯ）、分析手段７０１はフォルマントとアンチフォルマントの記憶をメモリからクリアする（ステップＳ１２０５）。

［擬似音声の生成手順１］
図１３は本実施例に係る擬似音声生成手段１０２〜５０２が実行する擬似音声の生成手順のフローチャートである。また図１４は本実施例に係る繰り替えしの信号片の接続関係を示す模式図である。Ｍは相関係数を算出する区間の長さ（サンプル）であり、Ｌはオーバラップ長である。

擬似音声生成手段１０２〜５０２はそれぞれ、分析手段１０１〜５０１から繰り返しの対象信号を受信する（ステップＳ１３０１）。繰り返しの対象信号は、正常区間の入力信号または正常区間の音声成分の信号である。正常区間はエラーの発生していない区間、つまりパケットロスしていない区間である。

擬似音声生成手段１０２〜５０２は、式（Ｆ３）を用いて、繰り返しの対象信号の自己相関係数を算出する（ステップＳ１３０２）。擬似音声の周期性（擬似音声の周期と周期性の強さ）を算出するために、擬似音声生成手段１０２〜５０２は繰り返しの対象信号の自己相関係数を算出する。

そして擬似音声生成手段１０２〜５０２は、算出した自己相関係数の最大位置を算出する（ステップＳ１３０３）。自己相関係数の最大位置は、ａ＿ｍａｘのことであり、周期に対応するものである。

擬似音声生成手段１０２〜５０２は、繰り返しを行う信号片を算出する（ステップＳ１３０４）。ここで繰り返しを行う信号片は、自己相関係数開始位置よりａ＿ｍａｘ＋Ｌサンプル前から対象信号の最後とする。

擬似音声生成手段１０２〜５０２は、繰り返し信号片を接続して繰り返す（ステップＳ１３０５）。ここで擬似音声生成手段１０２〜５０２はＬサンプルをオーバラップして連続的に繰り返し信号片を接続する。繰り返し接続片をオーバラップして接続することにより、異音の発生を防ぐ擬似音声を生成することができる。擬似音声生成手段１０２〜５０２は、式（Ｆ４）を用いて、接続信号片のオーバラップ結果の信号ＯＬを算出する。ＳＬ（ｊ）は接続対象の信号であって、時系列で古い（左側）の信号である。Ｓｒ（ｊ）は接続対象の信号であって、時系列で新しい（右側）の信号である。ｊはサンプルを示す番号であり、Ｊ＝０、・・・Ｌ−１である。

擬似音声生成手段１０２〜５０２は、繰り返し信号片の繰り返しの結果（接続の結果）の信号長を算出して、信号長が所定の閾値を越えたか否かを判別する（ステップＳ１３０６）。

擬似音声生成手段１０２〜５０２が繰り返し結果の信号長が所定の閾値を越えたと判別する場合（ステップＳ１３０６ＹＥＳ）、擬似音声生成手段１０２〜５０２は擬似音声の生成処理を終了する。また擬似音声生成手段１０２〜５０２が繰り返し結果の信号長が所定の閾値を越えていないと判別する場合（ステップＳ１３０６ＮＯ）、さらに擬似音声生成手段１０２〜５０２は繰り返し信号片を接続する（ステップＳ１３０５）。

［擬似音声の生成手順２］
図１５は本実施例に係る擬似音声生成手段６０１が実行する擬似音声の生成手順のフローチャートである。

擬似音声生成手段６０１は、音声の包絡を受信する。また擬似音声生成手段６０１は音声の音源、音源の周期性を受信する（ステップＳ１５０１）。

擬似音声生成手段６０１は、音源を繰り返し、１フレーム分の音源を生成する（ステップＳ１５０２）。擬似音声生成手段６０１は、音源の繰り返しを図１３に示す処理フローによって行い、１フレーム分の音源を生成する。擬似音声生成手段６０１は、繰り返した音源に包絡を適用して、擬似音声を生成する（ステップＳ１５０３）。ここで擬似音声生成手段６０１は、繰り返した音源に包絡を適用する方法を以下の方法による。擬似音声生成手段６０１は繰り返した音源を時間周波数変換して振幅スペクトルＯ（ｋ）を算出する。そして擬似音声生成手段６０１は、算出した振幅スペクトルＯ（ｋ）に包絡の振幅スペクトルＥ（ｋ）をかけて、擬似音声の振幅スペクトルＳ（ｋ）を算出する（式（Ｆ５）参照））。Ｓ（ｋ）はｋ番目の帯域の擬似音声の振幅スペクトル、Ｏ（ｋ）はｋ番目の帯域の繰り返し音源の振幅スペクトル、Ｅ（ｋ）はｋ番目の帯域の包絡の振幅スペクトルである。擬似音声生成手段６０１は、Ｓ（ｋ）を周波数時間変換で時間領域に戻す。

［擬似音声の生成手順３］
図１６は本実施例に係る擬似音声生成手段７０１が実行する擬似音声の生成手順のフローチャートである。

擬似音声生成手段７０１は、分析手段７０１から音声の包絡、音声の包絡の変化パターンを受信する。また擬似音声生成手段７０１は音声の音源、音源の周期性を受信する（ステップＳ１６０１）。

擬似音声生成手段７０１は、音源の繰り返しを図１３に示す処理フローによって行い、１フレーム分の音源を生成する（ステップＳ１６０２）。

擬似音声生成手段７０１は、音声の包絡の変化パターンから包絡の変化情報を算出する（ステップＳ１６０３）。擬似音声生成手段７０１は、変化情報を以下の方法により算出する。擬似音声生成手段７０１は、時間ｔ、時間ｔ＋１の包絡情報から時間ｔと時間ｔ＋１間の包絡の変化情報を算出する。ここで包絡情報はフォルマント、アンチフォルマントの周波数（Ｈｚ）、大きさ（ｄＢ）である。時間ｔの第１フォルマントの周波数をＦ１ｘ、時間ｔの第１フォルマントの大きさをＦ１ｙとする。また時間ｔ＋１の第１フォルマントの周波数を（Ｆ１ｘ＋Δｘ）、時間ｔ＋１の第１フォルマントの大きさを（Ｆ１ｙ＋Δｙ）とする。これより第１フォルマントの変化情報（ｐｘ、ｐｙ）はｐｘ＝Δｘ／ｘ、ｐｙ＝Δｙ／ｙとなる。同様に他のフォルマント、アンチフォルマントの変化情報を算出する。そしてすべてのフォルマント、アンチフォルマントの変化情報をまとめて包絡の変化情報とする。

擬似音声生成手段７０１は、包絡の変化情報を用いて音声の包絡を更新する（ステップＳ１６０４）。擬似音声生成手段７０１は、音声の包絡のフォルマント、アンチフォルマントを算出する。擬似音声生成手段７０１は、それぞれのフォルマント、アンチフォルマントに対応する変化情報を適用して、フォルマント、アンチフォルマントを更新する。そして擬似音声生成手段７０１は、フォルマント、アンチフォルマントに対応する幅を算出する。フォルマントの幅は、フォルマントを挟んで最初にフォルマントより所定値だけパワースペクトルが小さくなった左右の周波数の差とする。ここで所定値はたとえば３ｄＢである。同様にアンチフォルマントの幅は、アンチフォルマントを挟んで最初にアンチフォルマントより所定値だけパワースペクトルが大きくなった左右の周波数の差である。具体的には第１フォルマントの周波数がＦ１＿ｃｕｒ＿ｘ、第１フォルマントの大きさがＦ１＿ｃｕｒ＿ｙであるとき、更新した第１フォルマントの周波数Ｆ１＿ｃｕｒ＿ｘ’、更新した第１フォルマントの大きさＦ１＿ｃｕｒ＿ｙ’はそれぞれＦ１＿ｃｕｒ＿ｘ’ ＝Ｆ１＿ｃｕｒ＿ｘ×ｐｘ、Ｆ１＿ｃｕｒ＿ｙ’ ＝Ｆ１＿ｃｕｒ＿ｙ×ｐｙと表すことができる。同様にして他のフォルマント、アンチフォルマントも更新することが可能である。擬似音声生成手段７０１は、二次曲線を当てはめて音声の包絡を算出する。擬似音声生成手段７０１がフォルマントに当てはめる二次曲線は、（ｆｘ、ｆｙ）を極大とし、（ｆｘ＋０．５ＷＦ、ｆｙ−３）を通る二次曲線とする。このときフォルマント位置が（ｆｘ、ｆｙ）であって、フォルマント幅がＷＦ（Ｈｚ）である。またｘ軸は周波数（Ｈｚ）、ｙ軸はパワー（ｄＢ）である。同様にして擬似音声生成手段７０１がアンチフォルマントに当てはめる二次曲線は、（ｕｘ、ｕｙ）を極小とし、（ｕｘ＋０．５ＷＦ、ｕｙ＋３）を通る二次曲線とする。このときアンチフォルマント位置が（ｕｘ、ｕｙ）であって、アンチフォルマント幅がＵＦ（Ｈｚ）である。また擬似音声生成手段７０１は、フォルマントに対応する二次曲線とアンチフォルマントに対応する二次曲線を補間してフォルマントとアンチフォルマントの境界の包絡を算出する。

擬似音声生成手段７０１は、繰り返した音源に更新した包絡を適用して擬似音声を生成する（ステップＳ１６０５）。擬似音声生成手段７０１は、擬似音声生成手段６０１と同様の方法を用いて擬似音声を生成する。つまり擬似音声生成手段７０１は繰り返した音源を時間周波数変換して振幅スペクトルＯ（ｋ）を算出する。擬似音声生成手段７０１は、算出した振幅スペクトルＯ（ｋ）に包絡の振幅スペクトルＥ（ｋ）をかけて、擬似音声の振幅スペクトルＳ（ｋ）を算出する（式（Ｆ５）参照））。そして擬似音声生成手段７０１は、Ｓ（ｋ）を周波数時間変換で時間領域に戻して擬似音声を生成する。

［擬似雑音の生成手順１］
図１７は本実施例に係る擬似雑音生成手段２０３が実行する擬似雑音の生成手順を示すフローチャートである。

擬似雑音生成手段２０３は白色雑音を生成する（ステップＳ１７０１）。

擬似雑音生成手段２０３は、式（Ｆ６）を用いて、白色雑音に背景雑音の周波数特性を表すフィルタ係数を適用して擬似雑音を生成する（ステップＳ１７０２）。ｙ（ｎ）が擬似雑音、ｗ（ｎ）は白色雑音、ｈ（ｍ）はフィルタ係数、ｎはサンプル数、ｍは０〜ｐ−１のフィルタ次数である。

［擬似雑音の生成手順２］
図１８は本実施例に係る背景雑音生成手段３０３が実行する背景雑音の生成手順のフローチャートである。

擬似雑音生成手段３０３は、分析手段３０１から背景雑音のパワースペクトルを受信する（ステップＳ１８０１）。

擬似雑音生成手段３０３は、背景雑音のスペクトルの位相をランダム化する（ステップＳ１８０２）。具体的には擬似雑音生成手段３０３は、背景雑音の振幅スペクトルの大きさを保ったまま、背景雑音の位相をランダム化する。振幅スペクトルがｓ（ｉ）、各帯域のスペクトルの実部、虚部がそれぞれｒｅ（ｉ）、ｉｍ（ｉ）とする。擬似雑音生成手段３０３は、ｒｅ（ｉ）、ｉｍ（ｉ）をランダムな数字ｒｅ’（ｉ）、ｉｍ’（ｉ）で置き換え、振幅スペクトルの大きさを保存するように係数を掛けて、位相をランダム化した背景雑音のスペクトル（αｒｅ’（ｉ）、αｉｍ’（ｉ））を算出する。これより擬似振幅スペクトルは式（Ｆ７）を用いて算出することができる。

そして擬似雑音生成手段３０３は、位相をランダム化した背景雑音のスペクトル（αｒｅ’（ｉ）、 αｉｍ’（ｉ））を周波数時間変換で時間領域に戻して擬似雑音を生成する（ステップＳ１８０３）。

［出力信号の生成手順］
図１９は本実施例に係る出力信号生成手段１０４〜７０４が実行する出力信号の生成手順のフローチャートである。

出力信号生成手段１０４〜７０４は、エラー情報と入力信号と擬似音声と擬似雑音と音声の特徴量と雑音の特徴量を受信する（ステップＳ１９０１）。

出力信号生成手段１０４〜７０４は、ステップＳ１９０１で受信した情報よりエラーの有無を判別する（ステップＳ１９０２）。

出力信号生成手段１０４〜７０４が現フレームにエラーがあると判別する場合（ステップＳ１９０２ＹＥＳ）、出力信号生成手段１０４〜７０４は擬似音声と擬似雑音の振幅係数を算出する（ステップＳ１９０３）。出力信号生成手段１０４〜７０４は擬似音声と擬似雑音を重畳して出力信号を生成する（ステップＳ１９０４）。

出力信号生成手段１０４〜７０４が現フレームにエラーがないと判別する場合（ステップＳ１９０２ＮＯ）、出力信号生成手段１０４〜７０４は入力信号を出力信号とする（ステップＳ１９０５）。

［振幅係数の算出手順１］
図２０は本実施例に係る出力信号生成手段１０４〜７０４の振幅係数の第１の算出手順を示すフローチャートである。

出力信号生成手段１０４〜７０４は、現フレームがエラー開始フレームであるか否かを判別する（ステップＳ２００１）。エラー開始フレームは、フレームが消失した区間においてフレーム消失（パケット消失）が最初に発生したフレームである。出力信号生成手段１０４〜７０４が、現フレームはエラー開始フレームであると判別する場合（ステップＳ２００１ＹＥＳ）、出力信号生成手段１０４〜７０４は入力信号の音声検出処理を行う（ステップＳ２００２）。音声検出処理は入力信号のパワーが閾値を越えたか否かにより音声を判別する処理である。また出力信号生成手段１０４〜７０４が、現フレームはエラー開始フレームでないと判別する場合（ステップＳ２００１ＮＯ）、出力信号生成手段１０４〜７０４は現フレームにおける音声の有無を判別する（ステップＳ２００３）。

ステップＳ２００３で、出力信号生成手段１０４〜７０４は音声を検出したか否かを判別する（ステップＳ２００３）。出力信号生成手段１０４〜７０４が音声を検出した場合（ステップＳ２００３ＹＥＳ）、出力信号生成手段１０４〜７０４は擬似音声の振幅係数を１−ｉ／Ｒ、擬似雑音の振幅係数をｉ／Ｒとして算出する（ステップＳ２００４）。ここでＲは擬似音声の振幅を０にするまでのサンプル数、ｉはエラー開始以降のサンプル数である。Ｒは予め定めた既定値である。出力信号生成手段１０４〜７０４が音声を検出しない場合（ステップＳ２００３ＮＯ）、出力信号生成手段１０４〜７０４は擬似音声の振幅係数を０、擬似雑音の振幅係数を１として算出する（ステップＳ２００５）。

出力信号生成手段１０４〜７０４は振幅係数を掛けた擬似音声と振幅係数を掛けた擬似雑音を足し合わせて出力信号を生成する（ステップＳ２００６）。ここで出力信号生成手段１０４〜７０４は、振幅係数を掛けた擬似音声と振幅係数を掛けた擬似雑音を足し合わせた出力信号のフレーム平均振幅がエラー直前の入力信号のフレーム平均振幅と等しくなるように調節する。

［振幅係数の算出手順２］
図２１は本実施例に係る出力信号生成手段１０４〜７０４の振幅係数の第２の算出手順を示すフローチャートである。

出力信号生成手段１０４〜７０４は、現フレームがエラー開始フレームであるか否かを判別する（ステップＳ２１０１）。出力信号生成手段１０４〜７０４が、現フレームはエラー開始フレームであると判別する場合（ステップＳ２１０１ＹＥＳ）、出力信号生成手段１０４〜７０４は入力信号の音声検出処理を行う（ステップＳ２１０２）。本実施例における音声検出処理も入力信号のパワーが閾値を越えたか否かにより音声を判別する処理である。また出力信号生成手段１０４〜７０４が、現フレームはエラー開始フレームでないと判別する場合（ステップＳ２１０１ＮＯ）、出力信号生成手段１０４〜７０４は現フレームにおける音声の有無を判別する。

出力信号生成手段１０４〜７０４は音声を検出したか否かを判別する（ステップＳ２１０３）。出力信号生成手段１０４〜７０４が音声を検出した場合（ステップＳ２１０３ＹＥＳ）、出力信号生成手段１０４〜７０４は擬似音声の劣化判定処理を行う（ステップＳ２１０４）。

出力信号生成手段１０４〜７０４が擬似音声の劣化を判別する（ステップＳ２１０５）。出力信号生成手段１０４〜７０４が、擬似音声は劣化していないと判別する場合（ステップＳ２１０５ＮＯ）、出力信号生成手段１０４〜７０４は擬似音声の振幅係数を０．５、擬似雑音の振幅係数を０．５として算出する（ステップＳ２１０６）。出力信号生成手段１０４〜７０４が、擬似音声は劣化していると判別する場合（ステップＳ２１０５ＹＥＳ）、出力信号生成手段１０４〜７０４は擬似音声の振幅係数を１−ｉ／Ｑ、擬似雑音の振幅係数をｉ／Ｑとして算出する（ステップＳ２１０７）。ここでＱは擬似音声が劣化と判定されてから擬似音声の振幅を０にするまでのサンプル数、ｉは擬似音声が劣化と判定されてからのサンプル数である。また擬似音声の振幅係数は、入力信号の周期性または音声成分の周期性または音源の周期性によって次のように重み付けても良い。たとえば擬似音声の振幅係数＝（１−ｉ／Ｑ）×ＭＡＸ（ｃｏｒｒ（ａ））と重み付けする。

ステップＳ２１０３において、出力信号生成手段１０４〜７０４が音声を検出しない場合（ステップＳ２１０３ＮＯ）、出力信号生成手段１０４〜７０４は擬似音声の振幅係数を０、擬似雑音の振幅係数を１として算出する（ステップＳ２１０８）。

出力信号生成手段１０４〜７０４は、振幅係数を掛けた擬似音声と振幅係数を掛けた擬似雑音を足し合わせて出力信号を生成する（ステップＳ２１０９）。ここで出力信号生成手段１０４〜７０４は、振幅係数を掛けた擬似音声と振幅係数を掛けた擬似雑音を足し合わせて出力信号のフレーム平均振幅がエラー直前の入力信号のフレーム平均振幅と等しくなるように調節する。

［擬似音声の劣化判定手順］
図２２は本実施例に係る出力信号生成手段１０４〜７０４が実行する擬似音声の劣化判定の処理を示すフローチャートである。

出力信号生成手段１０４〜７０４は、入力信号の繰り返し周期成分の大きさＰ１（ｄＢ）を算出する（ステップＳ２２０１）。出力信号生成手段１０４〜７０４は、入力信号を時間周波数変換して入力信号のパワースペクトルを求める。そして出力信号生成手段１０４〜７０４は、入力信号のパワースペクトルより入力信号の繰り返し周期成分の大きさ（パワー）Ｐ１を算出する。

出力信号生成手段１０４〜７０４は、擬似音声の繰り返し周期成分の大きさＰ２（ｄＢ）を算出する（ステップＳ２２０２）。出力信号生成手段１０４〜７０４は、擬似音声を時間周波数変換して擬似音声のパワースペクトルを求める。そして出力信号生成手段１０４〜７０４は、擬似音声のパワースペクトルより擬似雑音の繰り返し周期成分の大きさ（パワー）Ｐ１を算出する。

出力信号生成手段１０４〜７０４は、擬似雑音の繰り返し周期成分の大きさＰ２から入力信号の繰り返し周期成分の大きさＰ１を減算し、Ｐ２−Ｐ１を算出する。そして出力信号生成手段１０４〜７０４は、Ｐ２−Ｐ１が予め定めた所定の閾値を越えたか否か判別する（ステップＳ２２０３）。出力信号生成手段１０４〜７０４が、Ｐ２−Ｐ１が予め定めた所定の閾値を越えていないと判別する場合（ステップＳ２２０３ＮＯ）、出力信号生成手段１０４〜７０４は擬似音声に劣化がないと判定する（ステップＳ２２０４）。また出力信号生成手段１０４〜７０４が、Ｐ２−Ｐ１が予め定めた所定の閾値を越えていると判別する場合（ステップＳ２２０３ＹＥＳ）、出力信号生成手段１０４〜７０４は擬似音声に劣化があると判定する（ステップＳ２２０５）。

［情報処理装置１００〜７００の作用］
本発明に係る情報処理装置１００〜７００は、入力信号に含まれる音声の特徴量と雑音の特徴量から擬似音声と擬似雑音をそれぞれ独立に生成することにより、パケットロス直前の信号が子音や背景雑音などの周期性が小さいものであっても、不自然な周期発生の異音などによる音質劣化を低減してパケットロスを補間することができる。

以上より本実施例に係る情報処理装置１００〜７００は、入力信号を分析して入力信号に含まれる音声の特徴量と入力信号に含まれる背景雑音の特徴量を算出する。情報処理装置１００〜７００は音声の特徴量、背景雑音の特徴量を用いて擬似音声と擬似雑音をそれぞれ独立に生成する。そして情報処理装置１００〜７００は入力信号の性質に応じて擬似音声と擬似雑音とを配分して出力信号を生成するため、劣化の少ない高音質の補間を実現することができる。

また本実施例に係る情報処理装置２００は、背景雑音の周波数特性を用いて擬似雑音を生成するので、入力信号に重畳している背景雑音との音質やパワーの不連続なしに擬似雑音を生成できる。

また情報処理装置４００は、入力信号の周期性を算出するため、入力信号の周期性によって擬似音声の配分を決めることができる。これより特に入力信号の周期性が小さい場合に、情報処理装置４００は対象信号を繰り返すことによる異音を抑制できる。

また本実施例に係る情報処理装置５００は、入力信号の音声成分の周期性を算出するため、入力信号の音声成分の周期性によって擬似音声の配分を決めることができる。これより特に入力信号の音声成分の周期性が小さい場合に、情報処理装置５００は対象信号（入力信号の音声成分）を繰り返すことによる異音を抑制できる。また情報処理装置５００は入力信号の音声成分のみを繰り返すために、重畳した雑音を周期的に繰り返すことに起因する異音を抑制できる。

また情報処理装置６００、７００は音声の音源の周期性を算出するため、音声の音源の周期性によって擬似音声の配分を決めることができる。これより音声の音源の周期性が小さい場合に、情報処理装置６００、７００は対象信号を繰り返すことによる異音を抑制することができる。

また情報処理装置７００は、音声の包絡の変化パターンを算出するため、音声の包絡の変化パターンを用いて擬似音声を生成できる。これにより情報処理装置７００は、より自然な擬似音声を生成でき、高品質の補間を実現することができる。

次に、以上述べた補間方法の実施形態から抽出される技術的思想を請求項の記載形式に準じて付記として列挙する。本発明に係る技術的思想は上位概念から下位概念まで、様々なレベルやバリエーションにより把握できるものであり、以下の付記に本発明が限定されるものではない。
（付記１）伝送で損失した音声のデジタル信号を補間する補間方法において、
該デジタル信号の特徴量を算出する分析手順と、
該特徴量に応じて、擬似音声を生成する擬似音声生成手順と、
該特徴量に応じて、擬似雑音を生成する擬似雑音生成手順と、
該擬似音声と該擬似雑音を組み合わせて補間信号を生成する出力信号生成手順と、
からなることを特徴とする補間方法。
（付記２）付記１に記載の補間方法において、
該分析手順は、該背景雑音の周波数特性を算出することを特徴とする補間方法。
（付記３）付記１に記載の補間方法において、
該擬似雑音生成手順は、該背景雑音の周波数特性を持つ信号を生成することを特徴とすることを特徴とする補間方法。
（付記４）付記２に記載の補間方法において、
該擬似雑音生成手段は、白色雑音に該分析手順で算出した背景雑音の周波数特性を適用して擬似雑音を生成することを特徴とする補間方法。
（付記５）付記１に記載の補間方法において、
該分析手順は、該背景雑音のパワースペクトルを算出することを特徴とする補間方法。
（付記６）付記５に記載の補間方法において、
該擬似雑音生成手順は、該分析手順において算出した背景雑音のパワースペクトルにランダムな位相を適用して擬似雑音を生成することを特徴とする補間方法。
（付記７）付記１に記載の補間方法において、
該分析手順は、該デジタル信号の周期性を算出することを特徴とする補間方法。
（付記８）付記１に記載の補間方法において、
該擬似音声生成手順は、該デジタル信号を該デジタル信号の周期の整数倍の長さで繰り返して擬似音声を生成することを特徴とする補間方法。
（付記９）付記１に記載の補間方法において、
該分析手順は、該デジタル信号の音声の包絡と該音声の音源と該音声の周期を算出することを特徴とする補間方法。
（付記１０）付記９に記載の補間方法において、
該擬似音声生成手段は、該音声の包絡と、該音声の音源から擬似音声を生成することを特徴とする補間方法。
（付記１１）付記１に記載の補間方法において、
該分析手順は、該デジタル信号の音声の包絡の変化パターンと該音声の音源と該音源の周期性を算出することを特徴とする補間方法。
（付記１２）付記１１に記載の補間方法において、
該擬似音声生成手順は、該音声の包絡の変化パターンと該音声の音源と該音源の周期性を用いて擬似音声を生成することを特徴とする補間方法。
（付記１３）伝送で損失した音声のデジタル信号を補間する情報処理装置において、
該デジタル信号を受信し、該デジタル信号の特徴量を算出する分析手段と、
該デジタル信号に含まれる音声を模倣した擬似音声を生成する擬似音声生成手段と、
該デジタル信号に含まれる背景雑音を模倣した擬似雑音を生成する擬似雑音生成手段と、
該擬似音声と該擬似雑音を重畳して補間信号を生成する出力信号生成手段と、
からなることを特徴とする情報処理装置。
（付記１４）付記１に記載の補間方法は、
該分析手順において信号損失発生前のデジタル信号の特徴量を算出することを特徴とする補間方法。

本実施例に係る情報処理装置１００の構成図である。本実施例に係る情報処理装置２００の構成図である。本実施例に係る情報処理装置３００の構成図である。本実施例に係る情報処理装置４００の構成図である。本実施例に係る情報処理装置５００の構成図である。本実施例に係る情報処理装置６００の構成図である。本実施例に係る情報処理装置７００の構成図である。本実施例に係る情報処理装置１００〜７００における補間処理のフローチャートである。本実施例に係る分析手段１０１〜７０１における背景雑音の周波数特性の算出の処理手順を示すフローチャートである。本実施例に係る分析手段５０１が実行する音声成分の算出手順のフローチャートである。本実施例に係る分析手段６０１、７０１が実行する音声の包絡、音声の音源の算出手順のフローチャートである。本実施例に係る分析手段７０１が実行する音声の包絡パターンの算出手順のフローチャートである。本実施例に係る擬似音声生成手段１０２〜５０２が実行する擬似音声の生成手順のフローチャートである。本実施例に係る繰り替えしの信号片の接続関係を示す模式図である。本実施例に係る擬似音声生成手段６０１が実行する擬似音声の生成手順のフローチャートである。本実施例に係る擬似音声生成手段７０１が実行する擬似音声の生成手順のフローチャートである。本実施例に係る擬似雑音生成手段２０３が実行する擬似雑音の生成手順を示すフローチャートである。本実施例に係る背景雑音生成手段３０３が実行する背景雑音の生成手順のフローチャートである。本実施例に係る出力信号生成手段１０４〜７０４が実行する出力信号の生成手順のフローチャートである。本実施例に係る出力信号生成手段１０４〜７０４の振幅係数の第１の算出手順を示すフローチャートである。本実施例に係る出力信号生成手段１０４〜７０４の振幅係数の第２の算出手順を示すフローチャートである。本実施例に係る出力信号生成手段１０４〜７０４が実行する擬似音声の劣化判定の処理を示すフローチャートである。

符号の説明

１００…情報処理装置
１０１…分析手段
１０２…擬似音声生成手段
１０３…擬似雑音生成手段
１０４…出力信号生成手段
２００…情報処理装置
２０１…分析手段
２０２…擬似音声生成手段
２０３…擬似雑音生成手段
２０４…出力信号生成手段
３００…情報処理装置
３０１…分析手段
３０２…擬似音声生成手段
３０３…擬似雑音生成手段
３０４…出力信号生成手段
４００…情報処理装置
４０１…分析手段
４０２…擬似音声生成手段
４０３…擬似雑音生成手段
４０４…出力信号生成手段
５００…情報処理装置
５０１…分析手段
５０２…擬似音声生成手段
５０３…擬似雑音生成手段
５０４…出力信号生成手段
６００…情報処理装置
６０１…分析手段
６０２…擬似音声生成手段
６０３…擬似雑音生成手段
６０４…出力信号生成手段
７００…情報処理装置
７０１…分析手段
７０２…擬似音声生成手段
７０３…擬似雑音生成手段
７０４…出力信号生成手段

Claims

伝送で損失した音声のデジタル信号を補間する補間方法において、
該デジタル信号の特徴量を算出する分析手順と、
該特徴量に応じて、擬似音声を生成する擬似音声生成手順と、
該特徴量に応じて、擬似雑音を生成する擬似雑音生成手順と、
該擬似音声と該擬似雑音を組み合わせて補間信号を生成する出力信号生成手順と、
からなることを特徴とする補間方法。
請求項１に記載の補間方法において、
該分析手順は、該背景雑音の周波数特性を算出することを特徴とする補間方法。
請求項１に記載の補間方法において、
該擬似雑音生成手順は、該背景雑音の周波数特性を持つ信号を生成することを特徴とすることを特徴とする補間方法。
請求項２に記載の補間方法において、
該擬似雑音生成手段は、白色雑音に該分析手順で算出した背景雑音の周波数特性を適用して擬似雑音を生成することを特徴とする補間方法。
請求項１に記載の補間方法において、
該分析手順は、該背景雑音のパワースペクトルを算出することを特徴とする補間方法。
請求項５に記載の補間方法において、
該擬似雑音生成手順は、該分析手順において算出した背景雑音のパワースペクトルにランダムな位相を適用して擬似雑音を生成することを特徴とする補間方法。
請求項１に記載の補間方法において、
該分析手順は、該デジタル信号の周期性を算出することを特徴とする補間方法。
請求項１に記載の補間方法において、
該擬似音声生成手順は、該デジタル信号を該デジタル信号の周期の整数倍の長さで繰り返して擬似音声を生成することを特徴とする補間方法。
請求項１に記載の補間方法において、
該分析手順は、該デジタル信号の音声の包絡と該音声の音源と該音声の周期を算出することを特徴とする補間方法。
伝送で損失した音声のデジタル信号を補間する情報処理装置において、
該デジタル信号の特徴量を算出する分析手段と、
該特徴量に応じて、擬似音声を生成する擬似音声生成手段と、
該特徴量に応じて、擬似雑音を生成する擬似雑音生成手段と、
該擬似音声と該擬似雑音を組み合わせて補間信号を生成する出力信号生成手段と、
からなることを特徴とする情報処理装置。