JP2003255973A - 音声帯域拡張システムおよび方法 - Google Patents

音声帯域拡張システムおよび方法

Info

Publication number
JP2003255973A
JP2003255973A JP2002053062A JP2002053062A JP2003255973A JP 2003255973 A JP2003255973 A JP 2003255973A JP 2002053062 A JP2002053062 A JP 2002053062A JP 2002053062 A JP2002053062 A JP 2002053062A JP 2003255973 A JP2003255973 A JP 2003255973A
Authority
JP
Japan
Prior art keywords
signal
peak component
frequency
pseudo
voice band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002053062A
Other languages
English (en)
Inventor
Yuichiro Takamizawa
雄一郎 高見沢
Toshiyuki Nomura
俊之 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2002053062A priority Critical patent/JP2003255973A/ja
Publication of JP2003255973A publication Critical patent/JP2003255973A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 【課題】 僅かな付加情報により音声の高周波数帯域信
号を高音質に擬似生成できる音声帯域拡張システムを提
供する。 【解決手段】 本発明の音声帯域拡張システムは、補助
信号入力部(102)を持ち、低域信号だけでなく補助
信号をも用いて高域信号を擬似生成する高域生成部10
3を有するために、低域信号からだけでは生成が困難で
あった高音質な高域信号の擬似生成ができる。また高域
生成部103において線形予測フィルタやその残差信号
といった人間の音声生成モデルに基づいた方法を使用し
ないため、楽器音などでも高音質に高域信号の擬似生成
ができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声帯域拡張技術に
係り、特に、僅かな付加情報により音声の高周波数帯域
信号を高音質に擬似生成できる音声帯域拡張システムお
よび方法に関する。
【0002】
【従来の技術】狭帯域音声信号である低域信号から広帯
域音声信号である高域信号を生成する音声帯域拡張技術
が種々提案されている(たとえば、特開平08−130
494号公報、特開平08−305396号公報、特開
平09−258787号公報を参照)。
【0003】従来の音声帯域拡張システムの典型例は、
帯域が拡張される前の低域信号から高域信号を生成する
高域生成手段と、低域信号と高域信号とを合成して帯域
が拡張された音声信号を生成する帯域加算手段と、を有
する。
【0004】低域信号から高域信号を擬似生成する方法
については様々な方法がある。従来技術では、一般に、
人間の音声生成モデルに基づき、まず低域信号を線形予
測分析してフィルタ係数と残差信号に分離する。そし
て、残差信号に非線形処理などを施して広帯域予測残差
信号を生成する。この広帯域予測残差信号に線形予測分
析で求めたフィルタ係数での逆フィルタ処理により高域
信号を擬似生成する。
【0005】このように、従来の手法では、(1)低域
信号のみを用いて高域信号を擬似生成すること、およ
び、(2)線形予測分析など音声生成モデルに基づいて
高域信号を擬似生成すること、が特徴として挙げられ
る。
【0006】
【発明が解決しようとする課題】しかしながら、従来の
帯域拡張方式には次のような問題があった。第1の問題
点は、低域信号のみを用いて高域信号を擬似生成するた
めに、高域信号の音質が悪いということである。高域信
号は必ずしも低域信号から予測可能ではないからであ
る。
【0007】第2の問題点は、線形予測分析やその残差
信号など音声生成モデルに基づいて高域信号を擬似生成
するために、楽器音などの高域擬似生成が不得手である
ということである。楽器音などでは人間の音声とは生成
モデルが異なるからである。
【0008】本発明の目的は、高音質な帯域拡張音声を
生成できる音声帯域拡張システムおよび方法を提供する
ことにある。
【0009】本発明の他の目的は、人間の音声以外の楽
器音などについても、高音質な帯域拡張音声を生成でき
る音声帯域拡張システムおよび方法を提供することにあ
る。
【0010】
【課題を解決するための手段】本発明の音声帯域拡張シ
ステムは、低域信号および補助信号を用いて高域信号を
擬似生成するように動作する。
【0011】本発明の第1の観点によれば、低域信号か
ら高域信号を擬似生成し、前記低域信号と前記擬似生成
された高域信号とを合成することによって広帯域な帯域
拡張音声信号を生成する音声帯域拡張システムにおい
て、前記高域信号を擬似生成する際に、前記低域信号だ
けではなく前記音声帯域拡張システムに入力される補助
信号をも用いて前記高域信号を擬似生成する高域生成手
段を有することを特徴とする。
【0012】本発明の第2の観点によれば、低域信号か
ら高域信号を擬似生成し、前記低域信号と前記擬似生成
された高域信号とを合成することによって広帯域な帯域
拡張音声信号を生成する音声帯域拡張システムにおい
て、前記高域信号を擬似生成する際に、前記低域信号お
よび補助信号を用いて前記高域信号を擬似生成する高域
生成手段を有し、当該高域生成手段が前記高域信号をピ
ーク成分と非ピーク成分に分類し、前記ピーク成分と前
記非ピーク成分とを異なる方法で擬似生成することを特
徴とする。
【0013】本発明の第3の観点によれば、音声帯域拡
張システムが使用する補助信号を生成する補助信号生成
システムにおいて、低域信号から高域予測信号を疑似生
成する高域信号予測手段と、前記高域予測信号をピーク
成分と非ピーク成分に分類するピーク成分分類手段と、
前記ピーク成分を符号化してピーク成分信号を生成する
ピーク成分信号生成手段と、前記非ピーク成分を符号化
して非ピーク成分信号を生成する非ピーク成分信号生成
手段と、ピーク成分信号と非ピーク成分信号とを多重化
して前記補助信号を生成する補助信号生成手段と、を含
むことを特徴とする。
【0014】また、本発明による補助信号生成システム
において、高域信号をピーク成分と非ピーク成分に分類
するピーク成分分類手段と、前記ピーク成分を符号化し
てピーク成分信号を生成するピーク成分信号生成手段
と、前記非ピーク成分を符号化して非ピーク成分信号を
生成する非ピーク成分信号生成手段と、ピーク成分信号
と非ピーク成分信号を多重化して補助信号を生成する補
助信号生成手段と、を含むことを特徴とする。
【0015】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。
【0016】1.システム構成 図1を参照すると、本発明の一実施形態による音声帯域
拡張システムは、低域信号入力部101、補助信号入力
部102、高域生成部103、帯域加算部104、およ
び、帯域拡張音声信号出力部105を有する。
【0017】低域信号入力部101には帯域を拡張する
音声、すなわち低域信号が入力される。入力された低域
信号は高域生成部103と帯域加算部104へ出力され
る。ここで、低域信号は通常の時間領域の信号(例えば
PCM信号)であっても、周波数領域信号(例えば、時
間領域の信号にMDCT、フーリエ変換、あるいはサブ
バンド分割フィルタを施して得られた信号)であっても
良い。
【0018】補助信号入力部102には低域信号を分析
して高域信号を擬似生成する際に用いられる補助信号が
入力される。入力された補助信号は高域生成部103へ
出力される。補助信号に含まれる情報の内容については
後で詳細に説明する。
【0019】高域生成部103は、低域信号および補助
信号を用いて高域信号を擬似的に生成する。低域信号と
して時間領域の信号が入力された場合は、MDCT、フ
ーリエ変換あるいはサブバンド分割フィルタなどの変換
部を用いて周波数領域信号へ変換した後に、この周波数
領域信号と補助信号とを用いて高域信号を生成する。生
成された高域信号は帯域加算部104へ出力される。低
域信号と補助信号とを用いて高域信号を擬似的に生成す
る手法については後で詳細に説明する。
【0020】帯域加算部104は、入力された低域信号
と生成された高域信号とを合成して帯域拡張された音声
信号を生成する。生成された帯域拡張音声信号は帯域音
声信号出力部105から出力される。低域信号と高域信
号とを合成する方法については後で詳細に説明する。
【0021】上述した本実施形態の全体的な動作は、図
2に示すように、低域信号と補助信号とから高域信号を
生成するステップ(ステップ201)と、低域信号と高
域信号とを合成して帯域拡張音声信号を生成するステッ
プ(ステップ202)とからなる。
【0022】2.高域信号の疑似生成 次に、高域生成部103の高域信号疑似生成動作につい
て詳細に説明する。高域生成部103は補助信号と周波
数領域の低域信号とを用いて高域信号を擬似的に生成す
る。
【0023】高域生成部103では、高域の周波数帯域
を複数の副周波数帯域へ分割し、副周波数帯域毎に高域
信号の擬似生成処理を行う。ここでは、周波数成分F
1、F2、・・・、F31、F32(ヘルツ)という3
2個の周波数を含む1つの副周波数帯域を例として、副
周波数帯域毎に行う高域信号の擬似生成処理について説
明する。なお、これら周波数成分F1〜F32にそれぞ
れ対応する信号成分をM1、M2、・・・、M31、M
32と記す。実際の用途では、低域信号、および、高域
信号がそれぞれ4から12kHz程度の帯域を持ち、副
周波数帯域は高域信号を16から32帯域程度に分割し
て得られることが多いと考えられる。
【0024】副周波数帯域毎の処理としては、まず、副
周波数帯域に含まれる周波数成分の信号(本例ではF
1、F2、・・・、F31、F32の周波数を持つM
1、M2、・・・、M31、M32)を、ピーク成分と
非ピーク成分の2グループに分類する。副周波数帯域に
含まれる複数の信号は、各グループで異なる方法で擬似
生成される。
【0025】2.1)ピーク/非ピーク分類 副周波数帯域に含まれる複数の信号(本例では32個の
信号)をピーク成分と非ピーク成分に分類する方法につ
いて述べる。
【0026】1つめの分類方法は、どの信号がピーク成
分に分類されるかを補助信号に符号化しておき、音声帯
域拡張システムではその補助信号に従いピーク成分と非
ピーク成分とを分類するという方法である(以下、ピー
ク分類方法1と呼ぶ)。
【0027】2つめの分類方法は、まず副周波数帯域に
含まれる複数の信号(本例ではM1、M2、・・・、M
31、M32)の全てをピーク成分と仮定する。そし
て、後述するピーク成分の擬似生成方法(後述のピーク
成分振幅擬似生成方法1、あるいは、ピーク成分振幅擬
似生成方法2)によって信号の振幅値を擬似生成し、そ
の結果に基づいて再度ピーク成分と非ピーク成分とに分
類するという方法である(以下、ピーク分類方法2と呼
ぶ)。例えば、擬似生成された複数の信号の中で、その
振幅が大きい順に予め定められた個数の信号をピーク成
分とする方法などがある。この場合、大きい順に何個を
ピーク成分とするかを表すピーク成分数については、固
定値としておくか、変動する場合はピーク成分数に関す
る情報を補助信号に含めておく。
【0028】これら2つの分類方法については、全ての
副周波数帯域で同一の分類方法を用いても、両者を混在
させてもよい。
【0029】2.2)ピーク成分の振幅擬似生成 次に、ピーク成分として分類された信号の振幅値を擬似
生成する方法について述べる。
【0030】1つめの擬似生成方法は、ピーク成分各々
の振幅値情報を補助信号に符号化しておき、音声帯域拡
張システムでは、その情報を用いてピーク成分の振幅値
を生成する方法である。本手法では、ピーク成分の振幅
を忠実に再現できるという利点がある反面、ピーク成分
各々の振幅値情報を補助信号に含めるために補助信号の
符号量が大きくなる。以下、この方法をピーク成分振幅
値擬似生成方法1と呼ぶこととする。
【0031】2つめの擬似生成方法は、低域信号からの
予測によってピーク成分各々の振幅値を得る方法であ
る。この方法をピーク成分振幅値擬似生成方法2と呼ぶ
こととする。以下、予測方法について、周波数Fを持つ
信号Mの値を予測する方法を例に説明する。なお、これ
ら2つの擬似生成方法1および2については、全ての副
周波数帯域で同一の疑似生成方法を用いても、両者を混
在させてもよい。
【0032】2.2.1)ピーク成分の振幅予測 1つめの予測方法は、2以上の整数Nについて、周波数
(F÷N)を持つ低域信号の信号値を用いて信号Mの値を
予測する方法である。たとえば、周波数(F÷2)を持
つ低域信号の値(もしくはその絶対値)を信号Mの値と
する方法や、周波数(F÷2)を持つ低域信号の値(も
しくはその絶対値)と周波数(F÷3)を持つ低域信号
の値(もしくはその絶対値)を加算した値を信号Mの値
とする方法や、周波数(F÷3)を持つ低域信号の値
(もしくはその絶対値)と周波数(F÷2)を持つ低域
信号の値(もしくはその絶対値)から線形予測した値を
信号Mの値とする方法などである。この方法をピーク成
分振幅値予測方法1と呼ぶこととする。
【0033】整数Nについては、固定値としておくか、
変動する場合はその情報を補助信号に含めておく。ここ
ではN=2または3の場合について例を述べたが、Nの値
に特に制限は無く、擬似生成の精度が高く(音質が高
く)なるようにNを設定してもよい。また、周波数(F÷
N)を持つ低域信号について、(F÷N)が非整数値など
になるため存在しない場合、低域信号の中で(F÷N)よ
りも低い周波数で最も近い周波数FLを持つ低域信号値ML
と、(F÷N)よりも高い周波数で最も近い周波数FHを持
つ低域信号値MHを用いて、内挿補間などにより周波数
(F÷N)を持つ低域信号を生成するとよい。たとえば、
(F÷N)が100.3、FLが100.0、FHが101.
0であった場合、周波数(100.3)を持つ信号は
(ML×0.7+MH×0.3)や(MLの絶対値×0.7+
MHの絶対値×0.3)などの内挿補間によって求めると
よい。
【0034】2つめの予測方法は、周波数FZからの低域
信号を周波数Fからの高域信号(本例ではF1、F2、
・・・、F31、F32の周波数を持つM1、M2、・
・・、M31、M32)へとコピーする方法である。こ
の場合、低域信号のどの周波数帯域を高域信号へコピー
するかを表す周波数情報(本例では周波数FZ)を補助信
号に含めておく必要がある。この方法をピーク成分振幅
値予測方法2と呼ぶこととする。
【0035】これら2つの予測方法については、全ての
副周波数帯域で同一の予測方法を用いても、両者を混在
させてもよい。
【0036】2.2.2)振幅補正 上記2つの予測方法を用いて高域信号を予測した場合、
その振幅の大きさを補正することでより高音質な高域信
号を擬似生成することができる。そのため、振幅の大き
さをどのように補正するかを補助信号に符号化しておく
とよい。予測された高域信号の振幅補正方法について例
を述べる。
【0037】1つめの振幅補正方法は、補正後のピーク
成分の振幅値の情報、たとえば最大値や平均値や合計値
などのいずれかを補助信号に符号化しておき、その情報
に従って予測された高域信号の振幅補正を行う方法であ
る。この方法により、予測された高域信号を所望の最大
値や平均値や合計値などのいずれかを持つように補正す
ることができる。この方法をピーク成分振幅値補正方法
1と呼ぶこととする。
【0038】2つめの振幅補正方法は、予測によって得
られる高域信号のピーク成分と補正後の高域信号のピー
ク成分の振幅比を補助信号に符号化しておき、その情報
に従って予測された高域信号の振幅値に振幅比を乗じて
振幅補正を行う方法である。この方法をピーク成分振幅
値補正方法2と呼ぶこととする。
【0039】これら2つの振幅補正方法については、全
ての副周波数帯域で同一の方法を用いても、両者を混在
させてもよい。
【0040】2.2.3)ピーク成分の極性生成 また、ピーク成分については、一般に振幅値が大きく、
音質に与える影響が大きい。そこで高音質な高域信号を
擬似生成するためには、ピーク成分信号の極性(正か負
か)をいかに擬似生成するかも重要である。以下にピー
ク成分の極性の生成方法について例を述べる。
【0041】1つめの極性の生成方法は、乱数によって
極性を生成する方法である。補助信号に追加情報を一切
必要としないという利点がある。この方法をピーク成分
極性生成方法1と呼ぶこととする。
【0042】2つめの極性の生成方法は、上述の予測方
法(ピーク成分振幅値予測方法1、および、ピーク成分
振幅値予測方法2)によって生成された高域信号の極性
をそのまま使用する方法である。この方法も補助情報を
一切必要としないという利点がある。この方法をピーク
成分極性生成方法2と呼ぶこととする。
【0043】3つめの極性の生成方法は、各ピーク成分
の極性情報を各々補助信号に符号化しておき、その極性
情報に従ってピーク成分の極性を設定する方法である
(以下、ピーク成分極性生成方法3と呼ぶ)。ここで、
ピーク成分振幅値予測方法1を用いた場合、補助信号を
生成する際に予測されたピーク成分の振幅値の大きさや
周波数の順番など、予め定められた方法で各振幅値に対
応する極性情報を符号化しておくとよい。こうすること
で、音声帯域拡張システムでは、補助信号に含まれてい
る極性情報がピーク成分のどの信号に対応するものであ
るかを付加情報無しに正しく知ることができるようにな
る。
【0044】4つめの極性の生成方法は、周波数FYから
の低域信号の極性を周波数Fからの高域信号(本例では
F1、F2、・・・、F31、F32の周波数を持つM
1、M2、・・・、M31、M32)のピーク成分の極
性へとコピーする方法である。この場合、低域信号のど
の周波数帯域の極性を高域信号へコピーするかを表す周
波数情報(本例では周波数FY)を補助信号に含めておく
必要がある。この方法をピーク成分極性生成方法4と呼
ぶこととする。
【0045】これら4つの極性生成方法については、全
ての副周波数帯域で同一の方法を用いても、複数の方法
を混在させてもよい。
【0046】2.3)非ピーク成分振幅疑似生成 次に、非ピーク成分について振幅値を擬似生成する方法
について述べる。
【0047】1つめの非ピーク成分の振幅値生成方法
は、振幅値をゼロにする方法である。この方法を非ピー
ク成分振幅生成方法1と呼ぶこととする。
【0048】2つめの非ピーク成分の振幅値生成方法
は、振幅値を乱数値とする方法である。発生させる乱数
の特性について、特に制限は無いが、例えば振幅値につ
いては、最も高音質となるような乱数振幅値に関する情
報を補助情報に含めておくと良い。ここで、乱数振幅値
に関する情報としては、乱数振幅の最大値、合計エネル
ギ、平均値、平均エネルギ、ピーク成分との振幅比、ピ
ーク成分とのエネルギ比のいずれかなどを用いると良
い。この方法を非ピーク成分振幅生成方法2と呼ぶこと
とする。
【0049】これら2つの擬似生成方法については、全
ての副周波数帯域で同一の方法を用いても、両者を混在
させてもよい。
【0050】また、ピーク成分の振幅補正情報や、非ピ
ーク成分の乱数振幅値情報については、高域信号の複数
の副周波数帯域間で似た値になることが多い。そのた
め、複数の副周波数帯域間でこれらの情報を共有した
り、周波数方向に差分符号化やエントロピ符号化を施し
たりすることにより補助信号の符号量を減らすことがで
きる。また周波数方向と同様に時間方向にもこれらの情
報を共有や差分符号化やエントロピ符号化を行うことに
より補助信号の高効率化(符号量削減)を実現できる。
【0051】3.帯域合成 帯域加算部104は、低域信号と擬似生成された高域信
号とを合成して広帯域な帯域拡張音声信号を生成する。
例えば、1024個のMDCT係数に変換された広帯域
な周波数領域信号の低域側512個が低域信号として入
力され、高域生成部103において高域側512個を擬
似生成した場合、1024個のMDCT係数の低域側5
12個を低域信号で、高域側512個を擬似生成した信
号で構成することで帯域加算を行う。ここではMDCT
係数を例に説明したが、フーリエ変換など他の周波数変
換方式が用いられた場合も同様に、低域信号と擬似生成
された高域信号を周波数領域で結合することで広帯域信
号を構成できる。
【0052】4.補助信号生成システム 図3を参照すると、補助信号を生成する補助信号生成シ
ステムは、高域信号予測部301、ピーク成分分類部3
02、ピーク成分信号生成部303、非ピーク成分信号
生成部304、および、補助信号生成部305を有す
る。この補助信号生成システムの入力は低域信号および
高域信号であり、出力は補助信号である。
【0053】高域信号予測部301は、入力された低域
信号を分析して高域信号を擬似生成する。擬似生成され
た高域予測信号はピーク成分分類部302に出力され
る。高域予測信号の擬似生成方法は上述のピーク成分振
幅値擬似生成方法2などが用いられる。なお、音声帯域
拡張システムでピーク成分振幅値擬似生成方法1などの
ように低域信号からの予測を行わない場合、高域信号予
測部301は不要となる。
【0054】ピーク成分分類部302は、高域予測信号
あるいは高域信号のいずれか、もしくは両方を入力と
し、それらをピーク成分と非ピーク成分に分類する。周
波数や値といったピーク成分に関する情報がピーク成分
信号生成部303に出力される。同様に非ピーク成分に
関する周波数や値といった情報が非ピーク成分信号生成
部304に出力される。
【0055】音声帯域拡張システムで上述のピーク分類
方法1が使用されている場合は、高域信号の中から聴覚
的重要性、信号強度などの基準でピーク成分を選択し、
選択された信号の周波数と値(振幅、極性のいずれか、
または両方)をピーク成分信号生成部303へ出力す
る。音声帯域拡張システムで上述のピーク分類方法2が
使用されている場合は、上述のピーク分類方法2でピー
ク成分を選択し、選択された信号の周波数と値(振幅、
極性のいずれか、または両方)をピーク成分信号生成部
303へ出力する。ピーク成分以外の信号は、非ピーク
成分として信号の周波数と値(振幅、極性のいずれか、
または両方)を非ピーク成分信号生成部304へ出力す
る。
【0056】ピーク成分信号生成部303は、低域信号
と高域信号とピーク成分に関する情報のいずれか、また
は複数を入力とし、入力されたピーク成分に関する情報
を符号化してピーク成分信号を補助信号生成部305へ
出力する。
【0057】音声帯域拡張システムで上述のピーク分類
方法1が使用されている場合は、入力された信号の周波
数を符号化してピーク成分信号として補助信号生成部3
05へ出力する。また、音声帯域拡張システムで上述の
ピーク分類方法2が使用されている場合でピーク成分数
が可変である場合は、ピーク成分数に関する情報を符号
化してピーク成分信号として補助信号生成部305へ出
力する。また、ピーク分類方法1とピーク分類方法2が
混在している場合は、どの周波数帯域あるいは時間区間
でどの方法が用いられているかの情報をピーク成分信号
として補助信号生成部305へ出力する。
【0058】音声帯域拡張システムで上述のピーク成分
振幅値擬似生成方法1が使用されている場合は、入力さ
れた信号の振幅値を符号化してピーク成分信号として補
助信号生成部305へ出力する。音声帯域拡張システム
で上述のピーク成分振幅値予測方法1が用いられ、か
つ、低域信号から高域信号の生成方法(Nの選択方法な
ど)が可変である場合は、その生成方法に関する情報を
ピーク成分信号として補助信号生成部305へ出力す
る。
【0059】音声帯域拡張システムで上述のピーク成分
振幅値予測方法2が用いられている場合は、音質が高く
なるように低域信号のどの周波数から高域信号へコピー
すれば良いかを判定し、低域のコピー元周波数をピーク
成分信号として補助信号生成部305へ出力する。
【0060】また、ピーク成分振幅値擬似生成方法1と
ピーク成分振幅値擬似生成方法2とが混在している場合
は、どの周波数帯域あるいは時間区間でどの方法が用い
られているかの情報をピーク成分信号として補助信号生
成部305へ出力する。
【0061】同様に、ピーク成分振幅値予測方法1とピ
ーク成分振幅値予測方法2が混在している場合は、どの
周波数帯域あるいは時間区間でどの方法が用いられてい
るかの情報をピーク成分信号として補助信号生成部30
5へ出力する。
【0062】音声帯域拡張システムで上述のピーク成分
振幅値補正方法1あるいはピーク成分振幅値補正方法2
が用いられている場合は、高域信号と高域予測信号を比
較して、高域予測信号をどのように補正すれば高域信号
に近くなるかを表す補正情報をピーク成分信号として補
助信号生成部305へ出力する。この時、補正情報は、
時間方向または周波数方向、もしくはその両方向に同一
情報を共有、差分符号化、エントロピ符号化などをする
ことで情報量を削減してもよい。
【0063】また、ピーク成分振幅値補正方法1とピー
ク成分振幅値補正方法2とが混在している場合は、どの
周波数帯域あるいは時間区間でどの方法が用いられてい
るかの情報をピーク成分信号として補助信号生成部30
5へ出力する。
【0064】音声帯域拡張システムで上述のピーク成分
極性生成方法3が使用されている場合は、ピーク成分の
信号の周波数と同一周波数を持つ信号を高域信号から選
びその極性をピーク成分信号として補助信号生成部30
5へ出力する。ここで、同一周波数信号を持つ高域信号
の値がゼロである場合は、極性を乱数で決めてもよい。
【0065】音声帯域拡張システムで上述のピーク成分
極性生成方法4が使用されている場合は、音質が高くな
るように低域信号のどの周波数から高域信号へ極性をコ
ピーすれば良いかを判定し、低域のコピー元周波数をピ
ーク成分信号として補助信号生成部305へ出力する。
【0066】また、複数のピーク成分極性生成方法が混
在している場合は、どの周波数帯域あるいは時間区間で
どの方法が用いられているかの情報をピーク成分信号と
して補助信号生成部305へ出力する。
【0067】非ピーク成分信号生成部304は、入力さ
れた非ピーク成分に関する情報を符号化して非ピーク成
分信号を補助信号生成部305へ出力する。音声帯域拡
張システムで上述の非ピーク成分振幅生成方法1が使用
されている場合には、非ピーク成分信号生成部304は
不要である。
【0068】音声帯域拡張システムで上述の非ピーク成
分振幅生成方法2が使用されている場合には、非ピーク
成分として音声帯域拡張システムで生成すべき乱数の振
幅情報を非ピーク成分信号として補助信号生成部305
へ出力する。この時、乱数の振幅情報は、乱数のエネル
ギが、非ピーク成分に相当する周波数を持つ高域信号の
エネルギに近くなるように選択するとよい。
【0069】また、非ピーク成分振幅生成方法1と非ピ
ーク成分振幅生成方法2とが混在している場合は、どの
周波数帯域あるいは時間区間でどの方法が用いられてい
るかの情報を非ピーク成分信号として補助信号生成部3
05へ出力する。
【0070】補助信号生成部305は、入力されたピー
ク成分信号と非ピーク成分信号とを多重化し、補助信号
を生成する。ピーク成分信号と非ピーク成分信号のいず
れかのみが入力された場合は、いずれか入力された信号
を補助信号とする。生成された補助信号は補助信号生成
システムの出力となる。
【0071】図4は、本実施形態における補助信号生成
システムの動作を示すフローチャートである。まず、低
域信号から高域予測信号を生成し(ステップ401)。
次に、高域信号および高域予測信号の両方あるいは一方
を用いて、高域予測信号の周波数帯域に含まれる複数の
信号の中からピーク成分を選択する(ステップ40
2)。ピーク成分に関する情報からピーク成分信号を生
成し(ステップ403)、非ピーク成分に関する情報か
ら非ピーク成分信号を生成する(ステップ404)。最
後にピーク成分信号と非ピーク成分信号とを多重化し、
補助信号を出力する(ステップ405)。
【0072】5.オーディオ符号化/復号化システム 図5は、上記音声帯域拡張システムおよび補助信号生成
システムを利用した音声伝達システムの一例を示すブロ
ック図である。この例における音声伝達システムは、オ
ーディオ符号化システムとオーディオ復号システムから
なり、本発明による音声帯域拡張システムおよび補助信
号生成システムは、それぞれオーディオ復号システムお
よびオーディオ符号化システムに含まれる。これによ
り、従来よりも少ない符号量で広帯域かつ高音質なオー
ディオ信号を復号し出力することができる。
【0073】図5に示すシステムは、周波数変換部50
1、圧縮処理部502、補助信号生成システム503、
および多重化部504からなるオーディオ符号化システ
ムと、多重化解除部505、伸張部506、帯域拡張音
声生成システム507、および周波数逆変換部508か
らなるオーディオ復号システムと、で構成されている。
【0074】オーディオ符号化システムはMPEGに代
表される一般のオーディオ符号化システムに補助信号生
成システム503を追加したものである。
【0075】周波数変換部501は、入力されたオーデ
ィオ信号にMDCTまたはサブバンド変換処理といった
変換処理を施して周波数領域信号を得る。得られた周波
数領域信号の低域部分を圧縮処理部502に、低域部分
および高域部分の両方を補助信号生成システム503に
出力する。
【0076】圧縮処理部502は低域信号をMPEGに
代表される一般のオーディオ符号化方式で圧縮して、低
域信号を圧縮したビットストリームを多重化処置504
に出力する。また、補助信号生成システム503が必要
とする場合は、圧縮処理部502の処理途中で得られる
周波数領域信号の量子化値を逆量子化した値を低域信号
として補助信号生成システム503へ出力する。
【0077】補助信号生成システム503は低域信号と
高域信号を入力とし、音声帯域拡張システムで高音質な
高域が擬似生成できるような補助信号を生成し、多重化
処理504へ出力する。なお、入力の低域信号は、周波
数変換処理501が出力した低域信号、あるいは、圧縮
処理502が出力した低域信号のいずれかである。
【0078】多重化処理504は、低域信号を圧縮した
ビットストリームと補助信号を多重化してビットストリ
ームを生成する。生成されたビットストリームは、一般
に、メモリカード、磁気ディスク、あるいは光ディスク
といった情報蓄積媒体に記録されるか、無線あるいは有
線通信路といった情報伝達媒体を通じて伝送される。
【0079】オーディオ復号システムはMPEGに代表
される一般のオーディオ復号システムに帯域拡張音声生
成システム507を追加したものである。
【0080】多重化解除処理505は、ビットストリー
ムに多重化されている低域信号を圧縮したビットストリ
ームと補助信号を分離し、低域信号を圧縮したビットス
トリームを伸張処理506へ、補助信号を帯域拡張音声
生成システム507へ出力する。
【0081】伸張処理506は、MPEGに代表される
一般のオーディオ復号方式でビットストリームを復号
し、低域信号を得る。一般的な伸張処理では、周波数領
域の信号を生成した後に周波数逆変換によって時間領域
の復号オーディオ信号を得るが、ここでは、周波数逆変
換を行う前の周波数領域の信号を帯域拡張音声生成シス
テム507に出力することとする。
【0082】帯域拡張音声生成システム507は、低域
信号および補助信号から高域信号を擬似生成する。さら
に、低域信号と高域信号を合成して広帯域な周波数領域
信号を生成し、周波数逆変換処理508へ出力する。
【0083】周波数逆変換処理508は、広帯域な周波
数領域信号に逆MDCTやサブバンド逆変換処理を施し
て広帯域な時間領域信号に変換する。
【0084】上述した本実施形態では、低域信号だけで
なく補助信号をも用いて高域信号を擬似生成するように
構成されているため、低域信号からだけでは生成が困難
であった高音質な高域信号の擬似生成ができる。また高
域生成部103において線形予測フィルタやその残差信
号といった人間の音声生成モデルに基づいた方法を使用
しないため、楽器音などでも高音質に高域信号の擬似生
成ができる。
【0085】上述した本発明による音声帯域拡張システ
ムは、上記説明から明らかなように、コンピュータに、
高域生成部103および帯域加算部104にそれぞれ対
応する高域生成プログラムおよび帯域加算プログラムを
実行させることで実現することもできる。また、補正信
号生成システムも、同様にコンピュータシステムとして
実現可能である。
【0086】
【発明の効果】第1の効果は、高音質な帯域拡張音声信
号を生成できることにある。その理由は、補助信号によ
り低域からだけでは予測不可能な高域信号を生成可能な
ためである。
【0087】第2の効果は、楽器音など人間の音声以外
に対しても高音質な帯域拡張音声信号を生成できること
にある。その理由は、線形予測フィルタとその予測残差
といった人間の音声生成メカニズムに頼ったパラメータ
を用いずに高域信号を擬似生成するためである。
【図面の簡単な説明】
【図1】本発明の一実施形態による音声帯域拡張システ
ムの全体的構成を示すブロック図である。
【図2】本実施形態の全体的動作を示すフローチャート
である。
【図3】本実施形態における補助信号生成システムを示
すブロック図である。
【図4】本実施形態における補助信号生成の動作を示す
フローチャートである。
【図5】本発明による音声帯域拡張システムの一般的な
利用方法を示すブロック図である。
【符号の説明】
101 低域信号入力部 102 補助信号入力部 103 高域生成部 104 帯域加算部 105 帯域拡張音声出力部 301 高域信号予測部 302 ピーク成分分類部 303 ピーク成分信号生成部 304 非ピーク成分信号生成部 305 補助信号生成部 501 周波数変換部 502 圧縮処理部 503 補助信号生成システム 504 多重化部 505 多重化解除部 506 伸張処理部 507 帯域拡張音声生成システム 508 周波数逆変換部

Claims (58)

    【特許請求の範囲】
  1. 【請求項1】 低域信号から高域信号を擬似生成し、前
    記低域信号と前記擬似生成された高域信号とを合成する
    ことによって広帯域な帯域拡張音声信号を生成する音声
    帯域拡張システムにおいて、 前記高域信号を擬似生成する際に、前記低域信号だけで
    はなく前記音声帯域拡張システムに入力される補助信号
    をも用いて前記高域信号を擬似生成する高域生成手段を
    有することを特徴とする音声帯域拡張システム。
  2. 【請求項2】 低域信号から高域信号を擬似生成し、前
    記低域信号と前記擬似生成された高域信号とを合成する
    ことによって広帯域な帯域拡張音声信号を生成する音声
    帯域拡張システムにおいて、 前記高域信号を擬似生成する際に、前記低域信号および
    補助信号を用いて前記高域信号を擬似生成する高域生成
    手段を有し、 当該高域生成手段が前記高域信号をピーク成分と非ピー
    ク成分に分類し、前記ピーク成分と前記非ピーク成分と
    を異なる方法で擬似生成することを特徴とする音声帯域
    拡張システム。
  3. 【請求項3】 前記高域生成手段は前記補助信号を復号
    して前記ピーク成分に該当する信号を識別し、前記ピー
    ク成分以外の信号を非ピーク成分とすることで、前記高
    域信号をピーク成分と非ピーク成分に分類することを特
    徴とする請求項2に記載の音声帯域拡張システム。
  4. 【請求項4】 前記高域生成手段は予め定められた手法
    で高域予測信号を擬似生成し、前記高域予測信号から予
    め定められた手順で予め定められた個数の信号を選択し
    て前記ピーク成分に該当する信号とし、前記ピーク成分
    以外の信号を非ピーク成分とすることで、前記高域信号
    をピーク成分と非ピーク成分に分類することを特徴とす
    る請求項2に記載の音声帯域拡張システム。
  5. 【請求項5】 前記高域生成手段は予め定められた手法
    で高域予測信号を擬似生成し、前記高域予測信号から振
    幅が大きい順に予め定められた個数の信号を選択して前
    記ピーク成分に該当する信号とし、前記ピーク成分以外
    の信号を非ピーク成分とすることで、前記高域信号をピ
    ーク成分と非ピーク成分に分類することを特徴とする請
    求項2に記載の音声帯域拡張システム。
  6. 【請求項6】 前記予め定められた個数は固定値である
    ことを特徴とする請求項4または5に記載の音声帯域拡
    張システム。
  7. 【請求項7】 前記予め定められた個数は、前記補助信
    号を復号して得られることを特徴とする請求項4または
    5に記載の音声帯域拡張システム。
  8. 【請求項8】 前記ピーク成分を擬似生成する際に、そ
    の振幅値は前記補助信号を復号して得られることを特徴
    とする請求項2ないし7のいずれかに記載の音声帯域拡
    張システム。
  9. 【請求項9】 前記ピーク成分を擬似生成する際に、そ
    の振幅値は前記低域信号から予測して得られることを特
    徴とする請求項2ないし7のいずれかに記載の音声帯域
    拡張システム。
  10. 【請求項10】 前記高域信号に含まれる周波数Fを持
    つ信号の値を前記低域信号から予測して得る際に、2以
    上の整数Nについて前記低域信号に含まれる周波数(F
    ÷N)を持つ信号の値を用いて予測することを特徴とす
    る請求項9に記載の音声帯域拡張システム。
  11. 【請求項11】 前記整数Nについて周波数(F÷N)
    を持つ信号が前記低域信号に無い場合に、周波数(F÷
    N)に最も近く(F÷N)よりも小さい周波数を持つ信
    号値と、周波数(F÷N)に最も近く(F÷N)よりも
    大きい周波数を持つ信号値との内挿補間によって前記周
    波数(F÷N)を持つ信号の値とすること特徴とする請
    求項10に記載の音声帯域拡張システム。
  12. 【請求項12】 前記低域信号に含まれる一部の周波数
    帯域部分を前記高域信号に含まれる周波数帯域部分へコ
    ピーすることによって前記ピーク成分の値を得ることを
    特徴とする請求項9に記載の音声帯域拡張システム。
  13. 【請求項13】 前記ピーク成分の振幅を前記補助信号
    に含まれる補正情報に基づいて補正することを特徴とす
    る請求項2ないし12のいずれかに記載の音声帯域拡張
    システム。
  14. 【請求項14】 前記補助信号に含まれる補正後の前記
    ピーク成分の振幅に関する情報に基づいて前記ピーク成
    分を補正することを特徴とする請求項13に記載の音声
    帯域拡張システム。
  15. 【請求項15】 前記補助信号に含まれる補正倍率を用
    いて前記ピーク成分に前記補正倍率を乗じることで前記
    ピーク成分の振幅を補正することを特徴とする請求項1
    3に記載の音声帯域拡張システム。
  16. 【請求項16】 前記補正情報は、時間方向および周波
    数方向の少なくとも一方向に共有、差分復号化またはエ
    ントロピ復号化を含む処理を施されて使用されることを
    特徴とする請求項13ないし15のいずれかに記載の音
    声帯域拡張システム。
  17. 【請求項17】 前記ピーク成分の信号の極性を乱数で
    決定することを特徴とする請求項2ないし16のいずれ
    かに記載の音声帯域拡張システム。
  18. 【請求項18】 前記ピーク成分の信号の極性を前記擬
    似生成結果と同一にすることを特徴とする請求項8ない
    し12のいずれかに記載の音声帯域拡張システム。
  19. 【請求項19】 前記ピーク成分の信号の極性は前記補
    助信号を復号して得られることを特徴とする請求項2な
    いし16のいずれかに記載の音声帯域拡張システム。
  20. 【請求項20】 前記低域信号に含まれる一部の周波数
    帯域部分の極性を前記高域信号に含まれる周波数帯域部
    分の極性へコピーすることによって前記ピーク成分の信
    号の極性を得ることを特徴とする請求項2ないし16の
    いずれかに記載の音声帯域拡張システム。
  21. 【請求項21】 前記非ピーク成分の信号の値をゼロと
    することを特徴とする請求項2ないし20のいずれかに
    記載の音声帯域拡張システム。
  22. 【請求項22】 前記非ピーク成分の信号の値を乱数と
    することを特徴とする請求項2ないし20のいずれかに
    記載の音声帯域拡張システム。
  23. 【請求項23】 前記補助信号を復号して得た前記乱数
    に関する振幅情報を用い、前記振幅情報に従って前記乱
    数を発生させることを特徴とする請求項22に記載の音
    声帯域拡張システム。
  24. 【請求項24】 前記乱数に関する前記振幅情報を時間
    方向および周波数方向の少なくとも一方向に共有、差分
    復号化またはエントロピ復号化を含む処理を施して用い
    ることを特徴とする請求項23に記載の音声帯域拡張シ
    ステム。
  25. 【請求項25】 請求項1ないし請求項24のいずれか
    に記載の音声帯域拡張システムを含むことを特徴とする
    オーディオ復号システム。
  26. 【請求項26】 音声帯域拡張システムが使用する補助
    信号を生成する補助信号生成システムにおいて、 低域信号から高域予測信号を疑似生成する高域信号予測
    手段と、 前記高域予測信号をピーク成分と非ピーク成分に分類す
    るピーク成分分類手段と、 前記ピーク成分を符号化してピーク成分信号を生成する
    ピーク成分信号生成手段と、 前記非ピーク成分を符号化して非ピーク成分信号を生成
    する非ピーク成分信号生成手段と、 ピーク成分信号と非ピーク成分信号とを多重化して前記
    補助信号を生成する補助信号生成手段と、 を含むことを特徴とする補助信号生成システム。
  27. 【請求項27】 音声帯域拡張システムが使用する補助
    信号を生成する補助信号生成システムにおいて、 高域信号をピーク成分と非ピーク成分に分類するピーク
    成分分類手段と、 前記ピーク成分を符号化してピーク成分信号を生成する
    ピーク成分信号生成手段と、 前記非ピーク成分を符号化して非ピーク成分信号を生成
    する非ピーク成分信号生成手段と、 ピーク成分信号と非ピーク成分信号を多重化して補助信
    号を生成する補助信号生成手段と、 を含むことを特徴とする補助信号生成システム。
  28. 【請求項28】 請求項26または27に記載の補助信
    号生成システムを含むことを特徴とするオーディオ符号
    化システム。
  29. 【請求項29】 低域信号から高域信号を擬似生成し、
    前記低域信号と前記擬似生成された高域信号を合成する
    ことによって広帯域な帯域拡張音声信号を生成する音声
    帯域拡張方法において、 前記高域信号を擬似生成する際に、前記低域信号だけで
    はなく補助信号をも用いて前記高域信号を擬似生成する
    ことを特徴とする音声帯域拡張方法。
  30. 【請求項30】 低域信号から高域信号を擬似生成し、
    前記低域信号と前記擬似生成された高域信号を合成する
    ことによって広帯域な帯域拡張音声信号を生成する音声
    帯域拡張方法において、 前記高域信号を擬似生成する際に、前記低域信号および
    補助信号も用いて前記高域信号を擬似生成するステップ
    と、 前記高域信号をピーク成分と非ピーク成分とに分類する
    ステップと、 前記ピーク成分と前記非ピーク成分とを異なる方法で擬
    似生成するステップと、 を有することを特徴とする音声帯域拡張方法。
  31. 【請求項31】 前記分類ステップは、 前記補助情報を復号して前記ピーク成分に該当する信号
    を識別し、 前記ピーク成分以外の信号を非ピーク成分とすることで
    前記高域信号をピーク成分と非ピーク成分に分類する、 ことを特徴とする請求項30に記載の音声帯域拡張方
    法。
  32. 【請求項32】 前記高域疑似生成ステップは、予め定
    められた手法で高域予測信号を擬似生成し、 前記分類ステップは、 前記高域予測信号から予め定められた手順で予め定めら
    れた個数の信号を選択して前記ピーク成分に該当する信
    号とし、 前記ピーク成分以外の信号を非ピーク成分とすること
    で、前記高域信号をピーク成分と非ピーク成分とに分類
    する、 ことを特徴とする請求項30に記載の音声帯域拡張方
    法。
  33. 【請求項33】 前記高域疑似生成ステップは、予め定
    められた手法で高域予測信号を擬似生成し、 前記分類ステップは、 前記高域予測信号から振幅が大きい順に予め定められた
    個数の信号を選択して前記ピーク成分に該当する信号と
    し、 前記ピーク成分以外の信号を非ピーク成分とすること
    で、前記高域信号をピーク成分と非ピーク成分とに分類
    する、 ことを特徴とする請求項30に記載の音声帯域拡張方
    法。
  34. 【請求項34】 前記予め定められた個数が固定値であ
    ることを特徴とする請求項32または33に記載の音声
    帯域拡張方法。
  35. 【請求項35】 前記予め定められた個数が固定値では
    なく、その個数の情報を前記補助信号を復号して得るこ
    とを特徴とする請求項32または33に記載の音声帯域
    拡張方法。
  36. 【請求項36】 前記ピーク成分を擬似生成する際に、
    その振幅値を前記補助信号を復号して得ることを特徴と
    する請求項30ないし35のいずれかに記載の音声帯域
    拡張方法。
  37. 【請求項37】 前記ピーク成分を擬似生成する際に、
    その振幅値を前記低域信号から予測して得ることを特徴
    とする請求項30ないし35のいずれかに記載の音声帯
    域拡張方法。
  38. 【請求項38】 前記高域信号に含まれる周波数Fを持
    つ信号の値を前記低域信号から予測して得る際に、2以
    上の整数Nについて前記低域信号に含まれる周波数(F
    ÷N)を持つ信号の値を用いて予測することを特徴とす
    る請求項37に記載の音声帯域拡張方法。
  39. 【請求項39】 前記整数Nについて周波数(F÷N)
    を持つ信号が前記低域信号に無い場合に、周波数(F÷
    N)に最も近く(F÷N)よりも小さい周波数を持つ信
    号値と、周波数(F÷N)に最も近く(F÷N)よりも
    大きい周波数を持つ信号値との内挿補間によって前記周
    波数(F÷N)を持つ信号の値とすること特徴とする請
    求項38に記載の音声帯域拡張方法。
  40. 【請求項40】 前記低域信号に含まれる一部の周波数
    帯域部分を前記高域信号に含まれる周波数帯域部分へコ
    ピーすることによって前記ピーク成分の値を得ることを
    特徴とする請求項37に記載の音声帯域拡張方法。
  41. 【請求項41】 前記ピーク成分の振幅を前記補助信号
    に含まれる補正情報に基づいて補正することを特徴とす
    る請求項30ないし40のいずれかに記載の音声帯域拡
    張方法。
  42. 【請求項42】 前記補助信号に含まれる補正後の前記
    ピーク成分の振幅に関する情報に基づいて前記ピーク成
    分を補正することを特徴とする請求項41に記載の音声
    帯域拡張方法。
  43. 【請求項43】 前記補助信号に含まれる補正倍率を用
    いて前記ピーク成分に前記補正倍率を乗じることで前記
    ピーク成分の振幅を補正することを特徴とする請求項4
    1に記載の音声帯域拡張方法。
  44. 【請求項44】 前記補正情報を時間方向および周波数
    方向の少なくとも一方向に共有、差分復号化またはエン
    トロピ復号化を含む処理を施して使用することを特徴と
    する請求項41乃至請求項43に記載の音声帯域拡張方
    法。
  45. 【請求項45】 前記ピーク成分の信号の極性を乱数で
    決定することを特徴とする請求項30ないし44のいず
    れかに記載の音声帯域拡張方法。
  46. 【請求項46】 前記ピーク成分の信号の極性を前記擬
    似生成結果と同一にすることを特徴とする請求項36な
    いし40に記載の音声帯域拡張方法。
  47. 【請求項47】 前記ピーク成分の信号の極性を前記補
    助信号を復号して得ることを特徴とする請求項30ない
    し44に記載の音声帯域拡張方法。
  48. 【請求項48】 前記低域信号に含まれる一部の周波数
    帯域部分の極性を前記高域信号に含まれる周波数帯域部
    分の極性へコピーすることによって前記ピーク成分の信
    号の極性を得ることを特徴とする請求項30ないし44
    のいずれかに記載の音声帯域拡張方法。
  49. 【請求項49】 前記非ピーク成分の信号の値をゼロと
    することを特徴とする請求項30ないし48のいずれか
    に記載の音声帯域拡張方法。
  50. 【請求項50】 前記非ピーク成分の信号の値を乱数と
    することを特徴とする請求項30ないし48のいずれか
    に記載の音声帯域拡張方法。
  51. 【請求項51】 前記補助信号を復号して得た前記乱数
    に関する振幅情報を用い、前記振幅情報に従って前記乱
    数を発生させることを特徴とする請求項50に記載の音
    声帯域拡張方法。
  52. 【請求項52】 前記乱数に関する前記振幅情報を時間
    方向および周波数方向の少なくとも一方向に共有、差分
    復号化またはエントロピ復号化を含む処理を施して用い
    ることを特徴とする請求項51に記載の音声帯域拡張方
    法。
  53. 【請求項53】 請求項29ないし52のいずれかに記
    載の音声帯域拡張方法を用いることを特徴とするオーデ
    ィオ復号方法。
  54. 【請求項54】 音声帯域拡張システムが使用する補助
    信号を生成する補助信号生成方法において、 低域信号から高域予測信号を擬似生成し、 前記高域予測信号をピーク成分と非ピーク成分に分類
    し、 前記ピーク成分を符号化してピーク成分信号を生成し、 前記非ピーク成分を符号化して非ピーク成分信号を生成
    し、 前記ピーク成分信号と前記非ピーク成分信号とを多重化
    して補助信号を生成する、 ことを特徴とする補助信号生成方法。
  55. 【請求項55】 音声帯域拡張システムが使用する補助
    信号を生成する補助信号生成方法において、 高域信号をピーク成分と非ピーク成分とに分類し、 前記ピーク成分を符号化してピーク成分信号を生成し、 前記非ピーク成分を符号化して非ピーク成分信号を生成
    し、 ピーク成分信号と非ピーク成分信号とを多重化して補助
    信号を生成する、 ことを特徴とする補助信号生成方法。
  56. 【請求項56】 請求項54または55に記載の補助信
    号生成方法を用いることを特徴とするオーディオ符号化
    方法。
  57. 【請求項57】 コンピュータに、低域信号から高域信
    号を擬似生成させ、前記低域信号と前記擬似生成された
    高域信号とを合成することによって広帯域な帯域拡張音
    声信号を生成させる音声帯域拡張プログラムにおいて、 前記高域信号を擬似生成する際に、前記低域信号だけで
    はなく補助信号をも用いて前記高域信号を擬似生成する
    ステップを含むことを特徴とするプログラム。
  58. 【請求項58】 コンピュータに、低域信号から高域信
    号を擬似生成させ、前記低域信号と前記擬似生成された
    高域信号を合成することによって広帯域な帯域拡張音声
    信号を生成させる音声帯域拡張プログラムにおいて、 前記高域信号を擬似生成する際に、前記低域信号および
    補助信号も用いて前記高域信号を擬似生成するステップ
    と、 前記高域信号をピーク成分と非ピーク成分とに分類する
    ステップと、 前記ピーク成分と前記非ピーク成分とを異なる方法で擬
    似生成するステップと、 を有することを特徴とする音声帯域拡張プログラム。
JP2002053062A 2002-02-28 2002-02-28 音声帯域拡張システムおよび方法 Withdrawn JP2003255973A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002053062A JP2003255973A (ja) 2002-02-28 2002-02-28 音声帯域拡張システムおよび方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002053062A JP2003255973A (ja) 2002-02-28 2002-02-28 音声帯域拡張システムおよび方法

Publications (1)

Publication Number Publication Date
JP2003255973A true JP2003255973A (ja) 2003-09-10

Family

ID=28664587

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002053062A Withdrawn JP2003255973A (ja) 2002-02-28 2002-02-28 音声帯域拡張システムおよび方法

Country Status (1)

Country Link
JP (1) JP2003255973A (ja)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005112001A1 (ja) * 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
JPWO2005111568A1 (ja) * 2004-05-14 2008-03-27 松下電器産業株式会社 符号化装置、復号化装置、およびこれらの方法
JP2008129541A (ja) * 2006-11-24 2008-06-05 Fujitsu Ltd 復号化装置および復号化方法
JP2008275876A (ja) * 2007-04-27 2008-11-13 Victor Co Of Japan Ltd デジタル音声処理装置及びデジタル音声処理プログラム
JP2008298942A (ja) * 2007-05-30 2008-12-11 Victor Co Of Japan Ltd デジタル音声処理装置及びデジタル音声処理プログラム
WO2010000179A1 (zh) * 2008-06-30 2010-01-07 华为技术有限公司 频带扩展的方法、***和设备
JP2011013560A (ja) * 2009-07-03 2011-01-20 Fujitsu Ltd オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
JP2013125187A (ja) * 2011-12-15 2013-06-24 Fujitsu Ltd 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
US8560304B2 (en) 2007-04-30 2013-10-15 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding high frequency band
JP2014206769A (ja) * 2009-10-07 2014-10-30 ソニー株式会社 符号化装置および方法、並びにプログラム
US8898057B2 (en) 2009-10-23 2014-11-25 Panasonic Intellectual Property Corporation Of America Encoding apparatus, decoding apparatus and methods thereof
US9070372B2 (en) 2010-07-15 2015-06-30 Fujitsu Limited Apparatus and method for voice processing and telephone apparatus
EP2899722A1 (en) 2014-01-28 2015-07-29 Fujitsu Limited Communication device
US9208795B2 (en) 2009-10-07 2015-12-08 Sony Corporation Frequency band extending device and method, encoding device and method, decoding device and method, and program
US9390717B2 (en) 2011-08-24 2016-07-12 Sony Corporation Encoding device and method, decoding device and method, and program
US9406312B2 (en) 2010-04-13 2016-08-02 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US9583112B2 (en) 2010-04-13 2017-02-28 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US9659573B2 (en) 2010-04-13 2017-05-23 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US9767824B2 (en) 2010-10-15 2017-09-19 Sony Corporation Encoding device and method, decoding device and method, and program
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
US10692511B2 (en) 2013-12-27 2020-06-23 Sony Corporation Decoding apparatus and method, and program

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4810422B2 (ja) * 2004-05-14 2011-11-09 パナソニック株式会社 符号化装置、復号化装置、およびこれらの方法
JPWO2005111568A1 (ja) * 2004-05-14 2008-03-27 松下電器産業株式会社 符号化装置、復号化装置、およびこれらの方法
JP2011043853A (ja) * 2004-05-14 2011-03-03 Panasonic Corp 符号化装置、復号化装置、およびこれらの方法
WO2005112001A1 (ja) * 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
US8688440B2 (en) 2004-05-19 2014-04-01 Panasonic Corporation Coding apparatus, decoding apparatus, coding method and decoding method
US8463602B2 (en) 2004-05-19 2013-06-11 Panasonic Corporation Encoding device, decoding device, and method thereof
JP5013863B2 (ja) * 2004-05-19 2012-08-29 パナソニック株式会社 符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法及び復号化方法
JP2011248378A (ja) * 2004-05-19 2011-12-08 Panasonic Corp 符号化装置、復号化装置、およびこれらの方法
US8249882B2 (en) 2006-11-24 2012-08-21 Fujitsu Limited Decoding apparatus and decoding method
JP2008129541A (ja) * 2006-11-24 2008-06-05 Fujitsu Ltd 復号化装置および復号化方法
JP2008275876A (ja) * 2007-04-27 2008-11-13 Victor Co Of Japan Ltd デジタル音声処理装置及びデジタル音声処理プログラム
JP2017068276A (ja) * 2007-04-30 2017-04-06 サムスン エレクトロニクス カンパニー リミテッド 高周波数領域の符号化及び復号化の方法並びに装置
USRE47824E1 (en) 2007-04-30 2020-01-21 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding high frequency band
US8560304B2 (en) 2007-04-30 2013-10-15 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding high frequency band
JP2008298942A (ja) * 2007-05-30 2008-12-11 Victor Co Of Japan Ltd デジタル音声処理装置及びデジタル音声処理プログラム
WO2010000179A1 (zh) * 2008-06-30 2010-01-07 华为技术有限公司 频带扩展的方法、***和设备
JP2011013560A (ja) * 2009-07-03 2011-01-20 Fujitsu Ltd オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
JP2014206769A (ja) * 2009-10-07 2014-10-30 ソニー株式会社 符号化装置および方法、並びにプログラム
US9691410B2 (en) 2009-10-07 2017-06-27 Sony Corporation Frequency band extending device and method, encoding device and method, decoding device and method, and program
US9208795B2 (en) 2009-10-07 2015-12-08 Sony Corporation Frequency band extending device and method, encoding device and method, decoding device and method, and program
US8898057B2 (en) 2009-10-23 2014-11-25 Panasonic Intellectual Property Corporation Of America Encoding apparatus, decoding apparatus and methods thereof
US9679580B2 (en) 2010-04-13 2017-06-13 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US10381018B2 (en) 2010-04-13 2019-08-13 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US9583112B2 (en) 2010-04-13 2017-02-28 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US10546594B2 (en) 2010-04-13 2020-01-28 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US9406312B2 (en) 2010-04-13 2016-08-02 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US9659573B2 (en) 2010-04-13 2017-05-23 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US10297270B2 (en) 2010-04-13 2019-05-21 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US10224054B2 (en) 2010-04-13 2019-03-05 Sony Corporation Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US9070372B2 (en) 2010-07-15 2015-06-30 Fujitsu Limited Apparatus and method for voice processing and telephone apparatus
US9767824B2 (en) 2010-10-15 2017-09-19 Sony Corporation Encoding device and method, decoding device and method, and program
US10236015B2 (en) 2010-10-15 2019-03-19 Sony Corporation Encoding device and method, decoding device and method, and program
US9390717B2 (en) 2011-08-24 2016-07-12 Sony Corporation Encoding device and method, decoding device and method, and program
JP2013125187A (ja) * 2011-12-15 2013-06-24 Fujitsu Ltd 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
US10692511B2 (en) 2013-12-27 2020-06-23 Sony Corporation Decoding apparatus and method, and program
US11705140B2 (en) 2013-12-27 2023-07-18 Sony Corporation Decoding apparatus and method, and program
EP2899722A1 (en) 2014-01-28 2015-07-29 Fujitsu Limited Communication device
US9620149B2 (en) 2014-01-28 2017-04-11 Fujitsu Limited Communication device

Similar Documents

Publication Publication Date Title
JP2003255973A (ja) 音声帯域拡張システムおよび方法
JP5048697B2 (ja) 符号化装置、復号化装置、符号化方法、復号化方法、プログラムおよび記録媒体
JP3926726B2 (ja) 符号化装置および復号化装置
KR100427753B1 (ko) 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치
JP4899359B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
RU2491658C2 (ru) Синтезатор аудиосигнала и кодирующее устройство аудиосигнала
RU2381571C2 (ru) Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала
JP5203077B2 (ja) 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
JP2001521648A (ja) スペクトル帯域複製を用いた原始コーディングの強化
KR20070012194A (ko) 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
JP5031829B2 (ja) 符号化装置、復号化装置、符号化方法、復号化方法及びコンピュータで読み取り可能な記録媒体
KR20050030887A (ko) 신호 부호화 장치 및 방법, 및 신호 복호 장치 및 방법
WO2003010752A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
JPH0744193A (ja) 高能率符号化方法
JP2011059714A (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP2006126826A (ja) オーディオ信号符号化/復号化方法及びその装置
WO2016021412A1 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
JP5299327B2 (ja) 音声処理装置、音声処理方法、およびプログラム
JP2003108197A (ja) オーディオ信号復号化装置およびオーディオ信号符号化装置
JP4308229B2 (ja) 符号化装置および復号化装置
JP2004053940A (ja) オーディオ復号化装置およびオーディオ復号化方法
JPH09127995A (ja) 信号復号化方法及び信号復号化装置
KR100428697B1 (ko) 음성합성방법 및 장치
JP3191257B2 (ja) 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置、音響信号復号化装置
JP2006047561A (ja) オーディオ信号符号化装置およびオーディオ信号復号化装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050510