JP4538705B2 - ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 - Google Patents
ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 Download PDFInfo
- Publication number
- JP4538705B2 JP4538705B2 JP2000238897A JP2000238897A JP4538705B2 JP 4538705 B2 JP4538705 B2 JP 4538705B2 JP 2000238897 A JP2000238897 A JP 2000238897A JP 2000238897 A JP2000238897 A JP 2000238897A JP 4538705 B2 JP4538705 B2 JP 4538705B2
- Authority
- JP
- Japan
- Prior art keywords
- power spectrum
- spectrum data
- audio signal
- digital audio
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 44
- 238000003672 processing method Methods 0.000 title claims description 16
- 238000001228 spectrum Methods 0.000 claims description 151
- 230000005236 sound signal Effects 0.000 claims description 89
- 238000004364 calculation method Methods 0.000 claims description 39
- 238000004458 analytical method Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 9
- 238000013075 data extraction Methods 0.000 claims 16
- 230000003595 spectral effect Effects 0.000 claims 16
- 230000002596 correlated effect Effects 0.000 claims 3
- 230000000875 corresponding effect Effects 0.000 claims 3
- 230000000593 degrading effect Effects 0.000 claims 1
- 238000013139 quantization Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 8
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 8
- 238000005070 sampling Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明はディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体に関し、レートコンバータ又はPCM(Pulse Code Modulation) 復号装置等においてディジタル信号に対してデータの補間処理を行うディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体に適用して好適なものである。
【0002】
【従来の技術】
従来、ディジタルオーディオ信号をディジタル/アナログコンバータに入力する前に、サンプリング周波数を元の値の数倍に変換するオーバサンプリング処理を行っている。これにより、ディジタル/アナログコンバータから出力されたディジタルオーディオ信号はアナログ・アンチ・エイリアス・フィルタの位相特性が可聴周波数高域で一定に保たれ、また、サンプリングに伴うディジタル系のイメージ雑音の影響が排除されるようになされている。
【0003】
かかるオーバサンプリング処理では、通常、線形一次(直線)補間方式のディジタルフィルタが用いられている。このようなディジタルフィルタは、サンプリングレートが変わったりデータが欠落した場合等に、複数の既存データの平均値を求めて直線的な補間データを生成するものである。
【0004】
【発明が解決しようとする課題】
ところが、オーバサンプリング処理後のディジタルオーディオ信号は、線形一次補間によって時間軸方向に対してデータ量が数倍に緻密になっているものの、オーバサンプリング処理後のディジタルオーディオ信号の周波数帯域は変換前とあまり変わらず、音質そのものは向上していない。さらに、補間されたデータは必ずしもA/D変換前のアナログオーディオ信号の波形に基づいて生成されたのではないため、波形再現性もほとんど向上していない。
【0005】
また、サンプリング周波数の異なるディジタルオーディオ信号をダビングする場合において、サンプリング・レート・コンバータを用いて周波数を変換しているが、かかる場合でも線形一次ディジタルフィルタによって直線的なデータの補間しか行うことができず、音質や波形再現性を向上することが困難であった。さらに、ディジタルオーディオ信号のデータサンプルが欠落した場合において同様である。
【0006】
本発明は以上の点を考慮してなされたもので、ディジタルオーディオ信号の波形再現性を一段と向上し得るディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体を提案しようとするものである。
【0007】
【課題を解決するための手段】
かかる課題を解決するため本発明においては、ディジタルオーディオ信号からパワースペクトルデータを算出し、算出されたパワースペクトルデータから一部のパワースペクトルデータを抽出し、抽出された一部のパワースペクトルデータに基づいてそのクラスを分類し、分類されたクラスに対応した予測方式でディジタルオーディオ信号を変換するようにしたことにより、一段とディジタルオーディオ信号の特徴に適応した変換を行うことができる。
【0008】
【発明の実施の形態】
以下図面について、本発明の一実施の形態を詳述する。
【0009】
図1においてオーディオ信号処理装置10は、ディジタルオーディオ信号(以下これをオーディオデータと呼ぶ)のサンプリングレートを上げたり、オーディオデータを補間する際に、真値に近いオーディオデータをクラス分類適用処理によって生成するようになされている。
【0010】
因みに、この実施の形態におけるオーディオデータとは、人間の声や楽器の音等を表す楽音データ、さらにはその他種々の音を表すデータである。
【0011】
すなわち、オーディオ信号処理装置10において、スペクトル処理部11は入力端子TINから供給された入力オーディオデータD10を所定時間毎の領域(この実施の形態の場合、例えば6サンプル毎とする)に切り出した時間軸波形データであるクラスタップを構築した後、当該構築したクラスタップについて、後述する対数データ算出方法により、入力手段18から供給される制御データD18に応じて対数データを算出する。
【0012】
スペクトル処理部11は入力オーディオデータD10のこのとき構築されたクラスタップについて、対数データ算出方法による算出結果であってクラス分類しようとする対数データD11を算出し、これをクラス分類部14に供給する。
【0013】
クラス分類部13は、スペクトル処理部11から供給された対数データD11について、当該対数データD11を圧縮して圧縮データパターンを生成するADRC(Adaptive Dynamic Range Coding) 回路部と、対数データD11の属するクラスコードを発生するクラスコード発生回路部とを有する。
【0014】
ADRC回路部は対数データD11に対して、例えば8ビットから2ビットに圧縮するような演算を行うことによりパターン圧縮データを形成する。このADRC回路部は、適応的量子化を行うものであり、ここでは、信号レベルの局所的なパターンを短い語長で効率的に表現することができるので、信号パターンのクラス分類のコード発生用に用いられる。
【0015】
具体的には、6つの8ビットのデータ(対数データ)をクラス分類しようとする場合、248という膨大な数のクラスに分類しなければならず、回路上の負担が多くなる。そこで、この実施の形態のクラス分類部14ではその内部に設けられたADRC回路部で生成されるパターン圧縮データに基づいてクラス分類を行う。例えば6つの対数データに対して1ビットの量子化を実行すると、6つの対数データを6ビットで表すことができ、26 =64クラスに分類することができる。
【0016】
ここで、ADRC回路部は、切り出された領域内のダイナミックレンジをDR、ビット割り当てをm、各対数データのデータレベルをL、量子化コードをQとすると、次式、
【0017】
【数1】
【0018】
に従って、領域内の最大値MAXと最小値MINとの間を指定されたビット長で均等に分割して量子化を行う。なお、(1)式において{ }は小数点以下の切り捨て処理を意味する。かくしてスペクトル処理部11において算出された6つの対数データが、それぞれ例えば8ビット(m=8)で構成されているとすると、これらはADRC回路部においてそれぞれが2ビットに圧縮される。
【0019】
このようにして圧縮された対数データをそれぞれqn (n=1〜6)とすると、クラス分類部14に設けられたクラスコード発生回路部は、圧縮された対数データqn に基づいて、次式、
【0020】
【数2】
【0021】
に示す演算を実行することにより、そのブロック(q1 〜q6 )が属するクラスを示すクラスコードclass を算出し、当該算出されたクラスコードclass を表すクラスコードデータD14を予測係数メモリ15に供給する。このクラスコードclass は、予測係数メモリ15から予測係数を読み出す際の読み出しアドレスを示す。因みに(2)式において、nは圧縮された対数データqn の数を表し、この実施の形態の場合n=6であり、またPはビット割り当てを表し、この実施の形態の場合P=2である。
【0022】
このようにして、クラス分類部14は入力オーディオデータD10から算出された対数データD11のクラスコードデータD14を生成し、これを予測係数メモリ15に供給する。
【0023】
予測係数メモリ15には、各クラスコードに対応する予測係数のセットがクラスコードに対応するアドレスにそれぞれ記憶されており、クラス分類部14から供給されるクラスコードデータD14に基づいて、当該クラスコードに対応するアドレスに記憶されている予測係数のセットW1 〜Wn が読み出され、予測演算部16に供給される。
【0024】
予測演算部16は、予測演算部抽出部13において入力オーディオデータD10から時間軸領域で切り出された予測演算しようとするオーディオ波形データ(予測タップ)D13(X1 〜Xn )と、予測係数W1 〜Wn に対して、次式
【0025】
【数3】
【0026】
に示す積和演算を行うことにより、予測結果y′を得る。この予測値y′が、音質が改善されたオーディオデータD16として予測演算部16から出力される。
【0027】
なお、オーディオ信号処理装置10の構成として図1について上述した機能ブロックを示したが、この機能ブロックを構成する具体的構成として、この実施の形態においては図2に示すコンピュータ構成の装置を用いる。すなわち、図2において、オーディオ信号処理装置10は、バスBUSを介してCPU21、ROM(Read Only Memory)22、予測係数メモリ15を構成するRAM(Random Access Memory)15、及び各回路部がそれぞれ接続された構成を有し、CPU11はROM22に格納されている種々のプログラムを実行することにより、図1について上述した各機能ブロック(スペクトル処理部11、予測演算部抽出部13、クラス分類部14及び予測演算部16)として動作するようになされている。
【0028】
また、オーディオ信号処理装置10にはネットワークとの間で通信を行う通信インターフェース24、フロッピィディスクや光磁気ディスク等の外部記憶媒体から情報を読み出すリムーバブルドライブ28を有し、ネットワーク経由又は外部記憶媒体から図1について上述したクラス分類適用処理を行うための各プログラムをハードディスク装置25のハードディスクに読み込み、当該読み込まれたプログラムに従ってクラス分類適応処理を行うこともできる。
【0029】
ユーザは、キーボードやマウス等の入力手段18を介して種々のコマンドを入力することにより、CPU21に対して図1について上述したクラス分類処理を実行させる。この場合、オーディオ信号処理装置10はデータ入出力部27を介して音質を向上させようとするオーディオデータ(入力オーディオデータ)D10を入力し、当該入力オーディオデータD10に対してクラス分類適用処理を施した後、音質が向上したオーディオデータD16をデータ入出力部27を介して外部に出力し得るようになされている。
【0030】
因みに、図3はオーディオ信号処理装置10におけるクラス分類適応処理の処理手順を示し、オーディオ信号処理装置10はステップSP101から当該処理手順に入ると、続くステップSP102において入力オーディオデータD10の対数データD11をスペクトル処理部11において算出する。
【0031】
この算出された対数データD11は入力オーディオデータD10の特徴を表すものであり、オーディオ信号処理装置10は、ステップSP103に移ってクラス分類部14により対数データD11に基づいてクラスを分類する。そしてオーディオ信号処理装置10はクラス分類の結果得られたクラスコードを用いて予測係数メモリ15から予測係数を読み出す。この予測係数は予め学習によりクラス毎に対応して格納されており、オーディオ信号処理装置10はクラスコードに対応した予測係数を読み出すことにより、このときの対数データD11の特徴に合致した予測係数を用いることができる。
【0032】
予測係数メモリ15から読み出された予測係数は、ステップSP104において予測演算部16の予測演算に用いられる。これにより、入力オーディオデータD10はその対数データD11の特徴に適応した予測演算により、所望とするオーディオデータD16に変換される。かくして入力オーディオデータD10はその音質が改善されたオーディオデータD16に変換され、オーディオ信号処理装置10はステップSP105に移って当該処理手順を終了する。
【0033】
次に、オーディオ信号処理装置10のスペクトル処理部11における入力オーディオデータD10の対数データD11の算出方法について説明する。
【0034】
すなわち、図4はスペクトル処理部11における対数データ算出方法の対数データ算出処理手順を示し、スペクトル処理部11はステップSP1から当該処理手順に入ると、続くステップSP2において入力オーディオデータD10を所定時間毎の領域に切り出した時間軸波形データであるクラスタップを構築し、ステップSP3に移る。
【0035】
ステップSP3において、スペクトル処理部11はクラスタップに対して、窓関数を「W(K)」とすると、次式、
【0036】
【数4】
【0037】
に示すハミング窓に従って、乗算データを算出し、ステップSP4に移る。因みに、この窓関数の乗算処理においては、続くステップSP4において行われる周波数分析の精度を向上させるために、このとき構築されたそれぞれのクラスタップの最初の値と最後の値を等しくするようになされている。また、(1)式において、「N」はハミング窓のサンプル数を表しており、「k」は何番目のサンプルデータであるかを表している。
【0038】
ステップSP4において、スペクトル処理部11は乗算データに対して、高速フーリエ変換(FFT:Fast Fourier Transform)を行うことにより、図5に示すようなパワースペクトルデータを算出し、ステップSP5に移る。
【0039】
ステップSP5において、スペクトル処理部11はパワースペクトルデータから有意であるパワースペクトルデータのみを抽出するようになされている。
【0040】
この抽出処理において、N個の乗算データから算出したパワースペクトルデータのうち、N/2から右側のパワースペクトルデータ群AR2(図5)は、ゼロ値からN/2までの左側のパワースペクトルデータ群AR1(図5)とほぼ同じ成分になる(すなわち、左右対称となる)。このことは、N個の乗算データの周波数帯域内で、両端から等距離にある2個の周波数点におけるパワースペクトルデータの成分が互いに共役であることを示している。従って、スペクトル処理部11は、ゼロ値からN/2までの左側のパワースペクトルデータ群AR1(図5)のみを抽出対象とする。
【0041】
そしてスペクトル処理部11は、このとき抽出対象としたパワースペクトルデータ群AR1のうち、予めユーザが入力手段18(図1及び図2)を介して選択設定した以外のm個のパワースペクトルデータを除いて抽出する。
【0042】
具体的には、ユーザが入力手段18を介して例えば人間の声を一段と高音質にするように選択設定を行った場合、当該選択操作に応じた制御データD18が入力手段18からスペクトル処理部11に出力され(図1及び図2)、これによりスペクトル処理部11は、このとき抽出したパワースペクトルデータ群AR1(図5)から、人間の声において有意となる500Hzから4kHz付近のパワースペクトルデータのみを抽出する(すなわち500Hzから4kHz付近以外のパワースペクトルデータが、除くべきm個のパワースペクトルデータである)。
【0043】
また、ユーザが入力手段18(図1及び図2)を介して例えば音楽を一段と高音質にするように選択を行った場合には、当該選択操作に応じた制御データD18が入力手段18からスペクトル処理部11に出力され、これによりスペクトル処理部11は、このとき抽出したパワースペクトルデータ群AR1(図5)から、音楽において有意となる20Hzから20kHz付近のパワースペクトルデータのみを抽出する(すなわち20Hzから20kHz付近以外のパワースペクトルデータが、除くべきm個のパワースペクトルデータである)。
【0044】
このように入力手段18(図1及び図2)から出力される制御データD18は、有意なパワースペクトルデータとして抽出する周波数成分を決定づけるようになされており、入力手段18(図1及び図2)を介して手動で選択操作するユーザの意図を反映している。
【0045】
従って、制御データD18に応じてパワースペクトルデータを抽出するスペクトル処理部11は、ユーザが高音質での出力を希望する特定のオーディオ成分の周波数成分を有意なパワースペクトルデータとして抽出することとなる。
【0046】
因みに、スペクトル処理部11は、抽出対象としたパワースペクトルデータ群AR1のうち、もとの波形の音程を表すため、有意な特徴をもたない直流成分のパワースペクトルデータをも除いて抽出するようになされている。
【0047】
このように、ステップSP5において、スペクトル処理部11は制御データD18に応じて、パワースペクトルデータ群AR1(図5)からm個のパワースペクトルデータを除くと共に、直流成分のパワースペクトルデータも除いてなる必要最小限のパワースペクトルデータ、すなわち有意なパワースペクトルデータのみを抽出し、続くステップSP6に移る。
【0048】
ステップSP6において、スペクトル処理部11は抽出されたパワースペクトルデータに対して、次式、
【0049】
【数5】
【0050】
に従って、このとき抽出されたパワースペクトルデータ(ps[k] )の最大値(ps_max)を算出し、次式、
【0051】
【数6】
【0052】
に従って、このとき抽出されたパワースペクトルデータ(ps[k] )の最大値(ps_max)での正規化(除算)し、このとき得られた基準値(psn[k] )に対して、次式、
【0053】
【数7】
【0054】
に従って、対数(デシベル値)変換を行うようになされている。因みに(7)式において、logは常用対数である。
【0055】
このように、ステップSP6において、スペクトル処理部11は最大振幅で正規化及び振幅の対数変換を行うことにより、特徴部分(有意である小さな波形部分)をも見い出すと共に、結果として、音声を聞く対象である人間が心地よく聞き得るようにする対数データD11を算出し、続くステップSP7に移って対数データ算出処理手順を終了する。
【0056】
このようにして、スペクトル処理部11は対数データ算出方法の対数データ算出処理手順によって、入力オーディオデータD10で表される信号波形の特徴を一段と見い出した対数データD11を算出することができる。
次に、図1について上述した予測係数メモリ15に記憶するクラス毎の予測係数のセットを予め学習によって得るための学習回路について説明する。
【0057】
図6において、学習回路30は、高音質の教師オーディオデータD30を生徒信号生成フィルタ37に受ける。生徒信号生成フィルタ37は、間引き率設定信号D39により設定された間引き率で教師オーディオデータD30を所定時間ごとに所定サンプル間引くようになされている。
【0058】
この場合、生徒信号生成フィルタ37における間引き率によって、生成される予測係数が異なり、これに応じて上述のオーディオ信号処理装置10で再現されるオーディオデータも異なる。例えば、上述のオーディオ信号処理装置10においてサンプリング周波数を高くすることでオーディオデータの音質を向上しようとする場合、生徒信号生成フィルタ37ではサンプリング周波数を減らす間引き処理を行う。また、これに対して上述のオーディオ信号処理装置10において入力オーディオデータD10の欠落したデータサンプルを補うことで音質の向上を図る場合には、これに応じて、生徒信号生成フィルタ37ではデータサンプルを欠落させる間引き処理を行うようになされている。
【0059】
かくして、生徒信号生成フィルタ37は教師オーディオデータ30から所定の間引き処理により生徒オーディオデータD37を生成し、これをスペクトル処理部31及び予測演算部抽出部33にそれぞれ供給する。
【0060】
スペクトル処理部31は生徒信号生成フィルタ37から供給された生徒オーディオデータD37を所定時間毎の領域(この実施の形態の場合、例えば6サンプル毎とする)に分割した後、当該分割された各時間領域の波形について、図4について上述した対数データ算出方法による算出結果であってクラス分類しようとする対数データD31を算出し、これをクラス分類部34に供給する。
クラス分類部34は、スペクトル処理部31から供給された対数データD31について、当該対数データD31を圧縮して圧縮データパターンを生成するADRC回路部と、対数データD31の属するクラスコードを発生するクラスコード発生回路部とを有する。
【0061】
ADRC回路部は対数データD31に対して、例えば8ビットから2ビットに圧縮するような演算を行うことによりパターン圧縮データを形成する。このADRC回路部は、適応的量子化を行うものであり、ここでは、信号レベルの局所的なパターンを短い語長で効率的に表現することができるので、信号パターンのクラス分類のコード発生用に用いられる。
【0062】
具体的には、6つの8ビットのデータ(対数データ)をクラス分類しようとする場合、248という膨大な数のクラスに分類しなければならず、回路上の負担が多くなる。そこで、この実施の形態のクラス分類部34ではその内部に設けられたADRC回路部で生成されるパターン圧縮データに基づいてクラス分類を行う。例えば6つの対数データに対して1ビットの量子化を実行すると、6つの対数データを6ビットで表すことができ、26 =64クラスに分類することができる。
【0063】
ここで、ADRC回路部は、切り出された領域内のダイナミックレンジをDR、ビット割り当てをm、各対数データのデータレベルをL、量子化コードをQとして、上述の(1)式と同様の演算により、領域内の最大値MAXと最小値MINとの間を指定されたビット長で均等に分割して量子化を行う。かくしてスペクトル処理部31において算出された6つの対数データが、それぞれ例えば8ビット(m=8)で構成されているとすると、これらはADRC回路部においてそれぞれが2ビットに圧縮される。
【0064】
このようにして圧縮された対数データをそれぞれqn (n=1〜6)とすると、クラス分類部34に設けられたクラスコード発生回路部は、圧縮された対数データqn に基づいて、上述の(2)式と同様の演算を実行することにより、そのブロック(q1 〜q6 )が属するクラスを示すクラスコードclass を算出し、当該算出されたクラスコードclass を表すクラスコードデータD34を予測係数算出部36に供給する。因みに(2)式において、nは圧縮された対数データqn の数を表し、この実施の形態の場合n=6であり、またPはビット割り当てを表し、この実施の形態の場合P=2である。
【0065】
このようにして、クラス分類部34はスペクトル処理部31から供給された対数データD31のクラスコードデータD34を生成し、これを予測係数算出部36に供給する。また、予測係数算出部36には、クラスコードデータD34に対応した時間軸領域のオーディオ波形データD33(x1 、x2 、……、xn )が予測演算部抽出部33において切り出されて供給される。
【0066】
予測係数算出部36は、クラス分類部34から供給されたクラスコードclass と、各クラスコードclass 毎に切り出されたオーディオ波形データD33と、入力端TINから供給された高音質の教師オーディオデータD30とを用いて、正規方程式を立てる。
【0067】
すなわち、生徒オーディオデータD37のnサンプルのレベルをそれぞれx1 、x2 、……、xn として、それぞれにpビットのADRCを行った結果の量子化データをq1 、……、qn とする。このとき、この領域のクラスコードclass を上述の(2)式のように定義する。そして、上述のように生徒オーディオデータD37のレベルをそれぞれ、x1 、x2 、……、xn とし、高音質の教師オーディオデータD30のレベルをyとしたとき、クラスコード毎に、予測係数w1 、w2 、……、wn によるnタップの線形推定式を設定する。これを次式、
【0068】
【数8】
【0069】
とする。学習前は、Wn が未定係数である。
【0070】
学習回路30では、クラスコード毎に、複数のオーディオデータに対して学習を行う。データサンプル数がMの場合、上述の(8)式に従って、次式、
【0071】
【数9】
【0072】
が設定される。但しk=1、2、……Mである。
【0073】
M>nの場合、予測係数w1 、……wn は一意的に決まらないので、誤差ベクトルeの要素を次式、
【0074】
【数10】
【0075】
によって定義し(但し、k=1、2、……、M)、次式、
【0076】
【数11】
【0077】
を最小にする予測係数を求める。いわゆる、最小自乗法による解法である。
【0078】
ここで、(11)式によるwn の偏微分係数を求める。この場合、次式、
【0079】
【数12】
【0080】
を「0」にするように、各Wn (n=1〜6)を求めれば良い。
【0081】
そして、次式、
【0082】
【数13】
【0083】
【数14】
【0084】
のように、Xij、Yi を定義すると、(12)式は行列を用いて次式、
【0085】
【数15】
【0086】
として表される。
【0087】
この方程式は、一般に正規方程式と呼ばれている。なお、ここではn=6である。
【0088】
全ての学習用データ(教師オーディオデータD30、クラスコードclass 、オーディオ波形データD33)の入力が完了した後、予測係数算出部36は各クラスコードclass に上述の(15)式に示した正規方程式を立てて、この正規方程式を掃き出し法等の一般的な行列解法を用いて、各Wn について解き、各クラスコード毎に、予測係数を算出する。予測係数算出部36は、算出された各予測係数(D36)を予測係数メモリ15に書き込む。
【0089】
このような学習を行った結果、予測係数メモリ15には、量子化データq1 、……、q6 で規定されるパターン毎に、高音質のオーディオデータyを推定するための予測係数が、各クラスコード毎に格納される。この予測係数メモリ15は、図1について上述したオーディオ信号処理装置10において用いられる。かかる処理により、線形推定式に従って通常のオーディオデータから高音質のオーディオデータを作成するための予測係数の学習が終了する。
【0090】
このように、学習回路30は、オーディオ信号処理装置10において補間処理を行う程度を考慮して、生徒信号生成フィルタ37で高音質の教師オーディオデータの間引き処理を行うことにより、オーディオ信号処理装置10における補間処理のための予測係数を生成することができる。
【0091】
以上の構成において、オーディオ信号処理装置10は、入力オーディオデータD10に対して高速フーリエ変換を行うことにより、周波数軸上にパワースペクトルを算出する。周波数分析(高速フーリエ変換)は、時間軸波形データからでは知りえない微妙な違いを発見することが可能であることにより、オーディオ信号処理装置10は、時間軸領域に特徴を見い出せない微妙な特徴を見い出し得るようになる。
【0092】
微妙な特徴を見い出し得る状態(すなわち、パワースペクトルを算出した状態)において、オーディオ信号処理装置10は、選択範囲設定手段(ユーザが入力手段18から手動で行う選択設定)に応じて、有意とされるパワースペクトルデータのみを抽出(すなわち、N/2−m個)する。
【0093】
これによりオーディオ信号処理装置10は、処理負担を一段と軽減することができ、かつ処理速度を向上させることができる。
【0094】
このように、オーディオ信号処理装置10は、周波数分析を行うことにより、微妙な特徴を見い出し得るようになされたパワースペクトルデータを算出し、さらに算出したパワースペクトルデータから有意とされるパワースペクトルデータのみを抽出する。従ってオーディオ信号処理装置10は、必要最低限の有意なパワースペクトルデータのみを抽出したことになり、当該抽出したパワースペクトルデータに基づいて、そのクラスを特定する。
【0095】
そしてオーディオ信号処理装置10は、抽出した有意なパワースペクトルデータに基づいて特定したクラスに基づく予測係数を用いて入力オーディオデータD10を予測演算することにより、当該入力オーディオデータD10を一段と高音質のオーディオデータD16に変換することができる。
【0096】
また、クラス毎の予測係数を生成する学習時において、位相の異なる多数の教師オーディオデータについてそれぞれに対応した予測係数を求めておくことにより、オーディオ信号処理装置10における入力オーディオデータD10のクラス分類適応処理時に位相変動が生じても、位相変動に対応した処理を行うことができる。
【0097】
以上の構成によれば、周波数分析を行うことにより、微妙な特徴を見い出し得るようになされたパワースペクトルデータから有意とされるパワースペクトルデータのみを抽出し、これをクラス分類した結果に基づく予測係数を用いて入力オーディオデータD10を予測演算するようにしたことにより、入力オーディオデータD10を一段と高音質のオーディオデータD16に変換することができる。
【0098】
なお上述の実施の形態においては、窓関数としてハミング窓を用いて乗算する場合について述べたが、本発明はこれに限らず、ハミング窓に代えて、例えばハニング窓やブラックマン窓等、他の種々の窓関数によって乗算する、又はスペクトル処理部において予め各種窓関数(ハミング窓、ハニング窓及びブラックマン窓等)を用いて乗算し得るようにしておき、入力されるディジタルオーディオ信号の周波数特性に応じて、スペクトル処理部が所望の窓関数を用いて乗算するようにしても良い。
【0099】
因みに、スペクトル処理部がハニング窓を用いて乗算する場合、スペクトル処理部は、切り出し部から供給されたクラスタップに対して、次式、
【0100】
【数16】
【0101】
からなるハニング窓を乗算して乗算データを算出する。
【0102】
また、スペクトル処理部がブラックマン窓を使用して乗算する場合、スペクトル処理部は、切り出し部から供給されたクラスタップに対して、次式、
【0103】
【数17】
【0104】
からなるブラックマン窓を乗算して乗算データを算出する。
【0105】
また上述の実施の形態においては、高速フーリエ変換を用いる場合について述べたが、本発明はこれに限らず、例えば離散フーリエ変換(DFT:Discrete Fourier Transformer)や離散コサイン変換(DCT:Discrete Cosine Transform )又は最大エントロピー法、さらには線形予測分析による方法等、他の種々の周波数分析手段を適用することができる。
【0106】
さらに上述の実施の形態においては、スペクトル処理部11がゼロ値からN/2までの左側のパワースペクトルデータ群AR1(図5)のみを抽出対象とする場合について述べたが、本発明はこれに限らず、右側のパワースペクトルデータ群AR2(図5)のみを抽出対象とするようにしても良い。
【0107】
この場合、オーディオ信号処理装置10の処理負担を一段と軽減することができ、処理速度を一段と向上させることができる。
【0108】
さらに上述の実施の形態においては、圧縮データパターンを生成するパターン生成手段として、ADRCを行う場合について述べたが、本発明はこれに限らず、例えば可逆符号化(DPCM:Differential Pulse Code Modulation)やベクトル量子化(VQ:Vector Quantize )等の圧縮手段を用いるようにしても良い。要は、信号波形のパターンを少ないクラスで表現し得るような圧縮手段であれば良い。
【0109】
さらに上述の実施の形態においては、ユーザが手動で選択操作し得る選択範囲設定手段として、人間の声及び音声を選択(すなわち、抽出する周波数成分として500Hz〜4kHz又は20Hz〜20kHz)する場合について述べたが、本発明はこれに限らず、例えば図7に示すように、高域(UPP)、中域(MID)及び低域(LOW)のいづれかの周波数成分を選択する、又は図8に示すように、まばらに周波数成分を選択する、さらには図9に示すように、不均一に帯域を周波数成分する等、他の種々の選択範囲設定手段を適用し得る。
【0110】
この場合、オーディオ信号処理装置には、新たに設けられた選択範囲設定手段に対応するプログラムを作成してハードディスクドライブやROM等、所定の記憶手段に格納させる。これにより、ユーザが手動で入力手段18を介して新たに設けられた選択範囲設定手段を選択操作した場合においても、このとき選択された選択範囲設定手段に応じた制御データが入力手段からスペクトル処理部に出力され、これによりスペクトル処理部は、新たに設けられた選択範囲設定手段に対応するプログラムによって、所望の周波数成分からパワースペクトルデータの抽出を行う。
【0111】
このようにすれば、他の種々の選択範囲設定手段を適用することができ、ユーザの意図に応じた有意なパワースペクトルデータを抽出することができる。
【0112】
さらに上述の実施の形態においては、オーディオ信号処理装置10(図2)がプログラムによってクラスコード生成処理手順を実行する場合について述べたが、本発明はこれに限らず、ハードウェア構成によってこれらの機能を実現して種々のディジタル信号処理装置(例えば、レートコンバータ、オーバーサンプリング処理装置、BS(Broadcasting Satellite)放送等に用いられているPCM(Pulse Code Modulation) ディジタル音声エラー訂正を行うPCMエラー修正装置等)内に設けたり、又は各機能を実現するプログラムを格納したプログラム格納媒体(フロッピーディスク、光ディスク等)からこれらのプログラムを種々のディジタル信号処理装置にロードして各機能部を実現するようにしても良い。
【0113】
【発明の効果】
上述のように本発明によれば、ディジタルオーディオ信号からパワースペクトルデータを算出し、算出されたパワースペクトルデータから一部のパワースペクトルデータを抽出し、抽出された一部のパワースペクトルデータに基づいてそのクラスを分類し、分類されたクラスに対応した予測方式でディジタルオーディオ信号を変換するようにしたことにより、一段とディジタルオーディオ信号の特徴に適応した変換を行うことができ、かくして、ディジタルオーディオ信号の波形再現性を一段と向上した高音質のディジタルオーディオ信号への変換を行うことができる。
【図面の簡単な説明】
【図1】本発明によるオーディオ信号処理装置を示す機能ブロック図である。
【図2】本発明によるオーディオ信号処理装置を示すブロック図である。
【図3】オーディオデータの変換処理手順を示すフローチャートである。
【図4】対数データ算出処理手順を示すフローチャートである。
【図5】パワースペクトルデータ算出例を示す略線図である。
【図6】学習回路の構成を示すブロック図である。
【図7】パワースペクトルデータ選択例を示す略線図である。
【図8】パワースペクトルデータ選択例を示す略線図である。
【図9】パワースペクトルデータ選択例を示す略線図である。
【符号の説明】
10……オーディオ信号処理装置、11……スペクトル処理部、22……ROM、15……RAM、24……通信インターフェイス、25……ハードディスクドライブ、26……入力手段、27……データ入出力部、28……リムーバブルドライブ。
Claims (26)
- ディジタルオーディオ信号を単位領域ごとに切り出す切出ステップと、
上記単位領域のパワースペクトルデータを算出する周波数分析ステップと、
上記パワースペクトルデータから一部のパワースペクトルデータを抽出するスペクトルデータ抽出ステップと、
上記一部のパワースペクトルデータに基づいてそのクラスを分類するクラス分類ステップと、
分類されるクラスに対応付けられる係数と、上記単位領域との積和演算により上記ディジタルオーディオ信号を変換してなる新たなディジタルオーディオ信号を生成する予測演算ステップと
を有するディジタル信号処理方法。 - 上記周波数分析ステップでは、窓関数の各種演算処理方法が具えられ、
上記ディジタルオーディオ信号の周波数特性に応じて、所望の上記演算処理方法が用いられる
請求項1に記載のディジタル信号処理方法。 - 上記スペクトルデータ抽出ステップでは、
上記一部のパワースペクトルデータを抽出する際、直流成分のパワースペクトルデータが除かれる
請求項1に記載のディジタル信号処理方法。 - 上記予測演算ステップでは、
予め所望とするディジタルオーディオ信号に基づいて学習により生成されている予測係数が用いられる
請求項1に記載のディジタル信号処理方法。 - 上記パワースペクトルデータは、ほぼ左右対称の成分からなり、
上記スペクトルデータ抽出ステップでは、
上記パワースペクトルデータのうち、左右いづれかの成分が抽出対象とされる
請求項1に記載のディジタル信号処理方法。 - ディジタルオーディオ信号を単位領域ごとに切り出す切出手段と、
上記単位領域のパワースペクトルデータを算出する周波数分析手段と、
上記パワースペクトルデータから一部のパワースペクトルデータを抽出するスペクトルデータ抽出手段と、
上記一部のパワースペクトルデータに基づいてそのクラスを分類するクラス分類手段と、
分類されるクラスに対応付けられる係数と、上記単位領域との積和演算により上記ディジタルオーディオ信号を変換してなる新たなディジタルオーディオ信号を生成する予測演算手段と
を有するディジタル信号処理装置。 - 上記周波数分析手段は、窓関数の各種演算処理手段を具え、
上記ディジタルオーディオ信号の周波数特性に応じて、所望の上記演算処理手段を用いる
請求項6に記載のディジタル信号処理装置。 - 上記スペクトルデータ抽出手段は、
上記一部のパワースペクトルデータを抽出する際、直流成分のパワースペクトルデータを除く
請求項6に記載のディジタル信号処理装置。 - 上記予測演算手段は、
予め所望とするディジタルオーディオ信号に基づいて学習により生成されている予測係数を用いる
請求項6に記載のディジタル信号処理装置。 - 上記パワースペクトルデータは、ほぼ左右対称の成分からなり、
上記スペクトルデータ抽出手段は、
上記パワースペクトルデータのうち、左右いづれかの成分を抽出対象とする
請求項6に記載のディジタル信号処理装置。 - ディジタルオーディオ信号を単位領域ごとに切り出す切出ステップと、
上記単位領域のパワースペクトルデータを算出する周波数分析ステップと、
上記パワースペクトルデータから一部のパワースペクトルデータを抽出するスペクトルデータ抽出ステップと、
上記一部のパワースペクトルデータに基づいてそのクラスを分類するクラス分類ステップと、
分類されるクラスに対応付けられる係数と、上記単位領域との積和演算により上記ディジタルオーディオ信号を変換してなる新たなディジタルオーディオ信号を生成する予測ステップと
を実行させるためのプログラムを記録したコンピュータ読取可能なプログラム格納媒体。 - 上記周波数分析ステップでは、窓関数の各種演算処理方法が具えられ、
上記ディジタルオーディオ信号の周波数特性に応じて、所望の上記演算処理方法が用いられる
請求項11に記載のプログラム格納媒体。 - 上記スペクトルデータ抽出ステップでは、
上記一部のパワースペクトルデータを抽出する際、直流成分のパワースペクトルデータが除かれる
請求項11に記載のプログラム格納媒体。 - 上記パワースペクトルデータは、ほぼ左右対称の成分からなり、
上記スペクトルデータ抽出ステップでは、
上記パワースペクトルデータのうち、左右いづれかの成分が抽出対象とされる
請求項11に記載のプログラム格納媒体。 - 所望とするディジタルオーディオ信号から当該ディジタルオーディオ信号を劣化させた生徒ディジタルオーディオ信号を生成する生徒ディジタルオーディオ信号生成ステップと、
上記生徒ディジタルオーディオ信号からパワースペクトルデータを算出する周波数分析ステップと、
上記パワースペクトルデータから一部のパワースペクトルデータを抽出するスペクトルデータ抽出ステップと、
上記一部のパワースペクトルデータに基づいてそのクラスを分類するクラス分類ステップと、
上記ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号とに基づいて上記クラスに対応する予測係数を算出する予測係数算出ステップと
を有する学習方法。 - 上記周波数分析ステップでは、窓関数の各種演算処理方法が具えられ、
上記ディジタルオーディオ信号の周波数特性に応じて、所望の上記演算処理方法が用いられる
請求項15に記載の学習方法。 - 上記スペクトルデータ抽出ステップでは、
上記一部のパワースペクトルデータを抽出する際、直流成分のパワースペクトルデータが除かれる
請求項15に記載の学習方法。 - 上記パワースペクトルデータは、ほぼ左右対称の成分からなり、
上記スペクトルデータ抽出ステップでは、
上記パワースペクトルデータのうち、左右いづれかの成分が抽出対象とされる
請求項15に記載の学習方法。 - 所望とするディジタルオーディオ信号から当該ディジタルオーディオ信号を劣化させた生徒ディジタルオーディオ信号を生成する生徒ディジタルオーディオ信号生成手段と、
上記生徒ディジタルオーディオ信号からパワースペクトルデータを算出する周波数分析手段と、
上記パワースペクトルデータから一部のパワースペクトルデータを抽出するスペクトルデータ抽出手段と、
上記一部のパワースペクトルデータに基づいてそのクラスを分類するクラス分類手段と、
上記ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号とに基づいて上記クラスに対応する予測係数を算出する予測係数算出手段と
を有する学習装置。 - 上記周波数分析手段は、窓関数の各種演算処理手段を具え、
上記ディジタルオーディオ信号の周波数特性に応じて、所望の上記演算処理手段を用いる
請求項19に記載の学習装置。 - 上記スペクトルデータ抽出手段は、
上記一部のパワースペクトルデータを抽出する際、直流成分のパワースペクトルデータを除く
請求項19に記載の学習装置。 - 上記パワースペクトルデータは、ほぼ左右対称の成分からなり、
上記スペクトルデータ抽出手段は、
上記パワースペクトルデータのうち、左右いづれかの成分を抽出対象とする
請求項19に記載の学習装置。 - 所望とするディジタルオーディオ信号から当該ディジタルオーディオ信号を劣化させた生徒ディジタルオーディオ信号を生成する生徒ディジタルオーディオ信号生成ステップと、
上記生徒ディジタルオーディオ信号からパワースペクトルデータを算出する周波数分析ステップと、
上記パワースペクトルデータから一部のパワースペクトルデータを抽出するスペクトルデータ抽出ステップと、
上記一部のパワースペクトルデータに基づいてそのクラスを分類するクラス分類ステップと、
上記ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号とに基づいて上記クラスに対応する予測係数を算出する予測係数算出ステップと
を実行させるためのプログラムを記録したコンピュータ読取可能なプログラム格納媒体。 - 上記周波数分析ステップでは、窓関数の各種演算処理方法が具えられ、
上記ディジタルオーディオ信号の周波数特性に応じて、所望の上記演算処理方法が用いられる
請求項23に記載のプログラム格納媒体。 - 上記スペクトルデータ抽出ステップでは、
上記一部のパワースペクトルデータを抽出する際、直流成分のパワースペクトルデータが除かれる
請求項23に記載のプログラム格納媒体。 - 上記パワースペクトルデータは、ほぼ左右対称の成分からなり、
上記スペクトルデータ抽出ステップでは、
上記パワースペクトルデータのうち、左右いづれかの成分が抽出対象とされる
請求項23に記載のプログラム格納媒体。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000238897A JP4538705B2 (ja) | 2000-08-02 | 2000-08-02 | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
PCT/JP2001/006594 WO2002013181A1 (fr) | 2000-08-02 | 2001-07-31 | Procede de traitement de signaux numeriques, procede d'apprentissage, appareils associes, et support de stockage de programmes |
US10/089,463 US6907413B2 (en) | 2000-08-02 | 2001-07-31 | Digital signal processing method, learning method, apparatuses for them, and program storage medium |
US11/074,420 US6990475B2 (en) | 2000-08-02 | 2005-03-08 | Digital signal processing method, learning method, apparatus thereof and program storage medium |
US11/074,432 US20050177257A1 (en) | 2000-08-02 | 2005-03-08 | Digital signal processing method, learning method, apparatuses thereof and program storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000238897A JP4538705B2 (ja) | 2000-08-02 | 2000-08-02 | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002049398A JP2002049398A (ja) | 2002-02-15 |
JP4538705B2 true JP4538705B2 (ja) | 2010-09-08 |
Family
ID=18730528
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000238897A Expired - Fee Related JP4538705B2 (ja) | 2000-08-02 | 2000-08-02 | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
Country Status (3)
Country | Link |
---|---|
US (3) | US6907413B2 (ja) |
JP (1) | JP4538705B2 (ja) |
WO (1) | WO2002013181A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4596196B2 (ja) * | 2000-08-02 | 2010-12-08 | ソニー株式会社 | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
JP4857467B2 (ja) * | 2001-01-25 | 2012-01-18 | ソニー株式会社 | データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体 |
JP3879922B2 (ja) * | 2002-09-12 | 2007-02-14 | ソニー株式会社 | 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム |
JP4598877B2 (ja) * | 2007-12-04 | 2010-12-15 | 日本電信電話株式会社 | 符号化方法、この方法を用いた装置、プログラム、記録媒体 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09231374A (ja) * | 1996-02-26 | 1997-09-05 | Sony Corp | 動きベクトル検出装置および検出方法 |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57144600A (en) * | 1981-03-03 | 1982-09-07 | Nippon Electric Co | Voice synthesizer |
US4720802A (en) * | 1983-07-26 | 1988-01-19 | Lear Siegler | Noise compensation arrangement |
JPS60195600A (ja) * | 1984-03-19 | 1985-10-04 | 三洋電機株式会社 | パラメ−タ内插方法 |
JP3033159B2 (ja) * | 1990-08-31 | 2000-04-17 | ソニー株式会社 | 可変長符号化のビット長推定回路 |
JP3297751B2 (ja) | 1992-03-18 | 2002-07-02 | ソニー株式会社 | データ数変換方法、符号化装置及び復号化装置 |
JP2747956B2 (ja) * | 1992-05-20 | 1998-05-06 | 国際電気株式会社 | 音声復号装置 |
US5586215A (en) * | 1992-05-26 | 1996-12-17 | Ricoh Corporation | Neural network acoustic and visual speech recognition system |
JPH0651800A (ja) * | 1992-07-30 | 1994-02-25 | Sony Corp | データ数変換方法 |
US5579431A (en) * | 1992-10-05 | 1996-11-26 | Panasonic Technologies, Inc. | Speech detection in presence of noise by determining variance over time of frequency band limited energy |
JP3511645B2 (ja) | 1993-08-30 | 2004-03-29 | ソニー株式会社 | 画像処理装置及び画像処理方法 |
JP3400055B2 (ja) | 1993-12-25 | 2003-04-28 | ソニー株式会社 | 画像情報変換装置及び画像情報変換方法並びに画像処理装置及び画像処理方法 |
US5555465A (en) * | 1994-05-28 | 1996-09-10 | Sony Corporation | Digital signal processing apparatus and method for processing impulse and flat components separately |
JP3693187B2 (ja) | 1995-03-31 | 2005-09-07 | ソニー株式会社 | 信号変換装置及び信号変換方法 |
US5712953A (en) * | 1995-06-28 | 1998-01-27 | Electronic Data Systems Corporation | System and method for classification of audio or audio/video signals based on musical content |
JPH0993135A (ja) * | 1995-09-26 | 1997-04-04 | Victor Co Of Japan Ltd | 発声音データの符号化装置及び復号化装置 |
JPH10124092A (ja) * | 1996-10-23 | 1998-05-15 | Sony Corp | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 |
US5903866A (en) | 1997-03-10 | 1999-05-11 | Lucent Technologies Inc. | Waveform interpolation speech coding using splines |
JP4062771B2 (ja) * | 1997-05-06 | 2008-03-19 | ソニー株式会社 | 画像変換装置および方法、並びに記録媒体 |
EP0912045B1 (en) | 1997-05-06 | 2007-10-10 | Sony Corporation | Image converter and image conversion method |
JP3946812B2 (ja) * | 1997-05-12 | 2007-07-18 | ソニー株式会社 | オーディオ信号変換装置及びオーディオ信号変換方法 |
US5924066A (en) * | 1997-09-26 | 1999-07-13 | U S West, Inc. | System and method for classifying a speech signal |
DE19747132C2 (de) * | 1997-10-24 | 2002-11-28 | Fraunhofer Ges Forschung | Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms |
JP3584458B2 (ja) * | 1997-10-31 | 2004-11-04 | ソニー株式会社 | パターン認識装置およびパターン認識方法 |
JPH11215006A (ja) * | 1998-01-29 | 1999-08-06 | Olympus Optical Co Ltd | ディジタル音声信号の送信装置及び受信装置 |
JP4139979B2 (ja) * | 1998-06-19 | 2008-08-27 | ソニー株式会社 | 画像変換装置および方法、並びに記録媒体 |
JP4035895B2 (ja) * | 1998-07-10 | 2008-01-23 | ソニー株式会社 | 画像変換装置および方法、並びに記録媒体 |
US6480822B2 (en) * | 1998-08-24 | 2002-11-12 | Conexant Systems, Inc. | Low complexity random codebook structure |
US7092881B1 (en) * | 1999-07-26 | 2006-08-15 | Lucent Technologies Inc. | Parametric speech codec for representing synthetic speech in the presence of background noise |
US6519559B1 (en) * | 1999-07-29 | 2003-02-11 | Intel Corporation | Apparatus and method for the enhancement of signals |
US6463415B2 (en) * | 1999-08-31 | 2002-10-08 | Accenture Llp | 69voice authentication system and method for regulating border crossing |
JP4645868B2 (ja) | 2000-08-02 | 2011-03-09 | ソニー株式会社 | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
JP4645866B2 (ja) | 2000-08-02 | 2011-03-09 | ソニー株式会社 | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
JP4596196B2 (ja) | 2000-08-02 | 2010-12-08 | ソニー株式会社 | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
JP4596197B2 (ja) | 2000-08-02 | 2010-12-08 | ソニー株式会社 | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
JP4645867B2 (ja) | 2000-08-02 | 2011-03-09 | ソニー株式会社 | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
JP4538704B2 (ja) | 2000-08-02 | 2010-09-08 | ソニー株式会社 | ディジタル信号処理方法及びディジタル信号処理装置並びにプログラム格納媒体 |
-
2000
- 2000-08-02 JP JP2000238897A patent/JP4538705B2/ja not_active Expired - Fee Related
-
2001
- 2001-07-31 US US10/089,463 patent/US6907413B2/en not_active Expired - Fee Related
- 2001-07-31 WO PCT/JP2001/006594 patent/WO2002013181A1/ja active Application Filing
-
2005
- 2005-03-08 US US11/074,420 patent/US6990475B2/en not_active Expired - Fee Related
- 2005-03-08 US US11/074,432 patent/US20050177257A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09231374A (ja) * | 1996-02-26 | 1997-09-05 | Sony Corp | 動きベクトル検出装置および検出方法 |
Also Published As
Publication number | Publication date |
---|---|
US6907413B2 (en) | 2005-06-14 |
US20020184175A1 (en) | 2002-12-05 |
US6990475B2 (en) | 2006-01-24 |
US20050154480A1 (en) | 2005-07-14 |
US20050177257A1 (en) | 2005-08-11 |
JP2002049398A (ja) | 2002-02-15 |
WO2002013181A1 (fr) | 2002-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3881943B2 (ja) | 音響符号化装置及び音響符号化方法 | |
RU2555221C2 (ru) | Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой | |
US8666733B2 (en) | Audio signal compression and decoding using band division and polynomial approximation | |
EP2030199A1 (en) | Linear predictive coding of an audio signal | |
WO2006054583A1 (ja) | オーディオ信号符号化装置および方法 | |
JP2002041089A (ja) | 周波数補間装置、周波数補間方法及び記録媒体 | |
JP2001343997A (ja) | デジタル音響信号符号化装置、方法及び記録媒体 | |
JP2004198485A (ja) | 音響符号化信号復号化装置及び音響符号化信号復号化プログラム | |
JP4645869B2 (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
JP4596197B2 (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
JP4596196B2 (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
JP4538705B2 (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
JP4359949B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP3472279B2 (ja) | 音声符号化パラメータ符号化方法及び装置 | |
CN1198397C (zh) | 解码器、解码方法 | |
JP2002041098A (ja) | 周波数間引き装置、周波数間引き方法及び記録媒体 | |
JP2001184090A (ja) | 信号符号化装置,及び信号復号化装置,並びに信号符号化プログラムを記録したコンピュータ読み取り可能な記録媒体,及び信号復号化プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4645867B2 (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
JP4645866B2 (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
JP4645868B2 (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
JP4618823B2 (ja) | 信号符号化装置及び方法 | |
JP2003216199A (ja) | 復号装置、復号方法及びプログラム供給媒体 | |
JPH0651800A (ja) | データ数変換方法 | |
JP3510493B2 (ja) | 音声信号の符号/復号方法及びそのプログラムを記録した記録媒体 | |
JP4024784B2 (ja) | オーディオ復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100223 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100527 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100609 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130702 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |