JP4520922B2 - データ形式判別方法、装置、プログラム、および記録媒体 - Google Patents

データ形式判別方法、装置、プログラム、および記録媒体 Download PDF

Info

Publication number
JP4520922B2
JP4520922B2 JP2005266870A JP2005266870A JP4520922B2 JP 4520922 B2 JP4520922 B2 JP 4520922B2 JP 2005266870 A JP2005266870 A JP 2005266870A JP 2005266870 A JP2005266870 A JP 2005266870A JP 4520922 B2 JP4520922 B2 JP 4520922B2
Authority
JP
Japan
Prior art keywords
data
input digital
digital data
value
data format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005266870A
Other languages
English (en)
Other versions
JP2007079127A (ja
Inventor
健弘 守谷
登 原田
優 鎌本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005266870A priority Critical patent/JP4520922B2/ja
Publication of JP2007079127A publication Critical patent/JP2007079127A/ja
Application granted granted Critical
Publication of JP4520922B2 publication Critical patent/JP4520922B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

デジタルデータ中に音響データが含まれているかを判定する方法、装置、プログラム、および記録媒体に関する。
歪のない圧縮符号化としては、多くの提案がある。たとえば、文章やプログラムなどのテキストデータでは、ZIPという汎用的な圧縮符号化方法が良く使われる。一方、音楽信号などの歪のない圧縮符号化方法としては、たとえば特許文献1などがある。この方法の場合、ZIPより、はるかに効果的に圧縮できる。
圧縮しようとするデジタルデータを格納しているファイルに、統一的な拡張子が付されている場合は、テキストデータであるか音響データを含むものであるかは、その拡張子を見て判断できる。しかし、圧縮しようとするデジタルデータに拡張子が付されていない場合や、正しい拡張子が付されていない場合もあり、テキストデータであるか音響データを含むものであるかが分からないことも多い。このような場合に、効率良い圧縮符号化方法を選択して圧縮することができないため、特に音響データを含むデータを効率よく圧縮できていない。
つまり、デジタルデータが音響データを含むものであるか否かを判別できれば、効率的に圧縮できる。しかし、従来技術では、そのような判定技術はなかった。
特開2005−115267号公報
従来技術では、圧縮しようとするデジタルデータが格納されたファイルの拡張子を見て音響データを含むか否かを判定することは可能である。しかし、拡張子が付されていない場合は、デジタルデータが音響データを含むか否かを判定することはできない。その結果、音響データが保有する特徴を利用した符号化ができないため、符号化の効率が大幅に悪くなる。これはアナログ波形データをサンプリングして得られたデジタル波形データの場合でも同じである。本発明の目的は、入力されたデジタルデータが音響データ等の波形データを含むか否かを判別することにある。
本発明では、入力されたデジタルデータが既知の1つまたは複数のデータ形式の波形データのサンプル値列であるとして、その波形データらしさを、サンプル値列内のサンプル値間の関係を用いて求める。求めた1つまたは複数の波形データらしさの中に、あらかじめ設定された条件を満足するものがある場合には、入力されたデジタルデータが波形データを含むと判別し、前記条件を満足するものがない場合には、入力されたデジタルデータは波形データを含まないと判別する
本発明によれば、入力されたデジタルデータに波形データが含まれているか分からない場合にも、入力されたデジタルデータの波形データらしさを判断することで、入力されたデジタルデータが波形データを含むか否かを判別することができる。さらに、波形データを含むと判別された場合には、波形データとしてのデータ形式も予測できるので、どのような波形データ形式で符号化すればよいかも判定できる。したがって、効率的な符号化が期待できる。
以下では、最も代表的なアナログ波形データである音響データに本発明を適用した実施形態を説明する。説明の重複を避けるため同じ機能を有する構成部や同じ処理を行う処理ステップには同一の番号を付与し、説明を省略する。
[第1実施形態]
本発明の音響データ形式判別装置の機能構成例を図1に示す。また、音響データ形式判別装置100の処理フローを図2に示す。データ形式判別装置100は、データ記録部110、指標判定部120、データ形式判別部130から構成される。また、指標判定部120は、格納形式記録部121、指標計算部124から構成される。データ形式判別部130は、指標比較部131を備えている。
入力されたデジタルデータは、まずデータ記録部110に記録される(S110)。指標判定部120は、以下のように、入力されたデジタルデータをあらかじめ設定された形式の音響データであると仮定して、音響データらしさの判定を行い、各データ形式での音響データらしさの指標の値を出力する(S124)。まず、指標判定部120の指標計算部124は、格納形式記録部121にあらかじめ設定された1つまたは複数の音響データ用のデータ形式の中から、データ形式を順次選択する。次に、それぞれのデータ形式であるとした場合のサンプル値列内のサンプル値間の関係を用いて、入力されたデジタルデータに対して、それぞれのデータ形式であると想定した場合の音響データらしさを評価する。そして、各データ形式での音響データらしさの指標の値を出力する(S124)。ここで、あらかじめ設定されたデータ形式とは、複数種類の1サンプルあたりのビット数、整数表現であるか浮動小数点表現であるか、複数種類のサンプルごとのバイト格納順、複数種類のチャネル数などである。評価に用いるデジタルデータは入力されたもの全てであっても良いし、一部であっても良い。一部を用いる場合は、例えばデジタルデータの先頭の数千サンプル〜数万サンプルを用いればよい。音響データらしさの評価であれば、数千サンプル分で構成されるフレームごとに行う。
具体的には、音響データらしさの指標として、次式を用いて評価する。
Figure 0004520922
ただし、pはあらかじめ定めた正の整数、k(i=1〜p)はPARCOR係数。
Fは、p次の予測の場合の予測残差のエネルギーに対する入力信号のエネルギーの比を近似するものである。Fの値が大きい方が、音響データらしいと言え、入力されたデジタルデータを圧縮する場合は、音響データ用の符号化手段を用いることで高い圧縮効果が期待できる。なお、例えば、フレーム単位に音響データらしさの指標を計算する場合に、想定したデータ形式でのサンプル値列が複数フレーム分ある場合には、データ形式ごと、フレームごとの複数の指標の値が求まることになる。このように同じデータ形式で複数の指標の値がある場合には、それらの中の最大の値、すなわち最も音響データらしい指標の値を、当該データ形式でのサンプル値列に対する指標の値とする。
データ形式判別部130は、各データ形式に対応する音響データらしさの指標(F)の値を比較し、最大の指標を与えるデータ形式、すなわち最も音響データらしいと判断されたデータ形式と、その形式での音響データらしさの指標(F)の値を得る。(S130)。また、データ形式判別部130の指標比較部131は、当該音響データらしさの指標(F)と閾値とを比較し、音響データらしいか否かを判断する(S131)。後述の実験例で説明するが、例えばFの値が1000以上の場合を音響データらしいと判断する。ステップS131がYesの場合には、データ形式判別部130は、音響データを含むと判別し、その旨と音響データのデータ形式を出力する(S141)。またステップS131がNoの場合には、データ形式判別部130は、音響データを含まないと判別し、その旨を出力する(S142)。なお、あらかじめ設定するデータ形式を1つとした場合は、ステップS124では順次データ形式を選択するのではなく、当該1つのデータ形式だけでの音響データらしさを求めればよい。また、ステップS130を行う必要がない。
このようにデータ形式を判別することで、入力されたデジタルデータに音響データが含まれるのか、および音響データが含まれる場合にはそのデータ形式を推定することができる。
[変形例1]
第1実施形態では、音響データらしさを示す指標としてFを用いたが、周波数領域に変換する符号化の場合には、次式を用いて評価することもできる。
Figure 0004520922
ただし、Mはあらかじめ定めた正の整数、Y(j=0〜M−1)はj番目の周波数領域係数の2乗値。
Eは、パワースペクトルに相当する係数の2乗値の相加平均の比である。係数値がjによらず一定であればE=1という最低値となる。この場合、入力されたデジタル音響データをそのデータ形式とした場合のサンプル値列は乱数であり、そのデータ形式では音響データらしいとは言えない。従って、入力されたデジタルデータを圧縮する場合に、音響データに特化した圧縮方法を利用しても、圧縮は期待できない。一方、係数の2乗値の変動が大きければEは大きな値となる。周波数領域の係数(スペクトル)の値に大きな変動があるということで、音響データらしいと言える。従って、入力されたデジタルデータを圧縮する場合に、音響データに特化した圧縮方法を利用すれば、圧縮後のデータ量を少なくできる。つまり、高い圧縮効果が期待できる。また、これはサンプル値間の相関が強いことも意味している。
したがって、この方法によっても、入力されたデジタルデータが音響データであるか否かを推定することができる。
[変形例2]
音響データらしさを示す指標として、エネルギー/Fまたはエネルギー/Eを用いることもできる。エネルギー/Fまたはエネルギー/Eは、予測誤差のエネルギーの近似に相当し、これらの値が小さいほど音響データらしいと判断できる。したがって、この指標を用いる場合には、データ形式判別部130は、各データ形式に対応する指標(エネルギー/Fまたはエネルギー/E)の値を比較し、値が最も小さいデータ形式とその指標の値を得る(S130)。データ形式判別部130の指標比較部131は、当該音響データらしさの指標(エネルギー/Fまたはエネルギー/E)と閾値とを比較し、閾値より小さい場合に音響データらしいと判断し、そうでない場合は音響データらしくないと判断する(S131)。
[変形例3]
第1実施形態および変形例1、2では、ステップS131で単純に閾値との比較による判断をしていた。しかし、入力信号のデータ形式が1バイトか2バイト以上かによって、もしくはサンプル値列を波形の振幅とした場合のエネルギーの大きさによって、音響データが含まれるか否かの判断が変わる場合もある。そこで、本変形例では、データ形式判別部130の処理を変更した例を示す。
図3に本変形例でのデータ形式判別装置100の処理フローを示す。この処理フローでは、図6のステップS131の代わりに、ステップS132〜S136が実行される。以下にステップS132〜S136について説明する。データ形式判別部103は、入力信号のデータ形式が1バイト単位であると判別されたかを確認する(S132)。ステップS132がNoの場合には、データ形式判別部103は、サンプル値列を波形の振幅とした場合のエネルギーを計算し(S133)、エネルギーが閾値よりも小さいかを確認する(S134)。閾値としては、例えば最大振幅でのエネルギーの1/100とする方法などがある。ステップS134がYesの場合には、ステップS241に進む。また、ステップS134がNoの場合には、指標比較部131が、音響データらしさを示す指標が閾値より音響データらしいかを比較する(S135)。このステップでの、音響データらしさを示す指標であるFやEに対する閾値は、100程度とすれば良い。ステップS135がYesの場合にはステップS241へ進み、Noの場合にはステップS242へ進む。ステップS132がYesの場合には、指標比較部131が、音響データらしさを示す指標が閾値より音響データらしいかを比較する(S136)。このステップは第1実施形態(図2)のステップS131と同じである。
このように、バイト数やエネルギーの違いによって、音響データが含まれているか否かを細かく判断するため、より精度の高い判別が期待できる。
[第2実施形態]
図4に本実施形態の符号化装置の機能構成例を示す。また、図5に符号化装置200の処理フローを示す。符号化装置200は、データ記録部110、指標判定部120、データ形式判別部130、符号化部240から構成される。また、符号化部240は、音響信号用の符号化手段である音響信号符号化部241とZIPなどの汎用的な符号化手段である非音響信号符号化部を備えている。図4と図1との比較からも分かるように、図4の符号化装置200は、図1の音響データ形式判別装置100に符号化部240を付加した構成となっている。
図5の処理フローも、図2の処理フローにステップS241とS242が付加された処理フローである。ステップS241では、音響信号符号化部241が、データ形式判別部130が判別した音響データのデータ形式にしたがって、データ記録部110に記録されたデジタルデータを符号化する。したがって、音響信号符号化部241には、複数の音響データのデータ形式に対応できる符号化手段が備えられている必要がある。つまり指標計算部124で音響データらしさの指標を計算するとき(ステップS124)に用いるデータ形式は、音響信号符号化部241で対応できる符号化方法の範囲内に限られる。ステップS242では、非音響信号符号化部242が、ZIPなどの汎用的な符号化手段によりデータ記録部110に記録されたデジタルデータを符号化する。
このように、本実施形態では、入力されたデジタルデータを、音響データが含まれる場合には最も音響データらしいと判定されたデータ形式であるとして符号化し、音響データが含まれない場合には汎用的な符号化手段で符号化できるので、高い圧縮効率が期待できる。
[変形例]
第2実施形態では、ステップS131で単純に閾値との比較による判断をしていた。しかし、入力信号のデータ形式が1バイトか2バイト以上かによって、もしくはサンプル値列を波形の振幅とした場合のエネルギーの大きさによって、音響用の符号化手段を用いた方が良いか、非音響用の符号化手段を用いた方が良いかが変わる場合もある。そこで、本変形例では、データ形式判別部130の処理を変更した例を示す。
図6に本変形例での符号化装置200の処理フローを示す。図6の処理フローも、図3の処理フローにステップS241とS242が付加された処理フローである。したがって、図6と図3の違いは、図5(第2実施形態)と図2(第1実施形態)の違いと同じである。
このように、バイト数やエネルギーの違いによって、音響データが含まれているか否かを細かく判断するため、より精度の高い判別が期待できる。したがって、より効率の良い符号化が期待できる。
第1、第2実施形態では、入力データが音響信号をサンプリングして得られたデジタル音響データかもしれない場合について説明した。しかし、入力データがアナログ波形データをサンプリングして得たものかもしれない場合であれば、その他の時系列データ等であっても本発明を利用することができる。この場合、各実施形態の「音響データらしさの判定」を、「波形データらしさの判定」に変更するだけで、一般的な波形データに対して本発明が適用できる。
なお、上記の実施形態はコンピュータに、上記方法の各ステップを実行させるプログラムを読み込ませ、実施することもできる。また、コンピュータに読み込ませる方法としては、プログラムをコンピュータ読み取り可能な記録媒体に記録しておき、記録媒体からコンピュータに読み込ませる方法、サーバ等に記録されたプログラムを電気通信回線等を通じてコンピュータに読み込ませる方法などがある。
[実験例]
本発明の効果を評価するため、第1実施形態でのシミュレーション結果を以下に示す。シミュレーションの条件は次のとおりである。1つ目の入力信号は、2バイト/サンプル、2048サンプル/フレームのデータ量(175フレーム)、2チャネルの音響データである。あらかじめ設定したデータ形式は、チャネル数(1、2、3)である。2つ目の入力信号は、1バイト単位のテキストデータである。計算した指標は、エネルギー、F(p=1、2、3、20)である。また、Fを計算する際に仮定した音響データのデータ形式は、1つ目の入力のデータ形式と同じ(2バイト、2チャネル)としている。シミュレーションでは、入力信号の先頭の9フレームに対してエネルギーとFを計算した。たとえば、1つ目の入力信号では、チャネル数が2なので、第1チャネルの5フレーム分と第2チャネルの4フレーム分である。
1つ目の入力に対するシミュレーション結果を図7、2つ目の入力に対するシミュレーション結果を図8に示す。1つ目の入力の場合、最初の2つのフレームは音響データらしさの指標の値が小さいが、その他の値は大きい。特に、p=20の6フレーム目では、27608という大きな値となっている。それに対し、2つ目の入力の場合は、Fの値はどれも10以下であり、小さな値となっている。
また、1つ目の入力を音響データとして符号化した場合には30.90%に、ZIPにより符号化した場合は88.14%に圧縮できた。2つ目の入力を音響データとして符号化した場合は96.40%、ZIPにより符号化した場合は20.36%に圧縮できた。
したがって、音響データらしさの指標(F)を用いてデジタルデータを評価することにより、音響データが含まれているか否かの判断ができ、効率の良い符号化が期待できることが分かる。
なお、Fの値は、pを増加させると単調に増加する。また、Yを平滑化したパワースペクトルまたは微小な正の値を加えたパワースペクトルとしてEの値を計算すると、その値はpを大きくしたときのFの値と近似することが知られている。したがって、pが小さい値の場合でもチャネル数を3とするべきであることは分かるが、pを20程度の値にしたFやEもしくはエネルギー/Fやエネルギー/Eを指標とすることが望ましい。また、少なくともpを3以上とすべきである。
第1実施形態の音響データ形式判別部の機能構成例を示す図。 第1実施形態の音響データ形式判別部の処理フローを示す図。 第1実施形態の変形例3の音響データ形式判別部の処理フローを示す図。 第2実施形態の符号化装置の機能構成例を示す図。 第2実施形態の符号化装置の処理フローを示す図。 第2実施形態の変形例の符号化装置の処理フローを示す図。 音響データを入力とする場合のシミュレーション結果を示す図。 テキストデータを入力とする場合のシミュレーション結果を示す図。

Claims (10)

  1. 入力されたデジタルデータが音響データを含むか否かを判別するデータ形式判別方法であって、
    入力されたデジタルデータ中のサンプル値列について
    Figure 0004520922

    ただし、pはあらかじめ定めた正の整数、k (i=1〜p)はPARCOR係数、を求める指標計算ステップと、
    前記指標計算ステップで求めた前記Fの値があらかじめ設定された閾値以上である場合には入力されたデジタルデータが音響データを含むと判断し、前記Fの値が当該閾値より小さい場合には入力されたデジタルデータが音響データを含まないと判断するデータ形式判別ステップと
    を有することを特徴とするデータ形式判別方法。
  2. 入力されたデジタルデータが音響データを含むか否かを判別するデータ形式判別方法であって、
    入力されたデジタルデータ中のサンプル値列について
    Figure 0004520922

    ただし、Mはあらかじめ定めた正の整数、Y (j=0〜M−1)はj番目の周波数領域係数の2乗、を求める指標計算ステップと、
    前記指標計算ステップで求めた前記Eの値があらかじめ設定された閾値以上である場合には入力されたデジタルデータが音響データを含むと判断し、前記Eの値が当該閾値より小さい場合には入力されたデジタルデータが音響データを含まないと判断するデータ形式判別ステップと
    を有することを特徴とするデータ形式判別方法。
  3. 入力されたデジタルデータが音響データを含むか否かを判別するデータ形式判別方法であって、
    入力されたデジタルデータ中のサンプル値列について、エネルギー/F、ただし、
    Figure 0004520922

    、pはあらかじめ定めた正の整数、k (i=1〜p)はPARCOR係数、を求める指標計算ステップと、
    前記指標計算ステップで求めた前記エネルギー/Fの値があらかじめ設定された閾値より小さい場合には入力されたデジタルデータが音響データを含むと判断し、前記エネルギー/Fの値が当該閾値以上である場合には入力されたデジタルデータが音響データを含まないと判断するデータ形式判別ステップと
    を有することを特徴とするデータ形式判別方法。
  4. 入力されたデジタルデータが音響データを含むか否かを判別するデータ形式判別方法であって、
    入力されたデジタルデータ中のサンプル値列について、エネルギー/E、ただし、
    Figure 0004520922

    、Mはあらかじめ定めた正の整数、Y (j=0〜M−1)はj番目の周波数領域係数の2乗、を求める指標計算ステップと、
    前記指標計算ステップで求めた前記エネルギー/Eの値があらかじめ設定された閾値より小さい場合には入力されたデジタルデータが音響データを含むと判断し、前記エネルギー/Eの値が当該閾値以上である場合には入力されたデジタルデータが音響データを含まないと判断するデータ形式判別ステップと
    を有することを特徴とするデータ形式判別方法。
  5. 入力されたデジタルデータが音響データを含むか否かを判別するデータ形式判別装置であって、
    入力されたデジタルデータを記録するデータ記録部と、
    入力されたデジタルデータ中のサンプル値列について
    Figure 0004520922

    ただし、pはあらかじめ定めた正の整数、k (i=1〜p)はPARCOR係数、を求める指標計算部と、
    前記指標計算部で求めた前記Fの値があらかじめ設定された閾値以上である場合には入力されたデジタルデータが音響データを含むと判断し、前記Fの値が当該閾値より小さい場合には入力されたデジタルデータが音響データを含まないと判断するデータ形式判別部と
    を備えるデータ形式判別装置。
  6. 入力されたデジタルデータが音響データを含むか否かを判別するデータ形式判別装置であって、
    入力されたデジタルデータを記録するデータ記録部と、
    入力されたデジタルデータ中のサンプル値列について
    Figure 0004520922

    ただし、Mはあらかじめ定めた正の整数、Y (j=0〜M−1)はj番目の周波数領域係数の2乗、を求める指標計算部と、
    前記指標計算部で求めた前記Eの値があらかじめ設定された閾値以上である場合には入力されたデジタルデータが音響データを含むと判断し、前記Eの値が当該閾値より小さい場合には入力されたデジタルデータが音響データを含まないと判断するデータ形式判別部と
    を備えるデータ形式判別装置。
  7. 入力されたデジタルデータが音響データを含むか否かを判別するデータ形式判別装置であって、
    入力されたデジタルデータを記録するデータ記録部と、
    入力されたデジタルデータ中のサンプル値列について、エネルギー/F、ただし、
    Figure 0004520922

    、pはあらかじめ定めた正の整数、k (i=1〜p)はPARCOR係数、を求める指標計算部と、
    前記指標計算部で求めた前記エネルギー/Fの値があらかじめ設定された閾値より小さい場合には入力されたデジタルデータが音響データを含むと判断し、前記エネルギー/Fの値が当該閾値以上である場合には入力されたデジタルデータが音響データを含まないと判断するデータ形式判別部と
    を備えるデータ形式判別装置。
  8. 入力されたデジタルデータが音響データを含むか否かを判別するデータ形式判別装置であって、
    入力されたデジタルデータを記録するデータ記録部と、
    入力されたデジタルデータ中のサンプル値列について、エネルギー/E、ただし、
    Figure 0004520922

    、Mはあらかじめ定めた正の整数、Y (j=0〜M−1)はj番目の周波数領域係数の2乗、を求める指標計算部と、
    前記指標計算部で求めた前記エネルギー/Eの値があらかじめ設定された閾値より小さい場合には入力されたデジタルデータが音響データを含むと判断し、前記エネルギー/Eの値が当該閾値以上である場合には入力されたデジタルデータが音響データを含まないと判断するデータ形式判別部と
    を備えるデータ形式判別装置。
  9. 請求項1から請求項4のいずれかに記載の方法をコンピュータにより実行させるプログラム。
  10. 請求項9に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2005266870A 2005-09-14 2005-09-14 データ形式判別方法、装置、プログラム、および記録媒体 Active JP4520922B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005266870A JP4520922B2 (ja) 2005-09-14 2005-09-14 データ形式判別方法、装置、プログラム、および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005266870A JP4520922B2 (ja) 2005-09-14 2005-09-14 データ形式判別方法、装置、プログラム、および記録媒体

Publications (2)

Publication Number Publication Date
JP2007079127A JP2007079127A (ja) 2007-03-29
JP4520922B2 true JP4520922B2 (ja) 2010-08-11

Family

ID=37939504

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005266870A Active JP4520922B2 (ja) 2005-09-14 2005-09-14 データ形式判別方法、装置、プログラム、および記録媒体

Country Status (1)

Country Link
JP (1) JP4520922B2 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06152548A (ja) * 1992-11-02 1994-05-31 Sharp Corp 信号識別回路
JPH06164406A (ja) * 1992-11-27 1994-06-10 Matsushita Electric Ind Co Ltd データ圧縮装置及びデータ圧縮方法
JPH11259099A (ja) * 1998-03-16 1999-09-24 Mitsubishi Electric Corp 音声符号化・復号装置
JP2000066691A (ja) * 1998-08-21 2000-03-03 Kdd Corp オーディオ情報分類装置
JP2000267699A (ja) * 1999-03-19 2000-09-29 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置
JP2001236085A (ja) * 2000-02-25 2001-08-31 Matsushita Electric Ind Co Ltd 音声区間検出装置、定常雑音区間検出装置、非定常雑音区間検出装置、及び雑音区間検出装置
JP2002023795A (ja) * 2000-07-11 2002-01-25 Roland Corp 圧縮処理装置および圧縮処理方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06152548A (ja) * 1992-11-02 1994-05-31 Sharp Corp 信号識別回路
JPH06164406A (ja) * 1992-11-27 1994-06-10 Matsushita Electric Ind Co Ltd データ圧縮装置及びデータ圧縮方法
JPH11259099A (ja) * 1998-03-16 1999-09-24 Mitsubishi Electric Corp 音声符号化・復号装置
JP2000066691A (ja) * 1998-08-21 2000-03-03 Kdd Corp オーディオ情報分類装置
JP2000267699A (ja) * 1999-03-19 2000-09-29 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置
JP2001236085A (ja) * 2000-02-25 2001-08-31 Matsushita Electric Ind Co Ltd 音声区間検出装置、定常雑音区間検出装置、非定常雑音区間検出装置、及び雑音区間検出装置
JP2002023795A (ja) * 2000-07-11 2002-01-25 Roland Corp 圧縮処理装置および圧縮処理方法

Also Published As

Publication number Publication date
JP2007079127A (ja) 2007-03-29

Similar Documents

Publication Publication Date Title
EP1667112B1 (en) Apparatus, method and medium for coding an audio signal using correlation between frequency bands
CN1205601C (zh) 用于与说话者无关的话音识别***的构造话音模板的方法和设备
JP5815723B2 (ja) 低ビットレート信号コーダおよびデコーダ
WO2006019556A2 (en) Low-complexity music detection algorithm and system
JP2004530153A (ja) 信号を特徴付ける方法および装置、および、索引信号を生成する方法および装置
US9954550B1 (en) Content-aware compression of data using window-based selection from multiple prediction functions
US10133551B1 (en) Content-aware compression of data using multiple parallel prediction functions
WO2006019555A2 (en) Music detection with low-complexity pitch correlation algorithm
JP4865872B2 (ja) エントロピ符号化及び復号化を行う装置及び方法
JP2010160507A (ja) 分散音声認識プロセスにおけるエラーの軽減方法および装置
CN105118512B (zh) 一种面向aac数字音频的通用隐写分析方法
US20140039902A1 (en) Data compression apparatus, computer-readable storage medium having stored therein data compression program, data compression system, data compression method, data decompression apparatus, data compression/decompression apparatus, and data structure of compressed data
CN101208741B (zh) 一种适用于数字信号短时相关性模型之间的互用性的方法
TW201133470A (en) Compressing feature space transforms
KR101370018B1 (ko) 제한된 벡터 양자화
Nilsson et al. On the mutual information between frequency bands in speech
CN101609681B (zh) 编码方法、编码器、解码方法及解码器
JP4520922B2 (ja) データ形式判別方法、装置、プログラム、および記録媒体
EP3252758B1 (en) Encoding apparatus, decoding apparatus, and methods, programs and recording media for encoding apparatus and decoding apparatus
EP3751565B1 (en) Parameter determination device, method, program and recording medium
JP2017134197A (ja) パラメータ調整システム、パラメータ調整方法、プログラム
WO2007095247A2 (en) Perceptual quality based automatic parameter selection for data compression
JP4332144B2 (ja) 波形データ形式判別方法、信号符号化方法、それらの方法を用いた装置、プログラム、および記録媒体
JP4603429B2 (ja) クライアント・サーバ音声認識方法、サーバ計算機での音声認識方法、音声特徴量抽出・送信方法、これらの方法を用いたシステム、装置、プログラムおよび記録媒体
JP2009210644A (ja) 線形予測係数算出装置、線形予測係数算出方法、線形予測係数算出プログラム、および記憶媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090803

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091005

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100416

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100511

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100521

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4520922

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140528

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350