JP4920692B2 - オーディオクリップ再生装置、再生方法および記憶媒体 - Google Patents

オーディオクリップ再生装置、再生方法および記憶媒体 Download PDF

Info

Publication number
JP4920692B2
JP4920692B2 JP2008538849A JP2008538849A JP4920692B2 JP 4920692 B2 JP4920692 B2 JP 4920692B2 JP 2008538849 A JP2008538849 A JP 2008538849A JP 2008538849 A JP2008538849 A JP 2008538849A JP 4920692 B2 JP4920692 B2 JP 4920692B2
Authority
JP
Japan
Prior art keywords
processor
audio clip
channel
subbands
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008538849A
Other languages
English (en)
Other versions
JP2009515215A5 (ja
JP2009515215A (ja
Inventor
ワン,イー
ファン,ウェンドン
チャクラボーティ,サマルジット
Original Assignee
ナショナル ユニヴァーシティー オブ シンガポール
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ナショナル ユニヴァーシティー オブ シンガポール filed Critical ナショナル ユニヴァーシティー オブ シンガポール
Publication of JP2009515215A publication Critical patent/JP2009515215A/ja
Publication of JP2009515215A5 publication Critical patent/JP2009515215A5/ja
Application granted granted Critical
Publication of JP4920692B2 publication Critical patent/JP4920692B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Description

本発明は、概して、オーディオクリップ再生装置、オーディオクリップ再生方法およびコンピュータシステムにオーディオクリップ再生方法を実行させるためのコンピュータコード手段を記憶したデータ記憶媒体に関するものである。
携帯型組み込みシステムでは、電力消費量はハードウェアとソフトウェア双方の設計における重要な制限要素になっている。多くの携帯型組み込みシステムは、オーディオやビデオの符号化などのストリーミングマルチメディアアプリケーションを目標にしている。典型的には、これらのマルチメディアアプリケーションは、計算上の要求が大きく変化する。
既存の動的電圧/周波数スケーリング技術および動的電力管理技術では、この変化を調べ、要求が低い期間にはプロセッサを低速にするか停止してエネルギーの節約を図っている。これらの技術は、計算上の要求の変化を予測することに基礎を置き、制御理論によるフィードバック技法を使用することが多い。しかし、このようなフィードバック技法は計算上のコストが高く、エラーが発生しやすい。
したがって、上記問題の少なくともひとつに対処する技術または技法の提供が要求されている。
本発明の第一の態様は、電圧または周波数、もしくは双方に関してスケーラブルなプロセッサと、再生装置の複数の出力モードのひとつを選択するためのスイッチと、前記オーディオクリップを表すジョイント/MSステレオモードでエンコードされたオーディオデータの入力を選択された前記出力モードに基づいてデコードするために、前記プロセッサを制御するための制御装置を有し、各出力モードは前記ジョイント/MSステレオモードでエンコードされたデータのMチャネルのサブバンド数mおよびSチャネルのサブバンド数sを定義し、前記制御装置はプレイバックのために前記mおよびsサブバンドからのデータのみをデコードし記憶するように前記プロセッサを制御することを特徴とする、オーディオクリップ再生装置である。
前記Sチャネルのサブバンド数sは、前記Mチャネルのサブバンド数m以下であってもよい。
ここで、s<mであり、前記制御装置は、ジョイント/MSステレオモード処理後も変化しない前記Mチャネルの[s+1,m]個のサブバンドをコピーするために前記プロセッサを制御してもよい。
各出力モードは、前記プロセッサのデコードのための異なる電力消費に対応してもよい。
各出力モードは、プロセッサのデコードのために必要な最小周波数に対応してもよい。
各出力モードは、異なる出力帯域幅に対応してもよい。
各出力モードは、異なる品質レベルに対応してもよい。
本発明の第二の態様は、複数の出力モードのひとつを選択することと、前記オーディオクリップを表すジョイント/MSステレオモードでエンコードされたオーディオデータの入力を選択された前記出力モードに基づいてデコードするために、電圧または周波数、もしくは双方に関してスケーラブルなプロセッサを制御することを有し、各出力モードは前記ジョイント/MSステレオモードでエンコードされたデータのMチャネルのサブバンド数mおよびSチャネルのサブバンド数sを定義し、プレイバックのために前記mおよびsサブバンドからのデータのみをデコードし記憶するように前記プロセッサを制御することとを有することを特徴とする、オーディオクリップ再生方法である。
ここで、s<mであり、前記方法は、ジョイント/MSステレオモード処理後も変化しない前記Mチャネルの[s+1,m]個のサブバンドをコピーするために前記プロセッサを制御することをさらに有してもよい。
各出力モードは、前記プロセッサのデコードのための異なる電力消費に対応してもよい。
各出力モードは、プロセッサのデコードのために必要な最小周波数に対応してもよい。
各出力モードは、異なる出力帯域幅に対応してもよい。
各出力モードは、異なる品質レベルに対応してもよい。
本発明の第三の態様は、複数の出力モードのひとつを選択するステップと、前記オーディオクリップを表すジョイント/MSステレオモードでエンコードされたオーディオデータの入力を選択された前記出力モードに基づいてデコードするために、電圧または周波数、もしくは双方に関してスケーラブルなプロセッサを制御するステップを有し、各出力モードは前記ジョイント/MSステレオモードでエンコードされたデータのMチャネルのサブバンド数mおよびSチャネルのサブバンド数sを定義し、プレイバックのために前記mおよびsサブバンドからのデータのみをデコードし記憶するように前記プロセッサを制御するステップとを有することを特徴とする、オーディオクリップ再生方法を実行することをコンピュータシステムに指示するためのコンピュータコード手段を記憶したデータ記憶媒体である。
本発明の実施例は、当業者には、例示することおよび図面に関連させることで、より深く理解され、明らかになるであろう。
ジョイント/MSステレオモードを用いてエンコードされたオーディオファイルに対するステレオイメージスケーラブルオーディオデコード技法をここで説明する。本実施例では、MP3のようなシングルレイヤーオーディオ形式に対する帯域幅およびステレオイメージスケーラブル(BSS)デコード技法を説明する。BSSデコード技法は、圧縮ビットストリーム内の異なるオーディオ成分の知覚上の関連性を分析することに基礎を置く。帯域幅およびステレオイメージのスケーラビリティは、デコーダによって生成されたコンピュータ動作負荷で表されたスケーラビリティに直接変換される。これは、エネルギー節約およびバッテリ寿命延長のために、電圧/周波数に関しスケーラブルなプロセッサによって検出される。
BSSデコーディング技法は、オーディオ品質の僅かな悪化はユーザには感知されないがプレイヤーのバッテリ寿命を著しく延長できることを考慮して、ユーザがバッテリ寿命とデコードされたオーディオの品質との兼ね合いを制御することを許す。これによって、ユーザは、自分の聴覚能力、傾聴環境および要求されるサービスタイプにしたがって、デコードされたオーディオの品質レベルを制御するのが許される。ユーザはデコーダ側での品質レベルをも制御できる。さらに、MP3等のシングルレイヤーオーディオ形式に対して、多数の出力品質レベル間を切り替えることができる。各品質レベルは異なる電力消費レベルに対応する。また、BSSデコード技法は実施し易く、実行時間のオーバーヘッドがなく、実行時に電圧または周波数のスケーリングも生じない。
標準MP3デコーダはBSSデコード技法実施のために再設計されてBSS-MP3デコーダとなった。BSSデコード技法は、いかなる知覚オーディオデコーダを用いても実施可能であることは、当業者には理解されよう。
以下の説明は部分的に、コンピュータメモリ内のデータに対するアルゴリズムおよび関数、または符号による操作の表現によって明示的または暗示的に示される。これらのアルゴリズムによる説明および関数、または符号による表現は、データ処理技術業者がその仕事の内容を他のデータ処理技術業者に極めて効果的に伝えるために用いられる手段である。ここで、アルゴリズムは一般的に、所望の結果を導く首尾一貫した一連のステップと考えられる。これらのステップは、保存、転送、組み合わせ、比較およびその他の処理が可能な電気信号、磁気信号、または光信号等の物理量に関する物理的処理を要求するステップである。
特に他に説明がない限りおよび以下から明らかなように、本明細書を通して、「デコーディング」、「プロセッシング」、「アンパッキング」、「コンピューティング」、「ストアリング」、または「コピーイング」等を用いた検討は、コンピュータシステムまたは同様な電子装置の動作および処理に関するが、上記コンピュータシステムまたは同様な電子装置はコンピュータシステム内の物理量として示されるデータを処理し、他のコンピュータシステムまたは他の情報記憶装置、または、伝送または表示装置内の物理量として同様に示されるデータに変換する。
本明細書は上記方法の動作を実行するための装置も開示する。このような装置は、所望の目的のために特に構成されてもよいし、汎用コンピュータまたはコンピュータ内に記憶されたコンピュータプログラムによって選択的に起動されるか再構築された他の装置を含んでもよい。ここで示されるアルゴリズムおよび表示はいかなる特定のコンピュータまたは他の装置に本質的に関連するものではない。各種汎用装置に教え込みを施してプログラムとともに使用してもよい。または、所望の方法のステップを実行するためのより特殊化した装置を構築するのも適当であろう。従来の汎用コンピュータの構成は以下の説明から明らかになろう。
さらに、本明細書はコンピュータプログラムを開示するが、ここで記載される方法の個々のステップはコンピュータコードによって実現されてもよいことは当業者には明らかであろう。このコンピュータプログラムは、いかなる特定のプログラム言語およびその実施に制限されるものではない。ここに含まれる開示の教え込みを行うために、各種プログラム言語およびそのコードを使用してもよいことは理解されるであろう。また、コンピュータプログラムはいかなる特定の制御フローに制限されるものではない。他に多くのコンピュータプログラムの変形があり、それらは本発明の精神および範囲を逸脱することなく異なる制御フローを使用できる。
そのようなコンピュータプログラムは、いかなるコンピュータ読取可能媒体にも記憶されうる。コンピュータ読取可能媒体は、汎用コンピュータへのインターフェースに適した磁気または光ディスク、メモリチップ、または他の装置のような記憶装置を含んでもよい。上記コンピュータプログラムはこのような汎用コンピュータにロードされ実行されると、上記好ましい方法のステップを実行する装置となる。
図1はBSS-MP3デコーダ100の概略図を示す。BSS-MP3デコーダ100は、プロセッサ102および手動スイッチ104を有する。プロセッサ102は、圧縮オーディオビットストリームをパルス符号変調(PCM)オーディオサンプルに変換する。手動スイッチ104はプロセッサ102に接続される。手動スイッチ104は、特定レベルのためのデコード技法またはアルゴリズムと、プロセッサ102がこのデコード技法を実行する際の電圧および周波数とにしたがって任意のオーディオクリップをデコードするための品質レベルを、ユーザが手動で選択できるようにする。クリップが低品質レベルでデコードされていれば、プロセッサ102は低い周波数と電圧で作動できる。これにより、電力節約が達成されるという利点がある。
BSSデコード技法はマルチレベルデコード技法であり、この技法は異なる周波数帯域とチャネルに関連する知覚上の重要性を認識することに基礎を置き、知覚上関連性のない演算を除去する。したがって、BSSデコード技法は、「do not zero-pute」アルゴリズム(P.De Smet,F.Rooms,H.Liong、およびW.Philips.Do not zero-pute:効果的な手作りのMPEG-オーディオレーヤIIデコードおよび最適化戦略、ACMマルチメディア2004予稿集,2004年10月)ような他の既存の最適化技術に比較した場合、動作負荷を効果的に低減するという利点がある。
BSS-MP3デコーダ100は、周波数帯域とステレオイメージスケーラビリティとを組み合わせて、いくつかのデコードレベルを作る。各デコードレベルは異なるプレイバック品質に対応する。周波数帯域およびステレオイメージスケーラビリティの詳細を以下に説明する。
周波数帯域幅のスケーラビリティを達成するためには、MPEG1オーディオ標準で定義された32のサブバンドを4個のグループに分ける。各グループは知覚品質レベルに対応する。図2は上記4個の周波数帯域グループを列挙する表を示す。約44.1kHzのサンプリング周波数を例にとって説明する。
周波数帯域グループ1は約5.5kHzの最小の周波数帯域幅で、基本レイヤーとして定義される。このグループ1は全帯域幅の4分の1のみを占めるだけであり、全コンピュータ動作負荷のほぼ4分の1に寄与するが、知覚的には最も関連性のある周波数帯域である。出力オーディオ品質は振幅変調(AM)品質であり、ニュースやスポーツ解説のようなサービスには十分である。
グループ2は約11kHzの周波数帯域幅で、出力オーディオ品質は周波数変調(FM)品質であり、特に騒がしい環境で音楽を聴くには十分である。グループ3は約16.5kHzの周波数帯域幅をカバーし、コンパクトディスク(CD)品質に極めて近い出力オーディオ品質を生成する。グループ4は約22kHzの全周波数帯域幅をカバーし、標準MP3デコーダに対応する。対応する出力オーディオ品質はCD品質である。
本実施例では、MP3はジョイント/MSステレオモードを使用してエンコードされる。このモードは左右のチャネルの信号の相似性を検出する。左右のチャネルはMP3ファイルにおいて、ミドル(M)とサイド(S)のチャネルとしてエンコードされる。Mチャネルは左右のチャネルの双方からの最も重要な情報を含み、Sチャネルはステレオイメージを提供する役目だけを果たす。したがって、Mチャネルは、デコード上では同様な動作負荷であるにもかかわらず、Sチャネルよりも知覚的に重要である。このように、本発明者らは、動作負荷の低減とバッテリ寿命の延長が望まれる場合には、Sチャネルを部分的にデコードするかまたは完全に廃棄することが可能であると認識するに至った。
図3は、BSS-MP3デコーダ100によって実行されたBSSデコード技法の処理のフローチャートを示す。これらの処理は、ビットストリームアンパックおよびホフマンデコード302、スペクトル値の逆量子化および再並び替え304、ジョイント/MS処理306、逆変形離散コサイン変換(IMDCT)処理308およびポリフェーズ生成310である。
最も演算上の動作負荷が大きいのは逆量子化304、IMDCT処理308およびポリフェーズ生成310である。標準MP3デコーダは全周波数帯域においてデコードするが、これは演算上の最大動作負荷に相当する。BSS-MP3デコーダ100において、上記の3個のモジュールは、ユーザが選択したデコードレベルにしたがって、部分的な周波数範囲のみを処理する。よって、演算に要するコストは低減される。図3では、それぞれ、B1はMチャネルに対して選択された帯域幅、B2はSチャネルに対して選択された帯域幅、B3は左チャネルに対して選択された帯域幅、B4は右チャネルに対して選択された帯域幅である。
Figure 0004920692
のとき、Mチャネルの低位m個のサブバンドおよびSチャネルの低位s個のサブバンドが、BSS-MP3デコーダ100でデコードされるものとする。これは、Sチャネルに比してMチャネルのサブバンドがより多くデコードされる非対称デコードを意味する。しかし、s=mの場合には対称部分MSデコードも可能である。
図3に示されるように、このBSS-MP3デコーダ100は、ホフマンデコード後に、MおよびSチャネルそれぞれの低位のmおよびsサブバンドからのデータのみをデコードし記憶する。Sチャネルには[s+1,m]サブバンドのグループがないので、Mチャネルの[s+1,m]サブバンドは、ジョイント/MSステレオ処理モジュールの後でも、変化しない。図3内にIMDCTモジュールの後に破線で示されるように、これらは左右のチャネルの双方へ単にコピーされるだけである。真のステレオ成分のみが、左右のチャネルの低位sサブバンドとなる。
上記処理中には、有利なことに、BSS-MP3デコーダ100の演算における動作負荷は、両チャネルのデコードされるサブバンド数の減少にほぼ線形に比例して減少する。BSS-MP3デコーダ100のエネルギー節約と性能を評価したが、この評価の詳細と結果を以下に説明する。
BSS-MP3デコーダ100によるエネルギー節約を約128kbits/秒のビットレートのオーディオクリップを用いて評価した。全てのオーディオクリップは、約44.1kHzのサンプリングレートで約20秒の継続時間であり、ジョイントステレオモードで符号化された。プロセッサモデルは、SimpleScalar命令セットシミュレータのSim-Profile構成を基礎とした。BSS-MP3デコーダ100は、3個の異なるプレイバック遅延値、それぞれ約0.5、1、2秒でシミュレートされた。
図4は、3個の異なるプレイバック遅延値での異なるデコードレベルのために必要な最小周波数を列挙する表を示す。これらの周波数値は、MP3ビットストリーム内の異なるグラニュールに対して必要とされる各種プロセッササイクルおよび各グラニュールを構成するビット数の双方を考慮して計算された。プレイバック遅延値が約0.5秒から1約秒および約2秒に増加すると、必要な最小周波数は全てのデコードレベルに対して適度な減少を示した。これは、バッファ時間の増加のせいであり、これが動作負荷の変化をある程度なだらかにしている。
図5は、プレイバック遅延を約0.5秒にした場合の、14個の異なるデコードレベルに対して正規化されたエネルギー消費量のチャートを示す。図5から、このデコード用構成(m:32,s:32)502は約0.99の最大正規化エネルギー量を消費することがわかる。これは標準MP3出力に相当する。他方、このデコード用構成(m:8,s:8)504は約0.01の正規化エネルギーを消費する。デコード用構成(m:8,s:8)504が選択された場合には、およそ98%のエネルギー節減が達成されるという利点がある。
BSS-MP3デコーダ100の有効性を評価するために、13個の対象に対して信頼性の高い実験を行った。全ての対象に対して、5ポイント制(5-優,4-秀,3-良,2-可,1-不可)の平均オピニオンスコア(MOS)を用いてオーディオ品質を評価した。評価には5個のミュージッククリップが使用され、このうち4個はポップミュージックで1個は純粋な器楽のクラシックミュージックであった。これらのミュージッククリップは全てジョイントステレオモードで、約44.1kHzのサンプリングレートと約128kbits/秒のビットレートである。テストのために、各ミュージッククリップに対して5個の異なるコピーを用意した。これらのコピーは、それぞれ(m:32,s:32)、(m:32,s:24)、(m:32,s:16)、(m:32,s:8)、(m:32,s:0)のプロファイルをもつBSS-MP3デコーダ100によって生成された。各ミュージッククリップにたいして、アンカー品質基準値として使用される(m:32,s:32)と(m:8,s:8)のプロファイルでさらに2個のコピーを用意した。プロファイル(m:32,s:32)はMOSスケールで5であり、プロファイル(m:8,s:8)はMOSスケールで3であった。全てのテストサンプルはアンカー品質基準値を除いてランダムに並べた。2個の対象の組、つまり、ステレオイメージスケーラビリティ評価用の対象と帯域幅スケーラビリティ評価用の対象と、が評価された。
ステレオイメージスケーラビリティの第1の評価結果を図6に示す。図6は5個の異なるミュージッククリップの5個の異なるプロファイルに対するMOSを示す。Sチャネルを完全に廃棄すると、すなわち、ステレオをモノに(m:32,s:32(602)をm:32,s:0(604))に変換すると、品質低下が著しいことが観察される。全MチャネルおよびSチャネルの低位4分の1をデコード(すなわち、m:32,s:32(602)をm:32,s:8(606))すると、品質低下はごくわずかなものになる。Sチャネルの低位4分の1のみをデコードするとしても、十分なプレーバックオーディオ品質が得られるという利点がある。これは、低周波数帯域(図1のグループ1)が高周波数帯域よりも重要なことを示している。さらに、プロセッサ周波数の低減は約30%であり、これは電力節約がほぼ70%に達したということになる。
帯域幅スケーラビリティの第2の評価のために、MおよびSチャネルの対称デコードすなわちMおよびSチャネルの部分的なデコードを行った。図7にこの第2評価の結果を示す。図7は、帯域幅に対する平均オピニオンスコアのプロット702、帯域幅に対する動作負荷のプロット704および帯域幅に対するエネルギー消費のプロット706を示す。プロット702によれば、周波数帯域グループ4から周波数帯域グループ3への切り替えによって知覚的なオーディオ品質の低下は殆どないことが分かる。しかし、プロット706は、周波数帯域グループ4から周波数帯域グループ3への切り替えによって有利にも約50%を超えるエネルギー消費低減がなされることを示している。したがって、バッテリ寿命が延びる。出力オーディオ品質の僅かな低下を許すことで多大なエネルギー節減が達成されるという利点がある。
プロット704は、BSS-MP3デコーダ100の動作負荷が、デコード対象の周波数帯域幅にほぼ比例することを示している。したがって、デコード対象のオーディオ周波数帯域幅を減少させることで、オーディオ品質は緩やかに悪化するが、エネルギー消費は急激に低減する。
図8は本実施例によるオーディオクリップの再生のための装置800の概略図を示す。この装置800は、電圧または周波数、もしくは双方に関してスケーラブルなプロセッサ802を有する。装置800はさらに、この装置の複数個の出力モードのひとつを選択するためのスイッチ804を有する。また装置800は、プロセッサ802およびスイッチ804に接続され、選択された出力モードにしたがって、オーディオクリップを表すジョイント/MSステレオモードでエンコードされたオーディオデータの入力をデコードするためにプロセッサを制御する制御装置806を有する。ここで、各出力モードは、上記ジョイント/MSステレオモードでエンコードされたデータのMチャネルのサブバンド数mおよびSチャネルのサブバンド数sを定義する。制御装置806は、プレイバックのためにmおよびsサブバンドからのデータのみをデコードし記憶するようにプロセッサ802を制御する。
図9は本実施例によるオーディオクリップの再生方法を例示するフローチャート900を示す。ステップ902で、複数個の出力モードのひとつが選択される。ステップ904において、プロセッサが制御されるが、このプロセッサは、電圧または周波数、もしくは双方においてスケーラブルであり、上記制御の結果、選択された出力モードにしたがって、オーディオクリップを表すジョイント/MSステレオモードでエンコードされたオーディオデータの入力がデコードされる。ここで、各出力モードは、上記ジョイント/MSステレオモードでエンコードされたデータのMチャネルのサブバンド数mおよびSチャネルのサブバンド数sを定義する。ステップ906で、上記プロセッサは、プレイバックのためにmおよびsサブバンドからのデータのみをデコードし記憶するように制御される。
上記方法およびシステムは、図10に概略が示されているコンピュータシステム1000上で実施されうる。これはソフトウェアとして実施されてもよく、たとえば、コンピュータシステム1000内で実行されるコンピュータプログラムであってコンピュータシステム1000に上記実施例の方法を行うように指示するコンピュータプログラムとして実施されてよい。
コンピュータシステム1000はコンピュータモジュール1002、キーボード1004やマウス1006のような入力モジュール1002、およびディスプレー1008やプリンタ1010のような複数個の出力装置を有する。
コンピュータモジュール1002は適当なトランシーバ装置1014を介してコンピュータネットワーク1012に接続され、これによってインターネットもしくはローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)などの他のネットワークシステムにアクセスできる。
この例におけるコンピュータモジュール1002はプロセッサ1018、ランダムアクセスメモリ(RAM)1020およびリードオンリメモリ(ROM)1022を有する。また、コンピュータモジュール1002は、いくつかの入出力(I/O)インターフェース、たとえば、ディスプレー1008へのI/Oインターフェース1024やキーボード1004へのI/Oインターフェース1026を有する。
コンピュータモジュール1002の構成要素は、典型的には、内部接続されたバス1028を介して、当業者には既知の方法によって通信を行う。
アプリケーションプログラムは典型的には、CD-ROMまたはフラッシュメモリ担体などのデータ記憶媒体上にエンコードされコンピュータシステム1000のユーザに提供され、データ記憶装置1030の対応するデータ記憶媒体ドライブを用いて読み込まれる。アプリケーションプログラムはその実行時に、プロセッサ1018によって読み込まれ制御される。プログラムデータの中間記憶装置として、RAM1020を使用してもよい。
当業者には理解されようが、本発明の特許請求の範囲の精神および範囲を逸脱することなく、上記特定の実施例に示されたような本発明に対して、多くの変形および/または修正が可能である。したがって、あらゆる観点において、本実施例は例示としてであり制限するものではないものと考えられるべきである。
帯域幅およびステレオイメージスケーラブルMPEGオーディオレーヤ3(BSS-MP3)デコーダの概略を示す図である。 4周波数帯グループのリストを示す表である。 BSS-MP3デコーダによって実行されたBSSデコード技法の処理の流れを示す図である。 異なる3個のプレイバック遅延値について、異なるデコードレベルに必要とされる最小の周波数のリストを示す表である。 プレイバック遅延を0.5秒にセット時の、異なる14個のデコードレベルに対する正規化エネルギー消費量を示すグラフである。 異なる5個のミュージッククリップの異なる5個のプロファイルに対する平均オピニオンスコアを示すグラフである。 平均オピニオンスコア、動作負荷およびエネルギー消費量を帯域幅に対してそれぞれプロットしたものを示すグラフである。 オーディオクリップ再生装置の概略を示す図である。 オーディオクリップ再生方法を示すフローチャートである。 上記方法およびシステムを実施するためのコンピュータシステムの概略を示す図である。

Claims (13)

  1. オーディオクリップ再生装置であって、
    前記装置は、
    電圧または周波数、もしくは双方に関してスケーラブルなプロセッサと、
    前記プロセッサに結合され、オーディオクリップを表すジョイント/MSステレオモードでエンコードされたオーディオデータの入力を複数個の出力モードのうちの選択された出力モードに基づいてデコードするために前記プロセッサを制御するように構成された制御装置
    を有し、
    ここで、各選択された前記出力モードは前記ジョイント/MSステレオモードでエンコードされたデータのMチャネルのサブバンド数mおよびSチャネルのサブバンド数sを定義し、
    ここで、前記制御装置はプレイバックのためにmおよびsサブバンドからのデータのみをデコードし記憶するように前記プロセッサを制御するように構成され、
    ここで、前記Sチャネルのサブバンド数sは、前記Mチャネルのサブバンド数m以下であること、
    を特徴とするオーディオクリップ再生装置。
  2. 記制御装置は、さらに、ジョイント/MSステレオモード処理後も変化しない前記Mチャネルの[s+1,m]個のサブバンドをコピーするために前記プロセッサを制御するように構成されたことを特徴とする請求項1記載のオーディオクリップ再生装置。
  3. 前記複数個の出力モードは、前記プロセッサのデコードのための異なる電力消費に対応することを特徴とする請求項1または2記載のオーディオクリップ再生装置。
  4. 前記複数個の出力モードは、前記プロセッサのデコードのために必要な最小周波数に対応することを特徴とする請求項1または2記載のオーディオクリップ再生装置。
  5. 前記複数個の出力モードは、異なる出力帯域幅に対応することを特徴とする請求項1または2記載のオーディオクリップ再生装置。
  6. 前記複数個の出力モードは、異なる品質レベルに対応することを特徴とする請求項1または2記載のオーディオクリップ再生装置。
  7. 前記装置は、前記装置の前記複数個の出力モードから、選択された前記出力モードの選択を可能にするように構成されたスイッチをさらに有することを特徴とする請求項1からのいずれか1項に記載のオーディオクリップ再生装置。
  8. オーディオクリップ再生方法であって、
    前記方法は、
    装置により、前記装置の複数の出力モードから選択された出力モードの表示を受信するステップと、
    オーディオクリップを表すジョイント/MSステレオモードでエンコードされたオーディオデータの入力を選択された前記出力モードに基づいてデコードするために、電圧または周波数、もしくは双方に関してスケーラブルな前記装置のプロセッサを制御するステップと
    を含み、
    ここで、選択された前記出力モードは前記ジョイント/MSステレオモードでエンコードされたデータのMチャネルのサブバンド数mおよびSチャネルのサブバンド数sを定義し、
    ここで、前記プロセッサを制御するステップは、プレイバックのためにmおよびsサブバンドからのデータのみデコード記憶を制御するステップを含み、
    ここで、前記Sチャネルのサブバンド数sは、前記Mチャネルのサブバンド数m以下であること、
    を特徴とするオーディオクリップ再生方法。
  9. 前記プロセッサを制御するステップは、ジョイント/MSステレオモード処理後も変化しない前記Mチャネルの[s+1,m]個のサブバンドコピーを制御するステップをさらに含むことを特徴とする請求項記載のオーディオクリップ再生方法。
  10. 選択された前記出力モードは、複数個の出力モードのうちのひとつであり、かつ、前記複数個の出力モードは、前記プロセッサのデコードのための異なる電力消費に対応することを特徴とする請求項または記載のオーディオクリップ再生方法。
  11. 選択された前記出力モードは、複数個の出力モードのうちのひとつであり、かつ、前記複数個の出力モードは、前記プロセッサのデコードのために必要な最小周波数に対応することを特徴とする請求項8または9記載のオーディオクリップ再生方法。
  12. 選択された前記出力モードは、複数個の出力モードのうちのひとつであり、かつ、前記複数個の出力モードは、異なる出力帯域幅に対応することを特徴とする請求項8または9記載のオーディオクリップ再生方法。
  13. 選択された前記出力モードは、複数個の出力モードのうちのひとつであり、かつ、前記複数個の出力モードは、異なる品質レベルに対応することを特徴とする請求項8または9記載のオーディオクリップ再生方法。
JP2008538849A 2005-11-04 2006-11-03 オーディオクリップ再生装置、再生方法および記憶媒体 Active JP4920692B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US73389205P 2005-11-04 2005-11-04
US60/733,892 2005-11-04
PCT/SG2006/000328 WO2007053120A1 (en) 2005-11-04 2006-11-03 A device and a method of playing audio clips

Publications (3)

Publication Number Publication Date
JP2009515215A JP2009515215A (ja) 2009-04-09
JP2009515215A5 JP2009515215A5 (ja) 2010-09-30
JP4920692B2 true JP4920692B2 (ja) 2012-04-18

Family

ID=38006155

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008538849A Active JP4920692B2 (ja) 2005-11-04 2006-11-03 オーディオクリップ再生装置、再生方法および記憶媒体

Country Status (8)

Country Link
US (1) US8036900B2 (ja)
EP (1) EP1943741B1 (ja)
JP (1) JP4920692B2 (ja)
KR (1) KR101135243B1 (ja)
CN (1) CN101356741B (ja)
AT (1) ATE496366T1 (ja)
DE (1) DE602006019762D1 (ja)
WO (1) WO2007053120A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4986243B2 (ja) * 2008-07-04 2012-07-25 Kddi株式会社 メディアストリームの階層数を制御する送信装置、方法及びプログラム
EP2582037B1 (en) * 2011-10-12 2017-12-20 Harman Becker Automotive Systems GmbH Device and method for reproducing an audio signal
US20130166924A1 (en) * 2011-12-21 2013-06-27 Jen-Chieh Yang Method for performing scenario driven voltage scaling, and associated apparatus

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
WO1995030286A2 (en) * 1994-05-02 1995-11-09 Philips Electronics N.V. Encoding system and encoding method for encoding a digital signal having at least a first and a second digital signal component
US5588181A (en) 1995-03-23 1996-12-31 Sutton; Michael R. Hinge for a glass shower door
JP2001189659A (ja) * 1999-12-28 2001-07-10 Toshiba Corp 圧縮データ復号装置および復号方法
JP2001319407A (ja) * 2000-05-10 2001-11-16 Canon Inc 音楽再生装置及び方法並びに記憶媒体
JP3569266B2 (ja) * 2002-03-22 2004-09-22 株式会社東芝 再生装置及び省電力方法
US8498422B2 (en) * 2002-04-22 2013-07-30 Koninklijke Philips N.V. Parametric multi-channel audio representation
CN1585029A (zh) * 2003-08-22 2005-02-23 何刚 无线的mp3,wma播放器
TWI227866B (en) * 2003-11-07 2005-02-11 Mediatek Inc Subband analysis/synthesis filtering method
TW200610363A (en) * 2004-09-03 2006-03-16 Inventec Appliances Corp Device and method for playing MP3 at mobile phone
CN101111997B (zh) * 2004-11-29 2012-09-05 新加坡国立大学 对表示音频剪辑的音频数据进行解码的设备和方法

Also Published As

Publication number Publication date
KR101135243B1 (ko) 2012-04-12
CN101356741B (zh) 2012-10-31
DE602006019762D1 (de) 2011-03-03
ATE496366T1 (de) 2011-02-15
KR20080070844A (ko) 2008-07-31
EP1943741A4 (en) 2009-11-18
WO2007053120A1 (en) 2007-05-10
US8036900B2 (en) 2011-10-11
CN101356741A (zh) 2009-01-28
JP2009515215A (ja) 2009-04-09
EP1943741B1 (en) 2011-01-19
EP1943741A1 (en) 2008-07-16
US20080306744A1 (en) 2008-12-11

Similar Documents

Publication Publication Date Title
JP4521170B2 (ja) 純可逆的音声圧縮における技術革新
JP4778196B2 (ja) 統合化不可逆的可逆的音声圧縮
JP4756818B2 (ja) 混合の可逆的音声圧縮
JP4084990B2 (ja) エンコード装置、デコード装置、エンコード方法およびデコード方法
JP4664431B2 (ja) アンビエンス信号を生成するための装置および方法
US11062715B2 (en) Time-domain stereo encoding and decoding method and related product
JP5576021B2 (ja) 携帯用デバイスのための知覚意識型低電力オーディオ・デコーダ
US20240153511A1 (en) Time-domain stereo encoding and decoding method and related product
JP4920692B2 (ja) オーディオクリップ再生装置、再生方法および記憶媒体
KR101809272B1 (ko) 다 채널 오디오 신호의 다운 믹스 방법 및 장치
US20230352033A1 (en) Time-domain stereo parameter encoding method and related product
US20110116551A1 (en) Apparatus and methods for processing compression encoded signals
CN108352165A (zh) 解码装置、解码方法以及程序
JP2009515215A5 (ja)
JP2000078018A (ja) 音声符号化方式、音声符号化装置、及びデ―タ記録媒体
Huang et al. Power-Aware bandwidth and stereo-image scalable audio decoding
JP2002304198A (ja) 信号処理装置および信号処理方法
Ju et al. Time-frequency domain fast audio transcoding
JP2000295110A (ja) オーディオ信号符号化装置
Pena et al. Realtime implementations of MPEG-2 and MPEG-4 natural audio coders
US20080215342A1 (en) System and method for enhancing perceptual quality of low bit rate compressed audio data
US20080172139A1 (en) System and method for enhancing perceptual quality of low bit rate compressed audio data
JP2008146471A (ja) 信号処理装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20081224

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090603

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090604

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091014

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100816

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120201

R150 Certificate of patent or registration of utility model

Ref document number: 4920692

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150210

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250