JP2012512441A - ピーク検出に基づいた選択型スケーリングマスク演算 - Google Patents

ピーク検出に基づいた選択型スケーリングマスク演算 Download PDF

Info

Publication number
JP2012512441A
JP2012512441A JP2011542225A JP2011542225A JP2012512441A JP 2012512441 A JP2012512441 A JP 2012512441A JP 2011542225 A JP2011542225 A JP 2011542225A JP 2011542225 A JP2011542225 A JP 2011542225A JP 2012512441 A JP2012512441 A JP 2012512441A
Authority
JP
Japan
Prior art keywords
audio signal
gain
vector
signal
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011542225A
Other languages
English (en)
Other versions
JP5285162B2 (ja
Inventor
ピー. アシュリー、ジェームズ
ミタル、ウダー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Mobility LLC
Original Assignee
Motorola Mobility LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Mobility LLC filed Critical Motorola Mobility LLC
Publication of JP2012512441A publication Critical patent/JP2012512441A/ja
Application granted granted Critical
Publication of JP5285162B2 publication Critical patent/JP5285162B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

受信されたオーディオ信号の再構築されたオーディオベクトル^Sにおけるピークの組が検出され、検出されたピークの組に基づいたスケーリングマスクΨ(^S)が生成される。少なくともスケーリングマスクと、ゲインベクトルを表すインデックスjとに基づいてゲインベクトルgが生成される。再構築オーディオ信号は、ゲインベクトルでスケーリングされ、スケーリングされた再構築オーディオ信号を生成する。オーディオ信号とスケーリングされた再構築オーディオ信号とに基づいて歪みが生成される。生成された歪みに基づいたゲインベクトルのインデックスが出力される。

Description

本開示は、一般に通信システムに関し、特に、かかる通信システムにおけるスピーチ信号とオーディオ信号との符号化に関する。
(関連出願の相互参照)
本出願は、モトローラ社が本出願と合わせて所有する以下の米国出願に関する。
「METHOD AND APPARATUS FOR GENERATING AN ENHANCEMENT LAYER WITHIN A MULTIPLE−CHANNEL AUDIO CODING SYSTEM(マルチ・チャネル・オーディオ符号化システム内で拡張レイヤを生成するための方法および装置)」と題する出願番号第12/345,165号(代理人整理番号CS36250AUD)、
「METHOD AND APPARATUS FOR GENERATING AN ENHANCEMENT LAYER WITHIN A MULTIPLE−CHANNEL AUDIO CODING SYSTEM(マルチ・チャネル・オーディオ符号化システム内で拡張レイヤを生成するための方法および装置)」と題する出願番号第12/345,117号(代理人整理番号CS36627AUD)、および
「SELECTIVE SCALING MASK COMPUTATION BASED ON PEAK DETECTION(ピーク検出に基づいた選択型マスク演算)」と題する出願番号第12345,096号(代理人整理番号CS36655AUD」で、すべて本出願と同一日に出願されている。
デジタルのスピーチ信号とオーディオ信号との圧縮については周知である。圧縮は、一般に、通信チャネル経由で信号を効率的に送信したり、圧縮信号を、ソリッドステート・メモリ・デバイスやコンピュータ・ハード・ディスクなどのデジタル・メディア・デバイスに保存したりする目的で必要とされる。多数の圧縮(すなわち「符号化」)技法が存在するが、これまで非常に人気の高かったデジタルスピーチ符号化方法の1つが符号励振線形予測(Code Excited Linear Prediction:CELP)と呼ばれるもので、この方法は、「合成による分析」符号化アルゴリズムという系統の1つである。合成による分析とは一般に、デジタルモデルの複数のパラメータが、入力信号と比較され、歪みが分析される1組の候補信号を合成する目的で使用される符号化プロセスを表す。その後、最小の歪みをもたらす1組のパラメータが送信または格納され、最終的には元の入力信号の推定値を再構築する目的で使用される。CELPは、各々がコードブックインデックスに応答してコードブックから取得されるコード・ベクトルのセットを本質的に備える1つもしくは複数のコードブックを使用する特定の合成による分析法である。
現代のCELPコーダでは、合理的に低いデータ速度で質の高いスピーチおよびオーディオ再生を維持することに関して課題がある。このことは、CELPスピーチモデルに十分に適合しない音楽または他の汎用オーディオ信号で特に該当する。このような場合では、モデルの不適合によって、かかる方法を用いる器材のエンドユーザが許容できないほど劣悪なオーディオ品質を生じ得る。そのため、特に音楽および他の非スピーチタイプ入力を対象に、低ビットレートでのCELPタイプ・スピーチ・コーダの性能向上に対するニーズが依然として存在する。
先行技術による組み込み型スピーチ/オーディオ圧縮システムのブロック図である。 図1の拡張レイヤエンコーダの詳細な実施形態である。 図1の拡張レイヤエンコーダの詳細な実施形態である。 拡張レイヤエンコーダおよびデコーダのブロック図である。 マルチレイヤ組み込み型符号化システムのブロック図である。 レイヤ4のエンコーダおよびデコーダのブロック図である。 図4および図6のエンコーダの動作を示すフローチャートである。 先行技術による組み込み型スピーチ/オーディオ圧縮システムのブロック図である。 図8の拡張レイヤエンコーダの詳細な実施形態である。 各種実施形態にかかる拡張レイヤエンコーダおよびデコーダのブロック図である。 各種実施形態にかかる拡張レイヤエンコーダおよびデコーダのブロック図である。 各種実施形態にかかるマルチ・チャネル・オーディオ信号エンコーディングのフローチャートである。 各種実施形態にかかるマルチ・チャネル・オーディオ信号エンコーディングのフローチャートである。 各種実施形態にかかるマルチ・チャネル・オーディオ信号の復号を示すフローチャートである。 各種実施形態にかかるマスク生成に基づいたピーク検出の周波数プロットである。 各種実施形態にかかるピークマスク生成を使用したコア・レイヤ・スケーリングの周波数プロットである。 各種実施形態にかかる、ピーク検出に基づいたマスク生成を使用してエンコードおよび復号を行うための方法を表すフロー図である。 各種実施形態にかかる、ピーク検出に基づいたマスク生成を使用してエンコードおよび復号を行うための方法を表すフロー図である。 各種実施形態にかかる、ピーク検出に基づいたマスク生成を使用してエンコードおよび復号を行うための方法を表すフロー図である。
添付の図面において、同じ参照番号は、それぞれの図を通じて同一または機能上同様の要素を言及し、下記の詳細な説明と共に本明細書に援用されて明細書の一部を形成する。添付の図面は、請求された発明を含む概念の各種実施形態をさらに表し、それらの実施形態の各種原理と利点とを説明する役割を果たす。
当業者であれば、図内の要素が簡潔化と明瞭化のために示されるものであり、必ずしも正しい尺度で描かれてはいないことがわかるであろう。例えば、図内の一部の要素の寸法は、各種実施形態についての理解度向上を支援するために、他の要素に対して誇張されている場合がある。加えて、説明および図面は、図示された順序を必ずしも必須とするものではない。特定の動作および/またはステップが特定の発生順に記載または描写されている場合があることをさらに理解されたい一方で、当業者であれば、順序に関するかかる具体性が実際には要求されないことも理解するであろう。装置および方法の構成要素は、慣習的な記号によって図面に適宜表されており、本明細書の記載内容の便益を有する当業者にとって容易に明らかであろう詳細によって本開示を不明瞭にすることのないよう、各種実施形態の理解に関わる具体的な詳細だけを示している。したがって、説明の簡潔・明瞭化という点から、これらの各種実施形態を、余計な要素に煩わされることなく簡便に参照するために、商業的に可能な実施形態で有用または必要であっても、一般的かつ十分に理解される要素については描かれていない場合がある。
上述のニーズに対処するために、オーディオ符号化システム内で拡張レイヤを生成するための方法および装置が本明細書に記載されている。動作時には、符号化される入力信号が受信され、符号化オーディオ信号を生成する。符号化オーディオ信号はその後、関連付けられたゲイン値を各々が有する複数のゲイン値でスケーリングされ、複数のスケーリングされた符号化オーディオ信号を生成する。そして、入力信号と、複数のスケーリングされた符号化オーディオ信号の各々との間に存在する複数のエラー値が決定される。その後、スケーリングされた符号化オーディオ信号と関連付けられているゲイン値が選択され、入力信号と、スケーリングされた符号化オーディオ信号との間に存在するエラー値が小さくなる。最終的には、この低エラー値は、拡張レイヤの一部として、ゲイン値と共に、符号化オーディオ信号に送信される。
先行技術による組み込み型スピーチ/オーディオ圧縮システムが図1に示されている。入力オーディオs(n)はまず、コア・レイヤ・エンコーダ120によって処理される。そのために、CELPタイプのスピーチ符号化アルゴリズムが使用され得る。エンコードされたビットストリームは、チャネル125に送信されると共に、ローカルコア・レイヤ・デコーダ115に入力され、そこで、再構築されたコアオーディオ信号s(n)が生成される。その後、拡張レイヤエンコーダ120を使用して、信号s(n)とs(n)との何らかの比較に基づいて追加情報を符号化し、任意でコア・レイヤ・デコーダ115からのパラメータを使用し得る。コア・レイヤ・デコーダ115と同様、コア・レイヤ・デコーダ130も、コア・レイヤ・ビットストリーム・パラメータをコア・レイヤ・オーディオ信号^s(n)に変換する。その後、拡張レイヤデコーダ135が、チャネル125からの拡張レイヤビットストリームと信号^s(n)とを使用して、拡張されたオーディオ出力信号^s(n)を生成する。
かかる組み込み型符号化システムの主な利点は、特定のチャネル125が質の高いオーディオ符号化アルゴリズムと関連付けられた帯域幅要件を一貫してサポートできるとは限らないという点である。しかし、組み込み型コーダにより、チャネル125から部分的なビットストリーム(例えばコア・レイヤ・ビットストリームのみ)を受信して、例えば、拡張レイヤビットストリームが消失または破損したときにコア出力オーディオだけを生成することができる。ただし、組み込み型コーダと非組み込み型コーダとの間、さらには組み込み型符号化のさまざまな最適化目的の間でも、質のトレードオフが存在する。すなわち、質の高い拡張レイヤ符号化は、コアレイヤと拡張レイヤとの間のバランスを改善するのに役立ち得ると共に、全体的なデータレートの低下によって伝送特性(渋滞の低減など)が向上するため、拡張レイヤのパケットエラー率が低下し得る。
先行技術による拡張レイヤエンコーダ120のより詳細な実施形態が図2に挙げられている。ここで、エラー信号ジェネレータ210は、エラー信号エンコーダ220により、処理のためにMDCT(Modified Discrete Cosine Transform:変形離散コサイン変換)領域に形態変換される重み付き差分信号から成る。エラー信号Eは、次式によって与えられる。
E=MDCT{W(s−s)} (1)
式中、Wはコア・レイヤ・デコーダ115からのLP(線形予測)フィルタ係数A(z)に基づいた概念的な重み付き行列であり、sは入力オーディオ信号s(n)からのサンプルのベクトル(すなわちフレーム)、sはコア・レイヤ・デコーダ115からの対応するサンプルのベクトルである。MDCTプロセス例が、ITU−T勧告G.729.1に記載されている。その後エラー信号Eがエラー信号エンコーダ220によって処理されてコード語iを生み出し、このコード語はその後チャネル125に送信される。本実施形態では、エラー信号エンコーダ120がただ1つのエラー信号Eで表され、関連付けられた1つのコード語iを出力するという点に注意することが重要である。その理由は、後で明らかになるであろう。
拡張レイヤデコーダ135はその後、チャネル125からエンコードされたビットストリームを受信し、ビットストリームを適切に非多重化してコード語iを生成する。エラー信号デコーダ230は、コード語iを使用して拡張レイヤエラー信号^Eを再構築する。次にこのエラー信号は、信号コンバイナ240によって以下のとおりコアレイヤ出力オーディオ信号^s(n)と組み合わされ、拡張オーディオ出力信号^s(n)を生成する。
^s=s+W−1MDCT−1{^E} (2)
式中、MDCT−1は逆MDCT(Overlap−Addを含む)であり、W−1は概念的な逆重み付き行列である。
拡張レイヤエンコーダの別の実施例が図3に示されている。ここでは、エラー信号ジェネレータ315によるエラー信号Eの生成が適応型プリスケーリングを伴い、その際にコア・レイヤ・オーディオ出力s(n)に対する何らかの改変が実行される。このプロセスにより、複数のビットが生成され、それらがコード語iとして拡張レイヤエンコーダ120に示される。
加えて、拡張レイヤエンコーダ120は、入力オーディオ信号s(n)および変換されたコアレイヤ出力オーディオSがエラー信号エンコーダ320に入力されている様子を示す。これらの信号は、拡張レイヤエラー信号Eの改善された符号化用の音響心理モデルを構築する目的で使用される。その後コード語iおよびiは、MUX325によって多重化された後、チャネル125に送られ、拡張レイヤデコーダ135によって以降のデコードが行われる。符号化されたビットストリームはdemux335によって受信され、ビットストリームを成分iとiとに分けられる。その後、コード語iは、エラー信号デコーダ340によって使用され、拡張レイヤエラー信号^Eを再構築する。信号コンバイナ345は、スケーリングビットiを使用した方法で信号^s(n)をスケーリングした後、結果を拡張レイヤエラー信号^Eと組み合わせて、拡張オーディオ出力信号^s(n)を生成する。
本発明の第1実施形態が図4に示されている。この図は、スケーリングユニット415によってコアレイヤ出力信号s(n)を受信する拡張レイヤエンコーダ410を示している。複数のスケーリングされたコアレイヤ出力信号{S}を生成するために、所定のゲインの組{g}が使用される。式中、gおよびSは、それぞれの組のj番目の候補である。スケーリングユニット415内で、第1実施形態が(MDCT)領域で信号s(n)信号を処理する式は以下のとおり。
=G×MDCT{Ws};0≦j<M (3)
式中、Wは何らかの概念的な重み付き行列であり得、sはコア・レイヤ・デコーダ115からのサンプルのベクトルであり、MDCTは当該技術において周知の動作であり、Gはゲインベクトル候補gを利用して形成されるゲイン行列であり得、Mはゲインベクトル候補の数である。第1実施形態では、数多くの可能性が存在するが、Gがベクトルgを対角線として使用し、その他の場所ではゼロ(すなわち、対角行列)を使用する。例えば、Gは帯行列であり得るか、恒等行列Iによって乗算される単純なスカラ量でさえあり得る。あるいは、時間領域に信号Sを残すことに何らかの利点が存在し得る場合もあれば、オーディオを離散型フーリエ変換(DFT)領域など異なる領域に変換した方が有利である場合もあり得る。かかる多くの変換は、当該技術において周知である。これらの場合では、スケーリングユニットがそれぞれのベクトル領域に基づいて適切なSを出力し得る。
しかしいずれにせよ、コアレイヤ出力オーディオをスケーリングする第1の理由は、入力信号とコア・レイヤ・コーデックとの間で有意な差をもたらし得るモデルの不一致(またはその他何らかの符号化欠陥)を補償することである。例えば、入力オーディオ信号が主として楽音信号であり、コア・レイヤ・コーデックがスピーチモデルに基づいている場合、コアレイヤ出力は大きく歪んだ信号特性を含み得る。その場合には、1つもしくは複数の拡張レイヤを経由して信号を追補的に符号化する前に、この信号成分のエネルギーを選択的に低減する方が、音質という点から見て有益である。
ゲインスケーリングされたコア・レイヤ・オーディオ候補ベクトルSおよび入力オーディオs(n)は、その後エラー信号ジェネレータ420への入力として使用され得る。例示的実施形態では、SおよびSが対応して整合するように入力オーディオ信号s(n)がベクトルSに変換される。すなわち、s(n)を表しているベクトルsは、sと時間(フェーズ)的に整合しており、対応する動作は、本実施形態において、次式で表されるように適用され得る。
=MDCT{Ws}−S;0≦j<M (4)
この式は、入力オーディオと、MDCTスペクトル領域におけるゲインスケーリングされたコアレイヤ出力オーディオとの間の重み付き差分を表す複数のエラー信号ベクトルEを生じる。さまざまな領域が考慮される他の実施形態では、それぞれの処理領域に基づいて上記の式が改変され得る。
その後、本発明の第1実施形態に従ってゲインセレクタ425を使用して複数のエラー信号ベクトルEが求められ、最適なエラーベクトルE、最適なゲインパラメータg、続いて対応ゲインインデックスiを生成する。ゲインセレクタ425は、さまざまな方法を用いて最適なパラメータEとgとを決定する。具体的には、閉ループ方式(歪み距離の最小化など)、開ループ方式(ヒューリスティック分類、モデル性能推定など)、または両方式の組み合わせを伴い得る。例示的実施形態では、バイアスされた歪み距離が使用され得る。この距離は次式で表され、元のオーディオ信号ベクトルSと再構築されたコンポジット信号ベクトルとの間のバイアスされたエネルギー差分として与えられる。
Figure 2012512441
式中、^Eはエラー信号ベクトルEの量子化された推定値、βは、概念上最適なゲイン・エラー・インデックスjを選択するという決定を補完する目的で使用されるバイアス項であり得る。信号ベクトルのベクトル量子化のための例示的な方法が、「APPARATUS AND METHOD FOR LOW COMPLEXITY COMBINATORIAL CODING OF SIGNALS(信号の低複雑度組み合わせコーディングのための装置および方法)」と題する米国特許出願番号第11/531122号に記載されているが、他にも数多くの方法が可能である。E=S−Sと認識すると、等式(5)は以下のように書き直され得る。
Figure 2012512441
この式で、項ε=|E−^Eは、非量子化されたエラー信号と量子化されたエラー信号との間のエネルギー差を表す。明瞭化のために、この量は「残余エネルギー」と呼ばれることがあり、「ゲイン選択基準」を評価する目的でさらに使用され得る。この場合には、最適ゲインパラメータgが選択される。かかるゲイン選択基準は等式(6)で表されるが、多数の表示形態が可能である。
等式(3)および(4)におけるエラー重み付け関数Wがベクトル^E全体で等しく認識可能な歪みを十分に生成することができない場合から、バイアス項βの必要性が生じ得る。例えば、エラー重み付け関数Wは、エラースペクトルをある程度「白く」しようとする目的で使用され得るものの、人間の耳による歪みの認識を理由に、低周波数に対する重みを増やすことに一定の利点が存在し得る。低周波数におけるエラーの重み付けを増やした結果、高周波数信号は、拡張レイヤによって不完全にモデル化され得る。これらの場合では、Sの高周波数成分を減衰させないgの値の方へ歪みの大きさをバイアスすることに直接的な利点があり得るため、高周波数を不完全にモデル化しても、最終的に再構築されたオーディオ信号の響きが不快あるいは不自然にはならない。かかる一例が、無声スピーチ信号の場合である。この場合では、入力オーディオが、人間の口から生じた空気の乱流から生み出される中高周波数の雑音のような信号で構成されるのが一般的である。コア・レイヤ・エンコーダはこのタイプの波形を直接符号化しないかもしれないが、雑音モデルを使用して同様の響きを有するオーディオ信号を生成し得る。その結果、入力オーディオとコアレイヤ出力オーディオ信号との間の相関は一般に低くなり得る。ただし、本実施形態では、エラー信号ベクトルEが入力オーディオとコア・レイヤ・オーディオ出力信号との差異に基づいている。これらの信号はあまり相関していない可能性があるので、エラー信号Eのエネルギーが、入力オーディオまたはコアレイヤ出力オーディオより必ずしも低いとは限らない。そのような場合では、等式(6)でエラーを最小化すると、ゲインスケーリングが過剰になる場合があり、結果的に可聴アーティファクトの可能性が生じ得る。
別の場合では、バイアス係数βが、入力オーディオおよび/またはコアレイヤ出力オーディオ信号の他の信号特性に基づき得る。例えば、信号のスペクトルのピーク対平均値比は、その信号のハーモニックコンテントを示し得る。話し言葉やある種の音楽などの信号は、高いハーモニックコンテントを有し得ることから、高いピーク対平均値比を有し得る。ただし、スピーチコーデックによって処理された楽音信号は、符号化モデルの不一致により低質となり得る。その結果、コアレイヤ出力信号スペクトルが、入力信号スペクトルと比較したときに低いピーク対平均値比を有し得る。このような場合では、コアレイヤ出力オーディオが低エネルギーにゲインスケーリングできるようにするために、最小化プロセスにおけるバイアスの量を減らすのが有益である場合があり、それによって拡張レイヤ符号化がコンポジット出力オーディオにより顕著な影響を及ぼし得る。逆に言えば、ある種のスピーチまたは音楽入力信号は、低いピーク対平均値比を呈し得る。その場合、その信号は雑音が多いものとして認識され得るため、エラーバイアスを増やすことにより、コアレイヤ出力オーディオのスケーリング減少による便益が生まれ得る。βのバイアス係数を生成するための関数例は次式のとおりである。
Figure 2012512441
式中、λは何らかのしきい値であり、ベクトルφのピーク対平均値比は次式によって表され得る。
Figure 2012512441
式中yk1k2は、y(k)のベクトルサブセットであり、yk1k2=y(k);k≦k≦kである。
最適なゲインインデックスjが等式(6)から決定されると、関連付けられたコード語iが生成され、最適なエラーベクトルEがエラー信号エンコーダ430に送られる。Eは、(MUX 440により、)他のコード語との多重化に適した形態に符号化されて送信され、対応するデコーダによって使用される。例示的実施形態では、エラー信号エンコーダ408が、階乗パルス符号化(FPC)を使用する。ベクトルEの符号化と関連付けられた列挙プロセスが、^Eを生成する目的で使用されるベクトル生成プロセスから独立しているため、この方法は処理の複雑さという点から見て有利である。
拡張レイヤデコーダ450は、これらのプロセスを逆転させて、拡張オーディオ出力^s(n)を生成する。具体的には、iおよびiがデコーダ450によって受信され、iがデマルチプレクサ455によってエラー信号デコーダ460に送信され、そこで最適なエラーベクトルEがコード語から導かれる。最適なエラーベクトルEは信号コンバイナ465に渡され、受信した^s(n)が等式(2)などで改変され、^s(n)を生成する。
本発明の第2実施形態は、図5に示すとおり、マルチレイヤ組み込み型符号化システムを伴う。ここでは、本実施例を対象とする5つの組み込み型レイヤがあることが確認できる。レイヤ1および2は共にスピーチ・コーデック・ベース・レイヤ、レイヤ3、4および5は、MDCT拡張レイヤであり得る。そのため、エンコーダ502および503は、スピーチコーデックを利用して、エンコードされた入力信号s(n)を生み出し、出力する。エンコーダ510、610および514は拡張レイヤエンコーダを備え、各々が、エンコードされた信号に対する異なる拡張を出力する。先述の実施形態と同様、レイヤ3(エンコーダ510)のエラー信号ベクトルは、次式によって表され得る。
=S−S (9)
式中、S=MDCT{Ws}は、重み付けされた変換済み入力信号であり、S=MDCT{Ws}は、レイヤ1/2のデコーダ506から生成された、重み付けされた変換済み信号である。本実施形態では、レイヤ3が低速量子化レイヤであり得るため、対応する量子化されたエラー信号^E=Q{E}を符号化するための比較的少数のビットが存在し得る。これらの制約下で優れた質を提供するために、E内の係数の一部分だけが量子化され得る。符号化される係数の位置は一定または可変であり得るが、変化することが許可されている場合には、これらの位置を特定するためにデコーダに追加情報を送る必要があり得る。例えば、符号化された位置の範囲の始点がkで終点がkであり、0≦k<k<Nであれば、量子化されたエラー信号ベクトル^Eは、その範囲内でのみゼロ以外の値を含む場合があり、その範囲から外れた位置はゼロになる。使用される符号化方法に応じて、位置・範囲情報は暗黙的でもあり得る。例えば、周波数帯が認識上重要であると考えられ得ること、および信号ベクトルの符号化はそれらの周波数に集中し得ることは、オーディオ符号化において周知である。これらの状況では、符号化範囲が可変であってよく、連続する周波数の組に及んではならない。しかし、いずれにせよ、この信号が量子化されると、コンポジット符号化出力スペクトルは次式によって構成され得る。
=^E+S (10)
このスペクトルはその後、レイヤ4エンコーダ610への入力として使用される。
レイヤ4のエンコーダ610は、先述の実施形態の拡張レイヤエンコーダ410と似ている。ゲインベクトル候補gを使用した場合、対応するエラーベクトルは次式のように記述され得る。
(j)=S−G (11)
式中、Gはベクトルgを対角成分とするゲイン行列であり得る。ただし本実施形態において、ゲインベクトルgは量子化されたエラー信号ベクトル^Eと以下のように関連し得る。量子化されたエラー信号ベクトル^Eは、例えばベクトル位置kを始点とし、ベクトル位置kを終点とする周波数範囲に制限され得るため、レイヤ3の出力信号Sは、その範囲内でかなり正確に符号化されるものと推定される。そのため、本発明によれば、ゲインベクトルgは、レイヤ3のエラー信号ベクトルkとkとの符号化位置に基づいて調整される。具体的には、それらの箇所で信号の完全性を維持するために、対応する個々のゲイン要素は一定値αに設定され得る。つまり次式のとおりである。
Figure 2012512441
式中、0≦γ(k)≦1であり、g(k)がj番目の候補ベクトルのk番目の位置のゲインであるのが一般的である。例示的実施形態では、定数の値が1(α=1)だが、多くの値が可能である。加えて、周波数範囲は複数の起点および終点位置に及び得る。すなわち、等式(12)は、エラー信号^Eの何らかの関数に基づいた連続しない可変ゲイン範囲に分割され、一般的には次式で書き表され得る。
Figure 2012512441
本実施例の場合、前に量子化されたエラー信号^Eにおける対応位置がゼロでなければ、一定ゲインαがg(k)を生成する目的で使用され、^Eにおける対応位置がゼロであれば、ゲイン関数γ(k)が使用される。1つの潜在的なゲイン関数は、次式のように定義され得る。
Figure 2012512441
式中、Δはステップサイズ(例えばΔ〜2.2dB)であり、αは定数であり、Mは候補の数(例えばM=4であれば、2ビット使用するだけで表すことができる)であり、kおよびkはそれぞれ低周波および高周波カットオフ値であり、これらの値を超えると、ゲインリダクションが行われ得る。パラメータkおよびkの導入は、特定の周波数範囲でのみスケーリングが所望されるシステムで有用である。例えば、所与の実施形態では、高周波がコアレイヤによって適切にモデル化されないため、高周波数帯域内のエネルギーが、入力オーディオ信号におけるエネルギーよりも本質的に低い場合がある。そのような場合では、全体的なエラーエネルギーが結果的に増大し得るため、その領域信号でレイヤ3の出力をスケーリングすることにメリットがほとんどないか、皆無である。
要約すると、複数のゲインベクトル候補gは、先に符号化された信号ベクトル、この場合では^Eの何らか関数に基づいている。これは一般に次式で表すことができる。
(k)=f(k,^E) (15)
対応するデコーダの動作が図5の右側に示されている。符号化ビットストリーム(iからi)の各種レイヤが受信されると、より質の高い出力信号がコアレイヤ(レイヤ1)デコーダを経て拡張レイヤの階層に構築される。すなわち、この実施形態であれば、最初の2層が時間領域スピーチモデル符号化(CELPなど)から成り、残りの3層が変換領域符号化(MDCTなど)から成り、システムの最終的な出力^s(n)が次式に従って生成される。
Figure 2012512441
式中、^e(n)は、レイヤ2の時間領域拡張レイヤ信号であり、^S=MDCT{Ws}は、レイヤ2のオーディオ出力^s(n)に対応する重み付きMDCTベクトルである。この式では、全体出力信号^s(n)が、受信される連続ビットストリームレイヤの最上位レベルから決定され得る。本実施形態では、低レベルレイヤの方が、チャネルから適切に受信される可能性が高いため、コード語セット{i}、{i}、{i}などが、等式(16)における拡張レイヤデコードの適正レベルを決定すると仮定される。
図6は、レイヤ4のエンコーダ610とデコーダ650とを示すブロック図である。図6に示すエンコーダおよびデコーダは、図4に示すものと似ているが、スケーリングユニット615および670によって使用されるゲイン値が、それぞれ周波数選択型ゲインジェネレータ630および660を介して導かれるという点が異なる。動作時、レイヤ3のオーディオ出力Sは、レイヤ3のエンコーダから出力され、スケーリングユニット615によって受信される。加えて、レイヤ3のエラーベクトル^Eは、レイヤ3のエンコーダ510から出力され、周波数選択型ゲインジェネレータ630によって受信される。既述のとおり、量子化されたエラー信号ベクトル^Eは周波数範囲が制限され得るため、例えばゲインベクトルgは、等式12に示す位置kおよびkなどに基づいて調整される。等式13に、さらに一般的な式が示されている。
スケーリングされたオーディオSは、スケーリングユニット615から出力され、エラー信号ジェネレータ620によって受信される。上記のとおり、エラー信号ジェネレータ620は、入力オーディオ信号Sを受信し、スケーリングユニット615によって利用されるスケーリングベクトルごとにエラー値Eを決定する。これらのエラーベクトルは、エラーベクトルと、最適なゲイン値gに基づいて特定のエラーEとを決定する際に使用されたゲイン値と共に、ゲインセレクタ回路635に渡される。最適なゲインgがゲインセレクタ635から出力されていることを表すコード語(i)が、最適エラーベクトルEと共にエラー信号エンコーダ640に渡され、そこでコード語iが決定および出力される。iおよびiは共にマルチプレクサ645に出力され、チャネル125を経由してレイヤ4のデコーダ650に送信される。
レイヤ4のデコーダ650の動作時にiおよびiがチャネル125から受信され、デマルチプレクサ655によって非多重化される。ゲインコード語iおよびレイヤ3のエラーベクトル^Eは、周波数選択型ゲインジェネレータ660への入力として使用され、エンコーダ610の対応方法に従ってゲインベクトルgを生成する。その後ゲインベクトルgは、スケーリングユニット670内のレイヤ3の再構築されたオーディオベクトル^Sに適用され、その出力はその後、コード語iのデコードによってエラー信号デコーダ655から取得されたレイヤ4の拡張レイヤ・エラー・ベクトルEと信号コンバイナ675で組み合わされ、図示するとおり、レイヤ4の再構築されたオーディオ出力^Sを生成する。
図7は、本発明の第1および第2の実施形態にかかるエンコーダの動作を示すフローチャート700である。上記のとおり、両実施形態は、複数のスケーリング値でエンコードされたオーディオをスケーリングし、その後そのスケーリング値を選択してエラー値を最小化する拡張レイヤを利用する。ただし、本発明の第2の実施形態では、ゲイン値を生成するために周波数選択型ゲインジェネレータ630が利用される。
論理フローが始まるのはブロック710で、コア・レイヤ・エンコーダが、符号化される入力信号を受信し、入力信号を符号化して符号化オーディオ信号を生成する。拡張レイヤエンコーダ410が符号化オーディオ信号(s(n))を受信し、スケーリングユニット415が、符号化オーディオ信号を複数のゲイン値でスケーリングして、関連付けられたゲイン値を各々が有する複数のスケーリングされた符号化オーディオ信号を生成する(ブロック720)。ブロック730で、エラー信号ジェネレータ420が、入力信号と、複数のスケーリングされた符号化オーディオ信号の各々との間に存在する複数のエラー値を決定する。その後、ゲインセレクタ425が複数のゲイン値からゲイン値を選択する(ブロック740)。上記のとおり、ゲイン値(g)は、スケーリングされた符号化オーディオ信号と関連付けられており、入力信号と、スケーリングされた符号化オーディオ信号との間に低エラー値(E)が存在する結果となる。最後にブロック750で、トランスミッタ440が低エラー値(E)をゲイン値(g)と共に、拡張レイヤの一部として符号化オーディオ信号に送信する。当業者であれば承知のとおり、送信前にEとgとの両方が適切にエンコードされる。
上記のとおり、受信側で、符号化オーディオ信号は、拡張レイヤと共に受信される。拡張レイヤは、ゲイン値(g)と、ゲイン値と関連付けられたエラー信号(E)とを備える符号化オーディオ信号に対する拡張である。
ステレオ用コア・レイヤ・スケーリング
上記説明では、組み込み型符号化システムについて説明されており、そこではレイヤの各々がモノラル信号を符号化していた。ここからは、ステレオまたは他のマルチチャネル信号を符号化するための組み込み型符号化システムについて説明する。簡潔化のため、2つのオーディオ入力(ソース)から成るステレオ信号という状況における技術について説明しているが、本明細書に記載されている例示的実施形態は、マルチ・チャネル・オーディオ入力の場合と同様、ステレオ信号が2つより多いオーディオ入力を有する場合にまで容易に拡大することができる。限定ではなく例示のために、2つのオーディオ入力は、左側の信号(S)と右側の信号(S)とから成るステレオ信号、式中SおよびSはオーディオデータのフレームを表すn次元の列ベクトルとする。再度簡潔化のために、コアレイヤおよび拡張レイヤという2つの層から成る組み込み型符号化システムについて詳細に述べる。提案される考えは、マルチレイヤ組み込み型符号化システムにまで容易に拡大することができる。また、コーデック自体は組み込むことができず、すなわち1層のみ有することができ、そのコーデックの一部のビットはビットのステレオ専用であり、残りのビットがモノラル信号である。
単にモノラル信号を符号化するだけのコアレイヤと、高周波数またはステレオ信号を符号化する拡張レイヤとから成る組み込み型ステレオコーデックが知られている。その限られた場面において、コアレイヤは、SとSとの組み合わせから取得されるモノラル信号(s)を符号化して、符号化されたモノラル信号^sを生成する。Hは、モノラル信号の生成に使用される2×1の組み合わせ行列であり、次式で表される。
s=(s)H (17)
なお、等式(17)では、Sが単なる右側チャネル信号ではなく、右側オーディオ信号の遅延バージョンであり得る。この遅延は、例えば、Sの相関とSの遅延バージョンとを最大化する目的で計算され得る。行列Hが[0.5 0.5]であれば、等式17によって左右それぞれのチャネルの重み付けが等価、すなわちs=0.5s+0.5sとなる。本明細書に記載されている実施形態は、モノラル信号を符号化するコアレイヤと、ステレオ信号を符号化する拡張レイヤとに制限されない。組み込み型コーデックのコアレイヤおよび拡張レイヤは共に、マルチ・チャネル・オーディオ信号を符号化し得る。コア・レイヤ・マルチチャネルによって符号化されるマルチ・チャネル・オーディオ信号におけるチャネル数は、拡張レイヤによって符号化され得るマルチ・チャネル・オーディオ信号におけるチャネル数よりも少ない場合がある。(m,n)は、それぞれコアレイヤと拡張レイヤとによって符号化されるチャネルの数とする。S、S、S、...、Sは、組み込み型システムによって符号化されるn個の音声チャネルを表すものとする。コアレイヤによって符号化されるmチャネルはこれらから導かれ、次式によって取得される。
[s...s]=[s...s]H (17a)
式中、Hはn×mの行列である。
先述のとおり、コアレイヤは、モノラル信号sをエンコードして、コアレイヤによって符号化された信号^sを生成する。^sからステレオ成分の推定値を生成するために、バランス係数が計算される。このバランス係数は、次式のように演算される。
Figure 2012512441
組み合わせ行列Hが[0.5 0.5]であれば、次式のように表わすことができる。
=2−w(19)
この比は、1つのパラメータのみの量子化を可能にし、他は最初のパラメータから容易に抽出可能であるできることに注意されたい。ステレオ出力は、次式によって計算される。
^s=w^s、^s=w^s (20)
次のセクションでは、時間領域ではなく周波数領域について説明する。周波数領域内の対応信号は大文字で表記される。すなわち、S、^S、S、S、^S、および^Sは、それぞれs、^s、s、s、^s、および^sの周波数領域信号を表す。周波数領域におけるバランス係数は、周波数領域の項を使用して演算され、次式によって計算される。
Figure 2012512441
かつ
^S=W^S,^S=W^S (22)
周波数領域では、これらのベクトルが、重複しないサブベクトルにさらに分割され得る。すなわち、次元数nのベクトルSであれば、次式で表される次元数m、m、...mのt個のサブベクトル、S、S、...、Sに分割され得る。
Figure 2012512441
この場合、異なるサブベクトルに対して異なるバランス係数を演算すること、すなわち次式のように表すことができる。
Figure 2012512441
この事例におけるバランス係数は、ゲインが考慮されていない。
次に図8および図9を参照すると、ステレオおよび他のマルチチャネル信号に関連する先行技術による図面が示されている。図8の先行技術による組み込み型スピーチ/オーディオ圧縮システム800は、図1と似ているが、本実施例で左右のステレオ入力信号S(n)で示されているマルチオーディオ入力信号を有する。これらの入力オーディオ信号は、図示のとおり入力オーディオs(n)を生成するコンバイナ810に供給される。これら複数の入力信号は、図示のとおり拡張レイヤエンコーダ820にも提供される。デコード側では、拡張レイヤデコーダ830が、図示のとおり拡張出力オーディオ信号^s ^sを生成する。
図9は、図8で使用され得る従来の拡張レイヤエンコーダ900を表す。図示のとおり、複数のオーディオ入力が、コアレイヤ出力オーディオ信号と共にバランス係数ジェネレータに提供される。拡張レイヤエンコーダ910のバランス係数ジェネレータ920が、複数のオーディオ入力を受信して信号iを生成する。この信号は、図示のとおりMUX325に渡される。信号iは、バランス係数の表現(representation)である。好適な実施形態では、iが、バランス係数を表すビットシーケンスである。デコーダ側では、この信号iが、図示のとおりバランス係数要素W(n)とW(n)とを生成するバランス係数デコーダ940によって受信され、図示のとおり信号コンバイナ950によって受信される。
マルチチャネルバランス係数演算
先述のとおり、多くの状況で、モノラル信号の符号化のために使用されるコーデックはシングル・チャネル・スピーチ用に設計されているため、コーデックモデルによって完全にはサポートされていない信号の符号化に使用されると、必ず符号化モデルノイズを生む。楽音信号および他の非スピーチ信号は、スピーチモデルに基づいたコア・レイヤ・コーデックによって適切にモデル化されない信号の例である。上記説明では、図1〜図7に関して、コアレイヤによって符号化された信号に周波数選択型ゲインを適用することが提案された。オーディオ入力と、スケーリングされ符号化された信号との間での特定の歪み(エラー値)を最小化するために、スケーリングが最適化された。上記の手法は、シングルチャネル信号の場合には良好に機能するが、拡張レイヤがステレオまたは他のマルチチャネル信号を符号化しているときにコア・レイヤ・スケーリングを適用するには最適でない場合がある。
ステレオ信号などマルチチャネル信号のモノラル成分は2つ以上のステレオオーディオ入力の組み合わせから取得されるため、組み合わされた信号sもシングル・チャネル・スピーチ・モデルに適合し得ないことから、組み合わされた信号を符号化するときに、コア・レイヤ・コーデックがノイズを生み出し得る。そのため、組み込み型符号化システムでコアレイヤによって符号化された信号のスケーリングを可能にし、それによって、コアレイヤによって生成されるノイズを減らす手法に対する必要性がある。上記のモノラル信号手法では、周波数選択型スケーリングを取得した際の特定の歪みの測定が、モノラル信号におけるエラーに基づいていた。このエラーE(j)は、上の等式(11)で表される。しかし、モノラル信号の歪みだけでは、ステレオ通信システムの質を改善するのに十分でない。等式(11)に含まれるスケーリングは、単位スケーリング係数(1)による場合、またはその他任意の恒等関数による場合がある。
ステレオ信号の場合には、歪み測定値によって、左右両チャネルの歪みを捕捉するべきである。EとEとを、それぞれ左および右のチャネルのエラーベクトルとし、これらは次式によって与えられる。
=S−^S、E=S−^S (25)
例えばAMR−WB+標準に記載されているとおり、先行技術では、これらのエラーベクトルが次式によって計算される。
=S−W・^S、E=S−W・^S (26)
次に、周波数選択型ゲインベクトルg(0≦j<M)が^Sに適用される場合を考える。この周波数選択型ゲインベクトルは、行列形態でGとして表記され、式中Gは、対角要素gを有する対角行列である。各ベクトルGについて、エラーベクトルは次式によって計算される。
(j)=S−W・G・^S、E(j)=S−W・G・^S (27)
ステレオ信号の推定値が、項W・G・^Sによって与えられる。ゲイン行列Gが単位行列(1)またはその他任意の対角行列であり得ることが確認でき、すべての潜在的推定値がスケーリングされたすべての信号に対して実行され得るわけではないことが認識される。
ステレオの質を改善するために最小化される歪み測定値εは、2つのエラーベクトルの関数であり、すなわち次式によって表される。
ε=f(E(j)、E(j)) (28)
歪み値が複数の歪み測定値から成り得ることが確認できる。
選択されている周波数選択型ゲインベクトルのインデックスjは、次式によって与えられる。
Figure 2012512441
例示的実施形態では、歪み測定値が、次式によって表される平均二乗歪みである。
ε=‖E(j)‖+‖E(j)‖ (30)
あるいは、次式によって表される重み付けまたはバイアスされた歪みであり得る。
ε=B‖E(j)‖+B‖E(j)‖ (31)
バイアスBおよびBは、左および右のチャネルのエネルギーの関数であり得る。
先述のとおり、周波数領域では、ベクトルが重複しないサブベクトルにさらに分割され得る。提案された技法を、周波数領域ベクトルをサブベクトルに分割することを含むように拡大するために、(27)で使用するバランス係数は、サブベクトルごとに演算される。したがって、各周波数選択型ゲインのエラーベクトルEおよびEは、次式によって与えられるエラー・サブ・ベクトルの連結によって形成される。
Lk(j)=SLk−WLk・Gjk・^S、ERk(j)=SRk−WRk・Gjk・^S (32)
(28)における歪み測定値εは、上記エラー・サブ・ベクトルの連結によって形成されたエラーベクトルの関数ということになる。
バランス係数の演算
先行技術を使用して生成されたバランス係数(等式21)は、コアレイヤの出力から独立している。しかし、(30)および(31)で求められる歪み測定値を最小化するために、バランス係数を演算して対応する歪みを最小化することも有益であり得る。バランス係数WおよびWは、次式によって演算され得る。
Figure 2012512441
式中、例えば図11の図面に示すとおり、バランス係数がゲインから独立していることが確認できる。この等式は、等式(30)と(31)とにおける歪みを最小化する。かかるバランス係数の使用に関する課題は、次式に示すとおりである。
(j)≠2−W(j) (34)
したがって、WとWとを量子化するために別々のビットフィールドが必要とされ得る。これは、最適化に際してW(j)=2−W(j)という制約を課すことによって回避され得る。この制約に伴い、等式(30)に最適解は、次式によって与えられる。
Figure 2012512441
式中、バランス係数は、図示のとおりゲイン項に依存する。図面の図10は、依存型バランス係数を表している。バイアス係数BおよびBが1つである場合には、次式が成立する。
Figure 2012512441
等式(33)と(36)とにおける項S^Sは、スケーリングされた符号化オーディオ信号と、マルチ・チャネル・オーディオ信号のうち少なくとも1つのオーディオ信号と間の相関値を表す。
ステレオ符号化では、平均二乗歪みよりも音源の方向と位置の方が重要であり得る。そのため、左チャネルのエネルギーと右チャネルのエネルギーとの比は、重み付き歪み測定値を最小化することよりもむしろ、方向(または音源の位置)をより良好に明示し得る。かかる場面では、等式(35)と(36)とで演算されたバランス係数が、バランス係数を計算するための良好な手法でない場合がある。必要なのは、符号化の前後で左右のチャネルのエネルギーの比を維持することである。符号化の前および後のチャネルのエネルギーの比は、それぞれ次式によって与えられる。
Figure 2012512441
これらの2つのエネルギー比を等しくし、W(j)=2−W(j)という仮定を使用することにより、次式が得られる。
Figure 2012512441
この式は、生成されたバランス係数のバランス係数成分を与える。なお、(38)で計算されたバランス係数は、Gから独立しているため、もはやjの関数ではなく、ゲインを考慮していない自己相関バランス係数を提供する。依存型バランス係数は、図面の図10にさらに示されている。この結果を等式29および32で使用することにより、次式に表すとおり、最適なコア・レイヤ・スケーリング・インデックスjの選択を、連結されたベクトル部分kを含むように拡張することができる。
Figure 2012512441
この式は、最適なゲイン値の表現である。このゲイン値jというインデックスが、拡張レイヤエンコーダの出力信号として送信される。
次に図10を参照すると、各種実施形態にかかる拡張レイヤエンコーダと拡張レイヤデコーダとのブロック図1000が示されている。入力オーディオ信号s(n)は、拡張レイヤエンコーダ1010のバランス係数ジェネレータ1050とゲイン・ベクトル・ジェネレータ1020のエラー信号(歪み信号)ジェネレータ1030とによって受信される。図示のとおり、コアレイヤ^S(n)からの符号化オーディオ信号は、ゲイン・ベクトル・ジェネレータ1020のスケーリングユニット1025によって受信される。スケーリングユニット1025は、複数のゲイン値で符号化オーディオ信号^S(n)をスケーリングするように動作して複数の符号化オーディオ信号の候補を生成し、それらの符号化オーディオ信号の候補のうち少なくとも1つがスケーリングされる。前述のとおり、1つまたは任意の所望の恒等関数によるスケーリングが用いられ得る。スケーリングユニット1025が、スケーリングされたオーディオSを出力し、この信号はバランス係数ジェネレータ1030によって受信される。拡張レイヤエンコーダ1010によって受信されるマルチ・チャネル・オーディオ信号のオーディオ信号と各々関連付けられている複数のバランス係数成分を有するバランス係数を生成することについては、等式(18)、(21)、(24)および(33)との関連ですでに述べられている。この処理は、図示のとおりバランス係数ジェネレータ1050によって達成され、バランス係数成分^S(n)、^S(n)を生成する。等式(38)との関連で既述のとおり、バランス係数ジェネレータ1030は、バランス係数をゲインから独立したものとして表している。
等式(27)、(28)および(29)で既述のとおり、ゲイン・ベクトル・ジェネレータ1020は、マルチ・チャネル・オーディオ信号の推定値を生成するために符号化オーディオ信号に適用されるゲイン値の決定を担う。この処理は、スケーリングユニット1025とバランス係数ジェネレータ1050とによって達成され、これらが協力して、バランス係数と少なくとも1つのスケーリングされた符号化オーディオ信号とに基づいた推定値を生成する。ゲイン値は、バランス係数とマルチ・チャネル・オーディオ信号とに基づいており、このゲイン値は、マルチ・チャネル・オーディオ信号とマルチ・チャネル・オーディオ信号の推定値との間の歪み値を最小化するように構成されている。等式(30)は、マルチチャネル入力信号の推定値と実際の入力信号自体との関数として歪み値を生成することを述べている。そのため、スケーリングユニット1025によって利用されるスケーリングベクトルごとにエラー値Eを決定するために、バランス係数成分が入力オーディオ信号s(n)と共に、エラー信号ジェネレータ1030によって受信される。これらのエラーベクトルは、エラーベクトルと、最適なゲイン値gに基づいた特定のエラーEとを決定する際に使用されたゲイン値と共に、ゲインセレクタ回路1035に渡される。その後、ゲインセレクタ1035が、潜在的なゲイン値の最適なゲインの表現gを決定するために、マルチチャネル入力信号の推定値と実際の信号自体とに基づいて歪み値を評価するように動作する。図示のとおり、最適なゲインgを表すコード語(i)がゲインセレクタ1035から出力され、MUXマルチプレクサ1040によって受信される。
およびiは共に、マルチプレクサ1040に出力され、トランスミッタ1045により、チャネル125を経由して拡張レイヤデコーダ1060に送信される。ゲイン値iの表現は、図示のとおりチャネル125への送信のために出力されるが、所望であれば格納しても良い。
デコーダ側では、拡張レイヤデコーダ1060の動作時に、iおよびiがチャネル125から受信され、デマルチプレクサ1065によって非多重化される。そのため、拡張レイヤデコーダは、符号化オーディオ信号^S(n)と、符号化されたバランス係数iと、符号化されたゲイン値iとを受信する。ゲイン・ベクトル・デコーダ1070は、図示のとおり、周波数選択型ゲインジェネレータ1075とスケーリングユニット1080とを備える。ゲイン・ベクトル・デコーダ1070は、符号化されたゲイン値から被復号ゲイン値を生成する。符号化されたゲイン値iは、エンコーダ1010の対応する方法に従ってゲインベクトルgを生成するために、周波数選択型ゲインジェネレータ1075に入力される。その後ゲインベクトルgはスケーリングユニット1080に適用され、被復号ゲイン値gで符号化オーディオ信号^S(n)をスケーリングして、スケーリングされたオーディオ信号を生成する。信号コンバイナ1095は、スケーリングされたオーディオ信号G^S(n)に対するバランス係数デコーダ1090の符号化されたバランス係数出力信号を受信して、拡張出力オーディオ信号として示されている被復号マルチ・チャネル・オーディオ信号を生成し、出力する。
上記等式(33)との関連で述べられている例示的な拡張レイヤエンコーダおよび拡張レイヤデコーダのブロック図1100では、バランス係数ジェネレータ1030が、ゲインに依存しているバランス係数を生成する。これは、G信号1110を生成するエラー信号ジェネレータによって表されている。
次に図12〜図14を参照すると、本明細書に記載されている各種実施形態の方法論を網羅するフローが示されている。図12のフロー1200には、マルチ・チャネル・オーディオ信号を符号化するための方法が示されている。ブロック1210で、複数のオーディオ信号を有するマルチ・チャネル・オーディオ信号が受信される。ブロック1220で、このマルチ・チャネル・オーディオ信号が符号化され、符号化オーディオ信号を生成する。符号化オーディオ信号は、図面に表されているステレオ信号などのモノラルまたはマルチチャネル信号であり得る。さらに、符号化オーディオ信号は、複数のチャネルを備え得る。コアレイヤには1つより多くのチャネルが存在する場合があり、拡張レイヤのチャネル数は、コアレイヤのチャネル数よりも多い場合がある。次にブロック1230で、マルチ・チャネル・オーディオ信号のオーディオ信号と各々関連付けられているバランス係数成分を有するバランス係数が生成される。等式(18)、(21)、(24)、(33)は、バランス係数の生成について説明している。各バランス係数成分は、等式(38)に示すとおり、生成された他のバランス係数成分に依存し得る。バランス係数を生成することは、等式(33)、(36)などで、スケーリングされた符号化オーディオ信号と、マルチ・チャネル・オーディオ信号のうちの少なくとも1つのオーディオ信号との間の相関値を生成することを含み得る。等式(38)に示すとおり、少なくとも1つのオーディオ信号間での自己相関が生成され、そこから平方根を生成することができる。ブロック1240で、バランス係数とマルチ・チャネル・オーディオ信号とに基づいてマルチ・チャネル・オーディオ信号の推定値を生成するために符号化オーディオ信号に適用されるゲイン値が決定される。ゲイン値は、マルチ・チャネル・オーディオ信号とマルチ・チャネル・オーディオ信号の推定値との間の歪み値を最小化するように構成される。等式(27)、(28)、(29)、(30)は、ゲイン値の決定について説明している。符号化オーディオ信号をスケーリングし、スケーリングされた符号化オーディオ信号を生成するために、複数のゲイン値からゲイン値が選択され得る。歪み値は、この推定値に基づいて生成され得る。ゲイン値は、この歪み値に基づき得る。ブロック1250で、ゲイン値の表現が、送信および/または格納のために出力される。
各種実施形態によれば、図13のフロー1300は、マルチ・チャネル・オーディオ信号を符号化するための別の方法論を説明している。ブロック1310で、複数のオーディオ信号を有するマルチ・チャネル・オーディオ信号が受信される。ブロック1320で、このマルチ・チャネル・オーディオ信号が符号化され、符号化オーディオ信号を生成する。ブロック1310および1320のプロセスは、先述のとおり、コア・レイヤ・エンコーダによって実行される。先述のとおり、符号化オーディオ信号は、図面に表されているステレオ信号などのモノラルまたはマルチチャネル信号であり得る。さらに、符号化オーディオ信号は、複数のチャネルを備え得る。コアレイヤには1つより多くのチャネルが存在する場合があり、拡張レイヤのチャネル数は、コアレイヤのチャネル数よりも多い場合がある。
ブロック1330で、符号化オーディオ信号が複数のゲイン値でスケーリングされて複数の符号化オーディオ信号の候補を生成し、これらの符号化オーディオ信号の候補のうちの少なくとも1つがスケーリングされる。スケーリングは、ゲイン・ベクトル・ジェネレータのスケーリングユニットによって達成される。既述のとおり、符号化オーディオ信号をスケーリングすることは、ゲイン値1つでスケーリングすることを含み得る。複数のゲイン値のうちのゲイン値は、先述のとおり、ベクトルgを対角成分として有するゲイン行列であり得る。このゲイン行列は周波数選択型であり得る。それはコアレイヤの出力、すなわち図面に表されている符号化オーディオ信号に依存する場合があり得る。符号化オーディオ信号をスケーリングし、スケーリングされた符号化オーディオ信号を生成するために、複数のゲイン値からゲイン値が選択され得る。ブロック1340で、マルチ・チャネル・オーディオ信号のオーディオ信号と各々関連付けられているバランス係数成分を有するバランス係数が生成される。バランス係数の生成は、バランス係数ジェネレータによって実行される。各バランス係数成分は、等式(38)に示すとおり、生成された他のバランス係数成分に依存し得る。バランス係数を生成することは、等式(33)、(36)などで、スケーリングされた符号化オーディオ信号と、マルチ・チャネル・オーディオ信号のうちの少なくとも1つのオーディオ信号との間の相関値を生成することを含み得る。等式(38)に示すとおり、少なくとも1つのオーディオ信号間での自己相関が生成され、そこから平方根を生成することができる。
ブロック1350で、バランス係数と少なくとも1つのスケーリングされた符号化オーディオ信号とに基づいてマルチ・チャネル・オーディオ信号の推定値が生成される。この推定値は、スケーリングされた符号化オーディオ信号と、生成されたバランス係数とに基づいて生成される。この推定値は、複数の符号化オーディオ信号の候補に対応する複数の推定値を備え得る。ブロック1360で、ゲイン値の最適なゲイン値の表現を決定するために、マルチ・チャネル・オーディオ信号の推定値とマルチ・チャネル・オーディオ信号とに基づいて歪み値が推定および/または生成され得る。この歪み値は、複数の推定値に対応する複数の歪み値を備え得る。この歪み値の推定値は、ゲインセレクタ回路によって達成される。最適なゲイン値は、等式(39)によって与えられる。ブロック1370で、ゲイン値の表現が、送信および/または格納のために出力され得る。拡張レイヤエンコーダのトランスミッタは、先述のとおりゲイン値の表現を送信することができる。
図14のフローチャート1400で実施されるプロセスは、マルチ・チャネル・オーディオ信号の復号を表している。ブロック1410で、符号化オーディオ信号、符号化されたバランス係数および符号化されたゲイン値が受信される。ブロック1420で、符号化されたゲイン値から被復号ゲイン値が生成される。ゲイン値は先述のとおりゲイン行列である場合があり、ゲイン行列は周波数選択型であり得る。ゲイン行列は、コアレイヤの出力として受信される符号化されたオーディオに依存している場合もある。さらに、符号化オーディオ信号は、モノラル信号であっても、図面に例示されているステレオ信号などのマルチチャネル信号であっても良い。加えて、符号化オーディオ信号は、複数のチャネルを備え得る。例えば、コアレイヤには1つより多くのチャネルが存在する場合があり、拡張レイヤのチャネル数は、コアレイヤのチャネル数よりも多い場合がある。
ブロック1430で、符号化オーディオ信号が被復号ゲイン値でスケーリングされ、スケーリングされたオーディオ信号を生成する。ブロック1440で、スケーリングされたオーディオ信号に符号化されたバランス係数が適用され、被復号マルチ・チャネル・オーディオ信号を生成する。ブロック1450で、被復号マルチ・チャネル・オーディオ信号が出力される。
ピーク検出に基づいた選択型スケーリングマスク演算
対角要素がゲインベクトルgを形成している対角行列である周波数選択型ゲイン行列Gは、上記(14)のように定義され得る。
Figure 2012512441
式中、Δはステップサイズ(例えばΔ〜2.0dB)であり、αは定数であり、Mは候補の数(例えばM=8であれば、3ビット使用するだけで表すことができる)であり、kおよびkはそれぞれ低周波および高周波カットオフ値であり、これらの値を超えると、ゲインリダクションが行われ得る。ここでkは、k番目のMDCTまたはフーリエ変換係数を表す。gは周波数選択型であるが、先のレイヤの出力からは独立していることに注意されたい。ゲインベクトルgは、先に符号化された信号ベクトル、この場合では^Sの符号化された要素の何らかの関数に基づき得る。これは次式で表現することができる。
(k)=f(k,^S) (41)
(2層より多い)マルチレイヤの組み込み型符号化システムで、ゲインベクトルgによってスケーリングされる出力^Sが、少なくとも前2層の寄与度から取得される。すなわち次式のとおりである。
^S=^E+^S (42)
式中、^Sは第1層(コアレイヤ)の出力であり、^Eは第2の層または第1の拡張レイヤの寄与度である。この場合、ゲインベクトルgが、先に符号化された信号ベクトル^Sの符号化された要素と、第1の拡張レイヤの寄与度との何らかの関数であり得る。
(k)=f(k,^S,^E) (43)
低い方の層の符号化モデルによる可聴ノイズの大半は谷に存在し、ピークには存在しないことが観察された。換言すれば、スペクトルピークに、元のスペクトルと符号化されたスペクトルとの間の良好な一致が存在する。そのため、ピークは変更すべきでない。すなわちスケーリングは谷に限定すべきである。この観察を好都合に使用するために、実施形態のうちの1つでは、等式(41)の関数が^Sのピークと谷とに基づいている。Ψ(^S)は、検出された^Sのピーク規模に基づいたスケーリングマスクとする。スケーリングマスクは、検出されたピークでゼロ以外の値を有するベクトル値関数である場合があり、すなわち次式によって表される。
Figure 2012512441
式中、^sは^Sのi番目の要素である。等式(41)は、次式のように改変することができる。
Figure 2012512441
ピーク検出にはさまざまな手法を用いることができる。好適な実施形態では、2つの重み付き平均化フィルタを通じて絶対スペクトル|^S|を渡し、フィルタ処理された出力を比較することによってピークが検出される。AおよびAは、2つの平均化フィルタの行列表現とする。lおよびl(l>l)は、2つのフィルタの長さとする。ピーク検出関数は次式として与えられる。
Figure 2012512441
式中、βは経験的しきい値である。
具体例として、図15と図16とを参照する。ここでは、MDCT領域における符号化された信号の絶対値|^S|が1510として両プロットに描かれている。この信号は「ピッチパイプ」からの音を表し、図示のとおり一定間隔の調和数列を成す。この信号の基本周波数は、スピーチ信号にとって妥当とみなされる範囲を超えているため、スピーチモデルに基づいたコア・レイヤ・コーダを使用してこの信号を符号化するのは困難である。そのため、相当高いレベルのノイズがコアレイヤによって生み出される。このノイズは、符号化された信号1510を元の信号|S|(1610)のモノラルバージョンと比較することによって観察することができる。
符号化された信号(1510)から、しきい値ジェネレータを使用して、等式45の式βA|^S|に対応するしきい値1520が生み出される。ここでAは、好適な実施形態で、長さ45の余弦窓で信号|^S|のコンボリューションを実装するコンボリューション行列である。数多くのウインドウ形状が可能であり、異なる長さを備え得る。また、好適な実施形態において、Aは恒等行列である。その後、ピーク検出器が信号1510をしきい値1520と比較して、1530として示すスケーリングマスクΨ(^S)を生成する。
その後、(等式45で与えられた)コア・レイヤ・スケーリング・ベクトル候補を使用して、符号化された信号|^S|のピーク間でノイズをスケーリングし、スケーリングされた再構築信号1620を生成することができる。最適候補は、上記等式39または他で記載されているプロセスに従って選択され得る。
次に図17〜図19を参照すると、各種実施形態に従って上記のピーク検出に基づいた選択型スケーリングマスク演算と関連付けられた方法論を表すフロー図が示される。図17のフロー図1700では、ブロック1710で、受信されたオーディオ信号の再構築されたオーディオベクトル^Sにおけるピークの組が検出される。このオーディオ信号は、複数の層に組み込まれ得る。再構築されたオーディオベクトル^Sは周波数領域に、ピークの組は周波数領域のピークに存在し得る。ピークの組の検出は、例えば等式(46)によって与えられるピーク検出関数に従って実行される。なお、すべてが減衰していてピークが存在しない場合のように、この組が空であることもある。ブロック1720で、検出されたピークの組に基づいたスケーリングマスクΨ(^S)が生成される。その後ブロック1730で、少なくともスケーリングマスクと、ゲインベクトルを表すインデックスjとに基づいたゲインベクトルgが生成される。ブロック1740で、スケーリングされた再構築オーディオ信号を生成するためのゲインベクトルを有する再構築オーディオ信号がスケーリングされる。ブロック1750で、オーディオ信号とスケーリングされた再構築オーディオ信号とに基づいて歪みが生成される。ブロック1760で、生成された歪みに基づいたゲインベクトルのインデックスが出力される。
次に図18を参照すると、フロー図1800は、ある実施形態にかかる、オーディオ信号をエンコードする代替実施形態を表す。ブロック1810で、オーディオ信号が受信される。このオーディオ信号は、複数の層に組み込まれ得る。オーディオ信号はその後、ブロック1820でエンコードされ、再構築されたオーディオベクトル^Sを生成する。再構築されたオーディオベクトル^Sは周波数領域に、ピークの組は周波数領域のピークに存在し得る。ブロック1830で、受信されたオーディオ信号の再構築されたオーディオベクトル^Sにおけるピークの組が検出される。ピークの組の検出は、例えば等式(46)によって与えられるピーク検出関数に従って実行される。なお、繰り返しになるが、すべてが減衰していてピークが存在しない場合のように、この組が空であることもある。ブロック1840で、検出されたピークの組に基づいたスケーリングマスクΨ(^S)が生成される。ブロック1850で、スケーリングマスクに基づいた複数のゲインベクトルgが生成される。再構築オーディオ信号は、ブロック1860で複数のゲインベクトルでスケーリングされ、複数のスケーリングされた再構築オーディオ信号を生成する。次にブロック1870で、オーディオ信号および複数のスケーリングされた再構築オーディオ信号とに基づいて複数の歪みが生成される。ブロック1880で、複数の歪みに基づいて複数のゲインベクトルからゲインベクトルが選択される。このゲインベクトルは、複数の歪みの最小の歪みと一致すべく選択され得る。ブロック1890で、ゲインベクトルを表すインデックスが出力され、送信および/または格納される。
上記の図17〜図18に表されたエンコーダのフローは、先述の装置構造によって実装することができる。フロー1700を参照すると、オーディオ信号を符号化するように動作可能な装置で、拡張レイヤエンコーダ1010のゲイン・ベクトル・ジェネレータ1020のゲインセレクタ1035などのゲインセレクタが、受信されたオーディオ信号の再構築されたオーディオベクトル^Sにおけるピークの組を検出し、検出されたピークの組に基づいてスケーリングマスクΨ(^S)を生成する。繰り返しになるが、このオーディオ信号は、複数の層に組み込まれ得る。再構築されたオーディオベクトル^Sは周波数領域に、ピークの組は周波数領域のピークに存在し得る。ピークの組の検出は、例えば等式(46)によって与えられるピーク検出関数に従って実行される。なお、信号内のすべてが減衰した場合には、ピークの組が存在しないこともあり得る。ゲイン・ベクトル・ジェネレータ1020のスケーリングユニット1025などのスケーリングユニットが、ゲインベクトルを表すスケーリングマスクとインデックスjとに少なくとも基づいてゲインベクトルgを生成し、ゲインベクトルで再構築オーディオ信号をスケーリングして、スケーリングされた再構築オーディオ信号を生成する。ゲイン・ベクトル・ジェネレータ1025のエラー信号ジェネレータ1030は、オーディオ信号とスケーリングされた再構築オーディオ信号とに基づいて歪みを生成する。拡張レイヤデコーダ1010のトランスミッタ1045などのトランスミッタは、生成された歪みに基づいてゲインベクトルSのインデックスを出力するように動作可能である。
図18のフロー1800を参照すると、オーディオ信号を符号化するように動作可能な装置で、エンコーダが、オーディオ信号を受信し、そのオーディオ信号をエンコードして、再構築されたオーディオベクトルSを生成する。ゲイン・ベクトル・ジェネレータ1020のスケーリングユニット1025などのスケーリングユニットが、受信されたオーディオ信号のオーディオベクトル^Sにおけるピークの組を検出し、検出されたピークの組に基づいてスケーリングマスクΨ(^S)を生成し、スケーリングマスクに基づいて複数のゲインベクトルgを生成し、複数のゲインベクトルで再構築オーディオ信号をスケーリングして、複数のスケーリングされた再構築オーディオ信号を生成する。エラー信号ジェネレータ1030は、このオーディオ信号と、複数のスケーリングされた再構築オーディオ信号とに基づいて複数の歪みを生成する。ゲインセレクタ1035などのゲインセレクタは、複数の歪みに基づいて、複数のゲインベクトルからゲインベクトルを選択する。例えば、トランスミッタ1045は、ゲインベクトルを表すインデックスを出力する。この出力は、後に伝送および/または格納される。
図19のフロー図1900には、オーディオ信号を復号する方法が表されている。ブロック1910で、再構築されたオーディオベクトル^Sおよびゲインベクトルを表すインデックスが受信される。ブロック1920で、再構築されたオーディオベクトルにおけるピークの組が検出される。ピークの組の検出は、例えば等式(46)によって与えられるピーク検出関数に従って実行される。なお、繰り返しになるが、すべてが減衰していてピークが存在しない場合のように、この組が空であることもある。ブロック1930で、検出されたピークの組に基づいたスケーリングマスクΨ(^S)が生成される。ブロック1940で、少なくともスケーリングマスクと、ゲインベクトルを表すインデックスとに基づいたゲインベクトルgが生成される。ブロック1950で、この再構築オーディオ信号がゲインベクトルでスケーリングされ、スケーリングされた再構築オーディオ信号を生成する。この方法は、再構築されたオーディオベクトルに対する拡張を生成すること、その後、拡張された復号信号を生成するために、スケーリングされた再構築オーディオ信号とその拡張とを、再構築されたオーディオベクトルに組み合せることをさらに含み得る。
図19に表されるデコーダのフローは、先述の装置構造によって実装することができる。オーディオ信号を復号するように動作可能な装置では、例えば、拡張レイヤデコーダ1060のゲイン・ベクトル・デコーダ1070が、再構築されたオーディオベクトル^Sと、ゲインベクトルを表すインデックスiとを受信する。図10に示すとおり、iがゲインセレクタ1075によって受信される一方で、再構築されたオーディオベクトル^Sがゲイン・ベクトル・デコーダ1070のスケーリングユニット1080によって受信される。ゲイン・ベクトル・デコーダ1070のゲインセレクタ1075などのゲインセレクタは、再構築されたオーディオベクトルにおけるピークの組を検出し、検出されたピークの組に基づいてスケーリングマスクΨ(^S)を生成し、少なくともスケーリングマスクとゲインベクトルが表すインデックスとに基づいてゲインベクトルgを生成する。繰り返しになるが、信号の大部分が減衰している場合には、このピークの組にファイルが存在しないこともあり得る。ゲインセレクタは、例えば等式(46)で表されるようなピーク検出関数に従ってピークの組を検出する。例えば、スケーリングユニット1080は、再構築されたオーディオベクトルをゲインベクトルでスケーリングして、スケーリングされた再構築オーディオ信号を生成する。
さらに、図6における拡張レイヤデコーダのエラー信号デコーダ665などのエラー信号デコーダは、再構築されたオーディオベクトルに対する拡張を生成し得る。図6の信号コンバイナ675のような信号コンバイナは、スケーリングされた再構築オーディオ信号と、再構築されたオーディオベクトルに対する拡張とを組み合わせて、拡張復号信号を生成する。
図12〜図14のバランス係数の有向フローおよび図17〜図19のピーク検出を伴う選択型スケーリングマスクの有向フローは共に、さまざまな組み合わせで実行され得ると共に、本明細書に記載されている装置と構造とによってそのようにサポートされている点にも注意されたい。
特定の実施形態を参照しながら本発明を明示および説明してきたが、当業者であれば、本発明の精神および範囲から逸脱することなく、形態と詳細の各種変更が可能であることが理解されよう。例えば、上記技法は電気通信システムにおけるチャネル経由での送受信について記載されているものの、これらの技法は、ソリッド・ステート・メモリ・デバイスまたはコンピュータ・ハード・ディスクなどのデジタル・メディア・デバイスにおける格納要件を軽減する目的で信号圧縮システムを使用するシステムに等しく適用され得る。かかる変更は以下の請求項の範囲内に収まるものと意図される。
本明細書および特許請求の範囲における^s、^S、及び^eは、それぞれ、国際出願の明細書および特許請求の範囲における
Figure 2012512441
を示すものとして用いられている。

Claims (17)

  1. オーディオ信号を符号化するように動作可能な装置であって、
    受信されたオーディオ信号の再構築されたオーディオベクトル^Sにおけるピークの組を検出し、検出されたピークの組に基づいてスケーリングマスクΨ(^S)を生成する、拡張レイヤエンコーダのゲイン・ベクトル・ジェネレータのゲインセレクタと、
    少なくとも前記スケーリングマスクと、ゲインベクトルを表すインデックスjとに基づいてゲインベクトルgを生成し、前記ゲインベクトルで再構築オーディオ信号をスケーリングして、スケーリングされた再構築オーディオ信号を生成する、前記ゲイン・ベクトル・ジェネレータのスケーリングユニットと、
    前記オーディオ信号と前記スケーリングされた再構築オーディオ信号とに基づいて歪みを生成する、前記ゲイン・ベクトル・ジェネレータのエラー信号ジェネレータと、
    生成された歪みに基づいて前記ゲインベクトルのインデックスを出力する、前記拡張レイヤエンコーダのトランスミッタと
    を備える装置。
  2. 前記ゲインセレクタが、
    Figure 2012512441
    によって与えられるピーク検出関数にさらに従ってピークの組を検出し、式中、βがしきい値である、請求項1に記載の装置。
  3. 前記オーディオ信号が複数の層に組み込まれている、請求項1に記載の装置。
  4. 前記再構築されたオーディオベクトル^Sが周波数領域内にあり、前記ピークの組が周波数領域のピークである、請求項1に記載の装置。
  5. 複数のオーディオ信号を含むマルチ・チャネル・オーディオ信号を受信し、前記マルチ・チャネル・オーディオ信号を符号化して符号化オーディオ信号を生成するエンコーダと、
    符号化オーディオ信号を受信し、各々が前記マルチ・チャネル・オーディオ信号の複数のオーディオ信号のうちのオーディオ信号と関連付けられた複数のバランス係数成分を有するバランス係数を生成する、前記拡張レイヤエンコーダのバランス係数ジェネレータと、
    を備え、前記拡張レイヤエンコーダのゲイン・ベクトル・ジェネレータが、前記符号化オーディオ信号に適用されるゲイン値を決定して、前記バランス係数と前記マルチ・チャネル・オーディオ信号とに基づいて前記マルチ・チャネル・オーディオ信号の推定値を生成し、前記ゲイン値が、前記マルチ・チャネル・オーディオ信号と前記マルチ・チャネル・オーディオ信号の前記推定値との間の歪み値を最小化するように構成されており、前記トランスミッタが、送信と格納とのうちの少なくとも一方のために前記ゲイン値の表現をさらに送信する、請求項1に記載の装置。
  6. 前記拡張レイヤエンコーダの前記スケーリングユニットが、複数のゲイン値で前記符号化オーディオ信号をスケーリングして、複数の符号化オーディオ信号の候補を生成し、前記符号化オーディオ信号の候補うちの少なくとも1つはスケーリングされており、
    前記スケーリングユニットと前記バランス係数ジェネレータとが、前記バランス係数と前記複数の符号化オーディオ信号の候補のうちの少なくとも1つのスケーリングされた符号化オーディオ信号に基づいて前記マルチ・チャネル・オーディオ信号の推定値を生成し、
    前記拡張レイヤエンコーダのゲインセレクタが、前記マルチ・チャネル・オーディオ信号の推定値と前記マルチ・チャネル・オーディオ信号とに基づいて歪み値を評価して、前記複数のゲイン値の最適なゲインの表現を決定する、請求項5に記載の装置。
  7. オーディオ信号をエンコードするように動作可能な装置であって、
    オーディオ信号を受信し、前記オーディオ信号をエンコードして、再構築されたオーディオベクトル^Sを生成するエンコーダと、
    受信されたオーディオ信号の前記再構築されたオーディオベクトル^Sにおけるピークの組を検出し、検出されたピークの組に基づいてスケーリングマスクΨ(^S)を生成し、前記スケーリングマスクに基づいて複数のゲインベクトルgを生成し、前記複数のゲインベクトルで再構築オーディオ信号をスケーリングして、複数のスケーリングされた再構築オーディオ信号を生成する拡張レイヤエンコーダのゲイン・ベクトル・ジェネレータのスケーリングユニットと、
    前記オーディオ信号と前記複数のスケーリングされた再構築オーディオ信号とに基づいて複数の歪みを生成する、前記ゲイン・ベクトル・ジェネレータのエラー信号ジェネレータと、
    前記複数の歪みに基づいて前記複数のゲインベクトルからゲインベクトルを選択する、前記ゲイン・ベクトル・ジェネレータのゲインセレクタと、
    前記ゲインベクトルを表すインデックスを、送信すること、及び格納することのうちの少なくとも一方のために出力する、前記拡張レイヤエンコーダのトランスミッタと
    を備える装置。
  8. 前記複数の歪みのうちの最小の歪みと一致するゲインベクトルが選択される、請求項7に記載の装置。
  9. 前記スケーリングユニットが、
    Figure 2012512441
    によって与えられるピーク検出関数に従って前記ピークの組を検出し、式中、βがしきい値である、請求項7に記載の装置。
  10. 前記オーディオ信号が複数の層に組み込まれている、請求項7に記載の装置。
  11. 前記再構築されたオーディオベクトル^Sが周波数領域内にあり、前記ピークの組が周波数領域のピークである、請求項7に記載の装置。
  12. オーディオ信号をエンコードするための方法であって、
    受信されたオーディオ信号の再構築されたオーディオベクトル^Sにおけるピークの組を検出すること、
    検出されたピークの組に基づいてスケーリングマスクΨ(^S)を生成すること、
    少なくとも前記スケーリングマスクと、ゲインベクトルを表すインデックスjとに基づいてゲインベクトルgを生成すること、
    前記ゲインベクトルで再構築オーディオ信号をスケーリングして、スケーリングされた再構築オーディオ信号を生成すること、
    前記オーディオ信号と前記スケーリングされた再構築オーディオ信号とに基づいて歪みを生成すること、
    生成された歪みに基づいて前記ゲインベクトルのインデックスを出力すること
    を含む方法。
  13. 前記ピークの組を検出することが、
    Figure 2012512441
    によって与えられるピーク検出関数をさらに備え、式中、βがしきい値である、請求項12に記載の方法。
  14. 前記オーディオ信号が複数の層に組み込まれている、請求項12に記載の方法。
  15. 前記再構築されたオーディオベクトル^Sが周波数領域内にあり、前記ピークの組が周波数領域のピークである、請求項12に記載の方法。
  16. 複数のオーディオ信号を含むマルチ・チャネル・オーディオ信号を受信すること、
    前記マルチ・チャネル・オーディオ信号を符号化して、符号化オーディオ信号を生成すること、
    前記マルチ・チャネル・オーディオ信号の前記複数のオーディオ信号のうちのオーディオ信号と各々関連付けられた複数のバランス係数成分を有するバランス係数を生成すること、
    前記符号化オーディオ信号に適用されるゲイン値を決定して、前記バランス係数と前記マルチ・チャネル・オーディオ信号とに基づいて前記マルチ・チャネル・オーディオ信号の推定値を生成することであって、前記ゲイン値が、前記マルチ・チャネル・オーディオ信号と前記マルチ・チャネル・オーディオ信号の推定値との間の歪み値を最小化するように構成されている、前記推定値を生成すること、
    送信と格納とのうちの少なくとも一方のために前記ゲイン値の表現を出力すること
    をさらに含む、請求項12の方法。
  17. 複数のオーディオ信号を含むマルチ・チャネル・オーディオ信号を受信すること、
    前記マルチ・チャネル・オーディオ信号を符号化して符号化オーディオ信号を生成すること、
    前記符号化オーディオ信号を複数のゲイン値でスケーリングして、複数の符号化オーディオ信号の候補を生成することであって、前記符号化オーディオ信号の候補のうちの少なくとも1つはスケーリングされている、前記複数の符号化オーディオ信号の候補を生成すること、
    前記マルチ・チャネル・オーディオ信号の前記複数のオーディオ信号のうちのオーディオ信号と各々関連付けられた複数のバランス係数成分を有するバランス係数を生成すること、
    前記バランス係数と前記複数の符号化オーディオ信号の候補のうちの前記少なくとも1つのスケーリングされた符号化オーディオ信号とに基づいて前記マルチ・チャネル・オーディオ信号の推定値を生成すること、
    前記マルチ・チャネル・オーディオ信号の推定値と前記マルチ・チャネル・オーディオ信号とに基づいて歪み値を評価して、前記複数のゲイン値のうちの最適なゲイン値の表現を決定すること、
    送信と格納とのうちの少なくとも一方のために前記最適なゲイン値の表現を出力すること
    をさらに含む、請求項12の方法。
JP2011542225A 2008-12-29 2009-12-07 ピーク検出に基づいた選択型スケーリングマスク演算 Expired - Fee Related JP5285162B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/345,141 2008-12-29
US12/345,141 US8140342B2 (en) 2008-12-29 2008-12-29 Selective scaling mask computation based on peak detection
PCT/US2009/066927 WO2010077587A1 (en) 2008-12-29 2009-12-07 Selective scaling mask computation based on peak detection

Publications (2)

Publication Number Publication Date
JP2012512441A true JP2012512441A (ja) 2012-05-31
JP5285162B2 JP5285162B2 (ja) 2013-09-11

Family

ID=41694779

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011542225A Expired - Fee Related JP5285162B2 (ja) 2008-12-29 2009-12-07 ピーク検出に基づいた選択型スケーリングマスク演算

Country Status (8)

Country Link
US (1) US8140342B2 (ja)
EP (1) EP2382627B1 (ja)
JP (1) JP5285162B2 (ja)
KR (1) KR101274802B1 (ja)
CN (1) CN102272832B (ja)
BR (1) BRPI0923750A2 (ja)
ES (1) ES2432625T3 (ja)
WO (1) WO2010077587A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US7889103B2 (en) * 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8639519B2 (en) 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8149144B2 (en) * 2009-12-31 2012-04-03 Motorola Mobility, Inc. Hybrid arithmetic-combinatorial encoder
JP5333257B2 (ja) * 2010-01-20 2013-11-06 富士通株式会社 符号化装置、符号化システムおよび符号化方法
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
SG11201509526SA (en) * 2014-07-28 2017-04-27 Fraunhofer Ges Forschung Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction
EP2988300A1 (en) 2014-08-18 2016-02-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Switching of sampling rates at audio processing devices
CN113783571B (zh) * 2021-08-25 2024-03-22 深圳市中科蓝讯科技股份有限公司 信号强度自动调节方法、存储介质及芯片

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006220753A (ja) * 2005-02-08 2006-08-24 Toshiba Corp オーディオ符号化方法およびオーディオ符号化装置
WO2007126106A1 (ja) * 2006-04-26 2007-11-08 Sony Corporation 符号化方法および符号化装置
JP2011529199A (ja) * 2008-07-24 2011-12-01 ディーティーエス・インコーポレイテッド 二次元変換によるオーディオスケールファクタの圧縮

Family Cites Families (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4560977A (en) 1982-06-11 1985-12-24 Mitsubishi Denki Kabushiki Kaisha Vector quantizer
US4670851A (en) 1984-01-09 1987-06-02 Mitsubishi Denki Kabushiki Kaisha Vector quantizer
US4727354A (en) 1987-01-07 1988-02-23 Unisys Corporation System for selecting best fit vector code in vector quantization encoding
JP2527351B2 (ja) 1987-02-25 1996-08-21 富士写真フイルム株式会社 画像デ―タの圧縮方法
US5067152A (en) 1989-01-30 1991-11-19 Information Technologies Research, Inc. Method and apparatus for vector quantization
DE68922610T2 (de) 1989-09-25 1996-02-22 Rai Radiotelevisione Italiana Umfassendes System zur Codierung und Übertragung von Videosignalen mit Bewegungsvektoren.
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
WO1993018505A1 (en) 1992-03-02 1993-09-16 The Walt Disney Company Voice transformation system
IT1281001B1 (it) 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6263312B1 (en) 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
US6233554B1 (en) * 1997-12-12 2001-05-15 Qualcomm Incorporated Audio CODEC with AGC controlled by a VOCODER
EP0932141B1 (en) 1998-01-22 2005-08-24 Deutsche Telekom AG Method for signal controlled switching between different audio coding schemes
US6253185B1 (en) 1998-02-25 2001-06-26 Lucent Technologies Inc. Multiple description transform coding of audio using optimal transforms of arbitrary dimension
US6904174B1 (en) 1998-12-11 2005-06-07 Intel Corporation Simplified predictive video encoder
US6480822B2 (en) 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
CA2246532A1 (en) 1998-09-04 2000-03-04 Northern Telecom Limited Perceptual audio coding
US6453287B1 (en) 1999-02-04 2002-09-17 Georgia-Tech Research Corporation Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders
EP1088304A1 (en) * 1999-04-05 2001-04-04 Hughes Electronics Corporation A frequency domain interpolative speech codec system
US6691092B1 (en) * 1999-04-05 2004-02-10 Hughes Electronics Corporation Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system
US6236960B1 (en) 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
US6504877B1 (en) 1999-12-14 2003-01-07 Agere Systems Inc. Successively refinable Trellis-Based Scalar Vector quantizers
JP4149637B2 (ja) * 2000-05-25 2008-09-10 株式会社東芝 半導体装置
US6304196B1 (en) 2000-10-19 2001-10-16 Integrated Device Technology, Inc. Disparity and transition density control system and method
AUPR105000A0 (en) 2000-10-27 2000-11-23 Canon Kabushiki Kaisha Method for generating and detecting marks
JP3404024B2 (ja) 2001-02-27 2003-05-06 三菱電機株式会社 音声符号化方法および音声符号化装置
JP3636094B2 (ja) 2001-05-07 2005-04-06 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
JP4506039B2 (ja) 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US6662154B2 (en) 2001-12-12 2003-12-09 Motorola, Inc. Method and system for information signal coding using combinatorial and huffman codes
AU2003213149A1 (en) 2002-02-21 2003-09-09 The Regents Of The University Of California Scalable compression of audio and other signals
KR100711989B1 (ko) 2002-03-12 2007-05-02 노키아 코포레이션 효율적으로 개선된 스케일러블 오디오 부호화
JP3881943B2 (ja) 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
US7876966B2 (en) 2003-03-11 2011-01-25 Spyder Navigations L.L.C. Switching between coding schemes
KR101000345B1 (ko) 2003-04-30 2010-12-13 파나소닉 주식회사 음성 부호화 장치, 음성 복호화 장치 및 그 방법
JP2005005844A (ja) 2003-06-10 2005-01-06 Hitachi Ltd 計算装置及び符号化処理プログラム
JP4123109B2 (ja) 2003-08-29 2008-07-23 日本ビクター株式会社 変調装置及び変調方法並びに復調装置及び復調方法
SE527670C2 (sv) 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
EP1944758A3 (en) 2004-04-05 2014-09-10 Koninklijke Philips N.V. Method of coding data
US20060022374A1 (en) 2004-07-28 2006-02-02 Sun Turn Industrial Co., Ltd. Processing method for making column-shaped foam
US6975253B1 (en) 2004-08-06 2005-12-13 Analog Devices, Inc. System and method for static Huffman decoding
US7161507B2 (en) 2004-08-20 2007-01-09 1St Works Corporation Fast, practically optimal entropy coding
JP4771674B2 (ja) 2004-09-02 2011-09-14 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
CN101091208B (zh) 2004-12-27 2011-07-13 松下电器产业株式会社 语音编码装置和语音编码方法
US20060190246A1 (en) 2005-02-23 2006-08-24 Via Telecom Co., Ltd. Transcoding method for switching between selectable mode voice encoder and an enhanced variable rate CODEC
KR20130079627A (ko) 2005-03-30 2013-07-10 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 인코딩 및 디코딩
US7885809B2 (en) 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
FR2888699A1 (fr) 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
RU2419171C2 (ru) 2005-07-22 2011-05-20 Франс Телеком Способ переключения скорости передачи битов при аудиодекодировании с масштабированием скорости передачи битов и масштабированием полосы пропускания
US8457319B2 (en) 2005-08-31 2013-06-04 Panasonic Corporation Stereo encoding device, stereo decoding device, and stereo encoding method
EP1933304A4 (en) 2005-10-14 2011-03-16 Panasonic Corp DIMENSIONABLE CODING APPARATUS, DIMENSIONABLE DECODING APPARATUS AND METHODS OF USING SAME
WO2007063910A1 (ja) 2005-11-30 2007-06-07 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
EP1989706B1 (fr) 2006-02-14 2011-10-26 France Telecom Dispositif de ponderation perceptuelle en codage/decodage audio
US20070239294A1 (en) 2006-03-29 2007-10-11 Andrea Brueckner Hearing instrument having audio feedback capability
US7230550B1 (en) 2006-05-16 2007-06-12 Motorola, Inc. Low-complexity bit-robust method and system for combining codewords to form a single codeword
US7414549B1 (en) 2006-08-04 2008-08-19 The Texas A&M University System Wyner-Ziv coding based on TCQ and LDPC codes
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
WO2008062990A1 (en) 2006-11-21 2008-05-29 Samsung Electronics Co., Ltd. Method, medium, and system scalably encoding/decoding audio/speech
US7761290B2 (en) * 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US20090234642A1 (en) 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US7889103B2 (en) 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
US8639519B2 (en) 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
KR101227729B1 (ko) 2008-07-11 2013-01-29 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 샘플 오디오 신호의 프레임을 인코딩하기 위한 오디오 인코더 및 디코더
US20100088090A1 (en) 2008-10-08 2010-04-08 Motorola, Inc. Arithmetic encoding for celp speech encoders

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006220753A (ja) * 2005-02-08 2006-08-24 Toshiba Corp オーディオ符号化方法およびオーディオ符号化装置
WO2007126106A1 (ja) * 2006-04-26 2007-11-08 Sony Corporation 符号化方法および符号化装置
JP2011529199A (ja) * 2008-07-24 2011-12-01 ディーティーエス・インコーポレイテッド 二次元変換によるオーディオスケールファクタの圧縮

Also Published As

Publication number Publication date
CN102272832A (zh) 2011-12-07
KR101274802B1 (ko) 2013-06-13
EP2382627B1 (en) 2013-09-18
EP2382627A1 (en) 2011-11-02
US20100169100A1 (en) 2010-07-01
WO2010077587A1 (en) 2010-07-08
BRPI0923750A2 (pt) 2016-01-19
ES2432625T3 (es) 2013-12-04
JP5285162B2 (ja) 2013-09-11
US8140342B2 (en) 2012-03-20
CN102272832B (zh) 2013-06-19
KR20110110267A (ko) 2011-10-06

Similar Documents

Publication Publication Date Title
JP5285162B2 (ja) ピーク検出に基づいた選択型スケーリングマスク演算
JP5283046B2 (ja) ピーク検出に基づく選択的スケーリングマスク計算
KR101274827B1 (ko) 다수 채널 오디오 신호를 디코딩하기 위한 장치 및 방법, 및 다수 채널 오디오 신호를 코딩하기 위한 방법
US8175888B2 (en) Enhanced layered gain factor balancing within a multiple-channel audio coding system
KR101125429B1 (ko) 오디오 코딩 시스템내에서 향상 계층을 발생시키는 방법 및 장치
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
TWI415115B (zh) 用以產生帶寬擴展輸出資料之裝置與方法
JP5400059B2 (ja) オーディオ信号処理方法及び装置
CN103329197B (zh) 用于反相声道的改进的立体声参数编码/解码

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120717

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121015

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121022

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121217

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130116

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130430

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130530

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees