JP5996670B2

JP5996670B2 - オーディオデータの冗長送信に対するビット割振りのためのシステム、方法、装置、およびコンピュータ可読媒体

Info

Publication number: JP5996670B2
Application number: JP2014552204A
Authority: JP
Inventors: ラジェンドラン、ビベク; クリシュナン、ベンカテシュ; シンダー、ダニエル・ジェイ．
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2012-01-12
Filing date: 2012-12-20
Publication date: 2016-09-21
Anticipated expiration: 2032-12-20
Also published as: JP2015510313A; KR101585367B1; BR112014017120A2; WO2013106181A1; WO2013106187A1; KR101570631B1; JP6151405B2; CN104040622B; HUE037362T2; TW201338468A; EP2803065B1; BR112014017119A8; ES2621417T3; DK2812895T3; KR20140119735A; ES2653949T3; BR112014017120B1; US9053702B2; TWI499247B; EP2803065A1

Description

米国特許法第１１９条に基づく優先権の主張
[0001]本特許出願は、２０１２年１月１２日に出願され、本出願の譲受人に譲渡された「ＳＹＳＴＥＭＳ，ＭＥＴＨＯＤＳ，ＡＰＰＡＲＡＴＵＳ，ＡＮＤＣＯＭＰＵＴＥＲ−ＲＥＡＤＡＢＬＥＭＥＤＩＡＦＯＲＢＩＴＡＬＬＯＣＡＴＩＯＮＦＯＲＲＥＤＵＮＤＡＮＴＴＲＡＮＳＭＩＳＳＩＯＮ」と題する仮出願第６１／５８６，００７号の優先権を主張する。本特許出願はまた、２０１２年１月１７日に出願され、本出願の譲受人に譲渡された「ＳＹＳＴＥＭＳ，ＭＥＴＨＯＤＳ，ＡＰＰＡＲＡＴＵＳ，ＡＮＤＣＯＭＰＵＴＥＲ−ＲＥＡＤＡＢＬＥＭＥＤＩＡＦＯＲＣＲＩＴＩＣＡＬＩＴＹＴＨＲＥＳＨＯＬＤＣＯＮＴＲＯＬ」と題する仮出願第６１／５８７，５０７号の優先権を主張する。本特許出願はまた、２０１２年５月１日に出願され、本出願の譲受人に譲渡された「ＳＹＳＴＥＭＳ，ＭＥＴＨＯＤＳ，ＡＰＰＡＲＡＴＵＳ，ＡＮＤＣＯＭＰＵＴＥＲ−ＲＥＡＤＡＢＬＥＭＥＤＩＡＦＯＲＢＩＴＡＬＬＯＣＡＴＩＯＮＦＯＲＲＥＤＵＮＤＡＮＴＴＲＡＮＳＭＩＳＳＩＯＮ」と題する仮出願第６１／６４１，０９３号の優先権を主張する。

[0002]本開示は、オーディオ通信に関する。

[0003]デジタルオーディオ通信は、回線交換ネットワーク上で実行されてきた。回線交換ネットワークは、物理パスが呼の持続時間の間に２つの端末間に確立されるネットワークである。回線交換アプリケーションでは、送信端末が、オーディオ（たとえば、音声）情報を含む一連のパケットを物理パスを介して受信端末に送る。受信端末は、パケット内に含まれるオーディオ情報（たとえば、音声情報）を使用して、対応するオーディオ信号（たとえば、音声信号）を合成する。

[0004]デジタルオーディオ通信は、パケット交換ネットワーク上で実行されるように開始している。パケット交換ネットワークは、パケットが宛先アドレスに基づいてネットワークを介してルーティングされるネットワークである。パケット交換通信を用いて、ルータは、各パケットのためのパスを個別に決定し、その宛先に達するように、任意の利用可能なパスを通して各パケットを送る。その結果、パケットは、同時にまたは同じ順序で受信端末に到達することはない。パケットを元の順序に戻してそれらを連続的逐次方式で送り出す（play out）ために、受信端末内でデジッタバッファが使用され得る。

[0005]時として、パケットは、送信端末から受信端末に伝送中に失われる。失われたパケットは、合成オーディオ信号の品質を劣化させることがある。したがって、フレーム内（たとえば、音声フレーム内）の情報のロスに対処するためのシステムおよび方法を提供することによる利益が実現され得る。

[0006]一般的構成によるオーディオ信号を処理する方法は、オーディオ信号内でオーディオ信号の第１のフレーム（たとえば、クリティカルフレーム）に後続する、オーディオ信号の第２のフレームに対する決定メトリックの少なくとも１つの値を計算することを含む。この方法はまた、決定メトリックの少なくとも１つの計算された値に基づいて、複数の再割振り候補の中の１つを選択することを含む。この方法では、計算された少なくとも１つの値は、第２のフレームの圧縮率の尺度に基づき、選択された再割振り候補は、第２のフレームに対する初期ビット割振りの、第１の部分および第２の部分への再割振りを示す。また、特徴を読み取る機械にそのような方法を実行させる有形特徴を有するコンピュータ可読記憶媒体（たとえば、非一時的媒体）が開示される。

[0007]別の一般的構成に従ってオーディオ信号を処理するための装置は、オーディオ信号内でオーディオ信号の第１のフレーム（たとえば、クリティカルフレーム）に後続する、オーディオ信号の第２のフレームに対する決定メトリックの少なくとも１つの値を計算するための手段を含む。この装置はまた、決定メトリックの前記少なくとも１つの計算された値に基づいて、複数の再割振り候補の中の１つを選択するための手段を含む。この装置では、計算された少なくとも１つの値は、第２のフレームの圧縮率の尺度に基づき、選択された再割振り候補は、第２のフレームに対する初期ビット割振りの、第１の部分および第２の部分への再割振りを示す。

[0008]別の一般的構成に従ってオーディオ信号を処理するための装置は、オーディオ信号内でオーディオ信号の第１のフレーム（たとえば、クリティカルフレーム）に後続する、オーディオ信号の第２のフレームに対する決定メトリックの少なくとも１つの値を計算するように構成された計算器を含む。この装置はまた、決定メトリックの前記少なくとも１つの計算された値に基づいて、複数の再割振り候補の中の１つを選択するように構成された選択器を含む。この装置では、計算された少なくとも１つの値は、第２のフレームの圧縮率の尺度に基づき、選択された再割振り候補は、第２のフレームに対する初期ビット割振りの、第１の部分および第２の部分への再割振りを示す。

[0009]ネットワークＮＷ１０上で通信する送信端末１０２および受信端末１０４の一例を示すブロック図。 [0010]オーディオエンコーダＡＥ１０の実装形態ＡＥ２０のブロック図。 [0011]ネットワークＮＷ２０を介して互いに通信し得る異なる端末デバイスの例を示す図。 [0012]フレームエンコーダＦＥ１０の基本実装形態ＦＥ２０のブロック図。 [0013]送信端末１０２の実装形態１１２および受信端末１０４の実装形態１１４の一例を示すブロック図。 [0014]一般的構成による方法Ｍ１００のフローチャート。 [0015]方法Ｍ１００の実装形態Ｍ２００のフローチャート。 [0016]方法Ｍ２００の実装形態Ｍ２１０のフローチャート。 [0017]オーディオ信号の一連のフレームの一例を示す図。 [0018]決定メトリックＤの値の範囲と複数の再割振り候補との間の対応を示す図。 [0019]方法Ｍ２００の実装形態Ｍ２２０のフローチャート。 [0020]方法Ｍ１００の実装形態Ｍ３００のフローチャート。 [0021]方法Ｍ３００の実装形態Ｍ３１０のフローチャート。 [0022]方法Ｍ１００の実装形態Ｍ４００のフローチャート。 [0023]方法Ｍ４００の実装形態Ｍ４１０のフローチャート。 [0024]方法Ｍ４００の実装形態Ｍ４２０のフローチャート。 [0025]方法Ｍ４００の実装形態Ｍ４３０のフローチャート。 [0026]方法Ｍ４００の実装形態Ｍ５００のフローチャート。 [0027]方法Ｍ５００の実装形態Ｍ５１０のフローチャート。 [0028]方法Ｍ５００の実装形態Ｍ５２０のフローチャート。 [0029]方法Ｍ５００の実装形態Ｍ５３０のフローチャート。 [0030]方法Ｍ５００の実装形態Ｍ５４０のフローチャート。 [0031]方法Ｍ１００の実装形態Ｍ１１０のフローチャートを示す。 [0032]方法Ｍ１１０の実装形態Ｍ１２０のフローチャート。 [0033]方法Ｍ１２０の実装形態Ｍ１３０のフローチャート。 [0034]本明細書で説明する、チャネル状態情報と他のシステムパラメータとの間の関係の例を示す図。本明細書で説明する、チャネル状態情報と他のシステムパラメータとの間の関係の例を示す図。 [0035]方法Ｍ１２０の実装形態Ｍ１４０のフローチャート。 [0036]方法Ｍ１３０およびＭ１４０の実装形態Ｍ１５０のフローチャート。 [0037]方法Ｍ１００の実装形態Ｍ６００のフローチャート。 [0038]方法Ｍ６００の実装形態Ｍ６１０のフローチャート。 [0039]方法Ｍ６００の実装形態Ｍ６２０のフローチャート。 [0040]方法Ｍ６００の実装形態Ｍ６３０のフローチャート。 [0041]方法Ｍ６００の実装形態Ｍ６４０のフローチャート。 [0042]方法Ｍ６００の実装形態Ｍ６５０のフローチャート。 [0043]方法Ｍ４００およびＭ６１０の実装形態Ｍ６６０のフローチャート。 [0044]方法Ｍ４００およびＭ６２０の実装形態Ｍ６７０のフローチャート。 [0045]方法Ｍ６００の実装形態Ｍ７００のフローチャート。 [0046]方法Ｍ６６０およびＭ７００の実装形態Ｍ７１０のフローチャート。 [0047]方法Ｍ６７０およびＭ７００の実装形態Ｍ７２０のフローチャート。 [0048]ＩＰｖ４パケットの図。 [0049]ＩＰｖ６パケットの図。 [0050]通信デバイスＤ１０のブロック図。 [0051]クリティカルフレームの冗長コピーと後続フレームのコピーとを搬送するＲＴＰパケットのペイロードの一例を示す図。 [0052]オーディオデコーダＡＤ１０の実装形態ＡＤ２０のブロック図。 [0053]一般的構成による装置ＭＦ１００のブロック図。 [0054]装置ＭＦ１００の実装形態ＭＦ３００のブロック図。 [0055]装置ＭＦ１００の実装形態ＭＦ５００のブロック図。 [0056]装置ＭＦ１００の実装形態ＭＦ１４０のブロック図。 [0057]装置ＭＦ１４０の実装形態ＭＦ１５０のブロック図。 [0058]一般的構成による装置Ａ１００のブロック図。 [0059]装置Ａ１００の実装形態Ａ３００のブロック図。 [0060]装置Ａ１００の実装形態Ａ５００のブロック図。 [0061]ワイヤレスデバイス１１０２のブロック図。 [0062]ハンドセットＨ１００の正面図と、背面図と、側面図。

[0063]送信中の情報のロスに対する固定ビットレート方式のロバスト性を改善することが望ましい。本明細書で説明するシステム、方法、および装置は、オーディオ信号のクリティカルフレームの適応冗長符号化に適用され得る。そのような適応符号化は、複数の共有レート（たとえば、共有ビット割振り）およびフレームオフセットを試験することを含み得る。そのような適応符号化はまた、フレームがクリティカルフレームであると判断することを含み得る。

[0064]文脈によって明確に限定されない限り、「信号」という用語は、本明細書では、ワイヤ、バス、または他の伝送媒体上に表された記憶場所（または記憶場所のセット）の状態を含む、その通常の意味のいずれをも示すのに使用される。文脈によって明確に限定されない限り、「発生（generating）」という用語は、本明細書では、計算（computing）または別様の生成（producing）など、その通常の意味のいずれをも示すのに使用される。文脈によって明確に限定されない限り、「計算（calculating）」という用語は、本明細書では、複数の値からの計算（computing）、評価、平滑化、および／または選択など、その通常の意味のいずれをも示すのに使用される。文脈によって明確に限定されない限り、「得る（obtaining）」という用語は、計算、導出、（たとえば、外部デバイスからの）受信、および／または（たとえば、記憶素子のアレイからの）取り出しなど、その通常の意味のいずれをも示すのに使用される。文脈によって明確に限定されない限り、「選択（selecting）」という用語は、２つ以上のセットのうちの少なくとも１つ、かつすべてよりも少数を識別、指示、適用、および／または使用することなど、その通常の意味のいずれをも示すのに使用される。文脈によって明確に限定されない限り、「判断（determining）」という用語は、決定（deciding）、確立（establishing）、終結（concluding）、計算、選択、および／または評価など、その通常の意味のいずれをも示すのに使用される。「備える（comprising）」という用語は、本明細書と特許請求の範囲とにおいて使用される場合、他の要素または動作を除外するものではない。「に基づく」（「ＡはＢに基づく」など）という用語は、（ｉ）「から導出される」（たとえば、「ＢはＡの前の形である」）、（ｉｉ）「少なくとも〜に基づく」（たとえば、「Ａは少なくともＢに基づく」）、および特定の文脈で適当な場合に、（ｉｉｉ）「に等しい」（たとえば、「ＡはＢに等しい」）という場合を含む、その通常の意味のいずれをも示すのに使用される。同様に、「に応答して」という用語は、「少なくとも〜に応答して」を含む、その通常の意味のいずれをも示すのに使用される。

[0065]別段に規定されていない限り、「一連」という用語は、２つ以上のアイテムのシーケンスを示すのに使用される。「対数」という用語は、１０を底とする対数を示すのに使用されるが、他の底へのそのような演算の拡張は本開示の範囲内である。「周波数成分」という用語は、（たとえば、高速フーリエ変換またはＭＤＣＴによって生成される）信号の周波数領域表現のサンプル、あるいは信号のサブバンド（たとえば、バーク尺度またはメル尺度サブバンド）など、信号の周波数または周波数帯域のセットのうちの１つを示すのに使用される。

[0066]別段に規定されていない限り、特定の特徴を有する装置の動作のいかなる開示も、類似の特徴を有する方法を開示する（その逆も同様）ことをも明確に意図し、特定の構成による装置の動作のいかなる開示も、類似の構成による方法を開示する（その逆も同様）ことをも明確に意図する。「構成」という用語は、その具体的な文脈によって示されるように、方法、装置、および／またはシステムに関して使用され得る。「方法」、「処理」、「手順」、および「技法」という用語は、具体的な文脈によって別段に規定されていない限り、一般的、互換的に使用される。複数のサブタスクを有する「タスク」もまた一方法である。「装置」および「デバイス」という用語も、特定の文脈によって別段に規定されていない限り、一般的、互換的に使用される。「要素」および「モジュール」という用語は、一般に、より大きい構成の一部分を示すのに使用される。文脈によって明確に限定されない限り、「システム」という用語は、本明細書では、「共通の目的を果たすために相互作用する要素のグループ」を含む、その通常の意味のいずれをも示すのに使用される。「複数の」という用語は、「２つ以上の」を意味する。また、文書の一部分の参照によるいかなる組込みも、その部分内で参照される用語または変数の定義が、その文書中の他の場所、ならびに組み込まれた部分中で参照される図に現れた場合、そのような定義を組み込んでいることを理解されたい。

[0067]「コーダ」、「コーデック」、および「コーディングシステム」という用語は、（場合によっては知覚的重み付けおよび／または他のフィルタ処理演算などの１つまたは複数の前処理演算の後に）オーディオ信号のフレームを受信し符号化するように構成された少なくとも１つのエンコーダと、フレームの復号表現を生成するように構成された対応するデコーダとを含むシステムを示すのに互換的に使用される。そのようなエンコーダとデコーダは、一般に通信リンクの対向する端末に配備される。全二重通信をサポートするために、エンコーダとデコーダの両方のインスタンスは、一般にそのようなリンクの各端部に配備される。

[0068]別段の指示がない限り、「ボコーダ」、「オーディオコーダ」、および「音声コーダ」という用語は、オーディオエンコーダと対応するオーディオデコーダとの組合せを指す。別段の指示がない限り、「コーディング」という用語は、符号化および後続の復号を含めて、コーデックを介するオーディオ信号の転移（transfer）を示す。別段の指示がない限り、「送信」という用語は、送信チャネルへの（たとえば、信号の）伝搬を示す。

[0069]本明細書で説明するコーディング方式は、（たとえば非音声オーディオを含む）任意のオーディオ信号をコーディングするために適用され得る。あるいは、そのようなコーディング方式を音声にのみ使うのが望ましいことがある。そのような場合、そのコーディング方式を分類方式とともに使って、音声信号の各フレームの内容の種類を判定し、適切なコーディング方式を選択することができる。

[0070]本明細書で説明されるコーディング方式は、主要なコーデックとして、またはマルチレイヤ内のレイヤもしくはステージとして、またはマルチステージコーデックとして使われ得る。１つのそのような例では、音声信号の周波数成分の一部（たとえば、低域または高域）をコーディングするのにそのようなコーディング方式が使われ、信号の周波数成分の別の部分をコーディングするのに別のコーディング方式が使われる。別のそのような例では、そのようなコーディング方式は、線形予測コーディング（ＬＰＣ）分析動作の残差など、別のコーディングレイヤの残差（すなわち、元の信号と符号化された信号との間の誤差）であるオーディオ信号をコーディングするために使用される。

[0071]本明細書で説明する方法、システム、および装置は、オーディオ信号を一連のセグメントとして処理するように構成され得る。典型的なセグメント長は約５または１０ミリ秒から約４０または５０ミリ秒にわたり、セグメントは、重複しても（たとえば、隣接するセグメントが２５％または５０％だけ重複する）、重複しなくてもよい。１つの特定の例では、オーディオ信号は、１０ミリ秒の長さをそれぞれ有する一連の重複しないセグメントまたは「フレーム」に分割される。別の特定の例では、各フレームは２０ミリ秒の長さを有する。オーディオ信号に対するサンプリングレートの例は、８、１２、１６、３２、４４．１、４８および１９２キロヘルツを（制限なしに）含む。

[0072]オーディオ通信アプリケーションは、パケット交換ネットワーク内で実装され得る。たとえば、オーディオ通信アプリケーションは、ボイスオーバインターネットプロトコル（ＶｏＩＰ）ネットワーク内で実装され得る。パケットは、符号化されたオーディオ信号の１つまたは複数のフレームを含み、オーディオ（たとえば、音声）情報を有するパケットは、ネットワーク上で第１のデバイスから第２のデバイスに送信され得る。しかしながら、パケットのうちのいくつかは、パケットの送信中に失われることがある。たとえば、複数のパケットのロス（ときに、バースト的パケットロスと呼ばれる）が、受信デバイスにおける知覚的音声品質の劣化の理由となることがある。

[0073]ＶｏＩＰネットワーク内のパケットロスによって引き起こされる知覚的音声品質の劣化を緩和するために、２つのタイプの解法が存在する。第１の解法は、受信側ベースのパケットロス隠蔽（ＰＬＣ：packet loss concealment）手法である。ＰＬＣ法は、ＶｏＩＰ通信におけるパケットロスの影響をマスキングするために使用され得る。たとえば、ＰＬＣ法は、送信中に失われたパケットの代わりに代替パケットを生成するように実施され得る。そのようなＰＬＣ法は、失われたパケットに可能な限り類似するパケットを生成することを試行し得る。受信側ベースのＰＬＣ法は、代替パケットを生成するために、送信側からの追加のリソースまたは支援をまったく必要としない。しかしながら、重要な音声フレームが失われるときは、ＰＬＣ法は、パケットロスの影響をマスキングするには不十分であることがある。

[0074]第２の解法は、送信側ベースのパケットロス復元手法（packet loss resilient approach）である。そのような手法は、各パケットとともにいくつかの追加のデータを送ることを含み得る前方誤り訂正（ＦＥＣ）法を含む。追加のデータは、送信中のデータのロスによって引き起こされる誤りを修復するために使用され得る。たとえば、ＦＥＣ方式は、冗長オーディオフレームを送信し得る。言い換えれば、オーディオフレームの２つ以上のコピー（典型的には２つ）が、送信側によって送信される。これら２つのフレームは、主コピーおよび冗長コピーと呼ばれることがある。

[0075]送信側ベースのパケットロス復元方式は、復号された音声の知覚品質を改善し得るが、これらの方式はまた、音声の送信中に使用される帯域幅を増加させることがある。従来からのＦＥＣ方式はまた、実時間の会話にとって許容できないエンドツーエンド遅延を増加させることがある。たとえば、従来の送信側ベースの方式は、２つ異なる時間期間において２回、同じ音声フレームを送る。この手法は、データレートを少なくとも二倍にする。いくつかの従来の方式は、データレートを低減するために、冗長コピーに対して低ビットレートコーデックを使用することがある。しかしながら、低ビットレートコーデックの使用は、エンコーダの複雑さを増すことがある。加えて、いくつかの従来の方式は、フレームの主コピーとフレームの冗長コピーの両方に対して同じ低ビットレートコーデックを使用することがある。この手法は、エンコーダの複雑さを低減するだけでなく、データレートも低減し得るが、基本的な音声品質（すなわち、フレームが失われないときの音声品質）が、大幅に低下することがある。さらに、従来の送信側ベースの方式は、少なくとも１つのフレーム間隔の追加の遅延を前提として動作する。

[0076]本明細書で説明するシステム、方法、および装置は、音声品質と、遅延およびデータレートとの間の最適なトレードオフを得るために、ソース制御（source-controlled）（および場合によってはチャネル制御（channel-controlled））ＦＥＣ方式を提供するように実施され得る。ＦＥＣ方式は、追加の遅延が導入されないように構成され得る。適度のデータレート増の下で音声品質の高い品質改善が達成され得る。本明細書で説明するＦＥＣ方式はまた、任意の目標データレートにおいて動作することができる。一例では、ＦＥＣ方式および目標データレートは、送信チャネルの条件ならびに外部制御に基づいて適応的に調節され得る。提案されるＦＥＣ方式はまた、レガシー通信デバイス（たとえば、レガシーハンドセット）と互換性がある方式で実施され得る。

[0077]オーディオ（たとえば、音声）通信のためのいくつかのコーデックに対して、各フレームが符号化されるビットの総数は、所定の定数である。そのようなコーデックの例には、適応マルチレート（ＡＭＲ）音声コーデック（たとえば、３ＧＰＰ技術仕様（ＴＳ）２６．０７１、バージョン１０．０．０、２０１１年４月５日、欧州電気通信標準化機構（ＥＴＳＩ）、ｗｗｗ−ｄｏｔ−ｅｓｔｉ−ｄｏｔ−ｏｒｇ、フランス、ソフィア・アンティポリスから入手可能、に記載されている）と、ＡＭＲ広帯域音声コーデック（たとえば、ＩＴＵ−Ｔ勧告Ｇ．７２２．２、２００３年７月、国際電気通信連合、ｗｗｗ−ｄｏｔ−ｉｔｕ−ｄｏｔ−ｉｎｔ、および／または３ＧＰＰ技術仕様２６．１９０ｖ１０．０．０（２０１１年３月）、ＥＴＳＩから入手可能、に記載されている）とが含まれ、ビット数は、フレームに対して選択されたコーディングモードによって決定される。そのような場合には、過去のフレームの冗長コピーを送信することは、現在フレーム内の信号情報をコーディングするために利用可能なビット数において、対応する低減を必要とすることがある。この低減は、復号された音声の知覚品質に悪影響を及ぼすことがある。

[0078]冗長コピーがクリティカルフレームに対してのみ送信される、柔軟性のある手法を実施することが望ましい。「クリティカルフレーム」は、そのロスが、復号された信号の知覚品質に重大な影響を及ぼすことが予測されるフレームである。その上、冗長コピーを現在のフレーム上にピギーバッキングする影響が最小であると予測される場合だけ、そのような冗長コピーを送信することが望ましい。固定ビットレートシステムに対して、現在のフレームをコーディングするために使用されるビット数および過去のフレームの冗長コピー（たとえば、部分コピー）をコーディングするために使用されるビット数の合計が、目標の固定ビットレートＴと適合するように、現在のフレームをコーディングするために使用されるビット数を決定することが望ましい。

[0079]図１Ａは、送信チャネルＴＣ１０を介してネットワークＮＷ１０上で通信する送信端末１０２および受信端末１０４の一例を示すブロック図である。端末１０２および１０４の各々は、本明細書で説明する方法を実行するように、および／または本明細書で説明する装置を含むように実装され得る。送信端末１０２および受信端末１０４は、電話（たとえば、スマートフォン）、コンピュータ、オーディオブロードキャストおよび受信機器、ビデオ会議機器などを含む、音声通信をサポートすることが可能な任意のデバイスであり得る。送信端末１０２および受信端末１０４は、たとえば、符号分割多元接続（ＣＤＭＡ）機能など、ワイヤレス多元接続技術を用いて実装され得る。ＣＤＭＡは、スペクトラム拡散通信に基づく変調および多元接続方式である。

[0080]送信端末１０２はオーディオエンコーダＡＥ１０を含み、受信端末１０４はオーディオデコーダＡＤ１０を含む。オーディオエンコーダＡＥ１０は、人間音声発生モデルに従ってパラメータ値を抽出することによって、第１のユーザインターフェースＵＩ１０（たとえば、マイクロフォンおよびオーディオフロントエンド）からのオーディオ情報（たとえば、音声）を圧縮するために使用され得る。チャネルエンコーダＣＥ１０は、パラメータ値をパケットにアセンブルし、送信機ＴＸ１０は、これらのパラメータ値を含むパケットをネットワークＮＷ１０上で送信し、ＮＷ１０は、送信チャネルＴＣ１０を介する、インターネットまたは企業イントラネットなどのパケットベースネットワークを含み得る。送信チャネルＴＣ１０は、ワイヤードおよび／またはワイヤレス送信チャネルであってよく、チャネルの品質が、いかにしてどこで決定されるかに応じて、ネットワークＮＷ１０のエントリポイント（たとえば、基地局コントローラ）、ネットワークＮＷ１０の別のエンティティ（たとえば、チャネル品質分析器）、および／または受信端末１０４の受信機ＲＸ１０まで延びるものと考えられ得る。

[0081]受信端末１０４の受信機ＲＸ１０は、送信チャネルを介してネットワークＮＷ１０からのパケットを受信するために使用される。チャネルデコーダＣＤ１０は、パラメータ値を得るためにパケットを復号し、オーディオデコーダＡＤ１０は、パケットからのパラメータ値を使用してオーディオ情報を合成する。合成されたオーディオ（たとえば、音声）は、受信端末１０４上の第２のユーザインターフェースＵＩ２０（たとえば、オーディオ出力ステージおよび拡声器）に供給される。図示しないが、様々な信号処理機能が、チャネルエンコーダＣＥ１０およびチャネルデコーダＣＤ１０内で（たとえば、サイクリック冗長検査（ＣＲＣ）機能、インターリービングを含む畳み込みコーディングを）、また、送信機ＴＸ１０および受信機ＲＸ１０内で（たとえば、デジタル変調および対応する復調、スペクトラム拡散処理、アナログデジタル変換およびデジタルアナログ変換を）実行され得る。

[0082]図２は、無線アップリンクおよびダウンリンク送信チャネル上で移動局と通信するトランシーバ基地局ＢＴＳ１〜ＢＴＳ３を含むネットワークＮＷ１０の実装形態ＮＷ２０の一例を示す。ネットワークＮＷ２０はまた、公衆交換電話網ＰＳＴＮおよびインターネットＩＮＴに接続されたコアネットワークＣＮＷ１と、やはりインターネットＩＮＴに接続されたコアネットワークＣＮＷ２とを含む。ネットワークＮＷ２０はまた、トランシーバ局をコアネットワークとインターフェース接続する基地局コントローラＢＳＣ１〜ＢＳＣ３を含む。ネットワークＮＷ２０は、端末デバイス間にパケット交換通信を提供するように実施され得る。コアネットワークＣＮＷ１はまた、トランシーバ基地局ＢＴＳ１、ＢＴＳ２を介して端末デバイスＭＳ１とＭＳ２との間、および／またはそのような端末デバイスとＰＳＴＮ上の端末デバイスとの間に回線交換通信を提供し得る。

[0083]図２はまた、ネットワークＮＷ２０を介して（たとえば、パケット交換通信リンク上で）互いに通信し得る異なる端末デバイスの例、すなわち、移動局ＭＳ１〜ＭＳ３、ボイスオーバＩＰ（ＶｏＩＰ）電話ＶＰ、および電気通信プログラム（たとえば、マイクロソフトスカイプ部門、ＬＵからのスカイプソフトウェア）を実行するように構成されるコンピュータＣＰを示す。端末デバイスＭＳ１〜ＭＳ３、ＶＰ、およびＣＰのいずれかは、送信端末１０２のインスタンスと受信端末１０４のインスタンスとを含むように実施され得る。移動デバイスＭＳ１〜ＭＳ３は、ワイヤレス無線アップリンクおよびダウンリンク送信チャネルを介してネットワークと通信する。端末ＶＰおよびＣＰは、ワイヤード送信チャネル（たとえば、イーサネット（登録商標）ケーブル）および／またはワイヤレス送信チャネル（たとえば、ＩＥＥＥ８０２．１１または「ＷｉＦｉ」リンク）を介してネットワークと通信する。ネットワークＮＷ２０はまた、ゲートウェイおよび／またはＴＲＡＵ（トランスコーダおよびレートアダプタユニット）など、中間エンティティを含み得る。

[0084]通信に対する各パーティーは、送信だけでなく受信もでき、各端末はオーディオエンコーダＡＥ１０およびデコーダＡＤ１０のインスタンスを含み得る。オーディオエンコーダおよびデコーダは、個別のデバイスであってよく、または「ボイスコーダ」もしくは「ボコーダ」として知られる単一のデバイスに組み込まれてもよい。図１Ａに示すように、端末１０２、１０４は、ネットワークＮＷ１０の一端末におけるオーディオエンコーダＡＥ１０と、他の端末におけるオーディオデコーダＡＤ１０とともに説明されている。

[0085]送信端末１０２の少なくとも１つの構成では、オーディオ信号（たとえば、音声）は、第１のユーザインターフェースＵＩ１０からオーディオエンコーダＡＥ１０にフレームで入力され得、各フレームはサブフレームにさらに区分される。そのような任意のフレーム境界は、何らかのブロック処理が実行される場合に使用され得る。しかしながら、そのようにオーディオサンプルをフレーム（およびサブフレーム）に区分することは、ブロック処理ではなく連続処理が実施される場合は省略され得る。説明する例では、ネットワークＮＷ１０上で送信された各パケットは、特定の適用例および全体的な設計制約に応じて１つまたは複数のフレームを含み得る。

[0086]オーディオエンコーダＡＥ１０は、可変レートまたは単一固定レートのエンコーダであってよい。可変レートエンコーダは、オーディオコンテンツに応じて（たとえば、音声が存在するかどうかおよび／またはどのタイプの音声が存在するかに応じて）、複数のエンコーダモード（たとえば、異なる固定レート）の間でフレームからフレームに動的に切り替え得る。オーディオデコーダＡＤ１０はまた、対応する方式において、対応するデコーダモードの間でフレームからフレームに動的に切り替え得る。受信端末１０４において許容できる信号再生品質を維持しながら、可能な最低のビットレートを各フレームが達成するために、特定のモードが選択され得る。

[0087]オーディオエンコーダＡＥ１０は、一般に、入力信号を一連の重複しない時間のセグメントすなわち「フレーム」として処理し、新しい符号化されたフレームが、各フレームに対して計算される。フレーム期間は、概して、信号が局所的に静止していることが予測され得る期間であり、一般的な例は、２０ミリ秒（１６ｋＨｚのサンプリングレートで３２０サンプル、１２．８ｋＨｚのサンプリングレートで２５６サンプル、または８ｋＨｚのサンプリングレートで１６０サンプルに相当）と１０ミリ秒とを含む。また、入力信号を一連の重複するフレームとして処理するようにオーディオエンコーダＡＥ１０を実装することが可能である。

[0088]図１Ｂは、フレームエンコーダＦＥ１０を含むオーディオエンコーダＡＥ１０の実装形態ＡＥ２０のブロック図を示す。フレームエンコーダＦＥ１０は、入力信号の一連のコアオーディオフレームＣＦの各々を符号化して、一連の符号化されたオーディオフレームＥＦのうちの対応する１つを作成するように構成される。オーディオエンコーダＡＥ１０はまた、入力信号をフレームに分割することおよびフレームエンコーダＦＥ１０に対するコーディングモードを選択することなど、追加のタスクを実行するように実装され得る。コーディングモード（たとえば、レート制御）を選択することは、音声活動検出（ＶＡＤ）を実行することおよび／またはそれ以外にフレームのオーディオコンテンツを分類することを含むことがある。この例では、オーディオエンコーダＡＥ２０はまた、コアオーディオフレームＣＦを処理して、音声活動検出信号ＶＳ（たとえば、３ＧＰＰＴＳ２６．１０４ｖ１０．０．０、２０１１年３月、ＥＴＳＩで入手可能、に記載されている）を作成するように構成された音声活動検出器ＶＡＤ１０を含む。

[0089]フレームエンコーダＦＥ１０は、一般に、（Ａ）フィルタを記述するパラメータのセット、および（Ｂ）記述されたフィルタを駆動してオーディオフレームの合成された再生を作成するためにデコーダにおいて使用される励振信号、として入力オーディオ信号の各フレームを符号化するソースフィルタモデルに従って実装される。音声信号のスペクトルエンベロープは、一般に、声道（たとえば、喉および口の）の共鳴を表し、ホルマントと呼ばれるピークによって特徴づけられる。たいていの音声コーダは、少なくともこの粗いスペクトル構造をフィルタ係数などのパラメータのセットとして符号化する。残りの残留信号は、フィルタを駆動して音声信号を作成し、一般にその強度およびピッチによって特徴づけられるソース（たとえば、声帯によって作成される）としてモデル化され得る。

[0090]図３は、前処理モジュールＰＰ１０と、線形予測コーディング（ＬＰＣ）分析モジュールＬＡ１０と、開ループピッチ探索モジュールＯＬ１０と、適応コードブック（ＡＣＢ：adaptive codebook）探索モジュールＡＳ１０と、固定コードブック（ＦＣＢ：fixed codebook）探索モジュールＦＳ１０と、利得ベクトル量子化（ＶＱ）モジュールＧＶ１０とを含むフレームエンコーダＦＥ１０の基本的実装形態ＦＥ２０のブロック図を示す。前処理モジュールＰＰ１０は、たとえば、３ＧＰＰＴＳ２６．１９０ｖ１０．０．０の５．１節に記載されているように実装され得る。１つのそのような例では、前処理モジュールＰＰ１０は、コアオーディオフレーム（たとえば、１６ｋＨｚから１２．８ｋＨｚまで）のダウンサンプリングすることと、ダウンサンプリングされたフレームを（たとえば、５０Ｈｚの遮断周波数で）ハイパスフィルタ処理することと、フィルタ処理されたフレームのプリエンファシス（たとえば、一次ハイパスフィルタを使用）とを実行するように実装される。

[0091]線形予測コーディング（ＬＰＣ）分析モジュールＬＡＮ１０が、各コアオーディオフレームのスペクトルエンベロープを線形予測（ＬＰ）係数（たとえば、全極型フィルタ１／Ａ（ｚ）の係数）のセットとして符号化する。一例では、ＬＰＣ分析モジュールＬＡ１０は、各２０ミリ秒フレームのホルマント構造を特徴づけるための１６個のＬＰフィルタ係数のセットを計算するように構成される。分析モジュールＬＡ１０は、たとえば、３ＧＰＰＴＳ２６．１９０ｖ１０．０．０の５．２節に記載されているように実装され得る。

[0092]分析モジュールＬＡ１０は、各フレームのサンプルを直接分析するように構成され得、またはサンプルは、最初に、ウィンドウイング関数（たとえば、ハミングウィンドウ）に従って重み付けされ得る。また、分析は、３０ミリ秒ウィンドウなど、フレームよりも大きいウィンドウにわたって実行され得る。このウィンドウは、対称（たとえば、このウィンドウが、２０ミリ秒フレームの直前および直後に５ミリ秒を含むように、５−２０−５）であるか、または非対称（たとえば、このウィンドウが、先行するフレームの最後の１０ミリ秒を含むように、１０−２０）であり得る。ＬＰＣ分析モジュールは、一般に、Ｌｅｖｉｎｓｏｎ−Ｄｕｒｂｉｎ再帰またはＬｅｒｏｕｘ−Ｇｕｅｇｕｅｎアルゴリズムを使用してＬＰフィルタ係数を計算するように構成される。ＬＰＣ符号化は音声に好適であるが、それはまた、一般的なオーディオ信号（たとえば、音楽などの非音声を含む）を符号化するためにも使用され得る。別の実装形態では、分析モジュールは、ＬＰフィルタ係数のセットの代わりに、各フレームについてケプストラム係数のセットを計算するように構成され得る。

[0093]線形予測フィルタ係数は、一般に、効率的に量子化することが困難であり、通常、量子化および／またはエントロピー符号化のために、線スペクトル対（ＬＳＰ）もしくは線スペクトル周波数（ＬＳＦ）、またはイミッタンススペクトル対（ＩＳＰ）もしくはイミッタンススペクトル周波数（ＩＳＦ）など、別の表示にマッピングされる。一例では、分析モジュールＬＡ１０は、ＬＰフィルタ係数のセットを対応するＩＳＦのセットに変換する。ＬＰフィルタ係数の他の１対１の表現は、ＰＡＲＣＯＲ係数とログ面積比（log-area-ratio）の値とを含む。一般に、ＬＰフィルタ係数のセットとＬＳＦ、ＬＳＰ、ＩＳＦ、またはＩＳＰの対応するセットとの間の変換は可逆であるが、実施形態は、変換が可逆でなく誤差がない分析モジュールＬＡ１０の実装形態をも含む。

[0094]分析モジュールＬＡ１０は、ＩＳＦ（またはＬＳＦもしくは他の係数表示）のセットを量子化するように構成され、また、フレームエンコーダＦＥ２０は、この量子化の結果をＬＰＣインデックスＸＬとして出力するように構成される。そのような量子化器は、一般に、入力ベクトルをテーブルまたはコードブック中の対応するベクトルエントリへのインデックスとして符号化するベクトル量子化器を含む。

[0095]フレームエンコーダＦＥ２０はまた、適応コードブック探索モジュールＡＳ１０においてピッチ分析を簡素化し、閉ループピッチ探索の範囲を縮小するために使用され得る、随意の開ループピッチ探索モジュールＯＬ１０を含む。モジュールＯＬ１０は、量子化されないＬＰフィルタ係数に基づく重み付けフィルタを介して入力信号をフィルタ処理し、重み付けされた信号を２つまで間引きし、（現在のレートに応じて）フレーム当たり１回または２回、ピッチ推定を作成するように実施され得る。モジュールＯＬ１０は、たとえば、３ＧＰＰＴＳ２６．１９０ｖ１０．０．０の５．４節に記載されているように実装され得る。

[0096]適応コードブック（ＡＣＢ）探索モジュールＡＳ１０は、ピッチフィルタの遅延と利得とを作成するために（過去の励振に基づく、「ピッチコードブック」とも呼ばれる）適応コードブックを探索するように構成される。モジュールＡＳ１０は、（たとえば、量子化されたおよび量子化されないＬＰフィルタ係数に基づいて重み付けされた合成フィルタを介してＬＰ残差をフィルタ処理することによって得られるような）目標信号上のサブフレームベースで開ループピッチ推定周りの閉ループピッチ探索を実行し、次いで、示されたわずかなピッチラグにおいて過去の励振を内挿することによって適応コードベクトルを計算し、ＡＣＢ利得を計算するように実装され得る。モジュールＡＳ１０はまた、（特に６４サンプルのサブフレームサイズより小さい遅延に対して）ＬＰ残差を使用して過去の励振バッファを拡大し、閉ループピッチ探索を簡素化するように実装され得る。モジュールＡＳ１０は、（たとえば、各サブフレームに対する）ＡＣＢ利得と、第１のサブフレームのピッチ遅延（または現在のレートに応じて第１および第３のサブフレームのピッチ遅延）および他のサブフレームの相対的ピッチ遅延を示す量子化されたインデックスとを作成するように実装され得る。モジュールＡＳ１０は、たとえば、３ＧＰＰＴＳ２６．１９０ｖ１０．０．０の５．７節に記載されているように実装され得る。

[0097]固定コードブック（ＦＣＢ）探索モジュールＦＳ１０は、適応コードベクトルによってモデル化されない励振の部分を表す固定コードブック（「革新コードブック」、「革新的コードブック」、「確率論的コードブック」、または「代数的コードブック」とも呼ばれる）のベクトルを示すインデックスを作成するように構成される。モジュールＦＳ１０は、コードブックが必要でないように、（たとえば、パルスの位置および符号を表す）ＦＣＢベクトルを再生するのに必要なすべての情報を含むコード語としてコードブックインデックスを作成するように実装され得る。モジュールＦＳ１０は、たとえば、３ＧＰＰＴＳ２６．１９０ｖ１０．０．０の５．８節に記載されているように実装され得る。

[0098]利得ベクトル量子化モジュールＧＶ１０は、各サブフレームに対する利得を含み得るＦＣＢおよびＡＣＢの利得を量子化するように構成される。モジュールＧＶ１０は、たとえば、３ＧＰＰＴＳ２６．１９０ｖ１０．０．０の５．９節に記載されているように実装され得る。

[0099]コードブックベースの手法の代替として、変換ベースの手法が、ＬＰＣ残留信号を符号化するために使用され得る。たとえば、変形離散コサイン変換（ＭＤＣＴ）は、残差を符号化して、Ｃａｌｌｉｏｐｅ超広帯域コーデック（ＱＵＡＬＣＯＭＭ社、カリフォルニア州サンディエゴ）およびＡＭＲ−ＷＢ＋コーデックのＴＣＸオプションにおけるような、ＭＤＣＴ係数のセットを含むパラメータにするために使用され得る。別の例では、変換ベースの手法は、ＬＰＣ分析を実行することなくオーディオ信号を符号化するために使用される。

[00100]図５Ａに、タスクＴ２００とＴ３００とを含む一般的構成による、オーディオ信号処理の方法Ｍ１００のフローチャートを示す。タスクＴ２００は、オーディオ信号内でオーディオ信号の第１のフレーム（たとえば、クリティカルフレーム）に後続する、オーディオ信号の第２のフレーム（「後続フレーム」または「キャリアフレーム」）に対する決定メトリックの少なくとも１つの値を計算する。決定メトリックの少なくとも１つの計算された値に基づいて、タスクＴ３００は、複数の再割振り候補の中の１つを選択し、選択された再割振り候補は、後続フレームに対する初期ビット割振りＴの、第１の部分および第２の部分への再割振りを示す。典型的な適用例では、初期ビット割振りＴの第１の部分は、次いで、後続フレームのコピーを搬送するために使用され、初期ビット割振りの第２の部分は、クリティカルフレームの冗長コピーを搬送するために使用される。

[00101]キャリアフレームもまたクリティカルフレーム（すなわち、それに後続する別のフレームに対してクリティカル）となる尤度を低減することが望ましい。一般に、この尤度は、クリティカルフレームの直後にくるフレームに対して最高であり、後続の諸フレームに対して急速に低下する。有声音声に対して、トークスパートにおけるオンセットフレームがクリティカルであること、およびそれの直後にくるフレームもまた、（たとえば、オンセットフレームが失われた場合にカバーするために）クリティカルであることが一般的である。しかしながら、トークスパートにおける別のフレームが（たとえば、ピッチラグ（pitch lag）が変動する場合に）クリティカルとなることも起こり得る。

[00102]フレームオフセットｋは、クリティカルフレームとキャリアフレームとの間の距離を示すために使用され得る。そのような一例では、フレームオフセットｋの値は、クリティカルフレームｎとキャリアフレーム（ｎ＋ｋ）との間のフレーム数の差（たとえば、介在するフレームの数より１多い）である。図６Ａは、ｋの値が３である典型的な例を示す。別の例では、ｋの値は４である。他のあり得る値は、１、２、３、５、および５より大きい整数を含む。

[00103]方法Ｍ１００は、（たとえば、システム実装の間または呼設定の間）オフセットｋが固定されるように実施され得る。ｋの値は、元の時間領域信号および最大許容遅延内の（たとえば、ミリ秒の単位の）フレームの長さに従って選択され得る。たとえば、ｋの値は、（たとえば、フレーム遅延を制限するために）最大許容値によって制約され得る。最大許容遅延が８０または１００ミリ秒の値を有することが望ましい。そのような場合、ｋは、２０ミリ秒フレームを使用するスキームに対して４もしくは５の最大値、または１０ミリ秒フレームを使用するスキームに対して８、９もしくは１０の最大値を有し得る。

[00104]オフセットｋの値はまた、（たとえば、受信機からのフィードバックによって示される）チャネル状態に従って、呼の間に選択されおよび／または更新され得る。たとえば、連続するフレームの頻繁なロスを（たとえば、長いフェードによって）引き起こしている環境において、より大きいｋの値を使用することが望ましい。

[00105]受信端末１０４はまた、チャネル状態情報１２０を送信端末１０２にフィードバックすることができる。１つのそのような例では、受信端末１０４は、送信端末１０２からパケットを搬送する送信チャネルの品質に関連する情報を収集するように構成される。受信端末１０４は、収集された情報を使用してチャネルの品質を推定する。次いで、収集された情報および／またはチャネル品質推定は、チャネル状態情報として送信端末１０２にフィードバックされ得る。

[00106]図４は、送信チャネルＴＣ１０およびＲＣ１０を介してネットワークＮＷ１０上で通信する、送信端末１０２の実装形態１１２および受信端末１０４の実装形態１１４の一例を示すブロック図である。この例では、受信端末１１４は、（たとえば、オーディオデコーダＡＤ１０から）収集された情報および／または品質推定を送信用のパケットにアセンブルし、送信機ＴＸ１０のインスタンスＴＸ２０および送信チャネルＲＣ１０を介して送信端末１１２に戻すチャネルエンコーダＣＥ１０のインスタンスＣＥ２０を含み、送信端末１１２で、パケットは受信機ＲＸ１０のインスタンスＲＸ２０によって受信され、チャネルデコーダＣＤ１０のインスタンスＣＤ２０によって逆アセンブルされ、情報および／または推定がオーディオエンコーダＡＥ１０に供給される。送信端末１１２（たとえば、オーディオエンコーダＡＥ１０）は、このチャネル状態情報を使用して、本明細書で説明する送信側ベースのパケットロス復元方式に関連する１つまたは複数の機能（たとえば、オフセットおよび／またはクリティカリティ閾値）に適合させ得る。

[00107]オフセットｋは、フレームの主コピーの送信時間とフレームの冗長コピーの送信時間との間の間隔の長さを示す。通常、パケット交換ネットワーク内のパケットロスはバースト的であり、バースト長は、異なるネットワーク状態の下で異なることがある。したがって、動的に調節されるオフセットを使用することが、よりよい誤り保護性能をもたらし得る。最適なオフセットは、受信機によって送られたチャネル状態情報を使用して推定され得る。たとえば、オフセット値は、チャネル状態に基づいて、（たとえば、実行時に）適応的に調節され得る。代替として、オフセット値はあらかじめ決定されてもよい。

[00108]一例では、タスクＴ２００は、フレームからの情報に基づく開ループ決定メトリックＤを計算する。図５Ｂに、メトリック計算タスクＴ２００のそのような実装形態Ｔ２１０を含む方法Ｍ１００の実装形態Ｍ２００のフローチャートを示す。タスクＴ２１０は、開ループメトリックＤを、たとえば、後続フレームの圧縮率の尺度として計算するように実施され得る。そのような尺度は、互いに後続するフレームのサブフレームの相関として、（たとえば、サブフレームのすべての可能なラグ値およびすべての対（またはすべての隣接する対））にわたる最大相関、またはサブフレームの各対に対する（または各隣接する対に対する）すべての可能なラグ値にわたる最大相関の平均値として）計算され得る。そのような尺度は、フレームの圧縮率の静的尺度であるものと見なされてよい。メトリックＤの１つのそのような例は、長さＳの２つのサブフレームｖ_iとｖ_jとの間のラグｐにおける相関の尺度Ｒ_ijpであり、Ｒ_ijpは、

などの表現を使用して計算され得る。

[00109]１つのそのような例では、２０ミリ秒フレームが、それぞれ、長さ５３、５３および５４サンプルの３つのサブフレームに分割される。別のそのような例では、２０ミリ秒フレームが、４つの５ミリ秒サブフレームに分割される。メトリックＤは、たとえば、Ｄの高い値が圧縮可能なフレームを示し、Ｄの低い値が圧縮に対して抵抗性のあるフレームを示すように選択され得る。

[00110]タスクＴ３００は、決定メトリックの少なくとも１つの計算された値に基づいて、複数の再割振り候補の中の１つを選択する。図５Ｃは、方法Ｍ２００の実装形態Ｍ２１０のフローチャートを示す。方法Ｍ２１０は、比較タスクＴ３１０を含み、閾値Ｖ₁〜Ｖ_Mのセットを通してループするように構成されたループとして、タスクＴ３００の実施態様を含む。タスクＴ３１０は、Ｄの値と、閾値のセットのうちの現在の閾値とを比較する。この非限定的な例では、閾値のセットは、１〜（Ｍ−１）のすべての整数ｑに対してＶ_q≦Ｖ_q+1となるように順序付けられ、ループは、値Ｖ_Mにおいて開始するように構成される。一例では、Ｍの値は３であるが、他の可能な値は、２、４、５および５より大きい整数を含む。

[00111]再割振りインデックスｍに対して１の値で開始すると、図５Ｃに示すループは、Ｄの値が閾値Ｖ_mより小さくない（代替として、より大きい）ｍの値を選択する。典型的な適用例では、後続フレームのコピーおよびクリティカルフレームの冗長コピーが、選択されたインデックスｍの値によって示される再割振り候補に従って、初期ビット割振りＴに符号化される。

[00112]再割振り候補の各々は、少なくとも後続フレームおよびクリティカルフレームの中の初期ビット割振りの分配を示す。たとえば、各分配Ｎ_mは、初期ビット割振りＴを、クリティカルフレームに対するＮ_mビットの割振りと、後続フレームに対する（Ｔ−Ｎ_m）ビットの割振りとに分離することを示し得る。他の場合には、分配が、別のフレームおよび／または同様に他の情報を符号化するために、Ｔビットの全割振りのうちの一部の割振りを示すことが可能である。

[00113]図６Ｂは、閾値Ｖ₁〜Ｖ_Mで規定される決定メトリックＤの値の範囲、ならびにこれらの範囲の各々と、第１（キャリア）の部分および第２（冗長）の部分の中の初期ビット割振りＴの複数の分配のうちの異なる１つとの間の対応を示す。この例では、分配の各々は、数Ｎ₁〜Ｎ_Mで規定され、数Ｎ₁〜Ｎ_Mは、第２の部分におけるビット数、または第２の部分に符号化されるべきフレームに対するビットレートを示し得る（この例はまた、以下で説明するフォールバック分配Ｎ₀も含む）。メトリックＤは、たとえば、Ｄの高い値が圧縮可能なフレームを示し、Ｄの低い値が圧縮に対して抵抗性のあるフレームを示すように選択され得る。この場合、圧縮可能なフレームを示すＤの値（すなわち、高いＤの値）に対して、低いレート（すなわち、小さい冗長部分）で十分であり得る。圧縮に対して抵抗性のあるフレームを示すＤの値（すなわち、この例では低いＤの値）に対して、より高いレート（すなわち、より大きい冗長部分）が望ましい。方法Ｍ２１０の制限されない例では、再割振り候補のセットは、１〜（Ｍ−１）のすべての整数ｐに対してＮ_p≦Ｎ_p+1であるように順序付けられる。

[00114]大部分のクリティカルフレームに対して、方法Ｍ２１０におけるループは、Ｍ回より少ない回数で繰り返され得ることを明確に留意されたい。たとえば、大部分のクリティカルフレームに対して、十分な再割振り候補が識別される前にセット内のあらゆる閾値に対して方法が実行する必要がないように方法Ｍ２００を実施すること（たとえば、適切な決定メトリックと閾値のセットとを選択すること）が望ましい。

[00115]セット内のすべての閾値に対してタスクＴ３１０が失敗する場合、方法Ｍ２１０は、クリティカルフレームの冗長コピーは送信され得ないものと判断し得る。代替として、方法Ｍ２１０は、図６Ｂに示すフォールバックの場合を含むように実施され得る。図６Ｃは、再割振りインデックスｍに対してＭの値で開始するように構成された、選択するタスクＴ３００の代替実装形態Ｔ３２０を含む、ループを有する方法Ｍ２００の実装形態Ｍ２２０のフローチャートを示す。方法Ｍ２２０はまた、図６Ｂに示すフォールバックの場合を示すように実施され得る。

[00116]図５Ｃおよび図６Ｃに示す特定のループ構造、ならびにメトリックＤの値の範囲と初期ビット割振りの再割振りとの間の特定の対応は例示のためだけであり、任意の適切な選択ループ、ならびに決定メトリックの閾値Ｖ₁〜Ｖ_Mの順序付けられたセットの要素と冗長部分再割振りＮ₁〜Ｎ_Mの順序付けられたセットの対応する要素との間の任意の適切な対応が使用されてよいことが理解されよう。上記で説明した決定メトリックＤの開ループの例は例示のためだけであり、決定メトリックを再割振りと組み合わせる開示された原理は、クリティカルフレームの冗長コピーを収容するためにキャリアフレームのビットレートを低減することに対する知覚品質の影響を測定する任意の決定メトリック（たとえば、開ループまたは閉ループ）に適用され得ることにも留意されたい。

[00117]クリティカルフレームに後続する１つまたは複数のフレームからの情報に基づいて、フレーム（ｎ＋ｋ）を選択するように（たとえば、オフセットｋに対する値を選択するように）方法Ｍ１００を実施することが望ましい。そのような場合、クリティカルフレームがチャネル内で失われない場合に知覚品質の影響を最小にするようにフレーム（ｎ＋ｋ）を選択することが望ましい。たとえば、最大遅延制約Ｋを仮定して、最も圧縮可能な後続フレームをフレーム（ｎ＋ｋ）として選択することが望ましい。図７Ａは、メトリック計算タスクＴ２００の実装形態Ｔ２２０を含む方法Ｍ１００の実装形態Ｍ３００のフローチャートを示す。タスクＴ２２０は、オーディオ信号内でクリティカルフレームに後続する複数のフレームの各々に対して決定メトリックの少なくとも１つの値を計算する。方法Ｍ３００はまた、複数の再割振り候補の中の１つと複数の後続フレームの中の１つとを（たとえば、対応するオフセットｋの値を選択することによって）選択するタスクＴ３００の実装形態Ｔ３５０を含む。

[00118]図７Ｂは、方法Ｍ３００の実装形態Ｍ３１０のフローチャートを示す。方法Ｍ３１０は、計算タスクＴ２３０を含むループとしてタスクＴ２２０の実装形態を含む。タスクＴ２３０は、オフセットｋの現在の値によって示されるフレームに対して本明細書で説明する決定メトリックＤの値を計算する。方法Ｍ３１０はまた、比較タスクＴ３３０を含み、閾値Ｖ₁〜Ｖ_Mのセットを通して逆順にループするように構成されたループとして、タスクＴ３５０の実施態様を含む。この非限定的な例では、閾値のセットは、１〜（Ｍ−１）のすべての整数ｑに対してＶ_q≦Ｖ_q+1となるように順序付けられ、タスクＴ２３０を含むループは値ｋ＝１において開始するように構成され、タスクＴ３３０を含むループは、値Ｖ_Mにおいて開始するように構成される。セット内のすべての閾値に対してタスクＴ３３０が失敗する場合、方法Ｍ３１０は、クリティカルフレームの冗長コピーは、オフセットｋに対して送信され得ないものと判断し得る。セット内のすべての閾値に対しておよびすべてのｋの値に対してタスクＴ３３０が失敗する場合、方法Ｍ３１０は、クリティカルフレームの冗長コピーは送信され得ないものと判断し得る。代替として、方法Ｍ３１０は、フォールバックとしてオフセットｋのデフォルト値（たとえば、３または４）を含むように実施され得る。

[00119]大部分のクリティカルフレームに対して、タスクＴ３３０は、Ｋ個のフレームより少ないフレームの各々に対して、決定メトリックの値と閾値のセットのＭの値とを比較し得ることを明確に留意されたい。たとえば、大部分のクリティカルフレームに対して、十分なフレームおよび再割振り候補が識別される前にＫ個の後続フレームの１つずつに対して方法が実行する必要がないように、方法Ｍ３００を実施すること（たとえば、適切な決定メトリックと閾値のセットとを選択すること）が望ましい。Ｍが１に等しく（たとえば、唯一の閾値）、Ｋが１より大きい（たとえば、複数の可能なオフセット）ように方法Ｍ３００（たとえば、Ｍ３１０）を実施することも可能である。

[00120]後続フレームの複数のＫ個のフレームのすべてに対して、閾値およびＭ個の再割振り候補の同じセットが使用されことが考えられるが、異なる後続フレームに対して異なる閾値のセットおよび／または再割振り候補を（たとえば、後続フレームの音声モードおよび／または他の特性に従って）使用することも可能であり、そのような場合は、再割振り候補の各セットが要素Ｍの異なるそれぞれの数を有することが可能である。

[00121]別の例では、タスクＴ２００は、閉ループ決定メトリックに対する値のセットを計算するように実施される。この例では、計算された各値は、後続フレームのそれぞれの符号化されたバージョンからの情報に基づく尺度など、圧縮率の動的尺度に基づく。図８Ａに、メトリック計算タスクＴ２００のそのような実装形態Ｔ２５０を含む方法Ｍ１００の実装形態Ｍ４００のフローチャートを示す。タスクＴ２５０は、たとえば、知覚品質の尺度に基づいて決定メトリックを計算するように実施され得る。そのようなメトリックは、キャリアフレームの知覚品質における関連する変化（たとえば、減少）の尺度として、各再割振り候補に対して計算され得る。たとえば、そのようなメトリックは、（Ａ）すべての初期ビット割振りＴを使用して符号化されるときのキャリアフレームの知覚品質の尺度と（Ｂ）初期ビット割振りのキャリア部分だけを使用して符号化される時のキャリアフレームの知覚品質の尺度との間の差（たとえば、絶対値の差）または比として計算され得る。

[00122]図８Ｂは、方法Ｍ４００の実装形態Ｍ４１０のフローチャートを示す。方法Ｍ４１０は、計算サブタスクＴ２６０を有し、再割振りインデックス１〜Ｍのセットを通ってループするように構成されたループとして、タスクＴ２５０の実装形態を含む。タスクＴ２６０は、フレーム（ｎ＋ｋ）および現在のインデックス値によって示される再割振り候補に対する決定メトリックの値Ｄ_mを計算する。この例では、Ｄ_m＝｜Ｑ（Ｔ）−Ｑ（Ｔ−Ｎ_m）｜であり、ここで、Ｑ（ｘ）はｘビットを使用して符号化されるときのフレーム（ｎ＋ｋ）の知覚品質の尺度である。尺度Ｄ_mのそのような例はまた、フレーム（ｎ＋ｋ）に対する分配Ｎ_mの品質コストと見なされてよく、他のそのような（たとえば、Ｔビットを使用して符号化されるときのフレーム（ｎ＋ｋ）の品質に対する）品質コストもまた使用されてよい。

[00123]圧縮率の尺度Ｑ（ｘ）は、フルリファレンスメトリック、ノーリファレンスメトリック、または低減リファレンスメトリックであってよい。尺度Ｑ（ｘ）の例は、知覚的に重み付けされたひずみの尺度（たとえば、ＩＴＵ−Ｔ勧告８６１頁に記載されている、計測正規化ブロック（measuring normalizing block）すなわちＭＮＢアルゴリズムの、拡張修正Ｂａｒｋスペクトル距離（enhanced modified Bark spectral distance）すなわちＥＭＢＳＤ）と、元の信号および符号化された信号上の（たとえば、隠れマルコフモデルを適用する）音声認識器のワード誤り率出力と、推定された平均オピニオン評点（ＭＯＳ）にマッピングされ得るＲ値を作成するＥモデル（たとえば、ＩＴＵ−Ｔ勧告Ｇ．１０７およびＧ．１０８に記載されている）の１バージョンとを含む。Ｑ（ｘ）に対して使用され得るメトリック（たとえば、目的メトリック（objective metric））の他の例は、信号対雑音比（ＳＮＲ）と、知覚的に重み付けされたＳＮＲ（たとえば、フレーム（ｎ＋ｋ）のＬＰ係数を使用して重み付けされる）と、セグメント化されたＳＮＲと、知覚的に重み付けされたセグメント化されたＳＮＲと、ケプストラル距離と、Ｂａｒｋスペクトラル距離とを含む。Ｑ（ｘ）に対して使用され得る目的メトリックのさらなる例は、知覚的音声品質尺度（ＰＳＱＭ）（たとえば、ＩＴＵ−Ｔ勧告８６１頁に記載されている）と、そのような尺度によって作成されるときの雑音擾乱推定器（noise disturbance estimator）と、たとえば、ＩＴＵ−Ｔ勧告８６１頁および８６２頁（たとえば、ＰＳＱＭおよびＰＳＱＭ＋、音声品質の知覚評価、ＰＥＳＱ）において記載されている他のメトリックとを含む。別の例では、決定メトリックＤ_mは、ＳＮＲ、または知覚的に重み付けされたＳＮＲとして計算され、信号量は、Ｔビットを使用して符号化されたバージョンから復号されるときのフレーム（ｎ＋ｋ）のエネルギーに基づき、雑音量は、信号品質と、（Ｔ−Ｎ_m）ビットを使用して符号化されたバージョンから復号されたフレーム（ｎ＋ｋ）との間の差のエネルギーに基づく。

[00124]方法Ｍ４１０はまた、比較サブタスクＴ３４０を有し、決定メトリック値Ｄ₁〜Ｄ_Mの計算されたセットを通してループするように構成されたループとして、タスクＴ３００の実施態様を含む。タスクＴ３４０は、閾値Ｚと、決定メトリック値のセットのうちの現在の値とを比較する。この非限定的な例では、決定メトリック値のセットは、１〜（Ｍ−１）のすべての整数ｐに対してＤ_p≦Ｄ_p+1であるように順序付けられる。一例では、Ｍの値は３であるが、他の可能な値は、２、４、５および５より大きい整数を含む。

[00125]再割振りインデックスｍに対して１の値で開始すると、タスクＴ３４０を含むループは、Ｄ_mの値が閾値Ｚより大きくない（代替として、小さい）ｍの第１の値を選択する。方法Ｍ４００は、フレーム（ｎ＋ｋ）のコピーと、再割振り候補Ｎｍによるクリティカルフレームの冗長コピーとを符号化することによるそのような選択を適用するように実施され得る。セット内のすべての閾値に対してタスクＴ３４０が失敗する場合、方法Ｍ４１０は、クリティカルフレームの冗長コピーは送信され得ないものと判断し得る。代替として、方法Ｍ４１０は、フォールバックの場合（たとえば、デフォルト再割振り）を含むように実施され得る。

[00126]大部分のクリティカルフレームに対して、タスクＴ３４０は、決定メトリックのＭ個の値のすべてより少ない値と閾値Ｚとを比較し得ることを明確に留意されたい。たとえば、大部分のクリティカルフレームに対して、そのフレームに対する十分な再割振りが識別される前にＭ個の値の１つずつを方法が試験する必要がないように方法Ｍ４００を実施すること（たとえば、適切な決定メトリックと、閾値と、再割振り候補のセットとを選択すること）が望ましい。

[00127]図９Ａは、単一のループがタスクＴ２６０とＴ３４０の両方を包含する方法Ｍ４００の代替実装形態Ｍ４２０のフローチャートを示す。図９Ｂは、再割振りインデックスｍに対してＭの値で開始するように構成された、代替ループ構造を有する方法Ｍ４００の実装形態Ｍ４３０のフローチャートを示す。方法Ｍ４２０およびＭ４３０はまた、フォールバックの場合（たとえば、デフォルト再割振り）を含むように実施され得る。図８Ｂ、図９Ａおよび図９Ｂに示す特定のループ構造は例示のためだけであり、任意の適切な選択ループが方法Ｍ４００を実施するために使用されてよいことが理解されよう。

[00128]方法Ｍ３００に関連して本明細書で説明するものと同様にして、クリティカルフレームに後続する１つまたは複数のフレームからの情報に基づいてオフセットｋの値を選択するように方法Ｍ４００を実施することが望ましい。そのような場合には、クリティカルフレームがチャネル内で失われない場合に知覚品質の影響を最小にするようにオフセットｋに対して適切な値を決定することが望ましい。たとえば、最大の遅延制約Ｋを仮定して、品質の変更（change-of-quality）閾値Ｚを満足するためのｋの値を選択することが望ましい。

[00129]図１０Ａに、メトリック計算タスクＴ２５０の実装形態Ｔ２７０を含む方法Ｍ４００のそのような実装形態Ｍ５００のフローチャートを示す。タスクＴ２７０は、オーディオ信号内でクリティカルフレームに後続する複数のフレームの各々に対して決定メトリックの値のセットを計算する。方法Ｍ５００はまた、複数の再割振り候補の中の１つと複数の後続フレームの中の１つとを（たとえば、対応するオフセットｋの値を選択することによって）選択するタスクＴ３５０のインスタンスを含む。

[00130]図１０Ｂは、方法Ｍ５００の実装形態Ｍ５１０のフローチャートを示す。方法Ｍ５１０は、計算タスクＴ２６０のインスタンスＴ２８０を含むループとしてタスクＴ２７０の実装形態を含む。このループは、オフセットｋの現在の値によって示されるフレームに対する、本明細書で説明する決定メトリックの値Ｄ₁〜Ｄ_Mのセットを計算する。このループはまた、本明細書で説明する比較タスクＴ３４０のインスタンスとともにタスクＴ３５０を実施する。この非限定的な例では、ループは、オフセットインデックスｋと再割振りインデックスｍの両方を値１で初期化するように構成される。

[00131]後続フレームの複数のＫ個のフレームのすべてに対して、同じ閾値ＺおよびＭ個の再割振り候補の同じセットが使用されことが考えられるが、異なる後続フレームに対して異なる閾値Ｚおよび／または再割振り候補の異なるセットを（たとえば、後続フレームの音声モードおよび／または他の特性に従って）使用することも可能であり、そのような場合は、再割振り候補の各セットが要素Ｍの異なるそれぞれの数を有することが可能である。

[00132]大部分のクリティカルフレームに対して、タスクＴ３４０は、決定メトリックの各値Ｄ_mと、Ｋ個の後続フレームより少ないフレームの各々に対する閾値Ｚとを比較し得ることを明確に留意されたい。たとえば、大部分のクリティカルフレームに対して、そのフレームに対する後続フレームおよび十分な再割振りが識別される前にＫ個の後続フレームの１つずつに対して方法が実行する必要がないように方法Ｍ５００を実施すること（たとえば、適切な決定メトリックと、閾値と、再割振り候補のセットとを選択すること）が望ましい。

[00133]方法Ｍ５１０は、フレーム（ｎ＋ｋ）に対するすべての再割振り候補に対してタスクＴ３４０が失敗する場合、フレームがＴビットを使用して符号化されるように、実施され得る。すべての候補フレームにわたってすべての再割振り候補に対してタスクＴ３４０が失敗する場合、方法Ｍ５１０は、クリティカルフレームの冗長コピーは送信され得ないものと判断し得る。代替として、方法Ｍ５１０は、フォールバックとしてオフセットｋのデフォルト値（たとえば、３または４）と再割振りインデックスｍとを含むように実施され得る。図１１Ａ、図１１Ｂおよび図１２は、代替ループ構造を有する方法Ｍ５００の類似の実装形態Ｍ５２０、Ｍ５３０およびＭ５４０のフローチャートを、それぞれ示す。別の非限定的な変形形態では、方法Ｍ５１０のループ構造は、内部ループがｋ（たとえば、フレーム）の値を通して反復し、外部ループがｍ（たとえば、再割振り候補）の値を通して反復するように再構成される。

[00134]方法Ｍ１００は、フレームｎがクリティカルフレームであると判断することに応答して実行され得る。たとえば、クリティカル（すなわち、パケットロス状態の下で復号される信号の品質にとって重要）であると確認されたオーディオ信号の各フレームに対して、方法１００のインスタンスを実行することが望ましい。図１３Ａに、クリティカルフレームを識別するタスクＴ１００を含む方法Ｍ１００の実装形態Ｍ１１０のフローチャートを示す。

[00135]タスクＴ１００は、フレームに対するクリティカリティ尺度の値を計算し、計算された値と閾値とを比較することによって、信号のフレームがクリティカルであることを示すように実施され得る。そのようなクリティカリティ尺度は、フレーム内の情報に基づいてよく、また、入力信号内のフレームに隣接および／または後続する１つまたは複数のフレームからの情報に基づいてもよい。タスクＴ１００は、フレームに対して選択されたコーディングモードに基づくことができる閾値を、計算された値が超える（代替として、小さくない）とき、フレームがクリティカルであることを示すように実施され得る。タスクＴ１００は、オーディオ信号の各フレームに対して、またはクリティカルフレーム（たとえば、有声、過渡的、またはオンセットと確認されたフレーム、初期に少なくとも最小ビットレートに割り当てられたフレームなど）に対してのみ、実行するように実施され得る。

[00136]タスクＴ１００は、フレームの概略的特性評価から特定のロス影響評価までに及ぶ１つまたは複数の規準に基づいてクリティカリティ尺度を計算するように実施され得る。そのような尺度は、フレーム内の情報に基づいてよく、また、入力信号内のフレームに隣接および／または後続する１つまたは複数のフレームからの情報に基づいてもよい。

[00137]クリティカルフレームは、失われたときに、重大な品質劣化を引き起こすことがあるフレームであってよい。異なるクリティカルフレームは、異なるレベルのクリティカルな状態を有し得る。たとえば、２つのクリティカルフレームｎ１およびｎ２に対して、フレーム（ｎ１＋１）（すなわち、フレームｎ１の次のフレーム）がフレームｎ１から高度に予測可能であり、フレーム（ｎ２＋１）（すなわち、フレームｎ２の次のフレーム）がフレームｎ２にまったく依存しない場合、フレームｎ１を失うことが２つ以上のフレームにわたって品質劣化を引き起こすことがあるので、フレームｎ１はフレームｎ２よりクリティカルであり得る。

[00138]タスクＴ１００は、フレームｎのコーディングタイプ（すなわち、フレームを符号化するために使用されるコーディングプロセス）、および場合によってはフレームｎに隣接および／または後続する１つまたは複数のフレームの各々のコーディングタイプの表示に基づいて、クリティカリティ尺度を計算するように実施され得る。そのようなコーディングタイプの例は、コード励起線形予測（ＣＥＬＰ：code excited linear prediction）、雑音励起線形予測（ＮＥＬＰ：noise excited linear prediction）、プロトタイプ波形補間（ＰＷＩ：prototype waveform interpolation）、またはプロトタイプピッチ周期（ＰＰＰ：prototype pitch period）を含み得る。この規準の下で、たとえば、クリティカルＣＥＬＰフレームは、クリティカルＮＥＬＰフレームよりクリティカルであると見なされ得る。

[00139]追加または代替として、タスクＴ１００は、フレームｎの音声モード（すなわち、フレームの音声コンテンツの分類）、および場合によってはフレームｎに隣接および／または後続する１つまたは複数のフレームの各々の音声モードに基づいて、クリティカリティ尺度を計算するように実施され得る。音声モードの例は、有声と、非有声と、沈黙と、過渡的とを含み得る。「有声」の分類は、さらに、オンセットと静止とに分割され得る。過渡的の分類は、さらに、オントランジェント（on-transient）とオフトランジェント（off-transient）とに分割され得る。トークスパート内の後続フレームの符号化は、オンセットフレーム内の情報に大きく依存することがあるので、この規準の下で、たとえば、音声オンセットフレーム（トークスパート内の初期フレーム）は、静止有声フレームよりもクリティカルであり得る。一例では、タスクＴ１００は、フレームｎが音声オンセットフレームであり、後続フレーム（たとえば、フレーム（ｎ＋１）、（ｎ＋２）、または（ｎ＋３））が静止有声フレームであることの表示に応答して高度の依存を示すために、クリティカリティ尺度を計算するように実施される。

[00140]追加または代替として、タスクＴ１００は、フレームｎの（および場合によってはフレームｎに隣接および／または後続する１つまたは複数のフレームの各々の）１つまたは複数の他の特性に基づいて、クリティカリティ尺度を計算するように構成され得る。たとえば、フレームｎに対するいくつかの重要なパラメータの値が前のフレームに対する対応する値と著しく（たとえば、何らかの所定の閾値より大きく）異なる場合、フレームｎは、フレームｎの前のフレームから容易に予測され得ず、フレームｎのロスは、前のフレームよりもフレームｎにより類似する後続フレームに悪影響を及ぼすことがあるので、フレームｎはクリティカルフレームであり得る。

[00141]そのような特性の１つの例は、適応コードブック（ＡＣＢ）利得である。フレームｎに対する低いＡＣＢ利得値は、そのフレームが、それの前のフレームと著しく異なることを示し得、一方、フレームｎに後続するフレーム（たとえば、フレーム（ｎ＋１）、（ｎ＋２）、または（ｎ＋３））に対する高いＡＣＢ利得値は、フレームがフレームｎに大きく依存することを示し得る。一例では、タスクＴ１００は、フレームｎからの情報（たとえば、励振信号）を使用して、後続フレームに対する適応コードベクトルを生成し、後続フレームの符号化されたバージョンに対するＡＣＢ利得値を計算する。この例では、タスクＴ１００は、少なくとも計算されたＡＣＢ利得値に基づいてクリティカリティ尺度を計算するように実施される。

[00142]そのような特性の別の例は、この場合は、

として表現され得る、知覚的に重み付けされたＳＮＲ（信号対雑音比）である。

ここで、Ｌはサンプル内のフレーム長であり、ｃはフレームｎの復号されたバージョンを知覚的に重み付けするフィルタＷ（ｚ）でフィルタ処理することによって得られる知覚的に重み付けされた信号であり、ｅは知覚的に重み付けされた誤りである。誤りｅは、たとえば、（Ａ）Ｗ（ｚ）フィルタ処理されたフレームｎの復号バージョンと（Ｂ）Ｗ（ｚ）フィルタ処理された、フレームｎの誤り隠蔽（error-concealed）バージョン（すなわち、フレームはデコーダで利用可能ではないものと仮定する）との間の差として計算され得る。誤り隠蔽バージョンは、フレーム誤り隠蔽アルゴリズムに従って前のフレームからの情報に基づいて計算され得る。たとえば、誤り隠蔽バージョンは、３ＧＰＰＴＳ２６．０９１、ｖ．１０．０．０（２０１１年４月、「Ｅｒｒｏｒｃｏｎｃｅａｌｍｅｎｔｏｆｌｏｓｔｆｒａｍｅｓ」、ＥＴＳＩから入手可能）に記載されている手順に従って計算され得る。一例では、Ｗ（ｚ）＝Ａ（ｚ／γ）Ｈ（ｚ）であり、ここで、

であり、ａ₁〜ａ_pはフレームｎに対するＬＰＣフィルタ係数であり、γ＝０．９２であり、Ｈ（ｚ）＝１／（１−０．６８ｚ^-1）である。代替例では、誤りｅは、フィルタＷ（ｚ）を、復号バージョンと誤り隠蔽バージョンとの間の差に適用することによって計算される。

[00143]追加または代替として、タスクＴ１００は、クリティカリティ尺度を、フレームｎのロスが１つまたは複数の後続フレームのコーディング品質に及ぼす影響の推定として計算するように構成され得る。たとえば、クリティカリティ尺度は、フレームｎに後続する１つまたは複数のフレームの各々の符号化バージョンからの情報（たとえば、フレームｎおよび／または後続フレームのうちの１つまたは複数、の適応コードブック利得）に基づくことができる。追加または代替として、そのような尺度は、フレームｎに後続する１つまたは複数のフレームの各々の復号バージョンの情報（たとえば、復号バージョンの知覚的に重み付けされたＳＮＲ）に基づくことができ、ここで、後続フレームは、フレームｎの情報を使用せずに符号化されていた。

[00144]フレームｎに対するフレーム（ｎ＋ｑ）のそのような尺度の一例は、

として表現され得、ここで、Ｌはサンプル内のフレーム長であり、ｃはフレーム（ｎ＋ｑ）の復号バージョンを知覚的に重み付けするフィルタＷ（ｚ）でフィルタ処理することによって得られる知覚的に重み付けされた信号であり、ｅは知覚的に重み付けされた誤りである。誤りｅは、この場合、たとえば、（Ａ）フレームｎのロスなしにＷ（ｚ）フィルタ処理されたフレーム（ｎ＋ｑ）の復号バージョンと（Ｂ）フレームｎの誤り隠蔽バージョンを仮定してＷ（ｚ）フィルタ処理されたフレーム（ｎ＋ｑ）の復号バージョンとの間の差として計算され得る。フィルタＷ（ｚ）は、フレーム（ｎ＋ｑ）に対するＬＰＣフィルタ係数を使用して上記で説明したように計算され得る。代替例では、誤りｅは、フィルタＷ（ｚ）を、フレーム（ｎ＋ｑ）の、正常に復号されたバージョンとロスを仮定して復号されたバージョンとの間の差に適用することによって計算される。

[00145]タスクＴ１００は、クリティカルフレームとしてアクティブ音声フレームだけを示すように実施され得る。代替として、タスクＴ１００は、潜在的クリティカルフレームとして非音声フレームを考慮するように実施され得る。一般に、双方向の会話では、各当事者は、しばらくの間話をし、その間に通信システムは当事者の音声を（たとえば、その時間の半分未満で）送信し、他の時間の間休止し、その間に通信システムは沈黙または背景雑音を送信する。沈黙（または背景雑音）期間中の希発送信または不連続送信（ＤＴＸ）は、会話の知覚品質にほとんど影響を及ぼさないが、セル内／セル間干渉を低減し（したがって、システム能力を潜在的に向上させ）、会話に使用されるモバイルユニットのバッテリー電源を節約する利益をもたらす。

[00146]一般的なＤＴＸ方式は、音声活動検出（ＶＡＤ）を使用する音声エンコーダによって実現される。ＶＡＤを使用して、エンコーダは、背景雑音からアクティブ音声を区別することができる。１つのそのような例では、オーディオエンコーダＡＥ１０（たとえば、ＡＥ２０）は、各アクティブ音声セグメント（一般に２０ミリ秒の長さ）を送信のための目標ビットレートパケットで符号化するように実施され、クリティカルな背景雑音セグメント（やはり２０ミリ秒の長さ）を比較的小さいサイズのパケットで表す。この小さいパケットは、沈黙を示す沈黙記述子（ＳＩＤ）であってよい。クリティカル背景雑音セグメントは、トークスパートに直ちに続く背景雑音セグメント、またはその特性がそれの前の雑音セグメントと著しく異なる背景雑音セグメントであり得る。他のタイプの背景雑音セグメント（または非クリティカル背景雑音セグメント）は、ゼロビットで表示されるか、削除される（blanked）か、送信されないか、または送信を抑制されることがある。出力パケットのそのようなパターン（すなわち、アクティブセグメント、次にクリティカル背景雑音セグメント、次に非クリティカル背景雑音セグメント）が、純粋に音声エンコーダの入力、またはソースに依存するとき、そのようなＤＴＸ方式は、ソース制御ＤＴＸ方式と呼ばれる。

[00147]１つまたは複数のパケット交換ネットワーク上で、端末Ａ（たとえば、端末１０２などの送信ユーザ機器すなわちＵＥ）と端末Ｂ（たとえば、端末１０４などの受信ＵＥ）との間の実時間音声通信を実行することが望ましい。ＡＭＲおよびＡＭＲ−ＷＢなど、前の解法は、ビットレートを低減すること（「レート適合」とも呼ばれる）によって悪いチャネル状態に適合する。ＶｏＩＰ（ボイスオーバインターネットプロトコル）で使用するための次世代コーデックに対して、ビットレートの低減は、ネットワーク内の輻輳を十分に低減することを支援し得ない（たとえば、ＲＴＰオーバーヘッドに起因するため。ここで、ＲＴＰは、たとえばＲＦＣ３５５０、基準６４（２００３年７月）、インターネットエンジニアリングタスクフォース（ＩＥＴＦ）に記載の実時間トランスポートプロトコルである）。本明細書で説明する方法は、ボコーダにより大きいロバスト性を与え、および／またはチャネル障害によるコーデック性能問題を解決することができる。

[00148]送信端末Ａから受信端末Ｂへの通信チャネルの品質は、ネットワーク内のエンティティによって（たとえば、アップリンク無線チャネルのネットワークの終端におけるトランシーバ基地局によって、コアネットワーク内のトラフィック分析器によって）および／または受信端末Ｂによって（たとえば、パケットロス率を分析することによって）推定され得る。制御信号（たとえば、ＲＦＣ１８８９（１９９６年１月、ＩＥＴＦ）に記載されているＲＴＰ制御プロトコル（ＲＴＣＰ）を使用する制御パケット）を介して、および／または別のサービス品質（ＱｏＳ）フィードバック機構を介して、帯域内メッセージングを使用して、そのような情報を送信ＵＥに伝達して戻すことが望ましい。送信端末Ａは、障害のあるチャネルの下で良好な性能のために最適化される動作モード（すなわち、「チャネル認識」モード）に切り替えることによって、そのような情報を適用するように実施され得る。また、送信ＵＥは、悪いチャネル状態が予測され得る（たとえば、管理されないネットワーク）場合、呼設定時にチャネル認識動作モードを選択するように構成され得る。

[00149]ボコーダは、悪いチャネル状態（たとえば、パケットエラー、高いジッタなど）の表示に応答して、「チャネル障害ロバストモード」に切り替えるように実施され得る。「チャネル障害ロバストモード」において、音声コーデックは、入力信号のいくつかのクリティカルフレームを、部分的または全体的のいずれかで再送信することを選択することができる。たとえば、「チャネル障害ロバストモード」で動作する音声コーダは、フレームのクリティカリティが一定の所定の閾値を超える場合、フレームの冗長コピーを送信するように構成され得る。特定のフレームのクリティカリティは、そのフレームのロスが、エンコーダで推定されるときに復号された音声に及ぼす知覚的影響の関数として決定され得る。チャネル認識コーデックは、チャネル状態の表示に応答して、チャネル障害ロバストモードと正常な動作モード（すなわち、冗長コピーは送られない）との間を切り替えるように構成され得る。

[00150]本明細書で説明するシステム、方法、および装置は、クリティカリティ閾値を、チャネル品質推定の関数として設定するように実施され得る。非常に良好なチャネルに対して、クリティカリティ閾値は非常に高く設定され得る。チャネル品質が劣化するにつれて、クリティカリティ閾値は引き下げられて、より多くのフレームがクリティカルであると見なされるようなる。

[00151]図１３Ｂに、タスクＴ５０を含む方法Ｍ１１０の実装形態Ｍ１２０のフローチャートを示す。タスクＴ５０はクリティカリティ閾値を計算する。タスクＴ５０は、送信チャネルの状態に関連する情報に基づいてクリティカリティ閾値を計算するように実施され得る。そのような情報は、以下の尺度、すなわち、パケットロス率、パケットロス比（fraction）、予測されるパケット数、ロス率毎秒、受信されたパケットカウント、ロス推定妥当性（たとえば、間隔に対して予測されるパケット数など、サンプルサイズの尺度に基づく重み尺度（weight measure））、見かけのスループット、およびジッタのうちの１つまたは複数を含み得、それらは、一連の時間間隔の各々に対して更新され得る。

[00152]タスクＴ５０はまた、送信チャネルの状態に関連する情報に基づいて、２つ以上の閾値を計算するように構成され得る。そのような場合には、決定タスクＴ１００は、フレーム（および／または１つまたは複数の隣接フレーム）からの情報を使用して、適切な計算された閾値を選択するように構成され得る。たとえば、１つのクリティカリティ閾値を使用して、音声を含むものと判断されるフレームのクリティカリティを決定し、別のクリティカリティ閾値を使用して、雑音を含むものと判断されるフレームのクリティカリティを決定することが望ましい。別の例では、過渡的（たとえば、オンセット）および静止的音声フレームに対して、ならびに／あるいは有声音声および無声音声フレームに対して、異なる閾値が使用される。２つ以上のクリティカリティ閾値が使用される場合に対して、タスクＴ１００は、フレームｎに対して使用されるべき閾値に対応するクリティカリティ尺度を、２つ以上のクリティカリティ尺度の中から選択するように構成され得る。

[00153]タスクＴ５０が閾値を計算するために使用する情報は、以下の尺度、すなわち、パケットロス率、パケットロス比、予測されるパケット数、ロス率毎秒、受信されたパケットカウント、ロス推定妥当性（たとえば、間隔に対して予測されるパケット数など、サンプルサイズの尺度に基づく重み尺度）、見かけのスループット、およびジッタのうちの１つまたは複数を含み得、それらは、一連の時間間隔の各々に対して更新され得る。上述のように、受信機は、制御信号（ＲＴＣＰメッセージングが１つのそのような制御シグナリング方法の一例である）を介して、および／または別のサービス品質（ＱｏＳ）フィードバック機構を介して、帯域内メッセージングを使用して、そのような情報を送信ＵＥに伝達して戻すように構成され得る。ＲＴＣＰメッセージング（たとえばＩＥＴＦ仕様ＲＦＣ３５５０に規定される、実時間トランスポート制御プロトコル）を介して提供され得る情報の例は、送信されたオクテットカウントと、送信されたパケットカウントと、予測されるパケットカウントと、パケットロスの数および／または比率と、ジッタ（たとえば、遅延における振動）と、ラウンドトリップ遅延とを含む。図１３Ｃは、チャネル状態情報（たとえば、上述のような）を受信するタスクＴ２５を含む方法Ｍ１２０の実装形態Ｍ１３０のフローチャートを示す。

[00154]図１４Ａおよび図１４Ｂは、チャネル状態情報、その情報に基づくクリティカリティ閾値、およびもたらされるフレームがクリティカルとして示される尤度の間の関係の例を示す。図１４Ｂの例では、報告されたチャネル品質は、図１４Ａの報告されたチャネル品質より低い。したがって、図１４Ｂのクリティカリティ閾値は、図１４Ａのクリティカリティ閾値より選択性が小さく、もたらされる、フレームがクリティカルとして示される尤度は、より高い。報告されるチャネル品質が低くなりすぎると、もたらされる、フレームがクリティカルとして示される尤度は、高くなりすぎることがある。

[00155]クリティカルとして示され得るフレームの数または割合を制限することが望ましい。たとえば、悪いチャネル状態の下で元の音声コーディング品質を保存する性能を改良すること、および／または過度に包括的なクリティカリティ判断によってトリガされ得る再送信による能力ロスを阻むことをバランスさせることが望ましい。

[00156]再送信頻度を制限するための１つの手法は、閾値が、低いキャップ値（low cap value）（すなわち、低い境界値、またはフロア値）の影響を受けるように方法Ｍ１２０を実施することであり、キャップ値が、フレームが再送信され得る数に対する制限を設定する。たとえば、方法Ｍ１２０は、計算される閾値に対して最小値を強制するように実施され得る。図１５Ａに、タスクＴ７５を含む方法Ｍ１２０のそのような実装形態Ｍ１４０のフローチャートを示す。タスクＴ７５は、タスクＴ５０によって作成された、計算された候補閾値と、境界値（たとえば、低いキャップ値）とを比較する。この比較の結果に基づいて、タスクＴ７５は、（Ａ）計算された候補閾値および（Ｂ）境界値の中の一方を選択し、それにより、タスクＴ７５は、計算された閾値として選択された値を作成する。たとえば、タスクＴ７５は、計算された候補値が境界値より大きい（代替として、より小さくはない）場合に計算された候補値を選択し、そうでない場合に境界値を選択するように実施され得る。そのような様式で、タスクＴ７５は、計算された閾値がキャップ値を超える部分をクリップするように構成され得る。タスクＴ７５はまた、比較が失敗すると（たとえば、クリッピングが発生すると）、タスクＴ７５はそのような状態を、（たとえば、状態を記録すること、状態を基地局に報告すること、および／または別の是正措置を実行することのために）別のモジュールに示すように構成され得る。

[00157]もちろん、代替として、クリティカリティ尺度の計算された値がクリティカリティに逆比例するようにタスクＴ１００を実施することも可能である。そのような場合には、タスクＴ１００は、クリティカリティ尺度が計算された閾値より低い（代替として、超えることができない）ときにフレームがクリティカルであることを示すように構成されてよく、タスクＴ７５は、計算された閾値と高いキャップ値（すなわち、高い境界値、または天井値）とを比較（および場合によってはクリップ）するように構成され得る。図１５Ｂは、タスクＴ２５とＴ７５とを含む、方法Ｍ１３０およびＭ１４０の実装形態Ｍ１５０のフローチャートを示す。場合によっては、本明細書で説明するタスクＴ２５、Ｔ５０、およびＴ７５のうちの１つまたは複数を伴うタスクＴ１００（たとえば、Ｔ５０＋Ｔ１００、Ｔ５０＋Ｔ７５＋Ｔ１００、Ｔ２５＋Ｔ５０＋Ｔ１００、およびＴ２５＋Ｔ５０＋Ｔ７５＋Ｔ１００のうちのいずれか）は、本明細書で説明する方法Ｍ１００の他の実装形態のうちのいずれかの中に（たとえば、タスクＴ２００の前に実行するタスクとして）含まれてよいことを明確に留意されたい。

[00158]図１６Ａに、タスクＴ４００を含む方法Ｍ１００の実装形態Ｍ６００のフローチャートを示す。タスクＴ４００は、タスクＴ３００内で選択された再割振り候補に従って、クリティカルフレームの冗長コピーを作成する。冗長コピーは、一般に、符号化された信号（すなわち、正常に符号化されたクリティカルフレームのコピー）でのクリティカルフレームの主コピーより少ないビット数を有し、主コピーの部分的または全体的ロスによってもたらされる誤りを訂正するための前方誤り訂正（ＦＥＣ）動作を実行するために、デコーダによって使用され得る。タスクＴ４００は、選択タスクＴ３００の前に（たとえば、タスクＴ２５０としてタスクＴ２００の実装形態内の決定メトリック計算に対する入力パラメータとして）、またはタスクＴ３００による再割振り候補の選択に応答して、冗長コピーを作成するように実施され得る。

[00159]上述のように、選択された再割振り候補は、冗長コピーへの再割振りをビット数としてまたはビットレートとして示し得る。図１６Ｂに、タスクＴ４００の実装形態Ｔ４１０を含む方法Ｍ６００の実装形態Ｍ６１０のフローチャートを示す。タスクＴ４１０は、選択された再割振り候補によって示されるように、Ａ_Rビット長（たとえば、Ｎ_mビット）を有するクリティカルフレームの冗長コピーを作成する。図１６Ｃに、タスクＴ４００の実装形態Ｔ４２０を含む方法Ｍ６００の実装形態Ｍ６２０のフローチャートを示す。タスクＴ４２０は、選択された再割振り候補によって示されるように、レートｒ_Rで符号化されたクリティカルフレームの冗長コピーを作成する。

[00160]一般に、冗長コピーが、後続フレームを復号するために使用され得る良好な基準（たとえば、良好な適応コードブック）を提供することが望ましい。クリティカルフレームの冗長コピーは、クリティカルフレームの主コピーのすべてのパラメータのうちのいくつかを含み得る。タスクＴ４００は、主コピーの縮小バージョンとして冗長コピーを作成するように実施され得る。たとえば、主コピーは、周波数エンベロープ情報（たとえば、ＬＰＣまたはＭＤＣＴ係数）および／またはテンポラルエンベロープ情報（たとえば、固定コードブックインデックス、固定コードブック利得、適応コードブック利得、ピッチラグ、および／またはＣＥＬＰコーデックに対するピッチ利得；プロトタイプパラメータおよび／またはＰＷＩまたはＰＰＰコーデックに対するピッチ情報）などの構成要素を含むクリティカルフレームの符号化されたバージョンであってよい。タスクＴ４００は、１つまたは複数のそのような構成要素の各々の一部または全部のコピーを含む冗長コピーを作成するように実施され得る。たとえば、タスクＴ４００は、量子化されたＬＰＣフィルタパラメータおよび／または量子化されたテンポラルエンベロープ（たとえば、励振信号）パラメータを識別する１つまたは複数のコードブックインデックスを含む冗長コピーを作成するように実施され得る。

[00161]そのような場合には、タスクＴ４００は、すでに計算されているクリティカルフレームの主コピーの構成要素を使用して（たとえば、複製および／または圧縮して）冗長コピーをアセンブルするように実施され得る。タスクＴ４００は、ビット制約を満足するような方式で（たとえば、タスクＴ４１０のように）、またはレート制約に関連する構造に従って（たとえば、タスクＴ４２０のように）冗長コピーを作成するように実施され得る。そのような構造は、フレームに対してまたはフレームの１つまたは複数のサブフレームの各々に対して、上述のパラメータ（すなわち、ＬＰＣフィルタ情報、ピッチ遅延、固定／適応コードブックインデックス／利得など）などの複数のパラメータの各々に対して、指定されたビット数を含み得る。

[00162]追加または代替として、タスクＴ４００は、クリティカルフレームの主コピーを作成するために使用されものとは異なるコーディング方法を使用してクリティカルフレームを符号化することによって、冗長コピーの一部または全部を作成するように実施され得る。そのような場合には、この異なるコーディング方法は、一般に、クリティカルフレームの主コピーを作成するために使用される方法（たとえば、低次のＬＰＣ分析を使用する、広帯域コーデックではなく狭帯域コーデックを使用する、など）より低いレートを有する。そのような異なるコーディング方法は、異なるビットレートおよび／または異なるコーディング方式であってよい（たとえば、主コピーに対するＣＥＬＰおよび冗長コピーに対するＰＰＰまたはＰＷＩ）。図１７Ａに、タスクＴ４００の実装形態Ｔ４３０を含む方法Ｍ６００の実装形態Ｍ６３０のフローチャートを示す。タスクＴ４３０は、エンコーダに、クリティカルフレームの冗長コピーを作成させる。一例では、タスクＴ４３０は、エンコーダにクリティカルフレームと指示された割振りＮ_m（たとえば、ビット数として、またはビットレートとして）とを供給するように実施される。

[00163]図１７Ｂに、タスクＴ４００の実装形態Ｔ４４０を含む方法Ｍ６００の実装形態Ｍ６４０のフローチャートを示す。タスクＴ４４０は、フレーム（ｎ＋ｋ）のコピーとクリティカルフレームｎの冗長コピーとを作成する。タスクＴ４００は、選択された再割振り候補に従って、後続フレームに対する初期ビット割振りＴを第１の部分および第２の部分に再割振りすること、およびフレーム（ｎ＋ｋ）のコピーと冗長コピーとを作成してそれぞれの部分に（たとえば、それぞれ（Ｔ−Ｎ_m）ビットおよびＮ_mビットに）適合させる。

[00164]図１７Ｃに、タスクＴ４００の実装形態Ｔ４５０を含む方法Ｍ６００の実装形態Ｍ６５０のフローチャートを示す。タスクＴ４５０は、フレーム（ｎ＋ｋ）のコピーを第１の部分に符号化し、クリティカルフレームｎの冗長コピーを第２の部分に符号化する。

[00165]一例では、初期ビット割振りＴの値は２５３であり、その値は、たとえば１２．６５ｋｂｐｓ（キロビット毎秒）のビットレートおよび２０ミリ秒のフレーム長に対応する。別の例では、Ｔの値は１９２であり、その値は、たとえば９．６ｋｂｐｓのビットレートおよび２０ミリ秒のフレーム長に対応する。

[00166]Ｔビットの割振りの分配のセットの中の１つの選択が、選択された後続フレームのビットレートの変更、およびクリティカルフレームの冗長コピーを符号化するための低ビットレート方式の選択として実施され得る。たとえば、Ｔビットの割振りを、クリティカルフレームの冗長コピーを搬送するためのサイズＮ_mビットの部分と後続フレームのコピーを搬送するためのサイズ（Ｔ−Ｎ_m）ビットの部分として分配すること（ここで、Ｔ＝２５３およびＮ_m＝６１）が、後続フレームのビットレートを１２．６５ｋｂｐｓの開始ビットレートから９．６ｋｂｐｓの低減されたビットレートに変更することと、既存の９．６ｋｂｐｓ方式に従って後続フレームを符号化することと、クリティカルフレームの冗長コピーを符号化するために３．０５ｋｂｐｓ方式を使用することとによって、（たとえば、ＡＭＲコーデック内で）実施され得る。

[00167]各冗長符号化が分配のセットの中の異なる分配に対応する冗長符号化に対して、いくつかのそのような低ビットレート方式を実施することが望ましい。他の開始ビットレートの例は、８．８５、８．５５、６．６、６．２、４、２．７、および２ｋｂｐｓを含み、それらは、それぞれ、（たとえば、２０ミリ秒のフレーム長に対して）１７７、１７１、１３２、１２４、８０、５４および４０のＴの値に対応する。他の開始ビットレートのさらなる例は、２３．８５、２３．０５、１９．８５、１８．２５、１５．８５、１４．２５、および１２．６５ｋｂｐｓを含み、それらは、それぞれ、（たとえば、２０ミリ秒のフレーム長に対して）４７７、４６１、３９７、３６５、３１７、２８５および２５３のＴの値に対応する。フレームは、たとえば、（たとえば、ＣＥＬＰコーディングモデルを使用して）本明細書で参照されるＡＭＲ−ＷＢコーデックのリリース１０に記載されている、そのようなレートに従って符号化され得る。

[00168]本明細書で説明する原理は、各フレームが同じ初期ビット割振りＴを受信する単一の固定ビットレート方式に適用され得る。これらの原理はまた、Ｔビットのフレーム割振り全体がフレームごとに変化し得る可変ビットレート方式（たとえば、マルチモードまたはマルチプル固定ビットレート方式）に適用され得る。たとえば、フレーム（ｎ＋ｋ）を符号化するために利用可能なビット数Ｔは、フレームが音声または雑音を含むかどうか、またはフレームが有声音声または無声音声を含むかどうか、などに従って変化し得る。

[00169]方法Ｍ３００およびＭ５００は、Ｔビットを使用して複数の後続フレーム（たとえば、ノンキャリアフレーム）のうちの少なくとも１つを符号化することを含むように実施され得る。そのような方法は、さらに、Ｔビットを使用して複数の後続フレームのうちのノンキャリアの後続フレームの各々を符号化することを含み得る。しかしながら、オーディオ信号が、２つの隣接するクリティカルフレームまたは場合によっては互いに接近する２つのクリティカルフレームを含むことも可能であり、それにより、１つのクリティカルフレームに関連するＫ個の後続フレームのセットが、他のクリティカルフレームに関連するＫ個の後続フレームのセットと重なる（すなわち、少なくとも１つのフレームを共通に有する）。そのような場合には、共通の後続フレームのうちの１つが、１つのクリティカルフレームの冗長コピーを搬送するために選択され得、共通の後続フレームのうちの別の１つが、他のクリティカルフレームの冗長コピーを搬送するために選択され得、それにより、これら２つの後続フレームの各々は、Ｔビットより少ないビットを使用して符号化される。選択された後続フレームはそれ自体がクリティカルフレームであることも可能である。いくつかの場合には、たとえば、クリティカルフレームに関連するＫ個の後続フレームのセットは、少なくとも１つの他のクリティカルフレームを、約２０パーセントの時間に含み得ることが予測され得る。

[00170]タスクＴ４００は、選択タスクＴ３００の前に（たとえば、タスクＴ２５０内の決定メトリック計算に対する入力パラメータとして）、またはタスクＴ３００による再割振り候補の選択に応答して、フレーム（ｎ＋ｋ）のコピーを作成するように実施され得る。図１８Ａに、タスクＴＡ１０およびＴＢ１０を含む方法Ｍ６１０の実装形態Ｍ６６０のフローチャートを示す。タスクＴＡ１０は、初期ビット割振りＴの表示をフレーム（ｎ＋ｋ）に割り振られたビット数Ａ₀として受信する。タスクＴＢ１０は、フレーム（ｎ＋ｋ）のコピーをＡ₁ビット（たとえば、（Ｔ−Ｎ_m）ビット）に符号化し、ここでＡ₁はＡ₀より小さい。方法Ｍ６６０はまた、入力パラメータとしてＴＢ１０において符号化されたフレーム（ｎ＋ｋ）のコピーからの情報を受信するために配列されたタスクＴ２５０のインスタンスを含む。たとえば、タスクＴ２５０は、フレーム（ｎ＋ｋ）のコピーを使用して、本明細書で説明する品質の変更決定メトリックの１つまたは複数の値を計算するように実施され得る。

[00171]図１８Ｂに、タスクＴＡ２０およびＴＢ２０を含む方法Ｍ６２０の実装形態Ｍ６７０のフローチャートを示す。タスクＴＡ２０は、初期ビット割振りＴの表示をフレーム（ｎ＋ｋ）に対するレート選択ｒ₀として受信する。タスクＴＢ２０は、ｒ₀より低いレートｒ₁に従ってフレーム（ｎ＋ｋ）のコピーを符号化する。方法Ｍ６７０はまた、入力パラメータとしてタスクＴＢ２０において符号化されたフレーム（ｎ＋ｋ）のコピーからの情報を受信するために配列されたタスクＴ２５０のインスタンスを含む。たとえば、タスクＴ２５０は、フレーム（ｎ＋ｋ）のコピーを使用して、本明細書で説明する品質の変更決定メトリックの１つまたは複数の値を計算するように実施され得る。

[00172]図１８Ｃに、タスクＴ５００を含む方法Ｍ６００の実装形態Ｍ７００のフローチャートを示す。タスクＴ５００は、後続フレーム（ｎ＋ｋ）のコピーと、タスクＴ４００によって作成されたクリティカルフレームｎの冗長コピーとを含むパケットを作成する。図１９Ａは、方法Ｍ６１０およびＭ７００の実装形態Ｍ７１０のフローチャートを示す。図１９Ｂは、方法Ｍ６２０およびＭ７００の実装形態Ｍ７２０のフローチャートを示す。パケットが、クリティカルフレームの冗長コピーを搬送していることを示す情報、オフセットｋの値を示す情報、および／または再割振りされたビットの数Ｎ_mを示す情報を含むことが望ましい。代替として、そのような情報は、符号化された信号の中の他の情報からデコーダによって抽出可能であり得る。

[00173]パケットは、１つまたは複数のフレームを含み得る。パケット長を２０ミリ秒に制限することが、（たとえば、ラグを短縮するために）望ましい。図２０Ａは、インターネットプロトコルバージョン４（ＩＰｖ４：Internet Protocol version 4）と、ユーザデータグラムプロトコル（ＵＤＰ：User Datagram Protocol）と、ＲＴＰとを含むＶｏＩＰ通信に対して一般的なプロトコルスタックを使用して符号化されたパケットに対するオーバーヘッドの一例を示す。図２０Ｂは、ＩＰバージョン６（ＩＰｖ６）パケットに対する類似の例を示す。ペイロードサイズの例は、Ｇ．７１１コーデックに対する１６０バイトと、Ｇ．７２９コーデックに対する２０バイトと、Ｇ．７２３．１コーデックに対する２４バイトとを含む。本明細書で説明する冗長符号化に対するビット再割振りのための方法とともに使用され得る他のコーデックは、制限なしに、Ｇ．７２６、Ｇ．７２８、Ｇ．７２９Ａ、ＡＭＲ、ＡＭＲ−ＷＢ、ＡＭＲ−ＷＢ＋（たとえば、３ＧＰＰＴＳ２６．２９０ｖ１０．０．０、２０１１年３月に記載されている）と、ＶＭＲ−ＷＢ（３ＧＰＰ２Ｃ．Ｓ００５２−０、サービスオプション６２および６３）と、拡張型可変レートコーデック（ＥＶＲＣ：Enhanced Variable Rate Codec、「ＥｎｈａｎｃｅｄＶａｒｉａｂｌｅＲａｔｅＣｏｄｅｃ，ＳｐｅｅｃｈＳｅｒｖｉｃｅＯｐｔｉｏｎｓ３，６８，ａｎｄ７０ｆｏｒＷｉｄｅｂａｎｄＳｐｒｅａｄＳｐｅｃｔｒｕｍＤｉｇｉｔａｌＳｙｓｔｅｍｓ」と題する第３世代パートナーシッププロジェクト２（３ＧＰＰ２）文書Ｃ．Ｓ００１４−Ｃ，ｖ１．０、２００７年２月（ｗｗｗ−ｄｏｔ−３ｇｐｐ−ｄｏｔ−ｏｒｇにおいてオンラインで入手可能）に記載されている）と、選択可能モードボコーダ音声コーデック（「ＳｅｌｅｃｔａｂｌｅＭｏｄｅＶｏｃｏｄｅｒ（ＳＭＶ）ＳｅｒｖｉｃｅＯｐｔｉｏｎｆｏｒＷｉｄｅｂａｎｄＳｐｒｅａｄＳｐｅｃｔｒｕｍＣｏｍｍｕｎｉｃａｔｉｏｎＳｙｓｔｅｍｓ」と題する３ＧＰＰ２文書Ｃ．Ｓ００３０−０，ｖ３．０、２００４年１月（ｗｗｗ−ｄｏｔ−３ｇｐｐ−ｄｏｔ−ｏｒｇにおいてオンラインで入手可能）に記載されている）と、拡張型音声サービスコーデック（ＥＶＳ：Enhanced Voice Service codec、３ＧＰＰＴＲ２２．８１３ｖ１０．０．０（２０１０年３月）、ＥＴＳＩから入手可能に記載されている）とを含む。

[00174]図２１は、クリティカルフレームの冗長コピーとクリティカルフレームに後続するフレームのコピーとを搬送するＲＴＰパケットに対するペイロードの一例を示す。対応するフレームタイプインジケータＦＴに対して１の値で示されるとき、冗長コピー（ビットｒ（０）〜ｒ（１７６））は、ＡＭＲ−ＷＢ８．８５ｋｂｐｓモードで符号化され、対応するフレームタイプインジケータＦＴに対して０の値で示されるとき、後続フレームのコピー（ビットｐ（０）〜ｐ（１３１））は、ＡＭＲ−ＷＢ６．６ｋｂｐｓモードで符号化される。この例では、コーデックモード要求インジケータＣＭＲは、受信端末におけるエンコーダに、８．８５ｋｂｐｓモードを採用するように要求し、ペイロードは、最後のオクテットを書き込むために、３つのパディングビットＰで終了する。他の例では、ペイロードは、３つ以上の符号化されたフレームを含み得、および／または冗長コピーのビットは、パケット内で後続フレームのコピーのビットに先行し得る（コピーに対する対応するコンテンツ表のエントリの順序は、それに応じて切り替えられる）。

[00175]たとえば、ＲＴＰヘッダを１２バイトから４バイトに圧縮するために、ヘッダ圧縮を使用することが望ましい。ＲＴＰヘッダは、送信時間を計算するために使用され得るタイムスタンプと、順序が乱れて受信されたパケットを正しく提示するため、および／またはパケットロスを検出するために使用され得るシーケンス番号とを含む。ロバストヘッダ圧縮（ＲＯＨＣ：Robust Header Compression、ＩＥＴＦＲＦＣ３０９５、ＲＦＣ３８４３、および／またはＲＦＣ４８１５に記載されている）は、より大きい圧縮率（たとえば、１つまたは複数の、場合によってはすべてのパケットヘッダの、１〜４バイトへの圧縮）をサポートするために使用され得る。

[00176]図２２は、オーディオデコーダＡＤ１０の実装形態ＡＤ２０のブロック図である。オーディオデコーダＡＤ２０は、ボコーダの一部として、スタンドアローンエンティティとして、または受信端末１０４内の１つまたは複数のエンティティにわたって分配されて実装され得る。オーディオデコーダＡＤ２０はまた、ＶｏＩＰクライアントの一部として実装され得る。

[00177]オーディオデコーダＡＤ２０は、それの機能に関して以下で説明される。オーディオデコーダＡＤ２０は、ハードウェア、ファームウェア、ソフトウェア、またはそれらの任意の組合せとして実装され得、それが実装される方式は、特定の適用例および全体的なシステムに課された設計制約に応じて決まる。例として、オーディオデコーダＡＤ２０は、マイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、プログラマブルロジック、専用ハードウェア、あるいは任意の他のハードウェアおよび／またはソフトウェアベースの処理エンティティで実装され得る。

[00178]この例では、オーディオデコーダＡＤ２０は、デジッタバッファＤＢ１０（「ジッタバッファ」とも呼ばれる）を含む。デジッタバッファＤＢ１０は、（たとえば、ネットワーク輻輳、タイミング変動、および／またはルート変更による）パケット到着時間の変動によって引き起こされるジッタを低減または除去するハードウェアデバイスまたはソフトウェアプロセスであってよい。デジッタバッファＤＢ１０は、パケット内のオーディオフレームを受信し得る。デジッタバッファＤＢ１０は、前に到着したパケットのフレームが、正しい順序（たとえば、パケットのタイムスタンプによって示される）でフレームデコーダＦＤ２０に連続的に供給され、オーディオひずみがほとんどないきれいな接続をもたらすことができるように、新しく到着するパケットを遅延させるように実施され得る。デジッタバッファＤＢ１０は、固定型または適応型であってよい。固定デジッタバッファは、パケットに固定遅延をもたらし得る。一方、適応デジッタバッファは、ネットワークの遅延の変化に適応し得る。デジッタバッファＤＢ１０は、符号化されたオーディオフレーム（たとえば、インデックスＸＬ、ＸＦ、ＸＧおよびＸＰを含む）を適切な順序でフレームデコーダＦＤ２０に供給し得る。

[00179]フレームのコピーがデジッタバッファによって受信されない場合、フレームロスが、ＦＥＣが使用されない場合に引き起こされることがある。ＦＥＣが使用され、現在実行されるべきフレームのコピーが失われると、デジッタバッファＤＢ１０は、バッファ内にフレームの冗長コピーがあるかどうかを判断し得る。現在のフレームに対する冗長コピーが利用可能である場合、復号してオーディオサンプルを生成するために、冗長コピーがフレームデコーダＦＤ２０に供給され得る。

[00180]加えて、デジッタバッファＤＢ１０は、主フレーム（すなわち、元のクリティカルフレーム）と冗長フレーム（すなわち、元のクリティカルフレームの一部または全部のコピー）とを別様に処理するために修正され得る。バッファＤＢ１０は、本明細書で説明するＦＥＣ動作を実施することに関連する平均遅延が、ＦＥＣ動作が実施されないときの平均遅延より大きくならないように、これら２つのフレームを別様に処理し得る。たとえば、バッファＤＢ１０は、到来パケットが冗長コピーを含むこと（たとえば、パケットが２つのフレームを含むこと）を検出し、この検出に応答して冗長コピーの復号を開始するように実施され得る。

[00181]デジッタバッファＤＢ１０からリリースされたオーディオフレームは、フレームデコーダＦＤ２０に供給されて、復号されたコアオーディオフレームＤＦ（たとえば、合成音声）を生成し得る。概して、フレームデコーダＦＤ２０は、音声を復号して合成音声にする、当業界で知られている任意の方法を実行するように実施され得る。図２２の例では、フレームデコーダＦＤ２０は、図３を参照して上記で説明した符号化方法に対応するＣＥＬＰ復号方法を使用する。この例では、固定コードベクトル生成器ＶＧ１０は、ＦＣＢインデックスＸＦと、利得インデックスＸＧの対応する部分とを復号して、各サブフレームに対する固定コードベクトルを作成し、逆量子化器ＩＡ１０およびベクトル生成器Ａ５０は、ＡＣＢインデックスＸＰと、利得インデックスＸＧの対応する部分とを復号して、各サブフレームに対する適応コードベクトルを作成し、加算器ＡＤ１０は、対応するコードベクトルを組み合わせて、励振信号を作成し、メモリＭＥ１０を更新する（たとえば、３ＧＰＰＴＳ２６．１９０ｖ１０．０．０の６．１節のステップ１〜８に記載されている）。逆量子化器ＩＬ１０および逆変換モジュールＩＭ１０は、ＬＰＣインデックスＸＬを復号してＬＰフィルタ係数ベクトルを作成し、そのベクトルは、合成フィルタＳＦ１０によって励振に加えられて、合成信号を作成する（たとえば、３ＧＰＰＴＳ２６．１９０ｖ１０．０．０の６．１節の最初の段落およびステップ４に記載されている）。生の合成信号は、ポストフィルタＰＦ１０に供給され、ＰＦ１０は、ハイパスフィルタ処理、アップスケーリング、および内挿などの動作を実行し（たとえば、３ＧＰＰＴＳ２６．１９０ｖ１０．０．０の６．２節に記載されている）、復号されたコアオーディオフレームＤＦを作成するように実施され得る。代替として、制限なしに、フレームデコーダＦＤ２０は、ＮＥＬＰまたはＰＰＰフルフレーム復号方法を使用し得る。

[00182]主コピーのパラメータ値のいくつか（すなわち、部分セット）を含むフレームの冗長コピーは、デジッタバッファＤＢ１０から部分フレーム復号モジュールに送られ得る。たとえば、フレームデコーダＦＤ２０は、冗長コピーが利用可能になる前に、（たとえば、上述の３ＧＰＰＴＳ２６．０９１ｖ１０．０．０に記載されている誤り隠蔽手順に従って）クリティカルフレームに対応するフレームを生成するように実施され得る。この場合、フレームデコーダＦＤ２０は、キャリアフレーム（ｎ＋ｋ）を復号する前に、（たとえば、固定および適応コードブックインデックスならびに冗長コピーからの利得に従って）メモリＭＥ１０を更新するように構成された部分フレーム復号モジュールを含み得る。

[00183]一構成では、後続フレーム（ｎ＋ｋ）のコピーおよびクリティカルフレームｎの冗長コピーは、ＲＴＰパケットにパケット化され、受信端末１０４に送信される。別の構成では、後続フレームのコピーおよびクリティカルフレームの冗長コピーは、同時に生成され得るが、異なる対応するＲＴＰパケットに詰め込まれて受信端末に送信される。どのフォーマットを使用するかの判断は、両端末の能力に基づくことがある。両フォーマットが各端末内でサポートされる場合、たとえば、より低いデータレートをサポートするフォーマットが使用され得る。

[00184]受信機の側では、音声フレームは、デジッタバッファＤＢ１０内に記憶され得、ＤＢ１０は適応型であってよい。前述のように、デジッタバッファＤＢ１０は、音声フレームに対する平均遅延がＦＥＣ技法なしの平均遅延より大きくならないように設計され得る。フレームは、デジッタバッファＤＢ１０から適切な順序でフレームデコーダ（たとえば、デコーダＦＤ２０）に送られ得る。冗長コピーが主コピーのパラメータの部分セットである場合、部分フレーム復号モジュールが使用され得る。

[00185]本明細書で説明するソース制御（および場合によってはチャネル制御）ＦＥＣ方式は、パケットロスの数を低減させ得、ロスのバースト性（burstiness）は、データレートの増加をほとんどまたはまったく伴わない。クリティカルフレーム識別は、音声知覚品質とデータレートとの間の良好なトレードオフを確実にするのを助け得る。そのようなＦＥＣ方式は、利用可能な帯域幅を効率的に使用するように、また、レガシー通信デバイスとの後方互換性があるように実施され得る。

[00186]オーディオエンコーダＡＥ１０は、動的レート制御モジュールを含むように実施され得る。そのようなモジュールは、所定の目標レートに接近するために２つのステップを実施し得る。第１のステップでは、２つの隣接動作点が決定される。これら２つの隣接動作点は、データレートであってよく、目標データレートの値が２つの動作点の値の間にあるように選択される。目標データレートは、能力要求に基づいて外部で指定されてよい。代替として、目標データレートは、たとえば、チャネル状態情報に基づいて内部で指定されてもよい。そのようなレート制御は、事業者が能力要求に基づいてデータレートを決定し得るように、本明細書で説明するＦＥＣ方式が、任意の指定されたデータレートで遂行されることを可能にするように実施され得る。

[00187]図２３Ａは、一般的構成による装置ＭＦ１００のブロック図を示す。装置ＭＦ１００は、オーディオ信号内でオーディオ信号のクリティカルフレームに後続するオーディオ信号のフレーム（「後続フレーム」または「キャリアフレーム」）からの情報に基づいて、決定メトリックの少なくとも１つの値を計算するための手段Ｆ２００を含む（たとえば、タスクＴ２００を参照して本明細書で説明するように）。装置ＭＦ１００はまた、複数の再割振り候補の中の１つを選択するための手段Ｆ３００を含み、選択された再割振り候補は、後続フレームに対する初期ビット割振りＴの第１の部分および第２の部分への再割振りを示す（たとえば、タスクＴ３００を参照して本明細書で説明するように）。

[00188]図２３Ｂは、装置ＭＦ１００の実装形態ＭＦ３００のブロック図を示す。装置ＭＦ３００は、複数のフレームの各々に対する決定メトリックの少なくとも１つの値を計算するための手段Ｆ２００の実装形態Ｆ２２０を含む（たとえば、タスクＴ２２０を参照して本明細書で説明するように）。装置ＭＦ３００はまた、複数の再割振り候補の中の１つと複数のフレームの中の１つとを（たとえば、タスクＴ３５０を参照して本明細書で説明するように、対応するオフセットｋの値を選択することによって）選択するための手段Ｆ３００の実装形態Ｆ３５０を含む。

[00189]図２３Ｃは、装置ＭＦ１００の実装形態ＭＦ５００のブロック図を示す。装置ＭＦ５００は、決定メトリックの値の複数のセットを計算するための手段Ｆ２００の実装形態Ｆ２７０を含む（たとえば、タスクＴ２７０を参照して本明細書で説明するように）。装置ＭＦ５００はまた、手段Ｆ３５０のインスタンスを含む。

[00190]図２４Ａは、装置ＭＦ１００の実装形態ＭＦ１４０のブロック図を示す。装置ＭＦ１４０は、クリティカリティ閾値を計算する（たとえば、タスクＴ５０を参照して本明細書で説明するように）ための手段Ｆ５０と、計算されたクリティカリティ閾値とキャップ値とを比較する（たとえば、タスクＴ７５を参照して本明細書で説明するように）ための手段Ｆ７５と、フレームｎがクリティカルであると判断する（たとえば、タスクＴ１００を参照して本明細書で説明するように）ための手段Ｆ１００とを含む。

[00191]図２４Ｂは、装置ＭＦ１４０の実装形態ＭＦ１５０のブロック図を示す。装置ＭＦ１４０は、チャネル状態情報を受信する（たとえば、タスクＴ２５を参照して本明細書で説明するように）ための手段Ｆ２５を含む。本明細書で説明するように、送信端末１０２と受信端末１０４との間の送信のために使用されるチャネル品質を示し得るチャネル状態情報は、受信端末１０４において収集されて推定され、送信端末１０２に送信して戻される。

[00192]図２５Ａに、計算器２００と選択器３００とを含む、一般的構成による装置Ａ１００のブロック図を示す。計算器２００は、オーディオ信号内でオーディオ信号の第１のフレームに後続するオーディオ信号のフレームからの情報に基づいて、決定メトリック少なくとも１つの値を計算するように構成される（たとえば、タスクＴ２００を参照して本明細書で説明するように）。選択器３００は、決定メトリックの少なくとも１つの計算された値に基づいて複数の再割振り候補の中の１つを選択するように構成され（たとえば、タスク３００を参照して本明細書で説明するように）、選択された再割振り候補は、後続フレームに対する初期ビット割振りＴの、第１の部分および第２の部分への再割振りを示す。装置Ａ１００はまた、第１のフレーム（たとえば、フレームエンコーダＦＥ２０）の冗長コピーを作成するように構成されたフレームエンコーダ、後続フレームのコピーと冗長コピーとを含むパケットを作成する（たとえば、タスクＴ５００を参照して本明細書で説明するように）ように構成されたパケットアセンブラ、および／または第１のフレームがクリティカルフレームであると判断する（たとえば、タスクＴ１００を参照して本明細書で説明するように）ように構成されたクリティカルフレームインジケータを含むように実施され得る。

[00193]図２５Ｂは、装置Ａ１００の実装形態Ａ３００のブロック図を示す。装置Ａ３００は、複数のフレームの各々に対する決定メトリックの少なくとも１つの値を計算するように構成された計算器２００の実装形態２２０を含む（たとえば、タスクＴ２２０を参照して本明細書で説明するように）。装置Ａ３００はまた、複数の再割振り候補の中の１つと複数のフレームの中の１つとを（たとえば、タスクＴ３５０を参照して本明細書で説明するように、対応するオフセットｋの値を選択することによって）選択するように構成された計算器３００の実装形態３５０を含む。

[00194]図２５Ｃは、装置Ａ１００の実装形態Ａ５００のブロック図を示す。装置Ａ５００は、決定メトリックの値の複数のセットを計算するように構成された計算器２００の実装形態２７０を含む（たとえば、タスクＴ２７０を参照して本明細書で説明するように）。装置Ａ５００はまた、選択器３５０のインスタンスを含む。

[00195]図２０Ｃは、装置Ａ１００（またはＭＦ１００）の要素を統合するチップまたはチップセットＣＳ１０（たとえば、移動局モデム（ＭＳＭ）チップセット）を含む通信デバイスＤ１０のブロック図を示す。チップ／チップセットＣＳ１０は、装置Ａ１００またはＭＦ１００のソフトウェアおよび／またはファームウェア部を（たとえば、命令として）実行するように構成され得る、１つまたは複数のプロセッサを含み得る。送信端末１０２は、デバイスＤ１０の実装形態として実現され得る。

[00196]チップ／チップセットＣＳ１０は、無線周波（ＲＦ）通信信号を受信し、ＲＦ信号内で符号化されたオーディオ信号を復号し、再生するように構成された受信機（たとえば、ＲＸ１０）と、（たとえば、タスクＴ５００によって作成される）符号化されたオーディオ信号を記述するＲＦ通信信号を送信するように構成された送信機（たとえば、ＴＸ１０）とを含む。そのようなデバイスは、本明細書で参照されるコードのうちの任意の１つまたは複数を介して音声通信データをワイヤレスに送信および受信するように構成され得る。

[00197]デバイスＤ１０は、アンテナＣ３０を介してＲＦ通信信号を受信および送信するように構成される。デバイスＤ１０はまた、アンテナＣ３０への経路中にダイプレクサと１つまたは複数の電力増幅器とを含み得る。また、チップ／チップセットＣＳ１０は、キーパッドＣ１０を介してユーザ入力を受信し、ディスプレイＣ２０を介して情報を表示するように構成される。この例では、デバイスＤ１０はまた、全地球測位システム（ＧＰＳ）位置サービス、および／またはワイヤレス（たとえば、Ｂｌｕｅｔｏｏｔｈ（登録商標））ヘッドセットなどの外部デバイスとの短距離通信をサポートするための、１つまたは複数のアンテナＣ４０を含む。別の例では、そのような通信デバイスは、それ自体がＢｌｕｅｔｏｏｔｈ（登録商標）ヘッドセットであり、キーパッドＣ１０、ディスプレイＣ２０、およびアンテナＣ３０がない。

[00198]通信デバイスＤ１０は、スマートフォンおよびラップトップおよびタブレットコンピュータを含む、様々な通信デバイスに組み込まれ得る。図２６は、１つのそのような例の正面図、背面図、および側面図を示しており、ハンドセットＨ１００（たとえば、スマートフォン）は前面に配列された２つの音声マイクロフォンＭＶ１０−１およびＭＶ１０−３を有し、音声マイクロフォンＭＶ１０−２は背面上に配列され、別のマイクロフォンＭＥ１０（たとえば、強化された方向選択性のためおよび／またはアクティブ雑音消去動作への入力のためにユーザの耳元の音響誤差をキャプチャするため）は正面の上隅に配置され、別のマイクロフォンＭＲ１０（たとえば、強化された方向選択性のためおよび／または背景雑音の基準をキャプチャするため）は背面上に配置される。拡声器ＬＳ１０が、誤差マイクロフォンＭＥ１０の近くの、正面の上側の中心に配置され、（たとえばスピーカーフォンアプリケーションで）拡声器ＬＳ２０Ｌ、ＬＳ２０Ｒも設けられる。そのようなハンドセットのマイクロフォン間の最大距離は、一般に約１０または１２センチメートルである。

[00199]図２５Ｄは、本明細書で説明する方法（たとえば、方法Ｍ１００、Ｍ２００、Ｍ３００、Ｍ４００、Ｍ５００、Ｍ６００およびＭ７００のうちの任意の１つまたは複数）を実行するように実施され得るワイヤレスデバイス１１０２のブロック図を示す。送信端末１０２は、ワイヤレスデバイス１１０２の実装形態として実現され得る。ワイヤレスデバイス１１０２は、遠隔局、アクセス端末、ハンドセット、携帯情報端末（ＰＤＡ）、セルラー電話などであってよい。

[00200]ワイヤレスデバイス１１０２は、デバイスの動作を制御するプロセッサ１１０４を含む。プロセッサ１１０４は中央処理装置（ＣＰＵ）とも呼ばれることもある。読取り専用メモリ（ＲＯＭ）とランダムアクセスメモリ（ＲＡＭ）の両方を含むことができるメモリ１１０６は、命令とデータとをプロセッサ１１０４に与える。メモリ１１０６の一部は不揮発性ランダムアクセスメモリ（ＮＶＲＡＭ）をも含むことができる。プロセッサ１１０４は一般に、メモリ１１０６内に記憶されたプログラム命令に基づいて、論理および演算動作を実行する。メモリ１１０６中の命令は、本明細書で説明する方法（複数可）を実施するために実行可能である。

[00201]ワイヤレスデバイス１１０２は、ワイヤレスデバイス１１０２と遠隔地との間のデータの送信および受信を可能にするために送信機１１１０と受信機１１１２とを含むことができるハウジング１１０８を含む。送信機１１１０と受信機１１１２とを組み合わせてトランシーバ１１１４を形成することができる。アンテナ１１１６は、ハウジング１１０８に取り付けられ、トランシーバ１１１４に電気的に結合される。ワイヤレスデバイス１１０２は、複数の送信機、複数の受信機、複数のトランシーバ、および／または複数のアンテナをも含む（図示せず）ことができる。

[00202]この例では、ワイヤレスデバイス１１０２は、トランシーバ１１１４によって受信された信号のレベルを検出し、量子化するために使用され得る、信号検出器１１１８をも含み得る。信号検出器１１１８は、総エネルギー、擬似ノイズ（ＰＮ）チップ当たりのパイロットエネルギー、電力スペクトル密度、および他の信号などの信号を検出できる。ワイヤレスデバイス１１０２はまた、信号を処理する際に使用するためのデジタル信号プロセッサ（ＤＳＰ）１１２０を含む。

[00203]ワイヤレスデバイス１１０２の様々な構成要素は、データバスに加えて、電力バスと、制御信号バスと、ステータス信号バスとを含み得る、バスシステム１１２２によって互いに結合される。明確にするために、様々なバスが、バスシステム１１２２として図２５Ｄにおいて示されている。

[00204]本明細書で開示した方法および装置は、概して任意の送受信および／または音声感知アプリケーション、特にそのようなアプリケーションのモバイル事例または他の持ち運び可能事例において適用され得る。たとえば、本明細書で開示する構成の範囲は、符号分割多元接続（ＣＤＭＡ）無線インターフェースを採用するように構成されたワイヤレス電話通信システムに常駐する、通信デバイスを含む。しかし、本明細書で説明した特徴を有する方法および装置は、有線および／またはワイヤレス（たとえば、ＣＤＭＡ、ＴＤＭＡ、ＦＤＭＡ、および／またはＴＤ−ＳＣＤＭＡ）送信チャネルを介したボイスオーバＩＰ（ＶｏＩＰ）を採用するシステムなど、当業者に知られている広範囲の技術を採用する様々な通信システムのいずれにも常駐し得ることが、当業者には理解されよう。

[00205]本明細書で開示した通信デバイスは、パケット交換式であるネットワーク（たとえば、ＶｏＩＰなどのプロトコルに従ってオーディオ送信を搬送するように構成されたワイヤードおよび／またはワイヤレスネットワーク）および／または回線交換式であるネットワークにおける使用に適応され得ることが明確に企図され、本明細書によって開示される。また、本明細書で開示した通信デバイスは、狭帯域コーディングシステム（たとえば、約４または５キロヘルツの可聴周波数レンジを符号化するシステム）での使用、ならびに／あるいは全帯域広帯域コーディングシステムおよびスプリットバンド広帯域コーディングシステムを含む、広帯域コーディングシステム（たとえば、５キロヘルツを超える可聴周波数を符号化するシステム）での使用に適応され得ることが明確に企図され、本明細書によって開示される。

[00206]説明した構成の提示は、本明細書で開示する方法および他の構造物を当業者が製造または使用できるように与えたものである。本明細書で図示および説明したフローチャート、ブロック図、および他の構造は例にすぎず、これらの構造の他の変形形態も開示の範囲内である。これらの構成に対する様々な変更が可能であり、本明細書で提示した一般的な原理は他の構成にも同様に適用できる。したがって、本開示は、上に示した構成に限定されるものではなく、原開示の一部をなす、出願した添付の特許請求の範囲を含む、本明細書において任意の方法で開示される原理および新規の特徴に一致する最も広い範囲が与えられるべきである。

[00207]情報および信号は、多種多様な技術および技法のいずれかを使用して表され得ることを当業者なら理解されよう。たとえば、上記の説明全体にわたって言及され得るデータ、命令、コマンド、情報、信号、ビット、およびシンボルは、電圧、電流、電磁波、磁界または磁性粒子、光場または光学粒子、あるいはそれらの任意の組合せによって表され得る。

[00208]本明細書で開示した構成の実装形態の重要な設計要件は、圧縮されたオーディオもしくはオーディオビジュアル情報（たとえば、本明細書で識別される例のうちの１つなど、圧縮形式に従って符号化されるファイルまたはストリーム）の再生などの計算集約的適用例、または広帯域通信（たとえば、１２、１６、３２、４４．１、４８、または１９２ｋＨｚなど、８キロヘルツよりも高いサンプリングレートにおけるボイス通信）の適用例では特に、（一般に百万命令毎秒またはＭＩＰＳで測定される）処理遅延および／または計算複雑さを最小にすることを含み得る。

[00209]本明細書で開示した装置（たとえば、装置Ａ１００、Ａ３００、Ａ５００、ＭＦ１００、ＭＦ１４０、ＭＦ１５０、ＭＦ３００、ＭＦ５００）は、意図された適用例に好適と見なされる、ソフトウェアとの、および／またはファームウェアとのハードウェアの任意の組合せで実装され得る。たとえば、そのような装置の要素は、たとえば、同じチップ上に、またはチップセット中の２つ以上のチップ間に常駐する電子デバイスおよび／または光デバイスとして作製され得る。そのようなデバイスの一例は、トランジスタまたは論理ゲートなどの論理要素の固定アレイまたはプログラマブルアレイであり、これらの要素のいずれも１つまたは複数のそのようなアレイとして実装され得る。これらの要素のうちの任意の２つ以上、さらにはすべてが、同じ１つまたは複数のアレイ内に実装され得る。そのような１つまたは複数のアレイは、１つまたは複数のチップ内（たとえば、２つ以上のチップを含むチップセット内）に実装され得る。

[00210]本明細書で開示した装置（たとえば、装置Ａ１００、Ａ３００、Ａ５００、ＭＦ１００、ＭＦ１４０、ＭＦ１５０、ＭＦ３００、ＭＦ５００）の様々な実装形態の１つまたは複数の要素は、全体または一部が、マイクロプロセッサ、組込みプロセッサ、ＩＰコア、デジタル信号プロセッサ、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）、ＡＳＳＰ（特定用途向け標準製品）、およびＡＳＩＣ（特定用途向け集積回路）など、論理要素の１つまたは複数の固定アレイまたはプログラマブルアレイ上で実行するように構成された命令の１つまたは複数のセットとして実装され得る。本明細書で開示した装置の実装形態の様々な要素のいずれも、１つまたは複数のコンピュータ（たとえば、「プロセッサ」とも呼ばれる、命令の１つまたは複数のセットまたはシーケンスを実行するようにプログラムされた１つまたは複数のアレイを含む機械）としても実施され得、これらの要素のうちの任意の２つ以上、さらにはすべてが、同じそのような１つまたは複数のコンピュータ内に実装され得る。

[00211]本明細書で開示したプロセッサまたは処理するための他の手段は、たとえば、同じチップ上に、またはチップセット中の２つ以上のチップ上に常駐する、１つまたは複数の電子デバイスおよび／または光デバイスとして作製され得る。そのようなデバイスの一例は、トランジスタまたは論理ゲートなどの論理要素の固定アレイまたはプログラマブルアレイであり、これらの要素のいずれも１つまたは複数のそのようなアレイとして実装され得る。そのような１つまたは複数のアレイは、１つまたは複数のチップ内（たとえば、２つ以上のチップを含むチップセット内）に実装され得る。そのようなアレイの例には、マイクロプロセッサ、組込みプロセッサ、ＩＰコア、ＤＳＰ、ＦＰＧＡ、ＡＳＳＰ、およびＡＳＩＣなど、論理要素の固定アレイまたはプログラマブルアレイがある。本明細書で開示したプロセッサまたは処理するための他の手段は、１つまたは複数のコンピュータ（たとえば、命令の１つまたは複数のセットまたはシーケンスを実行するようにプログラムされた１つまたは複数のアレイを含む機械）あるいは他のプロセッサとしても実施され得る。本明細書で説明したプロセッサは、プロセッサが組み込まれているデバイスまたはシステム（たとえば、オーディオ感知デバイス）の別の演算に関係するタスクなど、方法Ｍ１００の実装形態のプロシージャに直接関係しないタスクを実施するかまたは命令の他のセットを実行するために使用することが可能である。また、本明細書で開示した方法の一部はオーディオ感知デバイスのプロセッサによって実行され、その方法の別の一部は１つまたは複数の他のプロセッサの制御下で実行されることが可能である。

[00212]本明細書で開示した構成に関して説明した様々な例示的なモジュール、論理ブロック、回路、およびテストならびに他の動作は、電子ハードウェア、コンピュータソフトウェア、またはその両方の組合せとして実装され得ることを、当業者なら諒解されよう。そのようなモジュール、論理ブロック、回路、および動作は、本明細書で開示した構成を生成するように設計された、汎用プロセッサ、デジタル信号プロセッサ（ＤＳＰ）、ＡＳＩＣまたはＡＳＳＰ、ＦＰＧＡまたは他のプログラマブル論理デバイス、個別ゲートまたはトランジスタ論理、個別ハードウェア構成要素、あるいはそれらの任意の組合せを用いて実装または実行され得る。たとえば、そのような構成は、少なくとも部分的に、ハードワイヤード回路として、特定用途向け集積回路へと作製された回路構成として、あるいは不揮発性記憶装置にロードされるファームウェアプログラム、または汎用プロセッサもしくは他のデジタル信号処理ユニットなどの論理要素のアレイによって実行可能な命令である機械可読コードとしてデータ記憶媒体からロードされるかもしくはデータ記憶媒体にロードされるソフトウェアプログラムとして実装され得る。汎用プロセッサはマイクロプロセッサであり得るが、代替として、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であり得る。プロセッサは、コンピューティングデバイスの組合せ、たとえば、ＤＳＰとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、ＤＳＰコアと連携する１つまたは複数のマイクロプロセッサ、あるいは任意の他のそのような構成として実装することもできる。ソフトウェアモジュールは、ＲＡＭ（ランダムアクセスメモリ）、ＲＯＭ（読取り専用メモリ）、フラッシュＲＡＭなどの不揮発性ＲＡＭ（ＮＶＲＡＭ）、消去可能プログラマブルＲＯＭ（ＥＰＲＯＭ）、電気的消去可能プログラマブルＲＯＭ（ＥＥＰＲＯＭ）、レジスタ、ハードディスク、リムーバブルディスク、またはＣＤ−ＲＯＭなど、非一時的記憶媒体中に、あるいは当技術分野で知られている任意の他の形態の記憶媒体中に常駐し得る。例示的な記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができるように、プロセッサに結合される。代替として、記憶媒体はプロセッサに一体化することができる。プロセッサおよび記憶媒体はＡＳＩＣ中に常駐することができる。ＡＳＩＣは、ユーザ端末内に常駐することができる。代替として、プロセッサおよび記憶媒体は、ユーザ端末内に個別構成要素として常駐することもできる。

[00213]本明細書で開示する様々な方法（たとえば、方法Ｍ１００、Ｍ２００、Ｍ３００、Ｍ４００、Ｍ５００、Ｍ６００、およびＭ７００のうちのいずれかの実装形態）は、プロセッサなどの論理要素のアレイによって実行され得、本明細書で説明する装置の様々な要素は、そのようなアレイ上で実行するように設計されたモジュールとして実装され得ることに留意されたい。本明細書で使用する「モジュール」または「サブモジュール」という用語は、ソフトウェア、ハードウェアまたはファームウェアの形態でコンピュータ命令（たとえば、論理式）を含む任意の方法、装置、デバイス、ユニットまたはコンピュータ可読データ記憶媒体を指すことができる。複数のモジュールまたはシステムを１つのモジュールまたはシステムに結合することができ、１つのモジュールまたはシステムを、同じ機能を実行する複数のモジュールまたはシステムに分離することができることを理解されたい。ソフトウェアまたは他のコンピュータ実行可能命令で実装した場合、プロセスの要素は本質的に、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを用いて関連するタスクを実行するコードセグメントである。「ソフトウェア」という用語は、ソースコード、アセンブリ言語コード、機械コード、バイナリコード、ファームウェア、マクロコード、マイクロコード、論理要素のアレイによって実行可能な命令の１つまたは複数のセットまたはシーケンス、およびそのような例の任意の組合せを含むことを理解されたい。プログラムまたはコードセグメントは、プロセッサ可読媒体に記憶され得、あるいは搬送波に埋め込まれたコンピュータデータ信号によって伝送媒体または通信リンクを介して送信され得る。

[00214]本明細書で開示した方法、方式、および技法の実装形態は、（たとえば、本明細書に記載する１つまたは複数のコンピュータ可読記憶媒体の有形のコンピュータ可読特徴において）論理要素のアレイ（たとえば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、または他の有限状態機械）を含む機械によって実行可能な命令の１つまたは複数のセットとしても有形に実施され得る。「コンピュータ可読媒体」という用語は、情報を記憶または転送することができる、揮発性の、不揮発性の、取外し可能な、および取外し不可能な記憶媒体を含む、任意の媒体を含み得る。コンピュータ可読媒体の例には、電子回路、半導体メモリデバイス、ＲＯＭ、フラッシュメモリ、消去可能ＲＯＭ（ＥＲＯＭ）、フロッピー（登録商標）ディスケットもしくは他の磁気ストレージ、ＣＤ−ＲＯＭ／ＤＶＤもしくは他の光ストレージ、ハードディスクもしくは所望の情報を記憶するために使用され得る任意の他の媒体、光ファイバー媒体、高周波（ＲＦ）リンク、または、所望の情報を搬送するために使用されアクセスされ得る任意の他の媒体がある。コンピュータデータ信号は、電子ネットワークチャネル、光ファイバー、無線リンク、電磁リンク、ＲＦリンクなどの伝送媒体を介して伝播することができる、任意の信号を含み得る。コードセグメントは、インターネットまたはイントラネットなどのコンピュータネットワークを介してダウンロードされ得る。いずれの場合も、本開示の範囲は、そのような実施形態によって限定されると解釈すべきではない。

[00215]本明細書で説明した方法のタスクの各々は、ハードウェアで直接実施されてもよく、プロセッサによって実行されるソフトウェアモジュールで実施されてもよく、またはその２つの組合せで実施されてもよい。本明細書で開示する方法の実装形態の典型的な適用例では、論理要素のアレイ（たとえば、論理ゲート）は、この方法の様々なタスクのうちの１つ、複数、さらにはすべてを実行するように構成される。タスクの１つまたは複数（場合によってはすべて）は、論理要素のアレイ（たとえば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、または他の有限状態機械）を含む機械（たとえば、コンピュータ）によって読取り可能および／または実行可能である、コンピュータプログラム製品（たとえば、ディスク、フラッシュもしくは他の不揮発性メモリカード、半導体メモリチップなどの１つまたは複数のデータ記憶媒体など）に埋め込まれたコード（たとえば、命令の１つまたは複数のセット）としても実装され得る。本明細書で開示した方法の実装形態のタスクは、２つ以上のそのようなアレイまたは機械によっても実行され得る。これらまたは他の実装形態では、タスクは、セルラー電話など、ワイヤレス通信用のデバイス、またはそのような通信機能を有する他のデバイス内で実行され得る。そのようなデバイスは、（たとえば、ＶｏＩＰなどの１つまたは複数のプロトコルを使用して）回線交換および／またはパケット交換ネットワークと通信するように構成され得る。たとえば、そのようなデバイスは、符号化フレームを受信および／または送信するように構成されたＲＦ回路を含み得る。

[00216]本明細書で開示した様々な方法は、ハンドセット、ヘッドセット、または携帯情報端末（ＰＤＡ）などのポータブル通信デバイスによって実行されてよく、本明細書で説明した様々な装置は、そのようなデバイス内に含まれ得ることが明確に開示される。典型的なリアルタイム（たとえば、オンライン）アプリケーションは、そのようなモバイルデバイスを使用して行われる、電話による会話である。

[00217]１つまたは複数の例示的な実施形態では、本明細書で説明した動作は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実施され得る。ソフトウェアで実施される場合、そのような動作は、１つまたは複数の命令またはコードとしてコンピュータ可読媒体に記憶され得るか、あるいはコンピュータ可読媒体を介して送信され得る。「コンピュータ可読媒体」という用語は、コンピュータ可読記憶媒体と通信（たとえば、伝送）媒体の両方を含む。限定ではなく、例として、コンピュータ可読記憶媒体は、（限定はしないが、ダイナミックＲＡＭもしくはスタティックＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、および／またはフラッシュＲＡＭを含み得る）半導体メモリ、または強誘電体メモリ、磁気抵抗メモリ、オボニックメモリ、高分子メモリ、または相変化メモリなどの記憶要素のアレイ、ＣＤ−ＲＯＭもしくは他の光ディスクストレージ、および／または、磁気ディスクストレージもしくは他の磁気ストレージデバイスを備え得る。そのような記憶媒体は、コンピュータによってアクセスされ得る命令またはデータ構造の形態で情報を記憶し得る。通信媒体は、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む、命令またはデータ構造の形態の所望のプログラムコードを搬送するために使用されコンピュータによってアクセスされ得る、任意の媒体を備え得る。同様に、いかなる接続も適切にコンピュータ可読媒体と称される。たとえば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または、赤外線、無線、および／もしくはマイクロ波のようなワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、ＤＳＬ、または、赤外線、無線、および／もしくはマイクロ波のようなワイヤレス技術は、媒体の定義に含まれる。本明細書で使用するディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザディスク（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピーディスク（disk）およびブルーレイ（登録商標）ディスク（disc）（Ｂｌｕ−ＲａｙＤｉｓｃＡｓｓｏｃｉａｔｉｏｎ、カリフォルニア州ユニヴァーサルシティー）を含み、ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）はデータをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含めるべきである。

[00218]本明細書で説明した音響信号処理装置は、いくつかの動作を制御するために音声入力を受容し、あるいは背景雑音から所望の雑音を分離することから利益を得ることがある、通信デバイスなどの電子デバイスに組み込まれ得る。多くの適用例では、複数の方向から発生した背景音から明瞭な所望の音を強調または分離することから利益を得ることがある。そのような適用例は、ボイス認識および検出、音声強調および分離、ボイスアクティブ化制御などの機能を組み込んだ電子デバイスまたはコンピューティングデバイスにおけるヒューマンマシンインターフェースを含み得る。そのような音響信号処理装置を、限定された処理機能のみを与えるデバイスに適するように実装するのが望ましいことがある。

[00219]本明細書で説明したモジュール、要素、およびデバイスの様々な実装形態の要素は、たとえば、同じチップ上に、またはチップセット中の２つ以上のチップ上に常駐する、電子デバイスおよび／または光デバイスとして作製され得る。そのようなデバイスの一例は、トランジスタまたはゲートなど、論理要素の固定アレイまたはプログラマブルアレイである。本明細書で説明した装置の様々な実装形態の１つまたは複数の要素は、全体または一部が、マイクロプロセッサ、組込みプロセッサ、ＩＰコア、デジタル信号プロセッサ、ＦＰＧＡ、ＡＳＳＰ、およびＡＳＩＣなど、論理要素の１つまたは複数の固定アレイまたはプログラマブルアレイ上で実行するように構成された命令の１つまたは複数のセットとしても実装され得る。

[00220]本明細書で説明した装置の一実装形態の１つまたは複数の要素は、装置が組み込まれているデバイスまたはシステムの別の動作に関係するタスクなど、装置の動作に直接関係しないタスクを実施し、あるいは装置の動作に直接関係しない命令の他のセットを実行するために使用することが可能である。また、そのような装置の実装形態の１つまたは複数の要素は、共通の構造（たとえば、異なる要素に対応するコードの部分を異なる時間に実行するために使用されるプロセッサ、異なる要素に対応するタスクを異なる時間に実施するために実行される命令のセット、あるいは、異なる要素向けの動作を異なる時間に実行する電子デバイスおよび／または光デバイスの構成）を有することが可能である。
以下に本願出願当初の特許請求の範囲を付記する。
[Ｃ１] オーディオ信号を処理する方法であって、
前記オーディオ信号内で前記オーディオ信号の第１のフレームに後続する、前記オーディオ信号の第２のフレームに対する決定メトリックの少なくとも１つの値を計算することと、
前記決定メトリックの前記少なくとも１つの計算された値に基づいて、複数の再割振り候補の中の１つを選択することとを備え、
前記計算された少なくとも１つの値が、前記第２のフレームの圧縮率の尺度に基づき、
前記選択された再割振り候補が、前記第２のフレームに対する初期ビット割振りの第１の部分および第２の部分への再割振りを示す、方法。
[Ｃ２] 前記方法が、前記第１のフレームが前記オーディオ信号のクリティカルフレームであると判断することを含む、Ｃ１に記載の方法。
[Ｃ３] 前記第１のフレームがクリティカルフレームであると前記判断することが、前記オーディオ信号内の前記第１のフレームに後続する、前記オーディオ信号のフレームの符号化されたバージョンからの情報に基づく、Ｃ２に記載の方法。
[Ｃ４] 前記符号化されたバージョンが、前記第２のフレームの符号化されたバージョンである、Ｃ３に記載の方法。
[Ｃ５] 前記判断することが、クリティカリティ尺度とクリティカリティ閾値とを比較することを含む、Ｃ２から４のいずれか一項に記載の方法。
[Ｃ６] 前記判断することが、送信チャネルの状態に関する情報に基づいて前記クリティカリティ閾値を計算することを含む、Ｃ５に記載の方法。
[Ｃ７] 前記クリティカリティ閾値を前記計算することが、
前記送信チャネルの前記状態に関する前記情報に基づく計算された値と境界値とを比較することと、
前記境界値と前記比較することの結果に応答して、前記境界値を前記クリティカリティ閾値として選択することとを含む、Ｃ６に記載の方法。
[Ｃ８] 圧縮率の前記尺度が、前記第２のフレームのサブフレームの間の相関を示す、Ｃ１から７のいずれか一項に記載の方法。
[Ｃ９] 前記複数の再割振り候補の中の１つを前記選択することが、前記決定メトリックの計算された値と、順序付けられた複数の決定閾値の各々とを比較することを含み、
前記順序付けられた複数の決定閾値の各々が、前記複数の再割振り候補の中の異なる１つに対応する、Ｃ１から８のいずれか一項に記載の方法。
[Ｃ１０] 前記方法が、前記決定メトリックの複数の値を計算することを備え、各値が、前記オーディオ信号内で前記第１のフレームに後続する前記オーディオ信号の異なるフレームに対応し、
前記決定メトリックの前記複数の値の各々が、前記対応するフレームの圧縮率の尺度に基づき、
前記方法が、前記決定メトリックの前記複数の値のうちの少なくともいくつかに基づいて、前記異なるフレームの中から前記第２のフレームを選択することを備える、Ｃ１から９のいずれか一項に記載の方法。
[Ｃ１１] 前記決定メトリックの前記計算された少なくとも１つの値が、前記決定メトリックの計算された値のセットを含み、前記計算された値のセットの各々が、前記複数の再割振り候補のうちの異なる１つに対応する、Ｃ１から７のいずれか一項に記載の方法。
[Ｃ１２] 前記計算された値のセットの各々が、前記複数の再割振り候補のうちの前記対応する１つに関連する知覚品質の尺度に基づく、Ｃ１１に記載の方法。
[Ｃ１３] 圧縮率の前記尺度が、前記第２のフレームの符号化されたバージョンからの情報に基づく、Ｃ１１または１２に記載の方法。
[Ｃ１４] 前記少なくとも１つの計算された値が、異なる符号化レートに対する前記第２のフレームの知覚品質の尺度間の関係に基づく、Ｃ１１から１３のいずれか一項に記載の方法。
[Ｃ１５] 前記少なくとも１つの計算された値が、（Ａ）前記初期ビット割振りに対する前記第２のフレームの圧縮率の尺度と、（Ｂ）前記複数の再割振り候補のうちの前記対応する１つに対する前記第２のフレームの圧縮率の尺度との間の関係に基づく、Ｃ１１から１４のいずれか一項に記載の方法。
[Ｃ１６] 前記決定メトリックの前記計算された少なくとも１つの値が、前記決定メトリックの計算された値の複数のセットを含み、前記複数のセットの各々が、前記オーディオ信号内で前記第１のフレームに後続する前記オーディオ信号の異なるフレームに対応し、各セット内で、各値が前記複数の再割振り候補のうちの異なる１つに対応する、Ｃ１から７のいずれか一項に記載の方法。
[Ｃ１７] 各セット内で、各値が、前記複数の再割振り候補のうちの前記対応する１つに関連する知覚品質の尺度に基づく、Ｃ１６に記載の方法。
[Ｃ１８] 各セット内で、各値が、前記対応するフレームの符号化されたバージョンからの情報に基づく、Ｃ１６または１７に記載の方法。
[Ｃ１９] 前記方法が、前記複数のセットのうちの少なくともいくつかの計算された値に基づいて、前記異なるフレームの中から前記第２のフレームを選択することを備える、Ｃ１６から１８のいずれか一項に記載の方法。
[Ｃ２０] 前記方法が、前記複数の再割振り候補の中の１つを前記選択することに応答して、前記第１のフレームの冗長コピーと前記第２のフレームのコピーとを含むパケットを作成することを備え、
前記第２のフレームの前記コピーが前記第１の部分に符号化され、
前記冗長コピーが前記第２の部分に符号化される、Ｃ１から１９のいずれか一項に記載の方法。
[Ｃ２１] オーディオ信号を処理するための装置であって、
前記オーディオ信号内で前記オーディオ信号の第１のフレームに後続する、前記オーディオ信号の第２のフレームに対する決定メトリックの少なくとも１つの値を計算するための手段と、
前記決定メトリックの前記少なくとも１つの計算された値に基づいて、複数の再割振り候補の中の１つを選択するための手段とを備え、
前記計算された少なくとも１つの値が、前記第２のフレームの圧縮率の尺度に基づき、
前記選択された再割振り候補が、前記第２のフレームに対する初期ビット割振りの第１の部分および第２の部分への再割振りを示す、装置。
[Ｃ２２] 前記装置が、前記第１のフレームが前記オーディオ信号のクリティカルフレームであると判断するための手段を含む、Ｃ２１に記載の装置。
[Ｃ２３] 前記第１のフレームがクリティカルフレームであると前記判断することが、前記オーディオ信号内の、前記第１のフレームに後続する前記オーディオ信号のフレームの符号化されたバージョンからの情報に基づく、Ｃ２２に記載の装置。
[Ｃ２４] 前記符号化されバージョンが、前記第２のフレームの符号化されたバージョンである、Ｃ２３に記載の装置。
[Ｃ２５] 前記判断することが、クリティカリティ尺度とクリティカリティ閾値とを比較することを含む、Ｃ２２から２４のいずれか一項に記載の装置。
[Ｃ２６] 前記判断することが、送信チャネルの状態に関連する情報に基づいて前記クリティカリティ閾値を計算することを含む、Ｃ２５に記載の装置。
[Ｃ２７] 前記クリティカリティ閾値を前記計算することが、
前記送信チャネルの前記状態に関連する前記情報に基づく計算された値と境界値とを比較することと、
前記境界値と前記比較することの結果に応答して、前記境界値を前記クリティカリティ閾値として選択することとを含む、Ｃ２６に記載の装置。
[Ｃ２８] 圧縮率の前記尺度が、前記第２のフレームのサブフレームの間の相関を示す、Ｃ２１から２７のいずれか一項に記載の装置。
[Ｃ２９] 前記複数の再割振り候補の中の１つを前記選択することが、前記決定メトリックの計算された値と、順序付けられた複数の決定閾値の各々とを比較することを含み、
前記順序付けられた複数の決定閾値の各々が、前記複数の再割振り候補の中の異なる１つに対応する、Ｃ２１から２８のいずれか一項に記載の装置。
[Ｃ３０] 前記決定メトリックの少なくとも１つの値を計算するための前記手段が、前記決定メトリックの複数の値を計算するように構成され、各値が、前記オーディオ信号内で前記第１のフレームに後続する前記オーディオ信号の異なるフレームに対応し、
前記決定メトリックの前記複数の値の各々が、前記対応するフレームの圧縮率の尺度に基づき、
前記装置が、前記決定メトリックの前記複数の値のうちの少なくともいくつかに基づいて、前記異なるフレームの中から前記第２のフレームを選択するための手段を備える、Ｃ２１から２９のいずれか一項に記載の装置。
[Ｃ３１] 前記決定メトリックの前記計算された少なくとも１つの値が、前記決定メトリックの計算された値のセットを含み、前記計算された値のセットの各々が、前記複数の再割振り候補のうちの異なる１つに対応する、Ｃ２１から２７のいずれか一項に記載の装置。
[Ｃ３２] 前記計算された値のセットの各々が、前記複数の再割振り候補のうちの前記対応する１つに関連する知覚品質の尺度に基づく、Ｃ３１に記載の装置。
[Ｃ３３] 圧縮率の前記尺度が、前記第２のフレームの符号化されたバージョンからの情報に基づく、Ｃ３１または３２に記載の装置。
[Ｃ３４] 前記少なくとも１つの計算された値が、異なる符号化レートに対する前記第２のフレームの知覚品質の尺度間の関係に基づく、Ｃ３１から３３のいずれか一項に記載の装置。
[Ｃ３５] 前記少なくとも１つの計算された値が、（Ａ）前記初期ビット割振りに対する前記第２のフレームの圧縮率の尺度と、（Ｂ）前記複数の再割振り候補のうちの前記対応する１つに対する前記第２のフレームの圧縮率の尺度との間の関係に基づく、Ｃ３１から３４のいずれか一項に記載の装置。
[Ｃ３６] 前記決定メトリックの前記計算された少なくとも１つの値が、前記決定メトリックの計算された値の複数のセットを含み、前記複数のセットの各々が、前記オーディオ信号内で前記第１のフレームに後続する前記オーディオ信号の異なるフレームに対応し、各セット内で、各値が前記複数の再割振り候補のうちの異なる１つに対応する、Ｃ２１から２７のいずれか一項に記載の装置。
[Ｃ３７] 各セット内で、各値が、前記複数の再割振り候補のうちの前記対応する１つに関連する知覚品質の尺度に基づく、Ｃ３６に記載の装置。
[Ｃ３８] 各セット内で、各値が、前記対応するフレームの符号化されたバージョンからの情報に基づく、Ｃ３６または３７に記載の装置。
[Ｃ３９] 前記装置が、前記複数のセットのうちの少なくともいくつかの計算された値に基づいて、前記異なるフレームの中から前記第２のフレームを選択するための手段を備える、Ｃ３６から３８のいずれか一項に記載の装置。
[Ｃ４０] 前記装置が、前記複数の再割振り候補の中の１つを前記選択することに応答して、前記第１のフレームの冗長コピーと前記第２のフレームのコピーを含むパケットを作成するための手段を備え、
前記第２のフレームの前記コピーが前記第１の部分に符号化され、
前記冗長コピーが前記第２の部分に符号化される、Ｃ２１から３９のいずれか一項に記載の装置。
[Ｃ４１] オーディオ信号を処理するための装置であって、
前記オーディオ信号内で前記オーディオ信号の第１のフレームに後続する、前記オーディオ信号の第２のフレームに対する決定メトリックの少なくとも１つの値を計算するように構成された計算器と、
前記決定メトリックの前記少なくとも１つの計算された値に基づいて、複数の再割振り候補の中の１つを選択するように構成された選択器とを備え、
前記計算された少なくとも１つの値が、前記第２のフレームの圧縮率の尺度に基づき、
前記選択された再割振り候補が、前記第２のフレームに対する初期ビット割振りの第１の部分および第２の部分への再割振りを示す、装置。
[Ｃ４２] 前記装置が、前記第１のフレームが前記オーディオ信号のクリティカルフレームであると判断するように構成されたクリティカルフレームインジケータを含む、Ｃ４１に記載の装置。
[Ｃ４３] 前記第１のフレームがクリティカルフレームであると前記判断することが、前記オーディオ信号内の、前記第１のフレームに後続する前記オーディオ信号のフレームの符号化されたバージョンからの情報に基づく、Ｃ４２に記載の装置。
[Ｃ４４] 前記符号化されたバージョンが、前記第２のフレームの符号化されたバージョンである、Ｃ４３に記載の装置。
[Ｃ４５] 前記判断することが、クリティカリティ尺度とクリティカリティ閾値とを比較することを含む、Ｃ４２から４４のいずれか一項に記載の装置。
[Ｃ４６] 前記判断することが、送信チャネルの状態に関連する情報に基づいて前記クリティカリティ閾値を計算することを含む、Ｃ４５に記載の装置。
[Ｃ４７] 前記クリティカリティ閾値を前記計算することが、
前記送信チャネルの前記状態に関連する前記情報に基づく計算された値と境界値とを比較することと、
前記境界値と前記比較することの結果に応答して、前記境界値を前記クリティカリティ閾値として選択することとを含む、Ｃ４６に記載の装置。
[Ｃ４８] 圧縮率の前記尺度が、前記第２のフレームのサブフレームの間の相関を示す、Ｃ４１から４７のいずれか一項に記載の装置。
[Ｃ４９] 前記複数の再割振り候補の中の１つを前記選択することが、前記決定メトリックの計算された値と、順序付けられた複数の決定閾値の各々とを比較することを含み、
前記順序付けられた複数の決定閾値の各々が、前記複数の再割振り候補の中の異なる１つに対応する、Ｃ４１から４８のいずれか一項に記載の装置。
[Ｃ５０] 前記計算器が、前記決定メトリックの複数の値を計算するように構成され、各値が、前記オーディオ信号内で前記第１のフレームに後続する前記オーディオ信号の異なるフレームに対応し、
前記決定メトリックの前記複数の値の各々が、前記対応するフレームの圧縮率の尺度に基づき、
前記選択器が、前記決定メトリックの前記複数の値のうちの少なくともいくつかに基づいて、前記異なるフレームの中から前記第２のフレームを選択するように構成される、Ｃ４１から４９のいずれか一項に記載の装置。
[Ｃ５１] 前記決定メトリックの前記計算された少なくとも１つの値が、前記決定メトリックの計算された値のセットを含み、前記計算された値のセットの各々が、前記複数の再割振り候補のうちの異なる１つに対応する、Ｃ４１から４７のいずれか一項に記載の装置。
[Ｃ５２] 前記計算された値のセットの各々が、前記複数の再割振り候補のうちの前記対応する１つに関連する知覚品質の尺度に基づく、Ｃ５１に記載の装置。
[Ｃ５３] 圧縮率の前記尺度が、前記第２のフレームの符号化されたバージョンからの情報に基づく、Ｃ５１または５２に記載の装置。
[Ｃ５４] 前記少なくとも１つの計算された値が、異なる符号化レートに対する前記第２のフレームの知覚品質の尺度間の関係に基づく、Ｃ５１から５３のいずれか一項に記載の装置。
[Ｃ５５] 前記少なくとも１つの計算された値が、（Ａ）前記初期ビット割振りに対する前記第２のフレームの圧縮率の尺度と、（Ｂ）前記複数の再割振り候補のうちの前記対応する１つに対する前記第２のフレームの圧縮率の尺度との間の関係に基づく、Ｃ５１から５４のいずれか一項に記載の装置。
[Ｃ５６] 前記決定メトリックの前記計算された少なくとも１つの値が、前記決定メトリックの計算された値の複数のセットを含み、前記複数のセットの各々が、前記オーディオ信号内で前記第１のフレームに後続する前記オーディオ信号の異なるフレームに対応し、各セット内で、各値が前記複数の再割振り候補のうちの異なる１つに対応する、Ｃ４１から４７のいずれか一項に記載の装置。
[Ｃ５７] 各セット内で、各値が、前記複数の再割振り候補のうちの前記対応する１つに関連する知覚品質の尺度に基づく、Ｃ５６に記載の装置。
[Ｃ５８] 各セット内で、各値が、前記対応するフレームの符号化されたバージョンからの情報に基づく、Ｃ５６または５７に記載の装置。
[Ｃ５９] 前記選択器が、前記複数のセットのうちの少なくともいくつかの計算された値に基づいて、前記異なるフレームの中から前記第２のフレームを選択するように構成される、Ｃ５６から５８のいずれか一項に記載の装置。
[Ｃ６０] 前記装置が、前記複数の再割振り候補の中の１つを前記選択することに応答して、前記第１のフレームの冗長コピーと前記第２のフレームのコピーとを含むパケットを作成するように構成されたパケットアセンブラを備え、
前記第２のフレームの前記コピーが前記第１の部分に符号化され、
前記冗長コピーが前記第２の部分に符号化される、Ｃ４１から５９のいずれか一項に記載の装置。
[Ｃ６１] 有形な特徴を有する非一時的コンピュータ可読データ記憶媒体であって、前記有形な特徴が、前記特徴を読み取る機械に、Ｃ１から２０のいずれか一項に記載の方法を実行させる、非一時的コンピュータ可読データ記憶媒体。

Claims

オーディオ信号を処理する方法であって、
前記オーディオ信号内で前記オーディオ信号の第１のフレームに後続する、前記オーディオ信号の第２のフレームに対する決定メトリックの少なくとも１つの値を計算することと、ここにおいて、前記決定メトリックの高い値は、前記第２のフレームが圧縮可能であることを示し、ならびに前記決定メトリックの低い値は、前記第２のフレームが圧縮に対して抵抗性があることを示す、
前記決定メトリックの前記少なくとも１つの計算された値に基づいて、複数の再割振り候補の中の１つを選択することと、
を備え、
ここにおいて、前記複数の再割振り候補の各々が、固定ビット数の初期ビット割振りの分配を示し、
ここにおいて、前記計算された少なくとも１つの値が、前記第２のフレームの圧縮率の尺度に基づき、
ここにおいて、前記選択された再割振り候補が、前記第２のフレームに対する前記初期ビット割振りの第１の部分および第２の部分への再割振りを示す、方法。
前記方法が、前記第１のフレームが前記オーディオ信号のクリティカルフレームであると判断することを含む、請求項１に記載の方法。
前記第１のフレームがクリティカルフレームであると前記判断することが、前記オーディオ信号内の前記第１のフレームに後続する、前記オーディオ信号のフレームの符号化されたバージョンからの情報に基づく、請求項２に記載の方法。
前記符号化されたバージョンが、前記第２のフレームの符号化されたバージョンである、請求項３に記載の方法。
前記判断することが、クリティカリティ尺度とクリティカリティ閾値とを比較することを含む、請求項２に記載の方法。
前記判断することが、送信チャネルの状態に関する情報に基づいて前記クリティカリティ閾値を計算することを含む、請求項５に記載の方法。
前記クリティカリティ閾値を前記計算することが、
前記送信チャネルの前記状態に関する前記情報に基づく計算された値と境界値とを比較することと、
前記境界値と前記比較することの結果に応答して、前記境界値を前記クリティカリティ閾値として選択することと
を含む、請求項６に記載の方法。
圧縮率の前記尺度が、前記第２のフレームのサブフレームの間の相関を示す、請求項１に記載の方法。
前記複数の再割振り候補の中の１つを前記選択することが、前記決定メトリックの計算された値と、順序付けられた複数の決定閾値の各々とを比較することを含み、
ここにおいて、前記順序付けられた複数の決定閾値の各々が、前記複数の再割振り候補の中の異なる１つに対応する、請求項１に記載の方法。
前記方法が、前記決定メトリックの複数の値を計算することを備え、各値が、前記オーディオ信号内で前記第１のフレームに後続する前記オーディオ信号の異なるフレームに対応し、
ここにおいて、前記決定メトリックの前記複数の値の各々が、前記対応するフレームの圧縮率の尺度に基づき、
ここにおいて、前記方法が、前記決定メトリックの前記複数の値のうちの少なくともいくつかに基づいて、前記異なるフレームの中から前記第２のフレームを選択することを備える、請求項１に記載の方法。
前記決定メトリックの前記計算された少なくとも１つの値が、前記決定メトリックの計算された値のセットを含み、前記計算された値のセットの各々が、前記複数の再割振り候補のうちの異なる１つに対応する、請求項１に記載の方法。
前記計算された値のセットの各々が、前記複数の再割振り候補のうちの前記対応する１つに関連する知覚品質の尺度に基づく、請求項１１に記載の方法。
圧縮率の前記尺度が、前記第２のフレームの符号化されたバージョンからの情報に基づく、請求項１１に記載の方法。
前記少なくとも１つの計算された値が、異なる符号化レートに対する前記第２のフレームの知覚品質の尺度間の関係に基づく、請求項１１に記載の方法。
前記少なくとも１つの計算された値が、（Ａ）前記初期ビット割振りに対する前記第２のフレームの圧縮率の尺度と、（Ｂ）前記複数の再割振り候補のうちの前記対応する１つに対する前記第２のフレームの圧縮率の尺度との間の関係に基づく、請求項１１に記載の方法。
前記決定メトリックの前記計算された少なくとも１つの値が、前記決定メトリックの計算された値の複数のセットを含み、前記複数のセットの各々が、前記オーディオ信号内で前記第１のフレームに後続する前記オーディオ信号の異なるフレームに対応し、各セット内で、各値が前記複数の再割振り候補のうちの異なる１つに対応する、請求項１に記載の方法。
各セット内で、各値が、前記複数の再割振り候補のうちの前記対応する１つに関連する知覚品質の尺度に基づく、請求項１６に記載の方法。
各セット内で、各値が、前記対応するフレームの符号化されたバージョンからの情報に基づく、請求項１６に記載の方法。
前記方法が、前記複数のセットのうちの少なくともいくつかの計算された値に基づいて、前記異なるフレームの中から前記第２のフレームを選択することを備える、請求項１６に記載の方法。
前記方法が、前記複数の再割振り候補の中の１つを前記選択することに応答して、前記第１のフレームの冗長コピーと前記第２のフレームのコピーとを含むパケットを作成することを備え、
ここにおいて、前記第２のフレームの前記コピーが前記第１の部分に符号化され、
ここにおいて、前記冗長コピーが前記第２の部分に符号化される、請求項１に記載の方法。
オーディオ信号を処理するための装置であって、
前記オーディオ信号内で前記オーディオ信号の第１のフレームに後続する、前記オーディオ信号の第２のフレームに対する決定メトリックの少なくとも１つの値を計算するための手段と、ここにおいて、前記決定メトリックの高い値は、前記第２のフレームが圧縮可能であることを示し、ならびに前記決定メトリックの低い値は、前記第２のフレームが圧縮に対して抵抗性があることを示す、
前記決定メトリックの前記少なくとも１つの計算された値に基づいて、複数の再割振り候補の中の１つを選択するための手段と
を備え、ここにおいて、前記複数の再割振り候補の各々が、固定ビット数の初期ビット割振りの分配を示し、
ここにおいて、前記計算された少なくとも１つの値が、前記第２のフレームの圧縮率の尺度に基づき、
ここにおいて、前記選択された再割振り候補が、前記第２のフレームに対する前記初期ビット割振りの第１の部分および第２の部分への再割振りを示す、装置。
前記装置が、前記第１のフレームが前記オーディオ信号のクリティカルフレームであると判断するための手段を含む、請求項２１に記載の装置。
前記第１のフレームがクリティカルフレームであると前記判断することが、前記オーディオ信号内の、前記第１のフレームに後続する前記オーディオ信号のフレームの符号化されたバージョンからの情報に基づく、請求項２２に記載の装置。
圧縮率の前記尺度が、前記第２のフレームのサブフレームの間の相関を示す、請求項２１に記載の装置。
前記決定メトリックの少なくとも１つの値を計算するための前記手段が、前記決定メトリックの複数の値を計算するように構成され、各値が、前記オーディオ信号内で前記第１のフレームに後続する前記オーディオ信号の異なるフレームに対応し、
ここにおいて、前記決定メトリックの前記複数の値の各々が、前記対応するフレームの圧縮率の尺度に基づき、
ここにおいて、前記装置が、前記決定メトリックの前記複数の値のうちの少なくともいくつかに基づいて、前記異なるフレームの中から前記第２のフレームを選択するための手段を備える、請求項２１に記載の装置。
前記決定メトリックの前記計算された少なくとも１つの値が、前記決定メトリックの計算された値のセットを含み、前記計算された値のセットの各々が、前記複数の再割振り候補のうちの異なる１つに対応し、
ここにおいて、前記計算された値のセットの各々が、前記複数の再割振り候補のうちの前記対応する１つに関連する知覚品質の尺度に基づく、請求項２１に記載の装置。
前記決定メトリックの前記計算された少なくとも１つの値が、前記決定メトリックの計算された値のセットを含み、前記計算された値のセットの各々が、前記複数の再割振り候補のうちの異なる１つに対応し、
ここにおいて、前記少なくとも１つの計算された値が、異なる符号化レートに対する前記第２のフレームの知覚品質の尺度間の関係に基づく、請求項２１に記載の装置。
前記装置が、前記複数の再割振り候補の中の１つを前記選択することに応答して、前記第１のフレームの冗長コピーと前記第２のフレームのコピーを含むパケットを作成するための手段を備え、
ここにおいて、前記第２のフレームの前記コピーが前記第１の部分に符号化され、
ここにおいて、前記冗長コピーが前記第２の部分に符号化される、請求項２１に記載の装置。
オーディオ信号を処理するための装置であって、
前記オーディオ信号内で前記オーディオ信号の第１のフレームに後続する、前記オーディオ信号の第２のフレームに対する決定メトリックの少なくとも１つの値を計算するように構成された計算器と、ここにおいて、前記決定メトリックの高い値は、前記第２のフレームが圧縮可能であることを示し、ならびに前記決定メトリックの低い値は、前記第２のフレームが圧縮に対して抵抗性があることを示す、
前記決定メトリックの前記少なくとも１つの計算された値に基づいて、複数の再割振り候補の中の１つを選択するように構成された選択器と
を備え、
ここにおいて、前記複数の再割振り候補の各々が、固定ビット数の初期ビット割振りの分配を示し、
ここにおいて、前記計算された少なくとも１つの値が、前記第２のフレームの圧縮率の尺度に基づき、
ここにおいて、前記選択された再割振り候補が、前記第２のフレームに対する前記初期ビット割振りの第１の部分および第２の部分への再割振りを示す、装置。
前記装置が、前記第１のフレームが前記オーディオ信号のクリティカルフレームであると判断するように構成されたクリティカルフレームインジケータを含む、請求項２９に記載の装置。
前記第１のフレームがクリティカルフレームであると前記判断することが、前記オーディオ信号内の、前記第１のフレームに後続する前記オーディオ信号のフレームの符号化されたバージョンからの情報に基づく、請求項３０に記載の装置。
圧縮率の前記尺度が、前記第２のフレームのサブフレームの間の相関を示す、請求項２９に記載の装置。
前記計算器が、前記決定メトリックの複数の値を計算するように構成され、各値が、前記オーディオ信号内で前記第１のフレームに後続する前記オーディオ信号の異なるフレームに対応し、
ここにおいて、前記決定メトリックの前記複数の値の各々が、前記対応するフレームの圧縮率の尺度に基づき、
ここにおいて、前記選択器が、前記決定メトリックの前記複数の値のうちの少なくともいくつかに基づいて、前記異なるフレームの中から前記第２のフレームを選択するように構成される、請求項２９に記載の装置。
前記決定メトリックの前記計算された少なくとも１つの値が、前記決定メトリックの計算された値のセットを含み、前記計算された値のセットの各々が、前記複数の再割振り候補のうちの異なる１つに対応し、
ここにおいて、前記計算された値のセットの各々が、前記複数の再割振り候補のうちの前記対応する１つに関連する知覚品質の尺度に基づく、請求項２９に記載の装置。
前記決定メトリックの前記計算された少なくとも１つの値が、前記決定メトリックの計算された値のセットを含み、前記計算された値のセットの各々が、前記複数の再割振り候補のうちの異なる１つに対応し、
前記少なくとも１つの計算された値が、異なる符号化レートに対する前記第２のフレームの知覚品質の尺度間の関係に基づく、請求項２９に記載の装置。
前記装置が、前記複数の再割振り候補の中の１つを前記選択することに応答して、前記第１のフレームの冗長コピーと前記第２のフレームのコピーとを含むパケットを作成するように構成されたパケットアセンブラを備え、
ここにおいて、前記第２のフレームの前記コピーが前記第１の部分に符号化され、
ここにおいて、前記冗長コピーが前記第２の部分に符号化される、請求項２９に記載の装置。
有形な特徴を有するコンピュータ可読データ記憶媒体であって、前記有形な特徴が、前記特徴を読み取る機械に、
オーディオ信号内で前記オーディオ信号の第１のフレームに後続する、前記オーディオ信号の第２のフレームに対する決定メトリックの少なくとも１つの値を計算することと、ここにおいて、前記決定メトリックの高い値は、前記第２のフレームが圧縮可能であることを示し、ならびに前記決定メトリックの低い値は、前記第２のフレームが圧縮に対して抵抗性があることを示す、
前記決定メトリックの前記少なくとも１つの計算された値に基づいて、複数の再割振り候補の中の１つを選択することと
を実行させ、
ここにおいて、前記複数の再割振り候補の各々が、固定ビット数の初期ビット割振りの分配を示し、
ここにおいて、前記計算された少なくとも１つの値が、前記第２のフレームの圧縮率の尺度に基づき、
ここにおいて、前記選択された再割振り候補が、前記第２のフレームに対する前記初期ビット割振りの第１の部分および第２の部分への再割振りを示す、
コンピュータ可読データ記憶媒体。
前記媒体が、前記特徴を読み取る機械に、前記第１のフレームが前記オーディオ信号のクリティカルフレームであると判断させる有形な特徴を含み、
ここにおいて、前記第１のフレームがクリティカルフレームであると前記判断することが、前記オーディオ信号内の前記第１のフレームに後続する、前記オーディオ信号のフレームの符号化されたバージョンからの情報に基づく、請求項３７に記載の媒体。
圧縮率の前記尺度が、前記第２のフレームのサブフレームの間の相関を示す、請求項３７に記載の媒体。
前記媒体が、前記特徴を読み取る機械に、前記複数の再割振り候補の中の１つを前記選択することに応答して、前記第１のフレームの冗長コピーと前記第２のフレームのコピーとを含むパケットを作成させる有形な特徴を備え、
ここにおいて、前記第２のフレームの前記コピーが前記第１の部分に符号化され、
ここにおいて、前記冗長コピーが前記第２の部分に符号化される、請求項３７に記載の媒体。