JP5727018B2

JP5727018B2 - 過渡フレームの符号化及び復号化

Info

Publication number: JP5727018B2
Application number: JP2013529208A
Authority: JP
Inventors: クリシュナン、ベンカテシュ; カンドハダイ、アナンサパドマナブハン・アラサニパライ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2010-09-13
Filing date: 2011-09-09
Publication date: 2015-06-03
Anticipated expiration: 2031-09-09
Also published as: TW201216254A; EP2617032A1; KR101545792B1; WO2012036988A1; CN103098127B; TWI459377B; US8990094B2; US20120065980A1; EP2617032B1; KR20130086609A; JP2013541731A; CN103098127A

Description

本開示は、一般に信号処理に関する。より詳細には、本開示は、過渡フレームを符号化及び復号することに関する。

最近の数十年で、電子機器の使用は一般的になった。特に、電子技術の進歩は、ますます複雑で有用になる電子機器のコストを低減した。コスト低減及び消費者需要により、電子機器が現代社会において事実上ユビキタスであるほど電子機器の使用が激増した。電子機器の使用が拡大するにつれて、電子機器の新しい改善された特徴に対する需要も拡大した。より詳細には、より高速に、より効率的に、又はより高品質で機能を実行する電子機器がしばしば求められる。

幾つかの電子機器（例えば、セルラーフォン、スマートフォン、コンピュータなど）はオーディオ又は音声信号を使用する。これらの電子機器は、記憶又は送信のために音声信号を符号化し得る。例えば、セルラーフォンは、マイクロフォンを使用してユーザのボイス又は音声を捕捉する。例えば、セルラーフォンは、マイクロフォンを使用して音響信号を電子信号に変換する。この電子信号は、次いで、別の機器（例えば、セルラーフォン、スマートフォン、コンピュータなど）への送信のために、又は記憶のためにフォーマットされ得る。

圧縮されていない音声信号を送信すること又は送ることは、例えば、帯域幅及び／又は記憶リソースに関してコストがかかり得る。音声信号をより効率的に（例えば、より少ないデータを使用して）表現することを試みる幾つかの方式が存在する。しかしながら、これらの方式は音声信号の幾つかの部分をうまく表現せず、その結果、性能が劣化することがある。上記の説明から理解され得るように、信号符号化を改善するシステム及び方法が有益であり得る。

米国特許法第１１９条に基づく優先権の主張
本出願は、本出願の譲受人に譲渡され、参照により本明細書に明確に組み込まれる、２０１０年９月１３日に出願された「CODING A TRANSIENT SPEECH FRAME」と題する仮特許出願第６１／３８２，４６０号の優先権を主張する。

過渡フレームを符号化するための電子機器が開示される。本電子機器は、プロセッサと、プロセッサと電子通信しているメモリに記憶された実行可能な命令とを含む。本電子機器は、現在過渡フレームを取得する。本電子機器はまた、現在過渡フレームに基づいて残差信号を取得する。本電子機器は、さらに、残差信号に基づいてピーク位置のセット（集合）を決定する。さらに、本電子機器は、少なくともピーク位置のセットに基づいて、現在過渡フレームを符号化するために第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定する。本電子機器はまた、第１の符号化モードが決定された場合、第１の符号化モードに基づいて励起を合成する。本電子機器は、さらに、第２の符号化モードが決定された場合、第２の符号化モードに基づいて励起を合成する。本電子機器はまた、励起と現在過渡フレームとに基づいて複数のスケーリング係数を決定し得る。第１の符号化モードは「有声過渡（voiced transient）」符号化モードであり得、第２の符号化モードは「他の過渡（other transient）」符号化モードであり得る。第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することは、さらに、ピッチラグと、前フレームタイプと、エネルギー比とに基づき得る。

ピーク位置のセットを決定することは、残差信号及びウィンドウ信号のサンプルの絶対値に基づいて包絡線信号を計算することと、包絡線信号と包絡線信号の時間シフトバージョンとの間の差に基づいて第１の勾配信号を計算することとを含み得る。ピーク位置のセットを決定することは、さらに、第１の勾配信号と第１の勾配信号の時間シフトバージョンとの間の差に基づいて第２の勾配信号を計算することと、第２の勾配信号値が第１の閾値を下回る位置インデックスの第１のセットを選択することとを含み得る。ピーク位置のセットを決定することはまた、包絡線値が包絡線中の最大値に対する第２の閾値を下回る位置インデックスをなくすことによって、位置インデックスの第１のセットから位置インデックスの第２のセットを決定することと、近隣位置インデックスに対する差閾値を満たさない位置インデックスをなくすことによって、位置インデックスの第２のセットから位置インデックスの第３のセットを決定することとを含み得る。

本電子機器はまた、線形予測係数のセットを取得するために、現在過渡フレームと現在過渡フレームより前の信号とを使用して線形予測分析を実行し、線形予測係数のセットに基づいて量子化線形予測係数のセットを決定し得る。残差信号を取得することは、さらに、量子化線形予測係数のセットに基づき得る。

第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することは、ピークの推定された数を決定することと、ピーク位置の数が、ピークの推定された数よりも大きいかそれに等しい場合、第１の符号化モードを選択することとを含み得る。第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することは、さらに、ピーク位置のセット中の最後のピークが現在過渡フレームの終了から第１の距離内にあり、ピーク位置のセット中の第１のピークが現在過渡フレームの開始から第２の距離内にある場合、第１の符号化モードを選択することを含み得る。第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することは、さらに、前フレームと現在過渡フレームとの間のエネルギー比が所定の範囲の外にある場合、第２の符号化モードを選択することと、前フレームのフレームタイプが無声（unvoiced）又は無音（silence）である場合、第２の符号化モードを選択することとを含み得る。第１の距離は、あるピッチラグに基づいて決定され得、第２の距離はそのピッチラグに基づいて決定され得る。

第１の符号化モードに基づいて励起を合成することは、前フレーム中の最後のピーク位置と現在過渡フレームのピッチラグとに基づいて、現在過渡フレーム中の最後のピークの位置を決定することを含み得る。第１の符号化モードに基づいて励起を合成することはまた、ピッチラグとスペクトル形状とに基づくプロトタイプ波形を使用した波形補間を使用して、前フレームの最後のサンプルと、現在過渡フレーム中の最後のピークの第１のサンプル位置との間で励起を合成することを含み得る。

第２の符号化モードに基づいて励起を合成することは、第１の位置において開始してプロトタイプ波形を繰り返し配置することによって励起を合成することを含み得る。第１の位置は、ピーク位置のセットからの第１のピーク位置に基づいて決定され得る。プロトタイプ波形はピッチラグとスペクトル形状とに基づき得、プロトタイプ波形は、ピッチラグと第１の位置とフレームサイズとに基づく回数だけ繰り返し配置され得る。

また、過渡フレームを復号するための電子機器が開示される。本電子機器は、プロセッサと、プロセッサと電子通信しているメモリに記憶された実行可能な命令とを含む。本電子機器はフレームタイプを取得し、フレームタイプが過渡フレームを示す場合、本電子機器は、過渡符号化モードパラメータを取得し、過渡符号化モードパラメータに基づいて、第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定する。フレームタイプが過渡フレームを示す場合、本電子機器はまた、第１の符号化モードを使用すべきであると決定された場合、第１の符号化モードに基づいて励起を合成し、第２の符号化モードを使用すべきであると決定された場合、第２の符号化モードに基づいて励起を合成する。本電子機器はまた、ピッチラグパラメータを取得し、ピッチラグパラメータに基づいてピッチラグを決定し得る。本電子機器はまた、複数のスケーリング係数を取得し、複数のスケーリング係数に基づいて励起をスケーリングし得る。

本電子機器はまた、量子化線形予測係数パラメータを取得し、量子化線形予測係数パラメータに基づいて量子化線形予測係数のセットを決定し得る。本電子機器はまた、励起信号と量子化線形予測係数のセットとに基づいて合成音声信号を生成し得る。

第２の符号化モードに基づいて励起を合成することは、第１のピーク位置を取得することと、第１の位置において開始してプロトタイプ波形を繰り返し配置することによって励起を合成することとを含み得る。第１の位置は第１のピーク位置に基づいて決定され得る。プロトタイプ波形はピッチラグとスペクトル形状とに基づき得、プロトタイプ波形は、ピッチラグと第１の位置とフレームサイズとに基づく回数だけ繰り返し配置され得る。

また、電子機器上で過渡フレームを符号化するための方法が開示される。本方法は、現在過渡フレームを取得することを含む。本方法はまた、現在過渡フレームに基づいて残差信号を取得することを含む。本方法は、さらに、残差信号に基づいてピーク位置のセットを決定することを含む。本方法は、さらに、少なくともピーク位置のセットに基づいて、現在過渡フレームを符号化するために第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することを含む。さらに、本方法は、第１の符号化モードが決定された場合、第１の符号化モードに基づいて励起を合成することを含む。本方法はまた、第２の符号化モードが決定された場合、第２の符号化モードに基づいて励起を合成することを含む。

また、電子機器上で過渡フレームを復号するための方法が開示される。本方法は、フレームタイプを取得することを含む。フレームタイプが過渡フレームを示す場合、本方法はまた、過渡符号化モードパラメータを取得することと、過渡符号化モードパラメータに基づいて、第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することとを含む。フレームタイプが過渡フレームを示す場合、本方法はまた、第１の符号化モードを使用すべきであると決定された場合、第１の符号化モードに基づいて励起を合成することと、第２の符号化モードを使用すべきであると決定された場合、第２の符号化モードに基づいて励起を合成することとを含む。

また、過渡フレームを符号化するためのコンピュータプログラム製品が開示される。本コンピュータプログラム製品は、命令をもつ非一時的有形コンピュータ可読媒体を含む。命令は、電子機器に、現在過渡フレームを取得させるためのコードを含む。命令はまた、電子機器に、現在過渡フレームに基づいて残差信号を取得させるためのコードを含む。命令は、さらに、電子機器に、残差信号に基づいてピーク位置のセットを決定させるためのコードを含む。命令は、さらに、電子機器に、少なくともピーク位置のセットに基づいて、現在過渡フレームを符号化するために第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定させるためのコードを含む。命令はまた、電子機器に、第１の符号化モードが決定された場合、第１の符号化モードに基づいて励起を合成させるためのコードを含む。さらに、命令は、電子機器に、第２の符号化モードが決定された場合、第２の符号化モードに基づいて励起を合成させるためのコードを含む。

また、過渡フレームを復号するためのコンピュータプログラム製品が開示される。本コンピュータプログラム製品は、命令をもつ非一時的有形コンピュータ可読媒体を含む。命令は、電子機器に、フレームタイプを取得させるためのコードを含む。フレームタイプが過渡フレームを示す場合、命令はまた、電子機器に、過渡符号化モードパラメータを取得させるためのコードと、電子機器に、過渡符号化モードパラメータに基づいて、第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定させるためのコードとを含む。フレームタイプが過渡フレームを示す場合、命令は、さらに、電子機器に、第１の符号化モードを使用すべきであると決定された場合、第１の符号化モードに基づいて励起を合成させるためのコードと、電子機器に、第２の符号化モードを使用すべきであると決定された場合、第２の符号化モードに基づいて励起を合成させるためのコードとを含む。

また、過渡フレームを符号化するための装置が開示される。本装置は、現在過渡フレームを取得するための手段を含む。本装置はまた、現在過渡フレームに基づいて残差信号を取得するための手段を含む。本装置は、さらに、残差信号に基づいてピーク位置のセットを決定するための手段を含む。さらに、本装置は、少なくともピーク位置のセットに基づいて、現在過渡フレームを符号化するために第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定するための手段を含む。本装置は、さらに、第１の符号化モードが決定された場合、第１の符号化モードに基づいて励起を合成するための手段を含む。本装置はまた、第２の符号化モードが決定された場合、第２の符号化モードに基づいて励起を合成するための手段を含む。

また、過渡フレームを復号するための装置が開示される。本装置は、フレームタイプを取得するための手段を含む。フレームタイプが過渡フレームを示す場合、本装置はまた、過渡符号化モードパラメータを取得するための手段と、過渡符号化モードパラメータに基づいて、第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定するための手段とを含む。フレームタイプが過渡フレームを示す場合、本装置は、さらに、第１の符号化モードを使用すべきであると決定された場合、第１の符号化モードに基づいて励起を合成するための手段と、第２の符号化モードを使用すべきであると決定された場合、第２の符号化モードに基づいて励起を合成するための手段とを含む。

過渡フレームを符号化するためのシステム及び方法が実施され得る、電子機器の一構成を示すブロック図。過渡フレームを符号化するための方法の一構成を示す流れ図。過渡フレームを符号化するための方法のより具体的な構成を示す流れ図。前フレームと現在過渡フレームとの一例を示すグラフ。前フレームと現在過渡フレームとの別の例を示すグラフ。過渡フレームを符号化するためのシステム及び方法が実施され得る、過渡エンコーダの一構成を示すブロック図。符号化モードを選択するための方法の一構成を示す流れ図。励起信号を合成するための方法の一構成を示す流れ図。過渡フレームを復号するためのシステム及び方法が実施され得る、過渡デコーダの一構成を示すブロック図。過渡フレームを復号するための方法の一構成を示す流れ図。励起信号を合成するための方法の一構成を示す流れ図。過渡フレームを符号化するためのシステム及び方法が実施され得る、電子機器の一例を示すブロック図。過渡フレームを復号するためのシステム及び方法が実施され得る、電子機器の一例を示すブロック図。ピッチ同期利得スケーリング及び線形予測符号化（ＬＰＣ）合成ブロック／モジュールの一構成を示すブロック図。電子機器において利用され得る様々な構成要素を示す図。ワイヤレス通信機器内に含まれ得る幾つかの構成要素を示す図。

本明細書で開示するシステム及び方法は、様々な電子機器に適用され得る。電子機器の例には、ボイスレコーダ、ビデオカメラ、オーディオプレーヤ（例えば、Moving Picture Experts Group-1（ＭＰＥＧ−１）又はＭＰＥＧ−２ＡｕｄｉｏＬａｙｅｒ３（ＭＰ３）プレーヤ）、ビデオプレーヤ、オーディオレコーダ、デスクトップコンピュータ／ラップトップコンピュータ、携帯情報端末（ＰＤＡ）、ゲームシステムなどがある。電子機器の一種は、別の機器と通信し得る通信機器である。通信機器の例には、電話、ラップトップコンピュータ、デスクトップコンピュータ、セルラーフォン、スマートフォン、ワイヤレス又はワイヤードモデム、電子リーダー、タブレットデバイス、ゲームシステム、セルラー電話基地局又はノード、アクセスポイント、ワイヤレスゲートウェイ及びワイヤレスルータがある。

電子機器又は通信機器は、国際電気通信連合（ＩＴＵ）標準及び／又は米国電気電子技術者協会（ＩＥＥＥ）標準（例えば、８０２．１１ａ、８０２．１１ｂ、８０２．１１ｇ、８０２．１１ｎ及び／又は８０２．１１ａｃなどのワイヤレスフィデリティー又は「Ｗｉ−Ｆｉ」標準）など、幾つかの業界標準に従って動作し得る。通信機器が準拠し得る標準の他の例には、ＩＥＥＥ８０２．１６（例えば、Worldwide Interoperability for Microwave Access又は「ＷｉＭＡＸ」）、Third Generation Partnership Project（３ＧＰＰ）、3GPP Long Term Evolution（ＬＴＥ）、Global System for Mobile Telecommunications（ＧＳＭ）（登録商標）などがある（通信機器は、例えば、ユーザ機器（ＵＥ）、ノードＢ、発展型ノードＢ（ｅＮＢ）、モバイル機器、移動局、加入者局、遠隔局、アクセス端末、モバイル端末、端末、端末ユーザ端末、加入者ユニットなど）と呼ばれることがある）。本明細書で開示するシステム及び方法の幾つかは１つ以上の標準に関して説明され得るが、これは、それらのシステム及び方法が多くのシステム及び／又は標準に適用可能であり得るので、本開示の範囲を限定すべきではない。

幾つかの通信機器は、ワイヤレス通信し得、及び／又はワイヤード接続もしくはリンクを使用して通信し得ることに留意されたい。例えば、幾つかの通信機器は、イーサネット（登録商標）プロトコルを使用して他の機器と通信し得る。本明細書で開示するシステム及び方法は、ワイヤレス通信し、及び／又はワイヤード接続もしくはリンクを使用して通信する通信機器に適用され得る。一構成では、本明細書で開示するシステム及び方法は、衛星を使用して別の機器と通信する通信機器に適用され得る。

本明細書で開示するシステム及び方法は、以下のように説明する通信システムの一例に適用され得る。この例では、本明細書で開示するシステム及び方法は、ジオモバイル衛星エアインターフェース（ＧＭＳＡ：geo-mobile satellite air interface）衛星通信のための低ビットレート（例えば、２キロビット毎秒（Ｋｂｐｓ））音声符号化を行い得る。より詳細には、本明細書で開示するシステム及び方法は、統合された衛星及びモバイル通信ネットワークにおいて使用され得る。そのようなネットワークは、シームレスで、透過的で、相互運用可能で、ユビキタスなワイヤレスカバレージを提供し得る。衛星ベースのサービスは、地上カバレージが利用不可能である遠隔位置における通信のために使用され得る。例えば、そのようなサービスは、人工又は自然災害、ブロードキャスト及び／又はフリート管理及びアセット追跡（asset tracking）に有用であり得る。Ｌ及び／又はＳバンド（ワイヤレス）スペクトルが使用され得る。

一構成では、順方向リンクは、オーバージエア衛星リンクのための基礎技術として1x Evolution Data Optimized (EV-DO) Rev Aエアインターフェースを使用し得る。逆方向リンクは周波数分割多重（ＦＤＭ）を使用し得る。例えば、逆方向リンクスペクトルの１．２５メガヘルツ（ＭＨｚ）ブロックは１９２個の狭帯域周波数チャネルに分割され、各々は６．４キロヘルツ（ｋＨｚ）の帯域幅をもち得る。逆方向リンクデータレートは制限され得る。これは、低ビットレート符号化の必要性を提示し得る。場合によっては、例えば、１つのチャネルが２．４Ｋｂｐｓしかサポートできないことがある。但し、より良いチャネル状態では、２つのＦＤＭチャネルが利用可能になり、場合によっては４．８Ｋｂｐｓ送信を提供し得る。

逆方向リンク上では、例えば、低ビットレート音声エンコーダが使用され得る。これにより、逆方向リンク上でシングルＦＤＭチャネル割当てのためのアクティブ音声のために２Ｋｂｐｓの固定レートが可能になり得る。一構成では、逆方向リンクは、基本チャネル符号化のために１／４畳み込みコーダを使用する。

幾つかの構成では、本明細書で開示するシステム及び方法は、他の符号化モードへの追加又は代替として使用され得る。例えば、本明細書で開示するシステム及び方法は、プロトタイプピッチ周期波形補間を使用した１／４レート有声符号化への追加又は代替として使用され得る。プロトタイプピッチ周期波形補間（ＰＰＰＷＩ：prototype pitch-period waveform interpolation）では、実際の波形の代わりに使用され得る補間波形を生成するためにプロトタイプ波形が使用されて、再構成された信号が、低減された数のサンプルによって生成されることが可能になり得る。ＰＰＰＷＩは、例えば、フルレート又は１／４レートにおいて利用可能であり得、及び／又は時間同期出力を生成し得る。さらに、ＰＰＰＷＩでは周波数領域において量子化が実行され得る。有声符号化モードでは、（例えば、ＦＱＱ（有効ハーフレート）の代わりに）ＱＱＱが使用され得る。ＱＱＱは、４０ビット毎フレームで１／４レートプロトタイプピッチ周期波形補間（ＱＰＰＰ−ＷＩ：quarter-rate prototype pitch period waveform interpolation）を使用して３つの連続する有声フレームを符号化する符号化パターンである（事実上２キロビット毎秒（ｋｂｐｓ））。ＦＱＱは、３つの連続する有声フレームが、それぞれフルレートＰＰＰ、ＱＰＰＰ及びＱＰＰＰを使用して符号化される符号化パターンである。これは４ｋｂｐｓの平均レートを達成する。後者は、２ｋｂｐｓボコーダにおいて使用され得ない。１／４レートプロトタイプピッチ周期（ＱＰＰＰ）は、周波数領域におけるプロトタイプ表現の振幅のデルタ符号化なしに、１３ビット線スペクトル周波数（ＬＳＦ：line spectral frequency）量子化を用いて、修正された様式で使用され得ることに留意されたい。一構成では、ＱＰＰＰは、ＬＳＦのための１３ビットと、プロトタイプ波形振幅のための１２ビットと、プロトタイプ波形電力のための６ビットと、ピッチラグのための７ビットと、モードのための２ビットとを使用し、合計４０ビットになり得る。

特に、本明細書で開示するシステム及び方法は、（ＱＰＰＰのために必要なシードを与え得る）過渡符号化モードのために使用され得る。（例えば、２Ｋｂｐｓボコーダにおける）この過渡符号化モードは、アップ過渡と、ダウン過渡と、有声過渡とを符号化するための統合モデルを使用し得る。

本明細書で開示するシステム及び方法は、１つ以上の過渡オーディオ又は音声フレームを符号化することについて説明する。一構成では、本明細書で開示するシステム及び方法は、残差信号中のピークの分析と、励起中のピークの配置のための好適な符号化モデルの決定と、合成励起の線形予測符号化（ＬＰＣ）フィルタ処理とを使用し得る。

音声信号中の過渡フレームを極低ビットレートで符号化することが音声符号化における１つの課題である。過渡フレームは、一般に、新しい音声イベントの開始又は終了をマークし得る。そのようなフレームは、無声音声と有声音声との接合において生じる。時々、過渡フレームは、破裂音及び他の短い音声イベントを含み得る。従って、過渡フレーム中の音声信号は非定常であり得、それにより、従来の符号化方法は、そのようなフレームを符号化している間に不満足に実行される。例えば、多くの従来の手法は、標準有声フレームのために使用される過渡フレームを符号化するために同じ方法を使用する。これは過渡フレームの符号化を非効率的にさせ得る。本明細書で開示するシステム及び方法は過渡フレームの符号化を改善し得る。

次に、図を参照しながら様々な構成について説明する。同様の参照番号は機能的に同様の要素を示し得る。本明細書で概して説明し、図に示すシステム及び方法は、多種多様な異なる構成で構成及び設計され得る。従って、図に表される幾つかの構成についての以下のより詳細な説明は、請求する範囲を限定するものではなく、システム及び方法を代表するものにすぎない。

図１は、過渡フレームを符号化するためのシステム及び方法が実装され得る、電子機器１０２の一構成を示すブロック図である。追加又は代替として、過渡フレームを復号するためのシステム及び方法は電子機器１０２中に実装され得る。電子機器Ａ１０２は過渡エンコーダ１０４を含み得る。過渡エンコーダ１０４の一例は線形予測符号化（ＬＰＣ）エンコーダである。過渡エンコーダ１０４は、電子機器Ａ１０２によって音声（又はオーディオ）信号１０６を符号化するために使用され得る。例えば、過渡エンコーダ１０４は、音声信号１０６を合成するために使用され得るパラメータのセット（集合）を推定又は生成することによって音声信号１０６の過渡フレームを「圧縮された」フォーマットに符号化する。一構成では、そのようなパラメータは、音声信号１０６を合成するために使用され得るピッチ（例えば、周波数）、振幅及びホルマント（例えば、共振）の推定値を表し得る。

電子機器Ａ１０２は音声信号１０６を取得し得る。一構成では、電子機器Ａ１０２は、マイクロフォンを使用して音響信号を捕捉及び／又はサンプリングすることによって音声信号１０６を取得する。別の構成では、電子機器Ａ１０２は、別の機器（例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）ヘッドセット、ユニバーサルシリアルバス（ＵＳＢ）ドライブ、セキュアデジタル（ＳＤ）カード、ネットワークインターフェース、ワイヤレスマイクロフォンなど）から音声信号１０６を受信する。音声信号１０６はフレーミングブロック／モジュール１０８に与えられ得る。本明細書で使用する「ブロック／モジュール」という用語は、特定の要素がハードウェア、ソフトウェア又は両方の組合せに実装され得ることを示すために使用され得る。

電子機器Ａ１０２は、フレーミングブロック／モジュール１０８を使用して音声信号１０６を１つ以上のフレーム１１０（例えば、フレーム１１０のシーケンス）にセグメント化し得る。例えば、フレーム１１０は、特定の数の音声信号１０６サンプルを含み、及び／又は音声信号１０６のある時間量（例えば、１０〜２０ミリ秒）を含み得る。音声信号１０６がフレーム１１０にセグメント化されるとき、フレーム１１０は、それらが含んでいる信号に従って分類され得る。例えば、フレーム１１０は、フレームタイプ決定ブロック／モジュール１２４に与えられ得、フレームタイプ決定ブロック／モジュール１２４は、フレーム１１０が有声フレームであるか、無声フレームであるか、無音フレームであるか、過渡フレームであるかを決定し得る。一構成では、本明細書で開示するシステム及び方法は、過渡フレームを符号化するために使用され得る。

過渡フレームは、例えば、ある音声クラスと別の音声クラスとの間の境界上に位置し得る。例えば、音声信号１０６は、無声音（例えば、ｆ、ｓ、ｓｈ、ｔｈなど）から有声音（例えば、ａ、ｅ、ｉ、ｏ、ｕなど）に遷移し得る。幾つかの過渡タイプは、（例えば、音声信号１０６の無声部分から有声部分に遷移するときの）アップ過渡、破裂音、有声過渡（例えば、線形予測符号化（ＬＰＣ）変更及びピッチラグ変動）、及び（例えば、単語の末尾など、音声信号１０６の有声部分から無声又は無音部分に遷移するときの）ダウン過渡を含む。２つの音声クラスの中間のフレーム１１０は過渡フレームであり得る。その上、過渡フレームは、さらに有声過渡フレーム又は他の過渡フレームとして分類され得る。本明細書で開示するシステム及び方法は過渡フレームに有利に適用され得る。

フレームタイプ決定ブロック／モジュール１２４は、フレームタイプ１２６をエンコーダ選択ブロック／モジュール１３０と符号化モード決定ブロック／モジュール１８４とに与え得る。追加又は代替として、フレームタイプ１２６は、別の機器（例えば、電子機器Ｂ１６８）への送信のために送信（ＴＸ）及び／又は受信（ＲＸ）ブロック／モジュール１６０に与えられ得、及び／又はデコーダ１６２に与えられ得る。エンコーダ選択ブロック／モジュール１３０は、フレーム１１０を符号化するためのエンコーダを選択し得る。例えば、フレーム１１０が過渡的であることをフレームタイプ１２６が示す場合、エンコーダ選択ブロック／モジュール１３０は過渡フレーム１３４を過渡エンコーダ１０４に与え得る。しかしながら、フレーム１１０が、過渡的でない別の種類のフレーム１３６であることをフレームタイプ１２６が示す場合（例えば、有声、無声、無音など）、エンコーダ選択ブロック／モジュール１３０はその別のフレーム１３６を別のエンコーダ１４０に与え得る。従って、エンコーダ選択ブロック／モジュール１３０は、過渡フレーム１３４及び／又は別のフレーム１３６のシーケンスを生成し得ることに留意されたい。従って、エンコーダ選択ブロック／モジュール１３０によって、現在過渡フレーム１３４に加えて１つ以上の前フレーム１３４、１３６が与えられ得る。一構成では、電子機器Ａ１０２は１つ以上の他のエンコーダ１４０を含み得る。これらの他のエンコーダに関するさらなる詳細を以下に与える。

過渡エンコーダ１０４は、過渡フレーム１３４に対して線形予測分析（例えば、ＬＰＣ分析）を実行するための線形予測符号化（ＬＰＣ）分析ブロック／モジュール１２２を使用し得る。ＬＰＣ分析ブロック／モジュール１２２は、追加又は代替として、前フレーム１１０からの１つ以上のサンプルを使用し得ることに留意されたい。例えば、前フレーム１１０が過渡フレーム１３４である場合、ＬＰＣ分析ブロック／モジュール１２２は、前過渡フレーム１３４からの１つ以上のサンプルを使用し得る。さらに、前フレーム１１０が別の種類のフレーム１３６である場合（例えば、有声、無声、無音など）、ＬＰＣ分析ブロック／モジュール１２２は、他の前フレーム１３６からの１つ以上のサンプルを使用し得る。

ＬＰＣ分析ブロック／モジュール１２２は１つ以上のＬＰＣ係数１２０を生成し得る。ＬＰＣ係数１２０の例には、線スペクトル周波数（ＬＳＦ）及び線スペクトル対（ＬＳＰ：line spectral pair）がある。ＬＰＣ係数１２０は量子化ブロック／モジュール１１８に与えられ得、量子化ブロック／モジュール１１８は１つ以上の量子化ＬＰＣ係数１１６を生成し得る。量子化ＬＰＣ係数１１６と、１つ以上の過渡フレーム１３４からの１つ以上のサンプルとは、残差信号１１４を決定するために使用され得る、残差決定ブロック／モジュール１１２に与えられ得る。例えば、残差信号１１４は、音声信号１０６から除去されたホルマント又はホルマントの影響（例えば、係数）を有していた音声信号１０６の過渡フレーム１３４を含み得る。残差信号１１４はピーク探索ブロック／モジュール１２８に与えられ得る。

ピーク探索ブロック／モジュール１２８は残差信号１１４中のピークを探索し得る。言い換えれば、過渡エンコーダ１０４は、残差信号１１４中のピーク（例えば、高いエネルギーの領域）を探索し得る。これらのピークは識別されて、１つ以上のピーク位置を含むピーク１３２のリスト又はセットが取得され得る。ピーク１３２のリスト又はセット中のピーク位置は、例えば、サンプル数及び／又は時間に関して指定され得る。ピーク１３２のリスト又はセットを取得することに関するさらなる詳細を以下に与える。

ピーク１３２のセットは、符号化モード決定ブロック／モジュール１８４、ピッチラグ決定ブロック／モジュール１３８及び／又はスケール係数決定ブロック／モジュール１５２に与えられ得る。ピッチラグ決定ブロック／モジュール１３８は、ピーク１３２のセットを使用してピッチラグ１４２を決定し得る。「ピッチラグ」は、過渡フレーム１３４中の２つの連続するピッチスパイク間の「距離」であり得る。ピッチラグ１４２は、例えば、サンプルの数及び／又は時間量において指定され得る。幾つかの構成では、ピッチラグ決定ブロック／モジュール１３８は、ピーク１３２のセット又は（ピーク１３２間の距離であり得る）ピッチラグ候補のセットを使用してピッチラグ１４２を決定し得る。例えば、ピッチラグ決定ブロック／モジュール１３８は、候補のセットからピッチラグ１４２を決定するために平均化又は平滑化アルゴリズムを使用し得る。他の手法も使用され得る。ピッチラグ決定ブロック／モジュール１３８によって決定されたピッチラグ１４２は、符号化モード決定ブロック／モジュール１８４、励起合成ブロック／モジュール１４８及び／又はスケール係数決定ブロック／モジュール１５２に与えられ得る。

符号化モード決定ブロック／モジュール１８４は、過渡フレーム１３４のための符号化モード（インジケータ又はパラメータ）１８６を決定し得る。一構成では、符号化モード決定ブロック／モジュール１８４は、過渡フレーム１３４のために第１の符号化モードを使用すべきか過渡フレーム１３４のために第２の符号化モードを使用すべきかを決定し得る。例えば、符号化モード決定ブロック／モジュール１８４は、過渡フレーム１３４が有声過渡フレームであるか他の過渡フレームであるかを決定し得る。符号化モード決定ブロック／モジュール１８４は、この決定を行うために１つ以上の種類の情報を使用し得る。例えば、符号化モード決定ブロック／モジュール１８４は、この決定を行うために、ピーク１３２のセット、ピッチラグ１４２、エネルギー比１８２、フレームタイプ１２６及び／又は他の情報を使用し得る。エネルギー比１８２は、エネルギー比決定ブロック／モジュール１８０によって前フレームと現在過渡フレーム１３４との間のエネルギー比に基づいて決定され得る。前フレームは、過渡フレーム１３４又は別の種類のフレーム１３６（例えば、無音、有声、無声など）であり得る。従って、過渡エンコーダブロック／モジュール１０４は過渡フレーム１３４中の重要な領域を識別し得る。これらの領域は、過渡フレーム１３４があまり一様及び／又は定常でないことがあるので、識別され得ることに留意されたい。概して、過渡エンコーダ１０４は、残差信号１１４中のピーク１３２のセットを識別し、これらのピーク１３２を使用して符号化モード１８６を決定し得る。次いで、選択された符号化モード１８６が使用されて過渡フレーム１３４中の音声信号が「符号化」又は「合成」され得る。

符号化モード決定ブロック／モジュール１８４は、過渡フレーム１３４のための選択された符号化モード１８６を示す符号化モード１８６を生成し得る。例えば、符号化モード１８６は、現在過渡フレームが「有声過渡」フレームである場合は第１の符号化モードを示し得、又は現在過渡フレームが「他の過渡」フレームである場合は第２の符号化モードを示し得る。符号化モード１８６は、励起合成ブロック／モジュール１４８に、ストレージに、（ローカル）デコーダ１６２に及び／又は遠隔デコーダ１７４に送られ（例えば、与えられ）得る。例えば、符号化モード１８６はＴＸ／ＲＸブロック／モジュール１６０に与えられ得、ＴＸ／ＲＸブロック／モジュール１６０は符号化モード１８６をフォーマットし、電子機器Ｂ１６８に送り得、そこで符号化モード１８６はデコーダ１７４に与えられ得る。

励起合成ブロック／モジュール１４８は、符号化モード１８６と、ピッチラグ１４２と、プロトタイプ波形生成ブロック／モジュール１４４によって与えられるプロトタイプ波形１４６とに基づいて励起１５０を生成又は合成し得る。プロトタイプ波形生成ブロック／モジュール１４４は、スペクトル形状及び／又はピッチラグ１４２に基づいてプロトタイプ波形１４６を生成し得る。励起１５０、ピーク１３２のセット、ピッチラグ１４２及び／又は量子化ＬＰＣ係数１１６はスケール係数決定ブロック／モジュール１５２に与えられ得、スケール係数決定ブロック／モジュール１５２は、励起１５０、ピーク１３２のセット、ピッチラグ１４２及び／又は量子化ＬＰＣ係数１１６に基づいて利得（例えば、スケーリング係数）１５４のセットを生成し得る。利得１５４のセットは利得量子化ブロック／モジュール１５６に与えられ得、利得量子化ブロック／モジュール１５６は、利得１５４のセットを量子化して量子化利得１５８のセットを生成する。

一構成では、過渡フレームは、復号音声信号を生成するために、ピッチラグ１４２、量子化ＬＰＣ係数１１６、量子化利得１５８、フレームタイプ１２６及び／又は符号化モード１８６を使用して復号され得る。ピッチラグ１４２、量子化ＬＰＣ係数１１６、量子化利得１５８、フレームタイプ１２６及び／又は符号化モード１８６は、別の機器に送信され、記憶及び／又は復号され得る。

一構成では、電子機器Ａ１０２は送信（ＴＸ）及び／又は受信（ＲＸ）ブロック／モジュール１６０を含み得る。現在フレーム１１０が過渡フレーム１３４でないが、何らかの他の種類のフレーム１３６である場合、フレーム１３６を符号化するために別のエンコーダ１４０（例えば、無音エンコーダ、１／４レートプロトタイプピッチ周期（ＱＰＰＰ）エンコーダ、雑音励起線形予測（ＮＥＬＰ：noise excited linear prediction）エンコーダなど）が使用され得る。他のエンコーダ１４０は、符号化非一時的音声信号１７８を生成し得、それはＴＸ／ＲＸブロック／モジュール１６０に与えられ得る。フレームタイプ１２６もＴＸ／ＲＸブロック／モジュール１６０に与えられ得る。ＴＸ／ＲＸブロック／モジュール１６０は、電子機器Ｂ１６８など、別の機器への送信のために、符号化非一時的音声信号１７８とフレームタイプ１２６とを１つ以上のメッセージ１６６中にフォーマットし得る。１つ以上のメッセージ１６６は、ワイヤレス及び／又はワイヤード接続又はリンクを使用して送信され得る。幾つかの構成では、１つ以上のメッセージ１６６は、衛星、基地局、ルータ、スイッチ及び／又は他の機器もしくは媒体によって電子機器Ｂ１６８に中継され得る。電子機器Ｂ１６８は、ＴＸ／ＲＸブロック／モジュール１７０を使用して１つ以上のメッセージ１６６を受信し、１つ以上のメッセージ１６６をデフォーマットして音声信号情報１７２を生成し得る。例えば、ＴＸ／ＲＸブロック／モジュール１７０は、１つ以上のメッセージ１６６を復調し、復号し（デコーダ１７４によって行われる音声信号復号と混同されるべきでない）、及び／又は他の方法でデフォーマットし得る。現在フレームが過渡フレーム１３４でない場合、音声信号情報１７２は、符号化非一時的音声信号とフレームタイプパラメータとを含み得る。

電子機器Ｂ１６８はデコーダ１７４を含み得る。デコーダ１７４は、無音フレーム用のデコーダ（例えば、無音デコーダ）、無声フレーム用のデコーダ（例えば、雑音励起線形予測（ＮＥＬＰ）デコーダ）、過渡デコーダ及び／又は有声フレーム用のデコーダ（例えば、１／４レートプロトタイプピッチ周期（ＱＰＰＰ）デコーダ）など、１つ以上のタイプのデコーダを含み得る。音声信号情報１７２中のフレームタイプパラメータが使用されて、（デコーダ１７４中に含まれる）どのデコーダを使用すべきかが決定され得る。現在フレーム１１０が過渡フレーム１３４でない場合、デコーダ１７４は、符号化非一時的音声信号を復号して復号音声信号１７６を生成し得、その復号音声信号１７６は、（例えば、スピーカーを使用して）出力され、メモリに記憶され、及び／又は別の機器（例えば、Ｂｌｕｅｔｏｏｔｈヘッドセットなど）に送信され得る。

一構成では、電子機器Ａ１０２はデコーダ１６２を含み得る。現在フレーム１１０が過渡フレーム１３４でないが、何らかの他の種類のフレーム１３６である場合、別のエンコーダ１４０は、符号化非一時的音声信号１７８を生成し得、その非一時的音声信号１７８はデコーダ１６２に与えられ得る。フレームタイプ１２６もデコーダ１６２に与えられ得る。デコーダ１６２は、無音フレーム用のデコーダ（例えば、無音デコーダ）、無声フレーム用のデコーダ（例えば、雑音励起線形予測（ＮＥＬＰ）デコーダ）、過渡デコーダ及び／又は有声フレーム用のデコーダ（例えば、１／４レートプロトタイプピッチ周期（ＱＰＰＰ）デコーダ）など、１つ以上のタイプのデコーダを含み得る。フレームタイプ１２６が使用されて、（デコーダ１６２中に含まれる）どのデコーダを使用すべきかが決定され得る。現在フレーム１１０が過渡フレーム１３４でない場合、デコーダ１６２は、符号化非一時的音声信号１７８を復号して復号音声信号１６４を生成し得、その復号音声信号１６４は、（例えば、スピーカーを使用して）出力され、メモリに記憶され、及び／又は別の機器（例えば、Ｂｌｕｅｔｏｏｔｈヘッドセットなど）に送信され得る。

電子機器Ａ１０２がＴＸ／ＲＸブロック／モジュール１６０を含む構成では、現在フレーム１１０が過渡フレーム１３４である場合、幾つかのパラメータがＴＸ／ＲＸブロック／モジュール１６０に与えられ得る。例えば、ピッチラグ１４２、量子化ＬＰＣ係数１１６、量子化利得１５８、フレームタイプ１２６及び／又は符号化モード１８６がＴＸ／ＲＸブロック／モジュール１６０に与えられ得る。ＴＸ／ＲＸブロック／モジュール１６０は、ピッチラグ１４２、量子化ＬＰＣ係数１１６、量子化利得１５８、フレームタイプ１２６及び／又は符号化モード１８６を送信に好適なフォーマットにフォーマットし得る。例えば、ＴＸ／ＲＸブロック／モジュール１６０は、１つ以上のメッセージ１６６として、ピッチラグ１４２、量子化ＬＰＣ係数１１６、量子化利得１５８、フレームタイプ１２６及び／又は符号化モード１８６を符号化し（過渡エンコーダ１０４によって行われる過渡フレーム符号化と混同されるべきでない）、変調し、スケーリング（例えば、増幅）し、及び／又は他の方法でフォーマットし得る。ＴＸ／ＲＸブロック／モジュール１６０は、１つ以上のメッセージ１６６を、電子機器Ｂ１６８など、別の機器に送信し得る。１つ以上のメッセージ１６６は、ワイヤレス及び／又はワイヤード接続又はリンクを使用して送信され得る。幾つかの構成では、１つ以上のメッセージ１６６は、衛星、基地局、ルータ、スイッチ及び／又は他の機器若しくは媒体によって電子機器Ｂ１６８に中継され得る。

電子機器Ｂ１６８は、ＴＸ／ＲＸブロック／モジュール１７０を使用して、電子機器Ａ１０２によって送信された１つ以上のメッセージ１６６を受信し得る。ＴＸ／ＲＸブロック／モジュール１７０は、１つ以上の受信されたメッセージ１６６をチャネル復号し（音声信号復号と混同されるべきでない）、復調し、及び／又は他の方法でデフォーマットして音声信号情報１７２を生成し得る。現在フレームが過渡フレームである場合、音声信号情報１７２は、例えば、ピッチラグ、量子化ＬＰＣ係数、量子化利得、フレームタイプパラメータ及び／又は符号化モードパラメータを備え得る。音声信号情報１７２はデコーダ１７４（例えば、ＬＰＣデコーダ）に与えられ得、デコーダ１７４は、復号（又は合成）された音声信号１７６を生成（例えば、復号）し得る。復号音声信号１７６は、トランスデューサ（例えば、スピーカー）を使用して音響信号（例えば、出力）に変換され、メモリに記憶され、及び／又は別の機器（例えば、Ｂｌｕｅｔｏｏｔｈヘッドセット）に送信され得る。

別の構成では、ピッチラグ１４２、量子化ＬＰＣ係数１１６、量子化利得１５８、フレームタイプ１２６及び／又は符号化モード１８６は（電子機器Ａ１０２上の）デコーダ１６２に与えられ得る。デコーダ１６２は、ピッチラグ１４２、量子化ＬＰＣ係数１１６、量子化利得１５８、フレームタイプ１２６及び／又は符号化モード１８６を使用して復号音声信号１６４を生成し得る。復号音声信号１６４は、例えば、スピーカーを使用して出力され、メモリに記憶され、及び／又は別の機器に送信され得る。例えば、電子機器Ａ１０２は、音声信号１０６を符号化し、メモリに記憶するデジタルボイスレコーダであり得、その音声信号１０６は、次いで、復号音声信号１６４を生成するために復号され得る。復号音声信号１６４は、次いで、トランスデューサ（例えば、スピーカー）を使用して音響信号（例えば、出力）に変換され得る。電子機器Ａ１０２上のデコーダ１６２と、電子機器Ｂ１６８上のデコーダ１７４とは同様の機能を実行し得る。

幾つかの点に留意されたい。電子機器Ａ１０２中に含まれるものとして示すデコーダ１６２は、構成に応じて、含まれる及び／又は使用されることがあってもなくてもよい。さらに、電子機器Ｂ１６８は、電子機器Ａ１０２と併せて使用されても、使用されなくてもよい。さらに、情報１８６、１４２、１１６、１５８、１２６の幾つかのパラメータ又は種類がＴＸ／ＲＸブロック／モジュール１６０及び／又はデコーダ１６２に与えられるものとして示されているが、情報１８６、１４２、１１６、１５８、１２６のこれらのパラメータ又は種類は、ＴＸ／ＲＸブロック／モジュール１６０及び／又はデコーダ１６２に送られる前にメモリに記憶されても、記憶されなくてもよい。

図２は、過渡フレームを符号化するための方法２００の一構成を示す流れ図である。例えば、電子機器１０２が、音声信号１０６の過渡フレーム１３４を符号化するために、図２に示す方法２００を実行し得る。電子機器１０２は、２０２において、現在過渡フレーム１３４を取得する。一構成では、電子機器１０２は、マイクロフォンを使用して音響音声信号をキャプチャすることによって電子音声信号１０６を取得し得る。追加又は代替として、電子機器１０２は、別の機器から音声信号１０６を受信し得る。電子機器１０２は、次いで、音声信号１０６を１つ以上のフレーム１１０にセグメント化し得る。フレーム１１０の一例は、音声信号１０６の一定数のサンプル又は所与の時間量（例えば、１０〜２０ミリ秒）を含み得る。電子機器１０２は、２０２において、例えば、現在フレーム１１０が過渡フレーム１３４であると電子機器１０２が決定したとき、現在過渡フレーム１３４を取得し得る。これは、例えば、フレームタイプ決定ブロック／モジュール１２４を使用して行われ得る。

電子機器１０２は、２０４において、現在過渡フレーム１３４に基づいて残差信号１１４を取得する。例えば、電子機器１０２は、２０２において残差信号１１４を取得するために、現在過渡フレーム１３４からＬＰＣ係数１１６（例えば、ホルマント）の影響を除去し得る。

電子機器１０２は、２０６において、残差信号１１４に基づいてピーク位置１３２のセットを決定する。例えば、電子機器１０２は、２０６においてピーク位置１３２のセットを決定するためにＬＰＣ残差信号１１４を探索し得る。ピーク位置は、例えば、時間及び／又はサンプル数に関して記述され得る。

電子機器１０２は、２０８において、現在過渡フレーム１３４を符号化するために第１の符号化モード（例えば、「符号化モードＡ」）を使用すべきか第２の符号化モード（例えば、「符号化モードＢ」）を使用すべきかを決定する。この決定は、例えば、ピーク位置１３２のセット、ピッチラグ１４２、前フレームタイプ１２６（例えば、有声、無声、無音、過渡）及び／又は（過渡フレーム１３４若しくは他のフレーム１３６であり得る）前フレーム１１０と現在過渡フレーム１３４との間のエネルギー比１８２に基づき得る。一構成では、第１の符号化モードは有声過渡符号化モードであり得、第２の符号化モードは「他の過渡」符号化モードであり得る。

２０８において、第１の符号化モード（例えば、符号化モードＡ）が決定又は選択された場合、電子機器１０２は、２１０において、現在過渡フレーム１３４のための第１の符号化モード（例えば、符号化モードＡ）に基づいて励起１５０を合成する。言い換えれば、電子機器１０２は、２１０において、選択された符号化モードに応じて励起１５０を合成し得る。

２０８において、第２の符号化モード（例えば、符号化モードＢ）が決定又は選択された場合、電子機器１０２は、２１２において、現在過渡フレーム１３４のための第２の符号化モード（例えば、符号化モードＢ）に基づいて励起１５０を合成する。言い換えれば、電子機器１０２は、２１２において、選択された符号化モードに応じて励起１５０を合成し得る。電子機器１０２は、２１４において、合成励起１５０及び／又は（現在）過渡フレーム１３４に基づいて複数のスケーリング係数（例えば、利得）１５４を決定する。２１４において、スケーリング係数１５４は、選択された過渡符号化モードに関係なく決定され得ることに留意されたい。

図３は、過渡フレームを符号化するための方法３００のより具体的な構成を示す流れ図である。例えば、電子機器１０２が、音声信号１０６の過渡フレーム１３４を符号化するために、図３に示す方法３００を実行し得る。電子機器１０２は、３０２において、現在過渡フレーム１３４を取得する。一構成では、電子機器１０２は、マイクロフォンを使用して音響音声信号を捕捉することによって電子音声信号１０６を取得し得る。追加又は代替として、電子機器１０２は、別の機器から音声信号１０６を受信し得る。電子機器１０２は、次いで、音声信号１０６を１つ以上のフレーム１１０にセグメント化し得る。フレーム１１０の一例は、音声信号１０６の一定数のサンプル又は所与の時間量（例えば、１０〜２０ミリ秒）を含み得る。電子機器１０２は、３０２において、例えば、現在フレーム１１０が過渡フレーム１３４であると電子機器１０２が決定したとき、現在過渡フレーム１３４を取得し得る。これは、例えば、フレームタイプ決定ブロック／モジュール１２４を使用して行われ得る。

電子機器１０２は、３０４において、線形予測（例えば、ＬＰＣ）係数１２０のセットを取得するために、現在過渡フレーム１３４と現在過渡フレーム１３４より前の信号とを使用して線形予測分析を実行する。例えば、電子機器１０２は、ルックアヘッドバッファと、現在過渡フレーム１３４より前の音声信号１０６の少なくとも１つのサンプルを含んでいるバッファとを使用して、ＬＰＣ係数１２０を取得し得る。

電子機器１０２は、３０６において、ＬＰＣ係数１２０のセットに基づいて量子化線形予測（例えば、ＬＰＣ）係数１１６のセットを決定する。例えば、電子機器１０２は、３０６において量子化ＬＰＣ係数１１６のセットを決定するために、ＬＰＣ係数１２０のセットを量子化する。

電子機器１０２は、３０８において、現在過渡フレーム１３４と量子化ＬＰＣ係数１１６とに基づいて残差信号１１４を取得する。例えば、電子機器１０２は、３０８において残差信号１１４を取得するために、現在過渡フレーム１３４からＬＰＣ係数１１６（例えば、ホルマント）の影響を除去し得る。

電子機器１０２は、３１０において、残差信号１１４に基づいてピーク位置１３２のセットを決定する。例えば、電子機器１０２は、ピーク位置１３２のセットを決定するためにＬＰＣ残差信号１１４を探索し得る。ピーク位置は、例えば、時間及び／又はサンプル数に関して記述され得る。

一構成では、電子機器１０２は、３１０において、以下のようにピーク位置のセットを決定し得る。電子機器１０２は、（ＬＰＣ）残差信号１１４と所定のウィンドウ信号とのサンプルの絶対値に基づいて包絡線信号を計算し得る。電子機器１０２は、次いで、包絡線信号と包絡線信号の時間シフトバージョンとの間の差に基づいて第１の勾配信号を計算し得る。電子機器１０２は、第１の勾配信号と第１の勾配信号の時間シフトバージョンとの間の差に基づいて第２の勾配信号を計算し得る。電子機器１０２は、次いで、第２の勾配信号値が所定の負の（第１の）閾値を下回る位置インデックスの第１のセットを選択し得る。電子機器１０２はまた、包絡線値が包絡線中の最大値に対する所定の（第２の）閾値を下回る位置インデックスをなくすことによって、位置インデックスの第１のセットから位置インデックスの第２のセットを決定し得る。例えば、所与のピーク位置における包絡線値が包絡線中の最大値の１０％を下回る場合、そのピーク位置はリストからなくされる。さらに、電子機器１０２は、近隣位置インデックスに対する所定の差閾値でない位置インデックスをなくすことによって、位置インデックスの第２のセットから位置インデックスの第３のセットを決定し得る。差閾値の一例は、推定されたピッチラグ値である。言い換えれば、２つのピークがｐｉｔｃｈ＿ｌａｇ±デルタ内にない場合、包絡線値がより小さいピークがなくされる。位置インデックス（例えば、第１、第２及び／又は第３のセット）は、ピークの決定されたセットの位置に対応し得る。

電子機器１０２は、３１２において、現在過渡フレーム１３４を符号化するために第１の符号化モード（例えば、「符号化モードＡ」）を使用すべきか第２の符号化モード（例えば、「符号化モードＢ」）を使用すべきかを決定する。この決定は、例えば、ピーク位置１３２のセット、ピッチラグ１４２、前フレームタイプ１２６（例えば、有声、無声、無音、過渡）及び／又は（過渡フレーム１３４若しくは他のフレーム１３６であり得る）前フレーム１１０と現在過渡フレーム１３４との間のエネルギー比１８２に基づき得る。

一構成では、電子機器１０２は、３１２において、第１の符号化モード（例えば、符号化モードＡ）を使用すべきか第２の符号化モード（例えば、符号化モードＢ）を使用すべきかを以下のように決定し得る。電子機器１０２は、式（１）に従ってピークの推定された数（例えば、「Ｐ_est」）を決定し得る。

式（１）において、「フレームサイズ」は、（例えば、サンプル数又は時間量単位の）現在過渡フレーム１３４のサイズである。「ピッチラグ」は、（例えば、サンプル数又は時間量単位の）現在過渡フレーム１３４のための推定されたピッチラグ１４２の値である。

電子機器１０２は、ピーク位置１３２の数がＰ_estよりも大きいかそれに等しい場合、第１の符号化モード（例えば、符号化モードＡ）を選択し得る。さらに、電子機器１０２は、ピーク位置１３２のセット中の最後のピークが現在過渡フレーム１３４の終了から（第１の）距離ｄ₁内にあり、ピーク位置１３２のセット中の第１のピークが現在過渡フレーム１３４の開始から（第２の）距離ｄ₂内にある場合、第１の符号化モード（例えば、符号化モードＡ）を選択し得る。ｄ₁とｄ₂の両方はピッチラグ１４２に基づいて決定され得る。ｄ₁とｄ₂との一例はピッチラグ１４２である（例えば、ｄ₁＝ｄ₂＝ｐｉｔｃｈ＿ｌａｇ）。音声信号１０６の（過渡フレーム１３４又は他のフレーム１３６であり得る）前フレーム１１０と現在過渡フレーム１３４との間のエネルギー比１８２が所定の範囲の外にある場合、第２の符号化モード（例えば、符号化モードＢ）が選択され得る。例えば、エネルギー比１８２は、前フレームの音声／残差のエネルギーを計算し、現在フレームの音声／残差のエネルギーを計算し、これらの２つのエネルギー値の比を取ることによって決定され得る。例えば、範囲は、０．００００１≦ｅｎｅｒｇｙ＿ｒａｔｉｏ≦１０００００であり得る。さらに、音声信号１０６の（過渡フレーム１３４又は他のフレーム１３６であり得る）前フレーム１１０のフレームタイプ１２６が無声又は無音であった場合、第２の符号化モード（例えば、符号化モードＢ）が選択され得る。

第１の符号化モード（例えば、符号化モードＡ）が選択された場合、電子機器１０２は、３１４において、現在過渡フレーム１３４のための第１の符号化モード（例えば、符号化モードＡ）に基づいて励起１５０を合成する。言い換えれば、電子機器１０２は、３１４において、選択された符号化モードに応じて励起を合成し得る。

一構成では、電子機器１０２は、３１４において、以下のように、第１の符号化モード（例えば、符号化モードＡ）に基づいて励起１５０を合成し得る。電子機器１０２は、（過渡フレーム１３４又は他のフレーム１３６であり得る）前フレーム１１０中の最後のピーク位置と現在過渡フレーム１３４のピッチラグ１４２とに基づいて、現在過渡フレーム１３４中の最後のピークの位置を決定し得る。励起１５０信号は、波形補間を使用して、前フレーム１１０の最後のサンプルと、現在過渡フレーム１３４中の最後のピークの第１のサンプル位置との間で合成され得る。第１の符号化モード（例えば、符号化モードＡ）が選択された場合、波形補間は、ピッチラグ１４２と所定のスペクトル形状とに基づくプロトタイプ波形１４６を使用し得る。

第２の符号化モード（例えば、符号化モードＢ）が選択された場合、電子機器１０２は、３１６において、現在過渡フレーム１３４のための第２の符号化モード（例えば、符号化モードＢ）に基づいて励起１５０を合成する。言い換えれば、電子機器１０２は、３１６において、選択された符号化モードに応じて励起１５０を合成し得る。

一構成では、第２の符号化モード（例えば、符号化モードＢ）が選択された場合、電子機器１０２は、３１６において、（ピッチラグ１４２と所定のスペクトル形状とに基づき得る）プロトタイプ波形１４６の繰り返し配置によって励起信号１５０を合成し得る。プロトタイプ波形１４６は、（ピーク位置１３２のセットからの第１のピーク位置に基づいて決定され得る）開始又は第１の位置から開始して繰り返し配置され得る。プロトタイプ波形１４６が繰り返し配置される回数は、ピッチラグと、開始位置と、現在過渡フレーム１３４サイズとに基づいて決定され得る。プロトタイプ波形１４６全体は、場合によっては整数の回数に適合しないことがあることに留意されたい。例えば、５．５個のプロトタイプがフレームを満たすことが必要とされる場合、現在フレームは６つのプロトタイプを用いて構築され得、その剰余又は余剰は、（次のフレームも過渡フレーム１３４である場合は）次のフレーム中で使用されるか、若しくは（フレームが過渡的でない（例えば、ＱＰＰＰ又は無声の）場合は）廃棄され得る。

電子機器１０２は、３１８において、合成励起１５０と過渡音声フレーム１３４とに基づいて複数（例えば、多数）のスケーリング係数１５４（例えば、利得）を決定する。電子機器１０２は、３２０において、複数の量子化スケーリング係数を生成するために複数のスケーリング係数１５４を量子化する。

電子機器１０２は、３２２において、（同じ又は異なる電子機器上の）デコーダに及び／又は記憶装置に、符号化モード１８６、ピッチラグ１４２、量子化ＬＰＣ係数１１６、スケーリング係数１５４（又は量子化スケーリング係数１５８）及び／又はフレームタイプ１２６を送る。

図４は、前フレーム４８８と現在過渡フレーム４３４との一例を示すグラフである。図４に示す例では、グラフは、本明細書で開示するシステム及び方法に従って使用され得る前フレーム４８８と現在過渡フレーム４３４とを示している。例えば、現在過渡フレーム４３４内に示す波形は、過渡フレーム１３４として分類されたフレーム１１０の残差信号１１４の一例であり得る。前フレーム４８８内に示す波形は、（例えば、過渡フレーム１３４又は他のフレーム１３６であり得る）前フレーム１１０からの残差信号の一例であり得る。図４に示す例では、電子機器１０２は、本明細書で開示するシステム及び方法を使用して、第１の符号化モード（例えば、有声符号化モード又は符号化モードＡ）を使用すべきであると決定し得る。例えば、電子機器１０２は、この例では第１の符号化モード（例えば、符号化モードＡ）が使用されるべきであると決定するために、図２に関して説明した方法２００を使用し得る。

より詳細には、図４は、「有声過渡」フレームと呼ばれ得る現在過渡フレーム４３４の一例を示している。電子機器１０２によって「有声過渡」フレーム４３４が検出されたとき、第１の符号化モード又は符号化モードＡが使用され得る。図４のグラフからわかるように、有声過渡フレーム４３４は、前フレーム４８８に対する周期性及び／又は連続性があるときに生じ得る（従って、第１の符号化モード又は符号化モードＡが使用され得る）。例えば、電子機器１０２が３つのピーク４９０ａ〜ｃを識別し、現在過渡フレーム４３４の長さを（ピーク間の距離である）ピッチラグ４９２で除算した値を取る場合、商は約３になるであろう。この計算において、ピッチラグ４９２ａ〜ｂのうちの１つが使用されるか、又は平均ピッチラグ４９２が使用され得ることに留意されたい。図４においてわかるように、前フレーム４８８と現在過渡フレーム４３４との間には何らかの連続性がある。これは、例えば、現在過渡フレーム４３４の長さをピッチラグ４９２で除算した値が３以下であり、現在過渡フレーム４３４中で３つのピーク４９０ａ〜ｃが検出され得るので、現在過渡フレーム４３４中で３つのピークが予想され得ることを意味し得る。これは、現在過渡フレーム４３４が前フレーム４８８に対してほぼ連続していることを示し得る。

現在過渡フレーム４３４が前フレーム４８８に対してほぼ連続していると検出されたとき、第１の符号化モード（例えば、符号化モードＡ）が使用され得る。従って、現在過渡フレーム４３４は、過渡的であるが、前フレーム４８８からの延長のように挙動し得る。従って、主要な１つの情報は、ピーク４９０ａ〜ｃがどのように配置されるかであり得る。ピークは極めて異なり得、それにより、フレームはより過渡的になり得ることに留意されたい。別の可能性は、ＬＰＣがフレーム全体にわたってどこかで変化し得ることであり、それは、フレームが過渡的である理由であり得る。しかしながら、図４の残差信号においてわかるように、現在過渡フレーム４３４は、（例えば、前フレーム４８８から）過去の信号を延長することによって合成され得る。従って、電子機器１０２は、現在過渡フレーム４３４を相応に符号化するために第１の符号化モード（例えば、符号化モードＡ）を選択し得る。

図４中のｙ軸又は垂直軸は波形の振幅（例えば、信号振幅）をプロットしていることに留意されたい。図４中のｘ軸又は水平軸は（例えば、ミリ秒単位の）時間を示す。構成に応じて、信号自体は、電圧変動、電流変動又は圧力変動などであり得る。

図５は、前フレーム５９４と現在過渡フレーム５３４との別の例を示すグラフである。より詳細には、グラフは、本明細書で開示するシステム及び方法に従って使用され得る前フレーム５９４と現在過渡フレーム５３４との一例を示している。例えば、電子機器１０２が、現在過渡フレーム５３４を「他の過渡」フレームとして検出又は分類し得る。「他の過渡」フレーム５３４が検出されたとき、電子機器１０２は、第２の符号化モード（例えば、符号化モードＢ）を使用し得る。例えば、電子機器１０２は、この例では第２の符号化モード（例えば、符号化モードＢ）が使用されるべきであると決定するために、図２に関して説明した方法２００を使用し得る。

（図４において示した例とは対照的に）図５において分かるように、前フレーム５９４と現在過渡フレーム５３４との間には連続性が殆んど又は全くない。前フレーム５９４に対する連続性がないとき、電子機器１０２は、第２の符号化モード（例えば、符号化モードＢ）を使用し得る。第２の符号化モード（例えば、「他の過渡」符号化モード又は符号化モードＢ）が使用されるとき、現在過渡フレーム５３４中の近似的開始位置が決定され得る。電子機器１０２は、次いで、開始位置から開始して、現在過渡フレーム５３４の終了に達するまで、プロトタイプ波形を繰り返し配置することによって現在過渡フレーム５３４を合成し得る。例えば、電子機器１０２は、開始位置を、現在過渡フレーム５３４中の第１のピーク５９６の位置として決定し得る。さらに、電子機器１０２は、検出されたピッチラグ５９８に基づいてプロトタイプ波形１４６を生成し、開始位置から現在過渡フレーム５３４の終了までプロトタイプ波形１４６を繰り返し配置し得る。

図６は、過渡フレームを符号化するためのシステム及び方法が実装され得る、過渡エンコーダ６０４の一構成を示すブロック図である。過渡エンコーダ６０４の一例は線形予測符号化（ＬＰＣ）エンコーダである。過渡エンコーダ６０４は、電子機器１０２によって音声（又はオーディオ）信号１０６の過渡フレームを符号化するために使用され得る。例えば、過渡エンコーダ６０４は、音声信号１０６（の過渡フレーム）を合成するために使用され得るパラメータのセットを推定又は生成することによって音声信号１０６の過渡フレームを「圧縮された」フォーマットに符号化する。一構成では、そのようなパラメータは、ピッチ（例えば、周波数）、振幅及びホルマント（例えば、共振）の推定値を表し得る。

過渡エンコーダ６０４は、現在過渡フレーム６３４を取得し得る。例えば、現在過渡フレーム６３４は、特定の数の音声信号サンプルを含み、及び／又は音声信号１０６のある時間量（例えば、１０〜２０ミリ秒）を含み得る。過渡フレームは、例えば、ある音声クラスと別の音声クラスとの間の境界上に位置し得る。例えば、音声信号１０６は、無声音（例えば、ｆ、ｓ、ｓｈ、ｔｈなど）から有声音（例えば、ａ、ｅ、ｉ、ｏ、ｕなど）に遷移し得る。幾つかの過渡タイプは、（例えば、音声信号１０６の無声部分から有声部分に遷移するときの）アップ過渡、破裂音、有声過渡（例えば、線形予測符号化（ＬＰＣ）変更及びピッチラグ変動）、及び（例えば、単語の末尾など、音声信号１０６の有声部分から無声又は無音部分に遷移するときの）ダウン過渡を含む。２つの音声クラスの中間の１つ以上のフレームは、１つ以上の過渡フレームであり得る。過渡フレームは、ピッチラグ、エネルギーなどの変動の分析によって検出され得る。この現象が複数のフレームにわたる場合、それらは過渡としてマークされ得る。その上、過渡フレームは、さらに「有声過渡」フレーム又は「他の過渡」フレームとして分類され得る。

過渡エンコーダ６０４はまた、前フレーム６０１、又は前フレーム６０１からの１つ以上のサンプルを取得し得る。一構成では、前フレーム６０１は、エネルギー比決定ブロック／モジュール６８０及び／又はＬＰＣ分析ブロック／モジュール６２２に与えられ得る。過渡エンコーダ６０４はさらに前フレームタイプ６０３を取得し得、前フレームタイプ６０３は符号化モード決定ブロック／モジュール６８４に与えられ得る。前フレームタイプ６０３は、無音、無声、有声又は過渡など、前フレームのタイプを示し得る。

過渡エンコーダ６０４は、現在過渡フレーム６３４に対して線形予測分析（例えば、ＬＰＣ分析）を実行するための線形予測符号化（ＬＰＣ）分析ブロック／モジュール６２２を使用し得る。ＬＰＣ分析ブロック／モジュール６２２は、追加又は代替として、前フレーム６０１からの信号（例えば、１つ以上のサンプル）を使用し得ることに留意されたい。例えば、前フレーム６０１が過渡フレームである場合、ＬＰＣ分析ブロック／モジュール６２２は、前過渡フレーム６０１からの１つ以上のサンプルを使用し得る。さらに、前フレーム６０１が別の種類のフレームである場合（例えば、有声、無声、無音など）、ＬＰＣ分析ブロック／モジュール６２２は、他の前フレーム６０１からの１つ以上のサンプルを使用し得る。

ＬＰＣ分析ブロック／モジュール６２２は１つ以上のＬＰＣ係数６２０を生成し得る。ＬＰＣ係数６２０は量子化ブロック／モジュール６１８に与えられ得、量子化ブロック／モジュール６１８は１つ以上の量子化ＬＰＣ係数６１６を生成し得る。量子化ＬＰＣ係数６１６と、現在過渡フレーム６３４からの１つ以上のサンプルとは、残差決定ブロック／モジュール６１２に与えられ得、それらは残差信号６１４を決定するために使用され得る。例えば、残差信号６１４は、音声信号１０６から除去されたホルマント又はホルマントの影響（例えば、係数）を有していた音声信号１０６の過渡フレーム６３４を含み得る。残差信号６１４は正規化ブロック／モジュール６０９に与えられ得る。

正規化ブロック／モジュール６０９は残差信号６１４を正規化し、その結果、修正（例えば、正規化）残差信号６１１が生じ得る。例えば、正規化は、現在フレーム中のピッチパルスを滑らかに展開するピッチ輪郭に整列させるためにそれらのピッチパルスを移動させる。一構成では、正規化のプロセスは、「Enhanced Variable Rate Codec, Speech Service Options 3, 68, 70, and 73 for Wideband Spread Spectrum Digital Systems」と題する３ＧＰＰ２文書Ｃ．Ｓ００１４Ｄのセクション４．１１．６に詳細に記載されているように使用され得る。修正残差信号６１１は、ピーク探索ブロック／モジュール６２８に、ＬＰＣ合成ブロック／モジュール６０５及び／又は励起合成ブロック／モジュール６４８に与えられ得る。ＬＰＣ合成ブロック／モジュール６０５は、修正音声信号６０７を生成（例えば、合成）し得、修正音声信号６０７はスケール係数決定ブロック／モジュール６５２に与えられ得る。

ピーク探索ブロック／モジュール６２８は修正残差信号６１１中のピークを探索し得る。言い換えれば、過渡エンコーダ６０４は修正残差信号６１１中のピーク（例えば、高いエネルギーの領域）を探索し得る。これらのピークは識別されて、１つ以上のピーク位置を含むピーク６３２のリスト又はセットが取得され得る。ピーク６３２のリスト又はセット中のピーク位置は、例えば、サンプル数及び／又は時間に関して指定され得る。

ピーク６３２のセットは、符号化モード決定ブロック／モジュール６８４、ピッチラグ決定ブロック／モジュール６３８及び／又はスケール係数決定ブロック／モジュール６５２に与えられ得る。ピッチラグ決定ブロック／モジュール６３８は、ピーク６３２のセットを使用してピッチラグ６４２を決定し得る。「ピッチラグ」は、現在過渡フレーム６３４中の２つの連続するピッチスパイク間の「距離」であり得る。ピッチラグ６４２は、例えば、サンプルの数及び／又は時間量において指定され得る。幾つかの構成では、ピッチラグ決定ブロック／モジュール６３８は、ピーク６３２のセット又は（ピーク６３２間の距離であり得る）ピッチラグ候補のセットを使用してピッチラグ６４２を決定し得る。例えば、ピッチラグ決定ブロック／モジュール６３８は、候補のセットからピッチラグ６４２を決定するために平均化又は平滑化アルゴリズムを使用し得る。他の手法も使用され得る。ピッチラグ決定ブロック／モジュール６３８によって決定されたピッチラグ６４２は、符号化モード決定ブロック／モジュール６８４、励起合成ブロック／モジュール６４８及び／又はスケール係数決定ブロック／モジュール６５２に与えられ得る。

符号化モード決定ブロック／モジュール６８４は、現在過渡フレーム６３４のための符号化モード６８６を決定し得る。一構成では、符号化モード決定ブロック／モジュール６８４は、現在過渡フレーム６３４のための有声過渡符号化モード（例えば、第１の符号化モード）を使用すべきか、現在過渡フレーム６３４のための「他の過渡」符号化モード（例えば、第２の符号化モード）を使用すべきかを決定し得る。例えば、符号化モード決定ブロック／モジュール６８４は、過渡フレームが有声過渡フレームであるか他の過渡フレームであるかを決定し得る。有声過渡フレームは、前フレーム６０１からの何らかの連続性を有する過渡フレームであり得る（一例は図４に関して上記で説明した）。「他の過渡」フレームは、前フレーム６０１からの連続性を殆んど又は全く有しない過渡フレームであり得る（一例は図５に関して上記で説明した）。符号化モード決定ブロック／モジュール６８４は、この決定を行うために１つ以上の種類の情報を使用し得る。例えば、符号化モード決定ブロック／モジュール６８４は、この決定を行うために、ピーク６３２のセット、ピッチラグ６４２、エネルギー比６８２及び／又は前フレームタイプ６０３を使用し得る。符号化モード決定ブロック／モジュール６８４がどのように符号化モード６８６を決定し得るかの一例を以下の図７に関して与えている。

エネルギー比６８２は、エネルギー比決定ブロック／モジュール６８０によって前フレーム６０１と現在過渡フレーム６３４との間のエネルギー比に基づいて決定され得る。前フレーム６０１は、過渡フレーム又は別の種類のフレーム（例えば、無音、有声、無声など）であり得る。

符号化モード決定ブロック／モジュール６８４は、現在過渡フレーム６３４のための選択された符号化モードを示す符号化モード６８６を生成し得る。例えば、符号化モード６８６は、現在過渡フレーム６３４が「有声過渡」フレームである場合は有声過渡符号化モードを示し得、又は現在過渡フレーム６３４が「他の過渡」フレームである場合は「他の過渡」符号化モードを示し得る。一構成では、符号化モード決定ブロック／モジュール６８４は、前フレーム残差６２５から最後のピーク６１５に基づいてこの決定を行い得る。例えば、符号化モード決定ブロック／モジュール６８４に供給する最後のピーク推定ブロック／モジュール６１３が、前フレーム残差６２５に基づいて前フレームの最後のピーク６１５を推定し得る。これにより、過渡エンコーダ６０４が、前フレームの最後のピーク６１５から開始して、現在フレーム又は現フレームへの連続性を探索することが可能になり得る。符号化モード６８６は、励起合成ブロック／モジュール６４８に、ストレージに、「ローカル」デコーダに及び／又は（別の機器上の）遠隔デコーダに送られ（例えば、与えられ）得る。例えば、符号化モード６８６はＴＸ／ＲＸブロック／モジュールに与えられ得、ＴＸ／ＲＸブロック／モジュールは符号化モード６８６をフォーマットし、別の電子機器に送り得、そこで符号化モード６８６はデコーダに与えられ得る。

励起合成ブロック／モジュール６４８は、プロトタイプ波形６４６、符号化モード６８６、（場合によっては）現在フレームの第１のピーク位置６１９、（場合によっては）修正残差信号６１１、ピッチラグ６４２、（場合によっては）（例えば、位置６３２のピークのセットからの）現在フレームからの推定された最後のピーク位置、及び／又は前フレーム残差信号６２５に基づいて励起６５０を生成又は合成し得る。例えば、「他の過渡」符号化モード６８６が選択された場合、第１のピーク推定ブロック／モジュール６１７は第１のピーク位置６１９を決定し得る。その場合、第１のピーク位置６１９が励起合成ブロック／モジュール６４８に与えられ得る。別の例では、（過渡）励起合成ブロック／モジュール６４８は、（ピーク位置６３２のリストからの、及び／又は、例えば、（便宜上その接続は図６に図示されていない）前フレーム６１５の最後のピークとピッチラグ６４２とに基づいて決定された）現在過渡フレーム６３４からの最後のピーク位置又は値を使用し得る。所定の形状６２７とピッチラグ６４２とに基づいてプロトタイプ波形６４６を生成し得るプロトタイプ波形生成ブロック／モジュール６４４によって、プロトタイプ波形６４６が与えられ得る。励起合成ブロック／モジュール６４８がどのように励起６５０を合成し得るかの例を以下の図８に関して与えている。

励起合成ブロック／モジュール６４８は、１つ以上の合成励起ピーク位置６２９のセットをピークマッピングブロック／モジュール６２１に与え得る。また、ピーク６３２のセット（修正残差信号６１１からのピーク６３２のセットであり、合成励起ピーク位置６２９と混同されるべきでない）は、ピークマッピングブロック／モジュール６２１に与えられ得る。ピークマッピングブロック／モジュール６２１は、ピーク６３２のセットと合成励起ピーク位置６２９とに基づいてマッピング６２３を生成し得る。マッピング６２３はスケール係数決定ブロック／モジュール６５２に与えられ得る。

励起６５０、マッピング６２３、ピーク６３２のセット、ピッチラグ６４２、量子化ＬＰＣ係数６１６及び／又は修正音声信号６０７はスケール係数決定ブロック／モジュール６５２に与えられ得、スケール係数決定ブロック／モジュール６５２は、それの入力６５０、６２３、６３２、６４２、６１６、６０７のうちの１つ以上に基づいて利得６５４のセットを生成し得る。利得６５４のセットは利得量子化ブロック／モジュール６５６に与えられ得、利得量子化ブロック／モジュール６５６は、利得６５４のセットを量子化して量子化利得６５８のセットを生成する。

過渡エンコーダ６０４は、１つ以上のブロック／モジュール又は機器に、符号化モード６８６、（場合によっては）第１のピーク位置６１９、ピッチラグ６４２、量子化利得６５８及び量子化ＬＰＣ係数６１６のうちの１つ以上を送るか、出力するか、又は与え得る。例えば、説明した情報６８６、６１９、６４２、６５８、６１６の一部又は全部が送信機に与えられ得、送信機は、それをフォーマットし及び／又は別の機器に送信し得る。追加又は代替として、情報６８６、６１９、６４２、６５８、６１６の一部又は全部は、メモリに記憶され及び／又はデコーダに与えられ得る。情報６８６、６１９、６４２、６５８、６１６の一部又は全部が使用されて、音声信号がローカルに又はリモートで合成（例えば、復号）され得る。復号音声信号は、次いで、例えば、スピーカーを使用して出力され得る。

図７は、符号化モードを選択するための方法７００の一構成を示す流れ図である。この構成では、（例えば、過渡エンコーダ６０４を含む）電子機器は、「有声過渡」符号化モード（例えば、第１の符号化モード又は符号化モードＡ）を使用すべきか「他の過渡」符号化モード（例えば、第２の符号化モード又は符号化モードＢ）を使用すべきかを以下のように決定し得る。電子機器は、７０２において、式（２）に従ってピークの推定された数（例えば、「Ｐ_est」）を決定する。

式（２）において、「フレームサイズ」は、（例えば、サンプル数又は時間量単位の）現在過渡フレーム６３４のサイズである。「ピッチラグ」は、（例えば、サンプル数又は時間量単位の）現在過渡フレーム６３４のための推定されたピッチラグ６４２の値である。電子機器は、７０４において、ピーク位置６３２の数がＰ_estよりも大きいかそれに等しい場合、有声過渡符号化モード（例えば、第１の符号化モード又は符号化モードＡ）を選択する。

電子機器は、７０６において、ピッチラグ６４２に基づいて第１の距離（例えば、ｄ₁）を決定する。電子機器は、７０８において、ピッチラグ６４２に基づいて第２の距離（例えば、ｄ₂）を決定する。一構成では、ｄ₁及びｄ₂は、ピッチラグ６４２の固定部分となるように設定される。例えば、ｄ₁＝０．２＊ｐｉｔｃｈ＿ｌａｇ及びｄ₂＝０．２５＊ｐｉｔｃｈ＿ｌａｇ。

電子機器は、７１０において、ピーク位置６３２のセット中の最後のピークが現在過渡フレーム６３４の終了から第１の距離（ｄ₁）内にあり、ピーク位置６３２のセット中の第１のピークが現在過渡フレーム６３４の開始から第２の距離（ｄ₂）内のある場合、有声過渡符号化モードを選択する。距離はサンプル、時間などの単位で測定され得ることに留意されたい。

７１２において、（例えば、音声信号１０６の）前フレーム６０１と現在過渡フレーム６３４との間のエネルギー比６８２が所定の範囲の外にある場合、電子機器は、「他の過渡」符号化モード（例えば、第２の符号化モード又は符号化モードＢ）を選択する。例えば、エネルギー比６８２は、前フレームの音声／残差のエネルギーを計算し、現在フレームの音声／残差のエネルギーを計算し、これらの２つのエネルギー値の比を取ることによって決定され得る。所定の範囲の一例は０．００００１≦ｅｎｅｒｇｙ＿ｒａｔｉｏ≦１０００００である。７１４において、前フレームタイプ６０３が無声又は無音である場合、電子機器は「他の過渡」符号化モード（例えば、符号化モードＢ）を選択する。

図８は、励起信号を合成するための方法８００の一構成を示す流れ図である。電子機器６０２は、８０２において、有声過渡符号化モード（例えば、第１の符号化モード又は符号化モードＡ）を使用すべきか「他の過渡」符号化モード（例えば、第２の符号化モード又は符号化モードＢ）を使用すべきかを決定する。例えば、電子機器６０２は、図７に関して説明した方法７００を使用してこの決定を行い得る。

８０２において、電子機器６０２が（励起６５０を合成するために）有声過渡符号化モードを使用すべきであると決定した場合、電子機器６０２は、８０４において、現在過渡フレーム６３４中の最後のピーク位置を決定する（例えば、推定する）。この決定８０４は、前フレームからの最後のピーク位置（例えば、最後のピーク推定ブロック／モジュール６１３からの最後のピーク６１５、又は前フレームからのピーク位置６３２のセットからの最後のピーク）と、現在過渡フレーム６３４からのピッチラグ６４２とに基づいて行われ得る。例えば、現在過渡フレーム６３４のための最後のピーク位置を推定するために前フレーム残差信号６２５とピッチラグ６４２とが使用され得る。例えば、前フレームが過渡的であった場合、（例えば、ピーク位置６３２の前フレームのセット、又は最後のピーク推定ブロック／モジュール６１３からの最後のピーク６１５から）前フレーム中の最後のピークの位置が知られ、現在フレーム中の最後のピークの位置は、最後のピッチサイクルを決定するまで、固定数のピッチラグ６４２値を前方に現在フレームへと移動させることによって決定され得る。前フレームが有声である場合、前フレーム中の最後のピークの位置を決定するために、（例えば、最後のピーク推定ブロック／モジュール６１３によって又は励起合成ブロック／モジュール６４８によって）ピーク探索が実行され得る。有声過渡は無声フレームの後に決してこないことがある。

電子機器６０２は、８０６において、励起信号６５０を合成する。励起信号６５０は、８０６において、波形補間を使用して、前フレーム６０１の最後のサンプルと、現在過渡フレーム６３４中の（推定された）最後のピークの第１のサンプル位置との間で合成され得る。波形補間は、ピッチラグ６４２と所定のスペクトル形状６２７とに基づくプロトタイプ波形６４６を使用し得る。

８０２において、電子機器６０２が他の過渡符号化モード（例えば、第２の符号化モード又は符号化モードＢ）を使用すべきであると決定した場合、電子機器６０２は、８０８において、他の過渡符号化モードを使用して励起６５０を合成し得る。例えば、電子機器６０２は、８０８において、プロトタイプ波形６４６を繰り返し配置することによって励起信号６５０を合成する。プロトタイプ波形６４６は、ピッチラグ６４２と所定のスペクトル形状６２７とに基づいて生成又は決定され得る。プロトタイプ波形６４６は、現在過渡フレーム６３４中の第１の位置において開始して繰り返し配置され得る。第１の位置は、ピーク位置６３２のセットからの第１のピーク位置６１９に基づいて決定され得る。プロトタイプ波形６４６が繰り返し配置される回数は、ピッチラグ６４２と、第１の位置と、現在過渡フレーム６３４サイズとに基づいて決定され得る。例えば、プロトタイプ波形６４６（及び／又はプロトタイプ波形６４６の部分）は、現在過渡フレーム６３４の終了に達するまで繰り返し配置され得る。

図９は、過渡フレームを復号するためのシステム及び方法が実装され得る、過渡デコーダ９３１の一構成を示すブロック図である。デコーダ９３１は、随意の第１のピークアンパッキングブロック／モジュール９５３、励起合成ブロック／モジュール９４１及び／又はピッチ同期利得スケーリング及びＬＰＣ合成ブロック／モジュール９４７を含み得る。過渡デコーダ９３１の一例はＬＰＣデコーダである。例えば、過渡デコーダ９３１は、図１に示すデコーダ１６２、１７４であり、及び／又は図１に示すデコーダ１６２、１７４とともに含まれるデコーダのうちの１つであり得る。

過渡デコーダ９３１は、利得９４５、第１のピーク位置９３３ａ（パラメータ）、モード９３５、前フレーム残差９３７、ピッチラグ９３９及びＬＰＣ係数９４９のうちの１つ以上を取得し得る。例えば、過渡エンコーダ１０４は、利得９４５、第１のピーク位置９３３ａ、モード９３５、ピッチラグ９３９及び／又はＬＰＣ係数９４９を与え得る。前フレーム残差は、（例えば、時間ｎ−１において）フレームを復号した後にデコーダが記憶する前フレームの復号された残差であり得ることに留意されたい。一構成では、この情報９４５、９３３ａ、９３５、９３９、９４９は、デコーダ９３１と同じ電子機器上にあるエンコーダ１０４から発生し得る。例えば、過渡デコーダ９３１は、エンコーダ１０４から情報９４５、９３３ａ、９３５、９３９、９４９を直接受信するか又はそれらの情報をメモリから取り出し得る。別の構成では、情報９４５、９３３ａ、９３５、９３９、９４９は、デコーダ９３１とは異なる電子機器１０２上にあるエンコーダ１０４から発生し得る。例えば、過渡デコーダ９３１は、情報９４５、９３３ａ、９３５、９３９、９４９を別の電子機器１０２から受信している受信機１７０からそれらの情報を取得し得る。第１のピーク位置９３３ａは、第１の符号化モード（例えば、有声過渡符号化モード）が使用されるときなど、エンコーダ１０４によって常に与えられるとは限らないことに留意されたい。

幾つかの構成では、パラメータとして、利得９４５、第１のピーク位置９３３ａ、モード９３５、ピッチラグ９３９及び／又はＬＰＣ係数９４９が受信され得る。より詳細には、過渡デコーダ９３１が、利得パラメータ９４５、第１のピーク位置パラメータ９３３ａ、モードパラメータ９３５、ピッチラグパラメータ９３９及び／又はＬＰＣ係数パラメータ９４９を受信し得る。例えば、この情報９４５、９３３ａ、９３５、９３９、９４９の各タイプは、ビット数を使用して表され得る。一構成では、これらのビットはパケット中で受信され得る。これらのビットは、過渡デコーダ９３１が情報９４５、９３３ａ、９３５、９３９、９４９を使用し得るように、電子機器及び／又は過渡デコーダ９３１によってアンパック、解釈、デフォーマット及び／又は復号され得る。一構成では、ビットは、表（１）に記載されている情報９４５、９３３ａ、９３５、９３９、９４９のために割り振られ得る。

表（１）に示すフレームタイプパラメータは、デコーダ（例えば、ＮＥＬＰデコーダ、ＱＰＰＰデコーダ、無音デコーダ、過渡デコーダなど）を選択するために使用され得、フレーム誤りに対して保護する（例えば、検出する）ためのフレーム誤り保護が使用され得ることに留意されたい。

モード９３５は、音声又はオーディオ信号を符号化するために第１の符号化モード（例えば、符号化モードＡ又は有声過渡符号化モード）が使用されたか第２の符号化モード（例えば、符号化モードＢ又は「他の過渡」符号化モード）が使用されたかを示し得る。モード９３５は、第１のピークアンパッキングブロック／モジュール９５３及び／又は励起合成ブロック／モジュール９４１に与えられ得る。

モード９３５が第２の符号化モード（例えば、他の過渡符号化モード）を示す場合、第１のピークアンパッキングブロック／モジュール９５３は、第１のピーク位置９３３ｂを取り出すか又はアンパックし得る。例えば、過渡デコーダ９３１によって受信された第１のピーク位置９３３ａは、幾つかのビット（例えば、３ビット）を使用して第１のピーク位置を表す第１のピーク位置パラメータ９３３ａであり得る。追加又は代替として、第１のピーク位置９３３ａは、他の情報（例えば、ヘッダ情報、他のペイロード情報など）とともにパケット中に含まれ得る。第１のピークアンパッキングブロック／モジュール９５３は、第１のピーク位置パラメータ９３３ａをアンパックし、及び／又はピーク位置パラメータ９３３ａを解釈（例えば、復号、デフォーマットなど）して、第１のピーク位置に９３３ｂを取得し得る。但し、幾つかの構成では、第１のピーク位置９３３ａは、アンパッキングが必要とされないようなフォーマットで過渡デコーダ９３１に与えられ得る。その構成では、過渡デコーダ９３１は第１のピークアンパッキングブロック／モジュール９５３を含まないことがあり、第１のピーク位置９３３は励起合成ブロック／モジュール９４１に直接与えられ得る。

モード９３５が第１の符号化モード（例えば、有声過渡符号化モード）を示す場合、第１のピーク位置（パラメータ）９３３ａが受信されないことがあり、及び／又は第１のピークアンパッキングブロック／モジュール９５３がどんな動作も実行する必要がないことがある。そのような場合、第１のピーク位置９３３は励起合成ブロック／モジュール９４１に与えられないことがある。

励起合成ブロック／モジュール９４１は、ピッチラグ９３９、前フレーム残差９３７、モード９３５及び／又は第１のピーク位置９３３に基づいて励起９４３を合成し得る。例えば、第２の符号化モード（例えば、他の過渡符号化モード）が使用される場合、励起９４３を合成するために第１のピーク位置９３３のみが使用され得る。励起９４３がどのように合成され得るかの一例を以下の図１１に関して与えている。

励起９４３は、ピッチ同期利得スケーリング及びＬＰＣ合成ブロック／モジュール９４７に与えられ得る。ピッチ同期利得スケーリング及びＬＰＣ合成ブロック／モジュール９４７は、励起９４３と利得９４５とＬＰＣ係数９４９とを使用して、合成又は復号された音声信号９５１を生成し得る。ピッチ同期利得スケーリング及びＬＰＣ合成ブロック／モジュール９４７の一例を以下の図１４に関して説明している。合成音声信号９５１は、メモリに記憶され、スピーカーを使用して出力され、及び／又は別の電子機器に送信され得る。

図１０は、過渡フレームを復号するための方法１０００の一構成を示す流れ図である。電子機器が、１００２において、過渡フレームを示すフレームタイプ（例えば、図１に示すフレームタイプ１２６など、インジケータ又はパラメータ）を取得（例えば、受信、取り出しなど）する。言い換えれば、電子機器は、現在フレームのフレームタイプが過渡フレームであることをフレームタイプが示すとき、図１０に示す方法１０００を実行し得る。幾つかの構成では、フレームタイプは、符号化電子機器から送られたフレームタイプパラメータであり得る。

電子機器は、１００４において、１つ以上のパラメータを取得する。例えば、電子機器は、利得９４５、第１のピーク位置９３３ａ、（過渡符号化）モード９３５、ピッチラグ９３９及び／又はＬＰＣ係数９４９を表すパラメータを受信するか、取り出すか又は他の方法で取得し得る。例えば、電子機器は、（１つ以上のパケット又はメッセージとして）別の電子機器からこれらのパラメータのうちの１つ以上を受信し得、メモリからこれらのパラメータのうちの１つ以上を取り出し得、及び／又は他の方法でエンコーダ１０４からこれらのパラメータのうちの１つ以上を取得し得る。一構成では、パラメータは、ワイヤレスに及び／又は衛星から受信され得る。

電子機器は、１００６において、過渡符号化モードパラメータに基づいて過渡符号化モード９３５を決定する。例えば、電子機器は、過渡デコーダ９３１によって使用可能である過渡符号化モード９３５を取得するために、過渡符号化モードパラメータをアンパック、復号及び／又はデフォーマットし得る。過渡符号化モード９３５は第１の符号化モード（例えば、符号化モードＡ又は有声過渡符号化モード）を示すか、あるいは過渡符号化モード９３５は第２の符号化モード（例えば、符号化モードＢ又は他の過渡符号化モード）を示し得る。

電子機器はまた、１００８において、ピッチラグパラメータに基づいてピッチラグ９３９を決定する。例えば、電子機器は、過渡デコーダ９３１によって使用可能であるピッチラグ９３９を取得するために、ピッチラグパラメータをアンパック、復号及び／又はデフォーマットし得る。

電子機器は、１０１０において、過渡符号化モード９３５に基づいて励起信号９４３を合成する。例えば、過渡符号化モード９３５が第２の符号化モード（例えば、他の過渡符号化モード）を示す場合、電子機器は、１０１０において、第１のピーク位置９３３を使用して励起信号９４３を合成する。他の場合は、電子機器は、１０１０において、第１のピーク位置９３３を使用せずに励起信号９４３を合成する。１０１０において過渡符号化モード９３５に基づいて励起信号９４３を合成することについてのより詳細な例を、以下の図１１に関して与えている。

電子機器は、１０１２において、１つ以上の利得９４５に基づいて励起信号９４３をスケーリングして、スケーリングされた励起信号９４３を生成する。例えば、電子機器は、励起信号９４３に１つ以上のスケーリング係数又は利得９４５を乗算することによって、励起信号に利得（例えば、スケーリング係数）９４５を適用し得る。

電子機器は、１０１４において、ＬＰＣパラメータに基づいてＬＰＣ係数９４９を決定する。例えば、電子機器は、過渡デコーダ９３１によって使用可能であるＬＰＣ係数９４９を取得するために、ＬＰＣ係数パラメータ９４９をアンパック、復号及び／又はデフォーマットし得る。

電子機器は、１０１６において、スケーリングされた励起信号９４３とＬＰＣ係数９４９とに基づいて合成音声信号９５１を生成する。１０１６において合成音声信号９５１を生成することについての一例を、図１４に関して以下で説明している。合成音声信号９５１は、メモリに記憶され、スピーカーを使用して出力され、及び／又は別の電子機器に送信され得る。

図１１は、励起信号を合成するための方法１１００の一構成を示す流れ図である。図１１に示す方法１１００は、例えば、合成音声信号９５１を生成するために過渡デコーダ９３１によって使用され得る。電子機器は、１１０２において、有声過渡符号化モード（例えば、第１の符号化モード又は符号化モードＡ）が使用されるべきか「他の過渡」符号化モード（例えば、第２の符号化モード又は符号化モードＢ）が使用されるべきかを決定する。一構成では、電子機器は、有声過渡符号化モードが使用されるか他の過渡符号化モードが使用されるかを示す符号化モードパラメータを取得又は受信する。例えば、符号化モードパラメータはシングルビットであり得、「１」が有声過渡符号化モードを示し、「０」が「他の過渡」符号化モードを示すか、又はその逆である。

１１０２において有声過渡符号化モードが使用されると電子機器が決定した場合、電子機器は、１１０４において、現在過渡フレーム中の最後のピーク位置を決定（例えば、推定）する。この決定１１０４は、前フレームからの最後のピーク位置と、現在過渡フレームからのピッチラグ９３９とに基づいて行われ得る。例えば、電子機器は、最後のピーク位置を推定するために、前フレーム残差信号９３７とピッチラグ９３９とを使用し得る。

電子機器は、１１０６において、励起信号９４３を合成する。励起信号９４３は、１１０６において、波形補間を使用して、前フレームの最後のサンプルと、現在過渡フレーム中の（推定された）最後のピークの第１のサンプル位置との間で合成され得る。波形補間は、ピッチラグ９３９と所定のスペクトル形状とに基づくプロトタイプ波形を使用し得る。

１１０２において、他の過渡符号化モード（例えば、第２の符号化モード又は符号化モードＢ）を使用すべきであると電子機器が決定した場合、電子機器は、１１０８において、第１のピーク位置９３３を取得する。一例では、電子機器は、第１のピーク位置９３３を取得するために、受信された第１のピーク位置パラメータをアンパックし、及び／又はピーク位置パラメータを解釈（例えば、復号、デフォーマットなど）し得る。別の例では、電子機器は、１１０８において、メモリから第１のピーク位置９３３を取り出すか、又はエンコーダから第１のピーク位置９３３を取得し得る。

電子機器は、１１１０において、他の過渡符号化モードを使用して励起９４３を合成する。例えば、電子機器は、１１１０において、プロトタイプ波形を繰り返し配置することによって励起信号９４３を合成し得る。プロトタイプ波形は、ピッチラグ９３９と所定のスペクトル形状とに基づいて生成又は決定され得る。プロトタイプ波形は、第１の位置において開始して繰り返し配置され得る。第１の位置は第１のピーク位置９３３に基づいて決定され得る。プロトタイプ波形が繰り返し配置される回数は、ピッチラグ９３９と、第１の位置と、現在過渡フレームサイズとに基づいて決定され得る。例えば、プロトタイプ波形は、現在過渡フレームの終了に達するまで繰り返し配置され得る。（整数個の全プロトタイプ波形がフレーム内に均等に収まらない場合は）プロトタイプ波形の一部分も配置され得、及び／又は残りの部分が後続のフレーム中に配置されるかもしくは廃棄され得ることに留意されたい。

図１２は、過渡フレームを符号化するためのシステム及び方法が実装され得る、電子機器１２０２の一例を示すブロック図である。この例では、電子機器１２０２は、前処理及び雑音抑圧ブロック／モジュール１２５５と、モデルパラメータ推定ブロック／モジュール１２５９と、レート決定ブロック／モジュール１２５７と、第１のスイッチングブロック／モジュール１２６１と、無音エンコーダ１２６３と、雑音励起線形予測（ＮＥＬＰ）エンコーダ１２６５と、過渡エンコーダ１２６７と、１／４レートプロトタイプピッチ周期（ＱＰＰＰ）エンコーダ１２６９と、第２のスイッチングブロック／モジュール１２７１と、パケットフォーマッティングブロック／モジュール１２７３とを含む。

前処理及び雑音抑圧ブロック／モジュール１２５５は、音声信号１２０６を取得又は受信し得る。一構成では、前処理及び雑音抑圧ブロック／モジュール１２５５は、音声信号１２０６中の雑音を抑制し、及び／又は音声信号１２０６に対してフィルタ処理などの他の処理を実行し得る。得られた出力信号はモデルパラメータ推定ブロック／モジュール１２５９に与えられる。

モデルパラメータ推定ブロック／モジュール１２５９は、ＬＰＣと、第１のカットピッチラグと、第１のカットピッチラグにおける正規化自己相関とを推定し得る。例えば、このプロシージャは、拡張可変レートコーデック／拡張可変レートコーデックＢ及び／又は拡張可変レートコーデック広帯域（ＥＶＲＣ／ＥＶＲＣ−Ｂ／ＥＶＲＣ−ＷＢ）において使用されるプロシージャに同様であり得る。レート決定ブロック／モジュール１２５７は、音声信号１２０６を符号化するための符号化レートを決定し得る。符号化レートは、（符号化）音声信号１２０６を復号する際に使用するためにデコーダに与えられ得る。

電子機器１２０２は、音声信号１２０６を符号化するためにどのエンコーダを使用すべきかを決定し得る。時々、音声信号１２０６は、実際の音声を常に含んでいるとは限らないが、例えば、無音及び／又は雑音を含んでいることがあることに留意されたい。一構成では、電子機器１２０２は、モデルパラメータ推定１２５９に基づいてどのエンコーダを使用すべきかを決定し得る。例えば、電子機器１２０２が音声信号１２０６中で無音を検出した場合、電子機器１２０２は、無音エンコーダ１２６３を通して（無音）音声信号をチャネリングするために第１のスイッチングブロック／モジュール１２６１を使用し得る。第１のスイッチングブロック／モジュール１２６１は、モデルパラメータ推定１２５９に基づいて、ＮＥＬＰエンコーダ１２６５、過渡エンコーダ１２６７又はＱＰＰＰエンコーダ１２６９によって符号化するように音声信号１２０６をスイッチングするために同様に使用され得る。

無音エンコーダ１２６３は、１つ以上の幾つかの情報を用いて無音を符号化又は表現し得る。例えば、無音エンコーダ１２６３は、音声信号１２０６中の無音の長さを表すパラメータを生成し得る。本明細書で開示するシステム及び方法の幾つかの構成のために使用され得る無音／背景を符号化する２つの例が、「Enhanced Variable Rate Codec, Speech Service Options 3, 68, 70, and 73 for Wideband Spread Spectrum Digital Systems」と題する３ＧＰＰ２文書Ｃ．Ｓ００１４Ｄのセクション４．１５及び４．１７に記載されている。

雑音励起線形予測（ＮＥＬＰ）エンコーダ１２６５は、無声音声として分類されたフレームを符号化するために使用され得る。ＮＥＬＰ符号化は、信号再生に関して効果的に動作し、音声信号１２０６はピッチ構造を殆んど又は全く有しない。より詳細には、ＮＥＬＰは、無声音声又は背景雑音など、性質が雑音様である音声を符号化するために使用され得る。ＮＥＬＰは、フィルタ処理された擬似ランダム雑音信号を使用して無声音声をモデル化する。そのような音声セグメントの雑音様の性質は、デコーダにおいてランダム信号を生成し、それらに適切な利得を適用することによって再構成され得る。ＮＥＬＰは、コード化音声について単純なモデルを使用し、それによってより低いビットレートを達成し得る。

過渡エンコーダ１２６７は、本明細書で開示するシステム及び方法に従って音声信号１２０６中の過渡フレームを符号化するために使用され得る。例えば、過渡エンコーダ１２６７として、上記の図１及び図６に関して説明した過渡エンコーダ１０４、６０４が使用され得る。従って、例えば、電子機器１２０２は、過渡フレームが検出されたとき、音声信号１２０６を符号化するために過渡エンコーダ１２６７を使用し得る。

１／４レートプロトタイプピッチ周期（ＱＰＰＰ）エンコーダ１２６９は、有声音声として分類されたフレームを符号化するために使用され得る。有声音声は、ＱＰＰＰエンコーダ１２６９によって活用される、緩やかに時間変動する周期成分を含んでいる。ＱＰＰＰエンコーダ１２６９は、各フレーム内のピッチ周期のサブセットを符号化する。音声信号１２０６の残りの期間は、これらのプロトタイプ期間間の補間によって再構成される。有声音声の周期性を活用することにより、ＱＰＰＰエンコーダ１２６９は、音声信号１２０６を知覚的に正確な方法で再生することが可能である。

ＱＰＰＰエンコーダ１２６９は、性質が周期的である音声データを符号化するために使用され得る、プロトタイプピッチ周期波形補間（ＰＰＰＷＩ）を使用し得る。そのような音声は、「プロトタイプ」ピッチ周期（ＰＰＰ）と同様である異なるピッチ周期によって特徴づけられる。このＰＰＰは、ＱＰＰＰエンコーダ１２６９が符号化するために使用するボイス情報であり得る。デコーダは、音声セグメント中の他のピッチ周期を再構成するためにこのＰＰＰを使用し得る。

第２のスイッチングブロック／モジュール１２７１は、パケットフォーマッティングブロック／モジュール１２７３に対して現在フレームを符号化するために使用されたエンコーダ１２６３、１２６５、１２６７、１２６９からの（符号化）音声信号をチャネリングするために使用され得る。パケットフォーマッティングブロック／モジュール１２７３は、（例えば、送信のために）（符号化）音声信号１２０６を１つ以上のパケット中にフォーマットし得る。例えば、パケットフォーマッティングブロック／モジュール１２７３は、過渡フレームのためのパケットをフォーマットし得る。一構成では、パケットフォーマッティングブロック／モジュール１２７３によって生成された１つ以上のパケットは別の機器に送信され得る。

図１３は、過渡フレームを復号するためのシステム及び方法が実装され得る、電子機器１３００の一例を示すブロック図である。この例では、電子機器１３００は、フレーム／ビット誤り検出器１３７７と、パケット化解除ブロック／モジュール１３７９と、第１のスイッチングブロック／モジュール１３８１と、無音デコーダ１３８３と、雑音励起線形予測（ＮＥＬＰ）デコーダ１３８５と、過渡デコーダ１３８７と、１／４レートプロトタイプピッチ周期（ＱＰＰＰ）デコーダ１３８９と、第２のスイッチングブロック／モジュール１３９１と、ポストフィルタ１３９３とを含む。

電子機器１３００はパケット１３７５を受信し得る。パケット１３７５は、フレーム／ビット誤り検出器１３７７とパケット化解除ブロック／モジュール１３７９とに与えられ得る。パケット化解除ブロック／モジュール１３７９は、パケット１３７５から情報を「アンパック」し得る。例えば、パケット１３７５は、ペイロードデータに加えて、ヘッダ情報、誤り訂正情報、ルーティング情報及び／又は他の情報を含み得る。パケット化解除ブロック／モジュール１３７９はパケット１３７５からペイロードデータを抽出し得る。ペイロードデータは第１のスイッチングブロック／モジュール１３８１に与えられ得る。

フレーム／ビット誤り検出器１３７７は、パケット１３７５の部分又は全部が誤って受信されたかどうかを検出し得る。例えば、フレーム／ビット誤り検出器１３７７は、パケット１３７５のいずれかが誤って受信されたかどうかを決定するために（パケット１３７５とともに送られた）誤り検出コードを使用し得る。幾つかの構成では、電子機器１３００は、フレーム／ビット誤り検出器１３７７の出力によって示され得る、パケット１３７５の一部又は全部が誤って受信されたかどうかに基づいて、第１のスイッチングブロック／モジュール１３８１及び／又は第２のスイッチングブロック／モジュール１３９１を制御し得る。

追加又は代替として、パケット１３７５は、ペイロードデータを復号するためにどのタイプのデコーダが使用されなければならないかを示す情報を含み得る。例えば、符号化電子機器１２０２は、符号化モードを示す２ビットを送り得る。（復号）電子機器１３００は、この指示を使用して第１のスイッチングブロック／モジュール１３８１と第２のスイッチングブロック／モジュール１３９１とを制御し得る。

従って、電子機器１３００は、無音デコーダ１３８３、ＮＥＬＰデコーダ１３８５、過渡デコーダ１３８７及び／又はＱＰＰＰデコーダ１３８９を使用して、パケット１３７５からペイロードデータを復号し得る。復号されたデータは、次いで、第２のスイッチングブロック／モジュール１３９１に与えられ得、第２のスイッチングブロック／モジュール１３９１は、復号されたデータをポストフィルタ１３９３にルーティングし得る。ポストフィルタ１３９３は、復号されたデータに対して何らかのフィルタ処理を実行し、合成音声信号１３９５を出力し得る。

一例では、パケット１３７５は、ペイロードデータを符号化するために無音エンコーダ１２６３が使用されたことを（符号化モードインジケータで）示し得る。電子機器１３００は、ペイロードデータを無音デコーダ１３８３にルーティングするように第１のスイッチングブロック／モジュール１３８１を制御し得る。復号された（無音）ペイロードデータは、次いで、第２のスイッチングブロック／モジュール１３９１に与えられ得、第２のスイッチングブロック／モジュール１３９１は、復号されたペイロードデータをポストフィルタ１３９３にルーティングし得る。別の例では、ＮＥＬＰエンコーダ１２６５によって符号化された音声信号（例えば、無声音声信号）を復号するためにＮＥＬＰデコーダ１３８５が使用され得る。

別の例では、パケット１３７５は、ペイロードデータが過渡エンコーダ１２６７を使用して符号化されたことを（例えば、符号化モードインジケータを使用して）示し得る。従って、電子機器１３００は、第１のスイッチングブロック／モジュール１３８１を使用してペイロードデータを過渡デコーダ１３８７にルーティングし得る。過渡デコーダ１３８７は、上記で説明したようにペイロードデータを復号し得る。別の例では、ＱＰＰＰエンコーダ１２６９によって符号化された音声信号（例えば、有声音声信号）を復号するためにＱＰＰＰデコーダ１３８９が使用され得る。

復号されたデータは、第２のスイッチングブロック／モジュール１３９１に与えられ得、第２のスイッチングブロック／モジュール１３９１は、復号されたデータをポストフィルタ１３９３にルーティングし得る。ポストフィルタ１３９３は、信号に対して何らかのフィルタ処理を実行し得、その信号は合成音声信号１３９５として出力され得る。合成音声信号１３９５は、次いで、記憶され、（例えば、スピーカーを使用して）出力され、及び／又は別の機器（例えば、Ｂｌｕｅｔｏｏｔｈヘッドセット）に送信され得る。

図１４は、ピッチ同期利得スケーリング及びＬＰＣ合成ブロック／モジュール１４４７の一構成を示すブロック図である。図１４に示すピッチ同期利得スケーリング及びＬＰＣ合成ブロック／モジュール１４４７は、図９に示すピッチ同期利得スケーリング及びＬＰＣ合成ブロック／モジュール９４７の一例であり得る。図１４に示すように、ピッチ同期利得スケーリング及びＬＰＣ合成ブロック／モジュール１４４７は、１つ以上のＬＰＣ合成ブロック／モジュール１４９７ａ〜ｃ、１つ以上のスケール係数決定ブロック／モジュール１４９９ａ〜ｂ、及び／又は１つ以上の乗算器１４０５ａ〜ｂを含み得る。

ＬＰＣ合成ブロック／モジュールＡ１４９７ａは、（例えば、単一のピッチサイクルのために）スケーリングされてない励起１４０１を取得又は受信し得る。初めに、ＬＰＣ合成ブロック／モジュールＡ１４９７ａはまた、ゼロメモリ１４０３を使用し得る。ＬＰＣ合成ブロック／モジュールＡ１４９７ａの出力はスケール係数決定ブロック／モジュールＡ１４９９ａに与えられ得る。スケール係数決定ブロック／モジュールＡ１４９９ａは、ＬＰＣ合成Ａ１４９７ａからの出力とターゲットピッチサイクルエネルギー入力１４０７とを使用して第１のスケーリング係数を生成し得、第１のスケーリング係数は第１の乗算器１４０５ａに与えられ得る。乗算器１４０５ａは、スケーリングされてない励起信号１４０１に第１のスケーリング係数を乗算する。（スケーリングされた）励起信号又は第１の乗算器１４０５ａの出力は、ＬＰＣ合成ブロック／モジュールＢ１４９７ｂと第２の乗算器１４０５ｂとに与えられる。

ＬＰＣ合成ブロック／モジュールＢ１４９７ｂは、第１の乗算器１４０５ａの出力ならびに（前の動作からの）メモリ入力１４１３を使用して合成出力を生成し、合成出力はスケール係数決定ブロック／モジュールＢ１４９９ｂに与えられる。例えば、メモリ入力１４１３は、前フレームの終了においてメモリから入り得る。スケール係数決定ブロック／モジュールＢ１４９９ｂは、第２のスケーリング係数を生成するために、ターゲットピッチサイクルエネルギー入力１４０７の他にＬＰＣ合成ブロック／モジュールＢ１４９７ｂの出力を使用し、第２のスケーリング係数は第２の乗算器１４０５ｂに与えられる。第２の乗算器１４０５ｂは、第１の乗算器１４０５ａの出力（例えば、スケーリングされた励起信号）に第２のスケーリング係数を乗算する。得られた乗積（例えば、２回目にスケーリングされた励起信号）はＬＰＣ合成ブロック／モジュールＣ１４９７ｃに与えられる。ＬＰＣ合成ブロック／モジュールＣ１４９７ｃは、メモリ入力１４１３の他に第２の乗算器１４０５ｂの出力を使用して、合成音声信号１４０９と、さらなる動作のためのメモリ１４１１とを生成する。

図１５は、電子機器１５００において利用され得る様々な構成要素を示す図である。図示の構成要素は、同じ物理構造内に配置されるか、あるいは別個のハウジング又は構造中に配置され得る。前に説明した電子機器１０２、１６８、１２０２、１３００のうちの１つ以上は、電子機器１５００と同様に構成され得る。電子機器１５００はプロセッサ１５２１を含む。プロセッサ１５２１は、汎用シングル又はマルチチップマイクロプロセッサ（例えば、ＡＲＭ）、専用マイクロプロセッサ（例えば、デジタル信号プロセッサ（ＤＳＰ））、マイクロコントローラ、プログラマブルゲートアレイなどであり得る。プロセッサ１５２１は中央処理ユニット（ＣＰＵ）と呼ばれることがある。図１５の電子機器１５００には単一のプロセッサ１５２１のみが示されているが、代替構成では、プロセッサの組合せ（例えば、ＡＲＭとＤＳＰ）が使用され得る。

電子機器１５００はまた、プロセッサ１５２１と電子通信しているメモリ１５１５を含む。すなわち、プロセッサ１５２１は、メモリ１５１５から情報を読み取り、及び／又はメモリ１５１５に情報を書き込むことができる。メモリ１５１５は、電子情報を記憶することが可能な任意の電子構成要素であり得る。メモリ１５１５は、ランダムアクセスメモリ（ＲＡＭ）、読取り専用メモリ（ＲＯＭ）、磁気ディスクストレージ媒体、光記憶媒体、ＲＡＭ中のフラッシュメモリデバイス、プロセッサとともに含まれるオンボードメモリ、プログラマブル読取り専用メモリ（ＰＲＯＭ）、消去可能プログラマブル読取り専用メモリ（ＥＰＲＯＭ）、電気的消去可能ＰＲＯＭ（ＥＥＰＲＯＭ）、レジスタなど、及びそれらの組合せであり得る。

データ１５１９ａ及び命令１５１７ａがメモリ１５１５に記憶され得る。命令１５１７ａは、１つ以上のプログラム、ルーチン、サブルーチン、関数、プロシージャなどを含み得る。命令１５１７ａは、単一のコンピュータ可読ステートメント又は多くのコンピュータ可読ステートメントを含み得る。命令１５１７ａは、上記で説明した方法２００、３００、７００、８００、１０００、１１００のうちの１つ以上を実装するために、プロセッサ１５２１によって実行可能であり得る。命令１５１７ａを実行することは、メモリ１５１５に記憶されたデータ１５１９ａの使用を含み得る。図１５は、プロセッサ１５２１にロードされている（命令１５１７ａ及びデータ１５１９ａから来ることがある）幾つかの命令１５１７ｂ及びデータ１５１９ｂを示している。

電子機器１５００はまた、他の電子機器と通信するための１つ以上の通信インターフェース１５２３を含み得る。通信インターフェース１５２３は、ワイヤード通信技術、ワイヤレス通信技術、又は両方に基づき得る。異なるタイプの通信インターフェース１５２３の例には、シリアルポート、パラレルポート、ユニバーサルシリアルバス（ＵＳＢ）、イーサネットアダプター、ＩＥＥＥ１３９４バスインターフェース、小型コンピュータシステムインターフェース（ＳＣＳＩ）バスインターフェース、赤外線（ＩＲ）通信ポート、Ｂｌｕｅｔｏｏｔｈワイヤレス通信アダプターなどがある。

電子機器１５００はまた、１つ以上の入力デバイス１５２５と、１つ以上の出力デバイス１５２９とを含み得る。様々な種類の入力デバイス１５２５の例には、キーボード、マウス、マイクロフォン、遠隔制御デバイス、ボタン、ジョイスティック、トラックボール、タッチパッド、ライトペンなどがある。例えば、電子機器１５００は、音響信号をキャプチャするための１つ以上のマイクロフォン１５２７を含み得る。一構成では、マイクロフォン１５２７は、音響信号（例えば、ボイス、音声）を電気又は電子信号に変換するトランスデューサであり得る。様々な種類の出力デバイス１５２９の例には、スピーカー、プリンタなどがある。例えば、電子機器１５００は１つ以上のスピーカー１５３１を含み得る。一構成では、スピーカー１５３１は、電気又は電子信号を音響信号に変換するトランスデューサであり得る。電子機器１５００中に典型的に含まれ得る１つの特定のタイプの出力デバイスはディスプレイデバイス１５３３である。本明細書で開示する構成とともに使用されるディスプレイデバイス１５３３は、陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）、発光ダイオード（ＬＥＤ）、ガスプラズマ、エレクトロルミネセンスなど、任意の好適な画像投影技術を利用し得る。メモリ１５１５に記憶されたデータを、ディスプレイデバイス１５３３上に示されるテキスト、グラフィック、及び／又は（適宜に）動画に変換するために、ディスプレイコントローラ１５３５も設けられ得る。

電子機器１５００の様々な構成要素は、電力バス、制御信号バス、ステータス信号バス、データバスなどを含み得る１つ以上のバスによって互いに結合され得る。簡単のために、図１５では様々なバスはバスシステム１５３７として示してある。図１５は、電子機器１５００の１つの可能な構成しか示していないことに留意されたい。様々な他のアーキテクチャ及び構成要素も利用され得る。

図１６に、ワイヤレス通信機器１６００内に含まれ得る幾つかの構成要素を示す。上記で説明した電子機器１０２、１６８、１２０２、１３００、１５００のうちの１つ以上は、図１６に示すワイヤレス通信機器１６００と同様に構成され得る。

ワイヤレス通信機器１６００はプロセッサ１６５７を含む。プロセッサ１６５７は、汎用シングル又はマルチチップマイクロプロセッサ（例えば、ＡＲＭ）、専用マイクロプロセッサ（例えば、デジタル信号プロセッサ（ＤＳＰ））、マイクロコントローラ、プログラマブルゲートアレイなどであり得る。プロセッサ１６５７は中央処理ユニット（ＣＰＵ）と呼ばれることがある。図１６のワイヤレス通信機器１６５７には単一のプロセッサ１６００のみが示されているが、代替構成では、プロセッサの組合せ（例えば、ＡＲＭとＤＳＰ）が使用され得る。

ワイヤレス通信機器１６００はまた、プロセッサ１６５７と電子通信しているメモリ１６３９を含む（すなわち、プロセッサ１６５７は、メモリ１６３９から情報を読み取り、及び／又はメモリ１６３９に情報を書き込むことができる）。メモリ１６３９は、電子情報を記憶することが可能な任意の電子構成要素であり得る。メモリ１６３９は、ランダムアクセスメモリ（ＲＡＭ）、読取り専用メモリ（ＲＯＭ）、磁気ディスクストレージ媒体、光記憶媒体、ＲＡＭ中のフラッシュメモリデバイス、プロセッサとともに含まれるオンボードメモリ、プログラマブル読取り専用メモリ（ＰＲＯＭ）、消去可能プログラマブル読取り専用メモリ（ＥＰＲＯＭ）、電気的消去可能ＰＲＯＭ（ＥＥＰＲＯＭ）、レジスタなど、及びそれらの組合せであり得る。

データ１６４１及び命令１６４３がメモリ１６３９に記憶され得る。命令１６４３は、１つ以上のプログラム、ルーチン、サブルーチン、関数、プロシージャ、コードなどを含み得る。命令１６４３は、単一のコンピュータ可読ステートメント又は多くのコンピュータ可読ステートメントを含み得る。命令１６４３は、上記で説明した方法２００、３００、７００、８００、１０００、１１００のうちの１つ以上を実装するために、プロセッサ１６５７によって実行可能であり得る。命令１６４３を実行することは、メモリ１６３９に記憶されたデータ１６４１の使用を含み得る。図１６は、プロセッサ１６５７にロードされている（命令１６４３及びデータ１６４１から来ることがある）幾つかの命令１６４３ａ及びデータ１６４１ａを示している。

ワイヤレス通信機器１６００はまた、ワイヤレス通信機器１６００と遠隔位置（例えば、別の電子機器、通信機器など）との間の信号の送信及び受信を可能にするために、送信機１６５３と受信機１６５５とを含み得る。送信機１６５３と受信機１６５５とはトランシーバ１６５１と総称されることがある。アンテナ１６４９はトランシーバ１６５１に電気的に結合され得る。ワイヤレス通信機器１６００はまた、複数の送信機、複数の受信機、複数のトランシーバ及び／又は複数のアンテナを含み得る（図示せず）。

幾つかの構成では、ワイヤレス通信機器１６００は、音響信号をキャプチャするための１つ以上のマイクロフォン１６４５を含み得る。一構成では、マイクロフォン１６４５は、音響信号（例えば、ボイス、音声）を電気又は電子信号に変換するトランスデューサであり得る。追加又は代替として、ワイヤレス通信機器１６００は１つ以上のスピーカー１６４７を含み得る。一構成では、スピーカー１６４７は、電気又は電子信号を音響信号に変換するトランスデューサであり得る。

ワイヤレス通信機器１６００の様々な構成要素は、パワーバス、制御信号バス、ステータス信号バス、データバスなどを含み得る１つ以上のバスシステムによって一緒に結合され得る。簡単のために、図１６では様々なバスはバスシステム１６５９として示してある。

上記の説明では、様々な用語とともに参照番号を時々使用した。用語が参照番号とともに使用されている場合、これは、１つ以上の図に示された特定の要素を指すものとされ得る。用語が参照番号なしに使用されている場合、これは、概して特定の図に限定されない用語を指すものとされ得る。

「決定」という用語は、多種多様なアクションを包含し、従って、「決定」は、計算、算出、処理、導出、調査、探索（例えば、テーブル、データベース又は別のデータ構造での探索）、確認などを含むことができる。また、「決定」は、受信（例えば、情報を受信すること）、アクセス（例えば、メモリ中のデータにアクセスすること）などを含むことができる。また、「決定」は、解決、選択、選出、確立などを含むことができる。

「に基づいて」という句は、別段に明示されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という句は、「のみに基づいて」と「に少なくとも基づいて」の両方を表す。

本明細書で説明した機能は、１つ以上の命令としてコンピュータ可読媒体上に記憶され得る。「コンピュータ可読媒体」という用語は、コンピュータ又はプロセッサによってアクセスされ得る任意の利用可能な媒体を指す。限定ではなく、例として、そのような媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリ、ＣＤ−ＲＯＭ又は他の光ディスクストレージ、磁気ディスクストレージ又は他の磁気ストレージデバイス、あるいは命令又はデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備え得る。本明細書で使用するディスク（disk）及びディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザディスク（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）及びブルーレイ（登録商標）ディスク（disc）を含み、ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）は、データをレーザで光学的に再生する。コンピュータ可読媒体は有形で非一時的であり得ることに留意されたい。「コンピュータプログラム製品」という用語は、コンピューティングデバイス又はプロセッサによって実行、処理又は計算され得るコード又は命令（例えば、「プログラム」）と組み合わせたコンピューティングデバイス又はプロセッサを指す。本明細書で使用する「コード」という用語は、コンピューティングデバイス又はプロセッサによって実行可能であるソフトウェア、命令、コード又はデータを指すことがある。

ソフトウェア又は命令はまた、送信媒体を介して送信され得る。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、又は赤外線、無線、及びマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、又は他のリモートソースから送信される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、ＤＳＬ、又は赤外線、無線、及びマイクロ波などのワイヤレス技術は、送信媒体の定義に含まれる。

本明細書で開示する方法は、説明した方法を達成するための１つ以上のステップ又はアクションを備える。本方法のステップ及び／又はアクションは、特許請求の範囲の範囲から逸脱することなく互いに交換され得る。言い換えれば、本明細書で説明した方法の適切な動作のためにステップ又はアクションの特定の順序が必要とされない限り、特定のステップ及び／又はアクションの順序及び／又は使用は、特許請求の範囲の範囲を逸脱することなく修正され得る。

特許請求の範囲は、上記に示した正確な構成及び構成要素に限定されないことを理解されたい。特許請求の範囲から逸脱することなく、本明細書で説明したシステム、方法、及び装置の構成、動作及び詳細において、様々な改変、変更及び変形が行われ得る。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
［１］
過渡フレームを符号化するための電子機器であって、
プロセッサと、
前記プロセッサと電子通信しているメモリと、
を具備し、
前記メモリに記憶された命令は
現在過渡フレームを取得することと、
前記現在過渡フレームに基づいて残差信号を取得することと、
前記残差信号に基づいてピーク位置のセットを決定することと、
少なくともピーク位置の前記セットに基づいて、前記現在過渡フレームを符号化するために第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することと、
前記第１の符号化モードが決定された場合、前記第１の符号化モードに基づいて励起を合成することと、
前記第２の符号化モードが決定された場合、前記第２の符号化モードに基づいて励起を合成することと
を行うように実行可能である、電子機器。
［２］
前記命令が、前記励起と前記現在過渡フレームとに基づいて複数のスケーリング係数を決定するようにさらに実行可能である、上記［１］に記載の電子機器。
［３］
ピーク位置のセットを決定することは、
前記残差信号及びウィンドウ信号のサンプルの絶対値に基づいて包絡線信号を計算することと、
前記包絡線信号と前記包絡線信号の時間シフトバージョンとの間の差に基づいて第１の勾配信号を計算することと、
前記第１の勾配信号と前記第１の勾配信号の時間シフトバージョンとの間の差に基づいて第２の勾配信号を計算することと、
第２の勾配信号値が第１の閾値を下回る位置インデックスの第１のセットを選択することと、
包絡線値が包絡線中の最大値に対する第２の閾値を下回る位置インデックスをなくすことによって、位置インデックスの前記第１のセットから位置インデックスの第２のセットを決定することと、
近隣位置インデックスに対する差閾値を満たさない位置インデックスを削除することによって、位置インデックスの前記第２のセットから位置インデックスの第３のセットを決定することとを備える、上記［１］に記載の電子機器。
［４］
前記命令が、
線形予測係数のセットを取得するために、前記現在過渡フレームと前記現在過渡フレームより前の信号とを使用して線形予測分析を実行することと、
線形予測係数の前記セットに基づいて量子化線形予測係数のセットを決定することとを行うようにさらに実行可能である、上記［１］に記載の電子機器。
［５］
前記残差信号を取得することが、量子化線形予測係数の前記セットにさらに基づく、上記［４］に記載の電子機器。
［６］
前記第１の符号化モードが「有声過渡」符号化モードであり、前記第２の符号化モードが「他の過渡」符号化モードである、上記［１］に記載の電子機器。
［７］
第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することが、ピッチラグと、前フレームタイプと、エネルギー比とにさらに基づく、上記［１］に記載の電子機器。
［８］
前記第１の符号化モードを使用すべきか前記第２の符号化モードを使用すべきかを決定することは、
ピークの推定された数を決定することと、
ピーク位置の数がピークの前記推定された数よりも大きいかそれに等しい場合、前記第１の符号化モードを選択することと、
ピーク位置の前記セット中の最後のピークが前記現在過渡フレームの終了から第１の距離内にあり、ピーク位置の前記セット中の第１のピークが前記現在過渡フレームの開始から第２の距離内にある場合、前記第１の符号化モードを選択することと、
前フレームと前記現在過渡フレームとの間のエネルギー比が所定の範囲の外にある場合、前記第２の符号化モードを選択することと、
前記前フレームのフレームタイプが無声又は無音である場合、前記第２の符号化モードを選択することとを備える、上記［１］に記載の電子機器。
［９］
前記第１の距離がピッチラグに基づいて決定され、前記第２の距離が前記ピッチラグに基づいて決定される、上記［８］に記載の電子機器。
［１０］
前記第１の符号化モードに基づいて励起を合成することが、
前フレーム中の最後のピーク位置と前記現在過渡フレームのピッチラグとに基づいて、前記現在過渡フレーム中の最後のピークの位置を決定することと、
前記ピッチラグとスペクトル形状とに基づくプロトタイプ波形を使用した波形補間を使用して、前記前フレームの最後のサンプルと、前記現在過渡フレーム中の前記最後のピークの第１のサンプル位置との間で前記励起を合成することとを備える、上記［１］に記載の電子機器。
［１１］
前記第２の符号化モードに基づいて励起を合成することが、第１の位置において開始してプロトタイプ波形を繰り返し配置することによって前記励起を合成することを備え、前記第１の位置が、ピーク位置の前記セットからの第１のピーク位置に基づいて決定される、上記［１］に記載の電子機器。
［１２］
前記プロトタイプ波形がピッチラグとスペクトル形状とに基づき、前記プロトタイプ波形が、前記ピッチラグと前記第１の位置とフレームサイズとに基づく回数だけ繰り返し配置される、上記［１１］に記載の電子機器。
［１３］
過渡フレームを復号するための電子機器であって、
プロセッサと、
前記プロセッサと電子通信しているメモリと、
を具備し、
前記メモリに記憶された命令は、
フレームタイプを取得することと、前記フレームタイプが過渡フレームを示す場合、
過渡符号化モードパラメータを取得することと、
前記過渡符号化モードパラメータに基づいて、第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することと、
前記第１の符号化モードを使用すべきであると決定された場合、前記第１の符号化モードに基づいて励起を合成することと、
前記第２の符号化モードを使用すべきであると決定された場合、前記第２の符号化モードに基づいて励起を合成することとを行うように実行可能である、電子機器。
［１４］
前記命令が、
ピッチラグパラメータを取得することと、
前記ピッチラグパラメータに基づいてピッチラグを決定することとを行うようにさらに実行可能である、上記［１３］に記載の電子機器。
［１５］
前記命令が、
複数のスケーリング係数を取得することと、
前記複数のスケーリング係数に基づいて前記励起をスケーリングすることとを行うようにさらに実行可能である、上記［１３］に記載の電子機器。
［１６］
前記命令が、
量子化線形予測係数パラメータを取得することと、
前記量子化線形予測係数パラメータに基づいて量子化線形予測係数のセットを決定することとを行うようにさらに実行可能である、上記［１３］に記載の電子機器。
［１７］
前記命令が、前記励起と量子化線形予測係数の前記セットとに基づいて、合成音声信号を生成するようにさらに実行可能である、上記［１６］に記載の電子機器。
［１８］
前記第１の符号化モードに基づいて前記励起を合成することが、
前フレーム中の最後のピーク位置と前記現在過渡フレームのピッチラグとに基づいて、現在過渡フレーム中の最後のピークの位置を決定することと、
前記ピッチラグとスペクトル形状とに基づくプロトタイプ波形を使用した波形補間を使用して、前記前フレームの最後のサンプルと、前記現在過渡フレーム中の前記最後のピークの第１のサンプル位置との間で前記励起を合成することとを備える、上記［１３］に記載の電子機器。
［１９］
前記第２の符号化モードに基づいて励起を合成することが、
第１のピーク位置を取得することと、
第１の位置において開始してプロトタイプ波形を繰り返し配置することによって前記励起を合成することであって、前記第１の位置が前記第１のピーク位置に基づいて決定される、合成することとを備える、上記［１３］に記載の電子機器。
［２０］
前記プロトタイプ波形がピッチラグとスペクトル形状とに基づき、前記プロトタイプ波形が、前記ピッチラグと前記第１の位置とフレームサイズとに基づく回数だけ繰り返し配置される、上記［１９］に記載の電子機器。
［２１］
電子機器上で過渡フレームを符号化するための方法であって、
現在過渡フレームを取得することと、
前記現在過渡フレームに基づいて残差信号を取得することと、
前記残差信号に基づいてピーク位置のセットを決定することと、
少なくともピーク位置の前記セットに基づいて、前記現在過渡フレームを符号化するために第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することと、
前記第１の符号化モードが決定された場合、前記第１の符号化モードに基づいて励起を合成することと、
前記第２の符号化モードが決定された場合、前記第２の符号化モードに基づいて励起を合成することとを備える、方法。
［２２］
前記励起と前記現在過渡フレームとに基づいて複数のスケーリング係数を決定することをさらに備える、上記［２１］に記載の方法。
［２３］
ピーク位置のセットを決定することは、
前記残差信号及びウィンドウ信号のサンプルの絶対値に基づいて包絡線信号を計算することと、
前記包絡線信号と前記包絡線信号の時間シフトバージョンとの間の差に基づいて第１の勾配信号を計算することと、
前記第１の勾配信号と前記第１の勾配信号の時間シフトバージョンとの間の差に基づいて第２の勾配信号を計算することと、
第２の勾配信号値が第１の閾値を下回る位置インデックスの第１のセットを選択することと、
包絡線値が包絡線中の最大値に対する第２の閾値を下回る位置インデックスをなくすことによって、位置インデックスの前記第１のセットから位置インデックスの第２のセットを決定することと、
近隣位置インデックスに対する差閾値を満たさない位置インデックスを削除することによって、位置インデックスの前記第２のセットから位置インデックスの第３のセットを決定することとを備える、上記［２１］に記載の方法。
［２４］
線形予測係数のセットを取得するために、前記現在過渡フレームと前記現在過渡フレームより前の信号とを使用して線形予測分析を実行することと、
線形予測係数の前記セットに基づいて量子化線形予測係数のセットを決定することとをさらに備える、上記［２１］に記載の方法。
［２５］
前記残差信号を取得することが、量子化線形予測係数の前記セットにさらに基づく、上記［２４］に記載の方法。
［２６］
前記第１の符号化モードが「有声過渡」符号化モードであり、前記第２の符号化モードが「他の過渡」符号化モードである、上記［２１］に記載の方法。
［２７］
第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することが、ピッチラグと、前フレームタイプと、エネルギー比とにさらに基づく、上記［２１］に記載の方法。
［２８］
前記第１の符号化モードを使用すべきか前記第２の符号化モードを使用すべきかを決定することは、
ピークの推定された数を決定することと、
ピーク位置の数がピークの前記推定された数よりも大きいかそれに等しい場合、前記第１の符号化モードを選択することと、
ピーク位置の前記セット中の最後のピークが前記現在過渡フレームの終了から第１の距離内にあり、ピーク位置の前記セット中の第１のピークが前記現在過渡フレームの開始から第２の距離内にある場合、前記第１の符号化モードを選択することと、
前フレームと前記現在過渡フレームとの間のエネルギー比が所定の範囲の外にある場合、前記第２の符号化モードを選択することと、
前記前フレームのフレームタイプが無声又は無音である場合、前記第２の符号化モードを選択することとを備える、上記［２１］に記載の方法。
［２９］
前記第１の距離がピッチラグに基づいて決定され、前記第２の距離が前記ピッチラグに基づいて決定される、上記［２８］に記載の方法。
［３０］
前記第１の符号化モードに基づいて励起を合成することが、
前フレーム中の最後のピーク位置と前記現在過渡フレームのピッチラグとに基づいて、前記現在過渡フレーム中の最後のピークの位置を決定することと、
前記ピッチラグとスペクトル形状とに基づくプロトタイプ波形を使用した波形補間を使用して、前記前フレームの最後のサンプルと、前記現在過渡フレーム中の前記最後のピークの第１のサンプル位置との間で前記励起を合成することとを備える、上記［２１］に記載の方法。
［３１］
前記第２の符号化モードに基づいて励起を合成することが、第１の位置において開始してプロトタイプ波形を繰り返し配置することによって前記励起を合成することを備え、前記第１の位置が、ピーク位置の前記セットからの第１のピーク位置に基づいて決定される、上記［２１］に記載の方法。
［３２］
前記プロトタイプ波形がピッチラグとスペクトル形状とに基づき、前記プロトタイプ波形が、前記ピッチラグと前記第１の位置とフレームサイズとに基づく回数だけ繰り返し配置される、上記［３１］に記載の方法。
［３３］
電子機器上で過渡フレームを復号するための方法であって、フレームタイプを取得することと、前記フレームタイプが過渡フレームを示す場合、
過渡符号化モードパラメータを取得することと、
前記過渡符号化モードパラメータに基づいて、第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することと、
前記第１の符号化モードを使用すべきであると決定された場合、前記第１の符号化モードに基づいて励起を合成することと、
前記第２の符号化モードを使用すべきであると決定された場合、前記第２の符号化モードに基づいて励起を合成することとを備える、方法。
［３４］
ピッチラグパラメータを取得することと、
前記ピッチラグパラメータに基づいてピッチラグを決定することとをさらに備える、上記［３３］に記載の方法。
［３５］
複数のスケーリング係数を取得することと、
前記複数のスケーリング係数に基づいて前記励起をスケーリングすることとをさらに備える、上記［３３］に記載の方法。
［３６］
量子化線形予測係数パラメータを取得することと、
前記量子化線形予測係数パラメータに基づいて量子化線形予測係数のセットを決定することとをさらに備える、上記［３３］に記載の方法。
［３７］
前記励起と量子化線形予測係数の前記セットとに基づいて、合成音声信号を生成することをさらに備える、上記［３６］に記載の方法。
［３８］
前記第１の符号化モードに基づいて前記励起を合成することが、
前フレーム中の最後のピーク位置と前記現在過渡フレームのピッチラグとに基づいて、現在過渡フレーム中の最後のピークの位置を決定することと、
前記ピッチラグとスペクトル形状とに基づくプロトタイプ波形を使用した波形補間を使用して、前記前フレームの最後のサンプルと、前記現在過渡フレーム中の前記最後のピークの第１のサンプル位置との間で前記励起を合成することとを備える、上記［３３］に記載の方法。
［３９］
前記第２の符号化モードに基づいて励起を合成することは、
第１のピーク位置を取得することと、
第１の位置において開始してプロトタイプ波形を繰り返し配置することによって前記励起を合成することであって、前記第１の位置が前記第１のピーク位置に基づいて決定される、合成することとを備える、上記［３３］に記載の方法。
［４０］
前記プロトタイプ波形がピッチラグとスペクトル形状とに基づき、前記プロトタイプ波形が、前記ピッチラグと前記第１の位置とフレームサイズとに基づく回数だけ繰り返し配置される、上記［３９］に記載の方法。
［４１］
命令をその上に有する非一時的有形コンピュータ可読媒体を備える、過渡フレームを符号化するためのコンピュータプログラム製品であって、前記命令は、
電子機器に、現在過渡フレームを取得させるためのコードと、
前記電子機器に、前記現在過渡フレームに基づいて残差信号を取得させるためのコードと、
前記電子機器に、前記残差信号に基づいてピーク位置のセットを決定させるためのコードと、
前記電子機器に、少なくともピーク位置の前記セットに基づいて、前記現在過渡フレームを符号化するために第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定させるためのコードと、
前記電子機器に、前記第１の符号化モードが決定された場合、前記第１の符号化モードに基づいて励起を合成させるためのコードと、
前記電子機器に、前記第２の符号化モードが決定された場合、前記第２の符号化モードに基づいて励起を合成させるためのコードとを備える、コンピュータプログラム製品。
［４２］
前記第１の符号化モードを使用すべきか前記第２の符号化モードを使用すべきかを決定することは、
ピークの推定された数を決定することと、
ピーク位置の数がピークの前記推定された数よりも大きいかそれに等しい場合、前記第１の符号化モードを選択することと、
ピーク位置の前記セット中の最後のピークが前記現在過渡フレームの終了から第１の距離内にあり、ピーク位置の前記セット中の第１のピークが前記現在過渡フレームの開始から第２の距離内にある場合、前記第１の符号化モードを選択することと、
前フレームと前記現在過渡フレームとの間のエネルギー比が所定の範囲の外にある場合、前記第２の符号化モードを選択することと、
前記前フレームのフレームタイプが無声又は無音である場合、前記第２の符号化モードを選択することとを備える、上記［４１］に記載のコンピュータプログラム製品。
［４３］
前記第２の符号化モードに基づいて励起を合成することが、第１の位置において開始してプロトタイプ波形を繰り返し配置することによって前記励起を合成することを備え、前記第１の位置が、ピーク位置の前記セットからの第１のピーク位置に基づいて決定される、上記［４１］に記載のコンピュータプログラム製品。
［４４］
命令をその上に有する非一時的有形コンピュータ可読媒体を備える、過渡フレームを復号するためのコンピュータプログラム製品であって、前記命令は、電子機器に、フレームタイプを取得させるためのコードと、前記フレームタイプが過渡フレームを示す場合、
前記電子機器に、過渡符号化モードパラメータを取得させるためのコードと、
前記電子機器に、前記過渡符号化モードパラメータに基づいて、第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定させるためのコードと、
前記電子機器に、前記第１の符号化モードを使用すべきであると決定された場合、前記第１の符号化モードに基づいて励起を合成させるためのコードと、
前記電子機器に、前記第２の符号化モードを使用すべきであると決定された場合、前記第２の符号化モードに基づいて励起を合成させるためのコードとを備える、コンピュータプログラム製品。
［４５］
前記第２の符号化モードに基づいて励起を合成することは、
第１のピーク位置を取得することと、
第１の位置において開始してプロトタイプ波形を繰り返し配置することによって前記励起を合成することであって、前記第１の位置が前記第１のピーク位置に基づいて決定される、合成することとを備える、上記［４４］に記載のコンピュータプログラム製品。
［４６］
現在過渡フレームを取得するための手段と、
前記現在過渡フレームに基づいて残差信号を取得するための手段と、
前記残差信号に基づいてピーク位置のセットを決定するための手段と、
少なくともピーク位置の前記セットに基づいて、前記現在過渡フレームを符号化するために第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定するための手段と、
前記第１の符号化モードが決定された場合、前記第１の符号化モードに基づいて励起を合成するための手段と、
前記第２の符号化モードが決定された場合、前記第２の符号化モードに基づいて励起を合成するための手段とを備える、過渡フレームを符号化するための装置。
［４７］
前記第１の符号化モードを使用すべきか前記第２の符号化モードを使用すべきかを決定するための前記手段は、
ピークの推定された数を決定するための手段と、
ピーク位置の数がピークの前記推定された数よりも大きいかそれに等しい場合、前記第１の符号化モードを選択するための手段と、
ピーク位置の前記セット中の最後のピークが前記現在過渡フレームの終了から第１の距離内にあり、ピーク位置の前記セット中の第１のピークが前記現在過渡フレームの開始から第２の距離内にある場合、前記第１の符号化モードを選択するための手段と、
前フレームと前記現在過渡フレームとの間のエネルギー比が所定の範囲の外にある場合、前記第２の符号化モードを選択するための手段と、
前記前フレームのフレームタイプが無声又は無音である場合、前記第２の符号化モードを選択するための手段とを備える、上記［４６］に記載の装置。
［４８］
前記第２の符号化モードに基づいて励起を合成するための前記手段が、第１の位置において開始してプロトタイプ波形を繰り返し配置することによって前記励起を合成するための手段を備え、前記第１の位置が、ピーク位置の前記セットからの第１のピーク位置に基づいて決定される、上記［４６］に記載の装置。
［４９］
過渡フレームを復号するための装置であって、フレームタイプを取得するための手段と、前記フレームタイプが過渡フレームを示す場合、
過渡符号化モードパラメータを取得するための手段と、
前記過渡符号化モードパラメータに基づいて、第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定するための手段と、
前記第１の符号化モードを使用すべきであると決定された場合、前記第１の符号化モードに基づいて励起を合成するための手段と、
前記第２の符号化モードを使用すべきであると決定された場合、前記第２の符号化モードに基づいて励起を合成するための手段とを備える、装置。
［５０］
前記第２の符号化モードに基づいて励起を合成するための手段は、
第１のピーク位置を取得するための手段と、
第１の位置において開始してプロトタイプ波形を繰り返し配置することによって前記励起を合成するための手段であって、前記第１の位置が前記第１のピーク位置に基づいて決定される、合成するための手段とを備える、上記［４９］に記載の装置。

Claims

過渡フレームを符号化するための電子機器であって、
プロセッサと、
前記プロセッサと電子通信しているメモリと、
を具備し、
前記メモリに記憶された命令は
現在過渡フレームを取得することと、
前記現在過渡フレームに基づいて残差信号を取得することと、
前記残差信号に基づいてピーク位置のセットを決定することと、
少なくともピーク位置の前記セットに基づいて、前記現在過渡フレームを符号化するために第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することと、ここにおいて、前フレームに対して連続していると検出される過渡フレームを符号化するための前記第１の符号化モードを選択することと、または、前フレームに対して連続性を有さないと検出される過渡フレームを符号化するための前記第２の符号化モードを選択することとを具備し、
前記第１の符号化モードが決定された場合、波形補間を使用して励起を合成することと、
前記第２の符号化モードが決定された場合、ピッチラグと所定のスペクトル形状とに基づくプロトタイプ波形の１つまたは繰り返し配置の何れかを使用して励起を合成することと
を行うように実行可能である、電子機器。
前記命令が、前記励起と前記現在過渡フレームとに基づいて複数のスケーリング係数を決定するようにさらに実行可能である、請求項１に記載の電子機器。
ピーク位置のセットを決定することは、
前記残差信号及びウィンドウ信号のサンプルの絶対値に基づいて包絡線信号を計算することと、
前記包絡線信号と前記包絡線信号の時間シフトバージョンとの間の差に基づいて第１の勾配信号を計算することと、
前記第１の勾配信号と前記第１の勾配信号の時間シフトバージョンとの間の差に基づいて第２の勾配信号を計算することと、
第２の勾配信号値が第１の閾値を下回る位置インデックスの第１のセットを選択することと、
包絡線値が包絡線中の最大値に対する第２の閾値を下回る位置インデックスをなくすことによって、位置インデックスの前記第１のセットから位置インデックスの第２のセットを決定することと、
近隣位置インデックスに対する差閾値を満たさない位置インデックスを削除することによって、位置インデックスの前記第２のセットから位置インデックスの第３のセットを決定することとを備える、請求項１に記載の電子機器。
前記命令が、
線形予測係数のセットを取得するために、前記現在過渡フレームと前記現在過渡フレームより前の信号とを使用して線形予測分析を実行することと、
線形予測係数の前記セットに基づいて量子化線形予測係数のセットを決定することとを行うようにさらに実行可能である、請求項１に記載の電子機器。
前記残差信号を取得することが、量子化線形予測係数の前記セットにさらに基づく、請求項４に記載の電子機器。
前記第１の符号化モードが「有声過渡」符号化モードであり、前記第２の符号化モードが「他の過渡」符号化モードである、請求項１に記載の電子機器。
第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することが、ピッチラグと、前フレームタイプと、エネルギー比とにさらに基づく、請求項１に記載の電子機器。
前記第１の符号化モードを使用すべきか前記第２の符号化モードを使用すべきかを決定することは、
ピークの推定された数を決定することと、
ピーク位置の数がピークの前記推定された数よりも大きいかそれに等しい場合、前記第１の符号化モードを選択することと、
ピーク位置の前記セット中の最後のピークが前記現在過渡フレームの終了から第１の距離内にあり、ピーク位置の前記セット中の第１のピークが前記現在過渡フレームの開始から第２の距離内にある場合、前記第１の符号化モードを選択することと、
前フレームと前記現在過渡フレームとの間のエネルギー比が所定の範囲の外にある場合、前記第２の符号化モードを選択することと、
前記前フレームのフレームタイプが無声又は無音である場合、前記第２の符号化モードを選択することとを備える、請求項１に記載の電子機器。
前記第１の距離がピッチラグに基づいて決定され、前記第２の距離が前記ピッチラグに基づいて決定される、請求項８に記載の電子機器。
前記第１の符号化モードに基づいて励起を合成することが、
前フレーム中の最後のピーク位置と前記現在過渡フレームのピッチラグとに基づいて、前記現在過渡フレーム中の最後のピークの位置を決定することと、
前記ピッチラグとスペクトル形状とに基づくプロトタイプ波形を使用した前記波形補間を使用して、前記前フレームの最後のサンプルと、前記現在過渡フレーム中の前記最後のピークの第１のサンプル位置との間で前記励起を合成することとを備える、請求項１に記載の電子機器。
前記第２の符号化モードに基づいて励起を合成することが、第１の位置において開始して前記プロトタイプ波形を繰り返し配置することによって前記励起を合成することを備え、前記第１の位置が、ピーク位置の前記セットからの第１のピーク位置に基づいて決定される、請求項１に記載の電子機器。
前記プロトタイプ波形がピッチラグとスペクトル形状とに基づき、前記プロトタイプ波形が、前記ピッチラグと前記第１の位置とフレームサイズとに基づく回数だけ繰り返し配置される、請求項１１に記載の電子機器。
過渡フレームを復号するための電子機器であって、
プロセッサと、
前記プロセッサと電子通信しているメモリと、
を具備し、
前記メモリに記憶された命令は、
フレームタイプを取得することと、前記フレームタイプが過渡フレームを示す場合、
過渡符号化モードパラメータを取得することと、
前記過渡符号化モードパラメータに基づいて、第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することと、前記第1の符号化モードは、前フレームに対して連続していると符号化の間検出される過渡フレームを符号化するために使用され、及び、前記第2の符号化モードは、前記前フレームに対して連続性を有さないと符号化の間検出される過渡フレームを符号化するために使用される、
前記第１の符号化モードを使用すべきであると決定された場合、波形補間を使用して励起を合成することと、
前記第２の符号化モードを使用すべきであると決定された場合、ピッチラグと所定のスペクトル形状とに基づくプロトタイプ波形の１つまたは繰り返し配置の何れかを使用して励起を合成することとを行うように実行可能である、電子機器。
前記命令が、
ピッチラグパラメータを取得することと、
前記ピッチラグパラメータに基づいてピッチラグを決定することとを行うようにさらに実行可能である、請求項１３に記載の電子機器。
前記命令が、
複数のスケーリング係数を取得することと、
前記複数のスケーリング係数に基づいて前記励起をスケーリングすることとを行うようにさらに実行可能である、請求項１３に記載の電子機器。
前記命令が、
量子化線形予測係数パラメータを取得することと、
前記量子化線形予測係数パラメータに基づいて量子化線形予測係数のセットを決定することとを行うようにさらに実行可能である、請求項１３に記載の電子機器。
前記命令が、前記励起と量子化線形予測係数の前記セットとに基づいて、合成音声信号を生成するようにさらに実行可能である、請求項１６に記載の電子機器。
前記第１の符号化モードに基づいて前記励起を合成することが、
現在過渡フレーム中の最後のピーク位置と前記現在過渡フレームのピッチラグとに基づいて、現在過渡フレーム中の最後のピークの位置を決定することと、
前記ピッチラグとスペクトル形状とに基づくプロトタイプ波形を使用した前記波形補間を使用して、前記前フレームの最後のサンプルと、前記現在過渡フレーム中の前記最後のピークの第１のサンプル位置との間で前記励起を合成することとを備える、請求項１３に記載の電子機器。
前記第２の符号化モードに基づいて励起を合成することが、
第１のピーク位置を取得することと、
第１の位置において開始して前記プロトタイプ波形を繰り返し配置することによって前記励起を合成することであって、前記第１の位置が前記第１のピーク位置に基づいて決定される、合成することとを備える、請求項１３に記載の電子機器。
前記プロトタイプ波形がピッチラグとスペクトル形状とに基づき、前記プロトタイプ波形が、前記ピッチラグと前記第１の位置とフレームサイズとに基づく回数だけ繰り返し配置される、請求項１９に記載の電子機器。
電子機器上で過渡フレームを符号化するための方法であって、
現在過渡フレームを取得することと、
前記現在過渡フレームに基づいて残差信号を取得することと、
前記残差信号に基づいてピーク位置のセットを決定することと、
少なくともピーク位置の前記セットに基づいて、前記現在過渡フレームを符号化するために第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することと、ここにおいて、前フレームに対して連続していると検出される過渡フレームを符号化するための前記第１の符号化モードを選択することと、または、前フレームに対して連続性を有さないと検出される過渡フレームを符号化するための前記第２の符号化モードを選択することとを具備し、
前記第１の符号化モードが決定された場合、波形補間を使用して励起を合成することと、
前記第２の符号化モードが決定された場合、ピッチラグと所定のスペクトル形状とに基づくプロトタイプ波形の１つまたは繰り返し配置の何れかを使用して励起を合成することとを備える、方法。
前記励起と前記現在過渡フレームとに基づいて複数のスケーリング係数を決定することをさらに備える、請求項２１に記載の方法。
ピーク位置のセットを決定することは、
前記残差信号及びウィンドウ信号のサンプルの絶対値に基づいて包絡線信号を計算することと、
前記包絡線信号と前記包絡線信号の時間シフトバージョンとの間の差に基づいて第１の勾配信号を計算することと、
前記第１の勾配信号と前記第１の勾配信号の時間シフトバージョンとの間の差に基づいて第２の勾配信号を計算することと、
第２の勾配信号値が第１の閾値を下回る位置インデックスの第１のセットを選択することと、
包絡線値が包絡線中の最大値に対する第２の閾値を下回る位置インデックスをなくすことによって、位置インデックスの前記第１のセットから位置インデックスの第２のセットを決定することと、
近隣位置インデックスに対する差閾値を満たさない位置インデックスを削除することによって、位置インデックスの前記第２のセットから位置インデックスの第３のセットを決定することとを備える、請求項２１に記載の方法。
線形予測係数のセットを取得するために、前記現在過渡フレームと前記現在過渡フレームより前の信号とを使用して線形予測分析を実行することと、
線形予測係数の前記セットに基づいて量子化線形予測係数のセットを決定することとをさらに備える、請求項２１に記載の方法。
前記残差信号を取得することが、量子化線形予測係数の前記セットにさらに基づく、請求項２４に記載の方法。
前記第１の符号化モードが「有声過渡」符号化モードであり、前記第２の符号化モードが「他の過渡」符号化モードである、請求項２１に記載の方法。
第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することが、ピッチラグと、前フレームタイプと、エネルギー比とにさらに基づく、請求項２１に記載の方法。
前記第１の符号化モードを使用すべきか前記第２の符号化モードを使用すべきかを決定することは、
ピークの推定された数を決定することと、
ピーク位置の数がピークの前記推定された数よりも大きいかそれに等しい場合、前記第１の符号化モードを選択することと、
ピーク位置の前記セット中の最後のピークが前記現在過渡フレームの終了から第１の距離内にあり、ピーク位置の前記セット中の第１のピークが前記現在過渡フレームの開始から第２の距離内にある場合、前記第１の符号化モードを選択することと、
前フレームと前記現在過渡フレームとの間のエネルギー比が所定の範囲の外にある場合、前記第２の符号化モードを選択することと、
前記前フレームのフレームタイプが無声又は無音である場合、前記第２の符号化モードを選択することとを備える、請求項２１に記載の方法。
前記第１の距離がピッチラグに基づいて決定され、前記第２の距離が前記ピッチラグに基づいて決定される、請求項２８に記載の方法。
前記第１の符号化モードに基づいて励起を合成することが、
前フレーム中の最後のピーク位置と前記現在過渡フレームのピッチラグとに基づいて、前記現在過渡フレーム中の最後のピークの位置を決定することと、
前記ピッチラグとスペクトル形状とに基づくプロトタイプ波形を使用した前記波形補間を使用して、前記前フレームの最後のサンプルと、前記現在過渡フレーム中の前記最後のピークの第１のサンプル位置との間で前記励起を合成することとを備える、請求項２１に記載の方法。
前記第２の符号化モードに基づいて励起を合成することが、第１の位置において開始して前記プロトタイプ波形を繰り返し配置することによって前記励起を合成することを備え、前記第１の位置が、ピーク位置の前記セットからの第１のピーク位置に基づいて決定される、請求項２１に記載の方法。
前記プロトタイプ波形がピッチラグとスペクトル形状とに基づき、前記プロトタイプ波形が、前記ピッチラグと前記第１の位置とフレームサイズとに基づく回数だけ繰り返し配置される、請求項３１に記載の方法。
電子機器上で過渡フレームを復号するための方法であって、フレームタイプを取得することと、前記フレームタイプが過渡フレームを示す場合、
過渡符号化モードパラメータを取得することと、
前記過渡符号化モードパラメータに基づいて、第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定することと、前記第1の符号化モードは、前フレームに対して連続していると符号化の間検出される過渡フレームを符号化するために使用され、及び、前記第2の符号化モードは、前記前フレームに対して連続性を有さないと符号化の間検出される過渡フレームを符号化するために使用される、
前記第１の符号化モードを使用すべきであると決定された場合、波形補間を使用して励起を合成することと、
前記第２の符号化モードを使用すべきであると決定された場合、ピッチラグと所定のスペクトル形状とに基づくプロトタイプ波形の１つまたは繰り返し配置の何れかを使用して励起を合成することとを備える、方法。
ピッチラグパラメータを取得することと、
前記ピッチラグパラメータに基づいてピッチラグを決定することとをさらに備える、請求項３３に記載の方法。
複数のスケーリング係数を取得することと、
前記複数のスケーリング係数に基づいて前記励起をスケーリングすることとをさらに備える、請求項３３に記載の方法。
量子化線形予測係数パラメータを取得することと、
前記量子化線形予測係数パラメータに基づいて量子化線形予測係数のセットを決定することとをさらに備える、請求項３３に記載の方法。
前記励起と量子化線形予測係数の前記セットとに基づいて、合成音声信号を生成することをさらに備える、請求項３６に記載の方法。
前記第１の符号化モードに基づいて前記励起を合成することが、
現在過渡フレーム中の最後のピーク位置と前記現在過渡フレームのピッチラグとに基づいて、現在過渡フレーム中の最後のピークの位置を決定することと、
前記ピッチラグとスペクトル形状とに基づくプロトタイプ波形を使用した前記波形補間を使用して、前記前フレームの最後のサンプルと、前記現在過渡フレーム中の前記最後のピークの第１のサンプル位置との間で前記励起を合成することとを備える、請求項３３に記載の方法。
前記第２の符号化モードに基づいて励起を合成することは、
第１のピーク位置を取得することと、
第１の位置において開始して前記プロトタイプ波形を繰り返し配置することによって前記励起を合成することであって、前記第１の位置が前記第１のピーク位置に基づいて決定される、合成することとを備える、請求項３３に記載の方法。
前記プロトタイプ波形がピッチラグとスペクトル形状とに基づき、前記プロトタイプ波形が、前記ピッチラグと前記第１の位置とフレームサイズとに基づく回数だけ繰り返し配置される、請求項３９に記載の方法。
電子機器に、現在過渡フレームを取得させるためのコードと、
前記電子機器に、前記現在過渡フレームに基づいて残差信号を取得させるためのコードと、
前記電子機器に、前記残差信号に基づいてピーク位置のセットを決定させるためのコードと、
前記電子機器に、少なくともピーク位置の前記セットに基づいて、前記現在過渡フレームを符号化するために第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定させるためのコードと、ここにおいて、前フレームに対して連続していると検出される過渡フレームを符号化するための前記第１の符号化モードを選択することと、または、前フレームに対して連続性を有さないと検出される過渡フレームを符号化するための前記第２の符号化モードを選択することとを具備し、
前記電子機器に、前記第１の符号化モードが決定された場合、波形補間を使用して励起を合成させるためのコードと、
前記電子機器に、前記第２の符号化モードが決定された場合、ピッチラグと所定のスペクトル形状とに基づくプロトタイプ波形の１つまたは繰り返し配置の何れかを使用して励起を合成させるためのコードとを備える、コンピュータプログラム。
前記第１の符号化モードを使用すべきか前記第２の符号化モードを使用すべきかを決定することは、
ピークの推定された数を決定することと、
ピーク位置の数がピークの前記推定された数よりも大きいかそれに等しい場合、前記第１の符号化モードを選択することと、
ピーク位置の前記セット中の最後のピークが前記現在過渡フレームの終了から第１の距離内にあり、ピーク位置の前記セット中の第１のピークが前記現在過渡フレームの開始から第２の距離内にある場合、前記第１の符号化モードを選択することと、
前フレームと前記現在過渡フレームとの間のエネルギー比が所定の範囲の外にある場合、前記第２の符号化モードを選択することと、
前記前フレームのフレームタイプが無声又は無音である場合、前記第２の符号化モードを選択することとを備える、請求項４１に記載のコンピュータプログラム。
前記第２の符号化モードに基づいて励起を合成することが、第１の位置において開始して前記プロトタイプ波形を繰り返し配置することによって前記励起を合成することを備え、前記第１の位置が、ピーク位置の前記セットからの第１のピーク位置に基づいて決定される、請求項４１に記載のコンピュータプログラム。
電子機器に、フレームタイプを取得させるためのコードと、前記フレームタイプが過渡フレームを示す場合、
前記電子機器に、過渡符号化モードパラメータを取得させるためのコードと、
前記電子機器に、前記過渡符号化モードパラメータに基づいて、第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定させるためのコードと、前記第1の符号化モードは、前フレームに対して連続していると符号化の間検出される過渡フレームを符号化するために使用され、及び、前記第2の符号化モードは、前記前フレームに対して連続性を有さないと符号化の間検出される過渡フレームを符号化するために使用される、前記電子機器に、前記第１の符号化モードを使用すべきであると決定された場合、波形補間を使用して励起を合成させるためのコードと、
前記電子機器に、前記第２の符号化モードを使用すべきであると決定された場合、ピッチラグと所定のスペクトル形状とに基づくプロトタイプ波形の１つまたは繰り返し配置の何れかを使用して励起を合成させるためのコードとを備える、コンピュータプログラム。
前記第２の符号化モードに基づいて励起を合成することは、
第１のピーク位置を取得することと、
第１の位置において開始して前記プロトタイプ波形を繰り返し配置することによって前記励起を合成することであって、前記第１の位置が前記第１のピーク位置に基づいて決定される、合成することとを備える、請求項４４に記載のコンピュータプログラム。
現在過渡フレームを取得するための手段と、
前記現在過渡フレームに基づいて残差信号を取得するための手段と、
前記残差信号に基づいてピーク位置のセットを決定するための手段と、
少なくともピーク位置の前記セットに基づいて、前記現在過渡フレームを符号化するために第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定するための手段と、ここにおいて、前フレームに対して連続していると検出される過渡フレームを符号化するための前記第１の符号化モードを選択することと、または、前フレームに対して連続性を有さないと検出される過渡フレームを符号化するための前記第２の符号化モードを選択することとを具備し、
前記第１の符号化モードが決定された場合、波形補間を使用して励起を合成するための手段と、
前記第２の符号化モードが決定された場合、ピッチラグと所定のスペクトル形状とに基づくプロトタイプ波形の１つまたは繰り返し配置の何れかを使用して励起を合成するための手段とを備える、過渡フレームを符号化するための装置。
前記第１の符号化モードを使用すべきか前記第２の符号化モードを使用すべきかを決定するための前記手段は、
ピークの推定された数を決定するための手段と、
ピーク位置の数がピークの前記推定された数よりも大きいかそれに等しい場合、前記第１の符号化モードを選択するための手段と、
ピーク位置の前記セット中の最後のピークが前記現在過渡フレームの終了から第１の距離内にあり、ピーク位置の前記セット中の第１のピークが前記現在過渡フレームの開始から第２の距離内にある場合、前記第１の符号化モードを選択するための手段と、
前フレームと前記現在過渡フレームとの間のエネルギー比が所定の範囲の外にある場合、前記第２の符号化モードを選択するための手段と、
前記前フレームのフレームタイプが無声又は無音である場合、前記第２の符号化モードを選択するための手段とを備える、請求項４６に記載の装置。
前記第２の符号化モードに基づいて励起を合成するための前記手段が、第１の位置において開始して前記プロトタイプ波形を繰り返し配置することによって前記励起を合成するための手段を備え、前記第１の位置が、ピーク位置の前記セットからの第１のピーク位置に基づいて決定される、請求項４６に記載の装置。
過渡フレームを復号するための装置であって、フレームタイプを取得するための手段と、前記フレームタイプが過渡フレームを示す場合、
過渡符号化モードパラメータを取得するための手段と、
前記過渡符号化モードパラメータに基づいて、第１の符号化モードを使用すべきか第２の符号化モードを使用すべきかを決定するための手段と、前記第1の符号化モードは、前フレームに対して連続していると符号化の間検出される過渡フレームを符号化するために使用され、及び、前記第2の符号化モードは、前記前フレームに対して連続性を有さないと符号化の間検出される過渡フレームを符号化するために使用される、
前記第１の符号化モードを使用すべきであると決定された場合、波形補間を使用して励起を合成するための手段と、
前記第２の符号化モードを使用すべきであると決定された場合、ピッチラグと所定のスペクトル形状とに基づくプロトタイプ波形の１つまたは繰り返し配置の何れかを使用して励起を合成するための手段とを備える、装置。
前記第２の符号化モードに基づいて励起を合成するための手段は、
第１のピーク位置を取得するための手段と、
第１の位置において開始して前記プロトタイプ波形を繰り返し配置することによって前記励起を合成するための手段であって、前記第１の位置が前記第１のピーク位置に基づいて決定される、合成するための手段とを備える、請求項４９に記載の装置。