JP4991743B2 - オーディオコーディングのためのエンコーダ支援フレーム損失隠蔽技術 - Google Patents
オーディオコーディングのためのエンコーダ支援フレーム損失隠蔽技術 Download PDFInfo
- Publication number
- JP4991743B2 JP4991743B2 JP2008538157A JP2008538157A JP4991743B2 JP 4991743 B2 JP4991743 B2 JP 4991743B2 JP 2008538157 A JP2008538157 A JP 2008538157A JP 2008538157 A JP2008538157 A JP 2008538157A JP 4991743 B2 JP4991743 B2 JP 4991743B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- domain data
- frequency domain
- subset
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 230000005236 sound signal Effects 0.000 claims abstract description 76
- 238000001514 detection method Methods 0.000 claims description 30
- 239000000284 extract Substances 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 5
- 238000004891 communication Methods 0.000 description 52
- 238000005516 engineering process Methods 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 8
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- BRABPYPSZVCCLR-UHFFFAOYSA-N methopromazine Chemical compound C1=CC=C2N(CCCN(C)C)C3=CC(OC)=CC=C3SC2=C1 BRABPYPSZVCCLR-UHFFFAOYSA-N 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- MOXZPMYMMBOUJY-UHFFFAOYSA-N n-[2-(2-aminoethylsulfanyl)ethyl]-5-(dimethylamino)naphthalene-1-sulfonamide Chemical compound C1=CC=C2C(N(C)C)=CC=CC2=C1S(=O)(=O)NCCSCCN MOXZPMYMMBOUJY-UHFFFAOYSA-N 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
Description
Claims (48)
- オーディオ信号のフレームを隠蔽する方法であって、
前記フレームの隣接フレームに基づいて前記フレームの周波数ドメインデータの大きさを推定するステップと、
隣接フレームのオーディオフレームとともにサイド情報としてエンコーダから送信された前記フレームの符号のサブセットに基づいて前記フレームの周波数ドメインデータの符号を推定するステップと、
前記大きさ推定と前記符号推定を結合して、前記フレームの周波数ドメインデータを推定するステップとを備える方法。 - 周波数ドメインデータを含む前記フレームのオーディオビットストリームを前記エンコーダから受信するステップと、
隣接フレームのオーディオビットストリームと共に前記フレームの前記サイド情報を前記エンコーダから受信するステップとをさらに備える、請求項1に記載の方法。 - 前記エンコーダから送信された前記フレームのオーディオビットストリームにエラー検出を実行するステップと、
1つ以上のエラーが検出された場合に前記フレームの周波数ドメインデータを破棄するステップとをさらに備える、請求項1に記載の方法。 - 前記フレームの前記周波数ドメインデータの大きさを推定するステップは、前記フレームの先行フレームおよび前記フレームの後続フレームのエネルギに基づいてエネルギ補間を実行するステップを備える、請求項1に記載の方法。
- 前記フレームの前記周波数ドメインデータの符号を推定するステップは、
前記フレームの前記周波数ドメインデータの雑音成分の符号をランダム信号から推定するステップと、
前記サイド情報として前記エンコーダから送信された前記フレームの前記符号のサブセットに基づいて前記フレームの前記周波数ドメインデータのトーン成分の符号を推定するステップとを備える、請求項1に記載の方法。 - 前記フレームの前記周波数ドメインデータの符号を推定するステップは、
前記フレームの前記周波数ドメインデータのトーン成分を選択するステップと、
前記フレーム内の前記トーン成分の場所を識別するインデックスサブセットを生成するステップと、
前記インデックスサブセットに基づいて前記フレームの前記符号のサブセットから前記トーン成分の符号を推定するステップとを備える、請求項1に記載の方法。 - トーン成分を選択するステップは、
前記周波数ドメインデータを大きさ順に分類するステップと、
最大の大きさを有する所定数の前記周波数ドメインデータを前記トーン成分として選択するステップとを備える、請求項6に記載の方法。 - 前記フレームの前記周波数ドメインデータの符号を推定するステップは、
前記フレームの前記周波数ドメインデータの前記大きさ推定からトーン成分を選択するステップと、
前記フレームの前記周波数ドメインデータの前記大きさ推定から選択された前記トーン成分の場所を識別する推定インデックスサブセットを生成するステップと、
前記フレームの前記推定インデックスサブセットに基づいて前記フレームの前記符号のサブセットから前記トーン成分の符号を推定するステップとを備える、請求項1に記載の方法。 - 前記フレームの前記周波数ドメインデータの符号を推定するステップは、
前記フレームの隣接フレームの周波数ドメインデータの大きさからトーン成分を選択するステップと、
前記隣接フレームの前記周波数ドメインデータの前記大きさから選択された前記トーン成分の場所を識別するインデックスサブセットを生成するステップと、
前記隣接フレームの前記インデックスサブセットに基づいて前記フレームの前記符号のサブセットから前記トーン成分の符号を推定するステップとを備える、請求項1に記載の方法。 - 周波数ドメインデータを含む前記フレームのオーディオビットストリームをデコーダへ送信するステップと、
隣接フレームのオーディオビットストリームと共に前記フレームの前記サイド情報をデコーダへ送信するステップとをさらに備える、請求項1に記載の方法。 - 前記サイド情報を送信するステップは、
前記フレームの前記周波数ドメインデータから前記符号のサブセットを抽出するステップと、
前記符号のサブセットを前記サイド情報として前記隣接フレームの前記オーディオビットストリームに添付するステップとを備える、請求項10に記載の方法。 - 前記フレームの前記符号のサブセットを抽出するステップは、
前記フレームの前記周波数ドメインデータのトーン成分を選択するステップと、
前記フレーム内の前記トーン成分の場所を識別するインデックスサブセットを生成するステップと、
前記インデックスサブセットに基づいて前記フレームの前記周波数ドメインデータから前記トーン成分の前記符号のサブセットを抽出するステップとを備える、請求項11に記載の方法。 - トーン成分を選択するステップは、
前記周波数ドメインデータを大きさ順に分類するステップと、
最大の大きさを有する所定数の前記周波数ドメインデータを前記トーン成分として選択するステップとを備える、請求項12に記載の方法。 - 前記フレームの前記符号のサブセットを抽出するステップは、
前記フレームの隣接フレームに基づいて前記フレームの前記周波数ドメインデータの大きさを推定するステップと、
前記フレームの前記周波数ドメインデータの大きさ推定からトーン成分を選択するステップと、
前記フレームの前記周波数ドメインデータの大きさ推定から選択された前記トーン成分の場所を識別する推定インデックスサブセットを生成するステップと、
前記フレームの前記推定インデックスサブセットに基づいて前記フレームの前記周波数ドメインデータから前記トーン成分の前記符号のサブセットを抽出するステップとを備える、請求項11に記載の方法。 - 前記フレームの前記符号のサブセットを抽出するステップは、
前記隣接フレームの周波数ドメインデータの大きさからトーン成分を選択するステップと、
前記隣接フレームの前記周波数ドメインデータの大きさから選択された前記トーン成分の場所を識別するインデックスサブセットを生成するステップと、
前記隣接フレームの前記インデックスサブセットに基づいて前記フレームの前記周波数ドメインデータから前記トーン成分の前記符号のサブセットを抽出するステップとを備える、請求項11に記載の方法。 - 前記エンコーダに含まれている変換ユニットによって前記フレームの時間ドメインオーディオ信号を前記フレームの周波数ドメインデータにエンコードするステップと、
デコーダに含まれている逆変換ユニットによって前記フレームの前記推定周波数ドメインデータを前記フレームの推定時間ドメインデータにデコードするステップとをさらに備える、請求項1に記載の方法。 - 前記サイド情報は、前記フレームの周波数ドメインデータのトーン成分の符号のサブセットを備えており、前記方法はさらに、
前記エンコーダによって前記フレーム内の前記トーン成分の場所を識別するインデックスサブセットを生成するステップと、
前記エンコーダによって前記インデックスサブセットに基づいて前記フレームの前記周波数ドメインデータから前記トーン成分の前記符号のサブセットを抽出するステップと、 前記トーン成分の前記符号のサブセットを前記サイド情報としてデコーダへ送信するステップと、
前記エンコーダと同じプロセスを使用して、前記デコーダによって前記フレーム内の前記トーン成分の場所を識別するインデックスサブセットを生成するステップと、
前記インデックスサブセットに基づいて前記符号のサブセットから前記トーン成分の符号を推定するステップとをさらに備える、請求項1に記載の方法。 - オーディオ信号のフレームを隠蔽する命令を備えるコンピュータ読み取り可能な媒体であって、前記命令はプログラマブルプロセッサに、
フレームの隣接フレームに基づいて前記フレームの周波数ドメインデータの大きさを推定させ、
隣接フレームのオーディオフレームとともにサイド情報としてエンコーダから送信された前記フレームの符号のサブセットに基づいて前記フレームの前記周波数ドメインデータの符号を推定させ、
前記大きさ推定と前記符号推定とを結合して前記フレームの周波数ドメインデータを推定させる、コンピュータ読み取り可能な記録媒体。 - 前記命令は前記プログラマブルプロセッサに、
前記フレームの前記周波数ドメインデータの雑音成分の符号をランダム信号から推定させ、
前記サイド情報として前記エンコーダから送信された前記フレームの前記符号のサブセットに基づいて前記フレームの前記周波数ドメインデータのトーン成分の符号を推定させる、請求項18に記載のコンピュータ読み取り可能な記録媒体。 - 前記命令は前記プログラマブルプロセッサに、
前記フレームの前記周波数ドメインデータを大きさ順に分類させ、
最大の大きさを有する所定数の前記周波数ドメインデータを前記フレームの前記周波数ドメインデータのトーン成分として選択させ、
前記フレーム内の前記トーン成分の場所を識別するインデックスサブセットを生成させ、
前記インデックスサブセットに基づいて前記フレームの前記符号のサブセットから前記トーン成分の符号を推定させる、請求項18に記載のコンピュータ読み取り可能な記録媒体。 - 前記プログラマブルプロセッサに、
前記フレームの前記周波数ドメインデータから前記符号のサブセットを抽出させ、
前記符号のサブセットを前記サイド情報として隣接フレームのオーディオビットストリームに添付させ、
前記隣接フレームの前記オーディオビットストリームと共に前記フレームの前記サイド情報をデコーダへ送信させる命令をさらに備える、請求項18に記載のコンピュータ読み取り可能な記録媒体。 - 前記命令は前記プログラマブルプロセッサに、
前記フレームの前記周波数ドメインデータを大きさ順に分類させ、
最大の大きさを有する所定数の前記周波数ドメインデータを前記フレームの前記周波数ドメインデータのトーン成分として選択させ、
前記フレーム内の前記トーン成分の場所を識別するインデックスサブセットを生成させ、
前記インデックスサブセットに基づいて前記フレームの前記周波数ドメインデータから前記トーン成分の前記符号のサブセットを抽出させる、請求項21に記載のコンピュータ読み取り可能な記録媒体。 - オーディオ信号のフレームを隠蔽するシステムであって、
サイド情報として前記フレームの符号のサブセットを送信するエンコーダと、
前記フレームの前記サイド情報を隣接フレームのオーディオフレームとともに前記エンコーダから受信するフレーム損失隠蔽(FLC)モジュールを含むデコーダとを備えており、
前記FLCモジュールは、前記フレームの隣接フレームに基づいて前記フレームの周波数ドメインデータの大きさを推定し、前記受信されたサイド情報に基づいて前記フレームの周波数ドメインデータの符号を推定し、前記大きさ推定と前記符号推定とを結合して前記フレームの周波数ドメインデータを推定する、システム。 - 前記FLCモジュールは、前記エンコーダから送信された前記フレームのオーディオビットストリームにエラー検出を実行し、1つ以上のエラーが検出された場合には前記フレームの周波数ドメインデータを破棄するエラー検出モジュールを含む、請求項23に記載のシステム。
- 前記FLCモジュールは、前記フレームの先行フレームおよび前記フレームの後続フレームのエネルギに基づいてエネルギ補間を実行し、前記フレームの前記周波数ドメインデータの前記大きさを推定する大きさ推定器を含む、請求項23に記載のシステム。
- 前記FLCモジュールは、
前記フレームの前記周波数ドメインデータの雑音成分の符号をランダム信号から推定し、
前記サイド情報として前記エンコーダから送信された前記フレームの前記符号のサブセットに基づいて、前記フレームの前記周波数ドメインデータのトーン成分の符号を推定する符号推定器を含む、請求項23に記載のシステム。 - 前記FLCモジュールは、前記フレームの前記周波数ドメインデータを大きさ順に分類し、最大の大きさを有する所定数の前記周波数ドメインデータを前記フレームの前記周波数ドメインデータのトーン成分として選択し、前記フレーム内の前記トーン成分の場所を識別するインデックスサブセットを生成する成分選択モジュールを含んでおり、
前記符号推定器は、前記インデックスサブセットに基づいて前記フレームの前記符号のサブセットから前記トーン成分の符号を推定する、請求項23に記載のシステム。 - 前記エンコーダは、前記フレームの前記周波数ドメインデータから前記符号のサブセットを抽出し、前記符号のサブセットを前記サイド情報として隣接フレームのオーディオビットストリームに添付する符号抽出器を含み、前記エンコーダは、前記隣接フレームの前記オーディオビットストリームと共に前記フレームの前記サイド情報を前記デコーダへ送信する、請求項23に記載のシステム。
- 前記エンコーダは、前記フレームの前記周波数ドメインデータを大きさ順に分類し、最大の大きさを有する所定数の前記周波数ドメインデータを前記フレームの前記周波数ドメインデータのトーン成分として選択し、前記フレーム内の前記トーン成分の場所を識別するインデックスサブセットを生成する成分選択モジュールを含み、
前記符号抽出器は、前記インデックスサブセットに基づいて前記フレームの前記周波数ドメインデータから前記トーン成分の前記符号のサブセットを抽出する、請求項28に記載のシステム。 - 前記フレームの周波数ドメインデータは、修正離散コサイン変換(MDCT)係数によって表される、請求項23に記載のシステム。
- 前記エンコーダは、前記フレームの時間ドメインオーディオ信号を前記フレームの周波数ドメインデータにエンコードする変換ユニットを含み、
前記デコーダは、前記フレームの前記推定周波数ドメインデータを前記フレームの推定時間ドメインデータにデコードする逆変換ユニットを含む、請求項23に記載のシステム。 - 前記エンコーダに含まれている前記変換ユニットは修正離散コサイン変換ユニットを備えており、前記デコーダに含まれている前記逆変換ユニットは逆修正離散コサイン変換ユニットを備えている、請求項31に記載のシステム。
- 前記サイド情報は、前記フレームの周波数ドメインデータのトーン成分の符号のサブセットを備えており、
前記エンコーダは、前記エンコーダによって前記フレーム内の前記トーン成分の場所を識別するインデックスサブセットを生成し、前記エンコーダによって前記インデックスサブセットに基づいて前記フレームの前記周波数ドメインデータから前記トーン成分の前記符号のサブセットを抽出し、前記トーン成分の前記符号のサブセットを前記サイド情報として前記デコーダへ送信し、
前記デコーダは、前記エンコーダと同じプロセスを使用して前記デコーダによって前記フレーム内の前記トーン成分の場所を識別するインデックスサブセットを生成し、前記インデックスサブセットに基づいて前記符号のサブセットから前記トーン成分の符号を推定する、請求項23に記載のシステム。 - オーディオ信号のフレームの周波数ドメインデータの成分を選択する成分選択モジュールと、
前記フレームの前記周波数ドメインデータから前記選択された成分の符号のサブセットを抽出する符号抽出器とを備えたエンコーダであって、
隣接フレームのオーディオフレームとともにサイド情報として前記フレームの前記符号のサブセットをデコーダへ送信する、エンコーダ。 - 前記エンコーダは、周波数ドメインデータを含む前記フレームのオーディオビットストリームを前記デコーダへ送信し、隣接フレームのオーディオビットストリームと共に前記フレームの前記サイド情報を前記デコーダへ送信し、前記符号抽出器は、前記フレームの前記サイド情報を前記隣接フレームの前記オーディオビットストリームに添付する、請求項34に記載のエンコーダ。
- 前記成分選択モジュールは、前記フレーム内の前記成分の場所を識別するインデックスサブセットを生成する、請求項34に記載のエンコーダ。
- 前記選択された成分は、前記フレームの前記周波数ドメインデータのトーン成分を備えており、前記成分選択モジュールは、前記フレームの前記周波数ドメインデータを大きさ順に分類し、最大の大きさを有する所定数の前記周波数ドメインデータを前記トーン成分として選択する、請求項34に記載のエンコーダ。
- 前記フレームの隣接フレームに基づいて前記フレームの前記周波数ドメインデータの大きさを推定する大きさ推定器と、
前記フレームの前記周波数ドメインデータの大きさ推定からトーン成分を選択し、前記フレームの前記周波数ドメインデータの大きさ推定から選択された前記トーン成分の場所を識別する推定インデックスサブセットを生成する前記成分選択モジュールと、
前記フレームの前記推定インデックスサブセットに基づいて前記フレームの前記周波数ドメインデータから前記トーン成分の前記符号のサブセットを抽出する前記符号抽出器とを含むFLCモジュールをさらに備える、請求項34に記載のエンコーダ。 - 前記成分選択モジュールは、前記隣接フレームの周波数ドメインデータの大きさからトーン成分を選択し、前記隣接フレームの前記周波数ドメインデータの大きさから選択された前記トーン成分の場所を識別するインデックスサブセットを生成し、
前記符号抽出器は、前記隣接フレームの前記インデックスサブセットに基づいて前記フレームの前記周波数ドメインデータから前記トーン成分の前記符号のサブセットを抽出する、請求項34に記載のエンコーダ。 - 前記フレームの隣接フレームに基づいてオーディオ信号のフレームの周波数ドメインデータの大きさを推定する大きさ推定器と、
隣接フレームのオーディオフレームとともにサイド情報としてエンコーダから送信された前記フレームの符号のサブセットに基づいて前記フレームの周波数ドメインデータの符号を推定する符号推定器とを含むフレーム損失隠蔽(FLC)モジュールを備えたデコーダであって、
前記大きさ推定と前記符号推定とを結合して、前記フレームの周波数ドメインデータを推定する、デコーダ。 - 前記デコーダは、周波数ドメインデータを含む前記フレームのオーディオビットストリームを前記エンコーダから受信し、隣接フレームのオーディオビットストリームと共に前記フレームの前記サイド情報を前記エンコーダから受信する、請求項40に記載のデコーダ。
- 前記FLCモジュールは、前記エンコーダから送信された前記フレームのオーディオビットストリームにエラー検出を実行し、1つ以上のエラーが検出された場合に前記フレームの周波数ドメインデータを破棄するエラー検出モジュールを含む、請求項40に記載のデコーダ。
- 前記FLCモジュールは、前記フレームの先行フレームおよび前記フレームの後続フレームのエネルギに基づいてエネルギ補間を実行し、前記フレームの前記周波数ドメインデータの前記大きさを推定する大きさ推定器を含む、請求項40に記載のデコーダ。
- 前記符号推定器は、前記フレームの前記周波数ドメインデータの雑音成分の符号をランダム信号から推定し、前記サイド情報として前記エンコーダから送信された前記フレームの前記符号のサブセットに基づいて前記フレームの前記周波数ドメインデータのトーン成分の符号を推定する、請求項40に記載のデコーダ。
- 前記FLCモジュールは、前記フレームの前記周波数ドメインデータのトーン成分を選択し、前記フレーム内の前記トーン成分の場所を識別するインデックスサブセットを生成する成分選択モジュールを含んでおり、
前記符号推定器は、前記インデックスサブセットに基づいて前記フレームの前記符号のサブセットから前記トーン成分の符号を推定する、請求項40に記載のデコーダ。 - 前記成分選択モジュールは、前記周波数ドメインデータを大きさ順に分類し、最大の大きさを有する所定数の前記周波数ドメインデータを前記トーン成分として選択する、請求項45に記載のデコーダ。
- 前記FLCモジュールは、前記フレームの前記周波数ドメインデータの前記大きさ推定からトーン成分を選択し、前記フレームの前記周波数ドメインデータの前記大きさ推定から選択された前記トーン成分の場所を識別する推定インデックスサブセットを生成する成分選択モジュールを含んでおり、
前記符号推定器は、前記フレームの前記推定インデックスサブセットに基づいて前記フレームの前記符号のサブセットから前記トーン成分の符号を推定する、請求項40に記載のデコーダ。 - 前記FLCモジュールは、前記フレームの隣接フレームの周波数ドメインデータの大きさからトーン成分を選択し、前記隣接フレームの前記周波数ドメインデータの前記大きさから選択された前記トーン成分の場所を識別するインデックスサブセットを生成する成分選択モジュールを含んでおり、
前記符号推定器は、前記隣接フレームの前記インデックスサブセットに基づいて前記フレームの前記符号のサブセットから前記トーン成分の符号を推定する、請求項40に記載のデコーダ。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US73045905P | 2005-10-26 | 2005-10-26 | |
US60/730,459 | 2005-10-26 | ||
US73201205P | 2005-10-31 | 2005-10-31 | |
US60/732,012 | 2005-10-31 | ||
US11/431,733 | 2006-05-10 | ||
US11/431,733 US8620644B2 (en) | 2005-10-26 | 2006-05-10 | Encoder-assisted frame loss concealment techniques for audio coding |
PCT/US2006/060237 WO2007051124A1 (en) | 2005-10-26 | 2006-10-25 | Encoder-assisted frame loss concealment techniques for audio coding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009514032A JP2009514032A (ja) | 2009-04-02 |
JP4991743B2 true JP4991743B2 (ja) | 2012-08-01 |
Family
ID=37772833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008538157A Expired - Fee Related JP4991743B2 (ja) | 2005-10-26 | 2006-10-25 | オーディオコーディングのためのエンコーダ支援フレーム損失隠蔽技術 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8620644B2 (ja) |
EP (1) | EP1941500B1 (ja) |
JP (1) | JP4991743B2 (ja) |
KR (1) | KR100998450B1 (ja) |
CN (1) | CN101346760B (ja) |
AT (1) | ATE499676T1 (ja) |
DE (1) | DE602006020316D1 (ja) |
WO (1) | WO2007051124A1 (ja) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008066836A1 (en) * | 2006-11-28 | 2008-06-05 | Treyex Llc | Method and apparatus for translating speech during a call |
KR101261524B1 (ko) * | 2007-03-14 | 2013-05-06 | 삼성전자주식회사 | 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치 |
CN101325537B (zh) * | 2007-06-15 | 2012-04-04 | 华为技术有限公司 | 一种丢帧隐藏的方法和设备 |
KR100906766B1 (ko) * | 2007-06-18 | 2009-07-09 | 한국전자통신연구원 | 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터송수신 장치 및 방법 |
CN101471073B (zh) * | 2007-12-27 | 2011-09-14 | 华为技术有限公司 | 一种基于频域的丢包补偿方法、装置和*** |
CN101588341B (zh) * | 2008-05-22 | 2012-07-04 | 华为技术有限公司 | 一种丢帧隐藏的方法及装置 |
AU2009256551B2 (en) * | 2008-06-13 | 2015-08-13 | Nokia Technologies Oy | Method and apparatus for error concealment of encoded audio data |
EP2311036A1 (en) * | 2008-07-09 | 2011-04-20 | Nxp B.V. | Method and device for digitally processing an audio signal and computer program product |
CN101958119B (zh) * | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
US8595005B2 (en) * | 2010-05-31 | 2013-11-26 | Simple Emotion, Inc. | System and method for recognizing emotional state from a speech signal |
HUE064739T2 (hu) | 2010-11-22 | 2024-04-28 | Ntt Docomo Inc | Audio kódoló eszköz és eljárás |
JP5724338B2 (ja) * | 2010-12-03 | 2015-05-27 | ソニー株式会社 | 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
US9767822B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
CN102810313B (zh) * | 2011-06-02 | 2014-01-01 | 华为终端有限公司 | 音频解码方法及装置 |
CN103946918B (zh) * | 2011-09-28 | 2017-03-08 | Lg电子株式会社 | 语音信号编码方法、语音信号解码方法及使用其的装置 |
EP2770503B1 (en) | 2011-10-21 | 2019-05-29 | Samsung Electronics Co., Ltd. | Method and apparatus for concealing frame errors and method and apparatus for audio decoding |
CN103325373A (zh) * | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 用于传送和接收音频信号的方法和设备 |
WO2013183977A1 (ko) | 2012-06-08 | 2013-12-12 | 삼성전자 주식회사 | 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치 |
WO2014042439A1 (ko) * | 2012-09-13 | 2014-03-20 | 엘지전자 주식회사 | 손실 프레임 복원 방법 및 오디오 복호화 방법과 이를 이용하는 장치 |
CN107731237B (zh) | 2012-09-24 | 2021-07-20 | 三星电子株式会社 | 时域帧错误隐藏设备 |
CN103714821A (zh) | 2012-09-28 | 2014-04-09 | 杜比实验室特许公司 | 基于位置的混合域数据包丢失隐藏 |
CN103854653B (zh) * | 2012-12-06 | 2016-12-28 | 华为技术有限公司 | 信号解码的方法和设备 |
PL3576087T3 (pl) * | 2013-02-05 | 2021-10-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Ukrywanie klatki utraconej sygnału audio |
EP3125239B1 (en) * | 2013-02-05 | 2019-07-17 | Telefonaktiebolaget LM Ericsson (publ) | Method and appartus for controlling audio frame loss concealment |
PL3098811T3 (pl) | 2013-02-13 | 2019-04-30 | Ericsson Telefon Ab L M | Ukrywanie błędu ramki |
BR112015031606B1 (pt) | 2013-06-21 | 2021-12-14 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Aparelho e método para desvanecimento de sinal aperfeiçoado em diferentes domínios durante ocultação de erros |
CN105408956B (zh) | 2013-06-21 | 2020-03-27 | 弗朗霍夫应用科学研究促进协会 | 用于获取音频信号的替换帧的频谱系数的方法及相关产品 |
EP2830064A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
JP2017508188A (ja) | 2014-01-28 | 2017-03-23 | シンプル エモーション, インコーポレイテッドSimple Emotion, Inc. | 適応型音声対話のための方法 |
EP2963645A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Calculator and method for determining phase correction data for an audio signal |
FR3024582A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Gestion de la perte de trame dans un contexte de transition fd/lpd |
CN112967727A (zh) | 2014-12-09 | 2021-06-15 | 杜比国际公司 | Mdct域错误掩盖 |
EP3301843A4 (en) | 2015-06-29 | 2018-05-23 | Huawei Technologies Co., Ltd. | Method for data processing and receiver device |
EP3553777B1 (en) * | 2018-04-09 | 2022-07-20 | Dolby Laboratories Licensing Corporation | Low-complexity packet loss concealment for transcoded audio signals |
CN110908630A (zh) * | 2019-11-20 | 2020-03-24 | 国家广播电视总局中央广播电视发射二台 | 音频处理方法、处理器、音频监测装置及设备 |
US11361774B2 (en) * | 2020-01-17 | 2022-06-14 | Lisnr | Multi-signal detection and combination of audio-based data transmissions |
US11418876B2 (en) | 2020-01-17 | 2022-08-16 | Lisnr | Directional detection and acknowledgment of audio-based data transmissions |
CN112365896B (zh) * | 2020-10-15 | 2022-06-14 | 武汉大学 | 一种基于栈式稀疏自编码器的面向对象编码方法 |
Family Cites Families (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
KR100220862B1 (ko) * | 1989-01-27 | 1999-09-15 | 쥬더 에드 에이. | 고품질 오디오용 저속 비트 변환 코더, 디코더 및 인코더/디코더 |
US5504833A (en) * | 1991-08-22 | 1996-04-02 | George; E. Bryan | Speech approximation using successive sinusoidal overlap-add models and pitch-scale modifications |
US5233348A (en) * | 1992-03-26 | 1993-08-03 | General Instrument Corporation | Variable length code word decoder for use in digital communication systems |
US5745169A (en) * | 1993-07-19 | 1998-04-28 | British Telecommunications Public Limited Company | Detecting errors in video images |
WO1996017449A1 (fr) * | 1994-12-02 | 1996-06-06 | Sony Corporation | Procede et dispositif d'interpolation de signal numerique, et dispositif et procede d'enregistrement et/ou de reproduction de donnees sur et/ou a partir d'un support d'enregistrement |
KR970011728B1 (ko) | 1994-12-21 | 1997-07-14 | 김광호 | 음향신호의 에러은닉방법 및 그 장치 |
JPH08223049A (ja) * | 1995-02-14 | 1996-08-30 | Sony Corp | 信号符号化方法及び装置、信号復号化方法及び装置、情報記録媒体並びに情報伝送方法 |
FR2741215B1 (fr) * | 1995-11-14 | 1998-01-23 | Matra Communication | Procede de transmission d'une sequence de bits d'information avec protection selective contre les erreurs de transmission, procedes de codage et de correction pouvant etre mis en oeuvre dans un tel procede de transmission |
JP3421962B2 (ja) | 1996-10-14 | 2003-06-30 | 日本電信電話株式会社 | 欠落音響信号合成処理方法 |
US6351730B2 (en) * | 1998-03-30 | 2002-02-26 | Lucent Technologies Inc. | Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment |
US6240141B1 (en) * | 1998-05-09 | 2001-05-29 | Centillium Communications, Inc. | Lower-complexity peak-to-average reduction using intermediate-result subset sign-inversion for DSL |
US6073151A (en) * | 1998-06-29 | 2000-06-06 | Motorola, Inc. | Bit-serial linear interpolator with sliced output |
JP3567750B2 (ja) | 1998-08-10 | 2004-09-22 | 株式会社日立製作所 | 圧縮音声再生方法及び圧縮音声再生装置 |
AU754877B2 (en) | 1998-12-28 | 2002-11-28 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method and devices for coding or decoding an audio signal or bit stream |
US6453287B1 (en) * | 1999-02-04 | 2002-09-17 | Georgia-Tech Research Corporation | Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders |
US6366888B1 (en) | 1999-03-29 | 2002-04-02 | Lucent Technologies Inc. | Technique for multi-rate coding of a signal containing information |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US7222070B1 (en) * | 1999-09-22 | 2007-05-22 | Texas Instruments Incorporated | Hybrid speech coding and system |
US7039581B1 (en) * | 1999-09-22 | 2006-05-02 | Texas Instruments Incorporated | Hybrid speed coding and system |
US6757654B1 (en) * | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
FR2813722B1 (fr) | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
JP4190742B2 (ja) * | 2001-02-09 | 2008-12-03 | ソニー株式会社 | 信号処理装置及び方法 |
US6931373B1 (en) * | 2001-02-13 | 2005-08-16 | Hughes Electronics Corporation | Prototype waveform phase modeling for a frequency domain interpolative speech codec system |
US6996523B1 (en) * | 2001-02-13 | 2006-02-07 | Hughes Electronics Corporation | Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system |
KR100591350B1 (ko) | 2001-03-06 | 2006-06-19 | 가부시키가이샤 엔.티.티.도코모 | 오디오 데이터 보간장치 및 방법, 오디오 데이터관련 정보작성장치 및 방법, 오디오 데이터 보간 정보 송신장치 및방법, 및 그 프로그램 및 기록 매체 |
JP4622164B2 (ja) | 2001-06-15 | 2011-02-02 | ソニー株式会社 | 音響信号符号化方法及び装置 |
DE10130233A1 (de) | 2001-06-22 | 2003-01-02 | Bosch Gmbh Robert | Verfahren zur Störverdeckung bei digitaler Audiosignalübertragung |
US7590525B2 (en) * | 2001-08-17 | 2009-09-15 | Broadcom Corporation | Frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
US7200561B2 (en) * | 2001-08-23 | 2007-04-03 | Nippon Telegraph And Telephone Corporation | Digital signal coding and decoding methods and apparatuses and programs therefor |
EP1315148A1 (en) * | 2001-11-17 | 2003-05-28 | Deutsche Thomson-Brandt Gmbh | Determination of the presence of ancillary data in an audio bitstream |
US6751587B2 (en) * | 2002-01-04 | 2004-06-15 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
US7047187B2 (en) | 2002-02-27 | 2006-05-16 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for audio error concealment using data hiding |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
DE10236694A1 (de) * | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7657427B2 (en) * | 2002-10-11 | 2010-02-02 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
US20040083110A1 (en) | 2002-10-23 | 2004-04-29 | Nokia Corporation | Packet loss recovery based on music signal classification and mixing |
JP2004194048A (ja) | 2002-12-12 | 2004-07-08 | Alps Electric Co Ltd | オーディオデータの転送方法および再生方法 |
US6985856B2 (en) | 2002-12-31 | 2006-01-10 | Nokia Corporation | Method and device for compressed-domain packet loss concealment |
US7139959B2 (en) * | 2003-03-24 | 2006-11-21 | Texas Instruments Incorporated | Layered low density parity check decoding for digital communications |
EP1465349A1 (en) * | 2003-03-31 | 2004-10-06 | Interuniversitair Microelektronica Centrum Vzw | Embedded multiple description scalar quantizers for progressive image transmission |
US7356748B2 (en) * | 2003-12-19 | 2008-04-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Partial spectral loss concealment in transform codecs |
SE527669C2 (sv) | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Förbättrad felmaskering i frekvensdomänen |
DE602005005640T2 (de) * | 2004-03-01 | 2009-05-14 | Dolby Laboratories Licensing Corp., San Francisco | Mehrkanalige audiocodierung |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
KR100647290B1 (ko) * | 2004-09-22 | 2006-11-23 | 삼성전자주식회사 | 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법 |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
-
2006
- 2006-05-10 US US11/431,733 patent/US8620644B2/en not_active Expired - Fee Related
- 2006-10-25 JP JP2008538157A patent/JP4991743B2/ja not_active Expired - Fee Related
- 2006-10-25 WO PCT/US2006/060237 patent/WO2007051124A1/en active Application Filing
- 2006-10-25 AT AT06846154T patent/ATE499676T1/de not_active IP Right Cessation
- 2006-10-25 DE DE602006020316T patent/DE602006020316D1/de active Active
- 2006-10-25 KR KR1020087012437A patent/KR100998450B1/ko not_active IP Right Cessation
- 2006-10-25 CN CN2006800488292A patent/CN101346760B/zh not_active Expired - Fee Related
- 2006-10-25 EP EP06846154A patent/EP1941500B1/en not_active Not-in-force
Also Published As
Publication number | Publication date |
---|---|
EP1941500B1 (en) | 2011-02-23 |
ATE499676T1 (de) | 2011-03-15 |
KR100998450B1 (ko) | 2010-12-06 |
WO2007051124A1 (en) | 2007-05-03 |
CN101346760A (zh) | 2009-01-14 |
JP2009514032A (ja) | 2009-04-02 |
KR20080070026A (ko) | 2008-07-29 |
EP1941500A1 (en) | 2008-07-09 |
DE602006020316D1 (de) | 2011-04-07 |
US20070094009A1 (en) | 2007-04-26 |
CN101346760B (zh) | 2011-09-14 |
US8620644B2 (en) | 2013-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4991743B2 (ja) | オーディオコーディングのためのエンコーダ支援フレーム損失隠蔽技術 | |
JP5357904B2 (ja) | 変換補間によるオーディオパケット損失補償 | |
KR100608062B1 (ko) | 오디오 데이터의 고주파수 복원 방법 및 그 장치 | |
EP2402939B1 (en) | Full-band scalable audio codec | |
US7610195B2 (en) | Decoding of predictively coded data using buffer adaptation | |
US9123328B2 (en) | Apparatus and method for audio frame loss recovery | |
US9830920B2 (en) | Method and apparatus for polyphonic audio signal prediction in coding and networking systems | |
JP2019505017A (ja) | 複数のオーディオ信号の符号化 | |
JP2009545780A (ja) | オーディオ信号に関連付けられるフレームを持つ窓を修正するためのシステムと方法 | |
WO2023197809A1 (zh) | 一种高频音频信号的编解码方法和相关装置 | |
EP1367564A1 (en) | Audio data interpolation apparatus and method, audio data-related information creation apparatus and method, audio data interpolation information transmission apparatus and method, program and recording medium thereof | |
KR20150021080A (ko) | 스테레오 오디오 신호 인코더 | |
CN101640793A (zh) | 一种音视频数据的解码方法、***及解码器 | |
WO2021213128A1 (zh) | 音频信号编码方法和装置 | |
Xie et al. | ITU-T G. 719: A new low-complexity full-band (20 kHz) audio coding standard for high-quality conversational applications | |
US8117029B2 (en) | Method and apparatus for matching sound quality measurement sections of variable bandwidth multi-codec | |
Ito et al. | Robust Transmission of Audio Signals over the Internet: An Advanced Packet Loss Concealment for MP3-Based Audio Signals | |
JP7420829B2 (ja) | 予測コーディングにおける低コスト誤り回復のための方法および装置 | |
WO2021136343A1 (zh) | 音频信号的编解码方法和编解码装置 | |
Kurniawati et al. | Error concealment scheme for MPEG-AAC | |
JP2006157789A (ja) | 音声障害検出装置 | |
TWI394398B (zh) | 用於傳輸資料分組序列的設備和方法以及用於對資料分組序列進行解碼的解碼器和設備 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110426 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110726 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110802 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110826 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110902 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120403 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120507 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4991743 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150511 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |