JP2000267699A - 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置 - Google Patents

音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置

Info

Publication number
JP2000267699A
JP2000267699A JP11075557A JP7555799A JP2000267699A JP 2000267699 A JP2000267699 A JP 2000267699A JP 11075557 A JP11075557 A JP 11075557A JP 7555799 A JP7555799 A JP 7555799A JP 2000267699 A JP2000267699 A JP 2000267699A
Authority
JP
Japan
Prior art keywords
encoding
audio signal
sound
frame
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11075557A
Other languages
English (en)
Inventor
Kenichi Minami
憲一 南
Akito Akutsu
明人 阿久津
Yoshinobu Tonomura
佳伸 外村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP11075557A priority Critical patent/JP2000267699A/ja
Publication of JP2000267699A publication Critical patent/JP2000267699A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 音響信号の種類に応じた高品質、高能率な符
号化を可能とする。 【解決手段】 入力音響信号を音響分類部102で周波
数分析して、音楽、音声、その他の音響に分類し、この
分類に応じて適切な符号化方法を選択部103で選択す
ると共にその選択を示す分類情報を生成し、分類が音楽
なら音響信号をTwinVQ、MPEG1,2などの符号化
方法で符号化部1041 により符号化し、音声なら、符
号化部1042 でPSI−CELP、CS−CELPな
どの符号化方法で符号化し、これらの符号化音響信号と
分類情報をフレームごとあるいは分類情報を適当な単位
でまとめてファイル化して符号化データとする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は音声や音楽などの
音響信号をフレームに分割し、フレームごとあるいは連
続する複数のフレームごとに符号化方法を選択して符号
化する可変ビットレート符号化方法および装置およびそ
のプログラムを記録した記録媒体、復号装置に関するも
のであり、音響信号の蓄積や伝送に適用される。
【0002】
【従来の技術】通信やマルチメディアの分野において、
音声や音楽等の音響信号を蓄積したり伝送する際には、
記録媒体や伝送路の効率的な利用を実現するために音声
あるいは音楽の高能率な符号化方法が利用されている。
例えば、音声の符号化に関しては、ピッチ同期励振源符
号駆動線形予測符号化(PSI−CELP:Pitch Sync
hronous Innovation Code Excited Linear Predictive
Coding)方法があり、自動車・携帯電話で日本の標準方
式として用いられている。この符号化方式の詳細は「自
動車電話用ハーフレート音声コーデックの検討」(間
野、他:信学技報、SP−92−133、1993)に
記載されている。この方式は、音声信号を一定の長さの
フレームに分割し、各フレームに一定のビットレートを
割り当てる固定ビットレート符号化方式を用いている
が、フレームごとあるいは同じ特徴を持つ複数のフレー
ムごとにビットレートを選択して符号化を行う可変ビッ
トレート符号化方式も提案されている。可変ビットレー
トPSI−CELP音声符号化はその一例であり、詳細
は「PSI−CELP音声符号化の可変ビットレート化
に関する検討」(大室、他:信学技報、SP−93−1
39、1994−02)に記載されている。
【0003】一方、音楽の符号化に関しては、周波数領
域重み付けインタリーブベクトル量子化(TwinVQ:Tr
ansform-domain Weighted Interleave Vector Quantiza
tion)方式があり、広帯域の音響信号を低ビットレート
で符号化することが可能である。TwinVQは、スケーラ
ブル符号化用の量子化としてISO標準符号化規格であ
るMPEGに採用されている。この符号化方式の詳細は
「周波数領域重み付けインタリーブベクトル量子化(Tw
inVQ)による楽音符号化」(岩上、他:信学論A、Vo
l.80、No. 5、pp. 830−837)に記載されてい
る。
【0004】ところで、音響信号の符号化に用いられる
ビットレートは、2kbps〜64kbpsと幅広い範囲に渡っ
ているため、ビットレートに応じて適当な符号化方式が
用いられるが、一般に音声のほうが時間変化が早く、時
間分解能が必要なのに対し、音楽は周波数分解能が必要
であるから、単にビットレートだけでなく、音響信号の
種類によっても符号化方式を選択した方が復号化したと
きに高品質な結果が得られる。この場合、対象とする音
響信号が音声主体か、音楽主体かを人が判断し、符号化
方式を一意に選択する必要があった。
【0005】
【発明が解決しようとする課題】従来の符号化方式で
は、符号化の対象となる音響信号が音声か、音楽かを人
が判断し、この情報とビットレートに応じて符号化方法
を一意に選択していたが、実際には音声と音楽が時間分
割的に混在する対象も多く存在するため、そのような場
合は充分な音質が得られない場合がある。
【0006】この発明の目的は、一連の音響信号内にお
ける音の種類を自動的に判別し、音の種類によって符号
化方法を切り換えることによって、高品質かつ効率的な
符号化方法とその復号装置を提供することにある。
【0007】
【課題を解決するための手段】上記目的を達成するた
め、この発明においては、音響信号を入力してフレーム
分割し、フレームごとに周波数解析し、各フレームを音
楽あるいは音声あるいはそれ以外の音響の少なくとも2
種類以上の音に分類し、フレームごとあるいは同じ種類
の連続したフレームごとに音の種類に応じた符号化方法
を選択し、どの符号化方法が選択されたかを示す分類情
報を生成し、選択された符号化方法により音響信号を符
号化し、分類情報と符号化された音響信号から符号化デ
ータを生成する。
【0008】また、音響信号を音楽に分類する際に、周
波数方向に安定しながら一定時間以上持続する音楽の周
波数スペクトルの時間方向のエッジの強さを用いる。ま
た、音響信号を音声に分類する際に、音声の高調波成分
を検出するくし形フィルタの出力を用いる。さらに、音
楽、音声、それ以外の音響の順に割り当てるビットレー
トを低くする。
【0009】
【発明の実施の形態】次に、この発明の実施例について
図面を参照して説明する。図1は、この発明の一実施例
の音響信号符号化装置の概略構成を示すブロック図であ
る。音声や音楽などの音響信号は、音響入力部101か
ら入力され、音響分類部102において音声、音楽、そ
の他の音響に分類される。この分類の方法については後
で述べる。次に符号化方法選択部103において、分類
された音響信号の種類に応じて適切な符号化方法を選択
する。符号化方法の例としては、音楽にはTwinVQ、M
PEG1,2、AC−3等が、音声にはPSI−CEL
P、CS−ACELP等が、その他の音響には音声に対
するものと同様のもの例えばCELPなどがそれぞれ利
用可能である。音響データは、選択された符号化方法に
応じて符号化部1041 〜1043 の何れかで符号化お
よび誤り訂正符号化される。符号化ファイル構成部10
5では、選択された符号化方法の種類を示す分類情報と
実際に符号化された音響データとをフレームごと、ある
いは、分類情報を適当な単位でまとめてファイル化し、
符号化データとして出力する。
【0010】図2は、この発明の一実施例の音響信号符
号化装置において、可変ビットレートの符号化方法を用
いた場合の概略構成を示すブロック図である。図1との
違いは、音響符号化部1041 〜1043 において、フ
レームごとの音響信号の特徴に応じてビットレートを変
化させるための音響分析部20431とモード選択部20
32が備わっている点である。音響符号化部1041
よび1042 も同様の構成にすることも可能である。音
響分析部20431では、例えば音声の場合には、音声信
号のパワー、ピッチ、相関等の特徴量を算出し、無音部
分、子音部分、母音部分等を特定する。ここでパワーは
音声信号の強度そのものであり、ピッチはいわゆる音声
帯域に特徴的な周波数情報であり、相関は音声波形を短
い周期で観測したときに現れる信号波形の相関を意味
し、特に母音の場合にこの相関が高くなるため、母音の
位置を検出できる。
【0011】モード選択部20432では、無音部分では
ビットレートを低くし、母音部分では高くするといった
ようにビットレートのモードを選択する。選択されたモ
ードに応じて音響信号は符号化部20433〜20435
符号化および誤り訂正符号化される。モード情報は、符
号化方法選択部103で選択された符号化方法を示す分
類情報と共にフレームごと、あるいは、適当な単位ごと
に符号化ファイル構成部105においてファイル化さ
れ、符号化部20433〜20435において符号化された
符号化情報と共に符号化データとして出力される。
【0012】音響分類部102で分類された音響信号が
音楽の場合には、通常可変ビットレート符号化方法を使
用することがないが、この場合でも途中で音がない休止
区間にはビットレートを低くしてもよい。分類された音
響信号が音楽でもなく、音声でもないその他の音響であ
る場合には、雑音、拍手、笑声、無音区間などが想定さ
れ、可変ビットレート符号化方式を使用することにより
効率的な符号化が達成できる。この場合の音響分析部2
0431での分析は、音声と同様な手法により実現でき
る、つまりその分析すべき特徴量としては信号パワーを
用いて、無音区間と有音区間を識別して、無音区間や雑
音区間のビットレートを低くする。
【0013】図3はこの発明の一実施例の音響信号符号
化装置における音響分類部での処理の流れを示すフロー
チャートである。まず、数十ミリ秒ごとのフレーム単位
で入力された音響信号は301で高速フーリエ変換(F
FT)され、302で数秒程度の長さを持つサウンドス
ペクトログラムが生成される。次に、周波数iを0に初
期化し、303において各周波数iにおけるサウンドス
ペクトログラムの時間方向のエッジ強度Iiを算出す
る。エッジ強度の算出には、周波数方向のスペクトル値
の微分等を用いることができる。304でそれまでの総
エッジ強度EDにエッジ強度Iiを加算して総エッジ強
度EDとし、305で周波数iが音響信号の帯域幅にお
ける最高周波数BWより大となったかを調べ、大でなけ
ればiを+1してステップ303に戻る。このようにし
て各周波数iにおけるサウンドスペクトログラムの時間
方向のエッジ強度Iiを算出する処理を帯域幅BW全体
に対して行い、その間エッジ強度の和EDを304で算
出する。305においてi>BWとなり全帯域について
の処理が終了したと判断されたならば、EDの値と予め
設定されたしきい値の比較を306で行う。EDの値が
しきい値以上であれば、このフレームは音楽に分類され
る。つまり、周波数方向に安定しながら一定時間以上持
続する周波数スペクトルの時間方向のエッジの強さが所
定値以上であればその音響信号は音楽であると判定す
る。
【0014】306においてEDがしきい値以下であっ
た場合には、i=0、j=1、maxCR=0と初期化
した後、308で音響信号周波数スペクトルをくし形フ
ィルタ処理し、その処理結果、つまりくし形フィルタ出
力CRijを算出し、309でそのCRijがそれまで最大
値maxCRより大かを調べ、大であれば310でその
CRijをmaxCRとし、次に311でくし形フィルタ
の隣接通過域間隔jがBW/2より大かを調べ、大でな
けばjを+1してステップ308に戻り、BW/2より
大であればj=1として、312でiがBWより大かを
調べ、大でなければiを+1してステップ308に戻
る。このようにして、くし形フィルタ処理は、各ライン
スペクトルに対して繰り返し処理を行う。くし形フィル
タは、中心周波数をiずらしながら、各iに対してくし
の間隔jを変化させ、309においてmaxCRとの比
較を行い、1ラインスペクトルで最大の値maxCRを
評価値とする。
【0015】maxCRと予め設定されたしきい値の比
較を313で行い、しきい値以上の場合は該当フレーム
を音声に分類する。しきい値以下の場合は、音楽でも音
声でもないその他の音響として分類する。その他の音響
として分類されたものは、有音/無音や特定のフィルタ
を用いてさらに分類することも可能である。このように
音響信号を音楽、音声、その他に分類し、各々の種類に
応じて適切な符号化方法を選択することにより、高品質
で効率の良い符号化が可能である。
【0016】以上のように符号化され音響信号に対する
復号は例えば図4に示すように入力された符号化データ
は分離部401で符号化音響信号と分類情報とに分離さ
れる。その分類情報に応じて選択部402が制御され、
符号化音響信号が復号部403,404,405の何れ
かに入力される。復号部403は、符号化側で楽音の音
響信号に対し符号化した符号化方法と対応する復号方法
により復号するものであり、復号部404は音声の音響
信号に対し符号化した符号化方法と対応する復号方法に
より復号するものであり、復号部405は音楽でもなく
音声でもない音の音響信号に対し符号化した符号化方法
と対応する復号方法により復号するものである。分類情
報が音楽を表わしていれば符号化音響信号を復号部40
3に入力し、音声を表わしていれば復号部404に入力
する。
【0017】
【発明の効果】以上のとおり、請求項1、2、6、7、
11および12記載の発明は、音響信号をフレーム分割
し、周波数解析し、各フレームを音楽あるいは音声ある
いはそれ以外の音響の少なくとも2種類以上の音に分類
し、音の種類に応じて適切な符号化方法を選択し、高品
質で効率の良い符号化が可能となる。
【0018】請求項3、8および13記載の発明は、音
響信号から得られたサウンドスペクトログラムにおい
て、周波数方向に安定しながら一定時間以上持続する時
間方向のエッジの強さを用いることによって、音響信号
を音楽に分類することができる。請求項4、9および1
4記載の発明は、音響信号から得られたサウンドスペク
トログラムに対して、くし形フィルタの出力を用いるこ
とにより音響信号を音声に分類することができる。
【0019】請求項5、10および15記載の発明は、
音響信号に対して、音楽、音声、それ以外の音響の順に
割り当てるビットレートを低くし、符号化することによ
って、高品質で効率の良い符号化が可能となる。請求項
16の記載の発明によれば、音楽、音声、その他の音と
対応した適切な復号がなされ高品質な効率の良い復号が
なされる。
【図面の簡単な説明】
【図1】この発明の一実施例の音響信号符号化装置の概
略機能構成を示すブロック図。
【図2】この発明の一実施例の音響信号符号化装置にお
いて、符号化部に可変ビットレートの方法を適用した場
合の概略機能構成を示すブロック図。
【図3】この発明の一実施例の音響信号符号化装置にお
ける音響分類部の処理の流れを示すフローチャート。
【図4】この発明の音響信号復号装置の概略機能構成を
示すブロック図。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 外村 佳伸 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 Fターム(参考) 5D045 CA01 DA11 DA20 5J064 AA01 AA02 BB10 BC02 BC25 BD03 9A001 BB04 EE04 GG03 HH16 KK31 KK43 KK54 LL02

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 音響信号をフレーム分割し、分割された
    フレームごとに符号化方法を選択して符号化する可変ビ
    ットレート符号化方法であって、 前記音響信号をフレームごとに周波数解析し、 各フレームを音楽あるいは音声あるいはそれ以外の音響
    の少なくとも2種類以上の音に分類し、フレームごとあ
    るいは同じ種類の連続したフレームごとに音の種類に応
    じた符号化方法を選択し、 どの符号化方法が選択されたかを示す分類情報を生成
    し、 選択された符号化方法により前記音響信号を符号化し、 前記分類情報と前記符号化された音響信号から符号化デ
    ータを生成することを特徴とする音響信号符号化方法。
  2. 【請求項2】 音響信号をフレーム分割し、分割された
    フレームごとに符号化方法を選択して符号化する可変ビ
    ットレート符号化方法であって、 前記音響信号をフレームごとに周波数解析し、 各フレームを音楽あるいは音声あるいはそれ以外の音響
    の少なくとも2種類以上の音に分類し、フレームごとあ
    るいは同じ種類の連続したフレームごとに音の種類に応
    じた符号化方法を選択し、 前記分類された音響信号をその分類に応じた音響分析を
    行い、その分析結果に応じたビットレートのモードを選
    択し、 前記選択された符号化方法及び前記選択されたビットレ
    ートにより前記音響信号を符号化し、 前記選択された符号化方法を示す分類情報を生成し、 前記選択されたビットレートを示すモード情報を生成
    し、 前記分類情報と前記モード情報と前記符号化された音響
    信号から符号化データを生成することを特徴とする音響
    信号符号化方法。
  3. 【請求項3】 前記音響信号を音楽に分類する際に、周
    波数方向に安定しながら一定時間以上持続する音楽の周
    波数スペクトルの時間方向のエッジの強さを用いること
    を特徴とする請求項1又は2記載の音響信号符号化方
    法。
  4. 【請求項4】 前記音響信号を音声に分類する際に、音
    声の高調波成分を検出するくし形フィルタの出力を用い
    ることを特徴とする請求項1乃至3記載の音響信号符号
    化方法。
  5. 【請求項5】 前記音響信号に対して、音楽、音声、そ
    れ以外の音響の順に割り当てるビットレートを低くし、
    符号化することを特徴とする請求項1乃至4の何れかに
    記載の音響信号符号化方法。
  6. 【請求項6】 音響信号をフレーム分割し、分割された
    フレームごとに符号化方法を選択して符号化する可変ビ
    ットレート符号化装置であって、 互いに符号化方法を異にする複数の符号化部と、 前記音響信号を入力する音響入力部と、 音響信号をフレームごとに周波数解析し、各フレームを
    音楽あるいは音声あるいはそれ以外の音響の少なくとも
    2種類以上の音に分類する音響分類部と、 フレームごとあるいは同じ種類の連続したフレームごと
    に音の種類に応じた符号化方法の符号化部を選択してそ
    の符号化部に前記音響信号を供給すると共にどの符号化
    方法が選択されたかを示す分類情報を生成する符号化方
    法選択部と、 選択された符号化部により符号化された音響信号と、前
    記分類情報とから符号化データを生成する符号化ファイ
    ル構成部とを具備することを特徴とする音響信号符号化
    装置。
  7. 【請求項7】 音響信号をフレーム分割し、分割された
    フレームごとに符号化方法を選択して符号化する可変ビ
    ットレート符号化装置であって、 符号化方法およびビットレートの少なくとも一方を互い
    に異にする複数の符号化部と、 前記音響信号を入力する音響入力部と、 前記音響信号をフレームごとに周波数解析し、各フレー
    ムを音楽あるいは音声あるいはそれ以外の音響の少なく
    とも2種類以上の音に分類する音響分類部と、 前記分類された音響信号をその分類に応じた音響分析を
    行う音響分析部と、 前記分類された音の種類に応じて選択した符号化方法を
    有し、かつ前記分析の結果に応じて選択したビットレー
    トを有する符号化部へ前記音響信号を供給すると共にど
    の符号化方法を選択したかを示す分類情報とどのビット
    レートを選択したかを示すモード情報を生成する選択部
    と、 前記符号化部により符号化された音響信号と、前記分類
    情報と前記モード情報から符号化データを生成する符号
    化ファイル構成部とを具備することを特徴とする音響信
    号符号化装置。
  8. 【請求項8】 前記音響分類部は、前記音響信号を音楽
    に分類する際に、周波数方向に安定しながら一定時間以
    上持続する音楽の周波数スペクトルの時間方向のエッジ
    の強さを用いることを特徴とする請求項6又は7記載の
    音響信号符号化装置。
  9. 【請求項9】 前記音響分類部は、前記音響信号を音声
    に分類する際に、音声の高調波成分を検出するくし形フ
    ィルタの出力を用いることを特徴とする請求項6乃至8
    の何れかに記載の音響信号符号化装置。
  10. 【請求項10】 分類結果の、音楽、音声、それ以外の
    音響の順にビットレートを低い符号化部が選択されるこ
    とを特徴とする請求項6乃至9の何れかに記載の音響信
    号符号化装置。
  11. 【請求項11】 音響信号をフレーム分割し、分割され
    たフレームごとに符号化方法を選択して符号化する可変
    ビットレート符号化プログラムを記録した記録媒体であ
    って、 前記音響信号を入力する音響入力処理と、 音響信号をフレームごとに周波数解析し、各フレームを
    音楽あるいは音声あるいはそれ以外の音響の少なくとも
    2種類以上の音に分類する音響分類処理と、 フレームごとあるいは同じ種類の連続したフレームごと
    に音の種類に応じた符号化方法を選択し、どの符号化方
    法が選択されたかを示す分類情報を生成する符号化方法
    選択処理と、 選択された符号化方法により音響信号を符号化する符号
    化処理と、 前記分類情報と前記符号化された音響信号から符号化デ
    ータを生成する符号化ファイル構成処理とをコンピュー
    タに実行させるための音響信号符号化プログラムを記録
    したことを特徴とする記録媒体。
  12. 【請求項12】 音響信号をフレーム分割し、分割され
    たフレームごとに符号化方法を選択して符号化する可変
    ビットレート符号化プログラムであって、 前記音響信号を入力する音響入力処理と、 前記音響信号をフレームごとに周波数解析し、 各フレームを音楽あるいは音声あるいはそれ以外の音響
    の少なくとも2種類以上の音に分類する音響分類処理
    と、 フレームごとあるいは同じ種類の連続したフレームごと
    に音の種類に応じた符号化方法を選択し、どの符号化方
    法が選択されたかを示す分類情報を生成する符号化方法
    選択処理と、 前記分類された音響信号をその分類に応じた音響分析を
    行う音響分析処理と、 前記分析結果に応じたビットレートのモードを選択し、
    選択されたビットレートモードを示すモード情報を生成
    するモード選択処理と、 前記選択された符号化方法及び前記選択されたビットレ
    ートモードにより前記音響信号を符号化する符号化処理
    と、 前記分類情報と前記モード情報と前記符号化された音響
    信号から符号化データを生成する符号化ファイル構成処
    理と、 をコンピュータに実行させるための音響信号符号化プロ
    グラムを記録した記録媒体。
  13. 【請求項13】 前記音響分類処理は、前記音響信号を
    音楽に分類する際に、周波数方向に安定しながら一定時
    間以上持続する音楽の周波数スペクトルの時間方向のエ
    ッジの強さを用いることを特徴とする請求項11又は1
    2記載の記録媒体。
  14. 【請求項14】 前記音響分類処理は、前記音響信号を
    音声に分類する際に、音声の高調波成分を検出するくし
    形フィルタの出力を用いることを特徴とする請求項11
    乃至13の何れかに記載の記録媒体。
  15. 【請求項15】 前記符号化処理は、音楽、音声、それ
    以外の音響の順に割り当てるビットレートを低くするこ
    とを特徴とする請求項11乃至14の何れかに記載の記
    録媒体。
  16. 【請求項16】 入力符号化データを分類情報と符号化
    音響信号に分離する分離部と、 互いに復号方法を異にし、入力された符号化音響信号を
    音響信号に復号する複数の復号部と、 前記分離された分類情報に応じて前記復号部の1つを選
    択してその復号部に前記符号化音響信号を入力する復号
    選択部とを具備する音響信号復号装置。
JP11075557A 1999-03-19 1999-03-19 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置 Pending JP2000267699A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11075557A JP2000267699A (ja) 1999-03-19 1999-03-19 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11075557A JP2000267699A (ja) 1999-03-19 1999-03-19 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置

Publications (1)

Publication Number Publication Date
JP2000267699A true JP2000267699A (ja) 2000-09-29

Family

ID=13579614

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11075557A Pending JP2000267699A (ja) 1999-03-19 1999-03-19 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置

Country Status (1)

Country Link
JP (1) JP2000267699A (ja)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006194959A (ja) * 2005-01-11 2006-07-27 Sony Corp 音声検出装置、自動撮像装置、および音声検出方法
JP2007079127A (ja) * 2005-09-14 2007-03-29 Nippon Telegr & Teleph Corp <Ntt> データ形式判別方法、信号符号化方法、それらの方法を用いた装置、プログラム、および記録媒体
JPWO2005086138A1 (ja) * 2004-03-05 2008-01-24 松下電器産業株式会社 エラー隠蔽装置およびエラー隠蔽方法
JP2008026662A (ja) * 2006-07-21 2008-02-07 Sony Corp データ記録装置、データ記録方法及びデータ記録プログラム
WO2008082133A1 (en) * 2006-12-28 2008-07-10 Samsung Electronics Co., Ltd. Method, medium, and apparatus to classify for audio signal, and method, medium and apparatus to encode and/or decode for audio signal using the same
US7469206B2 (en) 2001-11-29 2008-12-23 Coding Technologies Ab Methods for improving high frequency reconstruction
JP2009522922A (ja) * 2006-01-05 2009-06-11 テレフオンアクチーボラゲット エル エム エリクソン(パブル) メディアコンテナファイルの管理
JP2010506239A (ja) * 2006-10-10 2010-02-25 クゥアルコム・インコーポレイテッド オーディオ信号を符号化及び復号化する方法及び装置
JP2010522348A (ja) * 2007-03-20 2010-07-01 サムスン エレクトロニクス カンパニー リミテッド オーディオ信号のエンコーディング方法及び装置、そしてオーディオ信号のデコーディング方法及び装置
JP2011504249A (ja) * 2007-11-21 2011-02-03 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
WO2011039919A1 (ja) * 2009-09-30 2011-04-07 パナソニック株式会社 オーディオデコーダ、オーディオエンコーダ、システム
US7933417B2 (en) 2000-12-22 2011-04-26 Sony Corporation Encoding device and decoding device
JP2011188510A (ja) * 2002-08-08 2011-09-22 Qualcomm Inc 帯域幅適応性量子化方法と装置
WO2012020828A1 (ja) 2010-08-13 2012-02-16 株式会社エヌ・ティ・ティ・ドコモ オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム
CN104040626A (zh) * 2012-01-13 2014-09-10 高通股份有限公司 多译码模式信号分类
US9218818B2 (en) 2001-07-10 2015-12-22 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
JP2016218345A (ja) * 2015-05-25 2016-12-22 ヤマハ株式会社 音素材処理装置および音素材処理プログラム
US9542950B2 (en) 2002-09-18 2017-01-10 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9792919B2 (en) 2001-07-10 2017-10-17 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate applications
JP2020126227A (ja) * 2019-02-01 2020-08-20 富士通株式会社 信号処理方法及び情報処理装置

Cited By (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7933417B2 (en) 2000-12-22 2011-04-26 Sony Corporation Encoding device and decoding device
US9799340B2 (en) 2001-07-10 2017-10-24 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9218818B2 (en) 2001-07-10 2015-12-22 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9799341B2 (en) 2001-07-10 2017-10-24 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate applications
US9792919B2 (en) 2001-07-10 2017-10-17 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate applications
US10902859B2 (en) 2001-07-10 2021-01-26 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US10297261B2 (en) 2001-07-10 2019-05-21 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9865271B2 (en) 2001-07-10 2018-01-09 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate applications
US10540982B2 (en) 2001-07-10 2020-01-21 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US10403295B2 (en) 2001-11-29 2019-09-03 Dolby International Ab Methods for improving high frequency reconstruction
US8019612B2 (en) 2001-11-29 2011-09-13 Coding Technologies Ab Methods for improving high frequency reconstruction
US9818417B2 (en) 2001-11-29 2017-11-14 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9779746B2 (en) 2001-11-29 2017-10-03 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9812142B2 (en) 2001-11-29 2017-11-07 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9818418B2 (en) 2001-11-29 2017-11-14 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9792923B2 (en) 2001-11-29 2017-10-17 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US7469206B2 (en) 2001-11-29 2008-12-23 Coding Technologies Ab Methods for improving high frequency reconstruction
US11238876B2 (en) 2001-11-29 2022-02-01 Dolby International Ab Methods for improving high frequency reconstruction
US9761234B2 (en) 2001-11-29 2017-09-12 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US8112284B2 (en) 2001-11-29 2012-02-07 Coding Technologies Ab Methods and apparatus for improving high frequency reconstruction of audio and speech signals
US9761236B2 (en) 2001-11-29 2017-09-12 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9761237B2 (en) 2001-11-29 2017-09-12 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9431020B2 (en) 2001-11-29 2016-08-30 Dolby International Ab Methods for improving high frequency reconstruction
US8447621B2 (en) 2001-11-29 2013-05-21 Dolby International Ab Methods for improving high frequency reconstruction
JP2011188510A (ja) * 2002-08-08 2011-09-22 Qualcomm Inc 帯域幅適応性量子化方法と装置
US10418040B2 (en) 2002-09-18 2019-09-17 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US11423916B2 (en) 2002-09-18 2022-08-23 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9990929B2 (en) 2002-09-18 2018-06-05 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9842600B2 (en) 2002-09-18 2017-12-12 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10013991B2 (en) 2002-09-18 2018-07-03 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10115405B2 (en) 2002-09-18 2018-10-30 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10157623B2 (en) 2002-09-18 2018-12-18 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9542950B2 (en) 2002-09-18 2017-01-10 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10685661B2 (en) 2002-09-18 2020-06-16 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
JP4744438B2 (ja) * 2004-03-05 2011-08-10 パナソニック株式会社 エラー隠蔽装置およびエラー隠蔽方法
JPWO2005086138A1 (ja) * 2004-03-05 2008-01-24 松下電器産業株式会社 エラー隠蔽装置およびエラー隠蔽方法
JP2006194959A (ja) * 2005-01-11 2006-07-27 Sony Corp 音声検出装置、自動撮像装置、および音声検出方法
JP4520922B2 (ja) * 2005-09-14 2010-08-11 日本電信電話株式会社 データ形式判別方法、装置、プログラム、および記録媒体
JP2007079127A (ja) * 2005-09-14 2007-03-29 Nippon Telegr & Teleph Corp <Ntt> データ形式判別方法、信号符号化方法、それらの方法を用いた装置、プログラム、および記録媒体
US8225164B2 (en) 2006-01-05 2012-07-17 Telefonaktiebolaget Lm Ericsson (Publ) Media container file management
JP2009522921A (ja) * 2006-01-05 2009-06-11 テレフオンアクチーボラゲット エル エム エリクソン(パブル) メディアコンテナファイルの管理
US8185794B2 (en) 2006-01-05 2012-05-22 Telefonaktiebolaget L M Ericsson (Publ) Media container file management
JP2009522922A (ja) * 2006-01-05 2009-06-11 テレフオンアクチーボラゲット エル エム エリクソン(パブル) メディアコンテナファイルの管理
JP2008026662A (ja) * 2006-07-21 2008-02-07 Sony Corp データ記録装置、データ記録方法及びデータ記録プログラム
US9583117B2 (en) 2006-10-10 2017-02-28 Qualcomm Incorporated Method and apparatus for encoding and decoding audio signals
JP2010506239A (ja) * 2006-10-10 2010-02-25 クゥアルコム・インコーポレイテッド オーディオ信号を符号化及び復号化する方法及び装置
WO2008082133A1 (en) * 2006-12-28 2008-07-10 Samsung Electronics Co., Ltd. Method, medium, and apparatus to classify for audio signal, and method, medium and apparatus to encode and/or decode for audio signal using the same
JP2010522348A (ja) * 2007-03-20 2010-07-01 サムスン エレクトロニクス カンパニー リミテッド オーディオ信号のエンコーディング方法及び装置、そしてオーディオ信号のデコーディング方法及び装置
US8504377B2 (en) 2007-11-21 2013-08-06 Lg Electronics Inc. Method and an apparatus for processing a signal using length-adjusted window
JP2011504250A (ja) * 2007-11-21 2011-02-03 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
JP2011504249A (ja) * 2007-11-21 2011-02-03 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
KR101221918B1 (ko) 2007-11-21 2013-01-15 엘지전자 주식회사 신호 처리 방법 및 장치
US8527282B2 (en) 2007-11-21 2013-09-03 Lg Electronics Inc. Method and an apparatus for processing a signal
US8583445B2 (en) 2007-11-21 2013-11-12 Lg Electronics Inc. Method and apparatus for processing a signal using a time-stretched band extension base signal
CN102576534A (zh) * 2009-09-30 2012-07-11 松下电器产业株式会社 音频解码器、音频编码器、***
WO2011039919A1 (ja) * 2009-09-30 2011-04-07 パナソニック株式会社 オーディオデコーダ、オーディオエンコーダ、システム
JP2011075936A (ja) * 2009-09-30 2011-04-14 Panasonic Corp オーディオエンコーダ及びデコーダ
US8688442B2 (en) 2009-09-30 2014-04-01 Panasonic Corporation Audio decoding apparatus, audio coding apparatus, and system comprising the apparatuses
US9280974B2 (en) 2010-08-13 2016-03-08 Ntt Docomo, Inc. Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method, and audio encoding program
TWI570712B (zh) * 2010-08-13 2017-02-11 Ntt Docomo Inc Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program
JP2012042534A (ja) * 2010-08-13 2012-03-01 Ntt Docomo Inc オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム
CN104835501A (zh) * 2010-08-13 2015-08-12 株式会社Ntt都科摩 音频解码装置、音频解码方法、音频编码装置、音频编码方法
TWI476762B (zh) * 2010-08-13 2015-03-11 Ntt Docomo Inc Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program
WO2012020828A1 (ja) 2010-08-13 2012-02-16 株式会社エヌ・ティ・ティ・ドコモ オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム
CN103098125A (zh) * 2010-08-13 2013-05-08 株式会社Ntt都科摩 音频解码装置、音频解码方法、音频解码程序、音频编码装置、音频编码方法以及音频编码程序
JP2015507222A (ja) * 2012-01-13 2015-03-05 クゥアルコム・インコーポレイテッドQualcomm Incorporated 複数コーディングモード信号分類
CN104040626A (zh) * 2012-01-13 2014-09-10 高通股份有限公司 多译码模式信号分类
JP2016218345A (ja) * 2015-05-25 2016-12-22 ヤマハ株式会社 音素材処理装置および音素材処理プログラム
JP2020126227A (ja) * 2019-02-01 2020-08-20 富士通株式会社 信号処理方法及び情報処理装置
JP7283375B2 (ja) 2019-02-01 2023-05-30 富士通株式会社 信号処理方法及び情報処理装置

Similar Documents

Publication Publication Date Title
RU2764287C1 (ru) Способ и система для кодирования левого и правого каналов стереофонического звукового сигнала с выбором между моделями двух и четырех подкадров в зависимости от битового бюджета
JP2000267699A (ja) 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置
US8862463B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
JP4390803B2 (ja) 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
US7191120B2 (en) Speech encoding method, apparatus and program
EP1738355B1 (en) Signal encoding
EP1982329B1 (en) Adaptive time and/or frequency-based encoding mode determination apparatus and method of determining encoding mode of the apparatus
JP4270866B2 (ja) 非音声のスピーチの高性能の低ビット速度コード化方法および装置
EP1278184A2 (en) Method for coding speech and music signals
EP3537438A1 (en) Quantizing method, and quantizing apparatus
KR20080083719A (ko) 오디오 신호를 부호화하기 위한 부호화 모델들의 선택
KR20080093074A (ko) 오디오신호들의 분류
JP2007538282A (ja) 各種の符号化フレーム長でのオーディオ符号化
KR20080101872A (ko) 부호화/복호화 장치 및 방법
KR20150127041A (ko) 시간 영역 디코더에서 양자화 잡음을 감소시키기 위한 디바이스 및 방법
US11443751B2 (en) Phase reconstruction in a speech decoder
US7016832B2 (en) Voiced/unvoiced information estimation system and method therefor
US7634402B2 (en) Apparatus for coding of variable bitrate wideband speech and audio signals, and a method thereof
EP1204968B1 (en) Method and apparatus for subsampling phase spectrum information
EP3899931B1 (en) Phase quantization in a speech encoder
WO2002021091A1 (fr) Analyseur de signal de bruit, synthetiseur de signal de bruit, procede d&#39;analyse de signal de bruit et procede de synthese de signal de bruit
JP3353852B2 (ja) 音声の符号化方法
JP3490324B2 (ja) 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体
JP2001147700A (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体