JP2001202097A - 符号化二進オーディオ処理方法 - Google Patents

符号化二進オーディオ処理方法

Info

Publication number
JP2001202097A
JP2001202097A JP2000370595A JP2000370595A JP2001202097A JP 2001202097 A JP2001202097 A JP 2001202097A JP 2000370595 A JP2000370595 A JP 2000370595A JP 2000370595 A JP2000370595 A JP 2000370595A JP 2001202097 A JP2001202097 A JP 2001202097A
Authority
JP
Japan
Prior art keywords
frame
audio
dictionary
band
audio stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000370595A
Other languages
English (en)
Inventor
Touimi Abdellatif Benjelloun
ベンジェルー トゥイーミ アブデルラティフ
Yannick Mahieux
マヒュー ヤニック
Claude Lamblin
ローンブリ クロード
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of JP2001202097A publication Critical patent/JP2001202097A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/561Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities by multiplexing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

(57)【要約】 【課題】 オーディオ流を処理する際の算出コストを低
減する。 【解決手段】 フレーム内に構成される少なくとも一つ
の二進オーディオ流を処理する方法である。これは、符
号化二進オーディオ流または各符号化二進オーディオ流
のフレーム内に含まれる選択パラメータから一組の量記
号を決定し、その量記号に基ずく符号化により生成され
た変換係数を、復号化しその後逆量子化する。そして、
前記局部複合化されたフレームを周波数領域の処理段階
に委ね、その後でこの処理したフレームを後続の処理段
階で利用可能にさせる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、各フレームに構成
される少なくとも一つの符号化二進(バイナリ)オーデ
ィオ流(フラックス)の処理方法に関する。この若しく
はこれらの二進オーディオ流は、一方ではスループット
(処理能力)を減らすために、人間の耳の音響特性を利
用した周波数タイプの符号化アルゴリズムによって、ま
た他方では、こうした符号化されるべき各信号の量子化
によって得られる。本発明は特に、量子化の際に実行さ
れるビットアロケーションデータが、考慮されるべきオ
ーディオ流の中に明らかに存在しない場合に適用でき
る。
【0002】
【発明が解決しようとする課題】本発明による処理方法
は、第1のスループットで符号化されるオーディオ流
を、第2のスループットでの別のオーディオ流に取り換
えるのに利用できる。また、この方法は、例えばオーデ
ィオテレビ会議システム内において、様々な符号化され
たオーディオ流を結合するのに利用することもできる。
【0003】本発明による方法の可能性のある応用は、
主にオーディオ流を結合(あるいはミキシング)した
後、それらのオーディオ流を関連される各端末に配信す
るオーディオブリッジの役割をとりわけ果たす、多地点
制御装置(MCU)に基づいた集中通信アーチテクチャの
場合におけるテレビ会議に関連する。
【0004】しかし本発明の方法は、システムのアーチ
テクチャが各端末で相互リンクされ、その後各端末がポ
イント−トゥー−ポイント(2地点間)でリンクされる
テレビ会議システムに適用できる点に注目される。
【0005】別の応用としては、特に他のマルチメディ
アコンテキスト(背景)において考慮されるであろう。
これは例えば、仮想シーンを構築するために、オーディ
オオブジェクトを含んだデータベースサーバにアクセス
する場合などである。
【0006】サウンド(音)の生成と編集は、新たなサ
ウンドを生成するために、一以上の圧縮された二進オー
ディオ流を処理することで構成されるが、これも本発明
に適応される別の領域である。
【0007】符号化されたオーディオ流を処理するのに
解決すべき主たる問題の一つは、この処理を行なう際の
算出コストを低減することである。一般に、こうした処
理は、周波数領域(ドメイン)から時間領域にオーディ
オ流を変換し、時間領域のオーディオ流を処理した後
で、時間領域から周波数領域に逆変換する必要があるこ
とから、時間領域内で行なわれる。これらの変換はアル
ゴリズムでの遅延と、算出コストの著しい増加をもたら
し、負担となるであろう。
【0008】特にテレビ会議の場合には、全通信時間を
減らすと共に、会話型(interactivity)に関してその
品質を高める試みが行なわれる。上述した問題は、テレ
ビ会議の場合に、多地点制御装置を設けた所での高いア
クセス数によってより重大なものとなることが注目され
る。
【0009】様々な種類の標準化されたコーディングア
ルゴリズムを用いて、テレビ会議用のオーディオ流を符
号化することができる。例えば、挟帯域ISDNの伝送に固
有の標準規格H.320は、様々なコーディングアルゴリズ
ム(G.711,G.722,G.728)を明示している。同様に標
準規格H.323も、様々なコーディングアルゴリズム(G.7
23.1,G.729,MPEG-1)を明示している。
【0010】さらに、高品質のテレビ会議における標準
規格G.722は、7kHzのバンド幅すなわち帯域幅で動作
し、そのスペクトルを2つのサブ帯域に細分するコーデ
ィングアルゴリズムを明示しており、その後でADPCM(A
daptive Differential Pulse Code Modulation)形式の
コーディングが、各帯域内の信号に対し行なわれる。
【0011】前記アルゴリズムでの遅延の問題と、直角
ミラーフィルタの各バンク(接点端子群)の複雑さを解
決するために、多地点制御装置の段階では、標準規格G.
722が、その追加1において、サブ帯域信号に基づく直
接再結合方法を明示している。この方法は、多地点制御
装置の各入力フレームにおけるサブ帯域から、2つのサ
ンプルをADPCM形式で復号化し、関連する全ての入力チ
ャネルを集計して、最後に出力フレームを構築する前に
ADCPM形式で符号化することからなる。
【0012】前記複雑さを減らすのに提案された一つの
解決法は、多地点制御装置(MCU)の段階で復号器の数
を制限し、受取ったオーディオ流の一部分だけに、符号
化されたオーディオ流を結合することである。考慮すべ
き入力チャネルを決定するには、様々な計画がある。例
えば、最大ゲインを有する信号N’を予め定義して固定
し、コード化された入力符号語(input code word)か
らゲインが直接読み込まれた場合に、最大ゲインを有す
る信号N’上で結合が行なわれる。別な例では、その後
の考慮される各入力数が変化するけれども、アクティブ
なオーディオ流上で結合を行なうものである。これらの
各方法は、アルゴリズムでの遅延を減らす問題を解決し
ないことに注目すべきである。
【0013】本発明の方法による別な応用は、第1のス
ループットで符号化されるオーディオ信号流を、第2の
スループットでの別のオーディオ信号流に取り換えるこ
とである。
【0014】こうした応用は、利用する伝送環境によっ
て与えられた通過帯域にスループットを適合しなければ
ならない場合において、様々な異種ネットワークを通し
ての伝送があるときに興味がある。これは、サービスの
品質(QoS)が保証されない(あるいは信頼できない)
場合や、通過帯域の割当てがトラヒックに依存する場合
のネットワークに対しての事例である。一般的な例は、
通過帯域制限の厳しさがより低い場合のイントラネット
環境(例えば、伝送速度が10Mbits/sのEthernet LAN)
から、さらに飽和したネットワーク(インターネット)
への通過である。この新しいH.323のテレビ会議標準規
格は、様々な種類のネットワーク(QoSを保証しないLA
N,NISDN,BISDN,RTGCなど)における端末間での共同
利用を可能にするものであるが、これは別の応用領域で
ある。他の興味ある事例は、例えばオーディオ・オンデ
マンド(即時要求)のような、オーディオサーバが呼出
されたときである。オーディオデータは、ネットワーク
上での伝送が別のスループットの低減を必要とするかも
しれないので、高品質を維持するのに十分な低圧縮レー
トではあるが、しばしば符号化されたフォームに蓄積さ
れる。
【0015】本発明の目的は、上述した問題を解決可能
にするための、少なくとも一つの符号化された二進オー
ディオ流の処理方法を提案することにある。
【0016】
【課題を解決するための手段】本発明は、最初に各変換
係数を計算するために、時間領域から周波数領域に変換
し、次にデジタルオーディオ信号から展開した選択パラ
メータから決定される一組の量記号に基づき、これらの
前記変換係数を量子化および符号化することにより符号
化されたデジタルオーディオ信号から形成される各フレ
ームとして構成され、前記選択パラメータは前記各フレ
ーム内にも存在する少なくとも一つの符号化二進オーデ
ィオ流の処理方法に関する。
【0017】本発明の本質的な特徴によれば、前記処理
方法は、符号化により生成された前記各変換係数を取り
戻すために、前記符号化二進オーディオ流または各符号
化二進オーディオ流の前記フレーム内に含まれる前記選
択パラメータに基いて、量子化段階で利用する一組の量
記号を決定する段階と、符号化により生成された前記変
換係数を取り戻すのに決めた前記一組の量記号を利用し
て、前記符号化二進オーディオ流または各符号化二進オ
ーディオ流を復号化した後で逆量子化する局部復号化段
階と、後続の利用段階に前記処理した各フレームを提供
するための、取り戻した変換係数の周波数領域における
処理段階とからなる。
【0018】第1の実行モードによれば、前記後続の利
用段階は、処理された前記変換係数の再量子化と再符号
化に関連して、1ステップで処理された前記各フレーム
を局部的に再符号化することからなる。
【0019】本発明の別な特徴によれば、前記処理段階
は、各フレームにおけるオーディオ流を局部復号化する
ことで生成される変換係数を合計すると共に、この合計
した結果を、前記再符号化の段階で提供することからな
る。
【0020】本発明は上述の方法に関係して、多地点テ
レビ会議システムを実行するのにも意図されている。こ
の処理方法は、各端末から到来する前記各フレームのオ
ーディオ流をそれぞれ部分復号化することにより得られ
た変換係数を合計することと、端末に関連する再符号化
の段階で、前記各端末から到来する前記各フレームのオ
ーディオ流を部分復号化することにより得られた変換係
数を、前記合計した結果から減算するのに、この合計し
た結果を提供することからなる。
【0021】本発明の別な実行モードによれば、本発明
の処理方法は、前記後続の利用段階が、オーディオ信号
を再構築すなわち取り戻すのための周波数領域から時間
領域への変換段階であることを特徴とする。こうした処
理方法は、例えば多地点オーディオ会議システムで利用
される。そしてこれは、前記処理段階が、各端末から到
来する前記各フレームのオーディオ流を部分復号化する
ことにより得られた変換係数をそれぞれ合計することか
らなるという事実から特徴付けられる。
【0022】本発明の別な特徴によれば、前記一組の量
記号における選択パラメータの各値は、前記処理段階に
も従属すなわち作用が及んでいる。
【0023】前記オーディオ流または各オーディオ流の
前記フレームに含まれる前記一組の量記号の選択パラメ
ータが、予め決められた周波数帯域内におけるオーディ
オ信号のエネルギーの値であり、その値の組がスペクト
ル包絡線と呼ばれる場合、前記処理段階は、例えば前記
フレームのオーディオ流をそれぞれ部分復号化すること
により得られた変換係数を合計し、この変換係数を合計
した結果を再符号化の段階で提供することからなると共
に、その後各フレームのエネルギーを合計することによ
り、各周波数帯域におけるエネルギー総計を決定し、こ
のエネルギーを合計した結果を再符号化の段階で提供す
ることからなる。
【0024】多地点オーディオ会議システムを利用する
場合、前記処理方法は次のように特徴付けられる。すな
わち、前記処理段階は、各端末から各々到来する前記各
フレームのオーディオ流をそれぞれ部分復号化すること
により得られた変換係数を合計し、端末に関連する再符
号化の段階で、前記各端末から到来する前記各フレーム
のオーディオ流を部分復号化することにより得られた変
換係数を、前記変換係数を合計した結果から減算するの
に、この合計した結果を提供することからなると共に、
前記各端末から到来する各フレームのエネルギーを合計
することにより、各周波数帯域におけるエネルギー総計
を決定し、端末に関連する再符号化の段階で、前記端末
から到来したフレームからのエネルギーを、前記エネル
ギーを合計した結果から減算するのに、この合計した結
果を提供することからなる。
【0025】本発明の別な特徴によれば、前記オーデイ
オ流または各オーディオ流の前記フレームは、それに対
応するオーディオ信号のボイシング情報を含んでおり、
前記処理段階は、この処理段階から得られた前記オーデ
イオ信号に対するボイシング情報を決定する。前記処理
段階から得られたオーデイオ信号に対するこのボイシン
グ情報を決定するために、例えば全てのオーディオ流の
フレームが同一のボイシング状態である場合に、このボ
イシング状態を前記処理段階から得られたオーディオ信
号の状態として考慮する一方で、全てのオーディオ流の
フレームが同一のボイシング状態でない場合に、有音フ
レームのオーディオ信号組のエネルギー総計と、無音フ
レームのオーディオ組のエネルギーを決定し、その後で
最大エネルギーを有する組のボイシング状態を、こうし
た処理段階から得られたオーディオ信号の状態として考
慮するようにしてもよい。
【0026】前記オーデイオ流または各オーディオ流の
前記フレームが、対応するオーディオ信号のトーン情報
を含んでいる場合、前記処理段階は、全ての各フレーム
が同じ種類のトーン情報であれば、この処理段階から得
られたオーディオ信号に対するトーン情報を、前記各フ
レームの信号状態であるものとして決定してもよい。
【0027】本発明の別な特徴によれば、処理されるべ
き全てのフレームの中から、与えられた帯域内で最大エ
ネルギーを有するフレームを見つけ出し、この与えられ
た帯域内で最大エネルギーを有するフレーム以外の各入
力フレームの係数が、前記与えられた帯域内で最大エネ
ルギーを有するフレームのマスキング閾値によってマス
クされる場合に、出力フレームの係数を前記与えられた
帯域内で最大エネルギーを有する前記フレームの係数と
等しくさせるようにしている。この与えられた帯域内で
の出力フレームのエネルギーは、例えばこの与えられた
帯域内の前記入力フレームの最大エネルギーと等しくな
る。
【0028】本発明の別な特徴によれば、前記再量子化
の段階が、サイズ毎に埋め込まれるディクショナリを備
えたベクトルの量子化を行なうものであるときに、仮に
帯域に対応する入力ディクショナリが選択された出力デ
ィクショナリに含まれる場合、あるいは反対の場合で、
出力ディクショナリが入力ディクショナリに含まれるも
のの、量子化されたベクトルにおいて、入力ディクショ
ナリの要素も出力ディクショナリの要素であるである場
合に、出力帯域に対する符号語が入力帯域に対する符号
語と等しくなり、それとは別に、出力ディクショナリに
おける逆量子化とその後の再量子化に関連する処理が実
行される。
【0029】例えば、前記再量子化の段階は、サイズ毎
に埋め込まれるディクショナリを備えたベクトルの量子
化を行なうものであり、そのディクショナリは、順列
(permutation)コードの和から構成される。その後、
仮にその帯域に対応する入力ディクショナリが選択され
た出力ディクショナリに含まれる場合、あるいは反対の
場合で、出力ディクショナリが入力ディクショナリに含
まれるものの、量子化されたベクトルにおいて、入力デ
ィクショナリの要素も出力ディクショナリの要素である
である場合に、出力帯域に対する符号語が入力帯域に対
する符号語と等しくなり、それとは別に、出力ディクシ
ョナリにおける逆量子化とその後の再量子化の処理が実
行され、入力ディクショナリのベクトルのリーダーに最
も近傍に隣接するものを、出力ディクショナリのリーダ
とすることで、再量子化の処理を高速化する利点があ
る。
【0030】上述およびその他の発明の各特徴は、次の
実施例における記述を読むことでより明確になるであろ
う。この実施例における記述は、添付図面に関連される
ものである。
【0031】
【発明の実施形態】図1に示すテレビ会議システムは、
多地点制御装置(MCU)にそれぞれ接続されるN個の端
末10〜10Nから本質的に構成される。より詳細には、
各端末10は、その入力が別な端末に伝送するためのオー
ディオデータを受取り、その出力が多地点制御装置20の
入力に接続される符号器11を備えている。また各端末10
は、その入力が多地点制御装置20の出力に接続され、そ
の出力が別の端末に相当する端末に伝送されるデータを
配信する復号器12を備えている。
【0032】一般に符号器11は、図2に示すように、知
覚的な周波数タイプのものからなる。したがって、一方
では、時間領域から周波数領域に入力データを変換する
のに利用される装置110を備え、他方では、この装置110
で行なわれた変換によって生成された係数を量子化し符
号化する量子化符号化装置111を備えている。一般に、
量子化は一組のクオンティファイア(quantifier:量記
号)に基づいて行われ、各量記号は、例えば符号化され
るべき信号から装置112によって展開された一定の数値
に依存する。これらの各値は、一組の量記号からの選択
パラメータである。最後に、量子化され符号化された各
係数は、装置113によりオーディオフレーム内にフォー
マットされる。
【0033】以下に示すように、符号器11は量記号の選
択パラメータからなる各値のデータを送り出してもよい
ことが注目される。またこれらの各値は、予め決められ
た周波数帯域内におけるオーディオ信号のエネルギーに
関係し、入力オーディオ信号間でこの入力オーディオ信
号のスペクトル包絡線を形成することが注目される。さ
らに、符号器11はボイシング(voicing)情報およびト
ーン(tone)情報データを出力するものでもよい。
【0034】しかし本発明の背景においては、装置111
により行なわれた量子化や符号化処理の際に利用した量
記号に関係する明確な情報を、符号器11が送り出すもの
ではない。
【0035】各端末10の復号器12は、符号器11によって
行なわれるものとは反対の動作を実行するのに意図され
ている。したがって復号器12は、多地点制御装置20から
受取ったオーディオフレーム内に含まれる係数を量子化
の動作時とは逆に逆量子化した後、符号器11により行わ
れたものと逆の変換を行なって、時間領域におけるデー
タを送り出すことを意図している。この逆量子化段階
(stage)は、量子化の過程で用いた量記号を認識する
ことが必要で、フレーム内に存在する選択パラメータの
各値によってこの認識が与えられる。復号器12は、多地
点制御装置20から受取ったデータからのボイシングおよ
びトーン情報を利用してもよい。
【0036】本発明に基づく図1に示した多地点制御装
置20は、その各入力にある信号を結合すると共に、端末
10mからの信号を除いて、他のN個の端末の全符号器11
によりそれぞれ送り出された信号の合計を、端末10m
復号器12の入力に送り出すように意図された結合装置21
により、本質的に構成される。より詳細には、多地点制
御装置20は、端末10〜10nによって生成されるオーデ
ィオフレームをそれぞれ受取って、このオーディオフレ
ームを復号化し、結合装置21の入力に送り出すN個の局
部復号器22〜22Nを本質的に有する。さらに多地点制
御装置20は、その出力が端末10〜10nの復号器12の入
力にそれぞれ接続され、その入力が結合装置21の出力に
それぞれ接続されるN個の再符号器23〜23Nを有す
る。
【0037】本発明に基づいて各復号器22で行なわれる
復号化は、その入力に存在するオーディオフレームに含
まれた本質的な情報を展開し、周波数領域における変換
係数を配信することから本質的に行なわれる局部デコー
ディング(復号化)である。結局、各復号器22も、スペ
クトル包絡線のような一組の量記号選択パラメータの値
と、ボイシングおよびトーン情報を結合装置21に配信す
る。
【0038】要点を簡潔にするために、これより後の記
述ではスペクトル包絡線だけを考慮する。但し本発明
が、量記号を利用することができ、あるいは選択される
べき関連した処理によって利用される、あらゆる種類の
パラメータ値の組にも適用されることは理解できよう。
【0039】図1において、端末10mに接続される入力
mに存在するフレームのランクkにおける変換係数をy
Em(k)、インデックスjでの周波数帯域内において、入
力Emに存在するフレームに対応するオーディオ信号の
エネルギーをeEm(j)、このオーディオ信号のボイシン
グ情報をvEm、さらにこのオーディオ信号のトーン情
報をtEmとして示す。またこれ以降、1からM(Mは帯
域の総数である)に変化する全帯域jのエネルギー群e
Em(j)を、「スペクトル包絡線」と名付ける。これは、
{e(j)}と示されるであろう。
【0040】技術の現状では、各端末10〜10から到
来するオーディオフレームを復号化すると共に、結合装
置21により時間領域内でその後処理される時間信号を合
成(シンセサイズ)することを目的として、このオーデ
ィオフレームを処理するのに復号器22が意図されてお
り、結合装置21により遂行される処理が周波数領域内で
行なわれる場合には、本発明での事例にならない。実際
に結合装置21は、i=mである場合を除く全ての変換係数y
Ei(k)を合計し、新たな逆量子化係数ySm(k)をそれぞ
れの出力Smに送り出すことにより、各復号器22〜22N
から到来する逆量子化されたフレームを再結合する。新
たな逆量子化係数ySm(k)の値は、次の数1に示す関係
で与えられる。
【0041】
【数1】
【0042】仮に、各復号器22〜22Nによって送り出
されたオーディオフレームがスペクトル包絡線信号{e
(j)}を含むものとすると、結合装置21はそれぞれの帯域
jにおけるエネルギーeSm(j)を再計算することによっ
て、それぞれの出力Smに対する新たなスペクトル包絡
線信号{eSm(j)}を計算する。新たなスペクトル包絡線
信号{eSm(j)}は、次の数2に示す関係で与えられる。
【0043】
【数2】
【0044】結局、結合装置21は符号化のタイプを選ぶ
のに利用されるパラメータと、スペクトル包絡線信号{e
Sm(j)}の量子化特性を決定する。
【0045】さらに、それぞれの出力Smに送り出され
るべきフレームの有音/無音の本質や、トーン/ノント
ーンの本質は、それらを構築するのに利用される入力E
1〜Enにあるフィールドに対応したボイシングおよび信
号エネルギーに基づき決定される。
【0046】再符号器23〜23に関しては、局部復号
器22〜22Nをによるものと逆の手法で進行するが、最
終的には検討されるチャネルmに必要な新たな二進スル
ープットDSmが考慮される。
【0047】図3は符号器30を示すもので、この符号器
30のタイプは、本発明によるシステムでの端末10の符号
器11として利用されることもある。本発明はこのタイプ
の復号器に限定されるものではなく、ITU-T勧告におい
てG-722.1という名で標準化された復号器や、ISOにおい
てMPEG-4 AACという名で標準化された復号器のように、
変換係数および量子化選択パラメータを送り出すことの
できる、あらゆるタイプのオーディオ復号器に適合する
ことが理解されよう。
【0048】この符号器30の入力に存在するフレームx
(n)は、先ず最初に修正された離散コサイン変換のよう
な、時間領域から周波数領域への変換対象となる。装置
31は、この変換係数y(k)の送り出しを意図したものであ
る。符号器30はまた、ボイシング検出器32を備えてい
る。このボイシング検出器32は、入力信号にボイスがあ
るか否かを決定すると共に、二進のボイシング情報vを
送り出すものである。さらに符号器30は、装置31により
送り出された変換係数に基いて、入力信号x(n)が音調
(tonal)を有するか否かを評価すると共に、二進トー
ン情報tを送り出すトーン検出器33を備えている。その
他に符号器30は、装置31により送り出された変換係数を
基準として、予め決められた閾値レベルでの比較値によ
って、マスキング情報を送り出したり、送り出さないよ
うにするマスキング装置34を備えている。
【0049】ボイシング信号vやトーン信号tのみなら
ず、マスキング装置34により送り出されたマスキング情
報に基づいて、装置35は複数帯域(一般にはその数は32)
における各帯域jのそれぞれについてエネルギーe(j)を
決定すると共に、量子化され符号化され、その後で量子
化されたという事実で示される、最新フレームに対する
j=1〜M(Mは帯域の総数である)のスペクトル包絡線
信号{eq(j)}を送り出す。その後、全くマスクされてい
ない周波数帯域に対し、量子化符号化装置37にて変換係
数を量子化する目的で、装置36によりビットが動的に割
当てられる。
【0050】ここで、ビットアロケーション(割当て)装
置36が装置35により送り出されたスペクトル包絡線を利
用することが注目される。
【0051】こうして、変換係数は装置37にて量子化さ
れる。この装置37は、変換係数の量子化を行なうと共
に、量子化の動的(ダイナミック)な領域を減らすため
に、装置31から到来する前記変化係数と、装置34により
送り出されたマスキング情報と、装置35により送り出さ
れたスペクトル包絡線信号{eq(j)}と、装置36により送
り出されたビットアロケーション信号を利用する。
【0052】量子化された変換係数yq(k)と、各帯域jの
量子化されたエネルギーeq(j)と、トーン信号tと、ボイ
シング信号vは、その後マルチプレクサ38において、符
号化された信号オーディオフレームを形成するのに多重
送信される。
【0053】図4は、図3に示すような符号化装置が端
末レベルで利用される場合において、本発明に基づく多
地点制御装置20の復号器22として利用される局部復号器
40のブロック図である。
【0054】図4に示す局部復号器40は、入力フレーム
を逆多重化し、それにより変換係数yq(k)と、各帯域jの
量子化されたエネルギーeq(j)と、ボイシング情報信号v
と、トーン情報信号tとを送り出すデマルチプレクサ41
を本質的に備えている。各帯域jのそれぞれにおけるエ
ネルギー信号eq(j)は、ボイシング情報信号vとトーン情
報信号tとを利用して、装置42で復号化および逆量子化
される。そして、この各帯域jのそれぞれにおけるエネ
ルギー信号eq(j)が送り出される。
【0055】帯域でのマスキング曲線は装置43により決
定され、ダイナミックビットアロケーション装置44によ
り利用される。このダイナミックビットアロケーション
装置44は、逆量子化装置45にダイナミックビットアロケ
ーション信号を送り出すために、各帯域jのそれぞれに
おけるエネルギー信号e(j)をさらに利用する。逆量子化
装置45は、対応する帯域のそれぞれにおけるエネルギー
信号e(j)をも利用して、変換係数yq(k)のそれぞれを逆
量子化するように意図される。
【0056】こうして局部復号器は、その入力における
各フィールドに対し、変換係数y(k)と、各帯域のそれぞ
れにおけるエネルギーe(j)と、ボイシング情報信号v
と、トーン情報信号tとを送り出す。この局部復号化装
置40は、結合されるべきインデックスnでのチャネルの
各フィールドに対して、k=1〜Kにおけるインデックス
kで量子化されたK組の量子化変換係数{yq En(k)}
と、j=1〜Mの各帯域jにおけるM組の量子化エネルギ
ー値{eq En(j)}と、トーン情報信号tEnと、ボイシン
グ情報信号vEnとを利用することもできる。
【0057】結合装置21は、インデックスnの入力に対
し、別の各入力N-1を結合して、この結合した結果とな
る信号をインデックスnの出力に送り出す。より詳細に
は、結合装置21により行なわれる連結動作は、次のよう
な利点がある。
【0058】先ず最初に、全入力Enに対するインデッ
クスkでの変換係数の合計yEn(k)と、全入力Enに対す
る各帯域jでの量子化エネルギー値の合計eEn(j)に対応
する中間の変数は、次の数3で決定される。
【0059】
【数3】
【0060】次に、各出力チャネルSmに対応する値
は、前記中間変数y(k)とe(j)からインデックスmの入力
に対する入力信号を減算する。すなわち、次の数4で示
される。
【0061】
【数4】
【0062】上記計算では、検討されるべき出力チャネ
ルのスループットに依存して、帯域の数Mと変換係数の
数Kを利用することが注目される。したがって、例えば
あるチャネルのスループットが16kbit/sである場合、帯
域の数Mは32に代わり26となる。
【0063】結合装置21は、各出力Smにおけるフィー
ルドのボイシングvSmも決定する。これを遂行するため
に、各インデックスn(但し、n=mの場合は除く)での入
力N-1のフレームにおけるボイシング状態vEnと、それ
らのエネルギーeEmを利用する。したがって、仮に各イ
ンデックスn(但し、n=mの場合は除く)での入力チャネ
ルの全フレームが、有音または無音の同じ種類であると
き、インデックスmの出力チャネルのフィールドは、同
一となるように考慮される。しかし、仮に各入力フレー
ムが同じ種類ではないときには、その後で有音フレーム
の組のエネルギー総計と、無音フレームの組のエネルギ
ー総計が、お互いから独立して計算される。そして、イ
ンデックスmの出力フレームは、こうして計算されたエ
ネルギー総計が最大であるフレーム群のものと同じにな
る。
【0064】各入力フレームの計算は、復号化されたス
ペクトル包絡線から得られたその各帯域のエネルギーを
結合することにより、簡単に行なわれることに注目され
たい。
【0065】インデックスmの出力チャネルにおけるフ
レームの計算に寄与するインデックスnの全ての入力フ
レームが同じ種類のものであるならば、結合装置20は各
出力フィールドのトーンtEmも決定する。特にこの場合
は、インデックスmの出力フレームが同じトーンとな
る。さもなければ、トーンの決定は、局部再符号化段階
(partial recoding phase)まで延期される。
【0066】図5は、図3に示すような符号化装置が端
末の符号器11として用いられた場合の、局部再符号化装
置50のブロック図を示すものである。図5に示す局部符
号器50は、結合装置20の各出力Smに、変換係数y
q Sm(k)と、各帯域jのエネルギーeq Sm(j)と、トーン情
報信号tSmと、ボイシング情報信号vSmとを送り出す。
【0067】インデックスmでの出力のトーン情報信号t
Smは、装置51を利用して再計算される。この装置51
は、トーン情報信号tSmが結合装置20により決定されて
いたときに、第1の入力でインデックスnの出力からト
ーン情報信号tSmを受取り、結合装置20がトーン情報信
号tSmの決定を行なっていなかったときに、第2の入力
で新たな再計算のために全変換係数ySm(k)を受取る。
【0068】この装置51からのトーン情報信号tSmは、
マルチプレクサ52の入力に送り出されると共に、スペク
トル包絡線符号化装置53にも送り出される。スペクトル
包絡線符号化装置53は、結合装置20の出力Smのボイシ
ング情報信号vSmも利用して符号化を行ない、考慮され
る全帯域中のエネルギーeSm(j)を量子化する。量子化
されたエネルギー信号eq Sm(j)は、マルチプレクサ52の
入力に送り出される。
【0069】量子化されていないエネルギー信号e
Sm(j)は、帯域jによるマスキング信号をダイナミック
アロケーション装置55およびマスキング装置56に供給す
るマスキング曲線決定装置54によっても利用される。
【0070】ダイナミックビットアロケーション装置55
は、量子化されたエネルギー信号eq Sm(j)も受取って、
再量子化装置57により利用されるビット数を決定する。
そして再量子化装置57は、マスキング装置56によってマ
スクされなかった変換係数y Sm(k)を量子化すると共
に、マルチプレクサ52に量子化された変換係数yq Sm(k)
を送り出す。再量子化装置57はまた、帯域j内の量子化
されたエネルギー信号eq Sm(j)も利用する。マルチプレ
クサ52は、これらの信号の組を出力フレームの形態に送
り出すのに意図される。
【0071】各復号器40の逆量子化装置45により行なわ
れる逆ベクトル量子化と、再符号器50、特に再符号器50
の再量子化装置57を動作するときの各帯域の再量子化に
よる複雑さを減らすために、本装置では、できれば一定
の帯域内における信号の変換係数とエネルギーだけを保
持するために、信号間マスキング方法(intersignalmas
king method)を利用した処理を行なう。したがって、
インデックスmの出力に存在するフレームのj=1〜Mに
おける帯域jでの信号を決定するのに、n=mの場合を除い
た全ての入力フレームが、最初に帯域j内における最大
エネルギー(e n(j))2の一つを見つけるのに検索され
る。これはすなわち、次の数5にて表せる。
【0072】
【数5】
【0073】その後、帯域j内でn=mおよびn=n0の場合を
除いた入力フレームに対する変換係数yEm(k)が、帯域j
内のフレームn0に対するマスキング閾値SEn0(j)によっ
て全てマスクされたかどうかを決定する検査を行なう。
この閾値SEn0(j)が、復号器40のダイナミックビットア
ロケーション装置44によって行なわれる局部復号化段階
の間に行なわれることに注目されたい。したがって、変
換係数yEm(k)はマスキング閾値SEn0(j)によってマス
クされ、次の数6のようになる。
【0074】
【数6】
【0075】各出力フレームの変換係数ySm(k)は、入
力フレームn0の変換係数yEn0(k)に等しくなり、次の数
7のようになる。
【0076】
【数7】
【0077】さらにこの場合は、考慮される前記帯域j
の各出力フレームにおけるエネルギーeSm(j)が、最大
エネルギーeEn0(j)に等しくなり、次の数8のようにな
る。
【0078】
【数8】
【0079】こうして計算される出力フレームmの各帯
域における変換係数は、局部再符号化段階の間、全部の
逆量子化や再量子化処理に左右されない。もし上述のを
満足しない場合、エネルギーeSm(j)と変換係数ySm(k)
は前記等式によって与えられる。
【0080】ベクトル代数型の量子化が変換係数の再量
子化に利用されるとき、入力フレームの各帯域iに対し
転送された符号語(code word)miは、C(bi,di)で示さ
れるディクショナリ(dictionary)内の量子化ベクト
ル、すなわちビットbiおよびディメンジョンdiの番号で
量子化されるリーダーベクトル(leader vector)のイ
ンデックスを表わす。この符号語miからは、ディクショ
ナリC(bi,di)内において、リーダーベクトルYL(i)の最
も近傍に隣接する量子化リーダーベクトルの記号ベクト
ル(signs vector)sign(i)と番号Li、およびリーダー
ベクトルYLq(i)のクラス内における量子化ベクトルYq
(i)の列riが展開される。
【0081】なお上記および以下の説明では、次の数9
に示すように、リーダーベクトルYLを便宜上記載してい
る。
【0082】
【数9】
【0083】前記出力符号語miを得るために、帯域iに
おける再符号化が、その後次のようにして行なわれる。
【0084】帯域iにおける符号語miが復号化され、量
子化リーダーベクトルYLq(i)の番号Liと列記号sign(i)
が展開される。新しいディクショナリC(b'i,di)と比較
される入力量子化リーダーベクトルの位置のみならず、
帯域iの入力および出力にそれぞれ割当てられたビットb
iとビットb'iの番号によって、2つの場合が考慮され
る。
【0085】仮に、出力ビットb'iの番号が入力ビットb
iの番号よりも大きいかあるいは等しい場合には、出力
フレームの符号語m'iは、入力フレームの符号語miと等
しくなる。また、出力ビットb'iの番号が入力ビットbi
の番号よりも小さいが、同時に量子化リーダーベクトル
YLq(i)の番号Liが、出力フレームを量子化するのに利
用するディクショナリの基数NL(b'i,di)よりも小さいか
あるいは等しい場合にも、同様になる。すなわち、次の
数10のようになる。
【0086】
【数10】
【0087】残りの場合の全てにおいて、番号Liから
と列riのperm(i)(量子化ベクトルYq(i)を決定するのと
同値)を取り戻すのに、フレームが復号化される。この
段階は、局部復号化の動作中にすでに達成されている。
【0088】その後、ディクショナリC(b'i,di)内で、
その番号がL'iである量子化リーダーベクトルYLq(i)の
最も近傍に隣接するベクトルYL'q(i)が検索される。こ
れに続いて、Y(i)の新たな量子化ベクトルであるY'q(i)
の列r'iが、perm(i)を利用してリーダークラスベクトル
YL'q(i)内で検索される。そして、出力フレームの帯域
iにおける符号語m'iが、番号L'iと、列r'iと、記号si
gn(i)を利用して構築される。
【0089】本発明は、あらゆるデジタルオーディオ処
理の応用にも適用可能である。こうした応用の一ブロッ
ク図を、図6に示す。
【0090】端末10のようなターミナルから到来する符
号化された信号は、装置60にて復号化装置40(図4参
照)によって行なわれるような局部復号化がなされる。
局部的に復号化されたこの信号は、その後装置61にて、
適用されるべき特別な処理が行なわれる。この処理の後
に、図5に示す装置50のタイプの装置62において、最後
に再符号化される。
【0091】例えば、上記特別な処理は、第1のスルー
プット(例えば、24kbits/s)または第2のスループッ
ト(例えば、16kbits/s)に符号化されたオーディオ信
号をもたらすオーディオトランスコーディングである。
この特別な場合、装置61で行なわれる処理は、本質的に
第2の利用可能な二進スループットに基づき各ビットを
再ロケーティングすることからなる。この場合には、装
置62からの出力フレームが、装置60の入力に存在するフ
レームと同一のラテラル(側音)トーンと、ボイシング
と、符号化されたスペクトル包絡線情報を含んでいる。
【0092】図7は、相互リンクアーキテクチャを備え
たテレビ会議端末のブロック図である。この端末に局部
復号器70を備え、別の端末から到来する各フレームが入
力される。これらの局部復号器70は、結合装置71の各入
力にそれぞれ接続される出力を有しており、結合装置71
はその後で周波数領域の合計フレームを送り出す。この
フレームはその後、装置72で時間領域に変換され、装置
72からデジタルオーディオ信号を送り出す。
【0093】本発明は上記実施例に限定されるものでは
なく、本発明の要旨の範囲内で適宜変更が可能である。
【0094】
【発明の効果】本発明は、最初に各変換係数を計算する
ために、時間領域から周波数領域に変換し、次にデジタ
ルオーディオ信号から展開した選択パラメータから決定
される一組の量記号に基づき、前記変換係数を量子化お
よび符号化することにより符号化されたデジタルオーデ
ィオ信号から作り出される各フレームの形態に構成さ
れ、前記選択パラメータは前記各フレーム内にも存在す
る少なくとも一つの符号化二進オーディオ流の処理方法
において、前記符号化二進オーディオ流または各符号化
二進オーディオ流の前記フレーム内に含まれる前記選択
パラメータから、量子化段階で利用する一組の量記号の
符号化により生成された前記変換係数を取り戻すことを
決める段階と、符号化により生成された前記変換係数を
取り戻すのに決めた前記一組の量記号を利用して、前記
符号化二進オーディオ流または各符号化二進オーディオ
流を復号化した後で逆量子化する局部復号化段階と、後
続の利用段階に前記処理した各フレームを提供するため
の、取り戻した係数を変換する周波数領域の処理段階と
からなることを特徴とし、オーディオ流を処理する際の
算出コストを低減することができる。
【図面の簡単な説明】
【図1】本発明に基づく方法の実行を意図した集中アー
チテクチャテレビ会議システムのブロック図である。
【図2】周波数領域において人間の耳の音響特性を利用
した符号化装置のブロック図である。
【図3】テレビ会議システム端末のような符号化された
オーディオ信号源を利用する符号化装置のブロック図で
ある。
【図4】本発明の方法を行なうのに利用される局部復号
化装置のブロック図である。
【図5】本発明の方法を行なうのに利用される局部再符
号化装置のブロック図である。
【図6】本発明における方法の実行を意図した処理装置
のブロック図である。
【図7】本発明に基づく方法を実行する相互リンクアー
チテクチャテレビ会議システムのブロック図である。
【符号の説明】
10 端末 11 符号器 12 復号器 20 多地点制御装置 21 結合装置 22〜22N 局部復号器 23〜23N 再符号器
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ヤニック マヒュー フランス,22140 トンケード,ローシュ グラ (72)発明者 クロード ローンブリ フランス,22700 ペロー−ギーレ,リュ エルネース ルナン,13

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 最初に各変換係数を計算するために、時
    間領域から周波数領域に変換し、次にデジタルオーディ
    オ信号から展開した選択パラメータから決定される一組
    の量記号に基づき、前記変換係数を量子化および符号化
    することにより符号化されたデジタルオーディオ信号か
    ら作り出される各フレームの形態に構成され、前記選択
    パラメータは前記各フレーム内にも存在する少なくとも
    一つの符号化二進オーディオ流の処理方法において、 前記符号化二進オーディオ流または各符号化二進オーデ
    ィオ流の前記フレーム内に含まれる前記選択パラメータ
    から、量子化段階で利用する一組の量記号の符号化によ
    り生成された前記変換係数を取り戻すことを決める段階
    と、 符号化により生成された前記変換係数を取り戻すのに決
    めた前記一組の量記号を利用して、前記符号化二進オー
    ディオ流または各符号化二進オーディオ流を復号化した
    後で逆量子化する局部復号化段階と、 後続の利用段階に前記処理した各フレームを提供するた
    めの、取り戻した係数を変換する周波数領域の処理段階
    とからなることを特徴とする符号化二進オーディオ処理
    方法。
  2. 【請求項2】 前記後続の利用段階は、処理された前記
    変換係数の再量子化と再符号化に関連して、1ステップ
    で処理された前記各フレームを局部的に再符号化するこ
    とからなる請求項1記載の符号化二進オーディオ処理方
    法。
  3. 【請求項3】 前記処理段階は、各フレームにおけるそ
    れぞれの前記オーディオ流を局部復号化する間に生成さ
    れる変換係数を合計すると共に、この合計した結果を、
    前記再符号化の段階に提供することからなる請求項2記
    載の符号化二進オーディオ処理方法。
  4. 【請求項4】 多地点オーディオ会議システムでの利用
    を意図したものであって、前記処理段階は、各端末から
    到来する各フレームの前記オーディオ流をそれぞれ部分
    復号化することにより得られた変換係数を合計し、端末
    に関連する再符号化の段階で、前記各端末から到来する
    各フレームの前記オーディオ流を部分復号化することに
    より得られた変換係数を、前記合計した結果から減算す
    るのに、この合計した結果を提供することからなる請求
    項3記載の符号化二進オーディオ処理方法。
  5. 【請求項5】 前記後続の利用段階は、オーディオ信号
    を再構築するために、周波数領域から時間領域への変換
    に関連する段階である請求項1〜3のいずれか一つに記
    載の符号化二進オーディオ処理方法。
  6. 【請求項6】 多地点オーディオ会議システムでの利用
    を意図したものであって、前記処理段階は、各端末から
    到来する各フレームの前記オーディオ流をそれぞれ部分
    復号化することにより得られた変換係数を合計すること
    からなる請求項5記載の符号化二進オーディオ処理方
    法。
  7. 【請求項7】 前記一組の量記号の選択パラメータの各
    値は、前記処理段階にも作用が及ぶことを特徴とする請
    求項1〜6のいずれか一つに記載の符号化二進オーディ
    オ処理方法。
  8. 【請求項8】 前記オーディオ流または各オーディオ流
    の前記フレームに含まれる前記一組の量記号の選択パラ
    メータは、スペクトル包絡線と呼ばれる予め決められた
    周波数帯域内におけるオーディオ信号のエネルギーの組
    であって、前記処理段階は、各フレームの前記オーディ
    オ流をそれぞれ部分復号化することにより得られた変換
    係数を合計し、この変換係数を合計した結果を再符号化
    の段階で提供することからなると共に、各フレームのエ
    ネルギーを合計することにより、各周波数帯域における
    エネルギー総計を決定し、このエネルギーを合計した結
    果を再符号化の段階で提供することからなる請求項7記
    載の符号化二進オーディオ処理方法。
  9. 【請求項9】 多地点オーディオ会議システムでの利用
    を意図したものであって、前記処理段階は、各端末から
    到来する各フレームの前記オーディオ流をそれぞれ部分
    復号化することにより得られた変換係数を合計し、端末
    に関連する再符号化の段階で、前記各端末から到来する
    各フレームの前記オーディオ流を部分復号化することに
    より得られた変換係数を、前記変換係数を合計した結果
    から減算するのに、この合計した結果を提供することか
    らなると共に、前記各端末から到来する各フレームのエ
    ネルギーを合計することにより、各周波数帯域における
    エネルギー総計を決定し、端末に関連する再符号化の段
    階で、前記端末から到来したフレームからのエネルギー
    を、前記エネルギーを合計した結果から減算するのに、
    この合計した結果を提供することからなる請求項8記載
    の符号化二進オーディオ処理方法。
  10. 【請求項10】 前記オーデイオ流または各オーディオ
    流の前記フレームは、対応するオーディオ信号のボイシ
    ング情報を含んでおり、前記処理段階は、この処理段階
    から得られた前記オーディオ信号に対するボイシング情
    報を決定する請求項1〜9のいずれか一つに記載の符号
    化二進オーディオ処理方法。
  11. 【請求項11】 前記処理段階から得られた前記オーデ
    イオ信号に対するボイシング情報の決定は、全てのオー
    ディオ流のフレームが同一のボイシング状態である場合
    に、このボイシング状態を前記処理段階から得られたオ
    ーディオ信号の状態として考慮する一方で、全てのオー
    ディオ流のフレームが同一のボイシング状態でない場合
    に、有音フレームのオーディオ信号組のエネルギー総計
    と、無音フレームのオーディオ組のエネルギーを決定
    し、最大エネルギーを有する組のボイシング状態を、前
    記処理段階から得られたオーディオ信号の状態として考
    慮することを特徴とする請求項10記載の符号化二進オ
    ーディオ処理方法。
  12. 【請求項12】 前記オーデイオ流または各オーディオ
    流の前記フレームは、対応するオーディオ信号のトーン
    情報を含んでおり、前記処理段階は、全ての各フレーム
    が同じ種類のトーン情報であれば、この処理段階から得
    られたオーディオ信号に対するトーン情報を、前記各フ
    レームの信号状態であるものとして決定する請求項1〜
    11のいずれか一つに記載の符号化二進オーディオ処理
    方法。
  13. 【請求項13】 処理されるべき全てのフレームの中か
    ら、与えられた帯域内で最大エネルギーを有するフレー
    ムを見つけ出し、この帯域内で最大エネルギーを有する
    フレーム以外の各入力フレームの係数が、前記帯域内で
    最大エネルギーを有する前記フレームのマスキング閾値
    によってマスクされる場合に、出力フレームの係数を前
    記帯域内で最大エネルギーを有する前記フレームの係数
    と等しくさせることを特徴とする請求項1〜12のいず
    れか一つに記載の少なくとも一つの符号化二進オーディ
    オ流の処理方法。
  14. 【請求項14】 前記帯域内の出力フレームのエネルギ
    ーを、この帯域内の前記入力フレームの最大エネルギー
    と等しくさせることを特徴とする請求項13記載の符号
    化二進オーディオ処理方法。
  15. 【請求項15】 前記後続の利用段階で行なう再量子化
    の段階が、サイズ毎に埋め込まれるディクショナリを備
    えたベクトルの量子化を行なうものであって、仮に帯域
    に対応する入力ディクショナリが選択された出力ディク
    ショナリに含まれる場合、あるいは反対の場合で、出力
    ディクショナリが入力ディクショナリに含まれるもの
    の、量子化されたベクトルにおいて、入力ディクショナ
    リの要素も出力ディクショナリの要素であるである場合
    に、出力帯域に対する符号語が入力帯域に対する符号語
    と等しくなり、それとは別に、出力ディクショナリにお
    ける逆量子化とその後の再量子化に関連する処理が実行
    される請求項1〜14のいずれか一つに記載の符号化二
    進オーディオ処理方法。
  16. 【請求項16】 前記再量子化の段階は、サイズ毎に埋
    め込まれるディクショナリを備えたベクトルの量子化を
    行なうものであり、そのディクショナリは順列コードの
    和から構成されるものであって、仮にその帯域に対応す
    る入力ディクショナリが選択された出力ディクショナリ
    に含まれる場合、あるいは反対の場合で、出力ディクシ
    ョナリが入力ディクショナリに含まれるものの、量子化
    されたベクトルにおいて、入力ディクショナリの要素も
    出力ディクショナリの要素であるである場合に、出力帯
    域に対する符号語が入力帯域に対する符号語と等しくな
    り、それとは別に、出力ディクショナリにおける逆量子
    化とその後の再量子化の処理が実行され、入力ディクシ
    ョナリのベクトルのリーダーに最も近傍に隣接するもの
    を、出力ディクショナリのリーダとすることで、再量子
    化の処理を高速化する請求項15記載の符号化二進オー
    ディオ処理方法。
JP2000370595A 1999-12-08 2000-12-05 符号化二進オーディオ処理方法 Pending JP2001202097A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR99-15574 1999-12-08
FR9915574A FR2802329B1 (fr) 1999-12-08 1999-12-08 Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames

Publications (1)

Publication Number Publication Date
JP2001202097A true JP2001202097A (ja) 2001-07-27

Family

ID=9553092

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000370595A Pending JP2001202097A (ja) 1999-12-08 2000-12-05 符号化二進オーディオ処理方法

Country Status (6)

Country Link
US (1) US6807526B2 (ja)
EP (1) EP1107230B1 (ja)
JP (1) JP2001202097A (ja)
CA (1) CA2327627C (ja)
DE (1) DE60012860T2 (ja)
FR (1) FR2802329B1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007515677A (ja) * 2003-12-10 2007-06-14 フランス テレコム 最適化された複合的符号化方法
JP2008536192A (ja) * 2005-04-13 2008-09-04 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション コード化されたオーディオの経済的な音量計測
JP2009532738A (ja) * 2006-04-04 2009-09-10 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション Mdct領域におけるオーディオ信号音量測定と改良

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7447639B2 (en) * 2001-01-24 2008-11-04 Nokia Corporation System and method for error concealment in digital audio transmission
US7069208B2 (en) * 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission
US7461002B2 (en) * 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
AU2003276754A1 (en) * 2002-11-07 2004-06-07 Samsung Electronics Co., Ltd. Mpeg audio encoding method and apparatus
KR100477701B1 (ko) * 2002-11-07 2005-03-18 삼성전자주식회사 Mpeg 오디오 인코딩 방법 및 mpeg 오디오 인코딩장치
ES2290764T3 (es) * 2003-05-28 2008-02-16 Dolby Laboratories Licensing Corporation Metodo, aparato y programa de ordenador para calcular y ajustar la sonoridad percibida de una señal de audio.
US7460684B2 (en) 2003-06-13 2008-12-02 Nielsen Media Research, Inc. Method and apparatus for embedding watermarks
US7912226B1 (en) * 2003-09-12 2011-03-22 The Directv Group, Inc. Automatic measurement of audio presence and level by direct processing of an MPEG data stream
FR2867648A1 (fr) * 2003-12-10 2005-09-16 France Telecom Transcodage entre indices de dictionnaires multi-impulsionnels utilises en codage en compression de signaux numeriques
US7480267B2 (en) * 2004-02-06 2009-01-20 M-Stack Limited Apparatus and method for operating a communications device in a mobile communications network
KR101079066B1 (ko) 2004-03-01 2011-11-02 돌비 레버러토리즈 라이쎈싱 코오포레이션 멀티채널 오디오 코딩
KR101087588B1 (ko) * 2004-07-02 2011-11-29 닐슨 미디어 리서치 인코퍼레이티드 압축 디지털 비트스트림을 믹싱하는 방법 및 장치
US7508947B2 (en) * 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
WO2006047600A1 (en) 2004-10-26 2006-05-04 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
EA026063B1 (ru) * 2005-04-18 2017-02-28 Басф Се Сополимер, синтезированный из по меньшей мере трех различных моноэтиленненасыщенных мономеров
US20060235883A1 (en) * 2005-04-18 2006-10-19 Krebs Mark S Multimedia system for mobile client platforms
KR101251426B1 (ko) * 2005-06-03 2013-04-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법
TWI396188B (zh) * 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
CN102684628B (zh) 2006-04-27 2014-11-26 杜比实验室特许公司 修正音频动态处理器的参数的方法以及执行该方法的设备
EP2092517B1 (en) * 2006-10-10 2012-07-18 QUALCOMM Incorporated Method and apparatus for encoding and decoding audio signals
EP2095560B1 (en) 2006-10-11 2015-09-09 The Nielsen Company (US), LLC Methods and apparatus for embedding codes in compressed audio data streams
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
KR101137715B1 (ko) 2006-10-20 2012-04-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 리셋을 사용하는 오디오 다이내믹스 프로세싱
US8521314B2 (en) * 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
BRPI0718738B1 (pt) 2006-12-12 2023-05-16 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo
FR2910752B1 (fr) * 2006-12-22 2009-03-20 Commissariat Energie Atomique Procede de codage spatio-temporel pour systeme de communication multi-antenne de type uwb impulsionnel
US8396574B2 (en) * 2007-07-13 2013-03-12 Dolby Laboratories Licensing Corporation Audio processing using auditory scene analysis and spectral skewness
US8315398B2 (en) * 2007-12-21 2012-11-20 Dts Llc System for adjusting perceived loudness of audio signals
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
EP2362387A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Watermark generator, watermark decoder, method for providing a watermark signal in dependence on binary message data, method for providing binary message data in dependence on a watermarked signal and computer program using a differential encoding
US9729120B1 (en) 2011-07-13 2017-08-08 The Directv Group, Inc. System and method to monitor audio loudness and provide audio automatic gain control
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
EP2901448A4 (en) * 2012-09-26 2016-03-30 Nokia Technologies Oy METHOD, APPARATUS AND COMPUTER PROGRAM PRODUCT FOR CREATING AUDIO COMPOSITION SIGNAL
WO2017220528A1 (en) * 2016-06-22 2017-12-28 Dolby International Ab Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain
JP7092048B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 多地点制御方法、装置及びプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04151953A (ja) * 1990-08-28 1992-05-25 Mitsubishi Electric Corp 音声信号処理装置
WO1992012607A1 (en) * 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
WO1992012608A1 (en) * 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Decoder for variable-number of channel presentation of multidimensional sound fields
JPH0795300A (ja) * 1993-03-24 1995-04-07 At & T Corp 会議通信装置および会議通信方法
US5570363A (en) * 1994-09-30 1996-10-29 Intel Corporation Transform based scalable audio compression algorithms and low cost audio multi-point conferencing systems
WO1998033284A2 (en) * 1997-01-27 1998-07-30 British Broadcasting Corporation Audio compression
WO1999062057A2 (en) * 1998-05-26 1999-12-02 Koninklijke Philips Electronics N.V. Transmission system with improved speech encoder

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
WO1995010760A2 (en) * 1993-10-08 1995-04-20 Comsat Corporation Improved low bit rate vocoders and methods of operation therefor
JPH1075310A (ja) * 1996-08-29 1998-03-17 Nec Corp 多地点テレビ会議システム
US6230130B1 (en) * 1998-05-18 2001-05-08 U.S. Philips Corporation Scalable mixing for speech streaming

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04151953A (ja) * 1990-08-28 1992-05-25 Mitsubishi Electric Corp 音声信号処理装置
WO1992012607A1 (en) * 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
WO1992012608A1 (en) * 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Decoder for variable-number of channel presentation of multidimensional sound fields
JPH0795300A (ja) * 1993-03-24 1995-04-07 At & T Corp 会議通信装置および会議通信方法
US5570363A (en) * 1994-09-30 1996-10-29 Intel Corporation Transform based scalable audio compression algorithms and low cost audio multi-point conferencing systems
WO1998033284A2 (en) * 1997-01-27 1998-07-30 British Broadcasting Corporation Audio compression
WO1999062057A2 (en) * 1998-05-26 1999-12-02 Koninklijke Philips Electronics N.V. Transmission system with improved speech encoder

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007515677A (ja) * 2003-12-10 2007-06-14 フランス テレコム 最適化された複合的符号化方法
JP4879748B2 (ja) * 2003-12-10 2012-02-22 フランス・テレコム 最適化された複合的符号化方法
JP2008536192A (ja) * 2005-04-13 2008-09-04 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション コード化されたオーディオの経済的な音量計測
JP2009532738A (ja) * 2006-04-04 2009-09-10 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション Mdct領域におけるオーディオ信号音量測定と改良

Also Published As

Publication number Publication date
FR2802329B1 (fr) 2003-03-28
CA2327627A1 (en) 2001-06-08
US20010027393A1 (en) 2001-10-04
EP1107230A1 (fr) 2001-06-13
CA2327627C (en) 2012-02-07
DE60012860D1 (de) 2004-09-16
US6807526B2 (en) 2004-10-19
DE60012860T2 (de) 2005-08-18
EP1107230B1 (fr) 2004-08-11
FR2802329A1 (fr) 2001-06-15

Similar Documents

Publication Publication Date Title
JP2001202097A (ja) 符号化二進オーディオ処理方法
JP3391686B2 (ja) 符号化されたオーディオ信号を復号する方法及び装置
KR101221918B1 (ko) 신호 처리 방법 및 장치
US5983172A (en) Method for coding/decoding, coding/decoding device, and videoconferencing apparatus using such device
US8311810B2 (en) Reduced delay spatial coding and decoding apparatus and teleconferencing system
US5570363A (en) Transform based scalable audio compression algorithms and low cost audio multi-point conferencing systems
US5995923A (en) Method and apparatus for improving the voice quality of tandemed vocoders
US6502069B1 (en) Method and a device for coding audio signals and a method and a device for decoding a bit stream
JP5215994B2 (ja) 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置
US20020049586A1 (en) Audio encoder, audio decoder, and broadcasting system
JP2010170142A (ja) ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置
US20030220783A1 (en) Efficiency improvements in scalable audio coding
CN103187065B (zh) 音频数据的处理方法、装置和***
US20080140393A1 (en) Speech coding apparatus and method
JP2008511040A (ja) 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
US8055499B2 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
JP2000101436A (ja) オーディオ信号の符号化及び復号方法及び装置
Gayer et al. A guideline to audio codec delay
JPH02155313A (ja) 符号化方法
JP4063508B2 (ja) ビットレート変換装置およびビットレート変換方法
JP3406275B2 (ja) ディジタル信号符号化方法、ディジタル信号復号化方法、これらの装置及びその各プログラム記録媒体
EP1136986B1 (en) Audio datastream transcoding apparatus
US6549147B1 (en) Methods, apparatuses and recorded medium for reversible encoding and decoding
Ding Wideband audio over narrowband low-resolution media
WO2024051955A1 (en) Decoder and decoding method for discontinuous transmission of parametrically coded independent streams with metadata

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110425

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111024