JPH08293798A - 低ビット速度のオーディオエンコーダおよびデコーダ - Google Patents

低ビット速度のオーディオエンコーダおよびデコーダ

Info

Publication number
JPH08293798A
JPH08293798A JP7333371A JP33337195A JPH08293798A JP H08293798 A JPH08293798 A JP H08293798A JP 7333371 A JP7333371 A JP 7333371A JP 33337195 A JP33337195 A JP 33337195A JP H08293798 A JPH08293798 A JP H08293798A
Authority
JP
Japan
Prior art keywords
signal
audio signal
encoded
decoder
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7333371A
Other languages
English (en)
Other versions
JP2971796B2 (ja
Inventor
Irving Rabowsky
アービング・ラボウスキー
Donald Mead
ドナルド・ミード
Ronnie Burns
ロニー・バーンズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
H II HOLDINGS Inc D B EE FUSE ELECTRON
Raytheon Co
Original Assignee
H II HOLDINGS Inc D B EE FUSE ELECTRON
Hughes Aircraft Co
HE Holdings Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by H II HOLDINGS Inc D B EE FUSE ELECTRON, Hughes Aircraft Co, HE Holdings Inc filed Critical H II HOLDINGS Inc D B EE FUSE ELECTRON
Publication of JPH08293798A publication Critical patent/JPH08293798A/ja
Application granted granted Critical
Publication of JP2971796B2 publication Critical patent/JP2971796B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0033Recording/reproducing or transmission of music for electrophonic musical instruments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0018Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

(57)【要約】 【課題】 本発明は、オーディオ信号を伝送し記憶する
ために必要なビット数を減少させ、しかも信号の内容お
よび忠実度を維持することのできる音響圧縮システムを
提供することを目的とする。 【解決手段】 音声の音響を表す第1のオーディオ信号
と、音声以外の音響を表す第2のオーディオ信号とから
構成されているオーディオ信号をビット流にエンコード
し、第1のオーディオ信号を記号的にエンコードして第
1のエンコードされた信号を形成する第1のエンコーダ
10と、第2のオーディオ信号を記号的にエンコードして
第2のエンコードされた信号を形成する第2のエンコー
ダ12と、第1のエンコーダおよび第2のエンコーダに結
合されて第1および第2のエンコードされた信号を多重
化したビット流を形成するマルチプレクサ14とを具備し
ていることを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、オーディオ信号の
処理のための方法およびシステム、特にオーディオ信号
をエンコードおよびデコードするための方法および装置
に関する。
【0002】
【従来の技術】音響圧縮システムは、デジタル的にサン
プルされたオーディオ信号を伝送および記憶するために
必要とされるビット数を減らすために使用される。その
結果、より低い帯域幅の通信チャンネルを、圧縮されて
いないオーディオ信号と比較して圧縮されたオーディオ
信号を伝送するために使用することができる。同じよう
に、圧縮されたオーディオ信号を記憶するために必要と
されるメモリ或いは磁気記憶媒体を具備することができ
る記憶装置の容量を減少させることができる。一般的な
音響圧縮システムは、オーディオ信号を圧縮された信号
に変換するエンコーダと、圧縮された信号に基いてオー
ディオ信号を再生するデコーダとを具備する。
【0003】オーディオ信号圧縮システムの設計におい
て、その目的は、オーディオ信号の内容および忠実度を
保持しながら、それを表示するために必要なビット数を
減少することである。音響圧縮に関する現在の方法およ
びシステムは、モノラル音響で1秒当り128キロビッ
ト、ステレオ音響で1秒当り128キロビットの伝送ビ
ット速度で優れた品質の忠実度を達成した。これらの方
法およびシステムは、オーディオ信号の波形の表示を直
接に圧縮することに基いている。
【0004】
【発明が解決しようとする課題】オーディオ信号を伝送
し記憶するために必要とされるビット数を著しく減少
し、同時にオーディオ信号の内容および忠実度を保持す
る音響圧縮システムが求められている。したがって本発
明の目的は、オーディオ信号を伝送するために必要とさ
れるビット速度を著しく減少することである。本発明の
別の目的は、オーディオエンコーダ、およびエンコード
されたオーディオ信号の選択可能な個人化を可能にする
対応するオーディオデコーダを提供することである。本
発明のさらに別の目的は、オーディオ信号の記号的にエ
ンコードおよびデコードを行うことである。
【0005】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明はオーディオ信号をビット流にエンコード
するためのシステムを提供し、ここでオーディオ信号
は、実質的に音声の音響を示す第1のオーディオ信号
と、実質的に音声以外の音響を示す第2のオーディオ信
号とから構成される。第1のエンコーダは、第1のエン
コードされた信号を形成するために第1のオーディオ信
号を記号的にエンコードする。第2のエンコーダは、第
2のエンコードされた信号を形成するために第2のオー
ディオ信号を記号的にエンコードする。第1のエンコー
ダおよび第2のエンコーダに接続されるマルチプレクサ
は、ビット流を形成するために第1のエンコードされた
信号と第2のエンコードされた信号を多重化する。
【0006】また上記の目的を達成するために、本発明
は、オーディオ信号をビット流にエンコードするための
システムを提供し、ここでオーディオ信号は、実質的に
音声の音響を示す第1のオーディオ信号と、実質的に音
声以外の音響を示す第2のオーディオ信号とから構成さ
れる。第1のエンコーダは、第1のエンコードされた信
号を形成するために第1のオーディオ信号を記号的にエ
ンコードする。信号解析器は、対応する複数の予め決め
られた信号のクラスに基いて、第2のオーディオ信号を
複数の分解信号に分解する。複数の分解信号は、MID
I分解信号と波テーブル分解信号とを具備する。MID
I音要素の第1のライブラリと、波テーブル音要素の第
2のライブラリと、第3のライブラリとを有する特徴認
識器は、信号解析器に結合されている。特徴認識器は、
分解信号および音要素の1つに応じて差信号を形成し、
第3のライブラリにおける差信号の表示を記憶すること
ができる。特徴認識器は、MIDI分解信号に応じてM
IDI音要素の少なくとも1つを表す第1のコード化さ
れた識別子を生成することもできる。特徴認識器はさら
に、波テーブル分解信号に応じて波テーブル音要素の少
なくとも1つを表す第2のコード化された識別子を生成
することができる。特徴認識器はまた、差信号を表す第
3のコード化識別子を生成することができる。第2のエ
ンコードされた信号を形成するために、第1のコード化
された識別子と、第2のコード化された識別子と、第3
のコード化された識別子とを多重化する第1のマルチプ
レクサは、特徴認識器に接続される。第2のマルチプレ
クサは、第1のエンコーダおよび第2のエンコーダに接
続される。第2のマルチプレクサは、第1のエンコード
された信号を第2のエンコードされた信号と多重化する
ことによってビット流を形成する。
【0007】また上記の目的を達成する際に、本発明
は、上記で説明されたシステムによって行われるステッ
プに基いてオーディオ信号をビット流にエンコードする
方法を提供し、それにおいてオーディオ信号は、実質的
に音声であるオーディオ信号を表す第1のオーディオ信
号と、実質的に音声以外のオーディオ信号を表す第2の
オーディオ信号とを含む。
【0008】また更に上記の目的を達成する際に、本発
明は、エンコードされたオーディオ信号を表すビット流
からオーディオ信号を再生するためのシステムを提供す
る。デマルチプレクサは、エンコードされた音声の信号
とエンコードされた音声以外の信号とをビット流から抽
出する。エンコードされた音声の信号に基いてデコード
された音声の信号を形成する第1のデコーダは、デマル
チプレクサに結合される。エンコードされた音声以外の
信号に基いてデコードされた音声以外の信号を形成する
第2のデコーダは、デマルチプレクサに接続される。第
1のデコーダと第2のデコーダとに結合されたミキサ
は、デコードされた音声の信号をデコードされた音声以
外の信号と結合して、オーディオ信号を形成する。
【0009】また更に上記の目的を達成する際に、本発
明は、エンコードされたオーディオ信号を表すビット流
からオーディオ信号を再生するためのシステムを提供す
る。デマルチプレクサは、エンコードされた音声の信号
とエンコードされた音声以外の信号とをビット流から抽
出する。エンコードされた音声以外の信号は、複数の予
め決められた信号のクラスに基いて、第1の記号的にエ
ンコードされた信号と、第2の記号的にエンコードされ
た信号と、第3の記号的にエンコードされた信号とを含
み、予め決められた信号のクラスは、MIDIのクラス
と、波テーブルのクラスと、特別なライブラリのクラス
とを含む。デマルチプレクサに結合された第1のデコー
ダは、エンコードされた音声の信号に基いてデコードさ
れた音声の信号を形成する。MIDIの音要素のライブ
ラリを含む第1の記号デコーダは、デマルチプレクサに
結合される。第1の記号デコーダは、エンコードされた
音声以外の信号中に含まれるMIDI信号のクラスの第
1の記号的にエンコードされた信号に応じてMIDI音
要素の1つを発生することができる。波テーブルの音要
素のライブラリを具備する第2の記号デコーダは、デマ
ルチプレクサに結合される。第2の記号デコーダは、エ
ンコードされた音声以外の信号内に含まれる波テーブル
の信号のクラスの第2の記号的にエンコードされた信号
に応じて波テーブルの音要素の1つを発生することがで
きる。特別な音要素のライブラリを含む第3の記号デコ
ーダは、デマルチプレクサに結合される。第3の記号デ
コーダは、エンコードされた音声以外の信号中に含まれ
る特別なライブラリの信号のクラスの第3の記号のエン
コードされた信号に応じて特別な音要素の1つを発生す
ることができる。発生された音要素に基いてデコードさ
れた音声以外の信号を形成する信号解析器は、第1、第
2、および第3の記号デコーダに結合される。ミキサ
は、第1のデコーダと信号解析器とに結合される。ミキ
サは、オーディオ信号を形成するためにデコードされた
音声の信号とデコードされた音声以外の信号とを結合す
る。
【0010】また更に上記の目的を達成するために、本
発明は、上記で説明されたシステムによって実行される
ステップに従ってエンコードされたオーディオ信号を表
すビット流からオーディオ信号を再生する方法を提供す
る。
【0011】本発明のこれらのおよびその他の特徴、態
様、および有効性は、以下の説明、添付の請求の範囲、
および添付の図面を参照して、一層よく理解されるであ
ろう。
【0012】
【発明の実施の形態】従来のシステムの欠点を克服する
ために、本発明は、音声のオーディオ信号および音声以
外のオーディオ信号を個別にエンコードするエンコーダ
/送信機を提供する。記号的表示は、音声のオーディオ
信号と音声以外のオーディオ信号のために形成される。
これらの記号的表示は、音素、MIDI、および波テー
ブルを含む。エンコードされた音声信号および音声以外
の信号は、別々の音声用のデコーダと音声以外のもの用
のデコーダとを使用する対応するデコーダ/受信機に伝
送される。音声以外のもの用のデコーダは、MIDI、
波テーブル、および特定のコードを識別するデータを受
信し、音を再生成するために記憶装置内に記憶された対
応するライブラリおよびテーブルを使用する。再生成さ
れた音声の音響および音声以外の音響は、使用者に提供
するために混合される。また、エンコーダ/送信機は、
デコーダ/受信機の性能を高める個人化データを送信
し、生成された信号を調整できるようにする。
【0013】本発明のオーディオエンコーダの実施例
は、図1のブロック図によって示される。オーディオエ
ンコーダは、対応するデコーダへ伝送するためのビット
流へオーディオ信号をエンコードするためのシステムを
提供する。オーディオ信号は、音声のオーディオ信号と
音声以外のオーディオ信号とを含む。音声のオーディオ
信号は、実質的に音声で生成される音響を表す信号であ
り、それは話し言葉、歌、およびその他の音声発声を含
む。音声以外のオーディオ信号は、音楽および他の種類
の音のような、実質的に音声以外から生成される音響を
示す信号である。
【0014】音声のオーディオ信号は、エンコードされ
た音声の信号を形成する第1のエンコーダ10に供給され
る。同じように、音声以外のオーディオ信号は、エンコ
ードされた音声以外の信号を形成する第2のエンコーダ
12に供給される。第1のエンコーダ10と第2のエンコー
ダ12とに結合されるマルチプレクサ14は、エンコードさ
れた音声の信号とエンコードされた音声以外の信号とを
多重化することによってビット流を形成する。
【0015】第1のエンコーダ10に入力する際に、音声
のオーディオ信号は、アナログ−デジタルコンバータ20
に供給される。アナログ−デジタルコンバータ20は、デ
ジタル音声信号を形成するために音声信号をデジタル化
する。音声信号が既にデジタル型式である場合、アナロ
グ−デジタルコンバータ20は必要ない。音素解析器22
は、アナログ−デジタルコンバータ20に接続される。音
素解析器22は、デジタルの音声の信号内に含まれた各音
素に対する時間ベースを識別し、時間ベースに基いてデ
ジタルの音声の信号を少なくとも1つの音素に分解す
る。
【0016】音素解析器22は、予め決められた音素群か
ら少なくとも1つの音素を認識する音素認識器24に結合
され、記号コードを少なくとも1つの各音素にそれぞれ
割り当てる。英語に関する好ましい実施例において、音
素認識器24は、英語の約40の音素の各々に対して特有
の6ビットの記号コードを割り当てる。当業者は、音素
をコード化するために必要とされるビット数が、当該の
言語の音素の数に依存していることが認識されるであろ
う。歌声から生成される音声のオーディオ信号をエンコ
ード可能にするために、予め決められた音素群は歌声の
音素も含む可能性がある。したがって、歌声の音素を含
むために、英語をエンコードするために使用されるビッ
ト数は、6ビット標準よりも増加する可能性がある。
【0017】音素認識器24からの記号コードは、可変長
コーダ(VLC)26に供給される。可変長コーダ26は、
話される対応する音素の相関的確率に基いて記号コード
の可変長コードを供給する。特に、典型的なスピーチに
おいて頻繁に現れる音素は、より短い長さのコードでコ
ード化され、一方で頻繁に現れない音素は、より長い長
さのコードでコード化される。可変長コーダ26は、典型
的なスピーチ信号を表示するために必要とされる平均ビ
ット数を減少させるために使用される。好ましい実施例
において、可変長コーダは、ハフマン(Huffma
n)コード方式を使用する。可変長コーダは、可変長コ
ードを直列のビット流にフォーマット化するマルチプレ
クサ30に接続される。
【0018】音素解析器22は、使用者の話した音素の波
形と標準音素の波形ライブラリからの対応する波形との
間の差信号を形成する差プロセッサ32に接続される。標
準音素波形ライブラリは、差プロセッサ32に結合された
読取り専用メモリ(ROM)のような第1の電子記憶装
置34内に設けられる。第1の電子記憶装置34は、予め決
められた音素のセットからの各音素の標準波形の表示を
含む。
【0019】差信号は、差プロセッサ32の出力に結合さ
れたデータ圧縮器36によって圧縮される。圧縮された差
信号の表示は、第2の電子記憶装置40内に記憶される。
その結果、第2の電子記憶装置40は、デコーダの使用者
のための個人音素ライブラリを具備する。マルチプレク
サ30は、第2の電子記憶装置40に接続され、その結果供
給されたビット流は、音素認識器24によって発生された
記号コードと差信号の表示の両方に基づく。好ましい実
施例において、マルチプレクサ30は、伝送の始めに際し
て個人音素ライブラリに基いてヘッダをフォーマット化
する。
【0020】差プロセッサ32、第1の電子記憶装置34、
データ圧縮器36、および第2の電子記憶装置40を結合し
て、エンコーダの個人化トレーニングを行うシステムを
形成する。すなわち、予め決められたトレーニングモー
ドにおいて、音素解析器22の出力は標準音素波形ライブ
ラリと比較され、差音素波形、すなわちデルタ音素波形
が形成され圧縮される。デルタ音素波形は、その後の伝
送のためにエンコーダの個人用音素ライブラリ(記憶装
置40)内に記憶される。
【0021】第2のエンコーダ12は、音声以外のオーデ
ィオ信号を対応する複数の予め決められた信号のクラス
に基いて複数の分解信号に分解する信号解析器50を具備
する。音声以外のオーディオ信号がアナログ信号である
場合、信号解析器50は、その中でさらに処理するデジタ
ルビット流を供給するためにアナログ−デジタルコンバ
ータを具備することができる。図1の実施例において、
3つの予め決められた信号のクラス、すなわちMIDI
クラス、波テーブルクラス、および特別なライブラリの
クラスが定められる。したがって、音声以外のオーディ
オ信号は、音声以外の音の種類のオーディオ信号および
とその応用に応じて、MIDIビット流、波テーブルビ
ット流、特別なライブラリビット流に分離される。
【0022】幾つかの応用において、音声以外のオーデ
ィオ信号を分解する必要はない。例えば、音声以外のオ
ーディオ信号は、MIDIファイルを直接に生成する装
置によって発生される音楽の型式であっても良い。これ
らの応用において、分解信号は、信号解析器50を使用す
る必要無しに、第2のエンコーダ12に直接に供給され
る。
【0023】自由選択として、各ビット流は対応する可
変長コーダ(VLC)に供給される。すなわち、MID
Iビット流は第1のVLC52に供給され、波テーブルビ
ット流は第2のVLC54に供給され、特別なライブラリ
ビット流は第3のVLC56に供給される。各VLCは、
各ビット流を表示するために必要とされる平均ビット数
を減少する可変長コードを与える。
【0024】可変長コーダ52、54、および56は、特徴認
識器60に結合される。特徴認識器60は、音声以外のオー
ディオ信号に応じて少なくとも1つのコード化された識
別子を生成し、少なくとも1つのコード化された識別子
に基いてエンコードされた音声以外の信号を形成する。
詳しく説明すると、特徴認識器60は、予め記憶された音
要素の少なくとも1つのライブラリを具備し、少なくと
も1つのコード化された識別子は音要素の少なくとも1
つを表示する。
【0025】図1の好ましい実施例において、特徴認識
器60は、MIDI音要素を含むMIDIライブラリ62、
波テーブル音要素を含む波テーブルライブラリ64、およ
び特別な音要素を含む特別なライブラリ66を具備する。
MIDIビット流内の各音は、特徴認識サブシステム70
によってMIDIライブラリ62内のMIDI音要素と比
較される。MIDIライブラリ62内の最も近い音要素が
選択され、このMIDI要素のコード化された識別子が
獲得される。同じように、波テーブルのビット流内の各
音は、波テーブルライブラリ64内の波テーブル音要素と
比較される。波テーブルライブラリ内の最も近い要素が
選択され、この波テーブル要素のコード化された識別子
が獲得される。最も近い要素を決定するために色々な相
関測定が使用される可能性がある。
【0026】特徴認識器60は、音声以外のオーディオ信
号と音要素の1つによって差信号を形成することができ
る。差信号の表示は、特別なライブラリ66内に記憶され
る。図1の実施例において、差信号は、MIDIビット
流とMIDI音要素との間、波テーブルのビット流と波
テーブルの音要素との間、或いは特別なライブラリのビ
ット流と特別なライブラリの音要素との間で形成される
ことができる。記憶された差信号は、個人ファイルを具
備し、それは以下で説明されるデコーダによって生成さ
れる音の表示を変更するために使用される。さらに詳し
く説明すると、個人ファイルは、相対的なボリューム、
音色、および音要素の各々を変更するために使用される
その他の特別な特徴に関連する情報を含むことができ
る。さらに、個人ファイルは何れかのライブラリにおい
て関連の強い要素が存在しない独特の音の表示も含む可
能性がある。
【0027】特徴認識器60は、可変長コードのMID
I、波テーブル、および特別なライブラリのコード化識
別子をマルチプレクサ72へ供給する。マルチプレクサ72
は、エンコードされた音声以外の信号を生成するために
特別な個人ファイルおよびタイミング情報とコード化さ
れた識別子の各々を複合する。好ましい実施例におい
て、エンコードされた音声以外の信号は直列ビット流の
型式である。第2のエンコーダ12の出力は、第1のエン
コーダ10の出力と同じように、マルチプレクサ14に供給
され、対応するデコーダへの転送のための結合されたコ
ード化出力を設ける。
【0028】当業者が理解するであろうように、マルチ
プレクサ14、30、および72の各々は、ビット流の一部を
記憶するために対応するバッファを具備することができ
る。これは、入力ビット流の状態を変化させるように出
力ビット流を制御することを可能にする。マルチプレク
サの入力および出力を整列するために、基準クロックは
表示タイムスタンプを使用することが好ましい。
【0029】本発明によると、デコーダ/受信機の実施
例は、図2の概略的ブロック図によって示される。デコ
ーダは、対応するエンコーダから受信されたエンコード
されたオーディオ信号のビット流の表示からオーディオ
信号を再生するためのシステムを提供する。ビット流は
デマルチプレクサ80に入り、それは基準クロック信号を
回復し、ビット流に対して位相ロックをするために内部
クロック信号を発生する。デマルチプレクサ80は、デマ
ルチプレックス動作を行うことができ、エンコードされ
た音声の信号およびエンコードされた音声以外の信号が
ビット流から抽出される。好ましい実施例において、デ
マルチプレクサ80は表示タイムスタンプを備えた移動層
をデコードし、入力ビット流をエンコードされた音声の
ビット流と復元されたエンコードされた音声以外のビッ
ト流とに分離する。
【0030】エンコードされた音声の信号に基いて、第
1のデコーダ82はデコードされた音声の信号を生成す
る。同じように、第2のデコーダ84は、エンコードされ
た音声以外の信号に基いてデコードされた音声以外の信
号を生成するために使用される。オーディオミキサ86
は、デコードされた音声の信号とデコードされた音声以
外の信号とを結合するために第1のデコーダ82と第2の
デコーダ84とに接続されて、再生されたオーディオ信号
を生成する。
【0031】エンコードされた音声の信号から、デマル
チプレクサ80は、使用者が話した言葉の音素波形と標準
音素波形のセットからの対応する音素波形との間の相違
の少なくとも1つの差信号の表示を抽出することができ
る。好ましい実施例において、少なくとも1つの差信号
はビット流内のヘッダ内で受信される。デマルチプレク
サ80は、少なくとも1つの差信号を第1のデコーダ82内
の記憶装置92へ供給する。記憶装置92は少なくとも1つ
の差信号の表示を記憶する。この実施例において、デマ
ルチプレクサ80はヘッダを記憶装置82へ送信する。その
結果、標準DRAMによって構成されることがきる記憶
装置92は、第1のデコーダ82のためのゲスト(guest )
個人用音素ライブラリを形成する。
【0032】デマルチプレクサ80は、ビット流から少な
くとも1つの記号コードを抽出することもでき、少なく
とも1つの記号コードの各々は、予め決められた音素群
からの対応する音素を表す。好ましい実施例において、
デマルチプレクサ80はエンコードされた音声のビット流
を、それぞれ音素を表示する6ビットのブロックに形成
する。少なくとも1つの記号コードは、第1のデコーダ
82内の標準音素波形発生器94に供給される。標準音素波
形発生器94は、少なくとも1つの記号コードに対して標
準波形のセットから対応する音素波形を発生する。この
実施例において、6ビットのブロックの各々は標準波形
群から特定の音素を選択する。その結果、典型的にデジ
タルで表された再生されたスピーチ信号が形成される。
【0033】標準音素波形発生器94の出力および記憶装
置92の出力は加算素子96に供給される。加算素子96は、
元の話し手の音声を再生するために標準波形のセットか
らの音素波形と差信号とを組合わせる。加算素子96の出
力は、アナログの再生されたスピーチ信号を形成するた
めにデジタル−アナログコンバータ98に供給される。ア
ナログの再生されたスピーチ信号は、オーディオミキサ
86に供給されるデコードされたオーディオ信号を形成す
る。
【0034】次に、第2のデコーダ84の実施例が詳細に
説明される。デマルチプレクサ80によって抽出されるエ
ンコードされた音声以外の信号は、複数の予め決められ
た信号のクラスに基いて複数の記号的にエンコードされ
た信号を含む。図2の実施例において、信号のクラス
は、MIDIクラス、波テーブルクラス、および特別な
ライブラリクラスを含む。したがって、記号的にエンコ
ードされた信号は、MIDIのエンコードされた信号、
波テーブルのエンコードされた信号、および特別なライ
ブラリのエンコードされた信号を含む。
【0035】MIDIのエンコードされた信号は、MI
DI音要素のライブラリを含むMIDI記号デコーダ10
0 に供給される。MIDI記号デコーダ100 は、MID
Iのエンコードされた信号を受信するのに応答してMI
DI音要素の少なくとも1つを発生する。同じように、
波テーブルのエンコードされた信号は、波テーブル音要
素のライブラリを含む波テーブルの記号デコーダに供給
される。波テーブルデコーダ102 は、波テーブルのエン
コードされた信号を受信するのに応答して波テーブル音
要素の少なくとも1つを発生する。特別なライブラリの
エンコードされた信号は、特別なライブラリの音要素を
含む特別なライブラリ音要素デコーダ104 に供給され
る。特別なライブラリデコーダ104 は、特別なライブラ
リのエンコードされた信号を受信するのに応答して特別
なライブラリの音要素の少なくとも1つを発生する。こ
の実施例において、エンコードされた音声以外のビット
流のヘッダ情報は、再生される各音要素を識別するため
に使用される。
【0036】信号解析器106 は、MIDI記号デコーダ
100 、波テーブル記号デコーダ102、および特別なライ
ブラリデコーダ104 に接続される。信号解析器106 は、
ミキサ86において音声の音響を追加するのに先立って発
生された音要素に基いて音声以外のオーディオ信号を構
成するために使用される。信号解析器106 は、タイムス
タンプによって与えられるタイミング信号およびヘッダ
内の他の説明的な情報に基いて、音声以外のオーディオ
信号を構成する。信号解析器106 の出力は、デジタル−
アナログコンバータ110 へ供給され、それはオーディオ
ミキサ86へ供給するためのアナログの音声以外のオーデ
ィオ信号を供給する。オーディオミキサは、使用者へ提
供するために音声のオーディオ信号と音声以外のオーデ
ィオ信号を接続する。
【0037】代りの実施例において、オーディオミキサ
86は、加算素子96および信号解析器106 の出力から直接
にデジタル信号を混合する。その結果、デジタル−アナ
ログコンバータ98および110 は省略される。オーディオ
ミキサ86によって生成された混合されたデジタル信号
は、オーディオミキサ86の出力に接続されたデジタル−
アナログコンバータによってアナログ信号に変換でき
る。しかしながら、混合された信号をアナログ型式に変
換するステップは、自由選択である。
【0038】本発明のエンコーダおよびデコーダの上記
で説明された実施例は、共同して以下のように動作す
る。個人のライブラリ40或いは特別なライブラリ66の情
報が新しい特徴を含むために更新される時、デコーダの
特別なライブラリ104 におけるデータベースもそれに応
じて更新される。最初に新しい特徴に出会う時、全デル
タがライブラリ識別番号と共に伝送される。2回目に新
しい特徴に出会う時は、ライブラリの識別番号だけがエ
ンコーダからデコーダへ送信されることが必要である。
【0039】本発明の上記の形態は多くの効果を有す
る。MIDI、波テーブル、および特別な記号テーブル
のような記号コードのテーブルを利用することによっ
て、音声以外のオーディオ信号の完全な表示を、かなり
減少したビット速度でエンコードし、伝送することがで
きる。テーブルコードおよびタイミング情報と共に個人
ファイルを伝送することによって、音声以外の音響の表
示は、関連するボリュームおよび音色のような音の特別
な特徴を含むように変更することができる。さらに、個
人ファイルは、任意のテーブルにおいて非常に関連の強
い対照物を有しない独特の音のエンコードおよび伝送を
可能にする。また、デコーダ内に大きいライブラリを記
憶することによって、必要とされる伝送ビット速度、お
よび類似して必要な記憶キャパシティを著しく低減す
る。
【0040】本発明の実施例は、コンパクトディスクプ
レーヤおよびデジタルオーディオプレーヤのようなオー
ディオ製品、およびラジオ、テレビ、およびテレビ電話
のようなオーディオ信号送信システムに応用することが
できる。
【0041】本発明は、当業者には明白な多くの変形お
よび別の実施形態を包含する種々の異なる構造において
使用可能であることに留意されたい。従って、そのよう
な変形および別の実施形態の全ては、本発明の特許請求
の範囲に記載された技術的範囲内に含まれるべきのもで
ある。
【図面の簡単な説明】
【図1】本発明のエンコーダの1実施例のブロック図。
【図2】本発明のデコーダの1実施例のブロック図。
フロントページの続き (72)発明者 アービング・ラボウスキー アメリカ合衆国、カリフォルニア州 91364、ウッドランド・ヒルズ、キャシャ ロート・ストリート 4103 (72)発明者 ドナルド・ミード アメリカ合衆国、カリフォルニア州、カー ルスバド、アダムス・ストリート 4140 (72)発明者 ロニー・バーンズ アメリカ合衆国、カリフォルニア州、アー ビン、ティーチャーズ・アベニュー 17502

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 実質上音声の音響を表す第1のオーディ
    オ信号と、実質上音声以外の音響を表す第2のオーディ
    オ信号とから構成されているオーディオ信号をビット流
    にエンコードするシステムにおいて、 第1のオーディオ信号を記号的にエンコードして第1の
    エンコードされた信号を形成する第1のエンコーダと、 第2のオーディオ信号を記号的にエンコードして第2の
    エンコードされた信号を形成する第2のエンコーダと、 第1のエンコーダおよび第2のエンコーダに結合され、
    第1のエンコードされた信号および第2のエンコードさ
    れた信号を多重化したビット流を形成する第1のマルチ
    プレクサとを具備していることを特徴とするシステム。
  2. 【請求項2】 第2のエンコーダが、音響要素の少なく
    とも1つのライブラリを有し、第2のオーディオ信号に
    応じて少なくとも1つのコード化された識別子を生成す
    る特徴認識器を具備し、少なくとも1つのコード化され
    た識別子が、音響要素の少なくとも1つを表し、第2の
    エンコードされた信号が、少なくとも1つのコード化さ
    れた識別子に応じて形成される請求項1記載のシステ
    ム。
  3. 【請求項3】 特徴認識器が、第2のオーディオ信号と
    音要素の1つに応じて差信号を形成し、第2のエンコー
    ドされた信号が、差信号に応じて形成される請求項1記
    載のシステム。
  4. 【請求項4】 第2のエンコーダが、対応する複数の予
    め決められた信号のクラスに基いて第2のオーディオ信
    号を複数の分解信号に分解する信号解析器を具備し、分
    解信号が特徴認識器に供給される請求項2記載のシステ
    ム。
  5. 【請求項5】 特徴認識器は、複数の分解信号の各々に
    対して対応するコード化された識別子を生成することが
    できる請求項4記載のシステム。
  6. 【請求項6】 エンコードされたオーディオ信号を表す
    ビット流からオーディオ信号を再生するシステムにおい
    て、 ビット流からエンコードされた音声の信号とエンコード
    された音声以外の信号とを抽出するデマルチプレクサ
    と、 デマルチプレクサに結合されて、エンコードされた音声
    の信号に基いてデコードされた音声の信号を形成する第
    1のデコーダと、 デマルチプレクサに結合されて、エンコードされた音声
    以外の信号に基いてデコードされた音声以外の信号を形
    成する第2のデコーダと、 第1のデコーダおよび第2のデコーダに結合され、オー
    ディオ信号を形成するためにデコードされた音声の信号
    をデコードされた音声以外の信号と結合するミキサとを
    具備していることを特徴とするシステム。
  7. 【請求項7】 エンコードされた音声以外の信号が、複
    数の予め決められた信号のクラスに基いて複数の記号的
    にエンコードされた信号を含む請求項6記載のシステ
    ム。
  8. 【請求項8】 第2のデコーダが複数の記号デコーダを
    具備し、各記号デコーダが音要素の対応するライブラリ
    を具備し、各記号デコーダが記号的にエンコーダされた
    信号の対応する1つに応じて音要素の少なくとも1つを
    発生することができる請求項7記載のシステム。
  9. 【請求項9】 第2のデコーダが、複数の記号デコーダ
    に結合され、記号デコーダによって発生された音要素に
    基いてデコードされた音声以外の信号を再構成する信号
    解析器を具備している請求項8記載のシステム。
JP7333371A 1994-12-21 1995-12-21 低ビット速度のオーディオエンコーダおよびデコーダ Expired - Lifetime JP2971796B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/361,348 US5680512A (en) 1994-12-21 1994-12-21 Personalized low bit rate audio encoder and decoder using special libraries
US361348 1994-12-21

Publications (2)

Publication Number Publication Date
JPH08293798A true JPH08293798A (ja) 1996-11-05
JP2971796B2 JP2971796B2 (ja) 1999-11-08

Family

ID=23421682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7333371A Expired - Lifetime JP2971796B2 (ja) 1994-12-21 1995-12-21 低ビット速度のオーディオエンコーダおよびデコーダ

Country Status (3)

Country Link
US (1) US5680512A (ja)
EP (1) EP0718819A2 (ja)
JP (1) JP2971796B2 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6088484A (en) * 1996-11-08 2000-07-11 Hughes Electronics Corporation Downloading of personalization layers for symbolically compressed objects
US5915237A (en) * 1996-12-13 1999-06-22 Intel Corporation Representing speech using MIDI
US5850628A (en) * 1997-01-30 1998-12-15 Hasbro, Inc. Speech and sound synthesizers with connected memories and outputs
US6351565B1 (en) * 1997-02-07 2002-02-26 Matsushita Electric Industrial Co, Ltd. Data structure for image transmission, method of image transmission, image decoding apparatus, and data recording media
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
EP1076336A3 (en) * 1999-07-12 2002-01-16 DCS Desarrollos Tecnologicos S.A. Method and device for storing, selecting and playing digital audio in magnetic memory and electronic security system against unauthorized copies
US6462264B1 (en) 1999-07-26 2002-10-08 Carl Elam Method and apparatus for audio broadcast of enhanced musical instrument digital interface (MIDI) data formats for control of a sound generator to create music, lyrics, and speech
EP1102242A1 (de) * 1999-11-22 2001-05-23 Alcatel Verfahren zur Personalisierung von Sprachausgabe
FR2808370A1 (fr) * 2000-04-28 2001-11-02 Cit Alcatel Procede de compression d'un fichier midi
JP3915585B2 (ja) * 2002-04-23 2007-05-16 ヤマハ株式会社 データ生成方法、プログラム、記録媒体およびデータ生成装置
US7136811B2 (en) * 2002-04-24 2006-11-14 Motorola, Inc. Low bandwidth speech communication using default and personal phoneme tables
WO2004029935A1 (en) * 2002-09-24 2004-04-08 Rad Data Communications A system and method for low bit-rate compression of combined speech and music
JP3938015B2 (ja) * 2002-11-19 2007-06-27 ヤマハ株式会社 音声再生装置
KR100694395B1 (ko) * 2004-03-02 2007-03-12 엘지전자 주식회사 웨이브 테이블 기반의 미디 합성 방법
US7706415B2 (en) * 2004-07-29 2010-04-27 Microsoft Corporation Packet multiplexing multi-channel audio
EP2064698B1 (en) * 2006-09-18 2015-06-10 Circle Consult ApS A method and a system for providing sound generation instructions
JP5130809B2 (ja) * 2007-07-13 2013-01-30 ヤマハ株式会社 楽曲を制作するための装置およびプログラム
WO2024118046A1 (en) * 2022-11-28 2024-06-06 Product Development Associates, Inc. Low data rate language communication

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03226789A (ja) * 1990-01-31 1991-10-07 Toshiba Lighting & Technol Corp 表示装置
JPH04238392A (ja) * 1991-01-22 1992-08-26 Brother Ind Ltd 音楽再生装置
JPH05183523A (ja) * 1992-01-06 1993-07-23 Oki Electric Ind Co Ltd 音声・楽音符号化装置
JPH0728830A (ja) * 1993-06-25 1995-01-31 Matsushita Electric Ind Co Ltd オーディオデータファイルの分析処理装置
JPH07281667A (ja) * 1994-04-05 1995-10-27 Kawai Musical Instr Mfg Co Ltd 電子楽器

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL63434A0 (en) * 1981-07-27 1981-10-30 Mekler Dan Apparatus and method for drip irrigation
EP0071716B1 (en) * 1981-08-03 1987-08-26 Texas Instruments Incorporated Allophone vocoder
US4876696A (en) * 1986-07-18 1989-10-24 Nec Corporation Transmission system for transmitting multifrequency signals or modem signals with speech signals
US5300724A (en) * 1989-07-28 1994-04-05 Mark Medovich Real time programmable, time variant synthesizer
US5225618A (en) * 1989-08-17 1993-07-06 Wayne Wadhams Method and apparatus for studying music
US5243438A (en) * 1989-10-30 1993-09-07 At&T Bell Laboratories Facsimile compression for transmission
US5228086A (en) * 1990-05-18 1993-07-13 Matsushita Electric Industrial Co., Ltd. Speech encoding apparatus and related decoding apparatus
JPH06161479A (ja) * 1991-01-08 1994-06-07 Brother Ind Ltd 音楽再生装置
DE69214882T2 (de) * 1991-06-06 1997-03-20 Matsushita Electric Ind Co Ltd Gerät zur Unterscheidung von Musik und Sprache
US5305421A (en) * 1991-08-28 1994-04-19 Itt Corporation Low bit rate speech coding system and compression
US5444818A (en) * 1992-12-03 1995-08-22 International Business Machines Corporation System and method for dynamically configuring synthesizers
US5457769A (en) * 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03226789A (ja) * 1990-01-31 1991-10-07 Toshiba Lighting & Technol Corp 表示装置
JPH04238392A (ja) * 1991-01-22 1992-08-26 Brother Ind Ltd 音楽再生装置
JPH05183523A (ja) * 1992-01-06 1993-07-23 Oki Electric Ind Co Ltd 音声・楽音符号化装置
JPH0728830A (ja) * 1993-06-25 1995-01-31 Matsushita Electric Ind Co Ltd オーディオデータファイルの分析処理装置
JPH07281667A (ja) * 1994-04-05 1995-10-27 Kawai Musical Instr Mfg Co Ltd 電子楽器

Also Published As

Publication number Publication date
EP0718819A3 (ja) 1996-07-10
JP2971796B2 (ja) 1999-11-08
EP0718819A2 (en) 1996-06-26
US5680512A (en) 1997-10-21

Similar Documents

Publication Publication Date Title
JP2971796B2 (ja) 低ビット速度のオーディオエンコーダおよびデコーダ
US6088484A (en) Downloading of personalization layers for symbolically compressed objects
US6442517B1 (en) Methods and system for encoding an audio sequence with synchronized data and outputting the same
US6081780A (en) TTS and prosody based authoring system
US6246672B1 (en) Singlecast interactive radio system
JP3412081B2 (ja) ビット率の調節可能なオーディオ符号化/復号化方法及びその装置及びその方法を記録した記録媒体
JP3354863B2 (ja) ビット率の調節可能なオーディオデータ符号化/復号化方法及び装置
CN1878001B (zh) 对音频数据编码及解码的设备及方法
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
MXPA05000285A (es) Metodo y dispositivo para la senalizacion de atenuacion y rafaga en banda eficiente y operacion maxima a semi-proporcion en codificacion de voz de banda ancha de velocidad de bits variable para sistemas inalambricos de cdma.
US20060106597A1 (en) System and method for low bit-rate compression of combined speech and music
JP3388958B2 (ja) 低いビット速度のスピーチエンコーダおよびデコーダ
US20020169601A1 (en) Encoding device, decoding device, and broadcast system
US7136811B2 (en) Low bandwidth speech communication using default and personal phoneme tables
KR100694395B1 (ko) 웨이브 테이블 기반의 미디 합성 방법
CN1212604C (zh) 基于可变速语音编码的语音合成器
EP1298647B1 (en) A communication device and a method for transmitting and receiving of natural speech, comprising a speech recognition module coupled to an encoder
Ding Wideband audio over narrowband low-resolution media
JPH0451100A (ja) 音声情報圧縮装置
WO2002005433A1 (en) A method, a device and a system for compressing a musical and voice signal
JP3219822B2 (ja) 音声合成用符号化装置及び復号化装置
JPH05276049A (ja) 音声符号化方法及びその装置
JPH04349499A (ja) 音声合成システム
KR100247348B1 (ko) 엠펙 오디오 디코더에서 메모리 사이즈를 최소화하기 위한 회로 및 방법
KR0130875B1 (ko) 펄스 코드 변조(pcm) 파형 오디오 및 엠팩(mpeg) 오디오 신호 재생장치

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080827

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080827

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090827

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100827

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110827

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120827

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120827

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130827

Year of fee payment: 14

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term