JP3335841B2 - 信号符号化装置 - Google Patents
信号符号化装置Info
- Publication number
- JP3335841B2 JP3335841B2 JP15485096A JP15485096A JP3335841B2 JP 3335841 B2 JP3335841 B2 JP 3335841B2 JP 15485096 A JP15485096 A JP 15485096A JP 15485096 A JP15485096 A JP 15485096A JP 3335841 B2 JP3335841 B2 JP 3335841B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- pitch
- circuit
- input signal
- pitch prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013139 quantization Methods 0.000 claims description 70
- 238000001228 spectrum Methods 0.000 claims description 35
- 230000005284 excitation Effects 0.000 claims description 25
- 230000003044 adaptive effect Effects 0.000 claims description 24
- 230000015572 biosynthetic process Effects 0.000 claims description 8
- 230000003595 spectral effect Effects 0.000 claims description 8
- 238000003786 synthesis reaction Methods 0.000 claims description 8
- 238000005259 measurement Methods 0.000 claims 2
- 239000011295 pitch Substances 0.000 description 68
- 238000004364 calculation method Methods 0.000 description 47
- 239000013598 vector Substances 0.000 description 39
- 230000004044 response Effects 0.000 description 23
- 230000014509 gene expression Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 17
- 238000000034 method Methods 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 6
- 230000002194 synthesizing effect Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 101000622137 Homo sapiens P-selectin Proteins 0.000 description 1
- 102100023472 P-selectin Human genes 0.000 description 1
- 101000873420 Simian virus 40 SV40 early leader protein Proteins 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006854 communication Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】
【発明の属する技術分野】本発明は信号符号化装置に関
し、特に音声や音楽などの広帯域信号を低いビットレー
トで高品質に符号化するための信号符号化装置に関す
る。
し、特に音声や音楽などの広帯域信号を低いビットレー
トで高品質に符号化するための信号符号化装置に関す
る。
【0002】
【従来の技術】音声信号を高能率に符号化する方式とし
ては、例えば、M.Schroeder and B.
Atalによる”Code−excited line
arprediciton:High quality
speech at very low bit r
ates”(Proc.ICASSP,pp.937−
940,1985年)と題した論文(文献1)や、Kl
eijn他による”Improved speech
quality and efficeintvect
or quantization in SELP”
(Proc.ICASSP,pp.155−158,1
988年)と題した論文(文献2)などに記載されてい
るCELP(Code Excited Linear
Predictive Coding)が知られてい
る。
ては、例えば、M.Schroeder and B.
Atalによる”Code−excited line
arprediciton:High quality
speech at very low bit r
ates”(Proc.ICASSP,pp.937−
940,1985年)と題した論文(文献1)や、Kl
eijn他による”Improved speech
quality and efficeintvect
or quantization in SELP”
(Proc.ICASSP,pp.155−158,1
988年)と題した論文(文献2)などに記載されてい
るCELP(Code Excited Linear
Predictive Coding)が知られてい
る。
【0003】この従来の技術では、送信側では、フレー
ム毎(例えば20ms)に音声信号から線形予測(LP
C)分析を用いて、音声信号のスペクトル特性を表すス
ペクトルパラメータを抽出する。フレームをさらにサブ
フレーム(例えば5ms)に分割し、サブフレーム毎に
過去の音源信号を基に適応コードブックにおけるパラメ
ータ(ピッチ周期に対応する遅延パラメータおよびゲイ
ンパラメータ)を抽出し、適応コードブックにより前記
サブフレームの音源信号をピッチ予測する。ピッチ予測
して求めた音源信号に対して、予め定められた種類の雑
音信号からなる音源コードブック(ベクトル量子化コー
ドブック)から最適な音源コードベクトルを選択し、最
適なゲインを計算することにより、音源信号を量子化す
る。音源コードベクトルの選択の仕方は、選択した雑音
信号により合成した信号と、前記ピッチ予測して求めた
音源信号との誤差電力を最小化するように行う。そし
て、選択されたコードベクトルの種類を表すインデクス
およびゲインコードベクトルを示すインデクスと、前記
スペクトルパラメータ,ピッチ周期に対応する遅延パラ
メータおよびゲインパラメータとをマルチプレクサ部に
より組み合わせて伝送する。受信側の説明は省略する。
ム毎(例えば20ms)に音声信号から線形予測(LP
C)分析を用いて、音声信号のスペクトル特性を表すス
ペクトルパラメータを抽出する。フレームをさらにサブ
フレーム(例えば5ms)に分割し、サブフレーム毎に
過去の音源信号を基に適応コードブックにおけるパラメ
ータ(ピッチ周期に対応する遅延パラメータおよびゲイ
ンパラメータ)を抽出し、適応コードブックにより前記
サブフレームの音源信号をピッチ予測する。ピッチ予測
して求めた音源信号に対して、予め定められた種類の雑
音信号からなる音源コードブック(ベクトル量子化コー
ドブック)から最適な音源コードベクトルを選択し、最
適なゲインを計算することにより、音源信号を量子化す
る。音源コードベクトルの選択の仕方は、選択した雑音
信号により合成した信号と、前記ピッチ予測して求めた
音源信号との誤差電力を最小化するように行う。そし
て、選択されたコードベクトルの種類を表すインデクス
およびゲインコードベクトルを示すインデクスと、前記
スペクトルパラメータ,ピッチ周期に対応する遅延パラ
メータおよびゲインパラメータとをマルチプレクサ部に
より組み合わせて伝送する。受信側の説明は省略する。
【0004】
【発明が解決しようとする課題】上述した従来の技術で
は、音源コードブックから最適な音源コードベクトルを
選択するのに多大な演算量を要するという問題点があっ
た。これは、文献1や文献2の方法では、音源コードベ
クトルを選択するのに、各コードベクトルに対して一旦
フィルタリングもしくは畳み込み演算を行い、この演算
を音源コードブックに格納されている音源コードベクト
ルの個数だけ繰り返すことに起因している。例えば、音
源コードブックのビット数がBビットで、次元数がNの
ときは、フィルタリングあるいは畳み込み演算のときの
フィルタあるいはインパルス応答長をKとすると、演算
量は1秒当たり、N×K×2B ×8000/Nだけ必要
となる。一例として、B=10,N=40,K=10と
すると、1秒当たり81,920,000回の演算が必
要となり、極めて膨大であるということがわかる。ま
た、この問題点は、入力信号の帯域が電話帯域よりも広
く、標本化周波数が高くなるほど、深刻であった。
は、音源コードブックから最適な音源コードベクトルを
選択するのに多大な演算量を要するという問題点があっ
た。これは、文献1や文献2の方法では、音源コードベ
クトルを選択するのに、各コードベクトルに対して一旦
フィルタリングもしくは畳み込み演算を行い、この演算
を音源コードブックに格納されている音源コードベクト
ルの個数だけ繰り返すことに起因している。例えば、音
源コードブックのビット数がBビットで、次元数がNの
ときは、フィルタリングあるいは畳み込み演算のときの
フィルタあるいはインパルス応答長をKとすると、演算
量は1秒当たり、N×K×2B ×8000/Nだけ必要
となる。一例として、B=10,N=40,K=10と
すると、1秒当たり81,920,000回の演算が必
要となり、極めて膨大であるということがわかる。ま
た、この問題点は、入力信号の帯域が電話帯域よりも広
く、標本化周波数が高くなるほど、深刻であった。
【0005】音源コードブック探索に必要な演算量を低
減する方法として、従来、種々のものが提案されてい
る。例えば、ACELP(Argebraic Cod
e Excited Linear Predicti
on)方式が提案されている。これについては、例え
ば、C.Laflammeらによる“16kbps w
ideband speech coding tec
hnique basedon algebraic
CELP”と題した論文(Proc.ICASSP,p
p.13−16,1991)(文献3)等を参照するこ
とができる。文献3の方法によれば、音源信号を複数個
のパルスで表し、各パルスの位置をあらかじめ定められ
たビット数で表して伝送する。ここで、各パルスの振幅
は+1.0もしくは−1.0に限定されているため、パ
ルス探索の演算量を大幅に低減化できる。
減する方法として、従来、種々のものが提案されてい
る。例えば、ACELP(Argebraic Cod
e Excited Linear Predicti
on)方式が提案されている。これについては、例え
ば、C.Laflammeらによる“16kbps w
ideband speech coding tec
hnique basedon algebraic
CELP”と題した論文(Proc.ICASSP,p
p.13−16,1991)(文献3)等を参照するこ
とができる。文献3の方法によれば、音源信号を複数個
のパルスで表し、各パルスの位置をあらかじめ定められ
たビット数で表して伝送する。ここで、各パルスの振幅
は+1.0もしくは−1.0に限定されているため、パ
ルス探索の演算量を大幅に低減化できる。
【0006】さらに、以上述べたいずれの手法も、ピッ
チが1つの音声信号に対しては比較的良好な音質が得ら
れるものの、会議などの用途での複数話者の音声信号
や、楽器が複数種でピッチが複数個含まれる音楽信号に
対しては、低いビットレートでは甚だしく音質が劣化し
ていた。
チが1つの音声信号に対しては比較的良好な音質が得ら
れるものの、会議などの用途での複数話者の音声信号
や、楽器が複数種でピッチが複数個含まれる音楽信号に
対しては、低いビットレートでは甚だしく音質が劣化し
ていた。
【0007】本発明の目的は、上述の問題を解決し、ビ
ットレートが低い場合にも、広帯域の音声信号のみなら
ず音楽信号に対しても、比較的少ない演算量で音質の劣
化の少ない信号符号化装置を提供することにある。
ットレートが低い場合にも、広帯域の音声信号のみなら
ず音楽信号に対しても、比較的少ない演算量で音質の劣
化の少ない信号符号化装置を提供することにある。
【0008】
【課題を解決するための手段】第1の発明の信号符号化
装置は、入力信号からスペクトルパラメータを求めて量
子化するスペクトルパラメータ計算部と、前記入力信号
を複数個の帯域に分割する分割部と、前記複数個の帯域
のうちの2つ以上の帯域においてピッチ情報を求めピッ
チ予測信号を求めるピッチ計算部と、前記複数個の帯域
のうちの2つ以上の帯域において前記ピッチ情報を用い
てピッチ予測の判別を行う判別部と、前記ピッチ予測信
号を合成し前記入力信号から減算して音源信号を求め前
記音源信号を量子化する音源量子化部とを有することを
特徴とする。
装置は、入力信号からスペクトルパラメータを求めて量
子化するスペクトルパラメータ計算部と、前記入力信号
を複数個の帯域に分割する分割部と、前記複数個の帯域
のうちの2つ以上の帯域においてピッチ情報を求めピッ
チ予測信号を求めるピッチ計算部と、前記複数個の帯域
のうちの2つ以上の帯域において前記ピッチ情報を用い
てピッチ予測の判別を行う判別部と、前記ピッチ予測信
号を合成し前記入力信号から減算して音源信号を求め前
記音源信号を量子化する音源量子化部とを有することを
特徴とする。
【0009】第2の発明の信号符号化装置は、第1の発
明の信号符号化装置において、前記入力信号の音源信号
を、振幅が非零の複数個のパルスにより表して量子化す
ることを特徴とする。
明の信号符号化装置において、前記入力信号の音源信号
を、振幅が非零の複数個のパルスにより表して量子化す
ることを特徴とする。
【0010】第3の発明の信号符号化装置は、入力信号
からスペクトルパラメータを求めて量子化するスペクト
ルパラメータ計算部と、前記入力信号から特徴量を抽出
してモードを判別するモード判別部と、あらかじめ定め
られたモードにおいて前記入力信号を複数個の帯域に分
割する分割部と、前記複数個の帯域のうちの2つ以上の
帯域においてピッチ情報を求めピッチ予測信号を求める
ピッチ計算部と、前記複数個の帯域のうちの2つ以上の
帯域において前記ピッチ情報を用いてピッチ予測の判別
を行う判別部と、あらかじめ定められたモードにおいて
前記ピッチ予測信号を合成し前記入力信号から減算して
音源信号を求め前記音源信号を量子化する音源量子化部
とを有することを特徴とする。
からスペクトルパラメータを求めて量子化するスペクト
ルパラメータ計算部と、前記入力信号から特徴量を抽出
してモードを判別するモード判別部と、あらかじめ定め
られたモードにおいて前記入力信号を複数個の帯域に分
割する分割部と、前記複数個の帯域のうちの2つ以上の
帯域においてピッチ情報を求めピッチ予測信号を求める
ピッチ計算部と、前記複数個の帯域のうちの2つ以上の
帯域において前記ピッチ情報を用いてピッチ予測の判別
を行う判別部と、あらかじめ定められたモードにおいて
前記ピッチ予測信号を合成し前記入力信号から減算して
音源信号を求め前記音源信号を量子化する音源量子化部
とを有することを特徴とする。
【0011】第4の発明の信号符号化装置は、第3の発
明の信号符号化装置において、前記入力信号の音源信号
を、振幅が非零の複数個のパルスにより表して量子化す
ることを特徴とする。
明の信号符号化装置において、前記入力信号の音源信号
を、振幅が非零の複数個のパルスにより表して量子化す
ることを特徴とする。
【0012】第5の発明の信号符号化装置は、入力信号
からスペクトルパラメータを求めて量子化するスペクト
ルパラメータ計算部と、前記入力信号を複数個の帯域に
分割する分割部と、前記複数個の帯域のうちの2つ以上
の帯域においてピッチ情報を複数候補求め各候補に対し
てピッチ予測信号を求めるピッチ計算部と、前記ピッチ
情報候補の組合せについて前記ピッチ予測信号を合成し
て前記入力信号と前記ピッチ予測信号との誤差信号を用
いて最良のピッチ情報を選択する選択部と、前記誤差信
号を量子化する音源量子化部とを有することを特徴とす
る。
からスペクトルパラメータを求めて量子化するスペクト
ルパラメータ計算部と、前記入力信号を複数個の帯域に
分割する分割部と、前記複数個の帯域のうちの2つ以上
の帯域においてピッチ情報を複数候補求め各候補に対し
てピッチ予測信号を求めるピッチ計算部と、前記ピッチ
情報候補の組合せについて前記ピッチ予測信号を合成し
て前記入力信号と前記ピッチ予測信号との誤差信号を用
いて最良のピッチ情報を選択する選択部と、前記誤差信
号を量子化する音源量子化部とを有することを特徴とす
る。
【0013】第6の発明の信号符号化装置は、第5の発
明の信号符号化装置において、前記誤差信号を、振幅が
非零の複数個のパルスを用いて表して量子化することを
特徴とする。
明の信号符号化装置において、前記誤差信号を、振幅が
非零の複数個のパルスを用いて表して量子化することを
特徴とする。
【0014】第7の発明の信号符号化装置は、入力信号
からスペクトルパラメータを求めて量子化するスペクト
ルパラメータ計算部と、前記入力信号から特徴量を抽出
してモードを判別するモード判別部と、あらかじめ定め
られたモードにおいて前記入力信号を複数個の帯域に分
割する分割部と、前記複数個の帯域のうちの2つ以上の
帯域においてピッチ情報を複数候補求め各候補に対して
ピッチ予測信号を求めるピッチ計算部と、あらかじめ定
められたモードにおいて前記ピッチ情報候補の組合せに
ついて前記ピッチ予測信号を合成して前記入力信号と前
記ピッチ予測信号との誤差信号を用いて最良のピッチ情
報を選択する選択部と、前記誤差信号を量子化する音源
量子化部とを有することを特徴とする。
からスペクトルパラメータを求めて量子化するスペクト
ルパラメータ計算部と、前記入力信号から特徴量を抽出
してモードを判別するモード判別部と、あらかじめ定め
られたモードにおいて前記入力信号を複数個の帯域に分
割する分割部と、前記複数個の帯域のうちの2つ以上の
帯域においてピッチ情報を複数候補求め各候補に対して
ピッチ予測信号を求めるピッチ計算部と、あらかじめ定
められたモードにおいて前記ピッチ情報候補の組合せに
ついて前記ピッチ予測信号を合成して前記入力信号と前
記ピッチ予測信号との誤差信号を用いて最良のピッチ情
報を選択する選択部と、前記誤差信号を量子化する音源
量子化部とを有することを特徴とする。
【0015】第8の発明の信号符号化装置は、第7の発
明の信号符号化装置において、前記誤差信号を、振幅が
非零の複数個のパルスを用いて表して量子化することを
特徴とする。
明の信号符号化装置において、前記誤差信号を、振幅が
非零の複数個のパルスを用いて表して量子化することを
特徴とする。
【0016】
【発明の実施の形態】次に、本発明について図面を参照
して詳細に説明する。
して詳細に説明する。
【0017】図1は、本発明の第1の実施の形態に係る
信号符号化装置の構成を示す回路ブロック図である。本
実施の形態に係る信号符号化装置は、フレーム分割回路
110と、サブフレーム分割回路120と、スペクトル
パラメータ計算回路200と、スペクトルパラメータ量
子化回路210と、コードブック215と、聴感重み付
け回路230と、減算回路235および236と、応答
信号計算回路240と、ピッチ情報を計算する適応コー
ドブック回路3001 〜300U と、インパルス応答計
算回路310と、音源量子化回路350と、音源コード
ブック355と、重み付け信号計算回路360と、ゲイ
ン量子化回路365と、ゲインコードブック366と、
マルチプレクサ400と、分割回路410,415およ
び440と、ピッチ予測の判別を行う判別回路4201
〜420U と、合成回路430とから構成されている。
信号符号化装置の構成を示す回路ブロック図である。本
実施の形態に係る信号符号化装置は、フレーム分割回路
110と、サブフレーム分割回路120と、スペクトル
パラメータ計算回路200と、スペクトルパラメータ量
子化回路210と、コードブック215と、聴感重み付
け回路230と、減算回路235および236と、応答
信号計算回路240と、ピッチ情報を計算する適応コー
ドブック回路3001 〜300U と、インパルス応答計
算回路310と、音源量子化回路350と、音源コード
ブック355と、重み付け信号計算回路360と、ゲイ
ン量子化回路365と、ゲインコードブック366と、
マルチプレクサ400と、分割回路410,415およ
び440と、ピッチ予測の判別を行う判別回路4201
〜420U と、合成回路430とから構成されている。
【0018】次に、このように構成された第1の実施の
形態に係る信号符号化装置の動作について説明する。
形態に係る信号符号化装置の動作について説明する。
【0019】フレーム分割回路110は、入力端子10
0から音声信号を入力し、音声信号をフレーム(例えば
10ms)毎に分割する。
0から音声信号を入力し、音声信号をフレーム(例えば
10ms)毎に分割する。
【0020】サブフレーム分割回路120は、フレーム
の音声信号をフレームよりも短いサブフレーム(例えば
5ms)に分割する。
の音声信号をフレームよりも短いサブフレーム(例えば
5ms)に分割する。
【0021】スペクトルパラメータ計算回路200は、
2つ以上のサブフレームの音声信号に対して、サブフレ
ーム長よりも長い窓(例えば24ms)をかけて音声を
切り出してスペクトルパラメータをあらかじめ定められ
た次数(例えばP=10次)計算する。ここで、スペク
トルパラメータの計算には、周知のLPC分析,Bur
g分析等を用いることができる。ここでは、Burg分
析を用いることとする。Burg分析の詳細について
は、中溝著による”信号解析とシステム同定”と題した
単行本(コロナ社,1988年刊)の第82〜87頁
(文献4)等に記載されているので、詳しい説明は省略
する。
2つ以上のサブフレームの音声信号に対して、サブフレ
ーム長よりも長い窓(例えば24ms)をかけて音声を
切り出してスペクトルパラメータをあらかじめ定められ
た次数(例えばP=10次)計算する。ここで、スペク
トルパラメータの計算には、周知のLPC分析,Bur
g分析等を用いることができる。ここでは、Burg分
析を用いることとする。Burg分析の詳細について
は、中溝著による”信号解析とシステム同定”と題した
単行本(コロナ社,1988年刊)の第82〜87頁
(文献4)等に記載されているので、詳しい説明は省略
する。
【0022】さらに、スペクトルパラメータ計算回路2
00は、Burg法により計算された線形予測係数αi
(i=1,…,10)を量子化や補間に適したLSPパ
ラメータに変換する。ここで、線形予測係数からLSP
パラメータへの変換は、菅村他による”線スペクトル対
(LSP)音声分析合成方式による音声情報圧縮”と題
した論文(電子通信学会論文誌,J64−A,pp.5
99−606,1981年)(文献5)を参照すること
ができる。例えば、スペクトルパラメータ計算回路20
0は、第2サブフレームでBurg法により求めた線形
予測係数をLSPパラメータに変換し、第1サブフレー
ムのLSPパラメータを直線補間により求めて、第1サ
ブフレームのLSPパラメータを逆変換して線形予測係
数に戻し、第1および2サブフレームの線形予測係数α
il(i=1,…,10,l=1,…,2)を聴感重み付
け回路230に出力する。また、スペクトルパラメータ
計算回路200は、第2サブフレームのLSPパラメー
タをスペクトルパラメータ量子化回路210に出力す
る。
00は、Burg法により計算された線形予測係数αi
(i=1,…,10)を量子化や補間に適したLSPパ
ラメータに変換する。ここで、線形予測係数からLSP
パラメータへの変換は、菅村他による”線スペクトル対
(LSP)音声分析合成方式による音声情報圧縮”と題
した論文(電子通信学会論文誌,J64−A,pp.5
99−606,1981年)(文献5)を参照すること
ができる。例えば、スペクトルパラメータ計算回路20
0は、第2サブフレームでBurg法により求めた線形
予測係数をLSPパラメータに変換し、第1サブフレー
ムのLSPパラメータを直線補間により求めて、第1サ
ブフレームのLSPパラメータを逆変換して線形予測係
数に戻し、第1および2サブフレームの線形予測係数α
il(i=1,…,10,l=1,…,2)を聴感重み付
け回路230に出力する。また、スペクトルパラメータ
計算回路200は、第2サブフレームのLSPパラメー
タをスペクトルパラメータ量子化回路210に出力す
る。
【0023】スペクトルパラメータ量子化回路210
は、あらかじめ定められたサブフレームのLSPパラメ
ータを効率的に量子化する。量子化法として、ベクトル
量子化を用いるものとし、第2サブフレームのLSPパ
ラメータを量子化するものとする。LSPパラメータの
ベクトル量子化の手法は、周知の手法を用いることがで
きる。具体的な方法については、例えば、特開平4−1
71500号公報(文献6),特開平4−363000
号公報(文献7),特開平5−6199号公報(文献
8),T.Nomura他による”LSP Codin
g Using VQ−SVQ With Inter
polation in 4.075kbpsM−LC
ELP Speech Coder”と題した論文(P
roc.Mobile Multimedia Com
munications,pp.B.2.5,199
3)(文献9)等を参照できる。
は、あらかじめ定められたサブフレームのLSPパラメ
ータを効率的に量子化する。量子化法として、ベクトル
量子化を用いるものとし、第2サブフレームのLSPパ
ラメータを量子化するものとする。LSPパラメータの
ベクトル量子化の手法は、周知の手法を用いることがで
きる。具体的な方法については、例えば、特開平4−1
71500号公報(文献6),特開平4−363000
号公報(文献7),特開平5−6199号公報(文献
8),T.Nomura他による”LSP Codin
g Using VQ−SVQ With Inter
polation in 4.075kbpsM−LC
ELP Speech Coder”と題した論文(P
roc.Mobile Multimedia Com
munications,pp.B.2.5,199
3)(文献9)等を参照できる。
【0024】スペクトルパラメータ量子化回路210
は、コードブック215を用いて、数1の歪みDj を最
小化するコードベクトルを選択して出力する。
は、コードブック215を用いて、数1の歪みDj を最
小化するコードベクトルを選択して出力する。
【0025】
【数1】
【0026】数1で、LSP(i),QLSP(i)j
およびW(i)は、それぞれ、量子化前のi次目のLS
P,j番目のコードベクトルおよび重み係数である。
およびW(i)は、それぞれ、量子化前のi次目のLS
P,j番目のコードベクトルおよび重み係数である。
【0027】また、スペクトルパラメータ量子化回路2
10は、第2サブフレームで量子化したLSPパラメー
タをもとに、第1サブフレームのLSPパラメータを復
元する。ここでは、現フレームの第2サブフレームの量
子化LSPパラメータと1つ過去のフレームの第2サブ
フレームの量子化LSPパラメータとを直線補間して、
第1サブフレームのLSPパラメータを復元する。ここ
で、スペクトルパラメータ量子化回路210は、量子化
前のLSPパラメータと量子化後のLSPパラメータと
の誤差電力を最小化するコードベクトルを1種類選択し
た後に、直線補間により第1サブフレームのLSPパラ
メータを復元できる。
10は、第2サブフレームで量子化したLSPパラメー
タをもとに、第1サブフレームのLSPパラメータを復
元する。ここでは、現フレームの第2サブフレームの量
子化LSPパラメータと1つ過去のフレームの第2サブ
フレームの量子化LSPパラメータとを直線補間して、
第1サブフレームのLSPパラメータを復元する。ここ
で、スペクトルパラメータ量子化回路210は、量子化
前のLSPパラメータと量子化後のLSPパラメータと
の誤差電力を最小化するコードベクトルを1種類選択し
た後に、直線補間により第1サブフレームのLSPパラ
メータを復元できる。
【0028】スペクトルパラメータ量子化回路210
は、以上により復元した第1サブフレームのLSPパラ
メータと第2サブフレームの量子化LSPパラメータと
を、サブフレーム毎に線形予測係数αi (i=1,…,
10)に変換し、インパルス応答計算回路310に出力
する。また、スペクトルパラメータ量子化回路210
は、第2サブフレームの量子化LSPパラメータのコー
ドベクトルを表すインデクスをマルチプレクサ400に
出力する。
は、以上により復元した第1サブフレームのLSPパラ
メータと第2サブフレームの量子化LSPパラメータと
を、サブフレーム毎に線形予測係数αi (i=1,…,
10)に変換し、インパルス応答計算回路310に出力
する。また、スペクトルパラメータ量子化回路210
は、第2サブフレームの量子化LSPパラメータのコー
ドベクトルを表すインデクスをマルチプレクサ400に
出力する。
【0029】聴感重み付け回路230は、スペクトルパ
ラメータ計算回路200から各サブフレーム毎に量子化
前の線形予測係数αi (i=1,…,10)を入力し、
前記文献1にもとづきサブフレームの音声信号に対して
聴感重み付けを行い、聴感重み付け信号xw (n)を出
力する。
ラメータ計算回路200から各サブフレーム毎に量子化
前の線形予測係数αi (i=1,…,10)を入力し、
前記文献1にもとづきサブフレームの音声信号に対して
聴感重み付けを行い、聴感重み付け信号xw (n)を出
力する。
【0030】応答信号計算回路240は、スペクトルパ
ラメータ計算回路200から各サブフレーム毎に線形予
測係数αi を入力し、スペクトルパラメータ量子化回路
210から量子化および補間して復元した線形予測係数
αi をサブフレーム毎に入力し、保存されているフィル
タメモリの値を用いて入力信号d(n)を0とした応答
信号xz (n)を1サブフレーム分計算し、減算器23
5に出力する。ここで、応答信号xz (n)は、数2で
表される。
ラメータ計算回路200から各サブフレーム毎に線形予
測係数αi を入力し、スペクトルパラメータ量子化回路
210から量子化および補間して復元した線形予測係数
αi をサブフレーム毎に入力し、保存されているフィル
タメモリの値を用いて入力信号d(n)を0とした応答
信号xz (n)を1サブフレーム分計算し、減算器23
5に出力する。ここで、応答信号xz (n)は、数2で
表される。
【0031】
【数2】
【0032】ただし、n−i≦0のときは、数3および
数4である。
数4である。
【0033】
【数3】
【0034】
【数4】
【0035】数2,数3および数4で、Nはサブフレー
ム長を示す。γは聴感重み付け量を制御する重み係数で
あり、下記の数6におけるのと同一の値である。s
w (n)およびp(n)は、重み付け信号計算回路36
0から出力される応答信号および後述の数6における右
辺第1項のフィルタの分母の項の出力信号をそれぞれ示
す。
ム長を示す。γは聴感重み付け量を制御する重み係数で
あり、下記の数6におけるのと同一の値である。s
w (n)およびp(n)は、重み付け信号計算回路36
0から出力される応答信号および後述の数6における右
辺第1項のフィルタの分母の項の出力信号をそれぞれ示
す。
【0036】減算器235は、数5により、聴感重み付
け信号xw (n)から応答信号xz(n)を1サブフレ
ーム分減算し、減算結果x’w (n)を分割回路410
および減算器820に出力する。
け信号xw (n)から応答信号xz(n)を1サブフレ
ーム分減算し、減算結果x’w (n)を分割回路410
および減算器820に出力する。
【0037】
【数5】
【0038】インパルス応答計算回路310は、z変換
が数6で表される聴感重み付けフィルタのインパルス応
答hW (n)をあらかじめ定められた点数Lだけ計算
し、分割回路415および音源量子化回路350に出力
する。
が数6で表される聴感重み付けフィルタのインパルス応
答hW (n)をあらかじめ定められた点数Lだけ計算
し、分割回路415および音源量子化回路350に出力
する。
【0039】
【数6】
【0040】分割回路410は、減算器235の減算結
果x’w (n)をあらかじめ定められた個数Uのサブ帯
域に分割し、残差信号x’w1(n)〜x’wU(n)とし
て適応コードブック回路3001 〜300U および判別
回路4201 〜420U にそれぞれ出力する。なお、帯
域分割には、QMF(Quadrature Mirr
or Filter:直交鏡像型フィルタ)を使用する
ことができる。QMFの使用により、比較的少ないフィ
ルタ次数により分割が可能となる。QMFの構成法につ
いては、P.Vaidyanathanによる”Mul
tiratedigital filters,fil
ter banks,polyphase netwo
rks,and applications:A tu
torial”と題した論文(Proc.IEEE,v
ol.78,pp.56−93,1990)(文献1
0)を参照できる。
果x’w (n)をあらかじめ定められた個数Uのサブ帯
域に分割し、残差信号x’w1(n)〜x’wU(n)とし
て適応コードブック回路3001 〜300U および判別
回路4201 〜420U にそれぞれ出力する。なお、帯
域分割には、QMF(Quadrature Mirr
or Filter:直交鏡像型フィルタ)を使用する
ことができる。QMFの使用により、比較的少ないフィ
ルタ次数により分割が可能となる。QMFの構成法につ
いては、P.Vaidyanathanによる”Mul
tiratedigital filters,fil
ter banks,polyphase netwo
rks,and applications:A tu
torial”と題した論文(Proc.IEEE,v
ol.78,pp.56−93,1990)(文献1
0)を参照できる。
【0041】分割回路415は、インパルス応答h
W (n)をあらかじめ定められた個数Uのサブ帯域に分
割して、各サブ帯域のインパルス応答hw1(n)〜hwU
(n)を、サブ帯域の適応コードブック回路3001 〜
300U の対応するサブ帯域に出力する。
W (n)をあらかじめ定められた個数Uのサブ帯域に分
割して、各サブ帯域のインパルス応答hw1(n)〜hwU
(n)を、サブ帯域の適応コードブック回路3001 〜
300U の対応するサブ帯域に出力する。
【0042】適応コードブック回路3001 〜300U
および判別回路4201 〜420Uは、各サブ帯域に対
して同一の動作を行うので、一例として、適応コードブ
ック回路3001 および判別回路4201 の動作を説明
する。
および判別回路4201 〜420Uは、各サブ帯域に対
して同一の動作を行うので、一例として、適応コードブ
ック回路3001 および判別回路4201 の動作を説明
する。
【0043】適応コードブック回路3001 は、分割回
路440からサブ帯域1に対応する過去の音源信号v1
(n)を、分割回路410からサブ帯域1に対応する残
差信号x’w1(n)を、分割回路415からサブ帯域1
に対応するインパルス応答hw1(n)をそれぞれ入力す
る。
路440からサブ帯域1に対応する過去の音源信号v1
(n)を、分割回路410からサブ帯域1に対応する残
差信号x’w1(n)を、分割回路415からサブ帯域1
に対応するインパルス応答hw1(n)をそれぞれ入力す
る。
【0044】次に、適応コードブック回路3001 は、
ピッチ周期に対応する遅延パラメータT1 とピッチゲイ
ンβ1 とを数7の歪みDT1を最小化するように求め、判
別回路4201 に出力する。
ピッチ周期に対応する遅延パラメータT1 とピッチゲイ
ンβ1 とを数7の歪みDT1を最小化するように求め、判
別回路4201 に出力する。
【0045】
【数7】
【0046】数7で、yw1(n−T1 )は数8であり、
記号*は畳み込み演算を表す。
記号*は畳み込み演算を表す。
【0047】
【数8】
【0048】続いて、適応コードブック回路300
1 は、ピッチゲインβ1 を、数9に従い求める。
1 は、ピッチゲインβ1 を、数9に従い求める。
【0049】
【数9】
【0050】数9で、女性音や子供の声に対して、遅延
パラメータT1 の抽出精度を向上させるために、遅延パ
ラメータT1 を整数サンプルではなく、小数サンプル値
で求めてもよい。具体的な方法は、例えば、P.Kro
onらによる、“Pitchpredictors w
ith high temporal resolut
ion”と題した論文(Proc.ICASSP,p
p.661−664,1990年)(文献11)等を参
照することができる。
パラメータT1 の抽出精度を向上させるために、遅延パ
ラメータT1 を整数サンプルではなく、小数サンプル値
で求めてもよい。具体的な方法は、例えば、P.Kro
onらによる、“Pitchpredictors w
ith high temporal resolut
ion”と題した論文(Proc.ICASSP,p
p.661−664,1990年)(文献11)等を参
照することができる。
【0051】さらに、適応コードブック回路300
1 は、ピッチゲインβ1 をあらかじめ定められた量子化
ビット数で量子化した後に、数10および数11に従い
ピッチ予測を行い、ピッチ予測値qw1(n)とピッチ予
測音源信号g1 (n)とを判別回路4201 に出力す
る。
1 は、ピッチゲインβ1 をあらかじめ定められた量子化
ビット数で量子化した後に、数10および数11に従い
ピッチ予測を行い、ピッチ予測値qw1(n)とピッチ予
測音源信号g1 (n)とを判別回路4201 に出力す
る。
【0052】
【数10】
【0053】
【数11】
【0054】数10および数11で、β’1 は量子化さ
れたゲインである。
れたゲインである。
【0055】判別回路4201 は、ピッチ予測ゲインG
1 を求め、これをあらかじめ定められたしきい値と比較
し、ピッチ予測を行うか否かの判別を行う。ピッチ予測
ゲインG1 は、数12で求める。
1 を求め、これをあらかじめ定められたしきい値と比較
し、ピッチ予測を行うか否かの判別を行う。ピッチ予測
ゲインG1 は、数12で求める。
【0056】
【数12】
【0057】ピッチ予測ゲインG1 があらかじめ定めら
れたしきい値よりも大きい場合は、判別回路420
1 は、ピッチ予測ありとして、ピッチ予測値qw1(n)
とピッチ予測音源信号g1 (n)とを合成回路430に
出力する。
れたしきい値よりも大きい場合は、判別回路420
1 は、ピッチ予測ありとして、ピッチ予測値qw1(n)
とピッチ予測音源信号g1 (n)とを合成回路430に
出力する。
【0058】ピッチ予測ゲインG1 がしきい値よりも小
さい場合は、判別回路4201 は、ピッチ予測なしと
し、振幅全て零の信号を合成回路430に出力する。
さい場合は、判別回路4201 は、ピッチ予測なしと
し、振幅全て零の信号を合成回路430に出力する。
【0059】判別回路4201 は、ピッチ予測ありのと
きは、遅延パラメータT1 を表すインデクスと、量子化
されたゲインβ’1 を表すインデクスとをマルチプレク
サ400に出力する。
きは、遅延パラメータT1 を表すインデクスと、量子化
されたゲインβ’1 を表すインデクスとをマルチプレク
サ400に出力する。
【0060】合成回路430は、判別回路4201 から
ピッチ予測値qw1(n)とピッチ予測音源信号g
1 (n)とを受け取り、全帯域合成を行い、全帯域合成
信号qw (n)を減算器236に出力する。また、合成
回路430は、全帯域合成音源信号g(n)を重み付け
信号計算回路360に出力する。
ピッチ予測値qw1(n)とピッチ予測音源信号g
1 (n)とを受け取り、全帯域合成を行い、全帯域合成
信号qw (n)を減算器236に出力する。また、合成
回路430は、全帯域合成音源信号g(n)を重み付け
信号計算回路360に出力する。
【0061】減算器236は、数13に示すように減算
回路235の減算結果x’w (n)から全帯域合成信号
gw (n)を減算して、減算結果である音源信号z
w (n)を音源量子化回路350に出力する。
回路235の減算結果x’w (n)から全帯域合成信号
gw (n)を減算して、減算結果である音源信号z
w (n)を音源量子化回路350に出力する。
【0062】
【数13】
【0063】音源量子化回路350は、音源信号z
w (n)を音源コードブック355を用いてベクトル量
子化する。詳しくは、音源量子化回路350は、減算器
236の出力である音源信号zw (n)とインパルス応
答計算回路310の出力であるインパルス応答h
W (n)とを用いて、数14の歪みDj を最小化するよ
うに、音源コードブック355から音源コードベクトル
cj (n)を探索する。
w (n)を音源コードブック355を用いてベクトル量
子化する。詳しくは、音源量子化回路350は、減算器
236の出力である音源信号zw (n)とインパルス応
答計算回路310の出力であるインパルス応答h
W (n)とを用いて、数14の歪みDj を最小化するよ
うに、音源コードブック355から音源コードベクトル
cj (n)を探索する。
【0064】
【数14】
【0065】数14で、ψ(n)およびswj(n)は、
数15および数16である。
数15および数16である。
【0066】
【数15】
【0067】
【数16】
【0068】数16で、記号*は畳み込み演算を示す。
【0069】音源量子化回路350は、選択された音源
コードベクトルのインデクスをマルチプレクサ400に
出力する。
コードベクトルのインデクスをマルチプレクサ400に
出力する。
【0070】ゲイン量子化回路365は、ゲインコード
ブック366からゲインコードベクトルを読み出し、選
択された音源コードベクトルに対して、数17の歪みD
t を最小化するゲインコードベクトルを選択する。ここ
では、音源コードベクトルのゲインをベクトル量子化す
る例について示す。
ブック366からゲインコードベクトルを読み出し、選
択された音源コードベクトルに対して、数17の歪みD
t を最小化するゲインコードベクトルを選択する。ここ
では、音源コードベクトルのゲインをベクトル量子化す
る例について示す。
【0071】
【数17】
【0072】数17で、G’t は、ゲインコードブック
366に格納された2次元ゲインコードベクトルにおけ
るt番目のコードベクトルの要素である。
366に格納された2次元ゲインコードベクトルにおけ
るt番目のコードベクトルの要素である。
【0073】ゲイン量子化回路365は、選択されたゲ
インコードベクトルを表すインデクスをマルチプレクサ
400に出力する。
インコードベクトルを表すインデクスをマルチプレクサ
400に出力する。
【0074】重み付け信号計算回路360は、ピッチ周
期を表すインデクス,量子化されたゲインを表すインデ
クス,音源コードブック355のインデクス,ゲインコ
ードベクトルを表すインデクスをそれぞれ入力し、これ
らのインデクスからそれに対応するコードベクトルを読
み出し、まず数18にもとづき駆動音源信号v(n)を
求める。
期を表すインデクス,量子化されたゲインを表すインデ
クス,音源コードブック355のインデクス,ゲインコ
ードベクトルを表すインデクスをそれぞれ入力し、これ
らのインデクスからそれに対応するコードベクトルを読
み出し、まず数18にもとづき駆動音源信号v(n)を
求める。
【0075】
【数18】
【0076】重み付け信号計算回路360は、駆動音源
信号v(n)を分割回路440に出力する。
信号v(n)を分割回路440に出力する。
【0077】次に、重み付け信号計算回路360は、ス
ペクトルパラメータ計算回路200の出力パラメータ
(LSPパラメータ)およびスペクトルパラメータ量子
化回路210の出力パラメータ(線形予測係数αi )を
用いて、数19により応答信号sw (n)をサブフレー
ム毎に計算し、応答信号計算回路240に出力する。
ペクトルパラメータ計算回路200の出力パラメータ
(LSPパラメータ)およびスペクトルパラメータ量子
化回路210の出力パラメータ(線形予測係数αi )を
用いて、数19により応答信号sw (n)をサブフレー
ム毎に計算し、応答信号計算回路240に出力する。
【0078】
【数19】
【0079】分割回路440は、重み付け信号計算回路
360から出力された駆動音源信号v(n)に対して、
各サブ帯域への帯域分割を行い、各サブ帯域に対応する
過去の音源信号v1 (n)〜vU (n)を適応コードブ
ック回路3001 〜300Uに出力する。
360から出力された駆動音源信号v(n)に対して、
各サブ帯域への帯域分割を行い、各サブ帯域に対応する
過去の音源信号v1 (n)〜vU (n)を適応コードブ
ック回路3001 〜300Uに出力する。
【0080】以上により、第1の実施の形態に係る信号
符号化装置の説明を終える。
符号化装置の説明を終える。
【0081】図2は、本発明の第2の実施の形態に係る
信号符号化装置の構成を示す回路ブロック図である。第
2の実施の形態に係る信号符号化装置が、図1に示した
第1の実施の形態に係る信号符号化装置と異なるのは、
音源量子化回路500,振幅コードブック540,ゲイ
ン量子化回路550,ゲインコードブック560,およ
び重み付け信号計算回路570である。したがって、そ
の他の回路等については、対応する回路等に同一符号を
付して詳しい説明を省略する。
信号符号化装置の構成を示す回路ブロック図である。第
2の実施の形態に係る信号符号化装置が、図1に示した
第1の実施の形態に係る信号符号化装置と異なるのは、
音源量子化回路500,振幅コードブック540,ゲイ
ン量子化回路550,ゲインコードブック560,およ
び重み付け信号計算回路570である。したがって、そ
の他の回路等については、対応する回路等に同一符号を
付して詳しい説明を省略する。
【0082】図3を参照すると、音源量子化回路500
は、相関係数計算回路510と、位置計算回路520
と、振幅量子化回路530とから構成されている。
は、相関係数計算回路510と、位置計算回路520
と、振幅量子化回路530とから構成されている。
【0083】次に、このように構成された第2の実施の
形態に係る信号符号化装置の動作について、第1の実施
の形態に係る信号符号化装置と異なる点を中心に簡単に
説明する。
形態に係る信号符号化装置の動作について、第1の実施
の形態に係る信号符号化装置と異なる点を中心に簡単に
説明する。
【0084】音源量子化回路500は、M個の振幅が非
零のパルス列の位置および振幅を計算する。
零のパルス列の位置および振幅を計算する。
【0085】詳しくは、音源量子化回路500では、図
3に示すように、相関係数計算回路510が、端子50
1および502から減算器236の減算結果zw (n)
およびインパルス応答計算回路310のインパルス応答
hw (n)をそれぞれ入力し、数20および数21に従
い、2種の相関係数ψ(n)およびφ(p,q)を計算
し、位置計算回路520および振幅量子化回路530に
出力する。
3に示すように、相関係数計算回路510が、端子50
1および502から減算器236の減算結果zw (n)
およびインパルス応答計算回路310のインパルス応答
hw (n)をそれぞれ入力し、数20および数21に従
い、2種の相関係数ψ(n)およびφ(p,q)を計算
し、位置計算回路520および振幅量子化回路530に
出力する。
【0086】
【数20】
【0087】
【数21】
【0088】位置計算回路520は、あらかじめ定めら
れた個数Mの非零の振幅のパルスの位置を計算する。こ
れには、文献3と同様に、各パルス毎に、あらかじめ定
められた位置の候補について、数22で表される評価値
Dを最大化するパルスの位置を求める。
れた個数Mの非零の振幅のパルスの位置を計算する。こ
れには、文献3と同様に、各パルス毎に、あらかじめ定
められた位置の候補について、数22で表される評価値
Dを最大化するパルスの位置を求める。
【0089】例えば、位置の候補の例は、サブフレーム
長をN=40、パルスの個数をM=5とすると、表1の
ように表せる。
長をN=40、パルスの個数をM=5とすると、表1の
ように表せる。
【0090】
【表1】
【0091】位置計算回路520は、各パルスについて
位置の候補を調べ、数22を最大化する位置を選択す
る。
位置の候補を調べ、数22を最大化する位置を選択す
る。
【0092】
【数22】
【0093】数22で、CK およびEK は、数23およ
び数24である。
び数24である。
【0094】
【数23】
【0095】
【数24】
【0096】数23および数24で、mk はk番目のパ
ルスの位置を示し、sgn(k)はk番目のパルスの極
性を示す。
ルスの位置を示し、sgn(k)はk番目のパルスの極
性を示す。
【0097】位置計算回路520は、M個のパルスの位
置を振幅量子化回路530に出力する。
置を振幅量子化回路530に出力する。
【0098】振幅量子化回路530は、パルスの振幅を
振幅コードブック540を用いて量子化する。詳しく
は、振幅量子化回路530は、数25で表される評価値
を最大化する振幅コードベクトルを選択する。
振幅コードブック540を用いて量子化する。詳しく
は、振幅量子化回路530は、数25で表される評価値
を最大化する振幅コードベクトルを選択する。
【0099】
【数25】
【0100】数25で、Cj およびEj は、数26およ
び数27である。
び数27である。
【0101】
【数26】
【0102】
【数27】
【0103】数26および数27で、g’kjはj番目の
振幅コードベクトルにおけるk番目のパルスの振幅を示
す。
振幅コードベクトルにおけるk番目のパルスの振幅を示
す。
【0104】なお、パルスの振幅を量子化するための振
幅コードブック540を、音声信号を用いてあらかじめ
学習して格納しておくこともできる。コードブックの学
習法は、例えば、Lindeらによる“An algo
rithm for vector quantiza
tion design”と題した論文(IEEETr
ans.Commun.,pp.84−95,Janu
ary,1980)(文献12)等を参照できる。
幅コードブック540を、音声信号を用いてあらかじめ
学習して格納しておくこともできる。コードブックの学
習法は、例えば、Lindeらによる“An algo
rithm for vector quantiza
tion design”と題した論文(IEEETr
ans.Commun.,pp.84−95,Janu
ary,1980)(文献12)等を参照できる。
【0105】振幅量子化回路530は、振幅コードベク
トルのインデクスおよび位置の情報を端子503および
504からそれぞれ出力する。
トルのインデクスおよび位置の情報を端子503および
504からそれぞれ出力する。
【0106】ゲイン量子化回路550は、ゲインコード
ブック560を用いてパルスのゲインを量子化する。詳
しくは、ゲイン量子化回路550は、数28の歪みDt
を最小化するようなゲインコードベクトルを選択し、選
択したゲインコードベクトルのインデクスをマルチプレ
クサ400に出力する。
ブック560を用いてパルスのゲインを量子化する。詳
しくは、ゲイン量子化回路550は、数28の歪みDt
を最小化するようなゲインコードベクトルを選択し、選
択したゲインコードベクトルのインデクスをマルチプレ
クサ400に出力する。
【0107】
【数28】
【0108】重み付け信号計算回路570は、ピッチ周
期を表すインデクス,量子化されたゲインを表すインデ
クス,振幅コードブック540のインデクスおよびゲイ
ンコードベクトルのインデクスを入力し、これらのイン
デクスからそれに対応するコードベクトルを読み出し、
まず数29にもとづき駆動音源信号v(n)を求める。
期を表すインデクス,量子化されたゲインを表すインデ
クス,振幅コードブック540のインデクスおよびゲイ
ンコードベクトルのインデクスを入力し、これらのイン
デクスからそれに対応するコードベクトルを読み出し、
まず数29にもとづき駆動音源信号v(n)を求める。
【0109】
【数29】
【0110】重み付け信号計算回路570は、駆動音源
信号v(n)を分割回路440に出力する。
信号v(n)を分割回路440に出力する。
【0111】次に、重み付け信号計算回路570は、ス
ペクトルパラメータ計算回路200の出力パラメータ
(LSPパラメータ)およびスペクトルパラメータ量子
化回路210の出力パラメータ(線形予測係数α’i )
を用いて、数30により応答信号sw (n)をサブフレ
ーム毎に計算し、応答信号計算回路240に出力する。
ペクトルパラメータ計算回路200の出力パラメータ
(LSPパラメータ)およびスペクトルパラメータ量子
化回路210の出力パラメータ(線形予測係数α’i )
を用いて、数30により応答信号sw (n)をサブフレ
ーム毎に計算し、応答信号計算回路240に出力する。
【0112】
【数30】
【0113】図4は、本発明の第3の実施の形態に係る
信号符号化装置の構成を示す回路ブロック図である。図
4において、図1と異なるのは、分割回路600,61
5および620と、合成回路610と、モード判別回路
900とである。
信号符号化装置の構成を示す回路ブロック図である。図
4において、図1と異なるのは、分割回路600,61
5および620と、合成回路610と、モード判別回路
900とである。
【0114】次に、このように構成された第3の実施の
形態に係る信号符号化装置の動作について、第1の実施
の形態に係る信号符号化装置と異なる点を中心に簡単に
説明する。
形態に係る信号符号化装置の動作について、第1の実施
の形態に係る信号符号化装置と異なる点を中心に簡単に
説明する。
【0115】モード判別回路900は、聴感重み付け回
路230からフレーム単位で聴感重み付け信号x
w (n)を受け取り、モード情報を分割回路600,分
割回路615,分割回路620,合成回路610および
マルチプレクサ400に出力する。
路230からフレーム単位で聴感重み付け信号x
w (n)を受け取り、モード情報を分割回路600,分
割回路615,分割回路620,合成回路610および
マルチプレクサ400に出力する。
【0116】ここでは、モード判別に、現在のフレーム
の特徴量を用いる。特徴量としては、例えば、フレーム
で平均したピッチ予測ゲインGを用いる。フレーム平均
ピッチ予測ゲインGの計算は、例えば、数31を用い
る。
の特徴量を用いる。特徴量としては、例えば、フレーム
で平均したピッチ予測ゲインGを用いる。フレーム平均
ピッチ予測ゲインGの計算は、例えば、数31を用い
る。
【0117】
【数31】
【0118】数31で、Lはフレームに含まれるサブフ
レームの個数である。Pi およびEi は、数32に示す
i番目のサブフレームでの音声電力および数33に示す
ピッチ予測誤差電力である。
レームの個数である。Pi およびEi は、数32に示す
i番目のサブフレームでの音声電力および数33に示す
ピッチ予測誤差電力である。
【0119】
【数32】
【0120】
【数33】
【0121】数33で、T’はフレーム平均ピッチ予測
ゲインGを最大化する最適遅延である。
ゲインGを最大化する最適遅延である。
【0122】モード判別回路900は、フレーム平均ピ
ッチ予測ゲインGをあらかじめ定められた複数個のしき
い値と比較して複数種類のモードに分類する。モードの
個数としては、例えば4を用いることができる。
ッチ予測ゲインGをあらかじめ定められた複数個のしき
い値と比較して複数種類のモードに分類する。モードの
個数としては、例えば4を用いることができる。
【0123】分割回路600,分割回路615,分割回
路620および合成回路610は、モード情報を入力
し、あらかじめ定められたモードの場合に信号を複数個
のサブ帯域に分割して、図1に示した第1の実施の形態
に係る信号符号化装置におけるのと同一の処理を行う。
それ以外のモードでは、サブ帯域への分割や合成などの
処理は行わない。
路620および合成回路610は、モード情報を入力
し、あらかじめ定められたモードの場合に信号を複数個
のサブ帯域に分割して、図1に示した第1の実施の形態
に係る信号符号化装置におけるのと同一の処理を行う。
それ以外のモードでは、サブ帯域への分割や合成などの
処理は行わない。
【0124】図5は、本発明の第4の実施の形態に係る
信号符号化装置の構成を示す回路ブロック図である。本
実施の形態に係る信号符号化装置は、図4におけるモー
ド判別回路900を、図2に示した第2の実施の形態に
係る信号符号化装置に付加したものである。したがっ
て、対応する回路等に同一符号を付して、それらの詳し
い説明は省略する。
信号符号化装置の構成を示す回路ブロック図である。本
実施の形態に係る信号符号化装置は、図4におけるモー
ド判別回路900を、図2に示した第2の実施の形態に
係る信号符号化装置に付加したものである。したがっ
て、対応する回路等に同一符号を付して、それらの詳し
い説明は省略する。
【0125】図6は、本発明の第5の実施の形態に係る
信号符号化装置の構成を示す回路ブロック図である。第
5の実施の形態に係る信号符号化装置において、図1に
示した第1の実施の形態に係る信号符号化装置と異なる
のは、選択回路700,適応コードブック回路8001
〜800U ,合成回路810および減算器820である
ので、これらを説明する。
信号符号化装置の構成を示す回路ブロック図である。第
5の実施の形態に係る信号符号化装置において、図1に
示した第1の実施の形態に係る信号符号化装置と異なる
のは、選択回路700,適応コードブック回路8001
〜800U ,合成回路810および減算器820である
ので、これらを説明する。
【0126】適応コードブック回路8001 〜800U
は、同一の動作を行うので、適応コードブック回路80
01 のみについて説明する。適応コードブック回路80
01は、数7の歪みDT1を最小化する順に、複数個のピ
ッチ周期を計算し、これらの各々に対し、数9を用いて
ピッチゲインβ1 を計算し量子化する。さらに、適応コ
ードブック回路8001 は、複数個のピッチ周期の各々
に対して、ピッチ予測信号qw1(n)を数10をもとに
計算し、合成回路810に出力する。
は、同一の動作を行うので、適応コードブック回路80
01 のみについて説明する。適応コードブック回路80
01は、数7の歪みDT1を最小化する順に、複数個のピ
ッチ周期を計算し、これらの各々に対し、数9を用いて
ピッチゲインβ1 を計算し量子化する。さらに、適応コ
ードブック回路8001 は、複数個のピッチ周期の各々
に対して、ピッチ予測信号qw1(n)を数10をもとに
計算し、合成回路810に出力する。
【0127】合成回路810は、各適応コードブック回
路8001 〜800U からの候補の全ての組合せの各々
について、全帯域の予測値qw (n)k を求め、減算器
820に出力する。
路8001 〜800U からの候補の全ての組合せの各々
について、全帯域の予測値qw (n)k を求め、減算器
820に出力する。
【0128】減算器820は、予測値qw (n)k の各
々を減算器235の減算結果x’w(n)から減算し、
選択回路700に出力する。
々を減算器235の減算結果x’w(n)から減算し、
選択回路700に出力する。
【0129】選択回路700は、減算器820から出力
された複数の減算結果zw (n)kの各々について、数
34の予測誤差電力Ek を計算する。
された複数の減算結果zw (n)kの各々について、数
34の予測誤差電力Ek を計算する。
【0130】
【数34】
【0131】選択回路700は、数34の予測誤差電力
Ek が最小になる組合せを選択し、そのときの予測誤差
信号zw (n)k を音源量子化回路350に出力し、そ
のときの全帯域合成音源信号g(n)k を重み付け信号
計算回路360に出力する。また、選択回路700は、
選択された候補のピッチ周期を示すインデクスと、量子
化されたピッチゲインを示すインデクスとをマルチプレ
クサ400に出力する。
Ek が最小になる組合せを選択し、そのときの予測誤差
信号zw (n)k を音源量子化回路350に出力し、そ
のときの全帯域合成音源信号g(n)k を重み付け信号
計算回路360に出力する。また、選択回路700は、
選択された候補のピッチ周期を示すインデクスと、量子
化されたピッチゲインを示すインデクスとをマルチプレ
クサ400に出力する。
【0132】図7は、本発明の第6の実施の形態に係る
信号符号化装置の構成を示す回路ブロック図である。第
6の実施の形態に係る信号符号化装置においては、音源
量子化回路500,振幅コードブック540,ゲイン量
子化回路550,ゲインコードブック560および重み
付け信号計算回路570に、図2に示した第2の実施の
形態に係る信号符号化装置において説明したものを使用
しているので、その詳しい説明は省略する。
信号符号化装置の構成を示す回路ブロック図である。第
6の実施の形態に係る信号符号化装置においては、音源
量子化回路500,振幅コードブック540,ゲイン量
子化回路550,ゲインコードブック560および重み
付け信号計算回路570に、図2に示した第2の実施の
形態に係る信号符号化装置において説明したものを使用
しているので、その詳しい説明は省略する。
【0133】図8は、本発明の第7の実施の形態に係る
信号符号化装置の構成を示す回路ブロック図である。第
7の実施の形態に係る信号符号化装置は、図6に示した
第5の実施の形態に係る信号符号化装置において、図4
に記したモード判別回路900,分割回路600,分割
回路615,分割回路620および合成回路610を組
み合わせたものである。したがって、あらかじめ定めら
れたモードにおいて、図6に示した第5の実施の形態に
係る信号符号化装置と同一の動作を行う。
信号符号化装置の構成を示す回路ブロック図である。第
7の実施の形態に係る信号符号化装置は、図6に示した
第5の実施の形態に係る信号符号化装置において、図4
に記したモード判別回路900,分割回路600,分割
回路615,分割回路620および合成回路610を組
み合わせたものである。したがって、あらかじめ定めら
れたモードにおいて、図6に示した第5の実施の形態に
係る信号符号化装置と同一の動作を行う。
【0134】図9は、本発明の第8の実施の形態に係る
信号符号化装置の構成を示す回路ブロック図である。第
8の実施の形態に係る信号符号化装置は、図8に示した
第7の実施の形態に係る信号符号化装置において、図2
の音源量子化回路500,振幅コードブック540,ゲ
イン量子化回路550,ゲインコードブック560およ
び重み付け信号計算回路570を使用したものであるた
め、詳しい説明は省略する。
信号符号化装置の構成を示す回路ブロック図である。第
8の実施の形態に係る信号符号化装置は、図8に示した
第7の実施の形態に係る信号符号化装置において、図2
の音源量子化回路500,振幅コードブック540,ゲ
イン量子化回路550,ゲインコードブック560およ
び重み付け信号計算回路570を使用したものであるた
め、詳しい説明は省略する。
【0135】本発明は、上述した各実施の形態に限ら
ず、種々の変形が可能である。
ず、種々の変形が可能である。
【0136】例えば、モード情報を用いて音源量子化回
路やゲインコードブックを切り替える構成とすることも
できる。
路やゲインコードブックを切り替える構成とすることも
できる。
【0137】音源コードブックを用いる場合、数14で
示した歪みDj の小さい順に、複数個のコードベクトル
を選択し、ゲイン量子化回路でゲインを量子化しなが
ら、数17で示した歪みDt を最小化する音源コードベ
クトルとゲインコードベクトルとの組合せを選択しても
よい。
示した歪みDj の小さい順に、複数個のコードベクトル
を選択し、ゲイン量子化回路でゲインを量子化しなが
ら、数17で示した歪みDt を最小化する音源コードベ
クトルとゲインコードベクトルとの組合せを選択しても
よい。
【0138】また、パルス列で音源を表す場合、パルス
の振幅を量子化する際にパルスの位置を複数セット求
め、これらの各々に対して振幅コードブックを探索し、
数25のEk を最小化する組合せを選択してもよい。ま
た、これらの組合せを複数種類ゲイン量子化回路に出力
し、ゲインを量子化しながら、数28で示した歪みDt
を最小化するような位置,振幅コードベクトルおよびゲ
インコードベクトルの組合せを選択してもよい。
の振幅を量子化する際にパルスの位置を複数セット求
め、これらの各々に対して振幅コードブックを探索し、
数25のEk を最小化する組合せを選択してもよい。ま
た、これらの組合せを複数種類ゲイン量子化回路に出力
し、ゲインを量子化しながら、数28で示した歪みDt
を最小化するような位置,振幅コードベクトルおよびゲ
インコードベクトルの組合せを選択してもよい。
【0139】さらに、複数個のサブ帯域で求めた適応コ
ードブックのゲインは、複数個まとめてベクトル量子化
してもよい。
ードブックのゲインは、複数個まとめてベクトル量子化
してもよい。
【0140】
【発明の効果】以上説明したように、本発明によれば、
入力信号を複数個のサブ帯域に分割し、複数個のサブ帯
域うちの2つ以上のサブ帯域においてピッチ情報を求
め、ピッチ予測の判別を行い、全帯域信号を合成し前記
入力信号の音源信号を量子化するため、会議などで複数
話者の混在した音声のみならず、音楽信号などのよう
に、複数個のピッチが存在する信号に対しては、帯域毎
に適応的にピッチが選択されるので、従来方式に比べ音
質が改善されるという効果がある。また、音源信号は全
帯域で求めているので、情報の無駄がなく、効率的な量
子化が可能となる。
入力信号を複数個のサブ帯域に分割し、複数個のサブ帯
域うちの2つ以上のサブ帯域においてピッチ情報を求
め、ピッチ予測の判別を行い、全帯域信号を合成し前記
入力信号の音源信号を量子化するため、会議などで複数
話者の混在した音声のみならず、音楽信号などのよう
に、複数個のピッチが存在する信号に対しては、帯域毎
に適応的にピッチが選択されるので、従来方式に比べ音
質が改善されるという効果がある。また、音源信号は全
帯域で求めているので、情報の無駄がなく、効率的な量
子化が可能となる。
【0141】さらに、本発明によれば、入力信号から特
徴量を抽出して信号のモードを判別し、あらかじめ定め
られたモードについてのみ、上記処理を行っているの
で、高い効果をあげることができる。
徴量を抽出して信号のモードを判別し、あらかじめ定め
られたモードについてのみ、上記処理を行っているの
で、高い効果をあげることができる。
【0142】また、本発明によれば、上述に加え、音源
信号を振幅が非零のM個のパルス列で表しているので、
比較的少ない探索演算量で、より良好な音質が得られ
る。
信号を振幅が非零のM個のパルス列で表しているので、
比較的少ない探索演算量で、より良好な音質が得られ
る。
【図1】本発明の第1の実施の形態に係る信号符号化装
置の構成を示すブロック図である。
置の構成を示すブロック図である。
【図2】本発明の第2の実施の形態に係る信号符号化装
置の構成を示すブロック図である。
置の構成を示すブロック図である。
【図3】図2中の音源量子化回路の内部構成を示す回路
ブロック図である。
ブロック図である。
【図4】本発明の第3の実施の形態に係る信号符号化装
置の構成を示すブロック図である。
置の構成を示すブロック図である。
【図5】本発明の第4の実施の形態に係る信号符号化装
置の構成を示すブロック図である。
置の構成を示すブロック図である。
【図6】本発明の第5の実施の形態に係る信号符号化装
置の構成を示すブロック図である。
置の構成を示すブロック図である。
【図7】本発明の第6の実施の形態に係る信号符号化装
置の構成を示すブロック図である。
置の構成を示すブロック図である。
【図8】本発明の第7の実施の形態に係る信号符号化装
置の構成を示すブロック図である。
置の構成を示すブロック図である。
【図9】本発明の第8の実施の形態に係る信号符号化装
置の構成を示すブロック図である。
置の構成を示すブロック図である。
110 フレーム分割回路 120 サブフレーム分割回路 200 スペクトルパラメータ計算回路 210 スペクトルパラメータ量子化回路 215 コードブック 230 聴感重み付け回路 235,236,820 減算回路 240 応答信号計算回路 3001 〜300U 適応コードブック回路 310 インパルス応答計算回路 350,500 音源量子化回路 355 音源コードブック 360,570 重み付け信号計算回路 365,550 ゲイン量子化回路 366,560 ゲインコードブック 400 マルチプレクサ 410,415,440,600,615,620 分
割回路 4201 〜420U 判別回路 430,610 合成回路 510 相関係数計算回路 520 位置計算回路 530 振幅量子化回路 540 振幅コードブック 700 選択回路 8001 〜800U 適応コードブック回路 900 モード判別回路
割回路 4201 〜420U 判別回路 430,610 合成回路 510 相関係数計算回路 520 位置計算回路 530 振幅量子化回路 540 振幅コードブック 700 選択回路 8001 〜800U 適応コードブック回路 900 モード判別回路
Claims (8)
- 【請求項1】入力信号からスペクトルパラメータを求め
て量子化するスペクトルパラメータ量子化部と、 前記入力信号を複数個の帯域に分割する分割部と、前記分割部で帯域分割された入力信号に対応した複数の
ピッチ予測値を求める複数の適応コードブック部と、前記複数の ピッチ予測値と前記帯域分割された複数の入
力信号に基づいてピッチ予測するか否かの判別を行う複
数の判別部と、 ピッチ予測を行う帯域に対し生成した前記ピッチ予測値
を組み合わせて全帯域のピッチ予測信号を合成し、前記
入力信号から減算して音源信号を求め、前記音源信号を
量子化する音源量子化部とを有することを特徴とする信
号符号化装置。 - 【請求項2】前記入力信号の音源信号を、振幅が非零の
複数個のパルスにより表して量子化することを特徴とす
る請求項1記載の信号符号化装置。 - 【請求項3】入力信号からスペクトルパラメータを求め
て量子化するスペクトルパラメータ量子化部と、 前記入力信号から特徴量を抽出してモードを判別するモ
ード判別部と、 あらかじめ定められたモードにおいて前記入力信号を複
数個の帯域に分割する分割部と、 前記分割部で帯域分割された入力信号に対応した複数の
ピッチ予測値を求める複数の適応コードブック部と、前記複数のピッチ予測値 と前記帯域分割された複数の入
力信号に基づいてピッチ予測するか否かの判別を行う複
数の判別部と、 あらかじめ定められたモードにおいて、ピッチ予測を行
う帯域に対し生成した前記ピッチ予測値を組み合わせて
全帯域のピッチ予測信号を合成し、前記入力信号から減
算して音源信号を求め、前記音源信号を量子化する音源
量子化部とを有することを特徴とする信号符号化装置。 - 【請求項4】前記入力信号の音源信号を、振幅が非零の
複数個のパルスにより表して量子化することを特徴とす
る請求項3記載の信号符号化装置。 - 【請求項5】入力信号からスペクトルパラメータを求め
て量子化するスペクトルパラメータ量子化部と、 前記入力信号を複数個の帯域に分割する分割部と、 前記分割部で帯域分割された入力信号に対応した複数の
ピッチ予測値を複数候補求め、各候補に対してピッチ予
測値を求める複数の適応コードブック部と、前記ピッチ予測値 を組み合わせて全帯域のピッチ予測値
を合成する合成部と、 前記入力信号と前記全帯域のピッチ予測値との誤差信号
を計算し、前記誤差信号が最小となる組合せを選択する
選択部と、前記選択部で選択された 前記誤差信号を量子化する音源
量子化部とを有することを特徴とする信号符号化装置。 - 【請求項6】前記誤差信号を、振幅が非零の複数個のパ
ルスを用いて表して量子化することを特徴とする請求項
5記載の信号符号化装置。 - 【請求項7】入力信号からスペクトルパラメータを求め
て量子化するスペクトルパラメータ量子化部と、 前記入力信号から特徴量を抽出してモードを判別するモ
ード判別部と、 あらかじめ定められたモードにおいて前記入力信号を複
数個の帯域に分割する分割部と、 前記分割部で帯域分割された入力信号に対応した複数の
ピッチ予測値を複数候補求め、各候補に対してピッチ予
測値を求める複数の適応コードブック部と、 あらかじめ定められたモードにおいて前記ピッチ予測値
を組み合わせて全帯域のピッチ予測値を合成する合成部
と、 前記入力信号と前記全帯域のピッチ予測値との誤差信号
を計算し、前記誤差信 号が最小となる組合せを選択する
選択部と、前記選択部で選択された 前記誤差信号を量子化する音源
量子化部とを有することを特徴とする信号符号化装置。 - 【請求項8】前記誤差信号を、振幅が非零の複数個のパ
ルスを用いて表して量子化することを特徴とする請求項
7記載の信号符号化装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15485096A JP3335841B2 (ja) | 1996-05-27 | 1996-05-27 | 信号符号化装置 |
US08/863,785 US5873060A (en) | 1996-05-27 | 1997-05-27 | Signal coder for wide-band signals |
CA002205093A CA2205093C (en) | 1996-05-27 | 1997-05-27 | Signal coder |
EP97108526A EP0810584A3 (en) | 1996-05-27 | 1997-05-27 | Signal coder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15485096A JP3335841B2 (ja) | 1996-05-27 | 1996-05-27 | 信号符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09319398A JPH09319398A (ja) | 1997-12-12 |
JP3335841B2 true JP3335841B2 (ja) | 2002-10-21 |
Family
ID=15593275
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15485096A Expired - Fee Related JP3335841B2 (ja) | 1996-05-27 | 1996-05-27 | 信号符号化装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5873060A (ja) |
EP (1) | EP0810584A3 (ja) |
JP (1) | JP3335841B2 (ja) |
CA (1) | CA2205093C (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6393391B1 (en) * | 1998-04-15 | 2002-05-21 | Nec Corporation | Speech coder for high quality at low bit rates |
DE69715478T2 (de) * | 1996-11-07 | 2003-01-09 | Matsushita Electric Ind Co Ltd | Verfahren und Vorrichtung zur CELP Sprachkodierung und -dekodierung |
JP2000305599A (ja) * | 1999-04-22 | 2000-11-02 | Sony Corp | 音声合成装置及び方法、電話装置並びにプログラム提供媒体 |
US6721713B1 (en) | 1999-05-27 | 2004-04-13 | Andersen Consulting Llp | Business alliance identification in a web architecture framework |
US7315815B1 (en) * | 1999-09-22 | 2008-01-01 | Microsoft Corporation | LPC-harmonic vocoder with superframe structure |
KR100804461B1 (ko) * | 2000-04-24 | 2008-02-20 | 퀄컴 인코포레이티드 | 보이스화된 음성을 예측적으로 양자화하는 방법 및 장치 |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US8712766B2 (en) * | 2006-05-16 | 2014-04-29 | Motorola Mobility Llc | Method and system for coding an information signal using closed loop adaptive bit allocation |
JP5085700B2 (ja) * | 2010-08-30 | 2012-11-28 | 株式会社東芝 | 音声合成装置、音声合成方法およびプログラム |
CN104221287B (zh) * | 2012-03-29 | 2017-05-31 | 瑞典爱立信有限公司 | 矢量量化器 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1255802A (en) * | 1984-07-05 | 1989-06-13 | Kazunori Ozawa | Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses |
JP2940005B2 (ja) * | 1989-07-20 | 1999-08-25 | 日本電気株式会社 | 音声符号化装置 |
EP0443548B1 (en) * | 1990-02-22 | 2003-07-23 | Nec Corporation | Speech coder |
JP2626223B2 (ja) * | 1990-09-26 | 1997-07-02 | 日本電気株式会社 | 音声符号化装置 |
JP3114197B2 (ja) * | 1990-11-02 | 2000-12-04 | 日本電気株式会社 | 音声パラメータ符号化方法 |
JP3151874B2 (ja) * | 1991-02-26 | 2001-04-03 | 日本電気株式会社 | 音声パラメータ符号化方式および装置 |
JP3143956B2 (ja) * | 1991-06-27 | 2001-03-07 | 日本電気株式会社 | 音声パラメータ符号化方式 |
JP2746039B2 (ja) * | 1993-01-22 | 1998-04-28 | 日本電気株式会社 | 音声符号化方式 |
JP2800618B2 (ja) * | 1993-02-09 | 1998-09-21 | 日本電気株式会社 | 音声パラメータ符号化方式 |
-
1996
- 1996-05-27 JP JP15485096A patent/JP3335841B2/ja not_active Expired - Fee Related
-
1997
- 1997-05-27 US US08/863,785 patent/US5873060A/en not_active Expired - Fee Related
- 1997-05-27 EP EP97108526A patent/EP0810584A3/en not_active Withdrawn
- 1997-05-27 CA CA002205093A patent/CA2205093C/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP0810584A2 (en) | 1997-12-03 |
CA2205093A1 (en) | 1997-11-27 |
EP0810584A3 (en) | 1998-10-28 |
CA2205093C (en) | 2001-01-30 |
JPH09319398A (ja) | 1997-12-12 |
US5873060A (en) | 1999-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3094908B2 (ja) | 音声符号化装置 | |
JP3196595B2 (ja) | 音声符号化装置 | |
EP0957472B1 (en) | Speech coding apparatus and speech decoding apparatus | |
JP3335841B2 (ja) | 信号符号化装置 | |
JP3180786B2 (ja) | 音声符号化方法及び音声符号化装置 | |
JPH09281995A (ja) | 信号符号化装置及び方法 | |
JP3582589B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP3266178B2 (ja) | 音声符号化装置 | |
JP3147807B2 (ja) | 信号符号化装置 | |
JP3360545B2 (ja) | 音声符号化装置 | |
JP3153075B2 (ja) | 音声符号化装置 | |
JP3003531B2 (ja) | 音声符号化装置 | |
JP3319396B2 (ja) | 音声符号化装置ならびに音声符号化復号化装置 | |
JP3299099B2 (ja) | 音声符号化装置 | |
JP2001318698A (ja) | 音声符号化装置及び音声復号化装置 | |
JP3144284B2 (ja) | 音声符号化装置 | |
JP2001142499A (ja) | 音声符号化装置ならびに音声復号化装置 | |
JP3092654B2 (ja) | 信号符号化装置 | |
JP3192051B2 (ja) | 音声符号化装置 | |
JP3471542B2 (ja) | 音声符号化装置 | |
JPH08320700A (ja) | 音声符号化装置 | |
JP2907019B2 (ja) | 音声符号化装置 | |
JP3144244B2 (ja) | 音声符号化装置 | |
JPH09319399A (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070802 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080802 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080802 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090802 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |