JPH11119800A - 音声符号化復号化方法及び音声符号化復号化装置 - Google Patents

音声符号化復号化方法及び音声符号化復号化装置

Info

Publication number
JPH11119800A
JPH11119800A JP9286373A JP28637397A JPH11119800A JP H11119800 A JPH11119800 A JP H11119800A JP 9286373 A JP9286373 A JP 9286373A JP 28637397 A JP28637397 A JP 28637397A JP H11119800 A JPH11119800 A JP H11119800A
Authority
JP
Japan
Prior art keywords
vector
codebook
basic
basic vector
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9286373A
Other languages
English (en)
Inventor
Takashi Ota
恭士 大田
Hitoshi Matsuzawa
均 松澤
Masanao Suzuki
政直 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP9286373A priority Critical patent/JPH11119800A/ja
Priority to US09/033,198 priority patent/US6078881A/en
Publication of JPH11119800A publication Critical patent/JPH11119800A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 A−b−S型のベクトル量子化による音声符
号化復号化方法及び音声符号化復号化装置に関し、メモ
リ容量及び演算量の削減を図る。 【解決手段】 符号帳探索処理による音声の符号化及び
符号帳を用いた音声の復号化に於いて、ランダム系列1
をリングバッファメモリ等のバッファメモリに格納し、
基本ベクトル生成部2によりランダム系列1からベクト
ル次元長の系列を任意のシフト量に従って、例えば、オ
ーバラップベクトル生成手段によりベクトル次元長の基
本ベクトルを生成し、この基本ベクトルを含む基本ベク
トル部3から符号帳展開部4により構造化処理によって
展開して木構造デルタ符号帳等の符号帳5を生成する過
程及び機能を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、A−b−S(Ana
lysis −by−Synthesis;合成による分析)型のベク
トル量子化による音声符号化復号化方法及び音声符号化
復号化装置に関する。CELP(Code Excited Lin
ear Prediction ;符号励振線形予測)符号化方式に代
表されるA−b−S型のベクトル量子化による音声符号
化復号化方法は、音声信号を例えば4〜16kbps程
度に圧縮処理する場合に適用されている。このような音
声圧縮処理は、企業内通信システムやディジタル移動無
線システム等の効率化の為に採用されており、処理量の
削減やハードウェアの小型化が要望されている。
【0002】
【従来の技術】音声信号の高能率符号化方法として前述
のようなA−b−S型のベクトル量子化を適用した方法
が知られており、入力信号と、コードベクトルを基にし
た再生信号との誤差電力が最小となるコードベクトルを
求めるもので、図13はその概要を示すものである。同
図に於いて、61は符号帳、62は係数器、63は線形
予測合成フィルタ、64は減算器、65は誤差電力の評
価部である。
【0003】符号帳61には、複数のコードベクトルC
が格納されており、このコードベクトルCに係数器61
によりゲインgを乗算し、その出力gCを線形予測合成
フィルタ63に入力して再生信号gACを合成出力し、
この再生信号gACと入力信号Xとを減算器64に入力
して誤差信号Eを求め、誤差電力の評価部65は、この
誤差信号Eによる誤差電力が最小となるコードベクトル
Cを探索し、そのインデックスを符号化情報として送信
する。又この符号化情報を受信して、符号帳からインデ
ックスに対応したコードベクトルを読出して音声を再生
する復号化処理を行うことになる。
【0004】図14は従来のCELP方式の説明図であ
り、71は雑音符号帳、72は適応符号帳、73,74
は係数器、75,78は線形予測合成フィルタ、76,
79は減算器、77,80は誤差電力の評価部である。
符号帳として、ランダム性音源に対応する雑音符号帳7
1と、ピッチ性音源に対応する適応符号帳72とを備
え、この適応符号帳72に格納される適応コードベクト
ルは適応的に更新され、又雑音符号帳71は固定的な雑
音コードベクトルが格納されている。
【0005】雑音符号帳71のコードベクトルCにゲイ
ンgを乗算し、線形予測合成フィルタ75を介して再生
信号gACとし、入力信号Xとの誤差信号Eを求め、こ
の誤差信号Eによる誤差電力が最小となるコードベクト
ルCを探索し、同様に、適応符号帳72の適応コードベ
クトル(ピッチベクトル)Pとゲインbとを乗算し、線
形予測合成フィルタ78を介して再生信号bAPと入力
信号Xとの誤差信号を求め、その誤差信号による誤差電
力が最小となるピッチベクトルを探索する。
【0006】前述の雑音符号帳71は、ランダム性音源
に対応する多数の雑音コードベクトルを格納するもので
あるから、雑音符号帳71を構成する為のメモリ容量は
非常に大きくなる。例えば、ベクトル次元長N=40
(5msの期間の8kHzサンプルに相当)、基本ベク
トル本数M=1024とすると、40960(ワード)
のメモリ容量を必要とする。そこで、雑音符号帳のメモ
リ容量削減の為に、オーバラップ符号帳や構造化符号帳
等が提案されている。
【0007】図15は従来のオーバラップ符号帳の説明
図であり、(A)はオーバラップ符号帳によるベクトル
量子化の構成の概要を示し、(B)はオーバラップベク
トル生成過程の説明図である。同図に於いて、81はラ
ンダム系列、82はオーバラップによる符号帳展開部、
83はオーバラップ符号帳としての雑音符号帳、84は
係数器、85は線形予測合成フィルタ、86は減算器、
87は誤差電力の評価部である。雑音符号帳83の探索
処理は、図13及び図14について説明した場合と同様
であるから、重複した説明は省略する。
【0008】ランダム系列81は、(B)に示すよう
に、ベクトル次元長をN、基本ベクトル本数をM、シフ
ト量をKとして、N+(M−1)Kの大きさを少なくと
も有するものであり、符号帳展開部82に於いて、シフ
ト量Kに従って順次シフトして、ベクトル次元長Nのコ
ードベクトルをランダム系列81から取り出すことによ
り、ベクトル次元長N、基本ベクトル本数Mの雑音符号
帳83を形成する処理を行うものである。
【0009】この場合に、N=40、M=1024、K
=1とすると、N+(M−1)K=1063(ワード)
となり、単純にN=40のコードベクトルを、基本ベク
トル本数M=1024に従って格納した雑音符号帳のメ
モリ容量(40960ワード)に比較して1/40とす
ることができる。
【0010】図16は従来の構造化符号帳の説明図であ
り、(A)は構造化符号帳によるベクトル量子化処理構
成の概要を示し、(B)は符号帳展開の一例としての木
構造デルタ符号帳の展開処理を示す。同図の(A)に於
いて、91は基本ベクトル部、92はベクトル加減則に
よる符号帳展開部、93は雑音符号帳、94は係数器、
95は線形予測合成フィルタ、96は減算器、97は誤
差電力の評価部である。雑音符号帳93の探索処理は、
図13及び図14について説明した場合と同様であるか
ら、重複した説明は省略する。
【0011】基本ベクトル部91は、(B)の木構造化
に於いて、初期ベクトルC0 及び階層対応のデルタベク
トルΔC1 ,ΔC2 ,・・・ΔC9 の基本ベクトルを格
納した構成を有し、符号帳展開部92は、基本ベクトル
0 ,ΔC1 ,ΔC2 ,・・・ΔC9 の加減算によっ
て、コードベクトルを求め、雑音符号帳93を生成する
ものである。例えば、初期ベクトルC0 とデルタベクト
ルΔC1 ,ΔC2 とを用いて、 C0 =C0 +0 C1 =C0 +ΔC12 =C0 −ΔC13 =C1 +ΔC2 =C0 +ΔC1 +ΔC24 =C1 −ΔC2 =C0 +ΔC1 −ΔC2 として、コードベクトルC0 〜C4 を求めることができ
る。以下同様にして、コードベクトルC1021,C
1022は、 C1021=C510 +ΔC9 =C0 −ΔC1 −ΔC2 −・・
・+ΔC91022=C510 −ΔC9 =C0 −ΔC1 −ΔC2 −・・
・−ΔC9 として求めることができる。即ち、コードベクトル
0 ,C1 ,C2 ,C3 ,・・・C1022を含む雑音符号
帳93を形成することができる。
【0012】この場合、初期ベクトルC0 と9個のデル
タベクトルΔC1 〜ΔC9 との10個のベクトルを基本
ベクトル部91に格納することにより、1023個のコ
ードベクトルを生成することができる。又−C0 を含め
ること等により1024個のコードベクトルを生成する
こともできる。従って、ベクトル次元長Nを前述のよう
に40、基本ベクトル長Mを1024とした時に、基本
ベクトル部91は、N×log2 M=40×10=40
0(ワード)のメモリ容量で済むことになる。従って、
単純に、N=40のコードベクトルを、基本ベクトル本
数M=1024に従って格納した雑音符号帳のメモリ容
量(40960ワード)に比較して約1/100とする
ことができる。このような構造化符号帳は、例えば、特
開平5−158500号公報に開示されている。
【0013】
【発明が解決しようとする課題】前述の高能率符号化に
於ける符号帳は、ベクトル次元長N、基本ベクトル本数
Mの場合に、単純にはN×Mのメモリ容量を必要とし、
それを図15に示すオーバラップ符号帳とすることによ
り、N+(M−1)Kのメモリ容量に削減することがで
きる。更に、図16に示す構造化符号帳とすることによ
り、Nlog2 Mのメモリ容量に削減することができ
る。しかし、A−b−S型ベクトル量子化を適用した音
声符号化方式は、携帯電話システムにも適用されること
から、メモリ容量の更なる削減及び演算量の削減が要望
されている。本発明は、A−b−S型ベクトル量子化を
適用した音声符号化方式に於けるメモリ容量の削減及び
演算量の削減を図ることを目的とする。
【0014】
【課題を解決するための手段】本発明の音声符号化復号
化方法は、(1)A−b−S型のベクトル量子化による
音声符号化復号化方法であって、ランダム系列から任意
のシフト量に従って、ベクトル次元長の基本ベクトルを
生成し、この基本ベクトルを構造化処理により展開して
符号帳を構成するコードベクトルを生成する過程を含む
ものである。即ち、符号帳展開処理の前段に、ランダム
系列から基本ベクトルを生成する処理を行うもので、符
号帳を構成するコードベクトル分布の操作が容易とな
る。又例えば、オーバラップベクトル生成を適用すれ
ば、ランダム系列を格納するメモリ容量を削減すること
ができると共に、オーバラップ部分に対する演算処理の
流用が可能となって、全体の演算量の削減を図ることが
できる。
【0015】又(2)ランダム系列をリングバッファメ
モリに格納して、オーバラップベクトル生成により基本
ベクトルを生成して一層のメモリ容量の削減を図ること
ができる。又構造化処理として、木構造デルタ符号帳に
展開することができる。又閾値を設定して、ベクトル次
元長の系列と比較することにより、この系列の零振幅サ
ンプル数を制御して基本ベクトルを生成することができ
る。又ピッチベクトルと相関のないピッチ直交化基本ベ
クトルを生成することができる。又ピッチ周期を基にピ
ッチ強調処理を施した基本ベクトルを生成することがで
きる。
【0016】又本発明の音声符号化復号化装置は、
(3)A−b−S型のベクトル量子化による音声符号化
復号化装置であって、ランダム系列1を格納するバッフ
ァメモリと、ベクトル次元長,シフト量のパラメータに
従ってバッファメモリからオーバラップベクトル生成に
より基本ベクトルを生成する基本ベクトル生成部2と、
この基本ベクトル生成部2により生成された基本ベクト
ルを展開して符号帳を形成する符号帳展開部4とを備え
ている。
【0017】又(4)ランダム系列1を格納するバッフ
ァメモリをリングバッファメモリとすることができる。
又基本ベクトル生成部2は、閾値を設定する閾値制御部
と、この閾値とベクトル次元長の系列と比較して、その
系列の零振幅サンプル数を制御する非零/零サンプル制
御部とを設けることができる。又基本ベクトル生成部2
は、ピッチベクトルと相関のないベクトルとして直交化
処理した基本ベクトルを生成するピッチベクトル直交化
処理部を設けることができる。又ピッチ強調処理を施す
ピッチ強調処理部を設けることができる。
【0018】
【発明の実施の形態】図1は本発明の原理説明図であ
り、1はランダム系列、2は基本ベクトル生成部、3は
基本ベクトル部、4は符号帳展開部、5は符号帳、6は
係数器、7は線形予測合成フィルタ、8は減算器、9は
誤差電力の評価部である。なお、点線で示す基本ベクト
ル部3と構造化符号帳に相当する符号帳5は、処理過程
に於いて生成されるものであり、音声符号化の要部を示
し、各部の機能はマイクロプロセッサ等の演算処理機能
によって容易に実現することも可能である。
【0019】ランダム系列1から基本ベクトル生成部2
により任意のシフト量に従ってベクトル次元長の基本ベ
クトルを生成して基本ベクトル部3を形成するもので、
例えば、オーバラップベクトル生成手段を適用すること
ができる。この基本ベクトル部3から符号帳展開部4に
よる構造化処理によって展開処理し、構造化符号帳であ
る符号帳5を構成するコードベクトルを生成し、この符
号帳5からのコードベクトルCに係数器6に於いてゲイ
ンgを乗算し、線形予測合成フィルタ7によりgCを基
に再生信号gACを合成出力し、減算器8により入力信
号Xとの差分の誤差信号Eを求め、この誤差信号Eによ
る誤差電力を評価部9に於いて評価し、誤差電力最小の
コードベクトルCを探索し、このコードベクトルCのイ
ンデックスを符号化情報として送信する。
【0020】又受信側の復号化装置に於いては、受信し
た音声の符号化情報を基に符号帳からコードベクトルを
求め、このコードベクトルやゲイン,ピッチ周期等のパ
ラメータを基に線形予測合成フィルタ7と同様な合成フ
ィルタを用いて音声信号を再生するものであり、この場
合の符号帳も、前述のランダム系列1からオーバラップ
ベクトル生成によって基本ベクトルを生成し、この基本
ベクトルを構造化処理により展開した木構造デルタ符号
帳とすることができる。
【0021】前述のように、構造化符号帳のコードベク
トルを生成する為の基本ベクトルを、ランダム系列1か
ら例えばオーバラップ処理により展開して求めることが
できるもので、符号化及び復号化の為のランダム音源情
報、即ち、ランダム系列1を極めて短くすることができ
る。従って、メモリ容量を著しく削減することができ
る。
【0022】又オーバラップ処理によって基本ベクトル
を形成した場合、隣接するコードベクトル間の相関を利
用して演算量を削減することが可能となる。例えば、V
SELP(Vector Sum Excited Linear Predict
ion )方式や、木構造デルタ符号帳等の構造化符号帳の
場合に、基本ベクトルの聴覚重み付け処理が行われる
が、複数のサンプル系列のうちのオーバラップする系列
が多ければ(シフト量が小さければ)、基本ベクトル分
の行列演算が数サンプル分の更新演算で代替えできるこ
とになり、演算量を削減することができる。
【0023】図2は本発明の第1の実施の形態の説明図
であり、11はランダム系列、12はオーバラップベク
トル生成部、13は基本ベクトル部、14は木構造デル
タ符号帳展開部、15は木構造デルタ符号帳を示す。こ
の図2に於けるオーバラップベクトル生成部12は図1
の基本ベクトル生成部2に相当し、木構造デルタ符号帳
展開部14は図1の符号帳展開部4に相当し、木構造デ
ルタ符号帳15は図1の符号帳5に相当し、又この木構
造デルタ符号帳15は、例えば、図16の(A)に示す
基本ベクトル部91のように、初期ベクトルC0 及びデ
ルタベクトルΔC1 〜ΔC9 を格納した構成となる。
【0024】図3は本発明の第1の実施の形態のフロー
チャートであり、パラメータの設定として、ランダム系
列11のベクトル次元長N、基本ベクトル本数M、シフ
ト量Kを設定する(A1)。これによるランダム系列1
1は、N+(log2 M−1)Kの長さとする。そし
て、基本ベクトル生成部12(図2のオーバラップベク
トル生成部12に相当)により、基本ベクトルの生成を
行う(A2)。即ち、基本ベクトル〔i〕〔j〕=ラン
ダム系列〔i*K+j〕を、j=0〜N−1、i=0〜
log2 M−1について求める。
【0025】又基本ベクトル〔i〕〔j〕は、第i番基
本ベクトルの第jサンプルを示し、ランダム系列11の
先頭位置からi*Kの位置を先頭として、0〜N−1の
サンプルを取り出すことにより、第i番基本ベクトルを
求めることができる。従って、i=0〜log2 M−1
について求めることにより、ベクトル次元長Nで基本ベ
クトル本数log2 Mの基本ベクトル部13を生成する
ことができる。
【0026】前述の処理により基本ベクトル部13が生
成され、符号帳展開部14(図2の木構造デルタ符号帳
展開部14に相当)により、ベクトル次元長Nで#0〜
#M−1の基本ベクトル本数Mの符号帳15(図2の木
構造デルタ符号帳15に相当)を生成することができ
る。即ち、N+(log2 M−1)Kの長さのランダム
系列11をバッファメモリに格納しておくことにより、
前述の処理によって構造化符号帳としての木構造デルタ
符号帳に展開することができる。この場合、例えば、ベ
クトル次元長Nを40、基本ベクトル本数Mを102
4、シフト量Kを1とすると、ランダム系列11は49
ワードとなる。従って、単純に、N=40のコードベク
トルを、基本ベクトル本数M=1024に従って格納し
た従来の雑音符号帳のメモリ容量(40960ワード)
に比較して、1/836に削減することができる。
【0027】図4は本発明の第2の実施の形態の説明図
であり、21はランダム系列、22はオーバラップベク
トル生成部、23は基本ベクトル部、24は木構造デル
タ符号帳展開部、25は木構造デルタ符号帳を示す。こ
の図4に於けるオーバラップベクトル生成部22は図1
の基本ベクトル生成部2に相当し、木構造デルタ符号帳
展開部24は図1の符号帳展開部4に相当し、木構造デ
ルタ符号帳25は図1の符号帳5に相当する。
【0028】この実施の形態は、リングバッファメモリ
系列を適用したものであり、オーバラップベクトル生成
部22の機能は、図2のオーバラップベクトル生成部1
2とほぼ同一であるが、ランダム系列21をリングバッ
ファメモリに格納した構成とすることにより、図2に於
けるランダム系列11の先頭部分のサンプルを再利用す
るように制御するものである。
【0029】図5はリングバッファメモリの説明図であ
り、#0〜#L−1の長さLのランダム系列をリングバ
ッファメモリに格納し、例えば、K=L/4として、#
0を先頭とした第1符号語、#L/4を先頭とした第2
符号語、#L/2を先頭とした第3符号語のように、各
符号語は一部オーバラップしてベクトル次元長Nの基本
ベクトルを生成することができる。
【0030】図6は本発明の第2の実施の形態のフロー
チャートであり、パラメータの設定として、ランダム系
列21のベクトル次元長N、ランダム系列長L、基本ベ
クトル本数M、シフト量Kを設定する(B1)。次に基
本ベクトル生成部22(図2のオーバラップベクトル生
成部22に相当)によって基本ベクトルを生成するもの
で、その時のパラメータの設定として、読出ポインタp
=i*Kを設定する(B2)。そして、この読出ポイン
タpとランダム系列21のベクトル次元長Lとを比較し
て、p>Lか否かを判定する(B3)。
【0031】この読出ポインタpが示すランダム系列2
1の位置からサンプルを読出すものであり、従って、p
>Lの場合は、長さLのランダム系列21の最後の位置
に読出ポインタpが到達し後、ランダム系列21の先頭
位置に読出ポインタpが移動した状態を示すから、p=
0とする(B4)。
【0032】そして、基本ベクトル〔i〕〔j〕=ラン
ダム系列〔i*K+j〕として基本ベクトルを生成し
(B5)、ランダム系列21の読出ポインタpによって
指示される位置から1サンプル読出しを行う毎に、p=
p+1として(B6)、i=0〜M−1、j=0〜N−
1について基本ベクトル23を求める。
【0033】この場合、基本ベクトル〔i〕〔j〕は、
第i番基本ベクトルの第jサンプルを示し、例えば、第
0番基本ベクトル生成時は、読出ポインタpは、p=i
*K=0となり、ランダム系列21の先頭から順次サン
プル読出しが行われ、p=0〜p=N−1の間のサンプ
ル読出しによりNサンプルからなる第0番基本ベクトル
が生成される。次の第1番基本ベクトル生成時は、p=
i*K=1となり、ランダム系列21の先頭から2番目
の位置を先頭として順次サンプル読出しが行われ、p=
1〜p=Nの間のサンプル読出しによりNサンプルから
なる第1番基本ベクトルが生成される。同様にして、第
M−1番基本ベクトル生成時は、p=i*K=M−1と
なり、ランダム系列21の先頭からM番目の位置を先頭
として順次サンプル読出しが行われ、p=M〜p=M+
N−1の間のサンプル読出しによりNサンプルからなる
第M番基本ベクトルが生成される。
【0034】この場合、ランダム系列長Lとベクトル次
元長Nとを等しくすることも可能である。例えば、図5
に於いて、L=Nとして、K=1とすると、第1符号語
は#0〜#L−1、第2符号語は#1〜#0、第3符号
語は#2〜#1となり、L個の基本ベクトルを生成する
ことができる。即ち、パラメータ設定(B1)に於い
て、N=L=M、K=1とすることになる。
【0035】又前述と同様に、ベクトル次元長Nを40
とすると、ランダム系列21は40ワードとなる。即
ち、リングバッファメモリは40ワードの容量で済むこ
とになる。従って、単純に、N=40のコードベクトル
を、基本ベクトル本数M=1024に従って格納した従
来の雑音符号帳のメモリ容量(40960ワード)に比
較して、約1/1000に削減することができる。な
お、L<Nの関係とすることも可能である。この場合、
例えば、L+2=N、K=1とすると、第1符号語は、
リングバッファメモリの#0〜#L−1〜#2のサンプ
ルを取り出し、次の第2符号語は、#1〜#L−1〜#
0〜#3のサンプルを取り出すことになる。又各符号語
に相関がないように制御する手段を付加することもでき
る。
【0036】図7は本発明の第3の実施の形態の説明図
であり、31はランダム系列、32は基本ベクトル生成
部、33は基本ベクトル部、34は木構造デルタ符号帳
展開部、35はサンプル密度可変の木構造デルタ符号
帳、36は閾値制御部、37は非零/零サンプル制御部
を示す。この図7に於けるランダム系列31は図1のラ
ンダム系列1に相当し、基本ベクトル生成部32は図1
の基本ベクトル生成部2に相当し、木構造デルタ符号帳
展開部34は図1の符号帳展開部4に相当し、木構造デ
ルタ符号帳35は図1の符号帳5に相当する。
【0037】基本ベクトル生成部32は、閾値制御部3
6と非零/零サンプル制御部37とを含み、符号化パラ
メータの関数として閾値を設定し、非零/零サンプル制
御部37に於いてランダム系列と閾値とを比較して非零
か又は零かの制御を行って、基本ベクトルを生成する。
木構造デルタ符号帳展開部34は、図4の木構造デルタ
符号帳展開部24と同様に動作して、木構造デルタ符号
帳35を形成することになるが、非零/零サンプル制御
により、サンプル密度が変化したものとなる。この場合
の閾値制御部36に加える符号化パラメータは、符号帳
探索処理の前段までの処理に於いて得られた各種のパラ
メータを利用することができるものであり、又復号化の
場合は、受信した符号化パラメータを利用するか、又は
再分析によって得られたパラメータを利用することがで
きる。
【0038】図8は本発明の第3の実施の形態のフロー
チャートであり、パラメータの設定として、ランダム系
列31のベクトル次元長N、基本ベクトル本数M、シフ
ト量Kを設定する(C1)。次に基本ベクトル生成部3
2の閾値制御部36に於いて符号化パラメータの関数と
して閾値を設定する(C2)。例えば、符号化パラメー
タにピッチゲイン〔0.0,1.8〕を導入した場合、
一例として、閾値TH=ピッチゲイン値/1.8とし
て、閾値THを設定することができる。
【0039】又非零/零サンプル制御部37は、ステッ
プ(C3)〜(C5)の処理を行うもので、先ず、ラン
ダム系列〔i*K+j〕<THか否かを判定し(C
3)、このランダム系列〔i*K+j〕が閾値THより
大きい場合は、基本ベクトル〔i〕〔j〕をランダム系
列〔i*K+j〕とし(C4)、反対に、ランダム系列
〔i*K+j〕が閾値THより小さい場合は、基本ベク
トル〔i〕〔j〕を0とする(C5)。このような処理
を、i=0〜M−1、j=0〜N−1について行うもの
である。
【0040】従って、基本ベクトルのサンプルに零振幅
の系列が含まれることになり、この基本ベクトルを木構
造デルタ符号帳展開部34により展開することにより、
非零サンプルの割合が疎から密までバリエーションに富
んだ木構造デルタ符号帳36を形成することができる。
それによって、パルス性の音源が適切とされる有声音か
ら雑音性の音源が適切とされる無声音までの広い属性を
カバーする符号帳とすることができる。又符号化パラメ
ータとしては、前述のピッチゲイン以外の他のパラメー
タを用いることも可能であり、又予め固定した閾値TH
を設定することも可能である。又処理フレームについて
音声の属性等に対応して非零/零サンプル制御部37に
於ける処理を行うか否かを選択するように制御すること
も可能である。
【0041】図9は本発明の第4の実施の形態の説明図
であり、41はランダム系列、42は基本ベクトル生成
部、43は基本ベクトル部、44は木構造デルタ符号帳
展開部、45はピッチベクトル低相関系列の木構造デル
タ符号帳、46はピッチベクトル直交化処理部である。
この図9に於けるランダム系列41は図1のランダム系
列1に相当し、基本ベクトル生成部42は図1の基本ベ
クトル生成部2に相当し、木構造デルタ符号帳展開部4
4は図1の符号帳展開部4に相当し、木構造デルタ符号
帳45は図1の符号帳5に相当する。
【0042】CELP方式に於ける音源探索は、ピッチ
ベクトルと雑音ベクトルとによって入力音声ベクトルを
同定する処理に相当し、このピッチベクトルは、適応符
号帳探索により、或いは入力音声信号の符号化前処理に
より求めることができる。この場合の雑音ベクトルを、
ピッチベクトルと相関がない直交ベクトルによって形成
することにより、効率的なベクトル量子化が可能とな
る。
【0043】そこで、ピッチベクトル直交化処理部46
は、ピッチベクトルを基に基本ベクトルに対する直交化
処理を施すものである。例えば、入力音声ベクトルに対
して先にピッチベクトルを求め、このピッチベクトルと
雑音ベクトルとにより入力音声ベクトルを同定する処理
に於いて、点線矢印で示す雑音ベクトルNV1〜NV5
について、それぞれピッチベクトル直交化平面に投影し
た実線矢印で示す雑音ベクトルNV1’〜NV5’を求
めるものである。又復号化の場合は、受信したピッチベ
クトル或いは再分析により得られたピッチベクトルを用
いて、前述のようなピッチ直交化雑音ベクトルを求める
ことになる。
【0044】図10は本発明の第4の実施の形態のフロ
ーチャートであり、パラメータの設定として、ランダム
系列41のベクトル次元長N、基本ベクトル本数M、シ
フト量Kを設定する(D1)。そして、Hを聴覚重みづ
けフィルタインパルス応答行列、Pをピッチベクトルと
して、ピッチベクトル直交化処理部46に於いて、直交
ベクトル係数Gを、G=f(H,P)により求め(D
2)、この直交化ベクトル係数Gを用いて、基本ベクト
ル〔i〕〔j〕=G*ランダム系列〔i*K+j〕によ
り、j=0〜N−1、i=0〜M−1として、ベクトル
次元長Nで基本ベクトル本数Mの基本ベクトルをオーバ
ラップ生成する(D3)。
【0045】この場合、右側に、グラム・シュミット直
交化法によるピッチ直交化基本ベクトル生成式を示し、
orthはピッチ直交化基本ベクトル、Bは基本ベ
クトル、Hは前述の聴覚重みづけフィルタインパルス応
答行列、Pは前述のピッチベクトルを示し、B ort
h=GBとして、ピッチ直交化基本ベクトルB ort
hを求めることができる。なお、直交ベクトル係数G
は、 G=〔1−(PT T HP)/(HP)T (HP)〕 によって求めることができる。このような処理によっ
て、ピッチベクトルと相関のないピッチ直交化基本ベク
トルを生成することができる。
【0046】図11は本発明の第5の実施の形態の説明
図であり、51はランダム系列、52は基本ベクトル生
成部、53は基本ベクトル部、54は木構造デルタ符号
帳展開部、55はピッチ強調系列の木構造デルタ符号
帳、56はピッチ強調処理部である。この図11に於け
るランダム系列51は図1のランダム系列1に相当し、
基本ベクトル生成部52は図1の基本ベクトル生成部2
に相当し、木構造デルタ符号帳展開部54は図1の符号
帳展開部4に相当し、木構造デルタ符号帳55は図1の
符号帳5に相当する。
【0047】ピッチ強調処理部56は、符号帳探索処理
の前段までの処理に於いて求めたピッチ周期が、分析フ
レーム長より短い場合にピッチ強調処理を施すものであ
る。本来雑音性信号を同定する為の雑音符号帳系列にピ
ッチ周期性を持たせることにより、有声音部(定常部)
に於ける特性向上を期待することができる。又復号化の
場合は、受信したピッチ周期又は再分析により得られた
ピッチ周期を用いることになる。
【0048】図12は本発明の第5の実施の形態のフロ
ーチャートであり、パラメータの設定として、ランダム
系列51のベクトル次元長N、基本ベクトル本数M、シ
フト量Kを設定する(E1)。そして、ピッチ周期と分
析フレーム長とを比較し(E2)、基本ベクトル〔i〕
〔j〕=ランダム系列〔i*K+j〕により基本ベクト
ルを生成する(E3),(E5)。そして、ピッチ周期
が分析フレーム長より短い場合、ピッチ強調処理を行う
(E4)。
【0049】この場合の基本ベクトル〔i〕〔j〕を
B、ピッチ周期をlag、分析フレーム長をfrm−l
ength、ピッチ強調フィルタ係数をp,qとする
と、ピッチ強調基本ベクトルBpit(n)は、 Bpit(n)=B(n) 但し、0≦n≦lag Bpit(n)=p*B(n)+q*B(n−lag) 但し、lag≦n≦frm−length により求めるものである。
【0050】前述のようなピッチ強調処理を行った基本
ベクトルを、木構造デルタ符号帳展開部54により展開
して、木構造デルタ符号帳55を形成することになる。
この木構造デルタ符号帳55を例えば雑音符号帳とする
ことができる。又符号化処理と復号処理との何れか一方
又は両方に於いて、このようなピッチ強調処理を行うこ
とにより、復号化再生音声信号の品質を向上することが
できる。
【0051】
【発明の効果】以上説明したように、本発明は、A−b
−S型のベクトル量子化による音声符号化復号化に於い
て、ランダム系列から任意のシフト量に従って、ベクト
ル次元長の基本ベクトルを生成し、この基本ベクトルを
構造化処理により展開して符号帳を構成するコードベク
トルを生成するものであり、例えば、オーバラップベク
トル生成手段を適用することができ、この場合はオーバ
ラップ部分についての演算量の削減が可能となり、且つ
メモリ容量の削減を図ることができる。又符号帳を生成
する展開処理の前段に於いて基本ベクトル生成処理を行
うことにより、符号帳を構成するコードベクトルの分布
の操作が容易となる利点がある。
【0052】又ランダム系列をリングバッファメモリに
格納して、オーバラップベクトル生成により基本ベクト
ルを生成することにより、ランダム系列の先頭部分の再
利用を図ることができることにより、ランダム系列を格
納するリングバッファメモリの容量を更に削減すること
ができる利点がある。又木構造デルタ符号帳のような構
造化符号帳に展開する場合、基本ベクトル本数Mを少な
くことができる。
【0053】又符号帳探索処理の前段までの分析により
得られたパラメータ又は受信したパラメータ或いは再分
析により得られたパラメータを基に設定した閾値との比
較により基本ベクトルの零振幅サンプル数を制御するこ
とによって、符号帳に展開した時の非零振幅サンプルの
割合を疎から密にわたって分布させることができる利点
がある。即ち、パルス性の音源が適切な有声音から、雑
音性の音源が適切な無声音までの広い範囲をカバーする
符号帳を生成して、符号化復号化能力の向上を図ること
ができる。
【0054】又ランダム系列から取り出したベクトル次
元長の系列を、ピッチベクトルと相関のない直交化ベク
トルとするもので、符号帳に展開する前の基本ベクトル
を総てピッチベクトルと無相関の関係とすることができ
るから、量子化効率を向上することができる。又ピッチ
周期が分析フレーム長より短い場合に、ピッチ強調処理
を施すことにより、復号化再生音声信号の品質を向上す
ることができる利点がある。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の第1の実施の形態の説明図である。
【図3】本発明の第1の実施の形態のフローチャートで
ある。
【図4】本発明の第2の実施の形態の説明図である。
【図5】リングバッファメモリの説明図である。
【図6】本発明の第2の実施の形態のフローチャートで
ある。
【図7】本発明の第3の実施の形態の説明図である。
【図8】本発明の第3の実施の形態のフローチャートで
ある。
【図9】本発明の第4の実施の形態の説明図である。
【図10】本発明の第4の実施の形態のフローチャート
である。
【図11】本発明の第5の実施の形態の説明図である。
【図12】本発明の第5の実施の形態のフローチャート
である。
【図13】従来のA−b−S型ベクトル量子化の説明図
である。
【図14】従来のCELP方式の説明図である。
【図15】従来のオーバラップ符号帳の説明図である。
【図16】従来の構造化符号帳の説明図である。
【符号の説明】
1 ランダム系列 2 基本ベクトル生成部 3 基本ベクトル部 4 符号帳展開部 5 符号帳 7 線形予測合成フィルタ 9 誤差電力の評価部

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 A−b−S型のベクトル量子化による音
    声符号化復号化方法に於いて、 ランダム系列から任意のシフト量に従って、ベクトル次
    元長の基本ベクトルを生成し、 該基本ベクトルを構造化処理により展開して符号帳を構
    成するコードベクトルを生成する過程を含むことを特徴
    とする音声符号化復号化方法。
  2. 【請求項2】 シフト量をベクトル次元長以下に設定し
    たオーバラップベクトル生成により前記基本ベクトルを
    生成する過程を含むことを特徴とする請求項1記載の音
    声符号化復号化方法。
  3. 【請求項3】 前記ランダム系列をリングバッファメモ
    リに格納した構成とし、該リングバッファメモリに格納
    された前記ランダム系列をオーバラップベクトル生成に
    より前記基本ベクトルを生成する過程を含むことを特徴
    とする請求項1記載の音声符号化復号化方法。
  4. 【請求項4】 前記構造化処理は、前記基本ベクトルを
    基に階層化された初期ベクトルとデルタベクトルとを含
    む木構造デルタ符号帳に展開する過程を含むことを特徴
    とする請求項1又は2又は3記載の音声符号化復号化方
    法。
  5. 【請求項5】 前記ランダム系列から取り出したベクト
    ル次元長の系列と閾値とを比較し、該比較結果に応じて
    該系列の零振幅サンプル数を制御して基本ベクトルを生
    成する過程を含むことを特徴とする請求項1乃至4の何
    れか1項記載の音声符号化復号化方法。
  6. 【請求項6】 前記閾値を、符号帳探索処理の前段まで
    の分析により得られたパラメータの関数として設定する
    過程を含むことを特徴とする請求項5記載の音声符号化
    復号化方法。
  7. 【請求項7】 伝送されたパラメータ又は復号化過程の
    再分析により得られたパラメータを基に閾値を設定し、
    該閾値と、前記ランダム系列から取り出したベクトル次
    元長の系列とを比較し、該比較結果に応じて該系列の零
    振幅サンプル数を制御して基本ベクトルを生成する過程
    を含むことを特徴とする請求項1乃至5の何れか1項記
    載の音声符号化復号化方法。
  8. 【請求項8】 ピッチベクトルを基に、前記ランダム系
    列から取り出したベクトル次元長の系列を、前記ピッチ
    ベクトルと相関のないピッチ直交化基本ベクトルとして
    生成する過程を含むことを特徴とする請求項1乃至7の
    何れか1項記載の音声符号化復号化方法。
  9. 【請求項9】 ピッチ周期を基に、前記ランダム系列か
    ら取り出したベクトル次元長の系列を、ピッチ強調した
    基本ベクトルとして生成する過程を含むことを特徴とす
    る請求項1乃至8の何れか1項記載の音声符号化復号化
    方法。
  10. 【請求項10】 A−b−S型のベクトル量子化による
    音声符号化復号化装置に於いて、 ランダム系列を格納するバッファメモリと、 ベクトル次元長,シフト量のパラメータに従って前記バ
    ッファメモリからオーバラップベクトル生成により基本
    ベクトルを生成する基本ベクトル生成部と、 該基本ベクトル生成部により生成された基本ベクトルを
    展開して符号帳を形成する符号帳展開部とを備えたこと
    を特徴とする音声符号化復号化装置。
  11. 【請求項11】 前記ランダム系列を格納するバッファ
    メモリをリングバッファメモリとしたことを特徴とする
    請求項10記載の音声符号化復号化装置。
  12. 【請求項12】 前記符号帳展開部は、前記基本ベクト
    ル生成部により生成された前記基本ベクトルを構造化符
    号帳に展開する構成を備えたことを特徴とする請求項1
    0記載の音声符号化復号化装置。
  13. 【請求項13】 前記基本ベクトル生成部は、閾値を設
    定する閾値制御部と、該閾値制御部に設定された閾値と
    前記バッファメモリに格納されたランダム系列のベクト
    ル次元長の系列とを比較して零振幅サンプル数を制御す
    る非零/零サンプル制御部とを備えたことを特徴とする
    請求項10乃至12の何れか1項記載の音声符号化復号
    化装置。
  14. 【請求項14】 前記基本ベクトル生成部は、ピッチベ
    クトルと相関のないベクトルとして直交化処理した基本
    ベクトルを生成するピッチベクトル直交化処理部を備え
    たことを特徴とする請求項10乃至12の何れか1項記
    載の音声符号化復号化装置。
  15. 【請求項15】 前記基本ベクトル生成部は、ピッチ周
    期に従って前記バッファメモリに格納されたランダム系
    列のベクトル次元長の系列にピッチ強調処理を施した基
    本ベクトルを生成するピッチ強調処理部を備えたことを
    特徴とする請求項10乃至12の何れか1項記載の音声
    符号化復号化装置。
JP9286373A 1997-10-20 1997-10-20 音声符号化復号化方法及び音声符号化復号化装置 Pending JPH11119800A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP9286373A JPH11119800A (ja) 1997-10-20 1997-10-20 音声符号化復号化方法及び音声符号化復号化装置
US09/033,198 US6078881A (en) 1997-10-20 1998-03-02 Speech encoding and decoding method and speech encoding and decoding apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9286373A JPH11119800A (ja) 1997-10-20 1997-10-20 音声符号化復号化方法及び音声符号化復号化装置

Publications (1)

Publication Number Publication Date
JPH11119800A true JPH11119800A (ja) 1999-04-30

Family

ID=17703560

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9286373A Pending JPH11119800A (ja) 1997-10-20 1997-10-20 音声符号化復号化方法及び音声符号化復号化装置

Country Status (2)

Country Link
US (1) US6078881A (ja)
JP (1) JPH11119800A (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1494055A (zh) 1997-12-24 2004-05-05 ������������ʽ���� 声音编码方法和声音译码方法以及声音编码装置和声音译码装置
CA2343737A1 (en) * 1998-09-11 2000-03-23 Bestop, Inc. Combination of a lockable soft tonneau cover and lockable tailgate
AU2621301A (en) * 1999-11-01 2001-05-14 Kurzweil Cyberart Technologies, Inc. Computer generated poetry system
US7518652B2 (en) * 2000-05-03 2009-04-14 Aperio Technologies, Inc. Method and apparatus for pre-focus in a linear array based slide scanner
WO2005022147A1 (en) * 2003-08-28 2005-03-10 Celula, Inc. Methods and apparatus for sorting cells using an optical switch in a microfluidic channel network
US20110004469A1 (en) * 2006-10-17 2011-01-06 Panasonic Corporation Vector quantization device, vector inverse quantization device, and method thereof
GB2463050B (en) * 2008-08-29 2010-12-08 Toshiba Res Europ Ltd Data compression method and apparatus
JP6962269B2 (ja) * 2018-05-10 2021-11-05 日本電信電話株式会社 ピッチ強調装置、その方法、およびプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5864650A (en) * 1992-09-16 1999-01-26 Fujitsu Limited Speech encoding method and apparatus using tree-structure delta code book
EP0788091A3 (en) * 1996-01-31 1999-02-24 Kabushiki Kaisha Toshiba Speech encoding and decoding method and apparatus therefor

Also Published As

Publication number Publication date
US6078881A (en) 2000-06-20

Similar Documents

Publication Publication Date Title
US7831420B2 (en) Voice modifier for speech processing systems
US6427135B1 (en) Method for encoding speech wherein pitch periods are changed based upon input speech signal
US6980951B2 (en) Noise feedback coding method and system for performing general searching of vector quantization codevectors used for coding a speech signal
US5819213A (en) Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks
JP3112681B2 (ja) 音声符号化方式
JP4771674B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JPH08234799A (ja) 改良されたベクトル励起源を有するデジタル音声コーダ
JPH11119800A (ja) 音声符号化復号化方法及び音声符号化復号化装置
JP6644848B2 (ja) ベクトル量子化装置、音声符号化装置、ベクトル量子化方法、及び音声符号化方法
JPH04344699A (ja) 音声符号化・復号化方法
JP2658816B2 (ja) 音声のピッチ符号化装置
JP3268750B2 (ja) 音声合成方法及びシステム
JP3263347B2 (ja) 音声符号化装置及び音声符号化におけるピッチ予測方法
JPH06282298A (ja) 音声の符号化方法
KR100718487B1 (ko) 디지털 음성 코더들에서의 고조파 잡음 가중
JP3593839B2 (ja) ベクトルサーチ方法
JPH0519795A (ja) 音声の励振信号符号化・復号化方法
JP3099852B2 (ja) 励振信号の利得量子化方法
JPH06131000A (ja) 基本周期符号化装置
JP4826580B2 (ja) 音声信号の再生方法及び装置
JP3874851B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP2003248495A (ja) 音声合成方法と装置及びプログラム
JP3049574B2 (ja) 利得形状ベクトル量子化法
JPH04305135A (ja) 音声のピッチ予測符号化法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20031014