JPS58128000A - 音声パラメ−タ符号化方式 - Google Patents

音声パラメ−タ符号化方式

Info

Publication number
JPS58128000A
JPS58128000A JP57011153A JP1115382A JPS58128000A JP S58128000 A JPS58128000 A JP S58128000A JP 57011153 A JP57011153 A JP 57011153A JP 1115382 A JP1115382 A JP 1115382A JP S58128000 A JPS58128000 A JP S58128000A
Authority
JP
Japan
Prior art keywords
sound
voiced
quantization
parameters
vocal tract
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57011153A
Other languages
English (en)
Inventor
豊 和田
大岡 明裕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Electric Industries Ltd
Original Assignee
Sumitomo Electric Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Electric Industries Ltd filed Critical Sumitomo Electric Industries Ltd
Priority to JP57011153A priority Critical patent/JPS58128000A/ja
Publication of JPS58128000A publication Critical patent/JPS58128000A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、有声音、無声音別(二異種形式の非線形量子
化を行なうことC;よりデータ圧縮を図った音声パラメ
ータ符号化方式(−関するものである。
音声の機械認識、合成あるいは高能率伝送等の各種方式
を実現する場合、音声信号を小さな情報ある。音声の特
徴パラメータは、声道の伝送特性に関する声道パラメー
タとこの声道駆動源(二関する音源パラメータ、とじ大
別される。前者は声道の周波数伝送特性(二よって表現
され、後者は有声音、無声音の別、音声振幅及び有声音
の基本周期(ピッチ)で表現される。ここで有声音は声
帯振動を伴う音源であり、これに対して無声音は声帯振
動を伴わない雑音源に類似の音源である。上述の特徴パ
ラメータを十分な高精度で抽出、再生する(二は原理的
にも実用的(二も未解決の技術的課題が多数存在するが
、含酸音質を所定のレベルに保ちつつデータ圧縮を行な
い記憶容量の低減化や伝送路の低ビツトレート化を図る
ことが大きな技術的課題の1つである。
従来このようなデータ圧縮の問題を解決するため、特徴
パラメータを2進符号の形式で抽出する場合においても
、これをそのまま記憶したり、伝送したすせずに、これ
を一旦量子化(符号化)して少ビット数の量子化パラメ
ータ(=変換している。
ラメータをそれぞれの重要度に応じて5乃至3ビット程
度のデータに量子化しているが、これ(二伴う量子化誤
差(雑りをいかに低減するかが問題−二な罎。このため
従来は各ゲ、微パラメータの出現頻度を考慮して対数、
正接1数等による非線形量子化を採用している。
例えば、PARCOR(Partiaj Autoeo
rreムtion:部分自己相関)方式におけるPAR
COR係数に1、k、を約5秒間にわたる男声から抽出
してみると、それぞれ第1図、第2図のA(=示す結果
が得られる。
すなわち、klは大部分がOと−toの狭い範囲に分布
しているのに対し、k、は−α4と+10の間の比較的
広い範囲(二分布している。従って、出現頻度の高い領
域はど量子化ステップが小さくなるように各パラメータ
ととC二異種の非線形量子化の形式を選択すること(二
より、量子化雑音の出現確率を低減することができる。
このよう(=従来例C;おいては、PARCOR係数に
茸、k!、ks−(二対してその出現頻度分布に応じて
非線形量子化を行なっているが、量子化雑音の改善はま
だ十分とはいえない。
本発明者はデータ圧縮(=伴う量子化雑音を低減するた
めC二種々の研究を行なった結果、新規かつ重要な現象
を発見した。すなわち、従来方法(=従って抽出したP
ARCOR係数kl、k、、k、・・・の出現頻度分布
を有声音と無声音の別(−分解してみると、両者の間C
=明確な相違が存在することが判明した。
実験データの一例としてに、、kについて有声音の場合
(B)、無声音の場合(C)をそれぞれ第1図、第2図
に示す。例えばに、の場合、第1図(B)、(C)に示
すよう(二有声音の出現頻度の分布は−toと−α8の
狭い領域C二限定されており、−万態声音の頻度分布は
比較的広い範囲にわたっている。klの場會第2図(B
)、(C)(=示すように、有声音がα85近傍の第1
のピークを受けもっており、−万態声音がα4近傍の第
2のピークを受けもっている。
従って例えばに、の場合、有声音については一μsと−
toの範囲を細かい量子化ステップで、他の領域は粗い
量子化ステップで非線形量子化し、−万態声tζ二つい
ては−10と0の広い範囲にわたって粗い量子化ステッ
プで、他の領域は更に粗い量子化ステップで非線形量子
化すること(二より、有声音と無声音を区別しない従来
方式(二比べて量子化誤差を大幅(二低減できることが
明らかである。
またに、の場合例えば有声f4:ついてはα85近傍に
細い量子化ステップを配分し、−万態声音(二ついては
α4近傍に細い量子化ステップを配分する。
これはに1、k4・・・の高次のPARCOR係数につ
いても同様である。一般−二PARCOR係数は精度の
向上とデータ圧縮という相反する要求を調和させるため
にk16程度までが採用されるが、本発明−二おいても
同様な理由からこれらの係数の一部についてだけ有声音
、無声音の区別を行なってもよい。またPARCOR方
式以外の他の方式、例えば線形予測方式(二おいても本
発明を使用できることは明らかである。これはPARC
OR係数と線形予測係数が1対1C二対応しているため
、PARCOR係数C二ついて有声音と無声音間の頻度
分布の差があるということは、線形予測係数(二ついて
も同様の差が存在することを意味しているからである。
さら(=、有声音、無声音別シー最適の非線形量子化形
式を選択するC二あたっては、有声音と無声音間の出現
頻度が考慮される。典型的には、有声音の出現頻度は2
4程度である。
このよう(=、本発明は新規かつ有用な知見に基づいて
なされたものであり、有声音であるか無声音であるか(
二応じて異なる形式の非線形量子化を行なうこと(二よ
り、量子化雑音の低減を図るものである。これはまた、
従来と同程度の量子化雑音を許容する場合(二は、量子
化雑音の低減分だけデータ圧縮が可能であり、記憶容量
の低減化、伝送路の低ビツトレート化等が達成できるこ
とを意味している。
以下実施例(二より本発明を更に詳細に説明する。
第3図は本発明方式の一実施例を適用する音声分析・合
成系の構成の一例を示すブロック図であり、音声分析系
10と音声含酸系2oから構成されている。音声分析系
10は声道パラメータ分析装置11、音源パラメータ分
析装置12及び符号化装置15を備えており、一方音声
合成系2oは声道模擬装置21、音源生成装置22及び
復号化装[23を備えている。
まず本発明C二おける音声分析の方法について説明すれ
ば、ディジタル化された音声が声道パラメータ分析装置
11に供給される。この声道パラメ゛−タ分析装置11
は、線形予測係数やPARCOR係数を分析・抽出する
ための適宜な公知装置で構成されており、計算機プログ
ラム(二よりあるいはディジタルフィルタを主体とした
八−ドウエア的な構成C二より声道パラメータ、例えば
PARCOR係数に1、k、、kl・・・k、・を分析
・抽出して符号化装置13屯二連なる信号線14上も;
これらの係数を出力すると共C二、音源パラメータ分析
装置124二連なる信号線15上に残差信号を出力する
。公知の適宜な音源パラメータ分析装置で構成される音
源パラメータ分析装置12は、残差信号の自己相関係数
を求めること(二より声帯振動の有無すなわち有声音で
あるか無声音であるかを表示fる1ビツトの積別符号(
V/UV)、音声振幅り及び有声音のピッチTを符号化
装置13に連なる信号線上(二出力する。
声道パラメータ符号化装置101は、声道パラメータ(
この場合はPARCOR係数に8、k!、kj・・・)
の量子化(符号化)を順次実行するが、まず各係数に3
、k、・・・の量子化(二先立って対応の次数を符号表
選択装置103(:、通知する。これを受けた符号表選
択装置゛103は、音源パラメータ分析装置12から。
受けた有声音、無声音の識別符号(V/UV)(二基づ
いて符号表102の先頭番地を決定し、これを符号化装
置101(二通知する。これを受けた符号化装置101
は符号表102の指定された先頭番地内(=格納されて
いる最小の量子化レベルを続出して符号化すべき係数に
1と比較する。符号化すべき係数に1の方が大きい場合
4=は、符号化装置101は符号表102内の次の番地
から次C二大きな値を有する第2の量子化レベルを読出
して符号化すべき係数klと比較する。このようにして
符号表102から続出した量子化レベルが符号化すべき
係数kiに等しいか又はこれよりも大iく゛なるまで上
述の続出しと比較が行なわれる。この読出しと比較操作
の繰返し′回数が2進カクンタで計測されており、上述
の条件が達成されて続出しが終了したときの2進カクン
タの内容が、先頭番地からの相対番地の形式でkiの量
子化レベルを表示する。
このように、各PARCOR係数について有声音、無声
音別(二異なる形式の量子化データを符号表102C二
格納しておき、V/vv符号(二よって読出すべき量子
化データの先頭番地を指定する構成であるから、有声音
であるか無声音であるか(:応じて異なる形式の非線形
量子化を行うことができる。
同様にして音源パラメータ符号化装置104は、音源パ
ラメータ分析装置12から受けた音声振幅り及び有声音
のピッチTを符号表105から読出した量子化データと
の比較、読出しの繰返しC二より符号化を行う。勿論V
/UV符号はもともと1ビツトの符号であるから、これ
はそのまま記憶ないしは伝送路に送出される。
このよう(ニして音声合成系10(二おいて符号化され
た声道パラメータ及び音源パラメータは、系の使用目的
(二応じて配憶装置あるいは伝送路を介して音声合成系
20に送られる。復号化装置25内の符号表202及び
205ならびC二符号表選択装置203は、それぞれ符
号化装置13内の符号表102及び205ならび(二符
号表選択装置103と全く同−C二構成されており、全
く同一の機能を有している。
従って、これらの装置(二ついては重複した説明を要し
ないであろう。声道パラメータ復号化装置201は、各
kiについて、符号表選択装置203から受けた続出し
の先頭番地及び声道パラメータ符号化装置101から受
けた相対番地を加算すること仁より読出すべき符号表2
02の絶対番地を決定し、その番地(二格納されている
量子化レベルを読出す。
この読出された声道パラメータ、すなわち復号化ないし
再生された声道パラメータは声道模擬装置゛ 214二
連なる信号線24上に出力される。
同様にして音源パラメータ復号化装置204で復号化さ
れた有声音、無声音の識別符号V/UV 、音声振幅り
、有声音のピッチTはそれぞれ音源生成装置22(二供
給される。音源生成装置22は、V/UVが有声音であ
る旨を表示している場合(:は、音声振幅り及びピッチ
Tのそれぞれ(=よって指定された振幅及び周期のパル
ス列を信号線25上(二出力する。一方V/UVが無声
音である旨を表示している場會(=は、音源生成装置2
2は、音声振幅りで指定された振幅の雑音を信号線25
上(二出力する。
公知の適宜な声道模擬装置で構成される声道模擬装置2
1は、典型的(二は可変パラメータのディジタシフ4ル
タで構成されており、これは声道パラメータ復号化装置
201から受けた声道パラメータ喀二応じて回路パラメ
ータを変更する。従って音源生成装置22から供給され
た所定レベル、所定ピッチの有声音又は所定レベルの無
声音(雑音)は声道模擬装置21で原音声に再生され出
力される。この出力は、記録装置(二供給されるかある
いはD/ム変換されかつ低域−波されてスピーカに供給
される。
第6図の構成例(二おいては、符号表選択装置103.
203を使用じたが、続出すべき量子化レベルを有声音
、無声音別に符号表102,202の異なるチップに格
納しておき、識別符号V/UV tニー基づいて続出す
べきチップを選択する構成とすることにより、符号表選
択装置103,203を省略することもできる。さらに
符号表103,203に量子化レベルを直接格納する構
成(二代えて、各パラメータの次数及び有声音、無声音
の別に応じて適用すべき最良の非線形量子化の形式を対
数関数、正接関数等の変換関数の形式で格納しておく構
成とすることもできる。
以上詳細C二説明したように、本発明は声道パラメータ
の出現頻度分布が有声音であるか無声音であるかによっ
て異るという新規な知見に基づいて、少くとも1部の声
道パラメータについては有声音であるか無声音であるか
(二応じて異なる形式の非線形量子化により符号化及び
復号化を行う構成であるから、一定のデータ量のもとで
量子化雑音を低減でき、また一定の量子化雑音のもとで
データ圧縮が可能であるという利点な有している。
【図面の簡単な説明】
第1図、第2図は本発明の基礎となる実験データを例示
する図、第3図は本発明方式の一実施例が適用される音
声分析・合成系の構成の一例な示すブロック図である。 10・・・音声分析系、11・・・声道パラメータ分析
装置、12・・・音源パラメータ分析装置、13・・・
符号化装置、20・・・音声合成系、21・・・声道模
擬装置、22・・・音源生成装置、23・・・復号化装
置、101・・・声道パラメータ符号化装置、102.
105゜202.205・・・符号表、103.203
・・・符号表選択装置、104・・・音源パラメータ符
号化装置、201・・・声道パラメータ復号化装置、2
04・・・音源パラメータ復号化装置。 特許出願人  住友電気工業株式会社 代理人 弁理士玉蟲久五部

Claims (1)

    【特許請求の範囲】
  1. 音声から声道パラメータ及び音源パラメータを分析抽出
    し、該分析抽出した両パラメータをディジタル符号化し
    、該ディジタル符号化した両パラメータ(二基づいて前
    記音声を再生するパラメータ応じて異なる形式の非線形
    量子化(二より符号化及び復号化を行′なうことを特徴
    とする音声パラメータ符号化方式。
JP57011153A 1982-01-27 1982-01-27 音声パラメ−タ符号化方式 Pending JPS58128000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57011153A JPS58128000A (ja) 1982-01-27 1982-01-27 音声パラメ−タ符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57011153A JPS58128000A (ja) 1982-01-27 1982-01-27 音声パラメ−タ符号化方式

Publications (1)

Publication Number Publication Date
JPS58128000A true JPS58128000A (ja) 1983-07-30

Family

ID=11770068

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57011153A Pending JPS58128000A (ja) 1982-01-27 1982-01-27 音声パラメ−タ符号化方式

Country Status (1)

Country Link
JP (1) JPS58128000A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60173600A (ja) * 1984-02-17 1985-09-06 日本電信電話株式会社 音声復号器

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60173600A (ja) * 1984-02-17 1985-09-06 日本電信電話株式会社 音声復号器

Similar Documents

Publication Publication Date Title
KR100427753B1 (ko) 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치
CA2430111C (en) Speech parameter coding and decoding methods, coder and decoder, and programs, and speech coding and decoding methods, coder and decoder, and programs
US20060212290A1 (en) Audio coding apparatus and audio decoding apparatus
KR20010021226A (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
WO2003010752A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
JPS62261238A (ja) ボコーダ装置
US7747435B2 (en) Information retrieving method and apparatus
JP2003108197A (ja) オーディオ信号復号化装置およびオーディオ信号符号化装置
US6772113B1 (en) Data processing apparatus for processing sound data, a data processing method for processing sound data, a program providing medium for processing sound data, and a recording medium for processing sound data
JPS62194296A (ja) 音声符号化方式
JP4508599B2 (ja) データ圧縮方法
JP2000132193A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JPS58128000A (ja) 音声パラメ−タ符号化方式
JPH03233500A (ja) 音声合成方式およびこれに用いる装置
JP2004246038A (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
JP2796408B2 (ja) 音声情報圧縮装置
JP2797348B2 (ja) 音声符号化・復号化装置
KR100359528B1 (ko) 엠피 쓰리 인코더/디코더
JPH05232996A (ja) 音声符号化装置
JPS62102294A (ja) 音声符号化方式
JP3250367B2 (ja) 符号化信号復号化方法及びその装置
KR100487645B1 (ko) 유사주기 파형들을 이용한 음성 인코딩 방법
JPH0690638B2 (ja) 音声分析方式
JP3271966B2 (ja) 符号化装置及び符号化方法
JPH05276049A (ja) 音声符号化方法及びその装置