JPH04264600A - 音声符号化装置および音声復号装置 - Google Patents

音声符号化装置および音声復号装置

Info

Publication number
JPH04264600A
JPH04264600A JP3026327A JP2632791A JPH04264600A JP H04264600 A JPH04264600 A JP H04264600A JP 3026327 A JP3026327 A JP 3026327A JP 2632791 A JP2632791 A JP 2632791A JP H04264600 A JPH04264600 A JP H04264600A
Authority
JP
Japan
Prior art keywords
pitch period
information
value
pitch
range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3026327A
Other languages
English (en)
Inventor
Yoshiaki Tanaka
良紀 田中
Yoshihiro Sakai
坂井 良広
Yasuko Shirai
白井 靖子
Tomohiko Taniguchi
智彦 谷口
Hideaki Kurihara
秀明 栗原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP3026327A priority Critical patent/JPH04264600A/ja
Priority to CA002061462A priority patent/CA2061462C/en
Priority to EP19920102831 priority patent/EP0500094A3/en
Priority to US07/838,340 priority patent/US5325461A/en
Publication of JPH04264600A publication Critical patent/JPH04264600A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号の情報圧縮伝
送を行うための音声符号化装置および音声復号装置に関
する。近年、企業内通信システム、ディジタル伝送シス
テム、音声蓄積システム等において、情報の高能率な圧
縮を行う音声符号化方式が要望されている。特に、ディ
ジタル移動無線通信システム等においては、伝送路エラ
ーに強い音声符号化システムが求められている。
【0002】
【従来の技術】音声の予測符号化方式においては、フレ
ーム毎に短期予測分析により抽出された短期予測係数、
長期予測分析により抽出されたピッチ予測係数およびピ
ッチ周期、および、短期予測フィルタおよび長期予測フ
ィルタの逆特性フィルタ(逆フィルタ)によって生成さ
れた予測残差信号を多重化して伝送する方式が一般的で
ある。この予測残差信号の情報を効率的に伝送するため
に、さらに、予測残差ベクトルをベクトル量子化して、
そのインデックスを伝送するコード駆動線型予測符号化
方式(CELP)や、予測残差ベクトルを有限個のパル
ス列でモデル化し、最適なパルス位置およびパルス振幅
を伝送する方式(マルチパス駆動符号化方式、MPC)
等が知られている。
【0003】ところで、このような方式を、移動通信の
ような伝送路エラーの多い環境下で使用する場合には、
エラーが発生した場合の品質の劣化が少なくなるように
、誤り訂正符号化の併用や、エラーのあるパラメータの
修復等が必要となる。パラメータの修復処理は、時間的
に前後するパラメータからの補間(外挿)や繰り返し等
により誤りのあるパラメータの修復を行うものであるが
、これらの処理は、誤りが無いときの再生音声品質を低
下させるため、誤りが存在するパラメータのみに対して
処理を行う必要がある。
【0004】前述の音声符号化方式のうち、長期予測分
析により分析されたピッチ予測係数およびピッチ周期を
伝送するようなシステムにおいては、このピッチ情報は
、音声の有声音部において最も重要なパラメータの1つ
であり、ピッチ情報における誤りは再生音声品質を著し
く劣化させる。
【0005】
【発明が解決しようとする課題】しかしながら、音声信
号は、波形に周期性のない無声音部を含むため、従来、
音声復号装置においては、ピッチ周期における伝送路エ
ラーに対しては、例え、誤り検出符号等の適用によって
誤りが検出されても補間(外挿)等の処理による誤りの
訂正は困難であるという問題がある。
【0006】本発明は、伝送されたピッチ情報を受信す
る復号装置側において、ピッチ情報の伝送路誤りを検出
し、誤りを修復する音声符号化装置および音声復号装置
を提供することを目的とする。
【0007】
【課題を解決するための手段】図1は、本発明による音
声符号化装置の基本構成を示すものである。図1におい
て、1は音声符号化手段、2は許容範囲情報発生手段、
そして、3は送信手段である。音声符号化手段1は、音
声信号を入力して、長期予測分析により分析されたピッ
チ周期を含む、前記音声信号を符号化した情報を出力す
る。
【0008】許容範囲情報発生手段2は、前記ピッチ周
期を入力て、該ピッチ周期の値を含む所定の幅を有する
、ピッチ周期の値の許容範囲に関する情報を出力する。 送信手段3は、上記の音声符号化手段1、および、許容
範囲情報発生手段2の出力を送信する。図2は、本発明
による音声復号装置の基本構成を示すものである。 図2において、4は受信手段、5はピッチ周期情報修復
手段、そして、6は音声復号手段である。
【0009】受信手段4は、長期予測分析を行ってピッ
チ周期を含む音声符号化情報を出力し、且つ、該ピッチ
周期の値を含む所定の幅を有する、ピッチ周期の値の許
容範囲に関する情報を出力する音声符号化装置によって
符号化された、該ピッチ周期、ピッチ周期の値の許容範
囲に関する情報、および、その他の音声符号化に関する
情報を受信する。
【0010】ピッチ周期情報修復手段5は、上記のピッ
チ周期およびピッチ周期の値の許容範囲に関する情報を
入力して、該入力したピッチ周期が、同時に入力したピ
ッチ周期の値の許容範囲に関する情報が示す許容範囲に
入るか否かを判定し、もし、許容範囲に入っていれば、
上記の入力したままのピッチ周期を出力し、もし、許容
範囲に入っていなければ、該入力したピッチ周期の代わ
りに、該許容範囲内の所定の値をピッチ周期として出力
する。
【0011】音声復号手段6は、上記のピッチ周期情報
修復手段5から出力される上記のピッチ周期、および、
上記の受信手段4からの該ピッチ周期以外の前記音声符
号化情報を入力して、これらに基づいて音声信号を再生
する。ここで、望ましくは、上記のピッチ周期の値の許
容範囲は、基本ピッチ周期を含む範囲、および、該基本
ピッチ周期の整数倍のピッチ周期を含む範囲を含んでな
るものとすることができる。
【0012】更に、望ましくは、上記の許容範囲情報発
生手段2は、長期予測分析によって分析されたピッチ周
期の値が予め決められた特定の許容範囲のどれにも含ま
れない(ピッチの周期性が小さい)音声信号であるか否
かを判定し、この場合は、ピッチの周期性が無いことを
示す情報を、前記ピッチ周期の値の許容範囲に関する情
報として出力する。
【0013】上記のようなシステムにおいては、音声復
号装置においては、ピッチ周期情報修復手段5は、上記
の、ピッチの周期性が無いことを示す情報を入力すると
、修復処理は行わない。更に、上記のピッチ周期情報修
復手段5において、上記のピッチ周期の値の許容範囲に
関する情報を入力する前段階において、該情報にビット
誤りがあるか否かを検出するビット誤り検出手段を設け
ることができる。図3は、ビット誤り検出手段を設ける
ことに対応する、音声復号装置における付加的な構成の
1例を示すものである。図3において、5は図2と同様
のピッチ周期情報修復手段、7はビット誤り検出手段、
8は外挿手段、そして、9は選択手段である。
【0014】ビット誤り検出手段7は、ピッチ周期の値
の許容範囲に関する情報を入力して、該情報にビット誤
りがあるか否かを検出する。外挿手段8は、少なくとも
上記の情報に誤りがあったときには、時間的に近い過去
に受信したピッチ周期の値の許容範囲の値からの外挿、
あるいは、直前に受信したピッチ周期の値の許容範囲の
値を出力する。選択手段9は、上記のビット誤り検出手
段7の検出結果によって制御され、上記のピッチ周期の
値の許容範囲に関する情報に誤りがあったときには、上
記のビット誤りがあったピッチ周期の値の許容範囲に関
する情報の代わりに、外挿手段8の出力を選択して出力
し、上記のピッチ周期の値の許容範囲に関する情報に誤
りがなかったときには、受信したピッチ周期の値の許容
範囲の値をそのまま出力する。この選択された情報が、
ピッチ周期情報修復手段5に供給され、ピッチ周期情報
修復手段5は、この情報に基づいて、同時に受信したピ
ッチ周期が該情報が示す許容範囲に入るか否かを判定し
、以後は、図2の構成におけると同様の動作が行われる
【0015】
【作用】図1の音声符号化装置において、入力された音
声信号は、音声符号化手段1にて、長期予測分析を含む
予測符号化が行われ、該長期予測分析により分析された
ピッチ周期を含む、前記音声信号を符号化した情報をと
して出力される。これらの情報のうち、ピッチ周期につ
いては、許容範囲情報発生手段2において、該ピッチ周
期の値を含む所定の幅を有する、ピッチ周期の値の許容
範囲に関する情報が出力される。そして、このピッチ周
期の値の許容範囲に関する情報も、上記の音声信号を符
号化した情報と共に送信手段3から、(例えば、多重化
されて、)送信される。
【0016】図2の音声復号装置においては、図1のよ
うな音声符号化装置から伝送されてきた音声信号を符号
化した情報を受信手段4て受信し、上記のピッチ周期お
よびピッチ周期の値の許容範囲に関する情報はピッチ周
期情報修復手段5において、該入力したピッチ周期が、
同時に入力したピッチ周期の値の許容範囲に関する情報
が示す許容範囲に入るか否か判定される。もし、許容範
囲に入っていれば、上記の入力したままのピッチ周期が
出力され、もし、許容範囲に入っていなければ、該入力
したピッチ周期の代わりに、該許容範囲内の所定の値を
ピッチ周期として出力する。音声復号手段6は、上記の
ピッチ周期情報修復手段5から出力される上記のピッチ
周期、および、上記の受信手段4からの該ピッチ周期以
外の前記音声符号化情報を入力して、これらに基づいて
音声信号を再生する。
【0017】ここで、後述するように、長期予測分析に
よれば、音声信号のピッチ周期の予測値は、基本ピッチ
周期の付近の値の他に、該基本ピッチ周期の整数倍のピ
ッチ周期の付近の値においても良い予測結果を示す。し
たがって、音声符号化手段1においては、例えば、(最
適の)分析値として、基本ピッチ周期の付近の値を与え
る続ける時間経過の間に、該基本ピッチ周期の整数倍の
ピッチ周期の付近の値を(最適の)分析値として出力す
ることが起こり得る。したがって、音声復号装置におい
ても、このような基本ピッチ周期の整数倍のピッチ周期
の付近の値を、伝送路エラーと判定しないため、および
、後述するように、ピッチ周期の値の許容範囲に関する
情報自体に伝送路エラーが生じて、ピッチ周期の値の許
容範囲に関する情報の外挿値等を使用したときに、上記
のように最適と判定されたピッチ周期の値が基本ピッチ
周期の整数倍の複数の範囲間を急に遷移しても伝送路エ
ラーと判定しないために、ピッチ周期の値の許容範囲を
、基本ピッチ周期を含む範囲、および、該基本ピッチ周
期の整数倍のピッチ周期を含む範囲を含んでなるように
することが望ましい。
【0018】更に、音声信号には、無声音が含まれ、こ
の無声音に対しては、ピッチ周期が検出されないので、
上記の許容範囲情報発生手段2で予め設定された許容範
囲のいずれにもピッチ周期の値が含まれなくなる。この
ときはピッチの周期性がない音声信号であると判定し、
この場合は、ピッチ周期性が無いことを示す情報を、前
記ピッチ周期の値の許容範囲に関する情報として出力す
る。
【0019】上記のような情報を受信すると、音声復号
装置におけるピッチ周期情報修復手段5は、修復処理は
行わない。更に、図3のような音声復号装置においては
、上記のピッチ周期の値の許容範囲に関する情報にビッ
ト誤りがあるか否かを検出し、ビット誤りがあると判定
されたときは、時間的に近い過去に受信したピッチ周期
の値の許容範囲の値からの外挿、あるいは、直前に受信
したピッチ周期の値の許容範囲の値を外挿手段8によっ
て求め、この外挿手段8の出力によって、出力する。 選択手段9は、上記のビット誤り検出手段7の検出結果
によって制御され、上記のピッチ周期の値の許容範囲に
関する情報に誤りがあったときには、上記のビット誤り
があったピッチ周期の値の許容範囲に関する情報の代わ
りに、外挿手段8の出力を選択して出力し、ピッチ周期
情報修復手段5は、この外挿手段8が与える許容範囲に
、同時に受信したピッチ周期が該情報が示す許容範囲に
入るか否かを判定し、入っていなければ、誤り修復を行
う。上記のピッチ周期の値の許容範囲に関する情報に誤
りがなければ、図2の構成におけると同様の動作が行わ
れる。
【0020】
【実施例】以下添付図面を用いて本発明の実施例を詳細
に説明する。図7は、長期予測分析を含む音声信号の予
測符号化装置の典型的な構成例を示す図である。図7に
おいて、11は音源、12は加算器、13は遅延回路、
14は増幅器、15は線型予測フィルタ、16は減算器
、17は予測評価量演算部、18は予測評価量の最大値
探索部である。
【0021】音源11からは、例えば、ガウス雑音から
なるベクトルを与える。この信号は、加算器12、遅延
回路13、および、増幅器14からなる長期予測フィル
タにて、dサンプル遅延したものにゲインgを乗じたも
のを加えられ、線型予測フィルタ15に印加される。線
型予測フィルタ15の特性は、
【0022】
【数1】
【0023】で表され、直前の過去の数サンプルのデー
タに基づいて線型予測(短期予測)を行う。こうして、
長期予測フィルタおよび短期予測フィルタを通して音源
11からの信号に基づいて実際の音声入力信号xi を
予測する信号g・yi が生成される。減算器16にお
いては、実際の音声入力信号xi と線型予測フィルタ
15の出力信号との差(xi −g・yi )が演算さ
れる。このとき誤差電力は(2)式で表わされる。
【0024】
【数2】
【0025】ここで、Nはピッチ分析フレーム長、ai
 は線型予測係数、pは線型予測の次数である。(2)
式の値を最小にするゲインgは、(2)式をgで微分す
ることにより得られる。すなわち、
【0026】
【数3】
【0027】このときの誤差電力Ed は(4)式で与
えられる。
【0028】
【数4】
【0029】ここで、(4)式の第1項は、音声ベクト
ル電力であって、遅延dの値に依らず一定である。この
ため、(4)式の右辺第2項を最大にするピッチ周期を
最適ピッチ周期として選べばよい。(4)式の右辺第2
項を(5)式として示す。
【0030】
【数5】
【0031】予測評価量演算部17においては、この(
5)式で表される予測の評価を行なうための予測評価量
が演算される。最大値探索部18は、長期予測フィルタ
における遅延時間dとゲインgを走査して、以下に示す
ように、予測評価量が最大(誤差電力が最小)となる遅
延時間dとゲインgを求める。これらの遅延時間dとゲ
インgが、前述のピッチ周期およびピッチ予測係数とし
て、各ピッチ分析フレーム(例えば、1音声フレームが
5ピッチ分析フレームを含む)毎に決定される(合成に
よる分析手法Analysis−by−Synthsi
s) 。
【0032】次に、図8は、上述の合成による分析手法
(Analysis−by−Synthsis)によっ
て抽出されるピッチ周期の時間特性を示すものである。 ここで、音声信号は、有声音部では周期的波形となるた
め、基本ピッチ周期は、時間的にある程度スムースな特
性を示すと考えられるが、上述の合成による分析手法(
Analysis−by−Synthsis)によって
抽出されるピッチ周期は、図8に示すように、基本ピッ
チ周期以外に、基本ピッチ周期の2倍周期、3倍周期等
も頻繁に選択され、スムースな特性とはならない。これ
は、一般に、図9に示されるように、(5)式の値が基
本ピッチ周期以外に、基本ピッチ周期の整数倍周期にお
いても極大値を有するためである。図9は、(5)式の
値のピッチ周期および時間特性を示すものである。図9
において1chのスケールは8msに対応する。図9に
も示されるように、無声音部においては、波形に周期性
がないため、分析されたピッチ周期の値はランダムに変
動する。したがって、ピッチ周期における伝送路エラー
に対しては、例え、誤り検出符号等の適用によって誤り
が検出されても補間(外挿)等の処理による誤りの訂正
は困難であるため、従来、ピッチ周期に対しては、音声
復号装置においては補間処理は行わず、専ら誤り訂正符
号等の訂正に頼っていた。
【0033】本発明の実施例においては、一定時間毎に
音声信号を分析したピッチ周期についての結果の、時間
的に連続した複数(所定の数)分の結果から(例えば、
1音声フレーム40msの区間において、8ms毎に5
回のピッチ分析を行う)、所定の時間内にピッチ周期が
連続して存在する範囲を、基本ピッチ周期および基本ピ
ッチ周期の整数倍周期の間を遷移することを許容(包含
)するように設け、この範囲の情報を音声復号装置側へ
補助情報として、従来の音声符号化情報と共に伝送する
。これにより、音声復号装置側では、ピッチ周期と同時
に伝送されてきた上記の範囲の情報とを比較して、この
ピッチ周期が、この範囲に収まるか否かを判定すること
により、ピッチ周期の情報の伝送路エラーが検出され得
る。そして、伝送路エラーが検出されたときには、ピッ
チ周期の情報を、上記の範囲内の適当な値、例えば、基
本ピッチ周期を含む(部分)範囲の中央値に修正する。
【0034】一般に、音声の有声音部における基本ピッ
チ周期の値は、時間と共に比較的緩やかに変動する。先
に述べた合成による分析手法(Analysis−by
−Synthsis)によって抽出される最適ピッチ周
期は、(5)式で示したように、入力ベクトルと各ピッ
チ周期におけるピッチベクトル間の相関の二乗値が最大
となる周期である。したがって、有声音区間においては
、その基本ピッチ周期以外に、2倍ピッチ周期、3倍ピ
ッチ周期等の基本周期の整数倍周期における相関も高く
なるため、最適ピッチ周期として、これらの値が選択さ
れることもあり、ピッチ周期の値は、基本ピッチ周期と
その整数倍ピッチ周期の間で大きく変動することがある
【0035】そこで、上記の範囲の情報としては、以下
に表1等を参照して例示するように、予め、基本ピッチ
周期および基本ピッチ周期の整数倍周期の部分にそれぞ
れ所定の幅の窓が存在するような(複数の範囲の組から
なる)範囲を、全ての基本ピッチ周期についてカバーす
るように、基本ピッチ周期の範囲をずらせて複数種類設
ける。例えば、ある基本ピッチ周期の範囲を30〜38
とすると、その中心周期34の2倍ピッチ68を中心と
した範囲64〜72、3倍ピッチ102を中心とした範
囲98〜106等を同じ組とする。これらの範囲の組に
それぞれ番号を付けておくことにすれば、この番号を上
記の補助情報として伝送すればよい。
【0036】ピッチ周期存在範囲の補助情報をNビット
、すなわち、ピッチ周期dの存在範囲を2N −1個の
窓Rk (k=0,1,・・・2N −1)に量子化す
る場合の各量子化窓は、次の式(6)〜(8)のように
なる。 mが奇数の場合 Rk :  nτk −(m−1)/2≦d≦nτk 
+(m−1)/2                 
                   (n=1,2
,・・・)  …(6)        τk =kT
+20+(m−1)/2              
              (k=0,1,・・・2
N −1)mが偶数の場合 Rk :  nτk −m/2+1≦d≦nτk +m
/2                       
             (n=1,2,・・・) 
 …(7)        τk =kT+20+m/
2+1                      
      (k=0,1,・・・2N −1)または
、 Rk :  nτk −m/2≦d≦nτk +m/2
−1                       
             (n=1,2,・・・) 
 …(8)        τk =kT+20+m/
2                        
    (k=0,1,・・・2N −1)ここで、T
は、隣合う範囲のシフトサンプル数、そして、mは、フ
レーム内ピッチ周期許容変動幅(すなわち、各窓の幅)
である。また、nτk −(m−1)/2は、ピッチ周
期の探索範囲の下限以上であり、nτk +(m−1)
/2は、ピッチ周期の探索範囲の上限以下であるように
定める。
【0037】前述のように、無声音部や有声/無声の過
渡部においては、ピッチの周期性が存在しないので、上
記のように設定した各範囲(の組)の何れにも収まらな
い。したがって、ピッチの周期性が存在せず設定した各
範囲(の組)の何れにも収まらない場合には、これを検
出して、このこともピッチ周期の情報の1つとして、復
号側へ伝送する。
【0038】図5は、(7)式による量子化窓の一部分
を示すものである。さらに、表1は、(7)式において
、ピッチ周期探索範囲を20〜147サンプルとし、m
=8(各窓の幅が8サンプル),T=4(隣の組の量子
化窓との重なりは4サンプル)とおいた場合の量子化窓
Rk の設定範囲(許容範囲)を示すものである。N=
5となることにより、k=0,1,・・・31となるが
、k=31は、上述のように、ピッチの周期性が存在せ
ず設定した各範囲(の組)の何れにも収まらない場合を
示す情報として使用している。図6には、表1の範囲の
一部分を図示する。
【0039】
【表1】
【0040】符号器側(音声符号化装置)では、例えば
、前述のように、1フレームを40msとして、1フレ
ームに5回、すなわち、8msのサブフレーム毎にピッ
チ分析を行い、各サブフレームについて最適と判断され
たピッチ周期の値をdi (i=0,1,2,3,4)
を1フレーム分求めて、それぞれに対応するピッチ予測
係数gi (i=0,1,2,3,4)の値、および、
LPC係数等のその他の音声符号化パラメータと共に復
号器側(音声復号装置)へ伝送する。ここで、上記のピ
ッチ分析としては、、前述の合成による分析手法(An
alysis−by−Synthsis)を用いる。す
なわち、前述の(5)式の値が最大とてるピッチ周期の
値を最適値とする。また、本発明によって、上記と同時
に、各フレーム内のピッチ周期の値di (i=0,1
,2,3,4)が全て収まるような各量子化窓Rk を
表1のk=0,1,・・・30の中から探索する。前述
のように、有声音部においては、基本ピッチ周期は、時
間的にある程度スムースな特性を示すと考えられるので
、連続する5サブフレームのピッチ周期は、基本ピッチ
周期の整数倍の間の遷移を除いて、大きな変化はしない
と考えられる。したがって、連続する5サブフレームの
ピッチ周期は、上記の各量子化窓Rk の何れかに収ま
ると考えられる。あるいは、上記のmおよびTの値を、
そのように選択すればよい。こうして、連続する5サブ
フレームのピッチ周期が全て収まる量子化窓Rk の番
号kが、このフレームの補助情報(5ビット)として、
上記のピッチ周期、および、その他の符号化情報と共に
、復号器側へ伝送される。
【0041】復号側(音声復号装置)では、符号化装置
側で上述のようにフレーム毎に付加されたピッチ周期の
存在範囲情報をもとに、フレーム内の各ピッチ周期の値
が指定された範囲(の組)内にあるか否かをチェックし
て、その範囲(の組)内にない場合には、受信したピッ
チ周期の情報に伝送路誤りがあったと見なして、ピッチ
周期の値を、その範囲内の値、例えば、基本ピッチ周期
の範囲の中央値に修正する。上記のチェックにおいて、
フレーム内の各ピッチ周期の値が指定された範囲(の組
)内にある場合は、受信したピッチ周期を、そのまま採
用する。また、無声音部のフレームに対応して、ピッチ
の周期性が存在せず設定した各範囲(の組)の何れにも
収まらないことを示す情報を受信したときには、元々ピ
ッチの周期性がないと考えられるため、ピッチ予測の効
果(ピッチ予測利得)は低い。したがって、この場合は
特に修復は行わず受信した値をそのまま採用する。こう
して、受信したピッチ周期の情報に伝送路誤りがあった
場合でも、ピッチ周期の値を、高々、指定された範囲(
の組)の範囲内で、送信した値に近い値に修復すること
ができる。
【0042】更に、上記の方式によれば、ピッチ周期存
在範囲を示す情報に対する伝送路誤りは重大な劣化を引
き起こすため、この情報に対しては、音声符号化装置側
でCRC等の誤り検出符号を付加して、音声復号装置側
では誤りの有無を調べ、誤りが検出された場合には、前
フレームのピッチ周期存在範囲を使用する等の補間(外
挿)処理を行う。
【0043】図4は、表1の量子化窓Rk を使用して
、上記の設定範囲(許容範囲)に関する情報を値kによ
って伝送する場合の、本発明による音声復号装置におけ
る制御フローを示すものである。図4において、ステッ
プ101においては、ピッチ周期値と共に受信した、上
記の範囲に関するnフレーム目の情報Rk (Rk (
n) ) のビットエラーを、例えば、CRCチェック
コードによって検証する。もし、誤りがあれば、ステッ
プ102からステップ103に移行して、上記の情報R
k (Rk (n) ) を、1つ前のフレーム(n−
1フレーム)において受信した範囲の情報(Rk (n
−1) ) に置き換えてステップ104に移行する。 誤りがなければ、ステップ102から直接ステップ10
4に移行する。ステップ104にては、kの値を31と
比較して、無声音部のフレームに対応して、ピッチの周
期性が存在せず、設定した各範囲(の組)の何れにも収
まらないことを示す情報か否かを判定する。ステップ1
04にて、ピッチの周期性が存在せず、設定した各範囲
(の組)の何れにも収まらないことを示す情報ではない
と判定されたときには、ステップ105に進んで、当該
フレーム中の複数のサブフレームを示す指標iを0と置
く。そして、ステップ106において、サブフレームi
のピッチ周期情報di が、上記の設定範囲(許容範囲
)Rk に収まるか否かを判定する。もし、収まらない
と判定されたならば、このピッチ周期情報di に伝送
路エラーが生じたと判断して、ステップ107にて、ピ
ッチ周期の値di を、上記の設定範囲(許容範囲)R
k に収まる値、例えば、基本ピッチ周期の範囲の中央
値に修正して、ステップ108に進む。ステップ106
にて、サブフレームiのピッチ周期情報di が、上記
の設定範囲(許容範囲)Rkに収まると判断されたとき
には、そのまま、ステップ108に進む。ステップ10
8では、サブフレームを示す指標iを更新する。こうし
て、以後、このフレーム内の全てのサブフレームi=0
〜4のピッチ周期情報di について、同様の処理を行
って、このフレームのピッチ周期情報の修復処理を終了
する。
【0044】
【発明の効果】以上説明したように、本発明によれば、
再生音声品質への影響の大きいピッチ周期情報における
伝送路誤りを、僅かの補助情報の付加によって修復する
ことができるため、伝送路誤りに強い音声符号化システ
ムが実現できる。
【図面の簡単な説明】
【図1】本発明による音声符号化装置の基本構成を示す
図である。
【図2】本発明による音声復号装置の基本構成を示す図
である。
【図3】本発明による音声復号装置の構成の1例を示す
図である。
【図4】表1の量子化窓Rk を使用して、ピッチ周期
の設定範囲(許容範囲)に関する情報を値kによって伝
送する場合の、本発明による音声復号装置における制御
フローを示すものである。
【図5】(7)式による量子化窓の一部分を示す図であ
る。
【図6】表1の範囲の一部分を示す図である。
【図7】長期予測分析を含む音声信号の予測符号化装置
の典型的な構成例を示す図である。
【図8】合成による分析手法(Analysis−by
−Synthsis)によって抽出されるピッチ周期の
時間特性を示す図である。
【図9】(5)式の値のピッチ周期および時間特性を示
す図である。
【符号の説明】
1…音声符号化手段 2…許容範囲情報発生手段 3…送信手段 4…受信手段 5…ピッチ周期情報修復手段 6…音声復号手段 7…ビット誤り検出手段 8…外挿手段 9…選択手段 11…音源 12…加算器 13…遅延回路 14…増幅器 15…線型予測フィルタ 16…減算器 17…予測評価量演算部 18…予測評価量の最大値探索部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】  音声信号を入力して、長期予測分析に
    より分析されたピッチ周期を含む、前記音声信号を符号
    化した情報を出力する音声符号化手段(1)と、前記ピ
    ッチ周期を入力して、該ピッチ周期の値を含む所定の幅
    を有する、ピッチ周期の値の許容範囲に関する情報を出
    力する許容範囲情報発生手段(2)とを有してなること
    を特徴とする音声符号化装置。
  2. 【請求項2】  前記ピッチ周期の値の許容範囲は、基
    本ピッチ周期を含む範囲、および、該基本ピッチ周期の
    整数倍のピッチ周期を含む範囲を含んでなる請求項1に
    記載の音声符号化装置。
  3. 【請求項3】  前記音声符号化手段(1)は、長期予
    測分析によってピッチの周期性が無い音声信号であるか
    否かを判定し、ピッチ周期性が無い音声信号であると判
    定された場合は、ピッチの周期性がないことを示す情報
    を、前記ピッチ周期の値の許容範囲に関する情報として
    出力する請求項1に記載の音声符号化装置。
  4. 【請求項4】  長期予測分析を行ってピッチ周期を含
    む音声符号化情報を出力し、且つ、該ピッチ周期の値を
    含む所定の幅を有する、ピッチ周期の値の許容範囲に関
    する情報を出力する音声符号化装置によって符号化され
    た、該ピッチ周期およびピッチ周期の値の許容範囲に関
    する情報を入力して、復号し、音声信号を再生する音声
    復号装置において、前記ピッチ周期およびピッチ周期の
    値の許容範囲に関する情報を入力して、該入力したピッ
    チ周期が、同時に入力したピッチ周期の値の許容範囲に
    関する情報が示す許容範囲に入るか否かを判定し、もし
    、許容範囲に入っていれば、上記の入力したままのピッ
    チ周期を出力し、もし、許容範囲に入っていなければ、
    該入力したピッチ周期の代わりに、該許容範囲内の所定
    の値をピッチ周期として出力するピッチ周期情報修復手
    段(5)と、該ピッチ周期情報修復手段(5)から出力
    される前記ピッチ周期、および、前記ピッチ周期以外の
    前記音声符号化情報を入力して、これらに基づいて音声
    信号を再生する音声復号手段(6)とを有してなること
    を特徴とする音声復号装置。
  5. 【請求項5】  前記ピッチ周期情報修復手段(5)は
    、前記長期予測分析によるピッチ周期性が無かったこと
    を示す情報を入力すると、前記ピッチ周期に対して修復
    処理は行わず、そのまま出力する請求項4に記載の音声
    復号装置。
  6. 【請求項6】  ピッチ周期の値の許容範囲に関する情
    報を入力して、該情報にビット誤りがあるか否かを検出
    するビット誤り検出手段(7)と、少なくとも前記情報
    に誤りがあったときには、時間的に近い過去に受信した
    ピッチ周期の値の許容範囲の値からの外挿、あるいは、
    直前に受信したピッチ周期の値の許容範囲の値を出力す
    る外挿手段(8)と、前記ビット誤り検出手段(7)の
    検出結果によって制御され、前記ピッチ周期の値の許容
    範囲に関する情報に誤りがあったときには、前記ビット
    誤りがあったピッチ周期の値の許容範囲に関する情報の
    代わりに、前記外挿手段(8)の出力を選択して前記ピ
    ッチ周期情報修復手段(5)に出力し、前記ピッチ周期
    の値の許容範囲に関する情報に誤りがなかったときには
    、受信したピッチ周期の値の許容範囲の値をそのまま前
    記ピッチ周期情報修復手段(5)に出力する選択手段(
    9)とを有してなり、該ピッチ周期情報修復手段(5)
    は、前記選択手段(9)から供給されたピッチ周期の値
    に基づいて、同時に受信したピッチ周期が該情報が示す
    許容範囲に入るか否かを判定する請求項5に記載の音声
    復号装置。
JP3026327A 1991-02-20 1991-02-20 音声符号化装置および音声復号装置 Withdrawn JPH04264600A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP3026327A JPH04264600A (ja) 1991-02-20 1991-02-20 音声符号化装置および音声復号装置
CA002061462A CA2061462C (en) 1991-02-20 1992-02-19 Speech signal coding and decoding system transmitting allowance range information
EP19920102831 EP0500094A3 (en) 1991-02-20 1992-02-20 Speech signal coding and decoding system with transmission of allowed pitch range information
US07/838,340 US5325461A (en) 1991-02-20 1992-02-20 Speech signal coding and decoding system transmitting allowance range information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3026327A JPH04264600A (ja) 1991-02-20 1991-02-20 音声符号化装置および音声復号装置

Publications (1)

Publication Number Publication Date
JPH04264600A true JPH04264600A (ja) 1992-09-21

Family

ID=12190325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3026327A Withdrawn JPH04264600A (ja) 1991-02-20 1991-02-20 音声符号化装置および音声復号装置

Country Status (4)

Country Link
US (1) US5325461A (ja)
EP (1) EP0500094A3 (ja)
JP (1) JPH04264600A (ja)
CA (1) CA2061462C (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009223326A (ja) * 1997-05-07 2009-10-01 Nokia Corp 音声符号化方法及び装置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1270438B (it) * 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce
US6463406B1 (en) * 1994-03-25 2002-10-08 Texas Instruments Incorporated Fractional pitch method
US5819213A (en) * 1996-01-31 1998-10-06 Kabushiki Kaisha Toshiba Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks
JPH10105195A (ja) * 1996-09-27 1998-04-24 Sony Corp ピッチ検出方法、音声信号符号化方法および装置
WO2001059764A1 (en) * 2000-02-10 2001-08-16 Koninklijke Philips Electronics N.V. Error correction method with pitch change detection
US7478042B2 (en) * 2000-11-30 2009-01-13 Panasonic Corporation Speech decoder that detects stationary noise signal regions
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
US8462026B2 (en) * 2009-11-13 2013-06-11 Ati Technologies Ulc Pulse code modulation conversion circuit and method
GB0920729D0 (en) * 2009-11-26 2010-01-13 Icera Inc Signal fading
JP5613781B2 (ja) * 2011-02-16 2014-10-29 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
US12011951B1 (en) * 2019-07-15 2024-06-18 Phoenix U.S.A. Inc. Scratchless decorative cover

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3676595A (en) * 1970-04-20 1972-07-11 Research Corp Voiced sound display
JPS6262399A (ja) * 1985-09-13 1987-03-19 株式会社日立製作所 音声高能率符号化方式
US4809334A (en) * 1987-07-09 1989-02-28 Communications Satellite Corporation Method for detection and correction of errors in speech pitch period estimates

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009223326A (ja) * 1997-05-07 2009-10-01 Nokia Corp 音声符号化方法及び装置

Also Published As

Publication number Publication date
EP0500094A2 (en) 1992-08-26
US5325461A (en) 1994-06-28
CA2061462A1 (en) 1992-08-21
EP0500094A3 (en) 1992-09-30
CA2061462C (en) 1996-04-30

Similar Documents

Publication Publication Date Title
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
US5729655A (en) Method and apparatus for speech compression using multi-mode code excited linear predictive coding
EP0459358B1 (en) Speech decoder
US5862518A (en) Speech decoder for decoding a speech signal using a bad frame masking unit for voiced frame and a bad frame masking unit for unvoiced frame
EP0409239A2 (en) Speech coding/decoding method
US6978235B1 (en) Speech coding apparatus and speech decoding apparatus
JP3565869B2 (ja) 伝送エラーの修正を伴う音声信号の復号方法
US7302387B2 (en) Modification of fixed codebook search in G.729 Annex E audio coding
JPH04264600A (ja) 音声符号化装置および音声復号装置
EP1339042B1 (en) Voice encoding method and apparatus
JPH01155400A (ja) 音声符号化方式
JP3416331B2 (ja) 音声復号化装置
JP2002268696A (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
EP0557940A2 (en) Speech coding system
US6973424B1 (en) Voice coder
JP3435310B2 (ja) 音声符号化方法および装置
JPH0612095A (ja) 音声復号化方法
US6856955B1 (en) Voice encoding/decoding device
JP3047761B2 (ja) 音声符号化装置
JP3085347B2 (ja) 音声の復号化方法およびその装置
JP3229784B2 (ja) 音声符号化復号化装置及び音声復号化装置
JP3350340B2 (ja) 音声符号化方法および音声復号化方法
JP2775533B2 (ja) 音声の長期予測装置
JP2817196B2 (ja) 音声符号化方式
JP3270146B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19980514