JP2002244700A - 音声符号化装置、音声符号化方法および記憶素子 - Google Patents

音声符号化装置、音声符号化方法および記憶素子

Info

Publication number
JP2002244700A
JP2002244700A JP2001036406A JP2001036406A JP2002244700A JP 2002244700 A JP2002244700 A JP 2002244700A JP 2001036406 A JP2001036406 A JP 2001036406A JP 2001036406 A JP2001036406 A JP 2001036406A JP 2002244700 A JP2002244700 A JP 2002244700A
Authority
JP
Japan
Prior art keywords
frame
subframe
excitation
encoding
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001036406A
Other languages
English (en)
Inventor
Atsushi Yamane
淳 山根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001036406A priority Critical patent/JP2002244700A/ja
Publication of JP2002244700A publication Critical patent/JP2002244700A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 背景雑音のない場合も、背景雑音が含まれた
場合も、音声を良好に符号化する音声符号化装置を提供
することを課題とする。 【解決手段】 サブフレーム判別手段107における判
別結果にしたがって、音源符号帳探索手段105で、A
−b−s音源符号帳探索手段202とスペクトル領域音
源符号帳探索手段203とのいずれかを使い分け、背景
雑音が多く含まれた音声の場合に周波数領域での音源符
号帳探索を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声符号化装置、
音声符号化方法および音声符号化方法のアルゴリズムを
記憶する記憶素子に関し、特に背景雑音の有無に影響さ
れない音声符号化装置、音声符号化方法および記憶素子
に関する。
【0002】
【従来の技術】近年、携帯電話、インターネット電話、
DSVDモデムなど、音声信号を低ビットレートで符号
化する音声符号化技術を用いたアプリケーションが広く
普及するにつれ、音声符号化技術の高品質化への要求が
高まっている。6kbps〜16kbpsにおける音声
符号化方式の主流は、CELP(符号励振線形予測符号
化方式:Code Excited Linear P
rediction codiug system)で
あり、CELPの概念を用いた方式が、上記さまざまな
アプリケーションや、ディジタル携帯電話などさまざま
な標準において利用されてきている。
【0003】CELPは、線形予測による音声の音源・
声道分離モデルを用い、声道情報を量子化し、さらに音
源情報をベクトル量子化することによって、低ビットレ
ート符号化を実現するものである。具体的には、まず、
入力音声を処理単位であるフレームに分割する。さら
に、フレームを解析し、声道情報に対応する音声のホル
マント成分を表現するホルマントパラメータを抽出して
量子化する。
【0004】音源情報の量子化は、フレームよりもさら
に短いサブフレームについて行われることが多く、さら
に、二種類の符号帳を用いて二段階の過程を経て行われ
ることが多い。この一段階目は、音声のピッチ情報を表
す適応符号帳を用いた適応符号帳探索である。適応符号
帳は、直前のサブフレームまでの音源情報をピッチ長さ
分、繰り返してサブフレーム長にしたベクトル(適応符
号ベクトル)を所定数のピッチ数個、生成することによ
ってサブフレームごとに適応的に構成される。さらに、
各適応符号ベクトルを前記量子化されたホルマントパラ
メータによって構成される声道フィルタに通し、合成ベ
クトルを生成する。次に、前記合成ベクトルと入力サブ
フレームとの距離を測定し、最も短い距離を与えるもの
として最適な適応符号ベクトル、すなわち最適なピッチ
を決定する。このように、合成音を用いて分析する手法
は「合成による分析(A−b−s)法」と呼ばれる。
【0005】二段階目は、音源符号帳(雑音符号帳と呼
ぶこともある)と呼ばれる所定数の固定的なベクトル
(音源符号ベクトル)によって構成される固定的な符号
帳を用いた音源符号帳探索(雑音符号帳探索と呼ぶこと
もある)である。音源符号帳には、学習によって構成さ
れる学習符号帳、乱数によって構成するランダム符号
帳、数本のパルスを用いて代数的に構成する代数的符号
帳、あるいはそれらを部分的に組み合わせたものといっ
た種類がある。音源符号帳探索にも、A−b−s法が一
般に用いられる。A−b−s法では、まず、前記サブフ
レームベクトルから、前記決定された最適な適応符号ベ
クトルを声道フィルタに通した合成ベクトルを差し引く
ことにより、音源符号帳探索の目標信号を生成する。次
に、各音源符号ベクトルを、適応符号ベクトルと同様
に、前記声道フィルタに通し、合成ベクトルを生成す
る。さらに、前記音源符号帳探索の目標信号と前記合成
ベクトルとの距離を測定し、最も短い距離を与えるもの
として最適な音源符号ベクトルを決定する。
【0006】上記のように、CELPは、音声の音源・
声道モデルを用いるため、人間の音声を効率よく符号化
することのできる方式ではあるが、人間の音声以外の音
楽信号や背景雑音信号などに弱いという欠点を持つ。し
かし、上記携帯電話等、音声符号化を用いたアプリケー
ションでは人間の実環境において利用される場合が多
く、特に背景雑音への対策が望まれている。
【0007】CELPの背景雑音への対策としては、
(1)雑音抑圧を利用して入力信号の雑音レベルを低減
する方式、(2)雑音をCELP符号化することにより
不自然さを低減する方式、(3)入力音声の性質にした
がって音源符号帳を切り替える方式、等が提案されてい
る。
【0008】(1)の例としては、文献(S.F.Bo
ll,“Suppressionof Acousti
c Noise in Speech Using S
pectral Subtraction”,IEEE
Trans.0n ASSP,Vol.27,No.
2,pp.113〜120(1979))において述べ
られているSS(Spectrum Subtract
ion)法や、文献(J.D.Gibson,B.Ko
o,S.D.Gray,“Filtering of
Colored Noise for Speech
Enhancement and Coding”,I
EEE Trans.on SP,Vol.39,N
o.8,pp.1732〜1741(1991))にお
いて述べられているカルマンフィルタ法などを用いた雑
音抑圧法を用いるものがあげられる。これらの方式は、
ある程度雑音のレベルを低減することには有効である
が、雑音を完全に除去することはできないため、依然雑
音をCELPで符号化することによる不自然さを除くこ
とはできない。
【0009】(2)の例としては、特開平11−242
499号公報に記載されているSS法を用いて音声と背
景雑音を分離して符号化する方式や、文献(大室、間
野、“低ビットレート音声符号化における背景雑音付加
音声の品質向上”、電子情報通信学会技術研究報告、S
P98〜145(1999))に述べられている、背景
雑音レベルを推定し、復号後の音声に積極的に背景雑昔
を加えることによって背景雑音をCELPで符号化する
ことによる不自然さを低減する方式、および文献(岡
崎、高橋、“ポストノイズスムーザーによる低レートC
ELPの雑音区間品質の改善”、日本音響学会講演論文
集、pp.237〜238(1998.3))に述べら
れている、再生音声をスペクトル領域でスムージングし
て不自然さを低減する方式、等が提案されている。これ
らの方法は、背景雑音をCELP符号化することによる
不快な音は大幅に低減され、ある程度不自然さは低減さ
れるが、背景雑音をランダム雑音で近似するため、実環
境における背景雑音を変質させてしまい、場所の同定な
ど背景雑音に意味のある場合、必要な情報が伝わらない
といった問題が生じる。
【0010】(3)としては、特開平8−123493
号公報に記載されている音源符号帳として、有声音に有
効なマルチパルス型の符号帳と、雑音や無声音等に有効
なランダム雑音符号帳とを備え、入力音声の性質にした
がって切り替えたり、混合比率を変化させたりする方式
があげられる。CELPでは、上記のように、一般にA
−b−s法を用いた符号帳探索を行う。A−b−s法
は、合成音と目標となる音声とを時間軸で比較するもの
である。SS法では、入力信号の離散フーリエ変換値の
強度から、推定した雑音スペクトルのパワーを差し引
き、位相情報は入力信号のものをそのまま用いることに
背景雑音を除去するものであり、雑音成分の特徴量とし
ては、時間軸における類似度よりも、スペクトルの強度
が重要であると考えることができる。
【0011】
【発明が解決しようとする課題】上述のごとく、学習済
みの音源符号帳を用いるCELPは、背景雑音や背景音
楽を含まない人間の音声を効率よく符号化するには適し
た方法であるが、背景に雑音や音楽が加わった場合には
品質劣化を生じるという問題があった。また、学習をし
ないガウス雑音からなる音源符号帳を用いた場合は、背
景雑音や背景音楽による劣化がないものの、雑音のない
環境下での音声符号化に対しては品質がよくないという
問題があった。本発明は、比較的簡単な方法でこの問題
を解決して、入力音声の性質にしたがって音源符号帳を
切り替える方式を用い、音源符号帳探索において、背景
雑音レベルが低い場合には学習済みの音源符号帳を用
い、背景雑音レベルが高い場合には時間軸のA−b−s
法を用いずスペクトル領域において探索を行うことによ
り、背景雑音のない場合も、背景雑音が含まれた場合
も、音声を良好に符号化する音声符号化方法およびその
方法を実現する音声符号化装置を提供することを課題と
するものである。
【0012】
【課題を解決するための手段】上記課題を達成するた
め、本発明は、ディジタル音声信号の符号化を実行する
音声符号化装置において、前記ディジタル音声信号を複
数のフレームに分割するフレーム分割手段と、前記フレ
ームをフレームよりさらに短いサブフレームに分割する
サブフレーム分割手段と、前記フレームから前記フレー
ムのホルマントパラメータを抽出して符号化するホルマ
ントパラメータ抽出手段と、前記サブフレームと前記フ
レームのホルマントパラメータとを用いて前記サブフレ
ームのピッチ周期を抽出し符号化する適応符号帳探索手
段と、前記サブフレームと前記フレームのホルマントパ
ラメータと前記ピッチ周期と複数の音源符号ベクトルか
らなる音源符号帳とを用いて、前記サブフレームの雑音
源成分を抽出し符号化する音源符号帳探索手段と、前記
サブフレームの性質を判別するサブフレーム判別手段と
を備え、さらに、前記音源符号帳探索手段に、合成によ
る分析法を用いて雑音源成分を抽出し符号化する「合成
による分析法(A−b−s)」音源符号帳探索手段と、
スペクトル領域で音源符号帳探索成分を抽出し符号化す
るスペクトル領域音源符号帳探索手段とを備え、前記サ
ブフレーム判別手段における判別結果にしたがって、前
記音源符号帳探索手段において、A−b−s音源符号帳
探索手段とスペクトル領域音源符号帳探索手段とのいず
れかを使い分けることを特徴とする。これにより、背景
雑音等を判別することによって音源符号帳探索手段を切
り替え、背景雑音のない場合も、背景雑音が含まれた場
合も、音声を良好に符号化する音声符号化装置を提供す
ることができる。
【0013】また、ディジタル音声信号の符号化を実行
する際の音声符号化方法において、ディジタル音声信号
をフレームに分割するフレーム分割工程と、前記フレー
ムをフレームよりさらに短いサブフレームに分割するサ
ブフレーム分割工程と、前記フレームから前記フレーム
のホルマントパラメータを抽出し符号化するホルマント
パラメータ抽出工程と、前記サブフレームと、前記フレ
ームのホルマントパラメータとを用いて前記サブフレー
ムのピッチ周期を抽出し符号化する適応符号帳探索工程
と、前記サブフレームと、前記フレームのホルマントパ
ラメータと、前記ピッチ周期と、複数の音源符号ベクト
ルからなる音源符号帳とを用いて前記サブフレームの雑
音源成分を抽出し符号化する音源符号帳探索工程と、前
記サブフレームの性質を判別するサブフレーム判別工程
とを備え、さらに、前記音源符号帳探索工程が、合成に
よる分析法を用いて雑音源成分を抽出し符号化するA−
b−s音源符号帳探索工程と、スペクトル領域で音源符
号帳探索成分を抽出し符号化するスペクトル領域音源符
号帳探索工程とを備え、前記サブフレーム判別工程にお
ける判別結果にしたがって、前記音源符号帳探索工程に
おいて、前記A−b−s音源符号帳探索工程と前記スペ
クトル領域音源符号帳探索工程とのいずれかを使い分け
ることを特徴とする。これにより、背景雑音等を判別す
ることによって音源符号帳探索工程を切り替え、背景雑
音のない場合も、背景雑音が含まれた場合も、音声を良
好に符号化する音声符号化方法を提供することができ
る。
【0014】
【発明の実施の形態】以下、本発明にかかる音声符号化
装置、音声符号化方法を添付図面を参照にして詳細に説
明する。
【0015】図1に、本発明の請求項1に基づく音声符
号化装置の一実施の形態のブロック図を示す。この音声
符号化装置は、CELPに基づいてディジタル音声入力
信号を符号化する音声符号化装置であって、フレーム分
割手段101と、サブフレーム分割手段102と、ホル
マントパラメータ抽出手段103と、適応符号帳探索手
段104と、音源符号帳探索手段105と、利得量子化
手段(利得符号帳探索手段)106と、サブフレーム判
別手段107とを備える。さらに、音源符号帳探索手段
105は、目標信号算出手段201と、A−b−s音源
符号帳探索手段202と、スペクトル領域音源符号帳探
索手段203とを備える。
【0016】ディジタル音声信号は、フレーム分割手段
101において、フレームと呼ぶ処理単位に分割され
る。フレーム長としては、20〜30msといった値が
あげられる。フレーム分割の前後に、高域通過フィルタ
を通すことにより、直流成分を除去してもよい。さら
に、前記フレームは、サブフレーム分割手段102にお
いて、サブフレームと呼ぶ処理単位に分割される。1フ
レームあたりのサブフレーム数としては、2〜6といっ
た値があげられる。
【0017】さらに、前記フレームは、ホルマントパラ
メータ抽出手段103において、解析され、前記フレー
ムのホルマントパラメータが抽出される。ホルマントパ
ラメータとしては、LPC(Linear Predi
ction Coding、線形予測)係数、LSP
(Line Spectrum Pair、線スペクト
ル対)、LSF(Line Spectrum Fre
quency、線スペクトル周波数)、LPCケプスト
ラム係数、反射係数があげられる。ホルマントパラメー
タの抽出手法としては、線形予測解析があげられる。線
形予測解析の手法としては、フレームの自己相関関数を
算出し、Levinson−Durbinの再帰解法に
よってLPC係数を算出する手法があげられる。前記自
己相関関数を算出する前に、フレームにハミング窓ある
いはハニング窓などの窓関数を適用してもよい。
【0018】次に、前記フレームのホルマントパラメー
タは量子化され、伝送あるいは蓄積される。前記フレー
ムのホルマントパラメータの量子化手法としては、スカ
ラ量子化、ベクトル量子化、多段ベクトル量子化、分割
ベクトル量子化、予測量子化などがあげられる。ホルマ
ントパラメータを量子化する際には、LSPあるいはL
SFといった量子化効率の良いパラメータを用いること
が好ましい。
【0019】次に、前記量子化された前記フレームのホ
ルマントパラメータを用いて、前記サブフレームのホル
マントパラメータが算出される。前記サブフレームのホ
ルマントパラメータ算出手法としては、現在および過去
の前記量子化された前記フレームのホルマントパラメー
タから補間によって求めるという手法があげられる。前
記補間手法としては、線形補間、二次補間があげられ
る。
【0020】次に、適応符号帳探索手段104におい
て、各前記サブフレームに対して、サブフレームのピッ
チ周期成分の抽出に相当する適応符号帳探索が行われ
る。この適応符号帳探索においては、あらかじめ所定数
のピッチ候補を用意しておく。ピッチ候補には、サンプ
リング単位の整数倍の整数ピッチと、非整数ピッチとが
ある。このピッチ候補のすべてに対して、以下の処理を
行う。
【0021】まず、適応符号ベクトルの生成が行われ
る。適応符号ベクトルは、直前のサブフレームまでの音
源ベクトルからピッチ長分を切り出し、サブフレーム長
になるまで繰り返して並べることによって生成される。
次に、前記適応符号ベクトルと前記サブフレームのホル
マントパラメータとを用いることにより、合成音声ベク
トルが生成される。合成音声ベクトルの生成手法として
は、前記適応符号ベクトルに前記サブフレームのホルマ
ントパラメータによって構成された線形フィルタを適用
することによって行う手法があげられる。
【0022】次に、前記合成音声ベクトルが、任意の利
得を乗じた場合に、前記サブフレームに対して最も近く
なる最短距離が算出される。前記最短距離の算出におい
ては、聴覚的な重み付けを行うことにより、聴覚的な誤
差が最小になるように行う手法を導入してもよい。以上
の処理を、前記ピッチ候補内のすべてのピッチに対して
行い、前記最短距離が最も小さい適応符号ベクトルおよ
びピッチ周期を、当該サブフレームの適応符号ベクトル
およびピッチ周期とする。当該サブフレームのピッチ周
期に付与された符号は、伝送あるいは蓄積される。
【0023】さらに、前記サブフレーム判別手段107
において、前記サブフレームの性質の判別を行う。本実
施の形態においては、背景雑音の含まれる度合いの判別
を行う。背景雑音の含まれる度合いの判別を行う手法と
しては、前記サブフレームの自己相関関数を計算し、0
次の自己相関関数と0次を除いた中でもっとも値の大き
な自己相関関数との比が所定の値以下であり、0次の自
己相関関数(すなわち前記サブフレームの強度)の値が
所定の値以上である場合に、背景雑音が多く含まれると
判別する手法があげられる。
【0024】さらに、前記音源符号帳探索手段105に
おいて、複数の音源符号ベクトルによって構成される音
源符号帳を用いた雑音源成分の抽出および符号化が行わ
れる。音源符号帳としては、ランダム符号帳、Alge
braic(代数学的)符号帳に代表される複数の少数
のパルスによって構成される符号帳、学習によって構成
される学習符号帳などがあげられる。
【0025】まず、前記目標信号算出手段201におい
て、前記当該サブフレームの適応符号ベクトルと前記サ
ブフレームのホルマントパラメータとによって合成され
る合成音声ベクトルを、前記サブフレームから差し引く
ことにより、雑音源探索の目標信号ベクトルが生成され
る。
【0026】次に、前記サブフレーム判別手段107に
おける判別結果に基づき、前記スペクトル領域音源符号
帳探索手段203と前記A−b−s音源符号帳探索手段
202とのどちらで符号帳探索を行うかが決定される。
背景雑音が多く含まれると判別された場合は、前記目標
信号ベクトルは、前記スペクトル領域音源符号帳探索手
段203に送られて、符号帳探索が行われる。背景雑音
が多く含まれないと判別された場合は、前記目標信号ベ
クトルは、前記A−b−s音源符号帳探索手段202に
送られ、符号帳探索が行われる。
【0027】前記A−b−s音源符号帳探索手段202
においては、まず、前記音源符号ベクトルに対して、前
記適応符号帳探索手段104における場合と同様の距離
計算を行い、各音源符号ベクトルの合成音声ベクトル
が、任意の利得を乗じた場合に前記目標信号ベクトルに
最も近くなる最短距離が計算される。この場合に、前記
音源符号ベクトルの合成音声ベクトルを前記適応符号ベ
クトルの合成音声ベクトルに対して直交化してから距離
計算を行ってもよい。
【0028】次に、前記最短距離が最も小さくなる前記
音源符号ベクトルが決定される。また、前記スペクトル
領域音源符号帳探索手段203においては、まず、前記
適応符号帳探索手段104および前記A−b−s音源符
号帳探索手段202における場合と同様に、前記音源符
号帳に含まれるすべての前記音源符号ベクトルの合成音
声ベクトルが計算される。さらに、前記合成音声ベクト
ルおよび前記目標信号を周波数領域に変換する。周波数
領域への変換手法としては、離散フーリエ変換、離散コ
サイン変換、ウェーブレット変換があげられるが、この
限りではない。
【0029】さらに、周波数領域における前記目標信号
と前記合成音声ベクトルとの類似度が計算される。この
類似度としては、双方のベクトルを正規化した場合の距
離の小ささや、人間の聴覚特性を反映したマスキング周
波数を用いて重み付けした距離の小ささがあげられる
が、その限りではない。次に、前記類似度が最も大きく
なる前記音源符号ベクトルが決定される。ここで決定さ
れた音源符号ベクトルに付与された符号は、伝送あるい
は蓄積される。
【0030】さらに、利得符号化手段106において、
利得成分が符号化される。利得成分の抽出手法として
は、適応符号ベクトルの利得成分および雑音符号ベクト
ルの利得成分を別個に量子化するスカラ量子化と、両者
を同時に最適化するように量子化するベクトル量子化と
があげられる。ここで量子化された利得成分は、伝送あ
るいは蓄積される。さらに、本発明の音声符号化装置に
おいて、背景雑音が多く含まれると判別された場合に、
適応符号帳のビット数を削減したり、適応符号帳探索を
行わなかったり、音源符号ベクトルを切り替えたりする
など、入力サブフレームの性質に応じた符号帳構成の適
応的な切り替えを行ってもよい。以上、本発明の音声符
号化装置について述べたが、この音声符号化装置で用い
られる音声符号化方法およびこの音声符号化方法のアル
ゴリズムを記憶するコンピュータによって読取り可能な
記憶素子をも本発明の対象とするものである。
【0031】
【発明の効果】以上説明したように本発明の請求項1の
発明は、音声符号化装置において、サブフレーム判別手
段における判別結果にしたがって、音源符号帳探索手段
で、A−b−s音源符号帳探索手段とスペクトル領域音
源符号帳探索手段とのいずれかを使い分け、背景雑音が
多く含まれた音声の場合に、周波数領域での音源符号帳
探索を行うことにより、背景雑音を含んだ音声を良好に
符号化することのできる音声符号化装置を与えることが
できる。
【0032】本発明の請求項2の発明は、サブフレーム
判別手段でサブフレームの背景雑音レベルを推定してサ
ブフレームの判別に用いることで、より簡単な構成で目
的の音声符号化装置を実現することができる。
【0033】本発明の請求項3の発明は、スペクトル領
域音源符号帳探索手段で、入力目標信号と音声符号ベク
トルとを周波数領域に変換し、周波数スペクトルでの類
似度によって最適な音源符号ベクトルを決定するので、
より簡単な構成で目的の音声符号化装置を実現すること
ができる。
【0034】本発明の請求項4の発明は、音声符号化装
置において、サブフレーム判別工程における判別結果に
したがって、音源符号帳探索工程で、A−b−s音源符
号帳探索工程とスペクトル領域音源符号帳探索工程との
いずれかを使い分け、背景雑音が多く含まれた音声の場
合に、周波数領域での音源符号帳探索を行うことによ
り、背景雑音を含んだ音声を良好に符号化することので
きる音声符号化方法を実現することができる。
【0035】本発明の請求項5の発明は、サブフレーム
判別工程でサブフレームの背景雑音レベルを推定してサ
ブフレームの判別に用いることで、より簡単な構成で目
的の音声符号化装置を実現することができる。
【0036】本発明の請求項6の発明は、スペクトル領
域音源符号帳探索工程で、入力目標信号と音声符号ベク
トルとを周波数領域に変換し、周波数スペクトルでの類
似度によって最適な音源符号ベクトルを決定するので、
より簡単な構成で目的の音声符号化方法を実現すること
ができる。
【0037】本発明の請求項7の発明は、請求項4ない
し請求項6のいずれかの音声符号化方法のアルゴリズム
を、コンピュータによって読取り可能な記憶素子に記憶
するので、これらの方法を容易にコンピュータ上に実装
することができる。
【図面の簡単な説明】
【図1】本発明の音声符号化装置のブロック図。
【符号の説明】
101 フレーム分割手段 102 サブフレーム分割手段 103 ホルマントパラメータ抽出手段 104 適応符号帳探索手段 105 音源符号帳探索手段 106 利得量子化手段(利得符号帳探索手段) 107 サブフレーム判別手段 201 目標信号算出手段 202 A−b−s音源符号帳探索手段 203 スペクトル領域音源符号帳探索手段

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 ディジタル音声信号の符号化を実行する
    音声符号化装置において、 前記ディジタル音声信号を複数のフレームに分割するフ
    レーム分割手段と、 前記フレームをフレームよりさらに短いサブフレームに
    分割するサブフレーム分割手段と、 前記フレームから前記フレームのホルマントパラメータ
    を抽出して符号化するホルマントパラメータ抽出手段
    と、 前記サブフレームと前記フレームのホルマントパラメー
    タとを用いて前記サブフレームのピッチ周期を抽出し符
    号化する適応符号帳探索手段と、 前記サブフレームと前記フレームのホルマントパラメー
    タと前記ピッチ周期と複数の音源符号ベクトルからなる
    音源符号帳とを用いて、前記サブフレームの雑音源成分
    を抽出し符号化する音源符号帳探索手段と、 前記サブフレームの性質を判別するサブフレーム判別手
    段とを備え、 さらに、前記音源符号帳探索手段に、合成による分析法
    を用いて雑音源成分を抽出し符号化する「合成による分
    析法(A−b−s)」音源符号帳探索手段と、スペクト
    ル領域で音源符号帳探索成分を抽出し符号化するスペク
    トル領域音源符号帳探索手段とを備え、 前記サブフレーム判別手段における判別結果にしたがっ
    て、前記音源符号帳探索手段において、A−b−s音源
    符号帳探索手段とスペクトル領域音源符号帳探索手段と
    のいずれかを使い分けることを特徴とする音声符号化装
    置。
  2. 【請求項2】 前記サブフレーム判別手段は、前記サブ
    フレームの背景雑音レベルを推定してサブフレームの判
    別に用いることを特徴とする請求項1に記載の音声符号
    化装置。
  3. 【請求項3】 前記スペクトル領域音源符号帳探索手段
    は、入力目標信号と音声符号ベクトルとを周波数領域に
    変換し、周波数スペクトルでの類似度によって最適な音
    源符号ベクトルを決定することを特徴とする請求項1ま
    たは請求項2に記載の音声符号化装置。
  4. 【請求項4】 ディジタル音声信号の符号化実行する際
    の音声符号化方法において、 ディジタル音声信号をフレームに分割するフレーム分割
    工程と、 前記フレームをフレームよりさらに短いサブフレームに
    分割するサブフレーム分割工程と、 前記フレームから前記フレームのホルマントパラメータ
    を抽出し符号化するホルマントパラメータ抽出工程と、 前記サブフレームと、前記フレームのホルマントパラメ
    ータとを用いて前記サブフレームのピッチ周期を抽出し
    符号化する適応符号帳探索工程と、 前記サブフレームと、前記フレームのホルマントパラメ
    ータと、前記ピッチ周期と、複数の音源符号ベクトルか
    らなる音源符号帳とを用いて前記サブフレームの雑音源
    成分を抽出し符号化する音源符号帳探索工程と、 前記サブフレームの性質を判別するサブフレーム判別工
    程とを備え、 さらに、前記音源符号帳探索工程が、合成による分析法
    を用いて雑音源成分を抽出し符号化するA−b−s音源
    符号帳探索工程と、スペクトル領域で音源符号帳探索成
    分を抽出し符号化するスペクトル領域音源符号帳探索工
    程とを備え、 前記サブフレーム判別工程における判別結果にしたがっ
    て、前記音源符号帳探索工程において、前記A−b−s
    音源符号帳探索工程と前記スペクトル領域音源符号帳探
    索工程とのいずれかを使い分けることを特徴とする音声
    符号化方法。
  5. 【請求項5】 前記サブフレーム判別工程は、前記サブ
    フレームの背景雑音レベルを推定して前記サブフレーム
    の判別に用いることを特徴とする請求項4に記載の音声
    符号化方法。
  6. 【請求項6】 前記スペクトル領域音源符号帳探索工程
    は、入力目標信号と符号ベクトルとを周波数領域に変換
    し、周波数スペクトルの類似度によって最適な音源符号
    ベクトルを決定することを特徴とする請求項4または請
    求項5に記載の音声符号化方法。
  7. 【請求項7】 コンピュータによって読取り可能な記憶
    素子において、請求項4ないし請求項6のいずれかに記
    載の音声符号化方法に基づくアルゴリズムを記憶するこ
    とを特徴とする記憶素子。
JP2001036406A 2001-02-14 2001-02-14 音声符号化装置、音声符号化方法および記憶素子 Pending JP2002244700A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001036406A JP2002244700A (ja) 2001-02-14 2001-02-14 音声符号化装置、音声符号化方法および記憶素子

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001036406A JP2002244700A (ja) 2001-02-14 2001-02-14 音声符号化装置、音声符号化方法および記憶素子

Publications (1)

Publication Number Publication Date
JP2002244700A true JP2002244700A (ja) 2002-08-30

Family

ID=18899685

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001036406A Pending JP2002244700A (ja) 2001-02-14 2001-02-14 音声符号化装置、音声符号化方法および記憶素子

Country Status (1)

Country Link
JP (1) JP2002244700A (ja)

Similar Documents

Publication Publication Date Title
Kleijn Encoding speech using prototype waveforms
RU2389085C2 (ru) Способы и устройства для введения низкочастотных предыскажений в ходе сжатия звука на основе acelp/tcx
EP0878790A1 (en) Voice coding system and method
CN105825861B (zh) 确定加权函数的设备和方法以及量化设备和方法
EP0745971A2 (en) Pitch lag estimation system using linear predictive coding residual
JPH08123495A (ja) 広帯域音声復元装置
JPH1055199A (ja) 音声符号化並びに復号化方法及びその装置
JP2002140099A (ja) 音声復号化装置
JP3531780B2 (ja) 音声符号化方法および復号化方法
US5937374A (en) System and method for improved pitch estimation which performs first formant energy removal for a frame using coefficients from a prior frame
KR0155798B1 (ko) 음성신호 부호화 및 복호화 방법
JP3598111B2 (ja) 広帯域音声復元装置
JP2002244700A (ja) 音声符号化装置、音声符号化方法および記憶素子
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
KR20100006491A (ko) 무성음 부호화 및 복호화 방법 및 장치
JP2853170B2 (ja) 音声符号化復号化方式
JP4447546B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3770901B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3748081B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JPH08211895A (ja) ピッチラグを評価するためのシステムおよび方法、ならびに音声符号化装置および方法
JP3560964B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JP3676801B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JPH02160300A (ja) 音声符号化方式
JP3598112B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3636327B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置