WO2006046546A1

WO2006046546A1 - 音声符号化装置および音声符号化方法

Info

Publication number: WO2006046546A1
Application number: PCT/JP2005/019578
Authority: WO
Inventors: Masahiro Oshikiri
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2004-10-26
Filing date: 2005-10-25
Publication date: 2006-05-04
Also published as: KR20070068424A; BRPI0517513A; EP1793372A1; CN101061533A; ATE537536T1; EP1793372B1; JP5100124B2; EP1793372A4; JPWO2006046546A1; US20080065373A1; CN101061533B; US8326606B2

Abstract

　遅延量を低遅延に抑え、かつ、接続歪を緩和することができる音声符号化装置。この装置では、長分析部（２１）において、窓掛け部（２１１）が、分析長Ｍ１の長分析フレーム信号に対して分析窓を乗じ、この分析窓を乗じた信号をＭＤＣＴ部（２１２）に出力し、ＭＤＣＴ部（２１２）が、入力された信号にＭＤＣＴを施して長分析フレームの変換係数を得て変換係数符号化部（３０）に出力する。一方、短分析部（２２）では、窓掛け部（２２１）が、分析長Ｍ２（Ｍ２＜Ｍ１）の短分析フレーム信号に対して分析窓を乗じ、この分析窓を乗じた信号をＭＤＣＴ部（２２２）に出力し、ＭＤＣＴ部（２２２）が、入力された信号にＭＤＣＴを施して短分析フレームの変換係数を得て変換係数符号化部（３０）に出力する。変換係数符号化部（３０）は、これらの変換係数を符号化して出力する。

Description

明細書

音声符号化装置および音声符号化方法

技術分野

[0001] 本発明は、音声符号化装置および音声符号化方法に関する。

背景技術

[0002] 音声符号化にお!ヽて、時間信号を周波数領域に変換し変換係数を符号ィ匕する変換符号化は、時間信号に含まれる冗長性を効率的に除去できる。また、変換符号ィ匕では、周波数領域で表される人間の聴覚特性を利用することにより、低ビットレートにしても量子化歪が知覚され難い符号ィ匕を実現することが可能である。

[0003] 近年の変換符号化には、重ね合わせ直交変換 (LOT; Lapped Orthogonal Transfer m)と呼ばれる変換技術が利用されることが多い。これは、ブロック内だけの直交性だけでなく、隣り合うブロックとの直交性を考慮した直交基底に基づき変換を行うものであり、その代表的な手法として MDCT (Modified Discrete Cosine Transform)が挙げられる。 MDCTでは現分析フレームとその前後の分析フレームとを重ね合わせるようにして分析フレームを配置し分析を行う。この際、変換後の係数のうち、分析長の半分の係数のみを符号ィ匕の対象とすればよいため、 MDCTを用いることにより効率的な符号ィ匕が行える。また、合成時には現フレームと隣接するフレームとを重ね合わせ加算するため、フレーム毎に異なる量子化歪が発生する状況においてもフレーム境界での不連続が発生しにくヽと、う特徴がある。

[0004] 通常、 MDCTによる分析 Z合成を行う際には窓関数である分析窓および合成窓をそれぞれ対象信号に乗じる。このとき用いる分析窓/合成窓は、隣接フレームとの重ね合わせに位置する部分が傾斜 (スロープ)して、る。この重ね合わせ区間の長さ（つまり、スロープの長さ）と入力フレームのバッファリングに必要な遅延力 MDCT分析 Z合成により発生する遅延の長さに相当する。双方向通信においてこの遅延が大きくなると、通信相手端末からのレスポンスが自端末に届くまでに時間が力かってしまい、円滑な会話が成り立たなくなる。そのため、遅延はできるだけ短いことが望ましい [0005] 以下、従来の MDCTについて説明する。

[0006] MDCTに使用される分析窓 Z合成窓は、式（1)で表される条件を満たす場合に完全再構成 (量子化歪がない前提で変換による歪が 0になる)を実現する。

(0 · ^ ( + ^ + ) - ( + N/2) = 1

(0≤ / < N) 式（1)の条件を満たす代表的な窓として、非特許文献 1では、式 (2)で表される sin 窓が提案されている。また、この sin窓を図示すると図 1のようになる。このような sin窓を用いる場合、 sin窓のスペクトル特性はサイドローブが十分に減衰されるため、精度よくスペクトルを分析することが可能である。

また、非特許文献 2では、式（1)の条件を満たす窓として式 (3)で表される窓を用いて MDCT分析 Z合成を行う方法が提案されている。ここで、 Nは分析窓の長さ、 Lは重ね合わせ区間の長さを示している。また、式（3)で表される窓を図示すると図 2のようになる。このような窓を用いた場合、重ね合わせ区間が Lとなるため、この窓による遅延は Lと表される。よって、重ね合わせ区間 Lを短く設定することにより遅延の発生を抑制することが可能になる。

( 3 )

非特許文献 1 :守谷健弘著、「音声符号化」、（社)電子情報通信学会、 1998年 10月 20 日、 pp.36- 38

非特許文献 2 : M. Iwadare, et al, "A 128 kb/s Hi-Fi Audio CODEC Based on Adap tive Transform Coding with Adaptive Block Size MDCT," IEEE Journal on Selected Areas in Communications, Vol. 10, No.l, pp.138—丄 44, Jan. 1992.

発明の開示

発明が解決しょうとする課題

[0009] 式（2)で表される sin窓を用いると、図 1に示すように、隣接する分析フレームの重ね合わせ区間が分析フレームの 1Z2の長さになる。この例では、分析フレーム長が N であるので、重ね合わせ区間は NZ2となる。よって、合成側では、 NZ2〜N— 1に位置する信号を合成するには次の分析フレームの情報が得られなければ信号を合成することができない。つまり、（3NZ2)— 1に位置するサンプル値が得られるまで次の分析フレームで MDCT分析を行うことができず、（3NZ2)— 1の位置のサンプルが得られて初めて次の分析フレームで MDCT分析が行われ、その分析フレームの変換係数を用いて NZ2〜N—1の信号を合成することが可能になる。従って、 sin 窓を用いる場合には、 NZ2の長さの遅延が発生することになる。

[0010] 一方、式（3)で表される窓を用いると、重ね合わせ区間 Lが短いためにフレーム間の不連続が生じやすヽ。現分析フレームと次分析フレーム各々で MDCT分析を行い、その変換係数を量子化する場合、各々独立に量子化が行われるため、現分析フレームと次分析フレームとではそれぞれ異なる量子化歪が発生する。量子化歪が付加された変換係数を時間領域に逆変換すると、その時間信号には合成フレーム全体にわたつて量子化歪が付加されることになる。つまり、現合成フレームの量子化歪と次の合成フレームの量子化歪は無相関に発生する。そのため、重ね合わせ区間が短い場合、合成フレーム間の隣接部分において、量子化歪に起因する復号信号の不連続性が十分に吸収できず、フレーム間の接続歪が知覚されてしまう。この傾向は、重ね合わせ区間 Lを短くするほどに顕著に発生する。

[0011] 本発明の目的は、遅延量を低遅延に抑え、かつ、接続歪を緩和することができる音声符号化装置および音声符号化方法を提供することである。

課題を解決するための手段

[0012] 本発明の音声符号化装置は、時間領域の音声信号の 1フレームを長い分析長と短い分析長の双方で MDCT分析して、周波数領域の 2種の変換係数を得る第 1の分析手段と、前記 2種の変換係数を符号化する符号化手段と、を具備する構成を採る。発明の効果

[0013] 本発明によれば、遅延量を低遅延に抑え、かつ、接続歪を緩和することができる。

図面の簡単な説明

[0014] [図 1]従来の分析窓を示す図

[図 2]従来の分析窓を示す図

[図 3]本発明の実施の形態 1に係る音声符号化装置および音声復号化装置の構成を示すブロック図

[図 4]本発明の実施の形態 1に係る音声符号ィ匕装置の構成を示すブロック図

[図 5]本発明の実施の形態 1に係る音声符号化装置の信号状態遷移図

[図 6]本発明の実施の形態 1に係る分析窓を示す図

[図 7]本発明の実施の形態 1に係る音声復号ィ匕装置の構成を示すブロック図

[図 8]本発明の実施の形態 1に係る音声復号化装置の信号状態遷移図

[図 9]本発明の実施の形態 1に係る音声符号化装置の動作説明図

[図 10]本発明の実施の形態 1に係る分析窓を示す図

[図 11]本発明の実施の形態 1に係る分析窓を示す図 [図 12]本発明の実施の形態 2に係る分析窓を示す図

[図 13]本発明の実施の形態 2に係る音声符号ィ匕装置の構成を示すブロック図

[図 14]本発明の実施の形態 2に係る音声復号ィ匕装置の構成を示すブロック図発明を実施するための最良の形態

[0015] 以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。

[0016] (実施の形態 1)

本発明の実施の形態 1に係る音声符号化装置および音声復号化装置の構成は図 3に示すようになる。この図に示すように、音声符号化装置は、フレーム構成部 10、分析部 20、変換係数符号化部 30を備える。また、音声復号化装置は、変換係数復号化部 50、合成部 60、フレーム接続部 70を備える。

[0017] 音声符号化装置において、フレーム構成部 10は、入力される時間領域の音声信号をフレーム化する。分析部 20は、フレーム化された時間領域の音声信号を MDC T分析により周波数領域信号に変換する。変換係数符号化部 30は、分析部 20により得られた変換係数を符号化し符号化パラメータを出力する。この符号ィ匕パラメータは、伝送路を介して音声復号化装置へ送られる。

[0018] 音声復号化装置において、変換係数復号ィ匕部 50は、伝送路を介して送られてきた符号化パラメータを復号する。合成部 60は、復号された変換係数から MDCT合成により時間領域信号を生成する。フレーム接続部 70は、隣接するフレーム間で不連続が生じな!/、ように時間領域信号を接続して復号音声信号を出力する。

[0019] 次いで、音声符号化装置についてより詳細に説明する。音声符号化装置のより詳細な構成は図 4に示すようになり、信号の状態遷移は図 5に示すようになる。なお、図 4に示す信号 A〜Gは、図 5に示す信号 A〜Gにそれぞれ対応する。

[0020] フレーム構成部 10に音声信号 Aが入力されると、フレーム構成部 10にて長分析用の分析フレーム区間 (長分析フレーム)および短分析用の分析フレーム区間 (短分析フレーム）が定められる。そして、フレーム構成部 10は、長分析フレーム信号 Bを長分析部 21の窓掛け部 211に出力し、短分析フレーム信号 Cを短分析部 22の窓掛け部 221に出力する。なお、長分析フレーム長 (長分析窓長)と短分析フレーム長 (短分析窓長）はあら力じめ定められており、ここでは長分析フレーム長を Ml、短分析フレ一ム長を M2 (M1 >M2)として説明する。よって、生じる遅延は、 M2Z2となる。

[0021] 長分析部 21では、窓掛け部 211が、分析長 (分析窓長) Mlの長分析フレーム信号 Bに対して分析窓を乗じ、この分析窓を乗じた信号 Dを MDCT部 212に出力する。分析窓には、図 6に示す長分析窓を用いる。この長分析窓は、式 (3)を基に、分析長 Ml、重ね合わせ区間 M2Z2として設計したものである。

[0022] MDCT部 212は、式（4)に従って信号 Dに対して MDCTを施す。そして、 MDCT 部 212は、この MDCTにより得られる変換係数 Fを変換係数符号ィ匕部 30に出力する。なお、式 (4)において、 {sl (i) ; 0≤i< Ml }は長分析フレームに含まれる時間信号、 {XI (k) ;0≤k<MlZ2}は長分析により得られる変換係数 Fを表す。

画

[0023] 一方、短分析部 22では、窓掛け部 221が、分析長 (分析窓長) M2の短分析フレーム信号 Cに対して分析窓を乗じ、この分析窓を乗じた信号 Eを MDCT部 222に出力する。分析窓には、図 6に示す短分析窓を用いる。この短分析窓は、式 (2)を基に、分析長 M2 (M2< M1)として設計したものである。

[0024] MDCT部 222は、式（5)に従って信号 Eに対して MDCTを施す。そして、 MDCT 部 222は、この MDCTにより得られる変換係数 Gを変換係数符号ィ匕部 30に出力する。なお、式（5)において、 {s2 (i) ; 0≤i< M2}は短分析フレームに含まれる時間信号、 {X2 (k) ; 0≤k< M2Z2}は短分析により得られる変換係数 Gを表す。

[数 5] ,

■·· 5

[0025] 変換係数符号ィ匕部 30は、変換係数 F : {XI (k) }および変換係数 G : {X2 (k) }を符号化し、それぞれの符号化パラメータを時間多重して出力する。この際、変換係数符号ィ匕部 30は、変換係数 {X2 (k) }に対し、変換係数 {XI (k) }の符号ィ匕に比べより精度の高い (より量子化誤差の小さい)符号化を行う。例えば、変換係数符号化部 30は、変換係数 {X2 (k) }の変換係数当りの符号ィ匕ビット数を変換係数 {XI (k) }の変換係数当りの符号ィ匕ビット数より高く設定して、変換係数 {XI (k) }および変換係数 {X2 (k) }を符号化する。すなわち、変換係数符号ィ匕部 30では、変換係数 {XI (k) }に比ベ変換係数 {X2 (k) }の量子化歪みが小さくなる符号ィ匕を行う。なお、変換係数符号化部 30での符号ィ匕方法は、例えば特開 2003— 323199号公報に記載された符号化方法等を用いることができる。

[0026] 次いで、音声復号化装置についてより詳細に説明する。音声復号化装置のより詳細な構成は図 7に示すようになり、信号の状態遷移は図 8に示すようになる。なお、図 7に示す信号 A〜Iは、図 8に示す信号 A〜Iにそれぞれ対応する。

[0027] 変換係数復号ィ匕部 50に符号ィ匕パラメータが入力されると、変換係数復号ィ匕部 50 にて復号変換係数 (長分析) {Xlq (k) ;0≤k< Ml/2}： Aと復号変換係数 (短分析） {X2q (k) ;0≤k< M2Z2} : Bとが復号される。そして、変換係数復号ィ匕部 50は、復号変換係数 {Xlq (k) }： Aを長合成部 61の IMDCT部 611に出力し、復号変換係数 {X2q (k) } : Bを短合成部 62の IMDCT部 621に出力する。

[0028] 長合成部 61では、 IMDCT部 611が、復号変換係数 {Xlq (k) }に対して IMDCT( MDCT部 212で行われた MDCTの逆変換）を行って長合成信号 Cを生成し、この長合成信号 Cを窓掛け部 612に出力する。

[0029] 窓掛け部 612は、長合成信号 Cに対して合成窓を乗じ、この合成窓を乗じた信号 E をフレーム内接続部 71に出力する。合成窓には、音声符号化装置の窓掛け部 211 同様、図 6に示す長分析窓を用いる。

[0030] 一方、短合成部 62では、 IMDCT部 621が、復号変換係数 {X2q (k) }に対して IM DCT (MDCT部 222で行われた MDCTの逆変換）を行って短合成信号 Dを生成し、この短合成信号 Dを窓掛け部 622に出力する。

[0031] 窓掛け部 622は、短合成信号 Dに対して合成窓を乗じ、この合成窓を乗じた信号 F をフレーム内接続部 71に出力する。合成窓には、音声符号化装置の窓掛け部 221 同様、図 6に示す短分析窓を用いる。 [0032] そして、フレーム内接続部 71にて第 nフレームの復号信号 Gを生成し、次に、フレーム間接続部 73にて第 nフレームの復号信号 Gと第 n—1フレームの復号信号 Hの対応する区間を重ね合わせ加算して復号音声信号を生成する。すなわち、フレーム内接続部 71では、信号 Eと信号 Fの対応する区間を重ね合わせ加算して第 nフレームの復号信号 {sq (i) ;0≤i< Ml } : Gを生成する。そして、フレーム間接続部 73では、第 nフレームの復号信号 Gとバッファ 72にバッファリングされて!/、る第 n— 1フレームの復号信号 Hの対応する区間を重ね合わせ加算して復号音声信号 Iを生成する。その後、第 nフレームの復号信号 Gは、次フレーム（第 n+ 1フレーム）の処理のためにノッファ 72に格納される。

[0033] 次いで、図 9に、音声信号の各フレームと分析部 20での分析位置の対応関係を示す。図 9に示すように、本実施の形態では、 1フレーム区間 (符号ィ匕パラメータを生成する単位)の音声信号の分析は、 Vヽずれのフレームも必ず長分析と短分析の組み合わせにより行われる。

[0034] このように、本実施の形態では、 MDCT分析を長、分析長 (長分析)と短!、分析長（短分析)の組み合わせで行い、かつ、短分析により得られる変換係数の量子化誤差が小さくなるように符号ィ匕処理を行うため、遅延が短い状態で分析長を長くとって冗長性を効率的に取り除くことができるとともに、短分析の変換係数の量子化歪を小さくすることができる。よって、遅延量を M2Z2という低遅延に抑え、かつ、接続歪を緩和することができる。

[0035] なお、 1フレーム区間における長分析窓と短分析窓の配置について、図 6では短分析窓を長分析窓より時間的に後方に配置するようにしているが、例えば図 10に示すように、長分析窓を短分析窓より時間的に後方に配置するようにしてもよい。図 10に示すような配置にしても、図 6に示す配置と同様に、遅延量を低遅延に抑え、かつ、接続歪を緩和することができる。

[0036] また、本実施の形態では、短分析窓を式 (2)を基に設計したが、短分析窓の分析長 M2と長分析窓の分析長 Mlとの関係が M2< Mlとなっていれば、式（3)で表される窓を短分析窓として用いてもよい。つまり、式 (3)を基に、分析長 M2として設計した窓を短分析窓として用いてもよい。この一例を図 11に示す。このような分析窓の構成においても、遅延量を低遅延に抑え、かつ、接続歪を緩和することができる。

[0037] (実施の形態 2)

音声符号化装置に入力される音声信号が語頭部や、特性が急激に変化する遷移部である場合、周波数分解能よりもむしろ時間分解能が必要とされる。そのような音声信号に対しては、分析フレームが全て短分析フレームにより分析される方が音声品質が向上する。

[0038] そこで、本実施の形態では、各フレームに対して行う MDCT分析を、入力音声信号の特性に応じて、（1)長分析と短分析の組み合わせで行うモード (長短混合分析モード)と (2)短分析を繰り返し複数回行うモード (全短分析モード)とで切り替えて行う。全短分析モードのときに各フレームに対して使用する分析 Z合成窓の例を図 12に示す。なお、長短混合分析モードについては、実施の形態 1で説明したとおりである

[0039] 本発明の実施の形態 2に係る音声符号化装置の構成を図 13に示す。この図に示すように、本実施の形態に係る音声符号化装置は、実施の形態 1の構成（図 4)にさらに判定部 15、多重化部 35、 SW (スィッチ） 11、 SW12を備える。図 13において図 4 と同一の構成には同一符号を付して説明を省略する。なお、フレーム構成部 ₁₀から分析部 20への出力および分析部 20から変換係数符号ィ匕部 30への出力は実際には図 4に示すように並列的に行われるが、ここでは図示の便宜上 1本の信号線で示すものとする。

[0040] 判定部 15は、入力音声信号を分析して信号の特性を判定する。特性判定では、音声信号の特徴量の時間的な変化を監視し、その変化量が所定量未満の場合には定常部、所定量以上の場合には非定常部であると判定する。音声信号の特徴量としては、例えば、短区間パワー、短区間スペクトルなどが挙げられる。

[0041] そして、判定部 15は、判定結果に応じて MDCT分析の分析モードを長短混合分析モードと全短分析モードとで切り替える。すなわち、判定部 15は、入力された音声信号が定常部である場合は、 SW11および SW12を分析部 20側に接続して、分析部 20を使用して長短混合分析モードで MDCT分析を行う。一方、入力された音声信号が非定常部である場合は、 SW11および SW12を全短分析部 25側に接続して、全短分析部 25を使用して全短分析モードで MDCT分析を行う。この切替えにより、音声信号のフレームは、定常部である場合には実施の形態 1のように長分析と短分祈の組み合わせで分析され、非定常部である場合には短分析を繰り返し複数回行われる。

[0042] 判定部 15により全短分析モードが選択された場合には、全短分析部 25は、分析窓長を M2としたときの式（2)で表される分析窓を用い、式（5)に示される MDCTにより分析を行う。

[0043] また、判定部 15は、定常部であるか非定常部であるかを示す判定情報を符号化して多重化部 35に出力する。この判定情報は、多重化部 35により、変換係数符号ィ匕部 30から出力される符号化パラメータと多重されて出力される。

[0044] 一方、本発明の実施の形態 2に係る音声復号化装置の構成を図 14に示す。この図に示すように、本実施の形態に係る音声復号化装置は、実施の形態 1の構成（図 7) にさらに分離部 45、判定情報復号化部 55、全短合成部 65、 SW21、 SW22を備える。図 14において図 7と同一の構成には同一符号を付して説明を省略する。なお、変換係数復号ィ匕部 50から合成部 60への出力および合成部 60からフレーム内接続部 71への出力は実際には図 7に示すように並列的に行われる力ここでは図示の便宜上 1本の信号線で示すものとする。

[0045] 分離部 45は、入力される符号ィ匕パラメータを判定情報を表す符号化パラメータと変換係数を表す符号化パラメータに分離し、それぞれ判定情報復号化部 55と変換係数復号ィ匕部 50に出力する。

[0046] 判定情報復号化部 55は、入力された判定情報を復号する。そして、判定情報復号化部 55は、判定情報が定常部を示す場合は、 SW21および SW22を合成部 60側に接続して、合成部 60を使用して合成信号を生成する。なお、合成部 60を使用した合成信号の生成については、実施の形態 1で説明したとおりである。一方、判定情報が非定常部を示す場合は、 SW21および SW22を全短合成部 65側に接続して、全短合成部 65を使用して合成信号を生成する。全短合成部 65は、 1フレームにおける複数の復号変換係数 (短分析)それぞれに IMDCT処理を施して合成信号を生成する。

[0047] このように、本実施の形態では、 1フレームにおいて、入力音声信号が定常部で安定している場合はそのフレームの音声信号を長分析および短分析の組合せで分析し、入力音声信号が非定常部である場合 (入力音声信号が急激に変化する場合)はそのフレームの音声信号を全て短分析で分析して時間分解能を上げるため、入力音声信号の特性に応じて最適な MDCT分析を行うことができ、入力音声信号の特性が変化する場合でも音声品質を良好に保つことができる。

[0048] また、本実施の形態では、長短混合分析モードの重ね合わせ区間と全短分析モードの重ね合わせ区間を同一にする。よって、例えば ISO/IEC IS 13818-7 Information technology—― Generic coding of moving pictures and associated audio information― - Part 7: Advanced Audio Coding (AAC)に記載されている LONG— START— WINDOW または LONG_STOP_WINDOWのような遷移用の分析フレームを用いる必要がない。

[0049] また、長短混合分析モードか全短分析モードかを判定する別の方法として、次フレームとの接続部に位置する信号の原信号に対する SNRの大きさによって判定する方法が挙げられる。この判定方法を用いることにより、接続部の SNRによって次フレームの分析モードを決定することができるため、分析モードの誤判定を減らすことができる。

[0050] なお、上記各実施形態は、レイヤ数が 2以上の階層符号ィ匕の拡張レイヤに対して適用可能である。

[0051] また、上記各実施の形態に係る音声符号化装置、音声復号化装置を、移動体通信システムにおいて使用される無線通信移動局装置や無線通信基地局装置等の無線通信装置に搭載することも可能である。

[0052] また、上記実施の形態では、本発明をノヽードウエアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。

[0053] また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路である LSIとして実現される。これらは個別に 1チップ化されてもよいし、一部又は全てを含むように 1チップィ匕されてもょ、。

[0054] ここでは、 LSIとした力集積度の違いにより、 IC、システム LSI、スーパー LSI、ゥノレ卜ラ LSIと呼称されることちある。

[0055] また、集積回路化の手法は LSIに限るものではなぐ専用回路又は汎用プロセッサで実現してもよい。 LSI製造後に、プログラムすることが可能な FPGA (Field Program mable Gate Array)や、 LSI内部の回路セルの接続や設定を再構成可能なリコンフィギユラブル'プロセッサーを利用してもよい。

[0056] さらには、半導体技術の進歩又は派生する別技術により LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積ィ匕を行ってもよい。バイオ技術の適応等が可能性としてありえる。

[0057] 本明細書は、 2004年 10月 26日出願の特願 2004— 311143に基づくものである

。この内容はすべてここに含めておく。

産業上の利用可能性

[0058] 本発明は、移動体通信システムやインターネットプロトコルを用いたパケット通信システム等における通信装置の用途に適用できる。

Claims

請求の範囲

[1] 時間領域の音声信号の 1フレームを長ヽ分析長と短!ヽ分析長の双方で MDCT分祈して、周波数領域の 2種の変換係数を得る第 1の分析手段と、

前記 2種の変換係数を符号化する符号化手段と、

を具備する音声符号化装置。

[2] 前記符号化手段は、前記長い分析長により得られる第 1の変換係数に対する符号化に比べより精度の高い符号ィ匕を前記短い分析長により得られる第 2の変換係数に対して行う、

請求項 1記載の音声符号化装置。

[3] 前記音声信号が定常部または非定常部のいずれであるかを判定する判定手段と、非定常部である場合に、前記 1フレームを前記短い分析長で繰り返し複数回 MDC T分析する第 2の分析手段と、

をさらに具備する請求項 1記載の音声符号化装置。

[4] 請求項 1記載の音声符号化装置を具備する無線通信移動局装置。

[5] 請求項 1記載の音声符号化装置を具備する無線通信基地局装置。

[6] 時間領域の音声信号の 1フレームを長ヽ分析長と短!ヽ分析長の双方で MDCT分祈して、周波数領域の 2種の変換係数を得る分析工程と、

前記 2種の変換係数を符号化する符号化工程と、

を具備する音声符号化方法。