JP5100124B2 - 音声符号化装置および音声符号化方法 - Google Patents

音声符号化装置および音声符号化方法 Download PDF

Info

Publication number
JP5100124B2
JP5100124B2 JP2006543162A JP2006543162A JP5100124B2 JP 5100124 B2 JP5100124 B2 JP 5100124B2 JP 2006543162 A JP2006543162 A JP 2006543162A JP 2006543162 A JP2006543162 A JP 2006543162A JP 5100124 B2 JP5100124 B2 JP 5100124B2
Authority
JP
Japan
Prior art keywords
analysis
transform coefficient
encoding
frame
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006543162A
Other languages
English (en)
Other versions
JPWO2006046546A1 (ja
Inventor
正浩 押切
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2006543162A priority Critical patent/JP5100124B2/ja
Publication of JPWO2006046546A1 publication Critical patent/JPWO2006046546A1/ja
Application granted granted Critical
Publication of JP5100124B2 publication Critical patent/JP5100124B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

本発明は、音声符号化装置および音声符号化方法に関する。
音声符号化において、時間信号を周波数領域に変換し変換係数を符号化する変換符号化は、時間信号に含まれる冗長性を効率的に除去できる。また、変換符号化では、周波数領域で表される人間の聴覚特性を利用することにより、低ビットレートにしても量子化歪が知覚され難い符号化を実現することが可能である。
近年の変換符号化には、重ね合わせ直交変換(LOT;Lapped Orthogonal Transform)と呼ばれる変換技術が利用されることが多い。これは、ブロック内だけの直交性だけでなく、隣り合うブロックとの直交性を考慮した直交基底に基づき変換を行うものであり、その代表的な手法としてMDCT(Modified Discrete Cosine Transform)が挙げられる。MDCTでは現分析フレームとその前後の分析フレームとを重ね合わせるようにして分析フレームを配置し分析を行う。この際、変換後の係数のうち、分析長の半分の係数のみを符号化の対象とすればよいため、MDCTを用いることにより効率的な符号化が行える。また、合成時には現フレームと隣接するフレームとを重ね合わせ加算するため、フレーム毎に異なる量子化歪が発生する状況においてもフレーム境界での不連続が発生しにくいという特徴がある。
通常、MDCTによる分析/合成を行う際には窓関数である分析窓および合成窓をそれぞれ対象信号に乗じる。このとき用いる分析窓/合成窓は、隣接フレームとの重ね合わせに位置する部分が傾斜(スロープ)している。この重ね合わせ区間の長さ(つまり、スロープの長さ)と入力フレームのバッファリングに必要な遅延が、MDCT分析/合成により発生する遅延の長さに相当する。双方向通信においてこの遅延が大きくなると、通信相手端末からのレスポンスが自端末に届くまでに時間がかかってしまい、円滑な会話が成り立たなくなる。そのため、遅延はできるだけ短いことが望ましい。
以下、従来のMDCTについて説明する。
MDCTに使用される分析窓/合成窓は、式(1)で表される条件を満たす場合に完全再構成(量子化歪がない前提で変換による歪が0になる)を実現する。
Figure 0005100124
式(1)の条件を満たす代表的な窓として、非特許文献1では、式(2)で表されるsin窓が提案されている。また、このsin窓を図示すると図1のようになる。このようなsin窓を用いる場合、sin窓のスペクトル特性はサイドローブが十分に減衰されるため、精度よくスペクトルを分析することが可能である。
Figure 0005100124
また、非特許文献2では、式(1)の条件を満たす窓として式(3)で表される窓を用いてMDCT分析/合成を行う方法が提案されている。ここで、Nは分析窓の長さ、Lは重ね合わせ区間の長さを示している。また、式(3)で表される窓を図示すると図2のようになる。このような窓を用いた場合、重ね合わせ区間がLとなるため、この窓による遅延はLと表される。よって、重ね合わせ区間Lを短く設定することにより遅延の発生を抑制することが可能になる。
Figure 0005100124
守谷健弘著、「音声符号化」、(社)電子情報通信学会、1998年10月20日、pp.36-38 M. Iwadare, et al., "A 128 kb/s Hi-Fi Audio CODEC Based on Adaptive Transform Coding with Adaptive Block Size MDCT," IEEE Journal on Selected Areas in Communications, Vol. 10, No.1, pp.138-144, Jan. 1992.
式(2)で表されるsin窓を用いると、図1に示すように、隣接する分析フレームの重ね合わせ区間が分析フレームの1/2の長さになる。この例では、分析フレーム長がNであるので、重ね合わせ区間はN/2となる。よって、合成側では、N/2〜N−1に位置する信号を合成するには次の分析フレームの情報が得られなければ信号を合成することができない。つまり、(3N/2)−1に位置するサンプル値が得られるまで次の分析フレームでMDCT分析を行うことができず、(3N/2)−1の位置のサンプルが得られて初めて次の分析フレームでMDCT分析が行われ、その分析フレームの変換係数を用いてN/2〜N−1の信号を合成することが可能になる。従って、sin窓を用いる場合には、N/2の長さの遅延が発生することになる。
一方、式(3)で表される窓を用いると、重ね合わせ区間Lが短いためにフレーム間の不連続が生じやすい。現分析フレームと次分析フレーム各々でMDCT分析を行い、その変換係数を量子化する場合、各々独立に量子化が行われるため、現分析フレームと次分析フレームとではそれぞれ異なる量子化歪が発生する。量子化歪が付加された変換係数を時間領域に逆変換すると、その時間信号には合成フレーム全体にわたって量子化歪が付加さ
れることになる。つまり、現合成フレームの量子化歪と次の合成フレームの量子化歪は無相関に発生する。そのため、重ね合わせ区間が短い場合、合成フレーム間の隣接部分において、量子化歪に起因する復号信号の不連続性が十分に吸収できず、フレーム間の接続歪が知覚されてしまう。この傾向は、重ね合わせ区間Lを短くするほどに顕著に発生する。
本発明の目的は、遅延量を低遅延に抑え、かつ、接続歪を緩和することができる音声符号化装置および音声符号化方法を提供することである。
本発明の音声符号化装置は、時間領域の音声信号の1フレームを長い分析長と短い分析長の双方でMDCT分析して、周波数領域の2種の変換係数を得る第1の分析手段と、前記2種の変換係数を符号化する符号化手段と、を具備する構成を採る。
本発明によれば、遅延量を低遅延に抑え、かつ、接続歪を緩和することができる。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
(実施の形態1)
本発明の実施の形態1に係る音声符号化装置および音声復号化装置の構成は図3に示すようになる。この図に示すように、音声符号化装置は、フレーム構成部10、分析部20、変換係数符号化部30を備える。また、音声復号化装置は、変換係数復号化部50、合成部60、フレーム接続部70を備える。
音声符号化装置において、フレーム構成部10は、入力される時間領域の音声信号をフレーム化する。分析部20は、フレーム化された時間領域の音声信号をMDCT分析により周波数領域信号に変換する。変換係数符号化部30は、分析部20により得られた変換係数を符号化し符号化パラメータを出力する。この符号化パラメータは、伝送路を介して音声復号化装置へ送られる。
音声復号化装置において、変換係数復号化部50は、伝送路を介して送られてきた符号化パラメータを復号する。合成部60は、復号された変換係数からMDCT合成により時
間領域信号を生成する。フレーム接続部70は、隣接するフレーム間で不連続が生じないように時間領域信号を接続して復号音声信号を出力する。
次いで、音声符号化装置についてより詳細に説明する。音声符号化装置のより詳細な構成は図4に示すようになり、信号の状態遷移は図5に示すようになる。なお、図4に示す信号A〜Gは、図5に示す信号A〜Gにそれぞれ対応する。
フレーム構成部10に音声信号Aが入力されると、フレーム構成部10にて長分析用の分析フレーム区間(長分析フレーム)および短分析用の分析フレーム区間(短分析フレーム)が定められる。そして、フレーム構成部10は、長分析フレーム信号Bを長分析部21の窓掛け部211に出力し、短分析フレーム信号Cを短分析部22の窓掛け部221に出力する。なお、長分析フレーム長(長分析窓長)と短分析フレーム長(短分析窓長)はあらかじめ定められており、ここでは長分析フレーム長をM1、短分析フレーム長をM2(M1>M2)として説明する。よって、生じる遅延は、M2/2となる。
長分析部21では、窓掛け部211が、分析長(分析窓長)M1の長分析フレーム信号Bに対して分析窓を乗じ、この分析窓を乗じた信号DをMDCT部212に出力する。分析窓には、図6に示す長分析窓を用いる。この長分析窓は、式(3)を基に、分析長M1、重ね合わせ区間M2/2として設計したものである。
MDCT部212は、式(4)に従って信号Dに対してMDCTを施す。そして、MDCT部212は、このMDCTにより得られる変換係数Fを変換係数符号化部30に出力する。なお、式(4)において、{s1(i);0≦i<M1}は長分析フレームに含まれる時間信号、{X1(k);0≦k<M1/2}は長分析により得られる変換係数Fを表す。
Figure 0005100124
一方、短分析部22では、窓掛け部221が、分析長(分析窓長)M2の短分析フレーム信号Cに対して分析窓を乗じ、この分析窓を乗じた信号EをMDCT部222に出力する。分析窓には、図6に示す短分析窓を用いる。この短分析窓は、式(2)を基に、分析長M2(M2<M1)として設計したものである。
MDCT部222は、式(5)に従って信号Eに対してMDCTを施す。そして、MDCT部222は、このMDCTにより得られる変換係数Gを変換係数符号化部30に出力する。なお、式(5)において、{s2(i);0≦i<M2}は短分析フレームに含まれる時間信号、{X2(k);0≦k<M2/2}は短分析により得られる変換係数Gを表す。
Figure 0005100124
変換係数符号化部30は、変換係数F:{X1(k)}および変換係数G:{X2(k)}を符号化し、それぞれの符号化パラメータを時間多重して出力する。この際、変換係数符号化部30は、変換係数{X2(k)}に対し、変換係数{X1(k)}の符号化に
比べより精度の高い(より量子化誤差の小さい)符号化を行う。例えば、変換係数符号化部30は、変換係数{X2(k)}の変換係数当りの符号化ビット数を変換係数{X1(k)}の変換係数当りの符号化ビット数より高く設定して、変換係数{X1(k)}および変換係数{X2(k)}を符号化する。すなわち、変換係数符号化部30では、変換係数{X1(k)}に比べ変換係数{X2(k)}の量子化歪みが小さくなる符号化を行う。なお、変換係数符号化部30での符号化方法は、例えば特開2003−323199号公報に記載された符号化方法等を用いることができる。
次いで、音声復号化装置についてより詳細に説明する。音声復号化装置のより詳細な構成は図7に示すようになり、信号の状態遷移は図8に示すようになる。なお、図7に示す信号A〜Iは、図8に示す信号A〜Iにそれぞれ対応する。
変換係数復号化部50に符号化パラメータが入力されると、変換係数復号化部50にて復号変換係数(長分析){X1q(k);0≦k<M1/2}:Aと復号変換係数(短分析){X2q(k);0≦k<M2/2}:Bとが復号される。そして、変換係数復号化部50は、復号変換係数{X1q(k)}:Aを長合成部61のIMDCT部611に出力し、復号変換係数{X2q(k)}:Bを短合成部62のIMDCT部621に出力する。
長合成部61では、IMDCT部611が、復号変換係数{X1q(k)}に対してIMDCT(MDCT部212で行われたMDCTの逆変換)を行って長合成信号Cを生成し、この長合成信号Cを窓掛け部612に出力する。
窓掛け部612は、長合成信号Cに対して合成窓を乗じ、この合成窓を乗じた信号Eをフレーム内接続部71に出力する。合成窓には、音声符号化装置の窓掛け部211同様、図6に示す長分析窓を用いる。
一方、短合成部62では、IMDCT部621が、復号変換係数{X2q(k)}に対してIMDCT(MDCT部222で行われたMDCTの逆変換)を行って短合成信号Dを生成し、この短合成信号Dを窓掛け部622に出力する。
窓掛け部622は、短合成信号Dに対して合成窓を乗じ、この合成窓を乗じた信号Fをフレーム内接続部71に出力する。合成窓には、音声符号化装置の窓掛け部221同様、図6に示す短分析窓を用いる。
そして、フレーム内接続部71にて第nフレームの復号信号Gを生成し、次に、フレーム間接続部73にて第nフレームの復号信号Gと第n−1フレームの復号信号Hの対応する区間を重ね合わせ加算して復号音声信号を生成する。すなわち、フレーム内接続部71では、信号Eと信号Fの対応する区間を重ね合わせ加算して第nフレームの復号信号{sq(i);0≦i<M1}:Gを生成する。そして、フレーム間接続部73では、第nフレームの復号信号Gとバッファ72にバッファリングされている第n−1フレームの復号信号Hの対応する区間を重ね合わせ加算して復号音声信号Iを生成する。その後、第nフレームの復号信号Gは、次フレーム(第n+1フレーム)の処理のためにバッファ72に格納される。
次いで、図9に、音声信号の各フレームと分析部20での分析位置の対応関係を示す。図9に示すように、本実施の形態では、1フレーム区間(符号化パラメータを生成する単位)の音声信号の分析は、いずれのフレームも必ず長分析と短分析の組み合わせにより行われる。
このように、本実施の形態では、MDCT分析を長い分析長(長分析)と短い分析長(短
分析)の組み合わせで行い、かつ、短分析により得られる変換係数の量子化誤差が小さくなるように符号化処理を行うため、遅延が短い状態で分析長を長くとって冗長性を効率的に取り除くことができるとともに、短分析の変換係数の量子化歪を小さくすることができる。よって、遅延量をM2/2という低遅延に抑え、かつ、接続歪を緩和することができる。
なお、1フレーム区間における長分析窓と短分析窓の配置について、図6では短分析窓を長分析窓より時間的に後方に配置するようにしているが、例えば図10に示すように、長分析窓を短分析窓より時間的に後方に配置するようにしてもよい。図10に示すような配置にしても、図6に示す配置と同様に、遅延量を低遅延に抑え、かつ、接続歪を緩和することができる。
また、本実施の形態では、短分析窓を式(2)を基に設計したが、短分析窓の分析長M2と長分析窓の分析長M1との関係がM2<M1となっていれば、式(3)で表される窓を短分析窓として用いてもよい。つまり、式(3)を基に、分析長M2として設計した窓を短分析窓として用いてもよい。この一例を図11に示す。このような分析窓の構成においても、遅延量を低遅延に抑え、かつ、接続歪を緩和することができる。
(実施の形態2)
音声符号化装置に入力される音声信号が語頭部や、特性が急激に変化する遷移部である場合、周波数分解能よりもむしろ時間分解能が必要とされる。そのような音声信号に対しては、分析フレームが全て短分析フレームにより分析される方が音声品質が向上する。
そこで、本実施の形態では、各フレームに対して行うMDCT分析を、入力音声信号の特性に応じて、(1)長分析と短分析の組み合わせで行うモード(長短混合分析モード)と(2)短分析を繰り返し複数回行うモード(全短分析モード)とで切り替えて行う。全短分析モードのときに各フレームに対して使用する分析/合成窓の例を図12に示す。なお、長短混合分析モードについては、実施の形態1で説明したとおりである。
本発明の実施の形態2に係る音声符号化装置の構成を図13に示す。この図に示すように、本実施の形態に係る音声符号化装置は、実施の形態1の構成(図4)にさらに判定部15、多重化部35、SW(スイッチ)11、SW12を備える。図13において図4と同一の構成には同一符号を付して説明を省略する。なお、フレーム構成部10から分析部20への出力および分析部20から変換係数符号化部30への出力は実際には図4に示すように並列的に行われるが、ここでは図示の便宜上1本の信号線で示すものとする。
判定部15は、入力音声信号を分析して信号の特性を判定する。特性判定では、音声信号の特徴量の時間的な変化を監視し、その変化量が所定量未満の場合には定常部、所定量以上の場合には非定常部であると判定する。音声信号の特徴量としては、例えば、短区間パワー、短区間スペクトルなどが挙げられる。
そして、判定部15は、判定結果に応じてMDCT分析の分析モードを長短混合分析モードと全短分析モードとで切り替える。すなわち、判定部15は、入力された音声信号が定常部である場合は、SW11およびSW12を分析部20側に接続して、分析部20を使用して長短混合分析モードでMDCT分析を行う。一方、入力された音声信号が非定常部である場合は、SW11およびSW12を全短分析部25側に接続して、全短分析部25を使用して全短分析モードでMDCT分析を行う。この切替えにより、音声信号のフレームは、定常部である場合には実施の形態1のように長分析と短分析の組み合わせで分析され、非定常部である場合には短分析を繰り返し複数回行われる。
判定部15により全短分析モードが選択された場合には、全短分析部25は、分析窓長をM2としたときの式(2)で表される分析窓を用い、式(5)に示されるMDCTにより分析を行う。
また、判定部15は、定常部であるか非定常部であるかを示す判定情報を符号化して多重化部35に出力する。この判定情報は、多重化部35により、変換係数符号化部30から出力される符号化パラメータと多重されて出力される。
一方、本発明の実施の形態2に係る音声復号化装置の構成を図14に示す。この図に示すように、本実施の形態に係る音声復号化装置は、実施の形態1の構成(図7)にさらに分離部45、判定情報復号化部55、全短合成部65、SW21、SW22を備える。図14において図7と同一の構成には同一符号を付して説明を省略する。なお、変換係数復号化部50から合成部60への出力および合成部60からフレーム内接続部71への出力は実際には図7に示すように並列的に行われるが、ここでは図示の便宜上1本の信号線で示すものとする。
分離部45は、入力される符号化パラメータを判定情報を表す符号化パラメータと変換係数を表す符号化パラメータに分離し、それぞれ判定情報復号化部55と変換係数復号化部50に出力する。
判定情報復号化部55は、入力された判定情報を復号する。そして、判定情報復号化部55は、判定情報が定常部を示す場合は、SW21およびSW22を合成部60側に接続して、合成部60を使用して合成信号を生成する。なお、合成部60を使用した合成信号の生成については、実施の形態1で説明したとおりである。一方、判定情報が非定常部を示す場合は、SW21およびSW22を全短合成部65側に接続して、全短合成部65を使用して合成信号を生成する。全短合成部65は、1フレームにおける複数の復号変換係数(短分析)それぞれにIMDCT処理を施して合成信号を生成する。
このように、本実施の形態では、1フレームにおいて、入力音声信号が定常部で安定している場合はそのフレームの音声信号を長分析および短分析の組合せで分析し、入力音声信号が非定常部である場合(入力音声信号が急激に変化する場合)はそのフレームの音声信号を全て短分析で分析して時間分解能を上げるため、入力音声信号の特性に応じて最適なMDCT分析を行うことができ、入力音声信号の特性が変化する場合でも音声品質を良好に保つことができる。
また、本実施の形態では、長短混合分析モードの重ね合わせ区間と全短分析モードの重ね合わせ区間を同一にする。よって、例えばISO/IEC IS 13818-7 Information technology -- Generic coding of moving pictures and associated audio information -- Part 7: Advanced Audio Coding (AAC)に記載されているLONG_START_WINDOWまたはLONG_STOP_WINDOWのような遷移用の分析フレームを用いる必要がない。
また、長短混合分析モードか全短分析モードかを判定する別の方法として、次フレームとの接続部に位置する信号の原信号に対するSNRの大きさによって判定する方法が挙げられる。この判定方法を用いることにより、接続部のSNRによって次フレームの分析モードを決定することができるため、分析モードの誤判定を減らすことができる。
なお、上記各実施形態は、レイヤ数が2以上の階層符号化の拡張レイヤに対して適用可能である。
また、上記各実施の形態に係る音声符号化装置、音声復号化装置を、移動体通信システ
ムにおいて使用される無線通信移動局装置や無線通信基地局装置等の無線通信装置に搭載することも可能である。
また、上記実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用してもよい。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
本明細書は、2004年10月26日出願の特願2004−311143に基づくものである。この内容はすべてここに含めておく。
本発明は、移動体通信システムやインターネットプロトコルを用いたパケット通信システム等における通信装置の用途に適用できる。
従来の分析窓を示す図 従来の分析窓を示す図 本発明の実施の形態1に係る音声符号化装置および音声復号化装置の構成を示すブロック図 本発明の実施の形態1に係る音声符号化装置の構成を示すブロック図 本発明の実施の形態1に係る音声符号化装置の信号状態遷移図 本発明の実施の形態1に係る分析窓を示す図 本発明の実施の形態1に係る音声復号化装置の構成を示すブロック図 本発明の実施の形態1に係る音声復号化装置の信号状態遷移図 本発明の実施の形態1に係る音声符号化装置の動作説明図 本発明の実施の形態1に係る分析窓を示す図 本発明の実施の形態1に係る分析窓を示す図 本発明の実施の形態2に係る分析窓を示す図 本発明の実施の形態2に係る音声符号化装置の構成を示すブロック図 本発明の実施の形態2に係る音声復号化装置の構成を示すブロック図

Claims (5)

  1. 時間領域の音声信号をフレーム毎に符号化する音声符号化装置において、
    互いに一部を重ね合わせる分析長M1および分析長M2(ただし、M1>M2、M1とM2との重ね合わせ区間はM2/2)の各々でMDCT分析する処理をフレーム毎に行って1フレーム毎に、前記分析長M1に対応する周波数領域の第1の変換係数および前記分析長M2に対応する周波数領域の第2の変換係数を得る第1の分析手段と、
    前記第1の変換係数および前記第2の変換係数の各々を符号化する符号化手段と、を具備し、
    前記符号化手段は、
    前記第1の変換係数に隣接する前記第2の変換係数の符号化に用いられる変換係数あたりのビット数が、前記第1の変換係数の符号化に用いられる変換係数あたりのビット数よりも大きいビット配分に基づいて、前記第1の変換係数および前記第2の変換係数を符号化する、
    音声符号化装置。
  2. 前記フレームに含まれる信号が前記音声信号の定常部または非定常部のいずれであるかを判定する判定手段と、
    各フレームに対して、前記分析長M2で繰り返し複数回MDCT分析して、周波数領域の第3の変換係数をえる第2の分析手段と、をさらに具備し、
    前記第1の分析手段は、前記判定手段が前記フレームに含まれる信号は定常部であると判定した場合に、前記第1の変換係数および前記第2の変換係数を得て、
    前記第2の分析手段は、前記判定手段が前記フレームに含まれる信号は非定常部であると判定した場合に、前記第3の変換係数を得て、
    前記符号化手段は、
    前記第1の変換係数および前記第2の変換係数、または、前記第3の変換係数を符号化する、
    請求項1記載の音声符号化装置。
  3. 請求項1記載の音声符号化装置を具備する無線通信移動局装置。
  4. 請求項1記載の音声符号化装置を具備する無線通信基地局装置。
  5. 時間領域の音声信号をフレーム毎に符号化する音声符号化方法であって、
    互いに一部を重ね合わせる分析長M1および分析長M2(ただし、M1>M2、M1とM2との重ね合わせ区間はM2/2)の各々でMDCT分析を行う処理をフレーム毎に行って1フレーム毎に、前記分析長M1に対応する周波数領域の第1の変換係数および前記分析長M2に対応する第2の変換係数を得る分析工程と、
    前記第1の変換係数および前記第2の変換係数の各々を符号化する符号化工程と、を具備し、
    前記符号化工程において、前記第1の変換係数に隣接する前記第2の変換係数の符号化に用いられる変換係数あたりのビット数が、前記第1の変換係数の符号化に用いられる変換係数あたりのビット数よりも大きいビット配分に基づいて、前記第1の変換係数および前記第2の変換係数を符号化する、
    音声符号化方法。
JP2006543162A 2004-10-26 2005-10-25 音声符号化装置および音声符号化方法 Expired - Fee Related JP5100124B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006543162A JP5100124B2 (ja) 2004-10-26 2005-10-25 音声符号化装置および音声符号化方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2004311143 2004-10-26
JP2004311143 2004-10-26
PCT/JP2005/019578 WO2006046546A1 (ja) 2004-10-26 2005-10-25 音声符号化装置および音声符号化方法
JP2006543162A JP5100124B2 (ja) 2004-10-26 2005-10-25 音声符号化装置および音声符号化方法

Publications (2)

Publication Number Publication Date
JPWO2006046546A1 JPWO2006046546A1 (ja) 2008-05-22
JP5100124B2 true JP5100124B2 (ja) 2012-12-19

Family

ID=36227786

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006543162A Expired - Fee Related JP5100124B2 (ja) 2004-10-26 2005-10-25 音声符号化装置および音声符号化方法

Country Status (8)

Country Link
US (1) US8326606B2 (ja)
EP (1) EP1793372B1 (ja)
JP (1) JP5100124B2 (ja)
KR (1) KR20070068424A (ja)
CN (1) CN101061533B (ja)
AT (1) ATE537536T1 (ja)
BR (1) BRPI0517513A (ja)
WO (1) WO2006046546A1 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101061533B (zh) * 2004-10-26 2011-05-18 松下电器产业株式会社 语音编码装置和语音编码方法
EP1926083A4 (en) 2005-09-30 2011-01-26 Panasonic Corp AUDIOCODING DEVICE AND AUDIOCODING METHOD
US7991611B2 (en) * 2005-10-14 2011-08-02 Panasonic Corporation Speech encoding apparatus and speech encoding method that encode speech signals in a scalable manner, and speech decoding apparatus and speech decoding method that decode scalable encoded signals
DE602007013026D1 (de) * 2006-04-27 2011-04-21 Panasonic Corp Audiocodierungseinrichtung, audiodecodierungseinrichtung und verfahren dafür
US7987089B2 (en) 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
RU2444071C2 (ru) 2006-12-12 2012-02-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Кодер, декодер и методы кодирования и декодирования сегментов данных, представляющих собой поток данных временной области
US8560328B2 (en) * 2006-12-15 2013-10-15 Panasonic Corporation Encoding device, decoding device, and method thereof
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US9495971B2 (en) * 2007-08-27 2016-11-15 Telefonaktiebolaget Lm Ericsson (Publ) Transient detector and method for supporting encoding of an audio signal
WO2009047675A2 (en) * 2007-10-10 2009-04-16 Koninklijke Philips Electronics N.V. Encoding and decoding of an audio signal
CN101604983B (zh) * 2008-06-12 2013-04-24 华为技术有限公司 编解码装置、***及其方法
CA2730355C (en) * 2008-07-11 2016-03-22 Guillaume Fuchs Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
KR101670063B1 (ko) * 2008-09-18 2016-10-28 한국전자통신연구원 Mdct 기반의 코더와 이종의 코더 간 변환에서의 인코딩 장치 및 디코딩 장치
US8892427B2 (en) 2009-07-27 2014-11-18 Industry-Academic Cooperation Foundation, Yonsei University Method and an apparatus for processing an audio signal
KR101309671B1 (ko) 2009-10-21 2013-09-23 돌비 인터네셔널 에이비 결합된 트랜스포저 필터 뱅크에서의 오버샘플링
CN102243872A (zh) * 2010-05-10 2011-11-16 炬力集成电路设计有限公司 对音频数字信号进行编码、解码的方法及***
EP2645365B1 (en) 2010-11-24 2018-01-17 LG Electronics Inc. Speech signal encoding method and speech signal decoding method
FR2977439A1 (fr) * 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
WO2013092292A1 (en) * 2011-12-21 2013-06-27 Dolby International Ab Audio encoder with parallel architecture
KR101390551B1 (ko) * 2012-09-24 2014-04-30 충북대학교 산학협력단 저 지연 변형된 이산 코사인 변환 방법
KR20140075466A (ko) 2012-12-11 2014-06-19 삼성전자주식회사 오디오 신호의 인코딩 및 디코딩 방법, 및 오디오 신호의 인코딩 및 디코딩 장치
CN110232929B (zh) * 2013-02-20 2023-06-13 弗劳恩霍夫应用研究促进协会 用于对音频信号进行译码的译码器和方法
EP2830058A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
EP3230980B1 (en) * 2014-12-09 2018-11-28 Dolby International AB Mdct-domain error concealment
BR112018008874A8 (pt) * 2015-11-09 2019-02-26 Sony Corp aparelho e método de decodificação, e, programa.

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06268608A (ja) * 1993-03-11 1994-09-22 Sony Corp 圧縮データ記録及び/又は再生若しくは伝送及び/又は受信装置、圧縮データの圧縮データ記録及び/又は再生若しくは伝送及び/又は受信方法、及び記録媒体
JP2000500247A (ja) * 1996-07-11 2000-01-11 フラオホッフェル―ゲゼルシャフト ツル フェルデルング デル アンゲヴァンドテン フォルシュング エー.ヴェー. 可聴信号のコーディングおよびデコーディング方法
JP2000134106A (ja) * 1998-10-29 2000-05-12 Matsushita Electric Ind Co Ltd オーディオ変換符号化のための周波数領域でのブロックサイズ判定適応方法
JP2003066998A (ja) * 2001-08-28 2003-03-05 Mitsubishi Electric Corp 音響信号符号化装置
JP2003216188A (ja) * 2002-01-25 2003-07-30 Matsushita Electric Ind Co Ltd オーディオ信号符号化方法、符号化装置、及び記憶媒体
JP2004252068A (ja) * 2003-02-19 2004-09-09 Matsushita Electric Ind Co Ltd デジタルオーディオ信号の符号化装置及び方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ZA921988B (en) * 1991-03-29 1993-02-24 Sony Corp High efficiency digital data encoding and decoding apparatus
US5487086A (en) * 1991-09-13 1996-01-23 Comsat Corporation Transform vector quantization for adaptive predictive coding
US5285498A (en) 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
US5533052A (en) * 1993-10-15 1996-07-02 Comsat Corporation Adaptive predictive coding with transform domain quantization based on block size adaptation, backward adaptive power gain control, split bit-allocation and zero input response compensation
US6167093A (en) * 1994-08-16 2000-12-26 Sony Corporation Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission
WO1996006489A1 (fr) * 1994-08-22 1996-02-29 Sony Corporation Emetteur-recepteur
US5701389A (en) 1995-01-31 1997-12-23 Lucent Technologies, Inc. Window switching based on interblock and intrablock frequency band energy
US5852806A (en) * 1996-03-19 1998-12-22 Lucent Technologies Inc. Switched filterbank for use in audio signal coding
US5825320A (en) * 1996-03-19 1998-10-20 Sony Corporation Gain control method for audio encoding device
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
US6138120A (en) * 1998-06-19 2000-10-24 Oracle Corporation System for sharing server sessions across multiple clients
DE19921122C1 (de) * 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
US20020147652A1 (en) * 2000-10-18 2002-10-10 Ahmed Gheith System and method for distruibuted client state management across a plurality of server computers
JP2002196792A (ja) * 2000-12-25 2002-07-12 Matsushita Electric Ind Co Ltd 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム
AU2001276588A1 (en) * 2001-01-11 2002-07-24 K. P. P. Kalyan Chakravarthy Adaptive-block-length audio coder
US7460993B2 (en) * 2001-12-14 2008-12-02 Microsoft Corporation Adaptive window-size selection in transform coding
EP1394772A1 (en) * 2002-08-28 2004-03-03 Deutsche Thomson-Brandt Gmbh Signaling of window switchings in a MPEG layer 3 audio data stream
US7325023B2 (en) * 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
US7315822B2 (en) * 2003-10-20 2008-01-01 Microsoft Corp. System and method for a media codec employing a reversible transform obtained via matrix lifting
CN101061533B (zh) * 2004-10-26 2011-05-18 松下电器产业株式会社 语音编码装置和语音编码方法
US7386445B2 (en) * 2005-01-18 2008-06-10 Nokia Corporation Compensation of transient effects in transform coding

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06268608A (ja) * 1993-03-11 1994-09-22 Sony Corp 圧縮データ記録及び/又は再生若しくは伝送及び/又は受信装置、圧縮データの圧縮データ記録及び/又は再生若しくは伝送及び/又は受信方法、及び記録媒体
JP2000500247A (ja) * 1996-07-11 2000-01-11 フラオホッフェル―ゲゼルシャフト ツル フェルデルング デル アンゲヴァンドテン フォルシュング エー.ヴェー. 可聴信号のコーディングおよびデコーディング方法
JP2000134106A (ja) * 1998-10-29 2000-05-12 Matsushita Electric Ind Co Ltd オーディオ変換符号化のための周波数領域でのブロックサイズ判定適応方法
JP2003066998A (ja) * 2001-08-28 2003-03-05 Mitsubishi Electric Corp 音響信号符号化装置
JP2003216188A (ja) * 2002-01-25 2003-07-30 Matsushita Electric Ind Co Ltd オーディオ信号符号化方法、符号化装置、及び記憶媒体
JP2004252068A (ja) * 2003-02-19 2004-09-09 Matsushita Electric Ind Co Ltd デジタルオーディオ信号の符号化装置及び方法

Also Published As

Publication number Publication date
KR20070068424A (ko) 2007-06-29
CN101061533B (zh) 2011-05-18
JPWO2006046546A1 (ja) 2008-05-22
WO2006046546A1 (ja) 2006-05-04
EP1793372B1 (en) 2011-12-14
ATE537536T1 (de) 2011-12-15
EP1793372A4 (en) 2008-01-23
US8326606B2 (en) 2012-12-04
CN101061533A (zh) 2007-10-24
US20080065373A1 (en) 2008-03-13
EP1793372A1 (en) 2007-06-06
BRPI0517513A (pt) 2008-10-14

Similar Documents

Publication Publication Date Title
JP5100124B2 (ja) 音声符号化装置および音声符号化方法
ES2753899T3 (es) Mezclado de trenes de datos de entrada y generación de un tren de datos de salida a partir de los mismos
US7769584B2 (en) Encoder, decoder, encoding method, and decoding method
KR101340233B1 (ko) 스테레오 부호화 장치, 스테레오 복호 장치 및 스테레오부호화 방법
JP5363488B2 (ja) マルチチャネル・オーディオのジョイント強化
JP5046653B2 (ja) 音声符号化装置および音声符号化方法
JP4606418B2 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
JP5036317B2 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
WO2008072737A1 (ja) 符号化装置、復号装置およびこれらの方法
JP2010244078A (ja) スペクトル包絡情報量子化装置、スペクトル包絡情報復号装置、スペクトル包絡情報量子化方法及びスペクトル包絡情報復号方法
KR20070070189A (ko) 음성 부호화 장치 및 음성 부호화 방법
JPWO2008132850A1 (ja) ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
JPWO2008132826A1 (ja) ステレオ音声符号化装置およびステレオ音声符号化方法
JP4536621B2 (ja) 復号装置、および復号方法
JP5340378B2 (ja) チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110909

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120327

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120620

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120628

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120904

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120925

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5100124

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees