JP2004151123A - 符号変換方法、符号変換装置、プログラム及びその記憶媒体 - Google Patents

符号変換方法、符号変換装置、プログラム及びその記憶媒体 Download PDF

Info

Publication number
JP2004151123A
JP2004151123A JP2002307733A JP2002307733A JP2004151123A JP 2004151123 A JP2004151123 A JP 2004151123A JP 2002307733 A JP2002307733 A JP 2002307733A JP 2002307733 A JP2002307733 A JP 2002307733A JP 2004151123 A JP2004151123 A JP 2004151123A
Authority
JP
Japan
Prior art keywords
information
linear prediction
prediction coefficient
excitation signal
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002307733A
Other languages
English (en)
Inventor
Atsushi Murashima
淳 村島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2002307733A priority Critical patent/JP2004151123A/ja
Priority to PCT/JP2003/013347 priority patent/WO2004038696A1/ja
Priority to DE60329129T priority patent/DE60329129D1/de
Priority to EP06015364A priority patent/EP1717796B1/en
Priority to DE60308890T priority patent/DE60308890T2/de
Priority to EP03754175A priority patent/EP1560201B1/en
Priority to AU2003273043A priority patent/AU2003273043A1/en
Priority to US10/531,899 priority patent/US20060149537A1/en
Priority to CNB2003801019151A priority patent/CN100524460C/zh
Publication of JP2004151123A publication Critical patent/JP2004151123A/ja
Priority to HK05109131A priority patent/HK1077389A1/xx
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

【課題】音声をある方式により符号化して得た符号を、他の方式により復号可能な符号に高音質かつ低演算量で変換する。
【解決手段】線形予測係数符号変換回路1100は、第1の符号列から第1の線形予測係数の情報を得て、これを記憶保持し、また、記憶保持されている過去の第1の線形予測係数の情報から第1の線形予測係数の情報を計算し、これから第2の線形予測係数の情報を求める。部分音声復号回路1500は、第1の符号列から第1の励振信号の情報を得て、これを記憶保持し、また、記憶保持されている過去の第1の励振信号の情報から第1の励振信号の情報を計算し、第1の線形予測係数をもつフィルタを第1の励振信号で駆動して第1の音声信号を生成する。励振信号情報生成回路2600は、第1の線形予測係数と第2の線形予測係数と第1の音声信号とから第2の励振信号の情報を求める。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、音声信号を低ビットレートで伝送あるいは蓄積するための符号化および復号方法に関し、特に、異なる符号化復号方式を用いて音声通信を行うに際し、音声をある方式により符号化して得た符号を、他の方式により復号可能な符号に高音質かつ低演算量で変換する、符号変換方法、符号変換装置、プログラム及びその記録媒体に関する。
【0002】
【従来の技術】
音声信号を中低ビットレートで高能率に符号化する方法として、音声信号を線形予測(Linear Prediction:LP)フィルタとそれを駆動する励振信号に分離して符号化する方法が広く用いられている。
【0003】
その代表的な方法の一つにCode Excited Linear Prediction(CELP)がある。CELPでは、入力音声の周波数特性を表すLP係数が設定されたLPフィルタを、入力音声のピッチ周期を表す適応コードブック(Adaptive Codebook:ACB)と、乱数やパルスから成る固定コードブック(Fixed Codebook: FCB)との和で表される励振信号により駆動することで、合成音声信号が得られる。このとき、ACB成分とFCB成分には各々ゲイン(ACBゲインとFCBゲイン)を乗ずる。なお、CELPに関しては非特許文献1が参照される。
【0004】
【非特許文献1】
M. Schroeder著「Code excited linear prediction: High quality speech atvery low bit rates 」、(Proc. of IEEE Int. Conf. on Acoust., Speech and Signal Processing, pp.937−940, 1985 )
【0005】
ところで、例えば3G 移動体網と有線パケット網間の相互接続を想定した場合、各網で用いられる標準音声符号化方式が異なるため、直接接続できないという問題がある。これに対する解法としてはタンデム接続が考えられる。
【0006】
図12は、第1の音声符号化方式(方式1)を用いて音声を符号化して得た符号(第1の符号列)を、第2の方式(方式2)により復号可能な符号(第2の符号列)に変換する、従来の符号変換装置の構成の一例を示す図である。図12を参照して、タンデム接続に基づく従来の符号変換装置について説明する。
【0007】
符号分離回路1010は、入力端子10を介して入力した第1 の符号列から、音声パラメータ、すなわち、LP係数、ACB、FCB、ACBゲインおよびFCBゲインに対応する符号(LP係数符号、ACB符号、FCB符号、ゲイン符号)を分離する。ここで、ACBゲインとFCBゲインはまとめて符号化復号されるものとし、簡単のため、これをゲイン、その符号をゲイン符号と呼ぶことにする。また、LP係数符号、ACB符号、FCB符号、ゲイン符号を各々第1のLP係数符号、第1 のACB符号、第1のFCB符号、第1のゲイン符号として、音声復号回路1050へ出力する。
【0008】
ところで、音声符号変換装置に関しては、特許文献1が参照される。
【0009】
【特許文献1】
特開2002−202799号公報(図1)
【0010】
音声復号回路1050は、符号分離回路1010から出力される第1のLP係数符号、第1 のACB符号、第1のFCB符号、第1のゲイン符号を入力し、これらの符号から方式1の復号方法により音声を復号し、復号された音声を第1の復号音声として音声符号化回路1060へ出力する。
【0011】
音声符号化回路1060は、音声復号回路1050から出力される第1の復号音声を入力し、これを第2の符号化方法により符号化してLP係数符号、ACB符号、FCB符号、ゲイン符号を得る。そしてこれらの符号を第2のLP係数符号、第2のACB符号、第2のFCB符号、第2のゲイン符号として、符号多重回路1020へ出力する。
【0012】
なお、音声の符号化方法および復号方法に関しては、前述の非特許文献1または非特許文献2が参照される。
【0013】
【非特許文献2】
「AMR speech codec; Transcoding functions 」(3GPP TS 26.090)
【0014】
符号多重回路1020は、音声符号化回路1060から出力される第2のLP係数符号、第2のACB符号号、第2のFCB符号、第2のゲイン符号を入力し、これらを多重化して得られる符号列を第2の符号列として出力端子20を介して出力する。以上により図12の説明を終える。
【0015】
なお、後述するが、過去のLSPから現フレームのLSPを計算する方法については、非特許文献3を参照することもできる。
【0016】
【非特許文献3】
「AMR speech codec; Error concealment of lost frames」(3GPP TS 26.091)の第6.2.3 節の記載
【0017】
【発明が解決しようとする課題】
しかしながら、上述した従来の符号変換装置は、パケットロスなどにより第1の符号列が利用できない場合、変換後の第2の符号列から復号される音声信号の音質劣化が著しいという問題点を有している。その理由は、第1の符号列が利用できない場合、方式1において過去に復号されて記憶保持されている音声パラメータを利用することによって劣化を伴った音声信号を生成し、この音声信号を方式2により再分析して符号化を行うことにより第2の符号列を得るからである。
【0018】
したがって、本発明は、上記問題点に鑑みてなされたものであって、その主たる目的は、第1の符号列が利用できない場合に、第2の符号列から復号される音声信号の音質劣化を軽減できる符号変換装置、符号変換方法、プログラム及びその記録媒体を提供することにある。これ以外の本発明の目的、特徴、利点等は以下の説明から、当業者には直ちに明らかとされるであろう。
【0019】
【課題を解決するための手段】
上記課題を解決するために本発明に係る符号変換方法は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換方法であって、前記第1の符号列が利用できない場合には、前記第1の方式において過去に復号され記憶保持されている音声パラメータを直接利用して前記第2の符号列を求めるステップを含むことを特徴とする。
【0020】
また、本発明に係る他の符号変換方法は、前記第1の符号列から第1の線形予測係数の情報を得るステップと、前記第1の符号列から第1の励振信号の情報を得るステップと、前記第1の線形予測係数の情報を記憶保持するステップと、前記第1の励振信号の情報を記憶保持するステップと、記憶保持されている過去の第1の線形予測係数の情報から第1の線形予測係数の情報を計算するステップと、記憶保持されている過去の第1の励振信号の情報から第1の励振信号の情報を計算するステップと、前記第1の線形予測係数の情報から第2の線形予測係数の情報を求めるステップと、前記第1の励振信号の情報から第2の励振信号の情報を求めるステップとを含むことを特徴とする。
【0021】
さらに、本発明に係る他の符号変換方法は、上記符号変換方法において、前記第1の線形予測係数の情報から得られる第1の線形予測係数あるいは前記第2の線形予測係数の情報から得られる第2の線形予測係数をもつフィルタを前記第1の励振信号の情報から得られる第1の励振信号で駆動することによって第1の音声信号を生成するステップと、前記第1の線形予測係数または前記第2の線形予測係数と前記第1の音声信号とから第2の励振信号の情報を求めるステップを含むことを特徴とする。上記符号変換方法において、好ましくは、前記励振信号の情報が、適応コードブック情報と固定コードブック情報とゲイン情報とからなることを特徴とする。
【0022】
本発明に係る符号変換装置は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置であって、前記第1の符号列が利用できない場合には、前記第1の方式において過去に復号され記憶保持されている音声パラメータを直接利用して前記第2の符号列を求める手段を含むことを特徴とする。
【0023】
また、本発明に係る他の符号変換装置は、前記第1の符号列から第1の線形予測係数の情報を得る線形予測係数情報復号回路と、前記第1の符号列から第1の励振信号の情報を得る励振信号情報復号回路と、前記第1の線形予測係数の情報を記憶保持する線形予測係数情報記憶回路と、前記第1の励振信号の情報を記憶保持する励振信号情報記憶回路と、記憶保持されている過去の第1の線形予測係数の情報から第1の線形予測係数の情報を計算する線形予測係数情報計算回路と、記憶保持されている過去の第1の励振信号の情報から第1の励振信号の情報を計算する励振信号情報計算回路と、前記第1の線形予測係数の情報から第2の線形予測係数の情報を求める線形予測係数情報符号化回路と、前記第1の励振信号の情報から第2の励振信号の情報を求める励振信号情報生成回路とを含むことを特徴とする。
【0024】
さらに、本発明に係る他の符号変換装置は、前記第1の線形予測係数の情報から得られる第1の線形予測係数あるいは前記第2の線形予測係数の情報から得られる第2の線形予測係数をもつフィルタを前記第1の励振信号の情報から得られる第1の励振信号で駆動することによって第1の音声信号を生成する部分音声復号回路と、前記第1の線形予測係数または前記第2の線形予測係数と前記第1の音声信号とから第2の励振信号の情報を求める励振信号情報生成回路とを含むことを特徴とする。
【0025】
上記符号変換装置において、好ましくは、前記励振信号の情報が、適応コードブック情報と固定コードブック情報とゲイン情報とからなることを特徴とする。
【0026】
本発明に係るプログラムは、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置を構成するコンピュータに、
前記第1の符号列が利用できない場合には、前記第1の方式において過去に復号され記憶保持されている音声パラメータを直接利用して前記第2の符号列を求める処理を実行させるためのプログラムであることを特徴とする。
【0027】
また、本発明に係る他のプログラムは、前記第1の符号列から第1の線形予測係数の情報を得る処理と、
前記第1の符号列から第1の励振信号の情報を得る処理と、
前記第1の線形予測係数の情報を記憶保持する処理と、
前記第1の励振信号の情報を記憶保持する処理と、
記憶保持されている過去の第1の線形予測係数の情報から第1の線形予測係数の情報を計算する処理と、
記憶保持されている過去の第1の励振信号の情報から第1の励振信号の情報を計算する処理と、
前記第1の線形予測係数の情報から第2の線形予測係数の情報を求める処理と、
前記第1の励振信号の情報から第2の励振信号の情報を求める処理と、
を実行させるためのプログラムであることを特徴とする(図10のフローチャート参照)。
【0028】
さらに、本発明に係る他のプログラムは、前記第1の線形予測係数の情報から得られる第1の線形予測係数あるいは前記第2の線形予測係数の情報から得られる第2の線形予測係数をもつフィルタを前記第1の励振信号の情報から得られる第1の励振信号で駆動することによって第1の音声信号を生成し、前記第1の線形予測係数または前記第2の線形予測係数と前記第1の音声信号とから第2の励振信号の情報を求めることを特徴とする。
【0029】
上記プログラムにおいて、好ましくは、前記励振信号の情報が、適応コードブック情報と固定コードブック情報とゲイン情報とからなることを特徴とする。
【0030】
さらに、本発明による記録媒体には上記プログラムが記録されていることを特徴とする。
【0031】
【発明の実施の形態】
以下、本発明の実施の形態について添付図面を参照しながら説明する。まず、本発明の装置と方法の概要と原理を説明したあと、実施例について以下に詳細に説明する。図1は本発明に係る符号変換装置の第1 実施例の構成図である。
【0032】
同図を参照すると、本発明に係る符号変換装置は線形予測係数符号変換回路(LP係数符号変換回路)1100と、部分音声復号回路1500と、励振信号情報生成回路(第2の励振信号情報生成回路)2600とを含んで構成される。
【0033】
線形予測係数符号変換回路1100は、第1の方式に準拠する第1の符号列から第1の線形予測係数の情報を得て、これを記憶保持し、また、記憶保持されている過去の第1の線形予測係数の情報から第1の線形予測係数の情報を計算し、これから第2の線形予測係数の情報を求める。部分音声復号回路1500は、第1の符号列から第1の励振信号の情報を得て、これを記憶保持し、また、記憶保持されている過去の第1の励振信号の情報から第1の励振信号の情報を計算し、第1の線形予測係数をもつフィルタを第1の励振信号で駆動して第1の音声信号を生成する。励振信号情報生成回路2600は、第1の線形予測係数と第2の線形予測係数と第1の音声信号とから第2の励振信号の情報を求める。
【0034】
次に、本発明に係る方法は以下のステップを有する(図11のフローチャート参照)。
ステップa:第1の符号列から第1の線形予測係数の情報を得る。
ステップb :第1の線形予測係数の情報から第1の線形予測係数を得る。
ステップc :第1の線形予測係数の情報を記憶保持する。
ステップd :記憶保持されている過去の第1の線形予測係数の情報から第1の線形予測係数の情報を計算する。
ステップe :第1の線形予測係数の情報から第2の線形予測係数の情報を求める。
ステップf :第2の線形予測係数の情報から第2の線形予測係数を得る。
ステップg :第1の符号列から第1の励振信号の情報を得る。
ステップh :第1の励振信号の情報を記憶保持する。
ステップi :記憶保持されている過去の第1の励振信号の情報から第1の励振信号の情報を計算する。
ステップj :第1の励振信号の情報から第1の励振信号を得る。
ステップk :第1の線形予測係数あるいは前記第2の線形予測係数をもつフィルタを前記励振信号により駆動することによって第1の音声信号を生成する。
ステップl :第1の線形予測係数と前記第2の線形予測係数と前記第1の音声信号とから第2の励振信号の情報を求める。
【0035】
次に、本発明の作用を述べる。本発明では、第1の符号列が利用できない場合には、方式1において過去に復号されて記憶保持されている音声パラメータを直接利用して第2の符号列を求める。
【0036】
このため、方式1において過去の音声パラメータから生成される劣化を伴った音声信号を方式2により再分析して符号化を行うことに起因する、第2の符号列から復号される音声信号における音質劣化を軽減できる。
【0037】
【実施例】
次に、本発明の実施例について図面を参照して詳細に説明する。まず、第1 実施例について説明する。第1 実施例の説明には前述の図1を用いる。同図を参照すると、符号変換装置は符号分離回路1010と、LP係数符号変換回路1100と、LSP−LPC変換回路1110と、インパルス応答計算回路1120と部分音声復号回路1500と、第2の励振信号情報生成回路2600と、第2の励振信号計算回路1610と、第2の励振信号記憶回路1620と、符号多重回路1020とを含んで構成される。
【0038】
同図において、従来例の図12と同一または同等の要素には、同一の参照符号が付されている。図1において、入力端子10、出力端子20、符号分離回路1010、符号多重回路1020は、結線の一部が分岐する以外は基本的に図10に示した要素と同じである。以下では、上述した同一または同等の要素の説明は省略し、主に、図10に示した構成との相違点について説明する。
【0039】
また、方式1において、LP係数の符号化はTfr1 msec周期(フレーム)毎に行われ、ACB、FCBおよびゲインなど励振信号の構成要素の符号化はTsfr1=Tfr1/Nsfr1 msec周期(サブフレーム)毎に行われるものとし、一方、方式2においては、LP係数の符号化はTfr2 msec周期(フレーム)毎に行われ、励振信号の構成要素の符号化はTsfr2=Tfr2/Nsfr2 msec周期(サブフレーム)毎に行われるものとする。
【0040】
また、方式1のフレーム長、サブフレーム数およびサブフレーム長を各々Lfr1、Nsfr1およびLsfr1=Lfr1/Nsfr1とし、方式2のフレーム長、サブフレーム数およびサブフレーム長を各々Lfr2、Nsfr2およびLsfr2=Lfr2/Nsfr2とする。以下の説明では、簡単のため、Lfr1= Lfr2、Nsfr1=Nsfr2=2、Lsfr1=Lsfr2 とする。ここで、例えば、サンプリング周波数を8000Hz とし、Tfr1およびTfr2を10msecとすれば、Lfr1およびLfr2は160サンプル、Lsfr1およびLsfr2は80サンプルとなる。
【0041】
LP係数符号変換回路1100は、符号分離回路1010から第1のLP係数符号を入力し、フレーム消失フラグを入力端子45を介して入力する。ここで、前述の非特許文献2やITU−T勧告G.729など多くの標準方式では、LP係数を線スペクトル対(Line Spectral Pair:LSP)で表現し(LP係数情報としてLSPを用いる)、LSPを符号化および復号することが多いため、LP係数の符号化および復号は、LSP領域で行われるとする。LP係数からLSPへの変換、およびLSP からLP係数への変換については、周知の方法、例えば非特許文献2の第5.2.3節および第5.2.4節の記載が参照される。
【0042】
次に、第1のLP係数符号を方式1におけるLSP 復号方法により復号して、第1のLSPを得る。パケットロスなどにより現在のフレームにおいて第1の符号列が利用できない場合には、過去のフレームにおいて復号され記憶保持されている過去の第1のLSPから現在のフレームにおける第1のLSPを計算する。現在のフレームが利用可能か否かは、前記フレーム消失フラグにより通知される。
【0043】
そして、第1のLSPを、方式2におけるLSP量子化方法および符号化方法により量子化および符号化して、第2のLSPとこれに対応する符号( 第2のLP係数符号) を得る。そして、第2のLP係数符号を方式2におけるLSP復号方法により復号可能な符号として符号多重回路1020へ出力し、第1のLSP
と第2のLSPをLSP−LPC変換回路1110へ出力する。
【0044】
次に、図2を参照して、LP係数符号変換回路1100の各構成要素について説明する。図2はLP係数符号変換回路1100の一例の構成図である。同図を参照すると、LP係数符号変換回路1100はLSP計算回路117と、LSP復号回路110と、第1のLSPコードブック111と、LSP記憶回路116と、LSP符号化回路130と、第2のLSPコードブック131とを含んで構成される。
【0045】
LSP復号回路110は、フレーム消失フラグを入力端子45を介して入力する。このフレーム消失フラグにより現フレームが利用可能と通知される場合、符号分離回路1010から出力される第1のLP係数符号を入力端子31を介して入力し、前記第1のLP係数符号に対応するLSP を、複数セットのLSPが格納された第1のLSPコードブック111より読み出し、読み出されたLSPを第1のLSPとする。ここで、LP係数符号からのLSPの復号は、方式1におけるLSPの復号方法に従い、方式1のLSPコードブックを用いる。前記フレーム消失フラグにより現フレームが利用不可能と通知される場合、LSP計算回路117から出力される第1のLSPを入力する。そして前記第1のLSPをLSP符号化回路130とLSP記憶回路116へ出力するとともに、出力端子33を介してLSP−LPC変換回路1110へ出力する。
【0046】
LSP計算回路117は、フレーム消失フラグを入力端子45を介して入力する。前記フレーム消失フラグにより現フレームが利用不可能と通知される場合、LSP記憶回路116から出力される過去の第1のLSPを入力し、次式により現フレームにおける第1のLSPを計算し、前記第1のLSPをLSP復号回路110へ出力する。
【0047】
【数1】
Figure 2004151123
式(1)において、qj(n)は第nフレームにおけるLSP、Nは定数(例えば、2)、ckは定数(例えば、c1は0.9、c2は0.1)、P は線形予測次数( 例えば、10) である。なお、過去のLSPから現フレームのLSPを計算する方法については、前述の非特許文献3を参照することもできる。
【0048】
LSP記憶回路116は、LSP復号回路110から出力される第1のLSPを入力し、フレーム消失フラグを入力端子45を介して入力し、前述の第1のLSPを記憶保持する。前述のフレーム消失フラグにより現フレームが利用不可能と通知される場合、前述の記憶保持された第1のLSPをLSP復号回路110へ出力する。
【0049】
LSP符号化回路130は、LSP復号回路110から出力され前述の第1のLSPを入力し、複数セットのLSPが格納された第2のLSPコードブック131から第2のLSPとそれに対応するLP係数符号の各々を順次読み込み、前記第1のLSPとの誤差が最小となる前記第2のLSPを選択し、それに対応する前記LP係数符号を、第2のLP係数符号として出力端子32を介して符号多重回路1020へ出力し、前記第2のLSPを出力端子34を介してLSP−LPC変換回路1110へ出力する。ここで、前記第2のLSPの選択方法、すなわちLSPの量子化および符号化方法は、方式2におけるLSPの量子化方法および符号化方法に従い、方式2のLSPコードブックを用いる。ここで、LSPの量子化および符号化については、例えば非特許文献2の第5.2.5 節の記載が参照される。
【0050】
以上により、図2によるLP係数符号変換回路1100の説明を終え、再び図1の説明に戻る。
【0051】
LSP−LPC変換回路1110は、LP係数符号変換回路1100から出力される第1 のLSPと第2のLSPとを入力し、第1 のLSPを第1のLP係数に変換し、第2のLSPを第2のLP係数に変換し、第1のLP係数を第2の励振信号情報生成回路2600内のACB符号生成回路2200と部分音声復号回路1500とインパルス応答計算回路1120へ出力し、第2のLP係数を第2の励振情報生成回路2600内のACB符号生成回路2200とインパルス応答計算回路1120へ出力する。ここで、LSPからLP係数への変換については、非特許文献2の第5.2.4 節の記載が参照される。
【0052】
部分音声復号回路1500は、符号分離回路1010から出力される第1 のACB符号、第1のFCB符号、第1 のゲイン符号を入力し、LSP−LPC変換回路1110から第1のLP係数を入力し、フレーム消失フラグを入力端子45を介して入力する。前記フレーム消失フラグにより現フレームが利用可能と通知される場合は、方式1におけるACB信号復号方法、FCB信号復号方法およびゲイン復号方法の各々を用いて、前記第1 のACB符号、前記第1 のFCB符号および前記第1 のゲイン符号の各々から、第1のACB遅延、第1のFCB信号および第1のゲインの各々を復号する。前記フレーム消失フラグにより現フレームが利用不可能と通知される場合は、雑音信号を第1のFCB信号とし、過去のフレームにおいて復号され記憶保持されている過去の第1のACB遅延と第1のゲインの各々から、現在のフレームにおける第1のACB遅延と第1のゲインを計算する。そして、前記第1 のACB遅延を用いて第1のACB信号を生成し、前記第1 のACB信号、前記第1 のFCB信号および前記第1 のゲインと、前記第1のLP係数とから、第1の音声を生成し、前記第1の音声をACB符号生成回路2200へ出力する。ここで、第1のLP係数の代わりに第2のLP係数を用いることもできる。
【0053】
次に、図3を参照して、部分音声復号回路1500の各構成要素について説明する。図3は部分音声復号回路1500の一例の構成図である。同図を参照すると、部分音声復号回路1500は励振信号情報復号回路1600と、励振信号情報計算回路1607と、励振信号情報記憶回路1606と、励振信号記憶回路1570と、励振信号計算回路1540と、合成フィルタ1580とを含んで構成される。さらに、励振信号情報復号回路1600はACB復号回路1510と、FCB復号回路1520と、雑音生成回路1526と、ゲイン復号回路1530とを含んで構成され、励振信号情報計算回路1607はACB遅延計算回路1517と、ゲイン計算回路1537とを含んで構成され、励振信号情報記憶回路1606はACB遅延記憶回路1516と、ゲイン記憶回路1536とを含んで構成される。
【0054】
励振信号情報復号回路1600は、励振信号の情報に対応する符号からその励振信号の情報を復号する。符号分離回路1010から出力される第1のACB符号、第1 のFCB符号および第1 のゲイン符号を各々入力端子51、52および53を介して入力し、前記第1 のACB符号、前記第1 のFCB符号および前記第1 のゲイン符号の各々から、ACB遅延、FCB信号およびゲインの各々を復号し、各々を第1のACB遅延、第1 のFCB信号および第1 のゲインとする。ここで、前記第1 のゲインは、ACBゲインとFCBゲインとからなり、各々を第1 のACBゲインと第1 のFCBゲインとする。ただし、入力端子45を介して入力されるフレーム消失フラグにより現フレームが利用不可能と通知される場合は、雑音信号を第1のFCB信号とし、励振信号情報計算回路1607より第1のACB遅延と第1のゲインを入力する。次に、励振信号記憶回路1570から出力される過去の励振信号を入力する。前記過去の励振信号と前記第1 のACB遅延とを用いてACB信号を生成し、これを第1 のACB信号とする。そして、前記第1 のACB信号、前記第1 のFCB信号、前記第1 のACBゲインおよび前記第1 のFCBゲインを、励振信号計算回路1540へ出力する。
【0055】
励振信号情報計算回路1607は、入力端子45を介して入力されるフレーム消失フラグにより現フレームが利用不可能と通知される場合は、過去のフレームにおいて復号され記憶保持されている過去の第1のACB遅延と第1のゲインを励振信号情報記憶回路1606から入力し、その各々から現在のフレームにおける第1のACB遅延と第1のゲインを計算し、これらを励振信号情報復号回路1600へ出力する。
【0056】
励振信号情報記憶回路1606は、励振信号情報復号回路1600から出力される第1のACB遅延と第1のゲインとを入力し、前記第1のACB遅延と第1のゲインを記憶保持する。入力端子45を介して入力されるフレーム消失フラグにより現フレームが利用不可能と通知される場合は、記憶保持されている過去の第1のACB遅延と第1のゲインを励振信号情報計算回路1607へ出力する。
【0057】
次に、励振信号情報復号回路1600の構成要素であるACB復号回路1510、FCB復号回路1520、ゲイン復号回路1530および雑音生成回路1526、励振信号情報計算回路1607の構成要素であるACB遅延計算回路1517およびゲイン計算回路1537、励振信号情報記憶回路1606の構成要素であるACB遅延記憶回路1516およびゲイン記憶回路1536を詳細に説明する。
【0058】
ACB復号回路1510は、励振信号記憶回路1570から出力される過去の励振信号を入力し、フレーム消失フラグを入力端子45を介して入力する。そのフレーム消失フラグにより現フレームが利用可能と通知される場合、符号分離回路1010から出力される第1 のACB符号を、入力端子51を介して入力し、図4に示す方式1におけるACB符号とACB遅延の対応関係を用いて、第1 のACB符号に対応する第1のACB遅延T1を得る。フレーム消失フラグにより現フレームが利用不可能と通知される場合、ACB遅延計算回路1517から出力される第1のACB遅延T1を入力する。過去の励振信号において、現サブフレームの始点よりT1サンプル過去の点から、サブフレーム長に相当するL_sfr1サンプルの信号を切り出して、第1のACB信号を生成する。ここで、T1がL_sfr1よりも小さい場合には、T1サンプル分のベクトルを切り出し、このベクトルを繰り返し接続して、長さL_sfr1サンプルの信号とする。そして、第1のACB信号を励振信号計算回路1540へ出力し、第1のACB遅延を出力端子62を介して(第2の励振信号情報生成回路2600内の)ACB符号生成回路2200内のACB符号化回路2220へ出力する。ここで、第1のACB信号を生成する方法の詳細については、非特許文献2の第6.1節および第5.6節の記載が参照される。
【0059】
ACB遅延計算回路1517は、フレーム消失フラグを入力端子45を介して入力する。フレーム消失フラグにより現フレームが利用不可能と通知される場合、ACB遅延記憶回路1516から出力される過去の第1のACB遅延を入力し、次式により現フレームにおける第1のACB遅延を計算し、第1のACB遅延をACB復号回路1510へ出力する。
【0060】
【数2】
Figure 2004151123
ここで、d(n)は第nフレームの第2サブフレームにおけるACB遅延、N は定数(例えば、2)、ckは定数( 例えば、c1は0.9、c2は0.1) である。なお、過去のACB遅延から現フレームのACB遅延を計算する方法については、非特許文献3の第6.2.3節の記載を参照することもできる。
【0061】
ACB遅延記憶回路1516は、ACB復号回路1510から出力される第1のACB遅延を入力し、フレーム消失フラグを入力端子45を介して入力し、第1のACB遅延を記憶保持する。フレーム消失フラグにより現フレームが利用不可能と通知される場合、記憶保持された第1のACB遅延をACB遅延計算回路1517へ出力する。
【0062】
FCB復号回路1520は、フレーム消失フラグを入力端子45を介して入力する。フレーム消失フラグにより現フレームが利用可能と通知される場合、符号分離回路1010から出力される第1 のFCB符号を、入力端子52を介して入力し、第1のFCB符号に対応する第1のFCB信号を、励振信号計算回路1540へ出力する。ここで、FCB符号からのFCB信号の復号は、方式1におけるFCB信号の復号方法に従う。フレーム消失フラグにより現フレームが利用不可能と通知される場合、雑音生成回路1526から出力される第1のFCB信号を入力し、これを励振信号計算回路1540へ出力する。ここで、FCB信号は、パルス位置とパルス極性で規定されるマルチパルス信号により表現されることが多い。このとき、第1 のFCB符号はパルス位置に対応する符号( パルス位置符号) とパルス極性に対応する符号( パルス極性符号) とからなる。マルチパルス信号により表現されたFCB信号を生成する方法の詳細については、非特許文献2の第6.1節および第5.7節の記載が参照される。
【0063】
雑音生成回路1526は、フレーム消失フラグを入力端子45を介して入力し、これにより現フレームが利用不可能と通知される場合、雑音信号を生成し、これを第1のFCB信号としてFCB復号回路1520へ出力する。なお、雑音信号を生成する方法については、非特許文献3の第6.2.3節の記載を参照することもできる。
【0064】
ゲイン復号回路1530は、フレーム消失フラグを入力端子45を介して入力する。フレーム消失フラグにより現フレームが利用可能と通知される場合、符号分離回路1010から出力される第1 のゲイン符号を、入力端子53を介して入力し、第1 のゲイン符号に対応するゲインを、複数のゲインが格納されたゲインコードブックから読み出す。ここで、ゲイン符号からのゲインの復号は、方式1におけるゲインの復号方法に従い、方式1のゲインコードブックを用いる。そして、読み出されたゲイン、すなわち、ACBゲインに対応する第1のACBゲインと、FCBゲインに対応する第1のFCBゲインとを励振信号計算回路1540へ出力する。フレーム消失フラグにより現フレームが利用不可能と通知される場合、ゲイン計算回路から出力される第1のACBゲインおよび第1のFCBゲインを入力し、これを励振信号計算回路1540へ出力する。ここで、第1のACBゲインと第1のFCBゲインがまとめて符号化される場合には、ゲインコードブックには第1のACBゲインと第1のFCBゲインとから成る2次元ベクトルが複数格納される。また、第1のACBゲインと第1のFCBゲインが個別に符号化される場合には、二つのゲインコードブックが内蔵され、一方のゲインコードブックに第1のACBゲインが複数格納され、他方のゲインコードブックに第1のFCBゲインが複数格納される。
【0065】
ゲイン計算回路1537は、フレーム消失フラグを入力端子45を介して入力する。フレーム消失フラグにより現フレームが利用不可能と通知される場合、ゲイン記憶回路1536から出力される過去の第1のACBゲインと過去の第1のFCBゲインを入力し、次式により現フレームにおける第1のACBゲインと第1のFCBゲインを計算し、これらをゲイン復号回路1530へ出力する。
【0066】
【数3】
Figure 2004151123
ここで、g(n)は第n フレームの第2サブフレームにおけるACBゲインまたはFCBゲイン、N は定数( 例えば、2) 、ckは定数( 例えば、c1は0.9 、c2は0.1) である。なお、過去のACBゲインと過去のFCBゲインから現フレームのACBゲインとFCBゲインを各々計算する方法については、非特許文献3の第6.2.3節の記載を参照することもできる。
【0067】
ゲイン記憶回路1536は、ゲイン復号回路1530から出力される第1のACBゲインと第1のFCBゲインを入力し、フレーム消失フラグを入力端子45を介して入力し、第1のACBゲインと第1のFCBゲインを記憶保持する。フレーム消失フラグにより現フレームが利用不可能と通知される場合、記憶保持された第1のACBゲインと第1のFCBゲインをゲイン復号回路1530へ出力する。
【0068】
励振信号計算回路1540は、ACB復号回路1510から出力される第1のACB信号を入力し、FCB復号回路1520から出力される第1のFCB信号を入力し、ゲイン復号回路1530から出力される第1のACBゲインと第1のFCBゲインとを入力する。第1のAC信号に第1のACBゲインを乗じて得た信号と、第1のFCB信号に第1のFCBゲインを乗じて得た信号と、を加算して第1の励振信号を得る。そして第1の励振信号を合成フィルタ1580と励振信号記憶回路1570とへ出力する。
【0069】
励振信号記憶回路1570は、励振信号計算回路1540から出力される第1の励振信号を入力し、これを記憶保持する。そして、過去に入力されて記憶保持されている過去の第1の励振信号をACB 復号回路1510へ出力する。
【0070】
合成フィルタ1580は、励振信号計算回路1540から出力される第1の励振信号を入力し、LSP _LPC変換回路1110から出力される第1のLP係数を入力端子61を介して入力する。そして、第1のLP係数をもつ線形予測フィルタを、第1の励振信号で駆動することにより第1の音声を生成する。第1の音声を(第2の励振信号情報生成回路2600内の)ACB符号生成回路2200内の目標信号計算回路2210へ出力端子63を介して出力する。なお、第1のLP係数の代わりに第2のLP係数を用いることも可能である。
【0071】
以上で図3による部分音声復号回路1500の説明を終え、再び図1の説明に戻る。
【0072】
第2の励振信号情報生成回路2600は、LSP _LPC変換回路1110から第1のLP係数と第2のLP係数とを入力し、部分音声復号回路1500から第1の音声と第1のACB遅延とを入力し、インパルス応答計算回路1120からインパルス応答信号を入力し、第2の励振信号記憶回路1620に記憶保持される過去の第2の励振信号を入力する。第1の音声と第1のLP係数および第2のLP係数とから第1の目標信号を計算し、過去の第2の励振信号とインパルス応答信号と第1の目標信号と第1のACB遅延とから、第2のACB遅延と第2のACB信号と最適ACBゲインとを求める。第1の目標信号と第2のACB信号と最適ACBゲインとインパルス応答信号とから第2の目標信号を計算し、第2の目標信号との距離が最小となるFCB信号を求め、第2のFCB信号とする。第1の目標信号と第2のACB信号と第2のFCB信号とインパルス応答信号と、ゲインコードブックに格納されたACBゲインとFCBゲインとから計算される、第1の目標信号と再構成音声との重み付け自乗誤差を最小にする第2のACBゲインと第2のFCBゲインとを選択する。そして、第2のACB信号と第2のFCB信号と第2のACBゲインおよび第2のFCBゲインを第2の励振信号計算回路1610へ出力し、第2のACB遅延と第2のFCB信号と第2のACBゲインおよび第2のFCBゲインの各々に対応する、方式2により復号可能な符号を、第2のACB符号と第2のFCB符号と第2のゲイン符号として符号多重回路1020へ出力する。
【0073】
図5を参照して、第2の励振信号情報生成回路2600の各構成要素について説明する。図5は第2の励振信号情報生成回路2600の一例の構成図である。同図を参照すると、第2の励振信号情報生成回路2600はACB符号生成回路2200と、FCB 符号生成回路1300と、ゲイン符号生成回路1400とを含んで構成される。
【0074】
ACB符号生成回路2200は、LSP_ LPC変換回路1110から第1のLP係数と第2のLP係数とを入力し、部分音声復号回路1500から第1の音声と第1のACB遅延とを入力し、インパルス応答計算回路1120からインパルス応答信号を入力し、第2の励振信号記憶回路1620に記憶保持される過去の第2の励振信号を入力する。第1の音声と第1のLP係数および第2のLP係数とから第1の目標信号を計算する。次に、過去の第2の励振信号とインパルス応答信号と第1の目標信号と第1のACB遅延とから、第2のACB遅延と第2のACB信号と最適ACBゲインとを求める。そして、第1の目標信号をFCB符号生成回路1300とゲイン符号生成回路1400へ出力し、最適ACBゲインをFCB符号生成回路1300へ出力し、第2のACB信号をFCB符号生成回路1300とゲイン符号生成回路1400と第2の励振信号計算回路1610へ出力し、第2のACB遅延に対応する、方式2により復号可能な符号を、第2のACB符号として符号多重回路1020へ出力する。
【0075】
図6を参照して、ACB符号生成回路2200の各構成要素について説明する。図6はACB符号生成回路2200の一例の構成図である。同図を参照すると、ACB符号生成回路2200は目標信号計算回路2210と、ACB符号化回路2220と、最適ACBゲイン計算回路2230とを含んで構成される。
【0076】
目標信号計算回路2210は、部分音声復号回路1500内の合成フィルタ1580から出力される第1の音声を入力端子57を介して入力し、LSP_ LPC変換回路1110から出力される第1のLP係数と第2のLP係数とを、各々入力端子36と入力端子35とを介して入力する。まず、第1のLP係数を用いて、聴感重み付けフィルタW(z)を構成する。そして、第1の音声により聴感重み付けフィルタを駆動して聴感重み付け音声信号を生成する。次に、第1のLP係数と第2のLP係数とを用いて、聴感重み付け合成フィルタW(z)/A2(z)を構成する。そして、聴感重み付け合成フィルタの零入力応答を聴感重み付け音声信号から減算して得られる第1の目標信号x(n)を、ACB符号化回路2220と最適ACBゲイン計算回路2230へ出力するとともに、FCB符号生成回路1300内の第2の目標信号計算回路1310へ出力端子78を介して出力する。なお、第1の目標信号を計算する方法の詳細については、非特許文献2の第5.5節の記載が参照できる。
【0077】
ACB符号化回路2220は、目標信号計算回路2210から出力される第1の目標信号を入力し、部分音声復号回路1500内のACB復号回路1510から出力される第1のACB遅延を入力端子58を介して入力し、インパルス応答計算回路1120から出力されるインパルス応答信号を入力端子74を介して入力し、第2の励振信号記憶回路1620から出力される過去の第2の励振信号を入力端子75を介して入力する。過去の第2の励振信号から遅延k で切り出された信号とインパルス応答信号との畳み込みにより、フィルタ処理された遅延k の過去の励振信号yk(n),n=0, …,Lsfr2−1を計算する。次に、第1のACB遅延を中心とする、ある値の範囲内にある遅延k について、yk(n) と第1の目標信号x(n)とから正規化相互相関を計算し、正規化相互相関が最大となる遅延を選択する。これは、x(n)とyk(n)との自乗誤差が最小となる遅延を選択することに対応する。この選択された遅延を第2のACB遅延d とし、過去の第2の励振信号から第2のACB遅延d で切り出された信号を第2のACB信号v (n )とする。ここで、正規化相互相関Rxy(k)は次式により表される。
【0078】
【数4】
Figure 2004151123
Rxy(k)の代りに、第1の目標信号の自己相関Rss(k)を用いることもできる。
【0079】
【数5】
Figure 2004151123
ここで、sw(n)は第1の目標信号である。
【0080】
また、Rss(k)の代りに、次式による正規化自己相関Rss’(k)を用いることもできる。
【0081】
【数6】
Figure 2004151123
この場合、演算量低減のために、自己相関Rss(k)を用いて予備選択を行い、予備選択された複数候補の中から、正規化自己相関Rss’(k )を用いて本選択を行っても良い。そして、第2のACB信号をFCB符号生成回路1300内の第2の目標信号計算回路1310とゲイン符号生成回路1400と第2の励振信号計算回路1610とへ出力端子76を介して出力し、第2のACB遅延に対応する第2のACB符号を符号多重回路1020へ出力端子54を介して出力し、フィルタ処理された遅延d の過去の励振信号yd(n) を最適ACBゲイン計算回路2230へ出力する。
【0082】
ここで、自乗誤差最小化に基づいてACB遅延を選択する上述の方法の代わりに、方式1における符号および遅延と方式2における符号および遅延との対応関係を用いることにより、第2のACB遅延および第2のACB符号を得ることもできる。ここで、図4を参照して、符号の読み替えについて説明する。図4は方式1における符号および遅延と方式2における符号および遅延との対応関係を示す図である。例えば、方式1におけるACB符号iT1が56のとき、これに対応するACB遅延T1が76であるとする。方式2では、ACB符号iT2が53のとき、これに対応するACB遅延T2が76であるとすると、ACB遅延の値が同一(この場合では76)となるように、方式1から方式2へとACB符号を変換するには、方式1におけるACB符号56を方式2におけるACB符号53に対応付ければよい。また、同一のACB遅延が存在しない場合には、例えば、最も近い値を選べばよい。
【0083】
以上により、符号の読み替えについての説明を終え、再び図6の説明に戻る。
【0084】
最適ACBゲイン計算回路2230は、目標信号計算回路2210から出力される第1の目標信号x(n)を入力し、ACB 符号化回路2220から出力されるフィルタ処理された遅延dの過去の励振信号yd(n)を入力する。ここで、遅延dは、第2のACB遅延である。次に、第1の目標信号x(n)とyd(n)から最適ABCゲインgpを次式により計算する。
【0085】
【数7】
Figure 2004151123
そして、最適ACBゲインをFCB符号生成回路1300内の第2の目標信号計算回路1310へ出力端子77を介して出力する。なお、第2のACB信号を計算する方法および最適ACBゲインを計算する方法の詳細については、非特許文献2の第6.1 節および第5.6 節の記載が参照できる。
【0086】
以上で図6によるACB符号生成回路2200の説明を終え、再び図5の説明に戻る。
【0087】
FCB符号生成回路1300は、ACB符号生成回路2200から出力される第1の目標信号と第2のACB信号と最適ACBゲインとを入力し、インパルス応答計算回路1120から出力されるインパルス応答信号を入力する。第1の目標信号と第2のACB信号と最適ACBゲインとインパルス応答信号とから第2の目標信号を計算する。次に、第2の目標信号と、FCB符号生成回路1300が内蔵するテーブルに格納されたFCB信号と、インパルス応答信号とから、第2の目標信号との距離が最小となるFCB信号を求める。そして、FCB信号に対応する、方式2により復号可能な符号を、第2のFCB符号として符号多重回路1020へ出力し、求められたFCB信号を、第2のFCB信号としてゲイン符号生成回路1400と第2の励振信号計算1610とへ出力する。
【0088】
図7を参照して、FCB符号生成回路1300の各構成要素について説明する。図7はFCB符号生成回路1300の一例の構成図である。同図を参照すると、FCB符号生成回路1300は第2の目標信号計算回路1310と、FCB符号化回路1320とを含んで構成される。
【0089】
第2の目標信号計算回路1310は、ACB符号生成回路2200内の目標信号計算回路2210から出力される第1の目標信号を入力端子81を介して入力し、インパルス応答計算回路1120から出力されるインパルス応答信号を入力端子84を介して入力し、ACB符号生成回路2200内のACB符号化回路2220から出力される第2のACB信号を入力端子83を介して入力し、ACB符号生成回路2200内の最適ACBゲイン計算回路2230から出力される最適ACBゲインを入力端子82を介して入力する。第2のACB信号とインパルス応答信号との畳み込みにより、フィルタ処理された第2のACB信号y(n),n=0,…, Lsfr1−1を計算し、Y (n )に最適ACBゲインを乗じて得られる信号を第1の目標信号から減算して第2の目標信号x’(n)を得る。そして、第2の目標信号をFCB符号化回路1320へ出力する。
【0090】
FCB符号化回路1320は、第2の目標信号計算回路1310から出力される第2の目標信号を入力し、インパルス応答計算回路1120から出力されるインパルス応答信号を入力端子84を介して入力する。FCB符号化回路1320は、複数のFCB信号が格納されたテーブルを内蔵しており、FCB信号をテーブルから順次読み出し、FCB信号とインパルス応答信号との畳み込みにより、フィルタ処理されたFCB信号z(n),n=0,…,Lsfr2−1を順次計算する。次に、z(n)と第2の目標信号x‘(n)とから正規化相互相関を順次計算し、正規化相互相関が最大となるFCB信号を選択する。これは、x’(n) とz(n)との自乗誤差が最小となるFCB信号を選択することに対応する。ここで、正規化相互相関Rx‘z(k)は次式により表される。
【0091】
【数8】
Figure 2004151123
この選択されたFCB信号を第2のFCB信号c (n )とする。そして、第2のFCB信号に対応する、方式2により復号可能な符号を、第2のFCB符号として符号多重回路1020へ出力端子55を介して出力し、第2のFCB信号をゲイン符号生成回路1400内のゲイン符号化回路1410と第2の励振信号計算1610とへ出力端子85を介して出力する。なお、FCB信号の表現方法については、複数のパルスから成り、パルス位置とパルス極性により規定されるマルチパルス信号により、FCB信号を効率的に表現する方法を用いることもでき、この場合には、第2のFCB符号はパルス位置とパルス極性とに対応する。ここで、FCB信号をマルチパルスで表現した場合の符号化方法の詳細については、非特許文献2の第3.8節の記載が参照できる。
【0092】
ここで、音声領域における自乗誤差最小化に基づいてFCB信号を選択する上述の方法の代わりに、LP係数符号変換回路1100と同様の方法を用いることもできる。すなわち、部分音声復号回路1500で得られた第1のFCB信号を入力し、第1のFCB信号との距離が最小となるようなFCB信号を方式2おけるFCB信号のテーブルから選択し、第2のFCB信号とする。
【0093】
また、FCB信号がマルチパルスで表現されている場合は、ACB符号生成回路2200と同様の方法により、方式1におけるパルス位置およびパルス極性とその符号と、方式2におけるパルス位置およびパルス極性とその符号との対応関係を用いることもできる。すなわち、パルス位置の値およびパルス極性が方式1と方式2とで同一となるように対応付けて、符号を読み替えればよい。
【0094】
以上で図7によるFCB符号生成回路1300の説明を終え、再び図5の説明に戻る。
【0095】
ゲイン符号生成回路1400は、ACB符号生成回路2200から出力される第1の目標信号と第2のACB信号とを入力し、FCB符号生成回路1300から出力される第2のFCB信号を入力し、インパルス応答計算回路1120から出力されるインパルス応答信号を入力する。第1の目標信号と前記第2のACB信号と第2のFCB信号とインパルス応答信号と、ゲイン符号生成回路1400が内蔵するテーブルに格納されたACBゲインとFCBゲインとから計算される、第1の目標信号と再構成音声との重み付け自乗誤差を最小にするACBゲインとFCBゲインとを選択する。そして、選択されたACBゲインおよびFCBゲインに対応する、方式2により復号可能な符号を、第2のゲイン符号として符号多重回路1020へ出力する。また、選択されたACBゲインおよびF CBゲインを、各々第2のACBゲインおよび第2のFCBゲインとして第2の励振信号計算回路1610へ出力する。
【0096】
図8を参照して、ゲイン符号生成回路1400の構成要素である、ゲイン符号化回路1410について説明する。図8はゲイン符号生成回路1400の一例の構成図である。同図を参照するとゲイン符号生成回路1400はゲイン符号化回路1410と、ゲインコードブック1411とを含んで構成される。
【0097】
ゲイン符号化回路1 410は、ACB符号生成回路2200内の目標信号計算回路2210から出力される第1の目標信号を入力端子93を介して入力し、ACB符号生成回路2200内のACB符号化回路2220から出力される第2のACB信号を入力端子92を介して入力し、FCB符号生成回路1300内のFCB符号化回路1320から出力される第2のFCB信号を入力端子91を介して入力し、インパルス応答計算回路1120から出力されるインパルス応答信号を入力端子94を介して入力する。ゲイン符号化回路1 410は、複数のACBゲインと複数のFCBゲインとが格納されたテーブルを内蔵しており、ACBゲインとFCBゲインをテーブルから順次読み出し、第2のACB信号と第2のFCB信号とインパルス応答信号とACBゲインとFCBゲインとから重み付け再構成音声を順次計算し、重み付け再構成音声と第1の目標信号との自乗誤差を順次計算し、自乗誤差を最小にするACBインとFCBゲインを選択する。ここで、自乗誤差は次式により表される。
【0098】
【数9】
Figure 2004151123
ただし、g ’p とg ’c は、各々ACBゲインとFCBゲインである。また、y (n)はフィルタ処理された第2のACB信号であり、第2のACB信号とインパルス応答信号との畳み込みにより得られ、z(n)はフィルタ処理された第2のFCB信号であり、第2のFCB信号とインパルス応答信号との畳み込みにより得られる。なお、重み付け再構成音声は次式により表される。
【0099】
【数10】
Figure 2004151123
最後に、選択されたACBゲインおよびFCBゲインに対応する、方式2により復号可能な符号を、第2のゲイン符号として出力端子56を介して符号多重回路1020へ出力し、ACBゲインおよびFCBゲインを、各々第2のACBゲインおよび第2のFCBゲインとして出力端子95と96を介して第2の励振信号計算回路1610へ出力する。
【0100】
ここで、音声領域における自乗誤差最小化に基づいてゲインを選択する上述の方法の代わりに、LP係数符号変換回路1100と同様の方法を用いることもできる。すなわち、部分音声復号回路1500で得られた第1のゲインを入力し、第1のゲインとの距離が最小となるようなゲインを方式2おけるゲインのテーブル(方式2のゲインコードブック)から選択し、第2のゲインとする。
【0101】
以上で図8によるゲイン符号生成回路1400の説明を終え、図1の説明に戻る。
【0102】
インパルス応答計算回路1120は、LSP−LPC変換回路1110から出力される第1のLP係数と第2のLP係数を入力し、第1のLP係数と第2のLP係数を用いて聴感重み付け合成フィルタを構成する。そして、聴感重み付け合成フィルタのインパルス応答信号を(第2の励振信号情報生成回路2600内の)ACB符号生成回路2200内のACB符号化回路2220と(第2の励振信号情報生成回路2600内の)FCB符号生成回路1300内の第2の目標信号計算回路1310およびFCB符号化回路1320と(第2の励振信号情報生成回路2600内の)ゲイン符号生成回路1400内のゲイン符号化回路1410とへ出力する。なお、聴感重み付け合成フィルタのインパルス応答信号を計算する方法の詳細については、非特許文献2の第5.4節の記載が参照できる。
【0103】
第2の励振信号計算回路1610は、第2の励振信号情報生成回路2600内のACB符号生成回路2200から出力される第2のACB信号を入力し、第2の励振信号情報生成回路2600内のFCB符号生成回路1300から出力される第2のFCB信号を入力し、第2の励振信号情報生成回路2600内のゲイン符号生成回路1400から出力される第2のACBゲインと第2のFCBゲインとを入力する。第2のACB信号に第2のACBゲインを乗じて得た信号と、第2のFCB信号に第2のFCBゲインを乗じて得た信号と、を加算して第2の励振信号を得る。そして第2の励振信号を第2の励振信号記憶回路1620へ出力する。
【0104】
第2の励振信号記憶回路1620は、第2の励振信号計算回路1610から出力される第2の励振信号を入力し、これを記憶保持する。そして、過去に入力されて記憶保持されている第2の励振信号を第2の励振信号情報生成回路2600内のACB符号生成回路2200へ出力する。
【0105】
以上により第1の実施例の説明を終える。
【0106】
上述した本発明の各実施例の符号変換装置は、ディジタル信号処理プロセッサ等のコンピュータ制御で実現するようにしてもよい。図9は本発明の第2の実施例として、上記各実施例の符号変換処理をコンピュータで実現する場合の装置構成を模式的に示す図である。同図を参照すると、コンピュータ1はCPU(central processing unit)2と、メモリ3と、記録媒体読出装置インタフェース4とを含んでいる。記録媒体6を含む記録媒体読出装置5はコンピュータ1とは別個に設けられている。
【0107】
記録媒体6から読み出されたプログラムを実行するコンピュータ1において、第1の符号化復号装置により音声を符号化して得た第1の符号を第2の符号化復号装置により復号可能な第2の符号へ変換する符号変換処理を実行するにあたり、記録媒体6には、
(a) 第1の符号列から第1の線形予測係数の情報を得る処理と、
(b) 第1の線形予測係数の情報から第1の線形予測係数を得る処理と、
(c) 第1の線形予測係数の情報を記憶保持する処理と、
(d) 記憶保持されている過去の第1の線形予測係数の情報から第1の線形予測係数の情報を得る処理と、
(e) 第1の線形予測係数の情報から第2の線形予測係数の情報を得る処理と、
(f) 第2 の線形予測係数の情報から第2の線形予測係数を得る処理と、
(g) 第1の符号列から第1の励振信号の情報を得る処理と、
(h) 第1の励振信号の情報を記憶保持する処理と、
(i) 記憶保持されている過去の第1の励振信号の情報から第1の励振信号の情報を得る処理と、
(j) 第1の励振信号の情報から第1の励振信号を得る処理と、
(k) 第1の線形予測係数あるいは第2の線形予測係数をもつフィルタを励振信号により駆動することによって第1の音声信号を生成する処理と、
(l) 第1の線形予測係数と第2の線形予測係数と第1の音声信号とから第2の励振信号の情報を得る処理
を実行させるためのプログラムが記録されている。記録媒体6から該プログラムを記録媒体読出装置5、インタフェース4を介してメモリ3に読み出して実行する。上記プログラムは、マスクROM等、フラッシュメモリ等の不揮発性メモリに格納してもよく、記録媒体は不揮発性メモリを含むほか、CD−ROM、FD、Digital Versatile Disk(DVD)、磁気テープ(MT)、可搬型HDD 等の媒体の他、例えばサーバ装置からコンピュータで該プログラムを通信媒体伝送する場合等、プログラムを担持する有線、無線で通信される通信媒体等も含む。
【0108】
【発明の効果】
以上説明したように、本発明によれば、第1の符号列が利用できない場合に、方式1において過去の音声パラメータから生成される劣化を伴った音声信号を方式2により再分析して符号化を行うことに起因する、第2の符号列から復号される音声信号における音質劣化を軽減できる、という効果を奏する。その理由は、本発明においては、方式1において過去に復号されて記憶保持されている音声パラメータを直接利用して第2の符号列を求めるように構成したためである。
【図面の簡単な説明】
【図1】本発明に係る符号変換装置の第1の実施例の構成図である。
【図2】LP係数符号変換回路1100の一例の構成図である。
【図3】部分音声復号回路1500の一例の構成図である。
【図4】ACB符号とACB遅延との対応関係とACB符号の読み替え方法を説明する図である。
【図5】第2の励振信号情報生成回路2600の一例の構成図である。
【図6】ACB符号生成回路2200の一例の構成図である。
【図7】FCB符号生成回路1300の一例の構成図である。
【図8】FCB符号生成回路1300の一例の構成図である。
【図9】本発明による符号変換装置の第2の実施例の構成図である。
【図10】本発明に係るプログラムの内容を示すフローチャートである。
【図11】本発明に係る符号変換方法の手順を示すフローチャートである。
【図12】従来の符号変換装置の一例の構成図である。
【符号の説明】
1 コンピュータ
2 CPU
3 メモリ
4 記録媒体読出装置インタフェース
5 記録媒体読出装置
6 記録媒体
10,31,35,36,37,51,52,53,57,61 入力端子
74,75,81,82,83,84,85,91,92,93,94 入力端子
20,32,33,34,55,56,62,63 出力端子
76,77,78,86,95,96 出力端子
110 LSP 復号回路
111 第1のLSP コードブック
116 LSP 記憶回路
130 LSP 符号化回路
131 第2のLSP コードブック
1010 符号分離回路
1020 符号多重回路
1050 音声復号回路
1060 音声符号化回路
1100 LP係数符号変換回路
1110 LSP−LPC変換回路
1120 インパルス応答計算回路
1300 FCB 符号生成回路
1310 第2の目標信号計算回路
1320 FCB符号化回路
1400 ゲイン符号生成回路
1410 ゲイン符号化回路
1500 部分音声復号回路
1510 ACB復号回路
1516 ACB遅延記憶回路
1520 FCB復号回路
1526 雑音生成回路
1530 ゲイン復号回路
1536 ゲイン記憶回路
1540 励振信号計算回路
1570 励振信号記憶回路
1580 合成フィルタ
1600 励振信号情報復号回路
1606 励振信号情報記憶回路
1607 励振信号情報計算回路
1610 第2の励振信号計算回路
1620 第2の励振信号記憶回路
2200 ACB 符号生成回路
2210 目標信号計算回路
2220 ACB符号化回路
2230 最適ACBゲイン計算回路

Claims (13)

  1. 第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換方法であって、
    前記第1の符号列が利用できない場合には、前記第1の方式において過去に復号され記憶保持されている音声パラメータを直接利用して前記第2の符号列を求めることを特徴とする符号変換方法。
  2. 前記第1の符号列から第1の線形予測係数の情報を得るステップと、
    前記第1の符号列から第1の励振信号の情報を得るステップと、
    前記第1の線形予測係数の情報を記憶保持するステップと、
    前記第1の励振信号の情報を記憶保持するステップと、
    記憶保持されている過去の第1の線形予測係数の情報から第1の線形予測係数の情報を計算するステップと、
    記憶保持されている過去の第1の励振信号の情報から第1の励振信号の情報を計算するステップと、
    前記第1の線形予測係数の情報から第2の線形予測係数の情報を求めるステップと、
    前記第1の励振信号の情報から第2の励振信号の情報を求めるステップと、
    を含むことを特徴とする請求項1記載の符号変換方法。
  3. 前記第1の線形予測係数の情報から得られる第1の線形予測係数あるいは前記第2の線形予測係数の情報から得られる第2の線形予測係数をもつフィルタを前記第1の励振信号の情報から得られる第1の励振信号で駆動することによって第1の音声信号を生成するステップと、
    前記第1の線形予測係数または前記第2の線形予測係数と前記第1の音声信号とから第2の励振信号の情報を求めるステップと、
    を含むことを特徴とする請求項2記載の符号変換方法。
  4. 前記励振信号の情報が、適応コードブック情報と固定コードブック情報とゲイン情報のいずれかを含むことを特徴とする請求項2または3記載の符号変換方法。
  5. 第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置であって、
    前記第1の符号列が利用できない場合には、前記第1の方式において過去に復号され記憶保持されている音声パラメータを直接利用して前記第2の符号列を求めることを特徴とする符号変換装置。
  6. 前記第1の符号列から第1の線形予測係数の情報を得る線形予測係数情報復号回路と、
    前記第1の符号列から第1の励振信号の情報を得る励振信号情報復号回路と、
    前記第1の線形予測係数の情報を記憶保持する線形予測係数情報記憶回路と、
    前記第1の励振信号の情報を記憶保持する励振信号情報記憶回路と、
    記憶保持されている過去の第1の線形予測係数の情報から第1の線形予測係数の情報を計算する線形予測係数情報計算回路と、
    記憶保持されている過去の第1の励振信号の情報から第1の励振信号の情報を計算する励振信号情報計算回路と、
    前記第1の線形予測係数の情報から第2の線形予測係数の情報を求める線形予測係数情報符号化回路と、
    前記第1の励振信号の情報から第2の励振信号の情報を求める励振信号情報生成回路と、
    を含むことを特徴とする請求項5記載の符号変換装置。
  7. 前記第1の線形予測係数の情報から得られる第1の線形予測係数あるいは前記第2の線形予測係数の情報から得られる第2の線形予測係数をもつフィルタを前記第1の励振信号の情報から得られる第1の励振信号で駆動することによって第1の音声信号を生成する部分音声復号回路と、
    前記第1の線形予測係数または前記第2の線形予測係数と前記第1の音声信号とから第2の励振信号の情報を求める励振信号情報生成回路と、
    を含むことを特徴とする請求項6記載の符号変換装置。
  8. 前記励振信号の情報が、適応コードブック情報と固定コードブック情報とゲイン情報のいずれかを含むことを特徴とする請求項6または7記載の符号変換装置。
  9. 第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置を構成するコンピュータに、
    前記第1の符号列が利用できない場合には、前記第1の方式において過去に復号され記憶保持されている音声パラメータを直接利用して前記第2の符号列を求める処理を実行させるためのプログラム。
  10. 請求項9記載のプログラムであって、
    前記第1の符号列から第1の線形予測係数の情報を得る処理と、
    前記第1の符号列から第1の励振信号の情報を得る処理と、
    前記第1の線形予測係数の情報を記憶保持する処理と、
    前記第1の励振信号の情報を記憶保持する処理と、
    前記記憶保持されている過去の第1の線形予測係数の情報から第1の線形予測係数の情報を計算する処理と、
    記憶保持されている過去の第1の励振信号の情報から第1の励振信号の情報を計算する処理と、
    前記第1の線形予測係数の情報から第2の線形予測係数の情報を求める処理と、 前記第1の励振信号の情報から第2の励振信号の情報を求める処理と、
    を実行させるためのプログラム。
  11. 請求項9または10記載のプログラムであって、
    前記第1の線形予測係数の情報から得られる第1の線形予測係数あるいは前記第2の線形予測係数の情報から得られる第2の線形予測係数をもつフィルタを前記第1の励振信号の情報から得られる第1の励振信号で駆動することによって第1の音声信号を生成し、
    前記第1の線形予測係数または前記第2の線形予測係数と前記第1の音声信号とから第2の励振信号の情報を求めることを特徴とするプログラム。
  12. 請求項9から11いずれかに記載のプログラムであって、
    前記励振信号の情報が、適応コードブック情報と固定コードブック情報とゲイン情報のいずれかを含むことを特徴とするプログラム。
  13. 請求項9から12いずれかに記載のプログラムを記録した記録媒体。
JP2002307733A 2002-10-23 2002-10-23 符号変換方法、符号変換装置、プログラム及びその記憶媒体 Pending JP2004151123A (ja)

Priority Applications (10)

Application Number Priority Date Filing Date Title
JP2002307733A JP2004151123A (ja) 2002-10-23 2002-10-23 符号変換方法、符号変換装置、プログラム及びその記憶媒体
EP03754175A EP1560201B1 (en) 2002-10-23 2003-10-20 Code conversion method and device for code conversion
DE60329129T DE60329129D1 (de) 2002-10-23 2003-10-20 Kodeumsetzungsverfahren und Kodeumsetzungsgerät dafür
EP06015364A EP1717796B1 (en) 2002-10-23 2003-10-20 Method for converting code and code conversion apparatus therefor
DE60308890T DE60308890T2 (de) 2002-10-23 2003-10-20 Kode-umsetzungsverfahren
PCT/JP2003/013347 WO2004038696A1 (ja) 2002-10-23 2003-10-20 符号変換方法とそのための符号変換装置
AU2003273043A AU2003273043A1 (en) 2002-10-23 2003-10-20 Code conversion method and device for code conversion
US10/531,899 US20060149537A1 (en) 2002-10-23 2003-10-20 Code conversion method and device for code conversion
CNB2003801019151A CN100524460C (zh) 2002-10-23 2003-10-20 代码转换方法与应用其的代码转换装置
HK05109131A HK1077389A1 (en) 2002-10-23 2005-10-17 Code conversion method and device for code conversion

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002307733A JP2004151123A (ja) 2002-10-23 2002-10-23 符号変換方法、符号変換装置、プログラム及びその記憶媒体

Publications (1)

Publication Number Publication Date
JP2004151123A true JP2004151123A (ja) 2004-05-27

Family

ID=32170946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002307733A Pending JP2004151123A (ja) 2002-10-23 2002-10-23 符号変換方法、符号変換装置、プログラム及びその記憶媒体

Country Status (8)

Country Link
US (1) US20060149537A1 (ja)
EP (2) EP1560201B1 (ja)
JP (1) JP2004151123A (ja)
CN (1) CN100524460C (ja)
AU (1) AU2003273043A1 (ja)
DE (2) DE60329129D1 (ja)
HK (1) HK1077389A1 (ja)
WO (1) WO2004038696A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4304360B2 (ja) * 2002-05-22 2009-07-29 日本電気株式会社 音声符号化復号方式間の符号変換方法および装置とその記憶媒体
EP2980797A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR9206143A (pt) * 1991-06-11 1995-01-03 Qualcomm Inc Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados
JPH08146997A (ja) * 1994-11-21 1996-06-07 Hitachi Ltd 符号変換装置および符号変換システム
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
US5867814A (en) * 1995-11-17 1999-02-02 National Semiconductor Corporation Speech coder that utilizes correlation maximization to achieve fast excitation coding, and associated coding method
JP3071388B2 (ja) * 1995-12-19 2000-07-31 国際電気株式会社 可変レート音声符号化方式
JPH1031499A (ja) * 1996-07-16 1998-02-03 Nippon Telegr & Teleph Corp <Ntt> 音声情報符号化・復号化装置および通信装置
US5995923A (en) * 1997-06-26 1999-11-30 Nortel Networks Corporation Method and apparatus for improving the voice quality of tandemed vocoders
JP3754819B2 (ja) * 1998-03-24 2006-03-15 株式会社日立国際電気 音声通信方法及び音声通信装置
US6260009B1 (en) * 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
JP3365360B2 (ja) * 1999-07-28 2003-01-08 日本電気株式会社 音声信号復号方法および音声信号符号化復号方法とその装置
US7031926B2 (en) * 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder
JP2002202799A (ja) * 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
JP4231987B2 (ja) * 2001-06-15 2009-03-04 日本電気株式会社 音声符号化復号方式間の符号変換方法、その装置、そのプログラム及び記憶媒体
JP4108317B2 (ja) * 2001-11-13 2008-06-25 日本電気株式会社 符号変換方法及び装置とプログラム並びに記憶媒体
TWI237916B (en) * 2002-05-13 2005-08-11 Sun Bridge Corp Cordless device system
JP4304360B2 (ja) * 2002-05-22 2009-07-29 日本電気株式会社 音声符号化復号方式間の符号変換方法および装置とその記憶媒体
US7231345B2 (en) * 2002-07-24 2007-06-12 Nec Corporation Method and apparatus for transcoding between different speech encoding/decoding systems
US7630889B2 (en) * 2003-04-08 2009-12-08 Nec Corporation Code conversion method and device
DE602004025688D1 (de) * 2003-04-22 2010-04-08 Nec Corp Codeumsetzungsverfahren und einrichtung, programm und aufzeichnungsmedium
JP4793539B2 (ja) * 2005-03-29 2011-10-12 日本電気株式会社 符号変換方法及び装置とプログラム並びにその記憶媒体

Also Published As

Publication number Publication date
EP1560201B1 (en) 2006-10-04
DE60329129D1 (de) 2009-10-15
DE60308890T2 (de) 2007-05-24
CN1705979A (zh) 2005-12-07
EP1717796A2 (en) 2006-11-02
EP1560201A4 (en) 2006-01-18
AU2003273043A1 (en) 2004-05-13
EP1560201A1 (en) 2005-08-03
CN100524460C (zh) 2009-08-05
WO2004038696A1 (ja) 2004-05-06
EP1717796B1 (en) 2009-09-02
DE60308890D1 (de) 2006-11-16
HK1077389A1 (en) 2006-02-10
EP1717796A3 (en) 2008-08-06
US20060149537A1 (en) 2006-07-06

Similar Documents

Publication Publication Date Title
JP4304360B2 (ja) 音声符号化復号方式間の符号変換方法および装置とその記憶媒体
JPH11327597A (ja) 音声符号化装置及び音声復号化装置
JP3628268B2 (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
US7630884B2 (en) Code conversion method, apparatus, program, and storage medium
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP4231987B2 (ja) 音声符号化復号方式間の符号変換方法、その装置、そのプログラム及び記憶媒体
KR100796836B1 (ko) 코드 변환 방법, 장치 및 이 방법을 실행하는 컴퓨터용 프로그램이 기록된 기록 매체
JPWO2014034697A1 (ja) 復号方法、復号装置、プログラム、及びその記録媒体
JP4396524B2 (ja) 符号変換方法及び装置
US7319953B2 (en) Method and apparatus for transcoding between different speech encoding/decoding systems using gain calculations
JP2004151123A (ja) 符号変換方法、符号変換装置、プログラム及びその記憶媒体
JP4238535B2 (ja) 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体
EP1536413B1 (en) Method and device for voice code conversion
US7747431B2 (en) Code conversion method and device, program, and recording medium
JP3166697B2 (ja) 音声符号化・復号装置及びシステム
JP2000305598A (ja) 適応ポストフィルタ

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090126

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090331