JPH1039898A - 音声信号伝送方法及び音声符号復号化システム - Google Patents

音声信号伝送方法及び音声符号復号化システム

Info

Publication number
JPH1039898A
JPH1039898A JP8191944A JP19194496A JPH1039898A JP H1039898 A JPH1039898 A JP H1039898A JP 8191944 A JP8191944 A JP 8191944A JP 19194496 A JP19194496 A JP 19194496A JP H1039898 A JPH1039898 A JP H1039898A
Authority
JP
Japan
Prior art keywords
spectrum
quantized
section
signal
background noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8191944A
Other languages
English (en)
Other versions
JP3259759B2 (ja
Inventor
Toshihiro Hayata
利浩 早田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP19194496A priority Critical patent/JP3259759B2/ja
Priority to US08/897,514 priority patent/US5953698A/en
Priority to CN97115023.0A priority patent/CN1174457A/zh
Publication of JPH1039898A publication Critical patent/JPH1039898A/ja
Application granted granted Critical
Publication of JP3259759B2 publication Critical patent/JP3259759B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】音声符号化装置と音声復号化装置とを有し、背
景雑音を生成するVOX(Voice Operated Transmitter)
処理を実行する音声符号復号化システムにおいて、無音
区間中の背景雑音の音質を向上する。 【解決手段】音声符号化装置内に、入力音声信号での非
量子化スペクトル包絡と量子化スペクトル包絡の差を求
めるスペクトル包絡比較部4と、包絡の差に応じて量子
化スペクトル包絡を変化させるスペクトル包絡変更部5
とを設け、背景雑音更新信号を生成する際に、スペクト
ル包絡変更部5で変化させた量子化スペクトル包絡を使
用するとともに、その量子化スペクトル包絡の変化に関
するスペクトル変更情報を音声復号化装置側に送信す
る。音声復号化装置では、受信した量子化スペクトル包
絡をスペクトル変更情報に応じて変化させ、この変化済
量子化スペクトルによって背景雑音を生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声符号化装置と
音声復号化装置からなる音声符号復号化システムとこの
システムでの音声信号伝送方法に関し、特に、話者が発
声している期間だけデータの送信が行われるVOX(Vo
ice Operated Transmitter)機能を有する音声符号復号
化システムに関する。
【0002】
【従来の技術】話者の音声を音声符号化装置によって符
号化し、符号化されたデータを音声復号化装置に伝送
し、音声復号化装置でこのデータを復号化して出力する
音声符号復号化システムでは、消費電力の削減や回線帯
域の有効利用などを目的として、VOX機能、すなわち
話者が発声している期間(有声区間)だけ符号化装置側
から復号化装置側へのデータの送信が行われるような機
能が設けられることが多い。符号化装置への入力音声が
無音の時(無声区間)には、符号化装置は送信を停止
し、その代り、復号化装置側ではある種の背景雑音を生
成してそれを出力することによって、VOX機能を用い
たことによる通話の不自然さを解消している。このよう
なVOX機能を有する音声符号復号化システムとして、
例えば特開平5−122165号公報(以下、文献1と
する)に示されるように、有声区間を検出したときにプ
リアンブル信号を送信してから音声符号化データを送信
し、無声区間を検出したときにはポストアンブル信号を
送信し、復号化装置側ではポストアンブル信号の受信を
もって背景雑音の出力に切り替わるシステムが知られて
いる。
【0003】以下、ディジタル無線伝送方式による従来
の音声符号復号化システムについて説明する。図10
は、従来の音声符号復号化システムにおける符号化装置
すなわち送信側の装置の構成を示すブロック図である。
ディジタル無線伝送方式では、符号化装置に入力された
音声信号は、フレームと呼ばれる固まりごとに切り出さ
れて処理される。このフレームの(時間)長さは、例え
ば40msである。
【0004】音声信号の入力端としてマイク1が設けら
れており、マイク1に入力した音声信号が、音声信号の
スペクトル包絡を解析するスペクトル包絡解析部2と、
現フレームが有音区間か無音区間かを判定する有音区間
検出部3と、音声信号の高能率符号化を実行する高能率
符号化部14とに入力するように構成されている。スペ
クトル包絡解析部2の出力は高能率符号化部14の入力
に接続するとともに、スペクトル係数量子化部6の入力
に接続し、スペクトル係数量子化部6の出力もまた高能
率符号化部14に入力している。高能率符号化部14の
出力には、送信アンテナ11に接続するデータ切替部1
0が設けられている。このデータ切替部10には、プリ
アンブル生成部8及びポストアンブル生成部9も接続さ
れており、データ切替器10は、後述するように、有音
区間検出部3での検出結果に応じて、送信アンテナ11
から送信すべき信号を切り替えたり、送信を停止するた
めのものである。
【0005】入力した1フレーム分の音声信号は、スペ
クトル包絡解析部2において、音声信号自身の有するス
ペクトル包絡が解析され、スペクトル係数が算出され
る。ここでスペクトル係数とは、音声信号のスペクトル
を特徴付ける特徴量であり、スペクトル係数としては、
例えば、「古井貞煕著 ディジタル音声処理:東海大学
出版会 1985年9月25日出版 第1刷」(以下
「文献2」と称する)の60〜62ページに記載されて
いる線形予測係数(LPC;Linear Prediction Coeffic
ient)や、同じく文献2の73〜78ページに記載され
ているPARCOR(部分自己相関;Partioal Auto-cor
relation)係数や、同じく文献2の89〜92ページに
記載されているLSP(線スペクトル対;Line Spectrum
Pair)などが挙げられる。
【0006】スペクトル包絡解析部2で求められたスペ
クトル係数は、スペクトル係数量子化部6に入力して量
子化され、量子化スペクトル係数が求められる。具体的
には、スペクトル係数量子化部6は、予め作成されたデ
ータを符号帳(コードブック)として保持しており、ス
ペクトル係数が入力されると、そのスペクトル係数に最
も近いと思われるデータを符号帳中から選択する。選択
されたデータで表現されたスペクトル係数を量子化スペ
クトル係数と言う。以下、量子化スペクトル係数との区
別を明確にする意味で、スペクトル包絡解析部2より出
力される量子化されていないスペクトル係数を、「非量
子化スペクトル係数」と称する。また、量子化スペクト
ル係数を与える符号帳の符号語を、「量子化スペクトル
符号語」と称する。
【0007】このようにして求められた非量子化スペク
トル係数及び量子化スペクトル係数は、音声信号ととも
に高能率符号化部14に入力し、高能率符号化され、デ
ータ切替器10に入力する。
【0008】上述したように、マイク1から入力された
1フレーム分の音声信号は、有音区間検出部3にも入力
し、そこで現フレームが音声の出ている有音区間である
か、あるいは音声の出ていない無音区間であるかが判定
される。有音区間検出部3での判定結果はデータ切替部
10に入力しており、有音区間であると判断された場合
には、データ切替部10は、高能率符号化部14から出
力された高能率符号を選択し、送信アンテナ11より高
能率符号を復号化側に向かって送信する。
【0009】このように、有音区間であって高能率符号
を送信アンテナ11より送信し続けている状態を「有音
処理状態」、また、有音区間で生成される高能率符号
を、「有音符号信号」と称する。
【0010】これに対し、前フレームが有音区間であ
り、かつ、有音区間検出部3で現フレームが無音区間と
判定された場合、以下のような処理が行われる。まず、
現フレームでは、ポストアンブル生成部9において、ポ
ストアンブル信号と呼ばれるフレームを生成し、そのポ
ストアンブル信号をデータ切替部10を介して、送信ア
ンテナ11より送信する。次のフレームでは、マイク1
より入力された無音の音声信号を、有音区間の時と同じ
ように、高能率符号化部14で高能率符号化し、その符
号を送信アンテナ11より送信する。このとき送信され
る信号を「背景雑音更新信号」という。背景雑音更新符
号を送信した後、符号化側は、予め定められた時間間隔
Tフレームの間、送信を停止する。そして、Tフレーム
後、再び、ポストアンブル信号と背景雑音更新符号とを
送信した後、Tフレーム間、送信を停止する、というこ
とを繰り返す。
【0011】このように、ポストアンブル信号及び背景
雑音更新信号を送信し、そののちTフレーム間にわたっ
て送信を停止するという動作を繰り返している状態を、
以下、「無音処理状態」と称する。ただし、無音処理状
態であって送信を停止している間であっても、有音区間
検出部3は常に有音区間の検出を行っており、有音と判
断された場合には、プリアンブル生成部8において、プ
リアンブル信号と呼ばれるフレームを生成する。そし
て、そのプリアンブル信号は、データ切替部10を介し
て送信アンテナ11より送信され、次のフレームから
は、高能率符号化部14で作成した高能率符号を送信し
続ける。
【0012】なお、ポストアンブル信号及びプリアンブ
ル信号は、通常、高能率符号化部14では生成されない
信号であり、これらポストアンブル信号及びプリアンブ
ル信号を総称して「ユニークワード」という。
【0013】図11は、音声復号化装置、すなわち受信
側の装置の構成を示すブロック図である。
【0014】音声符号化装置(図10)側から送信され
た信号を受信するための受信アンテナ20が設けられ、
受信アンテナ10で受信された受信信号は、高能率音声
復号化を行う高能率音声復号化部22と、ユニークワー
ドの検出を行うユニークワード検出部23と、背景雑音
を生成するのに必要なパラメータを保持する背景雑音用
パラメータ記憶部24とに入力する。この音声復号化装
置は、背景雑音を合成するための背景雑音合成部29を
備えており、背景雑音合成部29から出力される背景雑
音と高能率音声復号化部22からの復号化音声を切り替
えてスピーカ30に出力するために、スイッチ21が設
けられている。さらにこの音声復号化装置には、量子化
スペクトル係数算出部25とランダムな残差信号発生部
28とが設けられている。
【0015】ユニークワード検出部23は、受信信号を
解析し、現フレーム及び次フレームが有音区間、無音区
間のいずれであるかを判断するとともに、無音区間の時
は、ポストアンブル信号、プリアンブル信号及び背景雑
音更新信号を検出する。ユニークワード検出部23での
有音区間/無音区間の検出方法は、以下の通りである。
【0016】前フレームが有音区間であり、かつ、現
フレームでポストアンブル信号以外を受信した場合は、
現フレームは有音区間である。
【0017】前フレームが有音区間であり、かつ、現
フレームでポストアンブル信号を受信した場合は、現フ
レームは無音区間である。
【0018】前フレームが無音区間であり、かつ、現
フレームでプリアンブル信号以外を受信した場合、現フ
レームは無音区間である。
【0019】上記3つの基準〜に関わらず、前フ
レームが無音区間であり、かつ現フレームでプリアンブ
ル信号を受信した場合、現フレームは無音区間であり、
次フレームでは、必ず有音区間となる。
【0020】また、ユニークワード検出部22が受信信
号中から信号を検出する際の基準は、以下の通りであ
る。
【0021】(a) ポストアンブル信号と見なせる信号を
受信した時は、現フレームが有音区間、無音区間に関わ
らず、ポストアンブル信号を検出する。
【0022】(b) 無音区間でプリアンブル信号と見なせ
る信号を受信した時は、プリアンブル信号を検出する。
【0023】(c) しかし、有音区間でプリアンブル信号
と見なせる信号を受信した時は、有音符号信号を検出す
る。
【0024】(d) 無音区間で、前フレームでポストアン
ブル信号を検出し、かつ、現フレームがプリアンブル信
号と見なせる信号を受信しない時は、現フレームでは、
背景雑音更新信号を検出する。
【0025】ユニークワード検出部23の検出出力は背
景雑音用パラメータ記憶部24に与えられるとともにス
イッチ21の切り替えのためにスイッチ21に供給され
ている。ユニークワード検出部23で、現フレームが有
音区間であると判断されると、高能率音声復号化部22
で有音符号信号が復号化される。そして、高能率音声復
号化部22からの復号化音声がスピーカ30より出力さ
れるように、スイッチ21が切り替えられる。
【0026】次に、ユニークワード検出部23で、現フ
レームが無音区間であると判断された場合の動作につい
て、説明する。
【0027】無音区間であると判断されると、まず、背
景雑音用パラメータ記憶部24よりパラメータを読み出
す。読み出されたパラメータの内、量子化スペクトル符
号語は、量子化スペクトル係数算出部25に入力され、
量子化スペクトル係数に変換された後、背景雑音合成部
29へ入力する。残りのパラメータは、残差信号に相当
する部分を除いて、背景雑音用パラメータ記憶部24か
ら背景雑音合成部29に直接入力する。残差信号に相当
するパラメータについては、背景雑音用パラメータ記憶
部24より背景雑音合成部29に入力するのではなく、
その代りに、ランダムな残差信号発生部28で発生され
たランダムな残差信号が背景雑音合成部29に入力す
る。これら背景雑音用パラメータ記憶部24、量子化ス
ペクトル係数算出部25及びランダムな残差信号発生部
28からの入力より、背景雑音合成部29は、背景雑音
信号を生成する。そして、ユニークワード検出部23で
無音区間と判断された場合には、スイッチ21が切り替
えられ、背景雑音合成部29で生成された背景雑音信号
がスピーカ30から出力される。
【0028】なお、背景雑音用パラメータ記憶部24
は、背景雑音を合成するために必要なパラメータを保持
しておくメモリである。ユニークワード検出部23で現
フレームの受信信号が背景雑音更新信号であると判断さ
れた場合には、その背景雑音更新信号が背景雑音用パラ
メータ記憶部24に入力し、背景雑音更新信号に基づき
求められた背景雑音用パラメータに、背景雑音用パラメ
ータ記憶部24の内容が更新される。
【0029】以下、この従来の音声符号復号化システム
の動作について、フローチャートを用いて説明する。図
12は音声符号化装置(送信側)の処理を示すフローチ
ャートである。
【0030】音声信号が1フレームずつ入力するものと
して、まず、スペクトル包絡解析部2において音声信号
自身の有するスペクトル包絡が解析され、スペクトル係
数が算出される(ステップ201)。このスペクトル係
数(非量子化スペクトル係数)は、スペクトル係数量子
化部6において量子化され、量子化スペクトル係数が得
られる(ステップ202)。
【0031】一方、フレーム分の音声信号は有音区間検
出部3にも入力しており、現フレームが有音区間である
か、あるいは無音区間であるかが判定される(ステップ
203)。そして、非量子化スペクトル係数、量子化ス
ペクトル係数及び入力音声信号に基づき、高能率符号化
部14おいて、高能率符号化が実行される(ステップ2
04)。
【0032】ステップ203で有音区間であると判断さ
れたときには、データ切替部10は、高能率符号化部1
4から出力された高能率符号を選択し、送信アンテナ1
1より、この高能率符号は復号化側に向かって送信され
る(ステップ206)。
【0033】一方、ステップ203で無音区間と判定さ
れた場合、ユニークワード生成部(プリアンブル生成部
8及びポストアンブル生成部9)での処理が実行される
(ステップ105)。まず、現フレームでは、ポストア
ンブル生成部9において、ポストアンブル信号を生成
し、データ切替部10を介してそのポストアンブル信号
を送信アンテナ11より送信する(ステップ206)。
次のフレームでは、マイク1より入力された無音の音声
信号を、有音区間の時と同じように高能率符号化部14
で高能率符号化し(ステップ104)、その符号を送信
アンテナ11より送信する(ステップ106)。背景雑
音更新符号を送信した後、符号化装置は、予め定められ
た時間間隔であるTフレームの間、送信を停止し、その
Tフレームの経過後、再び、ポストアンブル信号及び背
景雑音更新符号を送信してまたTフレームの間にわたっ
て送信を停止する、ということを繰り返す。
【0034】なお、送信を停止しているときでも、ステ
ップ203での有音区間の検出は常時行われており、無
音区間から有音区間への遷移が検出された場合、ユニー
クワード生成部であるプリアンブル生成部8で、プリア
ンブル信号を生成する(ステップ205)。そして、現
フレームでは、データ切替部10を介してそのプリアン
ブル信号を送信アンテナ11より送信する(ステップ2
06)。次のフレームからは、高能率符号化部14で作
成した高能率符号を送信し続ける(ステップ204,2
06)。
【0035】次に、音声復号化装置(受信側)の処理を
説明する。図13は従来の音声復号化装置での処理を示
すフローチャートである。
【0036】符号化側から送信され受信アンテナ20で
受信された受信信号は、高能率音声復号化部22及びユ
ニークワード検出部23に送られる。まず、ユニークワ
ード検出部23において受信信号を解析し、現フレーム
及び次フレームが有音区間、無音区間のいずれであるか
を判断する(ステップ251)。無音区間と判断された
ときは、さらに、受信信号がユニークワード(ポストア
ンブル信号及びプリアンブル信号)であるかを判断し
(ステップ253)、ユニークワードでない場合には、
背景雑音更新信号(背景雑音更新用データ)であるかど
うかを判断する(ステップ254)。背景雑音更新信号
であれば、背景雑音用パラメータ記憶部24の内容を更
新する(ステップ255)。
【0037】ステップ251において現フレームが有音
区間であると判断された場合には、高能率音声復号化部
22において受信信号(この場合は高能率符号)を復号
化することにより復号化音声信号を作成し(ステップ2
52)、その復号化音声がスピーカ30より出力される
ように、スイッチ21を切り替え(ステップ259)、
復号化音声信号を出力する。
【0038】次に、ステップ251においてユニークワ
ード検出部23により現フレームが無音区間であると判
断された場合の動作について、説明する。まず、上述し
たステップ253〜255の処理が実行される。そし
て、背景雑音用パラメータ記憶部24より量子化スペク
トル符号語が読み出されて量子化スペクトル係数算出部
25に入力し、量子化スペクトル係数に変換される(ス
テップ256)。そして、ランダムな残差信号発生部2
8においてランダムな残差信号を発生させ(ステップ2
57)、背景雑音用パラメータ記憶部24、量子化スペ
クトル係数算出部25及びランダムな残差信号発生部2
8からの入力により、背景雑音合成部29において背景
雑音信号を生成する(ステップ258)。無音区間であ
るのでスイッチ21は背景雑音合成部29側に切り替え
られ(ステップ259)、背景雑音合成部29で生成さ
れた背景雑音信号がスピーカ30から出力される。
【0039】
【発明が解決しようとする課題】しかしながら上述した
従来の音声符号復号化システムでは、無音区間において
復号化装置から出力される背景雑音が不自然な音になる
という問題点がある。従来のシステムにおいて符号化装
置のスペクトル係数量子化部6に備えられている符号帳
は、一般に、有音区間のスペクトル包絡を量子化するこ
とに対して最適化されており、無音区間を量子化するの
に適しているとはいい難いものである。しかしながら、
従来のシステムではこのような有音区間に最適化された
符号帳を用いて無音区間のスペクトル包絡を量子化して
いるため、無音区間での背景雑音に違和感が生じてしま
うのである。
【0040】本発明の目的は、背景雑音を生成するVO
X処理を行っている音声符号復号化システムにおいて、
復号化側で出力される背景雑音の有する違和感を低減す
ることにある。
【0041】
【課題を解決するための手段】本発明の音声信号伝送方
法は、送信側で入力音声信号を符号化して符号化データ
として受信側に伝送し、受信側では符号化データを復号
化して出力音声信号として出力し、送信側で無音区間を
検出したときには無音区間での入力音声信号を符号化し
て背景雑音更新信号とし、背景雑音更新信号を送信側か
ら受信側に送信した後は送信側が所定の期間送信を停止
し、所定の期間中は受信側は既に受信した背景雑音更新
信号に基づいて背景雑音を生成して出力音声信号として
出力する音声信号伝送方法において、無音区間での入力
音声信号から量子化スペクトルを求めるとともに非量子
化スペクトル包絡と量子化スペクトル包絡とを算出し、
非量子化スペクトル包絡と前記量子化スペクトル包絡の
差が所定のしきい値より大きいときには量子化スペクト
ルを変化させ、変化後の量子化スペクトルに基づいて背
景雑音更新信号を生成することを特徴とする。
【0042】本発明の音声符号復号化システムは、音声
符号化装置と音声復号化装置とを有し、背景雑音を生成
するVOX処理を実行する音声符号復号化システムにお
いて、音声符号化装置に、音声符号化装置への入力信号
での非量子化スペクトル包絡と量子化スペクトル包絡の
差を定量的に求めるスペクトル包絡比較手段と、差に応
じて量子化スペクトル包絡を変化させるスペクトル包絡
変更手段とが設けられ、音声符号化装置は、背景雑音に
関する符号化処理を行う際にスペクトル包絡変更手段に
よって変化した量子化スペクトル包絡を使用するととも
に、その量子化スペクトル包絡の変化に関するスペクト
ル変更情報を音声復号化装置側に送信し、音声復号化装
置に、受信したスペクトル変更情報を格納するスペクト
ル変更情報記憶手段と、スペクトル変更情報記憶手段に
格納されたスペクトル変更情報に基づいて、受信した量
子化スペクトル包絡を変化させる変化済スペクトル係数
算出手段とが設けられ、音声符号化装置が背景雑音を生
成する際には、変化済スペクトル係数算出手段が出力す
る量子化スペクトルが使用されることを特徴とする。
【0043】本発明の音声符号復号化システムでは、音
声符号化装置内に、第1の符号帳を用い有声区間での入
力信号を量子化するための第1のスペクトル係数量子化
手段と、第2の符号帳を用い無声区間での入力信号を量
子化するための第2のスペクトル係数量子化手段とを設
け、第1の符号帳と第2の符号帳の内容が異なるように
してもよい。
【0044】ここで、「量子化スペクトル包絡」とは、
量子化スペクトル係数により定められる音声のスペクト
ル包絡を意味し、「非量子化スペクトル包絡」とは、非
量子化スペクトル係数により定められる音声のスペクト
ル包絡を意味する。以下の文章でも、同じ意味として使
用する。
【0045】本発明において、スペクトル包絡比較手段
は、無音区間における、量子化スペクトル包絡と非量子
化スペクトル包絡との比較を行う。スペクトル包絡変更
手段は、その比較結果に基づき、非量子化スペクトル包
絡と量子化スペクトル包絡の差が小さくなるように、量
子化スペクトル係数を変化させる。従来のシステムで
は、有音区間に最適化された量子化器を使用して無音区
間の量子化スペクトル係数を求めていたために、無音区
間では量子化スペクトル係数と非量子化スペクトル係数
の差が大きくなったのに対し、本発明では、スペクトル
包絡変更手段で変更を加えることにより、量子化スペク
トル係数と非量子化スペクトル係数の差が小さくなり、
背景雑音の音質が向上する。
【0046】また本発明において、音声符号化装置内
に、第1の符号帳を用い有声区間での入力信号を量子化
するための第1のスペクトル係数量子化手段と、第1の
符号帳とは内容が異なる第2の符号帳を用い無声区間で
の入力信号を量子化するための第2のスペクトル係数量
子化手段とを設けた場合には、第2のスペクトル係数量
子化手段(無音区間スペクトル係数量子化部)が無音区
間用の小さな符号帳(第2の符号帳)を用いてスペクト
ル係数の量子化を行う。その後、さらにスペクトル包絡
変更手段で非量子化スペクトルとの差を小さくするよう
にフィルタ処理を施すため、従来使用されている有音区
間用のスペクトル係数量子化用の符号帳(第1の符号
帳)のように大きいものを用いて無音区間の量子化を行
う必要がなくなる。
【0047】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。
【0048】《第1の実施の形態》図1は本発明の第1
の実施の形態の音声符号復号化システムで使用される音
声符号化装置の構成を示すブロック図であり、図2はこ
のシステムにおいて使用される音声復号化装置の構成を
示すブロック図である。これら音声符号化装置と音声復
号化装置とは、無線回線によって接続されている。ま
ず、図1により、送信側の音声符号化装置の構成につい
て説明する。
【0049】この音声符号化装置は、図10に示す従来
システムでの音声符号化装置と比べ、高能率符号化部の
代りに無音区間にも対応した無音期間対応高能率符号化
部7を設けるとともに、非量子化スペクトル係数による
スペクトル包絡と量子化スペクトル係数によるスペクト
ル包絡との差を求めるスペクトル包絡比較部4と、スペ
クトル包絡比較部4の比較結果に応じて量子化スペクト
ル包絡を変更するスペクトル包絡変更部5とを追加した
構成となっている。スペクトル包絡変更部5から出力さ
れる変更後の量子化スペクトル包絡も無音区間対応高能
率符号化部7に入力する。
【0050】図10に示した従来の音声符号化装置の場
合と同様に、マイク1に入力した原音声信号は、フレー
ムごとにスペクトル包絡解析部2、有音区間検出部3及
び無音区間対応高能率符号化部7に入力する。フレーム
長は例えば40msである。1フレーム分の原音声信号
は、スペクトル包絡解析部2で、原音声信号自身の有す
るスペクトル包絡が解析され、スペクトル係数(非量子
化スペクトル係数)が算出される。ここでスペクトル係
数としては、上述した線形予測係数、PARCOR係
数、LSPなどが挙げられる。そして、この非量子化ス
ペクトル係数は、スペクトル係数量子化部6で量子化さ
れ、量子化スペクトル係数が得られる。一方、有音区間
検出部3では、現フレームが、音声の出ている有音区間
であるか、または、音声の出ていない無音区間であるか
が判定される。
【0051】以上述べた、マイク1、スペクトル包絡解
析部2、スペクトル係数量子化部6及び有音区間検出部
3の構成と動作は、図10に示した従来のシステムでの
音声符号化装置の場合と同じである。
【0052】高能率符号化を実行する無音区間対応高能
率符号化部7は、現フレームが有音区間であるとの情報
が有音区間検出部3から入力すると、マイク1から入力
された原音声信号と、スペクトル包絡解析部2で生成さ
れた非量子化スペクトル係数と、スペクトル係数量子化
部6で生成された量子化スペクトル係数とを使用して、
高能率符号を生成する。すなわち、後述するスペクトル
係数変更部5からの入力は、有音区間の高能率符号化に
は全く使用されない。原音声信号、非量子化スペクトル
係数及び量子化スペクトル係数より求めた高能率符号
に、量子化スペクトル符号語を加えたものが、有音区間
時に、有音符号信号として、無音区間対応高能率符号化
部7より出力される。そして、有音区間である場合、デ
ータ切替部10は無音区間対応高能率符号化部7から出
力された有音符号信号を選択し、この有音符号信号は、
送信アンテナ11より復号化側に向かって送信される。
【0053】一方、前フレームが有音区間であり、現フ
レームが無音区間と判定された場合、以下のような処理
が行われる。まず、現フレームでは、ポストアンブル生
成部9においてポストアンブル信号を生成し、そのポス
トアンブル信号をデータ切替部10を介して、送信アン
テナ11より送信する。なお、ポストアンブル生成部9
の構成、動作は、図10に示す従来の音声符号化装置の
場合と同じである。次のフレームでは、マイク1より入
力された無音の音声信号を、高能率符号化部7で以下の
ように高能率符号化して、その符号を送信アンテナ11
より背景雑音更新信号として送信する。
【0054】図10に示す従来の音声符号化装置の場
合、高能率符号化部14での有音区間の高能率符号の生
成方法と背景雑音更新信号の生成方法とは同一であった
が、本実施の形態での無音区間対応高能率符号化部7
は、有音区間の高能率符号と背景雑音更新信号とを異な
る生成方法で生成する。この音声符号化装置にはスペク
トル包絡比較部4及びスペクトル包絡変更部5が設けら
れているが、これらの出力を利用して、背景雑音更新信
号を有音区間での高能率符号と異なる方法で生成する。
まず、スペクトル包絡比較部4及びスペクトル包絡変更
部5について説明する。
【0055】スペクトル包絡比較部4は、スペクトル包
絡解析部2で得られた非量子化スペクトル係数より算出
される非量子化スペクトル包絡と、スペクトル係数量子
化部6で得られた量子化スペクトル係数より算出される
量子化スペクトル包絡を比較し、その差を求める。ま
た、スペクトル包絡変更部5は、スペクトル包絡比較部
4で得られた上記の差を入力としてその差としきい値と
を比較し、量子化スペクトル包絡と非量子化スペクトル
包絡が大きく異なると判断した場合には、スペクトル係
数量子化部6で得られた量子化スペクトル係数を変化さ
せて、非量子化スペクトル包絡との差が小さくなるよう
にする。そしてスペクトル包絡変化部5は、変化させた
量子化スペクトル係数とその変化方法に関する情報とを
無音区間対応高能率符号化部7に入力する。以下、変化
させた量子化スペクトル係数を「変更済量子化スペクト
ル係数」と称し、変化方法に関する情報を「スペクトル
変化情報」と称する。
【0056】無音区間対応高能率符号化部7は、マイク
1から入力された原音声信号と、スペクトル包絡解析部
2で生成した非量子化スペクトル係数と、スペクトル包
絡変更部5で生成した変更済量子化スペクトルとを用い
て高能率符号を生成する。さらに、この高能率符号に、
スペクトル係数量子化部6で求められた量子化スペクト
ル係数の符号語と、スペクトル包絡変更部5で生成され
たスペクトル変化情報の符号語とを加えて、背景雑音更
新信号が生成される。このようにして無音区間対応高能
率符号化部7で生成した背景雑音更新信号は、データ切
替部10に入力し、送信アンテナ11を介して送信され
る。
【0057】背景雑音更新符号を送信した後、符号化側
は、予め定められた時間間隔Tフレームの間、送信を停
止する。そして、そのTフレーム後、再び、ポストアン
ブル信号と背景雑音更新符号を送信した後、Tフレーム
の間送信を停止する、ということを繰り返す。
【0058】ただし、送信を停止している間も常に有音
区間検出部3で有音区間の検出を行っており、有音と判
断された場合、プリアンブル生成部8でプリアンブル信
号が生成し、そのプリアンブル信号はデータ切替部10
を介して送信アンテナ11より送信され、次のフレーム
からは高能率符号化部7で作成した有音符号信号を送信
し続ける。なお、プリアンブル生成部8の構成、動作
は、図10に示した従来の音声符号化装置の場合と同じ
である。
【0059】次に、音声復号化装置の構成について、図
2を用いて説明する。この音声復号化装置は、図11に
示す従来のシステムでの音声復号化装置に対し、受信信
号とユニークワード検出部3での検出結果とが入力して
スペクトル変更情報を記憶するスペクトル変更情報記憶
部27と、量子化スペクトル係数算出部25から量子化
スペクトル係数が入力しこの入力した量子化スペクトル
係数をスペクトル変更情報記憶部27に記憶されたスペ
クトル変更情報に応じて変化させる変更済スペクトル係
数算出部26とを追加した構成である。量子化スペクト
ル係数算出部25の出力は背景雑音合成部29に直接入
力せず、その代り、変更済スペクトル係数算出部26の
出力が背景雑音合成部29に入力している。
【0060】受信アンテナ20で受信された受信信号
は、高能率音声復号化部22、ユニークワード検出部2
3、背景雑音用パラメータ記憶部24及びスペクトル変
更情報記憶部27に入力する。ユニークワード検出部2
3は、受信信号を解析し、現フレーム及び次フレームが
有音区間、無音区間のいずれであるかを判断するととも
に、無音区間の時は、ポストアンブル信号、プリアンブ
ル信号及び背景雑音更新信号を検出する。ユニークワー
ド検出部23の構成、動作は、図11に示す従来の音声
復号化装置の場合と同じであって、有音区間か無音区間
かの判断方法、ポストアンブル信号、プリアンブル信号
及び背景雑音更新信号の検出方法も、上述した従来の場
合と同一である。
【0061】ユニークワード検出部23で、現フレーム
が有音区間であると判断されると、高能率音声復号化部
22で有音符号信号が復号化される。そして、スイッチ
21が高能率音声復号化部22を選択するように切り替
えられ、高能率音声復号化部22からの復号化音声がス
ピーカ30より出力される。なお、高能率音声復号化部
22及びスピーカ30の構成、動作は、図11に示した
従来の場合と同じである。
【0062】次に、ユニークワード検出部23で、現フ
レームが無音区間であると判断された場合の動作につい
て、説明する。
【0063】無音区間では、背景雑音を合成するために
必要なパラメータが保持されている2つの記憶部、すな
わちスペクトル変更情報記憶部27と背景雑音用パラメ
ータ記憶部24より必要な情報を引き出し、背景雑音合
成部29によって背景雑音を合成する。無音区間では、
まず、背景雑音用パラメータ記憶部24よりパラメータ
を読みだす。読み出されたパラメータの内、量子化スペ
クトル符号語は、量子化スペクトル係数算出部25へ入
力され量子化スペクトル係数に変換された後、変更済ス
ペクトル係数算出部26へ入力される。残りのパラメー
タは、残差信号に相当する部分を除いて、背景雑音用パ
ラメータ記憶部24から背景雑音合成部29に直接入力
される。なお、背景雑音用パラメータ記憶部24で保持
されている内容は、上述の従来の音声復号化装置の場合
と同様に、ユニークワード検出部23で現フレームの受
信信号が背景雑音更新信号であると判断された場合にの
み、背景雑音更新信号に基づき求められた背景雑音用パ
ラメータに更新される。
【0064】スペクトル変更情報記憶部27は、背景雑
音更新に用いられるスペクトル変更情報を保持、出力す
るのに用いられる。スペクトル変更情報記憶部27に保
持されているスペクトル変更情報が更新されるのは、ユ
ニークワード検出部23で現フレームが背景雑音更新信
号であると判断された場合のみであり、その場合には、
受信信号からスペクトル変更情報を取り出し、今まで保
存していた古いスペクトル変更情報を更新する。
【0065】変更済スペクトル係数算出部26は、変更
済スペクトル係数を算出するのに使用される。変更済ス
ペクトル係数算出部26では、量子化スペクトル係数算
出部25で算出された量子化スペクトル係数と、スペク
トル変更情報記憶部27に保持されているスペクトル変
更情報を合わせて、変更済量子化スペクトル係数を算出
し、背景雑音合成部29に入力する。
【0066】残差信号に相当するパラメータとして、ラ
ンダムな残差信号発生部28で発生されたランダムな残
差信号が入力される。なお、ランダムな残差信号発生部
28の構成、動作は、図11に示す従来の音声復号化装
置の場合と同じである。
【0067】背景雑音合成部29は、背景雑音用パラメ
ータ記憶部24、変更済スペクトル係数算出部26及び
ランダムな残差信号発生部28からの入力より、背景雑
音信号を生成する。ユニークワード検出部3で無音区間
と判断された場合は、スイッチ21は背景雑音合成部2
9を選択するように切り替えられており、背景雑音合成
部29で生成された背景雑音信号がスピーカ30から出
力される。
【0068】以下、この第1の実施の形態の音声符号復
号化システムの動作について、フローチャートを用いて
説明する。図3は音声符号化装置(送信側)の処理を示
すフローチャートである。
【0069】マイク1に入力した1フレーム分の原音声
信号は、スペクトル包絡解析部2に入力し、ここで、非
量子化スペクトル包絡及び非量子化スペクトル係数が算
出される(ステップ101)。非量子化スペクトル係数
は、スペクトル係数量子化部6に入力し、スペクトル係
数量子化部6が予め備えているスペクトル係数量子化用
符号帳(コードブック)を参照することにより、量子化
スペクトル包絡、量子化スペクトル係数及びその係数に
対応する符号語が求められる(ステップ102)。
【0070】有音区間検出部3は、入力された原音声信
号を解析し、現フレームが有音区間であるか、無音区間
であるかを判断する(ステップ103)。有音区間であ
ると判断されたときには、ステップ106に移行し、高
能率符号化を実行する。高能率符号化は、原音声信号、
非量子化スペクトル係数、量子化スペクトル係数及び量
子化スペクトル符号語を無音区間対応高能率符号化部7
に入力することで行われ、得られた高能率符号は、デー
タ切替部10を通り(ステップ108)、送信アンテナ
11から送信される。
【0071】他方、ステップ103において無音区間で
あると判断された場合の処理は、以下のようになる。ま
ず、スペクトル包絡解析部2で求められた非量子化スペ
クトル包絡とスペクトル係数量子化部6で求められた量
子化スペクトル包絡とをスペクトル包絡比較部4におい
て比較し、両者の差が大きいか小さいかを判断する(ス
テップ104)。この判断は、両者の差と所定のしきい
値とを比較することによって行われる。そして、この差
が大きいと判断されたときは、スペクトル包絡変更部5
において、非量子化スペクトル包絡に近くなるように変
更された、変更済量子化スペクトル係数が求められる
(ステップ105)。その後、ステップ104でスペク
トル包絡の差が大きいと判断されているときには変更済
量子化スペクトル係数を、差が小さいと判断されている
ときは量子化スペクトル係数を用いて、無音区間対応高
能率符号化部7において高能率符号化が行われ、その高
能率符号と、量子化スペクトル係数の符号語及びスペク
トル変更情報とをまとめて、背景雑音更新信号として出
力する(ステップ106)。
【0072】また、ステップ103で無音区間であると
判断されているときは、上記のステップ104,105
と同時平行的に、プリアンブル生成部8においてプリア
ンブル信号が、ポストアンブル生成部9においてポスト
アンブル信号が生成され(ステップ107)、これらプ
リアンブル信号やポストアンブル信号がデータ切替部1
0に入力する。そして、無音区間の場合、データ切替部
10においては、現フレームで出力すべき信号が選択さ
れる(ステップ108)。具体的には、背景雑音更新
符号を出すフレームでは、無音区間対応高能率符号化部
7で求められた背景雑音更新信号を選択し、プリアン
ブル信号を出すフレームでは、プリアンブル生成部8で
生成されたプリアンブル信号を選択し、ポストアンブ
ル信号を出すフレームでは、ポストアンブル生成部9で
生成されたポストアンブル信号を選択する。
【0073】次に、音声復号化装置(受信側)の処理を
説明する。図4は音声復号化装置での処理を示すフロー
チャートである。
【0074】受信アンテナ20で受信した受信信号がユ
ニークワード検出部23に入力して、現フレームが有音
区間か無音区間かが判断される(ステップ121)。有
音区間の場合、受信した高能率符号を高能率音声復号化
部22で復号化し(ステップ130)、その復号化音声
をスイッチ21で選択して(ステップ132)、スピー
カ30から出力する。
【0075】一方、ステップ121で無音区間と判断し
た場合、ユニークワード検出部23において、受信した
信号がポストアンブル信号、プリアンブル信号といった
ユニークワードであるかどうかを判断し(ステップ12
2)、ユニークワードでない場合には背景雑音更新信号
(背景雑音更新用データ)であるかどうかを判断する
(ステップ123)。ステップ122でユニークワード
であった場合とステップ123で背景雑音更新用データ
でなかった場合はステップ126に移行し、ステップ1
23で背景雑音更新信号と判断された場合には、新たに
受信した背景雑音更新信号より得られる背景雑音用パラ
メータとスペクトル変更情報とによって、それぞれ、背
景雑音用パラメータ記憶部24に保存されている背景雑
音用パラメータを更新し(ステップ124)、スペクト
ル変更情報記憶部27に保存されているスペクトル変更
情報を更新し(ステップ125)、ステップ126に移
行する。
【0076】ステップ126では、背景雑音用パラメー
タ記憶部24に保存されているデータを使用して、量子
化スペクトル係数算出部25において、量子化スペクト
ル係数を算出する。算出された量子化スペクトル係数
は、スペクトル変更情報記憶部27に保存されているス
ペクトル変更情報とともに、変更済スペクトル係数算出
部26に入力される。ここでは、スペクトル変更情報を
元に、量子化スペクトル係数を変更すべきか否かを判断
し(ステップ127)、変更する必要がある時にはスペ
クトル変更情報に従って変更して、変更済量子化スペク
トル係数を算出する(ステップ128)。
【0077】そして、ランダムな残差信号発生部28で
ランダムな残差信号を生成し(ステップ129)、背景
雑音用パラメータ記憶部24に保存されていた背景雑音
用パラメータと、変更済スペクトル係数算出部26で求
められた変更済量子化スペクトル係数(ステップ128
で量子化スペクトルを変更したとき)あるいは量子化ス
ペクトル係数算出部で算出された量子化スペクトル係数
(ステップ127で量子化スペクトルを変更しないと判
断したとき)と、上述のランダムな残差信号とが背景雑
音合成部29に入力し、背景雑音が生成される(ステッ
プ131)。無音区間の場合は、スイッチ21において
背景雑音が選択されるので(ステップ132)、背景雑
音がスピーカ30より出力される。
【0078】次に、音声符号化装置(図1)のスペクト
ル包絡変更部5での処理の一例について、図5を用いて
説明する。
【0079】量子化スペクトル包絡の存在する周波数領
域が、低い方から低域、中域、高域に区分されており、
スペクトル包絡変更部5は、各々の周波数領域のみに対
して周波数特性を変化するフィルタの係数を符号帳(低
域変更用フィルタ係数符号帳41、中域変更用フィルタ
係数符号帳42及び高域変更用フィルタ係数符号帳4
3)の形で有している。そして、スペクトル包絡変更部
5は、各周波数領域から選択したフィルタ係数より作ら
れるフィルタを、量子化スペクトル係数による合成フィ
ルタの伝達関数に乗算することにより量子化スペクトル
包絡を変更する。そしてその変更された量子化スペクト
ル包絡を非量子化スペクトル包絡と比較し、差が小さく
なる符号語を選択する。
【0080】以下、このようなスペクトル包絡変更部5
を使用したとして、この音声符号復号化システムの処理
を数式を用いて説明する。
【0081】1フレーム分の原音声信号に対し、ステッ
プ101においてスペクトル包絡解析部2により非量子
化スペクトル包絡及び非量子化スペクトル係数を、それ
ぞれ以下のように表わす。
【0082】
【数1】 ただし、fsは原音声信号をA/D変換した時の標本化
周波数、Npは非量子化スペクトル係数の次数とする
(なお、量子化スペクトル係数の次数も等しくNpとす
る)。ここでは、非量子化スペクトル係数の一例とし
て、上述の線形予測係数を用いるものとする。すると、
非量子化スペクトル係数nqa(n)による合成フィルタ
の伝達関数H(z)は以下のように表される。
【0083】
【数2】 このとき、非量子化スペクトル包絡nqsp(f)は次の
ように表される。
【0084】
【数3】 ただし、eは自然対数の底、jは虚数単位を表す。
【0085】ステップ102において非量子化スペクト
ル係数nqa(n)はスペクトル係数量子化部6に入力さ
れて量子化され、量子化スペクトル係数と、それに対応
する符号帳の符号語が算出される。さらに、量子化スペ
クトル係数より量子化スペクトル包絡も得られる。これ
らを以下のように表わす。
【0086】
【数4】 非量子化スペクトル係数と同じく、量子化スペクトル係
数としても、例えば上述の線形予測係数が使用されるも
のとする。すると、量子化スペクトル係数qa(n)によ
る合成フィルタの伝達関数Hq(z)は、以下のように表
される。
【0087】
【数5】 このとき、非量子化スペクトル包絡qsp(f)は次のよ
うに表される。
【0088】
【数6】 ステップ103で有音区間と判断された場合には、無音
区間対応高能率符号化部7で高能率符号が生成し(ステ
ップ106)、この高能率符号がデータ切替部10を介
して送信アンテナ11より出力されるわけであるが(ス
テップ108)、無音区間対応高能率符号化部7で使用
する高能率符号化方法としては、例えば「小澤一範監修
ディジタル移動通信のための高能率音声符号化技術:
トリケップス 1992年4月6日出版」(以下「文献
3」と称する)の99〜103ページに記載されている
VSELP(Vector Sum Excited LPC)が、一例として
挙げられる。
【0089】ステップ103で無音区間と判断された場
合には、ステップ104において非量子化スペクトル包
絡と量子化スペクトル包絡とをスペクトル包絡比較部4
において比較するわけであるが、比較の方法の一例とし
ては、以下に示す指標LD、及びしきい値LDTHを用い
る方法が挙げられる。
【0090】
【数7】
【0091】
【表1】 そして、非量子化スペクトル包絡と量子化スペクトル包
絡の差が大きいと判断された場合、ステップ105にお
いて、スペクトル包絡変更部5により、非量子化スペク
トル包絡に近くなるように変更された、変更済量子化ス
ペクトル係数が求められる。まず、図5中で使用されて
いる変数について説明する。
【0092】 LFi(z) : 符号語iに対する低域変更用フィルタ
の伝達関数. MFi(z) : 符号語iに対する中域変更用フィルタ
の伝達関数. HFi(z) : 符号語iに対する高域変更用フィルタ
の伝達関数. L : 低域符号語数. M : 中域符号語数. H : 高域符号語数. Ml : LFi(z)の分母の次数. Nl : LFi(z)の分子の次数. Mm : MFi(z)の分母の次数. Nm : MFi(z)の分子の次数. Mh : HFi(z)の分母の次数. Nh : HFi(z)の分子の次数. αl(i,j) : 符号語iの低域変更用フィルタの分
母j次の係数. βl(i,j) : 符号語iの低域変更用フィルタの分
子j次の係数. αm(i,j) : 符号語iの中域変更用フィルタの分
母j次の係数. βm(i,j) : 符号語iの中域変更用フィルタの分
子j次の係数. αh(i,j) : 符号語iの高域変更用フィルタの分
母j次の係数. βh(i,j) : 符号語iの高域変更用フィルタの分
子j次の係数. 以上より、符号語iに対応する、変更用フィルタの伝達
関数は各々次のようになる。
【0093】
【数8】 この時、低域符号語としてLi、中域符号語としてM
i、高域符号語としてHiを有する量子化スペクトルを
変更したとして、その変更された量子化スペクトル係数
は以下のように表わすことにする。
【0094】
【数9】 ただし、
【0095】
【数10】 とする。
【0096】すると、その変更後の量子化スペクトル係
数による合成フィルタの伝達関数H[LiMiHi](z)
及びスペクトル包絡sp[LiMiHi](f)は次のよう
になる。
【0097】
【数11】 上記のsp[LiMiHi](f)と、式(2)に示される非
量子化スペクトル包絡nqsp(f)との差を、式(11)に
示されるような評価式に基づき評価し、差が最も小さく
なる符号語Li,Mi,Hiの組合せを探索する。その時
のLi,Mi,Hiが選択された符号語であり、αc[L
iMiHi](i)及びβc[LiMiHi]が、変更済量
子化スペクトル係数となる。
【0098】このようにしてスペクトル包絡変更部5で
は、変更済量子化スペクトル係数が求められる。
【0099】そして、非量子化スペクトル包絡と量子化
スペクトル包絡の差が大きい時は変更済量子化スペクト
ル係数を、小さい時は量子化スペクトル係数を用いて、
無音区間対応高能率符号化部7において高能率符号化が
行われ、その高能率符号と、量子化スペクトル係数の符
号語と、スペクトル変更情報とをまとめて、背景雑音更
新信号として出力する。その後、上述したようにデータ
切替部10において、現フレームで出力すべき信号が選
択される。
【0100】次に、復号化側での動作を説明する。符号
化側でのスペクトル包絡変更部5の構成が上述のように
なっていれば、変更済スペクトル係数算出部26は、上
述の式(12)〜(16),(19),(20)によって、変更済量子化ス
ペクトル係数を求めればよい。
【0101】《第2の実施の形態》図6は本発明の第2
の実施の形態の音声符号復号化システムで使用される音
声符号化装置の構成を示すブロック図であり、図7はこ
のシステムにおいて使用される音声復号化装置の構成を
示すブロック図である。これら音声符号化装置と音声復
号化装置とは、無線回線によって接続されている。ま
ず、図6により、送信側の音声符号化装置の構成につい
て説明する。
【0102】この音声符号化装置は、図1に示す第1の
実施の音声符号化装置と比べ、無音区間対応高能率符号
化部7の代りに無音スペクトル対応高能率符号化部13
が設けられるとともに、無音区間スペクトル係数量子化
部12が加わっている点で異なっている。
【0103】無音区間スペクトル係数量子化部12は、
無音区間において背景雑音更新信号を作成する時に、ス
ペクトル包絡解析部2で求めた非量子化スペクトル係数
及び非量子化スペクトル包絡を量子化スペクトル係数及
び量子化スペクトル包絡に変換するためのものであり、
無音区間での非量子化スペクトルを量子化するのに最適
化された符号帳を備えている。以下、無音区間スペクト
ル係数量子化部12で算出された量子化スペクトル係
数、量子化スペクトル包絡を、それぞれ、特に、「無音
区間量子化スペクトル係数」、「無音区間量子化スペク
トル包絡」と称する。
【0104】上述の第1の実施の形態では、背景雑音更
新信号を作成する際にスペクトル包絡比較部4に入力し
比較されるのは、スペクトル包絡解析部2で求めた非量
子化スペクトル包絡及びスペクトル係数量子化部6で求
めた量子化スペクトル包絡であり、スペクトル包絡変更
部5で変更されるのも、スペクトル係数量子化部6で求
めた量子化スペクトル包絡であった。ところが、この第
2の実施の形態では、スペクトル包絡比較部4で比較さ
れるのは、スペクトル包絡解析部2で求めた非量子化ス
ペクトル包絡と、無音区間スペクトル係数量子化部12
で求めた無音区間量子化スペクトル包絡であり、スペク
トル包絡変更部5で変更されるのも無音区間量子化スペ
クトル包絡である。
【0105】そして、スペクトル係数量子化部6が、有
音区間の非量子化スペクトル包絡を量子化するのに最適
化した符号帳を有するのに対し、上述したように、無音
区間スペクトル係数量子化部12は、無音区間の非量子
化スペクトル包絡を量子化するのに最適化した符号帳を
有している。ここで、無音区間スペクトル係数量子化部
12に含まれる符号帳の大きさは、スペクトル係数量子
化部6の符号帳より、はるかに小さくなっている。無音
区間の場合、量子化スペクトル係数をさらにスペクトル
包絡変更部5で変更して非量子化スペクトル包絡に近づ
けるようにしているので、符号帳としては大がかりなも
のを使用する必要がないからである。
【0106】無音区間スペクトル対応高能率符号化部1
3は、有音区間では、第1の実施の形態での無音区間対
応高能率符号化部7と同じく、マイク1から入力された
原音声信号と、スペクトル包絡解析部2で生成された非
量子化スペクトル係数と、スペクトル係数量子化部6で
生成された量子化スペクトル係数とに基づいて高能率符
号を生成し、この高能率符号に、量子化スペクトル係数
に対応する符号語を加えたものを有音符号信号として出
力する。一方、無音区間では、無音区間スペクトル対応
高能率符号化部13は、マイク1から入力された原音声
信号と、スペクトル包絡解析部2で生成された非量子化
スペクトル係数と、スペクトル包絡変更部5で生成され
た変更済量子化スペクトル係数とを用いて高能率符号を
生成し、この高能率符号に、無音区間スペクトル係数量
子化部12で求められた無音区間量子化スペクトル係数
の符号語と、スペクトル包絡変更部5で求められたスペ
クトル変化情報の符号語とを加えて背景雑音更新符号と
し、この背景雑音更新符号を出力する。
【0107】次に、音声復号化装置の構成について、図
7を用いて説明する。この音声復号化装置は、図2に示
す第1の実施の形態の音声復号化装置に対し、無音区間
量子化スペクトル係数算出部31と無音区間量子化スペ
クトル記憶部32を加えた構成であり、その代り、量子
化スペクトル係数算出部25は設けられていない。無音
区間量子化スペクトル記憶部32は、ユニークワード検
出部23の検出結果と受信信号とを入力とし、背景雑音
生成の際に使用される、無音区間量子化スペクトル係数
の符号語を記憶しているメモリである。また、無音区間
量子化スペクトル係数算出部31は、無音区間量子化ス
ペクトル記憶部32に記憶されている符号語を入力とし
て、無音区間量子化スペクトル係数を求めるものであ
る。すなわち、符号化装置にある無音区間スペクトル係
数量子化部12で求められる量子化スペクトル係数と同
じものが、この無音区間量子化スペクトル係数算出部3
1でも求められる。無音区間量子化スペクトル係数算出
部31が出力する無音区間量子化スペクトル係数が、変
更済スペクトル係数算出部26に入力している。スペク
トル変更情報記憶部27及び背景雑音用パラメータ記憶
部24と同様、無音区間量子化スペクトル記憶部32に
記憶されているデータは、背景雑音更新信号を受信した
ら、その受信信号の内容にしたがい更新される。
【0108】以下、この第2の実施の形態の音声符号復
号化システムの動作について、フローチャートを用いて
説明する。図8は音声符号化装置(送信側)の処理を示
すフローチャートである。
【0109】第1の実施の形態の場合と同様、スペクト
ル包絡解析部2において原音声信号の非量子化スペクト
ル包絡及び非量子化スペクトル係数が算出される(ステ
ップ151)。そして、非量子化スペクトル係数は、ス
ペクトル係数量子化部6に入力し、量子化スペクトル包
絡、量子化スペクトル係数及びその係数に対応する符号
語が求められる(ステップ152)。
【0110】また、有音区間検出部3は、入力された原
音声信号を解析し、現フレームが有音区間であるか、無
音区間であるかを判断する(ステップ153)。有音区
間であると判断されたときには、ステップ154に移行
し、高能率符号化を実行する。無音区間スペクトル対応
高能率符号化部13で得られた高能率符号は、データ切
替部10を通り(ステップ159)、送信アンテナ11
から送信される。
【0111】他方、ステップ153において無音区間で
あると判断された場合の処理は、以下のようになる。ま
ず、スペクトル包絡解析部2で求めた非量子化スペクト
ル係数が無音区間スペクトル係数量子化部12に入力
し、無音区間スペクトル係数量子化部12は、入力され
た非量子化スペクトル係数に対して無音区間用コードブ
ック(符号帳)を用いることにより、無音区間量子化ス
ペクトル係数と無音区間量子化スペクトル包絡を求める
(ステップ155)。そして、スペクトル包絡解析部2
で求められた非量子化スペクトル包絡と無音区間スペク
トル係数量子化部12で求められた無音区間量子化スペ
クトル包絡とをスペクトル包絡比較部4において比較
し、両者の差が大きいか小さいかを判断する(ステップ
156)。そして、この差が大きいと判断されたとき
は、スペクトル包絡変更部5において、非量子化スペク
トル包絡に近くなるように無音区間量子化スペクトル係
数が変更された、変更済量子化スペクトル係数が求めら
れる(ステップ157)。その後、ステップ156でス
ペクトル包絡の差が大きいと判断されているときには変
更済量子化スペクトル係数を、差が小さいと判断されて
いるときは無音区間量子化スペクトル係数を用いて、無
音区間スペクトル対応高能率符号化部13において高能
率符号化が行われ、その高能率符号と、量子化スペクト
ル係数の符号語及びスペクトル変更情報をまとめて、背
景雑音更新信号として出力する(ステップ154)。
【0112】また、ステップ153で無音区間であると
判断されているときは、上記のステップ156,157
と同時平行的に、プリアンブル生成部8においてプリア
ンブル信号が、ポストアンブル生成部9においてポスト
アンブル信号が生成され(ステップ158)、これらプ
リアンブル信号やポストアンブル信号がデータ切替部1
0に入力する。そして、無音区間の場合、データ切替部
10においては、現フレームで出力すべき信号が選択さ
れる(ステップ159)。具体的には、背景雑音更新
符号を出すフレームでは、無音区間スペクトル対応高能
率符号化部13で求められた背景雑音更新信号を選択
し、プリアンブル信号を出すフレームでは、プリアン
ブル生成部8で生成されたプリアンブル信号を選択し、
ポストアンブル信号を出すフレームでは、ポストアン
ブル生成部9で生成されたポストアンブル信号を選択す
る。
【0113】次に、音声復号化装置(受信側)の処理を
説明する。図9は音声復号化装置での処理を示すフロー
チャートである。
【0114】受信信号がユニークワード検出部23に入
力して、現フレームが有音区間か無音区間かが判断され
る(ステップ171)。有音区間の場合、受信した高能
率符号を高能率音声復号化部22で復号化し(ステップ
172)、その復号化音声をスイッチ21で選択して
(ステップ183)、スピーカ30から出力する。
【0115】一方、ステップ171で無音区間と判断し
た場合、ユニークワード検出部23において、受信した
信号がユニークワードであるかどうかを判断し(ステッ
プ173)、ユニークワードでない場合には背景雑音更
新信号(背景雑音更新用データ)であるかどうかを判断
する(ステップ174)。ステップ173でユニークワ
ードであった場合とステップ174で背景雑音更新用デ
ータでなかった場合はステップ178に移行し、ステッ
プ174で背景雑音更新信号と判断された場合には、新
たに受信した背景雑音更新信号より得られる背景雑音用
パラメータとスペクトル変更情報と無音区間量子化スペ
クトルとによって、それぞれ、背景雑音用パラメータ記
憶部24に保存されている背景雑音用パラメータを更新
し(ステップ175)、スペクトル変更情報記憶部27
に保存されているスペクトル変更情報を更新し(ステッ
プ176)、無音区間量子化スペクトル記憶部32に格
納されている符号語を更新し(ステップ177)、ステ
ップ178に移行する。
【0116】ステップ178では、無音区間量子化スペ
クトル記憶部32に保存されているデータ(無音区間量
子化スペクトル係数符号語)を使用して、無音区間量子
化スペクトル係数算出部31において、無音区間量子化
スペクトル係数を算出する。算出された無音区間量子化
スペクトル係数は、スペクトル変更情報記憶部27に保
存されているスペクトル変更情報とともに、変更済スペ
クトル係数算出部26に入力される。ここでは、スペク
トル変更情報を元に、無音区間量子化スペクトル係数を
変更すべきか否かを判断し(ステップ179)、変更す
る必要がある時にはスペクトル変更情報に従って変更し
て、変更済量子化スペクトル係数を算出する(ステップ
180)。
【0117】そして、ランダムな残差信号発生部28で
ランダムな残差信号を生成し(ステップ181)、背景
雑音用パラメータ記憶部24に保存されていた背景雑音
用パラメータと、変更済スペクトル係数算出部26で求
められた変更済量子化スペクトル係数(ステップ180
で量子化スペクトルを変更したとき)あるいは無音区間
量子化スペクトル係数算出部31で算出された無音区間
量子化スペクトル係数(ステップ179で量子化スペク
トルを変更しないと判断したとき)と、上述のランダム
な残差信号とが背景雑音合成部29に入力し、背景雑音
が生成される(ステップ182)。無音区間の場合は、
スイッチ21において背景雑音が選択されるので(ステ
ップ183)、背景雑音がスピーカ30より出力され
る。
【0118】
【発明の効果】以上説明したように本発明は、無音区間
では量子化スペクトル係数に対してフィルタ処理などを
行って量子化スペクトル包絡を非量子化スペクトル包絡
に近付けることにより、有音区間で用いられるような大
きな量子化スペクトル係数算出用符号帳を用いることな
しに、無音区間での音質を向上させることができるとい
う効果がある。また、フィルタ処理とともに、サイズの
小さい無音区間用量子化スペクトル係数算出用符号帳を
用いることによっても、大きなサイズの符号帳を使うこ
となく、無音区間での音質を向上させることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態の音声符号復号化シ
ステムにおける音声符号化装置の構成を示すブロック図
である。
【図2】本発明の第1の実施の形態の音声符号復号化シ
ステムにおける音声復号化装置の構成を示すブロック図
である。
【図3】図1に示す音声符号化装置の動作を示すフロー
チャートである。
【図4】図2に示す音声復号化装置の動作を示すフロー
チャートである。
【図5】スペクトル包絡変更部での処理の一例を説明す
る図である。
【図6】本発明の第2の実施の形態の音声符号復号化シ
ステムにおける音声符号化装置の構成を示すブロック図
である。
【図7】本発明の第2の実施の形態の音声符号復号化シ
ステムにおける音声復号化装置の構成を示すブロック図
である。
【図8】図6に示す音声符号化装置の動作を示すフロー
チャートである。
【図9】図7に示す音声復号化装置の動作を示すフロー
チャートである。
【図10】従来の音声符号復号化システムにおける音声
符号化装置の構成の一例を示すブロック図である。
【図11】従来の音声符号復号化システムにおける音声
復号化装置の構成の一例を示すブロック図である。
【図12】図10に示す従来の音声符号化装置の動作を
示すフローチャートである。
【図13】図11に示す従来の音声復号化装置の動作を
示すフローチャートである。
【符号の説明】
1 マイク 2 スペクトル包絡解析部 3 有音区間検出部 4 スペクトル包絡比較部 5 スペクトル包絡変更部 6 スペクトル係数量子化部 7 無音区間対応高能率符号化部 8 プリアンブル生成部 9 ポストアンブル生成部 10 データ切替部 11 送信アンテナ 12 無音区間スペクトル係数量子化部 13 無音区間スペクトル対応高能率符号化部 14 高能率符号化部 20 受信アンテナ 21 スイッチ 22 高能率音声復号化部 23 ユニークワード検出部 24 背景雑音用パラメータ記憶部 25 量子化スペクトル係数算出部 26 変更済スペクトル係数算出部 27 スペクトル変更情報記憶部 28 ランダムな残差信号発生部 29 背景雑音合成部 30 スピーカ 31 無音区間量子化スペクトル係数算出部 32 無音区間量子化スペクトル記憶部 41 低域変更用フィルタ係数符号帳 42 中域変更用フィルタ係数符号帳 43 高域変更用フィルタ係数符号帳

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 送信側で入力音声信号を符号化して符号
    化データとして受信側に伝送し、前記受信側では前記符
    号化データを復号化して出力音声信号として出力し、前
    記送信側で無音区間を検出したときには無音区間での入
    力音声信号を符号化して背景雑音更新信号とし、前記背
    景雑音更新信号を前記送信側から前記受信側に送信した
    後は前記送信側が所定の期間送信を停止し、前記所定の
    期間中は前記受信側は既に受信した背景雑音更新信号に
    基づいて背景雑音を生成して出力音声信号として出力す
    る音声信号伝送方法において、 前記無音区間での入力音声信号から量子化スペクトルを
    求めるとともに非量子化スペクトル包絡と量子化スペク
    トル包絡とを算出し、前記非量子化スペクトル包絡と前
    記量子化スペクトル包絡の差が所定のしきい値より大き
    いときには前記量子化スペクトルを変化させ、変化後の
    量子化スペクトルに基づいて前記背景雑音更新信号を生
    成することを特徴とする音声信号伝送方法。
  2. 【請求項2】 有音区間での前記入力音声信号を符号化
    する際に使用する符号帳と前記無音区間で前記入力音声
    信号を符号化する際に使用する符号帳とが異なる、請求
    項1に記載の音声信号伝送方法。
  3. 【請求項3】 音声符号化装置と音声復号化装置とを有
    し、背景雑音を生成するVOX処理を実行する音声符号
    復号化システムにおいて、 前記音声符号化装置に、前記音声符号化装置への入力信
    号での非量子化スペクトル包絡と量子化スペクトル包絡
    の差を定量的に求めるスペクトル包絡比較手段と、前記
    差に応じて前記量子化スペクトル包絡を変化させるスペ
    クトル包絡変更手段とが設けられ、 前記音声符号化装置は、背景雑音に関する符号化処理を
    行う際に前記スペクトル包絡変更手段によって変化した
    量子化スペクトル包絡を使用するとともに、その量子化
    スペクトル包絡の変化に関するスペクトル変更情報を前
    記音声復号化装置側に送信し、 前記音声復号化装置に、受信した前記スペクトル変更情
    報を格納するスペクトル変更情報記憶手段と、前記スペ
    クトル変更情報記憶手段に格納されたスペクトル変更情
    報に基づいて、受信した量子化スペクトル包絡を変化さ
    せる変化済スペクトル係数算出手段とが設けられ、 前記音声符号化装置が背景雑音を生成する際には、前記
    変化済スペクトル係数算出手段が出力する量子化スペク
    トルが使用されることを特徴とする音声符号復号化シス
    テム。
  4. 【請求項4】 前記音声符号化装置内に、第1の符号帳
    を用い有声区間での入力信号を量子化するための第1の
    スペクトル係数量子化手段と、第2の符号帳を用い前記
    無声区間での入力信号を量子化するための第2のスペク
    トル係数量子化手段とを有し、前記第1の符号帳と前記
    第2の符号帳の内容が異なる、請求項3に記載の音声符
    号復号化システム。
  5. 【請求項5】 前記スペクトル包絡変更手段がフィルタ
    処理によって量子化スペクトル包絡を変化させる、請求
    項3または4に記載の音声符号復号化システム。
JP19194496A 1996-07-22 1996-07-22 音声信号伝送方法及び音声符号復号化システム Expired - Fee Related JP3259759B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP19194496A JP3259759B2 (ja) 1996-07-22 1996-07-22 音声信号伝送方法及び音声符号復号化システム
US08/897,514 US5953698A (en) 1996-07-22 1997-07-21 Speech signal transmission with enhanced background noise sound quality
CN97115023.0A CN1174457A (zh) 1996-07-22 1997-07-22 语音信号传输方法及语音编码和解码***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19194496A JP3259759B2 (ja) 1996-07-22 1996-07-22 音声信号伝送方法及び音声符号復号化システム

Publications (2)

Publication Number Publication Date
JPH1039898A true JPH1039898A (ja) 1998-02-13
JP3259759B2 JP3259759B2 (ja) 2002-02-25

Family

ID=16283064

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19194496A Expired - Fee Related JP3259759B2 (ja) 1996-07-22 1996-07-22 音声信号伝送方法及び音声符号復号化システム

Country Status (3)

Country Link
US (1) US5953698A (ja)
JP (1) JP3259759B2 (ja)
CN (1) CN1174457A (ja)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000034944A1 (fr) * 1998-12-07 2000-06-15 Mitsubishi Denki Kabushiki Kaisha Decodeur sonore et procede de decodage sonore
WO2000046789A1 (fr) * 1999-02-05 2000-08-10 Fujitsu Limited Detecteur de la presence d'un son et procede de detection de la presence et/ou de l'absence d'un son
WO2000077774A1 (fr) * 1999-06-15 2000-12-21 Matsushita Electric Industrial Co., Ltd. Codeur de signaux de bruit et codeur de signaux vocaux
WO2006008932A1 (ja) * 2004-07-23 2006-01-26 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
JP2008511040A (ja) * 2004-08-25 2008-04-10 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
CN100390639C (zh) * 2004-01-12 2008-05-28 友达光电股份有限公司 直下式背光组件
US7941313B2 (en) 2001-05-17 2011-05-10 Qualcomm Incorporated System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system
JP2011203737A (ja) * 1998-08-24 2011-10-13 Mindspeed Technologies Inc 音声信号内の雑音様信号の存在に基づく音声パラメータの平滑化
US8050911B2 (en) 2001-06-14 2011-11-01 Qualcomm Incorporated Method and apparatus for transmitting speech activity in distributed voice recognition systems
US8195469B1 (en) 1999-05-31 2012-06-05 Nec Corporation Device, method, and program for encoding/decoding of speech with function of encoding silent period
JP2014505907A (ja) * 2011-02-14 2014-03-06 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
JP2016010893A (ja) * 2014-06-27 2016-01-21 大日本印刷株式会社 プリンタ装置、その制御方法及び印画物の製造方法
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
US9595262B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100479585B1 (ko) * 2000-12-23 2005-04-06 엘지전자 주식회사 음성부호화기를 이용한 발신 가입자 식별정보 전송방법.
US6708147B2 (en) * 2001-02-28 2004-03-16 Telefonaktiebolaget Lm Ericsson(Publ) Method and apparatus for providing comfort noise in communication system with discontinuous transmission
US7486719B2 (en) * 2002-10-31 2009-02-03 Nec Corporation Transcoder and code conversion method
CN101662288B (zh) * 2008-08-28 2012-07-04 华为技术有限公司 音频编码、解码方法及装置、***
WO2010046954A1 (ja) * 2008-10-24 2010-04-29 三菱電機株式会社 雑音抑圧装置および音声復号化装置
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
ES2884626T3 (es) * 2014-05-01 2021-12-10 Nippon Telegraph & Telephone Codificador, descodificador, método de codificación, método de descodificación, programa de codificación, programa de descodificación y soporte de registro
JP7139628B2 (ja) * 2018-03-09 2022-09-21 ヤマハ株式会社 音処理方法および音処理装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5042069A (en) * 1989-04-18 1991-08-20 Pacific Communications Sciences, Inc. Methods and apparatus for reconstructing non-quantized adaptively transformed voice signals
JP3167385B2 (ja) * 1991-10-28 2001-05-21 日本電信電話株式会社 音声信号伝送方法
EP0577488B9 (en) * 1992-06-29 2007-10-03 Nippon Telegraph And Telephone Corporation Speech coding method and apparatus for the same
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
JP2728122B2 (ja) * 1995-05-23 1998-03-18 日本電気株式会社 無音圧縮音声符号化復号化装置
JP2806308B2 (ja) * 1995-06-30 1998-09-30 日本電気株式会社 音声復号化装置
US5802109A (en) * 1996-03-28 1998-09-01 Nec Corporation Speech encoding communication system

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011203737A (ja) * 1998-08-24 2011-10-13 Mindspeed Technologies Inc 音声信号内の雑音様信号の存在に基づく音声パラメータの平滑化
US6643618B2 (en) 1998-12-07 2003-11-04 Mitsubishi Denki Kabushiki Kaisha Speech decoding unit and speech decoding method
WO2000034944A1 (fr) * 1998-12-07 2000-06-15 Mitsubishi Denki Kabushiki Kaisha Decodeur sonore et procede de decodage sonore
WO2000046789A1 (fr) * 1999-02-05 2000-08-10 Fujitsu Limited Detecteur de la presence d'un son et procede de detection de la presence et/ou de l'absence d'un son
US8195469B1 (en) 1999-05-31 2012-06-05 Nec Corporation Device, method, and program for encoding/decoding of speech with function of encoding silent period
WO2000077774A1 (fr) * 1999-06-15 2000-12-21 Matsushita Electric Industrial Co., Ltd. Codeur de signaux de bruit et codeur de signaux vocaux
EP1120775A1 (en) * 1999-06-15 2001-08-01 Matsushita Electric Industrial Co., Ltd. Noise signal encoder and voice signal encoder
EP1120775A4 (en) * 1999-06-15 2001-09-26 Matsushita Electric Ind Co Ltd NOISE SIGNAL ENCODER AND VOICE SIGNAL ENCODER
US7941313B2 (en) 2001-05-17 2011-05-10 Qualcomm Incorporated System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system
US8050911B2 (en) 2001-06-14 2011-11-01 Qualcomm Incorporated Method and apparatus for transmitting speech activity in distributed voice recognition systems
CN100390639C (zh) * 2004-01-12 2008-05-28 友达光电股份有限公司 直下式背光组件
WO2006008932A1 (ja) * 2004-07-23 2006-01-26 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
JPWO2006008932A1 (ja) * 2004-07-23 2008-05-01 松下電器産業株式会社 音声符号化装置および音声符号化方法
US8670988B2 (en) 2004-07-23 2014-03-11 Panasonic Corporation Audio encoding/decoding apparatus and method providing multiple coding scheme interoperability
JP2008511040A (ja) * 2004-08-25 2008-04-10 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
JP2014505907A (ja) * 2011-02-14 2014-03-06 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
US9595262B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
JP2016010893A (ja) * 2014-06-27 2016-01-21 大日本印刷株式会社 プリンタ装置、その制御方法及び印画物の製造方法

Also Published As

Publication number Publication date
US5953698A (en) 1999-09-14
JP3259759B2 (ja) 2002-02-25
CN1174457A (zh) 1998-02-25

Similar Documents

Publication Publication Date Title
JP3259759B2 (ja) 音声信号伝送方法及び音声符号復号化システム
US7613606B2 (en) Speech codecs
EP1719120B1 (en) Coding model selection
EP1738355B1 (en) Signal encoding
US8438019B2 (en) Classification of audio signals
US7664650B2 (en) Speech speed converting device and speech speed converting method
JP3955179B2 (ja) 音声符号化装置、音声復号化装置、およびこれらの方法
KR20030041169A (ko) 무성 음성의 코딩 방법 및 장치
JP2001005474A (ja) 音声符号化装置及び方法、入力信号判定方法、音声復号装置及び方法、並びにプログラム提供媒体
US6424942B1 (en) Methods and arrangements in a telecommunications system
JP4734286B2 (ja) 音声符号化装置
JPH08272395A (ja) 音声符号化装置
JPH07129195A (ja) 音声復号化装置
JP3223966B2 (ja) 音声符号化/復号化装置
US7584096B2 (en) Method and apparatus for encoding speech
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
Choudhary et al. Study and performance of amr codecs for gsm
JP2638522B2 (ja) 音声符号化装置
JP3055608B2 (ja) 音声符号化方法および装置
JPH07334195A (ja) サブフレーム長可変音声符号化装置
MXPA06009369A (es) Clasificacion de señales de audio

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees