JP2947008B2 - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JP2947008B2
JP2947008B2 JP5176701A JP17670193A JP2947008B2 JP 2947008 B2 JP2947008 B2 JP 2947008B2 JP 5176701 A JP5176701 A JP 5176701A JP 17670193 A JP17670193 A JP 17670193A JP 2947008 B2 JP2947008 B2 JP 2947008B2
Authority
JP
Japan
Prior art keywords
speech
spectrum coefficient
audio
circuit
background noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5176701A
Other languages
English (en)
Other versions
JPH0736485A (ja
Inventor
利浩 早田
義博 海野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP5176701A priority Critical patent/JP2947008B2/ja
Publication of JPH0736485A publication Critical patent/JPH0736485A/ja
Application granted granted Critical
Publication of JP2947008B2 publication Critical patent/JP2947008B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はディジタル通信に利用す
る。特に、音声信号のディジタル符号化技術に関する。
【0002】
【従来の技術】従来の音声符号化装置では、入力音声信
号の音声スペクトル係数を求め、入力音声信号を音声ス
ペクトル係数と、音声スペクトル係数で現せない部分と
に分け、それぞれを符号化して出力する。音声復号化装
置では、受信した符号列を音声符号化装置の逆の手順で
音声信号に変換して出力する。また、音声符号化装置が
入力音声がないと判断した場合には、一定時間符号の送
信を停止する。その間、音声復号化装置では、以前に受
信した符号列を繰り返し復号化して出力する。詳しく
は、「GSM full-rate speech transcoding:ETSI/PT 12,
GSM Recommendation06.10 January 1990 (文献1)」
と題する勧告書や「GSM full-rate speech transcodin
g:ETSI/PT 12,GSM Recommendation 06.31 January 1990
(文献2)」と題する勧告書に述べられている。
【0003】ここでは図3を参照して従来例を簡単に説
明する。図3は従来例装置のブロック構成図である。入
力音声信号が1フレーム(所定長毎の音声信号の区切
り)分、入力端子1から入力されると、音声スペクトル
係数算出回路2で音声スペクトル係数が求められる。そ
して、音声スペクトル係数と入力音声信号とを基に、有
声無声判別回路3により音声が出ているか否かが判別さ
れる。その判別に基づき、音声符号化回路6において
は、符号化された音声信号が生成され、その符号が出力
端子7より出力される。また、ここでいうフレームと
は、入力音声信号の塊であり、符号化はこのフレームを
単位として行われる。以下、入力端子1→有声無声判別
回路3→音声符号化回路6→出力端子7といった一連の
構成要素をまとめて音声符号化装置という。
【0004】ここで、「音声スペクトル係数」とは、音
声を特徴づけるスペクトルに関する係数であり、文献1
ではスペクトル包絡を表す係数が「音声スペクトル係
数」とされているので、以下「音声スペクトル係数」の
一例としてスペクトル包絡を表す係数をとる。また、ス
ペクトル包絡を表す係数とは、例えば「ディジタル音声
処理、古井貞おき著、東海大学出版会、1985年9月
25日、第1版(文献3)」のp.61頁のLPC(Linea
r Prediction Coding:線形予測分析) 係数、「文献3 」
のpp.73 〜78のPARCOR(Partial Auto-correlatio
n Coefficinet:偏自己相関) 係数、文献3のpp.90
〜92のLSP(Line Spectrum Pair:線スペクトル対)
係数等がある。
【0005】有声無声判別回路3において、無声すなわ
ち入力信号が音声ではなく、背景雑音であると判別され
ると、音声符号化回路6でその背景雑音を符号化し、そ
の符号列を音声復号化装置9に送信する。その後N(N
は定数)フレームの間は音声符号化装置からの送信を一
時停止する。ここで「背景雑音」とは、文献2中の「Co
mfortable Noise 」と同義である。音声復号化装置9で
は、符号化された背景雑音を復号化し、出力した後、N
フレームの間、先に受信した背景雑音の符号を繰り返し
復号化して出力する。
【0006】もし、無声状態が背景雑音を送信して以
降、Nフレーム連続したら、現フレームでの音声入力信
号を背景雑音として符号化し、出力端子7より音声復号
化装置9へ出力する。そして再びNフレームの間、音声
符号化装置は出力を停止する。
【0007】ただし、音声符号化装置が出力を停止して
いる間も毎フレーム、有声無声判別回路3によって、有
声無声判別を行っており、有声であると判別されるとた
だちに通常の有声時の音声符号化処理に移行する。以
下、入力音声信号が背景雑音である状態を「VOX状
態」という。
【0008】
【発明が解決しようとする課題】従来の音声復号化装置
では、無声が連続する場合はNフレーム毎に音声符号化
装置が出力する背景雑音の符号列を更新するため、この
Nフレーム、すなわちVOX状態の間、音声復号化装置
は、同一の符号列から再生された背景雑音を出力するこ
とになる。
【0009】このため、背景雑音の更新時点において
は、Nフレーム前の背景雑音から、いきなり新たな背景
雑音に変化するため、そのNフレームの間に背景雑音の
性質が変化した場合、受信者は背景雑音の更新時点での
背景雑音の急激な変化を認識してしまう。この状態を図
4を参照して説明する。図4は背景雑音時の音声スペク
トル係数の挙動を示す図である。横軸に時間の経過とと
もに到来するフレームをとり、縦軸に音声スペクトル係
数の一要素をとる。破線は、背景雑音を忠実に符号化し
たときの音声スペクトル係数の一要素であり、実線は、
音声符号化装置より出力される音声スペクトル係数の一
要素である。
【0010】さらに背景雑音の変化が長時間にわたる場
合は、前記背景雑音の変化をNフレーム毎に知覚するこ
とになる。これが、背景雑音が受信者に不自然な感じを
与える一因子となる。
【0011】従来技術として特開平2−36628号公
報に開示された技術があるが、ここには、背景雑音の更
新時点における急激な変化を緩和しようとする考え方は
ない。
【0012】本発明は、このような背景に行われたもの
であり、音声復号化装置において無声の際に生ずる背景
雑音の受信者が感じる不自然さを低減させる音声符号化
装置を提供することを目的とする。
【0013】
【課題を解決するための手段】本発明は、アナログ音声
信号が到来する入力端子と、この到来したアナログ音声
信号を所定長のフレームに分割しこのフレーム毎に前記
アナログ音声信号の音声スペクトル係数を算出する第一
の音声スペクトル係数算出回路と、前記音声スペクトル
係数にしたがって前記アナログ音声信号を符号化する音
声符号化回路と、前記アナログ音声信号に含まれる音声
成分の有無を検出する音声無声判別回路と、前記音声無
声判別回路が送信すべき音声がない無声状態と判別した
ときはあらかじめ定められた複数フレームごとに背景雑
音を前記音声符号化回路で符号化させる制御回路とを備
えた音声符号化装置である。
【0014】ここで、本発明の特徴とするところは、あ
らかじめ定められた連続長の複数のフレーム毎に前記音
声スペクトル係数を算出する第二の音声スペクトル係数
算出回路を備え、前記制御回路は前記有声無声判別回路
が無声を検出している時に前記第一の音声スペクトル係
数算出回路を前記第二の音声スペクトル係数算出回路に
切替える手段を備えたところにある。
【0015】前記第二の音声スペクトル係数算出回路に
は、前記複数のフレームに含まれるアナログ音声信号を
一時蓄積するバッファが接続されることが望ましい。前
記連続長は、前記所定長のn倍であることが望ましい。
【0016】
【作用】音声成分が非検出となる、いわゆるVOX状態
に音声符号化回路は間欠動作を行う。このとき、符号化
が中断されている間に到来したアナログ音声信号をバッ
ファに蓄え、次回の符号化のタイミングと同期して複数
の連続したフレームに含まれるアナログ音声信号を用い
て音声スペクトル係数が算出される。
【0017】すなわち、音声符号化回路の休止中に背景
雑音の性質に急激な変化があっても、バッファに蓄積さ
れている休止中に到来したアナログ音声信号をすべて用
いて音声スペクトル係数を算出することにより、符号化
された背景雑音の性質の変化は緩和される。
【0018】これにより、背景雑音を受信している受信
者が感じる違和感を低減することができる。
【0019】
【実施例】本発明実施例の構成を図1を参照して説明す
る。図1は本発明実施例装置のブロック構成図である。
【0020】本発明は、アナログ音声信号が到来する入
力端子1と、この到来したアナログ音声信号を所定長の
フレームに分割しこのフレーム毎に前記アナログ音声信
号の音声スペクトル係数を算出する第一の音声スペクト
ル係数算出回路2と、前記音声スペクトル係数にしたが
って前記アナログ音声信号を符号化する音声符号化回路
6とを備えた音声符号化装置である。
【0021】ここで、本発明の特徴とするところは、あ
らかじめ定められた連続長の複数のフレーム毎に前記音
声スペクトル係数を算出する第二の音声スペクトル係数
算出回路として窓拡張音声スペクトル係数算出回路4
と、前記アナログ音声信号に含まれる音声成分の有無を
検出する有声無声判別回路3とを備え、有声無声判別回
路3が無声を検出している時に音声スペクトル係数算出
回路2を窓拡張音声スペクトル係数算出回路4に切替え
る手段として制御回路20を備えたところにある。
【0022】窓拡張音声スペクトル係数算出回路4に
は、前記複数のフレームに含まれるアナログ音声信号を
一時蓄積するバッファとして音声スペクトル補助情報バ
ッファ5が接続される。前記連続長は、前記所定長のn
倍である。
【0023】本発明実施例装置には、図3に示した従来
例装置と比較して二つのブロックが追加されている。す
なわち、過去nM(Mは定数)フレーム分の音声スペク
トル係数を算出する際に使用した情報を保持するFIF
O(First-In-First-Out)型の音声スペクトル補助情報バ
ッファ5および音声スペクトル係数を求める際に通常使
用する窓よりもさらに広い窓を用いて音声スペクトル係
数を算出する機能を有する窓拡張音声スペクトル係数算
出回路4を有している。
【0024】有声無声判別回路3により、有声無声を判
別するまでは、従来例と同じである。さらに、有声の場
合は、以降も従来例と同様に入力音声信号より求めた音
声スペクトルを直接、音声符号化回路6に入力し、出力
端子7より符号化された音声信号を出力する。
【0025】無声の場合は、まず、現フレームの音声ス
ペクトル係数を算出するのに使用した情報を音声スペク
トル補助情報バッファ5に保持し、その音声スペクトル
補助情報バッファ5の中の最も古い情報を破棄する。こ
こで、音声スペクトル係数を算出するのに使用した情報
とは、例えば「文献3」のp.63に記載されている共分散
法における共分散行列が考えられる。以下、このように
音声スペクトルを算出するに必要かつ充分な情報を「音
声スペクトル補助情報」という。
【0026】現フレームが背景雑音を更新すべきフレー
ムで無ければ、音声スペクトル補助情報バッファ5に音
声スペクトル補助情報を保持した時点で、そのフレーム
での処理は終了する。現フレームが背景雑音の更新情報
を送信すべきフレームであれば、音声スペクトル補助情
報バッファ5に保持されている過去nMフレームの音声
スペクトル補助情報に基づき、改めて音声スペクトル係
数を算出し、この過去nMフレームにわたる音声スペク
トル係数を背景雑音の更新情報とする。過去nMフレー
ム分の音声スペクトル補助情報を用いることは、すなわ
ち音声スペクトル係数を算出する際の時間窓を拡張する
のと同義である。
【0027】ここで一例として、音声スペクトル係数と
して「文献3」のpp.73 〜78のPARCOR係数を取
り、また、音声スペクトル補助情報として「文献3」の
p.63に記載されている共分散法による共分散行列をとる
とする。
【0028】音声スペクトル係数の次数をLとすると、
音声スペクトル係数を求めるに必要な共分散行列は、L
行L列である。以下このL行L列の共分散行列をΦ
〔L〕〔L〕と記す。これに対して、音声スペクトル補
助情報バッファ5には、過去nMフレーム分の共分散行
列Φ〔L〕〔L〕が格納されている。これをまとめて、
Φb〔i〕〔L〕〔L〕と記す(ただし、i=1〜nM
の整数)。
【0029】背景雑音を更新するフレーム以外では、Φ
〔L〕〔L〕を用いて音声スペクトル係数算出回路2で
求めた音声スペクトル係数をそれ以降の音声符号化装置
の処理に用いる。しかし、背景雑音を更新するフレーム
では、窓拡張音声スペクトル係数算出回路4において、 Φex〔L〕〔L〕= (i=1 to M) ΣΦb〔i〕〔L〕〔L〕 …(1) を使用して音声スペクトル係数を算出し、以降の処理で
はその係数を使用する。従来の方式では、図3に示すよ
うに背景雑音更新前後で音声スペクトル係数が急激に変
化する。しかし、本発明実施例装置のように窓拡張した
音声スペクトル係数を背景雑音の更新情報とすることに
より、図2に示すように背景雑音前後における音声スペ
クトル係数の変化は少なくなる。図2は背景雑音時の音
声スペクトル係数の挙動を示す図である。横軸に時間の
経過とともに到来するフレームをとり、縦軸に音声スペ
クトル係数の一要素をとる。破線は、背景雑音を忠実に
符号化したときの音声スペクトル係数の一要素であり、
実線は、音声符号化装置より出力される音声スペクトル
係数の一要素である。これにより、音声復号化装置9に
おいて、背景雑音更新前後で急激に音声の性質が変化す
ることに起因して受信者が享受する背景雑音の際の違和
感も減少する。
【0030】
【発明の効果】以上説明したように、本発明によれば、
音声復号化装置の側で起きる音声スペクトル係数の急激
な変化を抑え、受信者が享受する背景雑音が急激に変化
することの不自然さを低減することができる。
【図面の簡単な説明】
【図1】本発明実施例装置のブロック構成図。
【図2】本発明実施例の背景雑音時の音声スペクトル係
数の挙動を示す図。
【図3】従来例装置のブロック構成図。
【図4】従来例の背景雑音時の音声スペクトル係数の挙
動を示す図。
【符号の説明】
1、8 入力端子 2 音声スペクトル係数算出回路 3 有声無声判別回路 4 窓拡張音声スペクトル係数算出回路 5 音声スペクトル補助情報バッファ 6 音声符号化回路 7、10 出力端子 9 音声復号化装置 20 制御回路

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 アナログ音声信号が到来する入力端子
    と、この到来したアナログ音声信号を所定長のフレーム
    に分割しこのフレーム毎に前記アナログ音声信号の音声
    スペクトル係数を算出する第一の音声スペクトル係数算
    出回路と、前記音声スペクトル係数にしたがって前記ア
    ナログ音声信号を符号化する音声符号化回路と前記アナ
    ログ音声信号に含まれる音声成分の有無を検出する音声
    無声判別回路と、前記音声無声判別回路が送信すべき音
    声がない無声状態と判別したときはあらかじめ定められ
    た複数フレームごとに背景雑音を前記音声符号化回路で
    符号化させる制御回路とを備えた音声符号化装置におい
    て、 あらかじめ定められた連続長の複数のフレーム毎に前記
    音声スペクトル係数を算出する第二の音声スペクトル係
    数算出回路を備え、 前記制御回路は前記 有声無声判別回路が無声を検出して
    いる時に前記第一の音声スペクトル係数算出回路を前記
    第二の音声スペクトル係数算出回路に切替える手段を備
    えたことを特徴とする音声符号化装置。
  2. 【請求項2】 前記第二の音声スペクトル係数算出回路
    には、前記複数のフレームに含まれるアナログ音声信号
    を一時蓄積するバッファが接続された請求項1記載の音
    声符号化装置。
  3. 【請求項3】 前記連続長は、前記所定長のn倍(nは
    2以上の整数)である請求項1記載の音声符号化装置。
JP5176701A 1993-07-16 1993-07-16 音声符号化装置 Expired - Fee Related JP2947008B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5176701A JP2947008B2 (ja) 1993-07-16 1993-07-16 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5176701A JP2947008B2 (ja) 1993-07-16 1993-07-16 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH0736485A JPH0736485A (ja) 1995-02-07
JP2947008B2 true JP2947008B2 (ja) 1999-09-13

Family

ID=16018240

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5176701A Expired - Fee Related JP2947008B2 (ja) 1993-07-16 1993-07-16 音声符号化装置

Country Status (1)

Country Link
JP (1) JP2947008B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59172690A (ja) * 1983-03-22 1984-09-29 日本電気株式会社 ボコ−ダ

Also Published As

Publication number Publication date
JPH0736485A (ja) 1995-02-07

Similar Documents

Publication Publication Date Title
KR100563293B1 (ko) 음성 복호화에서 음성 프레임 오류 은폐를 위한 방법 및시스템
JP3167385B2 (ja) 音声信号伝送方法
EP0459358A2 (en) Speech decoder
JPH0962299A (ja) コード励振線形予測符号化装置
JPH06202696A (ja) 音声復号化装置
JPH02288520A (ja) 背景音再生機能付き音声符号復号方式
JP2002268696A (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JPH07129195A (ja) 音声復号化装置
JPH08179795A (ja) 音声のピッチラグ符号化方法および装置
CA2293165A1 (en) Method for transmitting data in wireless speech channels
JP2861889B2 (ja) 音声パケット伝送システム
JPH08314497A (ja) 無音圧縮音声符号化復号化装置
JP2947008B2 (ja) 音声符号化装置
US6240383B1 (en) Celp speech coding and decoding system for creating comfort noise dependent on the spectral envelope of the speech signal
KR100542435B1 (ko) 패킷 망에서의 프레임 손실 은닉 방법 및 장치
JP2900987B2 (ja) 無音圧縮音声符号化復号化装置
JP3649854B2 (ja) 音声符号化装置
JP3055608B2 (ja) 音声符号化方法および装置
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP2002252644A (ja) 音声パケット通信装置及び音声パケット通信方法
JP4597360B2 (ja) 音声復号装置及び音声復号方法
JPH05165500A (ja) 音声符号化方法
JPH1022936A (ja) 補間装置
JP3593183B2 (ja) 音声復号装置
JP3131437B2 (ja) 誤り補償方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070702

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080702

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090702

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100702

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110702

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees