JPH05204395A - 音声用利得制御装置および音声記録再生装置 - Google Patents

音声用利得制御装置および音声記録再生装置

Info

Publication number
JPH05204395A
JPH05204395A JP4110527A JP11052792A JPH05204395A JP H05204395 A JPH05204395 A JP H05204395A JP 4110527 A JP4110527 A JP 4110527A JP 11052792 A JP11052792 A JP 11052792A JP H05204395 A JPH05204395 A JP H05204395A
Authority
JP
Japan
Prior art keywords
gain
audio
voice
amplitude
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4110527A
Other languages
English (en)
Other versions
JP2965788B2 (ja
Inventor
Takahiko Nakano
貴彦 中野
Shuichi Yoshikawa
修一 吉川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP4110527A priority Critical patent/JP2965788B2/ja
Publication of JPH05204395A publication Critical patent/JPH05204395A/ja
Application granted granted Critical
Publication of JP2965788B2 publication Critical patent/JP2965788B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Control Of Amplification And Gain Control (AREA)
  • Complex Calculations (AREA)

Abstract

(57)【要約】 【目的】音声信号に含まれるノイズやイントネーシヨン
に影響されず、精度のよい利得制御が行える音声用利得
制御装置を提供する。 【構成】音声入力装置10でサンプリングされた音声信
号を非線形変換回路41で振幅の小さい信号を引き伸ば
し、振幅や時間軸を拡張する非線形変換処理する。これ
により、振幅の発生確率が平均化される。そして、平均
化されたことにより信号より振幅決定回路42が利得制
御に適正な振幅を計算し、続いて利得決定回路43が計
算された振幅に対応した利得を決定し、音声コーデック
20を介して音声入力装置10からの音声信号が入力さ
れる乗算器30に振幅係数として与える。これにより、
音声信号に適正な振幅係数が掛けられ、適正な利得制御
が行われる。音声用利得制御装置20は、入力される振
幅の発生頻度が平均化されるように、該振幅を非線形変
換する非線形変換部21を有し、雑音や話のイントネー
ションの影響の少ない適正な利得を得る。得られた利得
は、音声コーデック20で複号化された音声信号の振幅
に、乗算器30で乗じられる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声コーデック(CO
DEC:coderとdecoderとの合成語)に用
いられる音声用自動利得制御に関し、特に、マイクロフ
ォン等の音声入力装置から入力される音声信号の利得
(ゲイン)を適正値に自動的に制御する音声用自動利得
制御装置および該音声用自動利得制御装置を備えた音声
記録再生装置に関する。
【0002】
【従来の技術】音声コーデックは、一般に、アナログ信
号である音声を符号化する機能と符号化されたデータを
復号化する機能の両方を合わせ持つ装置である。このよ
うな音声コーデックにより、音声入力装置を通して入力
されるアナログの音声信号を符号化(コード)データに
変換し、しかる後、符号化データをテープカートリッジ
等の記録媒体に録音する構成を有する音声録音再生装置
がある。
【0003】留守番電話機能付き電話機に於ては、磁気
テープによる音声記録再生装置に代えて、半導体記憶装
置を使用した音声記録再生装置を採用するものがある。
このような半導体記憶装置による音声記録再生装置で
は、音声信号を符号化して一旦この半導体記憶装置に記
憶させておき、後にこれを復号化して音声として再生す
ることになる。
【0004】再生された音質の向上を図るためには、音
声信号の振幅が適当な大きさになるように、音声用利得
制御装置によって音声信号の利得を適正値に制御する必
要がある。従来、この種の利得制御は、音声信号を監視
(統計処理)して得られる平均化された音声振幅または
音声パワーを、利得係数としてフィードバックするフィ
ードバック制御により、行われていた。例えば、音声信
号の特徴を抽出する方法として、統計的手法による度数
分布に基づく方法がある。
【0005】
【発明が解決しようとする課題】しかしながら、音声信
号を長い時間観測した場合、該度数分布はその形が振幅
の小さい音声信号の発生確率が高く、振幅の大きい音声
信号の発生確率が低い分布となり、一様分布にならな
い。このため、該度数分布法によれば、音声の性質を精
度よく把握できず、精度のよい振幅係数が得られないた
め、結局音質の低下を来すことになる。特に、短い会話
では音声を特定の性質に限定できず、適正な振幅情報を
得ることが困難であるため、より大きな問題になる。加
えて、会話の場合はイントーネーションの影響を受け易
いという問題もある。
【0006】また、音声用利得制御装置が音声信号の振
幅に応じて随時フィードバックしながら利得制御を行っ
たのでは、音声が抑揚の乏しい単調なものとなる。しか
し、留守番電話機能付き電話機等に用いられる音声記録
再生装置では、音声信号の記録時と再生時とが時間的に
異なるために、事後的に利得をどのように調整するかを
決定することが可能である。そこで、音声信号を所定区
間ごとに区切り、この区間内の振幅の平均値に基づいて
利得の調整量を計算し、これを音声信号のディジタルデ
ータと共に記録する音声用利得制御装置が既に開発され
ている。このように音声信号の所定区間ごとに利得制御
を行えば、その間の音声の抑揚等を保存することができ
る。しかし、通常の話言葉の音声には、言葉が発せられ
る有音部分と、この言葉の区切りごとの無音部分とが存
在する。そして、この無音部分の多い話言葉では、所定
区間内に無音部分の占める割り合いが多くなり、音声信
号の振幅の平均値が異常に低くなる。このため、従来の
音声用利得制御装置は、音声信号を所定区間ごとに区切
って利得を調整する場合に、無音部分の多い音声では適
正な利得の調整を行うことができなくなるという問題が
生じていた。また、この問題を解決するために音声信号
を区切る区間を短くしたのでは、随時振幅をフィードバ
ックした場合と同様に、抑揚の乏しいものとなるだけで
あり問題の解決とならない。
【0007】さらに、上記従来の音声記録再生装置で
は、音声信号が利得制御されて符号化された後に記録媒
体に記憶されるため、再生時には常に利得制御後の音声
信号のみが復号化されることになる。このため、従来の
音声記録再生装置は、再生された音声の大きさや抑揚が
単調なものとなり、記録されたメッセージのニュアンス
を正確に伝えることができないという問題が生じてい
た。
【0008】本発明の目的は、音声信号に含まれるノイ
ズやイントネーシヨンに影響されず、精度のよい利得制
御が行える音声用利得制御装置を提供することにある。
【0009】本発明の他の目的は、所定区間の音声信号
について振幅の度数分布を作成し、この度数分布から有
音部分のみを抽出して平均値を計算することにより、無
音部分の影響を受けない利得制御を行うことができる音
声用利得制御装置を提供することにある。
【0010】本発明の更に他の目的は、音声信号の利得
制御を所定区間ごとに行い、また、この利得制御のため
の利得係数を音声信号のディジタルデータとは別に記録
しておくことにより、記録データの増加を最小限に留め
ながら、音声の大きさや抑揚を損なうことなく再生する
ことができる音声記録再生装置を提供することにある。
【0011】
【課題を解決するための手段】本発明の音声用利得制御
装置は、音声入力装置から入力される音声信号の利得を
自動的に制御する音声用利得制御装置であって、該音声
信号の振幅の小さい信号の振幅を引き伸ばし、該振幅の
小さい信号と振幅の大きい信号の発生確率を平均化する
非線形変換回路と、該非線形変換回路により平均化され
た音声信号に基づき利得制御用の振幅値を算出し、算出
値により利得を決定する利得決定回路とを備え、決定さ
れた該利得により該音声信号の振幅を制御することによ
り、上記目的が達成される。
【0012】前記非線形変換回路および前記利得決定回
路が乗算器、ROM、RAMおよび演算装置を備えたデ
ジタルシグナルプロセッサで構成され、該非線形変換回
路および前記利得決定回路の演算処理内容をソフトウェ
ア的に行ってもよい。
【0013】前記非線形変換回路のソフトウェア的演算
処理を非線形量子化法の一手法であるμ則圧縮特性法に
よって行ってもよい。
【0014】前記利得決定回路のソフトウェア的演算処
理を、前記非線形変換回路から前記利得決定回路に与え
られる入力レベルと、予め設定された該入力レベルの最
大値とを比較し、該入力レベルが該最大値よりも大きい
場合に、該最大値を入力レベルとして採用し、該最大値
に従って利得を決定するソフトウェア的処理手順で行っ
てもよい。
【0015】前記デジタルシグナルプロセッサの乗算機
能を用いて前記非線形変換回路からの入力信号をフィル
タ処理してもよい。
【0016】本発明の音声用利得制御装置は、音声信号
を符号化して記憶装置に記録する音声記録再生装置にお
いて用いられる音声用利得制御装置であって、音声信号
の所定区間ごとにおける振幅の度数分布を作成する度数
分布作成手段と、該度数分布作成手段が作成した度数分
布から有音部分のみを抽出する有音部分抽出手段と、該
有音部分抽出手段が抽出した有音部分の度数分布からそ
の振幅の平均値を計算する平均値計算手段と、該平均値
計算手段が計算した平均値に基づいて利得を決定する利
得決定手段とを備えており、そのことにより上記目的が
達成される。
【0017】本発明の音声記録再生装置は、音声信号を
符号化して記憶装置に記録し、これを復号化して再生す
る音声記録再生装置であって、音声信号を符号化して該
記憶装置に記録する符号化手段と、この音声信号の所定
区間ごとの振幅の平均値を計算する平均値計算手段と、
該平均値計算手段が計算した平均値から利得係数を計算
して該記憶装置に記録する利得係数計算手段と、該記憶
装置から符号化された信号を読み出し、復号化する復号
化手段と、該復号化手段が復号化した音声信号につい
て、該利得係数計算手段が計算した利得係数を該記憶装
置から読み出し、該利得計数に基づいて利得の調整を行
う利得制御手段とを備えており、そのことにより上記目
的が達成される。
【0018】
【実施例】図1は、本発明の音声用利得制御装置が音声
コーデックを備えた音声記録再生装置に用いられたシス
テムのブロック図を示している。
【0019】音声入力装置10は、一連の音声信号列を
監視し、該音声信号列の振幅を所定のサンプリングピッ
チでサンプリングする。サンプリングされた信号は、音
声コーデック20に入力される。音声コーデック20は
入力信号を符号化されたデータに符号化し、次いで該符
号化データを復号して乗算器30に与える。より詳細に
は、音声コーデック20内の符号化回路により符号化さ
れた符号化データが、例えば、該音声録音再生装置の録
音部に出力され、続いてテープカートリッジ等の記録媒
体(不図示)に録音される。これにより会話内容等が録
音される。記録媒体から読みだされた符号化データは、
音声コーデック20内の復号化回路で復号され、乗算器
30に与えられる。
【0020】乗算器30には、音声用利得制御装置40
により決定された利得係数が入力されるようになってお
り、復号化された信号に該利得係数を掛けた信号、すな
わち利得制御が行われた適正な振幅の信号を出力する。
【0021】該音声用利得制御装置は40は、音声入力
装置10がサンプリングした音声信号が入力される非線
形変換回路41と、該非線形変換回路41により信号処
理された信号が入力される振幅計算回路42と、該振幅
計算回路42により計算された利得制御用の振幅値によ
り前記利得係数を計算し、これを乗算器30に与える利
得決定回路43で構成される。
【0022】本発明の重要な特徴は、非線形変換回路4
1で非線形変換した音声信号に基づいて、振幅計算回路
42により振幅を計算することにある。非線形変換回路
41、振幅計算回路42及び利得決定回路43の回路そ
のものは、従来から存在する公知のものを用いてもよ
い。
【0023】本実施例の非線形変換回路41は、入力さ
れた音声信号を以下に示す内容で非線形変換する。すな
わち、音声信号中の振幅の小さい信号について、該信号
の振幅や時間軸を拡張する非線形変換処理を行う。これ
により、振幅の小さい信号と振幅の大きい信号の発生確
率が平均化される。それ故、該音声信号を統計処理して
その度数分布を求めると、一様な度数分布が得られる。
加えて、このような平均化処理によれば、音声信号に含
まれる信号振幅の大きなノイズが圧縮されるので、該ノ
イズの悪影響を排除できる。従って、平均化された音声
信号に基づき利得を制御すれば、ノイズやイントネーシ
ョンの影響の少ない適正な利得制御が可能になる。
【0024】振幅計算回路42は、非線形変換回路41
により発生確率を平均化された音声信号の振幅に基づい
て、利得制御に必要な振幅を計算する。振幅を計算する
方法には、種々の方法が知られている。非線形変換回路
41から入力されてくる信号の振幅の所定期間ごとの最
大値を得て、それぞれの期間の振幅の最大値を各々の期
間についての「振幅」とする方法や、所定期間内の度数
分布に基づいて平均振幅を得て、その平均振幅を各々の
期間についての「振幅」とする方法が公知である。
【0025】計算された振幅データは、利得決定回路4
3に入力され、ここで計算された振幅値に対応した利得
が決定(算出)され、振幅係数として乗算器30に出力
される。
【0026】上記の利得制御に必要な振幅計算と並行し
て、音声コーデック20においては、符号化処理が行わ
れる。すなわち、本実施例では、音声コーデックでの音
質に影響を与えないように、符号化処理に平行して利得
の決定が行われるシステム構成になっている。
【0027】非線形変換回路41、振幅計算回路42お
よび利得決定回路43からなる本実施例の音声用利得制
御装置40は、アナログ回路によっても実現できるが、
DSP(Digital Signal Processor)で音声用利得制御
装置40を構成し、そのソフトウェアで非線形変換回路
41、振幅計算回路42および利得決定回路43の演算
処理を実行すれば、演算処理を迅速、かつ精度よく行え
る利点がある。以下にその詳細を説明する。
【0028】図2は、DSPのシステム構成を示す。D
SPのディジタル信号処理には、乗算、加算が頻繁に行
われる。このためのハードウェアとして、DSPには、
並列乗算器(以下単に乗算器という)104が設けられ
るる。乗算器104における乗算は、乗数のそれぞれの
行(ビット)毎に被乗数との間で掛算(AND操作)を
行って部分積を算出し、この部分積を加算して最終的な
積を求めるという形で行われる。並列乗算器104はこ
の部分積の算出、部分積の加算を並列に行うことで処理
を高速化している。
【0029】ここで、DSPで実行する演算処理は、乗
算結果を次々に累積する、いわゆる積和演算が多いのが
特徴である。このため、DSPの演算回路、すなわちA
LU100は乗算器104による乗算の結果の累積が連
続して毎サイクル実行できるように設計がなされてい
る。すなわち、乗算器104の乗算結果を直接ALU1
00に入力させることができ、また、ALU100の演
算結果は累積用のレジスタであるアキュームレータ10
5に格納(蓄積)されると共に、アキュームレータ10
5の出力はALU100に与えられるようになっている
(図2参照)。また、アキュームレータ105の出力
は、セレクタ103を介して乗算器104に与えられる
ようになっている。
【0030】このようにDSPでは、乗算・加算等を高
速に行うことができるが、ALU100の処理能力を引
き出し、該ALU100のスループットを上げるには次
々にデータをALU100に与える必要がある。このた
め、DSPでは、複数のデータ・バス107(図示例で
は1組のデータバスのみ示す)が設けられている。図示
するデータ・バス107は、アドレス・バス106から
与えられるアドレスにより、対応するアドレスにデータ
が書き込み/読み出されるROM101、RAM102
の出力と乗算器104の入力レジスタを結ぶバスとして
機能する。すなわち、このデータ・バス107は乗算器
104に対し乗数、被乗数を毎サイクル設定するための
バスであり、このデータ・バス107により、RAM1
02、ROM101から連続してデータが読み出されて
乗算が行われる。
【0031】次に、図3および図4を参照して、ALU
100による非線形変換処理の内容について説明する。
ここで、この非線形変換処理は、上記の非線形変換回路
41の処理内容と同様であり、ROM101に格納され
た非線形変換処理のためのプログラム、すなわちROM
101に格納されたプログラムデータに従ったアルゴリ
ズムをALU100が実行することにより行われる。よ
り具体的には、非線形量子化法の一手法であるμ則圧縮
特性法に従った非線形変換処理が行われる。この非線形
変換処理は、下記(1)式で示す変換式のy(圧縮後信
号レベル)を算出し、このyを上記音声入力装置10か
らの入力レベルを平均化処理した一様な度数分布として
得る。
【0032】 y=(x−a)・(16/b)+c …(1) 但し、x:圧縮前信号レベル(音声入力装置10からの
入力レベル) a、b、c:音声入力装置10の特性に合わせた係数 である。
【0033】以下に、図3および図4に従いyの算出手
順をより詳細に説明する。まず、このプログラムがスタ
ートすると、ALU100はステップS1で、上記
(1)式の変換式を得るための係数a、b、cにそれぞ
れ0、32、0を設定する。続いて、ステップS2で音
声入力装置10からの入力レベルxの値が31より大き
いか否かを判定し、小さいことを確認すると、図4に示
すステップS16に進み、ここで入力レベル−aを入力
レベルに設定する。すなわち、ステップS16では、上
記(1)式中の(x−a)を算出する。
【0034】一方、ステップS2で入力レベルxが31
以上であると判定すると、この場合には入力レベルxの
設定処理を行わず、次にステップS3で係数a、b、c
にそれぞれ31、64、16を設定する。そして、ステ
ップS4で入力レベルxが95より大きいか否かを判定
し、小さいことを確認すると、上記同様にしてステップ
S16に進み、ここでこのときの入力レベルx−aを入
力レベルxに設定する。
【0035】ステップS4で入力レベルxが95以上で
あると判定すると、次にステップS5で係数a、b、c
をそれぞれ95、128、32に設定し、ステップS6
で入力レベルxが223より大きいか否かを判定する。
入力レベルxが223よりも小さいことを確認すると、
上記同様にステップS16に進み、ここで入力レベルx
の設定処理を行い、223以上である場合はステップS
7で新たな係数a、b、c設定を行う。以下同様にし
て、ステップS7〜ステップS15の処理を行ってステ
ップS16に進み、係数aに対応した入力レベルx−a
を設定する。
【0036】ステップS16で入力レベルxの設定処理
が行われると、ALU100は、次にステップS17で
乗算器104に演算ステップS16で算出された入力レ
ベル(x−a)に(16/b)を掛ける乗算処理を行わ
せ、これにより算出される上記(1)式中の(x−a)
×(16/b)を新たな入力レベルとしてアキュームレ
ータ105に蓄積する。
【0037】続いて、ステップS18で、アキュームレ
ータ105に蓄積された入力レベル(x−a)×(16
/b)を読み出し、乗算器104に該入力レベル(x−
a)×(16/b)に係数cを加算させる処理を行わ
せ、この値(x−a)×(16/b)+cを最終的に入
力レベル、すなわち変換後の信号レベルyとして得、こ
ひの値をアキュームレータ105に蓄積する。
【0038】次に、図6に従い上記の振幅計算回路42
の演算処理に相当する処理の内容について説明する。A
LU100は、ROM101に格納された振幅計算のた
めのプログラムがスタートすると、ALU100はステ
ップS61で、入力レベルxの値がデフォルト値より大
きいか否かを判定し、大きいことを確認すると、入力レ
ベルを最大値に設定する。一方、ステップS61で入力
レベルがデフォルト値以下であると判定すると、この場
合には最大値の設定処理を行わず、エンドに進む。こう
して、非線形変換回路から振幅計算回路に逐次入力され
る複数の入力レベルについて、上記処理と同様の処理を
繰り返し行うことにより、所定期間に於ける入力レベル
(非線形変換回路41の出力)の最大値を得ることがで
きる。この例では、入力レベルの最大値を得て、それを
各期間の「振幅」としている。しかし、DSPの有する
乗算機能を用いて、種々の方法で振幅を得ることが可能
である。例えば、雑音を「振幅」と計算しないように、
入力レベルに対してフィルタ処理を行い、振幅計算の際
に入力レベルから雑音を排除することも可能である。
【0039】このように、非線形変換回路により音声信
号中の振幅の小さい信号を引き伸ばして該信号の振幅や
時間軸を拡張すると、音声信号振幅の発生確率を平均化
できる。そして、この平均化により該音声信号に含まれ
る信号振幅の大きなノイズが圧縮される。従って、平均
化された音声信号に基づき利得を制御すれば、ノイズや
イントネーションの影響の少ない適正な利得制御が行え
る。
【0040】図7は、本発明による他の音声用利得制御
装置の構成を示している。この音声利得制御装置によれ
ば、音声入力装置1から音声信号が入力されると、まず
度数分布作成手段2によって音声信号の所定区間ごとに
おける振幅の度数分布が作成される。この度数分布は、
音声信号の所定区間(例えばサンプリング期間)を細分
化すると共に、各期間ごとにその音声信号の振幅を量子
化し、この量子化した値が一致する期間の数を計数して
作成したヒストグラムである。
【0041】次に、有音部分抽出手段3がこの度数分布
から有音部分のみを抽出する。度数分布は、その所定区
間内における音声信号の振幅レベルごとの度数を表すも
のであるため、ある一定の振幅レベル以下の度数を切り
捨てれば、有音部分のみの度数分布を抽出することがで
きる。
【0042】そして、平均値計算手段4がこの有音部分
のみを抽出した度数分布からその振幅の平均値を計算
し、利得決定手段5がこの平均値に基づいて利得を決定
する。従って、音声信号の有音部分のレベルが一定であ
れば、無音部分の多い少ないにかかわりなく一定の平均
値を得ることができ、これによって有音部分にのみ基づ
いた利得を決定することができる。
【0043】この結果、本発明の音声用利得制御装置に
よれば、音声信号の無音部分の影響を受けることなく、
常に最適な利得制御を行うことができるようになる。
【0044】図8は、本発明の音声用利得制御装置を備
えた音声記録再生装置の構成を示す。
【0045】音声入力装置10から入力された音声信号
は、符号化回路12と度数分布作成回路13aとに送ら
れる。符号化回路12は、通常のPCM(pulse code m
odulation)方式によって音声信号をディジタルデータ
に変換する回路でもよいが、好ましくは、長時間記録を
可能にするために、ADPCM(adaptive differentia
l PCM)方式等によって符号化データの圧縮を行う回路
である。符号化回路17によって符号化されたディジタ
ルデータは、後に復号化回路16によって復号化され
る。復号化回路16は、符号化回路12によって符号化
されたディジタルデータを同じ方式の逆変換によって音
声信号に復号化する回路である。そして、復号化回路1
6によって復号化された音声信号は、振幅調整回路19
を介して音声出力装置18に送られ、音声として再生さ
れる。本実施例の音声コーデックは、符号化回路12と
復号化回路16とからなる。
【0046】度数分布作成回路13aは、入力された音
声信号をサンプリング及び量子化して、所定サンプリン
グ数の期間ごとに量子化された振幅の度数分布を作成す
る回路である。この度数分布は、音声信号の所定サンプ
リング数の期間内において、量子化した音声信号の振幅
が一致するサンプリング期間の数を計数して作成したヒ
ストグラムである。度数分布作成回路13aの出力は、
有音部分抽出回路13bに接続されている。有音部分抽
出回路13bは、度数分布作成回路13aが作成した度
数分布から有音部分のみを抽出する回路である。また、
有音部分抽出回路13bの出力は、平均値計算回路13
cに接続されている。平均値計算回路13cは、入力さ
れた度数分布に基づいて、その所定サンプリング数の期
間内の振幅レベルの平均値を計算する回路である。そし
て、平均値計算回路13cが計算した振幅レベルの平均
値に基づいて、後に利得決定回路14が音声信号の利得
を決定する。
【0047】利得決定回路14の出力は、利得制御回路
17を介して振幅調整回路19に接続されている。利得
制御回路18は、利得決定回路14が決定した利得に基
づいて振幅調整回路19を制御し、復号化回路16が復
号化した音声信号の利得を調整する回路である。
【0048】本実施例の度数分布作成回路13aと有音
部分抽出回路13bと平均値計算回路13cとを、図1
に示された実施例の振幅計算回路42として用いること
も可能である。
【0049】以下に、上記構成の音声用利得制御装置を
備えた音声記録再生装置の動作を説明する。
【0050】音声入力装置10からの音声信号は、符号
化回路12と度数分布作成回路13aとに入力される。
符号化回路12に送られた音声信号は、ADPCM方式
等によってディジタルデータに符号化され、適宜図示し
ない半導体記憶装置に一旦記憶される。
【0051】度数分布作成回路13aに送られた音声信
号は、まず所定サンプリング数の期間ごとに度数分布が
作成される。次に、この度数分布は、有音部分抽出回路
13bに送られて有音部分のみが抽出される。度数分布
は、その所定サンプリング数の期間内における音声信号
の振幅レベルごとの度数を表すものであるため、ある一
定の振幅レベル以下の度数を切り捨てることにより、有
音部分のみの度数分布を抽出することができる。そし
て、この有音部分のみを抽出した度数分布は、平均値計
算回路13cに送られて平均値が計算され、適宜図示し
ない半導体記憶装置に一旦記憶される。従って、音声信
号における有音部分のレベルが一定であれば、無音部分
の多い少ないにかかわりなく一定の平均値を得ることが
できる。
【0052】上述のようにして半導体記憶装置に記憶さ
れたディジタルデータは、順次読み出されて復号化回路
16により音声信号に復号化される。そして、この音声
信号は、振幅調整回路19を介して音声出力装置18に
送られ音声として再生される。また、この半導体記憶装
置に記憶された平均値のデータは、ディジタルデータが
所定サンプリング数だけ読み出されるたびに1つずつ読
み出され、利得決定回路14に送られる。利得決定回路
14では、この平均値のデータに基づいて利得を決定
し、これを利得制御回路17に送ることにより、振幅調
整回路19を通過する音声信号の利得の調整を行う。
【0053】この結果、音声出力装置18から再生され
た音声は、元の音声における無音部分の多い少ないに影
響されることなく、有音部分のみに基づいて常に最適な
利得制御を行うことができるようになる。
【0054】図9は、本発明による音声録音再生装置の
構成を示している。音声入力装置21から入力された音
声信号は、符号化手段22により必要に応じてデータ圧
縮されて符号化される。また、この音声信号は、平均値
計算手段23によって所定区間ごとの振幅の平均値を計
算され、利得決定(利得係数計算)手段24により利得
係数が計算される。このようにして計算された利得係数
は、符号化手段22によって符号化された所定区間ごと
のディジタルデータと共に半導体記憶装置25に記憶さ
れる。
【0055】この音声信号を再生する場合には、まず復
号化手段26がディジタルデータを半導体記憶装置25
から読み出し復号化する。また、利得制御手段27は、
所定区間のディジタルデータが復号化されるたびに、半
導体記憶装置25から利得係数を読み出し、この利得係
数に基づいて復号化された音声信号の利得を調整する。
【0056】この結果、本発明の音声記録再生装置によ
れば、従来と同様に音声信号の利得を調整して、例えば
音声出力装置28から出力することができる。しかも、
本発明の場合には、利得係数が所定区間にわたって一定
となるので、この区間内の音声の抑揚をある程度保存し
て再生することができる。さらに、この利得係数は、音
声の所定区間ごとに生成されるものであるため、音声信
号のディジタルデータに付加しても、データ量が大幅に
増加するようなこともない。また、利得制御手段27の
利得係数を強制的に固定すれば、元の音声の大きさや抑
揚をそのままにして再生することもできる。
【0057】図10は、留守番電話機能付き電話機に用
いられた本発明の音声録音再生装置の構成を示すブロッ
ク図である。音声入力装置(電話回線)10から入力さ
れた音声信号は、スイッチ11の接点11a及び接点1
1bによって二方の回路に切り替えて送られる。スイッ
チ11の接点11a側の回路は、スイッチ9の接点9a
を介して受話器18bに接続されている。また、スイッ
チ11の接点11b側の回路は、二分岐されて符号化回
路12と平均値計算回路13dの入力に接続されてい
る。
【0058】符号化回路12は、通常のPCM(pulse
code modulation)方式によって音声信号をディジタル
データに変換する回路でもよいが、一般には長時間記録
を可能にするために、ADPCM(adaptive different
ial PCM)方式等によって符号化データの圧縮を行う回
路を使用する。符号化回路12によって符号化されたデ
ィジタルデータは、半導体記憶装置15に順次記憶され
る。また、半導体記憶装置15に記憶されたディジタル
データは、復号化回路16によって順次読み出される。
復号化回路16は、符号化回路12によって符号化され
たディジタルデータを同じ方式の逆変換によって音声信
号に復号化する回路である。
【0059】平均値計算回路13dは、入力された音声
信号をサンプリングして所定サンプリング数の期間ごと
にその振幅の大きさの平均値を計算する回路である。な
お、この音声信号のサンプリングは、符号化回路12に
おけるサンプリングと共に一括して行うこともできる。
平均値計算回路13dが計算した平均値は、利得決定回
路14に送られる。利得決定回路14は、平均値計算回
路13dが計算した平均値と所定の基準振幅値とを比較
して、その比から利得係数を計算する回路である。そし
て、利得決定回路14によって計算された利得係数も、
半導体記憶装置15の他の領域に順次記憶される。ただ
し、この利得係数は、音声信号の複数のサンプリング期
間ごとに1データが生成されるだけので、符号化回路1
2から出力されるディジタルデータと比較しても僅かな
記憶容量を占有するにすぎない。半導体記憶装置15に
記憶された利得係数は、利得制御回路17によって読み
出される。利得制御回路17は、復号化回路16から出
力された音声信号に、この音声信号の所定期間ごとに読
み出した利得係数を乗ずることにより、再生する音声信
号の利得を調整する回路である。そして、利得制御回路
17の出力も、スイッチ9の接点9bを介して受話器1
8bに接続されている。
【0060】上記構成の音声記録再生装置の動作を説明
する。
【0061】通常の通話時には、スイッチ11が接点1
1a側に接続され、スイッチ9が接点9a側に接続され
る。従って、電話回線10からの音声信号は、そのまま
受話器18bに送られ、通常の通話を行うことができ
る。
【0062】また、留守番電話機能が働いている場合に
は、スイッチ11が接点11b側に接続される。従っ
て、電話回線10からの音声信号は、まず符号化回路1
2と平均値計算回路13dとに入力される。
【0063】符号化回路12に送られた音声信号は、A
DPCM方式等によってディジタル信号に符号化され、
半導体記憶装置15に順次記憶される。また、平均値計
算回路13dに送られた音声信号は、所定サンプリング
数の期間ごとにその振幅の大きさの平均値が計算され
る。そして、この平均値は、利得決定回路14に送られ
て所定の基準振幅値と比較され、その比から利得係数が
計算されると共に、この利得係数が半導体記憶装置15
の他の領域に順次記憶される。
【0064】上記のようにして留守中に記録された電話
のメッセージを再生する場合には、スイッチ11を接点
21b側に接続する。すると、復号化回路16が半導体
記憶装置15からディジタルデータを順次読み出しなが
らこれを音声信号に復号化する。また、この際、利得制
御回路17も、復号化された音声信号の所定期間ごとに
半導体記憶装置15の他の領域から利得係数を順次読み
出し、この利得係数を該当期間内の音声信号に乗ずるこ
とにより利得を調整する。従って、スイッチ22を介し
て受話器18に出力される音声信号は利得制御されたも
のとなる。ただし、この利得係数は、複数のサンプリン
グ期間について一定となるので、この期間内での音声の
抑揚はある程度保存される。
【0065】また、上記メッセージを利得制御をせずに
聞きたい場合には、利得制御回路17の利得係数を半導
体記憶装置15から読み出さずに固定して設定する。す
ると、復号化回路16で復号化された音声信号を元の音
声の大きさや抑揚を保持したままで再生することができ
るようになる。
【0066】なお、本実施例の平均値計算回路13dの
代わりに、図8に示されている度数分布作成回路13
a、有音部分抽出回路13b及び平均値計算回路13c
を用いてもよい。
【0067】
【発明の効果】このように、本発明の音声用利得制御装
置によれば、非線形変換回路により音声信号の振幅の発
生確率を平均化する非線形変換処理を行い、続いて平均
化された信号により利得制御に必要な振幅を求め、求め
られた振幅に対応した利得により音声信号の利得制御を
行う構成をとるので、ノイズやイントネーションの悪影
響を排除できる。従って、利得制御の信頼性を向上で
き、音声コーデックを備えた音声録音再生装置に応用す
る場合は、音質の向上を格段に図れる利点がある。ま
た、音声信号に無音部分が占める割り合いの多い少ない
に影響されることなく、有音部分のみに基づいて常に最
適な利得制御を行うことができるようになる。
【0068】更に、記録データの増加を最小限に留めな
がら、音声の大きさや抑揚を損なうことなく再生するこ
とができるようになる。
【図面の簡単な説明】
【図1】本発明の音声用利得制御装置が音声コーデック
を備えた音声記録再生装置に用いられたときのブロック
図を示している。
【図2】Digital Signal Processorの構成を示してい
る。
【図3】本発明の実施例に用いられる非線形変換回路の
変換動作の一部を示すフローチャートである。
【図4】実施例で行われる上記変換動作の残りを示すフ
ローチャートである。
【図5】実施例で行われる非線形変換の変換関係を示す
グラフである。
【図6】本発明の実施例に用いられる振幅計算回路の動
作を示すフローチャートである。
【図7】本発明による音声用利得制御装置の構成を示し
ている。
【図8】本発明の音声用利得制御装置を備えた音声記録
再生装置の構成を示す。
【図9】本発明による音声録音再生装置の構成を示して
いる。
【図10】留守番電話機能付き電話機に用いられた本発
明の音声録音再生装置の構成を示すブロック図である。
【符号の説明】
10 音声入力装置 20 音声コーデック装置 41 非線形変換回路 42 振幅計算回路 43 利得決定回路

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】音声入力装置から入力される音声信号の利
    得を自動的に制御する音声用利得制御装置において、 該音声信号の振幅の小さい信号の振幅を引き伸ばし、該
    振幅の小さい信号と振幅の大きい信号の発生確率を平均
    化する非線形変換回路と、 該非線形変換回路により平均化された音声信号に基づき
    利得制御用の振幅値を算出し、算出値により利得を決定
    する利得決定回路とを備え、決定された該利得により該
    音声信号の振幅を制御する音声用利得制御装置。
  2. 【請求項2】前記非線形変換回路および前記利得決定回
    路が乗算器、ROM、RAMおよび演算装置を備えたデ
    ジタルシグナルプロセッサで構成され、該非線形変換回
    路および前記利得決定回路の演算処理内容をソフトウェ
    ア的に行う請求項1に記載の音声用利得制御装置。
  3. 【請求項3】前記非線形変換回路のソフトウェア的演算
    処理を非線形量子化法の一手法であるμ則圧縮特性法に
    よって行う請求項2に記載の音声用利得制御装置。
  4. 【請求項4】前記利得決定回路のソフトウェア的演算処
    理を、前記非線形変換回路から前記利得決定回路に与え
    られる入力レベルと、予め設定された該入力レベルの最
    大値とを比較し、該入力レベルが該最大値よりも大きい
    場合に、該最大値を入力レベルとして採用し、該最大値
    に従って利得を決定するソフトウェア的処理手順で行う
    請求項2に記載の音声用利得制御装置。
  5. 【請求項5】前記デジタルシグナルプロセッサの乗算機
    能を用いて前記非線形変換回路からの入力信号をフィル
    タ処理した請求項2に記載の音声用利得制御装置。
  6. 【請求項6】音声信号を符号化して記憶装置に記録する
    音声記録再生装置において用いられる音声用利得制御装
    置であって、 音声信号の所定区間ごとにおける振幅の度数分布を作成
    する度数分布作成手段と、 該度数分布作成手段が作成した度数分布から有音部分の
    みを抽出する有音部分抽出手段と、 該有音部分抽出手段が抽出した有音部分の度数分布から
    その振幅の平均値を計算する平均値計算手段と、 該平均値計算手段が計算した平均値に基づいて利得を決
    定する利得決定手段とを備えている音声用利得制御装
    置。
  7. 【請求項7】音声信号を符号化して記憶装置に記録し、
    これを復号化して再生する音声記録再生装置であって、 音声信号を符号化して該記憶装置に記録する符号化手段
    と、 この音声信号の所定区間ごとの振幅の平均値を計算する
    平均値計算手段と、 該平均値計算手段が計算した平均値から利得係数を計算
    して該記憶装置に記録する利得係数計算手段と、 該記憶装置から符号化された信号を読み出し、復号化す
    る復号化手段と、 該復号化手段が復号化した音声信号について、該利得係
    数計算手段が計算した利得係数を該記憶装置から読み出
    し、該利得計数に基づいて利得の調整を行う利得制御手
    段とを備えている音声記録再生装置。
JP4110527A 1991-04-30 1992-04-28 音声用利得制御装置および音声記録再生装置 Expired - Fee Related JP2965788B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4110527A JP2965788B2 (ja) 1991-04-30 1992-04-28 音声用利得制御装置および音声記録再生装置

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP9854191 1991-04-30
JP11738491 1991-05-22
JP3-117384 1991-05-22
JP11877591 1991-05-23
JP3-118775 1991-05-23
JP3-98541 1991-05-23
JP4110527A JP2965788B2 (ja) 1991-04-30 1992-04-28 音声用利得制御装置および音声記録再生装置

Publications (2)

Publication Number Publication Date
JPH05204395A true JPH05204395A (ja) 1993-08-13
JP2965788B2 JP2965788B2 (ja) 1999-10-18

Family

ID=27468650

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4110527A Expired - Fee Related JP2965788B2 (ja) 1991-04-30 1992-04-28 音声用利得制御装置および音声記録再生装置

Country Status (1)

Country Link
JP (1) JP2965788B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0810722A2 (en) * 1996-05-28 1997-12-03 Nec Corporation Mobile telephone set with automatic level control means of sound signal
JP2005165021A (ja) * 2003-12-03 2005-06-23 Fujitsu Ltd 雑音低減装置、および低減方法
JP2006191316A (ja) * 2005-01-05 2006-07-20 Freescale Semiconductor Inc 音声信号処理装置
JP2020067531A (ja) * 2018-10-23 2020-04-30 株式会社コーエーテクモゲームス プログラム、情報処理方法、及び情報処理装置
CN113299310A (zh) * 2020-02-21 2021-08-24 阿里巴巴集团控股有限公司 声音信号处理方法、装置、电子设备及可读存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0810722A2 (en) * 1996-05-28 1997-12-03 Nec Corporation Mobile telephone set with automatic level control means of sound signal
EP0810722A3 (en) * 1996-05-28 1999-05-06 Nec Corporation Mobile telephone set with automatic level control means of sound signal
US6070088A (en) * 1996-05-28 2000-05-30 Nec Corporation Mobile telephone set with automatic sound level control
JP2005165021A (ja) * 2003-12-03 2005-06-23 Fujitsu Ltd 雑音低減装置、および低減方法
JP4520732B2 (ja) * 2003-12-03 2010-08-11 富士通株式会社 雑音低減装置、および低減方法
JP2006191316A (ja) * 2005-01-05 2006-07-20 Freescale Semiconductor Inc 音声信号処理装置
JP2020067531A (ja) * 2018-10-23 2020-04-30 株式会社コーエーテクモゲームス プログラム、情報処理方法、及び情報処理装置
CN113299310A (zh) * 2020-02-21 2021-08-24 阿里巴巴集团控股有限公司 声音信号处理方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
JP2965788B2 (ja) 1999-10-18

Similar Documents

Publication Publication Date Title
US5404315A (en) Automatic sound gain control device and a sound recording/reproducing device including arithmetic processor conducting a non-linear conversion
TW401671B (en) Silence compression for recorded voice messages
KR100477699B1 (ko) 양자화 잡음 분포 조절 방법 및 장치
JP2008504783A (ja) 音声信号のラウドネスを自動的に調整する方法及びシステム
US20020173865A1 (en) Digital audio signal processing
US20040128126A1 (en) Preprocessing of digital audio data for mobile audio codecs
EP1538602B1 (en) Wideband synthesis from a narrowband signal
JPH0644195B2 (ja) エネルギ正規化および無声フレーム抑制機能を有する音声分析合成システムおよびその方法
JP4657570B2 (ja) 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体
JP3784583B2 (ja) 音声蓄積装置
US7565283B2 (en) Method and system for controlling potentially harmful signals in a signal arranged to convey speech
US20070118362A1 (en) Audio compression/decompression device
JP2965788B2 (ja) 音声用利得制御装置および音声記録再生装置
JP2003280691A (ja) 音声処理方法および音声処理装置
JP3289512B2 (ja) 無声音検出による自動利得制御装置
JP2000349893A (ja) 音声再生方法および音声再生装置
JP4556866B2 (ja) 高能率符号化プログラム及び高能率符号化装置
JP2002149198A (ja) 音声符号化装置及び音声復号化装置
JPH08307277A (ja) 可変レート音声符号化方法及び装置
JP4530567B2 (ja) デジタルオーディオ復号装置
KR100592926B1 (ko) 이동통신 단말기용 디지털 오디오신호의 전처리 방법
JPH075900A (ja) 音声記録装置
JPH10124097A (ja) 音声記録再生装置
JP3510493B2 (ja) 音声信号の符号/復号方法及びそのプログラムを記録した記録媒体
US6853869B1 (en) Method and apparatus for generating surround-sound data

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990802

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070813

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080813

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080813

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090813

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees