JPS62274941A - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JPS62274941A
JPS62274941A JP61117416A JP11741686A JPS62274941A JP S62274941 A JPS62274941 A JP S62274941A JP 61117416 A JP61117416 A JP 61117416A JP 11741686 A JP11741686 A JP 11741686A JP S62274941 A JPS62274941 A JP S62274941A
Authority
JP
Japan
Prior art keywords
threshold
value
input
output
attenuator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61117416A
Other languages
English (en)
Other versions
JPH0748695B2 (ja
Inventor
Ryujiro Muramatsu
村松 隆二郎
Yoshinori Miyamoto
宮本 宜則
Kazuhiro Kondo
和弘 近藤
Toshiro Suzuki
鈴木 俊郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP61117416A priority Critical patent/JPH0748695B2/ja
Priority to CA000537601A priority patent/CA1326912C/en
Priority to US07/052,395 priority patent/US4918734A/en
Publication of JPS62274941A publication Critical patent/JPS62274941A/ja
Publication of JPH0748695B2 publication Critical patent/JPH0748695B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 〔産業上の利用分野〕 本発明は音声の高能率符号化に係り、特に、電話通信に
おいて音声信号を圧縮したディジタル情報として伝送し
受信側で音声を再生する音声符号化方式に関するもので
、音声休止区間における周囲雑音を処理することを図っ
たものである。
〔従来の技術〕
従来の装置は、特願昭60−137721号に記載のよ
うに、入力音声信号をフレーム(音声のパラメータを抽
出する時間間隔)毎に順次分析して伝送パラメータを算
出し再び合成する方式をとっていた。
しかし、周囲雑音のある環境下における音声の休止区間
の合成音については、配慮されていなかった。
〔発明が解決しようとする問題点〕
上記従来技術では、冷暖房装置のファン等が発生する雑
音が周囲雑音として存在している環境下での会話につい
ては配慮されておらず、これらの雑音が会話の休止期間
に入力されると、従来の音声分析合成方式では、これら
の雑音も人間が発する音声と同等に扱われることになり
、その結果、合成出力は入力とはかなり異なった音に聞
こえ、耳ざわすな感じを与えるという問題があった。
本発明の目的は、従来技術での上記した問題点を解決し
、周囲雑音存在下の音声入力に対し、音声入力区間につ
いては従来と同じ処理を実行して音声品質を確保する一
方、音声休止区間については雑音処理を実行させ、雑音
の合成出力が感覚的に奇異な感じを与えないよう自然音
に近づけることのできる音声符号化方式を提供すること
にある。
〔問題点を解決するための手段〕
上記目的は、音声信号のある一定時間間隔毎のパワーを
算出する手段と、該パワーを上記時間間隔単位に積分す
る手段と、該積分値を一定の割合で減衰した値を求める
手段と、前記時間間隔毎に求められた上記減衰値とその
直前の時間間隔での減衰値を一定の割合で減衰した値と
を比較して大きい値の方をしきい値として出力する手段
と、該しきい値と前記積分値との比較結果により音声の
有無を判定する手段とを備えた構成とすることにより、
達成される。
すなわち、本発明の前記した目的を達成するためには、
まず、音声入力区間と音声休止区間とを判別することが
必要である。そのために、音声のパワーあるいはエネル
ギーを求めて、あるしきい値との比較結果により上記区
間を判別する。その際、入力音声レベルの大小に拘らず
、区間の判定がほぼ一定に保たれることが必要であるた
め、上記しきい値は入力信号に応じて変化する可変しき
い値とする必要がある。
さらに、話者、送話器、回線が定まれば、その間の音声
入力区間毎のパワーは、はぼ一定と考えられるため、同
一話者が会話をする平均的な時間内では、上記しきい値
は、はぼ一定とするよう考慮する。次に、雑音のみ入力
した場合、白色雑音に近い雑音でも特定な周波数成分が
多いと分析時には、有声化されやすくなる。これらの音
が合成出力では奇異な感じを与えることになる。そこで
、雑音に対し、常時無声化すれば、感覚的に不快感は少
なくなることを考慮し、音声休止区間では、入力に拘ら
ず無声判定とすることにより、上記目的は達成される。
〔作用〕
最初、前記した可変しきい値は最小値に設定しておく。
次に、音声が入力されると音声のパワーが大きくなるた
め、それに伴って可変しきい値も増大する。しかし、音
声入力中は、音声パワーがしきい値を上まわるために、
音声入力区間と判定=4− される。音声が途切れると、音声パワーは急速に減少す
る。ここで、しきい値を、音声パワーが減少方向である
時は徐々に減少するようにしておけば、音声パワーがし
きい値を下まわったことを検出することで音声休止区間
に入ったと判定され、この音声休止区間に入力される雑
音がしきい値以下であれば、これらの雑音はすべて無声
化され、奇異な合成音とはならない。
次に再び音声が入力して音声パワーが可変しきい値を上
まわると、音声入力区間に入ったことが判定され1通常
の分析合成処理が行なわれる。そしてこの入力音声によ
り、しきい値が新たな値に設定される。会話が終了する
と、しきい値は徐々に減少し、やがて元の最小値に落ち
着く。
〔実施例〕
以下、本発明の一実施例を第1図に示すブロック構成図
により説明する。第1図は符号器のみを示し、音声を合
成する復号器は前記した特願昭60−137721号に
記載の合成部と同一であるため省略している。入力され
た音声信号1は音声分析器2で分析される一方パワー演
算器3にも入力され、ここで音声のパラメータを抽出す
る一定時間間隔(以下、フレームという)毎に音声パワ
ーが演算される。フレーム毎に出力される音声パワーは
漏洩積分器4で積分され、減衰器5で一定レベル減衰さ
れる。実施例では減衰器5は、漏洩積分器4から出力さ
れるディジタル値に一定値、例えば1/2、を乗算する
掛算器であり、入力レベルをその1/2のレベルに減衰
している。6は可変しきい値を出力する比較選択器であ
る。7は選択器6の出力を入力に受けて1フレームだけ
遅延させて出力する、バッファメモリで構成される、]
フレーム遅延器であり、8はこの1フレーム遅延器7の
出力を入力に受けて、入力レベルを一定レベル減衰させ
て出力する減衰器である。減衰器8におけるレベル減衰
率は減衰器5におけるそれとは異なるように設定され、
実施例では入力レベルを9710に減衰させて出力する
ように設定される。減衰器5の出力と減衰器8の出力と
が選択器6に入力される。選択器6には、さらに大小比
較器9の出力も入力される。大小比較器9では減衰器5
の出力と1フレーム遅延器7の出力とが比較され、この
比較結果により選択器6を制御し、減衰器5の出力の方
が大きい場合には減衰器5の出力が、また1フレーム遅
延器7の出力の方が減衰器5の出力より大きい場合には
減衰器8の出力が、しきい値として選択器6より出力さ
れる。選択器6より出力されるしきい値と、漏洩積分器
4より出力される積分値との大小比較を判別器10にお
いて行ない、積分値がしきい値より大なる場合は音声入
力区間と判定し、小なる場合は音声休止区間と判定する
この判定結果は有声無声処理器11に入力され、音声入
力区間の場合は従来技術と同じ処理を行い、音声休止区
間の場合は入力信号に拘らず無声として処理されて符号
器出力12となる。
次に本実施例における各部信号の時間変化例を第2図、
第3図により説明する。第2図は入力される音声信号を
表わし、第3図は各部信号のレベル値を示している。し
きい値は音声入力前は設定された最小値にあり、音声入
力により漏洩積分値が増大すると減衰器5の出力(破線
曲線)の方がしきい値より大となり、しきい値としては
減衰器5の出力が選択されて比較選択器6の出力となる
漏洩積分値がしきい値より大きくなったことで音声入力
区間に入ったと判定される。漏洩積分値がピークより下
がると比較選択器6からは、前回フレームのしきい値を
一定の割合で、実施例では9/10のレベルに、減少さ
せた値がしきい値として出力される。そして、このしき
い値と漏洩積分値とが判定器10で比較され、判定され
る。漏洩積分値が低下してしきい値に達する時点までは
音声入力区間と判定され、漏洩積分値がしきい値を下ま
わり次にしきい値を上まわるまでの区間は音声休止区間
となり、この区間内にある小レベルの雑音は第1図の有
声無声処理器11において無声として処理される。
以上、本実施例によれば、音声入力区間では従来技術と
同等の通常処理が実行され、音声休止区間では、小レベ
ル雑音はすべて無声として処理されるので周囲雑音が奇
異な合成音となって出力されることばなく、従来技術で
の問題点が解決される。
〔発明の効果〕
以上説明したように、本発明によれば、周囲雑音存在下
での会話に際し、音声入力区間においては従来技術にお
ける音声品質を確保し、音声休止区間においては従来技
術において奇異な感じを与えていた合成音を耳ざわりの
ないものとすることができる効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック構成図、第2図は
実施例における入力音声信号の一例を示す図、第3図は
第1図中の各部信号の時間変化を示す図である。 〈符号の説明〉 1・・・音声信号人力  2・・・音声分析器3・・・
パワー演算器  4・・・漏洩積分器5.8・・・減衰
器   6・・・比較選択器7・・・1フレーム遅延器 9・・・大小比較器   10・・・判定器11・・・
有声無声処理器 12・・符号器出力第1図 1−音声信号人力 2・−音声分析器 3−・−パワー演算器 4−濡洩積分器 5.8−・減衰器 6・・−比較選択器 7−1フレ一ム週14器 9−大小辻較器 1〇−判定器 11−2−有声無声処理器 12−符号器出力

Claims (1)

  1. 【特許請求の範囲】 1、音声信号をディジタル符号に符号化し、該ディジタ
    ル符号を復号して音声信号を再生する音声符号化方式に
    おいて、音声信号の一定時間間隔毎のパワーを算出する
    手段と、該パワーを上記一定時間間隔単位に積分する手
    段と、該積分値を一定の割合で減衰した値を求める第1
    の減衰器と、この減衰値を一方の入力としてしきい値を
    選択出力するしきい値選択器と、この出力しきい値を前
    記一定時間間隔だけ遅らせて出力する遅延器と、この遅
    延器出力を前記とは異なる一定の割合で減衰した値を求
    めて上記しきい値選択器に他方の入力として与える第2
    の減衰器と、上記第1の減衰器出力と上記遅延器出力と
    の大小比較により上記しきい値選択器を制御してその2
    入力中の大きい値の方をしきい値として出力させる手段
    と、該しきい値と前記積分値との比較結果により音声の
    有無を判定する手段とを備えたことを特徴とする音声符
    号化方式。 2、前記一定時間間隔は、入力音声信号のパラメータを
    フレーム毎に抽出して有声、無声の判定を行って音声を
    分析合成する音声分析合成器のフレームであり、前記判
    定手段は、前記しきい値と前記積分値との比較結果に基
    づき音声が無いと判定されたフレームにおいては入力信
    号にかかわらず無声と判定することを特徴とする特許請
    求の範囲第1項記載の音声符号化方式。
JP61117416A 1986-05-23 1986-05-23 音声符号化方式 Expired - Lifetime JPH0748695B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP61117416A JPH0748695B2 (ja) 1986-05-23 1986-05-23 音声符号化方式
CA000537601A CA1326912C (en) 1986-05-23 1987-05-21 Speech coding system
US07/052,395 US4918734A (en) 1986-05-23 1987-05-21 Speech coding system using variable threshold values for noise reduction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61117416A JPH0748695B2 (ja) 1986-05-23 1986-05-23 音声符号化方式

Publications (2)

Publication Number Publication Date
JPS62274941A true JPS62274941A (ja) 1987-11-28
JPH0748695B2 JPH0748695B2 (ja) 1995-05-24

Family

ID=14711102

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61117416A Expired - Lifetime JPH0748695B2 (ja) 1986-05-23 1986-05-23 音声符号化方式

Country Status (3)

Country Link
US (1) US4918734A (ja)
JP (1) JPH0748695B2 (ja)
CA (1) CA1326912C (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2573352B2 (ja) * 1989-04-10 1997-01-22 富士通株式会社 音声検出装置
US5036540A (en) * 1989-09-28 1991-07-30 Motorola, Inc. Speech operated noise attenuation device
JPH03132228A (ja) * 1989-10-18 1991-06-05 Victor Co Of Japan Ltd 直交変換信号符号化復号化方式
JPH03132700A (ja) * 1989-10-18 1991-06-06 Victor Co Of Japan Ltd 音声の適応直交変換符号化方法
US6411928B2 (en) * 1990-02-09 2002-06-25 Sanyo Electric Apparatus and method for recognizing voice with reduced sensitivity to ambient noise
DE69127134T2 (de) * 1990-05-28 1998-02-26 Matsushita Electric Ind Co Ltd Sprachkodierer
US5134658A (en) * 1990-09-27 1992-07-28 Advanced Micro Devices, Inc. Apparatus for discriminating information signals from noise signals in a communication signal
CA2483322C (en) * 1991-06-11 2008-09-23 Qualcomm Incorporated Error masking in a variable rate vocoder
CA2110090C (en) * 1992-11-27 1998-09-15 Toshihiro Hayata Voice encoder
IN184794B (ja) * 1993-09-14 2000-09-30 British Telecomm
JPH07193548A (ja) * 1993-12-25 1995-07-28 Sony Corp 雑音低減処理方法
JP2586827B2 (ja) * 1994-07-20 1997-03-05 日本電気株式会社 受信装置
JP2728122B2 (ja) * 1995-05-23 1998-03-18 日本電気株式会社 無音圧縮音声符号化復号化装置
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
US6115589A (en) * 1997-04-29 2000-09-05 Motorola, Inc. Speech-operated noise attenuation device (SONAD) control system method and apparatus
US5970441A (en) * 1997-08-25 1999-10-19 Telefonaktiebolaget Lm Ericsson Detection of periodicity information from an audio signal
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6282430B1 (en) * 1999-01-01 2001-08-28 Motorola, Inc. Method for obtaining control information during a communication session in a radio communication system
US6321194B1 (en) 1999-04-27 2001-11-20 Brooktrout Technology, Inc. Voice detection in audio signals
US6509773B2 (en) * 2000-04-28 2003-01-21 Broadcom Corporation Phase interpolator device and method

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4219695A (en) * 1975-07-07 1980-08-26 International Communication Sciences Noise estimation system for use in speech analysis
US4301329A (en) * 1978-01-09 1981-11-17 Nippon Electric Co., Ltd. Speech analysis and synthesis apparatus
US4351983A (en) * 1979-03-05 1982-09-28 International Business Machines Corp. Speech detector with variable threshold
FR2466825A1 (fr) * 1979-09-28 1981-04-10 Thomson Csf Dispositif de detection de signaux vocaux et systeme d'alternat comportant un tel dispositif
US4449190A (en) * 1982-01-27 1984-05-15 Bell Telephone Laboratories, Incorporated Silence editing speech processor
DE3243231A1 (de) * 1982-11-23 1984-05-24 Philips Kommunikations Industrie AG, 8500 Nürnberg Verfahren zur erkennung von sprachpausen

Also Published As

Publication number Publication date
US4918734A (en) 1990-04-17
CA1326912C (en) 1994-02-08
JPH0748695B2 (ja) 1995-05-24

Similar Documents

Publication Publication Date Title
JPS62274941A (ja) 音声符号化方式
EP0661689B1 (en) Noise reducing method, noise reducing apparatus and telephone set
CA2428888C (en) Method and system for comfort noise generation in speech communication
RU2146394C1 (ru) Способ и устройство вокодирования переменной скорости при пониженной скорости кодирования
US8756054B2 (en) Method for trained discrimination and attenuation of echoes of a digital signal in a decoder and corresponding device
JP4579273B2 (ja) ステレオ音響信号の処理方法と装置
KR100302370B1 (ko) 음성구간검출방법과시스템및그음성구간검출방법과시스템을이용한음성속도변환방법과시스템
US5867815A (en) Method and device for controlling the levels of voiced speech, unvoiced speech, and noise for transmission and reproduction
JP2002237785A (ja) 人間の聴覚補償によりsidフレームを検出する方法
WO2000046789A1 (fr) Detecteur de la presence d'un son et procede de detection de la presence et/ou de l'absence d'un son
WO2006077626A1 (ja) 話速変換方法及び話速変換装置
US20040128126A1 (en) Preprocessing of digital audio data for mobile audio codecs
JPH07123235B2 (ja) エコ−サプレツサ
US6424942B1 (en) Methods and arrangements in a telecommunications system
EP2743923B1 (en) Voice processing device, voice processing method
JP2004513381A (ja) 音声符号化パラメータを決定する方法及び装置
JPH11265200A (ja) 符号化音声再生装置および符号化音声再生方法
KR100216018B1 (ko) 배경음을 엔코딩 및 디코딩하는 방법 및 장치
JPH08314497A (ja) 無音圧縮音声符号化復号化装置
JP2900987B2 (ja) 無音圧縮音声符号化復号化装置
JP3603470B2 (ja) 音声品質改善装置
JP3593183B2 (ja) 音声復号装置
US6134519A (en) Voice encoder for generating natural background noise
JP3580906B2 (ja) 音声復号装置
JPH0832526A (ja) 音声検出器