JPS6223096A - 音声区間検出装置 - Google Patents

音声区間検出装置

Info

Publication number
JPS6223096A
JPS6223096A JP60161781A JP16178185A JPS6223096A JP S6223096 A JPS6223096 A JP S6223096A JP 60161781 A JP60161781 A JP 60161781A JP 16178185 A JP16178185 A JP 16178185A JP S6223096 A JPS6223096 A JP S6223096A
Authority
JP
Japan
Prior art keywords
noise
section
voice
learning
noise level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60161781A
Other languages
English (en)
Other versions
JP2521425B2 (ja
Inventor
金指 久則
秋場 国夫
入間野 孝雄
猛 宮川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60161781A priority Critical patent/JP2521425B2/ja
Publication of JPS6223096A publication Critical patent/JPS6223096A/ja
Application granted granted Critical
Publication of JP2521425B2 publication Critical patent/JP2521425B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声認識装置における音声区間検出方法に関す
るものである。
(従来の技術) 第2図は、従来の音声認識装置における、騒音学習方法
の一例を実行するための機能ブロック図である。
従来例を第2図、第3図により説明する。
第2図において、10はマイクであり、ここから音声ま
たは騒音を入力し、前処理部11で前処理を行い、パワ
ー算出部12でパワーを算出する。13は音声認識モー
ドa、または騒音学習モードbの切り換えを行う切り換
えスイッチである。14は騒音学習部、15は音声区間
検出部であり、騒音学習モードにおいて音声区間検出の
ためのいき値を設定し、音声区間検出部で音声区間を検
出する。検出した音声区間内の音声を音声認識部16に
おいて認識する。17は認識結果出力部である。
次に、上記従来例の動作について説明する。最初に、音
声認識モードに入る前に切り換えスイッチ13て騒音学
習モードを選択し、騒音の学習を行う。第2図において
マイク10から人力した騒音は、前処理部Hにおいて、
A/D変換され、異名現象をとり除くためLPFを通り
、サンプル値Xを得る。次にパワー算出部12において
、(1)式に従い、単位時間(以後フレームと称する)
ごとにパワーP(J)を算出する。
P(J):Jフレーム目のパワーの値 x(i):1フレーム内における1番目のサンプル値 N :1フレーム内のサンプル数 騒音学習部14では、P(J)をもとに(2)式に従っ
て音声区間のいき値TPを設定する訳であるが、ここで
Lは騒音学習に要する時間であり、認識装置の仕様によ
り任意に設定するパラメータである。
なおTP’の値は学習時間における環境騒音の平均パワ
ーである。
TP= TP’+ A = Σ P (J)/ L   + A  ・・・(2
)J=1 TP:音声区間検出のためのいき値 P(J):Jフレーム目のパワーの値 L  :騒音学習時間 A  :定数 次に切り換えスイッチ13て認識モードを選択し、音声
認識を行う。
第2図において、入力した音声は、騒音学習モードと同
じ条件で前処理を行い、パワーを算出する。得られたパ
ワーの時系列をもとに、騒音学習モードで得られたいき
値TPを用いて音声区間の検出を行う。第3図は、/a
kita/(秋田)と発声したときのP(j)の時系列
を示したものである。
第2図において、いき値TPを使って、パワーの大きい
山形の部分Sl、S2.S3および山形の部分に挟まれ
た谷形の部分Pl、P21 P3を検出し、各々に対応
する時間SL+32+ S3およびpl+ ’I’2+
 p3の値を使って(3)式に示す条件との整合を検定
し音声区間、音声の始端S、終端Eを検出する。
第4図は、第3図とは異なる騒音下で学習し、/aki
ta/(秋田)と発声した場合のいき値TPの設定から
音声区間検出までのようすを表している。いき値設定に
要する時間り内において衝撃的な騒音が入り、音声を発
声している時と比ベレベルが大きくなっている。このた
め、いき値TPは第3図に示す例に比べて大きく設定さ
れるため、音声区間検出を誤り、本来の/akita/
の部分の語頭の/a/が脱落し、/k i t a/ど
なっている。 従って、従来の方法では第4図の場合の
ように、騒音学習時の、騒音レベルと音声発声時の騒音
レベルが著しく異なる場合音声区間検出を誤る欠点があ
った。
(発明が解決しようとする問題点) 上記従来例の音声区間検出方法では、いき値設定の学習
に要する時間内で衝撃的な騒音等により、音声を発声し
ている時の騒音レベルに比べ、学習時の騒音レベルが過
大に評価され、いき値設定を誤り、ひいては音声認識を
誤る問題があった。
本発明はこのような従来の問題を解決するものであり、
音声区間を精度よく検出できる音声区間検出方法を提供
することを目的とするものである。
く問題を解決するための手段) 本発明は、上記目的を達成するために、騒音学習を行う
際、学習時間にとり込む全てのフレームの騒音データか
らいき値を設定するのではなく、予め設定した範囲にあ
る騒音データのみを用いていき値を設定するようにした
ものである。
(作用) 従って本発明によれば、学習用の騒音データを選択的に
取り扱うことにより、騒音学習時の衝撃騒音によるいき
値設定誤りを減少することができ、音声区間を精度よく
検出することができ、その結果、音声認識誤りを減少す
ることができる。
(実施例) 以下に、本発明の一実施例の構成について第1図ととも
に説明する。
第1図においてマイク1、前処理部2およびパワー算出
部3、騒音学習部6、音声区間検出部7、音声認識部8
.認識結果出力部9は、従来例と同様のものである。5
は騒音データ選択部である。
次に本発明の実施例の動作について説明する。
先ずモード切り換えスイッチ4は、騒音学習モードにし
ておく。マイク1から入力した騒音は前処理部2てA/
D変換されLPFを通ってパワー算出部3に入り、従来
例と同様に(1)式に従いフレームのパワーを算出する
。騒音データ選択部5では、音声区間検出のためのいき
値設定に用いる騒音データの選択を行う。これは、騒音
学習時に人力した騒音レベルが予め設定した範囲に入っ
ている騒音データだけをいき値設定用のデータとして使
用するものである。
この範囲は、以下のように決定する。
第3図において音声区間の後端Eの後のρ3の部分は、
音声区間を決定する、つまりEを決定する前までは分析
する訳であるから、p3の区間のフレームごとのパワー
は算出されている。従来法ではp3の区間のデータは、
音声区間が決定すれば捨ててしまっていたが、本発明で
は(4)式に従いこの区間のフレーム毎のパワーの平均
値Nεと分散σεを求め騒音データ選択部5に送る。騒
音データ選択部5では音声区間検出のいき値設定の際に
用いた騒音レベルの平均値Npおよび分散 σP2と、NEおよびσε2から式(5)に従って新し
くNとσ2を計算する。
このNとσ2を使って入力した騒音レベルがN±σの範
囲に入っている騒音データだけをいき値設定のための騒
音データとして使用するものである。
Np、σP2の初期値は(6)式に従ってもとめる。
N±σの範囲にある騒音データを使って音声区間検出の
ためのいき値TPxを従来例同様の考え方で式(7)に
従って設定し、このいき値TPXを用いて音声区間を検
出する。
P(I):学習時間り内にあるN±σの範囲にある第一
番目の騒音パワーの値 M  :学習時間り内にあるN±σの範囲にある騒音デ
ータのサンプル数 B  :定数 TPXを用いて音声区間を検出した場合を第4図に示す
。この図において始端はS×、後端はEとなり、従来例
とは異なり/akita/の語頭の/a/の脱落がなく
なり、きちんと音声区間を検出できることがわかる。
以上の通り本実施例によれば、騒音学習に衝撃的な騒音
が入っても騒音レベルが予め設定した範囲になければ学
習用のデータとして用いないため、音声区間検出のいき
値設定を誤ることがない。従って、精度よく音声区間を
検出できるという利点を有する。
(発明の効果) 本発明は以上の説明から明らかなように、騒音学習を行
う際、学習時間に取り込む全てのフレームの騒音データ
からいき値を設定するのではなく、予め設定した範囲に
ある騒音データのみを用いて、いき値を設定しているの
で、音声区間検出のためのいき値設定誤りを減少させ精
度よく音声区間を検出できる利点を有する。更に、音声
区間を精度よく検出できるため、音声認識率を向上させ
る効果を有する。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装置の概略
ブロック図である。 第2図は、従来例における音声認識装置の概略ブロック
図である。 第3図は、ある騒音レベルで/akita/と発声した
場合の騒音のパワーと音声パワーの時間変化を表したも
のである。 第4図は、第3図とは異なる環境で/akita/と発
声した場合の騒音パワーと音声パワーの時間変化を表し
たものである。 l・・・マイク、2・・・前処理部、3・・・パワー検
出部、4・・・切り換えスイッチ、5・・・騒音データ
還択部、6・・・騒音学習部、7・・・音声区間検出部
、8・・・音声認識部、9・・・認識結果出力部。 特許出願人  松下電器産業株式会社 八玉 Q 礒λ °(〉−

Claims (2)

    【特許請求の範囲】
  1. (1)騒音レベルを学習し、適応的に音声区間検出のい
    き値を設定し、音声区間を検出する方法において、その
    騒音レベルの平均値と変動の大きさをもとに、予め騒音
    レベルの範囲を限定し、騒音学習時に、その範囲内にあ
    る騒音レベルのデータだけを音声区間検出のいき値設定
    用のデータとして用いる音声区間検出方法。
  2. (2)予め設定する騒音レベルの範囲を決定する方法と
    して、音声区間検出後の後端以後の部分を範囲決定のた
    めの入力データとすることを特徴とする特許請求の範囲
    第(1)項記載の音声区間検出方法。
JP60161781A 1985-07-24 1985-07-24 音声区間検出装置 Expired - Lifetime JP2521425B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60161781A JP2521425B2 (ja) 1985-07-24 1985-07-24 音声区間検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60161781A JP2521425B2 (ja) 1985-07-24 1985-07-24 音声区間検出装置

Publications (2)

Publication Number Publication Date
JPS6223096A true JPS6223096A (ja) 1987-01-31
JP2521425B2 JP2521425B2 (ja) 1996-08-07

Family

ID=15741783

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60161781A Expired - Lifetime JP2521425B2 (ja) 1985-07-24 1985-07-24 音声区間検出装置

Country Status (1)

Country Link
JP (1) JP2521425B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57144597A (en) * 1981-03-04 1982-09-07 Fujitsu Ltd Voice signal processor
JPS5876899A (ja) * 1981-10-31 1983-05-10 株式会社東芝 音声区間検出装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57144597A (en) * 1981-03-04 1982-09-07 Fujitsu Ltd Voice signal processor
JPS5876899A (ja) * 1981-10-31 1983-05-10 株式会社東芝 音声区間検出装置

Also Published As

Publication number Publication date
JP2521425B2 (ja) 1996-08-07

Similar Documents

Publication Publication Date Title
JPS6223096A (ja) 音声区間検出装置
JP2656069B2 (ja) 音声検出装置
JP2589468B2 (ja) 音声認識装置
KR100273395B1 (ko) 음성인식시스템의음성구간검출방법
JPS6147437B2 (ja)
JPS6338993A (ja) 音声区間検出装置
JPH0754434B2 (ja) 音声認識装置
JP2608702B2 (ja) 音声認識における音声区間検出方法
KR0128669B1 (ko) 음성 신호의 실시간 음성부 검출 방법
JP2737109B2 (ja) 音声区間検出方式
JPS61223796A (ja) 音声区間検出回路
JP3063856B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
JPS61292199A (ja) 音声認識装置
JPH0469957B2 (ja)
JPS61140999A (ja) 音声区間検出方式
JPH01200293A (ja) 音声認識方式
JPS61292198A (ja) 音声認識装置
JP2901976B2 (ja) パターン照合予備選択方式
JPS63259596A (ja) 音声区間検出方式
JP2643202B2 (ja) 入力音声の定常部、過渡部、不確定部の検出装置
JPH05241596A (ja) 音声の基本周波数抽出システム
JPH0310560Y2 (ja)
JPS61269197A (ja) 音声区間検出方式
JPS63155196A (ja) 無声音検出方法
JPH04251299A (ja) 音声区間検出方法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term