JPH039400A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH039400A
JPH039400A JP1142965A JP14296589A JPH039400A JP H039400 A JPH039400 A JP H039400A JP 1142965 A JP1142965 A JP 1142965A JP 14296589 A JP14296589 A JP 14296589A JP H039400 A JPH039400 A JP H039400A
Authority
JP
Japan
Prior art keywords
voice
noise
speech
storage means
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1142965A
Other languages
English (en)
Inventor
Atsushi Shinpo
敦 新保
Yukio Suzuki
幸夫 鈴木
Hiromi Ando
安藤 博美
Hideki Kamoi
鴨井 秀樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1142965A priority Critical patent/JPH039400A/ja
Publication of JPH039400A publication Critical patent/JPH039400A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は音声認識装置、特に高雑音環境下における音
声認識に関する。
[従来の技術] 通常、音声認識は話者により発生された音声を分析し、
予め登録しておいた標準パターン(辞書とも呼ぶ)との
類似性を算出し、最も類似している標準パターンを認識
結里として出力する。
第2図は古井著[ディジタル音声処理」(1985年9
J125日)東海犬q出阪会、P 160−181に開
示されている、単語単位の音声入力を仮定した際の音声
認識装置のブロック図である。図において、(201)
は入力端、(202)は音声分析手段であり、入力端(
20+、’)を介して入力された音声に必要な処理を施
し、認識にa効な特徴パラメータに変換する。
(203)は単語の標準パターンが格納されているメモ
リであり、認識させたい単語の特徴パラメー夕が音り分
析手段(202)によりp?I)求められて格納されて
いる。(204)は単語認識手段であり、4忠対象とな
る音声が音声分析手段(202)により同様に処理17
て導出された特徴パラメータとメモリ(203)に格・
納されでいる単語の標準パターンの全てとの類似性を計
算し、最も類似度の高い(似ている)パターンを認識結
果と12で出力端(205)に出力する。
第3図は第2図の一高声認識装置の動作を示すフV1−
チャー1・である。&声認識が開始すると(S301)
、マイクロフォン(図示せず)等を介して入力端(20
1)に音声を入力する(S302)。音声分析手段(2
02)は音声人力を分析1.5だ後特徴パラメータを導
出する。そして、単語認識手段(203)は音声分析手
段(202)からの特徴パラメータとメモリ(203)
に格納されている単語標準パターンの全てとの類似性を
計算18.て、最も類似度の高いパターンを認識結果と
して求め(S3(13)、出力端(205)に出力L 
(S304)、処理を終了する(S305)。
通常、音声分析1段(202)及び単語認識手段(20
4)はディジタル信号処理プロセッサ(DSP)等を用
いて実現されているため、入力端(201)に入力され
る音声入力は、マイクロフォンから人力される音声信号
を増幅j2、適当なフィルタ処理をしだ後1: A /
 D変換されたディジタルデータとなっている。また、
認コ結果は適当な符号に符号化し、出力端(205)を
介して被制御機器の制御部へ出力する。例えば、音声タ
イプライタ−であれば、タイプライタ−の^、ソドを制
御する回路へ出力【、音声ダイヤルであれば、ダイヤル
パルス又はブツシュボタントーンを発生する回路へ出力
する。
また、場合によっては、並行してディスブ(ノイや音声
合成装置等を用いて話者に対1.てエコーバックするこ
ともある。
[発明が解決12ようとする課題〕 し、かり、ながら、」1記の音声認識装置では背景雑音
が大きい環境下、例えば高速走行時の自動車内等では、
話者が発声する音声と同等、或いは、それ以上の背景雑
音がある場合があり(すなわぢS/間が負となる場合)
、音声の分析・認識が正確に実行できないという問題点
がある。
また、このような高雑音環境Fにおい′C1人間は自然
に大きな声で発声1.ようとする傾向がある。
大きな声で発声1.た場合、S / N比は改善される
が、反面、音声の特徴パラメータが通常の特徴パラメー
タと異なることが多く、やはり、正確な認4基が実行で
きないという問題点がある。
この発明は、従来の高雑音環境下での認識率の低下とい
う問題点を解決し、低雑音環境下とρ1雑音環境下の両
方において良好な認識率が得られる音声認識装置を提供
することを目的とする。
[課題を解決するための手段] この発明に係る音声合成装置は、通常の音声の特徴パラ
メータが格納された第1の記憶手段と、大きな音声の特
徴パラメータが格納された第2の記憶手段と、背景雑音
を測定・判定し、その大小を検出する雑音検出手段と、
雑δlノベル検出手段の出力に従って話者に対17て通
常のμjでの音声入力か、又は大きな声での音声入力か
を指示する音声合成手段とを有する。
更に、この発明に係る音声認識装置は、音声入力を分析
してその特徴パラメータを求める音声分析−1段と、雑
音検出手段の出力に従って第1の記憶手段又は第2の記
憶手段の特徴パラメータと3、音声分析手段で求められ
た特徴パラメータとを比較して入力音声を認識する音声
認識手段とを有する。
[作 用1 この発明においては、背景雑音をah定・判定してその
大小を検出し、その大小に応じて話者に対して通常の声
での音声入力か、又は大きな声での音声人力かを指示1
1、そして、話者の音声入力を認識する際に、第1の記
憶手段又は第2の記憶手段を選択に利用する。例えば雑
音が小さいと判断された場合には、第1の記憶手段に記
憶された特徴パラメータを利用1.て入力音声を認識す
る。また、雑音が大きいと判断された場合には、第2の
記憶手段に記憶された特徴パラメータを利用L ”[人
力音声を認識する。
〔実施例〕
第1図はこの発明の一実施例V係る音声認識装置の構成
を示すブロック図である。図において、(101)はマ
イクロフォン、(102)は前処理手段であり、ここで
はマイクロフォン(toi)に入力された音声入力を増
幅し、適当なフィルタ処理をした後にA/D変換り、て
ディジツノ1データの形式で後続するデジタル回路に出
力する。>(104)は音μ(分析手段であり、マ・イ
クロフA−ン(101)及び前処理手段(102)を介
j7て入力された音声に適当な分析処理を施して認識に
必要な特徴パラメータに変換する。
(105)は通常の大きさで発生(2,た音声の特徴パ
ラメータの標準パターンが格納されたメモリで、(IO
G)は大きな声で発生した音声の特徴パラメータのバラ
・−ンが格納されたメモリであり、これらツメ% ’J
 (105) 、 (10G) l;t:辞書トL テ
i7)機能をHする。メモリ(105) 、(,10B
)に対する特徴パラメータの格納は、音声分析手段(1
04)の出力が制御線(107)を介してそれぞれ行わ
わ、るウメモリ(105)に格納する際には比較的静か
な環境下において通常の大きさの音声δの特徴パラメー
タを登録する。メモリ(10B)に格納する際には、大
きな声で発声(7た音声の特徴パラメータを登録するが
、この時、静かな環境下での大きな声が不自然となる場
合が想定される。このような場合には、適当な雑音源を
用いて疑似的に雑音を作り出17、大きな声を発声して
登録する。
(108)は雑音検出手段であり、マイクロッ寸゛/(
101)に入力される雑音の1ノベルを検出し、ぞiが
所定の大きさ以ドであるかどうかによって、雑音が小さ
い又は大きいとする信号を出力する。009)は切り替
えスイッチであり、雑音検出手段(108)の出力によ
って切り替えられる。雑音検出手段(10B)の出力が
雑音が小6与いどする出力である場合には、端子010
)と(Ill)とが接続される。7また、雑音検出手段
(ios)の出力が雑音が大きいとする出力である場合
には、端子(1i0)と(112>とが接続される。
(113)は音声合成手段であり、音声分析手段(10
4)からの特徴パラメータと、メモリ(105)又は(
10G)の特徴パラメータの全てとの類似性を、:[算
し、最も類似度の高い(似ている)特徴バラメークを認
識結果として出力端(114)に出力する(115)は
音声合成手段であり、雑音検出手段(108)及び音声
認識手段(113)からの指令に従って音声を合成(2
、スピーカ(110)を介して出力する。
第4図は第1図の音声認識装置の動作を示すフローチャ
ートである。音声、22が開始すると(S4f11)、
始めに背景雑音(あるいは環境雑音)を入力マイクロフ
ォン(l口l)を介(、て入力する(8402)。
人力された雑音は雑音検出1段(■8)でその雑音の大
きさが用足され、定められた閾値より大きく雑音が大き
いと判断された場合には切り替えスイッ+ (10G)
 (7)端F (110)と(112)とを接続し、後
述する処理(S407)〜(S409)がなされろ。ま
た、雑音のレベルが定められた閾値より小さく雑音が小
さいと判断された場合には切り替えスイッチく109)
の端子(110)とcill)とを接続し、後述する処
理(S404) = (8406)を実行するようにす
る(S403)、。
まず、雑音検出手段(105)により目が小さいとi′
!1断さ1+、た場合には、切り替えスイッチ(109
)の端子(110)と(lit)とを接続すると共に、
音声合成手段(115)に指示をljλて、スピーカ(
116)を作動させて話者に対1.て「お話1.下さい
」と音声人力を指示する(S404)。指示に従って発
声された音声は、マイクロフォン(101)を介(7て
前処理手段(102)に入力し、前処理手段(102)
 ζ1.!増幅され、更にノイズが除去された後、A/
D変換されてディジタル信号に変換される。音声分析手
段(104)はディジタル信号に変換された入力音声を
分析して特徴パラメータを導出する(S405)c。
次に、音声認識手段<113>は、音声分析手段(10
4)により勺折された特徴パラメータと、メモリ(10
5)に格納されている標申の特徴パラメータの全てとの
類似性を計算して、最も類似度の高いパターンを認識結
果として求め(S4DJ、出力端(114)に出力L(
S4i1)、処理を終了する(S412)。
次に、雑音検出手段(105)により雑音が大きいと判
断された場合には、切り替えスイッチ(109)の端子
(1i0)と(112>とを接続すると共に、音声合成
手段(115)に指示を与えて、スピーカ(11B)を
作動させて話者に対して、「大きな声でお話1゜丁さい
」と音声入力を指示する(S407)。指示に従って発
声された音声は、マイクロフォン(101)を介して前
処理手段(102)に入力17、前処理手段(102)
では増幅され、更にノイズが除去された後、A/D変換
されてディジタル信号に変換される。
音声分析手段(104,”)はディジタル信号に変換さ
れた音声入力を分析して特徴パラメータを抽出する(8
408)。
次に、音声認識手段(113)は、音声分析手段(10
4)により分析された特徴パラメータと、メモリ(10
13)に格納されている大きい用の特徴パラメータの全
てとの類似性を計算し、て、最も類似度の高いパターン
を認ぷ結果として求め(S409)、上記の場合と同様
に出力端(114)に出力L(8411,)、処理を終
了する(8412)。
なお、認讃結果を出力端(114)に出力する前に、音
声認識手段(tia)で認識した音声を、音声合成手段
([15)により音声合成を行わせてスピーカ(116
)から出力させて話者に確認させるようにしてもよい。
また、雑音の大きさを判断した後、話者に対して音声入
力を指示する際には、スピーカ(11、G ’)の他に
、CRT (図示せず)にその旨を表示にさせることで
音声人力を指示させるようにしてもよい。
[発明の効果] 以上のようにこの発明によれば、背策雑音の大小に応じ
て話者に対して、声の大きさを指示すると共に、予め用
意しておいた2種類の記憶手段(通常の声の標準の特徴
パターンの登録、大きな声の特徴パターンの登録)を切
り換えて使用するようにしたので、低雑音環境下及び高
雑音慶境下の両方において良好な認識率が期待できる。
【図面の簡単な説明】
第1図はこの発明の一実施例に係る音声認識装置の構成
を示すブロック図、第2図は従来の音声認識装置の構成
を示すブロック図、第3図は第2図の装置の動作を示す
フローチャート、第4図は第1図の装置の動作を示すフ
ローチャートである。 図において、(104)は音声分析手段、(105)は
通常の音声の標準パターンが格納されているメモリ、(
II)Ili)は大きな音声の標準パターンが格納され
ているメモリ、(108)は雑音検出手段、(109)
は切り替えスイッチ、(113)は音声認識手段、(1
15)は音声合成手段である。

Claims (1)

  1. 【特許請求の範囲】 通常の音声の特徴パラメータが格納された第1の記憶手
    段と、 大きな音声の特徴パラメータが格納された第2の記憶手
    段と、 背景雑音を測定・判定し、その大小を検出する雑音レベ
    ル検出手段と、 該雑音レベル検出手段の出力に従って話者に対して通常
    の声での音声入力か、又は大きな声での音声入力かを指
    示する音声合成装置と、 音声入力を分析してその特徴パラメータを求める音声分
    析手段と、 該雑音レベル検出手段の出力に従って第1の記憶手段又
    は第2の記憶手段に格納された特徴パラメータと、音声
    分析手段で求められた特徴パラメータとを比較して入力
    音声を認識する音声認識手段と を有することを特徴とする音声認識装置。
JP1142965A 1989-06-07 1989-06-07 音声認識装置 Pending JPH039400A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1142965A JPH039400A (ja) 1989-06-07 1989-06-07 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1142965A JPH039400A (ja) 1989-06-07 1989-06-07 音声認識装置

Publications (1)

Publication Number Publication Date
JPH039400A true JPH039400A (ja) 1991-01-17

Family

ID=15327778

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1142965A Pending JPH039400A (ja) 1989-06-07 1989-06-07 音声認識装置

Country Status (1)

Country Link
JP (1) JPH039400A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020029998A (ko) * 2000-10-16 2002-04-22 김봉조 점착제 코팅시트 시스템
JP2006070448A (ja) * 2004-08-31 2006-03-16 Toso Co Ltd 日射遮蔽装置の操作コード端末
JP2008102384A (ja) * 2006-10-20 2008-05-01 Fujitsu Ltd 音声入力支援プログラム、音声入力支援装置、音声入力支援方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020029998A (ko) * 2000-10-16 2002-04-22 김봉조 점착제 코팅시트 시스템
JP2006070448A (ja) * 2004-08-31 2006-03-16 Toso Co Ltd 日射遮蔽装置の操作コード端末
JP2008102384A (ja) * 2006-10-20 2008-05-01 Fujitsu Ltd 音声入力支援プログラム、音声入力支援装置、音声入力支援方法

Similar Documents

Publication Publication Date Title
JP3674990B2 (ja) 音声認識対話装置および音声認識対話処理方法
EP0077194B1 (en) Speech recognition system
US7885818B2 (en) Controlling an apparatus based on speech
EP0757342A2 (en) User selectable multiple threshold criteria for voice recognition
JPS63301998A (ja) 音声認識応答装置
JPH039400A (ja) 音声認識装置
US20080228477A1 (en) Method and Device For Processing a Voice Signal For Robust Speech Recognition
JPS6257040B2 (ja)
JP3846500B2 (ja) 音声認識対話装置および音声認識対話処理方法
JPH0430040B2 (ja)
JPS6242198A (ja) 音声認識装置
JPS6126678B2 (ja)
JPH032793A (ja) 音声認識用前処理装置
JPS5914769B2 (ja) 音声機器
JPH04324499A (ja) 音声認識装置
JPH02103599A (ja) 音声認識装置
JP2975808B2 (ja) 音声認識装置
JPS59224900A (ja) 音声認識方法
JPH02198500A (ja) 音声認識装置
JPH07210186A (ja) 音声登録装置
JPH02141799A (ja) 音声認識装置
JPH06138895A (ja) 音声認識装置
JP2000155600A (ja) 音声認識システムおよび入力音声レベル警告方法
JP2599974B2 (ja) 音声検出方式
JPH03138698A (ja) 車載用音声認識装置の入力方式