JPS60158495A - 情報処理方法 - Google Patents

情報処理方法

Info

Publication number
JPS60158495A
JPS60158495A JP59013422A JP1342284A JPS60158495A JP S60158495 A JPS60158495 A JP S60158495A JP 59013422 A JP59013422 A JP 59013422A JP 1342284 A JP1342284 A JP 1342284A JP S60158495 A JPS60158495 A JP S60158495A
Authority
JP
Japan
Prior art keywords
voice
similarity
speech
recognition device
color information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59013422A
Other languages
English (en)
Other versions
JPH0562359B2 (ja
Inventor
恭則 大洞
宮芝 晃一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP59013422A priority Critical patent/JPS60158495A/ja
Publication of JPS60158495A publication Critical patent/JPS60158495A/ja
Publication of JPH0562359B2 publication Critical patent/JPH0562359B2/ja
Priority to US08/137,816 priority patent/US5359695A/en
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 し技術分野] 本発明はi声を認識して識別する音声認識装置に関し、
特に装置の認識状態を示す色表示により、発声者の発声
状態を知ることができるようにした音声認識装置に関す
る。
[従来技術] 従来この種の装置では、予め発声者の標準音声を入力し
、この入力信号に所定の変換を施していくつかの特徴ベ
クトルを抽出し、得られた特徴ベクトルの組合せから音
声を認識してその認識が正しければ抽出ベクトルをその
認識概念とともに登録ファイルに特徴標準パターンとし
て登録しておく、また必要ならキーボード等からの文字
、図形または記号入力を前記得られた特徴ベクトルの組
合せに対応させて登録ファイルに特徴標準パターンとし
て登録しておく。
次に、装置が通常の音声認識をするときは、前記同様の
変換で特徴ベクトルを抽出し、これを前記登録ファイル
の特徴標準パターンと比較して類似度を計算し、最も入
力音声に近い特徴ベクトルを前記特徴標準パターンの中
から選択して当該音声の認識をするものであった。従っ
て発声者は、例えば認識結果を符号化した表示文字が正
しい間は、自己の発声の一様性や再現性を正しいものと
信じているが、表示文字が発声と違ったときに初めて自
己の発声が登録したときの標準パターンからずれたこと
を知る。しかし人の音声は様々な人的コンディションに
も強く依存するから、例えば −装置が認識を誤ったと
きには、もはやその音声は登録時のものから徐々にずれ
て認識不能があるいは誤認識されるまでに変わったもの
である場合が多い。しかもそれまでには時間がたってお
り、発声者が登録した際の音声の感じを思い出すことは
もはや困難であり、止むなく音声を再登録するようなこ
とも多かった。
し目的] 本発明は上述した従来技術の欠点に鑑みて成されたもの
であってその目的とする所は、装置の音声認識の状態を
色分けして表示することにより、発声者には常に再現性
の良い発声を維持させ、装置には常に良好な音声入力を
可能とするような音声認識装置を提供することにある。
[実施例] 以下、図面に従って本発明に係る一実施例の音声認識装
置を詳細に説明する。第1図は一実施例の音声認識装置
の主要な機能構成を示すブロック図である。図において
、lは音声を電気信号に変換するマイクロホン、2は音
声の電気信号を増1幅する増幅部、3は増幅された音声
信号にス々クトル変換処理を施して様々な特徴ベクトル
を抽出する特徴ベクトル抽出部、4は、標準音声の登録
時に、特徴ベクトル抽出部3で抽出された特徴ベクトル
を特徴標準パターンとして登録する標準パターン登録部
、5は、通常の音声の認識時に、特徴ベクトル抽出部3
で抽出された特徴ベクトルと標準パターン登録部4から
読み出された特徴標準パターンベクトルを比較し、両者
の類似度を計算して最も高い類似度を得たものについて
その該当単語又は該当音素を識別して符号化する音声認
識部、6は音声認識部5で計算された類似度を複数段階
のレベルにクラス分けし、計算された類似度のクラス分
けに従ってこれに対応させた色情報を選択出力する表示
色選択部、7は認識部5で識別、符号化された文字、図
形または記号を表示する文字表示部71と表示色選択部
6で選択された色情報を可視化して表示する色表示部7
2とから成る表示部である。
第2図は第1図に示す構成の動作を説明するフローチャ
ートである。ステップS1ではマイクロホン1から音声
人力をする。ステップS2では所定のスペクトル変換に
より入力音声の特徴ベクトルを抽出する。ステップS3
では登録モードか否かの判別をする。装置は標準音声の
登録モードと通常の音声の認識モードを有し、スイッチ
手段(図示せず)により予めいずれかのモードに選択さ
れている。登録モードであればステップS4に進み抽出
された特徴ベクトルの組を特徴標準パターンとして登録
する。フローはステップ3.1に戻り、次の音声入力を
待つ。一般に音声人力はその特徴ベクトルを分析するだ
けでもある程度の認識が可能である。しかし、人の音声
はそれぞれに特徴があるので、実施例の装置は音声認識
の高信頼性を確保するため特徴標準パターンの登録方式
を採用している。さて、ステップS3の判別で登録モー
ドでないときは通常の音声の認識モードである。フロー
はステップS5に進み音素や単語の符号を格納す、る符
号レジスタCRと、類似度の最大価を格納するレジスタ
MRの内容をOに初期化する。るテップS6では既に登
録されている特徴標準パターンがあるか否かの判別をす
る。登録パターンがあればステップS7に進む際にその
頭から順々に特徴標準パターンを読み出す。ステップS
7ではステップS2で抽出された特徴ベクトルとステッ
プS6で読み出された特徴標準パターンを比較して類似
度Xmを計算する。ステップS8では1つ前の比較で読
み出された特徴標準パターンとの間で計算したときの類
似度をXm−1とするときに、現時点の類似度Xmとの
大小を比較判別する。XmがX m −1,より大きい
ときはステップS9に進んでレジスタCRに当該標準パ
ター゛ンに関連させて登録しておいた音素や単語の符号
を転送し、レジスタMRには現時点の類似度Xmを転送
する。またステップS8の判別がNOてあれば何もせず
にフローはステップS6に戻る。つまり以上の処理でレ
ジスタCRには現時点までに最もよく類似していると判
断される音素や単語等の符号が、またレジスタMRには
そのときの類似度の仙Xmが夫々保持されることになる
。このような処理を繰り返して、やがてステップS6の
判別で、登録されている標準パターンの終りにくると該
判別はNoになりステップS10に進む。ステップSI
OではレジスタCRの内容を文字表示部7.Iに送って
該当文字等の表示をする。ステップS11ではレジスタ
MRの内容を表示色選択部6に送る。表示色選択部6で
は、例えば類似度Xmの値100を最大として、Xmが
O〜59のときは赤色、Xmが60〜79のときは黄色
、Xmが80〜100のときは青色のようにレベル分け
して表示色の対応を決めておく。この選択された色情報
は色表示部72に送られて対応する色の表示を行う。フ
ローはステップS1に戻って次の音声の入力を待つ。こ
のようにすれば、発声者は自己の発声の状態をいつでも
モニタできる。類似度xmが80以上のときは青色か表
示されるから、発声者は安心して音声入力を続ける。発
声者は色表示の方式に慣れれば、表示の文字自体を見て
いちいち認識の正誤を確認するよりもずっと楽に装置を
扱えるようになるであろう。類似度Xmが60〜79の
ときは認識可能であるが要注意でもあるンつまり他の登
録パターンとの間でもこの程度の類似度が計算され得る
から、装置は誤認識する可能性が高い。発声者が黄色い
表示を見たときは、併せて認識結果の表示文字等にも注
意を払う必要がある。そしてどの音素や単語の類似度が
低かったのかを直ちに知ることができるであろう。
発声者はそのような音素や単語の発声について登録した
ときの発声からあまりかけはなれないうちに発声のずれ
を知り、直ちに発声を修正することが可能である。
第3図は他の一実施例の音声認識装置の主要な機能構成
を示すブロック図である。図において第1図と同等のも
のには同一番号を付して説明を省略する。この実施例で
特徴をなす構成は認識の確実度計算部8である。確実度
計算部8は過去に何度か識別された同一種の音素や単語
の識別単位iについて音声認識部5かも出力される類似
度の時系列テークX’m 、 XA′rQ−1,X”m
 −2、−= X’m −nに重みつき平均処理を行う
。識別単位iとは例えば“ア゛の語に対応する音声であ
る。あるいは同一種の識別単位に限るのてはなく、単純
に時系列にそって過去に現れた順のどんな音素や単語で
も認識に用いられた類似度を混ぜこせにした数個分の確
実度として計算してもよい。今、重み係数をス・ aとすると現時点における音声認識の確実度Yはa4゜
* x’4+ az−、・X”m−1+ * e φh
 a −nφX’m −nで与えられる。確実度計算部
8はこうしてめた現時点の確実度Y”m を表示色選択
部6に出力する。表示色選択部6では例えは確実度へ の100を最大としてYmがO〜59のときは赤色、Y
”mが60〜79のときは黄色、YLmが80〜100
のときは青色のようにして表示色の対応を決めておく。
この色選択情報はカラーCRT表示部9に送られて対応
する色の表示を行う。表示は例えば音声認識部5で符号
化された文字等の表示に直接色を現すものである。従っ
て発声者は入力した音声が音素や単語に変換されて表示
される際に、その文字の色から認識の確実度を知ること
ができる。通常は青色の文字が集って入力音声に対応す
る音素や単語が組立てられるであろう。その中にもし確
実度の低い音素や単語があるなら、その音素や単語だけ
黄色く表示されるから発声者はその音素や単語に対する
自己の発声が要注意であることを知り、直ちに発声の状
態を修正できる。また認識不能になることの多いものは
赤色で表示されることになる。例えは認識できたときは
その音素や単語を赤色で表示し、認識できなかったとき
は認識不能を示す所定の記号を赤色で表示する。このよ
うにして発声者は音声認識の状態を統計的にとらえるこ
とが可能になる。例えばaの重みづけを均一の値にすれ
ば確実度Y’mは過去のn+1回分の平均類似度という
ことになり単純な認識確実度の傾向を把握できる。また
aを最近の認識結果に近づくにつれ重みをおくように設
定すれば単純平均に比べて認識確実度の応答感度が良く
なる。
[効果コ 以上述べた如く本発明によれば、発声者はそのときどき
の音声認識の難易度を色によって知ることができる。色
による表示は認識の大まかな状態を知らせるには極めて
都合が良い。また認識した音素や単語を画面に表示して
確認できるタイプの装置では、その文字に直接色を加え
ることができる。従って本来の処理目的の遂行のじゃま
にならず、しかも音素や単語毎に認識の難易度を知るこ
とができる。このようにすれば、発声者は比較的早い時
点で自己の標準からの発声のずれを知ることができ、直
ちに修正することがてきる。従って装置の認識率と信頼
性の高い稼働が可能になる。
【図面の簡単な説明】
第1図は本発明に係る一実施例の主要な機能構成を示す
ブロック図、 第2図は第1図に示す構成の動作を説明するフローチャ
ート、 第3図は本発明に係る他の一実施例の主要な機能構成を
示すブロック図である。

Claims (4)

    【特許請求の範囲】
  1. (1)音声の特徴標準パターンと音声の特徴入カバター
    ンとの類似度をめて入力音声の識°別を行う音声認識装
    置において請求めた類似度を複数段階のレベルにクラス
    分けする手段と、前記類似度を前記クラス分1すに従っ
    てこれに対応させた色情報を選択出力する手段と、前記
    選択出力された色情報を可視化して表示する色表示手段
    を備えることを特徴とする音声認識装置。
  2. (2)入力音声の識別結果をこれに対応する文字、図形
    または記号で表示する表示手段を有し、色表示手段は前
    記表示文字、図形または記号上で色情報を可視化して表
    示することを特徴とする特許請求の範囲第1項記載の音
    声認識装置。
  3. (3)音声の特徴標準ノ々ターンと音声の住寺徴入カバ
    ターンとの類似度をめて入力音声の識ff1lを′I〒
    う音声認識袋Hにおいて請求めた類似度のa与系夕11
    に沿った所定の回数分の重みつき平均値を算IJjする
    手段と、前記算出された重みつき平均イ「(をネ1り段
    階のレベルにクラス分けする手段と、11■δ己算出さ
    れた重みつき平均値を前記クラス分けに従ってこれに対
    応させた色情報を選択出力する手段と、前記選択出力さ
    れた色情報を可視化して表示する色表示手段を備えるこ
    とを特徴とする音声認識装置。
  4. (4)重みつき平均値を算出する手段は同一の文字、図
    形または記号に識別されたものにつl、)てイ固別に重
    みつき平均値を算出することを特徴とする特許請求の範
    囲第3項記載の音声認識装置。
JP59013422A 1984-01-30 1984-01-30 情報処理方法 Granted JPS60158495A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP59013422A JPS60158495A (ja) 1984-01-30 1984-01-30 情報処理方法
US08/137,816 US5359695A (en) 1984-01-30 1993-10-19 Speech perception apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59013422A JPS60158495A (ja) 1984-01-30 1984-01-30 情報処理方法

Publications (2)

Publication Number Publication Date
JPS60158495A true JPS60158495A (ja) 1985-08-19
JPH0562359B2 JPH0562359B2 (ja) 1993-09-08

Family

ID=11832690

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59013422A Granted JPS60158495A (ja) 1984-01-30 1984-01-30 情報処理方法

Country Status (1)

Country Link
JP (1) JPS60158495A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04235599A (ja) * 1991-01-11 1992-08-24 Fujitsu Ltd 認識候補情報グループ別表示処理方式
JPH09292895A (ja) * 1996-04-25 1997-11-11 Matsushita Electric Ind Co Ltd ヒューマン・マシン・インタフェース装置
US9772739B2 (en) 2000-05-03 2017-09-26 Nokia Technologies Oy Method for controlling a system, especially an electrical and/or electronic system comprising at least one application device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04235599A (ja) * 1991-01-11 1992-08-24 Fujitsu Ltd 認識候補情報グループ別表示処理方式
JPH09292895A (ja) * 1996-04-25 1997-11-11 Matsushita Electric Ind Co Ltd ヒューマン・マシン・インタフェース装置
US9772739B2 (en) 2000-05-03 2017-09-26 Nokia Technologies Oy Method for controlling a system, especially an electrical and/or electronic system comprising at least one application device

Also Published As

Publication number Publication date
JPH0562359B2 (ja) 1993-09-08

Similar Documents

Publication Publication Date Title
JP4867804B2 (ja) 音声認識装置及び会議システム
CN110111778A (zh) 一种语音处理方法、装置、存储介质及电子设备
US5359695A (en) Speech perception apparatus
US20030120490A1 (en) Method for creating a speech database for a target vocabulary in order to train a speech recorgnition system
JPS60158495A (ja) 情報処理方法
JP2002311992A (ja) 話者認証方法及び装置
JPH02109100A (ja) 音声入力装置
JP5596869B2 (ja) 音声認識装置
JPS6151799B2 (ja)
JP2001147919A (ja) 音声処理装置及び方法並びにこれに利用される記憶媒体
JP2000181490A (ja) 利用者照合方法および利用者照合装置
JPH10198393A (ja) 会話記録装置
JPH11344992A (ja) 音声辞書作成方法、個人認証装置および記録媒体
CN108133706A (zh) 语义识别方法及装置
JPS59212900A (ja) 音声認識装置
JP2017068153A (ja) 半導体装置、システム、電子機器、及び、音声認識方法
JP2604776Y2 (ja) 音声入力装置
JPS5915993A (ja) 音声認識装置
JPH03223799A (ja) 分離しているワード、特に非常に大きい語いの認識方法と装置
JPS61230198A (ja) 音声認識装置
JP2002372989A (ja) 数字音声入力方法、その装置、そのプログラム及びその記録媒体
JPS6385964A (ja) スケジユ−ル表示方式
JPS61249099A (ja) 音声認識装置
JPH075894A (ja) パターン長正規化装置
JPS61281299A (ja) 音声認識装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term