JPS63259686A - 音声入力装置 - Google Patents

音声入力装置

Info

Publication number
JPS63259686A
JPS63259686A JP62093349A JP9334987A JPS63259686A JP S63259686 A JPS63259686 A JP S63259686A JP 62093349 A JP62093349 A JP 62093349A JP 9334987 A JP9334987 A JP 9334987A JP S63259686 A JPS63259686 A JP S63259686A
Authority
JP
Japan
Prior art keywords
input
voice
speech
dictionary
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62093349A
Other languages
English (en)
Inventor
佐々倉 実
重雄 倉掛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP62093349A priority Critical patent/JPS63259686A/ja
Publication of JPS63259686A publication Critical patent/JPS63259686A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野] この発明は、入力された音声波形信号を音声データに変
換して音声認識を行ないコード入力を行なう音声入力装
置に関する。
【発明の概要] この発明は、音声入力装置において、音声の種類に対応
して複数の音声認識用辞書を設け、音声入力の際に入力
すべき音声の種類に応じて音声入力用スイッチを操作す
ると、その操作状態に対応する種類の音声認識用辞書が
選択指定されると共に指定辞書内から入力音声に対応す
るコードを検索することにより、音声認識によるコード
入力を短時間でしかも確実に行なうことができるように
したものである。
[従来の技術] 従来、入力された音声波形信号を音声データに変換して
音声認識を行う音声入力装置におし1ては、標準音声デ
ータに対応して所定の入力コード(以下音声認識コード
という)を記憶する音声認識用辞書が設けられており、
入力された音声データに類似する標準音声データを音声
認識用辞書から検索すると共に、検索された標準音声デ
ータに対応する音声認識コードを音声認識用辞書力)ら
読み出して出力するようにしている。
[発明が解決しようとする問題点] しかしながら、この種のものにおし)てti、単一の音
声認識用辞書を用いて音声認識を行う為、辞書の規模が
大きくなって検索に時間が力)カ)ると共に、誤認識の
可能性が高かった。
この発明は上述した事情を背景になされたもので、その
目的とするところは、音声認識を短時間にしかも確実に
行なうことができる音声入力装置を提供することにある
[問題点を解決するための手段] t51図はこの発明の機能ブロック図である0図中1は
音声入力手段で音響変換された音声波形信号を音声デー
タに変換する。2は、複数の音声認識用辞書で音声の種
類、例えば、50音、濁音等に対応して設けられ、標準
音声データに対応する所定の入力コードを記憶する。3
は音声入力スイッチで1例えば、複数の音声認識用辞書
2に1:lに対応して設けられ、入力すべき音声の種類
に応じて操作される。4は、辞書選択手段で、複数の音
声認識用辞書2のうち音声入力スイッチ3の操作状態に
対応する種類の音声認識用辞書を選択する。5は検索手
段で、音声入力手段1から入力された音声データに類似
する標準音声データを辞書選択手段4で選択された音声
認識用辞書2内より検索する。6は検索手段5で検索さ
れた標準音声データに対応する所定の入力コードを音声
認識用辞書2から読み出して例えばワードプロセッサ本
体等に出力させる出力制御手段である。
[作 用J 次に、この発明の作用について説明する。ここで、複数
の音声認識用辞書2に1:1に対応して音声入力スイッ
チ3が設けられているものとする。いま、音声入力する
場合、入力すべき音声の種類に対応する音声入力スイッ
チ3を操作する。
すると、辞書選択手段4は音声入力スイッチ3の操作に
対応する種類の音声認識用辞書2を選択する0例えば、
入力すべき音声が50音のいずれかであればそれに対応
する音声入力スイッチ3を操作すると、50音の所定の
入力コード(例えばJISコード)が記憶されている音
声認識用辞書2が選択される。そして、音声入力スイッ
チ3の操作中に音声入力手段lから入力された音声デー
タに基づいて検索手段5はそれと類似する標準音声デー
タを検索する。この結果、出力制御手段6は検索された
標準音声データに対応する所定の入力コードを音声認識
用辞書2から読み出してワードプロセッサ本体等に出力
させる。
[実施例1 以下、この発明をfIS2図〜第4図に示す一実施例に
基づいて具体的に説明する。なお、本実施例はワードプ
ロセッサに接続された音声入力装置に適用した例を示し
ている。
延−虞 第2図はこの音声入力装置の外観図である0図中11は
ハンディタイプの音声入力装置で、接続コード12を介
してワードプロセッサ本体13に電気的に接続されてい
る。そして、音声入力装置11から音声入力すると、入
力された音声が認識されてコード化され、ワードプロセ
ッサ本体13に送られる。
また、音声入力装9111はその前面にマイクロホン1
4および液晶表示パネル15が配設され、また音声入力
装置11の側面には入力すべき音声の種類に対応して3
つの音声入カキ−5A、SB、SCおよびパワーオン/
オフキーPWが配設されている。ここで、入力すべき音
声が50音であれば音声入カキ−5A、濁音(半濁音を
含む)であれば音声入カキ−3R1「アンダーライン」
、「作表」等の制御コマンドであれば音声入カキ−5C
が操作される。即ち、5A−SCはそれが操作されてい
る間音声の入力動作を実行させる音声入カキ−として機
能する他、入力すべき音声の種類を選択する音声選択キ
ーとして機能する。
次に、第3図を参照して音声入力装置11の回路構成に
ついて説明する。音声入力装置11はCPU(中央演算
処理回路)21を中核とするもので、音声入力装置1工
の各種の動作を制御する。そして、音声入力装glll
には音声の種類に対応して3つの音声認識用辞書DA、
DB、DCが設けられている。ここで、辞書DAは50
音。
辞書DBは濁音(半濁音)、辞書DCは「アンダーライ
ン」、「作表」等の複数の文字列に対応する標準音声デ
ータをそれらの音声認識コードに対応して記憶するもの
である。そして、辞書DAは音声人力キー5A、辞書D
Bは音声入力キー5R1辞書DCは音声人カキ−5Cに
対応し、音声入カキ−5A−SCが操作された際にCP
U21の制御下で操作された音声入カキ−5A〜SCに
対応する辞書DA−DCが選択される。この場合、CP
U21は音声入カキ−3A−3Cに対応するキーフラグ
をフラグレジスタF1にセットし、このフラグレジスタ
F1の内容に基づいて#書DA−DCを選択する。なお
、本実施例にはフラグレジスタFlの他にフラグレジス
タF2が設けられており、フラグレジスタFlの内容を
一時保持する為にフラグレジスタFlの内容がフラグレ
ジスタF2に転送される。
また、マイクロホン14から入力された音声波形信号は
、音声入力処理部22に送られて音声データに変換され
、CPU21に取り込まれる。
音声入力処理部22は入力された音声波形信号の周波数
分析を行ってパラメータ化し、音声データに変換出力す
るもので、CPU21の制御下で音声、<ツファVOI
に転送される。なお、本実施例には音声バッファVOI
の他に音声バッファV02が設けられており、音声バッ
ファVOIの内容を一時保持する為に音声バッファVO
Iの内容が音声バッファVO2に転送される。しかして
、CPU21は音声バッファVOIあるいはVO2内に
セットされている音声データに基づいて辞書DA−DC
のうちフラグレジスタF1の内容によって選択された指
定辞書内より該当する標準音声データを検索し、検索し
た標準音声データに対応する音声認識コードを読み出し
て入力バッファIBにセットすると共に上記液晶表示パ
ネル15を備えた表示部23に送り、キャラクタ表示さ
せる。入カバッファIB内の音声認識コードは、新たな
音声が入力された際に確定し、CPU21の制御下で読
み出され、インターフェース24を介してワードプロセ
ッサ本体13に出力される。
肱−潅 先ず、音声入力装置1ii11の動作を説明する前に、
音声入力操作について説明する。オペレータは、音声入
力向に50音、濁音、#御コマンドのうちいずれの音声
を入力するかを決定し、音声入カキ−5A−5Cのうち
入力すべき音声の種類に対応するいずれかのキーを操作
する。そして、このキー操作中にマイクロホン14に向
かって音声を入力する。この場合、50音、濁音は各音
素毎に1文字ずつ入力するが、制御コマンドについては
「アンダーライン」の如く文字列毎に入力する。
また、本実施例においては入力音声が認識されて最も類
似した候補が表示されるが、この候補が入力音声に該当
しないときには、次の候補を検索表示させる為に再度同
一の音声入カキ−3A〜SCを操作する。この場合、音
声入力なしに音声入カキ−3A−3Cのみを操作する。
また、音声入カキ−3A−SCの操作を間違え、入力音
声の種類に対応しないキーを操作してしまった場合には
、音声入力なしに音声入カキ−5A−5Cのみを操作し
、操作キーの変更を行第4図は音声入力装置11の動作
を示すフローチャートである。パワーオン/オフキーF
Wを操作して音声入力装置11をパワーオンさせると、
音声入力装fillは第4図のフローにしたがった動作
を実行する。先ず、入力バッファIBの内容をクリアす
るイニシャライズ処理(ステップSl)が実行されたの
ち、音声入カキ−5A−5Cのキーオン待ちとなる(ス
テップS2)、いま。
音声入カキ−5A−5Cのうち、入力すべき音声の種類
(50音、濁音、制御コマンド)に応じて対応するキー
を操作すると、操作キーに対応するキーフラグがフラグ
レジスタF1にセットされる(ステップS3)、そして
、音声バッファVO1の内容をクリアするイニシャライ
ズ処理(ステップS4)が実行される。しかして、音声
入カキ−3A−3Cのいずれかを操作しているキーオン
中に、マイクロホン14に向かって音声を入力すると、
入力音声は音声入力処理部部22によってパラメータ化
されて音声データに変換されるので、CPU21は音声
入力処理部22からの音声データを取り込んで音声バッ
ファVO1に転送記憶させる(ステップS5)、そして
、当該キーがオフされるまで入力された音声データは音
声バッファVOIに取り込まれてゆき、そして、キーオ
フさせると、そのことがステップS6で検出されて音声
データを音声バッファVOIに取り込む処理が終了する
。これによって音声バッファVOIにはキーオン中に入
力された音声データが格納されることになる。
そして、次のステップS7では音声バッファvOI内に
音声データが格納されているか否かが調べられる。ここ
で、上述した如く次の候補を検索表示させる場合あるい
は音声人カキ−5A〜SCの操作を間違えてキーの変更
を行う場合には単に音声入カキ−3A−3Cを操作する
だけでキーオン中には音声が入力されないので、このよ
うな場合には音声バック、VOIに音声データが格納さ
れていないが、通常、キーオン中に音声が入力されるの
で、次のステップS8に進み、入力バッファIB内にコ
ードがセットされているか否かのチェックが行なわれる
。最初、入力バッファIBはクリアされているので、ス
テップ510に進み、辞書DA−DCのうちフラグレジ
スタFl内のキーフラグに対応する辞書が選択指定され
る。即ち、50音を入力する為に音声入カキ−5Aが操
作されると辞書DAが選択指定され、また、濁音を入力
する為に音声入カキ−3Bが操作されると辞書DBが選
択指定され、更に「アンダーライン」等の制御コマンド
を入力する為に音声入カキ−5Cが操作されると辞書D
Cが選択指定される。しかして、次のステップSllで
はいま入力した音声データを退避する為に音声バッファ
VOI内の音声データが音声バッファVO2にセットさ
れる。そして、音声バッファVOI内の音声データに基
づいて指定辞書内からそれに最も類似する標準音声デー
タを検索する処理が行なわれる(ステップ512)、こ
れによって検索された標準音声データに対応する音声認
識コードが指定辞書内から読み出され、入力バッファI
Bにセットされる(ステップ513)、そして、フラグ
レジスタFl内のキーフラグを退避する為に、フラグレ
ジスタF1の内容をフラグレジスタF2にセットしたの
ち、入カバッファIB内の音声認識コードが表示部23
に送られてキャラクタ表示される(ステップ320)、
そして、ステップS2に戻り、音声入カキ−5A−5C
の操作待ちとなる。
いま、入力音声が正しく認識されてその候補がキャラク
タ表示されている場合には、次の新たな音声を入力する
為に音声入カキ−5A−5Cを操作するが、入力音声が
誤認識されて他のキャラクタが候補表示されている場合
には、次の候補を検索表示させる為に再度同一キーを音
声入力なしに操作する。これによって、上述と同様にフ
ラグレジスタF1にはそのキーフラグがセットされ、ま
た音声バッファVOIの内容はクリアされる(ステップ
S3、S4)、そして、無音のまま当該キーをキーオフ
させると、ステップS15に進み、音声バッファVO2
に音声データが格納されているか否かが調べられる。こ
の場合、音声バッファVO2には前回入力された音声デ
ータが格納されているので、次のステップ316に進み
、フラグレジスタFl、F2の内容が一致するかの判断
が行なわれる。ここで、フラグレジスタF2には前回操
作したキーのキーフラグが記憶されており、いま、前回
と同一のキーが操作された場合であるから、この場合に
は両者の一致が検出される。これによって、音声バッフ
ァVO2内の音声データに類似する次の標準音声データ
を指定辞書内から検索する処理が行なわれる(ステップ
518)、そして、検索された次の標準音声データに対
応する音声認識コードが指定辞書内から読み出され、入
力バッファIBにセットされる(ステップ519)、こ
の入カバッファIB内の音声認識コードは、表示部23
に送られて次候補としてキャラクタ表示される(ステッ
プ520)、そして、ステップS2に戻り、音声入カキ
−3A〜SCの操作待ちとなる。このように2回目のキ
ー操作によっても人力音声が正しく認識されなければ、
更に次の候補を検索表示する為に、同一キーを音声入力
なしに操作する。
このようにして検索表示された候補に基づいて正しく認
識されたことを確認したら、次に新たな音声入力を行な
う、この場合においても入力すべき音声の種類に応じて
音声入カキ−3A−3Cを操作しながら音声入力を行な
う、いま、入カバッファIB内にはその直前の候補が格
納されているので、そのことがステップS8で検出され
てステップS9に進み、新たな音声入力によって直前の
コードが確定したとみなされ、入カバッファIB内のコ
ードがインターフェース24を介してワードプロセッサ
本体13に転送される。そして、今回入力した音声に対
する候補の検索表示処理が行なわれることは上述の場合
と同様である・(ステップ510〜514.320)。
一方、音声入カキ−5A−3Cの操作を間違えた場合に
は、音声入力なしに操作キーの変更を行なう、この場合
には次の3つの条件を満たしている。即ち、音声バッフ
ァMolにはデータ無しくステップS7)、音声バッフ
ァVO2にはデータ有り(ステップ515)、フラグレ
ジスタF1.F2の内容不一致(ステップ516)が夫
々検出されるので、ステップS17に進み、今回の操作
キーに対応する辞書が指定されて辞書の変更が行なわれ
ると共に、この変更辞書内から音声バッファVOZ内の
音声データ(以前入力した音声データ)に基づいてそれ
に類似する標準音声データの検索が行なわれたのちステ
ップ513に進む、したがって、入力すべき音声の種類
に対応しないキーを間違えて操作した場合には単にキー
の変更を行なうだけでよい。
このように本実施例においては、入力すべき音声の種類
に応じて音声入カキ−3A−3Cを操作すると、それに
対応する種類の辞書DA−DCが指定されて指定辞書内
から入力音声に対応する音声認識コードを検索するよう
にしたから、その検索を短時間でしかも確実に行なうこ
とができる。
また、このようにして検索された音声認識コードは次の
新たな音声入力によって順次ワードプロセッサ本体13
へ転送されるので、ワードプロセッサ本体13側では転
送されて来た音声認識コードを貯え、そして1通常のキ
ー操作によって漢字変換や片仮名変換を行なうことがで
き、入力音声に基づいた文書作成が可能となる。
なお、上記実施例は各辞書DA−DCにに1に対応して
音声入カキ−3A−5Cを設けたが。
3段階押しの単一キーであってもよく、またロータリス
イッチ、スライドスイッチ等で構成してもよい。
更に、上記実施例は、入力すべき音声の種類として50
音、濁音、¥Allコマンドを例に挙げたが、数字、5
0音、アルファベット等であってもよく、シかも単語単
位で音声入力するものであってもよい。
[発明の効果] この発明は以上詳細に説明したように、音声の種類に対
応して複数の音声認識m辞書を設け、音声入力の際に入
力すべき音声の種類に応じて音声入力用スイッチを操作
すると、その操作状態に対応する種類の辞書が選択指定
されると共に、指定辞書内から入力音声に対応するコー
ドを検索するようにしたから、音声認識によるコード入
力を短時間にかつ確実に行なうことができる等の効果を
有する。
【図面の簡単な説明】
第1図はこの発明の機藺ブロック図、第2図〜fiS4
図はこの発明の一実施例を示し、第2図はワードプロセ
ッサに接続した音声入力装置の外観図、第3図は音声入
力装置の基本的な構成を示すブロック回路図、第4図は
音声入力装置の動作を説明する為のフローチャートであ
る。 11・・・・・・音声入力装置、14・・・・・・マイ
クロホン、21・・・・・・CPU、22・・・・・・
音声入力処理部、24・・・・・・インターフェース、
SA、SB、SC・・・・・・音声入カキ−1DA、D
B、DC・旧・・辞書。 特許出願人  カシオ計算機株式会社 (剖t)1づ ワー7−ロ本イ本へ Jlり

Claims (1)

  1. 【特許請求の範囲】 入力された音声を音声データに変換する音声入力手段と
    、 音声の種類に応じて設けられ、標準音声データに対応し
    て所定の入力コードを記憶する複数の音声認識用辞書と
    、 入力すべき音声の種類に応じて操作される音声入力スイ
    ッチと、 前記複数の音声認識用辞書のうち前記音声入力スイッチ
    の操作状態に対応する種類の音声認識用辞書を選択指定
    する辞書選択手段と、 前記音声入力手段から入力された音声データに類似する
    標準音声データを前記辞書選択手段で選択された前記音
    声認識用辞書内より検索する検索手段と、 この検索手段で検索された標準音声データに対応する所
    定の入力コードを当該音声認識用辞書から読み出して出
    力させる出力制御手段と、 を具備したことを特徴とする音声入力装置。
JP62093349A 1987-04-17 1987-04-17 音声入力装置 Pending JPS63259686A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62093349A JPS63259686A (ja) 1987-04-17 1987-04-17 音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62093349A JPS63259686A (ja) 1987-04-17 1987-04-17 音声入力装置

Publications (1)

Publication Number Publication Date
JPS63259686A true JPS63259686A (ja) 1988-10-26

Family

ID=14079795

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62093349A Pending JPS63259686A (ja) 1987-04-17 1987-04-17 音声入力装置

Country Status (1)

Country Link
JP (1) JPS63259686A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005076259A1 (ja) * 2004-02-10 2005-08-18 Nec Corporation 音声入力システム、電子機器、音声入力方法、および、音声入力用プログラム
JP2007047412A (ja) * 2005-08-09 2007-02-22 Toshiba Corp 認識文法モデル作成装置、認識文法モデル作成方法、および、音声認識装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005076259A1 (ja) * 2004-02-10 2005-08-18 Nec Corporation 音声入力システム、電子機器、音声入力方法、および、音声入力用プログラム
JPWO2005076259A1 (ja) * 2004-02-10 2007-10-18 日本電気株式会社 音声入力システム、音声入力方法、および、音声入力用プログラム
JP4622861B2 (ja) * 2004-02-10 2011-02-02 日本電気株式会社 音声入力システム、音声入力方法、および、音声入力用プログラム
JP2007047412A (ja) * 2005-08-09 2007-02-22 Toshiba Corp 認識文法モデル作成装置、認識文法モデル作成方法、および、音声認識装置

Similar Documents

Publication Publication Date Title
JPS61107430A (ja) 音声情報の編集装置
JPS59144978A (ja) ポ−タブル翻訳装置
JP3476007B2 (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
EP0472193A2 (en) Translation device based on voice recognition and voice synthesis
JPH08278972A (ja) 音声入力翻訳装置
JPS63259686A (ja) 音声入力装置
KR100366806B1 (ko) 제한된 수의 키를 이용한 이동 통신 단말기의 한글 입력 장치
JPS634206B2 (ja)
JPH0155507B2 (ja)
JPH11120176A (ja) 通訳装置及び方法並びに通訳装置制御プログラムを記憶した媒体
JPH033260B2 (ja)
JP2504779B2 (ja) 音声入力機能付き文書処理装置
JP2002189490A (ja) ピンイン音声入力の方法
JPH08329088A (ja) 音声入力翻訳装置
JPS62212870A (ja) 文章読み上げ校正装置
JP3183686B2 (ja) 言語入力装置
JPH01300334A (ja) 文章読み上げ装置
JPH03217900A (ja) テキスト音声合成装置
JPH0319005Y2 (ja)
JPS61275972A (ja) 文章処理装置における音声入力装置
JP3402480B2 (ja) 文書朗読装置
JPH0195323A (ja) 音声入力装置
JPS60205594A (ja) 認識結果表示方式
JPH0442363A (ja) 携帯型音声認識電子辞書
JPH0414168A (ja) 文書作成装置