JP2000029585A - 音声コマンド認識画像処理装置 - Google Patents

音声コマンド認識画像処理装置

Info

Publication number
JP2000029585A
JP2000029585A JP19306998A JP19306998A JP2000029585A JP 2000029585 A JP2000029585 A JP 2000029585A JP 19306998 A JP19306998 A JP 19306998A JP 19306998 A JP19306998 A JP 19306998A JP 2000029585 A JP2000029585 A JP 2000029585A
Authority
JP
Japan
Prior art keywords
voice
command
data
input
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP19306998A
Other languages
English (en)
Inventor
Takeshi Aoyanagi
剛 青柳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP19306998A priority Critical patent/JP2000029585A/ja
Publication of JP2000029585A publication Critical patent/JP2000029585A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Accessory Devices And Overall Control Thereof (AREA)
  • Control Or Security For Electrophotography (AREA)
  • Facsimiles In General (AREA)

Abstract

(57)【要約】 【課題】 音声入力コマンドを認識して作動する複写機
及びファクシミリやプリンタ等の複合機において、不特
定多数の人が使用する場合、予め登録する音声辞書デー
タ用のメモリ等の記憶媒体の容量が過大となることを緩
和にするための手段を提供する。 【解決手段】 このため、辞書データに参照データを登
録する際は、実際に操作部101のボタン等を押し乍ら
登録し、次回同じコマンドを使用する時には、音声のみ
で操作できるようにし、また、登録を行う際にもパター
ンマッチングを行い、既登録済みコマンドと同一または
類似コマンドや類似音声が入力された場合には、その使
用者に警告すると共に、また、類似度の高い辞書データ
は、指紋や掌紋等の他の判断要素でより正確に認識する
よう構成した。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複写機及びファク
シミリやプリンタ等の複合機、特にコマンドを入力する
ユーザインタフェイスに音声を用いているこの種の複合
機械に関するものである。
【0002】
【従来の技術】近年、パーソナルコンピュータやカーナ
ビゲーション等に見られる様に、音声認識を利用したコ
マンド入力を行う機器が普及しつつあるが、従来の複写
機及びファクシミリやプリンタ等の複合機には、以上の
ような機能を有するものはなかった。
【0003】この種の音声認識を行うには、声紋や音声
の区切り、音の高低等の“パターンマッチング”を行っ
ている。このパターンマッチングとは、予めメモリ等の
記憶媒体に使用するコマンドと、それを発声した時の音
声データとが1対1に対応して、辞書として登録されて
おり、入力された音声データが登録されている各コマン
ドと、どの程度一致しているかを類似度として算出し、
その値の最大のものをコマンドとして選択し、実行する
という類のものである。
【0004】
【発明が解決しようとする課題】しかしながら、前記複
写機及びファクシミリやプリンタ等の複合機において、
前記のような音声認識によるコマンド入力を行うに当た
っては、以下のような問題点がある。
【0005】すなわち、音声認識でコマンドの入力を行
う際には、予め使用する全てのコマンドを辞書に登録し
ておく必要がある。現在のコマンドの登録方法は、使用
するコマンドの全てを1度読み乍ら、各キー操作と対応
させて登録していかなくてはならなかった。
【0006】従来のように、ある程度使用者が限定され
ているカーナビゲーションやパーソナルコンピュータ等
では、登録するデータは概して個人的のものであり、1
人の音声データを入力するだけで良かった。
【0007】しかしながら、複写機のように不特定多数
の人が使用する機械の場合には、使用する可能性のある
多くの人の音声辞書データを予め登録しておく必要があ
り、そのデータを記憶するために使用するメモリ等の記
憶媒体の容量もそれなりに大きなものが必要となる。
【0008】また、登録しておくコマンドも、人それぞ
れ使用頻度も異なり、人によっては結果的には全く使用
しないコマンドがあっても、全てを登録しておく必要が
あり、それによっても結果的には、不要な記憶媒体の容
量を使用することとなってしまう。
【0009】本発明は、以上のような局面にかんがみて
なされたもので、これらの問題点を解決することのでき
る音声コマンド認識画像処理装置の提供を目的としてい
る。
【0010】
【課題を解決するための手段】このため、本発明におい
ては、以下の各項(1)〜(6)のいずれかに示すよう
な音声コマンド認識画像処理装置を提供することによ
り、前記目的を達成しようとするものである。
【0011】(1)スイッチやボタン、テンキー、液晶
タッチパネル等により、コピー操作やファクシミリの送
信等のコマンドの入力を行う操作手段と、CPU等の処
理装置を使用し、前記操作手段からのコマンドにより画
像処理の設定やプリント枚数等の設定を行い、画像入力
手段、画像処理手段、画像出力手段等の動作の制御を行
うドライバ手段と、CCD等を使用し、前記ドライバ手
段からの制御により、原稿の画像データをデジタルデー
タに変換し、画像処理部へ出力する画像入力手段と、A
SIC等のハード回路や、前記CPU等を使用したソフ
ト的な処理等により、前記画像入力手段から入力される
デジタル画像データを、前記ドライバ手段からの画像処
理の設定に応じて処理を行い、前記画像出力手段に出力
を行う画像処理手段と、前記画像処理手段により処理が
された画像データを、レーザプリンタやインクジェット
プリンタ等のプリンタによって出力を行う画像出力手段
であって、この部分はブラウン管モニタや液晶モニタ、
または前記操作手段部に使用されている前記液晶タッチ
パネルに表示を行ったり、画像データとしてネットワー
ク上への出力、モデムを介してファクシミリ送信等を行
うものも含む前記画像出力手段と、マイク等を使用し、
音声の入力を行い、前記デジタルデータとして音声認識
手段に送る音声入力手段と、前記音声入力手段からの音
声データを入力し、辞書データへの登録や音声のパター
ンマッチング、コマンドへの変換等を行う音声認識手段
と、より構成され、前記音声によるコマンドの認識を行
い動作することを特徴とする音声コマンド認識画像処理
装置。
【0012】(2)前記音声認識手段は、前記音声入力
手段からのデジタル音声データを入力する音声データ入
力手段と、前記操作手段から入力されたコマンド情報の
入力を行う操作部情報入力手段と、前記操作手段部情報
と前記音声データとを対応させて、メモリやハードディ
スク等の記憶媒体に記憶しておく辞書データ蓄積手段
と、前記音声データ入力手段からのデータと、前記辞書
データ蓄積手段からの音声辞書データとのパターンマッ
チングを行い、各コマンドに対する類似度を出力するパ
ターンマッチング手段と、前記辞書情報の登録や通常コ
ピー動作の情報を前記ドライバ手段から入力を行うドラ
イバ情報入力手段と、前記パターンマッチング手段から
の情報と、前記コマンド情報入力手段の情報とを受け
て、通常コピーの場合は、入力された前記音声コマンド
がいずれのコマンドに該当するかを判断し、コマンド出
力手段に送るコマンド処理手段と、前記コマンド処理手
段からのコマンド情報を、通常コピーの場合はドライバ
手段や操作手段のモード表示部分へ送るコマンド出力手
段と、より成ることを特徴とする前項(1)記載の音声
コマンド認識画像処理装置。
【0013】(3)前記音声コマンド認識画像処理装置
は、前記辞書データ蓄積手段にデータを登録する際に、
実際に操作しながら前記音声データの登録を行うことを
特徴とする前項(1)、(2)のいずれか記載の音声コ
マンド認識画像処理装置。
【0014】(4)前記音声コマンド認識画像処理装置
は、前記音声データを登録する際に、前記辞書データ蓄
積手段にデータに既登録のデータと同一データを登録し
ようとした場合、その旨を使用者に報知することを特徴
とする前項(1)、(2)、(3)のいずれか記載の音
声コマンド認識画像処理装置。
【0015】(5)前記音声コマンド認識画像処理装置
は、前記音声により設定を行う際に、未登録のコマンド
を前記音声により設定しようとした場合、その未登録の
旨を使用者に報知することを特徴とする前項(1)ない
し(4)のいずれか記載の音声コマンド認識画像処理装
置。
【0016】(6)前記音声コマンド認識画像処理装置
は、前記音声により設定を行う際に、その音声入力され
たコマンドが複数のコマンドと類似していた場合、それ
らのコマンドを報知し、使用者に選択を促すことを特徴
とする前項(1)ないし(5)のいずれか記載の音声コ
マンド認識画像処理装置。
【0017】
【作用】以上のような本発明構成により、前記問題点を
解決した、新しい音声によるコマンド入力を行うことが
できる。すなわち、 1)辞書データに参照するデータを登録する際は、実際
に操作部のボタン等を押し乍ら登録することによって登
録を行い、次回同じコマンドを使用する時には、音声の
みで操作ができるようにすることによって、予め時間を
割いて各使用者が全てのコマンドの登録を行う必要がな
くなると共に、その機械を使用する各人が頻繁に使用す
るコマンドのみを登録することができる。これによって
辞書に使用する記憶媒体の容量の削減を実現し得る。
【0018】2)また、データ登録を行う際にも、パタ
ーンマッチングを行い、既登録のコマンドと同じコマン
ドを入力した時や、類似したコマンド、類似した音声が
入力された場合には、表示や警告音等によって使用者に
報知することにより、登録しようとしたコマンドが、正
当に入力されるべきものであるか否かを確認することが
できる。
【0019】3)また、音声による使用者の認識を行う
際に、登録してある辞書データに、ある程度類似度の高
いものが複数あった場合には、他の判定要素、例えば指
紋や掌紋などによって、より正確に認識を行うようにす
ることにより、音声のみで使用者の認識を行うより、さ
らに正確に個人の識別を行うことが可能となる。
【0020】
【発明の実施の形態】以下に、本発明の実施の形態を、
複数の実施例に基づき、それぞれ図面を参照して詳細に
説明する。
【0021】
【実施例】(第1の実施例)本発明に関る画像処理装置
の具体的な第1の実施例を、複写機の事例を用いて説明
する。図1に、本第1実施例の複写機の構成ブロック図
を示す(図1は、後述する第2〜第5実施例にも共用す
るものとする)。
【0022】101は操作部で、図8にその具体的な平
面図例を示すように、各スイッチやボタン、テンキー、
液晶タッチパネル等によりコピー操作やファクシミリの
送信等のコマンドの入力等を行う。図8における個々の
構成要素の説明は、それぞれ図示註記に渡り、重複説明
は省略する。
【0023】102はドライバ部で、CPU等の処理装
置を使用し、操作部101からのコマンドによって、画
像処理の設定やプリント枚数等の設定を行い、スキャナ
部103、画像処理部104、プリンタ部105等の動
作の制御を行う。
【0024】103は画像入力部で、CCD等を使用
し、ドライバ部102からの制御によって、原稿の画像
データをデジタルデータに変換し、画像処理部104へ
と出力する。
【0025】104は画像処理部で、ASIC等のハー
ド回路や、CPU等を使用したソフト的な処理等によっ
て、画像入力部103から入力されてくるデジタル画像
データを、ドライバ部102からの画像処理の設定に応
じて処理を行い、画像出力部105に出力を行う。
【0026】105は画像出力部で、画像処理部104
によって処理が行われた画像データを、レーザプリンタ
やインクジェットプリンタ等のプリンタによって出力を
行ったり、ブラウン管モニタや液晶モニタ、または操作
部101に使用されているタッチパネル等に出力を行
う。また、画像データとしてネットワーク上に出力を行
ったり、モデムを介してファクシミリ送信を行うのもこ
の部分とする。
【0027】106は音声入力部で、マイクロホン等を
使用し、音声の入力を行い、デジタルデータとして音声
認識部に送る。
【0028】107は音声認識部で、音声入力部106
からの音声データを入力し、辞書データへの登録や音声
のパターンマッチング、コマンドへの変換等を行う。変
換されたコマンドは、操作部101からのコマンドと同
様に、ドライバ部102へと送られる。
【0029】次に、本発明の特徴である音声認識部10
7についての詳細な説明を、その内部処理構成ブロック
図を示す図2を用いて行う(本図も図1と共に、後述す
る第2〜第5実施例にも共用するものとする)。
【0030】201は音声データ入力部で、この音声入
力部201からのデジタル音声データを入力する。
【0031】202は操作部情報入力部で、操作部10
1から入力されたコマンド情報の入力を行う。
【0032】203は辞書データ蓄積部で、操作部情報
と音声データとを対応させて、メモリやハードディスク
等の記憶媒体に記憶しておく。
【0033】204はパターンマッチング部で、音声デ
ータ入力部201からのデータと、辞書データ蓄積部2
03からの音声辞書データとのパターンマッチングを行
い、各コマンドに対する類似度を出力する。
【0034】例えば、入力された音声データが、「いち
まい」であったとき、音声辞書データの「いちまい」と
の類似度は100、「はちまい」との類似度は80、
「さんまい」との類似度は30、「コピー」との類似度
は5、などと出力を行う。
【0035】205はドライバ情報入力部で、辞書情報
の登録や通常コピー動作等の情報をドライバ部102か
ら入力を行う。
【0036】206はコマンド処理部で、パターンマッ
チング部204からの情報とコマンド情報入力部205
の情報とを受けて、通常コピーの場合は、入力された音
声コマンドがいずれのコマンドに相当するかを判断し、
コマンド出力部207に送る。また、辞書情報の登録時
には、類似度の高いコマンドのいくつかをコマンド出力
部207に送る等の処理を行う。
【0037】207はコマンド出力部で、コマンド処理
部206からのコマンド情報を、通常コピーの場合はド
ライバ部102や操作部101のモード表示部分へ送
る。また、辞書情報の登録時には、類似したコマンドや
警告音を発生する信号を操作部101へ送る。
【0038】次に具体的な例を挙げて処理内容を説明す
る:音声コマンドの登録を行う際には、実際に所定のキ
ーを押し乍ら発声を行う。この時、音声データ入力部2
01からは、その時の音声データが、また、操作部情報
入力部202からは、その時押されているキーの情報が
入力される。
【0039】例えば、「白黒コピーを1枚」行う時に
は、図8の「コピー」キーを押しながら、「コピー」と
発声する。すると、操作部101からドライバ部102
に「コピー」というコマンドが伝えられると共に、音声
認識部107の操作部情報入力部202にも同様にコマ
ンドが伝えられる。
【0040】また、音声入力部106からの音声データ
は、音声データ入力部201に入力され、コマンド情報
と共に辞書データ蓄積部203に入力される。辞書デー
タ蓄積部203では、「コピー」というコマンドに対応
して、入力された音声データを記憶しておく。
【0041】以下、同様に「白黒」というコマンドと音
声データ、「1枚」というコマンドと音声データを登録
すると同時に設定を行っていく。
【0042】スタートキーを押しながら、「スタート」
と発声することによって、「スタート」という音声コマ
ンドが登録されると共に、コピー出力を行うことができ
る。
【0043】以上の作業により、実際にコピーを行いな
がら「コピー」、「白黒」、「1枚」、「スタート」と
いった音声コマンドが登録される。
【0044】以上の音声コマンド登録時の動作シーケン
スフローチャートは、図3のシーケンス実線矢印部分に
該当する。音声入力(ステップS301)を、図2の音
声データ入力部201で行い、その時の操作部の状況を
操作部状況入力部202で検知し、キー入力が同時に行
われているか否かの判断を行う(ステップS302)。
【0045】キー入力が同時に行われている場合、音声
データ登録モード(ステップS303)となる。パター
ンマッチング部204によって音声データのパターンマ
ッチングを行い(ステップS304)、類似コマンドが
無かった場合(ステップS305)には、入力された音
声データをコマンドとして辞書データ蓄積部203に登
録し(ステップS306)、そのコマンドを実行(ステ
ップS307)する。
【0046】なお、以上の各ステップにおけるNOを示
すシーケンス点線矢印で示す各ステップの逐次詳細説明
は、図示の通りであり逐次詳細の重複説明は省略する。
【0047】以上の方法によって登録されたコマンド
は、キー操作を行わなくても音声のみで使用することが
できることとなる。
【0048】つまり、白黒コピーを1枚採りたい場合、
「コピー」と発声すれば「コピー」モードとなり、「白
黒」と発声することによって「白黒」モードになる。そ
の後、「1枚」、「スタート」と発声することによっ
て、白黒コピーの動作を行うことができる。
【0049】この時の音声コマンド実行時の動作シーケ
ンスフローチャートは、図4のシーケンス実線矢印部分
に該当する。音声入力(ステップS401)を図2の音
声データ入力部201で行い、その時の操作部101の
状況を操作部状況入力部202で検知し、キー入力が同
時に行われているか否かの判断を行う(ステップS40
2)。
【0050】キー入力が同時に行われていない場合、音
声データ実行モード(ステップS403)となる。パタ
ーンマッチング部204によって音声データのパターン
マッチングを行い(ステップS404)、登録されてい
るコマンドに類似したものが1つだけあった場合(ステ
ップS405・S406)には、入力された音声データ
をコマンドとして実行(ステップS407)する。
【0051】このときの音声コマンドの認識について、
詳細に説明する:音声コマンドの認識は、図2の音声デ
ータ入力部201からの音声データと、辞書データ蓄積
部203に格納してある音声データとのパターンマッチ
ングを、パターンマッチング部204によって行い、各
コマンドとの類似度を算出しコマンド処理部206に出
力する。この場合、登録してある辞書データと完全に一
致していた場合、類似度を100とする。
【0052】例えば、「白黒」といった音声データ入力
があった場合、辞書データ蓄積部203にある音声辞書
データの「白黒」とは一致度が95、「コピー」との一
致度は5、「1枚」との一致度は10、「スタート」と
の一致度は5、などといった情報がコマンド処理部20
6に送られる。
【0053】コマンド処理部206では、最も一致度の
高いものを音声入力されたコマンドと判断して、コマン
ド出力部207に送る。
【0054】コマンド出力部207では、そのコマンド
をドライバ部102に送ることによって、本体の設定を
行うこととなる。
【0055】上記2つの動作フロー図3、4の組み合わ
せにより、次回カラーコピーを1枚とる場合、「コピ
ー」と発声すれば「コピー」モードとなり、「カラー」
と発音しながら「カラー」キーを押すことによって「カ
ラー」モードになると共に、新たに「カラー」という音
声コマンドを登録する。
【0056】その後「1枚」、「スタート」と発声する
ことによって、「カラー」という発声コマンドを新たに
登録すると共に、カラーコピーの動作をも行うことがで
きる。
【0057】以上のように音声コマンドのデータ入力を
行うことによって、必要なコマンドを、必要な時に登録
することができ、普段は使用しないコマンドの登録を防
止することによって、辞書データ登録部203に使用す
る記憶媒体の容量増大を抑制することができる。
【0058】なお、本実施例の音声コマンド実行時の図
4各ステップにおける各シーケンス点線矢印で示す各ス
テップの逐次詳細説明は、図示の通りであり、逐次詳細
の重複説明は省略する。
【0059】(第2の実施例)本発明に係る第2の実施
例を、それぞれ図1、図2を共用して説明する:もし、
音声コマンドとして登録されていないコマンドが入力さ
れた時の処理は、以下のようになる。
【0060】まず、音声コマンドは図1、2における操
作部101のキー図8が押されない状態で入力されるこ
とによって、新たな音声コマンドの登録ではないと判断
できる。
【0061】次に、図2におけるパターマッチング部2
04によって登録されている音声辞書データとのパター
ンマッチングを行い、各コマンドとの類似度を算出しコ
マンド処理部206に送る。
【0062】この場合、登録されているコマンドとは異
なるため、類似度は全て低い値となる。完全に一致して
いる場合、類似度を100とした場合に、80以上をコ
マンドの候補、80未満は登録されていないコマンドの
入力と判断すると、全てのマッチングを行った結果、登
録されているコマンドの候補は無い状態となる。
【0063】そのような場合、コマンド処理部によって
入力された音声データは、登録されていないものと判断
し、コマンド出力部207から、操作部101の液晶表
示部に「未登録です。登録するキーを押して下さい。」
の表示を行うことによって、使用者に報知するようにド
ライバ部102に情報を送る。
【0064】使用者は、未登録であることを確認した
後、操作部101のキーを押すことにより新たにコマン
ドを登録することとなり、また同時にそのコマンドは実
行され、次の処理に進む。
【0065】以上の本第2実施例の音声登録時の動作シ
ーケンスフローチャートは、図5のシーケンス実線矢印
部分に該当する。音声入力(ステップS501)を図2
の音声データ入力部201で行い、その時の操作部10
1の状況を操作部状況入力部202で検知し、キー入力
が同時に行われているか否かの判断を行う(ステップS
502)。
【0066】キー入力が同時に行われていない場合、音
声データ実行モード(ステップS503)となる。パタ
ーンマッチング部204によって音声データのパターン
マッチングを行い(ステップS504)、類似コマンド
が無かった場合(ステップS506)には、コマンドが
未登録であることを使用者にメッセージとして操作部1
01から表示し(ステップS506)、その後キー入力
のあったキーを音声コマンドとして登録する(ステップ
S507)。それと共にコマンドを実行する(ステップ
S508)。
【0067】以上のように、音声コマンドのデータ入力
を行うことによって、音声コマンドとして登録されてい
ないコマンドが音声入力されたときに簡単に新たなコマ
ンドとして登録することができる。
【0068】本第2実施例の音声コマンド登録時図5の
各ステップにおける各シーケンス点線矢印で示す各ステ
ップの逐次詳細説明は図示の通りであり、逐次詳細の重
複説明は省略する。
【0069】(第3の実施例)次に本発明の第3の実施
例をそれぞれ前記図1、図2を共用して説明する:音声
コマンドの登録を行う場合、既に登録されているコマン
ドを更に登録しようとしてしまった時の動作について説
明する。
【0070】まず、音声コマンドが操作部101のキー
が押された状態で入力されることによって、新たな音声
コマンドの登録であると判断する。
【0071】次に、パターンマッチング部204によっ
て登録されている音声辞書データとのパターンマッチン
グを行い、各コマンドとの類似度を算出し、コマンド処
理部206に送る。
【0072】この場合、既に登録されているコマンドで
ある場合、類似度の高い値となるコマンドが存在するこ
ととなる。
【0073】そのような場合、コマンド出力部207か
ら、操作部101の液晶表示部(図8)に、類似度の高
かったコマンドを表示することによって、使用者に確認
を促すように、ドライバ部102に情報を送る。
【0074】具体例を挙げると、「1枚」というコマン
ドが既に登録されているにもかかわらず、再び登録しよ
うとした場合、使用者は操作部101のキー(図8)を
押しながら「1枚」と発声する。
【0075】前記第1の実施例において説明した方法と
同様に、音声認識部107によってパターンマッチング
を行い、類似度の算出を行うと、「1枚」というコマン
ドの類似度が90となり、80以上をコマンドの候補、
80未満は登録されていないコマンドの入力と判断する
と、それはすでに登録されているコマンドと判断され
る。
【0076】このような場合、図9にその一例を示すよ
うに液晶タッチパネル(図8)の表示部に「今のコマン
ドは「1枚」ですか?」という表示と「YES」、「N
O」の選択を行う表示とを行い、使用者に登録済みのデ
ータと類似していることを報知する。
【0077】「YES」のキーを押すことによって、使
用者は、既に登録されていることが確認できると共に、
ドライバ部102は、入力されたコマンドを受け付け
て、その後の処理を行うこととする。「NO」の場合は
再登録となる。
【0078】以上の動作シーケンスフローチャートは、
図6のシーケンス実線矢印部分に該当する。音声入力
(ステップS601)を音声データ入力部201で行
い、その時の操作部101の状況を操作部情報入力部2
02で検知し、キー入力が同時に行われているか否かの
判断を行う(ステップS602)。
【0079】キー入力が同時に行われている場合、音声
データ登録モード(ステップS603)となる。パター
ンマッチング部204によって音声データのパターンマ
ッチングを行い(ステップS604)、類似コマンドが
あった場合(ステップS605)には、コマンドが登録
済みであることを使用者にメッセージとして操作部10
1から示し(ステップS606)、その後「YES」の
キー入力があったら(ステップS607)、コマンドを
実行する(ステップS608)。
【0080】以上のように、音声コマンドのデータ処理
を行うことによって、すでに登録されているコマンドを
更に登録しようとしてしまった時に、2重に登録してし
まうことを防止することができる。
【0081】なお、本第3実施例の音声コマンド登録時
の図6各ステップにおけるシーケンス点線矢印で示す各
ステップの逐次詳細説明は、図示の通りであり、逐次詳
細の重複説明は省略する。
【0082】(第4の実施例)次に本発明に係る第4の
実施例を、それぞれ図1、図2を共用して説明する:未
登録のコマンドを登録しようとした場合、既に登録され
ているコマンドと類似している音声データが入力された
時の動作について説明する。
【0083】まず、音声コマンドが操作部101のキー
が押された状態で入力されることによって、新たな音声
コマンドの登録であると判断する。
【0084】次に、パターンマッチング部204によっ
て登録されている音声辞書データとのパターンマッチン
グを行い、各コマンドとの類似度を算出し、コマンド処
理部206に送る。
【0085】この場合、既に登録されているコマンド
で、類似度の高い値となるコマンドが存在した場合、コ
マンド出力部207から、操作部101の液晶表示部
(図8)に、類似度の高かったコマンドを表示すること
によって使用者に確認を促すように、ドライバ部102
に情報を送る。
【0086】具体例を挙げると、「8枚」というコマン
ドを新たに登録しようとした場合、使用者は操作部10
1のキー(図8)を押しながら「8枚」と発音する。し
かしながら、音声の仕方により、すでに登録済みの「1
枚」という音声コマンド共、類似度が大きくなったとす
る。
【0087】前記第1の実施例において説明した方法と
同様に、音声認識部107によってパターンマッチング
を行い、類似度の算出を行うと、「1枚」というコマン
ドの類似度が85となり、80以上をコマンドの候補、
80未満は登録されていないコマンドの入力と判断する
と、それは既に登録されているコマンドと同じレベルの
類似度と判断される。
【0088】この場合、その後音声によるコマンド入力
を行おうとした際に、誤認識し易くなる。
【0089】このような場合、図10にその一例を示す
ように、液晶タッチパネル(図8)の表示部に「今のコ
マンドは「1枚」と類似しています。登録し直しますか
?」という表示と「YES」、「NO」の選択を行う表
示とを行い、使用者に登録済みのデータと類似している
ことを報知する。
【0090】「YES」のキーを選択すると、再登録を
行うこととなるし、「NO」のキーを押すと、そのまま
音声コマンドの登録を行うと共に、ドライバ部102
は、入力されたコマンドを受け付けて、その後の処理を
行うこととする。
【0091】以上の動作シーケンスのフローチャート
は、前記第3実施例の図6の実線部分と同様にできる。
音声入力(ステップS601)を音声データ入力部20
1で行い、その時の操作部101の状況を操作部状況入
力部202で検知し、キー入力が同時に行われているか
否かの判断を行う(ステップS602)。
【0092】キー入力が同時に行われている場合、音声
データ登録モード(ステップS603)となる。パター
ンマッチング部204によって音声データのパターンマ
ッチングを行い(ステップS604)、類似コマンドが
あった場合(ステップS605)には、類似したコマン
ドが登録済みであることを使用者にメッセージとして操
作部101から示し(ステップS606)、その後キー
入力のあったキーを音声データと対応したコマンドとし
て登録し(ステップS607)、コマンドを実行する
(ステップS608)。
【0093】以上のように、音声コマンドのデータ処理
を行うことによって、新たに登録しようとした音声デー
タが既に登録されているコマンドと類似していた時に
も、正確に登録を行うことができる。
【0094】なお、本第4実施例においても、各シーケ
ンスの点線矢印で示す各ステップの詳細は、前記第3実
施例におけると同様、詳細重複説明は省略する。
【0095】(第5の実施例)さらに、本発明に係る第
5の実施例を、それぞれ図1、2を共用して説明する:
音声コマンドの認識を行う場合、音声入力されたコマン
ドに対して、複数の類似したコマンドの候補が出てしま
い、使用者の意志に反した動作をしてしまうことがあ
る。そのような誤動作を防ぐために、以下のような処理
を行う。
【0096】まず、音声コマンドは、操作部101(図
2、図8)のキーが押されない状態で入力されることに
よって、音声コマンドによる設定であると判断する。
【0097】次に、パターンマッチング部204(図
2)によって登録されている音声辞書データとのパター
ンマッチングを行い、各コマンドとの類似度を算出し、
コマンド処理部206に送る。
【0098】この場合、実際に設定したいコマンドと類
似した音声入力がなされた場合、類似度の高い値となる
コマンドが複数存在することとなる。
【0099】そのような場合、コマンド出力部207か
ら、操作部101の液晶表示部に、類似度の高かった複
数のコマンドを表示することによって、使用者に選択を
促すようにドライバ部102に情報を送る。
【0100】具体例を挙げると、「一枚」というコマン
ドを設定したいと思い、使用者は「1枚」と発音する。
【0101】しかしながら、登録時との発音の違い等に
より、仮に、「8枚」という音声コマンドとも類似度が
大きくなったとする。
【0102】前記第1の実施例において説明した方法と
同様に、音声認識部107によってパターンマッチング
を行い、類似度の算出を行うと、「1枚」と云うコマン
ドの類似度が90となり、「8枚」と云うコマンドの類
似度が85となったとする。類似度が80以上をコマン
ドの候補、80未満は登録されていないコマンドの入力
と判断すると、両方共コマンドの候補として挙げられる
と判断される。
【0103】このような場合、図11にその一例を示す
ように、液晶タッチパネルの表示部に「今のコマンドは
どちらですか?1:「1枚」・2:「8枚」」と表示を
行い、使用者にどちらのコマンドか選択して貰う。それ
によって選択された設定をドライバ部102は、入力さ
れたコマンドとして、その後の処理を行うこととする。
【0104】以上の動作シーケンスフローチャートは、
図7動作シーケンス実線矢印部分のようになる。(前記
第3、4実施例の図6の破線矢印部分の一部に相当す
る)。音声入力(ステップS701)を音声データ入力
部201(図2)で行い、その時の操作部101の状況
を操作部状況入力部202で検知し、キー入力が同時に
行われているか否かの判断を行う(ステップS70
2)。キー入力が同時に行われていない場合、音声デー
実行モード(ステップS703)となる。パターンマッ
チング部204によって音声データのパターンマッチン
グを行い(ステップS704)、類似コマンドが複数あ
った場合、(ステップS705・S706)には、類似
した複数のコマンドが登録済みであることを使用者にメ
ッセージとして操作部101から示し(ステップS70
7)、その後キー入力によって指定されたコマンド(ス
テップS708)を実行コマンドとして実行する(ステ
ップS709)。
【0105】以上のように、音声コマンドのデータ処理
を行うことによって、入力された音声コマンドとの類似
度が高いものが複数登録されてた場合も、正確な設定が
できることとなる。
【0106】
【発明の効果】以上説明したように、本発明によれば、
前記音声によるコマンドの認識を行い動作する画像処理
装置において、辞書データ蓄積手段にデータを登録する
際に、実際に操作し乍ら音声データの登録を行うことが
必要なコマンドを、必要な時に登録することができ、普
段は使用しないコマンドの登録を防止することによっ
て、辞書データ蓄積手段に使用する記憶媒体の容量を抑
えることが可能となる。
【0107】また音声データを登録する際に、前記辞書
データ蓄積手段のデータに、既に登録されているデータ
と同じデータを登録しようとした場合、そのことを使用
者に表示することによって、2重のデータ登録を防ぐこ
とが可能となる。
【0108】また、音声によって設定を行う際に、未登
録のコマンドを音声によって設定しようとした場合、未
登録であることを使用者に表示し、その都度、登録を行
っていくことが可能となる。
【0109】さらにまた、音声によって設定を行う際
に、音声入力されたコマンドが、複数のコマンドと類似
していた場合、それらのコマンドを表示し、使用者に選
択を促すことにより、正確なコマンド入力が可能とな
る。
【図面の簡単な説明】
【図1】 各実施例の複写機の構成ブロック図
【図2】 図1の音声認識部の内部処理構成ブロック図
【図3】 第1実施例の音声コマンド登録時の動作シー
ケンスフローチャート
【図4】 第1実施例の音声コマンド実行時の動作シー
ケンスフローチャートを示す図である
【図5】 第2実施例の音声コマンド登録時の動作シー
ケンスフローチャート
【図6】 第3、第4実施例の音声コマンド登録時の動
作シーケンスフローチャート
【図7】 第5実施例の音声コマンド登録時の動作シー
ケンスフローチャート
【図8】 図1複写機の操作部平面図例
【図9】 第3実施例の操作部の液晶タッチパネルの表
示例
【図10】 第4の実施例の操作部の液晶タッチパネル
の表示例
【図11】 第5の実施例の操作部の液晶タッチパネル
の表示例
【符号の説明】
101 操作部 102 ドライバ部 103 画像入力部 104 画像処理部 105 画像出力部 106 音声入力部 107 音声認識部 201 音声データ入力部 202 操作部情報入力部 203 辞書データ蓄積部 204 パターンマッチング部 205 ドライバ情報入力部 206 コマンド処理部 207 コマンド出力部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 1/00 G06F 3/16 320B // G06F 3/16 320 B41J 29/00 J Fターム(参考) 2C061 AP01 AP03 AP04 AP07 AQ05 AQ06 CQ02 CQ04 CQ24 CQ25 2H027 GA19 GA20 GA25 GA26 ZA07 5B021 AA05 AA19 CC05 PP04 PP06 QQ02 QQ04 5C062 AA02 AA05 AB02 AB11 AB20 AB25 AB26 AB41 AB42 AC02 AC03 AC05 AC21 AC60 AE11 AF07 AF15 BA00 5D015 GG04 KK01 LL00

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 スイッチやボタン、テンキー、液晶タッ
    チパネル等により、コピー操作やファクシミリの送信等
    のコマンドの入力を行う操作手段と、 CPU等の処理装置を使用し、前記操作手段からのコマ
    ンドにより画像処理の設定やプリント枚数等の設定を行
    い、画像入力手段、画像処理手段、画像出力手段等の動
    作の制御を行うドライバ手段と、 CCD等を使用し、前記ドライバ手段からの制御によ
    り、原稿の画像データをデジタルデータに変換し、画像
    処理部へ出力する画像入力手段と、 ASIC等のハード回路や、前記CPU等を使用したソ
    フト的な処理等により、前記画像入力手段から入力され
    るデジタル画像データを、前記ドライバ手段からの画像
    処理の設定に応じて処理を行い、前記画像出力手段に出
    力を行う画像処理手段と、 前記画像処理手段により処理された画像データを、レー
    ザプリンタやインクジェットプリンタ等のプリンタによ
    って出力を行う画像出力手段であって、この部分はブラ
    ウン管モニタや液晶モニタ、または前記操作手段部に使
    用されている前記液晶タッチパネルに表示を行ったり、
    画像データとしてネットワーク上への出力、モデムを介
    してファクシミリ送信等を行うものも含む前記画像出力
    手段と、マイク等を使用し、音声の入力を行い、前記デ
    ジタルデータとして音声認識手段に送る音声入力手段
    と、前記音声入力手段からの音声データを入力し、辞書
    データへの登録や音声のパターンマッチング、コマンド
    への変換等を行う音声認識手段と、 より構成され、前記音声によるコマンドの認識を行い動
    作することを特徴とする音声コマンド認識画像処理装
    置。
  2. 【請求項2】 前記音声認識手段は、 前記音声入力手段からのデジタル音声データを入力する
    音声データ入力手段と、 前記操作手段から入力されたコマンド情報の入力を行う
    操作部情報入力手段と、 前記操作手段部情報と前記音声データとを対応させて、
    メモリやハードディスク等の記憶媒体に記憶しておく辞
    書データ蓄積手段と、 前記音声データ入力手段からのデータと、前記辞書デー
    タ蓄積手段からの音声辞書データとのパターンマッチン
    グを行い、各コマンドに対する類似度を出力するパター
    ンマッチング手段と、 前記辞書情報の登録や通常コピー動作の情報を前記ドラ
    イバ手段から入力を行うドライバ情報入力手段と、 前記パターンマッチング手段からの情報と、前記コマン
    ド情報入力手段の情報とを受けて、通常コピーの場合
    は、入力された前記音声コマンドがいずれのコマンドに
    該当するかを判断し、コマンド出力手段に送るコマンド
    処理手段と、 前記コマンド処理手段からのコマンド情報を、通常コピ
    ーの場合はドライバ手段や操作手段のモード表示部分へ
    送るコマンド出力手段と、 より成ることを特徴とする請求項1記載の音声コマンド
    認識画像処理装置。
  3. 【請求項3】 前記音声コマンド認識画像処理装置は、
    前記辞書データ蓄積手段にデータを登録する際に、実際
    に操作しながら前記音声データの登録を行うことを特徴
    とする請求項1、2のいずれか記載の音声コマンド認識
    画像処理装置。
  4. 【請求項4】 前記音声コマンド認識画像処理装置は、
    前記音声データを登録する際に、前記辞書データ蓄積手
    段にデータに既登録のデータと同一データを登録しよう
    とした場合、その旨を使用者に報知することを特徴とす
    る請求項1、2、3のいずれか記載の音声コマンド認識
    画像処理装置。
  5. 【請求項5】 前記音声コマンド認識画像処理装置は、
    前記音声により設定を行う際に、未登録のコマンドを前
    記音声により設定しようとした場合、その未登録の旨を
    使用者に報知することを特徴とする請求項1ないし4の
    いずれか記載の音声コマンド認識画像処理装置。
  6. 【請求項6】 前記音声コマンド認識画像処理装置は、
    前記音声により設定を行う際に、その音声入力されたコ
    マンドが複数のコマンドと類似していた場合、それらの
    コマンドを報知し、使用者に選択を促すことを特徴とす
    る請求項1ないし5のいずれか記載の音声コマンド認識
    画像処理装置。
JP19306998A 1998-07-08 1998-07-08 音声コマンド認識画像処理装置 Withdrawn JP2000029585A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19306998A JP2000029585A (ja) 1998-07-08 1998-07-08 音声コマンド認識画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19306998A JP2000029585A (ja) 1998-07-08 1998-07-08 音声コマンド認識画像処理装置

Publications (1)

Publication Number Publication Date
JP2000029585A true JP2000029585A (ja) 2000-01-28

Family

ID=16301697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19306998A Withdrawn JP2000029585A (ja) 1998-07-08 1998-07-08 音声コマンド認識画像処理装置

Country Status (1)

Country Link
JP (1) JP2000029585A (ja)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000215022A (ja) * 1998-12-17 2000-08-04 Internatl Business Mach Corp <Ibm> コンピュ―タ制御対話式表示システム、音声コマンド入力方法および記録媒体
JP2002007015A (ja) * 2000-06-22 2002-01-11 Sharp Corp 情報処理装置およびコンピュータ読み取り可能な記憶媒体
JP2003241790A (ja) * 2002-02-13 2003-08-29 Internatl Business Mach Corp <Ibm> 音声コマンド処理システム、コンピュータ装置、音声コマンド処理方法およびプログラム
JP2004179780A (ja) * 2002-11-25 2004-06-24 Canon Inc 画像処理装置
WO2005055198A1 (en) * 2003-12-04 2005-06-16 Toyota Infotechnology Center Co., Ltd. Shortcut names for use in a speech recognition system
JP2006514753A (ja) * 2003-03-25 2006-05-11 シーメンス アクチエンゲゼルシヤフト 話者に依存する音声認識方法および音声認識システム
US7231343B1 (en) 2001-12-20 2007-06-12 Ianywhere Solutions, Inc. Synonyms mechanism for natural language systems
JP2008003371A (ja) * 2006-06-23 2008-01-10 Alpine Electronics Inc 車載用音声認識装置及び音声コマンド登録方法
JP2010224890A (ja) * 2009-03-24 2010-10-07 Konica Minolta Business Technologies Inc 操作画面制御装置、画像形成装置、およびコンピュータプログラム
JP2011150740A (ja) * 2000-05-03 2011-08-04 Nokia Corp 少なくとも1つのアプリケーションデバイスを有する電気/電子システムを制御する方法
JP2012118679A (ja) * 2010-11-30 2012-06-21 Nec Commun Syst Ltd 情報処理装置、単語判別装置、画面表示操作装置、単語登録装置およびこれらに関する方法ならびにプログラム
JP2014132461A (ja) * 2013-01-07 2014-07-17 Samsung Electronics Co Ltd 電子装置でコンテンツを制御する装置及びその方法
JP2018173754A (ja) * 2017-03-31 2018-11-08 ブラザー工業株式会社 情報処理プログラム、情報処理装置、および情報処理装置の制御方法
CN109584862A (zh) * 2017-09-29 2019-04-05 上海寒武纪信息科技有限公司 图像处理装置和方法
CN109584864A (zh) * 2017-09-29 2019-04-05 上海寒武纪信息科技有限公司 图像处理装置和方法
JP2020080052A (ja) * 2018-11-13 2020-05-28 コニカミノルタ株式会社 システム、画像形成装置、方法およびプログラム
US11310374B2 (en) 2018-10-02 2022-04-19 Sharp Kabushiki Kaisha System and processing apparatus

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000215022A (ja) * 1998-12-17 2000-08-04 Internatl Business Mach Corp <Ibm> コンピュ―タ制御対話式表示システム、音声コマンド入力方法および記録媒体
US9772739B2 (en) 2000-05-03 2017-09-26 Nokia Technologies Oy Method for controlling a system, especially an electrical and/or electronic system comprising at least one application device
JP2011150740A (ja) * 2000-05-03 2011-08-04 Nokia Corp 少なくとも1つのアプリケーションデバイスを有する電気/電子システムを制御する方法
JP2002007015A (ja) * 2000-06-22 2002-01-11 Sharp Corp 情報処理装置およびコンピュータ読み取り可能な記憶媒体
US7231343B1 (en) 2001-12-20 2007-06-12 Ianywhere Solutions, Inc. Synonyms mechanism for natural language systems
US7299187B2 (en) 2002-02-13 2007-11-20 International Business Machines Corporation Voice command processing system and computer therefor, and voice command processing method
JP2003241790A (ja) * 2002-02-13 2003-08-29 Internatl Business Mach Corp <Ibm> 音声コマンド処理システム、コンピュータ装置、音声コマンド処理方法およびプログラム
JP2004179780A (ja) * 2002-11-25 2004-06-24 Canon Inc 画像処理装置
US7480073B2 (en) 2002-11-25 2009-01-20 Canon Kabushiki Kaisha Image processing apparatus, method and program
JP2009211103A (ja) * 2003-03-25 2009-09-17 Siemens Ag 話者に依存して音声を認識する方法および音声認識システム
JP2006514753A (ja) * 2003-03-25 2006-05-11 シーメンス アクチエンゲゼルシヤフト 話者に依存する音声認識方法および音声認識システム
US7835913B2 (en) 2003-03-25 2010-11-16 Siemens Aktiengesellschaft Speaker-dependent voice recognition method and voice recognition system
US7292978B2 (en) 2003-12-04 2007-11-06 Toyota Infotechnology Center Co., Ltd. Shortcut names for use in a speech recognition system
WO2005055198A1 (en) * 2003-12-04 2005-06-16 Toyota Infotechnology Center Co., Ltd. Shortcut names for use in a speech recognition system
JP2008003371A (ja) * 2006-06-23 2008-01-10 Alpine Electronics Inc 車載用音声認識装置及び音声コマンド登録方法
JP2010224890A (ja) * 2009-03-24 2010-10-07 Konica Minolta Business Technologies Inc 操作画面制御装置、画像形成装置、およびコンピュータプログラム
JP2012118679A (ja) * 2010-11-30 2012-06-21 Nec Commun Syst Ltd 情報処理装置、単語判別装置、画面表示操作装置、単語登録装置およびこれらに関する方法ならびにプログラム
JP2014132461A (ja) * 2013-01-07 2014-07-17 Samsung Electronics Co Ltd 電子装置でコンテンツを制御する装置及びその方法
JP2018173754A (ja) * 2017-03-31 2018-11-08 ブラザー工業株式会社 情報処理プログラム、情報処理装置、および情報処理装置の制御方法
US11210061B2 (en) 2017-03-31 2021-12-28 Brother Kogyo Kabushiki Kaisha Non-transitory computer-readable recording medium storing computer-readable instructions for causing information processing device to execute communication processing with image processing program and voice-recognition program, information processing device, and method of controlling information processing device
CN109584862A (zh) * 2017-09-29 2019-04-05 上海寒武纪信息科技有限公司 图像处理装置和方法
CN109584864A (zh) * 2017-09-29 2019-04-05 上海寒武纪信息科技有限公司 图像处理装置和方法
CN109584864B (zh) * 2017-09-29 2023-11-24 上海寒武纪信息科技有限公司 图像处理装置和方法
CN109584862B (zh) * 2017-09-29 2024-01-12 上海寒武纪信息科技有限公司 图像处理装置和方法
US11310374B2 (en) 2018-10-02 2022-04-19 Sharp Kabushiki Kaisha System and processing apparatus
JP2020080052A (ja) * 2018-11-13 2020-05-28 コニカミノルタ株式会社 システム、画像形成装置、方法およびプログラム
JP7206827B2 (ja) 2018-11-13 2023-01-18 コニカミノルタ株式会社 システム、画像形成装置、方法およびプログラム

Similar Documents

Publication Publication Date Title
JP2000029585A (ja) 音声コマンド認識画像処理装置
EP2437141B1 (en) Character input apparatus equipped with auto-complete function, method of controlling the character input apparatus, and storage medium
US11769485B2 (en) Job record specifying device, image processing apparatus, server, job record specifying method, and recording medium
TW486887B (en) Chinese pinyin method and apparatus by using only numerical keypad
US11140284B2 (en) Image forming system equipped with interactive agent function, method of controlling same, and storage medium
CN111263023A (zh) 信息处理***和方法、计算机装置以及存储介质
JP6171511B2 (ja) 制御装置、画像形成装置、携帯端末装置、制御方法、および制御プログラム
JP2007193138A (ja) 画像形成装置
TW550478B (en) Chinese character input method using numeric keys and apparatus thereof
JP2006330576A (ja) 機器操作システム、音声認識装置、電子機器、情報処理装置、プログラム、及び記録媒体
US20200267268A1 (en) Image forming apparatus, display control method, and recording medium
JP7409179B2 (ja) 情報処理装置及びプログラム
US12015746B2 (en) Image processing system, setting control method, image processing apparatus, and storage medium
US10310775B2 (en) Job processing apparatus, method of controlling job processing apparatus, and recording medium for audio guidance
JP5343652B2 (ja) 操作画面制御装置、画像形成装置、およびコンピュータプログラム
US10791230B2 (en) Image forming apparatus, instruction acceptance method, and computer readable program
JP2024074811A (ja) 情報処理装置及びプログラム
US20210398530A1 (en) Information processing apparatus that cooperates with smart speaker, information processing system, control methods, and storage media
US20060242331A1 (en) Information processing apparatus
US11823672B2 (en) Voice-operated system, controller, computer-readable recording medium, and processing device
EP3716040A1 (en) Image forming apparatus and job execution method
JP7284455B2 (ja) 装置
JP6822374B2 (ja) 画像形成装置
JP2000259172A (ja) 音声認識装置と音声データの認識方法
JP2021082857A (ja) 入力制御装置、画像形成装置及び入力制御方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20051004