JP4562547B2 - 画像形成装置、プログラムおよび記録媒体 - Google Patents

画像形成装置、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP4562547B2
JP4562547B2 JP2005046948A JP2005046948A JP4562547B2 JP 4562547 B2 JP4562547 B2 JP 4562547B2 JP 2005046948 A JP2005046948 A JP 2005046948A JP 2005046948 A JP2005046948 A JP 2005046948A JP 4562547 B2 JP4562547 B2 JP 4562547B2
Authority
JP
Japan
Prior art keywords
voice
item
image forming
voice recognition
forming apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005046948A
Other languages
English (en)
Other versions
JP2006235040A (ja
Inventor
喜永 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2005046948A priority Critical patent/JP4562547B2/ja
Publication of JP2006235040A publication Critical patent/JP2006235040A/ja
Application granted granted Critical
Publication of JP4562547B2 publication Critical patent/JP4562547B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Record Information Processing For Printing (AREA)
  • Control Or Security For Electrophotography (AREA)

Description

本発明は、視覚を使用しないで操作可能な画像形成装置、その画像形成装置の機能を実行するためのプログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
複写装置、ファクシミリ装置、プリンタ装置、スキャナ装置やそれらのOA機器が提供する機能を1台に統合した複合機(MFP:Multi−Functional Peripherals)の操作に対して、音声を使用した操作及び操作のガイダンスが行われる「非視覚モード」と、タッチパネルと液晶表示によって操作が行われる「視覚モード」とを有する画像形成装置については、特開2003−140880号公報(特許文献1)、特開2003−131773号公報(特許文献2)に記載されている。この装置における、「非視覚モード」は、機器の操作項目を機能グループ別に分類して、木構造メニューを作成し、このメニュー上の項目を音声情報を手がかりにして選択させる。この方法により、視覚に障害がある人がMFPを操作できるようにしている。
上述した特開2003−140880号公報(特許文献1)、特開2003−131773号公報(特許文献2)では、視覚を利用しない操作方法として、次の3つの操作方法があり、それらのいずれかを使用して装置の操作項目の選択を行うようになっている。
(1)木構造メニューで構成された装置を操作するための項目を、上下左右に1ステップずつ移動しながら、所望の項目にたどりつく方法。
(2)上記の各項目に番号を付しておき、その番号をテンキーで入力して直接該当する項目に移動する方法。
(3)装置を操作するための項目を音声で入力し、音声認識により直接該当する項目に移動する方法。
また、上記のいずれの操作方法を用いても項目が選択されると、装置側から利用者への確認用に選択された項目を音声で出力するようになっている。上記(3)の音声認識を用いる方法の場合、利用者が発声した音声を認識し、装置の機能項目を選択させ、選択した項目を装置から音声で復唱、出力させる。この復唱によって、使用者は項目が正しく選択されたかどうかを確認できる。
さらに、上記(3)の方法では、同じ機能をもつ項目に対して複数の発話内容を割り当てることによって、さらに操作性を向上できる。例えば、原稿画像を用紙の両面に複写する「両面コピー」の機能を選択する場合、「両面コピー」と「コピー両面」のどちらの発声も音声認識が受付けることによって、利用者の発話制限を軽減できる。
ところで、このような複数の発話を受付ける場合、従来のように機能に割り当てられた項目名を復唱用として音声出力してしまうと、次のような不都合が生じる場合がある。例えば、利用者が「コピー両面」と発声したのに、機器側からは、項目名である「両面コピー」と復唱されてしまうと、利用者は、正しい項目を選択できたのかどうかがわからずに、混乱するかもしれない。
他方で、特開平11−143489号公報(特許文献3)に開示されているように、利用者が発話した通りに復唱させることも考えられるが、上述の(1)〜(3)のように音声認識以外にも複数の操作方法が提供されている場合、同じ項目を選択しているにもかかわらず、音声認識を使用したときだけ出力される内容が他の方法と変わってしまうと、一貫性がなくなり、やはり、混乱のもととなる。
特開2003−140880号公報 特開2003−131773号公報 特開平11−143489号公報
本発明では、上記の問題を解決するため、視覚を使用しないで操作可能な画像形成装置、プログラム及びコンピュータ読み取り可能な記録媒体、特に音声認識による操作方法を利用した時に、利用者混乱なく操作内容を確実に確認できる画像形成装置、プログラム及びコンピュータ読み取り可能な記録媒体を提供することを目的とする
上記課題を解決するため、本発明は、第1の態様として、使用者から発声された音声を音声入力として認識する音声認識手段と、画像形成装置の機能項目を木構造のメニューとして管理し、操作制御の対象である現在位置を、前記音声認識手段により認識された前記音声入力に対応する前記メニュー上の項目に、移動する制御を行うメニュー管理手段と、前記移動する制御が行われた後に、前記音声認識手段により認識された前記音声入力の復唱を出力する第1の音声出力処理、及び、前記音声認識手段により認識された前記音声入力に対応する前記メニュー上の項目の項目名を出力する第2の音声出力処理を行う音声出力手段と、を備えることを特徴とする画像形成装置を提供するものである。
また、上記課題を解決するため、本発明は、第2の態様として、画像形成装置に、使用者から発声された音声を音声入力として認識する音声認識処理と、画像形成装置の機能項目を木構造のメニューとして管理するメニュー管理処理と、操作制御の対象である現在位置を、前記音声認識処理により認識された前記音声入力に対応する前記メニュー上の項目に、移動する処理と、前記移動する処理が行われた後に、前記音声認識処理により認識された前記音声入力の復唱を出力する第1の音声出力処理と、前記音声認識処理により認識された前記音声入力に対応する前記メニュー上の項目の項目名を出力する第2の音声出力処理と、を実行させることを特徴とするプログラムを提供するものである。
音声認識使用時に発声した音声の復唱と、音声認識で設定させる項目名のどちらも出力させるようにしたので、視覚を使用しない利用者が所望する機能の項目を確実に選択できる。さらに、上記で出力する音声の種類を音声認識の復唱と項目名とで区別したので、確認を素早く行うことができ、利用者の利便性が増す。
以下に説明する本発明の実施の形態では、従来の画像形成装置に視覚を使用しない操作機能を組み込んだものとして説明する。
図1は、本発明の画像形成装置に関わる機能構成を示すブロック図で、同図において、画像形成装置は、画像形成部1、操作制御部2、メニュー管理部3、音声認識部4、音声出力部5を少なくとも含んで構成されている。画像形成部1は、従来の画像形成を行うための機能を有し、操作パネル(画面やキーなど)も含まれる。
操作制御部2は、使用者からの各種入力操作やその操作に対する制御を行う。画像形成部において視覚を使用しない操作モードであると判定されているときは、使用者が押下したキー押下情報を受け取り、キーの内容に応じた処理をメニュー管理部3、音声認識部4、音声出力部5に依頼する。また、画像形成部1の機能を設定する場合には、設定項目情報を画像形成部1に送信する。画像形成部1では設定項目情報を受信すると設定結果を操作パネルに表示する。
メニュー管理部3は、画像形成装置の機能項目を木構造メニューとして管理し、キー押下情報または音声入力により指定された項目への移動や項目に対する値設定を行う。
音声認識部4は、前記(3)で説明した音声認識による方法において、使用者から発声された音声(音声入力)を認識し、認識結果を操作制御部2に引き渡す。操作制御部2では、認識結果として受け取った項目情報をメニュー管理部3に送信し、メニュー管理部3は、受け取った項目上に現在位置を移動させる。この処理により、利用者は、階層メニューの所望する項目へ直接移動できる。
音声出力部5は、操作制御部2の指示で、キー押下情報による各種の操作を表す音声ガイダンス、報知音、BGM(Background Music)などを出力(音声出力)する。
図2は、以上の機能構成において、音声認識による方法で操作を行う場合の処理の流れを示す図で、音声認識部4では、音声認識が行われると、表1を参照して認識結果に対応する認識番号を操作制御部2に送信する。例えば、「コピー両面」が正しく認識されると番号18を操作制御部に送信する(ステップS1)。
操作制御部2では、認識番号を受け取ると、表2を参照し、認識番号に対応する項目番号を調べ、メニュー管理部3に送信する。認識番号18を受け取った場合は、項目番号612をメニュー管理部3に送信する(ステップS2)。
メニュー管理部3では、項目番号を受け取り、該当する項目に現在位置を移動する。項目番号612を受け取った場合は、項目「両面コピー」に移動する(ステップS3)。メニュー上の項目移動が行われたら、操作制御部2では、表3と表4とを参照し、ステップS1で調べた認識番号に対応する音声ファイル番号およびステップS2で調べた項目番号に対応する音声ファイル番号をそれぞれ調べ、音声出力部に送信する。認識番号18に対する項目番号は612であり、音声ファイル番号は、それぞれ418、1581である。
音声出力部5では、受け取った音声ファイル番号に対応するファイルを再生する(ステップS5)。
以上の処理により、音声認識に対する復唱が行われるので、利用者は正しく認識が行われたかどうかを確認できる。さらに、項目名の出力が行われるので、正しい項目に移動したかどうかも合わせて確認できる。
ここで、音声認識の復唱に使用する音声と項目名を出力する音声を異なる種類のデータで保存しておくことによって、どちらの確認にもちいる音声であるかがより明確になり、利便性が増す。
例えば、表3と表4に用いる音声を男声、女声で区別することによって実現できる。
同一の話者であっても感情のこもった音声を別に用意することにより区別することができる。例えば、表4では通常の発声による音声を使用し、表3では、通常よりも元気な声で録音した音声を使用すればよい。他にも通常の発声と異なる音声であれば、どのような種類でもよく、悲しそうな声や反対に感情の起伏のない声を採用しても、本発明を実施可能である。
上述した実施形態を構成する各機能をそれぞれプログラム化し、あらかじめCD−ROM等の記録媒体に書き込んでおき、このCD−ROMをCD−ROMドライブのような媒体駆動装置を搭載したコンピュータに装着して、これらのプログラムをコンピュータのメモリあるいは記憶装置に格納し、それを実行することによっても、本発明の目的が達成されることは言うまでもない。
この場合、記録媒体から読出されたプログラム自体が上述した実施形態の機能を実現することになり、そのプログラムおよびそのプログラムを記録した記録媒体も本発明を構成することになる。
なお、記録媒体としては半導体媒体(例えば、ROM、不揮発性メモリカード等)、光媒体(例えば、DVD、MO、MD、CD−R等)、磁気媒体(例えば、磁気テープ、フレキシブルディスク等)のいずれであってもよい。
また、ロードしたプログラムを実行することにより上述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、オペレーティングシステム等が実際の処理の一部または全部を行い、その処理によって上述した実施形態の機能が実現される場合も含まれる。
また、上述した実施形態の機能を実現するプログラムが、機能拡張ボードや機能拡張ユニットに備わるメモリにロードされ、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって、上述した実施形態の機能が実現される場合も含まれる。
さらに、上述したプログラムをサーバコンピュータの磁気ディスク等の記憶装置に格納しておき、通信網で接続された利用者のコンピュータからダウンロード等の形式で頒布する場合、このサーバコンピュータの記憶装置も本発明の記録媒体に含まれる。
本発明の画像形成装置に関わる機能構成を示すブロック図である。 音声認識による方法で操作を行う場合の処理の流れを示す図である。
符号の説明
1…画像形成部、2…操作制御部、3…メニュー管理部、4…音声認識部、5…音声出力部。

Claims (7)

  1. 使用者から発声された音声を音声入力として認識する音声認識手段と、
    画像形成装置の機能項目を木構造のメニューとして管理し、操作制御の対象である現在位置を、前記音声認識手段により認識された前記音声入力に対応する前記メニュー上の項目に、移動する制御を行うメニュー管理手段と、
    前記移動する制御が行われた後に、前記音声認識手段により認識された前記音声入力の復唱を出力する第1の音声出力処理、及び、前記音声認識手段により認識された前記音声入力に対応する前記メニュー上の項目の項目名を出力する第2の音声出力処理を行う音声出力手段と、
    を備えることを特徴とする画像形成装置。
  2. 複数の音声認識の復唱に使用する音声ファイルを備え、
    前記音声出力手段は、前記第1の音声出力処理を、前記音声認識手段により認識された前記音声入力と一致する前記音声認識の復唱に使用する音声ファイルを再生することによって行うことを特徴とする請求項1記載の画像形成装置。
  3. 複数の項目名の出力に使用する音声ファイルを備え、
    前記音声出力手段は、前記第2の音声出力処理を、前記音声認識手段により認識された前記音声入力に対応する前記メニュー上の項目に一致する前記項目名の出力に使用する音声ファイルを再生することによって行うことを特徴とする請求項2記載の画像形成装置。
  4. 前記音声認識の復唱に使用する音声ファイルと前記項目名の出力に使用する音声ファイルとは、それぞれ異なる種類の音声の音声ファイルであることを特徴とする請求項3記載の画像形成装置。
  5. 前記異なる種類の音声とは、性別の異なる音声であることを特徴とする請求項4記載の画像形成装置。
  6. 画像形成装置に、
    使用者から発声された音声を音声入力として認識する音声認識処理と、
    画像形成装置の機能項目を木構造のメニューとして管理するメニュー管理処理と、
    操作制御の対象である現在位置を、前記音声認識処理により認識された前記音声入力に対応する前記メニュー上の項目に、移動する処理と、
    前記移動する処理が行われた後に、前記音声認識処理により認識された前記音声入力の復唱を出力する第1の音声出力処理と、
    前記音声認識処理により認識された前記音声入力に対応する前記メニュー上の項目の項目名を出力する第2の音声出力処理と、
    を実行させることを特徴とするプログラム。
  7. 請求項6に記載のプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2005046948A 2005-02-23 2005-02-23 画像形成装置、プログラムおよび記録媒体 Expired - Fee Related JP4562547B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005046948A JP4562547B2 (ja) 2005-02-23 2005-02-23 画像形成装置、プログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005046948A JP4562547B2 (ja) 2005-02-23 2005-02-23 画像形成装置、プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2006235040A JP2006235040A (ja) 2006-09-07
JP4562547B2 true JP4562547B2 (ja) 2010-10-13

Family

ID=37042784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005046948A Expired - Fee Related JP4562547B2 (ja) 2005-02-23 2005-02-23 画像形成装置、プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP4562547B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5921259B2 (ja) * 2012-03-02 2016-05-24 アルパイン株式会社 音声入力装置
JP2020136972A (ja) * 2019-02-21 2020-08-31 コニカミノルタ株式会社 設定入力装置および画像形成装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11119792A (ja) * 1997-10-20 1999-04-30 Toyota Motor Corp 音声認識機能付き機器制御装置および音声認識装置
JP2003015682A (ja) * 2001-06-28 2003-01-17 Toho Gas Co Ltd 音声認識制御装置及び音声認識制御方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11119792A (ja) * 1997-10-20 1999-04-30 Toyota Motor Corp 音声認識機能付き機器制御装置および音声認識装置
JP2003015682A (ja) * 2001-06-28 2003-01-17 Toho Gas Co Ltd 音声認識制御装置及び音声認識制御方法

Also Published As

Publication number Publication date
JP2006235040A (ja) 2006-09-07

Similar Documents

Publication Publication Date Title
US7318198B2 (en) Apparatus operation device for operating an apparatus without using eyesight
JP4659505B2 (ja) 情報処理方法及び装置
US20030020760A1 (en) Method for setting a function and a setting item by selectively specifying a position in a tree-structured menu
JP4694758B2 (ja) 機器操作装置、プログラムおよび記録媒体並びに画像形成装置
US20030036909A1 (en) Methods and devices for operating the multi-function peripherals
US7809571B2 (en) Speech output of setting information according to determined priority
JP7173761B2 (ja) 印刷システム、制御方法、サーバシステム
JP4615786B2 (ja) 画像形成装置、プログラムおよび記録媒体
JP7192220B2 (ja) 画像処理装置、情報処理装置及びプログラム
JP6988608B2 (ja) フォトブック作製システム及びサーバ装置
JP4702936B2 (ja) 情報処理装置及び制御方法、プログラム
JP4562547B2 (ja) 画像形成装置、プログラムおよび記録媒体
JP4010864B2 (ja) 画像形成装置、プログラムおよび記録媒体
JP2021092982A (ja) 画像処理システム、画像処理装置、画像処理方法
JP2006333365A (ja) 情報処理装置およびプログラム
JP4520375B2 (ja) 音声操作支援装置、電子機器、画像形成装置およびプログラム
JP4459123B2 (ja) 情報処理装置及びユーザインターフェース制御方法
JP2007013905A (ja) 情報処理装置およびプログラム
JP6988607B2 (ja) フォトブック作製システム及びサーバ装置
JP4070545B2 (ja) 機器操作装置、プログラムおよび記録媒体並びに画像形成装置
JP2004351622A (ja) 画像形成装置、プログラムおよび記録媒体
JP4530681B2 (ja) 機器操作装置、画像形成装置、プログラム及び記録媒体
JP7375427B2 (ja) 音声設定システム、音声設定支援プログラムおよび音声設定支援装置
JP6416028B2 (ja) カラオケ用入力装置及びプログラム
JP6988606B2 (ja) フォトブック作製システム及びサーバ装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070806

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090210

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090316

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100514

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100720

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100727

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130806

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4562547

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees