JP7206827B2 - システム、画像形成装置、方法およびプログラム - Google Patents

システム、画像形成装置、方法およびプログラム Download PDF

Info

Publication number
JP7206827B2
JP7206827B2 JP2018213043A JP2018213043A JP7206827B2 JP 7206827 B2 JP7206827 B2 JP 7206827B2 JP 2018213043 A JP2018213043 A JP 2018213043A JP 2018213043 A JP2018213043 A JP 2018213043A JP 7206827 B2 JP7206827 B2 JP 7206827B2
Authority
JP
Japan
Prior art keywords
command
image forming
state
mfp
job
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018213043A
Other languages
English (en)
Other versions
JP2020080052A (ja
Inventor
義宗 張
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2018213043A priority Critical patent/JP7206827B2/ja
Priority to US16/668,464 priority patent/US20200152201A1/en
Publication of JP2020080052A publication Critical patent/JP2020080052A/ja
Application granted granted Critical
Publication of JP7206827B2 publication Critical patent/JP7206827B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00501Tailoring a user interface [UI] to specific requirements
    • H04N1/00509Personalising for a particular user or group of users, e.g. a workgroup or company
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00403Voice input means, e.g. voice commands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1278Dedicated interfaces to print systems specifically adapted to adopt a particular infrastructure
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Accessory Devices And Overall Control Thereof (AREA)
  • Facsimiles In General (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本開示はシステム、画像形成装置、方法およびプログラムに関し、特に、音声に基づく指令により画像形成装置を操作するシステム、画像形成装置、方法およびプログラムに関する。
近年、対話型によりマイクで集音した音声を認識し、認識結果に基き画像形成装置を操作するための指令を、当該画像形成装置に出力する、いわゆるスマートスピーカーが提案されている。スマートスピーカーが、画像形成装置の周囲に置かれた場合は、画像形成装置が印刷ジョブを実行中に発生する比較的大きな動作音が、マイクにより集音されると、スマートスピーカーが動作音を指令の音声と誤認識する。動作音による誤認識を解消するために、例えば、特許文献1(特開2005-219460号公報)では、画像形成装置の稼働中に音声の入力を禁止することで、入力音声の認識率を向上させている。
特開2005-219460号公報
特許文献1は、画像形成装置の稼働中は音声入力を一律禁止しているため、例えば、画像形成装置に誤って指令を出力した場合でも当該指令をキャンセルするための音声入力も禁止されてしまう。したがって、音声の認識結果による画像形成装置の操作性の改善が望まれる。
本開示の一例にかかるシステムは、画像形成装置と、発話の音声を集音し、集音された音声の音声データを生成する音声処理装置と、サーバーと、を備える。サーバーは、当該サーバーを制御する制御部と、画像形成装置および音声処理装置と通信する通信回路と、を含む。
制御部は、音声処理装置から受信する音声データを認識処理して画像形成装置を操作するための指令を生成し、画像形成装置がジョブを実行中に音声処理装置から音声データを受信した場合、画像形成装置が当該ジョブを実行中の所定状態であるとき、または、当該音声データから生成される指令が所定指令であるとき、当該生成される指令を画像形成装置に送信するよう通信回路を制御する。
上述の開示において、所定状態は、ジョブを実行中の画像形成装置の動作音が小さい状態を含む。
上述の開示において、画像形成装置は、当該画像形成装置に対する指令を受付け、ジョブを実行中の各状態は画像形成装置がジョブを実行中に受付ける指令を、他の指令よりも優先的に処理することを示す優先度が設定される。所定状態の優先度は、他の状態の当該優先度よりも高い。
上述の開示において、制御部は、画像形成装置がジョブを実行中の所定状態でない場合、当該音声データから生成される指令が所定指令であるとき、当該生成される指令を画像形成装置に送信するよう通信回路を制御する。
上述の開示において、所定指令は、画像形成装置を操作するための他の指令よりも優先的に処理される指令を含む。
上述の開示において、所定指令は画像形成装置を緊急に操作するための指令を含む。
上述の開示において、音声処理装置は、サーバーからの通知に基づく音声を出力する。制御部は、画像形成装置がジョブを実行中に音声処理装置から音声データを受信した場合、画像形成装置の状態が所定状態でないとき、当該音声データから生成される指令を画像形成装置に送信せずに、当該指令は画像形成装置により実行されない旨の通知を音声処理装置に送信するよう通信回路を制御する。
上述の開示において、通知は、ジョブの実行にかかる時間の情報を含む。
上述の開示において、サーバーは、画像形成装置から周期的に状態を受信する、または当該画像形成装置の状態が変化したときに当該状態を受信する。
上述の開示において、音声処理装置は、サーバーからの所定通知の受信周期に同期して当該所定通知を音声または点灯で出力し、ジョブは、画像形成装置の状態を、周期的に動作音を出力させる状態に変化させるジョブを含む。制御部は、画像形成装置から受信する状態に基づき動作音が出力される間隔を計測し、計測された間隔で、音声処理装置に所定通知を送信するよう通信回路を制御する。
上述の開示において、音声処理装置は、サーバーから受信する問合せを音声または点灯で出力する。制御部は、さらに、画像形成装置を操作するための複数の指令を格納する指令格納部を含み、制御部は、認識処理により生成される指令と、指令格納部の各複数の指令と照合し、照合の結果に基づく当該指令に関する問合せを、音声処理装置に送信するよう通信回路を制御する。
上述の開示において、画像形成装置は、当該画像形成装置の動作音を小さくする静音モードを有し、制御部は、音声処理装置から音声データを受信するとき、画像形成装置の動作モードを静音モードに切り替える操作の指令を、画像形成装置に送信するよう、通信回路を制御する。
本開示の一例にかかる画像形成装置は、画像形成ユニットと、情報処理部と、発話の音声を集音し、集音された音声の音声データを生成する音声処理装置と通信する通信回路を、を備える。情報処理部は、音声処理装置から受信する音声データを認識処理して画像形成ユニットを操作するための指令を生成する。情報処理部は、画像形成ユニットがジョブを実行中に音声処理装置から音声データを受信した場合、画像形成ユニットが当該ジョブを実行中の所定状態であるとき、または、当該音声データから生成される指令が所定指令であるとき、当該生成される指令を画像形成ユニットに出力する。
本開示の一例にかかる方法は、画像形成ユニットと接続可能な情報処理装置に備えられるプロセッサが実行する方法であって、発話の音声に基づく音声データを認識処理して画像形成ユニットを操作するための指令を生成するステップと、画像形成ユニットがジョブを実行中に音声データを受信した場合、画像形成ユニットが当該ジョブを実行中の所定状態であるとき、または、当該音声データから生成される指令が所定指令であるとき、当該生成される指令を前記画像形成ユニットに出力するステップと、を備える方法。
本開示の一例では、上記に記載の方法をコンピュータに実行させるためのプログラムが提供される。
本開示の一例によれば、音声の認識結果による画像形成装置の操作性が改善される。
実施の形態にかかるシステム1の概略的な構成を示す図である。 実施の形態にかかるMFP100のハードウェアの構成の一例を概略的に示す図である。 実施の形態にかかるサーバー300のハードウェア構成の一例を概略的に示す図である。 実施の形態にかかる音声処理装置200のハードウェア構成の一例を概略的に示す図である。 実施の形態にかかるジョブデータ50の構成を概略的に示す図である。 実施の形態にかかる指令フレーム57の構成を概略的に示す図である。 実施の形態にかかるサーバー300の機能構成の一例を模式的に示す図である。 実施の形態にかかる指令可否テーブル342の一例を模式的に示す図である。 実施の形態にかかる可能指令テーブル343の一例を模式的に示す図である。 実施の形態にかかるMFP100の機能構成の一例を模式的に示す図である。 実施の形態にかかる処理のシーケンスの一例を模式的に示す図である。 実施の形態にかかるガイダンスデータ344の構成の一例を模式的に示す図である。 実施の形態にかかるMFPの状態に関する優先度を表す状態優先度テーブル342Aの一例を模式的に示す図である。 実施の形態にかかるMFPに対する操作の指令に関する優先度を表す指令優先度テーブル343Aの一例を模式的に示す図である。 実施の形態にかかるシステム1Aの構成の変形例を模式的に示す図である。 他の実施の形態にかかるMFP100Aの機能構成の一例を模式的に示す図である。 他の実施の形態にかかるMFP100Aの処理のフローチャートである。
以下、図面を参照しつつ、各実施の形態について説明する。以下の説明では、同一の部品および構成要素には同一の符号を付してある。それらの名称および機能も同じである。したがって、これらの説明は繰り返さない。
<A.ハードウェア構成>
(a1.システムの構成)
図1は、実施の形態にかかるシステム1の概略的な構成を示す図である。図1を参照して、システム1は、有線または無線のネットワーク400に接続可能なMFP(Multi-Function Peripherals)100、音声処理装置200および例えばクラウドサーバーを含み得るサーバー300を備える。ネットワーク400は、LAN(Local Area Network)またはグローバルネットワーク、または、NFC(Near field communication)等の近距離無線通信を含み得る。MFP100は、プリンターまたはコピー機またはそれらの複合機であり、画像形成装置の一実施例である。なお、音声処理装置200またはMFP100は、ルーター等の中継器を介してネットワーク400に接続されてもよい。
システム1では、ユーザーは、発話によりMFP100を操作することができる。具体的には、ユーザーが例えば「コピーを10部して」と操作指令の発話をすると、音声処理装置200は発話による音声を集音し、集音した音声の音声データ40を生成する。例えば、音声処理装置200は、発話によるアナログの音声信号をデジタルの音声データに変換する。音声処理装置200は、音声データ40を、ネットワーク400を介してサーバー300に送信する。サーバー300は、音声データ40を音声認識処理して、認識結果としてテキストデータに変換する。例えば、このテキストデータは、1文字以上の文字列からなる文字コード列のデータであり、この文字列はMFP100を操作するための指令を表している。
サーバー300は、文字データが表す指令をMFP100に送信する。図1では、指令として例えばジョブデータ50または指令フレーム57が送信される。MFP100は、ジョブデータ50または指令フレーム57を処理する。これにより、MFP100はユーザーの発話による指令に従い操作される。なお、ジョブデータ50と指令フレーム57の詳細は後述する。また、MFP100は自装置の状態を検出して、検出された状態61をサーバー300に定期的に送信する。これによりサーバー300は、定期的に、MFP100の最近の状態を検出することができる。本実施の形態では、MFP100の状態は、ジョブを実行中に遷移し得る状態を含む。状態は、限定されないが、例えば、MFP100が内蔵するモーターが低速度で回転する低回転モード、プリントジョブの実行中、MFPに対してユーザーが操作中(すなわち、MFPが操作部172を介してユーザー操作を受付け中)などを含み得る。
また、MFP100は、自装置においてジョブが終了するまでに要する所要時間62をサーバー300に送信する。MFP100は、所要時間62を、状態61に含めて送信してもよい。また、サーバー300は、発話の間隔をユーザーに示すための間隔通知41を含む各種の通知を音声処理装置200に送信する。
図1のシステム1では、音声処理装置200は、MFP100の外部に備えられるが、これに限定されない。例えば、音声処理装置200は、MFP100に内蔵されてもよい。システム1は複数台のMFP100を備え、また、複数台の音声処理装置200を備えてもよい。その場合は、サーバー300は、各音声処理装置200の識別子(アドレス)と当該音声処理装置200の最寄りのMFP100の識別子(アドレス)の組合せを登録したテーブルを備える。サーバー300は、音声処理装置200から音声データ40に含まれる当該音声処理装置200の識別子(アドレス)に基づきテーブルを検索することにより、対応のMFP100を特定し、特定したMFP100にジョブデータ50および指令61を送信する。
(a2.MFP100のハードウェア構成)
図2は、実施の形態にかかるMFP100のハードウェアの構成の一例を概略的に示す図である。図2を参照して、MFP100は、MFP100を制御するための制御部に相当するCPU(Central Processing Unit)150、プログラムおよびデータを格納するための記憶部160、情報の入出力部170、ネットワーク400を介してサーバー300と通信するための通信I/F(InterFaceの略)156、画像データを含む各種データを記憶するハードディスクなどの記憶部173、データリーダー/ライター174、通信回路175、および画像形成ユニット180を含む。
MFP100は通信回路175を介して音声処理装置200を含む外部の端末と通信する。
記憶部160は、CPU10により実行されるプログラムおよびデータを記憶するためのROM(Read Only Memory)、CPU10によりプログラムを実行する際の作業領域として供されるRAM(Random Access Memory)および不揮発メモリなどを含む。
入出力部170は、ディスプレイを含む表示部171およびユーザーがMFP100に情報を入力するために操作する操作部172を含む。ここでは、表示部171と操作部172は、一体的に構成されたタッチパネルとして提供されてもよい。
通信I/F156は、NIC(Network Interface Card)などの回路を含んで構成される。通信I/F156は、サーバー300を含む外部装置とネットワークを介して通信するためのデータ通信部157を含む。データ通信部157は、データを、ネットワーク400を介してサーバー300を含む外部装置に送信するための送信部158、およびネットワーク400を介してサーバー300を含む外部装置からデータを受信する受信部159を含む。
データリーダー/ライター174は、記録媒体176が脱着自在に装着される。データリーダー/ライター174は、装着された記録媒体176からプログラムまたはデータを読出す回路と、記録媒体176にデータを書込む回路を有する。通信回路175は、例えばLAN(Local Area Network)またはNFC(Near Field Communication)などのための通信回路を含む。
画像形成ユニット180は、画像処理部151、画像形成部152、図示しないファクシミリ回路を制御するためのファクシミリ制御部153、図示しないプリンターを制御する画像出力部154および画像読取部155を備える。
画像処理部151は、入力された画像データを処理することにより、たとえば出力される画像の拡大・縮小等の処理を実行する。画像処理部151は、たとえば画像処理用のプロセッサーおよびメモリーによって実現される。画像形成部152は、トナーカートリッジ、記録用紙を収容するための用紙トレイ、および、感光体等の、記録用紙に画像を形成するためのモーターを含むハードウェア資源、ならびに、記録用紙を搬送するためのモーターを含むハードウェア資源によって実現される。画像読取部155は、原稿を光学的に読み取って画像データを得るためのスキャナー等の、原稿の画像データを生成するように構成されたハードウェア資源によって実現される。画像処理部151、画像形成部152、および画像読取部155のそれぞれの機能は、MFP100においてよく知られたものであるから、ここでは詳細な説明は繰返さない。
画像形成ユニット180は、CPU150から制御データを受付けて、制御データに基づき駆動信号(電圧信号または電流信号)を生成し、生成した駆動信号を各部(例えばモーター等のハードウェア)に出力する。これにより、指令に従い画像形成ユニット180のハードウェアが動作する。例えば、画像出力部154は、指令に従いプリンターを駆動する。プリンターを駆動するための指令は、例えば、CPU150が、印刷のジョブデータ50を処理することにより生成される。
(a3.サーバー300のハードウェア構成)
図3は、実施の形態にかかるサーバー300のハードウェア構成の一例を概略的に示す図である。図3を参照して、サーバー300は、サーバー300を制御するためのCPU30、記憶部34、ネットワークコントローラー35およびリーダー/ライター36を含む。記憶部34は、CPU30により実行されるプログラムおよびデータを記憶するためのROM31、RAM32、各種の情報を格納するためのHDD(Hard Disk Drive)33、およびMFP100および音声処理装置200と通信するネットワークコントローラー35を含む。RAM32は、各種情報を記憶する領域と、CPU30でプログラムを実行する際の作業領域とを含む。ネットワークコントローラー35は、MFP100および音声処理装置200と通信するための通信回路の一実施例である。ネットワークコントローラー35は、NICなどを含む。
リーダー/ライター36は、記録媒体37が脱着自在に装着される。リーダー/ライター36は、装着された記録媒体37からプログラムまたはデータを読出す回路と、記録媒体37にデータを書込む回路を有する。
(a4.音声処理装置200のハードウェア構成)
図4は、実施の形態にかかる音声処理装置200のハードウェア構成の一例を概略的に示す図である。図4を参照して、音声処理装置200は、音声処理装置200を制御するための制御部に相当するCPU20、ディスプレイ23、LED(light Emitting Diode)23A、マイク24、ユーザーが音声処理装置200に情報を入力するために操作する操作パネル25、記憶部26、NICまたはLAN回路などの通信回路を含む通信コントローラー27、およびスピーカー29を備える。記憶部26は、CPU20により実行されるプログラムおよびデータを記憶するためのROM21、RAM22、およびハードディスク装置を含むメモリ28を備える。ディスプレイ23と操作パネル25は、一体的に構成されたタッチパネルとして提供されてもよい。音声処理装置200は、通信コントローラー27を介してサーバー300またはMFP100などと通信することができる。
音声処理装置200は、マイク24を介して発話を含む音声を集音する。CPU20は、集音された音声の音声信号をデジタルデータに変換し、これにより音声データ40を生成する。また、音声処理装置200は音声データを再生する。具体的には、CPU20は音声データを音声信号に変換し、変換後の音声信号をスピーカー29に出力する。これにより、スピーカー29が音声信号により駆動されて、スピーカー29から音声が出力される。スピーカー29から出力される音声データは、例えば記憶部26に格納された音声データまたはサーバー300またはMFP100などの外部の装置から受信した音声データが含まれる。
<B.ジョブデータ50と指令フレーム57>
図5は、実施の形態にかかるジョブデータ50の構成を概略的に示す図である。図5のジョブデータ50は、例えば画像出力部154のプリンターに画像を印刷させるためのジョブに対応する。図5を参照してジョブデータ50は、PJLデータ51、PDL(ページ記述言語)データ52およびジョブデータ50の識別子、例えばジョブデータ50のユーザーを識別するユーザーID53を含む。本実施の形態では、サーバー300は、印刷対象となるデータ(以下、印刷対象データという)をPDLデータ52に変換し、PDLデータ52をPJLデータ51およびユーザーID53が付加されたジョブデータ50としてMFP100に送信する。PJLデータ51は、PJL形式で記述された指令を示す。この指令は、サーバー300が音声処理装置200から受信した音声データ40を認識処理することにより生成されるMFP100を操作するための指令を含み得る。
ユーザーID53は、ジョブデータ50のユーザーの識別子であり、例えば音声処理装置200またはMFP100のユーザーのログイン名が含まれる。サーバー300のCPU30は、音声処理装置200またはMFP100からユーザーのログイン名を受信することができる。
図5を参照して、PJLデータ51は、PDLデータ52に直接影響を与えない命令が各種規定されている。たとえば、印刷の指令(印刷部数の設定に関する指令54、MFP100が備える図示されないステープル、パンチなどの機能を用いる場合に当該機能の操作に関する指令55,56などが記述される。
印刷対象データは、限定されないが、例えば文書データ、図のデータまたは表のデータなどである。サーバー300の記憶部34は、ユーザー毎に、当該ユーザー識別子(ログイン名等)に関連付けて印刷対象データを格納することができる。例えば、サーバー300のCPU30は、受信したユーザー識別子(ログイン名)に関連付けられた記憶部34の印刷対象データをPDLデータ52に変換する。
本実施の形態では、印刷対象データは、サーバー300に格納されているとするが、これに限定されない。変形例として、印刷対象データは、MFP100の記憶部173に格納されていてもよい。この場合は、ジョブデータ50のPDLデータ52は、記憶部173に格納された印刷対象データを示す。具体的には、CPU150は、サーバー300からPJL51とユーザーID53を受信すると、ユーザーID53に関連付けられた記憶部173の印刷対象データをPDLデータ52に変換する。これにより、MFP100のCPU150は、サーバー300から受信したPJL51およびユーザーID53、ならびには、記憶部173の印刷対象データから生成したPDLデータ52からジョブデータ50を生成することができる。
ジョブデータ50はMFP100により処理される。具体的には、画像出力部154は、ジョブデータ50のPDLデータ52を、図示しないファームウェアを用いて記憶部160のRAM上でビットマップデータとして展開する。画像出力部154の図示しないプリンターは、ビットマップデータ(PDLデータ52)に従って印刷用紙に対する印字処理を実行し、PJLデータ51の指令を実行することによりステープル機能、指定部数の印刷するためのソーター機能等を操作する。
本実施の形態では、ジョブデータ50は、上記に述べた印刷ジョブに限定されず、例えばファクシミリ通信ジョブであってもよい。
図6は、実施の形態にかかる指令フレーム57の構成を概略的に示す図である。図6の指令フレーム57は、ジョブデータ50とは異なり、処理の対象となるデータ(例えばPDLデータ52等)を含まないフォーマットを有する。指令フレーム57は、指令58とユーザーID53とを含む。指令58は、サーバー300が音声処理装置200から受信した音声データ40を認識処理することにより生成されるMFP100を操作するための指令である。
<C.サーバー300の機能構成>
図7は、実施の形態にかかるサーバー300の機能構成の一例を模式的に示す図である。図8は、実施の形態にかかる指令可否テーブル342の一例を模式的に示す図である。図9は、実施の形態にかかる可能指令テーブル343の一例を模式的に示す図である。図7を参照して、サーバー300は、ネットワークコントローラー35を介して受信された音声データ40を用いて音声認識処理を実施する音声認識エンジン310、および音声認識結果に基づきジョブデータ50または指令フレーム57を生成するMFP制御モジュール320を備える。サーバー300は、生成されたジョブデータ50および指令フレーム57を、ネットワークコントローラー35を介してMFP100に送信する。
音声認識エンジン310またはMFP制御モジュール320は、CPU30が記憶部34または記録媒体37に格納されたプログラムを実行することにより実現される。なお、音声認識エンジン310またはMFP制御モジュール320は、ASIC(Application Specific Integrated Circuit)またはFPGA(Field-Programmable Gate Array)などの回路、または回路とプログラムの組合せにより実現されてもよい。
また、記憶部34は、辞書340、MFP100の状態を示すMFP状態341、指令可否テーブル342(図8参照)、可能指令テーブル343(図9参照)、ガイダンスデータ344、状態優先度テーブル342A(図13参照)および指令優先度テーブル343A(図14参照)を格納する。辞書340は、MFP100を操作するための複数の指令と、各指令に対応のテキストデータ(当該指令を表す文字列からなるテキストデータ)が登録されている。
MFP制御モジュール320は、判断部321、状態取得部322、指令生成部324および通知部325を含む。判断部321は、記憶部34のMFP状態341、指令可否テーブル342および可能指令テーブル343に従い、指令58(すなわち指令フレーム57)を送信するか否かを決定する。判断部321に備えられる優先度判断部323は、記憶部34のMFP状態341、状態優先度テーブル342Aおよび指令優先度テーブル343Aに従い、指令58(すなわち指令フレーム57)を送信するか否かを決定する。優先度判断部323の詳細は後述する。
状態取得部322は、MFP100から、MFP100の状態61を受信し、受信した状態61をMFP状態341として記憶部34に格納する。本実施の形態では、MFP100が定期的に自装置の状態61を検出して、サーバー300に送信する、または自装置の状態が変化したときに状態61をサーバー300に送信する。これにより、MFP状態341は常にMFP100の最新の状態を示す。
なお、状態取得部322が状態61を取得する方法は、これに限定されない。例えば、状態取得部322から定期的にMFP100に問合せを送信し、MFP100は当該問合せの応答として状態61をサーバー300に送信するとしてもよい。また、MFP状態341は、状態61を受信する順番に従う時系列の状態61を含んでもよい。
図8を参照して、指令可否テーブル342は、MFP100が取り得る複数の状態3421と、各状態3421に対応付けられた指令可否データ3422を有する。指令可否データ3422は、MFP100に対する指令の送信を許可(可:OK)するか、または送信を許可しない(否:NG)かを示す。限定されないが、例えば、指令可否テーブル342は、MFP100の状態3421として、プリンターのモーターの回転速度が低速であり比較的動作音が小さい「低回転モード」および動作音が大きい「プリントジョブ実行中」等を含む。「低回転モード」の状態3421に対応の指令可否データ3422は「OK」を示し、「プリントジョブ実行中」の状態3421に対応の指令可否データ3422は「NG」を示す。
この指令可否テーブル342は、MFP100のハードウェア(モーター、またはソーターなど)から発生する動作音が小さい状態であるときは、サーバー300からMFP100に対する指令58(指令フレーム57)の送信が許可されず、MFP100から発生する動作音が小さい状態であるときは、指令58(指令フレーム57)の送信が許可されることを規定する。
したがって、指令可否テーブル342によれば、MFP100が大きい動作音を発生させるような状態であるときは、音声データ40の認識結果に基づく指令58はMFP100に送信されない。これにより、ユーザーの発話による音声に動作音が混入して音声データ40が誤認識される可能性があるときは、音声データ40の指令58のMFP100への送信は許可されないから、当該誤認識による指令でMFP100が誤操作される事態を回避できる。
図9を参照して、可能指令テーブル343は、指令可否テーブル342の指令可否データ3422の「NG」の値に紐付けされるテーブルであり、MFP100に対して送信が許可される1以上の各操作に対応の指令3431を含む。指令3431は、MFP100を緊急に操作するための指令であり、例えば実行中のジョブを緊急に停止または中断させるための指令を含み得る。指令3431は、当該指令を表す文字列からなるテキストデータにより示される。なお、図9の可能指令テーブル343の内容は、指令可否データ3422が「NG」を示す状態3421のそれぞれについて共通していてもよく、または異なっていてもよい。
音声認識エンジン310は認識結果を示すテキストデータを、MFP100を操作する指令(以下、認識指令ともいう)に変換する。この変換には、例えば辞書340が用いられる。辞書340には、MFP100を操作するための複数の指令と、各指令に対応のテキストデータ(当該指令を表す文字列からなるテキストデータ)とが登録されている。したがって、音声認識エンジン310は、認識結果のテキストデータに基づき辞書340を検索することにより、当該変換を実現することができる。
MFP制御モジュール320の判断部321は、認識指令を、MFP100に送信するか否かを判断する。具体的には、判断部321は、MFP状態341に基づき指令可否テーブル342を検索することにより、当該MFP状態341に一致した状態3421に対応の指令可否データ3422を指令可否テーブル342から読出す。判断部321は、読出された指令可否データ3422が「NG」を示すとき、すなわちMFP100の状態341に基づき認識指令(指令58)を送信しないとの判断がなされたとき、判断部321は認識指令について次の処理を実施する。
次の処理において、判断部321は、認識指令に基づき可能指令テーブル343を検索することにより、認識指令が可能指令テーブル343に登録された指令3431であるかを判断する。判断部321は、認識指令は可能指令テーブル343に登録された指令3431であると判断したとき、判断部321は、当該認識指令をMFP100へ送信すると判断する。
指令生成部324は、判断部321により送信すると判断された認識指令を、指令58として含む指令フレーム57を生成する。MFP制御モジュール320は、生成された指令フレーム57をMFP100に送信するよう、ネットワークコントローラー35を制御する。一方、判断部321は、認識指令は可能指令テーブル343に登録されていないと判断したとき、判断部321は、認識指令をMFP100に送信しないことを最終的に判断する。
通知部325は、認識指令(指令フレーム57の指令58)がMFP100により実行されたとき、または実行が完了したとき、“指令が実行された(または実行完了)”した旨の音声データを生成し、MFP100に送信する。また、通知部325は、ネットワークコントローラー35により指令58がMFP100に送信されたときに、実行が完了した旨の通知をMFP100に送信してもよい。
また、通知部325は、判断部321により認識指令は送信不可と判断されたとき、“指令は実行されなかった”旨を通知の音声データを生成し、音声処理装置200に送信する。この場合に、通知部325は、MFP状態341と認識指令(例えば、用紙サイズ変更等)との組合せから、例えば“ジョブを実行が終了したとき、用紙サイズの変更ができます”などのMFP100の操作に関するガイダンスのための音声データを生成してもよい。ガイダンスデータ344は、指令と状態からなる複数の組と、各組に対応付けられたガイダンスのための音声データを格納する。通知部325は、MFP状態341と認識指令に基づきガイダンスデータ344を検索することにより、MFP状態341と認識指令に対応したガイダンスの音声データを取得することができる。
なお、通知部325は音声処理装置200に通知を送信して、音声処理装置200はサーバー300からの通知をスピーカー29、LED23A、ディスプレイ23等により出力するが、出力態様はこれに限定されない。例えば、通知部325は、ユーザーの携帯型端末に当該通知を送信する。この場合は、携帯型端末はサーバー300からの通知を音声、画像または点灯などにより報知する。
<D.MFP100の機能構成>
図10は、実施の形態にかかるMFP100の機能構成の一例を模式的に示す図である。図10を参照して、MFP100は、指令受付部110、指令実行部120、ユーザー指令受付部130および状態提供部140を備える。指令受付部110は、サーバー300から送信されたジョブデータ50または指令フレーム57を通信I/F156を介して受付ける。ユーザー指令受付部130は、ユーザーが操作部172を操作することによりMFP100に対して入力する指令を受付ける。指令実行部120は、指令受付部110またはユーザー指令受付部130が受付ける指令を解釈して制御データを生成し、生成された制御データを各部に出力する。
MFP100の各部は、制御データに従い駆動されて、その結果、MFP100はジョブデータ50の指令(PJLデータ51)または指令フレーム57の指令58に従い操作される。
状態提供部140は、MFP100の状態61を周期的に検知する状態検知部141を含む。状態検知部141は、MFP100の各部から出力される信号またはデータに基づき、または、記憶部160に格納されたMFP100の動作モードを示すモードデータに基づき、MFP100の状態61を検知する。状態提供部140は、検知された状態61を周期的にサーバー300に送信する。または、状態提供部140は、MFP100の状態61が変化したとき、状態61をサーバー300に送信する。これにより、状態提供部140は、サーバー300に、MFP100の最近の状態61を送信することができる。
図10に示す各部は、CPU150が記憶部160または記録媒体176に格納されたプログラムを実行することにより実現される。なお、図10の各部は、ASICまたはFPGAなどの回路、または回路とプログラムの組合せにより実現されてもよい。
<E.シーケンス>
図11は、実施の形態にかかる処理のシーケンスの一例を模式的に示す図である。図11では、シーケンスは、音声処理装置200の処理、サーバー300の音声認識エンジン310およびMFP制御モジュール320の処理、およびジョブを実行中のMFP100の処理が相互に関連付けて示される。
図11を参照して、ジョブを実行中のMFP100では、状態提供部140は状態61をサーバー300に送信する。サーバー300の状態取得部322は、MFP100から状態61を受信する毎に、受信した状態61を用いてMFP状態341を更新する(ステップS7)。なお、状態61には、MFP100がジョブを実行中である旨の状態が含まれるので、サーバー300は、MFP状態341からMFP100がジョブを実行中の状態であることを検出する。
ユーザーは、MFP100を操作するための発話を行なう。音声処理装置200は、発話の音声を集音し、音声データ40をサーバー300に送信する(ステップS1)。サーバー300の音声認識エンジン310は、受信した音声データ40を認識処理し、認識結果(テキストデータ)から認識指令を生成し(ステップS3)、生成された認識指令をMFP制御モジュール320に送信する。
MFP制御モジュール320の判断部321は、記憶部34からMFP状態341を読出すことで、MFP状態341を取得する(ステップS9)。また、判断部321は、MFP状態341に基づき指令可否テーブル342を検索することにより、MFP状態341に一致する状態3421に対応の指令可否データ3422の値を読出す(ステップS11)。
判断部321は、対応の指令可否データ3422の値が「OK」を示す、すなわちMFP100は指令の送信が許可される状態であると判断すると、指令生成部324は認識指令を指令58として含む指令フレーム57を生成する。MFP制御モジュール320は、指令フレーム57を、MFP100に送信する(ステップS13)。MFP100では、指令受付部110が指令フレーム57を受付けて、指令実行部120は、受付けられた指令フレーム57の指令58を実行する(ステップS15)。
一方、判断部321は、対応の指令可否データ3422の値が「NG」を示す、すなわちMFP100は指令の送信が許可されない状態であると判断すると、判断部321は、可能指令テーブル343を検索する。
具体的には、判断部321は、認識指令に基づき可能指令テーブル343を検索することにより、認識指令が可能指令テーブル343に登録された指令3431であるかを判断する(ステップS19)。判断部321は、認識指令は可能指令テーブル343に登録されていると判断したとき、当該認識指令をMFP100へ送信可と最終的に判断する。指令生成部324は、送信可と判断された認識指令である指令58を含む指令フレーム57を生成し、MFP制御モジュール320は、生成された指令フレーム57をMFP100に送信する(ステップS21)。MFP100の指令実行部120は、サーバー300からの指令フレーム57中の指令58を実行する(ステップS23)。
一方、認識指令は可能指令テーブル343に登録されていないと判断したとき、判断部321は、認識指令をMFP100に送信不可と最終的に判断し、認識指令をMFP100に送信しないよう処理する(ステップS26)。この処理は、例えば、認識指令の破棄または記憶部34の所定領域への格納等を含む。
上記に述べたステップS15またはS23において、MFP100の指令実行部120は発話による指令58を実行したとき、実行完了した旨の通知をサーバー300に送信する(ステップS16,ステップS24)。MFP制御モジュール320は、MFP100から指令を実行した旨の通知を受信すると、音声処理装置200に対して「指令を実行完了した」旨の音声データの通知を送信する(ステップS17,ステップS25)。また、上記に述べたステップS26では、MFP制御モジュール320は、音声処理装置200に対して「指令を実行できなかった」旨の音声データの通知を送信する(ステップS27)。
音声処理装置200は、ステップS17またはステップS25またはステップS27で受信した音声データを再生する(ステップS29)。これにより、音声処理装置200のスピーカー29から指令がMFP100で実行されたか否かを案内する音声が出力される。したがって、ユーザーは、発話によるMFP100の操作を指令した場合に、その指令がMFP100で実行されたか否かを、音声処理装置200との対話形式で確認することができる。
(e1.MFP100の動作モードの変更)
図11のステップS26で指令不可と判断されたときは、サーバー300は、MFP100に動作音の少ない静音モードへ運転モードを切替るための指令58を含めた指令フレーム57を送信しても良い。MFP100の指令実行部120が当該指令58を実行することにより、MFP100の動作モードは静音モードに変化し、MFP状態341は静音モードを示すことになる。静音モードは、例えば指令可否テーブル342の低回転モードを示す状態3421に該当する。したがって、静音モードに切替後は、ユーザーの発話に基づく指令58がサーバー300を介してMFP100に送信することが可能になる。
(e2.通知の変形例)
図12は、実施の形態にかかるガイダンスデータ344の構成の一例を模式的に示す図である。図12を参照して、ガイダンスデータ344は、複数の組3440と、各組3440に対応付けてMFP100の操作に関するガイダンスの音声データ3443を格納する。
例えば、通知部325は、ステップS9で取得されたMFP状態341とステップS5により受信した認識指令の組に基づきガイダンスデータ344を検索する。通知部325は、ガイダンスデータ344から、当該組と一致する組3440に対応の音声データ3443を読出す。ガイダンスデータ344には、MFP100の操作に関するガイダンスが含まれ得る。例えば、MFP状態341は「プリントジョブ実行中」を示し、発話による認識指令が「用紙サイズ変更」を示す場合、通知部325は、ガイダンスデータ344を検索することにより、“プリントジョブ実行が終了したとき、用紙サイズの変更ができます”などのガイダンスの音声データ3443を取得(生成)することができる。通知部325は、取得したガイダンスの音声データ3443を含む通知を音声処理装置200に送信する。
音声処理装置200は、通知に含まれるガイダンスの音声データ3443を再生する。これにより、ユーザーに対して、対話形式で、指令を実行するためのMFP100の操作に関するガイダンスを提供することができる。
(e3.通知の更なる変形例)
図11のステップS27における、指令を実行できなかった旨の通知には、ジョブの実行にかかる時間の情報、すなわちジョブが終了するまでの所要時間62が含まれてもよい。
本実施の形態では、MFP100は、印刷ジョブの実行にかかる所要時間62を推定する。例えば、MFP100は、ジョブ開始の操作指令を受信した時点での印刷待ちとなっているジョブの数とそれぞれの部数からトータル枚数を算出し、トータル枚数をMFP100の印刷速度で割った値に、ジョブ間のインターバルを足す等の補正をして得られた値を、所要時間62として推定する。MFP100は、サーバー300に所要時間62の通知を送信する。また、MFP100は、状態61とともに所要時間62をサーバー300に送信してもよい。
上記の所要時間62の推定(算出)は、MFP制御モジュール320により実施されてもよい。この場合、MFP100は状態61とともに、印刷待ちとなっているジョブの数とそれぞれの部数をサーバー300に送信する。
これにより、音声処理装置200は、指令を実行できなかった旨の通知の音声データとともに、所要時間62の音声データも再生することができる。
(e4.通知のさらなる変形例)
本実施の形態では、上記の通知には、MFP100に対して指令を入力するタイミングを示す通知が含まれてもよい。
具体的には、MFP100が実行するジョブは、MFP100の状態を、周期的に動作音を出力させる状態に変化させるジョブを含む。例えば、MFP100が印刷ジョブを実行中は、ステープル指令が実行されることにより、MFP100の状態61(すなわちMFP状態341)は、「ステープル起動→ステープル停止→ステープル起動→ステープル停止→ステープル起動→」と遷移する。これにより、ステープル起動の周期的に同期して、MFP100から動作音が出力される。
MFP制御モジュール320は、MFP100から受信する状態61に基づき動作音が出力される間隔、すなわちステープル起動から次のステープル起動までの間隔を計測する。通知部325は、計測された間隔に同期した周期で、音声処理装置200に所定通知を送信するようネットワークコントローラー35を制御する。所定通知は、例えば、ユーザーに対して発話の間隔を示す通知である間隔通知41を含む。
音声処理装置200は、所定通知(間隔通知41)が示す間隔毎に、所定音を出力するようにスピーカー29を制御する、または、LED23Aを点灯させる。これにより、MFP100がステープル機能を利用した印刷ジョブを実行中であっても、ユーザーに対して、動作音が小さい時期、すなわち発話に適した時期(発話の音声を適切に収集可能な時期)をガイドすることができる。
(e5.通知のさらなる変形例)
サーバー300から音声処理装置200に送信される通知は、発話による認識指令に関する問合せを含んでもよい。例えば、音声認識エンジン310は、音声データ40を認識して得られたテキストデータに基づき辞書340を検索し、検索結果に基づき、辞書340にテキストデータが登録されていないと判断したとき、通知部325は、問合せの通知を生成し、音声処理装置200に送信する。音声処理装置200は、サーバーから受信する問合せをスピーカー29による音声またはLED23Aの点灯で出力する。
具体的には、上記のようなステープル起動の間隔で発話がなされる場合、音声処理装置200はステープル起動の間隔でなされた短い発話による複数の音声データ40をサーバー300に送信する。音声認識エンジン310は、複数の音声データ40を認識し、複数のテキストデータを生成する。音声認識エンジン310は、これら複数のテキストデータを統合し、統合されたテキストデータに基づき辞書340を検索する。検索の結果、音声認識エンジン310は、当該テキストデータが辞書340に登録されていないと判断すると、通知部325は、指令に関する問合せの音声データを生成し、当該音声データを含む通知を音声処理装置200に送信する。
音声処理装置200は、サーバー300から受信した通知に含まれた問合せの音声データをスピーカー29で再生し、または、問合せを受信した旨をLED23Aの点灯により報知する。これにより、ユーザーに対して、MFP100を操作するための発話を促すことができる。
この場合、音声認識エンジン310は、上記の問合せにテキストデータの候補を含ませてもよい。具体的には、音声認識エンジン310は、音声認識処理によるテキストデータと辞書340の各テキストデータとの類似度を算出し、類似度が高いテキストデータを辞書340から抽出する。上記の問合せの音声データは、この類似度が高いテキストデータから生成された音声データであってもよい。これにより、ユーザーに対して、MFP100を操作するための発話を促す際に、候補となる操作(または指令)をガイドすることができる。
<F.優先度判断部323の処理>
図13は、実施の形態にかかるMFPの状態に関する優先度を表す状態優先度テーブル342Aの一例を模式的に示す図である。図14は、実施の形態にかかるMFPに対する操作の指令に関する優先度を表す指令優先度テーブル343Aの一例を模式的に示す図である。図13と図14を参照して、優先度判断部323の処理を説明する。
(f1.状態の優先度に従う処理)
実施の形態の変形例として、図8の指令可否テーブル342に代えて図13の状態優先度テーブル342Aを用いてもよい。指令可否テーブル342によれば、MFP100は動作音が小さい状態3421であるとき、サーバー300はユーザーの発話に基づく指令58をMFP100へ送信することが許可される。これに対して、状態優先度テーブル342Aでは、ジョブ実行中にMFP100が取り得る状態3423と、各状態3423に対応づけて優先度3424が設定されている。
この変形例では、MFP100は、自装置に対する指令を受付ける。ジョブを実行中に遷移し得る各状態3423は、MFP100がジョブを実行中に受付ける指令を、他の指令よりも優先的に処理することを示す優先度3242が設定されている。
状態優先度テーブル342Aに示されるように、MFP100のジョブ実行中に取り得る各状態3423は、サーバー300からの指令58を他の指令よりも優先的に処理すべき度合いを示す優先度3424が設定されている。また、優先度3424が示す値が大きいほど、指令が優先的に処理されるべき度合いは高い。
MFP制御モジュール320が音声データ40に基づく認識指令を受付けたとき、優先度判断部323は、MFP状態341に基づき状態優先度テーブル342Aを検索する。検索の結果に基づき、優先度判断部323は、MFP状態341が、状態優先度テーブル342Aの所定値以上の優先度3424に対応付けられた状態3423のうちのいずれと一致するか否かを判断する。優先度判断部323がMFP状態341は、当該いずれかの状態3423と一致する判断したとき、指令生成部324は、当該認識指令を指令58として含む指令フレーム57をMFP100に送信する。
(f2.指令の優先度に従う処理)
実施の形態の変形例として、図9の可能指令テーブル343に代えて図13の指令優先度テーブル343Aを用いてもよい。指令優先度テーブル343Aでは、音声データ40に基づき認識される得る複数の指令3432と、各指令3432に対応づけて優先度3433を有する。実施の形態では、音声データ40に基づく指令は、MFP100を緊急に操作するための指令を含む。可能指令テーブル343または指令優先度テーブル343Aに登録された各指令が示す操作の緊急度は、MFP100に対しなされる他の操作の緊急度よりも高い。
指令優先度テーブル343Aでは、優先度3433は、対応の指令3432が、MFP100に対しなされる他の操作の指令よりも優先して実行されるべき度合い(優先度)を示している。指令優先度テーブル343Aは、例えば、優先度3433が示す値が大きいほど優先度は高い、言い換えると当該指令によりMFP100を緊急に操作する緊急度は高い。
MFP制御モジュール320が音声データ40に基づく認識指令を受付けたとき、優先度判断部323は、受付けた認識指令に基づき指令優先度テーブル343Aを検索する。検索の結果に基づき、優先度判断部323は、認識指令が、指令優先度テーブル343Aの所定値以上の優先度3424に対応付けられた指令3432のうちのいずれかと一致するかを判断する。優先度判断部323が認識指令は、当該いずれかの指令3432と一致する判断したとき、指令生成部324は、当該認識指令を指令58として含む指令フレーム57をMFP100に送信する。
(f3.優先度の組合せ)
優先度判断部323は、状態優先度テーブル342Aと指令優先度テーブル343Aとの組合せに基づき判断を実施してもよい。
例えば、優先度判断部323は、状態優先度テーブル342Aの検索の結果に基づき、MFP状態341が所定状態(すなわち、所定値以上の優先度を有した状態)でないと判断した場合において、さらに、認識指令に基づき指令優先度テーブル343Aを検索する。この検索の結果に基づき、優先度判断部323は、認識指令に一致する指令3432に対応の優先度3433は所定値以上を示すと判断したとき、指令生成部324は、当該認識指令を指令58として含む指令フレーム57をMFP100に送信する。これにより、例えば、認識指令が、緊急性を有する操作指令(ジョブのキャンセル、またはジョブのストップなど)であれば、MFP100の状態にかかわらず認識された指令58がMFP100に送信されて、MFP100を緊急に操作することができる。
<G.システム1の変形例>
システム1の変形例にかかるシステム1Aでは、MFPに音声認識エンジンおよびMFP制御モジュールを備えられる。図15は、実施の形態にかかるシステム1Aの構成の変形例を模式的に示す図である。図16は、他の実施の形態にかかるMFP100Aの機能構成の一例を模式的に示す図である。図17は、他の実施の形態にかかるMFP100Aの処理のフローチャートである。
図15を参照して、システム1Aは、音声処理装置200、および音声処理装置200とLAN等により無線通信するMFP100Aを備える。図16を参照して、MFP100Aは、音声処理装置200からの音声データ40の音声認識処理を実行する音声認識エンジン310およびMFP制御モジュール320A、これらの周辺機能を提供する周辺機能モジュール101A、および記憶部165を備える。図16のMFP100Aが備える各部は、「情報処理部」の一実施例である。図16のMFP100Aが備える各部は、CPU150が記憶部160または記録媒体176に格納されたプログラムを実行することにより実現される。なお、図16のMFP100Aが備える各部は、ASICまたはFPGAなどの回路、または回路とプログラムの組合せにより実現されてもよい。
記憶部165は、記憶部160または記録媒体176の記憶領域を含んで構成される。記憶部165は、図7に示された記憶部34に格納されるものと同様の情報を格納するので、ここでは説明は繰り返さない。
周辺機能モジュール101Aは、図10に示された機能構成と同様の構成を有する。具体的には、周辺機能モジュール101Aは、MFP制御モジュール320Aからジョブデータ50の指令(PJLデータ51)または指令58を受け付ける指令受付部110A、指令実行部120、ユーザー指令受付部130および状態提供部140Aを備える。指令受付部110Aは、MFP制御モジュール320Aからジョブデータ50または指令58を受付ける。指令実行部120およびユーザー指令受付部130は図10のそれらと同様の機能を備えるので説明は繰り返さない。
状態提供部140Aは、MFP100の状態を周期的に検知する、または状態の変更があったときに検知する状態検知部141を含む。状態提供部140Aは、状態検知部141により検知された状態を、MFP状態341として記憶部165に格納する。
MFP制御モジュール320Aは、記憶部165のMFP状態341、指令可否テーブル342および可能指令テーブル343に従い、周辺機能モジュール101Aに指令58を送信するか否かを判断するための判断部321A、記憶部165のMFP状態341を読出すことにより状態を取得する状態取得部322A、指令58(指令フレーム57)を生成して周辺機能モジュール101Aに送信する指令生成部324A、および音声処理装置200に通知を送信する通知部325Aを含む。判断部321Aは、優先度判断部323Aを備える。MFP制御モジュール320Aが備える各部は、図7で説明したものと同様の機能を備えるので、説明は繰り返さない。
図17を参照してMFP100Aの処理を説明する。なお、MFP100Aは、ジョブを実行中であるとする。まず、MFP100Aは、音声処理装置200から音声データ40を受信すると(ステップS31)、音声認識エンジン310は音声データ40の音声認識処理を実施し、認識に結果に基づく認識指令を出力する(ステップS33)。
MFP制御モジュール320Aでは、判断部321Aが認識指令を指令58として出力するか否かを判断する(ステップS35)。ステップS35の判断処理は、図11のステップS9、S11、S19などと同様の処理を含むので、説明は繰り返さない。
判断部321Aは、認識指令を送信すると判断すると(ステップS43でYES)、認識指令は、指令生成部324Aにより指令58として周辺機能モジュール101Aに出力される(ステップS45)。指令実行部120は、ステップS45で受付けた指令58を実行する(ステップS46)。これにより、MFP100Aの各部が指令58に基づき制御される。周辺機能モジュール101Aは、指令58の実行を完了した旨の通知をMFP制御モジュール320Aに出力する(ステップS47)。
一方、判断部321は、認識指令は送信不可と判断すると(ステップS43でNO)、認識指令は指令58として周辺機能モジュール101Aに出力されずに、通知部325Aは、指令実行不可の通知を音声処理装置200に送信する(ステップS57)。ステップS47またはステップS57で送信される通知は、図11で説明したケースと同様の音声データを含む。
また、他の実施の形態においても、音声処理装置200は、MFP100Aに備えられてもよい。また。図15と図16に示すシステム1Aにおいても、上記に述べた優先度判断を含む各種変形例を適用することができる。
本実施の形態では、MFP状態341またはユーザーの発話による認識指令の内容に基づき、判断部321(または判断部321A)が認識指令は送信可と判断しとき、認識指令である指令58がMFP100(または周辺機能モジュール101A)に送信される。したがって、実施の形態の判断部321(または判断部321A)による音声データ40の認識指令の送信を許可するか否かの判断方法は、特許文献1のように、MFPが稼働中であればMFPに対する音声データの入力を一律に禁止する方法とは異なる。
これにより、例えば、ユーザーが間違ってMFP100(100A)に対して実行開始を指示したジョブであっても、MFP状態341が所定状態(動作音が小さい状態であって音声データ40を正確に認識可能な状態)であれば発話に基づく指令(例えば、キャンセル、ストップ、ジョブへの割込みなど)で当該ジョブの実行を中断または停止するようにMFP100(100A)を操作することができる。また、MFP状態341が所定状態でなくとも、発話に基づく指令が所定指令(緊急度の高い指令)であれば、当該発話に基づく所定指令をMFP100(100A)に送信することにより、ジョブの実行を中断または停止するようにMFP100(100A)を操作することができる。したがって、本実施の形態では、音声の認識結果によるMFP100の改善された操作性が提供される。
<H.プログラム>
各実施の形態では、上記に述べた処理をMFP100(100A)およびサーバー300に実行させるためのプログラムが提供される。このようなプログラムは、少なくとも上記の図11のシーケンスまたは図17のフローチャートに従う処理のプログラムを含む。MFP100(100A)およびサーバー300のコンピューターに付属するフレキシブルディスク、CD-ROM(Compact Disk-Read Only Memory)、ROM、RAMおよびメモリカードなどのコンピューター読み取り可能な記録媒体176,37にて記録させて、プログラム製品として提供することもできる。あるいは、コンピューターに内蔵するハードディスクなどの記録媒体にて記録させて、プログラムを提供することもできる。また、ネットワーク400を介したダウンロードによって、プログラムを提供することもできる。プログラムは、CPUなどの1つ以上のプロセッサにより、またはプロセッサとASIC,FPGAなどの回路との組合せにより実行され得る。
なお、プログラムは、コンピューターのOS(Operating System)の一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列で所定のタイミングで呼出して、プロセッサに処理を実行させるものであってもよい。その場合、プログラム自体には上記モジュールが含まれずOSと協働して処理が実行される。このようなモジュールを含まないプログラムも、各実施の形態のプログラムに含まれ得る。
また、各実施の形態にかかるプログラムは他のプログラムの一部に組込まれて提供されるものであってもよい。その場合にも、プログラム自体には上記他のプログラムに含まれるモジュールが含まれず、他のプログラムと協働して、プロセッサに処理を実行させる。このような他のプログラムに組込まれたプログラムも、各実施の形態にかかるプログラムに含まれ得る。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
1,1A システム、40,3443 音声データ、41 間隔通知、50 ジョブデータ、57 指令フレーム、58 指令、61 状態、341 MFP状態、62 所要時間、100,100A MFP、101A 周辺機能モジュール、110,110A 指令受付部、120 指令実行部、130 ユーザー指令受付部、140,140A 状態提供部、141 状態検知部、151 画像処理部、152 画像形成部、153 ファクシミリ制御部、154 画像出力部、155 画像読取部、157 データ通信部、180 画像形成ユニット、200 音声処理装置、300 サーバー、310 音声認識エンジン、320,320A MFP制御モジュール、321,321A 判断部、322,322A 状態取得部、323,323A 優先度判断部、324,324A 指令生成部、325,325A 通知部、340 辞書、342 指令可否テーブル、342A 状態優先度テーブル、343 可能指令テーブル、343A 指令優先度テーブル、344 ガイダンスデータ、400 ネットワーク。

Claims (15)

  1. 画像形成装置と、
    発話の音声を集音し、集音された音声の音声データを生成する音声処理装置と、
    サーバーと、を備え、
    前記サーバーは、
    当該サーバーを制御する制御部と、
    前記画像形成装置および前記音声処理装置と通信する通信回路と、を含み、
    前記制御部は、
    前記音声処理装置から受信する前記音声データを認識処理して前記画像形成装置を操作するための指令を生成し、
    ジョブを実行中の前記画像形成装置の状態が所定状態であるとき、前記指令を前記画像形成装置に送信し、
    ジョブを実行中の前記画像形成装置の状態が所定状態でなく、前記指令が所定指令である場合には、前記指令を前記画像形成装置に送信し、
    ジョブを実行中の前記画像形成装置の状態が所定状態でなく、前記指令が所定指令でない場合には、前記指令を前記画像形成装置に送信しないよう前記通信回路を制御する、システム。
  2. 前記所定状態は、ジョブを実行中の前記画像形成装置の動作音が小さい状態を含む、請求項1に記載のシステム。
  3. 前記画像形成装置は、当該画像形成装置に対する指令を受付け、
    前記ジョブを実行中の各状態は、前記画像形成装置がジョブを実行中に受付ける指令を、他の指令よりも優先的に処理することを示す優先度が設定されて、
    前記所定状態の前記優先度は、他の状態の当該優先度よりも高い、請求項1に記載のシステム。
  4. 前記所定状態は、ジョブを実行中に遷移し得る画像形成装置の状態を示す、請求項1から3のいずれかに記載のシステム。
  5. 前記所定指令は、前記画像形成装置を操作するための他の指令よりも優先的に処理される指令を含む、請求項1から4のいずれか1項に記載のシステム。
  6. 前記所定指令は、前記画像形成装置を緊急に操作するための指令を含む、請求項5に記載のシステム。
  7. 前記音声処理装置は、前記サーバーからの通知に基づく音声を出力し、
    前記制御部は、
    前記画像形成装置がジョブを実行中に前記音声処理装置から前記音声データを受信した場合、前記画像形成装置の状態が所定状態でないとき、当該音声データから生成される前記指令を前記画像形成装置に送信せずに、当該指令は前記画像形成装置により実行されない旨の通知を前記音声処理装置に送信するよう前記通信回路を制御する、請求項1から6のいずれか1項に記載のシステム。
  8. 前記通知は、前記ジョブの実行にかかる時間の情報を含む、請求項7に記載のシステム。
  9. 前記サーバーは、前記画像形成装置から周期的に状態を受信する、または当該画像形成装置の状態が変化したときに当該状態を受信する、請求項1から8のいずれか1項に記載のシステム。
  10. 前記音声処理装置は、前記サーバーからの所定通知の受信周期に同期して当該所定通知を音声または点灯で出力し、
    前記ジョブは、前記画像形成装置の状態を、周期的に動作音を出力させる状態に変化させるジョブを含み、
    前記制御部は、
    前記画像形成装置から受信する状態に基づき前記動作音が出力される間隔を計測し、
    計測された間隔で、前記音声処理装置に前記所定通知を送信するよう前記通信回路を制御する、請求項1から9のいずれか1項に記載のシステム。
  11. 前記音声処理装置は、前記サーバーから受信する問合せを音声または点灯で出力し、
    前記制御部は、さらに、
    前記画像形成装置を操作するための複数の指令を格納する指令格納部を含み、
    前記制御部は、前記認識処理により生成される前記指令と、前記指令格納部の各前記複数の指令と照合し、照合の結果に基づく当該指令に関する前記問合せを、前記音声処理装置に送信するよう前記通信回路を制御する、請求項1から10のいずれか1項に記載のシステム。
  12. 前記画像形成装置は、当該画像形成装置の動作音を小さくする静音モードを有し、
    前記制御部は、前記音声処理装置から前記音声データを受信するとき、前記画像形成装置の動作モードを前記静音モードに切り替える操作の指令を、前記画像形成装置に送信するよう、前記通信回路を制御する、請求項1から11のいずれか1項に記載のシステム。
  13. 画像形成ユニットと、
    情報処理部と、
    発話の音声を集音し、集音された音声の音声データを生成する音声処理装置と通信する通信回路を、を備える画像形成装置であって、
    前記情報処理部は、
    前記音声処理装置から受信する前記音声データを認識処理して前記画像形成ユニットを操作するための指令を生成し、
    ジョブを実行中の前記画像形成ユニットの状態が所定状態であるとき、前記指令を前記画像形成ユニットに送信し、
    ジョブを実行中の前記画像形成ユニットの状態が所定状態でなく、前記指令が所定指令である場合には、前記指令を前記画像形成ユニットに送信し、
    ジョブを実行中の前記画像形成ユニットの状態が所定状態でなく、前記指令が所定指令でない場合には、前記指令を前記画像形成ユニットに送信しない、画像形成装置。
  14. 画像形成ユニットと接続可能な情報処理装置に備えられるプロセッサが実行する方法であって、
    発話の音声に基づく音声データを認識処理して前記画像形成ユニットを操作するための指令を生成するステップと、
    前記情報処理装置を制御するステップと、を備え、
    前記制御するステップは、
    ジョブを実行中の前記画像形成ユニットの状態が所定状態であるとき、前記指令を前記画像形成ユニットに出力し、
    ジョブを実行中の前記画像形成ユニットの状態が所定状態でなく、前記指令が所定指令である場合には、前記指令を前記画像形成ユニットに出力し、
    ジョブを実行中の前記画像形成ユニットの状態が所定状態でなく、前記指令が所定指令でない場合には、前記指令を前記画像形成ユニットに出力しないよう前記情報処理装置を制御するステップを、含む、方法。
  15. 請求項14に記載の方法をコンピューターに実行させるためのプログラム。
JP2018213043A 2018-11-13 2018-11-13 システム、画像形成装置、方法およびプログラム Active JP7206827B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018213043A JP7206827B2 (ja) 2018-11-13 2018-11-13 システム、画像形成装置、方法およびプログラム
US16/668,464 US20200152201A1 (en) 2018-11-13 2019-10-30 System, image forming apparatus, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018213043A JP7206827B2 (ja) 2018-11-13 2018-11-13 システム、画像形成装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2020080052A JP2020080052A (ja) 2020-05-28
JP7206827B2 true JP7206827B2 (ja) 2023-01-18

Family

ID=70550654

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018213043A Active JP7206827B2 (ja) 2018-11-13 2018-11-13 システム、画像形成装置、方法およびプログラム

Country Status (2)

Country Link
US (1) US20200152201A1 (ja)
JP (1) JP7206827B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7483463B2 (ja) * 2020-03-30 2024-05-15 キヤノン株式会社 情報処理装置、制御方法、プログラム及び情報処理システム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000029585A (ja) 1998-07-08 2000-01-28 Canon Inc 音声コマンド認識画像処理装置
JP2006095984A (ja) 2004-09-30 2006-04-13 Canon Inc プリンタ制御装置およびプリンタ制御方法
JP2011039571A (ja) 2009-08-06 2011-02-24 Konica Minolta Business Technologies Inc 画像処理装置、音声操作履歴情報共有方法および操作項目判別テーブル共有方法
JP2016109933A (ja) 2014-12-08 2016-06-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声認識方法ならびに音声認識システムおよびそれに含まれる音声入力装置
JP2018157370A (ja) 2017-03-17 2018-10-04 株式会社リコー 情報処理装置、制御方法及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000029585A (ja) 1998-07-08 2000-01-28 Canon Inc 音声コマンド認識画像処理装置
JP2006095984A (ja) 2004-09-30 2006-04-13 Canon Inc プリンタ制御装置およびプリンタ制御方法
JP2011039571A (ja) 2009-08-06 2011-02-24 Konica Minolta Business Technologies Inc 画像処理装置、音声操作履歴情報共有方法および操作項目判別テーブル共有方法
JP2016109933A (ja) 2014-12-08 2016-06-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声認識方法ならびに音声認識システムおよびそれに含まれる音声入力装置
JP2018157370A (ja) 2017-03-17 2018-10-04 株式会社リコー 情報処理装置、制御方法及びプログラム

Also Published As

Publication number Publication date
JP2020080052A (ja) 2020-05-28
US20200152201A1 (en) 2020-05-14

Similar Documents

Publication Publication Date Title
US11475892B2 (en) Speech control system, speech control method, image processing apparatus, speech control apparatus, and storage medium
US12015746B2 (en) Image processing system, setting control method, image processing apparatus, and storage medium
JP2023051952A (ja) 音声操作システム及び音声操作方法
US11792338B2 (en) Image processing system for controlling an image forming apparatus with a microphone
US11327697B2 (en) Information processing apparatus and startup method for input-output device
JP2017220895A (ja) 情報処理システム、電子機器、情報処理装置、情報処理方法、電子機器処理方法、及びプログラム
JP2019215485A (ja) 画像形成装置、画像形成システム、制御方法および制御プログラム
JP7206827B2 (ja) システム、画像形成装置、方法およびプログラム
US20210398530A1 (en) Information processing apparatus that cooperates with smart speaker, information processing system, control methods, and storage media
US11683422B2 (en) Image processing system, image processing apparatus, and image processing method
EP3764351B1 (en) Voice-operated system, controller, control program, and processing device
US11838459B2 (en) Information processing system, information processing apparatus, and information processing method
US20200274979A1 (en) System, image forming apparatus, method, and program
EP3716040A1 (en) Image forming apparatus and job execution method
JP7361509B2 (ja) 周辺装置管理システム、印刷装置制御システム、制御方法、印刷制御装置及びプログラム
US11700338B2 (en) Information processing system that receives audio operations on multifunction peripheral, as well as image processing apparatus and control method therefor
JP7286321B2 (ja) 情報処理システム、情報処理装置、制御方法、プログラム
US11368593B2 (en) Image forming system allowing voice operation, control method therefor, and storage medium storing control program therefor
US11647130B2 (en) Information processing system capable of connecting a plurality of voice control devices, method of controlling information processing system, and storage medium
JP2004077601A (ja) 音声入力機能を有する稼働装置
CN115811576A (zh) 带交互代理功能的图像形成***及其控制方法和存储介质
US20210304753A1 (en) Information processing apparatus, information processing method, electronic device and information processing system
JP7261029B2 (ja) サーバシステム、制御方法、通信システム
JP7447458B2 (ja) 制御装置、制御システム及び制御プログラム
US20230336669A1 (en) Notification system notifying user of message, control method therefor, and storage medium storing control program therefor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220802

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221219

R150 Certificate of patent or registration of utility model

Ref document number: 7206827

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150