以下、情報処理システム、情報処理方法、情報処理装置及び出力装置の適用例となる入力操作システムの説明をする。
〔システムの概略〕
図1は、第1の実施の形態に係る入力操作システムの構成の一例を示す図である。図1に示すように、第1の実施の形態の入力操作システム1は、スマートスピーカ2、情報認識サーバ装置3、AIアシスタントサーバ装置4、クライアントPC6及び1以上の複合機7(MFP:Multifunction Peripheral。以下、単にMFP7とも呼ぶ)を、例えばLAN(Local Area Network)等のネットワーク8を介して相互に接続することで形成されている。
ここで、入力操作システム1は、情報処理システムの一例である。また、スマートスピーカ2は、音声入力によって、例えば、音楽や動画などの各種コンテンツ、天気、ニュース等を視聴することを可能にする人工知能を搭載した機器である。また、スマートスピーカ2は、照明や家電等の各種機器を遠隔操作する機能も備える。情報認識サーバ装置3は、スマートスピーカ2で得られた音声情報を受信し、テキストデータに変換する機能を備える。AIアシスタントサーバ装置4は、情報認識サーバ装置3と連携してスマートスピーカ2から得られた音声情報を処理する機能を備える。クラウドサービス装置5は、情報認識サーバ装置3及びAIアシスタントサーバ装置4を一つに纏めてネットワーク8を介して相互に接続し、MFP7に対する印刷実行命令等を生成して送信する。クライアントPC6は、クラウドサービス装置5で生成された印刷実行命令等を受信し、MFP7に対して所定の処理を実行する。
なお、スマートスピーカ2は情報入力装置の一例、クラウドサービス装置5を構成する情報認識サーバ装置3及びAIアシスタントサーバ装置4のうちの少なくとも一つ又はその両方は、サーバ装置の一例、クライアントPC6は情報処理装置の一例、及びMFP7は出力装置の一例である。但し、上述したネットワーク8は有線LAN、無線LANのいずれで構成されてもよい。なお、スマートスピーカ2は、例えば、対話型の音声入力操作に対応したAIアシスタント機能を持つスピーカを指し、内蔵されているマイク等で音声等を認識し、情報の検索や連携家電の操作等を行う機器をいう。また、スマートスピーカ2は、入力操作システム1において1以上備えられていてもよい。
スマートスピーカ2は、例えば、ユーザ(使用者ともいう)の発話による音声入力操作を受け付ける。また、スマートスピーカ2は、音声入力操作によって得られる情報に基づいて、MFP7に対する印刷処理や印刷実行命令等(以下、所定の処理ともいう)を実行する入力操作システム1における情報入力装置として機能する。さらに、スマートスピーカ2は、受け付けた音声入力操作に基づく音声データ(以下、音声情報ともいう)を含むデータ(以下、単に音声情報等ともいう)を、ネットワーク8を介して情報認識サーバ装置3(又はクラウドサービス装置5)に送信する。さらに、スマートスピーカ2は、受け付けた音声入力操作から得られる音声情報を補完するために、ユーザにフィードバックするためのマイク機能、カメラ機能等を有してもよい。本発明の実施の形態では、上述した音声情報からMFP7に対して印刷実行命令が送信される場合について説明する。
情報認識サーバ装置3は、スマートスピーカ2から送信された音声情報等をテキストデータに変換する。なお、情報認識サーバ装置3は、第1サーバ装置に相当する。
AIアシスタントサーバ装置4は、ネットワーク8を介して情報認識サーバ装置3と相互に接続されることで、上述したクラウドサービス装置5を構成する。
但し、クラウドサービス装置5の機能の一部又は全部を、スマートスピーカ2又はクライアントPC6が有していてもよい。クラウドサービス装置5の機能の全部をスマートスピーカ2又はクライアントPC6が有している場合、入力操作システム1にクラウドサービス装置5は含まれていなくてもよい。このような場合、スマートスピーカ2はクラウドサービス装置5を介さずにクライアントPC6と通信してもよく、入力操作システム1は、スマートスピーカ2、クライアントPC6及びMFP7を纏めた入力応答システム9を構築してもよい。また、クライアントPC6は、例えば1又は複数のサーバから構成される印刷管理サーバ等でもよい。
上述したように、クラウドサービス装置5は、情報認識サーバ装置3とAIアシスタントサーバ装置4を含む場合について説明したが、情報認識サーバ装置3の機能の一部又は全部をAIアシスタントサーバ装置4が有していてもよいし、AIアシスタントサーバ装置4の機能の一部又は全部を情報認識サーバ装置3が有していてもよい。つまり、情報認識サーバ装置3とAIアシスタントサーバ装置4が互いの機能を補完し合う構成でもよい。また、クラウドサービス装置5は一つのサーバによって構成されていてもよいし、3以上のサーバによって構成されていてもよい。
また、AIアシスタントサーバ装置4は、管理データベース401(以下、管理DB401という)及び紐づけ用データベース402(以下、紐づけ用DB402という)を備えている。管理DB401及び紐づけ用DB402は、例えば、クラウドサービス装置5がネットワーク8上に備えるHDD等の記憶部を用いることができる。このほか、管理DB401及び紐づけ用DB402のうち、一方又は両方を、ネットワーク8を介してクラウドサービス装置5でアクセス可能な別のサーバ装置に記憶してもよい。
管理DB401には、例えば、テキストデータ、画像データ及び音声データ等、AIアシスタントサーバ装置4が提供するコンテンツ(データ)が記憶されている。
なお、管理DB401で管理される情報は、例えば、ネットワーク8を介して接続されるクライアントPC又はクラウドサービス装置5によって新規追加又は変更することができる。図1では、管理DB401とクライアントPC6は別体として図示しているが、同一のサーバとして構成してもよい。この場合、後述する管理プログラムは、管理DB401に対してクライアントPC6又はMFP7等に対する印刷実行命令を送信することによって、管理DB401が管理する各種情報を取得してもよい。
一方、紐づけ用DB402には、例えば、各スマートスピーカ2を特定するための情報入力装置のデバイスIDと、各スマートスピーカ2に関連付けられたMFP7を含む出力装置(MFP_#1、MFP_#2、等)の機器IDとが関連付けられて記憶されている。この紐づけ用DB402の詳細については、後述する。
AIアシスタントサーバ装置4は、情報認識サーバ装置3によって変換されたユーザの意図に基づいてMFP7が解釈可能な命令(MFP7に対する印刷実行命令等)に変換する。AIアシスタントサーバ装置4は、変換した印刷実行命令等を、ネットワーク8を介してクライアントPC6に送信する。ここで、印刷実行命令は、例えば、ユーザがスマートスピーカ2を介して音声入力操作により与えたMFP7に対する印刷指示に基づいて生成されるものである。なお、AIアシスタントサーバ装置4は、第2サーバ装置に相当する。なお、印刷指示は、出力要求の一例である。
本実施の形態では、管理DB401及び紐づけ用DB402は、AIアシスタントサーバ装置4に含まれることを例示しているが、それぞれAIアシスタントサーバ装置4と別に設けられてもよいし、いずれか一方がAIアシスタントサーバ装置4に含まれ、他方がAIアシスタントサーバ装置4と別に設けられてもよい。
クライアントPC6は、例えば、AIアシスタントサーバ装置4から送信されたMFP7に対する印刷実行命令、印刷実行命令等を対象のMFP7に対して送信する。なお、AIアシスタントサーバ装置4(又はクラウドサービス装置5)とクライアントPC6との通信は、上述したネットワーク8を介して接続される。
さらに、クライアントPC6は、例えば、MFP7における音声、画像(静止画像、動画像)を含むコンテンツの出力を管理する。したがって、クライアントPC6は、MFP7にどのようなユーザがどのような時間にファイルの印刷指示、コンテンツの出力指示等をしているかを示す管理情報を含む情報を記憶、管理する。なお、クライアントPC6が記憶、管理する管理情報は、ネットワーク8を介して接続されるクライアントPC等から閲覧できてもよい。さらに、管理情報は、クライアントPC又はクラウドサービス装置5によって新規追加、変更等がされてもよい。本実施の形態では、出力装置として主にMFP7を例に説明する。
本実施の形態では、上述したように、情報認識サーバ装置3及びAIアシスタントサーバ装置4の二つのサーバ装置を一つに纏めたクラウドサービス装置5として説明する。但し、情報認識サーバ装置3、AIアシスタントサーバ装置4のそれぞれは、さらに複数のサーバ装置に分けて実現されてもよい。
〔ハードウェア構成〕
<スマートスピーカのハードウェア構成>
図2は、スマートスピーカのハードウェア構成の一例を示す図である。情報入力装置の一例であるスマートスピーカ2は、図2に示すようにCPU21、RAM22、ROM23、インターフェイス部(I/F部)24及び通信部25を含むハードウェア資源を、内部バス26を介して相互に接続される。
CPU21は、スマートスピーカ2全体を統括制御する制御デバイスである。
RAM22は、例えば、ROM23等に記憶された各種プログラムがダウンロードされ、CPU21によって各種処理が実行されるワークエリアとしての機能を有する。
ROM23には、操作音声処理プログラム等を含む操作指示処理プログラム、及びその他の各種プログラムを構成するデータが記憶されている。CPU21は、これらの処理プログラムを実行することで、MFP7に対する音声入力操作による処理を可能とする。また、CPU21は、クラウドサービス装置5から取得したデータのタッチパネル27への表示制御、スピーカ部28を介したフィードバックのための音声出力制御、画像出力制御等を実行する。
I/F部24には、タッチパネル27、スピーカ部28、マイクロホン部29及び撮像部(カメラ部)30が接続される。
通信部25は、ユーザによる音声入力操作によって得られた情報を、ネットワーク8を介して情報認識サーバ装置3に送信する。また、通信部25は、ネットワーク8を介して他の装置と通信を行う際、有線、無線いずれの通信形態でも通信を行うことが可能である。
内部バス26は、CPU21、RAM22、ROM23、I/F部24及び通信部25を接続する汎用バスである。この内部バス26は、スマートスピーカ等の汎用機器で一般的に用いられるバスであればその種類は問わない。
タッチパネル27は、例えば、液晶表示部(LCD:Liquid Crystal Display)とタッチセンサとが一体的に形成されたものである。タッチパネル27は、液晶表示部上に配置されたタッチキー等に対してユーザがタッチ動作等を行うことによって、所望の動作が指定される。
スピーカ部28は、ユーザに対して、不足する情報の入力等を促すための音声による音声フィードバックを行う。
マイクロホン部29は、例えば、MFP7に対して音声入力操作によって印刷操作するために、ユーザによって与えられた音声情報等を取得する。取得された音声情報等は、通信部25を介して情報認識サーバ装置3に送信され、情報認識サーバ装置3でテキストデータに変換される。
撮像部(カメラ部)30は、スマートスピーカ2を使用するユーザ及びその他の画像等を撮影する。撮影された画像等は、動画像データ若しくは静止画像データ(以下、単に画像データと呼ぶ)として通信部25を介して情報認識サーバ装置3に送信される。
<情報認識サーバ装置のハードウェア構成>
図3は、情報認識サーバ装置のハードウェア構成の一例を示す図である。
情報認識サーバ装置3は、図3に示すように、CPU31、RAM32、ROM33、HDD(Hard Disk Drive)34、インターフェイス部(I/F部)35及び通信部36を含むハードウェア資源を、内部バス37を介して相互に接続される。また、I/F部35には、表示部38及び操作部39が接続される。
HDD34には、以下の操作音声変換プログラムを構成するデータが記憶されている。なお、操作音声変換プログラムは、例えば、スマートスピーカ2から受信した音声情報等をテキストデータに変換する。続いて、変換したテキストデータを予め定義された辞書情報と一致するか否かを判断する。辞書情報と一致するか否かの判断において、各プログラムは、辞書情報と一致した場合にはテキストデータをユーザの意図を示すインテント(Intent)及び所定の処理の実行条件などの変数を示すパラメータに変換する。その後、操作音声変換プログラムは、ユーザの意図を示すインテント及び所定の処理の実行条件などの変数を示すパラメータを、AIアシスタントサーバ装置4に送信する。
CPU31は、操作音声変換プログラム等を含む各種プログラムを実行する。つまり、情報認識サーバ装置3は、音声データを受信して、音声を解析する装置として機能する。なお、操作音声変換プログラムは、一つのサーバ装置で実行されてもよいし、それぞれ異なるサーバ装置で実行されてもよい。さらに、複数のサーバ装置の連携によって、これらのプログラムが実行されてもよい。
RAM32は、例えば、ROM33等の記憶部に記憶された各種プログラムがダウンロードされ、CPU31によって各種処理が実行されるワークエリアとしての機能を有する。
ROM33には、HDD34に記憶された各種プログラム以外のその他のプログラムを構成するデータが記憶されている。CPU31は、ROM33に記憶された各種プログラムを実行することで、スマートスピーカ2及びAIアシスタントサーバ装置4との間の制御を行ってもよい。
I/F部35には、表示部38及び操作部39が接続される。
通信部36は、ユーザからの音声入力操作によって得られた音声情報をスマートスピーカ2から受信する。また、通信部36は、ネットワーク8を介して他の装置と通信を行う際、有線、無線いずれの通信形態でも通信を行うことが可能である。
内部バス37は、CPU31、RAM32、ROM33、HDD34、I/F部35及び通信部36を接続する汎用バスである。この内部バス37は、情報認識サーバ装置3がサーバ装置としての機能が実現できるものであれば、その種類は問わない。
表示部38は、例えば、液晶表示部(LCD:Liquid Crystal Display)で構成され、例えば、情報認識サーバ装置3の各種状態を表示する。
操作部39は、例えば、液晶表示部とタッチセンサとが一体的に形成された、いわゆるタッチパネルである。操作者(ユーザ)は、操作部39を用いて所望の動作の実行命令を行う場合、操作部39に表示された操作ボタン(ソフトウェアキー)等を接触操作することで、所望の動作を指定する。
また、操作音声処理プログラム等を含む操作指示処理プログラムは、インストール可能な形式または実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)などのコンピュータ装置で読み取り可能な記録媒体に記録して提供してもよい。また、CD−R、DVD(Digital Versatile Disk)、ブルーレイディスク(登録商標)、半導体メモリなどのコンピュータ装置で読み取り可能な記録媒体に記録して提供してもよい。また、インターネット等のネットワーク経由でインストールするかたちで提供してもよいし、情報認識サーバ装置3のROM等の記憶部に予め組み込んで提供してもよい。
<AIアシスタントサーバ装置のハードウェア構成>
図4は、AIアシスタントサーバ装置のハードウェア構成の一例を示す図である。AIアシスタントサーバ装置4は、図4に示すように、CPU41、RAM42、ROM43、HDD44、インターフェイス部(I/F部)45及び通信部46を含むハードウェア資源を、内部バス47を介して相互に接続している。I/F部45には、表示部48及び操作部49が接続されている。
HDD44のAI記憶部40には、ユーザが音声入力により指示する印刷実行命令を解釈するための辞書情報が記憶されている。この辞書情報には、後述するエンティティ(Entity)情報、アクション(Action)情報及びインテント情報が含まれる。また、HDD44には、以下に示すユーザ管理テーブル402a及び装置管理テーブル402bがそれぞれ記憶されている。これらのテーブルは、予め所定の設定値が与えられているが、適宜追加や変更等が行われてもよい。以下に、ユーザ管理テーブル402a及び装置管理テーブル402bの概要を説明する。
(各種テーブルデータ)
図5は、各種テーブルデータの一例である。AIアシスタントサーバ装置4のHDD44等の記憶部には、図5に示すユーザ管理テーブル402a及び装置管理テーブル402bによって構成された紐づけ用DB402が構築されている。これらのテーブルデータのうち、ユーザ管理テーブル402aでは、情報入力装置のデバイスID毎に、ユーザ名及びユーザIDが関連付けられて管理される。また、装置管理テーブル402bでは、情報入力装置名毎に、情報入力装置のデバイスID、情報処理装置名、情報処理装置の装置ID、情報処理装置の接続情報、出力装置名、出力装置の装置ID及び出力装置の接続情報がそれぞれ関連付けられて管理される。
これらのうち、情報入力装置のデバイスIDは、情報入力装置の一例であるスマートスピーカ2を識別するためのデバイス識別情報の一例である。つまり、デバイスIDは、情報入力装置を識別する装置識別情報の一例である。また、情報入力装置のデバイスIDに代えて又は加えて、情報入力装置の装置名を示す情報入力装置名を管理してもよい。
出力装置名は、ユーザが使用するスマートスピーカ2によって印刷や印刷実行命令が実行される出力装置の装置名である。この出力装置名には、上述したMFP7の他に、後述するプロジェクタ、電子黒板、テレビ会議・Web会議システム及びデジタルサイネージ等が与えられる。情報処理装置名は、ユーザが使用するクライアントPCの装置名である。
出力装置の装置IDは、上述した出力装置を識別するための装置識別情報の一例である。また、情報処理装置の装置IDは、クライアントPCを識別するための情報である。また、HDD44等の記憶部には、クライアントPC6毎に上述した情報処理装置の接続情報が記憶され、MFP7毎に出力装置の接続情報が割り振られている。ここで、それぞれの接続情報は該装置と通信接続するために必要な情報であり、例えばアドレス情報である。
なお、装置管理テーブル402bは、未登録の新たな使用者のユーザID及びその使用者が使用する情報入力装置のデバイスID並びにその使用者が指定した出力装置の装置IDをそれぞれ関連付けて、新たに追加登録されるようにしてもよい。
CPU41は、情報認識サーバ装置3で生成(変換)された解釈結果をMFP7に対する印刷実行命令等のデータに変換してネットワーク8を介してクライアントPC6に送信する。なお、ユーザから指示された意図は、例えば、MFP7への印刷指示及び各種命令の指示、プロジェクタの起動、電子黒板の起動、テレビ会議・Web会議システム及びデジタルサイネージ等の起動及び等を含む。このようにして、スマートスピーカ2を介して入力された音声情報等により、クライアントPC6を操作することができる。
RAM42は、例えば、HDD44等の記憶部に記憶された各種プログラムがダウンロードされ、CPU41によって各種処理が実行されるワークエリアとしての機能を有する。
ROM43には、例えば、HDD44に記憶されたプログラム以外の各種プログラムを構成するデータが記憶されている。
またAIアシスタントサーバ装置4は、HDD44に管理DB401及び紐づけ用DB402を備えている。管理DB401には、例えば、AIアシスタントサーバ装置4がクラウドサービス装置5として提供するコンテンツを示すテキストデータ、画像データ及び音声データ等が記憶されている。また、紐づけ用DB402には、例えば、スマートスピーカ2が複数用いられることを想定して、以下の情報が記憶されている。その情報とは、例えば、各スマートスピーカ2を特定する各デバイスIDと、各スマートスピーカ2への音声入力操作によって印刷処理等が実行されるMFP7の装置IDとが関連付けられた情報である。すなわち、紐づけ用DB402には、各スマートスピーカ2に対する音声入力操作により使用可能なMFP7を特定できるように、各スマートスピーカ2のデバイスIDとクライアントPC6の機器IDとが関連付けられて記憶されている。
なお、管理DB401及び紐づけ用DB402としては、クラウドサービス装置5がネットワーク8上に有するHDD等の記憶部を用いることができる。この他、管理DB401及び紐づけ用DB402のうち、一方又は両方を、ネットワーク8を介してクラウドサービス装置5でアクセス可能な別のサーバ装置に記憶してもよい。
I/F部45には、表示部48及び操作部49が接続される。
通信部46は、情報認識サーバ装置3及びクライアントPC6に対するデータの送受信を、ネットワーク8を介して行う。また、通信部46は、ネットワーク8を介して他の装置と通信を行う際、有線、無線いずれの通信形態でも通信を行うことが可能である。
内部バス47は、CPU41、RAM42、ROM43、HDD44、I/F部45及び通信部46を接続する汎用バスである。この内部バス47は、AIアシスタントサーバ装置4がサーバ装置の機能が実現できるものであれば、その種類は問わない。
表示部48は、例えば、液晶表示部(LCD:Liquid Crystal Display)で構成され、例えば、AIアシスタントサーバ装置4の各種状態を表示する。
操作部49は、例えば、液晶表示部とタッチセンサとが一体的に形成された、いわゆるタッチパネルである。操作者(ユーザ)は、操作部39を用いて所望の動作の実行命令を行う場合、操作部49に表示された操作ボタン(ソフトウェアキー)等を接触操作することで、所望の動作を指定する。
<クラウドサービス装置のハードウェア構成>
クラウドサービス装置5は、上述したように、例えば、情報認識サーバ装置3及びAIアシスタントサーバ装置4を纏めたもので、スマートスピーカ2及びクライアントPC6とそれぞれネットワーク8を介して接続される。クラウドサービス装置5を構成するハードウェア構成は、情報認識サーバ装置3及びAIアシスタントサーバ装置4で説明したとおりである。
<クライアントPCのハードウェア構成>
図6は、クライアントPCのハードウェア構成の一例を示す図である。クライアントPC6は、図6に示すように、CPU61、RAM62、ROM63、HDD64、インターフェイス部(I/F部)65及び通信部66を含むハードウェア資源を、内部バス67を介して相互に接続している。また、I/F部65には、表示部68及び操作部69が接続されている。
CPU61は、クライアントPC6全体を統括制御する制御デバイスである。
RAM62は、例えば、ROM23等に記憶された各種プログラムがダウンロードされ、CPU61によって各種処理が実行されるワークエリアとしての機能を有する。
ROM63には、例えば、クライアントPC6自身を制御するプログラムを構成するデータが記憶されている。CPU21は、このクライアントPC6自信を制御するプログラムを実行することで、例えば、クラウドサービス装置5(又はAIアシスタントサーバ装置4)との通信制御等を実行する。
HDD64は、命令実行プログラムを構成するデータが記憶されている。CPU61は、この命令実行プログラムをRAM62に展開して実行することで、例えば、出力装置の一例であるMFP7の印刷処理等を行う。なお、命令実行プログラムは、本実施の形態では、第1のプログラムに相当する。
I/F部65には、表示部68及び操作部69が接続される。
通信部66は、クラウドサービス装置5(又はAIアシスタントサーバ装置4)からの印刷実行命令等を受信する。また、印刷実行命令等を、MFP7に対してネットワーク8を介して送信する。
内部バス67は、CPU61、RAM62、ROM63、HDD64、I/F部65及び通信部66を接続する汎用バスである。この内部バス67は、クライアントPC6が命令実行プログラム等を実行することができるものであれば、その種類は問わない。
<MFPのハードウェア構成>
図7は、MFPのハードウェア構成の一例を示す図である。MFP7は、コントローラ700、近距離無線通信回路720、エンジン制御部730、操作パネル740、ネットワークI/F750を備えている。
これらのうち、コントローラ700は、例えば、操作パネル740からの入力等を制御する。また、コントローラ700は、MFP7の全体制御を行う制御部であるCPU701、システムメモリ(MEM−P)702、ノースブリッジ(NB)703、サウスブリッジ(SB)704、ASIC(Application Specific Integrated Circuit)706、記憶部であるローカルメモリ(MEM−C)707、HDDコントローラ708及び記憶部であるHDD709を有する。さらに、NB703とASIC706との間は、AGP(Accelerated Graphics Port)バス721で接続される。
NB703は、CPU701と、MEM−P702、SB704及びASIC706とを接続するためのブリッジ回路である。NB703は、MEM−P702に対する読み書きなどを制御するメモリコントローラと、PCI(Peripheral Component Interconnect)マスタ及びAGPターゲットとを有する。
MEM−P702は、コントローラ700の各機能を実現させるプログラムやデータの格納用メモリであるROM702a、プログラムやデータの展開及びメモリ印刷時の描画用メモリなどとして用いるRAM702bを備える。なお、RAM702bに記憶されているプログラムは、インストール可能な形式又は実行可能な形式のファイルで、CD−ROM、CD−R、DVD等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
SB704は、NB703とPCIデバイス、周辺デバイスとを接続するためのブリッジ回路である。
ASIC706は、画像処理用のハードウェア要素を有する画像処理用途向けのIC(Integrated Circuit)である。その役割は、AGPバス721、PCIバス722、HDDコントローラ708及びMEM−C707をそれぞれ接続するブリッジ回路である。また、ASIC706は、PCIターゲット及びAGPマスタ、ASIC706に接続される他のデバイスの動作やタイミングを調停するアービタ(ARB)、MEM−C707を制御するメモリコントローラ、DMA制御を司るDMAC(Direct Memory Access Controller)、スキャナ部731及びプリンタ部732との間でPCIバス722を介したデータ転送を行うPCIユニットを有する。
なお、ASIC706には、USB(Universal Serial Bus)のインターフェイスや、IEEE1394(Institute of Electrical and Electronics Engineers 1394)のインターフェイスを接続するようにしてもよい。
MEM−C707は、コピー用画像バッファ及び符号バッファとして用いるローカルメモリである。
HDD709は、画像データの蓄積、印刷時に用いるフォントデータの蓄積、フォームの蓄積を行うためのストレージである。HDDコントローラ708は、CPU701の制御にしたがってHDD709に対するデータの読出し又は書込みを制御する。
AGPバス721は、グラフィック処理を高速化するために提案されたグラフィックスアクセラレータカード用のバスインターフェイスである。AGPバス721は、MEM−P702に高スループットで直接アクセスすることにより、グラフィックスアクセラレータカードを高速にすることができる。
近距離無線通信回路720は、近距離無線通信を行うための回路であり、近距離無線通信回路用アンテナ720aを備える。近距離無線通信回路720は、例えば、NFC(Near Field Communication)、Bluetooth(登録商標)等の無線通信回路である。
エンジン制御部730は、スキャナ部731及びプリンタ部732によって構成される。スキャナ部731及びプリンタ部732には、誤差拡散やガンマ変換などの画像処理部分が含まれる。
操作部11の一部である操作パネル740は、MFP7に搭載又は接続可能であり、パネル表示部740a及びパネル操作部740bを含む。本実施形態では、一例としてMFP7に接続可能な状態を示している。パネル表示部740aは、現在の設定値や選択画面等を表示させ、操作者からの入力を受け付けるタッチパネル等を備える。また、パネル操作部740bは、濃度の設定条件などの画像形成に関する各種条件の設定値を受け付けるテンキー及びコピー開始指示を受け付けるスタートキー等を備える。
ネットワークI/F750は、通信ネットワークを利用してデータ通信をするためのインターフェイスである。近距離無線通信回路720及びネットワークI/F750は、PCIバス722を介して、ASIC706に電気的に接続される。
なお、MFP7は、パネル表示部740aに表示される又はパネル操作部740bが備えるアプリケーション切替キーにより、ドキュメントボックス機能、コピー機能、プリンタ機能及びファクシミリ機能を切り替えて選択することが可能となる。つまり、MFP7は、ドキュメントボックス機能の選択時にはドキュメントボックスモードとなり、コピー機能の選択時にはコピーモードとなり、プリンタ機能の選択時にはプリンタモードとなり、ファクシミリ機能の選択時にはファクシミリモードとなる。
〔機能構成〕
<入力操作システムの機能構成>
図8は、入力操作システムを構成する各装置の機能ブロックの一例を示す図である。入力操作システム1は、図1に示したように、スマートスピーカ2、情報認識サーバ装置3、AIアシスタントサーバ装置4、クラウドサービス装置5(情報認識サーバ装置3及びAIアシスタントサーバ装置4を纏めたもの)、クライアントPC6及びMFP7がそれぞれネットワーク8を介して接続されている。
<スマートスピーカの機能構成>
スマートスピーカ2は、クラウドサービス装置5を構成する情報認識サーバ装置3及びAIアシスタントサーバ装置4との間で、例えば音声データ、画像データ及びテキストデータ等のデータ通信を行う。
図2に示したスマートスピーカ2のCPU21は、ROM23等の記憶部に記憶された操作指示処理プログラムとしての操作音声処理プログラム等をRAM22に展開して実行することで、例えば、通信制御部251、取得部252、フィードバック部253、記憶・読出処理部254(以下、通信制御部251〜記憶・読出処理部254とも記載する)として機能又は機能する手段を構成する。
次に、スマートスピーカ2の各機能構成について説明する。通信制御部251は、ネットワーク8を介してスマートスピーカ2と情報認識サーバ装置3又はクラウドサービス装置5との間の通信を制御し、各種データ又は情報の送受信を行う。その際、通信制御部251は、スマートスピーカ2の通信部25を制御して各種データ又は情報の送受信を行う。通信制御部251は、次に説明する取得部252が取得した当該スマートスピーカ2に対してユーザが行った所定の操作及び指示等に基づく情報を情報認識サーバ装置3(又はクラウドサービス装置5)に送信する。また、通信制御部251は、フィードバックのために、クラウドサービス装置5からテキストデータ、画像データ、音声データ等を取得する。さらに、通信制御部251は、ユーザが行った所定の操作及び指示等に係る情報を情報認識サーバ装置3(又はクラウドサービス装置5)に送信する際に、スマートスピーカ2を特定するデバイスIDもあわせて送信する。
上述したように、通信制御部251は、スマートスピーカ2がLAN等のネットワーク8を介して接続される他の装置との通信を制御する。この通信を行う際の通信方式は、例えば、一般的にLANで使用されるEthernet(登録商標)等の通信プロトコルが用いられる。この通信制御部については、後述する情報認識サーバ装置3、AIアシスタントサーバ装置4、クラウドサービス装置5、クライアントPC6及びMFP7が有する各通信制御部についても同様の機能を有する。
取得部252は、音声情報取得手段の一例である。取得部252は、マイクロホン部29を介して集音されたユーザの音声入力操作に伴う指示音声を取得する。また、取得部252は、ユーザによるタップ操作又は物理スイッチの押下などの機械操作を含む指示操作を取得してもよい。つまり、取得部252は、指示音声及び指示操作を含む指示を表す情報のうち少なくとも一つを取得する。ここで、上述した指示を表す情報は、指示情報に相当する。なお、ユーザの指示音声には、例えば、出力装置の一例であるMFP7等に印刷を実行させるための印刷実行命令や各種処理を実行させるための処理実行命令を生成するための情報が含まれる。
取得部252は、上述した操作指示処理プログラムを実行することで、ユーザによって与えられた音声情報等を取得して情報認識サーバ装置3(又はクラウドサービス装置5)に送信する。さらに取得部252は、フィードバック部253と協働して、クラウドサービス装置5から取得したデータ(音声データ、画像データ及びテキストデータ等)を、タッチパネル27に表示するか、又はスピーカ部28を介して音声出力してユーザに通知する。なお、タッチパネル27は、スマートスピーカ2と一体で構成されていてもよいし、別々に構成されていてもよい。スマートスピーカ2と別々に構成される場合、タッチパネル27は、スマートスピーカ2と行う無線通信等に必要な無線通信インターフェイスを備えておけばよい。
フィードバック部253は、ユーザによって与えられた音声情報等に基づいてMFP7での印刷や所定の処理を行う場合、必要に応じてスマートスピーカ2がユーザに対して応答するように機能する。このフィードバック部253によって、本実施の形態は対話型システムを実現している。また、この対話型システムにおける音声入力操作を実現するため、フィードバック部253は、例えば、ユーザの指示音声や指示画像に対して不足するデータを補うために音声のフィードバックを行う。さらに、フィードバック部253は、タッチパネル27の画面への表示により、フィードバック対象のテキスト、音声又は画像をユーザに提供してもよい。なお、フィードバック部253による対話型動作及びフィードバックの詳細については、後述する。
記憶・読出処理部254は、例えば、ROM23に各種データを記憶したり、ROM23に記憶された操作指示処理プログラム等の各種データを読み出したりする処理を行う。
なお、本実施の形態では、通信制御部251〜記憶・読出処理部254は、ソフトウェアで実現されてもよい。また、通信制御部251〜記憶・読出処理部254は、他のプログラムに処理の一部を実行させ、又は他のプログラムを用いて間接的に処理を実行させてもよい。さらに、通信制御部251〜記憶・読出処理部254は、一部又は全部を、IC(Integrated Circuit)等のハードウェアで実現されてもよい。
<情報認識サーバ装置の機能構成>
情報認識サーバ装置3は、スマートスピーカ2から受信した音声情報等を解析し、テキストデータへ変換する。また、テキストデータと事前登録されている辞書情報とに基づいてユーザの意図を解釈し、解釈結果をAIアシスタントサーバ装置4に送信する。
情報認識サーバ装置3のCPU31は、スマートスピーカ2を介してユーザによって与えられた音声情報等に応じて、HDD34等の記憶部に記憶された操作音声変換プログラム等をRAM32に展開して実行する。これらのプログラムのうちのいずれかが実行されることにより、CPU31は、例えば、通信制御部351、取得部352、テキスト変換部353、解釈部354、出力部355、提供部356及び記憶・読出処理部357(以下、通信制御部351〜記憶・読出処理部357とも記載する)として機能又は機能する手段を構成する。
次に、情報認識サーバ装置3の各機能構成について説明する。通信制御部351は、ネットワーク8を介してスマートスピーカ2又はAIアシスタントサーバ装置4との間の通信を制御し、各種データ又は情報の送受信を行う。具体的には、通信制御部351は、ユーザによって与えられた音声データの受信及び情報入力装置2に対するテキストデータの送信等を行うように、情報認識サーバ装置3の通信部36を制御する。
取得部352は、情報入力装置2から送信される所定の操作及び指示等に基づく情報を取得する。また、取得部352は、スマートスピーカ2のタッチパネル、ボタン又はスイッチ等のユーザ操作に基づく情報を取得してもよい。
テキスト変換部353は、音声認識手段及び画像認識手段の一例であり、ユーザによって与えられた音声データをテキストデータに変換する。
解釈部354は、テキストデータに基づいて、ユーザからの指示を解釈する。具体的には、解釈部354は、音声アシスタントプログラムから提供された辞書情報に基づいて、テキストデータに含まれる単語などが辞書情報と一致しているか否かを判断する。そして、辞書情報と一致している場合には、解釈部354は、ユーザの意図を示すインテントと所定の処理の実行条件などの変数を示すパラメータに変換する。解釈部354は、インテント及びパラメータを管理プログラムに対して送信する。このとき、解釈部354は、音声データを取得したデバイスを特定するためのスマートスピーカ2のデバイスIDも共に、AIアシスタントサーバ装置4に送信する。
出力部355は、スマートスピーカ2に対するテキストデータ、音声データ、画像データなどのデータの送信等を行うように、通信部36を制御する。
さらに、CPU31は、HDD34等の記憶部に記憶された音声アシスタントプログラムを実行することで、提供部356として機能する。
提供部356は、テキストデータに基づいて、ユーザからの操作指示を解釈してもよい。具体的には、提供部356は、操作音声変換プログラムからテキストデータを取得し、テキストデータに含まれる単語などが辞書情報と一致しているか否かを判断して、辞書情報と一致している場合にはテキストデータをインテントとパラメータに変換する。その後、提供部356は、インテント及びパラメータを操作音声変換プログラムに対して提供する。
記憶・読出処理部357は、例えば、ROM33に記憶された操作音声変換プログラム等の各種プログラムを構成するデータの読出し処理を行う。
なお、本実施の形態では、通信制御部351〜記憶・読出処理部357は、ソフトウェアで実現されてもよい。また、通信制御部351〜記憶・読出処理部357は、他のプログラムに処理の一部を実行させ、又は他のプログラムを用いて間接的に処理を実行させてもよい。例えば、操作音声変換プログラムの解釈部354の機能の一部又は全てを音声アシスタントプログラムに実行させてもよい。さらに、操作画像変換プログラムの解釈部354の機能の一部又は全てを画像アシスタントプログラムに実行させてもよい。これらの場合、例えば、テキストデータに含まれる単語などが辞書情報と一致しているか否かの判断、及び辞書情報と一致している場合にユーザの意図を示すインテントと所定の処理の実行条件などの変数を示すパラメータへの変換は、音声アシスタントアプリ、画像アシスタントアプリ等に実行させてもよい。さらに、解釈部354は、インテント及びパラメータを音声アシスタントプログラム等から取得するものとしてもよい。さらに、通信制御部351〜記憶・読出処理部357のうち、一部又は全部を、IC(Integrated Circuit)等のハードウェアで実現してもよい。
また、上述した例では、提供部356をソフトウェアで実現することとしたが、これらのうち、一部又は全部を、IC(Integrated Circuit)等のハードウェアで実現してもよいこと等は、上述の他のプログラムと同様である。
<AIアシスタントサーバ装置の機能構成>
AIアシスタントサーバ装置4は、例えば、情報認識サーバ装置3で実行された操作音声変換プログラムによって得られたインテント、パラメータ及びスマートスピーカ2のデバイスID等を取得して、後述する各機能の処理を行う。
また、AIアシスタントサーバ装置4は、情報認識サーバ装置3から受信した解釈結果を、クライアントPC6で解釈可能な形式であるMFP7に対する印刷実行命令等のデータに変換する。その後、AIアシスタントサーバ装置4は、変換した印刷実行命令等のデータをクライアントPC6又はMFP7に送信する。MFP7では、クライアントPC6から送信される印刷実行命令等にしたがって所定の処理が実行される。なお、AIアシスタントサーバ装置4は、クライアントPC6に印刷実行命令を送信する以外に、例えば、MFP7を管理する他のサーバ装置が存在すれば、MFP7で実行される処理の実行命令等を他のサーバ装置に送信してもよい。
AIアシスタントサーバ装置4のCPU41は、ネットワーク8を介して情報認識サーバ装置3のHDD34等の記憶部に記憶された管理プログラムを取得し、RAM42に展開して実行する。CPU41は、この管理プログラムを実行することで、例えば、通信制御部451、取得部452、解釈結果変換部453、補完部454、実行指示部455、実行判定部456、機器情報取得部457、通知部458、管理部459、検索部460及び記憶・読出処理部461(以下、通信制御部451〜記憶・読出処理部461とも記載する)として機能又は機能する手段を構成する。
次に、AIアシスタントサーバ装置4の各機能構成について説明する。通信制御部451は、ユーザの情報入力装置2に対する解釈結果の送信、及びユーザによって与えられた音声データ等に係るテキストデータの受信等を行うように通信部46を制御する。
取得部452は、は、情報認識サーバ装置3から送信されるインテント、パラメータ及びスマートスピーカ2(情報入力装置)のデバイスID等を取得する。
解釈結果変換部453は、操作音声変換プログラム等で変換されたインテント及びパラメータなどの解釈結果を、クライアントPC6又はMFP7が解釈可能な印刷実行命令令等に変換する。この解釈結果変換部453は、AIアシスタントサーバ装置4(又はクラウドサービス装置5)で実行される管理プログラムの機能の一つである。また、クライアントPC6又はMFP7が解釈可能な印刷実行命令は、MFP7に対する処理を実行するための情報(処理情報)の一例である。
補完部454は、解釈結果変換部453によって変換される実行命令等に対して、ユーザ管理テーブル402a及び装置管理テーブル402bを参照して、出力装置の一例であるMFP7における処理に必要な情報を補完する機能を有する。この処理に必要な情報とは、例えば、MFP7に対する印刷実行命令等への変換に必要な情報である。
実行指示部455は、解釈結果変換部453で変換された印刷実行命令等を、MFP7を管理するクライアントPC6に送信して、命令の実行を指示する。つまり、実行指示部455は、ユーザが使用したスマートスピーカ2を特定するデバイスIDに関連付けられているMFP7を紐づけ用DB402から検索し、MFP7を管理するクライアントPC6に対して、インテント及びパラメータと共に印刷実行命令等を送信する。つまり、実行指示部455は、デバイスIDと関連付けられたクライアントPC6を紐づけ用DB402から特定することができる。
機器情報取得部457は、例えば、クライアントPC6とMFP7との通信接続が確立されているか否かを示す接続状態、MFP7の電源のオン/オフ等に係る電力使用状態、MFP7への電力供給状態(通常モード、省エネモード等)の機器情報を取得する。なお、機器情報取得部455は、MFP7から取得した機器情報を、MFP7を特定する装置ID等と関連付けてHDD44等の記憶部に記憶して管理する。この機器情報の記憶先は、紐づけ用DB402を構築する後述する装置管理テーブル402bでもよい。さらに、機器情報取得部457は、装置管理テーブル402bを参照して、MFP7で実行される印刷実行命令の生成に関連する情報を補完する機能も有する。
実行判定部456は、取得した機器情報で示されるMFP7の状態と、ユーザから指定された印刷指示や所定の処理内容とを比較することで、ユーザから指定された印刷指示や印刷実行命令をMFP7で実行可能か否かを判断する。ユーザから指定された印刷指示や所定の処理内容は、例えば、ユーザから指示された時間帯に当該MFP7が使用可能か否かの判断処理、当該MFP7の電源状態の変更処理及び当該MFP7に対する印刷実行処理等である。また、ユーザから指定された印刷指示や印刷実行命令が実行可能と判断した場合、実行判定部456は、解釈結果変換部453に対して、MFP7を管理するクライアントPC6に出力要求の一例である印刷実行命令を送信するよう判定する。一方、実行不可能と判断した場合、実行判定部456は、操作音声変換プログラム等を介してスマートスピーカ2に対してエラーメッセージ等のレスポンス情報をフィードバックする。なお、本実施の形態において、実行判定部456は、解釈結果変換部453から送信される印刷実行命令等を、クライアントPC6を介さずにネットワーク8を介して直接MFP7等に送信するように処理をしてもよい。このような例については、第2の実施の形態で詳述する。
通知部458は、ユーザによる印刷指示や印刷実行命令への応答としてテキストデータ、音声データ及び画像データ等を操作音声変換プログラム等に通知する。また、MFP7に対する印刷指示や所定の処理の実行のための処理命令又は所定の処理の実行条件を示すパラメータが不足している場合には、通知部457は、操作音声変換プログラム等を介してスマートスピーカ2に対してフィードバックを行う。つまり、通知部457は、ユーザに対して不足しているパラメータの入力を促す。ここで、通知部457は、不足しているパラメータを確認するために必要な情報として、所定のパラメータ情報をスマートスピーカ2に送信してもよいし、パラメータの指定を促すために必要な情報としてテキストデータ、音声データ及び画像データ等をスマートスピーカ2に送信してもよい。上述した処理によって、ユーザは、どんな情報が不足しているかをスマートスピーカ2から発生される音声等によって確認することができる。
管理部459は、クライアントPC6、スマートスピーカ2又はクラウドサービス装置5に接続されたクライアントデバイスに対して入力された情報に基づいて、スマートスピーカ2のデバイスIDとクライアントPC6において管理されるMFP7の装置IDとを関連付けて、紐づけ用DB402に登録する。紐づけ用DB402では、スマートスピーカ2のデバイスIDとMFP7の装置ID等を関連付けた情報及びMFP7の装置IDとクライアントPC6の装置IDを関連付けた情報が、装置管理テーブル402bとして記憶され、管理される。また、紐づけ用DB402には、スマートスピーカ1のデバイスIDとクライアントPC6の装置IDを関連付けた情報が管理されていてもよい。
検索部460は、デバイスIDやユーザID(使用者ID)に基づいてMFP7を検索し、特定する。
記憶・読出処理部461は、AIアシスタントサーバ装置4のHDD44等の記憶部に記憶された各種データの読み出し、HDD44等の記憶部への各種データの書き込み等の各処理を行う。
なお、本実施の形態では、通信制御部451〜記憶・読出処理部461をソフトウェアで実現することとしたが、これらのうち、一部又は全部を、IC(Integrated Circuit)等のハードウェアで実現してもよい。また、通信制御部451〜記憶・読出処理部461が実現する機能は、情報認識サーバ装置3のHDD34等の記憶部に記憶された他のプログラムに処理の一部を実行させる、又は他のプログラムを用いて間接的に処理を実行させてもよい。
(クラウドサービス装置による解釈動作の詳細)
ここで、クラウドサービス装置5による解釈動作の詳細について説明する。クラウドサービス装置5は、上述したように情報認識サーバ装置3及びAIアシスタントサーバ装置4を一つに纏めた装置であり、一つのサーバ装置としても機能するものである。クラウドサービス装置5を構成するAIアシスタントサーバ装置4のHDD44等の記憶部には、さらに辞書情報が記憶されている。操作音声変換プログラムは、この辞書情報に基づいてインテント及びパラメータを生成する。より具体的には、操作音声変換プログラムは、ユーザの発話によって得られた音声情報(音声データ)から変換されたテキストデータに含まれる単語などが辞書情報と一致するか否かを判断し、一致する場合は辞書情報に定義されているインテント及びパラメータを含む解釈結果を生成する。
上述した辞書情報は、インテント及びパラメータを生成することができるものであればどのような形態であってもよい。一例として、辞書情報は、エンティティ情報、インテント情報及び関連付け情報を含んで構成される。エンティティ情報は、MFP7が所定の処理を実行するためのパラメータと自然言語を関連付ける情報である。また、一つのパラメータには、複数の類義語が登録可能である。インテント情報は、上述したように所定の処理の種類を示す情報である。関連付け情報は、ユーザが発話した発話フレーズ(自然言語)とエンティティ情報及び発話フレーズとインテント情報を、それぞれ関連付ける情報である。この関連付け情報により、AIアシスタントサーバ装置4(又はクラウドサービス装置5)は、パラメータの発話順序又はニュアンスが多少変わっても、正しい解釈が可能となる。また、関連付け情報は、入力された内容に基づいてレスポンスのテキスト(解釈結果)を生成してもよい。なお、辞書情報には、上述したAIアシスタントサービス情報と一部機能を共通にする。
エンティティ情報には、パラメータ及び類義語が関連付けられて記憶されている。パラメータと共に、類義語を登録することで、例えば、MFP_#1を用いてファイル等を印刷する場合に、「これ出力して」と発話しても、「これ印刷して」と発話しても、同様の処理を行うパラメータとして設定することができる。
(対話型動作)
本実施の形態の入力操作システム1では、ユーザによって与えられた音声情報等に基づいてシステムが応答する対話型システムによる対話型動作を実現している。この対話型動作は、上述したように、スマートスピーカ2のフィードバック部253によって実行される動作の一つである。また、入力操作システム1は、対話等に必要な定型文を応答する以外に、MFP7における印刷に関する特有の応答として、「入力不足フィードバック」及び「入力確認フィードバック」の、2種類の応答をする。これによって、入力操作システム1は、対話によるMFP7における印刷処理を可能とする対話型の出力装置操作システムを実現している。
「入力不足フィードバック」は、MFP7における印刷を実行するために必要な情報が揃っていない場合にスマートスピーカ2から出力される応答である。さらに、「入力不足フィードバック」は、ユーザによる音声情報等の入力内容を聞き取れなかった場合、又は、音声入力操作による入力内容に必要な項目(以下、必須パラメータという)が不足している場合にスマートスピーカ2から出力される。換言すれば、必須パラメータ以外の項目(以下、パラメータともいう)については、ユーザから指示されていない場合であっても入力不足フィードバックを行う必要はない。さらに「入力不足フィードバック」では、パラメータ以外にも、MFP7における印刷において必要な機能を確認する処理が含まれていてもよい。
対話型動作では、フィードバック部253は、クラウドサービス装置5が通信接続中の出力装置の種類に応じて、ユーザに確認する機能及びパラメータを変更してもよい。この場合、AIアシスタントサーバ装置4の機器情報取得部457が、出力装置との通信が確立した後の所定のタイミングで出力装置の種類及び機能を示す情報を取得する。その後、機器情報取得部457は、取得した情報に基づいて、フィードバック部253がユーザに確認する機能及びパラメータを決定してもよい。
例えば、出力装置の種類が複合機(MFP7)である場合、フィードバック部253は、MFP7の印刷に必要な項目(使用者名、使用日時、等)をユーザに確認できる。更に、フィードバック部253は、MFP7で使用される備品リソース等の情報をユーザに確認してもよい。また、機器情報取得部457は、ユーザから指定された設定条件に応じて必須パラメータを変更してもよい。例えば、ユーザが指定した印刷条件が袋綴じ印刷の場合は、機器情報取得部457は、袋綴じ印刷に必要な具体的な条件(例えば、右開きか左開きか、など)を必須パラメータとして設定してもよい。
「入力確認フィードバック」は、MFP7の印刷を実行するために必要な情報が揃った場合に出力される応答である。つまり、「入力確認フィードバック」は、全ての必須パラメータについて指示された場合に行われる。また、「入力確認フィードバック」は、現在の設定値で印刷処理を実行するか、又は、設定値を変更するかの選択をユーザに促すために行われる。なお、「入力確認フィードバック」が行われることによって、現在の設定値で印刷処理を実行するか否かを確認するために、ユーザにより指示された全てのパラメータ(必須パラメータか必須パラメータ以外のパラメータかに関わらず)を、ユーザに確認することができる。
(AIアシスタントサーバ装置からフィードバックされる情報の例)
上述の説明では、スマートスピーカ2のフィードバック部253はレスポンス情報に含まれるテキストデータ及び音声データを出力することとして説明した。しかし、フィードバック部253は、スマートスピーカ2のROM23等の記憶部に記憶されたテキストデータに基づいて、レスポンス情報に対応するテキストデータを形成し、フィードバック出力(音声出力及びテキスト出力)を行ってもよい。なお、具体的なフィードバックの内容は後述する。
<クライアントPCの機能構成>
クライアントPC6は、クラウドサービス装置5(又はAIアシスタントサーバ装置4)と連携して、MFP7及びMFP7で使用される後処理装置等に対する印刷の実行、所定の処理の実行等を行う。但し、後処理装置は、クライアントPC6が処理する必須の対象でなくてもよい。
クライアントPC6のCPU61は、HDD64等の記憶部に記憶された命令実行プログラムをRAM62に展開して実行することで、例えば、通信制御部651、命令受信部652、検索部653、印刷要求送信部654、通知部655、表示制御部656及び記憶・読出処理部657(以下、通信制御部651〜記憶・読出処理部657とも記載する)として機能又は機能する手段を構成する。
次に、クライアントPC6の各機能構成について説明する。通信制御部651は、AIアシスタントサーバ装置4の通信制御部451及びMFP7とネットワーク8を介して通信を行う。但し、スマートスピーカ2の通信制御部251や、ネットワーク8を介して接続される他のクライアントPCと直接通信を行ってもよい。
命令受信部652は、MFP7に対する印刷実行命令、印刷取消要求及び印刷状況等を問い合わせるための印刷状況確認命令を含む各種命令をAIアシスタントサーバ装置4の実行指示部455から取得し、検索部653又は印刷要求送信部654に転送する。すなわち、命令受信部652は、例えば、出力要求受信手段としての機能を担う。なお、命令受信部652は、出力装置がMFP7以外の各種装置であった場合でも、それらの装置が実行可能な固有の命令を受信することが可能である。
検索部653は、命令受信部652が印刷実行命令を受信した場合、印刷実行命令に含まれる条件(出力装置名、出力装置の装置ID、出力装置の設置場所、ユーザ名及びユーザID、等)に基づいて、HDD64等の記憶部に記憶された各種情報の検索を行い、印刷実行命令の実行対象となるファイルを特定し、MFP7(出力装置)に対して印刷要求又は所定の処理要求を生成する。
印刷要求送信部654は、MFP7に対して所定の印刷要求を送信する。このとき、印刷要求送信部654は、出力対象送信手段の一例として機能する。また、印刷要求送信部654は、例えば、命令受信部652が印刷実行命令を受信した場合、印刷実行命令に含まれる条件(出力装置名、出力装置の装置ID、出力装置の設置場所、ユーザ名及びユーザID、等)に基づいて、HDD64等の記憶部に記憶された印刷状況を更新する。一方、MFP7が何らかの原因で印刷ができない場合は、MFP7からのステータス信号等を受信して、印刷要求送信部654は、エラーを通知することができる。その際、エラー通知は、クラウドサービス装置5を介して又はクライアントPC6から直接スマートスピーカ2に送信される。また、エラー通知の受信に伴い、印刷取消要求を取得した場合は、印刷要求送信部654は、条件に一致するMFP7の印刷処理を記憶部から削除する。上述したように、印刷要求送信部654は、スマートスピーカ2に対してユーザが与えた音声入力操作により生成されたMFP7に対する印刷実行命令や所定の処理命令等で特定された出力対象及びその出力対象に係る各種設定情報を送信する出力対象送信手段の機能を担う。
通知部655は、所定の条件に基づいて、MFP7又はスマートスピーカ2への通知を行うか否かを判断する。さらに通知部655は、例えば、MFP7に対する印刷実行時刻又は印刷実行時刻の所定時間前になった場合に、MFP7に対して種々の通知を行う。出力装置がMFP以外の装置の場合は、通知される内容は、例えば、それらの各デバイスの起動又はログイン等に関する情報である。なお、通知部655は、ユーザからの印刷指示を受け付けた時点でMFP7に通知を行ってもよい。この場合、MFP7は、印刷開始時刻になったら上述のいずれかの処理を実行してもよい。さらに、MFP7に送信される通知内容は、印刷要求に含まれていてもよいし、予めクライアントPC6に設定されていてもよい。また、例えば、印刷内容の重複があった場合、又は印刷開始時刻の所定時間前(例えば、10分前)に印刷済みのMFP7に故障等が発生した場合は、通知部655は、通信制御部651を介してスマートスピーカ2にメール、画像配信等で印刷内容の重複や故障等に関する通知を行ってもよい。
表示制御部656は、クライアントPC6上でユーザにより操作されるWeb画面、各アプリケーションの編集画面、テキストファイル、写真、動画等をクライアントPC6の表示部であるディスプレイ60や、クライアントPC6と接続可能な表示装置に表示制御する。なお、クライアントPC6のディスプレイ60は、出力対象を表示する表示装置の機能を担う。
記憶・読出処理部657は、HDD64等の記憶部を制御して、各種データの読出し、書込みを行う。
なお、本実施の形態では、通信制御部651〜記憶・読出処理部657をソフトウェアで実現することとしたが、これらのうち、一部又は全部を、IC(Integrated Circuit)等のハードウェアで実現してもよい。
次に、紐づけ用DB402の具体例について図5を用いて説明する。図5は、情報処理システムの一例である入力操作システム1で用いられる紐づけ用DB402で管理されるデータテーブルの一例である。例えば、デバイスIDとして「ud1001」を有するスマートスピーカ2から印刷指示された出力装置の名称は、「MFP_#1」であり、「MFP_#1」の装置IDは、「d0001」である。以下、詳細な説明は省略するが、図5に示した紐づけ用DB402の装置管理テーブル402bは、情報入力装置のデバイスIDとMFP7に係る装置IDとが関連付けられている。すなわち、紐づけ用DB402には、各スマートスピーカ2とMFP7を特定できるように、各スマートスピーカ2のデバイスIDとMFP7の装置IDとがそれぞれ関連付けられて記憶されている。なお、図5に示したそれぞれのIDの種類や値は一例であり、上述した内容に限らない。
<MFPの機能構成>
図8において、出力装置の一例であるMFP7のCPU701は、クライアントPC6から送信された印刷実行命令に基づいて、HDD709等の記憶手段に記憶された印刷実行プログラムをRAM702bに展開して実行する。CPU701は、この印刷実行命令を実行することで、例えば、通信制御部751、印刷要求受信部752、検索部753、印刷実行部754、通知部755及び記憶・読出処理部756として機能又は機能する手段を構成する。
次に、MFP7の各機能構成について説明する。通信制御部751は、クライアントPC6の通信制御部651とネットワーク8を介して通信を行う。但し、クラウドサービス装置5(又はAIアシスタントサーバ装置4)と直接通信を行ってもよい。
印刷要求受信部752は、MFP7で実行される印刷実行命令等の所定の印刷要求を、クライアントPC6又はクラウドサービス装置5(又はAIアシスタントサーバ装置4)から受信する。つまり、印刷要求受信部752は、MFP7で出力される出力対象のファイルやデータをクライアントPC6から受信する受信手段の機能を担う。
検索部753は、印刷要求受信部752が印刷要求又は印刷実行命令を受信した場合、印刷要求又は印刷実行命令に含まれる条件(出力装置名、出力装置の装置ID、出力装置の設置場所、ユーザ名及びユーザID、等)に基づいて、HDD64等の記憶部に記憶された各種情報の検索を行い、印刷実行命令の実行対象となるファイルを特定し、クライアントPC6に対して印刷要求又は所定の処理要求を生成する。
印刷実行部754は、印刷要求受信部752で受信した印刷要求に基づいて、MFP7において印刷処理を実行する。また、印刷実行部754は、例えば、印刷要求受信部752が印刷要求を受信した場合、印刷要求に含まれる出力装置名、装置ID、出力装置の設置場所、ユーザ名及びユーザID、等に基づいて、HDD709等の記憶部に記憶された印刷状況を更新する。一方、MFP7が何らかの原因で印刷ができない場合は、MFP7からのステータス信号等を受信して、外部にエラーを通知してもよい。その際、エラー通知は、クライアントPC6を介して又はMFP7から直接スマートスピーカ2に送信される。また、エラー通知の受信に伴い、印刷取消要求を取得した場合は、印刷実行部754は、条件に一致するMFP7の印刷処理を記憶部から削除する。
上述したように、印刷実行部754は、スマートスピーカ2に対してユーザが行う音声入力操作によって与えられた、MFP7に対する印刷指示や所定の処理の指示等の内容に基づく所定の出力形式で印刷される印刷処理等を実行する出力手段の機能を担う。なお、MFP7における印刷処理は、例えば、電子写真方式を利用した画像形成装置で実行される印刷処理であってもよい。本実施の形態では、印刷実行部754はMFP7における印刷処理を例に説明したが、実行される処理が印刷処理に限らない出力装置の場合は、情報処理装置から受信したそれぞれのファイルやデータを出力要求に含まれる所定の出力形式で表示するなどの出力処理が可能である。
通知部755は、MFP7の状態をクライアントPC6又はスマートスピーカ2に通知する。通知される内容は、例えば、当該装置の印刷動作及びその他の動作に係る情報、並びに当該装置の起動又はログイン等に関する情報である。なお、通知部755は、ユーザからの印刷指示を受け付けた時点で、上述した各種情報をクライアントPC6に通知してもよい。一方で通知部755は、受信した印刷要求に含まれる印刷開始時刻になったら上述した各種情報をクライアントPC6に通知してもよい。また、印刷要求に含まれる印刷内容に重複があった場合、又は印刷開始時刻の所定時間前(例えば、10分前)に当該装置に故障等が発生した場合は、通知部755は、通信制御部751を介してスマートスピーカ2及びクライアントPC6のうちの少なくとも一方に対して、メール、画像配信等で印刷内容の重複や故障等に関する通知を行ってもよい。
記憶・読出処理部756は、HDD709等の記憶部を制御して、各種データの読出し、書込みを行う。
なお、本実施の形態では、通信制御部751〜記憶・読出処理部756をソフトウェアで実現することとしたが、これらのうち、一部又は全部を、IC(Integrated Circuit)等のハードウェアで実現してもよい。
<入力操作システム1の処理の概要>
本実施の形態に係る入力操作システム1は、ユーザがスマートスピーカ2に対して行う音声入力操作によって、MFP7等の各種出力装置における印刷や所定の処理の命令等を実行する。つまり、クラウドサービス装置5(又はAIアシスタントサーバ装置4)によって生成された印刷実行命令がクライアントPC6に送信されると、クライアントPC6は、受信した印刷実行命令中の特定情報に基づいて、MFP7で実行される印刷処理に必要なデータを特定する。その後、クライアントPC6は、特定したデータに基づいてMFP7に対して印刷要求を送信し、MFP7にて所定の印刷が実行される概要となっている。上述した概要について、以下に詳述する。
なお、本実施の形態では、クライアントPC6が、クラウドサービス装置5から、ユーザにより与えられた音声情報等によって生成された印刷実行命令を受信して、MFP7を制御する形態について説明する。さらに、クライアントPC6が、クラウドサービス装置5から送信された印刷実行命令をMFP7が受信し、受信した印刷実行命令に基づいてクライアントPC6に対してファイル要求を送信してクライアントPC6から特定されたファイルを再度受信してMFP7自身を制御する形態について説明する。
<第1の実施の形態>
図9は、第1の実施の形態における処理の流れの一例を示すシーケンス図である。
図9に示すシーケンス図にしたがい、ユーザがスマートスピーカ2からMFP7に対する印刷要求を送信する場合について説明する。具体的には、第1の実施の形態では、ユーザの発話によってMFP_#1を用いて所定のファイル等を印刷する場合を例示する。以下にシーケンス図における各処理を示す。
本実施の形態における入力操作システム1では、ユーザが利用するクライアントPC6のとなりにスマートスピーカ2が配置されている状態を一例として説明する。図10は、第1の実施の形態におけるクライアントPC6のディスプレイ60に表示される表示画面の一例を示す図である。図10では、クライアントPC6のディスプレイ60には、文書作成ソフトウェア(例えば、Word(登録商標))形式のファイル「ドキュメントA.doc」が編集中の状態で表示されている。さらに、同ディスプレイ60には、表計算ソフトウェア(例えば、Excel(登録商標))形式のファイル「リストB.xlsx」も表示されている。但し、本実施の形態では、「ドキュメントA.doc」を表示する画面が、クライアントPC6のディスプレイ60におけるアクティブウィンドウとなっている。この状態において、ユーザがスマートスピーカ2に向かって「これ印刷して」と発話すると、スマートスピーカ2の取得部252は、ユーザから発話された「これ印刷して」という音声入力操作に基づいて、例えば、図3に示したマイクロホン部29を使用して音声データ(音声情報)を取得する(ステップS101)。
但し、ここでは、クライアントPC6のディスプレイ60に表示されるファイルの印刷指示であれば発話内容はこれに限定されない。例えば、所定の表示装置やファイルの格納先などを特定する情報(以下、特定情報ともいう)を発話してもよい。
さらに、本実施の形態における音声入力操作の内容は、例えば、ユーザからの指示内容には、MFP7における印刷処理に加えて、MFP7の後行程の処理を実行するフィニッシャー等の処理を含む内容でもよい。つまり、発話の内容として、例えば、「これを印刷した後にステープル処理をして」のように、同時に複数の処理を実行させる指示内容が含まれていてもよい。
続いて、スマートスピーカ2のROM23等の記憶部に記憶された操作指示処理プログラムが実行されることによって機能する通信制御部251は、音声データを取得した場合は、操作指示処理プログラムに含まれる操作音声処理プログラムによって音声データを情報認識サーバ装置3に送信する。このとき、通信制御部251は、当該スマートスピーカ2を特定するためのデバイスIDもあわせて情報認識サーバ装置3に送信する(ステップS102)。
なお、デバイスIDは、ユーザに関連付けられたスマートスピーカ2を特定する情報の一例である。例えば、デバイスIDに代えて又は加えて、スマートスピーカ2の位置情報や、スマートスピーカ2を使用するユーザを特定するユーザID、ユーザ名又はユーザの所属する組織等の個人情報を送信してもよい。
続いて、情報認識サーバ装置3の取得部352は、通信制御部351を介して、デバイスIDとあわせてスマートスピーカ2から送信された音声データ等を取得し、テキスト化する(ステップS103)。このとき、情報認識サーバ装置3は、操作音声変換プログラム等を実行する。但し、情報認識サーバ装置3が操作音声変換プログラム等を実行するタイミングは、上述した限りではなく、どのタイミングで実行してもよい。
なお、上述した取得部352は、スマートスピーカ2に備えられた音声情報等を得るための取得部252の機能を兼ね備えてもよい。その場合、取得部352は、例えば、マイクロホン部29を介して集音されたユーザの指示音声を、スマートスピーカ2のデバイスID及び使用者のユーザIDとあわせて取得する機能を有する。つまり、上述したステップS101及びステップS102の機能を兼用する。このような取得部352は、スマートスピーカ2の取得部252と同様に、音声情報取得手段の一例として機能してもよい。つまり、情報認識サーバ装置3は、音声情報取得手段を備えるサーバ装置の一例として機能してもよい。
この後、情報認識サーバ装置3のテキスト変換部353は、取得したデータが音声データの場合は操作音声変換プログラムにより音声データをテキスト化する。一方、情報認識サーバ装置3のテキスト変換部353は、受信したデータが画像データの場合は操作画像変換プログラムにより画像データをテキスト化する。このテキスト化の処理は例えば、「これ印刷して」という内容を示す音声入力操作に基づく情報をテキストデータに変換する処理である。
続いて、操作音声変換プログラムは、AIアシスタントサーバ装置4で実行される音声アシスタントプログラムに対して、辞書情報要求を通信制御部351を介してAIアシスタントサーバ装置4に送信する(ステップS104)。
AIアシスタントサーバ装置4の取得部452は、情報認識サーバ装置3から、辞書情報要求を通信制御部451を介して取得する。テキスト化された音声データ等を取得したAIアシスタントサーバ装置4は、取得した辞書情報要求に応じて辞書情報を情報認識サーバ装置3で実行される操作音声変換プログラムに提供する(ステップS105)。
なお、AIアシスタントサーバ装置4は、音声アシスタントプログラムを実行する際に、情報認識サーバ装置3のHDD34等の記憶部に記憶された上述の音声アシスタントプログラムを、ネットワーク8を介してダウンロードして実行してもよい。
続いて、情報認識サーバ装置3で操作音声変換プログラムが実行されることにより、解釈部354は、テキスト化された音声データ等を解釈して、インテントとパラメータを生成する(ステップS106)。
ステップS106の処理の具体例としては、解釈部354は、音声アシスタントプログラムから取得した辞書情報に基づいて、テキストデータに含まれる単語等が辞書情報と一致しているか否かを判断する。つまり、テキスト解釈を行う。テキストデータに含まれる単語等が辞書情報と一致している場合、解釈部354は、ユーザから指示された操作を示すインテント及び各種処理の実行条件等の変数を示すパラメータに変換する。なお上述した解釈部354の処理については、提供部356が行ってもよい。
変換されるインテントとパラメータは、例えば、「インテント:PRINT EXECUTE」(表1の「Action」に相当)、「パラメータ:THIS」である。本実施の形態では、インテントは、印刷要求をMFP6に対して送信することをクライアントPC6に対して指示する情報である。また、パラメータは、クライアントPC6がMFP7に対して送信するファイルを示す情報である。但し、これに限定されず、パラメータ中にクライアントPC6がMFP7に対して送信する印刷要求の印刷設定(部数やカラー/モノクロなど)の情報を含めてもよい。また、パラメータ中にクライアントPC6がMFP7に対して送信するファイルを特定するための情報を含めてもよい。例えば、ステップS101でユーザが印刷対象であるファイルを特定するための特定情報を発話していた場合、その特定情報をパラメータに含めることができる。
なお、後述するようにクラウドサービス装置5によって印刷対象が特定される場合には、パラメータはファイル名やファイルの保存場所を示すネットワークアドレスなどファイルに係る情報となる。
より具体的には、解釈部354は、MFP7において印刷が実行されるインテントに係る情報として「インテント:PRINT EXECUTE」を生成し、MFP7において実行される印刷処理のパラメータに係る情報として例えば、「出力装置名:MFP_#1」を生成する。このように、解釈部354は、テキストデータに基づいて、例えば、ユーザから指定された印刷の依頼、所定の処理の種別(インテント)及び所定の処理に関連する内容(パラメータ)を示す解釈結果を生成する。なお、ここではパラメータにMFP7を特定するための情報として出力装置名を用いる場合について説明したが、クライアントPC6でMFP7を特定できる情報であればこれに限定されない。例えば、MFP7を特定するための情報として、MFP7のアドレス情報であっても良い。また、クライアントPC6にてデフォルトで設定されているMFP7を用いて印刷を行う場合は、MFP7を特定するための情報をパラメータに含めなくてもよい。
続いて、解釈部354は、生成したインテント、パラメータ及びスマートスピーカ2(情報入力装置)のデバイスIDをクラウドサービス装置5(又はAIアシスタントサーバ装置4)で実行される管理プログラムに送信する(ステップS107)。
(情報の補完及び問合せ処理)
次に、クラウドサービス装置5(又はAIアシスタントサーバ装置4)で実行される情報の補完及び問合せの処理の一例を説明する。
まず、AIアシスタントサーバ装置4の解釈結果変換部453は、取得部452で取得されたインテント、パラメータ及びスマートスピーカ2のデバイスID等に基づいて、MFP7に対する印刷実行命令を示すデータに変換する。このとき、インテントには印刷することを表す「PRINT EXECUTE」が与えられ、パラメータには出力装置名を表す「MFP_#1」等が与えられる。なお、解釈結果変換部453は、変換手段に相当する。以下、出力装置としてMFP_#1を例に説明するが、装置管理テーブル402bに例示したような出力装置であれば、その種類は問わない。さらに、パラメータについて、ユーザ管理テーブル402a及び装置管理テーブル402bに例示したような内容(ジョブ命令、特定情報、実行プログラム等)であれば、その種類は問わない。
解釈結果変換部453によるデータ変換に伴い、検索部460は、スマートスピーカ2のデバイスID又は使用者のユーザIDに基づいて、印刷対象であるMFP_#1を特定する。
さらに、補完部454は、ユーザによって与えられた音声情報に対して、紐づけ用DB402に記憶された装置管理テーブル402bを参照して、MFP_#1で実行される印刷実行命令の生成に関連する情報を補完する。しかし、この装置管理テーブル402bを参照してもなお印刷実行命令に係る必須パラメータの生成に必要な情報を補完できない場合は、補完部454は、スマートスピーカ2を介してユーザにフィードバックを行い、必須パラメータの生成に必要な情報の入力(取得)をユーザに促すよう制御してもよい。この補完に係る処理は補完部454が行い、補完部454は、補完手段に相当する。
このとき、管理部459は、紐づけ用DB402に対して、デバイスID又はユーザIDとMFP_#1とを含めて予め関連付けて登録することができる。なお、ユーザIDを特定する方法として、例えば、以下の方法がある。スマートスピーカ2をあるユーザが使用する場合、そのスマートスピーカ2に向けて自分の名前をマイクロホン部29に向けて発話する。この発話による名前の入力を受けて、スマートスピーカ2の取得部252は、記憶・読出処理部254と連携して、ROM23等の記憶部に記憶、管理されているユーザID一覧テーブルを照合する。その後、取得部252は、音声からテキスト化された名前と記憶部に記憶、管理されているユーザIDを照合して、発話をした使用者のユーザIDを特定する。なお、名前の入力に代えてユーザのメールアドレス等を発話するようにしてもよい。さらに、スマートスピーカ2の撮像部(カメラ部)30を使用して使用者の顔写真等を撮影し、その撮影画像とユーザIDとを照合するようにしてもよい。
また、新たなユーザID及びデバイスIDの組合せでMFP_#1における印刷等に関する情報が与えられたときは、管理部459は、AIアシスタントサーバ装置4のHDD44等の記憶部に記憶、管理されたMFP_#1装置管理テーブル402bにそれらの情報を追加することで、MFP_#1の装置管理テーブル402bを更新してもよい。
次に、機器情報取得部457は、取得したインテントとパラメータに基づいてMFP_#1の印刷に必要な必須パラメータが充足しているか否かを判断する。この必須パラメータとは、例えば、受信したパラメータのうち出力対象及び出力対象を出力する出力装置を特定するための情報である。そこで、必須パラメータには、例えば、出力対象を出力する使用者の使用者名、出力日時、印刷処理における枚数やカラー/モノクロ設定等の任意のパラメータ(条件)など任意の条件が含まれる。
さらに、この必須パラメータは、上述したMFP_#1に関する装置管理テーブル402bとして、例えば、AIアシスタントサーバ装置4のHDD44等の記憶部に予め記憶させておき、適宜設定することもできる。さらに、この必須パラメータは、ユーザや出力装置の組合せ等にしたがって適宜必須パラメータと通常のパラメータを入れ替えることも可能である。つまり、ある条件では必須パラメータとして定義されたものでも、別の条件では通常のパラメータとして管理してもよい。
上述した説明より、機器情報取得部457は、以下の特徴を有する。つまり、機器情報取得部457は、出力装置を特定する場合に用いる必須パラメータを紐づけ用DB402に記憶された装置管理テーブル402bを参照して、出力対象(ファイル、画面データ、等)や出力装置(MFP_#1、等)を特定するための必須パラメータの生成に関連する情報を補完する。ここで示した必須パラメータの生成に関連する情報、換言すれば音声情報に関連する情報の一例として、ファイルに関するものであれば、例えば、「この」、「現在編集中の」、「最新アップデート後の」等の修飾語が挙げられる。しかし、パラメータの生成に関連する情報や装置管理テーブル402bを参照してもなお必須パラメータの生成に必要な情報を補完できない場合は、機器情報取得部457は、スマートスピーカ2を介してユーザにフィードバックを行い、必須パラメータの生成に必要な情報の入力をユーザに促すよう制御してもよい。
実行判定部456は、情報の補完処理に基づいて、必須パラメータの充足判断を行う。その際、実行判定部456は、補完処理によって補完された内容でもなお必須パラメータが充足していないと判断した場合は、通知部457を介してユーザに必須パラメータを問い合わせる。この問合せは、クラウドサービス装置5からスマートスピーカ2に対して問合せのための情報が送信され、音声等をユーザに提供することで行われる。
なお、実行判定部456は、必須パラメータが充足していない場合は、必須パラメータが充足するまでパラメータを指定するようにスマートスピーカ2を介してユーザに問合せを継続する。このとき実行される情報の補完及び必須パラメータの問合せ処理について、解釈結果変換部453及び実行判定部456が互いに協働して、ユーザから与えられる音声情報に関連する情報を補完するための取得制御部462として機能してもよい。
このとき、必須パラメータは、ステップS102でスマートスピーカ2から取得したデバイスID又はユーザIDに基づいて変更されてもよい。また、必須パラメータには、MFP_#1の使用者が含まれていてもよい。但し、ユーザが音声入力操作によってMFP_#1の使用者(使用者のユーザID等)を設定しなかった場合、実行判定部456は、ステップS102でスマートスピーカ2から取得したデバイスID又はユーザIDによって使用者を特定できるか否かを判断する。例えば、スマートスピーカ2は、一人のユーザによって占有される場合があり得る。そこで、実行判定部456は、スマートスピーカ2(情報入力装置)のデバイスIDや使用者のユーザIDに関連付けられたユーザが紐づけ用DB402に登録されているかを判断する。つまり、実行判定部456は、デバイスIDやユーザIDに基づいてユーザを検索し、ユーザを特定する。
ここで、実行判定部456は、ユーザを特定できた場合には当該ユーザをMFP_#1の使用者としてパラメータに設定することができる。一方、ユーザを特定できなかった場合には、実行判定部456は、スマートスピーカ2を介して使用者を設定するようにユーザへ問い合わせてもよい。つまり、所定の処理要求(印刷指示)を示すデータを生成するために、実行判定部456は、通知部457及び通信制御部451を介してスマートスピーカ2と通信し、ユーザに対して補完情報の入力を依頼してもよい。
なお、パラメータにはMFP_#1の使用者に係る情報が含まれていてもよい。但し、ユーザが音声入力操作によって使用者に係る情報、すなわち、ユーザ名やユーザID等を設定しなかった場合、実行判定部456は、ステップS102でスマートスピーカから取得した、デバイスID又はユーザIDによってMFP_#1を特定できるか否かを判断する。
この判断に基づいて、検索部460は、印刷に用いられるMFP_#1を検索し、特定する。ここで、MFP_#1を特定できた場合には、検索部460は、当該MFP_#1を印刷に用いられる出力装置としてパラメータに設定する。一方、MFP_#1を特定できなかった場合には、検索部460は、通知部457と協働してスマートスピーカ2を介してMFP_#1を設定するようにユーザへ問い合わせてもよい。
なお、ユーザが音声入力操作によってMFP_#1を設定した場合であっても、設定したMFP_#1と同一の名称を含む出力装置が複数存在する場合がある。そこで、実行判定部456は、音声入力操作によって設定されたMFP_#1の名称に加えて、デバイスID又はユーザIDによってMFP_#1を特定できるか否かを判断してもよい。つまり、実行判定部456は、デバイスIDやユーザIDに関連付けられたMFP_#1が紐づけ用DB402に登録されているかを判断する。これに続いて検索部460は、音声入力操作によって設定されたMFP_#1の名称に加えて、デバイスIDやユーザIDに基づいてMFP_#1を検索し、検索した結果から目的のMFP_#1を特定する。
ここで、検索部460によってMFP_#1が特定された場合は、検索部459は、当該MFP_#1を印刷に用いられる出力装置としてパラメータに設定する。一方、MFP_#1が特定されなかった場合は、検索部460は、通知部457と協働してスマートスピーカ2を介してMFP_#1の詳細を設定するようにユーザへ問い合わせてもよい(ステップS108)。なお、上記ではAIアシスタントサーバ装置4にて印刷を実行させるMFP7を特定する場合について説明したが、MFP7の特定はクライアントPC6が行ってもよく、この場合は、AIアシスタントサーバ装置4におけるMFP7を特定する処理を省略してもよい。
ここで、本実施の形態で使用されるテーブルデータとしてのAction(アクション)及びParameter(パラメータ)について、表1に示した具体例を用いて説明する。なお、AIアシスタントサーバ装置4の解釈結果変換部453は、情報認識サーバ装置3で解釈された解釈結果に基づいてMFP_#1における印刷のための印刷実行命令を示すデータに変換するために、例えば、以下に詳述する表1に示された情報をAIアシスタントサーバ装置4のHDD44等の記憶部に記憶し、参照できる構成としてもよい。
AIアシスタントサーバ装置4は、HDD等の記憶部に、表1に示す出力装置に対する印刷実行命令を含むテーブルデータを記憶する。なお、AIアシスタントサーバ装置4の解釈結果変換部453は、情報認識サーバ装置3で得られた解釈結果を印刷実行命令に変換するために、表1に相当する情報をクライアントPC6のHDD64等の記憶部に記憶し、参照できる構成としてもよい。
表1の例の場合、例えば、「PRINT EXECUTE」、「EMAIL EXECUTE」、及び「STORE EXECUTE」等が、アクション又はインテントの一例として示されている。また、「THIS」、「CURRENT」及び「CLOUD」等が、パラメータの一例として示されている。なお、パラメータとしてはMFP7への印刷実行命令等に対する設定値として指定可能な全てのパラメータが含まれる。
本実施の形態では、例えば、解釈結果変換部453は、「PRINT EXECUTE」の解釈結果を、MFP_#1に対する「印刷の実行」を示す命令に変換処理する。同様に、解釈結果変換部453は、「EMAIL EXECUTE」の解釈結果を、MFP_#1に対する「emailの送信」を示す命令に変換処理する。同様に、解釈結果変換部453は、「STORE EXECUTE」の解釈結果を、MFP_#1に対する「ストレージサービスへの保存」を示す命令に変換処理する。
すなわち、AIアシスタントサーバ装置4の解釈結果変換部453は、解釈結果のアクション又はインテントに含まれる情報で、MFP_#1に対する印刷実行命令の種類を判断し、パラメータに含まれる値を印刷実行命令に対する設定値と判断して、解釈結果を印刷実行命令に変換処理する。なお、表1に示した※の部分、すなわちパラメータの値は、所定の処理命令の設定値として指定可能なものは全て含まれる可能性がある。
なお、AIアシスタントサーバ装置4は、HDD44等の記憶部に表1とは異なる所定の処理の実行命令を含むテーブルデータを記憶し、そのテーブルデータを用いて、解釈結果変換部453で解釈した解釈結果をスマートスピーカ2にフィードバックしてもよい。
解釈結果変換部453は、ステップS108で補完した情報から、例えば、MFP_#1における印刷に必要な印刷実行命令(ジョブ命令)を生成して、通信制御部451を介してクライアントPC6に送信する(ステップS109)。このときの印刷実行命令(ジョブ命令)は、第一の出力要求の一例である。なお、実行指示部454は、印刷対象のファイルがAIアシスタントサーバ装置4にて特定できた場合にはMFP7へ印刷実行指示を送信する。一方、実行指示部454は、AIアシスタントサーバ装置4では特定できなかった場合にのみクライアントPC6へ印刷実行指示を送信してもよい。つまり、ユーザの発話中にファイル名が含まれ、検索部460がそのファイル名と同一名のファイルを特定できた場合には、実行指示部454はクライアントPC6を介さずに直接MFP7へ印刷実行指示を送信する。一方、ユーザが「これ印刷して」と指示した場合など、つまり、発話内容から生成されるパラメータが「THIS」のような場合は、AIアシスタントサーバ装置4では印刷対象のファイルを特定できないため、実行指示部454は、クライアントPC6へ印刷実行命令を送信する。
なお、ステップS109の処理は、例えば、図1のシステム構成図に示した(1)の処理に相当する。また、このとき、解釈結果変換部453は、例えば、クライアントPC6に対する出力要求送信手段として機能する。この場合、例えば、ユーザが発話等によって指示した「これ印刷して」、「これをここに印刷して」、「これをあのプリンタに印刷して」等の指示内容に相当する印刷実行命令が、クラウドサービス装置5(又はAIアシスタントサーバ装置4)からクライアントPC6に送信される。
(送信ファイル及び出力装置の特定)
続いて、クライアントPC6にインストールされた命令実行プログラム(第1のプログラム)が実行されることにより機能する検索部653は、クラウドサービス装置5(又はAIアシスタントサーバ装置4)から取得した印刷実行命令に基づいて、送信するファイル及び送信先の出力装置を特定する。
例えば、印刷実行命令ファイルを指定する情報の一例である「THIS」が含まれている場合、検索部653は、「THIS」という言葉の意味に関連付けられた対象として、クライアントPC6のディスプレイ60に表示されたアクティブウィンドウ中のファイルやデータをMFP7に送信するファイルとして特定する。つまり、検索部653は、クライアントPC6にて複数のプログラムが起動している場合、ユーザーからの対象となっているウィンドウに対応するプログラムに基づいて印刷対象を決定する。また、検索部653は、例えば、Webブラウザや文書作成ソフトウェアなどの第2のプログラムに対して、現在表示中の画像、ページ、ファイル等を出力対象(印刷対象)、ディスプレイ60のスクリーンショットとして特定してもよい。
さらに、検索部653は、例えば、ユーザが発話した「これ印刷して」という音声情報に対して、装置管理テーブル402aで記憶、管理されている情報、並びに発話したユーザのユーザIDに基づいて、MFP_#1を出力対象が出力される出力装置として特定してもよい。同様に、ユーザの発話等による指示内容が、「これをあのプリンタで印刷して」など、出力装置となるプリンタに対して『あの』という指定が含まれている場合も、検索部653は、装置管理テーブル402bで記憶、管理されている情報、並びに発話したユーザのユーザIDに基づいて、対応するMFP_#1等を出力対象が出力される出力装置として特定してもよい。より具体的には、検索部653は、クラウドサービス装置5から取得した印刷実行命令にMFPを特定するための情報が含まれていない場合に、印刷対象を出力するMFP7を決定する。ここで、検索653は、クライアントPC6にてデフォルトで設定されているMFP7を出力先のMFPとして決定することができる。つまり、第3のプログラムの一つであるプリンタドライバ又は、OSの設定として、通常使うプリンタとして予め定められたMFP7を出力先のMFPとして決定する。このように、検索653にてMFP7を特定する場合は、AIアシスタントサーバ装置4におけるMFP7を特定する処理を省略することができる。
検索部653によって送信ファイル及び出力装置が特定された後、印刷要求送信部654は、MFP7の印刷を司るプリンタドライバなどの第3のプログラムを介してMFP_#1に特定された印刷対象を送信するように構成する。なお、第1〜3のプログラムのいれかは、同一のプログラムであってもよい。
但し、送信ファイル及び出力装置の特定方法は上述した例に限定されない。例えば、検索部653は、クライアントPC6内の更新中のファイル又は更新日時が最新のファイルをMFP_#1に送信するファイルとして特定してもよい。また、印刷実行命令に「THIS」以外の特定情報が含まれていた場合は、検索部653は、その特定情報に基づいてMFP_#1に送信するファイルを特定してもよい。例えば、特定情報にファイル名が含まれていた場合は、検索部653は、第1のプログラムがクライアントPC6内のHDD64からファイルを検索することでファイルを特定してもよい。さらに、特定情報に第2のプログラムを指定する情報が含まれていた場合には、検索部653は、クライアントPC6に表示されたウィンドウがアクティブウィンドウであるか否かに関わらず、Webブラウザや文書作成ソフトウェアなどの第2のプログラムによって表示されているページ、ファイル等を特定してもよい。
さらに、検索部653は、特定した出力装置を状況に応じてMFP_#1ではなくMFP_#2に変更してもよい。この「状況」とは、例えば、出力装置の稼働状況や設置状況等である。つまり、MFP_#1は稼働中であるが、MFP_#2は省エネ状態やエラー状態である場合は、検索部653は、直ちに印刷処理が可能なMFP_#1を選択する。また、出力対象となるファイルに対して大量印刷の指示がされ、且つMFP_#1よりもMFP_#2のほうが印刷を指示したユーザの近くに設置されていて双方が印刷可能な場合は、検索部653は、ユーザによる出力ファイルの運搬を考慮してユーザと出力装置との距離が近いMFP_#2を出力装置として特定するようにしてもよい。さらに、よりセキュアな情報処理システムの運用を目的として、検索部653は、発話指示等を行うユーザのユーザIDを参照することで、そのユーザが所属する部署に設置されたMFPを出力装置として特定するようにしてもよい。つまり、検索部653は、ユーザ毎、出力するファイル毎等で出力先の出力装置を特定するように処理をしてもよい(ステップS110)。つまり、クライアントPC6は、予め使用可能なMFP7に関する情報を記憶、管理する。例えば、クライアントPC6は、MFP7と通信することで又はユーザからの音声入力操作を受け付けることで、MFP7のアドレス情報、位置情報、稼働状況を示す状態情報、機能や性能又はオプションの有無を示す機能情報を取得し、記憶することができる。
このように、検索部653は、印刷実行命令を受信後に送信ファイル及び出力装置を特定する。つまり、本実施の形態では、上述した印刷実行命令の特定において、AIアシスタントサーバ装置4の解釈結果変換部453でも送信ファイル及び出力装置を特定するが、特に、出力装置の特定に関しては、検索部653は、出力装置の稼働状況や設置状況等に応じて、解釈結果変換部453で決定された出力装置を適宜変更してもよい。
上述したステップS110で実行される送信ファイル及び出力装置の特定について、図10及び図11を用いて詳述する。図10は、第1の実施の形態におけるクライアントPCの表示画面の一例を示す図である。また、図11は、第1の実施の形態における送信ファイルの特定処理の一例を示すフローチャートである。
図11のフローチャートでは、AIアシスタントサーバ装置4の解釈結果変換部453及び通信制御部451から、クライアントPC6に対して送信されたジョブ命令に対する処理について説明する。まず、クライアントPC6の命令受信部652は、ジョブ命令(印刷実行命令)をAIアシスタントサーバ装置4から受信する(ステップS1000)。
次に、命令受信部652から印刷実行命令を転送された検索部653は、AIアシスタントサーバ装置4から取得したジョブ命令(印刷実行命令)に基づいて印刷対象の特定が必要であるか否かを判断する(ステップS1001)。
検索部653は、印刷対象の特定が必要であると判断した場合(ステップS1001でYes)、検索部653は、例えば、受信した印刷実行命令に含まれる特定情報が印刷対象を間接的に指定しているか否かを判断する(ステップS1002)。なお、『間接的に指定』というのは、例えば、特定情報の中に『これ』、『それ』、『あれ』等の指示代名詞を含む文言が含まれている場合を示す。
このステップS1002での判断では、「これ印刷して」という印刷命令をAIアシスタントサーバ装置4から受信すると、検索部653が、「これ印刷して」という印刷命令中の『これ』という文言の意味を解析する。その際、検索部653は、受信した印刷実行命令に含まれる情報からユーザ管理テーブル402a及び装置管理テーブル402bを参照して、スマートスピーカ2を使用するユーザのユーザID:u0010とそのユーザにより使用されるスマートスピーカ2のデバイスID:ud1001等から、『これ』(印刷実行命令が英語であれば『THIS』)が何かを検索する。
つまり、特定情報が印刷対象を間接的に指定している場合(ステップS1002でYes)、図5の装置管理テーブル402bより、検索部653は、『これ』が、ユーザID:u0010とそのユーザにより使用されるスマートスピーカ2のデバイスID:ud1001及び情報処理装置の装置ID:i001に関連付けられた情報処理装置であるクライアントPC6(PC1)のアクティブウィンドウ上で編集されている文書作成ソフトウェアの形式のファイル「ドキュメントA.doc」であることを特定する(ステップS1003)。
なお、アクティブウィンドウは、例えば図10に示されたような状態を示すものであり、文書作成ソフトウェアの形式のファイル「ドキュメントA.doc」がアクティブウィンドウとして表示されている。
一方、検索部653は、ステップS1001の判断で印刷対象の特定が必要でないと判断した場合(ステップS1001でNo)、検索部653は、このフローを抜ける。
一方、受信した印刷実行命が「これ印刷して」以外の内容であった場合、すなわち、印刷実行命令に『これ』(『THIS』)のような指示代名詞が含まれていない場合(ステップS1002でNo)、検索部653は、以下の処理を実行する。例えば、検索部653は、ステップS1003と同様の方法で印刷実行命令に含まれる特定情報がクライアントPC6で更新(編集)中のファイル又は最新のファイルであるかを判断する(ステップS1004)。
次に、印刷実行命令に含まれる特定情報がクライアントPC6で更新中のファイル又は最新のファイルである場合(ステップS1004でYes)、検索部653は、更新中のファイル又は最新のファイル又はデータを特定する(ステップS1005)。
一方、印刷実行命令に含まれる特定情報がクライアントPC6で更新中のファイル又は最新のファイルでない場合(ステップS1004でNo)、検索部653は、特定情報の中にファイル名が含まれるか否かを判断する(ステップS1006)。
印刷実行命令が、例えば、「ファイルAを印刷して」のように、特定情報の中にファイル名が含まれる場合(ステップS1006でYes)、検索部653は、クライアントPC6のHDD64からファイルを検索してデータを特定する(ステップS1007)。
一方、特定情報の中にファイル名が含まれない場合(ステップS1006でNo)、検索部653は、特定情報の中にWebブラウザや文書作成プログラムなどの第2のプログラムが含まれるか否かを判断する(ステップS1008)。
特定情報の中に第2のプログラムが含まれる場合(ステップS1008でYes)、検索部653は、第2のプログラムにより表示されたファイル、ページ等のデータを特定する(ステップS1009)。
一方、特定情報の中に第2のプログラムが含まれない場合(ステップS1008でNo)、検索部653は、ジョブ命令(印刷実行命令)の内容にしたがい、ファイル、ページ等のデータを特定する(ステップS1010)。
なお、図11に示したフローチャートは一例であって、検索部653により実行される処理は上述した例に限らない。例えば、本実施の形態に係る情報入力システム1の置かれた環境やシステムの用途等に応じて、上述したフローチャートの内容を適宜変えてMFP7に送信するファイルを特定するようにしてもよい。
ここで図9のシーケンス図に戻る。上述したように、クライアントPC6の検索部653は、印刷実行命令に基づいてMFP7で印刷されるファイルを特定する(ステップS110)。つまり、検索部653は、ユーザによって発話された音声情報に含まれる特定のパラメータ(特定の情報の一例)から印刷対象のファイル(出力対象の一例)及び出力先となるMFP_#1(出力装置の一例)のうち少なくとも一方を特定して印刷実行命令(出力要求の一例)を生成する出力特定手段の機能を担う。具体的には、検索部653は、印刷実行命令に含まれる印刷対象のファイルのうち、ディスプレイ60のアクティブウィンドウに表示されたページやファイル等の出力対象、Webアプリのプログラムで実行されるファイル及びプリンタドライバで実行される印刷ファイルのうちのいずれかを特定する。さらに、印刷実行命令に含まれる印刷対象のファイルが出力されるMFP7を特定する。
続いて、クライアントPC6の印刷要求送信部654は、MFP_#1に対して通信制御部651を介して印刷要求の送信を行う(ステップS111)。このとき、印刷要求送信部654は、例えば、第一の出力対象送信手段の機能を担う。
ここで、クライアントPC6の印刷要求送信部654は、印刷要求の送信先であるMFP_#1を、クライアントPC6が所有する第3のプログラムの一つであるプリンタドライバ又はOSによって予め登録することもできる。なお、クライアントPC6の表示制御部656は、MFP_#1に特定したファイルを送信する前に、クライアントPC6のディスプレイ60上に、特定したファイル及びMFP_#1に印刷要求を送信することを示す画面を表示してもよい。この場合、ユーザの許可を受け付けたことを条件に、印刷要求送信部654は、特定された印刷対象であるファイル等をMFP_#1に送信してもよい。
なお、図12は、ファイル又はページを特定する一例を示す画面図である。図12において、複数ページからなるファイルを特定した場合には、表示制御部656は、クライアントPC6のディスプレイ60に、例えば、「File XXのページ一覧」として、図12(a)に示したページのプレビュー画像の一覧を選択可能に表示してもよい。ユーザは、ディスプレイ60に表示された複数ページのプレビュー画像のうち、所望の画像を選択することで、印刷対象となる画像を選択することができる。図12(a)の場合、印刷対象としてユーザによって指定されたページ番号は、Page05〜Page10までの6ページである。
さらに、複数のファイルを取得した場合には、表示制御部656は、クライアントPC6のディスプレイ60に、例えば、「ファイル一覧」として、図12(b)に示したファイルの一覧をユーザインターフェイス(UI)として選択可能に表示してもよい。ユーザは、ディスプレイ60に表示された複数のファイルのうち、所望のファイルを選択することで、印刷対象となるファイルを選択することができる。図12(b)の場合、印刷対象としてユーザによって指定されたファイルは、File3である。上述した実施の形態では、表示制御部656は、印刷対象としたページやファイルをグレーアウト表示して、どのページやファイルが印刷対象として選ばれたかを一目で判別可能にしている。つまり、表示制御部656は、特定された出力対象を他の出力対象と判別可能に表示する機能を有する。なお、表示制御部656は、表示制御手段に相当する。
このようなUIを提供して表示することによって、表示されたページ及びファイルのうち、印刷したいページ及びファイルをユーザが選択できるようにシステムが構築されてもよい。
なお、ステップS111の処理は、例えば、図1のシステム構成図に示した(2)の処理に相当する。さらに、クライアントPC6とMFP7が有線ケーブル等で接続されているような場合は、ステップS111の処理は、図1のシステム構成図に示した(3)の経路で実行されてもよい。通信制御部651は、検索部653が特定したMFPに対して、検索部653が特定したファイルを、AIアシスタントサーバ装置4から取得した印刷実行命令で指定される条件で印刷するように、指示することができる。
続いて、クライアントPC6から印刷対象として特定されたMFP_#1(MFP7)は、クライアントPC6の印刷要求送信部654等から送信された印刷対象の印刷を行う(ステップS112)。
ここで、MFP_#1は、MFP_#1が有する操作部に、取得したファイル、印刷条件及び印刷を実行することを示す画面等を表示してもよい。このときに、印刷条件の変更を受け付けてもよいし、ユーザの許可を受け付けたことを条件に印刷を実行してもよい。
なお、MFP_#1は、クライアントPC6から送信された印刷実行命令にしたがって、装置の電源やネットワーク設定を起動し、所定のファイルの印刷やファイルの送信等を開始、実行するようにしてもよい。また、MFP_#1において他の処理の実行が必要な場合は、スマートスピーカ2は、MFP_#1の使用者に対して、後工程の処理を実行するフィニッシャー等に対する指示内容を発話等によって与えるようにフィードバックをしてもよい。
さらに、クライアントPC6の印刷要求送信部654は、MFP_#1を用いて印刷するようにスマートスピーカ2に対して指示をしたユーザに対して、通知部655を介して、印刷処理が完了したことを示す印刷完了通知等を通知するようにしてもよい。この場合、AIアシスタントサーバ装置4がクライアントPCに対して送信する印刷実行命令には、スマートスピーカ2を特定するための情報として、例えばアドレス情報を含むことができる。これにより、通知部655はアドレス情報に基づいて印刷処理の結果を送信することができる。なお、クライアントPC6がIアシスタントサーバ装置4から取得した印刷実行命令に含まれるスマートスピーカ2のアドレス情報をMFP7に送信することで、MFP7の通知部755は、送信されたアドレス情報に基づいて印刷処理の結果を送信してもよい。
上述した実施の形態では、クライアントPC6がMFP_#1に対して印刷要求を送信する場合について説明したが、これに限定されない。つまり、クライアントPC6でファイルを特定した後、クライアントPC6はこのファイルをクラウドサービス装置5で実行される管理プログラムに送信し、管理プログラムがMFP_#1に対して印刷要求と共にこのファイルを送信してもよい。この場合、クライアントPC6の命令実行プログラムが、特定したファイルを管理プログラムに送信してもよい。また、管理プログラムは、クライアントPC6からファイルを取得した場合、装置IDに関連付けられたMFP_#1等に対してジョブ命令(印刷実行命令)を送信してもよい。このジョブ命令には、ファイルデータ又はファイルの保存場所を示すアドレス情報等が含まれてもよい。さらにMFP_#1は、管理プログラムから取得したジョブ命令に基づいて印刷を実行してもよい。
なお、本実施の形態において、入力操作システム1は、例えば、過去のMFP_#1の印刷履歴及び使用履歴、並びに図5の紐づけ用DB402を構築する各管理テーブルの情報から、ユーザの発話等に伴う音声情報等について、機械学習を利用して、MFP_#1の印刷に加えて関連する処理も自動的に実行するような構成を備えていてもよい。
(第1の実施の形態の効果)
以上の説明から明らかなように、第1の実施の形態の入力操作システム1は、スマートスピーカ2に、プラットフォームアプリケーションプログラムとなる操作音声処理プログラム等を含むプログラムをインストールし、このプラットフォームアプリケーションプログラムによるクラウドサービス装置5との通信を行う。ユーザがスマートスピーカ2に設けられているマイクロホン部29や撮像部30に向かって音声入力操作を行うと、クラウドサービス装置5は、ユーザの発話内容等を解析し、ユーザによって与えられた印刷指示や所定の処理の実行指示が行われるようにMFP7等の出力装置を操作する。
このような構成により、MFP7における印刷や所定の処理を実行させるために必要な操作をユーザが発話する必要最低限の音声入力操作によって実現することができる。つまり、簡略化した指示を与えるだけで所望の出力を得ることが可能になる。これによって、タッチパネル27等のGUI(Graphical User Interface)による操作を不要とすることができる。このため、操作に慣れているユーザであっても、さらに迅速かつ簡単な入力操作を可能とすることができる。また、対話等による操作サポートによって、例えば、複雑なネットワーク設定、高度な処理の設定又は新規アプリの導入等が不要となる。その結果、高齢者又は機械操作に不慣れなユーザ等であっても、ユーザが希望する操作を迅速かつ簡単に実行可能とすることができ、利便性が向上する。
また、ユーザが発話等によって与えた内容から得られたテキストデータに基づいてユーザの意図を解析するため、ユーザの発話等に基づいた処理内容をクラウドサービス装置5(又はAIアシスタントサーバ装置4)側で判断して処理することも可能となる。
<第2の実施の形態>
次に、第2の実施の形態について説明する。第2の実施の形態では第1の実施の形態との相違点を主に説明する。したがって、特に言及されない点については、第1の実施の形態と同様でもよいため、詳細な説明を省略する。
第2の実施の形態では、クラウドサービス装置5(又はAIアシスタントサーバ装置4)で生成した印刷実行命令をクライアントPC6に送信する構成に代えて、一度MFP7に印刷実行命令を送信する。つまり、第2の実施の形態では、入力操作システム1において、上述した紐づけ用DB402に相当するデータベースを、MFP7(出力装置)側に設ける。つまり、このデータベースには、スマートスピーカ2から送信されたスマートスピーカ2を特定するデバイスID又はユーザを特定する識別情報(例えば、ユーザID)、そのユーザが使用するクライアントPC6(情報処理装置)を特定する識別情報(例えば、装置ID)及びアドレス情報等が関連付けて記憶、管理される。このような構成をとることは、サーバ装置5側の記憶手段の構築の負荷を軽減する狙いでもある。さらに、クラウドサービス装置5から取得したクライアントPC6を特定するための情報に基づいて、MFP7からクライアントPC6に対してファイルを要求する点も、第1の実施の形態と相違する点である。
以下、上述した相違に係る具体的な処理を、シーケンス図及びフローチャートを用いて説明する。
図13は、第2の実施の形態に係る入力操作システムの構成の一例を示す図である。なお、各装置のハードウェア構成及び機能構成については、印刷実行命令の送受信経路が第1の実施の形態と一部異なる以外は、上述した図1と同様であるため、詳細な説明を省略する。
図14は、第2の実施の形態における処理の流れの一例を示すシーケンス図である。第2の実施の形態では、スマートスピーカ2を用いたユーザによる発話等に基づいて生成された印刷実行命令を、クラウドサービス装置5(又はAIアシスタントサーバ装置4)から一旦MFP7に送信してその後の処理を実行する場合を例示する。但し、第2の実施の形態も、上述した第1の実施の形態と同様のシステム構成及び各装置におけるハードウェア構成並びに第1の実施の形態と同様の各機能構成により実現することが可能である。
図14のシーケンス図において、ステップS201〜S205までは、第1の実施の形態のステップS101〜S105と同様のため、詳細な説明を省略する。
次に、情報認識サーバ装置3で操作音声変換プログラム等が実行されることにより、解釈部354は、テキストの解釈を行う(ステップS206)。
具体的には、解釈部354は、テキスト化された音声データ等を解釈して、インテントとパラメータを生成する。解釈部354は、音声アシスタントプログラムから取得した辞書情報に基づいて、テキストデータに含まれる単語等が辞書情報と一致しているか否かを判断する。テキストデータに含まれる単語等が辞書情報と一致している場合、解釈部354は、ユーザから指示された操作を示すインテント及び各種処理の実行条件等の変数を示すパラメータに変換する。なお上述した解釈部354の処理については、提供部356が行ってもよい。
ここで、本実施の形態において、インテントは、MFP7に対する印刷要求を示す情報である。パラメータは、印刷対象を指定する情報で、例えば、MFP7の種類や名称等のMFP7を特定する情報、印刷日時、MFP7を使用する使用者に関する情報を含む。なお、ユーザが複数のMFPを使用した印刷を指示する場合、出力装置を特定する情報も複数含まれてよい。さらに、インテント又はパラメータ中にMFP7に対して印刷対象となるファイルの検索を要求する情報を含めてもよい。例えば、ステップS201でユーザが所定の特定情報を発話していた場合、その特定情報をパラメータに含めることができる。なお、後述するように、クラウドサービス装置5によって印刷対象が特定される場合には、パラメータには、印刷対象となるファイルのファイル名やファイルの保存場所を示すアドレス情報などが与えられる。
このように、解釈部354は、テキストデータに基づいて、例えば、ユーザから指定された印刷の依頼、所定の処理の種別(インテント)及び所定の処理に関連する内容(パラメータ)を示す解釈結果を生成する(ステップS206)。
続いて、解釈部354は、生成したインテント、パラメータ及びスマートスピーカ2のデバイスIDをクラウドサービス装置5(又はAIアシスタントサーバ装置4)で実行される管理プログラムに送信する(ステップS207)。
続くステップS208で実行される情報の補完、問合せ及び所定の処理の実行命令(本実施の形態では印刷実行命令)への変換処理については、第1の実施の形態と同様のため、詳細な説明を省略する。
解釈結果変換部453は、第1の実施の形態と同様に、インテントとパラメータに基づいて変換した「これ印刷して」の内容に相当する印刷実行命令を生成して、通信制御部451を介してMFP_#1(MFP7)に送信する(ステップS209)。また、このとき、解釈結果変換部453は、例えば、MFP7に対する出力要求送信手段として機能する。さらに、このときの印刷実行命令(ジョブ命令)は、第二の出力要求の一例である。
なお、解釈結果変換部453は、デバイスID又はユーザIDなどのクライアントPC6を特定するために必要な情報を、送信した印刷実行命令に含めて又は別途、MFP7に送信する。さらに、解釈結果変換部453は、MFP7に記憶された図5に示した装置管理テーブル402bを参照して、デバイスID等からクライアントPC6を特定する。そこで、解釈結果変換部453は、インテント又はパラメータに基づいて生成されるクライアントPC6を特定するための情報をMFP7に送信するか否かを判断する。例えば、印刷実行命令に含まれるパラメータが「THIS」であることを条件に、クライアントPC6を特定するための情報をMFP7に送信することを決定することができる。但し、これに限定されず、例えばステップS201でのユーザによる発話が「PCのファイルを印刷して」のようにファイルの保存場所を特定するための情報である「PC」が含まれている場合には、解釈結果変換部453は、クライアントPC6を特定するための情報をMFP7に送信するように決定してもよい。
(印刷対象及び出力装置の特定)
続いて、MFP7の検索部753は、解釈結果変換部453から取得した印刷実行命令に基づいて印刷対象及び出力装置の特定が必要であるか否かを判断する。例えば、印刷対象が「THIS」のように、ファイルを一意に特定できない情報であることを条件に、検索部753は印刷対象及び出力装置の特定を行う。
また、検索部753は、特定情報を受信したことを条件に印刷対象及び出力装置の特定を行ってもよい。さらに、印刷実行命令にファイル名やファイルの保存場所のアドレス情報などのファイルに係る情報が含まれている場合は、検索部753はファイルを一意に特定することができる。そのため、検索部753は、以下のステップS211の処理を省略することができる。さらに、印刷実行命令に印刷対象のファイルデータが含まれている場合にも、検索部753は、以下のステップS211を省略することができる(ステップS210)。また、検索部753は、印刷実行命令に含まれるスマートスピーカ2のデバイスID又はユーザIDに基づいて、クライアントPC6を特定する。なお、本実施の形態におけるステップS210の処理の詳細については、第1の実施の形態で説明した考え方及び図11のフローチャートと同様のため、詳細な説明を省略する。
次に、検索部753は、クラウドサービス装置5から取得したクライアントPC6を特定するための情報に基づいて、そのクライアントPC6に対してファイルを要求する(ステップS211)。つまり、検索部753は、出力対象となるファイルやデータを出力するための出力要求(印刷実行命令等)に基づいて、出力対象となるファイルやデータとその出力先となる出力装置を特定し、クライアントPC6(情報処理装置)に対して必要なデータの取得を要求する出力対象要求手段の一例となり得る。一方で、クライアントPC6の命令受信部652は、ステップS211でMFP7から送信された印刷対象のファイル出力要求を受信する出力対象要求受信手段としての機能を担うこともできる。
ここで、クライアントPC6側の処理は、第1の実施の形態のステップS110と同様である(但し、第1のプログラムは、MFP7からファイル要求を取得し、そのファイル要求に基づいて、第2のプログラム又は第3のプログラムにファイルを要求する)。なお、特定したファイルをMFP7に送信するプログラムは、第1、第2及び第3のプログラムのいずれでもよい。但し、クライアントPC6は、ファイル要求の送信元のMFP7に対してファイルを返信する。このため、検索部653は、MFP7を特定する処理を省略することができる。
続いて、印刷要求受信部752は、クライアントPC6から印刷対象のファイルを取得する(ステップS212)。このとき、クライアントPC6の印刷要求送信部654は、例えば、第二の出力対象送信手段の機能を担う。ここでの処理は、例えば、印刷要求受信部752は、クライアントPC6のディスプレイ60上で編集中又は編集したファイルを印刷対象として取得することができる。
続いて、印刷要求受信部752は、ステップS212で取得した印刷対象のファイルをMFP7の操作部等のディスプレイ60上に表示する(ステップS213)。ステップS212で複数ページからなるファイルを取得した場合には、印刷要求受信部752はページのプレビュー画像又は一覧を表示してもよいし、複数のファイルを取得した場合にはファイルの一覧を表示してもよい。ユーザは、表示されたページ及びファイルのうち、印刷したいページ及びファイルを選択することができる。
続いて、印刷実行部754は、ステップS211で選択されたページ又はファイルを印刷する(ステップS214)。
以上説明した実施の形態では、クライアントPC6は、デバイスや各種MFP7の印刷状況をクラウドサービス装置5(又はAIアシスタントサーバ装置4)経由でスマートスピーカ2に送信する場合について説明したが、これに限定されない。例えば、クライアントPC6は、上述したデバイスや各種MFP7の印刷状況をスマートスピーカ2へ直接送信してもよい。この場合、印刷実行命令には、スマートスピーカ2へ印刷状況を通知する要求と、スマートスピーカ2のアドレス情報などスマートスピーカ2へアクセスするために必要な情報を含めることができる。また、印刷状況の通知先は、スマートスピーカ2に限定されない。例えば、クライアントPCや他の情報入力装置へ直接又はクラウドサービス装置5(又はAIアシスタントを介して印刷状況を通知してもよい。
(第2の実施の形態の効果)
以上の説明から明らかなように、第2の実施の形態の入力操作システム1は、スマートスピーカ2に、プラットフォームアプリケーションプログラムとなる操作音声処理プログラム等を含むプログラムをインストールし、このプラットフォームアプリケーションプログラムによるクラウドサービス装置5との通信を行う。ユーザがスマートスピーカ2に設けられているマイクロホン部29や撮像部30に向かって音声入力操作を行うと、クラウドサービス装置5がユーザの発話内容等を解析し、ユーザによって与えられたMFP7への印刷指示等をMFP7に送信する。これに続いて、MFP7はクライアントPC6に対して送信するファイルを特定し、特定したファイルを要求する。ファイルを要求されたクライアントPC6は、印刷対象のファイルをMFP7に送信し、MFP7等は印刷を実行する。
このような構成により、MFPで印刷命令を受信し、印刷を実行させるために必要な操作を、ユーザが発話する必要最低限の音声入力操作によって実現することができる。つまり、簡略化した指示を与えるだけで所望の出力を得ることが可能になる。これによって、タッチパネル27等のGUI(Graphical User Interface)による操作を不要とすることができる。このため、操作に慣れているユーザであっても、さらに迅速かつ簡単な入力操作を可能とすることができる。また、対話等による操作サポートによって、例えば、複雑なネットワーク設定、高度な処理の設定又は新規アプリの導入等が不要となる。その結果、高齢者又は機械操作に不慣れなユーザ等であっても、ユーザが希望する操作を迅速かつ簡単に実行可能とすることができ、利便性が向上する。
また、ユーザが発話等によって与えた内容から得られたテキストデータに基づいてユーザの意図を解析するため、ユーザの発話等に基づいた処理内容をクラウドサービス装置5(又はAIアシスタントサーバ装置4)側で判断して処理することも可能となる。
上述した実施の形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上述した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)や従来の回路モジュール等のデバイスを含むものとする。
なお、情報入力装置は、マイク機能、撮像機能、スピーカ機能、表示機能、操作機能及び通信機能等を備えた装置であれば、スマートスピーカに限られない。情報入力装置は、例えば、ノートPC(Personal Computer)、携帯電話、スマートフォン、タブレット端末、ゲーム機、PDA(Personal Digital Assistant)、デジタルカメラ、ウェアラブルPCまたはデスクトップPC等であってもよい。
また、情報処理装置は、サーバ装置及び出力装置等と通信可能である。なお、情報処理装置は、例えば、出力装置と通信を行う機能を備えた装置であれば、クライアントPCに限られない。
同様に、出力装置は、上述したMFP以外に、ネットワークを介して通信可能で、情報処理装置上の画面や画像イメージなどの各種コンテンツを送受信可能な装置であればその種類を問わない。例えば、出力装置は、プロジェクタ、電子黒板(IWB:Interactive White Board)、テレビ会議・Web会議システム(UCS:Unified Communication System)及びデジタルサイネージ等の電子機器であってもよい。このとき、MFP7は、クライアントPC6によって制御される一方で、クライアントPC6を介さずに、例えば、クラウドサービス装置5から送信される実行命令等を直接受信して処理を行うものでもよい。
最後に、上述の各実施の形態は、一例として提示したものであり、本発明の範囲を限定することは意図していない。この新規な各実施の形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置換え、変更を行うことも可能である。例えば、上述の第1の実施の形態の説明では、情報認識サーバ装置3がユーザにより与えられた発話等に対応するテキストデータを生成し、生成したテキストデータに基づいて、AIアシスタントサーバ装置4がユーザの意図している操作を解釈した。しかし、情報入力装置2側に、このような音声認識機能及び解釈機能を設け、スマートスピーカ2で、ユーザの発話から意図する操作を解釈してもよい。これにより、情報認識サーバ装置3及びAIアシスタントサーバ装置4を不要とすることができ、システム構成を簡素化することができる。
このような各実施の形態及び各実施の形態の変形は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。