JP6598033B2 - 画像形成装置 - Google Patents

画像形成装置 Download PDF

Info

Publication number
JP6598033B2
JP6598033B2 JP2017009872A JP2017009872A JP6598033B2 JP 6598033 B2 JP6598033 B2 JP 6598033B2 JP 2017009872 A JP2017009872 A JP 2017009872A JP 2017009872 A JP2017009872 A JP 2017009872A JP 6598033 B2 JP6598033 B2 JP 6598033B2
Authority
JP
Japan
Prior art keywords
command
voice
microphone
user
forming apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017009872A
Other languages
English (en)
Other versions
JP2018121134A (ja
Inventor
国晃 大山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2017009872A priority Critical patent/JP6598033B2/ja
Publication of JP2018121134A publication Critical patent/JP2018121134A/ja
Application granted granted Critical
Publication of JP6598033B2 publication Critical patent/JP6598033B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Accessory Devices And Overall Control Thereof (AREA)
  • Facsimiles In General (AREA)

Description

本発明は、画像形成装置に関するものである。
近年、音声認識技術を使用して、ユーザーの音声で機器を操作することが可能になっている。ある画像形成装置は、音声操作が開始された場合、近隣の機器に対して音声操作の開始を通知することで、その近隣の機器に対する音声操作を無効にさせて、非対象機器での音声認識を防止している(例えば特許文献1参照)。
特開2006−23636号公報
しかしながら、複数ユーザーが操作対象の機器の周辺にいる場合、操作対象の機器が、その複数ユーザーの音声を認識してしまい、その機器を操作しているユーザーとは別のユーザーの音声に従って誤動作をしてしまう可能性がある。
本発明は、上記の問題に鑑みてなされたものであり、他のユーザーの音声を誤って認識する可能性を低くする画像形成装置を得ることを目的とする。
本発明に係る画像形成装置は、内部装置と、所定範囲を撮影し撮影画像を出力するカメラと、音声を集音するマイクロフォンと、前記マイクロフォンの集音範囲を移動させるマイクロフォン操作部と、前記撮影画像から人物が検出されるか否かを判定し、前記人物が検出された場合、前記人物をコマンドユーザーと特定し、前記コマンドユーザーの顔の位置を特定するユーザー検出部と、前記ユーザー検出部により前記コマンドユーザーが特定された場合、(a)前記コマンドユーザーの顔の位置に基づいて、前記マイクロフォン操作部を制御して前記マイクロフォンの集音範囲を前記コマンドユーザーの顔へ向け、(b)前記マイクロフォンにより集音された音声に対して音声認識処理を実行し、前記マイクロフォンにより集音された音声に対応するコマンドを特定する音声認識部と、特定された前記コマンドに従って前記内部装置を制御する制御部とを備える。そして、前記音声認識部は、前記マイクロフォンにより集音された前記音声から声紋を特定し、音声操作開始コマンドの前記音声の声紋をコマンドユーザーの声紋とし、前記制御部は、(a)音声操作終了まで、前記コマンドユーザーの声紋と一致する前記声紋の音声に対応するコマンドに従って前記内部装置を制御し、前記コマンドユーザーの声紋と一致しない前記声紋の音声に対応するコマンドを拒否し、(b)前記音声操作終了時に、前記コマンドユーザーの声紋を破棄し、(c)前記音声認識部により特定された前記コマンドが音声操作終了コマンドである場合には、当該コマンドの前記声紋が前記コマンドユーザーの声紋と一致するか否かに拘わらず、前記音声操作を終了させ、前記コマンドユーザーの声紋を破棄する。
本発明によれば、他のユーザーの音声を誤って認識する可能性を低くする画像形成装置が得られる。
本発明の上記又は他の目的、特徴および優位性は、添付の図面とともに以下の詳細な説明から更に明らかになる。
図1は、本発明の実施の形態に係る画像形成装置の構成を示すブロック図である。 図2は、図1に示す画像形成装置1の動作について説明するフローチャートである。 図3は、図1に示す画像形成装置1によるコマンドユーザー音声の集音について説明する斜視図である。 図4は、図1におけるユーザー検出部31によるコマンドユーザーの特定について説明する図である。
以下、図に基づいて本発明の実施の形態を説明する。
図1は、本発明の実施の形態に係る画像形成装置の構成を示すブロック図である。図1に示す画像形成装置1は、印刷機能、画像読取機能、ファクシミリ機能などを有する複合機である。
画像形成装置1は、操作パネル11、人感センサー12、カメラ13、スピーカー14、マイクロフォン15、マイクロフォン操作部16、通信装置21、モデム22、印刷装置23、画像読取装置24、およびコントローラー25を備える。
操作パネル11は、液晶ディスプレイなどの表示装置11a、およびタッチパネルなどの入力装置11bを備え、ユーザーに対する操作画面の表示およびユーザーの入力操作の検出を行う。表示装置11aは、ユーザーに対して操作画面を表示し、入力装置11bは、ユーザーにより入力されるユーザー操作を受け付ける。
人感センサー12は、赤外線、超音波などにより、当該画像形成装置1の前方の所定範囲内の人物を検出するセンサーである。
カメラ13は、当該画像形成装置1の前方の所定範囲を撮影し撮影画像を出力する。この実施の形態では、カメラ13は、人感センサー12により人物が検出されると、所定範囲の撮影を開始する。
スピーカー14は、音声案内などを出力する。
マイクロフォン15は、音声を集音し、音声信号として出力する。マイクロフォン操作部16は、マイクロフォン15の集音範囲を移動させる。
例えば、マイクロフォン15は、超指向性マイクロフォンであり、マイクロフォン操作部16は、モーター、アクチュエーターなどでマイクロフォン15の向きを機械的に調整して、マイクロフォン15の集音範囲を移動させる。
あるいは、例えば、マイクロフォン15として、マイクロフォンアレイを使用し、マイクロフォン操作部16が、そのマイクロフォンアレイからの複数の音声信号に対して信号処理をして集音範囲を移動させるようにしてもよい。
また、通信装置21は、コンピューターネットワークに接続され、そのコンピューターネットワークに接続された他の装置との間で所定の通信プロトコルでデータ通信を行う内部装置(ネットワークインターフェイスなど)である。
また、モデム22は、構内交換機などに接続され、構内交換機などを介して、公衆電話交換網に接続された他の装置との間で音声通信を行う内部装置である。モデム22は、ファクシミリ送受信に使用される。
また、印刷装置23は、例えば電子写真方式で原稿画像を印刷用紙に印刷する内部装置である。また、画像読取装置24は、原稿から原稿画像を光学的に読み取り、原稿画像の画像データを生成する内部装置である。
また、コントローラー25は、図示せぬCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)などを有するコンピューターを備え、ROMまたは図示せぬ記憶装置に記憶されているプログラムをRAMへロードし、そのプログラムをCPUで実行することにより、各種処理部として動作する。コントローラー25は、ASIC(Application Specific Integrated Circuit)を備え、ASICで特定の処理を実行するようにしてもよい。
ここでは、コントローラー25は、ユーザー検出部31、音声認識部32、および制御部33として動作する。
ユーザー検出部31は、カメラ13により得られた撮影画像から人物が検出されるか否かを判定し、人物が検出された場合、その人物をコマンドユーザーと特定し、コマンドユーザーの顔の位置を特定する。
なお、ユーザー検出部31は、撮影画像から複数の人物が検出された場合、例えば、複数の人物の顔領域をそれぞれ特定し、カメラ13(つまり、画像形成装置1)に近い人物ほど顔領域の面積が大きくなるため、顔領域の面積が最も大きい人物をコマンドユーザーと特定する。
音声認識部32は、ユーザー検出部31によりコマンドユーザーが特定された場合、(a)コマンドユーザーの顔の位置に基づいて、マイクロフォン操作部16を制御してマイクロフォン15の集音範囲をコマンドユーザーの顔へ向け、(b)マイクロフォン15により集音された音声に対して音声認識処理を実行し、マイクロフォン15により集音された音声に対応するコマンドを特定する。
なお、ユーザー検出部31により撮影画像から複数の人物が検出された場合、音声認識部32は、マイクロフォン操作部16を制御して、コマンドユーザーの顔がマイクロフォン15の集音範囲に入り、かつコマンドユーザー以外の人物の顔がマイクロフォン15の集音範囲に入らないように、マイクロフォン15の集音範囲を移動させるようにしてもよい。
制御部33は、音声認識部32により特定されたコマンドに従って内部装置を制御する。
この実施の形態では、音声認識部32は、マイクロフォン15により集音された音声から声紋を特定し、音声操作開始コマンドの音声の声紋をコマンドユーザーの声紋として一時的に保持する。そして、制御部33は、(a)音声操作終了まで、コマンドユーザーの声紋と一致する声紋の音声に対応するコマンドに従って内部装置を制御し、コマンドユーザーの声紋と一致しない声紋の音声に対応するコマンドを拒否し、(b)音声操作終了時に、コマンドユーザーの声紋を破棄する。
さらに、制御部33は、音声認識部32により特定されたコマンドが音声操作終了コマンドである場合には、当該コマンドの声紋がコマンドユーザーの声紋と一致するか否かに拘わらず、音声操作を終了させ、コマンドユーザーの声紋を破棄するようにしてもよい。
なお、この声紋の照合については、行わないようにしてもよい。
次に、上記画像形成装置1の動作について説明する。図2は、図1に示す画像形成装置1の動作について説明するフローチャートである。図3は、図1に示す画像形成装置1によるコマンドユーザー音声の集音について説明する斜視図である。
ユーザー検出部31は、図3に示すように、音声取得可能範囲内で人感センサー12により人物が検出されたか否かを監視しており(ステップS1)、ユーザー検出部31は、人感センサー12により人物が検出されると、カメラ13による撮影を開始する(ステップS2)。なお、音声取得可能範囲は、マイクロフォン15の集音範囲の可動範囲である。
ユーザー検出部31は、撮影画像に対して顔認識処理を実行し、人物の顔領域を検出してコマンドユーザーを特定し、コマンドユーザーの顔の位置を特定する(ステップS3)。図4は、図1におけるユーザー検出部31によるコマンドユーザーの特定について説明する図である。このとき、図4に示すように、複数の人物の顔領域が検出された場合には、面積が最も大きい顔領域の人物がコマンドユーザーと特定される。
次に、音声認識部32は、特定されたコマンドユーザーの顔の位置に基づいて、マイクロフォン操作部16を制御してマイクロフォン15の集音範囲をコマンドユーザーの顔へ向ける(ステップS4)。例えば、カメラ13の撮影画像の頂点の位置と、マイクロフォン15の集音範囲の向きとが予め特定されており、撮影画像内のコマンドユーザーの顔の位置に対応するマイクロフォン15の集音範囲の向きが線形補間などに基づいて特定される。
その後、音声認識部32は、マイクロフォン15により集音された音声に対して音声認識処理を実行し、マイクロフォン15により集音された音声に対応するコマンドを特定する(ステップS5)。このとき、マイクロフォン15の集音範囲がコマンドユーザーの顔に向いているので、コマンドユーザーの音声が良好に集音されるとともに、マイクロフォン15の指向性に基づいて他の人物の音声は集音されにくくなっている。
そして、音声認識部32は、コマンドユーザーの声紋が保持されているか否かを判定し(ステップS6)、コマンドユーザーの声紋が保持されていない場合、特定したコマンドが音声開始コマンドであるか否かを判定し(ステップS7)、特定したコマンドが音声開始コマンドである場合には、特定したコマンドの音声の声紋を特定し、コマンドユーザーの声紋として保持する(ステップS8)。
一方、コマンドユーザーの声紋が保持されている場合、音声認識部32は、特定したコマンドが音声操作終了コマンドであるか否かを判定する(ステップS9)。特定したコマンドが音声操作終了コマンドではない場合、音声認識部32は、特定したコマンドの音声の声紋がコマンドユーザーの声紋に一致するか否かを判定する(ステップS10)。特定したコマンドの音声の声紋がコマンドユーザーの声紋に一致する場合には、制御部33は、内部装置を制御して、特定したコマンドにより指示された処理を実行する(ステップS11)。このとき、特定したコマンドの音声の声紋がコマンドユーザーの声紋に一致しない場合には、制御部33は、特定したコマンドにより指示された処理を実行しない。
他方、特定したコマンドが音声操作終了コマンドである場合(ステップS9)、音声認識部32は、保持しているコマンドユーザーの声紋を破棄する(ステップS12)。
なお、ステップS7において、特定されたコマンドが音声操作開始コマンドではない場合には、ステップS1に戻り、音声操作開始コマンドが検出されるまで、ステップS1〜S7の処理が実行される。
また、ステップS8におけるコマンドユーザーの声紋保持の後、ステップS1に戻り、コマンドユーザーの音声による次のコマンドが検出されるまで、ステップS1〜S6,S9,S10の処理が実行される。
また、ステップS12においてコマンドユーザーの声紋破棄の後、ステップS1に戻り、ステップS1に戻り、音声操作開始コマンドが検出されるまで、ステップS1〜S7の処理が実行される。
以上のように、上記実施の形態によれば、ユーザー検出部31は、カメラ13による撮影画像から人物が検出されるか否かを判定し、人物が検出された場合、その人物をコマンドユーザーと特定し、コマンドユーザーの顔の位置を特定する。音声認識部32は、ユーザー検出部31によりコマンドユーザーが特定された場合、(a)コマンドユーザーの顔の位置に基づいて、マイクロフォン操作部16を制御してマイクロフォン15の集音範囲をコマンドユーザーの顔へ向け、(b)マイクロフォン15により集音された音声に対して音声認識処理を実行し、マイクロフォン15により集音された音声に対応するコマンドを特定する。制御部33は、特定されたコマンドに従って内部装置を制御する。
これにより、コマンドユーザー以外の他のユーザーの音声を誤って認識する可能性が低くなる。
なお、上述の実施の形態に対する様々な変更および修正については、当業者には明らかである。そのような変更および修正は、その主題の趣旨および範囲から離れることなく、かつ、意図された利点を弱めることなく行われてもよい。つまり、そのような変更および修正が請求の範囲に含まれることを意図している。
例えば、上記実施の形態において、人感センサー12により人物が検出されたときに、音声操作開始コマンドの特定音声(例えば「音声操作開始」など)を発するようにその人物に促す音声をスピーカー14から出力するようにしてもよい。
また、上記実施の形態においては、音声操作終了コマンドを音声で入力しているが、さらに、操作パネル11を操作して、音声操作を終了させることができるようにしてもよい。
本発明は、例えば、複合機などの画像形成装置に適用可能である。
1 画像形成装置
13 カメラ
15 マイクロフォン
16 マイクロフォン操作部
21 通信装置(内部装置の一例)
22 モデム(内部装置の一例)
23 印刷装置(内部装置の一例)
24 画像読取装置(内部装置の一例)
31 ユーザー検出部
32 音声認識部
33 制御部

Claims (4)

  1. 内部装置と、
    所定範囲を撮影し撮影画像を出力するカメラと、
    音声を集音するマイクロフォンと、
    前記マイクロフォンの集音範囲を移動させるマイクロフォン操作部と、
    前記撮影画像から人物が検出されるか否かを判定し、前記人物が検出された場合、前記人物をコマンドユーザーと特定し、前記コマンドユーザーの顔の位置を特定するユーザー検出部と、
    前記ユーザー検出部により前記コマンドユーザーが特定された場合、(a)前記コマンドユーザーの顔の位置に基づいて、前記マイクロフォン操作部を制御して前記マイクロフォンの集音範囲を前記コマンドユーザーの顔へ向け、(b)前記マイクロフォンにより集音された音声に対して音声認識処理を実行し、前記マイクロフォンにより集音された音声に対応するコマンドを特定する音声認識部と、
    特定された前記コマンドに従って前記内部装置を制御する制御部と、
    を備え
    前記音声認識部は、前記マイクロフォンにより集音された前記音声から声紋を特定し、音声操作開始コマンドの前記音声の声紋をコマンドユーザーの声紋とし、
    前記制御部は、(a)音声操作終了まで、前記コマンドユーザーの声紋と一致する前記声紋の音声に対応するコマンドに従って前記内部装置を制御し、前記コマンドユーザーの声紋と一致しない前記声紋の音声に対応するコマンドを拒否し、(b)前記音声操作終了時に、前記コマンドユーザーの声紋を破棄し、(c)前記音声認識部により特定された前記コマンドが音声操作終了コマンドである場合には、当該コマンドの前記声紋が前記コマンドユーザーの声紋と一致するか否かに拘わらず、前記音声操作を終了させ、前記コマンドユーザーの声紋を破棄すること、
    を特徴とする画像形成装置。
  2. 前記ユーザー検出部は、前記撮影画像から複数の人物が検出された場合、前記複数の人物の顔領域をそれぞれ特定し、前記顔領域の面積が最も大きい人物を前記コマンドユーザーと特定することを特徴とする請求項1記載の画像形成装置。
  3. 前記音声認識部は、前記ユーザー検出部により前記撮影画像から複数の人物が検出された場合、前記マイクロフォン操作部を制御して、前記コマンドユーザーの顔が前記マイクロフォンの集音範囲に入り、かつ前記コマンドユーザー以外の人物の顔が前記マイクロフォンの集音範囲に入らないように、前記マイクロフォンの集音範囲を移動させることを特徴とする請求項2記載の画像形成装置。
  4. 前記マイクロフォンは、超指向性マイクロフォンであり、
    前記マイクロフォン操作部は、前記マイクロフォンの向きを機械的に調整して、前記マイクロフォンの集音範囲を移動させること、
    を特徴とする請求項1から請求項3のうちのいずれか1項記載の画像形成装置。
JP2017009872A 2017-01-23 2017-01-23 画像形成装置 Active JP6598033B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017009872A JP6598033B2 (ja) 2017-01-23 2017-01-23 画像形成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017009872A JP6598033B2 (ja) 2017-01-23 2017-01-23 画像形成装置

Publications (2)

Publication Number Publication Date
JP2018121134A JP2018121134A (ja) 2018-08-02
JP6598033B2 true JP6598033B2 (ja) 2019-10-30

Family

ID=63044473

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017009872A Active JP6598033B2 (ja) 2017-01-23 2017-01-23 画像形成装置

Country Status (1)

Country Link
JP (1) JP6598033B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7124572B2 (ja) * 2018-09-05 2022-08-24 コニカミノルタ株式会社 画像形成装置および画像形成装置の制御プログラム
JP7187965B2 (ja) * 2018-10-17 2022-12-13 コニカミノルタ株式会社 画像処理装置、操作制御方法及び操作制御プログラム
JP7200772B2 (ja) * 2019-03-18 2023-01-10 コニカミノルタ株式会社 画像形成装置、画像形成装置の制御方法、および画像形成装置の制御プログラム
JP7367419B2 (ja) * 2019-09-17 2023-10-24 コニカミノルタ株式会社 画像形成装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008257566A (ja) * 2007-04-06 2008-10-23 Kyocera Mita Corp 電子機器
JP2010154260A (ja) * 2008-12-25 2010-07-08 Victor Co Of Japan Ltd 音声識別装置
JP2011061461A (ja) * 2009-09-09 2011-03-24 Sony Corp 撮像装置、指向性制御方法及びそのプログラム
US20160150124A1 (en) * 2014-11-24 2016-05-26 Kyocera Document Solutions Inc. Image Forming Apparatus with User Identification Capabilities

Also Published As

Publication number Publication date
JP2018121134A (ja) 2018-08-02

Similar Documents

Publication Publication Date Title
JP6598033B2 (ja) 画像形成装置
JP6504808B2 (ja) 撮像装置、音声コマンド機能の設定方法、コンピュータプログラム、及び記憶媒体
JP6478159B2 (ja) ユーザ識別能力を有する画像形成装置
JP4734980B2 (ja) 顔認証装置およびその制御方法、顔認証装置を備えた電子機器、顔認証装置制御プログラム、ならびに該プログラムを記録した記録媒体
KR102314480B1 (ko) 지문 인식 장치 및 방법
JP5662670B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2017167685A (ja) 画像処理装置及びプログラム
KR20210065178A (ko) 생체 검출 방법 및 장치, 전자 기기 및 저장 매체
WO2014124588A1 (zh) 利用便携式设备进行拍照的方法及便携式设备
US9927974B2 (en) Automatic customization of keypad key appearance
JP2005242677A (ja) 複合認証システムおよびその方法ならびにプログラム
EP3422698B1 (en) Method, device, mobile terminal, and camera for identifying photograph subject
JP2007048218A (ja) 画像処理システム、認証方法
CN104424073A (zh) 一种信息处理的方法及电子设备
WO2015042783A1 (zh) 非接触式掌纹认证方法、装置及便携终端
JP2019082973A (ja) 投影システム
CN110545352A (zh) 电子设备、控制装置、电子设备的控制方法、及记录介质
CN107155062B (zh) 记录声音信息的拍照方法及装置、移动终端
JP6650018B1 (ja) 情報処理装置、情報処理方法、プログラムならびに情報処理サーバ
JP2020109913A (ja) 画像処理装置、画像処理装置の制御方法、及びプログラム
JP2019164707A (ja) 電子機器、該電子機器の制御装置、制御プログラムおよび制御方法
JP2013007851A (ja) 撮像装置
JP2019152815A (ja) 投影システムとその制御方法及びプログラム
JP4502992B2 (ja) 撮影装置
JP7365793B2 (ja) 撮像装置およびその制御方法、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181029

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190801

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190822

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190905

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190918

R150 Certificate of patent or registration of utility model

Ref document number: 6598033

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150