JP7359008B2 - 情報処理装置及び情報処理プログラム - Google Patents

情報処理装置及び情報処理プログラム Download PDF

Info

Publication number
JP7359008B2
JP7359008B2 JP2020015709A JP2020015709A JP7359008B2 JP 7359008 B2 JP7359008 B2 JP 7359008B2 JP 2020015709 A JP2020015709 A JP 2020015709A JP 2020015709 A JP2020015709 A JP 2020015709A JP 7359008 B2 JP7359008 B2 JP 7359008B2
Authority
JP
Japan
Prior art keywords
utterance
service
information processing
settings
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020015709A
Other languages
English (en)
Other versions
JP2021124779A (ja
Inventor
貴文 治田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2020015709A priority Critical patent/JP7359008B2/ja
Priority to US16/916,128 priority patent/US11403060B2/en
Priority to CN202010788858.4A priority patent/CN113204324A/zh
Publication of JP2021124779A publication Critical patent/JP2021124779A/ja
Application granted granted Critical
Publication of JP7359008B2 publication Critical patent/JP7359008B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1202Dedicated interfaces to print systems specifically adapted to achieve a particular effect
    • G06F3/1203Improving or facilitating administration, e.g. print management
    • G06F3/1205Improving or facilitating administration, e.g. print management resulting in increased flexibility in print job configuration, e.g. job settings, print requirements, job tickets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1237Print job management
    • G06F3/1253Configuration of print job parameters, e.g. using UI at the client
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1237Print job management
    • G06F3/126Job scheduling, e.g. queuing, determine appropriate device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1278Dedicated interfaces to print systems specifically adapted to adopt a particular infrastructure
    • G06F3/1284Local printer device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00403Voice input means, e.g. voice commands

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)
  • Facsimiles In General (AREA)

Description

本発明は、情報処理装置及び情報処理プログラムに関する。
特許文献1には、話者の発話内容を認識する音声認識手段、及びその認識結果に応じた応答音声を合成音声により提供する応答制御手段を備えた音声対話装置において、前記話者による発話速度を検出する話速検出手段を備え、前記応答制御手段は、前記音声認識手段が話者の発話の終了を検出した時点から前記応答音声の提供を開始するまでの応答時間を、前記話速検出手段により検出された発話速度に応じて変化させることを特徴とする音声対話装置が開示されている。
特開2012-128440号公報
従来、制御対象装置に対して発話によりサービスの実行を指示する場合に、発話者がサービスの設定を発話するのは手間がかかる、という問題点があった。
本発明は、発話者が実行を指示する場合に、サービスの設定を発話する場合に比較して、当該発話のための手間を削減できる情報処理装置及び情報処理プログラムを提供することを目的とする。
上記目的を達成するために、第1態様に係る情報処理装置は、プロセッサを備え、前記プロセッサが、サービスを実行させる指示を発話により受け付け、受け付けた前記サービスを、前記発話の状態を用いて決定した設定で実行させる制御を行う。
また、第2態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記発話の状態が、前記発話の音声の高さ、大きさ、及び速度の少なくとも1つの状態であるものである。
また、第3態様に係る情報処理装置は、第2態様に係る情報処理装置において、前記プロセッサが、前記発話の音声が大きいほど、より多い回数で、受け付けた前記サービスを実行させる制御を行う。
また、第4態様に係る情報処理装置は、第2態様に係る情報処理装置において、前記プロセッサが、前記発話の音声が大きいほど、より大きな設定値で、受け付けた前記サービスを実行させる制御を行う。
また、第5態様に係る情報処理装置は、第1態様~第4態様の何れか1態様に係る情報処理装置において、前記プロセッサが、過去の発話を用いて、前記設定を決定する。
また、第6態様に係る情報処理装置は、第5態様に係る情報処理装置において、前記プロセッサが、前記指示を行った発話者を特定し、当該指示を行った発話者から過去に受け付けた前記発話を用いて、前記設定を決定する。
また、第7態様に係る情報処理装置は、第6態様に係る情報処理装置において、前記プロセッサが、前記サービスを実行させる指示を発話により受け付けた際に、声を用いた認証により、当該指示を行った発話者を特定し、当該指示を行った発話者から過去に受け付けた前記発話を用いて、前記設定を決定する。
また、第8態様に係る情報処理装置は、第1態様~第7態様の何れか1態様に係る情報処理装置において、前記プロセッサが、前記指示を行った発話者の予定情報を用いて決定した設定で前記サービスを実行させる制御を行う。
また、第9態様に係る情報処理装置は、第8態様に係る情報処理装置において、前記プロセッサが、前記発話の状態を用いて決定した前記設定及び前記予定情報を用いて決定した前記設定が異なる場合に、どちらの設定を選択するかを更に受け付ける。
また、第10態様に係る情報処理装置は、第8態様に係る情報処理装置において、前記プロセッサが、前記発話の状態を用いて決定した前記設定及び前記予定情報を用いて決定した前記設定が異なる場合に、前記予定情報を用いて決定した前記設定で前記サービスを実行させる制御を行う。
また、第11態様に係る情報処理装置は、第8態様~第10態様の何れか1態様に係る情報処理装置において、前記予定情報が、受け付けた前記サービスに関する予定情報であるものである。
また、第12態様に係る情報処理装置は、第1態様~第11態様の何れか1態様に係る情報処理装置において、前記プロセッサが、前記サービス及び決定した前記設定の内容を提示する制御を更に行う。
また、第13態様に係る情報処理装置は、第12態様に係る情報処理装置において、前記プロセッサが、前記サービス及び前記設定の提示に応じた、前記指示を行った発話者による発話を更に受け付ける。
また、第14態様に係る情報処理装置は、第12態様又は第13態様に係る情報処理装置において、前記プロセッサが、前記発話と並行して生じていた雑音の音量が予め定めたレベルより大きい場合に、前記提示する制御を行う。
また、第15態様に係る情報処理装置は、第1態様~第14態様の何れか1態様に係る情報処理装置において、前記プロセッサが、受け付けた前記サービスを、前記発話の状態を用いて決定した設定で画像形成装置に対して実行させる制御を行う。
更に、上記目的を達成するために、第16態様に係る情報処理プログラムは、サービスを実行させる指示を発話により受け付け、受け付けた前記サービスを、前記発話の状態を用いて決定した設定で実行させる制御を行う処理をコンピュータに実行させる。
第1態様及び第16態様によれば、発話者が実行を指示する場合に、サービスの設定を発話する場合に比較して、当該発話のための手間を削減できる、という効果を有する。
第2態様によれば、発話から簡易に得られる状態で設定を決定できる、という効果を有する。
第3態様によれば、発話の音声の大きさによってサービスの実行回数を決定することができる、という効果を有する。
第4態様によれば、発話の音声の大きさによってサービスの設定値を決定することができる、という効果を有する。
第5態様によれば、過去の発話を用いない場合に比較して、サービスの設定を高精度に決定することができる、という効果を有する。
第6態様によれば、指示を行った発話者を特定しない場合に比較して、サービスの設定を高精度に決定することができる、という効果を有する。
第7態様によれば、声を用いた認証を行わない場合に比較して、指示を行った発話者を高精度に特定できる、という効果を有する。
第8態様によれば、発話者の予定を考慮したサービスの設定を行うことができる、という効果を有する。
第9態様によれば、発話者の要望に応じたサービスの設定を適用することができる、という効果を有する。
第10態様によれば、発話者の予定を優先してサービスの設定を決定することができる、という効果を有する。
第11態様によれば、予定情報が、受け付けたサービスとは無関係の情報である場合に比較して、より合理的にサービスの設定を行うことができる、という効果を有する。
第12態様によれば、実行させるサービス及び設定を、発話者に対して事前に確認させることができる、という効果を有する。
第13態様によれば、サービスを指示した発話者による設定の変更を受け付けることができる、という効果を有する。
第14態様によれば、雑音の音量が予め定めたレベルより大きい場合に、誤認識による無駄なサービスの実行を回避することができる、という効果を有する。
第15態様によれば、発話者が画像形成に関するサービスの設定を発話する場合に比較して、当該発話のための手間を削減できる、という効果を有する。
第1及び第2実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。 第1実施形態に係る情報処理装置の機能的な構成の一例を示すブロック図である。 実施形態に係る発話状態情報データベースの構成の一例を示す模式図である。 実施形態に係る予定情報データベースの構成の一例を示す模式図である。 実施形態に係る情報処理の流れの一例を示すフローチャートである。 第1実施形態に係る設定決定処理の流れの一例を示すフローチャートである。 第2実施形態に係る情報処理装置の機能的な構成の一例を示すブロック図である。 第2実施形態に係る設定決定処理の流れの一例を示すフローチャートである。 第3実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。 第3実施形態に係る情報処理装置の機能的な構成の一例を示すブロック図である。 第3実施形態に係る設定決定処理の流れの一例を示すフローチャートである。
以下、図面を参照して、本発明を実施するための形態例を詳細に説明する。なお、ここでは、情報処理装置としてパーソナルコンピュータを適用した場合について説明する。また、ここでは、情報処理装置及び制御対象装置が別体で構成されている場合について説明するが、これらが一体で構成されていてもよい。
[第1実施形態]
図1に示すように、本実施形態に係る情報処理装置10は、CPU(Central Processing Unit:プロセッサ)11、一時記憶領域としてのメモリ12、不揮発性の記憶部13、及び通信インタフェース(I/F)部18を備えている。CPU11、メモリ12、記憶部13、及び通信I/F部18はバスB1を介して互いに接続されている。
記憶部13はHDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等によって実現される。記憶媒体としての記憶部13には、情報処理プログラム13A及び設定決定プログラム13Bが記憶されている。CPU11は、情報処理プログラム13A及び設定決定プログラム13Bを記憶部13から読み出してメモリ12に展開し、情報処理プログラム13A及び設定決定プログラム13Bが有するプロセスを順次実行する。また、記憶部13には、発話状態情報データベース13C及び予定情報データベース13Dが記憶されている。発話状態情報データベース13C及び予定情報データベース13Dについては詳細を後述する。
本実施形態では、制御対象装置として画像形成装置を適用しており、通信I/F部18には、音声入出力装置80及び画像形成装置90が接続されている。従って、CPU11は、音声入出力装置80及び画像形成装置90と各種情報を送受信することができる。なお、本実施形態では、音声入出力装置80として、スマートスピーカを適用しているが、スマートフォン及び携帯情報端末装置等の音声の入力及び出力を行うことができる他の装置を適用する形態としてもよい。また、本実施形態では、画像形成装置90として、印刷機能、画像読取機能及びファクシミリ機能等を有するデジタル複合機を適用しているが、これに限らないことは言うまでもない。
次に、本実施形態に係る情報処理装置10の機能的な構成について説明する。図2に示すように、情報処理装置10は、受付部11A、特定部11B、決定部11C、及び制御部11Dを含む。情報処理装置10のCPU11が、情報処理プログラム13A及び設定決定プログラム13Bを実行することで、受付部11A、特定部11B、決定部11C、及び制御部11Dとして機能する。
本実施形態に係る受付部11Aは、画像形成装置90を用いるサービスを実行させる指示を音声入出力装置80を介して発話により受け付ける。なお、ここで言う「サービス」には、無償で行う処理に加えて有償で行う処理も含まれる。また、本実施形態では、上記サービスとして印刷サービスを適用するが、この形態に限るものではなく、例えば画像読取サービス及びファクシミリ送信サービス等を適用する形態としてもよい。
また、本実施形態に係る特定部11Bは、受付部11Aで受け付けた指示を行った発話者を特定する。なお、本実施形態に係る特定部11Bは、受付部11Aで上記サービスを実行させる指示を発話により受け付けた際に、従来既知の発声内容依存型の話者認識方法を適用して上記発話者を特定しているが、この形態に限定されるものではない。例えば、発声内容独立型の話者認識方法等の技術を適用して上記発話者を特定する形態としてもよいし、声を用いた認証ではなく、画像形成装置90に備えられたタッチパネル等の入力部を介して入力された情報によって上記発話者を特定する形態としてもよい。
また、本実施形態に係る決定部11Cは、過去の発話を用いて、上記サービスの設定を決定する。なお、本実施形態では、上記設定の対象として、印刷画像の解像度、印刷用紙のサイズ、及び1枚の印刷用紙に印刷する原稿の枚数を適用しているが、これに限らない。例えば、これらの設定の対象に加えて印刷の速度及びカラー印刷の要否等の他の設定の対象を含めてもよいし、これらの個別、または複数の組み合わせを適用する形態としてもよい。また、本実施形態に係る決定部11Cは、上記指示を行った発話者から過去に受付部11Aで受け付けた発話を用いて、上記設定を決定しているが、この形態に限定されるものではない。例えば、情報処理装置10のユーザ等により予め登録された発話を用いて、上記設定を決定する形態としてもよい。
また、本実施形態に係る制御部11Dは、受付部11Aで受け付けたサービス及び決定した当該サービスの設定の内容を提示する制御を更に行う。なお、本実施形態では、上記発話と並行して生じていた雑音の音量が予め定めたレベルより大きい場合に、上記提示する制御を行う形態を適用しているが、この形態に限らず、例えば、受付部11Aでサービスを実行させる指示を受け付ける度に上記提示する制御を行う形態を適用してもよい。
また、本実施形態では、上記サービス及び上記設定の提示を、音声入出力装置80を介した音声の出力により行う形態としているが、これに限らない。例えば、画像形成装置90に備えられた液晶ディスプレイ等の表示部によって上記サービス及び上記設定を表示する形態としてもよい。
また、本実施形態では、上記予め定めたレベルとして、上記雑音の音量が当該値以上である場合は、当該雑音と並行して行われた発話の認識が困難であるものとして、予め実機を用いた実験や、コンピュータ・シミュレーション等によって得られた値を適用しているが、これに限定されるものではない。例えば、情報処理装置10のユーザ等によって、情報処理に求められるサービスの認識精度や、情報処理装置10の用途等に応じて、予め設定しておく形態としてもよい。
また、本実施形態に係る受付部11Aは、上記サービス及び上記設定の提示に応じた、当該サービスの実行の指示を行った発話者による発話を更に受け付ける。
また、本実施形態に係る制御部11Dは、受付部11Aで受け付けたサービスを、受付部11Aで受け付けた発話の状態を用いて決定した設定で実行させる制御を画像形成装置90に行う。なお、本実施形態では、上記発話の状態として、対応する発話の音声の高さ、大きさ、及び速度を適用しているが、これに限らない。例えば、これらの状態に加えて訛りの有無(例えば、関東弁か、関西弁か等)や、発話の感情(嬉しいか、悲しいか等)等の他の状態を含めてもよいし、これらの個別、または複数の組み合わせを適用する形態としてもよい。また、本実施形態に係る制御部11Dは、上記発話の音声の高さが高い程、印刷画像の解像度を高く設定し、上記発話の音声の大きさが大きい程、印刷用紙のサイズを大きく設定し、発話の音声の速度が速い程、1枚の印刷用紙に印刷する原稿の枚数を多く設定する形態(本実施形態では、3段階の設定)としているが、これに限らない。例えば、上記発話が関西弁の場合は、印刷の速度を速くする等、これらの発話の状態と、設定と、の組み合わせ以外の組み合わせを適用する形態としてもよい。
また、本実施形態に係る制御部11Dは、受付部11Aで受け付けたサービスを、受付部11Aで受け付けた指示を行った発話者の予定情報を用いて決定した設定も適用して実行させる制御を画像形成装置90に行う。なお、本実施形態では、上記予定情報を用いて決定した設定の対象として、1枚の印刷用紙に印刷する原稿の枚数を適用しているが、これに限らない。例えば、印刷画像の解像度及び印刷用紙のサイズ等の他の設定を対象として適用してもよいし、これらの個別、または複数の組み合わせを適用する形態としてもよい。
また、本実施形態に係る制御部11Dは、上記発話の状態を用いて決定した上記設定及び上記予定情報を用いて決定した上記設定が異なる場合に、上記予定情報を用いて決定した上記設定で上記サービスを実行させる制御を画像形成装置90に行う。なお、本実施形態では、上記予定情報として、受付部11Aで受け付けた上記サービスに関する予定情報を適用しているが、これに限らないことは言うまでもない。
次に、本実施形態に係る発話状態情報データベース13Cについて説明する。図3に示すように、本実施形態に係る発話状態情報データベース13Cは、発話者、日時、及び発話状態の各情報が関連付けられて記憶される。
上記発話者は、受付部11Aで受け付けたサービスの実行の指示を行った発話者を示す情報であり、上記日時は、対応する発話者による上記実行の指示を行った日時を示す情報である。また、上記発話状態は、対応する発話者による、上記実行の指示を行った際の発話の状態を示す情報である。
次に、本実施形態に係る予定情報データベース13Dについて説明する。図4に示すように、本実施形態に係る予定情報データベース13Dは、発話者、日時、及び予定の各情報が関連付けられて記憶されている。
上記発話者は、発話状態情報データベース13Cの発話者と同一の情報であり、上記日時は、対応する発話者の予定がある日時を示す情報であり、上記予定は、対応する日時に実施する予定の名称を示す情報である。図4に示す例では、例えば、発話者Aは、2019年12月5日の9時から17時までの間に出張を予定していることを表している。
次に、図5を参照して、情報処理を実行する際の情報処理装置10の作用を説明する。情報処理装置10のCPU11が情報処理プログラム13Aを実行することで図5に示す情報処理が実行される。なお、ここでは、錯綜を回避するため、発話状態情報データベース13C及び予定情報データベース13Dが、一例として図3及び図4に示すように構築されている場合について説明する。
ステップ200で、CPU11は、サービスを実行させる指示が、何れかの発話者による発話によって行われるまで待機する。ステップ202で、CPU11は、ステップ200の処理により受け付けた発話によって指示されたサービスを、従来既知の音声認識技術を用いて特定し、ステップ204で、CPU11は、当該発話の状態を特定する。本実施形態では、上記発話の状態を特定する方法として、上記発話の音声の高さは上記音声の周波数を用いて特定し、上記発話の音声の大きさは上記音声の音圧を用いて特定し、上記発話の音声の速度は、従来既知の音声認識技術によって特定した上記発話の文字数を発話時間で除算することで特定する形態を適用する。
次のステップ206で、CPU11は、実行させるサービスの設定を決定するための処理である設定決定処理を実行する。情報処理装置10のCPU11が設定決定プログラム13Bを実行することで図6に示す設定決定処理が実行される。以下、図6を参照して、本実施形態に係る設定決定処理について説明する。
ステップ400で、CPU11は、ステップ200の処理によって受け付けた発話を行った発話者(以下、「対象発話者」という。)を特定し、特定した対象発話者による発話状態を示す全ての値を発話状態情報データベース13Cから読み出す。そして、CPU11は、予め定められた時間帯別で、かつ、読み出した発話状態を示す値における、高さ、大きさ、及び速度の各状態別に平均値を算出することで、時間帯別で、かつ、各状態別の閾値Tを導出する。なお、本実施形態では、上記時間帯として午前及び午後を適用しているが、これに限らない。例えば、情報処理装置10のユーザ等によって、情報処理装置10の用途等に応じて、上記時間帯を予め設定しておく形態としてもよい。
以下では、「高さ」に関する閾値Tを閾値Tvと表し、「大きさ」に関する閾値Tを閾値Tlと表し、「速度」に関する閾値Tを閾値Tsと表す。
ステップ402で、CPU11は、ステップ204の処理によって特定した発話の音声の高さが、この時刻の時間帯に対応する閾値Tv(以下、単に「閾値Tv」という。)と同じであるか否かを判定し、肯定判定となった場合はステップ406に移行して、CPU11は、印刷画像の解像度の設定を300dpiとし、後述するステップ412に移行する。一方、ステップ402で否定判定となった場合は、ステップ404に移行して、CPU11は、ステップ204の処理によって特定した発話の音声の高さが閾値Tvより大きいか否かを判定し、肯定判定となった場合はステップ408に移行して、CPU11は、印刷画像の解像度の設定を600dpiとし、後述するステップ412に移行する。一方、ステップ404で否定判定となった場合は特定した発話の音声の高さが閾値Tvより小さいものとみなしてステップ410に移行し、CPU11は、印刷画像の解像度の設定を200dpiとして、ステップ412に移行する。
ステップ412で、CPU11は、ステップ204の処理によって特定した発話の音声の大きさが、この時刻の時間帯に対応する閾値Tl(以下、単に「閾値Tl」という。)と同じであるか否かを判定し、肯定判定となった場合はステップ416に移行して、CPU11は、印刷用紙のサイズの設定をA4とし、後述するステップ422に移行する。一方、ステップ412で否定判定となった場合は、ステップ414に移行して、CPU11は、ステップ204の処理によって特定した発話の音声の大きさが閾値Tlより大きいか否かを判定し、肯定判定となった場合はステップ418に移行して、CPU11は、印刷用紙のサイズの設定をA3とし、後述するステップ422に移行する。一方、ステップ414で否定判定となった場合は特定した発話の音声の大きさが閾値Tvより小さいものとみなしてステップ420に移行し、CPU11は、印刷用紙のサイズの設定をB5として、ステップ422に移行する。
例えば、発話者が、「コピーして。」と比較的大きな声で発話して、当該発話の音声の大きさが閾値Tlより大きい場合、印刷用紙のサイズの設定をA3とする。一方、発話者が、「コピーして。」と比較的小さな声で発話して、当該発話の音声の大きさが閾値Tlより小さい場合、印刷用紙のサイズの設定をB5とする。
ステップ422で、CPU11は、ステップ204の処理によって特定した発話の音声の速度が、この時刻の時間帯に対応する閾値Ts(以下、単に「閾値Ts」という。)と同じであるか否かを判定し、肯定判定となった場合はステップ426に移行して、CPU11は、1枚の印刷用紙に2枚分の原稿をまとめて印刷する設定とし、後述するステップ432に移行する。一方、ステップ422で否定判定となった場合は、ステップ424に移行して、CPU11は、ステップ204の処理によって特定した発話の音声の速度が閾値Tsより大きいか否かを判定し、肯定判定となった場合はステップ428に移行して、CPU11は、1枚の印刷用紙に全ての原稿をまとめて印刷する設定とし、後述するステップ432に移行する。一方、ステップ424で否定判定となった場合は特定した発話の音声の速度が閾値Tsより小さいものとみなしてステップ430に移行し、CPU11は、原稿の枚数と同じ枚数で印刷する設定として、ステップ432に移行する。
なお、これらの印刷サービスのための具体的な設定値はいずれも一例であることは言うまでもない。上記設定値を、画像形成装置90が設定可能な範囲内で情報処理装置10のユーザ等により変更することができる形態としてもよい。
ステップ432で、CPU11は、対象発話者の日時及び予定を示す全ての情報を予定情報データベース13Dから読み出す。ステップ434で、CPU11は、予定情報データベース13Dから読み出した情報に、この時点に対象発話者が実施する予定で、かつ、画像形成装置90による印刷を伴う予定(例えば、会議、来客対応等)が含まれているか否かを判定し、否定判定となった場合は本設定決定処理を終了する一方、肯定判定となった場合は、ステップ436へ移行して、CPU11は、1枚の印刷用紙に全ての原稿をまとめて印刷する設定とし、本設定決定処理を終了する。設定決定処理が終了すると、情報処理(図5参照。)のステップ208に移行する。
ステップ208で、CPU11は、発話者によるサービスを実行させる指示と並行して生じていた雑音の音量が予め定められた閾値Tn以上であるか否かを判定し、肯定判定となった場合は、後述するステップ212に移行する一方、否定判定となった場合はステップ210に移行する。
ステップ210で、CPU11は、対象発話者が本情報処理を初めて実行するか否かを判定し、否定判定となった場合は後述するステップ220へ移行する一方、肯定判定となった場合はステップ212へ移行する。ステップ212で、CPU11は、特定したサービス、及び設定決定処理で決定した設定を、音声入出力装置80を介した音声の出力により提示し、ステップ214へ移行する。ここで、対象発話者は、提示された内容で、特定したサービスを実行してよいか否かを示す発話を行う。また、対象発話者は、提示された内容で、指示したサービスを実行してはいけない場合には、改めて、サービス及び設定の内容を発話する。そこで、ステップ214で、CPU11は、対象発話者によるステップ212で提示したサービス及び設定に応じた発話が音声入出力装置80に対して行われるまで待機する。
ステップ216で、CPU11は、ステップ214の処理により受け付けた発話の内容を従来既知の音声認識技術を用いて特定して、提示した内容でサービスを実行してよいか否かを判定し、否定判定となった場合はステップ218へ移行して、CPU11は、特定したサービス及び設定に再設定し、ステップ212へ戻る。一方、ステップ216で肯定判定となった場合は、ステップ220へ移行して、CPU11は、以上の処理によって決定した設定でサービスを実行させる制御を画像形成装置90に行う。ステップ222で、CPU11は、ステップ204の処理によって特定した対象発話者による発話状態を示す全ての値を、この時点の日時を示す情報と共に発話状態情報データベース13Cに登録し、本情報処理を終了する。
なお、本実施形態では、上記発話の状態を用いて決定した設定及び上記予定情報を用いて決定した設定が異なる場合に、CPU11が、上記予定情報を用いて決定した設定で上記サービスを実行させる制御を画像形成装置90に行う形態について説明したが、これらの設定のうちどちらの設定を選択するかを更に受け付ける形態としてもよい。この場合の形態例としては、図6に示す設定決定処理において、ステップ422~ステップ430の処理、及びステップ432~ステップ436の処理の何れか一方の処理を、選択結果に応じて実行する形態を例示することができる。
[第2実施形態]
上記第1実施形態では、受け付けた発話の状態に応じた設定を、閾値を用いて決定する形態について説明したが、本第2実施形態では、閾値を用いることなく設定を決定する場合の形態例について説明する。なお、本第2実施形態に係る情報処理装置のハードウェア構成については、上記第1実施形態に係る構成(図1参照。)と同一であるため、ここでの説明を省略する。
まず、図7を参照して、本第2実施形態に係る情報処理装置10の機能的な構成について説明する。なお、図7における図2と同様の要素には図2と同一の符号を付する。図7に示すように、本第2実施形態では、情報処理装置10に特定部11B及び決定部11Cが含まれていない点のみが上記第1実施形態と異なっている。
次に、図8を参照して、本第2実施形態に係る情報処理装置10の作用として、設定決定処理を実行する際の情報処理装置10の作用について説明する。なお、図5に示す情報処理は、設定決定処理を除いて第1実施形態と同様であるため、ここでの説明は省略する。また、図8に示す設定決定処理における、図6に示す設定決定処理と同一の処理を実行するステップについては図6と同一のステップ番号を付して、その説明を省略する。
図8に示す設定決定処理と図6に示す設定決定処理とでは、ステップ400~ステップ430の処理に代えて、ステップ401~ステップ421の処理が適用されている点が異なっている。
すなわち、図8のステップ401で、CPU11は、図5のステップ204の処理によって特定した発話の音声の高さが高い程、印刷画像の解像度を高く設定する。本第2実施形態では、上記印刷画像の解像度を、発話の音声の高さを入力情報とし、印刷画像の解像度を出力情報とする、予め定めたルックアップテーブルを用いて設定する形態を適用しているが、当該ルックアップテーブルと同様の入出力情報とされる演算式等により設定する形態を適用してもよい。
ステップ411で、CPU11は、図5のステップ204の処理によって特定した発話の音声の大きさが大きい程、印刷用紙のサイズを大きく設定する。本第2実施形態では、上記印刷用紙のサイズを、発話の音声の大きさを入力情報とし、印刷用紙のサイズを出力情報とする、予め定めたルックアップテーブルを用いて設定する形態を適用しているが、当該ルックアップテーブルと同様の入出力情報とされる演算式等により設定する形態を適用してもよい。
ステップ421で、CPU11は、図5のステップ204の処理によって特定した発話の音声の速度が速い程、1枚の印刷用紙に印刷する原稿の枚数を多く設定する。本第2実施形態では、上記原稿の枚数を、発話の音声の速度を入力情報とし、上記原稿の枚数を出力情報とする、予め定めたルックアップテーブルを用いて設定する形態を適用しているが、当該ルックアップテーブルと同様の入出力情報とされる演算式等により設定する形態を適用してもよい。
なお、本第2実施形態では、発話の音声が大きいほど、より大きな設定値で、受け付けたサービスを実行させる制御を行う場合の形態例として、制御対象装置として画像形成装置90を適用した場合の形態例について説明したが、この形態に限定されるものではない。例えば、当該制御を行う場合の形態例として、制御対象装置として音楽再生装置を適用する場合、以下の形態としてもよい。
即ち、この場合、例えば、音声入出力装置80(ここでは、スマートスピーカ)を介して「音楽を流して」と比較的大きな声で発話された場合、音楽を流すというサービスが実行され、設定値として、音楽を流す音量を通常の音量(例えば、音声入出力装置80や、音声入出力装置80と連携している端末装置等に設定されている初期の音量や、それまでに流していた音量等)より上げて音楽を流すように音声入出力装置80を制御する。一方で、音声入出力装置80を介して「音楽を流して」と比較的小さな声で発話された場合、音楽を流すというサービスが実行され、設定値として、音楽を流す音量を上記通常の音量より下げて音楽を流すように音声入出力装置80を制御する。
更に、この形態例において、音楽が流れ始めた後等に音声入出力装置80を介して「音量を上げて」と比較的大きな声で発話された場合、それまでより音量を上げるというサービスが実行され、設定値として、音量を上げる幅を通常よりも大きくするように音声入出力装置80を制御する。この場合、例えば、通常は1段階ずつ音量を上げていくが、通常よりも大きい段階(例えば、2段階)ずつ上げていく形態としてもよい。一方で、音声入出力装置80を介して「音量を上げて」と比較的小さな声で発話された場合、それまでより音量を上げるというサービスが実行され、設定値として、音量を上げる幅を通常よりも小さくするように音声入出力装置80を制御する。この場合、例えば、通常は1段階ずつ音量を上げていくが、通常よりも小さい段階(例えば、0.5段階)ずつ上げていく形態としてもよい。
[第3実施形態]
上記第1実施形態及び上記第2実施形態では、制御対象装置として画像形成装置90を適用する形態について説明したが、本第3実施形態では、制御対象装置として掃除用ロボット100を適用する形態例について説明する。
まず、図9を参照して、本第3実施形態に係る情報処理装置のハードウェア構成について説明する。なお、図9における図1と同様の要素には図1と同一の符号を付する。図9に示すように、本第3実施形態では、通信I/F部18に掃除用ロボット100が接続されている点が上記第1実施形態及び上記第2実施形態と異なっている。なお、本第3実施形態では、掃除用ロボット100として、自走機能及び掃除機能等を有する自走式掃除機を適用しているが、これに限らないことは言うまでもない。
次に、図10を参照して、本第3実施形態に係る情報処理装置10の機能的な構成について説明する。なお、図10における図2と同様の要素には図2と同一の符号を付する。図10に示すように、本第3実施形態では、制御部11Dに掃除用ロボット100が接続されている点のみが上記第2実施形態と異なっている。
本第3実施形態に係る受付部11Aは、掃除用ロボット100を用いるサービスを発話により受け付ける点のみが上記第1実施形態及び上記第2実施形態と異なっている。なお、本第3実施形態では、上記サービスとして吸引掃除サービスを適用するが、この形態に限るものではなく、例えば拭き取り掃除サービス等を適用する形態としてもよい。
また、本第3実施形態に係る制御部11Dは、受付部11Aで受け付けたサービスを、受付部11Aで受け付けた発話の状態を用いて決定した設定で実行させる制御を掃除用ロボット100に行う点が、上記第1実施形態及び上記第2実施形態と異なっている。なお、本第3実施形態では、上記設定の対象として、同一の箇所を吸引掃除する回数及び吸引掃除を実施する部屋の数を適用しているが、これに限らない。例えば、これらの設定に加えて掃除用ロボット100の吸引力の大きさや吸引掃除を開始するまでの時間等の他の設定の対象を含めてもよいし、これらの個別、または複数の組み合わせを適用する形態としてもよい。
また、本第3実施形態に係る制御部11Dは、受付部11Aで受け付けた発話の音声の大きさを用いて同一の箇所を吸引掃除する回数を、上記音声の速度を用いて吸引掃除を実施する部屋の数を、それぞれ決定する形態としている点が上記第1実施形態及び上記第2実施形態と異なっている。なお、これらの発話の状態と、設定と、の組み合わせ以外の組み合わせを適用する形態としてもよい。
また、本第3実施形態に係る制御部11Dは、受付部11Aで受け付けたサービスを、受付部11Aで受け付けた指示を行った発話者の予定情報を用いて決定した設定で実行させる制御を掃除用ロボット100に行う点が上記第1実施形態及び上記第2実施形態と異なっている。なお、本第3実施形態では、上記予定情報を用いて決定した設定の対象として、同一の箇所を吸引掃除する回数を適用しているが、これに限らない。例えば、吸引掃除を実施する部屋の数を適用してもよいし、これらの個別、または複数の組み合わせを適用する形態としてもよい。
次に、図11を参照して、本第3実施形態に係る情報処理装置10の作用として、設定決定処理を実行する際の情報処理装置10の作用について説明する。なお、図5に示す情報処理は、設定決定処理を除いて第1実施形態と同様であるため、ここでの説明は省略する。
ステップ600で、CPU11は、図5のステップ204の処理によって特定した発話の音声の大きさが大きい程、掃除用ロボット100が同一の箇所を吸引掃除する回数を多く設定する。なお、本第3実施形態では、上記吸引掃除する回数を、発話の音声の大きさを入力情報とし、上記吸引掃除する回数を出力情報とする、予め定めたルックアップテーブルを用いて設定する形態を適用しているが、当該ルックアップテーブルと同様の入出力情報とされる演算式等により設定する形態を適用してもよい。
ステップ602で、CPU11は、図5のステップ204の処理によって特定した発話の音声の速度が速い程、掃除用ロボット100が吸引掃除を実施する部屋の数を多く設定する。なお、本第3実施形態では、上記部屋の数を、発話の音声の速度を入力情報とし、上記部屋の数を出力情報とする、予め定めたルックアップテーブルを用いて設定する形態を適用しているが、当該ルックアップテーブルと同様の入出力情報とされる演算式等により設定する形態を適用してもよい。
ステップ604で、CPU11は、対象発話者の日時及び予定を示す全ての情報を予定情報データベース13Dから読み出す。ステップ606で、CPU11は、予定情報データベース13Dから読み出した情報に、この時点に対象発話者が実施する予定で、かつ、掃除用ロボット100による吸引掃除を伴う予定(例えば、来客対応等)が含まれているか否かを判定し、否定判定となった場合は本設定決定処理を終了する一方、肯定判定となった場合は、ステップ608へ移行して、CPU11は、掃除用ロボット100が同一の箇所を吸引掃除する回数を2回とし、本設定決定処理を終了する。設定決定処理が終了すると、情報処理(図5参照。)のステップ208に移行する。
なお、これらの吸引掃除サービスのための具体的な設定値はいずれも一例であることは言うまでもない。上記設定値を、掃除用ロボット100が設定可能な範囲内で情報処理装置10のユーザ等により変更することができる形態としてもよい。
以上、実施の形態を説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。発明の要旨を逸脱しない範囲で上記実施の形態に多様な変更又は改良を加えることができ、該変更又は改良を加えた形態も本発明の技術的範囲に含まれる。
また、上記実施の形態は、クレーム(請求項)にかかる発明を限定するものではなく、また実施の形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。前述した実施の形態には種々の段階の発明が含まれており、開示される複数の構成要件の組み合わせにより種々の発明が抽出される。実施の形態に示される全構成要件から幾つかの構成要件が削除されても、効果が得られる限りにおいて、この幾つかの構成要件が削除された構成が発明として抽出され得る。
また、上記実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えば、CPU等)や、専用のプロセッサ(例えば、GPU: Graphics Processing Unit、ASIC: Application Specific Integrated Circuit、FPGA: Field Programmable Gate Array、プログラマブル論理デバイス、等)を含むものである。
また、上記実施形態では、制御対象装置の例として、画像形成装置、音楽再生装置、及び掃除用ロボットを適用したが、これらに限定するものではなく、風呂沸かし器、照明装置、テレビ、及び空調装置等を含めてもよいし、これらの個別、または複数の組み合わせを適用する形態としてもよい。
また、上記実施形態では、情報処理プログラム13A及び設定決定プログラム13Bが記憶部13に予めインストールされている場合について説明したが、これに限定されるものではない。例えば、情報処理プログラムが、CD-ROM(Compact Disc Read Only Memory)等の記憶媒体に格納されて提供される形態、又はネットワークを介して提供される形態としてもよい。
さらに、上記実施形態では、情報処理及び設定決定処理を、プログラムを実行することにより、コンピュータを利用してソフトウェア構成により実現する場合について説明したが、本発明はこれに限定されるものではない。例えば、情報処理及び設定決定処理を、ハードウェア構成や、ハードウェア構成とソフトウェア構成の組み合わせによって実現する形態としてもよい。
その他、上記実施形態で説明した情報処理装置10の構成(図1、図2、図9、及び図10参照。)は一例であり、本発明の主旨を逸脱しない範囲内において不要な部分を削除したり、新たな部分を追加したりしてもよいことは言うまでもない。
また、上記実施形態で説明した情報処理の流れ(図5参照。)及び設定決定処理の流れ(図6、図8、及び図11参照。)も一例であり、本発明の主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよいことは言うまでもない。
10 情報処理装置
11 CPU
11A 受付部
11B 特定部
11C 決定部
11D 制御部
12 メモリ
13 記憶部
13A 情報処理プログラム
13B 設定決定プログラム
13C 発話状態情報データベース
13D 予定情報データベース
18 通信I/F部
80 音声入出力装置
90 画像形成装置
100 掃除用ロボット

Claims (15)

  1. プロセッサを備え、
    前記プロセッサは、
    サービスを実行させる指示を発話により受け付け、
    受け付けた前記サービスを、前記発話の状態を用いて決定した設定で実行させる制御を行
    更に前記プロセッサは、
    前記指示を行った発話者の予定情報を用いて決定した設定で前記サービスを実行させる制御を行い、
    前記発話の状態を用いて決定した前記設定及び前記予定情報を用いて決定した前記設定が異なる場合に、どちらの設定を選択するかを更に受け付ける、
    情報処理装置。
  2. プロセッサを備え、
    前記プロセッサは、
    サービスを実行させる指示を発話により受け付け、
    受け付けた前記サービスを、前記発話の状態を用いて決定した設定で実行させる制御を行い、
    更に前記プロセッサは、
    前記指示を行った発話者の予定情報を用いて決定した設定で前記サービスを実行させる制御を行い、
    前記発話の状態を用いて決定した前記設定及び前記予定情報を用いて決定した前記設定が異なる場合に、前記予定情報を用いて決定した前記設定で前記サービスを実行させる制御を行う、
    情報処理装置。
  3. 前記発話の状態は、前記発話の音声の高さ、大きさ、及び速度の少なくとも1つの状態である、
    請求項1又は請求項2に記載の情報処理装置。
  4. 前記プロセッサは、
    前記発話の音声が大きいほど、より多い回数で、受け付けた前記サービスを実行させる制御を行う、
    請求項に記載の情報処理装置。
  5. 前記プロセッサは、
    前記発話の音声が大きいほど、より大きな設定値で、受け付けた前記サービスを実行させる制御を行う、
    請求項に記載の情報処理装置。
  6. 前記プロセッサは、
    過去の発話を用いて、前記設定を決定する、
    請求項1~の何れか1項に記載の情報処理装置。
  7. 前記プロセッサは、
    前記指示を行った発話者を特定し、
    当該指示を行った発話者から過去に受け付けた前記発話を用いて、前記設定を決定する、
    請求項に記載の情報処理装置。
  8. 前記プロセッサは、
    前記サービスを実行させる指示を発話により受け付けた際に、声を用いた認証により、当該指示を行った発話者を特定し、
    当該指示を行った発話者から過去に受け付けた前記発話を用いて、前記設定を決定する、
    請求項に記載の情報処理装置。
  9. 前記予定情報は、受け付けた前記サービスに関する予定情報である、
    請求項の何れか1項に記載の情報処理装置。
  10. 前記プロセッサは、
    前記サービス及び決定した前記設定の内容を提示する制御を更に行う、
    請求項1~の何れか1項に記載の情報処理装置。
  11. 前記プロセッサは、
    前記サービス及び前記設定の提示に応じた、前記指示を行った発話者による発話を更に受け付ける、
    請求項10に記載の情報処理装置。
  12. 前記プロセッサは、
    前記発話と並行して生じていた雑音の音量が予め定めたレベルより大きい場合に、前記提示する制御を行う、
    請求項10又は請求項11に記載の情報処理装置。
  13. 前記プロセッサは、受け付けた前記サービスを、前記発話の状態を用いて決定した設定で画像形成装置に対して実行させる制御を行う、
    請求項1~12の何れか1項に記載の情報処理装置。
  14. サービスを実行させる指示を発話により受け付け、
    受け付けた前記サービスを、前記発話の状態を用いて決定した設定で実行させる制御を行
    前記指示を行った発話者の予定情報を用いて決定した設定で前記サービスを実行させる制御を行い、
    前記発話の状態を用いて決定した前記設定及び前記予定情報を用いて決定した前記設定が異なる場合に、どちらの設定を選択するかを更に受け付ける、
    処理をコンピュータに実行させるための情報処理プログラム。
  15. サービスを実行させる指示を発話により受け付け、
    受け付けた前記サービスを、前記発話の状態を用いて決定した設定で実行させる制御を行い、
    前記指示を行った発話者の予定情報を用いて決定した設定で前記サービスを実行させる制御を行い、
    前記発話の状態を用いて決定した前記設定及び前記予定情報を用いて決定した前記設定が異なる場合に、前記予定情報を用いて決定した前記設定で前記サービスを実行させる制御を行う、
    処理をコンピュータに実行させるための情報処理プログラム。
JP2020015709A 2020-01-31 2020-01-31 情報処理装置及び情報処理プログラム Active JP7359008B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020015709A JP7359008B2 (ja) 2020-01-31 2020-01-31 情報処理装置及び情報処理プログラム
US16/916,128 US11403060B2 (en) 2020-01-31 2020-06-30 Information processing device and non-transitory computer readable medium for executing printing service according to state of utterance
CN202010788858.4A CN113204324A (zh) 2020-01-31 2020-08-07 信息处理装置以及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020015709A JP7359008B2 (ja) 2020-01-31 2020-01-31 情報処理装置及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2021124779A JP2021124779A (ja) 2021-08-30
JP7359008B2 true JP7359008B2 (ja) 2023-10-11

Family

ID=77024977

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020015709A Active JP7359008B2 (ja) 2020-01-31 2020-01-31 情報処理装置及び情報処理プログラム

Country Status (3)

Country Link
US (1) US11403060B2 (ja)
JP (1) JP7359008B2 (ja)
CN (1) CN113204324A (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005284492A (ja) 2004-03-29 2005-10-13 Mitsubishi Electric Corp 音声利用操作装置
JP2006163096A (ja) 2004-12-09 2006-06-22 Canon Inc 単音の組み合せによる音声機器操作
JP2007226388A (ja) 2006-02-22 2007-09-06 Konica Minolta Medical & Graphic Inc コマンド入力装置及びプログラム
JP2009104025A (ja) 2007-10-25 2009-05-14 Panasonic Electric Works Co Ltd 音声認識制御装置
JP2012146209A (ja) 2011-01-13 2012-08-02 Nikon Corp 電子機器および電子機器の制御プログラム
US20160372110A1 (en) 2015-06-19 2016-12-22 Lenovo (Singapore) Pte. Ltd. Adapting voice input processing based on voice input characteristics
JP2019160151A (ja) 2018-03-16 2019-09-19 Kddi株式会社 音声出力装置、音声出力制御方法及びプログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0713591A (ja) * 1993-06-22 1995-01-17 Hitachi Ltd 音声認識装置および音声認識方法
JP2012128440A (ja) 2012-02-06 2012-07-05 Denso Corp 音声対話装置
US9460715B2 (en) * 2013-03-04 2016-10-04 Amazon Technologies, Inc. Identification using audio signatures and additional characteristics
KR102391322B1 (ko) * 2017-06-30 2022-04-26 엘지전자 주식회사 이동 로봇
US11354071B2 (en) * 2018-04-30 2022-06-07 Hewlett-Packard Development Company, L.P. Navigation printing with voice tagging
US10514888B1 (en) * 2018-10-05 2019-12-24 Oracle International Corporation User-adaptive volume selection
JP7224863B2 (ja) * 2018-11-09 2023-02-20 キヤノン株式会社 中継サーバおよび制御方法
KR20200059054A (ko) * 2018-11-20 2020-05-28 삼성전자주식회사 사용자 발화를 처리하는 전자 장치, 및 그 전자 장치의 제어 방법
US10944588B2 (en) * 2018-11-29 2021-03-09 International Business Machines Corporation Resolving conflicting commands received by an electronic device
US10978064B2 (en) * 2018-11-30 2021-04-13 International Business Machines Corporation Contextually relevant spoken device-to-device communication between IoT devices
JP2020121452A (ja) * 2019-01-30 2020-08-13 コニカミノルタ株式会社 画像形成装置
JP7159892B2 (ja) * 2019-02-04 2022-10-25 コニカミノルタ株式会社 画像形成装置、画像形成システム、および情報処理方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005284492A (ja) 2004-03-29 2005-10-13 Mitsubishi Electric Corp 音声利用操作装置
JP2006163096A (ja) 2004-12-09 2006-06-22 Canon Inc 単音の組み合せによる音声機器操作
JP2007226388A (ja) 2006-02-22 2007-09-06 Konica Minolta Medical & Graphic Inc コマンド入力装置及びプログラム
JP2009104025A (ja) 2007-10-25 2009-05-14 Panasonic Electric Works Co Ltd 音声認識制御装置
JP2012146209A (ja) 2011-01-13 2012-08-02 Nikon Corp 電子機器および電子機器の制御プログラム
US20160372110A1 (en) 2015-06-19 2016-12-22 Lenovo (Singapore) Pte. Ltd. Adapting voice input processing based on voice input characteristics
JP2019160151A (ja) 2018-03-16 2019-09-19 Kddi株式会社 音声出力装置、音声出力制御方法及びプログラム

Also Published As

Publication number Publication date
US20210240430A1 (en) 2021-08-05
JP2021124779A (ja) 2021-08-30
CN113204324A (zh) 2021-08-03
US11403060B2 (en) 2022-08-02

Similar Documents

Publication Publication Date Title
JP4667138B2 (ja) 音声認識方法及び音声認識装置
US20160247533A1 (en) Audio recording apparatus, audio recording method, and non-transitory recording medium
US11140284B2 (en) Image forming system equipped with interactive agent function, method of controlling same, and storage medium
US9196253B2 (en) Information processing apparatus for associating speaker identification information to speech data
US20210193147A1 (en) Automated generation of transcripts through independent transcription
US8170874B2 (en) Apparatus and method for recognizing speech based on feature parameters of modified speech and playing back the modified speech
JP7359008B2 (ja) 情報処理装置及び情報処理プログラム
JP7409147B2 (ja) 情報処理装置及び情報処理プログラム
JP2009104047A (ja) 情報処理方法及び情報処理装置
JP7392498B2 (ja) 情報処理装置及び情報処理プログラム
JP7400554B2 (ja) 情報処理装置及び情報処理プログラム
JP2011107650A (ja) 音声特徴量算出装置、音声特徴量算出方法及び音声特徴量算出プログラム並びに音声認識装置
US20210409561A1 (en) Image forming system equipped with interactive agent function, method of controlling same, and storage medium
JP7310705B2 (ja) エージェント制御装置、エージェント制御方法、及びエージェント制御プログラム
JP2008051883A (ja) 音声合成制御方法および装置
JP7310706B2 (ja) エージェント制御装置、エージェント制御方法、及びエージェント制御プログラム
JP2000089789A (ja) 音声認識装置及び記録媒体
JP4304959B2 (ja) 音声対話制御方法、音声対話制御装置および音声対話制御プログラム
CN113687751A (zh) 智能体控制装置、智能体控制方法、以及非临时性的记录介质
US11546479B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
US20090182557A1 (en) Sound/voice processing apparatus, sound/voice processing method, and sound/voice processing program
JP7369263B2 (ja) 画像形成装置及び提示方法
JP2003202890A (ja) 音声認識装置及びその方法、プログラム
JP2009020352A (ja) 音声処理装置およびプログラム
JP2019020475A (ja) 音声認識装置、音声認識方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230627

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230829

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230911

R150 Certificate of patent or registration of utility model

Ref document number: 7359008

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150