WO2019142447A1

WO2019142447A1 - 情報処理装置および情報処理方法

Info

Publication number: WO2019142447A1
Application number: PCT/JP2018/040995
Authority: WO
Inventors: 祐平滝; 広岩瀬; 真一河野; 邦仁澤井
Original assignee: ソニー株式会社
Priority date: 2018-01-17
Filing date: 2018-11-05
Publication date: 2019-07-25
Also published as: EP3742301A4; US20210064640A1; EP3742301A1

Abstract

【課題】情報処理装置への入力をより適切に補助することを可能にする。【解決手段】入力が行われている途中のテキスト情報を取得する取得部と、前記テキスト情報に基づいて抽出される属性情報に基づいて前記入力の候補を抽出する入力候補抽出部と、を備える、情報処理装置が提供される。

Description

情報処理装置および情報処理方法

　本開示は、情報処理装置および情報処理方法に関する。

　近年、自然言語理解（ＮＬＵ：Natural　Language　Understanding）に関する技術が適用されたシステム、装置の開発が盛んである。例えば、音声入力が可能なエージェント装置等が挙げられる。ユーザは、エージェント装置に対して音声入力のための発話を行うことで、エージェント装置は音声情報を解析し、入力内容を認識することで当該入力に対応する機能を実現することができる。

　例えば、以下の特許文献１には、音声にて誤った入力が行われた場合、訂正発話の認識精度を高め、ユーザの訂正発話回数を削減する技術が開示されている。

特開２０１６－０６２０６９号公報

　しかし、特許文献１に開示の技術等によっては、入力を適切に補助することは十分ではなかった。例えば、エージェント装置が音声入力に対応している場合、ユーザは、どのような発話を行えば所望の機能を実現させることができるかが分からない場合がある。結果的に、ユーザが間違った音声入力を行うことで、想定外の処理が行われる場合がある。

　そこで、本開示では、情報処理装置への入力をより適切に補助することが可能な、新規かつ改良された情報処理装置および情報処理方法を提案する。

　本開示によれば、入力が行われている途中のテキスト情報を取得する取得部と、前記テキスト情報に基づいて抽出される属性情報に基づいて前記入力の候補を抽出する入力候補抽出部と、を備える、情報処理装置が提供される。

　また、本開示によれば、入力が行われている途中のテキスト情報を取得することと、前記テキスト情報に基づいて抽出される属性情報に基づいて前記入力の候補を抽出することと、を有する、コンピュータにより実行される情報処理方法が提供される。

　以上説明したように本開示によれば、情報処理装置への入力をより適切に補助することが可能となる。

　なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。

本開示に係る第１の実施例の概要を説明する図である。ＥｎｔｉｔｙとＩｎｔｅｎｔの関係を説明する図である。Ｉｎｔｅｎｔに対応する例文を説明する図である。情報処理装置１００の機能構成例を示すブロック図である。情報処理装置１００による第１の処理例のイメージを示す図である。情報処理装置１００による第１の処理例を示すフローチャートである。情報処理装置１００による第１の処理例を示すフローチャートである。情報処理装置１００による第２の処理例のイメージを示す図である。情報処理装置１００による第２の処理例のイメージを示す図である。情報処理装置１００による第２の処理例を示すフローチャートである。情報処理装置１００による第２の処理例を示すフローチャートである。情報処理装置１００による第３の処理例のイメージを示す図である。情報処理装置１００による第３の処理例を示すフローチャートである。情報処理装置１００による第３の処理例を示すフローチャートである。本開示に係る第２の実施例の概要を説明する図である。情報処理装置１００のハードウェア構成例を示す図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　なお、説明は以下の順序で行うものとする。
　１．第１の実施例
　　１．１．背景
　　１．２．情報処理装置１００の機能概要
　　１．３．情報処理装置１００の機能構成例
　　１．４．情報処理装置１００の処理例
　２．第２の実施例
　３．ハードウェア構成例
　４．まとめ

　　＜１．第１の実施例＞
　（１．１．背景）
　まず、本開示の背景について説明する。

　上記のとおり、近年、自然言語理解に関する技術が適用されたシステム、装置の開発が盛んである。例えば、音声入力が可能なエージェント装置等が挙げられる。ユーザは、エージェント装置に対して音声入力のための発話を行うことで、エージェント装置は音声情報を解析し、入力内容を認識することで当該入力に対応する機能を実現することができる。

　ここで、自然言語理解に関する技術が適用されたシステムまたは装置等をユーザが使用する際に、ユーザは、所望の機能を実現させるための入力方法が分からない場合がある。例えば、エージェント装置が音声入力に対応している場合、ユーザは、どのような発話を行えば所望の機能を実現させることができるかが分からない場合がある。結果的に、ユーザが間違った音声入力を行うことで、想定外の処理が行われる場合がある。もちろん、ユーザは、マニュアル等を確認することで正しい入力方法を認識することはできるが、機能毎に入力方法を記憶しておく必要があり、機能数が多いほど入力方法を記憶しておくことは困難であり、ユーザへの負荷が高い。

　そこで、本件の開示者は、上記事情に鑑みて本開示の技術を創作するに至った。本開示に係る情報処理装置１００は、入力が行われている途中のテキスト情報を取得し、当該テキスト情報に基づいて抽出される属性情報に基づいて当該入力の候補を出力することができる。

　これによって、情報処理装置１００は、入力をより適切に補助することができる。より具体的には、情報処理装置１００は、ユーザによる入力の手間（音声入力においては、発話量）を削減することができる。また、情報処理装置１００は、入力の候補を出力することで、（ユーザが認識していない）搭載機能をユーザに認識させることができる。

　以下、上記の特徴を実現する情報処理装置１００について、詳細に説明する。なお、本開示に係る技術思想は、以下に述べる実施例で挙げる例に限定されず、種々の装置に広く適用され得る。

　（１．２．情報処理装置１００の機能概要）
　上記では、本開示の背景について説明した。続いて、第１の実施例に係る情報処理装置１００の機能概要について説明する。

　図１に示すように、情報処理装置１００は、ユーザＵ１からの音声入力を受けるエージェント装置である。そして、情報処理装置１００は、ユーザＵ１による音声入力が行われている途中の音声情報を解析することでテキスト情報に変換し、当該テキスト情報を解析する。そして、情報処理装置１００は、当該テキスト情報に対応する属性情報を抽出する。

　属性情報は、任意の機能（または処理）を示すＩｎｔｅｎｔに対応するＥｎｔｉｔｙを含む。ここで、図２を参照して、ＩｎｔｅｎｔおよびＥｎｔｉｔｙの概要について説明する。

　まず、Ｉｎｔｅｎｔとは、任意の機能（または処理）を示す概念であり、図２の２Ａに示すように、例えば、「アラーム設定」、「乗換検索」、「電源ＯＦＦ」等を含む。これらの機能は、情報処理装置１００が実行可能なものであってもよいし、情報処理装置１００と通信を行う外部装置が実行可能なものであってもよい。なお、２Ａに示すＩｎｔｅｎｔは、あくまで一例であり、Ｉｎｔｅｎｔはこれらに限定されない。

　そして、Ｅｎｔｉｔｙとは、上記のＩｎｔｅｎｔに対応する任意の属性情報であり、図２の２Ｂに示すように、例えば、「時間」、「名前」、「出発駅」、「到着駅」、「経由駅」等を含む。Ｉｎｔｅｎｔは、複数のＥｎｔｉｔｙに対応していてもよい。例えば、「アラーム設定」というＩｎｔｅｎｔ＿０１は、「時間」というＥｎｔｉｔｙ＿０１および「名前」というＥｎｔｉｔｙ＿０２に対応しており、「乗換検索」というＩｎｔｅｎｔ＿０２は、「出発駅」というＥｎｔｉｔｙ＿０３、「到着駅」というＥｎｔｉｔｙ＿０４および「経由駅」というＥｎｔｉｔｙ＿０５に対応している。また、図示していないが、Ｅｎｔｉｔｙも、複数のＩｎｔｅｎｔに対応していてもよい。例えば、「時間」というＥｎｔｉｔｙ＿０１は、「アラーム設定」というＩｎｔｅｎｔ＿０１だけでなく「乗換検索」というＩｎｔｅｎｔ＿０２に対応していてもよい。なお、２Ｂに示すＥｎｔｉｔｙは、あくまで一例であり、Ｅｎｔｉｔｙはこれらに限定されない。

　情報処理装置１００は、入力途中のテキスト情報に対応する属性情報としてＥｎｔｉｔｙを抽出すると、当該Ｅｎｔｉｔｙに対応するＩｎｔｅｎｔを、ユーザが入力によって実現しようとする機能（または処理）であると認識する。そして、情報処理装置１００は、入力の候補を出力する。

　より具体的には、Ｉｎｔｅｎｔは、図３に示すように、Ｉｎｔｅｎｔの機能（または処理）を呼び出すことができる例文（図中の「Sentence」）を１または２以上有している。例えば、「アラーム設定」というＩｎｔｅｎｔ＿０１は、当該機能（または処理）を呼び出すことができる例文として、「・・・アラームを設定して。」、「アラームを・・・設定して。」、「・・・目覚ましを設定して。」、「目覚ましを・・・設定して。」、「・・・になったら教えて。」等を有している。なお、Ｉｎｔｅｎｔが有する例文の内容は特に限定されない。

　そして、情報処理装置１００は、抽出したＥｎｔｉｔｙに対応するＩｎｔｅｎｔが有する例文の中から適切な例文を選択し、出力することができる。例えば、情報処理装置１００は、入力途中のテキスト情報の内容に基づいて適切な例文を選択することができる。より具体的には、ユーザが「１３時に」と発話をすることで途中まで音声入力を行った場合、情報処理装置１００は、当該発話の文脈に合う例文として、「・・・アラームを設定して。」を選択し、出力する。なお、例文の選択方法はこれに限定されない。

　また、情報処理装置１００は、より適した入力の候補を出力できるように、Ｉｎｔｅｎｔが有する例文を選択した上で、当該例文を編集して出力してもよい。例えば、Ｉｎｔｅｎｔが「・・・にアラームを設定して。」という例文を有し、ユーザが「１３時に」と発話した場合、「に」という助詞が重複しているため、情報処理装置１００は、例文から助詞を削除した「・・・アラームを設定して。」を出力してもよい。これによって、入力の候補となるテキスト情報がより適切なものとなるため、ユーザが違和感を覚えにくい。

　ユーザは、情報処理装置１００が提供する入力の候補の中から所望の入力を選択することで、情報処理装置１００は、選択された入力に基づいて機能（または処理）を実行する。

　このように、情報処理装置１００は、入力途中のテキスト情報に基づいて入力の候補を出力し、当該候補の中から所望の入力をユーザに選択させることで、入力を適切に補助することができる。より具体的には、情報処理装置１００は、ユーザによる入力の手間（音声入力においては、発話量）を削減することができる。

　また、情報処理装置１００が提供する入力の候補の中には、実現可能であることをユーザが認識していない機能に関する入力が含まれる場合がある。例えば、ユーザがアラームの設定を意図して「１３時に」と発話し、入力の候補として「アラームを設定して」だけでなく、ユーザが認識していなかった「録画予約をして」および「音楽をかけて」等が出力された場合、ユーザはこれらの機能の存在を認識することができ、それ以降、これらの機能を利用することができる。

　なお、情報処理装置１００が受ける入力は音声入力に限定されず、任意の入力であり得る。例えば、情報処理装置１００は、ユーザがキーボード等を含む何らかの入力装置を用いて行うテキスト入力であってもよいし、動作等によって行うジェスチャ入力等であってもよい。また、情報処理装置１００が受ける入力の主体はユーザに限定されず、任意の主体であり得る。例えば、情報処理装置１００が受ける入力の主体は、他のエージェント装置またはロボット等を含む外部装置等であってもよい。

　また、本明細書では、上記の処理が情報処理装置１００によって実行される場合を一例として説明するが、実施の態様はこれに限定されない。例えば、情報処理装置１００と通信可能なサーバが存在し、当該サーバが情報処理装置１００の処理の一部を実行してもよい。より具体的には、情報処理装置１００が入力処理および出力処理を実行し、サーバがその他の処理（例えば、入力された情報の解析処理、入力候補の抽出処理等）を実行してもよい。

　（１．３．情報処理装置１００の機能構成例）
　上記では、情報処理装置１００の機能概要について説明した。続いて、図４を参照して、情報処理装置１００の機能構成例について説明する。

　図４に示すように、情報処理装置１００は、制御部１１０と、入力部１２０と、センサ部１３０と、撮像部１４０と、出力部１５０と、通信部１６０と、記憶部１７０と、を備える。

　（制御部１１０）
　制御部１１０は、情報処理装置１００が行う処理全般を統括的に制御する機能構成である。例えば、制御部１１０は、ユーザによって入力部１２０を用いて行われる入力に基づいて各構成の起動や停止を制御したり、ディスプレイまたはスピーカ等の出力部１５０を制御したりすることができる。なお、制御部１１０の制御内容はこれらに限定されない。例えば、制御部１１０は、汎用コンピュータ、ＰＣ、タブレットＰＣまたはスマートフォン等において一般的に行われる処理を制御してもよい。

　また、図４に示すように、制御部１１０は、音声認識部１１１と、Ｅｎｔｉｔｙ抽出部１１２と、Ｉｎｔｅｎｔ抽出部１１３と、入力候補抽出部１１４と、コンテキスト解析部１１５と、Ｉｎｔｅｎｔ処理部１１６と、を備える。

　（音声認識部１１１）
　音声認識部１１１は、入力音声の音声認識を行う機能構成である。具体的には、音声認識部１１１は、入力部１２０に備えられるマイクロフォンを介して入力されたユーザ発話の音声情報を取得すると、音響モデルを用いて音響分析を行い、音素と単語とが対応付けられて登録されている辞書情報等を用いて入力音声の音声認識処理を実行する。そして、音声認識部１１１は、音声認識処理の結果、ユーザ発話の音声情報をテキスト情報に変換する（換言すると、音声認識部１１１は、テキスト情報を取得する取得部として機能する）。音声認識部１１１による上記の音声認識処理は、ユーザによる音声入力と並行して逐次行われる。そして、音声認識部１１１は、テキスト情報を逐次Ｅｎｔｉｔｙ抽出部１１２に提供する。

　また、音声認識部１１１は、複数のユーザの音声の特徴量を管理しており、当該特徴量と入力された音声情報とのパターンマッチングを行うことによって、発話をしたユーザを特定してもよい。特定されたユーザの情報は、後段の処理に活用され得る。なお、上記の音声認識処理の方法については特に限定されるものではなく、公知の音声認識技術が用いられればよい。

　（Ｅｎｔｉｔｙ抽出部１１２）
　Ｅｎｔｉｔｙ抽出部１１２は、音声認識部１１１によって出力されるテキスト情報に基づいてＥｎｔｉｔｙを抽出する機能構成である。より具体的には、Ｅｎｔｉｔｙ抽出部１１２は、ユーザによる音声入力と並行して逐次出力されるテキスト情報を解析し、テキスト情報に対応するＥｎｔｉｔｙの抽出を試みる。

　Ｅｎｔｉｔｙの抽出方法は特に限定されない。例えば、Ｅｎｔｉｔｙ抽出部１１２は、テキスト情報に含まれる語の意味、順番、助詞または助動詞等に基づいてＥｎｔｉｔｙを抽出してもよい。より具体的には、音声認識部１１１から「１３」というテキスト情報が出力された場合、Ｅｎｔｉｔｙ抽出部１１２は、単に「数字」というＥｎｔｉｔｙを抽出し得る。その後、情報が追加され「１３時」というテキスト情報が出力された場合、Ｅｎｔｉｔｙ抽出部１１２は、「１３時」の意味に基づいて「時間」というＥｎｔｉｔｙを抽出し得る。なお、音声認識部１１１がユーザの発話における間（語と語の間の空白時間）、声のトーン、アクセントまたはイントネーション等を認識可能であれば、Ｅｎｔｉｔｙ抽出部１１２は、ユーザの発話における間、声のトーン、アクセントまたはイントネーション等に基づいてＥｎｔｉｔｙを抽出してもよい。

　また、Ｅｎｔｉｔｙに対応するキーワードが１または２以上存在するならば、Ｅｎｔｉｔｙ抽出部１１２は、音声認識部１１１から逐次出力されるテキスト情報から当該キーワードを探索することで、当該キーワードに対応するＥｎｔｉｔｙの抽出を行ってもよい。

　さらに、Ｅｎｔｉｔｙ抽出部１１２は、ユーザがおかれた状況もしくは環境、ユーザの状態もしくは行動等（以降、これらを含めた概念を「コンテキスト」と呼称する）、ユーザ情報（例えば、属性情報または嗜好情報等）またはユーザに関する履歴情報等（例えば、行動履歴情報または位置履歴情報等）を用いてＥｎｔｉｔｙの抽出を行ってもよい。

　例えば、Ｅｎｔｉｔｙ抽出部１１２は、ユーザによる発話の内容、時刻、ユーザの位置、ユーザの行動、または、行動を共にしている他のユーザ等の様々な情報を含むコンテキストに基づいて重み付けを施すことによって、Ｅｎｔｉｔｙを抽出してもよい。より具体的には、ユーザの発話によって「人名」および「地名」という２つのＥｎｔｉｔｙが抽出されるような場合において、Ｅｎｔｉｔｙ抽出部１１２は、コンテキストに基づいて当該「地名」とユーザの位置との関連性が低いと判断した場合（例えば、当該「地名」とユーザの位置との離隔距離が遠い場合等）、Ｅｎｔｉｔｙとして「人名」をより優先的に抽出してもよい。これによって、Ｅｎｔｉｔｙ抽出部１１２は、コンテキストに応じて、より適切なＥｎｔｉｔｙを抽出することができる。

　上記と同様に、Ｅｎｔｉｔｙ抽出部１１２は、ユーザ情報（例えば、属性情報または嗜好情報等）またはユーザに関する履歴情報等（例えば、行動履歴情報または位置履歴情報等）に基づいて重み付けを施すことによって、ユーザ個人に適した、Ｅｎｔｉｔｙの抽出処理を実現することができる（換言すると、Ｅｎｔｉｔｙの抽出処理を個人化することができる）。

　また、Ｅｎｔｉｔｙ抽出部１１２は、音声入力によって複数のＥｎｔｉｔｙを抽出した場合に、それらのＥｎｔｉｔｙの関連性に基づいて重み付けを施してもよい。例えば、Ｅｎｔｉｔｙ抽出部１１２は、音声入力によって「人名」、「地名」というＥｎｔｉｔｙを抽出した後に、更なる音声入力によって「鉄道」というＥｎｔｉｔｙを抽出したとする。この場合、Ｅｎｔｉｔｙ抽出部１１２は、「鉄道」とより高い関連性を有する「地名」というＥｎｔｉｔｙに対する重みを、「人名」というＥｎｔｉｔｙの重みよりも大きくしてもよい。

　また、Ｅｎｔｉｔｙ抽出部１１２は、抽出された複数のＥｎｔｉｔｙの共起関係に基づいてＥｎｔｉｔｙの抽出を行ってもよい。例えば、「鉄道」と「駅」が共起関係を有する場合、Ｅｎｔｉｔｙ抽出部１１２は、共起関係を有するこれらのＥｎｔｉｔｙの重みを、「人名」というＥｎｔｉｔｙの重みよりも大きくしてもよい。これによって、Ｅｎｔｉｔｙ抽出部１１２は、発話の内容から有り得ない組み合せのＥｎｔｉｔｙを除外したり、これらのＥｎｔｉｔｙの重みを小さくしたりすることができるため、より精度の高いＥｎｔｉｔｙを抽出することができる。なお、Ｅｎｔｉｔｙの抽出処理は、上記に限定されず、適宜変更され得る。Ｅｎｔｉｔｙ抽出部１１２は、抽出したＥｎｔｉｔｙをＩｎｔｅｎｔ抽出部１１３に提供する。

　（Ｉｎｔｅｎｔ抽出部１１３）
　Ｉｎｔｅｎｔ抽出部１１３は、Ｅｎｔｉｔｙに基づいてＩｎｔｅｎｔを抽出する機能構成である。より具体的には、Ｉｎｔｅｎｔ抽出部１１３は、Ｅｎｔｉｔｙ抽出部１１２によって抽出されたＥｎｔｉｔｙに対応するＩｎｔｅｎｔを探索する。仮に、Ｅｎｔｉｔｙに対応するＩｎｔｅｎｔが複数存在する場合には、Ｉｎｔｅｎｔ抽出部１１３は、複数のＩｎｔｅｎｔを抽出する。なお、ＥｎｔｉｔｙとＩｎｔｅｎｔの対応付けに関する情報（図２の２Ｂに示した情報等）は、Ｉｎｔｅｎｔ抽出部１１３が処理に用いるソフトウェアに含まれてもよいし、記憶部１７０のテーブルに記憶されていてもよい。

　また、Ｉｎｔｅｎｔ抽出部１１３も、Ｅｎｔｉｔｙ抽出部１１２と同様に、コンテキスト、ユーザ情報（例えば、属性情報または嗜好情報等）またはユーザに関する履歴情報等（例えば、行動履歴情報または位置履歴情報等）を用いてＩｎｔｅｎｔの抽出を行ってもよい。

　例えば、Ｉｎｔｅｎｔ抽出部１１３は、ユーザによる発話の内容、時刻、ユーザの位置、ユーザの行動、または、行動を共にしている他のユーザ等の様々な情報を含むコンテキストに基づいて重み付けを施すことによって、Ｉｎｔｅｎｔを抽出してもよい。より具体的には、ユーザが他のユーザに対してメッセージを送信しようとしている場合、Ｉｎｔｅｎｔ抽出部１１３は、ユーザによる発話の内容に基づいてユーザと宛先である他のユーザとの関係性を推定し、宛先である他のユーザが友人である場合と、友人でない場合とで、メッセージの送信用のソフトウェアを変えてもよい。

　また、ユーザが近くのスポットを探すために音声入力を行った場合、Ｉｎｔｅｎｔ抽出部１１３は、ユーザが自動車に乗って移動している場合と、ユーザが徒歩で移動している場合とで、「近く」の解釈を変えてもよい。例えば、Ｉｎｔｅｎｔ抽出部１１３は、ユーザが自動車に乗って移動している場合において「近く」は１０ｋｍ以内を指すと解釈し、ユーザが徒歩で移動している場合において「近く」は２００ｍ以内を指すと解釈してもよい。これらの処理によって、Ｉｎｔｅｎｔ抽出部１１３は、コンテキストに応じて、より適切なＩｎｔｅｎｔを抽出することができる。

　上記と同様に、Ｉｎｔｅｎｔ抽出部１１３は、ユーザ情報（例えば、属性情報または嗜好情報等）またはユーザに関する履歴情報等（例えば、行動履歴情報または位置履歴情報等）に基づいて重み付けを施すことによって、ユーザ個人に適した、Ｉｎｔｅｎｔの抽出処理を実現することができる（換言すると、Ｉｎｔｅｎｔの抽出処理を個人化することができる）。

　なお、Ｉｎｔｅｎｔの抽出処理は、上記に限定されず、適宜変更され得る。例えば、Ｉｎｔｅｎｔ抽出部１１３は、起動中のソフトウェアの種類に基づいて重み付けを施すことによって、Ｉｎｔｅｎｔを抽出してもよい。Ｉｎｔｅｎｔ抽出部１１３は、抽出したＩｎｔｅｎｔを入力候補抽出部１１４に提供する。

　（入力候補抽出部１１４）
　入力候補抽出部１１４は、Ｉｎｔｅｎｔに基づいて入力候補を抽出する機能構成である。より具体的には、入力候補抽出部１１４は、Ｉｎｔｅｎｔ抽出部１１３によって抽出されたＩｎｔｅｎｔを呼び出すことができる１または２以上の例文（図３参照）の中から適切な例文を抽出する。抽出された例文は、出力部１５０に提供されることでユーザに提供される。

　また、上記のように、入力候補抽出部１１４は、より適した入力の候補を出力できるように、Ｉｎｔｅｎｔが有する例文を選択した上で、当該例文を編集して出力してもよい。

　（コンテキスト解析部１１５）
　コンテキスト解析部１１５は、音声認識部１１１により認識された音声情報、センサ部１３０によりセンシングされた各種センサ情報または撮像部１４０によって生成された撮像画像情報等を用いてコンテキストを認識する機能構成である。なお、上記のコンテキストの認識処理の方法については特に限定されるものではなく、公知のコンテキスト認識技術が用いられればよい。コンテキスト解析部１１５は、認識したコンテキストに関する情報をＥｎｔｉｔｙ抽出部１１２またはＩｎｔｅｎｔ抽出部１１３等に提供する。

　（Ｉｎｔｅｎｔ処理部１１６）
　Ｉｎｔｅｎｔ処理部１１６は、Ｉｎｔｅｎｔに関する処理を実行する機能構成である。例えば、ユーザが入力候補の中から所望の入力を選択した場合、Ｉｎｔｅｎｔ処理部１１６は、当該入力に対応するＩｎｔｅｎｔに関する処理を実行する。例えば、Ｉｎｔｅｎｔ処理部１１６は、情報処理装置１００の各機能構成を制御する制御情報を生成し、各機能構成に提供することで処理を実行する。また、Ｉｎｔｅｎｔ処理部１１６は、生成した制御情報を、通信部１６０を介して外部装置に提供することで、外部装置と連携して処理を実行してもよい。

　また、Ｉｎｔｅｎｔ処理部１１６は、ユーザによる音声入力に関する発話の完了を待たずにＩｎｔｅｎｔに関する処理を実行することもできる。この場合、Ｉｎｔｅｎｔ処理部１１６は、Ｉｎｔｅｎｔに関する処理の実行条件に基づいて、ユーザによる音声入力に関する発話の完了を待たずにＩｎｔｅｎｔに関する処理を実行するか否かを判断する。例えば、ユーザが発話している内容、コンテキストまたはユーザの行動履歴等に基づいて、発話が行われたコンテキストにおいて発話によって抽出されたＩｎｔｅｎｔに関する処理が実行される可能性が所定値より高ければ、Ｉｎｔｅｎｔ処理部１１６は、ユーザによる音声入力に関する発話の完了を待たずに当該Ｉｎｔｅｎｔに関する処理を実行してもよい。具体例については後述する。

　（入力部１２０）
　入力部１２０は、入力を受ける機能構成である。例えば、入力部１２０は、音声情報を収集するためのマイクロフォン等を備えており、情報処理装置１００の周囲で発生する周囲音やユーザによる発話などの音声情報を収集する機能構成である。入力部１２０が収集する音声情報は、音声認識部１１１による音声認識処理、または、コンテキスト解析部１１５によるコンテキスト解析処理等に用いられる。

　また、入力部１２０は、例えば、マウス、キーボード、タッチパネル、ボタンまたはスイッチ等の各種入力機器を備えてもよく、これらの入力機器を用いて行われた入力を受ける。入力部１２０は、入力された情報（例えば、音声情報等）を制御部１１０に提供する。なお、入力手段は上記に限定されない。

　（センサ部１３０）
　センサ部１３０は、ユーザがおかれた状況もしくは環境、ユーザの状態もしくは行動等に関する種々のセンサ情報を収集する機能構成である。センサ部１３０が収集するセンサ情報の種類は特に限定されない。例えば、センサ部１３０が収集するセンサ情報には、加速度センサ、ジャイロセンサ、地磁気センサ、気圧センサ、温度センサ、振動センサ、心拍センサ、脈波センサ、近接センサ、照度センサ、圧力センサ、位置センサ（例えば、ＧＮＳＳ（Global Navigation Satellite System）センサ等）、発汗センサ、ｐＨセンサ、湿度センサまたは赤外線センサ等の任意のセンサによって出力された情報が含まれる。なお、センサ部１３０は、これらの各種センサを備えている外部装置からセンサ情報を収集してもよい。センサ部１３０は、収集したセンサ情報をコンテキスト解析部１１５に提供する。

　（撮像部１４０）
　撮像部１４０は、ユーザや周囲環境の画像を撮像する機能構成である。より具体的には、撮像部１４０は、イメージセンサ（例えば、ＣＣＤ（Charge-Coupled Device）センサまたはＣＭＯＳ（Complementary
Metal Oxide Semiconductor）センサ等）を備えており、当該センサを用いてユーザや周囲環境の画像を撮像する。そして、撮像部１４０は、生成した撮像画像情報をコンテキスト解析部１１５に提供する。なお、上記の画像には、静止画像のほか動画像が含まれる。

　（出力部１５０）
　出力部１５０は、各種情報を出力する機能構成である。例えば、出力部１５０は、ディスプレイ等の表示手段またはスピーカ、アンプ等の音声出力手段等に各種情報を出力することができる。例えば、出力部１５０は、入力候補抽出部１１４から提供された入力候補に関する情報、または、Ｉｎｔｅｎｔ処理部１１６によって実行されたＩｎｔｅｎｔに関する処理の結果等をディスプレイに表示したり、スピーカから音声出力したりすることができる。なお、出力手段は上記に限定されない。

　（通信部１６０）
　通信部１６０は、情報処理装置１００と外部装置との各種通信を行う機能構成である。例えば、通信部１６０は、Ｉｎｔｅｎｔ処理部１１６によって生成された制御情報を外部装置等に送信することで、外部装置にＩｎｔｅｎｔに関する処理を実行させてもよい。なお、通信部１６０が通信する情報および通信するケースはこれに限定されない。また、通信部１６０と外部装置間の通信方式は特に限定されない。

　（記憶部１７０）
　記憶部１７０は、各種情報を記憶する機能構成である。例えば、記憶部１７０は、入力部１２０から入力される音声情報、音声認識部１１１によって出力されるテキスト情報、Ｅｎｔｉｔｙに関する情報（例えば、図２の２Ｂに示したようなＥｎｔｉｔｙ　ＩＤ、Ｅｎｔｉｔｙ　ＮａｍｅまたはＥｎｔｉｔｙに対応するＩｎｔｅｎｔ　ＩＤ等）、Ｉｎｔｅｎｔに関する情報（例えば、図２の２Ａに示したようなＩｎｔｅｎｔ　ＩＤ、Ｉｎｔｅｎｔ　Ｎａｍｅ、または、図３に示したような例文情報等）、コンテキスト解析部１１５によって出力されるコンテキストに関する情報、ユーザ情報（例えば、属性情報、音声等の特徴量情報または嗜好情報等）、ユーザに関する履歴情報等（例えば、行動履歴情報または位置履歴情報等）を記憶することができる。また、記憶部１７０は、情報処理装置１００の処理に使用される各種プログラムまたは各種パラメータ等を記憶する。なお、記憶部１７０が記憶する情報はこれらに限定されない。

　以上、情報処理装置１００の機能構成例について説明した。なお、図４を用いて説明した上記の機能構成はあくまで一例であり、情報処理装置１００の機能構成は係る例に限定されない。例えば、情報処理装置１００は、図４に示す構成の全てを必ずしも備えなくてもよい。また、情報処理装置１００の機能構成は、仕様や運用に応じて柔軟に変形可能である。

　（１．４．情報処理装置１００の処理例）
　上記では、情報処理装置１００の機能構成例について説明した。続いて、情報処理装置１００の処理例について説明する。

　（１．４．１．第１の処理例）
　まず、図５を参照して、第１の処理例について説明する。図５は、情報処理装置１００による第１の処理例のイメージを示す図である。

　１３時にアラームを設定しようとしているユーザＵ１が存在する場合、ユーザＵ１は、図５の５Ａに示すように、情報処理装置１００に対して音声入力を開始する。ユーザＵ１が「１３時に」と発話する。すると、情報処理装置１００は、入力途中の音声情報を解析することで、５Ｂに示すように、「１．アラームを設定して」、「２．録画予約をして」、「３．音楽をかけて」等の入力候補をディスプレイＤ１に表示する。

　そして、５Ｃに示すように、ユーザＵ１が「１つ目」と発話することで、情報処理装置１００は、入力候補のうちの「１．アラームを設定して」が選択されたことを認識し、その旨をディスプレイＤ１に表示し、選択された入力に対応する処理を行う。

　これによって、情報処理装置１００は、ユーザによる音声入力時の発話量を削減することができる。なお、図５はあくまで一例であり、処理内容およびユーザによる発話内容は適宜変更され得る。例えば、５Ｃにおいて、何らかの方法で入力候補の中からユーザ所望の入力が特定されれば、選択方法は特に限定されない。より具体的には、ユーザは、ディスプレイＤ１に表示されたテキスト情報をそのまま読み上げてもよいし、コントローラ等の任意の入力装置を用いてポインタ等で選択を行ってもよい。

　図５に示した第１の処理例は、例えば、図６Ａおよび図６Ｂのフローチャートに示す、情報処理装置１００の各機能構成の処理よって実現される。

　より具体的には、ステップＳ１０００では、ユーザが情報処理装置１００に対して発話することで音声入力を開始し、ステップＳ１００４では、情報処理装置１００の音声認識部１１１が音声認識を開始する。より具体的には、音声認識部１１１は、ユーザによる音声入力と並行して、逐次、音声情報をテキスト情報に変換する。その後、Ｅｎｔｉｔｙ抽出部１１２は、ステップＳ１００８にて、入力途中のテキスト情報を逐次取得し、ステップＳ１０１２にて、テキスト情報に対応するＥｎｔｉｔｙの抽出を試みる。

　テキスト情報に対応するＥｎｔｉｔｙが抽出された場合（ステップＳ１０１６／ｙｅｓ）、ステップＳ１０２０にて、Ｉｎｔｅｎｔ抽出部１１３が、抽出されたＥｎｔｉｔｙに対応するＩｎｔｅｎｔを抽出する。ステップＳ１０１６にて、テキスト情報に対応するＥｎｔｉｔｙが抽出されない場合（ステップＳ１０１６／ｎｏ）、処理がステップＳ１０１２に戻り、Ｅｎｔｉｔｙの抽出処理が継続される。

　Ｅｎｔｉｔｙに対応するＩｎｔｅｎｔが抽出された場合（ステップＳ１０２４／ｙｅｓ）、ステップＳ１０２８にて、入力候補抽出部１１４が、抽出されたＩｎｔｅｎｔを呼び出すことができる１または２以上の例文の中から適切な例文を抽出する。ステップＳ１０２４にて、Ｅｎｔｉｔｙに対応するＩｎｔｅｎｔが抽出されない場合（ステップＳ１０２４／ｎｏ）、処理がステップＳ１０２０に戻り、Ｉｎｔｅｎｔの抽出処理が継続される。ステップＳ１０３２では、入力候補抽出部１１４が、抽出された例文を入力候補として出力する。

　ステップＳ１０３６では、ユーザが、出力された入力候補の中から一つの入力を選択する。ステップＳ１０４０では、Ｉｎｔｅｎｔ処理部１１６が、ユーザによって選択されたＩｎｔｅｎｔに関する処理を実行することで処理が終了する。

　（１．４．２．第２の処理例）
　続いて、図７を参照して、第２の処理例について説明する。図７は、情報処理装置１００による第２の処理例のイメージを示す図である。第２の実施例は、入力候補の選択だけではＩｎｔｅｎｔに関する処理の実行のために情報が不足している場合において、その不足情報が別途入力される場合の例である。

　山田さんにメッセージを送信しようとしているユーザＵ１が存在する場合、ユーザＵ１は、図７の７Ａに示すように、情報処理装置１００に対して音声入力を開始する。ユーザＵ１が「山田さん」と発話する。すると、情報処理装置１００は、入力途中の音声情報を解析することで、７Ｂに示すように、「１．・・・とメッセージを送る」、「２．電話をかける」、「３．コンタクトリストから削除する」等の入力候補をディスプレイＤ１に表示する。

　そして、７Ｃに示すように、ユーザＵ１が「１つ目」と発話することで、情報処理装置１００は、入力候補のうちの「１．・・・とメッセージを送る」が選択されたことを認識し、その旨をディスプレイＤ１に表示する。

　７Ｃでは、メッセージの内容が未入力の状態なので、情報処理装置１００は、Ｉｎｔｅｎｔに関する処理を実行することができない。そこで、７Ｄに示すように、ユーザＵ１は、メッセージの内容を入力するための発話を行う。例えば、ユーザＵ１は、「に明日は会社が休みだよ」と発話する。これによって、情報処理装置１００は、７Ｅに示すように、メッセージの内容を認識し、これを内容Ｓ１としてディスプレイＤ１に表示する。

　これによって、情報処理装置１００は、音声入力時の発話量を削減しつつ、Ｉｎｔｅｎｔに関する処理の実行に不足している情報を、入力候補の選択とは別に、ユーザＵ１に入力させることができる。なお、図７はあくまで一例であり、処理内容およびユーザによる発話内容は適宜変更され得る。例えば、７Ｄにおいて、何らかの方法で不足情報が入力されれば、その入力方法は特に限定されない。より具体的には、ユーザは、キーボードまたはコントローラ等の任意の入力装置を用いて不足情報を入力してもよい。また、入力候補の選択（図７においては、７Ｃ）と、不足情報の入力（図７においては、７Ｄ）の順番は適宜変更されてもよい。

　図７に示した第２の処理例は、例えば、図８Ａおよび図８Ｂのフローチャートに示す、情報処理装置１００の各機能構成の処理よって実現される。なお、ステップＳ１１００からステップＳ１１３６までは、図６Ａおよび図６Ｂに示したステップＳ１０００からステップＳ１０３６と同一であるため、説明を省略する。

　ステップＳ１１４０にて、Ｉｎｔｅｎｔの処理の実行に不足している情報がある場合（ステップＳ１１４０／ｙｅｓ）、ステップＳ１１４４にて、不足している情報をユーザが音声により入力する。そして、Ｉｎｔｅｎｔの処理の実行に不足している情報がなくなった場合（ステップＳ１１４０／ｎｏ）、ステップＳ１１４８にて、Ｉｎｔｅｎｔ処理部１１６が、Ｉｎｔｅｎｔに関する処理を実行することで処理が終了する。

　（１．４．３．第３の処理例）
　続いて、図９を参照して、第３の処理例について説明する。図９は、情報処理装置１００による第３の処理例のイメージを示す図である。第３の実施例は、ユーザによる音声入力に関する発話の完了を待たずにＩｎｔｅｎｔに関する処理が行われる場合の例である。

　「今から帰るよ」というメールをユーザＵ２に送信しようとしているユーザＵ１が存在する場合、ユーザＵ１は、図９の９Ａに示すように、情報処理装置１００に対して音声入力を開始する。ユーザＵ１が「今から帰るよ」と発話する。すると、情報処理装置１００は、入力途中の音声情報を解析することで、９Ｂに示すように、「１．とメールをＵ２へ送信」等の入力候補をディスプレイＤ１に表示する。

　そして、情報処理装置１００は、Ｉｎｔｅｎｔに関する処理の実行条件に基づいてユーザＵ１による音声入力に関する発話の完了を待たずにＩｎｔｅｎｔに関する処理を実行するか否かを判断する。例えば、ユーザＵ１が発話している内容、コンテキストまたはユーザＵ１の行動履歴等に基づいて、発話が行われたコンテキストにおいて、発話によって抽出されたＩｎｔｅｎｔに関する処理が実行される可能性が所定値より高ければ、情報処理装置１００は、９Ｃに示すように、「１．とメールをＵ２へ送信」という入力を確定し、ユーザＵ１による音声入力に関する発話の完了を待たずに当該Ｉｎｔｅｎｔに関する処理を実行してもよい。

　これによって、情報処理装置１００は、音声入力時の発話量を大幅に削減することができる。なお、図９はあくまで一例であり、処理内容およびユーザによる発話内容は適宜変更され得る。例えば、ユーザＵ１は、別途、音声入力に関する発話の完了を待たずに処理を実行させるＩｎｔｅｎｔの内容を、情報処理装置１００を用いて設定できてもよいし、当該機能の有効化または無効化を、情報処理装置１００を用いて設定できてもよい。

　図９に示した第３の処理例は、例えば、図１０Ａおよび図１０Ｂのフローチャートに示す、情報処理装置１００の各機能構成の処理よって実現される。なお、ステップＳ１２００からステップＳ１２２４までは、図６Ａおよび図６Ｂに示したステップＳ１０００からステップＳ１０２４と同一であるため、説明を省略する。

　ステップＳ１２２８では、Ｉｎｔｅｎｔ処理部１１６が、Ｉｎｔｅｎｔに関する処理の実行条件に基づいてユーザによる音声入力に関する発話の完了を待たずにＩｎｔｅｎｔに関する処理を実行するか否かを判断する。Ｉｎｔｅｎｔに関する処理の実行条件が満たされている場合（ステップＳ１２２８／Ｙｅｓ）、ステップＳ１２３２にて、Ｉｎｔｅｎｔ処理部１１６が、Ｉｎｔｅｎｔに関する処理を実行することで処理が終了する。

　Ｉｎｔｅｎｔに関する処理の実行条件が満たされていない場合（ステップＳ１２２８／Ｎｏ）、入力候補抽出部１１４が、ステップＳ１２３６にて、抽出されたＩｎｔｅｎｔを呼び出すことができる１または２以上の例文の中から適切な例文を抽出し、ステップＳ１２４０にて、抽出された例文を入力候補として出力する。

　そして、ステップＳ１２４４では、ユーザが、出力された入力候補の中から一つの入力を選択する。ステップＳ１２３２では、Ｉｎｔｅｎｔ処理部１１６が、ユーザによって選択されたＩｎｔｅｎｔに関する処理を実行することで処理が終了する。

　なお、図６Ａ、図６Ｂ、図８Ａ、図８Ｂ、図１０Ａおよび図１０Ｂに示したフローチャートにおける各ステップは、必ずしも記載された順序に沿って時系列に処理する必要はない。すなわち、フローチャートにおける各ステップは、記載された順序と異なる順序で処理されても、並列的に処理されてもよい。

　　＜２．第２の実施例＞
　上記では、本開示に係る第１の実施例について説明した。続いて、本開示に係る第２の実施例について説明する。

　第１の実施例において、Ｉｎｔｅｎｔ抽出部１１３は、Ｅｎｔｉｔｙ抽出部１１２によって抽出されたＥｎｔｉｔｙに基づいてＩｎｔｅｎｔを抽出していた。しかし、この方法では、適切なＩｎｔｅｎｔが抽出されない可能性がある。

　例えば、予定表の更新に関するＩｎｔｅｎｔが「時間」等のＥｎｔｉｔｙに対応しており、予定表の更新をしようとするユーザが「カレンダー」と発話した場合について考える。このとき、「カレンダー」という発話から「時間」というＥｎｔｉｔｙが抽出されない場合、Ｉｎｔｅｎｔ抽出部１１３は、予定表の更新に関するＩｎｔｅｎｔを抽出することができない。

　そこで、第２の実施例において、Ｉｎｔｅｎｔ抽出部１１３は、Ｅｎｔｉｔｙ以外の属性情報としてＩｎｔｅｎｔの予約語も併せて、Ｉｎｔｅｎｔの抽出処理に用いる。

　ここで、Ｉｎｔｅｎｔの予約語とは、Ｉｎｔｅｎｔに関する機能を指し示す際に頻繁に使用される語である。例えば、Ｉｎｔｅｎｔに関する機能が「予定表の更新」である場合、当該Ｉｎｔｅｎｔの予約語は、図１１に示すように、「１．予定表」、「２．カレンダー」または「３．日程」等であり得る。

　これによって、Ｉｎｔｅｎｔ抽出部１１３は、Ｅｎｔｉｔｙが適切に抽出されなかった場合であっても、予約語に基づいてＩｎｔｅｎｔを適切に抽出することができる。上記の例であれば、Ｉｎｔｅｎｔ抽出部１１３は、「カレンダー」という発話に基づいて「カレンダー」という予約語を有しているＩｎｔｅｎｔを適切に抽出することができる。

　なお、図１１に示した例では、予約語が、Ｉｎｔｅｎｔに関する機能「予定表の更新」の一部である「予定表」の同義語または類義語であるが、Ｉｎｔｅｎｔに関する機能を指し示す際に頻繁に使用される語であれば予約語の内容は特に限定されない。例えば、予約語は、Ｉｎｔｅｎｔに関する機能「予定表の更新」の一部である「予定表」と深い関連性を有する「予定」、「計画」、「プラン」または「スケジュール」であってもよいし、Ｉｎｔｅｎｔに関する機能「予定表の更新」の実現に用いられるソフトウェア名（またはアプリケーション名）であってもよい。また、予約語はユーザによって編集可能なものであってもよい。

　また、ユーザが予約語と同一の内容を発話しなかった場合であっても、Ｉｎｔｅｎｔ抽出部１１３は、当該発話の意味を解釈することで、発話の内容に含まれる語の同義語、類義語または深い関連性を有する語を認識し、これらの語を用いてＩｎｔｅｎｔを抽出してもよい。これによって、Ｉｎｔｅｎｔ抽出部１１３は、Ｉｎｔｅｎｔの抽出精度を向上させることができる。

　　＜３．ハードウェア構成例＞
　上記では、本開示に係る第２の実施例について説明した。続いて、図１２を参照して、情報処理装置１００のハードウェア構成例について説明する。

　図１２は、情報処理装置１００のハードウェア構成を示す図である。情報処理装置１００は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）９０１と、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）９０２と、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）９０３と、ホストバス９０４と、ブリッジ９０５と、外部バス９０６と、インタフェース９０７と、入力装置９０８と、出力装置９０９と、ストレージ装置（ＨＤＤ）９１０と、ドライブ９１１と、通信装置９１２と、を備える。

　ＣＰＵ９０１は、演算処理装置および制御装置として機能し、各種プログラムに従って情報処理装置１００内の動作全般を制御する。また、ＣＰＵ９０１は、マイクロプロセッサであってもよい。ＲＯＭ９０２は、ＣＰＵ９０１が使用するプログラムや演算パラメータ等を記憶する。ＲＡＭ９０３は、ＣＰＵ９０１の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはＣＰＵバスなどから構成されるホストバス９０４により相互に接続されている。当該ＣＰＵ９０１、ＲＯＭ９０２およびＲＡＭ９０３の協働により、情報処理装置１００の制御部１１０、センサ部１３０または撮像部１４０の各機能が実現される。

　ホストバス９０４は、ブリッジ９０５を介して、ＰＣＩ（Ｐｅｒｉｐｈｅｒａｌ　Ｃｏｍｐｏｎｅｎｔ　Ｉｎｔｅｒｃｏｎｎｅｃｔ／Ｉｎｔｅｒｆａｃｅ）バスなどの外部バス９０６に接続されている。なお、必ずしもホストバス９０４、ブリッジ９０５および外部バス９０６を分離構成する必要はなく、１つのバスにこれらの機能を実装してもよい。

　入力装置９０８は、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、スイッチおよびレバーなどユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、ＣＰＵ９０１に出力する入力制御回路などから構成されている。情報処理装置１００の使用者は、該入力装置９０８を操作することにより、各装置に対して各種情報を入力したり処理動作を指示したりすることができる。当該入力装置９０８により、入力部１２０の機能が実現される。

　出力装置９０９は、例えば、ＣＲＴ（Ｃａｔｈｏｄｅ　Ｒａｙ　Ｔｕｂｅ）ディスプレイ装置、液晶ディスプレイ（ＬＣＤ）装置、ＯＬＥＤ（Ｏｒｇａｎｉｃ　Ｌｉｇｈｔ　Ｅｍｉｔｔｉｎｇ　Ｄｉｏｄｅ）装置およびランプなどの表示装置を含む。さらに、出力装置９０９は、スピーカおよびヘッドホンなどの音声出力装置を含む。出力装置９０９は、例えば、再生されたコンテンツを出力する。具体的には、表示装置は再生された映像データ等の各種情報をテキストまたはイメージで表示する。一方、音声出力装置は、再生された音声データ等を音声に変換して出力する。当該出力装置９０９により、出力部１５０の機能が実現される。

　ストレージ装置９１０は、データ格納用の装置である。ストレージ装置９１０は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置などを含んでもよい。ストレージ装置９１０は、例えば、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）で構成される。このストレージ装置９１０は、ハードディスクを駆動し、ＣＰＵ９０１が実行するプログラムや各種データを格納する。当該ストレージ装置９１０により記憶部１７０の各機能が実現される。

　ドライブ９１１は、記憶媒体用リーダライタであり、情報処理装置１００に内蔵、あるいは外付けされる。ドライブ９１１は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記憶媒体９１３に記録されている情報を読み出して、ＲＡＭ９０３に出力する。また、ドライブ９１１は、リムーバブル記憶媒体９１３に情報を書き込むこともできる。

　通信装置９１２は、例えば、通信網９１４に接続するための通信デバイス等で構成された通信インタフェースである。当該通信装置９１２により通信部１６０の各機能が実現される。

　　＜４．まとめ＞
　以上で説明してきたように、本開示に係る情報処理装置１００は、入力が行われている途中のテキスト情報を取得し、当該テキスト情報に基づいて抽出される属性情報に基づいて当該入力の候補を出力することができる。

　また、Ｉｎｔｅｎｔを抽出する際、情報処理装置１００は、入力が行われている途中のテキスト情報に基づいて抽出したＥｎｔｉｔｙだけでなくＩｎｔｅｎｔの予約語も用いてＩｎｔｅｎｔを抽出することができる。これによって、情報処理装置１００は、Ｉｎｔｅｎｔの抽出精度を向上させることができる。

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　なお、以下のような構成も本開示の技術的範囲に属する。
（１）
　入力が行われている途中のテキスト情報を取得する取得部と、
　前記テキスト情報に基づいて抽出される属性情報に基づいて前記入力の候補を抽出する入力候補抽出部と、を備える、
　情報処理装置。
（２）
　前記入力は、ユーザによる入力である、
　前記（１）に記載の情報処理装置。
（３）
　前記入力は、前記ユーザによる音声入力である、
　前記（２）に記載の情報処理装置。
（４）
　前記音声入力が行われている途中の音声情報を解析することで、前記テキスト情報を出力する音声認識部をさらに備える、
　前記（３）に記載の情報処理装置。
（５）
　前記属性情報は、ある機能を示すＩｎｔｅｎｔの属性を示す情報である、
　前記（１）から（４）のいずれか１項に記載の情報処理装置。
（６）
　前記入力候補抽出部は、前記属性情報に基づいて抽出される前記Ｉｎｔｅｎｔに対応する例文を前記入力の候補として抽出する、
　前記（５）に記載の情報処理装置。
（７）
　前記属性情報は、Ｅｎｔｉｔｙである、
　前記（５）または（６）に記載の情報処理装置。
（８）
　前記テキスト情報に基づいて複数のＥｎｔｉｔｙが抽出される場合、前記複数のＥｎｔｉｔｙ同士の関連性の高さまたは共起関係の有無に基づいて前記Ｅｎｔｉｔｙに対して重み付けが施される、
　前記（７）に記載の情報処理装置。
（９）
　前記Ｅｎｔｉｔｙまたは前記Ｉｎｔｅｎｔは、ユーザの嗜好情報、前記ユーザに関する履歴情報、前記ユーザがおかれた状況もしくは環境または前記ユーザの状態もしくは行動を含むコンテキストのいずれかに基づいて抽出される、
　前記（７）または（８）に記載の情報処理装置。
（１０）
　前記属性情報は、前記Ｉｎｔｅｎｔを示す予約語に関する情報である、
　前記（５）または（６）に記載の情報処理装置。
（１１）
　前記Ｉｎｔｅｎｔに関する処理を実行するＩｎｔｅｎｔ処理部をさらに備える、
　前記（５）から（９）のいずれか１項に記載の情報処理装置。
（１２）
　前記処理の実行に前記テキスト情報が不足している場合、前記取得部は、別途入力されたテキスト情報を取得する、
　前記（１１）に記載の情報処理装置。
（１３）
　前記Ｉｎｔｅｎｔ処理部は、前記入力の完了を待つことなく前記処理を実行する、
　前記（１１）に記載の情報処理装置。
（１４）
　前記属性情報に基づいて抽出された前記Ｉｎｔｅｎｔに関する処理が実行される可能性が所定値より高い場合、前記Ｉｎｔｅｎｔ処理部は、前記入力の完了を待つことなく前記処理を実行する、
　前記（１３）に記載の情報処理装置。
（１５）
　入力が行われている途中のテキスト情報を取得することと、
　前記テキスト情報に基づいて抽出される属性情報に基づいて前記入力の候補を抽出することと、を有する、
　コンピュータにより実行される情報処理方法。

　１００　　情報処理装置
　１１０　　制御部
　１１１　　音声認識部
　１１２　　Ｅｎｔｉｔｙ抽出部
　１１３　　Ｉｎｔｅｎｔ抽出部
　１１４　　入力候補抽出部
　１１５　　コンテキスト解析部
　１１６　　Ｉｎｔｅｎｔ処理部
　１２０　　入力部
　１３０　　センサ部
　１４０　　撮像部
　１５０　　出力部
　１６０　　通信部
　１７０　　記憶部

Claims

　入力が行われている途中のテキスト情報を取得する取得部と、
　前記テキスト情報に基づいて抽出される属性情報に基づいて前記入力の候補を抽出する入力候補抽出部と、を備える、
　情報処理装置。
　前記入力は、ユーザによる入力である、
　請求項１に記載の情報処理装置。
　前記入力は、前記ユーザによる音声入力である、
　請求項２に記載の情報処理装置。
　前記音声入力が行われている途中の音声情報を解析することで、前記テキスト情報を出力する音声認識部をさらに備える、
　請求項３に記載の情報処理装置。
　前記属性情報は、ある機能を示すＩｎｔｅｎｔの属性を示す情報である、
　請求項１に記載の情報処理装置。
　前記入力候補抽出部は、前記属性情報に基づいて抽出される前記Ｉｎｔｅｎｔに対応する例文を前記入力の候補として抽出する、
　請求項５に記載の情報処理装置。
　前記属性情報は、Ｅｎｔｉｔｙである、
　請求項５に記載の情報処理装置。
　前記テキスト情報に基づいて複数のＥｎｔｉｔｙが抽出される場合、前記複数のＥｎｔｉｔｙ同士の関連性の高さまたは共起関係の有無に基づいて前記Ｅｎｔｉｔｙに対して重み付けが施される、
　請求項７に記載の情報処理装置。
　前記Ｅｎｔｉｔｙまたは前記Ｉｎｔｅｎｔは、ユーザの嗜好情報、前記ユーザに関する履歴情報、前記ユーザがおかれた状況もしくは環境または前記ユーザの状態もしくは行動を含むコンテキストのいずれかに基づいて抽出される、
　請求項７に記載の情報処理装置。
　前記属性情報は、前記Ｉｎｔｅｎｔを示す予約語に関する情報である、
　請求項５に記載の情報処理装置。
　前記Ｉｎｔｅｎｔに関する処理を実行するＩｎｔｅｎｔ処理部をさらに備える、
　請求項５に記載の情報処理装置。
　前記処理の実行に前記テキスト情報が不足している場合、前記取得部は、別途入力されたテキスト情報を取得する、
　請求項１１に記載の情報処理装置。
　前記Ｉｎｔｅｎｔ処理部は、前記入力の完了を待つことなく前記処理を実行する、
　請求項１１に記載の情報処理装置。
　前記属性情報に基づいて抽出された前記Ｉｎｔｅｎｔに関する処理が実行される可能性が所定値より高い場合、前記Ｉｎｔｅｎｔ処理部は、前記入力の完了を待つことなく前記処理を実行する、
　請求項１３に記載の情報処理装置。
　入力が行われている途中のテキスト情報を取得することと、
　前記テキスト情報に基づいて抽出される属性情報に基づいて前記入力の候補を抽出することと、を有する、
　コンピュータにより実行される情報処理方法。