JPWO2015059976A1

JPWO2015059976A1 - 情報処理装置、情報処理方法、及びプログラム

Info

Publication number: JPWO2015059976A1
Application number: JP2015543736A
Authority: JP
Inventors: 真一河野; 邦仁澤井; 高橋　慧; 高橋　　慧; 信広西条
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2013-10-24
Filing date: 2014-08-04
Publication date: 2017-03-09
Also published as: WO2015059976A1; CN105518657B; CN105518657A; EP3062237A4; US20160210276A1; EP3062237A1

Abstract

【課題】入力されたテキスト列を利用者が容易に編集することが可能な、情報処理装置、情報処理方法、及びプログラムを提案する。【解決手段】入力されたテキスト列を複数の第１のテキストに区分するテキスト区分部と、前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第１のテキストのうち前記利用者の選択対象である第１のテキストを特定するテキスト特定部と、特定された第１のテキストを、前記利用者により入力される入力情報に基づいて編集するテキスト編集部と、を備える、情報処理装置。【選択図】図１７

Description

本開示は、情報処理装置、情報処理方法、及びプログラムに関する。

近年、ユーザが携帯電話やＰＣ（Personal Computer）などの情報機器において、テキストの入力または修正を行うための技術が各種開発されている。例えば、タッチパネルに対する利用者のタッチ操作を認識したり、利用者の発声を音声認識することにより、テキストの入力を可能とする技術が開発されている。

例えば、特許文献１には、ユーザにより修正文字列が入力された場合には、入力済みの文字列の中から修正文字列に対応する文字列である対応文字列を探し、そして、ユーザの入力により、対応文字列を修正文字列と入れ替える技術が開示されている。

特開平５−１４３５９３号公報

しかしながら、上記の技術では、テキスト列を利用者が編集する手間が大きい。例えば、上記の技術では、テキスト列の中から修正対象のテキストの位置を指定するためには、利用者は一文字単位でカーソルを移動させ、そして、修正対象のテキストの先頭の文字を指定する必要があるので、利用者の手間が大きい。

そこで、本開示では、入力されたテキスト列を利用者が容易に編集することが可能な、新規かつ改良された情報処理装置、情報処理方法、及びプログラムを提案する。

上記課題を解決するために、本開示のある観点によれば、入力されたテキスト列を複数の第１のテキストに区分するテキスト区分部と、前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第１のテキストのうち前記利用者の選択対象である第１のテキストを特定するテキスト特定部と、特定された第１のテキストを、前記利用者により入力される入力情報に基づいて編集するテキスト編集部と、を備える、情報処理装置が提供される。

また、上記課題を解決するために、本開示の別の観点によれば、入力されたテキスト列を複数の第１のテキストに区分することと、前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第１のテキストのうち前記利用者の選択対象である第１のテキストを特定することと、特定された第１のテキストを、前記利用者により入力される入力情報に基づいてプロセッサにより編集することと、を備える、情報処理方法が提供される。

また、上記課題を解決するために、本開示の別の観点によれば、コンピュータを、入力されたテキスト列を複数の第１のテキストに区分するテキスト区分部と、前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第１のテキストのうち前記利用者の選択対象である第１のテキストを特定するテキスト特定部と、特定された第１のテキストを、前記利用者により入力される入力情報に基づいて編集するテキスト編集部、として機能させるための、プログラムが提供される。

以上説明したように本開示によれば、入力されたテキスト列を利用者が容易に編集することができる。なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。

入力テキスト列の一例を示した説明図である。入力テキスト列の一例を示した説明図である。本開示の第１の実施形態による情報処理システムの基本構成を示した説明図である。同実施形態による情報処理装置１０のハードウェア構成を示した説明図である。同実施形態によるコントローラー２０の外観の一例を示した説明図である。同実施形態によるコントローラー２０の外観の一例を示した説明図である。同実施形態によるコントローラー２０の構成を示した機能ブロック図である。同実施形態による情報処理装置１０の構成を示した機能ブロック図である。同実施形態による選択候補テキストの特定例を示した説明図である。同実施形態による利用者の操作によるカーソルの移動の一例を示した説明図である。同実施形態による利用者の操作によるカーソルの移動の一例を示した説明図である。同実施形態による選択テキストの修正の一例を示した説明図である。同実施形態による選択テキストの削除の一例を示した説明図である。同実施形態による選択テキストの単純化の一例を示した説明図である。同実施形態によるテキストの追加の一例を示した説明図である。同実施形態によるテキストの追加の一例を示した説明図である。同実施形態による第１の動作例を示したフローチャートである。同第１の動作例における「選択・修正処理」の動作を示したフローチャートである。同第１の動作例における「削除・変形処理」の動作を示したフローチャートである。同実施形態による第２の動作例の一部を示したフローチャートである。同実施形態による第２の動作例の一部を示したフローチャートである。同第２の動作例における「変形・追加処理」の動作を示したフローチャートである。同第２の動作例における「修正・追加処理」の動作を示したフローチャートである。本開示の第２の実施形態による情報処理システムの基本構成を示した説明図である。同実施形態によるテレビジョン受像機６０の構成を示した機能ブロック図である。同実施形態による視線方向の特定方法の一例を示した説明図である。同実施形態による動作例の一部を示したフローチャートである。同実施形態による動作例の一部を示したフローチャートである。

以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

また、本明細書及び図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なるアルファベットを付して区別する場合もある。例えば、実質的に同一の機能構成を有する複数の構成を、必要に応じて表示画面４０ａおよび表示画面４０ｂのように区別する。ただし、実質的に同一の機能構成を有する複数の構成要素の各々を特に区別する必要がない場合、同一符号のみを付する。例えば、表示画面４０ａおよび表示画面４０ｂを特に区別する必要が無い場合には、単に表示画面４０と称する。

また、以下に示す項目順序に従って当該「発明を実施するための形態」を説明する。
１．背景
２．実施形態の詳細な説明
２−１．第１の実施形態
２−２．第２の実施形態
３．変形例

＜＜１．背景＞＞
本開示は、一例として「２．実施形態の詳細な説明」において詳細に説明するように、多様な形態で実施され得る。最初に、本開示の特徴を明確に示すために、本開示による情報処理装置を創作するに至った背景について説明する。

図１は、利用者により入力されたテキスト列５０が表示画面４０に表示されている一例（テキスト列５０ａ）を示している。このテキスト列５０ａは、利用者の意図通りに正確に入力された例である。

また、図２は、図１に示したテキスト列５０ａを利用者が音声による入力を試みたが、例えば音声認識の認識誤りなどにより、利用者の意図とは異なるテキスト列５０ｂが実際に入力され、表示画面４０に表示された例である。図２に示したように、テキスト列５０ｂでは、例えば「drive」が「drove」、「15」が「50」とそれぞれ誤って入力され、また、「umm」という不要な単語が誤って入力されている。

上述したように、音声認識機能を利用して利用者がテキストを入力する場合には、例えば音声認識の認識誤りなどにより、利用者の意図とは異なるテキストが入力される可能性がある。また、利用者の意図通りにテキストが入力された場合であっても、入力後において、利用者がテキスト列の一部の修正を希望する場合もある。

そこで、上記事情を一着眼点にして本開示による情報処理装置を創作するに至った。本開示による情報処理装置は、入力されたテキスト列を利用者が容易に編集することができる。以下、このような本開示の各実施形態について詳細に説明する。

＜＜２．実施形態の詳細な説明＞＞
＜２−１．第１の実施形態＞
（２−１−１．基本構成）
次に、第１の実施形態について説明する。まず、第１の実施形態による情報処理システムの基本構成について図３を参照して説明する。図３に示したように、第１の実施形態による情報処理システムは、情報処理装置１０、コントローラー２０、および表示装置３０を含む。

（２−１−１−１．情報処理装置１０）
情報処理装置１０は、本開示による情報処理装置の一例である。情報処理装置１０は、例えばメモ、電子メール、ブログなどのアプリケーションまたはＷｅｂサービスの利用時において、テキストを編集するためのソフトウェアを実装することが可能である。

また、情報処理装置１０は、例えば後述するコントローラー２０に備えられたマイクロフォン２０２などにより集音された音声を認識する機能を有することが可能である。さらに、情報処理装置１０は、認識された音声をテキスト列に変換した後、表示画面４０に表示させることも可能である。

この情報処理装置１０は、例えば、スマートフォンなどの携帯電話、ＰＣ、サーバ装置、タブレット端末、ＰＤＡ（Personal Digital Assistant）、テレビジョン受像機、デジタルカメラなどであってもよい。

なお、情報処理装置１０は、例えば図４に示すようなハードウェア構成を有する。図４に示したように、情報処理装置１０は、ＣＰＵ（Central Processing Unit）１５０、ＲＯＭ（Read Only Memory）１５２、ＲＡＭ（Random Access Memory）１５４、内部バス１５６、インターフェース１５８、入力装置１６０、出力装置１６２、ストレージ装置１６４、および通信装置１６６を備える。

‐ＣＰＵ１５０‐
ＣＰＵ１５０は、例えば各種処理回路などで構成され、情報処理装置１０全体を制御する制御部１００として機能する。また、ＣＰＵ１５０は、情報処理装置１０において、例えば、後述する音声認識部１０２、テキスト区分部１０４、テキスト特定部１０６、テキスト編集部１０８、表示制御部１１０、およびテキスト追加部１１２の機能を実現する。

‐ＲＯＭ１５２‐
ＲＯＭ１５２は、ＣＰＵ１５０が使用するプログラムや演算パラメータなどの制御用データなどを記憶する。

‐ＲＡＭ１５４‐
ＲＡＭ１５４は、例えば、ＣＰＵ１５０により実行されるプログラムなどを一時的に記憶する。

‐インターフェース１５８‐
インターフェース１５８は、入力装置１６０、出力装置１６２、ストレージ装置１６４、および通信装置１６６を、内部バス１５６と接続する。例えば入力装置１６０は、このインターフェース１５８および内部バス１５６を介して、ＣＰＵ１５０などとの間でデータをやり取りする。

‐入力装置１６０‐
入力装置１６０は、例えばタッチパネル、ボタン、マイクロフォン、およびスイッチなどユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、ＣＰＵ１５０に出力する入力制御回路などから構成されている。

‐出力装置１６２‐
出力装置１６２は、例えば、液晶ディスプレイ（LCD:Liquid Crystal
Display）装置、ＯＬＥＤ（Organic Light Emitting
Diode）装置およびランプなどの表示装置を含む。この表示装置は、撮像された画像や生成された画像などを表示する。

さらに、出力装置１６２は、スピーカーなどの音声出力装置を含む。この音声出力装置は、音声データ等を音声に変換して出力する。

‐ストレージ装置１６４‐
ストレージ装置１６４は、例えばＣＰＵ１５０が実行するプログラムや各種データを格納する、データ格納用の装置である。ストレージ装置１６４は、例えば、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置、または記憶媒体に記録されたデータを削除する削除装置などを含む。

‐通信装置１６６‐
通信装置１６６は、例えば公衆網やインターネットなどの通信網に接続するための通信デバイス等で構成された通信インターフェースである。また、通信装置１６６は、無線ＬＡＮ対応通信装置、ＬＴＥ（Long Term Evolution）対応通信装置、または有線による通信を行うワイヤー通信装置であってもよい。通信装置１６６は、例えば、後述する通信部１２０として機能する。

なお、情報処理装置１０のハードウェア構成は、上述した構成に限定されない。例えば、情報処理装置１０は、入力装置１６０、出力装置１６２、またはストレージ装置１６４のうちいずれか一つ以上を備えなくてもよい。

（２−１−１−２．コントローラー２０）
‐基本構成‐
コントローラー２０は、表示画面４０に表示されたテキスト列５０を利用者が編集するために利用する装置である。図５は、コントローラー２０の外観の一例（コントローラー２０ａ）を示した説明図である。図５に示したように、コントローラー２０ａは、例えば、マイクロフォン２０２、方向キー２１２、決定キー２１４、音声入力キー２１６、および、Ｂａｃｋキー２１８を含む。ここで、マイクロフォン２０２は、音声を集音するための機器である。また、方向キー２１２は、表示画面４０に表示される指示位置を利用者が移動させるためのキーである。なお、指示位置とは、例えば、表示画面４０に表示されるカーソルなど、利用者により指定されている位置または範囲を示すための表示である。本明細書では、以後、指示位置が、表示画面４０に表示されるカーソルの位置である例を中心として説明を行う。

また、決定キー２１４は、例えば利用者が選択を決定するためのキーである。また、音声入力キー２１６は、利用者がマイクロフォン２０２に対して音声を入力するためのキーである。また、Ｂａｃｋキー２１８は、例えば表示画面４０に表示されているテキスト編集画面からメニュー画面へ戻るなど、操作画面や操作モードなどを利用者が切り替えるために入力するためのキーである。

なお、図５では、方向キー２１２が左右方向を指定するためのキーである例を示しているが、かかる例に限定されない。例えば、方向キー２１２は、上下方向を指定するためのキーをさらに含んでもよいし、または、円形のキーであってもよい。

図６は、コントローラー２０の外観の別の例（コントローラー２０ｂ）を示した説明図である。図６に示したように、コントローラー２０ｂは、図５に示したコントローラー２０ａと比較して、方向キー２１２、および決定キー２１４を含まない代わりに、回転キー２２０を新たに含む。回転キー２２０は、方向キー２１２および決定キー２１４の両方の機能を備えたキーである。この回転キー２２０は、図６に示したように、利用者によりコントローラー２０ｂの内部の方向へ押し込まれることにより、利用者により決定操作がなされたことを示す信号を生成する。また、回転キー２２０は、利用者により例えば上下方向に回転されることにより、表示画面４０に表示されるカーソルの位置を移動させる操作がなされたことを示す信号を生成する。

‐構成‐
また、図７は、コントローラー２０の内部構成を示した機能ブロック図である。図７に示したように、コントローラー２０は、通信部２００、音声入力部２０２、および操作部２１０を有する。

通信部２００は、コントローラー２０に備えられる通信装置（図示省略）により、例えばbluetoothなどの規格による無線通信により、コントローラー２０と通信可能な範囲に位置する機器との間で情報の送受信を行う。例えば、通信部２００は、後述する操作部２１０が受け付けた、カーソルの移動方向の指定や、音声入力部２０２が受け付けた音声データなどを情報処理装置１０へ送信する。

音声入力部２０２は、マイクロフォン２０２などにより構成される。音声入力部２０２は、例えば、音声入力キー２１６が利用者により押下された場合に、外部の音声を集音する。利用者は、この音声入力部２０２により、利用者の音声をコントローラー２０に入力することができる。

操作部２１０は、例えば、方向キー２１２、決定キー２１４、音声入力キー２１６、Ｂａｃｋキー２１８、または、回転キー２２０などにより構成される。操作部２１０は、利用者による、表示画面４０におけるカーソルの移動方向の指定や、表示画面４０に表示された内容を決定するための入力などを受け付ける。

（２−１−１−３．表示装置３０）
表示装置３０は、表示画面４０を表示するための装置である。表示装置３０は、例えば、液晶ディスプレイ、またはＯＬＥＤディスプレイを有する。なお、図３では、表示装置３０がメガネ型のディスプレイを有する装置である例を示しているが、かかる例に限定されない。例えば、表示装置３０は、ＨＭＤ(Head Mounted Display)、テレビジョン受像機、腕時計型コンピュータ、またはゲーム機などであってもよい。

なお、第１の実施形態による情報処理システムは、上述した構成に限定されない。例えば、出力装置１６２が表示装置３０の機能を有する場合には、情報処理装置１０と表示装置３０は一体的に構成されてもよい。

（２−１−２．構成）
以上、第１の実施形態による情報処理システムの基本構成について説明した。続いて、第１の実施形態による情報処理装置１０の構成について詳細に説明する。図８は、情報処理装置１０の構成を示した機能ブロック図である。図８に示したように、情報処理装置１０は、制御部１００、および通信部１２０を有する。

（２−１−２−１．制御部１００）
制御部１００は、情報処理装置１０に内蔵されるＣＰＵ１５０、ＲＡＭ１５４などのハードウェアを用いて、情報処理装置１０の動作を全般的に制御する。また、図８に示したように、制御部１００は、音声認識部１０２、テキスト区分部１０４、テキスト特定部１０６、テキスト編集部１０８、表示制御部１１０、およびテキスト追加部１１２を有する。

（２−１−２−２．音声認識部１０２）
音声認識部１０２は、後述する通信部１２０によりコントローラー２０から受信された音声データを、例えば隠れマルコフモデルなどの音声認識技術を用いて認識する。また、音声認識部１０２は、認識した音声をテキストデータに変換する。

（２−１−２−３．テキスト区分部１０４）
テキスト区分部１０４は、利用者により入力されたテキスト列を複数の選択候補テキストに区分する。ここで、テキスト列は、例えば、音声認識部１０２により認識されたテキストデータである。あるいは、テキスト列は、利用者により例えばキーボードにより一気にタイピングされた文字列であったり、手書き文字認識により認識された文字列などであってもよい。

選択候補テキストは、本開示における第１のテキストの一例である。例えば、テキスト列の言語が英語、フランス語、ドイツ語など、分かち書きされる言語の場合には、選択候補テキストは、一単語単位、または複数の単語の組み合わせであってもよい。また、テキスト列の言語が日本語、中国語、韓国語など、分かち書きされない言語の場合には、テキスト列に対して形態素解析を行うことにより得られる形態素単位であってもよいし、自立語と付属語の組み合わせ（文節）単位であってもよい。あるいは、選択候補テキストは、所定の文字数で区分された文字列単位であったり、音声入力された文章単位であってもよい。

ここで、図９を参照して、上記のテキスト区分部１０４の機能についてより詳細に説明する。図９は、図２に示したテキスト列５０が、テキスト区分部１０４により複数の選択候補テキストに区分される例を示した説明図である。図９に示したように、例えば１個目の選択候補テキスト５２ａが「I」、２個目の選択候補テキスト５２ｂが「drove」のように、テキスト区分部１０４は、テキスト列５０に含まれる空白を区切りとして、テキスト列５０を複数の選択候補テキストに区分することが可能である。

また、変形例として、テキスト区分部１０４は、入力されたテキスト列の文脈に基づいてテキスト列を複数の選択候補テキストに区分することも可能である。例えば、テキスト区分部１０４は、予め登録された辞書データを参照し、テキスト列に含まれる各単語に関して前または後ろの単語との連結のしやすさを算出することにより、意味上一つのまとまりと判定される１以上の単語の組み合わせを、選択候補テキストとして区分する。図１に示したテキスト列５０の例では、テキスト区分部１０４は、第１文における「your」と「car」を別々の選択候補テキストに区別せずに、「your car」という一つの選択候補テキストとすることが可能である。

（２−１−２−４．テキスト特定部１０６）
テキスト特定部１０６は、テキスト区分部１０４により区分された複数の選択候補テキストのうち、表示画面４０におけるカーソルの位置を移動させるための利用者による移動方向の入力操作に基づいて、利用者の選択対象であるテキスト（以下、選択テキストとも称する）を特定する。ここで、移動方向の入力操作は、例えば、利用者による、コントローラー２０における方向キー２１２の押下や、回転キー２２０の操作などである。

ここで、図１０または図１１を参照して、上記の機能についてより詳細に説明する。図１０または図１１は、利用者の入力操作に基づいて、表示画面４０においてカーソル４２の位置が移動される例を示した説明図である。例えば利用者により、図５に示した右方向キー２１２ａが押下されるなど、右方向への移動操作が一回なされた場合には、図１０の中図に示したように、後述する表示制御部１１０は、カーソル４２ａからカーソル４２ｂへ、選択候補テキスト一個分だけ右方向へカーソル４２の位置を移動させる。そして、テキスト特定部１０６は、移動後のカーソル４２ｂの位置に該当する選択候補テキスト、つまり「I」を選択テキストとして特定する。

また、利用者により、右方向への移動操作がもう１回なされた場合または所定の時間以上継続された場合には、図１０の下図に示したように、表示制御部１１０は、カーソル４２ｂからカーソル４２ｃへ、さらに選択テキスト一個分だけ右方向へカーソル４２の位置を移動させる。そして、テキスト特定部１０６は、移動後のカーソル４２ｃの位置に該当する選択候補テキスト、つまり「drove」を選択テキストとして特定する。

また、図１１は、表示画面４０におけるカーソル４２の位置が利用者により左方向へ移動される例を示した説明図である。図１１の中図に示したように、利用者によりカーソル位置を左方向へ移動させる操作がなされた場合には、テキスト特定部１０６は、移動後のカーソル４２ｂの位置に該当する選択候補テキスト、つまり「jam」を選択テキストとして特定する。また、図１１の下図に示したように、利用者によりカーソル位置をさらに左方向へ移動させる操作がなされた場合には、テキスト特定部１０６は、移動後のカーソル４２ｃの位置に該当する選択候補テキスト、つまり「traffic」を選択テキストとして特定する。

これらの特定例によれば、利用者は、コントローラー２０の操作によりカーソルの移動方向を指定することにより、選択候補テキスト単位にカーソルを移動させて、修正を希望する選択候補テキストを指定することができる。このため、利用者は、修正を希望する文字列を少ない手間で指定することができる。

（２−１−２−５．テキスト編集部１０８）
テキスト編集部１０８は、テキスト特定部１０６により特定された選択テキストを、利用者により入力される入力情報に基づいて編集する。

‐編集例１（上書き修正）‐
例えば、テキスト編集部１０８は、利用者により修正テキストが入力された場合には、テキスト特定部１０６により特定された選択テキストを、テキスト列において修正テキストに置換することが可能である。ここで、修正テキストは、本開示における第２のテキストの一例である。なお、修正テキストは、例えば、コントローラー２０の音声入力部２０２に対して利用者により入力された音声が、音声認識部１０２により認識されたテキストデータであってもよい。あるいは、修正テキストは、キーボードやソフトウェアキーボードなどを介して、利用者により入力された文字列であってもよい。

ここで、図１２を参照して、上記のテキスト編集部１０８の機能についてより詳細に説明する。図１２は、表示画面４０に表示されたテキスト列に含まれる選択テキストが、利用者の入力操作に基いて修正テキストに置換される例を示した説明図である。図１２に示したように、例えばコントローラー２０に対する利用者の音声入力により、修正テキスト（「15」）が入力された場合には、テキスト編集部１０８は、カーソル４２の位置に該当する選択テキスト、つまり「50」を、「15」に置換する。

この編集例１によれば、利用者は、修正を希望する選択候補テキストを指定した後に、例えば音声入力部２０２に対して利用者の音声を入力することにより、選択候補テキストを所望の文字列（修正テキスト）に修正することができるので、テキスト列を容易に修正することができる。

‐編集例２（削除）‐
また、編集例２として、テキスト編集部１０８は、テキストを削除するための削除指示情報が利用者により入力された場合には、テキスト特定部１０６により特定された選択テキストをテキスト列から削除することが可能である。

ここで、図１３を参照して、上記の機能についてより詳細に説明する。図１３は、表示画面４０に表示されたテキスト列に含まれる選択テキストが、利用者の入力操作に基いて削除される例を示した説明図である。図１３の中図に示したように、利用者が削除を希望する選択候補テキストの位置にカーソルが移動され、かつ、コントローラー２０の操作部２１０に対して決定操作がなされた場合には、まず、表示制御部１１０は、機能選択画像４４を表示画面４０に表示させる。この機能選択画像４４は、選択テキストの編集内容を利用者が選択するための画像である。そして、機能選択画像４４において利用者により「削除」機能が選択された場合には、図１３の下図に示したように、テキスト編集部１０８は、カーソル４２ｂの位置に該当する選択テキスト、つまり「umm」を、テキスト列から削除する。

なお、図１３の中図に示したように、機能選択画像４４において「削除」機能が確定される前において、「削除」という表示の上にカーソルが位置する場合には、表示制御部１１０は、カーソル４２ｂの位置に該当する選択テキスト（「umm」）の上に、例えば横線など、選択テキストを強調させる表示を表示画面４０に表示させることが可能である。この表示例によれば、利用者は、「削除」機能を確定する前において、もし決定操作を行えば選択テキストが削除されることを確実に認識することができる。このため、選択テキストを利用者が誤って削除してしまうようなヒューマンエラーを大きく減少させることができる。

‐編集例３（単純化）‐
また、編集例３として、例えばテキスト列の言語が英語であり、かつ、単語を原形に変換するための変換指示情報が利用者により入力された場合には、テキスト編集部１０８は、テキスト特定部１０６により特定された選択テキストを、当該選択テキストが単純化されたテキストに置換することが可能である。ここで、選択テキストの単純化とは、例えば、選択テキストが動詞である場合には、選択テキストを例えば過去形や過去分詞形から、現在形に変換することである。また、選択テキストが名詞である場合には、選択テキストを複数形から単数形に変換することである。

ここで、図１４を参照して、編集例３の内容についてより詳細に説明する。図１４は、表示画面４０に表示されたテキスト列に含まれる選択テキストが、利用者の入力操作に基いて、当該選択テキストの原形に変換される例を示した説明図である。図１４の中図に示したように、表示画面４０に表示された機能選択画像４４において利用者により「変形」機能が選択された場合には、図１４の下図に示したように、テキスト編集部１０８は、カーソル４２の位置に該当する選択候補テキスト、つまり「drove」を、「drove」の原形である「drive」に置換する。

なお、変形例として、テキスト列の言語が日本語であり、かつ、漢字をひらがなに変換するための変換指示情報が利用者により入力された場合には、テキスト編集部１０８は、テキスト特定部１０６により特定された選択テキストを、当該選択テキストがひらがなに変換されたテキストに置換することが可能である。

一般的に、音声認識技術では例えば同音異義語や発音が似ている単語などの場合、利用者が音声を入力し直しても、利用者の意図通りにテキストを修正することが困難である。一方、この編集例３によれば、選択テキストをより平易なテキストに変換するので、利用者の意図が概ね伝わるようにテキストを置換できるという利点がある。例えば、利用者が「began」という単語の音声入力を試みたが、「begun」と音声認識された場合において、テキスト編集部１０８は、「begun」を、「begun」の原形である「begin」に変換するので、利用者の意図が概ね伝わるようにテキストを置換することができる。

（２−１−２−６．表示制御部１１０）
表示制御部１１０は、各種表示画像や、利用者により入力されたテキスト列などを表示画面４０に表示させる。例えば、図１５に示したように、カーソルがテキスト列の末尾に位置し、かつ、例えば決定操作などの所定の操作がなされた場合には、表示制御部１１０は、記号選択画像を表示画面４０に表示させる。なお、記号選択画像は、本開示における選択画像の一例であり、１以上の記号を利用者が選ぶための画像である。

（２−１−２−７．テキスト追加部１１２）
テキスト追加部１１２は、利用者の入力操作に基づいて、テキスト列の末尾に第２のテキスト列を追加する。ここで、第２のテキスト列は、例えば、表示画面４０に表示された記号選択画像において利用者により選択された記号である。または、第２のテキスト列は、音声認識部１０２により認識されたテキストデータであったり、キーボードやソフトウェアキーボードなどを介して入力された文字列であってもよい。

ここで、図１５または図１６を参照して、上記の機能についてより詳細に説明する。図１５は、表示画面４０に表示されたテキスト列の末尾に、利用者の入力操作に基いて記号が追加される例を示した説明図である。図１５の中図に示したように、テキスト列の末尾にカーソルが位置し、かつ、コントローラー２０の操作部２１０に対して決定操作がなされた場合には、まず、表示制御部１１０は、記号選択画像を表示画面４０に表示させる。そして、記号選択画像においていずれかの記号が利用者により選択された場合には、テキスト追加部１１２は、選択された記号をテキスト列の末尾に追加する。なお、図１５に示した例では、「!」が利用者により選択され、そして、テキスト列の末尾に追加される例を示している。

この追加例によれば、例えば「!」や「?」のような、音声認識では認識が困難な文字（または文字列）であっても、利用者は、記号選択画像から所望の文字を選ぶことにより、選択された文字をテキスト列に容易に追加することができる。また、例えば日本語のような、口語では肯定文と疑問文との間でテキストが同じになり得る言語の場合には、利用者は文末に「?」を追加することにより、疑問文であることを読み手に確実に理解させることができるので、利点が大きい。

図１６は、表示画面４０に表示されたテキスト列の末尾に、利用者の音声入力に基いてテキストデータが追加される例を示した説明図である。図１６に示したように、テキスト列の末尾にカーソルが位置し、かつ、利用者により新たな音声入力がなされた場合には、まず、音声認識部１０２は、新たに入力された音声を認識する。そして、図１６の下図に示したように、テキスト追加部１１２は、音声認識部１０２により認識されたテキスト列を、表示画面４０に表示されたテキスト列の末尾に追加する。なお、図１６に示した例では、「I'll text you as soon as
I get there」というテキスト列が利用者により音声入力され、そして、表示画面４０に表示されたテキスト列の末尾に追加される例を示している。

（２−１−２−７．通信部１２０）
通信部１２０は、例えば無線通信により、情報処理装置１０と通信可能な各種装置との間で情報を送受信する。例えば、通信部１２０は、利用者により入力されたカーソルの移動方向の指定を示す情報や、音声入力部２０２に対して入力された音声データなどをコントローラー２０から受信する。

なお、第１の実施形態による情報処理装置１０の構成は、上述した構成に限定されない。例えば、通信部１２０は情報処理装置１０に含まれず、他の装置に備えられてもよい。

（２−１−３．動作）
以上、第１の実施形態による構成について説明した。続いて、第１の実施形態による動作について説明する。ここでは、「動作例１」および「動作例２」の２つの動作例について説明する。なお、「動作例１」、「動作例２」ともに、利用者が音声認識によりテキストを入力し、そして、認識されたテキストを修正する場面における動作の例である。

（２−１−３−１．動作例１）
‐全体的な動作‐
最初に、動作例１について説明する。図１７は、動作例１による全体的な動作を示したフローチャートである。図１７に示したように、まず、利用者は、コントローラー２０の音声入力キー２１６を押下する（Ｓ１０１）。

続いて、利用者は、音声入力部２０２に対して音声を入力する。そして、通信部２００は、入力された音声データを情報処理装置１０へ送信する（Ｓ１０２）。

続いて、情報処理装置１０の音声認識部１０２は、コントローラー２０から受信された音声データを、音声認識技術により認識する。そして、テキスト区分部１０４は、音声認識部１０２により認識されたテキスト列を複数の選択候補テキストに区分する（Ｓ１０３）。

続いて、表示制御部１１０は、音声認識部１０２により認識されたテキスト列を表示画面４０に表示させるための制御情報を通信部１２０に表示装置３０へ送信させる。そして、表示装置３０は、情報処理装置１０から受信された制御情報に基づいて、テキスト列を表示画面４０に表示する（Ｓ１０４）。

続いて、制御部１００は、通信部１２０による受信状況を監視し、そして、利用者により新たに音声入力キー２１６が押下されたか否かを判断する（Ｓ１０５）。音声入力キー２１６が押下されたと判断された場合には（Ｓ１０５：Ｙｅｓ）、情報処理装置１０は、再びＳ１０２の動作を行う。

一方、音声入力キー２１６が押下されていないと判断された場合には（Ｓ１０５：Ｎｏ）、制御部１００は、利用者により例えば方向キー２１２の押下などの左右方向の移動操作がなされたか否かを判断する（Ｓ１０６）。左右方向の移動操作がなされたと判断された場合には（Ｓ１０６：Ｙｅｓ）、情報処理装置１０は、後述する「選択・修正処理」を行う（Ｓ１０７）。そして、情報処理装置１０は、再びＳ１０６の動作を行う。

一方、左右方向の移動操作がなされていないと判断された場合には（Ｓ１０６：Ｎｏ）、制御部１００は、利用者により決定キー２１４が押下されたか否かを判断する（Ｓ１０８）。決定キー２１４が押下されたと判断された場合には（Ｓ１０８：Ｙｅｓ）、テキスト編集部１０８は、利用者により入力されたテキスト列を確定する（Ｓ１０９）。そして、情報処理装置１０は、処理を終了する。

一方、決定キー２１４が押下されていないと判断された場合には（Ｓ１０８：Ｎｏ）、制御部１００は、再びＳ１０６の動作を行う。

‐選択・修正処理‐
次に、図１８を参照して、Ｓ１０７における「選択・修正処理」の動作について詳細に説明する。図１８に示したように、まず、情報処理装置１０の表示制御部１１０は、利用者により入力されたカーソルの移動方向の指定に基づいて、選択候補テキスト１個分だけカーソルを移動させる（Ｓ１１１）。

続いて、制御部１００は、通信部１２０による受信状況を監視し、そして、利用者により左右方向の移動操作が再度なされたか否かを判断する（Ｓ１１２）。左右方向の移動操作が再度なされたと判断された場合には（Ｓ１１２：Ｙｅｓ）、情報処理装置１０は、再びＳ１１１の動作を行う。

一方、左右方向の移動操作がなされていないと判断された場合には（Ｓ１１２：Ｎｏ）、制御部１００は、利用者により音声入力キー２１６が新たに押下されたか否かを判断する（Ｓ１１３）。

音声入力キー２１６が新たに押下されたと判断された場合には（Ｓ１１３：Ｙｅｓ）、表示制御部１１０は、利用者に音声を入力させるためのメッセージを表示画面４０に表示させる。そして、利用者は、音声入力部２０２に対して音声を入力する（Ｓ１１４）。

続いて、音声認識部１０２は、コントローラー２０から受信された音声データを、音声認識技術により認識する（Ｓ１１５）。

続いて、制御部１００は、カーソルがテキスト列の文末に位置しているか否かを判断する（Ｓ１１６）。カーソルがテキスト列の文末に位置している場合には（Ｓ１１６：Ｙｅｓ）、テキスト追加部１１２は、音声認識部１０２により認識されたテキストデータを第２のテキスト列として、テキスト列の末尾に追加する（Ｓ１１７）。一方、カーソルがテキスト列の文末以外の場所に位置している場合には（Ｓ１１６：Ｎｏ）、テキスト編集部１０８は、音声認識部１０２により認識されたテキストデータを修正テキストとし、そして、カーソルの位置に該当する選択候補テキストを、テキスト列において修正テキストに置換する（Ｓ１１８）。

Ｓ１１３において、音声入力キー２１６が押下されていないと判断された場合には（Ｓ１１３：Ｎｏ）、制御部１００は、利用者により決定キー２１４が新たに押下されたか否かを判断する（Ｓ１１９）。決定キー２１４が押下されていないと判断された場合には（Ｓ１１９：Ｎｏ）、制御部１００は、再びＳ１１２の動作を行う。

一方、決定キー２１４が押下されたと判断された場合には（Ｓ１１９：Ｙｅｓ）、制御部１００は、カーソルがテキスト列の文末に位置しているか否かを判断する（Ｓ１２０）。

カーソルがテキスト列の文末に位置している場合には（Ｓ１２０：Ｙｅｓ）、まず、表示制御部１１０は、記号選択画像を表示画面４０に表示させる（Ｓ１２１）。続いて、利用者は、記号選択画像の中から、カーソル位置つまりテキスト列の末尾に追加することを希望する記号を選択する（Ｓ１２２）。そして、テキスト追加部１１２は、Ｓ１２２において選択された記号を、テキスト列の末尾に追加する（Ｓ１２３）。

一方、カーソルがテキスト列の文末以外の場所に位置している場合には（Ｓ１２０：Ｎｏ）、情報処理装置１０は、後述する「削除・変形処理」の動作を行う（Ｓ１２４）。

‐削除・変形処理‐
次に、図１９を参照して、Ｓ１２４における「削除・変形処理」の動作について詳細に説明する。図１９に示したように、まず、情報処理装置１０の表示制御部１１０は、機能選択画像を表示画面４０に表示させる（Ｓ１３１）。

機能選択画像において利用者により「削除」機能が選択された場合には（Ｓ１３２：Ｙｅｓ）、テキスト編集部１０８は、カーソルの位置に該当する選択候補テキストを、テキスト列から削除する（Ｓ１３３）。

一方、機能選択画像において利用者により「変形」機能が選択された場合には（Ｓ１３２：Ｎｏ、Ｓ１３４：Ｙｅｓ）、テキスト編集部１０８は、カーソルの位置に該当する選択候補テキストを、例えば当該選択候補テキストが原形に変換されたテキストに置換するなど、単純化する（Ｓ１３５）。

機能選択画像において利用者により「削除」機能および「変形」機能のいずれも選択されなかった場合には（Ｓ１３４：Ｎｏ）、情報処理装置１０は、「削除・変形処理」の動作を終了する。

以上、動作例１について説明した。この動作例１によれば、「削除・変形処理」において機能選択画像が表示されるので、利用者は、機能選択画像において、例えば削除や単純化など、テキスト列の編集内容を明示的に選択することができ、編集内容を間違えることを防止できる。

（２−１−３−２．動作例２）
‐全体的な動作‐
次に、動作例２について説明する。図２０は、動作例２による全体的な動作の一部を示したフローチャートである。なお、図２０に示したＳ２０１〜Ｓ２０４の動作は、動作例１におけるＳ１０１〜Ｓ１０４の動作と同様である。従って、ここでは説明を省略する。

次に、図２１を参照して、Ｓ２０４より後の動作について説明する。図２１に示したように、まず、情報処理装置１０の制御部１００は、通信部１２０による受信状況を監視し、そして、利用者により左右方向の移動操作がなされたか否かを判断する（Ｓ２０５）。左右方向の移動操作がなされたと判断された場合には（Ｓ２０５：Ｙｅｓ）、表示制御部１１０は、利用者により入力された移動方向の指定に基づいて、選択候補テキスト１個分だけカーソルを移動させる（Ｓ２０６）。そして、情報処理装置１０は、再びＳ２０５の動作を行う。

一方、左右方向の移動操作がなされていないと判断された場合には（Ｓ２０５：Ｎｏ）、制御部１００は、利用者により決定キー２１４がロングタップされたか否かを判断する（Ｓ２０７）。決定キー２１４がロングタップされたと判断された場合には（Ｓ２０７：Ｙｅｓ）、情報処理装置１０は、後述する「変形・追加処理」の動作を行う（Ｓ２０８）。そして、情報処理装置１０は、再びＳ２０５の動作を行う。

一方、決定キー２１４が（通常の）タップがされたと判断された場合には（Ｓ２０７：Ｎｏ、Ｓ２０９：Ｙｅｓ）、制御部１００は、カーソルがテキスト列の文末に位置しているか否かを判断する（Ｓ２１０）。

カーソルがテキスト列の文末に位置している場合には（Ｓ２１０：Ｙｅｓ）、テキスト編集部１０８は、利用者により入力されたテキスト列を確定する（Ｓ２１１）。そして、情報処理装置１０は、処理を終了する。

一方、カーソルがテキスト列の文末以外の場所に位置している場合には（Ｓ２１０：Ｎｏ）、テキスト編集部１０８は、カーソルの位置に該当する選択候補テキストを、テキスト列から削除する（Ｓ２１２）。そして、情報処理装置１０は、再びＳ２０５の動作を行う。

Ｓ２０９において、決定キー２１４がタップされていないと判断された場合には（Ｓ２０９：Ｎｏ）、制御部１００は、利用者により音声入力キー２１６が押下されたか否かを判断する（Ｓ２１３）。音声入力キー２１６が押下されたと判断された場合には（Ｓ２１３：Ｙｅｓ）、情報処理装置１０は、後述する「修正・追加処理」の動作を行う（Ｓ２１４）。一方、音声入力キー２１６が押下されていないと判断された場合には（Ｓ２１３：Ｎｏ）、情報処理装置１０は、再びＳ２０５の動作を行う。

‐変形・追加処理‐
次に、図２２を参照して、Ｓ２０８における「変形・追加処理」の動作について詳細に説明する。図２２に示したように、まず、情報処理装置１０の制御部１００は、カーソルがテキスト列の文末に位置しているか否かを判断する（Ｓ２２１）。カーソルがテキスト列の文末に位置している場合には（Ｓ２２１：Ｙｅｓ）、情報処理装置１０は、Ｓ２２２〜Ｓ２２４の動作を行う。なお、Ｓ２２２〜Ｓ２２４の動作は、動作例１におけるＳ１２１〜Ｓ１２３の動作と同様である。

一方、カーソルがテキスト列の文末以外の場所に位置している場合には（Ｓ２２１：Ｎｏ）、動作例１におけるＳ１３５と同様に、テキスト編集部１０８は、カーソルの位置に該当する選択候補テキストを単純化する（Ｓ２２５）。

‐修正・追加処理‐
次に、図２３を参照して、Ｓ２１４における「修正・追加処理」の動作について詳細に説明する。なお、図２３に示したＳ２３１〜Ｓ２３５の動作は、動作例１におけるＳ１１４〜Ｓ１１８の動作と同様である。従って、ここでは説明を省略する。

以上、動作例２について説明した。この動作例２では、利用者が決定キー２１４をロングタップするか、あるいはタップするかにより、利用者はテキスト列の編集内容を選択することができる。このため、利用者は、（動作例１と比較して）より直感的な操作によりテキスト列を編集することができる。

また、動作例２では、利用者により決定キー２１４がロングタップされたことをトリガーとして、テキスト列の上書き修正や単純化を行うための「変形・追加処理」に処理を切り替える。このため、利用者は、編集の途中において今どの処理状態にいるのかをより理解しやすいという利点がある。

（２−１−４．効果）
以上、例えば図８、図１７〜図２３等を参照して説明したように、第１の実施形態による情報処理装置１０は、まず、入力されたテキスト列を複数の選択候補テキストに区分する。そして、情報処理装置１０は、表示画面におけるカーソルを移動させるための利用者による移動方向の入力操作に基づいて、区分された複数の選択候補テキストのうち、利用者の選択対象である選択候補テキストを特定する。そして、情報処理装置１０は、特定された選択候補テキストを、利用者により入力される入力情報に基づいて編集する。このため、入力されたテキスト列を利用者が容易に編集することができる。

例えば、利用者は、コントローラー２０の操作によりカーソルの移動方向を指定することにより、選択候補テキスト単位、つまり文法的または意味的にまとまった文字列単位にカーソルを移動させることができるので、利用者は、修正を希望するテキストの位置を少ない手間で指定することができる。また、利用者は、修正を希望するテキストを選択した後に、例えばコントローラー２０の音声入力キー２１６を押下し、そして、音声入力部２０２に対して利用者の音声を入力することにより、選択候補テキストを所望の文字列に上書き修正することができる。このように、利用者は、修正対象のテキストを簡単な操作により編集することができる。

また、コントローラー２０は、操作キーとして、例えば方向キー２１２、決定キー２１４、および音声入力キー２１６だけを含むような、簡素な装置で実現可能である。このため、利用者は、例えばどの操作キーを押下すればよいかについて迷うことがなく、所望の操作を簡単に行うことができる。また、コントローラー２０は、小型、かつ安価に構成可能である。

＜２−２．第２の実施形態＞
以上、第１の実施形態について説明した。上述したように、第１の実施形態では、利用者は、コントローラー２０の操作により、例えばカーソルの移動方向の指定や、各種編集内容の決定などの入力を行うことができる。後述するように、第２の実施形態によれば、利用者は、コントローラー２０を用いることなく、これらの入力をハンドフリーで行うことができる。

（２−２−１．基本構成）
まず、第２の実施形態による情報処理システムの基本構成について図２４を参照して説明する。図２４に示したように、第２の実施形態による情報処理システムは、テレビジョン受像機６０、およびカメラ７０を含む。

（２−２−１−１．テレビジョン受像機６０）
テレビジョン受像機６０は、本開示における情報処理装置の一例である。テレビジョン受像機６０は、表示画面４０を表示することが可能な装置である。また、テレビジョン受像機６０は、第１の実施形態による情報処理装置１０と同様に、テキストを編集するためのソフトウェアを実装することが可能である。また、テレビジョン受像機６０は、テレビジョン受像機６０に備えられた入力装置１６０により音声を集音し、そして、集音された音声を認識する機能を有することが可能である。

なお、テレビジョン受像機６０は、図４に示した、第１の実施形態による情報処理装置１０と概略同様のハードウェア構成を有する。但し、かかる構成に限定されず、例えば、テレビジョン受像機６０は、ストレージ装置１６４を備えなくてもよい。

（２−２−１−２．カメラ７０）
カメラ７０は、外部の映像を、レンズを通して例えばＣＣＤ（Charge Coupled Device）やＣＭＯＳ（Complementary Metal Oxide
Semiconductor）などの撮像素子に結像させ、静止画像又は動画像を撮影する機能を有する。例えば、カメラ７０は、レンズの前方に位置する利用者や物体の画像を撮影する。

また、カメラ７０は、有線通信または無線通信により、撮像した画像をテレビジョン受像機６０へ送信することが可能である。

なお、第２の実施形態による情報処理システムは、上述した構成に限定されない。例えば、テレビジョン受像機６０がカメラ７０を内部に含むなど、テレビジョン受像機６０とカメラ７０は一体的に構成されてもよい。

（２−２−２．構成）
以上、第２の実施形態による情報処理システムの基本構成について説明した。続いて、第２の実施形態によるテレビジョン受像機６０の構成について詳細に説明する。図２５は、テレビジョン受像機６０の構成を示した機能ブロック図である。図２５に示したように、テレビジョン受像機６０は、制御部１００、通信部１２０、音声入出力部１２２、および表示部１２４を有する。なお、音声認識部１０２、テキスト区分部１０４、テキスト編集部１０８、表示制御部１１０、およびテキスト追加部１１２の機能は、それぞれ第１の実施形態と概略同様である。

（２−２−２−１．制御部１００）
第２の実施形態による制御部１００は、第１の実施形態と比較して、新たに視線方向特定部１１４、および目視位置算出部１１６を有する。なお、制御部１００のその他の機能については、第１の実施形態と概略同様である。

（２−２−２−２．テキスト特定部１０６）
第２の実施形態によるテキスト特定部１０６は、後述する視線方向特定部１１４により特定される利用者の視線方向の移動に基づいて、テキスト区分部１０４により区分された複数の選択候補テキストから選択テキストを特定する。例えば、テキスト特定部１０６は、後述する目視位置算出部１１６により算出される、表示画面４０における利用者の目視位置に位置する選択候補テキストを選択テキストとして特定する。

（２−２−２−３．視線方向特定部１１４）
‐Ａ．利用者の目の位置の特定‐
視線方向特定部１１４は、カメラ７０による撮影画像に基づいて、利用者の目の位置を特定することが可能である。例えば、視線方向特定部１１４は、まず、カメラ７０による撮影画像から、例えば目、鼻、または顔の輪郭などの特徴点を抽出することにより、利用者の顔を検出する。そして、視線方向特定部１１４は、例えば検出された利用者の目と目の間の距離、または利用者の顔の大きさなどに基づいて、カメラ７０から利用者の目までの相対的な位置を算出する。

‐Ｂ．利用者の視線方向の特定‐
さらに、視線方向特定部１１４は、カメラ７０による撮影画像に基づいて、利用者の視線方向を特定することが可能である。例えば、視線方向特定部１１４は、カメラ７０による撮影画像から検出された利用者の目の画像に対してパターンマッチングを行うことにより、利用者の視線方向を特定する。

なお、具体的な特定方法としては、例えば以下の方法が適用可能である。まず、ある画像処理装置により、視線方向と対応づけられた、複数人の目全体の撮影画像を用いて機械学習が行われることにより、パターンマッチング用の辞書データが作成される。そして、視線方向特定部１１４は、カメラ７０による撮影画像から検出された、利用者の目に関する特徴量と上記の辞書データとを比較することにより、利用者の視線方向がいずれの方向であるかを特定する。なお、上記の画像処理装置は、テレビジョン受像機６０であってもよいし、異なる装置であってもよい。

（２−２−２−４．目視位置算出部１１６）
目視位置算出部１１６は、視線方向特定部１１４により特定された利用者の目の位置、および利用者の視線方向に基づいて、表示画面４０における利用者の目視位置を算出する。ここで、目視位置は、例えば図２６に示した座標（ａ，ｂ）の点の位置のように、利用者が表示画面４０において見ている位置、または見ている位置の近傍の領域である。

例えば、図２６に示したように、目視位置算出部１１６は、利用者の目の位置（ｘ，ｙ，ｚ）から利用者の視線方向Ｖ（ｖｘ，ｖｙ，ｖｚ）へ伸ばした半直線と表示画面４０との交点の位置を、目視位置として算出する。

（２−２−２−５．通信部１２０）
第２の実施形態による通信部１２０は、テレビジョン受像機６０と通信可能な各種装置との間で情報を送受信する。例えば、通信部１２０は、カメラ７０により撮像された画像をカメラ７０から受信する。

（２−２−２−６．音声入出力部１２２）
音声入出力部１２２は、マイクロフォンなどの音声入力装置、およびスピーカーなどの音声出力装置から構成される。音声入出力部１２２は、例えば、外部の音声を集音したり、または、テレビジョン受像機６０により生成される音声データを音声に変換して出力する。

（２−２−２−７．表示部１２４）
表示部１２４は、表示制御部１１０による制御に基づいて、例えば利用者により入力されたテキスト列を表示画面４０に表示する。

なお、第２の実施形態によるテレビジョン受像機６０の構成は、上述した構成に限定されない。例えば、通信部１２０はテレビジョン受像機６０に含まれず、他の装置に備えられてもよい。また、テレビジョン受像機６０とカメラ７０が一体的に構成される場合には、テレビジョン受像機６０は、通信部１２０を含まなくてもよい。

（２−２−３．動作）
以上、第２の実施形態による構成について説明した。続いて、第２の実施形態による動作について説明する。なお、ここでは一例として、第１の実施形態による「動作例２」に対応する動作例について説明する。また、以下の説明では、マイクロフォンの形が描かれたアイコンである「マイクアイコン」が、表示画面４０における例えば左下部などの所定の位置に表示されている例を想定する。

図２７は、第２の実施形態による全体的な動作の一部を示したフローチャートである。図２７に示したように、まず、テレビジョン受像機６０の視線方向特定部１１４は、カメラ７０による撮影画像に基づいて、利用者の目の位置、および利用者の視線方向を特定する。そして、目視位置算出部１１６は、視線方向特定部１１４により特定された利用者の目の位置、および利用者の視線方向に基づいて、表示画面４０における利用者の目視位置を算出する。そして、制御部１００は、目視位置算出部１１６による算出結果に基づいて、表示画面４０に表示されたマイクアイコンを利用者が見つめる動作が所定時間以上続いたか否かを監視する（Ｓ３０１）。

マイクアイコンを見つめる動作が所定時間以上続いた場合には（Ｓ３０１：Ｙｅｓ）、表示制御部１１０は、利用者に音声を入力させるためのメッセージを表示画面４０に表示させる。そして、利用者は、音声入出力部１２２に対して音声を入力する（Ｓ３０２）。

続いて、音声認識部１０２は、音声入出力部１２２により受け付けられた音声データを、音声認識技術により認識する。そして、テキスト区分部１０４は、音声認識部１０２により認識されたテキスト列を複数の選択候補テキストに区分する（Ｓ３０３）。

続いて、表示制御部１１０は、音声認識部１０２により認識されたテキスト列を表示画面４０に表示させる（Ｓ３０４）。

続いて、視線方向特定部１１４は、カメラ７０による撮影画像に基づいて、利用者が目つぶりの動作をしているか否かを判定する。そして、制御部１００は、視線方向特定部１１４による判定結果に基づいて、利用者の目つぶりの動作が所定時間以上続いたか否かを監視する（Ｓ３０５）。

次に、図２８を参照して、Ｓ３０５より後の動作について説明する。目つぶりの動作が所定時間以上続いた場合には（Ｓ３０５：Ｙｅｓ）、制御部１００は、複数の選択候補テキストのうちいずれかが選択状態になっているか否かを判断する（Ｓ３０６）。なお、初期状態では、いずれの選択候補テキストも選択状態になっていないことを前提とする。

選択状態になっていない場合には（Ｓ３０６：Ｎｏ）、制御部１００は、目視位置算出部１１６による算出結果に基づいて、表示画面４０における特定の位置を見つめる動作が所定時間以上続いたか否かを監視する（Ｓ３０７）。そして、特定の位置を見つめる動作が所定時間以上続いた場合には（Ｓ３０７：Ｙｅｓ）、テキスト特定部１０６は、利用者が見つめている位置に該当する選択候補テキストを選択状態にする。なお、利用者がテキスト列の文末を見つめている場合には、テキスト列の文末を選択状態にする。続いて、表示制御部１１０は、表示画面４０において、選択状態にされた選択候補テキストまたは文末の位置（以下、選択位置とも称する）にカーソルを表示させる（Ｓ３０８）。その後、テレビジョン受像機６０は、再びＳ３０６の動作を行う。

Ｓ３０６において、いずれかの選択候補テキスト（または文末）が選択状態になっている場合には（Ｓ３０６：Ｙｅｓ）、制御部１００は、目視位置算出部１１６による算出結果に基づいて、利用者の目視位置の変化を監視する（Ｓ３０９、Ｓ３１１、Ｓ３１５）。

‐Ｓ３０９‐
利用者の目視位置が所定の距離以上、上に移動された場合には（Ｓ３０９：Ｙｅｓ）、テレビジョン受像機６０は、第１の実施形態におけるＳ２０８と概略同様な、「変形・追加処理」の動作を行う（Ｓ３１０）。そして、テレビジョン受像機６０は、再びＳ３０６の動作を行う。

‐Ｓ３１１‐
一方、利用者による選択位置を見つめる動作が所定時間以上続いた場合には（Ｓ３１１：Ｙｅｓ）、制御部１００は、選択位置が文末であるか否かを判断する（Ｓ３１２）。選択位置が文末である場合には（Ｓ３１２：Ｙｅｓ）、テキスト編集部１０８は、利用者により入力されたテキスト列を確定する（Ｓ３１３）。そして、情報処理装置１０は、処理を終了する。

選択位置が文末以外である場合には（Ｓ３１２：Ｎｏ）、テキスト編集部１０８は、選択中の選択候補テキストを、テキスト列から削除する（Ｓ３１４）。そして、情報処理装置１０は、再びＳ３０６の動作を行う。

‐Ｓ３１５‐
一方、表示画面４０に表示されたマイクアイコンを見つめる動作が所定時間以上続いた場合には（Ｓ３１５：Ｙｅｓ）、テレビジョン受像機６０は、第１の実施形態におけるＳ２１４と概略同様な、「修正・追加処理」の動作を行う（Ｓ３１６）。そして、テレビジョン受像機６０は、再びＳ３０６の動作を行う。

（２−２−４．効果）
以上、例えば図２５、図２７、図２８等を参照して説明したように、第２の実施形態によるテレビジョン受像機６０は、入力されたテキスト列から区分された複数の選択候補テキストのうち、利用者の視線方向の移動に基づいて、利用者の選択対象である選択候補テキストを特定する。そして、テレビジョン受像機６０は、特定された選択候補テキストを、利用者の視線の移動または利用者の音声に基づいて編集する。このため、利用者は、コントローラー２０を用いることなく、テキストの選択および編集を全てハンドフリーで行うことができる。また、例えばコントローラー２０を持ち続ける必要がないので、テキスト編集時における利用者の作業負荷がより小さい。

また、テレビジョン受像機６０は、例えば利用者がマイクアイコンを所定時間以上見つめた場合に利用者に音声入力させたり、または、利用者が選択位置を所定時間以上見つめた場合に選択テキストを削除する。このように、表示画面４０中の位置および時間の経過を条件として処理を切り替えるので、利用者は視線の移動だけで、意図通りに操作することができる。

＜＜３．変形例＞＞
なお、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示はかかる例に限定されない。本開示の属する技術の分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

例えば、コントローラー２０に含まれる各キーは、ハードウェアの代わりに、各キーの機能を実現するソフトウェアとして構成されることも可能である。そして、第１の実施形態による情報処理装置１０が、例えばスマートフォンのような、タッチパネルを有する装置である場合には、上記のソフトウェアをさらに実装することにより、情報処理装置１０およびコントローラー２０が一体的に構成されることが可能である。

また、本開示の各実施形態によれば、ＣＰＵ１５０、ＲＯＭ１５２、およびＲＡＭ１５４などのハードウェアを、上述した情報処理装置１０またはテレビジョン受像機６０の各構成と同等の機能を発揮させるためのコンピュータプログラムも提供可能である。また、該コンピュータプログラムが記録された記録媒体も提供される。

なお、以下のような構成も本開示の技術的範囲に属する。
（１）
入力されたテキスト列を複数の第１のテキストに区分するテキスト区分部と、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第１のテキストのうち前記利用者の選択対象である第１のテキストを特定するテキスト特定部と、
特定された第１のテキストを、前記利用者により入力される入力情報に基づいて編集するテキスト編集部と、
を備える、情報処理装置。
（２）
前記利用者により入力される入力情報は、前記利用者により入力される第２のテキストを含み、
前記テキスト編集部は、前記利用者により前記第２のテキストが入力された場合には、前記テキスト特定部により特定された第１のテキストを、前記テキスト列において前記第２のテキストに置換する、前記（１）に記載の情報処理装置。
（３）
前記第２のテキストは、前記利用者により発せられた音声が音声認識されることにより特定されるテキストを含む、前記（２）に記載の情報処理装置。
（４）
前記利用者により入力される入力情報は、テキストを削除するための削除指示情報を含み、
前記テキスト編集部は、前記利用者により前記削除指示情報が入力された場合には、前記テキスト特定部により特定された第１のテキストを前記テキスト列から削除する、前記（１）〜（３）のいずれか一項に記載の情報処理装置。
（５）
前記利用者により入力される入力情報は、単語を原形に変換するための変換指示情報を含み、
前記テキスト編集部は、前記利用者により前記変換指示情報が入力された場合には、前記テキスト特定部により特定された第１のテキストを、前記第１のテキストが原形に変換されたテキストに置換する、前記（１）〜（４）のいずれか一項に記載の情報処理装置。
（６）
前記利用者により入力される入力情報は、漢字をひらがなに変換するための変換指示情報を含み、
前記テキスト編集部は、前記利用者により前記変換指示情報が入力された場合には、前記テキスト特定部により特定された第１のテキストを、前記第１のテキストがひらがなに変換されたテキストに置換する、前記（１）〜（４）のいずれか一項に記載の情報処理装置。
（７）
前記入力されたテキスト列は、前記利用者により発せられた音声が音声認識されることにより特定されたテキスト列を含む、前記（１）〜（６）のいずれか一項に記載の情報処理装置。
（８）
前記情報処理装置は、前記指示位置が前記テキスト列の末尾に位置し、かつ、所定の操作がなされた場合に、前記テキスト列の末尾に第２のテキスト列を追加するテキスト追加部をさらに備える、前記（１）〜（６）のいずれか一項に記載の情報処理装置。
（９）
前記情報処理装置は、前記所定の操作がなされた場合に、前記利用者が１以上の記号を選ぶための選択画像を前記表示画面に表示させる表示制御部をさらに備え、
前記テキスト追加部は、前記選択画像において前記利用者により選択された１以上の記号を前記第２のテキスト列として、前記テキスト列の末尾に追加する、前記（８）に記載の情報処理装置。
（１０）
前記テキスト追加部は、前記利用者により発せられた音声が音声認識されることにより特定されたテキスト列を前記第２のテキスト列として、前記テキスト列の末尾に追加する、前記（８）に記載の情報処理装置。
（１１）
前記テキスト区分部は、前記テキスト列の文脈に基づいて前記テキスト列を複数の第１のテキストに区分する、前記（１）〜（１０）のいずれか一項に記載の情報処理装置。
（１２）
前記第１のテキストは、１以上の単語を含む、前記（１）〜（１１）のいずれか一項に記載の情報処理装置。
（１３）
前記利用者による移動方向の入力操作は、前記利用者による、前記表示画面において前記指示位置を移動させるための方向キーの選択操作を含む、前記（１）〜（１２）のいずれか一項に記載の情報処理装置。
（１４）
前記情報処理装置は、前記利用者の視線方向を特定する視線方向特定部をさらに備え、
前記利用者による移動方向の入力操作は、前記利用者による視線方向の移動を含む、前記（１）〜（１３）のいずれか一項に記載の情報処理装置。
（１５）
入力されたテキスト列を複数の第１のテキストに区分することと、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第１のテキストのうち前記利用者の選択対象である第１のテキストを特定することと、
特定された第１のテキストを、前記利用者により入力される入力情報に基づいてプロセッサにより編集することと、
を備える、情報処理方法。
（１６）
コンピュータを、
入力されたテキスト列を複数の第１のテキストに区分するテキスト区分部と、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第１のテキストのうち前記利用者の選択対象である第１のテキストを特定するテキスト特定部と、
特定された第１のテキストを、前記利用者により入力される入力情報に基づいて編集するテキスト編集部、
として機能させるための、プログラム。

１０情報処理装置
２０コントローラー
３０表示装置
６０テレビジョン受像機
７０カメラ
１００制御部
１０２音声認識部
１０４テキスト区分部
１０６テキスト特定部
１０８テキスト編集部
１１０表示制御部
１１２テキスト追加部
１１４視線方向特定部
１１６目視位置算出部
１２０通信部
１２２音声入出力部
１２４表示部
１５０ＣＰＵ
１５２ＲＯＭ
１５４ＲＡＭ
１５６内部バス
１５８インターフェース
１６０入力装置
１６２出力装置
１６４ストレージ装置
１６６通信装置
２００通信部
２０２マイクロフォン
２０２音声入力部
２１０操作部
２１２方向キー
２１４決定キー
２１６音声入力キー
２２０回転キー

Claims

入力されたテキスト列を複数の第１のテキストに区分するテキスト区分部と、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第１のテキストのうち前記利用者の選択対象である第１のテキストを特定するテキスト特定部と、
特定された第１のテキストを、前記利用者により入力される入力情報に基づいて編集するテキスト編集部と、
を備える、情報処理装置。
前記利用者により入力される入力情報は、前記利用者により入力される第２のテキストを含み、
前記テキスト編集部は、前記利用者により前記第２のテキストが入力された場合には、前記テキスト特定部により特定された第１のテキストを、前記テキスト列において前記第２のテキストに置換する、請求項１に記載の情報処理装置。
前記第２のテキストは、前記利用者により発せられた音声が音声認識されることにより特定されるテキストを含む、請求項２に記載の情報処理装置。
前記利用者により入力される入力情報は、テキストを削除するための削除指示情報を含み、
前記テキスト編集部は、前記利用者により前記削除指示情報が入力された場合には、前記テキスト特定部により特定された第１のテキストを前記テキスト列から削除する、請求項１に記載の情報処理装置。
前記利用者により入力される入力情報は、単語を原形に変換するための変換指示情報を含み、
前記テキスト編集部は、前記利用者により前記変換指示情報が入力された場合には、前記テキスト特定部により特定された第１のテキストを、前記第１のテキストが原形に変換されたテキストに置換する、請求項１に記載の情報処理装置。
前記利用者により入力される入力情報は、漢字をひらがなに変換するための変換指示情報を含み、
前記テキスト編集部は、前記利用者により前記変換指示情報が入力された場合には、前記テキスト特定部により特定された第１のテキストを、前記第１のテキストがひらがなに変換されたテキストに置換する、請求項１に記載の情報処理装置。
前記入力されたテキスト列は、前記利用者により発せられた音声が音声認識されることにより特定されたテキスト列を含む、請求項１に記載の情報処理装置。
前記情報処理装置は、前記指示位置が前記テキスト列の末尾に位置し、かつ、所定の操作がなされた場合に、前記テキスト列の末尾に第２のテキスト列を追加するテキスト追加部をさらに備える、請求項１に記載の情報処理装置。
前記情報処理装置は、前記所定の操作がなされた場合に、前記利用者が１以上の記号を選ぶための選択画像を前記表示画面に表示させる表示制御部をさらに備え、
前記テキスト追加部は、前記選択画像において前記利用者により選択された１以上の記号を前記第２のテキスト列として、前記テキスト列の末尾に追加する、請求項８に記載の情報処理装置。
前記テキスト追加部は、前記利用者により発せられた音声が音声認識されることにより特定されたテキスト列を前記第２のテキスト列として、前記テキスト列の末尾に追加する、請求項８に記載の情報処理装置。
前記テキスト区分部は、前記テキスト列の文脈に基づいて前記テキスト列を複数の第１のテキストに区分する、請求項１に記載の情報処理装置。
前記第１のテキストは、１以上の単語を含む、請求項１に記載の情報処理装置。
前記利用者による移動方向の入力操作は、前記利用者による、前記表示画面において前記指示位置を移動させるための方向キーの選択操作を含む、請求項１に記載の情報処理装置。
前記情報処理装置は、前記利用者の視線方向を特定する視線方向特定部をさらに備え、
前記利用者による移動方向の入力操作は、前記利用者による視線方向の移動を含む、請求項１に記載の情報処理装置。
入力されたテキスト列を複数の第１のテキストに区分することと、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第１のテキストのうち前記利用者の選択対象である第１のテキストを特定することと、
特定された第１のテキストを、前記利用者により入力される入力情報に基づいてプロセッサにより編集することと、
を備える、情報処理方法。
コンピュータを、
入力されたテキスト列を複数の第１のテキストに区分するテキスト区分部と、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第１のテキストのうち前記利用者の選択対象である第１のテキストを特定するテキスト特定部と、
特定された第１のテキストを、前記利用者により入力される入力情報に基づいて編集するテキスト編集部、
として機能させるための、プログラム。