JPWO2015059976A1 - 情報処理装置、情報処理方法、及びプログラム - Google Patents
情報処理装置、情報処理方法、及びプログラム Download PDFInfo
- Publication number
- JPWO2015059976A1 JPWO2015059976A1 JP2015543736A JP2015543736A JPWO2015059976A1 JP WO2015059976 A1 JPWO2015059976 A1 JP WO2015059976A1 JP 2015543736 A JP2015543736 A JP 2015543736A JP 2015543736 A JP2015543736 A JP 2015543736A JP WO2015059976 A1 JPWO2015059976 A1 JP WO2015059976A1
- Authority
- JP
- Japan
- Prior art keywords
- text
- user
- input
- information processing
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 118
- 238000003672 processing method Methods 0.000 title claims abstract description 7
- 230000011218 segmentation Effects 0.000 claims abstract description 9
- 238000012217 deletion Methods 0.000 claims description 16
- 230000037430 deletion Effects 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000004891 communication Methods 0.000 description 43
- 230000006870 function Effects 0.000 description 38
- 238000010586 diagram Methods 0.000 description 24
- 238000000034 method Methods 0.000 description 19
- 230000000007 visual effect Effects 0.000 description 19
- 238000012545 processing Methods 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 12
- 238000012937 correction Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000004397 blinking Effects 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
- G06F40/129—Handling non-Latin characters, e.g. kana-to-kanji conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- User Interface Of Digital Computer (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
1.背景
2.実施形態の詳細な説明
2−1.第1の実施形態
2−2.第2の実施形態
3.変形例
本開示は、一例として「2.実施形態の詳細な説明」において詳細に説明するように、多様な形態で実施され得る。最初に、本開示の特徴を明確に示すために、本開示による情報処理装置を創作するに至った背景について説明する。
<2−1.第1の実施形態>
(2−1−1.基本構成)
次に、第1の実施形態について説明する。まず、第1の実施形態による情報処理システムの基本構成について図3を参照して説明する。図3に示したように、第1の実施形態による情報処理システムは、情報処理装置10、コントローラー20、および表示装置30を含む。
情報処理装置10は、本開示による情報処理装置の一例である。情報処理装置10は、例えばメモ、電子メール、ブログなどのアプリケーションまたはWebサービスの利用時において、テキストを編集するためのソフトウェアを実装することが可能である。
CPU150は、例えば各種処理回路などで構成され、情報処理装置10全体を制御する制御部100として機能する。また、CPU150は、情報処理装置10において、例えば、後述する音声認識部102、テキスト区分部104、テキスト特定部106、テキスト編集部108、表示制御部110、およびテキスト追加部112の機能を実現する。
ROM152は、CPU150が使用するプログラムや演算パラメータなどの制御用データなどを記憶する。
RAM154は、例えば、CPU150により実行されるプログラムなどを一時的に記憶する。
インターフェース158は、入力装置160、出力装置162、ストレージ装置164、および通信装置166を、内部バス156と接続する。例えば入力装置160は、このインターフェース158および内部バス156を介して、CPU150などとの間でデータをやり取りする。
入力装置160は、例えばタッチパネル、ボタン、マイクロフォン、およびスイッチなどユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、CPU150に出力する入力制御回路などから構成されている。
出力装置162は、例えば、液晶ディスプレイ(LCD:Liquid Crystal
Display)装置、OLED(Organic Light Emitting
Diode)装置およびランプなどの表示装置を含む。この表示装置は、撮像された画像や生成された画像などを表示する。
ストレージ装置164は、例えばCPU150が実行するプログラムや各種データを格納する、データ格納用の装置である。ストレージ装置164は、例えば、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置、または記憶媒体に記録されたデータを削除する削除装置などを含む。
通信装置166は、例えば公衆網やインターネットなどの通信網に接続するための通信デバイス等で構成された通信インターフェースである。また、通信装置166は、無線LAN対応通信装置、LTE(Long Term Evolution)対応通信装置、または有線による通信を行うワイヤー通信装置であってもよい。通信装置166は、例えば、後述する通信部120として機能する。
‐基本構成‐
コントローラー20は、表示画面40に表示されたテキスト列50を利用者が編集するために利用する装置である。図5は、コントローラー20の外観の一例(コントローラー20a)を示した説明図である。図5に示したように、コントローラー20aは、例えば、マイクロフォン202、方向キー212、決定キー214、音声入力キー216、および、Backキー218を含む。ここで、マイクロフォン202は、音声を集音するための機器である。また、方向キー212は、表示画面40に表示される指示位置を利用者が移動させるためのキーである。なお、指示位置とは、例えば、表示画面40に表示されるカーソルなど、利用者により指定されている位置または範囲を示すための表示である。本明細書では、以後、指示位置が、表示画面40に表示されるカーソルの位置である例を中心として説明を行う。
また、図7は、コントローラー20の内部構成を示した機能ブロック図である。図7に示したように、コントローラー20は、通信部200、音声入力部202、および操作部210を有する。
表示装置30は、表示画面40を表示するための装置である。表示装置30は、例えば、液晶ディスプレイ、またはOLEDディスプレイを有する。なお、図3では、表示装置30がメガネ型のディスプレイを有する装置である例を示しているが、かかる例に限定されない。例えば、表示装置30は、HMD(Head Mounted Display)、テレビジョン受像機、腕時計型コンピュータ、またはゲーム機などであってもよい。
以上、第1の実施形態による情報処理システムの基本構成について説明した。続いて、第1の実施形態による情報処理装置10の構成について詳細に説明する。図8は、情報処理装置10の構成を示した機能ブロック図である。図8に示したように、情報処理装置10は、制御部100、および通信部120を有する。
制御部100は、情報処理装置10に内蔵されるCPU150、RAM154などのハードウェアを用いて、情報処理装置10の動作を全般的に制御する。また、図8に示したように、制御部100は、音声認識部102、テキスト区分部104、テキスト特定部106、テキスト編集部108、表示制御部110、およびテキスト追加部112を有する。
音声認識部102は、後述する通信部120によりコントローラー20から受信された音声データを、例えば隠れマルコフモデルなどの音声認識技術を用いて認識する。また、音声認識部102は、認識した音声をテキストデータに変換する。
テキスト区分部104は、利用者により入力されたテキスト列を複数の選択候補テキストに区分する。ここで、テキスト列は、例えば、音声認識部102により認識されたテキストデータである。あるいは、テキスト列は、利用者により例えばキーボードにより一気にタイピングされた文字列であったり、手書き文字認識により認識された文字列などであってもよい。
テキスト特定部106は、テキスト区分部104により区分された複数の選択候補テキストのうち、表示画面40におけるカーソルの位置を移動させるための利用者による移動方向の入力操作に基づいて、利用者の選択対象であるテキスト(以下、選択テキストとも称する)を特定する。ここで、移動方向の入力操作は、例えば、利用者による、コントローラー20における方向キー212の押下や、回転キー220の操作などである。
テキスト編集部108は、テキスト特定部106により特定された選択テキストを、利用者により入力される入力情報に基づいて編集する。
例えば、テキスト編集部108は、利用者により修正テキストが入力された場合には、テキスト特定部106により特定された選択テキストを、テキスト列において修正テキストに置換することが可能である。ここで、修正テキストは、本開示における第2のテキストの一例である。なお、修正テキストは、例えば、コントローラー20の音声入力部202に対して利用者により入力された音声が、音声認識部102により認識されたテキストデータであってもよい。あるいは、修正テキストは、キーボードやソフトウェアキーボードなどを介して、利用者により入力された文字列であってもよい。
また、編集例2として、テキスト編集部108は、テキストを削除するための削除指示情報が利用者により入力された場合には、テキスト特定部106により特定された選択テキストをテキスト列から削除することが可能である。
また、編集例3として、例えばテキスト列の言語が英語であり、かつ、単語を原形に変換するための変換指示情報が利用者により入力された場合には、テキスト編集部108は、テキスト特定部106により特定された選択テキストを、当該選択テキストが単純化されたテキストに置換することが可能である。ここで、選択テキストの単純化とは、例えば、選択テキストが動詞である場合には、選択テキストを例えば過去形や過去分詞形から、現在形に変換することである。また、選択テキストが名詞である場合には、選択テキストを複数形から単数形に変換することである。
表示制御部110は、各種表示画像や、利用者により入力されたテキスト列などを表示画面40に表示させる。例えば、図15に示したように、カーソルがテキスト列の末尾に位置し、かつ、例えば決定操作などの所定の操作がなされた場合には、表示制御部110は、記号選択画像を表示画面40に表示させる。なお、記号選択画像は、本開示における選択画像の一例であり、1以上の記号を利用者が選ぶための画像である。
テキスト追加部112は、利用者の入力操作に基づいて、テキスト列の末尾に第2のテキスト列を追加する。ここで、第2のテキスト列は、例えば、表示画面40に表示された記号選択画像において利用者により選択された記号である。または、第2のテキスト列は、音声認識部102により認識されたテキストデータであったり、キーボードやソフトウェアキーボードなどを介して入力された文字列であってもよい。
I get there」というテキスト列が利用者により音声入力され、そして、表示画面40に表示されたテキスト列の末尾に追加される例を示している。
通信部120は、例えば無線通信により、情報処理装置10と通信可能な各種装置との間で情報を送受信する。例えば、通信部120は、利用者により入力されたカーソルの移動方向の指定を示す情報や、音声入力部202に対して入力された音声データなどをコントローラー20から受信する。
以上、第1の実施形態による構成について説明した。続いて、第1の実施形態による動作について説明する。ここでは、「動作例1」および「動作例2」の2つの動作例について説明する。なお、「動作例1」、「動作例2」ともに、利用者が音声認識によりテキストを入力し、そして、認識されたテキストを修正する場面における動作の例である。
‐全体的な動作‐
最初に、動作例1について説明する。図17は、動作例1による全体的な動作を示したフローチャートである。図17に示したように、まず、利用者は、コントローラー20の音声入力キー216を押下する(S101)。
次に、図18を参照して、S107における「選択・修正処理」の動作について詳細に説明する。図18に示したように、まず、情報処理装置10の表示制御部110は、利用者により入力されたカーソルの移動方向の指定に基づいて、選択候補テキスト1個分だけカーソルを移動させる(S111)。
次に、図19を参照して、S124における「削除・変形処理」の動作について詳細に説明する。図19に示したように、まず、情報処理装置10の表示制御部110は、機能選択画像を表示画面40に表示させる(S131)。
‐全体的な動作‐
次に、動作例2について説明する。図20は、動作例2による全体的な動作の一部を示したフローチャートである。なお、図20に示したS201〜S204の動作は、動作例1におけるS101〜S104の動作と同様である。従って、ここでは説明を省略する。
次に、図22を参照して、S208における「変形・追加処理」の動作について詳細に説明する。図22に示したように、まず、情報処理装置10の制御部100は、カーソルがテキスト列の文末に位置しているか否かを判断する(S221)。カーソルがテキスト列の文末に位置している場合には(S221:Yes)、情報処理装置10は、S222〜S224の動作を行う。なお、S222〜S224の動作は、動作例1におけるS121〜S123の動作と同様である。
次に、図23を参照して、S214における「修正・追加処理」の動作について詳細に説明する。なお、図23に示したS231〜S235の動作は、動作例1におけるS114〜S118の動作と同様である。従って、ここでは説明を省略する。
以上、例えば図8、図17〜図23等を参照して説明したように、第1の実施形態による情報処理装置10は、まず、入力されたテキスト列を複数の選択候補テキストに区分する。そして、情報処理装置10は、表示画面におけるカーソルを移動させるための利用者による移動方向の入力操作に基づいて、区分された複数の選択候補テキストのうち、利用者の選択対象である選択候補テキストを特定する。そして、情報処理装置10は、特定された選択候補テキストを、利用者により入力される入力情報に基づいて編集する。このため、入力されたテキスト列を利用者が容易に編集することができる。
以上、第1の実施形態について説明した。上述したように、第1の実施形態では、利用者は、コントローラー20の操作により、例えばカーソルの移動方向の指定や、各種編集内容の決定などの入力を行うことができる。後述するように、第2の実施形態によれば、利用者は、コントローラー20を用いることなく、これらの入力をハンドフリーで行うことができる。
まず、第2の実施形態による情報処理システムの基本構成について図24を参照して説明する。図24に示したように、第2の実施形態による情報処理システムは、テレビジョン受像機60、およびカメラ70を含む。
テレビジョン受像機60は、本開示における情報処理装置の一例である。テレビジョン受像機60は、表示画面40を表示することが可能な装置である。また、テレビジョン受像機60は、第1の実施形態による情報処理装置10と同様に、テキストを編集するためのソフトウェアを実装することが可能である。また、テレビジョン受像機60は、テレビジョン受像機60に備えられた入力装置160により音声を集音し、そして、集音された音声を認識する機能を有することが可能である。
カメラ70は、外部の映像を、レンズを通して例えばCCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide
Semiconductor)などの撮像素子に結像させ、静止画像又は動画像を撮影する機能を有する。例えば、カメラ70は、レンズの前方に位置する利用者や物体の画像を撮影する。
以上、第2の実施形態による情報処理システムの基本構成について説明した。続いて、第2の実施形態によるテレビジョン受像機60の構成について詳細に説明する。図25は、テレビジョン受像機60の構成を示した機能ブロック図である。図25に示したように、テレビジョン受像機60は、制御部100、通信部120、音声入出力部122、および表示部124を有する。なお、音声認識部102、テキスト区分部104、テキスト編集部108、表示制御部110、およびテキスト追加部112の機能は、それぞれ第1の実施形態と概略同様である。
第2の実施形態による制御部100は、第1の実施形態と比較して、新たに視線方向特定部114、および目視位置算出部116を有する。なお、制御部100のその他の機能については、第1の実施形態と概略同様である。
第2の実施形態によるテキスト特定部106は、後述する視線方向特定部114により特定される利用者の視線方向の移動に基づいて、テキスト区分部104により区分された複数の選択候補テキストから選択テキストを特定する。例えば、テキスト特定部106は、後述する目視位置算出部116により算出される、表示画面40における利用者の目視位置に位置する選択候補テキストを選択テキストとして特定する。
‐A.利用者の目の位置の特定‐
視線方向特定部114は、カメラ70による撮影画像に基づいて、利用者の目の位置を特定することが可能である。例えば、視線方向特定部114は、まず、カメラ70による撮影画像から、例えば目、鼻、または顔の輪郭などの特徴点を抽出することにより、利用者の顔を検出する。そして、視線方向特定部114は、例えば検出された利用者の目と目の間の距離、または利用者の顔の大きさなどに基づいて、カメラ70から利用者の目までの相対的な位置を算出する。
さらに、視線方向特定部114は、カメラ70による撮影画像に基づいて、利用者の視線方向を特定することが可能である。例えば、視線方向特定部114は、カメラ70による撮影画像から検出された利用者の目の画像に対してパターンマッチングを行うことにより、利用者の視線方向を特定する。
目視位置算出部116は、視線方向特定部114により特定された利用者の目の位置、および利用者の視線方向に基づいて、表示画面40における利用者の目視位置を算出する。ここで、目視位置は、例えば図26に示した座標(a,b)の点の位置のように、利用者が表示画面40において見ている位置、または見ている位置の近傍の領域である。
第2の実施形態による通信部120は、テレビジョン受像機60と通信可能な各種装置との間で情報を送受信する。例えば、通信部120は、カメラ70により撮像された画像をカメラ70から受信する。
音声入出力部122は、マイクロフォンなどの音声入力装置、およびスピーカーなどの音声出力装置から構成される。音声入出力部122は、例えば、外部の音声を集音したり、または、テレビジョン受像機60により生成される音声データを音声に変換して出力する。
表示部124は、表示制御部110による制御に基づいて、例えば利用者により入力されたテキスト列を表示画面40に表示する。
以上、第2の実施形態による構成について説明した。続いて、第2の実施形態による動作について説明する。なお、ここでは一例として、第1の実施形態による「動作例2」に対応する動作例について説明する。また、以下の説明では、マイクロフォンの形が描かれたアイコンである「マイクアイコン」が、表示画面40における例えば左下部などの所定の位置に表示されている例を想定する。
利用者の目視位置が所定の距離以上、上に移動された場合には(S309:Yes)、テレビジョン受像機60は、第1の実施形態におけるS208と概略同様な、「変形・追加処理」の動作を行う(S310)。そして、テレビジョン受像機60は、再びS306の動作を行う。
一方、利用者による選択位置を見つめる動作が所定時間以上続いた場合には(S311:Yes)、制御部100は、選択位置が文末であるか否かを判断する(S312)。選択位置が文末である場合には(S312:Yes)、テキスト編集部108は、利用者により入力されたテキスト列を確定する(S313)。そして、情報処理装置10は、処理を終了する。
一方、表示画面40に表示されたマイクアイコンを見つめる動作が所定時間以上続いた場合には(S315:Yes)、テレビジョン受像機60は、第1の実施形態におけるS214と概略同様な、「修正・追加処理」の動作を行う(S316)。そして、テレビジョン受像機60は、再びS306の動作を行う。
以上、例えば図25、図27、図28等を参照して説明したように、第2の実施形態によるテレビジョン受像機60は、入力されたテキスト列から区分された複数の選択候補テキストのうち、利用者の視線方向の移動に基づいて、利用者の選択対象である選択候補テキストを特定する。そして、テレビジョン受像機60は、特定された選択候補テキストを、利用者の視線の移動または利用者の音声に基づいて編集する。このため、利用者は、コントローラー20を用いることなく、テキストの選択および編集を全てハンドフリーで行うことができる。また、例えばコントローラー20を持ち続ける必要がないので、テキスト編集時における利用者の作業負荷がより小さい。
なお、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示はかかる例に限定されない。本開示の属する技術の分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
(1)
入力されたテキスト列を複数の第1のテキストに区分するテキスト区分部と、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第1のテキストのうち前記利用者の選択対象である第1のテキストを特定するテキスト特定部と、
特定された第1のテキストを、前記利用者により入力される入力情報に基づいて編集するテキスト編集部と、
を備える、情報処理装置。
(2)
前記利用者により入力される入力情報は、前記利用者により入力される第2のテキストを含み、
前記テキスト編集部は、前記利用者により前記第2のテキストが入力された場合には、前記テキスト特定部により特定された第1のテキストを、前記テキスト列において前記第2のテキストに置換する、前記(1)に記載の情報処理装置。
(3)
前記第2のテキストは、前記利用者により発せられた音声が音声認識されることにより特定されるテキストを含む、前記(2)に記載の情報処理装置。
(4)
前記利用者により入力される入力情報は、テキストを削除するための削除指示情報を含み、
前記テキスト編集部は、前記利用者により前記削除指示情報が入力された場合には、前記テキスト特定部により特定された第1のテキストを前記テキスト列から削除する、前記(1)〜(3)のいずれか一項に記載の情報処理装置。
(5)
前記利用者により入力される入力情報は、単語を原形に変換するための変換指示情報を含み、
前記テキスト編集部は、前記利用者により前記変換指示情報が入力された場合には、前記テキスト特定部により特定された第1のテキストを、前記第1のテキストが原形に変換されたテキストに置換する、前記(1)〜(4)のいずれか一項に記載の情報処理装置。
(6)
前記利用者により入力される入力情報は、漢字をひらがなに変換するための変換指示情報を含み、
前記テキスト編集部は、前記利用者により前記変換指示情報が入力された場合には、前記テキスト特定部により特定された第1のテキストを、前記第1のテキストがひらがなに変換されたテキストに置換する、前記(1)〜(4)のいずれか一項に記載の情報処理装置。
(7)
前記入力されたテキスト列は、前記利用者により発せられた音声が音声認識されることにより特定されたテキスト列を含む、前記(1)〜(6)のいずれか一項に記載の情報処理装置。
(8)
前記情報処理装置は、前記指示位置が前記テキスト列の末尾に位置し、かつ、所定の操作がなされた場合に、前記テキスト列の末尾に第2のテキスト列を追加するテキスト追加部をさらに備える、前記(1)〜(6)のいずれか一項に記載の情報処理装置。
(9)
前記情報処理装置は、前記所定の操作がなされた場合に、前記利用者が1以上の記号を選ぶための選択画像を前記表示画面に表示させる表示制御部をさらに備え、
前記テキスト追加部は、前記選択画像において前記利用者により選択された1以上の記号を前記第2のテキスト列として、前記テキスト列の末尾に追加する、前記(8)に記載の情報処理装置。
(10)
前記テキスト追加部は、前記利用者により発せられた音声が音声認識されることにより特定されたテキスト列を前記第2のテキスト列として、前記テキスト列の末尾に追加する、前記(8)に記載の情報処理装置。
(11)
前記テキスト区分部は、前記テキスト列の文脈に基づいて前記テキスト列を複数の第1のテキストに区分する、前記(1)〜(10)のいずれか一項に記載の情報処理装置。
(12)
前記第1のテキストは、1以上の単語を含む、前記(1)〜(11)のいずれか一項に記載の情報処理装置。
(13)
前記利用者による移動方向の入力操作は、前記利用者による、前記表示画面において前記指示位置を移動させるための方向キーの選択操作を含む、前記(1)〜(12)のいずれか一項に記載の情報処理装置。
(14)
前記情報処理装置は、前記利用者の視線方向を特定する視線方向特定部をさらに備え、
前記利用者による移動方向の入力操作は、前記利用者による視線方向の移動を含む、前記(1)〜(13)のいずれか一項に記載の情報処理装置。
(15)
入力されたテキスト列を複数の第1のテキストに区分することと、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第1のテキストのうち前記利用者の選択対象である第1のテキストを特定することと、
特定された第1のテキストを、前記利用者により入力される入力情報に基づいてプロセッサにより編集することと、
を備える、情報処理方法。
(16)
コンピュータを、
入力されたテキスト列を複数の第1のテキストに区分するテキスト区分部と、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第1のテキストのうち前記利用者の選択対象である第1のテキストを特定するテキスト特定部と、
特定された第1のテキストを、前記利用者により入力される入力情報に基づいて編集するテキスト編集部、
として機能させるための、プログラム。
20 コントローラー
30 表示装置
60 テレビジョン受像機
70 カメラ
100 制御部
102 音声認識部
104 テキスト区分部
106 テキスト特定部
108 テキスト編集部
110 表示制御部
112 テキスト追加部
114 視線方向特定部
116 目視位置算出部
120 通信部
122 音声入出力部
124 表示部
150 CPU
152 ROM
154 RAM
156 内部バス
158 インターフェース
160 入力装置
162 出力装置
164 ストレージ装置
166 通信装置
200 通信部
202 マイクロフォン
202 音声入力部
210 操作部
212 方向キー
214 決定キー
216 音声入力キー
220 回転キー
Claims (16)
- 入力されたテキスト列を複数の第1のテキストに区分するテキスト区分部と、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第1のテキストのうち前記利用者の選択対象である第1のテキストを特定するテキスト特定部と、
特定された第1のテキストを、前記利用者により入力される入力情報に基づいて編集するテキスト編集部と、
を備える、情報処理装置。 - 前記利用者により入力される入力情報は、前記利用者により入力される第2のテキストを含み、
前記テキスト編集部は、前記利用者により前記第2のテキストが入力された場合には、前記テキスト特定部により特定された第1のテキストを、前記テキスト列において前記第2のテキストに置換する、請求項1に記載の情報処理装置。 - 前記第2のテキストは、前記利用者により発せられた音声が音声認識されることにより特定されるテキストを含む、請求項2に記載の情報処理装置。
- 前記利用者により入力される入力情報は、テキストを削除するための削除指示情報を含み、
前記テキスト編集部は、前記利用者により前記削除指示情報が入力された場合には、前記テキスト特定部により特定された第1のテキストを前記テキスト列から削除する、請求項1に記載の情報処理装置。 - 前記利用者により入力される入力情報は、単語を原形に変換するための変換指示情報を含み、
前記テキスト編集部は、前記利用者により前記変換指示情報が入力された場合には、前記テキスト特定部により特定された第1のテキストを、前記第1のテキストが原形に変換されたテキストに置換する、請求項1に記載の情報処理装置。 - 前記利用者により入力される入力情報は、漢字をひらがなに変換するための変換指示情報を含み、
前記テキスト編集部は、前記利用者により前記変換指示情報が入力された場合には、前記テキスト特定部により特定された第1のテキストを、前記第1のテキストがひらがなに変換されたテキストに置換する、請求項1に記載の情報処理装置。 - 前記入力されたテキスト列は、前記利用者により発せられた音声が音声認識されることにより特定されたテキスト列を含む、請求項1に記載の情報処理装置。
- 前記情報処理装置は、前記指示位置が前記テキスト列の末尾に位置し、かつ、所定の操作がなされた場合に、前記テキスト列の末尾に第2のテキスト列を追加するテキスト追加部をさらに備える、請求項1に記載の情報処理装置。
- 前記情報処理装置は、前記所定の操作がなされた場合に、前記利用者が1以上の記号を選ぶための選択画像を前記表示画面に表示させる表示制御部をさらに備え、
前記テキスト追加部は、前記選択画像において前記利用者により選択された1以上の記号を前記第2のテキスト列として、前記テキスト列の末尾に追加する、請求項8に記載の情報処理装置。 - 前記テキスト追加部は、前記利用者により発せられた音声が音声認識されることにより特定されたテキスト列を前記第2のテキスト列として、前記テキスト列の末尾に追加する、請求項8に記載の情報処理装置。
- 前記テキスト区分部は、前記テキスト列の文脈に基づいて前記テキスト列を複数の第1のテキストに区分する、請求項1に記載の情報処理装置。
- 前記第1のテキストは、1以上の単語を含む、請求項1に記載の情報処理装置。
- 前記利用者による移動方向の入力操作は、前記利用者による、前記表示画面において前記指示位置を移動させるための方向キーの選択操作を含む、請求項1に記載の情報処理装置。
- 前記情報処理装置は、前記利用者の視線方向を特定する視線方向特定部をさらに備え、
前記利用者による移動方向の入力操作は、前記利用者による視線方向の移動を含む、請求項1に記載の情報処理装置。 - 入力されたテキスト列を複数の第1のテキストに区分することと、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第1のテキストのうち前記利用者の選択対象である第1のテキストを特定することと、
特定された第1のテキストを、前記利用者により入力される入力情報に基づいてプロセッサにより編集することと、
を備える、情報処理方法。 - コンピュータを、
入力されたテキスト列を複数の第1のテキストに区分するテキスト区分部と、
前記テキスト列が表示されている表示画面における指示位置を移動させるための利用者による移動方向の入力操作に基づいて、区分された前記複数の第1のテキストのうち前記利用者の選択対象である第1のテキストを特定するテキスト特定部と、
特定された第1のテキストを、前記利用者により入力される入力情報に基づいて編集するテキスト編集部、
として機能させるための、プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013221125 | 2013-10-24 | ||
JP2013221125 | 2013-10-24 | ||
PCT/JP2014/070510 WO2015059976A1 (ja) | 2013-10-24 | 2014-08-04 | 情報処理装置、情報処理方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2015059976A1 true JPWO2015059976A1 (ja) | 2017-03-09 |
Family
ID=52992587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015543736A Pending JPWO2015059976A1 (ja) | 2013-10-24 | 2014-08-04 | 情報処理装置、情報処理方法、及びプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20160210276A1 (ja) |
EP (1) | EP3062237A4 (ja) |
JP (1) | JPWO2015059976A1 (ja) |
CN (1) | CN105518657B (ja) |
WO (1) | WO2015059976A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11657579B2 (en) | 2016-03-31 | 2023-05-23 | Magic Leap, Inc. | Interactions with 3D virtual objects using poses and multiple-DOF controllers |
US11960636B2 (en) | 2017-04-19 | 2024-04-16 | Magic Leap, Inc. | Multimodal task execution and text editing for a wearable system |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6374854B2 (ja) * | 2015-11-10 | 2018-08-15 | 株式会社オプティム | 画面共有システム及び画面共有方法 |
CN106933561A (zh) * | 2015-12-31 | 2017-07-07 | 北京搜狗科技发展有限公司 | 语音输入方法和终端设备 |
JP6772636B2 (ja) * | 2016-07-29 | 2020-10-21 | セイコーエプソン株式会社 | 情報処理装置、情報処理装置の制御方法、及び、制御プログラム |
JPWO2018043139A1 (ja) * | 2016-08-31 | 2019-06-24 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
US11183189B2 (en) | 2016-12-22 | 2021-11-23 | Sony Corporation | Information processing apparatus and information processing method for controlling display of a user interface to indicate a state of recognition |
JP6942995B2 (ja) * | 2017-03-31 | 2021-09-29 | ブラザー工業株式会社 | 情報処理プログラム、情報処理装置、および情報処理装置の制御方法 |
CN107203505A (zh) * | 2017-05-26 | 2017-09-26 | 北京小米移动软件有限公司 | 文本信息编辑方法及装置 |
JP7023743B2 (ja) * | 2018-02-28 | 2022-02-22 | シャープ株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US11900931B2 (en) | 2018-11-20 | 2024-02-13 | Sony Group Corporation | Information processing apparatus and information processing method |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58115526A (ja) * | 1981-12-29 | 1983-07-09 | Sharp Corp | 仮名漢字変換装置 |
JPH0447358A (ja) * | 1990-06-01 | 1992-02-17 | Nippon Telegr & Teleph Corp <Ntt> | 文章等の編集方法 |
JPH05298315A (ja) * | 1992-04-24 | 1993-11-12 | Toshiba Corp | 情報処理装置 |
JPH07160719A (ja) * | 1993-12-13 | 1995-06-23 | Matsushita Electric Ind Co Ltd | 電子辞書引き装置 |
JPH07191796A (ja) * | 1993-12-27 | 1995-07-28 | Canon Inc | 視線入力システム |
JPH0844737A (ja) * | 1994-08-01 | 1996-02-16 | Nec Corp | 文書編集装置 |
JPH09305343A (ja) * | 1996-05-13 | 1997-11-28 | Hitachi Ltd | 対象範囲指定方法 |
JPH10133684A (ja) * | 1996-10-31 | 1998-05-22 | Microsoft Corp | 音声認識中に代替ワードを選択する方法及びシステム |
JP2005149452A (ja) * | 2003-11-14 | 2005-06-09 | Toshiyuki Amino | 文字入力方法 |
US20050273713A1 (en) * | 2002-05-13 | 2005-12-08 | Microsoft Corporation | Correction widget |
JP2010002830A (ja) * | 2008-06-23 | 2010-01-07 | Sharp Corp | 音声認識装置 |
US20100131900A1 (en) * | 2008-11-25 | 2010-05-27 | Spetalnick Jeffrey R | Methods and Systems for Improved Data Input, Compression, Recognition, Correction, and Translation through Frequency-Based Language Analysis |
JP2011138343A (ja) * | 2009-12-28 | 2011-07-14 | Denso Corp | 電子機器及びプログラム |
WO2012161686A2 (en) * | 2011-05-23 | 2012-11-29 | Nuance Communications Inc. | Text browsing, editing and correction methods for automotive applications |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4914704A (en) * | 1984-10-30 | 1990-04-03 | International Business Machines Corporation | Text editor for speech input |
US5666139A (en) * | 1992-10-15 | 1997-09-09 | Advanced Pen Technologies, Inc. | Pen-based computer copy editing apparatus and method for manuscripts |
US5778404A (en) * | 1995-08-07 | 1998-07-07 | Apple Computer, Inc. | String inserter for pen-based computer systems and method for providing same |
US5682439A (en) * | 1995-08-07 | 1997-10-28 | Apple Computer, Inc. | Boxed input correction system and method for pen based computer systems |
US6356886B1 (en) * | 1995-11-30 | 2002-03-12 | Electronic Data Systems Corporation | Apparatus and method for communicating with a knowledge base |
US6396482B1 (en) * | 1998-06-26 | 2002-05-28 | Research In Motion Limited | Hand-held electronic device with a keyboard optimized for use with the thumbs |
US6356866B1 (en) * | 1998-10-07 | 2002-03-12 | Microsoft Corporation | Method for converting a phonetic character string into the text of an Asian language |
US7580838B2 (en) * | 2002-11-22 | 2009-08-25 | Scansoft, Inc. | Automatic insertion of non-verbalized punctuation |
US7921374B2 (en) * | 2004-07-08 | 2011-04-05 | Research In Motion Limited | Adding interrogative punctuation to an electronic message |
US20060064652A1 (en) * | 2004-09-20 | 2006-03-23 | Nokia Corporation | Input of punctuation marks |
US8117540B2 (en) * | 2005-05-18 | 2012-02-14 | Neuer Wall Treuhand Gmbh | Method and device incorporating improved text input mechanism |
US7429108B2 (en) * | 2005-11-05 | 2008-09-30 | Outland Research, Llc | Gaze-responsive interface to enhance on-screen user reading tasks |
US20080270895A1 (en) * | 2007-04-26 | 2008-10-30 | Nokia Corporation | Method, computer program, user interface, and apparatus for predictive text input |
JP4503069B2 (ja) * | 2007-12-27 | 2010-07-14 | シャープ株式会社 | 文字入力装置、システム、及び文字入力制御方法 |
US9223590B2 (en) * | 2010-01-06 | 2015-12-29 | Apple Inc. | System and method for issuing commands to applications based on contextual information |
US20120146955A1 (en) * | 2010-12-10 | 2012-06-14 | Research In Motion Limited | Systems and methods for input into a portable electronic device |
JP5841538B2 (ja) * | 2011-02-04 | 2016-01-13 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 関心度推定装置および関心度推定方法 |
US9236045B2 (en) * | 2011-05-23 | 2016-01-12 | Nuance Communications, Inc. | Methods and apparatus for proofing of a text input |
US8640026B2 (en) * | 2011-07-11 | 2014-01-28 | International Business Machines Corporation | Word correction in a multi-touch environment |
US20130212515A1 (en) * | 2012-02-13 | 2013-08-15 | Syntellia, Inc. | User interface for text input |
CA2847975A1 (en) * | 2011-09-07 | 2013-03-14 | Tandemlaunch Technologies Inc. | System and method for using eye gaze information to enhance interactions |
US8290772B1 (en) * | 2011-10-03 | 2012-10-16 | Google Inc. | Interactive text editing |
US20130159919A1 (en) * | 2011-12-19 | 2013-06-20 | Gabriel Leydon | Systems and Methods for Identifying and Suggesting Emoticons |
CN106774982B (zh) * | 2012-06-04 | 2020-06-09 | 华为终端有限公司 | 一种提示字符输入的方法和电子设备 |
CN103885743A (zh) * | 2012-12-24 | 2014-06-25 | 大陆汽车投资(上海)有限公司 | 结合注视跟踪技术的语音文本输入方法和*** |
JP6155821B2 (ja) * | 2013-05-08 | 2017-07-05 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US8943405B1 (en) * | 2013-11-27 | 2015-01-27 | Google Inc. | Assisted punctuation of character strings |
EP3193261B1 (en) * | 2014-03-18 | 2020-11-04 | smartwork solutions GmbH | Method and system for editing virtual documents |
US20180342248A1 (en) * | 2017-05-23 | 2018-11-29 | Ronen Rabinovici | Integrated speech recognition text input with manual punctuation |
-
2014
- 2014-08-04 US US14/913,655 patent/US20160210276A1/en not_active Abandoned
- 2014-08-04 EP EP14856022.0A patent/EP3062237A4/en not_active Ceased
- 2014-08-04 WO PCT/JP2014/070510 patent/WO2015059976A1/ja active Application Filing
- 2014-08-04 JP JP2015543736A patent/JPWO2015059976A1/ja active Pending
- 2014-08-04 CN CN201480046509.8A patent/CN105518657B/zh not_active Expired - Fee Related
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58115526A (ja) * | 1981-12-29 | 1983-07-09 | Sharp Corp | 仮名漢字変換装置 |
JPH0447358A (ja) * | 1990-06-01 | 1992-02-17 | Nippon Telegr & Teleph Corp <Ntt> | 文章等の編集方法 |
JPH05298315A (ja) * | 1992-04-24 | 1993-11-12 | Toshiba Corp | 情報処理装置 |
JPH07160719A (ja) * | 1993-12-13 | 1995-06-23 | Matsushita Electric Ind Co Ltd | 電子辞書引き装置 |
JPH07191796A (ja) * | 1993-12-27 | 1995-07-28 | Canon Inc | 視線入力システム |
JPH0844737A (ja) * | 1994-08-01 | 1996-02-16 | Nec Corp | 文書編集装置 |
JPH09305343A (ja) * | 1996-05-13 | 1997-11-28 | Hitachi Ltd | 対象範囲指定方法 |
JPH10133684A (ja) * | 1996-10-31 | 1998-05-22 | Microsoft Corp | 音声認識中に代替ワードを選択する方法及びシステム |
US20050273713A1 (en) * | 2002-05-13 | 2005-12-08 | Microsoft Corporation | Correction widget |
JP2005149452A (ja) * | 2003-11-14 | 2005-06-09 | Toshiyuki Amino | 文字入力方法 |
JP2010002830A (ja) * | 2008-06-23 | 2010-01-07 | Sharp Corp | 音声認識装置 |
US20100131900A1 (en) * | 2008-11-25 | 2010-05-27 | Spetalnick Jeffrey R | Methods and Systems for Improved Data Input, Compression, Recognition, Correction, and Translation through Frequency-Based Language Analysis |
JP2011138343A (ja) * | 2009-12-28 | 2011-07-14 | Denso Corp | 電子機器及びプログラム |
WO2012161686A2 (en) * | 2011-05-23 | 2012-11-29 | Nuance Communications Inc. | Text browsing, editing and correction methods for automotive applications |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11657579B2 (en) | 2016-03-31 | 2023-05-23 | Magic Leap, Inc. | Interactions with 3D virtual objects using poses and multiple-DOF controllers |
US11960636B2 (en) | 2017-04-19 | 2024-04-16 | Magic Leap, Inc. | Multimodal task execution and text editing for a wearable system |
Also Published As
Publication number | Publication date |
---|---|
WO2015059976A1 (ja) | 2015-04-30 |
CN105518657B (zh) | 2019-09-24 |
CN105518657A (zh) | 2016-04-20 |
EP3062237A4 (en) | 2017-06-28 |
US20160210276A1 (en) | 2016-07-21 |
EP3062237A1 (en) | 2016-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2015059976A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP6903808B2 (ja) | リアルタイム手書き認識の管理 | |
US11182069B2 (en) | Managing real-time handwriting recognition | |
US20140363074A1 (en) | Multi-script handwriting recognition using a universal recognizer | |
KR20160099497A (ko) | 핸드라이팅 인식 방법 및 장치 | |
CN104090652A (zh) | 一种语音输入方法和装置 | |
TW201516887A (zh) | 針對自動手寫辨識將筆劃分佈資訊整合到空間特徵擷取 | |
CN109002183B (zh) | 一种信息输入的方法及装置 | |
KR20090068380A (ko) | 개선된 이동 통신 단말 | |
US11900931B2 (en) | Information processing apparatus and information processing method | |
CN110858291A (zh) | 字符切分方法及装置 | |
CN112329563A (zh) | 一种基于树莓派的智能阅读辅助方法及*** | |
CN112261321B (zh) | 字幕处理方法、装置及电子设备 | |
JP7468360B2 (ja) | 情報処理装置および情報処理方法 | |
Sheth et al. | American Sign Language Recognition and Generation: A CNN-based Approach | |
CN114124864A (zh) | 消息处理方法、装置 | |
CN118072397A (zh) | 一种移动设备上的实时手语翻译*** | |
KR20200089253A (ko) | 도킹 장치와 상호 작용하는 모바일 장치 및 그 제어 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170606 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180814 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181005 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190208 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20190214 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190402 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20190410 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190522 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190530 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20191029 |