JP6221275B2 - 文字入力用のプログラムおよび文字入力装置 - Google Patents

文字入力用のプログラムおよび文字入力装置 Download PDF

Info

Publication number
JP6221275B2
JP6221275B2 JP2013053273A JP2013053273A JP6221275B2 JP 6221275 B2 JP6221275 B2 JP 6221275B2 JP 2013053273 A JP2013053273 A JP 2013053273A JP 2013053273 A JP2013053273 A JP 2013053273A JP 6221275 B2 JP6221275 B2 JP 6221275B2
Authority
JP
Japan
Prior art keywords
character string
input
attribute information
candidate
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013053273A
Other languages
English (en)
Other versions
JP2014178953A (ja
Inventor
昌治 上田
昌治 上田
ちほか 三原
ちほか 三原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2013053273A priority Critical patent/JP6221275B2/ja
Publication of JP2014178953A publication Critical patent/JP2014178953A/ja
Application granted granted Critical
Publication of JP6221275B2 publication Critical patent/JP6221275B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、操作部および表示部が接続されたコンピュータを、操作部から入力された読み文字列を所定の表記文字列に変換して、変換後の文字列をコンピュータで起動中のアプリケーションへの入力文字列として確定する文字入力システムとして機能させるためのプログラム、およびこのプログラムが適用された文字入力装置に関する。
携帯電話などの小型の情報端末装置に組み込まれる日本語入力システムには、変換操作に応じて読み文字列を表記文字列に変換する機能のほか、キー操作に応じて読み文字列が変更される都度、その時点での読み文字列に前方一致する候補の文字列を抽出する機能(以下、「予測変換機能」という。)や、文字列の確定に応じてその確定文字列に続いて入力される可能性がある文字列を予測して表示する機能(以下、「繋がり予測機能」という。)などが設けられている。
繋がり予測機能に関して、特許文献1には、繋がり元の文字列(特許文献1では「予測元文字列」)と繋がり先の文字列(特許文献1では「繋がり予測語」)とを対応づけた予測辞書を直前に確定された語により検索して、確定された語を予測元文字列とする繋がり予測語を候補として抽出することが記載されている。
また予測変換に関して、特許文献2には、入力状況に適した属性を表す複数種の属性がそれぞれ所定数の辞書データに対応づけられた構成の変換用辞書を設定し、読み文字の入力が開始された時点や候補が確定された時点での入力状況を判別すると共に、上記の変換用辞書から候補を抽出して表示する際に、判別されている入力状況が対応づけられている候補が上位に表示されるように優先度を嵩上げすることが記載されている。
特開2009−146201号公報 特開2009−276818号公報
従来の繋がり予測処理では、繋がり元の文字列と繋がり先の文字列との組み合わせが登録された辞書を対象にした検索により、直前に確定された文字列に対する繋がり先の文字列を抽出する。しかしながら、ユーザが目的とする候補が呼び出される確率は高いとは言えない。特に、「が」「の」「を」などの格助詞は、様々な語句と結びつけて使用されるため、各種語句に共通する繋がり元の語句を登録する程度のことしかできず、ユーザが目的とする語句が呼び出される可能性を高めるのは困難である。
特許文献1に記載された発明では、名詞と格助詞との組み合わせを繋がり元の文字列として繋がり先の文字列を対応づけた構成の辞書が設定されており、このような構成の辞書によれば、上記の問題を解決できるようにも思われる。しかし、実際に目的とする語句が呼び出される確度を高めるには、多数の名詞と格助詞との組み合わせに対してそれぞれ繋がり先文字列を登録しなければならない。そうなると、辞書ファイルの容量が膨大になり、現実的ではない。
たとえば、特許文献1の図3には、「服の」という語句に対して「色」「値段」「価格」という繋がり予測語を対応づけているが、「服」の下位概念にあたる語句(「セーター」「シャツ」など)についても、同様の繋がり予測語を対応づける必要がある。また、「色」「値段」「価格」というような語句は、「服」の分野に限らず、様々な物品に対して使用されるから、それらの物品を表す多数の名詞にも同様の繋がり予測語を対応づける必要がある。
また、予測変換や仮名漢字変換においても、一般に、辞書部に保存されている各語句の優先度や過去の入力履歴に基づき候補の表示順序が決定されるため、ユーザが意図する語句が呼び出されずに文字入力に手間がかかる場合がある。
本発明は上記の問題に着目してなされたもので、ユーザが意図する語句が候補として呼び出される可能性を高めることを第1の課題とする。
さらに本発明は、繋がり予測処理のために、前後に連ねて使用される可能性がある語句の組み合わせに両者の繋がり関係を示す情報を紐付けておく場合に、辞書部のデータ容量を増大させることなく、候補の抽出の確度を高めることを第2の課題とする。
本発明によるプログラムにより構成される文字入力システムには、複数の語句毎の読み文字列と表記文字列との組み合わせが登録された辞書部と、操作部から読み文字列の入力を受け付ける読み文字列入力手段と、入力された読み文字列または確定された文字列により辞書部を検索して所定数の表記文字列を入力候補として抽出する候補抽出手段と、候補抽出手段により抽出された入力候補の文字列を表示部に表示する候補表示手段と、操作部における候補の選択操作に応じて選択された候補の文字列を起動中のアプリケーションへの入力文字列として確定する確定手段とを具備する。
このプログラムにより設定された辞書部には、複数の名詞がそれぞれの上位概念に基づき複数のカテゴリに分類されると共に、分類された各名詞および各カテゴリに関連する各種の語句にそれぞれ分類されたカテゴリまたは関連するカテゴリを示す属性情報が紐付けられて登録される。また、候補抽出手段は、前記属性情報が紐付けられた名詞を含む文字列が入力文字列として設定されたことに応じて当該名詞の属性情報を一時的に保存する属性情報保存手段を具備すると共に、この手段に属性情報が保存されている状態下での辞書部に対する検索において、当該保存されている属性情報に紐付けられている語句を優先して抽出する。
上記構成のとおり、本発明では、各種名詞が上位概念に基づき複数のカテゴリに分類され、それぞれ所属するカテゴリを示す属性情報に紐付けられて辞書部に登録される。また、各カテゴリに関連する各種の語句もそれぞれ関連するカテゴリを示す属性情報に紐付けられて辞書部に登録される。属性情報が紐付けられた名詞を含む文字列が入力文字列として設定されると、その属性情報が属性情報保存手段に保存され、その後の辞書部に対する検索では、保存されている属性情報に紐付けられている語句が優先的に抽出される。
したがって、各カテゴリに関連する語句を十分にピックアップして属性情報を設定しておけば、同じカテゴリに分類されたどの名詞にも、それらに共通する属性情報に基づき同様の関連語を呼び出すことが可能になる。また、繋がり予測のために語句間の繋がり関係を示す情報を辞書部に登録する場合にも、個々の語句の組み合わせ毎に繋がり関係を示す情報を設定する必要がなくなり、辞書部のデータ容量が膨大化するおそれがない。
また、候補の抽出処理においては、属性情報保存手段に属性情報が保存されている間であれば、その保存の元となった名詞を含む文字列に直接に連なる関係にない語句であっても、当該名詞と同じ属性情報が紐付けられている語句が優先して抽出されるので、ユーザが意図する語句が候補として呼び出される可能性が高められる。
上記の文字入力システムでは、辞書部に、前後に連ねて入力される可能性がある語句の間の繋がり関係を示す情報を含め、候補抽出手段に、確定手段により直前に確定された文字列により辞書部を検索してその確定文字列に繋がりを持つ語句の表記文字列を次の入力候補として抽出する繋がり予測処理を実施する機能を設けることができる。この機能を持つ一実施形態の候補抽出手段は、属性情報保存手段に属性情報が保存されている状態下で繋がり予測処理を実施する場合には、前記直前に確定した文字列に繋がりを持つ語句の中の前記履歴情報保存手段に保存されている属性情報に紐付けられている語句の表記文字列を優先して抽出する。
この実施形態によれば、名詞を含む一連のテキストが入力される間にその名詞に直接または間接的に繋がる語句として、当該名詞のカテゴリに関連する語句を上位の候補として呼び出すことが可能になる。
他の実施形態における候補抽出手段は、読み文字列入力手段が複数の文節に対応する長さの読み文字列の入力を受け付けたことに応じて、当該読み文字列を文節毎に区切って辞書部を検索し、各文節に対して抽出した表記文字列を連ねた文字列を変換候補に設定する連文節変換機能を具備する。さらに、この連文節変換機能を実行する前記候補抽出手段は、読み文字列内のいずれかの文節に対する検索により属性情報に紐付けられた名詞を含む表記文字列が候補として抽出されたときは、その属性情報を前記属性情報保存手段に保存すると共に、当該文節より後の文節に対する検索において前記保存された属性情報に紐付けられている語句を優先して抽出する。
上記の実施形態によれば、属性情報が紐付けられた名詞を含む文字列を対象にした連文節変換において、名詞より後に位置する語句の変換にかかる確度を高めることができる。
上記実施形態の候補抽出手段には、操作部における操作に応じて読み文字列入力手段が入力する読み文字列が変化する都度、その変化後の読み文字列に適合する語句の表記文字列を抽出する第1の変換手段(前出した予測変換に相当する。)と、操作部における変換操作に応じてその時点で入力されている読み文字列に適合する語句を抽出する第2の変換手段(日本語入力では仮名漢字変換に相当する。)とを設けることができる。前出の連文節変換機能は、これら2種類の変換手段の双方に設けることが可能であるが、少なくとも第2の変換手段に当該連文節変換機能を設ければよい。
さらに各実施形態を含む本発明の候補抽出手段には、属性情報保存手段に保存されている属性情報に紐付けられている語句の表記文字列が確定手段により入力文字列として確定されたことに応じて属性情報保存手段に保存されている属性情報を消去する機能を設けることができる。この機能によれば、名詞を含む文字列が入力文字列として設定された後に、その名詞に関連する語句が候補として呼び出され、ユーザに選択されて確定されたことにより、保存されていた属性情報が消去されるので、あるカテゴリに関連する文の入力が終了した後に、別のカテゴリに関する文が入力される場合に、前回のカテゴリに関連する語句が候補として抽出されるのを防ぐことができる。
本発明によるプログラムには、辞書部を構成する全データを含めることができるが、これに限らず、既存の辞書部や候補抽出手段を、本発明が適用された状態に更新するための情報のみを含めてもよい。
本発明によるプログラムが組み込まれたコンピュータは、接続されている操作部および表示部と共に文字入力装置を構成する。この文字入力装置は、スマートフォンを含む携帯電話、タブレット端末などの携帯情報端末装置のほか、ATMやファクシミリ装置など、文字入力の環境が悪い情報処理装置全般に広く適用することができる。
本発明によれば、各種名詞の上位概念に基づき設定された複数のカテゴリ毎に、そのカテゴリに所属または関連する語句に当該カテゴリを示す属性情報を紐付けて辞書部に登録し、名詞を含む文字列が確定されたり、仮名漢字変換処理において仮確定されたことに応じて、以後の辞書部に対する検索において、その名詞のカテゴリに関連する語句が候補として優先して抽出されるようにしたので、ユーザが意図する語句が候補表示画面の上位に呼び出される可能性が大幅に高まり、文字入力の効率を向上させることができる。
また、繋がり予測処理のために、前後に連ねて入力される可能性がある語句の組み合わせに両者の繋がり関係を示す情報を紐付けておく場合にも、同じカテゴリに属する複数の語句に対して共通の情報を紐付けることができるので、辞書部のデータ容量を増大させることなく、繋がり予測処理による候補抽出の確度を高めることができる。
本発明が適用された文字入力装置の機能ブロック図である。 変換用辞書の辞書データの主要構成を示すテーブルである。 つながり予測辞書の辞書データの主要構成を示すテーブルである。 文字入力画面の変遷例を示す説明図である。 文字入力画面の変遷例を示す説明図である。 文字入力画面の変遷例を示す説明図である。 文字入力画面の変遷例を示す説明図である。 文字入力処理の流れを示すフローチャートである。 図8のフローチャート中の繋がり予測処理の詳細手順を示すフローチャートである。 図8のフローチャート中の予測変換処理の詳細手順を示すフローチャートである。 図8のフローチャート中の仮名漢字変換処理の詳細手順を示すフローチャートである。
図1は、本発明が適用された文字入力装置の構成例を示す。
この実施例の文字入力装置100は、スマートフォンに組み込まれて起動中のアプリケーションが管理するファイルへの仮名漢字文字列の入力を行うもので、タッチパネルディスプレイ2と文字入力システム(IME)1とを主要な構成とする。
タッチパネルディスプレイ2は、スマートフォンの筐体3(図4〜図7を参照。)の前面に配備される。文字入力システム1は、筐体3内の図示しない制御部に組み込まれたソフトウェアであって、キーボード処理部11,表示処理部12,読み文字列組立処理部13,候補抽出部14,確定処理部15,変換用辞書16,繋がり予測辞書17,属性メモリ18などが含まれる。
キーボード処理部11は、タッチパネルディスプレイ2に、複数の文字キー21を含むソフトウェアキーボード20(図4〜図7を参照。)を表示して、このキーボード20に対する操作を受け付ける。文字キー21が操作されると、その操作内容はキーボード処理部11から読み文字列組立処理部13に渡されて、読み文字列組立処理部13において操作に応じた読み文字列が組み立てられる。
候補抽出部14は、読み文字列による予測変換機能および仮名漢字変換機能と、確定文字列から次の入力文字列を予測する繋がり予測機能とを具備する。
予測変換では、読み文字列組立処理部13により組み立てられる読み文字列が変化する都度、その変化後の読み文字列に前方一致する語句の表記文字列を変換用辞書16から抽出する。仮名漢字変換では、ソフトウェアキーボード20内の変換キー22(図4〜図7を参照。)が操作されたことに応じて、その時点における読み文字列に適合する語句の表記文字列を変換用辞書16から抽出する。
表示された候補に対する選択操作またはキーボード20の確定キー23の操作が行われると、確定処理部15によって、選択された候補または確定操作の対象文字列が入力文字列として確定される。この確定に応じて候補抽出部14は、確定処理部15により確定された文字列により繋がり予測辞書17を検索して、確定文字列に繋がる関係が設定された語句の表記文字列を抽出する繋がり予測を実施する。
表示処理部12は、システム1の起動に応じてタッチパネルディスプレイ2に文字入力画面を立ち上げ、読み文字列組立処理部13により組み立てられた読み文字列や候補抽出部14により抽出された候補を表示する。また確定処理部14により入力文字列が確定されると、表示処理部12でも、その入力文字列を確定状態で表示する。
変換用辞書16には、予測変換や仮名漢字変換のために、多数の語句毎の読み文字列と表記文字列との組み合わせが登録される。また、繋がり予測辞書17には、前後に連ねて入力される可能性がある2つの語句の組み合わせが多数登録される。
さらに、候補の抽出確度を高めるために、この実施例の変換用辞書16では、複数の名詞がそれぞれの上位概念に基づいて複数のカテゴリに分類されると共に、各カテゴリに関連する名詞以外の各種の語句もそれぞれ関連するカテゴリに分類される。なお、語句によっては、複数のカテゴリに割り振られる場合もある。
変換用辞書16および繋がり予測辞書17は、それぞれ1または複数の辞書ファイルにより構成することができる。また、これらの辞書16,17を1つの辞書に統合した構成の辞書にすることも可能である。
図2は、変換用辞書16の辞書データの構成例を名詞の辞書データに限定して示す。この実施例では、[場所][乗り物][食べ物][飲み物][メディア1][メディア2][衣類]という7種類のカテゴリを設定して、各カテゴリに適した概念の名詞に対し、それぞれそのカテゴリに属することを示す属性情報(具体的にはカテゴリの名称)を設定している。
なお、[メディア1]は映像や音楽などの動的な情報を提供するもので、[メディア2]は印刷物などの静的な情報を提供するものである。
図2に示す変換用辞書16の辞書データには、平仮名による読み文字列と、仮名漢字による表記文字列と、属性情報とが含まれる。名詞以外の品詞についても、図2に示すのと同様の構成の辞書データが設定される。登録される語句の中には、図2の「フランクフルト」や「ネット」のように複数のカテゴリに属する語句がある一方で、いずれのカテゴリーにも所属していないために属性情報が設定されていない語句(主として助詞などの付属語)も存在する。
また、図2には示していないが、属性情報の有無に関わらず、変換用辞書16の辞書データには、品詞情報、システム設計者により設定された優先度、実際の確定状況に応じて候補抽出部14により更新される使用頻度情報などが含まれる。
なお、この実施例の変換用辞書16では、動詞や形容詞などの活用語については終止形のみが登録される。予測変換や仮名漢字変換では、変換用辞書16内の活用語に対しては、読み文字列の語頭が一致したことに応じて終止形を抽出し、必要に応じてその終止形から各種活用形を導き出して候補に加えるようにしている(後述する図7を参照。)。
図3は、繋がり予測辞書17の辞書データの構成例を示す。なお、図3では、繋がり元の語句を格助詞のみとしているが、その他の語句についても同様の構成の辞書データが登録される。
この例の繋がり予測辞書17では、連続して入力される可能性が高い関係にある語句の組み合わせについて、繋がり元の語句の表記文字列に繋がり先の語句の読み文字列および表記文字列を対応づけた構成の辞書データが登録される。さらに繋がり先の語句が前出の7種類のカテゴリのいずれかに所属する場合には、その所属カテゴリを示す属性情報が辞書データに含められる。つまり、変換用辞書16に属性情報が登録されている語句が繋がり先の語句となる場合には、繋がり予測辞書17の当該繋がり先語句を含む辞書データにも同一の属性情報が登録されることになる。また、変換用辞書16において属性情報が設定されていない語句が繋がり先の語句となる場合には、繋がり予測辞書17の辞書データにも属性情報は設定されない。
さらに繋がり予測辞書17の各辞書データにも、標準的な優先度や使用頻度情報などが含まれる。以下では、標準的な優先度と使用頻度情報とを総合した度数を「優先度」と呼ぶことにする。
図2に示すように、この実施例では、名詞は、その語句が示す概念の上位概念に相当するカテゴリに分類される。また図3に示すように、各カテゴリの名詞に直接または間接的に連なって入力される可能性がある語句は、その関連するカテゴリに分類される。
図2では、7種類のカテゴリの中の[衣類]に属する名詞の辞書データが位置する範囲を太枠で囲んで示すと共に、その中で以下の具体例に使用する「ふく/服」の辞書データを網点パターンにより示している。また図3では、[衣類]に属する語句が繋がり先として設定されている辞書データを網点パターンにより示している。
図4〜図7は、[衣類]の中の「服」を含む文章が入力される場合の文字入力画面における候補表示の変遷の事例を示す。いずれの事例でも、文字入力画面は、上中下の三段に分割され、上段に文字入力欄24が、中段に候補表示欄25が、下段にソフトウェアキーボード20がそれぞれ設定される。ソフトウェアキーボード20には、文字キー21や変換キー22や確定キー23を含む計16個のキーが含まれる。
図4は、「ふくを」という読み文字列が入力されて、これが「服を」に変換された場合の文字入力画面の変遷を示す。図4(1)は、読み文字列「ふくを」の入力が完了した直後の画面であって、候補表示欄25には予測変換により抽出された複数の候補が表示されている。図4(2)は、候補リストの中の「服を」が選択された後の画面であって、候補リストで選択された「服を」が文字入力欄24に確定表示されると共に、候補表示欄25の候補リストが、確定文字列に対する繋がり予測によって抽出された候補を表示するものに更新されている。
なお、この例のように、名詞と格助詞との組み合わせから成る文字列が確定された場合の繋がり予測では、末尾の格助詞により繋がり予測辞書17が検索される。すなわち、図4(2)の候補表示欄25には、「服を」の「を」に繋がる語句による候補が表示されているが、これらのうちの第6位までの語句「着る」「買う」「もらう」「あげる」「借りる」「貸す」には、図3に示すように、「を」の前の「服」と同じ[衣類]の属性情報が設定されている(図3参照)。
図5は、図4(1)(2)と同様の流れにより、「ふくを」という読み文字列が「服を」に変換された後に、「たくさん」という読み文字列が入力された場合の文字入力画面の変遷を示す。紙面の都合とにより、図5では、図4(1)に相当する図を省略して、「服を」が確定された時点の画面(図5(1))から示す。
先にも述べたように、「服を」が確定したことによって、候補表示欄25には、[衣類]の属性情報が設定された語句が上位に配置された候補リストが表示される(図5(1))。しかし、図5の事例では、表示された候補は選択されずに、読み文字が入力され、その入力に伴う予測変換によって候補表示欄25の表示が更新されている。
図5(2)は、「たくさん」という読み文字列が入力された時点での表示例を示す。候補表示欄25には、「たくさん」という読みを持つ語句が表示されているのみで、[衣類]に関わる語句は示されていない。
図5(3)は、上記の候補リストの中から「たくさん」が選択されて繋がり予測処理が実施された時点での表示例を示す。この実施例では、「を」に対する繋がり先の語句として登録された各語句が「たくさん」の繋がり先としても登録されていたため、「たくさん」の選択に応じた繋がり予測によって、再び[衣類]の属性情報を有する語句が上位に位置する候補リストが表示されている。
図6でも、図5と同様に、「ふくを」という読み文字列が「服を」に変換された後に読み文字列が入力された場合の文字入力画面の変遷を示す。この場合にも、読み文字列の「ふくを」に対する予測変換により抽出された候補の中の「服を」が選択され、その選択に応じて実施された繋がり予測によって、候補表示欄25の表示が、[衣類]の属性情報が設定されている語句が上位に配置された候補リストに更新される(図6(1)(2))。
図6の事例では、次に、「か」という読み文字が入力されている(図6(3))。この入力により予測変換が行われて、候補表示欄25の表示は、読み文字「か」に前方一致する語句による候補リストに更新されているが、このリストでは、[衣類]の属性情報が設定されている「買う」「借りる」「貸す」、ならびにこれらの活用形による文字列が上位を占めている。
図7は、「ふくをきる」という読み文字列が入力された後に、変換キー22の操作に応じて仮名漢字変換が実施された場合の文字入力画面の変遷を示す。
図7(1)は、変換キー22が操作される直前の画面の例であって、候補表示欄25には、予測変換により抽出された平仮名文字列の「ふくをきる」と片仮名文字列の「フクヲキル」とが表示されている。
図7(2)は、変換キー22の操作後の画面の例である。この実施例では、連文節変換により読み文字列が「ふくを」と「きる」とに分解されて変換され、文節毎の第1候補の文字列が結合された結果、仮名漢字文字列の「服を/着る」が文字入力欄24に未確定状態で表示されている。また、この未確定文字列の「服を」に変換用のカーソルが設定されると共に、候補表示欄25に第1文節に対する各種変換候補が表示される。
図4〜図7の事例では、いずれも「服」という名詞が入力されているが、この「服」を[衣類]に属する他の名詞(「シャツ」「ジャケット」など)に置き換え、その他は各事例と同様の入力作業を行った場合にも、名詞を含む読み文字列に対する変換結果以外の候補表示は、各事例と同様になる。
以上の事例に示したように、この実施例の文字入力システム1では、属性情報が設定されている名詞が確定されたことに応じて、以後の変換処理や繋がり予測処理において、確定された名詞と同じ属性情報が設定された語句を優先的に抽出する。この優先抽出のために、この実施例では、確定された名詞の属性情報を、同じ属性情報が設定された語句が確定されるまで属性メモリ18に保存するようにしている。
上記の優先抽出によれば、ユーザが目的とする語句が上位に表示される可能性が大幅に高められるので、文字入力にかかる労力を軽減して入力作業の効率を向上させることができる。
また、繋がり予測辞書17では、同じカテゴリ内の複数の語句への繋がり先として機能する語句に対し、当該カテゴリを示す属性情報を設定することによって各繋がり元の語句への対応づけが一括で行われるので、データ容量を増大させることなく、入力の利便性を高めることができる。
さらに、図5の事例に示すように、この実施例では、名詞と格助詞との組み合わせによる文字列に直接に繋がる語句に限らず、他の語句を介して繋がる語句についても、確定された名詞と同じ属性情報が設定されている候補があれば、その候補が優先して抽出される。仮名漢字変換においても、属性情報が設定された名詞を含む文節と名詞と同じ属性情報が設定された語句を含む文節との間に他の文節が位置する構成の文字列への変換を、精度良く実施することができる。
図8は、上記文字入力システム1において実施される一連の処理の流れを示す。
文字入力画面が立ち上げられて読み文字の入力が開始されると、その入力に応じた読み文字列が組み立てられ(ステップS1)、その読み文字列による予測変換処理(詳細は図10に示す。)が実施され(ステップS2)、予測変換により抽出された候補が表示される(ステップS3)。さらに読み文字の入力が続くと、ステップS4が「YES」となってステップS1に戻る。
以後も、読み文字列の入力が続く間は、ステップS1〜S4の処理が繰り返される。
所定の時点で変換キー22が操作されると、ステップS5が「YES」となってステップS6に進み、その時点における読み文字列を用いた仮名漢字変換処理(詳細は図11に示す。)が実施される。仮名漢字変換処理で抽出された候補もステップS3の処理により表示される。
予測変換または仮名漢字変換により抽出された候補が選択されるか、またはキーボード20の確定キー23が操作されると、ステップS7が「YES」となってステップS8に進み、選択操作の対象の文字列または文字入力欄24に表示中の文字列が確定される。
文字列の確定後は、ステップS11において、確定された文字列に対する繋がり予測処理(詳細は図9に示す。)が実施された後に、抽出された候補が表示される(ステップS3)。本実施例では、この繋がり予測処理の前に、確定された語句の属性情報をチェックする(ステップS9)。ここで、属性メモリ18に保存中の属性情報を有する語句が確定されている場合(ステップS9が「YES」)には、ステップS10において属性メモリ18をリセットしてから繋がり予測処理に進む。保存中の属性情報を有していない語句が確定された場合には、ステップS10をスキップして繋がり予測処理に進む。
繋がり予測処理により抽出された候補が選択された場合にも、ステップS7の「YES」判定に応じてステップS8以下の処理が実施される。
以下、図9,図10,図11を順に参照して、繋がり予測処理、予測変換処理、仮名漢字変換処理のそれぞれを詳細に説明する。
まず図9に示す繋がり予測処理では、直前に確定された語句に名詞が含まれるか否かをチェックし(ステップS101)、名詞が含まれない場合(ステップS101が「NO」)には、属性メモリ18に属性情報が保存されているかどうかをチェックする(ステップS102)。また、確定された語句に名詞が含まれる場合(ステップS101が「YES」)には、その名詞に属性情報が設定されているかどうかをチェックする(ステップS104)。
図4〜図6の事例のように、属性情報が設定されている名詞を含む語句が確定した場合には、ステップS101およびステップS104が順に「YES」となってステップS105に進み、確定した名詞の属性情報が属性メモリ18に保存される。なお、ここでの保存は上書き保存となるので、既に属性メモリ18に属性情報が格納されている場合には、その情報は消去される。
属性情報の保存が終了すると、ステップS103に進み、確定した語句(その語句の末尾に助詞が位置する場合には、助詞を示す文字のみ)により繋がり予測辞書17を検索して、確定した語句に繋がる語句(すなわち確定した語句を繋がり元とする辞書データ内の繋がり先の語句)を保存中の属性情報を有するものから優先して抽出する。
確定した語句には名詞が含まれないが、属性メモリ18に属性情報が保存されている場合(ステップS101が「NO」でステップS102が「YES」)にも、ステップS103に進み、同様に、確定した語句に繋がる語句を保存中の属性情報を有するものから優先して抽出する。
なお、ステップS103においては、保存中の属性情報を有する語句のほか、属性情報が設定されていない語句で優先度が高いものが抽出される。したがって、保存中の属性情報を有する語句が見つからなかった場合には、当該属性情報とは関係のない語句のみが抽出される。
確定した語句に名詞が含まれず、属性情報も保存されていない場合(ステップS101およびS102が共に「NO」)や、確定した語句に名詞が含まれてはいるが、その名詞に属性情報が設定されていない場合(ステップS101が「YES」でステップS104が「NO」)には、ステップS106に進む。ステップS106では、属性情報の有無や種別に関わらずに、確定した語句に繋がる語句を優先度の高いものから順に抽出する。
上記の処理によれば、図4の事例のように、名詞を含む語句が確定した直後にその名詞と同じ属性情報を有する語句を候補として呼び出すことができるほか、図5の事例のように、名詞を含む語句が確定した後に、その名詞とは異なる属性情報を有する語句や属性情報を持たない語句の確定を経て、名詞と同じ属性情報を有する語句の候補を呼び出すこともできる。
つぎに、図10を参照する。
予測変換処理でも、まず属性メモリ18における情報の保存の有無をチェックする(ステップS201)。属性情報が保存されている場合(ステップS201が「YES」)には、ステップS202に進み、読み文字列により変換用辞書16を検索して、当該読み文字列に前方一致する語句を、保存中の属性情報を有するものから優先して抽出する。
属性メモリ18に属性情報が保存されていない場合(ステップS201が「NO」)には、ステップS203に進み、属性情報の有無や種別に関わらずに、読み文字列に前方一致する語句を、読み文字列への一致度および優先度の高い順に抽出する。
なお、ステップS202においても、保存中の属性情報を有する語句が所定数以下または存在しない場合には、属性情報が設定されていない語句で読み文字列に前方一致するものを、優先度の高い順に抽出する。
また、ステップS202,S203ともに、読み文字列との前方一致検索により動詞や形容詞などの活用語の終止形を抽出した場合には、その一致の範囲を維持して終止形の語尾を変化させることにより、複数の変換候補の文字列を生成する。図6(3)に示した候補リストは、この機能が適用されたステップS202によって呼び出されたものである。
つぎに、図11を参照して、連文節変換が行われることを前提として仮名漢字変換処理の詳細手順を説明する。
まず最初のステップS301では、あらかじめ登録されているルールに基づき、読み文字列を複数の文節に切り分けた後、先頭の文節に対する候補を抽出する処理に進む。
この候補抽出処理では、属性メモリ18における属性情報の保存の有無をチェックし(ステップS302)、属性情報が保存されている場合(ステップS302が「YES」)には、変換用辞書16から、先頭の文節に適合する語句を、保存中の属性情報を有するものから優先して抽出する。一方、属性メモリ18に属性情報が保存されていない場合(ステップS311が「YES」)には、先頭の文節に適合する語句を優先度の高い順に抽出する。
なお、ステップS303,S304、および後記するステップS310,S311における「先頭の文節に適合する語句」とは、通常は、読み文字列が一致する語句を意味するが、動詞や形容詞などの語尾が変化する語句については、先頭の文節に対して語幹部分の読み文字列が一致する語句も「先頭の文節に適合する語句」に入れる。後者の語句については、先頭の文節の読み文字列に対する一致範囲を残して語尾を変化させることにより、読み文字列が一致する候補を生成する。
先頭の文節に対する候補抽出処理では、抽出された候補の中の第1候補が仮確定される。ステップ305では、この第1候補に属性情報を有する名詞が含まれるかどうかをチェックする。属性情報を有する名詞が含まれる場合には、ステップS306において、その属性情報を属性メモリ18に保存する。
以下、第2文節以下の各文節に順に着目して、着目中の文節に対する候補抽出処理を実施する(ステップS307〜S313)。この場合にも、属性メモリ18における属性情報の有無をチェックし(ステップS309)、属性情報が保存されている場合には、着目中の文節に適合する語句を、保存中の属性情報を有するものから優先して抽出し(ステップS309が「YES」でステップS310を実施。)、属性が保存されていない場合には、属性情報の有無や種別に関わらずに、着目中の文節に適合する語句を優先度の高い順に抽出する(ステップS309が「NO」でステップS311を実施。)。
また、第2文節以下に対する処理でも、属性情報が設定された名詞を含む文字列が第1候補として抽出された場合(ステップS312が「YES」)には、ステップS313において属性メモリ18に属性情報を保存する。
なお、ステップS313および先のステップS306においても、既に属性メモリ18に他の属性情報が保存されている場合には、上書き保存により前の属性情報が消去される。またステップS303やS310では、保存中の属性情報を有する語句のほか、属性情報が設定されていない語句が所定数抽出される。
全ての文節に対する処理が終了すると、ステップS307が「NO」となってステップS314に進み、文節毎の第1候補を連結することにより変換後の文字列を仮確定し、しかる後に処理を終了する。
上記の仮名漢字変換処理によれば、属性情報を有する名詞を含む連文節が変換対象となる場合でも、当該名詞より後の文節に対して、名詞と同じ属性情報を有する語句を第1候補として抽出することができる。よって、図7に示した事例のように属性情報を有する名詞が先頭の文節に位置する場合に限らず、2番目以降の文節に属性情報を有する名詞が位置する文字列(たとえば「かわいい/服を/着る」)や、名詞と同じ属性情報を持つ語句が名詞から離れた構成の文字列(たとえば「服を/たくさん/買った」)を変換対象とする場合でも、一連の読み文字列からの一括変換が可能である。
図11には示していないが、上記の仮名漢字変換の終了後に、一部の文節に対する変換結果を修正する操作が行われ、それに伴い、後続の文節が再度変換される場合もある。その場合にも、図11に準じた手順による処理を実施することができる。
また、長い読み文字列が入力された場合の予測変換処理においても、図11と同様の手法による連文節変換を実施することができる。
上記したように、本実施例による文字入力システム1では、属性情報を有する名詞が確定または仮確定されたことに応じてその属性情報を属性メモリ18に保存し、以後の候補抽出処理において、保存されている属性情報を有する語句を優先して抽出する。
保存された属性情報は、当該属性情報が設定されている語句がユーザにより選択されて確定されたことに応じて消去されるほか、属性情報を有する別の名詞が抽出されてその属性情報が保存されたとき(図9のステップS105,図11のステップS306,S313)にも消去される。したがって、あるカテゴリに関する話題を示す文が入力された後に別のカテゴリに話題が移った場合に、前の話題に関する概念の語句が抽出されるのを防ぐことができ、ユーザが必要とする語句をより高い確度で候補として呼び出すことが可能になる。
上記の文字入力システム1は、出荷前の情報端末装置にシステム全体を構成するプログラムを組み込むことにより設定されるほか、既存の文字入力システムを有する情報端末装置にも、候補抽出部14,変換用辞書16,繋がり予測辞書17などのアップデート用のプログラムを組み込むことによって設定することができる。
また、このプログラムは、スマートフォンやタブレット端末などのタッチパネルディスプレイを備えた情報端末装置に限らず、従来型の携帯電話のような機械式の操作部を有する情報端末装置にも導入可能である。
1 文字入力システム
2 タッチパネルディスプレイ
11 キーボード処理部
12 表示処理部
13 読み文字列組立処理部
14 候補抽出部
15 確定処理部
16 変換用辞書
17 繋がり予測辞書
18 属性メモリ
20 ソフトウェアキーボード
24 文字入力欄
25 候補表示欄
100 文字入力装置

Claims (6)

  1. 操作部および表示部が接続されたコンピュータを、複数の語句毎の読み文字列と表記文字列との組み合わせが登録された辞書部と、前記操作部から読み文字列の入力を受け付ける読み文字列入力手段と、入力された読み文字列または確定された文字列により前記辞書部を検索して所定数の表記文字列を入力候補として抽出する候補抽出手段と、前記候補抽出手段により抽出された入力候補の文字列を前記表示部に表示する候補表示手段と、前記操作部における候補の選択操作に応じて選択された候補の文字列を前記コンピュータで起動中のアプリケーションへの入力文字列として確定する確定手段とを具備する文字入力システムとして機能させるプログラムであって、
    複数の名詞がそれぞれの上位概念に基づき複数のカテゴリに分類されると共に、分類された各名詞および各カテゴリに関連する各種の語句にそれぞれ分類されたカテゴリまたは関連するカテゴリを示す属性情報が紐付けられて登録された構成の前記辞書部を前記コンピュータに設定するためのプログラムが含まれており、
    前記候補抽出手段は、前記属性情報が紐付けられた名詞を含む文字列が入力文字列として設定されたことに応じて当該名詞の属性情報を一時的に保存する属性情報保存手段を具備すると共に、この手段に属性情報が保存されている状態下での辞書部に対する検索において、当該保存されている属性情報に紐付けられている語句を優先して抽出
    前記候補表示手段が前記候補抽出手段によって抽出された語句を表示している状態で、前記読み文字列入力手段が読み文字列の入力を受け付けた場合、前記候補抽出手段は、前記候補表示手段が表示している語句のうち、前記読み文字列入力手段が受け付けた前記読み文字列に前方一致する語句を抽出するとともに、当該抽出した語句に終止形の活用語が含まれている場合、当該活用語の終止形以外の活用形に係る語句を入力候補に加えることを特徴とする文字入力用のプログラム。
  2. 前記辞書部には、前後に連ねて入力される可能性がある語句の間の繋がり関係を示す情報が含まれており、
    前記候補抽出手段は、前記確定手段により直前に確定された文字列により前記辞書部を検索してその確定文字列に繋がりを持つ語句の表記文字列を次の入力候補として抽出する繋がり予測処理を実施する機能を具備し、前記属性情報保存手段に属性情報が保存されている状態下で前記繋がり予測処理を実施する場合には、前記直前に確定した文字列に繋がりを持つ語句の中の前記属性情報保存手段に保存されている属性情報に紐付けられている語句の表記文字列を優先して抽出する、請求項1に記載された文字入力用のプログラム。
  3. 前記候補抽出手段は、前記読み文字列入力手段が複数の文節に対応する長さの読み文字列の入力を受け付けたことに応じて、当該読み文字列を文節毎に区切って前記辞書部を検索し、各文節に対して抽出した表記文字列を連ねた文字列を変換候補に設定する連文節変換機能を具備し、
    前記連文節変換を実施する前記候補抽出手段は、読み文字列内のいずれかの文節に対する検索により前記属性情報に紐付けられた名詞を含む表記文字列が候補として抽出されたとき、その属性情報を前記属性情報保存手段に保存すると共に、当該文節より後の文節に対する検索において前記保存された属性情報に紐付けられている語句を優先して抽出する、請求項1または2に記載された文字入力用のプログラム。
  4. 前記候補抽出手段は、前記操作部における操作に応じて前記読み文字列入力手段が入力する読み文字列が変化する都度、その変化後の読み文字列に適合する語句の表記文字列を抽出する第1の変換手段と、前記操作部における変換操作に応じてその時点で入力されている読み文字列に適合する語句を抽出する第2の変換手段とを具備し、これら2種類の変換手段のうちの少なくとも第2の変換手段に前記連文節変換機能が設けられている、請求項に記載された文字入力用のプログラム。
  5. 前記候補抽出手段は、前記属性情報保存手段に保存されている属性情報に紐付けられている語句の表記文字列が前記確定手段により入力文字列として確定されたことに応じて前記属性情報保存手段に保存されている属性情報を消去する、
    請求項1〜のいずれかに記載された文字入力用のプログラム。
  6. 操作部および表示部を有する筐体と、この筐体の内部に組み込まれた制御部とを備え、前記制御部に、複数の語句毎の読み文字列と表記文字列との組み合わせが登録された辞書部と、前記操作部から読み文字列の入力を受け付ける読み文字列入力手段と、入力された読み文字列または確定された文字列により前記辞書部を検索して所定数の表記文字列を入力候補として抽出する候補抽出手段と、前記候補抽出手段により抽出された入力候補の文字列を前記表示部に表示する候補表示手段と、前記操作部における候補の選択操作に応じて選択された候補の文字列を入力文字列として確定する確定手段とが設けられて成る文字入力装置であって、
    前記辞書部では、複数の名詞がそれぞれの上位概念に基づき複数のカテゴリに分類されると共に、分類された各名詞および各カテゴリに関連する各種の語句にそれぞれ分類されたカテゴリまたは関連するカテゴリを示す属性情報が紐付けられて登録され、
    前記候補抽出手段は、前記属性情報が紐付けられた名詞を含む文字列が入力文字列として設定されたことに応じて当該名詞の属性情報を一時的に保存する属性情報保存手段を具備すると共に、この手段に属性情報が保存されている状態下での辞書部に対する検索において、当該保存されている属性情報に紐付けられている語句を優先して抽出
    前記候補表示手段が前記候補抽出手段によって抽出された語句を表示している状態で、前記読み文字列入力手段が読み文字列の入力を受け付けた場合、前記候補抽出手段は、前記候補表示手段が表示している語句のうち、前記読み文字列入力手段が受け付けた前記読み文字列に前方一致する語句を抽出するとともに、当該抽出した語句に終止形の活用語が含まれている場合、当該活用語の終止形以外の活用形に係る語句を入力候補に加えることを特徴とする文字入力装置。
JP2013053273A 2013-03-15 2013-03-15 文字入力用のプログラムおよび文字入力装置 Active JP6221275B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013053273A JP6221275B2 (ja) 2013-03-15 2013-03-15 文字入力用のプログラムおよび文字入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013053273A JP6221275B2 (ja) 2013-03-15 2013-03-15 文字入力用のプログラムおよび文字入力装置

Publications (2)

Publication Number Publication Date
JP2014178953A JP2014178953A (ja) 2014-09-25
JP6221275B2 true JP6221275B2 (ja) 2017-11-01

Family

ID=51698818

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013053273A Active JP6221275B2 (ja) 2013-03-15 2013-03-15 文字入力用のプログラムおよび文字入力装置

Country Status (1)

Country Link
JP (1) JP6221275B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6459640B2 (ja) 2015-03-03 2019-01-30 オムロン株式会社 文字入力システム用のプログラムおよび情報処理装置
JPWO2018190128A1 (ja) * 2017-04-11 2020-02-27 ソニー株式会社 情報処理装置および情報処理方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04256162A (ja) * 1991-02-08 1992-09-10 Sharp Corp 学習機能付き文書処理装置及び方法
JPH09128387A (ja) * 1995-11-01 1997-05-16 Toshiba Corp 入力文字予測方法及びその方法を用いた装置
JP2000187661A (ja) * 1998-12-22 2000-07-04 Sharp Corp 文字列入力装置及び文字列入力方法並びに文字列入力プログラムを記録した記録媒体
JP3867775B2 (ja) * 2001-11-01 2007-01-10 日本電気株式会社 単語入力による文章作成装置
JP5481095B2 (ja) * 2009-05-12 2014-04-23 株式会社エヌ・ティ・ティ・データ 文字列入力装置、文字列入力方法、およびプログラム

Also Published As

Publication number Publication date
JP2014178953A (ja) 2014-09-25

Similar Documents

Publication Publication Date Title
US10809914B2 (en) System and method for inputting text into electronic devices
US9026428B2 (en) Text/character input system, such as for use with touch screens on mobile phones
EP2286350B1 (en) Systems and methods for an automated personalized dictionary generator for portable devices
US9460066B2 (en) Systems and methods for character correction in communication devices
US7477165B2 (en) Handheld electronic device and method for learning contextual data during disambiguation of text input
US20170076181A1 (en) Converting text strings into number strings, such as via a touchscreen input
KR20130122584A (ko) 서로 상이한 다언어로 사용자 장치에 대한 개체 이름의 문자 입력 사용자 보조 기술
JP6031764B2 (ja) 文字入力用のプログラムおよび情報処理装置ならびに文字入力動作の設定方法
US20140067731A1 (en) Multi-dimensional information entry prediction
US8612210B2 (en) Handheld electronic device and method for employing contextual data for disambiguation of text input
KR101130206B1 (ko) 입력 순서와 무관한 문자 입력 메커니즘을 제공하는 방법, 기기 및 컴퓨터 프로그램 제품
JP6221275B2 (ja) 文字入力用のプログラムおよび文字入力装置
US20130073572A1 (en) Method of learning character segments from received text, and associated handheld electronic device
JP5477936B2 (ja) 文字入力装置、文字・文字種の選択方法
JPH07334499A (ja) 文字列入力装置
JP4487614B2 (ja) 情報表示制御装置、及びプログラム
JP6048601B2 (ja) 情報表示装置、プログラムおよび単語情報表示方法
JP2008117310A (ja) 辞書検索装置および辞書検索処理プログラム
JP5573257B2 (ja) 文字入力用のプログラムおよび通信端末装置
KR20190084865A (ko) 문장 예측입력시스템
JP5891706B2 (ja) 情報表示装置およびプログラム
CN109597497B (zh) 一种信息预测方法、装置及设备
US20080189327A1 (en) Handheld Electronic Device and Associated Method for Obtaining New Language Objects for Use by a Disambiguation Routine on the Device
CN113743098A (zh) 一种基于云平台的输入方法及终端
JP5868350B2 (ja) 文字入力装置、文字・文字種の選択方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151106

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20160603

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170905

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170918

R150 Certificate of patent or registration of utility model

Ref document number: 6221275

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250