JPH11238056A - 日本語予測入力方法ならびにシステム及び同方法がプログラムされ記録される記録媒体 - Google Patents

日本語予測入力方法ならびにシステム及び同方法がプログラムされ記録される記録媒体

Info

Publication number
JPH11238056A
JPH11238056A JP10038990A JP3899098A JPH11238056A JP H11238056 A JPH11238056 A JP H11238056A JP 10038990 A JP10038990 A JP 10038990A JP 3899098 A JP3899098 A JP 3899098A JP H11238056 A JPH11238056 A JP H11238056A
Authority
JP
Japan
Prior art keywords
character string
reading
prediction
dictionary
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10038990A
Other languages
English (en)
Inventor
Yoshimi Saito
佳美 齋藤
Yumi Ichimura
由美 市村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10038990A priority Critical patent/JPH11238056A/ja
Publication of JPH11238056A publication Critical patent/JPH11238056A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 本発明は、文章入力中の任意の位置から自動
的に入力予測を行った結果を高精度に優先順位付けして
ユーザに呈示することにより、文書入力の効率が向上
し、簡易に日本語入力を行うことを課題とする。 【解決手段】 本発明は、切り出し部107にて、入力
あるいは予測補完された読み文字列から部分文字列群を
取り出し、検索部108にて、取り出された部分文字列
と読みが前方一致する漢字かな表記を辞書を用いて検索
し、制御部103、110、111にて辞書109中に
ある、(1) 漢字かな表記文字列に対する頻度情報と読み
文字列の部分文字列の少なくともー部に対する頻度情
報、(2) 読み文字列に対する頻度情報、(3) 漢字かな表
記文字毎の尤度情報、(4) 読み文字列毎の尤度情報のい
ずれかを用い、検索された漢字かな表記の優先順位付け
を行ない日本語予測入力することを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、日本語予測入力方
法ならびにシステム及び同方法がプログラムされ記録さ
れる記録媒体に関し、詳しくは、既に入力された文字を
手掛かりに、入力される文字列を予測し入力することの
できる日本語予測入力方法およびシステムならびに記録
媒体に係わる。
【0002】
【従来の技術】最近、計算機上で文書を作成することは
ー般的となり、ワードプロセッサ等の専用機、あるいは
パーソナルコンピュータ等の汎用機の使用により、簡易
に文書を入力できるようになっている。特に近年は、計
算機上での文書の通信によるコミュニケーンョンもー般
化しつつあり、計算機上で文書を作成する機会は更に増
大している。
【0003】一方、技術の進歩によりコンピュータを始
めとする種々の電子装置は小型化し、携帯機器の普及が
著しい。携帯機器等においては、キーボード等の操作部
のサイズが小さいことなどから、文書の入力作業の負担
は大きく、ユーザの入力に関わる負担を軽減することが
望まれる。
【0004】このような問題を解決するために、入力し
たい熟語の読みの先頭を入力し、それをキーとして入力
する熟語を検索して提示する文書入力装置( 特開昭60
−105029号) や、変換確定された単語に連接する
単語を検索提示するワードプロセッサ( 特開平1−26
0568) 、入力したい読みの先頭を入力し、それをキ
ーとして入力する読みを検索して提示するかな漢字変換
システム( 特開平8−147289) 等が知られてい
る。特開昭60−105029号では、熟語の読みの頻
度の情報を記憶し、これによって候補の優先順位付けを
行っている。特開平1−260568号では、過去の入
力履歴により候補の優先順位付けが行われている。特開
平8−147289号では、変換候補の単語の頻度情報
を記憶し、これによって候補の優先順位付けを行ってい
る。
【0005】
【発明が解決しようとする課題】しかし、上述した従来
の方法によればいずれも入力したい文字列の先頭が入力
されることを前提とし、これをキーに辞書を前方一致検
索して予測を行う仕組みとなっている。従って、文章の
入力中に任意の位置で、そこに続く入力を自動的に予測
できる仕組みを備えていないため、近年一般的となって
いる連文節入力での入力中に使用する際には、変換の途
中でー回変換キーを押す等入力操作を中断した後改めて
入力したい文字列の先頭を入力したり、あるいは、予測
を行いたい位置で予測検索を命令したり、といったキー
操作が必要となり、操作が繁雑となり、オペレータに負
担を強いていた。
【0006】一方、入力中の任意の位置から予測を行う
ためには、従来の単語やその読みの頻度情報のみで予測
候補間の優先順位付けを精度よく行うことは困難であ
り、任意の箇所での自動的な予測は実用上困難であっ
た。特に予測候補を上位の数個に限って表示するような
制御には向かず、予測候補間の優先順位付けのための新
しい方式の開発が必要であった。
【0007】本発明は上記事情に鑑みてなされたもので
あり、ユーザの入力中、および予測補完の後の任意の箇
所で、白動的に高精度な予測を行い、ユーザにわかりや
すく提示する、日本語予測入力方法ならびにシステム及
び同方法がプログラムされ記録される記録媒体を提供す
ることを目的とする。
【0008】
【課題を解決するための手段】本発明の日本語予測入力
方法は、読み文字列を入力し、この入力あるいは予測補
完された読み文字列から少なくとも一部の部分文字列群
を取り出し、取り出された部分文字列と読みが前方一致
する漢字かな表記を辞書を用いて検索し、(1)前記辞書
中にある漢字かな表記文字列に対する頻度情報と読み文
字列の部分文字列の少なくともー部に対する頻度情報を
用い、あるいは(2) 前記辞書中にある読み文字列の部分
文字列の少なくともー部に対する頻度情報を用いて検索
された漢字かな表記の優先順位付けを行ない日本語予測
入力することを特徴とする。また、(3) 辞書中にある漢
字かな表記文字列に対する、前方一致した読み文子列毎
の尤度情報を用いて(4) あるいは、読み文字列の部分文
字列の少なくともー部に対する頻度情報を用いて検索さ
れた漢字かな表記の優先順位付けを行ない日本語予測入
力することも特徴とする。
【0009】本発明の日本語予測入力システムは、日本
語文のー部を構成する漢字かな表記およびその読み文字
列を記憶した辞書と、読み文字列を入力する手段と、入
力あるいは予測補完された読み文字列から部分文字列群
のー部または全部を取り出す手段と、取り出された部分
文字列と読みが前方一致する漢字かな表記を前記辞書か
ら検索する手段と、(1) 前記辞書中にある漢字かな表記
文字列に対する頻度情報と、読み文字列の部分文字列の
ー部または全部に対する頻度情報を用い、(2)あるい
は、前記辞書中にある読み文字列の部分文字列のー部ま
たは全部に対する頻度情報を用いて検索された漢字かな
表記の優先順位付けする手段とを具備することを特徴と
する。また、(3) 前記辞書中にある漢字かな表記文字列
に対する、前方一致した読み文字列毎の尤度情報を用い
て(4) 読み文字列に対する、前方一致した読み文字列毎
の尤度情報を用いて検索された漢字かな表記の優先順位
付けを行う手段とを具備することも特徴とする。
【0010】本発明の記録媒体は、既に入力した文字を
手掛かりに入力される文字列を予測し、入力する日本語
予測入力システムにおいて用いられ、入力される読み文
字列を取り込むステップと、取り込まれた読み文字列あ
るいは予測補完された読み文字列から少なくとも一部の
部分文字列群を切り出すステップと、切り出された部分
文字列と読みが前方一致する漢字かな表記を辞書を用い
て検索するステップと、(1) 前記辞書中にある漢字かな
表記文字列に対する頻度情報と読み文字列の部分文字列
の少なくともー部に対する頻度情報、もしくは前記辞書
中にある読み文字列の少なくとも一部に対する頻度情報
を用いて検索された漢字かな表記の優先順位付けを行な
うステップ、あるいは、(2) 前記辞書中にある漢字かな
表記文字列に対する前方一致した読み文字列毎の尤度情
報、もしくは前記辞書中にある読み文字列に対する前方
一致した読み文字列毎の尤度情報を用いて検索された漢
字かな表記の優先順位付けを行なうステップとがプログ
ラムされ記録されることを特徴とする。
【0011】このことにより、文章入力中の任意の位置
から自動的に入力予測を行った結果を高精度に優先順位
付けしてユーザに呈示することができ、文書入力の効率
が向上し、簡易に日本語入力を行うことができる。
【0012】
【発明の実施の形態】図1は、本発明の日本語予測入力
システムの実施形態を示すブロック図である。
【0013】図において、101は入力部、102は制
御部、103は予測制御部、104はかな漢字変換部、
105はかな漢字変換辞書検索部、106はかな漢字変
換辞書、107は読み文字列切り出し部、108は予測
辞書検索部、109は予測辞書、110は予測候補評価
部、111は予測候補絞り込み部、112は出力部であ
る。
【0014】入力部101からは、読み情報をはじめと
する、ユーザからの種々の操作情報が取り込まれる。取
り込まれた情報は、制御部102に送られて解析された
後、必要な各処理部への情報として渡される。各処理部
の処理結果はまた制御部102に返され、漢字かな混じ
り文字列ほか必要な情報は出力部112を通して出力さ
れる。入力された情報のうち読み情報は制御部102か
ら、まず予測制御部103に渡される。取り込まれた情
報は、予測制御部103で解析された後、必要な各処理
部への情報として渡される。各処理部の処理結果はまた
予測制御部103に返されて、もうー度予測制御部10
3で処理された後、予測された漢字かな表記および読み
文字列ほか、必要な情報は制御部102に返される。予
測制御部103以下の処理については後に詳述する。
【0015】次に、制御部102は、入力された読み情
報と予測された漢字かな表記を、例えばディスプレー画
面に表示する等ユーザに提示する情報として出力する。
ここでユーザが表示される情報に従い入力した、表示さ
れた予測候補の採用/不採用、所望の候補の選択等の操
作情報は入力部101から取り込まれ、制御部102に
送られる。制御部102のこの部分の処理については後
に詳述する。また制御部102は、かな漢字変換処理を
行うことが指示された場合、またはあらかじめ変換処理
に入ることが定められている文字が入力された場合、ま
たは入力予測の結果がユーザに採用された場合、入力さ
れた読み情報と、もしそれに連続する予測補完された読
み文字列がある場合にはその読み文字列とを、かな漢字
変換部104に送る。制御部102のこの部分の処理に
ついては後に詳述する。
【0016】かな漢字変換部104では、かな漢字変換
辞書検索部105によりかな漢字変換辞書106を参照
しながら、制御部102より送られてきた読み文字列を
漢字かな混じり文字列に変換する。かな漢字変換の方法
は広く公知であるので、ここでは言及しない。変換結果
は、制御部102を通じて出力部112から出力され、
例えばディスプレーに表示される。ユーザは表示された
情報に従い、引き続き読み文字列の入力を行ったり、所
望の漢字かな表記を確定するなどの操作を行う。
【0017】ここで、更に、制御部102は、引き続き
入力された読み文字列を、予測制御部103に送る。こ
の時、制御部102は入力された読み文字列の他、もし
それに連続する予測補完された読み文字列がある場合に
はその読み文字列を合わせ、予測制御部103に送る。
制御部102のこの部分の処理については後に詳述す
る。
【0018】このように一連のユーザ操作とシステムの
処理により、日本語文の入力が完了する。以上が本発明
の日本語予測入力システムによる処理の流れの概要であ
る。
【0019】次に、予測制御部103以下の処理の流れ
の概要を図1を用いて説明する。
【0020】予測制御部103では、制御部102から
受け取った読み文字列を、読み文字列切り出し部107
に送る。読み文字列切り出し部107では、受け取った
読み文字列から、予測辞書検索に必要な部分文字列を幾
つか切り出し、予測制御部103に返す。次に、予測制
御部103は、それぞれの読み文字列を予測辞書検索部
108に送る。予測辞書検索部108は、予測辞書10
9中に登録されている見出し語に対応している読み情報
に対して前方一致検索を行い、前方一致する見出し語の
漢字かな表記とその読み情報および付属する各種情報、
例えば品詞や頻度の情報を取り出して予測制御部103
に返す。次に、予測制御部103はそれぞれの予測候補
( 見出し語) を予測候補評価部110に送る。
【0021】予測候補評価部110は送られてきた見出
し語に対し、付属する各種情報により各種評価点を算出
・付与し、さらにそれらを代表する代表評価点を算出・
付与して予測制御部103に返す。次に、予測制御部1
03は、各予測候補の各種評価点を予測候補絞り込み部
111に送る。予測候補絞り込み部111は、各種評価
点に対して設定可能な閾値を参照し、各種評価点が設定
されている閾値以上の候補のみを選別して、判別結果を
予測制御部103に返す。予測制御部103では予測候
補絞り込み部111の判別条件を満たした候補を代表評
価点順にソートし上位の候補を制御部102に送る。
【0022】次に、上述した各処理の詳細をフローチャ
ートならびに表を用いて説明する。
【0023】まず、図2のフローチャートを用いて、読
み文字列切り出し部107の処理の流れを説明する。最
初に、ステップ201で読み文字列リストを初期化す
る。次にステップ202で読み文字列バッファを初期化
する。ステップ203で、予測制御部103から受け取
った読み文字列を読み文字列バッファに記憶する。ステ
ップ204で、読み文字列バッファに記憶されている文
字列の長さを変数lenにセットする。ステップ205
で、変数iを0、変数startを1とする。ステップ
206で、変数startの値と変数lenの値を比較
し、変数startの値が変数lenの値以下であれ
ば、ステップ207に進む。ステップ207では、読み
文字列バッファ中の文字列の、第start番目の文字
から、第len番目の文字までを、読み文字列リストの
第i番目の要素にコピーし、ステップ208に進む。ス
テップ208では、変数iと変数startをそれぞれ
1加算し、ステップ206に戻る。
【0024】一方、ステップ206で、変数start
の値が変数lenの値より大きい時には処理を終了す
る。以上の処理によって受け取った読み文字列から、そ
の読み文字列の最後尾の文字を含むような部分読み文字
列が、読み文字列リスト中に格納される( 読み文字列リ
ストに格納されているのは、それぞれ、受け取った読み
文字列の最後尾の文字を含む部分読み文字列である) 。
【0025】図3は、読み文字列リストのフォーマット
と、その処理結果の例を示す。これは、予測制御部10
3から「かなかんじへん」という読み文字列を受け取っ
た時の処理の結果である。番号の欄が、図2に示すフロ
ーチャートの変数iにあたる番号で、部分読み文字列の
欄が、ステップ207で記憶された部分読み文字列であ
る。例えば、第2番目の読み文字列リストには、「かな
かんじへん」という読み文字列の部分読み文字列である
「かんじへん」という文字列が格納されている。
【0026】図4に、予測辞書109に登録されている
情報の一実施形態を示す。予測辞書109には、読み情
報、漢字かな表記情報、品詞情報、表記頻度情報、読み
頻度情報がそれぞれ記憶されている。例えば、「かな漢
字変換」という表記に対しては、「かなかんじへんか
ん」という読み、“サ変”という品詞が付与されてお
り、また表記の頻度を表す数値として“60”、読みの
頻度を表す数値として“12980,890,230,
90,80,80,80,80”が付与されている。こ
こで表記頻度情報“60”は、「かな漢字変換」という
表記が使用される頻度を示す数値であり、具体的には例
えば、あるコーパス中で「かな漢字変換」という表記の
出現した回数などで代表することができる。また、読み
頻度情報は、それぞれ、“ , ”で区切られており、
この例では「かなかんじへんかん」という9文字の読み
に対しその部分文字列8個に対する8個の数値が付与さ
れていて、第1番目の“12980”は「かな」という
部分読み文字列の頻度、第2番目の“890”は「かな
か」という読みの頻度、以降、“230”は「かなか
ん」、“90”は「かなかんじ」、“80”は「かなか
んじへ」、次の“80”は「かなかんじへん」、次の
“80”は「かなかんじへんか」、次の“80”は「か
なかんじへんかん」という読みの使用される頻度を示す
数値であり、具体的には例えばあるコーパスに対する読
みを付与したコーパス中で「かな」「かなか」「かなか
ん」などの文字列の出現した回数等で代表することがで
きる。
【0027】以下、同様に、「神奈川県」という表記に
対して「かながわけん」という読み、「地名」という品
詞、“1050”という「神奈川県」という表記の頻
度、「かながわけん」という読みに対する部分読み文字
列「かな」「かなが」「かながわ」「かながわけ」「か
ながわけん」に対するそれぞれの頻度情報“1298
0”、“1720”、“1590”、“1050”、
“1050”が、「株式会社」という表記に対してまた
それぞれの情報が、というように各々の情報がそれぞれ
登録されている。
【0028】予測辞書109に登録する情報の別の実施
形態を図5に示す。この例では、「読み」「表記」「品
詞」「表記頻度」の各情報は、図4に示した予測辞書と
同様であるが、図4に示す予測辞書と異なり、「読み頻
度情報」の代わりに「確率情報」を付与してある。これ
は、各々の部分読み文字列の頻度の代わりに、その部分
読み文字列が出現した時に対応する表記が出現する確率
(条件付き確率)をベイズの公式等に従って求めたもの
である。この例では、先にあげた図4の例で、表記頻度
情報を、各々の部分読み文字列頻度情報の数値で割って
百分率で表示したものが、図5に示す確率情報となって
いる。例えば、「かな漢字変換:かなかんじへんかん」
に対して“60”をそれぞれ“12980”、“89
0”、“230”、“90”、“80”、“80”、
“80”、“80”で割った値を100倍して小数点以
下を四捨五入した値が、“0”、“7”、“26”、
“67”、“75”、“75”、“75”、“75”で
ある。これらはそれぞれ「かな」「かなか」「かなか
ん」「かなかんじ」「かなかんじへ」「かなかんじへ
ん」「かなかんじへんか」「かなかんじへんかん」とい
う読みが出現した時に「かな漢字変換」という表記が出
現する確率の近似値として以降の処理で用いることがで
きる。
【0029】図6に、予測辞書検索部108により、図
5に示した予測辞書109を前方一致検索した結果を格
納した辞書検索結果リストの例を示す。図6の(a)
は、「かなかんじへん」という読み文字列情報により辞
書検索を行った結果の格納例である。図5に示した予測
辞書中には「かなかんじへん」という読み文字列で始ま
る(=前方一致検索の条件に該当する) 見出しは「かな漢
字変換」という見出しのみであるため、リストには1項
目のみが格納される。リスト中の、読み、表記、品詞、
表記頻度情報、確率情報は、辞書中の情報のコピーであ
り、一致長さ情報は、前方一致検索でー致した読み文字
列の長さ、即ち、この場合は「かなかんじへん」という
読みの長さを格納している。図6の(b)は「へん」と
いう読み文字列情報により辞書検索を行った結果の格納
例である。同じく該当する見出しは、「変換装置」のみ
であるため、リストには1項目が格納される。一致長さ
情報は前方一致した読み「へん」の長さである。図6の
(c)は「かな」という読み文字列情報により辞書検索
を行った結果の格納例である。この場合、該当する見出
しは、「かな漢字変換」と「神奈川県」の2つがあるた
め、2項目がリストに格納される。
【0030】次に、図7に示すフローチャートを用いて
予測制御部103の処理の流れを説明する。はじめにス
テップ701で、制御部102から受け取った読み文字
列を、読み文字列切り出し部107に送り、ステップ7
02で、結果の読み文字列リストと、部分読み文字列の
個数、例えば、図3に示したリストでは7(=即ち、図2
のフローチャートではiの値) を受け取り、変数max
に部分読み文字列の個数、即ち、部分読み文字列リスト
の項目数を代入する。次にステップ703に進み、変数
iに0を、変数cntに0を代入する。ステップ704
では、変数iと変数maxの値を比較し、変数iの値が
変数maxの値より小さければ、ステップ705へ進
む。変数iの値が変数max以上になったらステップ7
08に進む。ステップ705では、部分読み文字列リス
トの第i番目の読み文字列を、予測辞書検索部108に
送る。予測辞書検索部108では、先に説明したよう
に、送られてきた部分読み文字列により辞書を前方一致
検索し、検索結果を辞書検索結果リストに格納し、予測
制御部103に返す。例えば、図3にあげた部分読み文
字列リストの例では、第0番目の部分読み文字列「かな
かんじへん」が予測辞書検索部108に送られ、図6の
(a)に挙げたような検索結果リストが作成される。予
測制御部103はステップ706の処理に進み、検索結
果リストに格納されたn個の検索結果を、予測候補リス
トのcnt番目からcnt+n−1番目までに順にコピ
ーした後に、cntの値をn加算する。予測候補リスト
の形式例については後に説明する。次にステップ707
の処理に進み、変数iを1加算し、ステップ704の処
理に進む。先に述べたようにステップ704でのiとm
axの比較により条件が満たされている間はこのステッ
プ707までの処理が繰り返され、例えばi=5の時に
は「へん」という読みが予測辞書検索部108に送ら
れ、図6の(b)に挙げたような検索結果が作成され
る。
【0031】ここで図8に予測候補リストの例を示す。
予測候補リストのフォーマットは、図のように、それぞ
れの予測候補に対し、番号、読み、表記、品詞、表記頻
度情報、確率情報、一致長さ情報、尤度、有用度、po
int、判定の各情報で構成されている。このうち、読
み、表記、品詞、表記頻度情報、確率情報、一致長さ情
報は、辞書検索結果リストからコピーするものであり、
尤度、有用度、point、判定の各情報は、ステップ
708以降で付与されるものである。図8の例では、ま
ず図7でi=0の時にステップ706で図6の(a)の
情報が図8の第1番目にコピーされ、i=5の時に同じ
くステップ706で図6の(b)の情報が図8の第2番
目にコピーされる。iの値が1,2,4,6の時には予
測辞書109中に該当する見出しが登録されていないの
で検索の結果n=0となり、予測候補リストには何も格
納されない。以上の処理により、図7のステップ708
までに、図8に示したような予測候補リストが作成され
ている。
【0032】図7に戻りステップ708以降の処理を説
明する。ステップ704で条件が満たされなくなるとス
テップ708に進み、変数jに0が代入される。次にス
テップ709で変数jと変数cntの値を比較し、も
し、jが小さければステップ710の処理に進む。ステ
ップ710では、予測候補リストのj番目の候補を予測
候補評価部110に送り、結果を予測候補リストに書き
込んだ後、同じく結果を予測候補絞り込み部111に送
り、判別結果を再び予測候補リストに書き込む。例え
ば、図9の(a)は、図8の予測候補リストの第1番目
の情報を予測候補評価部110に送り、送られた結果を
リストに書き込んだ例である。また、(b)は、予測候
補絞り込み部111に情報を送り結果を書き込んだ例で
ある。
【0033】ここで、図11に示すフローチャートを用
いて予測候補評価部110の処理の流れを説明する。は
じめにステップ1101で、予測制御部107から送ら
れてきた予測候補情報のうち候補の読み文字列の長さを
調べ、変数lenに代入する。例えば、図8の第1番目
の予測候補が送られてきている場合、lenは「かなか
んじへんかん」の長さであるので、len=9となる。
次にステップ1102で、変数baseに、同じく送ら
れてくる予測候補からー致長さ情報を取り出し、代入す
る。例えば図8の第1番目の候補の場合、base=7
となる。ステップ1103では、予測候補リストの該当
する“尤度”の欄に、確率情報の(base−1)番目
の値を代入する。例えば、図8の第1番目の予測候補の
場合、“尤度は、“0”“7”“26”“67”“7
5”“75”“75”“75”の5番目の値である“7
5”となる。この時、図4の形式の予測辞書を用いてい
る場合には、ここで“尤度”の値を計算する。即ち、表
記頻度の値を、読み頻度情報の(base−1)番目の
値で割ったものを100倍した値を“尤度”に代入す
る。
【0034】次に、ステップ1104では、与えられた
式で“有用度”=len−baseを計算し、予測候補
リストの該当する“有用度”の欄に代入する。例えば、
図8の第1番目の予測候補の場合は、9−7=2とな
る。次に、ステップ1105では、与えられた式に基づ
き、これらの評価点(“尤度”、“有用度”) を代表す
る代表評価点pointを計算する。pointは図1
1に示したような式で計算されるが、必要に応じて適宜
各項目に対する定数倍の値を変えるなど、種々の計算方
法が可能である。ここでは、この式を採用しているの
で、例えば図8の第1番目の予測候補に対しては、75
*10+60+2=752となる。図8の第2番目の候
補が送られてきた時にも同様の処理が行われ、結果とし
て図10(a)の第2番目の結果が得られる。
【0035】ここで、図4に示した予測辞書は、辞書中
に表記頻度情報を保持しているが、これとは別に、辞書
中に表記頻度情報を保持しないことも可能である。この
場合、予測候補評価部110は、尤度の値の計算におい
て、読み頻度情報の最後の値を、読み頻度情報の(ba
se−1)番目の値で割ったものを100倍した値を
“尤度”に代入する。また、図5に示した予測辞書は、
辞書中の確率情報として表記頻度情報を部分読み文字列
の頻度情報で割った値の情報を保持しているが、これと
は別に見出しの読み頻度情報を、個々の部分読み文字列
の頻度情報で割った値の情報を保持することも可能であ
る。この場合、予測候補評価部110や、この尤度情報
を用いて評価を行う。
【0036】これらの表記頻度情報を用いない方式で
は、尤度情報は、部分読み文字列に対する表記文字列の
尤度ではなく、部分読み文字列に対する見出し読み文字
列の尤度となるため、同音語が存在する場合や、見出し
読み文字列と同じ読み文字列となるような他の文節区切
りの存在する場合に、尤度情報の確信度が低くなるが、
予測辞書の見出しが、慣用表現のような句レベルの表現
であり十分長い読み文字列である場合には、見出しの読
み文字列の頻度情報と部分読み文字列の頻度情報のみで
も尤度情報として用いることができる。
【0037】図12に示すフローチャートを参照して予
測候補絞り込みの処理の流れを説明する。はじめに、ス
テップ1201では、予測制御部103から送られてき
た尤度の情報に対して、その値とあらかじめ与えられて
いる値を比較する。ここでは尤度の値が10以上ならば
ステップ1202の処理に進み、10より小さいならば
ステップ1204の処理に進む。ステップ1202で
は、送られてきた有用度の情報に対して、その値とあら
かじめ与えられている値を比較する。ここでは有用度の
値が2以上ならばステップ1203の処理に進み、2よ
り小さいならばステップ1204の処理に進む。ステッ
プ1203では、判定結果を“○”として、予測制御部
103に返る。ステップ1204では、判定結果を
“×”として、予測制御部103に返る。この結果、図
8の予測候補リストの第1番目の候補に対しては、尤度
が10以上、有用度が2以上であるので判定“○”が与
えられ、第2番目の予測候補に対しては、尤度が10よ
り小さいため、判定“×”が与えられる。即ち、図11
のステップ1101で計算された尤度情報に対する下限
の値が設定され、尤度の値がこの下限以上である時の
み、予測候補とされる。また、図11のステップ110
2で計算された有用度情報、即ち、予測候補読み文字列
が与えられた部分読み文字列とー致した残りの読み文字
列の長さが、設定された下限値以上である時のみ、予測
候補とされる。
【0038】ここで図7に戻り、ステップ712以降を
説明する。即ち、ステップ711までの処理により各予
測候補に対して各種評価点( 尤度、有用度) と代表評価
点pointが付与された後、ステップ709での判定
により処理がステップ712に進む。ここで、ステップ
712では、候補リスト中のうち、判定結果が○である
もののみを選び、pointの値の大きい順にソート
し、上位x個の情報をソート順に出力バッファに代入す
る。出力バッファの形式は、予測候補リストの形式と同
様であるので、ここでは省略する。ここでxは、例え
ば、1、3、10等の任意の正の整数であればよいが、
ここでは3であるとする。図10の(b)に示した予測
候補リストでは、判定が“○”であるものは第1番目の
予測候補1つのみであるので、この予測候補、即ち、表
記「かな漢字変換」他の情報を出力バッファにセットす
る。ステップ713では、出力バッファの情報が予測制
御部103から制御部102に送られる。
【0039】次に、図13を用いて予測辞書に登録され
る情報の別の実施形態を説明する。
【0040】この形式では、図4、図5に示した予測辞
書と、読み、表記、品詞、表記頻度情報の部分は同様で
ある。次の、予測開始文字列長情報が、この形態の特徴
であるが、これは予測辞書検索部が辞書検索を行う際
に、受け取った部分読み文字列と前方一致すべき読み文
字数の下限値を各登録見出し毎に設定しているものであ
る。具体的には、図5の確率情報の欄の値が10以上と
なるカラムの序数+1、即ち、確率情報が10以上にな
る読み文字数を与えている。即ちこの場合、予測辞書に
は、読み頻度情報、確率情報は付与されておらず、代わ
りに予測開始文字列長情報が付与されている。
【0041】次に、図14を用いて、図13に示す実施
形態をとる予測辞書を用いる場合の、予測辞書検索部1
08の処理の流れを説明する。まずステップ1401で
予測制御部103より受け取った読み文字列をキーとし
て予測辞書に通常の前方一致検索を行い、候補すべてを
バッファにコピーする。バッファの形式は図6に示した
検索結果リストと同様であるのでここでは省略するが、
確率情報の欄の代わりに予測開始文字列長情報の欄が設
けられている。変数kouhoに候補の数を代入し、ス
テップ1402に進む。ステップ1402では、変数i
に1を、変数jに1を代入する。次にステップ1403
では、変数iと変数kouhoの値を比較し、変数iが
変数kouho以下であれば、ステップ1404に進
む。変数kouhoより大きければ、処理を終了する。
ステップ1404では、変数len1にバッファのi番
目の候補の前方一致した読み文字列長、即ちー致長さ情
報を代入し、変数len2にバッファのi番目の候補の
予測開始文字列長情報を代入する。ステップ1405に
進み、変数len1と変数len2の値を比較し、変数
len1が変数len2以上であればステップ1406
に、それより小さければステップ1408に進む。ステ
ップ1406では、バッファのi番目の予測候補を検索
結果リストのj番目にコピーする。検索結果リストの形
式は先に述べたバッファの形式と同様である。次にステ
ップ1407でjを1加算した後、ステップ1408に
進む。ステップ1408ではiを1加算して、ステップ
1403に戻る。以上の処理により、各登録見出し毎に
設定された、受け取った部分読み文字列と前方一致すべ
き読み文字数の下限値以上が前方一致する見出しのみが
予測候補として残される。
【0042】次に、図15を用いて、図11に示す実施
形態をとる予測辞書を用いる場合の、予測制御部103
の処理の流れを説明する。まずステップ1501で、受
け取った読み文字列を読み文字列切り出し部107に送
り、ステップ1502で結果を受け取り、ステップ15
05で予測辞書検索部108に情報を送り、ステップ1
506で結果を候補リストにセットする。ステップ15
02から1506までは、図7に示したフローチャート
のステップ701からステップ706までの処理と同様
の処理である。但し、候補リストには、特に、“尤
度”、“優先度”、“point”、“判定”の各情報
の欄は必要ない。ステップ1504でiがmaxの値以
上になった時ステップ1508に進むが、ステップ15
08では、候補リストを表記頻度の順にソートし、上位
の候補を出力バッファにセットし、ステップ1509で
出力バッファの情報を制御部102に送る。即ち、この
場合、“尤度”や“優先度”や“point”を読み出
したり計算したりする予測候補評価部110や、予測候
補の絞り込みを行う予測候補絞り込み部111は必要な
い。
【0043】次に、図16を用いて、予測候補の表示例
とそれに関わる制御部102の動きを説明する。図16
の(c)は、制御部102が予測制御部103から予測
結果を受け取り、入力された読み情報と予測された漢字
かな表記をディスプレー画面上に表示してユーザに提示
した例である。ここでは、「か」「な」「か」と順番に
読み文字列が入力され、「かなか」まで入力が進んだ時
点で、先に述べたような予測制御部103の処理によ
り、該当する予測候補が出力された場合の例を示してい
る。先に述べた予測辞書109と予測制御部103の処
理によると、「か」と入力された時点では予測制御部1
03から制御部102に送られる予測候補が1つもな
く、図16の(a)のように予測候補の表示は行われな
い。次に「かな」と入力されると、「かな」という読み
文字列が予測制御部103に送られて「神奈川県」とい
う予測候補が予測制御部103から制御部102に返さ
れ、図16の(b)のように候補表示が行われる。ここ
で次の「か」が入力されると前の候補表示は取り消さ
れ、次の「かなか」という読み文字列が予測制御部10
3に送られて「かな漢字変換」という予測候補が予測制
御部103から制御部102に返され、図16の(c)
のように候補表示が行われる。
【0044】ここでユーザが予測候補採用キー、例えば
上矢印キー↑を押すと、表示されていた予測候補中の反
転予測候補(予測候補が1つの場合にはその予測候補)
が採用され、図16の(d)のようにディスプレーの表
示が変更される。予測候補は1つとは限らないので複数
個の表示が行われる場合もある。その時には、予測制御
部103の出力バッファの上位から順番に予測候補ウィ
ンドウに表示され、はじめは第1番目の候補が反転表示
される。そこで、例えばユーザが予測候補移動キー例え
ば右矢印キー→を押すと、反転表示される予測候補がひ
とつずつ移動し、望まれる候補が反転表示されたところ
で↑キーが押されると、その候補が採用される。
【0045】次に、図17を用いて、読み文字列のかな
漢字変換部104と予測制御部103への受け渡しに関
わる、制御部102の処理を説明する。まずステップ1
701で変換対象読み文字列バッファと予測対象読み文
字列バッファの内容を初期化する。ステップ1702
で、ユーザーのキーボード入力を待ち、入力があったら
ステップ1703に進む。キーボードからの入力が読み
文字入力か否かを調べ、読み文字列以外の場合ステップ
1704に、読み文字列の場合ステップ1707に進
む。入力が読み文字であるか否かはあらかじめ与えられ
たテーブルを参照する等の処理で行うことが可能であ
る。ここで句読点は読み文字列ではないとする。また入
力がいわゆるローマ字入力である場合には、読み1文字
にあたる入力があるまでここでバッファリングを行う。
ステップ1707では、変換対象読み文字列バッファ
に、入力された読み1文字を追加し、次のステップ17
08へ進む。ステップ1708では予測対象読み文字列
バッファに入力された読み1文字を追加し、次に進む。
ステップ1709では、予測制御部103に予測対象読
み文字列バッファ中の読み文字列情報を送り、予測処理
がスタートする。予測制御部103は先に述べたような
処理を行い、結果を制御部102に返す。予測制御部1
03から結果を受け取った制御部102はステップ17
10に処理を進め、先に述べたような結果の表示処理を
行い、ステップ1702の処理に戻る。
【0046】ステップ1704では、キーボード入力が
予測選択キー、例えば先に述べた矢印キー↑であるか否
かを調べ、該当すればステップ1711の処理に、それ
以外であればステップ1705の処理に進む。ステップ
1711では、変換対象読み文字列バッファに選択キー
により選択された予測候補のうちキーボードからの入力
読み文字列ではない部分、即ち、予測補完された読み文
字列を追加する。例えば図16(c)から(d)の例で
は、既に「かなか」という読み文字列まではステップ1
707により変換対象読み文字列バッファに記憶されて
おり、ここにステップ1711で「んじへんかん」とい
う読み文字列が追加される結果、「かなかんじへんか
ん」という読み文字列が予測対象読み文字列バッファに
記憶される。同様にステップ1712では予測対象読み
文字列バッファに予測補完された読み文字列が追加され
る。図16(c)から(d)の例では、既に「かなか」
という読み文字列まではステップ1707により予測対
象読み文字列バッファに記憶されており、ここにステッ
プ1711で「んじへんかん」という読み文字列が追加
される結果、「かなかんじへんかん」という読み文字列
が予測対象読み文字列バッファに記憶される。
【0047】次にステップ1713で、制御部102は
かな漢字変換部104に変換対象読み文字列バツファの
情報を送り、かな漢字変換処理がスタートする。かな漢
字変換部104は結果を制御部102に返す。制御部1
02はステップ1714に進み表示処理を行う。かな漢
字変換処理部と、それにかかわる表示処理については、
広く公知であるのでここでは言及しない。次に処理がス
テップ1718に進み、変換対象読み文字列バッファの
内容がクリアされた後、ステップ1702の処理に戻
る。次にステップ1705で、キーボードからの入力が
変換指示キー、例えば変換キーであった場合、処理はス
テップ1713に進み、以下同様に進む。それ以外の時
はステップ1706に進む。次にステップ1706で、
キーボードからの入力が句読点キーであった時、ステッ
プ1715に進み、それ以外のキーであれば、別途定義
されているそれ以外の処理に進む。ステップ1715で
は、かな漢字変換部104に変換対象読み文字列バッフ
ァの情報を送り、ステップ1716でその結果を受け取
り、表示処理を行う。続いて、ステップ1717で予測
対象読み文字列バッファをクリアした後、ステップ17
18に進んで変換対象読み文字列バッファの情報をクリ
アし、ステップ1702に戻る。
【0048】以上の処理を繰り返すことにより、制御部
102は、入力された読み文字列と予測補完された読み
文字列の情報をかな漢字変換部104と予測制御部10
3へと受け渡し、結果を受け取って次の処理へと進む。
例えば、図16(d)の状態に統けて「そ」という読み
文字列が入力された場合、ステップ1708で「そ」と
いう読み文字列が予測対象読み文字列バッファに追加さ
れ、ステップ1709で「かなかんじへんかんそ」とい
う読み文字列が予測制御部103に送られる。
【0049】ここで先に述べたような処理により、予測
制御部103では「へんかんそ」という部分文字列に対
し、図18に示したような予測候補リストを作成し、こ
れを出力バッファを介して制御部102に返す。ステッ
プ1710で表示処理が行われた結果を示したのが図1
9(a)、これが↑キーにより選択された後の表示が図
(b)である。
【0050】ここで、例えば図10(b)に示したよう
に「かなかんじへ」という入力に対しては「変換装置」
という候補は判定が“×”になり表示されないが、「か
なかんじへんかんそ」まで入力が確定した時点では「変
換装置」という候補の判定が○になり、候補表示が行わ
れる。また、例えば、「さ」「い」「き」「ん」「の」
「か」「な」「か」と入力が進んだ時には、ステップ1
709で「さいきんのかなか」という読み文字列が予測
制御部103に送られ、先の「かなか」の入力例と同様
に「かなか」という部分読み文字列に対する処理の結果
「かな漢字変換」という予測結果が予測制御部103か
ら戻ってきて図20(a)のように表示されるが、ここ
で予測採用選択キー例えば↑キーにより候補が選択され
ると処理がステップ1713まで進んで「さいきんのか
なかんじへんかん」という読み文字列がかな漢字変換部
104に送られ、結果として図20(b)のように「最
近のかな漢字変換」という変換結果が表示される。
【0051】ここで、図17に示した予測制御部103
の処理では、ステップ1712の処理の後、ステップ1
713で変換対象読み文字列バッファの情報をかな漢字
変換部に送っているが、別の形態として、図24に示す
フローチャートのように、ステップ1712の直後には
かな漢字変換を行わず、ステップ1719に進み、ディ
スプレー上には変換対象読み文字列バッファ中の読み文
字列のうち、予測候補に含まれない部分を読みのまま、
予測候補を漢字かな表記で表示するという処理も可能で
ある。例えば、先に挙げた「さ」「い」「き」「ん」
「の」「か」「な」「か」の例では、図20(a)のよ
うに表示された後に、予測採用選択キーが押された時、
図25のように「さいきんのかな漢字変換」というよう
に表示される。その後、ステップ1702に戻り、ユー
ザからの入力が変換指示キーかまたは句読点だった時点
で残りの漢字かな表記が未確定だった読みの部分も漢字
かな表記に変換される。
【0052】次に、図21を用いて予測補完された読み
文字列の情報を含めた読み文字列が予測制御部103に
受け渡される場合の、予測辞書の別の形態を示す。この
図において、読み情報から確率情報までは図5に示した
予測辞書と同形式であるが、それに追加して、各見出し
は分割可能位置の情報を持つ。
【0053】図22は、分割可能位置情報を持つ予測辞
書を使用した場合の、図17のフローチャートで説明し
た予測対象読み文字列バッファの形式である。ここで、
予測対象読み文字列バッファは、読み文字列バッファの
情報以外に、分割可能位置情報を持つ。ステップ171
2で、予測補完された読み文字列を予測対象読み文字列
バッファに追加する際、対応する予測候補の分割可能位
置情報を参照し、予測対象読み文字列バッファ中の読み
文字列の対応する位置情報を算出して、図22のように
分割可能位置情報を書き込む。例えば「かなか」という
入力に対して「かな漢字変換」という予測候補が選択さ
れた場合、ステップ1712で「んじへんかん」という
読み文字列を読み文字列バッファに追加し、辞書情報で
ある「かなかんじへんかん」が読み文字列バッファの
「かなかんじへんかん」のm番目の文字から始まってい
るかを調べ( この場合、m=0) 、m+1の値、即ち、
この場合“1”と、辞書情報である分割可能位置“6”
にmを足した値、この場合“6”と、「かなかんじへん
かん」という読み文字列の長さをm+1に足した値、こ
の場合“10”を、分割可能位置情報に書き込む。
【0054】図23は、分割可能位置情報を持つ予測対
象読み文字列バッファを使用した場合の、読み文字列切
り出し部107の処理の流れを示すフローチャートであ
る。図のステップ2301からステップ2306までの
処理は図2のステップ201からステップ206と同様
であるのでここでは説明を省略する。ステップ2307
では、変数startの値が、予測対象読み文字列バッ
ファの分割可能位置情報とー致するか否かを調べ、もし
ー致すればステップ2308に進んで、読み文字列バッ
ファのstart番目の文字からlen番目の文字まで
を読み文字列バッファのi番目にコピーし、iを1加算
した後にステップ2309に進む。もしステップ230
7で値がー致しなければそのままステップ2309の処
理に進む。ステップ2309では、startの値を1
加算し、ステップ2306の処理に戻る。
【0055】以上の処理により、「かなかんじへんか
ん」という読み文字列までが確定しており、次に「そ」
という読みが入力された際、図2に示した読み文字列切
り出し処理によると、「かなかんじへんかんそ」「なか
んじへんかんそ」「かんじへんかんそ」「んじへんかん
そ」「じへんかんそ」「へんかんそ」「かんそ」「ん
そ」「そ」という9個の部分読み文字列が切り出され、
このそれぞれに対して予測辞書検索を行うことになるた
め、不必要な辞書検索処理時間がかかる他、例えば予測
辞書中に「乾燥機」などの候補がありこれが条件を満足
して予測候補として表示された場合、図16(d)のよ
うに「かな漢字変換」という候補がすでに表示されてい
るところに「乾燥機」という予測候補が表示されること
になり、不必要な候補の表示が行われることになるが、
図23に示した処理によると「かなかんじへんかんそ」
「へんかんそ」「そ」という3個の部分読み文字列のみ
が切り出され、予測辞書検索を行うことになるため、不
要な処理時間が省略され、また不要な予測候補表示が抑
制されることになり、処理の品質が向上する。
【0056】尚、本発明は日本語入力のみ例示して説明
したが、これに制限されるものでなく、例えば機械翻訳
にも同様に応用できるものである。
【0057】
【発明の効果】以上、本発明によれば、予測制御部10
3から読み文字列切り出し部107に送られた読み文字
列に対して対応する部分読み文字列のリストが作成さ
れ、その各々に対して前方一致する予測候補が予測辞書
検索部108によって予測辞書109から読み出されて
予測候補リストが作成され、さらに予測辞書109に記
憶されていた読み文字列の部分文字列の頻度情報、見出
し漢字かな表記文字列の頻度情報、または、部分読み文
字列に対する見出し漢字かな表記の確率情報によって予
測候補評価部110で前方一致した読み文字列に対する
見出し漢字かな表記の尤度情報と、それに基づく評価点
が計算され、予測制御部103で前記評価点の順に予測
候補が優先順位付けされて、その上位n位がユーザに呈
示されることにより、文章入力中の任意の位置から自動
的に入力予測を行った結果を高精度に優先順位付けして
ユーザに呈示することができることにより、文書入力の
効率が向上し、簡易に日本語入力を行うことができる。
【図面の簡単な説明】
【図1】本発明の日本語予測入力システムの実施形態を
示すブロック図、
【図2】本発明の日本語予測入力方法に従う、読み文字
列切り出し部の処理の流れを示すフローチャート、
【図3】読み文字列リストのフォーマットと、処理結果
の格納例を示す図、
【図4】予測辞書に登録される情報の実施形態を示す
図、
【図5】予測辞書に登録される情報の別の実施形態を示
す図、
【図6】辞書検索結果リストのフォーマットと、処理結
果の格納例を示す図、
【図7】本発明の日本語予測入力方法を実現する予測制
御部の処理の流れを示すフローチャート、
【図8】予測候補リストのフォーマットと格納例を示す
図、
【図9】予測候補リストの格納例を示す図、
【図10】予測候補リストの格納例を示す図、
【図11】本発明の日本語予測入力方法を実現する予測
候補評価部の処理の流れを示すフローチャート、
【図12】本発明の日本語予測入力方法を実現する予測
候補絞り込み部の処理の流れを示すフローチャート、
【図13】予測辞書に登録される情報の別の実施形態を
示す図、
【図14】本発明の日本語予測入力方法を実現する予測
辞書検索部の処理の流れを示すフローチャート、
【図15】本発明の日本語予測入力方法を実現する予測
制御部の処理の流れを示すフローチャート、
【図16】予測候補の表示例を示す図、
【図17】本発明の日本語予測入力方法を実現する制御
部の処理の流れを示すフローチャート、
【図18】予測候補リストの格納例を示す図、
【図19】予測候補の表示例を示す図、
【図20】予測候補の表示例を示す図、
【図21】予測辞書に登録される情報の別の実施形態を
示す図、
【図22】予測対象読み文字列バッファのフォーマット
と格納例を示す図、
【図23】本発明の日本語予測入力方法を実現する読み
文字列切り出し部の処理の流れを示すフローチャート、
【図24】本発明の日本語予測入力方法を実現する制御
部の処理の流れを示すフローチャート、
【図25】予測候補の表示例を示す図、
【符号の説明】
101…入力部、102…制御部、103…予測制御
部、104…かな漢字変換部、105…かな漢字変換辞
書検索部、106…かな漢字変換辞書、107…読み文
字列切り出し部、108…予測辞書検索部、109…予
測辞書、110…予測候補評価部、111…予測候補絞
り込み部

Claims (22)

    【特許請求の範囲】
  1. 【請求項1】 読み文字列を入力し、この入力あるいは
    予測補完された読み文字列から少なくとも一部の部分文
    字列群を取り出し、取り出された部分文字列と読みが前
    方一致する漢字かな表記を辞書を用いて検索し、前記辞
    書中にある漢字かな表記文字列に対する頻度情報と読み
    文字列の部分文字列の少なくとも一部に対する頻度情報
    を用いて検索された漢字かな表記の優先順位付けを行な
    い日本語予測入力することを特徴とする日本語予測入力
    方法。
  2. 【請求項2】 読み文字列を入力し、この入力あるいは
    予測補完された読み文字列から少なくとも一部の部分文
    字列群を取り出し、取り出された部分文字列と読みが前
    方一致する漢字かな表記を辞書を用いて検索し、前記辞
    書中にある漢字かな表記文字列に対する、前方一致した
    読み文字列毎の尤度情報を用いて検索された漢字かな表
    記の優先順位付けを行ない日本語予測入力することを特
    徴とする日本語予測入力方法。
  3. 【請求項3】 前記辞書中にある漢字かな表記文字列に
    対する、前方一致した読み文字列毎の尤度情報を、前記
    漢字かな表記文字列に対する頻度情報と前記読み文字列
    の部分文字列に対する頻度情報から算定し、算定された
    尤度情報を用いて検索された漢字かな表記の優先順位付
    けを行うことを特徴とする請求項2記載の日本語予測入
    力方法。
  4. 【請求項4】 読み文字列を入力し、この入力あるいは
    予測補完された読み文字列から少なくとも一部の部分文
    字列群を取り出し、取り出された部分文字列と読みが前
    方一致する漢字かな表記を辞書を用いて検索し、前記辞
    書中にある読み文字列の部分文字列の少なくとも一部に
    対する頻度情報を用いて検索された漢字かな表記の優先
    順位付けを行い日本語予測入力することを特徴とする日
    本語予測入力方法。
  5. 【請求項5】 読み文字列を入力し、この入力あるいは
    予測補完された読み文字列から少なくとも一部の部分文
    字列群を取り出し、取り出された部分文字列と読みが前
    方一致する漢字かな表記を辞書を用いて検索し、前記辞
    書中にある読み文字列に対する、前方一致した読み文字
    列毎の尤度情報を用いて検索された漢字かな表記の優先
    順位付けを行い日本語予測入力を行なうことを特徴とす
    る日本語入力予測方法。
  6. 【請求項6】 前記辞書中にある漢字かな表記文字列に
    対する、前方一致した読み文字列毎の尤度情報を前記読
    み文字列の部分文字列に対する頻度情報から算定し、こ
    の尤度情報を用いて検索された漢字かな表記の優先順位
    付けを行うことを特徴とする請求項5記載の日本語予測
    入力方法。
  7. 【請求項7】 更に、優先順位付けされた漢字かな表記
    中の上位n位(nは任意)を出力することを特徴とする
    請求項1乃至6記載の日本語予測入力方法。
  8. 【請求項8】 日本語文の一部を構成する漢字かな表記
    およびその読み文字列を記憶した辞書と、読み文字列を
    入力する手段と、入力あるいは予測補完された読み文字
    列から部分文字列群のー部または全部を取り出す手段
    と、取り出された部分文字列と読みが前方一致する漠宇
    かな表記を前記辞書から検索する手段と、前記辞書中に
    ある漢字かな表記文字列に対する頻度情報と、読み文字
    列の部分文字列のー部または全部に対する頻度情報を用
    いて検索された漢字かな表記の優先順位付けする手段と
    を具備することを特徴とする日本語予測入力システム。
  9. 【請求項9】 日本語文の一部を構成する漢字かな表記
    およびその読み文字列を記憶した辞書と、読み文字列を
    入力する手段と、入力あるいは予測補完された読み文字
    列から部分文字列群のー部または全部を取り出す手段
    と、取り出された部分文字列と読みが前方一致する漢字
    かな表記を前記辞書から検索する手段と、前記辞書中に
    ある漢字かな表記文字列に対する、前方一致した読み文
    字列毎の尤度情報を用いて検索された漢字かな表記の優
    先順位付けを行う手段とを具備することを特徴とする日
    本語予測入力システム。
  10. 【請求項10】 前記辞書中にある漢字かな表記文字列
    に対する、前方一致した読み文字列ごとの尤度情報を、
    前記漢字かな表記文字列に対する頻度情報と、前記読み
    文字列の部分文字列に対する頻度情報とから算定する手
    段と、この尤度情報を用いて検索された漢字かな表記の
    優先順位付けを行う手段とを具備することを特徴とす
    る、請求項9記載の日本語予測入力システム。
  11. 【請求項11】 日本語文のー部を構成する漢字かな表
    記およびその読み文字列を記憶した辞書と、読み文字列
    を入力する手段と、入力あるいは予測補完された読み文
    字列から部分文字列群のー部または全部を取り出す手段
    と、取り出された部分文字列と読みが前方一致する漢字
    かな表記を前記辞書から検索する手段と、前記辞書中に
    ある読み文字列の部分文字列のー部または全部に対する
    頻度情報を用いて検索された漢字かな表記の優先順位付
    けを行なう手段とを具備することを特徴とする、日本語
    予測入力システム。
  12. 【請求項12】 日本語文のー部を構成する漢字かな表
    記およびその読み文字列を記憶した辞書と、読み文字列
    を入力する手段と、入力あるいは予測補完された読み文
    字列から部分文字列群を取り出す手段と、取り出された
    部分文字列と読みが前方一致する漢字かな表記を前記辞
    書から検索する手段と、前記辞書中にある読み文字列に
    対する、前方一致した読み文字列毎の尤度情報を用いて
    検索された漢字かな表記の優先順位付けを行う手段とを
    具備することを特徴とする、日本語予測入力システム。
  13. 【請求項13】 前記辞書中にある漢字かな表記文字列
    に対する、前方一致した読み文字列毎の尤度情報を、前
    記読み文字列の部分文字列に対する頻度情報から算定す
    る手段と、この尤度情報を用いて検索された漢字かな表
    記の優先順位付けを行う手段とを具備することを特徴と
    する、請求項12記載の日本語予測入力システム。
  14. 【請求項14】 優先順位付けされた漢字かな表記中の
    上位n 位(nは任意) を出力する手段を更に具備すること
    を特徴とする、請求項8乃至13記載の日本語予測入力
    システム。
  15. 【請求項15】 既に入力した文字を手掛かりに入力さ
    れる文字列を予測し、入力する日本語予測入力システム
    において用いられ、入力される読み文字列を取り込むス
    テップと、取り込まれた読み文字列あるいは予測補完さ
    れた読み文字列から少なくとも一部の部分文字列群を切
    り出すステップと、切り出された部分文字列と読みが前
    方一致する漢字かな表記を辞書を用いて検索するステッ
    プと、前記辞書中にある漢字かな表記文字列に対する頻
    度情報と読み文字列の部分文字列の少なくともー部に対
    する頻度情報、もしくは前記辞書中にある読み文字列の
    少なくとも一部に対する頻度情報を用いて検索された漢
    字かな表記の優先順位付けを行なうステップとがプログ
    ラムされ記録されるコンピュータ読み取り可能な記録媒
    体。
  16. 【請求項16】 既に入力した文字を手掛かりに入力さ
    れる文字列を予測し、入力する日本語予測入力システム
    において用いられ、入力される読み文字列を取り込むス
    テップと、取り込まれた読み文字列あるいは予測補完さ
    れた読み文字列から少なくとも一部の部分文字列群を切
    り出すステップと、切り出された部分文字列と読みが前
    方一致する漢字かな表記を辞書を用いて検索するステッ
    プと、前記辞書中にある漢字かな表記文字列に対する前
    方一致した読み文字列毎の尤度情報、もしくは前記辞書
    中にある読み文字列に対する前方一致した読み文字列毎
    の尤度情報を用いて検索された漢字かな表記の優先順位
    付けを行なうステップとがプログラムされ記録されるコ
    ンピュータ読み取り可能な記録媒体。
  17. 【請求項17】 読み文字列リスト、読み文字列バッフ
    ァを初期化するステップと、入力される読み文字列を上
    記読み文字列バッファにセットするステップと、読み文
    字列バッファにセットされた文字列長を変数とし、入力
    される読み文字列の先頭から、その読み文字列の最後部
    の文字を含む部分読み文字列を逐一上記読み文字列リス
    トに格納するステップとがプログラムされ記録されるコ
    ンピュータ読み取り可能な請求項15乃至16記載の記
    録媒体。
  18. 【請求項18】 読み文字列リストの内容とその部分読
    み文字列の個数を受け取るステップと、部分読み文字列
    の個数を変数とし、逐一送られてくる部分文字列により
    辞書を前方一致検索し、その検索結果を辞書検索結果リ
    ストに格納するステップと、検索結果リストに格納され
    たn個の検索結果を予測候補リストに複写するととも
    に、予測候補リストの個数を変数とし、複写される表記
    頻度情報、読み頻度情報に基づき、あるいは複写される
    情報の他に少なくとも尤度を計算することによって予測
    評価を行ない、上記予測候補リストの該当個所に書き込
    むステップとがプログラムされ記録されるコンピュータ
    読み取り可能な請求項15乃至16記載の記録媒体。
  19. 【請求項19】 予測候補リストを介して送られてきた
    予測候補情報から候補の読み文字列の長さ(len)を
    調べるとともに一致長さ情報(base)を取り出すス
    テップと、確率情報の(base−1)の値、もしくは
    辞書に含まれる表記頻度を読み頻度情報の(base−
    1)番目の値を尤度として計算するステップと、(le
    n−base)を計算することによって有用度を求める
    ステップと、尤度、有用度に基づく任意のポイント計算
    を行い予測評価を行なうステップとがプログラムされ記
    録されるコンピュータ読み取り可能な請求項16記載の
    記録媒体。
  20. 【請求項20】 送られてくる尤度の情報に対しあらか
    じめ定義された第1の値と比較するステップと、送られ
    てくる有用度の情報に対しあらかじめ定義される第2の
    値と比較するステップと、これら比較の結果に従い予測
    候補の絞り込みを行なうステップとがプログラムされ記
    録されるコンピュータ読み取り可能な請求項16記載の
    記録媒体。
  21. 【請求項21】 受け取った読み文字列をキーに辞書を
    用いて前方一致検索を行ない、候補をバッファに複写す
    るステップと、前方一致した候補を変数として、バッフ
    ァのi番目候補の前方一致読み文字列長とバッファのi
    番目候補の、上記検索結果リストに格納されてある予測
    開始文字列長情報との比較を行なうステップと、比較の
    結果によっては予測候補としてバッファのi番目の内容
    を検索結果リストの該当個所に反映させるステップとが
    プログラムされ記録されるコンピュータ読み取り可能な
    請求項15記載の記録媒体。
  22. 【請求項22】 既に入力された文字を手掛かりに、入
    力される文字列を予測し入力することのできる日本語予
    測入力システムにおいて用いられ、変換対象読み文字列
    バッファと予測対象読み文字列バッファを初期化するス
    テップと、読み文字入力をチェックし、入力された読み
    文字を変換対象読み文字列バッファに追加するステップ
    と、読み文字入力以外の予測を指示していたとき、変換
    対象読み文字列バッファに予測補完された読み文字を、
    予測対象読み文字列バッファに予測補完された読み文字
    を追加するステップと、読み文字入力以外の予測指示、
    あるいは変換指示があったとき、変換対象読み文字列バ
    ッファにある読み文字列のかな漢字変換処理を行い、結
    果を画面表示するステップとがプログラムされ記録され
    るコンピュータ読み取り可能な請求項15乃至16記載
    の記録媒体。
JP10038990A 1998-02-20 1998-02-20 日本語予測入力方法ならびにシステム及び同方法がプログラムされ記録される記録媒体 Pending JPH11238056A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10038990A JPH11238056A (ja) 1998-02-20 1998-02-20 日本語予測入力方法ならびにシステム及び同方法がプログラムされ記録される記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10038990A JPH11238056A (ja) 1998-02-20 1998-02-20 日本語予測入力方法ならびにシステム及び同方法がプログラムされ記録される記録媒体

Publications (1)

Publication Number Publication Date
JPH11238056A true JPH11238056A (ja) 1999-08-31

Family

ID=12540587

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10038990A Pending JPH11238056A (ja) 1998-02-20 1998-02-20 日本語予測入力方法ならびにシステム及び同方法がプログラムされ記録される記録媒体

Country Status (1)

Country Link
JP (1) JPH11238056A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012132767A1 (ja) * 2011-03-31 2012-10-04 株式会社エヌ・ティ・ティ・ドコモ 携帯端末

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012132767A1 (ja) * 2011-03-31 2012-10-04 株式会社エヌ・ティ・ティ・ドコモ 携帯端末
JPWO2012132767A1 (ja) * 2011-03-31 2014-07-28 株式会社Nttドコモ 携帯端末

Similar Documents

Publication Publication Date Title
KR100330801B1 (ko) 언어식별장치및언어식별방법
US4831529A (en) Machine translation system
JP2741575B2 (ja) 文字認識文字補完方法及びコンピュータ・システム
EP0370774A2 (en) Machine translation system
KR19990078364A (ko) 문서처리장치 및 그의 방법
JPH10326275A (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
JPH11238056A (ja) 日本語予測入力方法ならびにシステム及び同方法がプログラムされ記録される記録媒体
JPH07271774A (ja) 文章入力装置
JP2000010969A (ja) 日本語予測入力方法ならびにシステム及び同方法がプログラムされ記録される記録媒体
JPH11242670A (ja) 日本語予測入力方法ならびにシステム及び同方法がプログラムされ記録される記録媒体
JP2959769B2 (ja) 日本語文字列の形態素解析方法及び装置
JPH0561902A (ja) 機械翻訳システム
JPH05282360A (ja) 多国語入力装置
JP2000330984A (ja) 文書処理装置及び方法
JP2000057133A (ja) 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体
JPH01229369A (ja) 文字処理装置
JP2000048019A (ja) 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体
JPH0793345A (ja) 文書検索装置
JPH06149790A (ja) 文章作成装置
JPH0128977B2 (ja)
JP2000276466A (ja) 文字列予測装置、文字列予測方法および文字列予測プログラムを記憶した記憶媒体
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JPH0567080A (ja) かな漢字変換装置
JPH0773174A (ja) 日本語処理システム
JPH06149791A (ja) 漢字文章入力装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050301

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050420

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060620

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060810

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070313