JP3327642B2

JP3327642B2 - 仮名漢字交じり変換装置

Info

Publication number: JP3327642B2
Application number: JP23469393A
Authority: JP
Inventors: 至幸小山
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1993-09-21
Filing date: 1993-09-21
Publication date: 2002-09-24
Anticipated expiration: 2017-09-24
Also published as: JPH0793314A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、かな漢字変換装置に係
り、特に漢字と仮名が混在したものが入力されることが
想定される仮名漢字交じり変換装置装置に関する。

【０００２】

【従来の技術】従来より、文書作成装置等に手書きのペ
ン入力などによって漢字文字列を直接入力するという技
術がある。

【０００３】しかしながら直接漢字を入力する際にも漢
字を忘れてしまって思い出せない時や、書くのに面倒な
漢字がありその文字は仮名で書きたいという場合があ
る。例えば「片りん」と買いて「片鱗」と変換したいと
いうものである。このように漢字仮名交じりの文字列を
入力して適切な漢字文字列にする（以下、これを漢字仮
名交じり変換という）方法として主に次の二つの方法が
ある。

【０００４】１つは漢字仮名交じりの見出しとそれに対
応する漢字の表記の辞書を持つことによって仮名漢字交
じり変換しようというものである。例えば「片りん」の
場合は「片りん」という見出しと、それに対応する漢字
の表記「片鱗」が入っている辞書を持つという方法であ
る。このような技術は特開昭６２−２０９６６７で示さ
れている。

【０００５】もう１つは漢字を仮名に直す辞書を持つこ
とにより、入力された文字列の漢字を仮名に直し、その
直された仮名文字列に対して通常の仮名漢字変換を行な
うというものである。例えば「片りん」の場合は、
「片」を仮名に直し「へん、かた」となり、「へんり
ん、かたりん」を仮名漢字変換し表記と一致する「片
鱗」を候補とする方法である。このような技術は特開昭
５５−５９５７８、特開昭６３−３７４６５等で示され
ている。

【０００６】

【発明が解決しようとする課題】しかしながら入力文字
列によっては上記の仮名漢字交じり変換の方法で、すべ
ての入力文字列を適切に変換できるわけではない。

【０００７】１つ目の漢字仮名交じりの見出しを持つ方
法では、どのような形で漢字仮名交じりの文字列が入力
されても変換できるような漢字仮名交じりの見出しを持
つことは事実上不可能であり（仮名漢字変換の辞書もす
べての日本語の単語が登録されているわけではない）、
入力文字列によっては変換できないものがある。

【０００８】２つ目の漢字を仮名に直し仮名漢字変換す
る方法では、特殊な読みを持つ単語については適切な仮
名に直すことができないので、結果として正しく変換で
きないという問題が起こる。例えば「風ろ」を入力して
「風呂」と変換したい場合を考えると、「風」という漢
字の読みは普通「ふう」と「かぜ」であり、「ふうろ、
かぜろ」を仮名漢字変換しても「風呂」という候補は得
られない。

【０００９】従って、本発明の目的は、上記の課題を解
決し、適切に変換できない漢字仮名交じりの文字列を極
力減らすことが可能な仮名漢字交じり変換装置を提供す
ることにある。

【００１０】

【課題を解決するための手段】上記目的は、本発明によ
れば、漢字仮名交じりの文字列を入力する入力手段と、
仮名漢字交じり変換できなかった文字列を登録する登録
手段と、前記登録手段によって登録された文字列に対応
する正しい表記を、当該文字列に含まれる漢字の一部を
インデックスとして残りの文字列と共に保持するユーザ
辞書と、前記漢字仮名交じりの文字列を仮名漢字交じり
変換するための予め定められた変換辞書情報を格納する
標準辞書と、前記入力された文字列から漢字を抽出する
抽出手段と、前記抽出された漢字と一致する漢字を前記
ユーザ辞書のインデックスにより検索する検索手段と、
前記検索手段が一致するインデックスを検索したとき
に、対応保持された表記を前記ユーザ辞書から読み出し
て変換候補としての表記を生成すると共に、一致するイ
ンデックスを検索できなかったときに、前記標準辞書を
参照して変換候補を生成する変換手段と、前記変換手段
にて生成された文字列を出力する出力手段と、を備えた
仮名漢字交じり変換装置により達成される。

【００１１】

【００１２】

【作用】上記構成によれば、入力手段は、漢字仮名交じ
りの文字列を入力し、登録手段は、仮名漢字交じり変換
できなかった文字列を登録し、ユーザ辞書は、登録手段
によって登録された文字列に対応する正しい表記を、当
該文字列に含まれる漢字の一部をインデックスとして残
りの文字列と共に保持し、標準辞書は、漢字仮名交じり
の文字列を仮名漢字交じり変換するための予め定められ
た変換辞書情報を格納し、抽出手段は、入力された文字
列から漢字を抽出し、検索手段は、抽出された漢字と一
致する漢字をユーザ辞書のインデックスにより検索し、
変換手段は、検索手段が一致するインデックスを検索し
たときには、対応保持された表記をユーザ辞書から読み
出して変換候補としての表記を生成し、また一致するイ
ンデックスを検索できなかったときには、標準辞書を参
照して変換候補を生成し、出力手段は、変換手段にて生
成された文字列を出力する。従って、ユーザが、変換で
きなかった入力文字列と、要求する正しい変換結果の文
字列をユーザ辞書に登録することにより、登録以降は、
要求する正しい変換が行えるようになり、このような登
録行為を繰り返すことにより、適切に変換できない漢字
仮名交じりの文字列を減らすことができる。

【００１３】

【実施例】以下、本発明の好適な実施例を図面に基づき
詳述する。

【００１４】図１は本実施例にてなる仮名漢字交じり変
換装置のブロック図である。仮名漢字交じり変換装置
は、漢字仮名交じりの文字列を入力するための入力部
１、仮名漢字交じり変換を行った結果、正しく仮名漢字
交じり変換を行うことができなかった文字列を登録する
ための登録部２、入力部１を介して入力された文字列を
仮名漢字交じり変換するための仮名漢字交じり変換部
３、仮名漢字交じり変換に際して参照される標準辞書
４、登録手段を介して登録された文字列と正しい変換結
果を蓄えるユーザー辞書５、及び変換結果の漢字文字列
を表すコード列を出力する出力部６からなる。

【００１５】入力部１は、座標入力タブレットと液晶表
示装置を一体としたもので、ペン等によりタブレット上
に手書きされた文字を認識し、その文字に対応する文字
コードを装置に入力するものである。勿論、漢字仮名交
じりの文字列に限らず、漢字、仮名文字列を入力できる
ことはいうまでもない。

【００１６】登録部２は、仮名漢字交じり変換を行った
結果、正しく仮名漢字交じり変換を行うことができなか
った仮名漢字交じり文字列、及び変換されるべき正しい
漢字文字列を、ユーザーの指示に従い、特定の構造にて
ユーザー辞書に登録するものである。ユーザー辞書に登
録する際の特定の構造については、後に詳述する。

【００１７】仮名漢字交じり変換部３は、まずユーザー
辞書５を参照することにより、入力された仮名漢字交じ
り文字列を仮名漢字交じり変換するとともに、その後、
これにより変換できなかったものを対象として、標準辞
書４を参照しつつ従来の仮名漢字交じり変換を行うもの
である。ここでいう従来の仮名漢字交じり変換とは、入
力された仮名漢字交じり文字列のうちの漢字を一旦仮名
に直すことにより、すべてが仮名の仮名文字列として、
その後、これにより得られた仮名文字列に対して仮名漢
字変換を行うというものである。勿論、標準辞書を漢字
仮名交じり見出し付きのかな漢字変換辞書として仮名漢
字交じり変換するというものであってもかまわない。ま
た、仮名漢字交じり変換部３が仮名文字列を仮名漢字変
換できることはいうまでもない。ユーザー辞書５の検索
方法については後に詳述する。

【００１８】標準辞書４は、漢字に対してその漢字の読
みを仮名で蓄えている漢字辞書部分と、仮名文字列に対
して対応する漢字もしくは漢字文字列を蓄えている仮名
漢字変換辞書部分とからなる。

【００１９】以下、ユーザー辞書５の構造を図２から図
５までを参照しつつ詳述する。

【００２０】登録例として「愛がん、愛玩」、「いん
居、隠居」、「愛そ、愛想」、「うけ所、請け所」、
「い丈だか、居丈高」、「いん花しょく物、隠花植物」
を登録するとし、それぞれの辞書構造を説明する。これ
らの文字列は今まで変換できなかったものと仮定してい
る。なお「」の左側が登録したい漢字仮名交じりの文字
列であり、右側が変換されるべき正しい文字列である。

【００２１】ユーザー辞書５は、登録仮名漢字文字列に
含まれる漢字１文字を蓄える漢字インデックスと、登録
仮名漢字文字列の残りの文字列及びこの部分の正しい表
記を格納する辞書本体とからなる。漢字インデックスに
は、それぞれの漢字に呼応する文字列が格納されている
辞書本体上での先頭アドレスが、それぞれの漢字に対応
づけて格納されており、これにより、漢字インデックス
に格納される漢字を見出しとする辞書本体の検索を可能
としている。

【００２２】まず「愛がん、愛玩」を登録したときの図
が図２である。この実施例では漢字インデックスは登録
する漢字仮名交じりの文字列の最初の漢字とする。「愛
がん」の場合は「愛」である。アドレスはユーザ辞書本
体の先頭のアドレスからの差分である。この場合、「愛
がん、愛玩」が最初の登録であり、ユーザ辞書本体の先
頭を指すので０である。本体側の最初はインデックス
「愛」に続く文字列である。この場合は「がん」であ
る。次の「玩」は「がん」の正しい表記である。そして
登録する文字列の終りに区切り記号「｜」を、変換され
るべき正しい文字列の終りに区切り記号「‖」を入れて
おく。そしてアドレスの０の下の８は「愛がん、愛玩」
を登録するのに要した本体のサイズである（かなと漢字
をそれぞれ２バイト、区切りの記号を１バイトとした時
のもの）。

【００２３】続いて「いん居、隠居」を登録したときの
図が図３である。漢字インデックスの「居」は上記で説
明したように登録する文字列の最初の漢字である。そし
て本体の先頭の記号「＊」は登録する文字列がそこで終
りであり、インデックスに用いた文字「居」の前に文字
があり、その文字が次に続くことを意味している。この
記号を終端記号と呼ぶことにする。この場合は次に「い
ん」であるので登録したい文字列は「居いん」ではなく
「いん居」であることが分かる。次の「隠」は「いん」
の正しい表記である。そして前記と同様に登録する文字
列の終りと、変換されるべき正しい文字列の終りにそれ
ぞれの区切り記号が入っている。そしてアドレスの８の
下の１７は８に本体のサイズ９（仮名と漢字は２バイ
ト、区切りに１バイト、記号に１バイトとした時のも
の）を足したものである。

【００２４】続いて「愛そ、愛想」を登録したときの図
が図４である。この場合漢字インデックスにすべき
「愛」はすでに存在するので前に登録した「愛がん、愛
玩」の本体に続けて登録してある。「そ」は「愛」に続
く文字列であり、「想」は「そ」の正しい表記である。

【００２５】ここで問題となるのはアドレスと本体の中
身であるが、この場合「愛そ、愛想」を登録するのに必
要なサイズ６（かなと漢字を２バイト、区切りの記号を
１バイトとした時のもの）バイト分を「いん＊｜隠‖」
以下の本体をずらすことにより、登録するメモリ空間を
取り、さらに漢字インデックスのアドレスもそれに対応
して補正することによって解決する。この場合「いん｜
＊隠‖」を１４（８＋６）バイト目以降にずらし、アド
レスもそれに対応して書き換えている。

【００２６】図５は続いて「うけ所、請け所」、「い丈
だか、居丈高」、「いん花しょく物、隠花植物」を順に
登録したときの図である。「＊うけ｜請け‖」は「いん
居、隠居」と同じ規則で登録したものである。次の「だ
か＊い｜高＊居‖」は「い丈だか、居丈高」を登録した
ものである、漢字インデックス「丈」の後にかな「だ
か」が来て、「丈」の前にかなの「い」が来ることを示
しており、「高」は「だか」の正しい表記、「居」は
「い」の正しい表記で漢字に復元する際に先頭に来るこ
とを示している。最後の「しょく☆＊いん｜植物＊隠
‖」は「いん花しょく物、隠花植物」を登録したもので
ある。ここで記号「☆」は漢字１文字を示す記号であ
り、「物」がその文字に対応している（・が対応を表
す）。意味は漢字インデックス「花」の後にかな「しょ
く」が来て、次に漢字が１文字あってそこで終ってお
り、「花」の前にかなの「いん」が来ることを示してい
る。そして「植」は「しょく」の正しい表記、「物」は
「☆」の実際の条件と表記であり、「隠」は「いん」の
表記であり先頭に来ることを示している。

【００２７】次に、仮名漢字交じり変換部３にて行われ
るユーザー辞書５の検索方法を図６のフローチャートを
使って説明する。

【００２８】検索は、入力文字列のうちどの文字に注目
しているかを示すポインタ１と、辞書本体の登録文字列
のうちどのデータ（文字及び記号）に注目しているかを
示すポインタ２とを用いて、各１文字づつを抽出し、こ
れらを順次比較することにより行われる。

【００２９】まず、ステップＳ１０１は文字列を入力す
る処理である。文字列が入力されると次のステップＳ１
０２に進む。

【００３０】ステップＳ１０２は入力文字列の漢字１文
字目を抽出して、この漢字が漢字インデックスに登録さ
れているか否かを検索する処理である。検索が終了した
ら、次のステップＳ１０３に進む。

【００３１】ステップＳ１０３はステップＳ１０２で候
補があったかどうかをチェックする処理である。漢字イ
ンデックスに抽出された漢字１文字目が存在した場合は
候補が有ったものとして、ステップＳ１０４に進む。無
かった場合は、ユーザー辞書の検索処理を終了して、標
準辞書４を用いた漢字仮名交じり変換処理に移行する。

【００３２】ステップＳ１０４はポインタをそれぞれ次
の文字を示すように移動する処理である。初期の状態で
は、入力文字列の漢字１文字目の次の文字を示すように
設定し、ポインタ２はインデックスで検索した辞書本体
のアドレスを示すように設定する。ポインタの移動が終
了したら、ステップ０１５に進む。

【００３３】ステップＳ１０５はポインタ２の示す文字
が終端記号の「＊」であるかをチェックする処理であ
る。終端記号の場合は、ステップＳ１０６に進み、そう
でない場合は、これをバイパスし、ステップＳ１０７に
進む。

【００３４】ステップＳ１０６は終端記号出現時のポイ
ンタを移動する処理であり、ポインタ１を入力文字列の
先頭の文字を示すようにし、ポインタ２を現在表してい
る文字の次の文字を示すようにする処理である。ポイン
タの移動が終了したらステップＳ１０７に進む。

【００３５】ステップＳ１０７はポインタ１の示す文字
とポインタ２の示す文字が一致するかをチェックする処
理である。文字が一致したら、ステップＳ１０８に進
む。

【００３６】ステップＳ１０８はポインタ２の示す文字
の次の文字が区切り記号の「｜」であるかをチェックす
る処理である。次の文字が「｜」であれば入力文字列と
辞書がマッチしたことが分かる。区切り記号「｜」であ
った場合は、ステップＳ１０９に進む。ステップＳ１０
９では区切り記号「｜」と区切り記号「‖」で挟まれた
文字列を用いて入力文字列に対して正しい表記を生成
し、その後、ユーザー辞書の検索処理を終了して、標準
辞書４を用いた漢字仮名交じり変換処理に移行する。区
切り記号「｜」でなかった場合は次の１文字を調べるた
め、ステップＳ１０４に戻る。

【００３７】ステップＳ１０７にて文字の一致が検出さ
れている限り、ステップＳ１０４からステップＳ１０８
までが、ステップＳ１０８にて区切り記号が検出される
まで繰り返される。ステップＳ１０７にて文字の一致が
検出されなかった場合には、ステップＳ１１０に進む。

【００３８】ステップＳ１１０は同一の漢字インデック
スに係わる次の候補にポインタを移動する処理である。
まずポインタ１を初期の設定である１文字目の漢字の次
の文字を示すようにする。そしてポインタ２を区切り記
号「‖」の次の文字を示すようにする。ポインタの移動
が済んだらステップＳ１１１に進む。

【００３９】ステップＳ１１１はステップＳ１１０で移
動したポインタ２がインデックスの示す範囲にあるか、
つまりまだ候補があるかをチェックする処理である。イ
ンデックスの示す範囲内で候補がある場合には、新たな
候補にて文字の一致を調べるべく、ステップＳ１０５に
進む。新たな候補がない場合はユーザー辞書の検索処理
を終了して、標準辞書４を用いた漢字仮名交じり変換処
理に移行する。

【００４０】以上が検索の一連の流れであるが、以下、
具体的事例に基づき、実際の流れを詳述する。具体的例
として、先にユーザー辞書の構造を説明した際に用いた
「愛そ」及び「いん花しょく物」を用いる。また、現在
のユーザー辞書登録状況は図５の状態とする。

【００４１】まず「愛そ」という文字列が入力されたと
きの処理を説明する。

【００４２】ステップＳ１０１で「愛そ」が入力される
と、ステップＳ１０２で入力文字列の漢字１文字目
「愛」を漢字インデックスで検索する。その結果、０バ
イト目から１３（１４−１）バイト目までがその本体で
あることが分かる。

【００４３】次に、ステップＳ１０３で候補があったか
どうかをチェックするが、今は候補が存在したのでステ
ップＳ１０４に処理を移す。

【００４４】ステップＳ１０４では、ポインタ１を入力
文字列の１文字目の漢字「愛」の次の文字「そ」を示す
ように設定し、ポインタ２をインデックスで検索した辞
書本体の０バイト目である「が」を示すように設定す
る。

【００４５】次いでステップＳ１０５では、ポインタ２
の示す文字「が」が終端記号の「＊」であるかをチェッ
クし、今の場合、違うのでステップＳ１０７に処理を移
す。ステップＳ１０７ではポインタ１の示す文字「そ」
とポインタ２の示す文字「が」が一致するかをチェック
し、一致しないのでステップＳ１１０に処理を移す。

【００４６】ステップＳ１１０では、まずポインタ１を
１文字目の漢字の次の文字「そ」を示すようにする。そ
してポインタ２を区切り記号「‖」の次の文字「そ」
（８バイト目）を示すようにする。

【００４７】次いで、ステップＳ１１１でステップＳ１
１０で移動したポインタ２がインデックスの示す範囲０
から１３バイト目までにあるか、つまりまだ候補がある
かをチェックし、この場合ポインタ２は８バイト目を示
しており、インデックスの示す範囲内で候補があるので
処理をステップＳ１０５に移す。

【００４８】ステップＳ１０５でポインタ２の示す文字
「そ」が終端記号かをチェックし、終端記号でないの
で、ステップＳ１０７に処理を移す。

【００４９】ステップＳ１０７ではポインタ１の示す文
字「そ」とポインタ２の示す文字「そ」を比較し、文字
がマッチするのでステップＳ１０８に処理を移す。

【００５０】ステップＳ１０８ではポインタ２の示す文
字の次の文字が区切り記号の「｜」であるかをチェック
し、この場合ポインタ２の示す文字の次の文字は「｜」
であるのでステップＳ１０９に処理を移し、区切り記号
の「｜」の次の文字を用いて表記を生成する。この場合
入力文字列が「愛そ」であり、「そ」に対応する漢字
が、「想」であるので、表記として「愛想」を生成し、
目的の適切な漢字の文字列が得られたことになり処理を
終了する。

【００５１】次に「いん花しょく物」という文字列が入
力されたときの処理を説明する。

【００５２】ステップＳ１０１で「いん花しょく物」が
入力されると、ステップＳ１０２で入力文字列の漢字１
文字目「花」を漢字インデックスで検索する。すると４
８バイト目から６８（６９−１）バイト目までが本体で
あることが分かる。

【００５３】次に、ステップＳ１０３でステップＳ１０
２で候補があったかをチェックし、今は候補が存在した
のでステップＳ１０４に処理を進める。

【００５４】ステップＳ１０４ではポインタ１を「花」
の次の文字「し」を示すように、ポインタ２を４８バイ
ト目の「し」を示すようにする。

【００５５】次にステップＳ１０５でポインタ２の示す
文字が終端記号かをチェックし、「し」であるので、ス
テップＳ１０７に処理を移す。

【００５６】ステップＳ１０７でポインタ１の示す文字
「し」と、ポインタ２の示す文字「し」を比較し、マッ
チするのでステップＳ１０８に処理を移す。

【００５７】ステップＳ１０８でポインタ２に示す次の
文字が「ょ」であり、区切り記号でないことが分かるの
でステップＳ１０４に処理を移す。

【００５８】ステップＳ１０４でポインタ１が入力文字
列「し」の次の文字「ょ」を示すようにし、ポインタ２
が辞書データ「し」の次の文字の「ょ」を示すようにポ
インタをそれぞれ移動する。

【００５９】次に、ステップＳ１０５でポインタ２の示
す文字「ょ」が終端記号「＊」かをチェックし、終端記
号でないのでステップＳ１０７に処理を移す。

【００６０】ステップＳ１０７でポインタ１の示す文字
「ょ」、ポインタ２の示す文字「ょ」を比較し、マッチ
するので、ステップＳ１０８に処理を移し、ステップＳ
１０８でポインタ２の示す文字の次の文字「く」が区切
り記号でないことが分かるので、ステップＳ１０４に処
理を移す。

【００６１】ステップＳ１０４でポインタ１を入力文字
列「ょ」の次の文字「く」を示すようにし、ポインタ２
を辞書データ「ょ」の次の文字の「く」を示すようにす
る。

【００６２】ステップＳ１０５でポインタ２の示す文字
「く」が終端記号「＊」でないことが分かり、ステップ
Ｓ１０７でポインタ１の示す文字「く」と、ポインタ２
の示す文字「く」を比較し文字がマッチするので、ステ
ップＳ１０８に進み、ステップＳ１０８でポインタ２の
示す文字の次の文字「☆」が区切り記号でないことが分
かるので、ステップＳ１０４に処理を移す。

【００６３】ステップＳ１０４でポインタ１を「く」の
次の文字「物」を示すようにし、ポインタ２を「く」の
次の文字「☆」を示すようにする。

【００６４】ステップＳ１０５でポインタ２の示す文字
「☆」が終端記号「＊」でないことが分かり、ステップ
Ｓ１０７に処理を移す。

【００６５】ステップＳ１０７は文字列の比較を行う処
理であるが、この場合ポインタ１は「物」を示し、ポイ
ンタ２は「☆」を示している。「☆」は漢字１文字を表
す記号であり、対応する漢字が「物」であることが分か
るので、ポインタ１の示す「物」と一致することが分か
る。

【００６６】ステップＳ１０８でポインタ２の示す次の
文字「＊」が区切り記号でないことが分かるのでステッ
プＳ１０４に処理を移す。

【００６７】ステップＳ１０４でポインタ１を「物」の
次の文字を示すようにするのであるが、この場合次の文
字はないので何も示していないことにする。ポインタ２
は「☆」の次の文字「＊」を示すようにする。

【００６８】ステップＳ１０５でポインタ２の示す文字
が終端記号の「＊」であることが分かるのでステップＳ
１０６に処理を移す。

【００６９】ステップＳ１０６は終端記号出現時のポイ
ンタを移動する処理であり、ポインタ１を入力文字列の
先頭の文字を示すようにし、ポインタ２を現在表してい
る文字の次の文字を示すようにする処理である。今の場
合はポインタ１は「い」を、ポインタ２は「＊」の次の
文字の「い」を示すようになる。

【００７０】ステップＳ１０７でポインタ１の示す文字
「い」と、ポインタ２の示す文字「い」を比較し文字が
マッチするので、ステップＳ１０８に進み、ステップＳ
１０８でポインタ２の示す文字の次の文字「ん」が区切
り記号でないことが分かるので、ステップＳ１０４に処
理を移す。

【００７１】ステップＳ１０４でポインタ１を「い」の
次の文字「ん」を示すようにし、ポインタ２を「い」の
次の文字「ん」を示すようにする。

【００７２】ステップＳ１０５でポインタ２の示す文字
が終端記号「＊」でないことが分かり、ステップＳ１０
７でポインタ１の示す文字「ん」と、ポインタ２の示す
文字「ん」を比較し文字がマッチするので、ステップＳ
１０８に処理を移す。。

【００７３】ステップＳ１０８でポインタ２の示す次の
文字が区切り記号の「｜」であることが分かり、入力文
字列と辞書がマッチしたことになる。

【００７４】ステップＳ１０９は区切り記号「｜」以降
の文字列を用いて目的とする表記を生成する処理であ
る。インデックスに使用した「花」を基準に見ると、
「植物」が「花」の後ろに来て、「隠」が先頭に来るこ
とが分かるので、「隠花植物」の表記を生成し、目的の
適切な漢字文字列が得られたことになり処理を終了す
る。

【００７５】以上、詳述したように、本実施例によれ
ば、いままで変換できなかった漢字仮名交じりの文字列
をユーザ辞書に登録しておき、漢字仮名交じり変換部が
このユーザ辞書を検索することにより、このような漢字
仮名交じりの文字列であっても登録以降は適切な漢字文
字列に変換することができる。

【００７６】

【発明の効果】本発明によれば本来変換できない文字列
を、ユーザ辞書に登録することにより次回から正しく変
換することができるので、ユーザがいつもこの文字列が
変換できないという不満を持つことを解消することを可
能とし快適な漢字仮名交じり変換を提供することができ
る。また漢字の１文字インデックスを持つ辞書構造にす
ることにより検索が容易になるので処理時間の短縮を図
ることが可能となる。

【図面の簡単な説明】

【図１】本発明の仮名漢字交じり変換装置の一実施例を
表すブロック図である。

【図２】ユーザ辞書の構造を説明するための模式図であ
る。

【図３】ユーザ辞書の構造を説明するための模式図であ
る。

【図４】ユーザ辞書の構造を説明するための模式図であ
る。

【図５】ユーザ辞書の構造を説明するための模式図であ
る。

【図６】ユーザ辞書の検索の一連の流れを表すフローチ
ャートである。

Claims

(57)【特許請求の範囲】

【請求項１】漢字仮名交じりの文字列を入力する入力
手段と、仮名漢字交じり変換できなかった文字列を登録
する登録手段と、前記登録手段によって登録された文字
列に対応する正しい表記を、当該文字列に含まれる漢字
の一部をインデックスとして残りの文字列と共に保持す
るユーザ辞書と、前記漢字仮名交じりの文字列を仮名漢
字交じり変換するための予め定められた変換辞書情報を
格納する標準辞書と、前記入力された文字列から漢字を
抽出する抽出手段と、前記抽出された漢字と一致する漢
字を前記ユーザ辞書のインデックスにより検索する検索
手段と、前記検索手段が一致するインデックスを検索し
たときに、対応保持された表記を前記ユーザ辞書から読
み出して変換候補としての表記を生成すると共に、一致
するインデックスを検索できなかったときに、前記標準
辞書を参照して変換候補を生成する変換手段と、前記変
換手段にて生成された文字列を出力する出力手段と、を
備えた仮名漢字交じり変換装置。