JP3327642B2 - 仮名漢字交じり変換装置 - Google Patents

仮名漢字交じり変換装置

Info

Publication number
JP3327642B2
JP3327642B2 JP23469393A JP23469393A JP3327642B2 JP 3327642 B2 JP3327642 B2 JP 3327642B2 JP 23469393 A JP23469393 A JP 23469393A JP 23469393 A JP23469393 A JP 23469393A JP 3327642 B2 JP3327642 B2 JP 3327642B2
Authority
JP
Japan
Prior art keywords
kanji
character
kana
character string
pointer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23469393A
Other languages
English (en)
Other versions
JPH0793314A (ja
Inventor
至幸 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP23469393A priority Critical patent/JP3327642B2/ja
Publication of JPH0793314A publication Critical patent/JPH0793314A/ja
Application granted granted Critical
Publication of JP3327642B2 publication Critical patent/JP3327642B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、かな漢字変換装置に係
り、特に漢字と仮名が混在したものが入力されることが
想定される仮名漢字交じり変換装置装置に関する。
【0002】
【従来の技術】従来より、文書作成装置等に手書きのペ
ン入力などによって漢字文字列を直接入力するという技
術がある。
【0003】しかしながら直接漢字を入力する際にも漢
字を忘れてしまって思い出せない時や、書くのに面倒な
漢字がありその文字は仮名で書きたいという場合があ
る。例えば「片りん」と買いて「片鱗」と変換したいと
いうものである。このように漢字仮名交じりの文字列を
入力して適切な漢字文字列にする(以下、これを漢字仮
名交じり変換という)方法として主に次の二つの方法が
ある。
【0004】1つは漢字仮名交じりの見出しとそれに対
応する漢字の表記の辞書を持つことによって仮名漢字交
じり変換しようというものである。例えば「片りん」の
場合は「片りん」という見出しと、それに対応する漢字
の表記「片鱗」が入っている辞書を持つという方法であ
る。このような技術は特開昭62−209667で示さ
れている。
【0005】もう1つは漢字を仮名に直す辞書を持つこ
とにより、入力された文字列の漢字を仮名に直し、その
直された仮名文字列に対して通常の仮名漢字変換を行な
うというものである。例えば「片りん」の場合は、
「片」を仮名に直し「へん、かた」となり、「へんり
ん、かたりん」を仮名漢字変換し表記と一致する「片
鱗」を候補とする方法である。このような技術は特開昭
55−59578、特開昭63−37465等で示され
ている。
【0006】
【発明が解決しようとする課題】しかしながら入力文字
列によっては上記の仮名漢字交じり変換の方法で、すべ
ての入力文字列を適切に変換できるわけではない。
【0007】1つ目の漢字仮名交じりの見出しを持つ方
法では、どのような形で漢字仮名交じりの文字列が入力
されても変換できるような漢字仮名交じりの見出しを持
つことは事実上不可能であり(仮名漢字変換の辞書もす
べての日本語の単語が登録されているわけではない)、
入力文字列によっては変換できないものがある。
【0008】2つ目の漢字を仮名に直し仮名漢字変換す
る方法では、特殊な読みを持つ単語については適切な仮
名に直すことができないので、結果として正しく変換で
きないという問題が起こる。例えば「風ろ」を入力して
「風呂」と変換したい場合を考えると、「風」という漢
字の読みは普通「ふう」と「かぜ」であり、「ふうろ、
かぜろ」を仮名漢字変換しても「風呂」という候補は得
られない。
【0009】従って、本発明の目的は、上記の課題を解
決し、適切に変換できない漢字仮名交じりの文字列を極
力減らすことが可能な仮名漢字交じり変換装置を提供す
ることにある。
【0010】
【課題を解決するための手段】上記目的は、本発明によ
れば、漢字仮名交じりの文字列を入力する入力手段と、
仮名漢字交じり変換できなかった文字列を登録する登録
手段と、前記登録手段によって登録された文字列に対応
する正しい表記を、当該文字列に含まれる漢字の一部を
インデックスとして残りの文字列と共に保持するユーザ
辞書と、前記漢字仮名交じりの文字列を仮名漢字交じり
変換するための予め定められた変換辞書情報を格納する
標準辞書と、前記入力された文字列から漢字を抽出する
抽出手段と、前記抽出された漢字と一致する漢字を前記
ユーザ辞書のインデックスにより検索する検索手段と、
前記検索手段が一致するインデックスを検索したとき
に、対応保持された表記を前記ユーザ辞書から読み出し
て変換候補としての表記を生成すると共に、一致するイ
ンデックスを検索できなかったときに、前記標準辞書を
参照して変換候補を生成する変換手段と、前記変換手段
にて生成された文字列を出力する出力手段と、を備えた
仮名漢字交じり変換装置により達成される。
【0011】
【0012】
【作用】上記構成によれば、入力手段は、漢字仮名交じ
りの文字列を入力し、登録手段は、仮名漢字交じり変換
できなかった文字列を登録し、ユーザ辞書は、登録手段
によって登録された文字列に対応する正しい表記を、当
該文字列に含まれる漢字の一部をインデックスとして残
りの文字列と共に保持し、標準辞書は、漢字仮名交じり
の文字列を仮名漢字交じり変換するための予め定められ
た変換辞書情報を格納し、抽出手段は、入力された文字
列から漢字を抽出し、検索手段は、抽出された漢字と一
致する漢字をユーザ辞書のインデックスにより検索し、
変換手段は、検索手段が一致するインデックスを検索し
たときには、対応保持された表記をユーザ辞書から読み
出して変換候補としての表記を生成し、また一致するイ
ンデックスを検索できなかったときには、標準辞書を参
照して変換候補を生成し、出力手段は、変換手段にて生
成された文字列を出力する。従って、ユーザが、変換で
きなかった入力文字列と、要求する正しい変換結果の文
字列をユーザ辞書に登録することにより、登録以降は、
要求する正しい変換が行えるようになり、このような登
録行為を繰り返すことにより、適切に変換できない漢字
仮名交じりの文字列を減らすことができる。
【0013】
【実施例】以下、本発明の好適な実施例を図面に基づき
詳述する。
【0014】図1は本実施例にてなる仮名漢字交じり変
換装置のブロック図である。仮名漢字交じり変換装置
は、漢字仮名交じりの文字列を入力するための入力部
1、仮名漢字交じり変換を行った結果、正しく仮名漢字
交じり変換を行うことができなかった文字列を登録する
ための登録部2、入力部1を介して入力された文字列を
仮名漢字交じり変換するための仮名漢字交じり変換部
3、仮名漢字交じり変換に際して参照される標準辞書
4、登録手段を介して登録された文字列と正しい変換結
果を蓄えるユーザー辞書5、及び変換結果の漢字文字列
を表すコード列を出力する出力部6からなる。
【0015】入力部1は、座標入力タブレットと液晶表
示装置を一体としたもので、ペン等によりタブレット上
に手書きされた文字を認識し、その文字に対応する文字
コードを装置に入力するものである。勿論、漢字仮名交
じりの文字列に限らず、漢字、仮名文字列を入力できる
ことはいうまでもない。
【0016】登録部2は、仮名漢字交じり変換を行った
結果、正しく仮名漢字交じり変換を行うことができなか
った仮名漢字交じり文字列、及び変換されるべき正しい
漢字文字列を、ユーザーの指示に従い、特定の構造にて
ユーザー辞書に登録するものである。ユーザー辞書に登
録する際の特定の構造については、後に詳述する。
【0017】仮名漢字交じり変換部3は、まずユーザー
辞書5を参照することにより、入力された仮名漢字交じ
り文字列を仮名漢字交じり変換するとともに、その後、
これにより変換できなかったものを対象として、標準辞
書4を参照しつつ従来の仮名漢字交じり変換を行うもの
である。ここでいう従来の仮名漢字交じり変換とは、入
力された仮名漢字交じり文字列のうちの漢字を一旦仮名
に直すことにより、すべてが仮名の仮名文字列として、
その後、これにより得られた仮名文字列に対して仮名漢
字変換を行うというものである。勿論、標準辞書を漢字
仮名交じり見出し付きのかな漢字変換辞書として仮名漢
字交じり変換するというものであってもかまわない。ま
た、仮名漢字交じり変換部3が仮名文字列を仮名漢字変
換できることはいうまでもない。ユーザー辞書5の検索
方法については後に詳述する。
【0018】標準辞書4は、漢字に対してその漢字の読
みを仮名で蓄えている漢字辞書部分と、仮名文字列に対
して対応する漢字もしくは漢字文字列を蓄えている仮名
漢字変換辞書部分とからなる。
【0019】以下、ユーザー辞書5の構造を図2から図
5までを参照しつつ詳述する。
【0020】登録例として「愛がん、愛玩」、「いん
居、隠居」、「愛そ、愛想」、「うけ所、請け所」、
「い丈だか、居丈高」、「いん花しょく物、隠花植物」
を登録するとし、それぞれの辞書構造を説明する。これ
らの文字列は今まで変換できなかったものと仮定してい
る。なお「」の左側が登録したい漢字仮名交じりの文字
列であり、右側が変換されるべき正しい文字列である。
【0021】ユーザー辞書5は、登録仮名漢字文字列に
含まれる漢字1文字を蓄える漢字インデックスと、登録
仮名漢字文字列の残りの文字列及びこの部分の正しい表
記を格納する辞書本体とからなる。漢字インデックスに
は、それぞれの漢字に呼応する文字列が格納されている
辞書本体上での先頭アドレスが、それぞれの漢字に対応
づけて格納されており、これにより、漢字インデックス
に格納される漢字を見出しとする辞書本体の検索を可能
としている。
【0022】まず「愛がん、愛玩」を登録したときの図
が図2である。この実施例では漢字インデックスは登録
する漢字仮名交じりの文字列の最初の漢字とする。「愛
がん」の場合は「愛」である。アドレスはユーザ辞書本
体の先頭のアドレスからの差分である。この場合、「愛
がん、愛玩」が最初の登録であり、ユーザ辞書本体の先
頭を指すので0である。本体側の最初はインデックス
「愛」に続く文字列である。この場合は「がん」であ
る。次の「玩」は「がん」の正しい表記である。そして
登録する文字列の終りに区切り記号「|」を、変換され
るべき正しい文字列の終りに区切り記号「‖」を入れて
おく。そしてアドレスの0の下の8は「愛がん、愛玩」
を登録するのに要した本体のサイズである(かなと漢字
をそれぞれ2バイト、区切りの記号を1バイトとした時
のもの)。
【0023】続いて「いん居、隠居」を登録したときの
図が図3である。漢字インデックスの「居」は上記で説
明したように登録する文字列の最初の漢字である。そし
て本体の先頭の記号「*」は登録する文字列がそこで終
りであり、インデックスに用いた文字「居」の前に文字
があり、その文字が次に続くことを意味している。この
記号を終端記号と呼ぶことにする。この場合は次に「い
ん」であるので登録したい文字列は「居いん」ではなく
「いん居」であることが分かる。次の「隠」は「いん」
の正しい表記である。そして前記と同様に登録する文字
列の終りと、変換されるべき正しい文字列の終りにそれ
ぞれの区切り記号が入っている。そしてアドレスの8の
下の17は8に本体のサイズ9(仮名と漢字は2バイ
ト、区切りに1バイト、記号に1バイトとした時のも
の)を足したものである。
【0024】続いて「愛そ、愛想」を登録したときの図
が図4である。この場合漢字インデックスにすべき
「愛」はすでに存在するので前に登録した「愛がん、愛
玩」の本体に続けて登録してある。「そ」は「愛」に続
く文字列であり、「想」は「そ」の正しい表記である。
【0025】ここで問題となるのはアドレスと本体の中
身であるが、この場合「愛そ、愛想」を登録するのに必
要なサイズ6(かなと漢字を2バイト、区切りの記号を
1バイトとした時のもの)バイト分を「いん*|隠‖」
以下の本体をずらすことにより、登録するメモリ空間を
取り、さらに漢字インデックスのアドレスもそれに対応
して補正することによって解決する。この場合「いん|
*隠‖」を14(8+6)バイト目以降にずらし、アド
レスもそれに対応して書き換えている。
【0026】図5は続いて「うけ所、請け所」、「い丈
だか、居丈高」、「いん花しょく物、隠花植物」を順に
登録したときの図である。「*うけ|請け‖」は「いん
居、隠居」と同じ規則で登録したものである。次の「だ
か*い|高*居‖」は「い丈だか、居丈高」を登録した
ものである、漢字インデックス「丈」の後にかな「だ
か」が来て、「丈」の前にかなの「い」が来ることを示
しており、「高」は「だか」の正しい表記、「居」は
「い」の正しい表記で漢字に復元する際に先頭に来るこ
とを示している。最後の「しょく☆*いん|植物*隠
‖」は「いん花しょく物、隠花植物」を登録したもので
ある。ここで記号「☆」は漢字1文字を示す記号であ
り、「物」がその文字に対応している(・が対応を表
す)。意味は漢字インデックス「花」の後にかな「しょ
く」が来て、次に漢字が1文字あってそこで終ってお
り、「花」の前にかなの「いん」が来ることを示してい
る。そして「植」は「しょく」の正しい表記、「物」は
「☆」の実際の条件と表記であり、「隠」は「いん」の
表記であり先頭に来ることを示している。
【0027】次に、仮名漢字交じり変換部3にて行われ
るユーザー辞書5の検索方法を図6のフローチャートを
使って説明する。
【0028】検索は、入力文字列のうちどの文字に注目
しているかを示すポインタ1と、辞書本体の登録文字列
のうちどのデータ(文字及び記号)に注目しているかを
示すポインタ2とを用いて、各1文字づつを抽出し、こ
れらを順次比較することにより行われる。
【0029】まず、ステップS101は文字列を入力す
る処理である。文字列が入力されると次のステップS1
02に進む。
【0030】ステップS102は入力文字列の漢字1文
字目を抽出して、この漢字が漢字インデックスに登録さ
れているか否かを検索する処理である。検索が終了した
ら、次のステップS103に進む。
【0031】ステップS103はステップS102で候
補があったかどうかをチェックする処理である。漢字イ
ンデックスに抽出された漢字1文字目が存在した場合は
候補が有ったものとして、ステップS104に進む。無
かった場合は、ユーザー辞書の検索処理を終了して、標
準辞書4を用いた漢字仮名交じり変換処理に移行する。
【0032】ステップS104はポインタをそれぞれ次
の文字を示すように移動する処理である。初期の状態で
は、入力文字列の漢字1文字目の次の文字を示すように
設定し、ポインタ2はインデックスで検索した辞書本体
のアドレスを示すように設定する。ポインタの移動が終
了したら、ステップ015に進む。
【0033】ステップS105はポインタ2の示す文字
が終端記号の「*」であるかをチェックする処理であ
る。終端記号の場合は、ステップS106に進み、そう
でない場合は、これをバイパスし、ステップS107に
進む。
【0034】ステップS106は終端記号出現時のポイ
ンタを移動する処理であり、ポインタ1を入力文字列の
先頭の文字を示すようにし、ポインタ2を現在表してい
る文字の次の文字を示すようにする処理である。ポイン
タの移動が終了したらステップS107に進む。
【0035】ステップS107はポインタ1の示す文字
とポインタ2の示す文字が一致するかをチェックする処
理である。文字が一致したら、ステップS108に進
む。
【0036】ステップS108はポインタ2の示す文字
の次の文字が区切り記号の「|」であるかをチェックす
る処理である。次の文字が「|」であれば入力文字列と
辞書がマッチしたことが分かる。区切り記号「|」であ
った場合は、ステップS109に進む。ステップS10
9では区切り記号「|」と区切り記号「‖」で挟まれた
文字列を用いて入力文字列に対して正しい表記を生成
し、その後、ユーザー辞書の検索処理を終了して、標準
辞書4を用いた漢字仮名交じり変換処理に移行する。区
切り記号「|」でなかった場合は次の1文字を調べるた
め、ステップS104に戻る。
【0037】ステップS107にて文字の一致が検出さ
れている限り、ステップS104からステップS108
までが、ステップS108にて区切り記号が検出される
まで繰り返される。ステップS107にて文字の一致が
検出されなかった場合には、ステップS110に進む。
【0038】ステップS110は同一の漢字インデック
スに係わる次の候補にポインタを移動する処理である。
まずポインタ1を初期の設定である1文字目の漢字の次
の文字を示すようにする。そしてポインタ2を区切り記
号「‖」の次の文字を示すようにする。ポインタの移動
が済んだらステップS111に進む。
【0039】ステップS111はステップS110で移
動したポインタ2がインデックスの示す範囲にあるか、
つまりまだ候補があるかをチェックする処理である。イ
ンデックスの示す範囲内で候補がある場合には、新たな
候補にて文字の一致を調べるべく、ステップS105に
進む。新たな候補がない場合はユーザー辞書の検索処理
を終了して、標準辞書4を用いた漢字仮名交じり変換処
理に移行する。
【0040】以上が検索の一連の流れであるが、以下、
具体的事例に基づき、実際の流れを詳述する。具体的例
として、先にユーザー辞書の構造を説明した際に用いた
「愛そ」及び「いん花しょく物」を用いる。また、現在
のユーザー辞書登録状況は図5の状態とする。
【0041】まず「愛そ」という文字列が入力されたと
きの処理を説明する。
【0042】ステップS101で「愛そ」が入力される
と、ステップS102で入力文字列の漢字1文字目
「愛」を漢字インデックスで検索する。その結果、0バ
イト目から13(14−1)バイト目までがその本体で
あることが分かる。
【0043】次に、ステップS103で候補があったか
どうかをチェックするが、今は候補が存在したのでステ
ップS104に処理を移す。
【0044】ステップS104では、ポインタ1を入力
文字列の1文字目の漢字「愛」の次の文字「そ」を示す
ように設定し、ポインタ2をインデックスで検索した辞
書本体の0バイト目である「が」を示すように設定す
る。
【0045】次いでステップS105では、ポインタ2
の示す文字「が」が終端記号の「*」であるかをチェッ
クし、今の場合、違うのでステップS107に処理を移
す。ステップS107ではポインタ1の示す文字「そ」
とポインタ2の示す文字「が」が一致するかをチェック
し、一致しないのでステップS110に処理を移す。
【0046】ステップS110では、まずポインタ1を
1文字目の漢字の次の文字「そ」を示すようにする。そ
してポインタ2を区切り記号「‖」の次の文字「そ」
(8バイト目)を示すようにする。
【0047】次いで、ステップS111でステップS1
10で移動したポインタ2がインデックスの示す範囲0
から13バイト目までにあるか、つまりまだ候補がある
かをチェックし、この場合ポインタ2は8バイト目を示
しており、インデックスの示す範囲内で候補があるので
処理をステップS105に移す。
【0048】ステップS105でポインタ2の示す文字
「そ」が終端記号かをチェックし、終端記号でないの
で、ステップS107に処理を移す。
【0049】ステップS107ではポインタ1の示す文
字「そ」とポインタ2の示す文字「そ」を比較し、文字
がマッチするのでステップS108に処理を移す。
【0050】ステップS108ではポインタ2の示す文
字の次の文字が区切り記号の「|」であるかをチェック
し、この場合ポインタ2の示す文字の次の文字は「|」
であるのでステップS109に処理を移し、区切り記号
の「|」の次の文字を用いて表記を生成する。この場合
入力文字列が「愛そ」であり、「そ」に対応する漢字
が、「想」であるので、表記として「愛想」を生成し、
目的の適切な漢字の文字列が得られたことになり処理を
終了する。
【0051】次に「いん花しょく物」という文字列が入
力されたときの処理を説明する。
【0052】ステップS101で「いん花しょく物」が
入力されると、ステップS102で入力文字列の漢字1
文字目「花」を漢字インデックスで検索する。すると4
8バイト目から68(69−1)バイト目までが本体で
あることが分かる。
【0053】次に、ステップS103でステップS10
2で候補があったかをチェックし、今は候補が存在した
のでステップS104に処理を進める。
【0054】ステップS104ではポインタ1を「花」
の次の文字「し」を示すように、ポインタ2を48バイ
ト目の「し」を示すようにする。
【0055】次にステップS105でポインタ2の示す
文字が終端記号かをチェックし、「し」であるので、ス
テップS107に処理を移す。
【0056】ステップS107でポインタ1の示す文字
「し」と、ポインタ2の示す文字「し」を比較し、マッ
チするのでステップS108に処理を移す。
【0057】ステップS108でポインタ2に示す次の
文字が「ょ」であり、区切り記号でないことが分かるの
でステップS104に処理を移す。
【0058】ステップS104でポインタ1が入力文字
列「し」の次の文字「ょ」を示すようにし、ポインタ2
が辞書データ「し」の次の文字の「ょ」を示すようにポ
インタをそれぞれ移動する。
【0059】次に、ステップS105でポインタ2の示
す文字「ょ」が終端記号「*」かをチェックし、終端記
号でないのでステップS107に処理を移す。
【0060】ステップS107でポインタ1の示す文字
「ょ」、ポインタ2の示す文字「ょ」を比較し、マッチ
するので、ステップS108に処理を移し、ステップS
108でポインタ2の示す文字の次の文字「く」が区切
り記号でないことが分かるので、ステップS104に処
理を移す。
【0061】ステップS104でポインタ1を入力文字
列「ょ」の次の文字「く」を示すようにし、ポインタ2
を辞書データ「ょ」の次の文字の「く」を示すようにす
る。
【0062】ステップS105でポインタ2の示す文字
「く」が終端記号「*」でないことが分かり、ステップ
S107でポインタ1の示す文字「く」と、ポインタ2
の示す文字「く」を比較し文字がマッチするので、ステ
ップS108に進み、ステップS108でポインタ2の
示す文字の次の文字「☆」が区切り記号でないことが分
かるので、ステップS104に処理を移す。
【0063】ステップS104でポインタ1を「く」の
次の文字「物」を示すようにし、ポインタ2を「く」の
次の文字「☆」を示すようにする。
【0064】ステップS105でポインタ2の示す文字
「☆」が終端記号「*」でないことが分かり、ステップ
S107に処理を移す。
【0065】ステップS107は文字列の比較を行う処
理であるが、この場合ポインタ1は「物」を示し、ポイ
ンタ2は「☆」を示している。「☆」は漢字1文字を表
す記号であり、対応する漢字が「物」であることが分か
るので、ポインタ1の示す「物」と一致することが分か
る。
【0066】ステップS108でポインタ2の示す次の
文字「*」が区切り記号でないことが分かるのでステッ
プS104に処理を移す。
【0067】ステップS104でポインタ1を「物」の
次の文字を示すようにするのであるが、この場合次の文
字はないので何も示していないことにする。ポインタ2
は「☆」の次の文字「*」を示すようにする。
【0068】ステップS105でポインタ2の示す文字
が終端記号の「*」であることが分かるのでステップS
106に処理を移す。
【0069】ステップS106は終端記号出現時のポイ
ンタを移動する処理であり、ポインタ1を入力文字列の
先頭の文字を示すようにし、ポインタ2を現在表してい
る文字の次の文字を示すようにする処理である。今の場
合はポインタ1は「い」を、ポインタ2は「*」の次の
文字の「い」を示すようになる。
【0070】ステップS107でポインタ1の示す文字
「い」と、ポインタ2の示す文字「い」を比較し文字が
マッチするので、ステップS108に進み、ステップS
108でポインタ2の示す文字の次の文字「ん」が区切
り記号でないことが分かるので、ステップS104に処
理を移す。
【0071】ステップS104でポインタ1を「い」の
次の文字「ん」を示すようにし、ポインタ2を「い」の
次の文字「ん」を示すようにする。
【0072】ステップS105でポインタ2の示す文字
が終端記号「*」でないことが分かり、ステップS10
7でポインタ1の示す文字「ん」と、ポインタ2の示す
文字「ん」を比較し文字がマッチするので、ステップS
108に処理を移す。。
【0073】ステップS108でポインタ2の示す次の
文字が区切り記号の「|」であることが分かり、入力文
字列と辞書がマッチしたことになる。
【0074】ステップS109は区切り記号「|」以降
の文字列を用いて目的とする表記を生成する処理であ
る。インデックスに使用した「花」を基準に見ると、
「植物」が「花」の後ろに来て、「隠」が先頭に来るこ
とが分かるので、「隠花植物」の表記を生成し、目的の
適切な漢字文字列が得られたことになり処理を終了す
る。
【0075】以上、詳述したように、本実施例によれ
ば、いままで変換できなかった漢字仮名交じりの文字列
をユーザ辞書に登録しておき、漢字仮名交じり変換部が
このユーザ辞書を検索することにより、このような漢字
仮名交じりの文字列であっても登録以降は適切な漢字文
字列に変換することができる。
【0076】
【発明の効果】本発明によれば本来変換できない文字列
を、ユーザ辞書に登録することにより次回から正しく変
換することができるので、ユーザがいつもこの文字列が
変換できないという不満を持つことを解消することを可
能とし快適な漢字仮名交じり変換を提供することができ
る。また漢字の1文字インデックスを持つ辞書構造にす
ることにより検索が容易になるので処理時間の短縮を図
ることが可能となる。
【図面の簡単な説明】
【図1】本発明の仮名漢字交じり変換装置の一実施例を
表すブロック図である。
【図2】ユーザ辞書の構造を説明するための模式図であ
る。
【図3】ユーザ辞書の構造を説明するための模式図であ
る。
【図4】ユーザ辞書の構造を説明するための模式図であ
る。
【図5】ユーザ辞書の構造を説明するための模式図であ
る。
【図6】ユーザ辞書の検索の一連の流れを表すフローチ
ャートである。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 漢字仮名交じりの文字列を入力する入力
    手段と、仮名漢字交じり変換できなかった文字列を登録
    する登録手段と、前記登録手段によって登録された文字
    列に対応する正しい表記を、当該文字列に含まれる漢字
    の一部をインデックスとして残りの文字列と共に保持す
    ユーザ辞書と、前記漢字仮名交じりの文字列を仮名漢
    字交じり変換するための予め定められた変換辞書情報を
    格納する標準辞書と、前記入力された文字列から漢字を
    抽出する抽出手段と、前記抽出された漢字と一致する漢
    字を前記ユーザ辞書のインデックスにより検索する検索
    手段と、前記検索手段が一致するインデックスを検索し
    たときに、対応保持された表記を前記ユーザ辞書から読
    み出して変換候補としての表記を生成すると共に、一致
    するインデックスを検索できなかったときに、前記標準
    辞書を参照して変換候補を生成する変換手段と、前記変
    換手段にて生成された文字列を出力する出力手段と、
    備えた仮名漢字交じり変換装置。
JP23469393A 1993-09-21 1993-09-21 仮名漢字交じり変換装置 Expired - Fee Related JP3327642B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23469393A JP3327642B2 (ja) 1993-09-21 1993-09-21 仮名漢字交じり変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23469393A JP3327642B2 (ja) 1993-09-21 1993-09-21 仮名漢字交じり変換装置

Publications (2)

Publication Number Publication Date
JPH0793314A JPH0793314A (ja) 1995-04-07
JP3327642B2 true JP3327642B2 (ja) 2002-09-24

Family

ID=16974943

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23469393A Expired - Fee Related JP3327642B2 (ja) 1993-09-21 1993-09-21 仮名漢字交じり変換装置

Country Status (1)

Country Link
JP (1) JP3327642B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8739729B2 (en) 2007-12-27 2014-06-03 Semes Co., Ltd. Chemical liquid supply unit, and substrate treating apparatus and method using the same

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010267019A (ja) 2009-05-13 2010-11-25 Internatl Business Mach Corp <Ibm> 文書作成を支援する方法、並びにそのコンピュータ・システム及びコンピュータ・プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Newton別冊 ワードプロセッサのすべて最新版,日本,教育社,1983年10月13日,P120

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8739729B2 (en) 2007-12-27 2014-06-03 Semes Co., Ltd. Chemical liquid supply unit, and substrate treating apparatus and method using the same

Also Published As

Publication number Publication date
JPH0793314A (ja) 1995-04-07

Similar Documents

Publication Publication Date Title
US8069033B2 (en) Document based character ambiguity resolution
US5802482A (en) System and method for processing graphic language characters
JP3327642B2 (ja) 仮名漢字交じり変換装置
US6912516B1 (en) Place name expressing dictionary generating method and its apparatus
JP2595934B2 (ja) 仮名漢字変換処理装置
JP3483585B2 (ja) 文書検索装置及び文書検索方法
JPH08339376A (ja) 外国語検索装置及び情報検索システム
JPS5822767B2 (ja) 和文タイプライタ
JP2795038B2 (ja) データ検索装置
JP3329476B2 (ja) かな漢字変換装置
JPH1021262A (ja) 情報検索装置
JPS59100941A (ja) 仮名漢字変換装置
JP3342028B2 (ja) かな漢字変換装置
JP2862236B2 (ja) 文字処理装置
JP2634926B2 (ja) かな漢字変換装置
JPH0612453A (ja) 未知語抽出登録装置
JPH0546814A (ja) 文字読み取り装置
JPH02136970A (ja) 英単語検索装置
JPH0531190B2 (ja)
JPH06251204A (ja) 文字認識装置
JPH08185400A (ja) 文字変換装置
JPH0335349A (ja) 用例表示機能付き文書処理装置
JPH10261049A (ja) 文字認識装置
JPH0581238A (ja) かな漢字変換装置
JPH07325844A (ja) 電子化辞書検索装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070712

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080712

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080712

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090712

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100712

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110712

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110712

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120712

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120712

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130712

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees