JP3329476B2 - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JP3329476B2
JP3329476B2 JP23019791A JP23019791A JP3329476B2 JP 3329476 B2 JP3329476 B2 JP 3329476B2 JP 23019791 A JP23019791 A JP 23019791A JP 23019791 A JP23019791 A JP 23019791A JP 3329476 B2 JP3329476 B2 JP 3329476B2
Authority
JP
Japan
Prior art keywords
kana
word
information
hiragana
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23019791A
Other languages
English (en)
Other versions
JPH0567080A (ja
Inventor
龍也 上原
一男 住田
和広 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP23019791A priority Critical patent/JP3329476B2/ja
Publication of JPH0567080A publication Critical patent/JPH0567080A/ja
Application granted granted Critical
Publication of JP3329476B2 publication Critical patent/JP3329476B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、かな文字列を入力して
漢字かなまじり文字列を出力するかな漢字変換装置に関
する。
【0002】
【従来の技術】計算機の日本語インタフェースにおい
て、かな漢字変換装置は重要な位置を占めている。かな
漢字変換装置は、文章の読みを入力すると、それに対す
る漢字かな混じり文に変換することを目的としている。
【0003】しかしながら、従来のかな漢字変換装置で
は、かなを漢字に変換することに重点がおかれているの
で、変換結果に漢字が多く含まれており、通常ひらがな
で表記する語が漢字で表記される傾向にある。たとえ
ば、「がっこうにおいて」という読み情報に対しては
「学校に於いて」と変換される場合がある。もし、利用
者が「学校において」という表記を意図した場合、「於
いて」という語を「次候補キー」や「別候補キー」など
を押し続けて「おいて」にしなけれならない。この場
合、「おいて」がかな漢字辞書登録されていないとき
は、この方法では変換できない。特に、かな表記の単語
は、かな漢字辞書に登録されていることが少ないので、
この方法では、変換できないことが多い。この問題を解
決するために、かな表記の単語を同音語の選択時に、同
音語の候補として加える方法が行なわれている。この方
法では、ひらがなのみからなる単語が登録されていなく
ても変換することができるが、「次候補キー」や「別候
補キー」など必要な回数、押さなければならず、非常に
手間がかかる。なぜなら、かな表記の単語は、かな漢字
変換辞書に登録していないために、同音語の最後の候補
になることが多いからである。
【0004】このような問題を解決するためには、利用
者がかな表記の単語に修正したことを記憶しておき、そ
の以降のかな漢字変換の結果に反映させる方法が考えら
れる。
【0005】この種の装置としては例えば、特開昭62-1
0764号公報が知られている。この装置は、変換された漢
字かな混じり表記を利用者がかな表記に修正する無変換
キーを備えた入力手段と、この無変換キーで修正された
操作内容を記憶する無変換修正登録手段とを有し、該登
録手段に登録した後、同じ読みの入力がある時、記憶さ
れた修正操作内容に従ってあらかじめ変換表示を修正し
て表示することを特徴としている。
【0006】この種の装置では、例えば「学校に於い
て」の「於いて」を「おいて」に修正することにより、
それ以降、「おいて」という読みの変換結果として、
「おいて」と変換することが可能となる。しかしなが
ら、この種の装置では、修正されたかな表記が、ある単
語の活用形である場合、その単語の異なる活用形には影
響を及ぼさないという問題がある。例えば、「服を着
た」という変換結果に対して利用者が「着た」を「き
た」に修正した場合、同じ「きた」には修正結果が有効
であるが、「ふくをきる」に対しては、修正結果が有効
でなく、「服を着る」となってしまう。
【0007】また、修正操作内容として読みや読みの長
さなどの文字情報だけを用いているので、単語の品詞の
文法情報を用いるかな漢字変換方式では、修正内容とし
て獲得されたかな表記の単語や漢字変換辞書に記載され
た単語と同様に扱うことができないという問題がある。
例えば、特開昭57-155668 号公報では、構文解析を利用
したかな漢字変換方式が提案されているが、これには単
語の品詞が必要である。ところが、従来の装置では、か
な表記の単語の品詞や文法情報を記憶する手段がないた
め、かな表記の単語に関しては上記のかな漢字変換方式
を適用することができず、かな漢字変換効率の向上を妨
げてしまう。
【0008】かと言って、利用者がかな表記の単語を辞
書に登録するのでは、登録単語の指定など複雑な操作が
必要となり非常に手間がかかる上に、利用者が文法情報
を決定しなければならないので文法などの知識が利用者
に要求されるという問題がある。
【0009】
【発明が解決しようとする課題】このように従来のかな
漢字変換装置では、修正された結果得られたかな表記の
単語が、ある単語の活用形である場合、その単語の異な
る活用形には修正結果の影響が及ばないという問題があ
った。また、修正操作内容として読みや読みの長さなど
の文字情報だけを用いているので、単語の品詞などの文
法情報や意味情報などの様々な変換用情報を用いるかな
漢字変換方式では、修正内容として獲得されたかな表記
の単語をかな漢字変換辞書に記載された単語と同様に扱
うことができないという問題があった。
【0010】本発明は上記の点を鑑みてなされたもの
で、その目的とするところは、かな表記に修正した単語
を変換用情報も含めて自動的にかな漢字変換辞書に登録
するかな漢字変換装置を提供することにある。
【0011】
【課題を解決するための手段】本発明に係るかな漢字変
換装置は、日本語文章の読みを入力する入力部と、読み
と、かな表記のまたは漢字かな混じりの語句と、変換用
情報とを対応付けて予め記憶するかな漢字変換辞書と、
このかな漢字変換辞書を用いて入力された読みを漢字か
な混じりの語句に変換するかな漢字変換部と、かな漢字
変換された語句に、これと同じ読みを持つ語句としてか
な表記の語句を含めた上で表示する表示部と、表示され
た複数の同じ読みを持つ語句から一つの語句の選択を指
示する指示部と、新たに含められたかな表記の語句が選
択された場合、選択されたかな表記の語句の変換用情報
を判定する変換用情報判定部と、選択されたかな表記の
語句を判定された変換用情報と共にかな漢字変換辞書に
登録するひらがな単語登録部とを具備することを特徴と
するものである。また、前記の変換用情報判定部は、そ
の語句の変換用情報を同音語の変換用情報と同じと推定
するものであって、推定の根拠になっている同音語が選
択された場合、選択された同音語を根拠として推定した
変換用情報をもつかな表記の単語をかな漢字変換辞書か
ら削除するひらがな単語管理情報更新部とを具備するこ
とを特徴とするものである。
【0012】
【作用】本発明によれば、かな表記の単語を文法情報を
含めてかな漢字変換辞書に登録する際に、かな表記の単
語を一度選択することによって、自動的にこの単語の同
音語の変換用情報とともに、このかな表記の単語をかな
漢字変換辞書に登録する。よって、次回から、そのかな
表記の単語もしくはその単語の活用形の読み情報を利用
者が入力すれば、利用者が意図しているかな表記を第一
候補として変換することが可能となる。さらに、上記で
登録したかな表記の単語とその同音語の変換用情報のう
ち、漢字表記された同音語が選択された場合、この選択
された同音語と同じ変換用情報を持つかな表記の単語を
かな漢字変換辞書から削除することによって、より信頼
性の高いかな漢字変換辞書を自動的に作成することがで
きる。また、登録されたかな表記の単語に関しても、予
め辞書に記憶されていた語と同様に、各種学習方式や、
構文情報や単語の共起関係を用いたかな漢字変換処理を
行うことができる。
【0013】
【実施例】以下、図面を参照しながら本発明の一実施例
について説明する。
【0014】図1は、本実施例に係るかな漢字変換装置
の概略構成を示すブロック図である。図1において、入
力部1はかな漢字変換処理の対象となるかな文字列の入
力、もしくは、同音語選択などの編集のためのコマンド
の入力を行なうためのキーボードなどからなっている。
かな漢字変換部2は、入力部1から受けとったかな文字
列をかな漢字変換辞書9に記憶された情報を用いて、漢
字かな混じり文に変換し、その結果を変換結果メモリ6
に書き込む。
【0015】文法情報判定部3は、変換結果メモリ6に
書き込まれた単語のうち、選択されたひらがに表記の単
語(以降、ひらがな単語と呼ぶ)に対して文法情報を判
定し、ひらがな単語と、判定した文法情報とをひらがな
単語登録部4に送る。さらに、文法情報を判定した根拠
となった同音語をひらがな単語管理情報記憶部10に記憶
する。ひらがな単語登録部4は、文法情報判定部3か
ら、ひらがな単語とその単語の文法情報とを受けとり、
これらの情報をひらがな単語辞書93に登録する。
【0016】ひらがな単語管理情報更新部5では、編集
制御部8から、ひらがな単語以外の単語を受けとり、ひ
らがな単語管理情報記憶部10を更新する。出力部6は、
かな漢字変換処理された変換結果、あるいは変換結果の
修正に用いられる同音語リストなどを表示する。編集制
御部8は、かな漢字変換部2により変換された結果を出
力部7に送る他、入力部1より編集コマンドを受けと
り、それぞれのコマンドに従って動作を行ない、編集結
果によって、変換結果メモリ6の内容を更新する。
【0017】かな漢字変換辞書9は、単語の読みとそれ
に対応する漢字かな混じりの表記の対応を記憶してお
り、あらかじめ用意されている一般辞書91、利用者が登
録する新語辞書92、ひらがな単語を登録するためのひら
がな単語辞書93がある。
【0018】図2は、かな漢字変換辞書9に記憶された
一般辞書91の内容の一例である。本辞書は、「読み」2
1、「見出し」22、「文法情報」23、「見出し番号」 24
の各項目から構成されており、「読み」22の部分には単
語の読み(例えば、「はる」)が記憶され、「見出し」
22の部分には、「読み」21の部分の読みを持つ単語の漢
字かな混じり表記(例えば、「春」)が記憶されてい
る。「文法情報」23には、単語の文法情報(例えば、
「名詞」)が記憶されている。「見出し番号」24には、
各見出しごとに付けられた認識番号(例えば、「1」が
記憶されている。
【0019】図3は、ひらがな単語管理情報記憶部10に
記憶されたひらがな単語管理情報の格納フォーマットの
一例である。このフォーマットにおける1セットは、
「ひらがな単語見出し番号」31と「同音語数」32と「同
音語見出し番号リスト」33の項目からなる。「ひらがな
単語見出し番号」31は、かな漢字変換辞書9に登録され
たひらがな単語の見出し番号が記憶されている。「同音
語数」32は、「同音語見出し番号リスト」33に記憶され
た見出し番号の数を示す。「同音語見出し番号リスト」
は、N個の「同音語見出し番号」 321〜32Nの項目から
なっている。「同音語見出し番号」 321〜32Nは、「ひ
らがな単語見出し番号」31が指し示すひらがな単語と同
じ読みで同じ文法情報を持つ単語の見出し番号(図2参
照)が記憶されている。同じ読みでも違う文法情報を持
つひらがな単語は、「ひらがな単語見出し番号」を異に
する別々のセットに記憶される。図4はこのフォーマッ
トで格されているひらがな単語管理情報の一例である。
この情報の意味は、「ひらがな単語見出し番号」が2001
(ここでは、「はる」、文法情報は「名詞」)のひらが
な単語は同音語見出し番号が1(「春」)をひらがな表
記にしたものであり、「ひらがな単語見出し番号」が20
02(ここでは、「はる」、文法情報は「動詞ラ行五段活
用」)のひらがな単語は、同音語見出し番号が2(「張
る」)か3(「貼る」)をひらがな表記したものである
ことを表している。したがって、例えば、現在入力中の
「春」という単語表記が用いられたならば、ユーザには
「春」という単語を「はる」とかな表記する意志はな
く、「ひらがな単語見出し番号」が2001のひらがな単語
は誤って登録されているものと判断する。この処理の詳
細は後述する。
【0020】図5は、かな漢字変換部2によって変換さ
れた結果を格納する変換結果メモリ6に記憶された変換
結果の格納フォーマットの一例である。変換結果は文節
毎に区切られているが、これらの文節を「文節番号」5
1、「全候補数」52、「選択候補番号」53、「同音語デ
ータ」54の項目で表現している。「文節番号」51は、か
な漢字変換された結果、この項目のあるレコードが、先
頭から何番目の文節を表しているかを格納している。
「全候補数」52は、「同音語データ」54の候補の数を保
持するものである。「選択候補番号」53は、「同音語デ
ータ」54のN個の「文節候補データ」のうち何番目の候
補が現在選択されているかを格納している。「同音語デ
ータ」54は、N個の「文節候補データ」 541〜54Nによ
って構成されている。このときの1〜Nを「文節候補の
番号」と呼ぶ。「文節候補データ」 541〜54Nは、かな
文字列に対する「かな漢字変換結果」55とその変換結果
に含まれる単語の「見出し番号」56からなっている。こ
の「見出し番号」は、一般辞書にある単語の場合はその
見出し番号(図2参照)であり、ひらがな単語辞書にあ
るひらがな単語の場合は0である。次に、以上のように
構成した実施例の動作について説明する。
【0021】まず、全体の動きを図7の流れ図を用いて
説明する。ステップA1で入力部1が変換すべきかな文
字列を受けとると、ステップA2でかな漢字変換部2に
よって入力されたかな文字列がかな漢字変換される。か
な漢字変換処理に関しては、例えば、特開昭60-72014号
公報等によって開示されている手法を流用すれば良いの
で、ここでは詳しく述べない。次に、ステップA3で
は、編集制御部8によって、ひらがな単語が候補に存在
していない文節にひらがな単語を付加し、利用者に文節
の候補を選択させる。ステップA4において、もし、ス
テップA3で付加したひらがな単語が選択された場合、
文法情報判定部3を用いて、そのひらがな単語の文法情
報を判定しひらがな単語辞書93に登録する(ステップA
5)。もし、ステップA4において、付加したひらがな
単語以外が選択された場合は、ひらがな単語管理情報更
新部5によって、ひらがな単語管理情報を書き換え、そ
の結果によって不必要なひらがな単語をひらがな単語辞
書93から削除する(ステップA6)。
【0022】次に、編集制御部8の動作(ステップA
3)を図8に従って説明する。まず、変換結果メモリ6
の内容から、第一候補の表示を行なう(ステップB
1)。第一候補とは、「文節候補データ」 541の「かな
漢字変換結果」55のことである。例えば、変換結果メモ
リ6の内容が図6(a)の状態にあるとする。この状態
は、「はるがきた」というかな入力に対する変換結果で
ある。この場合、第一候補の表示は、選択候補番号53を
参照して、各文節の第一候補(1番目の文節「はるが」
に対しては1番目の文節候補データ「春が」、2番目の
文節「きた」に対しては2番目の文節候補データ「来
た」)を並べた「春が来た」となる。次に、文節番号を
表す変数BNに1を代入する(ステップB2)。ステッ
プB3では、文節番号がBNの文節候補データ中でひら
がな候補の有無を調べ、存在しなければ、辞書に登録す
る。そして、文節番号がBNの文節候補を上記のひらが
な候補を含めて表示し(ステップB4)、利用者がその
中から一つ選択できるようにする(ステップB5)。例
えば、図9のようにしてユーザに選択される。次に選択
された文節候補の番号を変換結果メモリ6の「選択候補
番号」53に書き込む(ステップB6)。ステップB7
で、もし、処理されていない文節がもうなければ、終了
する。まだ、処理されていない文節があれば、変数BN
を1増やして(ステップB8)、ステップB3以降の処
理を行なう。
【0023】さらに、ステップB3について図10に従っ
て説明する。まず、文節候補の番号を表す変数KNに1
を代入して、処理用のフラグを表す変数Fに1を代入す
る(ステップC1)。変数KNが指し示す文節候補がか
な表記であるか、つまり、ひらがな単語であるか調べ
(ステップC2)、もし、ひらがな単語であれば、フラ
グFを0にする(ステップC3)。次に、ステップC4
において、変数KNが変換結果メモリ6の「全候補数」
52に一致していなければ、変数KNを1増やして(ステ
ップC7)、一致するまで、ステップC2〜C3の処理
を行う。全ての文節候補に対して処理が終わったところ
で、フラグFを調べ(ステップC5)、もし、Fが1で
あるならば、すなわち、同音語の候補の中にひらがな単
語が存在していなければ、「同音語データ」54の「文節
候補データ」55の最後にひらがな単語を付加する。この
とき、「見出し番号」56を0とし、付加した単語である
ことを示しておく。また、同時に「全候補数」52を1増
やしておく。例えば、変換結果メモリ6の内容が図6
(a)であるとすると、このステップB3によってひら
がな単語を付加し、前記のステップB6でユーザに選択
された文章候補の番号を「選択候補番号」53に書き込ん
だ後は図6(b)のようになる。
【0024】また、文法情報判定部3の動作(ステップ
A5)を図11に従って説明する。まず、文節番号を表す
変数BNに1を代入する(ステップD1)。BNという
文節番号をもつ「同音語データ」54の中で「選択候補番
号」53が指し示す候補の「見出し番号」56が0か調べる
(ステップD2)。もし、この見出し番号が0でなけれ
ば、すなわち、編集制御部8において付加されたひらが
な単語が選択されていなければ、ステップD7まで、処
理を飛ばす。これに対して、見出し番号が0の単語は、
ひらがな単語辞書93(図12にこの内容の一部を示す)に
登録すべきひらがな単語となるので、ひらがな単語の文
法情報の判定を行なう。文節候補の番号を表す変数KN
に1を代入する(ステップD3)。次に、ひらがな単語
辞書93を検索して、変数KNの候補のもつ文法情報が登
録すべきひらがな単語と共にすでに登録されているか判
断する(ステップD4)。即ち、変数KNの候補の見出
し番号56を見て、一般辞書91中の見出し番号24が前記の
見出し番号56と一致するものの読み21-1と文法情報23-1
を引き、ひらがな単語辞書93の読み21-2が前記の読み21
-1と一致するものの文法情報23-2を引いてきて、その中
に前記の文法情報23-1と一致するものがあれば、既登録
と判断する。もし、まだ登録されていなければ、ステッ
プD5において、変数KNの候補のもつ文法情報23-1と
同じものをひらがな単語の文法情報23-2として、ひらが
な単語をひらがな単語辞書93に登録する。登録する際に
は見出し番号24をつけるが、例えば、一般辞書における
見出し番号は1〜1000、ひらがな単語辞書における見出
し番号(これがひらがな単語管理情報における「ひらが
な単語見出し番号」である)は1001〜というふうに、一
般辞書とひらがな単語辞書とで見出し番号が重複するこ
とのないように、また、既に登録されている見出し番号
と重なることのないように、新しい見出し番号を付け
る。そして、ステップD6において、登録したひらがな
単語の見出し番号をひらがな単語管理情報(図3参照)
の「ひらがな単語見出し番号」31に、1を「同音語数」
32に、変数KNが指し示す候補の見出し番号を「同音語
見出し番号1」 331に登録する。もし、ステップD4に
おいて、登録されていると判断したならば、その文法情
報で登録しているひらがな単語の見出し語番号をひらが
な単語管理情報の「ひらがな単語見出し番号」31にに持
つレコードを探し、変数KNが指し示す候補のもつ見出
し番号を「同音語見出しリスト」33に記憶する。さら
に、「同音語数」32を1増やす(ステップD9)。ステ
ップD7において、変数KNが、「全候補数」52に達し
ていなければ、変数KNを1増やして(ステップD
9)、次の候補に対して、ステップD4以降の処理を行
なう。全ての文節候補に対して処理が終わった時は、ま
だ処理されていない文節があるか調べて(ステップD
7)、まだ残っていれば、変数BNを1増やして、次の
文節に対して、ステップD2からの処理を行なう。例え
ば、変換結果メモリの内容が図6(a)から(b)のよ
うに変わる時、文法情報判定部の動作によって、ひらが
な単語辞書93には図12のような内容が書き込まれること
になる。また、ひらがな単語管理情報記憶部10の内容は
図14(a)のようになる。
【0025】さらに、ひらがな単語管理情報更新部5の
動作(ステップA6)を図13に従って説明する。まず、
文節番号を表す変数BNに1を代入する(ステップE
1)。もし、変数BNが指し示す文節「選択候補番号」
51を持つ同音語の見出し番号が.でない、すなわち、選
択されている語がひらがな単語でなければ(ステップE
2)、この見出し番号がひらがな単語管理情報の「同音
語見出し番号リスト」33に存在するか調べ(ステップE
3)、もし、存在すれば、その見出し語番号を削除し
(ステップE4)、「同音語数」32を1減らす(ステッ
プE5)。その結果、「同音語数」32が0になれば(ス
テップE7)、すなわち、そのレコードが表すひらがな
単語が、どの漢字表記の単語のかな表記でもなければ、
そのレコードの「ひらがな見出し番号」が指し示すひら
がな単語をひらがな単語辞書93から削除する。そして、
以上の動作を変換結果メモリ2のすべての文節について
おこなう(ステップE8、E9)。
【0026】次に、本実施例における実際の処理例を示
す。例えば、「はるがきた。」というかな入力があった
とする。このとき、かな漢字変換部2によって、変換結
果メモリ6の内容は、図6(a)のようになっている。
まず、第一候補として、「春が来た。」と変換される。
利用者が「来る」を「くる」とひらがな表記を用いたい
と考えていると仮定すると、この変換結果を図9のよう
な方法を用いて、「春がきた。」と修正する。この時の
変換結果メモリの内容は、図6(b)のようになってい
る。このメモリの内容に対して、文法情報判定部3が動
作し、「きた」というひらがな単語をひらがな単語辞書
に登録する。この「きた」の同音語は、変換結果メモリ
2の内容から、「北」、「来た」、「着た」となり、し
たがって、「きた」の同音語は、「名詞」、「動詞カ
変」、「動詞上一段」となる。このときのひらがな単語
辞書93は、図12、ひらがな単語管理情報記憶部10の内容
は、図14(a)となる。次に、「なつがくる。」という
かな入力があったとすると、ひらがな単語辞書93(図1
2)に「くる」というひらがな単語が登録されているの
で、第一候補として、ひらがな単語を優先的に使用する
ようにしておけば、「夏がくる。」と変換され、前回の
ように修正を行なう必要がない。
【0027】さらに、「きたをめざす。」という変換に
対しては、第一候補として、「きたを目指す。」と変換
されるが、「北を目指す。」と一度修正すれば、ひらが
な単語管理情報記憶部10の内容(図14(a))は、ひら
がな単語管理情報更新部5によって、図14(b)とな
り、見出し番号1001の「同音語数」が0となっているの
で、ひらがな単語辞書から見出し番号が1001である「き
た」(名詞)というひらがな単語が削除され、それ以降
は、「きた」(名詞)は変換結果中に登場しなくなる。
以上のように本実施例では、ひらがなの単語を1度選択
すれば、その単語ばかりでなく、その活用形をひらがな
で使用できるようになる。また、誤って登録されたひら
がな単語に対しては、一度修正を行なうことにより、自
動的にその単語は辞書から削除される。
【0028】なお、本発明は、上記実施例にのみ限定さ
れず、要旨を変更しない範囲で適宜変形して実施可能で
ある。本実施例では、ひらがな単語辞書では登録・削除
等の操作が頻繁に行われるため、ひらがな単語辞書を一
般辞書とは別に設けているが、この形態は自由である。
例えば、一般辞書の中にひらがな単語辞書を含めるよう
にしても良いし、利用者が登録できる新語辞書にひらが
な単語を登録しても良い。更に、これら辞書のフォーマ
ットの変更や辞書項目の追加を行なっても、実施可能で
ある。
【0029】また、上記の例において、ユーザが、例え
ば全文書に渡って、「北」(名詞)という単語は「北」
と漢字表記し、「来た」(動詞カ変)という単語は「き
た」とひらがな表記したい場合に、まず、どちらの「き
た」もひらがな単語辞書に登録し、「北」なる漢字表記
の単語がユーザに選択された時点で、名詞の「きた」を
ひらがな単語辞書から抹消する。その後、ユーザが「来
た」という意味で「きた」なるひらがな表記の単語を選
択したとき、再び「北」の意味の「きた」をひらがな単
語辞書に登録することのないように、図7のステップA
4は「ステップA3で付加したひらがな単語が確定され
たか」という条件になっている。これを、「現在第一候
補でないひらがな単語が確定されたか」という条件に変
えても良い。
【0030】また、上記の例では、文節候補にひらがな
単語を付加するタイミングを、ユーザに候補を選択させ
る前としている。これを、装置がユーザに漢字表記の候
補を提示し、ユーザが無変換キー等を用いてひらがな表
記に直して確定したときに、ひらがな単語を付加するよ
うにしても良い。
【0031】また、上記の例では、変換結果メモリにあ
る文節候補のうち第一候補のみは選択候補番号として示
されるが、他の文節候補の優先順位(提示順)は付けて
いない。これを、選択候補番号53をなくして、文節候補
データに、かな漢字変換結果55、見出し番号56の他に優
先順位57を格納するようにしても良い。
【0032】また、上記の例では、図11のステップD14
で、確定されたひらがな単語と同じ読みを持つ単語の文
法情報が既にひらがな単語辞書に登録されているか判断
する際に、ひらがな単語辞書の読みから文法情報を引く
検索を行っている。これを、ひらがな単語の文法情報の
元となる単語の見出し番号を記憶しているひらがな単語
管理情報部10を利用して、全同音語見出し番号53の中に
確定されたひらがな単語と同じ読みを持つ単語の見出し
番号が存在するか調べることにより、登録の有無を判断
しても良い。
【0033】また、本実施例では、ひらがな単語を辞書
に登録する際に文法情報判定のみを行なっているが、同
音語の持つさまざまな情報をひらがな単語の情報として
も良い。例えば、どの語が同時に使われるかという共起
情報を用いるようなかな漢字変換手法においては、
「桜」と「咲く」が同時に使われるという情報があれ
ば、「さくら」というひらがな単語を辞書登録する際
に、「さくら」と「咲く」が同時に使われるという情報
を追加するといった使い方も可能である。本発明では、
このような文法情報、共起情報等を全て含めて変換用情
報と呼んでいる。変換用情報によって単語の性質を文法
情報のみよりさらに詳しく表すならば、例えば図4にお
いて同じ見出し番号に分類されている「はる」に対応す
る「張る」と「貼る」を、区別してひらがな単語辞書に
登録することができるようになる。つまり、ひらがな単
語管理情報における同音語数は大部分が1になる。する
と、例えば「張る」に対しては「はる」という表記を、
「貼る」に対しては「貼る」という表記を用いるという
ように、さらに細かいかな漢字変換制御が行えるように
なる。
【0034】さらに、本実施例では、ひらがな単語に登
録された単語を優先的に第一候補としているが、これ
は、長期学習などの各種学習や構文情報や意味情報を用
いるかな漢字変換手段を用いて、第一候補を決定するこ
とも可能である。このとき、上記のステップA4に関す
る変形例や優先順位に関する変形例を組み合わせると有
用である。
【0035】
【発明の効果】以上説明したように本発明によれば、ひ
らがな単語が一度選択されると、その単語の文法情報を
含む変換用情報を判定してかな漢字変換辞書に登録する
ことにより、利用者は、それ以降、ひらがな表記したい
単語とその活用形を毎度選択し直すという手間が減少
し、選択したひらがな単語やその活用形を辞書に登録さ
れている他の単語と同様に扱うことができ、また、単語
の選択状況から、誤って登録されたひらがな単語の削除
を行なうことにより、登録されたひらがな単語の信頼性
を向上させることのできるかな漢字変換装置を実現でき
るという実用上多大なる効果が奏せられる。
【図面の簡単な説明】
【図1】 本実施例に係るかな漢字変換装置の概略構成
を示すブロック図。
【図2】 かな漢字変換辞書9における一般辞書91の内
容の一例を表す図。
【図3】 ひらがな単語管理情報記憶部10に記憶された
ひらがな単語管理情報のフォーマットの一例を表す図。
【図4】 図3の格納フォーマットによるひらがな単語
管理情報の一例を表す図。
【図5】 変換結果メモリ6に記憶された変換結果の格
納フォーマットの一例を表す図。
【図6】 図5の格納フォーマットによる変換結果内容
の一例を表す図。
【図7】 本かな漢字変換装置の全体の処理の流れを示
すフロー図。
【図8】 編集制御部8の動作を表すフロー図。
【図9】 同音語選択のインタフェースの一例を示す画
面図。
【図10】 ひらがな単語付加(図8ステップB3)の
処理を表すフロー図。
【図11】 文法情報判定部3の動作を表すフロー図。
【図12】 ひらがな単語辞書93の内容の一部を示す
図。
【図13】 ひらがな単語管理情報更新部5の動作を表
すフロー図。
【図14】 「はるがきた」の変換に対するひらがら単
語管理情報の内容を表す図。
【符号の説明】
1…入力部 2…かな漢字変換部 3…文法情報判定部 4…ひらがな単語登
録部 5…ひらがな単語管理情報更新部 6…変換結果メモリ 7…出力部 8…編集制御部 9…かな漢字変換辞書 91…一般辞書 92…新語辞書 93…ひらがな単語辞
書 10…ひらがな単語管理情報記憶部 21…読み 22…見出し 23…文法情報 24…見出し番号 31…ひらがな単語見
出し番号 32…同音語数 33…同音語見出し番
号リスト 51…文節番号 52…全候補数 53…選択候補番号 54…同音語データ
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平3−137765(JP,A) 特開 昭63−276166(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/24

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】読み情報と漢字かな混じりの文字情報と変
    換用情報とを対応付けて予め記憶するかな漢字変換辞書
    と、 このかな漢字変換辞書を用いて、入力された読み情報を
    漢字かな混じりの文字情報に変換するかな漢字変換手段
    と、 このかな漢字変換手段により変換された文字情報を出力
    する出力手段と、 この出力手段により出力された文字情報に、同じ読み情
    報をかなのみで表記したかなのみの文字情報が含まれて
    いなければこれを追加し、これらの文字情報の中から一
    つの文字情報を選択する選択手段と、 この選択手段で追加されたかなのみの文字情報が選択さ
    れた場合、選択されたかなのみの文字情報と、前記読み
    情報と、前記出力手段により出力された文字情報に対応
    する前記変換用情報とを対応づけて、前記かな漢字変換
    辞書に登録する登録手段と、 前記選択手段でかなのみの文字情報以外の文字情報が選
    択された場合に、選択された文字情報と前記読み情報及
    び前記変換用情報を共通にするかなのみの文字情報が、
    前記かな漢字変換辞書に、前記登録手段によって既に登
    録されているときには、このかなのみの文字情報を前記
    かな漢字辞書から削除する手段とを有することを特徴と
    するかな漢字変換装置。
JP23019791A 1991-09-10 1991-09-10 かな漢字変換装置 Expired - Fee Related JP3329476B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23019791A JP3329476B2 (ja) 1991-09-10 1991-09-10 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23019791A JP3329476B2 (ja) 1991-09-10 1991-09-10 かな漢字変換装置

Publications (2)

Publication Number Publication Date
JPH0567080A JPH0567080A (ja) 1993-03-19
JP3329476B2 true JP3329476B2 (ja) 2002-09-30

Family

ID=16904107

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23019791A Expired - Fee Related JP3329476B2 (ja) 1991-09-10 1991-09-10 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JP3329476B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6275945B1 (en) 1996-11-26 2001-08-14 Kabushiki Kaisha Toshiba Apparatus for radiating heat for use in computer system
EP2426773B1 (en) 2010-09-03 2017-11-29 GS Yuasa International Ltd. Battery

Also Published As

Publication number Publication date
JPH0567080A (ja) 1993-03-19

Similar Documents

Publication Publication Date Title
JPS619753A (ja) 文書処理装置における頻発熟語の自動登録方法
US5384700A (en) Method and system for storing multiple, modifiable Yomi and Kanji strings in a structured document
JP3329476B2 (ja) かな漢字変換装置
US20040054677A1 (en) Method for processing text in a computer and a computer
JP2595934B2 (ja) 仮名漢字変換処理装置
JPS6246029B2 (ja)
JPS60124777A (ja) 文書処理装置
JPS62145463A (ja) 仮名漢字変換方式
JPS62140165A (ja) 仮名漢字変換方式
JPH038070A (ja) キーワード抽出方式
JPS62180465A (ja) 仮名漢字変換方式
JPH0610804B2 (ja) かな漢字変換装置
JPH0443308B2 (ja)
JPS6210762A (ja) 仮名漢字変換方式
JPH0713965A (ja) 仮名漢字変換装置
JPS6210764A (ja) 仮名漢字変換方式
JPH05324647A (ja) 文章作成装置
JPS60140460A (ja) カナ漢字変換装置における短縮変換方式
JPH11345229A (ja) 文字処理装置及び文字処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH05120266A (ja) かな漢字変換装置
JPH0128977B2 (ja)
JPH0214365A (ja) 前編集支援方式および装置
JPH05189432A (ja) 文章検査装置
JPH0567076A (ja) かな漢字変換装置
JPH0520301A (ja) かな漢字変換装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080719

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090719

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees