JPH0728806A - 文字処理装置及びその方法 - Google Patents

文字処理装置及びその方法

Info

Publication number
JPH0728806A
JPH0728806A JP5170472A JP17047293A JPH0728806A JP H0728806 A JPH0728806 A JP H0728806A JP 5170472 A JP5170472 A JP 5170472A JP 17047293 A JP17047293 A JP 17047293A JP H0728806 A JPH0728806 A JP H0728806A
Authority
JP
Japan
Prior art keywords
document
field
field information
word
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5170472A
Other languages
English (en)
Inventor
Eiichiro Toshima
英一朗 戸島
Hiroki Suzuki
大記 鈴木
Shuichi Morisawa
秀一 森澤
Atsushi Sakakibara
厚志 榊原
Kazuyo Ikeda
和世 池田
Yuji Kobayashi
雄二 小林
Hitoshi Yururi
仁志 緩利
Chika Ogusu
千佳 小楠
Mayumi Morita
麻友美 森田
Mariko Kishino
麻里子 岸野
Risa Adachi
里砂 安達
Hideyasu Suzuki
秀恭 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP5170472A priority Critical patent/JPH0728806A/ja
Publication of JPH0728806A publication Critical patent/JPH0728806A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 文書呼出時にその文書の分野情報を推定し、
その推定した分野情報に応じて仮名漢字変換の変換候補
の順序を変化させ、同音語候補選択の手間を低減する。 【構成】 読みを入力する入力手段と、単語の読みと、
表記及び分野情報を含む単語情報とを対応づけて記憶し
た辞書手段と、編集中の文書の分野情報を記憶する分野
情報記憶手段と、前記入力手段より入力された読みを、
前記分野情報記憶手段及び前記辞書手段を参照して、表
記に変換する変換手段と、前記変換手段によって得られ
た表記により編集された文書を記憶する文書記憶手段
と、補助記憶部に保存された文書を前記文書記憶手段に
呼び出す呼び出し手段と、前記呼び出し手段により呼び
出された文書から該文書の属する分野情報を推定する推
定手段と、該推定手段により推定された分野情報を、前
記分野情報記憶手段に設定する設定手段とを具える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、仮名文字を入力し、仮
名漢字変換により漢字仮名混じり文を編集する文字処理
装置及びその方法に関する。
【0002】
【従来の技術】現在、日本ワードプロセッサなどの文字
処理装置では、漢字仮名混り文の入力を仮名漢字変換を
使って行なうことが一般的である。仮名漢字変換方式の
最大の問題点は同音語である。例えば、読み「きこう」
に対しては、「気候」「機構」「奇行」「貴校」などと
いくつもの変換候補が存在するが、このうちオペレータ
がどれを望んでいるかは、装置には知り得ないことであ
る。そのため、考えられる全ての候補を一般的な日本語
としてありそうな順序で装置が表示し、オペレータが表
示された候補から1つを選択するという方式が一般的な
構成となっている。
【0003】
【発明が解決しようとしている課題】ところが、変換候
補の表示順序は一般的な観点に基づいて定められるた
め、必ずしもオペレータの望む候補が上位に表示される
とは限らない。例えば、先の「きこう」についていう
と、地理や地学を話題とする文書を入力する人にとって
は「気候」が最も自然な変換であるが、特許などの工学
的な文書を作成している人にとっては「機構」が最も自
然な変換である。このように、作成文書が話題とする分
野によって、変換候補の順序は異なるのが普通である。
もちろん、工学的文書でも「気候」という単語が全く出
現し得ないわけではないが、可能性は低く、工学分野の
文書では「機構」が最も自然な第1候補である。
【0004】しかしながら、従来装置では変換候補の順
序は固定的であり、地理分野の文書を入力する時も、工
学分野の文書を入力する時も、同じ順序で変換候補は表
示されていた。もし作成文書の分野情報がわかっていれ
ば、より尤もらしい変換候補を上位に変換することがで
きる。
【0005】このため、入力中の仮名漢字変換の過程か
ら分野情報を抽出し、それを次の仮名漢字変換に利用す
ることで変換率を向上させる試みも提案されている。そ
の方式では入力過程で徐々に分野情報が抽出され、仮名
漢字変換時にはその分野情報を参照して分野の単語を優
先して変換するというものである。しかし、その方式で
は入力によって分野情報が蓄積されるので、例えば、定
型文書を読み込んだ場合などは分野情報が蓄積されない
ので、変換率の向上につながらないという欠点があっ
た。
【0006】
【発明が解決しようとしている課題】本発明は上述の欠
点に鑑みてなされたものであり、その目的とするところ
は、文書呼出時にその文書の分野情報を推定し、その推
定した分野情報に応じて仮名漢字変換の変換候補の順序
を変化させることにより、同音語候補選択の手間の少な
い操作性の高い仮名漢字変換入力を実現する文字処理装
置及びその方法を提供することにある。
【0007】
【課題を解決するための手段】上述した課題を解決し、
上記目的を達成するため、本発明によれば、読みを仮名
文字列により入力して、漢字仮名混じり表記を含む文書
を編集する文字処理装置において、読みを入力する入力
手段と、単語の読みと、表記及び分野情報を含む単語情
報とを対応づけて記憶した辞書手段と、編集中の文書の
分野情報を記憶する分野情報記憶手段と、前記入力手段
より入力された読みを、前記分野情報記憶手段及び前記
辞書手段を参照して、表記に変換する変換手段と、前記
変換手段によって得られた表記により編集された文書を
記憶する文書記憶手段と、補助記憶部に保存された文書
を前記文書記憶手段に呼び出す呼び出し手段と、前記呼
び出し手段により呼び出された文書から該文書の属する
分野情報を推定する推定手段と、該推定手段により推定
された分野情報を、前記分野情報記憶手段に設定する設
定手段とを備えることを特徴とする。
【0008】また、本発明の他の態様によれば、読みを
仮名文字列により入力して、漢字仮名混じり表記の文書
を編集する文字処理装置において、補助記憶部に保存さ
れた文書を文書メモリに呼び出し、呼び出された前記文
書から該文書の属する分野情報を推定し、該推定された
分野情報を、分野情報メモリに設定し、読みを入力し、
入力された前記読みを、単語の読みと、表記及び分野情
報を含む単語情報とを対応づけて記憶した辞書及び前記
分野情報メモリを参照して、表記に変換し、前記変換に
よって得られた表記により文書メモリに記憶された前記
定型文書を編集する文字処理方法を特徴とする。
【0009】
【作用】かかる構成により、入力手段より入力された読
みを、変換手段が分野情報記憶手段及び辞書手段を参照
して、表記に変換し、得られた表記により編集された文
書を文書記憶手段に記憶する。呼び出し手段が、補助記
憶部から文書を前記文書記憶手段に呼び出すと、該定型
文書に対応する分野情報を前記分野情報記憶手段に呼び
出し、推定手段は呼び出された文書から該文書の属する
分野情報を推定し、設定手段が推定された分野情報を分
野情報記憶手段に設定する。
【0010】
【実施例】以下に添付図面を参照して、本発明に係る好
適な一実施例を詳細に説明する。
【0011】〈第1の実施例〉図1は本発明に係る文字
処理装置の第1の実施例を示すブロック図である。同図
において、CPUは、マイクロプロセッサであり、文字
処理のための演算、論理判断等を行ない、アドレスバス
AB、コントロールバスCB、データバスDBを介し
て、それらのバスに接続された各構成要素を制御する。
【0012】アドレスバスABはマイクロプロセッサC
PUの制御の対象とする構成要素を指示するアドレス信
号を転送する。コントロールバスCBはマイクロプロセ
ッサCPUの制御の対象とする各構成要素のコントロー
ル信号を転送して印加する。データバスDBは各構成機
器相互間のデータの転送を行なう。
【0013】DICは辞書であり、仮名漢字変換を行な
う際に参照する。
【0014】つぎにROMは、読出し専用の固定メモリ
であり、図12〜図18につき後述するマイクロプロセ
ッサCPUによる制御の手順、及び、固定的なデータを
記憶する。WTBLは分野間関連度テーブルである。K
DICはキーワード辞書である。KANJIDは漢字辞
書である。
【0015】また、RAMは、1ワード16ビットの構
成の書込み可能のランダムアクセスメモリであって、各
構成要素からの各種データの一時記憶に用いる。IBU
Fはキー入力された読み列あるいは仮名漢字変換語の変
換結果を記憶する入力バッファである。DOBUFは仮
名漢字変換された変換結果の同音語候補を格納する同音
語バッファである。BTBLは分野情報テーブルであ
る。TBUFは文書データを記憶する文書バッファであ
る。
【0016】KBはキーボードであって、アルファベッ
トキー、ひらかなキー、カタカナキー等の文字記号入力
キー、及び、変換キー、実行キー、文書呼出キー、文書
保存キー、などの本文字処理装置に対する各種機能を指
示するための各種のファンクションキーを備えている。
【0017】DISKは文書データを記憶するための外
部記憶であり、文書バッファ上に作成された文書の保管
を行ない、保管された文書はキーボードの指示により、
必要な時呼び出される。
【0018】CRはカーソルレジスタである。CPUに
より、カーソルレジスタの内容を読み書きできる。後述
するCRTコントローラCRTCは、ここに蓄えられた
アドレスに対応する表示装置CRT上の位置にカーソル
を表示する。
【0019】DBUFは表示用バッファメモリで、表示
すべきデータを蓄える。
【0020】CRTCはカーソルレジスタCR及びバッ
ファDBUFに蓄えられた内容を表示器CRTに表示す
る役割を担う。
【0021】またCRTは陰極線管等を用いた表示装置
であり、その表示装置CRTにおけるドット構成の表示
パターンおよびカーソルの表示をCRTコントローラで
制御する。
【0022】さらに、CGはキャラクタジェネレータで
あって、表示装置CRTに表示する文字、記号のパター
ンを記憶するものである。
【0023】かかる各構成要素からなる本発明文字処理
装置においては、キーボードKBからの各種の入力に応
じて作動するものであって、キーボードKBからの入力
が供給されると、まず、インタラプト信号がマイクロプ
ロセッサCPUに送られ、そのマイクロプロセッサCP
UがROM内に記憶してある各種の制御信号を読出し、
それらの制御信号に従って各種の制御が行なわれる。
【0024】図2は、第1の実施例による分野処理の例
を示した図である。
【0025】図中アンダラインは入力中の読み列を示
し、黒い矩形はカーソルを意味する。(a)は地理分野
を話題にしているので、仮名漢字変換の過程で文書の分
野情報が地理分野の方に傾き、「きこうの」を変換する
と「気候の」に変換される。(b)は工学分野を話題に
しているので、仮名漢字変換の過程で文書の分野情報が
工学分野の方に傾き、「きこうの」を変換すると「機構
の」に変換される。
【0026】図3は辞書DICの構造を示した図であ
る。
【0027】仮名漢字変換のための単語情報を記憶す
る。「読み」には単語の読みを記憶する。「表記」には
単語の表記を記憶する。「文法情報」には、品詞情報な
どの単語の文法情報を記憶する。「頻度」には単語の頻
度を記憶する。頻度は1から5の範囲内で記述し、5が
最も尤もらしい単語であることを意味する。「分野情
報」にはその単語の属する分野idとその分野の確信度
を記憶する。1つの単語に複数の分野idが記述でき
る。分野idは、分野1〜分野nまでのどれかである。
図中は分かりやすいように「地理」「地学」「工学」
「事務」などと記述している。確信度は0〜1の範囲の
値を取る。1は100%確実にその分野の単語であるこ
と意味する。0はその分野とは縁もゆかりもない単語で
あることを意味する。分野が記述されていない場合は確
信度0と解釈し、確信度0の分野は辞書には記述しな
い。全くどの分野にも属さない単語(例えば、「この」
など)はこの「分野情報」の記述はないことになる。
【0028】ある単語が選択された時、その単語の属す
る分野とその確信度に応じて、文書の分野情報が更新さ
れる。
【0029】図4はキーワード辞書KDICの構造を示
した図である。
【0030】キーワード辞書は、分野特有の読み列を記
憶した辞書であり、そこに記述された読みが入力される
だけで、その文書の分野が更新される。
【0031】「読み」にはキーワードの読み列が記憶さ
れる。「分野情報」には辞書DICに示したのと同等な
情報(分野idと確信度)が格納される。分野情報には
複数の分野を記述することもできる。
【0032】図5は入力バッファIBUFの構成を示し
た図である。
【0033】入力バッファIBUFは打鍵された読み
列、その読み列を仮名漢字変換した変換結果、次候補表
示を指示した場合の次候補の表記を格納する。入力バッ
ファIBUFに格納された文字列は画面上にアンダライ
ン付きで表示される。
【0034】(a)は読み列「きこうの」が入力された
状態を示した図である。ここで変換キーが打鍵されると
仮名漢字変換が行なわれ、(b)のように変換結果「機
構の」が格納される。更に変換キーが打鍵されると
(c)のように次候補「気候の」が格納される。
【0035】図6は同音語バッファDOBUFの構成を
示した図である。
【0036】読み列が仮名漢字変換されると、その同音
語情報が同音語バッファDOBUFに格納される。次候
補表示などが指示されると、同音語バッファDOBUF
中で候補Noに示された候補の表記が、入力バッファI
BUFに格納される。
【0037】「候補No」は、現在表示中の候補を示し
た変数である。「第i候補」は仮名漢字変換結果のi番
目の順位に表示される候補に関する情報を記憶する。
「表記」はその変換候補の表記を記憶する。「頻度」は
その候補の自立語の頻度(辞書DIC中に記載されてい
た値)をコピーしたものである。「分野情報j」はその
自立語の持つ分野idと確信度を辞書DICからコピー
したものである。
【0038】図7は分野情報テーブルBTBLの構成を
示した図である。
【0039】分野情報テーブルBTBLは、その文書の
仮名漢字変換入力に応じて蓄積された分野情報を記憶す
るものである。分野1〜分野nの一つ一つに対してその
分野の尤もらしさ(尤度)を記憶する。図中、分野1は
「工学分野」、分野2は「地理分野」分野3は「医学分
野」として示している。分野iの尤度が高いということ
は、その文書が分野iに属する可能性が高いということ
を意味する。
【0040】図8は分野間関連度テーブルWTBLの構
成を示した図である。
【0041】分野間関連度テーブルは、分野間の関連度
を示したテーブルである。行i列jの交点にある値Wij
は、分野jが分野iに与える影響の大きさを示し、影響
が大きいほど大きな値となる。分野jが分野iに与える
影響度とは、言い換えると、分野jの単語が選択された
時、入力中の文書の分野iの尤度を上げるべきなのか
(関連度が大)、分野iの尤度を下げるべきなのか(関
連度がマイナス)、分野iの尤度を変更しない方が良い
のか(関連度が0)を示している。行k列kの交点Wkk
は、分野kが分野k自身に与える影響であり、当然正の
値を持つ。
【0042】図9は各漢字コードがどの分野に属してい
るかを示しているかを記述する漢字辞書KANJIDの
構成を示した図である。
【0043】分野情報はその単語の属する分野idとそ
の分野の確信度を記憶する。1つの漢字に複数の分野i
dが記述できる。分野idは、分野1〜分野nまでのど
れかである。図中は分かりやすいように「地理」「地
学」「工学」「事務」などと記述している。確信度は0
〜1の範囲の値を取る。1は100%確実にその分野の
単語であること意味する。0はその分野とは縁もゆかり
もない単語であることを意味する。分野が記述されてい
ない場合は確信度0と解釈し、確信度0の分野は辞書に
は記述しない。全くどの分野にも属さない漢字(例え
ば、「此」など)は分野情報の記述はない。
【0044】例えば、漢字「鉱」は地理分野に0.6、
地学分野に0.6属していることがこのテーブルから読
み取れる。
【0045】図10は、仮名漢字変換における第1候補
決定のための評価式を示している。文節尤度は、変換単
語の単語頻度と、変換単語の「分野尤度」との和で求め
られる。ここで、変換単語の「分野尤度」は、変換単語
の分野kに対する確信度(Ck とする)と、その時の分
野情報テーブル上の分野kの尤度(Bk とする)との積
k ×Ck の最大値で求められる。
【0046】以上のようにして求められた文節尤度の最
も大きい変換単語が、第1候補として変換され、第2候
補以下は文節尤度の大きい順に表示される。
【0047】図11は、単語が選択された時の分野情報
テーブルの更新方法を示したものである。
【0048】ある単語が選択された時、その単語の属す
る分野に従って、以下のように分野情報テーブルの各分
野の尤度を更新する。
【0049】まず選択単語の分野kの確信度(Ck とす
る)を辞書DICから求め、次に分野kが分野iに与え
る影響度Wkiを分野間関連度テーブルから求め、確信度
kに乗じる。なお、選択単語の分野情報に分野kの記
述がなかった時は、分野kの確信度は0とする。この乗
じた値を分野1から分野nまでの和を取り、分野情報テ
ーブルの分野iの尤度(Bi とする)に加える。この分
野iの尤度Bi の計算を分野1から分野nまでの尤度に
ついて行なう。
【0050】また、第1候補で変換した単語が選択され
なかった時(第1候補以外の単語が選択された時)は、
以下のように分野情報テーブルの分野の尤度を更新す
る。
【0051】まず、分野kの単語の非選択が分野iに与
える非選択影響度(図中、Xで記述)を定義する。ここ
では、分野iが分野iに与える非選択影響度は、分野i
が分野iに与える影響度Wiiのマイナスであり、i≠j
のときの分野jが分野iに与える非選択影響度は0であ
ると定義する。
【0052】次に、第1候補で変換されたが選択されな
かった単語(非選択単語)の分野kの確信度(dk とす
る)を求め、それに分野kが分野iに与える非選択影響
度を乗じる。この乗じた値を分野1から分野nまでの和
を取り、分野情報テーブルの分野iの尤度Bi に加え
る。この分野iの尤度の計算を分野1から分野nまでの
尤度について行なう。これにより、第1候補で変換した
単語の属する分野が選択された時とは逆方向に分野情報
テーブルに影響を与えることになる。
【0053】図12は、定型文書が呼び出され分野を推
定する際の、分野情報テーブルの更新方法を示したもの
である。
【0054】呼び出される定型文書に含まれる1漢字1
漢字について、この式に従って分野情報テーブルが更新
される。
【0055】まず漢字の分野kにおける確信度Ck を求
め、それに分野kが分野iに与える影響度Wk を分野間
関連度テーブルから求め、乗じ、更に、ある一定値αを
乗じる。なお、漢字の分野情報に分野kの記述がなかっ
た時は分野kの確信度は0とする。αは単語選択が分野
尤度に与える影響と、漢字が分野尤度に与える影響の整
合性を取るための補正値である。例えば、平均的に1単
語が2漢字からなる時は、0.5の値を取る。この乗じ
た値を分野1から分野nまでの和を取り、分野情報テー
ブルの分野iの尤度Bi に加える。この分野iの尤度の
計算を分野1から分野nまでの尤度について行なう。
【0056】次に上述の動作をフローに従って説明す
る。
【0057】図13は第1の実施例によるキー入力を取
り込み、処理を行なう動作を説明するフローチャートで
ある。
【0058】ステップ13−1において、キーボードか
ら打鍵されるキーデータを取り込む。
【0059】ステップ13−2において、取り込まれた
キーの種別を判定し、判定結果を出力する。その判定結
果に応じて、各キーの処理ルーチンに分岐する。
【0060】変換キーであったときはステップ13−3
に分岐し、ステップ13−3において、図15に詳述す
るように変換処理を行なう。変換処理終了後、ステップ
13−8において、実行キーの打鍵により変換処理を終
了したかどうかを判定し、実行キー以外による時はその
キーを処理するためにステップ13−2にループする。
実行キー以外の時はそのキーを読み飛ばすためにステッ
プ13−1にループする。
【0061】ひらがな等の読みキーのときは、ステップ
13−4に分岐し、図14に詳述する読み蓄積処理を行
なう。
【0062】文書保存キーのときは、ステップ13−5
に分岐し、図18に詳述する文書保存処理を行なう。
【0063】文書呼出キーのときは、ステップ13−6
に分岐し、図19に詳述する文書呼出処理を行なう。
【0064】その他のキーのときはステップ13−7に
分岐し、挿入、削除、記号入力等の通常の文字処理装置
において行なわれるその他の処理を行なう。
【0065】各処理が終了するとステップ13−1に分
岐する。
【0066】図14は第1の実施例によるステップ13
−4の「読み蓄積処理」を詳細に説明するフローチャー
トである。
【0067】ステップ14−1において、入力された読
みを入力バッファIBUFに蓄積していく。また、読み
列の状態を表示する。
【0068】ステップ14−2において、IBUFに格
納された読み列がキーワード辞書KDICに登録されて
いないかどうか検索する。
【0069】ステップ14−3において、登録されてい
るかどうかを判定し、登録されていない時はそのままリ
ターンする。
【0070】登録されていた時はステップ14−4に進
み、ループ変数iを初期設定する。
【0071】ステップ14−5においてiが分野数nを
超えたかどうか判定し、超えていない時はステップ14
−6に進み、ループ変数jを初期設定する。
【0072】ステップ14−7においてjが分野数nを
超えたかどうか判定し、超えていない時は、ステップ1
4−8において、図11に示した分野尤度の更新処理を
行なう。キーワード辞書より得られたキーワードの分野
jの確信度Cj に、分野間関連度テーブルより得られた
分野jが分野iに与える影響度Wijを乗じたものを加
え、分野情報テーブルのi番目の分野尤度Bi を更新す
る。その後、ステップ14−9に進み、jの値を歩進
し、ステップ14−7にループする。
【0073】ステップ14−7においてjがnを超えて
いる時はステップ14−10においてiの値を歩進し、
ステップ14−5にループする。
【0074】ステップ14−5においてiが分野数nを
超えた時はリターンする。
【0075】図15は第1の実施例によるステップ13
−3の「変換処理」を詳細に説明するフローチャートで
ある。
【0076】ステップ15−1において、図16に詳述
するように、読み列を仮名漢字変換し、同音語バッファ
を作成する。
【0077】ステップ15−2において作成された同音
語バッファの第1候補の表記を入力バッファIBUFに
設定し、表示する。
【0078】ステップ15−3において、キーボードか
ら打鍵されるキーデータを取り込む。
【0079】ステップ15−4において取得されたキー
データが変換キーであるかどうかを判定する。変換キー
でない時(例えば、実行キー打鍵や、次の読み入力)は
次候補を見ずにその候補を確定することになるので、ス
テップ15−7に分岐する。変換キーの時はステップ1
5−5に進み次候補処理を行ない、同音語バッファ中の
候補Noの値を更新する。
【0080】ステップ15−6において、同音語バッフ
ァ中の新しい変換候補の表記を入力バッファに転送し、
表示する。その後、ステップ15−3にループし、再び
キー入力を取り込む。
【0081】ステップ15−7において、図17に詳述
するように分野更新処理を行なう。
【0082】ステップ15−8において、表示中の候補
を確定し、文書データなどに埋め込む処理を行ない、リ
ターンする。
【0083】図16は第1の実施例によるステップ15
−1の「仮名漢字変換処理」を詳細に説明するフローチ
ャートである。
【0084】ステップ16−1において、考えられる仮
名漢字変換候補を作成する。
【0085】ステップ16−2において各変換候補に対
応する文節尤度を、図10に示したように算出する。
【0086】ステップ16−3において、文節尤度の順
番に変換候補をソートし、第1候補を決定する。
【0087】ステップ16−4において、文節尤度の順
序に従って変換候補の表記及び必要な情報を同音語バッ
ファに登録しリターンする。
【0088】図17は第1の実施例によるステップ15
−7の「分野更新処理」を詳細に説明するフローチャー
トである。
【0089】分野更新処理は図11に示す、分野尤度の
更新処理を行なう部分である。
【0090】ステップ17−1において、ループ変数i
を初期設定する。
【0091】ステップ17−2においてiが分野数nを
超えたかどうか判定し、超えていない時はステップ17
−3に進み、ループ変数jを初期設定する。
【0092】ステップ17−4においてjが分野数nを
超えたかどうか判定し、超えていない時は、ステップ1
7−5において、分野尤度の更新処理を行なう。選択単
語の分野jの確信度Cjに、分野間関連度テーブルより
得られた分野jが分野iに与える影響度Wjiを乗じたも
のを加え、分野情報テーブルのi番目の分野尤度Bi
更新する。その後、ステップ17−6に進み、jの値を
歩進し、ステップ17−4にループする。
【0093】ステップ17−4においてjがnを超えて
いる時はステップ17−7においてiの値を歩進し、ス
テップ17−2にループする。
【0094】ステップ17−2においてiが分野数nを
超えた時はステップ17−8に進む。
【0095】ステップ17−8において、非選択単語ポ
インタを初期設定し、最初の非選択単語を示すようにす
る。
【0096】ステップ17−9において非選択単語全て
について処理が終了したかどうか判定し、終了している
時はリターンする。
【0097】ステップ17−10において、ループ変数
iを初期設定する。
【0098】ステップ17−11においてiが分野数n
を超えたかどうか判定し、超えていない時はステップ1
7−12に進み、ループ変数jを初期設定する。
【0099】ステップ17−13においてjが分野数n
を超えたかどうか判定し、超えていない時は、ステップ
17−14において、分野尤度の更新処理を行なう。非
選択単語ポインタの示す非選択単語の分野jの確信度d
j に、分野jが分野iに与える非選択影響度Xijを乗じ
たものを加え、分野情報テーブルのi番目の分野尤度B
i を更新する。その後、ステップ17−15に進み、j
の値を歩進し、ステップ17−13にループする。
【0100】ステップ17−13においてjがnを超え
ている時はステップ17−16においてiの値を歩進
し、ステップ17−11にループする。
【0101】ステップ17−11においてiが分野数n
を超えた時はステップ17−17に進み、非選択単語ポ
インタを歩進し、次の非選択単語を指すようにする。そ
の後、ステップ17−9にループする。
【0102】図18は第1の実施例によるステップ13
−5の「文書保存処理」を詳細に説明するフローチャー
トである。
【0103】ステップ18−1において、オペレータに
保存する文書の文書名を入力させ、それを受けつける処
理をする。
【0104】ステップ18−2において文書データをデ
ィスクに格納する保存形式に変形する。
【0105】ステップ18−3において、文書データの
保存形式をオペレータの指定した文書名に“.doc”
を付加したファイル名でディスクに保存する。
【0106】図19は第1の実施例によるステップ13
−6の「文書呼出処理」を詳細に説明するフローチャー
トである。
【0107】ステップ19−1において、オペレータに
呼び出す文書の文書名を入力させ、それを受けつける処
理をする。
【0108】ステップ19−2において、指定された文
書名の文書データをディスクから呼び出す処理を行な
う。呼び出された文書データが文書バッファ上にロード
されるので、文書バッファTBUF上にある現在作成中
の文書は消滅し、新しい文書データに置き換わることに
なる。
【0109】ステップ19−3において、呼び出された
文書データの漢字を示すポインタ“漢字ポインタ”を文
書先頭にセットする。
【0110】ステップ19−4において漢字ポインタの
示す漢字を1つ取ってくる。
【0111】ステップ19−5において漢字ポインタが
文書末尾を示しているかどうか判定する。文書末尾を示
している時は取得された漢字コードは無効なので、処理
を終了してリターンする。文書末尾を示していない時は
取得された漢字は有効なので、ステップ19−6に進
む。
【0112】ステップ19−6において、ループ変数i
を初期設定する。
【0113】ステップ19−7においてiが分野数nを
超えたかどうか判定し、超えていない時はステップ19
−8に進み、ループ変数jを初期設定する。
【0114】ステップ19−9においてjが分野数nを
超えたかどうか判定し、超えていない時は、ステップ1
9−10において、図12に示した式に基づく分野尤度
の推定処理を行なう。取得された漢字の分野jの確信度
jに、分野間関連度テーブルより得られた分野jが分
野iに与える影響度Wijを乗じたもののα倍を加え、分
野情報テーブルのi番目の分野尤度Biを更新する。そ
の後、ステップ19−11に進み、jの値を歩進し、ス
テップ19−9にループする。
【0115】ステップ19−9においてjがnを超えて
いる時はステップ19−12においてiの値を歩進し、
ステップ19−7にループする。
【0116】ステップ19−7においてiが分野数nを
超えた時はステップ19−13に進み、漢字ポインタを
歩進してステップ19−5にループする。
【0117】以上説明したように、第1の実施例によれ
ば、定型文書の文書データに含まれる漢字情報に基づい
て分野情報を推定し、定型文書の呼出と同時に分野情報
が推定され利用されるので、定型文書を呼び出して編集
する時の仮名漢字変換において、候補表示の順序を的確
に行なうことができるので、操作性の高い、快適な文字
処理装置を実現することができる。
【0118】〈第2の実施例〉以上の第1の実施例にお
いて、定型文書の文書データに含まれる漢字情報に基づ
いて分野情報を推定するというものであった。が、本発
明はこれに限定されるものではなく、文書データを形態
素解析し、それぞれの文節に含まれる単語が1つずつ選
択されたものとして分野情報を推定することもできる。
大部分の図面は第1の実施例と同じであるが、その時の
フローは図19の代わりに図20となる。
【0119】これにともない、図1のROMに格納され
る制御手順は、図13〜図18、図20に記述したもの
となる。
【0120】次に上述の動作をフローに従って説明す
る。
【0121】第1の実施例と異なるフローは図20のみ
なので、その部分のみ説明する。
【0122】図20は第1の実施例の図19に代わるも
のであり、ステップ13−6の「文書呼出処理」を詳細
に説明するフローチャートである。
【0123】ステップ20−1において、オペレータに
呼び出す文書の文書名を入力させ、それを受けつける処
理をする。
【0124】ステップ20−2において、指定された文
書名の文書データをディスクから呼び出す処理を行な
う。呼び出された文書データが文書バッファ上にロード
されるので、文書バッファTBUF上にある現在作成中
の文書は消滅し、新しい文書データに置き換わることに
なる。
【0125】ステップ20−3において、呼び出された
文書データを形態素解析する。
【0126】ステップ20−4において、形態素解析さ
れた文書データの文節を示すポインタ“文節ポインタ”
を文書先頭の文節を示すようセットする。
【0127】ステップ20−5において文節ポインタの
示す文節を1つ取ってくる。
【0128】ステップ20−6において文節ポインタが
文書末尾を示しているかどうか判定する。文書末尾を示
している時は文節が取得できないので、処理を終了して
リターンする。文書末尾を示していない時は取得された
文節は有効なので、ステップ20−7に進む。
【0129】ステップ20−7において、ループ変数i
を初期設定する。
【0130】ステップ20−8においてiが分野数nを
超えたかどうか判定し、超えていない時はステップ20
−9に進み、ループ変数jを初期設定する。
【0131】ステップ20−10においてjが分野数n
を超えたかどうか判定し、超えていない時はステップ2
0−11に進む。ステップ20−11において、図11
に示した式に基づき、文節を構成する単語が選択された
ものとみなして分野尤度の推定する。文節ポインタの示
す文節を構成する単語の分野jの確信度Cjに、分野間
関連度テーブルより得られた分野jが分野iに与える影
響度Wijを乗じたものを加え、分野情報テーブルのi番
目の分野尤度Biを更新する。その後、ステップ20−
12に進み、jの値を歩進し、ステップ20−10にル
ープする。
【0132】ステップ20−10においてjがnを超え
ている時はステップ20−13においてiの値を歩進
し、ステップ20−8にループする。
【0133】ステップ20−8においてiが分野数nを
超えた時はステップ20−14に進み、文節ポインタを
歩進してステップ20−6にループする。
【0134】以上説明したように、第2の実施例によれ
ば、定型文書の文書データを形態素解析し、それぞれの
文節に含まれる単語が1つずつ選択されたものとして分
野情報を推定し、定型文書の呼出と同時に分野情報が推
定され利用されるので、定型文書を呼び出して編集する
時の仮名漢字変換において、候補表示の順序を的確に行
なうことができるので、操作性の高い、快適な文字処理
装置を実現することができる。
【0135】
【発明の効果】以上説明したように、本発明によれば、
文書の呼出時に、呼び出した文書から分野情報を推定す
るので、文書を呼び出して編集する時の仮名漢字変換に
おいて、候補表示の順序を的確に行なうことができるの
で、操作性の高い、快適な文字処理装置を実現すること
ができる。
【図面の簡単な説明】
【図1】本発明に係る文字処理装置の第1の実施例を示
すブロック図である。
【図2】第1の実施例による分野処理の例を示した図で
ある。
【図3】第1の実施例による辞書DICの構成例を示し
た図である。
【図4】第1の実施例によるキーワード辞書KDICの
構成例を示した図である。
【図5】第1の実施例による入力バッファIBUFの構
成例を示した図である。
【図6】第1の実施例による同音語バッファDOBUF
の構成例を示した図である。
【図7】第1の実施例による分野情報テーブルBTBL
の構成例を示した図である。
【図8】第1の実施例による分野間関連度テーブルWT
BLの構成例を示した図である。
【図9】第1の実施例による漢字辞書KANJIDの構
成例を示した図である。
【図10】第1の実施例による仮名漢字変換における第
1候補決定のための評価式を示した図である。
【図11】第1の実施例による単語選択時における分野
情報テーブルの更新式を示した図である。
【図12】第1の実施例による単語選択時における分野
情報テーブルの更新式を示した図である。
【図13】第1の実施例によるキー入力を取り込み処理
を行なう動作を説明するフローチャートである。
【図14】第1の実施例によるステップ13−4の「読
み蓄積処理」を詳細に説明するフローチャートである。
【図15】第1の実施例によるステップ13−3の「変
換処理」を詳細に説明するフローチャートである。
【図16】第1の実施例によるステップ15−1の「仮
名漢字変換処理」を詳細に説明するフローチャートであ
る。
【図17】第1の実施例によるステップ15−7の「分
野更新処理」を詳細に説明するフローチャートである。
【図18】第1の実施例によるステップ13−5の「文
書保存処理」を詳細に説明するフローチャートである。
【図19】第1の実施例によるステップ13−6の「文
書呼出処理」を詳細に説明するフローチャートである。
【図20】第2の実施例によるステップ13−6の「文
書呼出処理」を詳細に説明するフローチャートである。
【符号の説明】
CPU マイクロプロセッサ DIC 仮名漢字変換用辞書 ROM 読出し専用メモリ RAM ランダムアクセスメモリ DISK 外部記憶 KB キーボード CR カーソルレジスタ DBUF 表示用バッファメモリ CRTC CRTコントローラ CRT 表示装置 CG キャラクタジェネレータ WTBL 分野間関連度テーブル KDIC キーワード辞書 IBUF 入力バッファ DOBUF 同音語バッファ BTBL 分野情報テーブル TBUF 文書バッファ KANJID 漢字辞書
───────────────────────────────────────────────────── フロントページの続き (72)発明者 榊原 厚志 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内 (72)発明者 池田 和世 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内 (72)発明者 小林 雄二 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内 (72)発明者 緩利 仁志 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内 (72)発明者 小楠 千佳 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内 (72)発明者 森田 麻友美 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内 (72)発明者 岸野 麻里子 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内 (72)発明者 安達 里砂 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内 (72)発明者 鈴木 秀恭 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 読みを仮名文字列により入力して、漢字
    仮名混じり表記の文書を編集する文字処理装置におい
    て、 読みを入力する入力手段と、 単語の読みと、表記及び分野情報を含む単語情報とを対
    応づけて記憶した辞書手段と、 編集中の文書の分野情報を記憶する分野情報記憶手段
    と、 前記入力手段より入力された読みを、前記分野情報記憶
    手段及び前記辞書手段を参照して、表記に変換する変換
    手段と、 前記変換手段によって得られた表記により編集された文
    書を記憶する文書記憶手段と、 補助記憶部に保存された文書を前記文書記憶手段に呼び
    出す呼び出し手段と、 前記呼び出し手段により呼び出された文書から該文書の
    属する分野情報を推定する推定手段と、 該推定手段により推定された分野情報を、前記分野情報
    記憶手段に設定する設定手段とを有することを特徴とす
    る文字処理装置。
  2. 【請求項2】 前記推定手段は、呼び出された文書中の
    漢字データに基づいて、該文書の分野情報を推定するこ
    とを特徴とする請求項1に記載の文字処理装置。
  3. 【請求項3】 前記推定手段は、呼び出された文書中を
    形態素解析し、該解析の結果得られた単語の分野情報に
    基づいて、該文書の分野情報を推定することを特徴とす
    る請求項1に記載の文字処理装置。
  4. 【請求項4】 読みを仮名文字列により入力して、漢字
    仮名混じり表記の文書を編集する文字処理装置におい
    て、 補助記憶部に保存された文書を文書メモリに呼び出し、 呼び出された前記文書から該文書の属する分野情報を推
    定し、 該推定された分野情報を、分野情報メモリに設定し、 読みを入力し、 入力された前記読みを、単語の読みと、表記及び分野情
    報を含む単語情報とを対応づけて記憶した辞書及び前記
    分野情報メモリを参照して、表記に変換し、 前記変換によって得られた表記により文書メモリに記憶
    された前記定型文書を編集することを特徴とする文字処
    理方法。
JP5170472A 1993-07-09 1993-07-09 文字処理装置及びその方法 Pending JPH0728806A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5170472A JPH0728806A (ja) 1993-07-09 1993-07-09 文字処理装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5170472A JPH0728806A (ja) 1993-07-09 1993-07-09 文字処理装置及びその方法

Publications (1)

Publication Number Publication Date
JPH0728806A true JPH0728806A (ja) 1995-01-31

Family

ID=15905582

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5170472A Pending JPH0728806A (ja) 1993-07-09 1993-07-09 文字処理装置及びその方法

Country Status (1)

Country Link
JP (1) JPH0728806A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006099196A (ja) * 2004-09-28 2006-04-13 Kyocera Corp 文字変換装置および文字変換方法、携帯通信機

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006099196A (ja) * 2004-09-28 2006-04-13 Kyocera Corp 文字変換装置および文字変換方法、携帯通信機

Similar Documents

Publication Publication Date Title
US7143350B2 (en) Method and system for character sequence checking according to a selected language
JPS6038752B2 (ja) テキスト・ストリ−ム変更方法
JPH06203013A (ja) 構造化文書に複数の変更可能な読み文字列および漢字文字列を記憶する方法およびシステム
JPH0728806A (ja) 文字処理装置及びその方法
JPH05113964A (ja) 電子辞書
JPH0728804A (ja) 文字処理装置及びその方法
JP4279926B2 (ja) 未知語読み導出装置および未知語読み導出方法並びに記録媒体
JP4050745B2 (ja) 文章入力システム
JPH07191986A (ja) 文章入力装置
JPS59100941A (ja) 仮名漢字変換装置
JP2786260B2 (ja) かな漢字変換装置
JPH0728797A (ja) 文字処理装置及びその方法
JPH0442350A (ja) 文字処理装置
JPH0728805A (ja) 文字処理装置及びその方法
JP2698458B2 (ja) 文字処理装置
JPH0584934B2 (ja)
JPS62290966A (ja) 文章編集装置
JP3278148B2 (ja) 文字処理装置及びその方法
JPS58151637A (ja) 日本語ワ−ドプロセツサ
JP2634596B2 (ja) かな漢字変換装置
JP2899087B2 (ja) 文字処理装置
JPH07191984A (ja) 文字処理装置
JPH0442347A (ja) 文字処理装置
JPH01191258A (ja) 文書処理装置
JPH0442348A (ja) 文字処理装置