JPS62267862A - かな漢字変換処理装置 - Google Patents

かな漢字変換処理装置

Info

Publication number
JPS62267862A
JPS62267862A JP61111893A JP11189386A JPS62267862A JP S62267862 A JPS62267862 A JP S62267862A JP 61111893 A JP61111893 A JP 61111893A JP 11189386 A JP11189386 A JP 11189386A JP S62267862 A JPS62267862 A JP S62267862A
Authority
JP
Japan
Prior art keywords
word
candidate
key
data
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61111893A
Other languages
English (en)
Inventor
Koji Igawa
幸治 井川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61111893A priority Critical patent/JPS62267862A/ja
Publication of JPS62267862A publication Critical patent/JPS62267862A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技−it? 3と艷 この発明は、学習機能を有するかな漢字変換処理Mff
lに関する。
又米五亙 一般に、オフィスコンピュータ、パーソナルコンピュー
タ、ワードプロセッサ、データプロセッサ、ワークステ
ーション、自動翻訳装置等の各種の情報処理装置におい
て、入力されたかな文字列を漢字混りの文字列に変換す
る文節あるいはベタ式等のかな漢字変換処理機能を備え
たものがある。
このようなかな漢字変換機能を有するかな漢字変換処理
装置においては、変換効率を高めるために最も確からし
いと判断した候補(最大候補)の同音異議語について最
新学習をする学習機能を備え、「読み」とこのr読み」
に対する最新使用の「候補文字列」とを対応づけて学習
データ(学習結果)として記憶するようにしている。
しかしながら、平仮名及び漢字を記憶するとき、平仮名
は1文字1バイト、漢字は1文字2バイト必要であるた
め、上述のように「読み」と「候Xli文字列」を記憶
すると、例えば「とりしまり」という「読み」に対して
「取り、諦り」という「候補文字列」を記憶するには「
とりしまり」が5バイト、「取り締り」が8バイトで合
it 13バイト必要になり、学習データを記憶するた
めのメモリ容量が多くなるという不都合がある。
旦−−眞 この発明は上記の点に鑑みてなされたものであリ、学習
データの記憶に要するメモリ容量を削減することを目的
とする。
豆−戒 この発明は上記の目的を達成するため、学習結果として
変換結果の特性を記憶する機能を備えたものである。
以下、この発明の一実施例に基づいて具体的に説明する
第2図は、この発明を実施したかな漢字変換処理装置を
備えた文書作成装置の一例を示す外観斜視図である。
この文言作成装置は1文字(平仮名2井仮名。
アルファベット、記号等を含む)情報並びに文言の作成
tα集及び印刷等に必要な制御情報を入力する入力装置
としてのキーボード1と、文言等を表示する複数行の表
示領域を有する表示装置としての液晶ディスプレイ装置
i! (LCD)2と1文書等を印刷する印刷装置とし
ての熱転写プリンタ3とを備えている。また、文言及び
文字パターンを格納する外部記憶装置としてのフロッピ
ディスクドライブ装置1′?(FDD)4を装着するこ
とができる。
そのキーボード1には第3図にも示すように各種のキー
を付設している。文字キ一群11は各種の文字を入力す
る文字キー(スペースキー及びシフ1−キーを含む)か
らなり、変換キー12はキー人力した文字のかな漢字変
換及び候補単語の次候補要求を指示し、無変換キー13
はキー人力した文字のかな漢字変換をしないことを指示
する。
平がなキー14.カタカナキー15.英数キー16及び
ローマ字キー17はそれぞれ入力モードとして平がなモ
ード、カタカナモード、英数モード及びローマ字モード
を指示し、全角/半角モードキー18は全角文字を入力
する全角モードと]う角文字を入力する半角モードとを
切換える指示をする。
べた書I!/文節キー1Sは入力文字をべた書き(ベタ
式)かな漢字変換するベタ式かな漢字変換モードと変換
キー12が押される毎に文節m位でかな漢字変換する文
節かな漢字変換モードとを切換える指示をする。
丈マチキー20は各種処理の実行を指示し、印刷キー2
1はプリン1−アウト(印刷)を指示し、紙送リキー2
2はプリンタ3の紙送りを指示し、カーソル移動キ一群
23の各キー23L、2B+2゜23U、23r)は液
晶ディスプレイ装置2のカーソルの左、右、上、下移動
を指示し1編集キーとしての字削除キー24.後退キー
25.改行キー2日はそれぞれ1文字削除、後退して字
削除、改行を指示し、タブキー27はタブを指示し、固
有名詞キー28は入力文字が固有名詞であることを指示
する。
機能選択キー30は他のキーと同時に押されたときに当
該他のキーをキートップに付設された入力情報を示す文
字以外の文字(キートップのかっこ1Fの文字を含む)
で表わされる機能の入力を指示する。つまり、この機能
選択キー30との組合せによって、例えば変換キー12
は単漢字変換を指示するキーとして、カタカナキー15
はキャンセルキーとして、印刷キー21は文書の登録及
び呼出しを指示するキーとして、カーソル移]すJキ一
群23の各キーはケイ線の設定を指示するキーとして、
タブキー27はタブの設定を指示するキーとして1文字
「¥」のキーは印刷条件設定を指示するキーとして、文
字「7」のキーは外字を指示するキーとしてそれぞれ機
能する。なおその他のキーについても同様に機能するの
で詳細な説明は省略する。
ファンクションキ一群31の各キーはそれぞれ書式の設
定、レイアウト表示の切替え2表示する文字の色の選択
2文字の色属性の設定1倍角、網かけ、アンダーライン
、両端揃え、右寄せ、センタリング、行末2行頭を指示
する。
また、液晶ディスプレイ装置(LCD)2の表示両面は
第3図に示すように分割して吏用する。
編集画面エリア35には入力されたかな文字列及びかな
漢字変換後の文字、ケイ線等を表示し、左端・右端・タ
ブ位置表示エリア36には左端位置。
右端位置、タブ位置情報を表示し、スケール表示エリア
37には桁数又は文字数等の情報を表示し。
ガイダンス表示エリア38にはキー人力文字1文節変換
時の候補漢字、入力モード、カーソルの現在位置(頁1
行1桁)、用紙サイズ、最大文字数。
最大行数、全/半角、カーソル位置の文字の色属性、印
刷条件(印刷モード、縦/横書、ケイ線色)等のガイダ
ンス情報を表示し、状態表示エリア39には状態情報を
表示する。
レイアウト表示エリア40には現編集中の文書の1頁内
の文字あるいは指定された属性の文字又はケイ線等のフ
ォーマットを縮小したレイアウト及び外字作成時の作成
パターン等を表示し、レイアウト種別表示エリア41に
はレイアウト表示エリア40に表示されているレイアウ
トの種別を表示する。
第4図はこの文書作成装置の制御部を示すブロック図で
ある。
この制御部50のマイクロコンピュータ(以下「マイコ
ン」と称す)51は、CPU、ROM。
RAM及び工/○等からなり、かな漢字変換処理。
文書作成編集処理、テキスト及びレイアウト等の表示処
理、印刷処理9文字拡大処理等この装置全体の制御を司
る。
罠○MS2には、この装置の各種処理に実行に必要な制
御プロゲラlx、標i曽的な]式(用紙サイズ、用紙方
向1文字間隔1行間隔)情報等の各種の同定情報を格納
している。
RAM53は、キーボード1から入力されたコードデー
タを格納するコードデータ格納エリア(入力バッファエ
リア)9文書データを格納する文書データ格納エリア、
設定された3式情報、左端、右端等の行情報、設定モー
ド情報等を格納するエリア等を含む各種のデータを格納
するデータエリア及びプログラム実行のためのワーキン
グエリアとして使用する。
辞書メモリ54は、かな漢字変換に必要な辞書−(単語
辞書2品詞分類表等)を格納した辞書エリアと、予め定
めた書体例えばゴシック体あるいは明朝体の文字の文字
パターンを格納した文字パターン格納エリアと1文字の
色属性(以下では「色種別」とも称する)を示す色種別
マークのパターンを格納した色種別マークパターン格納
エリア等とを構成する。
キーボードコントローラ55はキーボード1からの入力
データの判別やキーに1−1′設した図示しないLED
の点灯制御データの転送等を司り、LCDコン1−ロー
ラ56は内部にビデオメモリ(VRAM)等を備えて液
晶ディスプレイ装置f!!2の表示制御を司る。
また、この制御部50にはコネクタ5日を介して前述し
たように文書及び文字パターン記憶用の外部記憶装置と
しての70ツピデイスク装置(FDD)4を接続可能で
あるため、このFr)D4に対する情報の書込み及び読
出しを制御するフロッピディスクコントローラ(FCC
)57を備えている。なお、FCC4に装填されるフロ
ッピディスクにはJIS第2水僧文字の文字パターンを
t8納している。
さらに、この制御部50にはコネクタ5日を介して文字
パターンを格納した外部記憶装置としてのROMを有す
るROMカー1ヘリツジ60を接続することができ、マ
イコン51はこのROMカートリッジ60からの文字パ
ターンを読込む制御をする。なおこのROMカー1−リ
ッジ60にはJIS第2水準文字の文字パターンを格納
している。
なお、以下では辞書メモリS4の文字パターン格納エリ
ア、フロッピディスク装置4のフロッピディスクの文字
パターンを格納したエリア及びR○〜1カー1−リッジ
60を総称して「キャラクタジェネレータ(略称はrC
GJ )J と云う。
そして、マイコン51はプリンタ3の制御をも司り、r
1061に印字文字に応じたヘッドドライブデータを出
力してドライバ62を介してサーマルヘッド(印字ヘッ
ド)63の各発熱宋子をI駆    □動制御して所要
の文字を印字する。
また、マイコン51は■1061を介して、スペースド
ライブデータを出力してドライバ64を介してスペース
モータS5を駆動制御してキャリッジ66を移@h L
 、またラインフ、(−トドライブデータを出力してド
ライバ67を介してラインフィードモータ68を駆動制
御してプラテン6日を回動して紙送りをし、更にリボン
フイードドライブデータを出力してドライバ70を介し
てリボンフィードモータ71を駆動制御してリボン72
をフィードする。
なお、このプリンタ3はカラー印字が可能なプリンタで
あり、カラー印字は例えばリボン72としてシアン、イ
エロ、マゼンタの各色を循環順序で列設したリボンを使
用して、印字する色に応じてリボン72の色を選択する
ことによって行なうことができる。
第1図はこの文書作成装置の全体構成を機能的に示すブ
ロック図である。
入力部81はかな、;Ii:字、数字、記号等の文字キ
ー及びその他の機能キー(なお、「機能キー」とはr文
字キー以外のキー」の意味で使用する)を備え1表示部
82は文書情報やレイアウト情報等を表示し、印刷部8
3は文書情報等を印刷し。
外部記憶部84は文書情報や文字パターンデータ等を格
納する。入力制御部85は入力部81のキーマトリクス
をスキャンして入力データを取込み対応するコードデー
タ(キーデータ)に変換して出力する。
中央処理部86はこの装置全体の制御を司り。
入力制御部85からのキーデータの内の文字データを、
を−実部87を介して記憶部91に記憶させ、また編集
部87からの要求に応じてかな漢字変換部88によって
入力文字をかな漢字変換させてこの変換データを編集部
87に送出し、更にIg集郡部87らの要求に応じて外
部記憶部84に記憶されている文書情報や文字パターン
等の記憶内容を取込んで送出し、更にまた表示制御部8
日に対する表示命令の送出や印刷制御部90に対する印
刷命令の送出等の処理をする。
編集部87は中央処理部8日から送られてくる文字デー
タをテキストデータ(文書データ)として文書データ記
憶部としての記憶部S1に格納し。
また記憶部S1から文書データを読出して編集処理して
糊某処理した文書データを記憶部S1に格納する等の処
理をする。かな漢字変換部88は中央処理部8日からの
かな漢字変換要求を受けて入力文字列に対応する単語情
報を辞書92から読出して変換データとして中央処理部
86に送出する等の処理をする2辞書92には中詰情報
及び品詞分類表等を格納している。
表示制御部8日は中央処理部86からの表示命令を受け
て記憶部S1に格納されているテキストデータ(文書デ
ータ)を読出して表示データを作成して表示部82に表
示する。印刷制御部90は中央処理部86からの印刷命
令を受けて記憶部S1に格納されているテキストデータ
(文書データ)を読出して印字データを作成して印刷部
83に印刷させる。
ここで、二九等の各部と前述した具体的構成との概略対
応関係を説明して才;くと、入力部81はキーボード1
に1表示部82は液晶ディスプレイl hff 2に、
印刷部83はプリンタ乙に、外部記憶部84はフロンピ
ディスク装rrL4又はROMカートリッジ60に、入
力制御部85.中央処理部8日1編集部87.かな漢字
変換部8日1表示制御部8日及び印刷制御部90はマイ
コン51.キーボードコントローラ55.LCDコント
ローラ56及びFDC57に、記憶部S1はRAM53
の文書データ格納エリアにそれぞれ相当する。
第5図はこの装置の入力制御に係わる部分を機能的に示
すブロック図である。
スキャン制御部101は入力部81のキーマトリクス1
00をスキャンして押下げられたキーに応じたキーデー
タを複数キーロックアラ1−制御部102に送出する。
複数キーロックアラ[・制御部102は受領したキーデ
ータについて複数キーのロックアラ1へ制御をしてlの
キーのキーデータのみをチャタリング防止制御部103
に送出する。
チャタリング防止制御部10′5は受領したキーデータ
のチャタリングを除去して正しく入力されればそのキー
データをコード変換制御部104に送出する。
コード変換制御部104は受領したキーデータに応じた
コードデータを変換コード格納エリア105から取出し
てそのコードデータを入力データ(3納エリア106に
格納する。
リピート制御部107はこの入力データ洛納工リア10
6に格納されたコードデータを読出して。
このコードデータがリピート対象キー格納エリア108
に格納されたリピート対象キーのコードデータかを判断
してリピート対象キーのコードデータであれば、スキャ
ン制御部101に対してスキャン命令を送出する。
入力データ判別部109は入力データ格納エリア106
に格納された入力データ (コードデータ)を読出して
判別し、この判別結果に応じて入力データを各部に送出
する。
入力モード制御部110は入力データ判別部109から
の入力データとしてのモード情報を取込み、このモード
情報と入力モード情報格納エリア111に格納されてい
る現モード情報とに基づいて今回の入力モードを設定し
、この設定した入力モードを示すモード情報を入力モー
ド表示制御部112に送出すると共に、入力モード情報
格納エリア111に格納する。
入力モード情報表示制御部112は、入力モード制御部
110からのモード情報に応じたモード表示データを作
成して表示部82に表示する。
全/半角変換制御部113は入力データ判別部10Bか
らの入力データ(文字データ)を取込み。
入力モード情報格納エリア111に格納されている現モ
ード情報を読出して半角モードが指定されているか否か
を判断し、半角モードであるときには゛ト角文字情報格
納エリア114から入力データに対応する半角文字情報
を読出し、そのコードデータを送出する。
ローマ字変換制御部115は入力データ判別部109か
らの入力データ(文字データ)を取込み、入力モード情
報格納エリア111に格納されている呪モード情報を読
出してローマ字モードか否かを判断し、ローマ字モード
であるときにはローマ字情報格納エリア116から入力
データに対応するローマ字情報を読出し、そのコードデ
ータを送出する。
機能キー変換制御部117は入力データ判別部109か
らの入力データを取込んで機能キーデータ格納エリア1
18からその入力データに応じた機能キーデータを読出
し、その機能キーコードを送出する。
コードデータ格納エリア119には入力されたコードデ
ータとしての入力データ判別部109からの入力データ
、全/半角変換制御部113からの半角文字のコードデ
ータ、ローマ字変換制御部115からのローマ字のコー
ドデータ及び機能キー変換制御部117からの機能キー
コードが格納される。
第6図はこの装置のかな漢字変換制御に係わる部分を機
能的に示すブロック図である。
辞書S2の一部を構成するm語辞書部92Aには、読み
情報、この読みに対する文字列(表記)情報、この各文
字列の品詞番号情報及び頻度情報並びに第2水市文字か
否かを示す第2水準情報からなる単語辞書を格納してい
る。同じく辞392の一部を格納する品詞分類部921
3には?h語辞8部92Aの単語辞書中の品詞番号情報
で示される品詞がいかなる品詞かを示す品詞分子I表を
格納している。
読み判別部131は編集部87からの文字データを入力
してその文字データの「読み」を判別し、この判別した
読みデータを送出する。辞書検索部132は単語辞書部
92Aからの辞書データを読込んで読み判別部131か
ら受領した読みデータに対応する「読み」の単語がある
か否かを検索し、読みデータに対応する単語があればそ
の単語が格納されている単語辞書部92Aの場所(アド
レス)を示す辞書情報を送出する。
候補蓄積部133は辞書検索部132からの辞書情報を
パラメータとして単語辞書部92Aから読みに対応する
辞書データ(単語情%I)を得て、この辞書データに第
2水準文字を含む単語が含まれているときには中央処理
部8日を介して外部記憶部84が装着されているか否か
を判断して、第2水準文字を含む単語が含まれていない
とき及び第2水準文字を含む単語が含まれ外部記憶部8
4が装着されているときには辞書データに含まれるすべ
ての単語の単語情報を、また第2水準文字を含む単語が
含まれ外部記憶部84が装着されていないときには辞書
データ内から第2水準文字を含む単語を除いた単語の単
語情報を、それぞれ候補M積エリア134に格納する。
学習部135は最も確からしいと判断した候補単語(!
&尤候補単語)の同音異議語についての最新使用学習を
行なうもので1編集部87からの確定要求を受けたとき
の候補単語の「読み」とその候補Ia記の候補TI積エ
リア134における「候補NO1」を学習情報(学習結
果)2として学習データ格納エリア1716に格納する
ベタ変換部138は候補?9積エリア134に格納され
ている単語情報から最も確からしい単語の単語情報を読
出し、この単語情報に含まれろ品詞番号情報によって品
詞分類部92Bを検索して最も確からしいと判断した当
該単語の品詞を調査して、当該単語の品詞が助詞である
ときには学習データ格納エリア136に格納している学
習データを無視して最も確からしいと判断した単語を変
換結果の候補単語と決定してその単語情報を変換結果出
力部1′5日に送出し、当該単語の品詞が助詞でないと
きは学習データ格納エリア136に格納している学習デ
ータの内から当該単語の読みと同じ読みの単語を取出し
てそのi+、語を変換結果の候補中9語と決定してその
単語情報を変換結果出力部139に送出する。
変換結果出力部139はベタ変換部138から骨頭した
tn語情報に応じて変換結果の候補i1−語を出力バッ
ファ140に格納し、この出力バッファ140に格納さ
れた変換結果の候補11語が編集部87によって読出さ
れる。
次に、このように構成したこの実施例の作用について第
7図以降をも参照して説明する。
まず、キーボード1からのキー情報を取込むキーボード
制御処理及びキー人力制御処理について第7図−’+(
tびに第8[!Iをも参照して説明する。
キーボード制御処理においては、キーボード1のキーマ
トリクスをスキャンしてキーボード1のキーが押下げら
れた(入力あり)か否かを判別し。
入力があれば複数キーのロックアウト処理をして1つの
キーのみ有効とした後チャタリング防止処理をして、そ
のキー押下げによって正常に入力されたか否かを判別す
る。
そして、正常入力であれば、スキャンして得られたキー
データをコードデータに変換して、このコードデータを
出力した後、当該押下げられたキーがリピート対象キー
か否かを判別して、リピート対象キーであればリピート
制御をした後、スキャン処理に戻る。
そして、キー人力制御処理においては、このキーボード
制御処理で得ら才するコードデータを取込んだ(キーボ
ード入力)後、ウェイト状態か否かを判別し、ウェイト
状態であればレイアウトをブリンク表示した後入力され
たか否かを判別し、随回のキー人力が入力されていなけ
れば再度キーボード入力取込み処理に戻る。
そして、キーボード入力時にウェイト状態でないとき又
はウェイト状態であるが011回のキー人力が入力され
たときには、入力さ才したコードデータが入力モードコ
ードか否かを判別する。
このとき、入力モードコードであれば、入力モードを変
更して、変更後の入力モードを表示した後キーボード入
力処理に戻る。
つまり、この文書作成装置においては1文字入力モード
として平がなモード、英数モード及びカタカナモードの
3種預がある。そして、ローマ字キー17の押下げによ
って直接かなを入力するかな入力モードとローマ字入力
モードとを交互に切換えることができろ。また、英数キ
ー16の押下げによって英数入力モードになり、英数入
力モードから平がな入力モードに切換えるときには平が
なキー14を押下げればよく、このときの平がな入力モ
ードは英数人力モードに移行する前のかな入力モード又
はローマ字入力モードに復帰する。
更に全角/半角キー1日によって全角入力ど゛ト角入力
とを交互に切換えることができる。な、1;、電源投入
時のデフォルトはかな入力モードで全角モードとする。
また第S図には入力モードの切換えの−・例について、
同図(イ)に呪モードのモードキーの押下げに伴なう推
移を、同図(ロ)に現モードのL CD 2のガイダン
ス表示エリア38における表示例を示している。
これに対して、入力されたコードデータが入力モードコ
ードでないときには1機能キーか否かを判別して、機能
キーであれば機能キー変換をし。
機能キーでなければローマ字入力モードか否かを判別し
て、ローマ字入力モードであればローマ字に変換してロ
ーマ字が確定すれば再度キーボード入力処理に戻り、ロ
ーマ字モードでなければ全/半角変換をする。
次に、かな漢字変換処理について第10図乃至第32図
をも参照して説明する。
まず、この文書作成装置における一般的なベタ式かな漢
字変換操作について第10図乃至第20図をも参照して
説明する。
ベタ式かな漢字変換は入力された「読み」文字列を逐次
自動的に単語に区切り、漢字混じりの文字列に変換する
機能である。
そして、この装置では[読み」及び「変換候補文字列」
の表示は編集画面35において行ない、「読み」の文字
列は白黒反転表示し変換結果は下#4ドツト行の白黒反
転で表示する。なお、以下の説明で使用する図中では反
転表示の部分は枠で囲んで示し、またカーソルは符号「
C」にて示す。
但し、カーソルCは適宜符号を付している。
この装置においては、自動ベタ式かな漢字変換は次のタ
イミングで行なう。
(1)「読み」文字列が6文字たまった時。この場合の
一例を第10図に示している。
(2)句点、読点、スペース、及びかっこ等が入力され
た時。この場合の一例を第11図に示している。
(3)固有名詞キー28が押下げられた時。この場合の
一例を第12図に示している。
(4)変換キー12.改行キー26が押下げられた時。
この場合の一例を改行キーを例にして第1!1図に示し
ている。
(5)実行キー20が押下げられた時。
このようなタイミングで「読み」の文字列の総和が例え
ば160文字になるまでベタ式入力できる。また、5に
適候補として表示されている変換候補も再変換(同音異
義語)できる。
また、各弔語について単語単位で校正することができろ
。なおベタ式入力中は次のキーが有効である。
(1)カーソル上移動キー23Uの押下げによりカーソ
ルを現在のベタ入力の先頭にスキップさせる。
(2)カーソル上移動キー23Dの押下げによりカーソ
ルを現在のベタ入力の最後にスキップさせる。
(3)カーソル左移動キー23Lの押下げによりカーソ
ルを左隣りの’)’−unにスキップさせる。
(4)カーソル右移動キー23Rの押下げによりカーソ
ルを右隣りの甲6語にスキップさせる。
(5)機能選択キー30+カタカナキー15(キャンセ
ルキー)の押下げにより候補−中詰を「読み」に戻す。
(6)字削除キー24の押下げによりm語単位で削除す
る。
(7)後退キー25の押下げにより候補が表示されてい
るときには単語カーソルの左隣り(前甲1語)を削除し
、文字列が「読み」状態のときにはカーソルの左隣りの
文字を削除する。
(8)変換キー12の押下げによりm語の同音異義語の
次候補を求める。
(9)無変換キー13の押下げにより白黒反転している
中詰を未確定111語としてG隣りにスキップさせる。
これ笠のキーを使用して誤変換部分に対する修正を行な
うことができる。、二の誤変換部分の修正の一例につい
て第14図乃至第17図に示している。なお同図中の符
号rccJは用語カーソルを示す。但し、甲、語カーソ
ルCCは適宜符号を付している。
なお、ベタ式入力時は「読み」文字列及び変換候補文字
列の表示は左右端、用紙サイズ、改行の入力を無視し、
レイアウト表示のないときは40文字、レイアウト表示
中は32文字を一行として表示する。また、呪カーソル
位置に確定済みの文    字がある場合「読み」及び
候補を上書きの要領で表示する。実行キー20の押下げ
により候補群が確定されたときに、左右端、用紙サイズ
、改tテマ−り等を考慮した編集を行なう。すべての文
字が確定されていないときには編集機能は無効とする。
更にベタ入力以前に英数、英記号、外字等が入力された
ときには確認文字として入れる。なお、第18図にレイ
アウト表示中でベタ弐入力をした場合の一例を示してい
る。
また、「読み」が160文字入力されているときに、カ
ーソル左移動キー23L又はカーソル上移動キー23U
の押下げでqt語カーソルを戻し、新しい文字列を総和
が30文字になるまで入力することができる。
さらに、「読み」が変換され、候補単語を表示する際は
学習、ユーザ辞書の優先順位で表示する。
なおユーザ辞書が登録(例えば、読み二へんがん。
登録文字列:文章を、自動的に逐次変換します。)され
ておりかつ学習されていないときの一例を第1S図に、
更に上記ユーザ辞書の登録がありかつrへんかん」とい
う読みに対して「変換」という候補が学習されていると
きの一例を第20図に示している。
次に、この文書作成ft置のかな漢字変換機能のJ′r
、細について第21図乃至第32図をも参照して説明す
る。
まず、辞書メモリ54の単語辞書格納エリア(第6図の
m語辞書部92人)及び品詞分類表格納エリア(品詞分
順部928)に格納している単+i7を辞り及び品詞分
類表について説明する。
単語辞書は、第21図に示すように「読み」。
「表記」、「品詞」、「頻度」及び「第2水準」の欄か
らなる。
そして、「読み」の欄には文字列の「読み」を格納し、
f表?2 Jの欄にはその「読み」で表わさ九る文字列
(単語)を格納し、「品詞」の脳には当該r表記」の文
字列(単語)の品詞を求める(2査する)ために品詞分
類表の品詞番号を示す情報を格納し、「頻度」の欄には
当該「表記」の文字列の使用頻度を格納している。
また、「第2水準」の欄には当該「表記」に含ま、れる
各文字列中にJIS第2水準文字が含まれているか否か
を示す情報を格納し、第2水準文字が含まれているいる
ときに「1」を、第2水準文字が含まれていないときに
「0」を格納する。
例えば読み「かんがい」に対して表記「干害。
感慨、濯;a、館外、・・・・・・」であるとき、この
表記の各文字列に対して品詞r3,3,6.3・・・・
・・。
頻度ro、o、o、o、・・・・・・」、第2水準「0
゜0.1.O,・・・・・・」が格納される。つまり、
単語「潅厩」にはJIS第2水準文字が含まれているた
めに「第2水準」の欄にrlJが格納される。
品詞分類表は、第22図に示すように、予め定めた品詞
番号に対応する情報を格納した「番号」の欄及び当該番
号の品詞名を示す情報を(8納した「品詞名」の圓から
なる。例えば品詞番号「3」には品詞名r名詞漢語二字
以上」が格納され、品詞番号r263Jには品詞名「副
助詞は」が格納されている。したがって、例えば上述し
た第21図に示すfil−語辞書の一例において1表記
「感慨」の品詞「3」は当該表記文字(単語)が「名詞
漢語二字以上」の単語であることを示し、また表、記「
は」の品詞r2 G 3Jは当該表記文字(単語)が「
副助詞は」であることを示すことになる。
次に、かな漢字変換処理について第23図を参照して説
明する。
このかな漢字変換処理においては、まず入力文字列の【
読み」を判別して、この入力文字列の「読み」がひらが
なか否かを判断する。このとき。
ひらがなであれば入力された文字列をそのまま変換結果
として最も確からしいと判断した候補(最尤候補)の単
語の単語情報ここでは「表記、読み長2品詞」の情報を
出力バッファ(出力バッファ140)に書込んで編集処
理に移行する。
また、入力文字の[読み」の判別結果がひらがなでなけ
れば、単語辞書を検索して当該「読みJのデータがある
(該当データ有り)か否かを判別する。このとき、該当
データがなければ「読み」文字列の最後の文字をカット
した文字列を新たな「読み」とし、この「読み」の読み
長が「0」か否かを判別して、読み長が「0」であれば
そのまま編集処理に移行し、読み長がrQJでなければ
その最後の文字をカットした文字列の「読み」について
再度単語砕雪の検索をする。
そして、入力文字列の「読み」の該当データが単語辞書
に有れば、その「読み」に対応する「表記」文字列(単
語)の各「第2水準」の瀾をチェックして表記単語中に
JTS第2水準文字を含む+11語が含まれている(第
2水準文字有り)が否かを判別する。
このとき、表記単語中に第2水準文字が含まれる単記が
含まれていれば、第2水準文字を格納した外部記憶部と
してのフロッピディスク装置4又はROMカートリッジ
60が装着されている(外部記憶有り)か否かを判別す
る。
そして、外部記憶有りであれば「読みjに対応するすべ
ての表記文字列(甲6語)すなわち「第2水準」の僅が
「1」及び「0」のもののすべて単語の辞書データを単
語辞書から読出して、この辞書データから単語情報(こ
こでは「表記1品詞。
頻度」の各情報)を作成して各単語の単語情報を「候補
No、J を付加して候補蓄積エリア(候補蓄積二リア
134)にセーブする。
これに対して、外部記憶有りでなければ、「読−み」に
対応する表記文字列(単語)の内から第2水準文字を含
む単語を除いた単語すなわち「第2水準」の欄が「0」
の単語の辞8データのみを単語辞書から読出して、この
辞書データから+B語情報(ここでは[表記1品詞、g
度)の各情報を作成して各単語の単語情報を「候補NO
1」を付加して候1eft ¥i積エリアに格納する。
つまり、例えば入力文字列の「読み」が「かんがい」で
あるとき、第21図に示したようにこの読み「かんがい
」について表記文字中には第2水準文字を含む単語「潅
厩」が含まれている。
そこで、外部記憶部が有るか否かを判別し、このときに
外部記憶部が有れば外部記憶部に格納されている第2水
準文字の文字パターンを読出せるので、候補蓄積エリア
には第24図(イ)に示すように読み「かんがい」につ
いてのすべての表記文字列「干害」、「感慨」、「潅、
醜」、「館外」の単語情報(表記1品詞、頻度)を各々
「候補NO0」を・付加して格納する。
これに対して外部記憶部がなければ第2水準の文字は使
用できないので、候補蓄積エリアには同図(ロ)に示す
ように第2水1″總文字を含む表記文字列「濯厩」を除
いた他の表記文字列「干害」。
「感慨」、「館外」の単語情報(表記1品詞、頻度)を
各々「候補NO0」を付加して格納する。
同様に1例えば読み「べんたつ」の文字列については、
第2水市文字を含む甲4語r[1」のみであるので、外
部記憶部が有れば候補蓄積エリアには第25図(イ)に
示すように11ノのm語情報を格納するが、外部記憶部
がなければ候補蓄積エリアには同図(ロ)に示すように
該当なしとして何等格納しない。
また1表記文字列中に第2水準文字を含む単語が含まれ
ていなければ、外部記憶部の有無は関係なくすべての文
字を使用できるので「読みJに対応するすべての単語の
辞書データを単語辞書から読出して、前述したと同様に
して各単語の単語情報を候1+Ii M積エリアに格納
する。
このように、文字パターンを格納した外部記憶部の有無
を判別し、この判別結果に応じてかな漢字変換の候補漢
字を決定する。つまりここでは外部記憶部が装着されて
いるときには第2水準文字を含む’?’ 37も候補単
語とし、外部記憶部が装着されていないときには第2水
準文字を含む単語を候補111語から除外する。
それによって、文字パターンを記憶した外部記憶部を常
時装着するのではなく装着可能にした場合でも、第2水
準文字等を句点入力ではなくかな漢字変換処理によって
処理することができるようになって文字入力の操作性が
向上すると共に、外部記憶部を標準装備しない場合には
その外部記しα部に格納される文字は変換対象から除外
されるので使用できない文字が候lll1となることが
なく操作性が向上する。
その後、この候補蓄積エリアに格納された!i語の’F
−a情報を読出して最も確からしいと判断できるllt
語として候補No、lの単語を選択して、この最も確か
らしいと判断(評価)した候補(最尤候補)の!11語
の単語情報に含まれる品詞情報をパラメータとして品詞
分類表を調査して、当該単語の品詞が助詞か否かを判別
する。
このとき、当該最も確からしいと判断した候補の単語の
品詞が助詞であれば、そのまま最も確からしいと判断し
た候補の単語を変換結果の候補単語と決定して当該単語
の単語情報(ここでは「表記、読み長1品詞」の各情報
)を出力バッファに書込んで編集処理に移行する。
これに対して、当該最も確からしいと判断した候補の単
語の品詞が助詞でなければ、その単語と同じ「読み」の
学習データを取込んで学習データが有るか否かを判断す
る。
そして、学習データがあればその学習データの候補No
、を読出して、候補蓄積エリアに格納されている単語情
報の内から当該候補No、の表記文字列(単語)を取込
んで、この単語を変換結果の候補単語(!&も確からし
い候補の単語)と決定してこの単語の単語情報を出力バ
ッファに書込んで、出力バッファの表記文字列を学習さ
れている単語(表記文字列)の単語情報に置換えた後、
1g集処理に移行する。
また、学習データがなければそのまま、最も確からしい
と判断した候補の単語のm語情報を出力バッファに書込
んでS集処理に移行する。
つまり、従来の学習機能においては、後述するように学
習データを「読み」と「表記」 (候補文字列)とで構
成し、「読み」に対応する文字列が入力されると無条件
にその「表記」 (候補文字列)を変換結果との候補t
H−語決定して出力するようにしている。
そのため、例えば第26図に示すように「はんたいはの
ひとたちは」という文字列が入力されたときに、最初の
「はんたいは」のところで学習データとして読みrは」
6表記「派」が学習記憶され、最後の「は」が1派」に
変換されて、「反対派の人たち派」という変換結果にな
ってしまう。
このような例はその他にも例えば助詞「に」がr荷」又
は「二」と、助詞「で」がr呂」と、助詞「と」が1戸
」と学習されることがある。このような学習結果がある
ときに、例えば[ばつもうでにX×でらにりようしんと
ゆきました。」という文字列を入力したときには、「初
詣荷×X寺荷両親戸行きました。」という変換結果にな
ってしまう。
これに対して、この装置においては前述した第23図の
説明から明らかなように、最も確からしいと判断した候
補単語の品詞を調査して、その単語の品詞が助詞である
ときには学習結果を無視して変換結果の候補単語を決定
するようにしている。
したがって、例えば上述した読み「はんたいほのひとた
ちは」という文字列は「はんたい」 (す変名9)+ 
rは」 (接尾語)+「の」 (助詞)+「ひとたち」
 (名詞)+「は」 (助詞)と解析されるので、最後
の「は」については学習結果が無視されて、「反対派の
人たちは」という正しい変換結果が得られる。同様に「
はつもうでに××でらにりようしんとゆきました。」と
いう文字列を入力したときには、r初詣に××寺に両親
と行きました。」という正しい変換結果が得られる。
このように、最も確からしいと判断した単語の品詞に基
づいて変換結果の候補単語を決定する。
つまりここでは最も確からしいと判断した単語の品詞が
助詞であるときには学習結果を無視するようにすること
によって、変換率が高くなって文書作成操作の操作性も
向上する。
次に、学習処理について第27図を参照して説明する。
この学習処理においては、Rも確からしいと判断したr
B語(最尤候補中1語)のtpm語情報出力バッファに
セットしてキー人力を待ち、キー人力が有ってそのキー
人力が変換キー12(次候補変換要求キー)であれば次
候補が有るか否かを判別し。
次候補が有れば次の候補No、に践当する単語の甲4語
情報を出力バッファにセラ1−シた後キー入力待ちに戻
り1次候補がなければ候補なしとしてそのまま編集処理
に移行する。
そして、候補単語の単語情報を出力バッファにセラ1−
シた状態で次候補要求キー以外のキーが入ツノされたと
きには、そのとき出力バッファにセットしている候補!
r語が変換結果の単語と確定さ1しるので、その単語の
「読み」データと「候補NO0」とを学習エリア(学習
データ格納エリア136)に格納して編集処理に移行す
る。
次に、この学習処理について第28図を参照して具体的
に説明する。
まず、読み「かんがい」の文字列が入力されて候補蓄積
エリアにはその読み[かんがい」の単語の単語情報が格
納されているとき、かな漢字変換部はその候補蓄積エリ
アの最も確からしいと判断した候補No、1のQj語「
干害」を出力バッファにセットし、これが編集側に候補
漢字として表示される。
これに対して、変換キー12が押下げられて次候補が要
求されると1編集側からかな漢字変換部に対して次候補
要求が与えられ、これを受けてかな漢字変換部は次の候
補No、2の単語「感慨」を出力バッファにセラ1−シ
、これが編集側に候補漢字として表示される。
ここで、変換キー12以外のキーが押下げられて候補単
語が確定し1編集側からかな漢字変換部に対して確定要
求が与えられると、これを受けてかな漢字変換部は確定
要求のあった候補単語の読み「かんがい」と候補蓄積エ
リア内のr候補No。
2」とを学習データ格納エリアに格納する。
つまり、従来の学習機能においては、学習データとして
「読み」データと「表記」データ(候補文字列データ)
とを格納するようにしているため。
例えば「かんがい」という読みに対して「感慨」という
候補を学習したとき、平がなは1文字1バイトで表わせ
るが漢字は1文字2バイト必要であるので、読み「かん
がい」 (4バイト)及び表記rg慨」 (4バイト)
を表わすためには合計8バイト必要になる。
これに対して、この文書作成装置の学習機能においては
、学習データ(学習結果)として変換結果の特性、つま
りここでは当該変換結果(単語)の「読み」データと候
補蓄積エリアに展開したときの「候補No、Jデータと
を格納している。このとき、候補No、は1バイトで表
現できるので、例えば「かんがい」とい読みに対して「
感慨」という候補(変換結果)を学習したときの学習デ
ータは合計5バイトで足りる。
同様に1例えば「とりしまり」という読みに対して「取
り締り」という候補を学習した場合、従来であれば学習
データが13バイ1−になるのに対して、この装置の学
習データは6バイトですむことになる。
このように、学習結果として変換結果の特性、例えば「
読み」に対する候補蓄積エリアに展開したときの「候補
No、Jを格納することによって学習データ格納用メモ
リのメモリ容量を大幅に減らすことができる。例えば日
本語では「かんがい」のように「読み」が4文字で「表
記」 (文字列)が2文字というのが最も通常であるの
で、1語に対して平均5バイト削除されるとすれば仮に
10万語の学習をする場合には50万バイトのメモリを
削除することができる。
ここで1以上のようなかな漢字変換処理について読み「
かんがい」が入力された場合を例にして前述した第6図
及び第29図を参照して具体的に説明しておく。
編集部87からの入力文字列の読みを読み判別部131
で判別したところ「かんがい」であったときには、辞書
検索部132によって単語辞書部92Aを検索し、この
読み「かんがい」があるので、そのアドレスデータを候
補蓄積部133に送り、この候補蓄積部133は中央処
理部86からの外部記憶部84の有無を示す情報をチェ
ックして外部記憶部84の装着の有無を判別し、このと
き外部記憶部84が装着されているので辞書検索部13
2からのアドレスデータ(辞書情報)を基にして甲1語
辞暑部92Aをアクセスして qt語辞辞書92Aから
第2水準文字を含む単語を含めてすべての単語の辞書デ
ータを読み出して各単語の111語情報を作成して候補
蓄積エリア134に格納する。
そして、べた変換部138はこの読み「かんがい」の文
字列について候補蓄積エリア134から中詰情÷Rを得
て最も確からしい単語「干害」を選出し、この単語”F
3Jの品詞番号「3」をパラメータとしてを品詞分類部
92Bによって調査し。
このとき当該単語「干害」の品詞は助詞ではないので、
学習結果を反映するために学習データ格納エリア136
の学習データを参照し、このとき学習データは読み「か
んがい」に対しては候補N o 。
がrNo、2Jであるので候補TX積エリア134から
候i1[iNo、2の+B語「感慨」を得て、これを変
換結果の候補1113語と決定してこの単語情報と変換
−Pl’i果出力部139を介して出力バッファ140
に出力して編集へ移行する。
なお、このようなかな漢字変換の処理を含めたかな漢字
変換操作の一例を第30図乃至第32図に示しているゆ
第30図ではカーソル右移動キー231くを3回押し下
げたときに読み「へんかん」に対して「変換」が学習さ
れている。第31図では外部記憶部(第2水準文字の文
字パターン)をαnえているので読み「ごべんたつ」が
「御鞭健」に変換されて表示されている。第32図では
助詞の学習結果が無視されている。
なお、上記実施例においては、この発明を文書作成装置
であるパーソナルワードプロセッサのかな漢字変換処理
装置に実施した例について述べたが、これに限らず例え
ばパーソナルコンピュータ。
オフ、イスコンピュータ、データプロセッサ、ワークス
テーション、テレテックス、ワードプロセッサ、自動翻
訳装こ等の各種の情爪処理装ににおけるかな漢字変換処
理装置に実施することができる。
旌−敦 以上説明したように、この発明によれば、学習データの
記憶に要するメモリ容旦を削減することができる。
【図面の簡単な説明】
第1図はこの発明を実施した文書作成装置の全体構成の
一例を示すブロック図。 第2図、第3図及び第4図は同じくその外観斜視図、キ
ー配置及び画面の説明に供する平面図、並びに制御部の
ブロック図。 第5図は同じく入力制御に係わる部分のブロック図、 第6図は同じくかな漢字変換制御に係わる部分のブロッ
ク図。 第7図乃至第S図は同じくキーボード制御処理を示すフ
ロー図、キー人力処理を示すフロー図及びその具体的説
明に但する説明図、第10図乃至第20図は同じくそれ
ぞれかな漢字変換操作の異なる例の説明に供する説明図
、第21図及び第22図は同じく辞gメモリに格納した
11i語辞書及び品詞分類表の一例を示す説明図、 第23図乃至第26図は同じくかな漢字変換処理を示す
フロー図及びその具体的説明に供する説明図、 第27図及び第28図は同じく学習処理を示すフロー図
及びその具体的説明に供する説明図。 第29U2J乃至第32図は同じくかな漢字変換処理の
具体的説明に倶する説明図である。 1・・・キーホード  2・・・液晶ディスプレイ装置
3・・プリンタ   4・・・フロッピディスク装置5
0・・・制御部     54・・・辞書メモリ第2図 第9図 0)                       
     (ロ)平がな入力モード         
 平がな英数人力モード           英数子
がな入力モード          平がな平がな°−
”字入力モード        155口 〔〕英英数
人力モード          英数平力捲ローマ字入
力モード         圧IQ(3力タカナローマ
字入方モード        !  M第1O図   
    第11図 第12図 第13図 さ些竺壬二生立 第14図 日出珪トエロシ 科学0進歩は・6ざまい・マ 第15図 わたしは、早く会社へいった。− ・    豐 や セ 謳 困 第17図 C 1ヨ對す 第18図 の 第19図 第20図 文章を、自動的に逐次変換します。  −第21図 fi22図 第24図 第25図 第26図 「反対派の人たち派」 第27図 第30図 ↓  Eキー3回押下 δ」ト倍子鼾ニー 1 、へえヵ、え。、;:oJ&Aカ マ 7 、竹で  =急i々”−−

Claims (1)

  1. 【特許請求の範囲】 1 学習機能を有するかな漢字変換処理装置において、
    学習結果として変換結果の特性を記憶する学習手段を備
    えたことを特徴とするかな漢字変換処理装置。 2 学習手段が変換結果と決定された単語の候補番号を
    記憶する特許請求の範囲第1項記載のかな漢字変換処理
    装置。
JP61111893A 1986-05-15 1986-05-15 かな漢字変換処理装置 Pending JPS62267862A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61111893A JPS62267862A (ja) 1986-05-15 1986-05-15 かな漢字変換処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61111893A JPS62267862A (ja) 1986-05-15 1986-05-15 かな漢字変換処理装置

Publications (1)

Publication Number Publication Date
JPS62267862A true JPS62267862A (ja) 1987-11-20

Family

ID=14572780

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61111893A Pending JPS62267862A (ja) 1986-05-15 1986-05-15 かな漢字変換処理装置

Country Status (1)

Country Link
JP (1) JPS62267862A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02287864A (ja) * 1989-04-28 1990-11-27 Sharp Corp 日本語ワードプロセッサ
JPH04111045A (ja) * 1990-08-30 1992-04-13 Canon Inc 文字処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02287864A (ja) * 1989-04-28 1990-11-27 Sharp Corp 日本語ワードプロセッサ
JPH04111045A (ja) * 1990-08-30 1992-04-13 Canon Inc 文字処理装置

Similar Documents

Publication Publication Date Title
JP5299011B2 (ja) テープ印刷装置、テープ印刷装置の制御方法及びプログラム
JPS62267862A (ja) かな漢字変換処理装置
JPS62267861A (ja) かな漢字変換処理装置
JPS61175682A (ja) 文字処理装置
JPS61122774A (ja) 日本語入出力装置
JP2956702B2 (ja) ローマ字かな変換方法
JPS63106067A (ja) 情報処理装置
JPH089245B2 (ja) 文字処理装置
JPH0638256B2 (ja) 入出力装置
JPS61122776A (ja) 入出力装置
JPS6375787A (ja) 文書作成装置
JPS62239194A (ja) 文書作成装置
JPS62267860A (ja) かな漢字変換処理装置
JPS61122778A (ja) 表示装置を備えた入出力装置
JPH074666Y2 (ja) 文書処理装置
JPS6389374A (ja) 印刷装置
JPH0661038B2 (ja) 文字処理装置
JPS62267141A (ja) 情報処理装置
JPS63289671A (ja) 文字処理装置
JPS63118974A (ja) ケイ線処理装置
JPH0230222A (ja) 文書作成編集装置
JPS61128315A (ja) 電子タイプライタ−
JPS62245287A (ja) 文書作成装置
JPH0638255B2 (ja) 入出力装置
JPH02101569A (ja) 文字処理装置