JPH0267684A - 校正支援方法 - Google Patents

校正支援方法

Info

Publication number
JPH0267684A
JPH0267684A JP63218322A JP21832288A JPH0267684A JP H0267684 A JPH0267684 A JP H0267684A JP 63218322 A JP63218322 A JP 63218322A JP 21832288 A JP21832288 A JP 21832288A JP H0267684 A JPH0267684 A JP H0267684A
Authority
JP
Japan
Prior art keywords
notation
rewriting
dictionary
search
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63218322A
Other languages
English (en)
Inventor
Minoru Ashizawa
実 芦沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63218322A priority Critical patent/JPH0267684A/ja
Publication of JPH0267684A publication Critical patent/JPH0267684A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、自然言語処理技術に係り、単語の表記にゆれ
がある言語を解析の対象とする技術、例えば日英自動翻
訳や校正支援に好適な、校正支援方式及び辞書検索方式
に関する。
〔従来の技術〕
従来の技術は、辞書検索方式に関して、表記のゆれに対
応するために、例えば次のような方法をとっている。即
ち、各々の表記をキーとするレコードを辞書内に作成す
る。その単語の文法、意味。
訳等の、語に付属する情報は、それらのレコードのうち
1つに書き込み、残りのレコードにはその情報を書き込
んだレコードへのポインタを書き込むようになっている
また特開昭61−223979号に記載のように、複合
語の区切り文字を統一化したものに書き換えてから辞書
検索するとなっていた。
また、特願昭58−107677号に記載のように、漢
字をその読みを表す仮名文字列に書き換え”Cから登録
、検索することで、漢字と仮名の両方の表記が可能なゆ
れに対処するとなっていた。
また、″カタカナ表記外来語の直接検索″、(中村、他
、情報処理学会筒35回全国大会(昭和62年後期)P
、1223〜p、1224)では、外来語のカタカナ表
記から英語綴りを復元して英語辞書を直接検索するとな
っていた。
一方1校正支援方式に関して、カタカナの部分をキーに
してソートし、クイック(KWIC)リストの形式で表
示するものが商品として発売されている。
〔発明が解決しようとする課題〕
上記従来技術で、辞書検索方式に関して、辞書にポイン
タを書き込む方式は、万能ではあるが、表記のゆれを網
羅的に登録する必要がある。複合語等のように1表記の
ゆれのある箇所が2箇所以上ある場合は1組み合せ的に
考える必要がある。
例えば「マルチ・ウィンドーJという単語では、「・」
による分かち書きにするか、空白による分かち書きにす
るか、入た書きにするか、また「ウィンドー」の「ライ
」を「ライ」と書くか、また、「ドー」を「ドウ」と書
くか「ドウ」と書くかによって、18通りの表記が考え
られる。全ての外来語について、このような表記のゆれ
を網羅すれば、データ量は膨大なものとなる。また、登
録から漏れてしまうものが出ることも考えられ、辞書の
品質を保証することが難しくなるという問題がある。
特開昭61−223979号に記載の方式では、複合語
の区切り文字を統一化したものであり、Pli合語の構
成要素に表記のゆれがある場合に上記と同じ問題が生じ
る。
特願昭58−107677号に記載の方式では漢字と仮
名の両方の表記ができるようなゆれには対処できるが、
その他の表記のゆれには対処できないという問題がある
前記文献″カタカナ表記外来語の直接検索″の方法では
、予め想定した外国語以外の言語を源とする外来語には
適用できない、また、英語綴りを復元するためには、表
記にゆれのない箇所に対する処理が必要である。また、
日本語による表記からは一意に英語綴りを復元すること
ができず、処理が複雑になるというl¥+7題点がある
校正支援方式に関しては、KWICリストの形式で表示
するものは、1つの単語の表記のゆれや入力誤りを発見
するために有効であるが、異なる単語間で同じような表
記のゆれがあるものの発見や、自動修正が充分でないと
いう問題点がある。
例えば、テキストに、「・・・アクティグデータ・・・
」という表記と、「・・・コグニテイブサイエンス・・
・ノという表記があるとする。この両者には、「ティグ
」 「ティグ」のように、源を同じくする音節の表記に
ゆれがある。しかし、「アクティブ」と「コグニテイブ
」では1表記のゆれがある部分より前方の文字列「アク
」と「コグニ」が異なっているために、上記従来技術の
KWICリストによる方式では、この2つの表記が離れ
た部分に表示されることになる。このため、表記のゆれ
を発見しにくいという問題点がある。また、このような
表記のゆれを発見しても、それを自動的に統一する機能
が充分でない。
本発明の第1の目では、上記問題点を回避し、表記のゆ
れの検出を行う校正支援方式を提供することにある。第
2の目的は、検出した表記のゆれを自動的に統一せしめ
る校正支援方式を提供することにある。
また、本発明の第3の目的は1表記のゆれがある。言語
に関する辞書の作成及び利用に関して、表記のゆれを網
羅的に登録する必要を無くし、単純な方法で表記のゆれ
に対処する辞書検索方式を提供することにある。
〔課題を解決するための手段〕
まず、第3の目的である辞書検索方式は、単語辞書記憶
手段と、検索キーによって単語辞書を検索する辞書検索
手段を利用する#番検索方式において、書き換え規則記
憶手段と、検索キーを書き換え規則に従って書き換える
文字列書き換え手段を利用する処理ステップを設けるこ
とによって達成される。
また、第1および第2の目的である校正支援方式は、テ
キスト編集手段とテキスト記憶手段と表示手段と入力手
段を利用する校正支援方式において1本発明の第3の目
的である辞書検索方式において書き換えられた文字列で
テキスト文字列の所定部分を書き換える処理ステップを
設けることによって達成される。
〔作用〕
書き換え規則記憶手段には、予め、書き換え規則として
、左辺に使用頻度の低い表記を書き、右辺には左辺の表
記より使用頻度の高い表記を書いたものを記憶させてお
く。これらの規則を、左辺の使用頻度別に分類しておく
。辞書検索手段は。
テキスト編集手段から渡された検索キーを用いて辞書検
索をする。また、辞書検索手段は1文字列7Fき換え手
段に対して検索キーの書き換きをJH示し、書き換えら
れた検索キーによって辞書検索を行なう。この書き換え
と検索を適宜くり返し、検索キーの書き換え内容ど、検
索結果をテキスト編集手段に返す0文字列書き換え手段
は、辞書検索手段からの指示に基き、検索キーに書き換
え規則を適用して、検索キーを書き換える。書き換え規
則は、その左辺の表記の使用頻度が低いものから適用す
る。
テキスト記憶手段は、予め校正の対象とするテキストを
記憶しておく。テキスト編集手段は、テキスト記憶手段
に記憶されているテキストの中の表記にゆれがある可能
性があると判断した部分を切り出して、検索キーとして
辞書検索手段に渡す。
また、テキスト編集手段は、辞書検索手段から返される
、検索キーの書き換え内容と、検索結果を受は取る。テ
キスト編集手段は、この検索キーの書き換え内容と検索
結果から5表記のゆれの有無について、最終的に判断す
る。ゆれがあると判断した場合は、自動的に表記を統一
するか、あるいは、ゆれがある旨を、表示手段を介して
表示する。
〔実施例〕
以下、本発明の一実施例を説明する。
第1図は本発明を実現する装置の一例を示す図である。
第2図、第3図、第4図、第5図は、本発明による校正
支援方式の一例を示すフロー図である。第1図のテキス
ト編集手段102は、このフローに従って動作する。
第11図、第12図は、書き換え規則の適用によって文
字列の長さが変化する場合の、文字の対応を保つデータ
構造を示す。この第11図、第12図の詳細については
、後にフローの説明と合わせて説明する。
第13図は、検索結果スタッフの構造を示す。
これについても1次のフローの説明と合わせて説明する
以下、まず、第2図〜第8図のフローを例を用いて説明
する。
第2図のステップ201で、第1図のテキスト記憶手段
101に記憶されているテキストの先頭の文字に注目し
、これを注目文字とする。ステップ202で、注目文字
とテキストの終りを示す文字を比較する。一致した場合
は、(203ステツプ)処理を終了する。一致しなかっ
た場合は、第3図のステップ301へ進む。ここで、注
目文字の字種を調べる。注目文字がカタカナでもナカグ
ロ〔・〕でもない場合は、ステップ303で、注目文字
の次の文字を注目文字として、第2図のス第6図、第7
図、第8図は、本発明による辞書検索方式の一例を示す
フロー図である。第1図の辞書検索手段105は、第6
図、第7図のフローに従って動作する。第1図の文字列
書き換え手段107は、第8図のフローに従って動作す
る。
第9図は、第1図の書き換え規則記憶手段108に記憶
されている規則群の一例である。第9図900に示す「
レベル」は、書き換え規則の左辺の表記の使用頻度に基
づく分類を表す番号であり。
番号の小さい規則程、その左辺の表記の使用頻度が低い
ことを表す。
第10図は、第1図の単語辞書記憶手段104に記憶さ
れている単語辞書の一例である。第10図1001.1
002,1003.1005において、「内容」が「皐
」となっているものは、その見出しを正しい表記として
使用することを指定している。また、通常は使用しない
ような表記を特に使用したい場合は、第10図1004
のように、「内容」にその使用したい表記を登録してお
けば良い。
チップ202へ戻る。注目文字が、カタカナあるいはナ
カグロになるまで、202,203,301゜302.
303の各ステップをくり返す。
今、ステップ301において1例えば注目文字が、テキ
ストの中の「マルチ・ウィンドウ・システムの〜」の先
頭の文字「マ」であるとする。これはステップ302で
カタカナであると判断され、ステップ304に進む。こ
こで、注目文字から始まるカタカナあるいはナカグロが
続く範囲「マルチ・ウィンドウ・システム」をテキスト
から切り出して、キー(KEY)(0)に代入する。ス
テップ305,306で、辞書検索方式のフローを呼び
出す準備をする。検索結果スタック(第13図)は、辞
書検索した結果、辞書から得た情報を格納するために使
用する。REWRITTENは、検索キーが、文字列書
き換え手段によって書き換えられたのか否かを示す。ス
テップ305,306を経てステップ307で、第6図
、第7図のフローを呼び出し、第6図のステップ601
へ進む。
第6図ステップ601において、KEY (0)の長さ
をLとする。KEY (0)と、それを書き換えたもの
を代入するKEY (I)との間で、文字の対応を保つ
ための配列変数0RIGLOG (1)〜01(IGL
OG (L)に、順に、自然数1,2.・・・Lを代入
する。現在、KEY (0)は、「マルチ・ウィンドウ
°システム」なので、Lは14であり、0111GLO
Gの内容は、第11図に示すようなものになる。第11
図には、説明をわかり易くするために、()内に対応す
る文字を記入しである。
続くステップ602で、KEY (0)即ち「マルチ・
ウィンドウ・システム」を検索キーとして最長一致によ
る辞書検索を行なう。検索が成功した場合は、検索結果
を検索結果スタックに書き込む。更に、辞書の見出しと
KEY (0)が一致する文字数を検索結果スタックの
「対応」の項目に書き込む。しかし、辞書の内容が第1
0図のようになっているので、現時点の辞書検索ではK
EY(0)と一致する見出しがない。従って検索結果ス
タックには何も書き込まない。
次にステップ603〜606および第7図、第8図のフ
ローで、検索キーを書き換えた辞書検索を行なう。ステ
ップ603で記憶されている書き換え規則のレベルの最
大数をNに代入する。第9図に示す例では最大数は4で
あるので、Nに4を代入する。ステップ604で、レベ
ルカウンタIに1を代入する。終了判定ステップ605
を経て、第7図のステップ701へ進む。
ステップ701で、KEY (1−1)をKEY(1)
へ代入する。現時点ではIは1なので、 KEY(0)
即ち「マルチ・ウィンドウ・システム」をKEY (1
)へ代入する。ステップ702でサブルーチンREWR
ITE  KEYを呼び出す、即ち第8図のフローへ制
御を移す。
第8図は、書き換え規則による検索キーの書き換え処理
である。ステップ801で、記憶されている書き換え規
則の先頭のものをRULEに代入する。現時点では、第
9図901に示す「・→(null)Jが代入される。
ステップ802で。
RULEのレベルが■と等しいかどうか判定する。
第9図901に示すように、現時点でレベルは1゜■は
1なので、803ステツプへ進む。ステップ803で、
RU L EをKEY (1)に適用する。
現時点ではKEY(1)が「マルチ・ウィンドウ・シス
テム」からrマルチウィンドウシステムJになる。この
結果、KEY (1)の長さが変化したので、同時に、
0RIGLOGの内容を修正する。修正後の0RIGL
OGの内容を第12図に示す。第11図では、1104
.1110に示すように、ナカグロに対応する部分があ
ったが、第12図では、その部分が削除され、詰められ
ている。その後、終了判定ステップ804を経てステッ
プ805へ進む。805ステツプで現時点のRULEに
代入されている規則の次の規則を新たにRULEに代入
する。現時点では、第9図901の次の規則902「デ
ユーシュ」が代入される。その後ステップ802へ進む
。現時点でRULEに代入されている規則802のレベ
ルは2なので、■の1とは一致せずステップ804へ進
む。以下、順に第9図903〜908の各規則をRlJ
LEに代入するが、この例では全てのレベルが1とは一
致しないので適用しない。規則908をRULEに代入
した後に、ステップ804の終了判定が成立し、第7図
ステップ703へ制御を戻す。
現時点では、第8図の処理の結果、KEY(1)に「マ
ルチウィンドウシステム」が代入されている。ステップ
703で検索キーが書き換えら九だか否かを調ベル。現
時点では、KEY (0)とKEY (1)は異なるの
で、ステップ704へ進む。ステップ704で、KEY
 (1)即ち現時点ではKEY (1)rマルチウィン
ドウシステム」を検索キーとして最長一致による辞書検
索をする。
検索してデータが得られたとき、該データを検索結果ス
タックに追加する。しかし、辞書の内容は第10図に示
す通りであり、KEY (1)と−致する見出しがない
。即ち辞書検索に失敗し、検索結果スタックには何も追
加しない。ステップ705で、キーが書き換えられたか
否かを示す変数REWRITTENに1に代入する。
次に、ステップ606でIに1を加える。現時点ではI
は2になる。その後、再びステップ605゜第7図、第
8図の各処理が行なわれる。すなわちIが2となったの
で、第8図の処理において。
第9図902,903,904,905(7)規則の適
用が試みられる。ここで、規則905の適用に成功する
。この結果、KEY (2)は、「マルチウィンドウシ
ステム」から「マルチウィンドーシステム」になる。こ
のKEY (2)を検索キーとした辞書検索が行なわれ
るが、この辞書検索も前回同様に失敗する。この後、ス
テップ705を経てステップ606に進む。
ステップ606で更に■に1を加える。この結果Iは3
になり、以下、前記とほぼ同様の処理が行なわれる。現
時点では■が3なので、KEY(3)に対して第9図の
規則906,907が試みられ。
規則907の適用に成功する。この結果、KEY(3)
は、「マルチウィンドーシステム」がら「マルチウィン
ドーシステム」になる、このKEY (3)を検索キー
とした辞書検索の結果、第10図のレコード1001に
示す「マルチウィンドー」が一致する。従って、レコー
ド1001を検索結果スタックに追加する。このレコー
ド1001の見出し「マルチウィンドー」の長さは8な
ので、第12図1208に示す0RIGLOC(8)の
値「9」を検索結果スタックの「対応」の項目に書き込
む。即ち「マルチウィンドー」の最後の文字は、KEY
(0)の[マルチ・ウィンドウ・システム」の9文字目
と対応することを示す。この結果、検索結果スタックの
内容は、第13図に示すものになる。
次にステップ705で、検索キーを書き換えたか否かを
示す変数REWRITTENに1を代入する。
この後、606ステツプで更にIに1を加える。
現時点ではIは4になる。このため、第9図908の規
則の適用が試みられるが失敗する。この結果KEY (
4)はKEY (3)と同じ「マルチウィンドーシステ
ムJのままである。このため、第8図の処理から戻った
第7図のステップ703で、条件が成立しない。このた
め、ステップ704゜705を経ずに、ステップ606
へ進む。
ステップ606で更に夏に1が加えられる。この結果、
■は5になり、ステップ605の終了判定条件が成立し
、第6図の処理の呼び出し元である第3図ステップ30
7へ戻り、第4図ステップ401へ進む。
ステップ401で検索結果スタックの内容が空であるか
どうかを調べる6空である場合は、ステップ402を経
て、ステップ403へ進む。キーが書き換えらでいたら
、ステップ404において、警告表示をする。その後、
ステップ405に進み・テキストの続きを同様に処理す
る。現時点ではステップ401で、検索結果スタックの
内容は、第13図に示すように空ではない。従って、第
5図のステップ501へ進む。
501ステツプで、検索結果スタックから、使用すべき
表記を1つ選択する。現時点では、検索結果スタックは
第13図のようになっているので、使用すべき表記とし
て「マルチウィンドー」を選択し、5TRIに代入する
。ステップ502で。
検索結果スタフの「対応」が「9」であることから、K
EY (0)の先頭から9文字の部分、即ち「マルチ・
ウィンドウ」を5TR2に代入する。
5TRIと5TR2が異なっている場合は、504ステ
ツプに進む。ステップ504で、テキスト中にある5T
R2と一致する表記を5TRIの表記に修正する。現時
点では、「マルチ・ウィンドウ」を「マルチウィンドー
」に修正する。
その後、ステップ505を経゛Cテキストの続きを処理
する。即ち、もとは[マルチ・ウィンドウ・システムの
・・・」であったテキストを、「マルチウィンドー・シ
ステムの・・・」に修正した後に、[・システムの・・
・」の先頭「・」を注目文字として処理を続ける。
以上のように処理をくり返すことで、テキスト内の「マ
ルチ・ウィンドウ・システム」という表記は、「マルチ
ウィンドーシステム」という表記に修正される。
本実施例では、書き換えの各段階に対応する辞書検索の
成否に拘らず、書き換えと検索を続けたが、検索に成功
したら直ちに次の処理へ進むようにできる。
また、書き換えと検索を段階的にくり返すようにしであ
るが、辞書の登録と書き換え規則の整合性が充分にある
ならば、1つの検索キーに、同時に全ての書き換え規則
を適用し、辞書検索を1回済ますことができる。
上記で説明した実現手段と実施例では、辞書検索方式を
校正支援方式において利用するとしたが、この辞書検索
方式は、他の自然i′語解祈方式で利用することもでき
る。例えば、@械翻訳方式で利用する場合、「マルチ・
ウィンドウ・システム」「マルチウィンドウシステム」
 [マルチウィンドーシステム」は結腸「マルチウィン
ドーシステム」という表記で辞書検索するので、機械翻
訳用の辞書には、最後の「マルチウィンドーシステム」
を見出しとして訳語を登録しておけば、他の3種の表記
からも検索可能とすることができる。
以」二、説明した実現手段、実施例の他に、次のような
実現手段も考えられる。
異なる単語間で表記法にずれがあるものを検出するとい
う第1の目的に限れば、テキスト記憶手段とテキスト編
集手段と表示手段と入力手段を利用する校正支援方式に
おいて、表記のゆれ情報記憶手段とソート用レコード記
憶手段とソート手段を利用するステップを設けることに
よって達成される。
表記のゆれ情報記憶手段には、予め、源を同じくする音
節ごとに、表記を分類して記憶させておく。テキスト編
集手段は、入力手段からの指示に基き、テキスト記憶手
段に記憶されているテキストと、表記のゆれ情報記憶手
段に記憶されている表記とを比較する。一致した部分に
ついて、ソート用レコードを作成し、ソート用レコード
記憶手段に記憶する。比較処理が終了した時点で、ソー
ト用レコード記憶手段に記憶されているレコードを、ソ
ート手段によりソートする。テキスト編集手段はソート
結果を、表示手段を介して表示する。
以下、上記の構成における実施例を説明する。
第14図は、本発明を実現する装置の一例を示す図であ
る。第15図は本発明による校正支援方式の一例を示す
フロー図である。第14図に示すテキスト編集手段14
01は第15図のフローに従って動作する。第16図は
、第14図の記憶手段1405に記憶さている表記のゆ
れ情報の内容を示す図であり、図の如く、源を同じくす
る表記が、項番に従って分類されている。
以下、第15図のフローに従って説明する・第15図ス
テップ1501で、第14図のソート用レコード記憶手
段1406の内容を空にする。
ステップ15o2で、テキストと、表記のゆれ情報の各
々の表記を比較して、一致した部分についてソート用レ
コードを作成し、ソート用レコード記憶手段1406に
記憶させる。
ソート用レコードの例を第17図に示す。例えば、テキ
ストの、第20ページ第5行に、「・・・アクティグデ
ータ・・・」という表現があるとする。これの「ティグ
」の部分が、第16図1604に示す「ティグ」と一致
するので、第17図1701に示すレコードを作成する
。即ち、レコード1701の「項番」の「4」は、第1
6図のレコード1604の「項番」の「4」である。ま
た、レコード1701の「表記」の「ティグ」は、ステ
ップ1502の比較処理で一致した表記である。また、
レコード1701の「前方テキスト」の「クア・・・」
は、テキストの、第20ページ第5行にあった「・・ア
クティグデータ・・・」において、「ティグ」より前方
の文字列「アク」を逆順にしたものである。また、17
01の「後方テキストJの「データ」は、同様に、「チ
イッ」より後方の正順文字列である。
また、レコード1701の「テキスト位置」の「20p
、5Q」は、レコード1701の内容が、テキストの第
20ページ第5行にある表記に関するものであることを
示す。
また、別の例として、第22ページ第29行に「・・・
コグニティブサイエンス・・・」という表現があれば、
第17図のレコード1702に示すようなレコードを作
成する。
このような、比較およびレコード作成処理の後、第15
図ステップ1503で、レコードをソートする。ソート
する際に、第17図の「項番」を第1キーに、「表記」
を第2キーに、「前方テキスト」を第3キーに、「後方
テキスト」を第4キーに、「テキスト位置jを第5キー
にしてソートする。ソートキーをこのようにすることで
、テキスト内では離れた位置にある全く別の単語である
「アクティグデータ」と「コグニティブサイエンスJに
おける「ティグ」と「ティグ」の表記のゆれに関するレ
コード(1701と1702)が、近接することになる
このソート結果を第15図ステップ1504で、表示手
段(第14図1403)を介して表示する。
以上、2通りの手段及び実施例について説明した。上記
の説明では、ゆれのある表記をカタカナによって記述し
たが、この他、ひらがな、ローマ字で表現したり、また
、正規表現、状態遷移図によって表現することで、パタ
ーンマツチの性能を向上させることができる。また、他
国語の綴りで表現することもできる。例えば、英語と米
語における綴りずれを1表記のゆれとして考え、検出あ
るいは自動修正することができる。
〔発明の効果〕
本発明の第1の実現手段によれば、複数の文書を結果す
るなどした場合に問題となる表記のゆれを自動的に統一
できるという効果がある。また、使用する書き換え規則
が充分にあれば、辞書を作成するためには、使用すべき
表記を与えれば良い。
即ち、単語毎に、可能な表記のゆれを調査し、表記のゆ
れを全て登録する必要がない。また、複合語の構成要素
ごとに使用すべき表記を与えれば良い。このため、辞書
作成の手間を大幅に低減するという効果がある。また1
本発明の辞書検索方式を他の自然β語解析方式と組み合
わせろことにより、入力テキストの表記のゆれに対応し
て、網羅的に表記のゆれを登録しなくても正しく対処で
きるという効果がある。
本発明の第2の実現手段によれば、異なる単語間の表記
のゆれを容易に発見できる表示を容易に実現できるとい
う効果がある。
【図面の簡単な説明】
第1図は1本発明の第1の実施例を表わす機能構成ブロ
ック図、第2図、第3図、第4図、第5図は、本発明の
実施例の校正支援方式の処理フロ−図、第6図、第7図
、第8図は、本発明の実施例の辞書検索方式の処理フロ
ー図、第9図は、上記辞書検索方式で利用する書き換え
規則の一例を表す説明図、第10図は辞書の構成例を表
す説明図、第11図と第12図は書き換え規則の適用に
より、文字列長が変化する場合の各文字の対応を表すデ
ータ構造を表す説明図、第13図は、辞書検索の結果を
保存する検索結果スタックの構造の説明図、第14図は
、本発明の第2の実施例を表わす機能構成ブロック図、
第15図は、上記第2の実施例の校正支援方式の処理フ
ロー図、第16図は、上記の校正支援方式で利用する、
表記のゆれ情報の構造を表す説明図、第17図は、上記
校正支援方式で利用する、ソート用レコードの構造を表
す説明図である。

Claims (1)

  1. 【特許請求の範囲】 1、予め記憶させた表記のゆれの対応表を書き換え規則
    として用い、文字列書き換えを行なうことを特徴とする
    校正支援方式。 2、予め記憶させた表記のゆれの対応表を、標準的でな
    い表記から標準的な表記に書き換えるための規則として
    用い、文字列書き換えを行なうことを特徴とする校正支
    援方式。 3、所望のカタカナ表記による文字列を上記対応表にも
    とずいて他のカタカナ表記に書き換えることを特徴とす
    る請求項第1項もしくは第2項記載の校正支援方式。 4、書き換え前の文字列と書き換え後の文字列の長さが
    異なる書き換えにおいて、文字列間の各文字の対応関係
    を保存することを特徴とする請求項第1項、もしくは第
    2項、もしくは第3項記載の校正支援方式。 5、検索対象とされた文字列の検索キーとなる文字列を
    、予め記憶させた表記のゆれの対応表を書き換え規則と
    して用いて手書き換え、上記書き換えられた検索キーを
    もとに辞書の検索を行なうことを特徴とする辞書検索方
    式。 6、上記検索キーの書き換えを、いくつかの段階に分け
    られた書き換え規則の順に段階分けして行ない、各段階
    ごとに書き換えられた検索キーをもとに辞書検索するこ
    とを特徴とする請求項第5項記載の辞書検索方式。 7、請求項第5項、もしくは第6項記載の辞書検索方式
    を用い、異なる単語の間で共通する表記のゆれに対して
    共通の書き換えを施すことを特徴とする校正支援方式。 8、予め記憶させた表記のゆれの対応表とテキスト文字
    列の表記とを比較することにより、テキスト中の表記の
    ゆれを検出し、表示することを特徴とする校正支援方式
JP63218322A 1988-09-02 1988-09-02 校正支援方法 Pending JPH0267684A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63218322A JPH0267684A (ja) 1988-09-02 1988-09-02 校正支援方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63218322A JPH0267684A (ja) 1988-09-02 1988-09-02 校正支援方法

Publications (1)

Publication Number Publication Date
JPH0267684A true JPH0267684A (ja) 1990-03-07

Family

ID=16718033

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63218322A Pending JPH0267684A (ja) 1988-09-02 1988-09-02 校正支援方法

Country Status (1)

Country Link
JP (1) JPH0267684A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04119469A (ja) * 1990-09-10 1992-04-20 Nec Corp 辞書作成支援装置
JPH06332934A (ja) * 1993-05-19 1994-12-02 Matsushita Electric Ind Co Ltd 電子辞書引き装置
US5890183A (en) * 1995-03-13 1999-03-30 Fuji Xerox Co., Ltd. Method, apparatus, electronic dictionary and recording medium for converting converted output into character code set accetpable for re-retrieval as original input

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62290967A (ja) * 1986-06-10 1987-12-17 Nec Corp 表記のゆれ統一方式
JPS62290968A (ja) * 1986-06-10 1987-12-17 Nec Corp 表記のゆれ統一方式
JPS63140329A (ja) * 1986-12-02 1988-06-11 Fujitsu Ltd 文章読み上げ方式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62290967A (ja) * 1986-06-10 1987-12-17 Nec Corp 表記のゆれ統一方式
JPS62290968A (ja) * 1986-06-10 1987-12-17 Nec Corp 表記のゆれ統一方式
JPS63140329A (ja) * 1986-12-02 1988-06-11 Fujitsu Ltd 文章読み上げ方式

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04119469A (ja) * 1990-09-10 1992-04-20 Nec Corp 辞書作成支援装置
JPH06332934A (ja) * 1993-05-19 1994-12-02 Matsushita Electric Ind Co Ltd 電子辞書引き装置
US5890183A (en) * 1995-03-13 1999-03-30 Fuji Xerox Co., Ltd. Method, apparatus, electronic dictionary and recording medium for converting converted output into character code set accetpable for re-retrieval as original input

Similar Documents

Publication Publication Date Title
US5604897A (en) Method and system for correcting the spelling of misspelled words
US20050171758A1 (en) Translation tool
JPH0267684A (ja) 校正支援方法
JPS61156466A (ja) 単語抽出方式
CN112364632B (zh) 图书校对方法和装置
JP2595934B2 (ja) 仮名漢字変換処理装置
JP2792147B2 (ja) 文字処理方法およびその装置
JP2870375B2 (ja) 文章訂正装置
JP3329476B2 (ja) かな漢字変換装置
JPH03233669A (ja) 文書作成装置
JPH0484261A (ja) 誤り表記検索方式
JP3501240B2 (ja) 文書作成支援装置
JPS6370372A (ja) 文書処理装置
JPH06332934A (ja) 電子辞書引き装置
JPS63184864A (ja) 文章作成装置
JPS62160534A (ja) 文字列照合方式
JPH03144850A (ja) 文章校正支援方式
JPS60186959A (ja) 辞書デ−タ管理方式
JPH01279322A (ja) 検索装置
JPS6366665A (ja) 文書解析整形装置
JPH08185401A (ja) 文書検索装置
JPH07319892A (ja) 文字列照合装置
JPH10261049A (ja) 文字認識装置
JPH05120325A (ja) 電子化辞書
JPH06161995A (ja) 氏名データ整形方法および装置