JPH11282844A - 文書作成方法および情報処理装置および記録媒体 - Google Patents

文書作成方法および情報処理装置および記録媒体

Info

Publication number
JPH11282844A
JPH11282844A JP7934098A JP7934098A JPH11282844A JP H11282844 A JPH11282844 A JP H11282844A JP 7934098 A JP7934098 A JP 7934098A JP 7934098 A JP7934098 A JP 7934098A JP H11282844 A JPH11282844 A JP H11282844A
Authority
JP
Japan
Prior art keywords
character string
text document
text
document
additional information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7934098A
Other languages
English (en)
Inventor
Tetsuya Sakai
哲也 酒井
Kazuo Sumita
一男 住田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7934098A priority Critical patent/JPH11282844A/ja
Publication of JPH11282844A publication Critical patent/JPH11282844A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

(57)【要約】 【課題】自動抄録生成、機械翻訳等の機械的処理に適し
たテキスト文書を容易に作成することのできる文書作成
方法およびそれを用いた情報処理装置を提供する。 【解決手段】少なくとも入力された情報を表示する表示
部2を有した情報処理装置において、入力されたテキス
ト文書から文法的に関連する文字列を抽出する抽出手段
3、4と、この抽出手段で抽出された文字列を表示部に
表示する表示手段4、2と、この表示手段で表示された
文字列から選択された文字列の対応関係に基づき、前記
テキスト文書を編集する編集手段4、5とを具備する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自動抄録生成、機
械翻訳等の機械的処理に適したテキスト文書を作成する
文書作成方法に関する。
【0002】
【従来の技術】ワープロやワールドワイドウェブ(WW
W)の普及により、電子化テキストを作成したり、利用
したりする機会は増える一方である。また、大量の電子
化テキストから必要な情報のみを自動的に抽出する自動
抄録技術や、ある言語で書かれた電子化テキストを別の
言語に自動的に翻訳する機械翻訳技術なども実用化され
つつある。
【0003】しかし、人間の作成した文書を機械で完全
に解析し理解することは難しいため、自動抄録や機械翻
訳などの、電子化テキストに対する機械的処理の性能に
は限界がある。まして、もともと人間がワープロなどで
作成した文書自体に誤りがある場合、上記のような機械
的処理をうまく行うことはできない。今後は、自分の作
成した文書に対して自動抄録や機械翻訳などの機械的処
理を行い、これを他人に提供するような情報共有の時代
が訪れると考えられるが、機械的処理結果の品質を満足
のいくものにするためには、機械的処理で扱うことので
きない自然言語テキストの難しさを、人間になるべく負
荷を与えない方法で解消する必要がある。しかし、これ
までは、自動抄録や機械翻訳などの翻訳がうまくいかな
かった場合、そのたびに人間が補助的情報を与えて解析
を助ける必要があった。
【0004】
【発明が解決しようとする課題】そこで、本発明は、上
記問題点に鑑み、自動抄録生成、機械翻訳等の機械的処
理に適したテキスト文書を容易に作成することのできる
文書作成方法およびそれを用いた情報処理装置を提供す
ることを目的とする。
【0005】すなわち、ユーザが、テキスト文書を作成
しながら、そのテキスト文書の機械的処理に役立つ情報
を簡単に付加できる対話的インタフェイスを実現する。
【0006】具体的には、テキスト文書の文法的に互い
に関連のある文字列を抽出し、この抽出された文字列を
対応付ける過程で該テキスト文書の言語的誤りを検出す
ることにより、より機械処理に適したテキスト文書の作
成が可能となる。
【0007】
【課題を解決するための手段】(1)本発明の文書作成
方法は、入力されたテキスト文書から文法的に関連する
文字列を抽出し、この抽出された文字列を表示手段に表
示して、前記表示された文字列から選択された文字列の
対応関係に基づき、前記テキスト文書を編集する(テキ
スト文書中の任意の文字列に該文字列と対応関係にある
他の文字列を埋め込む、あるいは、テキスト文書中の任
意の文字列を該文字列と対応関係にある他の文字列に置
き換える、あるいはテキストを修正する)ことにより、
自動抄録生成、機械翻訳等の機械的処理に適したテキス
ト文書を容易に作成することができる。
【0008】より、好ましくは、前記テキスト文書中の
前記抽出された文字列を特殊・強調表示する。
【0009】(2)本発明の情報処理装置は、少なくと
も入力された情報を表示する表示部を有した情報処理装
置において、入力されたテキスト文書から文法的に関連
する文字列を抽出する抽出手段と、この抽出手段で抽出
された文字列を表示部に表示する表示手段と、この表示
手段で表示された文字列から選択された文字列の対応関
係に基づき、前記テキスト文書を編集する編集手段と、
を具備したことにより、自動抄録生成、機械翻訳等の機
械的処理に適したテキスト文書を容易に作成することが
できる。
【0010】より好ましくは、前記表示手段は、前記テ
キスト文書中の前記抽出された文字列を特殊・強調表示
する。
【0011】
【発明の実施の形態】以下、本発明の実施形態について
図面を参照して説明する。
【0012】図1は、本発明の文書作成方法を適用した
情報処理装置の要部の構成例を示したもので、例えば、
パーソナルコンピュータ等の汎用的な情報処理装置であ
ってもよいし、機能の限定された(少なくとも文書作成
機能を有する)小型の携帯可能小型情報処理装置であっ
てもよい。
【0013】図1に示すように、主に、入力部1、表示
部2、テキスト解析部3、対応関係抽出部4、編集部
5、記憶部6、テキスト解析用辞書7から構成される。
【0014】以下、図2に示すフローチャートを参照し
ながら図1の各構成部の機能について説明する。なお、
図2は、図1の情報処理装置における文書作成処理動作
の概略を示したフローチャートである。
【0015】入力部1は例えば、キーボード、文字認識
装置、音声認識装置などの文書作成に必要な入力装置か
ら構成される。なお、以下の説明における処理対象は、
テキストデータであり、例えば、音声データとして入力
された文書であってもテキストデータに変換されている
ものとする。
【0016】表示部2は、液晶ディスプレイなど、テキ
ストやイメージが表示可能な表示画面を構成するもので
ある。
【0017】入力部1を介してユーザにより入力された
テキスト(表示部2の表示画面に表示されている)は、
入力部1から所定の指示操作を行うことにより(例え
ば、表示画面に表示された操作メニューからの選択、キ
ーボード上の所定のキー押下等)、テキスト解析部3に
渡される。
【0018】テキスト解析部3は、所定のメモリに記憶
されるテキスト解析用辞書7を参照しながら、例えば
「自然言語解析の基礎」(田中穂積著、産業図書)に開
示されている技術を用いて、ユーザにより作成されたテ
キスト文書に対して形態素解析、構文解析などの言語解
析を行う(図2のステップS1)。これにより、文法的
に予め定められた規則に基づき、テキスト文書中の文字
列が品詞、文節、文等に分解される。すなわち、テキス
ト文書中で名詞あるいは名詞句はどれであるか、あるい
は、特定の語にかかっていると考えられる語の候補など
が明らかになる。ここでの言語解析は完全な機械処理で
あるため、解析結果として複数の候補が得られる場合が
あるが、これらの曖昧性はそのまま保持しておく。な
お、テキスト文書自体は、以後の処理実行中であっても
従来どうり表示画面に表示されている。テキスト文書の
解析結果は、対応関係抽出部4に渡される。
【0019】対応関係抽出部4は、テキスト解析部3の
解析結果を基に、関連し合う文字列を抽出する。すなわ
ち、関連し合う文字列のうちの1つを参照元、他を参照
先の候補と決定する。ここで抽出された参照元と参照先
の候補は、表示部2に提示し、ユーザに、自分の意図し
ている参照元の文字列と参照先の文字列との対応関係を
選択させる。ユーザにより選択された対応関係に基づ
き、該参照元の文字列に該参照先の文字列を対応付ける
付加情報を作成する(ステップS2)。
【0020】編集部5は、対応関係抽出部4にて作成さ
れた付加情報に基づき当該テキスト文書を編集する(ス
テップS3)。すなわち、付加情報を当該テキスト文書
中に埋め込み、あるいは、付加情報に基づき当該テキス
ト文書を書き換える。そして、編集結果のテキスト文書
(付加情報を埋め込まれたテキスト文書および書き換え
られたテキスト文書のうちの少なくとも一方)を記憶部
6に記憶するようになっている(ステップS4)。
【0021】このように、本情報処理装置により作成さ
れたテキスト文書(記憶部6に記憶されている)は、付
加情報を作成する過程で文法的な誤りが修正され、ある
いは、付加情報にて文法的な文字列間の係り受け関係が
明確にされているため、このテキスト文書に対しては、
より円滑に機械的処理を施すことができる。
【0022】次に、図1の対応関係抽出部4、編集部5
の各構成部の処理動作についてより詳細に説明する。
【0023】図3は、対応関係抽出部4の処理動作を説
明するためのフローチャートである。
【0024】対応関係抽出部4は、テキスト解析部3か
らユーザにより作成されたテキスト文書および該テキス
ト文書の言語解析結果を受け取る(ステップS11)。
この解析結果を基に、当該テキスト文書中から参照元と
なる文字列を決定する(ステップS12)。例えば、テ
キスト文書の末尾から先頭に向けて(逆向きに)スキャ
ンして、最初に見つかった名詞や代名詞を参照元とす
る。このようにして決定した参照元は、表示部2の表示
画面上で特殊・強調表示される(ステップS13)。こ
こで、特殊・強調表示とは、カラー化、字体や字の大き
さの変更、アンダーラインなどにより、当該文字列をテ
キスト文書の他の文字列の表示方法とは異なる方法で表
示することを言う。
【0025】次に、解析結果をもとに、当該テキスト文
書をスキャンして、先に決定された参照元の文字列に対
応する参照先の文字列の候補を抽出する(ステップS1
4)。例えば、参照元の文字列の存在位置の直前から該
テキスト文書の先頭方向に向けて(逆方向に)スキャン
して、見つかった名詞や名詞句を抽出する。このとき、
テキスト文書全体をスキャンするかわりに、例えば最新
の(ユーザにより新たに入力された)n個の文、n個の
語のみをスキャンするなど、探索の範囲を限定してもよ
い。このようにして抽出された参照先の候補は、表示部
2の表示画面上で特殊・強調表示される(ステップS1
5)。
【0026】ユーザは、表示画面を見ながら、入力部1
を通して、表示画面上に提示された参照先の候補の中か
ら自分が意図しているものを選択する。これにより、参
照元と参照先、すなわちひとつの新しい対応関係が決定
され、両者が特殊・強調表示された状態となる。ここ
で、参照元の文字列に対応付けられた参照先の文字列
は、該参照元の文字列の付加情報とする(ステップS1
6)。なお、ユーザとの対話を通し参照先の決定を行う
具体的手順については後述する。
【0027】対応関係抽出部4は、最後に当該処理対象
のテキスト文書と、その言語解析結果と付加情報とを編
集部5に渡す(ステップS17)。
【0028】図4は、編集部5の処理動作を説明するた
めのフローチャートである。
【0029】編集部5は、対応関係抽出部4から処理対
象のテキスト文書、その言語解析結果と付加情報を受け
取ると(ステップS21)、当該テキスト文書(あるい
はその言語解析結果であってもよい)に付加情報を埋め
込む。あるいは、参照元を、それに対応付けられた付加
情報で当該テキスト文書を書き換える(ステップS2
2)。そして、編集結果のテキスト文書(付加情報を埋
め込まれたテキスト文書および書き換えられたテキスト
文書のうちの少なくとも一方)を記憶部6に記憶する
(ステップS23)。付加情報を埋め込む方法について
は後述する。
【0030】図5は、ユーザとの対話を通し参照先の決
定を行う際に用いられるインタフェース画面の表示例を
示したものである。なお、図5において、簡単のため、
テキスト文は長方形でイメージ的に表している。ここで
は、3行のテキスト文のみが図示されており、3行目の
末尾の部分が、対応関係抽出部4で抽出された参照元も
文字列として決定されている。また、対応関係抽出部4
は、該参照元よりも前の部分から参照先候補を探し、3
つの参照先候補(第1参照先候補〜第3参照先候補)を
抽出したとする。これは、例えばテキスト文書の中から
名詞のみをピックアップすることにより可能である。
【0031】さて、表示画面上では、まず、図5(a)
に示すように、参照元と、対応関係抽出4で最初に抽出
された第1の参照先候補とを対比させて特殊・強調表示
する。このとき、第1の参照候補がユーザの意図するも
のでなかった場合、例えば、ユーザがキーボードの所定
のキーを押下することにより、図5(b)のように参照
先の次候補、すなわち、第2の参照先候補が表示され
る。以下、所定のキーを押下し続けることにより、順
次、次候補が特殊・強調表示されていき(図5(b)、
(c)、(d)参照)、ユーザはこの中から所望の正し
い参照先を選択することができる。
【0032】図6は、ユーザとの対話を通し参照先の決
定を行う際に用いられるインタフェース画面の他の表示
例を示したものである。図5と異なる点は、図5では、
複数の参照先候補をユーザからの指示に従って順次1つ
づつ特殊・強調表示していくものであったが、図6で
は、参照先候補を一括表示している。図6に示したよう
に参照先候補を表示する場合、例えばマウスなどのポイ
ンティングデバイスにより、ユーザに正しい参照先の位
置を直接指定させてもよい。
【0033】なお、図5と図6に示したような参照先指
定方法を併用してもよい。また、対応関係抽出部4が抽
出した参照先候補にユーザの意図するような参照先が含
まれていない場合には、例えば、マウス等のポインティ
ングデバイスを用いて正しい参照先を指定させるように
してもよい。
【0034】次に、図7を参照して、編集部5における
テキスト文書の編集処理について具体的に説明する。
【0035】図7(a)に示すように、参照元が代名詞
であり、該参照元の参照先候補が名詞である日本語文を
例にとり説明する。
【0036】図7(a)のテキスト文中「これ」は、テ
キスト解析部3での形態素解析により代名詞であること
がわかるので、対応関係抽出部4は参照元に決定してい
る。参照先候補として、参照元「これ」以前の名詞を探
すと、「○○システム」「われわれ」などが見つかる。
ユーザが、例えば図5のに示したようなインタフェース
画面から「○○システム」を参照先として指定したとす
る。このとき、対応関係抽出部4は、「○○システム」
を「これ」の付加情報として、編集部5に渡し、編集部
5では、例えば図7(b)に示すような形式で、言語解
析結果に該付加情報をテキスト文に書き込む。
【0037】図7(b)において、「/」が形態素の区
切りを表しており、各区切りにおいて、各形態素の品詞
を括弧内に記述している。形態素「これ」の付加情報、
すなわち、参照先の形態素と、その品詞「[指示語:○
○システム(未知語)]」は、「これ」の直後に書き込
まれて、付加情報の書き込まれた形態素全体が「{}」
で囲まれている。「指示語」というのは、参照先と参照
元の具体的関係を表しいる。
【0038】なお、付加情報として参照先の文字列その
ものを実際に書き込む代わりに、参照先の文字列の位置
情報(例えば、数値、ポインタ値)を付加情報として、
図7(b)同様に、言語解析結果に書き込むようにして
もよい。参照先の文字列が非常に長くなる場合には、後
者の方が効率的である。
【0039】また、参照元の文字列を、その付加情報で
ある参照先の文字列に置き換えてもよい。すなわち、図
7(a)のテキスト文中、「これ」という文字列を「○
○システム」に置き換えて、新たなテキスト文を作成す
るようにしてもよい。
【0040】図7(a)のようなテキスト文に対して、
例えば、予め定められたキーワードを含む重要そうな文
を選出し、これらを単純に並べて抄録を作成する自動抄
録作成処理を施した場合、「これを用いて××を行
う。」という唐突に始まるような、代名詞の指示先を含
まない、文章としてのつながりがおかしい抄録が得られ
てしまう場合があるが、図7(b)に示したようなテキ
スト文では、「これ」という代名詞に「○○システム」
という具体的な名詞が対応付けられているので、この対
応関係を用いることにより、「これを用いて××を行
う。」という文が重要文として選ばれた場合でも、「こ
れ」を「○○システム」で置き換えた「○○システムを
用いて××を行う。」という、わかりやすい抄録を作成
することができる。
【0041】図8は、参照元が代名詞であり、参照先候
補が名詞である英文の場合、例えば図7(b)と同様、
言語解析結果に、例えば「They」という代名詞に
「men」という名詞が付加情報として書き込まれてい
れば、「they」という単語の多義性が解消され、後
の翻訳時に、「They」を「それら」や「彼女ら」で
はなく「彼ら」と正しく訳すことが可能となる。
【0042】図9(a)は、テキスト解析部3で「とて
も感動した。」という文を解析した結果、主語が省略さ
れていることがわかったため、対応関係抽出部4が、参
照元として「とても感動した。」という文の直前の空白
を選んだ場合を示している。主語の省略の検出は、例え
ば、文に対して形態素解析を行い、文中に名詞や代名詞
が含まれているかどうかをチェックすることにより可能
である。このように、参照元は、必ずしも文字列を含ん
でいる必要はない。対応関係抽出部4では、名詞+助詞
「は」の形をしている「私は」を参照先候補として選択
しており、ユーザはこれを正しいとして、該空白の参照
先として指定したとする。すると、図7(b)と同様
に、図9(b)に示すように、言語解析結果に書き込
む。ここで、記号「φ」は、参照元の文字列が省略され
ていることを示すものである。
【0043】図9(a)に示したようなテキスト文に対
し自動翻訳処理を施した場合、第2文の主語が不明であ
るため、正確な翻訳は不可能であるが、図9(b)に示
したようなテキスト文に対し自動翻訳処理を施した場
合、「Yesterday Iwent to see
a movie. I was very impr
essed.」のように、第2文目に主語「I」を補っ
て正しく翻訳できる。
【0044】以上、図7〜図9では、付加情報を利用し
ていかに高精度な機械翻訳や自動抄録などが行えるかを
中心に説明した。
【0045】次に、図10〜図12を参照して、付加情
報を作成する(テキスト文書中の文字列に付加情報を対
応付ける)過程において、いかに文章の誤りが検出さ
れ、これにより正確な文書が作成できるかについて具体
例を挙げて説明する。
【0046】図10(a)は、英文における誤った文の
例である。「The boys were …」という
ように、複数の少年が話題であったにもかかわらず、そ
の後続に「He …」という、1人の男性に関する文を
入力しはじめてしまっている。このとき、対応関係抽出
部4が参照元として代名詞「He」を選んだとする。対
応関係抽出部4は、参照先候補を探して、「He」以前
のテキストをスキャンするが、「He」が単数であると
いう属性を利用して候補を探した場合、「boys」は
不適であり、他に候補はみつからない。あるいは、全く
関係のないテキスト部分が参照先候補として挙げられて
しまう。このような場合、例えば、図5に示したような
インタフェース画面を介して参照先候補が提示される
と、ユーザは、自分が入力した文書に誤りがあることを
察し、該インタフェース画面から図10(b)に示した
ように、例えば「He」を「They」に訂正すること
ができる。その後、再び対応関係抽出部4で参照元「T
hey」の参照先を検索すると、「They」と「bo
ys」が共に複数であるため、「boys」が「The
y」の参照先として正しく挙げることができる。なお、
参照先が見つからない場合には、例えば、図5に示した
ようなインタフェース画面上で、ユーザに対してウォー
ニングメッセージを出すようにしてもよい。
【0047】図11(a)は、日本語文における曖昧な
文の例である。「とも子」と「れい子」という2人の女
性が話題にのぼっているにもかかわらず、その直後の文
が「彼女は」で始まっている。これは、図10と類似の
ケースであるが、図11の場合は、ユーザは「彼女=れ
い子」と思いこんで文章を入力しているとする。このよ
うな場合、ユーザは、例えば、図5に示したようなイン
タフェース画面を介して対応関係抽出部4が提示した複
数の候補、あるいは自分の意図に反する候補を見ること
により、自分の入力した「彼女」という言葉が曖昧であ
ったことに気付き、例えば図11(b)のように、該イ
ンタフェース画面から「彼女」が誰であるかを明示する
よう訂正することができる。
【0048】図12も図10と同様、英文における誤っ
た文を参照先候補の提示を利用して修正する例である。
「The set of keywords are
…」のように誤ったbe動詞を入力してしまうと、数の
照合により「are」の参照先として「keyword
s」が挙げられるが、ユーザが意図している文の主語は
「キーワードの集合」であり、「集合」自体は単数であ
る。このような場合も、例えば、図5に示したようなイ
ンタフェース画面を介して参照先候補が提示されると、
ユーザは、その誤りに気ずき、例えば該インタフェース
画面上から図12(b)に示すように、be動詞を訂正
することにより、その後、再び対応関係抽出部4で参照
元「is」の参照先を検索すると、「set」が「i
s」の参照先として正しく挙げることができる。これを
ユーザが正しい参照先として確認することにより、付加
情報の作成とともに、文法的な誤りの修正が容易に行え
る。
【0049】以上説明したように、テキスト文書作成時
に、ユーザの簡単な操作により、作成中のテキスト文書
中の任意の文字列に機械的処理に有用な情報(付加情
報)の埋め込み、あるいは、該テキスト文書中の任意の
文字列を機械的処理に有用な情報(付加情報)で書き換
えることにより、自動翻訳、自動抄録作成処理等の機械
的処理に適した(すなわち、文法的に誤りの少ない)テ
キスト文書を作成することができる。
【0050】テキスト文書中の任意の文字列に付加情報
が埋め込むことにより、後でこのテキスト文書に対して
自動抄録や機械翻訳などの機械的処理を施す場合に、こ
の付加情報を利用することにより、自然言語の難しさを
回避して精度の高い処理結果を得ることができる。
【0051】具体的には、曖昧な言葉の意味、文の構文
的構造、語と語の係受け関係など、機械的処理だけでは
十分な精度で得られない情報が、ユーザがテキスト編集
と同時に付加した付加情報により得られる。
【0052】また、付加情報を付加する過程で、自分の
作成した文章の誤りが検出されるので、言語的により正
確な文章を作成することができる。
【0053】付加情報は、テキスト編集時に校正支援の
感覚で一度付加しておけば、以後の機械的処理にに何度
でも活用することができるので、同じテキストに対して
機械処理を行うたびに人間が介在する必要がなくなる。
【0054】図13は、図1の情報処理装置で作成中の
テキスト文と、該テキスト文中の任意の文字列に付加情
報として対応付けられた参照先の文字列とを一度に表示
画面上に表示した場合を概念的に示したものである。
【0055】図13では、対応関係抽出部4でこれまで
に作成された全ての付加情報としての参照先の文字列が
参照元の文字列とともに、それらの対応関係が明らかに
なるように異なる形式で特殊・強調表示されている。こ
れは、例えば参照元と参照先との対応関係毎に異なる色
を使ったり、色や字体、字の大きさなどを変化させるな
どして実現できる。しかし、対応関係が多い場合は、見
にくくなる場合もあると思われるので、その場合は、例
えば、図14のように、現在入力中に位置から過去のn
文あるいはn行についてだけ対応関係を明示し、それ以
前の対応関係は表示しないようにしてもよい。なぜな
ら、現在入力している語の参照先は、テキスト中の近傍
にあることが多いはずだからである。
【0056】また、普段は(実際のテキスト文入力中
は)、参照先候補あるいは参照先を表示せず、入力部1
から表示画面上の特定の文字列を指定して所定の指示操
作を行ったときのみ(例えば、表示画面に表示された操
作メニューからの選択、キーボード上の所定のキー押下
等)、その文字列の参照先あるいは参照先候補あるいは
参照元を表示してもよい。
【0057】さらに、現在入力中の位置から過去のn文
についてだけその付加情報を明示するかわりに、付加情
報が設定されてから一定時間だけこれを表示し、それ以
降は提示しないようにすることも考えられる。
【0058】なお、図2、図3、図4に示したような処
理を実行するテキスト解析部3、地王関係抽出部4、編
集部5は、コンピュータに実行させることのできるプロ
グラムとして、フロッピーディスク、ハードディスク、
CD−ROM、DVD、半導体メモリ等の記録媒体に格
納して頒布することもできる。
【0059】また、付加情報としてテキスト文書中の任
意の文字列に対応付ける付加情報としては前述したよう
な言語解析の結果に基づき選択された参照先の文字列に
限らない。例えば、ユーザが入力部1から表示部2の表
示画面上の特定の文字列を指定して、所望の文字列を必
要に応じて入力し、それを該文字列の付加情報として対
応付けるようにしてもよい。
【0060】
【発明の効果】以上説明したように、本発明によれば、
自動抄録生成、機械翻訳等の機械的処理に適したテキス
ト文書を容易に作成することができる。
【図面の簡単な説明】
【図1】本発明の実施形態に係る文書作成方法を適用し
た情報処理装置の要部の構成例を示した図。
【図2】図1の情報処理装置における文書作成処理動作
の概略を示したフローチャート。
【図3】対応関係抽出部の処理動作を説明するためのフ
ローチャートで
【図4】編集部の処理動作を説明するためのフローチャ
ート。
【図5】ユーザとの対話を通し参照先の決定を行う際に
用いられるインタフェース画面の表示例を示した図。
【図6】ユーザとの対話を通し参照先の決定を行う際に
用いられるインタフェース画面の他の表示例を示した
図。
【図7】編集部におけるテキスト文書の編集処理につい
て具体的に説明するための図。
【図8】付加情報の有効性(語の係り受け関係の明確
化)について説明するための具体例を示した図。
【図9】付加情報の有効性(語の係り受け関係の明確
化)について説明するための他の具体例を示した図。
【図10】付加情報の有効性(文の誤り検出および修
正)について説明するための具体例を示した図。
【図11】付加情報の有効性(文の誤り検出および修
正)について説明するための他の具体例を示した図。
【図12】付加情報の有効性(文の誤り検出および修
正)について説明するための他の具体例を示した図。
【図13】図1の情報処理装置で作成中のテキスト文
と、該テキスト文中の任意の文字列に付加情報として対
応付けられた参照先の文字列とを一度に表示画面上に表
示した場合を概念的に示した図。
【図14】図1の情報処理装置で作成中のテキスト文
と、該テキスト文中の任意の文字列に付加情報として対
応付けられた参照先の文字列とを表示画面上に表示した
場合を概念的に示した図。
【符号の説明】 1…入力部 2…表示部 3…テキスト解析部 4…対応関係抽出部 5…編集部 6…記憶部 7…テキスト解析用辞書

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 入力されたテキスト文書から文法的に関
    連する文字列を抽出し、この抽出された文字列を表示手
    段に表示して、前記表示された文字列から選択された文
    字列の対応関係に基づき、前記テキスト文書を編集する
    ことを特徴とする文書作成方法。
  2. 【請求項2】 前記テキスト文書中の前記抽出された文
    字列を特殊・強調表示することを特徴とする請求項1記
    載の文書作成方法。
  3. 【請求項3】 少なくとも入力された情報を表示する表
    示部を有した情報処理装置において、 入力されたテキスト文書から文法的に関連する文字列を
    抽出する抽出手段と、 この抽出手段で抽出された文字列を表示部に表示する表
    示手段と、 この表示手段で表示された文字列から選択された文字列
    の対応関係に基づき、前記テキスト文書を編集する編集
    手段と、 を具備したことを特徴とする情報処理装置。
  4. 【請求項4】 前記表示手段は、前記テキスト文書中の
    前記抽出された文字列を特殊・強調表示することを特徴
    とする請求項1記載の情報処理装置。
  5. 【請求項5】 入力されたテキスト文を編集するための
    プログラムを記録した機械読取可能な記録媒体であっ
    て、 入力されたテキスト文書から文法的に関連する文字列を
    抽出させる抽出手段と、 この抽出手段で抽出された文字列を表示部に表示させる
    表示手段と、 この表示手段で表示された文字列から選択された文字列
    の対応関係に基づき、前記テキスト文書を編集させる編
    集手段と、 を実行するプログラムを記録してた記録媒体。
JP7934098A 1998-03-26 1998-03-26 文書作成方法および情報処理装置および記録媒体 Pending JPH11282844A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7934098A JPH11282844A (ja) 1998-03-26 1998-03-26 文書作成方法および情報処理装置および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7934098A JPH11282844A (ja) 1998-03-26 1998-03-26 文書作成方法および情報処理装置および記録媒体

Publications (1)

Publication Number Publication Date
JPH11282844A true JPH11282844A (ja) 1999-10-15

Family

ID=13687180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7934098A Pending JPH11282844A (ja) 1998-03-26 1998-03-26 文書作成方法および情報処理装置および記録媒体

Country Status (1)

Country Link
JP (1) JPH11282844A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100447805C (zh) * 2004-09-17 2008-12-31 富士施乐株式会社 文档处理装置和文档处理方法
JP2010538374A (ja) * 2007-08-31 2010-12-09 マイクロソフト コーポレーション 曖昧感応自然言語処理システムにおける同一指示解決
US8712758B2 (en) 2007-08-31 2014-04-29 Microsoft Corporation Coreference resolution in an ambiguity-sensitive natural language processing system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100447805C (zh) * 2004-09-17 2008-12-31 富士施乐株式会社 文档处理装置和文档处理方法
JP2010538374A (ja) * 2007-08-31 2010-12-09 マイクロソフト コーポレーション 曖昧感応自然言語処理システムにおける同一指示解決
US8712758B2 (en) 2007-08-31 2014-04-29 Microsoft Corporation Coreference resolution in an ambiguity-sensitive natural language processing system

Similar Documents

Publication Publication Date Title
JP4050755B2 (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US8423346B2 (en) Device and method for interactive machine translation
JP4940325B2 (ja) 文書校正支援装置、方法およびプログラム
JPH08101837A (ja) 機械翻訳装置における翻訳規則学習方法
JP2010067021A (ja) 機械翻訳装置及び機械翻訳プログラム
JPH11282844A (ja) 文書作成方法および情報処理装置および記録媒体
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
JP4350566B2 (ja) 機械翻訳システム
JP2838984B2 (ja) 汎用参照装置
JP5632213B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP4043176B2 (ja) 自然言語処理装置
JPH04174069A (ja) 言語理解支援装置
JP2817497B2 (ja) 辞書編集装置
JP2928246B2 (ja) 翻訳支援装置
JP3244286B2 (ja) 翻訳処理装置
JP3313810B2 (ja) アスペクト処理装置
JP2723886B2 (ja) 機械翻訳装置及びその翻訳規則作成方法
JP2608384B2 (ja) 機械翻訳装置及びその方法
JPH09185629A (ja) 機械翻訳方法
JP3253311B2 (ja) 言語処理装置および言語処理方法
JPH11259474A (ja) 機械翻訳装置及び機械翻訳方法
JP3350624B2 (ja) 文生成支援装置
JPH05225232A (ja) テキスト自動前編集装置
JPH0612449A (ja) 機械翻訳装置及びその方法
JPH0773185A (ja) 機械翻訳装置及び方法