JPH11272666A - 文書編集システム、方法、及び記録媒体 - Google Patents

文書編集システム、方法、及び記録媒体

Info

Publication number
JPH11272666A
JPH11272666A JP7272798A JP7272798A JPH11272666A JP H11272666 A JPH11272666 A JP H11272666A JP 7272798 A JP7272798 A JP 7272798A JP 7272798 A JP7272798 A JP 7272798A JP H11272666 A JPH11272666 A JP H11272666A
Authority
JP
Japan
Prior art keywords
document
area
information
location
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7272798A
Other languages
English (en)
Other versions
JP3737629B2 (ja
Inventor
Yasuyuki Fujikawa
泰之 藤川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP07272798A priority Critical patent/JP3737629B2/ja
Publication of JPH11272666A publication Critical patent/JPH11272666A/ja
Application granted granted Critical
Publication of JP3737629B2 publication Critical patent/JP3737629B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

(57)【要約】 【課題】 複数の文書から所定のパターンによって抽出
された領域を再構成して、ユーザが編集可能な状態で表
示させる文書編集システムを提供する。 【解決手段】 汎用的な開始パターン及び終了パターン
からなるパターンの組と文書構造情報を用いて、複数の
文書から前記パターンの組に該当する個所の間の領域を
それぞれ抽出し、結果を前記文書構造情報とレイアウト
情報に従って集約して再構成し、ユーザが編集可能な状
態で表示する。ユーザにより編集された領域は抽出元の
文書に書き戻される。更に、前記文書構造情報と前記レ
イアウト情報は一体的に登録、保持され、前記文書構造
情報は前記文書内の領域の階層構造(包含関係)、出現
順序、及び繰り返しの有無等の文書構造に関する情報を
含み、前記レイアウト情報は、前記各領域の表示位置、
フォント・スタイル、フォント・サイズ、文字列の配
置、及び文字色等のレイアウト情報を含む。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書を編集するシ
ステムに関し、より詳しくは、複数の文書から、同様の
パターンに属する領域を抽出し、その抽出された各領域
を再構成して表示装置上に編集可能に表示し、更にその
編集後の各領域を抽出元の文書に反映させる文書編集シ
ステムに関する。
【0002】
【従来の技術】従来より、文書を一定の規則で効率よく
表示または印刷するための技術としてSGML(Sta
ndard Generalized Markup
Language)が広く知られている。ユーザはSG
MLによって、文書の構造を定義した文書型定義と表示
レイアウトまたは印刷レイアウトに使用される文書レイ
アウト定義を事前に設定することができ、ユーザはこれ
らの定義を用いて、効率的に一定の規則に従って文書を
再構成し、その表示または印刷を行うことができる。前
記文書型定義はDTD(Document Type
Definition)と呼ばれ、例えば、文書が複数
の領域から成る場合、その各領域の階層構造(包含関
係)、出現順及び繰り返し等に関する情報を有してい
る。また前記各領域はそれぞれ任意の一対のタグ(識別
子)に関連付けられている。
【0003】ユーザが文書を作成する場合には、DTD
で定義した領域に対応させる部分を、前記領域に関連付
けられた一対のタグで挟むように作成する。例えば、文
章のタイトル領域は一対のタグ「title」と「/t
itle」に関連付けられており、ユーザは、タイトル
として表示させたい文字列を、この一対のタグで挟むよ
うにする。タグは、場合によっては、対で指定しなくて
もよい。
【0004】前記文書レイアウト定義は、DTDで定義
された一対のタグに対応して設定され、例えば、その一
対のタグで挟まれた文書内の領域をどういったフォント
・スタイルやフォント・サイズで出力するか等を定義す
る。この文書レイアウト定義は、通常フォーマッタと呼
ばれる出力ソフトウエア等によって保持され、フォーマ
ッタが文書を処理する際にフォーマッタによって、その
文書内に現れる一対のタグに挟まれた各領域が、文書レ
イアウト定義においてそのタグに関して定義された内容
に従って表示または印刷される。例えば、文書内で一対
のタグ「title」と「/title」で挟まれた領
域は12ポイントのゴシック体で表示される。
【0005】また、特開平7−98708号公報「文書
処理システム及びその方法」には、ユーザが意図した通
りに文書またはその文書の一部を選択して、その内容を
再構成して表示する文書処理システムが開示されてい
る。この文書処理システムは、ユーザが、例えば「認識
技術に役立つ文書を読みたい。」という要求を文章で入
力すると、その意図を解析し、その意図に合致した少な
くとも1つの文書等(素材)が選択され、更にその文書
の全てまたは一部が再構成されて、ユーザの読みやすい
状態に加工された後、表示される。ユーザの意図に合致
した文書または文書の一部を選択するために、ユーザが
入力した前記文章内の複数のキーワードまたはそのキー
ワードの類義語が用いられる。
【0006】また更に、特開平8−202711号公報
「文書編集操作電子装置」には、ユーザが最初に指定し
た編集対象の範囲から、特定の文字パターンを検出し、
同一文書内に同様のパターンを有する部分があれば、そ
の部分も編集対象として自動的に追加登録する装置が開
示されている。前記装置は、1つの文書内に散在する見
出し、タイトル部分、または注釈文等を一括して編集対
象として選択することを目的としている。前記装置は、
最初にユーザが編集対象の範囲を1つ選択すると、その
範囲内で、見出しなどで多用される「・」や「§」とい
った特定の記号が存在するかどうかを判定し、それらの
記号のうちいずれかが存在する場合は、その記号と記号
の表示カラム位置等をパターンとして登録する。次に前
記装置は、その文書内で、前記登録されたパターンと同
じパターンを有する部分、即ち「・」や「§」といった
記号を同じカラム位置に有する部分を検出し、それらを
全て編集対象として自動的に選択する。
【0007】
【発明が解決しようとする課題】前述した第1の従来技
術SGMLにおいては、文書の一部を抽出し、再構成す
るために、意識的に一対のタグを文書に埋め込むことが
必要であり、このため文書作成の際の労力は多大なもの
である。この結果、文書内には文書の内容とは直接関係
のないタグが散りばめられ、全体的に見映えが悪くな
り、場合によってはタグを文書内容と誤解するといった
弊害も生じる。また、タグは固定的な文字列であり、こ
れらをパターン化して表示や印刷の際に使用する文書レ
イアウト定義に対応付けることはできない。
【0008】更に、SGMLでは、1文書を対象とする
部分的な抽出と再構成が可能であるが、複数の文書から
同様のパターンの文字列に挟まれる領域をそれぞれ抽出
して、それらを一覧的に集約して再構成することはでき
ない。また、SGMLは主に、表示または印刷において
一定の規則に基づいてレイアウトを行うものであり、再
構成された文書の内容を編集可能とし、その編集された
内容を元の文書に書き戻すような機能はない。
【0009】また、SGMLでは、文書の構造を定義す
るDTDと、フォーマッタ内に保持されたレイアウト定
義をそれぞれ設定しなければならない。これはユーザに
とって非常に繁雑な作業である。更に、タグ名称などは
これらの定義の間で一致させておかなくてはならず、別
々に作成することによってタグ名や構造上の矛盾が生じ
やすくなる。
【0010】前述した第2の従来技術、特開平7−98
708号公報「文書処理システム及びその方法」におい
ては、文書の一部を抽出し再構成するために、ユーザの
要求として入力された文章から解析されたキーワードま
たはそのキーワードの類義語による文字列検索が行われ
る。こうした文字列検索では、抽出元の文書を少しでも
変更すると、その部分は抽出されなくなってしまい、検
索結果が大きく変わってしまう。また、キーワードの類
義語も検索しているため、場合によっては検索結果が膨
大になり、実用に耐えないケースも生じる。更に、ユー
ザが要求を文章等で入力するため、所定のパターン化し
た文字列等を使用して抽出を行うことができない。
【0011】更に、この技術では、複数の文書を対象と
して抽出を行うことができるが、複数の文書の選択自体
がユーザの入力から解析されたキーワード等を用いてい
るので、実際に選択される文書を事前に確定させること
ができない。また、再構成された文書の内容を編集し
て、その編集結果を元の文書に書き戻すような機能はな
い。
【0012】前述した第3の従来技術、特開平8−20
2711号公報「文書編集操作電子装置」においては、
文書の一部を抽出し再構成するために、ユーザが最初に
選択した範囲と同じパターンを有する部分が検索される
が、前記パターンは、「・」や「§」といった見出し部
分に多用される特定の文字列とその表示カラムであっ
て、汎用的なパターンを用いて検索を行うことはできな
い。
【0013】更に、この技術では、1文書内における複
数の部分を対象にしており、前記パターンを有する文の
みが編集対象として選択される。また、編集対象として
選択された文に対してレイアウト情報などを用いて再構
成するといった機能はない。
【0014】本発明の課題は、汎用的な開始パターン及
び終了パターンからなる一対のパターンと、文書の構造
を定義する文書構造情報を用いて、複数の文書から前記
開始パターンに該当する個所と前記終了パターンに該当
する個所との間の領域をそれぞれ抽出し、その抽出結果
を前記文書構造情報とレイアウト情報に従って集約して
再構成し、ユーザが編集可能な状態で表示する文書編集
システムを提供することにある。
【0015】更に、本発明の課題は、編集可能な状態で
再構成され表示された領域をユーザが編集した後に、そ
の編集された領域を抽出元の文書に書き戻し、ユーザの
編集結果を抽出元の文書に反映させる文書編集システム
を提供することにある。
【0016】また更に、本発明の課題は、前記文書構造
情報と前記レイアウト情報を一体として登録、保持で
き、前記文書構造情報が前記文書内の各領域の領域名、
階層構造(包含関係)、出現順序、繰り返しの有無及び
省略の可否などの文書構造に関する情報を定義し、前記
レイアウト情報が、前記各領域の表示位置、フォント・
スタイル、フォント・サイズ、文字列の配置、及び文字
色等のレイアウト情報を定義する文書編集システムを提
供することにある。
【0017】
【課題を解決するための手段】上記本発明の課題を解決
するための請求項1に記載の文書編集システムは、少な
くとも1つの文書から任意の領域を抽出して、該抽出さ
れた領域を編集可能な状態で表示する文書編集システム
であって、各文書から所望の領域を抽出するために使用
される領域定義情報をパターンとして登録する領域定義
情報登録手段と、各文書内の領域の構造に関する文書構
造情報、及び該各領域を再構成するために使用されるレ
イアウト情報を登録する文書構造・レイアウト情報登録
手段と、該記領域定義登録手段によって登録された領域
定義情報と、該文書構造・レイアウト情報登録手段によ
って登録された文書構造情報を使用して第1の箇所と第
2の箇所を検索し、該2つの箇所の間にある領域を抽出
する文書抽出手段と、該文書構造・レイアウト情報登録
手段によって登録された該文書構造情報及び該レイアウ
ト情報を使用して、該抽出された少なくとも1つの領域
を再構成して表示する文書再構成手段を有するよう構成
される。これによって、抽出パターンを使用した安定的
な領域の抽出が行われ、少なくとも1つの文書から抽出
された各領域の内容を集約して見やすい形式で表示する
ことができる。
【0018】請求項2に記載の文書編集システムは、請
求項1に記載の前記システムにおいて、前記再構成して
表示された少なくとも1つの領域を編集できるように制
御する文書編集制御手段を有するように構成される。こ
れによって、少なくとも1つの文書から抽出された各領
域の内容が集約され見やすく表示されると共に、その状
態で編集を行うことができる。
【0019】請求項3に記載の文書編集システムは、請
求項1に記載の前記システムにおいて、前記文書編集制
御手段が更に、前記再構成して表示された少なくとも1
つの領域に関する編集機能を、前記文書から抽出された
領域の内容のみに制限するよう制御するように構成され
る。これによって、抽出された各領域の内容を編集しよ
うとする際に、各領域の内容以外の表示上の修飾部分な
どを誤って編集することがなく、編集の操作性が向上す
る。
【0020】請求項4に記載の文書編集システムは、請
求項1に記載の前記システムにおいて、前記抽出された
少なくとも1つの領域が編集された場合、その編集結果
を該領域の抽出元の文書に反映させる文書編集結果反映
手段を有するように構成される。これによって、複数の
文書の同様の部分を個別に検索してそれぞれ編集作業を
行うことが不要となり、集約的に複数文書の関連部分を
編集できる。
【0021】請求項9に記載の文書編集システムは、請
求項1に記載の前記システムにおいて、前記各文書内の
領域の構造に関する前記文書構造情報、及び該各領域を
再構成するために使用される前記レイアウト情報が、前
記文書構造・レイアウト情報登録手段によって一体的に
登録されるように構成される。これによって、前記文書
構造情報と前記レイアウト情報が一体として登録、保持
され、両者を矛盾なく一体化して容易に作成できるよう
になった。
【0022】
【発明の実施の形態】以下に、本発明の実施の形態の例
について、図面を参照して説明する。尚、各図におい
て、同一または類似のものには同一の参照番号または、
記号を付与して説明する。
【0023】図1は、本発明の文書編集システム100
の一実施の形態のシステム構成を示すブロック図であ
る。文書編集システム100は、処理装置110、記憶
装置120、入力装置130、及び表示装置140を含
む。処理装置110は、記憶装置120に記憶されてい
る必要なデータを読み込み、そのデータから得られる情
報を元に処理を行い、その処理結果を表示装置140に
表示した後、必要に応じてその表示内容を記憶装置12
0内に記憶された関連するデータに書き込む。
【0024】記憶装置120は、通常ハードディスクや
フロッピーディスクなどの2次記憶装置であり、文書編
集システム100に必要な、後で詳述する領域定義情報
121、文書構造・レイアウト情報122、領域−文書
構造対応情報123、及び複数の抽出元となる文書12
4を格納する。しかし、これらのデータは、ネットワー
ク経由で他のコンピュータの記憶装置等から読み込ま
れ、また逆の経路で書き込まれることも可能であり、こ
の場合に前記データが記憶装置120内に格納されてい
る必要はない。
【0025】入力装置130は、必要に応じて記憶装置
120に格納されたデータの入力・変更を行うための、
マウスやキーボードといった入力装置である。また、入
力装置130は、表示装置140上に表示される再構成
結果を編集するためにユーザによって使用される。ここ
で編集とは、表示装置140上に表示された文字列等の
対象を入力装置130を使用して追加、変更、または削
除することを指す。
【0026】表示装置140は、記憶装置120に格納
されたデータや、処理装置110における処理結果の内
容を表示するための、CRTディスプレイなどの表示装
置である。処理装置110によって処理された再構成結
果は最初に、表示装置140に表示される。また、再構
成結果やその再構成結果を編集した結果などを印刷する
ために、印刷装置を設けることも可能である。
【0027】これらの装置の構成は、パーソナル・コン
ピュータやUNIXワークステーション等において一般
的なものである。従って本発明の文書編集システム10
0も、単一の一般的なパーソナル・コンピュータ等によ
って実施可能である。
【0028】処理装置110は更に、領域定義情報登録
部111、文書構造・レイアウト情報登録部112、文
書抽出部113、文書再構成部114、文書編集制御部
115、及び文書編集結果反映部116を含む。
【0029】領域定義情報登録部111は、ユーザが処
理対象とする複数の文書のそれぞれから、再構成すべき
文書の領域を抽出するための開始パターンと終了パター
ンからなる1対のパターンを登録する機能を提供する。
登録結果は、記憶装置120内の領域定義情報121と
して記憶される。また、領域定義情報121はテキスト
情報でよいため、前記領域定義情報登録部111は、任
意のテキストエディタで実現されうるが、所定の入力エ
リアやチェック機能を備えた特定のアプリケーションに
よって達成されることが望ましい。
【0030】文書構造・レイアウト情報登録部112
は、前記領域定義情報登録部111によって登録された
抽出パターンに対応する各領域に対し、領域名、階層構
造(包含関係)、出現順序、繰り返しの有無、及び省略
の可否などの文書構造情報と、再構成する際の各領域の
表示位置、フォント・スタイル、フォント・サイズ、文
字列の配置、及び文字色等のレイアウト情報を登録する
機能を提供する。登録結果は、記憶装置120内の文書
構造・レイアウト情報122として記憶される。この実
施の形態では、前記文書構造情報と前記レイアウト情報
を一体として登録しているため、登録機構も一体化して
示しているが、文書構造情報登録部とレイアウト情報登
録部という個別の機構として構成することもできる。ま
たその場合、記憶装置120内の文書構造・レイアウト
情報122も、文書構造情報及びレイアウトとして別々
に記憶されうる。
【0031】文書抽出部113は、ユーザが指定した記
憶装置120内の少なくとも1つの文書124を読み込
み、領域定義情報登録部111によって登録された領域
定義情報121と文書構造・レイアウト情報登録部11
2によって登録された文書構造・レイアウト情報122
を使用して、文書124の所望の領域を抽出する。文書
抽出部113は、読み込んだ前記文書124のそれぞれ
の中で、前記領域定義情報121に登録された開始パタ
ーンと終了パターンからなる1対の抽出パターンに合致
する箇所をそれぞれ判定し、更にそれらの箇所に挟まれ
た領域が、前記文書構造・レイアウト情報122内に定
義されている文書内の各領域に関する領域名、階層構造
(包含関係)、出現順序、繰り返しの有無、及び省略の
可否などの文書構造情報と矛盾していないことを判定す
ると、その領域を抽出する。また、この抽出の際、抽出
元の文書124のどこからどこまでの領域を抽出したか
を対応づける情報を、記憶装置120内の領域−文書構
造対応情報123に出力する。これは、抽出された各領
域が後述する文書編集制御部115によって編集された
結果、その領域の長さが変更される可能性があり、その
後、これらの領域が後述する文書編集結果反映部116
によって個別に抽出元の文書124に反映される際に、
文書124内の抽出されていない他の領域を更新してし
まわないようにするためである。
【0032】また、文書抽出部113では、ユーザが文
書124を指定した際に、その各文書124の内容をそ
れぞれ1つのウインドウに表示させ、その後、抽出を指
示するよう設定する。しかし、各文書124の内容を表
示させることなく、抽出の指定を行うよう構成しても構
わない。
【0033】文書再構成部114は、文書抽出部113
によって抽出された文書124内の各領域を、領域定義
情報登録部111によって登録された領域定義情報12
1と文書構造・レイアウト情報登録部112によって登
録された文書構造・レイアウト情報122を使用して、
表示装置140上に再構成する。前記抽出された領域に
は、それが抽出された抽出パターンに対応する名前(領
域名)がつけられており、その領域名に対応する前記文
書構造・レイアウト情報122内の内容がそれぞれの領
域の再構成に用いられる。また、この再構成に際して
は、レイアウト情報によって、抽出された領域に含まれ
ていない見出しなどの固定の文字列や、囲み線、下線等
の修飾が付加され、ユーザが見やすいような再構成がな
される。
【0034】また、文書再構成部114は、前記領域−
文書構造対応情報123の出力を前記文書抽出部113
に代わって行うことも可能である。その場合には、文書
抽出部113は、抽出対象となった領域の内容に加え
て、それらの領域が抽出元の文書124のどこからどこ
までの内容に対応するかを示す中間情報を、文書再構成
部114に対して出力しておく必要がある。
【0035】再構成結果は、複数の文書に関して抽出さ
れた少なくとも1つの領域が前記レイアウト情報に従っ
て1つのウインドウとして表示される。この実施の形態
では、例えばマイクロソフト社のWindows95の
ようなマルチウインドウシステム上でワープロWord
を稼働させて、その中の1ウインドウに再構成結果を表
示させている。また、再構成結果は、1つの文書に関し
て抽出された少なくとも1つの領域を前記レイアウト情
報に従って1つのウインドウとして表示し、それぞれの
文書に関して1つのウインドウで表示されるように構成
しても良い。
【0036】文書編集制御部115は、前記文書再構成
部114によって表示装置140に表示されたウインド
ウにおいて、そのウインドウ内の編集を制御する。前述
の通り、前記ウインドウ内には、複数の文書に関して再
構成された結果が表示されているが、抽出された領域
と、レイアウト情報によって新たに付加された見出しな
どの情報が混在している。そこで、前記文書編集制御部
115は、このウインドウ内において、前記抽出された
領域のみを編集可能とし、レイアウト情報によって付加
された見出しなどの修飾領域の編集を禁止する。また、
ここでの編集は、結果的に抽出された領域の長さを変え
てしまうような編集であっても構わない。
【0037】文書編集結果反映部116は、ユーザが抽
出元の文書124にその編集結果を反映させるよう指示
すると、記憶装置120内の領域−文書構造対応情報1
23に記憶された対応情報に従って、その抽出元の文書
124の内容を編集された内容に更新する。もちろん、
反映されるのは、複数の文書から抽出され編集された領
域であって、レイアウト情報によって新たに付加された
見出しなどの情報は対象外である。
【0038】以上、図1に関して説明を行ってきたが、
図示した構成は本発明の一実施の形態の構成を示したに
過ぎず、こうした構成に限られるものではない。例え
ば、処理装置110内の各部分は、複数のコンピュータ
に分散させて行うことができる。更に、記憶装置12
0、入力装置130、及び表示装置140は、ネットワ
ークを介して単数または複数の処理装置110と接続さ
せることができ、ユーザがリモートで本発明の文書編集
システム100を操作することが可能である。
【0039】次に、図4から図12までを参照しながら
図2の処理フローを説明する。図2は、前記文書抽出部
113及び前記文書再構成部114による文書抽出及び
再構成処理の流れを示す図である。図2は、左1/3の
欄が文書抽出及び再構成処理により作成された情報を示
し、中央1/3の欄が文書抽出及び再構成処理の流れを
示し、右1/3の欄がユーザが予め定義した情報を示し
ている。
【0040】図2の最初のステップS10において、文
書抽出部113は領域定義情報121を読み込む。領域
定義情報121は、予めユーザが領域定義情報登録部1
11を用いて登録したものである。
【0041】図4はユーザによって登録された領域定義
情報121の一例を示すものである。なお、図面中に記
載された黒く塗りつぶされた括弧は本文中では“〔〕”
の括弧に置き換えて表記する。この例では、ある一対の
文字列パターン(開始パターンと終了パターン)に該当
する文字列に挟まれる文書124内の領域を抽出するよ
うに定義されている。例えば、抽出する領域の直前を示
す文字列パターン(開始パターン)は〔@@〕であり、
直後を示す文字列パターン(終了パターン)は〔@@−
終了〕であり、〔@@〕に該当する文字列と〔@@−終
了〕に該当する文字列の間の領域が抽出されるように定
義される。 外1 (以下、本文中にお
【0042】
【外1】
【0043】いて、この黒く塗りつぶされた四角は
“(黒四角)”と置き換えて表記する。)は任意の領域
の終了を示すパターンとして定義されている。但し、こ
こで、〔@@−終了〕は必須でなく、〔@@〕に該当す
る文字列の次に更に〔@@〕に該当する別の文字列があ
れば、2つ目の〔@@〕の直前までが1つ目の〔@@〕
に関する領域の抽出範囲となる。また、@@とは、任意
の文字数の文字列を示し、一対の文字列パターンにおけ
る〔@@〕と〔@@−終了〕内の@@は同一の文字列で
ある。なお、@@に該当する文字列は、後述する図5の
文書構造情報の各領域名(構成要素の名称)と一致する
べきものである。
【0044】図2の次のステップS11において、文書
抽出部113は文書構造・レイアウト情報122を読み
込む。文書構造・レイアウト情報122は、予めユーザ
が文書構造・レイアウト情報登録部112を用いて登録
したものである。ステップS11で使用されるのは、こ
の文書構造・レイアウト情報122のうち、文書124
の中の各領域の領域名、階層構造(包含関係)、出現順
序、繰り返しの有無及び省略の可否などを定義した文書
構造情報のみである。この実施の形態では、文書構造・
レイアウト情報122は一体として定義されており、後
で図10に関して詳述する。ここでは、説明を簡略化す
るため、前記文書構造情報の例を概念的に示す図5を用
いて説明する。
【0045】図5に示された文書構造情報は、プログラ
ムの仕様書に関する文書構造を規定した例であり、主と
して文書200の階層構造(包含関係)を示している。
最下位の階層のブロック(即ち、見出し、関数名、処理
概要、呼出形式、インタフェース、及び注意)が文書内
の領域の実体を示している。文書200は、見出し21
0と処理仕様220から成っている。見出し210は1
つ存在する。処理仕様220は繰り返しありと記述され
ており、複数存在する可能性がある。処理仕様220
は、関数名221、処理概要222、呼出形式223、
インタフェース224、及び注意225を含んでいると
いう包含関係を規定する。処理仕様220は前記各要素
の集合を規定するのみで、文書200の実体領域に対応
しない。インタフェース224は繰り返しありと記述さ
れていることから、1つの処理仕様の中に複数存在する
可能性があり、注意225は省略可であり、存在しない
場合がある。
【0046】逆に、見出し210、関数名221、処理
概要222、呼出形式223、及び少なくとも1つのイ
ンタフェース224は、文書200内に必須のものであ
り、これがない場合は、後述の図2のステップS12に
おいて、該当文書に関して所定のタイミングでエラーメ
ッセージを表示したりする対応が考えられる。
【0047】次に図2のステップS12では、文書抽出
部113が、ユーザの指定した少なくとも1つの文書1
24を読み込み、図4の領域定義情報121と図5の文
書構造情報に基づいて、各文書124から少なくとも1
つの領域を抽出する。前述のように、図5に示された文
書構造情報の各領域名(構成要素の名称)が、図4の領
域定義情報121のパターンに記載された@@に該当す
る文字列に対応している。即ち文書抽出部113は、既
に読み取った図4の領域定義情報121と図5の文書構
造情報から、ユーザより指定された前記各文書124
が、少なくとも〔見出し〕〜〔見出し−終了〕の領域、
〔関数名〕〜〔関数名−終了〕の領域、〔処理概要〕〜
〔処理概要−終了〕の領域、〔呼出形式〕〜〔呼出形式
−終了〕の領域、〔インタフェース〕〜〔インタフェー
ス−終了〕の領域、及び〔注意〕〜〔注意−終了〕の領
域をこの順序で有し、更に〔関数名〕〜〔関数名−終
了〕の領域から〔注意〕〜〔注意−終了〕の領域まで
は、同じ順序で繰り返される可能性があるものとして解
釈する。
【0048】但し、前述のように、〔見出し−終了〕、
〔関数名−終了〕、〔処理概要−終了〕、〔呼出形式−
終了〕、〔インタフェース−終了〕、及び〔注意−終
了〕といった領域の終了を判定する文字列は文書124
中で省略される場合があり、次の領域の開始を判定する
文字列または(黒四角)などの所定の文字列の出現によ
り領域の終了が判定される。
【0049】こうした抽出の例を、図6に示される文書
124の例で考えてみる。前述の説明から、文書124
では、見出し210に関する領域は必須となっている
が、ここでは省略する。文書抽出部113が図6の文書
124を読み込むと、最初に「〔関数名〕」という文字
列を検出し、その後「〔関数名−終了〕」という文字列
を検出する。これは、図4の領域定義情報121のパタ
ーンに合致し、図5の文書構造情報における関数名22
1の出現順序に合致するため(前述の通り、ここでは見
出し210はないものと考え、関数名221が最初に現
れる有効な領域である)、「〔関数名〕」〜「〔関数名
−終了〕」の間の文字列「ZaikoHikiate」
が「関数名」という領域名と関連付けて抽出される。
【0050】次に、文書抽出部113が読み込みを続け
ると、「★この行は抽出されません★」という文字列が
抽出されるが、この文字列は、図4の領域定義情報12
1で定義されたパターンで挟まれておらず、またそのよ
うなパターンで始まっていないため、抽出されない。
【0051】次に、文書抽出部113は、「〔処理概
要〕」という文字列を検出し、その後「〔呼出形式〕」
という文字列を検出する。ここで、「〔処理概要〕」と
いう文字列は図4の領域定義情報121のパターンに合
致し、図5の文書構造情報において、関数名221の次
に出現する領域名が処理概要222であることから出現
順序の条件も満たし、「〔処理概要〕」〜「〔呼出形
式〕」の間の文字列「(改行)与えられた商品コードと
受注数量を基に、在庫が引き当て可能かどうか(改行)
を判断する。」が、「処理概要」という領域名と関連付
けて抽出される。この場合、「〔処理概要−終了〕」と
いう、領域の終了を示す文字列はないが、次の妥当な領
域「呼出形式」の開始を示す「〔呼出形式〕」という文
字列が出現したため前記文字列「〔処理概要−終了〕」
が省略されているものと判断される。また、ここで抽出
される文字列の内容には、抽出元の内容を忠実に再現す
べく、文字情報の他に改行や改ページに関する制御情報
も抽出される。前記処理概要の例では、改行に関する制
御情報が、抽出文字列内に「(改行)」として抽出され
ている。
【0052】以降、同様の処理を繰り返すと、その後、
以下のような文字列が各領域名に関連付けて抽出され
る。 領域名:呼出形式=「ZaikoHikiate(ShohinCD, Za ikoSu, Kekka)」、 領域名:インタフェース(1)=「Int ShohinCD, // 引き当てすべき商品コードのキーとなる値」、 領域名:インタフェース(2)=「Int ZaikoSu, // 引き当てすべき数量」、 領域名:インタフェース(3)=「Int Kekka // 引き当てが可能かどうかがセットされる。(改行) // 引き当て可能なら1。不可なら0が設定される。」、 領域名:注意=「在庫数(ZaikoSu)にマイナスの数値が入っている場 合、本処理の動作結果(改行)は不定になる。」。
【0053】ここで、処理仕様220の繰り返しはない
がインタフェース224は3回繰り返されており、この
ような場合、領域名には、前述のようにインタフェース
の後に(1)〜(3)が付加される。これは、繰り返し
の要素を固有に識別可能にするためであって、他の様々
な方法を用いることもできる。
【0054】図7には、領域定義情報121の第2の例
が示されている。この例では、ある程度規則的な文字列
のパターンを有する文書124内の文字列から開始され
る領域が抽出されるように定義されている。例えば、抽
出する領域の直前の文字列は^[0−9]+¥.@@$
であり、領域の直後の文字列を示すパターンはない。^
[0−9]+¥.@@$は、行頭から少なくとも1つの
数字の並び、1つのピリオド、領域名に対応する任意の
数の文字列、及び改行からなる文字列を示している。任
意の領域の終了を示すパターンは、 外2 である。こ
こで、^$は改
【0055】
【外2】
【0056】行のみの行を示している。従って、改行の
みの行または文字列(黒四角)が現れた場合に任意の領
域が終了する。前述のように@@は、文書構造情報の各
領域名(構成要素の名称)と同じものである。
【0057】図7の領域定義情報121に基づいた抽出
の例を、図8に示す第2の文書124の例で考えてみ
る。また、ここでは、図5に示したような文書構造情報
が省略されているが、階層構造、及び繰り返しを持たな
い「発明の名称」、「特許請求の範囲」、及び「発明の
詳細な説明」の各領域が、この順で並んでいる単純な文
書構造を仮定する。
【0058】文書抽出部113が図8の文書124を読
み込むと、最初に「1.発明の名称」という文字列を検
出し、その後改行のみの行を検出する。ここで、図7の
領域定義情報121から、@@に対応するのは「発明の
名称」であり、前記仮定した文書構造情報において文書
内で最初にあるべき領域「発明の名称」に合致するた
め、「1.発明の名称」〜改行のみの行の間にある文字
列「(改行)電子ファイル編集装置(改行)」を「発明
の名称」という領域名に関連付けて抽出する。以降同様
に抽出を繰り返すと、その後、以下のような文字列が各
領域名に関連付けて抽出される。
【0059】領域名:特許請求の範囲=「(改行)電子
ファイルの領域を指定するためのルールと、その領域を
レイアウトする情報を定義することにより、電子ファイ
ルを再構成し、編集する装置(改行)」、 領域名:発明の詳細な説明=「(改行)本発明は、複
数...(改行)は不定になる。」。
【0060】図9には、領域定義情報121の第3の例
が示されている。この例では、ある程度固定的な文字列
のパターンを有する文書124内の文字列に挟まれた領
域が抽出されるように定義されている。例えば、「1.
発明の名称」という文字列と、^$(改行のみの行)、
または(黒四角)との間の文字列は、発明名称という領
域名で抽出され、「2.特許請求の範囲」という文字列
と、^$または(黒四角)との間の文字列は、請求範囲
という領域名で抽出され、「3.発明の詳細な説明」と
いう文字列と、^$または(黒四角)との間の文字列
は、詳細説明という領域名で抽出される。ここで、^$
は改行のみの行を示している。
【0061】図4または図7に示した領域定義情報の例
では、文書中のパターンの中の一部分(@@に対応する
部分)が領域名に対応していたが、この第3の例では、
パターン毎に固定的に設定されている。また、この例で
も、文書構造情報が省略されているが、階層構造、及び
繰り返しを持たない「発明名称」、「請求範囲」、及び
「詳細説明」の各領域が、この順で並んでいる単純な文
書構造を仮定する。ここでは、各領域の名称が前記領域
定義情報121内の各抽出パターンに対応して設定され
ており、図8の説明で仮定した文書構造情報における領
域名とは異なっていることに注意すべきである。
【0062】図9の領域定義情報121を用いて、再び
図8の文書124からの抽出を行うと、文書抽出部11
3は最初に「1.発明の名称」という文字列を検出し、
その後改行のみの行を検出する。ここで、図9の領域定
義情報121から、対応する領域名は「発明名称」であ
り、前記仮定した文書構造情報において文書内で最初に
あるべき領域「発明名称」に合致するため、「1.発明
の名称」〜改行のみの行までの文字列「(改行)電子フ
ァイル編集装置(改行)」を「発明名称」という領域名
に関連付けて抽出する。以降同様に抽出を繰り返すと、
その後、以下のような文字列が各領域名に関連付けて抽
出される。
【0063】領域名:請求範囲=「(改行)電子ファイ
ルの領域を指定するためのルールと、その領域をレイア
ウトする情報を定義することにより、電子ファイルを再
構成し、編集する装置(改行)」、 領域名:詳細説明=「(改行)本発明は、複数...
(改行)は不定になる。」。
【0064】図2のステップS12で、文書抽出部11
3が文書124から抽出対象の領域を抽出する方法を以
上に示したが、文書抽出部113は、この抽出と共に、
抽出元の文書124のどこからどこまでの領域を抽出し
たかを対応づける情報を、記憶装置120内の領域−文
書構造対応情報123に出力する。図10は、前記領域
−文書構造対応情報123の内容の一例を示す図であ
る。
【0065】領域−文書構造対応情報123は、前記文
書構造情報における領域名毎に、その領域が抽出元の文
書124のどの位置に対応するかを示す抽出元文書情報
を有している。ここで、図5に示す文書構造情報を有す
る文書124を仮定すると、「見出し」に対応する抽出
元文書情報は、「”C:¥文書¥source−1.
c”, From(2,10), To(2,20)」
であり、これは、抽出元の文書が、記憶装置120内の
Cドライブ内の「文書」というディレクトリ内の「so
urce−1.c」というファイルであり、抽出された
「見出し」の領域をその文書の2行目の10カラム〜2
行目の20カラムの位置から抽出したということを示し
ている。他の領域も同様であるが、図10では、処理仕
様及びインタフェースに繰り返しがあり、領域名におい
ては、それぞれ繰り返し要素が括弧内に表されている。
また、その繰り返し要素と階層関係(包含関係)を表す
ために、前記領域名は、例えば「処理仕様(2).イン
タフェース(1)」といった連結された表記となってい
る。
【0066】この例では、抽出された領域の抽出元の文
書124における位置を、各領域の開始行とカラム、及
び終了行とカラムを保持することによって記憶するよう
にしているが、各領域名、即ち検索パターン毎の抽出順
(この場合は、書き戻す際に、文書124に対して前記
文書抽出部113による抽出処理と同様のパターン検索
処理が必要)や、抽出元の文書124における開始アド
レス位置と抽出された領域のサイズを保持することによ
って、前記抽出された領域の抽出元の文書124におけ
る位置を記憶してもよい。
【0067】こうして、抽出された各領域の抽出元の文
書124における位置が記憶されることによって、即
ち、領域−文書構造対応情報123を保持することによ
って、前記文書抽出部113によって抽出された領域
が、抽出元の文書124と独立して編集された場合で
も、文書124内の抽出されていない他の領域との整合
性を保ちつつ、前記抽出され編集された領域を文書12
4に反映することが可能となる。
【0068】再び図2のステップS13に戻ると、ここ
では前記文書再構成部114が、前記文書抽出部113
が文書124から抽出した領域の情報を読み込み、文書
構造・レイアウト情報122に基づいて、表示装置14
0上に、それらの領域の情報を再構成して表示する。
【0069】図11に文書構造・レイアウト情報122
の例を示す。この文書構造・レイアウト情報122は、
図5に示した概念的な文書構造情報と、前記再構成のた
めに使用されるレイアウト情報を同時に定義するための
方法を示したものである。前述したように、文書構造情
報とレイアウト情報は、個別に定義されていても良い。
【0070】この例では、マイクロソフト社のワープロ
Wordを使用して、各領域に関して、その領域の表示
位置、フォント・スタイル、フォント・サイズ、文字列
の配置、及び文字色等のレイアウト情報と、領域名、包
含関係、繰り返しの有無、及び省略の可否を示す文書構
造情報を定義し、その他囲み線や区切り線などのワープ
ロによる修飾を付加している。これらの情報のうち、フ
ォント・スタイル、フォント・サイズ、文字列の配置、
及び文字色等のレイアウト情報と、領域名、繰り返しの
有無、及び省略の可否を示す文書構造情報は、各領域毎
にWordのブックマークの機能を利用して設定してい
る。
【0071】しかし、このように、各領域に対して、レ
イアウト情報及び文書構造情報を定義可能であり、その
情報をコンピュータによって制御(入出力を含む)でき
れば、他のどのような手段を用いても構わない。また、
マイクロソフト社のWordを用いた本発明の例は、単
に例示のためのものに過ぎず、こうした具体的な手段の
みに制限されるものではない。
【0072】図11に示す文書構造・レイアウト情報1
22は、まず可視部分と不可視部分に大別される。可視
部分は更に、ユーザによる編集が禁止される固定部分
と、抽出された領域が表示される、ユーザによる編集が
可能な編集部分に分類される。区切り線326、固定タ
イトル327、328、329、及び32A、及び各領
域を囲む囲み線は固定部分である。領域310、32
1、322、323、324、及び325は、それぞれ
見出し、関数名、処理概要、呼出形式、インタフェー
ス、及び注意の各領域名称に対応する編集部分である。
【0073】前述のように、文書抽出部113は、前記
文書124から抽出した領域をそれぞれ見出しや関数名
といった領域名と関連付けて、抽出された領域の情報と
して出力する。前記文書再構成部114は、文書抽出部
113から受け取った抽出された領域の情報を、対応す
る領域名を有する図11に示された領域の位置に出力す
る。この領域は、ユーザによる編集が可能で、前記編集
制御部115によって、表示された内容の削除、変更、
追加を行うことができる。前記編集制御部115は、そ
の他の領域のユーザによる編集を禁止する。所定の領域
のみ編集を有効にすることは、従来のワープロの機能を
使用して容易に達成することができるが、特別なアプリ
ケーションを用意して、ワープロ上に組み込むこともで
きるし、全く独立した別のアプリケーションとして作成
することもできる。
【0074】不可視部分には、上位階層の領域である処
理仕様に対応する領域320と、各領域に関してレイア
ウト情報、及び文書構造情報を定義する定義部分33
0、331、332、333、334、335、及び3
36がある(この定義内容は、Wordのブックマーク
機能によって設定されている)。領域320は、図5の
文書構造情報に示す処理仕様220に対応するものであ
り、前記編集領域321、322、323、324、及
び325の集合を含むように示されている。このことに
よって、前記各領域320及び321〜325の階層構
造(包含関係)が分かり、これも1つの文書構造情報で
ある。この領域320の定義をしているのが定義部分3
36である。ここでは、この領域320が処理仕様とい
う領域名称を有し、繰り返し有りであることが定義され
ている。領域320が、各領域321から325を包含
しているということは、各領域321から325を全て
含むように領域320が設定されていることで示されて
いる。
【0075】その他の定義部分330、331、33
2、333、334、及び335は、それぞれ編集領域
310、321、322、323、324、及び325
に関するものであり、表示される編集対象の文字列に関
するレイアウト情報及び文章構造情報を含んでいる。
【0076】例えば、定義部分330領域310に対応
し、表示される文字列のフォント・スタイルは明朝体、
フォント・サイズは22ポイント、文字修飾はBOLD
(太字)とし、文字列の配置は中央揃え(センタリン
グ)、色は黒で、対応する領域310の領域名称が「見
出し」であることを示している。
【0077】また、領域324に対応する定義部分33
4は、領域324の領域名称がインタフェースであり、
繰り返し有りであることを示している。領域325に対
応する定義部分335は、領域325の領域名称が注意
であり、省略可であることを示している。
【0078】文書再構成部114が、このようにして文
書抽出部113から抽出された領域の情報を再構成して
表示画面140上に表示した表示例400を図12に示
す。図12の表示例400は、図6に示した文書124
を、図4に示す領域定義情報121、及び図11に示す
文書情報・レイアウト情報122に基づいて抽出し、再
構成し、表示したものである(但し、図6の文書124
では、見出し「Aプロジェクト−関数定義仕様書」は省
略してある)。
【0079】この表示例400では、1つの文書から複
数の領域が抽出された場合を示している。複数の文書か
ら領域が抽出された場合は、この表示の下に追加される
か、または別のウインドウ内の表示として提供される。
このことによって、ユーザは、例えば、複数のプログラ
ムの仕様書の処理概要や呼出形式等の内容を同じ様式で
一覧表示させる事ができる。
【0080】図3には、文書編集結果反映部116によ
る文書編集結果反映処理の流れが示されている。図3
は、左1/3の欄が再構成処理及びユーザの編集により
作成された情報を示し、中央1/3の欄が文書編集結果
反映処理の流れを示し、右1/3の欄がユーザが予め定
義した情報を示している。
【0081】ユーザが編集結果を抽出元の文書124に
反映させるよう指示すると、図3の最初のステップS2
0において、文書編集結果反映部116が文書構造情報
・レイアウト情報122を読み込む。これは、各編集領
域の領域名等を取得するためであり、この実施の形態で
は、前述のように文書構造情報・レイアウト情報122
の保存及び編集にWordの機能が使用されているた
め、Wordの関係ファイルまたはメモリから読み込ま
れる。
【0082】次に、ステップS21において、文書編集
結果反映部116は、文書抽出部113によって出力さ
れた領域−文書構造対応情報123を読み込み、ユーザ
によって編集された表示装置140上の各領域の内容
を、抽出元の文書124のどの位置に反映させるかを判
定する。
【0083】次に、ステップS22において、文書編集
結果反映部116は、ユーザによって編集された表示装
置140上の各領域の内容を、抽出元の文書124の対
応する位置に反映させる。ユーザが表示装置140上の
ある領域に対して任意の文字数だけ削除を行った場合
は、その領域を抽出元の文書124に反映させた時にそ
の領域の最終位置となるアドレスAが、領域−文書構造
対応情報123に保持されているその領域の抽出時にお
ける最終位置のアドレスBより小さいので、その領域を
抽出元の文書124に反映させた後、両者のアドレスの
差だけ、抽出元の文書124のアドレスB以降の内容を
アドレスAの後に移動させる必要がある。
【0084】ユーザが表示装置140上のある領域に対
して任意の文字数だけ追加を行った場合は、その領域を
抽出元の文書124に反映させた時にその領域の最終位
置となるアドレスAが、領域−文書構造対応情報123
に保持されているその領域の抽出時における最終位置の
アドレスBより大きいので、その領域を抽出元の文書1
24に反映させる前に、両者のアドレスの差だけ、抽出
元の文書124のアドレスB以降の内容をアドレスAの
後に移動させておく必要がある。
【0085】ユーザが表示装置140上のある領域に対
して編集を行わなかったかまたは、編集を行ったものの
結果的に文字数に変動がなかった場合は、その領域を抽
出元の文書124に反映させた時にその領域の最終位置
となるアドレスAと、領域−文書構造対応情報123に
保持されているその領域の抽出時における最終位置のア
ドレスBは等しいので、その領域を抽出元の文書124
の元の位置に反映させるだけでよい。
【0086】前記アドレスAやアドレスBは、図10に
例示した領域−文書構造対応情報123に示すように、
文書124における行とカラムで把握することができる
が、文書124の先頭からの論理アドレスとして把握す
る事も可能である。
【0087】次に、図13から図20を参照して、本発
明の文書編集システムの一連の操作をより具体的に説明
する。また、領域定義情報121は図4に示したもの、
文書構成・レイアウト情報122は図11に示したもの
が使用される。
【0088】図13には、抽出元の文書124の読み込
みを指定する画面410が示されている。このように、
本発明の文書編集システムは、例えばマイクロソフト社
のワープロWordなどに本発明の独自の機能を組み込
むことによって達成することができるが、新たに作成し
てもよく、また任意の方法で既存のアプリケーションと
組み合わせて実現することも可能である。
【0089】画面の表示例410のメニューで「表示
(V)」をマウスのクリックやキーボド等によって選択
すると、図示するようなサブメニュー411が表示され
る。そこで、このサブメニュー411から「抽出ファイ
ル指定(S)」を選択すると、図14に示すような抽出
元の文書124を選択する画面421が表示される。
【0090】図14は、抽出元の文書124を選択する
画面421を示している。画面421は画面420から
のポップアップ・ウインドウとして表示される。この例
では、Title.txt(422)、ZaikoHi
kiate.c(423)、及びZaikoKousi
n.c(424)の3ファイルが選択されている。これ
らのファイルはいずれもテキスト・ファイルである。本
発明が抽出元の文書124に関して文字列のパターン検
索を行い、抽出結果の編集を可能にするシステムである
ことから、ここでテキスト情報を有しないバイナリ・フ
ァイルなどを指定することに意味はない。この画面42
1で抽出の対象となる抽出元の文書124を選択した後
「開く(O)」ボタンを選択すると、図15に示すよう
に、選択された抽出元の文書124の内容を表示する画
面430が表示される。
【0091】図15は、選択された抽出元の文書124
の内容を表示する画面430を示している。指定された
文書124の内容がそれぞれ1つのウインドウ内に表示
されている。ウインドウ431には、ZaikoKou
sin.cの内容が、ウインドウ432には、Zaik
oHikiate.cの内容が、ウインドウ433には
Title.txtの内容がそれぞれ表示されている。
【0092】図16は、図15の状態から再構成処理を
指示する画面440を示している。画面440のメニュ
ーで「表示(V)」を選択すると、図示するようなサブ
メニュー444が表示される。そこで、このサブメニュ
ー444から「ソース→仕様(S)」を選択すると、選
択された全ての文書124に関して再構成処理が開始さ
れる。設計によっては、図15の内容表示画面を省略す
ることも可能である。
【0093】図17は、図16で再構成の指定がされた
場合に、再構成結果を表示する画面450を示してい
る。画面450の再構成結果は1ウインドウとして表示
され、抽出元の文書124の区切りはページ区切りで表
される。例えば、ZaikoHikiate.cから抽
出され再構成された内容は、領域451に示され、Za
ikoKousin.cから抽出され再構成された内容
は、領域452に示されている。このように、抽出元の
文書124の区切りをページ区切りによって表すのに代
えて、抽出元の文書124毎に別のウインドウで表示す
るような態様も可能である。この画面450において
は、図11に示す領域310、321、322、32
3、324、及び325に対応する部分に関して、ユー
ザはワープロと同様の方法で自由に編集作業を行うこと
ができ、それ以外の領域にはカーソルが移動せず、ユー
ザによる編集ができないように制御されている。
【0094】図18は、図17で示された再構成結果の
表示画面450において、ZaikoHikiate.
cから抽出され再構成された内容を編集している画面4
60を示している。ここでの編集は、処理概要に関する
記述内容を付加するものである。ユーザの編集によって
加えられた部分461は、それが再構成された後に編集
されたものであることを明示するために、この例のよう
に反転表示されているのが望ましい。
【0095】図19は、編集結果を抽出元の文書124
に反映させる指示を行う画面470を示している。画面
470のメニューで「表示(V)」を選択すると、図示
するようなサブメニュー472が表示される。そこで、
このサブメニュー472から「仕様→ソース(D)」を
選択すると、元の文書124に対してその編集結果が反
映される。この例では、抽出元の文書ZaikoHik
iate.cに対して、実質的に内容が追加された部分
(反転領域471)が反映される。
【0096】図20は、編集結果が反映された抽出元の
文書124の内容を示す画面480を示している。図1
9に示す画面470の操作で編集結果が反映された文書
ZaikoHikiate.cを再び表示させてみる
と、ウインドウ481に示すように、処理概要の内容
に、「その際...チェックする。」という文が追加さ
れている。また、図3のステップS22において、文書
編集結果反映部116が、ユーザによる編集結果を抽出
元の文書124に反映させた時に、その編集された部分
が最終的に抽出元の文書124のどの位置に反映された
かを記憶しておけば、ウインドウ481に示すように、
ユーザによって追加等された領域を反転表示させること
も可能である。
【0097】図21は、上述した文書編集システム10
0を構築するために使用されるコンピュータ600のハ
ードウエア構成の一例を示している。該コンピュータ6
00は、それぞれバス680に接続されたCPU61
0、記憶部620、メモリ部630、表示部640、入
力部650、印刷部660、及びネットワーク・インタ
フェース部670からなる。
【0098】CPU610は、図1の文書編集システム
100の処理装置110に対応し、領域定義情報登録部
111、文書構造・レイアウト情報登録部112、文書
抽出部113、文書再構成部114、文書編集制御部1
15、及び文書編集結果反映部116の各部分を実行す
る。
【0099】記憶部620は、図1の文書編集システム
100の記憶装置120に対応し、CPU610によっ
て実行される前記各機能を実現するプログラム、及び領
域定義情報121、文書構造・レイアウト情報122、
領域−文書構造対応情報123、及び複数の抽出元とな
る文書124を格納するメモリ部630には、CPU6
10によって実行される前記各部分を実現するプログラ
ムがロードされ、また必要に応じてユーザの編集内容な
どを含む表示部640に表示されている内容や、記憶部
620内の各種情報の内容がロードされる。
【0100】表示部640は、図1の文書編集システム
100の表示装置140に対応し、再構成結果を表示
し、それをユーザが編集する際に必要とされ、通常はC
RTやLCD等のディスプレイ装置である。
【0101】入力部650は、図1の文書編集システム
100の入力装置130に対応し、前記表示部640に
表示された画面に沿って入力や指示を行うために使用さ
れる装置であり、通常キーボード、マウス等から成る入
力装置やタッチパネル、音声入力装置等で構成される。
【0102】印刷部660は、ユーザ等の指示に従っ
て、前記記憶部620またはメモリ部630に格納され
ているデータ等を印刷する、レーザプリンタ等の印刷装
置である。前記印刷部660は、前記文書編集システム
100の実施に関して必須の構成要件ではない。
【0103】ネットワーク・インタフェース部670
は、主に、リモートにある記憶部620との接続、また
は他のCPUとの接続を実現するよう機能する。前記文
書編集システム100を単一のコンピュータで実施する
場合には必要とされない。
【0104】バス680は、前記各構成要素610〜6
70間でデータ、指令等の送受信を行うための共通伝送
経路である。
【0105】
【発明の効果】本発明の文書編集システムによれば、汎
用的な開始パターン及び終了パターンからなる一対のパ
ターンと、文書の構造を定義する文書構造情報を用い
て、複数の文書から前記開始パターンに該当する個所と
終了パターンに該当する個所との間の領域がそれぞれ抽
出され、その抽出結果が、前記文書構造情報とレイアウ
ト情報に従って集約して再構成され、ユーザが編集可能
な状態で表示される。この結果、複数の文書の情報を、
ユーザが最も見やすいレイアウトで表示させたまま編集
作業を行うことができ、複数の文書から必要な領域を検
索して直接編集作業を行うことに比べて格段に編集作業
が効率化された。
【0106】また、抽出対象を文字列の一致などではな
く、抽出領域の開始、終了を示す文字列パターンを用い
て指定することにより、複数の文を含む広い領域を指定
することができる。文字列の一致などの方法では、抽出
元の文書を少し変えただけでも抽出結果が大きく変化す
るのに対し、本発明のシステムでは開始や終了パターン
に該当する部分が変更されない限り、抽出される領域自
体に変化はない。この結果、常にユーザの意図した抽出
結果を得ることができ、安定した再構成結果を表示させ
ることができる。
【0107】更に本発明によって、編集可能な状態で再
構成され表示された領域がユーザに編集された後、その
編集された領域が抽出元の文書に、その文書の他の領域
と矛盾することなく書き戻される。
【0108】また更に本発明によって、前記文書構造情
報と前記レイアウト情報が一体として登録、保持され、
前記文書構造情報には前記文書内の各領域の領域名、階
層構造(包含関係)、出現順序、繰り返しの有無、及び
省略の可否などの文書構造に関する情報が含まれ、前記
レイアウト情報には、前記各領域の表示位置、フォント
・スタイル、フォント・サイズ、文字列の配置、及び文
字色等のレイアウト情報が含まれる。従来は両方の前記
情報を突き合わせながら、両者が矛盾しないように注意
深く作成していたが、本発明により、両者を矛盾なく一
体化して容易に作成できるようになった。
【図面の簡単な説明】
【図1】本発明の文書編集システムの一実施の形態のシ
ステム構成を示すブロック図である。
【図2】文書抽出及び再構成処理の流れを示す図であ
る。
【図3】文書編集結果反映処理の流れを示す図である。
【図4】領域定義情報の例を示す図である。
【図5】文書構造情報の例を概念的に示す図である。
【図6】抽出元の文書の例を示す図である。
【図7】領域定義情報の第2の例を示す図である。
【図8】抽出元の文書の第2の例を示す図である。
【図9】領域定義情報の第3の例を示す図である。
【図10】領域−文書構造対応情報の例を示す図であ
る。
【図11】文書構造・レイアウト情報の例を示す図であ
る。
【図12】再構成結果の表示例を示す図である。
【図13】抽出元の文書の読み込みを指定する画面の例
を示す図である。
【図14】抽出元の文書を選択する画面の例を示す図で
ある。
【図15】選択された抽出元の文書の内容を表示する画
面の例を示す図である。
【図16】再構成処理を指示する画面の例を示す図であ
る。
【図17】再構成結果を表示する画面の例を示す図であ
る。
【図18】表示された再構成結果に対して編集を行った
画面の例を示す図である。
【図19】編集結果を抽出元の文書に出力するよう指示
する画面の例を示す図である。
【図20】編集結果が反映された抽出元の文書の内容を
示す画面の例を示す図である。
【図21】文書編集システムを実行するコンピュータの
ハードウエア構成を示す図である。
【符号の説明】
100 文書編集システム 110 処理装置 111 領域定義情報登録部 112 文書構造・レイアウト情報登録部 113 文書抽出部 114 文書再構成部 115 文書編集制御部 116 文書編集結果反映部 120 記憶装置 121 領域定義情報 122 文書構造・レイアウト情報 123 領域−文書構造対応情報 124 文書 130 入力装置 140 表示装置

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも1つの文書から任意の領域を
    抽出して、該抽出された領域を編集可能な状態で表示す
    る文書編集システムであって、 各文書から所望の領域を抽出するために使用される領域
    定義情報をパターンとして登録する領域定義情報登録手
    段と、 各文書内の領域の構造に関する文書構造情報、及び該各
    領域を再構成するために使用されるレイアウト情報を登
    録する文書構造・レイアウト情報登録手段と、 該記領域定義登録手段によって登録された領域定義情報
    と、該文書構造・レイアウト情報登録手段によって登録
    された文書構造情報を使用して領域を抽出する文書抽出
    手段と、 該文書構造・レイアウト情報登録手段によって登録され
    た該文書構造情報及び該レイアウト情報を使用して、該
    抽出された少なくとも1つの領域を再構成して表示する
    文書再構成手段と、 を有することを特徴とする文書編集システム。
  2. 【請求項2】 前記再構成して表示された少なくとも1
    つの領域を編集できるように制御する文書編集制御手段
    を有すること、 を特徴とする請求項1に記載の文書編集システム。
  3. 【請求項3】 前記文書編集制御手段が更に、前記再構
    成して表示された少なくとも1つの領域に関する編集機
    能を、前記文書から抽出された領域の内容のみに制限す
    るよう制御すること、 を特徴とする請求項2に記載の文書編集システム。
  4. 【請求項4】 前記抽出された少なくとも1つの領域が
    編集された場合、その編集結果を該領域の抽出元の文書
    に反映させる文書編集結果反映手段を有すること、 を特徴とする請求項2に記載の文書編集システム。
  5. 【請求項5】 前記領域定義情報登録手段によって登録
    される領域定義情報が、前記所望の領域の直前の箇所を
    特定する第1のパターンを含み、 前記文書構造・レイアウト情報登録手段によって登録さ
    れる文書構造情報が、文書内の各領域の領域名、階層構
    造、出現順序、繰り返しの有無、及び省略の可否に関す
    る情報を含み、 前記文書抽出手段が、文書内のある箇所が該領域定義情
    報から得られる該第1のパターンに該当し、かつその箇
    所に対応する領域名が該文書構造情報から得られる同じ
    領域名の出現条件を満たす場合に、その箇所を領域の開
    始箇所と判定し、該第1のパターンと同じかまたは異な
    るパターンに該当する箇所であって、前記開始箇所とそ
    の箇所との間に任意のパターンに該当する個所がない場
    合に、その箇所を領域の終了箇所と判定し、該開始箇所
    と該終了箇所との間の領域を、該文書構造情報から得ら
    れる該領域名に対応付けて抽出すること、 を特徴とする請求項1に記載の文書編集システム。
  6. 【請求項6】 前記領域定義情報登録手段によって登録
    される領域定義情報が第1のパターンと第2のパターン
    から成る1対のパターンを含み、該第1のパターンは前
    記所望の領域の直前の箇所を特定し、該第2のパターン
    は所望の領域の直後の箇所を特定し、 前記文書構造・レイアウト情報登録手段によって登録さ
    れる文書構造情報が、文書内の各領域の領域名、階層構
    造、出現順序、及び繰り返しの有無、省略の可否に関す
    る情報を含み、 前記文書抽出手段が、文書内のある箇所が該領域定義情
    報から得られる該第1のパターンに該当し、かつその箇
    所に対応する領域名が該文書構造情報から得られる同じ
    領域名の出現条件を満たす場合に、その箇所を前記第1
    の箇所と判定し、該第1の個所以降で、該第2のパター
    ンに該当する箇所であって、該第1の箇所とその箇所と
    の間に任意のパターンに該当する個所がない場合に、そ
    の箇所を前記第2の箇所と判定し、該第1の箇所と該第
    2の箇所との間の領域を、該文書構造情報から得られる
    該領域名に対応付けて抽出すること、 を特徴とする請求項1に記載の文書編集システム。
  7. 【請求項7】 前記領域定義情報登録手段によって登録
    される領域定義情報が領域の開始の文字列のパターンと
    領域の終了の文字列のパターンの組を単数または複数含
    み、 前記文書構造・レイアウト情報登録手段によって登録さ
    れる文書構造情報が、文書内の各領域の領域名、階層構
    造、出現順序、繰り返しの有無、及び省略の可否に関す
    る情報を含み、 前記文書抽出手段が、文書内のある箇所が該領域定義情
    報から得られる該開始の文字列のパターンに該当し、か
    つその箇所に対応する領域名が該文書構造情報から得ら
    れる同じ領域名の出現条件を満たす場合に、その箇所を
    領域の開始箇所と判定し、該終了の文字列のパターンに
    該当する箇所であって、前記開始箇所とその箇所との間
    に任意のパターンに該当する個所がない場合に、その箇
    所を領域の終了箇所と判定し、該開始箇所と該終了箇所
    との間の領域を、該文書構造情報から得られる該領域名
    に対応付けて抽出すること、 を特徴とする請求項1に記載の文書編集システム。
  8. 【請求項8】 前記パターンが、固定的な文字列と、任
    意の数の任意の文字との組み合わせで定義されること、 を特徴とする請求項5ないし7に記載の文書編集システ
    ム。
  9. 【請求項9】 前記各文書内の領域の構造に関する前記
    文書構造情報、及び該各領域を再構成するために使用さ
    れる前記レイアウト情報が、前記文書構造・レイアウト
    情報登録手段によって一体的に登録されること、 を特徴とする請求項1に記載の文書編集システム。
  10. 【請求項10】 少なくとも1つの文書から任意の領域
    を抽出して、該抽出された領域を編集可能な状態で表示
    する文書編集方法において、 各文書から所望の領域を抽出するために使用される領域
    定義情報をパターンとして登録する領域定義情報登録ス
    テップと、 各文書内の領域の構造に関する文書構造情報、及び該各
    領域を再構成するために使用されるレイアウト情報を登
    録する文書構造・レイアウト情報登録ステップと、 該記領域定義登録手段によって登録された領域定義情報
    と、該文書構造・レイアウト情報登録手段によって登録
    された文書構造情報を使用して第1の箇所と第2の箇所
    を検索し、該2つの箇所の間にある領域を抽出する文書
    抽出ステップと、 該文書構造・レイアウト情報登録手段によって登録され
    た該文書構造情報及び該レイアウト情報を使用して、該
    抽出された少なくとも1つの領域を再構成して表示する
    文書再構成ステップと、 を有することを特徴とする文書編集方法。
  11. 【請求項11】 少なくとも1つの文書から任意の領域
    を抽出して、該抽出された領域を編集可能な状態で表示
    する文書編集方法を実現するプログラムを記録した記録
    媒体であって、 各文書から所望の領域を抽出するために使用される領域
    定義情報をパターンとして登録する領域定義情報登録ス
    テップと、 各文書内の領域の構造に関する文書構造情報、及び該各
    領域を再構成するために使用されるレイアウト情報を登
    録する文書構造・レイアウト情報登録ステップと、 該記領域定義登録手段によって登録された領域定義情報
    と、該文書構造・レイアウト情報登録手段によって登録
    された文書構造情報を使用して第1の箇所と第2の箇所
    を検索し、該2つの箇所の間にある領域を抽出する文書
    抽出ステップと、 該文書構造・レイアウト情報登録手段によって登録され
    た該文書構造情報及び該レイアウト情報を使用して、該
    抽出された少なくとも1つの領域を再構成して表示する
    文書再構成ステップを、 コンピュータに実行させるプログラムを記録した該コン
    ピュータが読み取り可能な記録媒体。
  12. 【請求項12】 前記コンピュータが読み取り可能な記
    録媒体に記憶された、前記文書編集方法を実現するプロ
    グラムが、前記抽出された少なくとも1つの領域が編集
    された場合、その編集結果を該領域の抽出元の文書に反
    映させる文書編集結果反映ステップを有すること、 を特徴とする請求項11に記載の記録媒体。
JP07272798A 1998-03-20 1998-03-20 文書編集システム、方法、及び記録媒体 Expired - Fee Related JP3737629B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07272798A JP3737629B2 (ja) 1998-03-20 1998-03-20 文書編集システム、方法、及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07272798A JP3737629B2 (ja) 1998-03-20 1998-03-20 文書編集システム、方法、及び記録媒体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2005291620A Division JP2006059378A (ja) 2005-10-04 2005-10-04 文書編集方法及び記録媒体

Publications (2)

Publication Number Publication Date
JPH11272666A true JPH11272666A (ja) 1999-10-08
JP3737629B2 JP3737629B2 (ja) 2006-01-18

Family

ID=13497689

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07272798A Expired - Fee Related JP3737629B2 (ja) 1998-03-20 1998-03-20 文書編集システム、方法、及び記録媒体

Country Status (1)

Country Link
JP (1) JP3737629B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100359309B1 (ko) * 2000-10-20 2002-10-31 아이원더넷 주식회사 반복 그래픽 패턴에 대한 메모리 활용 방법
US7269791B2 (en) 2000-10-31 2007-09-11 Fujitsu Limited Recording medium storing document constructing program
JP2019010861A (ja) * 2017-06-29 2019-01-24 株式会社寺岡精工 編集装置及び印刷装置
WO2023045920A1 (zh) * 2021-09-24 2023-03-30 维沃移动通信有限公司 文本显示方法和文本显示装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100359309B1 (ko) * 2000-10-20 2002-10-31 아이원더넷 주식회사 반복 그래픽 패턴에 대한 메모리 활용 방법
US7269791B2 (en) 2000-10-31 2007-09-11 Fujitsu Limited Recording medium storing document constructing program
JP2019010861A (ja) * 2017-06-29 2019-01-24 株式会社寺岡精工 編集装置及び印刷装置
WO2023045920A1 (zh) * 2021-09-24 2023-03-30 维沃移动通信有限公司 文本显示方法和文本显示装置

Also Published As

Publication number Publication date
JP3737629B2 (ja) 2006-01-18

Similar Documents

Publication Publication Date Title
JP4907715B2 (ja) テキストドキュメント及びイメージドキュメントを同期化、ディスプレイ、及び操作するための方法及び装置
CA2036859C (en) System and method for editing a structured document to modify emphasis characteristics
US7836043B2 (en) Database system and method for data acquisition and perusal
US6014663A (en) System, method, and computer program product for comparing text portions by reference to index information
US5146552A (en) Method for associating annotation with electronically published material
US5623679A (en) System and method for creating and manipulating notes each containing multiple sub-notes, and linking the sub-notes to portions of data objects
AU2005225130B2 (en) Management and use of data in a computer-generated document
US6442576B1 (en) Searching for documents with multiple element types
US5982365A (en) System and methods for interactively generating and testing help systems
JPH07239850A (ja) 構造化文書作成支援システム
US5907851A (en) Editing nested documents by appointing a portion for insertion with an alternative substitute
JP3737629B2 (ja) 文書編集システム、方法、及び記録媒体
JPH08221417A (ja) 構造化文書の新旧対照編集装置
JP3454987B2 (ja) 文書編集装置及び方法
JP3712320B2 (ja) 可変文書作成システム、可変文書出力装置及び可変原稿作成装置
Chen et al. Automating index preparation
US7613709B2 (en) System and method for editing operations of a text object model
JP2006059378A (ja) 文書編集方法及び記録媒体
JP2000081999A (ja) 文書出力システム
JPH06242935A (ja) 操作手順書作成システム
JPH05334291A (ja) 文書処理装置
JPS6389979A (ja) 論理図概要記述変換処理方式
JPH08194706A (ja) 構造化文章作成装置
JPH0785006A (ja) 情報検索方法及びその装置
Klemperer Pro-Cite for the Macintosh

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040518

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040720

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051004

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20051013

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051025

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051027

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081104

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091104

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees