JPH10116284A - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPH10116284A
JPH10116284A JP8270110A JP27011096A JPH10116284A JP H10116284 A JPH10116284 A JP H10116284A JP 8270110 A JP8270110 A JP 8270110A JP 27011096 A JP27011096 A JP 27011096A JP H10116284 A JPH10116284 A JP H10116284A
Authority
JP
Japan
Prior art keywords
document
main
supplementary
file
plus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8270110A
Other languages
English (en)
Inventor
Koji Kusumoto
浩二 楠本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP8270110A priority Critical patent/JPH10116284A/ja
Publication of JPH10116284A publication Critical patent/JPH10116284A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 SGML文書等の構造化文書の処理に際し、
元の文書の文書型定義に対する適合性を損なわずにアプ
リケーションを実行可能にする。 【解決手段】 主文書ファイルから目次構造を作成する
場合、主文書plus作成部4は、主文書ファイルの目次要
素に要素識別子を付与した主文書plus20を生成し、補
文書作成部5は主文書ファイルから目次構造を抽出し要
素識別子を付与した目次補文書30を作成する。文書pl
us/補文書出力処理部7は、主文書plus20と次補文書
30とに文書識別子を付与し主文書plusファイルと補文
書ファイルとして生成文書ファイル記憶部8に記憶させ
る。文書アプリケーション11から主文書に対する目次
作成操作要求があると、ファイル入力部10により主文
書の代わりに主文書plus20と目次補文書30が読み込
まれ、これらが内部で結合されて目次を含んだ文書が生
成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、SGML(Standa
rd Generalized Markup Language)文書等の任意の文書
型の構造化文書とその文書型定義とを入力して処理する
文書処理装置に係わり、詳しくは、上記構造化文書をそ
の文書型定義を逸脱するような構造変換操作が要求され
た場合にも元の文書構造及び文書型定義を変更すること
なく上記要求された構造変換を実現するための文書構造
編成処理の改良に関する。
【0002】
【従来の技術】周知のように、SGML文書等の任意の
文書型の構造化文書を扱う文書処理装置では、上記構造
化文書を例えば画面出力したり印刷出力したりあるいは
編集する際に、当該対象文書に対し、目次、索引、参考
文献等を自動的に付与したいといった場合も少なくな
い。
【0003】かかる要求に対し、対象となる構造化文書
の操作(目次、索引、参考文献を自動的に付与するため
の文書操作)を実現した装置としては、ODA文書を対
象として上記文書構造操作を行う特開平6−25942
1号公報が知られている。また、実際の製品としては、
富士ゼロックス社製のAkaneの文書操作ツールキットが
ある。また、SGML文書を対象として文書構造操作を
行う製品としては、ドイツOvidius社のMetaMorphosisが
知られている。
【0004】上記従来装置での文書操作には、共通し
て、文書要素の生成/削除/置換機能が提供されてい
る。更に、文書がテキスト形式である場合には、SED
やAWKプログラムも併用する点も開示されている。
【0005】上記従来装置では、入力された文書に文書
構造操作を施し、その操作結果を同じ形式の文書ファイ
ルとして保存するようにしている。これにより、操作前
と操作後では文書が持つ情報や構造は変化することにな
る。
【0006】
【発明が解決しようとする課題】ところで、この種の装
置の処理対象である構造化文書は、当該構造化文書の構
造を定義した文書型定義に従っていなければならない。
例えば、SGML文書を処理するアプリケーションで
は、必ず、DTD(Document Type Definition)の範囲
内で文書構造操作を実行しなければならない。
【0007】これに対して、上記従来装置では、入力さ
れた構造化文書に対する文書操作の前と後では文書構造
が変化することが前提となっていることから、例えばS
GML文書を扱う場合に、当該SGML文書がDTDに
従っていなければならないという制約に絡んで以下のよ
うな種々の問題点が生じることになった。
【0008】・操作の要求に対して、結果として、DT
Dの範囲を逸脱するような構造を作成する場合は、文書
構造に適応するように、DTDの変更が必要となる。D
TDの変更は文書操作毎に生じる可能性があり、非現実
的である。
【0009】・ISOのような公に登録されたDTDで
ある場合は、DTDの変更が許されない。DTDを無視
して操作をしても変更後の文書の流通ができないことか
ら、SGML文書としての存在価値は低下する。
【0010】・構造を変化させずに文書操作を実行しよ
うとすると、ある要素に異なる意味の要素内容を取り込
むことになり、その結果、文書の論理構造を歪ませてし
まうことになる。
【0011】そこで、本発明の目的は、構造化文書とそ
の文書型定義とを入力し、上記文書に目次や索引等を自
動的に付与する文書処理を行う際に、上記文書型定義に
不適合な文書を生成することを要求する場合でも、元の
文書の文書型定義に対する適合性を損なわずにアプリケ
ーションを実行可能とする文書処理装置を提供すること
にある。
【0012】
【課題を解決するための手段】第1の発明は、構造化文
書とその文書型定義とを入力し、前記構造化文書を対象
に所望の項目要素を付与する処理を行う文書処理装置に
おいて、文書構造変換プログラムを実行することにより
前記対象文書の項目要素の生成/削除/置換に関する文
書構造編成処理を行う文書構造操作手段と、前記文書構
造編成時、必要に応じて前記対象文書の項目要素に対し
要素識別子を付与することにより前記対象文書の主文書
と置換可能な置換主文書を生成する置換主文書生成手段
と、前記文書構造編成時、必要に応じて前記対象文書か
ら前記項目要素のみを抽出し該項目要素に要素識別子を
付与した補文書を生成する補文書生成手段と、前記置換
主文書及び前記補文書に各々対応する文書識別子を付与
することにより置換主文書ファイル及び補文書ファイル
として出力する出力処理手段と、前記文書構造編成時に
前記項目要素に付与する要素識別子を生成する要素識別
子生成手段と、前記ファイル出力時に前記置換主文書及
び前記補文書に付与する文書識別子を生成する文書識別
子生成手段と、前記主文書、前記置換主文書、前記補文
書に付与する文書識別子の生成ルールを定めた文書識別
子管理データを記憶する文書識別子管理データ記憶手段
とを具備することを特徴とする。
【0013】第2の発明は、第1の発明において、出力
処理手段から出力された前記置換主文書ファイル及び補
文書ファイルを記憶する生成文書ファイル記憶手段と、
任意の文書アプリケーションから与えられる読み込みリ
ストと前記文書識別子管理データとに基づき前記読み込
みリストに該当する置換主文書ファイルまたは前記補文
書ファイル若しくは当該両ファイルを前記生成文書ファ
イル記憶手段から読み出し、前記文書アプリケーション
に入力する文書ファイル入力手段とを更に具備すること
を特徴とする。
【0014】第3の発明は、第1の発明において、文書
構造変換プログラムは、前記置換主文書を作成する置換
主文書作成プロシージャと、目次、索引、参考文献、変
換定義リストに関連する前記補文書を作成する複数の補
文書作成プロシージャーから成り、前記文書構造操作手
段は、前記各プロシージャを選択的に起動することによ
り、前記置換主文書作成手段または前記補文書作成手段
への処理の分岐を行うことを特徴とする。
【0015】第4の発明は、第1の発明において、構造
化文書は、SGML文書であることを特徴とする。
【0016】
【作用】第1の発明では、対象文書の文書型定義に所望
の項目要素が定義されていない時に当該項目要素が付与
された文書構造を作成する場合、文書構造操作手段での
文書構造変換プログラムによる文書構造編成時、置換主
文書作成手段で、必要に応じて上記対象文書の主文書か
ら置換主文書を生成すると共に、補文書作成手段で、必
要に応じて上記主文書から複数の補文書を生成し、次い
で、出力処理手段が、文書識別子生成手段により文書識
別子管理データを基に生成された文書識別子を各々対応
する置換主文書または補文書に付与し、それぞれ置換主
文書ファイルと補文書ファイルとして出力する。
【0017】このように、第1の発明では、主文書から
置換主文書ファイルと補文書ファイルをそれぞれ必要に
応じて生成するようにしたため、任意の文書アプリケー
ション側では、元の主文書の代わりに例えば上記置換主
文書ファイルと上記補文書ファイルとを用い、これらを
内部で結合し、文書型定義にはない項目要素が付与され
た主文書構造を生成する等の運用が行える。従って、上
記処理においては、元の文書の文書型定義を一切変更せ
ずに済むと共に、元の文書の論理構造も歪ませずに済
み、上記操作の後も元の文書を自由に流通させることが
できる。
【0018】第2の発明では、第1の発明において、上
記置換主文書ファイル及び補文書ファイルを生成文書フ
ァイル記憶手段に記憶しておき、任意の文書アプリケー
ションから読み込みリストが与えられた場合、文書ファ
イル出力手段が、上記読み込みリストと上記文書識別子
管理データとに基づき当該リストに該当するファイルを
上記生成文書ファイル記憶手段から読み出し、文書アプ
リケーションに入力するようにしている。
【0019】この第2の発明では、主文書の内容が更新
されない間は、当該主文書に関連する置換主文書ファイ
ル及び補文書ファイルが記憶保持されているため、文書
アプリケーション側では、必要に応じて読み込みリスト
を与え、置換補文書ファイルや補文書ファイルを読み出
すという処理から実行すれば良いことになり、アプリケ
ーションの実行効率が向上する。
【0020】第3の発明では、第1の発明において、文
書構造操作手段は、文書構造変換プログラムとして用意
されるプロシージャを選択的に起動することにより、置
換主文書作成手段または補文書作成手段への処理の分岐
を行う機能構成を有するため、用意する文書構造変換プ
ログラムによっては、あらゆる文書型定義の文書を対象
にアプリケーション(表示、編集、印刷)を実行できる
ようになる。
【0021】第4の発明では、第1の発明において、構
造化文書としてSGML文書を扱うようにしたため、複
雑な階層構造を有する当該SGML文書に対し、その文
書型定義(DTD)に定義されていない目次や索引等を
自動的に付与する際にも、元の文書のDTD適合性を損
なわずにアプリケーションを実行できる。
【0022】
【発明の実施の形態】以下、本発明の一実施の形態につ
いて添付図面を参照して詳細に説明する。図1は、本発
明に係わる文書処理装置100の一実施の形態を示す機
能ブロック図である。この文書処理装置100は、主文
書ファイル記憶部1、要素識別子生成部2、文書構造操
作部3、主文書plus作成部4、補文書作成部5、文書識
別子生成部6、主文書plus/補文書出力処理部7、生成
文書ファイル記憶部8、文書識別子管理データ記憶部
9、ファイル入力部10、文書アプリケーション11、
文書読み込みリスト入力部12を具備して構成される。
【0023】この文書処理装置100における文書処理
の概略動作を図2に示すフローチャートを参照して説明
する。なお、本実施の形態においては、処理対象の構造
化文書としてSGML文書を用いるものとする。
【0024】先ず、文書処理装置100は、図示しない
文書入力部より主文書ファイル(上記SGML文書)を
入力し(ステップ201)、主文書ファイル記憶部1に
記憶する。次に、本処理装置100は、例えば図示しな
い操作部からの指示に基づき文書構造操作部3に対し、
上記主文書ファイルの主文書の文書要素の生成/削除/
置換等を行うための変換プログラムを入力し(ステップ
202)、上記主文書ファイルに対する文書構造操作処
理を開始させる。なお、上記主文書ファイルにはその文
書型の定義を規定したDTD(文書型定義)が伴われて
入力する。
【0025】主文書ファイルに対する文書構造操作処理
の開始後、文書構造操作部3は、先ず、文書識別子管理
データ記憶部9に記憶されている文書識別子管理データ
から主文書plus、補文書の文書識別子の生成ルールを取
り込み(ステップ203)、次いで、要素識別子生成部
2により上記主文書ファイルの文書要素に付与するため
の要素識別子を生成する(ステップ204)。
【0026】次に、上記主文書ファイルのDTDと上記
ステップ202で投入された変換プログラムとの関係に
応じて文書操作プログラムの分岐処理を行う(ステップ
205)。
【0027】ここで、上記DTDに基づき主文書plusの
み作成が必要であると判断された場合、図中左側に示さ
れる処理に進む。この処理において、文書構造操作部3
は、上記ステップ202で投入された変換プログラム中
の該当する変換プログラムを起動させることにより上記
主文書ファイルに対する文書要素の生成/削除/置換の
処理を行い(ステップ206)、この処理において、主
文書plus作成部4により、入力文書(主文書ファイル)
と置換可能な置換主文書構造(以下、主文書plus構造2
0という)を作成する(ステップ207)。
【0028】また、上記DTDに基づき主文書plusと補
文書を作成する必要であると判断された場合、図中の中
央に示される処理に進む。この処理において、文書構造
操作部3は、上記ステップ202で投入された変換プロ
グラム中の該当する変換プログラムを起動させることに
より上記主文書ファイルの文書要素の生成/削除/置換
の処理を行い(ステップ208)、この処理において、
主文書plus作成部4により、上記入力文書と置換可能な
主文書plus構造20を作成し(ステップ209)、更
に、補文書作成部5により上記主文書plus構造20とは
別の第3の構造すなわち補文書構造30を1または複数
作成する(ステップ210)。
【0029】また、上記DTDに基づき補文書のみを作
成すればよいと判断された場合、図中右側に示す処理に
進む。この処理において、文書構造操作部3は、上記ス
テップ202で投入された変換プログラム中の該当する
変換プログラムを起動させることにより上記主文書ファ
イルの文書要素の生成/削除/置換の処理を行い(ステ
ップ211)、この処理において、補文書作成部5によ
り上記主文書plus構造20とは別の第3の構造すなわち
補文書構造30を1または複数作成する(ステップ21
2)。
【0030】上記文書構造操作処理の後、文書識別子生
成部6では、文書識別子管理データを参照して主文書pl
usファイル及び補文書ファイルを識別できる文書識別子
を上記主文書plus構造20または補文書構造30にそれ
ぞれ付与し(ステップ213)、次いで主文書plus/補
文書出力処理部7では上記文書識別子を付与されること
により生成された主文書plusファイル、1または複数の
補文書ファイルを上記文書識別子生成部6より出力し
(ステップ214)、生成文書ファイル記憶部8に記憶
させる。
【0031】次に、生成文書ファイル記憶部8に記憶さ
れた主文書plusファイル、1または複数の補文書ファイ
ルに対する文書アプリケーション側の動作について、図
3に示すフローチャートを参照して説明する。
【0032】任意のSGML文書アプリケーション(例
えば、フォーマッタ)11において、主文書に対して所
望の文書要素の作成操作を行わせるためには、ユーザは
文書読み込みリスト入力部12から文書の読み込みリス
トを投入する必要がある。
【0033】文書アプリケーション11は、文書識別子
管理データにアクセス(ステップ301)しており、上
記文書読み込みリストが入力される(ステップ302)
と、上記文書識別子管理データを基に上記読み込みリス
トに対応する文書識別子を獲得する(ステップ30
3)。
【0034】次いで、上記獲得した文書識別子に該当す
る文書識別子を持つ文書ファイルが生成文書ファイル記
憶部8に記憶されているかどうかをチェックし、該チェ
ック結果に基づき文書読み込みの分岐を行う(ステップ
304)。
【0035】ここで、上記獲得した文書識別子に該当す
る文書識別子を持つ文書ファイルとして主文書plusファ
イルのみが存在すれば、ファイル入力部10は、当該主
文書plusファイルを生成文書ファイル記憶部8から読み
込む(ステップ305)。
【0036】また、上記獲得した文書識別子に該当する
文書識別子を持つ文書ファイルとして主文書plusファイ
ルと補文書ファイルとが存在すれば、ファイル入力部1
0は、先ず、上記主文書plusファイルを生成文書ファイ
ル記憶部8から読み込み(ステップ306)、次に補文
書ファイルの1つ目を読み込み(ステップ307)、全
ての補文書ファイルの読み込みが終了するまで(ステッ
プ308yes)、上記補文書ファイルの読み込みを続
ける。
【0037】また、上記獲得した文書識別子に該当する
文書識別子を持つ文書ファイルとして補文書ファイルの
みが存在すれば、ファイル入力部10は、上記補文書フ
ァイルの1つ目を読み込み(ステップ309)、全ての
補文書ファイルの読み込みが終了するまで(ステップ3
10yes)、上記補文書ファイルの読み込みを続け
る。
【0038】上記文書ファイルの読み込み完了後、文書
アプリケーション11は、読み込んだ主文書plusファイ
ルまたは補文書ファイルを結合または置換するためのプ
ログラムを入力し(ステップ311)、該プログラムに
従って上記文書ファイル間のの結合あるいは置換の処理
を実行する(ステップ312)。
【0039】以上に述べた文書構造操作の処理を具体例
をあげて更に詳しく説明する。ここでは、主文書である
SGML文書から目次構造を作成する場合について考え
る。なお、対象文書(SGML文書)のDTDには目次
構造は定義されていないものとする。
【0040】この例の場合、文書構造操作部3での文書
構造操作において、先ず、主文書plus作成部4は、対象
文書の目次要素に要素識別子を付与し、主文書plus構造
を生成する。次に、補文書作成部5において、上記対象
文書ら目次構造を抽出し、同時に要素識別子も抽出する
ことによって、目次補文書構造を作成する。従って、主
文書plus構造と補文書構造における同等な要素はその識
別子も等しい。
【0041】一方、文書識別子管理データ記憶部9の文
書識別子管理データには、主文書plus構造に対しては
「 plus」、補文書構造には対しては、「-toc」がルー
ル付けされている。文書識別子生成部6では文書識別子
管理データを参照して上記主文書plus構造と補文書構造
にそれぞれ対応する文書識別子を付与することにより主
文書plusファイル名と目次補文書ファイル名とを生成す
る。この例では、主文書が「manual.sgm」ならば、主文
書plusファイルとして「manual-plus.sgm」が生成さ
れ、目次補文書ファイルとして「manual-toc」が生成さ
れる。
【0042】これら主文書plusファイルと目次補文書フ
ァイルは、主文書plus/補文書出力処理部7により出力
されて生成文書ファイル記憶部8に保持される。
【0043】任意のSGML文書アプリケーション(例
えば、フォーマッタ)11が主文書「manual.sgm」に対
して、目次作成操作を要求すると、主文書、主文書plu
s、ファイル入力部(ファイル入力部10)は、文書識
別子管理データを参照して、主文書「manual.sgm」の代
わりに主文書plus「manual-plus.sgm」を、また目次補
文書として「manual-toc」を読み込む。その後、文書ア
プリケーション11は、主文書plusと目次補文書を内部
で結合し、目次を含んだ文書を作成する。この時、目次
は、主文書の要素識別子を持っているので、その要素が
存在するページ番号も付与することができる。なお、結
合方法やページ番号については、アプリケーションの指
示に従う。
【0044】以下、上述した目次構造の作成処理につい
て図4〜図33を参照して更に詳しく説明していく。な
お、以下の例においては、SimpleDocという仮想のDT
Dを例に説明する。また、この例では、理解を容易にす
るために補文書はSGML文書であるものとする。すな
わち、本実施の形態では、SGML文書からSGML文
書を作成する場合における文書構造操作の概要と、この
文書構造操作を実現するためのプログラムの一例につい
て順次説明していく。
【0045】まず、図4は、上記目次構造に関し主文書
plusと補文書を作成し、利用する場合の処理の流れを示
している。SimpleDocには目次構造がなく、このため、
文書構造操作部3は、この時の主文書「manual.sgm」か
ら文書識別子管理データ「config」を参照しつつ目次構
造を生成し、目次補文書「manual-toc.sgm」とする。こ
れと同時に、上記主文書「manual.sgm」から主文書plus
構造を生成し、主文書plus「manual-plus.sgm」とす
る。その際の変換プログラムとしては、目次作成のため
のプログラム「maketoc」を用いる。
【0046】次に、補文書を作成し、利用する場合の処
理の流れを図5に示している。これは、例えば、Simple
Docに存在する定義リスト構造を別の構造へ変換する場
合の例である。すなわち、この例では、文書構造操作部
3は、定義リスト変換プログラム「deflist」を用い
て、この時の主文書「manual.sgm」から定義リスト補文
書「manual-dl.sgm」を作成する。この時、処理対象の
主文書「manual.sgm」はそのままの形で出力する。
【0047】上記処理に際して用いる文書識別子管理デ
ータは文書DTD毎に存在し、例えば上述したSimpleDo
cの場合は図6に示すように記述されている。同図にお
いて、CurDocPlusで始まる行は、主文書plusに関するデ
ータであることを示している。
【0048】<EntryName>は、プロシージャ名を示す。<
DocumentNameRule>は、プロシージャを実行した結果、
主文書名から主文書plusの名前を生成するルールであ
る。
【0049】それ以外の行は、補文書に関するデータで
あることを示している。補文書に関するデータのうち、
<EntryName>は、プロシージャ名を示す。<DocumentName
Rule>は、プロシージャを実行した結果、主文書名から
補文書の名前を生成するルールである。
【0050】また、上記処理に用いる変換プログラムの
例としては、図7に示すようなものがある。すなわち、
変換プログラムは、プロシージャから成り、主文書plus
を作成するプロシージャ#1と補文書を作成するプロシー
ジャ#2〜#nに分類される。
【0051】主文書plusを作成し、目次補文書を作成す
るプログラム(図4における目次作成プログラムmaketo
cに相当)の場合は、図8に示す如くに記述される。ま
た、定義リスト補文書を作成するプログラム(図5にお
ける定義リスト変換プログラムdeflistに相当)の場合
は、図9に示す如くに記述される。
【0052】更に、これら主文書plus/目次補文書作成
プログラム(図8参照)と定義リスト補文書作成プログ
ラム(図9参照)を組み合わせることにより、主文書pl
usと共に目次も生成し、かつ定義リストの構造を変換し
たい場合は、図10に示すようなプログラムを定義する
こともできる。この目次−定義リスト作成プログラム
(maketoc deflist)を実行した場合、その実行結果と
して、主文書plusと、2つの補文書との合計3つの文書
ファイルが作成される。
【0053】次に、要素識別子の付与による主文書plus
の生成について説明する。目次作成時において主文書pl
usを生成する場合、主文書の目次相当部分全てに識別子
を付与し、主文書plus構造とする。この主文書plus構造
は、SimpleDoc DTDに準じている。主文書plusの名前
は、主文書名から文書識別子管理データに基づいた名前
を付与されるという規定があるため、例えば、主文書が
「manual.sgm」とすると、主文書plus名は「-plus」と
いう命名規則に基づき「manual-plus.sgm」となる。
【0054】以下にその手順について、図11を参照し
て述べる。同図において、SimpleDocの構造が例えば以
下の意味を指しているものとする。
【0055】 H1 ->;レベル1のタイトル H2 ->;レベル2のタイトル H3 ->;レベル3のタイトル H4 ->;レベル4のタイトル H5 ->;レベル5のタイトル H6 ->;レベル6のタイトル P ->;段落 Head ->;文書ヘッダ部 Body ->;文書本文部 このSimpleDocという主文書「manual.sgm」に対し、主
文書plus作成プロシージャを実行することにより、H1か
らH6の要素にID属性値がないものにそれぞれ識別子を
付与する。その結果、同図の下側部分に示す如く、H1か
らH6の各要素に対してそれぞれ識別子「id=t0001」,「i
d=t0002」,「id=t0003」,……が対応付けられた主文書
plus構造「manual-plus.sgm」が生成される。
【0056】この処理においては、もともとID属性値
があるものについては識別子を付与しない。なお、この
処理の前提として、SimpleDocのDTDにおいて、H1か
らH6には識別子を保持することができる属性IDが定義
されているものとする。
【0057】上記識別子付与手順に係わる実行プログラ
ムの一例を図12に示している。同図は、MetaMorphosi
sのプログラムの一例である。同図において、!Annotati
onは、属性操作であることを宣言している。H1からH6の
要素について、ユニークなkeyを生成し、その値をID
という属性に代入する。[ ]は、条件を指定するための
部分である。ここで、@id=length()>0なので、idの値の
長さが0(零)の時、すなわち値が無かった場合にのみ
識別子が付与される。
【0058】次に、目次作成の処理手順について述べ
る。目次作成にあたっては、上述したように、主文書pl
usから目次相当部分を抽出し、補文書DTDに準じた目
次補文書を作成することが基本となる。その際、主文書
内のH1,H2,H3,H4,H5,H6の各要素の下位要素を目次情報
とする。ここで、補文書DTDは、「sup-toc.dtd」と
いうDTDに従う文書とする。目次、補文書の名前は、
主文書名から文書識別子管理データに基づいた名前を付
与することにより得る。例えば、主文書が「manual.sg
m」であれば、目次補文書名は「-toc」という命名規則
に基づき「manual-toc.sgm」となる。
【0059】図13は、主文書と目次補文書との間のタ
グの対応付けを表す表図であり、目次作成時には、この
表図に示すタグの対応に従って主文書から補文書への変
換処理を行う。
【0060】図14は、本実施の形態における目次構造
の生成の様子を示す概念図であり、図13のタグの対応
に従い、例えば、主文書「SimpleDoc」のノードH1を目
次補文書DTD「sup-toc.dtd」のLEVEL 0へと置換さ
せ、次いで上記ノードH1の下位要素「id=t0001」から目
次補文書DTD「sup-toc.dtd」のLEVEL 0の直下のTITL
Eを生成するようにし、以下同様の処理を主文書「Simpl
eDoc」内の各要素H2,H3,H4,H5,H6に対しても実施してい
くことで、目次補文書を生成している。
【0061】上記補文書変換手順を実行するための変換
プログラムの一例を図15〜図17に示している。以下
にこの変換プログラムについて説明する。先ず、図15
は、目次要素の上位要素となるH1,H2,H3,H4,H5,H6の各
要素を抽出するためのプログラムである。同図における
(0)から(4)の記述は、それぞれ以下の意味を有す
るものである。
【0062】(0)!Transformationで構造変換である
ことを宣言する。
【0063】(1)ルートノードSUP-TOCを生成する。
【0064】(2)ルートノードSUP-TOCの配下にノー
ドCONTENT-LISTを生成する。
【0065】(3)ノードCONTENT-LISTの配下に主文書
「SimpleDoc」のH1からH6までの要素のみを抽出する。
【0066】(4)H1からH6について、ノードTITLEを
挿入する。この時、H1からH6に付与されているID値をID
REF値としてコピーする。(4)によって、主文書plus
中のID値と目次補文書中のIDREF値の対応付けが実行さ
れる。
【0067】図16は、主文書「SimpleDoc」の各要素H
1,H2,H3,H4,H5,H6が有する下位要素を収集するためのプ
ログラムである。このプログラムによって、上記各要素
H1,H2,H3,H4,H5,H6をレベル毎にまとめ、階層化する。
【0068】図17は、上記各要素H1,H2,H3,H4,H5,H6
を適切な要素に変換するためのプログラムを示してい
る。このプログラムによって、上記各要素H1,H2,H3,H4,
H5,H6をそれぞれのレベルにあった要素名へと変換す
る。また、不要な要素は削除する。
【0069】図18は、上記変換プログラムを実行する
ことで生成された目次補文書「manual-toc.sgm」の構造
の一例を示したものである。この目次補文書「manual-t
oc.sgm」は、図11に示す主文書plus「manual-plus.sg
m」と共に生成文書ファイル記憶部8に記憶される。
【0070】次に、文書アプリケーション11によっ
て、上記生成文書ファイル記憶部8から主文書plusと目
次補文書を読み込む処理について説明する。文書アプリ
ケーション11内で、主文書から目次を作成する場合、
ユーザは、先ず、文書読み込みリストを作成する。図1
9は、本実施の形態に係わる文書読み込みリストの一例
を示したものである。
【0071】文書読み込みリスト入力部12から上記文
書読み込みリストが投入されると、文書アプリケーショ
ン11は、当該文書読み込みリストと文書識別子管理デ
ータ記憶部9内の文書識別子管理データとから、主文書
plusと目次補文書の名前を主文書名と関連付けて求め
る。その際、文書読み込みリストは、図20に示すよう
に読み替えられて実行される。この読み替えにおいて
は、主文書を主文書plusとし、更に目次補文書も読み込
む。
【0072】また、図21は本実施の形態におけるファ
イル読み込み動作を示す概念図であり、図20に示す内
容の文書読み込みリストが指定された場合、当該指定に
応じた主文書plus「manual-plus.sgm」と目次補文書「m
anual-toc.sgm」とが文書識別子管理データ「config」
を基に文書アプリケーション11に読み込まれる。
【0073】次に、文書アプリケーション11における
主文書plusファイルと目次補文書ファイル「manual-to
c.sgm」との連結について説明する。本実施の形態で
は、文書アプリケーション11によって主文書plus「ma
nual-plus.sgm」と目次補文書「manual-toc.sgm」の2
つのファイルが読み込まれる。ここで、文書アプリケー
ション11が例えば文書エディタであれば、上記両者の
連結が考えられる。また、文書アプリケーション11が
文書フォーマッタであれば、上記両者間の文書レイアウ
トの順番などの指定が必要となる。
【0074】ここで、ある文書アプリケーション11に
おいて、以下のような関数が提供されているものとす
る。
【0075】LinkSubTree(src-gi,src-context,src-roo
t,dst-gi,dst-context,linkposition) この関数の意味は、「主文書中のdst-giとdst-context
に照合するオブジェクトのlinkpositionで示される位置
にsrc-rootに照合する補文書中でsrc-giとsrc-context
に照合する要素とその子孫を結合する」というものであ
る。
【0076】この関数を使って、例えば、SimpleDocのB
odyの先頭に目次構造を挿入する場合は、図22に示す
ような記述を行えばよい。この記述に従ったプログラム
を実行することによって、図23に示す如く、主文書pl
usのBodyの長男にSUP-TOCのCONTENT-LIST以下が挿入さ
れることになる。
【0077】同図において、目次部分のTITLEのidref値
とBody以下の同じid値を持つものとが対応しているた
め、例えばid=t0001を持つ目次のタイトルはページ数5
を得ることができるため、文書アプリケーション11側
から見た場合に、ページ付きの目次を生成できるという
利点を有する。
【0078】次に、定義リストを作成する例について説
明する。ここでは、定義リスト補文書DTDに準じた補
文書を作成する。図24は、主文書と定義リスト補文書
とのタグの対応付けを示す図である。本実施の形態で
は、同図のタグの対応に従って変換後の定義リスト補文
書を作成する。SimpleDocの定義リスト構造は、term部
とdefine部がフラットに並んでいるので、これをterm部
とdefine部とをまとめたノードであるdeflist-itemとい
うノードを挿入した構造に変換する。
【0079】図25は、定義リストの構造変換処理の流
れを示す概念図である。この処理は、以下の手順を経て
実現される。
【0080】1.主文書から定義リスト(“DL”)を抽出
する。
【0081】2-1.<DL>は、<DEFLIST>に置き換え
る。
【0082】2-2.<DT>は、新しいノード<DEFLIST-
ITEM>の下の<TERM>に置き換える。<DT>の次の<DD
>は、全て<DEF>に置き換える。
【0083】2-3.前に<DT>がなくて、連続する<DD
>の先頭ノードならば、新しいノード<DEFLIST-ITEM>
の下の<DEF>に置き換える。この<DD>の次から連続
する<DD>も<DEF>に置き換える。
【0084】図26及び図27は、上記定義リスト補文
書作成のための変換プログラムの一例を示すものであ
り、特に、図26はルートを作成し、主文書中の定義リ
スト構造を集めるまでの処理に対応し、図27はそれ以
降の処理に対応している。また、図28は、本実施の形
態において、図26及び図27に示した記述内容の変換
プログラムを実行して得られる定義リスト補文書の構造
を示す図である。
【0085】文書アプリケーション11に定義リスト補
文書を読み込む場合には、定義リストの構造変換要求時
に文書識別子管理データ記憶部9の文書識別子管理デー
タを参照して、例えば、図29に示すような文書読み込
みリストを与えればよい。
【0086】文書アプリケーション11は、上記文書読
み込みリストと、上記文書識別子管理データとから定義
リスト補文書の名前を求める。実際の動作では、上記文
書読み込みリストは図30に示す形態に変換されて実行
される。
【0087】図31は、本実施の形態における定義リス
ト補文書の読み込み動作を示す概念図であり、図30に
示す内容の文書読み込みリストが指定された場合、当該
指定に応じた主文書「manual.sgm」と定義リスト補文書
「manual-dl.sgm」とが文書識別子管理データ「confi
g」を基に文書アプリケーション11に読み込まれる。
【0088】次に、文書アプリケーション11における
定義リスト補文書の置換処理について述べる。上述の如
く、本実施の形態では、文書アプリケーション11によ
って主文書「manual.sgm」と定義リスト補文書「manual
-dl.sgm」の2つのファイルが読み込まれる。
【0089】ここで、文書アプリケーション11が例え
ば文書エディタや文書フォーマッタであれば、上記両者
の連結が考えられる。
【0090】ここで、ある文書アプリケーション11に
おいて、以下のような関数が提供されている場合を考え
る。
【0091】replaceSubTree(src-gi,src-context,src-
root,dst-gi,dst-context) この関数の意味は、「主文書中のdst-giとdst-context
に照合するオブジェクトとその子孫を、src-rootに照合
する補文書中でsrc-giとsrc-contextに照合する要素と
その子孫に置換する」というものである。
【0092】この関数を使って、例えば、SimpleDocの
定義リストを定義リスト補文書内の定義リストに置換す
る場合は、図32に示すような記述を行えばよい。
【0093】この記述に従ったプログラムを実行するこ
とによって、図33に示す如く、主文書のDL以下がDEFL
IST以下に置換されることになる。このような文書中の
特定の構造を変形する例としては、他に、表構造や注構
造がある。上記実施の形態によれば、以下の利点を有す
ることになる。
【0094】(1)SimpleDocのDTDを何ら変更すること
がない。
【0095】(2)上記実施の形態では、SimpleDocのD
TDについてプログラムを用意したが、他のDTDにおいて
も文書構造変換プログラムを用意することにより、あら
ゆるDTDに対応可能となる。
【0096】(3)主文書には変更が一切生じなかった
ため、この主文書の流通に与える影響は皆無である。
【0097】(4)目次や定義リストの変形といった主
文書の構造にない構造は、補文書としているので、主文
書の論理構造を変更することや論理構造の歪曲は一切生
じることがない。
【0098】(5)主文書の内容が更新されない間は、
文書アプリケーションは文書読み込みリストを与え、主
文書plusや補文書の読み込みから実行すればよいため、
主文書plusや補文書の作成を毎回実行する必要性がな
く、アプリケーションの実行効率を向上させることがで
きる。
【0099】
【発明の効果】以上詳細に説明したように、第1の発明
によれば、主文書から置換主文書ファイルと補文書ファ
イルをそれぞれ必要に応じて生成するようにしたため、
任意の文書アプリケーション側では、元の主文書の代わ
りに例えば上記置換主文書ファイルと上記補文書ファイ
ルとを用い、これらを内部で結合し、文書型定義にはな
い項目要素が付与された主文書構造を生成する等の運用
が行える。従って、上記処理においては、元の文書の文
書型定義を一切変更せずに済むと共に、元の文書の論理
構造も歪ませずに済み、上記操作の後も元の文書を自由
に流通させることができる。
【0100】第2の発明によれば、第1の発明におい
て、上記置換主文書ファイル及び補文書ファイルを生成
文書ファイル記憶手段に記憶しておき、任意の文書アプ
リケーションから読み込みリストが与えられた場合、文
書ファイル出力手段が、上記読み込みリストと上記文書
識別子管理データとに基づき当該リストに該当するファ
イルを上記生成文書ファイル記憶手段から読み出し、文
書アプリケーションに入力するようにしており、主文書
の内容が更新されない間は、当該主文書に関連する置換
主文書ファイル及び補文書ファイルが記憶保持されてい
るため、文書アプリケーション側では、必要に応じて読
み込みリストを与え、置換補文書ファイルや補文書ファ
イルを読み出すという処理から実行すれば良いことにな
り、アプリケーションの実行効率が向上する。
【0101】第3の発明によれば、第1の発明におい
て、文書構造操作手段は、文書構造変換プログラムとし
て用意されるプロシージャを選択的に起動することによ
り、置換主文書作成手段または補文書作成手段への処理
の分岐を行う機能構成を有するため、用意する文書構造
変換プログラムによっては、あらゆる文書型定義の文書
を対象にアプリケーション(表示、編集、印刷)を実行
できるようになる。
【0102】第4の発明によれば、第1の発明におい
て、構造化文書としてSGML文書を扱うようにしたた
め、複雑な階層構造を有する当該SGML文書に対し、
その文書型定義(DTD)に定義されていない目次や索
引等を自動的に付与する際にも、元の文書のDTD適合
性を損なわずにアプリケーションを実行できる。
【図面の簡単な説明】
【図1】本発明に係わる文書処理装置の一実施の形態を
示す機能ブロック図。
【図2】本発明装置の文書構造変換処理動作を示すフロ
ーチャート。
【図3】本発明装置の文書アプリケーションの処理動作
を示すフローチャート。
【図4】本発明装置における主文書plusと補文書の作成
処理手順を示す概念図。
【図5】本発明装置における補文書の作成処理手順を示
す概念図。
【図6】本発明装置で用いる文書識別子管理データの記
述例を示す図。
【図7】本発明装置の文書構造変換処理に用いる変換プ
ログラムの一例を示す図。
【図8】本発明装置の目次作成プログラムの記述例を示
す図。
【図9】本発明装置の定義リスト変換プログラムの記述
例を示す図。
【図10】本発明装置の目次−定義リスト作成プログラ
ムの記述例を示す図。
【図11】本発明装置の主文書plus生成時の識別子付与
例を示す図。
【図12】図11における識別子付与手順の実行プログ
ラムの記述例を示す図。
【図13】本発明装置の主文書と目次補文書との間のタ
グの対応付けを示す表図。
【図14】本発明装置における目次構造生成処理手順を
示す概念図。
【図15】目次構造生成時の目次要素を抽出するための
プログラムの記述例を示す図。
【図16】目次構造生成時の目次要素の下位要素収集用
のプログラムの記述例を示す図。
【図17】抽出した目次要素を適切な要素に変換するた
めのプログラムの記述例を示す図。
【図18】図15乃至図17に示す変換プログラムを実
行して得られる目次補文書の構造の一例を示す図。
【図19】文書アプリケーションに主文書plusと目次補
文書を読み込む場合の文書読み込みリストの一例を示す
図。
【図20】図19に示す文書読み込みリストの実際の処
理での投入形態を示す図。
【図21】図20に示す文書取り込みリストに基づく文
書読み込み手順を示す概念図。
【図22】文書アプリケーションで読み込んだ主文書pl
usと目次補文書の連結処理を起動するための関数の記述
例を示す図。
【図23】文書アプリケーションにおける図22の関数
に基づく連結処理により得られる文書構造の一例を示す
図。
【図24】本発明装置の定義リスト補文書作成に係わる
主文書と定義リスト補文書とのタグの対応付けを示す表
図。
【図25】図24に示すタグの対応付けに基づく定義リ
スト補文書作成手順を示す概念図。
【図26】本発明装置での定義リスト補文書作成のため
の変換プログラムのうちの初期処理に対応する部分の記
述例を示す図。
【図27】本発明装置での定義リスト補文書作成のため
の変換プログラムのうちの図26に示す処理に続く部分
の記述例を示す図。
【図28】図26及び図27に示した変換プログラムを
実行して得られる定義リスト補文書の構造を示す図。
【図29】文書アプリケーションに定義リスト補文書を
読み込む場合の文書読み込みリストの一例を示す図。
【図30】図29に示す文書読み込みリストの実際の処
理での投入形態を示す図。
【図31】図30に示す文書取り込みリストに基づく文
書読み込み手順を示す概念図。
【図32】文書アプリケーションで読み込んだ定義リス
ト補文書の連結処理を起動するための関数の記述例を示
す図。
【図33】図32に示す関数に基づく連結処理により得
られる定義リスト補文書の構造を示す図。
【符号の説明】
100…文書処理装置、1…主文書ファイル記憶部、2
…要素識別子生成部、3…文書構造操作部、4…主文書
plus作成部、5…補文書作成部、6…文書識別子生成
部、7…主文書plus/補文書出力処理部、8…生成文書
ファイル記憶部、9…文書識別子管理データ記憶部、1
0…ファイル入力部、11…文書アプリケーション、1
2…文書読み込みリスト入力部、20…主文書plus構
造、30…補文書構造

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 構造化文書とその文書型定義とを入力
    し、前記構造化文書を対象に所望の項目要素を付与する
    処理を行う文書処理装置において、 文書構造変換プログラムを実行することにより前記対象
    文書の項目要素の生成/削除/置換に関する文書構造編
    成処理を行う文書構造操作手段と、 前記文書構造編成時、必要に応じて前記対象文書の項目
    要素に対し要素識別子を付与することにより前記対象文
    書の主文書と置換可能な置換主文書を生成する置換主文
    書生成手段と、 前記文書構造編成時、必要に応じて前記対象文書から前
    記項目要素のみを抽出し該項目要素に要素識別子を付与
    した補文書を生成する補文書生成手段と、 前記置換主文書及び前記補文書に各々対応する文書識別
    子を付与することにより置換主文書ファイル及び補文書
    ファイルとして出力する出力処理手段と、 前記文書構造編成時に前記項目要素に付与する要素識別
    子を生成する要素識別子生成手段と、 前記ファイル出力時に前記置換主文書及び前記補文書に
    付与する文書識別子を生成する文書識別子生成手段と、 前記主文書、前記置換主文書、前記補文書に付与する文
    書識別子の生成ルールを定めた文書識別子管理データを
    記憶する文書識別子管理データ記憶手段とを具備するこ
    とを特徴とする文書処理装置。
  2. 【請求項2】 出力処理手段から出力された前記置換主
    文書ファイル及び補文書ファイルを記憶する生成文書フ
    ァイル記憶手段と、 任意の文書アプリケーションから与えられる読み込みリ
    ストと前記文書識別子管理データとに基づき前記読み込
    みリストに該当する置換主文書ファイルまたは前記補文
    書ファイル若しくは当該両ファイルを前記生成文書ファ
    イル記憶手段から読み出し、前記文書アプリケーション
    に入力する文書ファイル入力手段とを更に具備すること
    を特徴とする請求項1記載の文書処理装置。
  3. 【請求項3】 文書構造変換プログラムは、前記置換主
    文書を作成する置換主文書作成プロシージャと、目次、
    索引、参考文献、変換定義リストに関連する前記補文書
    を作成する複数の補文書作成プロシージャーから成り、
    前記文書構造操作手段は、前記各プロシージャを選択的
    に起動することにより、前記置換主文書作成手段または
    前記補文書作成手段への処理の分岐を行うことを特徴と
    する請求項1記載の文書処理装置。
  4. 【請求項4】 構造化文書は、SGML(Standard Gen
    eralized Markup Language)文書であることを特徴とす
    る請求項1記載の文書処理装置。
JP8270110A 1996-10-11 1996-10-11 文書処理装置 Pending JPH10116284A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8270110A JPH10116284A (ja) 1996-10-11 1996-10-11 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8270110A JPH10116284A (ja) 1996-10-11 1996-10-11 文書処理装置

Publications (1)

Publication Number Publication Date
JPH10116284A true JPH10116284A (ja) 1998-05-06

Family

ID=17481684

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8270110A Pending JPH10116284A (ja) 1996-10-11 1996-10-11 文書処理装置

Country Status (1)

Country Link
JP (1) JPH10116284A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020017669A (ko) * 2000-08-31 2002-03-07 양준호 Xml 기반 어플리케이션 제공 시스템, 및 xml 기반어플리케이션이 기록된 컴퓨터 판독가능한 기록매체
KR20020080697A (ko) * 2001-04-17 2002-10-26 주식회사 이네트 엑스엠엘을 이용한 비즈니스 로직 처리기 및 그 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020017669A (ko) * 2000-08-31 2002-03-07 양준호 Xml 기반 어플리케이션 제공 시스템, 및 xml 기반어플리케이션이 기록된 컴퓨터 판독가능한 기록매체
KR20020080697A (ko) * 2001-04-17 2002-10-26 주식회사 이네트 엑스엠엘을 이용한 비즈니스 로직 처리기 및 그 방법

Similar Documents

Publication Publication Date Title
JP4141556B2 (ja) 構造化文書管理方法及びその実施装置並びにその処理プログラムを記録した媒体
JP3692054B2 (ja) 文書構造変換方法および文書構造変換装置およびプログラム
US7197510B2 (en) Method, system and program for generating structure pattern candidates
JP3692764B2 (ja) 構造化文書登録方法、検索方法、およびそれに用いられる可搬型媒体
US5649218A (en) Document structure retrieval apparatus utilizing partial tag-restored structure
CN108351768B (zh) 用标记语言编写文档的同时实现处理信息***的数据的用户界面的方法
JP2002024211A (ja) 文書管理方法およびシステム並びにその処理プログラムを格納した記憶媒体
US7275066B2 (en) Link management of document structures
JPH04503881A (ja) 書類管理及び作成システム
JPH0576061B2 (ja)
CN101171582A (zh) 用于从数据库生成xml文档的动态方法
US8065606B1 (en) System and method for automating document generation
JP2006202308A (ja) グラフィカルユーザインターフェース方法、グラフィカルユーザインターフェース装置、及び記録媒体
US5765177A (en) Document processing method and apparatus for searching documents having a graph based document logic structure
US20090193053A1 (en) Information management system
JP2002215519A (ja) ウェブページ生成方法およびシステム、ウェブページ生成プログラム、記録媒体
JP2000339306A (ja) 文書作成装置
JPH10116284A (ja) 文書処理装置
JP2004348341A (ja) 構造化文書処理システム、構造化文書処理方法及びプログラム
JPH08221417A (ja) 構造化文書の新旧対照編集装置
JP4627962B2 (ja) データベースパブリッシング方法及びその装置
JP2008084128A (ja) 構造化文書の要素指定装置、要素指定方法及び要素指定プログラム
JP3910048B2 (ja) データベースパブリッシング方法及びその装置
Škrbić et al. Bibliographic records editor in XML native environment
JP2000081999A (ja) 文書出力システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040525

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041005