JP4997749B2 - 文書処理方法、プログラム及びシステム - Google Patents
文書処理方法、プログラム及びシステム Download PDFInfo
- Publication number
- JP4997749B2 JP4997749B2 JP2005353456A JP2005353456A JP4997749B2 JP 4997749 B2 JP4997749 B2 JP 4997749B2 JP 2005353456 A JP2005353456 A JP 2005353456A JP 2005353456 A JP2005353456 A JP 2005353456A JP 4997749 B2 JP4997749 B2 JP 4997749B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- template
- folder
- information
- integrated structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Description
図1に、実施形態の文書処理システムの概略構成を示す。このシステムは、文書データベース10、文書取得部12、フォルダ構造取得部14、参照先取得部16、ディレクトリマージ部18、URL生成部20、データ変換部22、テンプレート解析部26、マッチング処理部28、流し込み処理部34、を備える。
この例では、文書データベース10中の注目する文書の構造と、文書データベース10の階層的なフォルダ構造とをマージして統合構造情報を作成し、この統合構造情報に対してテンプレートを適用する。また注目する文書の中から他の文書が参照されている場合、その参照先の文書の構造を統合構造情報に組み込む。準備フェーズでは、このような統合構造情報を作成する。また、以下の例では、作成した統合構造情報を、テンプレート処理に適したディレクトリレコード(詳細は後述)の形に変換する処理も行っている。以下、この準備フェーズのための構成要素群について説明する。
<BOOK title=”文書3”>
<PART title=”従来技術の問題点” ID=”A030100”>
<CHAPTER title=”従来技術” ID=”A030101”>
従来、構造化文書処理におけるレイアウト処理では、<JUMP JUMPID=”A010200”>参考文献1</JUMP>に述べられているように...
</CHAPTER>
<CHAPTER title=”課題” ID=”A030102”>
<SECTION title=”コスト” ID=”A030102_1”>...</SECTION>...
</CHAPTER>
</PART>
<PART title=”新たな技術の提案” ID=”A030200”> ... </PART> ...
</BOOK>
<FOLDER NAME=”フォルダ1”>
<FOLDER NAME=”フォルダ2”>
<DOCUMENT NAME=”文書1” />
<DOCUMENT NAME=”文書2” />
</FOLDER>
<FOLDER NAME=”フォルダ3”>
<DOCUMENT NAME=”文書3” />
</FOLDER>
</FOLDER>
<BOOK title=”文書1”>
<PART title=”従来技術の問題点” ID=”A010100”> ... </PART>
<PART title=”新たな技術の提案” ID=”A010200”> ... </PART> ...
</BOOK>
<FOLDER NAME=”フォルダ1”>
<FOLDER NAME=”フォルダ2”>
<DOCUMENT NAME=”文書1” >
<PART title=”従来技術の問題点” ID=”A010100”> ... </PART>
<PART title=”新たな技術の提案” ID=”A010200”> ... </PART> ...
</DOCUMENT>
<DOCUMENT NAME=”文書2” />
</FOLDER>
<FOLDER NAME=”フォルダ3”>
<DOCUMENT NAME=”文書3”>
<PART title=”従来技術の問題点” ID=”A030100”>
<CHAPTER title=”従来技術” ID=”A030101”>
従来、構造化文書処理におけるレイアウト処理では、<JUMP JUMPID=”A010200”>参考文献1</JUMP>に述べられているように...
</CHAPTER>
<CHAPTER title=”課題” ID=”A030102”>
<SECTION title=”コスト” ID=”A030102_1”>...</SECTION>...
</CHAPTER>
</PART>
<PART title=”新たな技術の提案” ID=”A030200”> ... </PART> ...
</DOCUMENT>
</FOLDER>
</FOLDER>
<FOLDER NAME=”フォルダ1”>
<FOLDER NAME=”フォルダ2”>
<DOCUMENT NAME=”文書1” >
<PART title=”従来技術の問題点” ID=”A010100” url_1=”A010100.html”> ... </PART>
<PART title=”新たな技術の提案” ID=”A010200” url_1=”A010200.html”> ... </PART> ...
</DOCUMENT>
<DOCUMENT NAME=”文書2” />
</FOLDER>
<FOLDER NAME=”フォルダ3”>
<DOCUMENT NAME=”文書3”>
<PART title=”従来技術の問題点” ID=”A030100” url_1=”A030100.html”>
<CHAPTER title=”従来技術” ID=”A030101” url_1=”A030101.html”>
従来、構造化文書処理におけるレイアウト処理では、<JUMP JUMPID=”A010200”>参考文献1</JUMP>に述べられているように...
</CHAPTER>
<CHAPTER title=”課題” ID=”A030102” url_1=”A030102.html”>
<SECTION title=”コスト” ID=”A030102_1” url_1=”A030102.html_1”>...</SECTION>...
</CHAPTER>
</PART>
<PART title=”新たな技術の提案” ID=”A030200” url_1=”A030200.html”> ... </PART> ...
</DOCUMENT>
</FOLDER>
</FOLDER>
・「コンテキスト番号」については、生成されるレコード毎に0,1,2,...という値を順に与える。
・「コンテキスト識別子」については、統合構造情報のルート要素については「/」、その他の要素については、親要素のコンテキスト識別子が<PC>で、その要素がその親要素のn番目の子要素であるならば「<PC>/n」とする。但し親要素がルート要素の場合は「/n」とする。数値nの代わりに子要素の中でユニークに識別可能な任意の文字列を用いることもできる。
・「要素名」については、その要素の要素名とする。
・「text」については、その要素の内容から他の要素を除いた部分とする。
・統合構造情報からリストアップされたその他の属性については、その属性をその要素が保持しているならば、その属性の値をセットし、保持していないならばその属性の値を空とする。
(C1)テンプレート解析
このフェーズは、テンプレート解析部26,マッチング処理部28及び流し込み処理部34によって実行される。このフェーズに対する入力は、テンプレート24と、データ変換部22が生成したディレクトリレコードと、テンプレート処理の基点とするディレクトリレコード上の特定のレコードを指定するコンテキスト番号と、の組である。使用するテンプレート24は、ユーザが指定してもよいし、タイプ-テンプレート対応表(詳細は後述)に示される対応関係に基づき自動的に選択されてもよい。また、テンプレート処理の基点とするコンテキスト番号は、ユーザが指定してもよいし、タイプ-テンプレート対応表に示される対応関係から決定するようにしてもよい(詳細は後述)。そして、テンプレート処理フェーズでは、テンプレート24を評価した結果をテキスト文字列として出力する。
<テンプレート>::=<テンプレート要素列>
<テンプレート要素列>::=<テンプレート要素列><テンプレート要素>
<テンプレート要素>::=<テキスト要素>
| <変数要素>
| <繰り返し要素>
| <選択要素>
| <ディレクトリ要素>
| <エンコード要素>
<繰り返し要素>::=’{{‘ <テンプレート要素列> ‘}}’
<選択要素>::=’[[‘<テンプレート要素列>‘]]’
<ディレクトリ要素>::=‘#directory’ <条件式> <テンプレート要素列> ‘#end’
<エンコード要素>::=‘#encode’ <エンコード形式> <テンプレート要素> ‘#end’
<変数要素>::=‘$’<変数名>‘.’<属性名>‘$’
<テキスト要素>::=<$,{,},[,]を含まない文字列>
<変数名>::=<アルファベット・数字の列>
<属性名>::=<アルファベット・数字の列>
<条件式>::=<変数要素>’==’<定数>|<変数要素>
<定数>::=<”を含まない文字列>
<エンコード形式>::=<$,{,},[,]を含まない文字列>
目次
{{$SECTION.title$[[($SECTION.whatsNew$)]]:
}}
マッチング処理では、ディレクトリレコード中の着目しているコンテキスト番号の行(以降「カレントコンテキスト」と呼ぶ)において、ディレクトリレコードと、テンプレート中のテンプレート要素とのマッチング判定を行う。判定結果は、「<確定>」または、「<代入可能>」または、「<代入不能>」のいずれかになる。
流し込み処理は、ディレクトリレコードの属性値を、変数と置き換える処理である。テンプレート中の着目ノードEと、ディレクトリレコード上のカレントコンテキストCとを指定して行ったマッチング処理の判定結果が<代入可能>か<確定>であるようなノードEに対して、流し込み処理部34が流し込み処理を行う。
目次
機能1(新着):
機能2:
機能3:
以上、文書処理システムの構成及び処理について説明した。次に、以上の処理を、章(CHAPTER)要素を基点としたテンプレート処理において、章に含まれる節の見出しリストである「章目次ファイル」を生成する場合を例にとって説明する。節の見出しリストには、各節の内容(コンテンツ)ファイルへのハイパーリンクが設定されているようにする。
<HTML>
章目次
{{<A href=”$SECTION.url_1$”> $SECTION.title$[[($SECTION.whatsNew$)]]: </A>
}}
</HTML>
<HTML>
章目次
<A href=”A0101010100.html”>機能1(新着): </A>
<A href=”A0101010200.html”>機能2: </A>
<A href=”A0101010300.html”>機能3: </A>
</HTML>
<HTML>
<H3>$SECTION.title$</H3>
{{<A name=”$DOCITEM.ID$”></A>
<P>$DOCITEM.text$</P>
}}
</HTML>
<HTML>
<H3>機能3</H3>
<A name=” A0101010301”></A>
<P>この節では、機能3の説明をします。</P>
<A name=” A0101010302”></A>
<P>※この機能はRev 2.0でサポートされます。</P>
</HTML>
上記D節の具体例では、統合構造情報における異なる階層に対してそれぞれ異なるテンプレートを選択的に適用する例を示した。これに対し、この節では、同じ要素に対して複数のテンプレートを適用する例を示す。
・その要素(着目要素と呼ぶ)に対応するテンプレートがn種類、タイプ-テンプレート対応表37に記述されているならば、url_1, url_2, ...url_n属性を追加し、それらの属性値をそれぞれ「<IDの属性値>_<テンプレート名>」とする。
・着目要素に対応するテンプレートが対応表37に記述されていない場合は、その祖先の要素でテンプレートが対応表37に記述されている直近の要素を求める。求めた直近の祖先要素にurl_1, ..., url_n属性が追加されているならば、着目要素にもurl_1, ..., url_nを追加し、これらの属性値をそれぞれ「<祖先のurl_i属性値>#<IDの属性値>」(但しiは1からn)とする。
<FOLDER NAME=”フォルダ1”>
<FOLDER NAME=”フォルダ2”>
<DOCUMENT NAME=”文書1” />
<PART title=”従来技術の問題点” ID=”A010100”
url_1=”A010100_frameSet.html” url_2=”A010100_partLeft.html”
url_3=”A010100_partRight.html”> ... </PART>
<PART title=”新たな技術の提案” ID=”A010200”
url_1=”A010200_frameSet.html” url_2=”A010200_partLeft.html”
url_3=”A010200_partRight.html” > ... </PART> ...
<DOCUMENT NAME=”文書2” />
</FOLDER>
<FOLDER NAME=”フォルダ3”>
<DOCUMENT NAME=”文書3”>
<PART title=”従来技術の問題点” ID=”A030100”
url_1=”A030100_frameSet.html” url_2=”A030100_partLeft.html”
url_3=”A030100_partRight.html”>
<CHAPTER title=”従来技術” ID=”A030101”
url_1=”A030101_chapterLeft.html” url_2=”A030101_chapterRight.html”>
従来、構造化文書処理におけるレイアウト処理では、<JUMP JUMPID=”A010200”>参考文献1</JUMP>に述べられているように...
</CHAPTER>
<CHAPTER title=”課題” ID=”A030102”
url_1=”A030102_chapterLeft.html” url_2=”A030102_chapterRight.html”>
<SECTION title=”コスト” ID=”A030102_1”
url_1=”A030102_chapterLeft.html#A030102_1”
url_2=”A030102_chapterRight.html#A030102_1”>...</SECTION>...
</CHAPTER>
</PART>
<PART title=”新たな技術の提案” ID=”A030200”
url_1=”A030200_frameSet.html” url_2=”A030200_partLeft.html”
url_3=”A030200_partRight.html”> ... </PART> ...
</DOCUMENT>
</FOLDER>
</FOLDER>
<HTML>
<FRAMESET cols=”30,*”>
<FRAME src=”$CHAPTER.url_2$” name=”left”>
<FRAME src=”$CHAPTER.url_3$” name=”right”>
</FRAMESET>
</HTML>
<HTML>
章目次
{{<A href=”$SECTION.url_1$” target=”right”> $SECTION.title$: <A>
}}
</HTML>
<HTML>
<H3>$CHAPTER.title$</H3>
{{<A name=”$DOCITEM.ID$”></A>
<P>$DOCITEM.text$</P>
}}
</HTML>
<HTML>
<FRAMESET>
<FRAME src=” A0101020000_chapterLeft.html” name=”left”>
<FRAME src=” A0101020000_chapterRight.html” name=”right”>
</FRAMESET>
</HTML>
<HTML>
章目次
<A href=”A0101010100_section.html” target=”right”>機能1: <A>
<A href=”A0101010200_section.html” target=”right”>機能2: <A>
<A href=”A0101010300_section.html” target=”right”>機能3: <A>
</HTML>
<HTML>
<H3>操作</H3>
<A name=” A0101010001”>
<P>この章では、操作を説明します。</P>
</HTML>
次に、ディレクトリ要素について説明する。
$SECTION.title$ :
#directory $*.ID$==$JUMP.JUMPID$
<A href=”$SECTION.ID$.htm”>$PART.title$:$CHAPTER.title$:$SECTION.title$</A>
#end
機能3 :
<A href=“A0201010300.htm”>基本編: 操作&手順: 参照<3></A>
次に、文書処理システムにおけるデバッグ処理について説明する。
Watch Point: :C6[SECTION] (C4[CHAPTER]の配下)
E2 http://server/template.html: 2行:[代入可能] 繰返し: C6[SECTION]: 3 回の繰返し中 2 回目の流し込みです。
| {{$SECTION.title$[[($SECTION.whatsNew$)]]:
| *
| + E3 http://server/template.html: 2行:[代入可能] 変数: 値は [機能1] です。
| | {{$SECTION.title$[[($SECTION.whatsNew$)]]:
| | *
| + E4 http://server/template.html: 2行:[代入可能] 選択範囲: 選択されました。
| | {{$SECTION.title$[[($SECTION.whatsNew$)]]:
| | *
| | + E6 http://server/template.html: 2行:[代入可能] 変数: 値は [新着] です。
| | | {{$SECTION.title$[[($SECTION.whatsNew$)]]:
| | | *
Watch Point: :C6[SECTION] (C4[CHAPTER]の配下)
E2 http://server/template.html: 2行:[代入可能] 繰返し: C6[SECTION]: 3 回の繰返し中 2 回目の流し込みです。
| {{$SECTION.title$[[($SECTION.whatsnew$)]]:
| *
| + E3 http://server/template.html: 2行:[代入可能] 変数: 値は [機能1] です。
| | {{$SECTION.title$[[($SECTION.whatsnew$)]]:
| | *
| + E4 http://server/template.html: 2行:[代入不能] 選択範囲: 選択されません。
| | {{$SECTION.title$[[($SECTION.whatsnew$)]]:
| | *
| | + E6 http://server/template.html: 2行:[代入不能] 変数: SECTION は指定した属性 whatsnewの値がありません。
| | | {{$SECTION.title$[[($SECTION.whatsnew$)]]:
| | | *
次に、テンプレートに組み込み可能なエンコード要素について説明する。例えばXMLやHTMLなどといった文書を表現する言語では、言語の仕様上、通常の文字列には使用できない文字が存在し、その文字を文字列に組み込むには特殊な修飾を行うなどの処置が必要になる場合がある。このように、文書を表現する言語に応じた文字の置き換えを指示するために用いるのがエンコード要素である。
#encode XMLEntityEncoding
#directory $*.ID$==$JUMP.JUMPID$
<A href=”$SECTION.ID$.htm”>$PART.title$:$CHAPTER.title$:$SECTION.title$</A>
#end
#end
6.着目ノードEがエンコード要素なら、唯一の子のテンプレート要素Ecの判定値をEの判定値とする。
6.着目ノードEがエンコード要素なら、グローバル変数(ENCODER)にエンコード方式を設定し、Eの唯一の子のテンプレート要素Ecのマッチング判定結果が<代入可能>か<確定>である場合に、Ecを指定して再帰的に流し込み処理を行う。
2.着目ノードEが変数要素なら、マッチング処理で記録したvをグローバル変数(ENCODER)に指定されたエンコード方式でエンコード処理して出力する。
<A href=“A0201010300.htm”>基本編: 操作&手順: 参照<3></A>
ここでは、上述の文書処理システムを利用して複数文書にわたる索引を生成する例を説明する。
1.rootエントリを追加
2.サブレコードの属性の集合に対しtag及びg.INDEX属性を追加
3.各エントリのtag, g.INDEX属性に分類出力指示に従い属性値を設定(rootには更にtitle属性値を設定)
1.g.INDEX属性でソート
2.INDEXデータエントリを追加
3.階層構造を生成(コンテキスト識別子の付与)
4.要素名がないエントリについてtagから要素名を付与
<HTML>
<H1> $ROOT.title$
{{<H2>$INDEX.title$</H2>
{{[[<A href="$FOLDER.url_1$"> $FOLDER.title$ </A>
]][[<A href="$DOCUMENT.url_1$"> $DOCUMENT.title$ </A>
]][[<A href="$PART.url_1$"> $PART.title$ </A>
]][[<A href="$CHAPTER.url_1$"> $CHPATER.title$ </A>
]][[<A href="$SECTION.url_1$"> $SECTION.title$ </A>
]]}}}}</HTML>
<HTML>
<H1> 索引
<H2>あ行</H2>
<A href="A0102010000.html"> 応用編 </A>
<A href="A0202010000.html"> 応用編 </A>
<H2>か行</H2>
<A href="A0101010100.html"> 機能1 </A>
<A href="A0101010200.html"> 機能2 </A>
<A href="A0101010300.html"> 機能3 </A>
<A href="A0101000000.html"> 基本編 </A>
<A href="A0201000000.html"> 基本編 </A>
<H2>さ行</H2>
<A href="A0201010100.html"> 参照<1> </A>
<A href="A0201010200.html"> 参照<2> </A>
<A href="A0201010300.html"> 参照<3> </A>
<A href="A0100000000.html"> 説明書 </A>
<H2>は行</H2>
<H2>や行</H2>
<A href="A0200000000.html"> 用語集 </A>
</HTML>
Claims (12)
- 文書データベース内の階層構造をなすフォルダ群のいずれかのフォルダに格納される複数の構造化文書に対して1以上のテンプレートを適用した結果を生成するためにコンピュータシステムが実行する文書処理方法であって、
前記文書データベース内の前記各フォルダ、及び、それらフォルダに格納される各構造化文書を構成する各文書要素は、それぞれ前記文書データベース内で該フォルダ又は該文書要素を一意に特定するID属性を有し、
前記方法は、
構造を成す文書要素群からなる第1の構造化文書を取得し、
文書データベースのフォルダ群がなす階層構造の情報を取得し、
第1の構造化文書の文書要素群がなす構造を、フォルダ群がなす階層構造において当該第1の構造化文書が格納されているフォルダの位置に併合することにより、統合構造情報を作成し、
前記統合構造情報における各フォルダ又は文書要素に対し、該フォルダ又は文書要素のID属性を含んだファイル名をアクセス情報属性として追加し、
前記アクセス情報属性追加後の前記統合構造情報に対してテンプレートを適用する、
と共に、
前記統合構造情報に対してテンプレートを適用する処理では、前記統合構造情報内のフォルダ又は文書要素に対してテンプレートを適用して得られたデータを、該フォルダ又は文書要素の前記アクセス情報属性が表すファイル名を持つファイルとして保存することにより、該ファイル名を用いて当該データにアクセスできるようにする、
ことを特徴とする文書処理方法。 - 請求項1記載の文書処理方法であって、
前記統合構造情報を作成する処理では、前記文書データベース内の各フォルダの属性情報と、前記第1の構造化文書の各文書要素の属性情報と、を前記統合構造情報内の各フォルダ及び各文書要素に対応づけて記憶し、
前記統合構造情報に対してテンプレートを適用する処理は、各フォルダ又は各文書要素に対応づけて記憶された属性情報を前記テンプレートの対応箇所に代入する、
ことを特徴とする文書処理方法。 - 請求項1記載の文書処理方法であって、
前記統合構造情報を作成する処理では、更に、第1の構造化文書の文書要素から参照される第2の構造化文書の文書要素群がなす構造を、前記統合構造情報における当該第2の構造化文書が格納されているフォルダの位置に併合する、
ことを特徴とする文書処理方法。 - 請求項1記載の文書処理方法であって、更に、
フォルダ又は文書要素の種別と当該種別に対して適用すべきテンプレートとの対応関係を示す対応情報を取得し、
前記統合構造情報に対してテンプレートを適用する処理では、前記統合構造情報における各フォルダ又は各文書要素に対し、対応情報に示される当該フォルダ又は文書要素の種別に対応するテンプレートを適用する、
処理を行うことを特徴とする文書処理方法。 - 請求項1記載の文書処理方法であって、更に、前記コンピュータシステムは、
フォルダ又は文書要素の種別と当該種別に対して適用すべき複数のテンプレートとの対応関係を示す対応情報を取得する処理を更に実行し、
前記統合構造情報における各フォルダ又は文書要素に対し、前記アクセス情報属性を追加する処理では、前記対応情報における該フォルダ又は該文書要素に適用すべきテンプレートごとに、該フォルダ又は該文書要素のID属性と該テンプレートを特定する情報とを含むファイル名をアクセス情報属性として追加し、
前記統合構造情報に対してテンプレートを適用する処理では、前記統合構造情報における各フォルダ又は各文書要素に対して前記対応情報に示される当該フォルダ又は文書要素の種別に対応する各テンプレートを適用し、前記統合構造情報内のフォルダ又は文書要素に対してテンプレートを適用して得られたデータを、該フォルダ又は文書要素の前記アクセス情報属性が表すファイル名を持つファイルとして保存することにより、該ファイル名を用いて当該データにアクセスできるようにする、
ことを特徴とする方法。 - 請求項1記載の文書処理方法であって、
前記統合構造情報における1つのフォルダ又は文書要素に対し、複数のテンプレートの適用が指示された場合に、前記統合構造情報における各フォルダ又は文書要素に対し、前記アクセス情報属性を追加する処理では、それら各テンプレートごとに、該フォルダ又は文書要素のID属性と該テンプレートを特定する情報とを含むファイル名をアクセス情報属性として追加し、
前記統合構造情報に対してテンプレートを適用する処理では、前記統合構造情報におけるフォルダ又は文書要素に対して前記各テンプレートを適用し、前記統合構造情報内のフォルダ又は文書要素に対してテンプレートを適用して得られたデータを、該フォルダ又は文書要素の前記アクセス情報属性が表すファイル名を持つファイルとして保存することにより、該ファイル名を用いて当該データにアクセスできるようにする、
ことを特徴とする方法。 - 請求項1記載の文書処理方法であって、
フォルダ又は文書要素の種別と当該種別に対して適用すべきテンプレートとの対応関係を示す対応情報を取得し、
前記統合構造情報に対してテンプレートを適用する処理では、前記統合構造情報におけるフォルダ又は文書要素のうち、該テンプレートを適用すべき種別に該当するものを該対応情報から求め、求めたフォルダ又は文書要素をカレント要素とし、該カレント要素を基点として該テンプレートを適用する
処理を行うことを特徴とする文書処理方法。 - 請求項7記載の文書処理方法であって、
前記統合構造情報に対してテンプレートを適用する処理では、該テンプレートの要素群がなす構造を解析して解析ツリーを求め、前記統合構造情報における前記カレント要素の周囲の構造と該解析ツリーとのマッチング処理により、該テンプレートの要素にマッチする前記統合構造情報内のフォルダ又は文書要素を求め、該テンプレートの各要素に対し、それにマッチする前記統合構造情報内のフォルダ又は文書要素の情報を流し込む、
ことを特徴とする文書処理方法。 - 請求項7記載の文書処理方法であって、
前記テンプレートには、ディレクトリ要素を組み込むことができ、
前記統合構造情報に対してテンプレートを適用する処理では、該テンプレート中のディレクトリ要素を検出すると、前記統合構造情報内のフォルダ又は文書要素のうち該ディレクトリ要素中に記述される条件を満足するフォルダ又は文書要素をカレント要素とした上で、該ディレクトリ要素中のテンプレート内容を適用する、
ことを特徴とする文書処理方法。 - 請求項1記載の文書処理方法であって、
前記テンプレートには、エンコード要素を組み込むことができ、
前記統合構造情報に対してテンプレートを適用する処理では、該エンコード要素内のテンプレート内容の適用結果の文字列に対し、該エンコード要素が示すエンコードを施す、
ことを特徴とする文書処理方法。 - 文書データベース内の階層構造をなすフォルダ群のいずれかのフォルダに格納される複数の構造化文書に対して1以上のテンプレートを適用した結果を生成する処理をコンピュータシステムに実行させるためのプログラムであって、
前記文書データベース内の前記各フォルダ、及び、それらフォルダに格納される各構造化文書を構成する各文書要素は、それぞれ前記文書データベース内で該フォルダ又は該文書要素を一意に特定するID属性を有し、
該コンピュータシステムに、
構造を成す文書要素群からなる第1の構造化文書を取得し、
文書データベースのフォルダ群がなす階層構造の情報を取得し、
第1の構造化文書の文書要素群がなす構造を、フォルダ群がなす階層構造において当該第1の構造化文書が格納されているフォルダの位置に併合することにより、統合構造情報を作成し、
前記統合構造情報における各フォルダ又は文書要素に対し、該フォルダ又は文書要素のID属性を含んだファイル名をアクセス情報属性として追加し、
前記アクセス情報属性追加後の前記統合構造情報に対してテンプレートを適用する、
処理を実行させる、
と共に、
前記統合構造情報に対してテンプレートを適用する処理では、前記統合構造情報内のフォルダ又は文書要素に対してテンプレートを適用して得られたデータを、該フォルダ又は文書要素の前記アクセス情報属性が表すファイル名を持つファイルとして保存することにより、該ファイル名を用いて当該データにアクセスできるようにする、
ためのプログラム。 - 文書データベース内の階層構造をなすフォルダ群のいずれかのフォルダに格納される複数の構造化文書に対して1以上のテンプレートを適用した結果を生成する文書処理システムであって、
前記文書データベース内の前記各フォルダ、及び、それらフォルダに格納される各構造化文書を構成する各文書要素は、それぞれ前記文書データベース内で該フォルダ又は該文書要素を一意に特定するID属性を有し、
前記文書処理システムは、
構造を成す文書要素群からなる第1の構造化文書を取得する手段、
文書データベースのフォルダ群がなす階層構造の情報を取得する手段、
第1の構造化文書の文書要素群がなす構造を、フォルダ群がなす階層構造において当該第1の構造化文書が格納されているフォルダの位置に併合することにより、統合構造情報を作成する手段、
前記統合構造情報における各フォルダ又は文書要素に対し、該フォルダ又は文書要素のID属性を含んだファイル名をアクセス情報属性として追加する手段、及び、
前記アクセス情報属性追加後の前記統合構造情報に対してテンプレートを適用する手段、
を備え、
前記統合構造情報に対してテンプレートを適用する手段は、前記統合構造情報内のフォルダ又は文書要素に対してテンプレートを適用して得られたデータを、該フォルダ又は文書要素の前記アクセス情報属性が表すファイル名を持つファイルとして保存することにより、該ファイル名を用いて当該データにアクセスできるようにする、
ことを特徴とする文書処理システム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005353456A JP4997749B2 (ja) | 2005-12-07 | 2005-12-07 | 文書処理方法、プログラム及びシステム |
AU2006213978A AU2006213978B2 (en) | 2005-12-07 | 2006-09-18 | Document processing method, recording medium, and document processing system |
US11/524,830 US7912846B2 (en) | 2005-12-07 | 2006-09-21 | Document processing method, recording medium, and document processing system |
KR1020060103445A KR100890966B1 (ko) | 2005-12-07 | 2006-10-24 | 문서 처리 방법, 기록 매체 및 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005353456A JP4997749B2 (ja) | 2005-12-07 | 2005-12-07 | 文書処理方法、プログラム及びシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007156965A JP2007156965A (ja) | 2007-06-21 |
JP4997749B2 true JP4997749B2 (ja) | 2012-08-08 |
Family
ID=38119997
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005353456A Expired - Fee Related JP4997749B2 (ja) | 2005-12-07 | 2005-12-07 | 文書処理方法、プログラム及びシステム |
Country Status (4)
Country | Link |
---|---|
US (1) | US7912846B2 (ja) |
JP (1) | JP4997749B2 (ja) |
KR (1) | KR100890966B1 (ja) |
AU (1) | AU2006213978B2 (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9880980B2 (en) * | 2007-03-05 | 2018-01-30 | International Business Machines Corporation | Document transformation performance via incremental fragment transformations |
US20080263071A1 (en) * | 2007-04-19 | 2008-10-23 | Sharp Laboratories Of America, Inc. | Systems and methods for driverless imaging of documents |
US7933871B2 (en) * | 2007-12-28 | 2011-04-26 | Microsoft Corporation | Discovering and updating templates |
US8239387B2 (en) * | 2008-02-22 | 2012-08-07 | Yahoo! Inc. | Structural clustering and template identification for electronic documents |
US9946584B2 (en) * | 2008-03-14 | 2018-04-17 | Northrop Grumman Systems Corporation | Systems and methods for extracting application relevant data from messages |
US7996435B2 (en) * | 2008-12-01 | 2011-08-09 | Sap Ag | Apparatus and method for comparing computer documents using tree structures |
JP5090408B2 (ja) | 2009-07-22 | 2012-12-05 | インターナショナル・ビジネス・マシーンズ・コーポレーション | ネットワーク通信において送信データの宛先を動的に制御する方法及び機器 |
FR2962236B1 (fr) * | 2010-06-30 | 2012-07-13 | Alcatel Lucent | Acces a un systemes de fichiers avec indexation semantique |
JP5539127B2 (ja) * | 2010-09-09 | 2014-07-02 | キヤノン株式会社 | 文書管理システム、検索指定方法、プログラム |
JP5496853B2 (ja) * | 2010-10-29 | 2014-05-21 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 構造化文書を分類するためのルールを生成するための方法、並びにそのコンピュータ・プログラム及びコンピュータ |
US9367524B1 (en) * | 2012-06-06 | 2016-06-14 | Google, Inc. | Systems and methods for selecting web page layouts including content slots for displaying content items based on predicted click likelihood |
JP6481515B2 (ja) * | 2015-05-29 | 2019-03-13 | 富士通株式会社 | 情報処理装置、コンパイル方法、及びコンパイラプログラム |
JP6876227B2 (ja) * | 2016-08-15 | 2021-05-26 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、プログラム及び情報処理システム |
CN108563747A (zh) * | 2018-04-13 | 2018-09-21 | 北京深度智耀科技有限公司 | 一种文档处理方法及装置 |
JP6638053B1 (ja) * | 2018-12-05 | 2020-01-29 | グレイステクノロジー株式会社 | ドキュメント作成支援システム |
CN111027294B (zh) * | 2019-12-12 | 2023-05-30 | 中国联合网络通信集团有限公司 | 表格汇总的方法、装置及*** |
US11314765B2 (en) | 2020-07-09 | 2022-04-26 | Northrop Grumman Systems Corporation | Multistage data sniffer for data extraction |
CN113283228A (zh) * | 2021-07-22 | 2021-08-20 | 北京关键科技股份有限公司 | 文档生成方法、装置、电子设备及存储介质 |
CN113657080A (zh) * | 2021-08-11 | 2021-11-16 | 成都海光核电技术服务有限公司 | 一种基于xml的结构化***及数据包创建方法 |
CN114298238A (zh) * | 2021-12-31 | 2022-04-08 | 瀚云科技有限公司 | 一种档案创建方法、装置、电子设备及存储介质 |
CN115688733B (zh) * | 2022-12-29 | 2023-05-02 | 南方电网科学研究院有限责任公司 | 标准文档编写的方法和*** |
CN117436429B (zh) * | 2023-12-22 | 2024-05-17 | 珠海格力电器股份有限公司 | 文档导出方法、装置、计算机设备和存储介质 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08115323A (ja) * | 1994-10-18 | 1996-05-07 | Toppan Printing Co Ltd | 自動ページアップルール作成装置 |
US6732111B2 (en) * | 1998-03-03 | 2004-05-04 | Siebel Systems, Inc. | Method, apparatus, system, and program product for attaching files and other objects to a partially replicated database |
JPH11353307A (ja) * | 1998-06-04 | 1999-12-24 | Nec Corp | 情報変換装置 |
US7039860B1 (en) * | 1999-10-01 | 2006-05-02 | Netspinner Solutions As | Creating web pages category list prior to the list being served to a browser |
JP3879350B2 (ja) * | 2000-01-25 | 2007-02-14 | 富士ゼロックス株式会社 | 構造化文書処理システム及び構造化文書処理方法 |
WO2001063382A2 (en) * | 2000-02-25 | 2001-08-30 | Synquiry Technologies, Ltd. | Conceptual factoring and unification of graphs representing semantic models |
JP3703080B2 (ja) * | 2000-07-27 | 2005-10-05 | インターナショナル・ビジネス・マシーンズ・コーポレーション | ウェブコンテンツを簡略化するための方法、システムおよび媒体 |
US20030050932A1 (en) * | 2000-09-01 | 2003-03-13 | Pace Charles P. | System and method for transactional deployment of J2EE web components, enterprise java bean components, and application data over multi-tiered computer networks |
US7475151B2 (en) * | 2000-12-22 | 2009-01-06 | Oracle International Corporation | Policies for modifying group membership |
US6950981B2 (en) * | 2000-12-29 | 2005-09-27 | International Business Machines Corporation | Method and system for providing task information in a place |
US7028262B2 (en) * | 2000-12-29 | 2006-04-11 | International Business Machines Corporation | Method and system for designing a theme and associating it with a collaboration space user interface |
MXPA03011976A (es) * | 2001-06-22 | 2005-07-01 | Nervana Inc | Sistema y metodo para la recuperacion, manejo, entrega y presentacion de conocimientos. |
JP2004086855A (ja) | 2002-06-28 | 2004-03-18 | Fuji Xerox Co Ltd | 文書処理装置及び文書処理方法、文書処理プログラム |
US20040205581A1 (en) * | 2002-07-15 | 2004-10-14 | Gava Fabio M. | Hierarchical storage |
WO2004061713A1 (ja) * | 2002-12-27 | 2004-07-22 | Fujitsu Limited | 構造化文書の構造変換装置、構造変換方法、記録媒体 |
JP2004252665A (ja) * | 2003-02-19 | 2004-09-09 | Canon Inc | 文書処理方法 |
KR20040090866A (ko) * | 2003-04-18 | 2004-10-27 | (주)아이펜텍 | 폼을 이용하는 xml 문서 편집기 및 xml 문서편집기가 기록된 컴퓨터로 읽을 수 있는 기록 매체 |
JP3922372B2 (ja) * | 2003-07-28 | 2007-05-30 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 構造化文書処理装置、およびプログラム |
DE60311805T2 (de) * | 2003-08-28 | 2007-11-22 | Accenture Global Services Gmbh | Erfassung, Zusammenstellung und/oder Visualisierung von strukturellen Merkmalen von Architekturen |
US7379945B1 (en) * | 2003-10-20 | 2008-05-27 | International Business Machines Corporation | Virtual foldering system for blending process and content in a collaborative environment |
JP4410005B2 (ja) * | 2004-03-22 | 2010-02-03 | 富士通株式会社 | 構造化文書の構造変換装置、プログラム |
-
2005
- 2005-12-07 JP JP2005353456A patent/JP4997749B2/ja not_active Expired - Fee Related
-
2006
- 2006-09-18 AU AU2006213978A patent/AU2006213978B2/en not_active Ceased
- 2006-09-21 US US11/524,830 patent/US7912846B2/en not_active Expired - Fee Related
- 2006-10-24 KR KR1020060103445A patent/KR100890966B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
US7912846B2 (en) | 2011-03-22 |
AU2006213978A1 (en) | 2007-06-21 |
AU2006213978B2 (en) | 2008-07-10 |
KR20070059939A (ko) | 2007-06-12 |
US20070130176A1 (en) | 2007-06-07 |
JP2007156965A (ja) | 2007-06-21 |
KR100890966B1 (ko) | 2009-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4997749B2 (ja) | 文書処理方法、プログラム及びシステム | |
JP4657432B2 (ja) | 階層構造の構造化文書を変換する装置 | |
JP4267336B2 (ja) | 構造パターン候補を生成する方法、システムおよびプログラム | |
US7143344B2 (en) | Transformation stylesheet editor | |
US6792475B1 (en) | System and method for facilitating the design of a website | |
US20090210780A1 (en) | Document processing and management approach to creating a new document in a mark up language environment using new fragment and new scheme | |
EP1821185A1 (en) | Data processing device and data processing method | |
US20080040588A1 (en) | Data Processing Device and Data Processing Method | |
US20070204215A1 (en) | Device for analyzing log files generated by process automation tools | |
EP1821176A1 (en) | Data processing device and data processing method | |
JPWO2006051715A1 (ja) | 文書処理装置及び文書処理方法 | |
JP2004502993A (ja) | 訓練可能で拡張可能な自動化データ/知識翻訳機 | |
US20080046809A1 (en) | Data Processing Device and Data Processing Method | |
JP5053550B2 (ja) | 文書処理装置及び方法と文書処理システム | |
CN113177168B (zh) | 一种基于Web元素属性特征的定位方法 | |
JPWO2006051713A1 (ja) | 文書処理装置及び文書処理方法 | |
CN110489625A (zh) | 一种网页数据采集模板的生成方法和装置 | |
US20090083300A1 (en) | Document processing device and document processing method | |
EP1830274A1 (en) | Server device and name space issuing method | |
JPWO2006051712A1 (ja) | 文書処理装置及び文書処理方法 | |
JPWO2006051716A1 (ja) | 文書処理装置及び文書処理方法 | |
KR100522186B1 (ko) | 동적으로 홈페이지를 제작하는 방법 및 이 방법을 웹에서구현하는 장치 | |
US20080005085A1 (en) | Server Device and Search Method | |
JP3842576B2 (ja) | 構造化文書編集方法及び構造化文書編集システム | |
JPWO2006051717A1 (ja) | 文書処理装置及び文書処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110901 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120417 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120430 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4997749 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150525 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |