JP4899476B2 - 分割プログラム、連結プログラム、情報処理方法 - Google Patents
分割プログラム、連結プログラム、情報処理方法 Download PDFInfo
- Publication number
- JP4899476B2 JP4899476B2 JP2005380328A JP2005380328A JP4899476B2 JP 4899476 B2 JP4899476 B2 JP 4899476B2 JP 2005380328 A JP2005380328 A JP 2005380328A JP 2005380328 A JP2005380328 A JP 2005380328A JP 4899476 B2 JP4899476 B2 JP 4899476B2
- Authority
- JP
- Japan
- Prior art keywords
- tag
- identification
- description
- output file
- record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/131—Fragmentation of text files, e.g. creating reusable text-blocks; Linking to fragments, e.g. using XInclude; Namespaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/154—Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(1)XMLについて
ここで、XML規格に基づき、専門用語の呼び方を定めておく。一対の“<”と“>”で囲まれた文字列をタグ、“<文字列>”を開始タグ、“</文字列>”を終了タグ、開始タグから終了タグまでの文字列全体を要素、開始タグと終了タグで挟まれた文字列を要素内容、タグ内に記述される要素の名前を要素名(あるいはタグ名)、要素に対する付加情報を属性と呼ぶ。
代表的な構造化文書であるXML文書では、応用ソフトウェアからXML文書を扱うために、DOM(Document Object Model)と、SAX(Simple API for XML)と呼ばれる二つの標準的なインタフェース(API: Application Programming Interface)規格が定められている。
一方、DOMは、一般に低速で、メモリ消費が大きいが、文書の要素を階層的なツリー状に展開するため、複雑な処理内容でもプログラムが組み易いという特徴を持つ。XML文書の更新には主にDOMが使われる。
XML文書の形式変換には、XML環境に標準装備されているXSL変換が用いられる。しかし、XSL変換は、ファイルサイズの10倍程度の大量のメモリを消費するため、50MB規模以上の大容量のXML文書をメモリ上で直接形式を変換することが困難であり、従来、下記のような対策(i)〜(iii)の方法が採られた。最も手間が少ない方法は対策(i)だが、複雑な構造を持つ文書には対応が難しかった。
この対策として、特許文献1には、XML文書をDOMで処理する場合において、解析された要素をノードとする部分木をメモリ上に展開するとともに、その過程で、既定の停止条件になったことを契機として不要なノードを削除することで、メモリ不足に陥ることなく、解析処理を継続させようとする技術が開示されている。
"Streaming Transformations for XML (STX) Version 1.0"[2005年12月8日検索]、インターネット<http://stx.sourceforge.net/>
本発明の他の目的は、必要以上に大きなメモリ資源を必要とすることなく、複雑なデータ構造を持つ大容量のXML文書等の構造化文書を自動的に変換処理することが可能な技術を提供することにある。
分割順序に対応した固有名を有する個々の前記第2構造化文書に前記第1構造化文書の前記情報を先頭側から既定量だけ順に複写する第1処理と、
個々の前記第2構造化文書が前記第1構造化文書と同じ階層構造を持つように開始タグおよび/または終了タグを前記ファイルに付加する第2処理と、
をコンピュータに実行させる分割プログラムを提供する。
さらに、個々の前記第2構造化文書に付加された前記開始タグおよび/または終了タグを識別するための識別タグを付加する第3処理を前記コンピュータに実行させる分割プログラムを提供する。
前記第1および第2構造化文書は、XML(eXtensible Markup Language)で記述されたXML文書である分割プログラムを提供する。
前記情報に含まれる冗長な開始タグおよび/または終了タグを除去して、前記第1構造化文書と同一の階層構造を有する第2構造化文書に併合する第2処理と、
をコンピュータに実行させる連結プログラムを提供する。
前記第2処理では、冗長な前記開始タグおよび/または終了タグを識別するために個々の前記第1構造化文書に付加された識別タグに基づいて、当該冗長な前記開始タグおよび/または終了タグを識別して除去する連結プログラムを提供する。
前記第1および第2構造化文書はXML(eXtensible Markup Language)で記述されたXML文書である連結プログラムを提供する。
変換前の第1構造化文書の情報を先頭側から既定量だけ順に第1記憶手段に複写する第1ステップと、
前記第1記憶手段に複写された前記情報が完結した一つの第2構造化文書となるように開始タグおよび/または終了タグと、当該開始タグおよび/または終了タグを識別するための識別タグとを付加する第2ステップと、
前記第1記憶手段に構成された前記第2構造化文書を目的の書式に変換して第3構造化文書として第2記憶手段に出力する第3ステップと、
前記第2記憶手段に保持された前記第3構造化文書から、前記第2ステップで付加された前記開始タグおよび/または終了タグと前記識別タグとを除去して、第4構造化文書に併合する第4ステップと、
を含む情報処理方法を提供する。
前記第3ステップでは、前記第2構造化文書に含まれる複数の要素を、CSV(Comma Separated Value)形式で羅列して一つに要素にまとめるCSV圧縮変換を行う情報処理方法を提供する。
前記構造化文書はXML(eXtensible Markup Language)で記述されたXML文書である情報処理方法を提供する。
本発明では、たとえば、大容量XML文書を分割変換するときに、ストリーム型のAPIによりXMLファイルを読み取って、指定したサイズごとの複数個に分割し、分割したファイルに、併合時に分割順序が分かるように、ファイル名に一連番号を付ける。
一つはデータ型XML文書と呼ばれ、伝票、予定表など、タグ数が多く、要素内容の短いものである。
本発明は、たとえば、データ型XML文書を対象にしてAPIの簡単化を図ることができる。
これによって、主記憶の容量を増大させることなく、たとえば、大容量XML文書におけるレコード単位の変換を、標準のXSLTスタイルシートを用いて変換ができるようになる。
また、必要以上に大きなメモリ資源を必要とすることなく、複雑なデータ構造を持つ大容量のXML文書等の構造化文書を、自動的に変換処理することが可能となる。
図1は、本発明の一実施の形態である分割プログラムおよび連結プログラム、情報処理方法の作用の一例を示す概念図である。
図3は、本発明の実施の形態の分割プログラムおよび連結プログラム、情報処理方法を実施する情報処理装置の構成の一例を示す概念図である。
本実施の形態の情報処理装置10は、中央処理装置11、主記憶12、外部記憶装置13、ディスプレイ14、情報入力装置15、ネットワークインタフェース16、を含んでいる。
主記憶12は、たとえば半導体メモリで構成され、中央処理装置11が実行するソフトウェアやデータが格納される。
ストリーミング型パーサプログラム22、分割プログラム101、XSL変換プロセッサ110、連結プログラム201は、オペレーティングシステム21の配下で稼働するアプリケーションプログラムである。
本実施の形態の場合、この外部記憶装置13には、システムフォルダ20、大容量XML文書100、併合XML文書200、フォルダ102、フォルダ202、スタイルシート110a、が格納されている。
分割プログラム101は、ストリーミング型パーサプログラム22を介して構造解析を行いつつ大容量XML文書100を読み込んで複数の小容量XML文書102aに分割する処理を行う。
ディスプレイ14は、情報の可視化表示を行う。
外部記憶装置13に格納されている上述の情報は、ネットワークインタフェース16を介して外部の図示しないサーバ装置や記憶装置に配置して情報処理装置10からアクセスしてもよい。
図1に示すように、大容量XML文書100を入力し、分割プログラム101を用いて、小容量XML文書102aに分割する。分割した複数の小容量XML文書102aには連番のファイル名を付して、フォルダ102に格納する。
図2に、簡単な1階層の大容量XML文書の場合の分割変換の例を示す。
最後の小容量XML文書102aは、ルート要素「社員名簿」の追加開始タグ51のみが文書の先頭に付加される。
なお、連結プログラム201では、上述と逆の方法で、分割制御情報103にて指定されたレコード100aの数に基づいて、個々の小容量XML文書202a内の冗長な追加開始タグ51、追加終了タグ52を除去することで、一つの併合XML文書200に併合できる。
XSL変換プロセッサ110では、入力される小容量XML文書102aの全体を主記憶12の作業領域に展開するが、小容量XML文書102a自体が小容量であるため、作業領域のメモリ容量は小さくて済むので、主記憶12を必要以上に大きくする必要がない。
図5は、本実施の形態における大容量XML文書の分割処理の一例を示すフローチャートである。
図4において対象とする大容量XML文書100(list2.xml)は売上実績のデータである。ルート要素「売上実績」の下に「マスタ」と「売上」要素を持ち、「マスタ」の下にはさらに「得意先マスタ」と「商品マスタ」の階層を持つ。
最終の小容量XML文書102aでは、2番目の小容量XML文書102aの開始と同様に、階層の開始タグ(追加開始タグ51)と識別用スタート・タグ61を付加して作成処理を開始し、指定したレコード数未満をコピーすることになるので、階層の終了タグ(終了タグ42)もそのままコピーして終了する。
まず、ステップS610で、分割制御情報103として、対象とするレコード100aの要素名と、ファイル分割単位のレコード数を情報入力装置15やファイルから入力する。
ステップS612で、大容量XML文書100の内容を1行づつ読み取る。
ステップS640で、入力ファイルのファイルエンドを検出した場合、ステップS642で、入力ファイルをクローズして終了する。
このように、図4、図5、図6に例示した変形例では、大容量XML文書100を複数の小容量XML文書102aに分割する際に、分割位置の前後にタグ階層の深さに合わせて追加開始タグ51および/または追加終了タグ52を付加する。このため、比較的複雑な構造を持つ大容量XML文書100の場合にも、的確かつ自動的に小容量XML文書102aへの分割を行うことができる。
今まで述べてきた実施の形態は、大容量XML文書100を一括して複数の小容量XML文書102aに分割し、一括して変換して複数の小容量XML文書202aの各々に出力し、小容量XML文書202aを、一括して併合XML文書200に出力するものであった。これは一括分割変換となる。
分割部410は、上述の分割プログラム101と同様の処理を行うが、出力部分が若干異なる。
以下、上述の逐次分割変換の作用について説明する。図8は、本実施の形態の逐次分割変換の作用一例を示すフローチャートである。
ステップS704、ステップS709で、読み取った内容が開始タグで対象とするレコード100aならば、ステップS712でレコード要素とレコード内の要素を全てコピーする。
もし、ステップS714で計数しているレコード数が、入力したレコード数に達していない場合は、そのままステップS703に戻る。
一括分割変換は、分割プログラム101、フォルダ102等のソフトウェアの構造がシンプルになる。
レコード100aを単位とするソート処理では、大容量XML文書100上で行うことが必要になるが、この場合は本願発明者によって別に出願済みの発明である「XML CSV圧縮」(特開2003−203067号公報、特開2005−267531号公報、参照)と、本実施の形態の分割変換を組合せれば、省リソースでソート処理を行うことが可能となる。
上述の実施の形態の例では、変換処理としてCSV圧縮を行う場合、小容量XML文書202aの「社員」のレコード100a内における要素「連絡先」に例示されるように、レコード内で1個のCSV要素を持つ場合について説明した。これは、CSV要素を複数個にした場合も、CSV圧縮文書(併合XML文書200)のヘッダにおいて、その複数個のCSV要素に格納されている要素名を記述しておき、上述と同様に読み取って2つのデータ用連想配列を用いて、API上で管理することができる。
なお、本発明は、上述の実施の形態に例示した構成に限らず、その趣旨を逸脱しない範囲で種々変更可能であることは言うまでもない。
第1構造化文書に含まれる情報を複数の第2構造化文書に分割する分割プログラムであって、
分割順序に対応した固有名を有する個々の前記第2構造化文書に前記第1構造化文書の前記情報を先頭側から既定量だけ順に複写する第1処理と、
個々の前記第2構造化文書が前記第1構造化文書と同じ階層構造を持つように開始タグおよび/または終了タグを前記ファイルに付加する第2処理と、
をコンピュータに実行させることを特徴とする分割プログラム。
(付記2)
付記1記載の分割プログラムにおいて、
さらに、個々の前記第2構造化文書に付加された前記開始タグおよび/または終了タグを識別するための識別タグを付加する第3処理を前記コンピュータに実行させることを特徴とする分割プログラム。
(付記3)
付記1記載の分割プログラムにおいて、
前記第1および第2構造化文書は、XML(eXtensible Markup Language)で記述されたXML文書であることを特徴とする分割プログラム。
(付記4)
共通の階層構造を有する複数の第1構造化文書の各々から、連結順序を示すように個々の当該第1構造化文書に付与された固有名に基づく順序で情報を読み取る第1処理と、
前記情報に含まれる冗長な開始タグおよび/または終了タグを除去して、前記第1構造化文書と同一の階層構造を有する第2構造化文書に併合する第2処理と、
をコンピュータに実行させることを特徴とする連結プログラム。
(付記5)
付記4記載の連結プログラムにおいて、
前記第2処理では、冗長な前記開始タグおよび/または終了タグを識別するために個々の前記第1構造化文書に付加された識別タグに基づいて、当該冗長な前記開始タグおよび/または終了タグを識別して除去することを特徴とする連結プログラム。
(付記6)
付記4記載の連結プログラムにおいて、
前記第1および第2構造化文書はXML(eXtensible Markup Language)で記述されたXML文書であることを特徴とする連結プログラム。
(付記7)
構造化文書の書式を変換する情報処理方法であって、
変換前の第1構造化文書の情報を先頭側から既定量だけ順に第1記憶手段に複写する第1ステップと、
前記第1記憶手段に複写された前記情報が完結した一つの第2構造化文書となるように開始タグおよび/または終了タグと、当該開始タグおよび/または終了タグを識別するための識別タグとを付加する第2ステップと、
前記第1記憶手段に構成された前記第2構造化文書を目的の書式に変換して第3構造化文書として第2記憶手段に出力する第3ステップと、
前記第2記憶手段に保持された前記第3構造化文書から、前記第2ステップで付加された前記開始タグおよび/または終了タグと前記識別タグとを除去して、第4構造化文書に併合する第4ステップと、
を含むことを特徴とする情報処理方法。
(付記8)
付記7記載の情報処理方法において、
前記第3ステップでは、前記第2構造化文書に含まれる複数の要素を、CSV(Comma Separated Value)形式で羅列して一つに要素にまとめるCSV圧縮変換を行うことを特徴とする情報処理方法。
(付記9)
付記7記載の情報処理方法において、
前記構造化文書はXML(eXtensible Markup Language)で記述されたXML文書であることを特徴とする情報処理方法。
11 中央処理装置
12 主記憶
13 外部記憶装置
14 ディスプレイ
15 情報入力装置
16 ネットワークインタフェース
20 システムフォルダ
21 オペレーティングシステム
22 ストリーミング型パーサプログラム
41 開始タグ
42 終了タグ
51 追加開始タグ
52 追加終了タグ
61 識別用スタート・タグ
62 識別用エンド・タグ
100 大容量XML文書
100a レコード
101 分割プログラム
101a スタック領域
102 フォルダ
103 分割制御情報
102a 小容量XML文書
110 XSL変換プロセッサ
110a スタイルシート
200 併合XML文書
201 連結プログラム
202 フォルダ
202a 小容量XML文書
400 逐次分割変換プログラム
401a 逐次分割XML文書
402 スタイルシート
403a 逐次変換XML文書
410 分割部
411 分割バッファ
420 XSL変換部
430 連結部
431 連結バッファ
Claims (3)
- XML形式のファイルである第1構造化文書に含まれる情報を、複数の第2構造化文書に分割する分割プログラムであって、
前記第1構造化文書の記述を先頭から順に一行ずつ取得し、
取得した記述に開始タグがあり、該開始タグと対応する終了タグとの間にレコード要素がない場合、前記開始タグのタグ名をスタックにプッシュダウンして格納し、取得した前記レコードの前記開始タグを前記第1構造化文書と別の第1の出力ファイルにコピーし、
取得したレコードの開始タグがあり、該開始タグと対応する終了タグとの間にレコードがある場合、該レコードに関する要素を示す記述を前記第1の出力ファイルの記述の後にコピーし、
該レコードのレコード数が分割位置を決める閾値と一致する位置に分割位置を示す識別用終了タグを追加し、前記スタックに格納されている開始タグを用いて、前記第1の出力ファイルの開始タグに対応する追加終了タグを生成し、前記第1の出力ファイルの前記識別用終了タグの後に追加し、
前記第1の出力ファイルを生成した後、前記スタックに格納されている開始タグを用いて、第2の出力ファイルに前記追加終了タグに対応する追加開始タグを生成し、前記第1の出力ファイルの前記識別用終了タグに対応する識別用開始タグを追加し、
前記第1構造化文書から取得した記述が該レコードに関する要素を示す記述である場合、前記第2の出力ファイルに該レコードに関する要素を示す記述をコピーし、
前記第1構造化文書から取得した記述に終了タグがある場合、前記スタックに格納されている前記開始タグのタグ名をポップアップし、取得した該終了タグを前記第2の出力ファイルの記述の後にコピーし、
前記第1構造化文書のルートタグが終了タグと一致した場合、分割処理を終了し、前記複数の第2構造化文書を生成する、
ことをコンピュータに実行させることを特徴とする分割プログラム。 - 分割された順に前記第2構造化文書の記述を先頭から順に一行ずつ取得し、
取得した記述を前記第2構造化文書と別の第3の出力ファイルにコピーし、
取得した記述に前記識別用終了タグを検出後、前記識別用終了タグの後に終了タグがある場合、該終了タグを前記追加終了タグと特定し、前記識別用終了タグと前記追加終了タグを、前記第3の出力ファイルにコピーせず、
取得した記述に前記識別用開始タグを検出後、前記識別用開始タグの後に開始タグがある場合は該開始タグを前記追加開始タグと特定し、前記識別用開始タグと前記追加開始タグを、前記第3の出力ファイルにコピーしない、
連結プログラムを有し、前記連結プログラムを、
コンピュータに実行させることを特徴とする請求項1に記載の分割プログラム。 - XML形式のファイルである第1構造化文書に含まれる情報を、複数の第2構造化文書に分割する情報処理方法であって、
前記第1構造化文書の記述を先頭から順に一行ずつ取得し、
取得した記述に開始タグがあり、該開始タグと対応する終了タグとの間にレコード要素がない場合、前記開始タグのタグ名をスタックにプッシュダウンして格納し、取得した前記レコードの前記開始タグを前記第1構造化文書と別の第1の出力ファイルにコピーし、
取得したレコードの開始タグがあり、該開始タグと対応する終了タグとの間にレコードがある場合、該レコードに関する要素を示す記述を前記第1の出力ファイルの記述の後にコピーし、
該レコードのレコード数が分割位置を決める閾値と一致する位置に分割位置を示す識別用終了タグを追加し、前記スタックに格納されている開始タグを用いて、前記第1の出力ファイルの開始タグに対応する終了タグを生成し、前記第1の出力ファイルの前記識別用終了タグの後に追加し、
前記第1の出力ファイルを生成した後、前記スタックに格納されている開始タグを用いて、第2の出力ファイルに開始タグを生成し、前記第1の出力ファイルの前記識別用終了タグに対応する識別用開始タグを追加し、
前記第1構造化文書から取得した記述が該レコードに関する要素を示す記述である場合、前記第2の出力ファイルに該レコードに関する要素を示す記述をコピーし、
前記第1構造化文書から取得した記述に終了タグがある場合、前記スタックに格納されている前記開始タグのタグ名をポップアップし、取得した該終了タグを前記第2の出力ファイルの記述の後にコピーし、
前記第1構造化文書のルートタグが終了タグと一致した場合、分割処理を終了し、前記複数の第2構造化文書を生成する、分割処理と、
分割された順に前記第2構造化文書の記述を先頭から順に一行ずつ取得し、
取得した記述を前記第2構造化文書と別の第3の出力ファイルにコピーし、
取得した記述に前記識別用終了タグを検出後、前記識別用終了タグの後に終了タグがある場合、該終了タグを前記追加終了タグと特定し、前記識別用終了タグと前記追加終了タグを、前記第3の出力ファイルにコピーせず、
取得した記述に前記識別用開始タグを検出後、前記識別用開始タグの後に開始タグがある場合は該開始タグを前記追加開始タグと特定し、前記識別用開始タグと前記追加開始タグを、前記第3の出力ファイルにコピーしない、連結処理と、
をコンピュータが実行することを特徴とする情報処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005380328A JP4899476B2 (ja) | 2005-12-28 | 2005-12-28 | 分割プログラム、連結プログラム、情報処理方法 |
US11/393,725 US8418053B2 (en) | 2005-12-28 | 2006-03-31 | Division program, combination program and information processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005380328A JP4899476B2 (ja) | 2005-12-28 | 2005-12-28 | 分割プログラム、連結プログラム、情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007179492A JP2007179492A (ja) | 2007-07-12 |
JP4899476B2 true JP4899476B2 (ja) | 2012-03-21 |
Family
ID=38195347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005380328A Expired - Fee Related JP4899476B2 (ja) | 2005-12-28 | 2005-12-28 | 分割プログラム、連結プログラム、情報処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8418053B2 (ja) |
JP (1) | JP4899476B2 (ja) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8356053B2 (en) * | 2005-10-20 | 2013-01-15 | Oracle International Corporation | Managing relationships between resources stored within a repository |
US7770107B2 (en) * | 2006-03-01 | 2010-08-03 | Oracle International Corporation | Methods and systems for extracting and processing translatable and transformable data from XSL files |
US9495356B2 (en) * | 2006-03-30 | 2016-11-15 | International Business Machines Corporation | Automated interactive visual mapping utility and method for validation and storage of XML data |
US9183321B2 (en) | 2006-10-16 | 2015-11-10 | Oracle International Corporation | Managing compound XML documents in a repository |
US7827177B2 (en) * | 2006-10-16 | 2010-11-02 | Oracle International Corporation | Managing compound XML documents in a repository |
US9880980B2 (en) * | 2007-03-05 | 2018-01-30 | International Business Machines Corporation | Document transformation performance via incremental fragment transformations |
US20090007115A1 (en) * | 2007-06-26 | 2009-01-01 | Yuanhao Sun | Method and apparatus for parallel XSL transformation with low contention and load balancing |
EP2187312B1 (en) | 2007-09-07 | 2016-12-21 | Humming Heads Inc. | Information search system, information search method, and program |
US8739022B2 (en) * | 2007-09-27 | 2014-05-27 | The Research Foundation For The State University Of New York | Parallel approach to XML parsing |
US20090094606A1 (en) * | 2007-10-04 | 2009-04-09 | National Chung Cheng University | Method for fast XSL transformation on multithreaded environment |
JP5337411B2 (ja) * | 2008-06-13 | 2013-11-06 | 京セラドキュメントソリューションズ株式会社 | 情報秘匿化方法および情報秘匿化装置 |
US8782514B1 (en) * | 2008-12-12 | 2014-07-15 | The Research Foundation For The State University Of New York | Parallel XML parsing using meta-DFAs |
US20100162142A1 (en) * | 2008-12-22 | 2010-06-24 | Lockheed Martin Corporation | Common style sheets for compiled and scripting language applications |
JP5321113B2 (ja) * | 2009-02-13 | 2013-10-23 | ソニー株式会社 | 情報処理装置、および情報処理方法、並びにプログラム |
US9477651B2 (en) * | 2010-09-29 | 2016-10-25 | International Business Machines Corporation | Finding partition boundaries for parallel processing of markup language documents |
US9626368B2 (en) * | 2012-01-27 | 2017-04-18 | International Business Machines Corporation | Document merge based on knowledge of document schema |
EP2657851A1 (en) * | 2012-04-26 | 2013-10-30 | Sap Ag | Partition based structured document transformation |
CN103377175A (zh) * | 2012-04-26 | 2013-10-30 | Sap股份公司 | 基于分割的结构化文档转换 |
US9442700B2 (en) * | 2013-09-30 | 2016-09-13 | MuleSoft, Inc. | API notebook tool |
CN103544260A (zh) * | 2013-10-16 | 2014-01-29 | 银江股份有限公司 | 一种大型xml文档转换方法 |
US20150186371A1 (en) * | 2013-12-27 | 2015-07-02 | A4 Data, Inc. | System and method for transferring files through differential compression |
JP6796376B2 (ja) * | 2014-11-28 | 2020-12-09 | 日本放送協会 | 分割装置および解析装置、ならびにプログラム |
US10204095B1 (en) * | 2015-02-10 | 2019-02-12 | West Corporation | Processing and delivery of private electronic documents |
AU2016345990A1 (en) * | 2015-10-30 | 2018-05-17 | Kim Seng Kee | A system and method for processing big data using electronic document and electronic file-based system that operates on RDBMS |
JP7000709B2 (ja) | 2017-06-09 | 2022-01-19 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
US10984184B2 (en) * | 2018-12-11 | 2021-04-20 | Change Healthcare Holdings, Llc | Maintenance of a metafile using spreadsheet software |
US20210200717A1 (en) * | 2019-12-26 | 2021-07-01 | Oath Inc. | Generating full metadata from partial distributed metadata |
CN117391066A (zh) * | 2023-09-06 | 2024-01-12 | 苏州数设科技有限公司 | 面向工业数据的解析方法、装置、电子设备及存储介质 |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10143498A (ja) * | 1996-11-08 | 1998-05-29 | Nippon Telegr & Teleph Corp <Ntt> | リンク付与機能を持つページ分割通信中継装置 |
US6901403B1 (en) * | 2000-03-02 | 2005-05-31 | Quovadx, Inc. | XML presentation of general-purpose data sources |
CA2350735A1 (en) * | 2001-03-14 | 2002-09-14 | Ibm Canada Limited-Ibm Canada Limitee | A method for providing open access to application profiling data |
US20030023584A1 (en) * | 2001-04-27 | 2003-01-30 | Brandin Christopher Lockton | Universal information base system |
JP3692054B2 (ja) * | 2001-05-21 | 2005-09-07 | 株式会社東芝 | 文書構造変換方法および文書構造変換装置およびプログラム |
JP2003015869A (ja) * | 2001-06-27 | 2003-01-17 | Toshiba Corp | 開発支援プログラム及び開発支援方法並びに開発支援システム |
US7281206B2 (en) * | 2001-11-16 | 2007-10-09 | Timebase Pty Limited | Maintenance of a markup language document in a database |
US7146564B2 (en) * | 2001-12-21 | 2006-12-05 | Xmlcities, Inc. | Extensible stylesheet designs using meta-tag and/or associated meta-tag information |
US7210097B1 (en) * | 2002-05-22 | 2007-04-24 | Pitney Bowes Inc. | Method for loading large XML documents on demand |
JP2004062600A (ja) * | 2002-07-30 | 2004-02-26 | Fujitsu Ltd | 構造型文書の変換方法、復元方法、変換及び復元方法及びプログラム |
US7225425B2 (en) * | 2002-08-29 | 2007-05-29 | Sap Aktiengesellschaft | Rapid application integration |
US7237225B2 (en) * | 2002-08-29 | 2007-06-26 | Sap Aktiengesellschaft | Rapid application integration using reusable patterns |
US7257818B2 (en) * | 2002-08-29 | 2007-08-14 | Sap Aktiengesellschaft | Rapid application integration using functional atoms |
US7596523B2 (en) * | 2002-09-09 | 2009-09-29 | Barra, Inc. | Method and apparatus for network-based portfolio management and risk-analysis |
US20040098246A1 (en) * | 2002-11-19 | 2004-05-20 | Welch Donald J. | System and method for displaying documents in a language specified by a user |
US7203928B2 (en) * | 2002-12-31 | 2007-04-10 | Sun Microsystems, Inc. | Method and system for generating and maintaining uniform test results |
WO2004068320A2 (en) * | 2003-01-27 | 2004-08-12 | Vincent Wen-Jeng Lue | Method and apparatus for adapting web contents to different display area dimensions |
JP3905851B2 (ja) * | 2003-03-24 | 2007-04-18 | 株式会社東芝 | 構造化文書の分割方法及びプログラム |
WO2004104857A1 (ja) | 2003-05-22 | 2004-12-02 | Sharp Kabushiki Kaisha | データ処理装置、データ処理方法、データ処理プログラム、およびデータ処理プログラムを記録したコンピュータ読取可能な記録媒体 |
JP4184155B2 (ja) * | 2003-05-22 | 2008-11-19 | シャープ株式会社 | データ処理装置、データ処理方法、データ処理プログラム、およびデータ処理プログラムを記録したコンピュータ読取可能な記録媒体 |
EP1480377B1 (en) * | 2003-05-23 | 2005-09-07 | Alcatel | Method and system for creating a protocol-independent meta-model in a Network Management System of a telecommunication network |
JP2005011183A (ja) | 2003-06-20 | 2005-01-13 | Fuji Xerox Co Ltd | 情報処理装置、情報処理方法、及びプログラム |
US7209925B2 (en) * | 2003-08-25 | 2007-04-24 | International Business Machines Corporation | Method, system, and article of manufacture for parallel processing and serial loading of hierarchical data |
US7437374B2 (en) * | 2004-02-10 | 2008-10-14 | International Business Machines Corporation | Efficient XML schema validation of XML fragments using annotated automaton encoding |
US20050177578A1 (en) * | 2004-02-10 | 2005-08-11 | Chen Yao-Ching S. | Efficient type annontation of XML schema-validated XML documents without schema validation |
US7392243B2 (en) * | 2004-10-20 | 2008-06-24 | Microsoft Corporation | Using permanent identifiers in documents for change management |
US7899834B2 (en) * | 2004-12-23 | 2011-03-01 | Sap Ag | Method and apparatus for storing and maintaining structured documents |
JP2006238147A (ja) * | 2005-02-25 | 2006-09-07 | Toshiba Corp | コンテンツ再生装置、字幕再生方法及びプログラム |
US7665016B2 (en) * | 2005-11-14 | 2010-02-16 | Sun Microsystems, Inc. | Method and apparatus for virtualized XML parsing |
US7665015B2 (en) * | 2005-11-14 | 2010-02-16 | Sun Microsystems, Inc. | Hardware unit for parsing an XML document |
US7596745B2 (en) * | 2005-11-14 | 2009-09-29 | Sun Microsystems, Inc. | Programmable hardware finite state machine for facilitating tokenization of an XML document |
CN101329665A (zh) * | 2007-06-18 | 2008-12-24 | 国际商业机器公司 | 解析标记语言文档的方法和解析器 |
US8739022B2 (en) * | 2007-09-27 | 2014-05-27 | The Research Foundation For The State University Of New York | Parallel approach to XML parsing |
-
2005
- 2005-12-28 JP JP2005380328A patent/JP4899476B2/ja not_active Expired - Fee Related
-
2006
- 2006-03-31 US US11/393,725 patent/US8418053B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20070150809A1 (en) | 2007-06-28 |
JP2007179492A (ja) | 2007-07-12 |
US8418053B2 (en) | 2013-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4899476B2 (ja) | 分割プログラム、連結プログラム、情報処理方法 | |
CN111400408B (zh) | 数据同步方法、装置、设备及存储介质 | |
JP4997749B2 (ja) | 文書処理方法、プログラム及びシステム | |
US6092091A (en) | Device and method for filtering information, device and method for monitoring updated document information and information storage medium used in same devices | |
US7519903B2 (en) | Converting a structured document using a hash value, and generating a new text element for a tree structure | |
US20020049731A1 (en) | Information processing method and apparatus | |
JP4769005B2 (ja) | 情報処理支援システム及び情報処理支援プログラム | |
JP2002099428A (ja) | ハッシュコンパクトxmlパーサ | |
JP2006178946A (ja) | ワークブックを表現するためのファイルフォーマット、方法およびコンピュータプログラム製品 | |
CN112667720A (zh) | 接口数据模型的转化方法、装置、设备及存储介质 | |
JP4185175B2 (ja) | 構造化文書の表示方法 | |
US20110107198A1 (en) | Information processing apparatus, storage medium, and information processing method | |
JP4393404B2 (ja) | データベース管理装置およびデータベース管理方法 | |
CA2281346A1 (en) | Method and apparatus for amplifying design information into software products | |
US7873902B2 (en) | Transformation of versions of reports | |
JP5690472B2 (ja) | データ抽出システム | |
JP4887726B2 (ja) | 構造化文書のデータ処理方法、データ処理プログラム、およびデータ処理装置 | |
JP2006171800A (ja) | データ集計装置、その方法、及びプログラム | |
JP4480109B2 (ja) | 画像管理装置および画像管理方法 | |
JP4951407B2 (ja) | コンテンツ部品検索方法及び装置 | |
CN112988668B (zh) | 基于PostgreSQL的流式文档处理方法、装置以及装置的应用方法 | |
US20110185274A1 (en) | Mark-up language engine | |
JP3448922B2 (ja) | 電子文書記憶装置 | |
JPH09293085A (ja) | 設計支援装置 | |
CN113822014B (zh) | 一种代码物料的存储方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080416 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101007 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101012 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101213 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110621 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110921 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20111004 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111206 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111219 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150113 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |