JP4933280B2 - 情報処理装置、情報処理方法 - Google Patents

情報処理装置、情報処理方法 Download PDF

Info

Publication number
JP4933280B2
JP4933280B2 JP2007007459A JP2007007459A JP4933280B2 JP 4933280 B2 JP4933280 B2 JP 4933280B2 JP 2007007459 A JP2007007459 A JP 2007007459A JP 2007007459 A JP2007007459 A JP 2007007459A JP 4933280 B2 JP4933280 B2 JP 4933280B2
Authority
JP
Japan
Prior art keywords
document data
link information
data
link
divided
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007007459A
Other languages
English (en)
Other versions
JP2007257617A (ja
JP2007257617A5 (ja
Inventor
透 石嵜
亙 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2007007459A priority Critical patent/JP4933280B2/ja
Priority to PCT/JP2007/053458 priority patent/WO2007097442A1/en
Priority to US12/279,973 priority patent/US20100229079A1/en
Publication of JP2007257617A publication Critical patent/JP2007257617A/ja
Publication of JP2007257617A5 publication Critical patent/JP2007257617A5/ja
Application granted granted Critical
Publication of JP4933280B2 publication Critical patent/JP4933280B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/114Pagination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Description

本発明は、外部データへのリンクを示すリンク情報が記された文書データと、この外部データとを取り扱うための技術に関するものである。
画像データ等の参照情報へのリンクを示すリンク情報が記された構造化文書を保存したり転送したりする際には効率化を考え、構造化文書と参照情報とを一つにまとめることがある。従来では、参照情報に対してbase64エンコードを行い、リンク情報が記されている箇所に埋め込む方法がある。また、W3CのMTOM(SOAP Message Transmission Optimization Mechanism)などでは、XML文書や参照情報をそれぞれ独立したパートとして一つのパッケージにまとめている。
さらに、IETF仕様で規定されているThe MIME Application/Vnd.pwg-multiplexed Content-Typeでは、特殊な区切り文字列を使うことにより参照情報を構造化文書の参照箇所に直接挿入してまとめている。
特開平10-312348号公報 特開2000-293422号公報
上述のような従来技術では、構造化文書が、構造化文書内の複数箇所から同じ内容の参照情報を参照している場合に問題を生じる。
リソースの少ない機器では、入力されたデータを蓄積しなくてもよいように、入力データが順次処理できるようになっていることが求められる。そこで、参照している箇所ごとに参照情報を複製して構造化文書へ挿入してまとめると、まとめた後のデータは順次処理できるようになる。しかし、まとめた後のデータ量はまとめる前のデータ量に比べ大きく増加してしまうため、データ転送を行うときにはコストがかかる。
一方、参照情報は複製せずに構造化文書に添付し、複数箇所から添付した参照情報を参照できるようにまとめるとデータ量は大きくならないが、まとめた後のデータを処理するときに参照情報をいつまで必要とするかがわからない。結局、まとめた後のデータをすべて処理し終わるまで参照情報を保持しておくことになり、参照情報が画像データなどサイズの大きいデータである場合リソースの少ない機器では処理できなくなる。
したがって、構造化文書と参照情報とを一つにまとめる際に重複したデータを保持せず、リソースの少ない機器でも処理できるように、まとめたデータは順次処理できるようにすることが課題となる。
本発明は以上の問題に鑑みてなされたものであり、外部データへのリンクを示すリンク情報が記された文書データと、この外部データとを効率よく管理するための技術を提供することを目的とする。
本発明の目的を達成するために、例えば、本発明の情報処理装置は以下の構成を備える。
即ち、外部データへのリンクを示すリンク情報が記された文書データを処理する情報処理装置であって、
前記文書データを区切ることで複数の分割文書データを作成した場合に、分割文書データに前記リンク情報が記されているか否かを判断する判断手段と、
前記リンク情報が記されていると前記判断手段が判断た分割文書データに、前記リンク情報が指し示す外部データをマージすると共に、前記リンク情報が示すリンク先を、該マージされた外部データに変更することで、該分割文書データを更新する更新手段と
を備えることを特徴とする。
本発明の目的を達成するために、例えば、本発明の情報処理方法は以下の構成を備える。
即ち、外部データへのリンクを示すリンク情報が記された文書データを処理する情報処理装置が行う情報処理方法であって、
判断手段が、前記文書データを区切ることで複数の分割文書データを作成した場合に、分割文書データに前記リンク情報が記されているか否かを判断する判断工程と、
更新手段が、前記リンク情報が記されていると前記判断工程で判断た分割文書データに、前記リンク情報が指し示す外部データをマージすると共に、前記リンク情報が示すリンク先を、該マージされた外部データに変更することで、該分割文書データを更新する更新工程と
を備えることを特徴とする。
本発明の構成により、外部データへのリンクを示すリンク情報が記された文書データと、この外部データとを効率よく管理することができる。
以下添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。
[第1の実施形態]
図1は、本実施形態に係る情報処理装置を適用したコンピュータを含むシステムの構成を示す図である。同図に示す如く、本実施形態に係るシステムは、コンピュータ101、印刷処理装置103、記憶装置104により構成されており、コンピュータ101と印刷処理装置103とはLAN102に接続されている。また、印刷処理装置103には記憶装置104が接続されている。なお、コンピュータ101と印刷処理装置103とを繋ぐネットワークはLAN102に限定するものではなく、インターネットなどのネットワークを用いても良い。
先ず、コンピュータ101について説明する。図2は、コンピュータ101のハードウェア構成を示すブロック図である。CPU201は、ROM202やRAM203に格納されているプログラムやデータを用いてコンピュータ101全体の制御を行ったり、LAN102を介して印刷処理装置103とのデータ通信を制御したりする。即ち、CPU201は、コンピュータ101が行う後述の各処理を実行する。
ROM202は、コンピュータ101の設定データやブートプログラムなどを格納する。
RAM203は、記憶部205からロードされたプログラムやデータ、LAN I/F206を介して外部から受信したデータなどを一時的に記憶する為のエリアや、CPU201が各処理を実行する際に用いるワークエリアなどを有する。即ち、RAM203は、各種のエリアを適宜提供することができる。
表示部204は、CRTや液晶画面などにより構成されており、CPU201による処理結果を画像や文字などでもって表示することができる。
記憶部205は、ハードディスクドライブ装置に代表される大容量情報記憶装置であって、ここにはOS(オペレーティングシステム)や、コンピュータ101が行う後述の各処理をCPU201に実行させるためのプログラムやデータが保存されている。このデータには、以下説明する文書データも含まれている。記憶部205に保存されているこれらのプログラムやデータは、CPU201による制御に従って適宜RAM203にロードされる。そしてCPU201はこのロードされたプログラムやデータを用いて処理を実行する。
LAN I/F206は、コンピュータ101を上記LAN102に接続するためのものであり、コンピュータ101はこのLAN I/F206を介して印刷処理装置103とのデータ通信を行うことができる。
USB I/F207は、USB端子を有する外部機器を接続するためのものであり、例えば、USB端子を有するキーボードやマウスなどを接続することができる。
次に、印刷処理装置103について説明する。印刷処理装置103は、コンピュータ101から送信されたデータに基づいて紙などの記録媒体上に印刷処理を行う機能を有する装置であり、プリンタや複合機などにより構成されている。また、印刷処理装置103には、記憶装置104が接続されており、記憶装置104には、コンピュータ101から受信した各種の情報を一時的に記憶する。
図3は、本実施形態でコンピュータ101が取り扱う文書ファイル(文書データ)の構成例を示す図である。同図に示す如く、本実施形態に係る文書ファイルはXMLで記述されたものであるが、他のマークアップ言語でもって記述されていても良い。
同図に示す文書データには、外部ファイル(参照情報)としての画像データ(画像ファイル)へのリンクを示すリンク情報が記されている。例えば、リンク情報<image xlink:href="sample1.jpg">は、"sample1.jpg"なるファイル名を有する画像ファイルへのリンクを示す。なお、各リンク情報が指し示すリンク先に存在する画像ファイルは、記憶部205内に保存されている。また、"sample2.jpg"なるファイル名を有する画像ファイルに対しては複数のリンクが設けられている。リンク先は、文書が保存されている記憶装置内のデータであっても他の記憶装置内のデータであってもよい。
なお、同図の文書ファイルは記憶部205に保存されており、必要時にはCPU201による制御に従ってRAM203にロードされる。以下の説明では、コンピュータ101が図3に示した文書ファイルと、この文書ファイル内でリンクされているそれぞれの画像ファイルとを1つにまとめて印刷処理装置103に転送する場合について説明する。なお、印刷処理装置103へのデータプロトコルについては特に限定するものではないので、これに関する説明は省略する。
図4は、コンピュータ101が行う処理のフローチャートである。なお、同図のフローチャートを含め、以下に説明する全てのフローチャートに従った処理をCPU201に実行させるためのプログラムやデータは記憶部205に保存されている。そして、このプログラムやデータはCPU201による制御に従って適宜RAM203にロードされる。従って、CPU201がこのロードされたプログラムやデータを用いて処理を実行することで、コンピュータ101は以下説明する各処理を実行することになる。
先ず、RAM203にロードされている文書ファイル(図3に示す構成を有する)を複数の分割ファイルに分割するのであるが、どこで分割するのかを示す分割条件の入力を、コンピュータ101の操作者に対して促し、操作者によって選択させる。選択方法としては例えば、USB I/F207に接続されているキーボードやマウスを用いて行う。本実施形態では、タグ<page>〜</page>で囲まれた要素(以下、ページ分割単位)毎に分割する。従って、本実施形態では、操作者が、ページ分割単位毎に分割する、という分割条件を指示したものとするので、ステップS500ではこの条件を受け付ける。
次に、ステップS501では、文書ファイルの先頭から順次内容を参照し、ページ分割単位の先頭位置(分割開始位置)を検出したかをチェックする。本実施形態では、タグ<page>を検出したかをチェックする。検出した場合には処理をステップS502に進め、検出していない場合には処理をステップS550に進める。ステップS550では、現在参照している箇所が文書ファイルの最後の位置(例えばEOFの位置)であるのかをチェックし、最後の位置であれば本処理を終了し、最後の位置でなければ処理をステップS501に戻し、続きを参照する。
ステップS502では、ページ分割単位の最後の位置(分割終了位置)を検出したかをチェックする。本実施形態では、タグ</page>を検出したかをチェックする。検出した場合には処理をステップS550に進め、検出していない場合には処理をステップS503に進める。
ステップS503では、ステップS501で検出したタグ<page>以降の記述文を参照し、リンク情報が記されているか否かのチェック処理を行う。リンク情報が記されていない場合には処理をステップS502に戻し、現在参照している箇所がタグ</page>であるのかをチェックする。タグ</page>でなければ再度処理をステップS503に進め、続きを参照する。即ち、ステップS502,S503における処理によって、ステップS501で検出したタグ<page>から、次に登場するタグ</page>までの間にリンク情報が記されているか否かをチェックすることができる。そして、リンク情報が記されている場合(リンク情報を検出した場合)には処理をステップS504に進める。
ステップS504では、ステップS503で検出したリンク情報が指し示す画像ファイルが、既にページ分割単位にマージ(包括)された画像ファイルであるのかをチェックする。画像ファイルのマージについては後述する。なお、本実施形態以降で用いる「マージ」とは、一般には「パッケージ」を意味するものである。
このチェックの結果、ステップS503で検出したリンク情報が指し示す画像ファイルが、既にページ分割単位にマージされた画像ファイルではない場合には処理をステップS505に進める。ステップS505では、ステップS503で検出したリンク情報が指し示す画像ファイルを、ステップS501で検出したタグ<page>の直前にマージする処理を行う。更に同ステップでは、ステップS503で検出したリンク情報がこのマージした位置を指し示すように、このリンク情報を変更する。これにより、ページ分割単位を更新することができる。
なお、それぞれの画像ファイル同士でそれぞれが同じものであるか否かのチェックは、例えばそれぞれの画像ファイル名が同じであるのかチェックすればよい。
一方、ステップS504におけるチェック処理の結果、ステップS503で検出したリンク情報が指し示す画像ファイルが、既に他のページ分割単位にマージされた画像ファイルである場合には処理をステップS506に進める。ステップS506では、ステップS503で検出したリンク情報を、既にマージされている画像ファイルを指し示すように更新することで、ページ分割単位を更新する。
そしてステップS505,S506の何れの処理を行った後であっても、処理をステップS502に進め、以降の処理を繰り返す。
以上説明した、図4のフローチャートに従った処理は、1つの文書ファイルについて行う処理である。従って、同図のフローチャートに従った処理を全て行うと、1つの文書ファイル内の各ページ分割単位のうち、リンク情報が記されたページ分割単位については以下のようにして処理される。即ち、このリンク情報が指し示すリンク先が、ページ分割単位にマージされた画像ファイルと異なるものである場合、このページ分割単位内に記されているリンク情報が指し示す先の画像ファイルをこのページ分割単位の先頭にマージする。更に、このリンク情報が指し示す先を、このマージした位置を指し示すように変更する。
また、リンク情報が指し示す画像ファイルが、既にページ分割単位にマージされた画像ファイルである場合には、このリンク情報を、既にマージされている画像ファイルを指し示すように更新する。
図6は、図3の文書ファイルを図4のフローチャートに従って更新した場合に得られる文書ファイルの構成例を示す図である。図6に示す如く、マージした画像ファイル部分は、cidxxxという識別子で参照元から参照している。識別子は、マージした画像ファイル部分を一意に識別できればcidxxxという形式になっていなくてもよい。2番目のページ分割単位では、同じ画像ファイルを複数の参照元から参照するようにリンク記述を行っている。
そして、以上のようにして作成した文書ファイルを、印刷処理装置103に送出する。なお、以上のようにして作成した文書ファイルは図6に例示したように、MIMEに従ったものであるので、印刷処理装置103は当然、MIMEに対応可能な構成を有する。
なお、本実施形態に係る情報処理装置は、コンピュータ101以外にも、ディジタルカメラなどの撮像装置や、PDA、携帯電話等の、コンピュータ101よりも搭載メモリ量が少ない装置に適用しても良い。即ち、図4に示した処理は、生成する文書ファイルのサイズをできるだけ小さくすることにあるので、このように搭載メモリ量が少ない装置において図4のフローチャートに従った処理を行えば、より好適な結果となる。
また、本実施形態では、文書ファイルの分割は、タグ<page>〜</page>で囲まれた要素毎に行っていたが、これに限定するものではなく、文書ファイルの構造上、分割可能な要素毎に分割しても良い。
[第2の実施形態]
図5は、コンピュータ101が行う処理のフローチャートである。本実施形態では、画像ファイルに有効期限(有効期限情報)を設定し、ページ分割単位の更新処理をこの有効期限に基づいて変更する点が第1の実施形態とは異なる。なお、図5に示した各ステップにおいて、図4に示した各ステップと同じものについては同じステップ番号を付けており。その説明は省略する。
本実施形態では、最大有効期限なるものが予め設定されているものとする。もちろん、この最大有効期限はキーボードやマウスを用いて適宜操作者が変更しても良い。また、この最大有効期限は、文書ファイルの分割数であっても良いし、文書ファイルの構造上、分割可能な箇所で分割した場合に、ある分割要素の出現回数であっても良い。本実施形態では、例えば最大有効期限を2とする。最大有効期限内は、外部データを保持し続けることにより重複して同じ外部データを参照することを避け、また、有効期限が過ぎれば外部データを一旦破棄することにより、メモリの長期占有を防ぐ。例えば、1ページ目、2ページ目、100ページ目で同じ外部データを参照している場合に、有効期限が過ぎると該外部データを破棄し、100ページ目を解析する時に再度該外部データをマージ(包括)するような場合である。
本実施形態では、最大有効期限なるものが予め設定されているものとする。もちろん、この最大有効期限はキーボードやマウスを用いて適宜操作者が変更しても良い。また、この最大有効期限は、文書ファイルの分割数であっても良いし、文書ファイルの構造上、分割可能な箇所で分割した場合に、ある分割要素の出現階数であっても良い。本実施形態では、最大有効期限として、ページ分割単位の数とする。例えば最大有効期限を2とする。
ステップS600では、これまでに参照したページ分割単位の数をカウントし、このカウント値が有効期限を越えているか否かを判断する。この結果、越えている場合には処理をステップS505に進めるのであるが、越えていない場合には処理をステップS601に進める。ステップS601では、上記ステップS506における処理と同様の処理を行うと共に、有効期限を1つインクリメントする。
図7は、図3の文書ファイルを図5のフローチャートに従って更新した場合に得られる文書ファイルの構成例を示す図である。図7に示す如く、リンク情報が指し示す先の画像ファイルをページ分割単位の先頭にマージしている。まず、CHK1の2番目のパートは、画像ファイル(sample2.jpg)を参照しているので、画像ファイル(sample2.jpg)をマージして参照する。このときマージされた画像ファイル(sample2.jpg)の有効期限は1となる。
次に、CHK1の3番目のパートも画像ファイル(sample2.jpg)を参照している。そこで、既にマージされた画像ファイル(sample2.jpg)を参照するかどうか判断する。既にマージされた画像ファイル(sample2.jpg)を参照すると、マージされた画像ファイル(sample2.jpg)の有効期限は2となる。予め設定された最大有効期限の2を越えないので、CHK1の3番目のパートは既にマージされた画像ファイル(sample2.jpg)を参照することとする。画像ファイル(sample2.jpg)には有効期限としてCHK1:3という文字列が付加される。これは、CHK1の3番目のパートが終了するまで画像ファイルが有効であることを示す。今回はCHK1:3という文字列を使用したが、有効期限が識別できる文字列なら何でもよい。例えば、cid:[email protected]/3という文字列でもよい。また、有効期限の2という文字列でも良い。最大有効期限は2なので、もしCHK1の4番目のパートが画像ファイル(sample2.jpg)を参照していても、既にマージした画像ファイル(sample2.jpg)を参照せず、改めて画像ファイル(sample2.jpg)をマージして参照する。
以上の各実施形態によれば、文書ファイル内のリンク情報を、指定された分割条件で分割した分割ファイル毎に検出しているので、分割ファイル内の複数箇所から同じ情報を参照していてもマージする画像ファイルは重複しない。また、マージする箇所は、それぞれの分割ファイルの先頭になっているので、分割ファイルの処理が終わると先頭に挿入された画像ファイルは不要になることがわかる。
また、複数の分割ファイルから参照されている画像ファイルでも、有効期限を付加すれば、有効期限の間は同じ画像ファイルを複数回マージしなくても済むようにすることができる。
よって、リソースの少ない機器でも処理できるような順次処理可能なデータ形式で、出来るだけ重複した情報を保持せずに文書ファイルと画像ファイルとを一つにまとめることができる。
[第3の実施形態]
情報とエレクトロニクスの技術標準化団体であるEcma InternationalのTC45委員会にて国際標準化が進められているOffice Open XMLに含まれるOPC(Open Packaging Conventions)仕様は、ZIPファイル形式でコンテンツ、リソース、およびメタデータをアーカイブする方法について規定している。以下では係るアーカイブ技術を用いるものとする。
図8は本実施形態においてコンピュータ101がアーカイブ(包括)する文書データについて示す図である。図8において801、802はXMLで記述された文書ファイルであり、それぞれには、リンク情報が記されているものとする。また、文書ファイル801、802にはそれぞれファイル名「data1.svg」、「data2.svg」が設定されているものとする。
また、本実施形態においても図1に示したシステムを用いるものとする。
本実施形態では上記OPC仕様に従い、文書ファイルや画像ファイル等の複数のファイルを1つのファイルにアーカイブする点が第1の実施形態とは異なる。
図9はコンピュータ101が文書ファイルや画像ファイル等の複数のファイルを1つのファイルにアーカイブする処理のフローチャートである。図9に示した各ステップにおいて、図4に示したものと同じステップについては同じステップ番号を付けており、その説明は簡単に行うものとする。
本実施形態では、アーカイブ結果に含める文書ファイルや画像ファイルは予め設定されているものとするが、キーボードやマウスなどを用いて適宜操作者が選択してもよい。以下、図8に示す文書ファイル801、802を用いた場合における、図9のフローチャートに従った処理について説明する。もちろん、図9のフローチャートに従った処理は、他のファイルを用いた場合でも、実質的には同じである。
先ずステップS500では、文書ファイル801,802の分割条件を受け付ける。本実施形態では、分割したそれぞれのファイル(分割文書ファイル)には多くとも1つのリンク情報が含まれているようにする。
次に、文書ファイル801,802を1つずつ処理していくのであるが、説明上、文書ファイル801、文書ファイル802の順に処理していくものとして説明する。しかし、その順番が逆であっても、以下の説明は実質的には同じである。
次にステップS501では、文書ファイル801の先頭から順次内容を参照し、文書ファイル801の先頭、若しくはxlink:href属性を含む開始要素の位置(分割開始位置)を検出したかをチェックする。図8の場合、image要素の開始タグ、及び文書ファイルの先頭部分が分割開始位置に相当する。
係るチェックの結果、検出した場合には処理をステップS502に進め、検出していない場合には処理をステップS550に進める。
ステップS502では、文書ファイル801の最後、若しくはxlink:href属性を含む開始要素の直前の位置(分割終了位置)を検出したかをチェックする。図8の場合、点線で示された部分および、文書ファイルの終了部分が分割終了位置に相当する。
係るチェックの結果、検出した場合には処理をステップS905に進め、検出していない場合には処理をステップS901に進める。
以下では、ステップS501で検出した分割開始位置からステップS502で検出した分割終了位置までの間のデータを分割文書ファイルと呼称する。
ステップS901では、分割文書ファイル中にリンク情報が記されているか否かをチェックする。係るチェックの結果、記されている場合には処理をステップS902に進めるのであるが、記されていない場合には処理をステップS502に戻す。
ステップS902では、分割文書ファイル中に記されているリンク情報が指し示すリンク先の画像ファイル(参照情報)が、既にアーカイブされている分割文書ファイルからリンクされているか否かをチェックする。これは、分割文書ファイル中に記されているリンク情報が指すリンク先の画像ファイルのファイル名が、既にアーカイブされた分割文書ファイルに記述されているリンク情報が指す画像ファイルのファイル名と同じであるか否かをチェックすることでなされる。
係るチェックの結果、分割文書ファイル中に記されているリンク情報が指し示すリンク先の画像ファイルが、既にアーカイブされている分割文書ファイルからリンクされている場合には処理をステップS904に進める。一方、リンクされていない場合には処理をステップS903に進める。
ステップS903では、分割文書ファイル中に記されているリンク情報が指し示す画像ファイル(参照情報)をアーカイブする。
ステップS904では、分割文書ファイル中に記されているリンク情報を書き換える。即ち、このリンク情報が指すリンク先が、ステップS903でアーカイブされた画像ファイル、若しくは既にアーカイブされている分割文書ファイルからリンクされている(分割文書ファイル中に記されているリンク情報が指し示す画像ファイルと同じファイル名の)画像ファイルを指し示すように、このリンク情報を書き換える。
ステップS905では、分割文書ファイルをアーカイブする。なお、ファイルをアーカイブする場合、アーカイブする毎に、それまでにアーカイブしたファイルとマージするものとする。これにより、1つのアーカイブファイルを作成する。
図8において、文書ファイル801の最初の分割文書ファイル801aについては、「data1.svg/[0].piece」というファイル名でアーカイブする。
次の分割文書ファイル801bについては、「data1.svg/[1].piece」というファイル名でアーカイブする。また、分割文書ファイル801b内に記述されているリンク情報が指し示す画像ファイル「sample1.jpg」をアーカイブする。そして先のアーカイブファイルとマージする。そして、分割文書ファイル801b内のリンク情報は、アーカイブファイル内における画像ファイル「sample1.jpg」を指し示すように書き換えられる。
次の分割文書ファイル801cについては、「data1.svg/[2].last.piece」というファイル名でアーカイブする。また、分割文書ファイル801c内に記述されているリンク情報が指し示す画像ファイル「sample2.jpg」をアーカイブする。そして先のアーカイブファイルとマージする。そして、分割文書ファイル801c内のリンク情報は、アーカイブファイル内における画像ファイル「sample2.jpg」を指し示すように書き換えられる。
ステップS550では、文書ファイル801の最後の位置を検出したか否かをチェックする。係るチェックの結果、検出した場合には処理をステップS906に進め、検出してない場合には処理をステップS501に戻す。
ステップS906では、全ての文書ファイルについてアーカイブを行ったか否かをチェックする。係るチェックの結果、行っている場合には本処理を終了する。一方、全ての文書ファイルについてアーカイブを行っていない場合には処理をステップS501に戻す。ここでは、まだ文書ファイル802についてはアーカイブを行っていないので、文書ファイル802についてステップS501以降の処理を行うことになる。
図8において、文書ファイル802の最初の分割文書ファイル802aについては、「data2.svg/[0].piece」というファイル名でアーカイブする。そして先のアーカイブファイルとマージする。
次の分割文書ファイル802bについては、「data2.svg/[1].last.piece」というファイル名でアーカイブする。また、分割文書ファイル802b内に記述されているリンク情報が指し示す画像ファイルは「sample1.jpg」であり、既にアーカイブされた分割文書ファイル801bからリンクされているものである。従ってこの場合、改めて画像ファイル「sample1.jpg」についてのアーカイブは行わない。そして先のアーカイブファイルとマージする。そして、分割文書ファイル802b内のリンク情報は、アーカイブファイル内における画像ファイル「sample1.jpg」を指し示すように書き換えられる。
以上の処理により、図8に示したアーカイブファイル803を生成する。アーカイブファイル803を構成する各部分データおよび、そのデータ名の決定規則はOPC仕様に従うものとする。このようにアーカイブされることによってリソースの少ない機器であっても、アーカイブファイル803のように構成された部分データを上から順に処理することによりデータを不必要に蓄積させることなく順次処理することが可能となる。
[その他の実施形態]
また、本発明の目的は、以下のようにすることによって達成されることはいうまでもない。即ち、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給する。そして、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行する。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムコードを実行することにより、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行う。その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれたとする。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明を上記記録媒体に適用する場合、その記録媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
本発明の第1の実施形態に係る情報処理装置を適用したコンピュータを含むシステムの構成を示す図である。 コンピュータ101のハードウェア構成を示すブロック図である。 本発明の第1の実施形態でコンピュータ101が取り扱う文書ファイルの構成例を示す図である。 コンピュータ101が行う処理のフローチャートである。 コンピュータ101が行う処理のフローチャートである。 図3の文書ファイルを図4のフローチャートに従って更新した場合に得られる文書ファイルの構成例を示す図である。 図3の文書ファイルを図5のフローチャートに従って更新した場合に得られる文書ファイルの構成例を示す図である。 本発明の第3の実施形態においてコンピュータ101がアーカイブする文書データについて示す図である。 コンピュータ101が文書ファイルや画像ファイル等の複数のファイルを1つのファイルにアーカイブする処理のフローチャートである。

Claims (8)

  1. 外部データへのリンクを示すリンク情報が記された文書データを処理する情報処理装置であって、
    前記文書データを区切ることで複数の分割文書データを作成した場合に、分割文書データに前記リンク情報が記されているか否かを判断する判断手段と、
    前記リンク情報が記されていると前記判断手段が判断た分割文書データに、前記リンク情報が指し示す外部データをマージすると共に、前記リンク情報が示すリンク先を、該マージされた外部データに変更することで、該分割文書データを更新する更新手段と
    を備えることを特徴とする情報処理装置。
  2. 前記分割文書データは、文書データに含まれている開始タグと、該開始タグに対応する終了タグとで囲まれた要素であることを特徴とする請求項1に記載の情報処理装置。
  3. 前記分割文書データに含まれるリンク情報が指し示す外部データは、当該分割文書データの先頭部分にマージされることを特徴とする請求項1に記載の情報処理装置。
  4. 前記更新手段により更新された分割文書データを印刷処理装置に送信する送信手段を更に備えることを特徴とする請求項1に記載の情報処理装置。
  5. 前記更新手段は、前記分割文書データに記されたリンク情報が示す外部データが、他の分割文書データに含まれるリンク情報の示すリンク先と同じである場合、一方の分割文書データのリンク情報が示すリンク先を他方の分割文書データにマージされた外部データに変更することを特徴とする請求項1に記載の情報処理装置。
  6. 外部データへのリンクを示すリンク情報が記された文書データを処理する情報処理装置が行う情報処理方法であって、
    判断手段が、前記文書データを区切ることで複数の分割文書データを作成した場合に、分割文書データに前記リンク情報が記されているか否かを判断する判断工程と、
    更新手段が、前記リンク情報が記されていると前記判断工程で判断た分割文書データに、前記リンク情報が指し示す外部データをマージすると共に、前記リンク情報が示すリンク先を、該マージされた外部データに変更することで、該分割文書データを更新する更新工程と
    を備えることを特徴とする情報処理方法。
  7. コンピュータを、請求項1乃至5の何れか1項に記載の情報処理装置が有する各手段として機能させる為のコンピュータプログラム。
  8. 請求項に記載のコンピュータプログラムを格納した、コンピュータ読み取り可能な記憶媒体。
JP2007007459A 2006-02-22 2007-01-16 情報処理装置、情報処理方法 Expired - Fee Related JP4933280B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007007459A JP4933280B2 (ja) 2006-02-22 2007-01-16 情報処理装置、情報処理方法
PCT/JP2007/053458 WO2007097442A1 (en) 2006-02-22 2007-02-20 Information processing apparatus and information processing method
US12/279,973 US20100229079A1 (en) 2006-02-22 2007-02-20 Information processing apparatus and information processing method

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006045860 2006-02-22
JP2006045860 2006-02-22
JP2007007459A JP4933280B2 (ja) 2006-02-22 2007-01-16 情報処理装置、情報処理方法

Publications (3)

Publication Number Publication Date
JP2007257617A JP2007257617A (ja) 2007-10-04
JP2007257617A5 JP2007257617A5 (ja) 2010-02-04
JP4933280B2 true JP4933280B2 (ja) 2012-05-16

Family

ID=38437477

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007007459A Expired - Fee Related JP4933280B2 (ja) 2006-02-22 2007-01-16 情報処理装置、情報処理方法

Country Status (3)

Country Link
US (1) US20100229079A1 (ja)
JP (1) JP4933280B2 (ja)
WO (1) WO2007097442A1 (ja)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3059467B2 (ja) * 1990-07-17 2000-07-04 シャープ株式会社 ファイル管理装置
US6094684A (en) * 1997-04-02 2000-07-25 Alpha Microsystems, Inc. Method and apparatus for data communication
US6163779A (en) * 1997-09-29 2000-12-19 International Business Machines Corporation Method of saving a web page to a local hard drive to enable client-side browsing
JPH11212882A (ja) * 1998-01-30 1999-08-06 Pfu Ltd 情報受配信方法及び情報受配信システム
US6886132B1 (en) * 2000-06-06 2005-04-26 Microsoft Corporation Method and system for packing and unpacking web pages
JP3991836B2 (ja) * 2002-10-04 2007-10-17 富士ゼロックス株式会社 画像形成装置
US20040095400A1 (en) * 2002-11-19 2004-05-20 Anderson Andrew T. Reconfiguration of content for display on devices of different types

Also Published As

Publication number Publication date
WO2007097442A1 (en) 2007-08-30
JP2007257617A (ja) 2007-10-04
US20100229079A1 (en) 2010-09-09

Similar Documents

Publication Publication Date Title
JP3991836B2 (ja) 画像形成装置
US9152631B2 (en) Document management system, method for controlling the same, and storage medium
JP2009003802A (ja) 情報表示装置及び情報表示方法
US7069292B2 (en) Automatic display method and apparatus for update information, and medium storing program for the method
US20060103872A1 (en) Electronic document management program and electronic document management apparatus
JP4958481B2 (ja) Webサービス実行方法及び情報処理装置
JP4933280B2 (ja) 情報処理装置、情報処理方法
JP2008035224A (ja) ログ情報管理システム、ログ情報管理装置、ログ情報管理方法、ログ情報管理プログラム及び記憶媒体
JP2008310816A (ja) 複数のマークアップ・ページ・データをコンパクトに表現するシステムおよび方法
US20040051901A1 (en) Information processsing apparatus, a function extension program, computer readable storage medium storing the program, and information processing method
JP2007281673A (ja) 情報処理装置および情報処理プログラム
US20020038322A1 (en) Information processing apparatus, method therefor,and computer-readable memory
JP2005266973A (ja) データ移行方法および装置
JP2005107635A (ja) 電子フォーム入力システム、方法、プログラムおよび媒体
JP6484915B2 (ja) 情報処理システム及び情報処理方法
JP2004326141A (ja) 画像処理装置及びプログラム
JP2004145736A (ja) 文字認識装置および文字認識データ出力方法およびプログラムおよび記録媒体
JP5012760B2 (ja) 情報処理装置
JP3771826B2 (ja) 書籍型データ差分追加更新装置,そのプログラムの記録媒体およびそのプログラム
US20080133450A1 (en) Structured Document Retrieval Device, Structured Document Retrieval Method Structured Document Retrieval Program
JP3892802B2 (ja) 情報処理装置
JP2004139142A (ja) 情報処理装置、その制御方法、制御プログラムを提供する媒体、及び制御プログラム
EP2293180A2 (en) PDL data processing device and PDL data creating device
JP2000132351A (ja) 画像プリント装置および画像プリント注文方法
JP2008251043A (ja) ネットワークの可視情報管理装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091007

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091211

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091211

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120213

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120216

R151 Written notification of patent or utility model registration

Ref document number: 4933280

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150224

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees