JP2010271862A - System and appaastus for processing information - Google Patents
System and appaastus for processing information Download PDFInfo
- Publication number
- JP2010271862A JP2010271862A JP2009122315A JP2009122315A JP2010271862A JP 2010271862 A JP2010271862 A JP 2010271862A JP 2009122315 A JP2009122315 A JP 2009122315A JP 2009122315 A JP2009122315 A JP 2009122315A JP 2010271862 A JP2010271862 A JP 2010271862A
- Authority
- JP
- Japan
- Prior art keywords
- structured document
- image
- structured
- unstructured data
- structured data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
本発明は、XML(登録商標)形式などの構造化データを扱う分散編集環境において、画像、音声、映像等の非構造化データを同時に取り扱い、サーバとクライアント間で、ネットワークを経由して非構造化データを含む構造化データをやり取りする情報処理システムおよび情報処理装置に関する。 The present invention simultaneously handles unstructured data such as images, sounds, and videos in a distributed editing environment that handles structured data such as XML (registered trademark) format, and unstructured between a server and a client via a network. The present invention relates to an information processing system and an information processing apparatus that exchange structured data including structured data.
従来、XMLDBを含むXML分散編集環境において、XML形式の構造化文書と画像などの非構造化データを両方扱う要望が高まってきている。しかしXMLDBにおいては、画像などの非構造化データを扱うため標準的な手法が確立されていない。 Conventionally, in an XML distributed editing environment including XMLDB, there is an increasing demand for handling both structured documents in XML format and unstructured data such as images. However, in XMLDB, a standard method has not been established for handling unstructured data such as images.
手法の一例として、画像などの非構造化データをBase64などでエンコードして、バイナリデータとして構造化データに取り込むことは可能だが、データサイズが増えてしまうので、画像の描画速度など性能の劣化につながることが多い。 As an example of the technique, it is possible to encode unstructured data such as images with Base64 etc. and import it into structured data as binary data, but the data size will increase, resulting in performance degradation such as image drawing speed Often connected.
また、例えば特許文献1に開示されるように、構造化文書や非構造化データにURI(Uniform Resource Identifier)を付与し、HTTPアドレスで定義される統一ユーザインタフェースを用いてクライアント・サーバ間で構造化文書や非構造化データの通信を行なう技術が開示されている。
Further, as disclosed in, for example,
構造化文書や非構造化データの通信に関わる従来の技術では、構造化文書作成クライアントが、構造化文書を構造化文書サーバに送信するとともに、構造化文書に含まれる画像などの非構造化データを非構造化データサーバに送信する。 In conventional technology related to communication of structured documents and unstructured data, a structured document creation client sends a structured document to a structured document server and unstructured data such as images included in the structured document. To the unstructured data server.
しかしながら、構造化文書の更新を行なった場合は、非構造化データの更新がなされていない場合でも、構造化文書作成クライアントは、構造化文書及び非構造化データを構造化文書サーバや非構造化データサーバにそれぞれ送信することになり、ネットワークへ負荷が高くなる問題があった。 However, if the structured document is updated, the structured document creation client can send the structured document and the unstructured data to the structured document server or unstructured data even if the unstructured data is not updated. There was a problem of increasing the load on the network due to the transmission to each data server.
そこで、本発明の目的は、構造化データおよび非構造化データの適切な伝送処理を行なうことが可能になる情報処理システムおよび情報処理装置を提供することにある。 Therefore, an object of the present invention is to provide an information processing system and an information processing apparatus that can perform appropriate transmission processing of structured data and unstructured data.
すなわち、本発明に係わる情報処理システムは、クライアント装置、構造化データサーバ装置、および非構造化データサーバ装置を有する情報処理システムであって、前記クライアント装置は、構造化データおよび当該構造化データに関わる非構造化データの作成のための入力操作を受け付ける入力手段と、前記入力手段により作成された構造化データに関わる非構造化データのハッシュ値を計算する第1の計算手段と、前記入力手段により作成された構造化データおよび当該構造化データに関わる非構造化データを前記構造化データサーバ装置に送信する第1の送信手段と、前記作成された構造化データが前記入力手段への入力操作により更新された場合に、当該更新された構造化データに関わる非構造化データのハッシュ値を計算する第2の計算手段と、前記第2の計算手段により計算したハッシュ値と前記第1の計算手段により計算した、更新前の構造化データに関わる非構造化データのハッシュ値とが一致するか否かを判別する判別手段と、前記ハッシュ値が一致すると前記判別手段により判別した場合に、前記更新された構造化データを前記構造化データサーバ装置に送信し、前記更新された構造化データに関わる非構造化データは送信しない第2の送信手段とを有し、前記構造化データサーバ装置は、前記構造化データを記憶するための構造化データ記憶装置と、前記クライアント装置からの前記作成時で更新前の構造化データに関わる非構造化データを前記非構造化データサーバ装置に送信する送信手段と、前記クライアント装置からの前記作成時で更新前の構造化データに、前記非構造化データサーバ装置からの前記非構造化データの参照情報を含ませて前記構造化データ記憶装置に記憶する第1の記憶制御手段と、前記構造化データ記憶装置に記憶される前記更新前の構造化データを、前記クライアント装置からの前記更新された構造化データに書き換える第2の記憶制御手段とを有し、前記非構造化データサーバ装置は、前記非構造化データを記憶するための非構造化データ記憶装置と、前記構造化データサーバ装置からの前記作成時で更新前の構造化データに関わる非構造化データを前記非構造化データ記憶装置に記憶する記憶制御手段と、前記作成時で更新前における、前記構造化データサーバ装置からの非構造化データを前記更新前の構造化データから参照するための参照情報を前記構造化データサーバ装置に送信する送信手段とを備えたことを特徴とする。 That is, an information processing system according to the present invention is an information processing system having a client device, a structured data server device, and an unstructured data server device, wherein the client device stores structured data and the structured data. Input means for accepting an input operation for creating related unstructured data, first calculation means for calculating a hash value of unstructured data related to structured data created by the input means, and the input means A first transmission means for transmitting the structured data created by the method and unstructured data related to the structured data to the structured data server device, and an operation for inputting the created structured data to the input means. The first step is to calculate the hash value of unstructured data related to the updated structured data. Whether the hash value calculated by the second calculation unit and the hash value of the unstructured data related to the structured data before the update calculated by the first calculation unit match. When the discriminating unit discriminates that the hash value matches, the discriminating unit sends the updated structured data to the structured data server device, and the non-structure related to the updated structured data The structured data server device includes a structured data storage device for storing the structured data, and a pre-update at the time of creation from the client device. Transmitting means for transmitting unstructured data related to the structured data to the unstructured data server device, and structuring before update at the time of creation from the client device First storage control means for storing the reference data of the unstructured data from the unstructured data server device in the structured data storage device and storing the data in the structured data storage device And second storage control means for rewriting the updated structured data before the update to the updated structured data from the client device, wherein the unstructured data server device includes the unstructured data And storage control for storing unstructured data related to structured data before update at the time of creation from the structured data server device in the unstructured data storage device And reference information for referring to unstructured data from the structured data server device before the update at the time of creation from the structured data before the update. And a transmission means for transmitting to the data server device.
また、本発明に係わる情報処理装置は、構造化データおよび当該構造化データに関わる非構造化データの作成のための入力操作を受け付ける入力手段と、前記入力手段により作成された構造化データに関わる非構造化データのハッシュ値を計算する第1の計算手段と、前記入力手段により作成された構造化データを構造化データサーバ装置に記憶するための構造化データとして送信し、当該構造化データに関わる非構造化データを非構造化データサーバ装置に記憶するための非構造化データとして送信する第1の送信手段と、前記作成されて前記構造化データサーバに記憶された構造化データが前記入力手段により更新された場合に、当該構造化データに関わる非構造化データのハッシュ値を計算する第2の計算手段と、前記第2の計算手段により計算したハッシュ値と前記第1の計算手段により計算した、前記更新前の構造化データに関わる非構造化データのハッシュ値とが一致するか否かを判別する判別手段と、前記ハッシュ値が一致すると前記判別手段により判別した場合に、前記更新された構造化データを前記構造化データサーバ装置に記憶するための構造化データとして送信し、前記更新された構造化データに関わる非構造化データは送信しない第2の送信手段とを備えたことを特徴とする。 An information processing apparatus according to the present invention relates to input means for receiving an input operation for creating structured data and unstructured data related to the structured data, and to structured data created by the input means. The first calculation means for calculating the hash value of the unstructured data and the structured data created by the input means are transmitted as structured data for storing in the structured data server device, and the structured data is sent to the structured data. First transmission means for transmitting unstructured data concerned as unstructured data for storing in the unstructured data server device; and the structured data created and stored in the structured data server as the input A second calculating means for calculating a hash value of unstructured data related to the structured data when updated by the means; and the second calculating means Determining means for determining whether or not the hash value calculated by the first calculation means matches the hash value of the unstructured data related to the structured data before update, and the hash value is When it is determined by the determining means that they match, the updated structured data is transmitted as structured data for storage in the structured data server device, and unstructured data related to the updated structured data Is provided with a second transmitting means that does not transmit.
本発明によれば、構造化データおよび非構造化データの適切な伝送処理を行なうことができる。 According to the present invention, it is possible to perform appropriate transmission processing of structured data and unstructured data.
本発明では、XMLDBを含む構造化文書の分散編集環境における画像などの非構造化データの取り扱い方法として、標準的な処理方式を提供する。
また、従来技術では、画像などの非構造化データを含む構造化文書を更新する際、非構造化データの更新がされていなくても、当該非構造化データがサーバへ送信され、更新されてしまう無駄があるが、本発明では、無駄のない非構造化データの更新方式を提供する。
The present invention provides a standard processing method as a method for handling unstructured data such as images in a distributed editing environment for structured documents including XMLDB.
Further, in the prior art, when updating a structured document including unstructured data such as an image, even if the unstructured data is not updated, the unstructured data is transmitted to the server and updated. However, the present invention provides a method for updating unstructured data without waste.
また、本発明では、複数の構造化文書から、ある非構造化データを参照している場合において、非構造化データが更新された場合に、構造化文書のプロパティなどの情報を元に、自動的に非構造化データへの参照情報を更新する手段を提供する。 Also, in the present invention, when unstructured data is updated in a case where some unstructured data is referenced from a plurality of structured documents, an automatic operation is performed based on information such as the properties of the structured document. A means for updating reference information to unstructured data is provided.
図1は、本発明を実現するための情報処理システムの構成例を示すブロック図である。
図1に示すように、本発明の実施形態における情報処理システムは、構造化文書作成クライアント1、構造化文書サーバ2、非構造化データサーバ3、構造化文書DB(データベース)4および非構造化データDB5を備える。
FIG. 1 is a block diagram showing a configuration example of an information processing system for realizing the present invention.
As shown in FIG. 1, an information processing system according to an embodiment of the present invention includes a structured
構造化文書作成クライアント1、構造化文書サーバ2および非構造化データサーバ3は、それぞれの間で通信可能に接続される。また、構造化文書DB4は構造化文書サーバ2と通信可能に接続され、非構造化データDB5は非構造化データサーバ3と通信可能に接続される。また、構造化文書サーバ2は構造化文書DB4を内蔵する形態であってもよく、非構造化データサーバ3は非構造化データDB5を内蔵する形態であってもよい。
The structured
構造化文書DB4は、例えばハードディスクドライブや不揮発性メモリなどの記憶媒体であり、構造化文書の管理のためのデータベース機能を有する。
非構造化データDB5は、例えばハードディスクドライブや不揮発性メモリなどの記憶媒体であり、非構造化データの管理のためのデータベース機能を有する。
The structured
The unstructured data DB5 is a storage medium such as a hard disk drive or a nonvolatile memory, and has a database function for managing unstructured data.
構造化文書作成クライアント1は、構造化文書編集UI(ユーザインタフェース)部1a、サーバ通信部1b、非構造化データハッシュ計算部1c、ハッシュキャッシュ部1d、ハッシュ一致判別部1eを有する。
The structured
構造化文書編集UI部1aは、非構造化データを含む構造化データである構造化文書を編集するためのユーザインタフェース機能を有し、キーボードやマウスなどの入力装置、およびディスプレイ装置などの出力装置により実現される。 The structured document editing UI unit 1a has a user interface function for editing a structured document that is structured data including unstructured data, and includes an input device such as a keyboard and a mouse, and an output device such as a display device. It is realized by.
サーバ通信部1bは、構造化文書サーバ2や非構造化データサーバ3と通信するためのクライアントサイド機能を有する。
非構造化データハッシュ計算部1cは、非構造化データのハッシュ値を計算する。
The server communication unit 1 b has a client side function for communicating with the structured
The unstructured data hash calculation unit 1c calculates a hash value of unstructured data.
ハッシュキャッシュ部1dは、不揮発性メモリなどの記憶媒体であり、非構造化データハッシュ計算部1cによって得られた非構造化データのハッシュを保存する。
ハッシュ一致判別部1eは、ハッシュキャッシュ部1dに保存されるハッシュ値と、この保存後に当該保存されたハッシュに関わる非構造化データを参照する構造化文書が更新された際に、当該更新された構造化文書が参照する非構造化データに関して非構造化データハッシュ計算部1cによって新たに得られたハッシュ値とが一致するか否かを判別する。
The hash cache unit 1d is a storage medium such as a non-volatile memory, and stores a hash of unstructured data obtained by the unstructured data hash calculation unit 1c.
The hash match determination unit 1e is updated when the hash value stored in the hash cache unit 1d and the structured document that refers to the unstructured data related to the stored hash are updated after the storage. It is determined whether or not the hash value newly obtained by the unstructured data hash calculation unit 1c matches the unstructured data referred to by the structured document.
構造化文書サーバ2は、クライアント通信部2a、非構造化データサーバ通信部2b、構造化文書ID発行部2c、非構造化データURI変換部2d、非構造化データ近似度計算部2e、非構造化データマルチ参照処理部2fおよび構造化文書DBアクセス部2gを有する。
The structured
クライアント通信部2aは、構造化文書作成クライアント1と通信を行なうためのサーバサイド機能を有する。
非構造化データサーバ通信部2bは、非構造化データサーバ3と通信を行なうためのクライアントサイド機能を有する。
The client communication unit 2a has a server-side function for communicating with the structured
The unstructured data server communication unit 2 b has a client side function for communicating with the
構造化文書ID発行部2cは、構造化文書を識別するための構造化文書IDを発行する。
非構造化データURI変換部2dは、構造化文書が参照する非構造化データが更新されて非構造化データの識別情報である非構造化データIDが新たに発行された場合、当該構造化文書の中に書かれた非構造化データへの参照情報である非構造化データURIを必要に応じて書き換える。
The structured document
When the unstructured data referred to by the structured document is updated and an unstructured data ID that is identification information of the unstructured data is newly issued, the unstructured data URI conversion unit 2d The unstructured data URI that is reference information to the unstructured data written in is rewritten as necessary.
非構造化データ近似度計算部2eは、構造化文書が参照する非構造化データが更新された場合に、更新前の構造化文書が参照する非構造化データと更新後の構造化文書が参照する非構造化データとの近似度を計算する。
非構造化データマルチ参照処理部2fは、ある非構造化データを参照する構造化文書が複数存在する場合で当該非構造化データが更新された場合に、各構造化文書の中に書かれた、当該該非構造化データURIを必要に応じて書き換える。
When the unstructured data that is referred to by the structured document is updated, the unstructured data approximation degree calculation unit 2e refers to the unstructured data that is referenced by the structured document before the update and the structured document after the update. The degree of approximation with unstructured data is calculated.
The unstructured data multi-reference processing unit 2f is written in each structured document when there are a plurality of structured documents that refer to certain unstructured data and the unstructured data is updated. The unstructured data URI is rewritten as necessary.
構造化文書DBアクセス部2gは、構造化文書DB4にアクセスするための機能を有し、この構造化文書DB4に対する構造化文書の作成、参照、更新、削除といった機能を有する。
The structured document
非構造化データサーバ3は、リクエスト処理部3a、非構造化データID発行部3bおよび非構造化データDBアクセス部3cを有する。
リクエスト処理部3aは、構造化文書作成クライアント1や構造化文書サーバ2と通信を行なうためのサーバサイド機能を有する。
The
The
非構造化データID発行部3bは、非構造化データを識別するための非構造化データIDを発行する。
非構造化データDBアクセス部3cは、非構造化データDB5にアクセスするための機能を有し、この非構造化データDB5に対する非構造化データの作成、参照、更新、削除といった機能を有する。
The unstructured data
The unstructured data DB access unit 3c has a function for accessing the unstructured data DB5, and has a function of creating, referring to, updating, and deleting unstructured data for the unstructured data DB5.
図2は、本発明を実現するための情報処理システムによる構造化文書作成処理の一例を示すフローチャートである。
まず、構造化文書作成クライアント1は、編集者による構造化文書編集UI部1aへの操作により構造化文書が作成されると(ステップA1)、この構造化文書の中に非構造化データが含まれるか否かをチェックする(ステップA2)。
FIG. 2 is a flowchart showing an example of structured document creation processing by the information processing system for realizing the present invention.
First, when the structured document is created by the editor operating the structured document editing UI unit 1a (step A1), the structured
構造化文書に非構造化データが含まれる場合は、構造化文書作成クライアント1は、作成済みの構造化文書が参照する非構造化データのハッシュ値を非構造化データハッシュ計算部1cにより計算する(ステップA3)。
When unstructured data is included in the structured document, the structured
このように非構造化データを含む構造化文書は、前述した非構造化データを参照するための非構造化データ参照情報を含む。構造化文書の作成時では、非構造化データ参照情報は当該非構造化データのファイル名である。 As described above, the structured document including unstructured data includes unstructured data reference information for referring to the above-described unstructured data. At the time of creating the structured document, the unstructured data reference information is the file name of the unstructured data.
そして、構造化文書作成クライアント1は、この計算したハッシュ値をハッシュキャッシュ部1dに保存し(ステップA4)、サーバ通信部1bにより、マルチパート形式を用いて非構造化データと構造化文書の両方を構造化文書サーバ2へ送信する(ステップA6)。
Then, the structured
一方、構造化文書に非構造化データが含まれない場合は、構造化文書作成クライアント1は、サーバ通信部1bにより、構造化文書をそのまま構造化文書サーバ2へ送信する(ステップA5)。
On the other hand, when the unstructured data is not included in the structured document, the structured
構造化文書サーバ2は、構造化文書作成クライアント1からの構造化文書をクライアント通信部2aにより受信して(ステップA11)、この構造化文書が非構造化データを含むか否かを判別する(ステップA12)。
The structured
ステップA11の処理で受信済みの構造化文書に非構造化データが含まれない場合は、構造化文書サーバ2は、この受信済みの構造化文書を識別するための構造化文書IDを構造化文書ID発行部2cにより発行して(ステップA13)、この構造化文書を当該発行した構造化文書IDとともに構造化文書DBアクセス部2gにより構造化文書DB4に保存する(ステップA14)。
If the structured document received in step A11 does not contain unstructured data, the structured
そして、クライアント通信部2aは、前述のように発行された構造化文書IDから計算可能なURIである構造化文書URIを構造化文書作成クライアント1に返信する(ステップA15)。この構造化文書URIは、構造化文書作成クライアント1が受け取り(ステップA16)、処理が終了する。 Then, the client communication unit 2a returns a structured document URI, which is a URI that can be calculated from the structured document ID issued as described above, to the structured document creation client 1 (step A15). The structured document URI is received by the structured document creation client 1 (step A16), and the process ends.
一方、ステップA11の処理で受信済みの構造化文書に非構造化データが含まれる場合は、構造化文書サーバ2は、この非構造化データを非構造化データサーバ通信部2bにより非構造化データサーバ3に送信する(ステップA17)。
On the other hand, if the structured document that has been received in step A11 contains unstructured data, the structured
非構造化データサーバ3は、構造化文書サーバ2からの非構造化データをリクエスト処理部3aにより受信すると(ステップA21)、この非構造化データを識別するための非構造化データIDを非構造化データID発行部3bにより発行する(ステップA22)。
When the
そして、非構造化データサーバ3は、ステップA21の処理で受信した非構造化データを発行済みの非構造化データIDとともに非構造化データDBアクセス部3cにより新規に非構造化データDB5に保存し(ステップA23)、発行済みの非構造化データIDから計算可能である非構造化データURIを構造化文書サーバ2に返信する(ステップA24)。
Then, the
そして、構造化文書サーバ2は、非構造化データサーバ3からの非構造化データURIを非構造化データサーバ通信部2bにより受信し(ステップA31)、この受信した非構造化データURIを用いて、ステップA11の処理で構造化文書作成クライアント1により受信済みの構造化文書の中の非構造化データ参照情報を非構造化データURI変換部2dにより受信済みの非構造化データURIに書き換える(ステップA32)。
The structured
その後、構造化文書ID発行部2cは、ステップA11の処理で構造化文書作成クライアント1により受信済みの構造化文書の構造化文書IDを発行し(ステップA13)、当該構造化文書を当該発行した構造化文書IDとともに構造化文書DBアクセス部2gにより構造化文書DB4に新規保存する(ステップA14)。
Thereafter, the structured document
そして、構造化文書サーバ2は、前述のように発行された構造化文書IDから計算可能なURIである構造化文書URIとステップA31の処理で非構造化データサーバ3から受信した非構造化データURIとのペアをクライアント通信部2aにより構造化文書作成クライアント1に返信する(ステップA15)。
The structured
構造化文書作成クライアント1は、構造化文書サーバ2からの構造化文書URIと非構造化データURIとをサーバ通信部1bにより受信し(ステップA16)、これらのURIを構造化文書編集UI部11により表示させることで、構造化文書の作成処理を終了する。
The structured
次に、前述のように作成された構造化文書を更新する際の処理の流れについて説明する。図3は、本発明を実現するための情報処理システムによる構造化文書更新処理の一例を示すフローチャートである。
まず、構造化文書作成クライアント1は、編集者による構造化文書編集UI部11への操作による更新対象の構造化文書の構造化文書URIの指定にともなって、当該更新対象の構造化文書を構造化文書編集UI部11により表示させ、この構造化文書が入力操作により更新されると(ステップB1)、この更新された構造化文書に非構造化データが含まれるか否かをチェックする(ステップB2)。
Next, the flow of processing when updating the structured document created as described above will be described. FIG. 3 is a flowchart showing an example of structured document update processing by the information processing system for realizing the present invention.
First, the structured
構造化文書作成クライアント1は、更新された構造化文書に非構造化データが含まれない場合は、この構造化文書を当該文書の構造化文書URIとともにサーバ通信部1bにより構造化文書サーバ2にそのまま送信する(ステップB3)。
When the updated structured document does not include unstructured data, the structured
一方、構造化文書作成クライアント1は、更新された構造化文書に非構造化データが含まれる場合は、この非構造化データのハッシュ値を非構造化データハッシュ計算部1cにより計算する。(ステップB4)
ハッシュ一致判別部1eは、既にハッシュキャッシュ部1dに保存された元のハッシュ値を取得し(ステップB5)、この取得したハッシュ値とステップB4の処理により計算済みのハッシュ値とを比較することで両者が一致するか否かを判別する(ステップB6,B7)。
On the other hand, when the structured document that has been updated contains unstructured data, the structured
The hash match determination unit 1e acquires the original hash value already stored in the hash cache unit 1d (step B5), and compares the acquired hash value with the hash value that has been calculated by the process of step B4. It is determined whether or not both match (steps B6 and B7).
構造化文書作成クライアント1は、この判別の結果、ハッシュ値同士が一致する場合は、更新された構造化文書の非構造化データが更新されていないと判別して、構造化文書を当該文書の構造化文書URIとともにサーバ通信部1bにより構造化文書サーバ2に送信する一方、前述した更新されていない非構造化データは送信対象としない(ステップB3)。
If the hash values match as a result of this determination, the structured
一方、構造化文書作成クライアント1は、ステップB7の処理による判別の結果、両者のハッシュ値が一致しない場合は、更新された構造化文書の非構造化データが更新されたとみなし、この非構造化データを含む構造化文書を当該文書の構造化文書URIとともにサーバ通信部1bにより構造化文書サーバ2に送信する(ステップB8,B9)。
On the other hand, if the hash value of the structured
構造化文書サーバ2は、構造化文書作成クライアント1からの構造化文書をクライアント通信部2aにより受信すると(ステップB11)、この受信した構造化文書に非構造化データが含まれるか否かをチェックする(ステップB12)。
When the structured
構造化文書サーバ2は、構造化文書作成クライアント1からの構造化文書に非構造化データが含まれない場合は、構造化文書DB4に保存される構造化文書のうち、ステップB11の処理で受信した構造化文書の構造化文書URIから計算される構造化文書IDに対応する構造化文書の更新処理のみを構造化文書DBアクセス部2gにより行ない(ステップB13)、更新完了通知をクライアント通信部2aを介して構造化文書作成クライアント1に発行する(ステップB14)。
構造化文書作成クライアント1は、構造化文書サーバ2からの更新完了通知をサーバ通信部1bにより受領し(ステップB15)、更新処理を終了する。
When the structured document from the structured
The structured
一方、構造化文書サーバ2は、構造化文書作成クライアント1からの構造化文書に非構造化データが含まれる場合は、元の非構造化データを非構造化データサーバ3から取得した上で、この元の非構造化データと前述のように更新後の構造化文書に含まれる非構造化データとの近似度を計算する(ステップB16)。
On the other hand, when the structured document from the structured
構造化文書サーバ2は、ステップB16の処理の結果、両者の近似度が高い場合、更新前後の非構造化データが同じものとみなして、この非構造化データは上書き対象のデータであると判別し、ステップB11の処理で構造化文書作成クライアント1から受信済みの構造化文書の中で示される非構造化データURIを取得する(ステップB17→B18)。
The structured
構造化文書サーバ2は、上書き対象である非構造化データを取得済みの非構造化データURIおよび上書きの指示とともに非構造化データサーバ通信部2bにより非構造化データサーバ3に送信する(ステップB19)。
The structured
非構造化データサーバ3は、構造化文書サーバ2からの非構造化データなどをリクエスト処理部3aにより受信すると(ステップB21)、非構造化データDBアクセス部3cは、非構造化データDB5に保存される非構造化データのうち、ステップB21の処理で構造化文書サーバ2から受信した非構造化データURIから計算される非構造化データIDに対応する非構造化データを、同じくステップB11の処理で構造化文書サーバ2から受信した非構造化データに上書き更新し(ステップB22)、当該非構造化データの更新完了通知をリクエスト処理部3aにより構造化文書サーバ2に返信する(ステップB23)。
When the
構造化文書サーバ2は、非構造化データサーバ3からの更新完了通知を非構造化データサーバ通信部2bにより受領すると(ステップB24)、構造化文書DB4に保存される構造化文書のうち、既にステップB11の処理で構造化文書作成クライアント1から受信した構造化文書の構造化文書URIから計算される構造化文書IDに対応する構造化文書の更新処理を構造化文書DBアクセス部2gにより行ない(ステップB13)、更新完了通知をクライアント通信部2aにより構造化文書作成クライアント1に発行する(ステップB14)。
構造化文書作成クライアント1は、構造化文書サーバ2からの更新完了通知をサーバ通信部1bにより受領し(ステップB15)、更新処理を終了する。
When the structured
The structured
一方、構造化文書サーバ2は、ステップB16の処理の結果、近似度が低い場合は、更新後の非構造化データが元の非構造化データと全く異なるとみなして、この非構造化データは上書き対象ではなく置換対象のデータであると判別する(ステップB17→B25)。
On the other hand, if the degree of approximation is low as a result of the processing in step B16, the structured
構造化文書サーバ2は、置換対象である非構造化データを置換の指示とともに非構造化データサーバ通信部2bにより非構造化データサーバ3に送信する(ステップB26)。
The structured
非構造化データサーバ3は、構造化文書サーバ2からの置換対象の非構造化データなどをリクエスト処理部3aにより受信すると(ステップB27)、この非構造化データの非構造化データIDを非構造化データID発行部3bにより新規に発行する(ステップB28)。
When the
非構造化データDBアクセス部3cは、この非構造化データIDをステップB27の処理で受信済みの非構造化データと関連付けて非構造化データDB5に新規保存し(ステップB29)、この非構造化データIDから非構造化データURIを計算して、当該計算した非構造化データURIをリクエスト処理部3aにより構造化文書サーバ2に返信する(ステップB30)。
The unstructured data DB access unit 3c newly stores the unstructured data ID in the
構造化文書サーバ2の非構造化データサーバ通信部2bが、非構造化データサーバ3からの非構造化データURIを受信すると(ステップB31)、非構造化データURI変換部2dは、ステップB11の処理で構造化文書作成クライアント1から受信した構造化文書に含まれる非構造化データURIを、ステップB31の処理で非構造化データサーバ3から受信した新たな非構造化データURIに書き換える(ステップB32)。
When the unstructured data server communication unit 2b of the structured
さらに、構造化文書サーバ2の構造化文書DBアクセス部2gは、構造化文書DB4に保存される構造化文書のうち、受信した構造化文書の構造化文書URIから計算される構造化文書IDに対応する構造化文書を、ステップB32の処理により非構造化データURIが書き換えられた構造化文書に更新する(ステップB33)。
Further, the structured document
その次に、構造化文書サーバ2は、当該非構造化データへ参照する他の構造化文書があるか否かをチェックし(ステップB34)、当該他の構造化文書がない場合は、構造化文書の更新完了通知をクライアント通信部2aにより構造化文書作成クライアント1に発行する(ステップB14)。
そして構造化文書作成クライアント1が構造化文書の更新完了通知をサーバ通信部1bにより受け取り(ステップB15)、更新処理が終了する。
Next, the structured
The structured
一方、構造化文書サーバ2は、前述した他の構造化文書がある場合は、これらの構造化文書のプロパティを調査し、この調査したプロパティが更新済みの構造化文書と類似しているか否かなどの判別結果をもとに、調査済みの構造化文書に含まれる非構造化データURIを、ステップB31の処理で新たに受信した非構造化データURIに書き換え(ステップB35)、更新完了通知をクライアント通信部2aにより構造化文書作成クライアント1に発行する(ステップB14)。
そして構造化文書作成クライアント1が構造化文書の更新完了通知をサーバ通信部1bにより受け取り(ステップB15)、更新処理が終了する。
On the other hand, when there is another structured document described above, the structured
The structured
以下は、非構造化データの具体例が画像である場合の本発明の実施形態を説明する。図4は、本発明の実施形態における情報処理システムの構成例を示すブロック図である。
図4に示すように、本発明の実施形態における情報処理システムは、構造化文書作成クライアント10、構造化文書サーバ20、画像サーバ30、文書DB40および画像DB50を備える。構造化文書作成クライアント10、構造化文書サーバ20、画像サーバ30は、それぞれの間で通信可能に接続される。
The following describes an embodiment of the present invention where a specific example of unstructured data is an image. FIG. 4 is a block diagram showing a configuration example of the information processing system in the embodiment of the present invention.
As illustrated in FIG. 4, the information processing system according to the embodiment of the present invention includes a structured
また、文書DB40は構造化文書サーバ20と通信可能に接続され、画像DB50は画像サーバ30と通信可能に接続される。また、構造化文書サーバ20は文書DB40を内蔵する形態であってもよく、画像サーバ30は画像DB50を内蔵する形態であってもよい。
The
文書DB40は、例えばハードディスクドライブや不揮発性メモリなどの記憶媒体であり、構造化文書の管理のためのデータベース機能を有する。
画像DB50は、例えばハードディスクドライブや不揮発性メモリなどの記憶媒体であり、画像の管理のためのデータベース機能を有する。
The
The
構造化文書作成クライアント10は、構造化文書編集UI部11、サーバ通信部12、画像ハッシュ計算部13、ハッシュキャッシュ部14、ハッシュ一致判別部15を有する。
構造化文書編集UI部11は、画像を含む構造化データである構造化文書を編集するためのユーザインタフェース機能を有し、キーボードやマウスなどの入力装置、およびディスプレイ装置などの出力装置により実現される。
サーバ通信部12は、構造化文書サーバ20や画像サーバ30と通信するためのクライアントサイド機能を有する。
The structured
The structured document
The
画像ハッシュ計算部13は、画像のハッシュ値を計算する。ハッシュキャッシュ部14は、不揮発性メモリなどの記憶媒体であり、画像ハッシュ計算部13によって得られたハッシュ値を記憶する。
The image
ハッシュ一致判別部15は、ハッシュキャッシュ部14に記憶されるハッシュ値と、この記憶後に構造化文書が更新された際に、当該構造化文書が参照する画像に関して画像ハッシュ計算部13によって新たに得られたハッシュ値とが一致するか否かを判別する。
The hash
構造化文書サーバ20は、クライアント通信部21、画像サーバ通信部22、文書ID発行部23、画像URI変換部24、画像近似度計算部25、画像マルチ参照処理部26および構造化文書DBアクセス部27を有する。
The structured
クライアント通信部21は、構造化文書作成クライアント10と通信を行なうためのサーバサイド機能を有する。
画像サーバ通信部22は、画像サーバ30と通信を行なうためのクライアントサイド機能を有する。
文書ID発行部23は、構造化文書を識別するための文書IDを発行する。
The
The image
The document
画像URI変換部24は、構造化文書が参照する画像が更新されて当該画像のIDが新たに発行された場合、構造化文書の中に書かれた画像参照情報である画像URIを書き換える。
画像近似度計算部25は、構造化文書が参照する画像が更新された場合に、更新前の構造化文書が参照する画像と更新後の構造化文書が参照する画像との近似度を計算する。
When the image referred to by the structured document is updated and an ID of the image is newly issued, the image
When the image referred to by the structured document is updated, the image approximation
画像マルチ参照処理部26は、ある画像を参照する構造化文書が複数存在する場合で当該画像が更新された場合に、各構造化文書の中に書かれた当該画像参照情報である画像URIを書き換える。
構造化文書DBアクセス部27は、文書DB40にアクセスするための機能を有し、この文書DB40に対する構造化文書の作成、参照、更新、削除といった機能を有する。
When there are a plurality of structured documents that refer to an image and the image is updated, the image
The structured document
画像サーバ30は、リクエスト処理部31、画像ID発行部32および画像DBアクセス部33を有する。
リクエスト処理部31は、構造化文書作成クライアント10や構造化文書サーバ20と通信を行なうためのサーバサイド機能を有する。
The
The
画像ID発行部32は、画像を識別するための画像IDを発行する。
画像DBアクセス部33は、画像DB50にアクセスするための機能を有し、この画像DB50に対する画像の作成、参照、更新、削除といった機能を有する。
The image
The image
次に、画像を含む構造化文書を編集作成する場合の動作について説明する。
図5は、本発明の実施形態における情報処理システムによる構造化文書の作成の手順を示す図である。
図6は、本発明の実施形態における情報処理システムによる画像付き構造化文書の伝送処理の一例を示すフローチャートである。
図7は、本発明の実施形態における情報処理システムによる構造化文書の作成画面の一例を示す図である。
図8は、本発明の実施形態における情報処理システムによる構造化文書のソースコードの一例を示す図である。
構造化文書作成クライアント10の構造化文書編集UI部11により表示する各種画面は、Webブラウザやスタンドアロンアプリケーションプログラムにより表示される。編集者は構造化文書編集UI部11への入力操作により、図7に示した作成画面を表示させて、この画面上で文書のタイトル、作成者名、作成日、本文を編集し、かつ当該文書に対する画像の添付のための入力操作を行なうことで、図8に示したようなXML形式の画像付き構造化文書の作成がなされる(ステップS1)。
Next, an operation for editing and creating a structured document including an image will be described.
FIG. 5 is a diagram showing a procedure for creating a structured document by the information processing system according to the embodiment of the present invention.
FIG. 6 is a flowchart illustrating an example of transmission processing of a structured document with images by the information processing system according to the embodiment of the present invention.
FIG. 7 is a diagram showing an example of a structured document creation screen by the information processing system according to the embodiment of the present invention.
FIG. 8 is a diagram showing an example of the source code of the structured document by the information processing system according to the embodiment of the present invention.
Various screens displayed by the structured document
作成済みの構造化文書には、当該構造化文書に対する画像を参照するための画像参照情報が含まれる。図8に示した例では、構造化文書における画像参照情報は画像ファイル名「waterlilies.jpg」である。 The created structured document includes image reference information for referring to an image with respect to the structured document. In the example shown in FIG. 8, the image reference information in the structured document is an image file name “waterlilies.jpg”.
すると、画像ハッシュ計算部13は、作成済みの画像付き構造化文書における画像のハッシュ値を計算し(ステップS2)、このハッシュ値をハッシュキャッシュ部14に保存する(ステップS3)。
Then, the image
図9は、本発明の実施形態における情報処理システムによる構造化文書の画像ハッシュ値の保存後のソースコードの一例を示す図である。
画像のハッシュ値の保存方法はいくつか考えられるが、例えば図9に示すように、作成済みの構造化文書のソースコード中にハッシュ値を含ませて、この文書をハッシュキャッシュ部14に保存することが挙げられる。
FIG. 9 is a diagram showing an example of the source code after storing the image hash value of the structured document by the information processing system according to the embodiment of the present invention.
There are several methods for storing the hash value of the image. For example, as shown in FIG. 9, the hash value is included in the source code of the structured document that has been created, and the document is stored in the
本実施形態では、構造化文書作成クライアント10と構造化文書サーバ20と画像サーバ30と間の通信は、REST(Representational State Transfer)に基づき、HTTP上で行われる。
通信時のインタフェースは、構造化文書の作成時は「HTTP POST」で、構造化文書の参照時は「HTTP GET」で、構造化文書の更新時は「HTTP PUT」で、構造化文書の削除時は「HTTP DELETE」である。
In this embodiment, communication among the structured
The interface for communication is "HTTP POST" when creating a structured document, "HTTP GET" when referring to a structured document, and "HTTP PUT" when updating a structured document. Deleting a structured document The time is “HTTP DELETE”.
よって、構造化文書作成クライアント10のサーバ通信部12は、文書の新規作成時は、リクエスト「POST http://document.example.com/server」を用いて、図9に示したような構造化文書のXMLと画像をマルチパートで構造化文書サーバ20に送信する(ステップS4)。このリクエスト中の「http://document.example.com」は構造化文書サーバ20のサーバ名である。
Therefore, the
図10は、本発明の実施形態における情報処理システムによる構造化文書の送信情報の一例を示す図である。
構造化文書サーバ20のクライアント通信部21が、構造化文書作成クライアント10からの画像付きの構造化文書を受信すると(ステップS5)、画像サーバ通信部22は、この受信した画像をリクエスト「POST http://picture.example.com/server」用いて画像サーバ30に送信する(ステップS6)。このリクエスト中の「http://picture.example.com」は画像サーバ30のサーバ名である。
FIG. 10 is a diagram showing an example of transmission information of a structured document by the information processing system according to the embodiment of the present invention.
When the
画像サーバ30は、構造化文書サーバ20から送られてきた画像をリクエスト処理部31により受信し、この画像を識別する画像IDを画像ID発行部32により発行する。ここでは発行された画像IDは「picId」とする。そして、画像DBアクセス部33は、受信済みの画像を発行済みの画像IDと関連付けて画像DB50に登録する(ステップS7)。
The
そして、画像サーバ30のリクエスト処理部31は、発行済みの画像IDをもとに画像URIを計算して、この画像URIを構造化文書サーバ20に返信する(ステップS8)。ここでは、画像URIは「http://picture.example.com/picId」であり、当該URIの末尾は前述した画像IDである。
Then, the
そして、構造化文書サーバ20の画像サーバ通信部22が、画像サーバ30からの画像URIを受信すると(ステップS9)、画像URI変換部24は、ステップS5の処理で前述したように構造化文書作成クライアント10から受信した構造化文書の中の画像参照情報を、ステップS9の処理で受信済みの非構造化データURIに書き換える(ステップS10)。
When the image
そして、構造化文書サーバ20の文書ID発行部23は、ステップS5の処理で受信した構造化文書の構造化文書IDを発行する。ここでは、発行された構造化文書IDは「docId」である。
Then, the document
そして、構造化文書サーバ20は、発行された文書IDをステップS5の処理で受信済みの構造化文書に書き込み、この構造化文書を文書DBアクセス部27により、文書DB40に登録する(ステップS11)。
Then, the structured
図11は、本発明の実施形態における情報処理システムによる構造化文書の画像参照の書き換え後のソースコードの一例を示す図である。
構造化文書サーバ20は、最後に、前述のように発行された構造化文書ID「docId」をもとに構造化文書のURIである文書URI「http://document.example.com/docId」を計算し、この文書URIをステップS9の処理で画像サーバ30から受信済みである、画像URI「http://picture.example.com/picId」とともにクライアント通信部21により構造化文書作成クライアント10に返信する(ステップS12)。
FIG. 11 is a diagram showing an example of the source code after rewriting the image reference of the structured document by the information processing system according to the embodiment of the present invention.
Finally, the structured
構造化文書作成クライアント10は、構造化文書サーバ20からの文書URIおよび画像URIをサーバ通信部12により受信すると、これらを内部記憶装置に保存し、かつ、画像URIを前述したようにハッシュキャッシュ部14に記憶されたハッシュ値に関連付けるとともに、受信済みの文書URIおよび画像URIを構造化文書編集UI部11を用いて画面表示させる。
When the structured
編集者は、これらの構造化文書URIと画像URIを確認して、後にこれらの構造化文書URIや画像URIを構造化文書編集UI部11により指定することで、構造化文書や画像をそれぞれ参照することができる。
The editor confirms the structured document URI and the image URI, and later designates the structured document URI and the image URI by the structured document
構造化文書IDや画像IDの発行に関しては、様々なアルゴリズムを利用することが可能である。例えば、連番、例えばdoc001、doc002、doc003、…のように、UUID(Universally Unique Identifier)などを利用することができる。 Various algorithms can be used for issuing structured document IDs and image IDs. For example, serial numbers such as UUID (Universally Unique Identifier) such as doc001, doc002, doc003,... Can be used.
また、文書URIと画像のURIは、それぞれ発行された文書IDや画像IDを用いて計算することが可能である。
本実施形態では例えば、構造化文書IDと構造化文書サーバ20のサーバ名をもとに、文書URIは「http://構造化文書サーバ名/{文書ID}」であると計算することができる。
また、例えば、画像IDと画像サーバ30のサーバ名をもとに、画像URIは「http://画像サーバ名/{画像ID}」であると計算することができる。
The document URI and the image URI can be calculated using the issued document ID and image ID, respectively.
In the present embodiment, for example, based on the structured document ID and the server name of the structured
For example, based on the image ID and the server name of the
例えば、構造化文書IDが「doc001」の場合で、前述したように構造化文書サーバ20のサーバ名が「http://document.example.com」である場合は、構造化文書のURIは「http://document.example.com/doc001」となる。
For example, when the structured document ID is “doc001” and the server name of the structured
また、画像IDが「pic001」の場で、前述したように画像サーバ30のサーバ名が「http://picture.example.com」である場合は、画像のURIは「http://picture.example.com/pic001」となる。
When the image ID is “pic001” and the server name of the
次に、作成済みの構造化文書の参照について説明する。
図12は、本発明の実施形態における情報処理システムによる構造化文書の参照の手順を示す図である。
図13は、本発明の実施形態における情報処理システムによる画像付き構造化文書の参照処理の一例を示すフローチャートである。
まず、構造化文書作成クライアント10は、編集者による構造化文書編集UI部11への入力操作により参照対象の構造化文書の構造化文書URIを指定することで(ステップS21)、この構造化文書URIを用いて構造化文書の参照のリクエストをサーバ通信部12により構造化文書サーバ20に送信する(ステップS22)。
例えば、指定された構造化文書URIが「http://document.example.com/docId」である場合には、参照のリクエストは「GET http://document.example.com/docId」となる。
Next, reference to a created structured document will be described.
FIG. 12 is a diagram showing a procedure for referring to a structured document by the information processing system according to the embodiment of the present invention.
FIG. 13 is a flowchart showing an example of a reference process for a structured document with an image by the information processing system according to the embodiment of the present invention.
First, the structured
For example, when the specified structured document URI is “http://document.example.com/docId”, the reference request is “GET http://document.example.com/docId”.
構造化文書サーバ20は、構造化文書作成クライアント10からの参照のリクエストをクライアント通信部21により受信すると(ステップS23)、この構造化文書URIから、参照対象の構造化文書の構造化文書IDを計算する。
参照のリクエストが前述した「GET http://document.example.com/docId」である場合は、構造化文書IDは当該リクエストの末尾の「docId」となる。
When the structured
When the reference request is “GET http://document.example.com/docId”, the structured document ID is “docId” at the end of the request.
そして、文書DBアクセス部27は、文書DB40に保存される構造化文書のうち、計算済みの構造化文書IDに対応する構造化文書を取得する。この構造化文書はクライアント通信部21により構造化文書作成クライアント10へ送信される(ステップS24)。
Then, the document
構造化文書作成クライアント10は、構造化文書サーバ20からの構造化文書をサーバ通信部12により受信すると(ステップS25)、この構造化文書の中に記述される画像参照用の画像URIを認識し(ステップS26)、この認識した画像URIをもとにした画像参照のリクエストをサーバ通信部12により画像サーバ30へ送信する(ステップS27)。
例えば、認識した画像URIが「http://picture.example.com/picId」である場合には、画像参照のリクエストは「GET http://picture.example.com/picId」となる。
When the structured
For example, when the recognized image URI is “http://picture.example.com/picId”, the image reference request is “GET http://picture.example.com/picId”.
画像サーバ30は、構造化文書サーバ20からの画像参照のリクエストをリクエスト処理部31により受信すると(ステップS28)、この画像URIから、参照対象の画像の画像IDを計算する。
参照のリクエストが前述した「GET http://picture.example.com/picId」である場合は、画像IDは当該リクエストの末尾の「picId」となる。
When the image processing request is received by the
If the reference request is “GET http://picture.example.com/picId”, the image ID is “picId” at the end of the request.
そして、画像DBアクセス部33は、画像DB50に保存される画像のうち、計算済みの画像IDに対応する画像を取得する。この画像はリクエスト処理部31により構造化文書作成クライアント10へ送信される(ステップS29)。
Then, the image
構造化文書作成クライアント10は、画像サーバ30からの画像をサーバ通信部12により受信すると(ステップS30)、この画像を構造化文書編集UI部11により表示する(ステップS31)。以上で参照処理が終了する。
When the structured
次に、参照済みの構造化文書を更に編集することによる更新処理について説明する。
図14は、本発明の実施形態における情報処理システムによる構造化文書の更新の手順の第1の例を示す図である。
図15は、本発明の実施形態における情報処理システムによる画像付き構造化文書の更新処理の第1の例を示すフローチャートである。
更新処理は2通りあり、まず、更新後の構造化文書の画像のハッシュ値と更新前の同じ構造化文書の画像のハッシュ値とが一致する場合の更新処理について説明する。
Next, update processing by further editing the referenced structured document will be described.
FIG. 14 is a diagram showing a first example of a procedure for updating a structured document by the information processing system in the embodiment of the present invention.
FIG. 15 is a flowchart illustrating a first example of the update process of the structured document with image by the information processing system according to the embodiment of the present invention.
There are two types of update processing. First, update processing in the case where the hash value of the image of the structured document after update matches the hash value of the image of the same structured document before update will be described.
まず、前述した参照のための操作により構造化文書作成クライアント10の構造化文書編集UI部11により表示される構造化文書が編集者による入力操作により更新されると(ステップS41)、画像ハッシュ計算部13は、この更新された構造化文書に添付される画像のハッシュ値を計算する(ステップS42)。
First, when the structured document displayed by the structured document
前述したハッシュ値は、元となるデータに対してハッシュ計算アルゴリズムを用いて計算される。ハッシュ計算アルゴリズムにはMDA、SHA1などがある。
ハッシュの特徴としては以下の四つが挙げられる。第1の特徴は、ハッシュ値の長さは元データのデータサイズに関わらず固定長になる点である。第2の特徴は、ハッシュ値の長さは、ハッシュ計算のために用いたアルゴリズムによって異なる点である。
The hash value described above is calculated using a hash calculation algorithm on the original data. There are HDA algorithms such as MDA and SHA1.
The hash has the following four features. The first feature is that the hash value has a fixed length regardless of the data size of the original data. The second feature is that the length of the hash value differs depending on the algorithm used for the hash calculation.
第3の特徴は、元データが異なれば、その計算結果であるハッシュ値も異なり、同じハッシュ値になることは極めてまれである点である。第4の特徴は、ハッシュ値とその計算アルゴリズムが判明しても元データを特定することができない点である。 The third feature is that if the original data is different, the hash value as the calculation result is also different, and it is extremely rare that the same hash value is obtained. The fourth feature is that the original data cannot be specified even if the hash value and its calculation algorithm are known.
前述したように、ハッシュキャッシュ部14に記憶されたハッシュ値には当該ハッシュ値の画像を参照する構造化文書の文書URI「http://document.example.com/docId」が関連付けられる。ハッシュ一致判別部15は、既にハッシュキャッシュ部14に保存されるハッシュ値のうち、前述した参照のために指定した構造化文書URIが関連付けられるハッシュ値である元のハッシュ値を取得し(ステップS43)、この取得したハッシュ値とステップS42の処理により計算済みのハッシュ値とを比較することで両者が一致するか否かを判別する(ステップS44)。
As described above, the hash value stored in the
構造化文書作成クライアント10は、ハッシュ一致判別部15によりハッシュ値同士が一致すると判別した場合は(ステップS45)、更新された構造化文書の画像が更新されていないと判別して、構造化文書を当該文書の構造化文書URI「http://document.example.com/docId」をもとにした更新リクエスト「PUT http://document.example.com/docId」を用いてサーバ通信部12により構造化文書サーバ20に送信する一方で、前述した更新されていないと判別した画像は送信対象としない(ステップS46)。
When the hash
構造化文書サーバ20は、構造化文書作成クライアント10からの構造化文書の更新リクエストをクライアント通信部21により受信すると(ステップS47)、文書DB40に保存される構造化文書のうち、当該受信したリクエストで示される構造化文書URI「http://document.example.com/docId」から計算される構造化文書ID「docId」に対応する構造化文書を当該受信した構造化文書に更新する処理を構造化文書DBアクセス部27により行ない(ステップS48)、更新完了通知をクライアント通信部21により構造化文書作成クライアント10に発行する(ステップS49)。
構造化文書作成クライアント10は、構造化文書サーバ20からの更新完了通知をサーバ通信部12により受領し、更新処理を終了する。
When the structured
The structured
このように、更新された構造化文書の画像が更新されていない場合には、当該構造化文書の画像は構造化文書作成クライアント10から構造化文書サーバ20に送信されないので、ネットワークの負荷を低減することができる。
As described above, when the image of the updated structured document is not updated, the image of the structured document is not transmitted from the structured
次に、更新後の構造化文書の画像のハッシュ値と更新前の同じ構造化文書の画像のハッシュ値とが一致しない場合の更新処理について説明する。
図16は、本発明の実施形態における情報処理システムによる処理対象の画像データ同士の近似度の高低を示す図である。
この、ハッシュ値同士が一致しない場合の更新処理は、図16に示すように更新後の構造化文書の画像と更新前の同じ構造化文書の画像との近似度が高い場合と低い場合とで異なる。まず、更新後の構造化文書の画像と更新前の同じ構造化文書の画像との近似度が高い場合の更新処理について説明する。
Next, an update process when the hash value of the image of the structured document after the update and the hash value of the image of the same structured document before the update do not match will be described.
FIG. 16 is a diagram showing the degree of approximation between image data to be processed by the information processing system according to the embodiment of the present invention.
The update processing in the case where the hash values do not match is shown in FIG. 16 when the degree of approximation between the image of the structured document after update and the image of the same structured document before update is high or low. Different. First, update processing when the degree of approximation between an image of a structured document after update and an image of the same structured document before update is high will be described.
図17は、本発明の実施形態における情報処理システムによる構造化文書の更新の手順の第2の例を示す図である。
図18は、本発明の実施形態における情報処理システムによる画像付き構造化文書の更新処理の第2の例を示すフローチャートである。
まず、前述したステップS41〜S44までの処理、つまり画像付き構造化文書の更新からハッシュ比較までの処理がなされた上で、構造化文書作成クライアント10は、ハッシュ一致判別部15によりハッシュ値同士が一致しないと判別した場合は(ステップS51)、更新された構造化文書の画像が元の画像から更新されたことを意味する。
FIG. 17 is a diagram showing a second example of the procedure for updating the structured document by the information processing system according to the embodiment of the present invention.
FIG. 18 is a flowchart showing a second example of the updating process of the structured document with image by the information processing system according to the embodiment of the present invention.
First, after the processing from the above-described steps S41 to S44, that is, the processing from the update of the structured document with image to the hash comparison, the structured
この場合、画像ハッシュ計算部13は、更新された構造化文書に関わる画像のハッシュ値を新たに計算する。さらに、画像ハッシュ計算部13は、ハッシュキャッシュ部14に保存されるハッシュ値のうち、更新された構造化文書の構造化文書URIが関連付けられるハッシュ値を前述したように新たに計算したハッシュ値に更新する(ステップS52)。
In this case, the image
そして、構造化文書作成クライアント10は、更新された構造化文書および画像を図10に示したように、マルチパートにより、当該文書の構造化文書URI「http://document.example.com/docId」をもとにした更新リクエスト「PUT http://document.example.com/docId」を用いてサーバ通信部12により構造化文書サーバ20に送信する(ステップS53)。ここでの作成時との違いは、更新時はPUTメソッド「PUT http://document.example.com/docId」を利用する点である。
Then, the structured
構造化文書サーバ20は、クライアント通信部21により、構造化文書作成クライアント10からの画像付き構造化文書を更新リクエストとともに受信すると(ステップS54)、構造化文書作成クライアント10から受信した構造化文書の中で示される画像URI「http://picture.example.com/picId」を認識して、この画像URIをもとに更新対象の画像の画像ID「picId」を認識する。
When the structured
この画像ID「picId」は元の画像の画像IDでもある。よって、構造化文書サーバ20は、この画像IDをもとに、元の画像の参照リクエスト「GET http://picture.example.com/picId」を画像サーバ通信部22を介して画像サーバ30に送信する(ステップS55)。
This image ID “picId” is also the image ID of the original image. Therefore, the structured
画像サーバ30は、構造化文書サーバ20からの元の画像の参照リクエストをリクエスト処理部31により受信すると、画像DB50に保存される画像のうち、受信した参照リクエスト「GET http://picture.example.com/picId」から計算される画像ID「picId」に対応する元の画像を画像DBアクセス部33により取得し(ステップS56)、この元の画像をリクエスト処理部31により構造化文書サーバ20に送信する(ステップS57)。
When the
構造化文書サーバ20は、画像サーバ30からの元の画像を画像サーバ通信部22により受信する(ステップS58)。すると、画像近似度計算部25は、ステップS54の処理で受信した更新後の画像とステップS58の処理で受信した元の画像とを比較することで、両者の近似度を判別する(ステップS59)。
The structured
なお、画像の近似度計算は公知の技術を用いて行なう。
画像近似度については、例えば下記の論文や特許文献に開示されている。
(1)岡山理科大学 松若 光一、榎本 拓郎、鴉 裕孝「画像類似度に関する研究」 [online]、[2009年4月10日検索]、インターネット<URL:http://gemini.mis.ous.ac.jp/Rejume/2005/sim.pdf>
(2)早稲田大学「類似画像検索方法および類似画像検索装置」、特開2006−285570号公報、[online]、[2009年4月10日検索]、インターネット<URL:http://jstore.jst.go.jp/cgibin/patent/advanced/pat/detail_pat.cgi?patid=13404&detail_id=15474>
構造化文書サーバ20は、近似度が所定値以上、つまり近似度が高いと画像近似度計算部25により判別した場合(ステップS60)、更新前後の画像が同じものとみなして、この画像は上書き対象のデータであると判別し、構造化文書作成クライアント10からの構造化文書の中で示される画像URI「http://picture.example.com/picId」を取得する。
Note that the degree of approximation of an image is calculated using a known technique.
The image approximation degree is disclosed in, for example, the following papers and patent documents.
(1) Okayama University of Science Koichi Matsuwaka, Takuro Enomoto, Hirotaka Tsuji “Studies on Image Similarity” [online], [Search April 10, 2009], Internet <URL: http://gemini.mis.ous.ac .jp / Rejume / 2005 / sim.pdf>
(2) Waseda University “Similar Image Retrieval Method and Similar Image Retrieval Device”, Japanese Patent Laid-Open No. 2006-285570, [online], [Retrieval on April 10, 2009], Internet <URL: http: //jstore.jst .go.jp / cgibin / patent / advanced / pat / detail_pat.cgi? patid = 13404 & detail_id = 15474>
If the structured
構造化文書サーバ20は、上書き対象である画像を取得済みの画像URIをもとにした画像上書き更新リクエスト「PUT http://picture.example.com/picId」を用いて画像サーバ通信部22により画像サーバ30に送信する(ステップS61)。
The structured
画像サーバ30のリクエスト処理部31が、構造化文書サーバ20からの画像上書き更新リクエストを上書き対象の画像とともに受信すると、画像データDBアクセス部33は、画像DB50に保存される画像のうち、受信した画像上書き更新リクエスト中の画像ID「picId」に対応する画像を、画像上書き更新リクエストとともに受信した画像に上書き更新する(ステップS62)。そして、リクエスト処理部31は、当該画像の更新完了通知を構造化文書サーバ20に返信する。
つまり、画像サーバ30側で画像の更新処理はなされるが、その際に当該画像の画像IDはそのままである。したがって、当該画像の画像URIもそのままで変更されないことになる。
When the
That is, the image update process is performed on the
構造化文書サーバ20は、画像サーバ30からの更新完了通知を画像サーバ通信部22により受信すると、文書DB40に保存される構造化文書のうち、受信済みの更新リクエストで示される構造化文書URI「http://document.example.com/docId」から計算される構造化文書ID「docId」に対応する構造化文書をステップS54の処理で受信した構造化文書に更新する処理を構造化文書DBアクセス部27により行ない(ステップS63)、更新完了通知をクライアント通信部21により構造化文書作成クライアント10に発行する(ステップS64)。
構造化文書作成クライアント10は、構造化文書サーバ20からの更新完了通知をサーバ通信部12により受領し、更新処理を終了する。
When the structured
The structured
また、その際に、構造化文書サーバ20において、当該画像へ参照する構造化文書が複数存在する場合、つまりマルチ参照である場合で、かつ、前述したように画像URIが更新されない場合には、構造化文書内の画像参照情報を書き換えるなどの処理を行なう必要はない。
At that time, in the structured
図19は、本発明の実施形態における情報処理システムによる画像付き構造化文書の上書き処理後の参照関係の一例を示す図である。
図19は、マルチ参照において画像の上書き更新処理を行った後の画像参照関係を示すものである。図19に示した例では、構造化文書である「文書1」を参照する画像である「画像1」が「画像1’」に上書き更新した場合で、この画像を参照する構造化文書が「文書1」および「文書2」である場合、「文書1」内の「画像1’」の画像URIおよび「文書2」内の「画像1’」の画像URIは、ともに「URI1」のままで変更されていない。
FIG. 19 is a diagram showing an example of the reference relationship after the overwriting process of the structured document with image by the information processing system according to the embodiment of the present invention.
FIG. 19 shows an image reference relationship after performing an image overwrite update process in multi-reference. In the example shown in FIG. 19, when “
次に、更新後の構造化文書の画像と更新前の同じ構造化文書の画像との近似度が低い場合の更新処理について説明する。
図20は、本発明の実施形態における情報処理システムによる構造化文書の更新の手順の第3の例を示す図である。
図21は、本発明の実施形態における情報処理システムによる画像付き構造化文書の更新処理の第3の例を示すフローチャートである。
まず、前述したステップS41〜S44の処理、およびステップS51〜S59の処理、つまり画像付き構造化文書の更新から画像近似度計算までの処理がなされた上で、構造化文書サーバ20は、近似度が所定値未満、つまり近似度が低いと画像近似度計算部25により判別した場合は(ステップS71)、更新後の画像が元の画像と全く異なるとみなして、この画像データは置換対象のデータであると判別し、構造化文書作成クライアント10からの構造化文書の中で示される画像URI「http://picture.example.com/picId」を取得する。
Next, update processing when the degree of approximation between the image of the structured document after update and the image of the same structured document before update is low will be described.
FIG. 20 is a diagram showing a third example of the procedure for updating the structured document by the information processing system according to the embodiment of the present invention.
FIG. 21 is a flowchart showing a third example of the updating process of the structured document with image by the information processing system according to the embodiment of the present invention.
First, after the processing in steps S41 to S44 and the processing in steps S51 to S59, that is, the processing from the update of the structured document with image to the calculation of the image approximation, the structured
構造化文書サーバ20は、置換対象である画像を当該画像の新規登録リクエスト「POST http://picture.example.com/server」を用いて画像サーバ通信部22により画像サーバ30に送信する(ステップS72)。
The structured
画像サーバ30のリクエスト処理部31が、構造化文書サーバ20からの新規登録リクエストを置換対象の画像とともに受信すると、この置換対象の画像の新たな画像IDを画像ID発行部32により新規に発行し、この画像IDを受信済みの画像と関連付けて画像DB50に新規保存する(ステップS73)。ここでは、新規の画像IDは「picId2」である。
When the
リクエスト処理部31は、この新規の画像ID「picId2」から新たな画像URI「http://picture.example.com/picId2」を計算して構造化文書サーバ20に返信する(ステップS74)。
The
構造化文書サーバ20は、画像サーバ30からの新たな画像URIを画像サーバ通信部22により受信すると(ステップS75)、ステップS54の処理で既に受信した構造化文書に含まれる画像URI「http://picture.example.com/picId」を、ステップS75の処理で新たに受信した画像URI「http://picture.example.com/picId2」に書き換える(ステップS76)。
When the structured
そして、構造化文書DBアクセス部27は、文書DB40に保存される構造化文書のうち、既に受信した構造化文書の構造化文書URI「http://document.example.com/docId」から計算される構造化文書ID「docId」に対応する構造化文書を、ステップS76の処理により画像URIが書き換えられた構造化文書に更新する(ステップS77)。
Then, the structured document
そして、構造化文書サーバ20は、前述のように更新された構造化文書のURI「http://document.example.com/docId」を、ステップS75の処理で画像サーバ30から受信済みである、新たな画像URI「http://picture.example.com/picId2」とともにクライアント通信部21により構造化文書作成クライアント10に返信する(ステップS78)。
The structured
構造化文書作成クライアント10は、構造化文書サーバ20からの文書URIおよび新たな画像URIを受信すると、これらを内部記憶装置に保存し、かつ、新たな画像URIをステップS52の処理でハッシュキャッシュ部14において更新されたハッシュ値に関連付けるとともに、文書URIや新たな画像URIを構造化文書編集UI部11を用いて画面表示させる。
編集者は、これらの構造化文書URIと新たな画像URIを確認して、後にこれらの構造化文書URIと画像URIを構造化文書編集UI部11により指定することで、文書と画像をそれぞれ参照することができる。
When the structured
The editor confirms the structured document URI and the new image URI, and later designates the structured document URI and the image URI by the structured document
また、その際に、構造化文書サーバ20において、当該置換後の画像を参照する構造化文書が複数存在する場合、つまり前述したマルチ参照である場合で、かつ、画像URIが前述したように新たに発行された場合は、それぞれの構造化文書の中に記述される画像参照の書き換えなどの処理を行なうか否かを判別する必要がある。
At that time, in the structured
図22は、本発明の実施形態における情報処理システムによる画像付き構造化文書の置換処理後の参照関係の一例を示す図である。
画像参照の書き換え処理については、構造化文書サーバ20は、同じ画像参照を有するそれぞれの構造化文書のプロパティを照合することにより、当該書き換え処理を行なうか否かの判断を決定する。
FIG. 22 is a diagram showing an example of the reference relationship after the replacement process of the structured document with image by the information processing system according to the embodiment of the present invention.
For the image reference rewriting process, the structured
図22に示した例では、更新対象の構造化文書が「文書1」、その他の構造化文書が「文書2」、これらの構造化文書が画像URI「URI1により」参照する更新前の画像が「画像1」で、更新後の画像が「画像2」であるとする。
In the example shown in FIG. 22, the document to be updated refers to “
例えば、構造化文書サーバ20は、図22に示すように、同じ画像URI「URI1」を含む複数の構造化文書「文書1」、「文書2」のうち画像を「画像1」から「画像2」に更新した構造化文書「文書1」とは異なる構造化文書「文書2」を選択する。
そして、構造化文書サーバ20は、この文書の作成日プロパティ、例えば図8に示したようなdateタグをチェックし、この作成日が更新対象の構造化文書「文書1」の作成日と近ければ、当該選択した構造化文書「文書2」の画像URI「URI1」を更新対象の構造化文書「文書1」において前述のように書き換えられた画像URI「URI2」に書き換え、つまり図22に示した形態2に移行する。
For example, as shown in FIG. 22, the structured
The structured
また、選択済みの構造化文書「文書2」の作成日が更新対象の構造化文書「文書1」の作成日と近くない場合には、当該選択した構造化文書「文書1」の画像URI「URI1」の書き換えを行なわずに、つまり図22に示した形態1に移行する。また、画像参照の書き換えの有無は他の拡張プロパティを用いて判別するようにしてもよい。
If the creation date of the selected structured document “
次に、構造化文書の削除について説明する。
図23は、本発明の実施形態における情報処理システムによる構造化文書の削除の手順の一例を示す図である。
図24は、本発明の実施形態における情報処理システムによる画像付き構造化文書の削除処理の第3の例を示すフローチャートである。
まず、構造化文書作成クライアント10は、編集者による構造化文書編集UI部11への操作により削除対象の構造化文書の構造化文書URI、ここでは「http://document.example.com/docId」が指定されると(ステップS81)、この構造化文書URIをもとにした削除リクエスト「DELETE http://document.example.com/docId」をサーバ通信部12により構造化文書サーバ20に送信する(ステップS82)。
Next, deletion of a structured document will be described.
FIG. 23 is a diagram illustrating an example of a procedure for deleting a structured document by the information processing system according to the embodiment of this invention.
FIG. 24 is a flowchart showing a third example of the deletion process of the structured document with image by the information processing system according to the embodiment of the present invention.
First, the structured
構造化文書サーバ20は、構造化文書作成クライアント10からの削除リクエスト「http://document.example.com/docId」をクライアント通信部21により受信すると(ステップS83)、この削除リクエストが示す構造化文書URIから、削除対象の構造化文書の構造化文書ID「docId」を計算する。
When the structured
そして、文書DBアクセス部27は、文書DB40に保存される構造化文書のうち、計算済みの構造化文書ID「docId」に対応する構造化文書を取得して、この構造化文書の中に記述される画像URI「http://picture.example.com/picId」を認識し(ステップS84)、この認識した画像URIをもとにした画像削除のリクエスト「DELETE http://picture.example.com/picId」を画像サーバ通信部22を介して画像サーバ30へ送信する(ステップS85)。
Then, the document
画像サーバ30は、構造化文書サーバ20からの画像削除のリクエストをリクエスト処理部31により受信すると(ステップS86)、このリクエストで示される画像URIから、削除対象の画像の画像ID「picId」を計算する。
When the image processing request is received by the
そして、画像DBアクセス部33は、画像DB50に保存される画像のうち、計算済みの画像ID「picId」に対応する画像を削除する(ステップS87)。
そして、リクエスト処理部31は、画像削除の完了通知を構造化文書サーバ20に送信する(ステップS88)。
Then, the image
Then, the
構造化文書サーバ20の画像サーバ通信部22が画像サーバ30からの削除完了通知を受信すると、文書DBアクセス部27は、文書DB40に保存される構造化文書のうち、前述したように計算済みである構造化文書ID「docId」に対応する構造化文書を削除する(ステップS89)。そして、クライアント通信部21は、構造化文書および画像の削除完了通知を構造化文書作成クライアント10に返信する(ステップS90)。
なお、これまでの例では、一つの画像を含む構造化文書を例として説明したが、この構造化文書は複数の画像を含むものであってもよい。
When the image
In the above examples, the structured document including one image has been described as an example. However, the structured document may include a plurality of images.
以上のように、本発明の実施形態における情報処理システムでは、画像を例とした非構造化データの参照情報を参照する構造化文書が更新された場合に、当該構造化文書の非構造化データが更新されているか否かを判別し、更新されていない場合には、非構造化データの参照情報を有する構造化文書を構造化文書サーバに送信する一方で、当該非構造化データは送信しないようにするので、ネットワークトラフィックを大幅に軽減する効果を得ることができる。 As described above, in the information processing system according to the embodiment of the present invention, when a structured document that refers to reference information of unstructured data using an image as an example is updated, the unstructured data of the structured document is updated. If it is not updated, the structured document having the reference information of the unstructured data is transmitted to the structured document server, but the unstructured data is not transmitted. As a result, the effect of greatly reducing network traffic can be obtained.
また、非構造化データ更新がなされた場合、更新前の非構造化データと更新後の非構造化データとの近似度の高低により、更新された画像の上書きまたは置換といった更新処理を行なうので、画像の適切な更新処理を行なうことができる。 When unstructured data is updated, update processing such as overwriting or replacement of the updated image is performed depending on the degree of approximation between the unstructured data before the update and the unstructured data after the update. Appropriate image update processing can be performed.
また、複数の構造化文書が同じ非構造化データを参照している場合において、前述した複数の構造化文書のうち何れかの構造化文書の非構造化データが更新されたら、各構造化文書のプロパティなどの情報を元に、同じ非構造化データを参照する他の構造化文書における非構造化データへの参照情報を更新するので、各構造化文書の参照情報を適切なものとすることができる。 In addition, when a plurality of structured documents refer to the same unstructured data, when the unstructured data of any one of the plurality of structured documents is updated, each structured document is updated. Because the reference information to unstructured data in other structured documents that refer to the same unstructured data is updated based on information such as the properties of the structure, the reference information of each structured document should be appropriate Can do.
次に、本実施形態における情報処理システムの変形例を説明する。
前述した実施形態では、構造化文書の更新がなされた場合で、この構造化文書を参照する画像が上書き更新用画像であるか置換用画像であるかの判別を、構造化文書の更新にともなって自動的に行なっていたが、この変形例では、更新した構造化文書を参照する画像が上書き更新用画像であるか置換用画像であるかの判別を、当該構造化文書に関する、編集者による指定内容にしたがって判別することにより、編集者の意向にしたがった画像更新を行なう機能を有する。
Next, a modification of the information processing system in the present embodiment will be described.
In the above-described embodiment, when the structured document is updated, the determination of whether the image referring to the structured document is an overwrite update image or a replacement image is accompanied by the update of the structured document. However, in this modification, it is determined by the editor regarding the structured document whether the image referring to the updated structured document is an overwrite update image or a replacement image. By discriminating according to the designated contents, it has a function of updating the image according to the editor's intention.
図25は、本発明の実施形態における情報処理システムの構成の変形例を示すブロック図である。
図25に示すように、この変形例では、図4に示した形態と比較して、構造化文書作成クライアント10は、変更種別判別部16をさらに備える。
この変更種別判別部16は、構造化文書の更新がなされた場合で、この構造化文書を参照する画像が上書き更新用画像であるか置換用画像であるかを判別する。
FIG. 25 is a block diagram showing a modification of the configuration of the information processing system in the embodiment of the present invention.
As shown in FIG. 25, in this modification, the structured
The change
図26は、本発明の実施形態の変形例における情報処理システムによる構造化文書の変更の手順の一例を示す図である。
図27は本発明の実施形態の変形例における情報処理システムによる画像付き構造化文書の変更処理の一例を示すフローチャートである。
この処理では、前述したステップS41の処理、つまり構造化文書が更新された場合において、当該構造化文書の画像の変更種別が上書き更新用であるか置換であるかを定めるための編集者による入力操作を構造化文書編集UI部11により受け付け、この受け付けた内容を構造化文書作成クライアント10の内部記憶装置に記憶するものとする。
FIG. 26 is a diagram showing an example of a procedure for changing a structured document by the information processing system in the modification of the embodiment of the present invention.
FIG. 27 is a flowchart showing an example of a process for changing the structured document with image by the information processing system according to the modification of the embodiment of the present invention.
In this process, when the structured document is updated in step S41 described above, that is, an input by the editor for determining whether the change type of the image of the structured document is for overwriting update or replacement. Assume that the structured document
そして、ステップS42〜S44の処理、およびステップS51,S52の処理、つまり画像付き構造化文書の画像ハッシュの計算からハッシュ比較の処理、および当該比較対象のハッシュが一致しないと判別して、ハッシュキャッシュ部14に保存される画像ハッシュが更新された場合において、構造化文書作成クライアント10の変更種別判別部16は、前述したように内部記憶装置に記憶される、構造化文書編集UI部11により受け付けた操作内容で示される変更種別が上書き更新であるか置換であるかを判別する(ステップS101)。
Then, it is determined that the processing of steps S42 to S44 and the processing of steps S51 and S52, that is, the hash comparison processing from the calculation of the image hash of the structured document with image, and the comparison target hash do not match, and the hash cache When the image hash stored in the
変更種別が上書き更新であった場合には(ステップS102のYES)、前述したステップS72からS78までの処理、つまり置換用画像の画像サーバ30への送信から、当該画像サーバ30による文書URIや画像URIの構造化文書作成クライアント10への返信までの処理がなされる。
If the change type is overwrite update (YES in step S102), the processing from step S72 to S78 described above, that is, the transmission of the replacement image to the
一方、変更種別が上書き更新であった場合には(ステップS102のNO)、前述したステップS61からS63までの処理、つまり置換用画像の画像サーバ30への送信から構造化文書サーバ20における構造化文書の保存までの処理がなされる。
On the other hand, when the change type is overwrite update (NO in step S102), the processing in steps S61 to S63, that is, the transmission of the replacement image to the
また、前述したように更新した構造化文書の画像を参照する構造化文書が他にも存在する場合、つまり前述したマルチ参照である場合における、当該他の構造化文書の画像の種別については、更新した構造化文書の画像について指定された変更種別をそのまま採用してもよいし、構造化文書を更新する際に、当該構造化文書の画像を参照する他の文書の一覧を表示させて、それぞれの構造化文書について、当該構造化文書の画像の更新形態が上書き更新か置換であるかを定めるための指定の入力操作を構造化文書編集UI部11により受け付けた上で、この受け付けた内容にしたがって、それぞれの構造化文書の画像を上書き更新または置換するようにしてもよい。
また、本実施形態では非構造化データは画像であるとして説明したが、これに限らず、例えば音声や映像であってもよい。
In addition, when there is another structured document that refers to the image of the structured document updated as described above, that is, in the case of the multi-reference described above, the type of the image of the other structured document is as follows. The change type specified for the image of the updated structured document may be adopted as it is, or when updating the structured document, a list of other documents that refer to the image of the structured document is displayed, For each structured document, the structured document
In the present embodiment, the unstructured data is described as an image. However, the present invention is not limited to this, and may be audio or video, for example.
なお、この発明は前記実施形態そのままに限定されるものではなく実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記実施形態に開示されている複数の構成要素の適宜な組み合わせにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を省略してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。 The present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. Various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be omitted from all the components shown in the embodiment. Furthermore, you may combine suitably the component covering different embodiment.
1,10…構造化文書作成クライアント、1a,11…構造化文書編集UI部、1b,12…サーバ通信部、1c…非構造化データハッシュ計算部、1d…ハッシュキャッシュ部、1e,15…ハッシュ一致判別部、16…変更種別判別部、2,20…構造化文書サーバ、2a,21…クライアント通信部、2b…非構造化データサーバ通信部、2c…構造化文書ID発行部、2d…非構造化データURI変換部、2e…非構造化データ近似度計算部、2f…非構造化データマルチ参照処理部、2g…構造化文書DBアクセス部、3…非構造化データサーバ、3a,31…リクエスト処理部、3b…非構造化データID発行部、3c…非構造化データDBアクセス部、4…構造化文書DB、5…非構造化データDB、13…画像ハッシュ計算部、14…画像ハッシュキャッシュ部、22…画像サーバ通信部、23…画像ID発行部、24…画像URI変換部、25…画像近似度計算部、26…画像マルチ参照処理部、27…文書DBアクセス部、30…画像サーバ、32…画像ID発行部、33…画像DBアクセス部、40…文書DB、50…画像DB。
DESCRIPTION OF
Claims (4)
前記クライアント装置は、
構造化データおよび当該構造化データに関わる非構造化データの作成のための入力操作を受け付ける入力手段と、
前記入力手段により作成された構造化データに関わる非構造化データのハッシュ値を計算する第1の計算手段と、
前記入力手段により作成された構造化データおよび当該構造化データに関わる非構造化データを前記構造化データサーバ装置に送信する第1の送信手段と、
前記作成された構造化データが前記入力手段への入力操作により更新された場合に、当該更新された構造化データに関わる非構造化データのハッシュ値を計算する第2の計算手段と、
前記第2の計算手段により計算したハッシュ値と前記第1の計算手段により計算した、更新前の構造化データに関わる非構造化データのハッシュ値とが一致するか否かを判別する判別手段と、
前記ハッシュ値が一致すると前記判別手段により判別した場合に、前記更新された構造化データを前記構造化データサーバ装置に送信し、前記更新された構造化データに関わる非構造化データは送信しない第2の送信手段とを有し、
前記構造化データサーバ装置は、
前記構造化データを記憶するための構造化データ記憶装置と、
前記クライアント装置からの前記作成時で更新前の構造化データに関わる非構造化データを前記非構造化データサーバ装置に送信する送信手段と、
前記クライアント装置からの前記作成時で更新前の構造化データに、前記非構造化データサーバ装置からの参照情報を含ませて前記構造化データ記憶装置に記憶する第1の記憶制御手段と、
前記構造化データ記憶装置に記憶される前記更新前の構造化データを、前記クライアント装置からの前記更新された構造化データに書き換える第2の記憶制御手段とを有し、
前記非構造化データサーバ装置は、
前記非構造化データを記憶するための非構造化データ記憶装置と、
前記構造化データサーバ装置からの前記作成時で更新前の構造化データに関わる非構造化データを前記非構造化データ記憶装置に記憶する記憶制御手段と、
前記作成時で更新前における、前記構造化データサーバ装置からの非構造化データを前記更新前の構造化データから参照するための参照情報を前記構造化データサーバ装置に送信する送信手段とを備えた
ことを特徴とする情報処理システム。 An information processing system having a client device, a structured data server device, and an unstructured data server device,
The client device is
An input means for accepting an input operation for creating structured data and unstructured data related to the structured data;
First calculation means for calculating a hash value of unstructured data related to structured data created by the input means;
First transmission means for transmitting structured data created by the input means and unstructured data related to the structured data to the structured data server device;
Second calculation means for calculating a hash value of unstructured data related to the updated structured data when the created structured data is updated by an input operation to the input means;
Discrimination means for discriminating whether or not the hash value calculated by the second calculation means matches the hash value of the unstructured data related to the structured data before update calculated by the first calculation means; ,
When the determination means determines that the hash values match, the updated structured data is transmitted to the structured data server device, and unstructured data related to the updated structured data is not transmitted. 2 transmission means,
The structured data server device comprises:
A structured data storage device for storing the structured data;
Transmitting means for transmitting unstructured data related to structured data before update at the time of creation from the client device to the unstructured data server device;
First storage control means for including in the structured data storage device the reference data from the unstructured data server device in the structured data before update at the time of creation from the client device;
Second storage control means for rewriting the pre-update structured data stored in the structured data storage device with the updated structured data from the client device;
The unstructured data server device
An unstructured data storage device for storing the unstructured data;
Storage control means for storing unstructured data related to structured data before update at the time of creation from the structured data server device in the unstructured data storage device;
Transmission means for transmitting, to the structured data server device, reference information for referring to unstructured data from the structured data server device before the update at the time of creation from the structured data before the update. An information processing system characterized by that.
前記ハッシュ値が一致しないと前記判別手段により判別した場合に、前記更新された構造化データを当該構造化データに関わる非構造化データとともに前記構造化データサーバ装置に送信する第3の送信手段をさらに備え、
前記構造化データサーバ装置は、
前記クライアント装置の第3の送信手段からの前記更新された構造化データを受信した場合に、当該構造化データに含まれる前記参照情報をもとに前記非構造化データサーバ装置に対して前記更新前の非構造化データの送信リクエストを行なうリクエスト手段と、
前記リクエスト手段によるリクエストに伴う、前記非構造化データサーバ装置の第2の送信手段からの前記更新前の非構造化データと前記クライアント装置の第3の送信手段からの前記更新された構造化データに関わる非構造化データとの近似度を計算する近似度計算手段と、
前記近似度計算手段により計算した近似度が所定値以上である場合に、前記クライアント装置からの、前記更新された構造化データに関わる非構造化データを前記非構造化データサーバに送信する第2の送信手段と、
前記近似度計算手段により計算した近似度が所定値未満である場合に、前記クライアント装置からの、前記更新された構造化データに関わる非構造化データを前記非構造化データサーバに送信する第3の送信手段と、
前記非構造化データサーバ装置の第3の送信手段からの前記非構造化データの新たな参照情報を前記クライアント装置に送信する第4の送信手段と、
前記クライアント装置からの前記更新された構造化データに含まれる前記参照情報を前記非構造化データサーバ装置の第3の送信手段からの新たな参照情報に書き換える参照情報書き換え手段とをさらに備え、
前記非構造化データサーバ装置は、
前記構造化データサーバ装置からのリクエストに従って前記更新前の非構造化データを前記構造化データサーバ装置に送信する第2の送信手段をさらに備え、
前記構造化データサーバ装置の前記第2の送信手段からの前記非構造化データを前記更新前の非構造化データに替えて前記非構造化データ記憶装置に記憶する第2の記憶制御手段と、
前記構造化データサーバ装置の前記第3の送信手段からの非構造化データを前記更新前の非構造化データとは別に前記非構造化データ記憶装置に記憶する第3の制御記憶手段と、
前記構造化データサーバ装置の前記第3の送信手段からの非構造化データの新たな参照情報を前記構造化データサーバ装置に送信する第3の送信手段とをさらに備えた
ことを特徴とする請求項1に記載の情報処理システム。 The client device is
A third transmitting unit configured to transmit the updated structured data to the structured data server device together with unstructured data related to the structured data when the determining unit determines that the hash values do not match; In addition,
The structured data server device comprises:
When the updated structured data is received from the third transmission unit of the client device, the update is performed on the unstructured data server device based on the reference information included in the structured data. A request means for making a request to send the previous unstructured data;
The unstructured data before the update from the second transmission unit of the unstructured data server device and the updated structured data from the third transmission unit of the client device, accompanying the request by the request unit. A degree of approximation calculating means for calculating a degree of approximation with unstructured data related to
A second unit for transmitting unstructured data related to the updated structured data from the client device to the unstructured data server when the degree of approximation calculated by the degree-of-approximation calculating unit is a predetermined value or more; Means for sending
A third unit for transmitting unstructured data related to the updated structured data from the client device to the unstructured data server when the degree of approximation calculated by the degree-of-approximation calculating unit is less than a predetermined value; Means for sending
Fourth transmission means for transmitting new reference information of the unstructured data from the third transmission means of the unstructured data server device to the client device;
Reference information rewriting means for rewriting the reference information included in the updated structured data from the client device with new reference information from a third sending means of the unstructured data server device,
The unstructured data server device
A second transmission means for transmitting the unstructured data before the update to the structured data server device in accordance with a request from the structured data server device;
Second storage control means for storing the unstructured data from the second transmission means of the structured data server device in the unstructured data storage device in place of the unstructured data before the update;
Third control storage means for storing unstructured data from the third transmission means of the structured data server device in the unstructured data storage device separately from the unstructured data before the update;
And further comprising: third transmission means for transmitting new reference information of unstructured data from the third transmission means of the structured data server device to the structured data server device. Item 4. The information processing system according to Item 1.
前記更新された構造化データに関わる非構造化データを参照する他の構造化文書に含まれる前記参照情報を前記非構造化データサーバ装置からの新たな参照情報に書き換えることを特徴とする請求項2に記載の情報処理システム。 The reference information rewriting means of the structured data server device is:
The referential information included in another structured document that refers to unstructured data related to the updated structured data is rewritten with new reference information from the unstructured data server device. 2. The information processing system according to 2.
前記入力手段により作成された構造化データに関わる非構造化データのハッシュ値を計算する第1の計算手段と、
前記入力手段により作成された構造化データを構造化データサーバ装置に記憶するための構造化データとして送信し、当該構造化データに関わる非構造化データを非構造化データサーバ装置に記憶するための非構造化データとして送信する第1の送信手段と、
前記作成されて前記構造化データサーバに記憶された構造化データが前記入力手段への入力操作により更新された場合に、当該構造化データに関わる非構造化データのハッシュ値を計算する第2の計算手段と、
前記第2の計算手段により計算したハッシュ値と前記第1の計算手段により計算した、前記更新前の構造化データに関わる非構造化データのハッシュ値とが一致するか否かを判別する判別手段と、
前記ハッシュ値が一致すると前記判別手段により判別した場合に、前記更新された構造化データを前記構造化データサーバ装置に記憶される更新前の構造化データに替えて記憶するための構造化データとして送信し、前記更新された構造化データに関わる非構造化データは送信しない第2の送信手段とを備えたことを特徴とする情報処理装置。 An input means for accepting an input operation for creating structured data and unstructured data related to the structured data;
First calculation means for calculating a hash value of unstructured data related to structured data created by the input means;
Transmitting structured data created by the input means as structured data to be stored in the structured data server device, and storing unstructured data related to the structured data in the unstructured data server device First transmitting means for transmitting as unstructured data;
A second value for calculating a hash value of unstructured data related to the structured data when the structured data created and stored in the structured data server is updated by an input operation to the input means; A calculation means;
Discriminating means for discriminating whether or not the hash value calculated by the second calculating means matches the hash value of the unstructured data related to the structured data before update calculated by the first calculating means. When,
As structured data for storing the updated structured data in place of the structured data before update stored in the structured data server device when the determining means determines that the hash values match. An information processing apparatus comprising: a second transmission unit that transmits and does not transmit unstructured data related to the updated structured data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009122315A JP2010271862A (en) | 2009-05-20 | 2009-05-20 | System and appaastus for processing information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009122315A JP2010271862A (en) | 2009-05-20 | 2009-05-20 | System and appaastus for processing information |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010271862A true JP2010271862A (en) | 2010-12-02 |
Family
ID=43419847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009122315A Withdrawn JP2010271862A (en) | 2009-05-20 | 2009-05-20 | System and appaastus for processing information |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010271862A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015527008A (en) * | 2012-08-31 | 2015-09-10 | インテル・コーポレーション | Mechanisms that promote storage data encryption-free integrity protection in computing systems |
WO2018117218A1 (en) * | 2016-12-22 | 2018-06-28 | 日本電信電話株式会社 | Data processing system and data processing method |
-
2009
- 2009-05-20 JP JP2009122315A patent/JP2010271862A/en not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015527008A (en) * | 2012-08-31 | 2015-09-10 | インテル・コーポレーション | Mechanisms that promote storage data encryption-free integrity protection in computing systems |
WO2018117218A1 (en) * | 2016-12-22 | 2018-06-28 | 日本電信電話株式会社 | Data processing system and data processing method |
JPWO2018117218A1 (en) * | 2016-12-22 | 2019-03-28 | 日本電信電話株式会社 | Data processing system and data processing method |
US11514083B2 (en) | 2016-12-22 | 2022-11-29 | Nippon Telegraph And Telephone Corporation | Data processing system and data processing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11402969B2 (en) | Multi-source journal content integration systems and methods and systems and methods for collaborative online content editing | |
US8082319B2 (en) | Publishing and subscribing to digital image feeds | |
KR102121626B1 (en) | Associating a file type with an application in a network storage service | |
KR101523816B1 (en) | Sending files from one device to another device over a network | |
CN114207607B (en) | Supporting unstructured, semi-structured, and structured documents | |
US8463944B2 (en) | Optimal compression process selection methods | |
CN102771080B (en) | Use the system and method that the efficient media of buffer memory transmits | |
RU2596986C2 (en) | Rent catalogue | |
US20090002361A1 (en) | Generating Low Resolution User Interfaces for Transmission to Mobile Devices | |
US20090019364A1 (en) | Method and apparatus for generating electronic content guide | |
US8370385B2 (en) | Media collections service | |
US20070143277A1 (en) | Content based partial download | |
KR101623742B1 (en) | Method and system for sharing file related messages | |
WO2014089230A2 (en) | Method and system of storing data files and retrieving data in a data file and requesting information from a computer | |
KR101553834B1 (en) | Method and apparatus for processing multimedia contents and meta data | |
US10002135B2 (en) | Simplifying the check-in of checked-out files in an ECM system | |
JP2009110061A (en) | Version management system and version management method | |
US7899781B1 (en) | Method and system for synchronizing a local instance of legal matter with a web instance of the legal matter | |
JP2010271862A (en) | System and appaastus for processing information | |
JP2005044097A (en) | Content search device and method | |
US20170147543A1 (en) | Enabling legacy web applications for mobile devices | |
US9342663B2 (en) | Distributing media with variable resolution and format | |
KR100771198B1 (en) | Method for transmitting picture data to electronic frame and apparatus thereof | |
KR20110136058A (en) | Method and apparatus for determinig object change in home network | |
JP2006252409A (en) | Document managing device, document managing method, and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20120807 |