JP2003223390A - データ抽出・構造変換処理プログラム、コンテンツ生成処理プログラム、データ抽出・構造変換処理プログラム記録媒体、コンテンツ生成処理プログラム記録媒体、およびコンテンツ再構築処理システム - Google Patents

データ抽出・構造変換処理プログラム、コンテンツ生成処理プログラム、データ抽出・構造変換処理プログラム記録媒体、コンテンツ生成処理プログラム記録媒体、およびコンテンツ再構築処理システム

Info

Publication number
JP2003223390A
JP2003223390A JP2002019425A JP2002019425A JP2003223390A JP 2003223390 A JP2003223390 A JP 2003223390A JP 2002019425 A JP2002019425 A JP 2002019425A JP 2002019425 A JP2002019425 A JP 2002019425A JP 2003223390 A JP2003223390 A JP 2003223390A
Authority
JP
Japan
Prior art keywords
data
content data
content
information
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002019425A
Other languages
English (en)
Other versions
JP4084049B2 (ja
Inventor
Minoru Morita
実 守田
Shingo Okamoto
晋吾 岡本
Tomoyoshi Inada
知義 稲田
Takuo Nakamura
拓郎 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Social Science Labs Ltd
Original Assignee
Fujitsu Social Science Labs Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Social Science Labs Ltd filed Critical Fujitsu Social Science Labs Ltd
Priority to JP2002019425A priority Critical patent/JP4084049B2/ja
Publication of JP2003223390A publication Critical patent/JP2003223390A/ja
Application granted granted Critical
Publication of JP4084049B2 publication Critical patent/JP4084049B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 既存のコンテンツから自動的に表示環境が異
なる端末用コンテンツを再構築する方法を提供する。 【解決手段】 データ抽出・構造変換処理部2は、We
bコンテンツ4を得て、リソースとスタイルとに分離
し、リソースをタグをもとにグループ化してモジュール
を生成し、リンク情報をもとにページのツリー構造を再
構築してモジュールを並べ替えてXMLデータを生成し
てコンテンツDB5へ記憶する。コンテンツ生成処理部
3は、携帯端末13から閲覧要求があると、データセン
タ14から得た要求元の携帯端末13のスペック情報を
もとに選択した表示形式テンプレートにしたがってコン
テンツDB5のXMLデータを再構成して応答する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、Webコンテンツ
を様々な表示処理環境に対応可能な形式のデータに再構
成して記憶し、記憶しておいたデータを要求元の表示処
理環境に対応した表示形式に従って再生成するWebコ
ンテンツ再構築処理方法に関する。特に、Webコンテ
ンツに対して自動ないし半自動で意味付けを行い、その
意味をもとにページのリンク情報を再構築したデータを
記憶しておき、表示処理環境に制約があるような端末に
適合する表示が可能なようにデータを再構成するWeb
コンテンツ再構築処理方法に関する。
【0002】
【従来の技術】Webコンテンツの閲覧処理手段ごと
に、適合するデータの形式が異なる場合がある。例え
ば、通常のコンピュータ端末などでの閲覧を想定したコ
ンテンツと、携帯電話端末やPDA(Personal Digital
Assistance )などの携帯型データ処理端末(以下、携
帯端末という。)での閲覧に適合したコンテンツとは、
データの記述形式、データ容量および画面サイズなどに
相違がある。したがって、例えばHTML(HyperText
Markup Language )で記述されたページの集合(HTM
Lドキュメント)からなるWebコンテンツを携帯端末
で閲覧させるためには、Webコンテンツを携帯端末用
に再構築する必要がある。
【0003】しかし、既存のHTMLドキュメントの記
述は多様な形式が許容されており、また、携帯端末側の
表示処理条件(画面サイズや表示可能なページ容量な
ど)も様々である。そのために、通常のWebコンテン
ツから携帯端末用のコンテンツへの再構築処理を自動化
することが困難であった。
【0004】従来は、端末の表示画面サイズや表示可能
なページ容量などを考慮して、Webコンテンツの内容
を検討して部分的に内容を変更したり、また、ページレ
イアウトやページ構成などを変更したりして、人手によ
り再構築していた。
【0005】または、予め特殊な言語を用いてWebコ
ンテンツを記述しておき、所定の変換処理ツールを用い
て携帯端末用のコンテンツを再構築するようにしてい
た。
【0006】
【発明が解決しようとする課題】携帯端末の種類の増加
に伴い既存のWebコンテンツを再利用してコンテンツ
を豊富化することが望まれているが、従来では、内容や
ページ構成などを考慮して、Webコンテンツから他の
表示処理環境に適合したコンテンツを自動的に再構築処
理することはできなかった。Webコンテンツから他の
表示処理環境で表示可能なコンテンツへの再構築処理は
人手で行うために、人的および時間的負担が大きかっ
た。
【0007】本発明の目的は、Webコンテンツの内容
やページ構成を考慮しつつ、元のWebコンテンツから
他の形式のコンテンツを自動または半自動的に再構築す
る処理方法を提供することである。
【0008】また本発明の目的は、上記の処理方法をコ
ンピュータで実現するためのプログラムもしくは処理装
置を提供することである。
【0009】
【課題を解決するための手段】上記の目的を達成するた
め、本発明は、タグ付きマークアップ言語で記述された
コンテンツデータから再利用可能な形式の中間コンテン
ツデータを再構成するデータ抽出・構造変換処理をコン
ピュータに実行させるためのプログラムであって、前記
コンテンツデータから、データ構成を定義する情報であ
るタグをもとに人間にとって有意な情報を構成する部分
であるリソース情報を抽出し、前記リソース情報を前記
タグをもとにグループ化してモジュールを生成し、前記
モジュールに意味を付与するモジュール生成処理と、前
記タグをもとに前記モジュール間の関係を付与し、前記
コンテンツデータに定義されているリンク情報から前記
コンテンツデータのページ間のツリー構造を再構築する
関係設定処理と、前記モジュール間の関係および前記ツ
リー構造にしたがって、前記モジュールを並べ替えて再
利用可能な形式の前記中間コンテンツデータを生成する
再構成処理と、前記中間コンテンツデータを記憶するコ
ンテンツデータ記憶処理とを、コンピュータに実行させ
るものである。
【0010】また、本発明は、タグ付きマークアップ言
語で記述された再利用可能な形式の中間コンテンツデー
タから、閲覧要求があった端末での表示に対応するコン
テンツデータを生成するコンテンツ生成処理をコンピュ
ータに実行させるためのプログラムであって、端末の表
示処理環境に対応する表示形式情報であるテンプレート
を保持するテンプレート記憶手段へアクセスする処理
と、前記端末からの閲覧要求および前記端末の種別情報
を受け付け、前記識別情報をもとに前記テンプレート記
憶手段から該当するテンプレートを抽出し、前記テンプ
レートに従って前記中間コンテンツデータを再構成して
前記コンテンツデータを生成する動的生成処理とを、コ
ンピュータに実行させるものである。
【0011】また、本発明は、タグ付きマークアップ言
語で記述されたコンテンツデータから再利用可能な形式
の中間コンテンツデータを再構成するデータ抽出・構造
変換処理をコンピュータに実行させるためのプログラム
を記録した記録媒体であって、前記コンテンツデータか
ら、データ構成を定義する情報であるタグをもとに人間
にとって有意な情報を構成する部分であるリソース情報
を抽出し、前記リソース情報を前記タグをもとにグルー
プ化してモジュールを生成し、前記モジュールに意味を
付与するモジュール生成処理と、前記タグをもとに前記
モジュール間の関係を付与し、前記コンテンツデータに
定義されているリンク情報から前記コンテンツデータの
ページ間のツリー構造を再構築する関係設定処理と、前
記モジュール間の関係および前記ツリー構造にしたがっ
て、前記モジュールを並べ替えて再利用可能な形式の前
記中間コンテンツデータを生成する再構成処理と、前記
中間コンテンツデータを記憶するコンテンツデータ記憶
処理とを、コンピュータに実行させるためのプログラム
を記録したものである。
【0012】また、本発明は、タグ付きマークアップ言
語で記述された再利用可能な形式の中間コンテンツデー
タから、閲覧要求があった端末での表示に対応するコン
テンツデータを生成するコンテンツ生成処理をコンピュ
ータに実行させるためのプログラムを記録した記録媒体
であって、端末の表示処理環境に対応する表示形式情報
であるテンプレートを保持するテンプレート記憶手段へ
アクセスする処理と、前記端末からの閲覧要求および前
記端末の種別情報を受け付け、前記識別情報をもとに前
記テンプレート記憶手段から該当するテンプレートを抽
出し、前記テンプレートに従って前記中間コンテンツデ
ータを再構成して前記コンテンツデータを生成する動的
生成処理とを、コンピュータに実行させるためのプログ
ラムを記録したものである。
【0013】また、本発明は、第1のタグ付きマークア
ップ言語で記述された第1のコンテンツデータから再利
用可能な形式の中間コンテンツデータを再構成して記憶
するデータ抽出・構造変換処理部と、前記中間コンテン
ツデータから閲覧要求があった端末での表示に対応する
第2のタグ付きマークアップ言語で記述した第2のコン
テンツデータを生成するコンテンツ生成処理部とからな
るコンテンツ再構築処理システムであって、前記データ
抽出・構造変換処理部は、前記第1のコンテンツデータ
から、データ構成を定義する情報であるタグをもとに人
間にとって有意な情報を構成する部分であるリソース情
報を抽出し、前記リソース情報を前記タグをもとにグル
ープ化してモジュールを生成し、前記モジュールに意味
を付与するモジュール生成処理手段と、前記タグをもと
に前記モジュール間の関係を付与し、前記第1のコンテ
ンツデータに定義されているリンク情報から前記第1の
コンテンツデータのページ間のツリー構造を再構築する
関係設定手段と、前記モジュール間の関係および前記ツ
リー構造にしたがって、前記モジュールを並べ替えて再
利用可能な形式の前記中間コンテンツデータを生成する
再構成処理手段と、前記中間コンテンツデータを記憶す
るコンテンツデータ記憶部とを備え、前記コンテンツ生
成部は、端末の表示処理環境に対応した表示形式情報で
あるテンプレートを保持するテンプレート記憶手段と、
前記端末からの閲覧要求および前記端末の種別情報を受
け付け、前記識別情報をもとに前記テンプレート記憶手
段から該当するテンプレートを抽出し、前記テンプレー
トに従って前記中間コンテンツデータを再構成して前記
コンテンツデータを生成する動的生成処理手段を備え
る。
【0014】本発明のコンテンツ再構築処理システム
は、第1のタグ付きマークアップ言語で記述された第1
のコンテンツデータから再利用可能な形式の中間コンテ
ンツデータを再構成して記憶するデータ抽出・構造変換
処理部と、前記中間コンテンツデータから閲覧要求があ
った端末での表示に対応する第2のタグ付きマークアッ
プ言語で記述した第2のコンテンツデータを生成するコ
ンテンツ生成処理部とからなるシステムであって、前記
データ抽出・構造変換処理部では、前記第1のコンテン
ツデータから、データ構成の定義情報をもとに人間にと
って有意なリソース情報を抽出して前記タグをもとにグ
ループ化してモジュールを生成し、さらに、前記第1の
コンテンツデータのリンク情報から前記第1のコンテン
ツデータのページ間のツリー構造を再構築して前記モジ
ュールを並べ替えて再利用可能な形式の前記中間コンテ
ンツデータを生成して記憶しておき、前記コンテンツ生
成部では、前記端末からの閲覧要求および前記端末の種
別情報を受け付けると、前記識別情報をもとに端末の表
示処理環境に対応した表示形式情報であるテンプレート
から該当するテンプレートを抽出し、前記テンプレート
に従って前記中間コンテンツデータを再構成して前記コ
ンテンツデータを生成することを特徴とする。
【0015】本発明の各手段または機能または要素をコ
ンピュータに実行させるためのプログラムは、コンピュ
ータが読み取り可能な、可搬媒体メモリ、半導体メモ
リ、ハードディスクなどの適当な記録媒体に格納するこ
とができ、これらの記録媒体に記録して提供され、また
は、通信インタフェースを介して種々の通信網を利用し
た送受信により提供される。
【0016】
【発明の実施の形態】以下に、本発明の実施の形態とし
て、Webコンテンツから、携帯電話端末などの表示画
面サイズが小型の携帯端末で表示されるコンテンツを再
構築する場合の処理を説明する。
【0017】図1に、本発明にかかるシステムの構成例
を示す。本発明を実現するコンテンツ再構築処理システ
ム1は、データ抽出・構造変換処理部2と、コンテンツ
生成処理部3と、コンテンツデータベース(コンテンツ
DB)5とを備える。
【0018】データ抽出・構造変換処理部2は、Web
コンテンツ4として一つのサイトを構成するHTMLド
キュメント(HTMLページの集合)を取得し、人間に
とって意味があるデータ部分を部品化し、部品化したデ
ータに意味付けし、その意味や元のページ構成を考慮し
て、他の表示処理環境で再利用可能な形式へ再構築して
コンテンツDB5に格納する手段である。ここでは、再
利用可能なデータとして例えばXML(eXtensible Mar
kup Language)データを生成する。
【0019】コンテンツ生成処理部3は、携帯端末など
の端末からのアクセス要求を受け付けて、コンテンツD
B5から該当するXMLデータを抽出し、抽出したXM
Lデータをもとに要求元に最適なコンテンツとなるよう
に所定の表示形式テンプレートを用いてモバイル用コン
テンツ6を動的に生成する手段である。ここでは、モバ
イル用コンテンツ6として、例えばCompactHT
ML(C−HTML)で記述されたコンテンツを生成す
る。
【0020】図2に示すように、コンテンツ再構築処理
システム1は、インターネット12を介して、Webサ
ーバ11、Webコンテンツ4へのアクセスを中継する
データセンタ14へ接続している。
【0021】Webサーバ11はWebコンテンツ4を
提供するサーバである。
【0022】データセンタ14は、携帯端末13が接続
する電話網などとインターネット12とを中継する装置
である。
【0023】携帯端末13は、携帯電話、PHS、PD
Aなどの端末であって、データセンタ14を介してイン
ターネット12へ接続でき、コンテンツ再構築処理シス
テム1で生成されたモバイル用コンテンツ6を表示処理
できる端末である。
【0024】図3に、Webコンテンツ4のデータ構造
の例を示す。それぞれのコンテンツは、一または複数の
ページ41を持つ。
【0025】ページ41は、Webブラウザなどの閲覧
手段により一度に表示されるデータのまとまりであり、
各ページは、一または複数のコンテナ42およびリンク
を持つ。
【0026】コンテナ42は、一または複数のリソース
43もしくはコンテナ42を格納する部分である。
【0027】リソース43は、人間にとって有意な情報
を構成するデータである。ここでは、リソース43は、
HTMLドキュメントの最小単位で、文字(テキスト)
データまたは画像(イメージ)データなどを指し、いず
れも文全体あるいはイメージ全体ではなく、HTMLの
タグで修飾された最小単位を1リソースとする。
【0028】スタイル45は、コンテンツを構成するペ
ージ41、コンテナ42、リソース43に関連するデー
タであって、フォントの種類、配置、属性などの書式情
報である。ここでは、文字データまたは画像データなど
のリソース43を修飾する情報を全てスタイル45とす
る。
【0029】リンク44は、各オブジェクト間の繋がり
を示すデータであり、リソース43からコンテナ42も
しくはページ41へのリンクがある。
【0030】図4に、データ抽出・構造変換処理部2の
構成例を示す。
【0031】データ抽出・構造変換処理部2は、正規化
処理手段201と、分離処理手段202と、カテゴリ特
定手段203と、モジュール生成処理手段204と、関
係設定手段205と、カスタマイズ処理手段206と、
再構成処理手段207とを備える。
【0032】正規化処理手段201は、入力ソースとし
てWebコンテンツ4であるHTMLドキュメントを格
納元のWebサーバ11から取得し、取得したHTML
ドキュメントの記述を正規化するためにXHTML形式
へ変換し、変換したXHTMLデータを一時的に格納す
る手段である。
【0033】分離処理手段202は、正規化処理手段2
01で生成されたXHTMLデータからリソース43と
スタイル45とを分離し、そのXHTMLドキュメント
内のリンク情報を特定する手段である。
【0034】カテゴリ特定手段203は、XHTMLド
キュメントのトップページから抽出した単語データをも
とに、業種カテゴリデータベース(業種カテゴリDB)
210を参照して、そのXHTMLドキュメント(コン
テンツ)の業種カテゴリを特定する手段である。業種カ
テゴリDB210は、社名や製品名などを業種カテゴリ
ごとに管理するデータベースである。
【0035】モジュール生成処理手段204は、XHT
MLデータの最小単位に分解された要素を機能ごとにグ
ループ化してモジュールを生成し、各要素のモジュール
内での役割を判定してモジュールに意味を付与する手段
である。
【0036】関係設定手段205は、モジュール間の主
従関係などを示すモジュール関係を付与する手段であ
る。
【0037】カスタマイズ処理手段206は、例えば本
システムのユーザの指示入力により、関係設定処理手段
205で付与されたモジュール間関係を修正し、また
は、リソース43の内容を変更する手段である。
【0038】再構成処理手段207は、XHTMLドキ
ュメントのリンク情報を用いてページ間のツリー構成な
どを再構成し、モジュール関係およびツリー構成をもと
に、最小単位であるリソース43を並べて出力用のXM
Lデータを再構成する手段である。再構成されたXML
データはコンテンツDB5へ格納される。
【0039】図5は、データ抽出・構造変換処理部2の
処理を説明するための図である。
【0040】正規化処理手段201は、Webサーバ1
1の管理者、コンテンツ作成者などから取得したWeb
コンテンツ4のURI(Uniform Resource Identifier
s)にもとづき、同一ドメイン内でリンクしている全て
のHTMLページをWebサーバ11から取得する。こ
こで、すべてのHTMLページとは、同一の処理装置内
に配置された相対パスで参照可能なページの集合を意味
する。他サイトへのリンクは同一コンテンツの範囲外と
みなして取得しない。
【0041】そして、図5(A)に示すように、正規化
処理手段201は、HTMLドキュメントのページひと
つひとつのタグを調べ、XMLの記述方法に合わせ、い
ったん処理しやすいXHTML形式へ変換する。一般の
HTMLドキュメントでは、終了タグが閉じられていな
いなどの終了タグに関するあいまいさの問題や、属性の
記述がまちまちであるというような記述の多様性の問題
などがあり、HTMLドキュメントのままでは、以降の
処理上においてやや不都合な点がいくつか存在するから
である。
【0042】ここではHTMLドキュメントを単にXM
Lデータとして扱うことができればよいので、最もHT
MLの記述に近いXMLとしてのXHTMLの仕様に合
わせて取得したHTMLドキュメントをXHTML形式
のデータへ変換するが、XHTML形式への変換処理
は、厳密なXHTMLの仕様に沿うようにデータを変換
するのではなく、欠落したタグの補完、不要なタグの削
除などを行なうことにより記述のあいまいさを排除し、
以降の処理が容易となるような記述形式へ整形すること
を目的として変換する。具体的に以下のような変換処理
を指す。 ・<img> 、<br>、<hr>などの空要素を閉じる 例)<br>→<br /> ・同じインライン要素のタグが入れ子になっている場
合、不要なタグとみなし、一方の対を削除する 例)<b><a name= "aiueo"><b> あいうえお</b></a></b> →<b><a name= "aiueo">あいうえお</a></b> ・開始タグと終了タグがクロスしている個所を、以下の
規則に従い正しい入れ子にする 規則1:ブロック要素とインライン要素がクロスしてい
る場合、インライン要素をブロック要素の中に入れる 規則2:ブロック要素同士またはインライン要素同士が
クロスしている場合、はじめに出てきたタグに順序を合
わせる 例)<ul><li><b><a name="aiueo"> あいうえお</b></a></ul></li> →<ul><li><b><a name="aiueo"> あいうえお</a></b></li></ul> ・<p> 、<li>など終了タグが欠落している個所を、以下
の規則に従い補う 規則3:次に同じタグが現れる直前、もしくはそのタグ
の親となるタグの終了タグに遭遇したとき、閉じられて
いないタグを補完する ・属性値が省略されている個所を属性名で補う 例)<td align="left" valign="top" nowrap> →<td align="left" valign="top" nowrap="nowrap"> ・テキスト、イメージなどの最小要素を複数修飾するタグを個別に振り分ける 例)<a href="index.html"> <img src="pressrelease.gif" alt=" プレスリリース" width="87" heigh t="12"/> <img src="delta-b.gif" alt="" width="10" height="13"/> </a> →<a href="index.html"> <img src="pressrelease.gif" alt=" プレスリリース" width="87" heigh t="12"/> </a> <a href="index.html"> <img src="delta-b.gif" alt="" width="10" height="13"/> </a> (「- 」は、半角のアンダーラインを表す記号である。) 次に、図5(B)に示すように、分離処理手段202
は、XHTMLデータから、リソース43を最小単位ご
とに別ファイルに切り分け、さらにリソース43に付随
するスタイル45を別ファイルとして分離する。また、
分離処理手段202は、リソース43を包含するコンテ
ナ42を確定するとともにコンテナ42に付随するスタ
イル45を分離する。また、ページ41内の構造情報で
あるリンク44を特定する。
【0043】一般的に、HTMLドキュメントから意味
的にまとまりのある部分を抽出することは困難である。
その理由は、HTMLドキュメントには人間が直接関わ
る文字データや画像のほかに、それらを修飾する書式情
報(スタイル)や、ページ構造を記述するタグが散在し
ているからである。
【0044】分離処理手段202は、以下の方法によ
り、XHTMLドキュメントからリソース43を抽出
し、またリソース43を修飾するスタイル45を分離す
る。ここでは、リソース43およびスタイル45を特定
するための規則を以下のように定義する。 ・タグに囲まれたテキストノードである。 ・1リソースには、テキストノードを囲むインラインレ
ベル要素のタグ(文字や画像を直接修飾するタグであっ
て、テーブル<table> やリスト<ul>などのブロックレベ
ル要素を除くもの)全てを含む。ただしインライン要素
のうちアンカー<a> は含まない。 ・改行タグ<br>が現れた場合は、改行タグを含むその直
前までを1リソースとする。 ・改行タグ<br>を除く全てのタグおよびび属性は、スタ
イル情報として格納する。 ・水平線<hr>は1つで1リソースとする。
【0045】以下に、HTMLドキュメントの一部の例
と、その例から分離処理されたリソース43およびスタ
イル45の例を示す。 例)HTMLドキュメントの一部 <a href="http://www.f.com/"> <img src="img.gif" width="415" height="64" alt="F" border="0"/> </a > <b><i>製品情報</i></b><br /> <a href="products/gis/pd.html"> 位置情報表示システム</a> 例) 作成されるリソース ・リソースr1: <resource id="1" type="image" src="img.gif" br="false" link="http://ww w.f.com/">F</resource> ・リソースr2: <resource id="2" type="text" src="" br="true" link="">製品情報</resour ce> ・リソースr3: <resource id="3" type="text" src="" br="false" link="products/gis/pd.h tml"> 位置情報表示システム</resource> 例)作成されるスタイル ・スタイルs1: <style id="1"><width>415</width><height>64</height><border>0</border>< /style> ・スタイルs2: <style id="2"><b /><i /></style> また、カテゴリ特定手段203は、XHTMLデータの
トップページの定義語を除いたデータ部分を切り出して
単語インデックスを生成し、単語インデックスの中の社
名や製品名などの単語をキーワードとして業種カテゴリ
DB210を検索して業種カテゴリを特定する。業種カ
テゴリとしては、例えば、日本標準産業分類を用いる。
また、検索の結果、業種カテゴリが確定できない場合に
は、類義語データベース(図示しない)をもとに抽出し
た単語の同義語リストを生成して、生成した同義語リス
トを用いて業種カテゴリDB210を検索して業種カテ
ゴリを特定する。
【0046】次に、図5(C)に示すように、モジュー
ル生成処理手段204は、XHTMLドキュメントにお
いて最小単位に解体された要素であるリソース43を、
タグをもとに、テーブル、リスト、文パラグラフなどの
所定の機能ごとにグループ化し、モジュールを生成す
る。そして、各要素のモジュール内での役割を判定して
意味として付与する。
【0047】すなわち、TABLE、UL、OL、D
L、P、HRや、TR、TH、TD、LI、TD、TH
などのタグをもとに、どの要素までがテーブルやリスト
としてひとまとまりであるかを調べて1つのモジュール
とし、構成する要素からそのモジュールの意味するもの
が何であるかを解釈する。
【0048】例えば、いくつかの要素で1つの表を構成
する場合に、その要素がテーブルの見出しにあたる項目
であるとか、見出しに対する値であるとかなど要素の役
割を判定して、そのモジュールの内容を解釈し、例えば
「○○の表」、「△△のリスト」などの意味情報をメタ
データとして付加していく。また別の例として、リンク
項目のみで構成されるモジュールがページに出現する場
合に、そのモジュールに対して「インデックス」という
意味情報を付加する。
【0049】なお、スタイル45を参照し、リソース4
3のテキストの文字サイズやセンタリングなどの書式情
報から、テーブルやリストのタイトルにあたる文字デー
タを抽出し、意味情報としてもよい。
【0050】そして、図5(D)に示すように、関係設
定手段205は、モジュール単位でページ内のモジュー
ル間に主従関係を付与する。例えば、同じ階層のモジュ
ールで、テキストモジュールの次に表モジュールがくる
場合に、意味情報が同一もしくは類似する場合には、そ
のテキストモジュールは次の表モジュールと関連がある
という文脈情報(関係)を付加していく。
【0051】そして、図5(E)に示すように、カスタ
マイズ処理手段206は、ユーザの入力指示により、関
係設定手段205で付けられたモジュール関係を修正す
る。また、カスタマイズ処理手段206は、タグを利用
して見出し項目のみを集めて新たにページ内インデック
スを作成したり、リソース43のテキストが長文である
場合にその要約文を新たなリソース43として代替した
り、表形式のデータの各項目をリスト形式で表現するよ
うなデータに変更したりするなど、ユーザが任意な指示
入力によりダイナミックな変更を行なう。
【0052】次に、再構成処理手段207は、図5
(F)に示すように、XHTMLドキュメントのリンク
44をもとに、ページ間のツリー構造を再構築し、この
ツリー構造とモジュール関係に従って、リソース43を
順に並べて中間データであるXMLドキュメントを生成
する。
【0053】ここで、再構成処理手段207は、ページ
間のツリー構造を再構築する場合に、リンクされる回数
が多いモジュールや、トップページ内に表れるキーワー
ドに重み付けしてそのキーワードと同一または類似する
意味情報を持つモジュールについては、優先度を高く
し、これらのモジュールを含むページが上位階層となる
ように構成することもできる。例えば、トップページに
「プレスリリース」、「新着情報」、「更新情報」など
のキーワードが含まれる場合に、そのキーワードと同一
の意味情報が付与されたモジュールからなるページを、
トップページから直接リンクされるようにページ構成す
る。
【0054】なお、この場合に、キーワードの重み付け
により、「プレスリリース」、「新着情報」の意味情報
を持つモジュールは、トップページから直接リンクされ
るようにページ構成し、「更新情報」の意味情報を持つ
モジュールは、より下位のリンクとなるようにページ構
成することもできる。
【0055】また、再構成処理手段207は、予め定め
た業種カテゴリごとにページ構成情報を定義した業種カ
テゴリ別構成情報211を持ち、特定した業種カテゴリ
で選択したページ構成情報に従ってツリー構造を再構築
することもできる。
【0056】また、再構成処理手段207は、XMLデ
ータを生成する際に、アクセス者の年齢に応じて内容を
変更した年齢別バージョンのXMLデータを生成しても
よい。
【0057】図6に、データ抽出・構造変換処理部の処
理フローチャートを示す。
【0058】データ抽出・構造変換処理部2では、正規
化処理手段201により、Webコンテンツ4として同
一サイト内の全HTMLページを取得し(ステップS
1)、XHTMLの形式に変換する(ステップS2)。
そして、分離処理手段202により、リソース43とス
タイル45とを分離し(ステップS3)、さらにリンク
情報を抽出する(ステップS4)。そして、カテゴリ特
定手段203により、サイトの業種カテゴリを特定し
(ステップS5)、モジュール生成処理手段204によ
り、リソース43をグループ化してモジュールを生成し
(ステップS6)、各要素の役割からモジュールの意味
を特定して付与する(ステップS7)。そして、関係設
定手段205により、モジュール間の関係付けを行い
(ステップS8)、カスタマイズ処理手段206により
カスタマイズを行う(ステップS9)。そして、再構成
処理手段207により、リンク情報をもとにサイトのツ
リー構造を再構築し(ステップS10)、再構築したツ
リー構造およびモジュール関係に従ってリソース43を
順にならべてXMLデータの形式でコンテンツを再構成
する(ステップS11)。
【0059】次に、コンテンツ生成処理部3を説明す
る。図7に、コンテンツ生成処理部3の構成例を示す。
コンテンツ生成処理部3は、スペック情報取得処理手段
301と、テンプレート選択手段302と、動的生成処
理手段303と、テンプレートデータベース(テンプレ
ートDB)310とを備える。
【0060】スペック情報取得処理手段301は、携帯
端末13からアクセス要求があると、携帯端末13の機
種名および利用するキャリア名などのスペック情報を取
得する手段である。なお、スペック情報として、アクセ
ス要求があった地域および時期、アクセス者年齢などの
情報を、アクセス要求を中継するデータセンタ14で付
加してもよい。
【0061】テンプレート選択手段302は、予め記憶
しておいたコンテンツ表示形式を定義する情報であるテ
ンプレートDB310から、取得したスペック情報をも
とに該当するテンプレートを選択する手段である。
【0062】テンプレートDB310に記憶されるテン
プレートでは、キャリアごとに携帯端末13の機種別
に、携帯端末13のWebブラウザが解釈可能な言語、
表示画面サイズ、データ容量、対応可能なカラーの種別
などの情報が定義される。また、テンプレートに、ペー
ジの書式情報を定義したスタイルシートを含めてもよ
い。
【0063】動的生成処理手段303は、テンプレート
DB310から選択したテンプレートに従ってコンテン
ツDB5に格納された該当するXMLデータをモバイル
用コンテンツ6に生成する手段である。例えば、テンプ
レートに定義された言語がC−HTMLである場合に
は、XMLデータの各ページを表示画面サイズに対応す
るように分割し、ページ間のリンクを再構築し、C−H
TMLに書き直してモバイル用コンテンツ6を生成す
る。また、動的生成処理手段303は、テンプレートが
スタイルシートを含む場合には、そのスタイルシートの
書式情報にしたがってモバイル用コンテンツ6を生成す
る。
【0064】なお、動的生成処理手段303は、スペッ
ク情報にアクセス地域やアクセス者年齢などのアクセス
情報が含まれる場合に、これらのアクセス情報をキーに
コンテンツDBから該当するXMLデータを抽出してモ
バイル用コンテンツ6を生成することもできる。
【0065】図8に、コンテンツ生成処理部3の処理フ
ローチャートを示す。
【0066】携帯端末13からアクセス要求を受け付け
ると(ステップS21)、スペック情報取得処理手段3
01により、データセンタ14で付加されたスペック情
報を取得する(ステップS22)。そして、テンプレー
ト選択手段302により、スペック情報をもとにテンプ
レートDB310から該当するテンプレートを選択する
(ステップS23)。そして、動的生成処理手段303
により、コンテンツDB5からアクセス要求にかかるコ
ンテンツ(XMLデータ)を抽出し(ステップS2
4)、テンプレートに従ってXMLデータからモバイル
用コンテンツ6を生成し(ステップS25)、生成した
モバイル用コンテンツ6を要求元の携帯端末13へ応答
する(ステップS26)以下に、本発明を適用して、通
常のサイトのWebコンテンツ4から、携帯電話端末な
どの小さい画面サイズに対応したモバイル用コンテンツ
6を再構成した場合の各データ例を示す。
【0067】図9に、通常のコンピュータ端末などでの
閲覧に適したWebコンテンツの表示例を示す。図10
に、図9のWebコンテンツ4の表示例において点線で
示す部分の前後のHTMLデータを示す。
【0068】図10に示すHTMLデータは、データ抽
出・構造変換処理部2の正規化処理手段201によりX
HTMLデータに変換される。図11に、正規化処理部
201により変換されたXHTMLデータの例を示す。
【0069】図11のXHTMLデータは、データ抽出
・構造変換処理部2の各処理手段により再構成されて、
再利用可能なデータ形式であるXMLの記述へ変換され
て、コンテンツDB5に格納される。図12および図1
3は、図11のXHTMLデータから再構成されたXM
Lデータの例を示す。
【0070】その後、携帯端末13からアクセス要求が
あると、図12および図13に示すXMLデータは、コ
ンテンツ生成処理部3により、携帯端末13に対応する
テンプレートに従ってページ構成が再構築されてモバイ
ル用コンテンツ6が生成される。
【0071】図14に、アクセス要求した携帯端末13
の表示処理環境に対応する表示形式テンプレートの例を
示す。図14のテンプレートでは、携帯端末13で表示
するモバイル用コンテンツ6のページ構成として、XM
Lデータを構成するコンテナ42のうち、container[@i
d='10'] およびcontainer[@id='11'] とされたモジュー
ルを順にページ構成することが定義されている。図15
に、図12および図13のXMLデータを、図14のテ
ンプレートに従って生成されたモバイル用コンテンツ6
の例を示す。
【0072】
【発明の効果】以上説明したように、本発明によれば、
データ抽出・構造変換処理部2により、Webコンテン
ツをその内容および構成をもとに再構築し、再利用可能
な中間的なデータ(XMLデータ)を生成し記憶し、ア
クセス要求時に、コンテンツ生成処理部3により、アク
セス要求元の携帯端末13のスペック情報をもとに選択
したテンプレートに従って記憶しておいたXMLデータ
からモバイル用コンテンツ6を自動的に生成する。これ
により、通常サイト用のWebコンテンツから携帯電話
端末などの表示画面が小さい端末での表示に適合したモ
バイル用コンテンツへの再構築処理の負担を軽減でき
る。
【0073】また、本発明によれば、データ抽出・構造
変換処理部2によりコンテンツの所定のモジュールごと
に意味を特定して付与し、その意味をもとにページのツ
リー構造を再構築する。これにより、表示可能なデータ
量が制約されるような端末からのアクセスであっても、
XMLデータから適切なページ構成のコンテンツを再構
成して提供することができる。
【0074】本発明の効果を以下に列挙する。 (1) 人手を介することなく、HTMLコンテンツを内容
に応じて再利用可能な形式(XML)に変換できる。 (2) 再利用可能な形式をもとに検索する場合に、精度の
高い検索結果が得られる。 (3) 業種カテゴリに応じた基本的な規則を踏まえた上
で、提供者の意図を反映した項目の並べ替えや表示内容
の変更が容易になる。
【図面の簡単な説明】
【図1】本発明にかかるシステムの構成例を示す図であ
る。
【図2】本発明にかかるシステムの接続関係例を示す図
である。
【図3】Webコンテンツのデータ構造の例を示す図で
ある。
【図4】データ抽出・構造変換処理部の構成例を示す図
である。
【図5】データ抽出・構造変換処理部の処理を説明する
ための図である。
【図6】データ抽出・構造変換処理部の処理フローチャ
ート図である。
【図7】コンテンツ生成処理部の構成例を示す図であ
る。
【図8】コンテンツ生成処理部の処理フローチャート図
である。
【図9】通常のWebコンテンツの表示例を示す図であ
る。
【図10】図9に示すWebコンテンツのHTMLデー
タの例を示す図である。
【図11】図10に示すHTMLデータから変換された
XHTMLデータの例を示す図である。
【図12】データ抽出・構造変換処理部で再構成された
XMLデータの例を示す図である。
【図13】データ抽出・構造変換処理部で再構成された
XMLデータの例を示す図である。
【図14】テンプレートの例を示す図である。
【図15】携帯端末におけるモバイル用コンテンツの表
示例を示す図である。
【符号の説明】
1 コンテンツ再構築処理システム 2 データ抽出・構造変換処理部 201 正規化処理手段 202 分離処理手段 203 カテゴリ特定手段 204 モジュール生成処理手段 205 関係設定手段 206 カスタマイズ処理手段 207 再構成処理手段 210 業種カテゴリDB 211 業種カテゴリ別構成情報 3 コンテンツ生成処理部 301 スペック情報取得処理手段 302 テンプレート選択手段 303 動的生成処理手段 310 テンプレートDB 4 Webコンテンツ(HTML) 5 コンテンツDB(XML) 6 モバイル用コンテンツ(C−HTML)
───────────────────────────────────────────────────── フロントページの続き (72)発明者 岡本 晋吾 神奈川県川崎市中原区小杉町1丁目403番 地 株式会社富士通ソーシアルサイエンス ラボラトリ内 (72)発明者 稲田 知義 神奈川県川崎市中原区小杉町1丁目403番 地 株式会社富士通ソーシアルサイエンス ラボラトリ内 (72)発明者 中村 拓郎 神奈川県川崎市中原区小杉町1丁目403番 地 株式会社富士通ソーシアルサイエンス ラボラトリ内 Fターム(参考) 5B082 GA02 GA07 (54)【発明の名称】 データ抽出・構造変換処理プログラム、コンテンツ生成処理プログラム、データ抽出・構造変換 処理プログラム記録媒体、コンテンツ生成処理プログラム記録媒体、およびコンテンツ再構築処 理システム

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 タグ付きマークアップ言語で記述された
    コンテンツデータから再利用可能な形式の中間コンテン
    ツデータを再構成するデータ抽出・構造変換処理をコン
    ピュータに実行させるためのプログラムであって、 前記コンテンツデータから、データ構成を定義する情報
    であるタグをもとに人間にとって有意な情報を構成する
    部分であるリソース情報を抽出し、前記リソース情報を
    前記タグをもとにグループ化してモジュールを生成し、
    前記モジュールに意味を付与するモジュール生成処理
    と、 前記タグをもとに前記モジュール間の関係を付与し、前
    記コンテンツデータに定義されているリンク情報から前
    記コンテンツデータのページ間のツリー構造を再構築す
    る関係設定処理と、 前記モジュール間の関係および前記ツリー構造にしたが
    って、前記モジュールを並べ替えて再利用可能な形式の
    前記中間コンテンツデータを生成する再構成処理と、 前記中間コンテンツデータを記憶するコンテンツデータ
    記憶処理とを、 コンピュータに実行させることを特徴とするデータ抽出
    ・構造変換処理プログラム。
  2. 【請求項2】 請求項1に記載のデータ抽出・構造変換
    処理プログラムにおいて、 前記再構成処理では、前記モジュール間の前記意味を用
    いて前記モジュールに重み付けを行い、前記重み付けと
    前記モジュール間の関係と前記ツリー構造とにしたがっ
    て、前記モジュールを並べ替えて再利用可能な形式の前
    記中間コンテンツデータを生成する処理を、 コンピュータに実行させることを特徴とするデータ抽出
    ・構造変換処理プログラム。
  3. 【請求項3】 請求項1に記載のデータ抽出・構造変換
    処理プログラムにおいて、 予め備えた企業名や製品名および企業活動に関する語句
    を業種カテゴリごとに管理した業種カテゴリ情報をもと
    に前記コンテンツデータの業種を特定する業種カテゴリ
    特定処理と、 前記再構成処理において、業種カテゴリごとのコンテン
    ツデータのモジュール構成の規則を定めたカテゴリ別構
    成情報を備え、前記コンテンツデータの業種により選択
    したカテゴリ別構成情報をもとに、前記モジュール間の
    関係と前記ツリー構造とにしたがって、前記モジュール
    を並べ替えて再利用可能な形式の前記中間コンテンツデ
    ータを生成する処理とを、 コンピュータに実行させることを特徴とするデータ抽出
    ・構造変換処理プログラム。
  4. 【請求項4】 タグ付きマークアップ言語で記述された
    再利用可能な形式の中間コンテンツデータから、閲覧要
    求があった端末での表示に対応するコンテンツデータを
    生成するコンテンツ生成処理をコンピュータに実行させ
    るためのプログラムであって、 端末の表示処理環境に対応する表示形式情報であるテン
    プレートを保持するテンプレート記憶手段へアクセスす
    る処理と、 前記端末からの閲覧要求および前記端末の種別情報を受
    け付け、前記識別情報をもとに前記テンプレート記憶手
    段から該当するテンプレートを抽出し、前記テンプレー
    トに従って前記中間コンテンツデータを再構成して前記
    コンテンツデータを生成する動的生成処理とを、 コンピュータに実行させることを特徴とするコンテンツ
    生成処理プログラム。
  5. 【請求項5】 請求項4に記載のコンテンツ生成処理プ
    ログラムにおいて、 前記動的生成処理では、前記閲覧要求とともに前記端末
    のアクセスに関するアクセス情報を受け付け、前記識別
    情報および前記アクセス情報をもとに前記テンプレート
    記憶手段から該当するテンプレートを抽出し、前記テン
    プレートに従って前記中間コンテンツデータを再構成し
    て前記コンテンツデータを生成する処理を、 コンピュータに実行させることを特徴とするコンテンツ
    生成処理プログラム。
  6. 【請求項6】 タグ付きマークアップ言語で記述された
    コンテンツデータから再利用可能な形式の中間コンテン
    ツデータを再構成するデータ抽出・構造変換処理をコン
    ピュータに実行させるためのプログラムを記録した記録
    媒体であって、 前記コンテンツデータから、データ構成を定義する情報
    であるタグをもとに人間にとって有意な情報を構成する
    部分であるリソース情報を抽出し、前記リソース情報を
    前記タグをもとにグループ化してモジュールを生成し、
    前記モジュールに意味を付与するモジュール生成処理
    と、 前記タグをもとに前記モジュール間の関係を付与し、前
    記コンテンツデータに定義されているリンク情報から前
    記コンテンツデータのページ間のツリー構造を再構築す
    る関係設定処理と、 前記モジュール間の関係および前記ツリー構造にしたが
    って、前記モジュールを並べ替えて再利用可能な形式の
    前記中間コンテンツデータを生成する再構成処理と、 前記中間コンテンツデータを記憶するコンテンツデータ
    記憶処理とを、 コンピュータに実行させるためのプログラムを記録した
    ことを特徴とするデータ抽出・構造変換処理プログラム
    記録媒体。
  7. 【請求項7】 タグ付きマークアップ言語で記述された
    再利用可能な形式の中間コンテンツデータから、閲覧要
    求があった端末での表示に対応するコンテンツデータを
    生成するコンテンツ生成処理をコンピュータに実行させ
    るためのプログラムを記録した記録媒体であって、 端末の表示処理環境に対応する表示形式情報であるテン
    プレートを保持するテンプレート記憶手段へアクセスす
    る処理と、 前記端末からの閲覧要求および前記端末の種別情報を受
    け付け、前記識別情報をもとに前記テンプレート記憶手
    段から該当するテンプレートを抽出し、前記テンプレー
    トに従って前記中間コンテンツデータを再構成して前記
    コンテンツデータを生成する動的生成処理とを、 コンピュータに実行させるためのプログラムを記録した
    ことを特徴とするコンテンツ生成処理プログラム記録媒
    体。
  8. 【請求項8】 第1のタグ付きマークアップ言語で記述
    された第1のコンテンツデータから再利用可能な形式の
    中間コンテンツデータを再構成して記憶するデータ抽出
    ・構造変換処理部と、前記中間コンテンツデータから閲
    覧要求があった端末での表示に対応する第2のタグ付き
    マークアップ言語で記述した第2のコンテンツデータを
    生成するコンテンツ生成処理部とからなるコンテンツ再
    構築処理システムであって、 前記データ抽出・構造変換処理部は、 前記第1のコンテンツデータから、データ構成を定義す
    る情報であるタグをもとに人間にとって有意な情報を構
    成する部分であるリソース情報を抽出し、前記リソース
    情報を前記タグをもとにグループ化してモジュールを生
    成し、前記モジュールに意味を付与するモジュール生成
    処理手段と、 前記タグをもとに前記モジュール間の関係を付与し、前
    記第1のコンテンツデータに定義されているリンク情報
    から前記第1のコンテンツデータのページ間のツリー構
    造を再構築する関係設定手段と、 前記モジュール間の関係および前記ツリー構造にしたが
    って、前記モジュールを並べ替えて再利用可能な形式の
    前記中間コンテンツデータを生成する再構成処理手段
    と、 前記中間コンテンツデータを記憶するコンテンツデータ
    記憶部とを備え、 前記コンテンツ生成部は、 端末の表示処理環境に対応した表示形式情報であるテン
    プレートを保持するテンプレート記憶手段と、 前記端末からの閲覧要求および前記端末の種別情報を受
    け付け、前記識別情報をもとに前記テンプレート記憶手
    段から該当するテンプレートを抽出し、前記テンプレー
    トに従って前記中間コンテンツデータを再構成して前記
    コンテンツデータを生成する動的生成処理手段を備える
    ことを特徴とするコンテンツ再構築処理システム。
JP2002019425A 2002-01-29 2002-01-29 コンテンツデータ抽出・構造変換処理プログラム、コンテンツデータ抽出・構造変換処理プログラム記録媒体、およびコンテンツ再構築処理システム Expired - Fee Related JP4084049B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002019425A JP4084049B2 (ja) 2002-01-29 2002-01-29 コンテンツデータ抽出・構造変換処理プログラム、コンテンツデータ抽出・構造変換処理プログラム記録媒体、およびコンテンツ再構築処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002019425A JP4084049B2 (ja) 2002-01-29 2002-01-29 コンテンツデータ抽出・構造変換処理プログラム、コンテンツデータ抽出・構造変換処理プログラム記録媒体、およびコンテンツ再構築処理システム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007008729A Division JP2007115276A (ja) 2007-01-18 2007-01-18 コンテンツデータ生成処理プログラムおよびコンテンツデータ生成処理プログラム記録媒体

Publications (2)

Publication Number Publication Date
JP2003223390A true JP2003223390A (ja) 2003-08-08
JP4084049B2 JP4084049B2 (ja) 2008-04-30

Family

ID=27743274

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002019425A Expired - Fee Related JP4084049B2 (ja) 2002-01-29 2002-01-29 コンテンツデータ抽出・構造変換処理プログラム、コンテンツデータ抽出・構造変換処理プログラム記録媒体、およびコンテンツ再構築処理システム

Country Status (1)

Country Link
JP (1) JP4084049B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005216215A (ja) * 2004-02-02 2005-08-11 Dainippon Printing Co Ltd 情報提示装置及び情報提示方法等
JP2005242756A (ja) * 2004-02-27 2005-09-08 Ricoh Co Ltd マルチメディアコンテンツ生成装置、マルチメディアコンテンツ生成方法、その方法をコンピュータに実行させるプログラム、およびマルチメディアコンテンツ生成システム
JP2005339566A (ja) * 2004-05-28 2005-12-08 Microsoft Corp コンテンツを開始テンプレートとターゲットテンプレートとの間でマップするための方法およびシステム
JP2006216024A (ja) * 2005-02-02 2006-08-17 Microsoft Corp 交換フォーマットメッセージの効率的な変換
JP2007109143A (ja) * 2005-10-17 2007-04-26 Media Groove:Kk 情報配信システム、情報配信装置、情報配信方法、および、情報配信用プログラム
WO2008121986A1 (en) * 2007-03-30 2008-10-09 Google Inc. Document processing for mobile devices
JP2008282114A (ja) * 2007-05-09 2008-11-20 Profield Co Ltd 情報処理装置、サーバ装置、情報処理システム、情報処理方法、およびプログラム
JP2009199514A (ja) * 2008-02-25 2009-09-03 Fujifilm Corp 携帯電話用ファイル生成サーバ,その動作制御方法およびその制御プログラム
JP2010061638A (ja) * 2008-06-26 2010-03-18 Nec (China) Co Ltd 階層構築方法および階層構築システム
JP2010092128A (ja) * 2008-10-03 2010-04-22 Nifty Corp サイト情報変換装置、サイト情報変換方法及びサイト情報変換プログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005216215A (ja) * 2004-02-02 2005-08-11 Dainippon Printing Co Ltd 情報提示装置及び情報提示方法等
JP4518807B2 (ja) * 2004-02-02 2010-08-04 大日本印刷株式会社 情報提示装置及び情報提示方法等
JP2005242756A (ja) * 2004-02-27 2005-09-08 Ricoh Co Ltd マルチメディアコンテンツ生成装置、マルチメディアコンテンツ生成方法、その方法をコンピュータに実行させるプログラム、およびマルチメディアコンテンツ生成システム
JP2005339566A (ja) * 2004-05-28 2005-12-08 Microsoft Corp コンテンツを開始テンプレートとターゲットテンプレートとの間でマップするための方法およびシステム
KR101150132B1 (ko) * 2004-05-28 2012-06-08 마이크로소프트 코포레이션 시작 템플릿과 목표 템플릿 사이의 콘텐츠 맵핑을 위한방법 및 시스템
JP2006216024A (ja) * 2005-02-02 2006-08-17 Microsoft Corp 交換フォーマットメッセージの効率的な変換
JP2007109143A (ja) * 2005-10-17 2007-04-26 Media Groove:Kk 情報配信システム、情報配信装置、情報配信方法、および、情報配信用プログラム
WO2008121986A1 (en) * 2007-03-30 2008-10-09 Google Inc. Document processing for mobile devices
JP2008282114A (ja) * 2007-05-09 2008-11-20 Profield Co Ltd 情報処理装置、サーバ装置、情報処理システム、情報処理方法、およびプログラム
JP2009199514A (ja) * 2008-02-25 2009-09-03 Fujifilm Corp 携帯電話用ファイル生成サーバ,その動作制御方法およびその制御プログラム
JP2010061638A (ja) * 2008-06-26 2010-03-18 Nec (China) Co Ltd 階層構築方法および階層構築システム
JP2010092128A (ja) * 2008-10-03 2010-04-22 Nifty Corp サイト情報変換装置、サイト情報変換方法及びサイト情報変換プログラム

Also Published As

Publication number Publication date
JP4084049B2 (ja) 2008-04-30

Similar Documents

Publication Publication Date Title
US8683324B2 (en) Dynamic generation of target files from template files and tracking of the processing of target files
US9390097B2 (en) Dynamic generation of target files from template files and tracking of the processing of target files
KR100461019B1 (ko) 소형 화면 단말기를 위한 웹 컨텐츠 변환 시스템 및 방법
US6748569B1 (en) XML server pages language
CN104881275B (zh) 一种电子报表生成方法及装置
KR101331532B1 (ko) 데이터베이스로부터 xml 문서를 동적으로 생성하는 방법
US7191397B2 (en) XML server pages language
US9208255B2 (en) Method of converting data of database and creating XML document
CN101788994A (zh) 一种数据展示模型建立方法、数据展示方法及装置
US20130339840A1 (en) System and method for logical chunking and restructuring websites
US8359307B2 (en) Method and apparatus for building sales tools by mining data from websites
CN111258577B (zh) 页面渲染方法、装置、电子设备和存储介质
CN117150050B (zh) 一种基于大语言模型的知识图谱构建方法及***
CN111061828A (zh) 一种数字图书馆知识检索方法及装置
JP4084049B2 (ja) コンテンツデータ抽出・構造変換処理プログラム、コンテンツデータ抽出・構造変換処理プログラム記録媒体、およびコンテンツ再構築処理システム
US20150149887A1 (en) Method of implementing structured and non-structured data in xml document
CN107203557A (zh) 用于处理待搜索的对象的方法及装置
US10133826B2 (en) UDDI based classification system
JP2007115276A (ja) コンテンツデータ生成処理プログラムおよびコンテンツデータ生成処理プログラム記録媒体
CN107209779B (zh) 非结构化的用户可编辑内容存储库中结构化内容的存储和取回
CN114117242A (zh) 数据查询方法和装置、计算机设备、存储介质
CN106777140B (zh) 用于非结构化文档搜索的方法及装置
CN112597410A (zh) 基于规则配置库对网页内容执行结构化提取的方法及装置
CN111090668B (zh) 数据检索方法及装置、电子设备和计算机可读存储介质
JP3914081B2 (ja) アクセス権限設定方法および構造化文書管理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061121

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080214

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140222

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees