JP2005327154A - Htmlファイル処理方法及びプログラム - Google Patents

Htmlファイル処理方法及びプログラム Download PDF

Info

Publication number
JP2005327154A
JP2005327154A JP2004145934A JP2004145934A JP2005327154A JP 2005327154 A JP2005327154 A JP 2005327154A JP 2004145934 A JP2004145934 A JP 2004145934A JP 2004145934 A JP2004145934 A JP 2004145934A JP 2005327154 A JP2005327154 A JP 2005327154A
Authority
JP
Japan
Prior art keywords
tag
html file
storage unit
character string
user terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004145934A
Other languages
English (en)
Inventor
Yasuhiko Awamoto
康彦 粟元
Hisao Sasaki
久雄 佐々木
Yoshiyuki Okada
芳幸 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2004145934A priority Critical patent/JP2005327154A/ja
Priority to US10/948,293 priority patent/US20050256836A1/en
Publication of JP2005327154A publication Critical patent/JP2005327154A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/568Storing data temporarily at an intermediate stage, e.g. caching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】
端末において表示に影響を与えないようにWebアクセスにおける通信データ量を削減する。
【解決手段】
ユーザ端末における表示に影響を与えない文字列を特定するためのデータを格納する定義データ格納部を参照して、ユーザ端末からの要求に応じて他のサーバから受信したHTMLファイルにおいて、ユーザ端末における表示に影響を与えない文字列を特定する特定ステップと、特定された文字列の属性に応じた方法に従ってデータ量を減らすようにHTMLファイルを変更し、変更されたHTMLファイルをユーザ端末に送信する送信ステップとを含む。
【選択図】 図1

Description

本発明は、ウェブ(Web)サイトとクライアント端末との間の中継処理技術に関する。
例えば特開平10−177528号公報は、発信情報の情報量を削減することを目的として、送信キャンセル情報記憶部に記憶された送信キャンセル情報に基づいてWWWサーバに記憶されているハイパーテキスト情報からユーザ指定の不必要な情報を削除し、その削除済みのハイパーテキスト情報を端末に送信する技術が開示されている。但し、本公報記載の技術によれば発信情報の情報量を削減することは出来るが、端末における表示内容を変更してしまっている。
また、特開2003−58445号公報は、デジタル圧縮情報を伸張させるアプリケーションをインターネット網及び無線通信網を介して携帯電話機へ配信し、ウェブサーバからコンテンツ情報を受信し、デジタル圧縮情報を生成し、デジタル圧縮情報を受信し、デジタル圧縮情報をインターネット網及び無線通信網を介して携帯電話機へ配信するという技術を開示している。また、必要に応じて暗号化処理を実施することも開示されている。しかし、携帯電話機などにもデジタル圧縮情報を伸張させるアプリケーション等を送信せざるをえず、さらに携帯電話機の処理能力により表示処理が遅くなる等の問題がある。また、データ通信量がデジタル圧縮情報を伸張させるアプリケーション等の送信のため多くなる場合もある。また、暗号化処理についても端末側の処理負荷を増加させる。
特開平10−177528号公報 特開2003−58445号公報
PDA(Personal Digital Asistant)や携帯電話機などでもWebサイトにアクセスして、Webページの閲覧を行うことが出来るようになっているが、これらの機器の通信速度は遅い場合が多く、Webページ・データをダウンロードするのに時間がかかったり、Webページ・データのデータ量が多い場合にはパケット単位で課金されるとコストが高くなったりという問題があった。また、セキュリティを保持するためにはSSL(Secure Sockect Layer)を用いる場合が多いが、PDAや携帯電話機では通信量、表示速度といった面で問題がある。
これに対して、上で述べたような従来技術では、表示内容に影響を与えるような形で通信量を減らしたり、端末側に特別な機能を付加する必要がある。
従って、本発明の目的は、端末において表示に影響を与えないようにWebアクセスにおける通信データ量を削減するための新規な技術を提供することである。
また本発明の他の目的は、端末において特別な機能を付加することなくWebアクセスにおけるセキュリティレベルを上げるための新規な技術を提供することである。
本発明に係るHTML(Hyper Text Markup Language)ファイル処理方法は、ユーザ端末における表示に影響を与えない文字列を特定するためのデータを格納する定義データ格納部を参照して、ユーザ端末からの要求に応じて他のサーバから受信したHTMLファイルにおいて、ユーザ端末における表示に影響を与えない文字列を特定する特定ステップと、特定された文字列の属性に応じた方法に従ってデータ量を減らすようにHTMLファイルを変更し、変更されたHTMLファイルをユーザ端末に送信する送信ステップとを含む。
このようにユーザ端末において表示に影響を与えない文字列について処理を行ってHTMLファイルのデータ量を削減するため、ユーザ端末におけるユーザは本発明に係る方法の実施を意識することなく、HTMLファイルを含むWebページ・データのスムーズな通信が可能となる。また、データ量が削減されるため、通信料も削減することが出来る。
また、上で述べた送信ステップが、特定された文字列がユーザ端末から返信される可能性を有する文字列である場合、特定された文字列に対してコードを割り当て、当該文字列とコードとの対応テーブルを構成するステップと、対応テーブルに従ってHTMLファイルを変更し、変更されたHTMLファイルをユーザ端末に送信する送信ステップとを含むようにしてもよい。
このように、表示に影響を与えない文字列であって且つ返信される可能性を有する文字列の場合には、コードに変換することにより通信データ量が削減でき、さらに他人が対応テーブルを取得できなければ当該HTMLファイルを盗み見ても次の処理を実施させることができないためセキュリティレベルを上げることも出来る。
さらに、上で述べた送信ステップが、特定された文字列が文字の表示態様を特定するための重複するタグである場合、当該文字列を含まないHTMLファイルを生成するステップを含むようにしてもよい。商用のホームページ作成プログラムを用いてWebページ・データを生成すると、文字の表示態様を特定するためのタグが、当該表示態様を変更しない場合にあっても重複して定義される場合が多い。本来は、同じ表示態様の場合には重複定義は不要であるから、削除しても表示上問題ない。すなわち、ユーザ端末における表示に影響を与えることなく通信データ量を削減することが出来る。
さらに、上で述べた定義データ格納部が、ユーザ端末において表示に影響を与えないタグ名及び当該タグにおける属性名とを格納するようにしてもよい。この場合、上で述べた特定ステップが、上記HTMLファイルにおいて、定義データ格納部に格納されているタグ名を有するタグに、定義データ格納部に格納されている属性名を有する属性が規定されているか判断する判断ステップと、判断ステップにおいて定義データ格納部に格納されているタグ名を有するタグに、定義データ格納部に格納されている属性名を有する属性が規定されていると判断された場合には、当該属性値を上記文字列として特定するステップとを含むようにしてもよい。なお、場合によっては特定の属性及び属性値によりさらに条件が付される場合もある。
本発明によれば、端末において表示に影響を与えないようにWebアクセスにおける通信データ量を削減することができる。
また本発明の別の側面によれば、端末において特別な機能を付加することなくWebアクセスにおけるセキュリティレベルを上げることができる。
[実施の形態1]
本発明の第1の実施の形態に係るシステム概要図を図1に示す。例えばインターネットやLAN(Local Area Network)であるネットワーク1には、1又は複数のWebサーバ9と、本実施の形態における主要な処理を実施するWebコンテンツ制御システム3とが接続されている。Webコンテンツ制御システム3は、インターネット等のネットワーク6を介して無線基地局7に接続されている。Webブラウザを有する携帯電話機5aやPDA5bは、この無線基地局7に無線にて接続する。携帯電話機やPDA、無線基地局の数に特に制限はなく、本実施の形態の主要部ではないので、ここでは1つずつ示している。また、ネットワーク1及びネットワーク6についてもどのような形態のネットワークであってもよい。
Webコンテンツ制御システム3は、Webサーバ9と携帯電話機5aやPDA5bの間に設けられ、Webページ・データの中継を行うシステムであり、1又は複数のサーバで構成される。Webコンテンツ制御システム3は、携帯電話機5a等に代わってWebサーバ9などへアクセスし、取得したWebページ・データを第1Webページデータ格納部32に格納する代理アクセス部31と、代理アクセス部31により取得されたWebページ・データを格納する第1Webページデータ格納部32と、第1Webページデータ格納部32を参照して以下で詳細に述べる重複定義削除処理を実施し処理結果を第2Webページデータ格納部34に格納する重複定義削除処理部33と、重複定義削除処理部33の処理結果を格納する第2Webページデータ格納部34と、第2Webページデータ格納部34を参照して以下で詳細に述べるコード変換処理を実施し処理結果を第3Webページデータ格納部36及び変換テーブル格納部37に格納するコード変換処理部35と、コード変換処理部35の処理結果を格納する第3Webページデータ格納部36と、コード変換処理部35の処理結果である変換テーブルを格納する変換テーブル格納部37と、第3Webページデータ格納部36を参照して要求元の携帯電話機5a等にWebページ・データを送信する送信部38とを含む。変換テーブル格納部37については、代理アクセス部31にも参照される。なお、Webコンテンツ制御システム3には、受信URL(Uniform Resouce Locator)と転送先WebサーバのURLとの対応関係は予め登録されているものとする。
次に図2に重複定義削除処理部33の詳細な機能ブロック図を示す。重複定義削除処理部33は、重複定義チェック部331と、チェック定義テーブル格納部332と、比較テーブル格納部334と、終了タグ格納部333とを含む。重複定義チェック部331は、チェック定義テーブル格納部332に格納されたチェック定義テーブルに従って第1Webページデータ格納部32に格納されたHTMLファイルをチェックすると共に、比較テーブル格納部334及び終了タグ格納部333に格納されたデータを用いて、重複するタグを削除する処理を実施する。重複定義チェック部331の処理結果は、第2Webページデータ格納部34に格納される。チェック定義テーブル格納部332、比較テーブル格納部334及び終了タグ格納部333に格納されるデータについては、以下の処理フローにおいて説明する。
図3にコード変換処理部35の詳細な機能ブロック図を示す。コード変換処理部35は、タグ抽出部351と、抽出定義データ格納部352と、コード変換部353とを含む。タグ抽出部351は、第2Webページデータ格納部34に格納されたHTMLファイルを抽出定義データ格納部352に格納された抽出定義データに従って処理し、抽出定義データに合致するタグデータについてはコード変換部353に出力し、抽出定義データに合致しないタグデータ等については第3Webページデータ格納部36に出力する。コード変換部353は、タグ抽出部351から受け取ったタグデータにおける属性値を所定のルールに従ってコード変換し、属性値とコードの対応関係を変換テーブル格納部37の変換テーブルに登録すると共に、属性値をコードに置換したタグデータを第3Webページデータ格納部36に出力する。なお、変換テーブル格納部37の変換テーブルは、代理アクセス部31においても、携帯電話機5aなどから受信したコードを元の属性値に変換するために用いられる。抽出定義データ格納部352及び変換テーブル格納部37に格納されるデータについては以下の処理フローにおいて説明する。
次に図4乃至図17を用いて図1乃至図3に示したシステムの処理フローを示す。まず、ユーザの指示に従ってユーザ端末(携帯電話機5a又はPDA5b。以下同じ)は、特定のWebサイトにアクセスするためのリクエストをWebコンテンツ制御システム3に送信する(ステップS1)。なお、Webコンテンツ制御システム3によるサービスに認証が必要であれば、既に認証処理が済んでいるものとする。Webコンテンツ制御システム3の代理アクセス部31は、ユーザ端末から特定のWebサイト(例えばWebサーバ9)へのアクセス・リクエストを受信すると、当該特定のWebサイトにアクセス・リクエストを転送する(ステップS3)。なお、代理アクセス部31は、アクセス・リクエストにクッキー等セッションを特定するデータが含まれているか確認する。ここでは説明を分かりやすくするためセッションを特定するデータは含まれていないものとして説明する。そして、特定のWebサイトからアクセス・リクエストに応じたWebページ・データ(ここではHTMLファイル)を受信し、第1Webページデータ格納部32に格納する(ステップS5)。なお、HTMLファイル以外のファイルについては本実施の形態の処理対象ではないので、以下の処理はスキップされるものとする。
次に重複定義削除処理部33は、第1Webページデータ格納部32に格納されたHTMLファイルに対して重複定義削除処理を実施する(ステップS7)。この処理については、図5乃至図11を用いて説明する。
まず、本処理の概要を図5乃至図7を用いて説明する。一般に販売されているホームページ作成プログラムを使用すると、画面に表示させる文字列については、文字列ごとに表示態様を定義するためのタグが規定される。すなわち図5に示すように、「123」という第1文字列について、センタリング、左寄せ、右寄せといった文字位置を設定し、文字サイズを設定し、文字色を設定し、太字、斜体といった文字装飾を設定した上に、「456」という第2文字列について、同じく文字位置を設定し、文字サイズを設定し、文字色を設定し、文字装飾を設定する。図5の例では、第1文字列には「センタリング」「2ポイント」「文字色(青)」「太字」という設定がなされ、第2文字列には「センタリング」「2ポイント」「文字色(青)」「斜体」という設定がなされている。従って、このような設定に従ってHTMLファイルを構成すると図6に示すようなファイルが生成される。図6では、<HTML>タグと、<BODY>タグと、<P>タグと、<CENTER>タグと、color属性が規定された<FONT>タグと、size属性が規定された<FONT>タグと、<B>タグと、文字列「123」と、</B>タグと、</FONT>タグと、</P>タグと、</CENTER>と、<P>タグと、<CENTER>タグと、color属性が規定された<FONT>タグと、size属性が規定された<FONT>タグと、<i>タグと、文字列「456」と、</i>タグと、</FONT>タグと、</P>タグと、</CENTER>タグと、</BODY>タグと、</HTML>タグとが含まれる。これにより、図7に示すような画面表示が実現される。しかしながら、HTMLに従えば、第1文字列と第2文字列とにつき共通の設定については別個にタグを設ける必要はない。図5の例では、異なる部分は文字装飾のみで他の文字位置、文字サイズ、文字色については共通するため、<CENTER>タグ及び</CENTER>タグ、color属性が規定された<FONT>タグ、size属性が規定された<FONT>タグ及び</FONT>タグは余分である。従って、本処理では、このような余分なタグを削除することによって通信データ量を減少させる。
次に具体的な処理フローを図8乃至図11を用いて説明する。重複定義削除処理部33の重複定義チェック部331は、第1Webページデータ格納部32に格納されたHTMLファイルから1タグ(タグでない文字列については次のタグを検出するまでの全文字列)を例えばメインメモリ等の記憶装置に読み出す(図8:ステップS31)。そして読み出したタグが</HTML>タグであるか判断する(ステップS33)。すなわち、HTMLファイルの終了タグを読み出したか判断する。</HTML>タグであると判断された場合には、ステップS60に移行する。</HTML>タグではないと判断されると、チェック定義テーブル格納部332に格納されたチェック定義テーブルを参照して、チェック対象タグを読み出したか判断する(ステップS35)。例えばチェック定義テーブルは、図9のようなデータ・テーブルである。すなわち、チェックすべきタグのデータとして、位置についてのタグ(<CENTER>タグ、<LEFT>タグ、<RIGHT>タグ)、フォントサイズについてのタグ(<FONT>タグ)及び属性(size)、フォントカラーについてのタグ(<FONT>タグ)及び属性(color)、文字修飾についてのタグ(<i>タグ、<B>タグ)が規定されている。
もしステップS35においてチェック対象タグではないと判断された場合、チェック対象タグの終了タグであるか判断する(ステップS53)。例えば、図6の例では、<HTML>タグから<P>タグまでのタグを処理する場合には、ステップS33、ステップS35を経由してステップS53に移行し、ステップS53でチェック対象タグの終了タグでもないと判断される。ステップS53でチェック対象タグの終了タグでないと判断された場合には、当該タグ等を第2Webページデータ格納部34に格納する(ステップS59)。そしてステップS31に移行する。
一方、ステップS35においてチェック対象タグであると判断された場合、同種のチェックフラグがONにセットされているか判断する(ステップS37)。重複定義チェック部331は、比較テーブル格納部334の比較テーブルを参照して同種のチェックフラグがONであるか判断する。比較テーブルの初期状態を図10(a)に示す。図10(a)に示すように比較テーブルには、位置についてのタグのチェックフラグ、フォントサイズについてのタグのチェックフラグ、フォントカラーについてのタグのチェックフラグ、及び文字装飾についてのタグのチェックフラグが設けられている。初期的には図10(a)のように全てOFFとなっている。例えば図6の<CENTER>タグを処理する場合には、位置についてのタグのチェックフラグを参照するが、全てのチェックフラグがOFFとなっているので、ここではステップS39に移行する。
すなわち、同種のチェックフラグがOFFである場合には、タグ(又は属性値)を比較テーブル格納部334の比較テーブルに格納する(ステップS39)。そして、比較テーブルにおいて、処理対象タグの種類に応じたチェックフラグをONにセットする(ステップS41)。図6の<CENTER>タグの場合には、図10(b)に示すように位置についてのタグのチェックフラグをONにセットし、タグ名(CENTER)を登録する。さらに、処理対象タグを第2Webページデータ格納部34に格納する(ステップS43)。その後ステップS31に戻る。
図6のフォントカラーについてのタグ<font color=”#00FFFF”>を処理する場合には、ステップS33、ステップS35、ステップS37、ステップS39、ステップS41及びステップS43を経由して処理が行われ、例えば図10(c)に示すような比較テーブルが比較テーブル格納部334に格納される。すなわち、フォントカラーについてのタグのチェックフラグがONにセットされ、属性値「#00FFFF」が登録されている。
図6のフォントサイズについてのタグ<FONT size=”2”>を処理する場合には、同じくステップS33、ステップS35、ステップS37、ステップS39、ステップS41及びステップS43を経由して処理が行われ、例えば図10(d)に示すような比較テーブルが比較テーブル格納部334に格納される。すなわち、フォントサイズについてのタグのチェックフラグがONにセットされ、属性値「2」が登録されている。
また図6の文字装飾についてのタグ<B>を処理する場合には、同じくステップS33、ステップS35、ステップS37、ステップS39、ステップS41及びステップS43を経由して処理が行われ、例えば図10(e)に示すような比較テーブルが比較テーブル格納部334に格納される。すなわち、文字装飾についてのタグのチェックフラグがONにセットされ、タグ名(B)が登録されている。
さらに図6の文字列「123」を処理する場合には、ステップS33、ステップS35、ステップS53、及びステップS59を経由して処理が行われ、文字列「123」は第2Webページデータ格納部34に格納される。
次に、図6の文字装飾についての<B>タグの終了タグ</B>を処理する場合には、ステップS33及びステップS35を経由して、ステップS53において、チェック定義テーブル格納部332を参照してチェック対象タグの終了タグであると判断される。この場合、同じ終了タグが既に終了タグ格納部333に格納済みであるか判断する(ステップS55)。今回の場合には、まだいずれの終了タグも終了タグ格納部333に登録されていないので、ステップS57に移行して、当該終了タグを終了タグ格納部333に登録する。この終了タグについては同じ種類の次の開始タグの直前に配置すれば問題ないが、ここでは当該終了タグと対応する開始タグにより挟まれた文字列(有効文字列)を終了タグ格納部333において格納しておくことにより、適切な位置に配置し直すことが可能となる。従って、本実施の形態では最終の有効文字列を終了タグ格納部333に登録しておくことにする。上で述べた例の終了タグ</B>については、文字列「123」を合わせて登録する。
また、図6のフォントについての<font>タグの終了タグ</font>を処理する場合には、ステップS33、ステップS35、ステップS53、ステップS55及びステップS57を経由して、終了タグ格納部333に</font>と文字列「123」を格納する。
さらに図6の</p>タグについては、ステップS33、ステップS35、ステップS53及びステップS59を経由して処理され、第2Webページデータ格納部34に格納される。
また図6の位置についての<CENTER>タグの終了タグ</CENTER>を処理する場合には、ステップS33、ステップS35、ステップS53、ステップS55及びステップS57を経由して、終了タグ格納部333に</CENTER>と文字列「123」を格納する。
ここまで処理すると終了タグ格納部333には、図10(f)に示すようなデータが格納されている。すなわち、終了タグ</B>と文字列「123」、終了タグ</font>と文字列「123」、及び終了タグ</CENTER>と文字列「123」が格納されている。
次に図6の<P>タグについては、ステップS33、ステップS35、ステップS53及びステップS59を経由して処理され、第2Webページデータ格納部34に格納される。
そして図6の2度目の<CENTER>タグを処理する場合には、ステップS33及びステップS35を経由して、ステップS37において、同種のチェックフラグがONであると判断される。従って、タグ(又は属性値)が比較テーブル格納部334の比較テーブルに登録されているものと同じであるか判断される(ステップS45)。この場合、位置についてのタグのチェックフラグに対応して「CENTER」が登録されているため、「一致する」と判断される。そうすると何もせずステップS31に戻る。すなわち、<CENTER>タグは重複したタグとして削除されたことになる。
次に、図6の2度目の<font color=”#00FFFF”>タグを処理する場合には、ステップS33、ステップS35、ステップS37及びステップS45を経由して、何もせずにステップS31に戻る。すなわち、<font color=”#00FFFF”>タグは重複したタグとして削除されたことになる。
さらに図6の2度目の<font size=”2”>タグを処理する場合には、ステップS33、ステップS35、ステップS37及びステップS45を経由して、何もせずにステップS31に戻る。すなわち、<font size=”2”>タグは重複したタグとして削除されたことになる。
そして図6の<i>タグを処理する場合には、ステップS33、ステップS35及びステップS37を経由して、ステップS45において、タグ(又は属性値)が一致しないと判断される。従って、終了タグ格納部333に格納されている同種(ここでは文字装飾という種類)の終了タグを対応位置に配置するように第2Webページデータ格納部34に格納する(ステップS47)。終了タグ格納部333には図10(f)に示したようなデータが格納されており、文字修飾についてのタグの対応終了タグ</B>を、文字列「123」の後ろに配置するように、第2Webページデータ格納部34に格納する。なお、第2Webページデータ格納部34に格納された終了タグ格納部333内のタグは削除される。すなわち、終了タグ格納部333には図10(g)に示すようなデータが格納されるようになる。また、処理対象タグを第2Webページデータ格納部34に格納する(ステップS49)。さらに、タグ(又は属性値)を比較テーブル格納部334の比較テーブルに上書き登録する(ステップS51)。今回の例では、文字装飾についてのタグとして「B」が登録されているので、これに代わって「i」を上書き登録する。このような処理を行うと比較テーブルは図10(h)に示すようなデータが格納される。すなわち、文字装飾についてのタグのチェックフラグはONのままで、対応してタグ名「i」が登録されている。残りの部分は図10(e)と同じである。その後処理はステップS31に戻る。
さらに図6の文字列「456」を処理する場合には、ステップS33、ステップS35、ステップS53、及びステップS59を経由して処理が行われ、文字列「456」は第2Webページデータ格納部34に格納される。
また図6の</i>タグを処理する場合には、ステップS33、ステップS35、ステップS53、ステップS55及びステップS57を経由して処理され、</i>タグ及び文字列「456」が終了タグ格納部333に格納される。
次に図6の</font>を処理する場合には、ステップS33、ステップS35及びステップS53を経由して、ステップS55において同じ終了タグが終了タグ格納部333に登録済みであると判断される。そうすると、終了タグ格納部333において同じ終了タグに対応して登録されている文字列を今回の有効文字列に変更する(ステップS58)。すなわち、文字列「123」から、文字列「456」に変更する。
また図6の</P>を処理する場合には、ステップS33、ステップS35、ステップS53及びステップS59を経由して処理され、第2Webページデータ格納部34に格納される。
さらに図6の</CENTER>を処理する場合には、ステップS33、ステップS35、ステップS53、ステップS55及びステップS58を経由して処理され、</CENTER>タグに対応して登録されている文字列「123」に代わって、今回の有効文字列「456」が登録される。ここまでの処理により、終了タグ格納部333には、図10(i)に示すようなデータが格納される。
そして図6の</body>を処理する場合には、ステップS33、ステップS35、ステップS53及びステップS59を経由して処理され、第2Webページデータ格納部34に格納される。
最後に図6の</HTML>を処理する場合にはステップS33を経由して、ステップS60において、</HTML>タグを第2Webページデータ格納部34に格納する。また、終了タグ格納部333に格納されている終了タグを対応位置に配置するように第2Webページデータ格納部34に格納する(ステップS61)。そして元の処理に戻る。終了タグ格納部333には図10(i)に示すようなデータが格納されているので、</font>、</CENTER>及び</i>を文字列「456」の後に配置する。従って図11に示すようなHTMLファイルが第2Webページデータ格納部34に格納されることになる。
このような処理を実施することにより、重複したタグが削除され通信データ量が削減される。
図4の処理に戻って、次に、コード変換処理部35が、コード変換処理を実施する(ステップS9)。コード変換処理については図12乃至図17を用いて説明する。まず、コード変換処理部35のタグ抽出部351は、第2Webページデータ格納部34からタグ等(タグ以外の場合には次のタグまでの全文字列)を読み出す(図12:ステップS71)。そして、抽出定義データ格納部352を参照して変換処理対象の文字列を含むタグであるか判断する(ステップS73)。抽出定義データ格納部352の一例を図13に示す。図13には、抽出定義データとして、抽出すべきタグのタグ名及び当該タグの属性名を規定するテーブルを示す。本実施の形態では、タグ名として、<A>タグと、<INPUT>タグと、<SELECT>タグと、<OPTION>タグとが含まれる。また、<INPUT>タグには、TYPE属性の属性値として「TEXT」「CHECKBOX」「RADIO」が抽出における必須の属性及び属性値として規定されている。すなわち、<INPUT>タグであってもTYPE属性の属性値が「SUBMIT」等の場合には、必須の属性及び属性値が一致しないので抽出されない。また、変換対象文字列(属性値)を規定するための属性名として、<A>タグのHREF属性、<INPUT>タグ及び必須属性及び属性値TYPE=TEXTについてはNAME属性、<INPUT>タグ及び必須属性及び属性値TYPE=CHECKBOXについてはNAME属性及びVALUE属性、<INPUT>タグ及び必須属性及び属性値TYPE=RADIOについてはNAME属性及びVALUE属性、<SELECT>タグについてはNAME属性、<OPTION>タグについてはVALUE属性が含まれている。ステップS73では、ステップS71において読み出したタグのタグ名が、図13のテーブルに登録されており、且つ属性及び属性値が図13のテーブルに登録された必須属性及び属性値を有しているかをまず判断する。もし、この条件を満たしている場合には、必須属性以外の属性が、当該タグ並びに必須属性及び属性値に対応して図13のテーブルに格納されている属性となっているか判断する。
例えば図14に示すようなHTMLファイルを処理するものとする。最初の<HTML>タグから<form action=Post.jsp>タグまでは、ステップS73において変換処理対象の文字列を含むタグではないと判断され、ステップS75に移行する。そして、読み出したタグ等を第3Webページデータ格納部36に格納する。すなわち、特に変換処理を実施しない。
一方、図14の<a href=”http://www.bsc.co.jp/bsc/”>タグについては、ステップS73において変換対象の文字列を含むタグであると判断される。そして、コード変換部353は、ステップS73において特定された属性の属性値にコードを割り当てる(ステップS77)。そして、属性値とコードの対を変換テーブル格納部37の変換テーブルに登録する(ステップS79)。コードの長さが変換元の文字列より短ければ、通信データ量を減らすことが出来る。また、変換元の文字列(属性値)とコードとの関連性がなければ、例えば変換後のコードを含むHTMLファイルを盗み見る者がいたとしても、コードから元の文字列を抽出できず、当該HTMLファイルより後のデータを不正に取得できない。従って、特定の数列、ランダムな数列、若しくは文字又は記号列(記号のみを含む)などを割り当てる。但し、特定した文字列が「1」「2」「3」というような文字列であるにもかかわらず、割り当てるコードを「1」「2」「3」といった数列に従って割り当てると、意味がない場合もあるので、元の文字列とコードとが重複しないようすることが好ましい。このような重複を避けるためには、変換対象の全ての属性値を抽出した後に、変換対象の属性値と重複しないようなコードを割り当て、それから変換テーブルに登録する。なお、本実施の形態では、説明を簡単にするため、検出順に「1」「2」「3」という数列に従って数字をコードとして文字列に割り当てることとする。また、同じ属性値がHTMLファイル中に何度も登場する場合もあるので、変換テーブルを参照して同じ属性値に異なるコードを割り当てないように確認する。
そしてコード変換部353は、属性値をコードに変換した後のタグを第3Webページデータ格納部36に格納する(ステップS81)。<a href=”http://www.bsc.co.jp/bsc/”>は、<a href=”1”>に変換され、第3Webページデータ格納部36に格納される。
またタグ抽出部351は、全てのタグ等のデータを処理したか判断する(ステップS83)。もし、最後の</HTML>タグまで処理すれば全て処理したことになるので、元の処理に戻る。一方、未処理のタグ等があればステップS71に戻る。
図14の例では、<a href=”http://www.bsc.co.jp/arb/”>タグ、<input type=text name=uid>タグ、<input type=checkbox name=mode value=”on”>タグ、<input type=radio name=course value=”type1”>タグ、<input type=radio name=course value=”type2”>タグ、<select name=”kudamono”>タグ、<OPTION VALUE=”オレンジ”>タグ、<OPTION VALUE=”メロン”>タグ、<OPTION VALUE=”バナナ”>タグ、及び<OPTION VALUE=”レモン” SELECTED>タグについては、その属性値がコードに変換される。また、<input type=checkbox name=mode value=”on”>タグのように、1つのタグに複数の変換対象の属性値が含まれる場合もある。
一方、図14の例では、<input type=submit value=送信>タグは、必須属性及び属性値が一致しないので、変更対象として抽出しない。
以上のような変換処理を実施すると、図15に示すような変換テーブルが変換テーブル格納部37に格納される。すなわち、変換後のコードと変換前の文字列とが対応付けられている。この変換テーブルは、ユーザ及びセッション毎に設けられる。すなわち、ユーザ固有のものであって、同じユーザであっても基本的には2以上のHTMLファイルで共通して用いることはない。コードは、「1」から「13」までの数字となっている。但し、「a」から「m」までのアルファベットであってもよいし、検出順ではなくランダムな数字を与えても良い。また、本変換テーブルに従って生成され、第3Webページデータ格納部36に格納されるHTMLファイルは、図16に示すようになる。すなわち、<a href=”http://www.bsc.co.jp/bsc/”>タグが、<a href=”1”>タグに、<a href=”http://www.bsc.co.jp/arb/”>タグが<a href=”2”>タグに、<input type=text name=uid>タグが<input type=text name=3>タグに、<input type=checkbox name=mode value=”on”>タグが<input type=checkbox name=4 value=5>タグに、<input type=radio name=course value=”type1”>タグが<input type=radio name=6 value=7>タグに、<input type=radio name=course value=”type2”>タグが<input type=radio name=6 value=8>タグに、<select name=”kudamono”>タグが<select name=9>タグに、<OPTION VALUE=”オレンジ”>タグが<OPTION VALUE=10>タグに、<OPTION VALUE=”メロン”>タグが<OPTION VALUE=11>タグに、<OPTION VALUE=”バナナ”>タグが<OPTION VALUE=12>タグに、及び<OPTION VALUE=”レモン” SELECTED>タグが<OPTION VALUE=13 SELECTED>タグに変換される。
このようにすれば、文字の表示態様を規定する重複タグだけではなく、後にユーザ端末から返信される可能性があるようなタグの属性値についてもコードに変換することにより、ユーザ端末における表示内容に影響を与えずに、通信データ量を削減できる。後にユーザ端末から返信される可能性があるため、ユーザ端末への下り方向だけではなく、ユーザ端末からWebコンテンツ制御システム3への上り方向の通信データ量も削減できる。また、「1」から「13」の数字では元の内容を推定することが出来ず、セキュリティレベルも上がっている。
なお、図14のようなHTMLファイルであっても図16のようなHTMLファイルであっても図17に示すような画面がユーザ端末の表示装置に表示される。図17の例では、「BSC Top Page」リンク1701、「ARB Top Page」リンク1702、ユーザID入力欄1703、詳細モードのチェックボックス1704、タイプ1又はタイプ2のいずれかを選択するためのラジオボタン1705、コンボボックス1706、及び送信ボタン1707が含まれる。
図4の処理フローの説明に戻って、Webコンテンツ制御システム3の送信部38は、第3Webページデータ格納部36に格納されている修正後のHTMLファイル(Webページ・データ)をユーザ端末に送信する(ステップS11)。ユーザ端末は、Webコンテンツ制御システム3から修正後のWebページ・データを受信し、表示装置に表示する(ステップS13)。上でも述べたように例えば図17に示すような画面が表示されたものとする。
そしてユーザがユーザ端末を操作し、ユーザID入力欄1703に8003を入力し、詳細モードのチェックボックス1704にチェックを付し、ラジオボタン1705においてタイプ1を選択し、チェックボックス1706においてレモンを選択し、「送信」ボタン1707をクリックしたものとする。そうすると、ユーザ端末のWebブラウザは、当該ユーザ入力を受け付け、「http://(Webコンテンツ制御システム3のULRホスト部)/Post.jsp?3=8003&4=5&6=7&9=13」というリクエスト・メッセージを生成して、Webコンテンツ制御システム3に送信する(ステップS15)。中継サーバURLホスト部については、表示しているHTMLファイルのURLから特定する。Post.jspが相対パスで指定されているためである。Webコンテンツ制御システム3の代理アクセス部31は、ユーザ端末からリクエスト・メッセージを受信し(ステップS17)、変換テーブル格納部37の変換テーブルに従ってリクエスト・メッセージを変換する(ステップS19)。上のリクエスト・メッセージの場合には、「http://(対応WebサイトのURLホスト部)/Post.jsp?uid=8003&mode=”on”&course=type1&kudamono=レモン(「レモン」はURLエスケープコードを使って指定される)」というリクエスト・メッセージが例えばWebサーバ9に送信される(ステップS21)。送信処理については通常の処理と変わらないのでこれ以上説明しない。そして処理はステップS5に戻る。なお、ステップS5に戻る時には、基本的にはステップS19において使用した変換テーブルをクリアする。
また、ステップS15において、ユーザが「BSC TOP Page」リンク1701をクリックした場合には、ユーザ端末からは「http://(Webコンテンツ制御システム3のURLホスト部)/1」というリクエスト・メッセージを生成し、Webコンテンツ制御システム3に送信する。Webコンテンツ制御部3の代理アクセス部31は、変換テーブルに従って「http://www.bsc.co.jp/bsc/」というリクエスト・メッセージに変換し、例えばWebサーバ9に転送する。
このような処理を実施することにより、通信データ量を削減でき、さらにコード変換を実施する場合にはセキュリティレベルを向上させることが出来る。
なお、上では基本的にクッキーにてセッションIDをやり取りする例を示したが、他にも方法がある。例えば、図8の処理を行った後に、飛び先URLなどを指定する属性を抽出して、セッションIDのデータを付加する。例えば、<form>タグにおけるaction属性や、<A>タグにおけるhref属性といった属性を抽出し、その属性値に例えば「?jsessionid=XXXX」(XXXXはセッションIDそのもの)を付加する。例えば、図16の例では、「<form action=Post.jsp?jsessionid=XXXX>」、「<A href=”1?jsessionid=XXXX”>」「<A href=”2?jsessionid=XXXX”>」といったように変換する。
このようにすれば、ユーザ端末からのリクエスト・メッセージは、「http://(Webコンテンツ制御システム3のURLホスト部)/Post.jsp?jsessionid=XXXX?3=8003&4=5&6=7&9=13」というようにリクエスト・メッセージのみからセッションIDを特定できるようになる。また、他の例についても「http://(Webコンテンツ制御システム3のURLホスト部)/1?jsessionid=XXXX」となり、同様にセッションIDを特定できる。
[実施の形態2]
次に本発明の第2の実施の形態を説明する。図18に本実施の形態に係るシステム概要図を示す。なお、図1と同じ構成要素には同じ符号を付している。ネットワーク1には、1又は複数のWebサーバ9と、本実施の形態に係る主要な処理を実施するWebコンテンツ制御システム300とが接続されている。Webコンテンツ制御システム300には、ネットワーク6を介して無線基地局7と接続されている。また、本実施の形態に係る携帯電話機50aやPDA50bは、無線で無線基地局7に接続する。ここでも携帯電話機50aやPDA50b、無線基地局7の数については、いくつあっても良い。
本実施の形態におけるWebコンテンツ制御システム300は、携帯電話機50a等に代わってWebサーバ9にアクセスしてWebページ・データ(HTMLファイル)を受信しWebページデータ格納部302に格納する代理アクセス部301と、代理アクセス部301により取得されたWebページ・データを格納するWebページデータ格納部302と、Webページデータ格納部302に格納されている特定のユーザ端末用の前回のWebページ・データと今回受信したWebページ・データとの差を識別し差分データを生成して差分データ格納部304に格納する差分データ生成部303と、差分データ生成部303により生成された差分データ等を格納する差分データ格納部304と、差分データ格納部304に格納されている差分データ等を携帯電話機50a等に送信する送信部305とを含む。
また、本実施の形態における携帯電話機50aは、本実施の形態に係るWebブラウザ51aと直前に用いたHTMLファイルを格納するHTMLファイル格納部53aとを有している。このWebブラウザ51aは、Webコンテンツ制御システム300からの差分データとHTMLファイル格納部53aに格納された直前に用いたHTMLファイルとから今回使用するHTMLファイルを再構成するHTMLファイル再構成部52aを含む。PDA50bについても同様の構成を有する。
本実施の形態では、前回の表示と今回の表示との差分に係る差分データ(及び以下で説明する編集データ)のみをWebコンテンツ制御システム300から携帯電話機50a等に送信することにより、通信データ量を削減するものである。例えば直前に図19(a)に示すような表示内容であり、次に図19(b)に示すような表示内容のWebページにアクセスした場合に、図19(a)の表示部分Aは図19(b)の表示部分A’と同じであり、図19(a)の表示部分Bと図19(b)の表示部分B’とは異なり、図19(a)の表示部分Cと図19(b)の表示部分C’とは異なり、図19(a)の表示部分Dは図19(b)の表示部分D’と同じであり、図19(a)の表示部分Eは図19(b)の表示部分E’と同じである。従って、表示部分B’及び表示部分C’のためのデータ及びWebブラウザ51aのHTMLファイル再構成部52aにおいて必要な編集データのみをWebコンテンツ制御システム300から携帯電話機50aに送信する。
以下、図20及び図21を用いて図18に示したシステムの処理フローを説明する。なお、Webコンテンツ制御システム300を使用するための認証が必要な場合は、既に認証済みであるものとする。まず、ユーザはユーザ端末(携帯電話機50a又はPDA50b)を操作して、特定のWebサイト(Webサーバ)にアクセス・リクエストを送信させる(ステップS101)。なお、セッションを特定するためのクッキー等も送信する。Webコンテンツ制御システム300の代理アクセス部301は、ユーザ端末からアクセス・リクエストを受信すると、特定のWebサイトへ当該アクセス・リクエストを転送する(ステップS103)。なお、Webコンテンツ制御システム300には、受信URL(Uniform Resouce Locator)と転送先WebサーバのURLとの対応関係は予め登録されているものとする。
そして、代理アクセス部301は、特定のWebサイトからWebページ・データを受信し、Webページデータ格納部302に格納する(ステップS105)。Webページデータ格納部302には、例えばセッションIDやユーザIDに対応付けてWebページ・データを格納する。Webページデータ格納部302には、セッションID等に対応付けられて(1)直前のHTMLファイル及び(2)今回受信したHTMLファイルが格納されている。なお、本実施の形態ではHTMLファイルのみを取り扱い、他のファイルについてはそのままユーザ端末に転送するものとする。
そして差分データ生成部303は、Webページデータ格納部302を参照して、同じユーザ端末からのリクエストに係る今回受信したWebページ・データと直前のWebページ・データとを比較して、差分を抽出する(ステップS107)。
例えば図21(a)が直前のHTMLファイルの文字列を模式的に表し、図21(b)が今回受信したHTMLファイルの文字列を模式的に表したものである。図21(a)及び図21(b)の各数字は文字位置を示しており、各数字の位置に文字が配置されているものとする。また、図21(a)において、白抜き文字は図21(b)と相違する文字列を示しており、通常の数字が示されている部分は図21(b)共通する文字列を示している。また図21(b)では、白抜き文字は図21(a)と相違する文字列を示しており、通常の数字が示されている部分は図21(a)と共通する文字列を示している。本例では、前回の文字1乃至10と今回の文字1乃至10、前回の文字25乃至34と今回の文字14乃至23、前回の文字72乃至81と今回の文字68乃至77、前回の文字91乃至100と今回の文字81乃至90とが一致している。従って、送信すべき文字は、今回の文字11乃至13、文字24乃至67、文字78乃至80、文字91乃至100を差分データとして特定し、差分データ格納部304に格納する。
そして差分データ生成部303は、編集データを生成し、差分データ格納部304に格納する(ステップS109)。編集データは、どのようにHTMLファイルを再構成するかを示すデータである。図21(a)及び図21(b)に示した例であれば、前回の文字1乃至10を位置1へ、文字25乃至34を位置14へ、文字72乃至81を位置68へ、文字91乃至100を位置81へというデータである。すなわち、前回の文字列をどの位置に複写すればよいのかを示すデータである。差分データについては、送信順(Webブラウザ51aから見れば受信順)に編集データで特定されなかった文字位置を埋めるように配置すればよい。すなわち、位置11乃至13に1番目(元の文字位置11)から3番目(元の文字位置13)に送信した文字を配置し、位置24乃至67に4番目(元の文字位置24)から47番目(元の文字位置67)に送信した文字を配置し、位置78乃至80に48番目(元の文字位置78)から50番目(元の文字位置80)に送信した文字を配置し、位置91乃至100に51番目(元の文字位置91)から60番目(元の文字位置100)を配置することがわかる。
そして、送信部305は、差分データ及び編集データをユーザ端末に送信する(ステップS111)。ユーザ端末のWebブラウザ51aは、Webコンテンツ制御システム300から差分データ及び編集データを受信し、メインメモリ等の記憶装置に格納する(ステップS113)。そして、Webブラウザ51aのHTMLファイル再構成部52aは、HTMLファイル格納部53aに格納されている前回のHTMLファイルを参照して、編集データ及び差分データに従って、今回のHTMLファイルを再構成し、HTMLファイル格納部53aに格納する(ステップS115)。上で述べたように、前回のHTMLファイルのデータを編集データに従って配置し、残りの部分を今回受信した差分データで順番に埋めていくことにより、今回のHTMLファイルを再構成する。例えば図21(c)のようなHTMLファイルが再構成される。今回のHTMLファイルは次のHTMLファイルを再構成するために使用されるので、HTMLファイル格納部53aに格納する。
そしてWebブラウザ51aは、再構成されたHTMLファイルに従って画面表示を行う(ステップS117)。なお、画像ファイルなどが必要な場合には、別途リクエストを出して取得した上で表示を行う。その後、処理はステップS101に戻って、図20の処理フローを繰り返す。
以上のような処理を実施すれば、直前のHTMLファイルとほとんど差がないようなHTMLファイルを再度送るよりも通信データ量は少なくて済む。
なお、全く異なるようなHTMLファイルの場合には、当該HTMLファイルが差分データとなり、前回のHTMLファイルの使用法を特定する編集データは無い。
以上本発明の実施の形態を説明したが、本発明はこれに限定されず、様々な変形が可能である。例えば、第1の実施の形態と第2の実施の形態を組み合わせることも可能である。その場合、例えば第1の実施の形態の処理を実施した後、第2の実施の形態の処理を実施する。その場合、コード変換がその都度行われるので、同一と判断される部分が少なくなる場合がある。そのため、変換テーブルを同じユーザにつき長い時間維持するような構成にすれば、同一と判断される部分が多くなると予測される。
また、図1及び図18に示した機能ブロック図は一例であって、必ずしも実際のプログラム・モジュール構成に合致するものではない。
さらに、上で述べた処理フローにおいても処理順番を入れ替えることが出来る部分もある。
また、Webコンテンツ制御システム3及び300は、図22に示すように、メモリ2501とCPU2503とハードディスク・ドライブ(HDD)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。オペレーティング・システム(OS:Operating System)及び各実施の形態における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。必要に応じてCPU2503は、表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、必要な動作を行わせる。また、処理途中のデータについては、メモリ2501に格納され、必要があればHDD2505に格納される。本発明の実施の形態では、上記機能を実現するためのアプリケーション・プログラムはリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータは、上で述べたCPU2503、メモリ2501などのハードウエアとOS及び必要なアプリケーション・プログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
また、携帯電話機5aやPDA5bについても、HDD2505やドライブ装置2513などの代わりにフラッシュメモリを保持する構成であって、大きな相違は無い。以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
ユーザ端末における表示に影響を与えない文字列を特定するためのデータを格納する定義データ格納部を参照して、ユーザ端末からの要求に応じて他のサーバから受信したHTMLファイルにおいて、前記ユーザ端末における表示に影響を与えない文字列を特定する特定ステップと、
特定された前記文字列の属性に応じた方法に従ってデータ量を減らすように前記HTMLファイルを変更し、変更された前記HTMLファイルを前記ユーザ端末に送信する送信ステップと、
を含み、コンピュータにより実行されるHTMLファイル処理方法。
(付記2)
前記送信ステップが、
特定された前記文字列が前記ユーザ端末から返信される可能性を有する文字列である場合、特定された前記文字列に対してコードを割り当て、当該文字列とコードとの対応テーブルを構成するステップと、
前記対応テーブルに従って前記HTMLファイルを変更し、変更された前記HTMLファイルを前記ユーザ端末に送信する送信ステップと、
を含む付記1記載のHTMLファイル処理方法。
(付記3)
前記送信ステップが、
特定された前記文字列が文字の表示態様を特定するための重複するタグである場合、当該文字列を含まない前記HTMLファイルを生成するステップ、
を含む付記1又は2記載のHTMLファイル処理方法。
(付記4)
前記コードが前記文字列より短い文字列であることを特徴とする付記2記載のHTMLファイル処理方法。
(付記5)
前記コードが、前記HTMLファイルにおいて特定された前記文字列と重複することなく任意に割り当てられた文字列であることを特徴とする付記2記載のHTMLファイル処理方法。
(付記6)
前記ユーザ端末から前記コードを含むメッセージを受信した場合、前記対応テーブルを参照して、前記メッセージ内の前記コードを前記文字列に置換するステップと、
置換後の前記メッセージを転送するステップと、
をさらに含む付記2記載のHTMLファイル処理方法。
(付記7)
前記定義データ格納部が、特定すべきタグ名を格納しており、
前記特定ステップが、
前記HTMLファイルにおいて、前記定義データ格納部に格納されているタグ名を有するタグが含まれており、且つ当該タグ又は当該タグと当該タグに関連する属性値との組み合わせが複数回連続して出現するか判断するステップと、
複数回連続して出現すると判断されたタグ又はタグと当該タグに関連する属性値との組み合わせが存在する場合には、当該タグ及び当該タグの終了タグのうち最初のタグ及び最後の終了タグ以外を前記文字列として特定するステップと、
を含むことを特徴とする請求項3記載のHTMLファイル処理方法。
(付記8)
前記定義データ格納部が、前記ユーザ端末において表示に影響を与えないタグ名及び当該タグにおける属性名とを格納しており、
前記特定ステップが、
前記HTMLファイルにおいて、前記定義データ格納部に格納されているタグ名を有するタグに、前記定義データ格納部に格納されている属性名を有する属性が規定されているか判断する判断ステップと、
前記判断ステップにおいて前記定義データ格納部に格納されているタグ名を有するタグに、前記定義データ格納部に格納されている属性名を有する属性が規定されていると判断された場合には、当該属性値を前記文字列として特定するステップと、
を含むことを特徴とする付記2記載のHTMLファイル処理方法。
(付記9)
ユーザ端末における表示に影響を与えない文字列を特定するためのデータを格納する定義データ格納部を参照して、ユーザ端末からの要求に応じて他のサーバから受信したHTMLファイルにおいて、前記ユーザ端末における表示に影響を与えない文字列を特定する特定ステップと、
特定された前記文字列の属性に応じた方法に従ってデータ量を減らすように前記HTMLファイルを変更し、変更された前記HTMLファイルを前記ユーザ端末に送信する送信ステップと、
を、コンピュータに実行させるHTMLファイル処理プログラム。
(付記10)
ユーザ端末における表示に影響を与えない文字列を特定するためのデータを格納する定義データ格納部を参照して、ユーザ端末からの要求に応じて他のサーバから受信したHTMLファイルにおいて、前記ユーザ端末における表示に影響を与えない文字列を特定する特定手段と、
特定された前記文字列の属性に応じた方法に従ってデータ量を減らすように前記HTMLファイルを変更し、変更された前記HTMLファイルを前記ユーザ端末に送信する送信手段と、
を有するHTMLファイル処理装置。
本発明の第1の実施の形態におけるシステム概要図である。 重複定義削除処理部の機能ブロック図である。 コード変換処理部の機能ブロック図である。 本発明の第1の実施の形態におけるメインの処理フローを示す図である。 文字の表示態様設定画面の一例を示す図である。 一般に販売されているホームページ作成プログラムにおいて生成されるHTMLファイルの一例を示す図である。 図6に示したHTMLファイルの表示例を示す図である。 重複定義削除処理の処理フローを示す図である。 チェック定義テーブルの一例を示す図である。 (a)は第1の状態の比較テーブル、(b)は第2の状態の比較テーブル、(c)は第3の状態の比較テーブル、(d)は第4の状態の比較テーブル、(e)は第5の状態の比較テーブル、(f)は第6の状態の終了タグ格納部に格納されるデータ、(g)は第7の状態の終了タグ格納部に格納されるデータ、(h)は第8の状態の比較テーブル、(i)は第9の状態の終了タグ格納部に格納されるデータを示す図である。 重複定義削除処理後のHTMLファイルの一例を示す図である。 コード変換処理の処理フローを示す図である。 抽出定義データ・テーブルの一例を示す図である。 コード変換処理を説明するためのHTMLファイルの一例を示す図である。 変換テーブルの一例を示す図である。 コード変換後のHTMLファイルの一例を示す図である。 図14及び図16のHTMLファイルの表示例を示す図である。 本発明の第2の実施の形態におけるシステム概要図である。 (a)は直前の表示内容の一例を示し、(b)は次のWebページの一例を示す図である。 本発明の第2の実施の形態における処理フローを示す図である。 (a)は直前のHTMLファイルの文字列の模式図、(b)は今回のHTMLファイルの文字列の模式図、(c)は差分データの模式図である。 コンピュータ・システムの機能ブロック図である。
符号の説明
1,6 ネットワーク 7 無線基地局
9 Webサーバ
3,300 Webコンテンツ制御システム
5a,50a 携帯電話機
5b,50b PDA
31,301 代理アクセス部
32 第1Webページデータ格納部
33 重複定義削除処理部
34 第2Webページデータ格納部
35 コード変換処理部
36 第3Webページデータ格納部
37 変換テーブル格納部
38,305 送信部
302 Webページデータ格納部
303 差分データ生成部
304 差分データ格納部
51a,51b Webブラウザ
52a,52b HTMLファイル再構成部
53a,53b HTMLファイル格納部

Claims (5)

  1. ユーザ端末における表示に影響を与えない文字列を特定するためのデータを格納する定義データ格納部を参照して、ユーザ端末からの要求に応じて他のサーバから受信したHTMLファイルにおいて、前記ユーザ端末における表示に影響を与えない文字列を特定する特定ステップと、
    特定された前記文字列の属性に応じた方法に従ってデータ量を減らすように前記HTMLファイルを変更し、変更された前記HTMLファイルを前記ユーザ端末に送信する送信ステップと、
    を含み、コンピュータにより実行されるHTMLファイル処理方法。
  2. 前記送信ステップが、
    特定された前記文字列が前記ユーザ端末から返信される可能性を有する文字列である場合、特定された前記文字列に対してコードを割り当て、当該文字列とコードとの対応テーブルを構成するステップと、
    前記対応テーブルに従って前記HTMLファイルを変更し、変更された前記HTMLファイルを前記ユーザ端末に送信する送信ステップと、
    を含む請求項1記載のHTMLファイル処理方法。
  3. 前記送信ステップが、
    特定された前記文字列が文字の表示態様を特定するための重複するタグである場合、当該文字列を含まない前記HTMLファイルを生成するステップ、
    を含む請求項1又は2記載のHTMLファイル処理方法。
  4. 前記定義データ格納部が、前記ユーザ端末において表示に影響を与えないタグ名及び当該タグにおける属性名とを格納しており、
    前記特定ステップが、
    前記HTMLファイルにおいて、前記定義データ格納部に格納されているタグ名を有するタグに、前記定義データ格納部に格納されている属性名を有する属性が規定されているか判断する判断ステップと、
    前記判断ステップにおいて前記定義データ格納部に格納されているタグ名を有するタグに、前記定義データ格納部に格納されている属性名を有する属性が規定されていると判断された場合には、当該属性値を前記文字列として特定するステップと、
    を含むことを特徴とする請求項2記載のHTMLファイル処理方法。
  5. ユーザ端末における表示に影響を与えない文字列を特定するためのデータを格納する定義データ格納部を参照して、ユーザ端末からの要求に応じて他のサーバから受信したHTMLファイルにおいて、前記ユーザ端末における表示に影響を与えない文字列を特定する特定ステップと、
    特定された前記文字列の属性に応じた方法に従ってデータ量を減らすように前記HTMLファイルを変更し、変更された前記HTMLファイルを前記ユーザ端末に送信する送信ステップと、
    を、コンピュータに実行させるHTMLファイル処理プログラム。
JP2004145934A 2004-05-17 2004-05-17 Htmlファイル処理方法及びプログラム Pending JP2005327154A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004145934A JP2005327154A (ja) 2004-05-17 2004-05-17 Htmlファイル処理方法及びプログラム
US10/948,293 US20050256836A1 (en) 2004-05-17 2004-09-24 HTML file processing technique

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004145934A JP2005327154A (ja) 2004-05-17 2004-05-17 Htmlファイル処理方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2005327154A true JP2005327154A (ja) 2005-11-24

Family

ID=35310573

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004145934A Pending JP2005327154A (ja) 2004-05-17 2004-05-17 Htmlファイル処理方法及びプログラム

Country Status (2)

Country Link
US (1) US20050256836A1 (ja)
JP (1) JP2005327154A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011039668A (ja) * 2009-08-07 2011-02-24 Hitachi Ltd Webページの表示方法、計算機システム及びプログラム
JP2013186887A (ja) * 2012-12-05 2013-09-19 Murakumo Corp 情報処理装置、方法およびプログラム
JP2013186886A (ja) * 2012-12-05 2013-09-19 Murakumo Corp 情報処理装置、方法およびプログラム
WO2016047307A1 (ja) * 2014-09-26 2016-03-31 凸版印刷株式会社 コンテンツ作成装置、コンテンツ検査装置、コンテンツ作成方法及びコンテンツのデータ構造を含むコンピュータ可読媒体
JP2018045308A (ja) * 2016-09-12 2018-03-22 株式会社日立製作所 転送制御装置および転送制御方法
CN113051266A (zh) * 2019-12-27 2021-06-29 浙江大搜车软件技术有限公司 数据处理方法、装置、计算机可读存储介质和计算机设备

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8181107B2 (en) 2006-12-08 2012-05-15 Bytemobile, Inc. Content adaptation
US10095663B2 (en) 2012-11-14 2018-10-09 Amazon Technologies, Inc. Delivery and display of page previews during page retrieval events
US9729605B2 (en) * 2012-12-27 2017-08-08 Akamai Technologies Inc. Mechanism for distinguishing between content to be served through first or second delivery channels
US9563928B1 (en) 2014-05-22 2017-02-07 Amazon Technlogies, Inc. Bandwidth reduction through delivery of hardware-independent graphics commands for portions of content pages
US11169666B1 (en) 2014-05-22 2021-11-09 Amazon Technologies, Inc. Distributed content browsing system using transferred hardware-independent graphics commands
US10042521B1 (en) 2014-05-22 2018-08-07 Amazon Technologies, Inc. Emulation of control resources for use with converted content pages
US9922007B1 (en) 2014-05-22 2018-03-20 Amazon Technologies, Inc. Split browser architecture capable of determining whether to combine or split content layers based on the encoding of content within each layer
US9720888B1 (en) 2014-05-22 2017-08-01 Amazon Technologies, Inc. Distributed browsing architecture for the delivery of graphics commands to user devices for assembling a plurality of layers of a content page
US9563929B1 (en) 2014-05-22 2017-02-07 Amazon Technologies, Inc. Caching of content page layers
US20150347610A1 (en) * 2014-06-03 2015-12-03 KCura Corporation Methods and apparatus for modifying a plurality of markup language files
US9454515B1 (en) 2014-06-17 2016-09-27 Amazon Technologies, Inc. Content browser system using graphics commands and native text intelligence
US11070608B2 (en) 2015-06-17 2021-07-20 Fastly, Inc. Expedited sub-resource loading
CN111078219B (zh) * 2019-12-13 2023-10-03 北京金山云网络技术有限公司 页面显示方法、装置、***、电子设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5590317A (en) * 1992-05-27 1996-12-31 Hitachi, Ltd. Document information compression and retrieval system and document information registration and retrieval method
JP3859313B2 (ja) * 1997-08-05 2006-12-20 富士通株式会社 タグ文書の圧縮装置および復元装置,圧縮方法および復元方法,圧縮/復元装置および圧縮/復元方法並びに圧縮,復元もしくは圧縮/復元プログラムを記録したコンピュータ読み取り可能な記録媒体
US6635088B1 (en) * 1998-11-20 2003-10-21 International Business Machines Corporation Structured document and document type definition compression
US6604106B1 (en) * 1998-12-10 2003-08-05 International Business Machines Corporation Compression and delivery of web server content
US20020138526A1 (en) * 2001-03-20 2002-09-26 International Business Machines Corporation Javascript code optimizer
US20040215665A1 (en) * 2002-01-09 2004-10-28 Edgar David A. System, method, and computer program product for providing accelerated and secure wireless data transmission over the internet
CN100388269C (zh) * 2003-03-27 2008-05-14 国际商业机器公司 用于优化基于标签的协议流分析的***和方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011039668A (ja) * 2009-08-07 2011-02-24 Hitachi Ltd Webページの表示方法、計算機システム及びプログラム
JP2013186887A (ja) * 2012-12-05 2013-09-19 Murakumo Corp 情報処理装置、方法およびプログラム
JP2013186886A (ja) * 2012-12-05 2013-09-19 Murakumo Corp 情報処理装置、方法およびプログラム
WO2016047307A1 (ja) * 2014-09-26 2016-03-31 凸版印刷株式会社 コンテンツ作成装置、コンテンツ検査装置、コンテンツ作成方法及びコンテンツのデータ構造を含むコンピュータ可読媒体
JP2016071431A (ja) * 2014-09-26 2016-05-09 凸版印刷株式会社 コンテンツ作成装置、コンテンツ検査装置、コンテンツ作成方法及びコンテンツのデータ構造
CN106716427A (zh) * 2014-09-26 2017-05-24 凸版印刷株式会社 内容制作装置、内容检查装置、内容制作方法及包含内容的数据构造的计算机可读介质
US10747855B2 (en) 2014-09-26 2020-08-18 Toppan Printing Co., Ltd. Content generating device, content inspecting device, content generating method, and computer-readable medium including content data structure
JP2018045308A (ja) * 2016-09-12 2018-03-22 株式会社日立製作所 転送制御装置および転送制御方法
CN113051266A (zh) * 2019-12-27 2021-06-29 浙江大搜车软件技术有限公司 数据处理方法、装置、计算机可读存储介质和计算机设备

Also Published As

Publication number Publication date
US20050256836A1 (en) 2005-11-17

Similar Documents

Publication Publication Date Title
JP2005327154A (ja) Htmlファイル処理方法及びプログラム
JP4982455B2 (ja) モバイルウェブサービスシステムおよび方法
EP1641211B1 (en) Web server and method for dynamic content.
CN109981595B (zh) 一种资源获取方法、资源返回方法及服务器、存储介质
US10015226B2 (en) Methods for making AJAX web applications bookmarkable and crawlable and devices thereof
CN102882974B (zh) 一种通过网站识别版本号节省网站访问资源的方法
US20130262696A1 (en) Proxy server apparatus, client terminal apparatus, remote access system, transfer control method, access method, and recording medium
US8825756B2 (en) Server apparatus, information processing method, information processing program, and recording medium
CN107016074B (zh) 一种网页加载方法及装置
JP2005346734A (ja) コンテンツ提供方法
CN106817391A (zh) 文件断点续传方法和装置
CN102202100A (zh) 微浏览器处理网络数据的方法、微浏览器及其服务器
CN108512898A (zh) 文件推送方法、装置、计算机设备和存储介质
CN114282233A (zh) Web性能优化方法、装置、计算机设备和存储介质
JPWO2007088785A1 (ja) 個人情報の漏洩阻止装置・方法
CN114117498A (zh) 脱敏数据的实现方法、装置、***、设备及存储介质
JP2007079988A (ja) Wwwブラウザ、htmlページ共有システムおよびhtmlページ共有方法
JP6429467B2 (ja) マルチ大画面表示システム、表示端末及び配信サーバー
JP2004206406A (ja) Url情報の変換方法およびプログラム並びにコンテンツ配信方法
CN113515213A (zh) 一种光标形状同步方法、远程浏览***、设备及存储介质
JP2002342213A (ja) コンテンツ提供方法
JP2002342222A (ja) コンテンツ提供方法
US20060123109A1 (en) Method for processing HTTP requests and HTML pages transmitted or received by a navigator to or from at least one web server, and associated server
JP3851110B2 (ja) コンテンツ提供方法
US10176150B2 (en) Remotely providing fonts for an electronic document

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060726

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081224

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090428