JP4768951B2 - Web site analysis system - Google Patents

Web site analysis system Download PDF

Info

Publication number
JP4768951B2
JP4768951B2 JP2002144507A JP2002144507A JP4768951B2 JP 4768951 B2 JP4768951 B2 JP 4768951B2 JP 2002144507 A JP2002144507 A JP 2002144507A JP 2002144507 A JP2002144507 A JP 2002144507A JP 4768951 B2 JP4768951 B2 JP 4768951B2
Authority
JP
Japan
Prior art keywords
page
web
parent
website
web page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2002144507A
Other languages
Japanese (ja)
Other versions
JP2003337738A (en
Inventor
英樹 三井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2002144507A priority Critical patent/JP4768951B2/en
Publication of JP2003337738A publication Critical patent/JP2003337738A/en
Application granted granted Critical
Publication of JP4768951B2 publication Critical patent/JP4768951B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、Webサイトの構成を分析するWebサイト分析システムに関するものである。
【0002】
【従来の技術】
従来、Webサイト、即ち、ホームページの構成を分析するシステムとして、特開平10−207756号公報に開示された装置等が存在する。このホームページの構成を分析する装置によれば、まず、ホームページを構成するファイルをネットワークを介して取得し、取得されたファイルの形式を判断した後に、アンカータグやイメージタグ等が存在するか否かを判別している。次に、アンカータグやイメージタグの示すURL(Uniform Resource Locator)を分析することにより、該URLの示すホームページを検出し、更に、このホームページを検出することによりホームページ全体の構成を分析している。そして、分析されたホームページの構成を表示する際に、同一のWebページを複数回表示する場合には、同一のWebページであることを識別できるように表示している。
【0003】
また、ホームページの閲覧状況を分析するホームページ閲覧状況分析サーバが存在する(特開2002−24126号公報参照)。このホームページ閲覧状況分析サーバによれば、ホームページの閲覧状況を分析した結果をサムネイル画像を用いて表示している。
【0004】
【発明が解決しようとする課題】
ところで、既存のWebサイトにおいては、新たなWebページの追加及び新たなWebページの追加に伴う新たなリンクの設定が随時行われている。そのため、Webサイト内のあるWebページから複数の他のWebページにリンクが設けられ、更にリンク先のWebページからも複数の他のWebページへのリンクが設けられた状態となり、Webサイトの構成が複雑になっている。
【0005】
上述のように、Webサイトの分析は、Webサイト内に実際に設けられているリンクの経路を辿り、Webサイトを構成する各Webページ間のリンクの経路を分析することにより行われる。そして、分析の結果はWebサイト内の全てのリンク経路を示すことにより行われている。そのため、Webサイト全体がどのような構成になっているのかを視覚的に容易に把握することは、困難である。
【0006】
また、サムネイル画像を用いてWebサイトの閲覧状況を分析した結果を表示した場合には、実際に閲覧されたWebページのデザイン等を認識することはできるが、Webサイト全体がどのように構成されているのかを理解することは困難である。
【0007】
この発明の課題は、Webサイトの構成を分析し、Webサイト全体の構成を視覚的に容易に認識できるように表示するWebサイト分析システムを提供することである。
【0008】
【課題を解決するための手段】
請求項1記載のWebサイト分析システムは、Webサイトを構成するWebページのデータを記憶するWebサイトデータ記憶手段と、前記Webサイトデータ記憶手段に記憶されている前記Webページの中から、前記Webサイトのトップページを決定するトップページ決定手段と、前記トップページ決定手段により決定された前記トップページを起点としてリンクが設けられている前記Webページの全てのリンクの一覧を作成するリンク一覧作成手段と、前記リンク一覧作成手段により作成された前記リンクの一覧に含まれている前記Webページについて、前記トップページからのリンクの階層の深さに基づいて、前記Webページ毎に、当該Webページより前記リンクの階層が浅い一のWebページを親ページとして一義的に決定する親ページ決定手段と、前記Webサイトデータ記憶手段に記憶されている前記Webページのうち、前記トップページとして決定されず、前記リンクの一覧に含まれない孤立したWebページがあるか否か判断する孤立ページチェック手段と、前記孤立ページチェック手段により前記孤立したWebページが無いと判断された場合に、前記トップページを起点として、前記Webページ毎に決定された前記親ページに基づいて、前記Webページ毎の前記親ページとのリンク経路と共に前記Webページを階層構造で表示し、前記孤立したWebページが有ると判断された場合に、前記トップページ及び前記トップページ決定手段により前記孤立したWebページの中から決定されたトップページのそれぞれを起点として、前記Webページ毎に決定された前記親ページに基づいて、前記Webページ毎の前記親ページとのリンク経路と共に前記Webページを階層構造で表示する表示手段とを備えることを特徴とする。
【0009】
この請求項1記載のWebサイト分析システムによれば、トップページを起点としてリンクが設けられている各Webページについて、トップページからのリンクの階層の深さに基づいてWebページ毎に一義的に親ページを決定している。そして、決定された親ページに基づいて一つのWebページは一度だけ表示することによってWebサイト全体の構成を階層構造で表示している。従って、Webサイト全体の構成を視覚的に容易に把握できるように表示することができる。
【0010】
また、請求項2記載のWebサイト分析システムは、前記親ページ決定手段が、一のWebページが当該一のWebページよりリンク階層が浅い複数の階層のWebページとリンクされている場合、前記トップページからのリンクの階層が浅い方のWebページを前記親ページとして決定し、一のWebページが当該一のWebページよりリンク階層が浅く同一階層のWebページが複数存在する場合には、前記Webサイトの設計者により設定された仮想リンクに基づいて一のWebページを前記親ページとして決定することを特徴とする。
【0011】
この請求項2記載のWebサイト分析システムによれば、Webサイトの設計者によりWebサイトを閲覧したユーザをナビゲートする仮想の経路として設けられたリンク(仮想リンク)を優先して親ページを決定している。そのため、Webサイトの設計者の意図を尊重してWebサイトの分析を行うことができる。
【0012】
また、請求項3記載のWebサイト分析システムは、前記Webサイトデータ記憶手段が、前記Webサイトを構成する前記Webページを分類して記憶するWebページ記憶領域を備え、前記親ページ決定手段は、一のWebページが当該一のWebページよりリンク階層が浅い複数の階層のWebページとリンクされている場合、前記トップページからのリンクの階層が浅い方のWebページを前記親ページとして決定し、一のWebページが当該一のWebページよりリンク階層が浅く同一階層のWebページが複数存在する場合には、前記Webページ記憶領域に基づいて一のWebページを前記親ページとして決定することを特徴とする。
【0013】
この請求項3記載のWebサイト分析システムによれば、分類され、同一のWebページ記憶領域に記憶されているWebページを親ページとして決定している。従って、適切なWebページを一義的に親ページとして決定することができる。
【0014】
また、請求項4記載のWebサイト分析システムは、前記トップページ決定手段が、前記Webサイトの設計者による指定に基づいて前記トップページを決定することを特徴とする。
【0015】
この請求項4記載のWebサイト分析システムによれば、トップページとなるWebページがWebサイトの設計者により指定されている場合には、そのWebページをトップページとして決定している。そのため、Webサイトの設計者が意図したWebページをトップページとすることができる。
【0016】
また、請求項5記載のWebサイト分析システムは、前記トップページ決定手段が、前記Webページに付されている名称に基づいて前記トップページを決定することを特徴とする。
【0017】
この請求項5記載のWebサイト分析システムによれば、例えば、index.html等、通常、Webサイトを閲覧した場合に最初に表示されるWebページに付されている名称のWebページをトップページとして決定している。そのため、Webサイトを構成する複数のWebページの中から適切にトップページを決定することができる。
【0018】
また、請求項6記載のWebサイト分析システムは、前記表示手段が、前記親ページを表示する親ページ表示領域と、前記親ページ決定手段により親ページが決定されているWebページを、該親ページに対する子ページとして表示する子ページ表示領域とを備え、前記親ページに対する前記子ページが複数存在する場合には、前記子ページ表示領域において複数の前記子ページを等間隔で表示すると共に、前記親ページ表示領域において前記親ページを複数の前記子ページに対してほぼ中央に位置するように表示することを特徴とする。
【0019】
この請求項6記載のWebサイト分析システムによれば、いわゆるツリー構造で表示する場合には、複数の子ページは親ページに対して等間隔で表示し、親ページは複数の子ページに対してほぼ中央に表示される。また、同心円状に表示する場合には、複数の子ページは、親ページが表示されている位置の外側であり、かつ、親ページに対して同一の角度を有する位置に表示される。そのため、Webサイト内のWebページ間に設けられているリンクを視覚的に容易に理解できるようにWebサイト全体の構成を表示することができる。
【0020】
【発明の実施の形態】
以下、図面を参照して、この発明の実施の形態に係るWebサイト分析システムについて説明する。
【0021】
図1は、実施の形態に係るWebサイト分析システム2のブロック構成図である。図1に示すように、Webサイト分析システム2は、Webサイトの分析等の処理を行うデータ処理部4を備えている。このデータ処理部4には、Webサイトのデータ等を入力する入力部6、入力部6を介して入力されたWebサイトのデータを記憶するデータ記憶部8及びWebサイトの分析結果等を表示する表示部10が接続されている。
【0022】
データ記憶部8には、Webサイトのデータ、即ち、Webサイト分析システム2による分析対象となるWebサイト(ホームページ)を構成するWebページのデータが記憶されている。このWebページのデータは、通信制御装置等により構成される入力部6を介して入力される。即ち、Webサイトは、インターネットを介して公開されるWebページ群により構成されている。従って、Webサイトを構成する複数のWebページのデータがWebサイトのデータとしてデータ記憶部8に記憶される。
【0023】
ここで、Webサイト内のWebページは、原則的にリンクで連結され、互いに行き来できるように構成されている。即ち、インターネットを介してWebサイトを閲覧した場合に、最初に表示されるWebページ(トップページ)を起点として、Webサイトを構成する他のWebページを閲覧することができるようにリンクが設けられている。
【0024】
なお、リンクとは、Webページの文書内に埋め込まれた情報であり、他の文書や画像等のWebサイト内における位置を示す情報である。Webサイト内においては、Webページ上に表示されているリンクをマウス等のポインティングデバイスを用いて選択することにより、リンク先のWebページに移動することができる。
【0025】
また、リンクには、実リンクと仮想リンクが含まれる。即ち、Webページに実際に設けられている実リンクと、実リンクの中でWebサイトの設計者によりWebサイトを閲覧したユーザをナビゲートする経路を想定して設けられた仮想リンクの双方が含まれている。
【0026】
次に、図2のフローチャートを参照して、Webサイト分析システムによるWebサイトの分析処理について説明する。なお、以下においてはXML(eXtensibele Markup Language)により記述されているWebサイトの分析を行う場合を例として説明する。
【0027】
まず、データ記憶部8に記憶されているWebページの中でWebサイトのトップページを決定する(ステップS10)。即ち、Webサイトにアクセスした際に最初に表示されるWebページを、データ記憶部8に記憶されているWebページの名称を参照することによって決定する。
【0028】
ここで、通常、Webサイトのデータは、Webサイトを構成するWebページを分類し、ゾーン単位に記憶されている。ゾーンとは、Webページを分類・整理して記憶するための領域であり、HTML(Hyper Text Markup Language)でWebサイトが記述されている場合のフォルダに該当するものである。
【0029】
また、Webサイトのトップページは、Webページを分類して記憶している複数のゾーンのうち、最初のゾーン(トップゾーン)内に記憶されているWebページの中から、Webページに付されている名称を参照して決定される。なお、トップゾーン以外のゾーンにおいても、ゾーン内に記憶されているWebページの名前を参照してゾーン内のトップページが決定される。
【0030】
トップページの決定は、以下のように行われる。即ち、Webページの名称が、例えば、index.html、index.htm、default.html又はdefault.htm等となっている場合には、その名称が付されているWebページがトップページとして決定される。通常、Webサイトを設計する際には、トップページとするWebページにindex.html等を付すためである。また、index.html等が付されたWebページが存在しない場合であっても、001.html、a.html等の名称が付されているWebページが存在する場合には、そのWebページをトップページとする。更に、Webページに付されている名称を参照することによってトップページを決定することができない場合には、ゾーンの中で最初に定義されているWebページをトップページとする。
【0031】
また、Webサイトの設計者によりトップページが指定されている場合には、指定されたWebページがトップページとして決定される。即ち、Webサイトの設計者によりトップページが指定されている場合には、Webページに付されている名称に拘りなく、指定されているWebページがトップページとして決定される。
【0032】
次に、トップページを起点に、Webサイト内におけるWebページ間のリンクの一覧を作成する(ステップS11)。即ち、ステップS10において決定されたトップページを起点として実際に設けられている全てのリンクの一覧を作成する。
【0033】
次に、ステップS11において作成されたリンク一覧に基づいて、Webページ毎に親となるWebページを決定する(ステップS12)。即ち、トップページからのリンクの階層の深さに基づいてリンク先のWebページの親となるWebページ(親ページ)を決定する。なお、リンクの階層とは、トップページからリンク先のWebページに移動するまでに必要とされる移動回数を意味する。そのため、リンクの階層が深いとは、トップページからの移動回数が多いことを意味する。従って、複数のWebページからのリンクが設けられている場合には、トップページからの階層が浅い(移動回数が少ない)Webページを一義的に親ページとして決定する。
【0034】
図3及び図4は、親ページを決定する処理を説明するための図である。図3に示すWebサイトにおいては、ページ1がトップページであり、ページ1からページ2及びページ3にリンクが設けられている。また、ページ3からページ4にリンクが設けられており、更にページ2及びページ4からページ5にリンクが設けられている。この場合、ページ1はトップページであるため、ページ1の親ページは存在しない。また、ページ2の親ページとしてページ1、ページ3の親ページとしてページ1、ページ4の親ページとしてページ3がそれぞれ一義的に決定される。そして、ページ5の親ページとしてはページ2が一義的に決定される。
【0035】
ここで、ページ5は、ページ4からもリンクが設けられているが、ページ4は、ページ1からページ4に移動するまでにページ3を経由する必要が有る。一方、ページ2は、ページ1から直接移動することができる。従って、ページ2の方がページ4よりもリンクの階層が浅いWebページであるため、ページ5の親ページとしてページ2が一義的に決定される。
【0036】
ステップS12においてリンクの階層が同じWebページが複数存在し、同じ階層の複数のWebページが親ページとして決定された場合には(ステップS13)、親ページとして決定されたWebページの中から最適な親ページを決定する(ステップS14)。即ち、リンクの階層が同じであり、かつ、複数のWebページからリンクが設けられているWebページについても、一義的に親ページを決定すべく最適な親ページを一つ決定する。
【0037】
図4は、複数のWebページが同じ階層に存在しているために、複数のWebページが親ページとして決定されたWebサイトの一例を示す図である。この図4に示すように、ページ2及びページ3の双方ともページ1からの階層が等しく、ページ2及びページ3の双方からページ4にリンクが設けられている場合には、リンクの階層に基づいてページ2及びページ3が親ページとして決定されてしまう。従って、ページ2又はページ3の何れかをページ4の最適な親ページとして決定する。例えば、Webサイトの設計者によりページ2又はページ3からページ4への仮想リンクが設けられている場合には、仮想リンクが設けられているWebページが最適な親ページとして一義的に親ページが決定される。
【0038】
一方、仮想リンクが設けられていない場合には、同一のゾーン内に記憶されているWebページを親ページとして決定する。即ち、ページ2又はページ3の何れかがページ4と同一のゾーン内に記憶されている場合には、同一のゾーン内に記憶されているWebページが最適な親ページとして一義的に親ページが決定される。
【0039】
また、仮想リンクが設けられておらず、かつ、ページ2、ページ3及びページ4が同一のゾーン内に記憶されている場合には、同一のゾーン内のトップページとなっているWebページが最適な親ページとなり、一義的に親ページが決定される。
【0040】
上述のステップS11において作成されたリンク一覧におけるトップページからリンクが設けられている全てのWebページについて親ページが決定された場合には(ステップS15)、孤立しているWebページが存在するか否かの判断を行う(ステップS16)。即ち、ステップS11において作成されてリンク一覧に含まれていないWebページが、データ記憶部8に記憶されているWebページの中に存在するか否かの判断を行う。
【0041】
孤立しているWebページが複数存在する場合には(ステップS16)、この複数の孤立しているWebページ間に設けられているリンクの構成の分析を行う。即ち、まず、孤立しているWebページの中から、孤立しているWebページに付されている名称に基づいてトップページを決定する(ステップS10)。次に、決定されたトップページを起点とするリンク一覧を作成し(ステップS11)、ステップS12〜ステップS15の処理を行って各Webページについて一義的に親ページを決定する。
【0042】
なお、孤立しているWebページが一つ存在する場合には(ステップS16)、孤立しているWebページがそのままトップページとして決定され(ステップS10)、更に、孤立しているWebページが一つの場合にはリンクが存在しないためステップS17に進む。
【0043】
一方、孤立しているWebページが存在しない場合には(ステップS16)、Webサイトの分析結果に基づいてWebサイト全体の構成を表示部10に表示する(ステップS17)。即ち、トップページを起点とする階層構造により、Webサイト全体の構成を表示部10に表示する。
【0044】
図5は、表示部10に表示される分析されたWebサイト全体の構成の一例を示す図である。この図5に示すように、Webサイトのトップページ18からの階層が最も深いWebページ12a、12b、12c、12d、12eを一番下の階層に表示する。また、Webページ12a、12b、12c、12d、12eの親ページ14cを一つ上の階層に表示する。更に、14cの親ページ16bをその上の階層に更に、Webページ16bの親ページであるトップページ18をその上の階層に表示する。
【0045】
ここで、Webページ12a、12b、12c、12d、12eは、親ページ14cが表示されている階層の下の階層の表示領域、即ち、Webページ14cを親ページとする子ページを表示する子ページ表示領域において等間隔に表示される。また、親ページ14cは、Webページ12a、12b、12c、12d、12eが表示されている階層の上の階層の表示領域、即ち、親ページ表示領域において、Webページ12a、12b、12c、12d、12eが表示されている位置に対してほぼ中央に表示される。また、Webページ14a、14b、14c、14dは、親ページ16bが表示されている階層の下の階層の表示領域、即ち、Webページ16bを親ページとする子ページを表示する子ページ表示領域において等間隔に表示される。また、親ページ16bは、Webページ14a、14b、14c、14dが表示されている階層の上の階層の表示領域、即ち、親ページ表示領域において、Webページ14a、14b、14c、14dが表示されている位置に対してほぼ中央に表示される。更に、トップページ18は、Webページ16a、16b、16c、16dが表示されている階層の表示領域の上の階層の表示領域において、Webページ16a、16b、16c、16dが表示されている位置に対してほぼ中央に表示される。また、孤立しているページ20は、トップページ18と同じ階層の表示領域に表示される。このようにして、Webサイトを構成する全てのWebページを該当する階層に表示することにより、Webサイト全体の構成を階層構造により表示する。
【0046】
図6は、表示部10に表示される分析されたWebサイト全体の構成の他の例を示す図である。この図6に示すように、トップページを中心として、リンクの階層に基づく同心円状にWebサイトの構成が表示される。即ち、トップページを中心として、トップページからの移動回数に対応する同心円状の表示領域があり、各表示領域にその移動回数で到達することができるWebページを表示することによってWebサイト全体の構成が表示される。
【0047】
この場合には、最も外側の表示領域に表示されているWebページは、外側から2番目の表示領域に表示されている親ページに対して同一の角度の位置に表示される。更に、外側から2番目の表示領域に表示されているWebページは、外側から3番目の表示領域に表示されている親ページに対して同一の角度の位置に表示される。なお、複数の子ページが存在する場合には、それぞれの子ページが親ページに対して同一の角度を有する位置に表示される。このようにして、中心のトップページまでが表示される。
【0048】
この実施の形態に係るWebサイト分析システムによれば、トップページからのリンクの階層が浅いWebページを優先して各Webページについて一義的に親ページを決定し、トップページを起点とした階層構造によりWebサイト全体の構成を表示している。従って、Webサイト内の全てのリンク経路を示すことによりWebサイト全体の構成を表示する場合と異なり、一義的に親ページを決定することにより、Webサイト内のリンクの構成を視覚的に容易に理解できるようにWebサイト全体の構成を表示することができる。
【0049】
また、トップページを起点としたリンクに基づいて、トップページからの移動回数に対応する階層に各Webページを表示すると共に、下位の階層に表示されている複数のWebページの親ページは、複数のWebページに対してほぼ中央に位置するように上位の階層において表示している。従って、トップページから各Webページまでの階層の深さ及びWebサイトを構成するWebページ間のリンクの構成を視覚的に容易に理解できるようにWebサイト全体の構成を表示することができる。
【0050】
また、Webサイト全体の構成を容易に把握することができるため、Webサイトに関する経営判断の資料として用いることができる。例えば、Webサイトの中でリンクの階層が深くなりすぎている場合には、最下層のWebページを閲覧するためのユーザの通信負担が多くなってしまうことが容易に把握することができる。従って、Webサイトの構成が経営上好ましいか否か等を判断する資料として用いることができる。
【0051】
また、Webサイト全体の構成を視覚的に把握することができるため、Webサイトが適切に設計されているか否かを判断する際の資料として用いることができる。例えば、Webサイトのメンテナンスを適切に行うことができるのか否か、即ち、メンテナンスが容易に行えるように設計されているか、又は、メンテナンスが困難なWebページが存在しているか否か等を判断する際の資料として用いることができる。
【0052】
なお、上述の実施の形態に係るWebサイト分析システムにおいては、既存のWebサイトを分析する場合を例として説明しているが、設計途中のWebサイトの構成を確認するためにWebサイトの分析を行うようにしてもよい。即ち、Webサイトの設計途中において、設計されたWebサイトが設計者の意図したとおりに構成されているか否かを確認するために分析を行うようにしてもよい。
【0053】
また、上述の実施の形態に係るWebサイト分析システムにおいては、分析されたWebサイトの構成を表示しているが、Webサイトの閲覧状況を分析した結果を併せて表示するようにしてもよい。即ち、Webサイトを構成する各Webページに対するアクセスログを収集して集計し、集計結果を階層構造で表示されている各Webページに対応させて表示するようにしてもよい。
【0054】
また、Webサイトを閲覧したユーザが、Webサイト内でどのようにWebページ間を移動したかを分析するようにしてもよい。即ち、Webサイトを閲覧したユーザが辿ったWebサイト内のリンクの経路をWebサイトの構成に対応させて表示するようにしてもよい。この場合には、Webサイトの設計者が意図した通りにWebサイトを閲覧したユーザをナビゲートできたか否かを確認する際の資料として用いることができる。
【0055】
また、上述の実施の形態に係るWebサイト分析システムにおいては、WebサイトがXMLで記述されている場合を例としているが、HTML等その他の言語で記述されているWebサイトを分析するようにしてもよい。また、CGI(Common Gateway Interface)を用いたWebサイトや、動画を組み込んだWebサイト等、動的なWebサイトを分析するようにしてもよい。
【0056】
また、上述の実施の形態に係るWebサイト分析システムにおいては、同一の階層に複数のWebページが存在し、複数のWebページが親ページとして決定された場合には、仮想リンクが設けられているWebページを優先して一義的に親ページを決定しているが、同一のゾーン内に記憶されているWebページを優先して一義的に親ページを決定してもよい。また、仮想リンクとゾーンの何れを優先して一義的に親ページを決定するかを任意に指定するようにしてもよい。
【0057】
また、上述の実施の形態に係るWebサイト分析システムにおいては、Webサイトの設計者によるトップページの指定を優先してトップページを決定しているが、Webページの名称を優先してトップページを決定してもよい。また、Webサイトの設計者による指定とWebページの名称の何れを優先してトップページを決定するかを任意に指定するようにしてもよい。
【0058】
【発明の効果】
この発明によれば、Webサイトを構成するWebページ毎に、トップページを起点とするリンクについて、トップページからのリンクの階層の深さに基づいて一義的に親となるWebページを決定し、Webページ全体の構成を階層構造で表示している。従って、リンクが複雑になっているWebページであっても、Webサイト全体の構成を視覚的に容易に理解できるようにWebサイト全体の構成を表示することができる。
【図面の簡単な説明】
【図1】この発明の実施の形態に係るWebサイト分析システムのブロック構成図である。
【図2】この発明の実施の形態に係るWebサイトの分析処理を説明するためのフローチャートである。
【図3】この発明の実施の形態に係る親ページを決定する処理を説明するための図である。
【図4】この発明の実施の形態に係る最適な親ページを決定する処理を説明するための図である。
【図5】この発明の実施の形態に係る分析されたWebサイト全体の構成の表示の一例を示す図である。
【図6】この発明の実施の形態に係る分析されたWebサイト全体の構成の表示の他の例を示す図である。
【符号の説明】
2…Webサイト分析システム、4…データ処理部、6…入力部、8…データ記憶部、10…表示部。
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a website analysis system that analyzes the configuration of a website.
[0002]
[Prior art]
Conventionally, as a system for analyzing the configuration of a Web site, that is, a home page, there is an apparatus disclosed in JP-A-10-207756. According to the device for analyzing the configuration of this homepage, first, the files that make up the homepage are acquired via the network, and after determining the format of the acquired file, whether or not there are anchor tags, image tags, etc. Is determined. Next, by analyzing a URL (Uniform Resource Locator) indicated by an anchor tag or an image tag, a home page indicated by the URL is detected, and further, by detecting this home page, the configuration of the entire home page is analyzed. When the analyzed web page configuration is displayed, when the same Web page is displayed a plurality of times, it is displayed so that it can be identified as the same Web page.
[0003]
There is also a homepage browsing status analysis server that analyzes the browsing status of homepages (see Japanese Patent Application Laid-Open No. 2002-24126). According to the homepage browsing status analysis server, the result of analyzing the homepage browsing status is displayed using thumbnail images.
[0004]
[Problems to be solved by the invention]
By the way, in an existing website, a new web page is added and a new link is set as needed along with the addition of a new web page. Therefore, a link is provided from a certain web page in the website to a plurality of other web pages, and a link from the linked web page to a plurality of other web pages is also provided. Is complicated.
[0005]
As described above, the analysis of the website is performed by tracing the link path actually provided in the website and analyzing the link path between the web pages constituting the website. The result of the analysis is performed by showing all link paths in the Web site. Therefore, it is difficult to visually grasp how the entire website is configured.
[0006]
When the result of analyzing the browsing status of a website using thumbnail images is displayed, the design of the actually viewed web page can be recognized, but how the entire website is configured. It is difficult to understand what is.
[0007]
It is an object of the present invention to provide a website analysis system that analyzes the configuration of a website and displays the entire website configuration so that it can be easily recognized visually.
[0008]
[Means for Solving the Problems]
The website analysis system according to claim 1, wherein the website data storage means for storing data of a web page constituting the website, and the web page stored in the website data storage means Top page determination means for determining the top page of the site, and link list creation means for creating a list of all links of the Web page provided with links starting from the top page determined by the top page determination means And for each of the web pages, the web page included in the list of links created by the link list creation unit is based on the depth of the hierarchy of links from the top page. Unique web page with shallow link hierarchy as parent page Whether there is an isolated web page that is not determined as the top page and is not included in the list of links among the parent page determination means to be determined and the web pages stored in the website data storage means Based on the parent page determined for each Web page starting from the top page when the isolated page check means determines that there is no isolated Web page by the isolated page check means. The web page is displayed in a hierarchical structure together with the link path to the parent page for each web page. When it is determined that there is an isolated web page, the top page and the top page determined from the isolated web pages by the top page determining unit are used as starting points for each of the web pages. Based on the determined parent page, the Web page is displayed in a hierarchical structure together with a link path to the parent page for each Web page. And a display means.
[0009]
According to the Web site analysis system according to claim 1, each Web page provided with a link starting from the top page is uniquely determined for each Web page based on the depth of the link hierarchy from the top page. The parent page is determined. Then, one Web page is displayed only once based on the determined parent page, thereby displaying the configuration of the entire Web site in a hierarchical structure. Therefore, it is possible to display so that the configuration of the entire website can be easily grasped visually.
[0010]
Further, in the website analysis system according to claim 2, the parent page determination unit includes: When one web page is linked to a plurality of web pages having a lower link hierarchy than the one web page, a web page having a shallow link hierarchy from the top page is determined as the parent page; When one web page has a shallower link hierarchy than the one web page and there are multiple web pages of the same hierarchy, Based on the virtual link set by the website designer One web page as the parent page It is characterized by determining.
[0011]
According to the website analysis system according to claim 2, a parent page is determined with priority given to a link (virtual link) provided as a virtual route for navigating a user who has browsed the website by the website designer. is doing. Therefore, the website can be analyzed while respecting the intention of the website designer.
[0012]
The website analysis system according to claim 3, wherein the website data storage means includes a web page storage area for classifying and storing the web pages constituting the website, and the parent page determination means includes: When one web page is linked to a plurality of web pages having a lower link hierarchy than the one web page, a web page having a shallow link hierarchy from the top page is determined as the parent page; When one web page has a shallower link hierarchy than the one web page and there are multiple web pages of the same hierarchy, Based on the web page storage area One web page as the parent page It is characterized by determining.
[0013]
According to the Web site analysis system of the third aspect, the Web pages that are classified and stored in the same Web page storage area are determined as the parent page. Therefore, an appropriate Web page can be uniquely determined as a parent page.
[0014]
The Web site analysis system according to claim 4 is characterized in that the top page determining means determines the top page based on designation by a designer of the Web site.
[0015]
According to the Web site analysis system according to the fourth aspect, when the Web page to be the top page is designated by the Web site designer, the Web page is determined as the top page. Therefore, the Web page intended by the Web site designer can be set as the top page.
[0016]
The Web site analysis system according to claim 5 is characterized in that the top page determining means determines the top page based on a name given to the Web page.
[0017]
According to the Web site analysis system according to claim 5, for example, index. A web page having a name given to a web page that is first displayed when browsing a web site, such as html, is determined as a top page. Therefore, it is possible to appropriately determine the top page from among a plurality of Web pages constituting the Web site.
[0018]
The website analysis system according to claim 6, wherein the display unit displays a parent page display area in which the parent page is displayed and a Web page whose parent page is determined by the parent page determination unit. A child page display area displayed as a child page for the parent page, and when there are a plurality of child pages for the parent page, the plurality of child pages are displayed at equal intervals in the child page display area, and the parent page is displayed. In the page display area, the parent page is displayed so as to be positioned substantially in the center with respect to the plurality of child pages.
[0019]
According to the Web site analysis system according to claim 6, when displaying in a so-called tree structure, a plurality of child pages are displayed at equal intervals with respect to the parent page, and the parent page corresponds to a plurality of child pages. It is displayed at the center. When displaying concentrically, the plurality of child pages are displayed outside the position where the parent page is displayed and at the same angle with respect to the parent page. Therefore, the configuration of the entire website can be displayed so that the links provided between the web pages in the website can be easily visually understood.
[0020]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, a website analysis system according to an embodiment of the present invention will be described with reference to the drawings.
[0021]
FIG. 1 is a block diagram of a website analysis system 2 according to the embodiment. As shown in FIG. 1, the website analysis system 2 includes a data processing unit 4 that performs processes such as website analysis. The data processing unit 4 displays an input unit 6 for inputting website data and the like, a data storage unit 8 for storing website data input via the input unit 6, and an analysis result of the website. A display unit 10 is connected.
[0022]
The data storage unit 8 stores Web site data, that is, Web page data constituting a Web site (homepage) to be analyzed by the Web site analysis system 2. The web page data is input via the input unit 6 configured by a communication control device or the like. That is, the Web site is composed of a group of Web pages that are made public via the Internet. Accordingly, data of a plurality of Web pages constituting the Web site is stored in the data storage unit 8 as Web site data.
[0023]
Here, the Web pages in the Web site are connected by links in principle, and are configured to be able to go back and forth. In other words, when a website is browsed via the Internet, a link is provided so that other web pages constituting the website can be browsed starting from the first displayed web page (top page). ing.
[0024]
The link is information embedded in the document of the Web page, and is information indicating a position in the Web site such as another document or an image. In a Web site, a link displayed on a Web page can be selected using a pointing device such as a mouse to move to a linked Web page.
[0025]
The link includes a real link and a virtual link. That is, both the actual link actually provided on the Web page and the virtual link provided assuming a route for navigating the user who browsed the Web site by the Web site designer in the actual link are included. It is.
[0026]
Next, website analysis processing by the website analysis system will be described with reference to the flowchart of FIG. In the following description, an example of analyzing a website described in XML (extensible Markup Language) will be described.
[0027]
First, the top page of the website is determined among the web pages stored in the data storage unit 8 (step S10). That is, the Web page that is displayed first when accessing the Web site is determined by referring to the name of the Web page stored in the data storage unit 8.
[0028]
Here, normally, the data of the website is stored in units of zones by classifying the web pages constituting the website. A zone is an area for classifying, organizing and storing Web pages, and corresponds to a folder when a Web site is described in HTML (Hyper Text Markup Language).
[0029]
The top page of the website is attached to the web page from among the web pages stored in the first zone (top zone) among a plurality of zones in which the web pages are classified and stored. It is determined with reference to the name. Even in a zone other than the top zone, the top page in the zone is determined by referring to the name of the Web page stored in the zone.
[0030]
The top page is determined as follows. That is, the name of the Web page is, for example, index. html, index. htm, default. html or default. If it is htm or the like, the Web page with the name is determined as the top page. Normally, when designing a website, an index. This is to attach html or the like. Also, index. Even when there is no Web page with html etc., 001. html, a. If there is a web page with a name such as html, the web page is set as the top page. Further, when the top page cannot be determined by referring to the name given to the Web page, the first Web page defined in the zone is set as the top page.
[0031]
Further, when the top page is designated by the designer of the website, the designated web page is determined as the top page. That is, when the top page is designated by the designer of the website, the designated web page is determined as the top page regardless of the name given to the web page.
[0032]
Next, a list of links between Web pages in the Web site is created starting from the top page (step S11). That is, a list of all links actually provided starting from the top page determined in step S10 is created.
[0033]
Next, based on the link list created in step S11, the parent web page is determined for each web page (step S12). That is, the Web page (parent page) that is the parent of the linked Web page is determined based on the depth of the link hierarchy from the top page. The link hierarchy means the number of movements required before moving from the top page to the linked Web page. Therefore, a deep link hierarchy means that the number of movements from the top page is large. Therefore, when links from a plurality of Web pages are provided, the Web page having a shallow hierarchy from the top page (the number of movements is small) is uniquely determined as the parent page.
[0034]
3 and 4 are diagrams for explaining processing for determining a parent page. In the Web site shown in FIG. 3, page 1 is the top page, and links are provided from page 1 to page 2 and page 3. In addition, links are provided from page 3 to page 4, and links are provided from page 2 and page 4 to page 5. In this case, since page 1 is the top page, there is no parent page of page 1. Further, page 1 is uniquely determined as the parent page of page 2, page 1 as the parent page of page 3, and page 3 as the parent page of page 4. Then, page 2 is uniquely determined as the parent page of page 5.
[0035]
Here, page 5 is also provided with a link from page 4, but page 4 needs to go through page 3 before moving from page 1 to page 4. On the other hand, page 2 can be moved directly from page 1. Accordingly, since page 2 is a Web page having a shallower link hierarchy than page 4, page 2 is uniquely determined as the parent page of page 5.
[0036]
If there are a plurality of Web pages having the same link hierarchy in step S12 and a plurality of Web pages in the same hierarchy are determined as the parent page (step S13), the optimal Web page is determined from the Web pages determined as the parent page. A parent page is determined (step S14). That is, for a Web page having the same link hierarchy and links from a plurality of Web pages, one optimal parent page is determined to uniquely determine the parent page.
[0037]
FIG. 4 is a diagram illustrating an example of a Web site in which a plurality of Web pages are determined as parent pages because a plurality of Web pages exist in the same hierarchy. As shown in FIG. 4, when both page 2 and page 3 have the same hierarchy from page 1 and links are provided from both page 2 and page 3 to page 4, it is based on the link hierarchy. Thus, page 2 and page 3 are determined as parent pages. Therefore, either page 2 or page 3 is determined as the optimal parent page of page 4. For example, when a virtual link from page 2 or page 3 to page 4 is provided by the website designer, the web page provided with the virtual link is uniquely identified as the optimal parent page. It is determined.
[0038]
On the other hand, when the virtual link is not provided, the Web page stored in the same zone is determined as the parent page. That is, if either page 2 or page 3 is stored in the same zone as page 4, the web page stored in the same zone is uniquely identified as the optimal parent page. It is determined.
[0039]
If no virtual link is provided and page 2, page 3, and page 4 are stored in the same zone, the web page that is the top page in the same zone is optimal. The parent page is uniquely determined.
[0040]
If the parent page is determined for all Web pages provided with links from the top page in the link list created in Step S11 described above (Step S15), whether or not there is an isolated Web page. Is determined (step S16). That is, it is determined whether or not a Web page created in step S11 and not included in the link list exists in the Web page stored in the data storage unit 8.
[0041]
If there are a plurality of isolated Web pages (step S16), the configuration of the links provided between the plurality of isolated Web pages is analyzed. That is, first, a top page is determined based on the name given to the isolated Web page from the isolated Web pages (step S10). Next, a link list starting from the determined top page is created (step S11), and the processing of steps S12 to S15 is performed to uniquely determine the parent page for each web page.
[0042]
When there is one isolated web page (step S16), the isolated web page is determined as the top page as it is (step S10), and further, there is one isolated web page. In this case, since there is no link, the process proceeds to step S17.
[0043]
On the other hand, when there is no isolated web page (step S16), the entire configuration of the website is displayed on the display unit 10 based on the analysis result of the website (step S17). That is, the configuration of the entire website is displayed on the display unit 10 by a hierarchical structure starting from the top page.
[0044]
FIG. 5 is a diagram illustrating an example of the configuration of the entire analyzed website displayed on the display unit 10. As shown in FIG. 5, Web pages 12a, 12b, 12c, 12d, and 12e having the deepest hierarchy from the top page 18 of the website are displayed in the lowest hierarchy. In addition, the parent page 14c of the Web pages 12a, 12b, 12c, 12d, and 12e is displayed in the upper hierarchy. Furthermore, the parent page 16b of 14c is further displayed in the hierarchy above it, and the top page 18 which is the parent page of the Web page 16b is displayed in the hierarchy above it.
[0045]
Here, the Web pages 12a, 12b, 12c, 12d, and 12e are display areas below the hierarchy in which the parent page 14c is displayed, that is, child pages that display child pages that have the Web page 14c as a parent page. They are displayed at regular intervals in the display area. In addition, the parent page 14c is a display area above the hierarchy where the Web pages 12a, 12b, 12c, 12d, and 12e are displayed, that is, in the parent page display area, the Web pages 12a, 12b, 12c, 12d, 12e is displayed at substantially the center with respect to the displayed position. The Web pages 14a, 14b, 14c, and 14d are displayed in a display area below the hierarchy in which the parent page 16b is displayed, that is, in a child page display area that displays a child page having the Web page 16b as a parent page. Displayed at regular intervals. The parent page 16b displays the Web pages 14a, 14b, 14c, and 14d in the display area above the hierarchy where the Web pages 14a, 14b, 14c, and 14d are displayed, that is, the parent page display area. It is displayed in the middle of the current position. Further, the top page 18 is located at the position where the Web pages 16a, 16b, 16c, and 16d are displayed in the display area of the hierarchy above the display area of the hierarchy where the Web pages 16a, 16b, 16c, and 16d are displayed. On the other hand, it is displayed at the center. Further, the isolated page 20 is displayed in the display area of the same hierarchy as the top page 18. In this way, by displaying all the Web pages constituting the Web site in the corresponding hierarchy, the configuration of the entire Web site is displayed in a hierarchical structure.
[0046]
FIG. 6 is a diagram illustrating another example of the configuration of the entire analyzed website displayed on the display unit 10. As shown in FIG. 6, the configuration of the website is displayed concentrically based on the link hierarchy, with the top page as the center. That is, there is a concentric display area corresponding to the number of movements from the top page, centering on the top page, and the configuration of the entire website is displayed by displaying web pages that can be reached by the number of movements in each display area. Is displayed.
[0047]
In this case, the Web page displayed in the outermost display area is displayed at the same angle as the parent page displayed in the second display area from the outside. Further, the Web page displayed in the second display area from the outside is displayed at the same angle position with respect to the parent page displayed in the third display area from the outside. When there are a plurality of child pages, each child page is displayed at a position having the same angle with respect to the parent page. In this way, the center top page is displayed.
[0048]
According to the website analysis system according to this embodiment, a parent page is uniquely determined for each web page with priority given to a web page with a shallow link from the top page, and a hierarchical structure starting from the top page. Is used to display the configuration of the entire website. Therefore, unlike the case where the entire website configuration is displayed by showing all the link paths in the website, it is possible to visually easily configure the link configuration in the website by uniquely determining the parent page. The configuration of the entire website can be displayed so that it can be understood.
[0049]
In addition, each Web page is displayed in a hierarchy corresponding to the number of movements from the top page based on a link starting from the top page, and a plurality of parent pages of a plurality of Web pages displayed in a lower hierarchy are displayed. Are displayed in a higher hierarchy so as to be positioned substantially in the center of the Web page. Therefore, it is possible to display the configuration of the entire Web site so that the depth of the hierarchy from the top page to each Web page and the configuration of the links between Web pages constituting the Web site can be easily understood visually.
[0050]
In addition, since the entire configuration of the website can be easily grasped, it can be used as a material for management judgment regarding the website. For example, when the link hierarchy is too deep in the website, it can be easily understood that the communication burden on the user for browsing the web page at the lowest level is increased. Therefore, it can be used as a material for determining whether or not the configuration of the Web site is favorable for management.
[0051]
Further, since the entire configuration of the website can be visually grasped, it can be used as a material for determining whether or not the website is appropriately designed. For example, it is determined whether or not maintenance of a website can be performed properly, that is, whether or not there is a web page that is designed to be easily maintained or difficult to maintain. It can be used as a reference material.
[0052]
In the website analysis system according to the above-described embodiment, the case of analyzing an existing website has been described as an example. However, in order to confirm the configuration of the website being designed, the website analysis is performed. You may make it perform. In other words, during the design of the website, an analysis may be performed to confirm whether the designed website is configured as intended by the designer.
[0053]
Further, in the website analysis system according to the above-described embodiment, the configuration of the analyzed website is displayed. However, the analysis result of the browsing status of the website may be displayed together. That is, the access logs for each Web page constituting the Web site may be collected and totaled, and the totaled result may be displayed in correspondence with each Web page displayed in a hierarchical structure.
[0054]
Moreover, you may make it analyze how the user who browsed the web site moved between web pages within the web site. That is, the link route in the website followed by the user who browsed the website may be displayed corresponding to the configuration of the website. In this case, it can be used as a material for confirming whether or not the user who browsed the website has been navigated as intended by the designer of the website.
[0055]
Further, in the website analysis system according to the above-described embodiment, the case where the website is described in XML is taken as an example. However, the website described in other languages such as HTML is analyzed. Also good. Further, a dynamic website such as a website using CGI (Common Gateway Interface) or a website incorporating a moving image may be analyzed.
[0056]
In the website analysis system according to the above-described embodiment, a plurality of web pages exist in the same hierarchy, and a virtual link is provided when a plurality of web pages are determined as parent pages. Although the parent page is uniquely determined with priority on the Web page, the parent page may be uniquely determined with priority on the Web page stored in the same zone. In addition, it may be arbitrarily specified which of the virtual link and the zone is given priority and the parent page is uniquely determined.
[0057]
Further, in the website analysis system according to the above-described embodiment, the top page is determined with priority given to the designation of the top page by the website designer, but the top page is given priority over the name of the web page. You may decide. In addition, it may be arbitrarily designated which of the designation by the website designer and the name of the web page is to be given priority.
[0058]
【The invention's effect】
According to this invention, for each Web page constituting the Web site, for the link starting from the top page, the Web page that is the parent is uniquely determined based on the depth of the link hierarchy from the top page, The configuration of the entire Web page is displayed in a hierarchical structure. Therefore, even for a Web page with complicated links, the configuration of the entire Web site can be displayed so that the configuration of the entire Web site can be easily understood visually.
[Brief description of the drawings]
FIG. 1 is a block configuration diagram of a website analysis system according to an embodiment of the present invention.
FIG. 2 is a flowchart for explaining Web site analysis processing according to the embodiment of the present invention;
FIG. 3 is a diagram for explaining processing for determining a parent page according to the embodiment of the present invention;
FIG. 4 is a diagram for explaining processing for determining an optimal parent page according to the embodiment of the present invention;
FIG. 5 is a diagram showing an example of a display of the configuration of the entire analyzed website according to the embodiment of the present invention.
FIG. 6 is a view showing another example of the display of the configuration of the entire analyzed website according to the embodiment of the present invention.
[Explanation of symbols]
2 ... Web site analysis system, 4 ... data processing unit, 6 ... input unit, 8 ... data storage unit, 10 ... display unit.

Claims (6)

Webサイトを構成するWebページのデータを記憶するWebサイトデータ記憶手段と、
前記Webサイトデータ記憶手段に記憶されている前記Webページの中から、前記Webサイトのトップページを決定するトップページ決定手段と、
前記トップページ決定手段により決定された前記トップページを起点としてリンクが設けられている前記Webページの全てのリンクの一覧を作成するリンク一覧作成手段と、
前記リンク一覧作成手段により作成された前記リンクの一覧に含まれている前記Webページについて、前記トップページからのリンクの階層の深さに基づいて、前記Webページ毎に、当該Webページより前記リンクの階層が浅い一のWebページを親ページとして一義的に決定する親ページ決定手段と、
前記Webサイトデータ記憶手段に記憶されている前記Webページのうち、前記トップページとして決定されず、前記リンクの一覧に含まれない孤立したWebページがあるか否か判断する孤立ページチェック手段と、
前記孤立ページチェック手段により前記孤立したWebページが無いと判断された場合に、前記トップページを起点として、前記Webページ毎に決定された前記親ページに基づいて、前記Webページ毎の前記親ページとのリンク経路と共に前記Webページを階層構造で表示し、前記孤立したWebページが有ると判断された場合に、前記トップページ及び前記トップページ決定手段により前記孤立したWebページの中から決定されたトップページのそれぞれを起点として、前記Webページ毎に決定された前記親ページに基づいて、前記Webページ毎の前記親ページとのリンク経路と共に前記Webページを階層構造で表示する表示手段と
を備えることを特徴とするWebサイト分析システム。
Web site data storage means for storing data of Web pages constituting the Web site;
Top page determining means for determining a top page of the website from the web pages stored in the website data storage means;
A link list creating means for creating a list of all links of the web page provided with links starting from the top page determined by the top page determining means;
With respect to the Web page included in the list of links created by the link list creating means, the link from the Web page for each Web page based on the depth of the link hierarchy from the top page. A parent page determining means for uniquely determining one web page having a shallow hierarchy as a parent page;
An isolated page check unit that determines whether there is an isolated Web page that is not determined as the top page among the Web pages stored in the Web site data storage unit and is not included in the list of links;
The parent page for each Web page based on the parent page determined for each Web page starting from the top page when the isolated page check means determines that there is no isolated Web page When the web page is displayed in a hierarchical structure together with the link path to and the isolated web page is determined to be present, the top page and the top page determining means determine the web page from the isolated web pages. Display means for displaying the web page in a hierarchical structure together with a link path to the parent page for each web page based on the parent page determined for each web page starting from each top page A website analysis system characterized by this.
前記親ページ決定手段は、一のWebページが当該一のWebページよりリンク階層が浅い複数の階層のWebページとリンクされている場合、前記トップページからのリンクの階層が浅い方のWebページを前記親ページとして決定し、一のWebページが当該一のWebページよりリンク階層が浅く同一階層のWebページが複数存在する場合には、前記Webサイトの設計者により設定された仮想リンクに基づいて一のWebページを前記親ページとして決定することを特徴とする請求項1記載のWebサイト分析システム。  When the one web page is linked to a plurality of web pages having a lower link hierarchy than the one web page, the parent page determination unit selects a web page having a shallow link hierarchy from the top page. If the web page is determined as the parent page, and there is a plurality of web pages with the same hierarchy and a single web page that is shallower than the one web page, based on the virtual link set by the website designer The Web site analysis system according to claim 1, wherein one Web page is determined as the parent page. 前記Webサイトデータ記憶手段は、前記Webサイトを構成する前記Webページを分類して記憶するWebページ記憶領域を備え、
前記親ページ決定手段は、一のWebページが当該一のWebページよりリンク階層が浅い複数の階層のWebページとリンクされている場合、前記トップページからのリンクの階層が浅い方のWebページを前記親ページとして決定し、一のWebページが当該一のWebページよりリンク階層が浅く同一階層のWebページが複数存在する場合には、前記Webページ記憶領域に基づいて一のWebページを前記親ページとして決定することを特徴とする請求項1記載のWebサイト分析システム。
The website data storage means includes a web page storage area for classifying and storing the web pages constituting the website.
When the one web page is linked to a plurality of web pages having a lower link hierarchy than the one web page, the parent page determination unit selects a web page having a shallow link hierarchy from the top page. When the web page is determined as the parent page, and there is a plurality of web pages of the same hierarchy that have a shallower link hierarchy than the one web page, the one web page is assigned to the parent page based on the web page storage area The Web site analysis system according to claim 1, wherein the Web site analysis system is determined as a page.
前記トップページ決定手段は、前記Webサイトの設計者による指定に基づいて前記トップページを決定することを特徴とする請求項1〜請求項3の何れか一項に記載のWebサイト分析システム。  The website analysis system according to any one of claims 1 to 3, wherein the top page determination unit determines the top page based on designation by a designer of the website. 前記トップページ決定手段は、前記Webページに付されている名称に基づいて前記トップページを決定することを特徴とする請求項1〜請求項3の何れか一項に記載のWebサイト分析システム。  4. The website analysis system according to claim 1, wherein the top page determination unit determines the top page based on a name given to the Web page. 5. 前記表示手段は、前記親ページを表示する親ページ表示領域と、
前記親ページ決定手段により親ページが決定されているWebページを、該親ページに対する子ページとして表示する子ページ表示領域とを備え、
前記親ページに対する前記子ページが複数存在する場合には、前記子ページ表示領域において複数の前記子ページを等間隔で表示すると共に、前記親ページ表示領域において前記親ページを複数の前記子ページに対してほぼ中央に位置するように表示することを特徴とする請求項1〜請求項5の何れか一項に記載のWebサイト分析システム。
The display means includes a parent page display area for displaying the parent page;
A child page display area for displaying a web page whose parent page is determined by the parent page determination means as a child page for the parent page;
When there are a plurality of child pages for the parent page, the plurality of child pages are displayed at equal intervals in the child page display area, and the parent page is displayed as a plurality of child pages in the parent page display area. The Web site analysis system according to any one of claims 1 to 5, wherein the Web site analysis system is displayed so as to be positioned substantially at the center.
JP2002144507A 2002-05-20 2002-05-20 Web site analysis system Expired - Lifetime JP4768951B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002144507A JP4768951B2 (en) 2002-05-20 2002-05-20 Web site analysis system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002144507A JP4768951B2 (en) 2002-05-20 2002-05-20 Web site analysis system

Publications (2)

Publication Number Publication Date
JP2003337738A JP2003337738A (en) 2003-11-28
JP4768951B2 true JP4768951B2 (en) 2011-09-07

Family

ID=29704160

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002144507A Expired - Lifetime JP4768951B2 (en) 2002-05-20 2002-05-20 Web site analysis system

Country Status (1)

Country Link
JP (1) JP4768951B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101235139B1 (en) * 2012-05-29 2013-02-20 주식회사 비바엔에스 Detection method and system, the internal structure website

Also Published As

Publication number Publication date
JP2003337738A (en) 2003-11-28

Similar Documents

Publication Publication Date Title
JP4756953B2 (en) Information search apparatus and information search method
Chi et al. The scent of a site: A system for analyzing and predicting information scent, usage, and usability of a web site
US8694680B2 (en) Methods and apparatus for enabling use of web content on various types of devices
US9652441B2 (en) System and method for creation of templates
KR100572576B1 (en) Extraction of information from structured documents
US20080184138A1 (en) System, method and apparatus for selecting content from web sources and posting content to web logs
US20080098310A1 (en) System for displaying and managing information on webpage using indicator
KR20080064945A (en) Simultaneously spawning multiple searches across multiple providers
JP2005157965A (en) Apparatus and method for creating document link structure information
WO2011049641A1 (en) A method and apparatus of generating internet navigation page
Andronico et al. Improving search engine interfaces for blind users: a case study
WO2008002108A1 (en) A method of managing web services using integrated document
US20050149853A1 (en) Document display program and method
KR20120029013A (en) Host apparatus and web content display method thereof
CN112612990A (en) Webpage analysis method, system and computer readable storage medium
JP4768951B2 (en) Web site analysis system
JP2009539171A (en) Method and apparatus for providing additional information using tabs corresponding to questions
JP5049880B2 (en) Information processing device
JP2012145970A (en) Portlet support system, apparatus, method and program
KR100261265B1 (en) Apparatus for making a web document and method of operating it
Stouffs Visualizing information structures and its impact on project teams: an information architecture for the virtual AEC company
Leporini Google news: how user-friendly is it for the blind?
JP2005071164A (en) Bookmark management method
JP4382451B2 (en) Hypertext correction system and method
WO2003091906A1 (en) Document display program and document display method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050315

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060207

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080603

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080801

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080916

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081105

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090113

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20090227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110511

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110617

R150 Certificate of patent or registration of utility model

Ref document number: 4768951

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140624

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term