JP2008071116A - Information delivery system, information delivery device, information delivery method and information delivery program - Google Patents
Information delivery system, information delivery device, information delivery method and information delivery program Download PDFInfo
- Publication number
- JP2008071116A JP2008071116A JP2006249264A JP2006249264A JP2008071116A JP 2008071116 A JP2008071116 A JP 2008071116A JP 2006249264 A JP2006249264 A JP 2006249264A JP 2006249264 A JP2006249264 A JP 2006249264A JP 2008071116 A JP2008071116 A JP 2008071116A
- Authority
- JP
- Japan
- Prior art keywords
- web page
- information
- update
- update information
- uri
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
Description
本発明は、情報配信システム、情報配信装置、情報配信方法および情報配信用プログラムに関し、特に、更新情報を配信できる情報配信システム、情報配信装置、情報配信方法および情報配信用プログラムに関する。 The present invention relates to an information distribution system, an information distribution apparatus, an information distribution method, and an information distribution program, and more particularly to an information distribution system, an information distribution apparatus, an information distribution method, and an information distribution program that can distribute update information.
従来の情報配信システムは、ユーザがWebページ(以下、ウェブページとも言う。)の更新の有無を把握できるようにするため、特許文献1や特許文献2に記載されているように、システムがWebページの更新の有無を予め設定された条件に照らして検出し、ユーザに通知していた。
In the conventional information distribution system, as described in Patent Document 1 and
また、ユーザがWebページの更新情報を取得できるようにするため、非特許文献1で開示されているように、RSS(RDF Site Summery)という形式でWebページ提供者が更新情報を作成し、配信する方法も見られる。 In addition, in order to allow the user to acquire update information on the Web page, as disclosed in Non-Patent Document 1, the Web page provider creates update information in the form of RSS (RDF Site Summery) and distributes it. You can also see how to do it.
さらに、ユーザがWebページの更新情報のみを取得して通信費を抑制できるようにするため、特許文献3に記載されているように、システムがWebページの指定された情報のみをその情報が更新された時にユーザに配信したり、特許文献4に記載されているように、システムが多様なWebページの更新情報を抽出し所定の形式に生成の上、ユーザに配信する方法も考えられている。 Furthermore, in order to allow the user to acquire only the update information of the Web page and reduce the communication cost, as described in Patent Document 3, the system updates only the specified information of the Web page. As described in Japanese Patent Application Laid-Open No. 2004-133620, a method is also conceivable in which the system extracts update information of various Web pages, generates them in a predetermined format, and distributes them to the users. .
特許文献1に記載されているシステムでは、複数のデータ変動タイプに分類し、データ変動タイプを用いて通知条件を設定して、不必要な更新通知を受けないようにすることができる。しかしながら、特許文献1に記載されているシステムでは、何についての情報が更新されたか等は示されず、数多くの更新情報が通知されれば、やはりユーザに無駄な閲覧作業を強いることになってしまう。 In the system described in Patent Document 1, it is possible to categorize into a plurality of data variation types and set notification conditions using the data variation types so that unnecessary update notifications are not received. However, the system described in Patent Document 1 does not indicate what information has been updated, and if a large amount of update information is notified, the user is forced to perform useless browsing work. .
また、特許文献2に記載されているシステムでは、項目を指定することでユーザが関心のある項目についてのみ更新情報を通知することができるが、各項目の領域などをユーザに指定させる手間がかかってしまう。また、ユーザが複数の項目を指定した場合には、結局元のWebページを改めて閲覧しなければ何についての情報が更新されたかを確認することができない。なお、何についての情報が更新されたかが示されない点では、特許文献3に記載されているシステムも同様である。
Further, in the system described in
また、特許文献4に記載されているシステムでは、ユーザが設定することで、更新通知の対象となるWebページのURLの各々、または1まとまりにタイトルを設定することで識別を容易にすることができると記載されているが、ユーザに設定させる手間がかかってしまう。また、URLを単位にタイトルをつけただけでは、多くのWebページに見られるように、複数のフレームにより1ページが構成されているような場合には、やはり何についての情報が更新されたかがわからないことになる。 Further, in the system described in Patent Document 4, identification is facilitated by setting a title for each or a set of URLs of a Web page that is a target of update notification when set by a user. Although it is described that it can be done, it takes time and effort for the user to set. In addition, if only a title is given in units of URLs, as is seen in many Web pages, when one page is composed of a plurality of frames, it is not possible to know what information has been updated. It will be.
また、非特許文献1で開示されているRSSを用いた場合には、Webページ提供者側に、RSS形式で更新情報を作成させ、公開させる手間が必要となる。 In addition, when RSS disclosed in Non-Patent Document 1 is used, it is necessary for the Web page provider side to create and release update information in the RSS format.
このように、従来技術の問題点は、Webページ提供者やユーザからの特段の支援なくWebページの更新情報を抽出・配信する情報配信システムにおいて、更新情報を分かりやすく提供できないことである。その理由は、従来の情報配信システムでは更新情報の適度な周辺情報が提供されないためである。更新情報の前後一定文字を併せて提供する方法もあるが、加減がWebページに依存するため難しい。 As described above, the problem with the prior art is that update information cannot be provided in an easy-to-understand manner in an information distribution system that extracts and distributes Web page update information without special support from Web page providers and users. This is because the conventional information distribution system does not provide appropriate peripheral information of the update information. There is a method of providing a fixed character before and after the update information, but it is difficult because it depends on the Web page.
そこで、本発明の目的は、Webページ提供者やユーザからの特段の支援なくWebページの更新情報を分かりやすく提供できるようにすることである。 Accordingly, an object of the present invention is to provide update information of a Web page in an easy-to-understand manner without special support from a Web page provider or a user.
本発明による情報配信システムは、ウェブページの更新された情報を示す更新情報を配信する情報配信システムであって、更新情報に、意味的に関連する情報を掲載しているウェブページの画面上の領域の単位であるセクションであって、更新情報を含むセクションを示す情報を付加した配信用更新情報を生成することを特徴とする。 An information distribution system according to the present invention is an information distribution system that distributes update information indicating updated information of a web page, on the screen of a web page in which information that is semantically related to the update information is posted. Distribution update information is generated by adding information indicating a section that is a unit of an area and that includes the update information.
また、情報配信システムは、直近複数時点のウェブページデータを比較して更新情報を抽出する更新情報抽出手段(例えば、更新情報抽出手段22)と、ウェブページデータに基づいて、ウェブページのレイアウトを解析し、セクションを抽出するレイアウト解析手段(例えば、レイアウト解析手段23)と、更新情報抽出手段で抽出された更新情報を含むレイアウト解析手段で抽出されたセクションを、更新セクションとして抽出する更新セクション抽出手段(例えば、更新セクション抽出手段24)と、更新情報抽出手段で抽出された更新情報に、更新セクション抽出手段が抽出した更新セクションを示す情報を付加した配信用更新情報を生成する更新情報整形手段(例えば、更新情報整形手段25)とを備えていてもよい。 In addition, the information distribution system compares the web page data at the most recent time points and extracts update information (for example, the update information extraction unit 22), and the layout of the web page based on the web page data. Update section extraction that extracts a section extracted by a layout analysis unit (for example, layout analysis unit 23) that analyzes and extracts a section, and a section that is extracted by the layout analysis unit that includes update information extracted by the update information extraction unit. Means (for example, update section extraction means 24), and update information shaping means for generating update information for distribution by adding information indicating the update section extracted by the update section extraction means to the update information extracted by the update information extraction means (For example, update information shaping means 25).
また、情報配信システムは、ユーザを識別するためのユーザ識別情報と、ユーザが指定したURIと、URIで特定されるウェブページのウェブページデータと、ウェブページデータの取得時間とを対応づけて記憶するウェブページ記憶手段(例えば、Webページ記憶部31)を備え、更新抽出手段は、指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近複数時点のウェブページデータを比較し、レイアウト解析手段は、指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近のウェブページデータに基づいて、ウェブページのレイアウトを解析してもよい。 The information distribution system stores user identification information for identifying the user, a URI specified by the user, web page data of the web page specified by the URI, and acquisition time of the web page data in association with each other. Web page storage means (for example, a web page storage unit 31), and the update extraction means includes webs at a plurality of points in time nearest to the web page specified by the designated URI stored in association with the designated user identification information. Comparing the page data, the layout analysis means analyzes the layout of the web page based on the latest web page data of the web page specified by the designated URI stored in association with the designated user identification information. May be.
また、情報配信システムは、ユーザ識別子と、ユーザ識別子で識別されるユーザが指定したURIとを対応づけて記憶するURI記憶手段(例えば、URI記憶部32)と、指定のURIで特定されるウェブページのウェブページデータを取得するウェブページデータ取得手段(例えば、Webページ取得手段21)と、定期的に、ウェブページデータ取得手段に、URI記憶手段に記憶されているURIで特定されるウェブページのウェブページデータを取得させ、取得時間とユーザ識別子と対応づけてウェブページ記憶手段に記憶させる定期実行制御手段(例えば、定期実行制御手段28)とを備えていてもよい。 In addition, the information distribution system includes a URI storage unit (for example, a URI storage unit 32) that stores a user identifier and a URI specified by the user identified by the user identifier in association with each other, and a web specified by the specified URI. Web page data acquisition means (for example, web page acquisition means 21) for acquiring the web page data of the page, and a web page specified by the URI stored in the URI storage means in the web page data acquisition means periodically. Periodic execution control means (for example, periodic execution control means 28) for acquiring the web page data and storing it in the web page storage means in association with the acquisition time and the user identifier.
また、更新情報抽出手段は、更新時刻をも抽出し、更新情報整形生成手段は、更新情報抽出手段によって抽出された更新情報に、更新時刻をさらに付加した配信用更新情報を生成してもよい。 The update information extraction unit may also extract the update time, and the update information shaping generation unit may generate distribution update information in which the update time is further added to the update information extracted by the update information extraction unit. .
また、更新情報整形手段は、配信用更新情報を更新時刻順に配列させて生成してもよい。 Further, the update information shaping means may generate the update information for distribution by arranging in order of update time.
また、本発明による情報配信装置は、ウェブページの更新された情報を示す更新情報を配信する情報配信システムに適用される情報配信装置であって、直近複数時点のウェブページデータを比較して更新情報を抽出する更新情報抽出手段と、ウェブページデータに基づいて、ウェブページのレイアウトを解析し、セクションを抽出するレイアウト解析手段と、更新情報抽出手段で抽出された更新情報を含むレイアウト解析手段で抽出されたセクションを、更新セクションとして抽出する更新セクション抽出手段と、更新情報抽出手段で抽出された更新情報に、更新セクション抽出手段が抽出した更新セクションを示す情報を付加した配信用更新情報を生成する更新情報整形手段とを備えたことを特徴とする。 An information distribution apparatus according to the present invention is an information distribution apparatus applied to an information distribution system that distributes update information indicating updated information of a web page, and compares and updates web page data at the most recent time points. Update information extraction means for extracting information, layout analysis means for analyzing the layout of the web page based on the web page data, extracting sections, and layout analysis means including update information extracted by the update information extraction means Update section extraction means for extracting the extracted section as an update section, and update information for distribution is generated by adding the information indicating the update section extracted by the update section extraction means to the update information extracted by the update information extraction means Update information shaping means.
また、本発明による情報配信方法は、ウェブページの更新された情報を示す更新情報を配信する情報配信方法であって、直近複数時点のウェブページデータを比較して更新情報を抽出し、ウェブページデータに基づいて、ウェブページのレイアウトを解析し、セクションを抽出し、抽出された更新情報を含むセクションを、更新セクションとして抽出し、抽出された更新情報に、更新セクションを示す情報を付加した配信用更新情報を生成することを特徴とする。 An information distribution method according to the present invention is an information distribution method for distributing update information indicating updated information of a web page, comparing the web page data at the most recent time points, extracting the update information, Based on the data, analyze the layout of the web page, extract the sections, extract the sections containing the extracted update information as update sections, and add the information indicating the update section to the extracted update information Update information is generated.
また、ユーザを識別するためのユーザ識別情報と、ユーザが指定したURIと、URIで特定されるウェブページのウェブページデータと、ウェブページデータの取得時間とを対応づけて記憶し、指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近複数時点のウェブページデータを比較して更新情報を抽出し、指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近のウェブページデータに基づいて、ウェブページのレイアウトを解析してもよい。 Further, the user identification information for identifying the user, the URI designated by the user, the web page data of the web page specified by the URI, and the acquisition time of the web page data are stored in association with each other. The update information is extracted by comparing the web page data at the most recent time points of the web page specified by the designated URI stored in association with the identification information, and stored in association with the designated user identification information. The layout of the web page may be analyzed based on the latest web page data of the web page specified by the designated URI.
また、ユーザ識別子と、ユーザ識別子で識別されるユーザが指定したURIとを対応づけて記憶し、定期的に、ウェブページデータ取得手段に、URI記憶手段に記憶されているURIで特定されるウェブページのウェブページデータを取得し、取得時間とユーザ識別子と対応づけて記憶させてもよい。 Further, a user identifier and a URI specified by the user identified by the user identifier are stored in association with each other, and periodically specified by the URI stored in the URI storage unit in the web page data acquisition unit. The web page data of the page may be acquired and stored in association with the acquisition time and the user identifier.
また、更新情報の抽出において更新時刻をも抽出し、抽出された更新情報に、更新時刻をさらに付加した配信用更新情報を生成してもよい。 In addition, the update time may also be extracted in the update information extraction, and distribution update information in which the update time is further added to the extracted update information may be generated.
また、配信用更新情報の生成において、更新情報を更新時刻順に配列させてもよい。 Further, in the generation of distribution update information, the update information may be arranged in order of update time.
また、本発明による情報配信用プログラムは、ウェブページの更新された情報を示す更新情報を配信するための情報配信用プログラムであって、コンピュータに、直近複数時点のウェブページデータを比較して更新情報を抽出する処理、ウェブページデータに基づいて、ウェブページのレイアウトを解析し、セクションを抽出する処理、抽出された更新情報を含むセクションを、更新セクションとして抽出する処理、および抽出された更新情報に、更新セクションを示す情報を付加した配信用更新情報を生成する処理を実行させることを特徴とする。 An information distribution program according to the present invention is an information distribution program for distributing update information indicating updated information of a web page, and updates the computer by comparing the web page data at the most recent time points with a computer. Processing for extracting information, processing for analyzing the layout of a web page based on web page data, extracting a section, processing for extracting a section including extracted update information as an update section, and extracted update information In addition, a process of generating update information for distribution to which information indicating an update section is added is executed.
また、コンピュータに、ユーザを識別するためのユーザ識別情報と、ユーザが指定したURIと、URIで特定されるウェブページのウェブページデータと、ウェブページデータの取得時間とを対応づけて記憶装置に記憶させる処理、指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近複数時点のウェブページデータを比較して更新情報を抽出する処理、および指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近のウェブページデータに基づいて、ウェブページのレイアウトを解析する処理を実行させてもよい。 Also, the user identification information for identifying the user, the URI designated by the user, the web page data of the web page specified by the URI, and the acquisition time of the web page data are associated with the computer in the storage device. Processing to store, processing to extract update information by comparing web page data at the most recent time points of a web page specified by a specified URI stored in association with specified user identification information, and specified user identification A process of analyzing the layout of the web page may be executed based on the latest web page data of the web page specified by the specified URI stored in association with the information.
また、コンピュータに、ユーザ識別子と、ユーザ識別子で識別されるユーザが指定したURIとを対応づけて記憶装置に記憶させる処理、および定期的に、ウェブページデータ取得手段に、URI記憶手段に記憶されているURIで特定されるウェブページのウェブページデータを取得し、取得時間とユーザ識別子と対応づけて記憶装置に記憶させる処理を実行させてもよい。 Further, the computer stores the user identifier and the URI specified by the user identified by the user identifier in association with each other and stores them in the storage device, and periodically stores them in the web page data acquisition unit and the URI storage unit. The web page data of the web page specified by the current URI may be acquired, and a process of associating the acquisition time with the user identifier and storing it in the storage device may be executed.
また、コンピュータに、更新情報の抽出において更新時刻を抽出させ、抽出された更新情報に、更新時刻をさらに付加した配信用更新情報を生成させてもよい。 Alternatively, the computer may cause the update time to be extracted in the extraction of the update information and generate update information for distribution in which the update time is further added to the extracted update information.
また、配信用更新情報の生成において、更新情報を更新時刻順に配列させてもよい。 Further, in the generation of distribution update information, the update information may be arranged in order of update time.
本発明の効果は、更新情報を適度な周辺情報とともに提供できることにある。この結果更新情報を分かりやすく提供できる。その理由は、Webページの更新情報を抽出し、当該更新情報とウェブページのレイアウト解析結果に基づき更新セクションを抽出し、更新情報に更新セクションを示す情報を付加した配信用更新情報を生成するためである。 An advantage of the present invention is that update information can be provided together with appropriate peripheral information. As a result, update information can be provided in an easy-to-understand manner. The reason for this is that the update information of the Web page is extracted, the update section is extracted based on the update information and the layout analysis result of the Web page, and the update information for distribution in which the information indicating the update section is added to the update information is generated. It is.
実施の形態1.
以下、本実施の形態について図面を参照して説明する。図1は、本発明の第1の実施の形態における情報配信システムに適用される配信サーバの構成例を示すブロック図である。図1に示すように、本発明の第1の実施の形態による配信サーバは、ネットワークカード等の入力装置1と、プログラム制御により動作するデータ処理装置2と、情報を記憶する記憶装置3と、ネットワークカード等の出力装置4とを含む。配信サーバは、例えば、ユーザが操作するユーザ端末からの要求に従って更新情報を配信するサーバ装置によって実現される。なお、図示していないが、情報配信システムとしては、更新情報を配信する配信サーバの他に、ユーザが操作し更新情報の配信先となるユーザ端末と、Webページを公開するWebサーバとを備え、各装置がインターネット等の通信ネットワークを介して接続されて構成される。
Embodiment 1 FIG.
Hereinafter, the present embodiment will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration example of a distribution server applied to the information distribution system according to the first embodiment of the present invention. As shown in FIG. 1, a distribution server according to the first embodiment of the present invention includes an input device 1 such as a network card, a
また、記憶装置3は、Webページ記憶部31を備える。Webページ記憶部31は、ユーザを識別するためのユーザIDと、更新情報の取得対象とするWebページのURI(Uniform Resource Identifier)と、URIで特定されるWebページのWebページデータと、取得時刻とを対応づけて記憶する。
In addition, the storage device 3 includes a Web
また、データ処理装置2は、Webページ取得手段21と、更新情報抽出手段22と、レイアウト解析手段23と、更新セクション抽出手段24と、更新情報整形手段25と、更新情報配信手段26とを備える。
Further, the
Webページ取得手段21は、入力装置1から与えられたURIに対応するWebページのデータ(Webページデータ)を取得し、入力装置1から与えられたユーザID、WebページのURI、取得時刻とともにWebページ記憶部31に記憶させる。更新情報抽出手段22は、入力装置1から与えられたユーザIDとURIとに対応する直近複数時点のWebページデータをWebページ記憶部31から取得し、これらを比較して更新情報(更新された情報)を抽出する。
The Web
レイアウト解析手段23は、入力装置1から与えられたユーザIDとURIとに対応する直近の(または比較に用いた)WebページデータをWebページ記憶部31から取得し、レイアウト(Webページの画面レイアウト)を解析し、レイアウトを構成するセクションやその見出しを抽出する。一般に、Webページの画面では、意味的に関連する情報を掲載した1つ以上の領域がレイアウトされ、一部の領域はその内容が一目で分かる標題を持つ。ここで、意味的に関連する情報とは、ある事柄に一定の基準で関わりのある情報をいう。具体的には、”ある事柄”が、その領域の標題となる。なお、ある事柄にある基準で(例えば、情報の詳細さのレベルで)関わりのある情報が一つしかない場合は、領域内に掲載される情報が一つとなる。本実施の形態において、セクションとは、意味的に関連する情報を掲載している、Webページの画面レイアウト上の領域をいう。また、見出しとは、セクション内で掲載している情報の標題を示す情報をいう。
The
更新セクション抽出手段24は、更新情報抽出手段22で抽出された更新情報と、レイアウト解析手段23で解析されたレイアウト解析結果(例えば、セッションの区切りを示す情報やセッションの見出し)とを取得し、更新情報を含むセクションを更新セクションとして抽出する。なお、更新情報が仮に削除された情報であった場合には、更新前のWebページにおいて削除された情報を含んでいたセクションを更新セクションとして抽出すればよい。
The update
更新情報整形手段25は、更新情報抽出手段22で抽出された更新情報に、更新セクション抽出手段24で抽出された更新セクションを示す情報(例えば、見出しやセクションそのものの情報)を含めた配信用更新情報を生成する。更新情報整形手段25は、例えば、更新情報と更新セクションの見出しとを含む配信用更新情報を生成してもよい。また、配信用更新情報として更新セクション内で掲載されている全ての情報を配信用更新情報として生成してもよい。
The update
更新情報配信手段26は、更新情報整形手段25で生成された更新情報(すなわち、配信用更新情報)を出力装置3を用いて所定の方式で配信する。所定の方式としては、更新情報をファイル形式に変換して直接要求元に送信する、更新情報をファイル形式に変換してWebサーバに配置する、更新情報をメールで送信する等を用いることができる。
The update
ここで、更新情報抽出手段22は、入力装置1から与えられたユーザIDにつき、複数のURIに対応するそれぞれの直近複数時点のWebページデータをWebページ記憶部31から取得し、これらを比較し、更新情報を抽出し、更新情報整形手段25は、更新情報抽出手段22で抽出された更新情報に、更新セクション抽出手段24で抽出された更新セクションやその見出しの情報を付加してURI順に配列した、複数のWebページの統合された配信用更新情報を生成してもよい。
Here, the update
また、更新情報抽出手段22と更新セクション抽出手段24は、更新時刻をも抽出し、更新情報整形手段25は、更新情報抽出手段22で抽出された更新情報に更新時刻をさらに付加した配信用更新情報を生成してもよい。更新時刻は、例えば、比較したWebページデータの取得時間に基づいて抽出すればよい。また、更新情報整形手段25は、更新時刻順に配列した配信用更新情報を生成してもよい。また、更新情報整形手段25は、セクションの更新履歴を含んだ配信用更新情報を生成してもよい。
The update
また、更新情報整形手段25は、例えば、更新セクション抽出手段24で抽出された更新セクションやその見出しの情報を、[見出し][セクション][見出し]・・・の形式で配列したり、[見出し][セクション内の更新情報][見出し]・・・の形式で配列したり、[見出し][セクション][見出し]・・・の形式で配列しセクション内の更新情報を例えば太字で示したり、画面上のセクション位置を示すアイコンを用い、[アイコン][セクション][アイコン]・・・の形式で配列したりした配信用更新情報を生成してもよいし、更新情報や更新セクションの表現(色やフォント等)を変えたWebページを配信用更新情報として生成してもよい。 Further, the update information shaping means 25 arranges, for example, the update section extracted by the update section extraction means 24 and the information of the headline in the form of [heading] [section] [heading]. ] [Update information in section] [Heading] ..., arranged in the format [Heading] [Section] [Heading] ..., etc. Using the icons indicating the section positions on the screen, update information for distribution arranged in the form of [icon] [section] [icon]... May be generated. A Web page with a different color, font, etc.) may be generated as distribution update information.
Webページ記憶部31は、具体的には、メモリ等の記憶装置によって実現される。また、Webページ取得手段21、更新情報抽出手段22、レイアウト解析手段23、更新セクション抽出手段24、更新情報整形手段25および更新情報配信手段26は、具体的には、プログラムに従って動作するCPUによって実現される。なお、データ処理装置と記憶装置とは、通信可能に接続されていれば別装置として実現されていてもよい。
Specifically, the Web
次に、本実施の形態の動作について図面を参照して説明する。図2は、本実施の形態における配信サーバの動作例を示すフローチャートである。Webページ取得手段21は、入力装置1から与えられたURIで特定されるWebページにネットワークを介してアクセスし、URIに対応するWebページデータを取得する(ステップA1)。そして、取得したWebページデータを、入力装置1から与えられたユーザIDと、WebページのURIと、Webページデータの取得時間とともに、Webページ記憶部31に記憶させる(ステップA2)。
Next, the operation of the present embodiment will be described with reference to the drawings. FIG. 2 is a flowchart showing an operation example of the distribution server in the present embodiment. The web page acquisition means 21 accesses the web page specified by the URI given from the input device 1 via the network, and acquires web page data corresponding to the URI (step A1). The acquired Web page data is stored in the Web
ユーザIDは、例えば、本システムによる更新情報の配信サービスを受けたいユーザに予め所定の登録手続きを行わせた際に割り当ててもよいし、端末固有情報(携帯電話機の端末固有IDやMACアドレス、IPアドレスなど)を用いてもよい。また、更新情報の取得対象とするWebページのURIは、更新情報を要求するための要求画面を用意し画面操作によって入力させてもよいし、ブックマークのような履歴情報を記憶しておき、その中から選択させてもよい。 The user ID may be assigned, for example, when a user who wants to receive an update information distribution service by the system performs a predetermined registration procedure in advance, or terminal specific information (terminal specific ID or MAC address of a mobile phone, IP address etc.) may be used. Also, the URI of the Web page that is the acquisition target of update information may be prepared by a request screen for requesting update information and input by screen operation, or history information such as a bookmark is stored, You may choose from among them.
更新情報抽出手段22は、入力装置1から与えられたユーザIDとURIとに対応する直近2時点のWebページデータをWebページ記憶部31から取得し、これらを比較し、更新情報を抽出する(ステップA3)。レイアウト解析手段23は、Webページ取得手段21で取得されたWebページデータで示されるWebページについてレイアウトを解析する(ステップA4)。レイアウト解析手段23は、具体的には、レイアウトを解析し、レイアウトを構成するセクションとその見出しを抽出する。
The update
レイアウト解析手段23は、例えば、Webページデータとして取得された構造化文書または半構造化文書の構造(タグの種類や構造)やレンダリング時の表示上の特徴に基づいて、レイアウトを構成するセクションやその見出しを抽出する。具体的には、特開2006−1555931号公報(参照文献)に開示されているような文書解析システムを用いて実現してもよい。参照文献に開示されている文書解析システムでは、構造化・半構造化文書をレンダリングし、文書記述要素の配置を認識し、一定の方向に配置された文書記述要素をグループ化してレイアウトを解析する。また、レイアウトを解析する際に、文書記述要素の名前、属性、スタイル、内容を所定のタイトル解析ルールと照合しタイトル(すなわち、見出し)を抽出する。タイトル解析ルールは、例えば、h1でタグ付けされた情報や背景色を持つなど、他と比べ表示上顕著な特徴を持つ情報を抽出できるようなルールであってもよい。 The layout analysis means 23, for example, the sections constituting the layout based on the structure (tag type and structure) of the structured document or semi-structured document acquired as Web page data and the display characteristics at the time of rendering. Extract the headline. Specifically, it may be realized using a document analysis system as disclosed in Japanese Patent Application Laid-Open No. 2006-1555931 (reference document). The document analysis system disclosed in the reference document renders structured / semi-structured documents, recognizes the placement of document description elements, and analyzes the layout by grouping document description elements arranged in a certain direction. . Further, when analyzing the layout, the name (attribute), style, and content of the document description element are compared with a predetermined title analysis rule to extract a title (ie, heading). The title analysis rule may be, for example, a rule that can extract information having features that are more noticeable than others, such as information tagged with h1 and a background color.
更新セクション抽出手段24は、更新情報抽出手段22で抽出された更新情報と、レイアウト解析手段23で解析されたレイアウト解析結果(例えば、セッションの区切りを示す情報やセッションの見出し)とを取得し、レイアウトを構成する各セクションについて、セクションが更新情報を含むか順に判定し、更新セクションを抽出する(ステップA5)。更新情報整形手段25は、更新情報抽出手段22で抽出された更新情報を元に、更新セクション抽出手段24で抽出された更新セクションを用いて、更新情報を整形する(ステップA6)。更新情報整形手段25は、更新情報抽出手段22で抽出された更新情報に、更新セクション抽出手段24で抽出された更新セクションを示す情報(例えば、更新セクションの見出しや更新セクション内で掲載している情報)を付加した配信用更新情報を生成する。更新情報配信手段26は、更新情報整形手段25で生成された配信用更新情報を出力装置3を用いて所定の方式で配信する(ステップA7)。
The update
以上のように、本実施の形態では、意味的に関連する情報を掲載しているWebページの画面レイアウト上の領域のうち、更新情報を含む領域を更新セクションとして抽出し、更新セクションを示す情報を含めて配信するので、更新情報を適度な周辺情報とともに提供することができる。結果、更新情報を分かりやすく提供できる。すなわち、ユーザは、そのWebページが何について更新したかを、そのWebページを改めて閲覧することなく知ることができる。 As described above, in the present embodiment, information indicating the update section is extracted from the area on the screen layout of the Web page on which the semantically related information is posted, as an update section. Therefore, update information can be provided together with appropriate peripheral information. As a result, update information can be provided in an easy-to-understand manner. That is, the user can know what the web page has been updated without browsing the web page again.
なお、本実施の形態では、サーバ側で全ての処理を行う場合について説明したが、例えば、ユーザIDを省略して、クライアント側(ユーザ端末)単体で動作させてもよい。ユーザ端末単体で動作させる場合、具体的には、Webページデータを履歴情報として記憶しておき、Webページ読み込み時に更新情報を表示するようなブラウザによって実現してもよい。また、更新情報の表示は、Webページの代わりに表示させたり、ポップアップ表示させてもよい。 In the present embodiment, the case where all processes are performed on the server side has been described. However, for example, the user ID may be omitted and the client side (user terminal) may be operated alone. When the user terminal is operated alone, specifically, it may be realized by a browser that stores Web page data as history information and displays update information when the Web page is read. Further, the update information may be displayed instead of the Web page or may be displayed in a pop-up manner.
また、サーバ側とクライアント側で連携し処理する構成として、サーバ側にWebページ記憶部31を、クライアント側にそれ以外の構成要素を配してもよい。そのような場合には、記憶装置が貧弱なユーザ端末に代わりサーバ装置が過去のWebページデータを記憶して、更新情報取得時にユーザ端末がサーバ装置からデータを取得すればよい。
Further, as a configuration for processing in cooperation between the server side and the client side, the Web
また、別の例として、サーバ側にレイアウト解析手段を、クライアント側にそれ以外の構成要素を配してもよい。そのような場合には、データ処理装置が貧弱なユーザ端末に代わりサーバ装置がレイアウト解析処理を実行し、ユーザ端末はサーバ装置が解析したレイアウト解析結果を用いて更新セクションを抽出すればよい。 As another example, layout analysis means may be arranged on the server side and other components may be arranged on the client side. In such a case, the server device executes layout analysis processing instead of the poor user terminal in the data processing device, and the user terminal may extract the update section using the layout analysis result analyzed by the server device.
実施の形態2.
本発明の第2の実施の形態について図面を参照して説明する。図3は、第2の実施の形態における情報配信システムの構成例を示すブロック図である。図3に示すように、本発明の第2の実施の形態における配信サーバは、ネットワークカード等の入力装置1と、プログラム制御により動作するデータ処理装置2と、情報を記憶する記憶装置3と、ネットワークカード等の出力装置4とを含む。本実施の形態では、図1に示す第1の実施の形態と比べて、記憶装置3がURI記憶部32を備える点、およびデータ処理装置2がURI登録手段27と定期実行制御手段28とを備える点が異なる。
A second embodiment of the present invention will be described with reference to the drawings. FIG. 3 is a block diagram illustrating a configuration example of the information distribution system according to the second embodiment. As shown in FIG. 3, the distribution server according to the second embodiment of the present invention includes an input device 1 such as a network card, a
URI記憶部32は、ユーザを識別するためのユーザIDと、更新情報の取得対象とするWebページのURIとを記憶する。
The
URI登録手段27は、入力装置1から与えられたユーザIDとURIとをURI記憶部32に記憶させる。URI登録手段27は、例えば、登録手続きを行ったユーザに対し、更新情報の取得対象とするWebページのURIを指定するためのURI登録画面を用意し、画面操作によって入力されるURIを、ユーザIDと対応づけて登録(記憶)する。なお、URI記憶部32には、例えば、いずれかのユーザに指定されたURIと対応づけて、そのURIを指定したユーザを記憶させてもよい。
The
定期実行制御手段28は、URI記憶部32からユーザIDとURIとを定期的に取得し、Webページ取得手段21を用いて当該URIに対応するWebページデータを取得させ、ユーザIDと、URIと、取得したWebページデータと、その取得時刻とをWebページ記憶部31に記憶する。
The periodic execution control means 28 periodically acquires the user ID and URI from the
なお、本実施の形態では、Webページ取得手段21は、定期実行制御手段27から与えられたURIで特定されるWebページにネットワークを介してアクセスし、URIに対応するWebページデータを取得する。
In the present embodiment, the Web
ここで、Webページ取得手段21は、入力装置1から与えられたURIに対応するWebページを取得し、入力装置1から与えられたユーザIDと、WebページのURIと、Webページデータと取得時刻とをWebページ記憶部31に記憶してもよい。なお、Webページ記憶部31ではユーザIDを省略してもよい。そのような場合には、URI記憶部32を参照してURIとユーザIDとを対応づければよい。
Here, the Web
また、URI登録手段27は、更新情報抽出手段22に与えられたユーザIDとURIとを監視し、これらがURI記憶部32に記憶されていない場合に、当該ユーザIDとURIをURI記憶部32に記憶してもよい。
Further, the
URI記憶部32は、具体的には、メモリ等の記憶装置によって実現される。URI登録手段27および定期実行制御手段28は、具体的には、プログラムに従って動作するCPUによって実現される。
Specifically, the
次に、本実施の形態の動作について図4〜図6を参照して説明する。図4〜図6は、本実施の形態における情報配信システムの動作例を示すフローチャートである。まず、URI登録手段27は、入力装置1から与えられたユーザIDとURIとをURI記憶部32に記憶する(図4のステップB1)。
Next, the operation of the present embodiment will be described with reference to FIGS. 4 to 6 are flowcharts showing an operation example of the information delivery system in the present embodiment. First, the
定期実行制御手段28は、URI記憶部32からユーザIDとURIとを定期的に取得し(図5のステップB2)、Webページ取得手段21を制御して、当該URIに対応するWebページデータをネットワーク経由で取得し(図5のステップA1)、取得したWebページデータを、そのURIとユーザIDと取得時刻とともにWebページ記憶部31に記憶する(図5のステップA2)。定期実行制御手段28は、URI記憶部32に他のURI・ユーザIDが記憶されているか否かを判断し(図5のステップB3)、ユーザID・URIに対応する全てのWebページデータを取得するまで、上記処理を繰り返し行う。
The periodic
なお、複数のユーザが同じURIを登録している場合には、1度取得したWebページデータを、そのURIを登録した全てユーザIDと対応づけられるようにWebページ記憶部31に記憶してもよい。以降の動作(図6のステップA3〜A7)は、図2に示した第1の実施の形態と同様のため、説明は省略する。
If a plurality of users register the same URI, the Web page data acquired once may be stored in the Web
以上のように、本実施の形態によれば、定期的に取得されたWebページデータを用いて、Webページの更新情報を抽出し、抽出した更新情報を含む領域である更新セクションを示す情報を含めて配信するので、定期的な更新情報を適度な周辺情報とともに提供できる。結果、一定時間に生じた更新情報を分かりやすく提供できる。 As described above, according to the present embodiment, Web page update information is extracted using regularly acquired Web page data, and information indicating an update section that is an area including the extracted update information is displayed. Since it is distributed, regular update information can be provided along with appropriate peripheral information. As a result, it is possible to provide easy-to-understand update information generated in a certain time.
実施の形態3.
本発明の第3の実施の形態について図7を参照して説明する。図7は、本発明の第3の実施の形態における配信サーバの構成例を示すブロック図である。図7に示す配信サーバは、第1および第2の実施の形態と同様に、入力装置1、データ処理装置2、記憶装置3、出力装置4を備え、さらに、データ処理装置2に読み込まれデータ処理装置2の動作を制御して、第1または第2の実施の形態におけるデータ処理装置2と同様の処理を実行させるための情報配信用プログラム5を備える。
Embodiment 3 FIG.
A third embodiment of the present invention will be described with reference to FIG. FIG. 7 is a block diagram illustrating a configuration example of a distribution server according to the third embodiment of the present invention. As in the first and second embodiments, the distribution server shown in FIG. 7 includes an input device 1, a
情報配信用プログラム5は、データ処理装置2に読み込まれデータ処理装置2の動作を制御し、第1または第2の実施の形態におけるデータ処理装置2と同様の処理を実行させる。また、記憶装置3にWebページ記憶部31やURI記憶部32となる記憶領域を割り当て、Webページ記憶部31やURI記憶部32として動作させる。データ処理装置2は、情報配信用プログラム5の制御により、第1または第2の実施の形態におけるデータ処理装置2による処理と同様の処理を実行する。
The information distribution program 5 is read by the
次に、本発明の第1の実施例を図面を参照して説明する。本実施例は、本発明の第1の実施の形態に対応するものである。本実施例は、配信サーバを、ネットワークカードを備えたパーソナルコンピュータと磁気ディスク記憶装置とによって実現する例である。すわなち、本実施例による配信サーバは、入力装置1としてネットワークカードを、データ処理装置2としてパーソナルコンピュータを、記憶装置3として磁気ディスク記憶装置を、出力装置4としてネットワークカードを備えている。
Next, a first embodiment of the present invention will be described with reference to the drawings. This example corresponds to the first embodiment of the present invention. In this embodiment, the distribution server is realized by a personal computer having a network card and a magnetic disk storage device. That is, the distribution server according to the present embodiment includes a network card as the input device 1, a personal computer as the
また、パーソナルコンピュータは、プログラム制御に従い、Webページ取得手段21、更新情報抽出手段22、レイアウト解析手段23、更新セクション抽出手段24、更新情報整形手段25、更新情報配信手段26として機能する中央演算装置を有する。また、磁気ディスク記憶装置には、Webページ記憶部31として、例えば図8に示すような形式で、ユーザIDと、URIと、Webページデータと、取得時間のリストが記憶されている。
The personal computer is a central processing unit that functions as a Web
図8は、Webページ記憶部31に記憶される情報の一例を示す説明図である。図8では、例えば、ユーザID”user”で識別されるユーザが指定したURI”http://www.nec.co.jp/”について、そのURIで特定されるWebページデータとして”index.html”が取得されていること、またそのWebページデータの取得時間が2006年4月1日18時00分00秒であることが示されている。また、例えば、ユーザID”user2”で識別されるユーザが指定したURI”http://www.nec−x.co.jp/”について、そのURIで特定されるWebページデータとして”index.html”と”logo.gif”が取得されていること、またそのWebページデータの取得時間が2006年4月1日17時55分00秒であることが示されている。
FIG. 8 is an explanatory diagram illustrating an example of information stored in the Web
今、パーソナルコンピュータに対し、”http://pc/update.cgi?uid=user+uri=http://www.nec.co.jp/”という更新情報取得要求があったとする。これは、パーソナルコンピュータが予め公開している更新情報の取得を要求するためのCGI”http://pc/update.cgi”に対し、ユーザIDとして”user”が、更新情報を取得するURIとして”http://www.nec.co.jp/”が、それぞれネットワークカード経由で入力されたことを示す。 Assume that there is an update information acquisition request “http: //pc/update.cgi? Uid = user + uri = http: //www.nec.co.jp/” to the personal computer. This is because “user” as a user ID is a URI for acquiring update information with respect to CGI “http: //pc/update.cgi” for requesting acquisition of update information published in advance by a personal computer. “Http://www.nec.co.jp/” is input via the network card.
中央演算装置は、入力されたURI”http://www.nec.co.jp/”に対応するWebページにネットワーク経由でアクセスし、そのWebページを構成するHTML(Hyper Text Markup Language)、CSS(Cascading Style Sheets)、画像などのデータ(すなわち、Webページデータ)を取得し、ユーザID”user”、URI”http://www.nec.co.jp/”、Webページデータの取得時刻とともに、Webページ記憶部31のリストに追加する。
The central processing unit accesses the Web page corresponding to the input URI “http://www.nec.co.jp/” via the network, and forms an HTML (Hyper Text Markup Language), CSS that configures the Web page. (Cascading Style Sheets), data such as images (that is, Web page data) is acquired, and the user ID “user”, URI “http://www.nec.co.jp/”, together with the Web page data acquisition time , Added to the list of the Web
図9は、ユーザからの更新情報取得要求に応じてWebページデータを取得した際にWebページ記憶部31に追加される情報の一例を示す説明図である。図9では、ユーザからの更新情報取得要求に応じてWebページデータを取得したことによって、ユーザID”user”で識別されるユーザが指定したURI”http://www.nec.co.jp/”について、2006年4月1日19時00分00秒に取得したWebページデータ”index.html”がリストに追加されたことを示している。
FIG. 9 is an explanatory diagram illustrating an example of information added to the Web
中央演算装置は、Webページ記憶部31に記憶されているリストから、ユーザID”user”、URI”http://www.nec.co.jp/”に対応する直近2時点のデータ、具体的には2006年4月1日18時00分00秒に取得された”index.html”と2006年4月1日19時00分00秒に取得された”index.html”とを取得し、これらを比較し、所定の抽出ルールに従って更新情報を抽出する。抽出ルールとしては、全情報を比較対象とする、画面上に掲載される情報だけを比較対象とする、色やデザインの変更は無視するといったルールが考えられる。
From the list stored in the Web
図10は、更新情報を抽出する対象であるWebページデータの一例としての”index.html”のデータ例を示す説明図である。図10に示すように、ここでは、2006年4月1日19時00分00秒の”index.html”に、”<div>PC新モデル発売</div>”が追加されているものとする。 FIG. 10 is an explanatory diagram showing a data example of “index.html” as an example of Web page data from which update information is extracted. As shown in FIG. 10, “<div> PC new model release </ div>” is added to “index.html” on April 1, 2006, 19:00:00. To do.
中央演算装置は、HTMLのテキストデータを解析し、更新情報として”<div>PC新モデル発売</div>”を抽出する。次に、中央演算装置は、Webページ記憶部31に記憶されているリストから、ユーザID”user”と、URI”http://www.nec.co.jp/”とに対応する直近のデータを取得し、Webページのレイアウトを解析し、レイアウトを構成するセクションとその見出しを抽出する。
The central processing unit analyzes the text data of HTML and extracts “<div> PC new model release </ div>” as update information. Next, the central processing unit selects the latest data corresponding to the user ID “user” and the URI “http://www.nec.co.jp/” from the list stored in the Web
図11は、レイアウト解析結果の例を示す説明図である。ここで、中央演算装置は、図11に示すように、Webページデータをレンダリングした結果、3つのセクションと、それらのセクションについて、”NEC”、”NEWS”、”IR”という見出しを抽出する。そして、中央演算装置は、レイアウト解析の結果、抽出された各セクションについて、更新情報”<div>PC新モデル発売</div>”を含むかを順に判定し、更新セクションとして見出し”NEWS”を持ったセクション(図12において網掛けで示すセクション)を抽出する。図12は、更新セクションの抽出例を示す説明図である。 FIG. 11 is an explanatory diagram illustrating an example of a layout analysis result. Here, as shown in FIG. 11, the central processing unit extracts three sections and headings “NEC”, “NEWS”, and “IR” for those sections as a result of rendering the Web page data. Then, the central processing unit sequentially determines whether each section extracted as a result of layout analysis includes update information “<div> PC new model release </ div>”, and finds “NEWS” as an update section. The section (the section indicated by shading in FIG. 12) is extracted. FIG. 12 is an explanatory diagram of an example of extracting update sections.
次に、中央演算装置は、更新セクションとその見出しの情報を取得し、これらを図13に示すように[見出し][セクション]の順に配列した配信用更新情報を生成し、更新情報を出力装置3を用いて送信する。図13は、更新情報の整形例を示す説明図である。 Next, the central processing unit obtains update section information and headline information, generates update information for distribution in which these are arranged in the order of [headline] and [section], as shown in FIG. 3 is used for transmission. FIG. 13 is an explanatory diagram of an example of shaping update information.
図13では、HTML形式で、見出しをclass=”heading”とする<DIV>タグで囲むとともに、更新セクション内で掲載している情報をclass=”body”とする<DIV>タグで囲んで更新情報を整形する例を示している。 In FIG. 13, in the HTML format, the heading is enclosed in <DIV> tags with class = "heading" and the information posted in the update section is enclosed with <DIV> tags with class = "body". An example of shaping information is shown.
次に、本発明の第2の実施例を図面を参照して説明する。本実施例は、本発明の第2の実施の形態に対応するものである。本実施例は、第1の実施例と同様に、配信サーバを、ネットワークカードを備えたパーソナルコンピュータと磁気ディスク記憶装置とによって実現する。 Next, a second embodiment of the present invention will be described with reference to the drawings. This example corresponds to the second embodiment of the present invention. In the present embodiment, as in the first embodiment, the distribution server is realized by a personal computer having a network card and a magnetic disk storage device.
また、パーソナルコンピュータは、プログラム制御に従い、Webページ取得手段21、更新情報抽出手段22、レイアウト解析手段23、更新セクション抽出手段24、更新情報整形手段25、更新情報配信手段26、URI登録手段27、定期実行制御手段28として機能する中央演算装置を有する。 Further, the personal computer follows the program control in accordance with the program control, Web page acquisition means 21, update information extraction means 22, layout analysis means 23, update section extraction means 24, update information shaping means 25, update information distribution means 26, URI registration means 27, A central processing unit that functions as the periodic execution control means 28 is included.
また、磁気ディスク記憶装置には、URI記憶部32として、例えば図14に示すような形式で、ユーザIDとURIのリストを記憶するための記憶領域が確保されているものとする。図14は、URI記憶部32に記憶される情報の一例を示す説明図である。図14に示すように、例えば、更新情報の取得対象とするURIが未登録である場合には、各項目に”null”を記憶しておいてもよい。また、磁気ディスク記憶装置には、Webページ記憶部31として、例えば図15に示すような形式で、ユーザIDと、URIと、Webページデータと、取得時間のリストを記憶するための記憶領域が確保されているものとする。図15は、Webページ記憶部31に記憶される情報の一例を示す説明図である。図15に示すように、例えば、Webページデータが未取得である場合には、各項目に”null”を記憶しておいてもよい。
In the magnetic disk storage device, it is assumed that a storage area for storing a list of user IDs and URIs is secured as the
今、パーソナルコンピュータに対し、”http://pc/register.cgi?uid=user+uri=http://www.nec.co.jp/というURI登録要求があったとする。これは、パーソナルコンピュータが予め公開している更新情報の取得対象とするURIを登録するためのCGI” http://pc/register.cgi”に対し、ユーザIDとして”user”が、更新情報の取得対象とするURIとして”http://www.nec.co.jp/”が、それぞれネットワークカード経由で入力されたことを示す。 Now, assume that a personal computer has a URI registration request “http: //pc/register.cgi? Uid = user + uri = http: //www.nec.co.jp/. CGI for registering URIs for which update information to be published is to be registered "http: // pc / register. “user” as the user ID and “http: //www.cgi” as the URI for which update information is to be acquired. nec. co. jp / "indicates that each is input via the network card.
中央演算装置は、入力されたユーザID”user”と、URI”http://www.nec.co.jp/”の登録がないことを確認した上で、これらをURI記憶部32のリストに追加する。図16は、ユーザからのURI登録要求に応じてURI記憶部32に追加される情報の一例を示す説明図である。図16では、ユーザからのURI登録要求に応じて、例えば、ユーザID”user”とユーザが指定したURI”http://www.nec.co.jp/”とが対応づけられてリストに追加されたことを示している。
The central processing unit confirms that the input user ID “user” and URI “http://www.nec.co.jp/” are not registered, and stores them in the list of the
そして、中央演算装置は、URI記憶部32に記憶されているリストから、定期的にユーザID”user”、URI”http://www.nec.co.jp/”を取得し、当該URIで特定されるWebページにネットワーク経由でアクセスし、そのWebページを構成するHTML、CSS、画像などのデータ(Webページデータ)を取得し、ユーザID、URI、Webページデータの取得時間とともに、Webページ記憶部31のリストに追加する。
The central processing unit periodically obtains the user ID “user” and URI “http://www.nec.co.jp/” from the list stored in the
図17は、ユーザから登録のあったURIに対応するWebページデータを定期的に取得した際に、Webページ記憶部31に追加される情報の一例を示す説明図である。図17では、ユーザから登録のあったURIに対応するWebページデータを定期的に取得したことによって、ユーザID”user”が指定したURI”http://www.nec.co.jp/”について、2006年4月1日18時00分00秒に取得したWebページデータ”index.html”と、2006年4月1日19時00分00秒に取得したWebページデータ”index.html”とがリストに追加されたことを示している。なお、図17に示す例では、1時間が経過したことを検出した場合にWebページデータを取得している。
FIG. 17 is an explanatory diagram illustrating an example of information added to the Web
ここで、パーソナルコンピュータに対し、”http://pc/update.cgi?uid=user+uri=http://www.nec.co.jp/”という更新情報取得要求があり、ユーザIDとして”user”が、更新情報を取得するURIとして”http://www.nec.co.jp/”が、それぞれネットワークカード経由で入力されたとする。中央演算装置は、第1の実施例と同様に、Webページ記憶部31に記憶されている情報を元に、更新情報(配信用更新情報)を生成し、出力装置3を用いて送信する。
Here, there is an update information acquisition request for the personal computer “http: //pc/update.cgi? Uid = user + uri = http: //www.nec.co.jp/”, and the user ID is “user”. However, it is assumed that “http://www.nec.co.jp/” is input via a network card as a URI for acquiring update information. As in the first embodiment, the central processing unit generates update information (distribution update information) based on information stored in the Web
ここで、第1および第2の実施例について、中央演算装置は、更新情報や更新セクションの元のHTML形式のデータについて、HTML要素の全部または一部を別のHTML要素やXML(Extensible Markup Language)要素、テキストに置換して更新情報を生成してもよい。また、第1および第2の実施例について、中央演算装置は、XML形式の配信用更新情報を生成してもよい。図18は、XML形式で配信用更新情報を生成した例を示す説明図である。 Here, regarding the first and second embodiments, the central processing unit converts all or part of the HTML element into another HTML element or XML (Extensible Markup Language) for the original HTML format data of the update information or update section. ) Update information may be generated by substituting elements and text. Moreover, about the 1st and 2nd Example, the central processing unit may produce | generate the update information for delivery of an XML format. FIG. 18 is an explanatory diagram showing an example of generating update information for distribution in the XML format.
本発明によれば、Webページの更新情報を配信する情報配信装置や、情報配信装置をコンピュータに実現するためのプログラムといった用途に適用できる。また、Webページの更新情報を計算し端末画面に表示する情報表示装置や機能といった用途にも適用できる。 INDUSTRIAL APPLICABILITY According to the present invention, the present invention can be applied to uses such as an information distribution apparatus that distributes update information of a Web page and a program for realizing the information distribution apparatus on a computer. The present invention can also be applied to uses such as information display devices and functions for calculating update information of a Web page and displaying it on a terminal screen.
1 入力装置
2 データ処理装置
3 記憶装置
4 出力装置
21 Webページ取得手段
22 更新情報抽出手段
23 レイアウト解析手段
24 更新セクション抽出手段
25 更新情報整形手段
26 更新情報配信手段
27 URI登録手段
28 定期実行制御手段
31 Webページ記憶部
32 URI記憶部
DESCRIPTION OF SYMBOLS 1
Claims (17)
更新情報に、意味的に関連する情報を掲載しているウェブページの画面上の領域の単位であるセクションであって、更新情報を含むセクションを示す情報を付加した配信用更新情報を生成する
ことを特徴とする情報配信システム。 An information distribution system that distributes update information indicating updated information of a web page,
A section that is a unit of an area on the screen of a web page that contains information that is semantically related to the update information, and that generates update information for distribution by adding information indicating the section that contains the update information. An information distribution system characterized by
前記ウェブページデータに基づいて、ウェブページのレイアウトを解析し、セクションを抽出するレイアウト解析手段と、
前記更新情報抽出手段で抽出された更新情報を含む前記レイアウト解析手段で抽出されたセクションを、更新セクションとして抽出する更新セクション抽出手段と、
前記更新情報抽出手段で抽出された更新情報に、前記更新セクション抽出手段が抽出した更新セクションを示す情報を付加した配信用更新情報を生成する更新情報整形手段とを備えた
請求項1に記載の情報配信システム。 Update information extraction means for extracting update information by comparing web page data at the most recent time points;
Layout analysis means for analyzing a layout of a web page based on the web page data and extracting a section;
An update section extraction means for extracting the section extracted by the layout analysis means including the update information extracted by the update information extraction means, as an update section;
The update information shaping means which produces | generates the update information for delivery which added the information which shows the update section extracted by the said update section extraction means to the update information extracted by the said update information extraction means. Information distribution system.
更新抽出手段は、指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近複数時点のウェブページデータを比較し、
レイアウト解析手段は、指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近のウェブページデータに基づいて、ウェブページのレイアウトを解析する
請求項2に記載の情報配信システム。 Web page storage for storing user identification information for identifying a user, a URI designated by the user, web page data of a web page specified by the URI, and acquisition time of the web page data in association with each other With means,
The update extraction means compares the web page data at the most recent time points of the web page specified by the designated URI stored in association with the designated user identification information,
The layout analysis means analyzes the layout of the web page based on the latest web page data of the web page specified by the designated URI stored in association with the designated user identification information. Information distribution system.
指定のURIで特定されるウェブページのウェブページデータを取得するウェブページデータ取得手段と、
定期的に、前記ウェブページデータ取得手段に、前記URI記憶手段に記憶されているURIで特定されるウェブページのウェブページデータを取得させ、取得時間とユーザ識別子と対応づけてウェブページ記憶手段に記憶させる定期実行制御手段とを備えた
請求項3に記載の情報配信システム。 URI storage means for storing a user identifier and a URI specified by the user identified by the user identifier in association with each other;
Web page data acquisition means for acquiring web page data of a web page specified by a specified URI;
Periodically, the web page data acquisition unit acquires the web page data of the web page specified by the URI stored in the URI storage unit, and associates the acquisition time with the user identifier in the web page storage unit. The information distribution system according to claim 3, further comprising periodic execution control means for storing.
更新情報整形生成手段は、前記更新情報抽出手段によって抽出された更新情報に、前記更新時刻をさらに付加した配信用更新情報を生成する
請求項2から請求項4のうちのいずれか1項に記載の情報配信システム。 The update information extraction means also extracts the update time,
5. The update information shaping and generating unit generates distribution update information in which the update time is further added to the update information extracted by the update information extracting unit. 5. Information distribution system.
直近複数時点のウェブページデータを比較して更新情報を抽出する更新情報抽出手段と、
前記ウェブページデータに基づいて、ウェブページのレイアウトを解析し、セクションを抽出するレイアウト解析手段と、
前記更新情報抽出手段で抽出された更新情報を含む前記レイアウト解析手段で抽出されたセクションを、更新セクションとして抽出する更新セクション抽出手段と、
前記更新情報抽出手段で抽出された更新情報に、前記更新セクション抽出手段が抽出した更新セクションを示す情報を付加した配信用更新情報を生成する更新情報整形手段とを備えた
ことを特徴とする情報配信装置。 An information distribution device applied to an information distribution system for distributing update information indicating updated information of a web page,
Update information extraction means for extracting update information by comparing web page data at the most recent time points;
Layout analysis means for analyzing a layout of a web page based on the web page data and extracting a section;
An update section extraction means for extracting the section extracted by the layout analysis means including the update information extracted by the update information extraction means, as an update section;
Update information shaping means for generating update information for distribution by adding information indicating the update section extracted by the update section extraction means to the update information extracted by the update information extraction means Distribution device.
直近複数時点のウェブページデータを比較して更新情報を抽出し、
前記ウェブページデータに基づいて、ウェブページのレイアウトを解析し、セクションを抽出し、
抽出された更新情報を含む前記セクションを、更新セクションとして抽出し、
抽出された更新情報に、前記更新セクションを示す情報を付加した配信用更新情報を生成する
ことを特徴とする情報配信方法。 An information distribution method for distributing update information indicating updated information of a web page,
Compare web page data from the most recent time points to extract update information,
Based on the web page data, analyze the layout of the web page, extract sections,
Extracting the section containing the extracted update information as an update section;
An information distribution method comprising: generating update information for distribution by adding information indicating the update section to the extracted update information.
指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近複数時点のウェブページデータを比較して更新情報を抽出し、
前記指定のユーザ識別情報に対応づけて記憶されている前記指定のURIで特定されるウェブページの直近のウェブページデータに基づいて、ウェブページのレイアウトを解析する
請求項8に記載の情報配信方法。 User identification information for identifying a user, a URI specified by the user, web page data of a web page specified by the URI, and an acquisition time of the web page data are stored in association with each other,
Update the web page data at the most recent time points of the web page specified by the designated URI stored in association with the designated user identification information, and extract update information,
The information distribution method according to claim 8, wherein the layout of the web page is analyzed based on the web page data nearest to the web page specified by the designated URI stored in association with the designated user identification information. .
定期的に、前記ウェブページデータ取得手段に、前記URI記憶手段に記憶されているURIで特定されるウェブページのウェブページデータを取得し、取得時間とユーザ識別子と対応づけて記憶させる
請求項9に記載の情報配信方法。 Storing a user identifier and a URI specified by the user identified by the user identifier in association with each other;
The web page data of the web page specified by the URI stored in the URI storage unit is periodically acquired in the web page data acquisition unit, and stored in association with the acquisition time and the user identifier. Information distribution method described in 1.
抽出された更新情報に、前記更新時刻をさらに付加した配信用更新情報を生成する
請求項8から請求項10のうちのいずれか1項に記載の情報配信方法。 Extract the update time in the update information extraction,
The information distribution method according to any one of claims 8 to 10, wherein the distribution update information is generated by further adding the update time to the extracted update information.
コンピュータに、
直近複数時点のウェブページデータを比較して更新情報を抽出する処理、
前記ウェブページデータに基づいて、ウェブページのレイアウトを解析し、セクションを抽出する処理、
抽出された更新情報を含む前記セクションを、更新セクションとして抽出する処理、および
抽出された更新情報に、前記更新セクションを示す情報を付加した配信用更新情報を生成する処理
を実行させるための情報配信用プログラム。 An information distribution program for distributing update information indicating updated information of a web page,
On the computer,
The process of extracting update information by comparing web page data from the most recent time points,
A process of analyzing a layout of the web page and extracting a section based on the web page data;
Information distribution for executing processing for extracting the section including the extracted update information as an update section, and processing for generating distribution update information in which information indicating the update section is added to the extracted update information Program.
ユーザを識別するためのユーザ識別情報と、前記ユーザが指定したURIと、前記URIで特定されるウェブページのウェブページデータと、前記ウェブページデータの取得時間とを対応づけて記憶装置に記憶させる処理、
指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近複数時点のウェブページデータを比較して更新情報を抽出する処理、および
前記指定のユーザ識別情報に対応づけて記憶されている前記指定のURIで特定されるウェブページの直近のウェブページデータに基づいて、ウェブページのレイアウトを解析する処理
を実行させる請求項13に記載の情報配信用プログラム。 On the computer,
The user identification information for identifying the user, the URI specified by the user, the web page data of the web page specified by the URI, and the acquisition time of the web page data are stored in the storage device in association with each other. processing,
A process of extracting update information by comparing web page data at the most recent time points of a web page specified by a specified URI stored in association with the specified user identification information, and corresponding to the specified user identification information The information distribution program according to claim 13, wherein a process for analyzing a layout of a web page is executed based on the latest web page data of the web page specified by the specified URI stored together.
ユーザ識別子と、前記ユーザ識別子で識別されるユーザが指定したURIとを対応づけて記憶装置に記憶させる処理、および
定期的に、前記ウェブページデータ取得手段に、前記URI記憶手段に記憶されているURIで特定されるウェブページのウェブページデータを取得し、取得時間とユーザ識別子と対応づけて記憶装置に記憶させる処理
を実行させる請求項14に記載の情報配信用プログラム。 On the computer,
A process in which a user identifier and a URI designated by the user identified by the user identifier are associated with each other and stored in a storage device, and periodically stored in the URI storage unit in the web page data acquisition unit The information delivery program according to claim 14, wherein processing for acquiring web page data of a web page specified by a URI and storing the web page data in a storage device in association with an acquisition time and a user identifier is executed.
更新情報の抽出において更新時刻を抽出させ、
抽出された更新情報に、前記更新時刻をさらに付加した配信用更新情報を生成させる
請求項13から請求項15のうちのいずれか1項に記載の情報配信用プログラム。 On the computer,
Update time is extracted in the update information extraction,
The information distribution program according to any one of claims 13 to 15, wherein the distribution update information is generated by further adding the update time to the extracted update information.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006249264A JP2008071116A (en) | 2006-09-14 | 2006-09-14 | Information delivery system, information delivery device, information delivery method and information delivery program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006249264A JP2008071116A (en) | 2006-09-14 | 2006-09-14 | Information delivery system, information delivery device, information delivery method and information delivery program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008071116A true JP2008071116A (en) | 2008-03-27 |
Family
ID=39292644
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006249264A Pending JP2008071116A (en) | 2006-09-14 | 2006-09-14 | Information delivery system, information delivery device, information delivery method and information delivery program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008071116A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010049515A (en) * | 2008-08-22 | 2010-03-04 | Mitsubishi Electric Corp | Information processing apparatus and program |
JP2010211708A (en) * | 2009-03-12 | 2010-09-24 | Brother Ind Ltd | Communication apparatus and program |
US8291013B2 (en) | 2009-03-12 | 2012-10-16 | Brother Kogyo Kabushiki Kaisha | Communication apparatus and storage medium storing program |
JP2013008332A (en) * | 2011-06-27 | 2013-01-10 | Yahoo Japan Corp | Portal time line generation device and method |
KR101587877B1 (en) * | 2014-09-26 | 2016-01-25 | 숭실대학교산학협력단 | Monitoring system and method thereof, recording medium for performing the method |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004362241A (en) * | 2003-06-04 | 2004-12-24 | Canon Inc | Device and method for creating document update content data, and control program for device |
JP2005284334A (en) * | 2004-03-26 | 2005-10-13 | Oki Electric Ind Co Ltd | Web page update notification method and apparatus |
-
2006
- 2006-09-14 JP JP2006249264A patent/JP2008071116A/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004362241A (en) * | 2003-06-04 | 2004-12-24 | Canon Inc | Device and method for creating document update content data, and control program for device |
JP2005284334A (en) * | 2004-03-26 | 2005-10-13 | Oki Electric Ind Co Ltd | Web page update notification method and apparatus |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010049515A (en) * | 2008-08-22 | 2010-03-04 | Mitsubishi Electric Corp | Information processing apparatus and program |
JP2010211708A (en) * | 2009-03-12 | 2010-09-24 | Brother Ind Ltd | Communication apparatus and program |
US8291013B2 (en) | 2009-03-12 | 2012-10-16 | Brother Kogyo Kabushiki Kaisha | Communication apparatus and storage medium storing program |
JP2013008332A (en) * | 2011-06-27 | 2013-01-10 | Yahoo Japan Corp | Portal time line generation device and method |
KR101587877B1 (en) * | 2014-09-26 | 2016-01-25 | 숭실대학교산학협력단 | Monitoring system and method thereof, recording medium for performing the method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10956531B2 (en) | Dynamic generation of mobile web experience | |
US7865544B2 (en) | Method and system for providing XML-based asynchronous and interactive feeds for web applications | |
US8521892B2 (en) | Method and apparatus for controlling web page advertisement through incentives and restrictions | |
JP5233220B2 (en) | Page additional information sharing management method | |
US20090112824A1 (en) | Method and apparatus for generating presentation configuration file of document content | |
JP2005284334A (en) | Web page update notification method and apparatus | |
JP2009531793A (en) | System and method for converting web community and web application data | |
US20050024355A1 (en) | Selecting items displayed on respective areas on a screen | |
JP2012133515A (en) | Information processor, information processing method, program and information processing system | |
TWI519980B (en) | Method and device for displaying web page and computer-readable storage medium | |
JP2008134906A (en) | Business process definition generation method, device and program | |
JP2008071116A (en) | Information delivery system, information delivery device, information delivery method and information delivery program | |
JP2007072959A (en) | Distribution system, terminal device, and program | |
CN102004729A (en) | Method and system for showing website webpage and website server | |
JP2007172482A (en) | Information display system | |
JP2008123425A (en) | Web document data providing device, method, and system | |
JP2013164666A (en) | Portlet processing device, portal server, portal system, portlet processing method and computer program | |
JP5134639B2 (en) | Client apparatus, display method, program, information processing apparatus, and information processing system | |
JP2009251754A (en) | Page customizing server, page customizing program, and page customizing method | |
JP2007249700A (en) | Document management device, document retrieval method, document retrieval program and recording medium | |
JP5330169B2 (en) | Content data providing device | |
JP2009026013A (en) | Content registration/provision device, content registration/provision control method, and content registration/provision control program | |
WO2013132643A1 (en) | Information processing device, method, and program | |
US8082259B2 (en) | Information processing apparatus for extracting objects | |
JP2009176176A (en) | Web page distribution device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090812 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110609 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110621 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111018 |