JP2008071116A - Information delivery system, information delivery device, information delivery method and information delivery program - Google Patents

Information delivery system, information delivery device, information delivery method and information delivery program Download PDF

Info

Publication number
JP2008071116A
JP2008071116A JP2006249264A JP2006249264A JP2008071116A JP 2008071116 A JP2008071116 A JP 2008071116A JP 2006249264 A JP2006249264 A JP 2006249264A JP 2006249264 A JP2006249264 A JP 2006249264A JP 2008071116 A JP2008071116 A JP 2008071116A
Authority
JP
Japan
Prior art keywords
web page
information
update
update information
uri
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006249264A
Other languages
Japanese (ja)
Inventor
Yuushin Tatsumi
勇臣 辰巳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2006249264A priority Critical patent/JP2008071116A/en
Publication of JP2008071116A publication Critical patent/JP2008071116A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To solve the problem in which update information of an information delivery system for delivering update information of a Web page without special support of a Web page provider or a user is difficult to understand. <P>SOLUTION: A Web page acquisition means 21 acquires Web page data corresponding to an input URI, and stores it in a Web page storage part 31. An update information extraction means 22 compares Web page data at a plurality of most recent points of time corresponding to the input URI, and extracts update information. A layout analysis means 23 analyzes a layout of Web page based on the most recent Web page data corresponding to the input URI, and extracts sections constituting the layout or indexes thereof. An update section extraction means 24 extracts a section obtained by the layout analysis means 23 which includes the update information extracted by the update information extraction means 22 as an update section. An update information shaping means 25 generates delivery update information by adding information showing the update section to the update information. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、情報配信システム、情報配信装置、情報配信方法および情報配信用プログラムに関し、特に、更新情報を配信できる情報配信システム、情報配信装置、情報配信方法および情報配信用プログラムに関する。   The present invention relates to an information distribution system, an information distribution apparatus, an information distribution method, and an information distribution program, and more particularly to an information distribution system, an information distribution apparatus, an information distribution method, and an information distribution program that can distribute update information.

従来の情報配信システムは、ユーザがWebページ(以下、ウェブページとも言う。)の更新の有無を把握できるようにするため、特許文献1や特許文献2に記載されているように、システムがWebページの更新の有無を予め設定された条件に照らして検出し、ユーザに通知していた。   In the conventional information distribution system, as described in Patent Document 1 and Patent Document 2, the system is a Web-based system so that a user can grasp whether or not a Web page (hereinafter also referred to as a Web page) has been updated. The presence / absence of a page update is detected according to preset conditions, and the user is notified.

また、ユーザがWebページの更新情報を取得できるようにするため、非特許文献1で開示されているように、RSS(RDF Site Summery)という形式でWebページ提供者が更新情報を作成し、配信する方法も見られる。   In addition, in order to allow the user to acquire update information on the Web page, as disclosed in Non-Patent Document 1, the Web page provider creates update information in the form of RSS (RDF Site Summery) and distributes it. You can also see how to do it.

さらに、ユーザがWebページの更新情報のみを取得して通信費を抑制できるようにするため、特許文献3に記載されているように、システムがWebページの指定された情報のみをその情報が更新された時にユーザに配信したり、特許文献4に記載されているように、システムが多様なWebページの更新情報を抽出し所定の形式に生成の上、ユーザに配信する方法も考えられている。   Furthermore, in order to allow the user to acquire only the update information of the Web page and reduce the communication cost, as described in Patent Document 3, the system updates only the specified information of the Web page. As described in Japanese Patent Application Laid-Open No. 2004-133620, a method is also conceivable in which the system extracts update information of various Web pages, generates them in a predetermined format, and distributes them to the users. .

特開2004−199595号公報Japanese Patent Laid-Open No. 2004-199595 特開2006−048327号公報JP 2006-048327 A 特開2003−248613号公報JP 2003-248613 A 特開2005−284334号公報JP 2005-284334 A ”RSSフィールドについて”、[online]、atmarkit、[平成18年7月18日検索]、インターネット<URL:http://www.atmarkit.co.jp/aboutus/rss/rss.html>"About the RSS field", [online], atmarkit, [searched July 18, 2006], Internet <URL: http://www.atmarkit.co.jp/aboutus/rss/rss.html>

特許文献1に記載されているシステムでは、複数のデータ変動タイプに分類し、データ変動タイプを用いて通知条件を設定して、不必要な更新通知を受けないようにすることができる。しかしながら、特許文献1に記載されているシステムでは、何についての情報が更新されたか等は示されず、数多くの更新情報が通知されれば、やはりユーザに無駄な閲覧作業を強いることになってしまう。   In the system described in Patent Document 1, it is possible to categorize into a plurality of data variation types and set notification conditions using the data variation types so that unnecessary update notifications are not received. However, the system described in Patent Document 1 does not indicate what information has been updated, and if a large amount of update information is notified, the user is forced to perform useless browsing work. .

また、特許文献2に記載されているシステムでは、項目を指定することでユーザが関心のある項目についてのみ更新情報を通知することができるが、各項目の領域などをユーザに指定させる手間がかかってしまう。また、ユーザが複数の項目を指定した場合には、結局元のWebページを改めて閲覧しなければ何についての情報が更新されたかを確認することができない。なお、何についての情報が更新されたかが示されない点では、特許文献3に記載されているシステムも同様である。   Further, in the system described in Patent Document 2, update information can be notified only for items that the user is interested in by specifying the items, but it takes time and effort for the user to specify the area of each item. End up. In addition, when the user designates a plurality of items, it is impossible to confirm what information has been updated unless the original Web page is browsed again. The system described in Patent Document 3 is similar in that it does not indicate what information has been updated.

また、特許文献4に記載されているシステムでは、ユーザが設定することで、更新通知の対象となるWebページのURLの各々、または1まとまりにタイトルを設定することで識別を容易にすることができると記載されているが、ユーザに設定させる手間がかかってしまう。また、URLを単位にタイトルをつけただけでは、多くのWebページに見られるように、複数のフレームにより1ページが構成されているような場合には、やはり何についての情報が更新されたかがわからないことになる。   Further, in the system described in Patent Document 4, identification is facilitated by setting a title for each or a set of URLs of a Web page that is a target of update notification when set by a user. Although it is described that it can be done, it takes time and effort for the user to set. In addition, if only a title is given in units of URLs, as is seen in many Web pages, when one page is composed of a plurality of frames, it is not possible to know what information has been updated. It will be.

また、非特許文献1で開示されているRSSを用いた場合には、Webページ提供者側に、RSS形式で更新情報を作成させ、公開させる手間が必要となる。   In addition, when RSS disclosed in Non-Patent Document 1 is used, it is necessary for the Web page provider side to create and release update information in the RSS format.

このように、従来技術の問題点は、Webページ提供者やユーザからの特段の支援なくWebページの更新情報を抽出・配信する情報配信システムにおいて、更新情報を分かりやすく提供できないことである。その理由は、従来の情報配信システムでは更新情報の適度な周辺情報が提供されないためである。更新情報の前後一定文字を併せて提供する方法もあるが、加減がWebページに依存するため難しい。   As described above, the problem with the prior art is that update information cannot be provided in an easy-to-understand manner in an information distribution system that extracts and distributes Web page update information without special support from Web page providers and users. This is because the conventional information distribution system does not provide appropriate peripheral information of the update information. There is a method of providing a fixed character before and after the update information, but it is difficult because it depends on the Web page.

そこで、本発明の目的は、Webページ提供者やユーザからの特段の支援なくWebページの更新情報を分かりやすく提供できるようにすることである。   Accordingly, an object of the present invention is to provide update information of a Web page in an easy-to-understand manner without special support from a Web page provider or a user.

本発明による情報配信システムは、ウェブページの更新された情報を示す更新情報を配信する情報配信システムであって、更新情報に、意味的に関連する情報を掲載しているウェブページの画面上の領域の単位であるセクションであって、更新情報を含むセクションを示す情報を付加した配信用更新情報を生成することを特徴とする。   An information distribution system according to the present invention is an information distribution system that distributes update information indicating updated information of a web page, on the screen of a web page in which information that is semantically related to the update information is posted. Distribution update information is generated by adding information indicating a section that is a unit of an area and that includes the update information.

また、情報配信システムは、直近複数時点のウェブページデータを比較して更新情報を抽出する更新情報抽出手段(例えば、更新情報抽出手段22)と、ウェブページデータに基づいて、ウェブページのレイアウトを解析し、セクションを抽出するレイアウト解析手段(例えば、レイアウト解析手段23)と、更新情報抽出手段で抽出された更新情報を含むレイアウト解析手段で抽出されたセクションを、更新セクションとして抽出する更新セクション抽出手段(例えば、更新セクション抽出手段24)と、更新情報抽出手段で抽出された更新情報に、更新セクション抽出手段が抽出した更新セクションを示す情報を付加した配信用更新情報を生成する更新情報整形手段(例えば、更新情報整形手段25)とを備えていてもよい。   In addition, the information distribution system compares the web page data at the most recent time points and extracts update information (for example, the update information extraction unit 22), and the layout of the web page based on the web page data. Update section extraction that extracts a section extracted by a layout analysis unit (for example, layout analysis unit 23) that analyzes and extracts a section, and a section that is extracted by the layout analysis unit that includes update information extracted by the update information extraction unit. Means (for example, update section extraction means 24), and update information shaping means for generating update information for distribution by adding information indicating the update section extracted by the update section extraction means to the update information extracted by the update information extraction means (For example, update information shaping means 25).

また、情報配信システムは、ユーザを識別するためのユーザ識別情報と、ユーザが指定したURIと、URIで特定されるウェブページのウェブページデータと、ウェブページデータの取得時間とを対応づけて記憶するウェブページ記憶手段(例えば、Webページ記憶部31)を備え、更新抽出手段は、指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近複数時点のウェブページデータを比較し、レイアウト解析手段は、指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近のウェブページデータに基づいて、ウェブページのレイアウトを解析してもよい。   The information distribution system stores user identification information for identifying the user, a URI specified by the user, web page data of the web page specified by the URI, and acquisition time of the web page data in association with each other. Web page storage means (for example, a web page storage unit 31), and the update extraction means includes webs at a plurality of points in time nearest to the web page specified by the designated URI stored in association with the designated user identification information. Comparing the page data, the layout analysis means analyzes the layout of the web page based on the latest web page data of the web page specified by the designated URI stored in association with the designated user identification information. May be.

また、情報配信システムは、ユーザ識別子と、ユーザ識別子で識別されるユーザが指定したURIとを対応づけて記憶するURI記憶手段(例えば、URI記憶部32)と、指定のURIで特定されるウェブページのウェブページデータを取得するウェブページデータ取得手段(例えば、Webページ取得手段21)と、定期的に、ウェブページデータ取得手段に、URI記憶手段に記憶されているURIで特定されるウェブページのウェブページデータを取得させ、取得時間とユーザ識別子と対応づけてウェブページ記憶手段に記憶させる定期実行制御手段(例えば、定期実行制御手段28)とを備えていてもよい。   In addition, the information distribution system includes a URI storage unit (for example, a URI storage unit 32) that stores a user identifier and a URI specified by the user identified by the user identifier in association with each other, and a web specified by the specified URI. Web page data acquisition means (for example, web page acquisition means 21) for acquiring the web page data of the page, and a web page specified by the URI stored in the URI storage means in the web page data acquisition means periodically. Periodic execution control means (for example, periodic execution control means 28) for acquiring the web page data and storing it in the web page storage means in association with the acquisition time and the user identifier.

また、更新情報抽出手段は、更新時刻をも抽出し、更新情報整形生成手段は、更新情報抽出手段によって抽出された更新情報に、更新時刻をさらに付加した配信用更新情報を生成してもよい。   The update information extraction unit may also extract the update time, and the update information shaping generation unit may generate distribution update information in which the update time is further added to the update information extracted by the update information extraction unit. .

また、更新情報整形手段は、配信用更新情報を更新時刻順に配列させて生成してもよい。   Further, the update information shaping means may generate the update information for distribution by arranging in order of update time.

また、本発明による情報配信装置は、ウェブページの更新された情報を示す更新情報を配信する情報配信システムに適用される情報配信装置であって、直近複数時点のウェブページデータを比較して更新情報を抽出する更新情報抽出手段と、ウェブページデータに基づいて、ウェブページのレイアウトを解析し、セクションを抽出するレイアウト解析手段と、更新情報抽出手段で抽出された更新情報を含むレイアウト解析手段で抽出されたセクションを、更新セクションとして抽出する更新セクション抽出手段と、更新情報抽出手段で抽出された更新情報に、更新セクション抽出手段が抽出した更新セクションを示す情報を付加した配信用更新情報を生成する更新情報整形手段とを備えたことを特徴とする。   An information distribution apparatus according to the present invention is an information distribution apparatus applied to an information distribution system that distributes update information indicating updated information of a web page, and compares and updates web page data at the most recent time points. Update information extraction means for extracting information, layout analysis means for analyzing the layout of the web page based on the web page data, extracting sections, and layout analysis means including update information extracted by the update information extraction means Update section extraction means for extracting the extracted section as an update section, and update information for distribution is generated by adding the information indicating the update section extracted by the update section extraction means to the update information extracted by the update information extraction means Update information shaping means.

また、本発明による情報配信方法は、ウェブページの更新された情報を示す更新情報を配信する情報配信方法であって、直近複数時点のウェブページデータを比較して更新情報を抽出し、ウェブページデータに基づいて、ウェブページのレイアウトを解析し、セクションを抽出し、抽出された更新情報を含むセクションを、更新セクションとして抽出し、抽出された更新情報に、更新セクションを示す情報を付加した配信用更新情報を生成することを特徴とする。   An information distribution method according to the present invention is an information distribution method for distributing update information indicating updated information of a web page, comparing the web page data at the most recent time points, extracting the update information, Based on the data, analyze the layout of the web page, extract the sections, extract the sections containing the extracted update information as update sections, and add the information indicating the update section to the extracted update information Update information is generated.

また、ユーザを識別するためのユーザ識別情報と、ユーザが指定したURIと、URIで特定されるウェブページのウェブページデータと、ウェブページデータの取得時間とを対応づけて記憶し、指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近複数時点のウェブページデータを比較して更新情報を抽出し、指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近のウェブページデータに基づいて、ウェブページのレイアウトを解析してもよい。   Further, the user identification information for identifying the user, the URI designated by the user, the web page data of the web page specified by the URI, and the acquisition time of the web page data are stored in association with each other. The update information is extracted by comparing the web page data at the most recent time points of the web page specified by the designated URI stored in association with the identification information, and stored in association with the designated user identification information. The layout of the web page may be analyzed based on the latest web page data of the web page specified by the designated URI.

また、ユーザ識別子と、ユーザ識別子で識別されるユーザが指定したURIとを対応づけて記憶し、定期的に、ウェブページデータ取得手段に、URI記憶手段に記憶されているURIで特定されるウェブページのウェブページデータを取得し、取得時間とユーザ識別子と対応づけて記憶させてもよい。   Further, a user identifier and a URI specified by the user identified by the user identifier are stored in association with each other, and periodically specified by the URI stored in the URI storage unit in the web page data acquisition unit. The web page data of the page may be acquired and stored in association with the acquisition time and the user identifier.

また、更新情報の抽出において更新時刻をも抽出し、抽出された更新情報に、更新時刻をさらに付加した配信用更新情報を生成してもよい。   In addition, the update time may also be extracted in the update information extraction, and distribution update information in which the update time is further added to the extracted update information may be generated.

また、配信用更新情報の生成において、更新情報を更新時刻順に配列させてもよい。   Further, in the generation of distribution update information, the update information may be arranged in order of update time.

また、本発明による情報配信用プログラムは、ウェブページの更新された情報を示す更新情報を配信するための情報配信用プログラムであって、コンピュータに、直近複数時点のウェブページデータを比較して更新情報を抽出する処理、ウェブページデータに基づいて、ウェブページのレイアウトを解析し、セクションを抽出する処理、抽出された更新情報を含むセクションを、更新セクションとして抽出する処理、および抽出された更新情報に、更新セクションを示す情報を付加した配信用更新情報を生成する処理を実行させることを特徴とする。   An information distribution program according to the present invention is an information distribution program for distributing update information indicating updated information of a web page, and updates the computer by comparing the web page data at the most recent time points with a computer. Processing for extracting information, processing for analyzing the layout of a web page based on web page data, extracting a section, processing for extracting a section including extracted update information as an update section, and extracted update information In addition, a process of generating update information for distribution to which information indicating an update section is added is executed.

また、コンピュータに、ユーザを識別するためのユーザ識別情報と、ユーザが指定したURIと、URIで特定されるウェブページのウェブページデータと、ウェブページデータの取得時間とを対応づけて記憶装置に記憶させる処理、指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近複数時点のウェブページデータを比較して更新情報を抽出する処理、および指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近のウェブページデータに基づいて、ウェブページのレイアウトを解析する処理を実行させてもよい。   Also, the user identification information for identifying the user, the URI designated by the user, the web page data of the web page specified by the URI, and the acquisition time of the web page data are associated with the computer in the storage device. Processing to store, processing to extract update information by comparing web page data at the most recent time points of a web page specified by a specified URI stored in association with specified user identification information, and specified user identification A process of analyzing the layout of the web page may be executed based on the latest web page data of the web page specified by the specified URI stored in association with the information.

また、コンピュータに、ユーザ識別子と、ユーザ識別子で識別されるユーザが指定したURIとを対応づけて記憶装置に記憶させる処理、および定期的に、ウェブページデータ取得手段に、URI記憶手段に記憶されているURIで特定されるウェブページのウェブページデータを取得し、取得時間とユーザ識別子と対応づけて記憶装置に記憶させる処理を実行させてもよい。   Further, the computer stores the user identifier and the URI specified by the user identified by the user identifier in association with each other and stores them in the storage device, and periodically stores them in the web page data acquisition unit and the URI storage unit. The web page data of the web page specified by the current URI may be acquired, and a process of associating the acquisition time with the user identifier and storing it in the storage device may be executed.

また、コンピュータに、更新情報の抽出において更新時刻を抽出させ、抽出された更新情報に、更新時刻をさらに付加した配信用更新情報を生成させてもよい。   Alternatively, the computer may cause the update time to be extracted in the extraction of the update information and generate update information for distribution in which the update time is further added to the extracted update information.

また、配信用更新情報の生成において、更新情報を更新時刻順に配列させてもよい。   Further, in the generation of distribution update information, the update information may be arranged in order of update time.

本発明の効果は、更新情報を適度な周辺情報とともに提供できることにある。この結果更新情報を分かりやすく提供できる。その理由は、Webページの更新情報を抽出し、当該更新情報とウェブページのレイアウト解析結果に基づき更新セクションを抽出し、更新情報に更新セクションを示す情報を付加した配信用更新情報を生成するためである。   An advantage of the present invention is that update information can be provided together with appropriate peripheral information. As a result, update information can be provided in an easy-to-understand manner. The reason for this is that the update information of the Web page is extracted, the update section is extracted based on the update information and the layout analysis result of the Web page, and the update information for distribution in which the information indicating the update section is added to the update information is generated. It is.

実施の形態1.
以下、本実施の形態について図面を参照して説明する。図1は、本発明の第1の実施の形態における情報配信システムに適用される配信サーバの構成例を示すブロック図である。図1に示すように、本発明の第1の実施の形態による配信サーバは、ネットワークカード等の入力装置1と、プログラム制御により動作するデータ処理装置2と、情報を記憶する記憶装置3と、ネットワークカード等の出力装置4とを含む。配信サーバは、例えば、ユーザが操作するユーザ端末からの要求に従って更新情報を配信するサーバ装置によって実現される。なお、図示していないが、情報配信システムとしては、更新情報を配信する配信サーバの他に、ユーザが操作し更新情報の配信先となるユーザ端末と、Webページを公開するWebサーバとを備え、各装置がインターネット等の通信ネットワークを介して接続されて構成される。
Embodiment 1 FIG.
Hereinafter, the present embodiment will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration example of a distribution server applied to the information distribution system according to the first embodiment of the present invention. As shown in FIG. 1, a distribution server according to the first embodiment of the present invention includes an input device 1 such as a network card, a data processing device 2 that operates under program control, a storage device 3 that stores information, And an output device 4 such as a network card. The distribution server is realized, for example, by a server device that distributes update information according to a request from a user terminal operated by a user. Although not shown, the information distribution system includes, in addition to a distribution server that distributes update information, a user terminal that is operated by a user and serves as a distribution destination of update information, and a Web server that publishes a Web page. Each device is configured to be connected via a communication network such as the Internet.

また、記憶装置3は、Webページ記憶部31を備える。Webページ記憶部31は、ユーザを識別するためのユーザIDと、更新情報の取得対象とするWebページのURI(Uniform Resource Identifier)と、URIで特定されるWebページのWebページデータと、取得時刻とを対応づけて記憶する。   In addition, the storage device 3 includes a Web page storage unit 31. The Web page storage unit 31 includes a user ID for identifying a user, a URI (Uniform Resource Identifier) of a Web page for which update information is to be acquired, Web page data of a Web page specified by the URI, and an acquisition time Are stored in association with each other.

また、データ処理装置2は、Webページ取得手段21と、更新情報抽出手段22と、レイアウト解析手段23と、更新セクション抽出手段24と、更新情報整形手段25と、更新情報配信手段26とを備える。   Further, the data processing device 2 includes a Web page acquisition unit 21, an update information extraction unit 22, a layout analysis unit 23, an update section extraction unit 24, an update information shaping unit 25, and an update information distribution unit 26. .

Webページ取得手段21は、入力装置1から与えられたURIに対応するWebページのデータ(Webページデータ)を取得し、入力装置1から与えられたユーザID、WebページのURI、取得時刻とともにWebページ記憶部31に記憶させる。更新情報抽出手段22は、入力装置1から与えられたユーザIDとURIとに対応する直近複数時点のWebページデータをWebページ記憶部31から取得し、これらを比較して更新情報(更新された情報)を抽出する。   The Web page acquisition unit 21 acquires Web page data (Web page data) corresponding to the URI given from the input device 1, and the Web ID together with the user ID, Web page URI, and acquisition time given from the input device 1. It is stored in the page storage unit 31. The update information extraction unit 22 acquires the web page data at the latest plural time points corresponding to the user ID and the URI given from the input device 1 from the web page storage unit 31 and compares them to update information (updated) Information).

レイアウト解析手段23は、入力装置1から与えられたユーザIDとURIとに対応する直近の(または比較に用いた)WebページデータをWebページ記憶部31から取得し、レイアウト(Webページの画面レイアウト)を解析し、レイアウトを構成するセクションやその見出しを抽出する。一般に、Webページの画面では、意味的に関連する情報を掲載した1つ以上の領域がレイアウトされ、一部の領域はその内容が一目で分かる標題を持つ。ここで、意味的に関連する情報とは、ある事柄に一定の基準で関わりのある情報をいう。具体的には、”ある事柄”が、その領域の標題となる。なお、ある事柄にある基準で(例えば、情報の詳細さのレベルで)関わりのある情報が一つしかない場合は、領域内に掲載される情報が一つとなる。本実施の形態において、セクションとは、意味的に関連する情報を掲載している、Webページの画面レイアウト上の領域をいう。また、見出しとは、セクション内で掲載している情報の標題を示す情報をいう。   The layout analysis unit 23 acquires the latest (or used for comparison) Web page data corresponding to the user ID and the URI given from the input device 1 from the Web page storage unit 31, and performs layout (screen layout of the Web page). ) To extract the sections and headings that make up the layout. In general, on the screen of a Web page, one or more areas on which semantically related information is posted are laid out, and some areas have titles that allow the contents to be seen at a glance. Here, the semantically related information is information related to a certain matter on a certain standard. Specifically, “something” becomes the title of the area. In addition, when there is only one piece of information related to a certain standard (for example, at the level of detail of information), only one piece of information is displayed in the area. In the present embodiment, a section refers to an area on the screen layout of a Web page in which semantically related information is posted. The heading refers to information indicating the title of information posted in a section.

更新セクション抽出手段24は、更新情報抽出手段22で抽出された更新情報と、レイアウト解析手段23で解析されたレイアウト解析結果(例えば、セッションの区切りを示す情報やセッションの見出し)とを取得し、更新情報を含むセクションを更新セクションとして抽出する。なお、更新情報が仮に削除された情報であった場合には、更新前のWebページにおいて削除された情報を含んでいたセクションを更新セクションとして抽出すればよい。   The update section extraction unit 24 acquires the update information extracted by the update information extraction unit 22 and the layout analysis result (for example, information indicating a session delimiter or a session header) analyzed by the layout analysis unit 23, A section including update information is extracted as an update section. If the update information is information that has been deleted, a section that includes the deleted information in the Web page before the update may be extracted as an update section.

更新情報整形手段25は、更新情報抽出手段22で抽出された更新情報に、更新セクション抽出手段24で抽出された更新セクションを示す情報(例えば、見出しやセクションそのものの情報)を含めた配信用更新情報を生成する。更新情報整形手段25は、例えば、更新情報と更新セクションの見出しとを含む配信用更新情報を生成してもよい。また、配信用更新情報として更新セクション内で掲載されている全ての情報を配信用更新情報として生成してもよい。   The update information shaping unit 25 includes the update information extracted by the update information extraction unit 22 and includes information indicating the update section extracted by the update section extraction unit 24 (for example, information on headings and sections themselves). Generate information. For example, the update information shaping unit 25 may generate update information for distribution including update information and an update section header. Further, all information posted in the update section as distribution update information may be generated as distribution update information.

更新情報配信手段26は、更新情報整形手段25で生成された更新情報(すなわち、配信用更新情報)を出力装置3を用いて所定の方式で配信する。所定の方式としては、更新情報をファイル形式に変換して直接要求元に送信する、更新情報をファイル形式に変換してWebサーバに配置する、更新情報をメールで送信する等を用いることができる。   The update information distribution unit 26 distributes the update information (that is, distribution update information) generated by the update information shaping unit 25 using the output device 3 in a predetermined manner. As the predetermined method, the update information can be converted into a file format and transmitted directly to the request source, the update information can be converted into a file format and placed on a Web server, or the update information can be transmitted by e-mail. .

ここで、更新情報抽出手段22は、入力装置1から与えられたユーザIDにつき、複数のURIに対応するそれぞれの直近複数時点のWebページデータをWebページ記憶部31から取得し、これらを比較し、更新情報を抽出し、更新情報整形手段25は、更新情報抽出手段22で抽出された更新情報に、更新セクション抽出手段24で抽出された更新セクションやその見出しの情報を付加してURI順に配列した、複数のWebページの統合された配信用更新情報を生成してもよい。   Here, the update information extraction unit 22 acquires, from the web page storage unit 31, the web page data at the most recent time points corresponding to the plurality of URIs for the user ID given from the input device 1, and compares them. The update information is extracted, and the update information shaping means 25 adds the update section extracted by the update section extraction means 24 and the heading information to the update information extracted by the update information extraction means 22 and arranges them in URI order. The update information for distribution in which a plurality of Web pages are integrated may be generated.

また、更新情報抽出手段22と更新セクション抽出手段24は、更新時刻をも抽出し、更新情報整形手段25は、更新情報抽出手段22で抽出された更新情報に更新時刻をさらに付加した配信用更新情報を生成してもよい。更新時刻は、例えば、比較したWebページデータの取得時間に基づいて抽出すればよい。また、更新情報整形手段25は、更新時刻順に配列した配信用更新情報を生成してもよい。また、更新情報整形手段25は、セクションの更新履歴を含んだ配信用更新情報を生成してもよい。   The update information extraction unit 22 and the update section extraction unit 24 also extract the update time, and the update information shaping unit 25 updates the distribution information by adding the update time to the update information extracted by the update information extraction unit 22. Information may be generated. What is necessary is just to extract update time based on the acquisition time of the compared web page data, for example. Further, the update information shaping means 25 may generate distribution update information arranged in the order of update times. Further, the update information shaping unit 25 may generate distribution update information including a section update history.

また、更新情報整形手段25は、例えば、更新セクション抽出手段24で抽出された更新セクションやその見出しの情報を、[見出し][セクション][見出し]・・・の形式で配列したり、[見出し][セクション内の更新情報][見出し]・・・の形式で配列したり、[見出し][セクション][見出し]・・・の形式で配列しセクション内の更新情報を例えば太字で示したり、画面上のセクション位置を示すアイコンを用い、[アイコン][セクション][アイコン]・・・の形式で配列したりした配信用更新情報を生成してもよいし、更新情報や更新セクションの表現(色やフォント等)を変えたWebページを配信用更新情報として生成してもよい。   Further, the update information shaping means 25 arranges, for example, the update section extracted by the update section extraction means 24 and the information of the headline in the form of [heading] [section] [heading]. ] [Update information in section] [Heading] ..., arranged in the format [Heading] [Section] [Heading] ..., etc. Using the icons indicating the section positions on the screen, update information for distribution arranged in the form of [icon] [section] [icon]... May be generated. A Web page with a different color, font, etc.) may be generated as distribution update information.

Webページ記憶部31は、具体的には、メモリ等の記憶装置によって実現される。また、Webページ取得手段21、更新情報抽出手段22、レイアウト解析手段23、更新セクション抽出手段24、更新情報整形手段25および更新情報配信手段26は、具体的には、プログラムに従って動作するCPUによって実現される。なお、データ処理装置と記憶装置とは、通信可能に接続されていれば別装置として実現されていてもよい。   Specifically, the Web page storage unit 31 is realized by a storage device such as a memory. Further, the Web page acquisition unit 21, the update information extraction unit 22, the layout analysis unit 23, the update section extraction unit 24, the update information shaping unit 25, and the update information distribution unit 26 are specifically realized by a CPU that operates according to a program. Is done. The data processing device and the storage device may be realized as separate devices as long as they are communicably connected.

次に、本実施の形態の動作について図面を参照して説明する。図2は、本実施の形態における配信サーバの動作例を示すフローチャートである。Webページ取得手段21は、入力装置1から与えられたURIで特定されるWebページにネットワークを介してアクセスし、URIに対応するWebページデータを取得する(ステップA1)。そして、取得したWebページデータを、入力装置1から与えられたユーザIDと、WebページのURIと、Webページデータの取得時間とともに、Webページ記憶部31に記憶させる(ステップA2)。   Next, the operation of the present embodiment will be described with reference to the drawings. FIG. 2 is a flowchart showing an operation example of the distribution server in the present embodiment. The web page acquisition means 21 accesses the web page specified by the URI given from the input device 1 via the network, and acquires web page data corresponding to the URI (step A1). The acquired Web page data is stored in the Web page storage unit 31 together with the user ID given from the input device 1, the Web page URI, and the Web page data acquisition time (step A2).

ユーザIDは、例えば、本システムによる更新情報の配信サービスを受けたいユーザに予め所定の登録手続きを行わせた際に割り当ててもよいし、端末固有情報(携帯電話機の端末固有IDやMACアドレス、IPアドレスなど)を用いてもよい。また、更新情報の取得対象とするWebページのURIは、更新情報を要求するための要求画面を用意し画面操作によって入力させてもよいし、ブックマークのような履歴情報を記憶しておき、その中から選択させてもよい。   The user ID may be assigned, for example, when a user who wants to receive an update information distribution service by the system performs a predetermined registration procedure in advance, or terminal specific information (terminal specific ID or MAC address of a mobile phone, IP address etc.) may be used. Also, the URI of the Web page that is the acquisition target of update information may be prepared by a request screen for requesting update information and input by screen operation, or history information such as a bookmark is stored, You may choose from among them.

更新情報抽出手段22は、入力装置1から与えられたユーザIDとURIとに対応する直近2時点のWebページデータをWebページ記憶部31から取得し、これらを比較し、更新情報を抽出する(ステップA3)。レイアウト解析手段23は、Webページ取得手段21で取得されたWebページデータで示されるWebページについてレイアウトを解析する(ステップA4)。レイアウト解析手段23は、具体的には、レイアウトを解析し、レイアウトを構成するセクションとその見出しを抽出する。   The update information extraction unit 22 acquires the Web page data at the last two points corresponding to the user ID and the URI given from the input device 1 from the Web page storage unit 31, compares them, and extracts update information ( Step A3). The layout analysis unit 23 analyzes the layout of the Web page indicated by the Web page data acquired by the Web page acquisition unit 21 (Step A4). Specifically, the layout analysis means 23 analyzes the layout and extracts sections constituting the layout and their headings.

レイアウト解析手段23は、例えば、Webページデータとして取得された構造化文書または半構造化文書の構造(タグの種類や構造)やレンダリング時の表示上の特徴に基づいて、レイアウトを構成するセクションやその見出しを抽出する。具体的には、特開2006−1555931号公報(参照文献)に開示されているような文書解析システムを用いて実現してもよい。参照文献に開示されている文書解析システムでは、構造化・半構造化文書をレンダリングし、文書記述要素の配置を認識し、一定の方向に配置された文書記述要素をグループ化してレイアウトを解析する。また、レイアウトを解析する際に、文書記述要素の名前、属性、スタイル、内容を所定のタイトル解析ルールと照合しタイトル(すなわち、見出し)を抽出する。タイトル解析ルールは、例えば、h1でタグ付けされた情報や背景色を持つなど、他と比べ表示上顕著な特徴を持つ情報を抽出できるようなルールであってもよい。   The layout analysis means 23, for example, the sections constituting the layout based on the structure (tag type and structure) of the structured document or semi-structured document acquired as Web page data and the display characteristics at the time of rendering. Extract the headline. Specifically, it may be realized using a document analysis system as disclosed in Japanese Patent Application Laid-Open No. 2006-1555931 (reference document). The document analysis system disclosed in the reference document renders structured / semi-structured documents, recognizes the placement of document description elements, and analyzes the layout by grouping document description elements arranged in a certain direction. . Further, when analyzing the layout, the name (attribute), style, and content of the document description element are compared with a predetermined title analysis rule to extract a title (ie, heading). The title analysis rule may be, for example, a rule that can extract information having features that are more noticeable than others, such as information tagged with h1 and a background color.

更新セクション抽出手段24は、更新情報抽出手段22で抽出された更新情報と、レイアウト解析手段23で解析されたレイアウト解析結果(例えば、セッションの区切りを示す情報やセッションの見出し)とを取得し、レイアウトを構成する各セクションについて、セクションが更新情報を含むか順に判定し、更新セクションを抽出する(ステップA5)。更新情報整形手段25は、更新情報抽出手段22で抽出された更新情報を元に、更新セクション抽出手段24で抽出された更新セクションを用いて、更新情報を整形する(ステップA6)。更新情報整形手段25は、更新情報抽出手段22で抽出された更新情報に、更新セクション抽出手段24で抽出された更新セクションを示す情報(例えば、更新セクションの見出しや更新セクション内で掲載している情報)を付加した配信用更新情報を生成する。更新情報配信手段26は、更新情報整形手段25で生成された配信用更新情報を出力装置3を用いて所定の方式で配信する(ステップA7)。   The update section extraction unit 24 acquires the update information extracted by the update information extraction unit 22 and the layout analysis result (for example, information indicating a session delimiter or a session header) analyzed by the layout analysis unit 23, For each section constituting the layout, it is determined in order whether the sections include update information, and an update section is extracted (step A5). The update information shaping unit 25 shapes the update information using the update section extracted by the update section extraction unit 24 based on the update information extracted by the update information extraction unit 22 (step A6). The update information shaping unit 25 includes, in the update information extracted by the update information extraction unit 22, information indicating the update section extracted by the update section extraction unit 24 (for example, in the update section heading or the update section). Update information for distribution to which (information) is added is generated. The update information distribution unit 26 distributes the update information for distribution generated by the update information shaping unit 25 using the output device 3 by a predetermined method (step A7).

以上のように、本実施の形態では、意味的に関連する情報を掲載しているWebページの画面レイアウト上の領域のうち、更新情報を含む領域を更新セクションとして抽出し、更新セクションを示す情報を含めて配信するので、更新情報を適度な周辺情報とともに提供することができる。結果、更新情報を分かりやすく提供できる。すなわち、ユーザは、そのWebページが何について更新したかを、そのWebページを改めて閲覧することなく知ることができる。   As described above, in the present embodiment, information indicating the update section is extracted from the area on the screen layout of the Web page on which the semantically related information is posted, as an update section. Therefore, update information can be provided together with appropriate peripheral information. As a result, update information can be provided in an easy-to-understand manner. That is, the user can know what the web page has been updated without browsing the web page again.

なお、本実施の形態では、サーバ側で全ての処理を行う場合について説明したが、例えば、ユーザIDを省略して、クライアント側(ユーザ端末)単体で動作させてもよい。ユーザ端末単体で動作させる場合、具体的には、Webページデータを履歴情報として記憶しておき、Webページ読み込み時に更新情報を表示するようなブラウザによって実現してもよい。また、更新情報の表示は、Webページの代わりに表示させたり、ポップアップ表示させてもよい。   In the present embodiment, the case where all processes are performed on the server side has been described. However, for example, the user ID may be omitted and the client side (user terminal) may be operated alone. When the user terminal is operated alone, specifically, it may be realized by a browser that stores Web page data as history information and displays update information when the Web page is read. Further, the update information may be displayed instead of the Web page or may be displayed in a pop-up manner.

また、サーバ側とクライアント側で連携し処理する構成として、サーバ側にWebページ記憶部31を、クライアント側にそれ以外の構成要素を配してもよい。そのような場合には、記憶装置が貧弱なユーザ端末に代わりサーバ装置が過去のWebページデータを記憶して、更新情報取得時にユーザ端末がサーバ装置からデータを取得すればよい。   Further, as a configuration for processing in cooperation between the server side and the client side, the Web page storage unit 31 may be arranged on the server side, and other components may be arranged on the client side. In such a case, the server device may store past Web page data in place of a user terminal with a poor storage device, and the user terminal may acquire data from the server device when acquiring update information.

また、別の例として、サーバ側にレイアウト解析手段を、クライアント側にそれ以外の構成要素を配してもよい。そのような場合には、データ処理装置が貧弱なユーザ端末に代わりサーバ装置がレイアウト解析処理を実行し、ユーザ端末はサーバ装置が解析したレイアウト解析結果を用いて更新セクションを抽出すればよい。   As another example, layout analysis means may be arranged on the server side and other components may be arranged on the client side. In such a case, the server device executes layout analysis processing instead of the poor user terminal in the data processing device, and the user terminal may extract the update section using the layout analysis result analyzed by the server device.

実施の形態2.
本発明の第2の実施の形態について図面を参照して説明する。図3は、第2の実施の形態における情報配信システムの構成例を示すブロック図である。図3に示すように、本発明の第2の実施の形態における配信サーバは、ネットワークカード等の入力装置1と、プログラム制御により動作するデータ処理装置2と、情報を記憶する記憶装置3と、ネットワークカード等の出力装置4とを含む。本実施の形態では、図1に示す第1の実施の形態と比べて、記憶装置3がURI記憶部32を備える点、およびデータ処理装置2がURI登録手段27と定期実行制御手段28とを備える点が異なる。
Embodiment 2. FIG.
A second embodiment of the present invention will be described with reference to the drawings. FIG. 3 is a block diagram illustrating a configuration example of the information distribution system according to the second embodiment. As shown in FIG. 3, the distribution server according to the second embodiment of the present invention includes an input device 1 such as a network card, a data processing device 2 that operates under program control, a storage device 3 that stores information, And an output device 4 such as a network card. In the present embodiment, compared to the first embodiment shown in FIG. 1, the storage device 3 includes a URI storage unit 32, and the data processing device 2 includes a URI registration unit 27 and a periodic execution control unit 28. The point to prepare is different.

URI記憶部32は、ユーザを識別するためのユーザIDと、更新情報の取得対象とするWebページのURIとを記憶する。   The URI storage unit 32 stores a user ID for identifying a user and a URI of a Web page for which update information is to be acquired.

URI登録手段27は、入力装置1から与えられたユーザIDとURIとをURI記憶部32に記憶させる。URI登録手段27は、例えば、登録手続きを行ったユーザに対し、更新情報の取得対象とするWebページのURIを指定するためのURI登録画面を用意し、画面操作によって入力されるURIを、ユーザIDと対応づけて登録(記憶)する。なお、URI記憶部32には、例えば、いずれかのユーザに指定されたURIと対応づけて、そのURIを指定したユーザを記憶させてもよい。   The URI registration unit 27 stores the user ID and URI given from the input device 1 in the URI storage unit 32. For example, the URI registration unit 27 prepares a URI registration screen for designating the URI of the Web page for which update information is to be acquired for the user who has performed the registration procedure. It is registered (stored) in association with the ID. The URI storage unit 32 may store, for example, a user who specifies the URI in association with a URI specified by any user.

定期実行制御手段28は、URI記憶部32からユーザIDとURIとを定期的に取得し、Webページ取得手段21を用いて当該URIに対応するWebページデータを取得させ、ユーザIDと、URIと、取得したWebページデータと、その取得時刻とをWebページ記憶部31に記憶する。   The periodic execution control means 28 periodically acquires the user ID and URI from the URI storage unit 32, causes the Web page acquisition means 21 to acquire Web page data corresponding to the URI, and acquires the user ID, URI, The acquired Web page data and the acquisition time are stored in the Web page storage unit 31.

なお、本実施の形態では、Webページ取得手段21は、定期実行制御手段27から与えられたURIで特定されるWebページにネットワークを介してアクセスし、URIに対応するWebページデータを取得する。   In the present embodiment, the Web page acquisition unit 21 accesses the Web page specified by the URI given from the periodic execution control unit 27 via the network, and acquires Web page data corresponding to the URI.

ここで、Webページ取得手段21は、入力装置1から与えられたURIに対応するWebページを取得し、入力装置1から与えられたユーザIDと、WebページのURIと、Webページデータと取得時刻とをWebページ記憶部31に記憶してもよい。なお、Webページ記憶部31ではユーザIDを省略してもよい。そのような場合には、URI記憶部32を参照してURIとユーザIDとを対応づければよい。   Here, the Web page acquisition unit 21 acquires a Web page corresponding to the URI given from the input device 1, the user ID given from the input device 1, the URI of the Web page, the Web page data, and the acquisition time. May be stored in the Web page storage unit 31. The web page storage unit 31 may omit the user ID. In such a case, the URI and the user ID may be associated with each other with reference to the URI storage unit 32.

また、URI登録手段27は、更新情報抽出手段22に与えられたユーザIDとURIとを監視し、これらがURI記憶部32に記憶されていない場合に、当該ユーザIDとURIをURI記憶部32に記憶してもよい。   Further, the URI registration unit 27 monitors the user ID and URI given to the update information extraction unit 22, and when these are not stored in the URI storage unit 32, the user ID and URI are displayed in the URI storage unit 32. May be stored.

URI記憶部32は、具体的には、メモリ等の記憶装置によって実現される。URI登録手段27および定期実行制御手段28は、具体的には、プログラムに従って動作するCPUによって実現される。   Specifically, the URI storage unit 32 is realized by a storage device such as a memory. Specifically, the URI registration unit 27 and the periodic execution control unit 28 are realized by a CPU that operates according to a program.

次に、本実施の形態の動作について図4〜図6を参照して説明する。図4〜図6は、本実施の形態における情報配信システムの動作例を示すフローチャートである。まず、URI登録手段27は、入力装置1から与えられたユーザIDとURIとをURI記憶部32に記憶する(図4のステップB1)。   Next, the operation of the present embodiment will be described with reference to FIGS. 4 to 6 are flowcharts showing an operation example of the information delivery system in the present embodiment. First, the URI registration unit 27 stores the user ID and the URI given from the input device 1 in the URI storage unit 32 (step B1 in FIG. 4).

定期実行制御手段28は、URI記憶部32からユーザIDとURIとを定期的に取得し(図5のステップB2)、Webページ取得手段21を制御して、当該URIに対応するWebページデータをネットワーク経由で取得し(図5のステップA1)、取得したWebページデータを、そのURIとユーザIDと取得時刻とともにWebページ記憶部31に記憶する(図5のステップA2)。定期実行制御手段28は、URI記憶部32に他のURI・ユーザIDが記憶されているか否かを判断し(図5のステップB3)、ユーザID・URIに対応する全てのWebページデータを取得するまで、上記処理を繰り返し行う。   The periodic execution control unit 28 periodically acquires the user ID and the URI from the URI storage unit 32 (step B2 in FIG. 5), and controls the Web page acquisition unit 21 to obtain Web page data corresponding to the URI. Acquired via the network (step A1 in FIG. 5), the acquired Web page data is stored in the Web page storage unit 31 together with the URI, user ID, and acquisition time (step A2 in FIG. 5). The periodic execution control means 28 determines whether or not another URI / user ID is stored in the URI storage unit 32 (step B3 in FIG. 5), and acquires all Web page data corresponding to the user ID / URI. Until this is done, the above process is repeated.

なお、複数のユーザが同じURIを登録している場合には、1度取得したWebページデータを、そのURIを登録した全てユーザIDと対応づけられるようにWebページ記憶部31に記憶してもよい。以降の動作(図6のステップA3〜A7)は、図2に示した第1の実施の形態と同様のため、説明は省略する。   If a plurality of users register the same URI, the Web page data acquired once may be stored in the Web page storage unit 31 so as to be associated with all the user IDs registered with the URI. Good. The subsequent operations (steps A3 to A7 in FIG. 6) are the same as those in the first embodiment shown in FIG.

以上のように、本実施の形態によれば、定期的に取得されたWebページデータを用いて、Webページの更新情報を抽出し、抽出した更新情報を含む領域である更新セクションを示す情報を含めて配信するので、定期的な更新情報を適度な周辺情報とともに提供できる。結果、一定時間に生じた更新情報を分かりやすく提供できる。   As described above, according to the present embodiment, Web page update information is extracted using regularly acquired Web page data, and information indicating an update section that is an area including the extracted update information is displayed. Since it is distributed, regular update information can be provided along with appropriate peripheral information. As a result, it is possible to provide easy-to-understand update information generated in a certain time.

実施の形態3.
本発明の第3の実施の形態について図7を参照して説明する。図7は、本発明の第3の実施の形態における配信サーバの構成例を示すブロック図である。図7に示す配信サーバは、第1および第2の実施の形態と同様に、入力装置1、データ処理装置2、記憶装置3、出力装置4を備え、さらに、データ処理装置2に読み込まれデータ処理装置2の動作を制御して、第1または第2の実施の形態におけるデータ処理装置2と同様の処理を実行させるための情報配信用プログラム5を備える。
Embodiment 3 FIG.
A third embodiment of the present invention will be described with reference to FIG. FIG. 7 is a block diagram illustrating a configuration example of a distribution server according to the third embodiment of the present invention. As in the first and second embodiments, the distribution server shown in FIG. 7 includes an input device 1, a data processing device 2, a storage device 3, and an output device 4, and is further read into the data processing device 2 and data An information distribution program 5 is provided for controlling the operation of the processing device 2 to execute the same processing as that of the data processing device 2 in the first or second embodiment.

情報配信用プログラム5は、データ処理装置2に読み込まれデータ処理装置2の動作を制御し、第1または第2の実施の形態におけるデータ処理装置2と同様の処理を実行させる。また、記憶装置3にWebページ記憶部31やURI記憶部32となる記憶領域を割り当て、Webページ記憶部31やURI記憶部32として動作させる。データ処理装置2は、情報配信用プログラム5の制御により、第1または第2の実施の形態におけるデータ処理装置2による処理と同様の処理を実行する。   The information distribution program 5 is read by the data processing device 2 and controls the operation of the data processing device 2 to execute the same processing as the data processing device 2 in the first or second embodiment. In addition, a storage area that becomes the Web page storage unit 31 and the URI storage unit 32 is allocated to the storage device 3, and the storage device 3 is operated as the Web page storage unit 31 and the URI storage unit 32. The data processing device 2 executes processing similar to the processing by the data processing device 2 in the first or second embodiment under the control of the information distribution program 5.

次に、本発明の第1の実施例を図面を参照して説明する。本実施例は、本発明の第1の実施の形態に対応するものである。本実施例は、配信サーバを、ネットワークカードを備えたパーソナルコンピュータと磁気ディスク記憶装置とによって実現する例である。すわなち、本実施例による配信サーバは、入力装置1としてネットワークカードを、データ処理装置2としてパーソナルコンピュータを、記憶装置3として磁気ディスク記憶装置を、出力装置4としてネットワークカードを備えている。   Next, a first embodiment of the present invention will be described with reference to the drawings. This example corresponds to the first embodiment of the present invention. In this embodiment, the distribution server is realized by a personal computer having a network card and a magnetic disk storage device. That is, the distribution server according to the present embodiment includes a network card as the input device 1, a personal computer as the data processing device 2, a magnetic disk storage device as the storage device 3, and a network card as the output device 4.

また、パーソナルコンピュータは、プログラム制御に従い、Webページ取得手段21、更新情報抽出手段22、レイアウト解析手段23、更新セクション抽出手段24、更新情報整形手段25、更新情報配信手段26として機能する中央演算装置を有する。また、磁気ディスク記憶装置には、Webページ記憶部31として、例えば図8に示すような形式で、ユーザIDと、URIと、Webページデータと、取得時間のリストが記憶されている。   The personal computer is a central processing unit that functions as a Web page acquisition unit 21, an update information extraction unit 22, a layout analysis unit 23, an update section extraction unit 24, an update information shaping unit 25, and an update information distribution unit 26 according to program control. Have In the magnetic disk storage device, a list of user IDs, URIs, Web page data, and acquisition times is stored as the Web page storage unit 31, for example, in the format shown in FIG.

図8は、Webページ記憶部31に記憶される情報の一例を示す説明図である。図8では、例えば、ユーザID”user”で識別されるユーザが指定したURI”http://www.nec.co.jp/”について、そのURIで特定されるWebページデータとして”index.html”が取得されていること、またそのWebページデータの取得時間が2006年4月1日18時00分00秒であることが示されている。また、例えば、ユーザID”user2”で識別されるユーザが指定したURI”http://www.nec−x.co.jp/”について、そのURIで特定されるWebページデータとして”index.html”と”logo.gif”が取得されていること、またそのWebページデータの取得時間が2006年4月1日17時55分00秒であることが示されている。   FIG. 8 is an explanatory diagram illustrating an example of information stored in the Web page storage unit 31. In FIG. 8, for example, for the URI “http://www.nec.co.jp/” specified by the user identified by the user ID “user”, “index.html” is the Web page data specified by the URI. "Is acquired, and the acquisition time of the Web page data is 1 April 2006 18:00:00. For example, for the URI “http://www.nec-x.co.jp/” designated by the user identified by the user ID “user2”, “index.html” is specified as the Web page data specified by the URI. “And“ logo.gif ”are acquired, and the acquisition time of the Web page data is 17:55:00 on April 1, 2006.

今、パーソナルコンピュータに対し、”http://pc/update.cgi?uid=user+uri=http://www.nec.co.jp/”という更新情報取得要求があったとする。これは、パーソナルコンピュータが予め公開している更新情報の取得を要求するためのCGI”http://pc/update.cgi”に対し、ユーザIDとして”user”が、更新情報を取得するURIとして”http://www.nec.co.jp/”が、それぞれネットワークカード経由で入力されたことを示す。   Assume that there is an update information acquisition request “http: //pc/update.cgi? Uid = user + uri = http: //www.nec.co.jp/” to the personal computer. This is because “user” as a user ID is a URI for acquiring update information with respect to CGI “http: //pc/update.cgi” for requesting acquisition of update information published in advance by a personal computer. “Http://www.nec.co.jp/” is input via the network card.

中央演算装置は、入力されたURI”http://www.nec.co.jp/”に対応するWebページにネットワーク経由でアクセスし、そのWebページを構成するHTML(Hyper Text Markup Language)、CSS(Cascading Style Sheets)、画像などのデータ(すなわち、Webページデータ)を取得し、ユーザID”user”、URI”http://www.nec.co.jp/”、Webページデータの取得時刻とともに、Webページ記憶部31のリストに追加する。   The central processing unit accesses the Web page corresponding to the input URI “http://www.nec.co.jp/” via the network, and forms an HTML (Hyper Text Markup Language), CSS that configures the Web page. (Cascading Style Sheets), data such as images (that is, Web page data) is acquired, and the user ID “user”, URI “http://www.nec.co.jp/”, together with the Web page data acquisition time , Added to the list of the Web page storage unit 31.

図9は、ユーザからの更新情報取得要求に応じてWebページデータを取得した際にWebページ記憶部31に追加される情報の一例を示す説明図である。図9では、ユーザからの更新情報取得要求に応じてWebページデータを取得したことによって、ユーザID”user”で識別されるユーザが指定したURI”http://www.nec.co.jp/”について、2006年4月1日19時00分00秒に取得したWebページデータ”index.html”がリストに追加されたことを示している。   FIG. 9 is an explanatory diagram illustrating an example of information added to the Web page storage unit 31 when Web page data is acquired in response to an update information acquisition request from the user. In FIG. 9, the URI “http://www.nec.co.jp/designated by the user identified by the user ID“ user ”by acquiring the Web page data in response to the update information acquisition request from the user. ", The web page data“ index.html ”acquired at 19:00 on April 1, 2006 is added to the list.

中央演算装置は、Webページ記憶部31に記憶されているリストから、ユーザID”user”、URI”http://www.nec.co.jp/”に対応する直近2時点のデータ、具体的には2006年4月1日18時00分00秒に取得された”index.html”と2006年4月1日19時00分00秒に取得された”index.html”とを取得し、これらを比較し、所定の抽出ルールに従って更新情報を抽出する。抽出ルールとしては、全情報を比較対象とする、画面上に掲載される情報だけを比較対象とする、色やデザインの変更は無視するといったルールが考えられる。   From the list stored in the Web page storage unit 31, the central processing unit stores the data at the last two points corresponding to the user ID “user”, URI “http://www.nec.co.jp/”, specifically Acquired “index.html” acquired at 18:00:00 on April 1, 2006 and “index.html” acquired at 19:00:00 on April 1, 2006, These are compared, and update information is extracted according to a predetermined extraction rule. As extraction rules, all information can be compared, only information displayed on the screen can be compared, and color and design changes can be ignored.

図10は、更新情報を抽出する対象であるWebページデータの一例としての”index.html”のデータ例を示す説明図である。図10に示すように、ここでは、2006年4月1日19時00分00秒の”index.html”に、”<div>PC新モデル発売</div>”が追加されているものとする。   FIG. 10 is an explanatory diagram showing a data example of “index.html” as an example of Web page data from which update information is extracted. As shown in FIG. 10, “<div> PC new model release </ div>” is added to “index.html” on April 1, 2006, 19:00:00. To do.

中央演算装置は、HTMLのテキストデータを解析し、更新情報として”<div>PC新モデル発売</div>”を抽出する。次に、中央演算装置は、Webページ記憶部31に記憶されているリストから、ユーザID”user”と、URI”http://www.nec.co.jp/”とに対応する直近のデータを取得し、Webページのレイアウトを解析し、レイアウトを構成するセクションとその見出しを抽出する。   The central processing unit analyzes the text data of HTML and extracts “<div> PC new model release </ div>” as update information. Next, the central processing unit selects the latest data corresponding to the user ID “user” and the URI “http://www.nec.co.jp/” from the list stored in the Web page storage unit 31. Are acquired, the layout of the Web page is analyzed, and the sections constituting the layout and their headings are extracted.

図11は、レイアウト解析結果の例を示す説明図である。ここで、中央演算装置は、図11に示すように、Webページデータをレンダリングした結果、3つのセクションと、それらのセクションについて、”NEC”、”NEWS”、”IR”という見出しを抽出する。そして、中央演算装置は、レイアウト解析の結果、抽出された各セクションについて、更新情報”<div>PC新モデル発売</div>”を含むかを順に判定し、更新セクションとして見出し”NEWS”を持ったセクション(図12において網掛けで示すセクション)を抽出する。図12は、更新セクションの抽出例を示す説明図である。   FIG. 11 is an explanatory diagram illustrating an example of a layout analysis result. Here, as shown in FIG. 11, the central processing unit extracts three sections and headings “NEC”, “NEWS”, and “IR” for those sections as a result of rendering the Web page data. Then, the central processing unit sequentially determines whether each section extracted as a result of layout analysis includes update information “<div> PC new model release </ div>”, and finds “NEWS” as an update section. The section (the section indicated by shading in FIG. 12) is extracted. FIG. 12 is an explanatory diagram of an example of extracting update sections.

次に、中央演算装置は、更新セクションとその見出しの情報を取得し、これらを図13に示すように[見出し][セクション]の順に配列した配信用更新情報を生成し、更新情報を出力装置3を用いて送信する。図13は、更新情報の整形例を示す説明図である。   Next, the central processing unit obtains update section information and headline information, generates update information for distribution in which these are arranged in the order of [headline] and [section], as shown in FIG. 3 is used for transmission. FIG. 13 is an explanatory diagram of an example of shaping update information.

図13では、HTML形式で、見出しをclass=”heading”とする<DIV>タグで囲むとともに、更新セクション内で掲載している情報をclass=”body”とする<DIV>タグで囲んで更新情報を整形する例を示している。   In FIG. 13, in the HTML format, the heading is enclosed in <DIV> tags with class = "heading" and the information posted in the update section is enclosed with <DIV> tags with class = "body". An example of shaping information is shown.

次に、本発明の第2の実施例を図面を参照して説明する。本実施例は、本発明の第2の実施の形態に対応するものである。本実施例は、第1の実施例と同様に、配信サーバを、ネットワークカードを備えたパーソナルコンピュータと磁気ディスク記憶装置とによって実現する。   Next, a second embodiment of the present invention will be described with reference to the drawings. This example corresponds to the second embodiment of the present invention. In the present embodiment, as in the first embodiment, the distribution server is realized by a personal computer having a network card and a magnetic disk storage device.

また、パーソナルコンピュータは、プログラム制御に従い、Webページ取得手段21、更新情報抽出手段22、レイアウト解析手段23、更新セクション抽出手段24、更新情報整形手段25、更新情報配信手段26、URI登録手段27、定期実行制御手段28として機能する中央演算装置を有する。   Further, the personal computer follows the program control in accordance with the program control, Web page acquisition means 21, update information extraction means 22, layout analysis means 23, update section extraction means 24, update information shaping means 25, update information distribution means 26, URI registration means 27, A central processing unit that functions as the periodic execution control means 28 is included.

また、磁気ディスク記憶装置には、URI記憶部32として、例えば図14に示すような形式で、ユーザIDとURIのリストを記憶するための記憶領域が確保されているものとする。図14は、URI記憶部32に記憶される情報の一例を示す説明図である。図14に示すように、例えば、更新情報の取得対象とするURIが未登録である場合には、各項目に”null”を記憶しておいてもよい。また、磁気ディスク記憶装置には、Webページ記憶部31として、例えば図15に示すような形式で、ユーザIDと、URIと、Webページデータと、取得時間のリストを記憶するための記憶領域が確保されているものとする。図15は、Webページ記憶部31に記憶される情報の一例を示す説明図である。図15に示すように、例えば、Webページデータが未取得である場合には、各項目に”null”を記憶しておいてもよい。   In the magnetic disk storage device, it is assumed that a storage area for storing a list of user IDs and URIs is secured as the URI storage unit 32, for example, in the format shown in FIG. FIG. 14 is an explanatory diagram illustrating an example of information stored in the URI storage unit 32. As illustrated in FIG. 14, for example, when the URI for which update information is to be acquired is not registered, “null” may be stored in each item. Further, the magnetic disk storage device has a storage area for storing a list of user IDs, URIs, Web page data, and acquisition times in the format shown in FIG. 15 as the Web page storage unit 31. It shall be secured. FIG. 15 is an explanatory diagram illustrating an example of information stored in the Web page storage unit 31. As shown in FIG. 15, for example, when Web page data has not been acquired, “null” may be stored in each item.

今、パーソナルコンピュータに対し、”http://pc/register.cgi?uid=user+uri=http://www.nec.co.jp/というURI登録要求があったとする。これは、パーソナルコンピュータが予め公開している更新情報の取得対象とするURIを登録するためのCGI” http://pc/register.cgi”に対し、ユーザIDとして”user”が、更新情報の取得対象とするURIとして”http://www.nec.co.jp/”が、それぞれネットワークカード経由で入力されたことを示す。   Now, assume that a personal computer has a URI registration request “http: //pc/register.cgi? Uid = user + uri = http: //www.nec.co.jp/. CGI for registering URIs for which update information to be published is to be registered "http: // pc / register. “user” as the user ID and “http: //www.cgi” as the URI for which update information is to be acquired. nec. co. jp / "indicates that each is input via the network card.

中央演算装置は、入力されたユーザID”user”と、URI”http://www.nec.co.jp/”の登録がないことを確認した上で、これらをURI記憶部32のリストに追加する。図16は、ユーザからのURI登録要求に応じてURI記憶部32に追加される情報の一例を示す説明図である。図16では、ユーザからのURI登録要求に応じて、例えば、ユーザID”user”とユーザが指定したURI”http://www.nec.co.jp/”とが対応づけられてリストに追加されたことを示している。   The central processing unit confirms that the input user ID “user” and URI “http://www.nec.co.jp/” are not registered, and stores them in the list of the URI storage unit 32. to add. FIG. 16 is an explanatory diagram illustrating an example of information added to the URI storage unit 32 in response to a URI registration request from the user. In FIG. 16, in response to a URI registration request from the user, for example, the user ID “user” is associated with the URI “http://www.nec.co.jp/” specified by the user and added to the list. It has been shown.

そして、中央演算装置は、URI記憶部32に記憶されているリストから、定期的にユーザID”user”、URI”http://www.nec.co.jp/”を取得し、当該URIで特定されるWebページにネットワーク経由でアクセスし、そのWebページを構成するHTML、CSS、画像などのデータ(Webページデータ)を取得し、ユーザID、URI、Webページデータの取得時間とともに、Webページ記憶部31のリストに追加する。   The central processing unit periodically obtains the user ID “user” and URI “http://www.nec.co.jp/” from the list stored in the URI storage unit 32, and uses the URI. The specified Web page is accessed via the network, data (Web page data) such as HTML, CSS, and images constituting the Web page is acquired, and the Web page is acquired together with the acquisition time of the user ID, URI, and Web page data. It adds to the list of the storage unit 31.

図17は、ユーザから登録のあったURIに対応するWebページデータを定期的に取得した際に、Webページ記憶部31に追加される情報の一例を示す説明図である。図17では、ユーザから登録のあったURIに対応するWebページデータを定期的に取得したことによって、ユーザID”user”が指定したURI”http://www.nec.co.jp/”について、2006年4月1日18時00分00秒に取得したWebページデータ”index.html”と、2006年4月1日19時00分00秒に取得したWebページデータ”index.html”とがリストに追加されたことを示している。なお、図17に示す例では、1時間が経過したことを検出した場合にWebページデータを取得している。   FIG. 17 is an explanatory diagram illustrating an example of information added to the Web page storage unit 31 when Web page data corresponding to a URI registered by the user is periodically acquired. In FIG. 17, the URI “http://www.nec.co.jp/” designated by the user ID “user” by periodically acquiring Web page data corresponding to the registered URI from the user. Web page data “index.html” acquired at 18:00:00 on April 1, 2006, and Web page data “index.html” acquired at 19:00:00 on April 1, 2006, Is added to the list. In the example shown in FIG. 17, Web page data is acquired when it is detected that one hour has passed.

ここで、パーソナルコンピュータに対し、”http://pc/update.cgi?uid=user+uri=http://www.nec.co.jp/”という更新情報取得要求があり、ユーザIDとして”user”が、更新情報を取得するURIとして”http://www.nec.co.jp/”が、それぞれネットワークカード経由で入力されたとする。中央演算装置は、第1の実施例と同様に、Webページ記憶部31に記憶されている情報を元に、更新情報(配信用更新情報)を生成し、出力装置3を用いて送信する。   Here, there is an update information acquisition request for the personal computer “http: //pc/update.cgi? Uid = user + uri = http: //www.nec.co.jp/”, and the user ID is “user”. However, it is assumed that “http://www.nec.co.jp/” is input via a network card as a URI for acquiring update information. As in the first embodiment, the central processing unit generates update information (distribution update information) based on information stored in the Web page storage unit 31 and transmits it using the output device 3.

ここで、第1および第2の実施例について、中央演算装置は、更新情報や更新セクションの元のHTML形式のデータについて、HTML要素の全部または一部を別のHTML要素やXML(Extensible Markup Language)要素、テキストに置換して更新情報を生成してもよい。また、第1および第2の実施例について、中央演算装置は、XML形式の配信用更新情報を生成してもよい。図18は、XML形式で配信用更新情報を生成した例を示す説明図である。   Here, regarding the first and second embodiments, the central processing unit converts all or part of the HTML element into another HTML element or XML (Extensible Markup Language) for the original HTML format data of the update information or update section. ) Update information may be generated by substituting elements and text. Moreover, about the 1st and 2nd Example, the central processing unit may produce | generate the update information for delivery of an XML format. FIG. 18 is an explanatory diagram showing an example of generating update information for distribution in the XML format.

本発明によれば、Webページの更新情報を配信する情報配信装置や、情報配信装置をコンピュータに実現するためのプログラムといった用途に適用できる。また、Webページの更新情報を計算し端末画面に表示する情報表示装置や機能といった用途にも適用できる。   INDUSTRIAL APPLICABILITY According to the present invention, the present invention can be applied to uses such as an information distribution apparatus that distributes update information of a Web page and a program for realizing the information distribution apparatus on a computer. The present invention can also be applied to uses such as information display devices and functions for calculating update information of a Web page and displaying it on a terminal screen.

本発明の第1の実施の形態における配信サーバの構成例を示すブロック図である。It is a block diagram which shows the structural example of the delivery server in the 1st Embodiment of this invention. 第1の実施の形態における配信サーバの動作例を示すフローチャートである。It is a flowchart which shows the operation example of the delivery server in 1st Embodiment. 第2の実施の形態における配信サーバの構成例を示すブロック図である。It is a block diagram which shows the structural example of the delivery server in 2nd Embodiment. 第2の実施の形態における配信サーバの動作例を示すフローチャートである。It is a flowchart which shows the operation example of the delivery server in 2nd Embodiment. 第2の実施の形態における配信サーバの動作例を示すフローチャートである。It is a flowchart which shows the operation example of the delivery server in 2nd Embodiment. 第2の実施の形態における配信サーバの動作例を示すフローチャートである。It is a flowchart which shows the operation example of the delivery server in 2nd Embodiment. 本発明の第3の実施の形態における配信サーバの構成例を示すブロック図である。It is a block diagram which shows the structural example of the delivery server in the 3rd Embodiment of this invention. Webページ記憶部31に記憶される情報の一例を示す説明図である。4 is an explanatory diagram illustrating an example of information stored in a Web page storage unit 31. FIG. Webページ記憶部31に記憶される情報の一例を示す説明図である。4 is an explanatory diagram illustrating an example of information stored in a Web page storage unit 31. FIG. 更新情報を抽出する対象であるWebページデータの一例を示す説明図である。It is explanatory drawing which shows an example of the web page data which is the object which extracts update information. レイアウト解析結果の例を示す説明図である。It is explanatory drawing which shows the example of a layout analysis result. 更新セクションの抽出例を示す説明図である。It is explanatory drawing which shows the example of extraction of an update section. 更新情報の整形例を示す説明図である。It is explanatory drawing which shows the example of shaping of update information. URI記憶部32に記憶される情報の一例を示す説明図である。5 is an explanatory diagram illustrating an example of information stored in a URI storage unit 32. FIG. Webページ記憶部31に記憶される情報の一例を示す説明図である。4 is an explanatory diagram illustrating an example of information stored in a Web page storage unit 31. FIG. URI記憶部32に追加される情報の一例を示す説明図である。5 is an explanatory diagram illustrating an example of information added to a URI storage unit 32. FIG. Webページ記憶部31に追加される情報の一例を示す説明図である。5 is an explanatory diagram illustrating an example of information added to a Web page storage unit 31. FIG. XML形式で配信用更新情報を生成した例を示す説明図である。It is explanatory drawing which shows the example which produced | generated the update information for delivery in the XML format.

符号の説明Explanation of symbols

1 入力装置
2 データ処理装置
3 記憶装置
4 出力装置
21 Webページ取得手段
22 更新情報抽出手段
23 レイアウト解析手段
24 更新セクション抽出手段
25 更新情報整形手段
26 更新情報配信手段
27 URI登録手段
28 定期実行制御手段
31 Webページ記憶部
32 URI記憶部
DESCRIPTION OF SYMBOLS 1 Input device 2 Data processing device 3 Storage device 4 Output device 21 Web page acquisition means 22 Update information extraction means 23 Layout analysis means 24 Update section extraction means 25 Update information shaping means 26 Update information distribution means 27 URI registration means 28 Periodic execution control Means 31 Web page storage unit 32 URI storage unit

Claims (17)

ウェブページの更新された情報を示す更新情報を配信する情報配信システムであって、
更新情報に、意味的に関連する情報を掲載しているウェブページの画面上の領域の単位であるセクションであって、更新情報を含むセクションを示す情報を付加した配信用更新情報を生成する
ことを特徴とする情報配信システム。
An information distribution system that distributes update information indicating updated information of a web page,
A section that is a unit of an area on the screen of a web page that contains information that is semantically related to the update information, and that generates update information for distribution by adding information indicating the section that contains the update information. An information distribution system characterized by
直近複数時点のウェブページデータを比較して更新情報を抽出する更新情報抽出手段と、
前記ウェブページデータに基づいて、ウェブページのレイアウトを解析し、セクションを抽出するレイアウト解析手段と、
前記更新情報抽出手段で抽出された更新情報を含む前記レイアウト解析手段で抽出されたセクションを、更新セクションとして抽出する更新セクション抽出手段と、
前記更新情報抽出手段で抽出された更新情報に、前記更新セクション抽出手段が抽出した更新セクションを示す情報を付加した配信用更新情報を生成する更新情報整形手段とを備えた
請求項1に記載の情報配信システム。
Update information extraction means for extracting update information by comparing web page data at the most recent time points;
Layout analysis means for analyzing a layout of a web page based on the web page data and extracting a section;
An update section extraction means for extracting the section extracted by the layout analysis means including the update information extracted by the update information extraction means, as an update section;
The update information shaping means which produces | generates the update information for delivery which added the information which shows the update section extracted by the said update section extraction means to the update information extracted by the said update information extraction means. Information distribution system.
ユーザを識別するためのユーザ識別情報と、前記ユーザが指定したURIと、前記URIで特定されるウェブページのウェブページデータと、前記ウェブページデータの取得時間とを対応づけて記憶するウェブページ記憶手段を備え、
更新抽出手段は、指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近複数時点のウェブページデータを比較し、
レイアウト解析手段は、指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近のウェブページデータに基づいて、ウェブページのレイアウトを解析する
請求項2に記載の情報配信システム。
Web page storage for storing user identification information for identifying a user, a URI designated by the user, web page data of a web page specified by the URI, and acquisition time of the web page data in association with each other With means,
The update extraction means compares the web page data at the most recent time points of the web page specified by the designated URI stored in association with the designated user identification information,
The layout analysis means analyzes the layout of the web page based on the latest web page data of the web page specified by the designated URI stored in association with the designated user identification information. Information distribution system.
ユーザ識別子と、前記ユーザ識別子で識別されるユーザが指定したURIとを対応づけて記憶するURI記憶手段と、
指定のURIで特定されるウェブページのウェブページデータを取得するウェブページデータ取得手段と、
定期的に、前記ウェブページデータ取得手段に、前記URI記憶手段に記憶されているURIで特定されるウェブページのウェブページデータを取得させ、取得時間とユーザ識別子と対応づけてウェブページ記憶手段に記憶させる定期実行制御手段とを備えた
請求項3に記載の情報配信システム。
URI storage means for storing a user identifier and a URI specified by the user identified by the user identifier in association with each other;
Web page data acquisition means for acquiring web page data of a web page specified by a specified URI;
Periodically, the web page data acquisition unit acquires the web page data of the web page specified by the URI stored in the URI storage unit, and associates the acquisition time with the user identifier in the web page storage unit. The information distribution system according to claim 3, further comprising periodic execution control means for storing.
更新情報抽出手段は、更新時刻をも抽出し、
更新情報整形生成手段は、前記更新情報抽出手段によって抽出された更新情報に、前記更新時刻をさらに付加した配信用更新情報を生成する
請求項2から請求項4のうちのいずれか1項に記載の情報配信システム。
The update information extraction means also extracts the update time,
5. The update information shaping and generating unit generates distribution update information in which the update time is further added to the update information extracted by the update information extracting unit. 5. Information distribution system.
更新情報整形手段は、配信用更新情報を更新時刻順に配列させて生成する請求項5に記載の情報配信システム。   The information distribution system according to claim 5, wherein the update information shaping unit generates distribution update information by arranging in order of update time. ウェブページの更新された情報を示す更新情報を配信する情報配信システムに適用される情報配信装置であって、
直近複数時点のウェブページデータを比較して更新情報を抽出する更新情報抽出手段と、
前記ウェブページデータに基づいて、ウェブページのレイアウトを解析し、セクションを抽出するレイアウト解析手段と、
前記更新情報抽出手段で抽出された更新情報を含む前記レイアウト解析手段で抽出されたセクションを、更新セクションとして抽出する更新セクション抽出手段と、
前記更新情報抽出手段で抽出された更新情報に、前記更新セクション抽出手段が抽出した更新セクションを示す情報を付加した配信用更新情報を生成する更新情報整形手段とを備えた
ことを特徴とする情報配信装置。
An information distribution device applied to an information distribution system for distributing update information indicating updated information of a web page,
Update information extraction means for extracting update information by comparing web page data at the most recent time points;
Layout analysis means for analyzing a layout of a web page based on the web page data and extracting a section;
An update section extraction means for extracting the section extracted by the layout analysis means including the update information extracted by the update information extraction means, as an update section;
Update information shaping means for generating update information for distribution by adding information indicating the update section extracted by the update section extraction means to the update information extracted by the update information extraction means Distribution device.
ウェブページの更新された情報を示す更新情報を配信する情報配信方法であって、
直近複数時点のウェブページデータを比較して更新情報を抽出し、
前記ウェブページデータに基づいて、ウェブページのレイアウトを解析し、セクションを抽出し、
抽出された更新情報を含む前記セクションを、更新セクションとして抽出し、
抽出された更新情報に、前記更新セクションを示す情報を付加した配信用更新情報を生成する
ことを特徴とする情報配信方法。
An information distribution method for distributing update information indicating updated information of a web page,
Compare web page data from the most recent time points to extract update information,
Based on the web page data, analyze the layout of the web page, extract sections,
Extracting the section containing the extracted update information as an update section;
An information distribution method comprising: generating update information for distribution by adding information indicating the update section to the extracted update information.
ユーザを識別するためのユーザ識別情報と、前記ユーザが指定したURIと、前記URIで特定されるウェブページのウェブページデータと、前記ウェブページデータの取得時間とを対応づけて記憶し、
指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近複数時点のウェブページデータを比較して更新情報を抽出し、
前記指定のユーザ識別情報に対応づけて記憶されている前記指定のURIで特定されるウェブページの直近のウェブページデータに基づいて、ウェブページのレイアウトを解析する
請求項8に記載の情報配信方法。
User identification information for identifying a user, a URI specified by the user, web page data of a web page specified by the URI, and an acquisition time of the web page data are stored in association with each other,
Update the web page data at the most recent time points of the web page specified by the designated URI stored in association with the designated user identification information, and extract update information,
The information distribution method according to claim 8, wherein the layout of the web page is analyzed based on the web page data nearest to the web page specified by the designated URI stored in association with the designated user identification information. .
ユーザ識別子と、前記ユーザ識別子で識別されるユーザが指定したURIとを対応づけて記憶し、
定期的に、前記ウェブページデータ取得手段に、前記URI記憶手段に記憶されているURIで特定されるウェブページのウェブページデータを取得し、取得時間とユーザ識別子と対応づけて記憶させる
請求項9に記載の情報配信方法。
Storing a user identifier and a URI specified by the user identified by the user identifier in association with each other;
The web page data of the web page specified by the URI stored in the URI storage unit is periodically acquired in the web page data acquisition unit, and stored in association with the acquisition time and the user identifier. Information distribution method described in 1.
更新情報の抽出において更新時刻をも抽出し、
抽出された更新情報に、前記更新時刻をさらに付加した配信用更新情報を生成する
請求項8から請求項10のうちのいずれか1項に記載の情報配信方法。
Extract the update time in the update information extraction,
The information distribution method according to any one of claims 8 to 10, wherein the distribution update information is generated by further adding the update time to the extracted update information.
配信用更新情報の生成において、更新情報を更新時刻順に配列させる請求項11に記載の情報配信方法。   The information distribution method according to claim 11, wherein the update information is arranged in order of update time when generating the update information for distribution. ウェブページの更新された情報を示す更新情報を配信するための情報配信用プログラムであって、
コンピュータに、
直近複数時点のウェブページデータを比較して更新情報を抽出する処理、
前記ウェブページデータに基づいて、ウェブページのレイアウトを解析し、セクションを抽出する処理、
抽出された更新情報を含む前記セクションを、更新セクションとして抽出する処理、および
抽出された更新情報に、前記更新セクションを示す情報を付加した配信用更新情報を生成する処理
を実行させるための情報配信用プログラム。
An information distribution program for distributing update information indicating updated information of a web page,
On the computer,
The process of extracting update information by comparing web page data from the most recent time points,
A process of analyzing a layout of the web page and extracting a section based on the web page data;
Information distribution for executing processing for extracting the section including the extracted update information as an update section, and processing for generating distribution update information in which information indicating the update section is added to the extracted update information Program.
コンピュータに、
ユーザを識別するためのユーザ識別情報と、前記ユーザが指定したURIと、前記URIで特定されるウェブページのウェブページデータと、前記ウェブページデータの取得時間とを対応づけて記憶装置に記憶させる処理、
指定のユーザ識別情報に対応づけて記憶されている指定のURIで特定されるウェブページの直近複数時点のウェブページデータを比較して更新情報を抽出する処理、および
前記指定のユーザ識別情報に対応づけて記憶されている前記指定のURIで特定されるウェブページの直近のウェブページデータに基づいて、ウェブページのレイアウトを解析する処理
を実行させる請求項13に記載の情報配信用プログラム。
On the computer,
The user identification information for identifying the user, the URI specified by the user, the web page data of the web page specified by the URI, and the acquisition time of the web page data are stored in the storage device in association with each other. processing,
A process of extracting update information by comparing web page data at the most recent time points of a web page specified by a specified URI stored in association with the specified user identification information, and corresponding to the specified user identification information The information distribution program according to claim 13, wherein a process for analyzing a layout of a web page is executed based on the latest web page data of the web page specified by the specified URI stored together.
コンピュータに、
ユーザ識別子と、前記ユーザ識別子で識別されるユーザが指定したURIとを対応づけて記憶装置に記憶させる処理、および
定期的に、前記ウェブページデータ取得手段に、前記URI記憶手段に記憶されているURIで特定されるウェブページのウェブページデータを取得し、取得時間とユーザ識別子と対応づけて記憶装置に記憶させる処理
を実行させる請求項14に記載の情報配信用プログラム。
On the computer,
A process in which a user identifier and a URI designated by the user identified by the user identifier are associated with each other and stored in a storage device, and periodically stored in the URI storage unit in the web page data acquisition unit The information delivery program according to claim 14, wherein processing for acquiring web page data of a web page specified by a URI and storing the web page data in a storage device in association with an acquisition time and a user identifier is executed.
コンピュータに、
更新情報の抽出において更新時刻を抽出させ、
抽出された更新情報に、前記更新時刻をさらに付加した配信用更新情報を生成させる
請求項13から請求項15のうちのいずれか1項に記載の情報配信用プログラム。
On the computer,
Update time is extracted in the update information extraction,
The information distribution program according to any one of claims 13 to 15, wherein the distribution update information is generated by further adding the update time to the extracted update information.
配信用更新情報の生成において、更新情報を更新時刻順に配列させる請求項16に記載の情報配信用プログラム。   The information distribution program according to claim 16, wherein the update information is arranged in order of update time when generating the distribution update information.
JP2006249264A 2006-09-14 2006-09-14 Information delivery system, information delivery device, information delivery method and information delivery program Pending JP2008071116A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006249264A JP2008071116A (en) 2006-09-14 2006-09-14 Information delivery system, information delivery device, information delivery method and information delivery program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006249264A JP2008071116A (en) 2006-09-14 2006-09-14 Information delivery system, information delivery device, information delivery method and information delivery program

Publications (1)

Publication Number Publication Date
JP2008071116A true JP2008071116A (en) 2008-03-27

Family

ID=39292644

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006249264A Pending JP2008071116A (en) 2006-09-14 2006-09-14 Information delivery system, information delivery device, information delivery method and information delivery program

Country Status (1)

Country Link
JP (1) JP2008071116A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010049515A (en) * 2008-08-22 2010-03-04 Mitsubishi Electric Corp Information processing apparatus and program
JP2010211708A (en) * 2009-03-12 2010-09-24 Brother Ind Ltd Communication apparatus and program
US8291013B2 (en) 2009-03-12 2012-10-16 Brother Kogyo Kabushiki Kaisha Communication apparatus and storage medium storing program
JP2013008332A (en) * 2011-06-27 2013-01-10 Yahoo Japan Corp Portal time line generation device and method
KR101587877B1 (en) * 2014-09-26 2016-01-25 숭실대학교산학협력단 Monitoring system and method thereof, recording medium for performing the method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004362241A (en) * 2003-06-04 2004-12-24 Canon Inc Device and method for creating document update content data, and control program for device
JP2005284334A (en) * 2004-03-26 2005-10-13 Oki Electric Ind Co Ltd Web page update notification method and apparatus

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004362241A (en) * 2003-06-04 2004-12-24 Canon Inc Device and method for creating document update content data, and control program for device
JP2005284334A (en) * 2004-03-26 2005-10-13 Oki Electric Ind Co Ltd Web page update notification method and apparatus

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010049515A (en) * 2008-08-22 2010-03-04 Mitsubishi Electric Corp Information processing apparatus and program
JP2010211708A (en) * 2009-03-12 2010-09-24 Brother Ind Ltd Communication apparatus and program
US8291013B2 (en) 2009-03-12 2012-10-16 Brother Kogyo Kabushiki Kaisha Communication apparatus and storage medium storing program
JP2013008332A (en) * 2011-06-27 2013-01-10 Yahoo Japan Corp Portal time line generation device and method
KR101587877B1 (en) * 2014-09-26 2016-01-25 숭실대학교산학협력단 Monitoring system and method thereof, recording medium for performing the method

Similar Documents

Publication Publication Date Title
US10956531B2 (en) Dynamic generation of mobile web experience
US7865544B2 (en) Method and system for providing XML-based asynchronous and interactive feeds for web applications
US8521892B2 (en) Method and apparatus for controlling web page advertisement through incentives and restrictions
JP5233220B2 (en) Page additional information sharing management method
US20090112824A1 (en) Method and apparatus for generating presentation configuration file of document content
JP2005284334A (en) Web page update notification method and apparatus
JP2009531793A (en) System and method for converting web community and web application data
US20050024355A1 (en) Selecting items displayed on respective areas on a screen
JP2012133515A (en) Information processor, information processing method, program and information processing system
TWI519980B (en) Method and device for displaying web page and computer-readable storage medium
JP2008134906A (en) Business process definition generation method, device and program
JP2008071116A (en) Information delivery system, information delivery device, information delivery method and information delivery program
JP2007072959A (en) Distribution system, terminal device, and program
CN102004729A (en) Method and system for showing website webpage and website server
JP2007172482A (en) Information display system
JP2008123425A (en) Web document data providing device, method, and system
JP2013164666A (en) Portlet processing device, portal server, portal system, portlet processing method and computer program
JP5134639B2 (en) Client apparatus, display method, program, information processing apparatus, and information processing system
JP2009251754A (en) Page customizing server, page customizing program, and page customizing method
JP2007249700A (en) Document management device, document retrieval method, document retrieval program and recording medium
JP5330169B2 (en) Content data providing device
JP2009026013A (en) Content registration/provision device, content registration/provision control method, and content registration/provision control program
WO2013132643A1 (en) Information processing device, method, and program
US8082259B2 (en) Information processing apparatus for extracting objects
JP2009176176A (en) Web page distribution device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090812

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110621

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111018