JP2010231508A - 重要度判定装置、重要度判定方法、およびプログラム - Google Patents
重要度判定装置、重要度判定方法、およびプログラム Download PDFInfo
- Publication number
- JP2010231508A JP2010231508A JP2009078383A JP2009078383A JP2010231508A JP 2010231508 A JP2010231508 A JP 2010231508A JP 2009078383 A JP2009078383 A JP 2009078383A JP 2009078383 A JP2009078383 A JP 2009078383A JP 2010231508 A JP2010231508 A JP 2010231508A
- Authority
- JP
- Japan
- Prior art keywords
- importance
- determination
- article data
- data
- web page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 14
- 238000000605 extraction Methods 0.000 claims abstract description 23
- 239000000284 extract Substances 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000013480 data collection Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】Webページに表示されている記事データの重要度を判定する判定サーバ10は、Webページに含まれるリンクデータおよび記事データを抽出するURL抽出部12と、抽出されたリンクデータが指し示すリンク先のファイルを取得する引用ファイル取得部13と、取得されたファイル内に、記事データの少なくとも一部分が含まれる場合、当該記事データの重要度を低く判定する引用解析部14と、を備える。
【選択図】図3
Description
前記Webページに含まれるリンクデータおよび記事データを抽出する抽出手段と、
前記抽出手段により抽出されたリンクデータが指し示すリンク先のファイルを取得する取得手段と、
前記取得手段により取得されたファイル内に、前記記事データの少なくとも一部分が含まれる場合、当該記事データの重要度を低く判定する判定手段と、を備える重要度判定装置。
前記受信手段は、前記更新情報に基づいて前記重要度を判定する記事データを受信することを特徴とする(1)から(6)のいずれかに記載の重要度判定装置。
前記Webページに含まれるリンクデータおよび記事データを抽出する抽出ステップと、
前記抽出ステップにより抽出されたリンクデータが指し示すリンク先のファイルを取得する取得ステップと、
前記取得ステップにより取得されたファイル内に、前記記事データの少なくとも一部分が含まれる場合、当該記事データの重要度を低く判定する判定ステップと、を含む重要度判定方法。
前記Webページに含まれるリンクデータおよび記事データを抽出する抽出ステップと、
前記抽出ステップにより抽出されたリンクデータが指し示すリンク先のファイルを取得する取得ステップと、
前記取得ステップにより取得されたファイル内に、前記記事データの少なくとも一部分が含まれる場合、当該記事データの重要度を低く判定する判定ステップと、を実行させるプログラム。
図1は、本実施形態に係る判定サーバ10(重要度判定装置)と関連要素とを含んだシステムの全体構成を示す図である。判定サーバ10と、Webサーバ20および21と、ユーザ端末30とは、インターネット等の所定のネットワークを介して接続されている。
図2は、本実施形態に係る判定サーバ10のハードウェア構成を示す図である。判定サーバ10は、制御部110と、記憶部120と、入力部130と、表示部140と、通信部150と、を備え、各ハードウェアは、バス160を介して接続されている。
図3は、本実施形態に係る判定サーバ10の機能構成を示す図である。判定サーバ10の制御部110は、ブログ受信部11(受信手段)と、URL抽出部12(抽出手段)と、引用ファイル取得部13(取得手段)と、引用解析部14(判定手段)と、スプログ判定部15と、を備える。また、記憶部120は、ブログDB16を備える。
図6は、本実施形態に係る判定サーバ10の制御部110における処理を示すフローチャートである。
11 ブログ受信部(受信手段)
12 URL抽出部(抽出手段)
13 引用ファイル取得部(取得手段)
14 引用解析部(判定手段)
15 スプログ判定部
16 ブログDB
Claims (10)
- Webページに表示されている記事データの重要度を判定する重要度判定装置であって、
前記Webページに含まれるリンクデータおよび記事データを抽出する抽出手段と、
前記抽出手段により抽出されたリンクデータが指し示すリンク先のファイルを取得する取得手段と、
前記取得手段により取得されたファイル内に、前記記事データの少なくとも一部分が含まれる場合、当該記事データの重要度を低く判定する判定手段と、を備える重要度判定装置。 - 前記抽出手段は、前記リンクデータ近傍の記事データを、所定の文字列で区切り分割して抽出することを特徴とする請求項1に記載の重要度判定装置。
- 前記判定手段は、前記取得手段により取得されたファイル内に、前記記事データが含まれる量に基づいて、前記記事データの重要度を判定することを特徴とする請求項2に記載の重要度判定装置。
- 前記判定手段は、前記取得手段により取得されたファイル内に、前記記事データが含まれる割合に基づいて、前記Webページの重要度を判定することを特徴とする請求項2に記載の重要度判定装置。
- 前記判定手段は、前記Webページ内において前記リンクデータが記述されている位置と前記記事データが記述されている位置との距離に基づいて、当該記事データの重要度を判定することを特徴とする請求項1から請求項4のいずれかに記載の重要度判定装置。
- 前記判定手段は、前記Webページの所定領域に含まれる複数の前記リンクデータそれぞれに関する判定結果に基づいて、当該所定領域における記事データの重要度を判定することを特徴とする請求項1から請求項5のいずれかに記載の重要度判定装置。
- Webページの更新情報を受信する受信手段をさらに備え、
前記受信手段は、前記更新情報に基づいて前記重要度を判定する記事データを受信することを特徴とする請求項1から請求項6のいずれかに記載の重要度判定装置。 - 前記判定手段は、前記受信手段により受信された更新情報に基づいて、所定の時間帯に更新されたWebページに関して、前記記事データの重要度を判定することを特徴とする請求項7に記載の重要度判定装置。
- コンピュータがWebページに表示されている記事データの重要度を判定する重要度判定方法であって、
前記Webページに含まれるリンクデータおよび記事データを抽出する抽出ステップと、
前記抽出ステップにより抽出されたリンクデータが指し示すリンク先のファイルを取得する取得ステップと、
前記取得ステップにより取得されたファイル内に、前記記事データの少なくとも一部分が含まれる場合、当該記事データの重要度を低く判定する判定ステップと、を含む重要度判定方法。 - Webページに表示されている記事データの重要度をコンピュータに判定させるプログラムであって、
前記Webページに含まれるリンクデータおよび記事データを抽出する抽出ステップと、
前記抽出ステップにより抽出されたリンクデータが指し示すリンク先のファイルを取得する取得ステップと、
前記取得ステップにより取得されたファイル内に、前記記事データの少なくとも一部分が含まれる場合、当該記事データの重要度を低く判定する判定ステップと、を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009078383A JP5216654B2 (ja) | 2009-03-27 | 2009-03-27 | 重要度判定装置、重要度判定方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009078383A JP5216654B2 (ja) | 2009-03-27 | 2009-03-27 | 重要度判定装置、重要度判定方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010231508A true JP2010231508A (ja) | 2010-10-14 |
JP5216654B2 JP5216654B2 (ja) | 2013-06-19 |
Family
ID=43047253
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009078383A Active JP5216654B2 (ja) | 2009-03-27 | 2009-03-27 | 重要度判定装置、重要度判定方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5216654B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012133578A (ja) * | 2010-12-21 | 2012-07-12 | Yahoo Japan Corp | Webページ評価装置及びWebページ評価方法 |
CN103927370A (zh) * | 2014-04-23 | 2014-07-16 | 焦点科技股份有限公司 | 一种组合文字和图片信息的网络资讯批量采集方法 |
JP2014146257A (ja) * | 2013-01-30 | 2014-08-14 | International Business Maschines Corporation | 情報処理装置、情報処理方法、及び、情報処理プログラム |
JP2015090663A (ja) * | 2013-11-07 | 2015-05-11 | 三菱電機株式会社 | テキスト要約装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006338086A (ja) * | 2005-05-31 | 2006-12-14 | Nomura Research Institute Ltd | 話題規模管理装置 |
JP2007052737A (ja) * | 2005-08-19 | 2007-03-01 | Oki Electric Ind Co Ltd | 情報処理装置およびコンピュータプログラム |
JP2007272333A (ja) * | 2006-03-30 | 2007-10-18 | Fujitsu Ltd | Webページ分類プログラム、Webページ分類装置およびWebページ分類方法 |
JP2009508267A (ja) * | 2005-09-13 | 2009-02-26 | グーグル インコーポレイテッド | ブログ文書のランク付け |
-
2009
- 2009-03-27 JP JP2009078383A patent/JP5216654B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006338086A (ja) * | 2005-05-31 | 2006-12-14 | Nomura Research Institute Ltd | 話題規模管理装置 |
JP2007052737A (ja) * | 2005-08-19 | 2007-03-01 | Oki Electric Ind Co Ltd | 情報処理装置およびコンピュータプログラム |
JP2009508267A (ja) * | 2005-09-13 | 2009-02-26 | グーグル インコーポレイテッド | ブログ文書のランク付け |
JP2007272333A (ja) * | 2006-03-30 | 2007-10-18 | Fujitsu Ltd | Webページ分類プログラム、Webページ分類装置およびWebページ分類方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012133578A (ja) * | 2010-12-21 | 2012-07-12 | Yahoo Japan Corp | Webページ評価装置及びWebページ評価方法 |
JP2014146257A (ja) * | 2013-01-30 | 2014-08-14 | International Business Maschines Corporation | 情報処理装置、情報処理方法、及び、情報処理プログラム |
US9904663B2 (en) | 2013-01-30 | 2018-02-27 | International Business Machines Corporation | Information processing apparatus, information processing method, and information processing program |
JP2015090663A (ja) * | 2013-11-07 | 2015-05-11 | 三菱電機株式会社 | テキスト要約装置 |
CN103927370A (zh) * | 2014-04-23 | 2014-07-16 | 焦点科技股份有限公司 | 一种组合文字和图片信息的网络资讯批量采集方法 |
CN103927370B (zh) * | 2014-04-23 | 2015-02-18 | 焦点科技股份有限公司 | 一种组合文字和图片信息的网络资讯批量采集方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5216654B2 (ja) | 2013-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3491544B1 (en) | Web page display systems and methods | |
CN109145280B (zh) | 信息推送的方法和装置 | |
US8601120B2 (en) | Update notification method and system | |
KR102455232B1 (ko) | 콘텍스트 기반 탭 관리를 위한 방법 및 전자 장치 | |
US9304979B2 (en) | Authorized syndicated descriptions of linked web content displayed with links in user-generated content | |
US20140129661A1 (en) | Smart Web Notifications | |
US20150295942A1 (en) | Method and server for performing cloud detection for malicious information | |
CN107153716B (zh) | 网页内容提取方法和装置 | |
US11423096B2 (en) | Method and apparatus for outputting information | |
CN106951270B (zh) | 一种代码处理方法、***及服务器 | |
US20130198240A1 (en) | Social Network Analysis | |
KR20160019090A (ko) | 내장된 미디어에 관련하여 부가 콘텐트를 제공 | |
JP5216654B2 (ja) | 重要度判定装置、重要度判定方法、およびプログラム | |
WO2018145637A1 (zh) | 上网行为记录方法、装置及用户终端 | |
US20110197133A1 (en) | Methods and apparatuses for identifying and monitoring information in electronic documents over a network | |
JP6763433B2 (ja) | 情報収集システム、情報収集方法、及び、プログラム | |
JP5116822B2 (ja) | ユーザ端末にコンテンツマッチ広告を配信する広告配信装置及び方法 | |
CN113656737A (zh) | 网页内容展示方法、装置、电子设备以及存储介质 | |
US20130230248A1 (en) | Ensuring validity of the bookmark reference in a collaborative bookmarking system | |
KR20160032599A (ko) | 사회 이슈에 대한 은폐를 탐지하는 방법 및 판단 장치 | |
US20130311860A1 (en) | Identifying Referred Documents Based on a Search Result | |
JP5089091B2 (ja) | コンテンツ収集システム | |
CN113742614A (zh) | 生成、显示推荐信息的方法、电子设备及存储介质 | |
JP4550939B1 (ja) | 情報伝播経路特定装置、情報伝播経路特定方法、情報伝播経路特定プログラム | |
CN111339453A (zh) | 导航页的判别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110817 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120803 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130304 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5216654 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160308 Year of fee payment: 3 |