JP5559725B2 - 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供方法 - Google Patents
複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供方法 Download PDFInfo
- Publication number
- JP5559725B2 JP5559725B2 JP2011042894A JP2011042894A JP5559725B2 JP 5559725 B2 JP5559725 B2 JP 5559725B2 JP 2011042894 A JP2011042894 A JP 2011042894A JP 2011042894 A JP2011042894 A JP 2011042894A JP 5559725 B2 JP5559725 B2 JP 5559725B2
- Authority
- JP
- Japan
- Prior art keywords
- web page
- information
- search
- sorting
- page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 29
- 238000011156 evaluation Methods 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 7
- 238000000638 solvent extraction Methods 0.000 claims 2
- 238000007726 management method Methods 0.000 description 22
- 238000004891 communication Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 241000239290 Araneae Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Claims (5)
- コンピュータによって実行される仕分け検索サービス提供方法において、
ウェブページを構成する各データの前記ウェブページ内における位置を把握し、前記把握された位置に基づいて前記各データを複数個の情報ブロックに区分する段階と、
前記区分された情報ブロック別に索引語を生成する段階と、
使用者端末機から入力されたキーワードと前記索引語とを比較し、前記キーワードと前記索引語との間の関連性に基づいて前記情報ブロック別に異なる重み値を付ける段階と、
前記情報ブロック別に付けられた重み値を考慮して、前記キーワードに対する仕分け検索結果を生成して前記使用者端末機に提供する段階とを含み、
前記ウェブページを構成する各データの前記ウェブページ内における位置を把握し、前記把握された位置に基づいて前記各データを複数個の情報ブロックに区分する段階は、
前記ウェブページが位置するURLに基づいて位置情報形式を生成する段階と、
前記生成された位置情報形式から、同一の位置情報形式を持つために関連性があると把握されるウェブページのHTMLタグを分析して前記ウェブページからHTMLテンプレートを抽出する段階と、
前記抽出されたHTMLテンプレートを用いて前記ウェブページを構成する前記各データを前記複数個の情報ブロックに区分する段階と、
を含み、
前記仕分け検索結果を生成する段階は、
前記使用者端末機によって、検索しようとする情報の種類または属性に応じて、ウェブページ検索のための検索設定窓に区分された題名、作成者、及び本文の項目のいずれか一項目が選択されたことに基づいて、選択された項目に重み値を付けて検索することを含む
ことを特徴とする仕分け検索サービス提供方法。 - 前記仕分け検索結果は、前記情報ブロック別に付けられた重み値を考慮して計算された評価値によって整列されることを特徴とする請求項1に記載の仕分け検索サービス提供方法。
- 使用者端末機から質疑語を受信し、検索結果を生成して前記使用者端末機に送信する仕分け検索サーバーで仕分け検索サービスを提供する方法において、前記仕分け検索サーバーによって実行される段階が、
前記使用者端末機から前記質疑語及び仕分け検索要請信号を受信する段階と、
ウェブページを構成する各データの前記ウェブページ内における位置を把握し、前記把握された位置に基づいて前記各データを複数個の情報ブロックに区分する段階と、
前記区分された情報ブロック別に索引語を生成し、前記索引語が参照するウェブページである参照ページのURLを保存する段階と、
前記質疑語と同一または関連した索引語が参照する前記参照ページのURLを検索する段階と、
前記情報ブロック別に検索した前記参照ページのURLを仕分け検索結果として生成して前記使用者端末機に送信する段階とを含み、
前記ウェブページを構成する各データの前記ウェブページ内における位置を把握し、前記把握された位置に基づいて前記各データを複数個の情報ブロックに区分する段階は、
前記ウェブページが位置するURLに基づいて位置情報形式を生成する段階と、
前記生成された位置情報形式から、同一の位置情報形式を持つために関連性があると把握されるウェブページのHTMLタグを分析して前記ウェブページからHTMLテンプレートを抽出する段階と、
前記抽出されたHTMLテンプレートを用いて前記ウェブページを構成する前記各データを前記複数個の情報ブロックに区分する段階と、
を含み、
前記仕分け検索結果を生成する段階は、
前記使用者端末機によって、検索しようとする情報の種類または属性に応じて、ウェブページ検索のための検索設定窓に区分された題名、作成者、及び本文の項目のいずれか一項目が選択されたことに基づいて、選択された項目に重み値を付けて検索することを含み、
前記質疑語と同一または関連した索引語が参照する前記参照ページのURLを検索する段階は、
前記質疑語と前記索引語との間の関連性に基づいて前記情報ブロック別に異なる重み値を付ける段階を含み、
前記仕分け検索結果は、
前記情報ブロック別に付けられた重み値を考慮して計算された評価値によって前記参照ページのURLが整列されて生成される
ことを特徴とする仕分け検索サービス提供方法。 - 仕分け検索サービス提供サーバーにおいて、
ウェブページを構成する各データの前記ウェブページ内における位置を把握し、前記把握された位置に基づいて前記各データを複数個の情報ブロックに区分するページ仕分けモジュールと、
前記ウェブページが位置するURLに基づいて位置情報形式を生成するURL形式生成モジュールと、
前記区分された情報ブロック別に索引語を生成する索引管理モジュールと、
使用者端末機から入力されたキーワードと前記索引語とを比較し、前記キーワードと前記索引語との間の関連性に基づいて前記情報ブロック別に異なる重み値を付け、前記情報ブロック別に付けられた重み値を考慮して前記キーワードに対する仕分け検索結果を生成して前記使用者端末機に提供する質疑管理モジュールとを備え、
前記ページ仕分けモジュールは、前記生成された位置情報形式から、同一の位置情報形式を持つために関連性があると把握されるウェブページのHTMLタグを分析して前記ウェブページからHTMLテンプレートを抽出し、前記抽出されたHTMLテンプレートを用いて前記ウェブページを構成する前記各データを前記複数個の情報ブロックに区分し、
前記質疑管理モジュールは、
前記使用者端末機によって、検索しようとする情報の種類または属性に応じて、ウェブページ検索のための検索設定窓に区分された題名、作成者、及び本文の項目のいずれか一項目が選択されたことに基づいて、選択された項目に重み値を付けて検索して仕分け検索結果を生成し、
前記仕分け検索結果は、前記情報ブロック別に付けられた重み値を考慮して計算された評価値によって整列される
ことを特徴とする仕分け検索サービス提供サーバー。 - 仕分け検索サービス提供サーバーにおいて、
前記仕分け検索サービス提供サーバーは、使用者端末機から質疑語及び仕分け検索要請信号を受信し、
ウェブページを構成する各データの前記ウェブページ内における位置を把握し、前記把握された位置に基づいて前記各データを複数個の情報ブロックに区分するページ仕分けモジュールと、
前記ウェブページが位置するURLに基づいて位置情報形式を生成するURL形式生成モジュールと、
前記区分された情報ブロック別に索引語を生成し、前記索引語が参照するウェブページである参照ページのURLを保存する索引管理モジュールと、
前記質疑語と同一または関連した索引語が参照する前記参照ページのURLを検索し、前記情報ブロック別に検索した前記参照ページのURLを仕分け検索結果として生成して前記使用者端末機に送信する質疑管理モジュールと
を備え、
前記ページ仕分けモジュールは、前記生成された位置情報形式から、同一の位置情報形式を持つために関連性があると把握されるウェブページのHTMLタグを分析して前記ウェブページからHTMLテンプレートを抽出し、前記抽出されたHTMLテンプレートを用いて前記ウェブページを構成する前記各データを前記複数個の情報ブロックに区分し、
前記質疑管理モジュールは、
前記使用者端末機によって、検索しようとする情報の種類または属性に応じて、ウェブページ検索のための検索設定窓に区分された題名、作成者、及び本文の項目のいずれか一項目が選択されたことに基づいて、選択された項目に重み値を付けて検索して仕分け検索結果を生成し、
前記質疑語と前記索引語との間の関連性に基づいて前記情報ブロック別に異なる重み値を付け、
前記仕分け検索結果は、前記情報ブロック別に付けられた重み値を考慮して計算された評価値によって前記参照ページのURLが整列されて生成される
ことを特徴とする仕分け検索サービス提供サーバー。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20050018310 | 2005-03-04 | ||
KR10-2005-0018310 | 2005-03-04 | ||
KR10-2006-0020349 | 2006-03-03 | ||
KR1020060020349A KR100645711B1 (ko) | 2005-03-04 | 2006-03-03 | 다수의 정보 블록으로 구분된 웹 페이지를 이용한 정보검색 서비스 제공 서버, 방법 및 시스템 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007557936A Division JP2008538021A (ja) | 2005-03-04 | 2006-03-03 | 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供サーバー、方法及びシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011146059A JP2011146059A (ja) | 2011-07-28 |
JP5559725B2 true JP5559725B2 (ja) | 2014-07-23 |
Family
ID=37623991
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007557936A Pending JP2008538021A (ja) | 2005-03-04 | 2006-03-03 | 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供サーバー、方法及びシステム |
JP2011042894A Active JP5559725B2 (ja) | 2005-03-04 | 2011-02-28 | 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007557936A Pending JP2008538021A (ja) | 2005-03-04 | 2006-03-03 | 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供サーバー、方法及びシステム |
Country Status (2)
Country | Link |
---|---|
JP (2) | JP2008538021A (ja) |
KR (1) | KR100645711B1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6187095B2 (ja) * | 2013-09-26 | 2017-08-30 | 大日本印刷株式会社 | 情報処理装置及び情報処理方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06309365A (ja) * | 1993-04-20 | 1994-11-04 | Fuji Xerox Co Ltd | 文書処理装置 |
JP3598742B2 (ja) * | 1996-11-25 | 2004-12-08 | 富士ゼロックス株式会社 | 文書検索装置及び文書検索方法 |
JP4463925B2 (ja) * | 1999-03-02 | 2010-05-19 | キヤノン株式会社 | インデックス生成装置及びその方法、記憶媒体 |
KR100643979B1 (ko) * | 2000-05-18 | 2006-11-13 | 엘지전자 주식회사 | 인터넷을 이용한 정보검색 결과 제공방법 |
JP2001344254A (ja) * | 2000-05-31 | 2001-12-14 | Fuji Xerox Co Ltd | ドキュメント管理システム |
JP2002297627A (ja) * | 2001-03-29 | 2002-10-11 | Tokyo Electric Power Co Inc:The | 情報収集システム、情報収集端末、データベースサーバ |
JP3895955B2 (ja) * | 2001-08-24 | 2007-03-22 | 株式会社東芝 | 情報検索方法および情報検索システム |
JP2004070376A (ja) * | 2002-06-10 | 2004-03-04 | Fuji Xerox Co Ltd | 文書表示装置および方法 |
JP4226862B2 (ja) * | 2002-08-29 | 2009-02-18 | 株式会社リコー | 文書検索装置 |
JP4231298B2 (ja) * | 2003-01-14 | 2009-02-25 | 日本電信電話株式会社 | 情報抽出規則作成システム、情報抽出規則作成プログラム、情報抽出システム及び情報抽出プログラム |
JP2004341942A (ja) * | 2003-05-16 | 2004-12-02 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ分類方法、コンテンツ分類装置、コンテンツ分類用プログラムおよびコンテンツ分類用プログラムを記憶した記憶媒体 |
JP3929418B2 (ja) * | 2003-05-19 | 2007-06-13 | アルトリサーチ株式会社 | 情報探索プログラム及び情報探索プログラムを記録した媒体 |
JP2006163723A (ja) * | 2004-12-06 | 2006-06-22 | Hitachi Software Eng Co Ltd | ドキュメント検索方法 |
-
2006
- 2006-03-03 JP JP2007557936A patent/JP2008538021A/ja active Pending
- 2006-03-03 KR KR1020060020349A patent/KR100645711B1/ko active IP Right Grant
-
2011
- 2011-02-28 JP JP2011042894A patent/JP5559725B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
KR20060096357A (ko) | 2006-09-11 |
KR100645711B1 (ko) | 2006-11-15 |
JP2008538021A (ja) | 2008-10-02 |
JP2011146059A (ja) | 2011-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kumar et al. | Keyword query based focused Web crawler | |
US20080065632A1 (en) | Server, method and system for providing information search service by using web page segmented into several inforamtion blocks | |
CN110597981B (zh) | 一种采用多策略自动生成摘要的网络新闻概要*** | |
US8498984B1 (en) | Categorization of search results | |
CN101452453B (zh) | 一种输入法网址导航的方法和一种输入法*** | |
US9619571B2 (en) | Method for searching related entities through entity co-occurrence | |
JP5329540B2 (ja) | ユーザ中心の情報探索方法、コンピュータ読み取り可能な記録媒体およびユーザ中心の情報探索システム | |
KR20100112512A (ko) | 검색 장치 및 검색 방법 | |
JP4769822B2 (ja) | ページグループを用いた情報検索サービス提供サーバー、方法及びシステム | |
US20070136248A1 (en) | Keyword driven search for questions in search targets | |
JP5221664B2 (ja) | 情報マップ管理システムおよび情報マップ管理方法 | |
Li | [Retracted] Internet Tourism Resource Retrieval Using PageRank Search Ranking Algorithm | |
JP2008299842A (ja) | 広告執行による反応情報提供方法、コンピュータ読み取り可能な記録媒体、広告執行による反応情報提供システム | |
CN116226494B (zh) | 一种用于信息搜索的爬虫***及方法 | |
CN109948015B (zh) | 一种元搜索列表结果抽取方法及*** | |
JP5559725B2 (ja) | 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供方法 | |
JP5688754B2 (ja) | 情報検索装置及びコンピュータプログラム | |
JP2012104051A (ja) | 文書インデックス作成装置 | |
KR101120040B1 (ko) | 연관 질의어 추천 장치 및 방법 | |
US20060059126A1 (en) | System and method for network searching | |
KR101347123B1 (ko) | 정보검색장치 및 정보검색방법, 컴퓨터 판독가능 기록매체 | |
JPH10222534A (ja) | 情報検索装置 | |
Praba et al. | Evaluation of Web Searching Method Using a Novel WPRR Algorithm for Two Different Case Studies | |
KR100871470B1 (ko) | 색인 데이터를 구축하기 위한 검색 시스템 및 이를 위한 방법 | |
TWI423053B (zh) | Domain Interpretation Data Retrieval Method and Its System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110329 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110329 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121120 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130220 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130319 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130903 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20131128 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20131203 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20131220 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20131226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140606 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5559725 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |