JP2014112433A - Device and method for search result ordering using reliability of representative - Google Patents

Device and method for search result ordering using reliability of representative Download PDF

Info

Publication number
JP2014112433A
JP2014112433A JP2014042802A JP2014042802A JP2014112433A JP 2014112433 A JP2014112433 A JP 2014112433A JP 2014042802 A JP2014042802 A JP 2014042802A JP 2014042802 A JP2014042802 A JP 2014042802A JP 2014112433 A JP2014112433 A JP 2014112433A
Authority
JP
Japan
Prior art keywords
representative
search result
document
reliability
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014042802A
Other languages
Japanese (ja)
Other versions
JP5724009B2 (en
Inventor
Hae-Jin Lee
ヘジン リー
Joon-Ho Lee
ジュンホ リー
Chang Ho Shin
チャンホ シン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naver Corp
Original Assignee
Naver Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naver Corp filed Critical Naver Corp
Publication of JP2014112433A publication Critical patent/JP2014112433A/en
Application granted granted Critical
Publication of JP5724009B2 publication Critical patent/JP5724009B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a device and a method for search result ordering using reliability of a representative.SOLUTION: A device for search result ordering using reliability of a representative includes: a search unit for extracting a search result document for a search query; a representative extraction unit for extracting the representative for the searched result document; a reliability calculation unit for calculating the reliability of the representative; and an ordering unit for ordering the search result documents by considering the reliability. The representative extraction unit extracts the representative for the search result document when at least one of a page rank, a blog rank, number of visitors or quality value for a lower rank document for a site in which the search result document is included is a respectively preselected threshold or more.

Description

本発明は、検索クエリに対応した検索結果文書の代表者を抽出して代表者の信頼度を考慮して検索結果文書を順位化する装置および方法に関する。   The present invention relates to an apparatus and method for extracting a search result document representative corresponding to a search query and ranking the search result document in consideration of the reliability of the representative.

検索キーワードに対応して検索結果として示されるページには、検索キーワードを主題とするサイト、検索キーワードを内容に含むブログ、カフェ、掲示板、ニュース、ウェブ文書などが掲載される。   On the page shown as a search result corresponding to the search keyword, a site whose theme is the search keyword, a blog, a cafe, a bulletin board, news, a web document, and the like including the search keyword as a content are posted.

このような検索結果を順位化する過程において、該当文書のキーワードとの類似度または該当文書のページランクなどだけを考慮して見たところ、信頼性が不足する文書が検索結果の上段に表示される場合が発生する。これによって、検索キーワードを含んでいたとしても検索意図に適合しない文書が検索結果として表示されるようになり、検索結果の信頼度が保障されない場合が発生する。   In the process of ranking the search results, when considering only the similarity to the keyword of the corresponding document or the page rank of the corresponding document, a document with insufficient reliability is displayed at the top of the search result. Occurs. As a result, even if the search keyword is included, a document that does not match the search intention is displayed as the search result, and the reliability of the search result may not be guaranteed.

これは、検索キーワードを含むそれぞれの文書自体の関連度または人気度だけを考慮して順位化を行うためである。   This is because the ranking is performed considering only the relevance or popularity of each document itself including the search keyword.

したがって、ユーザの検索意図により適合し、検索の信頼性を向上させることができる検索結果順位化装置および方法が求められる。   Accordingly, there is a need for a search result ranking apparatus and method that can be adapted to the search intention of the user and improve the reliability of the search.

本発明は、検索結果文書に対する代表者を抽出し、前記代表者の信頼度を考慮して前記検索結果文書を順位化することにより、ユーザの検索意図に適合して信頼性の高い検索結果文書を優先順位で提供できる検索結果順位化装置および方法を提供する。   The present invention extracts a representative for a search result document, and ranks the search result document in consideration of the reliability of the representative, thereby matching a user's search intention and providing a highly reliable search result document. There are provided a search result ranking apparatus and method capable of providing a priority order.

本発明は、検索結果文書の代表者に対する信頼度を抽出するために前記代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値などのさまざまな要素を考慮することによって、代表者に対する信頼度をより正確に抽出する検索結果順位化装置および方法を提供する。   The present invention considers various factors such as the page rank of the site operated by the representative, the number of visitors, and the quality value of the subordinate document in order to extract the reliability of the representative of the search result document. Provided are a search result ranking apparatus and method for more accurately extracting the reliability of a representative.

本発明は、検索クエリに代表者名が含まれる場合、代表者名と関連する文書に重みを付与して検索結果文書を順位化することにより、ユーザの意図により適合した検索結果に対して優先順位を付けて提供できる検索結果順位化装置および方法を提供する。   In the present invention, when a representative name is included in a search query, priority is given to a search result more suitable for the user's intention by giving a weight to a document related to the representative name and ranking the search result document. A search result ranking apparatus and method that can be provided with a ranking are provided.

本発明の一実施形態に係る検索結果順位化装置は、検索クエリに対する検索結果文書を抽出する検索部と、前記検索結果文書に対する代表者を抽出する代表者抽出部と、前記代表者に対する信頼度を算出する信頼度算出部と、前記信頼度を考慮して前記検索結果文書を順位化する順位化部と、を含む。   A search result ranking apparatus according to an embodiment of the present invention includes a search unit that extracts a search result document for a search query, a representative extraction unit that extracts a representative for the search result document, and a reliability for the representative And a ranking unit that ranks the search result documents in consideration of the reliability.

また、本発明の一実施形態に係る検索結果順位化装置は、前記代表者抽出部は、前記検索結果文書がブログポスト(blog post)である場合、ブログ所有者を代表者として抽出し、前記検索結果文書がカフェの投稿メッセージである場合、前記カフェを代表者として抽出し、前記検索結果文書がウェブページである場合、ウェブサイトを代表者として抽出し、前記検索結果文書がニュースである場合、前記ニュースを提供する報道機関
を代表者として抽出してもよい。
In the search result ranking apparatus according to an embodiment of the present invention, the representative extraction unit extracts a blog owner as a representative when the search result document is a blog post, When the search result document is a cafe posting message, the cafe is extracted as a representative, when the search result document is a web page, the website is extracted as a representative, and the search result document is news The news agency that provides the news may be extracted as a representative.

また、本発明の一実施形態に係る検索結果順位化装置は、前記信頼度算出部は、前記代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値のうち少なくとも1つを用いて信頼度を算出してもよい。   In the search result ranking apparatus according to an embodiment of the present invention, the reliability calculation unit includes at least one of a page rank of a site operated by the representative, the number of visitors, and a quality value of a subordinate document. The reliability may be calculated using

また、本発明の一実施形態に係る検索結果順位化装置は、前記信頼度算出部は、それぞれの検索クエリに対応して前記代表者の信頼度を算出してもよい。   In the search result ranking apparatus according to an embodiment of the present invention, the reliability calculation unit may calculate the reliability of the representative corresponding to each search query.

また、本発明の一実施形態に係る検索結果順位化装置は、前記順位化部は、前記検索結果文書の前記検索クエリとの類似度、前記検索結果文書のページランク、および前記信頼度のうち少なくとも1つを用いて前記検索結果文書を順位化してもよい。   In the search result ranking apparatus according to an embodiment of the present invention, the ranking unit includes a similarity between the search result document and the search query, a page rank of the search result document, and the reliability. The search result documents may be ranked using at least one.

また、本発明の一実施形態に係る検索結果順位化装置は、前記検索クエリは代表者名を含み、前記順位化部は、前記代表者名と関連する代表者サイトの下位文書に重みを付与して順位化してもよい。   In the search result ranking apparatus according to an embodiment of the present invention, the search query includes a representative name, and the ranking unit assigns a weight to a subordinate document of a representative site associated with the representative name. And may be ranked.

本発明の一実施形態に係る検索結果順位化方法は、検索クエリに対する検索結果文書を抽出し、前記検索結果文書に対する代表者を抽出し、前記代表者に対する信頼度を算出し、前記信頼度を考慮して前記検索結果文書を順位化する、ことを含んでもよい。   The search result ranking method according to an embodiment of the present invention extracts a search result document for a search query, extracts a representative for the search result document, calculates a reliability for the representative, and calculates the reliability. And ranking the search result documents in consideration.

また、本発明の一実施形態に係る検索結果順位化方法は、前記代表者を抽出することは、前記検索結果文書のURLパターンを分析して、前記URLパターンを用いて代表者を抽出してもよい。   In the search result ranking method according to an embodiment of the present invention, extracting the representative includes analyzing a URL pattern of the search result document and extracting the representative using the URL pattern. Also good.

また、本発明の一実施形態に係る検索結果順位化方法は、前記代表者を抽出することは、予め選定された代表者プール(pool)から前記検索結果文書に対応する代表者を抽出してもよい。   In the search result ranking method according to an embodiment of the present invention, extracting the representative includes extracting a representative corresponding to the search result document from a representative pool selected in advance. Also good.

本発明の一実施形態によれば、検索結果文書に対する代表者を抽出して、代表者の信頼度を考慮して検索結果文書を順位化することにより、ユーザの検索意図に適合して信頼性の高い検索結果文書に対して優先順位を付けて提供できる検索結果順位化装置および方法が提供される。   According to an embodiment of the present invention, a representative for a search result document is extracted, and the search result document is ranked in consideration of the reliability of the representative, thereby matching the user's search intention and reliability. There is provided a search result ranking apparatus and method capable of providing prioritized search result documents with high priority.

本発明の一実施形態によれば、検索結果文書の代表者に対する信頼度を抽出するために代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値などのさまざまな要素を考慮することによって、代表者に対する信頼度をより正確に抽出する検索結果順位化装置および方法が提供される。   According to an embodiment of the present invention, various factors such as the page rank of the site operated by the representative, the number of visitors, and the quality value of the subordinate document are extracted in order to extract the reliability of the representative of the search result document. By considering the above, a search result ranking apparatus and method for more accurately extracting the reliability of the representative are provided.

本発明の一実施形態によれば、検索クエリに代表者名が含まれる場合、代表者名と関連する文書に重みを付与して検索結果文書を順位化することにより、ユーザの意図により適合した検索結果に対して優先順位を付けて提供できる検索結果順位化装置および方法が提供される。   According to an embodiment of the present invention, when a representative name is included in a search query, the search result documents are ranked by giving a weight to a document related to the representative name, and thus more suitable to the user's intention. There is provided a search result ranking apparatus and method capable of providing priorities with respect to search results.

本発明の一実施形態において、検索結果順位化装置を示すブロック図である。In one Embodiment of this invention, it is a block diagram which shows a search result ranking apparatus. 本発明の一実施形態において、検索結果文書の代表者を抽出する過程を示す図である。FIG. 5 is a diagram illustrating a process of extracting a representative of a search result document in an embodiment of the present invention. 本発明の一実施形態において、信頼度を考慮しない検索結果文書リストの出力を説明するための図である。FIG. 10 is a diagram for explaining the output of a search result document list that does not consider reliability in an embodiment of the present invention. 本発明の一実施形態において、信頼度を考慮した検索結果文書リストの出力を説明するための図である。FIG. 10 is a diagram for explaining output of a search result document list in consideration of reliability in an embodiment of the present invention. 本発明の一実施形態において、代表者名に重みを付与せずに検索結果文書リストを出力した結果を説明するための図である。FIG. 10 is a diagram for explaining a result of outputting a search result document list without giving a weight to a representative name in an embodiment of the present invention. 本発明の一実施形態において、代表者名に重みを付与して検索結果文書を順位化する方法を説明するための図である。FIG. 6 is a diagram for explaining a method of ranking search result documents by assigning weights to representative names in an embodiment of the present invention. 本発明の一実施形態において、検索結果順位化方法を示すフローチャートである。5 is a flowchart illustrating a search result ranking method according to an embodiment of the present invention.

以下、添付する図面に記載された内容を参照しながら本発明の実施形態を詳細に説明する。ただし、本発明が実施形態によって制限され、限定されることはない。各図面に提示する同一の参照符号は、同一の部材を示す。検索結果順位化方法は、検索結果順位化装置を構成する構成要素によってなされる。   Hereinafter, embodiments of the present invention will be described in detail with reference to the contents described in the accompanying drawings. However, this invention is restrict | limited by embodiment and is not limited. The same reference numerals shown in the drawings indicate the same members. The search result ranking method is performed by the components constituting the search result ranking device.

図1は、本発明の一実施形態において、検索結果順位化装置を示すブロック図である。   FIG. 1 is a block diagram showing a search result ranking apparatus according to an embodiment of the present invention.

図1を参照すれば、検索結果順位化装置100は、検索部110と、代表者抽出部120と、信頼度算出部130と、順位化部140と、を含んでもよい。   Referring to FIG. 1, the search result ranking apparatus 100 may include a search unit 110, a representative extraction unit 120, a reliability calculation unit 130, and a ranking unit 140.

検索部110は、検索クエリに対する検索結果文書を抽出してもよい。すなわち、検索部110は、ユーザから入力された検索クエリに対応して1つ以上の検索結果文書を抽出してもよい。ここで、検索クエリは、代表者名を含んでもよい。   The search unit 110 may extract a search result document for the search query. That is, the search unit 110 may extract one or more search result documents corresponding to the search query input from the user. Here, the search query may include a representative name.

代表者抽出部120は、検索結果文書に対する代表者を抽出してもよい。ここで、代表者は、検索結果文書の代表サイトと、検索結果文書の情報の出所のうち少なくとも1つであってもよい。一方、代表者抽出は、予め選定された計算方式によって、自動的に抽出されるようにしてもよい。この時、すべての検索結果文書に対して代表者を選定せずに、一定の条件を満足する検索結果文書に対してのみ代表者を抽出するようにしてもよい。例えば、サイトのページランク、ブログランク、訪問者数、下位文書の品質値などを考慮して代表者を抽出する基準を設定し、検索結果文書が含まれるサイトが代表者を抽出する基準以上の値を有する場合にだけ検索結果文書に対する代表者を抽出するようにしてもよい。一例として、ブログランキング300位内のブログに対してのみ代表者を抽出しようとする時、検索結果文書が掲載されたブログが500位のブログランキングを有するのであれば、検索結果文書に対しては代表者を抽出しないようにしてもよい。   The representative extraction unit 120 may extract a representative for the search result document. Here, the representative may be at least one of a representative site of the search result document and a source of information of the search result document. On the other hand, representative extraction may be automatically performed by a pre-selected calculation method. At this time, representatives may be extracted only for search result documents that satisfy a certain condition, without selecting representatives for all search result documents. For example, the criteria for extracting representatives are set in consideration of the page rank, blog rank, number of visitors, quality values of subordinate documents, etc., and the site where the search result document is included exceeds the criteria for extracting representatives. The representative for the search result document may be extracted only when it has a value. As an example, when trying to extract representatives only for blogs ranked 300th in the blog ranking, if the blog on which the search result document is posted has the blog ranking ranked 500th, the search result document The representative may not be extracted.

代表者抽出の一実施形態について図2を参考にしながら、以下に詳しく説明する。   One embodiment of representative extraction will be described in detail below with reference to FIG.

図2は、本発明の一実施形態において、検索結果文書の代表者を抽出する過程を示す図である。   FIG. 2 is a diagram illustrating a process of extracting a representative of a search result document in an embodiment of the present invention.

図2を参照すれば、検索結果文書210の種類によって代表者がさまざまに選択される。例えば、検索結果文書210がブログポストである場合、ブログ所有者211を代表者として抽出し、検索結果文書210がカフェの投稿メッセージである場合、カフェ212を代表者として抽出し、検索結果文書210がウェブページの場合、ウェブサイト213を代表者として抽出し、検索結果文書210がニュースである場合、ニュースを提供する報道機関214を代表者として抽出してもよい。すなわち、代表者は、検索結果文書の出所と認識される代表サイト、人、会社などを意味してもよい。   Referring to FIG. 2, the representative is variously selected depending on the type of the search result document 210. For example, when the search result document 210 is a blog post, the blog owner 211 is extracted as a representative, and when the search result document 210 is a post message of a cafe, the cafe 212 is extracted as a representative. Is a web page, the website 213 may be extracted as a representative, and if the search result document 210 is news, the news agency 214 that provides the news may be extracted as a representative. That is, the representative may mean a representative site, a person, a company, or the like that is recognized as the origin of the search result document.

再び図1を参照すれば、代表者は、検索結果文書のURLパターンを分析し、分析したURLパターンを用いて抽出してもよい。例えば、「スポーツ朝鮮」の下位文書は「http://sports.chosun.com」を含むため、「http://sports.chosun.com」を代表者抽出のためのURLとして決定してもよい。したがって、URLの前部が「http://sports.chosun.com」で始まる文書に対しては、すべて「スポーツ朝鮮」を代表者として抽出することができる。すなわち、URL「http://sports.chosun.com」で始まる文書に対しては「スポーツ朝鮮」に対する信頼度に基づいて順位化することができる。   Referring to FIG. 1 again, the representative may analyze the URL pattern of the search result document and extract it using the analyzed URL pattern. For example, since the subordinate document of “Sports Korea” includes “http://sports.chosun.com”, “http://sports.chosun.com” may be determined as the URL for representative extraction. . Therefore, “sports Korea” can be extracted as a representative for all documents whose URL starts with “http://sports.chosun.com”. That is, a document that starts with the URL “http://sports.chosun.com” can be ranked based on the reliability of “Sports Korea”.

信頼度算出部130は、代表者に対する信頼度を算出してもよい。すなわち、抽出された代表者に対する信頼度を予め選定された方法によって算出して検索結果文書に対する信頼度を推定してもよい。信頼度算出の一例として、代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値のうち少なくとも1つを用いて信頼度を算出してもよい。したがって、代表者が運営するサイトのページランクが高いほど、訪問者数が多いほど、下位文書の品質値が高いほど代表者の信頼度が高くなり得る。   The reliability calculation unit 130 may calculate the reliability for the representative. In other words, the reliability of the extracted representative may be calculated by a method selected in advance to estimate the reliability of the search result document. As an example of the reliability calculation, the reliability may be calculated using at least one of the page rank of the site operated by the representative, the number of visitors, and the quality value of the subordinate document. Therefore, the higher the page rank of the site operated by the representative, the greater the number of visitors, and the higher the quality value of the subordinate document, the higher the reliability of the representative.

また、信頼度算出部130は、予め選定された代表者プール(pool)に含まれた代表者に対してのみ信頼度を算出してもよい。例えば、すべての検索結果文書の代表者に対して信頼度を算出するのではなく、代表者プールに含まれる代表者に対してのみ信頼度を算出してもよい。すなわち、代表者プールに含まれる代表者に対してのみ信頼度を算出することによって、信頼度算出に過度な負荷がかからないようにできる。   The reliability calculation unit 130 may calculate the reliability only for representatives included in a representative pool (pool) selected in advance. For example, the reliability may not be calculated for the representatives of all the search result documents, but the reliability may be calculated only for the representatives included in the representative pool. That is, by calculating the reliability only for the representatives included in the representative pool, it is possible to prevent an excessive load from being applied to the reliability calculation.

順位化部140は、信頼度を考慮して検索結果文書を順位化してもよい。例えば、検索結果文書の代表者に対する信頼度が高いほど、高い順位の検索結果から出力される。この時、信頼度だけでなく、検索結果文書の検索クエリとの類似度、検索結果文書のページランクなどを共に考慮して検索結果文書を順位化してもよい。   The ranking unit 140 may rank the search result documents in consideration of the reliability. For example, the higher the reliability for the representative of the search result document, the higher the search result is output. At this time, the search result documents may be ranked in consideration of not only the reliability but also the similarity of the search result document with the search query and the page rank of the search result document.

一方、検索クエリが代表者名を含む場合、代表者名に対応する代表者を抽出して、代表者と関連する検索結果文書には重みを付与して順位化してもよい。   On the other hand, when the search query includes a representative name, a representative corresponding to the representative name may be extracted, and the search result document related to the representative may be given a weight to be ranked.

例えば、ユーザが「KTX釜山」を検索語で入力する場合にKTXが代表者名に分類されて代表者名と関連するサイトである「http://www.korail.com」(以下「コレイル」という)を代表者としてもよい。したがって、代表者名と関連するサイトの下位ページの中に「釜山」というキーワードを有する文書が検索される場合、「釜山」というキーワードを有する文書には、重みが付与されて検索結果の上段に位置するようにしてもよい。   For example, when the user inputs “KTX Busan” as a search term, “http://www.korail.com” (hereinafter “Coleil”) is a site where KTX is classified into a representative name and related to the representative name. May be the representative. Therefore, when a document having the keyword “Busan” is searched for in the lower page of the site related to the representative name, the document having the keyword “Busan” is given a weight and is placed at the top of the search results. It may be located.

上記のように、検索結果文書に対する代表者を抽出し、代表者の信頼度を考慮して検索結果文書を順位化することにより、ユーザの検索意図に適合して信頼性の高い検索結果文書に対して優先順位を付けて提供することができる。   As described above, representatives for the search result document are extracted, and the search result documents are ranked in consideration of the reliability of the representatives, so that the search result document conforms to the user's search intention and has high reliability. It can be provided with priorities.

図3は、本発明の一実施形態において、信頼度を考慮しない検索結果文書リストの出力を説明するための図である。   FIG. 3 is a diagram for explaining the output of the search result document list without considering the reliability in the embodiment of the present invention.

図3を参照すれば、ユーザが検索クエリで「旅行情報」を入力した場合、複数の検索結果文書に対するリストをウェブブラウザウィンドウ310を介してユーザに提供することができる。この時、各検索結果文書は、検索結果文書に対する信頼度は考慮せずに、検索クエリとの類似度、検索結果文書のページランクのうち少なくとも1つを用いて順位化して提供するものであってもよい。図3の場合、ユーザの検索クエリ「旅行情報」に対応す
る検索結果文書として「韓国観光公社」311、「Tour123」312、「ジオトラベル」313、「ネイバー旅行」314などを順に提供してもよい。この場合、検索クエリと関連する内容が含まれているが、ユーザの所望する情報とは関係が少ない検索結果文書が上位順位に表示されてユーザに提供されることもある。
Referring to FIG. 3, when the user inputs “travel information” in the search query, a list for a plurality of search result documents can be provided to the user via the web browser window 310. At this time, each search result document is provided by ranking using at least one of the similarity to the search query and the page rank of the search result document without considering the reliability of the search result document. May be. In the case of FIG. 3, “Korea Tourism Organization” 311, “Tour 123” 312, “Geo Travel” 313, “Naver Travel” 314 and the like may be provided in order as search result documents corresponding to the user's search query “travel information”. Good. In this case, contents related to the search query are included, but search result documents that are less related to the information desired by the user may be displayed in higher rank and provided to the user.

図4は、本発明の一実施形態において、信頼度を考慮した検索結果文書リストの出力を説明するための図である。   FIG. 4 is a diagram for explaining the output of the search result document list in consideration of the reliability in the embodiment of the present invention.

図4を参照すれば、図3のようにユーザが検索クエリで「旅行情報」を入力した場合、複数の検索結果文書に対するリストをウェブブラウザウィンドウ410を介してユーザに提供することができる。ここで、複数の検索結果文書は、各検索結果文書の代表者に対する信頼度を考慮して順位化して提供してもよい。図4の場合、検索結果文書として「韓国観光公社」411、「ネイバー旅行」412、「ジオトラベル」413、「Tour123」414などを抽出してもよい。   Referring to FIG. 4, when the user inputs “travel information” in a search query as shown in FIG. 3, a list for a plurality of search result documents can be provided to the user via the web browser window 410. Here, the plurality of search result documents may be ranked and provided in consideration of the reliability of the representative of each search result document. In the case of FIG. 4, “Korea Tourism Corporation” 411, “Naver Travel” 412, “Geo Travel” 413, “Tour 123” 414, etc. may be extracted as search result documents.

この時、「韓国観光公社」411に対する代表者は、韓国観光公社自体または韓国観光公社の代表サイトとしてもよい。したがって、韓国観光公社自体または韓国観光公社の代表サイトの信頼度を抽出することができる。ここで、信頼度は数値化して格納してもよく、韓国観光公社411の場合、一例として信頼度「90」を有することもある。   At this time, the representative for the “Korea Tourism Organization” 411 may be the Korea Tourism Organization itself or the representative site of the Korea Tourism Organization. Therefore, the reliability of the Korea Tourism Organization itself or the representative site of the Korea Tourism Organization can be extracted. Here, the reliability may be digitized and stored. In the case of the Korea Tourism Organization 411, the reliability may be “90” as an example.

また、「Tour123」412の場合、「Tour123」412の代表サイトまたはサイト運営者を代表者として抽出してもよく、「Tour123」412の代表サイトまたはサイト運営者に対する信頼度を抽出してもよい。この時、「Tour123」412の場合、一例として、信頼度「30」を有することもある。   In the case of “Tour123” 412, the representative site or site operator of “Tour123” 412 may be extracted as a representative, and the reliability of the representative site or site operator of “Tour123” 412 may be extracted. . At this time, in the case of “Tour123” 412, as an example, the reliability may be “30”.

また、「ジオトラベル」413の場合、「ジオトラベル」413の代表サイトまたはサイト運営者を代表者として抽出してもよく、「ジオトラベル」413の代表サイトまたはサイト運営者に対する信頼度が抽出されてもよい。この時、「ジオトラベル」413の場合、一例として、信頼度「50」を有することもある。   In the case of “Geotravel” 413, the representative site or site operator of “Geotravel” 413 may be extracted as a representative, and the reliability of the representative site or site operator of “Geotravel” 413 is extracted. May be. At this time, in the case of “Geotravel” 413, as an example, the reliability may be “50”.

また、「ネイバー旅行」414の場合、ネイバーの代表サイトなどが代表者として抽出されてもよく、ネイバーの代表サイトに対する信頼度が抽出されてもよい。この時、「ネイバー」414の場合、一例として、信頼度「80」を有することもある。   In the case of “neighbor trip” 414, a representative site of a neighbor may be extracted as a representative, and the reliability of the neighbor's representative site may be extracted. At this time, the “neighbor” 414 may have a reliability “80” as an example.

したがって、各検索結果文書の信頼度を考慮して検索結果文書を順位化する場合、図4に示すように、「韓国観光公社」411、「ネイバー旅行」412、「ジオトラベル」413、「Tour123」414などの順序で検索結果を提供してもよい。すなわち、図3の場合のように、信頼度が低い「Tour123」312などが上位ランクに提供されず、「ネイバー旅行」412のような信頼度の高い代表者の下位文書を高い順位で提供してもよい。   Therefore, when ranking the search result documents in consideration of the reliability of each search result document, as shown in FIG. 4, "Korea Tourism Corporation" 411, "Naver Travel" 412, "Geo Travel" 413, "Tour123" The search results may be provided in an order such as “414”. That is, as in the case of FIG. 3, “Tour123” 312 or the like with low reliability is not provided to the higher rank, and a subordinate document of a representative with high reliability such as “Naver trip” 412 is provided in a higher order. May be.

図5は、本発明の一実施形態において、代表者名に重みを付与せずに検索結果文書リストを出力した結果を説明するための図である。   FIG. 5 is a diagram for explaining a result of outputting a search result document list without giving a weight to a representative name in an embodiment of the present invention.

図5を参照すれば、ユーザが検索クエリで「KTX釜山」を入力した場合、複数の検索結果文書に対するリストをウェブブラウザウィンドウ510を介してユーザに提供することができる。この時、複数の検索結果文書は、「KTX」と「釜山」をすべて含む検索結果文書を抽出してユーザに提供してもよい。この場合、代表者名に重みを付与せずにユーザに検索結果文書を提供する場合、地球ツアーの第1下位文書511、地球ツアーの第2下位文書512、oktourの下位文書513、およびユーアンドアイ(UNI)旅行
社514の下位文書などを順次提供してもよい。
Referring to FIG. 5, when the user inputs “KTX Busan” in the search query, a list for a plurality of search result documents can be provided to the user via the web browser window 510. At this time, a plurality of search result documents may be extracted and provided to the user as search result documents including all of “KTX” and “Busan”. In this case, when a search result document is provided to the user without giving a weight to the representative name, the first sub-document 511 of the Earth tour, the second sub-document 512 of the Earth tour, the sub-document 513 of oktour, and the user and Subordinate documents of the UNI travel agency 514 may be sequentially provided.

図6は、本発明の一実施形態において、代表者名に重みを付与して検索結果文書を順位化する方法を説明するための図である。   FIG. 6 is a diagram for explaining a method of ranking search result documents by assigning weights to representative names in an embodiment of the present invention.

図6を参照すれば、ユーザが検索クエリで「KTX釜山」を入力した場合、複数の検索結果文書に対するリストをウェブブラウザウィンドウ610を介してユーザに提供することができる。この時、検索クエリ中「KTX」を代表者名に分類し、代表者名に重みを付与して検索結果文書を順位化してもよい。ここで、代表者名は、代表者が運営するサイト名および代表者が運営するサイトと関連するキーワードのうち少なくとも1つを含むものであってもよい。ここで、代表者名「KTX」に対応する代表者を検出すれば、代表者名「KTX」と関連するサイトのうち代表サイトの「コレイル」を代表者として検出してもよい。したがって、「コレイル」の下位ページのうち「釜山」というキーワードを有する文書が検索される場合、「釜山」というキーワードを有する文書に重みを付与して検索結果の上段に表示してもよい。図6の場合、代表者「コレイル」の下位ページのうち「釜山」というキーワードを有する「コレイル」の第1下位文書611および「コレイル」の第2下位文書612が第1順位および第2順位として表示され、代表者が「コレイル」でない地球ツアーの第1下位文書613および地球ツアーの第2下位文書613は、第3順位および第4順位として表示してもよい。   Referring to FIG. 6, when the user inputs “KTX Busan” in the search query, a list for a plurality of search result documents can be provided to the user via the web browser window 610. At this time, “KTX” in the search query may be classified into representative names, and weights may be given to the representative names to rank the search result documents. Here, the representative name may include at least one of a site name operated by the representative and a keyword related to the site operated by the representative. Here, if the representative corresponding to the representative name “KTX” is detected, the representative site “Coleyl” may be detected as the representative among the sites related to the representative name “KTX”. Therefore, when a document having the keyword “Busan” is searched for in the lower pages of “Coleil”, a weight may be given to the document having the keyword “Busan” and displayed at the top of the search results. In the case of FIG. 6, the first sub-document 611 of “Coleil” and the second sub-document 612 of “Coleil” having the keyword “Busan” among the sub-pages of the representative “Coleil” are set as the first rank and the second rank. The first sub-document 613 of the Earth tour and the second sub-document 613 of the Earth tour that are displayed and whose representative is not “Coleyl” may be displayed as the third rank and the fourth rank.

上記のように、検索クエリに代表者名が含まれる場合、代表者名に重みを付与して検索結果文書を順位化することにより、ユーザの意図により適合した検索結果に対して優先順位を付けて提供してもよい。   As described above, when a representative name is included in a search query, a priority is given to search results that are more suited to the user's intention by giving weight to the representative name and ranking the search result documents. May be provided.

図7は、本発明の一実施形態において、検索結果順位化方法を示すフローチャートである。   FIG. 7 is a flowchart illustrating a search result ranking method according to an embodiment of the present invention.

図7を参照すれば、ステップ710では検索クエリに対する検索結果文書を抽出してもよい。ここで、検索クエリには代表者名を含んでもよい。ここで、代表者名は、代表者が運営するサイト名および代表者が運営するサイトと関連するキーワードのうち少なくとも1つを含んでもよい。この場合、代表者名と関連する代表者を抽出して代表者の下位文書が検索結果文書に含まれる場合には、代表者の下位文書は検索結果の上位ランクに表示してユーザに提供してもよい。   Referring to FIG. 7, in step 710, a search result document for the search query may be extracted. Here, the search query may include a representative name. Here, the representative name may include at least one of a site name operated by the representative and a keyword related to the site operated by the representative. In this case, if the representative associated with the representative name is extracted and the subordinate document of the representative is included in the search result document, the subordinate document of the representative is displayed in the upper rank of the search result and provided to the user. May be.

ステップ720では、検索結果文書に対する代表者を抽出してもよい。ここで、代表者は予め選定された代表者プール(pool)から抽出してもよい。代表者抽出の一例として、検索結果文書がブログポスト(blog post)である場合、ブログ所有者を代表者として抽出し、検索結果文書がカフェの投稿メッセージである場合、カフェを代表者として抽出し、検索結果文書がウェブページである場合、ウェブサイトを代表者として抽出し、検索結果文書がニュースである場合、ニュースを提供する報道機関を代表者として抽出してもよい。また、ステップ720は、検索結果文書のURLパターンを分析して代表者を抽出するための最小URLを決定するステップと、検索結果文書中最小URLを含む文書を分類するステップと、分類された文書に対する代表者を抽出するステップと、を含んでもよい。例えば、検索結果文書のURLパターンを分析して、「http://blog.naver.com/idxxxx」を代表者分類のための最小URLとして決定してもよい。以降、検索結果文書中URLの前部に「http://blog.naver.com/idxxxx」を含む文書を分類して、分類された文書に対してはURLをアドレスとして用いるブログの所有者を代表者として抽出してもよい。以降、「http://blog.naver.com/idxxxx」を含む文書は、ブログ所有者に対する信頼度を考慮して順位化してもよい。   In step 720, representatives for the search result document may be extracted. Here, the representative may be extracted from a representative pool (pool) selected in advance. As an example of representative extraction, if the search result document is a blog post, the blog owner is extracted as a representative. If the search result document is a cafe posting message, the cafe is extracted as a representative. If the search result document is a web page, the website may be extracted as a representative, and if the search result document is news, the news agency that provides the news may be extracted as the representative. Step 720 analyzes the URL pattern of the search result document to determine a minimum URL for extracting a representative, classifies a document including the minimum URL in the search result document, and the classified document. Extracting representatives for. For example, the URL pattern of the search result document may be analyzed to determine “http://blog.naver.com/idxxx” as the minimum URL for representative classification. Thereafter, a document including “http://blog.naver.com/idxxxx” in the front part of the URL in the search result document is classified, and the owner of the blog that uses the URL as an address for the classified document. You may extract as a representative. Hereinafter, documents including “http://blog.naver.com/idxxx” may be ranked in consideration of the reliability of the blog owner.

ステップ730では、代表者に対する信頼度を算出してもよい。ここで、信頼度は、一例として、代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値のうち少なくとも1つを用いて算出してもよい。したがって、代表者が運営するサイトのページランクが高いほど、訪問者数が多いほど、下位文書の品質値が高いほど代表者の信頼度が高まり、代表者の下位文書には検索結果出力時に高い順位を付けて提供してもよい。   In step 730, the reliability for the representative may be calculated. Here, as an example, the reliability may be calculated using at least one of the page rank of the site operated by the representative, the number of visitors, and the quality value of the subordinate document. Therefore, the higher the page rank of the site operated by the representative, the greater the number of visitors, and the higher the quality value of the lower document, the higher the reliability of the representative. It may be provided with a ranking.

ステップ740では、信頼度を考慮して検索結果文書を順位化してもよい。すなわち、信頼度の高い代表者を有する検索結果文書は、高い順位に表示してもよい。また、信頼度を考慮して検索結果文書を順位化する場合、信頼度だけでなく検索クエリとの類似度、検索結果文書のページランクなどを共に考慮してもよい。   In step 740, the search result documents may be ranked in consideration of the reliability. That is, search result documents having representatives with high reliability may be displayed in a high order. When ranking the search result documents in consideration of the reliability, not only the reliability but also the similarity to the search query, the page rank of the search result document, and the like may be considered together.

一方、図7で説明していない部分は、図1〜図6の説明を参考にすることができる。   On the other hand, the description of FIGS. 1-6 can be referred for the part which is not demonstrated in FIG.

上記のように、検索結果文書を順位化して提供するために、検索結果文書に対する代表者を抽出し、代表者の信頼度を考慮して検索結果文書を順位化することにより、ユーザの検索意図に適合して信頼性の高い検索結果文書に対して優先順位を付けて提供できる装置および方法を提供することができる。この時、信頼度だけでなく検索クエリとの類似度、ページランクなどを総合的に考慮することによって、ユーザの検索意図により適合する文書を上位ランクに表示することができる。   As described above, in order to provide a search result document in order, a representative of the search result document is extracted, and the search result document is ranked in consideration of the reliability of the representative. It is possible to provide an apparatus and a method that can be provided with priority given to a search result document that conforms to the above and has high reliability. At this time, by comprehensively considering not only the reliability but also the similarity to the search query, the page rank, and the like, it is possible to display a document that matches the user's search intention in the higher rank.

また、検索結果文書の代表者に対する信頼度を抽出するために代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値などのさまざまな要素を考慮することによって、代表者に対する信頼度をより正確に抽出することができる。   In addition, by considering various factors such as the page rank of the site operated by the representative, the number of visitors, and the quality value of the subordinate document in order to extract the reliability of the representative of the search result document, The reliability can be extracted more accurately.

なお、本発明の実施形態は、コンピュータにより実現されるさまざまな動作を実行するためのプログラム命令を含むコンピュータ読取可能な記録媒体を含む。当該記録媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含むものであってもよく、記録媒体およびプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知であり使用可能なものであってもよい。コンピュータ読取可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、フロプティカルディスクのような磁気−光媒体、およびROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれる。また、記録媒体は、プログラム命令、データ構造などを保存する信号を送信する搬送波を含む光または金属線、導波管などの送信媒体でもある。プログラム命令の例としては、コンパイラによって生成されるような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行され得る高級言語コードを含む。   The embodiments of the present invention include a computer-readable recording medium including program instructions for executing various operations realized by a computer. The recording medium may include program instructions, data files, data structures, etc. alone or in combination, and the recording medium and program instructions are specially designed and configured for the purposes of the present invention. Alternatively, it may be known and usable by those skilled in the computer software field. Examples of computer-readable recording media include magnetic media such as hard disks, floppy (registered trademark) disks and magnetic tapes, optical recording media such as CD-ROMs and DVDs, and magnetic-lights such as floppy disks. A medium and a hardware device specially configured to store and execute program instructions such as ROM, RAM, flash memory, and the like are included. The recording medium is also a transmission medium such as an optical or metal line or a waveguide including a carrier wave that transmits a signal for storing program instructions, data structures, and the like. Examples of program instructions include not only machine language code generated by a compiler but also high-level language code that can be executed by a computer using an interpreter or the like.

上述したように、本発明の好ましい実施形態を参照して説明したが、該当の技術分野において熟練した当業者にとっては、特許請求の範囲に記載された本発明の思想および領域から逸脱しない範囲内で、本発明をさまざまに修正および変更することができることを理解することができる。すなわち、本発明の技術的範囲は、特許請求の範囲に基づいて定められ、発明を実施するための最良の形態により制限されるものではない。   As described above, the preferred embodiments of the present invention have been described with reference to the preferred embodiments of the present invention. However, those skilled in the relevant art will not depart from the spirit and scope of the present invention described in the claims. Thus, it can be understood that various modifications and changes can be made to the present invention. In other words, the technical scope of the present invention is defined based on the claims, and is not limited by the best mode for carrying out the invention.

100:検索結果順位化装置
110:検索部
120:代表者抽出部
130:信頼度算出部
140:順位化部

100: Search result ranking device 110: Search unit 120: Representative extraction unit 130: Reliability calculation unit 140: Ranking unit

Claims (8)

検索クエリに対する検索結果文書を抽出する検索部と、
前記検索結果文書に対する代表者を抽出する代表者抽出部と、
前記代表者に対する信頼度を算出する信頼度算出部と、
前記信頼度に加えて、前記検索結果文書の前記検索クエリとの類似度、前記検索結果文書のページランクおよび前記検索結果文書のページランクのうち少なくとも1つを用いて前記検索結果文書を順位化する順位化部と、
を含み、
前記代表者抽出部は、前記検索結果文書が含まれるサイトのページランク、ブログランク、訪問者数、および下位文書の品質値のうち少なくとも1つが予め選定されたそれぞれの閾値以上である場合、前記検索結果文書の代表者を抽出することを特徴とする検索結果順位化装置。
A search unit for extracting a search result document for the search query;
A representative extractor for extracting representatives for the search result document;
A reliability calculation unit for calculating reliability for the representative;
In addition to the reliability, the search result document is ranked using at least one of the similarity of the search result document with the search query, the page rank of the search result document, and the page rank of the search result document. A ranking unit to
Including
The representative extraction unit, when at least one of the page rank, the blog rank, the number of visitors, and the quality value of the subordinate document of the site where the search result document is included is equal to or higher than a predetermined threshold value, A search result ranking apparatus characterized by extracting representatives of search result documents.
前記代表者抽出部は、
前記検索結果文書がブログポストである場合、ブログ所有者を代表者として抽出し、
前記検索結果文書がカフェの投稿メッセージである場合、前記カフェを代表者として抽出し、
前記検索結果文書がウェブページである場合、前記ウェブページの代表ウェブサイトを代表者として抽出し、
前記検索結果文書がニュースである場合、前記ニュースを提供する報道機関を代表者として抽出することを特徴とする請求項1に記載の検索結果順位化装置。
The representative extraction unit
If the search result document is a blog post, extract the blog owner as a representative,
If the search result document is a post message from a cafe, the cafe is extracted as a representative,
If the search result document is a web page, the representative website of the web page is extracted as a representative,
2. The search result ranking apparatus according to claim 1, wherein when the search result document is news, a news agency that provides the news is extracted as a representative.
前記代表者抽出部は、
前記検索結果文書のURLパターンを分析して、前記URLパターンを用いて代表者を抽出することを特徴とする請求項1に記載の検索結果順位化装置。
The representative extraction unit
The search result ranking apparatus according to claim 1, wherein a URL pattern of the search result document is analyzed, and a representative is extracted using the URL pattern.
前記信頼度算出部は、
予め選定された代表者プールに含まれる代表者に対して信頼度を算出することを特徴とする請求項1に記載の検索結果順位化装置。
The reliability calculation unit includes:
2. The search result ranking apparatus according to claim 1, wherein the reliability is calculated for representatives included in a representative pool selected in advance.
前記信頼度算出部は、
前記代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値のうち少なくとも1つを用いて信頼度を算出することを特徴とする請求項1に記載の検索結果順位化装置。
The reliability calculation unit includes:
The search result ranking apparatus according to claim 1, wherein the reliability is calculated using at least one of a page rank of a site operated by the representative, the number of visitors, and a quality value of a lower document. .
前記信頼度算出部は、
それぞれの検索クエリに対応して前記代表者の信頼度を算出することを特徴とする請求項1に記載の検索結果順位化装置。
The reliability calculation unit includes:
The search result ranking apparatus according to claim 1, wherein the reliability of the representative is calculated corresponding to each search query.
前記検索クエリは、代表者名を含み、
前記順位化部は、
前記代表者名と関連する代表者サイトの下位文書に重みを付与して順位化することを特徴とする請求項1に記載の検索結果順位化装置。
The search query includes a representative name,
The ranking unit includes:
2. The search result ranking apparatus according to claim 1, wherein ranking is performed by assigning a weight to a subordinate document of a representative site associated with the representative name.
前記代表者名は、
前記代表者が運営するサイト名および前記代表者が運営するサイトと関連するキーワードのうち少なくとも1つを含むことを特徴とする請求項7に記載の検索結果順位化装置。
The representative name is
The search result ranking apparatus according to claim 7, comprising at least one of a site name operated by the representative and a keyword related to the site operated by the representative.
JP2014042802A 2009-04-30 2014-03-05 Search result ranking apparatus and method using reliability of representative Active JP5724009B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020090038119A KR101050013B1 (en) 2009-04-30 2009-04-30 Apparatus and method for ranking search results using representative reliability
KR10-2009-0038119 2009-04-30

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2010093975A Division JP5497523B2 (en) 2009-04-30 2010-04-15 Search result ranking apparatus and method using reliability of representative

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2015068780A Division JP5989170B2 (en) 2009-04-30 2015-03-30 Search result ranking apparatus and method using reliability of representative

Publications (2)

Publication Number Publication Date
JP2014112433A true JP2014112433A (en) 2014-06-19
JP5724009B2 JP5724009B2 (en) 2015-05-27

Family

ID=43360614

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2010093975A Active JP5497523B2 (en) 2009-04-30 2010-04-15 Search result ranking apparatus and method using reliability of representative
JP2014042802A Active JP5724009B2 (en) 2009-04-30 2014-03-05 Search result ranking apparatus and method using reliability of representative
JP2015068780A Active JP5989170B2 (en) 2009-04-30 2015-03-30 Search result ranking apparatus and method using reliability of representative

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2010093975A Active JP5497523B2 (en) 2009-04-30 2010-04-15 Search result ranking apparatus and method using reliability of representative

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2015068780A Active JP5989170B2 (en) 2009-04-30 2015-03-30 Search result ranking apparatus and method using reliability of representative

Country Status (2)

Country Link
JP (3) JP5497523B2 (en)
KR (1) KR101050013B1 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013162265A1 (en) * 2012-04-23 2013-10-31 줌인터넷 주식회사 Method and system for providing ranking information by using packet mirroring
WO2013162263A1 (en) * 2012-04-23 2013-10-31 줌인터넷 주식회사 Method and system for determining search target rank by using packet mirroring
US9323810B2 (en) * 2013-08-29 2016-04-26 Fujitsu Limited Curation selection for learning
JPWO2016178337A1 (en) * 2015-05-01 2018-02-22 ソニー株式会社 Information processing apparatus, information processing method, and computer program
CN105488151A (en) * 2015-11-27 2016-04-13 小米科技有限责任公司 Reference document recommendation method and apparatus
JP6577925B2 (en) * 2016-09-20 2019-09-18 株式会社トヨタマップマスター FACILITY SEARCH DEVICE, FACILITY SEARCH METHOD, COMPUTER PROGRAM, AND RECORDING MEDIUM CONTAINING COMPUTER PROGRAM
KR101972660B1 (en) * 2017-08-18 2019-04-25 주식회사 포스코아이씨티 System and Method for Checking Fact

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10171819A (en) * 1996-12-06 1998-06-26 Fuji Xerox Co Ltd Information retrieving device
WO2002099695A1 (en) * 2001-05-31 2002-12-12 Sony Corporation Information processing apparatus, information processing method, and program
JP2004192542A (en) * 2002-12-13 2004-07-08 Nippon Telegr & Teleph Corp <Ntt> Information recommendation device, information recommendation method, program, and recording medium
US20050060312A1 (en) * 2003-09-16 2005-03-17 Michael Curtiss Systems and methods for improving the ranking of news articles

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005327028A (en) * 2004-05-13 2005-11-24 Ricoh Co Ltd Talent search system, program, and recording medium
KR100462542B1 (en) * 2004-05-27 2004-12-17 엔에이치엔(주) contents search system for providing confidential contents through network and method thereof
JP2006164086A (en) * 2004-12-10 2006-06-22 Nippon Telegr & Teleph Corp <Ntt> Online knowledge search support system and online knowledge search support method
JP4911599B2 (en) * 2006-12-28 2012-04-04 独立行政法人情報通信研究機構 Reputation information extraction device and reputation information extraction method
KR100941140B1 (en) * 2007-01-16 2010-02-09 넷다이버(주) Method and Apparatus for evaluating Blog
KR100928794B1 (en) * 2007-05-17 2009-11-25 엔에이치엔비즈니스플랫폼 주식회사 PPC method and system based on blog influence
KR100892263B1 (en) * 2007-08-01 2009-04-09 주식회사 다음커뮤니케이션 System and method for recommending a keyword according to each category

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10171819A (en) * 1996-12-06 1998-06-26 Fuji Xerox Co Ltd Information retrieving device
WO2002099695A1 (en) * 2001-05-31 2002-12-12 Sony Corporation Information processing apparatus, information processing method, and program
JP2004192542A (en) * 2002-12-13 2004-07-08 Nippon Telegr & Teleph Corp <Ntt> Information recommendation device, information recommendation method, program, and recording medium
US20050060312A1 (en) * 2003-09-16 2005-03-17 Michael Curtiss Systems and methods for improving the ranking of news articles

Also Published As

Publication number Publication date
JP5724009B2 (en) 2015-05-27
JP5497523B2 (en) 2014-05-21
JP5989170B2 (en) 2016-09-07
KR20100119157A (en) 2010-11-09
JP2010262638A (en) 2010-11-18
JP2015144011A (en) 2015-08-06
KR101050013B1 (en) 2011-07-19

Similar Documents

Publication Publication Date Title
JP5989170B2 (en) Search result ranking apparatus and method using reliability of representative
US8612416B2 (en) Domain-aware snippets for search results
JP4437500B2 (en) Technology that manages data in association with tag information
US9565236B2 (en) Automatic genre classification determination of web content to which the web content belongs together with a corresponding genre probability
US20150067476A1 (en) Title and body extraction from web page
JP5329540B2 (en) User-centric information search method, computer-readable recording medium, and user-centric information search system
JP2009151749A (en) Method and system for filtering subject related web page based on navigation path information
JP2007528520A (en) Method and system for managing websites registered with search engines
US20110208715A1 (en) Automatically mining intents of a group of queries
JP2010049372A (en) Content search apparatus
KR100917458B1 (en) Method and system of providing recommended words
KR20100132376A (en) Apparatus and method for providing snippet
JP2010061587A (en) Similar document determination device, similarity determination method and program therefor
JP5287099B2 (en) SEARCH DEVICE, INFORMATION PROCESSING DEVICE, SEARCH METHOD, PROGRAM, AND RECORDING MEDIUM
JP2010108268A (en) Document processing apparatus
KR101103671B1 (en) Method, system and computer readable recording medium for extracting the most relevant images dynamically and providing them responsive to users&#39; request
JP7081155B2 (en) Selection program, selection method, and selection device
JP4550939B1 (en) Information propagation path identification device, information propagation path identification method, information propagation path identification program
JP6749865B2 (en) INFORMATION COLLECTION DEVICE AND INFORMATION COLLECTION METHOD
Kaddu et al. To extract informative content from online web pages by using hybrid approach
JP4842921B2 (en) Search system and method
JP5903370B2 (en) Information search apparatus, information search method, and program
CN107784056B (en) Page data searching method and device
US20150169526A1 (en) Heuristically determining key ebook terms for presentation of additional information related thereto
Patel et al. A Survey on Web Content Extraction and Noise Reduction from Webpage

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140401

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150303

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150330

R150 Certificate of patent or registration of utility model

Ref document number: 5724009

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250