JP5540080B2 - 検索結果を生成する方法および情報検索のためのシステム - Google Patents

検索結果を生成する方法および情報検索のためのシステム Download PDF

Info

Publication number
JP5540080B2
JP5540080B2 JP2012510843A JP2012510843A JP5540080B2 JP 5540080 B2 JP5540080 B2 JP 5540080B2 JP 2012510843 A JP2012510843 A JP 2012510843A JP 2012510843 A JP2012510843 A JP 2012510843A JP 5540080 B2 JP5540080 B2 JP 5540080B2
Authority
JP
Japan
Prior art keywords
user
category
matching information
information
total amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012510843A
Other languages
English (en)
Other versions
JP2012527038A (ja
Inventor
ニン グオ
ユハン シエ
フェイ シン
レイ ホウ
チン チャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2012527038A publication Critical patent/JP2012527038A/ja
Application granted granted Critical
Publication of JP5540080B2 publication Critical patent/JP5540080B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99937Sorting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

関連出願
本出願は、「検索結果を生成する方法および情報検索のためのシステム」と題され、2009年5月12日に出願された中国特許出願第200910135277.4号に対する優先権を主張し、この出願の全内容は参考文献として本明細書に援用される。
本開示は、コンピュータ利用技術分野に関し、特に、検索結果を生成する方法および情報検索システムに関する。
情報検索システムは、ユーザに情報検索サービスを提供することができるシステムである。一例は、インターネットにおいて共通して用いられている検索エンジンである。インターネットにおける使用を鑑みると、検索エンジンは、ユーザがウェブをサーフするための欠くことのできないツールの1つになっている。ユーザの視点から、検索エンジンは、検索ボックスを含むウェブページを通常提供する。ユーザは検索ボックスにおいてキーワードまたは他の検索条件(それは関連するブラウザによって検索エンジンに対して引き続き送信される)を入力する。その後、検索エンジンは、ユーザによって入力されたキーワードと一致する情報を返す。
ユーザ検索要求(例えばユーザによって入力された検索キーワード)を鑑みると、検索エンジンは、一般に、恐らく数十から数万に達する件数とともに多数の関連情報を探し出すことができる。ユーザの視点から、ユーザは、検索結果において相対的に高いランクに置かれた情報のみに注目するであろう。したがって、検索エンジンがユーザに対して検索結果を提供する場合に、これらの情報をいかにランクづけするかは、特に重大になっている。検索結果のランキングが適切であるか否かは、ユーザエクスペリエンスに直接的な影響を及ぼすだろう。
検索エンジンが情報をランクづけする場合、様々な要因が考慮に入れられる。考慮される要因は、例えば、情報のソース、情報の信頼性、ユーザのレスポンスなどを含んでもよい。これらの要因の中で、ユーザのレスポンスは、検索結果のランキングに影響を与える鍵になる要因である。例えば、検索キーワードが「中央電視台(China Central Television)」である場合、80パーセントのユーザは、中央電視台の公式ホームページをクリックする。ユーザのレスポンスが考慮された要因のみであるならば、検索エンジンは、当然、キーワード「中央電視台」に対応する検索結果の一番上に中央電視台の公式ウェブページを置いてもよい。
前述の結果を達成するために、既存の検索エンジンは、検索キーワードと一致する様々な情報に関連するユーザのレスポンスの量をカウントし、ユーザの反応の量に基づいて降順でユーザのための検索結果を生成する。既存の技術の研究により、本発明者は、検索結果を生成する既存の方法の以下の問題に気づいた。新しく公開された情報にとって、レスポンスの量の初期値は、低いランクという結果になる0(または、極めて低値)であるかもしれない。低いランクのせいで、新しく公開された情報は、ユーザによってほとんど気づかれない場合がある。したがって、ランキングは、ほとんど伸びない場合がある。別の視点から、あるユーザは、検索結果内のより高いランクに彼(または彼女)の公開された情報を置き、したがって、他のユーザの通常の利益に影響を与えるために、ある不正な手段(不正なクリックなど)を通じてレスポンスの量を素早く変動させるかもしれない。したがって、ユーザの視点から、既存の技術によって生成される検索結果は、ユーザエクスペリエンスに衝撃を与える欠点がある。
前述の問題を解決するために、本開示は、一致情報のより適切なランキング結果を表示し、それによって、ユーザエクスペリエンスを改善することができる、検索結果を生成する方法および情報検索システムを提供する。提案される技術的なスキームは、以下のように記述される。
本開示は、検索結果を生成する方法を提供する。その方法は、受信された検索要求に基づいて、情報検索システムにおいて検索することにより前記検索要求と一致する複数の一致情報を取得するステップと、前記複数の一致情報の各々に関連するユーザのレスポンスのそれぞれの量と、前記複数の一致情報の各々が属するそれぞれのカテゴリに関連するユーザのレスポンスの合計量とを取得するステップと、前記複数の一致情報の各々が属する前記それぞれのカテゴリに関連する前記ユーザのレスポンスの合計量に基づいて検索結果を生成するために前記複数の情報をランクづけするステップとを含む。
本開示は、また、情報検索システムを開示する。その情報検索システムは、検索要求を受信し、検索によって、前記検索要求に一致する複数の一致情報を取得する情報検索ユニットと、複数の一致情報の各々に関連するユーザのレスポンスのそれぞれの量を取得し、さらに、前記複数の一致情報の各々が属するそれぞれのカテゴリに関連するユーザのレスポンスの合計量を取得するユーザレスポンス演算ユニットと、前記複数の一致情報が属する前記それぞれのカテゴリに関連する前記ユーザのレスポンスの合計量に基づいて検索結果を生成するために前記複数の情報をランクづけする結果生成ユニットとを備える。
既存の技術と比較して、本開示の典型的な実施形態において提供される技術的なスキームは、ランキングのベースとして、個別の情報に関連するユーザのレスポンスの量を用いない。もっと正確に言えば、開示された技術的なスキームは、ランキングのベースとして、個別の情報が属するそれぞれのカテゴリに関連するユーザのレスポンスの合計量を用いる。したがって、たとえ新たに公開された1つの情報に対するユーザのレスポンスの量が非常に少ないかもしれなくても、この情報が相対的により多くのユーザの注目を引くカテゴリに属するのであれば、この情報は、なお、相対的に高いランクに置かれてもよい。別の視点から見て、個別の情報に対するユーザのレスポンスの量の増加は、個別の情報のランキングを直接伸ばさないかもしれないが、その代り、この情報が属するカテゴリのランキングを増加させてもよい。したがって、検索結果におけるランキング上の不正なクリックのような不正手段の影響は、効果的に軽減されることができる。
本開示の典型的な実施形態の技術的なスキームを理解するのを支援するために、添付された図は、以下に与えられ簡潔に記述される。以下の図は、本開示のほんの少数の典型的な実施形態を表わす。これらの添付の図に基づいて、当業者は、任意の創造力または取り組みを入れずに、他の図を取得することができる。
本開示による、検索結果を生成する典型的な方法のフローチャートである。 本開示による、典型的な情報検索システムの概略構成図である。 本開示による、典型的な結果生成ユニットの概略構成図である。 本開示による、典型的なランキングスコア演算サブユニットの概略構成図である。 本開示による、別の典型的な結果生成サブユニットの概略構成図である。
本開示による、検索結果を生成する典型的な方法は、まずここに記述される。その方法は、情報検索システムによって検索要求を受信し、検索による検索要求と一致する様々な一致情報を取得するステップと、様々な一致情報の各々に関連するユーザのレスポンスのそれぞれの量を問い合わせ、さらに、様々な一致情報の各々が属するそれぞれのカテゴリに関連するユーザのレスポンスの合計量を取得するステップと、様々な一致情報の各々が属するそれぞれのカテゴリに関連するユーザのレスポンスの合計量に基づいて検索結果を生成するために様々な一致情報をランクづけするステップとを含む。
当業者が本開示の技術的なスキームをより良く理解することを可能にするために、本開示の典型的な実施形態における技術的なスキームは、典型的な実施形態のための添付の図を参照しながら以下に記述される。本明細書に記述された典型的な実施形態は、本開示の典型的な実施形態の(すべてではなく)一部のみを構成する。本開示の典型的な実施形態に基づいて、創造的な取り組みなしで当業者によって導き出される他のすべての実施形態は、本開示のさらに範囲内である。
本開示で提供される技術的なスキームについて詳細に説明するために、以下のネットワーク検索アプリケーションが、一例として用いられる。図1は、以下で記述されるような検索結果を生成する、典型的な方法100のフローチャートを示す。
S101において、検索エンジンは、検索要求を受信し、検索により、検索要求と一致する様々な一致情報を取得する。
ユーザがオンラインで情報を探し出す必要がある場合、ユーザは、1つ以上の検索条件を入力する。一般に使用される検索条件は、検索キーワードである。いくつかの検索エンジンは、さらに、異なる特定の検索アプリケーションシナリオ(Different Specific Search Application Scenarios)にしたがって、情報の公開時期および情報のプロパティなどの付加的なタイプの検索条件を支援してもよい。本開示の典型的な実施形態において、各々の様々な検索条件は、全般的に検索要求と呼ばれる。検索要求を受信すると、検索エンジンは、検索要求と一致する情報を検索する。検索アプリケーションシナリオに依存して、異なるカテゴリの情報が探し出されるかもしれない。例えば、ウェブページの検索において、探し出されるべき情報は、ウェブページを含む。電子商取引における検索に関して、探し出されるべき情報は、製品を含む。論文検索において、探し出されるべき情報は、雑誌やジャーナル記事などを含む。検索要求に一致する情報を探し出す方法は、既存の技術に類似しているので、本開示の典型的な実施形態において詳細に記述されないだろう。
S102においては、様々な情報の各々に関連するユーザのレスポンスのそれぞれの量が取得され、様々な情報の各々が属するそれぞれのカテゴリに関連するユーザのレスポンスの合計量もまた取得される。
検索エンジンは、一般に、検索要求に一致する複数の一致情報を探し出すことができる。検索エンジンは、ユーザによる理解を容易にするために、これらの情報を検査しランクづけするためのあるルールに従う。
これらのルールの中で、ユーザのレスポンスは、検索結果内のランクづけに影響を与える鍵になる要因である。基本的なルールは、検索結果の一番上に、ユーザが最大に関心のある情報を置くことである。本開示の典型的な実施形態において、ユーザのレスポンスの量は、ある情報を有しているかもしれないユーザの注目の度合いを反映するためのパラメータとして、用いられる。例えば、ウェブページリンクのクリック回数またはブックマークを付けられたリンク件数などは、対応するウェブページを有しているかもしれないユーザの注目の度合いを直接反映することができる。したがって、リンク上のクリック回数および/またはブックマークを付けられるリンクの回数などの情報は、ウェブページへのユーザのレスポンスの量の尺度として注目されることができる。電子商取引において、ある製品に対するユーザのレスポンスの量は、製品の売上高、製品の総取引量、製品に関する照会件数、および適切な製品情報がブックマークを付けられる回数などの情報を含むことができる。当業者は、ユーザのレスポンスの量を表わすために、特定のカテゴリの情報が選択されてもよいということを十分に理解することができる。あるいは、複数のカテゴリの情報は、ユーザのレスポンスの量を表わすために考慮に入れられてもよい。例えば、
ユーザのレスポンス=製品の売上高×0.3+ブックマークを付けられている回数×2
ユーザのレスポンス=製品の総取引販売量×製品情報がブックマークを付けられた回数+ログ(製品の総取引量)
など。
一般に、ユーザのレスポンスの量は、ユーザレスポンスログに記録される。ユーザレスポンスログを読み出すことによって、検索エンジンは、様々な情報に対応するユーザのレスポンスのそれぞれの量を取得することができる。その上、検索エンジンは、絶えず変化するユーザの興味のポイントに順応するために、ある期間(例えば、直近の1週間、直近の1か月、など)内のユーザレスポンスログを選択的に読み出してもよい。
例えば、ある検索要求に関して、検索エンジンは、4つの一致情報を探し出してもよい。ユーザレスポンスログを読み出すと、これらの4つの一致情報の各々に関連するユーザのレスポンスの量は、取得され、表1に示される。
Figure 0005540080
表1において図示されたように、これら4つの一致情報に対するユーザのレスポンスの量のサイズ相関は、一致情報1>一致情報3>一致情報2>一致情報4である。既存の技術的なスキームが用いられれば、検索結果は、典型的にはこの順序で生成され、その順序でユーザに表示されるだろう。但し、本開示における技術的なスキームは、これらの様々な一致情報のユーザのレスポンスの量で、さらに処理することを必要とする。
通常、1つのオンライン情報は、あるカテゴリにしたがって公開される。例えば、ポータルウェブサイトのウェブページのカテゴリは、ニュース、スポーツ、娯楽および金融などを含んでもよい。電子商取引ウェブサイトの製品カテゴリは、家具、電子機器、衣服、食物などを含んでもよい。したがって、検索エンジンによって探し出された一致情報の各々は、その一致情報が属する対応するカテゴリを有する。本開示の典型的な実施形態において、様々な一致情報のユーザのレスポンスの量を取得すると、一致情報のそれぞれに属するカテゴリが、まず取得される。ウェブページの場合、ウェブページの対応するカテゴリが、関連するウェブアドレスパスを介して取得されてもよい。例えば、「ニュース」分野を含むウェブアドレスパスを有するウェブページは、ニュース型ウェブページとして分類されてもよいし、その一方で、「スポーツ」分野を含むウェブアドレスパスを有するウェブページは、スポーツ型ウェブページとして分類されてもよい。製品に関して、その製品の対応するカテゴリは、その製品情報を直接得ることにより取得されてもよい。
その上、一致情報の各々のカテゴリのユーザのレスポンスの合計量が、さらに計算される。例えば、表1で示される例における一致情報1および一致情報4は「カテゴリA」に属し、その一方で、一致情報2および一致情報3は「カテゴリB」に属する。したがって、表2に示されるように、「カテゴリA」に対するユーザのレスポンスの合計量は、100+5=105であり、その一方で、「カテゴリB」に対するユーザのレスポンスの合計量は、30+40=70である。
Figure 0005540080
S103にて、様々な一致情報の各々が属するカテゴリのユーザのレスポンスの合計量のサイズに基づいて、様々な一致情報は、検索結果を生成するためにランクづけされる。
表2を見て分かるように、「カテゴリA」は「カテゴリB」より多くのユーザの注目を受けた。したがって、ユーザのレスポンスの合計量が、考慮された要因のみであるならば、「カテゴリA」に属する情報は、「カテゴリB」に属する情報に先立って示されるだろう。
一致情報4にとって、ユーザのレスポンスのその量は、非常に小さい。既存の技術的なスキームが用いられれば、一致情報4は、通常の状況下で高いランキングをほとんど取得しないだろう。但し、本開示の技術的なスキームは、ランキングのベースとして個別の情報の各々のユーザのレスポンスの量のサイズを用いない。一致情報4のユーザのレスポンスの量は非常に少ないが、それは相対的により高い注目を受けたカテゴリに属しており、したがって、一致情報4は、本開示における技術的なスキームによって生成された検索結果において、一致情報2および一致情報3に先立って示される(または、一致情報4は、一致情報2および一致情報3に先立って置かれるべき、より高い可能性を有する)。したがって、新しく公開された情報でさえ、検索結果においてより高いランキングを取得するためのより多くの可能性を有するかもしれず、したがって、ユーザの実際的な必要性をより満たすかもしれない。
表1に基づいて、ある人が検索要求と一致する情報5(情報5は「カテゴリC」に属すると仮定される)を最近公開したとすると、その人は、ユーザのレスポンスの量が短期間で50に到達するために不正にクリックするような手段を用いる。既存の技術的なスキームが用いられれば、この一致情報5は、検索結果において第2位から最上位の地位に直接置かれ、したがって、他の情報公開の通常の有益性に影響を与える。但し、カテゴリCのユーザのレスポンスの合計量がカテゴリAおよびカテゴリBの合計量未満であるので、本開示の技術的なスキームによれば、一致情報5は、それでもやはり、不正手段にもかかわらず高いランキングを取得することはできない。上述の例が単に例示の目的のためのものであることは、注目されるべきである。実用化において、情報の複数のカテゴリ、および探し出されるべき複数の一致情報は、より大きな量であってもよい。個人ユーザは不正手段を通じて彼(または彼女)の1つ以上の公開された情報のレスポンスの量を伸ばすかもしれないが、情報が属するカテゴリのユーザのレスポンスの合計量は、ほとんど影響を与えられない。したがって、これは、検索結果のランキングの不正の影響を効果的に低減することができる。
上述の典型的な実施形態が、単にユーザのレスポンスの量を考慮することにより、一致情報をランクづけすることは、注目されるべきである。実用化において、検索結果を生成する場合、検索エンジンは、複数の要因を考慮に入れてもよい。一般に、要因の各々は、重みを加えられたパラメータとして扱われてもよい。それぞれの要因の重要な度合いに依存して、重みづけ係数は、各々の重みを加えられたパラメータに対して設定される。ランキングスコアを取得するために重みを加えられたパラメータの重み平均を処理することによって、検索エンジンは、最後に、一致情報のそれぞれのランキングスコアに基づいた検索結果において一致情報の各々のランクを判定する。
既存の技術的なスキームが用いられれば、そのユーザのレスポンスの量が増加するにつれて、一致情報の重みづけ係数は増加するだろう。本開示における技術的なスキーム下では、一致情報が属するカテゴリのユーザのレスポンスの合計量が増加するにつれて、一致情報の重みづけ係数は、増加する。表2に示された結果から、一致情報1および一致情報4の、パラメータに対する重みづけ係数、ユーザのレスポンスの量は、一致情報2および一致情報3より大きい。既存の技術と比較して、一致情報1は、高いランクの地位に置かれるためのより高い可能性を有する。
具体的には、一致情報の各カテゴリに対する重みづけ係数は、一致情報の各カテゴリのユーザのレスポンスの合計量の比率値に基づいて計算されてもよい。一例として表2を用いると、カテゴリAのユーザのレスポンスの合計量は105であり、その一方で、カテゴリBのユーザのレスポンスの合計量は70である。したがって、比率は3:2である。この比率は、さらに正規化されてもよい。例えば、各々のカテゴリのユーザのレスポンスの合計量は、カテゴリのユーザのレスポンスのすべての合計量の和で除算されてもよく、0.6対0.4の比率という結果になる。そのため、カテゴリAに属する一致情報およびカテゴリBに属する一致情報の、パラメータに対する重みづけ係数、ユーザのレスポンスの量は、それぞれ、0.6と0.4である。あるいは、各々のカテゴリのユーザのレスポンスの合計量は、カテゴリの中のユーザのレスポンスの合計量の最大値で除算されてもよく、1対0.67の比率という結果になる。そのため、カテゴリAに属する一致情報およびカテゴリBに属する一致情報の、パラメータに対する重みづけ係数、ユーザのレスポンスの量は、それぞれ、1と0.67である。
あるいは、検索エンジンは、ユーザのレスポンスのそれぞれの合計量にしたがって一致情報のカテゴリを配置し、ランキング結果に基づいて一致情報の各カテゴリに対応する重みづけ係数を取得してもよい。例えば、表3は、以下のように示す。
Figure 0005540080
図示されるように、各々のカテゴリの情報によって取得された結果の重みづけ係数は、各々のカテゴリのユーザのレスポンスの合計量のそれぞれのランクの地位にのみ関連するが、ユーザのレスポンスの合計量の値には関連しない。具体的には、カテゴリEに属する情報にとって、より大きな重みづけ係数は、カテゴリEのユーザのレスポンスの合計量が500を超える場合にのみ、そのランキングを伸ばすために取得されてもよい。したがって、検索結果ランキングの不正の影響は、さらに軽減されることができる。
演算の重みづけ係数の2つの具体例が以上に記述されている。「一致情報が属するカテゴリのユーザのレスポンスの合計量が大きいほど、関連する重みづけ係数は大きくなる」という原則に基づいて、当業者は、他の特定条件を組み込み、重みづけ係数を計算するために他の技術的な手段を取り入れてもよい。このような導き出される技術的な手段は、なお、本開示の範囲内にある。
実用化においては、複数の要因が考慮に入れられる場合、重みづけ係数を用いるアプローチに加えて(または、その代わりに)複数のランキングを実行するアプローチが用いられてもよい。具体的には、1つの(または、それ以上の)要因に基づいて最初に一致情報のランクづけをすると、最初のランキングの結果は、1つの(または、それ以上の)別の要因に基づいて今一度ランクづけされてもよい。
この明細書の開示において提供される技術的なスキームに基づいて、当業者は、以下のことを容易に十分に理解することができる。すなわち、様々な一致情報が属するそれぞれのカテゴリのユーザのレスポンスの合計量に基づいて様々な一致情報のランクづけをすると、各々のカテゴリ内の一致情報は、ユーザのレスポンスの対応する量に別々に基づいて、さらにランクづけされてもよい。
表1で与えられたデータが、例として用いられてもよい。開示された技術的なスキームの下では、カテゴリAに属する情報は、カテゴリBに属する情報に先立って置かれるべきである。すなわち、一致情報1および4は、一致情報2および3に先立って置かれる。その上、カテゴリ内の一致情報は、さらに、これらの一致情報のユーザのレスポンスのそれぞれの量に基づいて、今一度ランクづけされてもよい。取得された結果は、以下の順序(すなわち、一致情報4、一致情報1、一致情報3、および一致情報2)である最終順序の結果により、一致情報1が一致情報4に先立って置かれるべきであり、一致情報3が一致情報2に先立って置かれるべきであるということであってもよい。
上述の技術的なスキームから例証されるように、一方では、高い注目を受けるカテゴリは、高いランクに置かれることが保証される。一方、同一のカテゴリ内という前提の下で、各々のカテゴリ内の一致情報は、さらに、ユーザのレスポンスの対応する量に基づいてランクづけされる。当業者は、様々な一致情報が属するそれぞれのカテゴリのユーザのレスポンスの合計量に基づいて、様々な一致情報をランクづけすると、各々のカテゴリ内の一致情報は、1つ以上の他の要因にしたがって、さらにランクづけされてもよいことを理解してもよい。さらに、必要な場合は、第3のランキング、第4のランキングなどが、さらに、他の要因に基づいて実行されてもよい。それ以上の詳細な説明は、簡潔さの目的のために用意されないだろう。
いくつかの特定のアプリケーションの例は、本開示の検索結果を生成する方法について説明するために、以下に与えられる。
例えば、ウェブページ検索アプリケーションにおいて、キーワード「赤壁」(その英訳は「Chibi」である)が、検索として用いられる。検索エンジンは、「Chibi」に一致する多数のウェブページを探し出し、これらのウェブページは、様々なカテゴリに属する。ある期間内のユーザレスポンスログを読み出すことによって、およびウェブページのカテゴリに基づいて各々のカテゴリのユーザのレスポンスの合計量を計算することによって、表4に示されるような結果が取得される。
Figure 0005540080
「Chibi」は、古代中国の有名な戦いであり、したがって、一致するウェブページの多くは、当然に「軍事」および「歴史」のカテゴリに属するだろう。同時に、「Chibi」は、多くの場合、映画またはゲームのエピソードとして出現するので、一致するウェブページの多くは、「娯楽」および「ゲーム」のカテゴリに属する。さらに、「Chibi」は観光地であり、したがって、一致するウェブページのいくつかは、たぶん「旅行」のカテゴリに属するだろう。
ユーザのレスポンスの量が、ある期間内にあるユーザレスポンスログを読み出すことにより取得されるので、その期間においてユーザの興味のあるポイントが反映されてもよい。例えば、映画のように、「Chibi」は、多くの人から注目を受けている。したがって、映画のリリースの前後の期間に、「娯楽」のカテゴリに属するウェブページとの一致は、他のカテゴリのものより多く、表4に示されるように、非常に高いユーザクリック率を有する。本開示における技術的なスキームの下で、ユーザが検索を実行するためにキーワードとして「Chibi」を用いると、「娯楽」のカテゴリに属するウェブページとの一致は、(個別のウェブページのためのユーザクリック率に関係なく)より高い重みづけ係数を取得し、したがって、ユーザが閲覧のためにクリックすることを容易にするために、検索結果においてより高いランクに置かれるだろう。
この開示において提供される技術的なスキームは、また、電子商取引のための検索アプリケーションにおいて用いられてもよい。例えば、ユーザは、製品検索を実行するためにキーワードとして「ラップトップ」を用いる。検索エンジンは、ラップトップコンピュータ、ラップトップバッテリ、ラップトップラジエタ、および筆記用として用いられる従来の手帳などに関連する製品を探し出してもよい。電子商取引ウェブサイトによる製品カテゴリの分類に基づいて、ラップトップコンピュータは「ラップトップ完成品一式」のカテゴリに属してもよいし、その一方で、ラップトップバッテリおよびラップトップラジエタは「ラップトップアクセサリ」のカテゴリに属していてもよい。筆記用として用いられる従来の手帳は、「文房具類備品」または「事務用消耗品」のカテゴリに属してもよい。ユーザのレスポンスの量をカウントすることによって、既存のステージにおいて「ラップトップ」をキーワード検索として用いる大部分のユーザの関心事の実製品は、ラップトップコンピュータである。したがって、本開示の技術的なスキームを用いると、「ラップトップ完成品一式」のカテゴリに属する製品は、より高い重みづけ係数を取得し、したがって、ユーザが閲覧のためにクリックすることを容易にするために、検索結果においてより高いランクに置かれるだろう。同様に、新しく、ラップトップコンピュータの製品に関連して公開された情報は、より高いランクに置かれてもよい。たとえ、不正手段(例えば、公開者は問い合わせの件数を増加させるかもしれない、または彼(または彼女)の製品情報に自分でブックマークをつけるかもしれない)が実行されたとしても、従来の手帳は、実際は「ラップトップ」を検索する大部分のユーザの実際の関心事ではないので、キーワード「ラップトップ」に関しての従来の手帳(それは「文房具類備品」または「事務用消耗品」カテゴリに属する)ランキングを伸ばすことはできない。(従来の手帳に関心を持つユーザは、本開示の技術的なスキームと無関係な「文房具類備品」または「事務用消耗品」の範囲の検索を実行するだろう。対応する詳細な記述は、本明細書に記述されない。)例証されたように、この開示の技術的なスキームによって生成された検索結果でのランキングは、ユーザのニーズに対して非常によく適しており、したがって、ユーザエクスペリエンスを効果的に改善する。
上述の2つの例は、例示の目的のみに用いられる。実際のオンライン情報は、より包括的な分類レベルを含んでもよい。例えば、上述の例における「ラップトップバッテリ」および「ラップトップラジエタ」は、「ラップトップアクセサリ」のカテゴリの下の個別のアイテム情報と呼ばれる。実用化において「ラップトップバッテリ」および「ラップトップラジエタ」は、「ラップトップアクセサリ」のカテゴリの下の2つのサブカテゴリに対応してもよい。したがって、本開示で提供される技術的なスキームを用いると、これらの2つのサブカテゴリの各々は、ユーザのレスポンスの対応する合計量を有する。ユーザが「ラップトップアクセサリ」の範囲の検索を実行すれば、これらの2つのサブカテゴリの製品は、異なる重みづけ係数を別々に取得してもよい。ユーザが最も小さなカテゴリの範囲内の検索を実行するならば、そのように取得された検索結果のランキングは、そのカテゴリの下の個別の製品情報のユーザのレスポンスの量のサイズに基づくであろうことは、十分に理解することができる。
本開示の上述の技術的なスキームは、ウェブページ検索および電子商取引検索における2つのアプリケーションを記述する。これらが単に本開示の技術的なスキームの2つの典型的なアプリケーションであることは理解される。実際、開示された技術的なスキームは、ライブラリデータベース検索、文献探索などの様々な検索ニーズに用いることができる。その上、本開示の範囲は、インターネット分野に限定されない。単一コンピュータまたはローカルエリアネットワーク内の検索などの他の分野は、また、この開示において提供される技術的なスキームを使用してもよい。
上述の典型的な実施形態に対応して、本開示は、さらに、情報検索システム200を記述する。図2において示されるように、システム200は、情報検索ユニット210、ユーザレスポンス演算ユニット220および結果生成ユニット230を含む。
情報検索ユニット210は、検索要求を受信し、検索することにより、検索要求に一致する様々な一致情報を取得する。ユーザレスポンス演算ユニット220は、様々な一致情報の各々に関連するユーザのレスポンスのそれぞれの量を取得し、さらに、様々な一致情報の各々が属するそれぞれのカテゴリに関連するユーザのレスポンスの合計量を取得する。ユーザのレスポンスの合計量は、カテゴリの下の一致情報のユーザのレスポンスの和である。結果生成ユニット230は、様々な一致情報が属するそれぞれのカテゴリに関連するユーザのレスポンスの合計量に基づいて検索結果を生成するために様々な情報をランクづけする。
ユーザレスポンス演算ユニット220は、ある期間内のあるユーザレスポンスログを読み出すことにより、それぞれの一致情報のユーザのレスポンスの量を取得してもよい。
図3は、結果生成ユニット230の1つの実施形態を示す。図3に示されるように、結果生成ユニット230は、ランキングスコア演算サブユニット231および結果生成サブユニット232を含んでもよい。
ランキングスコア演算サブユニット231は、重みづけパラメータとして様々な一致情報の各々が属するそれぞれのカテゴリに関連するユーザのレスポンスの合計量を用いることにより、様々な一致情報のためのランキングスコアを計算する。ここで、第1の一致情報が属するカテゴリに関連するユーザのレスポンスの合計量が、第2の一致情報が属するカテゴリに関連するユーザのレスポンスの合計量より大きい場合、第1の一致情報の重みづけ係数の値が第2の一致情報の重みづけ係数の値より大きい。結果生成サブユニット232は、様々な一致情報のランキングスコアに基づいて検索結果を生成する。
図4に示されるように、ランキングスコア演算サブユニット231は、第1の重みづけ係数演算モジュール2311を含んでもよい。第1の重みづけ係数演算モジュール2311は、様々な一致情報の各々が属するそれぞれのカテゴリに関連するユーザのレスポンスの合計量に基づいて、様々な一致情報の各々が属する各々のカテゴリのための重みづけ係数を取得する。
当業者は、ランキングスコア演算サブユニット231が、他の重みづけパラメータに対応する重みづけ係数を演算するために、第2の重みづけ係数演算モジュール2312、第3の重みづけ係数演算モジュール2313などをさらに含んでもよいことを理解してもよい。
ランキングスコア演算サブユニット231は、さらに、重み平均モジュール2310を含んでもよい。重み平均モジュール2310は、様々な一致情報のランキングスコアを取得するために第1の重みづけ係数演算モジュール2311の計算結果を含む重みづけ係数の重み平均処理を実行する。
具体的には、第1の重みづけ係数演算モジュール2311は、一致情報の各カテゴリのユーザのレスポンスの合計量の間の比率を算出し、この比率に基づいて、一致情報の各カテゴリの重みづけ係数を取得してもよい。あるいは、第1の重みづけ係数演算モジュール2311は、ある順序で、一致情報の各カテゴリのユーザのレスポンスの合計量を配置し、その順序結果に基づいて、一致情報の各カテゴリの重みづけ係数を取得してもよい。
図5に示されるように、結果生成ユニット230は、第1のランクづけサブユニット233および第2のランクづけサブユニット234を含んでもよい。
第1のランクづけサブユニット233は、様々な一致情報の各々が属するそれぞれのカテゴリに関連するユーザのレスポンスの合計量に基づいて様々な一致情報をランクづけする。第2のランクづけサブユニット234は、それぞれの様々な一致情報のユーザのレスポンスの量に基づいて各カテゴリ内の一致情報をランクづけする。
以上に記述された情報検索システム200は、インターネット検索に用いられる検索エンジンであってもよいし、または、単一コンピュータまたはローカルエリアネットワーク内で検索するために用いられる情報検索システムであってもよい。
ユーザのレスポンスの量は、必ずしも検索結果ランキングのための唯一の要因ではないかもしれない。ユーザによって入力されたキーワードと、ウェブページまたはウェブページのページランク値に表示された情報との間の関連の度合いなどの他の要因は、検索結果ランキングのための要因となるように、ユーザのレスポンスの量とともに用いられてもよい。
利便性のよい説明のために、上述のシステムは、別々に記述される様々なユニットに機能的に分割される。開示されたシステムを実行する場合、様々なユニットの機能は、ソフトウェアおよび/またはハードウェアの1つ以上の事例において実行されてもよい。
以上に記述された典型的な実施形態から、当業者は、開示された方法およびシステムが、ソフトウェアおよび普遍的なハードウェアプラットフォームを用いて実行されてもよいことを明確に理解できる。この理解に基づいて、本開示の技術的なスキーム(あるいは既存の技術の一助となる部分)は、ROM/RAM、ハードドライブおよび光ディスクなどの記憶媒体に格納されるソフトウェアプロダクトの形式で実行されてもよい。ソフトウェアは、コンピュータ装置(例えばパーソナルコンピュータ、サーバまたはネットワーク・デバイス)が本開示の典型的な実施形態において記載された方法を実行するための命令を含む。
様々な典型的な実施形態は、本開示で次第に記述される。典型的な実施形態の同一または同様の部分は、相互に参照されることができる。典型的な実施形態の各々は、他の典型的な実施形態とは異なる焦点がある。特に、典型的なシステム実施形態は、典型的な方法とのその基本的な対応のため、相対的に単純な方式で記述されている。その詳細な記述は、典型的な方法の関連する部分に参照されることができる。上述の典型的なシステムの説明は、例示の目的のみのために意図される。その中で別々の構成要素として記述されたユニットは、物理的に分割されてもよいし、分割されなくてもよい。ユニットに関して例証された構成要素は、物理的ユニットであってもよいし、物理的ユニットでなくてもよい(例えば、一ヶ所に配置されてもよいし、または複数のネットワークユニットの中で分散されてもよい)。実際のニーズに依存して、典型的な実施形態の目的は、モジュールの一部またはすべてを選択することによって達成されてもよい。当業者は、創造力に富む効果なしで開示されたシステムを理解し実行する場合がある。
開示された方法およびシステムは、普遍的なまたは特定化されたコンピュータシステムの環境または構成において用いられてもよい。具体例は、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルド装置または携帯型装置、タブレット装置、マルチプロセッサシステム、マイクロプロセッサ・ベース・システム、セットアップボックス、プログラミング可能な宅内電子装置、ネットワークPC、小規模コンピュータ、大規模コンピュータ、および上述の任意のシステムまたは装置を含む分散コンピューティング環境を含む。
本開示は、プログラムモジュールなどのコンピュータによって実行されるコンピュータ実行可能な命令の一般的なコンテキスト内に記述されてもよい。一般に、プログラムモジュールは、特定タスクを実行するためのまたは特定の抽象データ型を実現するための、ルーチン、プログラム、オブジェクト、モジュール、およびデータ構造などを含む。開示された方法およびサーバは、また、分散コンピューティング環境において実行されてもよい。分散コンピューティング環境において、タスクは、通信網を介して接続される遠隔処理装置によって実行される。分散コンピューティング環境において、プログラムモジュールは、ローカルコンピュータおよびリモートコンピュータの記憶媒体(それらは記憶装置を含む)に配置されてもよい。
上述したことは、本開示の好ましい典型的な実施形態のみである。但し、本開示は、この明細書に限定されない。当業者が、この開示の精神および範囲から逸脱せずに、様々な方法において本開示を変更または修正することができることは、十分に理解される。したがって、これらの変更および変形は、本開示の特許請求の範囲およびそれらの均等物内に収まると見なされるべきである。

Claims (18)

  1. 情報検索ユニット、ユーザレスポンス演算ユニット、結果生成ユニットを有する情報検索システムを構成するコンピューターにおいて実行される検索結果を生成する方法であって、
    前記情報検索ユニットにより、受信された検索要求に基づいて、前記情報検索システムにおいて検索することにより前記検索要求と一致する複数の一致情報を取得するステップと、
    前記ユーザレスポンス演算ユニットにより、ユーザレスポンスログを読み出し、取得された前記複数の一致情報の各々に関連するユーザのレスポンスのそれぞれの量と、前記複数の一致情報の各々が属するそれぞれのカテゴリに関連するユーザのレスポンスの合計量とを取得するステップと、
    前記結果生成ユニットにより、前記複数の一致情報の各々が属する前記それぞれのカテゴリに関連する前記ユーザのレスポンスの合計量に基づいて検索結果を生成するために前記複数の一致情報をランクづけするステップと
    を含むことを特徴とする方法。
  2. それぞれのカテゴリと関連する前記ユーザのレスポンスの合計量は、前記それぞれのカテゴリの下の一致情報のユーザのレスポンスの和を含むことを特徴とする請求項1に記載の方法。
  3. 前記複数の一致情報の各々に関連する前記ユーザのレスポンスのそれぞれの量を取得するステップは、
    ある期間のあるユーザレスポンスログを読み出すことにより、前記複数の一致情報の各々に関連する前記ユーザのレスポンスのそれぞれの量を取得するステップ
    を含むことを特徴とする請求項1に記載の方法。
  4. 前記様々な一致情報の各々が属する前記それぞれのカテゴリに関連する前記ユーザのレスポンスの合計量に基づいて前記複数の一致情報のランクづけをするステップは、
    重みづけパラメータとして前記様々な一致情報の各々が属する前記それぞれのカテゴリに関連する前記ユーザのレスポンスの合計量を用いることにより前記複数の一致情報のためのランキングスコアを演算するステップを含み、
    第1の一致情報が属するカテゴリに関連するユーザのレスポンスの合計量が、第2の一致情報が属するカテゴリに関連するユーザのレスポンスの合計量より大きい場合、前記第1の一致情報の重みづけ係数の値は、前記第2の一致情報の重みづけ係数の値より大きいことを特徴とする請求項3に記載の方法。
  5. 前記重みづけパラメータとして前記複数の一致情報の各々が属する前記それぞれのカテゴリに関連する前記ユーザのレスポンスの合計量を用いるステップは、さらに、
    一致情報の各カテゴリの前記ユーザのレスポンスの合計量の間の比率を算出するステップと、
    この比率に基づいて一致情報の各カテゴリの前記重みづけ係数を取得するステップと
    を含むことを特徴とする請求項4に記載の方法。
  6. 前記重みづけパラメータとして前記複数の一致情報の各々が属する前記それぞれのカテゴリに関連する前記ユーザのレスポンスの合計量を用いるステップは、さらに、
    ある順序で一致情報の各カテゴリの前記ユーザのレスポンスの合計量を配置するステップと、
    前記順序の結果に基づいて一致情報の各カテゴリの前記重みづけ係数を取得するステップと
    を含むことを特徴とする請求項4に記載の方法。
  7. 前記複数の一致情報の各々が属する前記それぞれのカテゴリに関連する前記ユーザのレスポンスの合計量に基づいて前記複数の一致情報のランクづけをするステップの後に、前記方法は、さらに、
    前記複数の一致情報の各々の前記ユーザのレスポンスの量に基づいて各カテゴリ内の一致情報をランクづけするステップ
    を含むことを特徴とする請求項4に記載の方法。
  8. 前記検索要求は、ウェブページのための検索要求または電子商取引に関連する検索要求を含むことを特徴とする請求項1に記載の方法。
  9. 前記検索要求がウェブページのための前記検索要求である場合、前記ユーザのレスポンスの量は、ウェブページリンクのクリック回数、ブックマークを付けられたウェブページリンクの件数、またはそれらの組み合わせ
    を含むことを特徴とする請求項8に記載の方法。
  10. 前記検索要求が前記電子商取引に関連する検索要求である場合、前記ユーザのレスポンスの量は、製品の販売量、前記製品の総取引量、前記製品が問い合わせられた回数、前記製品の情報がブックマークを付けられた件数、またはそれらの組み合わせを含むことを特徴とする請求項8に記載の方法。
  11. 検索要求を受信し、検索によって、前記検索要求に一致する複数の一致情報を取得する情報検索ユニットと、
    複数の一致情報の各々に関連するユーザのレスポンスのそれぞれの量を取得し、さらに、前記複数の一致情報の各々が属するそれぞれのカテゴリに関連するユーザのレスポンスの合計量を取得するユーザレスポンス演算ユニットと、
    前記複数の一致情報が属する前記それぞれのカテゴリに関連する前記ユーザのレスポンスの合計量に基づいて検索結果を生成するために前記複数の情報をランクづけする結果生成ユニットと
    を備えることを特徴とする情報検索システム。
  12. 前記ユーザのレスポンスの合計量は、前記カテゴリの下の一致情報のユーザのレスポンスの和であることを特徴とする請求項11に記載のシステム。
  13. 前記ユーザレスポンス演算ユニットは、ある期間内のユーザレスポンスログを読み出すことにより、前記それぞれの一致情報の前記ユーザのレスポンスの量をさらに取得することを特徴とする請求項11に記載のシステム。
  14. 前記結果生成ユニットは、
    重みづけパラメータとして前記様々な一致情報の各々が属する前記それぞれのカテゴリに関連する前記ユーザのレスポンスの合計量を用いることにより前記複数の一致情報のためのランキングスコアを演算するランキングスコア演算サブユニットであって、第1の一致情報が属するカテゴリに関連するユーザのレスポンスの合計量が、第2の一致情報が属するカテゴリに関連するユーザのレスポンスの合計量より大きい場合、前記第1の一致情報の重みづけ係数の値は、前記第2の一致情報の重みづけ係数の値より大きい前記ランキングスコア演算サブユニットと、
    前記複数の一致情報のランキングスコアに基づいて前記検索結果を生成する結果生成サブユニットと
    を備えることを特徴とする請求項11に記載のシステム。
  15. 前記ランキングスコア演算ユニットは、
    前記複数の一致情報の各々が属する前記それぞれのカテゴリに関連する前記ユーザのレスポンスの合計量に基づいて、前記複数の一致情報の各々が属する前記各カテゴリのための重みづけ係数を取得する第1の重みづけ係数演算モジュールと、
    前記複数の一致情報の前記ランキングスコアを取得するために前記第1の重みづけ係数演算モジュールの計算結果を含む重みづけ係数の重み平均処理を実行する重み平均モジュールと
    を備えることを特徴とする請求項14に記載のシステム。
  16. 前記第1の重みづけ係数演算モジュールは、前記一致情報の各カテゴリの前記ユーザのレスポンスの合計量の間の比率を算出し、この比率に基づいて、前記一致情報の各カテゴリの前記重みづけ係数を取得することを特徴とする請求項15に記載のシステム。
  17. 前記第1の重みづけ係数演算モジュールは、ある順序で前記一致情報の各カテゴリの前記ユーザのレスポンスの合計量を配置し、前記順序結果に基づいて前記一致情報の各カテゴリの前記重みづけ係数を取得することを特徴とする請求項15に記載のシステム。
  18. 前記結果生成ユニットは、
    前記様々な一致情報の各々が属する前記それぞれのカテゴリに関連する前記ユーザのレスポンスの合計量に基づいて前記複数の一致情報をランクづけする第1のランクづけサブユニットと、
    それぞれの複数の一致情報の前記ユーザのレスポンスの量に基づいて各カテゴリ内の一致情報をランクづけする第2のランクづけサブユニットと
    を含むことを特徴とする請求項11に記載のシステム。
JP2012510843A 2009-05-12 2010-04-29 検索結果を生成する方法および情報検索のためのシステム Active JP5540080B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN200910135277.4 2009-05-12
CN200910135277.4A CN101887437B (zh) 2009-05-12 2009-05-12 一种搜索结果生成方法及信息搜索***
PCT/US2010/033010 WO2010132212A1 (en) 2009-05-12 2010-04-29 Method for generating search result and system for information search

Publications (2)

Publication Number Publication Date
JP2012527038A JP2012527038A (ja) 2012-11-01
JP5540080B2 true JP5540080B2 (ja) 2014-07-02

Family

ID=43073363

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012510843A Active JP5540080B2 (ja) 2009-05-12 2010-04-29 検索結果を生成する方法および情報検索のためのシステム

Country Status (6)

Country Link
US (2) US8849822B2 (ja)
EP (1) EP2430519A4 (ja)
JP (1) JP5540080B2 (ja)
CN (1) CN101887437B (ja)
HK (1) HK1148369A1 (ja)
WO (1) WO2010132212A1 (ja)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542474B (zh) * 2010-12-07 2015-10-21 阿里巴巴集团控股有限公司 查询结果排序方法及装置
CN102073699B (zh) * 2010-12-20 2016-03-02 百度在线网络技术(北京)有限公司 用于基于用户行为来改善搜索结果的方法、装置和设备
US9384278B2 (en) * 2011-04-07 2016-07-05 Ebay Inc. Methods and systems for assessing excessive accessory listings in search results
CN102779136A (zh) * 2011-05-13 2012-11-14 北京搜狗科技发展有限公司 一种信息搜索的方法和装置
CN102799591B (zh) * 2011-05-26 2015-03-04 阿里巴巴集团控股有限公司 一种提供推荐词的方法及装置
CN102831526A (zh) * 2011-06-17 2012-12-19 苏州工业园区辰烁软件科技有限公司 一种针对在线交易应用的商品搜索排序的方法和***
US9262513B2 (en) 2011-06-24 2016-02-16 Alibaba Group Holding Limited Search method and apparatus
CN102841904B (zh) * 2011-06-24 2016-05-04 阿里巴巴集团控股有限公司 一种搜索方法及设备
CN102866992B (zh) * 2011-07-04 2015-12-02 阿里巴巴集团控股有限公司 一种在网页中显示产品信息的方法及装置
CN102956009B (zh) 2011-08-16 2017-03-01 阿里巴巴集团控股有限公司 一种基于用户行为的电子商务信息推荐方法与装置
CN102968418A (zh) * 2011-09-01 2013-03-13 阿里巴巴集团控股有限公司 网站信息检索方法和***
CN103034660B (zh) * 2011-10-10 2016-09-28 阿里巴巴集团控股有限公司 信息提供方法、装置及***
CN102364475A (zh) * 2011-11-24 2012-02-29 迈普通信技术股份有限公司 基于身份识别对检索结果排序的***及方法
CN103164804B (zh) 2011-12-16 2016-11-23 阿里巴巴集团控股有限公司 一种个性化的信息推送方法及装置
CN103365870B (zh) * 2012-03-29 2017-12-01 腾讯科技(深圳)有限公司 搜索结果排序的方法和***
CN103365904B (zh) * 2012-04-05 2018-01-09 阿里巴巴集团控股有限公司 一种广告信息搜索方法和***
CN107066509B (zh) * 2012-04-26 2020-12-04 阿里巴巴集团控股有限公司 信息提供方法、处理服务器及合并服务器
US9141707B2 (en) 2012-07-19 2015-09-22 Facebook, Inc. Context-based object retrieval in a social networking system
CN103729365A (zh) * 2012-10-12 2014-04-16 阿里巴巴集团控股有限公司 一种搜索方法和***
CN103093003A (zh) * 2012-10-27 2013-05-08 长沙九窝网络科技有限公司 基于互助推广功能的搜索结果排序***及方法
US9430561B2 (en) * 2012-12-19 2016-08-30 Facebook, Inc. Formation of topic profiles for prediction of topic interest groups
CN103970743B (zh) * 2013-01-24 2017-10-31 北京百度网讯科技有限公司 一种在搜索中的个性化信息推荐方法、***及搜索引擎
CN103366003B (zh) * 2013-07-19 2017-03-08 百度在线网络技术(北京)有限公司 基于用户反馈优化搜索结果的方法和设备
CN103473125B (zh) * 2013-09-04 2017-02-15 五八同城信息技术有限公司 用户选项优化方法及装置
US9996588B2 (en) 2013-12-09 2018-06-12 International Business Machines Corporation Managing a search
CN104731809B (zh) * 2013-12-23 2018-10-02 阿里巴巴集团控股有限公司 对象的属性信息的处理方法及装置
CN103678663B (zh) * 2013-12-24 2018-02-27 北京奇虎科技有限公司 网页搜索方法及客户端
CN104794135B (zh) * 2014-01-21 2018-06-29 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法和装置
JP5620604B1 (ja) * 2014-05-12 2014-11-05 株式会社ワイワイワイネット ネット上での検索結果のランキングシステム
CN105224547A (zh) * 2014-06-05 2016-01-06 阿里巴巴集团控股有限公司 对象集合及其满意度的处理方法及装置
CN105224567B (zh) * 2014-06-26 2020-08-14 腾讯科技(深圳)有限公司 一种关键字的搜索方法及装置
CN105335423B (zh) * 2014-08-06 2020-02-07 阿里巴巴集团控股有限公司 一种网页的用户反馈的收集处理方法及装置
CN105740255B (zh) * 2014-12-09 2019-07-05 深圳市腾讯计算机***有限公司 网络搜索方法及装置
CN104516980B (zh) * 2014-12-26 2018-08-03 携程计算机技术(上海)有限公司 搜索结果的输出方法以及服务器***
US10339165B2 (en) * 2015-02-27 2019-07-02 Walmart Apollo, Llc System, method, and non-transitory computer-readable storage media for generating synonyms of a search query
CN105989156B (zh) * 2015-03-03 2019-12-17 阿里巴巴集团控股有限公司 一种用于提供搜索结果的方法、设备及***
CN104731901B (zh) * 2015-03-19 2019-03-19 天脉聚源(北京)传媒科技有限公司 一种采集视频的方法及装置
CN105183900B (zh) * 2015-09-30 2019-05-21 北京奇虎科技有限公司 一种网络搜索结果处理方法、***、客户端及网络服务器
CN105260432A (zh) * 2015-09-30 2016-01-20 北京奇虎科技有限公司 一种网络搜索结果筛选方法及电子设备
CN105354225B (zh) * 2015-09-30 2019-05-31 北京奇虎科技有限公司 一种网络搜索结果推荐方法及电子设备
CN105224959B (zh) * 2015-11-02 2019-03-26 北京奇艺世纪科技有限公司 排序模型的训练方法和装置
CN105808649B (zh) * 2016-02-27 2019-06-04 腾讯科技(深圳)有限公司 一种搜索结果排序方法及其设备
CN106055688B (zh) * 2016-06-07 2020-01-14 北京金山安全软件有限公司 搜索结果的展现方法、装置和移动终端
JP6761710B2 (ja) * 2016-09-08 2020-09-30 ヤフー株式会社 決定装置、決定方法、及び決定プログラム
US20180131667A1 (en) * 2016-11-10 2018-05-10 Danal Inc. Systems and methods to verify ownership of a telephone number and to track ownership reassignments
CN107093094A (zh) * 2016-11-25 2017-08-25 口碑控股有限公司 一种评价信息的发布方法及装置
CN107908662B (zh) * 2017-10-18 2020-11-03 北京京东尚科信息技术有限公司 搜索***的实现方法和实现装置
CN108920484B (zh) * 2018-04-28 2022-06-10 广州市百果园网络科技有限公司 搜索内容处理方法、装置及存储设备、计算机设备
CN108804674B (zh) * 2018-06-11 2022-03-11 北京五八信息技术有限公司 一种帖子排序方法、装置、设备及计算机可读存储介质
CN109088814B (zh) * 2018-07-20 2020-11-17 维沃移动通信有限公司 一种移动终端的数据处理方法及移动终端
CN111488513A (zh) * 2019-01-29 2020-08-04 百度在线网络技术(北京)有限公司 用于生成页面的方法和装置
US11328238B2 (en) * 2019-04-01 2022-05-10 Microsoft Technology Licensing, Llc Preemptively surfacing relevant content within email
TWI753267B (zh) * 2019-06-14 2022-01-21 劉國良 消費推薦資訊與採購決策的優化系統及其實施方法
CN112100482A (zh) * 2020-07-31 2020-12-18 咪咕文化科技有限公司 搜索结果排序方法、装置、电子设备及存储介质
CN114254179B (zh) * 2020-09-23 2024-07-30 北京达佳互联信息技术有限公司 搜索请求的处理方法、装置及搜索平台

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ506229A (en) 1998-03-03 2003-02-28 Amazon Identifying the items most relevant to a current query based on items selected in connection with similar queries
US6963867B2 (en) * 1999-12-08 2005-11-08 A9.Com, Inc. Search query processing to provide category-ranked presentation of search results
US20020062258A1 (en) 2000-05-18 2002-05-23 Bailey Steven C. Computer-implemented procurement of items using parametric searching
US7146416B1 (en) * 2000-09-01 2006-12-05 Yahoo! Inc. Web site activity monitoring system with tracking by categories and terms
JP2002183210A (ja) 2000-12-14 2002-06-28 Nippon Telegraph & Telephone East Corp 検索サーバにおけるコンテンツ検索方法およびそのプログラムが記録されたコンピュータ読み取り可能な記録媒体
JP2002207764A (ja) * 2001-01-09 2002-07-26 Kentop:Kk 商品情報配信システム
US7003503B2 (en) * 2001-06-07 2006-02-21 Idealswork Inc. Ranking items
CA2489236C (en) 2002-06-12 2014-01-14 Jena Jordahl Data storage, retrieval, manipulation and display tools enabling multiple hierarchical points of view
JP2004206517A (ja) * 2002-12-26 2004-07-22 Nifty Corp ホットキーワード提示方法及びホットサイト提示方法
CN101247524B (zh) 2003-02-21 2011-05-04 松下电器产业株式会社 图像编码方法
US7523095B2 (en) * 2003-04-29 2009-04-21 International Business Machines Corporation System and method for generating refinement categories for a set of search results
JP2005099964A (ja) * 2003-09-24 2005-04-14 Ricoh Co Ltd 検索分類システム、検索分類サーバ、プログラムおよび記録媒体
US7346839B2 (en) * 2003-09-30 2008-03-18 Google Inc. Information retrieval based on historical data
US7447678B2 (en) 2003-12-31 2008-11-04 Google Inc. Interface for a universal search engine
CN1993697A (zh) * 2004-06-18 2007-07-04 皮克托兴克公司 网络内容组织工具
US8090736B1 (en) * 2004-12-30 2012-01-03 Google Inc. Enhancing search results using conceptual document relationships
US8019749B2 (en) * 2005-03-17 2011-09-13 Roy Leban System, method, and user interface for organizing and searching information
US7529736B2 (en) * 2005-05-06 2009-05-05 Microsoft Corporation Performant relevance improvements in search query results
US20070094242A1 (en) 2005-10-26 2007-04-26 John Dove System and method for returning search results
CN101017482A (zh) * 2006-02-07 2007-08-15 久大资讯网路股份有限公司 网页搜寻结果的表列最佳化方法及使用该方法的***
US7664744B2 (en) 2006-07-14 2010-02-16 Yahoo! Inc. Query categorizer
CN1996316A (zh) * 2007-01-09 2007-07-11 天津大学 基于网页相关性的搜索引擎搜索方法
US7966309B2 (en) 2007-01-17 2011-06-21 Google Inc. Providing relevance-ordered categories of information
US20080183554A1 (en) * 2007-01-29 2008-07-31 W.W. Grainger, Inc. System and method for providing customized catalogs
CN101281519B (zh) * 2007-04-02 2015-04-01 北京奇虎科技有限公司 一种评价网络资源价值的方法及其在搜索引擎领域的应用
CN100507918C (zh) * 2007-04-20 2009-07-01 清华大学 一种网络关键资源页面的自动定位方法
JP5032206B2 (ja) * 2007-05-30 2012-09-26 パイオニア株式会社 情報提供サーバ、ナビゲーション装置、情報提供システム、情報提供方法、情報処理方法、情報表示方法、情報提供プログラム、情報処理プログラム、情報表示プログラムおよび記録媒体
US20090037239A1 (en) * 2007-08-02 2009-02-05 Daniel Wong Method For Improving Internet Advertising Click-Through Rates through Time-Dependent Keywords
KR100930455B1 (ko) * 2007-09-06 2009-12-08 엔에이치엔(주) 쿼리별 검색 컬렉션 생성 방법 및 시스템
JP2009080624A (ja) * 2007-09-26 2009-04-16 Toshiba Corp 情報表示装置、方法及びプログラム
US20090106221A1 (en) 2007-10-18 2009-04-23 Microsoft Corporation Ranking and Providing Search Results Based In Part On A Number Of Click-Through Features
US8862608B2 (en) * 2007-11-13 2014-10-14 Wal-Mart Stores, Inc. Information retrieval using category as a consideration
US20090164266A1 (en) * 2007-12-21 2009-06-25 Microsoft Corporation Category aggregated opinion data
CN101266620B (zh) * 2008-04-07 2021-04-16 北京大学 向用户提供目标信息的方法及设备
US8010537B2 (en) * 2008-08-27 2011-08-30 Yahoo! Inc. System and method for assisting search requests with vertical suggestions
US8001131B2 (en) * 2008-12-17 2011-08-16 Demand Media Inc. Method and system for ranking of keywords for profitability

Also Published As

Publication number Publication date
CN101887437B (zh) 2016-03-30
CN101887437A (zh) 2010-11-17
US20150006525A1 (en) 2015-01-01
US8849822B2 (en) 2014-09-30
EP2430519A1 (en) 2012-03-21
US9672290B2 (en) 2017-06-06
US20120047148A1 (en) 2012-02-23
EP2430519A4 (en) 2012-12-05
JP2012527038A (ja) 2012-11-01
WO2010132212A1 (en) 2010-11-18
HK1148369A1 (zh) 2011-09-02

Similar Documents

Publication Publication Date Title
JP5540080B2 (ja) 検索結果を生成する方法および情報検索のためのシステム
US9009146B1 (en) Ranking search results based on similar queries
JP5662961B2 (ja) レビュー処理方法およびシステム
US7966337B2 (en) System and method for prioritizing websites during a webcrawling process
US7574426B1 (en) Efficiently identifying the items most relevant to a current query based on items selected in connection with similar queries
US8583633B2 (en) Using reputation measures to improve search relevance
US8645393B1 (en) Ranking clusters and resources in a cluster
TWI615723B (zh) 網路搜尋方法及設備
US20160078132A1 (en) Search suggestion and display environment
CN105917364B (zh) 对问答论坛中讨论话题的排名
Sugiyama et al. Refinement of TF-IDF schemes for web pages using their hyperlinked neighboring pages
CN103345517B (zh) 模拟tf-idf相似性计算的协同过滤推荐算法
US8819004B1 (en) Ranking image search results using hover data
US20160357857A1 (en) Apparatus, system and method for string disambiguation and entity ranking
Bota et al. Composite retrieval of heterogeneous web search
Wu et al. Keyword extraction for contextual advertisement
TW201426357A (zh) 搜索資料排序的方法和裝置,資料搜索的方法和裝置
Jiang et al. A unified neural network approach to e-commerce relevance learning
US8645394B1 (en) Ranking clusters and resources in a cluster
Vidal et al. Selecting keywords to represent web pages using wikipedia information
TWI476611B (zh) Search results generation method and information search system
US11086961B2 (en) Visual leaf page identification and processing
US20110231387A1 (en) Engaging content provision
JP5903370B2 (ja) 情報検索装置、情報検索方法、及びプログラム
Rathod et al. A personalized mobile search engine based on user preference

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130402

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140401

R150 Certificate of patent or registration of utility model

Ref document number: 5540080

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140501

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250