JP4750832B2 - 情報検索方法およびそのシステム - Google Patents

情報検索方法およびそのシステム Download PDF

Info

Publication number
JP4750832B2
JP4750832B2 JP2008205234A JP2008205234A JP4750832B2 JP 4750832 B2 JP4750832 B2 JP 4750832B2 JP 2008205234 A JP2008205234 A JP 2008205234A JP 2008205234 A JP2008205234 A JP 2008205234A JP 4750832 B2 JP4750832 B2 JP 4750832B2
Authority
JP
Japan
Prior art keywords
information
question
category
user
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008205234A
Other languages
English (en)
Other versions
JP2009043264A (ja
Inventor
知 勳 崔
光 鉉 金
相 浩 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naver Corp
Original Assignee
Naver Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naver Corp filed Critical Naver Corp
Publication of JP2009043264A publication Critical patent/JP2009043264A/ja
Application granted granted Critical
Publication of JP4750832B2 publication Critical patent/JP4750832B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報検索方法およびそのシステムに関し、より詳細には、ユーザの質問の意図に適合した情報を検索する情報検索方法及び情報検索システムに関する。
一般的に、情報検索方法は、ユーザが入力したクエリを分析し、分析されたクエリに対応する検索結果を人気度順によって整列して提供する。
例えば、ユーザが「ドラム」をクエリとして入力して楽器のドラムと関連した情報を検索しようとする場合に、従来の情報検索方法は、他のユーザによって「ドラム」に対応する検索結果として「ドラム洗濯機」の人気度が高ければ、ユーザが検索しようとする楽器のドラムよりもドラム洗濯機を優先的に検索結果として提供されてしまい、ユーザが所望する検索結果を優先的に提供できないという問題点がある。
一例として、ユーザによって入力された質問が「ジーンズ」である場合に、従来の情報検索方法は、男性用ジーンズまたは女性用ジーンズのうちで人気がある商品のみを検索するので、女性のユーザが男性用ジーンズを所望する場合において、女性ジーンズのうちの人気のある商品のみを検索結果として提供するようになれば、ユーザが所望する情報を適切に検索して提供できないという結果を招来してしまうことになる。
また、一例として、ユーザによって入力された質問が「プーマ」である場合に、従来の情報検索方法は、アビューズ(abuse)行為によって「ナイキ/アディダス/ポロ/ビーンポール」などが含まれる検索結果が上位に露出するようになれば、実際にユーザが所望するプーマに対する検索結果を正確に提供できないという問題点がある。
したがって、ユーザの質問の意図を把握し、より正確にユーザが所望する情報検索結果を提供することができる方案が切に求められている。
本発明は、上記した問題点を解決するために案出されたものであって、ユーザの質問の意図に適合した情報を検索する情報検索方法及びそのシステムを提供することを目的とする。
また、本発明は、アビューズを除去し、ユーザが所望するより正確な情報検索結果を提供する情報検索方法及びそのシステムを提供することを他の目的とする。
また、本発明は、情報検索時の手作業検索結果を改善することができる情報検索方法及びそのシステムを提供することを他の目的とする。
また、本発明は、商品販売度を検索ランキングに反映することができる情報検索方法及びそのシステムを提供することを他の目的とする。
さらに、本発明は、商品の発売日を検索ランキングに反映することができる情報検索方法及びそのシステムを提供することをさらに他の目的とする。
本発明の一実施形態に係る情報検索方法は、複数の質問に対する類型を分析するステップと、前記分析された類型に応じて質問を分類するステップと、前記分類された質問を用いて情報を索引するステップと、前記索引結果を用いてユーザから入力された質問に対応する情報を検索するステップとを含み、前記質問に対する類型は、カテゴリ、ブランド、モデル名、または同義語の質問を含む。
本発明の一実施形態に係る情報検索システムは、複数の質問に対する類型を分析する分析部と、前記分析された類型に応じて質問を分類する分類部と、前記分類された質問を用いて情報を索引する索引部と、前記索引結果を用いてユーザから入力された質問に対応する情報を検索する検索部とを備え、前記質問に対する類型は、カテゴリ、ブランド、モデル名、または同義語の質問を含む。
本発明によれば、ユーザの質問の意図に適合した情報を検索する情報検索方法及びそのシステムを提供することができる効果がある。
また、本発明によれば、アビューズを除去し、ユーザが所望するより正確な情報検索結果を提供する情報検索方法及びそのシステムを提供することができる効果がある。
また、本発明によれば、情報検索時の手作業検索結果を改善することができる情報検索方法及びそのシステムを提供することができる効果がある。
また、本発明によれば、商品販売度を検索ランキングに反映することができる情報検索方法及びそのシステムを提供することができる効果がある。
さらに、本発明によれば、商品の販売日を検索ランキングに反映することができる情報検索方法及びそのシステムを提供することができる効果がある。
以下、添付の図面を参照しながら、本発明に係る情報検索方法及びそのシステムについて詳細に説明する。
図1は、本発明に係る情報検索システムとユーザ端末機との連動関係を示す図である。
図1を参照すれば、ユーザ端末機110は、ユーザから検索しようとする質問(query)の入力を受け付けると、入力された質問を情報検索システム120に送信する。なお、ユーザ端末機110と情報検索システム120とは、有線/無線の通信網で接続され、例えば、インターネット等を介して通信することができる。
情報検索システム120は、データベースに格納された複数の質問に対する類型を分析する。質問に対する類型は、カテゴリ、ブランド、モデル名、または同義語の質問を含むことができる。すなわち、情報検索システム120は、フィードバック情報を用いて質問の意図を分析し、質問の意図に対する分析結果に応じて質問が最も多くクリックされた情報が存在するカテゴリをランキングすることで、質問に対する類型を分析することができる。フィードバック情報は、質問に対するクリック頻度などを含むことができる。
情報検索システム120は、分析された類型に応じて、情報に対するカテゴリにおいて該カテゴリに含まれる上位カテゴリ名と下位カテゴリ名との間でカテゴリ名が重複する場合に、重複したカテゴリ名を除去することができる。また、情報検索システム120は、分析された類型に応じて、情報に対するカテゴリに決められたキーワードが含まれる場合に、決められたカテゴリを除外したキーワードが含まれるカテゴリを除去することができる。さらに、情報検索システム120は、分析された類型に応じて、フィードバック情報が閾値以下のクリック頻度を有する場合に、フィードバック情報を除去することができる。
情報検索システム120は、質問の意図に対する分析結果に応じて、カテゴリ、ブランド、製造社、モデル名、キーワード、またはフィードバック情報に対するセクション加重値を適用し、セクション加重値が最も高いセクションを用いて情報をランキングすることができる。セクション加重値とは、カテゴリ、ブランド、製造社、モデル名、キーワード、またはフィードバック情報の各セクション別に重要度に応じて付与された加重値である。一例として、情報検索システム120は、質問の意図に対する分析結果に応じてセクション加重値を適用した後、セクション加重値が最も高いセクションがカテゴリである場合に、カテゴリに対する情報をランキングすることができる。また、情報検索システム120は、質問に対する累積したクリック頻度数、アビューズ読み取り指数、または各商品に対する販売指数を反映して質問に対する類型を分析することができる。一例として、アビューズ読み取り指数とは、商品名の人気度を高めるために故意的に商品名が質問として入力されたものとして読み取られた数値によって生成された指数であり、販売指数とは、各商品の販売数値によって生成された指数である。さらに、情報検索システム120は、アビューズ読み取り指数が基準値以下である場合に、累積したクリック頻度数、アビューズ読み取り指数、および販売指数に対してペナルティを適用して質問に対する類型を分析することができる。
情報検索システム120は、分析された類型に応じて質問を分類し、分類された質問を用いて情報を索引(Indexing)する。情報検索システム120は、同義語辞書を用いて質問に対する同義語を追加して質問に対して検索される情報の範囲を拡張することができる。
情報検索システム120は、索引結果を用いて、ユーザから入力された質問に対応される情報を検索する。また、情報検索システム120は、検索された情報をユーザ端末機110に提供する。
図2は、本発明の一実施形態に係る情報検索システムの構成を示す図である。
図2を参照すれば、情報検索システム120は、情報データベース210と、分析部220と、分類部230と、索引部240と、索引データベース250と、検索部260とを備える。
情報データベース210は、ユーザによって入力された複数の質問および質問に応じて提供される各種情報を記録して保持する。
分析部220は、複数の質問に対する類型を分析する。すなわち、分析部220は、情報データベース210に記録された複数の質問に対する類型を分析することができる。質問に対する類型は、カテゴリ、ブランド、モデル名、または同義語の質問を含むことができる。
分析部220は、フィードバック情報を用いて質問の意図を分析する。例えば、質問の意図に対する分析として、ユーザが入力した質問に対して最も多くクリックされた情報が存在するカテゴリをランキングして情報を分析することができる。フィードバック情報は、情報をクリックしたユーザ質問の集合であって、ユーザの検索意図を把握することができる手段であり、情報がクリックされるときに用いられた質問および質問を用いたユーザによって情報がクリックされた回数を示すクリック頻度を含む。
図5は、フィードバック情報の一例を示す図である。
図5を参照すれば、商品情報510は、ユーザから入力された質問に対する検索結果のうちでユーザによってクリックされたショッピング商品情報であり、アディダスジャージトレーニングウェアWarm Set(黒/白)を示している。フィードバック情報520は、商品情報510をクリックしたユーザ質問の集合であって、ユーザによって商品情報510がクリックされた回数を示すクリック頻度および商品情報510をクリックするときにユーザによって入力された質問を含む。図5を一例として説明すると、フィードバック情報520は、質問が「トレーニングウェア」である場合において商品情報510のクリック頻度が412であり、質問が「アディダス」である場合において商品情報510のクリック頻度が259であり、質問が「アディダストレーニングウェア」である場合において商品情報510のクリック頻度が196であり、質問が「運動服」である場合において商品情報510のクリック頻度が「182」であり、質問が「adidas運動服」である場合において商品情報510のクリック頻度が160である。
このように分析部220は、図5に示すようなフィードバック情報を用いて質問の意図を分析し、質問の意図に対する分析結果に応じて、例えば、質問が「トレーニングウェア」である場合において商品情報510を含む複数の商品情報の各クリック頻度を分析し、質問「トレーニングウェア」に対してユーザが最も多くクリックした情報(商品情報)が存在するカテゴリをランキングすることができる。すなわち、商品情報は、複数のカテゴリに区分され、例えば、カテゴリ別に付与されるカテゴリIDと関連付けて商品情報を格納することができる。
また、分析部220は、質問の意図に対する分析結果に応じて、カテゴリ、ブランド、製造社、モデル名、キーワード、またはフィードバック情報に対するセクション加重値を適用し、セクション加重値が最も高いセクションを用いて情報をランキングすることができる。
図3は、分析部の具体的な構成の一例を示す図である。
図3を参照すれば、分析部220は、カテゴリ整除部310と、フィードバック情報整除部320と、人気度適用部330とを備える。
カテゴリ整除部310は、分析された類型に応じて、情報に対するカテゴリにおける上位カテゴリ名と下位カテゴリ名との間でカテゴリ名が重複する場合に、重複したカテゴリ名を除去してカテゴリを整除(整理)する。すなわち、カテゴリ整除部310は、カテゴリに多くの分類カテゴリ名を含む場合に、下位カテゴリ名に対して上位カテゴリ名が重複すれば、重複した上位カテゴリ名を除去してカテゴリを整除することができる。
図6は、カテゴリを整除した一例を示す図である。
図6を参照すれば、一例として、第1カテゴリ610を整除(重複を排除)する場合に、カテゴリ整除部310は、「ノート型パソコン/デスクトップ/モニタ>ノート型パソコン>LG電子」のように、上位カテゴリ名「ノート型パソコン/デスクトップ/モニタ」と下位カテゴリ名「ノート型パソコン」との間でカテゴリ名「ノート型パソコン」が重複する場合、重複した上位カテゴリ名である「ノート型パソコン/デスクトップ/モニタ」を除去することができる。
一例として、第2カテゴリ620を整除する場合に、カテゴリ整除部310は、「デジカメ/カムコーダ>デジタルカメラ>キヤノン」のように、上位カテゴリ名である「デジカメ/カムコーダ」と下位カテゴリ名である「デジタルカメラ」との間において、「デジカメ」と「デジタルカメラ」とを同義語として判別することができ、実質的に重複しているカテゴリ名として、重複した上位カテゴリ名である「デジカメ/カムコーダ」を除去することができる。すなわち、カテゴリ整除部310は、整除処理を遂行する際に、完全一致するカテゴリ名に対して整除処理を遂行するとともに、下位カテゴリ名に対する同義語を不図示の同義語辞書データベース等から取得し、下位カテゴリ名と同義の上位カテゴリ名を除去する整除処理を遂行することができる。
また、一例として、第3カテゴリ630を整除する場合に、カテゴリ整除部310は、「おむつ/衛生用品>パンツ型>ハギス」のように、下位カテゴリ名に上位カテゴリ名が存在しないため、カテゴリ名を除去せずに「おむつ/衛生用品>パンツ型>ハギス」をそのまま用いることができる。つまり、下位カテゴリ名が上位カテゴリ名に含まれていない、又は下位カテゴリ名と同義のカテゴリ名が上位カテゴリ名に含まれていない場合、カテゴリに対して上位カテゴリ名を除去する処理を遂行しない。
また、カテゴリ整除部310は、カテゴリに衆意的な意味を有するキーワードが含まれる場合には特定の意味を択一し、特定の意味のキーワードが含まれるカテゴリを除いた残りのすべてのカテゴリにて衆意的な意味を有するキーワードを除去することができる。一例として、カテゴリに「かき(柿)」というキーワード(カテゴリ名)が含まれる場合に、当該カテゴリが果物である「かき(柿)」に対するカテゴリであれば(当該カテゴリが果物の属性を有するカテゴリであれば)保持し、カテゴリが果物である「かき(柿)」に対するカテゴリを除外した他のすべてのカテゴリにおけるカテゴリ名から、例えば「かき(柿)」と発音は同じであるが意味が異なる同音異義語の「かき(牡蠣)」を除去することができる。
フィードバック情報整除部320は、分析された類型に応じて、フィードバック情報が閾値以下のクリック頻度を有する場合に、フィードバック情報を除去してフィードバック情報を整除する。すなわち、フィードバック情報整除部320は、情報別に累積したフィードバック情報を整除するために所定のクリック頻度閾値を定義し、閾値以下のクリック頻度を有するフィードバック情報を除去することで、フィードバック情報を整除することができる。クリック頻度閾値は、フィードバック情報内のクリック頻度値、好ましくは最大クリック頻度値を参照して決定することができる。
図7は、フィードバック情報を整除した一例を示す図である。
図7を参照すれば、フィードバック情報710において、最大クリック頻度を参照して、クリック頻度閾値を一例として「40」に決めることができる。フィードバック情報整除部320は、フィードバック情報710において、クリック頻度閾値である「40」よりも小さいクリック頻度が「25」である質問「イ・ヒョリフォン」とクリック頻度が「10」である質問「Sch−S470」を除去することができる。つまり、図5の例において、質問と商品情報510との間のフィードバック情報520、すなわち、各質問が入力された際に商品情報510がクリックされる頻度(言い換えれば、質問が入力された場合に、当該質問と関連してユーザが参照する商品情報の参照数)のうち、所定のクリック頻度に満たない質問は、当該商品情報510との間の関連性が低いと判断し、累積されたフィードバック情報520に含まれないようにすることができる(除外することができる)。
人気度適用部330は、質問の意図に対する分析結果に応じて、累積したクリック頻度数、アビューズ読み取り指数、または各商品に対する販売指数を人気度に適用する。人気度とは、質問に対する入力回数、質問に対するクリック回数、質問に対するアビューズ読み取り指数、または質問を用いた各商品に対する販売指数などのような多様な情報を分析した結果に応じて、この質問がユーザにどれ程多くの人気があるのかを判断することができる基準である。すなわち、人気度適用部330は、累積したクリック頻度数をログ(log)正規化し、形態素分析を介した商品名のアビューズ判断指数を正規化し、商品の販売指数リストで最大値を用いて人気度に適用することができる。このとき、人気度適用部330は、情報生成期間(Maxage)が6ヶ月以内である最新のスコアを人気度に反映することができる。さらに、人気度適用部330は、アビューズ読み取り指数が基準値以下である場合に、累積したクリック頻度数、アビューズ読み取り指数、および販売指数に対してペナルティを人気度に適用することができる。一例として、アビューズ読み取り指数が基準値以下である場合に、人気度適用部330は、累積したクリック頻度数、アビューズ読み取り指数、販売指数、およびフィードバック情報に対するクリック頻度を減少させることで、ペナルティを人気度に適用することができる。
分析部220は、分析された質問の意図、人気度、および類似度を結合して検索ランキングを定義することができる。一例として、分析部220は、製品名(モデル名)、カテゴリ名、ブランド名、フィードバック情報のクリック頻度を用いた類似度を定義することができる。
分類部230は、分析された類型に応じて質問を分類する。
図4は、分類部に対する構成の一例を示す図である。
図4を参照すれば、分類部230は、質問拡張部410と、質問分類部420とを備える。質問拡張部410は、同義語辞書を用いて質問に対する同義語を追加して質問を拡張する。すなわち、質問拡張部410は、同義語辞書を用いてORMAX演算を適用して質問を拡張する。拡張された質問は1つの概念であり、質問数が1つである。さらに、質問拡張部410は、ポスティング(Posting)をマージ(merge)するときに、加重値を合わせて類似度を生成するのではなくて最大値を用い、加重値を正規化する過程でも質問の数を分けない。一例として、質問が「携帯電話」である場合に、質問拡張部410は、同義語辞書を用いて「携帯電話、携帯フォン、最新フォン、携帯」などに質問を拡張することができる。
質問分類部420は、拡張された質問を分類する。一例として、質問分類部420は、同義語辞典を用いて質問に対する同義語を追加して質問を拡張した後、分析された類型に応じて拡張された質問を分類することができる。
索引部240は、分類された質問を用いて情報を索引する。
索引データベース250は、索引結果を記録して保持する。索引結果は、質問および質問に対応する情報である。
検索部260は、索引結果を用いてユーザから入力された質問に対応する情報を検索する。すなわち、検索部260は、索引データベース250を参照して、ユーザから入力された質問に対応する情報を検索することができる。
このように、本発明に係る情報検索システムは、ユーザの質問の意図に適合したカテゴリの情報を検索することができる。
図8は、本発明の一実施形態に係る情報検索方法を説明するためのフローチャートである。
図8を参照すれば、ステップS810で、情報検索システムは、複数の質問に対する類型を分析する。質問に対する類型は、カテゴリ、ブランド、モデル名、または同義語の質問を含むことができる。
図9は、質問に対する類型を分析するステップをより具体化した一例を示すフローチャートである。
図9を参照すれば、ステップS910で、情報検索システムは、フィードバック情報を用いて質問の意図を分析する。フィードバック情報は、質問、および質問を用いたユーザによってクリックされた商品情報のクリック回数を示すクリック頻度を含むことができる。
ステップS920で、情報検索システムは、質問の意図に対する分析結果に応じて質問が最も多くクリックされた情報が存在するカテゴリをランキングする。すなわち、ステップS920で、情報検索システムは、質問の意図に対する分析結果に応じて、カテゴリ、ブランド、製造社、モデル名、キーワード、またはフィードバック情報に対するセクション加重値を適用し、セクション加重値が最も高いセクションを用いて情報をランキングすることができる。
一例として、ステップS810で、情報検索システムは、質問に対する類型を分析した結果に応じて、質問に対するカテゴリにおいて上位カテゴリ名と下位カテゴリ名が重複する場合に、重複したカテゴリ名を除去することができる。
一例として、ステップS810で、情報検索システムは、質問に対する類型を分析した結果に応じて、フィードバック情報が閾値以下のクリック頻度を有する場合に、該当のフィードバック情報を除去することができる。
一例として、ステップS810で、情報検索システムは、質問に対する累積したクリック頻度数、アビューズ読み取り指数、または各商品に対する販売指数を反映して質問に対する類型を分析することができる。
一例として、ステップS810で、情報検索システムは、アビューズ読み取り指数が基準値以下である場合に、累積したクリック頻度数、アビューズ読み取り指数、および販売指数に対してペナルティを適用して質問に対する類型を分析することもできる。
ステップS820で、情報検索システムは、分析された類型に応じて質問を分類する。一例として、ステップS820で、情報検索システムは、同義語辞書を用いて質問に対する同義語を追加して質問を拡張した後に(質問及び質問に対する同義語を含む複数の質問を用いて)、分析された類型に応じて拡張された質問を分類することができる。
ステップS830で、情報検索システムは、分類された質問を用いて情報を索引データベース250から索引する。
ステップS840で、情報検索システムは、索引結果を用いてユーザから入力された質問に対応する情報を検索(抽出)する。
このように、本発明に係る情報検索方法は、ユーザの質問の意図に適合したカテゴリの情報を検索することができる。
なお、本発明に係る情報検索方法の各ステップは、コンピュータにより実行されるプログラム(命令)により実現することができ、該プログラムを含むコンピュータ読取可能な記録媒体として提供されることが可能である。当該記録媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含むこともでき、記録媒体およびプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知であり使用可能なものであってもよい。コンピュータ読取可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、フロプティカルディスクのような磁気−光媒体、およびROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれる。また、プログラム命令の例としては、コンパイラによって生成されるような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行され得る高級言語コードを含む。前記したハードウェア要素は、本発明の動作を実行するために一以上のソフトウェアモジュールとして作動するように構成することができ、その逆もできる。
上述したように、本発明の好ましい実施形態を参照して説明したが、該当の技術分野において熟練した当業者にとっては、特許請求の範囲に記載された本発明の思想および領域から逸脱しない範囲内で、本発明を多様に修正および変更させることができることを理解することができるであろう。すなわち、本発明の技術的範囲は、特許請求の範囲に基づいて定められ、発明を実施するための最良の形態により制限されるものではない。
本発明に係る情報検索システムとユーザ端末機との連動関係を示す図である。 本発明の一実施形態に係る情報検索システムの構成を示す図である。 分析部に対する具体的な構成の一例を示す図である。 分類部に対する構成の一例を示す図である。 フィードバック情報の一例を示す図である。 カテゴリを整除した一例を示す図である。 フィードバック情報を整除した一例を示す図である。 本発明の一実施形態に係る情報検索方法を説明するためのフローチャートである。 質問に対する類型を分析するステップをより具体化した一例を示すフローチャートである。
符号の説明
110:ユーザ端末機
120:情報検索システム
210:情報データベース
220:分析部
230:分類部
240:索引部
250:索引データベース
260:検索部
310:カテゴリ整除部
320:フィードバック情報整除部
330:人気度適用部
410:質問拡張部
420:質問分類部

Claims (17)

  1. 情報検索方法であって、コンピュータにより実行されるステップが、
    ユーザから入力された質問に対する検索結果のうちの前記ユーザによりクリックされた前記検索結果に含まれる各情報毎に所定の記憶領域に記憶される、前記ユーザが入力した各質問とその情報に対するクリック頻度を含むフィードバック情報を用いて、前記質問に対して前記ユーザが最も多くクリックした前記各情報それぞれが属する各カテゴリを抽出する分析ステップと、
    前記抽出された各カテゴリに前記質問を分類する分類ステップと、
    前記分類された質問を用いて前記カテゴリに関連付けられる前記検索結果に含まれる情報を索引する索引ステップと、
    前記ユーザから入力された質問に合致する前記分類された質問により索引された前記検索結果に含まれる情報を検索する検索ステップと
    を含むことを特徴とする情報検索方法。
  2. 前記分析ステップは、
    前記抽出された各カテゴリのうちカテゴリ名が重複する一方のカテゴリを除去する除去ステップ、をさらに含むことを特徴とする請求項に記載の情報検索方法。
  3. 前記除去ステップは、
    前記抽出された各カテゴリ予め決められたカテゴリ名が含まれる場合に、前記予め決められたカテゴリ名のカテゴリを除外した他のすべてのカテゴリにおいて前記予め決められたカテゴリ名と同音異義のカテゴリ名のカテゴリを除去することを特徴とする請求項に記載の情報検索方法。
  4. 前記分析ステップは、
    前記クリック頻度が閾値以下である前記質問を前記情報に対する前記フィードバック情報から除去するステップ、をさらに含むことを特徴とする請求項1から3のいずれか1つに記載の情報検索方法。
  5. 前記検索ステップで検索された前記ユーザから入力された質問に合致する前記分類された質問により索引された前記検索結果に含まれる情報を、ランキングするランキングステップをさらに含み、
    前記ランキングステップは、前記クリック頻度に基づいて前記分類された質問に対する前記カテゴリに加重値を割り当て、前記加重値に基づいてランキングすることを特徴とする請求項1から4のいずれか1つに記載の情報検索方法。
  6. 前記分析ステップは、
    前記ユーザから入力された質問に対する各情報の累積クリック頻度前記質問に対する情報のアビューズ読み取り指数、または前記質問に対する情報に関連した商品の販売指数を用いて、前記質問が分類される前記カテゴリの人気度を算出するステップを含み、
    前記検索ステップで検索された前記ユーザから入力された質問に合致する前記分類された質問により索引された前記検索結果に含まれる情報を、当該情報が属するカテゴリの前記人気度に基づいてランキングするランキングステップをさらに含むことを特徴とする請求項1から4のいずれか1つに記載の情報検索方法。
  7. 前記人気度を算出するステップは、
    前記アビューズ読み取り指数が基準値以下である場合に、所定のペナルティを適用して前記人気度を算出することを特徴とする請求項に記載の情報検索方法。
  8. 同義語辞書を用いて前記質問に対する同義語を抽出し、前記抽出した同義語を追加して前記質問を拡張する拡張ステップさらに含み、
    前記索引ステップは、
    前記分類された質問及び前記同義語を用いて前記検索結果に含まれる情報を索引することを特徴とする請求項1から7のいずれか1つに記載の情報検索方法。
  9. コンピュータに、請求項1〜のうちのいずれか一項に記載情報検索方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  10. ユーザから入力された質問に対する検索結果のうちの前記ユーザによりクリックされた前記検索結果に含まれる各情報毎に所定の記憶領域に記憶される、前記ユーザが入力した各質問とその情報に対するクリック頻度を含むフィードバック情報を用いて、前記質問に対して前記ユーザが最も多くクリックした前記各情報それぞれが属する各カテゴリを抽出する分析部と、
    前記抽出された各カテゴリ前記質問を分類する分類部と、
    前記分類された質問を用いて前記カテゴリに関連付けられる前記検索結果に含まれる情報を索引する索引部と、
    前記ユーザから入力された質問に合致する前記分類された質問により索引された前記検索結果に含まれる情報を検索する検索部と
    を備えことを特徴とする情報検索システム。
  11. 前記分析部は、
    前記抽出された各カテゴリのうちカテゴリ名が重複する一方のカテゴリを除去して前記抽出された各カテゴリを整除するカテゴリ整除部を備えることを特徴とする請求項10に記載の情報検索システム。
  12. 前記カテゴリ整除部は、
    前記抽出された各カテゴリ予め決められたカテゴリ名が含まれる場合に、前記予め決められたカテゴリ名のカテゴリを除外した他のすべてのカテゴリにおいて前記予め決められたカテゴリ名と同音異義のカテゴリ名のカテゴリを除去することを特徴とする請求項11に記載の情報検索システム。
  13. 前記分析部は、
    前記クリック頻度が閾値以下である前記質問を前記情報に対する前記フィードバック情報から除去して当該フィードバック情報を整除するフィードバック情報整除部を備えることを特徴とする請求項10から12のいずれか1つに記載の情報検索システム。
  14. 前記検索部は、
    前記検索された前記ユーザから入力された質問に合致する前記分類された質問により索引された前記検索結果に含まれる情報を、前記クリック頻度に基づいて前記分類された質問に対する前記カテゴリに割り当てられる加重値に基づいてランキングすることを特徴とする請求項10から13のいずれか1つに記載の情報検索システム。
  15. 前記ユーザから入力された質問に対する各情報の累積クリック頻度前記質問に対する情報のアビューズ読み取り指数、または前記質問に対する情報に関連した商品の販売指数を用いて、前記質問が分類される前記カテゴリの人気度を算出する人気度適用部を含み、
    前記検索部は、
    前記検索された前記ユーザから入力された質問に合致する前記分類された質問により索引された前記検索結果に含まれる情報を、当該情報が属するカテゴリの前記人気度に基づいてランキングすることを特徴とする請求項10から13のいずれか1つに記載の情報検索システム。
  16. 前記人気度適用部は、
    前記アビューズ読み取り指数が基準値以下である場合に、所定のペナルティを適用して前記人気度を算出することを特徴とする請求項15に記載の情報検索システム。
  17. 同義語辞書を用いて前記質問に対する同義語を抽出し、前記抽出した同義語を追加して前記質問を拡張する質問拡張部さらに備え
    前記索引部は、
    前記分類された質問及び前記同義語を用いて前記検索結果に含まれる情報を索引することを特徴とする請求項10から16のいずれか1つに記載の情報検索システム。
JP2008205234A 2007-08-10 2008-08-08 情報検索方法およびそのシステム Active JP4750832B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2007-0080878 2007-08-10
KR1020070080878A KR100898458B1 (ko) 2007-08-10 2007-08-10 정보 검색 방법 및 그 시스템

Publications (2)

Publication Number Publication Date
JP2009043264A JP2009043264A (ja) 2009-02-26
JP4750832B2 true JP4750832B2 (ja) 2011-08-17

Family

ID=40443888

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008205234A Active JP4750832B2 (ja) 2007-08-10 2008-08-08 情報検索方法およびそのシステム

Country Status (2)

Country Link
JP (1) JP4750832B2 (ja)
KR (1) KR100898458B1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102253936B (zh) * 2010-05-18 2013-07-24 阿里巴巴集团控股有限公司 记录用户访问商品信息的方法及搜索方法和服务器
CN102810104B (zh) * 2011-06-03 2015-05-20 阿里巴巴集团控股有限公司 信息调整方法及装置
US9298776B2 (en) 2011-06-08 2016-03-29 Ebay Inc. System and method for mining category aspect information
CN103368986B (zh) 2012-03-27 2017-04-26 阿里巴巴集团控股有限公司 一种信息推荐方法及信息推荐装置
KR101509209B1 (ko) * 2014-01-13 2015-04-09 네이버 주식회사 검색 서비스 제공 장치 및 검색 서비스 제공 방법
KR101616958B1 (ko) * 2015-01-26 2016-04-29 주식회사 포워드벤처스 쇼핑 서비스 제공 장치, 방법 및 컴퓨터 프로그램
CN106951422B (zh) * 2016-01-07 2021-05-28 腾讯科技(深圳)有限公司 网页训练的方法和装置、搜索意图识别的方法和装置
CN108664515B (zh) 2017-03-31 2019-09-17 北京三快在线科技有限公司 一种搜索方法及装置,电子设备
KR102491077B1 (ko) * 2020-08-10 2023-01-20 네이버 주식회사 실시간 이슈에 대한 스포츠 팀 랭킹 제공 방법 및 시스템

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100445943B1 (ko) * 2000-10-25 2004-08-25 전석진 근접 검색식을 이용한 정보 검색 시스템 및 방법
JP4453229B2 (ja) * 2001-07-03 2010-04-21 日本電気株式会社 情報検索システム及び情報検索方法並びに情報検索プログラム
JP4230710B2 (ja) * 2002-03-19 2009-02-25 株式会社ジャストシステム 検索装置、検索方法、ならびに、プログラム
KR20040006515A (ko) * 2002-07-12 2004-01-24 주식회사 네오위즈 사용자가 입력하는 정보와 행동로그의 분석을 이용하여정보 서비스 체계 및 검색 결과를 제공하는 정보 서비스시스템 및 방법
KR100567268B1 (ko) * 2003-11-21 2006-04-03 한국전자통신연구원 카테고리 갱신이 가능한 엑스,엠,엘 옐로우페이지웹서비스 장치 및 이를 이용한 시스템
KR100645608B1 (ko) * 2004-03-25 2006-11-13 (주)첫눈 사용자 방문 유알엘 로그를 이용한 정보 검색 서비스 제공 서버 및 그 방법
JP4453437B2 (ja) * 2004-05-11 2010-04-21 日本電信電話株式会社 検索キーワード順位付け方法及び装置及びプログラム

Also Published As

Publication number Publication date
KR100898458B1 (ko) 2009-05-21
KR20090016328A (ko) 2009-02-13
JP2009043264A (ja) 2009-02-26

Similar Documents

Publication Publication Date Title
JP4750832B2 (ja) 情報検索方法およびそのシステム
KR102075833B1 (ko) 미술 작품 추천 큐레이션 방법 및 시스템
WO2016180270A1 (zh) 网页分类方法和装置、计算设备以及机器可读存储介质
CN106874279B (zh) 生成应用类别标签的方法及装置
US9262527B2 (en) Optimized ontology based internet search systems and methods
JP6379093B2 (ja) 製品識別子のラベル付けおよび製品のナビゲーション
JP4726528B2 (ja) マルチセンスクエリについての関連語提案
WO2020253591A1 (zh) 运用标签知识网络的搜索方法及装置
JP5391633B2 (ja) オントロジー空間を規定するタームの推奨
JP6247292B2 (ja) クエリ拡張
US20090094232A1 (en) Refining A Search Space In Response To User Input
WO2016000158A1 (en) Code recommendation
CN109597990B (zh) 一种社会热点与商品品类的匹配方法
CA3217669A1 (en) Commodity short title generation method and apparatus
KR100898459B1 (ko) 질의 분류 방법 및 그 시스템
JP2009294939A (ja) 文書分類装置
JP2014106665A (ja) 文書検索装置、文書検索方法
JP2001306612A (ja) 情報提供装置、情報提供方法およびその方法を実現するプログラムを記録した機械読取可能な記録媒体
KR20130022075A (ko) 감성 어휘 정보 구축 방법 및 장치
JP4959603B2 (ja) ドキュメントを解析するためのプログラム,装置および方法
JP5542729B2 (ja) 関連語抽出装置、関連語抽出方法、及び関連語抽出プログラム
JP5224532B2 (ja) 評判情報分類装置及びプログラム
CN103034709B (zh) 检索结果重排序***及其方法
JP2001184358A (ja) カテゴリ因子による情報検索装置,情報検索方法およびそのプログラム記録媒体
JP2000163437A (ja) 文書分類方法および文書分類装置ならびに文書分類処理プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110517

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110519

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4750832

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140527

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250