JP2009043264A - 情報検索方法およびそのシステム - Google Patents

情報検索方法およびそのシステム Download PDF

Info

Publication number
JP2009043264A
JP2009043264A JP2008205234A JP2008205234A JP2009043264A JP 2009043264 A JP2009043264 A JP 2009043264A JP 2008205234 A JP2008205234 A JP 2008205234A JP 2008205234 A JP2008205234 A JP 2008205234A JP 2009043264 A JP2009043264 A JP 2009043264A
Authority
JP
Japan
Prior art keywords
question
information
category
questions
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008205234A
Other languages
English (en)
Other versions
JP4750832B2 (ja
Inventor
Ji Hoon Choi
知 勳 崔
Kogen Kim
光 鉉 金
Soko Lee
相 浩 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NHN Corp
Original Assignee
NHN Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NHN Corp filed Critical NHN Corp
Publication of JP2009043264A publication Critical patent/JP2009043264A/ja
Application granted granted Critical
Publication of JP4750832B2 publication Critical patent/JP4750832B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】情報検索方法およびそのシステムを提供する。
【解決手段】情報検索方法は、複数の質問に対する類型を分析するステップと、分析された類型に応じて質問を分類するステップと、分類された質問を用いて情報を索引するステップと、索引結果を用いてユーザから入力された質問に対応する情報を検索するステップとを含み、質問に対する類型は、カテゴリ、ブランド、モデル名、または同義語の質問を含む。
【選択図】図8

Description

本発明は、情報検索方法およびそのシステムに関し、より詳細には、ユーザの質問の意図に適合した情報を検索する情報検索方法及び情報検索システムに関する。
一般的に、情報検索方法は、ユーザが入力したクエリを分析し、分析されたクエリに対応する検索結果を人気度順によって整列して提供する。
例えば、ユーザが「ドラム」をクエリとして入力して楽器のドラムと関連した情報を検索しようとする場合に、従来の情報検索方法は、他のユーザによって「ドラム」に対応する検索結果として「ドラム洗濯機」の人気度が高ければ、ユーザが検索しようとする楽器のドラムよりもドラム洗濯機を優先的に検索結果として提供されてしまい、ユーザが所望する検索結果を優先的に提供できないという問題点がある。
一例として、ユーザによって入力された質問が「ジーンズ」である場合に、従来の情報検索方法は、男性用ジーンズまたは女性用ジーンズのうちで人気がある商品のみを検索するので、女性のユーザが男性用ジーンズを所望する場合において、女性ジーンズのうちの人気のある商品のみを検索結果として提供するようになれば、ユーザが所望する情報を適切に検索して提供できないという結果を招来してしまうことになる。
また、一例として、ユーザによって入力された質問が「プーマ」である場合に、従来の情報検索方法は、アビューズ(abuse)行為によって「ナイキ/アディダス/ポロ/ビーンポール」などが含まれる検索結果が上位に露出するようになれば、実際にユーザが所望するプーマに対する検索結果を正確に提供できないという問題点がある。
したがって、ユーザの質問の意図を把握し、より正確にユーザが所望する情報検索結果を提供することができる方案が切に求められている。
本発明は、上記した問題点を解決するために案出されたものであって、ユーザの質問の意図に適合した情報を検索する情報検索方法及びそのシステムを提供することを目的とする。
また、本発明は、アビューズを除去し、ユーザが所望するより正確な情報検索結果を提供する情報検索方法及びそのシステムを提供することを他の目的とする。
また、本発明は、情報検索時の手作業検索結果を改善することができる情報検索方法及びそのシステムを提供することを他の目的とする。
また、本発明は、商品販売度を検索ランキングに反映することができる情報検索方法及びそのシステムを提供することを他の目的とする。
さらに、本発明は、商品の発売日を検索ランキングに反映することができる情報検索方法及びそのシステムを提供することをさらに他の目的とする。
本発明の一実施形態に係る情報検索方法は、複数の質問に対する類型を分析するステップと、前記分析された類型に応じて質問を分類するステップと、前記分類された質問を用いて情報を索引するステップと、前記索引結果を用いてユーザから入力された質問に対応する情報を検索するステップとを含み、前記質問に対する類型は、カテゴリ、ブランド、モデル名、または同義語の質問を含む。
本発明の一実施形態に係る情報検索システムは、複数の質問に対する類型を分析する分析部と、前記分析された類型に応じて質問を分類する分類部と、前記分類された質問を用いて情報を索引する索引部と、前記索引結果を用いてユーザから入力された質問に対応する情報を検索する検索部とを備え、前記質問に対する類型は、カテゴリ、ブランド、モデル名、または同義語の質問を含む。
本発明によれば、ユーザの質問の意図に適合した情報を検索する情報検索方法及びそのシステムを提供することができる効果がある。
また、本発明によれば、アビューズを除去し、ユーザが所望するより正確な情報検索結果を提供する情報検索方法及びそのシステムを提供することができる効果がある。
また、本発明によれば、情報検索時の手作業検索結果を改善することができる情報検索方法及びそのシステムを提供することができる効果がある。
また、本発明によれば、商品販売度を検索ランキングに反映することができる情報検索方法及びそのシステムを提供することができる効果がある。
さらに、本発明によれば、商品の販売日を検索ランキングに反映することができる情報検索方法及びそのシステムを提供することができる効果がある。
以下、添付の図面を参照しながら、本発明に係る情報検索方法及びそのシステムについて詳細に説明する。
図1は、本発明に係る情報検索システムとユーザ端末機との連動関係を示す図である。
図1を参照すれば、ユーザ端末機110は、ユーザから検索しようとする質問(query)の入力を受け付けると、入力された質問を情報検索システム120に送信する。なお、ユーザ端末機110と情報検索システム120とは、有線/無線の通信網で接続され、例えば、インターネット等を介して通信することができる。
情報検索システム120は、データベースに格納された複数の質問に対する類型を分析する。質問に対する類型は、カテゴリ、ブランド、モデル名、または同義語の質問を含むことができる。すなわち、情報検索システム120は、フィードバック情報を用いて質問の意図を分析し、質問の意図に対する分析結果に応じて質問が最も多くクリックされた情報が存在するカテゴリをランキングすることで、質問に対する類型を分析することができる。フィードバック情報は、質問に対するクリック頻度などを含むことができる。
情報検索システム120は、分析された類型に応じて、情報に対するカテゴリにおいて該カテゴリに含まれる上位カテゴリ名と下位カテゴリ名との間でカテゴリ名が重複する場合に、重複したカテゴリ名を除去することができる。また、情報検索システム120は、分析された類型に応じて、情報に対するカテゴリに決められたキーワードが含まれる場合に、決められたカテゴリを除外したキーワードが含まれるカテゴリを除去することができる。さらに、情報検索システム120は、分析された類型に応じて、フィードバック情報が閾値以下のクリック頻度を有する場合に、フィードバック情報を除去することができる。
情報検索システム120は、質問の意図に対する分析結果に応じて、カテゴリ、ブランド、製造社、モデル名、キーワード、またはフィードバック情報に対するセクション加重値を適用し、セクション加重値が最も高いセクションを用いて情報をランキングすることができる。セクション加重値とは、カテゴリ、ブランド、製造社、モデル名、キーワード、またはフィードバック情報の各セクション別に重要度に応じて付与された加重値である。一例として、情報検索システム120は、質問の意図に対する分析結果に応じてセクション加重値を適用した後、セクション加重値が最も高いセクションがカテゴリである場合に、カテゴリに対する情報をランキングすることができる。また、情報検索システム120は、質問に対する累積したクリック頻度数、アビューズ読み取り指数、または各商品に対する販売指数を反映して質問に対する類型を分析することができる。一例として、アビューズ読み取り指数とは、商品名の人気度を高めるために故意的に商品名が質問として入力されたものとして読み取られた数値によって生成された指数であり、販売指数とは、各商品の販売数値によって生成された指数である。さらに、情報検索システム120は、アビューズ読み取り指数が基準値以下である場合に、累積したクリック頻度数、アビューズ読み取り指数、および販売指数に対してペナルティを適用して質問に対する類型を分析することができる。
情報検索システム120は、分析された類型に応じて質問を分類し、分類された質問を用いて情報を索引(Indexing)する。情報検索システム120は、同義語辞書を用いて質問に対する同義語を追加して質問に対して検索される情報の範囲を拡張することができる。
情報検索システム120は、索引結果を用いて、ユーザから入力された質問に対応される情報を検索する。また、情報検索システム120は、検索された情報をユーザ端末機110に提供する。
図2は、本発明の一実施形態に係る情報検索システムの構成を示す図である。
図2を参照すれば、情報検索システム120は、情報データベース210と、分析部220と、分類部230と、索引部240と、索引データベース250と、検索部260とを備える。
情報データベース210は、ユーザによって入力された複数の質問および質問に応じて提供される各種情報を記録して保持する。
分析部220は、複数の質問に対する類型を分析する。すなわち、分析部220は、情報データベース210に記録された複数の質問に対する類型を分析することができる。質問に対する類型は、カテゴリ、ブランド、モデル名、または同義語の質問を含むことができる。
分析部220は、フィードバック情報を用いて質問の意図を分析する。例えば、質問の意図に対する分析として、ユーザが入力した質問に対して最も多くクリックされた情報が存在するカテゴリをランキングして情報を分析することができる。フィードバック情報は、情報をクリックしたユーザ質問の集合であって、ユーザの検索意図を把握することができる手段であり、情報がクリックされるときに用いられた質問および質問を用いたユーザによって情報がクリックされた回数を示すクリック頻度を含む。
図5は、フィードバック情報の一例を示す図である。
図5を参照すれば、商品情報510は、ユーザから入力された質問に対する検索結果のうちでユーザによってクリックされたショッピング商品情報であり、アディダスジャージトレーニングウェアWarm Set(黒/白)を示している。フィードバック情報520は、商品情報510をクリックしたユーザ質問の集合であって、ユーザによって商品情報510がクリックされた回数を示すクリック頻度および商品情報510をクリックするときにユーザによって入力された質問を含む。図5を一例として説明すると、フィードバック情報520は、質問が「トレーニングウェア」である場合において商品情報510のクリック頻度が412であり、質問が「アディダス」である場合において商品情報510のクリック頻度が259であり、質問が「アディダストレーニングウェア」である場合において商品情報510のクリック頻度が196であり、質問が「運動服」である場合において商品情報510のクリック頻度が「182」であり、質問が「adidas運動服」である場合において商品情報510のクリック頻度が160である。
このように分析部220は、図5に示すようなフィードバック情報を用いて質問の意図を分析し、質問の意図に対する分析結果に応じて、例えば、質問が「トレーニングウェア」である場合において商品情報510を含む複数の商品情報の各クリック頻度を分析し、質問「トレーニングウェア」に対してユーザが最も多くクリックした情報(商品情報)が存在するカテゴリをランキングすることができる。すなわち、商品情報は、複数のカテゴリに区分され、例えば、カテゴリ別に付与されるカテゴリIDと関連付けて商品情報を格納することができる。
また、分析部220は、質問の意図に対する分析結果に応じて、カテゴリ、ブランド、製造社、モデル名、キーワード、またはフィードバック情報に対するセクション加重値を適用し、セクション加重値が最も高いセクションを用いて情報をランキングすることができる。
図3は、分析部の具体的な構成の一例を示す図である。
図3を参照すれば、分析部220は、カテゴリ整除部310と、フィードバック情報整除部320と、人気度適用部330とを備える。
カテゴリ整除部310は、分析された類型に応じて、情報に対するカテゴリにおける上位カテゴリ名と下位カテゴリ名との間でカテゴリ名が重複する場合に、重複したカテゴリ名を除去してカテゴリを整除(整理)する。すなわち、カテゴリ整除部310は、カテゴリに多くの分類カテゴリ名を含む場合に、下位カテゴリ名に対して上位カテゴリ名が重複すれば、重複した上位カテゴリ名を除去してカテゴリを整除することができる。
図6は、カテゴリを整除した一例を示す図である。
図6を参照すれば、一例として、第1カテゴリ610を整除(重複を排除)する場合に、カテゴリ整除部310は、「ノート型パソコン/デスクトップ/モニタ>ノート型パソコン>LG電子」のように、上位カテゴリ名「ノート型パソコン/デスクトップ/モニタ」と下位カテゴリ名「ノート型パソコン」との間でカテゴリ名「ノート型パソコン」が重複する場合、重複した上位カテゴリ名である「ノート型パソコン/デスクトップ/モニタ」を除去することができる。
一例として、第2カテゴリ620を整除する場合に、カテゴリ整除部310は、「デジカメ/カムコーダ>デジタルカメラ>キヤノン」のように、上位カテゴリ名である「デジカメ/カムコーダ」と下位カテゴリ名である「デジタルカメラ」との間において、「デジカメ」と「デジタルカメラ」とを同義語として判別することができ、実質的に重複しているカテゴリ名として、重複した上位カテゴリ名である「デジカメ/カムコーダ」を除去することができる。すなわち、カテゴリ整除部310は、整除処理を遂行する際に、完全一致するカテゴリ名に対して整除処理を遂行するとともに、下位カテゴリ名に対する同義語を不図示の同義語辞書データベース等から取得し、下位カテゴリ名と同義の上位カテゴリ名を除去する整除処理を遂行することができる。
また、一例として、第3カテゴリ630を整除する場合に、カテゴリ整除部310は、「おむつ/衛生用品>パンツ型>ハギス」のように、下位カテゴリ名に上位カテゴリ名が存在しないため、カテゴリ名を除去せずに「おむつ/衛生用品>パンツ型>ハギス」をそのまま用いることができる。つまり、下位カテゴリ名が上位カテゴリ名に含まれていない、又は下位カテゴリ名と同義のカテゴリ名が上位カテゴリ名に含まれていない場合、カテゴリに対して上位カテゴリ名を除去する処理を遂行しない。
また、カテゴリ整除部310は、カテゴリに衆意的な意味を有するキーワードが含まれる場合には特定の意味を択一し、特定の意味のキーワードが含まれるカテゴリを除いた残りのすべてのカテゴリにて衆意的な意味を有するキーワードを除去することができる。一例として、カテゴリに「かき(柿)」というキーワード(カテゴリ名)が含まれる場合に、当該カテゴリが果物である「かき(柿)」に対するカテゴリであれば(当該カテゴリが果物の属性を有するカテゴリであれば)保持し、カテゴリが果物である「かき(柿)」に対するカテゴリを除外した他のすべてのカテゴリにおけるカテゴリ名から、例えば「かき(柿)」と発音は同じであるが意味が異なる同音異義語の「かき(牡蠣)」を除去することができる。
フィードバック情報整除部320は、分析された類型に応じて、フィードバック情報が閾値以下のクリック頻度を有する場合に、フィードバック情報を除去してフィードバック情報を整除する。すなわち、フィードバック情報整除部320は、情報別に累積したフィードバック情報を整除するために所定のクリック頻度閾値を定義し、閾値以下のクリック頻度を有するフィードバック情報を除去することで、フィードバック情報を整除することができる。クリック頻度閾値は、フィードバック情報内のクリック頻度値、好ましくは最大クリック頻度値を参照して決定することができる。
図7は、フィードバック情報を整除した一例を示す図である。
図7を参照すれば、フィードバック情報710において、最大クリック頻度を参照して、クリック頻度閾値を一例として「40」に決めることができる。フィードバック情報整除部320は、フィードバック情報710において、クリック頻度閾値である「40」よりも小さいクリック頻度が「25」である質問「イ・ヒョリフォン」とクリック頻度が「10」である質問「Sch−S470」を除去することができる。つまり、図5の例において、質問と商品情報510との間のフィードバック情報520、すなわち、各質問が入力された際に商品情報510がクリックされる頻度(言い換えれば、質問が入力された場合に、当該質問と関連してユーザが参照する商品情報の参照数)のうち、所定のクリック頻度に満たない質問は、当該商品情報510との間の関連性が低いと判断し、累積されたフィードバック情報520に含まれないようにすることができる(除外することができる)。
人気度適用部330は、質問の意図に対する分析結果に応じて、累積したクリック頻度数、アビューズ読み取り指数、または各商品に対する販売指数を人気度に適用する。人気度とは、質問に対する入力回数、質問に対するクリック回数、質問に対するアビューズ読み取り指数、または質問を用いた各商品に対する販売指数などのような多様な情報を分析した結果に応じて、この質問がユーザにどれ程多くの人気があるのかを判断することができる基準である。すなわち、人気度適用部330は、累積したクリック頻度数をログ(log)正規化し、形態素分析を介した商品名のアビューズ判断指数を正規化し、商品の販売指数リストで最大値を用いて人気度に適用することができる。このとき、人気度適用部330は、情報生成期間(Maxage)が6ヶ月以内である最新のスコアを人気度に反映することができる。さらに、人気度適用部330は、アビューズ読み取り指数が基準値以下である場合に、累積したクリック頻度数、アビューズ読み取り指数、および販売指数に対してペナルティを人気度に適用することができる。一例として、アビューズ読み取り指数が基準値以下である場合に、人気度適用部330は、累積したクリック頻度数、アビューズ読み取り指数、販売指数、およびフィードバック情報に対するクリック頻度を減少させることで、ペナルティを人気度に適用することができる。
分析部220は、分析された質問の意図、人気度、および類似度を結合して検索ランキングを定義することができる。一例として、分析部220は、製品名(モデル名)、カテゴリ名、ブランド名、フィードバック情報のクリック頻度を用いた類似度を定義することができる。
分類部230は、分析された類型に応じて質問を分類する。
図4は、分類部に対する構成の一例を示す図である。
図4を参照すれば、分類部230は、質問拡張部410と、質問分類部420とを備える。質問拡張部410は、同義語辞書を用いて質問に対する同義語を追加して質問を拡張する。すなわち、質問拡張部410は、同義語辞書を用いてORMAX演算を適用して質問を拡張する。拡張された質問は1つの概念であり、質問数が1つである。さらに、質問拡張部410は、ポスティング(Posting)をマージ(merge)するときに、加重値を合わせて類似度を生成するのではなくて最大値を用い、加重値を正規化する過程でも質問の数を分けない。一例として、質問が「携帯電話」である場合に、質問拡張部410は、同義語辞書を用いて「携帯電話、携帯フォン、最新フォン、携帯」などに質問を拡張することができる。
質問分類部420は、拡張された質問を分類する。一例として、質問分類部420は、同義語辞典を用いて質問に対する同義語を追加して質問を拡張した後、分析された類型に応じて拡張された質問を分類することができる。
索引部240は、分類された質問を用いて情報を索引する。
索引データベース250は、索引結果を記録して保持する。索引結果は、質問および質問に対応する情報である。
検索部260は、索引結果を用いてユーザから入力された質問に対応する情報を検索する。すなわち、検索部260は、索引データベース250を参照して、ユーザから入力された質問に対応する情報を検索することができる。
このように、本発明に係る情報検索システムは、ユーザの質問の意図に適合したカテゴリの情報を検索することができる。
図8は、本発明の一実施形態に係る情報検索方法を説明するためのフローチャートである。
図8を参照すれば、ステップS810で、情報検索システムは、複数の質問に対する類型を分析する。質問に対する類型は、カテゴリ、ブランド、モデル名、または同義語の質問を含むことができる。
図9は、質問に対する類型を分析するステップをより具体化した一例を示すフローチャートである。
図9を参照すれば、ステップS910で、情報検索システムは、フィードバック情報を用いて質問の意図を分析する。フィードバック情報は、質問、および質問を用いたユーザによってクリックされた商品情報のクリック回数を示すクリック頻度を含むことができる。
ステップS920で、情報検索システムは、質問の意図に対する分析結果に応じて質問が最も多くクリックされた情報が存在するカテゴリをランキングする。すなわち、ステップS920で、情報検索システムは、質問の意図に対する分析結果に応じて、カテゴリ、ブランド、製造社、モデル名、キーワード、またはフィードバック情報に対するセクション加重値を適用し、セクション加重値が最も高いセクションを用いて情報をランキングすることができる。
一例として、ステップS810で、情報検索システムは、質問に対する類型を分析した結果に応じて、質問に対するカテゴリにおいて上位カテゴリ名と下位カテゴリ名が重複する場合に、重複したカテゴリ名を除去することができる。
一例として、ステップS810で、情報検索システムは、質問に対する類型を分析した結果に応じて、フィードバック情報が閾値以下のクリック頻度を有する場合に、該当のフィードバック情報を除去することができる。
一例として、ステップS810で、情報検索システムは、質問に対する累積したクリック頻度数、アビューズ読み取り指数、または各商品に対する販売指数を反映して質問に対する類型を分析することができる。
一例として、ステップS810で、情報検索システムは、アビューズ読み取り指数が基準値以下である場合に、累積したクリック頻度数、アビューズ読み取り指数、および販売指数に対してペナルティを適用して質問に対する類型を分析することもできる。
ステップS820で、情報検索システムは、分析された類型に応じて質問を分類する。一例として、ステップS820で、情報検索システムは、同義語辞書を用いて質問に対する同義語を追加して質問を拡張した後に(質問及び質問に対する同義語を含む複数の質問を用いて)、分析された類型に応じて拡張された質問を分類することができる。
ステップS830で、情報検索システムは、分類された質問を用いて情報を索引データベースから250から索引する。
ステップS840で、情報検索システムは、索引結果を用いてユーザから入力された質問に対応する情報を検索(抽出)する。
このように、本発明に係る情報検索方法は、ユーザの質問の意図に適合したカテゴリの情報を検索することができる。
なお、本発明に係る情報検索方法の各ステップは、コンピュータにより実行されるプログラム(命令)により実現することができ、該プログラムを含むコンピュータ読取可能な記録媒体として提供されることが可能である。当該記録媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含むこともでき、記録媒体およびプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知であり使用可能なものであってもよい。コンピュータ読取可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、フロプティカルディスクのような磁気−光媒体、およびROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれる。また、記録媒体は、プログラム命令、データ構造などを保存する信号を送信する搬送波を含む光または金属線、導波管などの送信媒体でもある。プログラム命令の例としては、コンパイラによって生成されるような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行され得る高級言語コードを含む。前記したハードウェア要素は、本発明の動作を実行するために一以上のソフトウェアモジュールとして作動するように構成することができ、その逆もできる。
上述したように、本発明の好ましい実施形態を参照して説明したが、該当の技術分野において熟練した当業者にとっては、特許請求の範囲に記載された本発明の思想および領域から逸脱しない範囲内で、本発明を多様に修正および変更させることができることを理解することができるであろう。すなわち、本発明の技術的範囲は、特許請求の範囲に基づいて定められ、発明を実施するための最良の形態により制限されるものではない。
本発明に係る情報検索システムとユーザ端末機との連動関係を示す図である。 本発明の一実施形態に係る情報検索システムの構成を示す図である。 分析部に対する具体的な構成の一例を示す図である。 分類部に対する構成の一例を示す図である。 フィードバック情報の一例を示す図である。 カテゴリを整除した一例を示す図である。 フィードバック情報を整除した一例を示す図である。 本発明の一実施形態に係る情報検索方法を説明するためのフローチャートである。 質問に対する類型を分析するステップをより具体化した一例を示すフローチャートである。
符号の説明
110:ユーザ端末機
120:情報検索システム
210:情報データベース
220:分析部
230:分類部
240:索引部
250:索引データベース
260:検索部
310:カテゴリ整除部
320:フィードバック情報整除部
330:人気度適用部
410:質問拡張部
420:質問分類部

Claims (19)

  1. 複数の質問に対する類型を分析するステップと、
    前記分析された類型に応じて質問を分類するステップと、
    前記分類された質問を用いて情報を索引するステップと、
    前記索引結果を用いてユーザから入力された質問に対応する情報を検索するステップと、を含み、
    前記質問に対する類型は、
    カテゴリ、ブランド、モデル名、または同義語の質問を含むことを特徴とする情報検索方法。
  2. 質問に対する類型を分析する前記ステップは、
    フィードバック情報を用いて質問の意図を分析するステップと、
    前記質問の意図に対する分析結果に応じて前記質問が最も多くクリックされた情報が存在するカテゴリをランキングするステップと、を含み、
    前記フィードバック情報は、
    前記質問に対するクリック頻度を含むことを特徴とする請求項1に記載の情報検索方法。
  3. 質問に対する類型を分析する前記ステップは、
    前記質問に対する類型を分析した結果に応じて、質問に対するカテゴリが上位カテゴリ名と下位カテゴリ名が重複する場合に、重複したカテゴリ名を除去するステップ、
    をさらに含むことを特徴とする請求項2に記載の情報検索方法。
  4. 重複したカテゴリ名を除去する前記ステップは、
    前記質問に対するカテゴリに決められたキーワードが含まれる場合に、決められたカテゴリを除外したすべてのカテゴリから前記キーワードを除去することを特徴とする請求項3に記載の情報検索方法。
  5. 質問に対する類型を分析する前記ステップは、
    前記質問に対する類型を分析した結果に応じて、前記フィードバック情報が閾値以下のクリック頻度を有する場合に、前記フィードバック情報を除去するステップ、
    をさらに含むことを特徴とする請求項2に記載の情報検索方法。
  6. カテゴリをランキングする前記ステップは、
    前記質問の意図に対する分析結果に応じて、カテゴリ、ブランド、製造社、モデル名、キーワード、またはフィードバック情報に対するセクション加重値を適用し、前記セクション加重値が最も高いセクションを用いて前記情報をランキングすることを特徴とする請求項2に記載の情報検索方法。
  7. 質問に対する類型を分析する前記ステップは、
    前記質問に対する累積したクリック頻度数、アビューズ読み取り指数、または各商品に対する販売指数を反映して前記質問に対する類型を分析することを特徴とする請求項1に記載の情報検索方法。
  8. 質問に対する類型を分析する前記ステップは、
    前記アビューズ読み取り指数が基準値以下である場合に、前記累積したクリック頻度数、前記アビューズ読み取り指数、および前記販売指数に対してペナルティを適用して前記質問に対する類型を分析することを特徴とする請求項7に記載の情報検索方法。
  9. 同義語辞書を用いて前記質問に対する同義語を追加して前記質問を拡張するステップ、
    をさらに含むことを特徴とする請求項1に記載の情報検索方法。
  10. 請求項1〜9のうちのいずれか一項の方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  11. 複数の質問に対する類型を分析する分析部と、
    前記分析された類型に応じて質問を分類する分類部と、
    前記分類された質問を用いて情報を索引する索引部と、
    前記索引結果を用いてユーザから入力された質問に対応する情報を検索する検索部と、
    を備え、
    前記質問に対する類型は、
    カテゴリ、ブランド、モデル名、または同義語の質問を含むことを特徴とする情報検索システム。
  12. 前記分析部は、
    フィードバック情報を用いて質問の意図を分析し、前記質問の意図に対する分析結果に応じて前記質問が最も多くクリックされた情報が存在するカテゴリをランキングして前記複数の質問に対する類型を分析し、
    前記フィードバック情報は、
    前記質問および前記質問がユーザによってクリックされた回数を示すクリック頻度を含むことを特徴とする請求項11に記載の情報検索システム。
  13. 前記分析部は、
    前記分析された類型に応じて、前記情報に対するカテゴリが上位カテゴリ名と下位カテゴリ名が重複する場合に、重複したカテゴリ名を除去してカテゴリを整除するカテゴリ整除部、を備えることを特徴とする請求項11に記載の情報検索システム。
  14. 前記カテゴリ整除部は、
    前記分析された類型に応じて、前記情報に対するカテゴリに決められたキーワードが含まれる場合に、決められたカテゴリを除外したすべてのカテゴリから前記キーワードを除去することを特徴とする請求項13に記載の情報検索システム。
  15. 前記分析部は、
    前記分析された類型に応じて、前記フィードバック情報が閾値以下のクリック頻度を有する場合に、前記フィードバック情報を除去して前記フィードバック情報を整除するフィードバック情報整除部、
    を備えることを特徴とする請求項12に記載の情報検索システム。
  16. 前記分析部は、
    前記質問の意図に対する分析結果に応じて、カテゴリ、ブランド、製造社、モデル名、キーワード、またはフィードバック情報に対するセクション加重値を適用し、前記セクション加重値が最も高いセクションを用いて前記情報をランキングすることを特徴とする請求項12に記載の情報検索システム。
  17. 前記分析部は、
    前記質問の意図に対する分析結果に応じて、累積したクリック頻度数、アビューズ読み取り指数、または各商品に対する販売指数を人気度に適用する人気度適用部、
    を備えることを特徴とする請求項12に記載の情報検索システム。
  18. 前記人気度適用部は、
    前記アビューズ読み取り指数が基準値以下である場合に、前記累積したクリック頻度数、前記アビューズ読み取り指数、および前記販売指数に対してペナルティを前記人気度に適用することを特徴とする請求項17に記載の情報検索システム。
  19. 同義語辞書を用いて前記質問に対する同義語を追加して前記質問を拡張する質問拡張部、をさらに備えることを特徴とする請求項11に記載の情報検索システム。
JP2008205234A 2007-08-10 2008-08-08 情報検索方法およびそのシステム Active JP4750832B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020070080878A KR100898458B1 (ko) 2007-08-10 2007-08-10 정보 검색 방법 및 그 시스템
KR10-2007-0080878 2007-08-10

Publications (2)

Publication Number Publication Date
JP2009043264A true JP2009043264A (ja) 2009-02-26
JP4750832B2 JP4750832B2 (ja) 2011-08-17

Family

ID=40443888

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008205234A Active JP4750832B2 (ja) 2007-08-10 2008-08-08 情報検索方法およびそのシステム

Country Status (2)

Country Link
JP (1) JP4750832B2 (ja)
KR (1) KR100898458B1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013531289A (ja) * 2010-05-18 2013-08-01 アリババ・グループ・ホールディング・リミテッド 検索におけるモデル情報群の使用
JP2014517404A (ja) * 2011-06-03 2014-07-17 アリババ・グループ・ホールディング・リミテッド 情報カテゴリおよび表示情報の間の一致度の決定
US9740996B2 (en) 2012-03-27 2017-08-22 Alibaba Group Holding Limited Sending recommendation information associated with a business object
JP2018518788A (ja) * 2016-01-07 2018-07-12 テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド ウェブページトレーニング方法及び装置、検索意図識別方法及び装置
JP2020512651A (ja) * 2017-03-31 2020-04-23 ベイジン サンクアイ オンライン テクノロジー カンパニー リミテッド 検索方法、装置及び非一時的コンピュータ読取可能記憶媒体

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9298776B2 (en) 2011-06-08 2016-03-29 Ebay Inc. System and method for mining category aspect information
KR101509209B1 (ko) * 2014-01-13 2015-04-09 네이버 주식회사 검색 서비스 제공 장치 및 검색 서비스 제공 방법
KR101616958B1 (ko) * 2015-01-26 2016-04-29 주식회사 포워드벤처스 쇼핑 서비스 제공 장치, 방법 및 컴퓨터 프로그램
KR102491077B1 (ko) * 2020-08-10 2023-01-20 네이버 주식회사 실시간 이슈에 대한 스포츠 팀 랭킹 제공 방법 및 시스템

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003016112A (ja) * 2001-07-03 2003-01-17 Nec Corp 情報検索システム及び情報検索方法並びに情報検索プログラム
JP2003271648A (ja) * 2002-03-19 2003-09-26 Just Syst Corp 検索装置、検索方法、ならびに、プログラム
JP2005322165A (ja) * 2004-05-11 2005-11-17 Nippon Telegr & Teleph Corp <Ntt> 検索キーワード提示方法及び装置及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100445943B1 (ko) * 2000-10-25 2004-08-25 전석진 근접 검색식을 이용한 정보 검색 시스템 및 방법
KR20040006515A (ko) * 2002-07-12 2004-01-24 주식회사 네오위즈 사용자가 입력하는 정보와 행동로그의 분석을 이용하여정보 서비스 체계 및 검색 결과를 제공하는 정보 서비스시스템 및 방법
KR100567268B1 (ko) * 2003-11-21 2006-04-03 한국전자통신연구원 카테고리 갱신이 가능한 엑스,엠,엘 옐로우페이지웹서비스 장치 및 이를 이용한 시스템
KR100645608B1 (ko) * 2004-03-25 2006-11-13 (주)첫눈 사용자 방문 유알엘 로그를 이용한 정보 검색 서비스 제공 서버 및 그 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003016112A (ja) * 2001-07-03 2003-01-17 Nec Corp 情報検索システム及び情報検索方法並びに情報検索プログラム
JP2003271648A (ja) * 2002-03-19 2003-09-26 Just Syst Corp 検索装置、検索方法、ならびに、プログラム
JP2005322165A (ja) * 2004-05-11 2005-11-17 Nippon Telegr & Teleph Corp <Ntt> 検索キーワード提示方法及び装置及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013531289A (ja) * 2010-05-18 2013-08-01 アリババ・グループ・ホールディング・リミテッド 検索におけるモデル情報群の使用
EP2572325A4 (en) * 2010-05-18 2016-03-23 Alibaba Group Holding Ltd USING MODEL INFORMATION GROUPS IN A SEARCH
JP2014517404A (ja) * 2011-06-03 2014-07-17 アリババ・グループ・ホールディング・リミテッド 情報カテゴリおよび表示情報の間の一致度の決定
US9740996B2 (en) 2012-03-27 2017-08-22 Alibaba Group Holding Limited Sending recommendation information associated with a business object
JP2018518788A (ja) * 2016-01-07 2018-07-12 テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド ウェブページトレーニング方法及び装置、検索意図識別方法及び装置
JP2020512651A (ja) * 2017-03-31 2020-04-23 ベイジン サンクアイ オンライン テクノロジー カンパニー リミテッド 検索方法、装置及び非一時的コンピュータ読取可能記憶媒体
US11144594B2 (en) 2017-03-31 2021-10-12 Beijing Sankuai Online Technology Co., Ltd Search method, search apparatus and non-temporary computer-readable storage medium for text search

Also Published As

Publication number Publication date
KR100898458B1 (ko) 2009-05-21
JP4750832B2 (ja) 2011-08-17
KR20090016328A (ko) 2009-02-13

Similar Documents

Publication Publication Date Title
JP4750832B2 (ja) 情報検索方法およびそのシステム
US9519464B2 (en) Code recommendation
KR102075833B1 (ko) 미술 작품 추천 큐레이션 방법 및 시스템
KR101027864B1 (ko) 대량의 전자 문서 검색을 위한 문서 관련성을 판정하기위한 기계-학습 접근법
Zhao et al. Topical keyphrase extraction from twitter
JP4726528B2 (ja) マルチセンスクエリについての関連語提案
WO2016180270A1 (zh) 网页分类方法和装置、计算设备以及机器可读存储介质
US8108405B2 (en) Refining a search space in response to user input
JP2010170529A (ja) オブジェクト分類方法およびオブジェクト分類システム
JP3849318B2 (ja) 情報検索装置、情報検索方法及び情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4729607B2 (ja) 質問分類方法およびそのシステム
WO2021196541A1 (zh) 用于搜索内容的方法、装置、设备和计算机可读存储介质
CN104298658A (zh) 获取搜索结果的方法和装置
JP2009294939A (ja) 文書分類装置
JP2001306612A (ja) 情報提供装置、情報提供方法およびその方法を実現するプログラムを記録した機械読取可能な記録媒体
JP5224532B2 (ja) 評判情報分類装置及びプログラム
CN103034709B (zh) 检索结果重排序***及其方法
JP7256357B2 (ja) 情報処理装置、制御方法、プログラム
CN113039535A (zh) 搜索引擎用户接口ai蒙皮
CN116610810A (zh) 基于调控云知识图谱血缘关系的智能搜索方法及***
JP2011103020A (ja) 検索条件推薦装置、検索条件推薦方法および検索条件推薦プログラム
Rajkumar et al. Users’ click and bookmark based personalization using modified agglomerative clustering for web search engine
CN111831884B (zh) 一种基于信息查找的匹配***与方法
JP5308918B2 (ja) キーワード抽出方法、キーワード抽出装置およびキーワード抽出プログラム
Radhakrishnan et al. Modeling the evolution of product entities

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110517

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110519

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4750832

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140527

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250