JP2008084193A - インスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラム - Google Patents

インスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラム Download PDF

Info

Publication number
JP2008084193A
JP2008084193A JP2006265770A JP2006265770A JP2008084193A JP 2008084193 A JP2008084193 A JP 2008084193A JP 2006265770 A JP2006265770 A JP 2006265770A JP 2006265770 A JP2006265770 A JP 2006265770A JP 2008084193 A JP2008084193 A JP 2008084193A
Authority
JP
Japan
Prior art keywords
instance
item
relevance
value
metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006265770A
Other languages
English (en)
Inventor
Masumi Inaba
真純 稲葉
Shinichi Nagano
伸一 長野
Takahiro Kawamura
隆浩 川村
Tetsuo Hasegawa
哲夫 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2006265770A priority Critical patent/JP2008084193A/ja
Priority to US11/849,723 priority patent/US20080082524A1/en
Publication of JP2008084193A publication Critical patent/JP2008084193A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

【課題】メタ情報と関連性が高いインスタンスの選択精度を向上させる。
【解決手段】クラスが有する項目の名称を示す項目名と当該項目の値である項目値とで構成されているインスタンスを複数格納するオントロジーデータベースと、インスタンスを選択対象として設定された項目名及び項目値で構成されるメタデータの入力を受け付けるメタデータ入力受付部と、インスタンス毎に、当該インスタンスの項目名と項目値との少なくとも一方と、入力を受け付けたメタデータとの類似度に対して重み付け係数を用いて、インスタンスとメタデータとの関係を示した関連度を算出する関連度算出部と、算出された前記関連度に基づいて、複数のインスタンスから、メタデータと関連性が高いインスタンスを選択する選択部と、を備える。
【選択図】 図1

Description

この発明は、所定のメタ情報と関連性の高いインスタンスを選択するインスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラムに関するものである。
オントロジーとは、対象世界を特定の観点から知識表現言語を用いてモデリングしたものである。そして、オントロジーは、概念(コンセプト)を表す複数の語彙間の関係をつないだツリー構造で示されるのが一般的である。
この語彙間をつなぐ代表的な関係(プロパティ)としては、is-a(上位下位)、part-of(部分全体)、instance-of(具体化)などがある。また、概念には特有のプロパティが存在する。
また、オントロジーでは複数の語彙間の関係が体系化されているために、相関関係を把握できる。したがって、相関関係に基づいて、より高度な検索を行うことが可能となる。また、オントロジーのツリー構造を参照することで、特定のコンセプトの周辺にあるコンセプトのインスタンスを取得することができる。このように、オントロジーを利用することで、利用者の要求に対して適切な語彙を取得することが可能となる。
例えば、特許文献1には、オントロジーを利用することで、利用者の会話に含まれている単語から、オントロジー内からメタ情報を取得する技術が提案されている。これにより、利用者の会話から関心が高いと考えられる情報を利用者に対して提供することができる。
特開2004−341672号公報
しかしながら、上述した特許文献1では、オントロジーに対して検索を行い、メタ情報を多数取得した場合、これらメタ情報の数を絞り込むことができないという問題がある。
本発明は、上記に鑑みてなされたものであって、メタ情報と関連性が高いインスタンスの選択精度を向上させたインスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明に係るインスタンス選択装置は、クラスが有する項目の名称を示す項目名と当該項目の値である項目値とで構成されているインスタンスを複数記憶する記憶手段と、前記インスタンスを選択対象として設定された項目名及び項目値で構成されるメタ情報の入力を受け付けるメタ情報入力受付手段と、前記インスタンス毎に、当該インスタンスの項目名と項目値との少なくとも一方と、入力を受け付けた前記メタ情報との類似度に対して重み付け係数を用いて、当該インスタンスと前記メタ情報との関係を示した関連度を算出する関連度算出手段と、算出された前記関連度に基づいて、前記複数のインスタンスから、前記メタ情報と関連性が高い前記インスタンスを選択する選択手段と、を備えることを特徴とする。
また、本発明に係るインスタンス選択方法は、クラスが有する項目の名称を示す項目名と当該項目の値である項目値とで構成され且つ記憶手段に記憶されたインスタンスを、選択対象として設定された項目名及び項目値で構成されるメタ情報の入力を受け付けるメタ情報入力受付ステップと、前記インスタンス毎に、当該インスタンスの項目名と項目値との少なくとも一方と、入力を受け付けた前記メタ情報との類似度に対して重み付け係数を用いて、当該インスタンスと前記メタ情報との関係を示した関連度を算出する関連度算出ステップと、算出された前記関連度に基づいて、前記複数のインスタンスから、前記メタ情報と関連性が高い前記インスタンスを選択する選択ステップと、を有することを特徴とする。
また、本発明に係るインスタンス選択プログラムは、メタ情報に関連するインスタンスを選択するインスタンス選択プログラムであって、クラスが有する項目の名称を示す項目名と当該項目の値である項目値とで構成され且つ記憶手段に記憶されたインスタンスを、選択対象として設定された項目名及び項目値で構成されるメタ情報の入力を受け付けるメタ情報入力受付ステップと、前記インスタンス毎に、当該インスタンスの項目名と項目値との少なくとも一方と、入力を受け付けた前記メタ情報との類似度に対して重み付け係数を用いて、当該インスタンスと前記メタ情報との関係を示した関連度を算出する関連度算出ステップと、算出された前記関連度に基づいて、前記複数のインスタンスから、前記メタ情報と関連性が高い前記インスタンスを選択する選択ステップと、をコンピュータに実行させる。
本発明によれば、算出された関連度に基づいて複数のインスタンスからインスタンスを選択することで、所定のメタ情報と関連性が高いインスタンスの選択精度を向上させることが可能という効果を奏する。
以下に添付図面を参照して、この発明にかかるインスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラムの最良な実施の形態を詳細に説明する。
(第1の実施の形態)
図1は、第1の実施の形態にかかる情報提示装置100の構成を示すブロック図である。本図に示すように、情報提示装置100は、メタデータ入力装置150と、ネットワークを介して検索サーバ160と接続されている。そして、情報提示装置100は、オントロジーデータベース101と、ユーザコンテキストデータベース102と、キーワードデータベース103と、検索結果キャッシュデータベース104と、メタデータ入力受付部105と、オントロジー・メタデータマッチング部106と、インスタンス取得部107と、関連度算出部113と、選択部114と、インスタンスリスト生成部109と、インスタンスリスト処理部110と、コンテンツ解析部111と、検索要求部112と、項目名対応データベース115と、を備える。
本実施の形態では、W3C(World Wide Web Consortium)で標準化が進められているOWL(Web Ontology Language)等で記述されたオントロジーを適用した例について説明するが、他の記述手法を用いても良いものとする。
メタデータ入力装置150は、情報提示装置100に対してメタデータを入力し、当該メタデータに関連するインスタンスリストの提示を要求する装置とする。このメタデータ入力装置150は、情報提示装置100とは公衆回線、無線又は有線で接続可能とする。また、メタデータ入力装置150は、情報提示装置100に対してメタデータを入力できればどのような装置でも良く、例えば携帯電話等が考えられる。
メタデータは、インスタンスを検出(選択)するために設定された項目名と項目値とが対応付けられた集合からなる半構造化されたデータとする。図2は、メタデータの一例を示した図である。図2に示すように、項目毎に項目名と項目値が対応付けられている。例えば、項目名「商品名」と項目値「XXPlayer」とが対応付けられ、項目名「カテゴリ」と項目値「動画レコーダー」とが対応付けられ、項目名「メーカー」と項目値「AAA」とが対応付けられ、項目名「色」と項目値「シルバー」とが対応付けられ、項目名「発売日」と項目値「2005年9月28日」とが対応付けられ、項目名「データ作成日」と項目値「2005年9月1日」とが対応付けられ、項目名「データ更新日」と項目値「2006年2月15日」とが対応付けられている。
検索サーバ160は、ネットワーク上に公開されている情報に対して、キーワード等を用いて検索を行うサービスを提供しているサーバとする。この検索サーバ160は、どのような検索サーバでも良く、例えば周知のサーチエンジン等を適用しても良い。
情報提示装置100は、メタデータ入力装置150から入力されたメタデータに含まれる情報を利用して、後述するオントロジーDB101から、当該メタデータとオントロジー内で距離が近いインスタンスを取得し、取得したインスタンスのリストから、入力されたメタデータと関連性の高いインスタンスを選択し、選択したインスタンスで構成されるリストを生成する。次に、情報提示装置100の各構成について説明する。
オントロジーデータベース101は、オントロジーを格納するデータベースとする。図3は、オントロジーデータベース101に格納されているオントロジーの一例を示す図である。そして、情報提示装置100は、図3に示すオントロジーデータベース101に格納されているインスタンスのうち、入力されたメタデータと関連性の高いインスタンスで構成されるインスタンスリストを提示することができる。
また、インスタンスは、オントロジーに含まれるクラスを実体化したデータであり、当該クラスが有する項目毎に、当該インスタンスを表すための項目値を保持している。
項目名対応データベース115は、項目名の対応関係を格納するデータベースとする。つまり、項目名は、同一項目を表すにもかかわらず、メタデータ毎に異なる場合がある。そこで、項目名対応データベース115は、同一項目を表す複数の項目名の対応付けを格納する。これにより、入力されたメタデータに含まれる項目名を用いて、オントロジー内のインスタンスと適切なマッチングを行うことが可能となる。
項目名対応データベース115が保持する項目名の対応関係の例を示す。例えば、項目名対応データベース115は、対象物の「名称」を表す項目名として、項目名「商品名」、項目名「製品名」及び項目名「タイトル」を対応付けて保持している。
他の例としては、項目名対応データベース115は、対象物を「識別するための符号」を表す項目名として、項目名「型番」、項目名「モデル名」及び項目名「ID」を対応付けて保持している。また、対象物の「グループ」を表す項目名として、項目名「シリーズ」、項目名「ブランド」及び項目名「レーベル」を対応付けて保持している。また、対象物の「種類」を表す項目名として、項目名「カテゴリ」、項目名「ジャンル」及び項目名「区分」を対応付けて保持している。また、対象物の「作者」を表す項目名として、項目名「メーカー」、項目名「製造メーカー」及び項目名「生産者」とを対応付けて保持している。また、対象物の「色」を表す項目名として、項目名「色」、項目名「カラー」及び項目名「彩色」とを対応付けて保持している。
ユーザコンテキストデータベース102は、ユーザ毎にユーザコンテキストを格納するデータベースとする。また、ユーザコンテキストとは、ユーザに関連する情報が格納されたデータとする。このユーザコンテキストに格納された情報を用いることで、ユーザが関心があるインスタンスを選択することが可能となる。また、ユーザコンテキストも、メタデータと同様に、項目名と項目値とを対応付けられた集合からなる半構造化されたデータとする。
図4は、ユーザコンテキストの一例を示す図である。図4に示すように、項目名と項目値が対応付けられている。また、項目名「名前」、「年齢」、「性別」、「住所」、「メール」、「URL」が、ユーザの基本情報(プロファイル)を示す項目とする。
また、図4に示した項目名「カテゴリ」、「色」、「有名人」がユーザの趣味思考、興味を示す項目とする。このような項目を格納することで、ユーザに関心が高いと推測されるインスタンスのリストを生成することが可能となる。
また、図4に示した項目名「参照履歴」は、ユーザが参照した商品を示すメタデータを格納する。また、格納されたメタデータは、項目名と項目値とが対応付けられている。これにより、ユーザが参照した商品を、オントロジー内のインスタンスとマッチングさせることが可能となる。
また、図4に示した項目名「購入履歴」は、ユーザが購入した商品を示すメタデータを格納する。また、格納されたメタデータは、項目名と項目値とが対応付けられている。これにより、ユーザが購入した商品を、オントロジー内のインスタンスとマッチングさせることが可能となる。
また、図4に示したユーザコンテキストのデータ構造は、一例として示したものであり、例えば、ユーザの基本情報と、ユーザの趣味思考、興味と、ユーザの参照履歴と、ユーザの購入履歴とをそれぞれ異なるテーブルで管理しても良い。
キーワードデータベース103は、後述するコンテンツ解析部111がコンテンツから取得したメタデータ及びキーワード等を格納する。
検索結果キャッシュデータベース104は、後述する検索要求部112が検索サーバ160から取得した検索結果を格納するデータベースとする。
メタデータ入力受付部105は、メタデータ入力装置150からメタデータの入力を受け付け、入力を受け付けたメタデータをオントロジー・メタデータマッチング部106に出力する。
図5は、メタデータ入力受付部105が受け付けたメタデータの例を示した図である。図5に示すように、当該メタデータは、項目名「製品名」と項目値「XXPlayer91」とが対応付けられ、項目名「型番」と項目値「XXPlayer91」とが対応付けられ、項目名「色」と項目値「シルバー」とが対応付けられ、項目名「製造メーカー」と項目値「AAA」とが対応付けられ、項目名「カテゴリ」と項目値「動画レコーダー」とが対応付けられ、項目名「発売日」と項目値「2005年9月28日」とが対応付けられている。なお、本実施の形態では、以下に当該メタデータを用いて処理を行った例について説明する。
オントロジー・メタデータマッチング部106は、オントロジーデータベース101を参照し、入力されたメタデータとオントロジーのマッチング処理を行う。そして、オントロジー・メタデータマッチング部106は、当該メタデータを、オントロジーデータベース101に格納されているオントロジー内の特定のコンセプト(クラス)に対してマッチングする。なお、マッチング処理は、周知の手法を問わず、あらゆる手法を用いても良い。
インスタンス取得部107は、マッチングされたコンセプトのインスタンスと、当該オントロジー内で上位下位などの距離的に近いコンセプトのインスタンスを取得する。この取得したインスタンスは、ユーザに提示するインスタンスの候補とする。そして、インスタンス取得部107は、取得したインスタンスで構成されたリストを、インスタンス候補リストとする。なお、メタデータと距離的に近いコンセプトのインスタンスの取得手法は、周知の手法を問わず、あらゆる手法を用いても良い。
図6は、オントロジーから取得するインスタンス候補リストを示した概念図である。そして、オントロジー・メタデータマッチング部106は、図5に示したメタデータを用いて、図6に示したオントロジーに対してマッチング処理を行い、当該メタデータとクラス601と一致すると判断する。そして、オントロジー・メタデータマッチング部106は、オントロジー内のコンセプト「動画レコーダー」602にマッピングする。
そして、インスタンス取得部107は、「動画レコーダー」602周辺のインスタンスを収集し、インスタンス候補リストを生成する。この収集の例としては、コンセプト「動画レコーダー」にある上位のコンセプト「AAA」まで辿り、当該コンセプト「AAA」の下位に属する全てのインスタンスを取得する等が考えられる。
検索要求部112は、入力されたメタデータと、インスタンス取得部107が取得したインスタンス候補リストとを用いて、メタデータ又はインスタンスの候補が記載されたウェブコンテンツの検索を、検索サーバ160に対して要求する。また、ウェブコンテンツとは、どのようなコンテンツでも良いが、例えばブログ等が考えられる。
そして、検索要求部112は、メタデータ又はインスタンスの候補を用いた検索結果を、検索サーバ160から取得する。次に、検索要求部112は、検索結果をキャッシュDB104に格納すると共に、当該検索結果をコンテンツ解析部111に出力する。
図7は、検索要求部112が、検索サーバ160から取得した検索結果であるウェブコンテンツを示す図である。図7は、ウェブコンテンツに付与されているメタデータ(RSS)の例である。そして、後述するコンテンツ解析部111が、このようなメタデータに対して処理を行う。
コンテンツ解析部111は、検索要求部112から入力された検索結果に含まれるコンテンツから、当該コンテンツに付与されたメタデータや、コンテンツ本文から特徴的なキーワード等を抽出し、キーワードDB103に格納する。
図8〜図10は、コンテンツ解析部111が、検索結果に含まれるコンテンツから取得した情報の例を示した図である。図8は、コンテンツ解析部111が、検索結果に含まれるメタデータから、取得した基本情報を示すメタデータの例を示す図である。図9は、コンテンツ解析部111が、検索結果に含まれるメタデータから、取得したキーワード等を示すメタデータの第1の例を示す図である。また、図10も同様に、コンテンツ解析部111が、検索結果に含まれるメタデータから、取得したキーワード等を示すメタデータの第2の例を示す図である。そして、コンテンツ解析部111は、図9及び図10で示されたキーワード1〜4の間で対応付けを行う。
図9及び図10に示すように、検索結果に複数のキーワードが含まれている場合には、コンテンツ解析部111は、当該キーワード間に対応付けを行う。そして、コンテンツ解析部111は、当該対応付けが行われたキーワードの情報を、キーワードデータベース111に格納する。つまり、情報提示装置100に入力されたメタデータに当該キーワードが含まれている場合、当該キーワードと対応付けられたキーワードを含むインスタンスは関連度が高くなるように設定できる。これにより、関連度を算出する際、公衆ネットワーク上のウェブコンテンツに基づいた関連度の算出が可能となる。
関連度算出部113は、項目マッチング処理部121と、キーワードマッチング処理部122と、ユーザコンテキストマッチング処理部123と、情報評価処理部124とを備え、インスタンス候補リストに含まれるインスタンス毎に、当該インスタンスが有する項目の項目名及び項目値に対して、インスタンスを選択する基準となる関連度を算出する。関連度は、インスタンスと、メタデータやユーザコンテキスト等との関係を示した値とする。
項目マッチング処理部121は、インスタンス候補リストに含まれているインスタンス毎に、インスタンスの項目名及び項目値と、メタデータとの類似度に対して重み付け係数を用いて、関連度を算出する。なお、詳細な処理については後述する。
キーワードマッチング処理部122は、インスタンス候補リストに含まれているインスタンス毎に、メタデータの項目名及び項目値に格納されているキーワードと、インスタンスの項目名及び項目値に格納されているキーワードとが、キーワードデータベース111内で対応付けられているか否か判断して、インスタンス毎にメタデータとの関連度を算出する。
つまり、キーワードマッチング処理部122は、キーワードデータベース111内で対応付けられているか否か判断することで、同一ウェブコンテンツ内で比較又は議論されたキーワードであるか判断していることになる。つまり、キーワードマッチング処理部122は、キーワードデータベース111内で対応付けられていると判断した場合、メタデータの項目値(または項目名)とインスタンスの項目値(または項目名)とが同一コンテンツ上で議論されているものとみなし、高い関連度を付与する。
ユーザコンテキストマッチング処理部123は、メタデータ入力装置150からインスタンスリストの提示を要求したユーザのユーザコンテキストをユーザコンテキストデータベース102から取得し、インスタンス候補リストに含まれているインスタンス毎に、当該ユーザコンテキストに含まれている情報と、インスタンスに含まれている項目名や項目値とを比較し、当該インスタンスとユーザとの関連性を示した関連度を算出する。
情報評価処理部124は、インスタンス候補リストに含まれているインスタンス毎に、当該インスタンスがユーザに提示する情報として適切かを評価し、当該評価を関連度として算出する。本実施の形態では、情報評価処理部124は、インスタンス毎に、項目値として含まれる日付情報から、情報の鮮度を算出し、鮮度が高いインスタンスに対しては高い関連度を、鮮度が低いインスタンスに対しては低い関連度を付与する。これにより、ユーザに対して鮮度の高い情報を優先的に提示することができる。なお、本実施の形態では、算出を容易にするために情報の鮮度を、関連度として算出したが、別の指標を用いても良い。
また、本実施の形態にかかる情報評価処理部124は、各インスタンスに対して項目名の数に応じた関連度を付与する。これにより、ユーザに対して詳細な情報を保持しているインスタンスを優先的に提示することができる。
次に、インスタンス毎に関連度を算出する例を説明する。図11―1〜図11―6は、インスタンス候補リストに含まれるインスタンスの項目名及び項目値の例を示した図である。これらインスタンス毎に、図5に示したメタデータとの関連度を算出することになる。また、図11−1に示したインスタンスをインスタンスAと、図11−2に示したインスタンスをインスタンスBと、図11−3に示したインスタンスをインスタンスCと、図11−4に示したインスタンスをインスタンスDと、図11−5に示したインスタンスをインスタンスEと、図11−6に示したインスタンスをインスタンスFとする。
まず、項目マッチング処理部121は、メタデータが有する項目名と、各インスタンスが有する項目名がより多く一致するものは、関連性が高いものとして処理する。そこで本実施の形態にかかる項目マッチング処理部121は、各インスタンスに対して、メタデータが有する項目名と一致する項目名の数に、重み付け係数である‘8’点を乗じた値を関連度として付与する。
そこで、項目マッチング処理部121は、「製品名」、「型番」、「色」、「製造メーカー」、「カテゴリ」、「発売日」という6つの項目名がメタデータと一致するインスタンスA〜Dに対して、関連度‘48’点を付与する。また、インスタンスE、Fに対して、関連度‘40’点を付与する。
また、項目マッチング処理部121は、メタデータが有する項目値と、各インスタンスが有する項目値がより多く一致するものは、関連性が高いものとして処理する。そこで本実施の形態にかかる項目マッチング処理部121は、各インスタンスに対して、メタデータが有する項目値と一致する項目値の数に、重み付け係数である‘10’点を乗じた値を関連度として付与する。例えば、項目マッチング処理部121は、インスタンスAがメタデータと全ての項目値が一致するので関連度‘60’点を付与し、インスタンスFがメタデータと全ての項目値が一致しないので関連度‘0’点を付与する。
また、項目マッチング処理部121は、項目値が完全一致する場合に限り、関連度を付与することに限定するものではなく、項目値の数値が近い場合についても、関連性が高いと判断し、関連度を付与しても良い。例えば、上述したように完全一致の場合に重み付け係数が‘10’点ならば、数値の違いが20%以内であれば重み付け係数‘8’点で関連度を付与する等が考えられる。
例えば、項目マッチング処理部121が、メタデータとインスタンスとの項目名「価格」の項目値の違いが±20%であれば、価格帯が近似していると判断する。例えば、メタデータの項目名「価格」の項目値「200,000円」であり、任意のインスタンスの項目名「価格」の項目値「201,000円」であれば、完全一致はしていないが±20%以内であると判断する。そこで、項目マッチング処理部121は、当該項目値の関連度として‘8’点を当該任意のインスタンスに付与する。
他の例としては、項目マッチング処理部121が、メタデータとインスタンスとの項目名「重量」の項目値の違いが±20%であれば、重さが近似していると判断する。例えば、メタデータの項目名「重量」の項目値「3kg」であり、任意のインスタンスの項目名「重量」の項目値「2.8kg」であれば、完全一致はしていないが±20%以内であると判断する。そこで、項目マッチング処理部121は、当該項目値の関連度として‘8’点を当該任意のインスタンスに付与する。
他の例としては、項目マッチング処理部121が、メタデータとインスタンスとの項目名「個数」の項目値の違いが±20%であれば、一単位あたりの販売数が近似していると判断する。例えば、メタデータの項目名「個数」の項目値「100個」であり、任意のインスタンスの項目名「個数」の項目値「90個」であれば、完全一致はしていないが±20%以内であると判断する。そこで、項目マッチング処理部121は、当該項目値の関連度として‘8’点を当該任意のインスタンスに付与する。
また、項目マッチング処理部121は、より多くのインスタンスが有する項目を重視することとする。そこで、本実施の形態にかかる項目マッチング処理部121は、より多くのインスタンスが有する項目に関する関連度を、上述した説明の倍の点数を付与する。
例えば、項目マッチング処理部121は、インスタンスA〜Fにおいて、項目名「製品名」、「型番」、「カテゴリ」、「発売日」は、全ての全てのインスタンスに含まれているので、当該項目に関する関連度は倍の点数とする。より具体的な例としては、メタデータと、図11−2に示したインスタンスBとは項目名「カテゴリ」の項目値が「動画レコーダー」で一致する。そして、項目名「カテゴリ」は倍の点数を付与する必要があるので、項目マッチング処理部121は、項目値が一致した場合の重み付け係数‘10’の2倍の‘20’点を、インスタンスBに対して付与する。
また、項目マッチング処理部121は、インスタンス候補リストに含まれる各インスタンスの日付情報と、メタデータの日付情報を比較する。そして、項目マッチング処理部121は、日付情報が一致すると判断した場合、当該インスタンスとメタデータとの関連性が高いと判断する。また、完全一致のみならず、部分一致の場合でもある程度関連性が高いものと判断する。
日付情報として項目名「発売日」を例とした場合、項目マッチング処理部121は、メタデータにおける項目値「2005年9月28日」と、図11−1に示すインスタンスAの項目値「2005年9月28日」とが一致するので、インスタンスAに対して関連度‘10’ポイントを付与する。このように日付情報において、一致した項目値の数に重み付け係数‘10’点を乗じた値をインスタンスに対して付与することになる。
また、項目マッチング処理部121は、メタデータにおける項目値「2005年9月28日」と、図11−2に示すインスタンスBの項目値「2005年2月16日」とが部分一致する、つまり年のみに着目すると同一年に発売されていることが確認できる。このため、項目マッチング処理部121は、インスタンスBに対して関連度‘8’点を付与する。このように日付情報において、部分一致した項目値の数に重み付け係数‘8’点を乗じた値をインスタンスに対して付与することになる。
また、項目マッチング処理部121は、完全一致や部分一致のみならず、日付情報が近似している場合についても、関連度を付与する。また、この日付情報の近似としては、単にメタデータとインスタンスの日付情報の違いが1月以内であるため、近似している等が考えられる。また、年が異なる日付情報であっても、月のみに着目し、同一月又は近しい月であれば近い季節特有の商品として、近似していると判断しても良い。
具体的な例としては項目名「発売日」において、項目マッチング処理部121は、メタデータにおける項目値「2005年9月28日」と、任意のインスタンスの項目値「2005年9月20日」とが月が一致しているので近似していると判断する。また、これら項目値は、上記の部分一致の条件も満たしている。そこで、項目マッチング処理部121は、当該任意のインスタンスに対して関連度‘9’点を付与することになる。
なお、上述した一致する項目値の数や、項目名の数、項目値が完全一致又は部分一致したこと等は、メタデータと類似していることを示しており、換言すれば類似度に相当する。
キーワードマッチング処理部122は、キーワードデータベース111に格納されたウェブコンテンツ(例えばブログ)の検索結果を用いて、キーワード間の重み付けを示す重み付け係数を算出し、当該重み付け係数を用いてインスタンス毎にメタデータとの関連度を算出する。
そして、キーワードマッチング処理部122は、ウェブコンテンツの同一ページ上で、比較される頻度が高いキーワードを重視して、重み付け係数を求める。なお、重み付け係数の算出手法はどのような手法を用いても良い。これにより、キーワードマッチング処理部122は、メタデータが有する項目値と、ウェブコンテンツの同一ページ上で比較される頻度が高いキーワードを含む項目値を有するインスタンスに対して、高い関連度を付与することができる。
例えば、図9に示した検索結果に含まれるメタデータでは、「BookNeoG590」と「XXPlayer91」とがキーワードとして含まれているので、これらキーワード間の関連性が高いものと判断する。そこで、キーワードマッチング処理部122は、メタデータが有する項目値に「XXPlayer91」が含まれているので、「BookNeo」を項目値として含むインスタンスCに、関連度‘10’点を付与する。このように、キーワードマッチング処理部122は、ウェブコンテンツの同一ページ内で比較されるウェブコンテンツがあれば、件数に重み付け係数‘10’を乗じた値を関連度として付与する。また、キーワードマッチング処理部122は、ウェブコンテンツの日付情報がキーワードデータベース111に格納されている場合、当該ウェブコンテンツの日付情報の鮮度により重み付け係数を変更しても良い。
また、キーワードマッチング処理部122は、インスタンスが有する各項目値を検索キーとしてヒットした件数が高い場合に、当該インスタンスに対して高い関連度を付与する。本実施の形態では、関連度を、ヒットした件数に重み付け係数‘1’点を乗じた値を、関連度とする。例えば、検索サーバ160に対して「BookNeo」をキーワードとして検索した場合、ヒットした件数が50件とし、「XXPlayer」をキーワードとして検索した場合、ヒットした件数が100件とする。この場合、キーワードマッチング処理部122は、インスタンスA及びインスタンスBが項目値に「XXPlayer」を含むので、関連度100点を付与する。また、キーワードマッチング処理部122は、インスタンスCが項目値に「BookNeo」を含むので、関連度50点を付与する。
また、キーワードマッチング処理部122は、ヒットとして件数のみならず、ヒットしたウェブコンテンツで当該キーワードの出現頻度が多い場合、当該キーワードを含む項目値を有するインスタンスに対して、高い関連度を付与してもよい。
ユーザコンテキストマッチング処理部123は、インスタンス候補リストに含まれるインスタンスが有する項目値が、ユーザコンテキストの項目値が一致する場合に、高い関連値を付与する。
図4に示すユーザコンテキストを用いた場合、ユーザコンテキストマッチング処理部123は、図4のレコード401により、ユーザが男性であることが確認できるので、項目値が「女性向け」のインスタンスについては関連度を下げる。そこで、本実施の形態にかかるユーザコンテキストマッチング処理部123は、項目値「女性向け」を含むインスタンスの関連度を算出する全ての演算が終了した後、‘0’を乗じることにする。これにより、他の関連度が高くとも、当該インスタンスが選択されることが無くなる。このように、関連度を加算するのみならず、関連度の乗算等の他の演算を用いても良い。
また、ユーザコンテキストマッチング処理部123は、図4のレコード402,403及び404に格納されている「ノートPC」、「動画レコーダー」、「携帯型オーディオプレーヤー」、「シルバー」、「ブラック」及び「特許次郎」を項目値として重視する。例えば、ユーザコンテキストマッチング処理部123は、これらのキーワードを項目値内に含むインスタンスに対して、項目値に含まれているキーワードの数に重み付け係数‘10’を乗じた値を、関連度として付与する。
また、ユーザコンテキストマッチング処理部123は、図4に示すユーザコンテキストを用いる場合、図4のレコード402,403及び404に格納されている「ノートPC」、「動画レコーダー」、「携帯型オーディオプレーヤー」、「シルバー」、「ブラック」及び「特許次郎」を項目値として重視する。例えば、ユーザコンテキストマッチング処理部123は、これらのキーワードを項目値内に含むインスタンスに対して、項目値に含まれているキーワードの数に重み付け係数‘10’を乗じた値を、関連度として付与する。
また、ユーザコンテキストマッチング処理部123は、図4に示すユーザコンテキストを用いる場合、図4のレコード405に格納されている参照履歴に含まれるメタデータを重視する。例えば、ユーザコンテキストマッチング処理部123は、これらメタデータの商品名である「XXPlayer91」及び「MegahitF21」を項目値内に含むインスタンスに対して、関連度の合計値に‘1.5’を乗じる。なお、上記に示したように所定の点を付与してもよい。
また、ユーザコンテキストマッチング処理部123は、図4に示すユーザコンテキストを用いる場合、図4のレコード405に格納されている購入履歴に含まれるメタデータを重視する。例えば、ユーザコンテキストマッチング処理部123は、これらメタデータの商品名である「MegahitF21」及び「BookSS L/2」を項目値内に含むインスタンスに対して、関連度の合計値に‘1.2’を乗じる。
ユーザコンテキストマッチング処理部123が、上述する処理を行うことで、ユーザの興味のあるインスタンスを優先的に提示することができる。
情報評価処理部124は、インスタンス候補リストに含まれるインスタンス毎に、インスタンスが有する項目名及び項目値に応じた関連度を付与する。
本実施の形態にかかる情報評価処理部124は、項目を多く有するインスタンスを重視する。例えば、情報評価処理部124は、各インスタンスに対して、当該インスタンスが有する項目の数に重み付け係数‘3’を乗じた値を関連度として付与する。これにより、詳細な情報を有するインスタンスを優先的に提示できる。
例えば、インスタンスA〜Dは、項目数が6なので、関連度として‘18’点が付与される。また、インスタンスE、Fは、項目数が5なので、関連度として‘15’点が付与される。
また、情報評価処理部124は、インスタンス毎に、情報の鮮度の高さ(例えば、現在時刻との時間間隔)に応じた関連度を付与する。例えば、情報評価処理部124は、現在から一週間前までの日付情報(例えば発売日、データ作成日、データ更新日)を項目値として有する場合、当該インスタンスに対して、関連度‘10’点を付与する。
また、情報評価処理部124は、一週間前から一ヶ月前までの日付情報を項目値として有する場合、当該インスタンスに対して、関連度‘8’点を付与する。また、情報評価処理部124は、1ヶ月前から半年前までの日付情報を項目値として有する場合、当該インスタンスに対して、関連度‘5’点を付与する。
例えば、インスタンスリストを要求した日が2005年12月28日の場合、情報評価処理部124は、発売日が最も新しいインスタンスCに対して、関連度‘10’点を付与することになる。これにより、ユーザに対して、鮮度の高いインスタンスを提示することが可能となる。
また、情報評価処理部124は、現在から10年以上前の日付情報を項目値として有する場合、10年ごとに関連度の合計値に‘0.2’を乗ずることとする。これにより、鮮度の低いインスタンスが、ユーザに対して提示される確率が低減する。
また、上述した重み付け係数は、例として示したものであり、状況に応じて適切な値が設定されるものとする。また、重み付け係数は、予め定められた値ではなく、ユーザの要求に応じて変更可能な値としても良い。さらに、情報提示装置100が、格納されたユーザコンテキストデータベース102や、キーワードデータベース111に格納された情報に基づいて、重み付け係数を自動的に算出するようにしても良い。
選択部114は、関連度算出部113で算出された関連度の合計値に基づいて、インスタンス候補リストから、メタデータと関連度が高いインスタンスを選択する。本実施の形態では、選択部114は、算出された関連度の合計値が、所定の閾値より高いインスタンスを、メタデータと関連性が高いインスタンスとして選択する。
なお、インスタンスの選択手法は上述した閾値を用いた手法に限らず、どのような手法でも良い。本実施の形態とは異なる例としては、選択部114が、関連度が高い順に所定の数だけ、インスタンス候補リストからインスタンスを選択しても良い。
インスタンスリスト生成部109は、選択部114で選択されたインスタンスで構成されるインスタンスリストを生成する。
インスタンスリスト処理部110は、生成されたインスタンスリストを用いた処理を行う。この処理はどのような処理でも良いが、例えばメタデータを出力してきたメタデータ入力装置150に対して出力する等でも良い。これにより、メタデータに関連するインスタンスリストを、利用者に対して提示することができる。
次に、情報提示装置100のインスタンスリストを提示するまでの処理手順について説明する。図12は、情報提示装置100がインスタンスリストを提示するまでの処理手順を示すフローチャートである。
まず、メタデータ入力受付部105が、メタデータ入力装置150からのメタデータの入力を受け付ける(ステップS1201)。
次に、オントロジー・メタデータマッチング部106は、オントロジーデータベース101に格納されているオントロジーに対して、入力されたメタデータを用いてマッチング処理を行う(ステップS1202)。これにより、入力されたメタデータのオントロジー内の位置が把握できる。
そして、インスタンス取得部107は、オントロジー内で、メタデータと距離的に近いコンセプトのインスタンスを取得し、この取得したインスタンスからなるインスタンス候補リストを生成する(ステップS1203)。
次に、関連度算出部113が、インスタンス候補リストに含まれるインスタンス毎に、関連度を算出する(ステップS1204)。なお、詳細な処理手順については、後述する。
そして、選択部114が、算出された関連度から、ユーザに提示するインスタンスを選択する(ステップS1205)。
そして、インスタンスリスト生成部109が、選択されたインスタンスからなるインスタンスリストを生成する(ステップS1206)。
次に、インスタンスリスト処理部110が、生成されたインスタンスリストを用いた処理を行う(ステップS1207)。例えば、当該インスタンスリストを、ユーザに対して提示する等とする。
上述した処理手順により、メタデータ入力装置150から入力されたメタデータと関連性が高いインスタンスが含まれたインスタンスリストを用いた可能となった。
次に、関連度算出部113が、インスタンス候補リストのインスタンス毎に、メタデータ及びユーザコンテキスト等との関連性を示す関連度を算出するまでの処理手順について説明する。図13は、関連度算出部113が、インスタンス候補リストのインスタンス毎に、メタデータ及びユーザコンテキスト等との関連性を示す関連度を算出するまでの処理手順を示すフローチャートである。
まず、項目マッチング処理部121は、インスタンス候補リストに含まれているインスタンス毎に、メタデータと項目名及び項目値を用いた比較を行い、インスタンス毎にメタデータとの関連度を算出する(ステップS1301)。
次に、キーワードマッチング処理部122が、インスタンス候補リストに含まれているインスタンス毎に、キーワードデータベース111に格納された情報に基づいて、メタデータの項目名及び項目値に格納されているキーワードと、インスタンスの項目名及び項目値に格納されているキーワードとを比較し、インスタンス毎にメタデータとの関連度を算出する(ステップS1302)。
そして、ユーザコンテキストマッチング処理部123は、インスタンス候補リストに含まれているインスタンス毎に、当該インスタンスに含まれている項目名や項目値と、ユーザコンテキストデータベース102に格納されているユーザコンテキストとを用いて、当該インスタンスとユーザとの関連性を示す関連度を算出する(ステップS1303)。
次に、情報評価処理部124は、インスタンス候補リストに含まれているインスタンス毎に、当該インスタンスがユーザに提示する情報としての適切性を評価し、当該評価を関連度として算出する(ステップS1304)。この評価対象としては、例えば項目数が多いか否か、又は日付情報が新しいか否かなどが考えられる。
このような処理手順により、インスタンス毎にメタデータやユーザコンテキストとの関連性を示す関連度を算出することができる。そして、選択部114が、図13に示した処理手順で算出されたインスタンス毎の関連度の合計値に基づいて、インスタンス候補リストから、メタデータと関連度が高いインスタンスを選択する。
これにより、メタデータと関連性が高く、ユーザに対して提示する情報として適切なインスタンスが、インスタンス候補リストから選択することができる。
つまり、メタデータと項目名または項目値が一致したか否かでインスタンスを検出する場合、当該項目名又は項目値が一致したインスタンスが多量に選択される又はほとんど選択されない場合も考えられる。そこで、本実施の形態では、インスタンス毎に、上述した重み付けを行ってから、関連度を算出している。そして、関連度の合計値が所定の閾値を超えたインスタンスや、関連度が高い順に所定の数のインスタンスを選択している。これにより閾値を変更する等で、選択するインスタンスの数などを柔軟に変更することができる。また、ユーザが、状況に応じて重み付け係数を変更してもよい。つまり、本実施の形態にかかる情報提示装置100の関連度算出部113は、重み付け係数を変更されることで、状況に応じた適切なインスタンスを選択することができる。
また、本実施の形態にかかる情報提示装置100によれば、関連度算出部113でインスタンス毎に算出された関連度の合計値に基づいて、インスタンス候補リストからインスタンスを選択する。このため、入力されたメタデータ及びユーザコンテキスト等と関連性が高いインスタンスの選択することができるので、選択精度の向上が可能となる。
図14は、上述した実施の形態にかかる情報提示装置100のハードウェア構成を示す図である。情報提示装置100は、ハードウェア構成として、情報提示装置100におけるインスタンス処理プログラムなどが格納されているROM1402と、ROM1402内のプログラムに従って情報提示装置100の各部を制御するCPU1401と、情報提示装置100の制御に必要な種々のデータを記憶するRAM(Random Access Memory)1403と、ネットワークに接続する通信I/F1404と、ハードディスクなどの外部記憶装置1405と、各部を接続するバス1406と、を備えている。また、情報提示装置100は、上述した構成を備えた一般的なコンピュータに適用することができる。
上述した実施の形態にかかる情報提示装置100で実行されるインスタンス処理プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
この場合には、インスタンス処理プログラムは、情報提示装置100において上記記録媒体から読み出して実行することにより主記憶装置上にロードされ、上記ソフトウェア構成で説明した各部が主記憶装置上に生成されるようになっている。
また、上述した実施の形態にかかる情報提示装置100で実行されるインスタンス処理プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、上述した実施の形態にかかる情報提示装置100で実行されるインスタンス処理プログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。
また、本実施形態のインスタンス処理プログラムを、ROM等に予め組み込んで提供するように構成してもよい。
本実施の形態の情報提示装置100で実行されるインスタンス処理プログラムは、上述した各部を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が上記記憶媒体からインスタンス処理プログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、上記各部が主記憶装置上に生成されるようになっている。
以上のように、本発明にかかるインスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラムは、メタデータと関連性が高いインスタンスを特定する技術として有用である。
第1の実施の形態にかかる情報提示装置の構成を示すブロック図である。 メタデータの一例を示した図である。 オントロジーデータベースに格納されているオントロジーの一例を示す図である。 ユーザコンテキストの一例を示す図である。 メタデータ入力受付部が受け付けたメタデータの例を示した図である。 オントロジーから取得するインスタンス候補リストを示した概念図である。 検索要求部が、検索サーバから取得した検索結果であるウェブコンテンツを示す図である。 コンテンツ解析部が、検索結果に含まれるメタデータから取得した基本情報を示すメタデータの例を示す図である。 コンテンツ解析部が、検索結果に含まれるメタデータから取得したキーワード等を示すメタデータの第1の例を示す図である。 コンテンツ解析部が、検索結果に含まれるメタデータから取得したキーワード等を示すメタデータの第2の例を示す図である。 インスタンス候補リストに含まれるインスタンスの項目名及び項目値の第1の例を示した図である。 インスタンス候補リストに含まれるインスタンスの項目名及び項目値の第2の例を示した図である。 インスタンス候補リストに含まれるインスタンスの項目名及び項目値の第3の例を示した図である。 インスタンス候補リストに含まれるインスタンスの項目名及び項目値の第4の例を示した図である。 インスタンス候補リストに含まれるインスタンスの項目名及び項目値の第5の例を示した図である。 インスタンス候補リストに含まれるインスタンスの項目名及び項目値第6の例を示した図である。 情報提示装置がインスタンスリストを提示するまでの処理手順を示すフローチャートである。 関連度算出部が、インスタンス候補リストのインスタンス毎に、メタデータ及びユーザコンテキスト等との関連性を示す関連度を算出するまでの処理手順を示すフローチャートである。 情報提示装置のハードウェア構成を示す図である。
符号の説明
100 情報提示装置
101 オントロジーデータベース
102 ユーザコンテキストデータベース
103 キーワードデータベース
104 検索結果キャッシュデータベース
105 メタデータ入力受付部
106 オントロジー・メタデータマッチング部
107 インスタンス取得部
108 インスタンス選択部
109 インスタンスリスト生成部
110 インスタンスリスト処理部
111 キーワードデータベース
111 コンテンツ解析部
112 検索要求部
113 関連度算出部
114 選択部
115 項目名対応データベース
121 項目マッチング処理部
122 キーワードマッチング処理部
123 ユーザコンテキストマッチング処理部
124 情報評価処理部
150 メタデータ入力装置
160 検索サーバ
1401 CPU
1402 ROM
1403 RAM
1404 通信I/F
1405 外部記憶装置
1406 バス

Claims (9)

  1. クラスが有する項目の名称を示す項目名と当該項目の値である項目値とで構成されているインスタンスを複数記憶する記憶手段と、
    前記インスタンスを選択対象として設定された項目名及び項目値で構成されるメタ情報の入力を受け付けるメタ情報入力受付手段と、
    前記インスタンス毎に、当該インスタンスの項目名と項目値との少なくとも一方と、入力を受け付けた前記メタ情報との類似度に対して重み付け係数を用いて、当該インスタンスと前記メタ情報との関係を示した関連度を算出する関連度算出手段と、
    算出された前記関連度に基づいて、前記複数のインスタンスから、前記メタ情報と関連性が高い前記インスタンスを選択する選択手段と、
    を備えることを特徴とするインスタンス選択装置。
  2. 前記選択手段は、前記関連度が所定の閾値より大きいインスタンスを選択すること、
    を特徴とする請求項1に記載のインスタンス選択装置。
  3. 前記関連度算出手段で用いられる前記類似度は、前記インスタンスと前記メタ情報との前記項目値の一致度合いから得られる値であること、
    を特徴とする請求項1又は2に記載のインスタンス選択装置。
  4. 前記関連度算出手段で用いられる前記類似度は、前記インスタンスと前記メタ情報との前記項目名の一致度合いから得られる値であること、
    を特徴とする請求項1又は2に記載のインスタンス選択装置。
  5. 利用者に関連する情報を示すユーザコンテキストを格納するユーザコンテキスト記憶部をさらに備え、
    前記関連度算出手段は、さらに複数のインスタンスのインスタンス毎に、当該インスタンスの項目名と項目値との少なくとも一方と、前記ユーザコンテキストに含まれる情報が一致するか否か判断し、一致した場合に前記関連度を大きくすること、
    を特徴とする請求項1乃至4のいずれか一つに記載のインスタンス選択装置。
  6. ネットワーク上に蓄積されているコンテンツを取得するコンテンツ取得手段と、
    取得した前記コンテンツを解析し、当該コンテンツから抽出された複数のキーワード間を対応付けるコンテンツ解析手段と、をさらに備え、
    前記関連度算出手段は、入力を受け付けた前記メタ情報の項目名又は項目値が前記キーワードに含まれている場合、当該キーワードと対応付けられたキーワードを含む項目名又は項目値を有する前記インスタンスの前記関連度を大きくすること、
    を特徴とする請求項1乃至5のいずれか一つに記載のインスタンス選択装置。
  7. 前記関連度算出手段は、さらに前記インスタンスの項目値に日付情報が格納されている場合、当該日付情報と所定の時間との時間間隔に応じて、前記関連度を変更すること、
    を特徴とする請求項1乃至5のいずれか一つに記載のインスタンス選択装置。
  8. クラスが有する項目の名称を示す項目名と当該項目の値である項目値とで構成され且つ記憶手段に記憶されたインスタンスを、選択対象として設定された項目名及び項目値で構成されるメタ情報の入力を受け付けるメタ情報入力受付ステップと、
    前記インスタンス毎に、当該インスタンスの項目名と項目値との少なくとも一方と、入力を受け付けた前記メタ情報との類似度に対して重み付け係数を用いて、当該インスタンスと前記メタ情報との関係を示した関連度を算出する関連度算出ステップと、
    算出された前記関連度に基づいて、前記複数のインスタンスから、前記メタ情報と関連性が高い前記インスタンスを選択する選択ステップと、
    を有することを特徴とするインスタンス選択方法。
  9. メタ情報に関連するインスタンスを選択するインスタンス選択プログラムであって、
    クラスが有する項目の名称を示す項目名と当該項目の値である項目値とで構成され且つ記憶手段に記憶されたインスタンスを、選択対象として設定された項目名及び項目値で構成されるメタ情報の入力を受け付けるメタ情報入力受付ステップと、
    前記インスタンス毎に、当該インスタンスの項目名と項目値との少なくとも一方と、入力を受け付けた前記メタ情報との類似度に対して重み付け係数を用いて、当該インスタンスと前記メタ情報との関係を示した関連度を算出する関連度算出ステップと、
    算出された前記関連度に基づいて、前記複数のインスタンスから、前記メタ情報と関連性が高い前記インスタンスを選択する選択ステップと、
    をコンピュータに実行させるインスタンス選択プログラム。
JP2006265770A 2006-09-28 2006-09-28 インスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラム Pending JP2008084193A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006265770A JP2008084193A (ja) 2006-09-28 2006-09-28 インスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラム
US11/849,723 US20080082524A1 (en) 2006-09-28 2007-09-04 Apparatus, method and computer program product for selecting instances

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006265770A JP2008084193A (ja) 2006-09-28 2006-09-28 インスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラム

Publications (1)

Publication Number Publication Date
JP2008084193A true JP2008084193A (ja) 2008-04-10

Family

ID=39262213

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006265770A Pending JP2008084193A (ja) 2006-09-28 2006-09-28 インスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラム

Country Status (2)

Country Link
US (1) US20080082524A1 (ja)
JP (1) JP2008084193A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009176160A (ja) * 2008-01-25 2009-08-06 Internatl Business Mach Corp <Ibm> サービス検索システム、方法及びプログラム
JP2010156552A (ja) * 2008-12-26 2010-07-15 Kddi R & D Laboratories Inc 誘導案内方法およびシステム
JP2010231271A (ja) * 2009-03-25 2010-10-14 Toshiba Corp コンテンツ検索装置、コンテンツ検索方法、コンテンツ検索プログラム
JP2011118667A (ja) * 2009-12-03 2011-06-16 Mitsubishi Electric Corp コンテンツ検索システム
KR20160066237A (ko) * 2014-12-02 2016-06-10 주식회사 솔트룩스 반정형데이터 기반 동적 온톨로지 인스턴스 구축 방법 및 시스템
WO2020003451A1 (ja) * 2018-06-28 2020-01-02 三菱電機株式会社 検索装置、検索方法および機械学習装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009080624A (ja) * 2007-09-26 2009-04-16 Toshiba Corp 情報表示装置、方法及びプログラム
US20110078579A1 (en) * 2009-09-28 2011-03-31 Shama Jaffrey Method and apparatus for providing information and dynamically displaying newly arrived, up-to-date, current, consumer products
US9244801B2 (en) * 2014-03-31 2016-01-26 International Business Machines Corporation Increasing the accuracy of service quality management metrics

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5845278A (en) * 1997-09-12 1998-12-01 Inioseek Corporation Method for automatically selecting collections to search in full text searches
US6018733A (en) * 1997-09-12 2000-01-25 Infoseek Corporation Methods for iteratively and interactively performing collection selection in full text searches
US6393399B1 (en) * 1998-09-30 2002-05-21 Scansoft, Inc. Compound word recognition
US6732088B1 (en) * 1999-12-14 2004-05-04 Xerox Corporation Collaborative searching by query induction
US6675159B1 (en) * 2000-07-27 2004-01-06 Science Applic Int Corp Concept-based search and retrieval system
KR20020067507A (ko) * 2000-08-23 2002-08-22 코닌클리케 필립스 일렉트로닉스 엔.브이. 한 벌의 옷을 선택하기 위해 추천을 발생시키는 방법 및시스템
US20030217052A1 (en) * 2000-08-24 2003-11-20 Celebros Ltd. Search engine method and apparatus
US7392263B2 (en) * 2005-02-28 2008-06-24 Microsoft Corporation File system represented inside a database
JP4427500B2 (ja) * 2005-09-29 2010-03-10 株式会社東芝 意味解析装置、意味解析方法および意味解析プログラム
JP4542993B2 (ja) * 2006-01-13 2010-09-15 株式会社東芝 構造化文書抽出装置、構造化文書抽出方法および構造化文書抽出プログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009176160A (ja) * 2008-01-25 2009-08-06 Internatl Business Mach Corp <Ibm> サービス検索システム、方法及びプログラム
JP2010156552A (ja) * 2008-12-26 2010-07-15 Kddi R & D Laboratories Inc 誘導案内方法およびシステム
JP2010231271A (ja) * 2009-03-25 2010-10-14 Toshiba Corp コンテンツ検索装置、コンテンツ検索方法、コンテンツ検索プログラム
JP2011118667A (ja) * 2009-12-03 2011-06-16 Mitsubishi Electric Corp コンテンツ検索システム
KR20160066237A (ko) * 2014-12-02 2016-06-10 주식회사 솔트룩스 반정형데이터 기반 동적 온톨로지 인스턴스 구축 방법 및 시스템
KR101675946B1 (ko) * 2014-12-02 2016-11-15 주식회사 솔트룩스 반정형데이터 기반 동적 온톨로지 인스턴스 구축 방법 및 시스템
WO2020003451A1 (ja) * 2018-06-28 2020-01-02 三菱電機株式会社 検索装置、検索方法および機械学習装置
JP6639749B1 (ja) * 2018-06-28 2020-02-05 三菱電機株式会社 検索装置、検索方法および機械学習装置
CN112352230A (zh) * 2018-06-28 2021-02-09 三菱电机株式会社 检索装置、检索方法及机器学习装置
TWI735892B (zh) * 2018-06-28 2021-08-11 日商三菱電機股份有限公司 檢索裝置及檢索方法

Also Published As

Publication number Publication date
US20080082524A1 (en) 2008-04-03

Similar Documents

Publication Publication Date Title
US20240169375A1 (en) Linguistic extraction of temporal and location information for a recommender system
US11461388B2 (en) Generating a playlist
US20200125981A1 (en) Systems and methods for recognizing ambiguity in metadata
US9652539B2 (en) Popularity of content items
US8200667B2 (en) Method and apparatus for constructing user profile using content tag, and method for content recommendation using the constructed user profile
US11822594B2 (en) System and method for automatically selecting images to accompany text
KR101078864B1 (ko) 질의/문서 주제 범주 변화 분석 시스템 및 그 방법과 이를 이용한 질의 확장 기반 정보 검색 시스템 및 그 방법
JP4622808B2 (ja) 楽曲分類装置、楽曲分類方法、楽曲分類プログラム
US8321456B2 (en) Generating metadata for association with a collection of content items
JP2008084193A (ja) インスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラム
JP5066963B2 (ja) データベース構築装置
US8321412B2 (en) Digital data processing method for personalized information retrieval and computer readable storage medium and information retrieval system thereof
US9576050B1 (en) Generating a playlist based on input acoustic information
JP2011175362A (ja) 情報処理装置、重要度算出方法及びプログラム
JP5306114B2 (ja) クエリ抽出装置、クエリ抽出方法およびクエリ抽出プログラム
JP4896132B2 (ja) 情報価値を反映した情報検索方法及びその装置
US20060253433A1 (en) Method and apparatus for knowledge-based music searching and method and apparatus for managing music file
JP2014056426A (ja) コンテンツ推薦システム、コンテンツ推薦方法、及びプログラム、並びに端末装置及びプログラム
JP7234077B2 (ja) 検索支援システム、学習システム、検索支援方法、及びプログラム
Tomar et al. Beats and Bytes: Decoding Song’s Success Patterns Using Machine Learning
JP5131565B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
CN113590736A (zh) 索引管理方法、装置、电子设备和可读存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080701

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080901

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081014

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090303