JP5477635B2

JP5477635B2 - 情報処理装置および方法、並びにプログラム

Info

Publication number: JP5477635B2
Application number: JP2010030178A
Authority: JP
Inventors: 真里斎藤
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2010-02-15
Filing date: 2010-02-15
Publication date: 2014-04-23
Anticipated expiration: 2030-02-15
Also published as: US8812503B2; US20110202530A1; JP2011165131A; CN102163208A

Description

本発明は、情報処理装置および方法、並びにプログラムに関し、特に、所定のコンテンツに対して、国や文化が異なる場合であっても、感性的な情報を正確に付与することができるようにした情報処理装置および方法、並びにプログラムに関する。

従来、コンテンツに対して、そのコンテンツの特徴を表すメタデータ（例えば、ジャンルなど）を付与することで、大量のコンテンツの中から所望のコンテンツを検索することがなされている。

特に、近年、コンテンツに対して、感性的な情報（以下、ラベルという）をメタデータとして付与するなどして、ユーザの感情（ムード）に適したコンテンツを検索して推薦するようにしたもの（例えば、特許文献１参照）や、ユーザの指定したコンテクスト（ユーザの状況、状態を表すもの）に対応するムードのラベルを有するコンテンツを検索して推薦するようにしたものが提案されている（例えば、特許文献２参照）。

特開２００７−１７２５２３号公報特開２００７−２０７２１８号公報

しかしながら、上述したようなコンテンツの検索に用いられるラベルの候補として、どのようなラベルを用意すべきかを一概に決めることは容易ではない。

具体的には、ラベルの候補として重複（類似）のないものを用意するのが望ましいが、類似の有無を評価することは、手間がかかり面倒である。

また、国や文化が異なる場合、ラベルを表す単語を翻訳することで、コンテンツの検索に用いることが考えられた。例えば、コンテンツとしての楽曲に、日本語の「幸せ」がメタデータとして付与されている場合、アメリカにおいては、辞書によって日本語の「幸せ」に対応付けられている英語の「Happy」により、そのコンテンツが検索される。

しかしながら、日本において「幸せ」が付与されている楽曲は、テンポが遅く、打楽器が少なく、コード進行が緩やかである一方、アメリカにおいて「happy」が付与されている楽曲は、テンポが速く、打楽器が多い。このように、国や文化が異なると、人間の感性も異なるため、ラベルの単純な翻訳で、所望のコンテンツを正確に検索できるとは限らない。

そこで、国や文化圏毎にラベルを予め用意してコンテンツに付与することが考えられるが、これもまた手間がかかる上に、その国の言語や文化を理解していないとラベルを正確に扱うことすらできない。

本発明はこのような状況に鑑みてなされたものであり、所定のコンテンツに対して、国や文化が異なる場合であっても、感性的な情報を正確に付与することができるようにするものである。

本発明の一側面の情報処理装置は、コンテンツに対するユーザの主観的な評価を表すラベルがメタデータとして付与されている複数の前記コンテンツに付与されている前記ラベルのうち、前記コンテンツへの評価の信頼度が高い前記ラベルを選択する選択手段と、前記選択手段によって選択された前記ラベル間の類似度を算出する算出手段と、前記算出手段によって算出された前記類似度に基づいて、前記ラベルをクラスタリングするクラスタリング手段と、前記クラスタリング手段によってクラスタリングされた前記ラベルが付与されている前記コンテンツの特徴量に基づいて、前記コンテンツの前記クラスタへの該当を判別するための判別器であるクラスタ判別器、および、前記コンテンツの、クラスタリングされた前記ラベルへの該当を判別するための判別器であるラベル判別器を生成する生成手段と、前記ラベル判別器の判別精度より、前記クラスタ判別器の判別精度の方が良い場合、前記クラスタリング手段によるクラスタリングの結果得られたクラスタを１つのラベルとして記憶する記憶手段とを備える。

前記算出手段には、前記選択手段によって選択された前記ラベルと、前記クラスタリング手段によって予め得られた既存クラスタとの間の類似度を算出させ、前記クラスタリング手段には、前記類似度に基づいて、前記ラベルを前記既存クラスタにクラスタリングさせることができる。

前記生成手段には、前記ラベルが前記既存クラスタにクラスタリングされた新規クラスタについての判別器である新規クラスタ判別器を生成させ、前記記憶手段には、前記既存クラスタについての前記クラスタ判別器の判別精度より、前記新規クラスタ判別器の判別精度の方が良い場合、前記新規クラスタを１つのラベルとして記憶させることができる。

前記情報処理装置には、コンテンツを評価するために入力された前記ラベルが、前記クラスタリング手段によるクラスタリングの結果得られた前記クラスタに含まれる場合、前記クラスタに含まれる、入力された前記ラベル以外のラベルを前記コンテンツに付与する付与手段をさらに設けることができる。

前記ラベルは、複数の異なる言語で与えられるようにすることができる。

本発明の一側面の情報処理方法は、コンテンツに対するユーザの主観的な評価を表すラベルがメタデータとして付与されている複数の前記コンテンツに付与されている前記ラベルのうち、前記コンテンツへの評価の信頼度が高い前記ラベルを選択する選択手段と、前記選択手段によって選択された前記ラベル間の類似度を算出する算出手段と、前記算出手段によって算出された前記類似度に基づいて、前記ラベルをクラスタリングするクラスタリング手段と、前記クラスタリング手段によってクラスタリングされた前記ラベルが付与されている前記コンテンツの特徴量に基づいて、前記コンテンツの前記クラスタへの該当を判別するための判別器であるクラスタ判別器、および、前記コンテンツの、クラスタリングされた前記ラベルへの該当を判別するための判別器であるラベル判別器を生成する生成手段と、前記ラベル判別器の判別精度より、前記クラスタ判別器の判別精度の方が良い場合、前記クラスタリング手段によるクラスタリングの結果得られたクラスタを１つのラベルとして記憶する記憶手段とを備える情報処理装置の情報処理方法であって、前記選択手段が、コンテンツに対するユーザの主観的な評価を表すラベルがメタデータとして付与されている複数の前記コンテンツに付与されている前記ラベルのうち、評価の信頼度が高い前記ラベルを選択する選択ステップと、前記算出手段が、前記選択ステップの処理によって選択された前記ラベル間の類似度を算出する算出ステップと、前記クラスタリング手段が、前記算出ステップの処理によって算出された前記類似度に基づいて、前記ラベルをクラスタリングするクラスタリングステップと、前記生成手段が、前記クラスタリングステップの処理によってクラスタリングされた前記ラベルが付与されている前記コンテンツの特徴量に基づいて、前記コンテンツの前記クラスタへの該当を判別するための判別器であるクラスタ判別器、および、前記コンテンツの、クラスタリングされた前記ラベルへの該当を判別するための判別器であるラベル判別器を生成する生成ステップと、前記記憶手段が、前記ラベル判別器の判別精度より、前記クラスタ判別器の判別精度の方が良い場合、前記クラスタリングステップの処理によるクラスタリングの結果得られたクラスタを１つのラベルとして記憶する記憶ステップとを含む。

本発明の一側面のプログラムは、コンテンツに対するユーザの主観的な評価を表すラベルがメタデータとして付与されている複数の前記コンテンツに付与されている前記ラベルのうち、前記コンテンツへの評価の信頼度が高い前記ラベルを選択する選択手段と、前記選択手段によって選択された前記ラベル間の類似度を算出する算出手段と、前記算出手段によって算出された前記類似度に基づいて、前記ラベルをクラスタリングするクラスタリング手段と、前記クラスタリング手段によってクラスタリングされた前記ラベルが付与されている前記コンテンツの特徴量に基づいて、前記コンテンツの前記クラスタへの該当を判別するための判別器であるクラスタ判別器、および、前記コンテンツの、クラスタリングされた前記ラベルへの該当を判別するための判別器であるラベル判別器を生成する生成手段と、前記ラベル判別器の判別精度より、前記クラスタ判別器の判別精度の方が良い場合、前記クラスタリング手段によるクラスタリングの結果得られたクラスタを１つのラベルとして記憶する記憶手段とを備える情報処理装置を制御するコンピュータに、前記選択手段が、コンテンツに対するユーザの主観的な評価を表すラベルがメタデータとして付与されている複数の前記コンテンツに付与されている前記ラベルのうち、評価の信頼度が高い前記ラベルを選択する選択ステップと、前記算出手段が、前記選択ステップの処理によって選択された前記ラベル間の類似度を算出する算出ステップと、前記クラスタリング手段が、前記算出ステップの処理によって算出された前記類似度に基づいて、前記ラベルをクラスタリングするクラスタリングステップと、前記生成手段が、前記クラスタリングステップの処理によってクラスタリングされた前記ラベルが付与されている前記コンテンツの特徴量に基づいて、前記コンテンツの前記クラスタへの該当を判別するための判別器であるクラスタ判別器、および、前記コンテンツの、クラスタリングされた前記ラベルへの該当を判別するための判別器であるラベル判別器を生成する生成ステップと、前記記憶手段が、前記ラベル判別器の判別精度より、前記クラスタ判別器の判別精度の方が良い場合、前記クラスタリングステップの処理によるクラスタリングの結果得られたクラスタを１つのラベルとして記憶する記憶ステップとを含む処理を実行させる。

本発明の一側面においては、コンテンツに対するユーザの主観的な評価を表すラベルがメタデータとして付与されている複数のコンテンツに付与されているラベルのうち、評価の信頼度が高いラベルが選択され、選択されたラベル間の類似度が算出され、算出された類似度に基づいて、ラベルがクラスタリングされ、クラスタリングされたラベルが付与されているコンテンツの特徴量に基づいて、コンテンツのクラスタへの該当を判別するための判別器であるクラスタ判別器、および、コンテンツの、クラスタリングされたラベルへの該当を判別するための判別器であるラベル判別器が生成され、ラベル判別器の判別精度より、クラスタ判別器の判別精度の方が良い場合、クラスタリングの結果得られたクラスタが１つのラベルとして記憶される。

本発明の一側面によれば、所定のアイテムに対して、国や文化が異なる場合であっても、感性的な情報を正確に付与することが可能となる。

本発明を適用したシステムの一実施の形態の構成を示すブロック図である。サーバのハードウェア構成例を示すブロック図である。サーバの機能構成例を示すブロック図である。ラベル管理部の構成例を示す図である。類似度算出部の処理について説明する図である。類似度算出部の処理について説明する図である。ラベルの例を示す図である。精度計算部の処理について説明する図である。翻訳リストについて説明する図である。ラベルのクラスタリング処理の例について説明するフローチャートである。ラベルのクラスタリング処理の他の例について説明するフローチャートである。ラベルの付与処理について説明するフローチャートである。

以下、本発明の実施の形態について図を参照して説明する。

［システムの構成について］
図１は、本発明を適用したシステムの一実施の形態の構成を示す図である。ネットワーク１には、サーバ２、端末３−１乃至３−Ｎが接続されている。図１に示されるシステムは、ユーザによって検索された所定のコンテンツ（例えば、楽曲、番組、商品など）を、ユーザに提示するシステムである。ネットワーク１は、インターネットやLAN（Local Area Network）などから構成される。

サーバ２は、ユーザによって検索されるコンテンツを蓄積したり、ユーザがコンテンツを検索するための情報をコンテンツに付与したりする。端末３−１乃至３−Ｎは、ユーザ側の端末である。例えば、ユーザが、端末３−１によりコンテンツを検索するための情報を入力したとき、サーバ２では、その情報に基づいてコンテンツが検索され、ネットワーク１を介して端末３−１に供給される。

以下の説明において、端末３−１乃至３−Ｎを個々に区別する必要がない場合、単に、端末３という。また、図１においては、サーバ２を１つしか記載していないが、複数設けることももちろん可能である。

［サーバのハードウェア構成について］
次に、図２を参照して、サーバ２のハードウェア構成について説明する。

CPU（Central Processing Unit）２１は、ROM（Read Only Memory）２２、または記憶部２８に記憶されているプログラムに従って各種の処理を実行する。RAM（Random Access Memory）２３には、CPU２１が実行するプログラムやデータなどが適宜記憶される。これらのCPU２１、ROM２２、およびRAM２３は、バス２４により相互に接続されている。

CPU２１にはまた、バス２４を介して入出力インタフェース２５が接続されている。入出力インタフェース２５には、キーボード、マウス、マイクロホンなどよりなる入力部２６、ディスプレイ、スピーカなどよりなる出力部２７が接続されている。CPU２１は、入力部２６から入力される指令に対応して各種の処理を実行する。そして、CPU２１は、処理の結果を出力部２７に出力する。

入出力インタフェース２５に接続されている記憶部２８は、例えばハードディスクからなり、CPU２１が実行するプログラムや各種のデータを記憶する。通信部２９は、ネットワーク１を介して外部の装置（例えば、端末３）と通信することで、外部の装置からの指令を入力したり、外部の装置へ情報を出力する。また、通信部２９を介してプログラムを取得し、記憶部２８に記憶してもよい。

入出力インタフェース２５に接続されているドライブ３０は、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリなどのリムーバブルメディア３１が装着されたとき、それらを駆動し、そこに記録されているプログラムやデータなどを取得する。取得されたプログラムやデータは、必要に応じて記憶部２８に転送され、記憶される。

なお、端末３は、基本的にサーバ２と同様に構成することができるので、ここでは、その説明を省略する。

［サーバの機能構成について］
次に、図３を参照して、サーバ２の機能構成例について説明する。

図３のサーバ２は、ラベル管理部５１、ラベル付与部５２、コンテンツDB（Database）５３、および提示部５４から構成される。ラベル管理部５１およびラベル付与部５２は、CPU２１（図２）が所定のプログラムを実行することによって実現される。

ラベル管理部５１は、コンテンツに付与されるメタデータである感性ラベル（以下、単にラベルという）を管理し、必要に応じてラベル付与部５２または提示部５４に供給する。ラベル管理部５１の詳細については後述する。

ラベルは、コンテンツに対するユーザの主観的な評価（感性）を表す情報である。より具体的には、ラベルには、コンテンツに対するユーザの感情を表すムード、ユーザの状況を表すコンテクスト、ユーザの活動を表すアクティビティなどを表すものがある。

ラベル付与部５２は、ユーザによる端末３からの指令に基づいて、記憶部２８（図２）に対応するコンテンツDB５３に蓄積（記憶）されているコンテンツを読み出し、そのコンテンツに対して、ラベル管理部５１に管理されているラベルをメタデータとして付与する。ラベル付与部５２は、ラベルを付与したコンテンツを、再度、コンテンツDB５３に記憶させたり、提示部５４に供給する。

提示部５４は、図２の出力部２７および通信部２９に対応する機能を有する。出力部２７としての提示部５４は、端末３からの指令に基づいて読み出された、ラベル管理部５１により管理されているラベルや、コンテンツDB５３に蓄積されているコンテンツを表示する。また、通信部２９としての提示部５４は、端末３からの指令に基づいて読み出された、ラベル管理部５１により管理されているラベルや、コンテンツDB５３に蓄積されているコンテンツを、ネットワーク１を介して端末３に供給する。端末３に供給されたコンテンツは、端末３の図示せぬ出力部（ディスプレイなど）に表示される。

［ラベル管理部の構成について］
次に、図４を参照して、ラベル管理部５１の詳細な構成について説明する。

ラベル管理部５１は、コンテンツ取得部７１、ラベル選択部７２、類似度算出部７３、クラスタリング部７４、判別器生成部７５、精度計算部７６、およびラベルDB７７から構成される。

コンテンツ取得部７１は、コンテンツDB５３（図３）や、ネットワーク１上の端末３または他のサーバ等に蓄積されている大量のコンテンツの中から、所定量のコンテンツを取得し、保持する。例えば、コンテンツが楽曲である場合、コンテンツ取得部７１は、様々なジャンル（J-POP、ロック、クラシック、演歌など）の楽曲を取得する。

コンテンツ取得部７１によって取得されるコンテンツには、１または複数のユーザ（ボランティア）によって、メタデータとしてのラベルが予め付与されている。このラベルは、国（言語）や文化を問わず多数用意され、ボランティアのコンテンツに対する評価として、コンテンツに付与される。具体的には、例えば、ある日本人がある楽曲Ａを聞いて「幸せ」な気分になった場合、楽曲Ａには日本語のラベル「幸せ」が付与され、あるアメリカ人がある楽曲Ｂを聞いて「happy」な気分になった場合、楽曲Ｂには英語のラベル「happy」が付与される。

コンテンツ取得部７１によって取得されるコンテンツに付与されているラベルは、ボランティアによる端末３からの要求に応じて、サーバ２のコンテンツDB５３に蓄積されているコンテンツに付与されたり、ネットワーク１上のコンテンツに付与される。

また、コンテンツ取得部７１によって取得されるコンテンツには、そのコンテンツについての物理的（客観的）特徴量（以下、単に特徴量という）が予め付与されている。例えば、コンテンツが楽曲である場合、楽曲のテンポ、コード進行、音の立ち上がり、楽曲についての説明文等から抽出されたキーワードなどが、特徴量として楽曲に付与されている。

ラベル選択部７２は、コンテンツ取得部７１によって取得された所定量のコンテンツに付与されているラベルのうち、コンテンツへの評価の信頼度が高いラベルを選択し、類似度算出部７３に供給する。

より具体的には、例えば、ラベル選択部７２は、コンテンツ取得部７１によって取得されたコンテンツに付与されているラベルのうち、付与されているコンテンツが極端に少ないラベルを除いたラベルを選択する。また、例えば、複数のボランティアによってラベルが付与されている場合、ラベル選択部７２は、コンテンツ取得部７１によって取得されたコンテンツに付与されているラベルのうち、ボランティアによるラベルの付与（コンテンツに対する評価）の傾向（レイティング）にばらつきがあるラベルを除いたラベルを選択する。

類似度算出部７３は、ラベル選択部７２から供給された各ラベル間の類似度を算出する。

例えば、類似度算出部７３は、ラベル選択部７２からの各ラベルのレイティングの相関を求めることで類似度を算出する。

ここで、図５を参照して、ラベル間の類似度の算出について説明する。

図５においては、ムードを表すラベルと、そのラベルが用いられている国を表すコードとが対応付けて示されている。より具体的には、「US」（アメリカ）と英語の「happy」、「DE」（ドイツ）とドイツ語の「gelungen」、「JP」（日本）と日本語の「幸せ」、「US」（アメリカ）と英語の「mellow」が、それぞれ対応付けられている。このように、ラベルは、世界中の各国（言語）について与えられている。

そして、類似度算出部７３によれば、「happy」と「gelungen」との間で、例えば５段階評価などの相関や一致率が高い場合、「happy」と「gelungen」の類似度（レイティングの相関）が高いとされる。また、「幸せ」と「mellow」との間で、例えば５段階評価などの相関や一致率が高い場合、「幸せ」と「mellow」の類似度が高いとされる。

また、類似度算出部７３は、ラベル選択部７２からの各ラベルが付与されていたコンテンツの特徴量に基づいて、各ラベル間の類似度を算出するようにすることもできる。

ここで、図６を参照して、各ラベルが付与されていたコンテンツの特徴量に基づいた、ラベル間の類似度の算出について説明する。

図６においては、図５と同様のラベルが示されているが、さらに、それぞれのラベルの右側には、そのラベルが付与されていたコンテンツの特徴量が示されている。なお、それぞれのラベルが付与されていたコンテンツは１つに限らないので、図６において示されているコンテンツの特徴量は、例えば、そのラベルが付与されていた複数のコンテンツの特徴量を数値化したものを平均して３段階（High，Medium，Low）に分類したものとする。

より具体的には、図６に示されるように、「happy」が付与されていたコンテンツの特徴量としてのテンポ、コードチェンジ、およびパーカッションは、それぞれHigh、High、およびMediumとなっている。これは、「happy」が付与されていたコンテンツは、テンポが速く、コードチェンジが多く、打楽器がやや多いという特徴を有する傾向にあることを示している。

また、「gelungen」が付与されていたコンテンツの特徴量としてのテンポ、コードチェンジ、およびパーカッションは、それぞれHigh、High、およびHighとなっている。これは、「gelungen」が付与されていたコンテンツは、テンポが速く、コードチェンジが多く、打楽器が多いという特徴を有する傾向にあることを示している。

さらに、「幸せ」が付与されていたコンテンツの特徴量としてのテンポ、コードチェンジ、およびパーカッションは、それぞれLow、Low、およびLowとなっている。これは、「幸せ」が付与されていたコンテンツは、テンポが遅く、コードチェンジが少なく、打楽器が少ないという特徴を有する傾向にあることを示している。

また、「mellow」が付与されていたコンテンツの特徴量としてのテンポ、コードチェンジ、およびパーカッションは、それぞれLow、Medium、およびLowとなっている。これは、「mellow」が付与されていたコンテンツは、テンポが遅く、コードチェンジがやや多く、打楽器が少ないという特徴を有する傾向にあることを示している。

そして、類似度算出部７３によれば、「happy」が付与されていたコンテンツの特徴量と、「gelungen」が付与されていたコンテンツの特徴量との類似度が高く、「幸せ」が付与されていたコンテンツの特徴量と、「mellow」が付与されていたコンテンツの特徴量との類似度が高いとされる。

このようにして、類似度算出部７３は、ラベル選択部７２からの各ラベル間の類似度を算出し、各ラベルとその類似度を表す情報をクラスタリング部７４に供給する。

なお、類似度算出部７３は、上述で説明した手法に限らず、他の手法によりラベル間の類似度を算出するようにしてもよい。

また、図５および図６では、ムードを表すラベル間の類似度の算出について説明したが、類似度算出部７３は、図７に示されるような、コンテクストやアクティビティを表すラベル間の類似度を算出することもできる。

図７は、コンテクストやアクティビティを表すラベルの例を示している。

図７においては、コンテクストまたはアクティビティを表すラベルと、そのラベルが用いられている国のコードとが対応付けて示されている。より具体的には、図７の上から順番に、「DE」とドイツ語の「aggressiv」、「DE」とドイツ語の「sport」、「JP」と日本語の「落ち着かない」、「JP」と日本語の「勇敢な」、「JP」と日本語の「ジョギング」、「US」と英語の「aggressive」、「US」と英語の「Sports」が、それぞれ対応付けられている。

そして、類似度算出部７３は、図７で示されるようなラベル間の類似度を、各ラベルのレイティングの相関として算出したり、各ラベルが付与されていたコンテンツの特徴量に基づいて算出することができる。

さらに、類似度算出部７３は、ラベル間の類似度だけでなく、ラベルDB７７に蓄積されている、所定のラベルがクラスタリング（グループ化）されたクラスタと、別個に取得されたラベルとの間の類似度を算出する。

ラベルのクラスタリングについては後述するが、所定のラベルがクラスタリングされたクラスタは、個々のラベルと同様に扱うことができる。類似度算出部７３は、ラベルとクラスタとの間の類似度を、それぞれのレイティングの相関として算出したり、それぞれが付与されていたコンテンツの特徴量に基づいて算出することができる。

そして、類似度算出部７３は、算出したラベルとクラスタとの間の類似度を表す情報を、そのラベルおよびクラスタとともに、クラスタリング部７４に供給する。

クラスタリング部７４は、類似度算出部７３からの各ラベルとその類似度を表す情報に基づいて、ラベルをクラスタリングし、その結果得られたクラスタ（ラベルのグループ）を判別器生成部７５に供給する。

例えば、クラスタリング部７４は、類似度算出部７３からのラベル間で、類似度が高いラベルのペアを１つのクラスタとする。より具体的には、クラスタリング部７４は、図５および図６で、類似度が高いとされた「happy」および「gelungen」のペアと、「幸せ」および「mellow」のペアとを、それぞれ１つのクラスタとする。なお、クラスタリングされるラベルは、ペア（２つのラベル）に限らず、３つ以上のラベルがクラスタリングされるようにしてももちろんよい。

また、クラスタリング部７４は、類似度算出部７３からラベルとクラスタとの間の類似度を表す情報が供給され、その類似度が所定の値より大きい場合、ラベルをクラスタにクラスタリングすることで新たなクラスタを得て、判別器生成部７５に供給する。

判別器生成部７５は、クラスタリング部７４からのクラスタに含まれるラベルが付与されていたコンテンツの特徴量に基づいて、コンテンツの、クラスタへの該当／非該当を機械学習によって判別するための判別器であるクラスタ判別器を生成する。また、判別器生成部７５は、クラスタリング部７４からのクラスタに含まれるラベルが付与されていたコンテンツの特徴量に基づいて、コンテンツの、クラスタに含まれる各ラベルへの該当／非該当を機械学習によって判別するための判別器であるラベル判別器を、ラベル毎に生成する。判別器生成部７５は、生成した判別器を精度計算部７６に供給する。

例えば、判別器生成部７５は、クラスタリング部７４から、「happy」および「gelungen」からなるクラスタが供給された場合、「happy」および「gelungen」のそれぞれが付与されていたコンテンツの特徴量を、コンテンツ取得部７１から取得し、その特徴量に基づいて、「happy」および「gelungen」からなるクラスタのクラスタ判別器と、「happy」および「gelungen」のそれぞれのラベルのラベル判別器とを生成する。

また、例えば、判別器生成部７５は、クラスタリング部７４から、ラベルとクラスタとからなる新たなクラスタが供給された場合、ラベルおよびクラスタに含まれる各ラベルのそれぞれが付与されていたコンテンツの特徴量を、コンテンツ取得部７１から取得し、その特徴量に基づいて、新たなクラスタのクラスタ判別器を生成（再生成）する。

精度計算部７６は、判別器生成部７５から供給された判別器の判別精度を計算する。

より具体的には、精度計算部７６は、判別器生成部７５から、クラスタ判別器とクラスタに含まれるラベル毎のラベル判別器とが供給された場合、クラスタ判別器の判別精度と、各ラベルのラベル判別器の判別精度とを求め、比較する。比較の結果、クラスタ判別器の判別精度の方が高い場合、精度計算部７６は、クラスタを１つのラベルとして、ラベルDB７７に供給する。一方、各ラベルのラベル判別器の判別精度の方が高い場合、精度計算部７６は、クラスタに含まれる各ラベルをラベルDB７７に供給する。

ここで、図８を参照して、精度計算部７６の処理の具体例について説明する。

図８の左側に示されるように、精度計算部７６は、例えば、３つのラベル（「DE」の「dark」、「US」の「angry」、および「US」の「dark」）それぞれのラベル判別器の判別精度を求める。図８においては、「DE」の「dark」のラベル判別器の判別精度は0.62、「US」の「angry」のラベル判別器の判別精度は0.43、「US」の「dark」のラベル判別器の判別精度は0.39となっている。さらに、精度計算部７６は、この３つのラベルについてのラベル判別器の判別精度より、その平均値（Average）0.48を求める。

さらに、精度計算部７６は、３つのラベルがクラスタリングされたクラスタのクラスタ判別器の判別精度（Cluster）0.79を求め、３つのラベル判別器の判別精度の平均値と比較する。

この場合、３つのラベル判別器の判別精度の平均値0.48と、クラスタ判別器の判別精度0.79とを比較すると、クラスタ判別器の判別精度0.79の方が大きいので、精度計算部７６は、３つのラベルがクラスタリングされたクラスタを１つのラベルとして、ラベルDB７７に供給する。

このようにして得られるクラスタは、国（言語）や文化を問わず、人間の感性（主観的な評価）に基づいてクラスタリングされたラベルからなる。

また、図８の右側に示されるように、精度計算部７６は、例えば、図７で示された７つのラベルそれぞれのラベル判別器の判別精度を求める。図８においては、「DE」の「aggressiv」のラベル判別器の判別精度は0.73、「DE」の「sport」のラベル判別器の判別精度は0.77、「JP」の「落ち着かない」のラベル判別器の判別精度は0.66、「JP」の「勇敢な」のラベル判別器の判別精度は0.69、「JP」の「ジョギング」のラベル判別器の判別精度は0.74、「US」の「aggressive」のラベル判別器の判別精度は0.78、「US」の「Sports」のラベル判別器の判別精度は0.78となっている。さらに、精度計算部７６は、この７つのラベルについてのラベル判別器の判別精度より、その平均値（Average）0.74を求める。

さらに、精度計算部７６は、７つのラベルがクラスタリングされたクラスタのクラスタ判別器の判別精度（Cluster）0.62を求め、７つのラベル判別器の判別精度の平均値と比較する。

この場合、７つのラベル判別器の判別精度の平均値0.74と、クラスタ判別器の判別精度0.62とを比較すると、ラベル判別器の判別精度の平均値0.74の方が大きいので、精度計算部７６は、７つのラベルそれぞれをラベルDB７７に供給する。

なお、精度計算部７６によって求められた判別器の精度は、判別器毎に、精度計算部７６内の図示せぬ記憶部に保持されるものとする。

また、精度計算部７６は、判別器生成部７５から、再生成されたクラスタ判別器が供給された場合、再生成されたクラスタ判別器についての判別精度を求め、再生成される前の（図示せぬ記憶部に保持されている）クラスタ判別器の判別精度と比較する。比較の結果、再生成されたクラスタ判別器についての判別精度の方が高い場合、精度計算部７６は、新たなクラスタを１つのラベルとして、ラベルDB７７に供給する。一方、再生成される前のクラスタ判別器についての判別精度の方が高い場合、精度計算部７６は、クラスタリングされる前のクラスタをラベルDB７７に供給する。

ラベルDB７７には、精度計算部７６から供給されたクラスタおよびラベルが蓄積（記憶）される。ラベルDB７７に蓄積されたクラスタは、ラベルと同様に扱われ、ラベル付与部５２に読み出され、所定のコンテンツに付与される。また、逆に、ラベルDB７７に蓄積された、最終的にクラスタリングされなかったラベルは、それぞれ１つのクラスタとして扱われる。なお、ラベルDB７７に蓄積されているクラスタ（ラベル）は、適宜、類似度算出部７３に読み出され、ラベルとの類似度が算出される。

また、ラベルDB７７には、クラスタに含まれる各国の言語のラベルを対応付けた翻訳リスト７７ａが保持されている。

ここで、図９を参照して、翻訳リスト７７ａの例について説明する。

図９に示されるように、翻訳リスト７７ａにおいては、５つのクラスタ（Cluster１乃至５）のそれぞれについて、各クラスタに含まれる、英語（「US」）、ドイツ語（「DE」）、日本語（「JP」）のラベルが対応付けられている。

より具体的には、Cluster１に含まれるラベルとして、英語の「happy」およびドイツ語の「gelungen」が対応付けられており、Cluster２に含まれるラベルとして、英語の「angry」およびドイツ語の「dunkel」が対応付けられている。また、Cluster３に含まれるラベルとして、英語の「mellow」および日本語の「幸せ」が対応付けられており、Cluster４に含まれるラベルとしては、日本語の「ほのぼの」のみが示されている。そして、Cluster５に含まれるラベルとして、英語の「aggressive」および「Sports」、ドイツ語の「aggressiv」、並びに日本語の「落ち着かない」および「ジョギング」が対応付けられている。

このような翻訳リスト７７ａは、ユーザが、端末３よりコンテンツDB５３のコンテンツに対してラベルを付与する際にラベル付与部５２によって参照されたり、ラベルが付与されたコンテンツを表示する際に提示部５４によって参照される。

例えば、ドイツ語を理解できないアメリカ人が、ドイツ滞在中などに、ある楽曲に対するラベルとして、英語の「happy」に対応するドイツ語のラベルを付与しようとする場合、図９の翻訳リスト７７ａによれば、「happy」と同一クラスタ（Cluster１）に含まれる「gelungen」がその楽曲に付与されるようになる。

また、例えば、英語を理解できない日本人が、アメリカ滞在中などに、ある楽曲に対するラベルとして、日本語の「落ち着かない」に対応する英語のラベルを付与しようとする場合、図９の翻訳リスト７７ａによれば、「落ち着かない」と同一クラスタ（Cluster５）に含まれる「aggressive」がその楽曲に付与されるようになる。

［ラベルのクラスタリング処理の例］
次に、図１０のフローチャートを参照して、上述したサーバ２によるラベルのクラスタリング処理について説明する。

図１０のフローチャートを参照して説明するラベルのクラスタリング処理は、ラベルDB７７にクラスタが十分に蓄積されていない、サーバ２の初期状態などに実行される。

ステップＳ１１において、コンテンツ取得部７１は、コンテンツDB５３や、ネットワーク１上の端末３または他のサーバ等に蓄積されている大量のコンテンツの中から、所定量のコンテンツを取得する。

ステップＳ１２において、ラベル選択部７２は、コンテンツ取得部７１によって取得されたコンテンツに付与されているラベルのうち、付与されているコンテンツが極端に少ないか、または、ボランティアによるレイティングにばらつきがあるラベルを除いたラベルを選択し、類似度算出部７３に供給する。

ステップＳ１３において、類似度算出部７３は、ラベル選択部７２から供給された各ラベル間の類似度を算出し、各ラベルとその類似度を表す情報をクラスタリング部７４に供給する。

ステップＳ１４において、クラスタリング部７４は、類似度算出部７３からの各ラベルとその類似度を表す情報を基に、k-means法や相関規則に基づいた手法により、類似度が高いラベルをクラスタリングし、得られたクラスタを判別器生成部７５に供給する。なお、ここで、ラベルがクラスタリングされることで、複数のクラスタが得られる場合、ステップＳ１４以降の処理は、それぞれのクラスタについて並行して実行されることとする。

ステップＳ１５において、判別器生成部７５は、クラスタリング部７４からのクラスタに含まれるラベルが付与されていたコンテンツの特徴量に基づいて、クラスタについてのクラスタ判別器を生成し、精度計算部７６に供給する。

ステップＳ１６において、判別器生成部７５は、クラスタリング部７４からのクラスタに含まれるラベルが付与されていたコンテンツの特徴量に基づいて、クラスタリングされる前のラベルについてのラベル判別器を、ラベル毎に生成し、精度計算部７６に供給する。

ステップＳ１７において、精度計算部７６は、判別器生成部７５からのクラスタ判別器およびラベル判別器それぞれの判別精度を計算し、比較する。ここでは、精度計算部７６は、Cross Validationなどにより、AccuracyやＦ値などその都度適切なものを判別精度として計算する。

ステップＳ１８において、精度計算部７６は、クラスタ判別器の判別精度とラベル判別器の判別精度との比較の結果、クラスタ判別器の判別精度の方が良いか否かを判定する。

ステップＳ１８において、クラスタ判別器の判別精度の方が良いと判定された場合、処理はステップＳ１９に進み、精度計算部７６は、クラスタを１つのラベルとして、ラベルDB７７に供給し、記憶させる。

一方、ステップＳ１８において、クラスタ判別器の判別精度の方が良くないと判定された場合、すなわち、ラベル判別器についての判別精度の方が高い場合、処理はステップＳ２０に進み、精度計算部７６は、クラスタに含まれる各ラベルをラベルDB７７に供給し、記憶させる。

以上の処理によれば、異なる言語のラベルが、ラベル間の類似度に基づいてグループ化されるようになる。これにより、例えば、ユーザが全く理解できない言語を用いる国において、所定のコンテンツに対する評価としてラベルを付与する場合、自国語のラベルに対応するその国のラベルが容易に選択されるようになる。したがって、所定のコンテンツに対して、国や文化が異なる場合であっても、感性的な情報を正確に付与することができる。

特に、ラベル間の類似度の算出において、レイティングの相関を用いるようにした場合には、ボランティアによるコンテンツに対する評価の傾向が近いラベルがクラスタリングされるので、人間により近い観点でラベルをグループ化することができる。すなわち、異なる言語であっても類似した感性を表すラベルをグループ化することができるので、所定のコンテンツに対して、国や文化が異なる場合であっても、感性的な情報を正確に付与することが可能となる。

なお、図１０のフローチャートのステップＳ１４において複数のクラスタが得られる場合、それ以降の処理はそれぞれのクラスタについて並行して実行されるようにしたが、類似度が最も高いラベルのペアをクラスタリングすることにより、１つのクラスタのみを得るようにもできる。この場合、ステップＳ１９で記憶されたクラスタまたはステップＳ２０で記憶されたラベルと、クラスタリングされなかったラベルとの間の類似度を再度算出するようにして、ステップＳ１３以降の処理が繰り返し実行されるようにしてもよい。

以上においては、ラベルDB７７にクラスタが十分に蓄積されていないような初期状態などにおいて、一括でラベルをクラスタリングする処理について説明した。以下においては、比較的十分な数のクラスタが蓄積された状態から、さらにラベルが追加される場合の処理について説明する。

［ラベルのクラスタリング処理の他の例］
そこで、図１１のフローチャートを参照して、比較的十分な数のクラスタが蓄積された状態から、さらにラベルが追加される場合のラベルのクラスタリング処理について説明する。

ステップＳ３１において、コンテンツ取得部７１は、コンテンツDB５３や、ネットワーク１上の端末３または他のサーバ等に蓄積されている大量のコンテンツの中から、所定量のコンテンツを取得する。

ステップＳ３２において、ラベル選択部７２は、コンテンツ取得部７１によって取得されたコンテンツに付与されているラベルのうち、付与されているコンテンツが極端に少ないか、または、ボランティアによるレイティングにばらつきがあるラベルを除いたラベルを選択し、類似度算出部７３に供給する。

ステップＳ３３において、類似度算出部７３は、ラベルDB７７に蓄積されているクラスタ（以下、既存クラスタという）を取得し、ラベル選択部７２から供給されたラベルと既存クラスタとの間の類似度を算出する。既存クラスタには、複数のラベルがクラスタリングされたものもあれば、１つのラベルからなるクラスタもある。

ステップＳ３４において、類似度算出部７３は、ステップＳ３３で算出した類似度の中で、最大となる類似度が所定値より大きいか否かを判定する。

ここで、所定値は、予め設定された値としてもよいし、一括でラベルがクラスタリングされることで得られたクラスタ（図１０のフローチャートのステップＳ１９で記憶されたクラスタ）について算出された類似度の最低値や平均値などとしてもよい。

ステップＳ３４において、最大となる類似度が所定値より大きいと判定された場合、類似度算出部７３は、その最大となる類似度が算出されたラベルおよび既存クラスタを、クラスタリング部７４に供給し、処理はステップＳ３５に進む。

ステップＳ３５において、クラスタリング部７４は、類似度算出部７３からのラベルおよび既存クラスタについて、ラベルを既存クラスタにクラスタリングすることで新たなクラスタ（以下、新規クラスタという）を得て、判別器生成部７５に供給する。

ステップＳ３６において、判別器生成部７５は、クラスタリング部７４からの新規クラスタに含まれるラベル、および、既存クラスタにさらに含まれる各ラベルのそれぞれが付与されていたコンテンツの特徴量を、コンテンツ取得部７１から取得し、その特徴量に基づいて、新規クラスタのクラスタ判別器を生成（再生成）する。

ステップＳ３７において、精度計算部７６は、判別器生成部７５からの、再生成されたクラスタ判別器についての判別精度を計算する。さらに、精度計算部７６は、計算した再生成されたクラスタ判別器についての判別精度と、再生成される前の（図示せぬ記憶部に保持されている）クラスタ判別器の判別精度と比較する。

ステップＳ３８において、精度計算部７６は、再生成されたクラスタ判別器の判別精度と再生成される前のクラスタ判別器の判別精度との比較の結果、再生成されたクラスタ判別器の判別精度の方が良いか否かを判定する。

ここで、精度計算部７６は、判別精度の比較の結果、単に、再生成されたクラスタ判別器の判別精度の方が良いか否かを判定するようにしてもよいし、再生成されたクラスタ判別器の判別精度の値が、再生成される前のクラスタ判別器の判別精度の値より、例えば、再生成される前のクラスタ判別器の判別精度の値の15％など一定値以上大きいか否かを判定するようにしてもよい。

また、例えば、精度計算部７６は、再生成されたクラスタ判別器の判別精度と、図示せぬ記憶部に保持されている全てのクラスタ判別器の判別精度とを比較し、再生成されたクラスタ判別器の判別精度が、図示せぬ記憶部に保持されている全てのクラスタ判別器の判別精度より良いか否かを判定するなどしてもよい。

すなわち、ステップＳ３８においては、最終的に保持される全てのクラスタ判別器の平均判別精度が悪くならないことが判定される。

ステップＳ３８において、再生成されたクラスタ判別器の判別精度の方が良いと判定された場合、処理はステップＳ３９に進み、精度計算部７６は、新規クラスタを１つのラベルとして、ラベルDB７７に供給し、記憶させる。その後、処理はステップＳ４６に進む。

一方、ステップＳ３８において、再生成されたクラスタ判別器の判別精度の方が良くないと判定された場合、すなわち、保持されている全てのクラスタ判別器の平均判別精度が悪くなるような場合、処理はステップＳ４０に進み、精度計算部７６は、既存クラスタを１つのラベルとしてラベルDB７７に供給し、再度記憶させる。ステップＳ４０の後、処理はステップＳ４６に進む。なお、ここで、ステップＳ３５において既存クラスタにクラスタリングされたラベルは削除されてもよいし、後述するステップＳ４１以降の処理の対象とされてもよい。

また、ステップＳ３４において、最大となる類似度が所定値より大きくないと判定された場合、類似度算出部７３は、その最大となる類似度が算出されたラベルおよび既存クラスタのうち、ラベルのみをクラスタリング部７４を介して、判別器生成部７５に供給する。このとき、クラスタリング部７４は、類似度算出部７３からのラベルに対して何の処理もせずに、判別器生成部７５に供給する。

ステップＳ４１において、判別器生成部７５は、類似度算出部７３からのラベルが付与されていたコンテンツの特徴量を、コンテンツ取得部７１から取得し、その特徴量に基づいて、そのラベルについてのラベル判別器を生成し、精度計算部７６に供給する。

ステップＳ４２において、精度計算部７６は、判別器生成部７５からのラベル判別器の判別精度を計算し、所定の基準値と比較する。

ここで、所定の基準値は、予め設定された値としてもよいし、例えば、ラベルDB７７に蓄積されているクラスタおよびラベルについてのクラスタ判別器およびラベル判別器の判別精度の最低値などとしてもよい。

ステップＳ４３において、精度計算部７６は、ラベル判別器の判別精度と所定の基準値との比較の結果、ラベル判別器の判別精度の方が良いか否かを判定する。

ステップＳ４３において、ラベル判別器の判別精度の方が良いと判定された場合、処理はステップＳ４４に進み、精度計算部７６は、そのラベル判別器のラベルをラベルDB７７に供給し、記憶させて、処理はステップＳ４６に進む。

一方、ステップＳ４３において、ラベル判別器の判別精度の方が良くないと判定された場合、処理はステップＳ４５に進み、精度計算部７６は、そのラベル判別器のラベルを削除する。その後、処理はステップＳ４６に進む。

ステップＳ４６において、類似度算出部７３は、ラベル選択部７２から供給された全てのラベルについて、ステップＳ３４以降の処理が実行されたか否かを判定する。

ステップＳ４６において、全てのラベルについて処理が実行されていないと判定された場合、処理はステップＳ３３に戻り、全てのラベルについて処理が実行されるまで、これ以降の処理が繰り返される。

なお、２回目以降のステップＳ３３においてラベルDB７７から取得される既存クラスタには、ステップＳ３９で記憶された新規クラスタ、ステップＳ４０で再度記憶された既存クラスタ、および、ステップＳ４４で記憶された１つのラベルも含まれる。

一方、ステップＳ４６において、全てのラベルについて処理が実行されたと判定された場合、ラベルのクラスタリング処理は終了する。

以上の処理によれば、異なる言語のラベルが、ラベルと既存クラスタとの間の類似度に基づいてグループ化されるようになる。これにより、例えば、ユーザが全く理解できない言語を用いる国において、所定のコンテンツに対する評価としてラベルを付与する場合、自国語のラベルに対応するその国のラベルが容易に選択されるようになる。したがって、所定のコンテンツに対して、国や文化が異なる場合であっても、感性的な情報を正確に付与することが可能となる。

また、追加されるラベルは、言語に関わらず、既存クラスタとの類似度に応じて、既存クラスタにクラスタリングされたり削除されるので、類似したラベルの有無を評価してラベルを用意したり、各言語について予めラベルを用意する必要がなく、ユーザが手間をかけることなくラベルを用意することができる。

なお、ステップＳ３２において選択されたラベルの数が一定数より多く、かつ、ステップＳ３３において算出される類似度の、例えば平均値が一定値より小さい場合には、図１０のフローチャートにおけるステップＳ１３以降の処理が実行されるようにしてもよい。これにより、選択されたラベルの多くが既存クラスタに含まれない場合には、新たに一括でラベルをクラスタリングするようにすることができる。

また、図１１のフローチャートを参照して説明したクラスタリング処理においては、選択した１つのラベルと既存クラスタとの類似度が最も大きい新規クラスタについて、判別器を生成し、その判別精度に応じて、新規クラスタを１つのラベルとするようにした。しかしながら、図１１のクラスタリング処理においては、例えば、選択した１つのラベルとの類似度が所定値より大きくなる複数の既存クラスタそれぞれについて、そのラベルとの新規クラスタを得るようにし、それぞれの新規クラスタについて生成した判別器のうち、最も判別精度のよい判別器の新規クラスタを１つのラベルとするようにもできる。

以上においては、異なる言語のラベルが、国や文化を問わず人間の感性に基づいてグループ化される、ラベルのクラスタリング処理について説明してきたが、以下においては、上述のようにしてクラスタリングされたラベルを、コンテンツに付与する処理について説明する。

［ラベルの付与処理の例］
そこで、図１２のフローチャートを参照して、サーバ２におけるラベル付与処理について説明する。なお、ラベル付与処理は、ユーザによって、端末３から、コンテンツDB５３に蓄積されているコンテンツを読み出し、そのコンテンツに対してラベルを付与する旨の指令が入力された後、ラベル付与部５２により、そのコンテンツが読み出されると実行される。

ステップＳ７１において、ラベル付与部５２は、ユーザによって、端末３から、コンテンツに付与するためにラベルが入力されたか否かを判定する。

ステップＳ７１において、ラベルが入力されていないと判定された場合、ラベルが入力されるまで、ステップＳ７１の処理は繰り返される。

一方、ステップＳ７１において、ラベルが入力されたと判定された場合、処理はステップＳ７２に進む。

ステップＳ７２において、ラベル付与部５２は、ラベル管理部５１のラベルDB７７に保持されている翻訳リスト７７ａを参照して、入力されたラベルが含まれているクラスタに含まれるラベルのうちの、提示される国や文化に対応した言語のラベルを、ラベルDB７７から読み出す。

例えば、言語として英語を用いる英語圏において、ラベルとして、日本語の「幸せ」が入力された場合、図９で示された翻訳リスト７７ａが参照されて、Cluster３に含まれるラベルとして日本語の「幸せ」に対応付けられている英語の「mellow」が、ラベルDB７７から読み出される。

ステップＳ７３において、ラベル付与部５２は、ステップＳ７２において読み出したラベルを、コンテンツDB５３から読み出したコンテンツに付与する。

このとき、ラベル付与部５２は、ラベルを付与したコンテンツを提示部５４に供給する。提示部５４は、ラベルが付与されたコンテンツの名称を、そのコンテンツに付与されたラベルとともに、端末３に供給（送信）する。端末３においては、ユーザにより読み出されたコンテンツに、ユーザにより入力されたラベルに対応するラベルが付与された旨が表示される。

以上の処理によれば、国や文化を問わず、人間の感性に基づいてグループ化された、異なる言語のラベルが、コンテンツに付与されるようになる。例えば、ユーザが全く理解できない言語を用いる国において、所定のコンテンツに対する評価としてラベルを付与する場合、自国語のラベルに対応するその国のラベルが付与される。すなわち、所定のコンテンツに対して、国や文化が異なる場合であっても、感性的な情報を正確に付与することが可能となる。

ところで、上述した実施の形態においては、サーバ２側でラベルのクラスタリング処理やラベルの付与処理が行われるとして説明をした。このようなサーバ２側で処理が行われるような形態は、例えば、端末３に対して、ネットワーク１を介してコンテンツが提供される際などに適している。

しかしながら、上述したようなラベルのクラスタリング処理や付与処理が、サーバ２側でのみ行われることを意味しているのではない。例えば、ラベルのクラスタリング処理は、サーバ２側で行い、その結果を利用して端末３側で、ラベルの付与が行われるようにすることも可能である。さらには、端末３側でラベルのクラスタリング処理や付与処理が実行されるようにしても良い。

［記録媒体について］
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。

コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを記録するプログラム記録媒体は、図２に示すように、磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む）、光磁気ディスク（MD（Mini-Disc）を含む）、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア３１、または、プログラムが一時的もしくは永続的に格納されるROM２２や、記憶部２８を構成するハードディスクなどにより構成される。プログラム記録媒体へのプログラムの記録は、必要に応じてルータ、モデムなどのインタフェースである通信部２９を介して、インターネットまたはLANなどのネットワーク１やデジタル衛星放送といった、有線または無線の通信媒体を利用して行われる。

なお、本明細書において、プログラム記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理は勿論、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。

なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

１ネットワーク，２サーバ，３端末，２１ CPU，２２ ROM，２３ RAM，２８記憶部，３１リムーバブルメディア，５１ラベル管理部，５２ラベル付与部，５３コンテンツDB，５４提示部，７１コンテンツ取得部，７２ラベル選択部，７３類似度算出部，７４クラスタリング部，７５判別器生成部，７６精度計算部，７７ラベルDB，７７ａ翻訳リスト

Claims

コンテンツに対するユーザの主観的な評価を表すラベルがメタデータとして付与されている複数の前記コンテンツに付与されている前記ラベルのうち、前記コンテンツへの評価の信頼度が高い前記ラベルを選択する選択手段と、
前記選択手段によって選択された前記ラベル間の類似度を算出する算出手段と、
前記算出手段によって算出された前記類似度に基づいて、前記ラベルをクラスタリングするクラスタリング手段と、
前記クラスタリング手段によってクラスタリングされた前記ラベルが付与されている前記コンテンツの特徴量に基づいて、前記コンテンツの前記クラスタへの該当を判別するための判別器であるクラスタ判別器、および、前記コンテンツの、クラスタリングされた前記ラベルへの該当を判別するための判別器であるラベル判別器を生成する生成手段と、
前記ラベル判別器の判別精度より、前記クラスタ判別器の判別精度の方が良い場合、前記クラスタリング手段によるクラスタリングの結果得られたクラスタを１つのラベルとして記憶する記憶手段と
を備える情報処理装置。
前記算出手段は、前記選択手段によって選択された前記ラベルと、前記クラスタリング手段によって予め得られた既存クラスタとの間の類似度を算出し、
前記クラスタリング手段は、前記類似度に基づいて、前記ラベルを前記既存クラスタにクラスタリングする
請求項１に記載の情報処理装置。
前記生成手段は、前記ラベルが前記既存クラスタにクラスタリングされた新規クラスタについての判別器である新規クラスタ判別器を生成し、
前記記憶手段は、前記既存クラスタについての前記クラスタ判別器の判別精度より、前記新規クラスタ判別器の判別精度の方が良い場合、前記新規クラスタを１つのラベルとして記憶する
請求項２に記載の情報処理装置。
コンテンツを評価するために入力された前記ラベルが、前記クラスタリング手段によるクラスタリングの結果得られた前記クラスタに含まれる場合、前記クラスタに含まれる、入力された前記ラベル以外のラベルを前記コンテンツに付与する付与手段をさらに備える
請求項１乃至３のいずれかに記載の情報処理装置。
前記ラベルは、複数の異なる言語で与えられている
請求項１乃至４のいずれかに記載の情報処理装置。
コンテンツに対するユーザの主観的な評価を表すラベルがメタデータとして付与されている複数の前記コンテンツに付与されている前記ラベルのうち、前記コンテンツへの評価の信頼度が高い前記ラベルを選択する選択手段と、
前記選択手段によって選択された前記ラベル間の類似度を算出する算出手段と、
前記算出手段によって算出された前記類似度に基づいて、前記ラベルをクラスタリングするクラスタリング手段と、
前記クラスタリング手段によってクラスタリングされた前記ラベルが付与されている前記コンテンツの特徴量に基づいて、前記コンテンツの前記クラスタへの該当を判別するための判別器であるクラスタ判別器、および、前記コンテンツの、クラスタリングされた前記ラベルへの該当を判別するための判別器であるラベル判別器を生成する生成手段と、
前記ラベル判別器の判別精度より、前記クラスタ判別器の判別精度の方が良い場合、前記クラスタリング手段によるクラスタリングの結果得られたクラスタを１つのラベルとして記憶する記憶手段とを備える情報処理装置の情報処理方法であって、
前記選択手段が、コンテンツに対するユーザの主観的な評価を表すラベルがメタデータとして付与されている複数の前記コンテンツに付与されている前記ラベルのうち、評価の信頼度が高い前記ラベルを選択する選択ステップと、
前記算出手段が、前記選択ステップの処理によって選択された前記ラベル間の類似度を算出する算出ステップと、
前記クラスタリング手段が、前記算出ステップの処理によって算出された前記類似度に基づいて、前記ラベルをクラスタリングするクラスタリングステップと、
前記生成手段が、前記クラスタリングステップの処理によってクラスタリングされた前記ラベルが付与されている前記コンテンツの特徴量に基づいて、前記コンテンツの前記クラスタへの該当を判別するための判別器であるクラスタ判別器、および、前記コンテンツの、クラスタリングされた前記ラベルへの該当を判別するための判別器であるラベル判別器を生成する生成ステップと、
前記記憶手段が、前記ラベル判別器の判別精度より、前記クラスタ判別器の判別精度の方が良い場合、前記クラスタリングステップの処理によるクラスタリングの結果得られたクラスタを１つのラベルとして記憶する記憶ステップと
を含む情報処理方法。
コンテンツに対するユーザの主観的な評価を表すラベルがメタデータとして付与されている複数の前記コンテンツに付与されている前記ラベルのうち、前記コンテンツへの評価の信頼度が高い前記ラベルを選択する選択手段と、
前記選択手段によって選択された前記ラベル間の類似度を算出する算出手段と、
前記算出手段によって算出された前記類似度に基づいて、前記ラベルをクラスタリングするクラスタリング手段と、
前記クラスタリング手段によってクラスタリングされた前記ラベルが付与されている前記コンテンツの特徴量に基づいて、前記コンテンツの前記クラスタへの該当を判別するための判別器であるクラスタ判別器、および、前記コンテンツの、クラスタリングされた前記ラベルへの該当を判別するための判別器であるラベル判別器を生成する生成手段と、
前記ラベル判別器の判別精度より、前記クラスタ判別器の判別精度の方が良い場合、前記クラスタリング手段によるクラスタリングの結果得られたクラスタを１つのラベルとして記憶する記憶手段とを備える情報処理装置を制御するコンピュータに、
前記選択手段が、コンテンツに対するユーザの主観的な評価を表すラベルがメタデータとして付与されている複数の前記コンテンツに付与されている前記ラベルのうち、評価の信頼度が高い前記ラベルを選択する選択ステップと、
前記算出手段が、前記選択ステップの処理によって選択された前記ラベル間の類似度を算出する算出ステップと、
前記クラスタリング手段が、前記算出ステップの処理によって算出された前記類似度に基づいて、前記ラベルをクラスタリングするクラスタリングステップと、
前記生成手段が、前記クラスタリングステップの処理によってクラスタリングされた前記ラベルが付与されている前記コンテンツの特徴量に基づいて、前記コンテンツの前記クラスタへの該当を判別するための判別器であるクラスタ判別器、および、前記コンテンツの、クラスタリングされた前記ラベルへの該当を判別するための判別器であるラベル判別器を生成する生成ステップと、
前記記憶手段が、前記ラベル判別器の判別精度より、前記クラスタ判別器の判別精度の方が良い場合、前記クラスタリングステップの処理によるクラスタリングの結果得られたクラスタを１つのラベルとして記憶する記憶ステップと
を含む処理を実行させるプログラム。