JP2005056021A - Information retrieval apparatus and method, and computer program - Google Patents
Information retrieval apparatus and method, and computer program Download PDFInfo
- Publication number
- JP2005056021A JP2005056021A JP2003206772A JP2003206772A JP2005056021A JP 2005056021 A JP2005056021 A JP 2005056021A JP 2003206772 A JP2003206772 A JP 2003206772A JP 2003206772 A JP2003206772 A JP 2003206772A JP 2005056021 A JP2005056021 A JP 2005056021A
- Authority
- JP
- Japan
- Prior art keywords
- information
- user
- search
- user profile
- music
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、検索対象情報の中からユーザの嗜好に適合した情報を検索する、情報検索装置および方法ならびにコンピュータプログラムに関する。
【0002】
【従来の技術】
カラオケなどで所望の楽曲を探す際に、ユーザが曲を歌い、その音声データに基づいて該当曲を検索するための音楽情報検索技術が検討されている。この技術によれば、曲名やアーティスト名等の楽曲に関する情報が不明であっても検索することができるため便利である。
【0003】
しかしながら上記した音楽情報検索システムでは、ユーザの「好きな」曲を検索することはできない。このため、音楽情報の自動分類技術を応用し、ユーザの嗜好に基づいて音楽データの分類を行うシステムが提案されている。この自動分類技術の一つとして、ツリーベクトル量子化技術に基づく音楽情報の自動分類方法に関する技術が照会されている(例えば、非特許文献1参照)。
【0004】
【非特許文献1】
「Foote,“Content−based retrieval of music and audio”,Proceedings of SPIE,Vol.3229,pp.136−147,1997」
【0005】
図4、図5に、この自動分類方法を用いた従来の情報検索処理の流れおよびその概念が示されている。
まず、図4のステップS41において、カテゴリ(集合Cg)に予め分類された複数の音楽データMg1,Mg2,・・・,Mgnと、カテゴリ(集合Cb)に予め分類された複数の音楽データMb1,Mb2,・・・,Mbpと、検索対象の音楽データX1,X2,・・・,Xkとがデータ入力される。集合Cg,Cbの音楽データは学習用のデータである。そして、集合Cbの音楽データは集合Cgのカテゴリには含まれない音楽データである。
【0006】
次に、ステップS42では、図5に示す手法により、先ず、学習データである集合Cg,Cbの音楽データを使用して、音楽データ毎にMFCC(mel−frequency cepstral coefficients)と音量を、MFCCフレーム区間をずらしながら算出する(図5のS51,S52)。MFCCは12種類のパラメータからなる。これによりMFCCフレームは、12個のMFCCと音量とを要素に持つ13次元ベクトルとして表される。そして、各音楽データMg1,Mg2,・・・,Mgnは、それぞれにMFCCフレーム群として表される(S53)。
そして、集合Cg,Cbの各音楽データについてそれぞれに、各MFCCフレームの13次元ベクトルを分類し、ベクトル量子化のためのツリーTgを生成する。この生成したツリーTgに対して、集合Cgの各音楽データについての各MFCCフレームの13次元ベクトルを入力し、ツリーTgの末端の枝毎に蓄積されるデータ度数のヒストグラムを作成する。このヒストグラムが集合Cgを表すカテゴリベクトルVgとなる(S54、S55)。
【0007】
説明を図4に戻す。ステップS43,S44において、検索対象となる個々の音楽データX1,X2,・・・,Xkについても、同様に、上記ツリーTgによりベクトル化する。そして、この検索対象データのベクトルと、カテゴリベクトルVgとの類似度Sim(Xi,Vg)を算出する。
そして、この類似度Sim(Xi,Vg)の大きい順に、検索対象データX1,X2,・・・,Xkを並べ替えし、上位N件の検索対象データを検索結果としてユーザに提示する(S45)。
【0008】
上記した従来の情報検索方法によれば、ベクトル量子化のためのツリーを生成するために大量の学習データ(数百曲のデータ)が必要であり、実用的でないという問題がある。また、少ない学習データによりツリーを生成すると検索の精度が悪くなってしまい、誤った楽曲を出力する可能性が高い。
【0009】
このため本出願人は、ユーザの音楽嗜好を表すユーザプロファイルを構築し、検索前にユーザからその嗜好を示す情報として、数曲の楽曲に対する評価を入力として得、システム側では、その入力情報を学習データとして利用してユーザプロファイルを構築し、ユーザの音楽嗜好に適合した検索結果が得られる情報検索方法およびその装置、コンピュータプログラムを出願済みである(特願2002−106719号)。
また、この出願によれば、ユーザプロファイルを精緻化するためにそのプロファイルを利用した検索結果に対して適合フィードバック情報を与え、システム側ではこの不適合フィードバック情報に基づきユーザプロファイルを更新し、以降の検索精度の向上をはかっている。
【0010】
【発明が解決しようとする課題】
上記した出願によれば、ユーザの嗜好についての学習プロセス、ならびに音楽情報検索プロセスへの入力データとして音楽情報の全てを利用している。しかしながら、ある楽曲に対しユーザが評価を与える場合、必ずしもその音楽情報の全てを聴いたうえで評価しているわけではなく、例えば、「サビ」と称される部分など、楽曲の特徴的な部分のみに基づいて評価を行っている可能性が高い。
この場合、上記した学習、あるいは検索のプロセスで音楽情報の全てを利用すれば不要な部分が多く含まれるため、音楽情報検索処理が劣化する可能性がある。また、学習プロセスなどにおいて不要な部分も含めて処理を行うため、処理時間にも悪影響を及ぼすといった欠点があった。
【0011】
このために本発明は、ユーザ嗜好学習プロセス、あるいは音楽情報検索プロセスへの入力データとして、例えば、音楽の「サビ」部分など特徴的な部分を自動抽出した結果を利用することにより、音楽情報検索処理の精度向上ならびに処理時間の高速化をはかった、情報検索装置および方法ならびにコンピュータプログラムを提供することを目的とする。
また、上記した自動抽出した部分を利用し、事前に分類されたジャンル毎の検索対象情報により構築されるジャンルプロファイルをユーザの嗜好に適応させることにより、情報検索処理の一層の高精度化をはかった、音楽情報検索装置および方法ならびにコンピュータプログラムを提供することも目的とする。
【0012】
【課題を解決するための手段】
上記した課題を解決するために本発明は、検索対象情報の中からユーザの嗜好に適合した情報を検索する情報検索装置であって、前記検索対象情報の所定の単位毎にあらかじめ特徴部分を定義し、当該特徴部分を抽出する特徴抽出部と、ユーザに対し前記抽出された特徴部分を提供し、その特徴部分に関する嗜好の入力を促し、当該入力情報を取り込んで前記ユーザの嗜好を示すユーザプロファイルを生成するユーザプロファイル生成部と、前記ユーザプロファイルを利用して前記検索対象情報の検索を行う情報検索部と、を備えたことを特徴とする。
【0013】
また、本発明において、前記特徴抽出部は、前記検索対象情報が符号化された音楽情報の場合、個々の音楽情報に関し、所定の周波数帯域毎のパワーが最大となる部分を中心に前後N(任意)秒相当部分を特徴部分として定義し、抽出することを特徴とする。
【0014】
また、本発明において、前記情報検索部は、前記特徴部分により生成されるベクトル量子化のためのツリーを用いてベクトル化された前記特徴部分を有する検索対象情報ならびに前記ユーザプロファイルの類似度に基づいて検索結果を出力することを特徴とする。
【0015】
また、本発明において、前記検索結果に対するユーザの評価を取り込み、当該評価を前記ユーザプロファイルに反映させて前記ユーザプロファイルのベクトルを更新するユーザプロファイル更新部、を備えたことを特徴とする。
【0016】
本発明によれば、ユーザの嗜好ならびに検索結果に対する評価入力情報に基づき構築されるユーザプロファイル生成の前処理として、特徴抽出部が、検索対象情報の所定の単位毎にあらかじめ特徴部分を定義し当該特徴部分を抽出してデータベースを構築しておく。特徴抽出部は、例えば、検索対象が音楽情報の場合、音楽情報の周波数成分に基づき「サビ」やイントロ部分に相当する特徴部分を抽出して音楽情報DBに蓄積する。
ユーザプロファイル生成部は、検索に先立ち、ユーザ嗜好入力取込み部を介して取り込まれる上記した特徴部分に対するユーザの嗜好に基づきユーザプロファイルを構築して情報検索部を起動する。情報検索部は、特徴部分により生成されるベクトル量子化のためのツリーを用いてベクトル化された特徴部分を有する検索対象情報ならびにユーザプロファイルの類似度に基づいて検索結果を出力する。
このことにより、音楽情報検索処理の精度向上ならびに処理時間の高速化をはかった情報検索装置を提供することができる。
【0017】
また、特徴部分に基づき構築されたユーザプロファイルは、特定の楽曲に対するユーザ評価が反映されていない分、ユーザの嗜好を的確に表現するための情報が不足している可能性がある。そこで、検索結果に対するユーザの評価入力の結果を取り込み、入力された評価結果をユーザプロファイルに反映させ、ユーザプロファイルのベクトルを更新することによってユーザプロファイルを精緻化し、高精度な音楽情報検索を実現することができる。
なお、ユーザの評価入力の結果取り込み、およびユーザプロファイルへの反映は、それぞれ、評価入力取込み部、ユーザプロファイル更新部が行う。
【0018】
上記した課題を解決するために本発明は、検索対象情報の中からユーザの嗜好に適合した情報を検索する情報検索方法であって、前記検索対象情報の所定の単位毎にあらかじめ特徴部分を定義し、当該特徴部部を抽出する工程と、ユーザに対し前記抽出された特徴部分を提供し、その特徴部分に関する嗜好の入力を促し、当該入力情報を取り込んで前記ユーザの嗜好を示すユーザプロファイルを生成する工程と、前記ユーザプロファイルを利用して前記検索対象情報の検索を行う工程と、を備えたことを特徴とする。
【0019】
上記した課題を解決するために本発明は、検索対象情報の中からユーザの嗜好に適合した情報を検索する情報検索装置に用いられるコンピュータプログラムであって、前記検索対象情報の所定の単位毎にあらかじめ特徴部分を定義し、当該特徴部部を抽出する処理と、ユーザに対し前記抽出された特徴部分を提供し、その特徴部分に関する嗜好の入力を促し、当該入力情報を取り込んで前記ユーザの嗜好を示すユーザプロファイルを生成する処理と、前記ユーザプロファイルを利用して前記検索対象情報の検索を行う処理と、をコンピュータに実行させることを特徴とする。
【0020】
【発明の実施の形態】
図1は、本発明における情報検索装置の実施形態の一例を示す図であり、ここでは音楽配信システムへの適用例が示されている。
図1において、音楽配信サーバ1は、音楽情報DB(データベース)2に格納されている音楽情報の中から個々のユーザの嗜好情報に基づいて検索し、配信する、本発明の情報検索装置として機能する。また、音楽配信サーバ1は、インターネット4に接続され、このインターネット4を介し希望する音楽情報をユーザが所有する端末3に配信する。
音楽情報DB2には、配信対象音楽情報21として、ポップス、ロック、クラシック、演歌など多ジャンルの楽曲の音楽情報が蓄積されており、音楽配信サーバ1からアクセス可能である。端末3は、音楽情報DB2を、インターネット4を介してアクセス可能であり、音楽配信サーバ1から音楽情報の配信を受けて音楽を再生することができる。
【0021】
図2は、図1に示す音楽配信サーバの内部構成を機能展開して示したブロック図である。
図2に示されるように、音楽配信サーバ1は、ユーザ嗜好入力取り込み部11と、特徴抽出部12と、ユーザプロファイル生成部13と、情報検索部14と、検索結果出力部15と、評価入力取り込み部16と、ユーザプロファイル更新部17で構成される。
【0022】
ユーザ嗜好入力取り込み部11は、ユーザに対し検索対象となる音楽情報の「サビ」に相当する部分など、特徴部分に関するユーザ嗜好の入力を促し、その入力を取り込む機能を持つ。
また、特徴抽出部12は、検索対象情報の所定の単位毎にあらかじめ特徴部分を定義し、当該特徴部分を抽出する機能を持つ。具体的に、検索対象情報が符号化された音楽情報の場合、個々の音楽情報に関し、所定の周波数帯域毎のパワーが最大となる部分を中心に、前後N(任意)秒相当部分を特徴部分として抽出し、例えば、音楽情報DB2へ音楽サビ情報22として蓄積する。
【0023】
ユーザプロファイル生成部13は、音楽サビ情報ならびにユーザ嗜好入力取込み部11を介して取り込まれたユーザの嗜好情報に基づき、音楽サビ情報に対するユーザの嗜好を示すユーザプロファイルを生成する機能を持つ。
情報検索部14は、ユーザプロファイルを利用して検索対象音楽情報21の検索を行う機能を持ち、検索結果出力部15を介してその検索結果を要求のあったユーザの端末3へ出力する。ここで、情報検索部14は、ベクトル量子化のためのツリーを用いてベクトル化された検索対象音楽情報21ならびにユーザプロファイルの類似度に基づいて検索結果を出力する。
【0024】
一方、評価入力取り込み部16は、検索結果に対するユーザの評価入力の結果を取り込んでユーザプロファイル更新部17へ供給し、ユーザプロファイル更新部17は、入力された評価結果をユーザプロファイル生成部13によって作成されたユーザプロファイルに反映させ、ユーザプロファイルのベクトルを更新する機能を持つ。
なお、音楽情報DB2は、検索対象音楽情報21と音楽サビ情報22で構成され、前者は、検索対象となる多ジャンルの音楽情報であり、後者は、事前に特徴抽出部12によって自動抽出された対象音楽情報のサビに相当する部分情報である。なお、後者は、サビに相当する部分に限らず、イントロ部分等、サビに変わる音楽情報の特徴部分であればよい。
【0025】
図3は、本発明実施形態の動作を説明するために引用したフローチャートであり、具体的には本発明のコンピュータプログラムの処理手順を示す。
以下、図3に示すフローチャートを参照しながら図1、図2に示す本発明実施形態の動作について詳細に説明する。
【0026】
ここでは、事前に特徴抽出部12により、あらかじめ検索対象となる楽曲毎特徴部分が定義されており、抽出された特徴部分、ここではサビに相当する部分が音楽情報DB2へ音楽サビ情報22として蓄積されている(S31)。
具体的に、検索対象音楽情報21が音楽情報DB2にMPEG(Moving Picture Experts Group)データとして蓄積されていた場合、特徴抽出部12は、当該MPEGデータのサブバンド毎の振幅値に基づき、以下に示す(1)式を用い、個々の楽曲のフレーム毎にサブバンドエネルギー値SBE(Subband−based weighted Subband Eenergy)を演算する。
そして、特徴抽出部12は、検索対象音楽情報21のサビ部分は、このSBE値が最大となる部分を中心に発生するものとして認識し、この最大となる部分を含めた周辺をサビ部分として抽出する。例えば、SBE値の最大部分を中心に前後N秒相当部分をサビ情報として抽出し、楽曲毎、音楽サビ情報22として音楽情報DB2に構築しておく。
【0027】
【数1】
【0028】
音楽情報の検索に先立ち、本発明の情報検索装置によれば、まず、音楽サビ情報に対する嗜好入力の取り込みが行われる。ユーザ嗜好情報の取り込みは、ユーザプロファイル生成部13による監視の下でユーザ嗜好入力取り込み部11によって行われる。
具体的に、ユーザ嗜好入力取り込み部11は、ユーザの端末3に対して音楽情報DB2に蓄積された楽曲毎の音楽サビ情報22を提供し、これに対し、ユーザは、端末3を操作することによって好き嫌いを入力する(S32)。そして、ジャンル嗜好入力取込み部11は、ここで入力されたユーザ嗜好情報を取込んでユーザプロファイル生成部13へ提供する。
【0029】
ユーザプロファイル生成部13では、取り込まれたユーザ嗜好入力情報に基づきユーザプロファイルを生成して情報検索部14を起動する(S33)。
なお、ユーザプロファイル生成部13は、ユーザ嗜好入力取り込み部11を介し、最初に音楽に関する好きなジャンルをユーザに問合せ、ユーザのジャンル嗜好入力を取込み、続いてこのジャンル嗜好に基づいて生成されるジャンルプロファイルに従い該当する楽曲のサビ部分を提供し、それに対する評価入力を取り込んでもよい。このことにより、ユーザプロファイル生成部13は、取り込まれたジャンル嗜好情報、ならびにジャンルプロファイルに基づき、各ジャンルのユーザの嗜好を表すユーザプロファイルを生成することができ、一層効果的な学習データの生成が可能になる。
【0030】
情報検索部14は、ユーザプロファイル生成部13によって生成されるユーザプロファイルを利用して音楽情報検索を行い(S34)、検索結果出力部15を介して要求のあったユーザの端末3へインターネット4経由で配信する(S35)。
具体的に、情報検索部14は、図4および図5を用いて説明したように、あらかじめ作成された音楽サビ情報(学習データ)により生成されるベクトル量子化のためのツリーを用いてベクトル化された検索対象情報22ならびにユーザプロファイルの類似度に基づき、類似度の大きい順に検索対象音楽情報21を並べ替えし、上位N件の検索対象音楽情報21を検索結果として出力し、ユーザに対してその検索結果の評価入力を促す。
上記したように、ユーザ嗜好学習プロセス、あるいは音楽情報検索プロセスへの入力データとして、例えば、音楽の「サビ」部分など特徴的な部分を自動抽出した結果を利用することにより、音楽情報検索処理の精度向上ならびに処理時間の高速化をはかることができる。
【0031】
ところで、ユーザプロファイル生成部13によって生成されるユーザプロファイルは、特定の楽曲に対するユーザ評価が反映されていない分、ユーザの嗜好を的確に表現するための情報が不足している可能性がある。
このため、ユーザは、端末3により、受信した音楽サビ情報の再生がなされると、その楽曲の評価を行い、その評価値を適合フィードバック情報として音楽配信サーバ1へ送信する。
なお、楽曲の評価方法としては、例えば、配信された楽曲について、好みに合う度合いを5段階式、あるいは○×式で評価する方法がある。後者の場合には、ユーザが、聴きたくない楽曲については端末3の音楽再生機能を用いて早送り再生を行い、この操作情報を×の評価値として利用する。
【0032】
そこで、音楽情報サーバ1の評価入力取込み部16は、ユーザの評価入力の結果を取り込み(S36:適合フィードバックあり)、ユーザプロファイル更新部17を起動し、ユーザプロファイル更新部17が、入力された評価結果をユーザプロファイルに反映させる。例えば、ユーザプロファイル更新部17は、ユーザプロファイルとしてその評価値をジャンル毎に分類して記録し、その評価値に基づいて類似度算出のためのスコアを計算してユーザプロファイルのベクトルを更新する(S37)。
このことによりユーザプロファイルを精緻化することができ、情報検索部14は、ステップS34以降の処理を繰り返すことによって高精度な音楽情報検索を実現することができる(S38)。
【0033】
なお、上記した本発明実施形態によれば、インターネット等のデータ通信ネットワークを利用して端末に3に音楽情報を配信する音楽情報配信システムに適用した例についてのみ説明したが、この例に限らず、スタンドアロン構成による音楽情報検索装置にも適用が可能である。また、検索対象として音楽情報についてのみ例示したが、画像等、他の検索対象メディアでも同様に応用が可能である。また、図2に示されるユーザ嗜好入力取り込み部11と、特徴抽出部12と、ユーザプロファイル生成部13と、情報検索部14と、検索結果出力部15と、評価入力取り込み部16と、ユーザプロファイル更新部17のそれぞれで実行される手順をコンピュータ読取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより本発明の情報検索装置が実現されるものとする。ここでいうコンピュータシステムとは、OSや周辺機器等のハードウェアを含むものである。
【0034】
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【0035】
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【0036】
【発明の効果】
以上説明のように本発明によれば、検索対象情報の特徴部分のみが自動抽出され、ユーザプロファイルの学習、あるいは情報検索プロセスに適用されるため、音楽情報の全体を学習あるいは情報検索プロセス適用の対象としていた従来手法に比べ情報検索処理の高精度化、ならびに処理の高速化がはかれる。
また、適合フィードバック情報を取り込んでユーザプロファイルに反映させ、ユーザプロファイルのベクトルを更新することによってユーザプロファイルを精緻化することができるため、一層高精度な情報検索を実現することができる。
【図面の簡単な説明】
【図1】本発明における情報検索装置の実施形態の一例を示す図である。
【図2】図1に示す音楽配信サーバの内部構成を機能展開して示したブロック図である。
【図3】本発明実施形態の動作を説明するために引用したフローチャートである。
【図4】従来の自動分類方法に基づく情報検索処理の流れをフローチャートで示した図である。
【図5】従来の自動分類方法に基づく情報検索処理を模式的に示した概念図である。
【符号の説明】
1…音楽情報配信サーバ、2…音楽情報DB、3…端末、4…インターネット、11…ユーザ嗜好入力取り込み部、12…特徴抽出部、13…ユーザプロファイル生成部、14…情報検索部、15…検索結果出力部、16…評価入力取り込み部、17…ユーザプロファイル更新部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an information search apparatus and method, and a computer program for searching information suitable for a user's preference from search target information.
[0002]
[Prior art]
When searching for a desired music piece in karaoke or the like, a music information search technique for a user to sing a music piece and search for the corresponding music piece based on the voice data has been studied. This technique is convenient because it is possible to search even if information on music such as a music title or artist name is unknown.
[0003]
However, the above-described music information search system cannot search for a user's “favorite” song. For this reason, a system for applying music information automatic classification technology and classifying music data based on user preferences has been proposed. As one of the automatic classification techniques, a technique related to an automatic classification method of music information based on a tree vector quantization technique is inquired (for example, see Non-Patent Document 1).
[0004]
[Non-Patent Document 1]
“Foote,“ Content-based retrievable of music and audio ”, Processeds of SPIE, Vol. 3229, pp. 136-147, 1997”.
[0005]
FIG. 4 and FIG. 5 show the flow and concept of a conventional information search process using this automatic classification method.
First, in step S41 of FIG. 4, a plurality of music data Mg1, Mg2,..., Mgn previously classified into a category (set Cg) and a plurality of music data Mb1, previously classified into a category (set Cb). Mb2,..., Mbp and music data X1, X2,. The music data of the sets Cg and Cb is learning data. The music data of the set Cb is music data not included in the category of the set Cg.
[0006]
Next, in step S42, by using the music data of the sets Cg and Cb as learning data, the MFCC frame and the volume of MFCC (Mel-Frequency Coefficients) are set for each music data by using the method shown in FIG. Calculation is performed while shifting the section (S51, S52 in FIG. 5). The MFCC consists of 12 types of parameters. Thus, the MFCC frame is represented as a 13-dimensional vector having 12 MFCCs and sound volume as elements. The music data Mg1, Mg2,..., Mgn are each represented as a MFCC frame group (S53).
Then, a 13-dimensional vector of each MFCC frame is classified for each music data of the sets Cg and Cb, and a tree Tg for vector quantization is generated. A 13-dimensional vector of each MFCC frame for each piece of music data in the set Cg is input to the generated tree Tg, and a histogram of the data frequency accumulated for each end branch of the tree Tg is created. This histogram becomes a category vector Vg representing the set Cg (S54, S55).
[0007]
Returning to FIG. In steps S43 and S44, the individual music data X1, X2,..., Xk to be searched are similarly vectorized by the tree Tg. Then, a similarity Sim (Xi, Vg) between the vector of the search target data and the category vector Vg is calculated.
Then, the search target data X1, X2,..., Xk are rearranged in the descending order of the similarity Sim (Xi, Vg), and the top N search target data are presented to the user as search results (S45). .
[0008]
According to the conventional information search method described above, a large amount of learning data (several hundred pieces of data) is required to generate a tree for vector quantization, which is not practical. In addition, if a tree is generated with a small amount of learning data, the accuracy of the search deteriorates, and there is a high possibility that an incorrect music piece is output.
[0009]
For this reason, the present applicant constructs a user profile representing the user's music preference, obtains an evaluation of several songs as input from the user as information indicating the preference before the search, and the system side inputs the input information. An application has been filed for an information search method, an apparatus, and a computer program that can be used as learning data to construct a user profile and obtain a search result suitable for the user's music preference (Japanese Patent Application No. 2002-106719).
Further, according to this application, in order to refine the user profile, conformity feedback information is given to the search result using the profile, and the system updates the user profile based on this nonconformity feedback information, and performs subsequent searches. We are trying to improve accuracy.
[0010]
[Problems to be solved by the invention]
According to the above-mentioned application, all of the music information is used as input data to the learning process of the user's preference and the music information search process. However, when a user gives an evaluation to a certain piece of music, the evaluation is not necessarily made after listening to all of the music information. For example, a characteristic part of the music, such as a part called “rust” There is a high possibility that the evaluation is based only on this.
In this case, if all of the music information is used in the learning or search process described above, a lot of unnecessary parts are included, so that the music information search process may be deteriorated. In addition, since processing is performed including unnecessary portions in the learning process, the processing time is adversely affected.
[0011]
To this end, the present invention uses a result of automatically extracting a characteristic part such as a “rust” part of music as input data to a user preference learning process or a music information search process. An object of the present invention is to provide an information search apparatus and method, and a computer program that improve processing accuracy and speed up processing time.
In addition, by using the above-mentioned automatically extracted portion and adapting the genre profile constructed by the search target information for each genre classified in advance to the user's preference, the accuracy of the information search process is further improved. Another object of the present invention is to provide a music information retrieval apparatus and method, and a computer program.
[0012]
[Means for Solving the Problems]
In order to solve the above-described problems, the present invention is an information search device for searching for information suitable for a user's preference from search target information, wherein a characteristic portion is defined in advance for each predetermined unit of the search target information A feature extraction unit for extracting the feature portion, and a user profile that provides the user with the extracted feature portion, prompts the user to input a preference regarding the feature portion, and captures the input information to indicate the user's preference. A user profile generation unit for generating the search target information, and an information search unit for searching for the search target information using the user profile.
[0013]
In the present invention, when the search target information is encoded music information, the feature extraction unit is configured to perform forward and backward N (centering on a portion where the power for each predetermined frequency band is maximum with respect to individual music information. (Optional) Characteristic is that a second equivalent part is defined as a characteristic part and extracted.
[0014]
Further, in the present invention, the information search unit is based on search target information having the feature portion vectorized using a tree for vector quantization generated by the feature portion and similarity of the user profile. And the search result is output.
[0015]
Further, the present invention is characterized in that a user profile update unit is provided, which takes in a user's evaluation for the search result and updates the user profile vector by reflecting the evaluation in the user profile.
[0016]
According to the present invention, as a preprocessing of user profile generation that is constructed based on user preference and evaluation input information on search results, the feature extraction unit defines a feature portion in advance for each predetermined unit of search target information. A database is constructed by extracting features. For example, when the search target is music information, the feature extraction unit extracts a feature portion corresponding to “rust” or an intro portion based on the frequency component of the music information and stores it in the music information DB.
Prior to the search, the user profile generation unit constructs a user profile based on the user's preference with respect to the above-described feature portion captured via the user preference input capture unit, and activates the information search unit. The information search unit outputs a search result based on search target information having a feature part vectorized using a tree for vector quantization generated by the feature part and the similarity of the user profile.
As a result, it is possible to provide an information search apparatus that improves the accuracy of the music information search process and speeds up the processing time.
[0017]
In addition, the user profile constructed based on the characteristic portion may lack information for accurately expressing the user's preference because the user evaluation for the specific music is not reflected. Therefore, the result of the user's evaluation input with respect to the search result is captured, the input evaluation result is reflected in the user profile, and the user profile is refined by updating the user profile vector, thereby realizing highly accurate music information search. be able to.
Note that the evaluation input capturing unit and the user profile updating unit respectively capture the result of the user's evaluation input and reflect it in the user profile.
[0018]
In order to solve the above-described problem, the present invention provides an information search method for searching for information suitable for a user's preference from search target information, wherein a characteristic portion is defined in advance for each predetermined unit of the search target information A step of extracting the feature portion, providing the user with the extracted feature portion, prompting the user to input a preference regarding the feature portion, and taking in the input information to indicate the user's preference A generating step; and a step of searching for the search target information using the user profile.
[0019]
In order to solve the above-described problem, the present invention is a computer program used for an information search device for searching information suitable for a user's preference from search target information, and for each predetermined unit of the search target information. A process of defining a feature portion in advance and extracting the feature portion, providing the extracted feature portion to the user, prompting the user to input a preference regarding the feature portion, and capturing the input information to obtain the user's preference And a process for searching for the search target information using the user profile.
[0020]
DETAILED DESCRIPTION OF THE INVENTION
FIG. 1 is a diagram showing an example of an embodiment of an information search apparatus according to the present invention. Here, an example of application to a music distribution system is shown.
In FIG. 1, a music distribution server 1 functions as an information search apparatus of the present invention that searches and distributes music information stored in a music information DB (database) 2 based on preference information of individual users. To do. The music distribution server 1 is connected to the
The
[0021]
FIG. 2 is a block diagram showing an expanded function of the internal configuration of the music distribution server shown in FIG.
As shown in FIG. 2, the music distribution server 1 includes a user preference input capturing unit 11, a
[0022]
The user preference input capturing unit 11 has a function of prompting the user to input user preferences regarding a characteristic portion such as a portion corresponding to “rust” of music information to be searched, and capturing the input.
The
[0023]
The user
The
[0024]
On the other hand, the evaluation
The
[0025]
FIG. 3 is a flowchart cited for explaining the operation of the embodiment of the present invention, and specifically shows the processing procedure of the computer program of the present invention.
The operation of the embodiment of the present invention shown in FIGS. 1 and 2 will be described in detail below with reference to the flowchart shown in FIG.
[0026]
Here, a feature portion for each piece of music to be searched is defined in advance by the
Specifically, when the search
Then, the
[0027]
[Expression 1]
[0028]
Prior to the search for music information, according to the information search apparatus of the present invention, first, preference input for music chorus information is captured. The user preference information is captured by the user preference input capturing unit 11 under monitoring by the user
Specifically, the user preference input capturing unit 11 provides the
[0029]
The user
Note that the user
[0030]
The
Specifically, as described with reference to FIGS. 4 and 5, the
As described above, as input data to the user preference learning process or the music information search process, for example, by using a result of automatically extracting a characteristic part such as a “rust” part of music, the music information search process The accuracy can be improved and the processing time can be increased.
[0031]
By the way, the user profile generated by the user
For this reason, when the received music chorus information is reproduced by the
In addition, as a method for evaluating music, for example, there is a method for evaluating the degree of preference for a distributed music by a five-stage method or a ◯ × method. In the latter case, the user performs fast-forward playback of music that the user does not want to listen to using the music playback function of the
[0032]
Therefore, the evaluation
As a result, the user profile can be refined, and the
[0033]
In addition, according to the above-described embodiment of the present invention, only the example applied to the music information distribution system that distributes the music information to the
[0034]
Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.
The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line.
The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.
[0035]
The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes design and the like within the scope not departing from the gist of the present invention.
[0036]
【The invention's effect】
As described above, according to the present invention, only the characteristic part of the search target information is automatically extracted and applied to the learning of the user profile or the information search process. Therefore, the entire music information is learned or applied to the information search process. Compared to the conventional method that was the subject, the accuracy of the information retrieval process and the speed of the process can be improved.
In addition, since the user profile can be refined by capturing the adaptive feedback information, reflecting it in the user profile, and updating the vector of the user profile, it is possible to realize more accurate information retrieval.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating an example of an embodiment of an information search apparatus according to the present invention.
FIG. 2 is a block diagram showing an expanded function of the internal configuration of the music distribution server shown in FIG.
FIG. 3 is a flowchart cited for explaining the operation of the embodiment of the present invention;
FIG. 4 is a flowchart showing the flow of information search processing based on a conventional automatic classification method.
FIG. 5 is a conceptual diagram schematically showing information search processing based on a conventional automatic classification method.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 ... Music information delivery server, 2 ... Music information DB, 3 ... Terminal, 4 ... Internet, 11 ... User preference input acquisition part, 12 ... Feature extraction part, 13 ... User profile production | generation part, 14 ... Information search part, 15 ... Search result output unit, 16 ... evaluation input import unit, 17 ... user profile update unit
Claims (6)
前記検索対象情報の所定の単位毎にあらかじめ特徴部分を定義し、当該特徴部部を抽出する特徴抽出部と、
ユーザに対し前記抽出された特徴部分を提供し、その特徴部分に関する嗜好の入力を促し、当該入力情報を取り込んで前記ユーザの嗜好を示すユーザプロファイルを生成するユーザプロファイル生成部と、
前記ユーザプロファイルを用いて前記検索対象情報の検索を行う情報検索部と、を備えたことを特徴とする情報検索装置。An information search device for searching for information that matches user preferences from search target information,
Defining a characteristic part in advance for each predetermined unit of the search target information, and extracting a characteristic part;
A user profile generation unit that provides the extracted feature portion to the user, prompts the user to input a preference regarding the feature portion, and takes in the input information to generate a user profile indicating the user preference;
An information search device comprising: an information search unit that searches for the search target information using the user profile.
前記検索対象情報が符号化された音楽情報の場合、個々の音楽情報に関し、所定の周波数帯域毎のパワーが最大となる部分を中心に前後N秒相当部分を特徴部分として定義し、抽出することを特徴とする請求項1に記載の情報検索装置。The feature extraction unit includes:
When the search target information is encoded music information, for each piece of music information, a portion corresponding to N seconds before and after the portion where the power for each predetermined frequency band is maximized is defined as a characteristic portion and extracted. The information search device according to claim 1.
前記特徴部分により生成されるベクトル量子化のためのツリーを用いてベクトル化された前記特徴部分を有する検索対象情報ならびに前記ユーザプロファイルの類似度に基づいて検索結果を出力することを特徴とする請求項1に記載の情報検索装置。The information search unit
The search result is output based on search target information having the feature portion vectorized using a tree for vector quantization generated by the feature portion and similarity of the user profile. Item 2. The information search device according to Item 1.
前記検索対象情報の所定の単位毎にあらかじめ特徴部分を定義し、当該特徴部部を抽出する工程と、
ユーザに対し前記抽出された特徴部分を提供し、その特徴部分に関する嗜好の入力を促し、当該入力情報を取り込んで前記ユーザの嗜好を示すユーザプロファイルを生成する工程と、
前記ユーザプロファイルを用いて前記検索対象情報の検索を行う工程と、を備えたことを特徴とする情報検索方法。An information search method for searching information suitable for a user's preference from search target information,
Defining a feature portion in advance for each predetermined unit of the search target information, and extracting the feature portion;
Providing the user with the extracted feature portion, prompting the user to input a preference regarding the feature portion, capturing the input information, and generating a user profile indicating the user's preference;
And a step of searching for the search target information using the user profile.
前記検索対象情報の所定の単位毎にあらかじめ特徴部分を定義し、当該特徴部部を抽出する処理と、
ユーザに対し前記抽出された特徴部分を提供し、その特徴部分に関する嗜好の入力を促し、当該入力情報を取り込んで前記ユーザの嗜好を示すユーザプロファイルを生成する処理と、
前記ユーザプロファイルを用いて前記検索対象情報の検索を行う処理と、をコンピュータに実行させるコンピュータプログラム。A computer program used in an information search device for searching information suitable for a user's preference from search target information,
Defining a characteristic part in advance for each predetermined unit of the search target information, and extracting the characteristic part;
Processing for providing the extracted feature portion to the user, prompting the user to input a preference regarding the feature portion, capturing the input information, and generating a user profile indicating the user's preference;
The computer program which makes a computer perform the process which searches the said search object information using the said user profile.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003206772A JP2005056021A (en) | 2003-08-08 | 2003-08-08 | Information retrieval apparatus and method, and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003206772A JP2005056021A (en) | 2003-08-08 | 2003-08-08 | Information retrieval apparatus and method, and computer program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005056021A true JP2005056021A (en) | 2005-03-03 |
Family
ID=34363512
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003206772A Pending JP2005056021A (en) | 2003-08-08 | 2003-08-08 | Information retrieval apparatus and method, and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005056021A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006137271A1 (en) * | 2005-06-24 | 2006-12-28 | Pioneer Corporation | Musical composition searching device, musical composition searching method, and musical composition searching program |
KR100763197B1 (en) | 2006-02-06 | 2007-10-04 | 삼성전자주식회사 | Method and apparatus for content browsing |
JP2008186444A (en) * | 2007-01-05 | 2008-08-14 | Yahoo Japan Corp | Sensitivity matching method, device and computer program |
CN100458783C (en) * | 2006-08-18 | 2009-02-04 | 中山大学 | Digital family music controller |
CN101807416A (en) * | 2010-04-16 | 2010-08-18 | 中山大学 | Digital home background music control system |
-
2003
- 2003-08-08 JP JP2003206772A patent/JP2005056021A/en active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006137271A1 (en) * | 2005-06-24 | 2006-12-28 | Pioneer Corporation | Musical composition searching device, musical composition searching method, and musical composition searching program |
JPWO2006137271A1 (en) * | 2005-06-24 | 2009-01-08 | パイオニア株式会社 | Music search device, music search method, and music search program |
JP4560544B2 (en) * | 2005-06-24 | 2010-10-13 | パイオニア株式会社 | Music search device, music search method, and music search program |
KR100763197B1 (en) | 2006-02-06 | 2007-10-04 | 삼성전자주식회사 | Method and apparatus for content browsing |
US8340474B2 (en) | 2006-02-06 | 2012-12-25 | Samsung Electronics Co., Ltd. | Apparatus and method of browsing contents |
CN100458783C (en) * | 2006-08-18 | 2009-02-04 | 中山大学 | Digital family music controller |
JP2008186444A (en) * | 2007-01-05 | 2008-08-14 | Yahoo Japan Corp | Sensitivity matching method, device and computer program |
CN101807416A (en) * | 2010-04-16 | 2010-08-18 | 中山大学 | Digital home background music control system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8392414B2 (en) | Hybrid audio-visual categorization system and method | |
US8438168B2 (en) | Scalable music recommendation by search | |
US6910035B2 (en) | System and methods for providing automatic classification of media entities according to consonance properties | |
US7381883B2 (en) | System and methods for providing automatic classification of media entities according to tempo | |
US7532943B2 (en) | System and methods for providing automatic classification of media entities according to sonic properties | |
US7574276B2 (en) | System and methods for providing automatic classification of media entities according to melodic movement properties | |
US20050071329A1 (en) | System and methods for providing adaptive media property classification | |
US20070282860A1 (en) | Method and system for music information retrieval | |
US11537651B2 (en) | Descriptive media content search | |
US11636835B2 (en) | Spoken words analyzer | |
US20100023328A1 (en) | Audio Recognition System | |
EP1894126A1 (en) | A method of analysing audio, music orvideo data | |
CN109165302A (en) | Multimedia file recommendation method and device | |
JP2012015809A (en) | Music selection apparatus, music selection method, and music selection program | |
US11410706B2 (en) | Content pushing method for display device, pushing device and display device | |
AU2020269924A1 (en) | Methods and systems for determining compact semantic representations of digital audio signals | |
JP2003316818A (en) | Information researching method and device therefor, and computer program | |
JP2005056021A (en) | Information retrieval apparatus and method, and computer program | |
JP4597714B2 (en) | Information retrieval apparatus and method, and computer program | |
KR102031282B1 (en) | Method and system for generating playlist using sound source content and meta information | |
Simas Filho et al. | Genre classification for brazilian music using independent and discriminant features | |
JP2005056020A (en) | Information retrieval apparatus and method, and computer program | |
Kumari et al. | Music Genre Classification for Indian Music Genres | |
Skalski | What you hear is what you get: Post-genre, feature-based music recommendation system | |
Shuhendler et al. | Dynamic artist-based embeddings with application to playlist generation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050909 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20050912 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070911 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20071010 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071010 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071211 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080212 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080318 |