JP4992295B2

JP4992295B2 - 情報処理装置

Info

Publication number: JP4992295B2
Application number: JP2006144125A
Authority: JP
Inventors: 千加志杉浦; 岳彦井阪
Original assignee: Fujitsu Mobile Communications Ltd
Current assignee: Fujitsu Mobile Communications Ltd
Priority date: 2006-05-24
Filing date: 2006-05-24
Publication date: 2012-08-08
Anticipated expiration: 2026-05-24
Also published as: JP2007316830A

Description

本発明は、情報処理装置に係り、特に、所望のコンテンツの選択処理に関する。

情報処理装置がコンテンツを記憶し、記憶されたコンテンツを再生する処理が知られている。ここで、コンテンツは、楽曲、人の話した声、機械音、自然界で発生する音声で例えば背景音として用いられる音声、動画等、時間の関数として表される信号や、静止画であるが、以後、楽曲を例に取って説明する。

装置の使用者は、所望の楽曲、例えば好みの楽曲を選択する際、楽曲の名称、アーチスト名等の書誌的事項による。しかしながら、楽曲が記憶される記憶部の記憶容量の増大により、数多くの楽曲が記憶されるようになり、装置の使用者は、所望の楽曲の選択に困難を感じる。特に、携帯型の装置においては、表示部の表示画面が小さく、少数の楽曲の書誌的事項の一覧の表示のみが可能であり、その困難さが顕著である。

更に、使用者は、未知の楽曲が所望の楽曲であるか否かを知るには、その楽曲を試聴する他なく、長時間を必要とする。そのため、所望の楽曲が装置に記憶されていながら所望の楽曲が記憶されていることを知らず、選択することが困難である問題点があった。

そこで、例えば、装置に記憶された楽曲の特徴量を抽出し、抽出された特徴量から印象値を算出し、その楽曲と対応づけて記憶する。一方、使用者は、所望の楽曲の印象の度合いを入力する。そして、装置は、入力された印象の度合いから印象値を算出し、算出された印象値との距離が小さい記憶された印象値を検索し、その検索された印象値に対応づけられた楽曲を所望の楽曲として検索する処理が知られている（例えば、特許文献１参照。）。
特開２００２−２７８５４７号公報（第１８−１９頁、図１）

しかしながら、上述した特許文献１に開示されている方法では、印象の度合いは、事前に定められた、小数の性質であって、使用者の所望の度合いを正確に表現することが不可能であり、その結果、所望の楽曲を検索することができない問題点があった。

本発明は上記問題点を解決するためになされたもので、選択された所望のコンテンツの例及び／または選択された所望でないコンテンツの例に依存して、所望のコンテンツを検索する情報処理装置を提供することを目的とする。

上記目的を達成するために、本発明の情報処理装置は、コンテンツを記憶するコンテンツ記憶手段と、第１種の前記コンテンツを前記コンテンツ記憶手段から検索し、その検索で得られた第１種のコンテンツの特徴量ベクトルから前記第１種のコンテンツからなる第１の集団の特徴量を算出し、コンテンツの特徴量ベクトルの代表ベクトルを中心に前記検索で得られた第１種のコンテンツの特徴量ベクトルと対称なベクトルからの距離が最も小さい、及び／または、その距離が所定の値より小さい特徴量ベクトルを有する第２種のコンテンツを前記コンテンツ記憶手段から検索し、その検索された第２種のコンテンツの特徴量ベクトルから前記第２種のコンテンツからなる第２の集団の特徴量を算出する集団特徴量算出手段と、前記コンテンツ記憶手段に記憶されたコンテンツの特徴量ベクトルと前記集団特徴量算出手段によって算出された第１の集団の特徴量との間の第１の距離と、そのコンテンツの特徴量ベクトルと前記集団特徴量算出手段によって算出された第２の集団の特徴量との間の第２の距離とを算出し、前記第１の距離が前記第２の距離より小さい前記コンテンツを前記第１種のコンテンツとして検索し、及び／または、前記第１の距離が前記第２の距離より大きい前記コンテンツを前記第２種のコンテンツとして検索するコンテンツ検索手段とを有することを特徴とする。

本発明によれば、選択された所望のコンテンツの例及び／または選択された所望でないコンテンツの例に依存して、所望のコンテンツを検索する情報処理装置を提供することができる。

以下に、本発明による情報処理装置及びコンテンツ検索プログラムの実施の形態を、図面を参照して説明する。

（第１の実施形態）
図１は、本発明の第１の実施形態に係るコンテンツ検索プログラムが適用された、本発明の第１の実施形態に係る情報処理装置の構成を示すブロック図である。この情報処理装置は、プログラムを利用して動作するコンピュータであり、装置全体の制御を行う制御部１１と、表示部１２と、入力装置１３と、楽曲登録部２１と、特徴抽出部２２と、コンテンツ記憶部２３と、集団特徴量算出部２４と、辞書記憶部２５と、楽曲検索部２６と、楽曲再生部２７と、楽曲再生用のスピーカ２７ａとからなる。

コンテンツ記憶部２３には、コンテンツ２３ａが記憶される。コンテンツ２３ａは、後で詳述するように、デジタル化されたコンテンツと、そのコンテンツの特徴を示す情報等からなる。辞書記憶部２５には、辞書２５ａが記憶される。辞書２５ａは、後で詳述するように、所望のコンテンツ集団の特徴を示す情報等からなる。

上記のように構成された、本発明の実施形態に係る情報処理装置の各部の動作を説明する。

表示部１２は、制御部１１に制御されることで、カーソルを含む文字・数字や画像データの表示動作を行い、表示されているデータは、入力装置１３からの入力操作等に応答して制御部１１からの指示を受けることで切換わる。

入力装置１３は、数字、ひらがな文字、アルファベット文字及び記号文字を入力するための数字キーと、文字キーと、カーソル移動キーやスクロールキーを含む複数の機能キーとを含むキーからなる。そして、入力装置１３のキーが押下されると、そのキーの識別子が制御部１１に通知され、制御部１１によって、表示部１２に文字として表示され、各部に通知され、または、制御が行われる。また、入力装置１３は、マウス、タッチパネル等、キー以外の入力素子を含んでも良い。

楽曲登録部２１は、楽曲データを受信して、受信された楽曲データの特徴量ベクトルを特徴抽出部２２に抽出させる。そして、受信された楽曲データと、特徴抽出部２２によって抽出された特徴量ベクトルとをコンテンツ記憶部２３にコンテンツ２３ａとして記憶させる。

特徴抽出部２２は、楽曲データを受信して、受信された楽曲データの特徴量ベクトルを抽出して、抽出された特徴量ベクトルを送信する。

集団特徴量算出部２４は、所望のコンテンツ２３ａの例として指定されたコンテンツ２３ａ及び／または所望でないコンテンツ２３ａの例として指定されたコンテンツ２３ａの特徴量ベクトルをコンテンツ記憶部２３から読み出し、それらの特徴量ベクトルから所望のコンテンツ２３ａの集団を示すベクトル及び行列と、所望でないコンテンツ２３ａの集団を示すベクトル及び行列とを算出し、辞書記憶部２５に辞書２５ａとして記憶させる。

楽曲検索部２６は、辞書記憶部２５に記憶された辞書２５ａを参照して、コンテンツ２３ａの特徴量ベクトルから、そのコンテンツ２３ａの所望の度合いを算出する。そして、指定された所望の度合いであるコンテンツ２３ａをコンテンツ記憶部２３から検索する。

楽曲再生部２７は、楽曲検索部２６によって検索されたコンテンツ２３ａの楽曲データをコンテンツ記憶部２３から読み出して、読み出された楽曲データを再生し、スピーカ２７ａから出力させる。

以下、本実施形態に係る情報処理装置における、指定された所望の度合いのコンテンツ２３ａの検索に関する動作を説明する。

図２は、コンテンツ２３ａの構成の一例を示す。このコンテンツ２３ａは、コンテンツ識別子２３ｂと、コンテンツデータ２３ｃと、名称２３ｄと、アーチスト名２３ｅと、アルバム名２３ｆと、特徴量ベクトル２３ｇとからなる。

コンテンツ識別子２３ｂは、コンテンツ２３ａを一意に識別する識別子である。コンテンツデータ２３ｃは、コンテンツ２３ａのデータであり、例えば、楽曲を示すデジタルデータが符号化されたデータである。ただし、符号化されていなくとも良い。

名称２３ｄは、コンテンツ２３ａの名称である。アーチスト名２３ｅは、コンテンツ２３ａが楽曲である場合、その楽曲の演奏者または歌手の名前である。また、コンテンツ２３ａが発話である場合、その発話の発話者である。アルバム名２３ｆは、コンテンツ２３ａが含まれるアルバムの名称である。

特徴量ベクトル２３ｇは、コンテンツデータ２３ｃの特徴を示すベクトルであって、第１の特徴量ベクトル２３ｇ１と、第２の特徴量ベクトル２３ｇ２と、…、第Ｍの特徴量ベクトル２３ｇＭとのＭ本のベクトルからなる。第ｉの特徴量ベクトル２３ｇｉ（１≦ｉ≦Ｍ）は、いずれもＮ次元のベクトルであって、Ｘｉ１、Ｘｉ２、…、ＸｉＮなる要素からなる。

コンテンツ２３ａは、書誌的事項として、名称２３ｄと、アーチスト名２３ｅと、アルバム名２３ｆとを含むとしたが、これに限るものではない。例えば、作曲者名、作詞者名、発売者名等、それら以外の書誌的事項を含むとしても良い。また、これらの書誌的事項は、必須情報ではなく、情報が記憶されていなくとも良い。後で説明するように、所望の度合いによってコンテンツ２３ａを検索して再生するために、コンテンツ識別子２３ｂと、コンテンツデータ２３ｃと、特徴量ベクトル２３ｇとは、必須の情報である。

図３は、辞書２５ａの構成の一例を示す。この辞書２５ａは、辞書識別子２５ｂと、辞書名２５ｃと、第１の重心ベクトル２５ｄと、第１の分散共分散行列の逆行列２５ｅと、第２の重心ベクトル２５ｆと、第２の分散共分散行列の逆行列２５ｇとからなる。

辞書識別子２５ｂは、辞書２５ａを一意に識別する識別子である。辞書名２５ｃは、辞書２５ａの名称である。第１の重心ベクトル２５ｄと、第２の重心ベクトル２５ｆとは、いずれもＮ次元のベクトルであり、コンテンツ２３ａに含まれる特徴量ベクトル２３ｇと同じ次元数のベクトルである。第１の分散共分散行列の逆行列２５ｅと、第２の分散共分散行列の逆行列２５ｇとは、いずれもＮ×Ｎ次元の行列である。

そして、第１の重心ベクトル２５ｄと、第１の分散共分散行列の逆行列２５ｅとは、所望であると指定されたコンテンツ２３ａからなる集団の特徴量を示し、所望であると指定されたコンテンツ２３ａの特徴量ベクトル２３ｇに含まれる各ベクトルの重心と、分布とをそれぞれ示す。

第２の重心ベクトル２５ｆと、第２の分散共分散行列の逆行列２５ｇとは、所望でないと指定されたコンテンツ２３ａからなる集団の特徴量を示し、所望でないと指定されたコンテンツ２３ａの特徴量ベクトル２３ｇに含まれる各ベクトルの重心と、分布とをそれぞれ示す。

楽曲登録部２１は、コンテンツデータと、名称と、アーチスト名と、アルバム名とを受信し、受信されたコンテンツデータと、名称と、アーチスト名と、アルバム名とをそれぞれコンテンツデータ２３ｃと、名称２３ｄと、アーチスト名２３ｅと、アルバム名２３ｆとに設定する。ここで、コンテンツデータは、ＭＰ３方式やＡＡＣ方式で符号化された楽曲データであるが、これに限るものではない。なお、コンテンツデータがアナログデータである場合、楽曲登録部２１は、そのアナログデータをデジタル変換し、更に符号化したデータをコンテンツデータ２３ｃに設定する。

ここで、受信の手段は、例えば、装置はセルラ通信網と通信する通信部（図示せず）を有し、セルラ網を経由して受信するが、これに限るものではない。装置はインターネット通信部（図示せず）を有し、インターネットを経由して受信するとしても良い。また、装置は電子メール送受信部（図示せず）を有し、電子メール送受信部によって受信された電子メールの本文や、そのメールに添付されたファイルとして受信するとしても良い。更に、取り外し可能な記憶媒体を介して受信するとしても良い。

また、名称２３ｄと、アーチスト名２３ｅと、アルバム名２３ｆとは、入力装置１３の所定の操作によって入力された情報であっても良い。

次に、楽曲登録部２１は、コンテンツデータ２３ｃをパラメータとして、特徴抽出部２２を起動する。そして、特徴抽出部２２から送信されたＭ本のＮ次元ベクトルを受信する。そして、特徴抽出部２２から送信されたＭ本のＮ次元ベクトルを特徴量ベクトル２３ｇに設定し、更にコンテンツ２３ａを一意に識別するコンテンツ識別子２３ｂを設定することによって得られたコンテンツ２３ａをコンテンツ記憶部２３に記憶させる。

図４は、特徴抽出部２２がコンテンツデータ２３ｃを受信し、特徴量ベクトル２３ｇであるＭ本のＮ次元ベクトルを作成する動作のフローチャートを示す。

特徴抽出部２２は、コンテンツデータ２３ｃをパラメータとして楽曲登録部２１によって起動されて動作を開始する（ステップＳ２２ａ）。そして、パラメータとして与えられたコンテンツデータ２３ｃが所定の時間間隔で分割され、複数のフレームが作成されたとして、どのＭ個のフレームを選択するかを決定する（ステップＳ２２ｂ）。ここで、この所定の時間間隔は、数秒程度が適切である。また、後述するように、選択されたフレームから特徴量ベクトルが算出される。

また、Ｍ個のフレームを選択する際、それらのフレームのそれぞれから算出されたＭ本の特徴量ベクトルは、与えられたコンテンツデータ２３ｃ全体の特徴を正確に示すベクトルとするため、Ｍは、大きい程良い。しかし、大きい場合、以下に説明する動作の処理量が増大する。そこで、コンテンツデータ２３ｃの再生時間等に依存するものの、Ｍは、数十程度が適切である。

また、上記特徴量ベクトルは、コンテンツデータ２３ｃ全体の特徴を示すベクトルとするため、そのコンテンツデータ２３ｃの全フレームの中で、時間的に略等間隔に位置するフレームを選択することが適切である。ただし、楽曲の冒頭の前奏及び末尾の後奏は、コンテンツデータ２３ｃ全体とは異なる音調であることがあるので、冒頭及び末尾の所定時間に係るフレームは選択しないとしても良い。

次に、特徴抽出部２２は、パラメータとして与えられたコンテンツデータ２３ｃの中で、ステップＳ２２ｂで選択されたＭ個のフレームに相当するデコードされたデータを算出し、デコードされたフレームに対して、モノラル化、及び低域濾波の前処理を施して、特徴抽出部２２内に記憶する（ステップＳ２２ｃ）。

なお、コンテンツデータ２３ｃは符号化されており、そのデータをデコードするには、そのデータを例えばハフマン復号し、周波数情報を得る。そして、その周波数情報を逆量子化処理によって周波数時間変換して波形データを得る。ここで、特徴抽出部２２は、得られた周波数情報を記憶して、後述の処理に用いても良い。この周波数情報を用いる方法によれば、周波数時間変換が不要であり、計算量の削減が可能となる。

そして、特徴抽出部２２内に記憶されたＭ個のフレームの中のフレームを１個ずつ逐次読み込む（ステップＳ２２ｄ）。フレームが尽きて、読み込めなかったか否かを調べ（ステップＳ２２ｅ）、尽きておらず、読み込まれた場合、特徴抽出部２２は、読み込まれたフレームに関する零交差数の平均値と標準偏差を算出する（ステップＳ２２ｆ）。

即ち、特徴抽出部２２は、そのフレームを所定の時間間隔でＮＮ個に分割して、ＮＮ個のサブフレームを作成する。そして、ｎ番目のサブフレーム（０≦ｎ≦ＮＮ−１）の離散波形信号の振幅をＳ（ｎ、ｔ）とする。ここで、ｔは、サブフレーム内の時刻を示す変数であり、０≦ｔ≦Ｔ−１である。すると、ｎ番目のサブフレームの零交差数Ｚｃ（ｎ）は、以下の（式１）が示すように、ある時刻ｔ（１≦ｔ≦Ｔ−１）における振幅と、その時刻の前の時刻ｔ−１における振幅との符号が異なる場合の数として算出される。次に、算出されたＮＮ個の零交差数Ｚｃ（ｎ）の平均値及び標準偏差を算出する（０≦ｎ≦ＮＮ−１）。

次に、特徴抽出部２２は、ステップＳ２２ｄで読み込まれたフレームに関するメル周波数ケプストラム係数の平均値と標準偏差を算出する（ステップＳ２２ｇ）。このメル周波数ケプストラム係数の算出については、後述する。

次に、特徴抽出部２２は、ステップＳ２２ｆで算出された零交差数の平均値と標準偏差と、ステップＳ２２ｇで算出されたメル周波数ケプストラム係数の平均値と標準偏差とを要素とするベクトルを正規化前の特徴量ベクトルｘとし、この特徴量ベクトルを正規化する（ステップＳ２２ｈ）。なお、後述するメル周波数ケプストラム係数の数によって、この特徴量ベクトルの次元が決定されるが、その次元は、Ｎ次元であるとする。

正規化にあたり、特徴抽出部２２は、複数の、なるべく多くのコンテンツ２３ａのフレームに関する正規化前のＭ本の特徴量ベクトルの代表ベクトルμと、それらの特徴量ベクトルと代表ベクトルμとの間の分散行列Σとを記憶する。ここで、代表ベクトルμは、平均ベクトルである。

また、代表ベクトルμと分散行列Σとは、ベクトル量子化によって上記特徴量ベクトルから所定個数のコードベクトルを求め、求められたコードベクトルの平均ベクトルと分散行列Σとしても良い。ここで、コードベクトルは、上記特徴量ベクトルの全てに対して、それぞれの特徴量ベクトルから最も近い距離にあるコードベクトルとの間の距離を求め、その距離の総和が最小になる所定個のベクトルとして算出することによって求めるが、これに限るものではない。

なお、２つのベクトル間の距離は、例えばユークリッド距離、即ち、ベクトルの対応する各要素間の差を二乗し、その二乗された差の総和の平方根として求めるが、これに限るものではない。コードベクトルの数は、上記特徴量ベクトルの数の５０分の１から２０分の１（１／５０〜１／２０）程度が適切であるが、これに限るものではなく、事前に定められていても良い。

この、ベクトル量子化を経て代表ベクトルμと分散行列Σとを求める方法によれば、偏りのあるコンテンツ２３ａから適切な、即ち、無限に多くのコンテンツ２３ａから算出された代表ベクトルμと分散行列Σとに近いものを求めることができる。そこで、上記特徴量ベクトルの数が少ない場合、この方法の効果が顕著である。

これらの代表ベクトルμと、分散行列Σとは、コンテンツ記憶部２３に記憶された全てのコンテンツ２３ａから算出された特徴量ベクトルを用いて算出するとしても良い。また、過去に特徴抽出部２２によってコンテンツ２３ａから算出された特徴量ベクトルを用いても算出されたものでも良い。

なお、分散行列Σは、対角成分のみからなる行列である、即ち、対角成分以外の成分は０であるとしても良い。この、分散行列Σは対角成分のみからなる行列であるとする処理によれば、分散行列Σは、ベクトルとして表現可能であり、使用する記憶容量の削減と、計算量の削減とが可能である。

また、代表ベクトルμ及び分散行列Σは、例えば、装置外部から受信されたものであっても良い。また、装置の出荷時に記憶されていたものであっても良い。なお、複数のベクトルの平均ベクトルとは、複数のベクトルの要素毎の平均値を要素とするベクトルである。

特徴抽出部２２は、正規化された特徴量ベクトルｙを、以下の（式２）のように、分散行列Σの逆行列と、ステップＳ２２ｈで求められた正規化前の特徴量ベクトルｘから代表ベクトルμを減じたベクトルとの乗算により求めて、特徴抽出部２２内に記憶する。

そして、特徴抽出部２２は、ステップＳ２２ｄのフレームを逐次読み込む動作に戻る。一方、ステップＳ２２ｅで、フレームが尽きた場合、特徴抽出部２２は、ステップＳ２２ｈで求められ、特徴抽出部２２内に記憶されたＭ本のＮ次元の特徴量ベクトルを特徴抽出部２２を起動した処理部に送信して（ステップＳ２２ｉ）、動作を終了する（ステップＳ２２ｊ）。

図５は、ステップＳ２２ｇのメル周波数ケプストラム係数の平均値と標準偏差を算出する動作のフローチャートを示す。特徴抽出部２２は、この動作を開始して（ステップＳ２２ｍ）、周波数の高域を強調し（ステップＳ２２ｎ）、ハニング窓関数を乗じて離散フーリェ変換することによって、離散パワースペクトルＰ（ｎ、ｆ）を算出する。ここで、ｆは、周波数を示す変数であり、０≦ｆ≦Ｆである（ステップＳ２２ｏ）。

次に、特徴抽出部２２は、離散パワースペクトルＰ（ｎ、ｆ）をメル周波数間隔で両隣の区間を半分ずつオーバーラップするようにＩ区間に帯域分割し、このＩ区間毎の離散パワースペクトルの総和の対数を算出する。そして、このＩ個の値を離散コサイン変換し、０次からＩ−１次のＩ個のメル周波数ケプストラム係数を各サブフレーム毎に算出する（ステップＳ２２ｐ）。そして、それぞれの係数の各サブフレームに対するＮＮ個の値の平均値と標準偏差を算出してフレームの特徴量とし（ステップＳ２２ｑ）、動作を終了する（ステップＳ２２ｒ）。

なお、特徴抽出部２２は、ステップＳ２２ｆで説明した零交差数の平均値と標準偏差を算出する処理と、ステップＳ２２ｇで説明したメル周波数ケプストラム係数の平均値と標準偏差を算出する処理との２つの処理のどの処理を先に行い、どの処理を後に行っても良いことは明らかである。

以上説明した動作により、特徴抽出部２２は、以下に示す４種の特徴量から算出された特徴量ベクトルを送信する。ここで、零交差数は、コンテンツデータ２３ｃの中心周波数を、メル周波数ケプストラム係数は、スペクトルの傾き等を示し、また、これらの数の標準偏差は、これらの数の時間的な変化を示すので、この特徴量ベクトルは、コンテンツデータ２３ｃの特徴を適切に示すが、特徴量は、これらに限るものではない。

例えば、特徴抽出部２２は、上記特徴量に加えて、または代えて、離散パワースペクトルＰ（ｎ、ｆ）全域の、または上記Ｉ区間に分割された帯域毎の時間変化度を特徴量として用いても良い。

また、特徴抽出部２２は、正規化された特徴量ベクトルを送信するとしたが、これに限るものではなく、正規化前の特徴量ベクトルを送信するとしても良い。後述するように、例えば、集団特徴量算出部２４は、正規化された特徴量ベクトルの逆ベクトルを算出することによって、その特徴量ベクトルと、上記代表ベクトルμを中心に対称であるベクトルを算出する。この処理は、上記代表ベクトルμに２を乗じたベクトルから上記正規化前の特徴量ベクトルを減算する処理によって代えることができる。

また、上記分散行列Σの逆行列との乗算によれば、大きさが正規化された特徴量ベクトルを用いることになるが、その乗算をしないことにより、そのベクトルの正規化されていない大きさを用いるとしても良い。

次に、集団特徴量算出部２４の動作を説明する。図６は、集団特徴量算出部２４の動作のフローチャートを示す。集団特徴量算出部２４は、楽曲再生部２７によって起動され、動作を開始する（ステップＳ２４ａ）。そして、楽曲再生部２７から、所望のコンテンツ２３ａを識別する情報を受信し（ステップＳ２４ｂ）、所望でないコンテンツ２３ａを識別する情報を受信する（ステップＳ２４ｃ）。

ここで、コンテンツ２３ａを識別する情報は、コンテンツ識別子２３ｂであるが、これに限るものではない。名称２３ｄ、アーチスト名２３ｅ、アルバム名２３ｆのいずれか、または、これらが組み合わされたものでも良い。この場合、１つの識別する情報によってコンテンツ２３ａを検索して複数のコンテンツ識別子２３ｂが得られれば、その複数のコンテンツ識別子２３ｂが受信されたものとする。

また、コンテンツ２３ａを識別する情報には、所望の度合いまたは所望でない度合いが付加されていても良い。度合いは正の数であり、数が大きい程、度合いが大きいことを示す。

また、以下に説明するように、ステップＳ２４ｂで所望のコンテンツ２３ａを識別する情報が受信されず（空情報が受信される。）、または、ステップＳ２４ｃで所望でないコンテンツ２３ａを識別する情報が受信されなくとも良いが、いずれか一方は受信されることが必須である。

次に、集団特徴量算出部２４は、所望のコンテンツ２３ａの特徴を示すベクトルを特徴量ベクトル２３ｇを読み出すことによって、更に、新たに特徴量ベクトルを作成することによって得る（ステップＳ２４ｄ）。即ち、ステップＳ２４ｂで所望のコンテンツ２３ａを識別する情報が受信された場合、その情報を検索キーにコンテンツ２３ａを検索し、検索された特徴量ベクトル２３ｇを得る。

更に、ステップＳ２４ｃで所望でないコンテンツ２３ａを識別する情報が受信された場合、集団特徴量算出部２４は、その情報を検索キーにコンテンツ２３ａを検索し、検索された特徴量ベクトル２３ｇの逆ベクトルを作成することによって特徴量ベクトルを得ても良い。

ここで、特徴量ベクトル２３ｇは、Ｍ本のＮ次元ベクトルからなる。特徴量ベクトル２３ｇの逆ベクトルは、Ｍ本のベクトルそれぞれの逆ベクトルからなるＭ本のＮ次元の特徴量ベクトルである。なお、ステップＳ２４ｂで所望のコンテンツ２３ａを識別する情報が受信されなかった場合、上記逆ベクトルを作成することによって特徴量ベクトルを得ることは必須である。

なお、ステップＳ２４ｃで所望でないコンテンツ２３ａを識別する情報が受信された場合、集団特徴量算出部２４は、逆ベクトルを作成するとしたが、逆ベクトルに限るものではない。逆ベクトルを構成するベクトルの各要素に適宜四捨五入等を施しても良い。各要素が２進数で表現されている際、所定の下位ビットを０にしても良い。

また、逆ベクトルを構成するベクトルの各要素に正の数を乗算するとしても良い。１未満の正の数を乗算すれば、ステップＳ２４ｂで受信された所望のコンテンツ２３ａの特徴量ベクトル２３ｇと、乗算されたベクトルとの距離が小さくなるので、後述する楽曲検索部２６によって所望であると判断されるコンテンツ２３ａの範囲を狭くすることができる。また、１を超える数を乗算すれば、上記距離が大きくなるので、所望であると判断されるコンテンツ２３ａの範囲を広くすることができる。

更に、検索された特徴量ベクトル２３ｇより上記逆ベクトルに近い、即ち、検索された特徴量ベクトル２３ｇからの距離が上記逆ベクトルからの距離より大きいベクトルであれば良い。

なお、上記距離の算出は、Ｍ本のベクトルと、Ｍ本のベクトルとの間の距離の算出となる。そこで、例えば、一方のＭ本のそれぞれのベクトルと、他方のＭ本のそれぞれのベクトルとの距離、例えばユークリッド距離を算出し、Ｍ×Ｍ個のユークリッド距離の総和を上記距離とすれば良い。

または、一方のＭ本のベクトルから１本、他方のＭ本のベクトルから１本ずつ選択して組み合わせ、それらの２本のベクトルの間の距離、例えばユークリッド距離を算出する。そして、算出されたＭ個のユークリッド距離の総和であって、上記組み合わせを変更することによって得られる最小の総和であるとしても良い。また、それぞれのＭ本のベクトルの平均ベクトル間の距離としても良い。ここで、平均ベクトルとは、ベクトルの要素ごとに平均値を算出し、算出された平均値を要素とするベクトルである。

そして、集団特徴量算出部２４は、ステップＳ２４ｄで得られた特徴量ベクトルから、重心ベクトルと、分散共分散行列の逆行列を算出する（ステップＳ２４ｅ）。重心ベクトルは、Ｎ次元のベクトルであり、各特徴量ベクトルにステップＳ２４ｂまたはステップＳ２４ｃで受信された度合いを重みとして乗じたベクトルの平均ベクトルであるが、これに限るものではない。例えば、読み出された特徴量ベクトル２３ｇに限って度合いを乗じるとしても良い。また、度合いを乗じず、重心ベクトルは、平均ベクトルであるとしても良い。分散共分散行列の逆行列は、Ｎ×Ｎ次元の行列である。

なお、上記分散共分散行列は、対角成分のみからなる行列である、即ち、対角成分以外の成分は０であるとしても良い。この場合、上記分散共分散行列の逆行列は、対角成分のみからなる行列である、即ち、対角成分以外の成分は０である。この、分散共分散行列及び分散共分散行列の逆行列は対角成分のみからなる行列であるとする処理によれば、これらの行列は、ベクトルとして表現可能であり、使用する記憶容量の削減と、計算量の削減とが可能である。

次に、集団特徴量算出部２４は、所望でないコンテンツ２３ａの特徴量ベクトルを特徴量ベクトル２３ｇを読み出すことによって、または、新たに作成することによって得る（ステップＳ２４ｆ）。この動作は、既に説明したステップＳ２４ｄの所望のコンテンツ２３ａの特徴量ベクトルを得る動作と同様である。

即ち、ステップＳ２４ｂで受信された所望のコンテンツ２３ａを識別する情報に代えてステップＳ２４ｃで受信された所望でないコンテンツ２３ａを識別する情報を用い、ステップＳ２４ｃで受信された所望でないコンテンツ２３ａを識別する情報に代えてステップＳ２４ｂで受信された所望のコンテンツ２３ａを識別する情報を用いる点が相違する他は同一であるので、説明を省略する。

そして、集団特徴量算出部２４は、ステップＳ２４ｆで得られた特徴量ベクトルから、重心ベクトルと、分散共分散行列の逆行列を算出する（ステップＳ２４ｇ）。重心ベクトルと、分散共分散行列の逆行列の算出は、ステップＳ２４ｅで説明した通りであり、例えば、読み出された特徴量ベクトル２３ｇに限って度合いを乗じるとしても良い。

次に、集団特徴量算出部２４は、ステップＳ２４ｅで得られた重心ベクトルを第１の重心ベクトル２５ｄに、ステップＳ２４ｅで得られた分散共分散行列の逆行列を第１の分散共分散行列の逆行列２５ｅに、ステップＳ２４ｇで得られた重心ベクトルを第２の重心ベクトル２５ｆに、ステップＳ２４ｇで得られた分散共分散行列の逆行列を第２の分散共分散行列の逆行列２５ｇに設定する。

更に、集団特徴量算出部２４は、辞書２５ａを識別する情報を入力装置１３の所定の操作によって入力し、入力された辞書２５ａを識別する情報を辞書名２５ｃに設定し、更に、辞書２５ａを一意に識別する辞書識別子２５ｂを設定することによって得られた辞書２５ａを辞書記憶部２５に記憶させて（ステップＳ２４ｈ）、動作を終了する（ステップＳ２４ｉ）。

なお、集団特徴量算出部２４は、ステップＳ２４ｂ、ステップＳ２４ｄ及びステップＳ２４ｅで説明した所望のコンテンツ２３ａに関する３段階からなる処理は、この順で行う必要がある。また、ステップＳ２４ｃ、ステップＳ２４ｆ及びステップＳ２４ｇで説明した所望でないコンテンツ２３ａに関する３段階からなる処理は、この順で行う必要がある。しかし、これらの２つの処理のどの処理を先に行い、どの処理を後に行っても良いことは明らかである。また、一方の処理のある段階の実行と、他方の処理のある段階の実行の後先が任意であることは明らかである。

ここで、以上の説明で、所望であるか否かについて、単に好むか否かであると説明したが、これに限るものではない。例えば、使用者は、聴取した際の印象によってある種類に分類された楽曲や、ある状況において聴取することを好む楽曲を、それぞれ独立して所望であるか否かを指定し、それぞれによって異なる辞書２５ａを作成させるとしても良い。その場合、辞書名２５ｃは、例えば、「海を連想させるような感じ」、「通勤時にぴったりな感じ」等とすれば良い。更に、所望であることは好まないことに相当し、所望でないことは好むことに相当するとしても良く、何ら支障を生じない。

上記の説明は、辞書２５ａが作成されていない場合に、集団特徴量算出部２４が辞書２５ａを作成する場合の動作の説明であったが、集団特徴量算出部２４の動作は、これに限るものではない。即ち、辞書２５ａが作成され、辞書記憶部２５に記憶されている場合、その記憶されている辞書２５ａの作成に用いられなかったコンテンツ２３ａを識別する情報をステップＳ２４ｂ及びステップＳ２４ｃで受信し、受信された情報によって、記憶されている辞書２５ａを修正する、学習処理を行っても良い。

この学習処理にあたり、集団特徴量算出部２４は、記憶されている辞書２５ａの作成に用いられたコンテンツ２３ａを識別する情報を集団特徴量算出部２４内に記憶し、または辞書記憶部２５に記憶させ、その記憶された情報と上記受信された情報とから新たに辞書２５ａを作成しても良い。

また、記憶されている辞書２５ａの作成の際に重心ベクトルの算出に用いられた重みの合計値と、分散共分散行列を集団特徴量算出部２４内に記憶し、または辞書記憶部２５に記憶させ、その記憶された合計値及び行列とを、上記受信された情報によって更新して辞書２５ａを作成しても良い。この更新処理によれば、新たに作成する処理に比較して、計算量の減少が可能となる。

なお、集団特徴量算出部２４は、楽曲再生部２７によって起動されるとしたが、これに限るものではない。他の処理部によって起動されるとしても良い。その場合、集団特徴量算出部２４は、ステップＳ２４ｂ及びステップＳ２４ｃで受信されるコンテンツ２３ａを識別する情報を、起動した処理部から受信する。また、起動に際し、入力装置１３の所定のキー操作によって起動の了解が得られたと判断された場合に限って処理を行うとしても良い。更に、集団特徴量算出部２４は、入力装置１３の所定の操作によって起動されても良い。

ここで、図７を参照して、集団特徴量算出部２４によって、受信された所望のコンテンツ２３ａの特徴量ベクトルと、所望でないコンテンツ２３ａの特徴量ベクトルとから、辞書２５ａが作成される際のデータの流れの概要を説明する。なお、この説明は、概要の説明であり、必ずしも全ての場合を網羅したものではない。

ステップＳ２４ｂで受信された所望のコンテンツ２３ａの識別子からそのコンテンツ２３ａの特徴量ベクトル２３ｇがステップＳ２４ｄで検索される。その検索された特徴量ベクトル２３ｇに併せ、ステップＳ２４ｃで受信された所望でないコンテンツ２３ａの識別子からそのコンテンツ２３ａの特徴量ベクトル２３ｇを得て、そのベクトルの逆ベクトルがステップＳ２４ｄで作成されて、ステップＳ２４ｅの重心ベクトルと、分散共分散行列の逆行列の算出に用いられる。

また、ステップＳ２４ｃで受信された所望でないコンテンツ２３ａの識別子からそのコンテンツ２３ａの特徴量ベクトル２３ｇがステップＳ２４ｆで検索される。その検索された特徴量ベクトル２３ｇに併せ、ステップＳ２４ｂで受信された所望のコンテンツ２３ａの識別子からそのコンテンツ２３ａの特徴量ベクトル２３ｇを得て、そのベクトルの逆ベクトルがステップＳ２４ｆで作成されて、ステップＳ２４ｇの重心ベクトルと、分散共分散行列の逆行列の算出に用いられる。

ステップＳ２４ｅで算出された重心ベクトルと、分散共分散行列の逆行列、更に、ステップＳ２４ｇで算出された重心ベクトルと、分散共分散行列の逆行列とが辞書２５ａとして記憶される。

次に、楽曲検索部２６の動作を説明する。楽曲検索部２６は、入力装置１３の所定の操作に従い制御部１１によって起動されて動作を開始する。そして、入力装置１３の所定の操作に従って、名称２３ｄと、アーチスト名２３ｅと、アルバム名２３ｆとのいずれか、もしくは組合せを検索キーにコンテンツ２３ａを検索して、検索されたコンテンツ２３ａを順序付けする。

または、辞書２５ａを参照してコンテンツ２３ａを所望の程度に従って順序付けする。更には、これらの２つの順序付けを組み合わせて順序付けする。そして、所定の順位に順序付けされたコンテンツ２３ａの名称２３ｄと、アーチスト名２３ｅと、アルバム名２３ｆとの１つまたは複数の組を表示部１２に表示する。

そして、入力装置１３の所定の操作に従って、表示された名称２３ｄと、アーチスト名２３ｅと、アルバム名２３ｆとの１つまたは複数の中の１つが選択されると、楽曲検索部２６は、楽曲再生部２７を起動し、その選択されたコンテンツ２３ａのコンテンツデータ２３ｃを楽曲再生部２７に送信して再生させる。

なお、表示部１２の表示画面の大きさに依存して、上記表示するものは、一部のみを表示し、残部は、スクロールによって表示されるとする。また、楽曲検索部２６は、表示するものから一部を乱数に基づいて、コンテンツ２３ａに要する記憶容量が所定の容量以内であるように、所定の再生時間以内であるように、または、所定の楽曲数を選択し、選択されたものを表示しても良い。

また、表示部１２に表示することに限るものではない。表示するコンテンツ２３ａのコンテンツ識別子２３ｂの連結からなるプレイリストを作成し、コンテンツ記憶部２３に記憶させるとしても良い。また、通信部を制御して送信させても良い。

コンテンツデータ２３ｃが楽曲再生部２７によって再生されている際、入力装置１３の所定の操作によって、そのコンテンツ２３ａが所望であると入力されると、楽曲検索部２６は、コンテンツ識別子２３ｂと、所望である旨とを楽曲検索部２６内に記憶する。所望の度合いが併せて入力された場合、その度合いを併せて記憶する。また、そのコンテンツ２３ａが所望でないと入力されると、楽曲検索部２６は、コンテンツ識別子２３ｂと、所望でない旨とを楽曲検索部２６内に記憶する。所望でない度合いが併せて入力された場合、その度合いを併せて記憶する。

なお、コンテンツデータ２３ｃが楽曲再生部２７によって再生されている際、その再生が開始されてから所定の経過時間以内に入力装置１３の所定の操作によって異なるコンテンツデータ２３ｃの再生が指示された場合、楽曲検索部２６は、そのコンテンツ２３ａが所望でないと入力されたとみなしても良い。短時間で聴取を中止されたことは、所望でないと判断されるからである。

図８は、楽曲検索部２６が、辞書２５ａを参照してコンテンツ２３ａを所望の程度に従って順序付けし、所定の順位に順序付けされたコンテンツ２３ａの名称２３ｄと、アーチスト名２３ｅと、アルバム名２３ｆとの１つまたは複数を表示部１２に表示する動作のフローチャートを示す。

楽曲検索部２６は、入力装置１３の所定の操作によって上記辞書２５ａを参照してコンテンツ２３ａを所望の程度に従って順序付けして、所定の順位に順序付けされたコンテンツ２３ａの名称２３ｄと、アーチスト名２３ｅと、アルバム名２３ｆとの１つまたは複数を表示部１２に表示する動作を開始する（ステップＳ２６ａ）。

そして、楽曲検索部２６は、入力装置１３の操作によって入力された辞書名と辞書名２５ｃとが等しい辞書２５ａを辞書記憶部２５から検索し、その検索された辞書２５ａの第１の重心ベクトル２５ｄと、第１の分散共分散行列の逆行列２５ｅと、第２の重心ベクトル２５ｆと、第２の分散共分散行列の逆行列２５ｇとを読み出す（ステップＳ２６ｂ）。

次に、楽曲検索部２６は、コンテンツ２３ａの特徴量ベクトル２３ｇを逐次コンテンツ記憶部２３から読み込む（ステップＳ２６ｃ）。ここで、コンテンツ２３ａが尽きて読み込めなかったか、尽きずに読み込めたかを調べる（ステップＳ２６ｄ）。

コンテンツ２３ａが尽きずに読み込まれた場合、楽曲検索部２６は、その特徴量ベクトル２３ｇを構成する第１〜第Ｍの特徴量ベクトル２３ｇ１〜２３ｇＭとのそれぞれと、ステップＳ２６ｂで読み込まれた第１の重心ベクトル２５ｄと、第１の分散共分散行列の逆行列２５ｅとによって示される集団（第１の集団と称する。）との距離（第１の距離と称する。）、及びその集団との類似度（第１の類似度と称する。）とを算出する。ここで、第１の類似度は、第１の距離が大きい程小さく、第１の距離が小さい程大きい。

更に、楽曲検索部２６は、上記第１〜第Ｍの特徴量ベクトル２３ｇ１〜２３ｇＭとのそれぞれと、ステップＳ２６ｂで読み込まれた第２の重心ベクトル２５ｆと、第２の分散共分散行列の逆行列２５ｇとによって示される集団（第２の集団と称する。）との距離（第２の距離と称する。）、及びその集団との類似度（第２の類似度と称する。）とを算出する。ここで、第２の類似度は、第２の距離が大きい程小さく、第２の距離が小さい程大きい（ステップＳ２６ｅ）。

例えば、上記第ｍの特徴量ベクトル２３ｇｍをｘｍ（１≦ｍ≦Ｍ）とし、第ｉの集団との距離をマハラノビス距離とし、第ｉの類似度は、そのマハラノビス距離に１を加えた値の逆数とする（ｉ＝１、２）。即ち、第１の重心ベクトル２５ｄをｖｇ１、第１の分散共分散行列の逆行列２５ｅをＤ１、第２の重心ベクトル２５ｆをｖｇ２、第２の分散共分散行列の逆行列２５ｇをＤ２とすると、第ｉの類似度Ｓｉ（ｉ＝１、２）は、以下の（式３）によって算出される。

なお、上記説明では、第ｉの集団との第ｉの距離としてマハラノビス距離を用いると説明したが、これに限るものではない。例えば、第ｉの距離は、上記第ｍの特徴量ベクトル２３ｇｍと、ｖｇｉ（第１の重心ベクトル２５ｄまたは第２の重心ベクトル２５ｆ。）との間の距離、例えばユークリッド距離であるとしても良い（ｉ＝１、２）。

第ｉの距離としてベクトル間の距離を用いると、その距離の算出に第１の分散共分散行列の逆行列２５ｅ及び第２の分散共分散行列の逆行列２５ｇが用いられないので、これらを算出しない。そこで、計算量の削減が可能になる。一方、マハラノビス距離等のベクトルと集団との間の距離を用いると、第１の分散共分散行列の逆行列２５ｅと、第２の分散共分散行列の逆行列２５ｇとが異なる場合、適切な第ｉの類似度Ｓｉ（ｉ＝１、２）を算出することができる。

また、上記距離は、ベクトル量子化を用いた距離であるとしても良い。楽曲検索部２６は、集団特徴量算出部２４のステップＳ２４ｄの動作で得られた所望のコンテンツの特徴量ベクトルをベクトル量子化して所定個数のコードベクトルを算出し、算出されたコードベクトルと第ｍの特徴量ベクトル２３ｇｍとの間のユークリッド距離の中で最小である距離を第１の距離とする。

同様に、楽曲検索部２６は、集団特徴量算出部２４のステップＳ２４ｆの動作で得られた所望でないコンテンツの特徴量ベクトルをベクトル量子化して所定個数のコードベクトルを算出し、算出されたコードベクトルと第ｍの特徴量ベクトル２３ｇｍとの間のユークリッド距離の中で最小である距離を第２の距離とする。

ここで、第１の距離を算出するためのコードベクトルの数と、第２の距離を算出するためのコードベクトルの数とは等しいとするが、これに限るものではない。なお、ベクトル量子化を用いた距離を用いるか否かは、特徴抽出部２２によってベクトル量子化によるコードベクトル算出が行われたか否かとは無関係である。また、距離を算出するためのコードベクトルの数と、特徴抽出部２２によって算出されたコードベクトルの数とは無関係である。

また、ガウス混合モデルを用いた確率的距離であるとしても良い。即ち、楽曲検索部２６は、集団特徴量算出部２４のステップＳ２４ｄの動作で得られた所望のコンテンツの特徴量ベクトルを複数のガウス分布が混合された分布として表現する。そして、この混合されたガウス分布における第ｍの特徴量ベクトル２３ｇｍの生起確率の逆数、またはその生起確率の対数値の逆数を第１の距離とする。

同様に、集団特徴量算出部２４のステップＳ２４ｆの動作で得られた所望でないコンテンツの特徴量ベクトルを複数のガウス分布が混合された分布として表現する。そして、この混合されたガウス分布における第ｍの特徴量ベクトル２３ｇｍの生起確率の逆数、またはその生起確率の対数値の逆数を第２の距離とする。

また、ヒストグラムを用いた確率的距離であるとしても良い。即ち、楽曲検索部２６は、集団特徴量算出部２４のステップＳ２４ｄの動作で得られた所望のコンテンツの特徴量ベクトルの要素毎にヒストグラムを作成し、そのヒストグラムにおける第ｍの特徴量ベクトル２３ｇｍの生起確率の逆数、またはその生起確率の対数値の逆数を第１の距離とする。

同様に、集団特徴量算出部２４のステップＳ２４ｆの動作で得られた所望でないコンテンツの特徴量ベクトルの要素毎にヒストグラムを作成し、そのヒストグラムにおける第ｍの特徴量ベクトル２３ｇｍの生起確率の逆数、またはその生起確率の対数値の逆数を第２の距離とする。

これらのガウス混合モデルを用いた確率的距離及びヒストグラムを用いた確率的距離を用いる際、距離は、生起確率の逆数、またはその生起確率の対数値の逆数であるとしたが、これに限るものではない。距離は、生起確率、またはその生起確率の対数値に対して非増加関数であれば良い。

これらのベクトル量子化を用いた距離、ガウス混合モデルを用いた確率的距離及びヒストグラムを用いた確率的距離を用いる方法によれば、集団特徴量算出部２４のステップＳ２４ｅ及びステップＳ２４ｇで説明した重心ベクトルと、分散共分散行列の逆行列の算出が不要となる。その算出に代えて、集団特徴量算出部２４が、それぞれの方法に対応してコードベクトル、複数のガウス分布が混合された分布または要素毎のヒストグラムを算出するとしても良い。

なお、集団特徴量算出部２４の動作の際、図６に示すフローチャートのステップＳ２４ｂで所望のコンテンツ２３ａを識別する情報が入力され、かつ、ステップＳ２４ｃで所望でないコンテンツ２３ａを識別する情報が入力された場合、第１の分散共分散行列の逆行列２５ｅと、第２の分散共分散行列の逆行列２５ｇとが大きく異なる可能性があり、マハラノビス距離等のベクトルと集団との間の距離を用いる効果が大きい。

上記のように、Ｍ本のベクトルｘｍに対して、第１の類似度Ｓ１と第２の類似度Ｓ２が算出されると、楽曲検索部２６は、コンテンツ２３ａが使用者によって所望される程度である、類似度Ｒを算出する。この類似度Ｒは、第１の類似度Ｓ１が大きいほど大きく、第２の類似度Ｓ２が大きいほど小さい。

例えば、楽曲検索部２６は、第１の類似度Ｓ１が第２の類似度Ｓ２に所定の定数Ｔ１を加えた値より大きいベクトルの数Ｃｎｔを求める（０≦Ｃｎｔ≦Ｍ）。ここで、Ｔ１は、所定の定数であり、例えば、０である。そして、上記Ｃｎｔが大きいとステップＳ２６ｃで読み込まれたコンテンツ２３ａの特徴量ベクトル２３ｇの類似度Ｒは大きく、上記Ｃｎｔが小さいと、上記類似度Ｒは小さいと算出して（ステップＳ２６ｆ）、ステップＳ２６ｃのコンテンツ２３ａの特徴量ベクトル２３ｇを逐次読み込む動作に移る。

ここで、Ｃｎｔと、上記類似度Ｒとは、例えば、それぞれ以下の（式４−１）、（式４−２）によって算出される。

この類似度Ｒが大きいほど、ステップＳ２６ｃで読み込まれたコンテンツ２３ａは、ステップＳ２６ｂで読み込まれた辞書２５ａに従うと、使用者の所望のコンテンツ２３ａである可能性が高い。

一方、ステップＳ２６ｄで、コンテンツ２３ａの特徴量ベクトル２３ｇが尽きて読み込まれなかった場合、楽曲検索部２６は、ステップＳ２６ｆで算出された類似度Ｒに従って、コンテンツ２３ａを識別する情報を順序付け、即ちソートする。そして、類似度Ｒが所定の範囲であるコンテンツ２３ａを識別する情報を表示部１２に表示して（ステップＳ２６ｇ）、動作を終了する（ステップＳ２６ｈ）。

ステップＳ２６ｇで、表示部１２に識別情報を表示するコンテンツ２３ａは、例えば、類似度Ｒが大きいものである。また、類似度Ｒが小さいものである。また、類似度Ｒが所定の範囲の値のものである。ここで、類似度Ｒが大きいものを表示すると、使用者は、普段所望する、即ち好みの楽曲を聴取するのに適している。また、類似度Ｒが小さいものを表示すると、使用者は、普段所望しない、即ち再生することの少ない楽曲を試聴するのに適している。また、類似度Ｒが所定の値の範囲のものを表示すると、使用者は、普段所望しないながら、所望する楽曲と大きく所望の程度が異なることのない楽曲を試聴するのに適している。

なお、楽曲検索部２６は、ステップＳ２６ｅで特徴量ベクトル２３ｇを構成する第１〜第Ｍの特徴量ベクトル２３ｇ１〜２３ｇＭのそれぞれと、第１の集団との距離を算出し、更に、上記第１〜第Ｍの特徴量ベクトル２３ｇ１〜２３ｇＭのそれぞれと、第２の集団との距離を算出する際、Ｎ次元である第１〜第Ｍの特徴量ベクトル２３ｇ１〜２３ｇＭのＮ未満の要素を用いて算出しても良い。

例えば、第ｉ要素（１≦ｉ≦Ｎ）を取り除いたベクトルによって距離を算出する場合、第１の重心ベクトル２５ｄと、第２の重心ベクトル２５ｆの第ｉ要素を取り除いたベクトルを用い、第１の分散共分散行列の逆行列２５ｅと、第２の分散共分散行列の逆行列２５ｇとの第ｉ行及び第ｉ列の要素を取り除いた行列を用いる。

取り除く要素は、第１の分散共分散行列の逆行列２５ｅ及び／または第２の分散共分散行列の逆行列２５ｇの第ｉ行及び第ｉ列の値が小さい場合、第ｉ要素を取り除くとする。これにより、分散が大きい、即ち、第１の集団との距離及び／または第２の集団との距離への寄与が少ない要素を取り除くことによって、類似度Ｒへの影響を少なくし、かつ、計算量の削減が可能となる。この削減の効果は、コンテンツ記憶部２３に多くのコンテンツ２３ａが記憶されている場合、顕著である。

ここで、図９を参照して、楽曲検索部２６によって、辞書２５ａを参照してコンテンツ２３ａを所望の程度に従って順序付けされることによって、所望の楽曲が検索される概念を説明する。なお、この説明は、概念の説明であり、必ずしも算出される値に対応するものではない。

図９に示すように、楽曲の特徴は、「非常に暗い曲」、「暗い曲」、「やや暗い曲」「明暗曖昧曲」、「やや明るい曲」、「明るい曲」及び「非常に明るい曲」からなる順序付けられた７段階及び隣り合う２つの段階の中間であることによって表されるとする。そして、楽曲は、その特徴が「明暗曖昧曲」である平均的な楽曲を境にいずれにあるかによって、「比較的暗い曲」と、「比較的明るい曲」とに分けられる。

使用者の所望の楽曲は、「やや明るい曲」であるとし、聴取済みの所望の楽曲が集団特徴量算出部２４に与えられることにより、辞書２５ａで、所望の楽曲の集団を示す第１の重心ベクトル２５ｄは、「やや明るい曲」を示し、所望でない楽曲の集団を示す第２の重心ベクトル２５ｆは、「やや暗い曲」を示している。

そこで、所望の楽曲を楽曲検索部２６に検索させると、楽曲検索部２６は、第１の重心ベクトル２５ｄが示す「やや明るい曲」に近く、そして、第２の重心ベクトル２５ｆが示す「やや暗い曲」から遠い特徴の楽曲を検索し、図９に示す第１の検索結果が得られる。即ち、第１の検索結果は、所望の「やや明るい曲」から明暗双方向に対称の範囲にある楽曲を示す第２の検索結果ではない。そこで、使用者が所望しない「比較的暗い曲」を含むことがなく、使用者の意図する検索結果が得られる。

なお、所望の「やや明るい曲」から明暗双方向に対称の範囲にある楽曲を示し、使用者の検索の意図から外れる「比較的暗い曲」を含む第２の検索結果は、第２の重心ベクトル２５ｆの概念、即ち、使用者の所望しない楽曲の概念を用いない場合の検索結果を示す。

次に、図１０を参照して、本実施形態に係る情報処理装置における、コンテンツ２３ａの流れ（図では、２重線矢印で示す。）、特徴量の流れ（図では、実線矢印で示す。）及びコンテンツ２３ａ指定の流れ（図では、破線矢印で示す。）の概略について説明する。なお、この説明は、情報の流れの概略であって、細部の動作全てを示すものではない。

コンテンツは、楽曲登録部２１によって受信され、楽曲登録部２１は、受信されたコンテンツをコンテンツデータ２３ｃとしてコンテンツ２３ａに記憶させ、更に、特徴抽出部２２に送信する。特徴抽出部２２は、受信されたコンテンツデータ２３ｃから特徴量ベクトルを抽出して、特徴量ベクトル２３ｇとしてコンテンツ２３ａに記憶させる。

入力装置１３から入力された所望のコンテンツ２３ａの指定が受信されると、集団特徴量算出部２４は、コンテンツ２３ａの特徴量ベクトル２３ｇを参照して、上記所望のコンテンツ２３ａの検索に必要な特徴量ベクトルを検索及び／または作成して、重心ベクトル等の特徴量を辞書２５ａに記憶させる。楽曲検索部２６は、辞書２５ａに記憶された特徴量を参照して、コンテンツ２３ａから所望のコンテンツ２３ａを検索し、検索されたコンテンツデータ２３ｃを楽曲再生部２７に送信する。楽曲再生部２７は、受信されたコンテンツデータ２３ｃを再生して、スピーカ２７ａから音声を発生させる。

以上の説明では、コンテンツ２３ａに含まれるコンテンツデータ２３ｃは、符号化されたデータであるとしたが、これに限るものではない。デコードされたデータであっても良い。

以上の説明は、楽曲検索部２６によって、辞書２５ａを参照して所望の楽曲が検索される概念を例に説明したが、楽曲の検索に限るものではない。例えば、コンテンツ記憶部２３には、楽曲であるコンテンツ２３ａと、人の声からなるコンテンツ２３ａが記憶されている場合、いずれか一方を所望のコンテンツ２３ａであり、他方を所望でないコンテンツ２３ａとして集団特徴量算出部２４に辞書２５ａを作成させても良い。このように辞書２５ａが作成された場合、楽曲検索部２６によって、楽曲であるコンテンツ２３ａと、人の声からなるコンテンツ２３ａとのいずれか一方を検索させることが可能である。

ここで、楽曲であるコンテンツ２３ａと、人の声からなるコンテンツ２３ａとでは、含まれる周波数成分の分布が異なることが知られており、それぞれのコンテンツ２３ａの集団の特徴（重心ベクトル及び分散共分散行列の逆行列）は異なるので、上記検索が可能となる。

以上の説明は、楽曲検索部２６が、コンテンツ記憶部２３に記憶されたコンテンツ２３ａを所望の程度に従って順序付けするとしたが、これに限るものではない。楽曲検索部２６は、通信部によって受信されているコンテンツデータの類似度Ｒを辞書２５ａを参照して算出するとしても良い。そして、その類似度Ｒが第１の所定の値以上である場合及び／または第２の所定の値以下である場合、楽曲再生部２７を制御して、スピーカ２７ａから所定の音声を出力させて報知するとしても良い。

この場合、通信部は、放送を受信し、楽曲検索部２６は、放送された楽曲であるコンテンツデータの類似度Ｒを算出するとしても良い。更に、受信された楽曲の冒頭の、例えば数秒間のデータによって類似度Ｒを算出するとしても良い。冒頭のデータによって算出する場合、そのコンテンツデータからＭ本の特徴量ベクトルを算出しても良く、また、Ｍ本未満の特徴量ベクトルを算出して類似度Ｒを算出するとしても良い。

また、上記報知は、スピーカ２７ａから所定の音声を出力することに限るものではない。例えば、装置はバイブレータ（図示せず）を有し、バイブレータの振動によって報知するとしても良い。この報知動作によれば、例えば、ラジオ放送が受信されている際、装置の使用者の好みの楽曲の放送が開始された場合、使用者に好みの楽曲が放送中であることを報知することができる。

以上の説明では、辞書２５ａは、集団特徴量算出部２４によって作成されるとしたが、これに限るものではない。例えば、装置外部から受信されたものであっても良い。また、装置の出荷時に含まれているものであっても良い。

以上の説明では、辞書２５ａは、辞書記憶部２５に記憶されるとしたが、これに限るものではない。集団特徴量算出部２４によって作成され、楽曲検索部２６に送信されるとしても良い。

（第２の実施形態）
第２の実施形態が第１の実施形態と異なる点は、集団特徴量算出部２４の動作にある。そこで、第２の実施形態の集団特徴量算出部２４の動作を、図面を参照して説明する。図１１は、第２の実施形態の係る集団特徴量算出部２４の動作のフローチャートを示す。なお、第１の実施形態に係る集団特徴量算出部２４の動作と同じ動作ステップについては、同じ符号を付し、その部分の説明を省略する。

第１の実施形態に係る集団特徴量算出部２４のステップＳ２４ｄの動作で、集団特徴量算出部２４は、所望のコンテンツ２３ａの特徴量ベクトル２３ｇを得ることに加え、所望でないコンテンツ２３ａの特徴量ベクトル２３ｇの逆ベクトルを用いるとした。

第２の実施形態に係る集団特徴量算出部２４は、第１の実施形態に係る集団特徴量算出部２４によって、所望でないコンテンツ２３ａの特徴量ベクトル２３ｇの逆ベクトルによって仮に辞書２５ａを作成する。そして、楽曲検索部２６を制御して、仮の辞書２５ａに含まれる第１の重心ベクトル２５ｄと、第１の分散共分散行列の逆行列２５ｅとで示される集団との第１の距離が最も小さい、即ち、第１の類似度Ｓ１が最も大きいコンテンツ２３ａを検索させる。

なお、上記の条件の他、第１の距離が所定の値以下である、即ち、第１の類似度Ｓ１が所定の値以上であるとの条件を加えて付し、または代えて用いても良い。これによれば、上記検索によってコンテンツ２３ａが得られない可能性があることにより、不適切な所望のコンテンツ２３ａが検索されることを防ぐことができる。

そして、第１の実施形態に係る集団特徴量算出部２４は、所望でないコンテンツ２３ａの特徴量ベクトル２３ｇの逆ベクトルを用いることに代えて、第２の実施形態に係る集団特徴量算出部２４は、上記検索されたコンテンツ２３ａの特徴量ベクトル２３ｇを所望のコンテンツ２３ａの特徴量ベクトル２３ｇとして用いて辞書２５ａを作成する（ステップＳ２４ｍ）。

同様に、第１の実施形態に係る集団特徴量算出部２４のステップＳ２４ｆの動作に代えて、第２の実施形態に係る集団特徴量算出部２４は、所望のコンテンツ２３ａの特徴量ベクトル２３ｇの逆ベクトルによって仮に辞書２５ａを作成する。そして、楽曲検索部２６を制御して、仮の辞書２５ａに含まれる第２の重心ベクトル２５ｆと、第２の分散共分散行列の逆行列２５ｇとによって示される集団との第２の類似度Ｓ２が最も大きいコンテンツ２３ａを検索させ、検索されたコンテンツ２３ａの特徴量ベクトル２３ｇを所望でないコンテンツ２３ａの特徴量ベクトル２３ｇとして用いて辞書２５ａを作成する（ステップＳ２４ｎ）。

これらの処理によれば、以後の処理で用いられる特徴量ベクトル２３ｇは、全てがコンテンツ２３ａに記憶されており、架空のものは含まれない。そのため、以後算出される第１の重心ベクトル２５ｄと、第１の分散共分散行列の逆行列２５ｅと、第２の重心ベクトル２５ｆと、第２の分散共分散行列の逆行列２５ｇとは、記憶されたコンテンツ２３ａに一層適切に依存したものとなる。

なお、上記の処理に代えてステップＳ２４ｍでは、所望でないコンテンツ２３ａの特徴量ベクトル２３ｇの逆ベクトルと距離が小さい特徴量ベクトル２３ｇをコンテンツ２３ａから検索し、検索された特徴量ベクトル２３ｇを所望のコンテンツ２３ａの特徴量ベクトル２３ｇとして用いても良い。

また、ステップＳ２４ｎでは、所望のコンテンツ２３ａの特徴量ベクトル２３ｇの逆ベクトルと距離が小さい特徴量ベクトル２３ｇをコンテンツ２３ａから検索し、検索された特徴量ベクトル２３ｇを所望でないコンテンツ２３ａの特徴量ベクトル２３ｇとして用いても良い。

これらの処理によれば、仮の辞書２５ａを作成する負荷が減少する。なお、上記距離の算出は、Ｍ本のベクトルと、Ｍ本のベクトルと間の距離の算出となるが、この距離については、既に説明した通りである。なお、これらの場合、上記距離が所定の値以下であるとの条件を加えて付し、または代えて用いても良い。これによれば、上記検索によってコンテンツ２３ａが得られない可能性があることにより、不適切な所望でないコンテンツ２３ａが検索されることを防ぐことができる。

なお、第２の実施形態に係る集団特徴量算出部２４は、ステップＳ２４ｂ、ステップＳ２４ｍ及びステップＳ２４ｅで説明した所望のコンテンツ２３ａに関する処理は、この順で行う必要がある。また、ステップＳ２４ｃ、ステップＳ２４ｎ及びステップＳ２４ｇで説明した所望でないコンテンツ２３ａに関する処理は、この順で行う必要がある。しかし、これらの処理のどれを先に行い、どれを後に行っても良いことは、第１の実施形態に係る集団特徴量算出部２４の動作説明で説明した通りである。

（その他の実施形態）
上記の各実施形態では、コンテンツ２３ａのコンテンツデータ２３ｃは、楽曲のデータであるとしたが、これに限るものではない。人の話した声、機械音、自然界で発生する音声で、例えば背景音として用いられる音声等の全ての種類の音声のデータであっても良く、当然に同様に動作する。

また、コンテンツデータ２３ｃが動画である場合、特定の画素の輝度や、色差の時間的な変化を音声の時間的な変化と同様に扱えば、同様の処理が可能である。また、任意の大きさのマクロブロックを離散コサイン変換して周波数成分を取り出すことによって、同様の処理が可能である。また、マクロブロックは、画像全体であっても良い。更に、コンテンツデータ２３ｃが静止画である場合、特定の線状の画素の輝度や、色差の線上の変化を時間的な変化と同様に扱えば、同様の処理が可能である。

本発明の情報処理装置は、固定式の装置であるか、携帯型の装置であるかを問わない。更に、ハードディスク搭載の動画像再生装置、ビデオカメラ、ビデオ再生装置、パソコン、携帯型音楽再生装置、移動通信端末装置等、あらゆるコンテンツを記憶する装置に適用することが当然に可能である。また、上記の各実施形態で説明した要素を適宜組み合わせても良い。本発明は以上の構成に限定されるものではなく、種々の変形が可能である。

本発明の実施形態に係る情報処理装置の構成を示すブロック図。本発明の実施形態に係るコンテンツの構成の一例を示す図。本発明の実施形態に係る辞書の構成の一例を示す図。本発明の実施形態に係る特徴抽出部の動作を示すフローチャート。本発明の実施形態に係る特徴抽出部のケプストラム係数に関わる特徴量算出動作を示すフローチャート。本発明の第１の実施形態に係る集団特徴量算出部の動作を示すフローチャート。本発明の実施形態に係る集団特徴量算出部の動作による特徴量の流れを示すフロー図。本発明の実施形態に係る楽曲検索部の動作を示すフローチャート（辞書を参照して、所定の所望の程度のコンテンツを検索する動作）。本発明の実施形態に係る楽曲検索部によって検索される楽曲の範囲の概念を示す図。本発明の実施形態に係る情報処理装置の動作によるコンテンツ等の流れを示すフロー図。本発明の第２の実施形態に係る集団特徴量算出部の動作を示すフローチャート。

符号の説明

２１楽曲登録部
２２特徴抽出部
２３コンテンツ記憶部
２３ａコンテンツ
２３ｂコンテンツ識別子
２３ｃコンテンツデータ
２３ｇ特徴量ベクトル
２３ｇ１第１の特徴量ベクトル
２３ｇ２第２の特徴量ベクトル
２３ｇｉ第ｉの特徴量ベクトル
２３ｇｍ第ｍの特徴量ベクトル
２３ｇＭ第Ｍの特徴量ベクトル
２４集団特徴量算出部
２５辞書記憶部
２５ａ辞書
２５ｂ辞書識別子
２５ｃ辞書名
２５ｄ第１の重心ベクトル
２５ｅ第１の分散共分散行列の逆行列
２５ｆ第２の重心ベクトル
２５ｇ第２の分散共分散行列の逆行列
２６楽曲検索部

Claims

コンテンツを記憶するコンテンツ記憶手段と、
第１種の前記コンテンツを前記コンテンツ記憶手段から検索し、その検索で得られた第１種のコンテンツの特徴量ベクトルから前記第１種のコンテンツからなる第１の集団の特徴量を算出し、コンテンツの特徴量ベクトルの代表ベクトルを中心に前記検索で得られた第１種のコンテンツの特徴量ベクトルと対称なベクトルからの距離が最も小さい、及び／または、その距離が所定の値より小さい特徴量ベクトルを有する第２種のコンテンツを前記コンテンツ記憶手段から検索し、その検索された第２種のコンテンツの特徴量ベクトルから前記第２種のコンテンツからなる第２の集団の特徴量を算出する集団特徴量算出手段と、
前記コンテンツ記憶手段に記憶されたコンテンツの特徴量ベクトルと前記集団特徴量算出手段によって算出された第１の集団の特徴量との間の第１の距離と、そのコンテンツの特徴量ベクトルと前記集団特徴量算出手段によって算出された第２の集団の特徴量との間の第２の距離とを算出し、前記第１の距離が前記第２の距離より小さい前記コンテンツを前記第１種のコンテンツとして検索し、及び／または、前記第１の距離が前記第２の距離より大きい前記コンテンツを前記第２種のコンテンツとして検索するコンテンツ検索手段と
を有することを特徴とする情報処理装置。