JP2005266198A

JP2005266198A - 音響情報再生装置および音楽データのキーワード作成方法

Info

Publication number: JP2005266198A
Application number: JP2004077519A
Authority: JP
Inventors: Masashi Tanabe; 正史田辺; Tsuyoshi Sato; 強司佐藤
Original assignee: Pioneer Electronic Corp
Current assignee: Pioneer Corp
Priority date: 2004-03-18
Filing date: 2004-03-18
Publication date: 2005-09-29
Also published as: US20050216257A1

Abstract

【課題】複数の曲が記憶される音響情報再生装置が複数の使用者によって使用される場合や、過去に自身で登録したキーワードを忘れてしまった場合でも、キーワードによる曲の検索を可能とする音響情報再生装置を提供すること。
【解決手段】複数の音楽データと、音楽データに付されたキーワードを音楽データに関連付けした音楽データベースとを格納する音楽データ情報格納部２と、音楽データを再生する再生部３と、再生部３による音楽データの再生中に音楽データの特徴を抽出する音楽データ特徴抽出部５と、音楽データ特徴抽出部５によって抽出された音楽データの特徴を用いてキーワードを作成し、音楽データに関連付けして音楽データ情報格納部２に格納するキーワード作成部６と、キーワードが入力されると音楽データベースに基づいて音楽データを検索するキーワード検索部７と、を備える。
【選択図】図１

Description

本発明は、複数の音楽データが記憶された記憶媒体から所望の音楽データを検索して再生する音響情報再生装置と、音楽データとキーワードとを対応付けて音楽データを検索する場合における音楽データのキーワード作成方法に関するものである。

近年、パーソナルコンピュータなどの情報機器の技術的進歩によって、情報機器に備えられる記憶媒体が小型化、大容量化するとともに、たとえばＭＰ３（MPEG1 Audio Layer 3）などのデータ圧縮技術の技術的進歩によって、曲や音楽などの音楽データを音質劣化を抑えながら圧縮することが可能となっている。これにより、膨大な数の音楽データを記憶することが可能でありながらサイズの小さい音響情報再生装置が提供されるようになっている。このような小型の音響情報再生装置として、たとえば手のひらの大きさほどの外箱に内蔵されたハードディスクに記憶した音楽データを聴くことができる携帯型の音響情報再生装置や、ハードディスクなどの記憶媒体を内蔵したカーナビゲーションシステムなどがある。

ところで、記憶媒体に膨大な数の音楽データが記憶されると、その中から所望の音楽データを選択して再生する作業が煩雑となってしまう。そこで、このような作業の煩雑さを解消するために、音楽データにキーワードを付して両者を対応付ける方法が提案されている。つまり、音響情報装置の使用者が、まず、音楽データの再生中にキーワードを登録し、キーワードと再生中の音楽データとの対応付けを音響情報装置に記憶させておく。このとき、登録されるキーワードは音響情報装置内で１つの音楽データとしか対応付けることができないが、１つの音楽データには複数のキーワードを登録することができる。その後、使用者が音楽データの選択を行う際には、キーワードを入力することによって、音響情報装置がそのキーワードに対応する音楽データを抽出し、再生するというものである（たとえば、特許文献１参照）。

特開２００３−９１５４０号公報

しかしながら、従来の音響情報装置では、キーワードとして登録される言葉は大抵の場合使用者によって異なるものであり、ある音楽データに対して付されるキーワードは使用者によって異なる場合がほとんどである。そのため、たとえば音響情報装置が車両内に備えられる場合のように１つの音響情報装置を複数の使用者で使用する場合に、使用者ごとにキーワードの登録を行なわなければならないという問題が生じる。また、登録されるキーワードは、音楽データとの関連性はあるというものの、登録時の使用者の気分や思いつきなどに左右されることが多いため、同じ使用者でも音楽データに付したキーワードを忘れてしまうという問題も生じる。さらに、キーワードの入力作業は、使用者によって行なわれるものであるために、手間もかかるという問題も生じる。

このようなことから、本発明が解決しようとする課題としては、従来技術の音響情報装置で生じる同一の音響情報装置を複数の使用者で使用する場合に、使用者ごとに音楽データに付するキーワードが必要になるという問題が一例として挙げられる。また、従来技術の音響情報装置で生じる音楽データに付したキーワードを使用者が忘れてしまう場合があるという問題も一例として挙げられる。さらに、従来技術の音響情報装置で生じるキーワードの入力作業に手間がかかるという問題も一例として挙げられる。

請求項１に記載の発明は、複数の音楽データと、前記音楽データに付されたキーワードを前記音楽データに関連付けした音楽データ関連付け情報とを格納する音楽データ情報格納手段と、前記音楽データを再生する再生手段と、キーワードが入力されると前記音楽データ関連付け情報に基づいて音楽データを検索するキーワード検索手段と、を備え、キーワードを用いて音楽データの検索を行ない、所望の音楽データを再生する音響情報再生装置であって、前記再生手段による音楽データの再生中に前記音楽データの特徴を抽出する音楽データ特徴抽出手段と、前記音楽データ特徴抽出手段によって抽出された前記音楽データの特徴を用いてキーワードを作成し、前記音楽データに関連付けして前記音楽データ情報格納手段に格納するキーワード作成手段と、を備えることを特徴とする。

また、請求項５に記載の発明は、複数の音楽データと、前記音楽データに付されたキーワードを前記音楽データに関連付けした音楽データ関連付け情報とを格納する音楽データ情報格納手段と、前記音楽データを再生する再生手段と、キーワードが入力されると前記音楽データ関連付け情報に基づいて音楽データを検索するキーワード検索手段と、を備え、キーワードを用いて音楽データの検索を行ない、所望の音楽データを再生する音響情報再生装置であって、前記再生手段によって再生される音楽データから音声を抽出する音声抽出手段と、抽出された音声を単語の連続として認識する音声認識手段と、認識された単語から所定の基準で選択される単語をキーワードとして抽出し、前記音楽データに関連付けして前記音楽データ情報格納手段に格納するキーワード抽出手段と、を備えることを特徴とする。

さらに、請求項８に記載の発明は、音楽データに関連付けされたキーワードを用いて複数格納された音楽データの中から所望の音楽データを検索する音響情報再生装置における音楽データのキーワード作成方法であって、音楽データの再生中に前記音楽データの特徴を抽出する特徴抽出工程と、前記特徴抽出工程によって抽出された前記音楽データの特徴を用いてキーワードを作成し、前記音楽データに関連付けするキーワード作成工程と、を含むことを特徴とする。

さらにまた、請求項１１に記載の発明は、音楽データに関連付けされたキーワードを用いて複数格納された音楽データの中から所望の音楽データを検索する音響情報再生装置における音楽データのキーワード作成方法であって、音楽データの再生中に前記音楽データから音声を抽出する音声抽出工程と、音声抽出工程で抽出された音声を単語の連続として認識する音声認識工程と、音声認識工程で認識された単語から所定の基準で選択される単語をキーワードとして抽出し、前記音楽データに関連付けするキーワード抽出工程と、を含むことを特徴とする。

以下に添付図面を参照して、本発明にかかる音響情報再生装置および音楽データのキーワード作成方法の好適な実施の形態を詳細に説明する。なお、以下では、本発明の概略と特徴を実施の形態として説明し、その後に実施の形態にかかる実施例を説明する。また、本発明がこれらの実施の形態や実施例により限定されるものではない。

［実施の形態］
図１は、本発明にかかる音響情報再生装置の概略構成を示すブロック図である。この音響情報再生装置１は、音楽データ情報格納部２、再生部３、音声出力部４、音楽データ特徴抽出部５、キーワード作成部６、キーワード検索部７、入力部８、表示部９および制御部１０を備えて構成される。

音楽データ情報格納部２は、再生される音楽である音楽データと、音楽データに付されるキーワードをその音楽データに対応付けて管理する音楽データベースとを格納する。以下では、音楽データ情報格納部２中の音楽データが格納される領域を音楽データ領域といい、音楽データベースが格納される領域を音楽データベース領域という。なお、この明細書で音楽データとは、曲や音楽などのように音を含むデータのことをいうものとする。また、特許請求の範囲における音楽データ関連付け情報は、この音楽データベースに対応している。

音楽データベースは、上述したように音楽データとその音楽データに付されたキーワードとを対応付けて格納する。キーワードとしては、音楽データから抽出される特徴を用いることができる。たとえば、音楽データを構成する歌詞に含まれる自立語または名詞をキーワードとしたり、音楽データのジャンルや曲調（ロックやフォークソング、ポップス、演歌など）をキーワードとしたりすることができる。そして、これらのキーワードを音楽データ情報格納部２に格納される音楽データと対応付けする。図２は、音楽データベースの構造の一例を示す図である。この例の音楽データベース２１は、音楽データ情報格納部２に格納される音楽データに関する情報を格納する音楽データ情報テーブル２２と、音楽データに付されるキーワードテーブル２３とを含み、これらが関連付けされたデータベース構成となっている。音楽データ情報テーブル２２は、音楽データベースに格納される音楽データを一意に識別するために付される「音楽データＩＤ」と、その音楽データのファイルに付された名称である「ファイル名」と、その音楽データが記憶される場所を示す「記憶場所」と、その音楽データの「曲名」と、その音楽データに対応付けされたキーワードを示す「キーワードＩＤ」の各項目を含んで構成される。このほかに、その音楽データの「歌手名」などを含むようにしてもよい。なお、「キーワードＩＤ」は、後述するキーワードテーブル２３のキーワードと関連付けするための項目である。キーワードテーブル２３は、該テーブルに格納されるキーワードである「キーワード」と、該キーワードを一意に識別するための「キーワードＩＤ」の各項目を含んで構成される。この「キーワードＩＤ」によって、音楽データ情報テーブル２２中の音楽データとそのキーワードとが関連付けされる。

再生部３は、音楽データ情報格納部２に記憶される音楽データのうち使用者によって選択された音楽データを、デジタルデータからアナログデータに変換して再生する機能を有する。音声出力部４は、スピーカなどの音声出力装置からなり、再生部３によってアナログデータに変換された音楽データを音として出力する機能を有する。

音楽データ特徴抽出部５は、キーワード作成状態にあるときに、キーワード作成に関する所定の基準に基づいて再生される音楽データから特徴を抽出する機能を有する。たとえば、曲調がキーワード作成に関する基準であれば、再生される音楽データの曲調を抽出する。この場合には、音楽データ特徴抽出部５は、曲調を決定する際に必要な曲調情報を予め保持し、再生中の音楽データの曲調を曲調情報と比較して、合致する曲調を特徴として抽出する。また、たとえば歌詞に含まれる単語がキーワード作成に関する基準であれば、再生される音楽データから歌詞を認識して単語を抽出する。

キーワード作成部６は、音楽データ特徴抽出部５によって抽出された音楽データの特徴に基づいてキーワードを作成し、再生中の音楽データと関連付けして音楽データベースに格納する機能を有する。たとえば、曲調がキーワード作成に関する基準であれば、キーワード作成部６は、曲調とその曲調に対応付けられるキーワードを含む音楽データ特徴情報を保持し、音楽データ特徴抽出部５によって抽出された曲調について対応付けされているジャンルを、音楽データ特徴情報を用いて判定し、そのジャンルをキーワードとして再生中の音楽データと関連付けして音楽データベースに格納する。また、たとえば歌詞に含まれる単語がキーワード作成に関する基準であれば、抽出された単語またはこの抽出された単語のうち所定の基準にしたがって選択された単語を、再生中の音楽データと関連付けして音楽データベースに格納する。

キーワード検索部７は、入力部８から入力されるキーワードに対応付けられる音楽データを音楽データベース２１から検索する機能を有する。検索結果は表示部９に出力される。

表示部９は、液晶ディスプレイなどの表示装置からなり、音響情報再生装置１の使用者に対して、再生している曲についての情報や、曲を検索する時の検索画面や検索結果画面などの種々の情報を提示する。また、入力部８は、キーボードやボタン、タッチパネルなどの入力装置からなり、使用者による音響情報再生装置１に対する操作や命令が入力される。制御部１０は、これらの各処理部による処理を制御する機能を有する。

ここで、このような構成を有する音響情報再生装置１におけるキーワード作成処理と、キーワードによる音楽データ検索処理について説明する。図３は、音響情報再生装置におけるキーワード作成処理の手順を示すフローチャートである。このキーワード作成処理は、音楽データの再生中に音響情報再生装置１の使用者によるキーワード作成処理の開始指示によって開始される。つまり、音響情報再生装置１の再生部３によって音楽データ情報格納部２に記憶されるいずれかの音楽データの再生処理が行われている状態で（ステップＳ１１）、音楽データ特徴抽出部５によって再生されている音楽データについての特徴が抽出される（ステップＳ１２）。その後、キーワード作成部６によって、抽出された音楽データの特徴に基づいてキーワードが作成され（ステップＳ１３）、そのキーワードが再生中の音楽データに関連付けして音楽データベース２１に格納され（ステップＳ１４）、キーワード作成処理が終了する。

なお、上述した説明では、音楽データの再生中にキーワードの作成処理を行っているが、この再生処理には、再生中の音楽データを他のＣＤ（Compact Disc）やＭＤ（Mini Disc）などの記憶媒体にダビングする際や、逆に、他のＣＤやＭＤなどの記憶媒体に記憶されている音楽データを自音響情報再生装置１の音楽データ情報格納部２にダビングする際の記録処理も含まれるものである。

図４は、音響情報再生装置における音楽データ検索処理の手順を示すフローチャートである。この音楽データ検索処理は、音響情報再生装置１が起動している間に、使用者によるキーワード検索処理の開始指示によって開始される。まず、使用者によって、検索したい音楽データに関連するキーワードが入力部８から入力される（ステップＳ２１）。このキーワードの入力は、たとえばキーボードのような入力装置から単語を直接入力する形式や、音楽データベース２１のキーワードテーブル２３中に格納されているキーワードを表示部９に一覧で表示させ、その中のキーワードを入力部８で選択するような形式などの任意の形式でよい。

ついで、キーワード検索部７は、入力されたキーワードに対応付けられた音楽データを音楽データベース２１の中から検索する（ステップＳ２２）。そして、その検索結果を表示部９に表示して（ステップＳ２３）、検索処理が終了する。この検索結果は、使用者によって再生処理に使用されたり、検索結果からさらに使用者の目的とする曲の再生のための選択処理に使用されたりする。

この実施の形態によれば、音楽データから抽出した特徴をキーワードとして、その音楽データに関連付けするようにしたので、その音楽データを知っている使用者であれば、その音楽データ自身の持つ普遍的な特徴に基づいて音楽データの検索を行うことができる。これにより、膨大な数の音楽データを記憶した音響情報再生装置１を複数の使用者で使用する場合でも、使用者によらずに所望の音楽データを抽出することができるという効果を有する。また、キーワードの作成に当たって使用者の行う作業がキーワードの作成処理を行う指示を与えるだけでよいので、使用者の手間がかからないという効果を有する。たとえば車両などの移動体に音響情報再生装置１が搭載され、使用者が運転者である場合でも、運転者の運転の安全性を確保することができる。

この実施例では、実施の形態で説明した音響情報再生装置において、音楽データに含まれる歌詞からキーワードを作成する音響情報再生装置を例に挙げて説明する。

図５は、本発明にかかる音響情報再生装置の概略構成を示すブロック図である。この音響情報再生装置１ａは、再生される音楽の音楽データとその音楽データに付されるキーワードを管理する音楽データベースとを格納する音楽データ情報格納部２と、音楽データ情報格納部２に記憶される音楽データのうち使用者によって選択された音楽データをデジタルデータからアナログデータに変換して再生する再生部３と、再生部３によって変換されたアナログデータを音として出力する音声出力部４と、音楽データから歌の部分のみを抽出する音声抽出部５１と、抽出された歌から音声を認識して単語列にする音声認識部５４と、認識された音声の単語列からキーワードを抽出するキーワード抽出部６１と、入力されたキーワードに対応する音楽データを検索するキーワード検索部７と、使用者に対して必要な情報の表示を行うとともに使用者からの入力を行うタッチパネル１１と、タッチパネル１１に表示させる画面情報を格納する表示画面情報格納部１２と、これらの各処理部を制御する制御部１０と、を備えて構成される。なお、実施の形態１の図１で説明した構成要素と同一の構成要素には同一の符号を付して、その詳細な説明を省略する。また、音楽データベース２１の構成も実施の形態１の図２のものと同様であるとする。ただし、キーワードテーブル２３に格納されるキーワードは、歌詞中に含まれる単語（名詞）であるとする。

音声抽出部５１は、キーワード作成状態にあるときに、曲と歌（以下、ボーカルという）で構成される音楽データからボーカル成分のみを抽出する機能を有し、音声キャンセル部５２と差動アンプ部５３とから構成される。音声キャンセル部５２は、ボーカルキャンセル回路などから構成され、音楽データからボーカル成分をキャンセルする機能を有する。音声キャンセル部５２の仕組みは、市販されている音楽ＣＤなどの音声データの作成時（録音時）において、大抵の場合には歌手がＬ（左）とＲ（右）のマイクロホンの中間に位置しているので、ボーカル成分に関してはＬ，Ｒ同レベルでかつ同位相で録音されたステレオソースとなっていることを利用し、２チャンネルの原信号（Ｌ，Ｒ）の差信号（Ｌ−Ｒ）を生成することで、歌手のボーカル成分のみを減衰させるものである。この音声キャンセル部５２によってボーカル成分がキャンセルされた音楽データ（以下、曲成分という）は、差動アンプ部５３に出力される。

また、差動アンプ部５３は、再生部３から入力される音楽データと、音声キャンセル部５２によって生成された曲成分とを入力とし、これらの差を取って、音楽データ中のボーカル成分のみを抽出する機能を有する。

音声認識部５４は、差動アンプ部５３によって生成された音楽データのボーカル成分の音声認識を行う機能を有する。音声認識部５４は、人間の発声の小さな単位である音素の音響特徴が記述された単語辞書５５と、単語がどのような音素のつながりで構成されているかを記録した認識辞書５６と、入力される音楽データのボーカル成分を解析する解析部５７とを備えている。解析部５７は、入力された音楽データのボーカル成分を分析して音響特徴を算出し、認識辞書５６に記述されている単語の中から、単語の音響特徴が入力された音楽データのボーカル成分の音響特徴に最も近い言葉を抽出して、音声認識結果として出力する。

キーワード抽出部６１は、音声認識部５４によって出力される音声認識結果からキーワードとなる単語を取り出して、現在再生中の音楽データと対応付けて音楽データ情報格納部２に格納する機能を有する。キーワードとなる単語とは、音声認識結果から助詞や助動詞を取り除いて得られる自立語でもよいし、音声認識結果中に含まれる名詞でもよい。この際、キーワード抽出部６１は、図示しない自立語や名詞が含まれる用語辞書を参照してキーワードを音声認識結果から抽出する。また、音楽データベース２１中のキーワードテーブル２３を用語辞書として設定してもよい。この場合には、用語辞書の各用語には、予め一意に識別するキーワードＩＤが付されている必要がある。

タッチパネル１１は、液晶表示装置などの表面に、使用者が表面を触れたことを圧力や光の遮断などで検出するタッチセンサを備える構成を有するものであり、図１における入力部８と表示部９とを兼ね備えるものである。表示画面情報格納部１２は、タッチパネル１１に表示する入力ボタン機能も含めた表示画面情報を格納する。たとえば、後述する音楽データを再生する際の再生画面、キーワード作成処理時におけるキーワード作成中画面やキーワード選択画面などの画面を表示するための表示画面情報を格納する。

ここで、このような構成を有する音響情報再生装置１ａにおけるキーワード作成処理とキーワードによる音楽データ検索処理の具体例について説明する。最初に、音響情報再生装置１ａにおけるキーワード作成処理について説明する。図６は、音響情報再生装置におけるキーワード作成処理の手順を示すフローチャートである。また、図７は、音楽データを再生中の再生画面の一例を示す図である。この再生画面７０には、再生中の音楽データ（以下、曲ともいう）に関する曲情報７１が表示されるとともに、キーワード作成処理を行う「キーワード作成」ボタン７２と、キーワードによって曲の検索を行う「キーワードによる曲検索」ボタン７３が設けられている。これらのボタン７２，７３が表示されている表示部９上の位置に触れることでタッチパネル１１はその位置を検出し、それぞれのボタン７２，７３に対応する処理が実行されるようになっている。この図７の再生画面７０でキーワード作成ボタン７２が押されることによって、図６に示されるキーワード作成処理が開始される。

つまり、音響情報再生装置１ａの再生部３によって音楽データ情報格納部２に記憶されるいずれかの音楽データの再生処理が行われている状態で（ステップＳ３１）、音声認識処理が実行される（ステップＳ３２）。図８は、音声認識処理の詳細を示すフローチャートである。まず、音声キャンセル部５２によって、再生部３から入力される再生中の音楽データのボーカル成分をキャンセルした曲成分が生成される（ステップＳ５１）。ついで、差動アンプ部５３によって、再生部３から入力される再生中の音楽データと、音声キャンセル部５２から入力される音楽データの曲成分の同期を取った状態で、両者の差からボーカル成分が抽出される（ステップＳ５２）。ついで、音声認識部５４によって、抽出された音楽データのボーカル成分について分析が行われ、その波形から音響特徴が算出される（ステップＳ５３）。その後、音声認識部５４は、認識辞書５６中のことばの音響特徴が算出された音楽データのボーカル成分の音響特徴に近いことばを抽出し（ステップＳ５４）、その結果を音声認識結果として出力し（ステップＳ５５）、音声認識処理が終了する。

音声認識処理によって得られる音声認識結果から、キーワード抽出部６１は、キーワードを抽出する（ステップＳ３３）。たとえば、音声認識結果を自立語と付属語に分解し、キーワード抽出部６１が有する用語辞書を参照して自立語のみを抽出したり、自立語の中の名詞のみを抽出したりして、キーワードを抽出する。ここでは、キーワードとして名詞を抽出するものとする。そして、抽出したキーワードをタッチパネル１１に表示する（ステップＳ３４）。図９は、キーワード作成中に表示されるキーワード作成中画面の一例を示す図である。このキーワード作成中画面９０には、現在再生中の曲情報９１とともに、キーワード抽出部６１によって抽出されたキーワードがキーワード表示領域９２に表示される。また、このキーワード作成中画面９０には、抽出されたキーワードから使用者によるキーワードの選択を行うことが可能なキーワード選択画面へと移行する「キーワード選択」ボタン９３が設けられている。

その後、音楽データの再生が終了したか否かを判定し（ステップＳ３５）、音楽データの再生が終了していない場合（ステップＳ３５でＮｏの場合）には、キーワード作成中画面９０のキーワード選択ボタン９３が押されたか否かを判定する（ステップＳ３６）。キーワード選択ボタン９３が押されない場合（ステップＳ３６でＮｏの場合）には、再びステップＳ３２に戻り、音楽データの再生が終了するまで上述した処理が繰り返し実行される。すなわち、キーワード作成中画面９０のキーワード表示領域９２に、音楽データの再生が終了するまで、キーワードが順次追加されていく。ここでは、「風」や「昴」、「砂」、「銀河」などの歌詞に含まれる名詞が順次追加されていく。

一方、ステップＳ３６でキーワード選択ボタン９３が押された場合（ステップＳ３６でＹｅｓの場合）またはステップＳ３５で再生処理が終了した場合（ステップＳ３５でＹｅｓの場合）には、制御部１０はタッチパネル１１にキーワード選択画面を表示する（ステップＳ３７）。図１０−１〜図１０−２は、キーワード選択画面の一例を示す図である。このキーワード選択画面１００Ａ，１００Ｂには、再生中だった音楽データ１０１の名称とともに、抽出されたキーワードを表示する抽出キーワード候補領域１０２と、抽出キーワード候補領域１０２から選択されたキーワードを表示する選択済キーワード領域１０３とが画面中央部付近に配置されている。これらの領域１０２，１０３には、抽出されたキーワードがボタン表示されている。また、キーワード選択画面１００Ａ，１００Ｂの下部には、抽出キーワード候補や選択済みキーワードが多数あり、現在の表示領域に収まらない場合にそれらの他の抽出キーワード候補や選択済みキーワードを閲覧するための「前頁」ボタン１０４と「次頁」ボタン１０５、選択済キーワード領域１０３で選択したキーワードを取り消すための「選択取り消し」ボタン１０６、選択が終了したことを通知する「設定終了」ボタン１０７が配置されている。

使用者によって、キーワード選択画面１００Ａ，１００Ｂ上の抽出キーワード候補領域１０２のボタン表示されたキーワードが選択されたか否か判定する（ステップＳ３８）。抽出キーワード候補領域１０２のボタン表示されたキーワードが選択された場合（ステップＳ３８でＹｅｓの場合）には、選択されたボタン表示されたキーワードを選択済キーワード領域１０３に表示する（ステップＳ３９）。その後、またはステップＳ３８で抽出キーワード候補領域１０２のキーワードボタンが選択されていない場合（ステップＳ３８でＮｏの場合）には、選択済キーワード領域１０３のキーワードボタンが選択されたか否か判定し（ステップＳ４０）、選択されている場合（ステップＳ４０でＹｅｓの場合）にはさらに選択取り消しボタン１０６が押されたか否かを判定する（ステップＳ４１）。選択取り消しボタン１０６が押された場合（ステップＳ４１でＹｅｓの場合）には、選択済キーワード領域１０３から選択されたキーワードボタンが削除される（ステップＳ４２）。その後、またはステップＳ４０で選択済キーワード領域１０３のキーワードボタンが選択されていない場合（ステップＳ４０でＮｏの場合）、またはステップＳ４１で選択取り消しボタン１０６が押されなかった場合（ステップＳ４１でＮｏの場合）には、設定終了ボタン１０７が押されたか否かが判定される（ステップＳ４３）。設定終了ボタン１０７が押されていない場合（ステップＳ４３でＮｏの場合）にはステップＳ３７へ戻り、設定終了ボタン１０７が押されるまでステップＳ３７〜Ｓ４２の処理が繰り返される。

たとえば、図１０−１は、抽出キーワード候補領域１０２で斜線表示されている「草原」ボタン１０２Ａが選択されたことを示しており、選択済キーワード領域１０３に「草原」１０３Ａが表示されている状態を示している。また、図１０−２は、図１０−１の次頁ボタン１０５を押した状態であり、その抽出キーワード候補領域１０２で斜線表示されている「昴」ボタン１０２Ｂが選択されて、選択済キーワード領域１０３に「昴」１０３Ｂが表示されている状態を示している。

一方、ステップＳ４３でキーワード選択画面１００Ａ，１００Ｂ上の設定終了ボタン１０７が押された場合（ステップＳ４３でＹｅｓの場合）には、選択済キーワード領域１０３に表示されたキーワードを、ステップＳ３１で再生された音楽データに対応付けて音楽データベース２１に格納し（ステップＳ４４）、キーワード作成処理が終了する。

なお、上述した説明では、音楽データの再生中にキーワードの作成処理を行っているが、この再生処理には、再生中の音楽データをダビングする際の記録処理も含まれるものである。また、上述した説明では、音響情報再生装置１ａに記憶された音楽データについてのキーワード作成処理について説明したが、他のＣＤやＭＤなどの記憶媒体に記憶されている音楽データを、音響情報再生装置１ａの音楽データ情報格納部２に記録する場合に、上述した手順にしたがってキーワードを作成することも可能である。また、ダビング時には、Ｎ倍速（Ｎは０より大きい数）でダビングすることが可能な装置においても本実施例を適用することができる。ただし、その場合には音声認識部５４は、Ｎ倍速に対応した認識辞書も備えている必要がある。

つぎに、音響情報再生装置１ａにおける音楽データ検索処理について説明する。図１１は、音響情報再生装置におけるキーワードを用いた音楽データ検索処理の手順を示すフローチャートである。この音楽データ検索処理は、音響情報再生装置１ａが起動している間に、使用者によるキーワード検索処理の開始指示によって、たとえば図７の再生画面７０中におけるキーワードによる曲検索ボタン７３が押されることによって開始され、タッチパネル１１に曲検索画面が表示される（ステップＳ６１）。図１２は曲検索画面の一例を示す図である。この曲検索画面１２０は、音楽データ情報格納部２に格納されるキーワードを表示するキーワード表示領域１２１と、キーワード表示領域１２１で選択されるキーワードに関連付けされた音楽データの曲名を表示する検索曲表示領域１２２とが画面中央部付近に配置されている。これらの領域１２１，１２２には、キーワードまたは曲名がボタン表示されている。また、曲検索画面１２０の下部には、キーワードや検索曲が多数あり、現在の表示領域に収まらない場合にその他のキーワードや検索曲を閲覧するための「前頁」ボタン１２３と「次頁」ボタン１２４、選択された検索曲を再生する「再生」ボタン１２５、キーワード検索処理を終了する「終了」ボタン１２６が配置されている。

ついで、キーワード検索部７はキーワード表示領域１２１のキーワードが選択されたか否かを判定する（ステップＳ６２）。キーワードが選択された場合（ステップＳ６２でＹｅｓの場合）には、キーワード検索部７は、選択されたキーワードに関連付けられた音楽データを音楽データベース２１内から検索し（ステップＳ６３）、その曲名を検索曲表示領域１２２に表示する（ステップＳ６４）。たとえば、図１２には、キーワード領域の「昴」ボタン１２１Ａが選択され、検索曲表示領域１２２中に「地上の星」１２２Ａと「昴」１２２Ｂという「昴」に関連付けされた曲が抽出された状態が示されている。

その後、またはステップＳ６２でキーワード表示領域１２１のキーワードが選択されない場合（ステップＳ６２でＮｏの場合）には、終了ボタン１２６が押されたか否か判定する（ステップＳ６５）。終了ボタン１２６が押されない場合（ステップＳ６５でＮｏの場合）には、再びステップＳ６１に戻り、上述した処理が繰り返される。また、終了ボタン１２６が押された場合には、キーワードによる音楽データ検索処理が終了する。

なお、このキーワードによる音楽データ検索処理によって検索された曲は、たとえばそのまま再生されたり、その中からさらに使用者によって選択された曲が再生されたりする。また、音響情報再生装置１ａに、プログラム再生機能がある場合には検索されまたはさらに選択された曲をプログラムに追加してプログラム再生を行ったり、さび再生機能がある場合には検索されまたはさらに選択された曲のさびの部分を再生したり、さらにイントロスキャン機能がある場合には検索されまたはさらに選択された曲のイントロダクション（出だし）の部分を再生したりすることができる。

なお、上述した例では、キーワードを歌詞の中の名詞として音楽データと関連付けるようにしているが、まず音楽データを曲調（ジャンル）によって分類し、さらにその後に歌詞中の名詞をキーワードとして音楽データに関連付けるようにしてもよい。このように分類することで、キーワードとしてジャンルと歌詞中の単語（名詞）を用いることができるので、より目的に近い音楽データを検索時に得ることが可能となる。

この実施例によれば、音楽データのボーカル成分中の単語を抽出してキーワードとして、その音楽データに関連付けを行うようにしたので、その音楽データを知っている使用者であれば、その歌詞の内容に基づいて音楽データの検索を行うことができる。これにより、膨大な数の音楽データを記憶した音響情報再生装置１ａを複数の使用者で使用する場合でも、使用者によらずに所望の音楽データを抽出することができるという効果を有する。また、キーワードの選択は、再生された音楽データの歌詞から抽出された単語の中から、使用者がキーワードとしてふさわしいと思うものを選択するだけであるので、キーワードの入力を行う場合に比して、手間がかからないという効果も有する。

本発明による音響情報再生装置の概略構成を示すブロック図である。音楽データベースの構造の一例を示す図である。音響情報再生装置におけるキーワード作成処理の手順を示すフローチャートである。音響情報再生装置におけるキーワードを用いた音楽データ検索処理の手順を示すフローチャートである。本発明による音響情報再生装置の概略構成を示すブロック図である。音響情報再生装置におけるキーワード作成処理の手順を示すフローチャートである。音楽データを再生中の再生画面の一例を示す図である。音声認識処理の詳細を示すフローチャートである。キーワード作成中画面の一例を示す図である。キーワード選択画面の一例を示す図である。キーワード選択画面の一例を示す図である。音響情報再生装置におけるキーワードを用いた音楽データ検索処理の手順を示すフローチャートである。曲検索画面の一例を示す図である。

符号の説明

１，１ａ音響情報再生装置
２音楽データ情報格納部
３再生部
４音声出力部
５音楽データ特徴抽出部
６キーワード作成部
７キーワード検索部
８入力部
９表示部
１０制御部
５１音声抽出部
５２音声キャンセル部
５３差動アンプ部
５４音声認識部
６１キーワード抽出部

Claims

複数の音楽データと、前記音楽データに付されたキーワードを前記音楽データに関連付けした音楽データ関連付け情報とを格納する音楽データ情報格納手段と、
前記音楽データを再生する再生手段と、
キーワードが入力されると前記音楽データ関連付け情報に基づいて音楽データを検索するキーワード検索手段と、
を備え、キーワードを用いて音楽データの検索を行ない、所望の音楽データを再生する音響情報再生装置であって、
前記再生手段による音楽データの再生中に前記音楽データの特徴を抽出する音楽データ特徴抽出手段と、
前記音楽データ特徴抽出手段によって抽出された前記音楽データの特徴を用いてキーワードを作成し、前記音楽データに関連付けして前記音楽データ情報格納手段に格納するキーワード作成手段と、
を備えることを特徴とする音響情報再生装置。
前記キーワード作成手段は、音楽データの特徴とキーワードとの対応関係を記述した音楽データ特徴情報を保持し、抽出された前記音楽データの特徴に対応するキーワードを前記音楽データ特徴情報から抽出することを特徴とする請求項１に記載の音響情報再生装置。
前記キーワード作成手段の保持する音楽データ特徴情報には、前記音楽データのジャンルまたは曲調とキーワードとの対応関係が記述され、
前記音楽データ特徴抽出手段は、前記音楽データのジャンルまたは曲調を抽出することを特徴とする請求項２に記載の音響情報再生装置。
表示手段と入力手段をさらに備え、
前記キーワード検索手段は、前記音楽データ情報格納手段に格納されるキーワードを前記表示手段に表示し、該キーワードの中から前記入力手段によって選択されたキーワードに対応付けられた音楽データを前記音楽データ情報格納手段から検索して前記表示手段に表示することを特徴とする請求項１〜３のいずれか１つに記載の音響情報再生装置。
複数の音楽データと、前記音楽データに付されたキーワードを前記音楽データに関連付けした音楽データ関連付け情報とを格納する音楽データ情報格納手段と、
前記音楽データを再生する再生手段と、
キーワードが入力されると前記音楽データ関連付け情報に基づいて音楽データを検索するキーワード検索手段と、
を備え、キーワードを用いて音楽データの検索を行ない、所望の音楽データを再生する音響情報再生装置であって、
前記再生手段によって再生される音楽データから音声を抽出する音声抽出手段と、
抽出された音声を単語の連続として認識する音声認識手段と、
認識された単語から所定の基準で選択される単語をキーワードとして抽出し、前記音楽データに関連付けして前記音楽データ情報格納手段に格納するキーワード抽出手段と、
を備えることを特徴とする音響情報再生装置。
表示手段と入力手段をさらに備え、
前記キーワード抽出手段は、前記音声認識手段によって認識された単語から所定の基準で選択される単語を前記表示手段に表示し、この表示された単語のうち前記入力手段によって選択された単語をキーワードとして前記音楽データに関連付けして前記音楽データ情報格納手段に格納することを特徴とする請求項５に記載の音響情報再生装置。
前記再生手段による再生は、前記音楽データ格納手段に格納されている音楽データの再生、他の記憶媒体への記録、または他の記憶媒体から前記音楽データ格納手段への記録を含むことを特徴とする請求項１〜６のいずれか１つに記載の音響情報再生装置。
音楽データに関連付けされたキーワードを用いて複数格納された音楽データの中から所望の音楽データを検索する音響情報再生装置における音楽データのキーワード作成方法であって、
音楽データの再生中に前記音楽データの特徴を抽出する特徴抽出工程と、
前記特徴抽出工程によって抽出された前記音楽データの特徴を用いてキーワードを作成し、前記音楽データに関連付けするキーワード作成工程と、
を含むことを特徴とする音楽データのキーワード作成方法。
前記キーワード作成工程では、音楽データの特徴とキーワードとの対応関係を記述した音楽データ特徴情報に基づいて、前記特徴抽出工程で抽出された前記音楽データの特徴に対応するキーワードを作成することを特徴とする請求項８に記載の音楽データのキーワード作成方法。
前記音楽データ特徴情報には、前記音楽データのジャンルまたは曲調とキーワードとの対応関係が記述され、
前記特徴抽出工程では、前記音楽データのジャンルまたは曲調が抽出されることを特徴とする請求項９に記載の音楽データのキーワード作成方法。
音楽データに関連付けされたキーワードを用いて複数格納された音楽データの中から所望の音楽データを検索する音響情報再生装置における音楽データのキーワード作成方法であって、
音楽データの再生中に前記音楽データから音声を抽出する音声抽出工程と、
音声抽出工程で抽出された音声を単語の連続として認識する音声認識工程と、
音声認識工程で認識された単語から所定の基準で選択される単語をキーワードとして抽出し、前記音楽データに関連付けするキーワード抽出工程と、
を含むことを特徴とする音楽データのキーワード作成方法。
前記キーワード抽出工程は、前記抽出された単語の中から選択される単語をキーワードとして前記音楽データに関連付けすることを特徴とする請求項１１に記載の音楽データのキーワード作成方法。