JP2008257020A - メロディーの類似度算出方法及び類似度算出装置 - Google Patents

メロディーの類似度算出方法及び類似度算出装置 Download PDF

Info

Publication number
JP2008257020A
JP2008257020A JP2007100303A JP2007100303A JP2008257020A JP 2008257020 A JP2008257020 A JP 2008257020A JP 2007100303 A JP2007100303 A JP 2007100303A JP 2007100303 A JP2007100303 A JP 2007100303A JP 2008257020 A JP2008257020 A JP 2008257020A
Authority
JP
Japan
Prior art keywords
similarity
energy
melody
pitch
music
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007100303A
Other languages
English (en)
Inventor
Yoshinori Haseyama
美紀 長谷山
Soji Konno
聡司 今野
Naoki Nitanda
直己 二反田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP2007100303A priority Critical patent/JP2008257020A/ja
Publication of JP2008257020A publication Critical patent/JP2008257020A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

【目的】倍音構造や雑音の影響を軽減可能とし、かつ推定精度が良好な「メロディーの類似度算出方法及び類似度算出装置」を提供することである。
【構成】2つの楽曲におけるメロディーの類似度を算出するメロディーの類似度算出に際して、比較する2つの楽曲信号のそれぞれに含まれるベース音の時間的変化を示す音高推移特性と各楽曲信号に含まれるベース音以外の楽器音のエネルギーの時間的変化を示すエネルギー特性とを取得する。ついで、各楽曲の音高推移特性の類似度を計算すると共に、各楽曲のベース音以外の楽器音のエネルギー特性の類似度を計算し、各類似度を用いてメロディーの類似度を算出する。
【選択図】 図10

Description

本発明は、メロディーの類似度算出方法及び類似度算出装置に係わり、特に、2つの楽曲におけるメロディーの類似度を算出するメロディーの類似度算出方法及び類似度算出装置に関する。
楽曲のディジタル化に伴い、楽曲名、作曲者名等のキーワードによる検索だけでなく、音楽信号を直接用いた検索が可能となった。そこで、同一ジャンルの楽曲の検索や類似する楽曲の検索等、音楽信号の内容に基づく様々な検索技術の実現が期待されている。このような検索技術の実現のために、楽曲間の類似度を算出する手法が提案されている(非特許文献1,2参照)。
北川高嗣、中西崇文、清水康、"楽曲メディアデータを対象としたメタデータ自動抽出方式の実現とその意味的楽曲検索への適用、"電子情報通信学会論文誌、vol.J85-D-I, no. 6, pp. 512−526、2002 蔭山哲也、高島洋典、"ハミング歌唱を手がかりとするメロディー検索、""電子情報通信学会論文誌、vol.J77-DII, no. 8, pp.1543-1551, 1994
非特許文献1の手法では、音楽信号より算出された複数の特徴量に基づき、楽曲にメタデータとして単語を付与する。さらに、人間の感性に基づく単語間の関係を用いて楽曲間の類似度を与え
る。従って、特徴量と単語を適切に設定することにより、楽曲の内容に基づく類似度算出を可能とする。しかしながら、メタデータが人間の感性に基づく単語から構成されるため、設定が困難であり、類似度の定量化も困難となる問題がある。また、類似度算出において楽曲の構造やメロディー等、音楽の構成要素を反映することは困難である。
一方、非特許文献2の手法では、歌唱から得られる音声と楽曲の類似度算出を可能とする。しかしながら、同一楽曲の検索を目的とするため、異なる楽曲間での類似度算出には十分ではない。
以上から本発明の目的は、上記従来の問題を解決する新たなメロディーの類似度算出手法及び算出装置を提供することである。
本発明の別の目的は、倍音構造や雑音の影響を軽減可能とし、推定精度が良好なメロディーの類似度算出手法及び算出装置を提供することである。
また、本発明の別の目的は、メロディーの伸縮や欠落が生じた場合にも類似度算出が可能なメロディーの類似度算出手法及び算出装置を提供することである。
本発明の第1の態様は、2つの楽曲におけるメロディーの類似度を算出するメロディーの類似度算出方法であり、比較する2つの楽曲信号のそれぞれに含まれるベース音の時間的変化を示す音高推移特性を取得する第1ステップ、前記各楽曲信号に含まれるベース音以外の楽器音のエネルギーの時間的変化を示すエネルギー特性を取得する第2ステップ、各楽曲の音高推移特性の類似度を計算する第3ステップ、各楽曲のベース音以外の楽器音のエネルギー特性の類似度を計算する第4ステップ、
前記各類似度を用いてメロディーの類似度を算出する第5ステップを有している。
前記第2ステップにおいて、各楽曲信号の音名毎に、該音名の周波数成分のエネルギー及びその2k倍(k=1,2、・・・)の周波数成分のエネルギーを合計したエネルギーの時間変化特性を求め、前記第4ステップにおいて、2つの楽曲信号の音名毎のエネルギー特性の相違度を計算し、該音名毎の相違度を合計し、該合計値の逆数により前記エネルギー特性の類似度を計算する。また、前記第5ステップにおいて、前記音高推移特性の類似度とエネルギー特性の類似度を乗算してメロディーの類似度を算出する。
本発明の第2の態様は、2つの楽曲におけるメロディーの類似度を算出するメロディーの類似度算出装置であり、比較する2つの楽曲信号のそれぞれに含まれるベース音の時間的変化を示す音高推移特性を取得する音高推移取得部、前記各楽曲信号に含まれるベース音以外の楽器音のエネルギーの時間的変化を示すエネルギー特性を取得するエネルギー特性取得部、各楽曲の音高推移特性の類似度を計算する第1の類似度計算部、各楽曲のベース音以外の楽器音のエネルギー特性の類似度を計算する第2の類似度計算部、前記各類似度を用いてメロディーの類似度を算出するメロディー類似度算出部を有している。
前記エネルギー特性取得部は、各楽曲信号の音名毎に、該音名の周波数成分のエネルギー及びその2k倍(k=1,2、・・・)の周波数成分のエネルギーを合計したエネルギーの時間変化特性を取得する複数の音名エネルギー取得部を備え、前記第2の類似度計算部は、2つの楽曲信号の音名毎のエネルギー特性の相違度を計算する相違度計算部、音名毎の相違度を合計し、該合計値の逆数により前記エネルギー特性の類似度を計算する計算部を有している。また、前記メロディー類似度算出部は、前記音高推移特性の類似度とエネルギー特性の類似度を乗算してメロディーの類似度を算出する乗算部を備えている。
本発明によれば、ベース音以外の楽器音のエネルギーとして、各音名が示す周波数のエネルギーを用いるため、倍音構造、雑音の影響を軽減可能であり、推定精度が良好なメロディーの類似度算出手法及び算出装置を提供することができる。
また、本発明によれば、低周波数域に基本周波数を持つベース音を併せて用いることで、倍音構造の影響をより軽減した類似度算出を可能とする。
さらに、本発明によれば、類似度の算出にはDTW を用いるため、メロディーの伸縮や欠落が生じた場合にも類似度算出が可能となる。
(A)本発明の概略
本発明は、音楽の構成要素であるメロディーに着眼する。音楽におけるメロディーとは、複数の音源により構成される基本周波数の時間推移である(石桁真礼生、“楽典−理論と実習、”音楽之友社発行、1980を参照)。本発明は、このメロディーの定義に従い、メロディーがベース音と、それ以外の楽器音から構成されると仮定する。さらに、この仮定に基づき、ベース音が示すエネルギーの推移、及びベース音以外の楽器音が示すエネルギーの推移についてマッチング処理を施すことで類似度を得る。ベース音が示すエネルギーとしてはベース音が存在する周波数域のパワースペクトルを用い、その他の楽器音が示すエネルギーとしてはC,D,E,・・・・等の音名が示す周波数のエネルギーを用いる。図1は音名説明図であり、1は日本語の音名(ハニホヘトイロハ)、2は英語標記の音名(CDEFGAB)、3は音符、4はハ長調での階名である。
ところで、音楽信号には以下の2つの特徴がある。第1の特徴は、楽器音に基本周波数の倍音が多く含まれる(以降、倍音構造という) 点であり、このため周波数域が高くなるに従い、基本周波数の特定が困難となる。第2の特徴は、楽曲中には発音の際に発生する擦弦音等の雑音が含まれる点であり、このため、音階上に存在しない周波数が楽器音の基本周波数として推定される可能性がある。
本発明はベース音が示すエネルギーの推移およびベース音以外の楽器音が示すエネルギーの推移、例えば、音名のエネルギーの推移を用いることにより、上記2つの特徴を有する音楽信号に有効に対応することができる。
本発明の実施例を説明する前に、本発明で使用するDTW(Dynamic Time Warping)技術と、音高推移特性の取得方法と、ベース音以外の楽器音が示すエネルギーの算出法を説明する。
(B)DTW技術
最初に、一般的なDTW について説明し、しかる後、本発明の類似度算出に用いるDTWの構成について説明する。
DTWとは、二つの一次元信号に伸縮を施し、信号間の相違度を算出する手法である。このため、時間軸方向に伸縮の生じる信号の比較に有効である。特に音楽信号では、演奏速度の変化が頻繁に発生することから、相違度より求められる類似度の算出にDTWを用いることは有効である。以降、相違度算出において、参照する信号を参照パターン、参照パターンとの相違度を求める信号を被参照パターンと呼ぶ。
まず、DTW によるパターン間の相違度の算出について説明する。長さI の一次元の参照パターンに含まれる各要素を順にa1,a2,…,aI とし、長さJ の被参照パターンに含まれる各要素を順にb1,b2,…,bJ と表現する。さらに、各パターンの位置集合を{a1,a2,…,aI},[ b1,b2,…,bJ ] で表現すると、パターンの各要素間の対応を決定する伸縮写像w:[1,2,…,I]→{1,2,…,J}は以下の性質を満たす。すなわち、
「wはパターンの始点、終点を一致させるもので、
Figure 2008257020
である。また、wは単調写像であり、次式
Figure 2008257020
が成立する。
このような写像w を用いたとき、パターン間の相違度の算出は図2における格子点(b1,a1) から格子点(bJ,aI) までの最短経路の探索問題に置換することができる。そこで、DTW では、
「初期状態の最初の決定が何であろうとも、以後の決定は最初の遷移から生じた状態に関して適切でなければならない」
という最適性の原理に基づいて上記の経路探索問題を解く。すなわち、全体の経路長を部分の経路長の和で求める。部分の経路長は、経路上の格子点(aj,bi) におけるコストd (j,i)、及び2 つの格子点(aj,bi),(bj-1,ai-1)間の移動コストcj,i(j-1,i-1)に加え、cj,i(j,i-1),cj,i(j-1,i)の3つを用いて算出する。部分の経路長の算出法を図2に示す。ここで、格子点上のコストd (j,i)は参照パターンと被参照パターンの間で対応する要素が異なる場合のペナルティであり、たとえば、要素が同じであれば0、異なればαである。また、移動コストcj,i(j-1,i-1) は参照パターンと被参照パターンの間で伸縮が生じた場合、格子点(bj-1,ai-1) から格子点(bj,ai) に移動するペナルティであり、たとえばi=jであれば0、パターンのずれによりi≠jであればβである。
上記のコストに基づいて部分の経路長を算出し、経路全体のコストが最小となる部分経路を選択する。最後に、選択された部分経路毎のコストの和を算出することで、全体の経路長が得られる。以上より、パターンの部分毎の相違度からパターン全体の相違度を得ることが可能となる。
本発明では、DTW を音楽信号に適用することから、音楽信号の類似度算出における特徴を考慮し、さらに詳細な相違度の算出法を提案する。本発明は、音楽の特徴として、同一楽曲の演奏速度が異なる場合にも、楽譜上の音符が欠落することがない点に着眼する。この特徴を、格子点間の移動による相違度算出に適用すると、参照パターンに含まれる全ての要素が被参照パターンに含まれ、要素間の対応が決定されることを意味する。従って、伸縮写像w は次式に示す傾斜制限を加えることが可能となる。
Figure 2008257020
本発明上記の条件に従ってDTW による相違度の算出を行う。これより相違度は、(4)式を用いて経路長を漸化的に求めることで算出可能となる。
Figure 2008257020
例えば、(4)式より、図4に示す格子点(1,1)の相違度D(1,1)は
D(1,1)=d(1,1)
であり、格子点(1,2)の相違度D(1,2)は
D(1,2)=d(1,2)+c1,2(1,1,)+D(1,1)
であり、格子点(2,1)の相違度D(2,1)は
D(2,1)=d(2,1)+c2,1(1,1,)+D(1,1)
である。同様にして第1行目の格子点の相違度及び第1列目の格子点の相違度が求まる。そして、以後、順次(4)式により他の格子点の相違度が求まってゆき、最終的に格子点(5,6)の相違度D(5,6)が求まる。この相違度D(5,6)が図3の2つのパターンa:{a1,a2,…,a6},b:[ b1,b2,…,b5 ]の相違度となる。
(C)音高推移特性の取得
本発明では、楽曲中のベース音の推移として、ベース音が示す音高の推移を用いる。音高とは、楽譜上に記載される各音符が示す基本周波数である。従って、音高の推移はベース音に含まれる主要な周波数におけるエネルギーの推移を意味する。ベース音の音高は、下記文献1に記載されている音高推定手法に従って推定する。
文献1:今野聡司、他“音楽信号の低周波数域における楽曲の構造に着眼した時間周波数解析に関する検討"、映像情報メディア学会技術報告、vol.29, no.46, pp.13-16, 2005
図5は音高推定装置の構成図である。バンドパスフィルタ1はベース音が存在する周波数帯域に基づいて処理対象の楽曲信号に含まれる40〜250Hzの信号成分を通過する。パワースペクトル算出部2はバンドパスフィルタ出力信号からパワースペクトルを算出する。評価関数計算部3は該パワースペクトルの時間軸方向、及び周波数軸方向にガウス関数に基づく重みを付加し、最後に、音高推定部4は重み付けされた各時刻のパワースペクトルにおいて最大のエネルギーを与える周波数を音高として推定する。
すなわち、時刻t(0 ≦t ≦ T)、周波数f においてパワースペクトル算出部2が算出するエネルギーをP(t,f)とすれば、評価関数計算部3は(5)式により重み付けされたパワースペクトルR(t,f)を評価関数として出力する。
Figure 2008257020
なお、vt(s)は時間軸の重みであり、
Figure 2008257020
ただし、σは音の持続時間の指標となる定数である。また、(5)式においてw(f)は周波数軸の重みであり、
Figure 2008257020
ただし、mを自然数として、
Figure 2008257020
で示されるFm は、DI(Musical Instrument Digital Interface)のm 番目のノートにおける周波数を表す。
(5)式の評価関数R(t,f)は、(6) 式の時間軸方向の重みにより、一定時間持続する基本周波数を音高として推定可能とする。また、(7) 式に示す周波数軸方向の重みにより、音階上に存在する周波数のみを音高として推定可能とする。以降、評価関数R(t,f)の各時刻t において最大値を与える周波数f をベースの音高とし、B(t) と表す。
(D)その他の楽器音によるエネルギーの推移
次に、ベース音以外の楽器音が示すエネルギーの算出法について説明する。一般的な音楽の構成では、主にベース音が楽曲の最低音となるため、その他の楽器音はベース音の周波数域より高い周波数を示す。また、ベース音より高い周波数域で、各音名は図6に示す周波数を持ち、各周波数の2k(k = 1,2,...) 倍の周波数も同一の音名として扱われる。そこで、本発明では、ベース音以外の楽器音が示すエネルギーを、ベース音の周波数より高く、かつ音名が持つ周波数のエネルギーとする。さらに、各音名が示す周波数のエネルギーには、図6の2k 倍の周波数が示すエネルギーの和を用いる。これにより、本発明は複数の楽器による倍音構造を軽減し、音高の推定が困難な周波数域に存在する楽器音についても類似度算出に用いることを可能とする。以上の手順概要を図7 に示し、以下で詳細を説明する。なお、音楽信号の信号長はT 秒、サンプリングレートはfs とし、また、時刻t(0 ≦t≦ T)および周波数f におけるエネルギーはパワースペクトルより算出されてP(t,f)と表す。
1 )音名が示す周波数のエネルギーの算出:
パワースペクトルから、各音名が示す周波数のエネルギーを算出する。図6 において音名X に対応する周波数をfX として、音名X が示す周波数のエネルギーPX(t) を次式で定義する。
Figure 2008257020
ただし、K はを越えない任意の整数とする。(9)式により各音名が示す周波数のエネルギーを定義することで、倍音の影響が軽減可能となる。
2 )エネルギーの割合の算出:
1)で得られた各音名が示す周波数のエネルギーを全周波数域に対するエネルギーの割合で表現する。これにより、音名毎に時間軸方向での比較が可能となり、推移を得ることが可能となる。音名X が示す周波数のエネルギーの割合px(t) は次式で示される。
Figure 2008257020
以上を全てのt、X について施し、得られたpx(t) をベース音以外の楽器音におけるエネルギーの推移として用いる。
図8は各音名のエネルギー特性を取得する音名エネルギー取得部の構成図であり、音名の周波数成分、該周波数の2k(k = 1,2,...) 倍の周波数成分をそれぞれ通過するバンドパスフィルタ111〜11n、各バンドパスフィルタ出力を合成することにより音名エネルギーPX(t)を出力する合成部12、(10)式によりエネルギーの割合px(t)を出力するエネルギー割合計算部13を備えている。
(E)メロディー類似度算出法
図9は2つの楽曲におけるメロディーの類似度を算出する本発明のメロディーの類似度算出方法の処理フローである。
本発明は、まずメロディーがベース音、及びベース音以外の楽器音から構成されると仮定する。これは、ベース音と他楽器音により同時に発音される音が、メロディーの特徴を決定する和音や調の指標となるためである。本発明は上記の仮定に基づき、それぞれの楽器音のエネルギーにDTW を適用することで類似度を算出する。
すなわち、最初に比較する2つの楽曲信号のそれぞれに含まれるベース音の時間的変化を示す音高B(t)を取得し(ステップ101)、また、各楽曲信号に含まれるベース音以外の楽器音のエネルギーの時間的変化を示すエネルギー特性px(t)を取得する(ステップ102)。次に(4)式に基づくDTW を用いて、各楽曲の音高の相違度を求め、その逆数を演算することで類似度Saを計算する(ステップ103)。しかる後、同様に、DTW を用いて、各楽曲のベース音以外の楽器音のエネルギー特性の相違度を求め、その逆数を演算することで類似度Sbを計算する(ステップ104)。最後に、音高B(t)、ベース音以外の楽器音のエネルギーpx(t)のそれぞれについて得られた類似度の積(Sa×Sb)を算出することでメロディーの類似度とする(ステップ105)。
以下で類似度算出の詳細について説明する。なお、DTW による相違度算出では、各楽曲信号を十分に小さい時間で分割し、一方を参照パターン、他方を被参照パターンとして用いる。
1)音高B(t) の相違度算出:
図5で説明したように、参照側のメロディーと被参照側のメロディーそれぞれについてベースの音高を推定し、DTWによる相違度算出を行う。ここで、DTW の(4)式で用いる各コストは以下のように設定する。
Figure 2008257020
Figure 2008257020
ただし、α>βとする。これにより、メロディーの不一致によるコストと比較して、演奏速度の変化等に伴うメロディーのずれに対するコストが小さくなる。以上により得られた相違度をDb と表す。
2)px(t) の相違度算出:
参照側のメロディーと被参照側のメロディーそれぞれについて、ベース音以外の楽器音の音名X毎のネルギーpxr (t), pxi (t)を算出し、これらを用いて音名毎にDTW による相違度Daxの算出を行う。従って、相違度は音名の数である12個得られる。そして、ベース以外の楽器音の相違度は音名毎に得られた相違度の和により定義する。すなわち、音名X について得られる相違度をDax とすると、ベース以外の楽器による音の相違度Da は次式で表される。
Da = DaC+DaCis+DaD+DaDis+DaE+DaF+DaFis +DaG +DaGis +DaA +DaB +DaH (13)
なお、DTWによる相違度算出に用いるコストは以下のように設定する。
Figure 2008257020
Figure 2008257020
以上、(13)式により、全ての音名が示す周波数のエネルギーの推移を用いた相違度算出が可能となる。また、(14)式に示すコストを設定することで、エネルギーの大きな周波数に対応する音名が、相違度全体に与える影響を増加する。これにより、メロディーを構成する主要な周波数成分を反映した相違度算出が可能となる。
3)各類似度の算出:
上記1)、2)で得られた相違度Db,Daの逆数を算出することで類似度とし、Sb, Sa と表す。
4)メロディーの類似度算出:
上記3)で得られた類似度Sb, Saから次式
S = Sb×Sa (16)
によりメロディーの類似度S を算出する。
以上の処理により、メロディー間の類似度を算出する。メロディー間の類似度は、ベース音とその他の楽器による音のエネルギーそれぞれの類似度から算出する。このため、倍音構造や雑音の影響を軽減可能とし、メロディーを構成する複数の楽器音を反映した類似度算出が可能となる。また、DTW を用いるため、メロディー間に伸縮や欠落が生じた場合にも類似度算出が可能となる。
(F)メロディー類似度算出装置
図10は2つの楽曲におけるメロディーの類似度を算出する本発明のメロディーの類似度算出装置の構成図である。参照側及び被参照側の音高推移取得部51,71はそれぞれ比較する2つの楽曲信号に含まれるベース音の時間的変化を示す音高推移特性を取得し、参照側及び被参照側のエネルギー特性取得部52,72は楽曲信号に含まれるベース音以外の楽器音のエネルギーの時間的変化を示すエネルギー特性を取得する。エネルギー特性取得部52は、12個の音名のエネルギー特性をそれぞれ取得する12個のエネルギー取得部521〜5212を備えている。図示しないがエネルギー特性取得部72も同様の構成を備えている。相違度計算部53はDTW を用いて、各楽曲の音高の相違度Dbを求め、演算部54は相違度の逆数を演算することで類似度Sbを計算する。
各音名の相違度計算部551〜5512はDTW を用いて音名毎にエネルギー特性の相違度を計算し、演算部56は音名毎のエネルギー特性の相違度を合計してベース音以外の楽器音のエネルギー特性の相違度Daを求め((13)式参照)、演算部57は相違度Daの逆数を演算することで類似度Saを計算する。メロディー類似度計算部58は、音高B(t)、ベース音以外の楽器音のエネルギーpx(t)のそれぞれについて得られた類似度Sb,Saの積Sを算出し、該積をメロディーの類似度Sとして出力する。
(G)実験
本発明の有効性を確認するために実験を行った。実験にはCD から直接入手した44.1kHz、10秒の音楽信号を3 つ用いた。音楽信号は同一の楽曲から2 箇所、異なる楽曲から1 箇所切り出した信号であり、以降それぞれを順に信号1、 信号2、 信号3 とする。なお、本発明で用いるパラメータはそれぞれσ = 0:1、α=3、β=1、γ=0.1、k=10とした。
実験結果を図11、図12に示す。図11は各信号間で最終的に得られた類似度を示している。ただし、図における類似度は、左端に示す信号を参照パターン、右上端に示す信号を被参照パターンとして用いた場合の結果を表す。一方、図12は、各時刻までで算出される類似度を示している。ただし、図12(A),(B),(C)は参照パターンを信号1、2、3とし、他の2つの信号を被参照パターンとして得られた類似度を示す。ここで、被参照パターンに用いた信号1、2、3は図中でそれぞれ実線、破線、点線で示してある。
まず、信号1 について考察を行う。図11 より、信号3と比較して、信号2 との類似度が高いことが確認できる。また、図12(A) より、各時刻における類似度についても、同様に信号2 との類似度が高いことが確認できる。これは、信号1、2 が同一の楽曲の異なる時間を切り出した信号であるため、メロディー全体に渡り、同時に発音される音が類似するためと考えられる。また、図12(A)の3.5 秒以降の類似度が特に高くなることが確認できる。これは、信号1 の演奏において、メロディーが強調される演奏がなされたことに起因すると考えられる。このため、 各音名が示す周波数のエネルギーが強くなり、楽曲2 との類似度が高くなったと考えられる。
次に、信号2 について考察を行う。信号1 と同様に、図11より、信号3と比較して信号1との類似度が高いことが確認できる。しかしながら、図12(B)より、信号1、3との類似度は各時刻で比較すると差が小さいことが確認できる。この点は、信号2が楽曲のサビであるため、同時に発音される楽器数が多く、信号のパワーが極めて強いことが原因と考えられる。このため、信号2と比較してパワーの小さい信号1、3 が類似すると推定されたと考えられる。
最後に、信号3について考察を行う。図11より、信号3と異なる楽曲である信号1、2との類似度は低いことが確認できる。また、図12より、各時刻においても信号1、2との類似度は低く、時間による変化が少ないことが確認できる。以上より、提案手法は楽曲の類似度を算出可能であることが確認できる。図12では、信号1、2、3 いづれの類似度算出においても、時間軸に対して類似度が増加することが確認できる。また、時間の経過に従って類似度の変化が小さくなることが確認できる。これらは、類似度がDTW を用いた経路探索により得られるため、短い経路では類似度算出の精度が劣化することを意味する。このため、類似度の算出では、十分な信号長を持つ信号を用いる必要があると考えられる。
音名説明図である。 DTW(Dynamic Time Warping)技術の第1の説明図である。 DTW技術の第2の説明図である。 本発明のDTWの説明図である。 音高推定装置の構成図である。 各音名の周波数説明図である。 本発明の手順概要説明図である。 音名のエネルギー特性を取得する音名エネルギー取得部の構成図である。 2つの楽曲におけるメロディーの類似度を算出する本発明のメロディーの類似度算出方法の処理フローである。 2つの楽曲におけるメロディーの類似度を算出する本発明のメロディー類似度算出装置の構成図である。 第1の実験結果である。 第2の実験結果である。
符号の説明
51,71 参照側及び被参照側の音高推移取得部
52,72 参照側及び被参照側のエネルギー特性取得部
521〜5212 音名エネルギー取得部
53 音高の相違度計算部
54 演算部
551〜5512 各音名の相違度計算部
56、57 演算部
58 メロディー類似度計算部

Claims (6)

  1. 2つの楽曲におけるメロディーの類似度を算出するメロディーの類似度算出方法において、
    比較する2つの楽曲信号のそれぞれに含まれるベース音の時間的変化を示す音高推移特性を取得する第1ステップ、
    前記各楽曲信号に含まれるベース音以外の楽器音のエネルギーの時間的変化を示すエネルギー特性を取得する第2ステップ、
    各楽曲の音高推移特性の類似度を計算する第3ステップ、
    各楽曲のベース音以外の楽器音のエネルギー特性の類似度を計算する第4ステップ、
    前記各類似度を用いてメロディーの類似度を算出する第5ステップ、
    を有することを特徴とするメロディーの類似度算出方法。
  2. 前記第2ステップにおいて、各楽曲信号の音名毎に、該音名の周波数成分のエネルギー及びその2k倍(k=1,2、・・・)の周波数成分のエネルギーを合計したエネルギーの時間変化特性を求め、
    前記第4ステップにおいて、2つの楽曲信号の音名毎のエネルギー特性の相違度を計算し、該音名毎の相違度を合計し、該合計値の逆数により前記エネルギー特性の類似度を計算する、
    ことを特徴とする請求項1記載のメロディーの類似度算出方法。
  3. 前記第5ステップにおいて、前記音高推移特性の類似度とエネルギー特性の類似度を乗算してメロディーの類似度を算出する、
    ことを特徴とする請求項1記載のメロディーの類似度算出方法。
  4. 2つの楽曲におけるメロディーの類似度を算出するメロディーの類似度算出装置において、
    比較する2つの楽曲信号のそれぞれに含まれるベース音の時間的変化を示す音高推移特性を取得する音高推移取得部、
    前記各楽曲信号に含まれるベース音以外の楽器音のエネルギーの時間的変化を示すエネルギー特性を取得するエネルギー特性取得部、
    各楽曲の音高推移特性の類似度を計算する第1の類似度計算部、
    各楽曲のベース音以外の楽器音のエネルギー特性の類似度を計算する第2の類似度計算部、
    前記各類似度を用いてメロディーの類似度を算出するメロディー類似度算出部、
    を有することを特徴とするメロディーの類似度算出装置。
  5. 前記エネルギー特性取得部は、各楽曲信号の音名毎に、該音名の周波数成分のエネルギー及びその2k倍(k=1,2、・・・)の周波数成分のエネルギーを合計したエネルギーの時間変化特性を取得する複数の音名エネルギー取得部を備え、
    前記第2の類似度計算部は、2つの楽曲信号の音名毎のエネルギー特性の相違度を計算する相違度計算部、音名毎の相違度を合計し、該合計値の逆数により前記エネルギー特性の類似度を計算する計算部、
    を有することを特徴とする請求項4記載のメロディーの類似度算出装置。
  6. 前記メロディー類似度算出部は、前記音高推移特性の類似度とエネルギー特性の類似度を乗算してメロディーの類似度を算出する乗算部、
    を備えることを特徴とする請求項4記載のメロディーの類似度算出装置。
JP2007100303A 2007-04-06 2007-04-06 メロディーの類似度算出方法及び類似度算出装置 Pending JP2008257020A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007100303A JP2008257020A (ja) 2007-04-06 2007-04-06 メロディーの類似度算出方法及び類似度算出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007100303A JP2008257020A (ja) 2007-04-06 2007-04-06 メロディーの類似度算出方法及び類似度算出装置

Publications (1)

Publication Number Publication Date
JP2008257020A true JP2008257020A (ja) 2008-10-23

Family

ID=39980645

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007100303A Pending JP2008257020A (ja) 2007-04-06 2007-04-06 メロディーの類似度算出方法及び類似度算出装置

Country Status (1)

Country Link
JP (1) JP2008257020A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008257019A (ja) * 2007-04-06 2008-10-23 Alpine Electronics Inc メロディー推定方法及びメロディー推定装置
CN109478198A (zh) * 2016-05-20 2019-03-15 弗劳恩霍夫应用研究促进协会 用于确定相似度信息的装置、用于确定相似度信息的方法、用于确定自相关信息的装置、用于确定互相关信息的装置以及计算机程序
CN112837680A (zh) * 2019-11-25 2021-05-25 马上消费金融股份有限公司 音频关键词检索方法、智能外呼方法及相关装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172693A (ja) * 1998-12-01 2000-06-23 Nippon Telegr & Teleph Corp <Ntt> 音楽検索装置,音楽検索方法および音楽検索プログラムを記録した記録媒体
JP2001075985A (ja) * 1999-09-03 2001-03-23 Sony Corp 音楽検索装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172693A (ja) * 1998-12-01 2000-06-23 Nippon Telegr & Teleph Corp <Ntt> 音楽検索装置,音楽検索方法および音楽検索プログラムを記録した記録媒体
JP2001075985A (ja) * 1999-09-03 2001-03-23 Sony Corp 音楽検索装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
今野聡司、二反田直己、長谷山美紀: "メロディーとリズムに着眼した音楽信号の類似度に関する一考察", 電子情報通信学会技術研究報告, vol. 第106巻、第536号, JPN6011060743, 15 February 2007 (2007-02-15), JP, pages 125 - 128, ISSN: 0002074018 *
蔭山哲也、高島洋典: "ハミング歌唱を手掛りとするメロディ検索", 電子情報通信学会論文誌, vol. 第J77-D-II巻、第8号, JPN6009024719, 25 August 1994 (1994-08-25), JP, pages 1543 - 1551, ISSN: 0002074019 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008257019A (ja) * 2007-04-06 2008-10-23 Alpine Electronics Inc メロディー推定方法及びメロディー推定装置
CN109478198A (zh) * 2016-05-20 2019-03-15 弗劳恩霍夫应用研究促进协会 用于确定相似度信息的装置、用于确定相似度信息的方法、用于确定自相关信息的装置、用于确定互相关信息的装置以及计算机程序
JP2021157180A (ja) * 2016-05-20 2021-10-07 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 類似性情報決定装置、類似性情報決定方法、自己相関情報決定装置、相互相関情報決定装置およびコンピュータプログラム
JP7317888B2 (ja) 2016-05-20 2023-07-31 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 類似性情報決定装置、類似性情報決定方法、自己相関情報決定装置、相互相関情報決定装置およびコンピュータプログラム
CN109478198B (zh) * 2016-05-20 2023-09-22 弗劳恩霍夫应用研究促进协会 用于确定相似度信息的装置、方法及计算机存储介质
CN112837680A (zh) * 2019-11-25 2021-05-25 马上消费金融股份有限公司 音频关键词检索方法、智能外呼方法及相关装置

Similar Documents

Publication Publication Date Title
Turetsky et al. Ground-truth transcriptions of real music from force-aligned midi syntheses
JP4243682B2 (ja) 音楽音響データ中のサビ区間を検出する方法及び装置並びに該方法を実行するためのプログラム
US7035742B2 (en) Apparatus and method for characterizing an information signal
JP3964792B2 (ja) 音楽信号を音符基準表記に変換する方法及び装置、並びに、音楽信号をデータバンクに照会する方法及び装置
US8440901B2 (en) Musical score position estimating apparatus, musical score position estimating method, and musical score position estimating program
Bosch et al. Evaluation and combination of pitch estimation methods for melody extraction in symphonic classical music
McNab et al. Tune retrieval in the multimedia library
JPH1115468A (ja) 楽曲検索方法、楽曲検索装置、楽曲検索システム、及び記録媒体
CN103559309A (zh) 一种基于gpu加速的音乐检索与推荐***
Elowsson et al. Modeling the perception of tempo
Heydarian Automatic recognition of Persian musical modes in audio musical signals
JP3730144B2 (ja) 類似音楽検索装置ならびにその方法、および類似音楽検索プログラムならびにその記録媒体
JP2008257020A (ja) メロディーの類似度算出方法及び類似度算出装置
Nagavi et al. An extensive analysis of query by singing/humming system through query proportion
JP3934556B2 (ja) 信号識別子の抽出方法及びその装置、信号識別子からデータベースを作成する方法及びその装置、及び、検索時間領域信号を参照する方法及びその装置
JP4695781B2 (ja) 音響信号の符号化方法
JP2007240552A (ja) 楽器音認識方法、楽器アノテーション方法、及び楽曲検索方法
JP2004531758A5 (ja)
JP4268328B2 (ja) 音響信号の符号化方法
MA et al. A review on tonic estimation algorithms in indian art music
Zhang Music Data Feature Analysis and Extraction Algorithm Based on Music Melody Contour
Ezers et al. Musical Instruments Recognition App
JP3776782B2 (ja) 音響信号の符号化方法
JP2002244691A (ja) 音響信号の符号化方法
Lindenbaum et al. Musical features extraction for audio-based search

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100325

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111122

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120313