JP2003529091A - 音楽データベースの検索 - Google Patents

音楽データベースの検索

Info

Publication number
JP2003529091A
JP2003529091A JP2001516077A JP2001516077A JP2003529091A JP 2003529091 A JP2003529091 A JP 2003529091A JP 2001516077 A JP2001516077 A JP 2001516077A JP 2001516077 A JP2001516077 A JP 2001516077A JP 2003529091 A JP2003529091 A JP 2003529091A
Authority
JP
Japan
Prior art keywords
music
search
input
file
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001516077A
Other languages
English (en)
Other versions
JP2003529091A5 (ja
JP4344499B2 (ja
Inventor
ベンジャミン ジェイムズ フィン,
ジョナサン ハンバート フィン,
ポール ウォームスレイ,
ジュリアン スミス,
Original Assignee
シベリウス ソフトウェア リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シベリウス ソフトウェア リミテッド filed Critical シベリウス ソフトウェア リミテッド
Publication of JP2003529091A publication Critical patent/JP2003529091A/ja
Publication of JP2003529091A5 publication Critical patent/JP2003529091A5/ja
Application granted granted Critical
Publication of JP4344499B2 publication Critical patent/JP4344499B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • G06F16/634Query by example, e.g. query by humming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/687Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/011Files or data streams containing coded musical information, e.g. for transmission
    • G10H2240/046File format, i.e. specific or non-standard musical file format used in or adapted for electrophonic musical instruments, e.g. in wavetables
    • G10H2240/056MIDI or other note-oriented file format
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/131Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
    • G10H2240/135Library retrieval index, i.e. using an indexing scheme to efficiently retrieve a music piece
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/131Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
    • G10H2240/141Library retrieval matching, i.e. any of the steps of matching an inputted segment or phrase with musical database contents, e.g. query by humming, singing or playing; the steps may include, e.g. musical analysis of the input, musical feature extraction, query formulation, or details of the retrieval process

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Auxiliary Devices For Music (AREA)
  • Toys (AREA)

Abstract

(57)【要約】 コンピュータを基盤としたシステムであって、音楽ファイルのデータベースへの検索を実現するためのものであり、入力手段を含む。入力手段は、一連の旋律的音程として節回しを含んでいる検索基準を入力するためのものである。入力は、マイクロフォンまたはMIDIキーボードにより行うことができる。検索基準は、コンピュータ読み取り可能な複数の音楽ファイルに含まれる選択的部分からの旋律的音程の連なりと比較される。複数の前記音楽ファイルについての索引が作成され、または、複数の前記音楽ファイルにタッグ付け処理を施し、これにより、旋律に一致しそうな選択的関連部分を特定する。前記検索基準と、コンピュータ読み取り可能な複数の音楽ファイルとの、あり得る一致を挙げたリストを含んでいる出力、好ましくは、あり得る一致をランク付けしたリストを含んでいる出力が生成される。

Description

【発明の詳細な説明】
【0001】 (技術分野) 本発明は、検索エンジン及びデータベースに関し、特に、コンピュータシステ
ムにおいて、記録もしくは符号化されたサウンドファイルのデータベースから、
音楽シーケンス及び音楽フレーズを検索するのに適した検索エンジンに関する。
【0002】 (背景技術) 本発明は、さまざまなタイプのデータベースでの検索に関する。データベース
では、発行者によるコンパクトディスクカタログのように、大きさ、範囲及びフ
ァイル形式が制限される。また、データベース検索は、検索サイズ及び検索範囲
が大きくてもよく、ネットワーク上で広く頒布でき、異なった多数のファイルタ
イプを含んでいてもよい。1つの例は、インターネット検索である。
【0003】 多くの事情から、音楽データベースの検索では、音楽の一部分に含まれる旋律
もしくは音楽的連なりの一部分のみに基づいて音楽の特定部分を見出せることが
望まれている。さもないと、検索では、より細かい普通の書誌的情報、例えば、
作品の題名、作曲者、発行者、歌詞(lyrics)などが検索の結果として得られなけ
ればならず、検索者は、必ずしも、このような細かい情報を知っているとは限ら
ない。
【0004】 音楽ファイルのデータベース上で音楽の一部分を検索することに関する問題と
しては、多数の及びさまざまな問題が知られている。
【0005】 まず、知られた節回しを検索基準としてコンピュータシステムに与えるための
適切な入力装置が、必要である。通常のコンピュータ入力装置(例えば、キーボ
ードなど)を介してコンピュータシステムに音楽を入力することは、未熟練な利
用者にとって容易ではない。
【0006】 次に、コンピュータの音楽ファイルに見出される複雑なパターンに対し、検索
基準を比較する方法は難しい。なぜならば、記録もしくは符号化された複雑な音
において、認識し得る旋律の正確な位置が知られていないからである。さまざま
な形式のファイル、例えば、MIDIファイル、MP3ファイル、WAVファイ
ル、シーケンサーファイル、楽譜記述ファイル、または他の適切な形式のファイ
ルが備えられていなければならない。
【0007】 本明細書において、「音楽ファイル」という表現は、電子的、磁気的もしくは
光学的に記録されたコンピュータ読み取り可能なファイルであって、音楽のデジ
タル的な情報を含み、かつ、音楽的ピッチデータを抽出し得る全ての形式のファ
イルを含むものとして用いられる。これらは、例えば、MP3形式により符号化
もしくは記録された音に関連し、または、音を生成するための信号化された指令
、例えば、MIDIファイル形式に関連していてもよい。
【0008】 本明細書において、「節回し」という表現は、音符のピッチの連なり、好まし
くは、和音よりもむしろ一重の音を指す。音符のピッチの連なりは、検索基準の
基礎を構成し得る。本発明において、音符と言う場合は、記号としての音符その
ものを表す他、信号化されたもの、例えば、その音符により表現される音などを
含むこともある。また、本明細書において、「旋律」という表現は、一般に、検
索される音楽ファイルの一部分に含まれている音符ピッチの連なりであって、入
力される検索用節回しが見出される位置、例えば、歌声のラインもしくはソロ楽
器のラインにある音符ピッチの連なりを指す。
【0009】 先行技術では、ミュージカルコンター(musical contours)の連なりを与える比
較的単純な方法によって検索基準を特定することが提案されている。これらのミ
ュージカルコンターは、ピッチの相対的変化を記述し、音符が、先行の音符との
比較において高いか、低いか、もしくは同じであるかを示す。この形式では、利
用者が「DUDRUDDUUDUUDUDR」のようなキャラクタストリング(character string)を
与えるだけで、キーボードを介した入力が容易に行われる。但し、キャラクタス
トリング「DUDRUDDUUDUUDUDR」において、「D」は下向きの変化を示し、「U」は
上向きの変化を示し、「R」は先行音符のピッチを繰り返すことを示している。
このような技術は、特別な構成のデータベースに対し、ある程度の効果を得られ
るが、その不正確さによって制約され、検索基準の入力が、未熟練な利用者にと
って難しい。しかも、このような技術は、一般の音楽ファイルを検索するのにあ
まり適していない。
【0010】 (発明の開示) 本発明の課題は、検索エンジンに入力される音楽検索基準であって、未熟練者
や非専門家にも容易に利用できる音楽検索基準を提供するための方法及び装置を
提供することである。
【0011】 本発明のもう一つの課題は、データベースに音楽検索基準を適用し、これによ
り、コンピュータ用の蓄積媒体に収納されたターゲットの音楽ファイルとの一致
を得るための方法及び装置を提供することである。
【0012】 本発明の更にもう一つの課題は、コンピュータシステムのデータベースにおい
て音楽ファイルを構成し、これにより、節回しを含む検索基準による検索処理を
高速化もしくは能率化するための方法及び装置を提供することである。
【0013】 本発明に係る一つの態様では、音楽ファイルのデータベースを検索するための
装置が提供される。この検索用装置は、入力手段と、比較手段と、出力手段とを
含む。
【0014】 入力手段は、一連の旋律的音程として節回しを含んでいる検索基準を入力する
ためのものである。比較手段は、前記一連の旋律的音程を、コンピュータ読み取
り可能な複数の音楽ファイルに含まれる選択的部分と比較するためのものである
。出力手段は、コンピュータ読み取り可能な前記複数の音楽ファイルに含まれる
選択的部分と、前記検索基準と一致するリストを出力するためのものである。
【0015】 本発明に係るもう一つの態様では、音楽データベースについて索引を作成する
ための装置が提供される。
【0016】 この索引作成用装置は、 コンピュータ読み取り可能な複数の音楽ファイルの各部分のうち、節回しを含
む可能性のある部分を特定するため、選択基準を適用することにより、前記複数
の音楽ファイルに含まれる選択的関連部分を特定するための手段と、 前記複数の音楽ファイルの各部分のうち、前記選択的関連部分に一致する部分
を特定するため、前記複数の音楽ファイルにタッグ付け処理を施すための手段と
を 含む。
【0017】 本発明に係る更にもう一つの態様では、音楽データベースについて索引を作成
するための装置が提供される。
【0018】 この索引作成用装置は、 コンピュータ読み取り可能な複数の音楽ファイルの各部分のうち、節回しを含
む可能性のある部分を特定するため、選択基準を適用することにより、前記複数
の音楽ファイルに含まれる選択的関連部分を特定するための手段と、 前記複数の音楽ファイルについての索引であって、前記選択的関連部分の代表
情報を含んでいる索引を作成するための手段とを 含む。
【0019】 本発明に係る更にもう一つの態様では、音楽ファイルのデータベースを検索す
るための方法が提供される。この検索用方法では、一連の旋律的音程として節回
しを含んでいる検索基準を、入力として与える。更に、前記一連の旋律的音程を
、コンピュータ読み取り可能な複数の音楽ファイルに含まれる選択的部分と比較
する。更に、コンピュータ読み取り可能な前記複数の音楽ファイルに含まれる選
択的部分と、前記検索基準と一致するリストを、出力として与える。
【0020】 次に、添付図面を参照し、本発明の実施例について説明する。
【0021】 (発明を実施するための最良の形態) 図1を参照すると、コンピュータシステム1が示されている。このコンピュー
タシステム1は、本発明に係る音楽検索方法を実行するのに適している。好まし
くは、このコンピュータシステムは、通常のハードウエアとしてプロセッサー2
と、メモリー3と、モニター4と、キーボード5と、マイクロホン6とを含んで
いる。また、好ましくは、このコンピュータシステム1は、更に、MIDIコン
パチブル音楽キーボード7と、適当なリンク8とを含んでいる。リンク8は外部
のデータベース9につながる。
【0022】 更に図2を参照し、本発明の一実施例での検索処理を、図1に示されたコンピ
ュータシステム1の細部と関連付けて説明する。
【0023】 <ピッチの認識> 第1のステップ20では、対象となる節回しに関する検索基準を入力する。好
ましくは、利用者が歌唱、ハミングもしくは口笛で節回しを奏し、この節回しを
、マイクロホン6によりコンピュータに入力する。ステップ21において、この
オーディオ入力がオーディオファイルの作成に用いられる。ステップ22におい
て、プロセッサ2に備えられたピッチ認識部11が、オーディオファイルの分析
及びピッチの特定に用いられる。好ましくは、ピッチ認識部11は、節回しにお
いて連続する音符の持続期間を特定するのにも用いられる。
【0024】 好ましくは、ピッチ認識ステップ22では、パラメータ評価段階で明瞭な調和
モデルを用いる。歌唱もしくはハミングによる節回しが入力される場合は、音声
特性のBayesian決定法を利用する。息継ぎ及び人工音により生じる短時間の中断
は、除去される。これにより、連続した、もしくはほぼ連続した周波数−時間グ
ラフ35(図3a参照)が得られる。この周波数−時間グラフ35については、
後で詳しく述べる。また、チューニング及び/またはスラーの問題を評価するた
め、音符の離散化段階を設定することが望ましい。この離散化段階については後
で述べる。
【0025】 別の実施例において、節回しの入力は、ステップ21の代わりに、またはステ
ップ21及びステップ22の代わりに、多くの他の方法を利用して容易に実現さ
れることが理解されよう。例えば、MIDIキーボード7は、節回しを、MID
Iファイルに直接に入力するのに利用できる。また、通常のキーボード5または
マウスは、例えばC、E、F等の音符名を入力するのに利用できる。また、節回
しは、蓄積された音楽ファイル、例えばMIDIファイル等の一部分から、利用
者により選択されてもよい。また、節回しは、蓄積された音楽ファイルの一部分
から自動的に選択されてもよい。この自動選択技術は後述する。自動選択技術は
、多数の検索を実行する場合に有効である。また、多くの音楽ファイル間で比較
したい場合、自動選択技術では、多くの音楽ファイルの多くの部分を自動的に選
択してもよい。
【0026】 <旋律的音程の決定> 検索基準として用いられる節回しは、音符のピッチの一つながりにより構成さ
れる。音符のピッチの一つながりが、コンピュータに入力されると、次のステッ
プ(図2のステップ23)では、音符のピッチから、一連の旋律的音程を決定す
る。疑問決定処理部12は、旋律的音程発生部13を利用することにより、疑問
となっている一連の旋律的音程を特定する。
【0027】 旋律的音程は、音符と、その直前の音符との間でのピッチの音程として定まる
。旋律的音程は、節回しに含まれる最初の音符もしくは小節により定まるが、対
象となる直前の音符は、音符のすぐ後にくることが好ましい。但し、この機能は
、節回しが歌唱、ハミングもしくは口笛等によるオーディオ入力として入力され
る際、ピッチが急激にもしくは緩慢に変化するときには、あまり有効ではない。
【0028】 <オーディオ入力の量子化> 好ましくは、オーディオ入力された旋律的音程は、ピッチ誤りの低減のため、
量子化される。この量子化処理は、図形の線または点を、グリッドに適合させる
処理に似ている。(この量子化処理は、MIDI装置から不正確な入力が入力さ
れた場合、または、利用者が少し誤った音符を入力した場合にも有効である。)
最適な量子化は、好ましくは、音楽ファイル及び検索用の節回しのセットから統
計的に見い出される。本発明で用いられる他の量子化処理としては、次のような
量子化処理が挙げられる。
【0029】 熟練の音楽家がMIDIキーボード、もしくは高信頼度の入力装置を使用する
ことにより検索用の節回しが定められ、かつ、データベースの信頼性が高い場合
、途中段階(半音)の量子化を利用することが好ましい。
【0030】 また、データベースまたは検索用節回しが、例えば、未熟練な利用者による歌
唱もしくはハミング等によるもので、低信頼度である場合、最終段階(全音)、
短3度もしくは長3度の量子化を利用することが好ましい。
【0031】 また、全音階等の音階の量子化が、音楽ファイル及び/または検索用節回しか
ら高信頼度で特定または決定されている場合、音階の量子化を利用することがで
いる。
【0032】 <音符の離散化> 入力された節回しは、典型的には、スラーで連結された音符を含んでいる。ス
ラーで連結された音符は、周波数−時間グラフ上において、湾曲された線、もし
くは折り曲げた線によって示される。図3(a)を参照すると、周波数−時間グ
ラフ35が示されている。この周波数−時間グラフ35は、入力された節回しの
一部分を、典型的に示すものである。図3(a)において、ピッチ(もしくは周
波数)はy軸で示され、時間はx軸で示されている。これは、未処理のピッチ曲
線を示している。この未処理ピッチ曲線では、一つの音符の終点、及び次の音符
の始点が不明確であろう。スラーが特定されず、除去されていない状態で、周波
数がピッチに量子化された場合、偽の音階に幅広のスラーが付されることになる
。例えば、一連の音符C、C#、D、D#、Eには、音符Cから半音階ずつ音符
Eまで上がるスラーが付されることになる。
【0033】 入力された節回しは、これが特に歌唱、口笛もしくはハミングによりなされた
ものである場合、チューニング(tuninng)が不正確になるであろう。もし、チュ
ーニングが無視され、周波数が単純に最も近い絶対ピッチ(例えば、A=440
Hzに対して最も近い半音)に量子化されると、多くのピッチ誤りが生じよう(
例えば、入力された節回しの内部チューニングが、基準の440Hzチューニン
グから4分の1音外れ、少し変動する場合)。
【0034】 上述した2つの問題点は、図3、図4を参照し、次のように解決される。 1.未処理のピッチ曲線を示す周波数−時間グラフ35は、分割され(ステップ
41)、連続した音符、スラーもしくはジャンプに単純化される。この処理は次
のように行うことができる。グラフ35は、例えば約100msの時間を一単位
として、複数の時間領域35に分割される。時間領域35には、それぞれ、直線
状線片があてはめられる(ステップ42)。図3(b)を参照すると、これらの
直線状線片は、傾き具合により、水平/略水平状態(連続した音符「N」)、斜
め状態(スラー「S」)及び垂直/略垂直状態(ジャンプ「J」)に分類される
。急速なパッセージ等におけるスラーには、真の音符が含まれている場合がある
。真の音符は、音量のピークにより特定され、短時間持続する音符と、その音符
の片側に付されるスラーとに置き換えられる。隣り合う直線状線片がつながり、
かつ、同じ傾き具合である場合、これらの直線状線片は合体され(ステップ44
)、1つの直線状線片となる。この処理は、図3(c)の、離散化された周波数
−時間グラフ38に示されている。およそ水平な直線状線片は、図示のように、
正確な水平状態に修正される。
【0035】 2.次に、連続する音符を片側に延長することにより、スラーを除去してもよ
い。これにより、グラフ全体が、連続した音符と、それらの間のジャンプとによ
り構成されることになる。即ち、部分的に一定なグラフとなる。このようにして
、斜めの直線状線片は、水平となり、かつ、その値が、隣り合う水平な直線状線
片の値と等しくなるように修正される。より好ましくは、斜めの直線状線片は2
つの部分に分割され、それぞれの部分に対し、隣り合う水平な直線状線片の値と
等しい値が与えられる。
【0036】 3.連続した音符の、等調律された半音階を基準として平均チューニングを求
めることにより、内部チューニングが得られる(ステップ45)。
【0037】 4.この内部チューニングでは、周波数が、音楽的ピッチ(例えば、半音階、
全音程もしくは全音階等)に量子化される。この量子化処理は、グラフ38の水
平な直線状線片を、選択された最も近い「スナップ点」にあてはめることにより
行うことができる(図3(d)参照)。用いられる一組のスナップ点は、適当な
「はしご」39a、39bもしくは39cから選択される。これらのはしご39
a、39b、39cは、それぞれ、長音階、半音階、短音階に対応している。長
音階や短音階などの不均律なはしごを用いて量子化を行う場合、入力された節回
しの周波数を示すヒストグラムを生成し、このヒストグラムを、標準音階のヒス
トグラム、または、標準音階による多数例の節回しのヒストグラムと比較すると
、入力された節回しの音階が特定される。この比較処理は、例えば、正規化最小
二乗比較法を利用することにより実行できる。
【0038】 <リズム間隔の決定> 好ましい実施例では、検索基準として旋律的音程を用いるのみならず、ステッ
プ24において、リズム間隔発生部14を用いることにより、節回しの音符から
一連のリズム間隔を決定する。
【0039】 リズム間隔は、直前の音符の持続期間によって割り当てられた音符の持続期間
として定められる。従って、1つのリズム間隔が一対の音符を示し、一対の音符
のうち、二番目の音符の音長が一番目の音符の音長の2倍となる。音符のリズム
間隔は、節回しにおける最初の音符、または、節回しの一部分における最初の音
符を基準とすることができる。しかし、この基準は、節回しにおいてリズムが加
速もしくは減速するときには、あまり有効ではない。また、リズム間隔を定める
別の方法として、小節、節回しもしくはファイルに含まれる音符の平均音長によ
って割り当てられた音符の持続期間として、リズム間隔を定めてもよい。
【0040】 検索用の節回しが、歌唱もしくはMIDIキーボード等のように正確にリズム
を保持した状態で入力される場合、リズム間隔は最も有効に利用される。好まし
くは、リズム間隔は、第2番目の検索基準として用いられ、旋律的音程よりも、
検索における重みを軽くする。なぜならば、リズム間隔は、旋律的音程よりもは
るかに不正確となる傾向にあるからである。この理由としては、検索用の節回し
が近似的なリズムしか持たないこと、または、音楽を編曲する仕方によってリズ
ムがしばしば変化することが挙げられる。
【0041】 <リズム間隔の量子化> 好ましくは、リズム間隔は、幾つかの値域に、粗めに量子化される。これらの
値域は、リズム間隔(の値)がめったに値域の境界付近に入らないように統計的
に設定される。例えば、リズム間隔を、値域(0−1)、(1−2)、(2+)
に量子化すると、かなり不都合であろう。なぜならば、多くのリズム間隔は1に
近く、リズム間隔がほぼランダムに最初の2つの値域に割り当てられるからであ
る。
【0042】 <他の検索基準> 好ましい実施例では、ステップ25に示すように、他の検索基準が、旋律的音
程及びリズム間隔に加えて設定される。これにより、検索精度が更に向上する。
例えば、下記のような一般的書誌の検索基準またはテキスト情報の検索基準 (a)歌詞 (b)題名及び作曲者名 (c)アーチスト名 (d)ファイル名 (e)作曲日 が、検索される音楽ファイルにおいて見つかるか、伝送される場合、これらの検
索基準を疑問決定処理部に入力してもよい。検索基準について、利用者は、例え
ば、ポップ歌曲もしくはロック歌曲の歌集、またはクラッシク音楽の年代などの
ように、おおよその情報を知っていればよく、題名や作曲者名を知らなくてもよ
い。
【0043】 <比較処理> すべての検索基準が疑問決定処理部12に入力されると(ステップ26)、比
較処理部15が始動する。
【0044】 検索基準に含まれている関連特徴は、データベース9もしくは10に収納され
ているそれぞれの音楽ファイルの関連特徴と、比較される。以下述べるように音
楽ファイルの索引を利用してもよい。
【0045】 <セグメンテーション> 好ましくは、一連の旋律的音程及び/もしくはリズム間隔は、セグメンテーシ
ョンアルゴリズム16の利用により、比較処理(ステップ29)の間にセグメン
トに分割される(ステップ27)。それぞれのセグメントは、所定数の連続した
音符及び/もしくはリズム間隔、または、ピッチ−時間グラフ(例えば、図3(
a)〜図3(c))上の期間を含んでいる。好ましくは、これらのセグメントは
重なり合っている。例えば、第1のセグメントが第1〜第5の旋律的音程を含み
、第2のセグメントが第2〜第6の旋律的音程を含み、第3のセグメントが第3
〜第7の旋律的音程を含んでいる。セグメンテーションの主な目的は、ターゲッ
トのファイル等に含まれていない検索用節回しの余分な音符が存在しても、柔軟
に処理できるようにすることである。もし、このようなずれが、検索用節回しに
早い段階で生じたならば、1音符ごとに検索用節回しを、ターゲットのファイル
と比較しても、何れの音符もあまり一致しないであろう。
【0046】 ところで、検索用節回し及びターゲットのファイルが、幾つかの音符を含むセ
グメントに分割され、かつ、分割処理が、セグメント内の誤りによりその後のセ
グメントに影響を及ぼさないように行われると、省略もしくは追加された音符は
、1つのセグメントのスコアのみに影響を及ぼし、総体的な一致にはあまり影響
を及ぼさない。
【0047】 セグメントの長さは、幾つかの音符の、好ましくは3乃至7つの音符の長さに
設定される。もし、セグメントが短か過ぎると、節回しの区別ができなくなり、
同じセグメントを含んでいる異なる節回しによって偽の肯定が示されてしまう(
セグメントの順序によって高いスコアを与えないかぎりにおいて)。また、セグ
メントが長過ぎると、検索用節回しのセグメントに含まれる誤りによってスコア
が低くなってしまう(あまり類似しない一致より、類似する一致に高いスコアを
与えないかぎりにおいて)。
【0048】 セグメントの理想的な長さ、及びセグメンテーションのアルゴリズムは、音楽
ファイル及び検索用節回しの代表的なサンプルから、統計的に与えられる。
【0049】 好ましい実施例において、セグメンテーションのアルゴリズムは、次のような
手法の何れかを含んでいてもよい。
【0050】 1.節回しの内の局所的なコンテキスト(context)に基づいてセグメントの長
さを異ならせるセグメンテーション。例えば、セグメントの境界は、ピッチの極
大箇所もしくは極小箇所、またはリズム間隔によって与えられる。ここでは、セ
グメンテーションは、局所的なコンテキストのみに基づくことが重要である。そ
もないと、検索用節回しに含まれる音符誤りが多数のセグメントに影響を及ぼし
、スコアがかなり低減してしまう。アルゴリズムは、標準的タイプでない節回し
のときに、長過ぎるもしくは短過ぎるセグメントを生じさせないようにしなけれ
ばならない。
【0051】 2.複数のバー、またはバーの複数の群に分割するセグメンテーション。この
セグメンテーションは、複数のバー、またはバーの複数の群が、音楽ファイル及
び検索用節回しの両者において高信頼度で特定され、かつ、両者で同じとなる場
合に有効である。このような例としては、音楽ファイル及び検索用節回しの音楽
記載形式が同じである(楽譜記載ファイルのように)場合を挙げることができる
【0052】 3.重なり合い、かつ、所定長さのセグメントに分割するセグメンテーション
。セグメントの長さは、典型的には3乃至7つの音符の長さとする。例えば、一
連の音符(A B C D E)が、セグメント(A B C)、(B C D
)、(C D E)、(D E F)に分割される。このセグメンテーションは
、バーに分割するセグメンテーションと類似であるが、バー長さやバーライン位
置が特定される必要はない。この方法の欠点は、多数のセグメントが生じるので
、能率が比較的低くなることである。
【0053】 別の方法のセグメンテーションを用いて同じ効果を生じさせることはできるが
、能率が比較的低くなる。これには、次の(1)、(2)が要求されるであろう
【0054】 (1)一音符ごとに検索用節回しを音楽ファイルと比較し、この比較処理を、
音楽ファイル内部のすべての可能な開始ポイントから開始すること(節回しの開
始が、音楽ファイル内で高信頼度に検出されない場合)。
【0055】 (2)ステップごとに検索用節回し及び音楽ファイルに戻ろうとするため、音
符の一致が得られなくても、比較ポイントを、1つもしくは複数の音符だけ前に
もしくは後ろにずらすこと。
【0056】 セグメントの理想的な長さ、及びセグメンテーションの最善のアルゴリズムは
、検索される音楽のタイプに応じて変わる。一実施例では、疑問決定処理部によ
ってセグメンテーションのアルゴリズムを特定化する。このアルゴリズムの特定
化処理は、利用者により直接に実行されてもよい。また、アルゴリズムの特定化
処理は、好ましくは、利用者が、検索される音楽のタイプ、例えばロック、ジャ
ズ、カントリーやクラシックを指示することによって間接的に実行されてもよい
【0057】 ステップ28に示すように、比較処理では、データベース9、10から規則的
にファイルを取り出す。そして、好ましくは、検索基準節回しのセグメント及び
ファイルのセグメントに基づいて比較動作(ステップ29)を実行する。この比
較動作では、例えば、上述のテキストのような他の検索基準が併用されてもよい
【0058】 比較されたファイルには、それぞれ、スコアが付けられる(ステップ30)。
このスコアは、より優れた一致に対してより高くなる。スコアは、セグメント間
での一致の近接度とは区別される。また、正確な一致に対しては、単一の高いス
コア(例えば1)が付され、不正確な一致または不一致に対しては、単一の低い
スコア(例えば0)が付される。
【0059】 誤りをモデル化するのと、不正確な一致を評価するのに統計学を利用してもよ
い。例えば、三全音の音程は正確に歌うのは困難であるが、音楽ファイルに三全
音の音程が含まれ、含まれる三全音の音程が検索用節回しと一致しない場合、こ
の三全音の音程を、一致しない容易な音程よりも有利と評価してもよい。
【0060】 セグメントの順序が正確にもしくは近接して一致する(類似の音符グループを
有しても、順序が異なる旋律は除外される)場合に、より高いスコアを与えても
よい。
【0061】 また、検索用節回しが、音楽ファイル内における選択的関連部分の開始ポイン
ト(またはその付近)から開始する場合に、より高いスコアを与えてもよい。こ
れは、検索される節回しが、検索されるファイル内における旋律の途中部分もし
くは終了部分よりも、むしろ開始部分であることが多いからである。
【0062】 音楽ファイルの個々の特徴に対するスコアは、加算処理または他の処理により
組み合わされる。
【0063】 <マルチパス式比較処理> 大きなデータベースを検索する際の速度を増大させるため、粗い比較処理を1
つもしくは複数実行してもよい。この比較処理では、信頼し得る幾つかの特徴が
比較され、これにより、音楽ファイルの大多数が除外される。この比較処理の後
、より詳しい比較処理として、すべての特徴が比較され、除外されなかった音楽
ファイルのそれぞれについて、信頼度の高いスコアが得られる。
【0064】 <音楽ファイル前処理> 音楽ファイルのさまざまなタイプを容易に検索できるようにするため、検索さ
れる音楽ファイルの前処理を実行してもよい。または、検索される音楽ファイル
の前処理を実行して、一致処理の速度を増大させてもよい。
【0065】 音楽ファイルが、オーディオに基づいているファイル、すなわち、記録された
音の情報を含んでいるファイルである場合、ピッチ認識部は、既述した疑問決定
部の動作と同様にして、音楽ファイルに含まれている旋律の音符を、最初に決定
するのに用いられてもよい。
【0066】 <トラック/チャンネル選択> 音楽ファイルは、典型的には、旋律を含むだけでなく、伴奏として同時に奏さ
れる他の音符をも含んでいる。旋律は、典型的には節回しから構成され、典型的
には2回またはそれ以上繰り返される。そして、しばしば、旋律は、節回しでは
ない他の音楽、例えばイントロダクションもしくはコーダ等の前に、かつ/また
は後にくる。
【0067】 検索される音楽の量を低減するため、好ましくは、音楽ファイルの各部分のう
ち、検索でターゲットとされる節回しを含んでいる可能性のより高い部分を選択
する。これによって、節回しを含んでいる可能性のある旋律ではない他の楽器及
び音が除外される。
【0068】 音楽ファイルの或る形式、例えばMIDIファイル、シーケンサファイルもし
くは楽譜ファイル等では、ファイルは、典型的には、トラック、チャンネルもし
くはステイブと呼ばれる別個のピッチストリームに分割される。1つのトラック
、チャンネルもしくはステイブは、典型的には、1つの楽器での音楽を含んでい
る。旋律は、典型的には、ファイルの始めから終わりまで同じトラック、チャン
ネルもしくはステイブ上に記録されているか、または、ファイル内部でトラック
、チャンネルもしくはステイブを、まれに変更するだけである。
【0069】 音楽ファイルの他の形式、例えばWAVファイルでは、ファイルは、典型的に
はそんなに分割されない。しかし、アルゴリズムを用いてピッチストリームを分
離することができる。これらのピッチストリームは、たいてい、個々の楽器に対
応している。ストリーム分離処理が行われると、節回しを含んでいる可能性のあ
るストリームが、トラック、チャンネルもしくはステイブのときと同様な方法に
よって特定される。
【0070】 オーディオファイルでは、このストリーム分離処理は、さまざまな方法で達成
される。例えば、オーディオファイルがステレオ形式の場合、旋律となる歌声も
しくは楽器音は、たいてい(特にロック/ポップ音楽では)、2つのオーディオ
チャンネルの中央に設定されている。これに対し、伴奏となる楽器音は、ある程
度左もしくは右にオフセットされている。このように、旋律となる歌声もしくは
楽器音は、両方のチャンネルに等しく寄与する唯一のものなので、伴奏から分離
することができる。これは、中間周波数の位相を反転させるフィルターで左チャ
ンネルをろ波することにより達成される。そして、右チャンネルからも引く。こ
の結果、チャンネルの中央に設定された中間周波数、すなわち、旋律の歌声もし
くは楽器音が強調され、中央に設定されていない他の周波数や音は低減される。
【0071】 これとは択一的に、もしくは追加的に、入力された節回しのピッチ認識に関し
て説明した方法を利用することによって、同時に奏される複数の音符が、個々の
歌声もしくは楽器音により生成されたオーディオファイルにおいて、何れのポイ
ントでも分離され得る。連続した音符であって、類似の音色及び/もしくはピッ
チを有するもの、並びに/または、スムーズな移行により接続されるものは、同
じ楽器による連続的なピッチストリームとみなすことができる。以下、これらを
「ストリーム」と称することにする。
【0072】 次のような判断基準を利用することによって、旋律を含んでいるトラック、チ
ャンネル、楽譜もしくはストリームが特定され、または、異なるトラック、チャ
ンネルもしくはステイブに移った旋律が追跡される。
【0073】 (a)1つのトラック/チャンネル/楽譜/ストリームが歌詞を有している場
合、歌詞は旋律である可能性が非常に高い。 (b)タイプ1のMIDIファイルの場合、旋律は通常、トラック1に記録され
ている。楽譜ファイルの場合、旋律は通常、最上段の楽譜に記録されている。 (c)MIDIファイルの場合、旋律は、しばしばチャンネル1に記録されてい
る。チャンネル1でないときはチャンネル2である。 (d)MIDIファイルの場合、旋律がチャンネル10(ピッチ未調整の衝撃音
(percussion))に記録されている可能性は非常に低い。 (e)旋律は、ふつう、大部分の時間で最も高いピッチとなっており、特に、そ
の最高ピッチが、音楽の長い期間中、同じチャンネル、トラックもしくは楽譜上
で継続している場合には、その通りとなる。
【0074】 (f)旋律が1オクターブ以上の旋律的音程を複数有している可能性は、非常
に低い。 (g)トラック、チャンネル、楽譜もしくはストリームがほとんど完全な全音程
とはなっていない場合、それはたぶん旋律ではないであろう。 (h)旋律を含んでいるトラック、チャンネルもしくは楽譜は、たぶん、和音よ
りむしろ単一の音符で構成されているであろう。 (i)旋律は、その平均音符長が、一例として0.15秒〜0.8秒となってい
るであろう(旋律が極端に速くもしくは遅くない場合)。 (j)旋律に含まれる音符のうち、最も高い音符は、たぶん、中央のCより高い
Bであるか、または、そのBよりも高いであろう。最も低い音符は、たぶん、中
央のCよりも高い9度のDであるか、そのDよりも低いであろう。
【0075】 (k)トラック名、楽譜名、または最初のテキスト項目が、「lead」、「melody」
、「vox」や「vocals」等を含んでいる場合、それは旋律である可能性が非常に高い
。 (l)トラック名または楽譜名が「bass」を含んでいる場合、それはたぶん、旋律
でないであろう。 (m)トラック/チャンネル/楽譜/ストリームの大部分もしくは全体に使われ
ている音符が変である場合、それはたぶん、旋律でないであろう(例えばMID
Iファイルでは、最初のプログラム変更が、全般的なMIDIピジッカート(piz
zicato)、ガンショット(gunshot)、ティンパニ(timpani)、バスギター(bass gui
tar)となっている場合、それはたぶん、旋律でない)。 (n)チャンネル、トラックもしくは楽譜が、ファイルの演奏時間中、所定パー
セント以下の時間しか演奏されていない場合、それはたぶん、旋律でないであろ
う。好ましい実施例では、その所定パーセントはおよそ70%である。
【0076】 (o)旋律は、そのたびごとに数秒間ほぼ継続するであろう(旋律は、ときお
りの孤立音符で中断される休止符を含むことはほとんどない)。 (p)旋律は、他の楽器音の何れと比較しても、少なくとも同じ音量を有してる
だろう(但し、ピッチ未調整の衝撃音を除く)。 (q)旋律には、何回も正確に繰り返され、かつ、短い旋律的もしくはリズム的
な部分は含まれていないであろう(これらは伴奏に生じる)。
【0077】 従って、好ましい実施例では、より高級なアルゴリズムを利用することによっ
て、想定される節回しを含むことのある音楽ファイルの関連部分を、まず特定す
ることができる。このアルゴリズムは、比較ステップ29の実行の前に実行され
る。好ましくは、ステップ32において、上述の項目(a)〜(q)に例示され
た1組の選択基準を利用することによって、検索されている音楽ファイルの選択
的関連部分を特定する。特定される関連部分は、検索用節回しを含む可能性のあ
る旋律である。
【0078】 これらの選択基準に割り当てられる相対的なスコアもしくは重みは、検索され
る音楽ファイルを代表するような音楽ファイルの大集合から、経験的に(例えば
Bayesian統計法によって)決定される。上述した基準のうち、個々の基準の信頼
性が高くなくても、大部分もしくは全ての基準を組み合わせたスコアの信頼性は
高くなる。利用される最も能率的な選択基準は、分析される音楽ファイルのタイ
プに応じて変わり得る。従って、セグメンテーション過程に関して説明したよう
に、選択基準が、検索されるファイルもしくはデータベースに収納されている音
楽のタイプに応じて利用者により選択されてもよい。適用される選択基準は、自
動的に選択されてもよい。特に、音楽タイプの分類が利用できるか、または、フ
ァイルの記録にある場合は、そうである。
【0079】 ファイルの何れの部分も、他よりも高くない場合、ファイルに含まれる幾つか
の旋律を、ファイルの選択的関連部分として特定し、かつ、検索しなければなら
ない。
【0080】 ファイルに含まれる幾つかの旋律が特定されると、見込み点または他の重みが
蓄積される。これらの見込み点または他の重みは、それぞれの旋律がどの程度、
実際の検索用節回しになるかを指し示す上述の基準に基づく。蓄積された見込み
点または他の重みは、検索用節回しに対する一致の度合いを評価するとき、利用
される。基準の評価には、一致した旋律の人気度を指し示す重み付け要因が含ま
れていてもよい。例えば、旋律が最近のポップ歌曲の場合、その旋律に与えられ
る一致の見込み点が、無名の作曲家による旋律のそれよりも高く設定され得る。
人気度は、データベース上のヒット件数、例えば、ファイルのアクセス回数もし
くは検索一致回数などに基づいて決定される。
【0081】 更に、それぞれの旋律(選択的関連部分)が始まるポイントを特定することが
好ましい。これにより、旋律を、検索用節回しに最も一致させることができる。
音楽ファイルの各部分から、検索用節回しを含む可能性のある旋律の開始部に対
応する部分を選択するための基準は、次の通りである。 (1)歌詞がある場合、歌詞の開始部は、節回しの開始部である可能性が非常に
高い。 (2)適当な長さのパッセージであって、後で繰り返されるパッセージのうち、
最初のパッセージ(すなわち、2つもしくはそれ以上のヴァースのうち、最初の
ヴァース)が始まる部分は、たぶん、節回しであろう。 (3)これらでない場合、チャンネル、トラック、楽譜もしくはストリームに記
載された音楽であって、旋律を含んでいる音楽が始まる部分は、節回しの開始部
である可能性がかなり高い。
【0082】 理解されるように、上述の選択基準は検索処理の進行と同時に利用され、これ
により、検索基準と比較される音楽ファイルの、選択的関連部分が特定される。
より好ましくは、選択基準は、検索処理の前に、データベースファイル上で利用
される。検索処理の進行と同時に選択基準を利用するか、または、検索処理の前
に独立的に選択基準を利用するかを選択してもよい。
【0083】 例えば、類似した2つの節回しを求めてデータベースを検索したい場合、選択
基準によって特定された選択的関連部分を、検索基準用の節回しとして利用する
こともできる。それは、著作権侵害となり得る場合を探すときに役立つであろう
【0084】 <索引作成> 好ましい実施例では、データベースの音楽ファイルは、検索処理の実行の前に
、索引作成/タッグ付け処理部17が上述の選択基準(a)〜(q)、(1)〜
(3)に従い、選択的関連部分を特定することによって、処理される。この情報
は、ファイルの索引、または1組のタッグとして提供される。これらファイル索
引または1組のタッグによって、ファイルの各部分のうち、選択的関連部分に対
応する部分が特定される。例えば、索引情報は、それぞれの音楽ファイルから分
離して、もしくは関連して蓄積される。または、索引情報は、それぞれの音楽フ
ァイルのヘッダー情報として蓄積される。
【0085】 このようなファイルの索引作成処理もしくはタッグ付け処理は、非常に大きな
データベースの場合、特に重要であり、データベース上の検索スピードを増大さ
せることができる。
【0086】 索引作成処理では、音楽ファイルから、非関連的な特徴(すなわち、はっきり
とは旋律といえない部分)を捨てる。これにより、検索対象となるデータの量が
低減される。従って、ファイルの索引項目は、もとのファイルをかなり短縮した
形態となる。
【0087】 索引作成の第1の段階では、旋律(すなわち、候補の節回しなど)を特定し、
はっきりとは旋律といえない音楽(例えば、伴奏もしくは前奏など)をすべて除
去する。
【0088】 第2の段階では、旋律を、音符の短いグループに分割する(セグメンテーショ
ン)。
【0089】 第3の段階では、旋律から、旋律的音程のような関連特徴を抽出する。旋律の
他の特徴について、索引が作成され、これにより、一致処理が支援される。例え
ば、これらの追加的な特徴は、次のようなものを含んでいてもよい。 (a)歌詞(例えばMIDIファイルの場合)、特に節回しの開始部にある歌詞 (b)題名及び作曲者名(例えばMIDIファイルの場合) (c)アーチスト名 (d)ファイル名(このファイル名は、しばしば、音楽の題名を短縮したもので
ある。例えば「Yellow Submarine」の場合、「YELLOW」
となる。) (e)作曲日 索引作成処理は、自動的に実行されることが好ましいが、応用として、部分的
に手動で実行されてもよい。例えば、消費者が店内でCDを見つけ出せるように
するため、CDから音楽クリップのデータベースを作成する場合、人間が、それ
ぞれのCDに対応した音楽ファイルを作成することが望ましい。この音楽ファイ
ルは、CD中、最も重要なトラックの旋律について、最初の数小節を含んでいる
。これらの音楽ファイルはデータベースを構成し、このデータベースが検索の対
象となる。
【0090】 もう一つの方法として、ファイルにタッグを付ける処理では、ファイルの内部
で関連特徴にマークを付けてもよい。例えば、MIDIファイルの内部で旋律の
開始部にタッグを付ける。タッグ付け処理では、時間記号、及び縦線の位置を記
載してもよく、これにより、比較処理中のセグメンテーションが支援される。
【0091】 索引ファイルはいかなる適当な形式もとり得る。索引が適当なテキスト形式の
場合、一致処理は、通常のテキスト検索エンジンにより実行することができる。
但し、検索基準が同様に符号化されることを条件とする。
【0092】 記録された音楽ファイルが検索される場合、音楽ファイルの選択的関連部分を
特定する処理、並びに、検索処理、索引作成処理もしくはタッグ付け処理の何れ
かは、量子化処理の前に実行され得る。この量子化処理は、検索基準として用い
られる節回しの決定に関連して上述した通りである。
【0093】 単一のウェブページもしくはテキストファイルは、音楽ファイル用の索引項目
として生成される。旋律的音程及びリズム間隔は、文字として符号化され、スペ
ースにより分離された「ワード」に分割される。「ワード」はセグメントを代表
する。インターネットによる幅広い検索の場合、「ワード」のような符号化が、
通常のテキストで生成されず、かつ、通常のテキストページで偽の一致を生じな
いように設定することが好ましい。例えば、vowelは符号化から除外すべき
である。
【0094】 セグメントの順序が誤っているときよりも正しいときに高いスコアを与える場
合、このスコア処理は、テキストフレーズ検索または「nearness」検索
によって代行することができる(テキストフレーズ検索では、ワードが特定の順
序で構成されていなければならない)。歌詞、題名もしくはアーチスト名などは
通常のテキストとして含まれていてもよい。
【0095】 <比較処理> 比較処理の正確さを改善するため、多数の他の処理方法が含まれていてもよい
【0096】 繰り返される音符もしくは連結される音符:検索用節回しと、ターゲットの音
楽ファイルとは相違してもよい。なぜならば、編曲もしくは歌詞では、音符が連
結されたり、繰り返されたりするからである。繰り返されている音符をオーディ
オで検出するのは困難である。特に、そり舌の子音が1つもない場合は、そうで
ある。繰り返される音符と、連結される音符との違いは、繰り返される音符のす
べてを、連結されたものとして処理することにより、除去される。
【0097】 和音:節回しを含んでいるトラック、チャンネルもしくは楽譜には、和音は、
1つももしくはほとんど含まれていないだろうが、存在している和音は、その和
音の最高音に置き換えられる。
【0098】 節回し中の休止:節回し中の休止は、編曲によって変更され得る(例えば、ス
タッカートもしくはレガートのため)。休止を除去するには、休止の後にくる音
符を、次の音符の開始時に終了するものと処理すればよい(次の音符が例えば、
1秒以内に始まるなら)。
【0099】 ピッチのベンド(例えば、MIDIファイルの場合):ピッチのベンドは無視
できるが、ピッチのベンドは、典型的には、上述した旋律的音程の量子化により
除去される。
【0100】 オーディオのオクターブ誤り:オーディオデータ上でピッチ認識を実行すると
き、オクターブを特定することが困難であるため、音符が、1もしくは1以上の
オクターブ外れてみなされてしまう場合がある。このオクターブ外れは、全ての
音符を、1つのオクターブ範囲に置き換えることにより、解消される。
【0101】 <検索結果の出力> コンピュータシステム1は、多数の方法で検索結果を出力し得る。好ましくは
、ステップ30において、それぞれの音楽ファイルにスコアが与えられる。音楽
ファイルに与えられるスコアは、そのファイルの選択的関連部分について、検索
基準による一致の近接度に基づく。そして、最も高いスコアとなったファイルの
ランク付けリストが、データベースからのファイル情報(例えば、題名、アーチ
スト名など)とともに、利用者に提供される(ステップ33)。タッグ付け処理
及び/もしくは索引作成処理について、ファイル情報は、音楽ファイルの小さな
クリップを含んでいるか、または、そのクリップにリンクされている構成も容易
にとり得る。これにより、利用者は、そこにある旋律が、疑問検索の節回しに一
致するか否かを容易に確かめることが可能となる。
【0102】 本発明には、次のような多数の変形例が存在する。 (a)インターネット上で音楽ファイルを見つけ出すこと。 (b)音楽店及びインターネットのサイトでCDを見つけ出すこと。 (c)権利収集会社、宣伝会社、映画/テレビ会社などで用いられるデータベー
ス上で音楽を見つけ出すこと。 (d)データベースの内部において音楽ファイルを互いに比較し、これにより、
複製、異なる編曲例または著作権侵害を見つけ出すこと。
【0103】 次に、3つの基本的な変形例を説明する。 1.MIDIファイルに対するインターネット検索エンジンにおいて、コンピュ
ータが、ウェブクローラーの利用により、全てのMIDIファイルについて索引
を作成する。利用者は、マウスを使って、スクリーン上の音楽キーボードで検索
用節回しを演奏する。コンピュータは、検索を実行する前に、もう一度、検索用
節回しを演奏し、これにより、検索用節回しが利用者の望む通りに入力されてい
ることを確認する。利用者は、節回しから、歌詞に含まれる幾つかの単語を打ち
込んで、「検索」ボタンをクリックする。コンピュータは、検索基準とその索引
との間で粗い比較処理を実行し、これにより、検索用節回しを含んでいるかもし
れない約500つのファイルを特定する。更に、コンピュータは、より細かい比
較処理を実行し、これらのファイルにスコアを与える。コンピュータは、最もス
コアの高い20つのファイルのリストを、ファイル名で作成する。利用者は、こ
れらのファイル名の何れかをクリックして、MIDIファイルを聴くことができ
る。これにより、利用者は、そのMIDIファイルが、対象の節回しを含んでい
るか否かを確かめることができる。コンピュータは、それぞれのファイルについ
て、旋律、または候補の節回しが始まるポイントから演奏する。このポイントは
、索引もしくはタグにより示される。利用者は、リンクをクリックすると、ター
ゲットのMIDIファイルを含んでいるウェブページにジャンプする。これによ
り、そのMIDIファイルをダウンロードすることができる。
【0104】 2.音楽店に備えられるCD検索装置において、音楽店のベストセラーとなっ
ているCDのそれぞれについて、MIDIファイルが生成される。このMIDI
ファイルは、CDに含まれるそれぞれの節回しについて、最初の数小節を含むよ
うに生成される。そして、CDのトラックが、セパレートMP3ファイルに変換
される。消費者は、店内のキオスクで検索用節回しを歌って、マイクロフォンに
吹き込む。このオーディオデータが、キオスクのコンピュータにより、音符のピ
ッチと、音符の連続とのストリームに変換される。このストリームは、コンピュ
ータにより、MIDIファイルの索引付きデータベースと比較される。そして、
コンピュータは、最もスコアの高いファイルについて、そのファイルに当てはま
るCDの題名、アーチスト名、価格及び販売場所のリストを作成する。更に、コ
ンピュータは、セパレートMP3ファイルから、当てはまるトラックの音楽を演
奏し始める。消費者がボタンを押すと、次にスコアの高いファイルに移る。
【0105】 3.CDチェインジャーにおいて、マガジンに挿入された新しいCDのそれぞ
れが、システムによってスキャンされ、これにより、CDチェインジャー内のC
Dに含まれる節回しの索引ファイルが作成される。上述したように、これらの索
引ファイルは、テキスト形式をとってもよいし、または検索の容易な他の形式を
とってもよい。そして、利用者は、CDのトラックにアクセスし、好きなトラッ
クの節回しをハミングし、もしくは歌う。このシステムは索引ファイルを検索す
る。更に、このシステムは、CDチェインジャーに対し、適切なCDをロードし
て演奏し、正しいトラックに位置を合わせるように指令する。
【0106】 <最初パス式検索アルゴリズム> 上述したように、マルチパス式比較処理を実行することにより、大きなデータ
ベース上の検索速度を増大させることが好ましい。1つの実施例では、データベ
ース全体について最初パス式検索を実行し、これにより、入力節回しを含んでい
そうもないファイルを幾つか捨てるか、または、入力節回しを含んでいる可能性
の高いファイルを順位付けする。まず、高く順位付けされたファイルを、連続し
たパスで検索する。この目的は、次の何れかである。 (1)利用者に優れた一致を、劣った一致よりも早く提供するため。 (2)時間が制限値に達した場合、または、高く順位付けされたファイルのうち
、1つもしくは複数のファイルがよく一致するとわかり、これ以上検索する必要
がないとされた場合、連続したパスが早く終了するため。 最初パス式検索に関する、より詳細な説明を、次に行う。
【0107】 最初パス式検索では、典型的には、データベースの全体を検索する。このため
、一致基準を用いて、ファイルを捨てるか、もしくは順位付けすることが好まし
い。用いられる一致基準は、「ファイル前処理」で説明したように、速く及び/
もしくは適切に、索引に蓄積されるようなものである。連続したパスでは、より
少数のファイルを検索して、遅いが、より高信頼度の一致アルゴリズムを利用し
てもよい。
【0108】 一致基準は、同じファイルの異なる部分、または、一つの節回しの異なる編曲
から取り出された入力節回しによって影響されないように設定される。このよう
に、一致基準は、ファイルを通して、かつ、同じ節回しの異なる型に対して、お
よそ一貫しているべきである。また、一致基準を用いて典型的データベースをフ
ァイルの複数組に実質的に分割できるように、一致基準は特徴的であるべきであ
る。
【0109】 最初のパス、または連続したパスのための適切な検索基準は、次のものを含ん
でいる。 (1)発生、及び、セグメントの頻度 この試験では、音楽を、重なり合っている、もしくは重なり合っていないセグ
メントの一つながりとして評価する(「セグメンテーション」で説明したように
)。そして、異なるタイプのセグメントが生じる相対的頻度を評価する。例えば
、旋律的音程発生部13からの、離散化及び量子化された出力において、100
つの音符による旋律音符の一つながりについて考えることにする。セグメントの
長さを5音符とし、セグメントの重なり合いを4音符とすると、100つの音符
の一つながりは、95つのセグメントに処理されることになる。これら95つの
セグメントの多くは、音符の同じ連なり、すなわち、1つのタイプのセグメント
が再び現れることになる。
【0110】 30の異なるセグメントタイプ(すなわち、5音符の旋律的音程について、3
0の異なる組み合わせ)があると仮定すると、それぞれのセグメントタイプの出
現がログされ、これにより、検索用節回しと、候補の節回しとに含まれるセグメ
ントタイプのそれぞれの頻度を示すヒストグラムが得られる。得られた2つのヒ
ストグラム51、52を、図5(a)、図5(b)に示す。検索用節回し、また
は候補の節回しに含まれるセグメントが、これらのヒストグラムに示されている
。それぞれのセグメントタイプは垂直棒で表され、節回し内におけるそのセグメ
ントタイプの発生数が、垂直棒の高さで表されている。2つのヒストグラムは、
輪郭がおよそ類似しており、各種セグメントタイプの相対頻度が類似している。
ヒストグラムの類似性は、定量的に定めることができる。このためには、対応す
る2つの棒についてそれらの高さを掛け合せ、更に、得られた積を足し合わせて
類似度を得ればよい。それぞれのセグメントタイプがベクトルの次元を表し、か
つ、棒の高さがその次元の値を表すとき、上述の類似度は、それぞれのヒストグ
ラムを表すベクトルの点乗積となる。
【0111】 言い換えれば、それぞれのセグメントタイプ(例えば、音符の連なり)は次元
として扱われ、入力されたそれぞれの節回しに、ベクトルが割り当てられる。こ
のベクトルにおけるそれぞれの次元の値は、一致するセグメントタイプが節回し
内で発生する回数となっている。そして、ベクトルは規格化される。規格化は、
それぞれの次元の値を自乗し、これらを足し合わせたとき、その総和が1となる
ように行う。2つの節回しの類似度(0と1との間)は、それらのベクトルの点
乗積で与えられる。候補のファイル内で並みはずれて頻繁に現れるセグメントタ
イプは、その節回しの一部分よりもむしろ、伴奏のモチーフであろう。このため
、スコアを付けるとき、伴奏のモチーフによる影響を低減することが望ましい。
【0112】 (2)音楽においてそれぞれの旋律的音程が現れる相対的な頻度 候補のファイル内において並みはずれて頻繁に現れる旋律的音程は、その節回
に現れるよりもむしろ、伴奏のモチーフであろう。このため、スコアを付けると
き、伴奏のモチーフによる影響を低減することが望ましい。これは、上記(1)
においてセグメントのサイズをちょうど2音符としたときの状況に、およそ一致
する。
【0113】 (3)音楽の調 調査結果に示されているように、人々が歌唱、ハミングもしくは口笛するとき
の音楽は、しばしば、記録されたもとの音楽と同じ調、または非常に近い調とな
ることが知られている。入力された節回し、もしくは候補のファイルに含まれる
ピッチの階級のヒストグラムを生成し、このヒストグラムを、標準音階のヒスト
グラム、または関連する音楽例のデータと比較する(例えば、正規化最小二乗法
を用いて比較する)。これにより、入力された節回しの調、及び候補のファイル
の調が、高信頼度で推定される。調は、あいまいなものであり、ファイル中で変
化し得るものであるため、その音楽が1つもしくはそれ以上の特定の調に在る可
能性を示す尺度を、用いてもよい。
【0114】 (4)音楽の音階(例えば、長音階もしくは短音階など)。音階は、調と同様
な方法で決定される。
【0115】 (5)音楽のテンポ。テンポは2番目の平均音符長により測定される。そして
、テンポは「速い」、「中庸」及び「遅い」に区分される。
【0116】 (6)節回しにおけるピッチの変化。例えば、すぐ繰り返される音符の百分率
、または、旋律的音程の絶対平均値が用いられる。
【0117】 基準は、個別に、または組み合わせて用いられる。例えば、データベース内の
50%のファイルが、入力された節回しのセグメントを含んでいないとして、除
外され得る。残されたファイルのうち、50%のファイルが誤った音階であると
して除外され得る。そして、ちょうど25%のファイルに対して、連続したパス
によるより細かな検索を行う。
【0118】 高信頼度の基準、例えば、候補のファイルが、入力された節回しのセグメント
を含んでいるか否かのような基準は、連続したパスから不一致のファイルをまと
めて捨てるのに適している。それよりも信頼度の低い基準、例えば、テンポなど
の基準は、不一致のファイルを捨てるに充分な信頼度を持っていないが、2番目
のパス、及び連続したパスで順位付けを行うには適しており、これにより、優れ
た一致を、より早く見つけ出すことができる。
【0119】 <図的比較技術> セグメンテーションのステップ(図2のステップ27)、並びに、分割された
検索基準と、音楽ファイルの選択部分との比較(図2のステップ29)を用いた
比較技術は、既に説明した。ここでの比較技術は、比較処理を実行するためのか
なり能率的な方法を表す。もう一つの、図的節回し比較処理は、適切に近代化さ
れた比較処理部15(図1)により実行される。比較処理部15はプロセッサー
2に備えられている。図的節回し比較処理において、候補の節回しは音楽ファイ
ルの選択的関連部分であることが好ましい。図的比較処理は、検索用節回し及び
/もしくは候補の節回しについてピッチ及び/もしくはリズムの量子化、並びに
/または音符の離散化(図2のステップ23、24、図3、図4を参照)が行わ
れた後に、実行されるのが好ましい。リズムが無視された場合、この比較処理の
目的として、全ての音符に同一の持続時間が与えられ得る。
【0120】 検索用節回しは、概念上、図6(a)に示すように、時間に対するピッチのグ
ラフ61としてプロットされる。候補の節回しのそれぞれも、概念上、図6(b
)のグラフ62として同様にプロットされる。検索用節回しのグラフ61と、候
補の節回しのグラフ62とは、次のように比較される。
【0121】 (1)異なる仕方で歌われ、もしくは編曲されるときに生じる変形例に、グラ
フ61、62を適合させるため、様々な変換処理(後で例示する)がグラフ61
、62に施される。典型的には、検索用節回し61が変換され、候補の節回し6
2は変換されないままである。なぜならば、検索用節回しは、不正確なピッチも
しくはリズムを含んでいる可能性が、候補の節回しよりも高いからである。
【0122】 (2)変換された一対のグラフ61、62のそれぞれについて、グラフは、図
6(c)の線61a、61bに示すように重ね合わされる。グラフの一致度(例
えばグラフ間の領域)、及び/もしくは、グラフに施した変換の一致度を示すス
コアが算出される。このスコアは、ある範囲の値をとるか、または、離散化され
た2つの値(「一致」の応答もしくは「不一致」の応答を示す)をとる。
【0123】 (3)さまざまな変換が、検索用節回しと単一の候補節回しとに試行されたと
き、候補の節回しに対する総合的スコアが、変換されたグラフ対の全てのうち最
高のスコアから算出され、または、よく一致するグラフ対のスコアを組み合わせ
ることにより算出される。
【0124】 (4)全ての音楽ファイルからの候補節回しがこのようにスコア付けされたと
き、最も高くスコア付けされた候補節回しが、最もよく検索用節回しに一致して
いるとして扱われる。
【0125】 上述のステップ(1)のような、グラフに対する変換の好ましい例は、次のよ
うなもの、またはそれらの組み合わせを含んでいる。 (1a)特定(変換せず)。 (1b)ピッチの変換(入力された節回しの調と、候補節回しの調とが異なる場
合)。ピッチ変換は、ピッチvs時間のグラフ61のレベルを変えることにより
達成される。 (1c)時間の変換(検索用節回しが候補節回し中の一部分に現れる場合、例え
ば、候補節回しが導入部を含んでいる場合)。 (1d)時間の基準化(入力された節回しのテンポと、候補節回しのテンポとが
異なる場合)。時間基準化は、「引き伸ばし」により、または、図6(a)に示
されたグラフのX軸を縮めることにより実行される。 (1e)相違時間基準化、または、グラフの相違部分に対する変換(典型的には
、検索用節回しのテンポが乱れている場合、または、検索用節回しがリズム誤り
を含んでいる場合)。これは、上述した項目(1b)、(1d)の組み合わせに
より実行される。 (1f)グラフの相違部分に対する相違ピッチ変換(典型的には、音符が誤って
いる場合、または、入力をチューニングする場合)。これは、上述の項目(1b
)のような変換を、グラフの一部分のみに施すことにより実行される。 (1g)グラフから線分を除去することによる変換(音符が欠落している場合、
典型的には節回しの誤りまたは異なる編曲法に起因する)。
【0126】 セグメンテーションでは、旋律の索引が作成され、かつ、グラフから線分を除
去するなどの変換の実行が不要なので、セグメンテーションは、図的比較処理よ
りも高能率な方法である。
【0127】 図7を参照して、基本的な図的一致処理を説明する。この図的一致処理では、
「音符の離散化」で説明した、部分的に一定なグラフが、図6(a)、図6(b
)に示すように用いられる(ステップ701)。入力された節回しは、それぞれ
の候補節回しについて、あり得る全てのn音符の連なりと比較される。この比較
処理を行うため、nが、入力された節回しに含まれる音符の個数iについて変化
する。これにより、入力された節回しがミスまたは余分な音符を含んでいる可能
性も許容される。最初に、nの値がni(niは典型的にはiに等しい)にセット
され、n増加ループの制御パラメータは「真」にセットされる(ステップ702
)。nには、最大値及び最小値が設定される。これら最大値及び最小値は、典型
的には、入力された節回しに含まれる音符の個数に関係して定められる(ステッ
プ706、709を参照)。例えば、最大値、最小値が2i、(1/2)iであ
る。音符連なりのそれぞれについて、ピッチは、その音符連なりにおける平均ピ
ッチに規格化され(ステップ703)、音符連なりは、持続時間が同じとなるよ
うに時間的に引き伸ばされる(ステップ704)。そして、音符連なりは図6(
c)に示すように重ね合わされ、一致の近接度に基づいたスコアが付される(ス
テップ705)。重ね合わされたグラフにおいて、グラフ間の領域は複数の矩形
63〜68を含んでいる。生じたそれぞれの矩形(音符連なりの間の差を表す)
について、誤りスコアdt.d 2 pitchが算出される。ここで、dtは矩形
の幅であり、dpitchは矩形の高さである。これらの誤りスコアを足し合わすと
、候補節回しの誤り合計スコアが得られる。
【0128】 nがまだ、最大値に達していない場合、n増加ループの制御パラメータはまだ
、「真」であり(ステップ706)、nの値は増加させられる(ステップ707
)。このサイクルは、nが最大値に達するまで(ステップ706)、繰り返され
る。この後、増加ループの制御パラメータを「偽」にセットし、かつ、nを最初
の値niにリセットする(ステップ708)。そして、nを減少させながら誤り
スコアを決定する(ステップ710、703〜708を参照)。処理は、nが最
小値に達するまで(ステップ709)、繰り返される。最小の誤りスコアが決定
されたとき(ステップ711)のnが最も優れた一致とみなされる。
【0129】 検索を早く終了させるため、最小の誤りスコアが決定されるまで、nを変化さ
せることが望ましい。この場合、ボックス705で決定された誤りスコアが、n
の最近の更新時からみて増加したか否かを確認するように、部分的に判定ボック
ス706、708の機能を変更する。
【0130】 その代替手段もしくは追加的手段は、次の通りである。もし、nがiから増加
もしくは減少するにつれて候補ファイルの誤りスコアが減少するならば、nが通
常の最大値もしくは最小値を超過しても、同じ変化方向に続くnの値について試
行することが望ましい。その変化方向にnを変化させるにつれて誤りスコアが減
少する場合、nには「はずみ」が与えられる。すなわち、誤りスコアが一時的に
増加しても、その変化方向にnを変化させ続ける。これにより、nは、誤りスコ
アの小さなこぶ(局部的最大値)を越えて、他では到達し得ない有意なくぼみ(
最小値)に到達する。
【0131】 与えられた候補ファイルに対する誤りスコアは、その候補ファイルに含まれる
全てのn音符連なりに対し、最小の誤りスコアである。最もよく一致する候補フ
ァイルは、最小の誤りスコアを与えられたものである。
【0132】 更にとり得る一致アルゴリズムとして、入力された節回しを候補の節回しとす
るような変換が決定される。この技術では、入力された節回しと、それぞれの候
補節回しとが、連続した旋律的音程の一列、またはセグメントの一列としてリス
トされる。リズムの情報は、除外されてもよいし、または、さまざまな仕方で包
含されてもよい。これは、例えば、「C 3 B 1 D 2」のような旋律的
音程データ/旋律的セグメントデータ中に、リズム間隔または他のリズムデータ
を差し込むことにより実現される。その代替手段として、より長い音符が、多数
の単位長さ音符に分割されてもよい。これにより、長さ3を有する1つのC(上
記では「C 3」として表される)が、長さ1を有する3つのC(「C C C
」)に置き換えられる。また、もう一つの代替手段として、セグメントが、ピッ
チの情報に追加的にリズムの情報を含んでいるように用いられてもよい。
【0133】 そして、入力された節回しと、候補節回しとが比較され、一方を他方に変換す
る(旋律的音程もしくは旋律的セグメントの挿入、削除または改変)ための最小
回数が求められる。例えば、「A B C D E」が「B C F E」と比
較される場合、前者を後者に変換するには、「A」の削除と、「D」の「F」へ
の改変とが必要である。入力された節回しが、候補節回しを下手に歌唱したもの
、または候補節回しを誤って記憶したものであるとすると、これら3つの変換タ
イプは、余分な音符、欠落した音符及び誤った音符に対応する。
【0134】 一致度は、これらの変換に基づいた尺度によって評価される。一致度は、単純
に、変換回数(上述のケースでは、1削除+1改変=2変換となる)としてもよ
いし、あるいは、より高級な尺度として、異なる変換タイプに対して異なるスコ
アを与えてもよい。例えば、繰り返されている音符の挿入及び削除は、同じ歌曲
の異なる奏法の間であり得る変化としてとらえ、僅かな不利益を与えるのみでも
よい。また、小さな旋律的音程(例えば、半音階)の改変は、入力される節回し
における音符の完全な誤りよりも、むしろ音程調整の下手さに起因することを考
慮し、小さな旋律的音程の改変には、大きな旋律的音程の改変よりも小さな不利
益を与えるとしてもよい。
【0135】 以上、添付図面に示された特徴的実施例を参照して本発明を説明したが、添付
図面は本発明に何らかの制限を与えるものではない。上述の実施例に対する変形
例は、添付された請求項の範囲内である。
【図面の簡単な説明】
【図1】 本発明に係る一実施例の装置であって、データベース上で音楽検索を実行する
ための装置の概略図である。
【図2】 本発明に係る一つの態様の音楽検索方法を説明する流れ図である。
【図3】 図3(a)〜(c)は、音符の量子化に含まれる3つの段階でのピッチ曲線を
示しており、図3(d)は、長音階、半音階及び全音階に対するはしごのあては
めを示している。
【図4】 本発明に係る音符離散化処理に含まれるステップを示している。
【図5】 図5(a)、(b)は、本発明に係るセグメント頻度比較処理において生成さ
れるヒストグラムである。
【図6】 図6(a)〜(c)は、本発明に係る図的比較処理を示すピッチvs時間グラ
フである。
【図7】 本発明に係る図的一致処理に含まれるステップを示している。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/28 (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,MZ,SD,SL,SZ,TZ,UG ,ZW),EA(AM,AZ,BY,KG,KZ,MD, RU,TJ,TM),AE,AG,AL,AM,AT, AU,AZ,BA,BB,BG,BR,BY,BZ,C A,CH,CN,CR,CU,CZ,DE,DK,DM ,DZ,EE,ES,FI,GB,GD,GE,GH, GM,HR,HU,ID,IL,IN,IS,JP,K E,KG,KP,KR,KZ,LC,LK,LR,LS ,LT,LU,LV,MA,MD,MG,MK,MN, MW,MX,MZ,NO,NZ,PL,PT,RO,R U,SD,SE,SG,SI,SK,SL,TJ,TM ,TR,TT,TZ,UA,UG,US,UZ,VN, YU,ZA,ZW (72)発明者 フィン, ジョナサン ハンバート イギリス, CB1 1DJ, ケンブリ ッジ, バーレイ ストリート 75 (72)発明者 ウォームスレイ, ポール イギリス, CB1 1DJ, ケンブリ ッジ, バーレイ ストリート 75 (72)発明者 スミス, ジュリアン イギリス, CB1 1DJ, ケンブリ ッジ, バーレイ ストリート 75 Fターム(参考) 5B075 ND14 NK10 PP07 QM08 UU40 5D015 AA06 HH23 KK02 5D082 BB01 DD10

Claims (33)

    【特許請求の範囲】
  1. 【請求項1】 音楽ファイルのデータベースを検索するための装置であって
    、入力手段と、比較手段と、出力手段とを含み、 入力手段は、一連の旋律的音程として節回しを含んでいる検索基準を入力する
    ためのものであり、 比較手段は、前記一連の旋律的音程を、コンピュータ読み取り可能な複数の音
    楽ファイルに含まれる選択的部分と比較するためのものであり、 出力手段は、コンピュータ読み取り可能な前記複数の音楽ファイルに含まれる
    選択的部分と、前記検索基準と一致するリストを出力するためのものである 装置。
  2. 【請求項2】 請求項1に記載された装置であって、 前記入力手段はマイクロフォンを含み、前記マイクロフォンは、前記節回しが
    、利用者の歌唱、ハミングもしくは口笛により吹き込まれるためのものである 装置。
  3. 【請求項3】 請求項1に記載された装置であって、 前記入力手段は、節回しを演奏するためのMIDIキーボードを含む 装置。
  4. 【請求項4】 請求項1、請求項2または請求項3の何れかに記載された装
    置であって、 前記入力手段は、ピッチ認識手段を含み、ピッチ認識手段は、前記節回しとし
    て入力された複数の音楽的ピッチ間におけるそれぞれの旋律的音程を特定するた
    めのものである 装置。
  5. 【請求項5】 請求項1乃至4の何れかに記載された装置であって、 前記入力手段は、量子化手段を含み、前記量子化手段は、連続した2つの音楽
    的ピッチの間で、最も近い半音程、最も近い全音程、最も近い短3度音程、また
    は、最も近い長3度音程を決定するためのものである 装置。
  6. 【請求項6】 請求項1乃至4の何れかに記載された装置であって、 前記入力手段は、量子化手段を含み、前記量子化手段は、連続した2つの音楽
    的ピッチに最も適合するような長音階、短音階もしくは他の音階を決定するため
    のものである 装置。
  7. 【請求項7】 請求項1乃至6の何れかに記載された装置であって、入力さ
    れた前記一連の旋律的音程から一連のリズム間隔を決定し、かつ、前記一連のリ
    ズム間隔を更なる検索基準として用いるための手段を含む 装置。
  8. 【請求項8】 請求項1乃至7の何れかに記載された装置であって、テキス
    ト情報を含んでいる更なる検索基準を入力するための手段を含む 装置。
  9. 【請求項9】 請求項1乃至8の何れかに記載された装置であって、 前記比較手段は、前記節回しに含まれる1つもしくは複数のセグメントを、コ
    ンピュータ読み取り可能な前記複数の音楽ファイルに含まれる前記選択的部分と
    比較するための手段を含んでおり、 前記出力手段は、あり得る一致を示す個々のセグメント及び/もしくは選択的
    部分の個数に基づいた見込み一致に基づく 装置。
  10. 【請求項10】 請求項9に記載された装置であって、 前記節回しに含まれる前記セグメント、及び/もしくは、音楽ファイルに含ま
    れる前記選択的部分は、重なり合う音符連なりとして定められる 装置。
  11. 【請求項11】 請求項1乃至10の何れかに記載された装置であって、 前記比較手段は、 (a)入力された一連の旋律的音程と、(b)コンピュータ読み取り可能な前
    記複数の音楽ファイルに含まれる選択的部分とを、それぞれ、時間−ピッチ特性
    として表すための手段と、 前記(a)の特性と前記(b)の特性との間の適合近接度を求め、これにより
    、入力された節回しと前記選択的部分との間の一致度を決定するための手段と を含む 装置。
  12. 【請求項12】 請求項11に記載された装置であって、変換手段を含み、 前記変換手段は、適合近接度を求める前に、少なくとも1つの変換機能を、前
    記(a)の特性もしくは前記(b)の特性の少なくとも1つに適用するためのも
    のである 装置。
  13. 【請求項13】 請求項12に記載された装置であって、 前記少なくとも1つの変換機能は、 ピッチの変換、時間の変換、時間の基準化、グラフの相違部分に対する調整可
    能な時間基準化、グラフの相違部分に対する調整可能なピッチ変換、または、グ
    ラフから選択的線分を除去することによる変換の何れか1つを含む 装置。
  14. 【請求項14】 請求項11に記載された装置であって、 適合近接度を求めるための前記手段は、nのそれぞれの値について、入力され
    たi音符の音符連なりを、前記音楽ファイルに含まれるn音符の選択的部分と比
    較することにより、i音符の音符連なりに対する誤りスコアを決定するための手
    段を含む 装置。
  15. 【請求項15】 請求項14に記載された装置であって、誤りスコアが最小
    化されるnの値を決定するための手段を含む 装置。
  16. 【請求項16】 請求項15に記載された装置であって、誤りスコアが最小
    化されるまで、nの値を、初期値から変化させるための手段を含む 装置。
  17. 【請求項17】 請求項1乃至16の何れかに記載された装置であって、 前記比較手段は、 選択基準を適用することにより、コンピュータ読み取り可能な複数の音楽ファ
    イルの各部分のうち、節回しを含む可能性のある部分を特定し、これにより、前
    記複数の音楽ファイルに含まれる選択的関連部分を特定する手段を含む 装置。
  18. 【請求項18】 請求項17に記載された装置であって、前記音楽ファイル
    に含まれる前記選択的関連部分は、索引として蓄積される 装置。
  19. 【請求項19】 請求項18に記載された装置であって、索引として蓄積さ
    れた前記選択的関連部分は、テキストに符号化され、 前記入力手段は、前記一連の旋律的音程を、テキスト列に符号化するための手
    段を含み、 前記比較手段は、テキスト検索エンジンを含む 装置。
  20. 【請求項20】 請求項17に記載された装置であって、 コンピュータ読み取り可能な前記複数の音楽ファイルに含まれる前記選択的関
    連部分の位置は、前記複数の音楽ファイル内において、1つもしくは複数のタッ
    グにより指し示される 装置。
  21. 【請求項21】 音楽データベースについて索引を作成するための装置であ
    って、 コンピュータ読み取り可能な複数の音楽ファイルの各部分のうち、節回しを含
    む可能性のある部分を特定するため、選択基準を適用することにより、前記複数
    の音楽ファイルに含まれる選択的関連部分を特定するための手段と、 前記複数の音楽ファイルの各部分のうち、前記選択的関連部分に一致する部分
    を特定するため、前記複数の音楽ファイルにタッグ付け処理を施すための手段と
    を 含む装置。
  22. 【請求項22】 音楽データベースについて索引を作成するための装置であ
    って、 コンピュータ読み取り可能な複数の音楽ファイルの各部分のうち、節回しを含
    む可能性のある部分を特定するため、選択基準を適用することにより、前記複数
    の音楽ファイルに含まれる選択的関連部分を特定するための手段と、 前記複数の音楽ファイルについての索引であって、前記選択的関連部分の代表
    情報を含んでいる索引を作成するための手段とを 含む装置。
  23. 【請求項23】 音楽ファイルのデータベースを検索するための方法であっ
    て、 一連の旋律的音程として節回しを含んでいる検索基準を、入力として与え、 前記一連の旋律的音程を、コンピュータ読み取り可能な複数の音楽ファイルに
    含まれる選択的部分と比較し、 コンピュータ読み取り可能な前記複数の音楽ファイルに含まれる選択的部分と
    、前記検索基準と一致するリストを、出力として与える 方法。
  24. 【請求項24】 コンピュータプログラム製品であって、コンピュータプロ
    グラムの符号情報を記録したコンピュータ読み取り可能な媒体を含んでおり、 前記コンピュータプログラムは、コンピュータに読み込まれたとき、請求項2
    3に記載された方法をコンピュータに実行させる 製品。
  25. 【請求項25】 入力源からの一連の旋律的音程を決定するための装置であ
    って、入力手段と、音符離散化手段とを含み、 入力手段は、節回しを表す波信号を入力するためのものであり、 音符離散化手段は、 前記波信号の周波数−時間特性を、個別の時間区間に分離することにより、一
    連の節回し要素を構成し、かつ、それぞれの節回し要素について時間区間に対す
    る入力勾配を決定するための手段を含む 装置。
  26. 【請求項26】 請求項25に記載された装置であって、 それぞれの節回し要素の勾配を、「水平/略水平状態」、「斜め状態」及び「
    垂直/略垂直状態」の種類の1つに指定するための手段と、 隣り合い、かつ同じ種類の節回し要素を合体して複合要素を構成するための手
    段とを 含む装置。
  27. 【請求項27】 請求項26に記載された装置であって、 それぞれの「斜め状態」の節回し要素、または、それぞれの「斜め状態」の節
    回し要素に含まれる部分を、最も近い「水平状態」の節回し要素と等しい値の「
    水平状態」の節回し要素として再指定し、 これにより、「斜め状態」の節回し要素を除去するための手段を 含む装置。
  28. 【請求項28】 請求項1に記載された装置であって、 前記節回しに含まれる複数のセグメントを、コンピュータ読み取り可能な前記
    複数の音楽ファイルに含まれる複数のセグメントと比較するための手段と、 それぞれのセグメントタイプについて一致個数を決定するための手段とを 含んでおり、 前記出力手段は、前記節回しと、前記音楽ファイルとの間において、セグメン
    トタイプの個数の輪郭を比較することに基づいた見込み一致に基づく 装置。
  29. 【請求項29】 請求項11に記載された装置であって、 一致度を決定するための前記手段は、(a)と(b)とを一致させるために要
    求される変換の回数を決定するための手段を含む 装置。
  30. 【請求項30】 請求項1に記載された装置であって、 コンピュータ読み取り可能な前記音楽ファイル、及び/もしくは、入力される
    前記検索基準は、オーディオファイルを含んでいる 装置。
  31. 【請求項31】 請求項30に記載された装置であって、 前記比較手段は、 オーディオ信号においてステレオの左チャンネル及び右チャンネルに共通な構
    成要素を検出することにより、前記オーディオファイルのうち、節回しを含む可
    能性のある選択的関連部分を特定する手段を含む 装置。
  32. 【請求項32】 本明細書において添付図面を参照して実質的に説明されて
    いる装置。
  33. 【請求項33】 本明細書において添付図面を参照して実質的に説明されて
    いる方法。
JP2001516077A 1999-08-07 2000-08-07 音楽データベースの検索 Expired - Fee Related JP4344499B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB9918611.6A GB9918611D0 (en) 1999-08-07 1999-08-07 Music database searching
GB9918611.6 1999-08-07
PCT/GB2000/003035 WO2001011496A2 (en) 1999-08-07 2000-08-07 Music database searching

Publications (3)

Publication Number Publication Date
JP2003529091A true JP2003529091A (ja) 2003-09-30
JP2003529091A5 JP2003529091A5 (ja) 2005-11-17
JP4344499B2 JP4344499B2 (ja) 2009-10-14

Family

ID=10858742

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001516077A Expired - Fee Related JP4344499B2 (ja) 1999-08-07 2000-08-07 音楽データベースの検索

Country Status (8)

Country Link
US (1) US20030023421A1 (ja)
EP (1) EP1397756B1 (ja)
JP (1) JP4344499B2 (ja)
AT (1) ATE491997T1 (ja)
AU (1) AU6456800A (ja)
DE (1) DE60045393D1 (ja)
GB (1) GB9918611D0 (ja)
WO (1) WO2001011496A2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006006528A1 (ja) * 2004-07-09 2006-01-19 Nippon Telegraph And Telephone Corporation 音響信号検出システム、音響信号検出サーバ、映像信号探索装置、映像信号探索方法、映像信号探索プログラムと記録媒体、信号探索装置、信号探索方法、及び、信号探索プログラムと記録媒体
JP2006301134A (ja) * 2005-04-19 2006-11-02 Hitachi Ltd 音楽検出装置、音楽検出方法及び録音再生装置
JP2007316692A (ja) * 2006-05-23 2007-12-06 Nec System Technologies Ltd メロディ検索装置及びこれに対する入力装置並びにメロディ検索方法
JP2011069845A (ja) * 2009-09-24 2011-04-07 Nippon Telegr & Teleph Corp <Ntt> 音声検索方法,音声検索装置および音声検索プログラム
JP2018146768A (ja) * 2017-03-06 2018-09-20 株式会社第一興商 カラオケ装置

Families Citing this family (86)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8180844B1 (en) * 2000-03-18 2012-05-15 Digimarc Corporation System for linking from objects to remote resources
US7062528B2 (en) 2000-07-14 2006-06-13 Sony Corporation Method and system for identifying a time specific event
US7031921B2 (en) * 2000-11-03 2006-04-18 International Business Machines Corporation System for monitoring audio content available over a network
US7085613B2 (en) * 2000-11-03 2006-08-01 International Business Machines Corporation System for monitoring audio content in a video broadcast
CN100511422C (zh) * 2000-12-07 2009-07-08 索尼公司 内容检索方法和装置、通信***和通信方法
GB0107104D0 (en) 2001-03-21 2001-05-09 Netpd Ltd Method and apparatus for identifying electronic files
US7328153B2 (en) 2001-07-20 2008-02-05 Gracenote, Inc. Automatic identification of sound recordings
WO2003012695A2 (en) * 2001-07-31 2003-02-13 Gracenote, Inc. Multiple step identification of recordings
US7127454B2 (en) * 2001-08-17 2006-10-24 Sony Corporation E-marker find music
US7107234B2 (en) 2001-08-17 2006-09-12 Sony Corporation Electronic music marker device delayed notification
US20030205124A1 (en) * 2002-05-01 2003-11-06 Foote Jonathan T. Method and system for retrieving and sequencing music by rhythmic similarity
US20040225519A1 (en) * 2002-06-25 2004-11-11 Martin Keith D. Intelligent music track selection
US6972698B2 (en) 2002-06-28 2005-12-06 Sony Corporation GPS e-marker
DE10232916B4 (de) * 2002-07-19 2008-08-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Charakterisieren eines Informationssignals
JP4039158B2 (ja) * 2002-07-22 2008-01-30 ソニー株式会社 情報処理装置および方法、情報処理システム、記録媒体、並びにプログラム
WO2004034375A1 (en) * 2002-10-11 2004-04-22 Matsushita Electric Industrial Co. Ltd. Method and apparatus for determining musical notes from sounds
DE10254612A1 (de) * 2002-11-22 2004-06-17 Humboldt-Universität Zu Berlin Verfahren zur Ermittlung spezifisch relevanter akustischer Merkmale von Schallsignalen für die Analyse unbekannter Schallsignale einer Schallerzeugung
GB0230097D0 (en) * 2002-12-24 2003-01-29 Koninkl Philips Electronics Nv Method and system for augmenting an audio signal
US20040225575A1 (en) * 2003-05-09 2004-11-11 List David M. System and method to purchase a customized cd, dvd and the like
US7715934B2 (en) 2003-09-19 2010-05-11 Macrovision Corporation Identification of input files using reference files associated with nodes of a sparse binary tree
US7383174B2 (en) * 2003-10-03 2008-06-03 Paulin Matthew A Method for generating and assigning identifying tags to sound files
US20050086052A1 (en) * 2003-10-16 2005-04-21 Hsuan-Huei Shih Humming transcription system and methodology
US20050108378A1 (en) * 2003-10-25 2005-05-19 Macrovision Corporation Instrumentation system and methods for estimation of decentralized network characteristics
US20050114709A1 (en) * 2003-10-25 2005-05-26 Macrovision Corporation Demand based method for interdiction of unauthorized copying in a decentralized network
US20050203851A1 (en) * 2003-10-25 2005-09-15 Macrovision Corporation Corruption and its deterrence in swarm downloads of protected files in a file sharing network
US20050089014A1 (en) * 2003-10-27 2005-04-28 Macrovision Corporation System and methods for communicating over the internet with geographically distributed devices of a decentralized network using transparent asymetric return paths
JP4594701B2 (ja) * 2003-11-14 2010-12-08 パイオニア株式会社 情報検索装置、情報検索方法及び情報検索用プログラム並びに情報記録媒体
EP1687803A4 (en) * 2003-11-21 2007-12-05 Agency Science Tech & Res METHOD AND APPARATUS FOR MATCHING AND REPRESENTING MELODIES FOR EXTRACTING MUSIC
JP2007519092A (ja) * 2003-12-08 2007-07-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ メロディデータベースの検索
US20050138036A1 (en) * 2003-12-18 2005-06-23 Sizemore Rodney J.Jr. Method of Producing Personalized Data Storage Product
JP2005202319A (ja) * 2004-01-19 2005-07-28 Denso Corp 情報抽出システム及び楽曲抽出システム
US7877810B2 (en) 2004-03-02 2011-01-25 Rovi Solutions Corporation System, method and client user interface for a copy protection service
US7325013B2 (en) * 2004-04-15 2008-01-29 Id3Man, Inc. Database with efficient fuzzy matching
US9553937B2 (en) * 2004-06-28 2017-01-24 Nokia Technologies Oy Collecting preference information
JP4315101B2 (ja) * 2004-12-20 2009-08-19 ヤマハ株式会社 音楽コンテンツ提供装置及びプログラム
DE102005005536A1 (de) * 2005-02-07 2006-08-10 Sick Ag Codeleser
US20070022139A1 (en) * 2005-07-25 2007-01-25 Stewart Bradley C Novelty system and method that recognizes and responds to an audible song melody
US20070027844A1 (en) * 2005-07-28 2007-02-01 Microsoft Corporation Navigating recorded multimedia content using keywords or phrases
JP2007072023A (ja) * 2005-09-06 2007-03-22 Hitachi Ltd 情報処理装置及び情報処理方法
CN100373383C (zh) * 2005-09-08 2008-03-05 上海交通大学 基于特征音符的音乐旋律分段自动标注方法
CN100373382C (zh) * 2005-09-08 2008-03-05 上海交通大学 基于内容的数字音乐检索旋律特征数据库及生成***
US7809943B2 (en) 2005-09-27 2010-10-05 Rovi Solutions Corporation Method and system for establishing trust in a peer-to-peer network
US8086722B2 (en) 2005-12-21 2011-12-27 Rovi Solutions Corporation Techniques for measuring peer-to-peer (P2P) networks
US7518052B2 (en) * 2006-03-17 2009-04-14 Microsoft Corporation Musical theme searching
EP1840764A1 (en) * 2006-03-30 2007-10-03 Sony France S.A. Hybrid audio-visual categorization system and method
WO2007133754A2 (en) * 2006-05-12 2007-11-22 Owl Multimedia, Inc. Method and system for music information retrieval
WO2008021459A2 (en) * 2006-08-17 2008-02-21 Anchorfree, Inc. Software web crawlwer and method thereof
US8311823B2 (en) 2006-08-31 2012-11-13 Sony Mobile Communications Ab System and method for searching based on audio search criteria
US8239480B2 (en) 2006-08-31 2012-08-07 Sony Ericsson Mobile Communications Ab Methods of searching using captured portions of digital audio content and additional information separate therefrom and related systems and computer program products
US20080059170A1 (en) * 2006-08-31 2008-03-06 Sony Ericsson Mobile Communications Ab System and method for searching based on audio search criteria
CN101226526A (zh) * 2007-01-17 2008-07-23 上海怡得网络有限公司 一种基于音乐片段信息查询的音乐搜索方法
US7890521B1 (en) * 2007-02-07 2011-02-15 Google Inc. Document-based synonym generation
US8116746B2 (en) * 2007-03-01 2012-02-14 Microsoft Corporation Technologies for finding ringtones that match a user's hummed rendition
US7985911B2 (en) 2007-04-18 2011-07-26 Oppenheimer Harold B Method and apparatus for generating and updating a pre-categorized song database from which consumers may select and then download desired playlists
US20090024388A1 (en) * 2007-06-11 2009-01-22 Pandiscio Jill A Method and apparatus for searching a music database
US20090013260A1 (en) * 2007-07-06 2009-01-08 Martin Keith D Intelligent music track selection in a networked environment
KR101504522B1 (ko) * 2008-01-07 2015-03-23 삼성전자 주식회사 음악 저장/검색 장치 및 방법
JP5121487B2 (ja) * 2008-02-12 2013-01-16 任天堂株式会社 楽曲修正プログラムおよび楽曲修正装置
CN102067228B (zh) * 2008-06-26 2013-04-24 日本电气株式会社 内容再现顺序决定***及其方法和程序
US7994410B2 (en) * 2008-10-22 2011-08-09 Classical Archives, LLC Music recording comparison engine
US20100138404A1 (en) * 2008-12-01 2010-06-03 Chul Hong Park System and method for searching for musical pieces using hardware-based music search engine
JP5293817B2 (ja) * 2009-06-19 2013-09-18 富士通株式会社 音声信号処理装置及び音声信号処理方法
US20110077756A1 (en) * 2009-09-30 2011-03-31 Sony Ericsson Mobile Communications Ab Method for identifying and playing back an audio recording
EP2355104A1 (en) * 2009-12-18 2011-08-10 Dublin Institute of Technology Apparatus and method for processing audio data
US8049093B2 (en) * 2009-12-30 2011-11-01 Motorola Solutions, Inc. Method and apparatus for best matching an audible query to a set of audible targets
US20110231189A1 (en) * 2010-03-19 2011-09-22 Nuance Communications, Inc. Methods and apparatus for extracting alternate media titles to facilitate speech recognition
US9280598B2 (en) * 2010-05-04 2016-03-08 Soundhound, Inc. Systems and methods for sound recognition
US9153217B2 (en) * 2010-11-01 2015-10-06 James W. Wieder Simultaneously playing sound-segments to find and act-upon a composition
TWI426501B (zh) * 2010-11-29 2014-02-11 Inst Information Industry 旋律辨識方法與其裝置
CN102541965B (zh) * 2010-12-30 2015-05-20 国际商业机器公司 自动获得音乐文件中的特征片断的方法和***
US8924345B2 (en) * 2011-09-26 2014-12-30 Adobe Systems Incorporated Clustering and synchronizing content
US20130325853A1 (en) * 2012-05-29 2013-12-05 Jeffery David Frazier Digital media players comprising a music-speech discrimination function
CN104380371B (zh) * 2012-06-04 2020-03-20 索尼公司 用于生成输入音乐数据的伴奏的装置、***和方法
US9529907B2 (en) * 2012-12-31 2016-12-27 Google Inc. Hold back and real time ranking of results in a streaming matching system
EP2916241A1 (en) * 2014-03-03 2015-09-09 Nokia Technologies OY Causation of rendering of song audio information
AU2014204540B1 (en) 2014-07-21 2015-08-20 Matthew Brown Audio Signal Processing Methods and Systems
WO2016024172A1 (en) 2014-08-14 2016-02-18 Yandex Europe Ag Method of and a system for matching audio tracks using chromaprints with a fast candidate selection routine
WO2016024171A1 (en) 2014-08-14 2016-02-18 Yandex Europe Ag Method of and a system for indexing audio tracks using chromaprints
US11681738B2 (en) * 2015-04-08 2023-06-20 Christopher John Allison Creative arts recommendation systems and methods
US10349196B2 (en) * 2016-10-03 2019-07-09 Nokia Technologies Oy Method of editing audio signals using separated objects and associated apparatus
US10121461B1 (en) * 2017-06-27 2018-11-06 International Business Machines Corporation Providing feedback on musical performance
CN108090210A (zh) 2017-12-29 2018-05-29 广州酷狗计算机科技有限公司 搜索音频的方法和装置
US11294954B2 (en) * 2018-01-04 2022-04-05 Audible Magic Corporation Music cover identification for search, compliance, and licensing
US11048747B2 (en) * 2019-02-15 2021-06-29 Secret Chord Laboratories, Inc. Predicting the popularity of a song based on harmonic surprise
EP3935622A4 (en) 2019-03-07 2023-03-01 Yao the Bard, LLC. SYSTEMS AND METHODS FOR TRANSFORMING SPOKE OR TEXTUAL INPUT INTO MUSIC
US11816151B2 (en) 2020-05-15 2023-11-14 Audible Magic Corporation Music cover identification with lyrics for search, compliance, and licensing

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02157799A (ja) * 1988-12-09 1990-06-18 Nec Corp 旋律分析方式
JPH04163486A (ja) * 1990-10-26 1992-06-09 Casio Comput Co Ltd 調性判別装置
JPH05273968A (ja) * 1992-03-27 1993-10-22 Yamaha Corp 自動演奏装置
JPH06290574A (ja) * 1993-03-31 1994-10-18 Victor Co Of Japan Ltd 楽曲検索装置
JPH0736478A (ja) * 1993-06-28 1995-02-07 Nec Corp 音符列間類似度計算装置
JPH0792985A (ja) * 1993-09-27 1995-04-07 Aiwa Co Ltd 音響装置
JPH09258729A (ja) * 1996-03-26 1997-10-03 Yamaha Corp 選曲装置
JPH1115468A (ja) * 1997-05-01 1999-01-22 N T T Data:Kk 楽曲検索方法、楽曲検索装置、楽曲検索システム、及び記録媒体

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4731847A (en) * 1982-04-26 1988-03-15 Texas Instruments Incorporated Electronic apparatus for simulating singing of song
US5563358A (en) * 1991-12-06 1996-10-08 Zimmerman; Thomas G. Music training apparatus
US5874686A (en) * 1995-10-31 1999-02-23 Ghias; Asif U. Apparatus and method for searching a melody
US5918223A (en) * 1996-07-22 1999-06-29 Muscle Fish Method and article of manufacture for content-based analysis, storage, retrieval, and segmentation of audio information
US5918303A (en) * 1996-11-25 1999-06-29 Yamaha Corporation Performance setting data selecting apparatus
DE19652225A1 (de) * 1996-12-16 1998-06-25 Harald Rieck Verfahren zum Erkennen von Melodien
US6504089B1 (en) * 1997-12-24 2003-01-07 Canon Kabushiki Kaisha System for and method of searching music data, and recording medium for use therewith
US6528715B1 (en) * 2001-10-31 2003-03-04 Hewlett-Packard Company Music search by interactive graphical specification with audio feedback

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02157799A (ja) * 1988-12-09 1990-06-18 Nec Corp 旋律分析方式
JPH04163486A (ja) * 1990-10-26 1992-06-09 Casio Comput Co Ltd 調性判別装置
JPH05273968A (ja) * 1992-03-27 1993-10-22 Yamaha Corp 自動演奏装置
JPH06290574A (ja) * 1993-03-31 1994-10-18 Victor Co Of Japan Ltd 楽曲検索装置
JPH0736478A (ja) * 1993-06-28 1995-02-07 Nec Corp 音符列間類似度計算装置
JPH0792985A (ja) * 1993-09-27 1995-04-07 Aiwa Co Ltd 音響装置
JPH09258729A (ja) * 1996-03-26 1997-10-03 Yamaha Corp 選曲装置
JPH1115468A (ja) * 1997-05-01 1999-01-22 N T T Data:Kk 楽曲検索方法、楽曲検索装置、楽曲検索システム、及び記録媒体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
柳瀬 隆史 TAKASHI YANASE: "音楽検索における自動インデクシング法 An Auto-Indexing Method in Music Retrirval", 情報処理学会研究報告 VOL.98 NO.58 IPSJ SIG NOTES, vol. 第98巻, JPN6007004583, JP, ISSN: 0000976511 *
柳瀬 隆史、高須 淳宏、安達 淳: "音楽検索における自動インデクシング法", 情報処理学会研究報告 VOL.98 NO.58, vol. 第98巻第58号, CSNG199901066015, 10 August 1998 (1998-08-10), JP, pages 117 - 124, ISSN: 0000826659 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006006528A1 (ja) * 2004-07-09 2006-01-19 Nippon Telegraph And Telephone Corporation 音響信号検出システム、音響信号検出サーバ、映像信号探索装置、映像信号探索方法、映像信号探索プログラムと記録媒体、信号探索装置、信号探索方法、及び、信号探索プログラムと記録媒体
US7873521B2 (en) 2004-07-09 2011-01-18 Nippon Telegraph And Telephone Corporation Sound signal detection system, sound signal detection server, image signal search apparatus, image signal search method, image signal search program and medium, signal search apparatus, signal search method and signal search program and medium
JP2006301134A (ja) * 2005-04-19 2006-11-02 Hitachi Ltd 音楽検出装置、音楽検出方法及び録音再生装置
JP2007316692A (ja) * 2006-05-23 2007-12-06 Nec System Technologies Ltd メロディ検索装置及びこれに対する入力装置並びにメロディ検索方法
JP2011069845A (ja) * 2009-09-24 2011-04-07 Nippon Telegr & Teleph Corp <Ntt> 音声検索方法,音声検索装置および音声検索プログラム
JP2018146768A (ja) * 2017-03-06 2018-09-20 株式会社第一興商 カラオケ装置

Also Published As

Publication number Publication date
WO2001011496A2 (en) 2001-02-15
GB9918611D0 (en) 1999-10-13
EP1397756A2 (en) 2004-03-17
JP4344499B2 (ja) 2009-10-14
US20030023421A1 (en) 2003-01-30
ATE491997T1 (de) 2011-01-15
WO2001011496A3 (en) 2003-12-24
EP1397756B1 (en) 2010-12-15
AU6456800A (en) 2001-03-05
DE60045393D1 (de) 2011-01-27

Similar Documents

Publication Publication Date Title
JP4344499B2 (ja) 音楽データベースの検索
JP3704980B2 (ja) 自動作曲装置と記録媒体
Hu et al. A comparison of melodic database retrieval techniques using sung queries
Birmingham et al. MUSART: Music Retrieval Via Aural Queries.
Serra et al. Chroma binary similarity and local alignment applied to cover song identification
US7838755B2 (en) Music-based search engine
Lu et al. A Newapproach To Query By Humming In Music Retrieval.
US7064262B2 (en) Method for converting a music signal into a note-based description and for referencing a music signal in a data bank
Soulez et al. Improving polyphonic and poly-instrumental music to score alignment
Casey et al. The importance of sequences in musical similarity
JP3844627B2 (ja) 音楽検索システム
WO2003028004A2 (en) Method and system for extracting melodic patterns in a musical piece
Maddage Automatic structure detection for popular music
Rolland et al. Musical content-based retrieval: an overview of the Melodiscov approach and system
JP2003519845A (ja) 音楽検索エンジン
Dannenberg et al. Discovering musical structure in audio recordings
Rizo et al. A Pattern Recognition Approach for Melody Track Selection in MIDI Files.
JPH1115468A (ja) 楽曲検索方法、楽曲検索装置、楽曲検索システム、及び記録媒体
KR100512143B1 (ko) 멜로디 기반 음악 검색방법과 장치
Heydarian Automatic recognition of Persian musical modes in audio musical signals
JPH10319948A (ja) 音楽演奏に含まれる楽器音の音源種類判別方法
CN110867174A (zh) 自动混音装置
JPH11272274A (ja) 歌声による曲検索法
JP2002055695A (ja) 音楽検索システム
Zenz et al. Automatic chord detection incorporating beat and key detection

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040402

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040402

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070607

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20070611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20070612

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20070611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071127

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20070611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080206

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080430

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080529

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090701

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090713

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120717

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4344499

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120717

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130717

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees