JP4823804B2 - コード名検出装置及びコード名検出用プログラム - Google Patents

コード名検出装置及びコード名検出用プログラム Download PDF

Info

Publication number
JP4823804B2
JP4823804B2 JP2006216361A JP2006216361A JP4823804B2 JP 4823804 B2 JP4823804 B2 JP 4823804B2 JP 2006216361 A JP2006216361 A JP 2006216361A JP 2006216361 A JP2006216361 A JP 2006216361A JP 4823804 B2 JP4823804 B2 JP 4823804B2
Authority
JP
Japan
Prior art keywords
sound
power
scale
detection
beat
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006216361A
Other languages
English (en)
Other versions
JP2008040283A5 (ja
JP2008040283A (ja
Inventor
錬 澄田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kawai Musical Instrument Manufacturing Co Ltd
Original Assignee
Kawai Musical Instrument Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kawai Musical Instrument Manufacturing Co Ltd filed Critical Kawai Musical Instrument Manufacturing Co Ltd
Priority to JP2006216361A priority Critical patent/JP4823804B2/ja
Priority to US11/780,717 priority patent/US7485797B2/en
Priority to DE102007034774A priority patent/DE102007034774A1/de
Priority to CN2007101403349A priority patent/CN101123085B/zh
Publication of JP2008040283A publication Critical patent/JP2008040283A/ja
Publication of JP2008040283A5 publication Critical patent/JP2008040283A5/ja
Application granted granted Critical
Publication of JP4823804B2 publication Critical patent/JP4823804B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/38Chord
    • G10H1/383Chord detection and/or recognition, e.g. for correction, or automatic bass generation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

本発明は、コード名検出装置及びコード名検出用プログラムに関する。
音楽CD等の複数の楽器音の混ざった音楽音響信号(オーディオ信号)からコード名(和音名)を検出するコード検出装置として、本出願人は、先に特願2006−1194の特許出願をしている。
同出願の構成では、小節内が複数のコード(和音)で構成される場合の、その判断方法として、ベース音を用いていた。つまり、小節を前半と後半の2つに分割し、その夫々でベース音を検出し、別のベース音が検出された場合は、コードも前半と後半に分けて検出するというものである。
しかし、この方法では、ベース音が同じで和音が異なる場合、例えば、小節の前半がCのコードで、後半がCmのコードの場合に、ベース音は同じであるために小節を分割することができず、コードを小節全体で検出してしまうという問題があった。
さらに、先の出願では、ベース音を検出範囲全体で検出していた。つまり、検出範囲が小節の場合は、小節全体で強い音をベース音としていた。しかし、ジャズのようなベースランニング(ベースが4分音符などで動く)場合には、この方法では正しくベース音を検出することができない。
本発明は、以上のような問題に鑑み創案されたもので、小節内で例えば同じベース音を持つ同士のコード変化がある場合でも正しいコードが検出出来るコード名検出装置及びコード名検出用プログラムを提供せんとするものである。
そのため本発明に係るコード名検出装置は、
音響信号を入力する入力手段と、
入力された音響信号から、所定のフレーム間隔で、FFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求める第1の音階音パワー検出手段と、
この所定のフレーム毎の各音階音のパワーの増分値をすべての音階音について合計して、フレーム毎の全体の音の変化度合いを示すパワーの増分値の合計を求め、このフレーム毎の全体の音の変化度合いを示すパワーの増分値の合計から、平均的なビート間隔と各ビートの位置を検出するビート検出手段と、
このビート毎の各音階音のパワーの平均値を計算し、このビート毎の各音階音の平均パワーの増分値をすべての音階音について合計して、ビート毎の全体の音の変化度合いを示す値を求め、このビート毎の全体の音の変化度合いを示す値から、拍子と小節線位置を検出する小節検出手段と、
上記入力された音響信号から、先のビート検出の時とは異なる別の所定のフレーム間隔で、第1の音階音パワー検出手段におけるFFT演算よりもFFTポイント数を大きくしてFFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求める第2の音階音パワー検出手段と、
各小節幾つかの検出範囲設定し、検出した各音階音のパワーのうち、各検出範囲内の1拍目に相当する部分の低域側の音階音のパワーから各検出範囲のベース音を検出するベース音検出手段と、
検出されたベース音が各検出範囲で異なるか否かによって、ベース音の変化のあるなしを判定し、このベース音の変化があるなしにより小節を複数個に分割することの可否を決定する第1の小節分割決定手段と、
同じく小節幾つかのコード検出区間設定し、主に和音が演奏されている音域として設定されたコード検出音域において、フレーム毎の各音階音のパワーを上記検出区間で平均し、これらの平均された各音階音のパワーをさらに12の音階音毎に積算し、積算した数で割り12の音階音の平均パワーを求め、夫々をパワーの強い順に並べ替えておいて、前後の検出区間で強い音の順位に変化があったかどうかによって、和音の変化のあるなしを判定し、この和音の変化の度合いにより小節を複数個に分割することの可否を決定する第2の小節分割決定手段と、
第1乃至第2の小節分割決定手段により、小節を幾つかのコード検出範囲に分割する必要があると決定された場合は、ベース音と各コード検出範囲における各音階音のパワーから、また小節を分割する必要がないと決定された場合は、ベース音とその小節の各音階音のパワーから、各コード検出範囲又はその小節におけるコード名を決定するコード名決定手段と
を有することを基本的特徴としている。
上記構成では、ベース音のみではなく、和音の変化度合いに応じて小節を分割するようにする。ベース音が異なるか、または、和音の変化度合いが大きい場合に小節を分割してコードを検出する。この小節の分割は、前半と後半の2分割だけでなく、曲が4拍子の場合には、前半と後半の夫々さらに半分に分割して、小節全体を4分割するようにしても良いし、場合によっては、さらに分割するようにしても構わない。ベース音の検出に関しては、検出範囲全体で検出するのではなく、検出範囲の先頭の1拍だけで検出するようにした。ベースランニングの場合にも、最初の1拍目はコードのルート音を弾くことが多いからである。
ベース音の検出については、先の出願と同じである。すなわち、入力波形を所定の時間間隔(以下、フレーム)でFFT演算し、求められたパワースペクトルから各音階音のパワーを求め、この各音階音のパワーのフレーム毎の増分値を計算し、これを全音階音で合計してフレーム毎の全体の音の変化度合いを求め、このフレーム毎の全体の音の変化度合いからビート(ビート間隔とビート位置)を検出する。ビート位置が検出されたら、夫々のビート間隔毎に各音階音のパワーの平均を計算し、この各音階音のパワーの平均のビート毎の増分値を計算し、これを全音階音で合計してビート毎の全体の音の変化度合いを求め、このビート毎の全体の音の変化度合いから拍子と小節線位置を検出する。このようにして、小節が検出されるので、小節を前半と後半に2分割して、夫々でベース音を検出する。ベース音は、先に求めたフレーム毎の各音階音のパワーの内、ベースの音域(例えばE1〜E3)のものを使って、その検出範囲内のパワーを平均して、平均パワーが大きいものをベース音とする。あるいは、12の音階音で平均して、最も強い音階音をベース音とする。
先の出願では、検出範囲内のパワーを平均して、平均パワーが大きいものをベース音としていたが、本発明では、検出範囲の1拍目だけを使って検出する。その理由は上述の通りである。検出手順乃至構成そのものは、先の出願と同じである。
本発明の主眼である、和音の変化度合いによる小節の分割について、次に説明する。
本発明では、前述のベース音だけでなく、和音の変化度合いでも小節を分割する。和音の変化度合いは、以下のようにして算出する。まず、コード検出音域を設定する。これは、主に和音が演奏されている音域で、例えば、C3〜E6(C4が中央のド)とする。
このコード検出音域のフレーム毎の各音階音のパワーを、小節の半分等の検出区間で平均する。平均された各音階音のパワーをさらに12の音階音(C、C#、D、D#、…、B)毎に積算し、積算した数で割り、12の音階音の平均パワーを求める。
小節の前半と後半で、このコード検出音域の12の音階音の平均パワーを求め、夫々を強い順に並べ替えておく。
図15(a)(b)に示すように、後半の強い音の内、例えば上位3つ(この数をMとする)が、前半の例えば上位3つ(この数をNとする)に含まれているかどうかを調べる。
含まれている数が例えば3つ(この数をCとする)以上の場合(即ちすべて含まれる)には、小節の前半と後半で和音の変化は無いと判断し、和音の変化度合いによる小節の分割は行わない。
M、N、Cの値を適当に設定することにより、この和音の変化度合いによる小節分割の強さを変えることができる。先の例の全て3では、かなりシビアに和音の変化をチェックするが、例えば、M=3、N=6、C=3(後半の上位3つの音が前半の上位6つに全て含まれるかどうか)にすれば、ある程度似た響きであれば、同じ和音であると判断する。
先に4拍子の場合、前半と後半を夫々更に半分に分割して小節全体を4分割することを述べたが、前半と後半の分割判断では、M=3、N=3、C=3とし、前半と後半を更に半分に分割するかどうかの判断では、M=3、N=6、C=3とすることで、実際の一般的な音楽に適合したより正しい判断を行うことができる。
本発明の構成では、ベース音のみではなく、和音の変化度合いに応じても小節を分割するようにして、和音を検出しているため、ベース音が同じ場合でも、和音の変化度合いが大きい場合には、小節を分割してコードが検出されることになる。すなわち、小節内で例えば同じベース音を持つ同士のコード変化がある場合でも正しいコードが検出出来るようになる。この小節の分割については、ベース音の変化の度合い、和音の変化度合いに応じて、様々に分割することが可能である。
請求項2の構成は、請求項1における和音の変化度合いによる小節の分割構成を別の構成としたものである。
すなわち、請求項2のコード名検出装置は、
音響信号を入力する入力手段と、
入力された音響信号から、所定のフレーム間隔で、FFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求める第1の音階音パワー検出手段と、
この所定のフレーム毎の各音階音のパワーの増分値をすべての音階音について合計して、フレーム毎の全体の音の変化度合いを示すパワーの増分値の合計を求め、このフレーム毎の全体の音の変化度合いを示すパワーの増分値の合計から、平均的なビート間隔と各ビートの位置を検出するビート検出手段と、
このビート毎の各音階音のパワーの平均値を計算し、このビート毎の各音階音の平均パワーの増分値をすべての音階音について合計して、ビート毎の全体の音の変化度合いを示す値を求め、このビート毎の全体の音の変化度合いを示す値から、拍子と小節線位置を検出する小節検出手段と、
上記入力された音響信号から、先のビート検出の時とは異なる別の所定のフレーム間隔で、第1の音階音パワー検出手段におけるFFT演算よりもFFTポイント数を大きくしてFFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求める第2の音階音パワー検出手段と、
各小節幾つかの検出範囲設定し、検出した各音階音のパワーのうち、各検出範囲内の1拍目に相当する部分の低域側の音階音のパワーから各検出範囲のベース音を検出するベース音検出手段と、
検出されたベース音が各検出範囲で異なるか否かによって、ベース音の変化のあるなしを判定し、このベース音の変化があるなしにより小節を複数個に分割することの可否を決定する第1の小節分割決定手段と、
同じく小節幾つかのコード検出区間設定し、主に和音が演奏されている音域として設定されたコード検出音域において、フレーム毎の各音階音のパワーを上記検出区間で平均し、これらの平均された各音階音のパワーをさらに12の音階音毎に積算し、積算した数で割り12の音階音の平均パワーを求め、前後の検出区間において、その12の音階音の平均パワーを12の音階音の平均パワーの最大値が小さい方を基準に正規化し、正規化後の各音階音のパワーのユークリッド距離を計算することによって、和音の変化のあるなしを判定し、この和音の変化の度合いにより小節を複数個に分割することの可否を決定する第2の小節分割決定手段と、
第1乃至第2の小節分割決定手段により、小節を幾つかのコード検出範囲に分割する必要があると決定された場合は、ベース音と各コード検出範囲における各音階音のパワーから、また小節を分割する必要がないと決定された場合は、ベース音とその小節の各音階音のパワーから、各コード検出範囲又はその小節におけるコード名を決定するコード名決定手段と
を有する構成である。
上記構成は、請求項1の構成とは異なり、各音階音のパワーのユークリッド距離を計算するという構成により、和音の変化の度合いを感知し、小節を分割してコードを検出するというものである。
ただし、この場合、単純にユークリッド距離を計算したのでは、急激な音の立ち上がり(曲の始まりなど)や急激な音の減衰(曲の終わり、ブレークなど)で、ユークリッド距離が大きな値となり、和音の変化は無いのに音の強弱だけで小節を分割してしまう恐れがある。そこで、ユークリッド距離を計算する前に、図17に示すように、各音階音のパワーを正規化するようにする(図17(a)は同(c)のように、また図17(b)は同図(d)のように正規化する)。その際、大きい方に合わせるのではなく、小さい方に合わせるようにすれば(図17(a)〜(d)参照)、急激な音の変化ではユークリッド距離が小さくなり、誤って小節分割することは無くなる。
上記各音階音のパワーのユークリッド距離は、下式数16で計算される。
Figure 0004823804
このユークリッド距離が、例えば全フレーム全音のパワーの平均を上回る場合は小節を分割する。
さらに、詳しくは、(ユークリッド距離>全フレーム全音のパワーの平均×T)の時、小節を分割するようにすれば良い。該式の値Tを変えれば、小節分割の閾値を任意の値に変える(調整する)ことができる。
請求項3乃至請求項4の構成は、コンピュータに読み出されて実行されることで、上記請求項1乃至請求項2のコード名検出装置となるコンピュータプログラムに関する提案を行うものである。
すなわち、上述した課題を解決するための構成として、上記請求項1乃至請求項2に規定したコード名検出装置の各構成における処理手段を、コンピュータの構成を利用して実行する、該コンピュータで読み込まれて実行可能なコンピュータプログラムにつき開示する。もちろんこれらの構成は、コンピュータプログラムとしてだけではなく、後述するように、同様な機能を有するプログラムを格納した記録媒体の構成として提供されても良いことは言うまでもない。この場合、コンピュータとは中央演算処理装置の構成を含んだ汎用的なコンピュータの構成の他、特定の処理に向けられた専用機などを含むものであっても良く、中央演算処理装置の構成を伴うものであれば特に限定はない。
コンピュータに上記各処理を実行させるためのこのようなプログラムが、コンピュータに読み出されると、請求項1乃至請求項2に規定された装置構成におけるいずれかの手段で達成されると同様な処理が実行されることになる。
また既存のハードウェア資源を用いてこのコンピュータプログラムを実行することにより、既存のハードウェアで新たなアプリケーションとしての請求項1乃至請求項2に規定したコード名検出装置の構成が容易に実行できるようになる。さらにこのようなコンピュータプログラムが前述の記録媒体に記録されることにより、これをソフトウェア商品として容易に配付、販売することができるようになる。加えて記録媒体の構成としては、上述した形式の場合の他、RAMやROMなどの内部記憶装置の構成やハードディスクなどの外部記憶装置の構成であっても良く、そのようなプログラムがそこに記録されれば、本発明に規定された記録媒体に含まれることは言うまでもない。
尚、後述する請求項3乃至請求項4に記載された各手段のうち一部の処理を実行する機能は、コンピュータに組み込まれた機能(コンピュータにハードウェア的に組み込まれている機能でも良く、該コンピュータに組み込まれているオペレーティングシステムや他のアプリケーションプログラムなどによって実現される機能でも良い)によって実現され、前記プログラムには、該コンピュータによって達成される機能を呼び出すあるいはリンクさせる命令が含まれていても良い。
これは、請求項3乃至請求項4に規定された各手段の一部が、例えばオペレーティングシステムなどによって達成される機能の一部で代行され、その機能を実現するためのプログラム乃至モジュールなどは直接記録されているわけではないが、それらの機能を達成するオペレーティングシステムの機能の一部を、呼び出したりリンクさせるようにしてあれば、実質的に同じ構成となるからである。
上記プログラムは、それ自身使用の対象となる他、後述のように記録媒体に記録されて配付乃至販売され、また通信などにより送信されて、譲渡の対象とすることもできるようになる。
そのうち請求項3の構成は、上記請求項1の構成に対応するものであって、具体的な構成としては、
コンピュータに読み込まれて実行されることにより、該コンピュータを、
音響信号を入力する入力手段と、
入力された音響信号から、所定のフレーム間隔で、FFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求める第1の音階音パワー検出手段と、
この所定のフレーム毎の各音階音のパワーの増分値をすべての音階音について合計して、フレーム毎の全体の音の変化度合いを示すパワーの増分値の合計を求め、このフレーム毎の全体の音の変化度合いを示すパワーの増分値の合計から、平均的なビート間隔と各ビートの位置を検出するビート検出手段と、
このビート毎の各音階音のパワーの平均値を計算し、このビート毎の各音階音の平均パワーの増分値をすべての音階音について合計して、ビート毎の全体の音の変化度合いを示す値を求め、このビート毎の全体の音の変化度合いを示す値から、拍子と小節線位置を検出する小節検出手段と、
上記入力された音響信号から、先のビート検出の時とは異なる別の所定のフレーム間隔で、第1の音階音パワー検出手段におけるFFT演算よりもFFTポイント数を大きくしてFFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求める第2の音階音パワー検出手段と、
各小節幾つかの検出範囲設定し、検出した各音階音のパワーのうち、各検出範囲内の1拍目に相当する部分の低域側の音階音のパワーから各検出範囲のベース音を検出するベース音検出手段と、
検出されたベース音が各検出範囲で異なるか否かによって、ベース音の変化のあるなしを判定し、このベース音の変化があるなしにより小節を複数個に分割することの可否を決定する第1の小節分割決定手段と、
同じく小節幾つかのコード検出区間設定し、主に和音が演奏されている音域として設定されたコード検出音域において、フレーム毎の各音階音のパワーを上記検出区間で平均し、これらの平均された各音階音のパワーをさらに12の音階音毎に積算し、積算した数で割り12の音階音の平均パワーを求め、夫々をパワーの強い順に並べ替えておいて、前後の検出区間で強い音の順位に変化があったかどうかによって、和音の変化のあるなしを判定し、この和音の変化の度合いにより小節を複数個に分割することの可否を決定する第2の小節分割決定手段と、
第1乃至第2の小節分割決定手段により、小節を幾つかのコード検出範囲に分割する必要があると決定された場合は、ベース音と各コード検出範囲における各音階音のパワーから、また小節を分割する必要がないと決定された場合は、ベース音とその小節の各音階音のパワーから、各コード検出範囲又はその小節におけるコード名を決定するコード名決定手段と
として機能させることを特徴とするコード名検出用プログラムである。
また請求項4の構成は、上記請求項2の構成に対応するコード名検出用コンピュータプログラムであって、具体的な構成としては、
コンピュータに読み込まれて実行されることにより、該コンピュータを、
音響信号を入力する入力手段と、
入力された音響信号から、所定のフレーム間隔で、FFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求める第1の音階音パワー検出手段と、
この所定のフレーム毎の各音階音のパワーの増分値をすべての音階音について合計して、フレーム毎の全体の音の変化度合いを示すパワーの増分値の合計を求め、このフレーム毎の全体の音の変化度合いを示すパワーの増分値の合計から、平均的なビート間隔と各ビートの位置を検出するビート検出手段と、
このビート毎の各音階音のパワーの平均値を計算し、このビート毎の各音階音の平均パワーの増分値をすべての音階音について合計して、ビート毎の全体の音の変化度合いを示す値を求め、このビート毎の全体の音の変化度合いを示す値から、拍子と小節線位置を検出する小節検出手段と、
上記入力された音響信号から、先のビート検出の時とは異なる別の所定のフレーム間隔で、第1の音階音パワー検出手段におけるFFT演算よりもFFTポイント数を大きくしてFFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求める第2の音階音パワー検出手段と、
各小節幾つかの検出範囲設定し、検出した各音階音のパワーのうち、各検出範囲内の1拍目に相当する部分の低域側の音階音のパワーから各検出範囲のベース音を検出するベース音検出手段と、
検出されたベース音が各検出範囲で異なるか否かによって、ベース音の変化のあるなしを判定し、このベース音の変化があるなしにより小節を複数個に分割することの可否を決定する第1の小節分割決定手段と、
同じく小節幾つかのコード検出区間設定し、主に和音が演奏されている音域として設定されたコード検出音域において、フレーム毎の各音階音のパワーを上記検出区間で平均し、これらの平均された各音階音のパワーをさらに12の音階音毎に積算し、積算した数で割り12の音階音の平均パワーを求め、前後の検出区間において、その12の音階音の平均パワーを12の音階音の平均パワーの最大値が小さい方を基準に正規化し、正規化後の各音階音のパワーのユークリッド距離を計算することによって、和音の変化のあるなしを判定し、この和音の変化の度合いにより小節を複数個に分割することの可否を決定する第2の小節分割決定手段と、
第1乃至第2の小節分割決定手段により、小節を幾つかのコード検出範囲に分割する必要があると決定された場合は、ベース音と各コード検出範囲における各音階音のパワーから、また小節を分割する必要がないと決定された場合は、ベース音とその小節の各音階音のパワーから、各コード検出範囲又はその小節におけるコード名を決定するコード名決定手段と
として機能させることを特徴とするコード名検出用プログラムである。
本発明の請求項1〜請求項4記載のコード名検出装置及びコード名検出用プログラムによれば、小節内で例えば同じベース音を持つ同士のコード変化がある場合でも正しいコードが検出出来るという優れた効果を奏し得るようになる。
以下、本発明の実施の形態を図示例と共に説明する。
図1は、本出願人の先の出願でその実施例構成として示したテンポ検出装置の全体ブロック図である。同図によれば、本テンポ検出装置の構成は、音響信号を入力する入力部1と、入力された音響信号から、所定の時間間隔(フレーム)で、FFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求める音階音パワー検出部2と、このフレーム毎の各音階音のパワーの増分値をすべての音階音について合計して、フレーム毎の全体の音の変化度合いを示すパワーの増分値の合計を求め、このフレーム毎の全体の音の変化度合いを示すパワーの増分値の合計から、平均的なビート間隔と各ビートの位置を検出するビート検出部3と、このビート毎の各音階音のパワーの平均値を計算し、このビート毎の各音階音の平均パワーの増分値をすべての音階音について合計して、ビート毎の全体の音の変化度合いを示す値を求め、このビート毎の全体の音の変化度合いを示す値から、拍子と小節線位置を検出する小節検出部4とを有している。
音楽音響信号を入力する上記入力部1は、テンポ検出をする対象の音楽音響信号を入力する部分である。マイク等の機器から入力されたアナログ信号をA/D変換器(図示無し)によりディジタル信号に変換しても良いし、音楽CDなどのディジタル化された音楽データの場合は、そのままファイルとして取り込み(リッピング)、これを指定して開くようにしても良い。このようにして入力したディジタル信号がステレオの場合、後の処理を簡略化するためにモノラルに変換する。
このディジタル信号は、音階音パワー検出部2に入力される。この音階音パワー検出部は、図2の各部から構成される。
そのうち波形前処理部20は、音楽音響信号の上記入力部1からの音響信号を今後の処理に適したサンプリング周波数にダウンサンプリングする構成である。
ダウンサンプリングレートは、ビート検出に使う楽器の音域によって決定する。すなわち、シンバル、ハイハット等の高音域のリズム楽器の演奏音をビート検出に反映させるには、ダウンサンプリング後のサンプリング周波数を高い周波数にする必要があるが、ベース音とバスドラム、スネアドラム等の楽器音と中音域の楽器音から主にビート検出させる場合には、ダウンサンプリング後のサンプリング周波数はそれほど高くする必要はない。
例えば検出する最高音をA6(C4が中央のド)とする場合、A6の基本周波数は約1760Hz(A4=440Hzとした場合)となるので、ダウンサンプリング後のサンプリング周波数は、ナイキスト周波数が1760Hz以上となる、3520Hz以上にすれば良い。これから、ダウンサンプリングレートは、元のサンプリング周波数が44.1kHz(音楽CD)の場合、1/12程度にすれば良いことになる。この時、ダウンサンプリング後のサンプリング周波数は、3675Hzとなる。
ダウンサンプリングの処理は、通常、ダウンサンプリング後のサンプリング周波数の半分の周波数であるナイキスト周波数(今の例では1837.5Hz)以上の成分をカットするローパスフィルタを通した後に、データを読み飛ばす(今の例では波形サンプルの12個に11個を破棄する)ことによって行われる。
このようにダウンサンプリングの処理を行うのは、この後のFFT演算において、同じ周波数分解能を得るために必要なFFTポイント数を下げることで、FFTの演算時間を減らすのが目的である。
なお、音楽CDのように、音源が固定のサンプリング周波数で既にサンプリングされている場合は、このようなダウンサンプリングが必要になるが、音楽音響信号の入力部1が、マイク等の機器から入力されたアナログ信号をA/D変換器によりディジタル信号に変換するような場合には、当然A/D変換器のサンプリング周波数を、ダウンサンプリング後のサンプリング周波数に設定することで、この波形前処理部を省くことが可能である。
このようにして波形前処理部20によるダウンサンプリングが終了したら、所定の時間間隔(フレーム)で、波形前処理部の出力信号を、FFT演算部21によりFFT(高速フーリエ変換)する。
FFTのパラメータ(FFTポイント数とFFT窓のシフト量)は、ビート検出に適した値とする。つまり、周波数分解能を上げるためにFFTポイント数を大きくすると、FFT窓のサイズが大きくなってしまい、より長い時間から1回のFFTを行うことになり、時間分解能が低下する、というFFTの特性を考慮しなくてはならない(つまりビート検出時は周波数分解能を犠牲にして時間分解能をあげるのが良い)。窓のサイズと同じだけの長さの波形を使わないで、窓の一部だけに波形データをセットし残りは0で埋めることによって、FFTポイント数を大きくしても時間分解能が悪くならない方法もあるが、低音側のパワーも正しく検出するためには、ある程度の波形サンプル数は必要である。
以上のようなことを考慮し、本実施例では、FFTポイント数512、窓のシフトは32サンプル(窓のオーバーラップは15/16)で、0埋めなしという設定にした。このような設定でFFT演算を行うと、時間分解能約8.7ms、周波数分解能約7.2Hzとなる。時間分解能約8.7msという値は、四分音符=300のテンポの曲で、32分音符の長さが、25msであることを考えると、十分な値であることがわかる。
このようにして、フレーム毎にFFT演算が行われ、その実数部と虚数部のそれぞれを二乗したものの和の平方根からパワーが計算され、その結果がパワー検出部22に送られる。
パワー検出部22では、FFT演算部21で計算されたパワー・スペクトルから、各音階音のパワーを計算する。FFTは、サンプリング周波数をFFTポイント数で割った値の整数倍の周波数のパワーが計算されるだけであるので、このパワー・スペクトルから各音階音のパワーを検出するために、以下のような処理を行う。つまり、音階音を計算するすべての音(C1からA6)について、その各音の基本周波数の上下50セントの範囲(100セントが半音)の周波数に相当するパワー・スペクトルの内、最大のパワーを持つスペクトルのパワーをこの音階音のパワーとする。
すべての音階音についてパワーが検出されたら、これをバッファに保存し、波形の読み出し位置を所定の時間間隔(1フレーム;先の例では32サンプル)進めて、FFT演算部21とパワー検出部22を波形の終わりまで繰り返す。
以上により、音楽音響信号の入力部1に入力された音響信号の、所定時間毎の各音階音のパワーが、バッファ23に保存される。
次に、図1のビート検出部3の構成について説明する。該ビート検出部3は、図3のような処理の流れで実行される。
ビート検出部3は、音階音パワー検出部が出力した1フレーム毎の各音階音のパワーの変化を元に平均的なビート(拍)間隔(つまりテンポ)とビートの位置を検出する。そのために、まずビート検出部3は、各音階音のパワー増分値の合計(前のフレームとのパワーの増分値をすべての音階音で合計したもの。前のフレームからパワーが減少している場合は0として加算する)を計算する(ステップS100)。
つまり、フレーム時間tにおけるi番目の音階音のパワーをL(t)とするとき、i番目の音階音のパワー増分値Laddi(t)は、下式数1に示すようになり、このLaddi(t)を使って、フレーム時間tにおける各音階音のパワー増分値の合計L(t)は、下式数2で計算できる。ここで、Tは音階音の総数である。
Figure 0004823804
Figure 0004823804
この合計L(t)値は、フレーム毎の全体での音の変化度合いを表している。この値は、音の鳴り始めで急激に大きくなり、同時に鳴り始める音が多いほど大きな値となる。音楽はビートの位置で音が鳴り始めることが多いので、この値が大きなところはビートの位置である可能性が高いことになる。
例として、図4に、ある曲の一部分の波形と各音階音のパワー、各音階音のパワー増分値の合計の図を示す。上段が波形、中央がフレーム毎の各音階音のパワーを濃淡で表したもの(下が低い音、上が高い音。この図では、C1からA6の範囲)、下段がフレーム毎の各音階音のパワー増分値の合計を示している。この図の各音階音のパワーは、音階音パワー検出部から出力されたものであるので、周波数分解能が約7.2Hzであり、G#2以下の一部の音階音でパワーが計算できずに歯抜け状態になっているが、この場合はビートを検出するのが目的であるので、低音の一部の音階音のパワーが測定できないのは、問題ない。
この図の下段に見られるように、各音階音のパワー増分値の合計は、定期的にピークをもつ形となっている。この定期的なピークの位置が、ビートの位置である。
ビートの位置を求めるために、ビート検出部3では、まずこの定期的なピークの間隔、つまり平均的なビート間隔を求める。平均的なビート間隔はこの各音階音のパワー増分値の合計の自己相関から計算できる(図3;ステップS102)。
あるフレーム時間tにおける各音階音のパワー増分値の合計をL(t)とすると、この自己相関φ(τ)は、以下の式数3で計算される。
Figure 0004823804
ここで、Nは総フレーム数、τは時間遅れである。
自己相関計算の概念図を、図5に示す。この図のように、時間遅れτがL(t)のピークの周期の整数倍の時に、φ(τ)は大きな値となる。よって、ある範囲のτについてφ(τ)の最大値を求めれば、曲のテンポを求めることができる。
自己相関を求めるτの範囲は、想定する曲のテンポ範囲によって変えれば良い。例えば、メトロノーム記号で四分音符=30から300の範囲を計算するならば、自己相関を計算する範囲は、0.2秒から2秒となる。時間(秒)からフレームへの変換式は、以下の数4式に示す通りとなる。
Figure 0004823804
この範囲の自己相関φ(τ)が最大となるτをビート間隔としても良いが、必ずしも全ての曲で自己相関が最大となる時のτがビート間隔とはならないので、自己相関が極大値となる時のτからビート間隔の候補を求め(図3;ステップS104)、これら複数の候補からユーザにビート間隔を決定させるのが良い(図3;ステップS106)。
このようにしてビート間隔が決定したら(決定したビート間隔をτmaxとする)、まず最初に先頭のビート位置を決定する。
先頭のビート位置の決定方法を、図6を用いて説明する。図6の上段はフレーム時間tにおける各音階音のパワー増分値の合計L(t)で、下段M(t)は決定したビート間隔τmaxの周期で値を持つ関数である。式で表すと、下式数5に示すようになる。
Figure 0004823804
この関数M(t)を、0からτmax−1の範囲でずらしながら、L(t)とM(t)の相互相関を計算する。
相互相関r(s)は、上記M(t)の特性から、下式数6で計算できる。
Figure 0004823804
この場合のnは、最初の無音部分の長さに応じて適当に決めれば良い(図6の例では、n=10)。
r(s)をsが0からτmax−1の範囲で求め、r(s)が最大となるsを求めれば、このsのフレームが最初のビート位置である。
最初のビート位置が決まったら、それ以降のビートの位置を1つずつ決定していく(図3;ステップS108)。
その方法を、図7を用いて説明する。図7の三角印の位置に先頭のビートが見つかったとする。2番目のビート位置は、この先頭のビート位置からビート間隔τmaxだけ離れた位置を仮のビート位置とし、その近辺でL(t)とM(t)が最も相関が取れる位置から決定する。つまり、先頭のビート位置をbとするとき、以下の式のr(s)が最大となるようなsの値を求める。この式のsは仮のビート位置からのずれで、以下の式数7の範囲の整数とする。Fは揺らぎのパラメータで0.1程度の値が適当であるが、テンポの揺らぎの大きい曲では、もっと大きな値にしてもよい。nは5程度で良い。
kは、sの値に応じて変える係数で、例えば図8のような正規分布とする。
Figure 0004823804
r(s)が最大となるようなsの値が求まれば、2番目のビート位置bは、下式数8で計算される。
Figure 0004823804
以降、同じようにして3番目以降のビート位置も求めることができる。
テンポがほとんど変わらない曲ではこの方法でビート位置を曲の終わりまで求めることができるが、実際の演奏は多少テンポが揺らいだり、部分的にだんだん遅くなったりすることがよくある。
そこで、これらのテンポの揺らぎにも対応できるように以下のような方法を考えた。
つまり、図7のM(t)の関数を、図9のように変化させるものである。
1)は、従来の方法で、図のように各パルスの間隔をτ1、τ2、τ3、τ4としたとき、
τ1=τ2=τ3=τ4=τmax
である。
2)は、τ1からτ4を均等に大きくしたり小さくしたりするものである。
τ1=τ2=τ3=τ4=τmax+s (-τmax・F≦s≦τmax・F)これにより、急にテンポが変わった場合に対応できる。
3)は、rit.(リタルダンド、だんだん遅く)又は、accel.(アッチェレランド、だんだん速く)に対応したもので、各パルス間隔は、
τ1=τmax
τ2=τmax+1・s
τ3=τmax+2・s (-τmax・F≦s≦τmax・F)
τ4=τmax+4・s
で計算される。
1、2、4の係数は、あくまで例であり、テンポ変化の大きさによって変えてもよい。
4)は、3)のようなrit.やaccel.の場合の、5個のパルスの位置のどこが現在ビートを求めようとしている場所かを変えるものである。
これらをすべて組み合わせて、L(t)とM(t)の相関を計算し、それらの最大からビート位置を決めれば、テンポが揺らぐ曲に対してもビート位置の決定が可能である。なお、2)と3)の場合には、相関を計算するときの係数kの値を、やはりsの値に応じて変えるようにする。
さらに、5個のパルスの大きさは現在すべて同じにしてあるが、ビートを求める位置(図9の仮のビート位置)のパルスのみ大きくしたり、ビートを求める位置から離れるほど値を小さくして、ビートを求める位置の各音階音のパワー増分値の合計を強調するようにしても良い[図9の5)]。
以上のようにして、各ビートの位置が決定したら、この結果をバッファ30に保存すると共に、検出した結果を表示し、ユーザに確認してもらい、間違っている箇所を修正してもらうようにしても良い。
ビート検出結果の確認画面の例を、図10に示す。同図の三角印の位置が検出したビート位置である。
「再生」のボタンを押すと、現在の音楽音響信号が、D/A変換され、スピーカ等から再生される。現在の再生位置は、図のように縦線等の再生位置ポインタで表示されるので、演奏を聞きながら、ビート検出位置の誤りを確認できる。さらに、検出の元波形の再生と同時に、ビート位置のタイミングで例えばメトロノームのような音を再生させるようにすれば、目で確認するだけでなく音でも確認でき、より容易に誤検出を判断できる。このメトロノームの音を再生させる方法としては、例えばMIDI機器等が考えられる。
ビート検出位置の修正は、「ビート位置の修正」ボタンを押して行う。このボタンを押すと、画面に十字のカーソルが現れるので、最初のビート検出が間違っている箇所で正しいビート位置をクリックする。クリックされた場所の少し前(例えばτmaxの半分の位置)から後のビート位置をすべてクリアし、クリックされた場所を、仮のビート位置として、以降のビート位置を再検出する。
次に、拍子および小節の検出について説明する。
これまでの処理で、ビートの位置が確定しているので、今度は、ビート毎の音の変化度合いを求める。ビート毎の音の変化度合いは、音階音パワー検出部2が出力した、フレーム毎の各音階音のパワーから計算する。
j番目のビートのフレーム数をbとし、その前後のビートのフレームをbj−1、bj+1とする時、j番目のビートのビート毎の音の変化度合いは、フレームbj−1からb−1までのフレームの各音階音のパワーの平均とフレームbからbj+1−1までのフレームの各音階音のパワーの平均を計算し、その増分値から各音階音のビート毎の音の変化度合いを求め、それらを全ての音階音で合計して計算することができる。
つまり、フレーム時間tにおけるi番目の音階音のパワーをL(t)とするとき、j番目のビートのi番目の音階音のパワーの平均Lavgi(j)は、下式数9であるから、j番目のビートのi番目の音階音のビート毎の音の変化度合いBaddi(j)は、下式数10に示すようになる。
Figure 0004823804
Figure 0004823804
よって、j番目のビートのビート毎の音の変化度合いB(j)は、下式数11に示すようになる。ここで、Tは音階音の総数である。
Figure 0004823804
図11の最下段は、このビート毎の音の変化度合いである。このビート毎の音の変化度合いから拍子と1拍目の位置を求める。
拍子は、ビート毎の音の変化度合いの自己相関から求める。一般的に音楽は1拍目で音が変わることが多いと考えられるので、このビート毎の音の変化度合いの自己相関から拍子を求めることができる。例えば、下式数12に示す自己相関φ(τ)を求める式から、ビート毎の音の変化度合いB(j)の自己相関φ(τ)を遅れτが、2から4の範囲で求め、自己相関φ(τ)が最大となる遅れτを拍子の数とする。
Figure 0004823804
Nは、総ビート数、τ=2〜4の範囲でφ(τ)を計算し、φ(τ)が最大となるτを拍子の数とする。
次に1拍目を求めるが、これは、ビート毎の音の変化度合いB(j)がもっとも大きい箇所を1拍目とする。つまり、φ(τ)が最大となるτをτmax、下式数13のX(k)が最大となるkをkmaxとするとき、kmax番目のビートが最初の1拍目の位置となり、以降、τmaxを足したビート位置が1拍目となる。
Figure 0004823804
maxは、τmax・n+k<Nの条件で最大となるn
以上のようにして、拍子及び1拍目の位置(小節線の位置)が決定したら、この結果をバッファ40に保存すると共に、検出した結果を画面表示して、ユーザに変更させるようにすることが望ましい。特に変拍子の曲は、この方法では対応できないので、変拍子の箇所をユーザに指定してもらう必要がある。
以上の構成により、人間が演奏したテンポの揺らぐ演奏の音響信号から、曲全体の平均的なテンポと正確なビート(拍)の位置、さらに曲の拍子と1拍目の位置を検出することが可能となる。
図12は、本発明のコード検出装置の全体ブロック図である。同図において、ビート検出及び小節検出の構成は、上記構成と基本的に同じであり、同一構成において、テンポ検出用とコード検出用の構成について、上記構成の場合と異なるものもあるので、数式等を除き、同じ説明が重なるが、以下に示す。
同図によれば、本コード検出装置の構成は、音響信号を入力する入力部1と、入力された音響信号から、所定の時間間隔(フレーム)で、ビート検出に適したパラメータを使ってFFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求めるビート検出用音階音パワー検出部2と、このフレーム毎の各音階音のパワーの増分値をすべての音階音について合計して、フレーム毎の全体の音の変化度合いを示すパワーの増分値の合計を求め、このフレーム毎の全体の音の変化度合いを示すパワーの増分値の合計から、平均的なビート間隔と各ビートの位置を検出するビート検出部3と、このビート毎の各音階音のパワーの平均値を計算し、このビート毎の各音階音の平均パワーの増分値を全ての音階音について合計して、ビート毎の全体の音の変化度合いを示す値を求め、このビート毎の全体の音の変化度合いを示す値から、拍子と小節線位置を検出する小節検出部4と、上記入力された音響信号から、先のビート検出の時とは異なる別の時間間隔(フレーム)で、コード検出に適したパラメータを使ってFFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求めるコード検出用音階音パワー検出部5と、検出した各音階音のパワーのうち、各小節を幾つかの検出範囲に設定し、各検出範囲内の1拍目に相当する部分の低域側の音階音のパワーから各検出範囲のベース音を検出するベース音検出部6と、検出されたベース音が各検出範囲で異なるか否かによって、ベース音の変化のあるなしを判定し、このベース音の変化があるなしにより小節を複数個に分割することの可否を決定する第1の小節分割決定部7と、同じく小節を幾つかのコード検出区間に設定し、主に和音が演奏されている音域として設定されたコード検出音域において、フレーム毎の各音階音のパワーを上記検出区間で平均し、これらの平均された各音階音のパワーをさらに12の音階音毎に積算し、積算した数で割り12の音階音の平均パワーを求め、夫々をパワーの強い順に並べ替えておいて、後続区間の強い音の内上位3以上のM個の音階音がその前の区間の強い音の内上位3以上のN個の音階音に、C個以上含まれるか否かによって、和音の変化のあるなしを判定し、この和音の変化の度合いにより小節を複数個に分割することの可否を決定する第2の小節分割決定部8と、第1乃至第2の小節分割決定部7、8により、小節を幾つかのコード検出範囲に分割する必要があると決定された場合は、ベース音と各コード検出範囲における各音階音のパワーから、また小節を分割する必要がないと決定された場合は、ベース音とその小節の各音階音のパワーから、各コード検出範囲又はその小節におけるコード名を決定するコード名決定部9とを有している。
音楽音響信号を入力する上記入力部1は、コード検出をする対象の音楽音響信号を入力する部分であるが、基本的構成は上記構成の入力部1と同じであるので、その詳細な説明は省略する。ただし、通常センタに定位されるボーカルが後のコード検出でじゃまになる場合は、右チャンネルの波形と左チャンネルの波形を引き算することでボーカルキャンセルするようにしても良い。
このディジタル信号は、ビート検出用音階音パワー検出部2とコード検出用音階音パワー検出部5とに入力される。これらの音階音パワー検出部は、どちらも上記図2の各部から構成され、構成はまったく同じなので、同じものをパラメータだけを変えて再利用できる。
そしてその構成として使用される波形前処理部20は、上記と同様な構成であり、音楽音響信号の上記入力部1からの音響信号を今後の処理に適したサンプリング周波数にダウンサンプリングする。ただし、ダウンサンプリング後のサンプリング周波数、つまり、ダウンサンプリングレートは、ビート検出用とコード検出用で変えるようにしても良いし、ダウンサンプリングする時間を節約するために同じにしても良い。
ビート検出用の場合は、ビート検出に使う音域によってダウンサンプリングレートを決定する。シンバル、ハイハット等の高音域のリズム楽器の演奏音をビート検出に反映させるには、ダウンサンプリング後のサンプリング周波数を高い周波数にする必要があるが、ベース音とバスドラム、スネアドラム等の楽器音と中音域の楽器音から主にビート検出させる場合には、以下のコード検出時と同じダウンサンプリングレートで構わない。
コード検出用の波形前処理部のダウンサンプリングレートは、コード検出音域によって変える。コード検出音域とは、コード名決定部でコード検出する時に使う音域のことである。例えばコード検出音域をC3からA6(C4が中央のド)とする場合、A6の基本周波数は約1760Hz(A4=440Hzとした場合)となるので、ダウンサンプリング後のサンプリング周波数はナイキスト周波数が1760Hz以上となる、3520Hz以上にすれば良い。これから、ダウンサンプリングレートは、元のサンプリング周波数が44.1kHz(音楽CD)の場合、1/12程度にすれば良いことになる。この時、ダウンサンプリング後のサンプリング周波数は、3675Hzとなる。
ダウンサンプリングの処理は、通常、ダウンサンプリング後のサンプリング周波数の半分の周波数であるナイキスト周波数(今の例では1837.5Hz)以上の成分をカットするローパスフィルタを通した後に、データを読み飛ばす(今の例では波形サンプルの12個に11個を破棄する)ことによって行われる。これについては、上記構成に説明したことと同じ理由による。
このようにして波形前処理部20によるダウンサンプリングが終了したら、所定の時間間隔で、波形前処理部の出力信号をFFT演算部21により、FFT(高速フーリエ変換)する。
FFTのパラメータ(FFTポイント数とFFT窓のシフト量)は、ビート検出時とコード検出時で異なる値とする。これは、周波数分解能を上げるためにFFTポイント数を大きくすると、FFT窓のサイズが大きくなってしまい、より長い時間から1回のFFTを行うことになり、時間分解能が低下する、というFFTの特性によるものである(つまりビート検出時は周波数分解能を犠牲にして時間分解能をあげるのが良い)。窓のサイズと同じだけの長さの波形を使わないで、窓の一部だけに波形データをセットし、残りは0で埋めることによってFFTポイント数を大きくしても時間分解能が悪くならない方法もあるが、本実施例のケースでは、低音側のパワーも正しく検出するためにある程度の波形サンプル数は必要である。
以上のようなことを考慮し、本実施例では、ビート検出時は、FFTポイント数512、窓のシフトは32サンプル(窓のオーバーラップは15/16)で、0埋めなしであるが、コード検出時は、FFTポイント数8192、窓のシフトは128サンプル(窓のオーバーラップは63/64)で、波形サンプルは一度のFFTで1024サンプル使うようにした。このような設定でFFT演算を行うと、ビート検出時は、時間分解能約8.7ms、周波数分解能約7.2Hz、コード検出時は、時間分解能約35ms、周波数分解能約0.4Hzとなる。今パワーを求めようとしている音階音は、C1からA6の範囲であるので、コード検出時の周波数分解能約0.4Hzは、最も周波数差の小さいC1とC#1の基本周波数の差、約1.9Hzにも対応できる。また、四分音符=300のテンポの曲で32分音符の長さが25msであることを考えると、ビート検出時の時間分解能約8.7msは、十分な値であることが分かる。
このようにして、フレーム毎にFFT演算が行われ、その実数部と虚数部のそれぞれを二乗したものの和の平方根からパワーが計算され、その結果がパワー検出部22に送られる。
パワー検出部22では、FFT演算部21で計算されたパワー・スペクトルから、各音階音のパワーを計算する。FFTは、サンプリング周波数をFFTポイント数で割った値の整数倍の周波数のパワーが計算されるだけであるので、このパワー・スペクトルから各音階音のパワーを検出するために、上記構成と同様な処理を行う。すなわち、音階音を計算するすべての音(C1からA6)について、その各音の基本周波数の上下50セントの範囲(100セントが半音)の周波数に相当するパワー・スペクトルの内、最大のパワーを持つスペクトルのパワーをこの音階音のパワーとする。
すべての音階音についてパワーが検出されたら、これをバッファに保存し、波形の読み出し位置を所定の時間間隔(1フレーム;先の例ではビート検出時は32サンプル、コード検出時は128サンプル)進めて、FFT演算部21とパワー検出部22を波形の終わりまで繰り返す。
以上により、音楽音響信号の入力部1に入力された音響信号の、フレーム毎の各音階音のパワーが、ビート検出用とコード検出用の2種類のバッファ23及び50に保存される。
次に、図12のビート検出部3及び小節検出部4の構成については、上記構成のビート検出部3及び小節検出部4と同じ構成なので、その詳細な説明は、ここでは、省略する。
上記構成と同様な構成と手順で、小節線の位置(各小節のフレーム番号)が確定したので、今度は各小節のベース音を検出する。
ベース音は、コード検出用音階音パワー検出部5が出力した各フレームの音階音のパワーから検出する。
図13に上記構成の図4と同じ曲の同じ部分のコード検出用音階音パワー検出部5が出力した各フレームの音階音のパワーを示す。この図のように、コード検出用音階音パワー検出部5での周波数分解能は、約0.4Hzであるので、C1からA6のすべての音階音のパワーが抽出されている。
本出願人による先の出願では、ベース音は、小節の前半と後半で異なる可能性があるので、小節を前半と後半の2つに分割し、その夫々でベース音を検出し、別のベース音が検出された場合は、コードも前半と後半に分けて検出するという構成である。しかし、この方法では、ベース音が同じで和音が異なる場合、例えば、小節の前半がCのコードで、後半がCmのコードの場合に、ベース音は同じであるために小節を分割することができず、コードを小節全体で検出してしまうという問題があった。
また、上記出願では、ベース音を検出範囲全体で検出していた。つまり、検出範囲が小節の場合は、小節全体で強い音をベース音としていた。しかし、ジャズのようなベースランニング(ベースが4分音符などで動く)場合には、この方法では正しくベース音を検出することができない。
そのため、本実施例構成では、まず、ベース音検出部6で、ベース音の検出を行うが、検出した各音階音のパワーのうち、各小節を幾つかの検出範囲に設定し、各検出範囲内の1拍目に相当する部分の低域側の音階音のパワーから各検出範囲のベース音を検出する構成とした。これは、上述のように、ベースランニングの場合にも、最初の1拍目はコードのルート音を弾くことが多いことによる。
ベース音は、1拍目の検出範囲内に相当する部分におけるベース検出音域の音階音のパワーの平均的な強さから求める。
フレーム時間tにおけるi番目の音階音のパワーをL(t)とすると、フレームfからfのi番目の音階音の平均的なパワーLavgi(f,f)は、下式数14で計算できる。
Figure 0004823804
この平均的なパワーを、ベース検出音域、例えばC2からB3の範囲で計算し、平均的なパワーが最も大きな音階音をベース音として、ベース音検出部6は、決定する。ベース検出音域に音が含まれない曲や無音部分で間違ってベース音を検出しないために、適当な閾値を設定し、検出したベース音のパワーが、この閾値以下の場合は、ベース音を検出しないようにしても良い。また、後のコード検出でベース音を重要視する場合には、検出したベース音が1拍目のベース検出期間中継続してあるパワー以上を保っているかどうかをチェックするようにして、より確実なものだけをベース音として検出するようにしても良い。さらに、ベース検出音域中、平均的なパワーが最も大きい音階音をベース音として決定するのではなく、この各音名の平均的なパワーを12の音名毎に平均し、この音名毎のパワーが最も大きな音名をベース音名として決定し、その音名を持つベース検出音域の中の音階音で、平均的なパワーが最も大きい音階音をベース音として決定するようにしても良い。
ベース音が決定したら、この結果をバッファ60に保存すると共に、ベース検出結果を画面表示して、間違っている場合にはユーザに修正させるようにしても良い。また、曲によってベース音域が変わることも考えられるので、ユーザがベース検出音域を変更できるようにしても良い。
図14に、ベース音検出部6によるベース検出結果の表示例を示す。
次に第1の小節分割決定部7により、検出されたベース音が各検出範囲で異なるか否かによって、ベース音の変化のあるなしを判定し、このベース音の変化があるなしにより小節を複数個に分割することの可否を決定する。すなわち、検出されたベース音が各検出範囲で同じであれば、その小節を分割する必要はないと決定する。また検出されたベース音が各検出範囲で異なれば、その小節を分割する必要があると決定する。この場合、さらに夫々の半分がさらに分割する必要があるか否かを繰り返し判断するようにしても良い。
他方第2の小節分割決定部8の構成では、まず、コード検出音域を設定する。これは、主に和音が演奏されている音域で、例えば、C3〜E6(C4が中央のド)とする。
このコード検出音域のフレーム毎の各音階音のパワーを、小節の半分等の検出区間で平均する。平均された各音階音のパワーをさらに12の音階音(C、C#、D、D#、…、B)毎に積算し、積算した数で割り、12の音階音の平均パワーを求める。
小節の前半と後半で、このコード検出音域の12の音階音の平均パワーを求め、夫々を強い順に並べ替えておく。
上記図15(a)(b)に示すように、後半の強い音の内、例えば上位3つ(この数をMとする)が、前半の例えば上位3つ(この数をNとする)に含まれているかどうかを調べ、その数以上含まれるか否かによって、和音の変化のあるなしを判定する。この判定により、第2の小節分割決定部8は、この和音の変化の度合いを判定し、それによって、小節を複数個に分割することの可否を決定する。
含まれている数が例えば3つ(この数をCとする)以上の場合(即ちすべて含まれる)には、小節の前半と後半で和音の変化は無いと判断し、和音の変化度合いによる小節の分割は行わないと、第2の小節分割決定部8では決定する。
第2の小節分割決定部8におけるこのM、N、Cの値を適当に設定することにより、この和音の変化度合いによる小節分割の強さを変えることができる。先の例の全て3では、かなりシビアに和音の変化をチェックするが、例えば、M=3、N=6、C=3(後半の上位3つの音が前半の上位6つに全て含まれるかどうか)にすれば、ある程度似た響きであれば、同じ和音であると判断する。
先に4拍子の場合、前半と後半を夫々更に半分に分割して小節全体を4分割することを述べたが、前半と後半の分割判断では、M=3、N=3、C=3とし、前半と後半を更に半分に分割するかどうかの判断では、M=3、N=6、C=3とすることで、実際の一般的な音楽に適合したより正しい判断を行うことができる。
コード名決定部9は、第1乃至第2の小節分割決定部7又は8によって、小節を幾つかのコード検出範囲に分割する必要があると決定された場合は、ベース音と各コード検出範囲における各音階音のパワーから、また小節を分割する必要がないと決定された場合は、ベース音とその小節の各音階音のパワーから、各コード検出範囲又はその小節におけるコード名を決定する構成である。
コード名決定部9による実際のコード名の決定は以下のようにして行われる。本実施例では、コード検出期間とベース検出期間は同一としている。コード検出音域、例えばC3からA6の各音階音のコード検出期間における平均的なパワーを計算し、これが大きな値を持つ音階音から順に数個の音名を検出し、これとベース音の音名からコード名候補を抽出する。
この際、必ずしもパワーが大きな音がコード構成音であるとは限らないので、複数の音名の音を例えば5つ検出し、その中の2つ以上を全ての組み合わせで抜き出して、これとベース音の音名とからコード名候補の抽出を行う。
コードに関しても、平均的なパワーが閾値以下のものは検出しないようにしても良い。また、コード検出音域もユーザが変更できるようにしても良い。さらに、コード検出音域中、平均的なパワーが最も大きい音階音から順にコード構成音候補を抽出するのではなく、このコード検出音域内の各音名の平均的なパワーを12の音名毎に平均し、この音名毎のパワーの最も大きな音名から順にコード構成音候補を抽出しても良い。
コード名候補の抽出は、コードのタイプ(m、M7等)とコード構成音のルート音からの音程を保存したコード名データベースを、コード名決定部9により検索することによって抽出する。つまり、検出した5つの音名の中から全ての2つ以上の組み合わせを抜き出し、これらの音名間の音程が、このコード名データベースのコード構成音の音程の関係にあるかどうかをしらみつぶしに調べ、同じ音程関係にあれば、コード構成音のいずれかの音名からルート音を算出し、そのルート音の音名にコードタイプを付けて、コード名を決定する。この時、コードのルート音(根音)や5度の音は、コードを演奏する楽器では省略されることがあるので、これらを含まなくてもコード名候補として抽出するようにする。ベース音を検出した場合には、このコード名候補のコード名にベース音の音名を加える。すなわち、コードのルート音とベース音が同じ音名であればそのままで良いし、異なる音名の場合は分数コードとする。
上記方法では、抽出されるコード名候補が多過ぎるという場合には、ベース音による限定を行っても良い。つまり、ベース音が検出された場合には、コード名候補の中でそのルート音がベース音と同じ音名でないものは削除する。
コード名候補が複数抽出された場合には、これらの中でどれか1つを決定するために、コード名決定部9により、尤度(もっともらしさ)の計算をする。
尤度は、コード検出音域における全てのコード構成音のパワーの強さの平均とベース検出音域におけるコードのルート音のパワーの強さから計算する。すなわち、抽出されたあるコード名候補の全ての構成音のコード検出期間における平均パワーの平均値をLavgc、コードのルート音のベース検出期間における平均パワーをLavgrとすると、下式数15のように、この2つの平均により尤度を計算する。尤度を計算する別の方法としては、コード検出音域におけるコードトーン(コード構成音)とノンコードトーン(コード構成音以外の音)の(平均的な)パワーの比を用いても良い。
Figure 0004823804
この際、コード検出音域やベース検出音域に同一音名の音が複数含まれる場合には、それらのうち、平均パワーの強い方を使うようにする。あるいは、コード検出音域とベース検出音域の夫々で、各音階音の平均パワーを12の音名毎に平均し、その音名毎の平均値を使うようにしても良い。
さらに、この尤度の計算に音楽的な知識を導入しても良い。例えば、各音階音のパワーを全フレームで平均し、それを12の音名毎に平均して各音名の強さを計算し、その強さの分布から曲の調を検出する。そして、調のダイアトニックコードには尤度が大きくなるようにある定数を掛ける、或いは、調のダイアトニックスケール上の音から外れた音を構成音に含むコードはその外れた音の数に応じて尤度が小さくなるようにする等が、考えられる。さらにコード進行のよくあるパターンをデータベースとして記憶しておき、それと比較することで、コード候補の中からよく使われる進行になるようなものは尤度が大きくなるようにある定数を掛けるようにしても良い。
最も尤度が大きいものをコード名として決定するが、コード名の候補を尤度とともに表示し、ユーザに選択させるようにしても良い。
いずれにしても、コード名決定部9により、コード名が決定したら、この結果をバッファ90に保存すると共に、コード名が、画面出力されることになる。
図16に、コード名決定部9によるコード検出結果の表示例を示す。このように検出されたコード名を画面表示するだけでなく、MIDI機器等を使って、検出されたコードとベース音を再生するようにすることが望ましい。一般的には、コード名を見ただけで正しいかどうかは判断できないからである。
以上説明した本実施例構成によれば、特別な音楽的知識を有する専門家でなくても、音楽CD等の複数の楽器音の混ざった入力された音楽音響信号に対し、個々の音符情報を検出することなしに全体の響きから、コード名を検出することができるようになる。
さらに、該構成によれば、構成音が同じ和音でも判別可能で、演奏のテンポが揺らいでしまった場合や、逆にわざとテンポを揺らして演奏しているような音源に関しても、小節毎のコード名が検出可能となる。
特に本実施例構成では、ベース音のみではなく、和音の変化度合いに応じても小節を分割するようにして、コードを検出しているため、ベース音が同じ場合でも、和音の変化度合いが大きい場合には、小節を分割してコードが検出されることになる。すなわち、小節内で例えば同じベース音を持つ同士のコード変化がある場合でも正しいコードが検出出来るようになる。この小節の分割については、ベース音の変化の度合い、和音の変化度合いに応じて、様々に分割することが可能である。
本実施例構成は、実施例1の構成とは異なり、各音階音のパワーのユークリッド距離を計算するという構成により、和音の変化の度合いを感知し、小節を分割してコードを検出するというものである。
ただし、この場合、単純にユークリッド距離を計算したのでは、急激な音の立ち上がり(曲の始まりなど)や急激な音の減衰(曲の終わり、ブレークなど)で、ユークリッド距離が大きな値となり、和音の変化は無いのに音の強弱だけで小節を分割してしまう恐れがある。そこで、ユークリッド距離を計算する前に、図17に示すように、各音階音のパワーを正規化するようにする[図17(a)は同図(c)のように、また図17(b)は同図(d)のように正規化する]。その際、大きい方に合わせるのではなく、小さい方に合わせるようにすれば[図17(a)〜(d)参照]、急激な音の変化ではユークリッド距離が小さくなり、誤って小節分割することは無くなる。
上記各音階音のパワーのユークリッド距離は、上述した数16式で計算される。このユークリッド距離が、例えば全フレーム全音のパワーの平均を上回る場合は、上記第1の小節分割決定部7により小節を分割することを決定することになる。
さらに、詳しくは、(ユークリッド距離>全フレーム全音のパワーの平均×T)の時、小節を分割するようにすれば良い。該式の値Tを変えれば、小節分割の閾値を任意の値に変える(調整する)ことができる。
尚、本発明のコード名検出装置及びコード名検出用プログラムは、上述の図示例にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
本発明のコード名検出装置及びコード名検出用プログラムは、ミュージックプロモーションビデオの作成の際などに音楽トラック中のビートの時刻に対して映像トラック中のイベントを同期させるビデオ編集処理や、ビートトラッキングによりビートの位置を見つけ音楽の音響信号の波形を切り貼りするオーディオ編集処理、人間の演奏に同期して照明の色・明るさ・方向・特殊効果などといった要素を制御したり、観客の手拍子や歓声などを自動制御するライブステージのイベント制御、音楽に同期したコンピュータグラフィックスなど、種々の分野で利用可能である。
前出願のテンポ検出装置の全体ブロック図である。 音階音パワー検出部2の構成のブロック図である。 ビート検出部3の処理の流れを示すフローチャートである。 ある曲の一部分の波形と各音階音のパワー、各音階音のパワー増分値の合計の図を示すグラフである。 自己相関計算の概念を示す説明図である。 先頭のビート位置の決定方法を説明する説明図である。 最初のビート位置決定後のそれ以降のビートの位置を決定していく方法を示す説明図である。 sの値に応じて変えられる係数kの分布状態を示すグラフである。 2番目以降のビート位置の決定方法を示す説明図である。 ビート検出結果の確認画面の例を示す画面表示図である。 小節検出結果の確認画面の例を示す画面表示図である。 本実施例1に係る本発明のコード検出装置の全体ブロック図である。 曲の同じ部分のコード検出用音階音パワー検出部5が出力した各フレームの音階音のパワーを示すグラフである。 ベース音検出部6によるベース検出結果の表示例を示すグラフである。 小節前半及び後半の各音階音のパワーの状態を示す各音階音パワー模式図である。 コード検出結果の確認画面の例を示す画面表示図である。 請求項2に係る第2の小節分割決定手段における各音階音のパワーのユークリッド距離の計算方法の概略を示す説明図である。
符号の説明
1 入力部
2 ビート検出用音階音パワー検出部
3 ビート検出部
4 小節検出部
5 コード検出用音階音パワー検出部
6 ベース音検出部
7 第1の小節分割決定部
8 第2の小節分割決定部
9 コード名決定部
20 波形前処理部
21 FFT演算部
22 パワー検出部
23、30、40、50、60、90 バッファ

Claims (4)

  1. 音響信号を入力する入力手段と、
    入力された音響信号から、所定のフレーム間隔で、FFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求める第1の音階音パワー検出手段と、
    この所定のフレーム毎の各音階音のパワーの増分値をすべての音階音について合計して、フレーム毎の全体の音の変化度合いを示すパワーの増分値の合計を求め、このフレーム毎の全体の音の変化度合いを示すパワーの増分値の合計から、平均的なビート間隔と各ビートの位置を検出するビート検出手段と、
    このビート毎の各音階音のパワーの平均値を計算し、このビート毎の各音階音の平均パワーの増分値をすべての音階音について合計して、ビート毎の全体の音の変化度合いを示す値を求め、このビート毎の全体の音の変化度合いを示す値から、拍子と小節線位置を検出する小節検出手段と、
    上記入力された音響信号から、先のビート検出の時とは異なる別の所定のフレーム間隔で、第1の音階音パワー検出手段におけるFFT演算よりもFFTポイント数を大きくしてFFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求める第2の音階音パワー検出手段と、
    各小節幾つかの検出範囲設定し、検出した各音階音のパワーのうち、各検出範囲内の1拍目に相当する部分の低域側の音階音のパワーから各検出範囲のベース音を検出するベース音検出手段と、
    検出されたベース音が各検出範囲で異なるか否かによって、ベース音の変化のあるなしを判定し、このベース音の変化があるなしにより小節を複数個に分割することの可否を決定する第1の小節分割決定手段と、
    同じく小節幾つかのコード検出区間設定し、主に和音が演奏されている音域として設定されたコード検出音域において、フレーム毎の各音階音のパワーを上記検出区間で平均し、これらの平均された各音階音のパワーをさらに12の音階音毎に積算し、積算した数で割り12の音階音の平均パワーを求め、夫々をパワーの強い順に並べ替えておいて、前後の検出区間で強い音の順位に変化があったかどうかによって、和音の変化のあるなしを判定し、この和音の変化の度合いにより小節を複数個に分割することの可否を決定する第2の小節分割決定手段と、
    第1乃至第2の小節分割決定手段により、小節を幾つかのコード検出範囲に分割する必要があると決定された場合は、ベース音と各コード検出範囲における各音階音のパワーから、また小節を分割する必要がないと決定された場合は、ベース音とその小節の各音階音のパワーから、各コード検出範囲又はその小節におけるコード名を決定するコード名決定手段と
    を有することを特徴とするコード名検出装置。
  2. 音響信号を入力する入力手段と、
    入力された音響信号から、所定のフレーム間隔で、FFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求める第1の音階音パワー検出手段と、
    この所定のフレーム毎の各音階音のパワーの増分値をすべての音階音について合計して、フレーム毎の全体の音の変化度合いを示すパワーの増分値の合計を求め、このフレーム毎の全体の音の変化度合いを示すパワーの増分値の合計から、平均的なビート間隔と各ビートの位置を検出するビート検出手段と、
    このビート毎の各音階音のパワーの平均値を計算し、このビート毎の各音階音の平均パワーの増分値をすべての音階音について合計して、ビート毎の全体の音の変化度合いを示す値を求め、このビート毎の全体の音の変化度合いを示す値から、拍子と小節線位置を検出する小節検出手段と、
    上記入力された音響信号から、先のビート検出の時とは異なる別の所定のフレーム間隔で、第1の音階音パワー検出手段におけるFFT演算よりもFFTポイント数を大きくしてFFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求める第2の音階音パワー検出手段と、
    各小節幾つかの検出範囲設定し、検出した各音階音のパワーのうち、各検出範囲内の1拍目に相当する部分の低域側の音階音のパワーから各検出範囲のベース音を検出するベース音検出手段と、
    検出されたベース音が各検出範囲で異なるか否かによって、ベース音の変化のあるなしを判定し、このベース音の変化があるなしにより小節を複数個に分割することの可否を決定する第1の小節分割決定手段と、
    同じく小節幾つかのコード検出区間設定し、主に和音が演奏されている音域として設定されたコード検出音域において、フレーム毎の各音階音のパワーを上記検出区間で平均し、これらの平均された各音階音のパワーをさらに12の音階音毎に積算し、積算した数で割り12の音階音の平均パワーを求め、前後の検出区間において、その12の音階音の平均パワーを12の音階音の平均パワーの最大値が小さい方を基準に正規化し、正規化後の各音階音のパワーのユークリッド距離を計算することによって、和音の変化のあるなしを判定し、この和音の変化の度合いにより小節を複数個に分割することの可否を決定する第2の小節分割決定手段と、
    第1乃至第2の小節分割決定手段により、小節を幾つかのコード検出範囲に分割する必要があると決定された場合は、ベース音と各コード検出範囲における各音階音のパワーから、また小節を分割する必要がないと決定された場合は、ベース音とその小節の各音階音のパワーから、各コード検出範囲又はその小節におけるコード名を決定するコード名決定手段と
    を有することを特徴とするコード名検出装置。
  3. コンピュータに読み込まれて実行されることにより、該コンピュータを、
    音響信号を入力する入力手段と、
    入力された音響信号から、所定のフレーム間隔で、FFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求める第1の音階音パワー検出手段と、
    この所定のフレーム毎の各音階音のパワーの増分値をすべての音階音について合計して、フレーム毎の全体の音の変化度合いを示すパワーの増分値の合計を求め、このフレーム毎の全体の音の変化度合いを示すパワーの増分値の合計から、平均的なビート間隔と各ビートの位置を検出するビート検出手段と、
    このビート毎の各音階音のパワーの平均値を計算し、このビート毎の各音階音の平均パワーの増分値をすべての音階音について合計して、ビート毎の全体の音の変化度合いを示す値を求め、このビート毎の全体の音の変化度合いを示す値から、拍子と小節線位置を検出する小節検出手段と、
    上記入力された音響信号から、先のビート検出の時とは異なる別の所定のフレーム間隔で、第1の音階音パワー検出手段におけるFFT演算よりもFFTポイント数を大きくしてFFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求める第2の音階音パワー検出手段と、
    各小節幾つかの検出範囲設定し、検出した各音階音のパワーのうち、各検出範囲内の1拍目に相当する部分の低域側の音階音のパワーから各検出範囲のベース音を検出するベース音検出手段と、
    検出されたベース音が各検出範囲で異なるか否かによって、ベース音の変化のあるなしを判定し、このベース音の変化があるなしにより小節を複数個に分割することの可否を決定する第1の小節分割決定手段と、
    同じく小節幾つかのコード検出区間設定し、主に和音が演奏されている音域として設定されたコード検出音域において、フレーム毎の各音階音のパワーを上記検出区間で平均し、これらの平均された各音階音のパワーをさらに12の音階音毎に積算し、積算した数で割り12の音階音の平均パワーを求め、夫々をパワーの強い順に並べ替えておいて、前後の検出区間で強い音の順位に変化があったかどうかによって、和音の変化のあるなしを判定し、この和音の変化の度合いにより小節を複数個に分割することの可否を決定する第2の小節分割決定手段と、
    第1乃至第2の小節分割決定手段により、小節を幾つかのコード検出範囲に分割する必要があると決定された場合は、ベース音と各コード検出範囲における各音階音のパワーから、また小節を分割する必要がないと決定された場合は、ベース音とその小節の各音階音のパワーから、各コード検出範囲又はその小節におけるコード名を決定するコード名決定手段と
    として機能させることを特徴とするコード名検出用プログラム。
  4. コンピュータに読み込まれて実行されることにより、該コンピュータを、
    音響信号を入力する入力手段と、
    入力された音響信号から、所定のフレーム間隔で、FFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求める第1の音階音パワー検出手段と、
    この所定のフレーム毎の各音階音のパワーの増分値をすべての音階音について合計して、フレーム毎の全体の音の変化度合いを示すパワーの増分値の合計を求め、このフレーム毎の全体の音の変化度合いを示すパワーの増分値の合計から、平均的なビート間隔と各ビートの位置を検出するビート検出手段と、
    このビート毎の各音階音のパワーの平均値を計算し、このビート毎の各音階音の平均パワーの増分値をすべての音階音について合計して、ビート毎の全体の音の変化度合いを示す値を求め、このビート毎の全体の音の変化度合いを示す値から、拍子と小節線位置を検出する小節検出手段と、
    上記入力された音響信号から、先のビート検出の時とは異なる別の所定のフレーム間隔で、第1の音階音パワー検出手段におけるFFT演算よりもFFTポイント数を大きくしてFFT演算を行い、求められたパワースペクトルからフレーム毎の各音階音のパワーを求める第2の音階音パワー検出手段と、
    各小節幾つかの検出範囲設定し、検出した各音階音のパワーのうち、各検出範囲内の1拍目に相当する部分の低域側の音階音のパワーから各検出範囲のベース音を検出するベース音検出手段と、
    検出されたベース音が各検出範囲で異なるか否かによって、ベース音の変化のあるなしを判定し、このベース音の変化があるなしにより小節を複数個に分割することの可否を決定する第1の小節分割決定手段と、
    同じく小節幾つかのコード検出区間設定し、主に和音が演奏されている音域として設定されたコード検出音域において、フレーム毎の各音階音のパワーを上記検出区間で平均し、これらの平均された各音階音のパワーをさらに12の音階音毎に積算し、積算した数で割り12の音階音の平均パワーを求め、前後の検出区間において、その12の音階音の平均パワーを12の音階音の平均パワーの最大値が小さい方を基準に正規化し、正規化後の各音階音のパワーのユークリッド距離を計算することによって、和音の変化のあるなしを判定し、この和音の変化の度合いにより小節を複数個に分割することの可否を決定する第2の小節分割決定手段と、
    第1乃至第2の小節分割決定手段により、小節を幾つかのコード検出範囲に分割する必要があると決定された場合は、ベース音と各コード検出範囲における各音階音のパワーから、また小節を分割する必要がないと決定された場合は、ベース音とその小節の各音階音のパワーから、各コード検出範囲又はその小節におけるコード名を決定するコード名決定手段と
    として機能させることを特徴とするコード名検出用プログラム。
JP2006216361A 2006-08-09 2006-08-09 コード名検出装置及びコード名検出用プログラム Active JP4823804B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2006216361A JP4823804B2 (ja) 2006-08-09 2006-08-09 コード名検出装置及びコード名検出用プログラム
US11/780,717 US7485797B2 (en) 2006-08-09 2007-07-20 Chord-name detection apparatus and chord-name detection program
DE102007034774A DE102007034774A1 (de) 2006-08-09 2007-07-25 Vorrichtung zur Bestimmung von Akkordnamen und Programm zur Bestimmung von Akkordnamen
CN2007101403349A CN101123085B (zh) 2006-08-09 2007-08-09 和弦名检测装置以及和弦名检测用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006216361A JP4823804B2 (ja) 2006-08-09 2006-08-09 コード名検出装置及びコード名検出用プログラム

Publications (3)

Publication Number Publication Date
JP2008040283A JP2008040283A (ja) 2008-02-21
JP2008040283A5 JP2008040283A5 (ja) 2008-08-14
JP4823804B2 true JP4823804B2 (ja) 2011-11-24

Family

ID=39049278

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006216361A Active JP4823804B2 (ja) 2006-08-09 2006-08-09 コード名検出装置及びコード名検出用プログラム

Country Status (4)

Country Link
US (1) US7485797B2 (ja)
JP (1) JP4823804B2 (ja)
CN (1) CN101123085B (ja)
DE (1) DE102007034774A1 (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006171133A (ja) * 2004-12-14 2006-06-29 Sony Corp 楽曲データ再構成装置、楽曲データ再構成方法、音楽コンテンツ再生装置および音楽コンテンツ再生方法
US7538265B2 (en) * 2006-07-12 2009-05-26 Master Key, Llc Apparatus and method for visualizing music and other sounds
US8843377B2 (en) * 2006-07-12 2014-09-23 Master Key, Llc System and method for foreign language processing
JP4315180B2 (ja) * 2006-10-20 2009-08-19 ソニー株式会社 信号処理装置および方法、プログラム、並びに記録媒体
US7932454B2 (en) * 2007-04-18 2011-04-26 Master Key, Llc System and method for musical instruction
WO2008130665A1 (en) 2007-04-19 2008-10-30 Master Key, Llc System and method for audio equalization
WO2008130697A1 (en) * 2007-04-19 2008-10-30 Master Key, Llc Method and apparatus for editing and mixing sound recordings
US7935877B2 (en) * 2007-04-20 2011-05-03 Master Key, Llc System and method for music composition
WO2008130659A1 (en) * 2007-04-20 2008-10-30 Master Key, Llc Method and apparatus for identity verification
US7960637B2 (en) 2007-04-20 2011-06-14 Master Key, Llc Archiving of environmental sounds using visualization components
WO2008130657A1 (en) * 2007-04-20 2008-10-30 Master Key, Llc Method and apparatus for computer-generated music
US7932455B2 (en) * 2007-04-20 2011-04-26 Master Key, Llc Method and apparatus for comparing musical works
US8018459B2 (en) * 2007-04-20 2011-09-13 Master Key, Llc Calibration of transmission system using tonal visualization components
US7569761B1 (en) * 2007-09-21 2009-08-04 Adobe Systems Inc. Video editing matched to musical beats
WO2009099592A2 (en) * 2008-02-01 2009-08-13 Master Key, Llc Apparatus and method for visualization of music using note extraction
JP5196550B2 (ja) * 2008-05-26 2013-05-15 株式会社河合楽器製作所 コード検出装置およびコード検出プログラム
JP5153517B2 (ja) * 2008-08-26 2013-02-27 株式会社河合楽器製作所 コード名検出装置及びコード名検出用コンピュータ・プログラム
EA201170559A1 (ru) * 2008-10-15 2012-01-30 Музеека С.А. Способ анализа цифрового музыкального аудиосигнала
EP2451076B1 (en) * 2009-06-29 2018-10-03 Mitsubishi Electric Corporation Audio signal processing device
US8269094B2 (en) * 2009-07-20 2012-09-18 Apple Inc. System and method to generate and manipulate string-instrument chord grids in a digital audio workstation
WO2011125203A1 (ja) * 2010-04-08 2011-10-13 パイオニア株式会社 情報処理装置及び方法、並びにコンピュータプログラム
US8309834B2 (en) 2010-04-12 2012-11-13 Apple Inc. Polyphonic note detection
US8983082B2 (en) * 2010-04-14 2015-03-17 Apple Inc. Detecting musical structures
JP5659648B2 (ja) * 2010-09-15 2015-01-28 ヤマハ株式会社 コード検出装置およびコード検出方法を実現するためのプログラム
JP2013105085A (ja) * 2011-11-15 2013-05-30 Nintendo Co Ltd 情報処理プログラム、情報処理装置、情報処理システム及び情報処理方法
CN104683933A (zh) * 2013-11-29 2015-06-03 杜比实验室特许公司 音频对象提取
JP6252147B2 (ja) * 2013-12-09 2017-12-27 ヤマハ株式会社 音響信号分析装置及び音響信号分析プログラム
JP6549234B2 (ja) * 2015-09-03 2019-07-24 Pioneer DJ株式会社 楽曲解析装置、楽曲解析方法、及び楽曲解析プログラム
US10381041B2 (en) * 2016-02-16 2019-08-13 Shimmeo, Inc. System and method for automated video editing
CN107301857A (zh) * 2016-04-15 2017-10-27 青岛海青科创科技发展有限公司 一种给旋律自动配伴奏的方法及***
JP6500869B2 (ja) * 2016-09-28 2019-04-17 カシオ計算機株式会社 コード解析装置、方法、及びプログラム
US11205407B2 (en) * 2017-08-29 2021-12-21 Alphatheta Corporation Song analysis device and song analysis program
JP6847237B2 (ja) * 2017-08-29 2021-03-24 AlphaTheta株式会社 楽曲解析装置および楽曲解析プログラム
JP6838659B2 (ja) * 2017-09-07 2021-03-03 ヤマハ株式会社 コード情報抽出装置、コード情報抽出方法およびコード情報抽出プログラム
CN108320730B (zh) * 2018-01-09 2020-09-29 广州市百果园信息技术有限公司 音乐分类方法及节拍点检测方法、存储设备及计算机设备
CN109935222B (zh) * 2018-11-23 2021-05-04 咪咕文化科技有限公司 一种构建和弦转换向量的方法、装置及计算机可读存储介质
CN110164473B (zh) * 2019-05-21 2021-03-26 江苏师范大学 一种基于深度学习的和弦排列检测方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0527751A (ja) * 1991-07-19 1993-02-05 Brother Ind Ltd 自動採譜装置等に用いられるテンポ抽出装置
JP3232112B2 (ja) * 1991-10-11 2001-11-26 ブラザー工業株式会社 小節境界時刻抽出装置
JP2900976B2 (ja) * 1994-04-27 1999-06-02 日本ビクター株式会社 Midiデータ編集装置
JP3666366B2 (ja) * 1999-11-04 2005-06-29 ヤマハ株式会社 携帯用端末装置
GB0023207D0 (en) * 2000-09-21 2000-11-01 Royal College Of Art Apparatus for acoustically improving an environment
JP3789326B2 (ja) * 2000-07-31 2006-06-21 松下電器産業株式会社 テンポ抽出装置、テンポ抽出方法、テンポ抽出プログラム及び記録媒体
JP2002215195A (ja) * 2000-11-06 2002-07-31 Matsushita Electric Ind Co Ltd 音楽信号処理装置
JP3908649B2 (ja) * 2002-11-14 2007-04-25 Necアクセステクニカ株式会社 環境同期制御システム、制御方法及びプログラム
JP4244133B2 (ja) * 2002-11-29 2009-03-25 パイオニア株式会社 楽曲データ作成装置及び方法
JP4313563B2 (ja) * 2002-12-04 2009-08-12 パイオニア株式会社 楽曲検索装置及び方法
JP4070120B2 (ja) * 2003-05-13 2008-04-02 株式会社河合楽器製作所 自然楽器の楽音判定装置
JP2006195384A (ja) * 2005-01-17 2006-07-27 Matsushita Electric Ind Co Ltd 楽曲調性算出装置および選曲装置
JP4672613B2 (ja) * 2006-08-09 2011-04-20 株式会社河合楽器製作所 テンポ検出装置及びテンポ検出用コンピュータプログラム
JP2008090633A (ja) * 2006-10-02 2008-04-17 Sony Corp 動きデータ生成装置、動きデータ生成方法及び動きデータ生成プログラム

Also Published As

Publication number Publication date
US7485797B2 (en) 2009-02-03
DE102007034774A1 (de) 2008-04-10
JP2008040283A (ja) 2008-02-21
CN101123085B (zh) 2011-10-05
US20080034947A1 (en) 2008-02-14
CN101123085A (zh) 2008-02-13

Similar Documents

Publication Publication Date Title
JP4823804B2 (ja) コード名検出装置及びコード名検出用プログラム
JP4767691B2 (ja) テンポ検出装置、コード名検出装置及びプログラム
JP4672613B2 (ja) テンポ検出装置及びテンポ検出用コンピュータプログラム
WO2007010637A1 (ja) テンポ検出装置、コード名検出装置及びプログラム
JP4916947B2 (ja) リズム検出装置及びリズム検出用コンピュータ・プログラム
JP6759560B2 (ja) 調律推定装置及び調律推定方法
JP5229998B2 (ja) コード名検出装置及びコード名検出用プログラム
US8723011B2 (en) Musical sound generation instrument and computer readable medium
JP2004184769A (ja) 楽曲構造検出装置及び方法
JP2012002858A (ja) タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム
JP3996565B2 (ja) カラオケ装置
JP6657713B2 (ja) 音響処理装置および音響処理方法
JP5005445B2 (ja) コード名検出装置及びコード名検出用プログラム
JP4932614B2 (ja) コード名検出装置及びコード名検出用プログラム
JP5153517B2 (ja) コード名検出装置及びコード名検出用コンピュータ・プログラム
JP2015125238A (ja) 音声信号処理装置、音声信号処理装置の制御方法、プログラム
JP6788560B2 (ja) 歌唱評価装置、歌唱評価プログラム、歌唱評価方法及びカラオケ装置
JP2010032809A (ja) 自動演奏装置及び自動演奏用コンピュータ・プログラム
JP4159961B2 (ja) カラオケ装置
JP6168649B2 (ja) コード検出装置及びプログラム
JP4135461B2 (ja) カラオケ装置、プログラム及び記録媒体
WO2024034118A1 (ja) 音声信号処理装置、音声信号処理方法およびプログラム
JP5151603B2 (ja) 電子楽器
JP2017032604A (ja) 楽音信号編集補助装置および楽音信号編集補助プログラム
JP2014041240A (ja) タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080627

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090722

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110415

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110607

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110801

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110906

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110907

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4823804

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140916

Year of fee payment: 3