JP7175395B2 - 楽曲構造解析装置および楽曲構造解析プログラム - Google Patents

楽曲構造解析装置および楽曲構造解析プログラム Download PDF

Info

Publication number
JP7175395B2
JP7175395B2 JP2021528065A JP2021528065A JP7175395B2 JP 7175395 B2 JP7175395 B2 JP 7175395B2 JP 2021528065 A JP2021528065 A JP 2021528065A JP 2021528065 A JP2021528065 A JP 2021528065A JP 7175395 B2 JP7175395 B2 JP 7175395B2
Authority
JP
Japan
Prior art keywords
signal
peak signal
peak
structure analysis
music
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021528065A
Other languages
English (en)
Other versions
JPWO2020255213A1 (ja
Inventor
四郎 鈴木
利尚 佐飛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AlphaTheta Corp
Original Assignee
AlphaTheta Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AlphaTheta Corp filed Critical AlphaTheta Corp
Publication of JPWO2020255213A1 publication Critical patent/JPWO2020255213A1/ja
Application granted granted Critical
Publication of JP7175395B2 publication Critical patent/JP7175395B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10GREPRESENTATION OF MUSIC; RECORDING MUSIC IN NOTATION FORM; ACCESSORIES FOR MUSIC OR MUSICAL INSTRUMENTS NOT OTHERWISE PROVIDED FOR, e.g. SUPPORTS
    • G10G3/00Recording music in notation form, e.g. recording the mechanical operation of a musical instrument
    • G10G3/04Recording music in notation form, e.g. recording the mechanical operation of a musical instrument using electrical means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

本発明は、楽曲構造解析装置および楽曲構造解析プログラムに関する。
従来、楽曲データの構造解析では、FFT(Fast Fourier Transform)等の周波数分析を行い、楽曲データの周波数スペクトル、低域、中域、高域の周波数成分のパワースペクトル、低域の周波数成分の出現頻度等を利用して、楽曲データの構造解析が行われている。
たとえば、特許文献1には、楽曲データのテンポの変化点を検出することにより、楽曲データのサビ(hook)の展開点を判別する技術が開示されている。
また、特許文献2には、STFT(Short Time Fourier Transform)変換によって生成されたパワースペクトルから得られたクロマベクトル情報のコードの推移から楽曲データのサビの展開位置を推定する技術が開示されている。
特開2008-65153号公報 特開2004-233965号公報
しかしながら、前記特許文献1に開示された技術では、楽曲データの展開点の判別にテンポの変化点を利用しているに過ぎないため、正しい展開点を高精度に検出することが困難であるという課題がある。
また、前記特許文献2に開示された技術では、楽曲データの低域、中域、高域周波数すべての周波数スペクトルからクロマベクトル情報を取得しているため、音域毎の判別が難しく、Aメロ、Bメロ、サビ等の展開位置を精度よく推定することが困難であるという課題がある。
本発明の目的は、楽曲データの展開位置等の区切り点を高精度に判定することのできる楽曲構造解析装置および楽曲構造解析プログラムを提供することにある。
本発明の楽曲構造解析装置は、楽曲データを構成する所定の周波数以下の信号の信号強度のうち、所定区間内の最大レベルのピーク信号を検出するピーク信号検出手段と、前記ピーク信号検出手段により検出されたピーク信号の信号強度について、前記楽曲データを構成する単位区間毎に平滑化処理を行う平滑化処理手段と、前記平滑化処理手段により平滑化された単位区間毎のピーク信号の信号強度について、時間的に前後する単位区間とのピーク信号の信号強度の差分量を算出する差分量算出手段と、前記差分量算出手段により算出された単位区間毎のピーク信号の信号強度の差分量のうち、ピーク信号の信号強度の差分量が、最も高い信号強度の差分量に対して処理の閾値の範囲内となるピーク信号抽出手段と、前記ピーク信号抽出手段により抽出されたピーク信号のうち、その後のピーク信号の信号強度の時間的変化が所定の閾値の範囲内にあり、かつ所定時間継続するピーク信号の時間的位置を前記楽曲データの区切り点と判定する区切り点判定手段と、を備える。
本発明のコンピュータ読取可能なプログラムは、コンピュータを前述した楽曲構造解析装置として機能させる。
本発明の実施の形態に係る楽曲構造解析装置の構造を示す機能ブロック図。 前記実施の形態における平滑化処理、差分量の算出を説明するためのグラフ。 前記実施の形態における区切り点の判定を説明するためのグラフ。 前記実施の形態における作用を説明するためのフローチャート。
図1には、本発明の実施の一形態に係る楽曲構造解析装置1が示されている。楽曲構造解析装置1は、入力された楽曲データの解析を行って、楽曲データの構造を特徴付けるイントロ(intro)、Aメロ(verse)、サビ(hook)、アウトロ(outro)等の特徴区間の展開位置、すなわち楽曲データの区切り点を判定する装置である。
楽曲構造解析装置1は、LPF(Low Pass Filter)処理手段2、ピーク信号検出手段4、平滑化処理手段5、差分量算出手段6、ピーク信号抽出手段7、区切り点判定手段8、および判定結果出力手段9を備える。これらの各機能的手段は、コンピュータのCPU上で実行されるコンピュータ読取可能なプログラムとして構成される。
楽曲構造解析装置1により解析された楽曲データの区切り点は、判定結果出力手段9を介しコンピュータ上のディスプレイ10、照明制御手段11に出力される。楽曲データの区切り点は、コンピュータのディスプレイ10において、楽曲の進行を表示する波形グラフ上に重畳表示され等の特徴を表す画像として表示され、DJプレイヤー等の演奏者に再生中の楽曲の区切れ点、すなわち展開位置を認識させる。
DJプレイヤーは、推定された楽曲データの展開位置から、DJコントローラ等で現在再生中の楽曲から、次に再生する楽曲の適否を判断して、違和感のない最適なDJパフォーマンスを行うことができる。
また、楽曲データの区切れ点は、照明制御手段11に出力され、楽曲データの展開に応じた照明制御が実行され、DJパフォーマンスにおける照明演出が行われる。
LPF処理手段2は、楽曲データの低域周波数の信号のみを通過させ、中域周波数、高域周波数の信号をカットする。カットオフ周波数は、バスドラム、ベース等のリズムセクションの信号の周波数に相当し、たとえば200Hz以下、好ましくは100Hz以下である。
低域周波数の信号の信号強度のピークを、所定間隔、たとえば拍毎に検出することにより、展開区間毎に変化することが多いリズムセクションの音量感の変化を把握することができる。
ピーク信号検出手段4は、LPF処理後のレベルをある所定区間毎、たとえば拍単位での最大レベルの信号値を検出し、さらに、別のある単位区間、例えば小節毎に、その区間内の最大レベルの信号値をピーク信号として検出する。
平滑化処理手段5は、ピーク信号検出手段4により検出されたピーク信号の信号強度について、楽曲データを構成する単位区間毎に平滑化処理を行う。ここで、本実施形態における単位区間は1小節を単位区間としている。
具体的には、平滑化処理手段5は、拍毎に検出された低域周波数の信号の信号強度を、小節毎に平滑化処理する。
まず、平滑化処理手段5は、1小節中に検出された低域周波数の信号のピーク信号の信号強度のうち、時間的に最初のピーク信号の信号強度を最初の処理値として設定する。
次に、平滑化処理手段5は、時系列的に次に検出されたピーク信号の信号強度が、最初に設定された処理値の所定の閾値の範囲内に含まれているか否かを判定する。所定の閾値の範囲としては、たとえば、次のピーク信号の信号強度が処理値に対して±10%の範囲内にあるか否かに基づいて判定する。
次のピーク信号が所定の閾値の範囲内に含まれていると判定された場合、平滑化処理手段5は、次のピーク信号の信号強度を処理値に書き替える。
次のピーク信号が所定の閾値の範囲内に含まれていないと判定された場合、平滑化処理手段5は、処理値を当該ピーク信号の信号強度に書き替える。
以後、平滑化処理手段5は、同様の判定を行って、時系列順で検出されたピーク信号の平滑化処理を小節毎に実施する。
差分量算出手段6は、時間的に前後する小節間のピーク信号の信号強度の差分量を算出する。
具値的には、図2に示すように、平滑化処理手段5により平滑化された波形グラフG1の時間的に前後する小節間の信号強度の差分量を算出して、小節毎の差分量を表すグラフG2を得る。
ピーク信号抽出手段7は、単位区間毎のピーク信号の信号強度の差分量のうち、ピーク信号の信号強度の差分量が、最高値をとるピーク信号の信号強度の差分量に対して所定の閾値の範囲内となる差分量のピーク信号を抽出する。
具体的には、ピーク信号抽出手段7は、図2に示されるように、ピーク信号Pmax、P1、P2の信号強度の差分量を表すグラフG2が、所定の閾値TH1、TH2の範囲内にあるか否かによってピーク信号を抽出する。
ピーク信号抽出手段7により抽出されたピーク信号は、楽曲データの展開位置等の区切り点の候補とされる。
本実施の形態では、ピーク信号抽出手段7は、2つの閾値TH1、TH2によってピーク信号を抽出している。
第1の閾値TH1は、ピーク信号の信号強度の差分量がピーク信号として認識される下限値として設定され、たとえば、検出可能な信号強度の限界値(100%)に対して、たとえば15%の信号強度が第1の閾値TH1とされる。したがって、信号強度が15%未満のピーク信号は、抽出の対象から除外される。
第2の閾値TH2は、差分量算出手段6により算出されたピーク信号Pmaxの差分量の最大値と比較して、一定の大きさの信号強度を有するピーク信号の信号強度として設定され、たとえば差分量の最大値に対して、60%とされる。したがって、図2において、信号強度の差分量が第2の閾値TH2に至らないピーク信号P1は、抽出の対象から除外され、第2の閾値TH2を超えるピーク信号P2は抽出の対象となる。
区切り点判定手段8は、ピーク信号抽出手段7により抽出されたピーク信号のうち、その後のピーク信号の信号強度の時間的変化が所定時間継続して所定の閾値の範囲内にあるときに、当該ピーク信号の時間的位置を楽曲データの区切り点と判定する。
具体的には、区切り点判定手段8は、図3に示すように、抽出されたピーク信号P2がその後、ピーク信号P2の信号強度PLに対して、閾値TH3の範囲内を、所定の継続時間、たとえば2小節以上維持する場合、ピーク信号P2を区切り点として判定する。閾値TH3は、たとえばピーク信号P2の信号強度PLに対して±30%に設定される。
ピーク信号P2が上記の条件を満たす場合、区切り点判定手段8は、ピーク信号P2を楽曲データの区切り点と判定する。
一方、ピーク信号P2が上記の条件を満たさない場合、区切り点判定手段8は、ピーク信号P2を楽曲データの区切り点とは判定せず、時系列的に次のピーク信号の判定を行う。
区切り点判定手段8により判定された結果は、判定結果出力手段9を介してディスプレイ10、照明制御手段11に出力される。
次に、前述した本実施の形態の作用について、図4に示すフローチャートに基づいて説明する。
楽曲構造解析装置1は、HDD等の記憶装置から楽曲データの読み出しを行う(手順S1)。LPF処理手段2は、読み出された楽曲データに対してLPF処理を行って、楽曲データの中域および高域の周波数成分を除去する(手順S2)。
ピーク信号検出手段4は、FFT解析によって生成された周波数スペクトルに基づいて、時間的に前後する信号の信号強度よりも信号強度の大きな信号をピーク信号として検出する(手順S3)。
平滑化処理手段5は、検出されたピーク信号の時間的変化について平滑化処理を行って、小節毎のピーク信号の処理値を算出する(手順S4)。
差分量算出手段6は、算出された小節毎のピーク信号の平滑化した処理値について、時間的に前後する小節間のピーク信号の信号強度の差分量を算出する(手順S5)。
ピーク信号抽出手段7は、ピーク信号の信号強度の差分量が閾値TH1よりも大きく、かつ閾値TH2よりも大きいかを判定する(手順S6)。
判定の結果、差分量が閾値TH1および閾値TH2のいずれかを満たさない場合、次のピーク信号について手順S6の判定を行う。
判定の結果、差分量が閾値TH1および閾値TH2の両方を満たす場合、当該差分量のピーク信号を区切り点の候補として抽出する(手順S7)。
以後、すべての差分量が算出されたピーク信号について、手順S6の判定を繰り返す(手順S8)。
区切り点の候補となるピーク信号がすべて抽出されたら、区切り点判定手段8は、抽出されたピーク信号について、その後のピーク信号の信号強度が所定時間継続して閾値TH3の範囲内にあるか否かを判定する(手順S9)。
判定条件を満たさない場合、区切り点判定手段8は、次の抽出されたピーク信号について、手順S9の判定を行う。
判定条件を満たす場合、区切り点判定手段8は、当該ピーク信号を楽曲データの区切り点と設定する(手順S10)。
区切り点判定手段8は、次の抽出されたピーク信号について、手順S9の判定を行い、抽出されたすべてのピーク信号についての手順S10の判定を繰り返す(手順S11)。
このような本実施の形態によれば、以下のような効果がある。
本実施の形態では、区切り点判定手段8が所定の周波数以下の信号の信号強度を対象として、楽曲データの区切り点の判定を行っている。したがって、低域周波数の変化のみを対象として楽曲データの区切り点を判定できるため、中域、高域周波数のノイズが入りにくい状態で区切り点の判定を行って、区切り点を高精度に判定できる。
本実施の形態では、区切り点判定手段8が区切り点の候補となるピーク信号のうち、ピーク信号の信号強度が閾値TH3の範囲内にあり、これを2小節間継続するピーク信号を楽曲データの区切り点として判定している。したがって、安定して大きな変化を有するピーク信号の時間的位置を区切り点として判定しているため、楽曲データの区切り点を誤りなく判定することができる。
本実施の形態では、区切り点判定手段8による判定の前に、平滑化処理手段5による平滑化処理を行っている。したがって、区切り点判定手段8による判定が、ノイズ等に妨害されることを防止して、確実に楽曲データの区切り点を判定できる。
本実施の形態では、ピーク信号抽出手段7によるピーク信号の抽出が、信号強度が最高値のピーク信号に対して、60%以上の信号強度を有するピーク信号を区切り点の候補として抽出している。したがって、信号強度が十分に大きなピーク信号を区切り点の候補として抽出できるため、区切り点判定手段8による区切り点の判定を高精度に行うことができる。
なお、本発明は、前述した実施の形態に限定されるものではなく、以下に示すような変形も含むものである。
前述の実施の形態では、区切り点判定手段8による区切り点の判定は、ピーク信号の信号強度が±30%の範囲内にあり、これを2小節以上継続することを条件として判定していたが、本発明は限らない。閾値の条件は、解析の対象となる楽曲データのジャンル、テンポ等によって適宜変更してもよい。
前述の実施の形態では、ピーク信号抽出手段7による区切り点の候補となるピーク信号の抽出を、ピーク信号の信号強度の最高値に対して、60%以上の信号強度を閾値TH2としてピーク信号を抽出していたが、本発明はこれに限られない。たとえば、閾値TH2をもっと高く設定してもよく、低く設定してもよい。要するに、閾値の条件は、解析の対象となる楽曲データのジャンル、テンポ等によって適宜変更してもよい。
その他、本発明の実施の際の具体的な構造および形状等は、本発明の目的を達成できる範囲で他の構造等としてもよい。
1…楽曲構造解析装置、2…LPF処理手段、4…ピーク信号検出手段、5…平滑化処理手段、6…差分量算出手段、7…ピーク信号抽出手段、8…区切り点判定手段、9…判定結果出力手段、10…ディスプレイ、11…照明制御手段、G1…グラフ、G2…グラフ、P1…ピーク信号、P2…ピーク信号、PL…信号強度、PL…信号強度、Pmax…ピーク信号、TH1…第1の閾値、TH2…第2の閾値、TH3…閾値。

Claims (4)

  1. 楽曲データを構成する所定の周波数以下の信号の信号強度のうち、所定区間内の最大レベルのピーク信号を検出するピーク信号検出手段と、
    前記ピーク信号検出手段により検出されたピーク信号の信号強度について、前記楽曲データを構成する単位区間毎に平滑化処理を行う平滑化処理手段と、
    前記平滑化処理手段により平滑化された単位区間毎のピーク信号の信号強度について、時間的に前後する単位区間とのピーク信号の信号強度の差分量を算出する差分量算出手段と、
    前記差分量算出手段により算出された単位区間毎のピーク信号の信号強度の差分量のうち、ピーク信号の信号強度の差分量が、最も高い信号強度の差分量に対して所定の閾値の範囲内となるピーク信号を抽出するピーク信号抽出手段と、
    前記ピーク信号抽出手段により抽出されたピーク信号のうち、その後のピーク信号の信号強度の時間的変化が所定時間継続して所定の閾値の範囲内にあるときに、当該ピーク信号の時間的位置を楽曲データの区切り点と判定する区切り点判定手段と、
    を備える楽曲構造解析装置。
  2. 請求項1に記載の楽曲構造解析装置において、
    前記区切り点判定手段における所定の閾値は、抽出されたピーク信号の信号強度の±30%であり、継続時間は2小節以上である楽曲構造解析装置。
  3. 請求項1または請求項2に記載の楽曲構造解析装置において、
    前記ピーク信号抽出手段における閾値は、最も高い信号強度の差分量に対して60%以上である楽曲構造解析装置。
  4. コンピュータを請求項1から請求項3のいずれか一項に記載の楽曲構造解析装置として機能させるコンピュータ読取可能な楽曲構造解析プログラム。
JP2021528065A 2019-06-17 2019-06-17 楽曲構造解析装置および楽曲構造解析プログラム Active JP7175395B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/023928 WO2020255213A1 (ja) 2019-06-17 2019-06-17 楽曲構造解析装置および楽曲構造解析プログラム

Publications (2)

Publication Number Publication Date
JPWO2020255213A1 JPWO2020255213A1 (ja) 2020-12-24
JP7175395B2 true JP7175395B2 (ja) 2022-11-18

Family

ID=74040180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021528065A Active JP7175395B2 (ja) 2019-06-17 2019-06-17 楽曲構造解析装置および楽曲構造解析プログラム

Country Status (2)

Country Link
JP (1) JP7175395B2 (ja)
WO (1) WO2020255213A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008159252A (ja) 2008-01-15 2008-07-10 Sony Corp 選択用音声データ取得方法、選択用音声データ取得装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008159252A (ja) 2008-01-15 2008-07-10 Sony Corp 選択用音声データ取得方法、選択用音声データ取得装置

Also Published As

Publication number Publication date
JPWO2020255213A1 (ja) 2020-12-24
WO2020255213A1 (ja) 2020-12-24

Similar Documents

Publication Publication Date Title
US8344234B2 (en) Tempo detecting device and tempo detecting program
US9087501B2 (en) Sound signal analysis apparatus, sound signal analysis method and sound signal analysis program
US10366121B2 (en) Apparatus, method, and computer-readable medium for cue point generation
JP6585289B2 (ja) 照明制御装置、照明制御方法、および照明制御プログラム
US10643638B2 (en) Technique determination device and recording medium
US11176915B2 (en) Song analysis device and song analysis program
Jensen et al. Real-time beat estimationusing feature extraction
CN107210029B (zh) 用于处理一连串信号以进行复调音符辨识的方法和装置
US7276656B2 (en) Method for music analysis
JP6920445B2 (ja) 楽曲解析装置および楽曲解析プログラム
JP6127519B2 (ja) 楽音制御装置、楽音制御方法及びプログラム
JP7175395B2 (ja) 楽曲構造解析装置および楽曲構造解析プログラム
JP6263383B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法、プログラム
JP6263382B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法、プログラム
JP7176113B2 (ja) 楽曲構造解析装置および楽曲構造解析プログラム
JP6286933B2 (ja) 小節間隔推定およびその推定のための特徴量抽出を行う装置、方法、およびプログラム
JP5131172B2 (ja) 周期特定装置およびプログラム
JP6064561B2 (ja) 拍情報推定装置
JP2004029274A (ja) 信号パターン評価装置、信号パターン評価方法及び信号パターン評価プログラム
JP6807461B2 (ja) 楽曲解析装置および楽曲解析プログラム
JP2014010309A (ja) 小節位置判定方法、小節位置判定装置およびプログラム
WO2017037920A1 (ja) 楽曲解析装置、楽曲解析方法、及び楽曲解析プログラム
WO2017037919A1 (ja) 楽曲解析装置、楽曲解析方法、及び楽曲解析プログラム
JP2018146933A (ja) 評価装置、評価方法及びプログラム
JPWO2019026236A1 (ja) 楽曲解析装置および楽曲解析プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221011

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221108

R150 Certificate of patent or registration of utility model

Ref document number: 7175395

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150