JP2010113277A - 楽曲処理装置およびプログラム - Google Patents

楽曲処理装置およびプログラム Download PDF

Info

Publication number
JP2010113277A
JP2010113277A JP2008287605A JP2008287605A JP2010113277A JP 2010113277 A JP2010113277 A JP 2010113277A JP 2008287605 A JP2008287605 A JP 2008287605A JP 2008287605 A JP2008287605 A JP 2008287605A JP 2010113277 A JP2010113277 A JP 2010113277A
Authority
JP
Japan
Prior art keywords
time
segment
sound data
music
musical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008287605A
Other languages
English (en)
Other versions
JP5359203B2 (ja
Inventor
Takuya Fujishima
琢哉 藤島
Boer Maarten De
デ ボア マールテン
Jong Fokke De
デ ジョン フォッケ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2008287605A priority Critical patent/JP5359203B2/ja
Publication of JP2010113277A publication Critical patent/JP2010113277A/ja
Application granted granted Critical
Publication of JP5359203B2 publication Critical patent/JP5359203B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract

【課題】、複数の楽曲を素片単位で連結して新たな楽曲を生成する際に、各素片のつなぎ目で無音が生じたり、楽曲全体に亘ってのリズムが不自然になったりすることを回避する。
【解決手段】複数の楽曲のうち演奏対象として指定された主楽曲の各素片の波形を表す楽音データを、他の楽曲の各素片の楽音データのうち主楽曲の素片と音楽的な特徴量が類似する素片の楽音データで置き換える際に、時間軸圧伸処理を施して時間長の調整を行いつつその置き換えを行う。時間軸圧伸のための手段として低音質高速な第1手段と高音質低速な第2手段とを用意し、楽曲の再生開始当初は、第1手段により時間軸圧伸を施した楽音データで置き換え、その後、第2手段により時間軸圧伸を施した楽音データによる置きかえに切り換える。
【選択図】図4

Description

本発明は、複数の楽曲の各々に含まれる素片を連結して新たな楽曲を生成する技術に関する。
例えばディスクジョッキ(DJ)は、複数の楽曲を途切れなく連結しながら次々に再生する。特許文献1には、このような楽曲再生を実現する技術が開示されている。同文献の技術においては、楽曲を拍に同期した時点で複数の区間(以下、素片)に区分し、それら各素片を音楽的な特徴量が類似する他の素片(例えば、他の楽曲の素片)で置き換えて再生することにより、複数の楽曲から違和感のない新たな楽曲を生成し再生することを実現している。
特開2008−129135号公報
しかし、一つの楽曲においても、その楽曲を構成する各素片SMの時間長は必ずしも一定ではなく、また、素片SMと置き換えて再生される素片SSの時間長が素片SMの時間長と一致するとは限らない。このため、特許文献1で開示された技術には、以下のような問題が生じ得る。すなわち、図6(A)に示すように、素片SMに比較して素片SSの時間長が短い場合には、各素片SSのつなぎ目が無音状態となってしまい、音がブツブツと途切れて聴こえてしまうといった問題がある。逆に、素片SMに比較して素片SSの時間長が長い場合には、その超過部分に応じて素片SSの末尾の部分が再生されず、図6(B)に示すように素片SSの中央に拍点がある場合に、各拍点の再生間隔がずれてしまい再生される楽曲全体に亘ってのリズムにずれが生じてしまうといった問題がある。
本発明は、上記課題に鑑みて為されたものであり、複数の楽曲を素片単位で連結して新たな楽曲を生成する際に、各素片のつなぎ目で無音が生じたり、楽曲全体に亘ってのリズムが不自然になったりすることを回避する技術を提供することを目的としている。
上記課題を解決するため、本発明は、楽曲を区分した各素片の波形を示す楽音データを記憶する記憶手段と、再生すべき素片を指定する情報と再生時における素片の時間長とを指定する情報とを含む再生指示を生成する再生指示生成手段と、前記再生指示により指定された素片の楽音データを前記記憶手段から読み出す読出手段と、前記再生指示に応じて前記記憶手段から読み出された楽音データに対し、前記再生指示により指定された時間長の素片とするための第1の時間軸圧伸処理を施す第1の時間軸圧伸処理手段と、前記再生指示に応じて前記記憶手段から読み出された楽音データに対し、前記再生指示により指定された時間長の素片とするための時間軸圧伸処理であって、前記第1の時間軸圧伸処理よりも演算量が多く、処理速度が遅い第2の時間軸圧伸処理を施す第2の時間軸圧伸処理手段と、前記再生指示に応じて、前記第1の時間軸圧伸処理の結果得られる楽音データを出力し、その後、前記第1の時間軸圧伸処理の結果得られる楽音データの代わりに、前記第2の時間軸圧伸処理の結果得られる楽音データを出力するデータ出力手段とを有する楽曲処理装置、およびコンピュータ装置を上記各手段として機能させることを特徴とするプログラムを提供する。
このような楽曲処理装置およびプログラムによれば、再生指示に応じて記憶手段から読み出される楽音データに対して第1または第2の時間軸圧伸処理を施す処理が実行され、その処理結果が出力される。このため、各素片のつなぎ目で無音が生じたり、リズムが不自然になることが回避される。さらに、本発明では、はじめのうちは第1の時間軸圧伸処理による時間長の調整が行われ、その後、第2の時間軸圧伸処理による時間長の調整に切り換えられる。このため、第1の時間軸圧伸処理として、処理速度は速いもののその処理後の楽音データの音質では劣る処理(例えば、時間領域での時間軸圧伸処理)を採用し、第2の時間軸圧伸処理として、処理速度は遅いもののその処理後の楽音データの音質では優る処理(例えば、フェーズボコーダなどスペクトル領域での時間軸圧伸処理)を採用すれば、前者のみを採用した場合に比較して音質の高い楽曲を生成することができ、また、後者のみを採用した場合に比較してリアルタイム処理が可能になるといった効果を奏する。
ここで、再生指示より指定される素片の再生時の時間長を指定する態様としては種々のものが考えられる。第1に、再生すべき素片を連ねて得られる楽曲の再生テンポを利用者に指定させ、再生時における各素片の時間長を当該再生テンポに応じた一定の時間長とする態様である。第2に、再生すべき素片の各々について再生時における当該素片の時間長を指定する態様である。
より好ましい態様においては、前記楽曲処理装置は、前記主楽曲に含まれる各素片と置き換えられる他の楽曲の素片の楽音データの各々に、その楽音データの表す素片内でフェードアウトするエンベロープを付与する一方、当該楽音データが他の楽音データに後続して出力される場合には、当該楽音データの表す素片の手前からフェードインするエンベロープを付与して出力することを特徴とする。このような態様によれば、前後の素片との境界を跨いでフェードインおよびフェードアウトするエンベロープを付与した場合に比較して、不要な拍点が顕在化することがなく、楽曲全体に亘ってのリズムが不自然になることが回避される。
以下、本発明の実施形態について図面を参照しつつ説明する。
(A:第1実施形態)
図1は、本発明の第1実施形態に係る楽曲処理装置100の構成を示すブロック図である。本形態の楽曲処理装置100は、複数の楽曲のうちから利用者により指定された一つの楽曲(以下「主楽曲」という)を、これら複数の楽曲のうちの他のもの(以下「副楽曲」という)を利用して加工し、このようにして生成される新たな楽曲を繰り返し再生する装置である。図1に示すように、この楽曲処理装置100は、制御装置10、記憶装置20、出力装置30、入力装置40および表示装置50を具備するコンピュータ(例えばパーソナルコンピュータ)によって実現される。
制御装置10は、プログラムの実行によって楽曲処理装置100の各部を制御する演算処理装置(CPU)と、この演算処理の実行過程で各種データが各々蓄積される複数のキャッシュメモリとを含んでいる。記憶装置20は、制御装置10が実行するプログラムや制御装置10が処理する各種のデータを記憶する。例えば半導体記憶装置や磁気記憶装置や光ディスク装置が記憶装置20として好適である。図1に示すように、記憶装置20は、複数の楽曲の各々について楽曲データを記憶する。本実施形態では、入力装置40に対する操作によって、上記複数の楽曲のうちから再生対象となる主楽曲が指定され、その主楽曲から再生対象のループが画定される。なお、上記複数の楽曲のうちの主楽曲として指定されなかったもの全てを副楽曲としても良いし、これら主楽曲として指定されなかた楽曲のうちの幾つかを副楽曲として利用者に指定させても良い。
図2は、楽曲とループの関係を示す概念図である。1つの楽曲は多数の小節に区分される。図2に示すように、ループは1つの楽曲の複数の小節からなる区間であり、例えば楽曲の特徴的な部分(いわゆるサビの部分など)がループとして好適である。このループは、入力装置40の操作によって利用者が主楽曲中にループの始点および終点を指定することで画定される。なお、本実施形態では、主楽曲の一部を再生対象のループとして利用者に指定させたが、主楽曲全体を再生対象のループとしても勿論良い。また、主楽曲のうち所定の条件を満たす区間を制御装置10がループとして自動的に画定する構成としても勿論良い。
図2に示すように、各小節は1つまたは複数の拍(ビート)を単位として複数の区間(以下「素片」という)Sに区分される。本形態における素片Sは1つの拍に相当する区間である。したがって、例えば2拍子の楽曲であれば1つの小節を2等分した各区間が素片Sに相当し、3拍子の楽曲であれば1つの小節を3等分した各区間が素片Sに相当する。なお、素片Sは、1つの拍を複数に区分した区間(すなわち1/2拍や1/4拍に相当する区間)であってもよい。
図1に示すように、1つの楽曲に対応した楽曲データは、当該楽曲に属する複数の素片Sの各々について素片データDSとその楽曲における各素片Sの再生タイミングを示すシーケンスデータTC(例えば、素片Sを一意に示す識別子と楽曲の先頭を時刻の基準点とした場合におけるその素片Sの再生時刻を示すデータとの配列)とを含む。例えば、4拍子の楽曲のうち3個の小節がループとして指定された場合には、当該ループの楽曲データは12個(=3小節×4拍分)の素片データDSを含む。1つの素片Sに対応した素片データDSは、当該素片Sの音波形を示すサンプリングデータ列(以下、楽音データ)Aと当該素片Sの音楽的な性質を特徴付ける数値(以下「特徴量」という)Fとを含む。本形態における素片データDSの特徴量Fは、楽音のエネルギ(強度),振幅スペクトルのセントロイド,スペクトルの強度が最大となる周波数,MFCC(Mel-Frequency Cepstrum Coefficient)などN種類(Nは自然数)の数値を含む。
制御装置10は、再生対象として画定されたループを構成する素片SM(i=1、2・・・:i=1はループの先頭に位置する素片)の楽音データAMを、複数の副楽曲の素片のうち素片SMと音楽的な特徴が類似した素片SSの楽音データASに置き換え、利用者により指定された再生テンポに応じた時間間隔で出力装置30へ順次出力する。ただし、制御装置10は、単に楽音データAMを楽音データASで置き換えて出力するのではなく、素片SSの時間長を利用者により指定された再生テンポに応じた長さに調整したうえで上記置き換えを行う点に特徴がある。これにより、各素片SSの切れ目で無音になったり、リズムのずれが生じたりすることが回避されるのである。そして、出力装置30は、制御装置10から出力される楽音データASに基づいて放音する。例えば、出力装置30は、楽音データASからアナログの信号を生成するD/A変換器と、D/A変換器が出力する信号を増幅する増幅器と、増幅器が出力する信号に応じた音波を出力する放音機器(スピーカやヘッドホン)とを含む。
入力装置40は、利用者が操作する複数の操作子を含む機器(例えばマウスやキーボード)である。利用者は、入力装置40を適宜に操作することで、主楽曲およびループを指定すること、その再生テンポや再生時の音量などを指定すること、および再生時に素片の時間長を調整するか否かを指示することができる。表示装置50は、例えば液晶ディスプレイであり、制御装置10による制御のもと上記各種操作の実行を促す画像を表示する。
次に、制御装置10の具体的な機能について説明する。図1に示すように、制御装置10は、記憶装置20に格納されたプログラムを実行することで複数の機能体(再生指示生成部12,素片読出部14,第1時間軸圧伸部16a,第2時間軸圧伸部16b、データ出力部18)として機能する。各機能体による具体的な処理の内容は以下の通りである。
再生指示生成部12は、再生対象として指定されたループを示す情報および指定された再生テンポに応じて、再生するべき素片を示す情報と再生時における素片の時間長とを含む再生指示を生成する。本実施形態では、再生指示生成部12は、まず、複数の副楽曲の各々に含まれる素片のうち再生対象のループを構成する各素片SMと音楽的な特徴が最も類似する素片を、その素片SMと置き換えて再生する素片SSとして特定する。より詳細に説明すると、再生指示生成部12は、再生対象として指定されたループにおける各素片SMの配列の順番で記憶装置20からその素片SMの特徴量FMを順次読み出し、1つの素片SMの特徴量FMについて、総ての副楽曲における各素片Sの特徴量Fとの類否指標値Rを算定する。この類否指標値Rとしては、例えば、特徴量Fに含まれるN種類の数値を軸とするN次元空間に特徴量FMと特徴量Fの各々に対応した座標を設定したときの各座標間の距離(ユークリッド距離など)の逆数を用いることが考えられる。このようにして算定される類否指標値Rを用いた場合、類否指標値Rが大きい(すなわち特徴量FMと特徴量Fとが近い)ほど音楽的な特徴が類似する。したがって、再生指示生成部12は、素片SMの各々に対して、最も大きな類否指標値Rが算定される素片を素片SSとして特定する。
次いで、再生指示生成部12は、上記のようにして特定した素片SSの各々について、利用者により指定された再生テンポで再生する際の時間長を算出する。ここで、再生テンポに基づいて各素片SSの時間長を算定する態様としては以下の2つの態様が考えられる。第1に、各素片SSの時間長を再生テンポに応じた一定の時間長とする態様である。具体的には、再生テンポとして1分当たりの拍数をBPMと指定された場合、素片SSの再生時の時間長を60/BPMとする態様である。なお、一拍あたりSPB個の素片がある場合(1つの素片が1/2拍や1/4拍に対応する場合など)には、再生時の素片SSの時間長を60/(BPM×SPB)とすれば良い。これに対して、第2の態様は、素片SSの時間長を、再生対象として指定されたループを上記再生テンポで再生する場合における各素片SMの時間長となるように定める態様である。例えば、上記再生対象のループを含む主楽曲の録音時のテンポがBPMであり、かつ、素片SMの時間長がTSMである場合、再生時の素片SSの時間長をTSM×BPM/BPMとするのである。
そして、再生指示生成部12は、上記のようにして特定した各素片SSiを指定する情報(例えば、記憶装置20における素片SSの記憶位置を示すアドレスなどその素片SSを一意に示す識別子)とその素片SSを再生する際の時間長を指定する情報とを含む再生指示を生成し、素片読出部14に与える。
素片読出部14は、再生指示生成部12によって生成された再生指示にしたがって素片SSの波形を示す楽音データASを記憶装置20から順次読出す。このようにして読み出される楽音データASを、利用者により指定された再生テンポに応じた出力タイミングで出力装置30へ順次出力したとしたならば、再生対象として指定されたループの各素片SMiを素片SSで置き換えた楽曲が上記再生テンポで再生されるのである。なお、本実施形態では、再生対象のループを構成する各素片SMと最も類似した特徴量を有する素片を再生指示生成部12に特定させ、その素片の識別子を再生するべき素片を示す情報として用いたが、素片SMの特徴量FMを、再生するべき素片を示す情報として用い、この特徴量FMと最も類似する特徴量を有する素片を読み出す処理を素片読出部14に実行させても良い。ただし、このような態様においては、再生指示生成部12における再生指示の生成の際には、再生するべき素片が一意に特定されないため、再生時の各素片の時間長を算定する態様としては前述した第1の態様を採用しなければならない。
第1時間軸圧伸部16aと第2時間軸圧伸部16bは、何れも、素片読出部14により記憶装置20から順次読み出される楽音データAS(i=1,2・・・)に時間軸圧伸処理を施し、素片SSの再生時の時間長が再生指示にて指定された時間長となるように時間長の調整を行う。より詳細に説明すると、第1時間軸圧伸部16aは、以下の要領で時間長の調整を行う。すなわち、楽音データASを構成する各サンプリングデータについて自己相関値を算出するなどして素片SSにて周期的に表れる波形を特定し、この波形単位で時間長の伸張または圧縮を行う。例えば、素片SSの時間長の伸張を行う場合には、第1時間軸圧伸部16aは、再生指示にて指定された時間長とその素片SSについての時間軸圧伸処理前の時間長との比(以下、圧伸比率)に応じた分だけ上記波形が繰り返されるように楽音データASにサンプリングデータ列の追加や削除を行う。
一方、第2時間軸圧伸部16bは、フェーズボコーダなどを利用したスペクトル領域でのデータ処理により時間長の調整を行う。例えば、素片SSの時間長の伸張を行う場合には、楽音データASを素片SSを構成するフレーム単位に分割し、各フレームにFFTを施してそのフレームのスペクトル分布を求め、圧伸比率に応じた分だけスペクトル分布の内挿を施した後に逆FFTを施すことで、その素片SSの時間長を伸長する。このように第1時間軸圧伸部16aによる時間軸圧伸処理は、FFTおよび逆FFTを含まないため、第2時間軸圧伸部16bにおけるものに比較して演算量が少なく高速であるといった長所があるものの、波形単位でのサンプルの追加等であるため、高音質な処理結果を望めないといった短所がある。以下、本実施形態では、第1時間軸圧伸部16aが実行する時間軸圧伸処理を「リアルタイム時間軸圧伸処理」と呼び、第2時間軸圧伸部16bが実行する時間軸圧伸処理を「オフライン時間軸圧伸処理」と呼ぶ。
データ出力部18は、素片読出部14によって読み出された楽音データAS(或いは、その楽音データASに時間軸圧伸処理を施して得られる楽音データ)を出力装置30へ出力する。図3は、制御装置10の動作モードの遷移を示す図である。図3に示すように、制御装置10の動作モードには、ノーマルモード、リアルタイム処理モード、切り換え準備モードおよびオフライン処理モードの4つがある。以下、これら4つの動作モードの各々にて制御装置10が実行する処理の内容について説明する。
(A−1:ノーマルモードにおける処理)
このモードは、時間長の調整を行うことなく、楽音データAMを楽音データASで置き換えて出力するモードである。本実施形態では、入力装置40に対する操作によりループの繰り返し再生が指示されると、制御装置10は、再生指示生成部12による再生指示の生成を行い、このモードの処理を開始する。図4(A)は、ノーマルモードにおける処理の流れを示すフロー図である。図4(A)に示すように、このモードにおいては、まず、再生指示の示す素片の楽音データが素片読出部14によって順次記憶装置20から読み出され、複数のキャッシュメモリのうちの1つ(以下、第1のキャッシュメモリ)に書き込む処理(図4(A):ステップSA100)が実行される。ここで、記憶装置20から読み出した楽音データASを上記第1のキャッシュメモリに蓄積するのは、一般に記憶装置20のデータ読み出し速度は低速であるため、一度記憶装置20から読み出された楽音データASがループの繰り返し再生を行う過程で再度記憶装置20から読み出されるとすると、楽曲のリアルタイム再生に支障が生じる虞があるからである。
ステップSA110で実行される加工処理では、入力装置40に対する操作に応じて音量の調整やイコライジング、所定の周波数を上回る周波数成分を遮断するなどの各種音響処理が楽音データASに施される。このようにして加工処理が施された楽音データは、第1時間軸圧伸部16aや第2時間軸圧伸部16bによる時間軸圧伸処理を施されることなく、データ出力部18によって再生テンポに応じた時間間隔で出力装置30へ順次出力される(ステップSA120)。
以上説明したように、このノーマルモードの処理においては、楽音データASに対して時間長の調整は施されないため、素片SSの時間長は必ずしも再生テンポに応じた長さとなっていない。このため、各素片SSのつなぎ目で無音が生じたり、ループ全体に亘ってのリズムが不自然になるといった不具合が生じ得る。このような不具合が生じた場合、楽曲処理装置100の利用者は、入力装置40を操作して素片の時間長調整の実行を指示することができる。このようにして時間長調整の実行を指示されると、図3に示すように、制御装置10は、その動作モードをリアルタイム処理モードへと切り換える。
(A−2:リアルタイム処理モードにおける動作)
このモードは、第1のキャッシュメモリに読み出された楽音データASに対してリアルタイム時間軸圧伸処理(図4では、リアルタイム圧伸処理と表記)を施しつつ出力するモードである。図4(B)は、リアルタイム処理モードにおける処理の流れを示すフロー図である。図4(B)と図4(A)とを比較すれば明らかように、リアルタイム処理モードにおいては、加工処理(ステップSA110)が施された楽音データに対して第1時間軸圧伸部16aによる時間軸圧伸処理(すなわち、リアルタイム圧伸処理:ステップSA115)を施した後に出力(ステップSA120)する点がノーマルモードにおける処理と異なる。
リアルタイム処理モードにて出力装置30へ出力される楽音データASには、その時間長を再生指示の示す時間長とする時間軸圧伸処理が施されている。このため、各素片SSのつなぎ目で無音が生じたり、ループ全体に亘ってのリズムが不自然になることはない。しかしながら、リアルタイム時間軸圧伸処理は、処理速度が高速であるものの、高音質な処理結果は得られない。このため、楽曲処理装置100の利用者は、リアルタイム処理モードにて再生される楽曲の音質に不満を抱く場合がある。このような場合、本実施形態では、入力装置40に対する操作により、リアルタイム時間軸圧伸処理からオフライン時間軸圧伸処理へと切り換えることを指示することができる。そして、このような指示が為される、制御装置10は、図3に示すように、その動作モードを切り換え準備モードへと切り換える。
(A−3:切り換え準備モードにおける動作)
このモードは、楽音データASに対する時間軸圧伸処理をリアルタイム時間軸圧伸処理からオフライン時間軸圧伸処理へ切り換える準備を行う動作モードである。本実施形態において、リアルタイム時間軸圧伸処理からオフライン時間軸圧伸処理へ即座に切り換えるのではなく、このような切り換え準備モードを経由する理由は、以下の通りである。すなわち、オフライン時間軸圧伸処理は、リアルタイム時間軸圧伸処理に比較して高音質な処理結果が得られるものの、演算量が多く、その処理速度が低速であるため、リアルタイム時間軸圧伸処理から即座にオフライン時間軸圧伸処理へ切り換えてしまうと、オフライン時間軸圧伸処理が間に合わず、楽曲のリアルタイム再生に支障が生じる虞があるからである。
図4(C)は、切り換え準備モードにおける処理の流れを示すフロー図である。この切り換え準備モードにおいては、記憶装置20から第1のキャッシュメモリへ読み出した楽音データASに対して加工処理(ステップSA110)およびリアルタイム時間軸圧伸処理(ステップSA115)を施して出力(ステップSA120)する点では、前述したリアルタイム処理モードにおける動作と同一である。しかし、この切り換え準備モードにおいては、これらの処理と並列に、素片読出部14によって記憶装置20から順次読み出される楽音データAS(i=1、2・・・)に対してオフライン時間軸圧伸処理(図4では、オフライン圧伸処理と表記)を施し、その処理結果を上記第1のキャッシュメモリとは異なる第2のキャッシュメモリへ蓄積する(ステップSA200)点が前述したリアルタイム処理モードにおける処理と異なる。そして、制御装置10は、上記第2のキャッシュメモリに充分な数の楽音データ(すなわち、オフライン時間軸圧伸処理済みの楽音データAS)が蓄積されたことを契機として、その動作モードをオフライン処理モードへ切り換える(図3参照)。ここで、第2のキャッシュメモリに蓄積されている楽音データの個数が幾つになったときに、充分な数の楽音データが蓄積されたと判定するのかについては種々の態様が考えられる。例えば、再生指示の示す全ての素片SSに対応する楽音データASが第2のキャッシュメモリに蓄積された場合に充分な数に達したと判定する態様や、第2時間軸圧伸部16bによる処理を開始してから所定時間が経過した場合に、第2のキャッシュメモリに充分な個数の楽音データが蓄積されたと判定する態様などが考えられる。
(A−4:オフライン処理モードにおける動作)
図4(D)は、オフライン処理モードにおける処理の流れを示すフロー図である。このモードにおいては、切り換え準備モードにて第2のキャッシュメモリに蓄積された楽音データAS(すなわち、第2時間軸圧伸部16bによる時間軸圧伸処理が施された楽音データAS)を順次読出し、前述した加工処理(ステップSA110)を施して出力する処理が実行される。例えば、切り換え準備モードからオフライン処理モードへ切り換える直前に、リアルタイム時間軸圧伸処理を施して出力した楽音データが楽音データASである場合には、このオフライン処理モードにおいては楽音データASm+1から順にキャッシュメモリから読み出して出力する処理が実行される。前述したように、オフライン時間軸圧伸処理により時間軸圧伸を施した場合には、リアルタイム時間軸圧伸処理による場合に比較して音質が向上する。
以降、オフライン処理モードでの動作中に入力装置40に対する操作によりノーマルモード或いはリアルタイム処理モードへの切り換えが指示されると、制御装置10は、図3にて二点鎖線或いは一点鎖線で示すように、当該指示されたモードに動作モードを切り換える。すなわち、ノーマルモードへの切り換えを指示された場合には、図4(A)に示す処理を実行し、リアルタイム処理モードへの切り換えを指示された場合には、図4(B)に示す処理を実行する。なお、本実施形態では、素片の時間長調整の実行を指示された場合には、まず、リアルタイム処理モードに動作モードを切り換え、その後、オフライン処理への切り換えを指示されたことを契機として、切り換え準備モードを経てオフライン処理モードへ動作モードを切り換えた。しかし、時間長調整の実行を指示された場合に、動作モードを切り換え準備モードへ切り換え、その後、第2のキャッシュに充分な数の楽音データが蓄積されたことを契機として動作モードをオフライン処理モードへ切り換えるようにしても勿論良い。
以上に説明したように、本第1実施形態においては、主楽曲を構成する各素片SMが、複数の副楽曲のうち音楽的な特徴が類似する素片SSに置換される。したがって、利用者が各楽曲の類似性や調和性について熟知していない場合であっても、主楽曲の曲調を損なうことなく聴感上において自然な楽曲を生成することが可能である。また、本第1実施形態では、各楽曲が拍に同期した時点で素片に区分されるとともに、時間軸圧伸処理の実行が指示された後は副楽曲の素片SSが再生テンポに応じた時間長(或いは、その再生テンポで主楽曲を再生する際の各素片SMの時間長)に調整されたうえで上記置き換えが行われる。このため、各素片SSのつなぎ目で無音が生じたり、リズムが不自然になったりするといった不具合が生じることはない。さらに、本実施形態では、リアルタイム時間軸圧伸処理とオフライン時間軸圧伸処理を上記のように切り換えて実行するようにしたため、リアルタイム時間軸圧伸処理のみで時間軸圧伸を行う場合に比較して、高い音質の楽曲が得られ、また、オフライン時間軸圧伸処理のみで時間軸圧伸を行う場合に比較して、時間軸圧伸処理の実行を指示してからその効果が表れるまでの応答時間を短くすることができる。
(B:第2実施形態)
上述した第1実施形態では、主楽曲の各素片SMの楽音データAMを、複数の副楽曲の素片のうち素片SMとの類似度が最も高い素片SSの楽音データASに適宜時間軸圧伸を施しつつ置き換えて出力した。しかしながら、このようにして順次出力される楽音データ列AS、ASi+1、ASi+2・・・の各々は、同一の副楽曲にて互いに隣り合っていた素片に対応する楽音データであるとは限らず、素片SS、SSi+1、SSi+2の各々のつなぎ目で音が急変するなどの不具合が起こり得る。
このような不具合を回避するために、図5(A)に示すように、各素片にその一つ手前の素片との境界を跨いでフェードインする一方、後続の素片との境界を跨いでフェードアウトするエンベロープを付与し、クロスフェードにより各素片のつなぎ目を滑らかにすることが考えられる。このようなエンベロープの付与は、素片読出部14に以下の処理を行わせることで実現することができる。例えば、再生指示の示す素片SSが、ある副楽曲の先頭からn番目の素片Sである場合、その素片Sの波形を表す楽音データAとともに、その副楽曲にて素片Sの一つ手前に位置する素片Sn−1の波形を示す楽音データAn−1と、その副楽曲にて素片Sに後続する素片Sn+1の音波形を表す楽音データAn+1とを読み出す処理を素片読出部14に実行させる。そして、これら3つの楽音データに含まれる各サンプルに対して図5(B)に示す窓関数を乗算し、その乗算結果を上記素片SSの波形を示す楽音データASとして出力する処理を素片読出部14に実行させるのである。
しかし、本実施形態における各素片は、楽曲を拍に同期した時点で区分することにより得られるものであるため、図5(A)に示すようなエンベロープの付与を行うと、以下のような問題が生じ得る。すなわち、楽曲を拍に同期した時点で区分して得られる素片Sn−1、S、Sn+1・・・の各々には、図5(B)に示すように、その冒頭部分に拍に対応したアタック(例えば、打楽器音のアタック)が含まれている。このため、図5(B)に示す窓関数の乗算により各素片にその前後の素片との境界を跨いでフェードイン、フェードアウトするエンベロープを付与すると、そのフェードアウト部分には後続の素片の冒頭に位置するアタックが含まれることとなる。このようなアタック部分の音が再生されると、各素片の切れ目でリズムに乱れが生じてしまう。
そこで、本実施形態では、図5(C)に示すように素片内にてフェードアウトするエンベロープを付与するとともに、素片の手前(図5(C)では、EAO秒手前)からその素片の冒頭まででフェードインするエンベロープを付与することとした。このような態様によれば、各素片SSのつなぎ目が滑らかになり、そのつなぎ目で音が急変するといった不具合が回避されるとともに、各素片の末尾に不要なアタックが含まれることが回避され、ループ全体に亘ってのリズムに乱れが生じないといった効果を奏する。なお、ループの先頭に位置する素片に対応する楽音データASには、フェードイン部を設ける必要がないことは言うまでもない。また、時間軸圧伸の比率がa倍であり、かつ、ピッチ比をb倍としてループの再生を行う場合には、各素片に対応する楽音データASを本来の再生開始タイミング(エンベロープの付与や時間軸圧伸を行わず、ピッチ比を1倍で再生する場合の再生タイミング)に対して(a×EAO)/b[秒]だけ早くその再生を開始する必要がある。
(C:他の実施形態)
以上、本発明の第1および第2実施形態について説明したが、これらの実施形態に以下に述べる変形を加えても勿論良い。
(1)上述した各実施形態では、オフライン処理の実行を指示されてからそのオフライン処理が完了するまでの間は、リアルタイム時間軸圧伸処理を施した楽音データASで楽音データAMを置換し、そのオフライン処理が完了した時点でオフライン時間軸圧伸処理を施した楽音データASによる置き換えに切り換えた。しかし、オフライン処理が完了した時点からの経過時点に応じて混合比RRを0から1まで次第に大きくしつつ、リアルタイム時間軸圧伸処理を施した楽音データASとオフライン時間軸圧伸処理を施した楽音データASとを1−RR:RRの比率でミキシングし、そのミキシング結果で楽音データAMを置き換えるようにしても良い。このような態様によれば、リアルタイム時間軸圧伸処理とオフライン時間軸圧伸処理の変わり目を目立たなくすることができる、といった効果を奏する。
(2)上述した各実施形態では、時間軸圧伸処理を施しつつ、主楽曲を構成する各素片SMの楽音データAMをその素片SMの特徴量FMとの類似度が最も高い特徴量の素片SSの楽音データAMで置き換えたが、両特徴量から算出される類否指標値Rが所定の閾値を超えていない場合には、上記置き換えを行わず、楽音データAMをそのまま出力するようにしても勿論良い。また、素片SMの特徴量FMとの類似度が最も低い特徴量の素片の楽音データで置き換えても勿論良い。このような態様によれば、主楽曲とは曲調が全く異なる新たな楽曲を生成することが可能になる。
(3)上述した実施形態では、記憶装置20に記憶されている複数の楽曲のうちの1つを主楽曲とし、この主楽曲から画定されるループ(或いは、主楽曲全体)の各素片を他の楽曲の素片で置き換えて新たな楽曲を生成した。このような態様においては、主楽曲の各素片の特徴量が、再生するべき素片を示す情報の役割を果たすのである。しかし、新たな楽曲の構成要素となる素片(すなわち、再生するべき素片)を利用者に指定させ、これらの素片の各々を時間長の調整を施しつつ利用者により指定された再生テンポで再生する態様であっても勿論良い。このような態様においては、各素片の音波形を示す楽音データのみを記憶装置20に記憶させておけば良い。
(4)上述した各実施形態では、制御装置10がプログラムを実行することで、時間軸圧伸処理を施しつつ、主楽曲を構成する各素片SMの楽音データAMをその素片SMの特徴量FMとの類似度が最も高い特徴量の素片SSの楽音データAMに置き換えることが実現される構成を例示した。しかし、楽曲処理装置100は、図1の制御装置10と同様の処理を実行するDSPなどのハードウェア(電子回路)によっても実現しても勿論良い。また、図1に示す各機能体(再生指示生成部12、素片読出部14、第1時間軸圧伸部16a、第2時間軸圧伸部16bおよびデータ出力部18)として制御装置10を機能させるプログラムを、例えばCD−ROM(Compact Disk-Read Only memory)などのコンピュータ装置読取可能な記録媒体に書き込んで配布しても良く、また、インターネットなどの電気通信回線経由のダウロードにより配布しても良い。
この発明の第1実施形態に係る楽曲処理装置100の構成を示す図である。 楽曲とループ、および素片の関係を示す概念図である。 楽曲処理装置100の4つの動作モードのモード間遷移を説明するための図である。 上記各動作モードにおける処理の流れを説明するための図である。 第2実施形態における素片と楽音データとの対応関係を説明するための図である。 複数の楽曲の各素片を連結して新たな楽曲を生成する従来技術の問題点を説明するための図である。
符号の説明
100…楽曲処理装置、10…制御装置、20…記憶装置、30…出力装置、40…入力装置、50…表示装置、S…素片(SM:主楽曲の素片/SS:副楽曲の素片)、A…楽音データ(AM:主楽曲の楽音データ/AS:副楽曲の楽音データ)、F…特徴量(FM:主楽曲の素片の特徴量/FS:副楽曲の素片の特徴量)、R…類否指標値。

Claims (5)

  1. 楽曲を区分した各素片の波形を示す楽音データを記憶する記憶手段と、
    再生すべき素片を指定する情報と再生時における素片の時間長とを指定する情報とを含む再生指示を生成する再生指示生成手段と、
    前記再生指示により指定された素片の楽音データを前記記憶手段から読み出す読出手段と、
    前記再生指示に応じて前記記憶手段から読み出された楽音データに対し、前記再生指示により指定された時間長の素片とするための第1の時間軸圧伸処理を施す第1の時間軸圧伸処理手段と、
    前記再生指示に応じて前記記憶手段から読み出された楽音データに対し、前記再生指示により指定された時間長の素片とするための時間軸圧伸処理であって、前記第1の時間軸圧伸処理よりも演算量が多く、処理速度が遅い第2の時間軸圧伸処理を施す第2の時間軸圧伸処理手段と、
    前記再生指示に応じて、前記第1の時間軸圧伸処理の結果得られる楽音データを出力し、その後、前記第1の時間軸圧伸処理の結果得られる楽音データの代わりに、前記第2の時間軸圧伸処理の結果得られる楽音データを出力するデータ出力手段と、
    を有することを特徴とする楽曲処理装置。
  2. 前記再生指示手段は、再生すべき素片を連ねて得られる楽曲の再生テンポを指定させ、再生時における各素片の時間長を当該再生テンポに応じた一定の時間長とすることを特徴とする請求項1に記載の楽曲処理装置。
  3. 前記再生指示生成手段は、再生すべき素片の各々について再生時における当該素片の時間長を指定することを特徴とする請求項1に記載の楽曲処理装置。
  4. 前記読出手段は、前記再生指示に応じて前記記憶手段から読み出す楽音データの各々に、その楽音データの表す素片内でフェードアウトするエンベロープを付与する一方、当該楽音データが他の楽音データに後続して出力される場合には、当該楽音データの表す素片の手前からフェードインするエンベロープを付与することを特徴とする請求項1から3の何れか1に記載の楽曲処理装置。
  5. コンピュータ装置を、
    楽曲を区分した各素片の波形を示す楽音データを記憶する記憶手段と、
    再生すべき素片を指定する情報と再生時における素片の時間長とを指定する情報とを含む再生指示を生成する再生指示生成手段と、
    前記再生指示により指定された素片の楽音データを前記記憶手段から読み出す読出手段と、
    前記再生指示に応じて前記記憶手段から読み出された楽音データに対し、前記再生指示により指定された時間長の素片とするための第1の時間軸圧伸処理を施す第1の時間軸圧伸処理手段と、
    前記再生指示に応じて前記記憶手段から読み出された楽音データに対し、前記再生指示により指定された時間長の素片とするための時間軸圧伸処理であって、前記第1の時間軸圧伸処理よりも演算量が多く、処理速度が遅い第2の時間軸圧伸処理を施す第2の時間軸圧伸処理手段と、
    前記再生指示に応じて、前記第1の時間軸圧伸処理の結果得られる楽音データを出力し、その後、前記第1の時間軸圧伸処理の結果得られる楽音データの代わりに、前記第2の時間軸圧伸処理の結果得られる楽音データを出力するデータ出力手段、
    として機能させることを特徴とするプログラム。
JP2008287605A 2008-11-10 2008-11-10 楽曲処理装置およびプログラム Expired - Fee Related JP5359203B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008287605A JP5359203B2 (ja) 2008-11-10 2008-11-10 楽曲処理装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008287605A JP5359203B2 (ja) 2008-11-10 2008-11-10 楽曲処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2010113277A true JP2010113277A (ja) 2010-05-20
JP5359203B2 JP5359203B2 (ja) 2013-12-04

Family

ID=42301854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008287605A Expired - Fee Related JP5359203B2 (ja) 2008-11-10 2008-11-10 楽曲処理装置およびプログラム

Country Status (1)

Country Link
JP (1) JP5359203B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016218345A (ja) * 2015-05-25 2016-12-22 ヤマハ株式会社 音素材処理装置および音素材処理プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003280664A (ja) * 2002-03-20 2003-10-02 Yamaha Corp 音楽波形のタイムストレッチ装置および方法
JP2008129135A (ja) * 2006-11-17 2008-06-05 Yamaha Corp 楽曲加工装置およびプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003280664A (ja) * 2002-03-20 2003-10-02 Yamaha Corp 音楽波形のタイムストレッチ装置および方法
JP2008129135A (ja) * 2006-11-17 2008-06-05 Yamaha Corp 楽曲加工装置およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016218345A (ja) * 2015-05-25 2016-12-22 ヤマハ株式会社 音素材処理装置および音素材処理プログラム

Also Published As

Publication number Publication date
JP5359203B2 (ja) 2013-12-04

Similar Documents

Publication Publication Date Title
US10388290B2 (en) Multifunctional audio signal generation apparatus
JP4207902B2 (ja) 音声合成装置およびプログラム
JP3399297B2 (ja) 電子楽器
JP3744216B2 (ja) 波形形成装置及び方法
JP6191459B2 (ja) オーディオ波形データを使用する自動演奏技術
US9147388B2 (en) Automatic performance technique using audio waveform data
JP4274152B2 (ja) 楽音合成装置
JP2006251375A (ja) 音声処理装置およびプログラム
JP6019803B2 (ja) 自動演奏装置及びプログラム
JP4802857B2 (ja) 楽音合成装置及びプログラム
JP2010113278A (ja) 楽曲処理装置およびプログラム
JP4561636B2 (ja) 楽音合成装置及びプログラム
JP5359203B2 (ja) 楽曲処理装置およびプログラム
JPH11167382A (ja) 波形形成装置及び方法
JP2001282246A (ja) 波形データ時間伸張圧縮装置
JP3613191B2 (ja) 波形生成方法及び装置
JP3744247B2 (ja) 波形圧縮方法及び波形生成方法
JP2005037964A (ja) 波形生成装置及び方法
JP3095018B2 (ja) 楽音発生装置
JP3788096B2 (ja) 波形圧縮方法及び波形生成方法
JP2001215973A (ja) 楽音制御パラメータ生成方法、楽音制御パラメータ生成装置および記録媒体
JP3876896B2 (ja) 波形生成方法及び装置
JP3862839B2 (ja) 波形圧縮伸長装置
JP3933162B2 (ja) 波形生成方法及び装置
JPH10307581A (ja) 波形データ圧縮装置および方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110919

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130212

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20130403

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130408

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20130403

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130806

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130819

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees