JP5549651B2 - 歌詞出力データ修正装置,及びプログラム - Google Patents

歌詞出力データ修正装置,及びプログラム Download PDF

Info

Publication number
JP5549651B2
JP5549651B2 JP2011167210A JP2011167210A JP5549651B2 JP 5549651 B2 JP5549651 B2 JP 5549651B2 JP 2011167210 A JP2011167210 A JP 2011167210A JP 2011167210 A JP2011167210 A JP 2011167210A JP 5549651 B2 JP5549651 B2 JP 5549651B2
Authority
JP
Japan
Prior art keywords
output
sound
lyrics
musical
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011167210A
Other languages
English (en)
Other versions
JP2013029762A (ja
Inventor
久美 太田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2011167210A priority Critical patent/JP5549651B2/ja
Priority to PCT/JP2012/058542 priority patent/WO2013018397A1/ja
Publication of JP2013029762A publication Critical patent/JP2013029762A/ja
Application granted granted Critical
Publication of JP5549651B2 publication Critical patent/JP5549651B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/361Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
    • G10H1/366Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems with means for modifying or correcting the external signal, e.g. pitch correction, reverberation, changing a singer's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2220/00Input/output interfacing specifically adapted for electrophonic musical tools or instruments
    • G10H2220/005Non-interactive screen display of musical or status data
    • G10H2220/011Lyrics displays, e.g. for karaoke applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/325Synchronizing two or more audio tracks or files according to musical features or musical timings

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Description

本発明は、楽譜データに対応付けて規定された歌詞の出力タイミングを、楽曲データに時間同期させるように修正する歌詞出力データ修正装置、及びプログラムに関する。
従来、歌声と伴奏音とを含む楽曲の音楽音響信号に対し、音楽音響信号とは別に用意された歌詞を時間軸に沿って対応付けるシステムが知られている(例えば、特許文献1参照)。
この種のシステムでは、音楽音響信号に含まれるボーカル音声に対応する信号(以下、ボーカル信号とする)から、予め規定された特徴量を抽出し、機械学習によって予め生成した識別器(いわゆる識別モデル)に照合する音声認識によって、ボーカル音声の音素の各々を特定している。さらに、この種のシステムでは、それらの特定した音素の各々と、歌詞を構成する各文字とを、時間軸に沿って順次対応付けることがなされている。
特開2008−134606号公報
ところで、特許文献1に記載のシステムでは、ボーカル音声中の音素を特定するために、音声認識処理を用いており、認識フェーズにおいて各音素を特定するまでの処理量が膨大なものとなる。特に、特許文献1に記載のシステムにおいては、音声認識に用いる識別モデルを、機械学習によって生成しているため、学習フェーズに要する処理量は膨大なものとなる。
つまり、特許文献1に記載のシステムでは、歌詞を構成する各文字を対応付けるべき、音楽音響信号での時刻を特定するまでに要するトータルの処理量が膨大なものとなるという問題があった。
そこで、本発明は、より簡易な方法で、歌詞を構成する文字を、当該文字に対応する音楽音響信号での時刻に対応付けることを目的とする。
上記目的を達成するためになされた本発明の歌詞出力データ修正装置では、楽音推移取得手段が、対象楽曲を構成する楽音の音圧が時間軸に沿って推移した楽音推移波形を取得し、出力音推移取得手段が、対象楽曲を模擬した楽曲の楽譜を表し、音源モジュールから出力される個々の出力音について、少なくとも音高及び演奏開始タイミングが規定された楽譜データに基づいて、出力音の音圧が時間軸に沿って推移した出力音推移波形を取得する。
そして、歌詞出力データ取得手段が、対象楽曲の歌詞を構成する歌詞構成文字の出力タイミングである歌詞出力タイミングを規定するデータであり、かつ歌詞構成文字の少なくとも1つに対する歌詞出力タイミングが、楽譜データに対して規定された少なくとも1つのタイミングである特定開始タイミングと対応付けられた歌詞出力データを取得する。
さらに、時間ズレ量導出手段が、楽音推移取得手段にて取得した楽音推移波形から抽出した該楽音推移波形の特性を表す楽音情報と、出力音推移取得手段にて取得した出力音推移波形から抽出した該出力音推移波形の特性を表す出力音情報とを比較した結果に基づき、出力音の各々の演奏開始タイミングに対する、各出力音に対応する楽音の演奏開始タイミングのズレ量を表す時間ズレ量を導出する。
そして、タイミング修正手段が、楽音の演奏開始タイミングに一致するように、歌詞出力データ取得手段で取得した歌詞出力データにおける歌詞出力タイミングを、時間ズレ量導出手段で導出された時間ズレ量に従って修正した修正歌詞出力タイミングを規定する。
本発明の時間ズレ量導出手段では、楽音変化導出手段が、楽音推移波形から、該楽音推移波形の非調波成分である楽音非調波を抽出し、時間軸に沿った楽音非調波の変化を表す楽音変化を、楽音情報として導出し、出力音変化導出手段が、出力音推移波形から、該出力音推移波形の非調波成分である出力音非調波を抽出し、時間軸に沿った出力音非調波の変化を表す出力音変化を、出力音情報として導出する。
すると、時間相関導出手段が、楽音変化と出力音変化との相関値を表す時間相関値を、楽音変化の時間軸上に規定された基準位置に、出力音変化の時間軸上に設定された設定位置を一致させて出力音変化を時間軸に沿って伸縮する毎に導出すると共に、設定位置を規定範囲内で時間軸に沿って順次変更し、その時間相関導出手段にて導出された時間相関値の中で、値が最大となる時間相関値に対応する出力音変化の伸縮率及び設定位置を、時間補正量導出手段が、時間補正量(時間ズレ量)として導出する。
このような歌詞出力データ修正装置によれば、歌詞出力データにおける歌詞出力タイミングを、対象楽曲を構成する楽音の演奏開始タイミングに対して、時間軸に沿って一致したものへと修正することができる。
そして、本発明の歌詞出力データ修正装置によれば、歌詞出力タイミングを修正する(即ち、修正歌詞出力タイミングを規定する)際に、音声認識処理を一切実行する必要がない。よって、本発明の歌詞出力データ修正装置によれば、歌詞構成文字を対応付けるべき、楽音の演奏開始タイミング(即ち、楽音推移波形(音楽音響信号)での時刻)を特定するまでに要するトータルの処理量を、特許文献1に記載された装置に比べて低減できる。
換言すれば、本発明の歌詞出力データ修正装置によれば、より簡易な方法で、歌詞構成文字を、当該歌詞構成文字に対応する楽音の演奏開始タイミング(即ち、楽音推移波形(音楽音響信号)での時刻)に対応付けることができる。
さらに、音源モジュールを備えていない装置に、本発明の歌詞出力データ修正装置にて修正された歌詞出力データを、個々の歌詞構成文字を表す歌詞テロップデータ、及び楽曲音響データと共に配信するシステムを想定する。このとき、当該装置にて、楽曲音響データの再生に併せて、楽曲音響データ中の楽音に時間同期させて、歌詞構成文字を出力すれば、当該装置においても、カラオケを楽しむことができる。
なお、ここで言う楽音推移波形には、例えば、対象楽曲を構成する全ての楽音の音圧が時間軸に沿って推移したアナログ波形を標本化(サンプリング)したものを含む。また、ここでいう出力音推移波形には、対象楽曲を模擬した楽曲をMIDI形式にて表したデータをレンダリングすることで生成した音声信号を含む。
さらに、ここで言う歌詞構成文字とは、歌詞を構成する文字の各々であっても良いし、その文字の各々を特定の規則に従って一群とした文節やフレーズであっても良い。
一般的に、楽音推移や出力音推移に含まれる非調波成分は、リズムを刻む楽器(例えば、ドラムやベース)の楽器音であることが多い。
このリズムを刻む楽器の楽器音は、他の楽器音に比して確実に検出できる。このため、本発明の歌詞出力データ修正装置にて導出される時間ズレ量は、楽譜データにおける個々の出力音の演奏開始タイミングと、楽音の演奏開始タイミングとをより確実に一致させることが可能なものとなる。
よって、本発明の歌詞出力データ修正装置によれば、修正歌詞出力タイミングを、楽音の演奏開始タイミングにより確実に一致させることができる。
さらに、本発明の歌詞出力データ修正装置では、音高補正量導出手段が、楽音情報の1つと、出力音情報の1つとを比較した結果に基づき、出力音の音高が、該出力音に対応する楽音の音高に一致するように音高補正量を導出し、楽譜データ修正手段が、楽譜データに規定された出力音の各々の音高を、音高補正量導出手段で導出した音高補正量に従ってシフトすることで、楽譜データを修正した修正楽譜データを生成しても良い。
この場合、時間ズレ量導出手段は、修正楽譜データに基づく出力音推移波形である修正音推移波形を、出力音推移取得手段で取得した出力音推移波形としても良い。
このような歌詞出力データ修正装置によれば、出力音推移取得手段で取得した出力音推移波形が修正音推移波形となるため、楽音推移波形との間の音高ズレが最小限に抑制され、時間ズレ量の導出精度を向上させることができる。この結果、本発明の歌詞出力データ修正装置によれば、修正歌詞出力タイミングを楽音の出力タイミングにより確実に一致させることができる。
そして、本発明の歌詞出力データ修正装置における音高補正量導出手段では、楽音分布導出手段が、楽音推移波形に含まれる周波数と各周波数の強さとを表し、該周波数の強さについて正規化した楽音音高分布を、楽音情報の一つとして導出し、出力音分布導出手段が、出力音推移波形に含まれる周波数と各周波数の強さとを表し、該周波数の強さについて正規化した出力音高分布を、出力音情報の一つとして導出し、音高相関導出手段が、出力音高分布と楽音音高分布との相関値を表す音高相関値を、楽音音高分布の予め規定された規定位置から出力音高分布を周波数軸に沿ってシフトさせる毎に導出しても良い。この場合、音高補正量導出手段は、音高相関導出手段にて導出された音高相関値の中で、値が最大となる音高相関値に対応する規定位置からの周波数軸に沿ったシフト量を、音高補正量として導出しても良い。
このように導出される音高補正量に従って楽譜データを修正すれば、修正後の出力音推移波形に含まれる周波数及び各周波数の強さの比率を、楽音推移波形に含まれる周波数及び各周波数の強さの比率に、より近似させることができる。
特に、本発明の歌詞出力データ修正装置で導出される楽音音高分布及び出力音高分布は、楽音推移波形及び出力音推移波形に含まれる周波数と各周波数の強さのうち、周波数の強さについて正規化されている。このため、本発明の歌詞出力データ修正装置によれば、楽音推移波形の振幅と、出力音推移波形の振幅とが大きく異なっていたとしても、修正楽譜データに基づく出力音推移波形を楽音推移波形に近づけることができる。
なお、本発明において、歌詞出力データは、歌詞構成文字のうちの少なくとも一部について、特定開始タイミングからの経過時間によって歌詞出力タイミングが規定されていても良い。
この場合、本発明の歌詞出力データ修正装置では、対応付手段が、少なくとも、経過時間によって歌詞出力タイミングが規定された歌詞構成文字の歌詞出力タイミングについて、修正歌詞出力タイミングを規定しても良い。
このような歌詞出力データ修正装置によれば、1つの歌詞構成文字からの経過時間によって歌詞出力タイミングが規定された歌詞出力データであっても、修正歌詞出力タイミングを規定できる。
なお、経過時間によって歌詞出力タイミングが規定された歌詞構成文字の修正歌詞出力タイミングの規定は、各歌詞構成文字の歌詞出力タイミングを、当該歌詞構成文字に対応する出力音の演奏開始タイミングと対応付けた上で実施しても良いし、当該対応付けを行うことなく実施しても良い。この対応付けの具体的な方法としては、対象楽曲においてテンポが一定の区間を特定し、そのテンポが一定の同一区間について、楽譜データに含まれる出力音の演奏開始タイミングを、歌詞出力データに含まれる歌詞構成文字の歌詞出力タイミングとを対応付けても良い。また、例えば、楽譜データがMIDI(Music Instrument Digital Interface)規格のデータとして予め生成されたものである場合、歌詞出力データにおける歌詞出力タイミングを表すMIDIのトラックを新たに追加することが考えられる。すなわち、新たに追加したトラックにおいて、歌詞構成文字の各々の歌詞出力タイミングを、各歌詞構成文字に対応する出力音の演奏開始タイミングと対応付けて表しても良い。
ところで、本発明において、楽譜データは、少なくとも一部の出力音の演奏開始タイミングが、特定開始タイミングとして規定されており、歌詞出力データは、歌詞構成文字の各々の歌詞出力タイミングに、当該歌詞構成文字に対応する出力音の演奏開始タイミングが対応付けられていても良い。
この場合、本発明におけるタイミング修正手段は、歌詞構成文字の各々について、修正歌詞出力タイミングを規定しても良い。
このような歌詞出力データ修正装置によれば、歌詞構成文字の各々の歌詞出力タイミングに、当該歌詞構成文字に対応する出力音の演奏開始タイミングが対応付けられた歌詞出力データを生成できる。
さらに、本発明では、演奏開始タイミング補正手段が、出力音の演奏開始タイミングを、時間ズレ量シフトさせた修正演奏開始タイミングを導出し、タイミング修正手段が、演奏開始タイミング補正手段で導出された修正演奏開始タイミングを、修正歌詞出力タイミングとしても良い。
このような歌詞出力データ修正装置によれば、修正歌詞出力タイミングを修正演奏開始タイミングに置き換えることができる。
また、本発明では、演奏開始タイミング補正手段が、出力音の演奏開始タイミングを、時間ズレ量シフトさせた修正演奏開始タイミングを導出し、タイミング修正手段が、その修正演奏開始タイミングと出力音の演奏開始タイミングとの差分、歌詞出力タイミングをシフトさせることで、修正歌詞出力タイミングを規定しても良い。
このような歌詞出力データ修正装置によれば、修正歌詞出力タイミングを、修正演奏開始タイミングと出力音の演奏開始タイミングとの差分、歌詞出力タイミングをシフトさせることで規定できる。
なお、本発明は、コンピュータを歌詞出力データ修正装置として機能させるためのプログラムであっても良い。
本発明がプログラムとしてなされている場合、そのプログラムでは、楽音推移取得手順にて、対象楽曲を構成する楽音の音圧が時間軸に沿って推移した楽音推移波形を取得し、出力音推移取得手順にて、対象楽曲を模擬した楽曲の楽譜を表し、音源モジュールから出力される個々の出力音について、少なくとも音高及び演奏開始タイミングが規定された楽譜データに基づいて、出力音の音圧が時間軸に沿って推移した出力音推移波形を取得する。さらに、歌詞出力データ取得手順にて、対象楽曲の歌詞を構成する歌詞構成文字の出力タイミングである歌詞出力タイミングを規定するデータであり、かつ歌詞構成文字の少なくとも1つに対する歌詞出力タイミングが、楽譜データに対して規定された少なくとも1つのタイミングである特定開始タイミングと対応付けられた歌詞出力データを取得する。
そして、時間ズレ量導出手順にて、楽音推移波形から抽出した該楽音推移波形の特性を表す楽音情報と、出力音推移波形から抽出した該出力音推移波形の特性を表す出力音情報とを比較した結果に基づき、出力音の各々の演奏開始タイミングに対する、各出力音に対応する楽音の演奏開始タイミングのズレ量を表す時間ズレ量を導出し、タイミング修正手順にて、楽音の演奏開始タイミングに一致するように、歌詞出力データ取得手順で取得した歌詞出力データにおける歌詞出力タイミングを、時間ズレ量導出手順で導出された時間ズレ量に従って修正した修正歌詞出力タイミングを規定する。
時間ズレ量導出手順は、楽音推移取得手順にて取得した楽音推移波形から、該楽音推移波形の非調波成分である楽音非調波を抽出し、時間軸に沿った楽音非調波の変化を表す楽音変化を、楽音情報として導出する楽音変化導出手順と、出力音推移取得手順にて取得した出力音推移波形から、該出力音推移波形の非調波成分である出力音非調波を抽出し、時間軸に沿った出力音非調波の変化を表す出力音変化を、出力音情報として導出する出力音変化導出手順と、楽音変化導出手順にて導出された楽音変化と、出力音変化導出手順にて導出された出力音変化との相関値を表す時間相関値を、楽音変化の時間軸上に規定された基準位置に、出力音変化の時間軸上に設定された設定位置を一致させて出力音変化を時間軸に沿って伸縮する毎に導出すると共に、設定位置を規定範囲内で時間軸に沿って順次変更する時間相関導出手順と、時間相関導出手順にて導出された時間相関値の中で、値が最大となる時間相関値に対応する出力音変化の伸縮率及び設定位置を、時間補正量として導出する時間補正量導出手順とをコンピュータに実行させ、時間補正量導出手順にて導出した時間補正量を、時間ズレ量とする。
本発明のプログラムが、このようになされていれば、例えば、DVD−ROM、CD−ROM、ハードディスク等のコンピュータ読み取り可能な記録媒体に記録し、必要に応じてコンピュータにロードさせて起動することや、必要に応じて通信回線を介してコンピュータに取得させて起動することにより用いることができる。そして、コンピュータに各手順を実行させることで、そのコンピュータを、請求項1に記載された歌詞出力データ修正装置として機能させることができる。
本発明が適用された情報処理装置を中心に構成された音楽データ配信システムの概略構成を示すブロック図である。 第一実施形態におけるデータ修正処理の処理手順を示すフローチャートである。 音高補正処理の処理手順を示すフローチャートである。 音高補正処理の概要を説明する説明図である。 時間ズレ量導出処理の処理手順を示すフローチャートである。 時間ズレ量導出処理の概要を説明する説明図である。 第二実施形態における歌詞出力データの概要を示す図面である。 第二実施形態におけるデータ修正処理の処理手順を示すフローチャートである。
以下に本発明の実施形態を図面と共に説明する。
[第一実施形態]
〈音楽データ配信システムについて〉
ここで、図1は、本発明が適用された歌詞出力データ修正装置を備えた音楽データ配信システムの概略構成を示すブロック図である。
この音楽データ配信システム1は、歌詞出力データDOを含む音楽データMDを格納する音楽データ格納サーバ3と、音楽データ格納サーバ3に格納された音楽データMDに対して処理を加える情報処理装置20と、情報処理装置20にて処理が加えられた音楽データMDが配信される少なくとも1つの携帯端末5A〜5n(nは、携帯端末の台数を表す1以上の自然数)とを備えている。
〈音楽データ格納サーバについて〉
音楽データ格納サーバ3は、音楽データMD1〜MDm(mは、音楽データの数を表す1以上の自然数)を格納するデータベースとして機能する装置である。本実施形態における音楽データMDには、楽曲音響データDWと、楽曲MIDIデータDMと、歌詞データDLとが含まれる。
このうち、楽曲音響データDWは、1つの楽曲(以下、特定楽曲とする)を構成する全ての楽音の音圧が時間軸に沿って推移したアナログ波形(即ち、楽音推移波形)を標本化(サンプリング)したデータであり、例えば、楽曲毎に予め用意された、WAVやMP3形式の音声ファイルである。
また、楽曲MIDIデータDMは、周知のMIDI(Musical Instrument Digital Interface)規格によって、特定楽曲を模擬した楽曲の楽譜を表すデータ(即ち、本発明の楽譜データに相当)であり、楽曲毎に予め用意されている。この楽曲MIDIデータDMの各々は、楽曲を区別するデータである識別データと、当該楽曲にて用いられる楽器毎の楽譜を表す楽譜トラックと、当該楽曲を分割した区間(例えば、Aメロやサビなど)の各々におけるテンポを表すテンポデータとを少なくとも有している。
このうちの楽譜トラックには、MIDI音源から出力される個々の出力音について、少なくとも、音高(いわゆるノートナンバー)と、音源モジュールが出力音を出力する期間(以下、音符長)とが規定されている。ただし、楽譜トラックの音符長は、当該出力音の出力を開始するまでの当該楽曲の演奏開始からの時間を表す演奏開始タイミング(いわゆるノートオンタイミング)と、当該出力音の出力を終了するまでの当該楽曲の演奏開始からの時間を表す演奏終了タイミング(いわゆるノートオフタイミング)とによって規定されている。
なお、楽譜トラックは、例えば、鍵盤楽器(例えば、ピアノやパイプオルガンなど)、弦楽器(例えば、バイオリンやビオラ、ギター、琴など)、打楽器(例えば、ドラムやシンバル、ティンパニー、木琴など)、及び管楽器(例えば、クラリネットやトランペット、フルート、尺八など)などの楽器毎に用意されている。
歌詞データDLは、周知のカラオケ装置を構成する表示装置に表示される歌詞に関するデータであり、特定楽曲の歌詞を構成する文字(以下、歌詞構成文字)を表す歌詞テロップデータDTと、歌詞構成文字の出力タイミングである歌詞出力タイミングを、楽曲MIDIデータDMの演奏と対応付けるタイミング対応関係が規定された歌詞出力データDOとを備えている。
具体的に、本実施形態におけるタイミング対応関係は、楽曲MIDIデータDMの演奏を開始するタイミング(本発明における特定開始タイミングの一例)に、歌詞テロップデータDTの出力を開始するタイミングが対応付けられた上で、対象楽曲の時間軸に沿った各歌詞構成文字の歌詞出力タイミングが、楽曲MIDIデータDMの演奏を開始からの経過時間によって規定されている。なお、ここでいう経過時間とは、例えば、表示された歌詞構成文字の色替えを実行するタイミングを表す時間であり、色替えの速度によって規定されている。また、ここでいう歌詞構成文字は、歌詞を構成する文字の各々であっても良いし、その文字の各々を時間軸に沿った特定の規則に従って一群とした文節やフレーズであっても良い。
なお、本実施形態におけるタイミング対応関係として、色替えの速度から特定される各歌詞構成文字の出力を終了するタイミング(以下、歌詞出力終了タイミングとする)が、楽曲MIDIデータDMの演奏を開始からの経過時間によって規定されていても良い。
楽曲音響データDWと、楽曲MIDIデータDMと、歌詞データDLとは、それぞれ対応する楽曲毎に対応付けられて、音楽データ格納サーバ3に格納されている。
〈携帯端末について〉
このうち、携帯端末5は、情報処理装置20から取得した楽曲音響データDWを再生可能な端末(例えば、周知の携帯電話)であり、情報受付部6と、表示部7と、音出力部8と、通信部9と、記憶部10と、制御部11とを備えている。
このうちの情報受付部6は、入力装置(図示せず)を介して入力された情報を受け付ける。表示部7は、制御部11からの指令に基づいて、少なくとも、文字コードで示される情報を含む画像を表示する。音出力部8は、少なくとも、楽曲音響データDWを再生して出力するものであり、例えば、PCM音源と、スピーカとを備えている。
通信部9は、通信網(例えば、公衆無線通信網やネットワーク回線)を介して、携帯端末5が外部との間で情報通信を行うものである。記憶部10は、各種処理プログラムや各種データを記憶する。制御部11は、記憶部10に記憶された処理プログラムなどに従って、携帯端末5を構成する各部6,7,8,9,10を制御する。
〈情報処理装置について〉
次に、情報処理装置20について説明する。
この情報処理装置20は、通信部21と、入力受付部22と、表示部23と、音声入力部24と、音声出力部25と、音源モジュール26と、記憶部27と、制御部30とを備えている。
このうち、通信部21は、通信網(例えば、公衆無線通信網やネットワーク回線)を介して、情報処理装置20が外部との間で通信を行う。入力受付部22は、外部からの操作に従って情報や指令の入力を受け付ける入力機器(例えば、キーボードやポインティングデバイス)である。表示部23は、少なくとも、文字コードで示される情報を含む画像を表示する表示装置(例えば、液晶ディスプレイやCRT等)である。また、音声入力部24は、音声を電気信号に変換して制御部30に入力する装置(いわゆるマイクロホン)である。音声出力部25は、制御部30からの電気信号を音声に変換して出力する装置(いわゆるスピーカ)である。
さらに、音源モジュール26は、楽曲MIDIデータDMに基づいて、音源からの音を模擬した音(即ち、出力音)を出力する装置(例えば、MIDI音源)である。記憶部27は、記憶内容を読み書き可能に構成された不揮発性の記憶装置(例えば、ハードディスク装置)である。
また、制御部30は、電源が切断されても記憶内容を保持する必要がある処理プログラムやデータを格納するROM31と、処理プログラムやデータを一時的に格納するRAM32と、ROM31やRAM32に記憶された処理プログラムに従って各処理(各種演算)を実行するCPU33とを少なくとも有した周知のコンピュータを中心に構成されている。
なお、ROM31には、対象楽曲に対応する歌詞出力データDOにおける歌詞出力タイミングを、対象楽曲に対応する楽曲音響データDW中の楽音の演奏開始タイミングに一致するように修正するデータ修正処理を、CPU33が実行するための処理プログラムが格納されている。すなわち、データ修正処理を実行することで、情報処理装置20は、本発明の歌詞出力データ修正装置として機能する。
〈データ修正処理について〉
次に、CPU33が実行するデータ修正処理について説明する。
ここで、図2は、本実施形態におけるデータ修正処理の処理手順を示すフローチャートである。
このデータ修正処理は、入力受付部22を介して、当該データ修正処理を起動するための起動指令が入力されると、実行が開始されるものである。
そして、図2に示すように、データ修正処理は、起動されると、入力受付部22を介して入力された情報によって指定された楽曲(以下、対象楽曲とする)に対応する楽曲MIDIデータDMを、音楽データ格納サーバ3から取得する(S110(Sは、ステップを意味する))。
続いて、対象楽曲に対応する楽曲音響データDWを音楽データ格納サーバ3から取得する(S130)。その取得した楽曲音響データDWから、当該楽曲音響データDWにおける楽音推移波形を取得する(S140)。
そして、S110にて取得した楽曲MIDIデータDMと、S140にて取得した楽音推移波形とに基づいて、対象楽曲を構成する楽音の音高に、出力音の音高が一致するように、当該楽曲MIDIデータDMを修正する音高補正処理を実行する(S150)。以下、出力音について修正が実行された楽曲MIDIデータDMを修正楽曲MIDIデータDMと称す。
さらに、音高補正処理によって、出力音の音高が楽音の音高に一致するように修正された出力音(以下、修正出力音とする)の演奏開始タイミングと、楽音の演奏開始タイミングとのズレ量(以下、時間ズレ量と称す)を導出すると共に、対象楽曲を構成する楽音の演奏開始タイミングに、個々の出力音の演奏開始タイミングが一致するように修正楽曲MIDIデータDMを修正する時間ズレ量導出処理を実行する(S170)。
〈音高補正処理の処理内容について〉
ここで、データ修正処理のS150にて起動される音高補正処理について説明する。
この音高補正処理は、起動されると、図3に示すように、先のS110にて取得した楽曲MIDIデータDMに含まれる全ての楽譜トラックに基づいて、全ての出力音が時間軸に沿って推移した波形である出力音推移波形を取得する(S310)。具体的に、本実施形態における出力音推移波形の取得は、MIDI規格のデータから音声信号(波形)を生成する周知のレンダリングによって実行される。
続いて、その取得した出力音推移波形を、時間軸に沿って設定された単位時間毎に周波数解析(本実施形態では、離散フーリエ変換)して、その単位時間の出力音推移波形に含まれる周波数、及び各周波数における強度を表すパワースペクトルを導出する(S320)。その導出されたパワースペクトルに基づいて、各周波数における強度を、時間軸に沿って周波数毎に相加平均した平均出力音スペクトルを導出する(S330)。その導出した平均出力音スペクトルの周波数における強度を、境界が互いに隣接するように予め規定された周波数範囲(例えば、半音単位、以下、規定音高範囲)毎に平均化して代表値とする(S340)。さらに、そのS340で平均化した平均出力音スペクトルにおける周波数における強度を、分散「1」、平均「0」となるように正規化した正規化出力音スペクトル(図4(A)参照)を導出する(S350)。
続いて、先のS140にて取得した楽音推移波形を、時間軸に沿って設定された単位時間毎に周波数解析して、その単位時間でのパワースペクトルを導出する(S360)。その導出されたパワースペクトルに基づいて、各周波数における強度を、時間軸に沿って周波数毎に相加平均した平均楽音スペクトルを導出する(S370)。その導出した平均楽音スペクトルの周波数における強度を、規定音高範囲毎に平均化して代表値とし(S380)、そのS380で平均化した平均楽音スペクトルの周波数における強度を、分散「1」、平均「0」となるように正規化した正規化楽音スペクトル(図4(B)参照)を導出する(S390)。
なお、本実施形態のS340,S380にて求める代表値は、規定音高範囲における中心値に対応する周波数における強度を代表値としても良い。この場合、具体的には、20Cent毎(半音の5分の1毎)に、20Centグリッドに一番近い周波数の値(パワー)を抽出する処理を行う。
そして、詳しくは、後述するように、正規化出力音スペクトルと正規化楽音スペクトルとの相関値(以下、音高相関値とする)を導出する(S400)。そして、正規化楽音スペクトルに対する正規化出力音スペクトルのシフト量が予め規定された上限値以上であるか否かを判定する(S410)。その判定の結果、シフト量が上限値未満であれば(S410:NO)、正規化出力音スペクトルを、周波数軸に沿って予め規定された規定量シフトして(S420)、S400へと戻り、音高相関値を再度導出する。
すなわち、本実施形態のS400〜S420では、図4(C)に示すように、正規化楽音スペクトルに対して、正規化出力音スペクトルを周波数軸に沿って下限値から上限値に達するまでシフトさせつつ、その正規化出力音スペクトルをシフトさせる毎に、音高相関値を導出する。
そして、正規化出力音のシフト量が上限値以上となると(S410:YES)、対象楽曲を構成する楽音の音高に、出力音の音高を一致させるための補正量(以下、音高補正量とする)を導出する(S430)。本実施形態のS430では、具体的に、先のS400にて導出された全ての音高相関値の中で、値が最大である音高相関値に対応する正規化出力音スペクトルのシフト量を音高補正量として導出する。
続いて、その導出された音高補正量に従って、楽曲MIDIデータDMにおける全ての楽譜トラックに規定された個々の出力音の音高を修正することで、修正楽曲MIDIデータを生成する(S440)。すなわち、本実施形態のS440にて生成される修正楽曲MIDIデータは、出力音の音高が、予め用意された出力音の音高から音高補正量シフトされたものとなる。
そして、その後、本音高補正処理を終了し、データ修正処理へと戻る。
〈時間ズレ量導出処理の処理内容について〉
次に、データ修正処理のS170にて起動される時間ズレ量導出処理について説明する。
この時間ズレ量導出処理は、起動されると、図5に示すように、先のS440にて生成された修正楽曲MIDIデータに含まれる全ての楽譜トラックに基づいて、全ての修正出力音が時間軸に沿って推移した波形である修正音推移波形を取得する(S510)。本実施形態における修正音推移波形の取得は、S310と同様の方法により実行すれば良い。
続いて、その取得した修正音推移波形の非調波成分である出力音非調波を、該修正音推移波形から導出し(S520)、さらに、先のS140で取得した楽音推移波形の非調波成分である楽音非調波を、該楽音推移波形から導出する(S530)。これらの非調波成分の導出は、予め用意されたフィルタに、修正音推移波形または楽音推移波形を通過させることで実行しても良い。
さらに、出力音非調波及び楽音非調波を、それぞれ、時間軸に沿って規定された時間長である特定ブロック毎に分割する(S540)。その分割する特定ブロックは、対象楽曲においてテンポが一定であることを表すテンポ一定区間である。このテンポ一定区間は、楽曲MIDIデータDMのテンポデータに規定されたテンポに従って、テンポが変更される時刻を、各テンポ一定区間の開始時刻、終了時刻として特定することで決定する。なお、楽音非調波の特定ブロックについては、出力音非調波の特定ブロックを決定した後、出力音非調波の特定ブロックそれぞれの開始時刻、終了時刻に相当する対象楽曲の演奏開始からの時刻を、楽音非調波の特定ブロックそれぞれの開始時刻及び終了時刻として特定することで決定する。
そして、S540にて分割された特定ブロックの中から、一組の特定ブロックを選択し(S550)、その一組の特定ブロックについて、楽音非調波、出力音非調波共に、時間軸に沿った変化を表すユニットデータを生成する(S560)。本実施形態におけるユニットデータは、図6(A),(B)に示すように、特定ブロックよりも短い時間長である規定区間毎に、その規定区間内での非調波成分の振幅値を加算した上で、その規定区間毎に加算された値を正規化することによって生成する。なお、以下では、出力音非調波についてのユニットデータを出力音ユニットデータ(本発明における出力音変化に相当)とし、楽音非調波についてのユニットデータを楽音ユニットデータ(本発明における楽音変化に相当)とする。
その出力音ユニットデータの時間軸上に規定された出力音設定位置を、楽音ユニットデータの時間軸上に規定された楽音設定位置に一致させて、出力音ユニットデータと楽音ユニットデータとの相関値(以下、時間相関値とする)を導出する(S570)。そして、楽音ユニットデータに対する出力音ユニットデータの伸縮率が、予め規定された上限値(伸縮率の上限値)以上であるか否かを判定する(S580)。その判定の結果、楽音ユニットデータの伸縮率が、伸縮率の上限値未満であれば(S580:NO)、出力音ユニットデータを、時間軸に沿って予め規定された規定率拡大して(S590)、S570へと戻る。
さらに、楽音ユニットデータの伸縮率が、伸縮率の上限値に達していれば(S580:YES)、楽音ユニットデータに対する出力音ユニットデータの時間軸に沿ったシフト量が、予め規定された上限値(シフト量の上限値)以上であるか否かを判定する(S600)。その判定の結果、楽音ユニットデータのシフト量が、シフト量の上限値未満であれば(S600:NO)、出力音ユニットデータの設定位置を、予め規定された時間シフトして(S610)、出力音ユニットデータの伸縮率を下限値とした上で、S570へと戻る。
すなわち、本実施形態のS570〜S610では、図6(C)に示すように、楽音ユニットデータに対して、出力音ユニットデータの伸縮率が上限値に達するまで拡大する毎に、時間相関値を導出する。そして、このような時間相関値の導出を、楽音ユニットデータに対して、出力音ユニットデータを時間軸に沿ってシフト量の上限値に達するまでシフトさせつつ実行する。
一方、S600での判定の結果、出力音ユニットデータのシフト量が、シフト量の上限値以上であれば(S600:YES)、対象楽曲を構成する楽音の演奏開始タイミングに、修正出力音の演奏開始タイミングを一致させるための補正量、即ち、時間ズレ量を導出する(S620)。本実施形態のS620では、具体的に、一組の特定ブロックに対してS570で導出された全ての時間相関値の中で、値が最大となる時間相関値に対応する出力音ユニットデータの伸縮率及びシフト量を、S550で選択した特定ブロックに対する時間ズレ量として導出する。
その導出された時間ズレ量に従って、個々の出力音の演奏開始タイミングを修正した修正楽譜データを生成する(S630)。本実施形態のS630では、S550で選択した特定ブロックに対する時間ズレ量として導出された、出力音ユニットデータのシフト量と、出力音ユニットデータの伸縮率とに基づいて、出力音の音高が修正された修正楽譜データにおける当該特定ブロックの開始時刻及び終了時刻を修正する。そして、修正前の出力音の演奏開始タイミングの間隔比率が維持されるように、修正後の開始時刻、及び終了時刻にて規定される期間に応じて、出力音の演奏開始タイミングを伸縮させることで、当該特定ブロックに対する個々の出力音の演奏開始タイミングを修正した修正楽譜データを生成する。なお、本実施形態のS630では、出力音の演奏終了タイミングについても修正する。この出力音の演奏終了タイミングの修正方法は、出力音の演奏開始タイミングと同様の方法を用いれば良い。
続いて、S540にて分割した全ての特定ブロックに対して、時間ズレ量を導出したか否かを判定し(S640)、その判定の結果、全ての特定ブロックに対して時間ズレ量を導出していなければ(S640:NO)、S550に戻る。そのS550では、新たな特定ブロックを選択し、S620までのステップを実行する。このS550では、時間長が長いものから順に特定ブロックを取得して、時間ズレ量を導出する。ただし、時間ズレ量が既に導出されている特定ブロックに隣接する特定ブロックでは、既に導出されている特定ブロックの修正後の開始時刻または終了時刻を、自特定ブロックでの値として導出する。
一方、S640での判定の結果、全ての特定ブロックに対して時間ズレ量を導出していれば(S640:YES)、その後、本時間補正処理を終了し、データ修正処理へと戻る。
そのデータ修正処理(図2参照)のS190へと移行すると、S120にて規定した歌詞出力トラックの各歌詞構成文字の歌詞出力タイミングを取得する(S190)。続いて、時間ズレ量導出処理にて導出された時間ズレ量に従って、楽曲音響データDWにおける楽音の演奏開始タイミングに一致するように、S190にて取得した歌詞構成文字の各々の歌詞出力タイミングを修正する(S200)。
具体的に、本実施形態のS200において歌詞出力タイミングを修正する方法は、先のS630における出力音の演奏開始タイミング及び演奏終了タイミングの修正と同様の方法でも良い。
そして、S200にて修正された歌詞出力タイミング(即ち、修正歌詞出力タイミング)及び歌詞出力終了タイミングが規定された歌詞出力データ(即ち、修正歌詞出力データ)DOを生成する(S210)。
その後、本データ修正処理を終了する。
[第一実施形態の効果]
以上説明したように、このようなデータ修正処理によれば、歌詞出力データDOにおける歌詞出力タイミングを、対象楽曲を構成する楽音の演奏開始タイミングに対して、時間軸に沿って一致したものへと修正することができる。
しかも、本実施形態のデータ修正処理では、歌詞出力タイミングを修正する(即ち、修正歌詞出力タイミングを規定する)際に、音声認識処理を一切実行する必要がないため、歌詞構成文字の歌詞出力タイミングを対応付けるべき、楽音の演奏開始タイミングを特定するまでに要するトータルの処理量を、特許文献1に記載された装置に比べて低減できる。
換言すれば、本発明の歌詞出力データ修正装置によれば、より簡易な方法で、歌詞構成文字の歌詞出力タイミングを、当該歌詞構成文字に対応する楽音の演奏開始タイミングに対応付けることができる。
特に、本実施形態のデータ修正処理では、時間ズレ量導出処理の実行前に音高補正処理を実行して、楽音の音高に一致するように修正された出力音の音高を有した修正楽曲MIDIデータDMを生成した上で、その修正楽曲MIDIデータDMから出力音推移波形を取得している。この結果、データ修正処理によれば、出力音推移波形と楽音推移波形との間の音高ズレが最小限に抑制され、時間ズレ量の導出精度を向上させることができる。
ところで、本実施形態のデータ修正処理にて生成される修正歌詞出力データDOは、各歌詞構成文字についての歌詞出力タイミングを、楽曲音響データDWにおける楽音の演奏開始タイミングに一致させるためのデータである。よって、本実施形態の音楽データ配信システム1において、音源モジュールを有していない携帯端末5に、楽曲音響データDWと共に、歌詞テロップデータDTと、修正歌詞出力データDOとを配信して、当該携帯端末5にて、楽曲音響データDWの再生に併せて、楽曲音響データ中の楽音に時間同期させて、歌詞構成文字を出力すれば、当該携帯端末5においても、カラオケを楽しむことができる。
[第二実施形態]
次に、本発明の第二実施形態について説明する。
第二実施形態における音楽データ配信システムは、第一実施形態における音楽データ配信システム1とは、歌詞出力データDOの構造、及び情報処理装置20が実行するデータ修正処理の処理内容が異なるのみである。このため、第二実施形態では、第一実施形態の音楽データ配信システム1と同様の構成には、同一の符号を付して説明を省略し、歌詞出力データDOの構造、及び情報処理装置20が実行するデータ修正処理の処理内容を中心に説明する。
〈歌詞出力データDOについて〉
本実施形態の歌詞出力データDOは、第一実施形態の歌詞出力データDOと同様、歌詞構成文字の歌詞出力タイミングを、楽曲MIDIデータDMの演奏と対応付けるタイミング対応関係が規定されている。
具体的に、本実施形態におけるタイミング対応関係は、図7に示すように、歌詞構成文字の各々に対する歌詞出力タイミングが、当該歌詞構成文字に対応する出力音の演奏開始タイミングと対応付けられている。さらには、本実施形態におけるタイミング対応関係では、図7に示すように、歌詞構成文字の各々に対する歌詞出力終了タイミングが、当該歌詞構成文字に対応する出力音の演奏終了タイミングと対応付けられている。
〈データ修正処理について〉
次に、本実施形態におけるデータ修正処理について説明する。
ここで、図8は、本実施形態におけるデータ修正処理の処理手順を示すフローチャートである。
このデータ修正処理は、入力受付部22を介して、当該データ修正処理を起動するための起動指令が入力されると、実行が開始されるものである。
そして、図8に示すように、データ修正処理は、起動されると、対象楽曲に対応する楽曲MIDIデータDMを、音楽データ格納サーバ3から取得する(S710)。
続いて、対象楽曲に対応する楽曲音響データDWを音楽データ格納サーバ3から取得する(S730)。その取得した楽曲音響データDWから、当該楽曲音響データDWにおける楽音推移波形を取得する(S740)。
そして、音高補正処理を実行する(S750)。この音高補正処理は、第一実施形態における音高補正処理(S150)と同様であるため、内容の具体的な説明は省略する。
さらに、時間ズレ量導出処理を実行する(S770)。この時間ズレ量導出処理は、第一実施形態における時間ズレ量導出処理(S170)と同様であるため、内容の具体的な説明は省略する。
続いて、S770にて修正された楽曲MIDIデータDMにおける出力音の演奏開始タイミングと、S710で取得された修正前の楽曲MIDIデータDMにおける出力音の演奏開始タイミングとの差分を導出する(S790)。本実施形態のS790では、具体的には、下記(1)式に基づいて、個々の出力音について、差分(以下、オンセット差分時間dOnset,オフセット差分時間dOffset)を導出する。
ただし、(1)式中のaOnsetは、修正された楽曲MIDIデータDMにおける出力音の演奏開始タイミングであり、bOnsetは、修正前の楽曲MIDIデータDMにおける出力音の演奏開始タイミングである。また、(1)式におけるaOffsetは、修正された楽曲MIDIデータDMにおける出力音の演奏終了タイミングであり、bOffsetは、修正前の楽曲MIDIデータDMにおける出力音の演奏終了タイミングである。
つまり、S790では、各出力音について、オンセット差分時間dOnset,オフセット差分時間dOffsetが導出される。
続いて、対象楽曲についての歌詞出力データDOを、音楽データ格納サーバ3から取得して、当該歌詞出力データDOにおける各歌詞構成文字の歌詞出力タイミングを取得する(S800)。
さらに、S790で導出されたオンセット差分時間dOnset,オフセット差分時間dOffsetに従って、楽曲音響データDWにおける楽音の演奏開始タイミングに一致するように、S800で取得した歌詞出力データDOにおける歌詞構成文字の各々の歌詞出力タイミングを修正する(S810)。
具体的に、本実施形態のS810では、下記(2)に基づいて、歌詞構成文字の各々について、修正した歌詞出力タイミングmOnset、及び修正した歌詞出力終了タイミングmOffsetを導出する。
ただし、(2)式中のlOnsetは、歌詞出力データDOにおける歌詞構成文字の歌詞出力タイミングであり、lOffsetは、歌詞出力データDOにおける歌詞構成文字の歌詞出力終了タイミングである。
つまり、S810では、歌詞構成文字それぞれの歌詞出力タイミング及び歌詞出力終了タイミングについて、楽曲音響データDWにおける楽音それぞれの演奏開始タイミングに一致するように、オンセット差分時間dOnset,オフセット差分時間dOffsetシフトすることで修正される。
そして、S810にて修正された歌詞出力タイミング(即ち、修正歌詞出力タイミング)及び歌詞出力終了タイミングが規定された歌詞出力データ(即ち、修正歌詞出力データ)を生成する(S820)。
その後、本データ修正処理を終了する。
[第二実施形態の効果]
本実施形態のデータ修正処理においても、第一実施形態のデータ修正処理と同様の効果を得ることができる。
特に、本実施形態のように構成された歌詞出力データDOを修正する場合、各歌詞構成文字の歌詞出力タイミングを、出力音の演奏開始タイミングと対応付ける必要が無いため、修正歌詞出力データDOを容易に生成できる。
[その他の実施形態]
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において、様々な態様にて実施することが可能である。
例えば、上記第二実施形態のデータ修正処理のS810では、歌詞構成文字それぞれの歌詞出力タイミング及び歌詞出力終了タイミングについて、オンセット差分時間dOnset,オフセット差分時間dOffsetシフトすることで修正していたが、歌詞出力タイミング及び歌詞出力終了タイミングの修正方法は、これに限るものではなく、第一実施形態のデータ修正処理における歌詞出力データの修正方法を適用しても良い。
また、第一実施形態のデータ修正処理においては、対象楽曲に対応する歌詞出力データDOを音楽データ格納サーバ3から取得し、当該楽曲MIDIデータDMに規定されている出力音の演奏開始タイミングと、歌詞出力データDOに規定された歌詞構成文字の歌詞出力タイミングとを対応付けた上で、その出力音の演奏開始タイミングと対応付けられた、歌詞構成文字の歌詞出力タイミングを修正しても良い。このとき、歌詞出力終了タイミングも、各歌詞構成文字に対応すると推定される出力音の演奏終了タイミングと対応付けても良い。
この対応付けの方法としては、色替えの速度から特定される各歌詞構成文字の歌詞出力タイミングを、各歌詞構成文字に対応すると推定される出力音の演奏開始タイミングとして設定した、楽曲MIDIデータDMの新たなトラック(以下、歌詞出力トラックとする)を生成する。
なお、第一実施形態のデータ修正処理における歌詞構成文字の歌詞出力タイミング(または、歌詞出力終了タイミング)を修正する方法は、同一のテンポ一定区間ごとに、当該区間に含まれる、歌詞構成文字の歌詞出力タイミング(または、歌詞出力終了タイミング)を、オンセット差分時間dOnsetまたはオフセット差分時間dOffsetシフトする方法でも良い。
また、上記実施形態(ここでは、第一実施形態と第二実施形態との両方)のデータ修正処理では、音高補正処理と時間ズレ量導出処理との両方の処理を実行していたが、データ修正処理で実行する処理としては、時間ズレ量導出処理のみであっても良い。
[実施形態と特許請求の範囲との対応関係]
最後に、上記実施形態の記載と、特許請求の範囲の記載との関係を説明する。
上記実施形態のデータ修正処理におけるS140,S740が、特許請求の範囲の記載における楽音推移取得手段に相当し、時間ズレ量導出処理のS510が、出力音推移取得手段に相当し、データ修正処理におけるS190,S800が、歌詞出力データ取得手段に相当する。さらに、時間ズレ量導出処理のS520〜S620が、時間ズレ量導出手段に相当し、データ修正処理におけるS200,S810が、タイミング修正手段に相当する。
また、時間ズレ量導出処理におけるS520,S540からS560が、出力音変化導出手段に相当し、S530からS560が、楽音変化導出手段に相当し、S570からS610が、時間相関導出手段に相当し、S620が、時間補正量導出手段に相当する。さらに、音高補正処理におけるS320からS430が、音高補正量導出手段に相当し、S440が、楽譜データ修正手段に相当する。このうちのS360からS390が、楽音分布導出手段に相当し、S320からS350が、出力音分布導出手段に相当し、S400からS420が、音高相関導出手段に相当する。
さらに、時間ズレ量導出処理におけるS630が、演奏開始タイミング補正手段に相当する。
1…音楽データ配信システム 3…音楽データ格納サーバ 5…携帯端末 6…情報受付部 7…表示部 8…音出力部 9…通信部 10…記憶部 11…制御部 20…情報処理装置 21…通信部 22…入力受付部 23…表示部 24…音声入力部 25…音声出力部 26…音源モジュール 27…記憶部 30…制御部 31…ROM 32…RAM 33…CPU

Claims (8)

  1. 対象楽曲を構成する楽音の音圧が時間軸に沿って推移した楽音推移波形を取得する楽音推移取得手段と、
    前記対象楽曲を模擬した楽曲の楽譜を表し、音源モジュールから出力される個々の出力音について、少なくとも音高及び演奏開始タイミングが規定された楽譜データに基づいて、前記出力音の音圧が時間軸に沿って推移した出力音推移波形を取得する出力音推移取得手段と、
    前記対象楽曲の歌詞を構成する歌詞構成文字の出力タイミングである歌詞出力タイミングを規定するデータであり、かつ前記歌詞構成文字の少なくとも1つに対する前記歌詞出力タイミングが、前記楽譜データに対して規定された少なくとも1つのタイミングである特定開始タイミングと対応付けられた歌詞出力データを取得する歌詞出力データ取得手段と、
    前記楽音推移取得手段にて取得した楽音推移波形から抽出した該楽音推移波形の特性を表す楽音情報と、前記出力音推移取得手段にて取得した出力音推移波形から抽出した該出力音推移波形の特性を表す出力音情報とを比較した結果に基づき、前記出力音の各々の演奏開始タイミングに対する、各出力音に対応する前記楽音の演奏開始タイミングのズレ量を表す時間ズレ量を導出する時間ズレ量導出手段と、
    前記楽音の演奏開始タイミングに一致するように、前記歌詞出力データ取得手段で取得した歌詞出力データにおける前記歌詞出力タイミングを、前記時間ズレ量導出手段で導出された時間ズレ量に従って修正した修正歌詞出力タイミングを規定するタイミング修正手段と
    を備え、
    前記時間ズレ量導出手段は、
    前記楽音推移取得手段にて取得した楽音推移波形から、該楽音推移波形の非調波成分である楽音非調波を抽出し、時間軸に沿った楽音非調波の変化を表す楽音変化を、前記楽音情報として導出する楽音変化導出手段と、
    前記出力音推移取得手段にて取得した出力音推移波形から、該出力音推移波形の非調波成分である出力音非調波を抽出し、時間軸に沿った出力音非調波の変化を表す出力音変化を、前記出力音情報として導出する出力音変化導出手段と、
    前記楽音変化導出手段にて導出された楽音変化と、前記出力音変化導出手段にて導出された出力音変化との相関値を表す時間相関値を、前記楽音変化の時間軸上に規定された基準位置に、前記出力音変化の時間軸上に設定された設定位置を一致させて前記出力音変化を時間軸に沿って伸縮する毎に導出すると共に、前記設定位置を規定範囲内で時間軸に沿って順次変更する時間相関導出手段と、
    前記時間相関導出手段にて導出された時間相関値の中で、値が最大となる時間相関値に対応する前記出力音変化の伸縮率及び前記設定位置を、時間補正量として導出する時間補正量導出手段と
    を備え、
    前記時間補正量導出手段にて導出した時間補正量を、前記時間ズレ量とすることを特徴とする歌詞出力データ修正装置。
  2. 前記楽音情報の1つと、前記出力音情報の1つとを比較した結果に基づき、前記出力音の音高が、該出力音に対応する前記楽音の音高に一致するように音高補正量を導出する音高補正量導出手段と、
    前記楽譜データに規定された前記出力音の各々の音高を、前記音高補正量導出手段で導出した音高補正量に従ってシフトすることで、前記楽譜データを修正した修正楽譜データを生成する楽譜データ修正手段と、
    を備え、
    前記時間ズレ量導出手段は、
    前記楽譜データ修正手段にて生成された修正楽譜データに基づく前記出力音推移波形である修正音推移波形を、前記出力音推移取得手段で取得した前記出力音推移波形とする
    ことを特徴とする請求項1に記載の歌詞出力データ修正装置。
  3. 前記音高補正量導出手段は、
    前記楽音推移波形に含まれる周波数と各周波数の強さとを表し、該周波数の強さについて正規化した楽音音高分布を、前記楽音情報の一つとして導出する楽音分布導出手段と、
    前記出力音推移波形に含まれる周波数と各周波数の強さとを表し、該周波数の強さについて正規化した出力音高分布を、前記出力音情報の一つとして導出する出力音分布導出手段と、
    前記出力音分布導出手段にて導出された出力音高分布と、前記楽音分布導出手段にて導出された楽音音高分布との相関値を表す音高相関値を、前記楽音音高分布の予め規定された規定位置から前記出力音高分布を周波数軸に沿ってシフトさせる毎に導出する音高相関導出手段とを備え、
    前記音高相関導出手段にて導出された音高相関値の中で、値が最大となる音高相関値に対応する前記規定位置からの周波数軸に沿ったシフト量を、前記音高補正量として導出する
    ことを特徴とする請求項に記載の歌詞出力データ修正装置。
  4. 前記歌詞出力データは、
    前記歌詞構成文字のうちの少なくとも一部について、前記特定開始タイミングからの経過時間によって前記歌詞出力タイミングが規定されており、
    前記タイミング修正手段は、
    前記経過時間によって前記歌詞出力タイミングが規定された前記歌詞構成文字の前記歌詞出力タイミングについて、前記修正歌詞出力タイミングを規定する
    ことを特徴とする請求項1から請求項のいずれか一項に記載の歌詞出力データ修正装置。
  5. 少なくとも一部の前記出力音の前記演奏開始タイミングが、前記特定開始タイミングとして規定されており、
    前記歌詞出力データは、
    前記歌詞構成文字の各々の歌詞出力タイミングに、当該歌詞構成文字に対応する前記特定開始タイミングが対応付けられており、
    前記タイミング修正手段は、
    前記歌詞構成文字の各々について、前記修正歌詞出力タイミングを規定する
    ことを特徴とする請求項1から請求項のいずれか一項に記載の歌詞出力データ修正装置。
  6. 前記出力音の演奏開始タイミングを、前記時間ズレ量シフトさせた修正演奏開始タイミングを導出する演奏開始タイミング補正手段を備え、
    前記タイミング修正手段は、
    前記演奏開始タイミング補正手段で導出された修正演奏開始タイミングを、前記修正歌詞出力タイミングとする
    ことを特徴とする請求項に記載の歌詞出力データ修正装置。
  7. 前記出力音の演奏開始タイミングを、前記時間ズレ量シフトさせた修正演奏開始タイミングを導出する演奏開始タイミング補正手段と、
    前記タイミング修正手段は、
    前記演奏開始タイミング補正手段で導出された修正演奏開始タイミングと前記出力音の演奏開始タイミングとの差分、前記歌詞出力タイミングをシフトさせることで、前記修正歌詞出力タイミングを規定する
    ことを特徴とする請求項または請求項に記載の歌詞出力データ修正装置。
  8. 対象楽曲を構成する楽音の音圧が時間軸に沿って推移した楽音推移波形を取得する楽音推移取得手順と、
    前記対象楽曲を模擬した楽曲の楽譜を表し、音源モジュールから出力される個々の出力音について、少なくとも音高及び演奏開始タイミングが規定された楽譜データに基づいて、前記出力音の音圧が時間軸に沿って推移した出力音推移波形を取得する出力音推移取得手順と、
    前記対象楽曲の歌詞を構成する歌詞構成文字の出力タイミングである歌詞出力タイミングを規定するデータであり、かつ前記歌詞構成文字の少なくとも1つに対する前記歌詞出力タイミングが、前記楽譜データに対して規定された少なくとも1つのタイミングである特定開始タイミングと対応付けられた歌詞出力データを取得する歌詞出力データ取得手順と、
    前記楽音推移取得手順にて取得した楽音推移波形から抽出した該楽音推移波形の特性を表す楽音情報と、前記出力音推移取得手順にて取得した出力音推移波形から抽出した該出力音推移波形の特性を表す出力音情報とを比較した結果に基づき、前記出力音の各々の演奏開始タイミングに対する、各出力音に対応する前記楽音の演奏開始タイミングのズレ量を表す時間ズレ量を導出する時間ズレ量導出手順と、
    前記楽音の演奏開始タイミングに一致するように、前記歌詞出力データ取得手順で取得した歌詞出力データにおける前記歌詞出力タイミングを、前記時間ズレ量導出手順で導出された時間ズレ量に従って修正した修正歌詞出力タイミングを規定するタイミング修正手順とを
    コンピュータに実行させ、
    前記時間ズレ量導出手順は、
    前記楽音推移取得手順にて取得した楽音推移波形から、該楽音推移波形の非調波成分である楽音非調波を抽出し、時間軸に沿った楽音非調波の変化を表す楽音変化を、前記楽音情報として導出する楽音変化導出手順と、
    前記出力音推移取得手順にて取得した出力音推移波形から、該出力音推移波形の非調波成分である出力音非調波を抽出し、時間軸に沿った出力音非調波の変化を表す出力音変化を、前記出力音情報として導出する出力音変化導出手順と、
    前記楽音変化導出手順にて導出された楽音変化と、前記出力音変化導出手順にて導出された出力音変化との相関値を表す時間相関値を、前記楽音変化の時間軸上に規定された基準位置に、前記出力音変化の時間軸上に設定された設定位置を一致させて前記出力音変化を時間軸に沿って伸縮する毎に導出すると共に、前記設定位置を規定範囲内で時間軸に沿って順次変更する時間相関導出手順と、
    前記時間相関導出手順にて導出された時間相関値の中で、値が最大となる時間相関値に対応する前記出力音変化の伸縮率及び前記設定位置を、時間補正量として導出する時間補正量導出手順とを
    前記コンピュータに実行させ
    前記時間補正量導出手順にて導出した時間補正量を、前記時間ズレ量とすることを特徴とするプログラム。
JP2011167210A 2011-07-29 2011-07-29 歌詞出力データ修正装置,及びプログラム Active JP5549651B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011167210A JP5549651B2 (ja) 2011-07-29 2011-07-29 歌詞出力データ修正装置,及びプログラム
PCT/JP2012/058542 WO2013018397A1 (ja) 2011-07-29 2012-03-30 歌詞出力データ修正装置,及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011167210A JP5549651B2 (ja) 2011-07-29 2011-07-29 歌詞出力データ修正装置,及びプログラム

Publications (2)

Publication Number Publication Date
JP2013029762A JP2013029762A (ja) 2013-02-07
JP5549651B2 true JP5549651B2 (ja) 2014-07-16

Family

ID=47628939

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011167210A Active JP5549651B2 (ja) 2011-07-29 2011-07-29 歌詞出力データ修正装置,及びプログラム

Country Status (2)

Country Link
JP (1) JP5549651B2 (ja)
WO (1) WO2013018397A1 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004212473A (ja) * 2002-12-27 2004-07-29 Matsushita Electric Ind Co Ltd カラオケ装置及びカラオケ再生方法
JP4595827B2 (ja) * 2006-02-14 2010-12-08 ヤマハ株式会社 楽曲再生装置およびデータファイル制作ツール
JP5141397B2 (ja) * 2008-06-24 2013-02-13 ヤマハ株式会社 音声処理装置およびプログラム
JP5287617B2 (ja) * 2009-09-04 2013-09-11 ヤマハ株式会社 音響処理装置およびプログラム

Also Published As

Publication number Publication date
WO2013018397A1 (ja) 2013-02-07
JP2013029762A (ja) 2013-02-07

Similar Documents

Publication Publication Date Title
JP5598516B2 (ja) カラオケ用音声合成システム,及びパラメータ抽出装置
JP5782972B2 (ja) 情報処理システム,プログラム
JP5418518B2 (ja) 楽曲データ修正装置
JP5267495B2 (ja) 楽器音分離装置、及びプログラム
JP5810947B2 (ja) 発声区間特定装置、音声パラメータ生成装置、及びプログラム
JP5310677B2 (ja) 音源分離装置、及びプログラム
JP6252420B2 (ja) 音声合成装置、及び音声合成システム
JP5413380B2 (ja) 楽曲データ修正装置
JP6075314B2 (ja) プログラム,情報処理装置,及び評価方法
JP5418525B2 (ja) カラオケ装置
JP5549651B2 (ja) 歌詞出力データ修正装置,及びプログラム
JP2015031729A (ja) 情報処理装置、及びプログラム
JP2013210501A (ja) 素片登録装置,音声合成装置,及びプログラム
JP5569307B2 (ja) プログラム、及び編集装置
JP2017138359A (ja) カラオケ装置,及びプログラム
JP6365483B2 (ja) カラオケ装置,カラオケシステム,及びプログラム
JP2016183998A (ja) 音声合成装置、及びプログラム
JP5983670B2 (ja) プログラム、情報処理装置、及びデータ生成方法
JP5541008B2 (ja) データ修正装置、及びプログラム
JP2015191177A (ja) プログラム、情報処理装置、及びデータ生成方法
JP2015184447A (ja) プログラム,情報処理装置,及び評価データ生成方法
JP5287782B2 (ja) 歌唱補助装置、及びプログラム
JP5418524B2 (ja) 楽曲データ修正装置
JP4967170B2 (ja) 伴奏作成システム及び伴奏作成方法,プログラム
JP5805474B2 (ja) 音声評価装置,音声評価方法,及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130313

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140212

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140326

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140422

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140505

R150 Certificate of patent or registration of utility model

Ref document number: 5549651

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150