JP4968109B2 - Audio data conversion / reproduction system, audio data conversion device, audio data reproduction device - Google Patents
Audio data conversion / reproduction system, audio data conversion device, audio data reproduction device Download PDFInfo
- Publication number
- JP4968109B2 JP4968109B2 JP2008049197A JP2008049197A JP4968109B2 JP 4968109 B2 JP4968109 B2 JP 4968109B2 JP 2008049197 A JP2008049197 A JP 2008049197A JP 2008049197 A JP2008049197 A JP 2008049197A JP 4968109 B2 JP4968109 B2 JP 4968109B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- percussion instrument
- sound
- instrument sound
- reproduction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Reverberation, Karaoke And Other Acoustics (AREA)
- Electrophonic Musical Instruments (AREA)
Description
本発明は、MIDIデータを別データに変換する技術に関するものである。 The present invention relates to a technique for converting MIDI data into other data.
従来、カラオケ再生用のデータとしてMIDIデータが広く用いられている。MIDIデータは、データ量が小さいため、通信容量、記憶容量に制約があるカラオケシステムに適している。また、MIDIデータは、それぞれの楽器音の発音タイミングを規定したものであるため、音質を低下させることなくスピードコントロールを行うことが可能である。 Conventionally, MIDI data has been widely used as data for karaoke playback. Since MIDI data is small, MIDI data is suitable for a karaoke system with limited communication capacity and storage capacity. Further, since MIDI data defines the sound generation timing of each instrument sound, it is possible to perform speed control without deteriorating sound quality.
しかしながら、MIDIデータが上記のような利点を有する反面、MIDIデータを再生するためのMIDI音源装置が高価であるという欠点がある。また、通信容量、記憶容量の増大に伴い、上記MIDIデータにおける少データ量という利点が薄まっている状況にある。そこで、カラオケ装置のコストダウンを目的として、他のフォーマットデータを楽曲データとして用いることにより、MIDI音源装置を不要としたカラオケ装置が提案されている。 However, while MIDI data has the advantages as described above, there is a disadvantage that a MIDI sound source device for reproducing MIDI data is expensive. Further, as the communication capacity and storage capacity increase, the advantage of the small amount of data in the MIDI data is diminished. Therefore, for the purpose of reducing the cost of the karaoke apparatus, there has been proposed a karaoke apparatus that eliminates the need for a MIDI sound source apparatus by using other format data as music data.
例えば、特許文献1には、MIDIデータに基づいて再生されたオーディオデータをMP3データに変換し、変換されたMP3データに基づいて楽音再生を行う点が開示されている。
For example,
上記特許文献1によれば、MIDI音源装置を用いることなく、楽音再生を行うことができる。また、MP3データに対し公知の速度変換処理を行うことにより、スピードコントロールを行うことも可能である。しかしながら、公知の速度変換処理によってスピードコントロールを行う場合、サンプリング周波数を変えることで再生速度を変え、次に再生速度に応じて変化した再生周波数を、ピッチシフトなどによって再生周波数を速度変化前の状態の周波数に再変化させることで、速度だけを変えるたように聞こえる変換処理を行う。ところが、前記変換処理で行われる周波数変換/再変換に伴う帯域制限や演算誤差などの原理的理由により、楽器音のアタック感に影響を与え、アタック感が重要な聴覚的要素となる打楽器(ドラム等)の発音への影響が特に目立つようになる。
また、この影響を解消するために、複数の速度で再生したMIDIデータを記憶することも物理的には可能ではあるが、記憶容量が急激に増加するという新たな問題が生じる。
According to
In order to eliminate this influence, it is physically possible to store MIDI data reproduced at a plurality of speeds, but a new problem arises that the storage capacity increases rapidly.
本発明は、上述したような状況に鑑みてなされたものであり、MIDIデータを別データに変換する技術に関し、データ量及び音質劣化を抑制できる別データに変換し、また、該別データを再生することができるオーディオデータ変換再生システム、オーディオデータ変換装置、オーディオデータ再生装置等を提供することを目的とする。 The present invention has been made in view of the situation as described above, and relates to a technique for converting MIDI data into other data. The present invention converts the data into other data that can suppress deterioration in data volume and sound quality, and reproduces the other data. An object of the present invention is to provide an audio data conversion / reproduction system, an audio data conversion device, an audio data reproduction device, and the like that can be used.
本発明の一側面である請求項1に係る発明は、MIDIデータに基いて別データに変換し、変換した別データに基いて音声信号を再生するオーディオデータ変換再生システムにおいて、MIDIデータを取得する取得手段と、取得したMIDIデータから打楽器音以外のトラックデータを通常音のトラックデータとして抽出する通常音抽出手段と、抽出した通常音のトラックデータに基いて、通常音波形データを生成する通常音生成手段と、前記取得したMIDIデータから打楽器音のトラックデータを抽出する打楽器音抽出手段と、再生速度を設定する再生速度設定手段と、抽出した打楽器音のトラックデータに基いて、前記設定した再生速度に応じた再生クロック数で再生した場合の打楽器音波形データを生成する打楽器音生成手段と、前記打楽器音波形データに対しデータ圧縮を行う打楽器音波形データ圧縮手段と、を備え、前記再生速度設定手段は、複数の再生速度を設定し、前記打楽器音生成手段は、前記複数の再生速度に応じた複数の打楽器音波形データを、前記再生速度毎に生成し、前記打楽器音波形データ圧縮手段は、前記複数の打楽器音波形データそれぞれに対し、打楽器音波形データ圧縮処理を行い、前記打楽器音波形データ圧縮処理は、所定単位で分割された前記打楽器音のトラックデータに対し、互いに類似するものをグループ化し、前記グループごとに代表波形データを生成し、前記代表波形データごとに識別符号を付与し、前記打楽器音のトラックデータを、前記識別符号を用いて識別符号列として表現し、前記代表波形データ、前記識別符号列、前記設定された再生速度を、前記打楽器音のトラックデータの打楽器音圧縮データとして生成し、さらに、前記通常音波形データ及び前記打楽器音圧縮データを取得するデータ取得手段と、再生速度を設定する再生速度設定手段と、前記通常音のデータを、前記設定した再生速度に応じた再生クロック数で出力する通常音再生手段と、前記通常音再生手段からの出力信号を、前記設定した再生速度に応じたシフト量でピッチシフトを行うピッチシフト手段と、前記設定した再生速度に応じて、複数の打楽器音データのうち1つの打楽器音データを選択する手段と、前記選択した打楽器音のデータを前記再生クロック数で出力する打楽器音再生手段と、前記ピッチシフト手段からの出力信号及び前記打楽器音再生手段からの出力信号をミックスして音声信号を再生する音声信号出力手段と、を有することを特徴とする。
The invention according to
上記オーディオデータ変換再生システムは、取得したMIDIデータから打楽器音(例えば、ドラム音)のトラックデータを抽出する。そして、抽出したトラックデータに基いて、設定した再生速度で再生した場合の打楽器音波形データを生成する。このとき、複数の再生速度を設定することにより、前記複数の再生速度に応じた複数の打楽器音波形データが、前記再生速度毎に得られる。そして、所定単位で分割されたトラックデータそれぞれに対し、互いに類似する前記分割されたデータをグループ化し、前記グループごとに代表波形データを生成し、前記代表波形データごとに識別符号を付与し、前記波形データを、前記識別符号を用いて識別符号列として表現し、前記代表波形データ、前記識別符号列、前記設定された再生速度を前記打楽器音のトラックデータの打楽器音圧縮データとして生成する。また、打楽器音以外のトラックに基いて通常波形データを生成する。これにより、MIDI音源装置を用いることなく、楽曲再生が可能となる。また、複数の再生速度で再生した打楽器音のデータを生成するので、楽曲の再生時に、打楽器音に対してスピードコントロールを施す必要がないため、音質劣化を防止することができる。さらに、複数の再生速度で再生した打楽器音のデータを圧縮して記憶しておくので、記憶容量の削減が可能となる。また、楽音再生時には、通常音のデータ及び複数の打楽器音データにも基いて音声信号を再生する。また、再生速度に応じて1つの打楽器音データが選択される。通常音データは、該再生速度に応じてピッチシフトが施される。また、通常音及び打楽器音は、同じ再生クロック数で出力される。これにより、MIDI音源装置を用いることなく、楽曲再生が可能となる。また、複数の再生速度で再生した打楽器音のデータを記憶するので、楽曲の再生時に、打楽器音に対してスピードコントロールを施す必要がないため、音質劣化を防止することができる。さらに、通常音と打楽器音の再生クロック数が同じであるので、同期性を確保することができる。 The audio data conversion / playback system extracts percussion instrument sound (for example, drum sound) track data from the acquired MIDI data. Then, based on the extracted track data, percussion instrument sound waveform data for reproduction at a set reproduction speed is generated. At this time, by setting a plurality of reproduction speeds, a plurality of percussion instrument sound waveform data corresponding to the plurality of reproduction speeds is obtained for each reproduction speed . Then, for each track data divided in a predetermined unit, the divided data similar to each other is grouped, representative waveform data is generated for each group, an identification code is given to each representative waveform data, Waveform data is expressed as an identification code string using the identification code, and the representative waveform data, the identification code string, and the set reproduction speed are generated as percussion instrument sound compression data of the percussion instrument sound track data. Further, normal waveform data is generated based on tracks other than percussion instrument sounds. This makes it possible to play music without using a MIDI tone generator. In addition, since percussion instrument sound data reproduced at a plurality of reproduction speeds is generated, it is not necessary to perform speed control on the percussion instrument sound at the time of music reproduction, so that deterioration in sound quality can be prevented. Furthermore, since percussion instrument sound data reproduced at a plurality of reproduction speeds is compressed and stored, the storage capacity can be reduced. Further, at the time of music sound reproduction, an audio signal is reproduced based on normal sound data and a plurality of percussion instrument sound data. Also, one piece of percussion instrument sound data is selected according to the playback speed. The normal sound data is pitch-shifted according to the reproduction speed. Further, the normal sound and the percussion instrument sound are output with the same number of reproduction clocks. This makes it possible to play music without using a MIDI tone generator. In addition, since percussion instrument sound data reproduced at a plurality of reproduction speeds is stored, it is not necessary to perform speed control on the percussion instrument sound during the reproduction of the music, so that deterioration in sound quality can be prevented. Further, since the number of reproduction clocks of the normal sound and the percussion instrument sound is the same, the synchronism can be ensured.
本発明の一側面である請求項2に係る発明は、MIDIデータに基いて別データに変換するオーディオデータ変換装置において、MIDIデータを取得する取得手段と、取得したMIDIデータから打楽器音以外のトラックデータを通常音のトラックデータとして抽出する通常音抽出手段と、抽出した通常音のトラックデータに基いて、通常音波形データを生成し記憶する通常音記憶手段と、前記取得したMIDIデータから打楽器音のトラックデータを抽出する打楽器音抽出手段と、再生速度を設定する再生速度設定手段と、抽出した打楽器音のトラックデータに基いて、前記設定した再生速度に応じた再生クロック数で再生した場合の打楽器音波形データを生成する打楽器音生成手段と、前記打楽器音波形データに対しデータ圧縮を行う打楽器音波形データ圧縮手段と、を備え、前記再生速度設定手段は、複数の再生速度を設定し、前記打楽器音生成手段は、前記複数の再生速度に応じた複数の打楽器音波形データを、前記再生速度毎に生成し、前記打楽器音波形データ圧縮手段は、前記複数の打楽器音波形データそれぞれに対し、打楽器音波形データ圧縮処理を行い、前記打楽器音波形データ圧縮処理は、所定単位で分割された前記打楽器音のトラックデータに対し、互いに類似するものをグループ化し、前記グループごとに代表波形データを生成し、前記代表波形データごとに識別符号を付与し、前記打楽器音のトラックデータを、前記識別符号を用いて識別符号列として表現し、前記代表波形データ、前記識別符号列、前記設定された再生速度を、前記打楽器音のトラックデータの打楽器音圧縮データとして記憶することを特徴とする。
The invention according to
上記オーディオデータ変換装置は、取得したMIDIデータから打楽器音(例えば、ドラム音)のトラックデータを抽出する。そして、抽出したトラックデータに基いて、設定した再生速度で再生した場合の打楽器音波形データを生成する。このとき、複数の再生速度を設定することにより、前記複数の再生速度に応じた複数の打楽器音波形データが、前記再生速度毎に得られる。そして、所定単位で分割されたトラックデータそれぞれに対し、互いに類似する前記分割されたデータをグループ化し、前記グループごとに代表波形データを生成し、前記代表波形データごとに識別符号を付与し、前記波形データを、前記識別符号を用いて識別符号列として表現し、前記代表波形データ、前記識別符号列、前記設定された再生速度を、トラックデータの打楽器音圧縮データとして生成する。また、打楽器音以外のトラックに基いて通常波形データを生成する。これにより、MIDI音源装置を用いることなく、楽曲再生が可能となる。また、複数の再生速度で再生した打楽器音のデータを記憶するので、楽曲の再生時に、打楽器音に対してスピードコントロールを施す必要がないため、音質劣化を防止することができる。さらに、複数の再生速度で再生した打楽器音のデータを圧縮して記憶しておくので、記憶容量の削減が可能となる。 The audio data converter extracts track data of percussion instrument sounds (for example, drum sounds) from the acquired MIDI data. Then, based on the extracted track data, percussion instrument sound waveform data for reproduction at a set reproduction speed is generated. At this time, by setting a plurality of reproduction speeds, a plurality of percussion instrument sound waveform data corresponding to the plurality of reproduction speeds is obtained for each reproduction speed . Then, for each track data divided in a predetermined unit, the divided data similar to each other is grouped, representative waveform data is generated for each group, an identification code is given to each representative waveform data, Waveform data is expressed as an identification code string using the identification code, and the representative waveform data, the identification code string, and the set reproduction speed are generated as percussion instrument sound compression data of track data. Further, normal waveform data is generated based on tracks other than percussion instrument sounds. This makes it possible to play music without using a MIDI tone generator. In addition, since percussion instrument sound data reproduced at a plurality of reproduction speeds is stored, it is not necessary to perform speed control on the percussion instrument sound during the reproduction of the music, so that deterioration in sound quality can be prevented. Furthermore, since percussion instrument sound data reproduced at a plurality of reproduction speeds is compressed and stored, the storage capacity can be reduced.
本発明の一側面である請求項3に係る発明は、請求項2のオーディオデータ変換装置であって、前記所定単位は、小節単位であることを特徴とする。
The invention according to
上記オーディオデータ変換装置は、小節単位で前記打楽器音データを分割して、圧縮データを生成する。打楽器音のトラックが有する、小節単位でのループ再生が多いという性質を理由することにより、高効率のデータ圧縮が可能となる。 The audio data conversion apparatus divides the percussion instrument sound data into bars and generates compressed data. Because of the nature of the percussion instrument track that has a large number of loop reproductions in units of measures, highly efficient data compression is possible.
本発明の一側面である請求項4に係る発明は、通常音のデータ及び複数の打楽器音のデータに基いて音声信号を再生するオーディオデータ再生装置において、前記通常音のデータ及び前記複数の打楽器音のデータを取得するデータ取得手段と、再生速度を設定する再生速度設定手段と、前記通常音のデータを、前記設定した再生速度に応じた再生クロック数で出力する通常音再生手段と、前記通常音再生手段からの出力信号を、前記設定した再生速度に応じたシフト量でピッチシフトを行うピッチシフト手段と、前記設定した再生速度に応じて、複数の打楽器音データのうち1つの打楽器音データを選択する手段と、前記選択した打楽器音のデータを前記再生クロック数で出力する打楽器音再生手段と、前記ピッチシフト手段からの出力信号及び前記打楽器音再生手段からの出力信号をミックスして音声信号を再生する音声信号出力手段とを有することを特徴とする。
The invention according to
上記オーディオデータ再生装置は、通常音のデータ及び複数の打楽器音データにも基いて音声信号を再生する。また、再生速度に応じて1つの打楽器音データが選択される。通常音データは、該再生速度に応じてピッチシフトが施される。また、通常音及び打楽器音は、同じ再生クロック数で出力される。これにより、MIDI音源装置を用いることなく、楽曲再生が可能となる。また、複数の再生速度で再生した打楽器音のデータを記憶するので、楽曲の再生時に、打楽器音に対してスピードコントロールを施す必要がないため、音質劣化を防止することができる。さらに、通常音と打楽器音の再生クロック数が同じであるので、同期性を確保することができる。 The audio data reproducing apparatus reproduces an audio signal based on normal sound data and a plurality of percussion instrument sound data. Also, one piece of percussion instrument sound data is selected according to the playback speed. The normal sound data is pitch-shifted according to the reproduction speed. Further, the normal sound and the percussion instrument sound are output with the same number of reproduction clocks. This makes it possible to play music without using a MIDI tone generator. In addition, since percussion instrument sound data reproduced at a plurality of reproduction speeds is stored, it is not necessary to perform speed control on the percussion instrument sound during the reproduction of the music, so that deterioration in sound quality can be prevented. Further, since the number of reproduction clocks of the normal sound and the percussion instrument sound is the same, the synchronism can be ensured.
本発明によれば、MIDIデータに基いて、データ量及び音質劣化を抑制できる別データに生成することができる。また、該別データをMIDI音源を用いることなく再生することができる。 According to the present invention, based on MIDI data, it can be generated as separate data that can suppress data volume and sound quality deterioration. Further, the separate data can be reproduced without using a MIDI sound source.
[システム構成]
以下、本発明の一実施形態を具体化したカラオケシステムについて説明する。本実施形態においては、本発明のオーディオデータ変換装置及びオーディオデータ再生装置が、カラオケシステム内の構成要素として実現されている。
[System configuration]
Hereinafter, a karaoke system embodying an embodiment of the present invention will be described. In the present embodiment, the audio data conversion device and the audio data playback device of the present invention are realized as components in the karaoke system.
図1は、本発明の一実施形態におけるカラオケシステムのネットワーク構成を示した図である。
本実施形態のカラオケシステムは、各地のカラオケ店舗等に設置されたカラオケ装置100と、通信網と、サーバ200と、から基本的に構成される。
カラオケ装置100は、カラオケ店舗の客室ごとに設置されている。
カラオケ装置100とサーバ200とは、例えば、カラオケ店舗内に設置されるルータを介して、通信網によって接続される。ここで、通信網としては、有線、無線、併用どのような形態でもよく、また、インターネットを利用したVPN(Virtual Private Network)であってもよい。
FIG. 1 is a diagram showing a network configuration of a karaoke system in an embodiment of the present invention.
The karaoke system of the present embodiment is basically composed of a
The
The
本実施形態においては、本発明に係るオーディオデータ変換装置の処理(以下、「オーディオデータ変換処理」ということがある。)が、サーバ200で行われる。また、本発明に係るオーディオデータ再生装置の処理(以下、「オーディオデータ再生処理」ということがある。)が、カラオケ装置100で行われる。ただし、以下説明する本実施形態は、本発明の単なる一実施形態にすぎず、オーディオデータ変換処理及びオーディオデータ再生処理は、他の構成を有するシステムにおいても実現可能であることはいうまでもない。
In the present embodiment, processing of the audio data conversion apparatus according to the present invention (hereinafter, also referred to as “audio data conversion processing”) is performed by the
サーバ200は、サーバコントローラ201、RAM202、MIDI音源203、データベース204等から基本的に構成される。
サーバコントローラ201は、サーバ200全体を制御するものであり、プロセッサ(例えば、CPU)によって実現される。また、本発明を実現するために必要なプロセス(プログラム)を実行する。
The
The server controller 201 controls the
プロセスの実行中において、種々のデータの書き込み/読み出しがRAM202に対して行われる。また、RAM202上の一部の領域は、リングバッファとして用いられる。MIDI音源203は、MIDIデータに基いて演奏音を再生する。
During the execution of the process, various data are written / read to / from the
データベース204(記憶媒体)には、カラオケ楽曲の演奏に用いられる種々のデータが記憶されている。例えば、楽曲IDをキーとして、楽音データ、背景データ、歌手名、歌詞、等が記憶されている。
楽音データは、後述するオーディオデータ変換処理によって変換されたデータである。楽音データの再生においては、MIDI音源を必要としない。
また、オーディオデータ変換処理の変換対象となったMIDIデータを必要に応じ記憶してもよい。
The database 204 (storage medium) stores various data used for performance of karaoke music. For example, musical tone data, background data, singer name, lyrics, etc. are stored using the music ID as a key.
The musical sound data is data converted by an audio data conversion process described later. The reproduction of the musical sound data does not require a MIDI sound source.
Further, MIDI data that is a conversion target of the audio data conversion process may be stored as necessary.
また、歌唱者情報データをデータベース204に記憶してもよい。歌唱者情報データベースは、例えば、歌唱者IDをキーとして、ニックネーム、住所、性別、生年月日、等を含む。また、歌唱者情報は、リモコンを用いて登録することができる。また、パソコンや携帯電話を用いて登録することができる。また、カラオケSNSサービスと関連付けてもよい。
Further, the singer information data may be stored in the
次に、カラオケ装置100について説明する。カラオケ装置100は、カラオケ店舗の各客室に設置される。
図2は、カラオケ装置100のシステム構成の一例である。図2に示すように、カラオケ装置100は、リモコン101とコマンダ102とから構成される。なお、複数のリモコン101が、コマンダ102と通信可能となるように構成してもよい。
Next, the
FIG. 2 is an example of a system configuration of the
リモコン101は、赤外線通信I/F111、電波通信I/F112、CPU113、ROM114、RAM115、表示部116、操作部117等から基本的に構成される。
The
コマンダ102は、赤外線通信I/F121、電波通信I/F122、CPU123、ROM124、RAM125、補助記憶手段126、映像音声再生手段130、から基本的に構成される。
The
赤外線通信I/F111及び赤外線I/F121は、リモコン101とコマンダ102とが赤外線を媒体とする無線通信(以下、「赤外線通信」という。)を行うためのインタフェースである。
電波通信I/F112及び電波I/F122は、リモコン101とコマンダ102とが電波を媒体とする無線通信(以下、「電波通信」という。)を行うためのインタフェースである。
The infrared communication I / F 111 and the infrared I / F 121 are interfaces for allowing the
The radio wave communication I / F 112 and the radio wave I / F 122 are interfaces through which the
また、電波通信I/F112及び電波通信I/F122を用いることにより、ホストとの間で種々の情報を送受信することも可能である。
また、コマンダ102とリモコン101とは、アクセスポイントを介して無線通信を行ってもよい。
リモコン101で受け付けた各種操作信号は、コマンダ102に送信される。また、種々の情報がコマンダ102からリモコン101に送信される。ここで、赤外線通信と無線通信とは、送受信される情報の種類等に応じて適宜切り替えて用いることができる。
Further, by using the radio communication I / F 112 and the radio communication I / F 122, it is possible to transmit and receive various types of information to and from the host.
Further, the
Various operation signals received by the
また、それぞれのリモコン101及びコマンダ102がイーサネット(登録商標)等で接続されている場合は、それぞれの機器に対して固有のIPアドレスが付されている。また、IPアドレスは、後述する識別番号及び所定の生成式に基いて算出することができる。
When each
CPU113及びCPU123は、本発明を実現するために必要なプログラムを含む種々のプログラムを実行する。ROM114及びROM124は、本発明を実現するために必要な情報を含む種々のデータを記憶する。RAM115及びRAM125は、本発明を実現するために必要な情報を含む種々のデータを一時的に記憶する。
また、RAM125上の所定の領域は、リングバッファとして機能する。
The CPU 113 and CPU 123 execute various programs including programs necessary for realizing the present invention. The ROM 114 and the ROM 124 store various data including information necessary for realizing the present invention. The RAM 115 and RAM 125 temporarily store various data including information necessary for realizing the present invention.
A predetermined area on the RAM 125 functions as a ring buffer.
リモコン101には、表示部116が設けられている。表示部116には、種々の情報を表示する。リモコン101には、操作部117が設けられている。操作部117は、表示部116の表面にタッチパネルとして実現してもよい。
The
コマンダ102には、補助記憶手段126が設けられている。補助記憶手段126には、例えば、楽曲の再生に必要な音声データ及び映像データ等が記憶される。また、ゲーム等のアプリケーションデータが記憶される。
The
コマンダ102には、映像音声再生手段130が設けられている。映像音声再生手段130は、楽曲の再生及び映像の再生を行う。また、図示しないホストから送信されたデータに基いてストリーミング再生を行うことも可能である。映像音声再生手段130のうち、音声を再生するための具体的構成については後述する。
The
また、図示しない音声入力手段(マイク等)、映像表示手段(ディスプレイ等)が、コマンダ102に接続されている。また、コマンダ102は、採点機能を有する。
Also, voice input means (such as a microphone) and video display means (such as a display) (not shown) are connected to the
また、リクエストがあった楽曲は、リクエスト毎にサーバからダウンロードしてもよく、また、ホストまたはコマンダに一時的に記憶しておくように構成してもよい。また、一度ダウンロードした楽曲を所定時間のみ記憶するようにしてもよい。 The requested music may be downloaded from the server for each request, or may be configured to be temporarily stored in the host or commander. Moreover, the music downloaded once may be stored only for a predetermined time.
[サーバにおけるオーディオデータ変換処理]
サーバ200において実行されるオーディオデータ変換処理について説明する。
[Audio data conversion processing on the server]
An audio data conversion process executed in the
(内部構成)
図3は、サーバ200の内部構成の一部を示している。
CPU201は、MIDI音源203に対し、楽曲のMIDIデータを送信(転送)する。
MIDI音源203は、受信したMIDIデータに基いて再生処理を行い、ADコンバータ205に演奏音を出力する。
ADコンバータ205は、可変クロックジェネレータ206から出力されるクロック信号に基いて、演奏音デジタルデータを生成する。
(Internal structure)
FIG. 3 shows a part of the internal configuration of the
The CPU 201 transmits (transfers) the MIDI data of the music to the
The
The
CPU201は、可変クロックジェネレータ206に制御信号を送信する。可変クロックジェネレータ206は、受信した制御信号に基いて、クロック周波数を決定し、該クロック周波数でクロック信号をADコンバータ205に送信する。すなわち、CPU201は、MIDI音源203で再生された波形データのサンプリング周波数を制御することができる。
The CPU 201 transmits a control signal to the variable clock generator 206. The variable clock generator 206 determines a clock frequency based on the received control signal, and transmits the clock signal to the
エンコーダ207は、上記演奏音デジタルデータを所定のフォーマット(例えば、MPEG)で圧縮し、圧縮演奏音データを生成する。なお、圧縮処理は公知であるので説明は省略する。
記録媒体204は、上記圧縮演奏音データを記憶する。また、圧縮演奏音データは、MIDI音源を用いることなく再生することができる。
The
The
(オーディオデータ変換処理)
オーディオデータ変換処理の詳細について説明する。オーディオデータ変換処理では、MIDIデータが他のフォーマットデータに変換する。オーディオデータ変換処理では、MIDIデータが、打楽器音トラックとそれ以外のトラック(以下、「通常音トラック」という。)に分けられ、それぞれのトラックに対し別々の処理が行われる。なお、MIDIデータは、データベース204または別の記憶媒体に記憶されているものとする。
(Audio data conversion processing)
Details of the audio data conversion processing will be described. In the audio data conversion process, MIDI data is converted into other format data. In the audio data conversion process, MIDI data is divided into a percussion instrument sound track and other tracks (hereinafter referred to as “normal sound track”), and a separate process is performed on each track. Note that the MIDI data is stored in the
(通常音トラックに対するオーディオデータ変換処理)
まず、通常音トラックに対するオーディオデータ変換処理について説明する。打楽器音トラックをミュートとした状態で、MIDIデータを再生し、再生された演奏音を圧縮して記録媒体204に記憶する。なお、「打楽器音トラックをミュートした状態」とは、打楽器音トラックのベロシティを0として再生することをいう。
(Audio data conversion processing for normal sound tracks)
First, audio data conversion processing for a normal sound track will be described. With the percussion instrument sound track muted, the MIDI data is reproduced, and the reproduced performance sound is compressed and stored in the
また、このときの可変クロックジェネレータ206のクロック信号は、通常速度(100%)で再生する場合のクロック周波数(例えば、44.1kHz)である。
記録媒体204に記憶された圧縮演奏音データを再生する場合は、圧縮演奏音データを解凍する。そして、解凍した演奏音データを指定された再生速度に応じたサンプリング周波数で読み出し、ピッチシフタを介して出力する(公知の速度変換処理)。すなわち、1つの圧縮演奏音データが、複数の再生速度に対応することになる。
Further, the clock signal of the variable clock generator 206 at this time is a clock frequency (for example, 44.1 kHz) when reproducing at a normal speed (100%).
When reproducing the compressed performance sound data stored in the
(打楽器音トラックに対するオーディオデータ変換処理)
次に、打楽器音トラックに対するオーディオデータ変換処理について説明する。打楽器音は、アタック感が重要な聴覚的要素である。ここで、上記公知の速度変換処理は、その原理的理由により出力音のアタック感に影響を及ぼす。したがって、打楽器音トラックを、通常音トラックと同様に処理した場合は、速度を変更して再生した場合に、悪影響を及ぼすことになる。
(Audio data conversion processing for percussion instrument sound tracks)
Next, audio data conversion processing for a percussion instrument sound track will be described. In percussion instrument sounds, the sense of attack is an important auditory element. Here, the known speed conversion process affects the attack feeling of the output sound due to its principle. Therefore, if the percussion instrument sound track is processed in the same manner as the normal sound track, it will have an adverse effect when the percussion instrument sound track is played at a different speed.
そこで、本実施形態においては、複数の速度ごとに再生した打楽器の演奏音を、それぞれ、所定のサンプリング周波数(詳細は後述)で記憶する。このとき、MIDIデータの発音タイミングを制御することで、複数の再生速度での再生を行う。発音タイミングを制御(すなわち、再生速度を上げるときは、発音タイミングを早める、また、再生速度を下げるときは、発音タイミングを遅くする)ため、再生速度の変更に伴う音質の低下を防ぐことができる。
複数の再生速度ごとに打楽器音の演奏音を記憶することによりデータ容量が急激に増加することになるため、本実施形態においては、以下のような圧縮処理を行う。
Therefore, in this embodiment, percussion instrument performance sounds reproduced at a plurality of speeds are stored at a predetermined sampling frequency (details will be described later). At this time, reproduction is performed at a plurality of reproduction speeds by controlling the sound generation timing of the MIDI data. Controls the sound generation timing (ie, speeds up the sound generation timing when the playback speed is increased, and slows the sound generation timing when the playback speed is decreased), so that it is possible to prevent deterioration in sound quality due to changes in the playback speed. .
Since the performance of the percussion instrument sound is stored for each of a plurality of reproduction speeds, the data capacity increases rapidly. Therefore, in the present embodiment, the following compression process is performed.
打楽器音は、小節単位でのループ再生が多いという特性を有する。すなわち、複数の小節において同じMIDIデータの並びが用いられている。そこで、本実施形態においては、同じMIDIデータを共通化して演奏音データを記憶することでデータ量の圧縮を図る。また、それぞれの小節のMIDIデータに識別符号を付与する。このとき、同じMIDIデータの小節には、同じ識別符号を付与する。これにより、MIDIデータの進行情報は、識別記号列として表現され、また、演奏音データは重複することなく記憶される。 Percussion instrument sounds have the characteristic that there are many loop reproductions in units of measures. That is, the same sequence of MIDI data is used in a plurality of bars. Therefore, in this embodiment, the same MIDI data is shared and performance sound data is stored to reduce the data amount. Also, an identification code is assigned to the MIDI data of each measure. At this time, the same identification code is given to the bar of the same MIDI data. Thereby, the progress information of the MIDI data is expressed as an identification symbol string, and the performance sound data is stored without duplication.
図4は、オーディオデータ変換処理によって生成される楽曲データのデータ構造の一例である。生成される楽曲データは、通常音トラック部分と打楽器音トラック部分から構成される。 FIG. 4 shows an example of the data structure of music data generated by the audio data conversion process. The generated music data is composed of a normal sound track portion and a percussion instrument sound track portion.
通常音トラック部分には、ヘッダと100%の再生速度で再生した場合の圧縮演奏音データが記憶されている。
打楽器音トラック部分には、ヘッダとそれぞれの再生速度で再生した場合のループ元データ列が記憶されている。
The normal sound track portion stores a header and compressed performance sound data when played back at a playback speed of 100%.
In the percussion instrument sound track portion, a header and a loop source data string when reproduced at each reproduction speed are stored.
ループ元データは、それぞれ、小節単位の打楽器音の演奏音データである。また、1つの再生速度におけるループ元データのそれぞれは、重複していない。ループ元データ列の生成方法については後述する。 The loop source data is performance sound data of percussion instrument sounds in units of measures. In addition, each of the loop source data at one reproduction speed does not overlap. A method for generating the loop source data string will be described later.
また、打楽器音トラックの部分には、ループ展開データが記憶されている。ループ展開データは、上述した識別記号列である。ループ展開データの生成方法については後述する。 Loop development data is stored in the percussion instrument sound track. The loop expansion data is the identification symbol string described above. A method for generating loop expansion data will be described later.
図4に示した楽曲データにおいては、再生速度(スピコン値)が、「+5」〜「−5」の11段階の再生速度におけるループ元データ列が生成されている。また、それぞれの再生速度は、3%刻みである。なお、図4に示す再生速度の段階、及び、刻み値は単なる一例であり、適宜設定可能である。
また、ループ展開データは複数の再生速度において共通に用いられる。
In the music data shown in FIG. 4, a loop source data sequence is generated at 11 playback speeds of “+5” to “−5”. Each playback speed is in increments of 3%. Note that the stage of reproduction speed and the step value shown in FIG. 4 are merely examples, and can be set as appropriate.
The loop expansion data is commonly used at a plurality of reproduction speeds.
図5は、ループ元データのデータ構造の一例である。図5に示すように、ループ元データは、ループ元ヘッダとループ元実データとから構成される。ループ元ヘッダには、ループ元実データのうち実際に使用するフレーム数が格納されている。これは、ループ元実データが圧縮データである場合、展開後(解凍後)のデータサイズと圧縮前のデータサイズとが同じとは限らないためである。すなわち、通常の音声圧縮コーデック(エンコーダ+デコーダ)は、一定のブロックサイズ毎にデータを分割して圧縮しており、元データが上記サイズの倍数以外のサイズであった場合、無音データの付与、または、元データの削除が行われるためである。なお、ループ元データは、楽曲の1小節分またはその倍数分の演奏データである。 FIG. 5 shows an example of the data structure of the loop source data. As shown in FIG. 5, the loop original data is composed of a loop original header and loop original real data. The number of frames actually used in the loop source real data is stored in the loop source header. This is because when the loop original real data is compressed data, the data size after decompression (after decompression) and the data size before compression are not necessarily the same. That is, a normal audio compression codec (encoder + decoder) divides and compresses data for each fixed block size, and if the original data has a size other than a multiple of the above size, the silence data is added, Alternatively, the original data is deleted. The loop source data is performance data for one measure or multiples of the music.
(ループ展開データ及びループ元データ列の生成処理)
次に、打楽器音トラックに対するオーディオデータ変換処理を構成するループ展開データ生成処理及びループ元データ列生成処理について説明する。
(Loop expansion data and loop source data string generation processing)
Next, a loop expansion data generation process and a loop original data string generation process constituting an audio data conversion process for a percussion instrument sound track will be described.
(ループ展開データ生成処理)
図6は、ループ展開データ生成処理のフローチャートである。
S1において、ループ展開データを作成する。ここでは、オーディオデータ変換処理の対象となる楽曲の小節分だけループ展開データが作成される。
S2において、ループ展開データを初期化する。ここでは、すべてのループ展開データに対し、初期値として「0」をセットする。
(Loop expansion data generation processing)
FIG. 6 is a flowchart of the loop expansion data generation process.
In S1, loop expansion data is created. Here, loop expansion data is created for the bars of the music to be subjected to audio data conversion processing.
In S2, loop expansion data is initialized. Here, “0” is set as the initial value for all loop expansion data.
S3において、ループ展開記述値に「1」をセットする。なお、ループ展開記述値は、RAM202上の所定領域に確保されているものとする。
S4において、比較元小節を特定する。ここでは、楽曲の先頭から順に、「0」がセットされているループ展開データを探索していき、「0」がセットされているループ展開データが見つかると、そのループ展開データに対応する小節を、「比較元小節」として特定する。したがって、ループ展開データ生成処理実行開始後、最初にS4の処理を実行する場合は、楽曲の最初の小節が、「比較元小節」となる。
In S3, “1” is set to the loop expansion description value. It is assumed that the loop expansion description value is secured in a predetermined area on the
In S4, the comparison source measure is specified. Here, in order from the beginning of the music, the loop expansion data set with “0” is searched, and when the loop expansion data with “0” set is found, the measure corresponding to the loop expansion data is found. , Specified as “comparison source measure”. Therefore, when the process of S4 is executed first after the execution of the loop expansion data generation process starts, the first measure of the music becomes the “comparison source measure”.
S5において、比較元小節のループ展開データに、ループ展開記述値をセットする。
S6において、チェック対象小節をセットする。ここでは、楽曲の先頭の小節が「チェック対象小節」としてセットされる。
In S5, a loop expansion description value is set in the loop expansion data of the comparison source measure.
In S6, a check target measure is set. Here, the first measure of the music is set as the “check target measure”.
S7において、チェック対象小節のループ展開データが0(初期値)であるか否かを判断する。チェック対象小節のループ展開データが0ではないと判断した場合は(S7:NO)、S10に移行する。すなわち、既に所定のループ展開記述値がセットされているものと判断し、ループ展開データに新たなループ展開記述値をセットしない。 In S7, it is determined whether or not the loop expansion data of the check target measure is 0 (initial value). If it is determined that the loop expansion data of the check measure is not 0 (S7: NO), the process proceeds to S10. That is, it is determined that a predetermined loop expansion description value has already been set, and no new loop expansion description value is set in the loop expansion data.
一方、チェック対象小節のループ展開データが0であると判断した場合は(S7:YES)、S8に移行する。
S8において、比較元小節のMIDIデータとチェック対象小節のMIDIデータは同一か否かを判断する。
同一ではないと判断した場合は(S8:NO)、S10に移行する。一方、同一であると判断した場合は(S8:YES)、S9に移行する。なお、同一か否かの判断においては、互いのMIDIデータが完全に一致していなくても、所定範囲内の差であれば同一であると判断してもよい。例えば、互いのMIDIデータのベロシティ値、発音タイミングの差分値が一定範囲内であれば、同一であると判断してもよい。
On the other hand, when it is determined that the loop expansion data of the measure to be checked is 0 (S7: YES), the process proceeds to S8.
In S8, it is determined whether or not the MIDI data of the comparison source measure and the MIDI data of the check target measure are the same.
If it is determined that they are not the same (S8: NO), the process proceeds to S10. On the other hand, if it is determined that they are the same (S8: YES), the process proceeds to S9. In determining whether or not they are the same, even if the MIDI data are not completely matched, it may be determined that they are the same as long as they are within a predetermined range. For example, it may be determined that they are the same if the velocity value of the MIDI data and the difference value of the sound generation timing are within a certain range.
S9において、チェック対象小節のループ展開データに、ループ展開記述値をセットする。これにより、比較元小節のループ展開データとチェック対象小節のループ展開データには、同じループ展開記述値がセットされることになる。 In S9, a loop expansion description value is set in the loop expansion data of the check target measure. As a result, the same loop expansion description value is set in the loop expansion data of the comparison source bar and the loop expansion data of the check target bar.
S10において、チェック対象小節が、楽曲の最後の小節であるか否かを判断する。楽曲の最後の小節ではないと判断した場合は(S10:NO)、S11に移行する。
S11において、チェック対象小節として、現位置の次の小節をセットする。そして、S7に戻る。これにより、チェック対象小節が、楽曲の最後の小節となるまで、S7〜S11の処理が繰り返し行われることになる。
In S10, it is determined whether or not the check target measure is the last measure of the music. If it is determined that it is not the last measure of the music (S10: NO), the process proceeds to S11.
In S11, the next measure at the current position is set as the check target measure. Then, the process returns to S7. Thereby, the processing of S7 to S11 is repeatedly performed until the check target measure is the last measure of the music.
一方、S10において、チェック対象小節が、楽曲の最後の小節であると判断した場合は(S10:YES)、S12に移行する。
S12において、「0」がセットされているループ展開データが存在するか否かを判断する。「0」がセットされているループ展開データが存在すると判断した場合は(S12:YES)、S13に移行する。
S13において、ループ展開データ記述値を「1」加算する。その後、S4に戻る。
On the other hand, if it is determined in S10 that the check target measure is the last measure of the music (S10: YES), the process proceeds to S12.
In S12, it is determined whether or not there is loop expansion data for which “0” is set. If it is determined that there is loop expansion data for which “0” is set (S12: YES), the process proceeds to S13.
In S13, “1” is added to the loop expansion data description value. Thereafter, the process returns to S4.
次に、上述したループ展開データ生成処理の具体例について説明する。図7乃至図9は、ループ展開データ生成処理におけるループ展開データの内容及びMIDIデータの比較を概略的に示す説明図である。なお、以下の説明においては、必要に応じ、図6のループ展開データ生成処理のステップ番号を用いる。 Next, a specific example of the loop expansion data generation process described above will be described. 7 to 9 are explanatory diagrams schematically showing the comparison of the contents of the loop expansion data and the MIDI data in the loop expansion data generation process. In the following description, the step number of the loop expansion data generation process of FIG. 6 is used as necessary.
ここでは、第1小節〜第6小節で構成されるMIDIデータを例として、ループ展開データにセットされる値を説明する。
図7(1)に示すように、第1小節は「MIDIデータA」、第2小節は「MIDIデータA」、第3小節は「MIDIデータB」、第4小節は「MIDIデータC」、第5小節は「MIDIデータA」、第6小節は「MIDIデータB」であるとする。
Here, the value set in the loop expansion data will be described using MIDI data composed of the first bar to the sixth bar as an example.
As shown in FIG. 7 (1), the first measure is “MIDI data A”, the second measure is “MIDI data A”, the third measure is “MIDI data B”, the fourth measure is “MIDI data C”, The fifth bar is “MIDI data A”, and the sixth bar is “MIDI data B”.
図7(2)に示すように、ループ展開データは、小節ごとに作成されている。また、図7(2)は、図6のS2の処理が終了した時点でのループ展開データの内容を示しており、すべてのループ展開データは「0」である。 As shown in FIG. 7 (2), the loop expansion data is created for each measure. FIG. 7 (2) shows the contents of the loop expansion data at the time when the process of S2 in FIG. 6 is completed, and all the loop expansion data is “0”.
そして、図6のS4において、第1小節を「比較元小節」として特定する。また、第1小節のループ展開データ(以下、「第n小節のループ展開データ」を「第n展開データ」といい、「第n小節のMIDIデータ」を「第nMIDIデータ」ということがある。)に「1」がセットされる。
そして、図7(3)に示すように、第1MIDIデータと、第2MIDIデータ〜第6MIDIデータとがそれぞれ比較される。図7(3)では、第2MIDIデータ、第5MIDIデータについて、第1MIDIデータと同一であると判断される。
Then, in S4 of FIG. 6, the first measure is specified as the “comparison source measure”. Further, the loop expansion data of the first bar (hereinafter, “loop expansion data of the nth bar” may be referred to as “nth expansion data”, and “MIDI data of the nth bar” may be referred to as “nth MIDI data”. ) Is set to “1”.
Then, as shown in FIG. 7 (3), the first MIDI data and the second to sixth MIDI data are respectively compared. In FIG. 7 (3), it is determined that the second MIDI data and the fifth MIDI data are the same as the first MIDI data.
これにより、図7(4)に示すように、第1展開データ、第2展開データ、第5展開データに「1」がセットされる。 Thereby, as shown in FIG. 7 (4), “1” is set in the first expanded data, the second expanded data, and the fifth expanded data.
その後、図8(5)に示すように、「0」がセットされているループ展開データのうち、最も先頭に近いループ展開データである「第3データ」に対応する「第3小節」が、次の「比較元小節」として特定される。このとき、ループ展開記述値は「2」となる(図6のS13参照)。 Thereafter, as shown in FIG. 8 (5), among the loop expansion data for which “0” is set, the “third measure” corresponding to the “third data” that is the loop expansion data closest to the head is It is identified as the next “comparison source bar”. At this time, the loop expansion description value is “2” (see S13 in FIG. 6).
そして、図8(6)に示すように、第3MIDIデータと、第4MIDIデータ及び第6MIDIデータとがそれぞれ比較される。図8(6)では、第6MIDIデータについて、第3MIDIデータと同一であると判断される。 Then, as shown in FIG. 8 (6), the third MIDI data, the fourth MIDI data, and the sixth MIDI data are respectively compared. In FIG. 8 (6), it is determined that the sixth MIDI data is the same as the third MIDI data.
これにより、図8(7)に示すように、第3展開データ、第6展開データに「1」がセットされる。 Thereby, as shown in FIG. 8 (7), “1” is set in the third development data and the sixth development data.
その後、図9(8)に示すように、「0」がセットされているループ展開データは、「第4展開データ」のみであるため、「第4展開データ」に対応する「第4小節」が、次の「比較元小節」として特定される。このとき、ループ展開記述値は「3」となる(図6のS13参照)。 Thereafter, as shown in FIG. 9 (8), since the loop expansion data in which “0” is set is only “fourth expansion data”, “fourth measure” corresponding to “fourth expansion data”. Is identified as the next “comparison source bar”. At this time, the loop expansion description value is “3” (see S13 in FIG. 6).
そして、図9(9)に示すように、第4MIDIデータと比較されるMIDIデータは存在しない。これにより、図9(10)に示すように、第4展開データに「3」がセットされる。 As shown in FIG. 9 (9), there is no MIDI data to be compared with the fourth MIDI data. Thereby, as shown in FIG. 9 (10), “3” is set in the fourth development data.
以上の処理によって、「112312」から構成されるループ展開データ(識別記号列)を生成することができる。 Through the above processing, loop expansion data (identification symbol string) composed of “112312” can be generated.
(ループ元データ列生成処理)
次に、ループ元データ列生成処理について説明する。図10は、ループ元データ列生成処理のフローチャートである。ループ元データ列生成処理は、設定される複数の再生速度ごとに実行される。
S21において、再生速度を設定する。例えば、115%、112%、109%、106%、103%、100%、97%、94%、91%、88%、85%のいずれかが設定される。なお、設定する再生速度は、上記以外のものであってもよい。
(Loop source data string generation process)
Next, the loop original data string generation process will be described. FIG. 10 is a flowchart of the loop original data string generation process. The loop source data string generation process is executed for each of a plurality of set reproduction speeds.
In S21, the playback speed is set. For example, any of 115%, 112%, 109%, 106%, 103%, 100%, 97%, 94%, 91%, 88%, and 85% is set. Note that the playback speed to be set may be other than the above.
S22において、打楽器音トラック以外をミュートした状態で、S21で設定された速度で再生して録音する。再生速度は、MIDIデータの発音タイミングを制御することにより制御する。録音は、例えば、RAM125上に対して行う。このときの、再生サンプリング周波数は、再生速度に比例して設定する。例えば、再生速度が100%であるときの再生サンプリング周波数を44100Hzとした場合、再生速度が115%の場合は、再生サンプリング周波数を50715Hz(=44100×1.15)とする。また、再生速度が85%の場合は、再生サンプリング周波数を37485Hz(=44100×0.85)とする。 In S22, with the mutes other than the percussion instrument sound track muted, playback and recording are performed at the speed set in S21. The playback speed is controlled by controlling the sound generation timing of MIDI data. Recording is performed on the RAM 125, for example. The reproduction sampling frequency at this time is set in proportion to the reproduction speed. For example, when the reproduction sampling frequency is 44100 Hz when the reproduction speed is 100%, the reproduction sampling frequency is set to 50715 Hz (= 44100 × 1.15) when the reproduction speed is 115%. When the playback speed is 85%, the playback sampling frequency is 37485 Hz (= 44100 × 0.85).
再生速度と再生サンプリング周波数との関係を上記のように設定することによって、各速度の演奏音データのサンプル数(フレーム数)は同一にすることができる。すなわち、各再生速度における小節ごとのフレーム数を同一にすることができる。これにより、ループ展開データを各速度で共通化でき、楽曲の再生中に速度変更(スピードコントロール、スピコン)指示があった場合において、変更後のデータにおける読み出し位置を容易に決定することができる。 By setting the relationship between the reproduction speed and the reproduction sampling frequency as described above, the number of samples (number of frames) of performance sound data at each speed can be made the same. That is, the number of frames for each measure at each playback speed can be made the same. Thereby, loop unfolded data can be made common at each speed, and when a speed change (speed control, speed controller) instruction is given during the reproduction of music, the read position in the changed data can be easily determined.
S23において、ループ展開データ比較値に「1」をセットする。なお、ループ展開データ比較値は、RAM202上の所定領域に記憶されているものとする。
S24において、ループ展開データ比較値と一致するループ展開データが存在するか否かを判断する。
In S23, “1” is set to the loop expansion data comparison value. It is assumed that the loop expansion data comparison value is stored in a predetermined area on the
In S24, it is determined whether or not there is loop expansion data that matches the loop expansion data comparison value.
一致するループ展開データが存在すると判断した場合は(S24:YES)、S25に移行する。一致するループ展開データが存在しないと判断した場合は(S24:NO)、ループ元データ列処理を終了する。 If it is determined that there is matching loop expansion data (S24: YES), the process proceeds to S25. If it is determined that there is no matching loop expansion data (S24: NO), the loop source data string processing is terminated.
S25において、一致するループ展開データの小節に対応する録音データを切り出し、ループ元データを作成する。
S26において、ループ展開データ比較値を「1」増加する。その後、S24に戻る。
In S25, the recorded data corresponding to the bar of the matched loop development data is cut out to create loop source data.
In S26, the loop expansion data comparison value is increased by “1”. Thereafter, the process returns to S24.
以上説明したループ展開データ生成処理及びループ元データ列生成処理によって、図4に示される楽曲データの打楽器音トラック部分を生成することができる。 The percussion instrument sound track portion of the music data shown in FIG. 4 can be generated by the loop expansion data generation process and the loop original data string generation process described above.
以上説明したサーバにおけるオーディオデータ変換処理によれば、サーバ200は、MIDI音源を必要としないオーディオフォーマットの楽音データをデータベース204に記憶することができる。これにより、コマンダからの楽曲リクエストに対し、上記楽音データを送信することができるので、コマンダにおいてMIDI音源を有する必要がない。また、オーディオデータ変換処理によって、打楽器音の特性に応じた圧縮処理を行うので、記憶容量の急激な増加を防止することができる。
According to the audio data conversion process in the server described above, the
[コマンダにおける処理]
次に、コマンダ102において実行されるオーディオデータ再生処理について説明する。本実施形態においては、コマンダ102は、サーバ200から受信したオーディオデータ変換処理がなされた楽音データに基いて、オーディオデータ再生処理を行う。コマンダ102は、楽曲再生指示があった場合に、上記楽音データに基いて再生を行う。また、スピコン値の変更指示があった場合に、上記楽音データに基いて速度制御を行う。
[Processing by commander]
Next, audio data reproduction processing executed in the
(入力受付処理)
図11は、コマンダで実行される入力受付処理のフローチャートである。
S31において、パネル、リモコン101から入力操作があったか否かを判断する。また、入力操作がない間、処理はS31で待機することになる。
(Input acceptance process)
FIG. 11 is a flowchart of the input reception process executed by the commander.
In S31, it is determined whether or not an input operation has been performed from the panel or
入力操作があったと判断した場合は(S31:YES)、S32に移行する。
S32において、入力操作が楽曲リクエストであるか否かを判断する。楽曲リクエストであると判断した場合は(S32:YES)、S33に移行する。
S33において、リクエストされた楽曲の再生を行う。楽曲の再生処理は公知であるので、説明を省略する。
If it is determined that there is an input operation (S31: YES), the process proceeds to S32.
In S32, it is determined whether or not the input operation is a music request. When it is determined that the request is a music request (S32: YES), the process proceeds to S33.
In S33, the requested music is reproduced. Since the music reproduction process is publicly known, a description thereof will be omitted.
一方、S32において、入力操作が楽曲リクエストでないと判断した場合は(S32:NO)、S34に移行する。
S34において、入力操作がスピコン値変更であるか否かを判断する。スピコン値変更ではないと判断した場合は(S34:NO)、S35に移行する。
S35において、入力操作指示に基いた処理を行う。例えば、楽曲の検索、リクエスト、ゲームの実行、所定の情報の提示、飲食の注文等、種々の処理が実行される。
On the other hand, if it is determined in S32 that the input operation is not a music request (S32: NO), the process proceeds to S34.
In S34, it is determined whether or not the input operation is a speed controller value change. If it is determined that the speed control value is not changed (S34: NO), the process proceeds to S35.
In S35, processing based on the input operation instruction is performed. For example, various processes such as music search, request, game execution, presentation of predetermined information, food order, and the like are executed.
一方、S34において、入力操作がスピコン値変更であると判断した場合は(S34:YES)、S36に移行する。
S36において、操作内容に応じて、スピコン値エリアを書き換える。ここで、スピコン値エリアは、RAM125上の所定の領域に確保されているものとする。また、スピコン値エリアは、後述するデコーダB制御処理においてアクセスされる。
On the other hand, if it is determined in S34 that the input operation is a change in the speed controller value (S34: YES), the process proceeds to S36.
In S36, the speed controller value area is rewritten according to the operation content. Here, it is assumed that the speed controller value area is secured in a predetermined area on the RAM 125. The speed controller value area is accessed in a decoder B control process described later.
S37において、操作内容に応じて、演奏音の出力クロック値を変更する。具体的には、可変クロックジェネレータ(後述)が出力するクロック信号のクロック周波数を変更するための指示を行う。 In S37, the output clock value of the performance sound is changed according to the operation content. Specifically, an instruction for changing the clock frequency of a clock signal output from a variable clock generator (described later) is issued.
S38において、操作内容に応じて、ピッチシフタ(後述)にシフト値を指示する。ピッチシフタは、速度変更に伴うピッチ周波数の変更を補正するためのものである。 In S38, a shift value is instructed to a pitch shifter (described later) according to the operation content. The pitch shifter is for correcting a change in pitch frequency accompanying a speed change.
図12は、コマンダ102の内部構成の一部を示している。
RAM125は、リングバッファのための領域を有する。また、後述する複数のプロセスでアクセスされる領域(共用メモリ領域)を有する。
また、再生対象の通常演奏データ、ループ元データ列、ループ展開データは、RAM125に記憶されているものとする。
FIG. 12 shows a part of the internal configuration of the
The RAM 125 has an area for a ring buffer. It also has an area (shared memory area) that is accessed by a plurality of processes to be described later.
It is assumed that the normal performance data, the loop source data string, and the loop expansion data to be reproduced are stored in the RAM 125.
デコーダ131は、通常音の圧縮データを解凍する。圧縮データは、公知の解凍方法によって解凍(展開)される。解凍データは、リングバッファ(通常演奏用リングバッファ)に順次書き出される。
デコーダ132は、打楽器音の圧縮データを解凍する。解凍処理の詳細については後述する。解凍データは、リングバッファ(ループ展開データ用リングバッファ)に順次書き出される。
The decoder 131 decompresses the compressed data of the normal sound. The compressed data is decompressed (decompressed) by a known decompression method. The decompressed data is sequentially written to a ring buffer (normal performance ring buffer).
The decoder 132 decompresses the compressed data of the percussion instrument sound. Details of the decompression process will be described later. The decompressed data is sequentially written to a ring buffer (loop buffer for loop expansion data).
なお、図12においては、説明の便宜上、CPU123、デコーダ131、デコーダ132を分けて記載しているが、CPU123が、デコーダ131及びデコーダ132での処理の全部または一部を処理するように構成してもよい。 In FIG. 12, for convenience of explanation, the CPU 123, the decoder 131, and the decoder 132 are shown separately. However, the CPU 123 is configured to process all or part of the processing in the decoder 131 and the decoder 132. May be.
CPU123は、可変クロックジェネレータ133に対し、制御信号を送信する。スピコンの変更指示があった場合に、その指示に応じたクロック信号を生成することを指示するための制御信号を送信する(図11のS37参照)。
CPU123は、ピッチシフタ136に対し、制御信号を送信する。スピコン指示があった場合に、その指示に応じたシフト量を指示するための制御信号を送信する(図11のS38参照)。
The CPU 123 transmits a control signal to the variable clock generator 133. When there is an instruction to change the speed controller, a control signal for instructing generation of a clock signal corresponding to the instruction is transmitted (see S37 in FIG. 11).
The CPU 123 transmits a control signal to the
可変クロックジェネレータ133は、DAコンバータ134及びDAコンバータ135に対し、受信した制御信号に基いたクロック周波数のクロック信号を送信する。
The variable clock generator 133 transmits a clock signal having a clock frequency based on the received control signal to the DA converter 134 and the
CPU123は、通常演奏用リングバッファに記憶される通常音の解凍データを、DAコンバータ134に転送する。
CPU123は、ループ展開データデータ用リングバッファに記憶される解凍データを、DAコンバータ135に転送する。
The CPU 123 transfers the decompressed data of the normal sound stored in the normal performance ring buffer to the DA converter 134.
The CPU 123 transfers the decompressed data stored in the loop expansion data data ring buffer to the
DAコンバータ134は、通常音の解凍データをクロック信号に基いて出力する。DAコンバータ135は、打楽器音の解凍データをクロック信号に基いて出力する。
なお、図12においては、説明の便宜上、DAコンバータ134及びDAコンバータ135を分けて記載しているが、1つのDAコンバータで実現してもよい。
The DA converter 134 outputs the decompressed data of the normal sound based on the clock signal. The
In FIG. 12, for convenience of explanation, the DA converter 134 and the
ピッチシフタ136は、入力された演奏音に対し、制御信号に基いてピッチシフトを行う。ピッチシフタ136によって、演奏音の音程を制御する。
通常音と打楽器音はミックスされ、スピーカ137により音声出力される。
なお、通常音のみピッチシフタ136が介され、前記ピッチシフタ136による前記通常音の信号伝達遅延時間が生じるときは、前記遅延時間に応じてCPU123による打楽器音の解凍タイミングの変更や、DAコンバータ135の出力に前記遅延時間と同じ遅延時間の遅延線挿入などを行えばよい。
The
The normal sound and the percussion instrument sound are mixed and output by the speaker 137 as sound.
When only the normal sound is passed through the
(オーディオデータ再生処理)
次に、オーディオデータ再生処理について説明する。オーディオデータ再生処理は、楽音再生処理、デコーダA制御処理、デコーダB制御処理に分けることができる。これらの処理は、マルチプロセスとして実行される。
(Audio data playback processing)
Next, audio data reproduction processing will be described. Audio data reproduction processing can be divided into musical tone reproduction processing, decoder A control processing, and decoder B control processing. These processes are executed as a multi-process.
(楽音再生処理)
まず、楽音再生処理について説明する。図13は、楽曲再生処理のフローチャートである。
S41において、デコーダA状態エリアをクリアする。また、デコーダB状態エリアをクリアする。それぞれのエリアは、RAM125上の所定の領域に確保されているものとする。また、それぞれのエリアは、後述するデコーダA制御処理、デコーダB制御処理においてアクセスされる。
(Music playback process)
First, the tone reproduction process will be described. FIG. 13 is a flowchart of the music playback process.
In S41, the decoder A state area is cleared. Also, the decoder B state area is cleared. It is assumed that each area is secured in a predetermined area on the RAM 125. Each area is accessed in a decoder A control process and a decoder B control process described later.
S42において、デコーダA制御処理の開始を指示する。また、デコーダB制御処理の開始を指示する。デコーダA制御処理は、デコーダ131(図12)で実行される処理である。デコーダB制御処理は、デコーダ132(図12)で実行される処理である。それぞれの処理については後述する。 In S42, the start of the decoder A control process is instructed. Also, the start of the decoder B control process is instructed. The decoder A control process is a process executed by the decoder 131 (FIG. 12). The decoder B control process is a process executed by the decoder 132 (FIG. 12). Each process will be described later.
S43において、各種ポインタを初期化する。ここでは、通常演奏データ用リングバッファの読み出し位置を示すポインタ、及び、ループ展開データ用リングバッファの読み出し位置を示すポインタを初期化する。 In S43, various pointers are initialized. Here, a pointer indicating the read position of the normal performance data ring buffer and a pointer indicating the read position of the loop expansion data ring buffer are initialized.
S44において、デコーダA及びデコーダBでのデコードが終了したか否かを判断する。この判断は、デコーダA状態エリアの値(後述)及びデコーダB状態エリアの値(後述)を参照することにより行われる。 In S44, it is determined whether or not the decoding by the decoder A and the decoder B is completed. This determination is made by referring to the value of the decoder A state area (described later) and the value of the decoder B state area (described later).
デコーダA及びデコーダBでのデコードが終了したと判断した場合は(S44:YES)、楽曲再生処理を終了する。
デコーダAまたはデコーダBでのデコードが終了していないと判断した場合は(S44:NO)、S45に移行する。
When it is determined that the decoding by the decoder A and the decoder B is finished (S44: YES), the music reproduction process is finished.
When it is determined that the decoding by the decoder A or the decoder B is not completed (S44: NO), the process proceeds to S45.
その後、通常演奏データ用リングバッファ及びループ展開データ用リングバッファに一定サイズのデータが書き込まれるまでS45で待機する。
通常演奏データ用リングバッファ及びループ展開データ用リングバッファに一定サイズのデータが書き込まれたと判断した場合は(S45:YES)、S46に移行する。
Thereafter, the process waits in S45 until data of a predetermined size is written in the normal performance data ring buffer and the loop expansion data ring buffer.
If it is determined that data of a certain size has been written to the normal performance data ring buffer and the loop expansion data ring buffer (S45: YES), the flow proceeds to S46.
S46において、通常演奏データ用リングバッファの内容及びループ展開データ用リングバッファの内容をそれぞれフレーム単位で出力する。これにより、スピーカ137から演奏音が出力されることになる。また、このときの再生クロック数は、通常音(通常演奏用リングバッファの内容)及び打楽器音(ループ展開データ用リングバッファ内容)に対して同一である。 In S46, the contents of the normal performance data ring buffer and the contents of the loop expansion data ring buffer are output in units of frames. As a result, a performance sound is output from the speaker 137. Further, the number of reproduction clocks at this time is the same for normal sounds (contents of the ring buffer for normal performance) and percussion instrument sounds (contents of the ring buffer for loop expansion data).
S47において、通常演奏データ用リングバッファの読み出し位置及びループ展開データ用リングバッファの読み出し位置を進める。すなわち、通常演奏データ用リングバッファの読み出し位置を示すポインタ、及び、ループ展開データ用リングバッファの読み出し位置を示すポインタを更新する。 In S47, the read position of the normal performance data ring buffer and the read position of the loop expansion data ring buffer are advanced. That is, the pointer indicating the read position of the normal performance data ring buffer and the pointer indicating the read position of the loop expansion data ring buffer are updated.
(デコーダA制御処理)
次に、デコーダA制御処理について説明する。図14は、デコーダA制御処理のフローチャートである。
(Decoder A control processing)
Next, the decoder A control process will be described. FIG. 14 is a flowchart of the decoder A control process.
S51において、各種ポインタを初期化する。ここでは、通常演奏データの読み出し位置を示すポインタ、及び、通常演奏用リングバッファの書き出し位置を示すポインタを初期化する。
S52において、通常演奏データを読み出し位置から一定サイズ分デコードする。
In S51, various pointers are initialized. Here, a pointer indicating the read position of the normal performance data and a pointer indicating the write position of the normal performance ring buffer are initialized.
In S52, the normal performance data is decoded by a certain size from the read position.
その後、通常演奏用リングバッファに書き込みが可能となるまでS53で待機する。
通常演奏用リングバッファへの書き込みが可能となったと判断した場合は(S53:YES)、S54に移行する。
Thereafter, the process waits at S53 until writing into the normal performance ring buffer becomes possible.
If it is determined that writing into the normal performance ring buffer is possible (S53: YES), the flow proceeds to S54.
S54において、通常演奏データ用リングバッファにデコード結果を書き込む。
S55において、通常演奏データ読み出し位置及びリングバッファの書き込み位置を進める。すなわち、通常演奏データの読み出し位置を示すポインタ、及び、通常演奏用リングバッファの書き出し位置を示すポインタを更新する。
In S54, the decoding result is written in the normal performance data ring buffer.
In S55, the normal performance data read position and the ring buffer write position are advanced. That is, the pointer indicating the reading position of the normal performance data and the pointer indicating the writing position of the normal performance ring buffer are updated.
S56において、データエンドか否かを判断する。すなわち、楽曲のすべての演奏データをリングバッファに書き込んだか否かを判断する。 In S56, it is determined whether it is a data end. That is, it is determined whether or not all performance data of the music has been written to the ring buffer.
データエンドではないと判断した場合は(S56:NO)、S52に戻る。一方、データエンドであると判断した場合は(S56:YES)、S57に移行する。
S57において、デコード終了を示す情報を、デコーダA状態エリアに書き込む。コード終了を示す情報は、楽曲再生処理(図13)のS44において参照される。
If it is determined that it is not a data end (S56: NO), the process returns to S52. On the other hand, when it is determined that the data end is detected (S56: YES), the process proceeds to S57.
In S57, information indicating the end of decoding is written in the decoder A state area. Information indicating the end of the code is referred to in S44 of the music reproduction process (FIG. 13).
(デコーダB制御処理)
次に、デコーダB制御処理について説明する。図15は、デコーダB制御処理のフローチャートである。
S61において、各種ポインタを初期化する。ここでは、ループ展開データの読み出し位置を示すポインタ、及び、ループ展開データ用リングバッファの書き出し位置を示すポインタを初期化する。
(Decoder B control processing)
Next, the decoder B control process will be described. FIG. 15 is a flowchart of the decoder B control process.
In S61, various pointers are initialized. Here, a pointer indicating the read position of the loop expansion data and a pointer indicating the write position of the loop expansion data ring buffer are initialized.
S62において、1小節書き出し値に0をセットする。1小節書き出し値は、ループ展開用リングバッファに書き出したデータ量を示すものである。また、1小節書き出し値は、RAM125上の所定領域に記憶される。
S63において、1小節分のループ展開データを読み込む。ここで、読み出される小節は、小節指定データによって決定される。
In S62, 0 is set to the 1-bar start value. The 1-bar write value indicates the amount of data written to the loop expansion ring buffer. In addition, the one bar start value is stored in a predetermined area on the RAM 125.
In S63, loop expansion data for one measure is read. Here, the bar to be read is determined by the bar designation data.
S64において、ループ展開データ及びスピコン値に基いてループ元データを決定する。ループ展開データに基いて、再生すべき小節で用いられるループ元データ(例えば、ループデータ1及びループデータ3)が決定される。本実施形態においては、再生速度ごとにループ元データ(例えば、複数のループデータ1及び複数のループデータ3)が存在するため、スピコン値に基いて、再生速度ごとに有する複数のループ元データのうち、どのループ元データを用いるかが決定される。
In S64, loop source data is determined based on the loop expansion data and the speed control value. Based on the loop expansion data, loop source data (for example,
S65において、ループ元データを読み出し位置から一定サイズ分デコードする。
S66において、スピコン値が変更されたか否かを判断する。スピコン値が変更されたと判断した場合は(S66:YES)、S64に戻る。
In S65, the loop source data is decoded by a certain size from the read position.
In S66, it is determined whether or not the speed controller value has been changed. If it is determined that the speed controller value has been changed (S66: YES), the process returns to S64.
一方、スピコン値は変更されていないと判断した場合は(S66:NO)、S67に移行する。
ループ展開データ用リングバッファに書き出し可能となるまで、S67で待機する。ループ展開データ用リングバッファに書き出し可能と判断した場合は(S67:YES)、S68に移行する。
On the other hand, when it is determined that the speed controller value has not been changed (S66: NO), the process proceeds to S67.
The process waits in S67 until it becomes possible to write to the ring buffer for loop expansion data. When it is determined that writing to the loop expansion data ring buffer is possible (S67: YES), the process proceeds to S68.
S68において、S65でデコードした内容をループ展開データ用リングバッファに書き出す。
S69において、ループ元データの読み出し位置及びループ展開データ用リングバッファ書き出し位置を進める。すなわち、ループ元データの読み出し位置を示すポインタ、及び、ループ展開データ用リングバッファの書き出し位置を示すポインタを制御する。
In S68, the content decoded in S65 is written to the loop expansion data ring buffer.
In step S69, the loop source data read position and loop expansion data ring buffer write position are advanced. That is, it controls a pointer indicating the read position of the loop original data and a pointer indicating the write position of the loop expansion data ring buffer.
S70において、小節書き出し値を、ループ展開用リングバッファに書き出したデータ量に基いて加算する。
S71において、1小節分のループ展開データの書き出しを終了したか否かを判断する。この判断は、小節書き出し値を参照して行われる。
In S70, the bar write value is added based on the amount of data written to the loop expansion ring buffer.
In S71, it is determined whether or not the writing of the loop expansion data for one measure has been completed. This determination is made with reference to the bar start value.
書き出しを終了したと判断した場合は(S71:YES)、S72に移行する。書き出しを終了していないと判断した場合は(S71:NO)、S65に戻る。 If it is determined that the writing has been completed (S71: YES), the process proceeds to S72. If it is determined that the writing has not ended (S71: NO), the process returns to S65.
S72において、小節指定データが最後の小節を指示しているか否かを判断する。最後の小節を指示していると判断した場合は(S72:YES)、S73に移行する。
最後の小節を指示していないと判断した場合は(S72:NO)、小節指定データを「1」加算し、S62に戻る。
In S72, it is determined whether or not the measure specifying data indicates the last measure. If it is determined that the last measure is instructed (S72: YES), the process proceeds to S73.
If it is determined that the last measure has not been instructed (S72: NO), “1” is added to the measure designation data, and the process returns to S62.
S73において、デコーダ終了を示す情報を、デコーダB状態エリアに書き込む。コード終了を示す情報は、楽曲再生処理(図13)のS44において参照される。 In S73, information indicating the end of the decoder is written in the decoder B state area. Information indicating the end of the code is referred to in S44 of the music reproduction process (FIG. 13).
以上説明したコマンダにおけるオーディオデータ再生装置によれば、コマンダ102は、サーバ200から受信した楽曲データ(通常演奏データ、ループ元データ、ループ展開データ)に基いて楽曲再生を行うので、MIDI音源を必要としない。これにより、MIDI音源に係るコストを削減することができる。また、通常演奏データ及びループ展開データに対し、同じ再生クロック数で再生することができるので、データの読み出し制御を簡素化することができ、また、同期性を確保することができる。
According to the audio data reproducing apparatus in the commander described above, the
本発明は上述した実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内で種々の改良、変形が可能であることはいうまでもない。 The present invention is not limited to the above-described embodiment, and it goes without saying that various improvements and modifications can be made without departing from the scope of the present invention.
例えば、上述した実施形態においては、サーバ200においてオーディオデータ変換処理を行っていたが、カラオケ店舗内のホストによってオーディオデータ変換処理を行ってもよい。この場合、ホストはMIDI音源を必要とするが、ホストによってフォーマット変換された楽曲データをコマンダ102に送信することにより、コマンダ102はMIDI音源を必要としない。
For example, in the embodiment described above, the audio data conversion process is performed in the
また、上述した各フローチャートは単なる一例であり、該各フローチャートの処理と同等の結果を得ることできるものであれば、他のフローチャートによって処理を実現してもよい。 Further, each flowchart described above is merely an example, and the processing may be realized by another flowchart as long as a result equivalent to the processing of each flowchart can be obtained.
また、上述したオーディオデータ変換処理、オーディオデータ再生処理としても本発明は実現可能である。さらに、上記処理を実現するためのプログラム、該プログラムが記録された記録媒体としても本発明は実現可能である。 The present invention can also be realized as the above-described audio data conversion process and audio data reproduction process. Furthermore, the present invention can be realized as a program for realizing the above processing and a recording medium on which the program is recorded.
100 カラオケ装置
102 コマンダ
123 CPU
125 RAM
130 映像音声再生手段
131 デコーダ
132 デコーダ
133 可変クロックジェネレータ
134 DAコンバータ
135 DAコンバータ
136 ピッチシフタ
137 スピーカ
200 サーバ
201 サーバコントローラ(CPU)
202 RAM
203 MIDI音源
204 データベース
205 ADコンバータ
207 エンコーダ
100
125 RAM
130 Video / Audio Playback Means 131 Decoder 132 Decoder 133 Variable Clock Generator 134
202 RAM
203
Claims (4)
MIDIデータを取得する取得手段と、
取得したMIDIデータから打楽器音以外のトラックデータを通常音のトラックデータとして抽出する通常音抽出手段と、
抽出した通常音のトラックデータに基いて、通常音波形データを生成する通常音生成手段と、
前記取得したMIDIデータから打楽器音のトラックデータを抽出する打楽器音抽出手段と、
再生速度を設定する再生速度設定手段と、
抽出した打楽器音のトラックデータに基いて、前記設定した再生速度に応じた再生クロック数で再生した場合の打楽器音波形データを生成する打楽器音生成手段と、
前記打楽器音波形データに対しデータ圧縮を行う打楽器音波形データ圧縮手段と、を備え、
前記再生速度設定手段は、複数の再生速度を設定し、
前記打楽器音生成手段は、前記複数の再生速度に応じた複数の打楽器音波形データを、前記再生速度毎に生成し、
前記打楽器音波形データ圧縮手段は、
前記複数の打楽器音波形データそれぞれに対し、打楽器音波形データ圧縮処理を行い、
前記打楽器音波形データ圧縮処理は、
所定単位で分割された前記打楽器音のトラックデータに対し、互いに類似するものをグループ化し、
前記グループごとに代表波形データを生成し、
前記代表波形データごとに識別符号を付与し、
前記打楽器音のトラックデータを、前記識別符号を用いて識別符号列として表現し、
前記代表波形データ、前記識別符号列、前記設定された再生速度を、前記打楽器音のトラックデータの打楽器音圧縮データとして生成し、
さらに、
前記通常音波形データ及び前記打楽器音圧縮データを取得するデータ取得手段と、
再生速度を設定する再生速度設定手段と、
前記通常音のデータを、前記設定した再生速度に応じた再生クロック数で出力する通常音再生手段と、
前記通常音再生手段からの出力信号を、前記設定した再生速度に応じたシフト量でピッチシフトを行うピッチシフト手段と、
前記設定した再生速度に応じて、複数の打楽器音データのうち1つの打楽器音データを選択する手段と、
前記選択した打楽器音のデータを前記再生クロック数で出力する打楽器音再生手段と、
前記ピッチシフト手段からの出力信号及び前記打楽器音再生手段からの出力信号をミックスして音声信号を再生する音声信号出力手段と、
を有する、
オーディオデータ変換再生システム。 In an audio data conversion / reproduction system that converts to another data based on MIDI data and reproduces an audio signal based on the converted other data,
An acquisition means for acquiring MIDI data;
Normal sound extraction means for extracting track data other than percussion instrument sound from the acquired MIDI data as track data of normal sound;
Normal sound generating means for generating normal sound waveform data based on the extracted normal sound track data;
Percussion instrument sound extraction means for extracting percussion instrument sound track data from the acquired MIDI data;
Playback speed setting means for setting the playback speed;
Percussion instrument sound generation means for generating percussion instrument sound waveform data when reproduced with the number of reproduction clocks corresponding to the set reproduction speed based on the track data of the extracted percussion instrument sound,
Percussion instrument sound waveform data compression means for performing data compression on the percussion instrument sound waveform data ,
The playback speed setting means sets a plurality of playback speeds ,
The percussion instrument sound generating means generates a plurality of percussion instrument sound waveform data corresponding to the plurality of reproduction speeds for each reproduction speed ,
The percussion instrument sound waveform data compression means includes:
Percussion instrument sound waveform data compression processing is performed for each of the plurality of percussion instrument sound waveform data,
The percussion instrument sound waveform data compression process is:
The track data of the percussion instrument sound divided in a predetermined unit is grouped with similar ones,
Generate representative waveform data for each group,
An identification code is assigned to each representative waveform data,
The track data of the percussion instrument sound is expressed as an identification code string using the identification code,
The representative waveform data, the identification code string, and the set reproduction speed are generated as percussion instrument sound compression data of the track data of the percussion instrument sound,
further,
Data acquisition means for acquiring the normal sound waveform data and the percussion instrument sound compression data;
Playback speed setting means for setting the playback speed;
Normal sound reproduction means for outputting the normal sound data at a reproduction clock number corresponding to the set reproduction speed;
Pitch shift means for shifting the output signal from the normal sound reproduction means by a shift amount corresponding to the set reproduction speed;
Means for selecting one percussion instrument sound data among a plurality of percussion instrument sound data according to the set reproduction speed;
Percussion instrument sound reproduction means for outputting the selected percussion instrument sound data at the number of reproduction clocks;
An audio signal output means for reproducing an audio signal by mixing an output signal from the pitch shift means and an output signal from the percussion instrument sound reproduction means;
Having
Audio data conversion playback system.
MIDIデータを取得する取得手段と、
取得したMIDIデータから打楽器音以外のトラックデータを通常音のトラックデータとして抽出する通常音抽出手段と、
抽出した通常音のトラックデータに基いて、通常音波形データを生成し記憶する通常音記憶手段と、
前記取得したMIDIデータから打楽器音のトラックデータを抽出する打楽器音抽出手段と、
再生速度を設定する再生速度設定手段と、
抽出した打楽器音のトラックデータに基いて、前記設定した再生速度に応じた再生クロック数で再生した場合の打楽器音波形データを生成する打楽器音生成手段と、
前記打楽器音波形データに対しデータ圧縮を行う打楽器音波形データ圧縮手段と、を備え、
前記再生速度設定手段は、複数の再生速度を設定し、
前記打楽器音生成手段は、前記複数の再生速度に応じた複数の打楽器音波形データを、前記再生速度毎に生成し、
前記打楽器音波形データ圧縮手段は、
前記複数の打楽器音波形データそれぞれに対し、打楽器音波形データ圧縮処理を行い、
前記打楽器音波形データ圧縮処理は、
所定単位で分割された前記打楽器音のトラックデータに対し、互いに類似するものをグループ化し、
前記グループごとに代表波形データを生成し、
前記代表波形データごとに識別符号を付与し、
前記打楽器音のトラックデータを、前記識別符号を用いて識別符号列として表現し、
前記代表波形データ、前記識別符号列、前記設定された再生速度を、前記打楽器音のトラックデータの打楽器音圧縮データとして記憶する、
ことを特徴とするオーディオデータ変換装置。 In an audio data conversion device for converting to another data based on MIDI data,
An acquisition means for acquiring MIDI data;
Normal sound extraction means for extracting track data other than percussion instrument sound from the acquired MIDI data as track data of normal sound;
Normal sound storage means for generating and storing normal sound waveform data based on the extracted track data of normal sound;
Percussion instrument sound extraction means for extracting percussion instrument sound track data from the acquired MIDI data;
Playback speed setting means for setting the playback speed;
Percussion instrument sound generation means for generating percussion instrument sound waveform data when reproduced with the number of reproduction clocks corresponding to the set reproduction speed based on the track data of the extracted percussion instrument sound,
Percussion instrument sound waveform data compression means for performing data compression on the percussion instrument sound waveform data ,
The playback speed setting means sets a plurality of playback speeds ,
The percussion instrument sound generating means generates a plurality of percussion instrument sound waveform data corresponding to the plurality of reproduction speeds for each reproduction speed ,
The percussion instrument sound waveform data compression means includes:
Percussion instrument sound waveform data compression processing is performed for each of the plurality of percussion instrument sound waveform data,
The percussion instrument sound waveform data compression process is:
The track data of the percussion instrument sound divided in a predetermined unit is grouped with similar ones,
Generate representative waveform data for each group,
An identification code is assigned to each representative waveform data,
The track data of the percussion instrument sound is expressed as an identification code string using the identification code,
Storing the representative waveform data, the identification code string, and the set reproduction speed as percussion instrument sound compression data of the percussion instrument sound track data;
An audio data converter characterized by the above.
ことを特徴とする請求項2のオーディオデータ変換装置。 The predetermined unit is a measure unit.
The audio data conversion apparatus according to claim 2, wherein:
前記通常音のデータ及び前記複数の打楽器音のデータを取得するデータ取得手段と、
再生速度を設定する再生速度設定手段と、
前記通常音のデータを、前記設定した再生速度に応じた再生クロック数で出力する通常音再生手段と、
前記通常音再生手段からの出力信号を、前記設定した再生速度に応じたシフト量でピッチシフトを行うピッチシフト手段と、
前記設定した再生速度に応じて、複数の打楽器音データのうち1つの打楽器音データを選択する手段と、
前記選択した打楽器音のデータを前記再生クロック数で出力する打楽器音再生手段と、
前記ピッチシフト手段からの出力信号及び前記打楽器音再生手段からの出力信号をミックスして音声信号を再生する音声信号出力手段と、
を有する、
ことを特徴とするオーディオデータ再生装置。 In an audio data reproducing apparatus for reproducing an audio signal based on normal sound data and a plurality of percussion instrument sound data,
Data acquisition means for acquiring the data of the normal sound and the data of the plurality of percussion instrument sounds;
Playback speed setting means for setting the playback speed;
Normal sound reproduction means for outputting the normal sound data at a reproduction clock number corresponding to the set reproduction speed;
Pitch shift means for shifting the output signal from the normal sound reproduction means by a shift amount corresponding to the set reproduction speed;
Means for selecting one percussion instrument sound data among a plurality of percussion instrument sound data according to the set reproduction speed;
Percussion instrument sound reproduction means for outputting the selected percussion instrument sound data at the number of reproduction clocks;
An audio signal output means for reproducing an audio signal by mixing an output signal from the pitch shift means and an output signal from the percussion instrument sound reproduction means;
Having
An audio data reproducing apparatus characterized by the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008049197A JP4968109B2 (en) | 2008-02-29 | 2008-02-29 | Audio data conversion / reproduction system, audio data conversion device, audio data reproduction device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008049197A JP4968109B2 (en) | 2008-02-29 | 2008-02-29 | Audio data conversion / reproduction system, audio data conversion device, audio data reproduction device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009205039A JP2009205039A (en) | 2009-09-10 |
JP4968109B2 true JP4968109B2 (en) | 2012-07-04 |
Family
ID=41147347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008049197A Active JP4968109B2 (en) | 2008-02-29 | 2008-02-29 | Audio data conversion / reproduction system, audio data conversion device, audio data reproduction device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4968109B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4831706B2 (en) | 2009-09-04 | 2011-12-07 | 住友ゴム工業株式会社 | Polymer laminate and pneumatic tire using the same for inner liner |
JP2011215228A (en) * | 2010-03-31 | 2011-10-27 | Yamaha Corp | Pitch changing device |
JP6369056B2 (en) * | 2014-03-04 | 2018-08-08 | 沖電気工業株式会社 | Media data reproduction control system, media data distribution apparatus, and media data distribution program |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01176898U (en) * | 1988-06-01 | 1989-12-18 | ||
JP2970396B2 (en) * | 1994-04-22 | 1999-11-02 | ヤマハ株式会社 | Waveform processing device |
JPH10161684A (en) * | 1996-12-05 | 1998-06-19 | Xing:Kk | Musical sound generator |
JP4012636B2 (en) * | 1998-08-25 | 2007-11-21 | ローランド株式会社 | Waveform compression / decompression device |
JP2002132275A (en) * | 2000-10-24 | 2002-05-09 | Matsushita Electric Ind Co Ltd | Karaoke sing-along machine and electronic musical instrument |
JP2002169547A (en) * | 2000-11-30 | 2002-06-14 | Casio Comput Co Ltd | Automatic music player and automatic music playing method |
JP2003114689A (en) * | 2001-10-04 | 2003-04-18 | Victor Co Of Japan Ltd | Music data processor |
JP4556896B2 (en) * | 2006-03-28 | 2010-10-06 | ヤマハ株式会社 | Electronic musical instruments |
-
2008
- 2008-02-29 JP JP2008049197A patent/JP4968109B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009205039A (en) | 2009-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2000181449A (en) | Information processor, information processing method and provision medium | |
WO2014003072A1 (en) | Automated performance technology using audio waveform data | |
JP4274152B2 (en) | Music synthesizer | |
JP2002055678A (en) | Compression method for midi film | |
WO1999040566A1 (en) | Method and apparatus for digital signal processing, method and apparatus for generating control data, and medium for recording program | |
JP4968109B2 (en) | Audio data conversion / reproduction system, audio data conversion device, audio data reproduction device | |
JP2008286946A (en) | Data reproduction device, data reproduction method, and program | |
JP4561636B2 (en) | Musical sound synthesizer and program | |
JP4802857B2 (en) | Musical sound synthesizer and program | |
JP2003255935A (en) | Reproduction switching device and program | |
JP5969421B2 (en) | Musical instrument sound output device and musical instrument sound output program | |
JP6657866B2 (en) | Sound effect imparting device and sound effect imparting program | |
JP2015225302A (en) | Karaoke device | |
JP5614554B2 (en) | Music playback system, music playback device, and program for music playback | |
WO2021117577A1 (en) | Signal processing device, signal processing method, program, signal processing system, and coding device | |
JP5800155B2 (en) | Karaoke equipment | |
JP2008197501A (en) | Electronic instrument and performance data utilization program | |
JP4238807B2 (en) | Sound source waveform data determination device | |
JP2008244888A (en) | Communication device, communication method, and program | |
JP3892433B2 (en) | Karaoke device, karaoke method, and program | |
JP2007093658A (en) | Audio device and karaoke machine | |
JP3754286B2 (en) | Data recording method and data recording apparatus | |
JP4259422B2 (en) | Performance control device and program | |
JP5663842B2 (en) | Sound effect system | |
JP5704201B2 (en) | Karaoke device and karaoke music processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100118 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111220 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120306 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120319 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150413 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4968109 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |