JP2871204B2 - Music transcription device - Google Patents

Music transcription device

Info

Publication number
JP2871204B2
JP2871204B2 JP3208367A JP20836791A JP2871204B2 JP 2871204 B2 JP2871204 B2 JP 2871204B2 JP 3208367 A JP3208367 A JP 3208367A JP 20836791 A JP20836791 A JP 20836791A JP 2871204 B2 JP2871204 B2 JP 2871204B2
Authority
JP
Japan
Prior art keywords
pitch
unit
output
neural network
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3208367A
Other languages
Japanese (ja)
Other versions
JPH0546164A (en
Inventor
直樹 柴多
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP3208367A priority Critical patent/JP2871204B2/en
Publication of JPH0546164A publication Critical patent/JPH0546164A/en
Application granted granted Critical
Publication of JP2871204B2 publication Critical patent/JP2871204B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Auxiliary Devices For Music (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は楽譜採譜装置に関し、特
にピッチが変動する楽器もしくは歌唱を対象に採譜する
楽音採譜装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a musical notation apparatus, and more particularly to a musical notation apparatus for recording musical instruments or singing whose pitch varies.

【0002】[0002]

【従来の技術】従来は、例えばCQ出版社刊行インター
フェース誌1991年2月号pp211−229(以下
文献1と言う)においては自己相関係数を用いて求めた
楽音や歌唱のピッチを絶対ピッチ上でのピッチカテゴリ
の範囲と単純比較して音程を決定していた。また、入力
音のパワーは、音のセグメンテーションのみに用いら
れ、ピッチ計算には使用されていなかった。
2. Description of the Related Art Conventionally, for example, in an interface magazine published by CQ Publishing Co., Ltd., February 1991, pp 211-229 (hereinafter referred to as reference 1), pitches of musical tones and singing obtained using an autocorrelation coefficient are expressed in absolute pitches. The pitch was determined simply by comparing it with the range of the pitch category. Also, the power of the input sound was used only for sound segmentation, not for pitch calculation.

【0003】[0003]

【発明が解決しようとする課題】しかし、上記の方法で
採譜した場合には、ピッチカテゴリの範囲が固定であっ
たため、ビブラートなどの様にピッチが極端に変動する
場合には細かな音程に分解されてしまうことがあった。
However, when the music is transcribed by the above-described method, the range of the pitch category is fixed, so that when the pitch fluctuates extremely like vibrato or the like, the pitch is decomposed into fine pitches. Was sometimes done.

【0004】本発明の目的は、安定に音程を決定して採
譜を行うことのできる楽音採譜装置を提供することにあ
る。
[0004] It is an object of the present invention to provide a musical sound transcription apparatus capable of stably determining a musical interval and performing transcription.

【0005】[0005]

【課題を解決するための手段】第1の発明は、楽器演奏
または歌唱から楽譜を作成する自動採譜装置において、
楽器演奏または歌唱のパワースペクトルを複数チャンネ
ル数求めることが可能なバンドパスフィルタバンク部
と、前記バンドパスフィルタバンク部から得られる各チ
ャンネル毎の出力を入力とする競合想起ニューラルネッ
トワーク部と、前記競合想起ニューラルネットワーク部
の出力を読み出す音程バッファ部と、前記音程バッファ
部の出力する音程データを記憶する音程記憶部と、前記
音程バッファ部が前記競合想起ニューラルネットワーク
部の出力を読み出すタイミングを生成する読み出しタイ
ミング生成部と、を有することを特徴とする。
According to a first aspect of the present invention, there is provided an automatic music transcription apparatus for producing a musical score from musical instrument performance or singing.
A bandpass filter bank unit capable of obtaining a power spectrum of musical instrument performance or singing in a plurality of channels, a competition recall neural network unit which receives an output for each channel obtained from the bandpass filter bank unit, A pitch buffer for reading the output of the recall neural network, a pitch storage for storing the pitch data output from the pitch buffer, and a read for generating a timing at which the pitch buffer reads the output of the competitive recall neural network And a timing generation unit.

【0006】第2の発明は、楽器演奏または歌唱から楽
譜を作成する自動採譜装置において、楽器演奏または歌
唱のパワースペクトルを複数チャンネル数求めることが
可能なバンドパスフィルタバンク部と、前記バンドパス
フィルタバンク部から得られる各チャンネル毎の出力を
入力とする競合想起ニューラルネットワーク部と、前記
競合想起ニューラルネットワーク部の出力を入力とする
フィードフォワードニューラルネットワーク部と、前記
フィードフォワードニューラルネットワーク部の出力を
読み出し音程バッファ部と、前記音程バッファ部の出力
する音程データを記憶する音程記憶部と、前記音程バッ
ファ部が前記フィードフォワードニューラルネットワー
ク部の出力を読み出すタイミングを生成する読み出しタ
イミング生成部と、を有することを特徴とする。
According to a second aspect of the present invention, there is provided an automatic transcription apparatus for creating a musical score from a musical instrument performance or singing, a band-pass filter bank unit capable of obtaining the power spectrum of the musical instrument performance or singing on a plurality of channels, and the band-pass filter. A competitive recall neural network unit that receives an output of each channel obtained from the bank unit as an input, a feedforward neural network unit that receives an output of the competitive recall neural network unit, and an output of the feedforward neural network unit. A pitch buffer unit, a pitch storage unit that stores pitch data output from the pitch buffer unit, and a read timing generation unit that generates a timing at which the pitch buffer unit reads the output of the feedforward neural network unit. Characterized in that it has a.

【0007】[0007]

【作用】本発明の基本的な原理の第一は、細かに変動す
るピッチを持つ楽音もしくは歌唱音の採譜時に、リカレ
ントニューラルネットワークの入出力特性のうちのヒス
テリシス性を用いることでピッチを安定に採譜すること
である。また基本的な原理の第二は、フィードフォワー
ド型ニューラルネットワークのもつ連想記憶の特性を用
いて採譜されたピッチに音名を与えることである。
The first principle of the present invention is to stabilize the pitch by using the hysteresis property of the input / output characteristics of the recurrent neural network when transcribing musical tones or singing sounds having finely varying pitches. Transcription. The second of the basic principles is to give pitch names to transcribed pitches using the characteristics of associative memory of a feedforward neural network.

【0008】従来は、例えば文献1では高速フーリエ変
換(FFT)や自己相関係数から求められた楽音の基本
周波数と音名にあたる周波数の間の距離を計り、その最
短距離を与える音名として音程をとっていた。また、音
程を求めるセグメントは音量についてのしきい値処理に
より決定されていた。
Conventionally, for example, in Reference 1, a distance between a fundamental frequency of a musical tone obtained from a fast Fourier transform (FFT) or an autocorrelation coefficient and a frequency corresponding to a pitch name is measured, and a pitch is given as a pitch name giving the shortest distance. Was taking. Also, the segment for which the pitch is to be determined has been determined by threshold processing for the volume.

【0009】しかしこれらの方法のみでは、実際の演奏
もしくは歌唱においては音量をとぎらせないで音程を変
える場合に対処できないことがあり得た。そのため音程
の時間変化を調べ、変化が激しくなった時点で異なる音
符に対応させる様になっていた。音程の時間変化をもと
に音程をつけるセグメントを決定することは、ビブラー
トの様な演奏法もしくは歌唱法によって得られた採譜対
象を処理する際にセグメントが細かくなり過ぎてしまう
という副作用をもっていた。
[0009] However, these methods alone may not be able to cope with a case where the pitch is changed without stopping the volume in an actual performance or singing. For this reason, the time change of the pitch is examined, and when the change becomes severe, it is made to correspond to a different note. Determining the segment to be pitched based on the time change of the pitch has the side effect that the segment becomes too fine when processing a transcription target obtained by a vibrato-like playing method or a singing method.

【0010】本発明では、過去の入力により発火する領
域が制限されるリカレントニューラルネットワークモデ
ルを用い、ピッチ変動のうちで幅が小さくかつ比較的短
周期であるものを吸収しようとするものである。また、
変動が吸収されたピッチのカテゴリをフィードフォワー
ド型のニューラルネットワークモデルを用いて音名を与
えるものである。
In the present invention, a recurrent neural network model in which a region to be ignited by a past input is restricted is used to absorb pitch fluctuations having a small width and a relatively short period among pitch fluctuations. Also,
The pitch category in which the fluctuation has been absorbed is given a pitch name using a feedforward neural network model.

【0011】リカレントニューラルネットワークのモデ
ルとしては以下に説明するモデルを用いる。
A model described below is used as a model of the recurrent neural network.

【0012】1種類の神経細胞からなる1次元の層
1 ,u2 を考える。ここで、この平面上での位置を指
定するため座標xを導入する。また、u(x,t)を、
層上の位置xでのノードの内部状態とする。この時、u
を場所xの周囲のノードの平均値をとるとし、個々のノ
ードの細かな変動を無視する。さらに場は、xに関して
等方性の場で、近い距離のノード同士は興奮性結合、離
れた距離にあるノード同士は抑制性結合しており、その
結合荷重は場において一様であるとする。また、ノード
の出力関数f(u)は次式で与えられるとする。
Consider one-dimensional layers u 1 and u 2 composed of one kind of nerve cells. Here, coordinates x are introduced to specify a position on this plane. Also, u (x, t) is
The state is the internal state of the node at the position x on the layer. At this time, u
Is taken as the average value of the nodes around the location x, and fine fluctuations of individual nodes are ignored. Further, the field is an isotropic field with respect to x. Nodes at close distances have excitatory coupling, nodes at distant distances have inhibitory coupling, and the coupling weight is assumed to be uniform in the field. . The output function f (u) of the node is given by the following equation.

【0013】[0013]

【数1】 (Equation 1)

【0014】さらに、u2 からu1 への結合は極めて幅
が狭く、u2 は自己結合を持たないとすると、u1 ,u
2 の状態を表す方程式は次のように書ける。
Further, if the bond from u 2 to u 1 is extremely narrow and u 2 has no self-bond, u 1 , u 1
The equation for state 2 can be written as

【0015】[0015]

【数2】 (Equation 2)

【0016】[0016]

【数3】 (Equation 3)

【0017】ただし、si ,hi はそれぞれ、ui への
外部からの一様刺激レベル、ui のしきい値である。ま
た、wijはuj からui への結合荷重を表す。τi はu
1 の状態変化の時定数である。
[0017] However, s i, respectively, h i, uniform level of stimulation from the outside to the u i, is the threshold of u i. W ij represents a connection weight from u j to u i . τ i is u
It is the time constant of the state change of 1 .

【0018】この設定のもとで、場には以下の3種類の
内部状態が現れ得る。 ・発火状態にあるノードが存在しない。 ・場全体が一様に発火状態にある。 ・発火状態にある有限の大きさの局在興奮領域が存在す
る。
Under this setting, the following three internal states can appear in the field. -There is no firing node.・ The entire site is uniformly ignited. -There is a finite-sized localized excitable region in the firing state.

【0019】これらの現れ方はs(外部からの一様刺激
レベル),h(閾値),w(x′−x)(結合荷重の
形)の間の大小関係によって変化する。発火状態にある
ノードが存在しない場合と、全体が発火状態にある場合
を除いて考える。
These appearances vary depending on the magnitude relationship between s (uniform stimulus level from the outside), h (threshold), and w (x'-x) (the form of connection weight). Except when there is no node in the firing state and when the entire node is in the firing state.

【0020】局在興奮領域が存在する場合の、場の性質
についてまとめると以下の様な性質がある。 ・弱い非一様定常入力s(x)が与えられた時、局在興
奮領域はs(x)が増加する方向へ移動し、極大値の位
置に停止する。 ・2つの局在興奮は、w11(x′−x)に依存して定ま
る距離xd を境界として反発し合うか、または引き合
う。つまり、距離がxd以下なら引き合い、xd 以上な
ら反発しあう。 ・複数の局在興奮を許す場では、ある個数の局在興奮が
相互作用によって安定に存在し得る。
The properties of the field in the case where the localized excitement area exists are summarized as follows. When a weak non-uniform steady input s (x) is given, the localized excitation region moves in the direction in which s (x) increases, and stops at the position of the maximum value. The two local excitements repel or attract each other at a distance x d determined depending on w 11 (x′−x). In other words, the distance inquiries If x d or less, repel If more than x d. In a place where a plurality of localized excitables are allowed, a certain number of localized excitables can be stably present by interaction.

【0021】以上の様な神経場の説明は、「神経回路網
の数理」(産業図書刊,甘利俊一著,以下文献2)が詳
しい。また、この神経場は位置に関して連続な場として
述べられているが、計算機などでシミュレーションする
際には場を離散的に表現する際のメッシュを細かくとる
ことにより良い精度で近似できる。
The description of the neural field as described above is described in detail in "Mathematics of Neural Network" (published by Sangyo Tosho, Shunichi Amari, hereinafter referred to as Reference 2). Although this nerve field is described as a continuous field with respect to position, it can be approximated with good accuracy by taking a fine mesh when expressing the field discretely when simulating with a computer or the like.

【0022】さて、今まで述べたようなu1 ,u2 の組
合せを用いてピッチをカテゴライズする方法について述
べる。今u1 ,u2 の様に興奮性及び抑制性の結合をし
た2層で、時定数τ1 ,τ2 が等しいものを、以降便宜
的にUと表すことにする。
Now, a method of categorizing pitches by using a combination of u 1 and u 2 as described above will be described. Here, two layers having excitatory and inhibitory couplings like u 1 and u 2 and having the same time constants τ 1 and τ 2 are hereinafter referred to as U for convenience.

【0023】時定数が異なる二つのUのうち時定数が長
いものをU1 ,短いものをU2 とする。Uへの入力及び
出力はどちらもu1 を対象とするものとする。U1 とU
2 の間はランダムな荷重で双方向性結合を行う。離散的
に表現された系では、メッシュの各グリッド間で全数結
合を行うことに相当する。
Of the two Us having different time constants, U 1 having a long time constant is referred to as U 1 and U 2 having a short time constant is referred to as U 2 . It is assumed that both input and output to U are directed to u 1 . U 1 and U
Between two , bidirectional coupling is performed with a random load. In a system represented discretely, this is equivalent to performing all-number connection between the grids of the mesh.

【0024】ここで、バンドパスフィルタ(BPF)バ
ンクの出力をU2 に入力する。各BPFの中心周波数の
間隔は楽譜における半音(短2度)よりも狭い等周波数
比とし、U2 には等間隔ずつ離して入力する。一般に楽
器音などは基本周波数成分以外に高調波成分を含んでい
る。ここでは基本周波数f及び2,3,4倍の各整数倍
倍音、すなわち2f,3f,4fが含まれた楽音がBP
Fバンクに入力されたとする。U2 への入力の大きさに
よりU2 上のf,2f,3f,4fに対応する領域が発
火し、またU1 −U2 間の接続の状態により、U1 上の
幾つかの領域が発火する場合がある。ある結合の両端が
発火した場合にその結合荷重を大きくし、U2 側のみ発
火した場合にその結合荷重を小さくする。この様なニュ
ーラルネットワークの学習方法については「パラレル・
ディストリビュ−テッド・プロセッシング第1巻pp1
51−193(Parallel Distribut
ed Processing, vol1, the
MITPress)」に詳しい。BPFバンクの全周波
数領域に渡り、荷重の変更を行うことで結局はU2 上に
与えられた4つの倍音に相当するU1 上の領域が活性化
されるニューラルネットワークモデルを構築できる。
Here, the output of the band pass filter (BPF) bank is input to U 2 . Distance of the center frequency of each BPF is narrower such as frequency ratio than a semitone (minor second) in the musical score, and inputs apart by equal intervals in the U 2. In general, instrument sounds and the like contain harmonic components in addition to the fundamental frequency components. Here, the fundamental frequency f and the respective overtones of 2, 3, and 4 times, that is, the musical tones containing 2f, 3f, and 4f are BP.
It is assumed that the input is made to the F bank. Input of the size on U 2 of f to U 2, 2f, 3f, corresponding area ignited 4f, and by the state of the connection between the U 1 -U 2, several areas on U 1 May catch fire. The binding load is increased when the two ends of a coupling has fired, to reduce the connection weights if ignited only U 2 side. For the learning method of such a neural network, see "Parallel
Distributed Processing Volume 1 pp1
51-193 (Parallel Distribut)
ed Processing, vol1, the
MIT Press) ”. Over the entire frequency range of the BPF bank, eventually by making changes in the load can build a neural network model space on U 1 corresponding to the four harmonic given above U 2 is activated.

【0025】学習が済んだネットワークの実際に音が入
って来た場合には時定数に応じて、U1 ,U2 上の領域
の内部状態、すなわちU1 とU2 それぞれのu1 が変化
してu1 >0となる領域が発火する。U1 上で発火して
いる部分は双方向性の結合を通じてU2 上の対応する領
域を活性化する。活性化された領域は入力が十分に大き
ければ発火することもあり得る。また、U2 上の発火領
域はU1 上の領域を活性化するが、U1 上の領域への入
力が十分に強くなければ領域は発火せず、内部状態が高
まるのみに留まる。しかし、U1 とU2 の時係数の差に
よりU1 の内部状態は刺激がなくなった後もしばらくは
保持される。
[0025] Depending on the time constant in the case came in is actually the sound of learning after completion network, U 1, the internal state of the area on the U 2, ie U 1 and U 2 each of u 1 changes Then, a region where u 1 > 0 is ignited. Moiety that is ignited on U 1 activates the corresponding area on the U 2 through binding bidirectional. The activated area can fire if the input is large enough. Also, ignition region on the U 2 is to activate an area on U 1, region if there is no sufficiently strong input to the region of the U 1 does not ignite, remains only increases the internal state. However, due to the difference between the time coefficients of U 1 and U 2 , the internal state of U 1 is maintained for a while after the stimulus disappears.

【0026】またf,2f,3f,4fという倍音を含
んだ入力により、U1 上ではfを基音とするピッチに対
応する領域が活性化するだけでなく、2f,3f,4f
といった倍音のそれぞれに対応する領域をも活性化す
る。また、それぞれの周波数を倍音としてもつ領域も活
性化する。その為、図3に示すようにu(x)は活性化
される。通常の楽曲で用いられている12音音階中のピ
ッチカテゴリの周波数比はおおよそ図5の様な関係にあ
る。つまり、一つの音とその倍音で活性化される領域
は、12音音階での相対音程に相当する領域となる。
[0026] f, 2f, 3f, the input including the harmonics of 4f, not only activation region corresponding to the pitch of the fundamental tone of f is on U 1, 2f, 3f, 4f
The area corresponding to each of the overtones is also activated. Also, a region having each frequency as a harmonic is activated. Therefore, u (x) is activated as shown in FIG. The frequency ratios of the pitch categories in the twelve-tone scale used in normal music generally have a relationship as shown in FIG. In other words, the region activated by one sound and its overtone is a region corresponding to the relative pitch in the 12-note scale.

【0027】活性化された領域は、周囲の領域と比較し
て発火しやすい状態にある為、該領域への入力が後続す
るU2 への入力により増加した場合に発火しやすい。U
2 への入力である楽音もしくは歌唱から得られたピッチ
が、特にパワーの立ち上がり時などに不安定であって
も、以前のU1 の活性化の状態分布のため、それ以前ま
での入力から定まる相対音程上の音高のカテゴリに相当
する領域の近傍が活性化され、発火し、U1 上では安定
にピッチカテゴリを決定できることになる。
Since the activated area is in a state where it is easy to fire compared to the surrounding area, it is easy to fire when the input to the area is increased by the input to the subsequent U 2 . U
Pitch obtained from tone or singing is the input to 2, even particularly unstable such as during the rise of the power, for state distribution of activation of the previous U 1, determined from the input to earlier the relative proximity of the pitch on a region corresponding to the pitch of the category is activated, ignited, will be able to determine the pitch categories stable on U 1.

【0028】U1 上を発火させたU2 への入力のピッチ
が微小に変動した場合には、U1 上の該発火領域及び該
領域を発火させているU2 上の領域との間の相互結合に
よるフィードバックのため、U1 上の発火領域の移動速
度は、U2 上での発火領域の移動速度ほど大きくならな
い。それ故U1 上では安定にピッチカテゴリを保持でき
る。
If the pitch of the input to U 2 that fired on U 1 fluctuates slightly, the distance between the firing area on U 1 and the area on U 2 firing the area is reduced. for feedback by mutual coupling, the moving speed of the firing region of the U 1 is not increased as the moving speed of the firing region of the on U 2. It on the late U 1 can be held stably pitch categories.

【0029】また、それまでに入力されてきた相対音程
の範疇に当てはまらないピッチが現れた場合には、まず
入力に相当する領域が活性化され、発火する。しかし、
この入力が消えた後、該発火領域はそれ以前に入力され
てきた相対音程に相当する活性化のピークに向って移動
する。この理由は前述の性質1による。そのため、結局
はこの相対音程の範疇に当てはまらなかったピッチ入力
は、発火領域の移動により以前までと同じ相対音程の範
疇としてU1 上でピッチカテゴリに分類される。
When a pitch that does not fall within the category of the relative pitch input so far appears, a region corresponding to the input is first activated and fires. But,
After this input has disappeared, the firing zone moves toward the activation peak corresponding to the relative pitch entered previously. This is because of the above-mentioned property 1. Therefore, eventually the pitch input was not the case in the category of the relative pitch is classified as a pitch categories on U 1 as category of the same relative pitch up earlier by the movement of the firing region.

【0030】結局、U1 に現れた発火領域の位置は、U
2 へ入力された楽音の倍音を含んだピッチクラスを与え
ることになる。絶対音程に従っている、すなわち調律さ
れた楽器などによる楽音の場合、例えばあるオクターブ
の中のA音が440Hzとなるように調律されているた
め、U1 上に現れた音程を求めるためには、あらかじめ
知られている音程を入力した時に現れた発火領域の位置
により音程を求めることができる。無伴奏で歌われた歌
唱など、相対音程のみが成り立つ場合には、譜面化にあ
たって調の主音を定める必要がある。
Eventually, the position of the ignition region appearing at U 1 is U
A pitch class including harmonics of the musical tone input to 2 is given. Absolute follow pitch, that is, the case of a tone due rhythm musical instrument, for example, A sound in a certain octave is tuned such that 440 Hz, in order to determine the pitch that appeared on U 1 in advance The pitch can be obtained from the position of the ignition region that appears when a known pitch is input. In the case where only relative pitches are satisfied, such as singing with unaccompaniment, it is necessary to determine the key tone of the key in musical notation.

【0031】本発明では、調の主音を定めるためにフィ
ードフォワードニューラルネットワークを用いる。
In the present invention, a feedforward neural network is used to determine the key of the key.

【0032】このネットワークを学習させる逆伝搬ネッ
トワーク学習法については「欧文誌パラレル・ディスト
リビューテッド・プロセッシング第3巻121−159
頁」(“Parallel Distributed
Processing”Vol.3, MIT Pre
ss,(1987)p121−159)が詳しい。
The back-propagation network learning method for learning this network is described in "European Magazine Parallel Distributed Processing, Vol. 3, 121-159."
Page ”(“ Parallel Distributed ”
Processing “Vol.3, MIT Pre
ss, (1987) p121-159).

【0033】モデルは一般に図4のように3種類の層か
ら階層的に構成され、それぞれ入力層、中間層、出力層
と呼ばれている。各層にはユニットと呼ばれる処理単位
が配置され、各ユニットは入力層に近い側の隣接層のユ
ニットから入力を受けて、出力層に近い側の隣接層へ出
力を出す。各ユニットの入力及び出力の関係は次のよう
に与えられる。
A model is generally hierarchically composed of three types of layers as shown in FIG. 4, and is called an input layer, a middle layer, and an output layer, respectively. A processing unit called a unit is arranged in each layer, and each unit receives an input from a unit in an adjacent layer closer to the input layer and outputs an output to an adjacent layer closer to the output layer. The relationship between the input and output of each unit is given as follows.

【0034】[0034]

【数4】 (Equation 4)

【0035】[0035]

【数5】 (Equation 5)

【0036】[0036]

【数6】 (Equation 6)

【0037】ここでx,y,θはそれぞれ、ユニットへ
の入力、ユニットからの出力、ユニットの持つ閾値を表
し、上付きの添え字は入力層からの階層を表す整数で、
下付きの添え字は層中のユニットを表す番号である。ま
Here, x, y, and θ represent the input to the unit, the output from the unit, and the threshold value of the unit, respectively, and the superscript suffix is an integer representing the hierarchy from the input layer.
Subscripts are numbers representing units in a layer. Also

【0038】[0038]

【数7】 (Equation 7)

【0039】は第(n−1)層のユニットiから一つ出
力層側の隣接層への結合を表す荷重、f(x)は以下の
数9の様なユニットの入出力の応答関数である。
Is a load representing the connection from the unit i of the (n-1) th layer to the adjacent layer on the one output layer side, and f (x) is the input / output response function of the unit as shown in the following equation 9. is there.

【0040】このモデルの入力層にデータが与えられる
とそのデータは下位の層、つまり入力層に近い層から隣
接する上位の層、つまり出力層に近い層へと順次伝播さ
れていく。その結果として得られる出力層の出力が与え
られた入力データに対する推論の結果となる。本発明で
は入力層にU1 上のu1 を呈示した時に、出力層に対応
する主音を表すノードを発火させるようなモデルを構成
する。
When data is given to the input layer of this model, the data is sequentially propagated from a lower layer, ie, a layer near the input layer, to an adjacent upper layer, ie, a layer near the output layer. The resulting output of the output layer is the result of the inference for the given input data. When presenting u 1 on U 1 in the input layer in the present invention, constitutes a model that ignite node representing the tonic corresponding to the output layer.

【0041】次にモデルが望ましい推論動作を行うよう
にユニット間の結合荷重wを定める逆伝播学習法につい
て説明する。学習に用いるデータは様々な楽曲から抽出
した同一拍子・同一調・同一区間長の旋律を表すシンボ
ルの時系列である。これらのデータを入力層に呈示し、
出力層には、入力層に呈示した旋律にハーモニックリズ
ムを考慮してつけた和音を表すシンボルの時系列を呈示
して逆伝播学習を繰り返し行う。逆伝播学習では入力さ
れたデータに対する望ましい推論結果を教師信号として
与えて、その時点でのネットワークモデルの出力(推論
結果)と教師信号との差を小さくするように繰り返しユ
ニット間の結合荷重を修正する。これは
Next, a description will be given of a back-propagation learning method for determining a connection weight w between units so that the model performs a desirable inference operation. The data used for learning is a time series of symbols representing melody with the same beat, same key, and same section length extracted from various music pieces. Present these data to the input layer,
The output layer presents a time series of symbols representing chords in consideration of the harmonic rhythm to the melody presented to the input layer, and repeatedly performs back propagation learning. In backpropagation learning, the desired inference result for the input data is given as a teacher signal, and the connection weight between the repetitive units is modified so as to reduce the difference between the network model output (inference result) and the teacher signal at that time. I do. this is

【0042】[0042]

【数8】 (Equation 8)

【0043】を出力層のi番目のユニットの出力、Ti
を対応する教師信号として、数9で表される誤差関数の
値を最小化するようなユニット間荷重を求めることと一
致する。
Is the output of the i-th unit of the output layer, T i
Is used as a corresponding teacher signal, and this is consistent with obtaining an inter-unit load that minimizes the value of the error function represented by Expression 9.

【0044】[0044]

【数9】 (Equation 9)

【0045】このようなモデルで数9に示すような誤差
関数の値を最小化するアルゴリズムは前記の文献「欧文
誌パラレル・ディストリビューテッド・プロセッシング
第3巻121−159頁」(“Parallel Di
stributed Processing”Vol.
3, MIT Press,(1987)p121−1
59)に詳しい。
The algorithm for minimizing the value of the error function as shown in Expression 9 in such a model is described in the above-mentioned document "European Magazine Parallel Distributed Processing, Vol. 3, pp. 121-159"("ParallelDi").
Structured Processing "Vol.
3, MIT Press, (1987) p121-1
59)

【0046】このネットワークの入力には採譜すべき楽
音の入力が終了した直後のU1 のu1 を与える。このu
1 は採譜した範囲でのピッチの出現に応じて、活性化さ
れた状態が残っている。ネットワークの出力層には、U
1 を実現している装置での一オクターブあたりの分解能
分のノードを用意する。学習に当っては、既知の楽曲を
絶対音程で演奏して得られたU1 のu1 を入力し、教師
信号としては主音に相当するノードを1、その他を0と
して与え、バックプロパゲーション学習を行う。
The input of this network is given as u 1 of U 1 immediately after the input of the musical sound to be transcribed. This u
1 remains activated according to the appearance of the pitch in the transcribed range. In the output layer of the network, U
Prepare nodes for the resolution per octave in the device that realizes 1 . Hitting the learning type the u 1 of U 1 obtained by playing known songs absolute pitch, giving the node corresponding to tonic as teacher signal 1, the other as a 0, a back propagation learning I do.

【0047】学習の済んだフィードフォワードニューラ
ルネットワークを用いて主音を求める際の手順について
説明する。U1 における1オクターブの分解能をNとす
ると12音音階での半音はN/12となる。採譜のため
の入力が終了した時点のU1 のu1 をフィードフォワー
ドネットワークの入力にプラスマイナスN/24の範囲
の位置のオフセットを与えて入力する。この操作により
N/12個のフィードフォワードネットワークの出力が
得られる。この出力をVi ,i=1,…,N/12であ
らわす。この場合のVの次元はNである。Vi の中の値
の内で最大値を与えるノードの位置をjとすると、主音
は、U1 の出力をiずらして読みとった場合のjとして
求めることができる。
A procedure for obtaining a tonic using a feedforward neural network that has been learned will be described. Assuming that the resolution of one octave at U 1 is N, the semitone at the 12-tone scale is N / 12. Input inputs giving the offset of the position of the range of ± N / 24 to the input of the feedforward network u 1 of U 1 at the time of completion for the transcription. By this operation, outputs of N / 12 feedforward networks are obtained. This output is represented by V i , i = 1,..., N / 12. The dimension of V in this case is N. When the position of the node which gives the maximum value among the values in V i and j, tonic can be obtained as j when read by shifting i the output of U 1.

【0048】jは音名に対応しているので、jから音程
に対応するUi 上の位置を求め、さらにiだけずらすこ
とにより、入力された楽音または歌唱の主音を求めるこ
とができる。主音の位置を求めることができれば、絶対
音程に基づかない歌唱などの場合は、主音に相当するU
1 上での位置からの相対的位置で階名が決定できる。こ
の場合、主音に相当する音名がないため、主音の周波数
と、主音に対する階名を求めるだけで、十分である。
Since j corresponds to a note name, a position on U i corresponding to a pitch is obtained from j, and by shifting the position by i, a main tone of an input musical tone or singing can be obtained. If the position of the tonic can be determined, in the case of singing that is not based on the absolute pitch, for example, U
The floor name can be determined by the relative position from the position above 1 . In this case, since there is no note name corresponding to the main tone, it is sufficient to find the frequency of the main tone and the floor name for the main tone.

【0049】[0049]

【実施例】図1は、第1の発明による採譜装置の一実施
例を示すブロック図である。この採譜装置は、音程記憶
部11と、音程バッファ部12と、競合想起ニューラル
ネットワーク部13と、バンドパスフィルタバンク部1
4と、読み出しタイミング生成部15とを有する。バン
ドパスフィルタバンク部14は、12音音階における半
音(短2度)音程より狭く、かつ等間隔の周波数を中心
周波数とするバンドパスフィルタの集まりである。外部
からのオーディオ信号は、このバンドパスフィルタバン
ク部で各周波数チャンネル毎にパワーエンベロープに変
換される。競合想起ニューラルネットワーク部13は、
バンドパスフィルタバンク部14から得られたパワーエ
ンベロープからピッチカテゴリを求める。音程バッファ
部12は、競合想起ニューラルネットワーク部13が出
力するピッチカテゴリを保持する。読み出しタイミング
生成部15は、採譜を行うために必要な、音程の採集間
隔を生成する。音程記憶部11は、読み出しタイミング
生成部15の出力するタイミングを基に音程バッファ部
12からピッチデータを取り込み、読み取り時刻と合わ
せて記録する。
FIG. 1 is a block diagram showing one embodiment of a music transcription device according to the first invention. This musical notation apparatus includes a pitch storage section 11, a pitch buffer section 12, a competitive recall neural network section 13, a band-pass filter bank section 1
4 and a read timing generation unit 15. The band-pass filter bank unit 14 is a group of band-pass filters that are narrower than the semitone (second minor) pitch in the twelve-tone scale and have center frequencies at equally spaced frequencies. An external audio signal is converted into a power envelope for each frequency channel by the band-pass filter bank unit. The competitive recall neural network unit 13
The pitch category is obtained from the power envelope obtained from the band-pass filter bank unit. The pitch buffer unit 12 holds the pitch category output from the competitive recall neural network unit 13. The readout timing generation unit 15 generates a pitch collection interval required for transcription. The pitch storage unit 11 fetches pitch data from the pitch buffer unit 12 based on the timing output from the read timing generation unit 15 and records the pitch data together with the read time.

【0050】以上の構成の採譜装置においては、読み出
しタイミング生成部15では採譜すべき音符長よりも十
分に短い時間長で音程の読み出しタイミングを生成す
る。譜面に直す場合には、読み取り時刻と全体の長さ、
曲の演奏テンポにより音符長を決定する必要がある。
In the transcription apparatus having the above-described configuration, the read timing generation section 15 generates the read timing of the interval with a time length sufficiently shorter than the note length to be transcribed. When converting to music, read time and overall length,
It is necessary to determine the note length according to the performance tempo of the music.

【0051】図2は、第2の発明による採譜装置の一実
施例を示すブロック図である。この採譜装置は、音程記
憶部21と、音程バッファ部22と、フィードフォワー
ドニューラルネットワーク部23と、競合想起ニューラ
ルネットワーク部24と、バンドパスフィルタバンク部
25と、読み出しタイミング生成部26とを有する。バ
ンドパスフィルタバンク部25は、12音音階における
半音(短2度)音程より狭く、かつ等間隔の周波数を中
心周波数とするバンドパスフィルタの集まりである。外
部からのオーディオ信号は、このバンドパスフィルタバ
ンク部で各周波数チャンネル毎にパワーエンベロープに
変換される。競合想起ニューラルネットワーク部24
は、バンドパスフィルタバンク部25から得られたパワ
ーエンベロープからピッチカテゴリを求める。フィード
フォワードニューラルネットワーク部23は、競合想起
ニューラルネットワーク部24が出力するピッチカテゴ
リを入力として、主音を探索し、競合想起ニューラルネ
ットワーク部24の出力を読み取る際の位置のオフセッ
トを求め、そのオフセットを出力する。音程バッファ部
22は、フィードフォワードニューラルネットワーク部
23が出力するオフセットを用いて競合想起ニューラル
ネットワーク部24の出力から、主音に対する相対音程
でピッチカテゴリを求め、それを保持する。読み出しタ
イミング生成部26は、採譜を行うために必要な、音程
の採集間隔を生成する。音程記憶部21は、読み出しタ
イミング生成部26の出力するタイミングを基に音程バ
ッファ部22からピッチデータを取り込み、読み取り時
刻と合わせて記録する。
FIG. 2 is a block diagram showing one embodiment of a music transcription device according to the second invention. This musical notation apparatus includes a pitch storage unit 21, a pitch buffer unit 22, a feedforward neural network unit 23, a competitive recall neural network unit 24, a bandpass filter bank unit 25, and a readout timing generation unit 26. The band-pass filter bank unit 25 is a group of band-pass filters that are narrower than the semitone (second minor) pitch in the twelve-tone scale and whose center frequencies are equally spaced frequencies. An external audio signal is converted into a power envelope for each frequency channel by the band-pass filter bank unit. Competitive Recall Neural Network Unit 24
Calculates the pitch category from the power envelope obtained from the bandpass filter bank unit 25. The feedforward neural network unit 23 receives the pitch category output from the competitive recall neural network unit 24 as an input, searches for a tonic, finds an offset of a position when reading the output of the competitive recall neural network unit 24, and outputs the offset. I do. The pitch buffer unit 22 uses the offset output from the feedforward neural network unit 23 to obtain a pitch category from the output of the competitive recall neural network unit 24 based on the relative pitch to the tonic, and retains it. The readout timing generation unit 26 generates a pitch collection interval required to perform transcription. The pitch storage unit 21 fetches pitch data from the pitch buffer unit 22 based on the timing output from the read timing generation unit 26, and records the pitch data together with the read time.

【0052】以上の構成の採譜装置においては、読み出
しタイミング生成部26では採譜すべき音符長よりも十
分に短い時間長で音程の読み出しタイミングを生成す
る。譜面に直す場合には、読み取り時刻と全体の長さ、
曲の演奏テンポにより音符長を決定する必要がある。
In the music transcription apparatus having the above-described structure, the read timing generation section 26 generates the read timing of the interval with a time length sufficiently shorter than the note length to be transcribed. When converting to music, read time and overall length,
It is necessary to determine the note length according to the performance tempo of the music.

【0053】競合想起ニューラルネットワーク部13及
び競合想起ニューラルネットワーク部24及びフィード
フォワードニューラルネットワーク部23、音程記憶部
11及び音程記憶部21の具体的な実施例として図6の
装置があげられる。
FIG. 6 shows a specific embodiment of the competitive recall neural network unit 13, the competitive recall neural network unit 24, the feedforward neural network unit 23, the pitch storage unit 11, and the pitch storage unit 21.

【0054】この装置は、マイクロプロセッサ51と、
ROM52と、RAM53と、出力用FIFO54と、
出力用磁気ディスク55と、割り込み信号線56を有し
ている。
This device comprises a microprocessor 51,
ROM 52, RAM 53, output FIFO 54,
It has an output magnetic disk 55 and an interrupt signal line 56.

【0055】ROM52には、数2及び数3に示す場の
状態遷移の計算を行うプログラム及び、出力用FIFO
54と出力磁気ディスク55へデータを書き出すための
制御プログラム及び、フィードフォワード計算を行うプ
ログラムが格納されている。
In the ROM 52, a program for calculating the state transition of the field represented by the equations (2) and (3) and an output FIFO
A control program for writing data to the output magnetic disk 54 and the output magnetic disk 55 and a program for performing feedforward calculation are stored.

【0056】出力磁気ディスク55は、音程記憶部11
及び音程記憶部21を実現する。また、出力用FIFO
54は音程バッファ部12及び音程バッファ部22を実
現する。
The output magnetic disk 55 is stored in the pitch storage unit 11.
And the pitch storage unit 21 are realized. Also, output FIFO
54 implements the pitch buffer unit 12 and the pitch buffer unit 22.

【0057】RAM53は競合想起ネットワーク部13
及び競合想起ネットワーク部24での場の状態、及びフ
ィードフォワードネットワーク部23でのノードの状態
を収めるために用いる。
The RAM 53 stores the competition recall network unit 13
And the state of the field in the competitive recall network unit 24 and the state of the node in the feedforward network unit 23.

【0058】動作時には、マイクロプロセッサ51はバ
ンドパスフィルタバンクの出力を基に数2及び数3に従
って場の状態遷移を計算する。割り込み信号線56は外
部からの読み取り信号をマイクロプロセッサ51に入力
する。割り込み信号を受けたマイクロプロセッサは場の
状態遷移をRAM53より読み取り、出力用FIFO部
54に出力する。
In operation, the microprocessor 51 calculates the state transition of the field according to equations 2 and 3 based on the output of the band-pass filter bank. The interrupt signal line 56 inputs a read signal from the outside to the microprocessor 51. The microprocessor that has received the interrupt signal reads the state transition of the field from the RAM 53 and outputs it to the output FIFO unit 54.

【0059】その後、一実施例においては、出力用FI
FO部54はU1 の発火領域の位置を求め、出力用磁気
ディスク55に出力する。
Thereafter, in one embodiment, the output FI
The FO unit 54 finds the position of the firing region of U 1 and outputs it to the output magnetic disk 55.

【0060】他の実施例においては、出力用FIFO部
54は、数式の計算を行い、さらにU1 読み取りのため
のオフセットを求め、以降はそのオフセットを用いて出
力磁気ディスクにオフセットを差し引いて計算した階名
を出力する。
In another embodiment, the output FIFO unit 54 calculates the formula, further obtains an offset for reading U 1 , and thereafter calculates the offset by subtracting the offset from the output magnetic disk using the offset. Output the floor name.

【0061】[0061]

【発明の効果】以上述べたように、本発明によれば、ピ
ッチが不安定な楽器や歌唱の採譜をする場合に、ビブラ
ートなどの効果を吸収し、さらに無伴奏時など絶対音程
が確保できない状況で行われた演奏や歌唱から安定に音
程を決定して採譜を行うことができる。
As described above, according to the present invention, when transcribing musical instruments or singing whose pitch is unstable, the effect of vibrato or the like is absorbed, and the absolute pitch cannot be secured, such as during unaccompaniment. It is possible to stably determine the pitch based on the performance or singing performed in the situation and perform the transcription.

【図面の簡単な説明】[Brief description of the drawings]

【図1】第1の発明の採譜装置のブロック図である。FIG. 1 is a block diagram of a music transcription device according to a first invention.

【図2】第2の発明の採譜装置の一実施例のブロック図
である。
FIG. 2 is a block diagram of one embodiment of a music transcription device of a second invention.

【図3】リカレントニューラルネットワークの場の活性
化の様子の一例を表す図である。
FIG. 3 is a diagram illustrating an example of a state of activation of a field of a recurrent neural network.

【図4】フィードフォワードニューラルネットワークの
一例を示す図である。
FIG. 4 is a diagram illustrating an example of a feedforward neural network.

【図5】12音音階の一つである平均律12音音階の音
程の周波数比を示す図である。
FIG. 5 is a diagram showing a frequency ratio of pitches of an equal-tempered 12-note scale, which is one of the 12-note scales.

【図6】第1,第2の発明中の競合想起ニューラルネッ
トワーク部13及び競合想起ニューラルネットワーク部
24及びフィードフォワードニューラルネットワーク部
23、音程記憶部11及び音程記憶部21の一実施例の
ブロック図である。
FIG. 6 is a block diagram of an embodiment of the competitive recall neural network unit 13, the competitive recall neural network unit 24, the feedforward neural network unit 23, the interval storage unit 11, and the interval storage unit 21 in the first and second inventions. It is.

【符号の説明】[Explanation of symbols]

11,21 音程記憶部 12,22 音程バッファ部 13,24 競合想起ニューラルネットワーク部 14,25 バンドパスフィルタバンク部 15,26 読み出しタイミング生成部 23 フィードフォワードニューラルネットワーク部 51 マイクロプロセッサ 52 ROM52 53 RAM 54 FIFO 55 出力用磁気ディスク 56 割り込み信号線 11, 21 interval storage unit 12, 22 interval buffer unit 13, 24 competitive recall neural network unit 14, 25 bandpass filter bank unit 15, 26 readout timing generation unit 23 feedforward neural network unit 51 microprocessor 52 ROM 52 53 RAM 54 FIFO 55 Magnetic disk for output 56 Interrupt signal line

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】楽器演奏または歌唱から楽譜を作成する自
動採譜装置において、 楽器演奏または歌唱のパワースペクトルを複数チャンネ
ル数求めることが可能なバンドパスフィルタバンク部
と、 前記バンドパスフィルタバンク部から得られる各チャン
ネル毎の出力を入力とする競合想起ニューラルネットワ
ーク部と、 前記競合想起ニューラルネットワーク部の出力を読み出
す音程バッファ部と、 前記音程バッファ部の出力する音程データを記憶する音
程記憶部と、 前記音程バッファ部が前記競合想起ニューラルネットワ
ーク部の出力を読み出すタイミングを生成する読み出し
タイミング生成部と、を有することを特徴とする楽音採
譜装置。
1. An automatic transcription apparatus for creating a musical score from a musical instrument performance or singing, comprising: a band-pass filter bank unit capable of obtaining a power spectrum of the musical instrument performance or singing from a plurality of channels; A competition recall neural network unit that receives an output of each channel as an input, a pitch buffer unit that reads an output of the competition recall neural network unit, a pitch storage unit that stores pitch data output from the pitch buffer unit, A musical sound notation apparatus, comprising: a read timing generation unit that generates a timing at which a pitch buffer unit reads the output of the competitive recall neural network unit.
【請求項2】楽器演奏または歌唱から楽譜を作成する自
動採譜装置において、 楽器演奏または歌唱のパワースペクトルを複数チャンネ
ル数求めることが可能なバンドパスフィルタバンク部
と、 前記バンドパスフィルタバンク部から得られる各チャン
ネル毎の出力を入力とする競合想起ニューラルネットワ
ーク部と、 前記競合想起ニューラルネットワーク部の出力を入力と
するフィードフォワードニューラルネットワーク部と、 前記フィードフォワードニューラルネットワーク部の出
力を読み出し音程バッファ部と、 前記音程バッファ部の出力する音程データを記憶する音
程記憶部と、 前記音程バッファ部が前記フィードフォワードニューラ
ルネットワーク部の出力を読み出すタイミングを生成す
る読み出しタイミング生成部と、を有することを特徴と
する楽音採譜装置。
2. An automatic transcription apparatus for creating a musical score from a musical instrument performance or singing, comprising: a band-pass filter bank unit capable of obtaining a power spectrum of the musical instrument performance or singing from a plurality of channels; A competitive recall neural network unit that receives an output of each channel as input, a feedforward neural network unit that receives an output of the competitive recall neural network unit, and a pitch buffer unit that reads an output of the feedforward neural network unit. A pitch storage unit that stores pitch data output from the pitch buffer unit; and a read timing generation unit that generates a timing at which the pitch buffer unit reads the output of the feedforward neural network unit. Tone music transcription apparatus according to claim and.
JP3208367A 1991-08-21 1991-08-21 Music transcription device Expired - Fee Related JP2871204B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3208367A JP2871204B2 (en) 1991-08-21 1991-08-21 Music transcription device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3208367A JP2871204B2 (en) 1991-08-21 1991-08-21 Music transcription device

Publications (2)

Publication Number Publication Date
JPH0546164A JPH0546164A (en) 1993-02-26
JP2871204B2 true JP2871204B2 (en) 1999-03-17

Family

ID=16555122

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3208367A Expired - Fee Related JP2871204B2 (en) 1991-08-21 1991-08-21 Music transcription device

Country Status (1)

Country Link
JP (1) JP2871204B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018194456A1 (en) 2017-04-20 2018-10-25 Universiteit Van Amsterdam Optical music recognition omr : converting sheet music to a digital format

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4625934B2 (en) * 2006-09-01 2011-02-02 独立行政法人産業技術総合研究所 Sound analyzer and program
CN101165779B (en) * 2006-10-20 2010-06-02 索尼株式会社 Information processing apparatus and method, program, and record medium
JP2020003536A (en) * 2018-06-25 2020-01-09 カシオ計算機株式会社 Learning device, automatic music transcription device, learning method, automatic music transcription method and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018194456A1 (en) 2017-04-20 2018-10-25 Universiteit Van Amsterdam Optical music recognition omr : converting sheet music to a digital format
NL2018758B1 (en) * 2017-04-20 2018-11-05 Univ Amsterdam Optical music recognition (OMR) assembly for converting sheet music

Also Published As

Publication number Publication date
JPH0546164A (en) 1993-02-26

Similar Documents

Publication Publication Date Title
Piszczalski et al. Predicting musical pitch from component frequency ratios
US9177540B2 (en) System and method for conforming an audio input to a musical key
US9251776B2 (en) System and method creating harmonizing tracks for an audio input
Woodhouse On the playability of violins. Part II: Minimum bow force and transients
Scheirer Using musical knowledge to extract expressive performance information from audio recordings
Puckette Score following using the sung voice
CN103959372A (en) System and method for providing audio for a requested note using a render cache
CN104040618A (en) System and method for producing a more harmonious musical accompaniment and for applying a chain of effects to a musical composition
Doush et al. Automatic music composition using genetic algorithm and artificial neural networks
Renault et al. Differentiable piano model for MIDI-to-audio performance synthesis
JP2871204B2 (en) Music transcription device
Aramaki et al. A percussive sound synthesizer based on physical and perceptual attributes
Baggi Neurswing: An intelligent workbench for the investigation of swing in jazz
Schumacher et al. Computer modelling of violin playing
Bader Computational Music Archiving as Physical Culture Theory
JPH06149242A (en) Automatic playing device
Su et al. A class of physical modeling recurrent networks for analysis/synthesis of plucked string instruments
Mathews et al. Computer study of violin tones
Liang et al. A new recurrent-network-based music synthesis method for chinese plucked-string instruments-pipa and qin
Sinjankhom et al. Deep Neural Networks for Sound Synthesis of Thai Duct F1ute, Khlui
Bryden Developing Metrics for Evolving a Musically Satisfying Result from a Population of Computer Generated Music Compositions
Cook Implementation of single reed instruments with arbitrary bore shapes using digital waveguide filters
Onishi et al. A Kansei model for musical chords based on the structure of the human auditory system
Gal et al. Estimation of the Wireless Sensor Network Performance using Fractal Behavior of the Generated Cognitive Harmonic Waves
Ostermann et al. Evaluation rules for evolutionary generation of drum patterns in jazz solos

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080108

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090108

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100108

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees