CN110377785B

CN110377785B - 一种基于深度学习的徐州梆子作曲方法

Info

Publication number: CN110377785B
Application number: CN201910540526.1A
Authority: CN
Inventors: 郭威; 余南南; 朱媛媛
Original assignee: Jiangsu Normal University
Current assignee: Jiangsu Normal University
Priority date: 2019-06-21
Filing date: 2019-06-21
Publication date: 2023-10-03
Anticipated expiration: 2039-06-21
Also published as: CN110377785A

Abstract

本发明公开了一种基于深度学习的徐州梆子作曲方法，首先通过稀疏成分分离提取徐州梆子乐曲中的梆子敲击部分以分离其他乐曲和梆子部分；然后，通过深度学习训练得出乐曲的特征；最后，利用递归神经网络进行训练和预测乐曲，再和生成的梆子相结合得到新的徐州梆子乐曲。采用本发明能够自动生成新的徐州梆子乐曲，对徐州梆子乐曲的保护和传承有重大意义。

Description

一种基于深度学习的徐州梆子作曲方法

技术领域

本发明涉及人工智能领域，涉及到自动作曲方法，特别涉及到一种基于深度学习的徐州梆子作曲方法。

背景技术

人工智能作曲作为一个新兴的研究方向，其主要目的是应用计算机来模仿人们对音乐的认知，进行辅助创作和设计。探索人工智能的徐州梆子作曲问题一方面可以了解徐州梆子在音乐创作过程中的特点；另一方面，通过算法作曲得到的徐州梆子音乐是对现有音乐的有益补充。目前还没有徐州梆子自动算法作曲方面的研究。本发明首先将徐州梆子中的梆子和其他部分相分离，提出基于变分式自动编码和递归神经网络的乐曲生成方法，然后和梆子部分相结合，生成新的徐州梆子音乐。填补了技术上空白，提供一种切实可行徐州梆子乐曲自动生成方法。

发明内容

发明目的：本发明提出了一种可批量且自动生成的基于深度学习的徐州梆子作曲方法。

技术方案：本发明所述的一种基于深度学习的徐州梆子作曲方法，包括以下骤：

(1)通过稀疏成分分离将徐州梆子乐曲分离成含梆子敲击部分的徐州梆子和不含梆子敲击部分的其他乐曲；

(2)对徐州梆子乐曲和其他类型的乐曲进行分类，得出徐州梆子乐曲的特征；

(3)利用步骤(2)得到的特征，通过递归神经网络进行训练和预测其他徐州梆子乐曲；

(4)利用步骤(1)中分离得到的梆子敲击部分乐曲训练字典，根据梆子乐曲重拍，确定稀疏系数，生成梆子敲击部分；

(5)由步骤(3)得到的徐州梆子乐曲和生成的梆子敲击部分相结合得到新的徐州梆子乐曲。

所述步骤(1)包括以下步骤：

(11)构建徐州梆子乐曲训练集，将每个乐曲分割为单位音乐序列，取单位时长3秒；

(12)分别构造梆子和其他乐曲的字典，利用稀疏分解，同时求得这两部分的稀疏系数，实现两部分的分离：

Y＝D₁θ₁+D₂θ₂

其中，D₁D₂分别是梆子字典和其他乐曲字典，θ₁θ₂是这两部分的稀疏系数。

所述步骤(2)包括以下步骤：

(21)应用变分式自动编码算法将徐州梆子和其它乐曲分为两类；

(22)将软阈值法分类前的数据作为徐州梆子和其他乐曲的特征。

所述步骤(4)包括以下步骤：

(41)随机选择一个其他类型乐曲的特征数据，利用LSTM预测输出得到新的特征数据，经过变分式自动编码解码过程生成单位乐曲序列，依次拼接得到新的乐曲；

(42)在重拍中加入生成的梆子，得到新的徐州梆子乐曲。

有益效果：与现有技术相比，本发明的有益效果：1、本发明应用变分式自动编码算法区分徐州梆子与其他乐曲特征；2、利用递归深度学习模型训练和预测其他乐曲，与传统机器学习相比，该模型能够自动提取乐曲特征，避免手动提取特征的麻烦；3、利用卷积神经网络的自主学习能力，通过输入训练数据自动更新网络参数。

附图说明

图1为本发明的体流程图；

图2是本发明中的深度学习徐州梆子作曲框图。

具体实施方式

下面结合附图对本发明做进一步说明，图1为本发明的流程图，包括以下步骤：

1、提取徐州梆子乐曲中的梆子敲击部分以分离其他乐曲和梆子部分。

(1)选择一批徐州梆子和其他音频乐曲用于构建训练集。将每个乐曲分割为单位音乐序列，取单位时长3秒。

(2)分别构造梆子和其他乐曲的字典，利用稀疏分解，同时求得这两部分的稀疏系数，实现两部分的分离。

Y＝D₁θ₁+D₂θ₂ (1)

2、通过深度学习训练得出乐曲的特征，如图2所示。

(1)应用变分式自动编码算法将徐州梆子和其它乐曲分为两类。

VAE的目标是构建一个从隐变量生成目标数据的模型，它的两个encoder一个用来计算均值，一个用来计算方差。

简单的通过tanh函数得到其输出：

(2)将软阈值法分类前的数据作为徐州梆子和其他乐曲的特征。

3、利用递归神经网络进行训练和预测乐曲，再和生成的梆子相结合得到新的徐州梆子乐曲。

(1)利用梆子乐曲特征训练长短期记忆网络(LSTM)模型；

将该模型的目标函数设定为tanh函数，具体地：

a、决定从“细胞状态”中提取乐曲特征

f_t＝σ(W_f·[h_t-1，x_t]+b_f) (3)

b、决定将上层细胞提取的乐曲特征放到“新细胞状态”中

i_t＝σ(W_i·[h_t-1,x_t]+b_i) (4)

c、更新“细胞状态”

d、基于“细胞状态”得到输出，

o_t＝σ(W_o·[h_t-1,x_t]+b_o) (7)

h_t＝o_t*tanh(C_t) (8)

上述式子中，o_t为输出门，i_t为输入门，C_t为记忆单元。

4、由第3步得到的模型再和生成的梆子相结合得到新的徐州梆子乐曲

(1)随机选择一个单位乐曲序列的特征数据，利用LSTM预测输出得到新的特征数据，经过变分式自动编码解码过程生成单位乐曲序列，依次拼接得到新的乐曲；

(2)在重拍中加入生成的梆子，得到新的徐州梆子乐曲。

Claims

1.一种基于深度学习的徐州梆子作曲方法，其特征在于，包括以下步骤：

(5)由步骤(3)得到的徐州梆子乐曲和生成的梆子敲击部分相结合得到新的徐州梆子乐曲；

所述步骤(3)实现过程如下：利用梆子乐曲特征训练递归神经网络模型；

将该模型的目标函数设定为tanh函数，具体地：

从“细胞状态”中提取乐曲特征：

f_t＝σ(W_f·[h_t-1,x_t]+b_f)(3)

将上层细胞提取的乐曲特征放到“新细胞状态”中：

i_t＝σ(W_i·[h_t-1,x_t]+b_i)(4)

更新“细胞状态”：

基于“细胞状态”得到输出：

o_t＝σ(W_o·[h_t-1,x_t]+b_o)(7)

h_t＝o_t*tanh(C_t)(8)

上述式子中，o_t为输出门，i_t为输入门，C_t为记忆单元；

所述步骤(4)包括以下步骤：

(42)在重拍中加入生成的梆子，得到新的徐州梆子乐曲。

2.根据权利要求1所述的一种基于深度学习的徐州梆子作曲方法，其特征在于，所述步骤(1)包括以下步骤：

Y＝D₁θ₁+D₂θ₂

3.根据权利要求1所述的一种基于深度学习的徐州梆子作曲方法，其特征在于，所述步骤(2)包括以下步骤：