CN110110137A

CN110110137A - 一种确定音乐特征的方法、装置、电子设备及存储介质

Info

Publication number: CN110110137A
Application number: CN201910207066.0A
Authority: CN
Inventors: 方远舟; 廖勤耘; 何丹; 王正; 彭滢萤
Original assignee: Migu Cultural Technology Co Ltd; MIGU Music Co Ltd
Current assignee: Migu Cultural Technology Co Ltd; MIGU Music Co Ltd
Priority date: 2019-03-19
Filing date: 2019-03-19
Publication date: 2019-08-09

Abstract

本发明实施例涉及数据处理领域，公开了一种确定音乐特征的方法、装置、电子设备及存储介质。本申请的部分实施例中，该确定音乐特征的方法包括：获取歌曲的文本信息；其中，歌曲的文本信息包括歌曲的歌词文本信息，和/或，歌曲的评论文本信息；提取歌曲的文本信息的关键词；确定关键词的词向量；根据关键词的词向量，确定歌曲的音乐特征。该实现中，根据关键词的词向量，确定歌曲的音乐特征，扩展了歌曲的音乐特征的维度。

Description

一种确定音乐特征的方法、装置、电子设备及存储介质

技术领域

本发明实施例涉及数据处理领域，特别涉及一种确定音乐特征的方法、装置、电子设备及存储介质。

背景技术

随着音乐产业进入移动互联网时代，各大音乐平台越来越关注音乐方面的研究，致力于挖掘音乐的各种特征，以便更好地向用户做出个性化推荐，迎合不同音乐用户的需求。

然而，发明人发现：目前，对音乐的数据分析大多集中于对音频数据的研究，关键词词频统计的维度有限，且指标单一，对音乐的分析不够全面。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本发明实施方式的目的在于提供一种确定音乐特征的方法、装置、电子设备及存储介质，使得能够扩展音乐特征的维度。

为解决上述技术问题，本发明的实施方式提供了一种确定音乐特征的方法，包括以下步骤：获取歌曲的文本信息；其中，歌曲的文本信息包括歌曲的歌词文本信息，和/或，歌曲的评论文本信息；提取歌曲的文本信息的关键词；确定关键词的词向量；根据关键词的词向量，确定歌曲的音乐特征。

本发明的实施方式还提供了一种确定音乐特征的装置，包括：获取模块、提取模块、第一确定模块和第二确定模块；获取模块用于获取歌曲的文本信息；其中，歌曲的文本信息包括歌曲的歌词文本信息，和/或，歌曲的评论文本信息；提取模块用于提取歌曲的文本信息的关键词；第一确定模块用于确定关键词的词向量；第二确定模块用于根据关键词的词向量，确定歌曲的音乐特征。

本发明的实施方式还提供了一种电子设备，包括：至少一个处理器；以及，与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行上述实施方式提及的确定音乐特征的方法。

本发明的实施方式还提供了一种计算机可读存储介质，存储有计算机程序，计算机程序被处理器执行时实现上述实施方式提及的确定音乐特征的方法。

本发明实施方式相对于现有技术而言，为挖掘歌曲的隐含的音乐特征，如歌曲的情感属性、情景属性等，对歌曲的文本信息进行分析，得到歌曲的文本信息的关键词的词向量。由于关键词的词向量的每个维度均可以表征歌曲的一个音乐特征，基于歌曲的关键词的词向量，可以分析歌曲的音乐特征。由于用户可以根据需要，设置关键词的词向量的维数以及每个维度所表征的音乐特征，丰富了歌曲的音乐特征的维度。

另外，根据关键词的词向量，确定歌曲的音乐特征，具体包括：根据关键词的词向量的每个维度的数值，确定歌曲的音乐特征。

另外，根据关键词的词向量的每个维度的数值，确定歌曲的每个维度的音乐特征，具体包括：对所有关键词的词向量的同一维度的数值进行平均处理；根据平均处理后得到的每个维度的数值，确定歌曲的音乐特征。该实现中，提高了电子设备分析歌曲的音乐特征的准确性。

另外，确定关键词的词向量，具体包括：基于词嵌入Word2Vec模型，确定关键词的词向量。该实现中，基于Word2Vec模型对关键词进行分析，能够更好地发现各个关键词之间的关系，便于更准确地分析歌曲的音乐特征。

另外，获取歌曲的文本信息，具体包括：通过爬虫技术在互联网中爬取歌曲的文本信息。该实现中，使得能够自动获取用于分析的歌曲的文本信息，提高了电子设备的智能性。

另外，提取歌曲的文本信息的关键词，具体包括：对歌曲的文本信息进行分词处理，得到分词结果；剔除分词结果中的无用信息，得到歌曲的文本信息的关键词。该实现中，能够避免无用信息的影响。

另外，无用信息包括分词结果中的符号和预先设定的无用词。

附图说明

一个或多个实施例通过与之对应的附图中的图片进行示例性说明，这些示例性说明并不构成对实施例的限定，附图中具有相同参考数字标号的元件表示为类似的元件，除非有特别申明，附图中的图不构成比例限制。

图1是本发明的第一实施方式的确定音乐特征的方法的流程图；

图2是本发明的第二实施方式的确定音乐特征的方法的流程图；

图3是本发明的第三实施方式的确定音乐特征的装置的结构示意图；

图4是本发明的第四实施方式的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的各实施方式进行详细的阐述。然而，本领域的普通技术人员可以理解，在本发明各实施方式中，为了使读者更好地理解本申请而提出了许多技术细节。但是，即使没有这些技术细节和基于以下各实施方式的种种变化和修改，也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便，不应对本发明的具体实现方式构成任何限定，各个实施例在不矛盾的前提下可以相互结合相互引用。

本发明的第一实施方式涉及一种确定音乐特征的方法，应用于电子设备，如终端、服务器等。如图1所示，确定音乐特征的方法包括：

步骤101：获取歌曲的文本信息。

具体地说，歌曲的文本信息包括歌曲的歌词文本信息，和/或，歌曲的评论文本信息。将歌曲的评论文本信息作为用于确定音乐特征的文本信息，使得能够从多角度、多维度分析歌曲的音乐特征。

在一个例子中，电子设备可以通过爬虫技术在互联网中爬取歌曲的文本信息。例如，电子设备通过运行预先设定的抓虫脚本，抓取各个音乐平台的评论文本信息和歌曲的歌词文本信息。其中，预先设定的抓虫脚本由用户编写。例如，用户编写抓虫脚本的过程为：梳理需要爬取的音乐平台列表和歌曲列表，整理在各音乐平台上需要爬取的指标，例如，抓取的指标为评论文本信息；采用计算机程序设计语言Python编写爬虫脚本，爬取各平台评论及歌曲文本数据。

需要说明的是，歌曲的文本信息也可以由用户直接导入，本领域技术人员可以理解，实际应用中，可以采用多种方式获取歌曲的文本信息，本实施方式不限制获取歌曲的文本信息的具体方式。

步骤102：提取歌曲的文本信息的关键词。

具体地说，电子设备对歌曲的文本信息进行处理，以获得歌曲的文本信息的关键词。

在一个例子中，电子设备对歌曲的文本信息进行分词处理，得到分词结果；剔除分词结果中的无用信息，得到歌曲的文本信息的关键词。其中，无用信息包括分词结果中的符号和预先设定的无用词。其中，预先设定的无用词可以由本领域技术人员根据自身经验设置。

以下以歌曲的文本信息包括歌词文本信息和评论文本信息为例，说明提取歌曲的文本信息的关键词的过程。

电子设备采用自然语言处理技术(Neural Parallel Language，NPL)提取歌曲的文本信息的关键词，具体实现步骤为：首先采用中文分词技术(如结巴分词)，对歌词文本信息和评论文本信息进行分词处理，并保存分词结果；然后对分词结果中的无用信息进行剔除。

在一个例子中，电子设备采用建立停用词库、正则表达式等方式去除分词结果中的符号(如标点符号和换行符)，以及无用词语等无用信息，保留歌曲的文本信息的关键词。

例如，电子设备抓取的指标为评论文本信息，指标名为“评论内容文本”。“评论内容文本”中，一首歌的评论文本内容如下：回到情歌的层面来讲，《×××》就是要戳人心、要感动听者的耳朵、要用感性的创作让听者听到感性的心声；钢琴、吉他、弦乐的配搭令听习惯亚洲情歌的听众熟悉又安心，心酸气息的背后还有一种默默陪伴的安适感，或是你和回忆的相伴，或是歌手用音乐与你的相伴。该评论文本在经过步骤102处理后，得到该评论文本信息的关键词，以列表形式保存为W＝[情歌，感性，相伴，配搭，安适，吉他，心声，弦乐，心酸，陪伴，失眠，钢琴，默默，安心，气息]。

需要说明的是，本领域技术人员可以理解，实际应用中，歌曲的文本信息的关键词可以通过列表的形式体现，也可以通过其他形式保存，本实施方式不限制保存歌曲的文本信息的关键词的方法。

需要说明的是，本领域技术人员可以理解，实际应用中，也可以通过其他方式获取歌曲的文本信息的关键词，此处仅为举例说明，本实施方式不限制提取歌曲的文本信息的关键词的方法。

步骤103：确定关键词的词向量。

具体地说，电子设备根据提取的关键词，通过计算词向量的技术，确定关键词的词向量。

在一个例子中，电子设备基于词嵌入Word2Vec模型，确定关键词的词向量。在NLP领域中，为了能表示人类的语言符号，一般会把这些符号转成一种数学向量形式以方便处理。词嵌入技术是将语言转换为数学向量的技术中的一种，其将文本的单词嵌入到向量空间中。而Word2vec是一种词嵌入技术。它能生成词向量，通过词向量可以很好地度量词与词之间的相似性。Word2vec采用的模型包含了连续词袋模型(Continuous Bag-of-Words，CBOW)和Skip-Gram模型。通过它可以在大数据量上进行高效训练从而得到词向量。CBOW是从原始语句推测目标字词；而Skip-Gram正好相反，是从目标字词推测出原始语句。CBOW对小型数据库比较合适，而Skip-Gram在大型语料中表现更好。对于CBOW模型和Skip-gram模型，word2vec给出了两套框架，它们分别是基于分层输出加速策略(HierarchicalSoftmax)和负采样加速策略(Negative Sampling)来进行设计。

下面介绍基于Hierarchical Softmax的Skip-gram模型。

Word2Vec采用三层神经网络，包括：输入层、隐层和输出层。Word2Vec产生词向量具体流程如下：

1.分词提取(词干提取)和词形还原。

中文和英文的NLP各有各的难点，中文的难点在于需要进行分词，将一个个句子分解成一个单词数组。而英文虽然不需要分词，但是要处理各种各样的时态，所以要进行词干提取和词形还原。

2.构造词典，统计词频。这一步需要遍历一遍所有文本信息，找出所有出现过的词，并统计各词的出现频率。

3.构造树形结构。依照各词出现概率构造哈夫曼(Huffman)树。

4.生成Huffman树的节点所在的二进制码。其中，Huffman树的节点包括叶节点和非叶节点。

5.初始化各个非叶节点的中间向量和叶节点的词向量。树中的各个节点，都存储着一个长为m的向量，但叶节点和非叶结点中的向量的含义不同。叶节点中存储的是各词的词向量，是作为神经网络的输入的。而非叶结点中存储的是中间向量，对应于神经网络中隐含层的参数，与输入一起决定分类结果。

6.训练中间向量和词向量。

接下来对训练词向量的Skip-gram模型的步骤进行说明。训练词向量的Skip-gram模型的步骤如下：

1.根据词频建立Huffman树。

2.随机初始化所有的模型参数θ和所有的词向量X_w的值。

3.设定取词窗，目标是根据sigmoid函数由单个词求出上下文的概率值最大。在Word2vec中，采用了二元逻辑回归的方法，即规定沿着Huffman的左子树走，那么就是负类(霍夫曼树编码为1)，沿着右子树走，那么就是正类(霍夫曼树编码为0)。判别正类和负类的方法是使用sigmoid函数。其中，sigmoid函数为：

公式a中，σ(Z_i)为sigmoid函数，θ是从训练文本求出的逻辑回归的模型参数，是指第i个节点的词向量，则每个内部节点i的逻辑回归概率为其表达式为：

根据每个内部节点i的逻辑回归概率，可以求内部节点i在上下文出现的概率P(context(W)|X_W)，P(context(W)|X_W)的表达式为：

公式c中，context(W)表示当前分析的文本，W为输入的词，X_W为其从输入层词向量求和平均后的霍尔曼树根节点词向量，l^w为从根节点到W所在的叶子节点包含的节点总数，为W在霍夫曼树中从根节点开始，经过的第i个节点对应的霍夫曼编码，其中，i＝2，3，……，l^w，θ_i-1为该节点对应的模型参数，是指当前内部节点i的词向量。

4.利用似然函数的最大值代替P。其中，似然函数为：

公式d中，为似然函数，W为输入的词，为W在霍夫曼树中从根节点开始，经过的第i个节点对应的霍夫曼编码，其中，i＝2，3，……，l^w，θ_i-1为第i个节点对应的模型参数，是指当前内部节点i的词向量。

5.利用梯度上升法求似然函数的最大值。

该步骤中，模型参数的更新函数为：

词向量更新函数为：

其中，公式e和公式f中，θ_i-1为W在霍夫曼树中从根节点开始，经过的第i个节点对应的模型参数，：＝表示迭代函数，η为学习率，为W在霍夫曼树中从根节点开始，经过的第i个节点对应的霍夫曼编码，是指context(W)中各词词向量的累加，υ(W)表示每个词的词向量，l^w为从根节点到W所在的叶子节点包含的节点总数。

在更新过程中，梯度一旦收敛，停止更新，此时概率值为极大值。

需要说明的是，本领域技术人员可以理解，CDOW模型也可以采用类似的方法求取各个分词的概率，区别在于：CBOW模型是已知某个词的上下文的分词的概率，求中间词出现的概率，本实施方式不限制确定关键词的词向量时使用的具体方法。

在一个例子中，歌曲的文本信息中包括歌曲的评论文本信息。电子设备在基于词嵌入Word2Vec模型，确定关键词的词向量后，确定关键词之间的距离，针对每个关键词，分别进行以下操作：判断该关键词与其他关键词的距离均大于第一预设值，剔除该关键词。由于两个关键词之间的距离能够体现两者之间的相似性，若歌曲的文本信息的某个关键词与其他关键词的距离大于第一预设值，可以认为该关键词与其他关键词均不相似。造成这一情况的原因可能是提取出该关键词的评论文本为不真实评论文本(如有意误导的评论文本)，或，该关键词对应的评论文本的评论者在评论时出现了拼写错误，因此，该关键词属于干扰性关键词。电子设备将干扰性关键词剔除，以免该关键词的词向量对电子设备分析歌曲的音乐特征造成干扰。其中，第一预设值可以根据实际情况设置。

值得一提的是，基于Word2Vec模型对关键词进行分析，能够更好地发现各个关键词之间的关系，便于更准确地分析歌曲的音乐特征。

步骤104：根据关键词的词向量，确定歌曲的音乐特征。

具体地说，本实施方式中，为挖掘歌曲的音乐特征，如音乐的情感属性、情景属性等特征，对歌曲的文本信息进行文本分析，将文本信息中的关键词数学化，提取歌曲的文本信息的非结构化数据的信息，使得能够获取更多的音乐特征，丰富了音乐的特征维度。

需要说明的是，本领域技术人员可以理解，实际应用中，关键词的词向量的各个维度所表征的含义可以根据需要设置，例如，可以设置为<情歌，古典音乐，欢快歌曲，悲伤歌曲>，本实施方式不限制词向量的维度和向量表示的含义。

在一个例子中，电子设备根据关键词的词向量的每个维度的数值，确定歌曲的n个音乐特征，n为关键词的词向量的维度数量。具体地说，假设关键词的词向量为v₁＝(a₁,a₂,…,a_n)，将该n维的词向量拆分为n个数值，根据每个数值，即可确定该歌曲的音乐特征。

在另一个例子中，电子设备根据关键词的词向量，确定该关键词的特征，将所有关键词的词向量的特征，均作为歌曲的音乐特征。例如，向量表示为<悲情歌曲，情歌，怀旧歌曲，民族歌曲>，歌曲中的关键词包括“难受”，该关键词的词向量为<0.6，0.2，0.1，0.3>，因此，可以确定该关键词的特征为悲情歌曲，故将悲情歌曲作为该歌曲的一个音乐特征。

需要说明的是，以上仅为举例说明，并不对本发明的技术方案构成限定。

与现有技术相比，本实施方式中提供的确定音乐特征的方法，为挖掘歌曲的隐含的音乐特征，如歌曲的情感属性、情景属性等，对歌曲的文本信息进行分析，得到歌曲的文本信息的关键词的词向量。由于关键词的词向量的每个维度均可以表征歌曲的一个音乐特征，基于歌曲的关键词的词向量，可以分析歌曲的音乐特征。由于用户可以根据需要，设置关键词的词向量的维数以及每个维度所表征的音乐特征，丰富了歌曲的音乐特征的维度。

本发明的第二实施方式涉及一种确定音乐特征的方法，本实施方式是对第一实施方式的进一步细化，举例说明了根据关键词的词向量，确定歌曲的音乐特征的过程。

具体的说，如图2所示，在本实施方式中，包含步骤201至步骤205，其中，步骤201至步骤203分别与第一实施方式中的步骤101至步骤103大致相同，此处不再赘述。下面主要介绍不同之处：

执行步骤201至步骤203。

步骤204：对所有关键词的词向量的同一维度的数值进行平均处理。

具体地说，假设评论文本信息X_i中某个句段X_ij的关键词为w₁,w₂,…,w_K，将w₁,w₂,…,w_K输入Word2vec模型后，得到K个关键词的词向量，其词向量分别为v₁,v₂,…,v_K。由v₁,v₂,…,v_K构成该句段的向量矩阵。其中，K为关键词的个数。对该句段的向量矩阵各个维度的数值求均值，得到该句段的向量表达，维度为n，计算公式为：

其中，Vector(X_ij)为该句段的向量表达，v_k表示第k个关键词的词向量。

步骤205：根据平均处理后得到的每个维度的数值，确定歌曲的音乐特征。

具体地说，句段的向量表示中每个维度分别对应一个音乐特征。电子设备根据句段的向量表示中每个维度的数值，确定歌曲的音乐特征。

在一个例子中，若某个维度的数值大于第二预设值，则将该维度对应的音乐特征作为该歌曲的音乐特征。其中，第二预设值可以根据实际情况设置。

以下结合实际情况，对确定音乐特征的方法进行举例说明。

假设，第二预设值为0.5，词向量维度n＝200，词向量的每个维度表征的音乐特征分别为<悲情歌曲，情歌，怀旧歌曲，……，民族歌曲>，相应的，句段的向量表示中每个维度表征的音乐特征也是<悲情歌曲，情歌，怀旧歌曲，……，民族歌曲>，评论文本信息中的句段的关键词的列表为W＝[w₁,w₂,…,w_K]，K＝15，该评论文本信息的句段的向量矩阵的维度为15*200。其中，w₁＝“爱情”，v₁则是关键词“爱情”经过Wrod2Vec模型处理后得到的词向量，将所有词向量对应维度数值求均值，得到一个200维的向量，即为该句段的向量表示，该句段的向量为<0.1，0.6，0.2，……，0.3>，由于第二个维度的数值大于0.5，因此，情歌是该歌曲的一个音乐特征。依次类推，对句段的向量表示中其他维度的数值进行分析，可以确定歌曲所有的音乐特征。

需要说明的是，本领域技术人员可以理解，实际应用中，除了采用平均处理的方式以外，也可以根据每个关键词在歌曲的文本信息中出现的概率，为每个关键词的词向量分配不同的权重，本实施方式不限制对关键词的词向量处理，得到句段的向量表达的方式。

与现有技术相比，本实施方式中提供的确定音乐特征的方法，为挖掘歌曲的隐含的音乐特征，如歌曲的情感属性、情景属性等，对歌曲的文本信息进行分析，得到歌曲的文本信息的关键词的词向量。由于关键词的词向量的每个维度均可以表征歌曲的一个音乐特征，基于歌曲的关键词的词向量，可以分析歌曲的音乐特征。由于用户可以根据需要，设置关键词的词向量的维数以及每个维度所表征的音乐特征，丰富了歌曲的音乐特征的维度。除此之外，对关键词的词向量的同一维度的数值进行平均处理，能够避免个别具有干扰性的关键词对分析歌曲的音乐特征的过程的影响，提高了电子设备分析歌曲的音乐特征的准确性。

上面各种方法的步骤划分，只是为了描述清楚，实现时可以合并为一个步骤或者对某些步骤进行拆分，分解为多个步骤，只要包括相同的逻辑关系，都在本专利的保护范围内；对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计，但不改变其算法和流程的核心设计都在该专利的保护范围内。

本发明的第三实施方式涉及一种确定音乐特征的装置，如图3所示，包括：获取模块301、提取模块302、第一确定模块303和第二确定模块304。获取模块301用于获取歌曲的文本信息；其中，歌曲的文本信息包括歌曲的歌词文本信息，和/或，歌曲的评论文本信息。提取模块302用于提取歌曲的文本信息的关键词。第一确定模块303用于确定关键词的词向量。第二确定模块304用于根据关键词的词向量，确定歌曲的音乐特征。

不难发现，本实施方式为与第一实施方式相对应的装置实施例，本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效，为了减少重复，这里不再赘述。相应地，本实施方式中提到的相关技术细节也可应用在第一实施方式中。

值得一提的是，本实施方式中所涉及到的各模块均为逻辑模块，在实际应用中，一个逻辑单元可以是一个物理单元，也可以是一个物理单元的一部分，还可以以多个物理单元的组合实现。此外，为了突出本发明的创新部分，本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入，但这并不表明本实施方式中不存在其它的单元。

本发明的第四实施方式涉及一种电子设备，如图4所示，包括：至少一个处理器401；以及，与至少一个处理器401通信连接的存储器402；其中，存储器402存储有可被至少一个处理器401执行的指令，指令被至少一个处理器401执行，以使至少一个处理器能够执行如上述实施方式提及的确定音乐特征的方法。

该电子设备包括：一个或多个处理器401以及存储器402，图4中以一个处理器401为例。处理器401、存储器402可以通过总线或者其他方式连接，图4中以通过总线连接为例。存储器402作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。处理器401通过运行存储在存储器402中的非易失性软件程序、指令以及模块，从而执行设备的各种功能应用以及数据处理，即实现上述确定音乐特征的方法。

存储器402可以包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需要的应用程序；存储数据区可存储选项列表等。此外，存储器402可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施方式中，存储器402可选包括相对于处理器401远程设置的存储器，这些远程存储器可以通过网络连接至外接设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

一个或者多个模块存储在存储器402中，当被一个或者多个处理器401执行时，执行上述任意方法实施方式中的确定音乐特征的方法。

上述产品可执行本申请实施方式所提供的方法，具备执行方法相应的功能模块和有益效果，未在本实施方式中详尽描述的技术细节，可参见本申请实施方式所提供的方法。

本发明的第五实施方式涉及一种计算机可读存储介质，存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。

即，本领域技术人员可以理解，实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域的普通技术人员可以理解，上述各实施方式是实现本发明的具体实施例，而在实际应用中，可以在形式上和细节上对其作各种改变，而不偏离本发明的精神和范围。

Claims

1.一种确定音乐特征的方法，其特征在于，包括：

获取歌曲的文本信息；其中，所述歌曲的文本信息包括所述歌曲的歌词文本信息，和/或，所述歌曲的评论文本信息；

提取所述歌曲的文本信息的关键词；

确定所述关键词的词向量；

根据所述关键词的词向量，确定所述歌曲的音乐特征。

2.根据权利要求1所述的确定音乐特征的方法，其特征在于，所述根据所述关键词的词向量，确定所述歌曲的音乐特征，具体包括：

根据所述关键词的词向量的每个维度的数值，确定所述歌曲的音乐特征。

3.根据权利要求2所述的确定音乐特征的方法，其特征在于，所述根据所述关键词的词向量的每个维度的数值，确定所述歌曲的每个维度的音乐特征，具体包括：

对所有关键词的词向量的同一维度的数值进行平均处理；

根据平均处理后得到的每个维度的数值，确定所述歌曲的音乐特征。

4.根据权利要求1至3中任一项所述的确定音乐特征的方法，其特征在于，所述确定所述关键词的词向量，具体包括：

基于词嵌入Word2Vec模型，确定所述关键词的词向量。

5.根据权利要求1至3中任一项所述的确定音乐特征的方法，其特征在于，所述获取歌曲的文本信息，具体包括：

通过爬虫技术在互联网中爬取所述歌曲的文本信息。

6.根据权利要求1至3中任一项所述的确定音乐特征的方法，其特征在于，所述提取所述歌曲的文本信息的关键词，具体包括：

对所述歌曲的文本信息进行分词处理，得到分词结果；

剔除分词结果中的无用信息，得到所述歌曲的文本信息的关键词。

7.根据权利要求6所述的确定音乐特征的方法，其特征在于，所述无用信息包括所述分词结果中的符号和预先设定的无用词。

8.一种确定音乐特征的装置，其特征在于，包括：获取模块、提取模块、第一确定模块和第二确定模块；

所述获取模块用于获取歌曲的文本信息；其中，所述歌曲的文本信息包括所述歌曲的歌词文本信息，和/或，所述歌曲的评论文本信息；

所述提取模块用于提取所述歌曲的文本信息的关键词；

所述第一确定模块用于确定所述关键词的词向量；

所述第二确定模块用于根据所述关键词的词向量，确定所述歌曲的音乐特征。

9.一种电子设备，其特征在于，包括：至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求1至7中任一项所述的确定音乐特征的方法。

10.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的确定音乐特征的方法。