WO2022089098A1

WO2022089098A1 - 音高调节方法、装置及计算机存储介质

Info

Publication number: WO2022089098A1
Application number: PCT/CN2021/119571
Authority: WO
Inventors: 周宇; 林森
Original assignee: 腾讯音乐娱乐科技（深圳）有限公司
Priority date: 2020-10-27
Filing date: 2021-09-22
Publication date: 2022-05-05
Also published as: US20230395051A1; CN112270913A; CN112270913B

Abstract

一种音高调节方法，用于自动对目标歌曲的伴奏进行调节，以使得用户歌声与伴奏在音高上相匹配。方法包括：获取用户歌声的基频序列（102），计算每个备选旋律文件与基频序列在每一个相对应时间点上的音高值差值，并分别统计每个备选旋律文件的所有音高值差值的总和（103），将总和最小的备选旋律文件确定为目标旋律文件，并根据目标旋律文件与目标歌曲的原始旋律文件的音高值差值调节目标歌曲的伴奏文件的音高（104）。由于目标旋律文件所标识的音高与用户歌声的音高的匹配度最高，因此，经过音高调节之后的伴奏可以与用户歌声的音高相契合，形成的混音作品可以获得良好的听感。还提供了一种音高调节装置及计算机存储介质。

Description

音高调节方法、装置及计算机存储介质

本申请要求于2020年10月27日提交中国专利局、申请号为202011163021.7、发明名称为“音高调节方法、装置及计算机存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及数据处理领域，具体涉及一种音高调节方法、装置及计算机存储介质。

背景技术

目前的智能终端音乐软件可以为用户提供歌唱录制服务，即音乐软件播放歌曲的伴奏，用户在该伴奏下歌唱，并由音乐软件录制用户的歌声，再将用户的歌声与该歌曲的伴奏进行混音，最终合成作品，该作品即包含用户的歌声及歌曲的伴奏。

部分用户因自身发音条件的限制，无法唱出歌曲中的高音部分或者低音部分，因此，即使音乐软件给出当前伴奏的参考音高，由于受限于自身的发音条件，用户仍然无法很好地依据该参考音高进行歌唱。此时，用户可以手动调节伴奏的音调，使其契合自身的发音条件，即用户无法唱出高音，则手动下调伴奏的音调，对伴奏进行降调，使其变为低音。

但是，用户如果不对伴奏的音调进行手动调节，在合成作品的时候，用户的歌声与伴奏在音高上不一致，严重影响了作品的听感。若用户在每一次歌唱时均需要根据自身的发音条件来调节伴奏的音高，这也给用户使用音乐软件带来不便，影响用户体验。

发明内容

本申请实施例提供了一种音高调节方法、装置及计算机存储介质，用于自动对目标歌曲的伴奏进行调节，以使得用户歌声与伴奏在音高上相匹配。

本申请实施例第一方面提供了一种音高调节方法，包括：

获取多个备选旋律文件，所述备选旋律文件用于标识目标歌曲的旋律中音符的音高值，每个所述备选旋律文件所标识的音高值不同；

获取用户歌唱所述目标歌曲的歌声的基频序列，并根据预设算法将所述基频序列的目标基频点的频率值转换为音高值，所述目标基频点包括所述基频序列中与所述备选旋律文件的音符在时间上相对应的基频点；

分别计算每个所述备选旋律文件与所述基频序列在每一个相对应时间点上的音高值差值，并分别统计每个所述备选旋律文件的所有音高值差值的总和；

将所述总和最小的备选旋律文件确定为目标旋律文件，并根据所述目标旋律文件与所述目标歌曲的原始旋律文件的音高值差值调节所述目标歌曲的伴奏文件的音高。

本申请实施例第二方面提供了一种音高调节装置，包括：

第一获取单元，用于获取多个备选旋律文件，所述备选旋律文件用于标识目标歌曲的旋律中音符的音高值，每个所述备选旋律文件所标识的音高值不同；

第二获取单元，用于获取用户歌唱所述目标歌曲的歌声的基频序列；

转换单元，用于根据预设算法将所述基频序列的目标基频点的频率值转换为音高值，所述目标基频点包括所述基频序列中与所述备选旋律文件的音符在时间上相对应的基频点；

计算单元，用于分别计算每个所述备选旋律文件与所述基频序列在每一个相对应时间点上的音高值差值，并分别统计每个所述备选旋律文件的所有音高值差值的总和；

音高调节单元，用于将所述总和最小的备选旋律文件确定为目标旋律文件，并根据所述目标旋律文件与所述目标歌曲的原始旋律文件的音高值差值调节所述目标歌曲的伴奏文件的音高。

本申请实施例第三方面提供了一种音高调节装置，包括：

处理器、存储器、总线、输入输出设备；

所述处理器与所述存储器、输入输出设备相连；

所述总线分别连接所述处理器、存储器以及输入输出设备；

所述处理器用于获取多个备选旋律文件，所述备选旋律文件用于标识目标歌曲的旋律中音符的音高值，每个所述备选旋律文件所标识的音高值不同，获取用户歌唱所述目标歌曲的歌声的基频序列，并根据预设算法将所述基频序列的目标基频点的频率值转换为音高值，所述目标基频点包括所述基频序列中与所述备选旋律文件的音符在时间上相对应的基频点，分别计算每个所述备选旋律文件与所述基频序列在每一个相对应时间点上的音高值差值，并分别统计每个所述备选旋律文件的所有音高值差值的总和，将所述总和最小的备选旋律文件确定为目标旋律文件，并根据所述目标旋律文件与所述目标歌曲的原始旋律文件的音高值差值调节所述目标歌曲的伴奏文件的音高。

本申请实施例第四方面提供了一种计算机存储介质，计算机存储介质中存储有指令，该指令在计算机上执行时，使得计算机执行前述第一方面的方法。

从以上技术方案可以看出，本申请实施例具有以下优点：

本申请实施例中，获取用户歌声的基频序列，计算每个备选旋律文件与基频序列在每一个相对应时间点上的音高值差值，并分别统计每个备选旋律文件的所有音高值差值的总和，将总和最小的备选旋律文件确定为目标旋律文件，并根据目标旋律文件与目标歌曲的原始旋律文件的音高值差值调节目标歌曲的伴奏文件的音高，由于目标旋律文件所标识的音高与用户歌声的音高的匹配度最高，因此，经过音高调节之后的伴奏可以与用户歌声的音高相契合，形成的混音作品可以获得良好的听感。

附图说明

图1为本申请实施例中音高调节方法一个流程示意图；

图2为本申请实施例中音高调节方法另一流程示意图；

图3为本申请实施例中音高调节装置一个结构示意图；

图4为本申请实施例中音高调节装置另一结构示意图；

图5为本申请实施例中音高调节装置另一结构示意图。

具体实施方式

请参阅图1，本申请实施例中音高调节方法一个实施例包括：

101、获取多个备选旋律文件；

本实施例的方法可应用于音高调节装置，该装置可以是终端、服务器等能够执行数据处理任务的计算机设备。该生成装置为终端时，可以是智能手机、平板电脑、膝上型便携计算机、台式计算机、自助服务终端等设备；为服务器时，可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式***，还可以是提供云数据库、云计算以及大数据和人工智能平台等基础云计算服务的云服务器。

本实施例根据用户的歌声的音高来调节目标歌曲的伴奏的音高，从而使伴奏的音高契合用户歌声的音高，使用户歌声和伴奏的混音作品在听感上更佳。基于上述原理，在调节目标歌曲的伴奏的音高时，是将多个备选旋律文件作为参考以确定出伴奏的音高的调节程度。因此，在调节伴奏的音高时，获取多个备选旋律文件，其中每个备选旋律文件均是用于标识目标歌曲的旋律中音符的音高值，且每个备选旋律文件所标识的音高值不同。

对于108键钢琴来说，其音高值范围是0～108；对于88键钢琴来说，其音高值范围是0～88。因此，备选旋律文件所标识的目标歌曲的旋律的音高值，其值可以是0～108或者0～88中的一个音高值。例如，备选旋律文件1标识的音高值为0，备选旋律文件2标识的音高值为1，等等。

102、获取用户歌唱目标歌曲的歌声的基频序列，并根据预设算法将基频序列的目标基频点的频率值转换为音高值；

当用户歌唱目标歌曲时，采集用户的歌声，则音高调节装置获取用户的歌声的音频数据，并提取该歌声的基频，得到基频序列，基频序列包括了多个基频点。本实施例中，提取歌声的基频的方法可以有多种，例如，常用的基频提取算法有自相关算法、平行处理法、倒谱法和简化逆滤波法，则可以基于上述算法提取出歌声的基频，并得到用户歌声的基频序列。

由于本实施例将多个备选旋律文件作为参考，而该多个备选旋律文件标识的是旋律的音高值，因此，在将备选旋律文件与用户歌声的基频序列进行对比时，需要将基频序列中的目标基频点的频率值转换为音高值，该目标基频点包括基频序列中与备选旋律文件的音符在时间上相对应的基频点，从而可以将基频点的音高值与备选旋律文件所标识的音高值进行对比，对比的结果可以作为伴奏的音高调节的依据。

103、分别计算每个备选旋律文件与基频序列在每一个相对应时间点上的音高值差值，并分别统计每个备选旋律文件的所有音高值差值的总和；

由于旋律是由音符组成，因此，备选旋律文件所标识的音高值也就是音符的音高值，在将基频序列的每一基频点的频率值转换为音高值之后，可以计算每个备选旋律文件与基频序列在每一个相对应时间点上的音高值差值，其中相对应时间点是指基频序列的基频点落在备选旋律文件中某个音符的时间范围，此时该基频点与该音符在时间上相对应。例如，某个音符的时值为1s，若某个基频点落在该1s的音符的时间范围之内，则该基频点与该音符在时间上相对应，可以计算出两者的音高值差值。

在计算得到每一个相对应时间点的音高值差值之后，分别将每个备选旋律文件的所有音高值差值进行累加，统计得到每个备选旋律文件的音高值差值的总和。音高值差值的总和的数值大小，可以反映出备选旋律文件的音高值与用户歌声的基频序列的音高值的差距大小，即该总和的数值越大，表明该差距越大，备选旋律文件的音高越不契合于用户歌声的音高；该总和的数值越小，表明该差距越小，备选旋律文件的音高与用户歌声的音高的契合程度越高，则依据该备选旋律文件调节伴奏音高，可以得到与用户歌声的音高相匹配的伴奏。

104、将总和最小的备选旋律文件确定为目标旋律文件，并根据目标旋律文件与目标歌曲的原始旋律文件的音高值差值调节目标歌曲的伴奏文件的音高；

根据上述的分析，备选旋律文件的音高值差值的总和越小，越有利于调节伴奏的音高。因此，在得到所有备选旋律文件的音高值差值的总和之后，将其中音高值差值的总和最小的备选旋律文件确定为目标旋律文件，该目标旋律文件可以作为调节伴奏音高的依据。

本实施例中，目标歌曲的原始旋律文件用于标识目标歌曲的原始旋律中音符的音高值，该原始旋律可以是目标歌曲的原唱者的歌声旋律，由于原唱者一般是相对较专业的歌手，因此，该原始旋律的音高一般也会契合目标歌曲的伴奏的音高，则原始旋律文件所标识的音高值也会匹配于伴奏的音高值。因此，可以根据目标旋律文件与该原始旋律文件的音高值差值来调节目标歌曲的伴奏文件的音高。由于目标旋律文件所标识的音高值与用户歌声的基频序列的音高值相匹配，因此，根据目标旋律文件调节音高得到的伴奏也会与用户歌声的音高相匹配，从而使调节音高之后的伴奏与用户歌声形成的混音作品具有良好的听感。

例如，假设某个备选旋律文件所标识的音符的音高值分别为24、25、29、31、34、27(实际应用中备选旋律文件所标识的音符的个数根据目标歌曲而确定，这里仅示例性列举有限个数的音符)，而目标歌曲的基频序列中分别与上述音符对应的目标基频点的音高值为24、25、28、31、34、27。分别计算得到相对应的目标基频点与音符之间的音高值差值为0、0、1、0、0、0(音高值差值取绝对值)，统计得到音高值差值的总和为1。以此类推，可计算得到其他备选旋律文件的音高值差值的总和。

假设存在12个备选旋律文件，其音高值差值的总和分别为137、109、90、73、49、24、1、22、45、67、86、114，则确定音高值差值为1所对应的备选旋律文件为目标旋律文件。假设该目标旋律文件与目标歌曲的原始旋律文件在音高上相差两个半音音程，则可以根据目标旋律文件与目标歌曲的原始旋律文件的音高差距调节目标歌曲的伴奏文件的音高，使得调节音高之后的伴奏能够契合用户歌声的音高，提升听感。

本实施例中，获取用户歌声的基频序列，计算每个备选旋律文件与基频序列在每一个相对应时间点上的音高值差值，并分别统计每个备选旋律文件的所有音高值差值的总和，将总和最小的备选旋律文件确定为目标旋律文件，并根据目标旋律文件与目标歌曲的原始旋律文件的音高值差值调节目标歌曲的伴奏文件的音高，由于目标旋律文件所标识的音高与用户歌声的音高的匹配度最高，因此，经过音高调节之后的伴奏可以与用户歌声的音高相契合，形成的混音作品可以获得良好的听感。

下面将在前述图1所示实施例的基础上，进一步详细地描述本申请实施例。请参阅图2，本申请实施例中音高调节方法另一实施例包括：

201、获取多个备选旋律文件；

本实施例中，该多个备选旋律文件可以是任意的用于标识目标歌曲的旋律的音高值的文件，只要每个备选旋律文件所标识的音高值不同即可。

在一种优选的实施方式中，该多个备选旋律文件可以由目标歌曲的原始旋律文件变换得到。同样的，原始旋律文件用于标识目标歌曲的原始旋律的音高值，该原始旋律可以是目标歌曲的原唱者的歌声旋律。由于旋律由音符组成，因此，在对原始旋律文件进行升调或者降调的变换时，可以对该原始旋律文件的所有音符的音高值加上变换值，从而得到变换后的旋律文件。因此，该变换后的旋律文件以及该原始旋律文件可以分别作为备选旋律文件，均可以作为伴奏音高调节的参考依据。

可以理解的是，由于对原始旋律文件的变换可以是升调的变换或者降调的变换，因此，变换值可以是正值，也可以是负值。例如，变换值为+1，则表示将原始旋律文件的音高值提高1个单位，为升调的变换；变换值为-2，则表示将原始旋律文件的音高值降低2个单位，为降调的变换。

本实施例在对原始旋律文件进行变换时，具体可以基于十二平均律的原理进行变换。十二平均律是一种音乐定律方法，将一个纯八度平均分成十二等份，每等分称为半音，是最主要的调音法。因此，可以基于十二平均律，将原始旋律文件所处的一个八度音阶进行平均分割，得到十二个半音音程，其中原始旋律文件便对应了该十二个半音音程中的一个半音音程；之后，按照原始旋律文件对应的半音音程与其它半音音程之间的音程关系，分别对原始旋律文件的所有音符的音高值执行11次的加变换值，从而得到11个变换后的旋律文件。由于加变换值是根据半音音程来执行的，因此，变换得到的旋律文件也会对应该十二个半音音程中的一个半音音程，即每个变换后的旋律文件分别对应该十二个半音音程中的一个半音音程。该11个变换后的旋律文件与原始旋律文件一起，构成12个备选旋律文件。

例如，分别对原始旋律文件的所有音符的音高值执行11次的加变换值，分别是+1、+2、+3、……、+9、+10、+11，则原始旋律文件的音高值最小，而加变换值+11的旋律文件的音高值最大。

202、获取用户歌唱目标歌曲的歌声的基频序列，并根据预设算法将基频序列的目标基频点的频率值转换为音高值；

本实施例中，该预设算法的具体算法内容不作限定，只要是能够将基频点的频率值转换为音高值的算法即可。例如，该预设算法可以是以下公式：

音高值＝12*log2(hz_value/440.0)+69；

其中，hz_value为基频点的频率值。通过以上公式可以将基频点的频率值转换为音高值。

本实施例中，目标基频点可以包括基频序列中所有的基频点，也可以仅包括与备选旋律文件的音符在时间上相对应的目标基频点。在计算目标基频点的音高值时，一种方式可以是，遍历基频序列的每一个基频点，根据预设算法将每一个基频点的频率值转换为音高值，之后，再从基频序列的所有基频点中确定出与备选旋律文件的音符在时间上相对应的目标基频点；另一方式也可以是，首先从基频序列的所有基频点中确定出与备选旋律文件的音符在时间上相对应的目标基频点，在将频率值转换为音高值时只转换目标基频点的频率值，相比于前一种方式，可以无需转换其他基频点的频率值，大大减少了计算音高值的操作，降低数据处理的压力。

203、分别计算每个备选旋律文件与基频序列在每一个相对应时间点上的音高值差值，并分别统计每个备选旋律文件的所有音高值差值的总和；

本实施例中，在计算每个备选旋律文件与基频序列在每一个相对应时间点上的音高值差值时，获取每个备选旋律文件中与目标基频点在时间上相对应的音符的音高值，即某一基频点落在某个音符的时值范围内时，该基频点即为与该音符在时间上相对应的目标基频点。之后，计算时间上相对应的目标基频点与音符之间的音高值差值，从而得到备选旋律文件与基频序列在每一个相对应时间点上的音高值差值。

其中，确定备选旋律文件中的音符是否与基频序列的基频点在时间上相对应，其具体方式可以是，备选旋律文件还标识有目标歌曲的旋律中音符的开始时间及结束时间，则可以根据音符的开始时间和结束时间确定与目标基频点在时间上相对应的音符，即基频点落在某一音符的开始时间至结束时间的时间段内，则确定目标基频点与该音符在时间上相对应。在确定了相对应的音符之后，获取该相对应的音符的音高值。

在计算得到每个备选旋律文件的所有相对应时间点的音高值差值之后，分别将每个备选旋律文件的所有音高值差值进行累加，统计得到每个备选旋律文件的音高值差值的总和。

204、将总和最小的备选旋律文件确定为目标旋律文件；

音高值差值的总和最小的备选旋律文件与用户歌声在音高上的匹配度最高，因此，将音高值差值的总和最小的备选旋律文件确定为伴奏音高调节的参考依据。

205、判断目标旋律文件中音高值差值为0的音符在所有音符中的占比是否大于预设阈值，若是，则执行步骤206；若否，则执行步骤207；

本实施例中，在确定出目标旋律文件之后，还可以进一步确定该目标旋律文件与用户歌声在音高上的匹配程度，即目标旋律文件中音高值差值为0的音符在所有音符中的占比越高，表明目标旋律文件与用户歌声在音高上的差异越小，则匹配程度越高。

例如，若目标旋律文件中音高值差值为0的音符在所有音符中的占比为100％，说明整个目标旋律文件与用户歌声在音高上完全无任何差异，目标旋律文件所标识的音高值可以很好地匹配用户歌声，从另一角度也说明该用户对音准的把握能力很强。反之，若目标旋律文件中音高值差值为0的音符在所有音符中的占比极低，说明目标旋律文件与用户歌声在音高上存在多处差异，两者的匹配度不高，可能是由于用户对音准的把握能力不强，在歌唱的时候经常跑调，无法依照一定的音高进行歌唱。

其中，该预设阈值可以任意设定，具体可以根据实验数据总结得到，例如可以设定为80％～100％之间的任意一个数值。

206、根据目标旋律文件与目标歌曲的原始旋律文件的音高值差值调节目标歌曲的伴奏文件的音高；

当目标旋律文件中音高值差值为0的音符在所有音符中的占比大于预设阈值时，表明目标旋律文件与用户歌声在音高上的匹配度很高，则根据目标旋律文件与目标歌曲的原始旋律文件的音高值差值调节目标歌曲的伴奏文件的音高。本步骤所执行的操作与前述图1所示实施例中的步骤104所执行的操作类似。

由于目标旋律文件是步骤201所获取到的多个备选旋律文件中的一个，若该多个备选旋律文件是由目标歌曲的原始旋律文件变换得到的，则可以直接根据目标旋律文件与原始旋律文件的变换关系，直接确定出目标旋律文件与原始旋律文件的音高值差值。

具体方式是，由于步骤201基于十二平均律对原始旋律文件进行变换得到12个备选旋律文件，并且每个备选旋律文件均对应一个半音音程，因此，目标旋律文件与原始旋律文件之间具有音程关系，即相差多少个半音音程，具体表现在音高上时，则为目标旋律文件对应的旋律与原始旋律文件对应的旋律之间的音高差距。因此，可以根据目标旋律文件与原始旋律文件之间的音程关系来调节目标歌曲的伴奏文件的音高。

207、不调节伴奏文件的音高；

当目标旋律文件中音高值差值为0的音符在所有音符中的占比小于预设阈值时，表明目标旋律文件与用户歌声在音高上存在多处差异，两者的匹配度不高，此时认为用户对目标歌曲的音准把握较差，即使根据目标旋律文件来调节伴奏文件的音高也无法令伴奏很好地契合用户歌声，因此，不调节伴奏文件的音高，不改变伴奏的音高。

本实施例中，可以通过判断目标旋律文件中音高值差值为0的音符在所有音符中的占比是否大于预设阈值，来进一步确定该目标旋律文件与用户歌声在音高上的匹配程度，提高了方案的可实现性。

上面对本申请实施例中的音高调节方法进行了描述，下面对本申请实施例中的音高调节装置进行描述，请参阅图3，本申请实施例中音高调节装置一个实施例包括：

第一获取单元301，用于获取多个备选旋律文件，备选旋律文件用于标识目标歌曲的旋律中音符的音高值，每个备选旋律文件所标识的音高值不同；

第二获取单元302，用于获取用户歌唱目标歌曲的歌声的基频序列；

转换单元303，用于根据预设算法将基频序列的目标基频点的频率值转换为音高值，目标基频点包括基频序列中与备选旋律文件的音符在时间上相对应的基频点；

计算单元304，用于分别计算每个备选旋律文件与基频序列在每一个相对应时间点上的音高值差值，并分别统计每个备选旋律文件的所有音高值差值的总和；

音高调节单元305，用于将总和最小的备选旋律文件确定为目标旋律文件，并根据目标旋律文件与目标歌曲的原始旋律文件的音高值差值调节目标歌曲的伴奏文件的音高。

本实施例一种优选的实施方式中，第一获取单元301具体用于获取目标歌曲的原始旋律文件，对原始旋律文件的所有音符的音高值加上变换值，得到变换后的旋律文件，分别将原始旋律文件以及变换后的旋律文件作为备选旋律文件。

本实施例一种优选的实施方式中，第一获取单元301具体用于基于十二平均律，将原始旋律文件对应的八度音阶平均分割，得到十二个半音音程，原始旋律文件对应十二个半音音程中的一个半音音程；

按照原始旋律文件对应的半音音程与其它半音音程之间的音程关系，分别对原始旋律文件的所有音符的音高值执行11次的加变换值，得到11个变换后的旋律文件；

其中，每个变换后的旋律文件分别对应十二个半音音程中的一个半音音程。

本实施例一种优选的实施方式中，当目标旋律文件不是原始旋律文件时，音高调节单元305具体用于根据目标旋律文件与原始旋律文件之间的音程关系调节目标歌曲的伴奏文件的音高。

本实施例一种优选的实施方式中，音高调节装置还包括：

判断单元306，用于判断目标旋律文件中音高值差值为0的音符在所有音符中的占比是否大于预设阈值；

音高调节单元305具体用于当目标旋律文件中音高值差值为0的音符在所有音符中的占比大于预设阈值时，执行根据目标旋律文件与目标歌曲的原始旋律文件的音高值差值调节目标歌曲的伴奏文件的音高的步骤；当目标旋律文件中音高值差值为0的音符在所有音符中的占比不大于预设阈值时，不调节伴奏文件的音高。

本实施例一种优选的实施方式中，转换单元303具体用于遍历基频序列的每一个基频点，根据预设算法将每一个基频点的频率值转换为音高值，并从基频序列的所有基频点中确定目标基频点；

计算单元304具体用于获取每个备选旋律文件中与目标基频点在时间上相对应的音符的音高值，计算时间上相对应的目标基频点与音符之间的音高值差值。

本实施例一种优选的实施方式中，备选旋律文件还用于标识目标歌曲的旋律中音符的开始时间及结束时间；

计算单元304具体用于根据每个备选旋律文件中音符的开始时间及结束时间确定与目标基频点在时间上相对应的音符，获取与目标基频点在时间上相对应的音符的音高值。

本实施例中，音高调节装置中各单元所执行的操作与前述图1至图2所示实施例中描述的类似，此处不再赘述。

本实施例中，第一获取单元301获取用户歌声的基频序列，计算单元304计算每个备选旋律文件与基频序列在每一个相对应时间点上的音高值差值，并分别统计每个备选旋律文件的所有音高值差值的总和，音高调节单元305将总和最小的备选旋律文件确定为目标旋律文件，并根据目标旋律文件与目标歌曲的原始旋律文件的音高值差值调节目标歌曲的伴奏文件的音高，由于目标旋律文件所标识的音高与用户歌声的音高的匹配度最高，因此，经过音高调节之后的伴奏可以与用户歌声的音高相契合，形成的混音作品可以获得良好的听感。

下面对本申请实施例中的音高调节装置进行描述。当该音高调节装置为服务器时，其结构示意图如图4所示。请参阅图4，本申请实施例中音高调节装置一个实施例包括：

该音高调节装置400可以包括一个或一个以***处理器(central processing units，CPU)401和存储器405，该存储器405中存储有一个或一个以上的应用程序或数据。

其中，存储器405可以是易失性存储或持久存储。存储在存储器405的程序可以包括一个或一个以上模块，每个模块可以包括对音高调节装置中的一系列指令操作。更进一步地，中央处理器401可以设置为与存储器405通信，在音高调节装置400上执行存储器405中的一系列指令操作。

音高调节装置400还可以包括一个或一个以上电源402，一个或一个以上有线或无线网络接口403，一个或一个以上输入输出接口404，和/或，一个或一个以上操作***，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等。

该中央处理器401可以执行前述图1至图2所示实施例中音高调节装置所执行的操作，具体此处不再赘述。

当该音高调节装置为终端时，其结构示意图如图5所示。请参阅图5，本申请实施例中音高调节装置一个实施例包括：

为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、PDA(Personal DigitalAssistant，个人数字助理)、POS(Point ofSales，销售终端)、车载电脑等任意终端设备，以终端为手机为例：

图5示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。参考图5，手机包括：射频(Radio Frequency，RF)电路510、存储器520、输入单元530、显示单元540、传感器550、音频电路560、无线保真(wireless fidelity，WiFi)模块570、处理器580、以及电源590等部件。本领域技术人员可以理解，图5中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图5对手机的各个构成部件进行具体的介绍：

RF电路510可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器580处理；另外，将设计上行的数据发送给基站。通常，RF电路510包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(LowNoiseAmplifier，LNA)、双工器等。此外，RF电路510还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯***(Global System of Mobile communication，GSM)、通用分组无线服务(General Packet Radio Service，GPRS)、码分多址(Code Division MultipleAccess，CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution，LTE)、电子邮件、短消息服务(Short Messaging Service，SMS)等。

存储器520可用于存储软件程序以及模块，处理器580通过运行存储在存储器520的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器520可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器520可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元530可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元530可包括触控面板531以及其他输入设备532。触控面板531，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板531上或在触控面板531附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板531可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器580，并能接收处理器580发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板531。除了触控面板531，输入单元530还可以包括其他输入设备532。具体地，其他输入设备532可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元540可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元540可包括显示面板541，可选的，可以采用液晶显示器(Liquid Crystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板541。进一步的，触控面板531可覆盖显示面板541，当触控面板531检测到在其上或附近的触摸操作后，传送给处理器580以确定触摸事件的类型，随后处理器580根据触摸事件的类型在显示面板541上提供相应的视觉输出。虽然在图5中，触控面板531与显示面板541是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板531与显示面板541集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器550，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板541的亮度，接近传感器可在手机移动到耳边时，关闭显示面板541和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路560、扬声器561，传声器562可提供用户与手机之间的音频接口。音频电路560可将接收到的音频数据转换后的电信号，传输到扬声器561，由扬声器561转换为声音信号输出；另一方面，传声器562将收集的声音信号转换为电信号，由音频电路560接收后转换为音频数据，再将音频数据输出处理器580处理后，经RF电路510以发送给比如另一手机，或者将音频数据输出至存储器520以便进一步处理。

WiFi属于短距离无线传输技术，手机通过WiFi模块570可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图5示出了WiFi模块570，但是可以理解的是，其并不属于手机的必须构成。

处理器580是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器520内的软件程序和/或模块，以及调用存储在存储器520内的数据，执行手机的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器580可包括一个或多个处理单元；优选的，处理器580可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作***、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器580中。

手机还包括给各个部件供电的电源590(比如电池)，优选的，电源可以通过电源管理***与处理器580逻辑相连，从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

在本申请实施例中，该终端所包括的处理器580可以执行前述图1至图2所示实施例中的功能，此处不再赘述。

本申请实施例还提供了一种计算机存储介质，其中一个实施例包括：该计算机存储介质中存储有指令，该指令在计算机上执行时，使得该计算机执行前述图1至图2所示实施例中音高调节装置所执行的操作。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的***，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，read-only memory)、随机存取存储器(RAM，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

一种音高调节方法，其特征在于，包括：

获取多个备选旋律文件，所述备选旋律文件用于标识目标歌曲的旋律中音符的音高值，每个所述备选旋律文件所标识的音高值不同；

获取用户歌唱所述目标歌曲的歌声的基频序列，并根据预设算法将所述基频序列的目标基频点的频率值转换为音高值，所述目标基频点包括所述基频序列中与所述备选旋律文件的音符在时间上相对应的基频点；

分别计算每个所述备选旋律文件与所述基频序列在每一个相对应时间点上的音高值差值，并分别统计每个所述备选旋律文件的所有音高值差值的总和；

将所述总和最小的备选旋律文件确定为目标旋律文件，并根据所述目标旋律文件与所述目标歌曲的原始旋律文件的音高值差值调节所述目标歌曲的伴奏文件的音高。
根据权利要求1所述的音高调节方法，其特征在于，所述获取多个备选旋律文件，包括：

获取所述目标歌曲的所述原始旋律文件；

对所述原始旋律文件的所有音符的音高值加上变换值，得到变换后的旋律文件；

分别将所述原始旋律文件以及所述变换后的旋律文件作为所述备选旋律文件。
根据权利要求2所述的音高调节方法，其特征在于，所述对所述原始旋律文件的所有音符的音高值加上变换值，得到变换后的旋律文件，包括：

基于十二平均律，将所述原始旋律文件对应的八度音阶平均分割，得到十二个半音音程，所述原始旋律文件对应所述十二个半音音程中的一个半音音程；

按照所述原始旋律文件对应的半音音程与其它所述半音音程之间的音程关系，分别对所述原始旋律文件的所有音符的音高值执行11次的加变换值，得到11个所述变换后的旋律文件；

其中，每个所述变换后的旋律文件分别对应所述十二个半音音程中的一个半音音程。
根据权利要求3所述的音高调节方法，其特征在于，当所述目标旋律文件不是所述原始旋律文件时，所述根据所述目标旋律文件与所述目标歌曲的原始旋律文件的音高值差值调节所述目标歌曲的伴奏文件的音高，包括：

根据所述目标旋律文件与所述原始旋律文件之间的音程关系调节所述目标歌曲的伴奏文件的音高。
根据权利要求1所述的音高调节方法，其特征在于，所述将所述总和最小的备选旋律文件确定为目标旋律文件之后，所述方法还包括：

判断所述目标旋律文件中音高值差值为0的音符在所有音符中的占比是否大于预设阈值；

若是，则执行所述根据所述目标旋律文件与所述目标歌曲的原始旋律文件的音高值差值调节所述目标歌曲的伴奏文件的音高的步骤；

若否，则不调节所述伴奏文件的音高。
根据权利要求1所述的音高调节方法，其特征在于，所述根据预设算法将所述基频序列的目标基频点的频率值转换为音高值，包括：

确定所述基频序列中与所述备选旋律文件的音符在时间上相对应的所述目标基频点；

根据所述预设算法将所述目标基频点的频率值转换为音高值；

所述分别计算每个所述备选旋律文件与所述基频序列在每一个相对应时间点上的音高值差值，包括：

获取每个所述备选旋律文件中与所述目标基频点在时间上相对应的音符的音高值，计算时间上相对应的目标基频点与音符之间的音高值差值。
根据权利要求6所述的音高调节方法，其特征在于，所述备选旋律文件还用于标识所述目标歌曲的旋律中音符的开始时间及结束时间；

所述获取每个所述备选旋律文件中与所述目标基频点在时间上相对应的音符的音高值，包括：

根据每个所述备选旋律文件中音符的开始时间及结束时间确定与所述目标基频点在时间上相对应的音符；

获取与所述目标基频点在时间上相对应的音符的音高值。
一种音高调节装置，其特征在于，包括：

第一获取单元，用于获取多个备选旋律文件，所述备选旋律文件用于标识目标歌曲的旋律中音符的音高值，每个所述备选旋律文件所标识的音高值不同；

第二获取单元，用于获取用户歌唱所述目标歌曲的歌声的基频序列；

转换单元，用于根据预设算法将所述基频序列的目标基频点的频率值转换为音高值，所述目标基频点包括所述基频序列中与所述备选旋律文件的音符在时间上相对应的基频点；

计算单元，用于分别计算每个所述备选旋律文件与所述基频序列在每一个相对应时间点上的音高值差值，并分别统计每个所述备选旋律文件的所有音高值差值的总和；

音高调节单元，用于将所述总和最小的备选旋律文件确定为目标旋律文件，并根据所述目标旋律文件与所述目标歌曲的原始旋律文件的音高值差值调节所述目标歌曲的伴奏文件的音高。
根据权利要求8所述的音高调节装置，其特征在于，所述音高调节装置还包括：

判断单元，用于判断所述目标旋律文件中音高值差值为0的音符在所有音符中的占比是否大于预设阈值；

音高调节单元具体用于当所述目标旋律文件中音高值差值为0的音符在所有音符中的占比大于预设阈值时，执行所述根据所述目标旋律文件与所述目标歌曲的原始旋律文件的音高值差值调节所述目标歌曲的伴奏文件的音高的步骤；当所述目标旋律文件中音高值差值为0的音符在所有音符中的占比不大于预设阈值时，不调节所述伴奏文件的音高。
一种音高调节装置，其特征在于，包括：

处理器、存储器、总线、输入输出设备；

所述处理器与所述存储器、输入输出设备相连；

所述总线分别连接所述处理器、存储器以及输入输出设备；

所述处理器用于获取多个备选旋律文件，所述备选旋律文件用于标识目标歌曲的旋律中音符的音高值，每个所述备选旋律文件所标识的音高值不同，获取用户歌唱所述目标歌曲的歌声的基频序列，并根据预设算法将所述基频序列的目标基频点的频率值转换为音高值，所述目标基频点包括所述基频序列中与所述备选旋律文件的音符在时间上相对应的基频点，分别计算每个所述备选旋律文件与所述基频序列在每一个相对应时间点上的音高值差值，并分别统计每个所述备选旋律文件的所有音高值差值的总和，将所述总和最小的备选旋律文件确定为目标旋律文件，并根据所述目标旋律文件与所述目标歌曲的原始旋律文件的音高值差值调节所述目标歌曲的伴奏文件的音高。
一种计算机存储介质，其特征在于，所述计算机存储介质中存储有指令，所述指令在计算机上执行时，使得所述计算机执行如权利要求1至7中任一项所述的方法。