CN114428600A

CN114428600A - 音轨增益调整方法、装置、智能终端及存储介质

Info

Publication number: CN114428600A
Application number: CN202011178759.0A
Authority: CN
Inventors: 徐小健
Original assignee: Shenzhen TCL New Technology Co Ltd
Current assignee: Shenzhen TCL New Technology Co Ltd
Priority date: 2020-10-29
Filing date: 2020-10-29
Publication date: 2022-05-03

Abstract

本发明公开了一种音轨增益调整方法、装置、智能终端及存储介质，方法包括：获取待处理的音频数据，音频数据包括歌手初始音轨数据和用户初始音轨数据；当用户初始音轨数据的音频增益值符合预设的参与规则时，对用户初始音轨数据和歌手初始音轨数据进行增益处理，生成用户目标音轨数据和歌手目标音轨数据。本发明可自动根据用户初始音轨数据，判断用户是否在进行K歌，从而实现K歌过程中根据用户K歌与否进行音轨增益调整。

Description

音轨增益调整方法、装置、智能终端及存储介质

技术领域

本发明涉及计算机技术领域，尤其涉及音轨增益调整方法、装置、智能终端及存储介质。

背景技术

随着互联网的普及以及网络宽带的提升，各种终端都具有音轨增益调整功能，例如智能手机、智能电视。目前的音轨增益调整有至少两种常规模式，一种是伴唱模式，一种是随唱模式。伴唱模式最后输出的音频中，人声部分主要是用户的声音，主要适用于对歌曲比较熟悉的用户，通过对歌手音轨增益调整减弱以及对用户音轨增益调整增强实现；而随常模式一般最后输出的音频中，人声部分是歌手的声音，主要适用于对歌曲不是非常熟悉的用户，通过对歌手音轨增益调整增强，以及对用户音轨增益调整减弱实现。

这两种模式之间可以进行自由切换，但是目前市面上的切换方式需要用户自己进行切换选择。当用户正在忙着其他事情的时候，模式是固定不变的。例如用户唱到一半，忽然忘词了，想要切换随唱模式听歌手的声音以获得提醒，需要停下手中的工作，在终端上进行模式切换。因此，目前的K歌软件或设备无法自动对歌手音轨和用户音轨进行合适的增益。

发明内容

本发明的主要目的在于提供一种音轨增益调整方法、装置、智能终端及存储介质，旨在解决现有技术中K歌过程中无法自动对歌手音轨和用户音轨进行合适的增益的问题。

为实现上述目的，本发明提供一种音轨增益调整方法，包括：

获取待处理的音频数据，音频数据包括歌手初始音轨数据和用户初始音轨数据；

当用户初始音轨数据的音频增益值符合预设的参与规则时，对用户初始音轨数据和歌手初始音轨数据进行增益处理，生成用户目标音轨数据和歌手目标音轨数据。

此外，为实现上述目的，本发明还提供一种音轨增益调整装置，包括：

获取单元，用于获取待处理的音频数据，音频数据包括歌手初始音轨数据和用户初始音轨数据；

调整单元，用于当用户初始音轨数据的音频增益值符合预设的参与规则时，对用户初始音轨数据和歌手初始音轨数据进行增益处理，生成用户目标音轨数据和歌手目标音轨数据。

此外，为实现上述目的，本发明还提供一种智能终端，智能终端包括存储器、处理器及存储在存储器上并可在处理器上运行的音轨增益调整程序，处理器执行音轨增益调整程序时实现如上的音轨增益调整方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，计算机可读存储介质存储有音轨增益调整程序，音轨增益调整程序被处理器执行时实现如上的音轨增益调整方法的步骤。

在本发明中，先获取待处理的音频数据，然后判断用户初始音轨数据的音频增益值是否符合预设的参与规则，若用户初始音轨数据的音频增益值是否符合预设的参与规则，则说明用户正在参与K歌，因此对用户初始音轨数据和歌手初始音轨数据进行增益处理。因此，通过本发明，可在K歌过程中，根据音频增益值，判断用户是否参与K歌，从而自动对用户初始音轨数据和歌手初始音轨数据进行适应性音轨增益调整处理，以实现K歌过程中的自动增益。

附图说明

图1是本发明音轨增益调整方法提供的较佳实施例的流程图；

图2是本发明音轨增益调整方法提供的较佳实施例中步骤S200的流程图；

图3为本发明音轨增益调整装置的功能单元示意图；

图4为本发明智能终端的较佳实施例的运行环境示意图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚、明确，以下参照附图并举实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明较佳实施例的音轨增益调整方法，如图1所示，音轨增益调整方法包括以下步骤：

步骤S100，智能终端获取待处理的音频数据，音频数据包括歌手初始音轨数据和用户初始音轨数据。

具体地，在本实施例中，该智能终端包括智能电视、智能油烟机。随着智能化的进展，家电也进一步向智能化发展，例如可以自动播放音乐的智能影响，根据用户体温自动进行空气温度调节的智能空调。其中，油烟机也向智能化发展。现在的智能油烟机功能丰富，具有用于与用户进行互动的大型互动屏，还具备智能调节风力档位，远程操控，延时换气，可变灯光等功能。该互动屏除与用户进行交互外，还可提供天气、时间显示，甚至提供音乐、电视、新闻资源、唱歌等娱乐资源。在为便于描述，后续实施例以智能油烟机进行描述。

当用户正在烹饪时，通过语音或按键选择自己想要的歌曲，并开启智能油烟机的唱歌模式。在进入唱歌模式时，智能油烟机开启麦克风，获取用户的声音，并保存为用户初始音轨数据。同时还获取用户选中的歌曲的的人声音轨作为歌手初始音轨数据。将用户初始音轨数据和歌手初始音轨数据作为待进行增益的音频数据保存。然后智能油烟机中的音轨增益调整程序会持续或周期性地获取本地保存且待增益的音频数据。

音频数据还包括背景音轨数据，音频数据的数据类型包括混合音频数据和独立音频数据，其中，独立音频数据为歌手初始音轨数据、背景音轨数据和用户初始音轨数据独立存在的音轨数据，混合音频数据包括由歌手初始音轨数据、背景音轨数据和用户初始音轨数据混合的音轨数据。

具体地，一般歌曲中，除歌手的人声外，还包括背景奏乐，例如吉他音、钢琴音，在本实施例中，待处理的音频数据中包括背景音轨数据。

此外，本实施例中，智能油烟机所获取的音频数据包括两种数据类型，一种是混合音频数据，一种是独立音频数据。其中，混合音频数据是指存在音轨混合的音频数据，例如在很多歌曲库中，歌曲中人声部分和背景音乐部分是混合在一起的，还例如为了统一各个音轨的相对增益，还可能将歌手初始音轨数据、背景音轨数据和用户初始音轨数据进行混合。

进一步地，为能够处理不同类型的音频数据，获取待处理的音频数据之后，还包括：

步骤S110，当音频数据为混合音频数据时，智能终端根据音频数据的频率和各个采样点的增益值，将音频数据拆分，生成歌手初始音轨数据、背景音轨数据和用户初始音轨数据。

具体地，若该音频数据为独立音频数据，则音频数据中的音轨数量为3；若该音频数据为歌手初始音轨数据和背景音轨数据混合，用户初始音轨数据独立的混合音频数据，则音轨数量为2；若该音频数据为歌手初始音轨数据、背景音轨数据和用户初始音轨数据混合的音频数据，则音轨数量为1。因此，根据音频数据中的音轨数量，可判断音频数据是否为混合音频数据。

一般用户需要的是歌手声音变小，而背景声音不便，从而得到自身，因此为更好地实现唱歌效果，需要对各个音轨数据进行单独处理，若音频数据为独立音频数据，则可直接对歌手初始音轨数据和用户初始音轨数据进行处理。若音轨数据为混合音频数据，则需要将混合音频数据进行拆分，得到歌手初始音轨数据、背景音轨数据和用户初始音轨数据，再分别对歌手初始音轨数据和用户初始音轨数据进行增益处理。音频中低频区域为40Hz-80Hz，中频区域为160Hz-1280Hz，高频区域为2560Hz-5120Hz，由于人声一般位于音频数据的低频区域和中频区域，而背景声音，例如各种乐器，位于高频区域，歌曲的人声和用户的人声，由于录音质量的差异，两者在音频体现为增益值不同。因此，可根据该音频数据的频率和采样点的增益值，将混合音频数据进行拆分，生成歌手初始音轨数据、背景音轨数据和用户初始音轨数据。

进一步地，为保障拆分后的音轨的质量的同时，提高拆分效率，拆分步骤包括：

步骤S111，智能终端计算音频数据的中频区域的最大增益值和低频区域的最小增益值之间的第一差值，并将第一差值作为歌手初始音轨数据增益值范围。

具体地，由于歌曲的人声一般是在录音棚录音得到的，因此增益值一般较大。先将该音频数据中的中频区域、低频区域和高频区域划分出来，以将人声和背景音分离，然后计算中频区域的最大增益值和低频区域的最小增益值的差值，将这个差值范围作为歌手初始音轨数据增益值范围。

步骤S112，智能终端计算音频数据的中频区域的中间增益值和最小增益值之间的第二差值，并将第二差值作为用户初始音轨数据增益值范围。

具体地，用户在烹饪时唱歌，由于厨房的隔音效果差，智能油烟机的收音效果较专业设备要差，因此通过麦克风采集到的用户的音频中增益值较小，因此计算上述分离的中频区域的中间增益值和低频区域的最小增益值之间的第二差值，并将其作为用户初始音轨数据增益值范围。其中，中间增益值可以是取中频区域中各个采样点的平均值，也可是各个采样点的增益值之中的中位数，只要可将歌手音轨数据和用户音轨数据区分即可。

步骤S113，智能终端计算音频数据的高频区域的最大增益值和最小增益值之间的第三差值，并将第三差值作为背景音轨数据增益值范围。

具体地，虽然背景音的音频跨度极大，从高频区域到低频区域都存在，但是为了将背景音和人声更好的区分开，背景音轨数据和歌手音轨数据、用户音轨数据之间音质更为干净，仅计算高频区域的最大增益值和最小增益值之间的第三差值，并作为背景音轨数据增益值范围。

步骤S114，智能终端根据歌手初始音轨数据增益值范围、背景音轨数据增益值范围和用户初始音轨数据增益值范围对音频数据进行拆分，分别生成歌手初始音轨数据、背景音轨数据和用户初始音轨数据。

具体地，最后根据歌手初始音轨数据增益值范围、用户初始音轨数据增益值范围，背景音轨数据增益值范围，以及音频数据中的各个采样点的增益值，将其拆分为三个音频数据，并将每一个音频数据单独作为一个音轨数据保存，即生成歌手初始音轨数据、背景音轨数据和用户初始音轨数据。

步骤S200，当用户初始音轨数据的音频增益值符合预设的参与规则时，智能终端对用户初始音轨数据和歌手初始音轨数据进行增益处理，生成用户目标音轨数据和歌手目标音轨数据。

具体地，预设一个参与规则，用于判断用户是否参与了K歌。第一种实现方式中，该参与规则可以包括一个音频增益值阈值，若小于该音频增益值阈值，则判断用户并未参与唱歌；若大于等于该音频增益阈值，则判断用户参与唱歌，因此需要对用户音轨数据和歌手音轨数据进行增益处理。除上述参与规则外，第二种实现方式中，参与规则还可以是判断这一段用户初始音轨数据中的各个采样点的增益值与歌手初始音轨数据中的各个采样点之间的增益值的差距，若差距较大，则判断用户并未在唱歌，而是在说话，或者并未发声，并未参与唱歌；若差距较小，则判断用户在参与唱歌。

若用户初始音轨数据的音频增益值不符合预设的参与规则，说用户并未参与唱歌，则不再对音频数据进行处理，直接输出。

基于上述第二种实现方式，还可进一步判断用户是在说话还是并未发声。若是说话，则可自动降低音量；若并未发生，可直接输出。

当用户初始音轨数据的音频增益值符合参与规则时，说明用户正在参与唱歌，因此需要对用户初始音轨数据和歌手初始音轨数据进行增益处理。在本实施例中第一种增益方式是预设一个用于用户唱歌的第一增益规则，根据第一增益规则，对用户初始音轨数据中的各个采样点进行增益值增加，对歌手初始音轨数据中各个采样点的增益值进行增益值减小，具体的增益值增加或减小方式可以是直接将用户初始音轨数据中的各个采样点的增益值增加一定的数值，而歌手初始音轨数据中各个采样点的增益值减小一定的数值，或者根据用户初始音轨数据中的各个采样点的当前的增益值，增加一定的比例，例如增加10％，而歌手初始音轨数据中各个采样点的增益值对应地减小，等等，由于增加或减小方式很多，在此不再一一赘述。

进一步地，参阅图2，本实施例提供的第二种实现方式中，步骤S200包括：

步骤S210，智能终端计算用户初始音轨数据对应的用户平均增益值，及歌手初始音轨数据对应的歌手平均增益值。

具体地，若用户初始音轨数据的音频增益值符合参与规则，先计算用户初始音轨数据对应的用户平均增益值，及歌手初始音轨数据对应的歌手平均增益值。计算方式可以采用各音轨中各个采样点的增益值，计算对应的平均值，分别作为用户平均增益值和歌手平均增益值。还可以采用各音轨数据中增益值的最大值和最小值，计算对应的平均值，并分别作为用户平均增益值和歌手平均增益值等方式。

进一步地，由于后续需要根据用户平均增益值和歌手平均增益值进行增益，因此若采用常规的计算各个采样点的增益值计算平均值，计算效率较低，且容易忽略增益最大值和增益最小值，因此在本实施例中，步骤S310包括：

步骤S211，智能终端计算用户初始音轨数据的最大增益值和最小增益值的平均值，生成用户初始音轨数据对应的用户平均增益值。

具体地，例如用户初始音轨数据的最大增益值为10，最小增益值为2，若用户初始音轨数据的音频增益值符合参与规则，则计算用户初始音轨数据的最大增益值和用户初始音轨数据的最小增益值的平均值，即(10+2)/2＝6，生成用户初始音轨数据对应的用户平均增益值，也就是6。

步骤S212，智能终端计算歌手初始音轨数据的最大增益值和最小增益值的平均值，生成歌手初始音轨数据对应的歌手平均增益值。

具体地，例如歌手初始音轨数据的最大增益值为15，最小增益值为9，若歌手初始音轨数据的音频增益值符合预设的参与规则，则计算歌手初始音轨数据的最大增益值和歌手初始音轨数据的最小增益值的平均值，即(15+9)/2＝12，生成歌手初始音轨数据对应的歌手平均增益值，也就是12。

步骤S220，当用户平均增益值大于等于歌手平均增益值时，智能终端对歌手初始音轨数据进行增益减弱，生成歌手目标音轨数据；以及，对用户初始音轨数据进行增益增强，生成用户目标音轨数据。

具体地，比较用户平均增益值和歌手平均增益值的大小，从而判断用户平均增益值是否大于等于歌手平均增益值。若用户平均增益值大于等于歌手平均增益值，则说明用户极有可能正在唱歌，因此对歌手初始音轨数据进行增益衰减，而对用户初始音轨数据进行增益减弱，从而增强输出音频中用户音轨数据的增益值，减弱输出音频中歌手音轨数据的增益值，以便用户听到自己的唱歌声音。

进一步地，步骤S220包括：

步骤S221，根据用户平均增益值和预设的主音轨增益值，智能终端逐帧增加用户音轨数据中的各个采样点的增益值，生成用户目标音轨数据。

具体地，若用户平均增益值大于等于歌手平均增益值，则说明用户正在高歌，本实施例第二种实施方式中采用的增益方式是根据预设的主音轨增益值进行增益，其中，主音轨增益值是指最终输出的输出数据中主要的人声的音轨所应当的平均增益值。用户在高歌时，默认之后输出的输出数据中的主要人声音轨是用户音轨。

根据当前处理的用户音轨数据中的用户平均增益值和主音轨增益值，逐帧增加用户音轨数据中的各个采样点的增益值，逐帧增加的方式可以是计算当前的用户平均增益值和主音轨增益值的差值作为被除数，并以用户音轨数据中的一定音频帧的数量作为除数，计算对应的商，然后将该商作为每一音频帧较前一帧所增加的增益值，直至当前音频帧的增益值与主音轨增益值相等。

步骤S222，根据歌手平均增益值和预设的次音轨增益值，智能终端逐帧降低歌手音轨数据中的各个采样点的增益值，生成歌手目标音轨数据。

具体地，次音轨增益调整值是指最终输出的输出数据中次要的人声的音轨所应当的平均增益值。若用户平均增益值大于等于歌手平均增益值，则歌手音轨数据为之后输出数据中的次要音轨。根据当前处理的歌手音轨数据中的歌手平均增益值和次音轨增益值，逐帧减小歌手音轨数据中的各个采样点的增益值，逐帧减小的方式可以是计算当前的歌手平均增益值和次音轨增益值的差值作为被除数，并以歌手音轨数据中的一定音频帧的数量作为除数，计算对应的商，然后将该商作为每一音频帧较前一帧所减小的增益值，直至当前音频帧的增益值与次音轨增益值相等。

步骤S230，当用户平均增益值小于歌手平均增益值时，智能终端对歌手初始音轨数据进行增益增强，生成歌手目标音轨数据；以及，对用户初始音轨数据进行增益减弱，生成用户目标音轨数据。

具体地，若用户平均增益值小于歌手平均增益值，则说明用户并不在高歌，可能仅仅是哼歌，也可能是忘词，因此，此后输出的输出数据中主音轨是歌手音轨数据，对歌手初始音轨数据进行增益增强，对用户初始音轨数据进行增益减弱。故需要对歌手初始音轨数据进行增益增强，对用户初始音轨数据进行增益减弱。本实施例中，对歌手初始音轨数据进行增益增强以及对用户初始音轨数据进行增益减弱的方式，与上述对歌手初始音轨数据进行增益减弱，对用户初始音轨数据进行增益减弱类似，只是处理对象不同。

进一步地，步骤S230包括：

步骤S231根据用户平均增益值和预设的主音轨增益值，智能终端逐帧增加用户音轨数据中的各个采样点的增益值，生成用户目标音轨数据。

步骤S232，根据歌手平均增益值和预设的次音轨增益值，智能终端逐帧降低歌手音轨数据中的各个采样点的增益值，生成歌手目标音轨数据。

由于步骤与上述步骤S331和步骤S332类似，只是增益增强对象由用户音轨数据改为歌手平均增益值，增益减弱对象由歌手平均增益值改为用户音轨数据，因此在此不再陈述。

进一步地，步骤S200之后还包括：

智能终端将歌手目标音轨数据、用户目标音轨数据和背景音轨数据进行混合，生成输出数据并输出。

具体地，在得到歌手目标音轨数据和用户目标音轨数据后，根据每一个音轨的时间，将歌手目标音轨数据、用户目标音轨数据和背景音轨数据进行混合，从而生成输出数据，最后将输出数据传输给音响，以供音响根据输出数据进行音乐播放。

进一步地，如图3所示，基于上述音轨增益调增方法，本发明还提供了一种音轨增益调整装置100，该音轨增益调整装置100包括：

获取单元110，用于获取待处理的音频数据，音频数据包括歌手初始音轨数据和用户初始音轨数据；

调整单元120，用于当用户初始音轨数据的音频增益值符合预设的参与规则时，对用户初始音轨数据和歌手初始音轨数据进行增益处理，生成用户目标音轨数据和歌手目标音轨数据。

其中，音频数据还包括背景音轨数据，音频数据的数据类型包括混合音频数据和独立音频数据，其中，独立音频数据为歌手初始音轨数据、背景音轨数据和用户初始音轨数据独立存在的音轨数据，混合音频数据包括由歌手初始音轨数据、背景音轨数据和用户初始音轨数据混合的音轨数据。

其中，音轨增益调整装置100还包括拆分单元，拆分单元用于当音频数据为混合音频数据时，根据音频数据的频率和各个采样点的增益值，将音频数据拆分，生成歌手初始音轨数据、背景音轨数据和用户初始音轨数据。

其中，拆分单元包括：

第一计算子单元，用于计算音频数据的中频区域的最大增益值和低频区域的最小增益值之间的第一差值，并将第一差值作为歌手初始音轨数据增益值范围；以及

计算音频数据的中频区域的中间增益值和低频区域的最小增益值之间的第二差值，并将第二差值作为用户初始音轨数据增益值范围；以及

计算音频数据的高频区域的最大增益值和高频区域的最小增益值之间的第三差值，并将第三差值作为背景音轨数据增益值范围；

拆分子单元，用于根据歌手初始音轨数据增益值范围、背景音轨数据增益值范围和用户初始音轨数据增益值范围，对音频数据进行拆分，分别生成歌手初始音轨数据、背景音轨数据和用户初始音轨数据。

其中，调整单元120包括：

第二计算子单元，用于计算用户初始音轨数据对应的用户平均增益值，及歌手初始音轨数据对应的歌手平均增益值；

第一调整子单元，用于当用户平均增益值大于等于歌手平均增益值时，对歌手初始音轨数据进行增益减弱，生成歌手目标音轨数据；以及对用户初始音轨数据进行增益增强，生成用户目标音轨数据；或者，

第二调整子单元，用于当用户平均增益值小于歌手平均增益值时，对歌手初始音轨数据进行增益增强，生成歌手目标音轨数据；以及对用户初始音轨数据进行增益减弱，生成用户目标音轨数据。

其中，第二计算子单元具体用于：

计算用户初始音轨数据的最大增益值和最小增益值的平均值，生成用户初始音轨数据对应的用户平均增益值；以及

计算歌手初始音轨数据的最大增益值和最小增益值的平均值，生成歌手初始音轨数据对应的歌手平均增益值。

其中，第一调整子单元具体用于：

根据用户平均增益值和预设的主音轨增益值，逐帧增加用户音轨数据中的各个采样点的增益值，生成用户目标音轨数据；以及

根据歌手平均增益值和预设的次音轨增益值，逐帧降低歌手音轨数据中的各个采样点的增益值，生成歌手目标音轨数据。

其中，第二调整子单元具体用于：

根据用户平均增益值和预设的次音轨增益值，逐帧降低用户音轨数据中的各个采样点的增益值，生成用户目标音轨数据；以及

根据歌手平均增益值和预设的主音轨增益值，逐帧增加歌手音轨数据中的各个采样点的增益值，生成歌手目标音轨数据。

进一步地，如图4所示，基于上述音轨增益调整方法，本发明还相应提供了一种智能终端，智能终端包括处理器10、存储器20及显示器30。图4仅示出了智能终端的部分组件，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

存储器20在一些实施例中可以是智能终端的内部存储单元，例如智能终端的硬盘或内存。存储器20在另一些实施例中也可以是智能终端的外部存储设备，例如智能终端上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，存储器20还可以既包括智能终端的内部存储单元也包括外部存储设备。存储器20用于存储安装于智能终端的应用软件及各类数据，例如安装智能终端的程序代码等。存储器20还可以用于暂时地存储已经输出或者将要输出的数据。在一实施例中，存储器20上存储有音轨增益调整程序40，该音轨增益调整程序40可被处理器10所执行，从而实现本申请中音轨增益调整方法。

处理器10在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)，微处理器或其他数据处理芯片，用于运行存储器20中存储的程序代码或处理数据，例如执行音轨增益调整方法等。

显示器30在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。显示器30用于显示在智能终端的信息以及用于显示可视化的用户界面。智能终端的部件10-30通过***总线相互通信。

在一实施例中，当处理器10执行存储器20中音轨增益调整程序40时实现以下步骤：

其中，获取待处理的音频数据之后，方法还包括：

当音频数据为混合音频数据时，根据音频数据的频率和各个采样点的增益值将音频数据拆分，生成歌手初始音轨数据、背景音轨数据和用户初始音轨数据。

其中，根据音频数据的频率和各个采样点的增益值，将音频数据拆分，生成歌手初始音轨数据、背景音轨数据和用户初始音轨数据，包括：

计算音频数据的中频区域的最大增益值和低频区域的最小增益值之间的第一差值，并将第一差值作为歌手初始音轨数据增益值范围；以及

根据歌手初始音轨数据增益值范围、背景音轨数据增益值范围和用户初始音轨数据增益值范围，对音频数据进行拆分，分别生成歌手初始音轨数据、背景音轨数据和用户初始音轨数据。

其中，对用户初始音轨数据和歌手初始音轨数据进行增益处理，包括：

计算用户初始音轨数据对应的用户平均增益值，及歌手初始音轨数据对应的歌手平均增益值；

当用户平均增益值大于等于歌手平均增益值时，对歌手初始音轨数据进行增益减弱，生成歌手目标音轨数据；以及对用户初始音轨数据进行增益增强，生成用户目标音轨数据；或者，

当用户平均增益值小于歌手平均增益值时，对歌手初始音轨数据进行增益增强，生成歌手目标音轨数据；以及对用户初始音轨数据进行增益减弱，生成用户目标音轨数据。

其中，计算用户初始音轨数据对应的用户平均增益值，及歌手初始音轨数据对应的歌手平均增益值，包括：

计算用户初始音轨数据的最大增益值的最小增益值的平均值，生成用户初始音轨数据对应的用户平均增益值；以及

计算歌手初始音轨数据的最大增益值最小增益值的平均值，生成歌手初始音轨数据对应的歌手平均增益值。

其中，对歌手初始音轨数据进行增益减弱，对用户初始音轨数据进行增益增强，分别生成歌手目标音轨数据和用户目标音轨数据，包括：

其中，对歌手初始音轨数据进行增益增强，对用户初始音轨数据进行增益减弱，分别生成歌手目标音轨数据和用户目标音轨数据，包括：

若用户平均增益值小于歌手平均增益值，则根据用户平均增益值和预设的次音轨增益调整值，逐帧降低用户音轨数据中的各个采样点的增益值，生成用户目标音轨数据；以及

根据歌手平均增益值和预设的主音轨增益调整值，逐帧增加歌手音轨数据中的各个采样点的增益值，生成歌手目标音轨数据。

本发明还提供一种计算机可读存储介质，计算机可读存储介质存储有音轨增益调整程序，音轨增益调整程序被处理器执行时实现如上的音轨增益调整方法的步骤。

当然，本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关硬件(如处理器，控制器等)来完成，的程序可存储于一计算机可读取的计算机可读存储介质中，程序在执行时可包括如上述各方法实施例的流程。其中的计算机可读存储介质可为存储器、磁碟、光盘等。

应当理解的是，本发明的应用不限于上述的举例，对本领域普通技术人员来说，可以根据上述说明加以改进或变换，所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims

1.一种音轨增益调整方法，其特征在于，包括：

获取待处理的音频数据，所述音频数据包括歌手初始音轨数据和用户初始音轨数据；

当所述用户初始音轨数据的音频增益值符合预设的参与规则时，对所述用户初始音轨数据和所述歌手初始音轨数据进行增益处理，生成用户目标音轨数据和歌手目标音轨数据。

2.根据权利要求1所述的方法，其特征在于，所述音频数据还包括背景音轨数据，所述音频数据的数据类型包括混合音频数据和独立音频数据，其中，所述独立音频数据为所述歌手初始音轨数据、所述背景音轨数据和所述用户初始音轨数据独立存在的音轨数据，所述混合音频数据包括由所述歌手初始音轨数据、所述背景音轨数据和所述用户初始音轨数据混合的音轨数据。

3.根据权利要求2所述的方法，其特征在于，所述获取待处理的音频数据之后，所述方法还包括：

当所述音频数据为所述混合音频数据时，根据所述音频数据的频率和各个采样点的增益值将所述音频数据拆分，生成所述歌手初始音轨数据、所述背景音轨数据和所述用户初始音轨数据。

4.根据权利要求3所述的方法，其特征在于，所述根据所述音频数据的频率和各个采样点的增益值将所述音频数据拆分，生成所述歌手初始音轨数据、所述背景音轨数据和所述用户初始音轨数据，包括：

计算所述音频数据的中频区域的最大增益值和低频区域的最小增益值之间的第一差值，并将所述第一差值作为歌手初始音轨数据增益值范围；以及

计算所述音频数据的中频区域的中间增益值和低频区域的最小增益值之间的第二差值，并将所述第二差值作为用户初始音轨数据增益值范围；以及

计算所述音频数据的高频区域的最大增益值和高频区域的最小增益值之间的第三差值，并将所述第三差值作为背景音轨数据增益值范围；

根据所述歌手初始音轨数据增益值范围、所述背景音轨数据增益值范围和所述用户初始音轨数据增益值范围对所述音频数据进行拆分，分别生成所述歌手初始音轨数据、所述背景音轨数据和所述用户初始音轨数据。

5.根据权利要求1-4中任意一项所述的方法，其特征在于，所述对所述用户初始音轨数据和所述歌手初始音轨数据进行增益处理，生成用户目标音轨数据和歌手目标音轨数据，包括：

计算所述用户初始音轨数据对应的用户平均增益值，及所述歌手初始音轨数据对应的歌手平均增益值；

当所述用户平均增益值大于等于所述歌手平均增益值时，对所述歌手初始音轨数据进行增益减弱，生成歌手目标音轨数据，以及对所述用户初始音轨数据进行增益增强，生成用户目标音轨数据；或者，

当所述用户平均增益值小于所述歌手平均增益值时，对所述歌手初始音轨数据进行增益增强，生成歌手目标音轨数据，以及对所述用户初始音轨数据进行增益减弱，生成用户目标音轨数据。

6.根据权利要求5所述的方法，其特征在于，所述计算所述用户初始音轨数据对应的用户平均增益值，及所述歌手初始音轨数据对应的歌手平均增益值，包括：

计算所述用户初始音轨数据的最大增益值和最小增益值的平均值，生成所述用户初始音轨数据对应的用户平均增益值；以及

计算所述歌手初始音轨数据的最大增益值和最小增益值的平均值，生成所述歌手初始音轨数据对应的歌手平均增益值。

7.根据权利要求5所述的方法，其特征在于，所述对所述歌手初始音轨数据进行增益减弱，生成歌手目标音轨数据，以及对所述用户初始音轨数据进行增益增强，生成用户目标音轨数据，包括：

根据所述用户平均增益值和预设的主音轨增益值，逐帧增加所述用户音轨数据中的各个采样点的增益值，生成所述用户目标音轨数据；以及

根据所述歌手平均增益值和预设的次音轨增益值，逐帧降低所述歌手音轨数据中的各个采样点的增益值，生成所述歌手目标音轨数据。

8.根据权利要求5所述的方法，其特征在于，所述对所述歌手初始音轨数据进行增益增强，生成歌手目标音轨数据，以及对所述用户初始音轨数据进行增益减弱，生成用户目标音轨数据，包括：

根据所述用户平均增益值和预设的次音轨增益值，逐帧降低所述用户音轨数据中的各个采样点的增益值，生成所述用户目标音轨数据；以及

根据所述歌手平均增益值和预设的主音轨增益值，逐帧增加所述歌手音轨数据中的各个采样点的增益值，生成所述歌手目标音轨数据。

9.一种音轨增益调整装置，其特征在于，包括：

获取单元，用于获取待处理的音频数据，所述音频数据包括歌手初始音轨数据和用户初始音轨数据；

调整单元，用于当所述用户初始音轨数据的音频增益值符合预设的参与规则时，对所述用户初始音轨数据和所述歌手初始音轨数据进行增益处理，生成用户目标音轨数据和歌手目标音轨数据。

10.一种智能终端，其特征在于，所述智能终端包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的音轨增益调整程序，所述处理器执行所述音轨增益调整程序时实现如权利要求1-8任一项所述的音轨增益调整方法的步骤。

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有音轨增益调整程序，所述音轨增益调整程序被处理器执行时实现如权利要求1-8任一项所述的音轨增益调整方法的步骤。