CN107967921B

CN107967921B - 会议***的音量调节方法及装置

Info

Publication number: CN107967921B
Application number: CN201711262051.1A
Authority: CN
Inventors: 尚德建; 胡小鹏; 顾振华
Original assignee: Suzhou Keda Technology Co Ltd
Current assignee: Suzhou Keda Technology Co Ltd
Priority date: 2017-12-04
Filing date: 2017-12-04
Publication date: 2021-09-07
Anticipated expiration: 2037-12-04
Also published as: CN107967921A

Abstract

本发明公开了一种会议***的音量调节方法及装置，其中，方法包括以下步骤：获取会议***中会议终端传输的音频数据；获取所述音频数据的音量和预设音量；利用所述音频数据的音量以及所述预设音量，确定出音量变化值；根据所述音量变化值以及最大音量增益值之间的大小关系，确定出音量调节量；按照所述音量调节量对所述音频数据的音量进行调节。通过设置音量的最大增益值，用于避免音量调节所产生的声音掩蔽效应，使得会议***中会议终端传输的音频数据能够顺利进行会议混音，不会出现大声音掩蔽掉小声音的情况，而且声音清晰；同时保证了在音量调节过程中会议***的其他功能模块不受影响，提高了***的实用性。

Description

会议***的音量调节方法及装置

技术领域

本发明涉及通信及移动互联网技术领域，具体涉及一种会议***的音量调节方法及装置。

背景技术

随着社会的进步、科技的发展，人与人之间的沟通越来越频繁，而沟通的方式也从信件发展到电话再到视频会议***慢慢的发生着变化。但是，除信件外，其余沟通方式中承载着信息的绝大部分是音频和视频数据，而不论是音频还是视频，声音在沟通中地位举足轻重。

以视频会议***为例，目前大型的会议***均是以中心点作为处理中心提供服务的形式。在视频会议过程中，大量的音频数据传输到中心点处理器进行混音的处理，这些音频数据的音量有的高有的低，这可能与发言人的音量或麦克风的采集有关系。然而，这些高低不同的音量在混音时就会出现音频掩蔽效应，即高音量的音频将低音量的音频掩蔽，从而导致低音量的音频无法被与会者听到，这样就会错失信息。

为解决上述技术问题，现有会议***已经采用了针对音量的自动增益，即通过自动增益固定的将声音调整到某个大小，然而将所有音频的音量调整为统一的大小，会导致中心点无法分辨各音频数据的发送方，从而对后期的音频混音带来不便。

另外，中国专利公开号为CN1885711A的专利文件中，公开了一种通过对解码后的数据进行音量范围的划分，并根据划分结果进行对应于各个范围的音量调整的自动增益方法。其所公开的自动增益方法的侧重点在于如何区分解码后数据的音量范围，并未对这些不同的音量范围的数据如何调整大小做出描述，有可能会导致调整后的各个音量范围的音频信号之间会出现音频掩蔽效应，影响音频的处理效果。

发明内容

有鉴于此，本发明实施例提供了一种会议***的音量调节方法及装置，以解决现有技术中不同音量的音频信号出现音频掩蔽效应，从而导致音频信息丢失的问题。

本发明第一方面提供了一种会议***的音量调节方法，包括以下步骤：

获取会议***中会议终端传输的音频数据；

获取所述音频数据的音量和预设音量；

利用所述音频数据的音量以及所述预设音量，确定出音量变化值；

根据所述音量变化值以及最大音量增益值之间的大小关系，确定出音量调节量；

按照所述音量调节量对所述音频数据的音量进行调节。

可选地，利用所述音频数据的音量以及所述预设音量，确定出音量变化值，包括：

计算所述音频数据的音量与预设音量的差值；

利用所述差值确定出所述音量变化值。

可选地，采用如下公式计算所述音量变化值：

V_a＝a₁×V_g ²+a₂×V_g+a₃；

其中，V_a为所述音量变化值；V_g为所述音频数据的音量与预设音量的差值；a₁，a₂，a₃为常数。

可选地，所述根据所述音量变化值以及最大音量增益值之间的大小关系确定出音量调节量，包括：

判断所述音量变化值是否大于所述最大音量增益值；

当所述音量变化值大于所述最大音量增益值时，所述音量调节量为所述最大音量增益值；

当所述音量变化值小于或等于所述最大音量增益值时，所述音量调节量为所述音量变化值。

可选地，采用如下公式计算所述音频数据的音量：

其中，V_c为所述音频数据的音量；V_i为对所述音频数据进行采样的采样值；N为采样点的个数。

本发明第二方面提供一种会议***的音量调节装置，包括：

第一获取单元，用于获取会议***中会议终端传输的音频数据；

第二获取单元，用于获取所述音频数据的音量和预设音量；

第一确定单元，用于利用所述音频数据的音量以及所述预设音量，确定出音量变化值；

第二确定单元，用于根据所述音量变化值以及最大音量增益值之间的大小关系，确定出音量调节量；

音量调节单元，按照所述音量调节量对所述音频数据的音量进行调节。

可选地，所述第一确定单元包括：

计算子单元，用于计算所述音频数据的音量与预设音量的差值；

确定子单元，用于利用所述差值确定出所述音量变化值。

可选地，采用如下公式计算所述音量变化值：

V_a＝a₁×V_g ²+a₂×V_g+a₃；

本发明第三方面提供一种媒体平台，包括至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行本发明第一方面或第一方面中任一项所述的会议***的音量调节方法。

本发明第四方面提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令用于使计算机执行本发明第一方面或第一方面中任一项所述的会议***的音量调节方法。

本发明提供的技术方案，具有如下优点：

1.本发明实施例提供的会议***的音量调节方法，通过对将音频数据的音量的调节分为两部分：音量变化值以及音量调节量，防止仅针对音量变化值进行调节时，调节量过大所导致的二次声音掩蔽效应；即本发明通过设置音量的最大增益值，用于避免音量调节所产生的声音掩蔽效应，使得会议***中会议终端传输的音频数据能够顺利进行会议混音，不会出现大声音掩蔽掉小声音的情况，而且声音清晰；同时保证了在音量调节过程中会议***的其他功能模块不受影响，提高了***的实用性。

2.本发明实施例提供的会议***的音量调节方法，通过将音频数据的音量与预设音量进行比较后，确定出音量变化值，即通过与预设音量的比较初次确认音量调节的范围，为精确的音量调节提供了调节基础，使得调节后的音量能够满足参会者的听觉感受，提高会议***的音质和会议效果。

3.本发明实施例提供的会议***的音量调节方法，通过在音量变化值的基础上，确定音量调节量，使得调节后的音频数据能够顺利进入会议混音，不会出现音频掩蔽效应。

4.本发明实施例提供的会议***的音量调节方法，通过采样方式确定出音频数据的音量，便于后续的分析，简化计算量，提高了计算精度。

5.本发明实施例提供的会议***的音量调节装置，通过设置音量的最大增益值，用于避免音量调节所产生的音频掩蔽效应，使得会议***中会议终端传输的音频数据能够顺利进行会议混音，不会出现大声音掩蔽掉小声音的情况，而且声音清晰；同时保证了在音量调节过程中会议***的其他功能模块不受影响，提高了***的实用性。

附图说明

通过参考附图会更加清楚的理解本发明的特征和优点，附图是示意性的而不应理解为对本发明进行任何限制，在附图中：

图1示出了本发明实施例中应用场景的一个具体示意的结构示意图；

图2示出了本发明实施例1中会议***的音量调节方法的一个具体示意的方法流程图；

图3示出了本发明实施例2中会议***的音量调节方法的一个具体示意的方法流程图；

图4示出了本发明实施例3中会议***的音量调节方法的一个具体示意的方法流程图；

图5示出了本发明实施例4中会议***的音量调节装置的一个具体示意的结构图；

图6示出了本发明实施例5中媒体平台的一个具体示意的结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要说明的是，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

此外，下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

图1示出了本发明实施例的应用场景示意图。会议***包括终端侧和媒体平台，其中终端可以为多台。图1中示出了包括两个会议终端的情况，即会议***包括媒体平台、第一终端和第二终端。其中，第一终端和第二终端可以是音频码流采集终端，例如智能手机、平板电脑等移动客户端，也可以是专用的音视频会议***终端。

通常情况下，会议***的工作过程如下，终端侧实时采集与会人员的音频数据，将其转换成音频帧封装后发送给媒体平台，媒体平台对所接收的音频帧进行音频处理后，发送给其他终端。

实施例1

本实施例提供一种会议***的音量调节方法，可用于媒体平台中。如图2所示，该方法包括以下步骤：

步骤S11，获取会议***中会议终端传输的音频数据。

会议***中各个会议终端实时采集与会者的音频数据，并将采集到的音频数据发送给会议***中的媒体平台；或者，在离线音频数据的音量调节情况下，可以将若干音频数据预先存储在各个会议终端的存储器中；只需保证媒体平台能够获取到音频数据，可用于进行音量调节即可。

步骤S12，获取音频数据的音量和预设音量。

媒体平台获取到各音频数据的音量，以及预设音量。其中，预设音量是使用者预设设置的，该预设音量设置的原则是使得用户听着舒服即可，可以根据实际会议***的使用环境进行设置。需要说明的是，预设音量可以是一个具体的数值，也可以是一个数值范围。

此外，关于音频数据的音量的获取，媒体平台可以对各音频数据进行采样，根据各个采样值的大小进行音频数据的音量的计算；也可以是媒体平台通过统计分析方法，对音频数据的音量进行处理，从而得出音频数据的音量。

步骤S13，利用音频数据的音量以及预设音量，确定出音量变化值。

媒体平台可以通过比较音频数据的音量与预设音量之间的大小关系，确定出音量变化值；例如，若音频数据的音量大于预设音量，则需要将音量数据的音量调小，即确定出的音量变化值为负；若音频数据的音量小于预设音量，则需要将音量数据的音量调大，即确定出的音量变化值为正。

媒体平台也可以在计算出音频数据的音量与预设音量之间的差值之后，以该差值为基础，通过预设公式计算出音量变化值。

媒体平台也可以将音量数据的音量结合其他参数(例如，会议场景所对应的权值)，与预设音量进行比较，确定出音量变化值。例如，可以在音频数据的音量的基础上乘以会场景所对应的权值，利用相乘之后的结果与预设音量进行比较，确定出音量变化值。

步骤S14，根据音量变化值以及最大音量增益值之间的大小关系，确定出音量调节量。

媒体平台在确定出音量变化值后，可以将该音量变化值直接与预设的最大音量增益值进行比较，确定出音量调节量。通过设置最大音量增益值是用于防止在步骤S13中确定出的音量变化值过大，会出现基于该音量变化值调节后的音频再次出现音频掩蔽效应，进而影响会议质量。

媒体平台也可以在音量变化值的基础上，对音频变化值进行二次处理后，例如，可以按照对应会议终端发言者的自身特征(性别，年龄等)，对音量变化值进行对应权值的处理之后，再与最大音量增益值进行比较。

步骤S15，按照音量调节量对音频数据的音量进行调节。

媒体平台按照步骤S14中确定出的音量调节量对各音频数据的音量进行调节后，并将调节后的音频数据进行混音处理后发送给各个会议终端。

通过设置音量的最大增益值，用于避免音量调节所产生的声音掩蔽效应，使得会议***中会议终端传输的音频数据能够顺利进行会议混音，不会出现大声音掩蔽掉小声音的情况，而且声音清晰；同时保证了在音量调节过程中会议***的其他功能模块不受影响，提高了***的实用性。

实施例2

本实施例提供一种会议***的音量调节方法，可用于媒体平台中。如图3所示，该方法包括以下步骤：

步骤S21，获取会议***中会议终端传输的音频数据。

会议***中的会议终端实时采集参会人员的音频，对该音频信息进行采样、量化和编码转换为离散的数字音频码流。在将数字音频码流封装成数据帧进行发送时，是根据传输协议进行的。可采用的音频传输协议有基于HTTP的流媒体传输协议(HTTP LiveStreaming)、实时消息传送协议(Real Time Messaging Protocol，简称为RTMP)以及实时传输协议(Real-time Transport Protocol，简称为RTP)等等。可选地，可以根据RTP协议进行音频帧的封装。

媒体平台获取到会议终端传输的音频帧后，对音频帧进行解码后得到对应会议终端的音频数据，并基于该音频数据进行后续的音频音量的调节处理。

步骤S22，获取音频数据的音量和预设音量。

媒体平台在获取到会议终端的音频数据后，通过采样方式获取到对应音频数据的音量。具体地，在一定时间间隔内，对音频数据进行采样，例如，在一定时间内设置N个采样点，对该音频数据进行采样，得到N个采样值，可以通过如下公式计算音频数据的音量：

上述公式中，i的具体取值取决于会议***的音量调节精度，精度要求较高，i的最大值为N-1；精度要求不高，i的最大值可以小于N-1。

此外，预设音量为具体数值，预设存储在媒体平台的存储器中，该预设音量的具体数值只需保证能够使得与会者具有较好的用户体验即可。

步骤S23，利用音频数据的音量以及预设音量，确定出音量变化值。

媒体平台在利用采样方式获取到音频数据的音量后，结合预设音量，确定出音量变化值。具体地，包括以下步骤：

步骤S231，计算音频数据的音量与预设音量的差值。

媒体平台采用如下公式，计算音频数据的音量与预设音量之间的差值V_g，

V_g＝V_c-V_aim；

其中，V_c为所述音频数据的音量；V_aim为所述预设音量。

当V_g＞0时，表示音频数据的音量大于预设音量，需要减小音频数据的音量；

当V_g＜0时，表示音频数据的音量小于预设音量，需要增大音频数据的音量。

步骤S232，利用差值确定出音量变化值。

媒体平台在确定出差值V_g之后，利用差值V_g来确定出音量变化值V_a，具体地，可以采用如下公式计算：

V_a＝a₁×V_g ²+a₂×V_g+a₃；

上述公式所表现出的音量变化值与差值之间为抛物线的对应关系，即差值越大，对应的音量变化值越大。

需要说明的是，上述公式中a₁，a₂，a₃三个系数取值跟预设音量大小以及音量变化的快慢有关。具体数值是经过一些测试进行估算的，一般地，这里a₁可以取(0，2)，a₂可以取值(0，1)，a₃可以取值为(-1，1)。

步骤S24，根据音量变化值以及最大音量增益值之间的大小关系，确定出音量调节量。

媒体平台根据步骤S23中确定出的音量变化值，计算该音量变化值与最大音量增益值之间的大小关系，并根据计算结果，确定音量调节量的具体数值。

其中，最大音量增益值用于表示音量调节的最大值。通过设置最大音量增益值是用于防止在步骤S13中确定出的音量变化值过大，会出现基于该音量变化值调节后的音频再次出现音频掩蔽效应，进而影响会议质量。

步骤S25，按照音量调节量对音频数据的音量进行调节。

媒体平台按照步骤S24中确定出的音量调节量对各音频数据的音量进行调节，并将调节后的音频数据进行混音处理后发送给各个会议终端。

实施例3

本实施例提供一种会议***的音量调节方法，可用于媒体平台中。如图4所示，该方法包括以下步骤：

步骤S31，获取会议***中会议终端传输的音频数据。

与实施例2步骤S21相同，在此不再赘述。

步骤S32，获取音频数据的音量和预设音量。

与实施例2步骤S22相同，在此不再赘述。

步骤S33，利用音频数据的音量以及预设音量，确定出音量变化值。

与实施例2步骤S23相同，在此不再赘述。

步骤S34，根据音量变化值以及最大音量增益值之间的大小关系，确定出音量调节量。

媒体平台通过比较音量变化值与最大音量增益值之间的大小关系，以确定音量调节量的大小。具体地，包括以下步骤：

步骤S341，判断音量变化值是否大于最大音量增益值。若音量变化值大于最大音量增益值，则执行步骤S342；否则，执行步骤S343。

媒体平台通过计算音量变化值与最大音量增益值的差值，若该差值大于零，则表示音量变化值大于最大音量增益值；否则，表示音量变化值小于或等于最大音量变化值。

步骤S342，音量调节量为最大音量增益值。

媒体平台确定出音量变化值大于最大音量增益值，即表示音量变化值已经超出预设的最大音量调节量，此时，将该最大音量增益值作为音量调节量，一方面可以保证该媒体平台能够按照音量变化的需求最大范围地设置音量调节量；另一方面可以避免音量调节量的过大而导致的调节后的音频会出现音频掩蔽效应。

步骤S343，音量调节量为音量变化值。

媒体平台确定出音量变化值小于或等于最大音量增益值，即表示音量变化量满足音量增益值的需求，此时，将该音量变化值作为音量调节量。

步骤S35，按照音量调节量对音频数据的音量进行调节。

媒体平台按照步骤S34中确定出的音量调节量对各音频数据的音量进行调节，具体地，调节后的音频数据的音量为：音频数据的音量与音量调节量之和。

未在本实施例中详细描述的会议***的音量调节方法，请参照实施例2，在此不再赘述。

实施例4

本实施例提供一种会议***的音量调节装置，可用于执行实施例1至实施例3中的会议***的音量调节方法。如图5所示，该装置包括：

第一获取单元51，用于获取会议***中会议终端传输的音频数据。

第二获取单元52，用于获取所述音频数据的音量和预设音量。

第一确定单元53，用于利用所述音频数据的音量以及所述预设音量，确定出音量变化值。

第二确定单元54，用于根据所述音量变化值以及最大音量增益值之间的大小关系，确定出音量调节量。

音量调节单元55，按照所述音量调节量对所述音频数据的音量进行调节。

作为本实施例的一种可选实施方式，其中，第一确定单元53包括：

计算子单元，用于计算音频数据的音量与预设音量的差值。

确定子单元，用于利用差值确定出音量变化值。

作为本实施例的另一种可选实施方式，其中，第二确定单元54包括：

判断子单元，用于判断音量变化值是否大于最大音量增益值。

第一确定子单元，用于确定音量调节量为最大音量增益值。

第二确定子单元，用于确定音量调节量为音量变化值。

实施例5

图6是本发明实施例提供的媒体平台的硬件结构示意图，如图6所示，该装置包括一个或多个处理器61以及存储器62，图6中以一个处理器61为例。

处理器61与存储器62可以通过总线或者其他方式连接，图6中以通过总线连接为例。

处理器61可以为中央处理器(Central Processing Unit，CPU)。处理器61还可以为其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片，或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器62作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块，如本发明实施例中的会议***的音量调节方法对应的程序指令/模块。处理器61通过运行存储在存储器62中的非暂态软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述实施例中的会议***的音量调节方法。

存储器62可以包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需要的应用程序；存储数据区可存储根据会议***的音量调节装置的使用所创建的数据等。此外，存储器62可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中，存储器62可选包括相对于处理器61远程设置的存储器，这些远程存储器可以通过网络连接至视频摘要生成装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

所述一个或者多个模块存储在所述存储器62中，当被所述一个或者多个处理器61执行时，执行实施例1至实施例3中任一项所述的会议***的音量调节方法。

上述产品可执行本发明实施例所提供的方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，具体可参见如图1所示的实施例中的相关描述。

实施例6

本发明实施例还提供了一种非暂态计算机存储介质，所述计算机存储介质存储有计算机可执行指令，该计算机可执行指令可执行实施例1至实施例3中任一项所述的会议***的音量调节方法。其中，所述存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory，ROM)、随机存储记忆体(Random Access Memory，RAM)、快闪存储器(FlashMemory)、硬盘(Hard Disk Drive，缩写：HDD)或固态硬盘(Solid-State Drive，SSD)等；所述存储介质还可以包括上述种类的存储器的组合。

本领域技术人员可以理解，实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。

虽然结合附图描述了本发明的实施例，但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型，这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims

1.一种会议***的音量调节方法，其特征在于，包括以下步骤：

获取会议***中会议终端传输的音频数据；

获取所述音频数据的音量和预设音量；

按照所述音量调节量对所述音频数据的音量进行调节；

其中，所述利用所述音频数据的音量以及所述预设音量，确定出音量变化值包括：

比较所述音频数据的音量与所述预设音量的大小关系，确定所述音量变化值；

或，

计算所述音频数据的音量与所述预设音量的差值，并以所述差值为基础，通过预设公式计算出所述音量变化值；

或，

将所述音频数据的音量结合预设参数之后再与所述预设音量进行比较，确定出所述音量变化值。

2.根据权利要求1所述的音量调节方法，其特征在于，利用所述音频数据的音量以及所述预设音量，确定出音量变化值，包括：

计算所述音频数据的音量与预设音量的差值；

利用所述差值确定出所述音量变化值。

3.根据权利要求2所述的音量调节方法，其特征在于，采用如下公式计算所述音量变化值：

V_a＝a₁×V_g ²+a₂×V_g+a₃；

4.根据权利要求1至3中任一项所述的音量调节方法，其特征在于，所述根据所述音量变化值以及最大音量增益值之间的大小关系确定出音量调节量，包括：

判断所述音量变化值是否大于所述最大音量增益值；

5.根据权利要求1至4中任一项所述的音量调节方法，其特征在于，采用如下公式计算所述音频数据的音量：

6.一种会议***的音量调节装置，其特征在于，包括：

第二获取单元，用于获取所述音频数据的音量和预设音量；

音量调节单元，按照所述音量调节量对所述音频数据的音量进行调节；

或，

7.根据权利要求6所述的音量调节装置，其特征在于，所述第一确定单元包括：

确定子单元，用于利用所述差值确定出所述音量变化值。

8.根据权利要求7所述的音量调节装置，其特征在于，采用如下公式计算所述音量变化值：

V_a＝a₁×V_g ²+a₂×V_g+a₃；

9.一种媒体平台，其特征在于，包括至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行权利要求1至5中任一项所述的会议***的音量调节方法。

10.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令用于使计算机执行权利要求1至5中任一项所述的会议***的音量调节方法。