CN113257256A - 一种语音处理方法、会议一体机、***及存储介质 - Google Patents
一种语音处理方法、会议一体机、***及存储介质 Download PDFInfo
- Publication number
- CN113257256A CN113257256A CN202110793618.8A CN202110793618A CN113257256A CN 113257256 A CN113257256 A CN 113257256A CN 202110793618 A CN202110793618 A CN 202110793618A CN 113257256 A CN113257256 A CN 113257256A
- Authority
- CN
- China
- Prior art keywords
- conference
- voice signal
- latest
- voice
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/40—Support for services or applications
- H04L65/403—Arrangements for multi-party communication, e.g. for conferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/80—Responding to QoS
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种语音处理方法、智能会议一体机、***、存储介质,包括以下步骤:步骤S1、通过预设方式连接多个会议终端,获取所述会议终端的语音信号;所述语音信号通过会议终端采集;步骤S2、将所述语音信号按时间顺序线性逐次叠加,每次叠加均得到最新混音值;判断所述最新混音值是否处于预设范围内,若所述最新混音值处于预设范围内,则执行步骤S3;若所述最新混音值不处于预设范围内,则调节所述语音信号压缩权重,直至所述最新混音值处于预设范围,执行步骤S3;步骤S3、输出所述最新混音值至会议终端。本发明可降低语音信号计算压力,提高智能会议的通讯效果,满足智能会议的需求。
Description
技术领域
本发明涉及语音处理技术领域,尤其涉及一种语音处理方法、会议一体机、***及存储介质。
背景技术
随着通信技术的发展,企业的会议模式也在发生着变化。从原先的面对面的传统模式,发展为具有多种功能的智能会议。智能会议突破地域间的限制,随时随地实现远程交流,同时具有较强的专业性,能够提供稳定的音频/视频传输,优化企业信息沟通模式,提高了员工内部沟通效率。
目前的智能会议,一般是由一台会议主机与其余会议终端通信。在智能会议举行过程中,需要涉及多个会议终端发言,由会议主机与多个会议终端建立网络连接,接收各个会议终端的声音。但现有的会议主机采集声音的效果不理想,声音降噪处理效果较差,难以满足会议需求。
发明内容
为了克服现有技术的不足,本发明的目的在于提供一种语音处理方法,提高智能会议的通讯效果。
本发明的目的之二在于提供一种智能会议一体机,执行上述一种语音处理方法,与多个会议终端连接,并合成多个会议终端的声音,提高智能会议的通讯效果。
本发明的目的之三在于提供一种智能会议***,包括会议主机及多个会议终端,会议主机采集并合成多个会议终端的声音,提高智能会议的通讯效果。
本发明的目的之四在于提供一种计算机可读存储介质,执行上述一种语音处理方法,与多个会议终端连接,并合成多个会议终端的声音,提高智能会议的通讯效果。
本发明的目的之一采用如下技术方案实现:
一种语音处理方法,应用于智能会议一体机,本方法包括以下步骤:
步骤S1、通过预设方式连接多个会议终端,获取所述会议终端的语音信号;所述语音信号通过会议终端采集;
步骤S2、将所述语音信号按时间顺序线性逐次叠加,每次叠加均得到最新混音值;判断所述最新混音值是否处于预设范围内,若所述最新混音值处于预设范围内,则执行步骤S3;若所述最新混音值不处于预设范围内,则调节所述语音信号压缩权重,直至所述最新混音值处于预设范围,执行步骤S3;
步骤S3、输出所述最新混音值至会议终端;
所述步骤S2中调节所述语音信号的压缩权重包括以下步骤:
步骤S21、判断连接的会议终端数量是否超过阈值,若不超过第一阈值,则通过平均调整权重法调整所述压缩权重;若超过阈值,则通过静音检测能量法调整所述压缩权重;所述平均调整权重法调整所述压缩权重,具体为通过以下公式:
进一步的,所述步骤S21通过静音检测能量法指所述压缩权重,具体包括:
获取所述语音信号的强度,将所述语音信号中第一强度范围的语音信号采用第一压缩比例压缩,第二强度范围的语音信号采用第二压缩比例压缩;
将压缩后的语音信号按照强度从大到小的顺序排列,选择强度前三的语音信号通过平均调整权重法调整所述压缩权重。
进一步的,所述第一强度范围大于第二强度范围,所述第一压缩比例大于第二压缩比例。
进一步的,所述步骤S1还包括以下步骤:
步骤S11、对所述语音信号预处理,并判断所述语音信号是否为有效信号;若所述语音信号为有效信号,则执行步骤S2;若所述语音信号非有效信号,则将所述语音信号过滤。
进一步的,所述步骤S1中预设方式包括接收所述会议终端发起的连接请求或通过二维码向所述会议终端发出连接请求。
本发明的目的之二采用如下技术方案实现:
一种智能会议一体机,包括多个处理器、存储器及存储于所述存储器上并可在所述处理器上运行的计算机程序,多个处理器执行所述计算机程序时实现如上任意一项所述的一种语音处理方法。
本发明的目的之三采用如下技术方案实现:
一种智能会议***,包括如上所述的一种智能会议一体机及若干会议终端,所述智能会议一体机与所述会议终端连接。
本发明的目的之四采用如下技术方案实现:
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被执行时实现如上任意一项所述的一种语音处理方法。
相比现有技术,本发明的有益效果在于:
本发明提供了一种语音处理方法、智能会议一体机、智能会议***及计算机可读存储介质,获取会议终端自身采集的语音信号,将语音信号按照时间顺序线性逐次叠加,每次叠加均得到最新混音值,压缩所述语音信号的压缩权重,直至所述最新混音值处于预设范围内,再由会议终端进行播放,降低语音信号计算压力,提高智能会议的通讯效果,满足智能会议的需求。
附图说明
图1为本发明所提供实施例一的流程示意图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
实施例一
如图1所示,本申请提供了一种语音处理方法,可有效提高会议过程中声音降噪处理效果,满足会议需求。
具体的,本方法应用于智能会议一体机,本方法包括以下步骤:
步骤S1、通过预设方式连接多个会议终端,获取所述会议终端的语音信号;所述语音信号为所述会议终端采集的信号。在智能会议开始之前,需要参与会议的会议终端均需与所述智能会议一体机连接。连接的预设方式可以为会议终端直接搜索智能会议一体机,发出连接请求,或者由智能会议一体机生成二维码,并将该二维码发送至所述会议终端,会议终端直接扫描参会。
在参会过程中,每个会议终端均可以进行发言。当参会的会议终端数量较多时,智能会议一体机可以控制多个会议终端的发言权限,以更好的管理智能会议。所述智能会议一体机获取所述会议终端的语音信号为通过会议终端自身的声音采集模块采集的,在采集到语音信号后,转换为电信号,通过网络通信传递至智能会议一体机中,减少采集过程中产生的噪音。
步骤S11、对所述语音信号预处理,并判断所述语音信号是否为有效信号;若所述语音信号为有效信号,则执行步骤S2;若所述语音信号非有效语音信号,则将所述语音信号过滤。所述预处理包括降噪、放大等步骤,初步对语音信号进行处理,进而更好的进行后续判断。判断所述语音信号是否为有效信号,则为判断所述语音信号的振幅是否相同,若所述语音信号的振幅相同,则代表所述语音信号为杂音,并不是用户发言的有效信号,因此将其过滤。若所述语音信号的振幅不同,则代表所述语音信号为有效信号,执行步骤S2。
步骤S2、将所述语音信号按时间顺序线性逐次叠加,每次叠加均得到最新混音值;判断所述最新混音值是否处于预设范围内,若所述最新混音值处于预设范围内,则执行步骤S3;若所述最新混音值不处于预设范围内,则调节所述语音信号压缩权重,直至所述最新混音值处于预设范围,执行步骤S3;
所述智能会议一体机连接且具有发言权限的会议终端数量,随着会议终端数量的不断增大,所述最新混音值超过预设范围的概率也会随之增加。溢出预设范围的数据超出可量化的范围,破坏了语音信号的特征参数,会导致语音质量急剧下降,溢出时的声音无法辨认,只能听到噪声。因此首先判断所述最新混音值是否超过预设范围,若是不超过,可直接执行步骤S3。若是超过了,则调节语音信号压缩权重,直至所述最新混音值处于预设范围。
具体的,所述调节语音信号压缩权重包括以下步骤:
步骤S21、判断连接的会议终端数量是否超过阈值,若不超过第一阈值,则通过平均调整权重法调整所述压缩权重;若超过第一阈值,则通过静音检测能量法调整所述压缩权重。具体的,所述阈值为3。当所述连接的会议终端不超过3个时,可以直接通过平均调整权重法调整所述压缩权重。
所述平均调整法为取所述最新混音值,其压缩权重函数如下所述:
当所述连接的会议终端数量超过3个时,则通过所述静音检测能量法调整所述压缩权重。首先,先通过非均匀波形收缩算法减小音量变压会会议的影响。这是根据在语音信号中,高强度信号出现的概率较低,中低强度信号出现的概率较高。在最新混音值中,将高强度信号使用较大的压缩比例压缩,中低强度信号使用较小的压缩比例压缩,将所述语音信号中第一强度范围的语音信号采用第一压缩比例压缩,第二强度范围的语音信号采用第二压缩比例压缩,所述第一强度范围大于第二强度范围,所述第一压缩比例大于第二压缩比例。使得最新混音值在预设范围内,保证不同强度的语音信号均有一定的识别性,避免音量变化对会议造成的影响。
其次,将压缩后的语音信号的强度按照从大到小的顺序进行排列,选择强度排序前三的会议终端对应的语音信号进行混音,通过平均调整权重法调整所述压缩权重,其他会议终端的语音信号选择静音处理,从而减少所述智能会议一体机的计算压力,可应用于大规模会议中。
步骤S3、输出所述最新混音值至会议终端,由会议终端进行解码并播放。
本方法获取会议终端自身采集的语音信号,将语音信号按照时间顺序线性逐次叠加,每次叠加均得到最新混音值,压缩所述语音信号的压缩权重,直至所述最新混音值处于预设范围内,再由会议终端进行播放,提高智能会议的通讯效果,满足智能会议的需求。
实施例二
本申请还提供一种智能会议一体机,包括:包括多个处理器、存储器及存储于所述存储器上并可在所述处理器上运行的计算机程序,多个处理器执行所述计算机程序时实现实施例一所述的一种语音处理方法。
实施例三
本实施例还提供一种智能会议***,包括了如实施例二所述的一种智能会议一体机,及若干会议终端,所述会议终端与智能会议一体机连接。所述会议终端设置有声音采集模块,用于采集语音信号。所述会议终端将采集到的语音信号发送至所述智能会议一体机中,由智能会议一体机对语音信号进行处理,并传输至会议终端中,进行播放。
实施例四
本发明实施例还提供一种计算机可读存储介质,存储介质上存储有计算机可执行指令,该计算机可执行指令可执行上述实施例一所述的一种语音处理方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccess Memory,RAM)、快闪存储器(Flash Memory)、硬盘(HardDisk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
本实施例中的设备、存储介质与前述实施例中的方法是基于同一发明构思下的两个方面,在前面已经对方法实施过程作了详细的描述,所以本领域技术人员可根据前述描述清楚地了解本实施中的***的结构及实施过程,为了说明书的简洁,在此就不再赘述。
上述实施方式仅为本发明的优选实施方式,不能以此来限定本发明保护的范围,本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。
Claims (8)
1.一种语音处理方法,其特征在于,应用于智能会议一体机,本方法包括以下步骤:
步骤S1、通过预设方式连接多个会议终端,获取所述会议终端的语音信号;所述语音信号通过会议终端采集;
步骤S2、将所述语音信号按时间顺序线性逐次叠加,每次叠加均得到最新混音值;判断所述最新混音值是否处于预设范围内,若所述最新混音值处于预设范围内,则执行步骤S3;若所述最新混音值不处于预设范围内,则调节所述语音信号压缩权重,直至所述最新混音值处于预设范围,执行步骤S3;
步骤S3、输出所述最新混音值至会议终端;
所述步骤S2中调节所述语音信号的压缩权重包括以下步骤:
步骤S21、判断连接的会议终端数量是否超过阈值,若不超过第一阈值,则通过平均调整权重法调整所述压缩权重;若超过阈值,则通过静音检测能量法调整所述压缩权重;所述平均调整权重法调整所述压缩权重,具体为,通过以下公式:
2.如权利要求1所述的一种语音处理方法,其特征在于,所述步骤S21通过静音检测能量法调整所述压缩权重,具体包括:
获取所述语音信号的强度,将所述语音信号中第一强度范围的语音信号采用第一压缩比例压缩,第二强度范围的语音信号采用第二压缩比例压缩;
将压缩后的语音信号按照强度从大到小的顺序排列,选择强度前三的语音信号通过平均调整权重法调整所述压缩权重。
3.如权利要求2所述的一种语音处理方法,其特征在于,所述第一强度范围大于第二强度范围,所述第一压缩比例大于第二压缩比例。
4.如权利要求3所述的一种语音处理方法,其特征在于,所述步骤S1还包括以下步骤:
步骤S11、对所述语音信号预处理,并判断所述语音信号是否为有效信号;若所述语音信号为有效信号,则执行步骤S2;若所述语音信号非有效信号,则将所述语音信号过滤。
5.如权利要求4所述的一种语音处理方法,其特征在于,所述步骤S1中预设方式包括接收所述会议终端发起的连接请求或通过二维码向所述会议终端发出连接请求。
6.一种智能会议一体机,其特征在于,包括多个处理器、存储器及存储于所述存储器上并可在所述处理器上运行的计算机程序,多个处理器执行所述计算机程序时实现权利要求1~5任意一项所述的一种语音处理方法。
7.一种智能会议***,其特征在于,包括如权利要求6所述的一种智能会议一体机及若干会议终端,所述智能会议一体机与所述会议终端连接。
8.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被执行时实现权利要求1~5任意一项所述的一种语音处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110793618.8A CN113257256A (zh) | 2021-07-14 | 2021-07-14 | 一种语音处理方法、会议一体机、***及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110793618.8A CN113257256A (zh) | 2021-07-14 | 2021-07-14 | 一种语音处理方法、会议一体机、***及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113257256A true CN113257256A (zh) | 2021-08-13 |
Family
ID=77191279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110793618.8A Pending CN113257256A (zh) | 2021-07-14 | 2021-07-14 | 一种语音处理方法、会议一体机、***及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113257256A (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10319949A (ja) * | 1997-05-20 | 1998-12-04 | Kawai Musical Instr Mfg Co Ltd | 電子楽器 |
US20030023428A1 (en) * | 2001-07-27 | 2003-01-30 | At Chip Corporation | Method and apparatus of mixing audios |
US20060187860A1 (en) * | 2005-02-23 | 2006-08-24 | Microsoft Corporation | Serverless peer-to-peer multi-party real-time audio communication system and method |
CN1845573A (zh) * | 2006-04-30 | 2006-10-11 | 南京大学 | 支持大容量混音的同声传译视频会议***及方法 |
CN102065265A (zh) * | 2009-11-13 | 2011-05-18 | 华为终端有限公司 | 实现混音的方法、装置和*** |
CN103050124A (zh) * | 2011-10-13 | 2013-04-17 | 华为终端有限公司 | 混音方法、装置及*** |
CN104409079A (zh) * | 2014-11-03 | 2015-03-11 | 北京有恒斯康通信技术有限公司 | 一种音频叠加的方法和装置 |
CN110299144A (zh) * | 2018-03-21 | 2019-10-01 | 腾讯科技(深圳)有限公司 | 音频混音方法、服务器及客户端 |
CN110972053A (zh) * | 2019-11-25 | 2020-04-07 | 腾讯音乐娱乐科技(深圳)有限公司 | 构造听音场景的方法和相关装置 |
CN111161751A (zh) * | 2019-12-25 | 2020-05-15 | 声耕智能科技(西安)研究院有限公司 | 复杂场景下的分布式麦克风拾音***及方法 |
CN111601068A (zh) * | 2020-05-12 | 2020-08-28 | 深圳市融讯视通科技有限公司 | 一种多mcu级联无中心视频会议的实现方法 |
CN112951197A (zh) * | 2021-04-02 | 2021-06-11 | 北京百瑞互联技术有限公司 | 一种音频混音方法、装置、介质及设备 |
-
2021
- 2021-07-14 CN CN202110793618.8A patent/CN113257256A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10319949A (ja) * | 1997-05-20 | 1998-12-04 | Kawai Musical Instr Mfg Co Ltd | 電子楽器 |
US20030023428A1 (en) * | 2001-07-27 | 2003-01-30 | At Chip Corporation | Method and apparatus of mixing audios |
US20060187860A1 (en) * | 2005-02-23 | 2006-08-24 | Microsoft Corporation | Serverless peer-to-peer multi-party real-time audio communication system and method |
CN1845573A (zh) * | 2006-04-30 | 2006-10-11 | 南京大学 | 支持大容量混音的同声传译视频会议***及方法 |
CN102065265A (zh) * | 2009-11-13 | 2011-05-18 | 华为终端有限公司 | 实现混音的方法、装置和*** |
CN103050124A (zh) * | 2011-10-13 | 2013-04-17 | 华为终端有限公司 | 混音方法、装置及*** |
CN104409079A (zh) * | 2014-11-03 | 2015-03-11 | 北京有恒斯康通信技术有限公司 | 一种音频叠加的方法和装置 |
CN110299144A (zh) * | 2018-03-21 | 2019-10-01 | 腾讯科技(深圳)有限公司 | 音频混音方法、服务器及客户端 |
CN110972053A (zh) * | 2019-11-25 | 2020-04-07 | 腾讯音乐娱乐科技(深圳)有限公司 | 构造听音场景的方法和相关装置 |
CN111161751A (zh) * | 2019-12-25 | 2020-05-15 | 声耕智能科技(西安)研究院有限公司 | 复杂场景下的分布式麦克风拾音***及方法 |
CN111601068A (zh) * | 2020-05-12 | 2020-08-28 | 深圳市融讯视通科技有限公司 | 一种多mcu级联无中心视频会议的实现方法 |
CN112951197A (zh) * | 2021-04-02 | 2021-06-11 | 北京百瑞互联技术有限公司 | 一种音频混音方法、装置、介质及设备 |
Non-Patent Citations (1)
Title |
---|
林晓峰: "《VOIP 会议***中混音技术的研究设计与实现》", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108922528B (zh) | 用于处理语音的方法和装置 | |
US9311920B2 (en) | Voice processing method, apparatus, and system | |
WO2017210991A1 (zh) | 一种语音过滤的方法、装置及*** | |
CN110956976B (zh) | 一种回声消除方法、装置、设备及可读存储介质 | |
CN110060696B (zh) | 混音方法及装置、终端及可读存储介质 | |
CN111710344A (zh) | 一种信号处理方法、装置、设备及计算机可读存储介质 | |
CN110769352B (zh) | 一种信号处理方法、装置以及计算机存储介质 | |
CN112466319A (zh) | 音频处理方法、装置、计算机设备和存储介质 | |
CN106603669A (zh) | 分布式主从设备的控制方法及*** | |
CN104079420B (zh) | 一种信息处理方法及电子设备 | |
CN116980804B (zh) | 音量调整方法、装置、设备及可读存储介质 | |
CN102457700A (zh) | 音频数据传输方法及*** | |
CN104464746A (zh) | 语音滤波方法、装置以及电子设备 | |
CN113257256A (zh) | 一种语音处理方法、会议一体机、***及存储介质 | |
CN2790077Y (zh) | 基于蓝牙技术的监控*** | |
CN107785026A (zh) | 一种用于机顶盒室内回声消除的时延估计方法 | |
CN115410593A (zh) | 音频信道的选择方法、装置、设备及存储介质 | |
CN105374363B (zh) | 音频信号编码方法和*** | |
US20200184973A1 (en) | Transcription of communications | |
CN109473096A (zh) | 一种智能语音设备及其控制方法 | |
US9258428B2 (en) | Audio bandwidth extension for conferencing | |
CN204231472U (zh) | 一种带特征识别的智能会议电话机 | |
CN204231484U (zh) | 一种基于特征声音的智能会议电话机 | |
CN104301561A (zh) | 一种智能会议电话机 | |
US20230138678A1 (en) | Processing method of sound watermark and sound watermark processing apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210813 |