CN103856740B - 一种信息处理的方法及视频会议*** - Google Patents
一种信息处理的方法及视频会议*** Download PDFInfo
- Publication number
- CN103856740B CN103856740B CN201210518523.6A CN201210518523A CN103856740B CN 103856740 B CN103856740 B CN 103856740B CN 201210518523 A CN201210518523 A CN 201210518523A CN 103856740 B CN103856740 B CN 103856740B
- Authority
- CN
- China
- Prior art keywords
- microphone
- sound source
- source information
- information
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种信息处理的方法及视频会议***,所述信息处理的方法应用在包括M个麦克风的视频会议***中,其中,所述M为大于等于2的整数,所述方法包括:检测获得L个第一声源信息,其中L为大于等于1的整数;确定所述L个第一声源信息所对应的所述M个麦克风中的N个第一麦克风,其中,N为大于等于1小于且等于M的整数;控制所述N个第一麦克风处于开启状态,以及控制所述M个麦克风中除所述N个第一麦克风之外的M减N个麦克风处于关闭状态。
Description
技术领域
本发明涉及通信技术领域,特别涉及一种信息处理的方法及视频会议***。
背景技术
随着电子设备的发展,其所实现的功能也越来越多,比如:视频会议、数据传输、视频点播等等。其中,在视频会议中,可以通过麦克风捕捉与会者的声音数据,其中,麦克风可以采用如下两种方式设置:
第一种,只配备一个麦克风,集成于电子设备,通过一个麦克风捕捉所有与会者的语音信息;
第二种,配备多个麦克风,通过这多个麦克风捕捉与会者的语音信息。
本申请发明人在实现本申请实施例技术方案的过程中,至少发现现有技术中存在如下技术问题:
由于在现有技术中,当只采用一个麦克风捕捉与会者的语音信息时,由于,有的与会者距离麦克风较远,故而存在着捕捉的语音信息不够精确的技术问题;而采用多个麦克风捕捉与会者的语音信息时,由于多方位捕捉,故而会捕捉到的杂音比较多,同样会导致捕捉的语音信息不够精确的技术问题。
发明内容
本发明实施例提供一种信息处理的方法及视频会议***,用于解决现有技术中会议***中捕捉的语音信息不够精确的技术问题。
一方面,本申请通过一实施例提供如下技术方案:
一种信息处理的方法,所述方法应用在包括M个麦克风的会议***中,其中,所述M为大于等于2的整数,所述方法包括:
检测获得L个第一声源信息,其中L为大于等于1的整数;
确定所述L个第一声源信息所对应的所述M个麦克风中的N个第一麦克风,其中,N为大于等于1小于且等于M的整数;
控制所述N个第一麦克风处于开启状态,以及控制所述M个麦克风中除所述N个第一麦克风之外的M减N个麦克风处于关闭状态。
可选的,所述检测获得L个第一声源信息,具体包括:
检测获得P个声源信息所对应的P个声音值,其中,P为大于等于1的整数;
依次取i为1至P的整数,判断第i个声源信息所对应的第i个声音值是否大于第一预设阈值;当所述第i个声音值大于所述第一预设阈值时,确定所述第i个声源信息为第一声源信息;
当i等于P时,即获得所述L个第一声源信息。
可选的,所述L个第一声源信息具体为:
L个声源中的每一个声源所对应的L个第一位置信息;或者
L个声源中的每一个声源所对应的L个第一语音信息。
可选的,当所述L个声源信息具体为:L个声源中的每一个声源所对应的第一位置信息时,所述确定所述L个第一声源信息所对应的所述M个麦克风中的N个第一麦克风,具体为:
基于位置信息与麦克风之间的对应关系,确定出所述L个第一位置信息所对应的所述N个第一麦克风。
可选的,当所述L个声源信息具体为:所述L个声源中的每一个声源所对应的L个第一语音信息,所述确定所述L个第一声源信息所对应的所述M个麦克风中的N个第一麦克风,具体包括:
确定所述L个第一语音信息中的每个第一语音信息所对应的第一用户,以确定出L个第一用户;
基于用户与麦克风之间的对应关系,确定出所述L个第一用户所对应的L个第一麦克风。
可选的,所述确定所述L个第一语音信息中的每个第一语音信息所对应的第一用户,以确定出L个第一用户,具体包括:
依次取j为1至L的整数,将第j个语音信息与预设的语音信息相匹配,以获取所述第j个语音信息所对应的第j个第一用户;
当j等于L时,即确定出所述L个第一用户。
可选的,在所述控制所述N个第一麦克风处于开启状态之后,所述方法还包括:
通过所述N个第一麦克风采集获得第一语音数据;
产生第一降噪指令,以对所述第一语音数据进行降噪处理,获得第二语音数据。
另一方面,本申请另一实施例提供如下技术方案:
一种视频会议***,所述视频会议***包括M个麦克风,所述M为大于等于2的整数,所述***还包括:
检测模块,用于检测获得L个第一声源信息,其中L为大于等于1的整数;
确定模块,用于确定所述L个第一声源信息所对应的所述M个麦克风中的N个第一麦克风,其中,N为大于等于1小于且等于M的整数;
控制模块,用于控制所述N个第一麦克风处于开启状态,以及控制所述M个麦克风中除所述N个第一麦克风之外的M减N个麦克风处于关闭状态。
可选的,所述检测模块,具体包括:
检测单元,用于检测获得P个声源信息所对应的P个声音值,其中,P为大于等于1的整数;
判断单元,用于依次取i为1至P的整数,判断第i个声源信息所对应的第i个声音值是否大于第一预设阈值;当所述第i个声音值大于所述第一预设阈值时,确定所述第i个声源信息为第一声源信息;
获得单元,用于当i等于P时,即获得所述L个第一声源信息。
可选的,所述L个第一声源信息具体为:
L个声源中的每一个声源所对应的L个第一位置信息;或者
L个声源中的每一个声源所对应的L个第一语音信息。
可选的,当所述L个声源信息具体为:L个声源中的每一个声源所对应的第一位置信息时,所述确定模块,具体用于:
基于位置信息与麦克风之间的对应关系,确定出所述L个第一位置信息所对应的所述N个第一麦克风。
可选的,当所述L个声源信息具体为:所述L个声源中的每一个声源所对应的L个第一语音信息,所述确定模块,具体包括:
第一确定单元,用于确定所述L个第一语音信息中的每个第一语音信息所对应的第一用户,以确定出L个第一用户;
第二确定单元,用于基于用户与麦克风之间的对应关系,确定出所述L个第一用户所对应的L个第一麦克风。
可选的,所述第一确定单元,具体包括:
匹配子单元,用于依次取j为1至L的整数,将第j个语音信息与预设的语音信息相匹配,以获取所述第j个语音信息所对应的第j个第一用户;
确定子单元,用于当j等于L时,即确定出所述L个第一用户。
可选的,所述***还包括:
采集模块,用于在所述控制所述N个第一麦克风处于开启状态之后,通过所述N个第一麦克风采集获得第一语音数据;
降噪模块,用于产生第一降噪指令,以对所述第一语音数据进行降噪处理,获得第二语音数据。
本申请提供的一个或多个技术方案,至少具有如下技术效果或优点:
(1)由于在本申请实施例中,采用了在视频会议***中设置M个麦克风,并且在捕捉到L个第一声源信息之后确定与之对应的N个麦克风处于开启状态、而其他麦克风处于关闭状态的技术方案,故而解决了现有技术中所存在的捕捉的语音信息不够精确的技术问题;达到了能够精确捕捉语音信息的技术效果;
比如:在会场中存在5个与会者,而每一个与会者配备一麦克风,这样,每一个与会者都可以采用与其对应的麦克风参与讨论,因而不会存在捕捉不到语音信息的技术问题;而如果其中仅仅某一个与会者参与讨论,那么,仅仅开启与之对应的麦克风而关闭其它麦克风,这样,也避免通过其它麦克风捕捉到杂音。
(2)由于在本申请实施例中,采用了通过判断声源信息所对应的声音值是否大于第一预设阈值来确定所述声源信息为会议信息还是噪音信息的技术方案,而现有技术中对于声音的检测较为方便,故而存在着操作方便的技术效果。
(3)由于在本申请实施例中,采用了通过声源信息所对应的第一位置信息来确定与之对应的第一麦克风的技术方案,而通过距离传感器就能够确定声源信息所对应的第一麦克风,故而存在着操作方便的技术效果。
(4)由于在本申请实施例中,除了可以通过与第一声源信息所对应的第一位置信息来确定与之对应的第一麦克风之外,还可以通过第一声源信息所对应的第一用户确定与之对应的第一麦克风,故而存在着对N个第一麦克风的确定方式更加多样化的技术效果。
附图说明
图1为本申请实施例一中信息处理的方法的流程图;
图2为本申请实施例一中检测获得L个第一声源信息;
图3为本申请实施例一中确定所述L个第一声源信息所对应的所述M个麦克风中的N个第一麦克风的流程图;
图4为本申请实施例一中对N个麦克风所采集的第一数据进行降噪处理的流程图;
图5为本申请实施例三中视频会议***的方框图。
具体实施方式
本发明实施例提供一种信息处理的方法及视频会议***,用于解决现有技术中视频会议***中捕捉的语音信息不够精确的技术问题。
本申请实施例中的技术方案为解决上述的技术问题,总体思路如下:
在一视频会议***中设置M个麦克风。首先通过检测获得L个第一声源信息,其中,所述L个第一声源信息例如为:L个声源所对应的第一位置信息、L个声源所对应的第一语音信息;然后确定所述L个第一声源信息所对应的所述M个麦克风中的N个第一麦克风,也就是确定参与讨论的与会者所对应的麦克风;然后控制所述N个第一麦克风处于开启状态,以捕捉与会者的语音信息,而控制所述M个麦克风中除所述N个第一麦克风之外的M减N个麦克风处于关闭状态,从而防止捕捉到杂音。
由于采用上述方案捕捉视频会议***中的声音信息时,既能够准确捕捉到每一个与会者的语音信息,又能够尽量少的捕捉到杂音,故而达到了能够精确捕捉语音信息的技术效果。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
实施例一
本申请实施例一提供一种信息处理的方法,所述方法应用在包括M个麦克风的视频会议***中,其中,所述M为大于等于2的整数。
其中,所述视频会议***例如为:中央设置一大的显示屏,然后与会者没人配置一麦克风;又或者与会者没人配备一笔记本电脑,其中,每个笔记本电脑上设置有一麦克风。在具体实施过程中,可以一个与会者对应一麦克风、一个与会者对应多个麦克风、多个与会者对应一麦克风,对于与会者与麦克风如何对应,本申请不作限制。
请参考图1,所述信息处理的方法包括如下步骤:
步骤S101:检测获得L个第一声源信息,其中L为大于等于1的整数;
步骤S102:确定所述L个第一声源信息所对应的所述M个麦克风中的N个第一麦克风,其中,N为大于等于1小于且等于M的整数;
步骤S103:控制所述N个第一麦克风处于开启状态,以及控制所述M个麦克风中除所述N个第一麦克风之外的M减N个麦克风处于关闭状态。
其中,步骤S101中,如图2所示,可以采用如下方式检测获得L个第一声源信息:
步骤S201:检测获得P个声源信息所对应的P个声音值,其中,P为大于等于1的整数;
步骤S202:依次取i为1至P的整数,判断第i个声源信息所对应的第i个声音值是否大于第一预设阈值;当所述第i个声音值大于所述第一预设阈值时,确定所述第i个声源信息为第一声源信息;
步骤S203:当i等于P时,即获得所述L个第一声源信息。
其中,步骤S201中,所述M个麦克风都处于开启状态,当然,也可以开启任意数量的麦克风,进而全方位的检测所述视频会议***中所有声音,进而可以获得P个声源信息所对应的P个声音值。
而在具体实施过程中,通常情况下,如果是与会者在发言,那么其声音值将比较大;而如果并非讨论与会内容或者为其它杂音,那么,其声音值比较小。故而,可以通过在步骤S202中,设置一第一预设阈值,比如:20dB、30dB等等,然后如果第i个声音值大于所述第一预设阈值,比如:为50dB、60dB等等,则确定所述第i个声源信息为第一声源信息,也就是为与会者参与讨论所对应的声源信息。
由以上描述可知,由于在本申请实施例中,采用了通过判断声源信息所对应的声音值是否大于第一预设阈值来确定所述声源信息为会议信息还是噪音信息的技术方案,而现有技术中对于声音的检测较为方便,故而存在着操作方便的技术效果。
其中,在具体实施过程中,所述L个第一声源信息可以为多种信息,比如:
第一种,L个声源中的每一个声源所对应的L个第一位置信息;
在具体实施过程中,当从所述P个声源信息中确定出L个声源信息之后,就能够通过距离传感器检测当前位置与声源之间的距离信息,而如果电子设备上预先设定有当前位置的坐标,就能够确定声源所对应的第一位置信息。
例如:假设当前坐标为(0,0),而第i个第一声源距离当前坐标的距离为(10,7)(其中,以左方为负方向、右方为正方向,而前方为负方向、后方为正方向),那么,就可以据此获得第i个第一声源所对应的第一位置信息为:(10,7),当然也可以为其他值,当然,在具体实施过程中也可以采用其他方式确定所述L个第一位置信息,对此本申请不作限制。
其中,在具体实施过程中,所述距离传感器例如为:电感式距离传感器、激光距离传感器、超声波距离传感器等等,对于所述距离传感器为何种传感器,本申请不做限制。
第二种,L个声源中的每一个声源所对应的L个第一语音信息。
在具体实施过程中,通过所述M个麦克风就可以采集每一个声源所对应的第一语音信息,进而获得L个第一语音信息。
其中,在具体实施过程中,基于所述L个第一声源信息的不同,确定所述L个第一声源信息所对应的所述M个麦克风中的N个第一麦克风的方式也不同,下面列举其中的两种进行介绍,当然,在具体实施过程中,不限于以下几种情况。
第一种,当所述L个声源信息具体为:L个声源中的每一个声源所对应的第一位置信息时,所述确定所述L个第一声源信息所对应的所述M个麦克风中的N个第一麦克风,具体为:
基于位置信息与麦克风之间的对应关系,确定出所述L个第一位置信息所对应的所述N个第一麦克风。
在具体实施过程中,通常在一个视频会议***的会场中,麦克风的位置是固定不变的,并且可以预设每一个麦克风所捕捉的语音信息的区域,比如,假设所述视频会议***中包括4个麦克风,每个麦克风对应区域分别为:
麦克风 | 捕捉区域(m,m) |
麦克风A | (0~5,0~5) |
麦克风B | (0~5,5~10) |
麦克风C | (5~10,0~5) |
麦克风D | (5~10,5~10) |
由于,前面所获得的第i个第一声源所对应的第一位置信息为:(10,7),故而其所对应的语音信息应该由麦克风D来捕捉,由于前面获得了L个第一位置信息,进而就能够确定出N个第一麦克风,在具体实施过程中,一个第一位置信息可以对应多个第一麦克风、一个第一位置信息可以对应一个第一麦克风、多个第一位置信息也可以对应一第一麦克风,故而L和N的大小并不确定,L可以大于N、可以小于N也可以等于N,对此本申请不作限制。
由以上描述可知,由于在本申请实施例中,采用了通过声源信息所对应的第一位置信息来确定与之对应的第一麦克风的技术方案,而通过距离传感器就能够确定声源信息所对应的第一麦克风,故而存在着操作方便的技术效果。
第二种,当所述L个声源信息具体为:所述L个声源中的每一个声源所对应的L个第一语音信息,如图3所示,所述确定所述L个第一声源信息所对应的所述M个麦克风中的N个第一麦克风,具体包括:
步骤S301:确定所述L个第一语音信息中的每个第一语音信息所对应的第一用户,以确定出L个第一用户;
步骤S302:基于用户与麦克风之间的对应关系,确定出所述L个第一用户所对应的L个第一麦克风。
其中,步骤S301中,可以采用如下确定出所述L个第一用户:
依次取j为1至L的整数,将第j个第一语音信息与预设的语音信息相匹配,以获取所述第j个第一语音信息所对应的第j个第一用户;
当j等于L时,即确定出所述L个第一用户。
在具体实施过程中,可以预先采集多个语音模型,比如:分别采集用户A、用户B、用户C、用户D的语音信息存储该视频会议***;
在所述视频会议***捕捉到所述L个第一语音信息之后,对每一个语音信息进行识别分别获得一识别结果;
然后分别将所述第一识别结果和所述预先采集的语音模型进行匹配,就能够确定所述L个第一用户。
而在步骤S302中,通常情况下,在一视频会议***中,用户的位置并不会发生变化,故而通常情况下,可以在电子设备中预存用户和麦克风之间的对应关系,基于所述对应关系就能够确定所述L个第一用户所对应的所述N个第一麦克风。
由以上描述可知,由于在本申请实施例中,除了可以通过与第一声源信息所对应的第一位置信息来确定与之对应的第一麦克风之外,还可以通过第一声源信息所对应的第一用户确定与之对应的第一麦克风,故而存在着对N个第一麦克风的确定方式更加多样化的技术效果。
另外,在具体实施过程中,可以仅仅采用上述一种方式来确定所述N个第一麦克风,也可以采用上述两种方式来确定所述N个第一麦克风。在通过上述两种方式来确定所述N个第一麦克风时,可以将第一种方式确定出的第一麦克风和第二种方式确定出的第一麦克风取并集,以保证不会遗漏任何的语音信息;也可以将第一种方式确定出的第一麦克风和第二种方式确定出的第一麦克风取并集,以保证对第一麦克风的确定更加准确。
在具体实施过程中,在基于步骤S103控制所述N个第一麦克风处于开启状态之后,如图4所示,所述方法还包括:
步骤S401:通过所述N个第一麦克风采集获得第一语音数据;
步骤S402:产生第一降噪指令,以对所述第一语音数据进行降噪处理,获得第二语音数据。
其中,所述步骤S401中所采集的所述第一语音数据通常为与会者的发言信息,但是只要不是在无噪室,通常都会捕捉到杂音。
故而可以执行步骤S402以对所述第一语音数据进行降噪处理,获得第二语音数据,进而实现更好的声音采集效果。
在具体实施过程中,在不同的时刻,会场中参与讨论的用户也不相同,进而其所对应的L个第一声源信息也不同。故而可以每个预设时间间隔,循环检测所述视频会议***全场的所有声音,进而确定与会者所对应的N个第一麦克风,以达到进一步的提高所采集的语音信息的精确度的技术效果。
实施例二
为了使本领域所属技术人员能够连接本申请实施例一中所介绍的信息处理的方法的具体实现过程,在本实施例中,将站在用户侧详解介绍该信息处理的方法的具体实现过程。
其中,在所述视频会议***中包括设置在会场中央的大的一体机,同时会场中包括用户A、用户B、用户C、用户D、用户D等5个用户同时包括5个麦克风,在所述一体机内,存储由这5个麦克风与5个用户之间存在的如下对应关系表:
用户 | 麦克风 |
A | a |
B | b |
C | c |
D | d |
E | e |
另外,所述第一预设阈值为20dB。
在T1时刻,所述视频会议***中的5个麦克风都处于开启状态,并且通过所述5个麦克风采集获得4处声源信息,其所对应的声音值分别为:10dB、25dB、45dB、30dB;
所述一体机,通过对所述4处声源信息所对应的声音值分别与所述第一预设阈值进行比较,获得3处第一声源信息;
然后提取所述3处第一声源信息所对应的语音信息,进而获得3处第一语音信息;
然后分别对所述3出第一语音信息进行识别,并与预存的语音模型进行匹配,确定出所述3处第一语音信息所对应的第一用户分别为:用户A、用户B、用户D;
在确定出所述3个第一用户之后,就能够通过所述一体机内预存的5个麦克风与5个用户之间的对应关系表,确定出所述3个第一用户所对应的3个第一麦克风,分比为:麦克风a、麦克风b、麦克风d;
在确定出所述3个麦克风之后,保持所述3个麦克风处于开启状态,而关闭另外两个麦克风,也就是麦克风c、麦克风e;
同时,开启所述3个麦克风所对应的降噪***,以对所述3个麦克风所采集的第一语音数据进行降噪处理。
实施例三
基于同一发明构思,本申请实施例三提供一种视频会议***,所述视频会议***包括M个麦克风,所述M为大于等于2的整数。
请参考图5,所述***还包括如下结构:
检测模块501,用于检测获得L个第一声源信息,其中L为大于等于1的整数;
确定模块502,用于确定所述L个第一声源信息所对应的所述M个麦克风中的N个第一麦克风,其中,N为大于等于1小于且等于M的整数;
控制模块503,用于控制所述N个第一麦克风处于开启状态,以及控制所述M个麦克风中除所述N个第一麦克风之外的M减N个麦克风处于关闭状态。
在具体实施过程中,所述检测模块501,具体包括:
检测单元,用于检测获得P个声源信息所对应的P个声音值,其中,P为大于等于1的整数;
判断单元,用于依次取i为1至P的整数,判断第i个声源信息所对应的第i个声音值是否大于第一预设阈值;当所述第i个声音值大于所述第一预设阈值时,确定所述第i个声源信息为第一声源信息;
获得单元,用于当i等于P时,即获得所述L个第一声源信息。
在具体实施过程中,可以开启所述M个麦克风中的任意数量的麦克风,比如开启一个、全部开启等等,进而全方位的检测所述视频会议***中所有声音,从而获得P个声源信息所对应的P个声音值。
进而,基于所述P个声音值来确定所述P个声源信息中与会者发言所对应的L个第一声源信息,由于具体如何确定,在本申请实施例一中已作介绍,故而在此不再赘述。
由以上描述可知,由于在本申请实施例中,采用了通过判断声源信息所对应的声音值是否大于第一预设阈值来确定所述声源信息为会议信息还是噪音信息的技术方案,而现有技术中对于声音的检测较为方便,故而存在着操作方便的技术效果。
在具体实施过程中,所述L个第一声源信息具体为:
L个声源中的每一个声源所对应的L个第一位置信息;或者
L个声源中的每一个声源所对应的L个第一语音信息。
而在具体实施过程中,基于所述L个第一声源信息的不同,所述确定模块502的功能也不同,下面列举其中的两种进行介绍,当然,在具体实施过程中,不限于以下两种情况。
第一种,当所述L个声源信息具体为:L个声源中的每一个声源所对应的第一位置信息时,所述确定模块,具体用于:
基于位置信息与麦克风之间的对应关系,确定出所述L个第一位置信息所对应的所述N个第一麦克风。
由以上描述可知,由于在本申请实施例中,采用了通过声源信息所对应的第一位置信息来确定与之对应的第一麦克风的技术方案,而通过距离传感器就能够确定声源信息所对应的第一麦克风,故而存在着操作方便的技术效果。
第二种,当所述L个声源信息具体为:所述L个声源中的每一个声源所对应的L个第一语音信息,所述确定模块502,具体包括:
第一确定单元,用于确定所述L个第一语音信息中的每个第一语音信息所对应的第一用户,以确定出L个第一用户;
第二确定单元,用于基于用户与麦克风之间的对应关系,确定出所述L个第一用户所对应的L个第一麦克风。
而在具体实施过程中,所述第一确定单元,具体包括:
匹配子单元,用于依次取j为1至L的整数,将第j个语音信息与预设的语音信息相匹配,以获取所述第j个语音信息所对应的第j个第一用户;
确定子单元,用于当j等于L时,即确定出所述L个第一用户。
由以上描述可知,由于在本申请实施例中,除了可以通过与第一声源信息所对应的第一位置信息来确定与之对应的第一麦克风之外,还可以通过第一声源信息所对应的第一用户确定与之对应的第一麦克风,故而存在着对N个第一麦克风的确定方式更加多样化的技术效果。
在具体实施过程中,所述***还包括:
采集模块,用于在所述控制所述N个第一麦克风处于开启状态之后,通过所述N个第一麦克风采集获得第一语音数据;
降噪模块,用于产生第一降噪指令,以对所述第一语音数据进行降噪处理,获得第二语音数据。
具体来讲,也就是在通过所述N个第一麦克风采集获得所述第一语音数据之后,对所述第一语音数据进行降噪处理,以实现更加好的声音采集效果。
另外,在具体实施过程中,在不同的时刻,会场中参与讨论的用户也不相同,进而其所对应的L个第一声源信息也不同。故而可以每个预设时间间隔,循环检测所述视频会议***全场的所有声音,进而确定与会者所对应的N个第一麦克风,以达到进一步的提高所采集的语音信息的精确度的技术效果。
由于本申请实施例三所介绍的视频会议***,为实施例本申请实施例一中的信息处理的方法所用到的视频会议***,故而基于本申请实施例一所介绍的信息处理的方法,本领域所属技术人员能够了解本申请实施例三所介绍的视频会议***的具体结构及变型,故而在此对于该视频会议***不再详作介绍,只要实施例本申请实施例一中的信息处理的方法所用到的视频会议***,都属于本申请所欲保护的范围。
本申请提供的一个或多个技术方案,至少具有如下技术效果或优点:
(1)由于在本申请实施例中,采用了在视频会议***中设置M个麦克风,并且在捕捉到L个第一声源信息之后确定与之对应的N个麦克风处于开启状态、而其他麦克风处于关闭状态的技术方案,故而解决了现有技术中所存在的捕捉的语音信息不够精确的技术问题;达到了能够精确捕捉语音信息的技术效果;
比如:在会场中存在5个与会者,而每一个与会者配备一麦克风,这样,每一个与会者都可以采用与其对应的麦克风参与讨论,因而不会存在捕捉不到语音信息的技术问题;而如果其中仅仅某一个与会者参与讨论,那么,仅仅开启与之对应的麦克风而关闭其它麦克风,这样,也避免通过其它麦克风捕捉到杂音。
(2)由于在本申请实施例中,采用了通过判断声源信息所对应的声音值是否大于第一预设阈值来确定所述声源信息为会议信息还是噪音信息的技术方案,而现有技术中对于声音的检测较为方便,故而存在着操作方便的技术效果。
(3)由于在本申请实施例中,采用了通过声源信息所对应的第一位置信息来确定与之对应的第一麦克风的技术方案,而通过距离传感器就能够确定声源信息所对应的第一麦克风,故而存在着操作方便的技术效果。
(4)由于在本申请实施例中,除了可以通过与第一声源信息所对应的第一位置信息来确定与之对应的第一麦克风之外,还可以通过第一声源信息所对应的第一用户确定与之对应的第一麦克风,故而存在着对N个第一麦克风的确定方式更加多样化的技术效果。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (12)
1.一种信息处理的方法,所述方法应用在包括M个麦克风的会议***中,其中,所述M为大于等于2的整数,其特征在于,所述方法包括:
检测获得L个第一声源信息,其中L为大于等于1的整数;所述L个第一声源信息为L个声源所对应的L个第一位置信息和L个第一语音信息;
确定所述L个第一声源信息所对应的所述M个麦克风中的N个第一麦克风,其中,N为大于等于1小于且等于M的整数;
控制所述N个第一麦克风处于开启状态,以及控制所述M个麦克风中除所述N个第一麦克风之外的M减N个麦克风处于关闭状态。
2.如权利要求1所述的方法,其特征在于,所述检测获得L个第一声源信息,具体包括:
检测获得P个声源信息所对应的P个声音值,其中,P为大于等于1的整数;
依次取i为1至P的整数,判断第i个声源信息所对应的第i个声音值是否大于第一预设阈值;当所述第i个声音值大于所述第一预设阈值时,确定所述第i个声源信息为第一声源信息;
当i等于P时,即获得所述L个第一声源信息。
3.如权利要求1所述的方法,其特征在于,当所述L个声源信息具体为:L个声源中的每一个声源所对应的第一位置信息时,所述确定所述L个第一声源信息所对应的所述M个麦克风中的N个第一麦克风,具体为:
基于位置信息与麦克风之间的对应关系,确定出所述L个第一位置信息所对应的所述N个第一麦克风。
4.如权利要求1所述的方法,其特征在于,当所述L个声源信息具体为:所述L个声源中的每一个声源所对应的L个第一语音信息,所述确定所述L个第一声源信息所对应的所述M个麦克风中的N个第一麦克风,具体包括:
确定所述L个第一语音信息中的每个第一语音信息所对应的第一用户,以确定出L个第一用户;
基于用户与麦克风之间的对应关系,确定出所述L个第一用户所对应的L个第一麦克风。
5.如权利要求4所述的方法,其特征在于,所述确定所述L个第一语音信息中的每个第一语音信息所对应的第一用户,以确定出L个第一用户,具体包括:
依次取j为1至L的整数,将第j个语音信息与预设的语音信息相匹配,以获取所述第j个语音信息所对应的第j个第一用户;
当j等于L时,即确定出所述L个第一用户。
6.如权利要求1-5任一权项所述的方法,其特征在于,在所述控制所述N个第一麦克风处于开启状态之后,所述方法还包括:
通过所述N个第一麦克风采集获得第一语音数据;
产生第一降噪指令,以对所述第一语音数据进行降噪处理,获得第二语音数据。
7.一种视频会议***,所述视频会议***包括M个麦克风,所述M为大于等于2的整数,其特征在于,所述***还包括:
检测模块,用于检测获得L个第一声源信息,其中L为大于等于1的整数;所述L个第一声源信息为L个声源所对应的L个第一位置信息和L个第一语音信息;
确定模块,用于确定所述L个第一声源信息所对应的所述M个麦克风中的N个第一麦克风,其中,N为大于等于1小于且等于M的整数;
控制模块,用于控制所述N个第一麦克风处于开启状态,以及控制所述M个麦克风中除所述N个第一麦克风之外的M减N个麦克风处于关闭状态。
8.如权利要求7所述的***,其特征在于,所述检测模块,具体包括:
检测单元,用于检测获得P个声源信息所对应的P个声音值,其中,P为大于等于1的整数;
判断单元,用于依次取i为1至P的整数,判断第i个声源信息所对应的第i个声音值是否大于第一预设阈值;当所述第i个声音值大于所述第一预设阈值时,确定所述第i个声源信息为第一声源信息;
获得单元,用于当i等于P时,即获得所述L个第一声源信息。
9.如权利要求7所述的***,其特征在于,当所述L个声源信息具体为:L个声源中的每一个声源所对应的第一位置信息时,所述确定模块,具体用于:
基于位置信息与麦克风之间的对应关系,确定出所述L个第一位置信息所对应的所述N个第一麦克风。
10.如权利要求7所述的***,其特征在于,当所述L个声源信息具体为:所述L个声源中的每一个声源所对应的L个第一语音信息,所述确定模块,具体包括:
第一确定单元,用于确定所述L个第一语音信息中的每个第一语音信息所对应的第一用户,以确定出L个第一用户;
第二确定单元,用于基于用户与麦克风之间的对应关系,确定出所述L个第一用户所对应的L个第一麦克风。
11.如权利要求10所述的***,其特征在于,所述第一确定单元,具体包括:
匹配子单元,用于依次取j为1至L的整数,将第j个语音信息与预设的语音信息相匹配,以获取所述第j个语音信息所对应的第j个第一用户;
确定子单元,用于当j等于L时,即确定出所述L个第一用户。
12.如权利要求7-11任一权项所述的***,其特征在于,所述***还包括:
采集模块,用于在所述控制所述N个第一麦克风处于开启状态之后,通过所述N个第一麦克风采集获得第一语音数据;
降噪模块,用于产生第一降噪指令,以对所述第一语音数据进行降噪处理,获得第二语音数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210518523.6A CN103856740B (zh) | 2012-12-05 | 2012-12-05 | 一种信息处理的方法及视频会议*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210518523.6A CN103856740B (zh) | 2012-12-05 | 2012-12-05 | 一种信息处理的方法及视频会议*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103856740A CN103856740A (zh) | 2014-06-11 |
CN103856740B true CN103856740B (zh) | 2017-05-24 |
Family
ID=50863888
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210518523.6A Active CN103856740B (zh) | 2012-12-05 | 2012-12-05 | 一种信息处理的方法及视频会议*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103856740B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104980687A (zh) * | 2015-07-04 | 2015-10-14 | 马岩 | 视频会议的麦克控制方法及*** |
WO2017004762A1 (zh) * | 2015-07-04 | 2017-01-12 | 马岩 | 视频会议的麦克控制方法及*** |
CN109905803B (zh) * | 2019-03-01 | 2020-08-14 | 深圳市沃特沃德股份有限公司 | 麦克风阵列的切换方法、装置、存储介质及计算机设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW260856B (en) * | 1994-05-09 | 1995-10-21 | At & T Corp | Voice actuated switching system |
CN1479525A (zh) * | 2002-06-27 | 2004-03-03 | 全向摄像机与话筒阵列的集成设计 | |
CN1716986A (zh) * | 2004-06-30 | 2006-01-04 | 宝利通公司 | 用于电信会议的立体声话筒处理 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007274462A (ja) * | 2006-03-31 | 2007-10-18 | Yamaha Corp | テレビ会議装置、テレビ会議システム |
JP2010193017A (ja) * | 2009-02-16 | 2010-09-02 | Panasonic Corp | 映像通信装置 |
-
2012
- 2012-12-05 CN CN201210518523.6A patent/CN103856740B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW260856B (en) * | 1994-05-09 | 1995-10-21 | At & T Corp | Voice actuated switching system |
CN1479525A (zh) * | 2002-06-27 | 2004-03-03 | 全向摄像机与话筒阵列的集成设计 | |
CN1716986A (zh) * | 2004-06-30 | 2006-01-04 | 宝利通公司 | 用于电信会议的立体声话筒处理 |
Also Published As
Publication number | Publication date |
---|---|
CN103856740A (zh) | 2014-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102843543B (zh) | 视频会议提醒方法、装置和视频会议*** | |
US9210269B2 (en) | Active speaker indicator for conference participants | |
US20210327436A1 (en) | Voice Interaction Method, Device, and System | |
CN102902505B (zh) | 具有增强音频的器件 | |
US10142483B2 (en) | Technologies for dynamic audio communication adjustment | |
WO2016177262A1 (zh) | 智能会议的协作方法和会议终端 | |
WO2017098772A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
EP2180703A1 (en) | Displaying dynamic caller identity during point-to-point and multipoint audio/videoconference | |
CN110223690A (zh) | 基于图像与语音融合的人机交互方法及装置 | |
US20100309284A1 (en) | Systems and methods for dynamically displaying participant activity during video conferencing | |
EP2993860B1 (en) | Method, apparatus, and system for presenting communication information in video communication | |
WO2019184650A1 (zh) | 字幕生成方法及终端 | |
CN108781273B (zh) | 基于自动参与者标识的动作 | |
CN104078045B (zh) | 一种识别的方法及电子设备 | |
CN104349040B (zh) | 用于视频会议***中的摄像机底座及其方法 | |
CN109257498B (zh) | 一种声音处理方法及移动终端 | |
EP4064692A1 (en) | Smart audio muting in a videoconferencing system | |
CN103856740B (zh) | 一种信息处理的方法及视频会议*** | |
CN115482830B (zh) | 语音增强方法及相关设备 | |
CN109671430A (zh) | 一种语音处理方法及装置 | |
CN104079420B (zh) | 一种信息处理方法及电子设备 | |
CN203734758U (zh) | 一种多功能会议*** | |
Dai et al. | Group Interaction Analysis in Dynamic Context $^{\ast} $ | |
US20230410828A1 (en) | Systems and methods for echo mitigation | |
CN115866499A (zh) | 一种基于人体识别和声纹匹配的拾音扩音方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |