CN114401350A - 一种音频处理方法及会议*** - Google Patents

一种音频处理方法及会议*** Download PDF

Info

Publication number
CN114401350A
CN114401350A CN202210079239.7A CN202210079239A CN114401350A CN 114401350 A CN114401350 A CN 114401350A CN 202210079239 A CN202210079239 A CN 202210079239A CN 114401350 A CN114401350 A CN 114401350A
Authority
CN
China
Prior art keywords
sound
conference
electronic
equipment
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210079239.7A
Other languages
English (en)
Inventor
王永亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN202210079239.7A priority Critical patent/CN114401350A/zh
Publication of CN114401350A publication Critical patent/CN114401350A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请公开了一种音频处理方法及会议***,确定与会议设备关联的至少两个电子设备,至少两个电子设备中每个电子设备至少包括收音装置,控制电子设备中的至少一个电子设备的收音装置启动以拾取声音数据,对声音数据进行处理,得到第一音频数据,输出第一音频数据。本方案中通过在会议过程中,由与会议设备关联的电子设备中的收音装置拾取声音,并由会议设备在对关联的电子设备的收音装置拾取的声音进行处理后输出,实现了通过与会议设备关联的电子设备的收音装置拾取声音。

Description

一种音频处理方法及会议***
技术领域
本申请涉及音频处理领域,尤其涉及一种音频处理方法及会议***。
背景技术
在多人会议时,通常会出现会议设备通过收音装置拾取与会者的声音,当与会者距离收音装置较远时,会导致拾取的声音的音量较小,降低通过会议设备的扬声器输出该拾取的音频的输出效果。
发明内容
有鉴于此,本申请提供一种音频处理方法及会议***,其具体方案如下:
一种音频处理方法,所述方法包括:
确定与会议设备关联的至少两个电子设备,所述至少两个电子设备中每个电子设备至少包括收音装置;
控制所述电子设备中的至少一个电子设备的收音装置启动以拾取声音数据;
对所述声音数据进行处理,得到第一音频数据;
输出所述第一音频数据。
进一步的,所述控制所述电子设备中的至少一个电子设备的收音装置启动以拾取声音数据,包括:
通过所述会议设备获得当前环境中的环境信息,基于所述环境信息确定第一电子设备,控制所述第一电子设备的收音装置启动,并关闭所述会议设备的收音装置;
获得所述第一电子设备的收音装置拾取的声音数据。
进一步的,所述通过所述会议设备获得当前环境中的环境信息,基于所述环境信息确定第一电子设备,包括:
通过所述会议设备的收音装置拾取当前环境中的第一声音信息;
基于所述第一声音信息的声纹信息或发声位置信息确定与所述第一声音信息对应的第一电子设备。
进一步的,所述通过所述会议设备获得当前环境中的环境信息,基于所述环境信息确定第一电子设备,包括:
通过所述会议设备的图像采集装置获得当前环境中的第一图像;
基于所述第一图像中的连续两帧图像确定发声者的人脸特征信息;
基于所述发声者的人脸特征信息确定与所述发声者的人脸特征信息匹配的第一电子设备。
进一步的,所述控制所述电子设备中的至少一个电子设备的收音装置启动以拾取声音数据,包括:
控制所述电子设备中的至少两个第二电子设备的收音装置启动,并关闭所述会议设备的收音装置;
获得所述至少两个第二电子设备的收音装置拾取的声音数据。
进一步的,所述对所述声音数据进行处理,得到第一音频数据,包括:
若所述声音数据为所述第一电子设备的收音装置拾取的,对所述声音数据进行降噪处理,得到第一音频数据;
若所述声音数据为所述至少两个第二电子设备的收音装置拾取的,对所述至少两个第二电子设备的收音装置分别拾取的声音信息进行重音过滤,得到第一音频数据。
进一步的,所述对所述至少两个第二电子设备的收音装置分别拾取的声音信息进行重音过滤,得到第一音频数据,包括:
确定所述至少两个第二电子设备中每一个第二电子设备的收音装置分别拾取的声音信息;
从所述至少两个第二电子设备分别拾取的至少两个声音信息中选取清晰度大于其他声音信息的声音信息,将其确定为第一音频数据。
进一步的,所述对所述至少两个第二电子设备的收音装置分别拾取的声音信息进行重音过滤,得到第一音频数据,包括:
将所述至少两个第二电子设备分别拾取的至少两个声音信息进行同步,以便于对声音信息进行加强处理,得到第一音频数据。
进一步的,所述确定与会议设备关联的至少两个电子设备,包括:
获得至少两个电子设备发送的会议请求;
基于所述会议请求确定所述至少两个电子设备是否符合环境条件,将所述至少两个电子设备中符合环境条件的电子设备与所述会议设备关联。
一种会议***,包括:
至少两个电子设备,所述至少两个电子设备中每个电子设备至少包括收音装置;
会议设备,用于确定与所述会议设备关联的至少两个电子设备,控制所述电子设备中的至少一个电子设备的收音装置启动以拾取声音数据;对所述声音数据进行处理,得到第一音频数据;输出所述第一音频数据。
从上述技术方案可以看出,本申请公开的音频处理方法及会议***,确定与会议设备关联的至少两个电子设备,至少两个电子设备中每个电子设备至少包括收音装置,控制电子设备中的至少一个电子设备的收音装置启动以拾取声音数据,对声音数据进行处理,得到第一音频数据,输出第一音频数据。本方案中通过在会议过程中,控制与会议设备关联的电子设备中的收音装置拾取声音,并由会议设备在对关联的电子设备的收音装置拾取的声音进行处理后输出,实现了通过与会议设备关联的电子设备的收音装置拾取声音,以提高拾取的声音的效果,避免了直接通过会议设备自身的收音装置拾取声音时可能导致的音量较小的问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的一种音频处理方法的流程图;
图2为本申请实施例公开的一种音频处理方法的流程图;
图3为本申请实施例公开的一种音频处理方法的流程图;
图4为本申请实施例公开的一种音频处理方法的流程图;
图5为本申请实施例公开的一种会议***的结构示意图;
图6为本申请实施例公开的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请公开了一种音频处理方法,其流程图如图1所示,包括:
步骤S11、确定与会议设备关联的至少两个电子设备,至少两个电子设备中每个电子设备至少包括收音装置;
步骤S12、控制电子设备中的至少一个电子设备的收音装置启动以拾取声音数据;
步骤S13、对声音数据进行处理,得到第一音频数据;
步骤S14、输出第一音频数据。
在多人会议时,无论是现场会议,还是远程会议,通过会议设备的收音装置拾取与会者的声音,若正在发言的与会者距离会议设备较远,就会导致会议设备自身的收音装置距离发言的与会者较远,会使得会议设备的收音装置拾取到的发言的与会者的声音的音量较小,降低用户的会议体验。
为了避免这一问题,本方案中,会议设备具有关联的至少两个电子设备,每个电子设备都包括收音装置,通过电子设备的收音装置拾取会议中的声音数据,以提高拾音效果,避免出现通过会议设备的收音装置拾取声音导致的音量较小的问题。
会议设备可以与多个电子设备关联,电子设备的数量可以与与会者的数量相同,即每个电子设备对应一个与会者,每个与会者都具有一个电子设备,当参加会议时,与会者通过电子设备与会议设备关联;或者,也可以为:电子设备的数量少于与会者的数量,电子设备可以直接设置在会议设备所在的空间环境中,不同的电子设备位于不同的方位,以便于在不同方位的与会者发言时,在该方位都有对应的电子设备,以便通过该方位的电子设备的收音装置拾取声音数据;或者,还可以为:只有在会议中会发言的与会者才会配置一个电子设备,并将该电子设备与会议设备关联。
每个电子设备都自带收音装置,通过收音装置能够拾取环境中的声音数据。
若每个与会者都对应有一个电子设备,电子设备与该与会者的位置邻近,若某个与会者发言,则可以通过发言的与会者对应的电子设备的收音装置拾取其声音,此时,由于电子设备与其对应的与会者的位置邻近,则发言的与会者对应的电子设备的收音装置所在的位置距离该与会者接近,其拾取的声音也更清晰,有效避免了通过会议设备自带的收音装置拾取声音时容易出现的声音小的问题。
在会议开始前,预先将电子设备与会议设备关联;在会议开始前,或者,会议开始时,或者,会议过程中,控制电子设备中的至少一个电子设备的收音装置启动以拾取声音数据。
在通过至少一个电子设备的收音装置拾取声音数据后,对声音数据进行处理,以得到第一音频数据,其中,第一音频数据为音效符合会议中的音频输出条件,即第一音频数据至少满足清晰度需求,和/或,音量需求,能够使其他与会者在听到该第一音频数据后清楚的明确该第一音频数据。
其中,输出第一音频数据,可以为发送第一音频数据至会议设备的对端,也可以为通过会议设备的声音播放装置在本地播放第一音频数据。
发送第一音频数据至会议设备的对端,即:在远程会议的过程中,位于本地的一个与会者发出声音数据,至少一个电子设备的收音装置拾取该声音数据,并在本地的会议设备处理后将第一音频数据输出到远端,以便通过远端的会议设备的声音播放装置输出该第一音频数据,以使远端的与会者能够获得清晰的声音。此时,在本地可以不输出第一音频数据,即在本地并不播放该第一音频数据,本地的与会者能够获得的声音数据仅有本地发言的与会者发出的声音,而不会有通过声音播放装置输出的音频数据;
通过会议设备的声音播放装置在本地播放第一音频数据,即在本地会议过程中,至少一个电子设备的收音装置拾取到声音数据后,会议设备对其进行处理,得到第一音频数据,之后,由会议设备的声音播放装置在本地播放该第一音频数据;
或者,还可以为:在将第一音频数据发送至会议设备的对端的同时,通过会议设备的声音播放装置在本地输出第一音频数据。
本实施例公开了一种音频处理方法,确定与会议设备关联的至少两个电子设备,至少两个电子设备中每个电子设备至少包括收音装置,控制电子设备中的至少一个电子设备的收音装置启动以拾取声音数据,对声音数据进行处理,得到第一音频数据,输出第一音频数据。本方案中通过在会议过程中,控制由与会议设备关联的电子设备中的收音装置拾取声音,并由会议设备在对关联的电子设备的收音装置拾取的声音进行处理后输出,实现了通过与会议设备关联的电子设备的收音装置拾取声音,以提高拾取的声音的效果,避免了直接通过会议设备自身的收音装置拾取声音时可能导致的音量较小的问题。
本实施例公开了一种音频处理方法,其流程图如图2所示,包括:
步骤S21、确定与会议设备关联的至少两个电子设备,至少两个电子设备中每个电子设备至少包括收音装置;
步骤S22、通过会议设备获得当前环境中的环境信息,基于环境信息确定第一电子设备,控制第一电子设备的收音装置启动,并关闭会议设备的收音装置;
步骤S23、获得第一电子设备的收音装置拾取的声音数据;
步骤S24、对声音数据进行处理,得到第一音频数据;
步骤S25、输出第一音频数据。
将至少两个电子设备与会议设备进行关联,是在会议开始前执行的,而启动至少一个电子设备的收音装置可以为在会议开始时执行的,或者,在会议过程中执行的。
若在会议过程中执行,则会根据会议过程中当前环境的环境信息的变化使得启动收音装置的电子设备发生变化。具体的,通过会议设备获得当前环境中的环境信息,基于环境信息从关联的所有电子设备选择一个第一电子设备,控制第一电子设备的收音装置启动,并关闭会议设备的收音装置,以便于会议装置仅获得第一电子设备的收音装置拾取的声音数据,而不会有会议设备本身的收音装置拾取的声音数据做干扰。
当前环境中的环境信息可以为声音信息,也可以为图像信息。
其中,若为声音信息,则通过会议设备的收音装置拾取当前环境中的第一声音信息;基于第一声音信息的声纹信息或发声位置信息确定与第一声音信息对应的第一电子设备。
在将电子设备与会议设备关联时,会议设备获得的不仅包括电子设备的相关信息,还包括持有该电子设备的与会者的相关信息。
若电子设备为与会者个人持有的设备,如:公司为员工分配的笔记本电脑,或者,员工个人的笔记本电脑等,在将电子设备与会议设备关联时,会议设备会向电子设备发送请求指令,请求获取与会者的声纹信息,若电子设备中存储有其持有者的声纹信息,则直接将该与会者的声纹信息返回会议设备,以便会议设备进行记录;若电子设备中未存储有其持有者的声纹信息,则电子设备会输出一个声纹录取指令,以便其持有者在电子设备中录入声纹信息,并将其发送至会议设备进行记录。
会议设备获得声纹信息后,将该声纹信息与发送该声纹信息的电子设备绑定,以便于实现声纹信息与电子设备的一一对应的关系。
在会议过程中,首先由会议设备的收音装置拾取声音信息,当拾取到声音信息后,会议设备会对该声音信息进行识别,确定其声纹信息与关联的至少两个电子设备中哪一个电子设备的声纹信息匹配,若确定会议设备识别到的声纹信息与第一电子设备绑定的声纹信息匹配,则控制第一电子设备的收音装置启动,以便由第一电子设备的收音装置拾取声音数据,同时,关闭会议设备的收音装置,以避免多个收音装置同时启动并拾音导致的拾取到的声音的音效降低的问题。
仅通过发言的与会者对应的第一电子设备的收音装置拾音,第一电子设备的收音装置与发言的与会者之间的距离是小于其他收音装置与该发言的与会者之间的距离的,因此,通过第一电子设备的收音装置拾取的声音的音量大于其他收音装置拾取的声音的音量,并且,通过第一电子设备的收音装置拾取的声音的清晰度大于其他收音装置拾取的声音的清晰度。
若发言的与会者发生变化,即由第一与会者发声切换为第二与会者发声:在第一与会者发声时,是第一与会者对应的第一电子设备的收音装置启动并拾取声音数据;若发声者由第一与会者切换为第二与会者,则第一电子设备的收音装置在拾取声音的过程中,检测到其拾取到的声音的清晰度或者音量降低超过某一预设范围,表明发声者切换为非第一与会者,则此时,将第一与会者对应的第一电子设备的收音装置拾取到的声音发送至会议设备,会议设备分析该声音数据,确定该声纹数据对应的是第二与会者的声纹数据,则启动第二与会者对应的第一电子设备的收音装置,同时,关闭第一与会者对应的第一电子设备的收音装置,仅通过第二与会者对应的第一电子设备的收音装置拾取第二与会者的声音数据。
若在会议开始前,并未进行声纹信息的获取,则可以通过发声位置确定第一声音信息对应的第一电子设备。
若基于发声位置确定第一声音信息对应的第一电子设备,则需要在会议开始前记录每个与会者在当前环境中的位置;同时,在将电子设备与会议设备关联时,还需要将与会者与电子设备绑定,即与会者与电子设备一一对应。
在会议过程中,首先通过会议设备的收音装置拾取声音信息,当拾取到声音信息后,会议设备会对该声音信息进行识别,以确定该声音信息的声源位置,即发声位置信息。在确定发声位置信息后,将该发声位置信息与预先记录的每个与会者在当前环境中的位置进行一一比对,从而确定该发声位置处的与会者,将与该与会者绑定的电子设备确定为第一电子设备,启动第一电子设备的收音装置,以便通过第一电子设备的收音装置拾取声音,同时,关闭会议设备的收音装置。
若发言的与会者发生变化,如:由第一与会者发言切换为第二与会者发言,则在第一与会者发声时,第一与会者对应的第一电子设备的收音装置拾取声音,当发声者由第一与会者切换为第二与会者,第一与会者对应的第一电子设备的收音装置将拾取到的声音发送至会议设备,会议设备对其进行识别,确定其声源位置与第一与会者的位置不同,而是与第二与会者的位置匹配,则确定第二与会者对应的第一电子设备,启动第二与会者对应的第一电子设备的收音装置,同时关闭第一与会者对应的第一电子设备的收音装置。
或者,也可以为:在会议开始时,就将所有电子设备的收音装置启动,通过所有电子设备的收音装置拾取声音,当有与会者发言时,由会议设备确定所有电子设备中每个电子设备的收音装置拾取的声音中音量最大的电子设备,将该电子设备确定为第一电子设备。之后,仅启动第一电子设备的收音装置,而关闭其他电子设备的收音装置,同时关闭会议设备的收音装置。
另外,若当前环境中的环境信息为图像信息,则可以为:
通过会议设备的图像采集装置获得当前环境中的第一图像,基于第一图像中的连续两帧图像确定发声者的人脸特征信息,基于发声者的人脸特征信息确定与发声者的人脸特征信息匹配的第一电子设备。
在会议开始前,每个电子设备会通过人脸识别的方式与其持有者绑定,将电子设备与会议设备关联时,会议设备在获得电子设备的相关信息后,也会获得该电子设备的持有者的人脸特征信息。
在会议过程中,通过会议设备的图像采集装置采集当前环境中的图像,同时,通过会议设备的收音装置拾取声音,当会议设备的收音装置拾取到声音时,会议设备对图像采集装置采集到的至少连续两帧图像进行比对,以确定发言的与会者,即发声者。会议设备在确定发声者后,基于图像采集装置采集到的该发声者的图像,分析该发声者的人脸特征信息,之后将该发声者的人脸特征信息与电子设备的持有者的人脸特征信息进行比对,确定与发声者的人脸特征信息匹配的电子设备的持有者的人脸特征信息,将该电子设备确定为第一电子设备。之后启动第一电子设备的收音装置,同时关闭会议设备的收音装置,仅通过第一电子设备的收音装置拾音,以提高拾音效果。
或者,也可以为,在会议过程中,控制所有的电子设备的收音装置均处于启动状态,每个电子设备的收音装置均能够拾取声音信息。
具体的,控制电子设备中的至少两个第二电子设备的收音装置启动,并关闭会议设备的收音装置,获得至少两个第二电子设备的收音装置拾取的声音数据。
与会议设备关联的电子设备为至少两个,在会议过程中可以控制至少两个电子设备中的一个电子设备的收音装置启动,以通过这一个电子设备的收音装置拾音,而选择一个收音装置启动的电子设备,则可以通过环境信息启动;也可以控制多个电子设备或者所有的电子设备的收音装置启动,以通过多个电子设备或者所有的电子设备的收音装置拾音。
若启动的收音装置为多个时,可以为直接从所有电子设备中选择预设数量的收音装置,其可以为随机选择,也可以为选择位于不同方位的多个电子设备等。
在通过多个电子设备或者所有的电子设备的收音装置拾音时,可以在拾音后,由会议设备对所有电子设备的收音装置拾取到的声音进行处理,以便得到清晰的第一音频数据进行输出。
本实施例公开了一种音频处理方法,确定与会议设备关联的至少两个电子设备,至少两个电子设备中每个电子设备至少包括收音装置,控制电子设备中的至少一个电子设备的收音装置启动以拾取声音数据,对声音数据进行处理,得到第一音频数据,输出第一音频数据。本方案中通过在会议过程中,控制由与会议设备关联的电子设备中的收音装置拾取声音,并由会议设备在对关联的电子设备的收音装置拾取的声音进行处理后输出,实现了通过与会议设备关联的电子设备的收音装置拾取声音,以提高拾取的声音的效果,避免了直接通过会议设备自身的收音装置拾取声音时可能导致的音量较小的问题。
本实施例公开了一种音频处理方法,其流程图如图3所示,包括:
步骤S31、确定与会议设备关联的至少两个电子设备,至少两个电子设备中每个电子设备至少包括收音装置;
步骤S32、控制电子设备中的至少一个电子设备的收音装置启动以拾取声音数据;
步骤S33、若声音数据为第一电子设备的收音装置拾取的,对声音数据进行降噪处理,得到第一音频数据;
步骤S34、若声音数据为至少两个第二电子设备的收音装置拾取的,对至少两个第二电子设备的收音装置分别拾取的声音信息进行重音过滤,得到第一音频数据;
步骤S35、输出第一音频数据。
若启动收音装置的电子设备仅为一个第一电子设备,由于该第一电子设备是基于环境信息确定的,则可确定第一电子设备是当前环境中与发言者的距离小于其他电子设备的设备,则该第一电子设备拾取到的声音为音量大于其他电子设备的设备。
会议设备在获得第一电子设备拾取到的声音后,对该声音数据进行降噪处理,以降低当前环境中除发声者发出的声音外的其他声音,从而使输出的音频数据更为清晰,满足会议中的音频输出条件。
若启动收音装置的电子设备为多个电子设备或者所有电子设备,由于拾取声音的电子设备的收音装置有多个,则由于不同的电子设备与发声者的距离不同,导致不同的电子设备的收音装置拾取到声音的时间不同,当会议设备接收到多个电子设备的收音装置拾取到的声音时,若不做处理直接输出,就会存在回声或拖音的问题,为了避免这一问题,就需要由会议设备对接收到的不同电子设备的收音装置拾取到的声音进行处理。
对接收到的不同电子设备的收音装置拾取到的声音进行处理,可以为:进行重音过滤,以保证处理后的声音不存在回音及拖音的情况,保证清晰度达到一定预设值。
具体的,可以为:确定至少两个第二电子设备中每个第二电子设备的收音装置分别拾取的声音信息,从至少两个第二电子设备分别拾取的至少两个声音信息中选取清晰度大于其他声音信息的声音信息,将其确定为第一音频数据。
即由于不同电子设备的收音装置分别拾取发声者发出的声音,并且,不同电子设备的收音装置与发声者之间的距离不同,就会导致不同的电子设备的收音装置拾取的声音信息的清晰度会不同,与发声者距离越近,收音装置拾取到的声音的清晰度越高。
会议设备从所有电子设备的收音装置分别拾取到的声音中选择清晰度最大的声音,直接将其确定为第一音频数据进行输出;或者,将选择的清晰度最大的声音进行降噪处理,将处理完成的声音确定为第一音频数据进行输出。
从多个电子设备的收音装置分别拾取到的声音中选择一个进行输出,避免了回音或拖音的情况发生,同时,直接选择清晰度最大的声音进行输出,保证了输出的音频数据的清晰度的问题。
或者,还可以为:将至少两个第二电子设备分别拾取的至少两个声音信息进行同步,以便于对声音信息进行加强处理,得到第一音频数据。
当不同电子设备的收音装置分别拾取声音时,由于不同电子设备的收音装置与发声者之间的距离不同,会导致不同电子设备的收音装置收取声音的起始时间不同,将不同电子设备的收音装置收取到的所有声音进行同步处理,以使得每个电子设备的收音装置收取到的声音的起始时间相同,这就避免了拖音、回音的存在;
并且,位于发声者不同位置的电子设备的收音装置收取到的声音的强弱不同,将不同位置的电子设备的收音装置收取到的声音同步后,实现声音的加强,保证了第一音频数据的音效。
本实施例公开了一种音频处理方法,确定与会议设备关联的至少两个电子设备,至少两个电子设备中每个电子设备至少包括收音装置,控制电子设备中的至少一个电子设备的收音装置启动以拾取声音数据,对声音数据进行处理,得到第一音频数据,输出第一音频数据。本方案中通过在会议过程中,控制由与会议设备关联的电子设备中的收音装置拾取声音,并由会议设备在对关联的电子设备的收音装置拾取的声音进行处理后输出,实现了通过与会议设备关联的电子设备的收音装置拾取声音,以提高拾取的声音的效果,避免了直接通过会议设备自身的收音装置拾取声音时可能导致的音量较小的问题。
本实施例公开了一种音频处理方法,其流程图如图4所示,包括:
步骤S41、获得至少两个电子设备发送的会议请求;
步骤S42、基于会议请求确定至少两个电子设备是否符合环境条件,将至少两个电子设备中符合环境条件的电子设备与会议设备关联,所述至少两个电子设备中每个电子设备至少包括收音装置;
步骤S43、控制电子设备中的至少一个电子设备的收音装置启动以拾取声音数据;
步骤S44、对声音数据进行处理,得到第一音频数据;
步骤S45、输出第一音频数据。
在会议开始前,电子设备与会议设备关联,其可以为:由电子设备向会议设备发送会议请求,请求与会议设备关联,只有在电子设备与会议设备关联之后,才能够在会议过程中使用该电子设备的收音装置。
会议设备确定电子设备是否符合环境条件,只有符合环境条件的电子设备才能够与会议设备关联。会议设备与电子设备符合环境条件可以为:电子设备为具有会议权限的设备,如:会议发起者已预先在会议设备中存储有与会者的相关信息,当电子设备的持有者的信息与会议设备中存储的与会者的相关信息匹配时,则可确定电子设备具有会议权限;或者,电子设备为公司内部的设备,则电子设备具有会议权限;或者,电子设备与会议设备处于同一局域网络中等。
当电子设备符合环境条件时,电子设备能够与会议设备关联。
在至少两个电子设备与会议设备关联后,会议过程中,可由会议设备控制电子设备中的至少一个电子设备的收音装置启动,以拾取声音数据,也可以为:由电子设备主动发送拾音请求,当会议设备基于该拾音请求启动该电子设备的收音装置后,由该电子设备的收音装置拾音。
此时,可以为:当某个与会者想要发言时,其通过对应的电子设备向会议设备发送拾音请求,当会议设备响应该拾音请求启动该电子设备的收音装置后,该与会者可以发言,并由其对应的电子设备的收音装置拾音。
在会议设备响应某个电子设备的拾音请求,启动该电子设备的收音装置时,会议设备控制其他电子设备的收音装置关闭,同时,会议设备的收音装置关闭,仅由该电子设备的收音装置拾音,以保证拾音效果。
本实施例公开了一种音频处理方法,确定与会议设备关联的至少两个电子设备,至少两个电子设备中每个电子设备至少包括收音装置,控制电子设备中的至少一个电子设备的收音装置启动以拾取声音数据,对声音数据进行处理,得到第一音频数据,输出第一音频数据。本方案中通过在会议过程中,控制由与会议设备关联的电子设备中的收音装置拾取声音,并由会议设备在对关联的电子设备的收音装置拾取的声音进行处理后输出,实现了通过与会议设备关联的电子设备的收音装置拾取声音,以提高拾取的声音的效果,避免了直接通过会议设备自身的收音装置拾取声音时可能导致的音量较小的问题。
本实施例公开了一种会议***,其结构示意图如图5所示,包括:
至少两个电子设备51及会议设备52。
其中,至少两个电子设备51中每个电子设备至少包括收音装置;
会议设备52用于确定与会议设备关联的至少两个电子设备,控制电子设备中的至少一个电子设备的收音装置启动以拾取声音数据;对声音数据进行处理,得到第一音频数据;输出第一音频数据。
本实施例公开的会议***是基于上述实施例公开的音频处理方法实现的,在此不再赘述。
本实施例公开了一种会议***,确定与会议设备关联的至少两个电子设备,至少两个电子设备中每个电子设备至少包括收音装置,控制电子设备中的至少一个电子设备的收音装置启动以拾取声音数据,对声音数据进行处理,得到第一音频数据,输出第一音频数据。本方案中通过在会议过程中,控制由与会议设备关联的电子设备中的收音装置拾取声音,并由会议设备在对关联的电子设备的收音装置拾取的声音进行处理后输出,实现了通过与会议设备关联的电子设备的收音装置拾取声音,以提高拾取的声音的效果,避免了直接通过会议设备自身的收音装置拾取声音时可能导致的音量较小的问题。
本实施例公开了一种会议设备,其结构示意图如图6所示,包括:
处理器61及存储器62。
其中,处理器61用于确定与会议设备关联的至少两个电子设备,至少两个电子设备中每个电子设备至少包括收音装置;控制电子设备中的至少一个电子设备的收音装置启动以拾取声音数据;对声音数据进行处理,得到第一音频数据,输出第一音频数据;
存储器62用于存储处理器执行上述处理过程的程序。
本实施例公开的会议设备是基于上述实施例公开的音频处理方法实现的,在此不再赘述。
本实施例公开了一种会议设备,确定与会议设备关联的至少两个电子设备,至少两个电子设备中每个电子设备至少包括收音装置,控制电子设备中的至少一个电子设备的收音装置启动以拾取声音数据,对声音数据进行处理,得到第一音频数据,输出第一音频数据。本方案中通过在会议过程中,由与会议设备关联的电子设备中的收音装置拾取声音,并由会议设备在对关联的电子设备的收音装置拾取的声音进行处理后输出,实现了通过与会议设备关联的电子设备的收音装置拾取声音,以提高拾取的声音的效果,避免了直接通过会议设备自身的收音装置拾取声音时可能导致的音量较小的问题。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种音频处理方法,所述方法包括:
确定与会议设备关联的至少两个电子设备,所述至少两个电子设备中每个电子设备至少包括收音装置;
控制所述电子设备中的至少一个电子设备的收音装置启动以拾取声音数据;
对所述声音数据进行处理,得到第一音频数据;
输出所述第一音频数据。
2.根据权利要求1所述的方法,其中,所述控制所述电子设备中的至少一个电子设备的收音装置启动以拾取声音数据,包括:
通过所述会议设备获得当前环境中的环境信息,基于所述环境信息确定第一电子设备,控制所述第一电子设备的收音装置启动,并关闭所述会议设备的收音装置;
获得所述第一电子设备的收音装置拾取的声音数据。
3.根据权利要求2所述的方法,其中,所述通过所述会议设备获得当前环境中的环境信息,基于所述环境信息确定第一电子设备,包括:
通过所述会议设备的收音装置拾取当前环境中的第一声音信息;
基于所述第一声音信息的声纹信息或发声位置信息确定与所述第一声音信息对应的第一电子设备。
4.根据权利要求2所述的方法,其中,所述通过所述会议设备获得当前环境中的环境信息,基于所述环境信息确定第一电子设备,包括:
通过所述会议设备的图像采集装置获得当前环境中的第一图像;
基于所述第一图像中的连续两帧图像确定发声者的人脸特征信息;
基于所述发声者的人脸特征信息确定与所述发声者的人脸特征信息匹配的第一电子设备。
5.根据1所述的方法,其中,所述控制所述电子设备中的至少一个电子设备的收音装置启动以拾取声音数据,包括:
控制所述电子设备中的至少两个第二电子设备的收音装置启动,并关闭所述会议设备的收音装置;
获得所述至少两个第二电子设备的收音装置拾取的声音数据。
6.根据权利要求2或5所述的方法,其中,所述对所述声音数据进行处理,得到第一音频数据,包括:
若所述声音数据为所述第一电子设备的收音装置拾取的,对所述声音数据进行降噪处理,得到第一音频数据;
若所述声音数据为所述至少两个第二电子设备的收音装置拾取的,对所述至少两个第二电子设备的收音装置分别拾取的声音信息进行重音过滤,得到第一音频数据。
7.根据权利要求6所述的方法,其中,所述对所述至少两个第二电子设备的收音装置分别拾取的声音信息进行重音过滤,得到第一音频数据,包括:
确定所述至少两个第二电子设备中每一个第二电子设备的收音装置分别拾取的声音信息;
从所述至少两个第二电子设备分别拾取的至少两个声音信息中选取清晰度大于其他声音信息的声音信息,将其确定为第一音频数据。
8.根据权利要求6所述的方法,其中,所述对所述至少两个第二电子设备的收音装置分别拾取的声音信息进行重音过滤,得到第一音频数据,包括:
将所述至少两个第二电子设备分别拾取的至少两个声音信息进行同步,以便于对声音信息进行加强处理,得到第一音频数据。
9.根据权利要求1所述的方法,其中,所述确定与会议设备关联的至少两个电子设备,包括:
获得至少两个电子设备发送的会议请求;
基于所述会议请求确定所述至少两个电子设备是否符合环境条件,将所述至少两个电子设备中符合环境条件的电子设备与所述会议设备关联。
10.一种会议***,包括:
至少两个电子设备,所述至少两个电子设备中每个电子设备至少包括收音装置;
会议设备,用于确定与所述会议设备关联的至少两个电子设备,控制所述电子设备中的至少一个电子设备的收音装置启动以拾取声音数据;对所述声音数据进行处理,得到第一音频数据;输出所述第一音频数据。
CN202210079239.7A 2022-01-24 2022-01-24 一种音频处理方法及会议*** Pending CN114401350A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210079239.7A CN114401350A (zh) 2022-01-24 2022-01-24 一种音频处理方法及会议***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210079239.7A CN114401350A (zh) 2022-01-24 2022-01-24 一种音频处理方法及会议***

Publications (1)

Publication Number Publication Date
CN114401350A true CN114401350A (zh) 2022-04-26

Family

ID=81233593

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210079239.7A Pending CN114401350A (zh) 2022-01-24 2022-01-24 一种音频处理方法及会议***

Country Status (1)

Country Link
CN (1) CN114401350A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115277959A (zh) * 2022-06-29 2022-11-01 深圳市声扬科技有限公司 拾音控制方法、拾音控制装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111833876A (zh) * 2020-07-14 2020-10-27 科大讯飞股份有限公司 会议发言控制方法、***、电子设备及存储介质
CN112423191A (zh) * 2020-11-18 2021-02-26 青岛海信商用显示股份有限公司 一种视频通话设备和音频增益方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111833876A (zh) * 2020-07-14 2020-10-27 科大讯飞股份有限公司 会议发言控制方法、***、电子设备及存储介质
CN112423191A (zh) * 2020-11-18 2021-02-26 青岛海信商用显示股份有限公司 一种视频通话设备和音频增益方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115277959A (zh) * 2022-06-29 2022-11-01 深圳市声扬科技有限公司 拾音控制方法、拾音控制装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US10848889B2 (en) Intelligent audio rendering for video recording
US9197974B1 (en) Directional audio capture adaptation based on alternative sensory input
JP6651989B2 (ja) 映像処理装置、映像処理方法、及び映像処理システム
US8175874B2 (en) Personalized voice activity detection
EP2538236A2 (en) Automatic camera selection for videoconferencing
US20110274293A1 (en) Method, device and communication terminal for adjusting volume adaptively
JP2020091465A (ja) ニューラルネットワークを使用した音クラスの識別
CN102902505A (zh) 具有增强音频的器件
CN110012331B (zh) 一种红外触发的远场双麦远场语音识别方法
US20240096343A1 (en) Voice quality enhancement method and related device
CN111199751B (zh) 一种麦克风的屏蔽方法、装置和电子设备
CN115482830B (zh) 语音增强方法及相关设备
CN114401350A (zh) 一种音频处理方法及会议***
JP5609431B2 (ja) 音量制御装置、音量制御方法およびプログラム
CN113225646B (zh) 音视频监控方法、装置、电子设备及存储介质
CN113329138A (zh) 视频拍摄方法、视频播放方法和电子设备
JP3838159B2 (ja) 音声認識対話装置およびプログラム
CN110265038B (zh) 一种处理方法及电子设备
CN116782089A (zh) 音信号处理方法及音信号处理装置
US11875800B2 (en) Talker prediction method, talker prediction device, and communication system
CN112634925B (zh) 一种音频调试的方法、装置及计算机设备
WO2018064883A1 (zh) 一种录音方法、装置、设备及计算机存储介质
JP2021197658A (ja) 収音装置、収音システム及び収音方法
KR101892268B1 (ko) 영상 회의 시 단말기를 제어하기 위한 방법, 장치 및 기록 매체
CN116866509B (zh) 会议现场画面跟踪方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination