CN110121048A

CN110121048A - 一种会议一体机的控制方法及控制***和会议一体机

Info

Publication number: CN110121048A
Application number: CN201810113995.0A
Authority: CN
Inventors: 秦向明; 陈国瑞; 刘永龙
Original assignee: Qingdao Haier Multimedia Co Ltd
Current assignee: Qingdao Haier Multimedia Co Ltd
Priority date: 2018-02-05
Filing date: 2018-02-05
Publication date: 2019-08-13

Abstract

本发明公开了一种会议一体机的控制方法及控制***和会议一体机，属于会议一体机领域。控制方法包括：获取第一手势图像；依据第一手势图像，获取发言人方位信息；依据发言人方位信息，定向增强发言人所在方位的语音。控制***能够实现上述控制方法。会议一体机包括本体、摄像头和前述控制***，以及拾音装置。本发明实施例中，通过手势识别技术，将发言人的位置进行定位，并依据定位信息，利用语音定向增强技术，定向增强发言人所在方位的语音，然后对该定向增强后的语音数据做强化处理，即可增强发言人所在方向的语音，提高信噪比，使得拾音装置不仅听的远，而且听的清，提高了会议体验以及会议效果。

Description

一种会议一体机的控制方法及控制***和会议一体机

技术领域

本发明涉及会议一体机技术领域，特别涉及一种会议一体机的控制方法及控制***和会议一体机。

背景技术

目前，在利用会议一体机进行视频会议时，为了使发言人的声音清晰，一般会放置一个话筒在会议桌上，发言时将话筒放在发言人前面，或者，每个参会者面前都会放一个话筒，不方便，也不智能。而且，如果控制不好话筒与发言人的距离，还会出现啸叫，严重影响会议体验以及会议效果。

发明内容

本发明实施例提供了一种会议一体机的控制方法及控制***和会议一体机。为了对披露的实施例的一些方面有一个基本的理解，下面给出了简单的概括。该概括部分不是泛泛评述，也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念，以此作为后面的详细说明的序言。

根据本发明实施例的第一方面，提供了一种会议一体机的控制方法，包括，

获取第一手势图像；

依据所述第一手势图像，获取发言人方位信息；

依据所述发言人方位信息，定向增强发言人所在方位的语音。

本发明实施例的控制方法中，通过手势识别技术，将发言人的位置进行定位，并依据定位信息，利用语音定向增强技术，定向增强发言人所在方位的语音，然后对该定向增强后的语音数据做强化处理，即可增强发言人所在方向的语音，提高信噪比，使得拾音装置不仅听的远，而且听的清，避免了目前一个话筒轮流使用或者每个参会者都配备一个话筒的弊端，提高了会议体验以及会议效果。

一种可选的实施例中，所述控制方法，还包括，

依据所述发言人方位信息，获取摄像头转向参数；

依据所述摄像头转向参数，控制摄像头转向。

一种可选的实施例中，在所述获取发言手势图像之前，还包括，

判断发言人在发言前是否操作了第一手势；

若否，则获取多个会议图像；

依据所述多个会议图像，确定当前发言人，并获取当前发言人方位信息。

一种可选的实施例中，所述控制方法，还包括，

获取第二手势图像；

依据所述第二手势图像，控制全向收音；或者，同时控制全向收音和控制摄像头转回至初始位置。

一种可选的实施例中，所述控制方法，还包括，当控制开启会议一体机时，同时控制开启回声消除模式。

根据本发明实施例的第二方面，提供了一种会议一体机的控制***，包括，

第一获取模块，用于获取第一手势图像；

第一信息处理模块，用于依据所述第一手势图像，获取发言人方位信息；

音频处理模块，依据所述发言人方位信息，定向增强发言人所在方位的语音。

本发明实施例的控制***能够实现前述的控制方法，结构简单，实现容易。

一种可选的实施例中，所述控制***，还包括，

第二信息处理模块，用于依据所述发言人方位信息，获取摄像头转向参数；

驱动模块，用于依据所述摄像头转向参数，控制摄像头转向。

一种可选的实施例中，所述控制***，还包括，

判断模块，用于在所述第一获取模块获取发言手势图像之前，判断发言人在发言前是否操作第一手势；

第二获取模块，在所述判断模块判断发言人在发言前未操作第一手势时，用于获取多个会议图像；

第三信息处理模块，依据所述多个会议图像，确定当前发言人，并获取当前发言人方位信息；

所述音频处理模块，还用于依据所述第三信息处理模块获取的所述发言人方位信息，定向增强发言人所在方位的语音。

所述第二信息处理模块，还用于依据所述第三信息处理模块获取的所述发言人方位信息，获取摄像头转向参数。

一种可选的实施例中，所述第一获取模块，还用于获取第二手势图像；

所述音频处理模块，还用于取消定向增强发言人所在方位的语音，进行全收音；以及，

所述驱动模块，还用于控制摄像头转回至初始位置。

一种可选的实施例中，所述控制***，还包括，回声消除模块，用于消除回声对会议一体机的干扰。

根据本发明实施例的第三方面，提供了一种会议一体机，包括，会议一体机本体、摄像头和前述的控制***，

所述摄像头，采集会议视频，并为所述控制***的第一获取模块或第二获取模块提供第一手势图像；且可转向，使在所述控制***包括驱动模块时，依所述驱动模块的驱动而转向；所述摄像头内置或者外置于所述会议一体机本体，并将采集的视频画面传送至所述会议一体机本体进行显示；

所述控制***将处理后的语音数据传送至会议一体机本体，用于播放。

一种可选的实施例中，所述会议一体机，还包括，拾音装置，所述拾音装置具有呈阵列排布且位于同一平面上的多个拾音咪头。

一种可选的实施例中，以所述多个拾音咪头所在平面呈竖直的方式，将所述拾音装置固定设置。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种会议一体机的控制方法的流程示意图；

图2是根据另一示例性实施例示出的一种会议一体机的控制方法的流程示意图；

图3是根据另一示例性实施例示出的一种会议一体机的控制方法的流程示意图；

图4是根据另一示例性实施例示出的一种会议一体机的控制方法的流程示意图；

图5是根据一示例性实施例示出的一种会议一体机的控制***的结构框图；

图6是根据另一示例性实施例示出的一种会议一体机的控制***的结构框图；

图7是根据一示例性实施例示出的一种会议一体机的结构框图；

图8是根据一示例性实施例示出的一种拾音装置的结构示意图；

图9是根据一示例性实施例示出的一种拾音装置的结构示意图。

具体实施方式

以下描述和附图充分地示出本发明的具体实施方案，以使本领域的技术人员能够实践它们。实施例仅代表可能的变化。除非明确要求，否则单独的部件和功能是可选的，并且操作的顺序可以变化。一些实施方案的部分和特征可以被包括在或替换其他实施方案的部分和特征。本发明的实施方案的范围包括权利要求书的整个范围，以及权利要求书的所有可获得的等同物。在本文中，各实施方案可以被单独地或总地用术语“发明”来表示，这仅仅是为了方便，并且如果事实上公开了超过一个的发明，不是要自动地限制该应用的范围为任何单个发明或发明构思。本文中，诸如第一和第二等之类的关系术语仅仅用于将一个实体或者操作与另一个实体或操作区分开来，而不要求或者暗示这些实体或操作之间存在任何实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。本文中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的方法、产品等而言，由于其与实施例公开的方法部分相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

结合图1至图4所示，说明本发明实施例的一种会议一体机的控制方法。

图1为根据一示例性实施例示出的一种会议一体机的控制方法。如图1所示，控制方法，包括，

S110，获取第一手势图像。第一手势为设定手势，用于表示参会人员打算发言，如，举手。该第一手势图像的获取是从摄像头采集的会议视频影像中获取的。在获取过程中，利用手势识别技术，对会议视频影像进行分析，如，将会议视频影像的每帧图像进行手势识别分析，从而获取第一手势图像。

S120，依据所述第一手势图像，获取发言人方位信息。具体地，以所述第一手势图像的中心点为原点，建立平面坐标系；则发言人方位信息以平面坐标表示即可。当然，发言人方位信息不限于采用平面坐标系，采用其他可定位的信息亦可，如，极轴坐标系等。其中，发言人方位信息是以发言人的脸部为定位点的，提高声源定位的精度。

S130，依据所述发言人方位信息，定向增强发言人所在方位的语音。将发言人方位信息与拾音装置(如，麦克)的拾音方位预先建立对应关系，如，将拾音装置的拾音方位以拾音咪头的中心为原点，建立平面坐标系，与发言人方位信息的平面坐标建立一一对应关系即可。拾音装置(如，麦克)在拾音过程中，通过声源定位(即发言人方位信息)和波速形成使得有效语音信号相对坏境噪声信号的信噪比指标更高，定向增强，就可以时拾音装置不仅听的远，而且听的清。

图2是根据另一示例性实施例示出的一种会议一体机的控制方法。如图2所示，在图1所示的控制方法的基础上，本实施例的控制方法，还包括，

S140，依据所述发言人方位信息，获取摄像头转向参数。所述发言人方位信息为依据步骤S120获取的。则，摄像头转向参数以发言人方位信息的平面坐标表示即可。

S150，依据所述摄像头转向参数，控制摄像头转向，使发言人位于视频画面的中间位置。

本实施例的控制方法中，通过调整摄像头转向，保证发言人位于采集的视频影像的中间位置，提高会议体验和会议效果。

图3是根据另一示例性实施例示出的一种会议一体机的控制方法。如图3所示，在图1或者图2所示的控制方法的基础上，本实施例的控制方法，在步骤S110的所述获取发言手势图像之前，还包括，

S111，判断发言人在发言前是否操作第一手势。若是，执行前述的步骤S110至S130，或者执行前述的步骤S110至S150。若否，则执行步骤S160至S170。即当已经拾取到语音，而没有获取到第一手势图像时，即可判断发言人在发言前没有操作第一手势，本实施例控制方法即可进入下述的步骤S160至S170。

S160，获取多个会议图像。即获取当前发言人在发言时的多个会议图像。

S170，依据所述多个会议图像，确定当前发言人，并获取当前发言人方位信息。通过对多个会议图像的比较，结合图像识别技术，能够确定当前发言人。进而通过其中一个会议图像，就可获取当前发言人的方位信息。当前发言人方位信息的获取可依据步骤S120进行。

本发明实施例的会议一体机的控制方法中，还包括，当控制开启会议一体机时，同时控制开启回声消除模式。将现有的回声消除技术应用在会议一体机中，如，采用回波抵消方法，通过自适应方法估计回波信号的大小，然后在接收信号中减去此估计值以抵消回波。可有效消除会议过程中的啸叫现象。

图4是根据另一示例性实施例示出的一种会议一体机的控制方法。如图4所示，还包括，

S180，获取第二手势图像。第二手势为设定手势，用于表示发言人结束发言，如，手势“OK”，即，收回大拇指和食指，伸出剩余三指。该第一手势图像的获取是从摄像头采集的会议视频影像中获取的。在获取过程中，利用手势识别技术，对会议视频影像进行分析，如，将会议视频影像的每帧图像进行手势识别分析，从而获取第二手势图像。

S190，依据所述第二手势图像，控制全向收音；或者，同时控制全向收音和控制摄像头转回至初始位置。

本实施例的控制方法中，通过第二手势确定当前发言人发言结束，并将拾音装置的定向增强取消，进行全向收音。或者，在增加摄像头转向的实施例中，同时增加将摄像头转回至初始位置。方便下一发言人的定位信息的获取，以及定位信息的准确。

在一种可选的实施例中，结合图4所示，所述控制方法，还包括，S100，控制开启会议一体机时，同时控制开启回声消除模式。

结合图4所示，说明本发明实施例的一种会议一体机的控制方法，具体流程如下：

控制开启会议一体机，即，开启会议一体机本机、摄像头和拾音装置等。此时，摄像头的位置处于初始位置，该初始位置具体可以为能拍摄到全体参会人员的角度。拾音装置处于全向收音状态，接收各个方向传来的语音。

S100，同时控制开启回声消除模式。回声消除功能可消除对方通话对电视机的干扰，防止啸叫。

S111，判断发言人在发言前是否操作第一手势。

若是，执行前述的步骤S110至S130，或者执行前述的步骤S110至S150。

若否，则执行步骤S160至S170。

具体步骤操作参见前述相应部分即可。

在当前发言人结束后，作出表示发言结束的第二手势。此时，执行步骤S180至S190，具体如下：

S180，获取第二手势图像。

会议结束后，控制关闭拾音装置、摄像头和会议一体机本机等。

结合图5至图6，说明本发明实施例的第二方面，提供了一种会议室一体机的控制***。

图5为一示例性实施例示出的一种会议一体机的控制***。如图5所示，所述控制***，包括，

第一获取模块11，用于获取第一手势图像；

第一信息处理模块21，用于依据所述第一手势图像，获取发言人方位信息；

音频处理模块30，依据所述发言人方位信息，定向增强发言人所在方位的语音。

如图5所示，所述控制***，还包括，

第二信息处理模块22，用于依据所述发言人方位信息，获取摄像头转向参数；

驱动模块41，用于依据所述摄像头转向参数，控制摄像头转向，使发言人位于视频画面中间。

图6为另一示例性实施例示出的一种会议一体机的控制***。如图6所示，所述控制***，还包括，

判断模块10，用于在所述第一获取模块11获取发言手势图像之前，判断发言人在发言前是否操作第一手势；

第二获取模块12，在所述判断模块10判断发言人在发言前未操作第一手势时，用于获取多个会议图像；

第三信息处理模块23，依据所述多个会议图像，确定当前发言人，并获取当前发言人方位信息。

所述音频处理模块30，还用于依据所述第三信息处理模块23获取的所述发言人方位信息，定向增强发言人所在方位的语音。

所述第二信息处理模块22，还用于依据所述第三信息处理模块23获取的所述发言人方位信息，获取摄像头转向参数。

在一种可选的实施例中，所述第一获取模块11，还用于获取第二手势图像；

所述音频处理模块30，还用于取消定向增强发言人所在方位的语音，进行全收音；以及，

所述驱动模块41，还用于控制摄像头转回至初始位置。

在一种可选的实施例中，为了消除会议过程中的啸叫现象，还包括，回声消除模块(图未示)，用于消除回声对会议一体机的干扰，防止啸叫。

结合图7至图8，说明本发明实施例的第三方面，提供了一种会议室一体机。

图7为一示例性实施例示出的一种会议一体机。如图7所示，会议一体机，包括会议一体机本体50、摄像头60和前述的控制***。摄像头60采集会议视频，并为控制***的第一获取模块11或第二获取模块12提供第一手势图像；且可转向，使在所述控制***包括驱动模块41时，依所述驱动模块41的驱动而转向。摄像头60可内置或者外置于所述会议一体机本体50，并采集的视频画面传送至所述会议一体机本体50进行显示，通过会议一体机本体50内部的图像处理后(采用常规图像处理手段即可)，显示在显示屏上。

控制***将处理后的语音数据传送至会议一体机本体50，用于播放；如，语音数据发送至外放装置，如音箱，进行播放。并进一步地，可使摄像头采集的视频画面中，发言人位于会议一体机的视频画面的中间位置。

如图7所示，转向摄像头60可选为外置。作为外置的转向摄像头60，其设置位置不限定，将其设置在能够采集到所有参会人员的位置即可。可转向摄像头的转向控制端与驱动模块41的驱动输出端连接即可。

本实施例的会议一体机中，还包括拾音装置70，其为控制***采集语音，由于控制***中的音频处理模块30具有定向增强发言人所在方位的语音的功能，所以拾音装置70采用一个，且固定设置即可，无需摆放在每个发言人面前。拾音装置70可以内置或者外置于所述会议一体机本体50。只要将其设置在方便拾取不同方位的语音的位置即可。

本实施例中，拾音装置70可以采用现有常规的麦克作为拾音装置。而在一种可选的实施例中，为了使音频处理模块30的定向增强发言人所在方位的语音的功能更好，如图8所示，拾音装置70的结构为：具有呈阵列排布且位于同一平面上的多个拾音咪头71。可选为，以圆形阵列排布。进一步可选地，该结构的拾音装置70外置于会议一体机本体50，且以所述多个拾音咪头71所在平面呈竖直的方式，将所述拾音装置70固定设置。该结构的拾音装置70的多个拾音咪头接收到的语音强度是不同的，因此其本身即可输出具有不同语音强度的数字信号，该些具有不同语音强度的数字信号再经过音频处理模块30定向增强后，能进一步提高语音识别率和准确率。

本实施例的拾音装置70中，呈圆形阵列排布且位于同一平面上的多个拾音咪头71的个数为12个，等距排布在圆周上，依据发言人定位信息，确定位于发言人的方位方向上的其中2-3个拾音咪头，并增强该2-3个拾音咪头的语音。此时，发言人方位信息和该拾音装置70结构相结合，进一步提高提高语音识别率和准确率。

如图9所示，本实施例的拾音装置70中,还包括壳体72，将呈阵列排布且位于同一平面上的多个拾音咪头71是指在壳体72内，并在与拾音咪头71的进声孔相对的壳体上开设收音孔721。拾音装置70为独立的拾音器产品，安装方便。具体地，所述壳体72可以采用外形为甜甜圈形状的圆环，方便对咪头阵列进行布局设置，且美观。其中，多个拾音咪头71在壳体72内部的固定方式，具体如下：在壳体72的一侧面的内壁的与多个拾音咪头71相应的位置上开设安装柱孔，将拾音咪头71固定设置在相应的安装柱孔的孔内，如采用弹性圈(如，硅胶套圈)将拾音咪头71固定塞设在安装柱孔的孔内。并保证拾音咪头71的进声孔朝向壳体72的开设安装柱孔的侧面上的收音孔721的方式固定。也可采用其他现有常规手段，不限定。为了方便拾音装置70与外接设备的连接，增设了接口，接口设置在壳体72上，设置位置不限定。多个拾音咪头72的输出端分别与接口的输入端连接，用于将拾音装置70拾取的多个语音信号通过数据线73传送至外接处理单元。

在一种可选的实施例中，本实施例的会议一体机的控制***中的回声消除模块采用回波抵消器即可，实现消除会议过程中的啸叫现象的目的，消除回声对会议一体机的干扰。

在一种可选的实施例中，本实施例的会议一体机的控制***中的音频处理模块30包括A/D转换电路、数字降噪处理电路和语音定向增强电路，A/D转换电路的数字信号输出端与数字降噪处理电路的信息输入端连接，A/D转换电路接收拾音装置70传送的语音模拟信号，将其进行A/D转换，得到多个数字信号，并将多个数字信号传送至数字降噪处理电路。数字降噪处理电路接收A/D转换电路传送的多个数字信号，对多个数字信号进行耦合，获得降噪处理后的语音数据；将降噪处理后的语音数据传送至语音定向增强电路，并结合发言人定位信息，从而获得定向增强后的语音数据。

本实施例的会议一体机中，控制***整合在会议一体机本体50内部即可，其中，控制***中各模块的功能实现可以在现有会议一体机本体50的主芯片上开发得到。将实现手势识别功能的第一信息处理模块21配置于主芯片上，当然主芯片还用于维持会议***应用的运行，如，采用AMLOGIC 966系列。其余的实现语音数据及图像数据处理的模块，可以采用XMOS的X1000芯片，包括第一获取模块11、第二获取模块12、第二信息处理模块22、第三信息处理模块23和音频处理模块30等。判断模块10采用现有常规判断电路即可。当检测到拾音装置已经开始拾音，而第一获取模块没有获取到具有第一手势的图像信息时，即可判断发言人在发言前没有操作第一手势。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器，上述指令可由处理器执行以完成前文所述的方法。上述非临时性计算机可读存储介质可以是只读存储器(Read Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、磁带和光存储设备等。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。所属技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本文所披露的实施例中，应该理解到，所揭露的方法、产品(包括但不限于装置、设备等)，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的流程及结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种会议一体机的控制方法，其特征在于，包括，

获取第一手势图像；

依据所述第一手势图像，获取发言人方位信息；

2.根据权利要求1所述的会议一体机的控制方法，其特征在于，还包括，

依据所述发言人方位信息，获取摄像头转向参数；

依据所述摄像头转向参数，控制摄像头转向。

3.根据权利要求1或2所述的会议一体机的控制方法，其特征在于，在所述获取发言手势图像之前，还包括，

判断发言人在发言前是否操作第一手势；

若否，则获取多个会议图像；

4.根据权利要求1或2所述的会议一体机的控制方法，其特征在于，还包括，当控制开启会议一体机时，同时控制开启回声消除模式。

5.一种会议一体机的控制***，其特征在于，包括，

第一获取模块，用于获取第一手势图像；

6.根据权利要求5所述的会议一体机的控制***，其特征在于，还包括，

7.根据权利要求5或6所述的会议一体机的控制***，其特征在于，还包括，

第三信息处理模块，依据所述多个会议图像，确定当前发言人，并获取当前发言人方位信息。

8.会议一体机，其特征在于，包括会议一体机本体、摄像头和权利要求5至7中任一项所述的控制***，

9.根据权利要求8所述的会议一体机，其特征在于，还包括，拾音装置，所述拾音装置具有呈阵列排布且位于同一平面上的多个拾音咪头。

10.根据权利要求9所述的会议一体机，其特征在于，以所述多个拾音咪头所在平面呈竖直的方式，将所述拾音装置固定设置。