CN104238576B

CN104238576B - 一种基于多麦的视频会议摄像头定位方法

Info

Publication number: CN104238576B
Application number: CN201410474230.1A
Authority: CN
Inventors: 毕永建
Original assignee: Xiamen Yealink Network Technology Co Ltd
Current assignee: Xiamen Yealink Network Technology Co Ltd
Priority date: 2014-09-17
Filing date: 2014-09-17
Publication date: 2017-02-15
Anticipated expiration: 2034-09-17
Also published as: CN104238576A

Abstract

本发明提供一种基于多麦的视频会议摄像头定位方法，所述多麦包括至少3个相对位置不变的通道，所述方法包括如下步骤：有远程的声音发出时，采集各通道的回声数据，确定能量值最大的主回声通道及其与主回声线的位置关系；利用主回声通道的位置确定麦克参考位置；有近端的声音发出时，采集各通道的声音能量值，置确定当前发言者位置方向；根据当前发言者位置方向确定摄像头方向。本发明根据多麦各通道的位置信息以及当前接收到的声音能量，判断发言人位置，设计简单灵活，计算简便，无性能方面的消耗，自动调节摄像头的跟踪角度，保证当前会议主发言人在摄像头的拾取范围内，提升会议效果。

Description

一种基于多麦的视频会议摄像头定位方法

技术领域

本发明涉及视频通讯技术领域，尤其涉及一种基于多麦的视频会议摄像头定位方法。

背景技术

目前视频会议越来越普及，在远程会议或远程教育等商务活动中也发挥着越来越重要的沟通作用，传统的视频会议***的麦克与摄像头是独立的，为了达到与说话人面对面的效果，经常需要手动调整摄像头的位置，造成不便。

发明内容

本发明要解决的技术问题，在于提供一种基于多麦的视频会议摄像头定位方法，实现摄像头跟踪说话人位置自动调整方向，保证当前发言人能在摄像头的拾取范围内，提升会议的体验效果。

本发明是这样实现的：一种基于多麦的视频会议摄像头定位方法，所述多麦包括至少3个通道，且各通道相对位置不变，所述方法包括如下步骤：

步骤10、有远程的声音发出时，声音播放方向形成一不可见的主回声线，采集各通道的回声数据，确定能量值最大的通道为主回声通道，计算主回声通道与主回声线的位置关系；

步骤20、利用主回声通道的位置确定麦克参考位置；

步骤30、有近端的声音发出时，采集各通道的声音能量值，确定能量最强的通道为主通道，并根据麦克参考位置计算主通道位置，再根据主通道位置确定当前发言者位置；

步骤40、根据当前发言者位置获得摄像头正确的位置，旋转摄像头到正确位置上上。

进一步的，所述步骤10具体为：有电视上的音响发出声音时，声音播放方向形成一不可见的主回声线，采集各通道的回声能量值，计算通道i的回声能量值公式为：Engecho(i)＝∑cap(i,j)²，其中，cap(i,j)是通道i在采样点j的采样值；计算各个通道的能量值后对能量值大小进行排序，取能量值前3的通道i₀、i₁和i₂，且取其中最大能量值对应的通道i₀为主回声通道，根据这3个通道的能量值间的关系确定主回声通道i₀到麦克中心的连线与主回声线的夹角τ为：

进一步的，所述多麦为4麦，即所述多麦有4个相对位置确定的通道，这4个通道关于麦克中心对称。

进一步的，所述步骤20具体为：所述4个各通道按逆时针方向标为mic0、mic1、mic2和mic3，以mic0为其他通道的麦克参考位置，根据τ确定mic0到麦克中心的连线与主回声线的夹角θ为：θ＝180°-((4-i₀)*90°+τ)。

进一步的，所述步骤30进一步包括：

步骤31、有近端的声音发出时，采集各通道的声音能量值，计算通道i的回声能量值公式为：Engecho(i)＝∑cap(i,j)²，其中，cap(i,j)是通道i在采样点j的采样值；对能量值大小进行排序，取能量值最大的通道i₀，判断通道i₀相对mic0的位置，即mic0到麦克中心的连线与最大通道i₀的顺时针方向的夹角为：γ＝(4-i₀)*90°；

步骤32、根据γ的值与θ的值计算主通道位置，从而确定当前发言者位置，即当前发言者位置到麦克中心的连线与主回声线的夹角α近似为：α＝γ+θ；把α的范围调整到-180～180度：

进一步的，所述步骤40中获得摄像头正确的位置具体为：假设当前发言者到麦克的距离等于摄像头到麦克的距离，则根据α值计算摄像头与主回声线的夹角β，β值近似为：β＝α/2。

本发明具有如下优点：

(1)根据多麦各通道的位置信息以及当前接收到的声音能量，判断发言人位置，所有算法按照自适应设计，设计简单灵活，计算简单，无性能方面的消耗；

(2)自动调节摄像头的跟踪角度，保证当前会议主发言人在摄像头的拾取范围内，提升会议效果。

附图说明

下面参照附图结合实施例对本发明作进一步的说明。

图1为本发明方法执行流程图。

图2为本发明会议***多麦及摄像头位置示意图。

具体实施方式

如图1和图2所示，一种基于多麦的视频会议摄像头定位方法，所述多麦包括至少3个通道，且各通道相对位置不变，本实施例中的多麦为4麦，由4个咪头组成的麦克，每个咪头为一个通道，且各通道的相对位置不变，为方便计算，各通道按照一定的顺序标号，如按逆时针方向进行标号，O为麦克中心，A为当前发言人的位置，B为摄像头位置，C为电视机，所述多麦的4个通道关于麦克中心O对称，所述方法包括如下步骤：

步骤10、有远程的声音通过电视的音响发出时，声音播放方向形成一不可见的主回声线，如图2中，主回声线是电视机C的音响发出的回声方向且与BO在同一直线上，采集各通道的回声能量值，计算通道i的回声能量值公式为：Engecho(i)＝∑cap(i,j)²，其中，cap(i,j)是通道i的采样值，通道i的取值范围为0～3，分别表示mic0、mic1、mic2和mic3，j表示音频采集中的一采样点，假设一帧为10ms，有160个采样点，则公式∑cap(i,j)²就是计算通道i在一帧中160个采样点的能量的累计作为该通道计算的能量值，计算各个通道的能量值后，对能量值大小进行排序，取能量值前3的通道i₀、i₁和i₂及这些通道对应的能量值，正常情况下这3路通道的中间位置的通道能量值最大(如这3路通道为mic1、mic2和mic3，则mic2能量值最大，此时i₀取值为2，当出现不连续的通道组合时，如mic0、mic1和mic3，则需要对通道进行重新映射，把3看成-1以保证与其他两个通道的连续性，保证中间位置的通道能量值最大)，取最大能量值对应的通道i₀为主回声通道，理想情况下主回声通道应与主回声线BO在同一直线上，但实际上可能存在偏差，为追求更高精度可根据这3个通道的能量值进行位置修正，进行位置修正需要确定主回声通道与主回声线BO的位置关系，计算修正角度τ即麦克中心O到主回声通道的连线与OB的夹角：

步骤20、4个通道按逆时针方向标为mic0、mic1、mic2和mic3，以mic0为其他通道的麦克参考位置，根据τ确定mic0的位置，即确定mic0到麦克中心O的连线与主回声线BO的夹角θ为：θ＝180°-((4-i₀)*90°+τ)，其中θ是指mic0到麦克中心O的连线以主回声线BO延长线为轴，绕O点顺时针方向表示正值，逆时针方向表示负值，θ取值范围为-180～180度；

步骤30、有近端的声音发出时，即有室内发言者发言时，采集各通道的声音能量值，通过找到能量最强的主通道并根据麦克参考位置确定当前发言者位置方向，具体包括：

步骤31、有近端的声音发出时，采集各通道的声音能量值，计算通道i的回声能量值公式为：Engecho(i)＝∑cap(i,j)²，其中，cap(i,j)是通道i的采样值，通道i的取值范围为0～3，分别表示mic0、mic1、mic2和mic3，j表示音频采集中的一采样点，假设一帧为10ms，有160个采样点，则公式∑cap(i,j)²就是计算通道i在一帧中160个采样点的能量的累计作为该通道计算的能量值；对采集到的各通道的能量值大小进行排序，取能量值最大的通道i₀，判断通道i₀相对mic0的位置，即确定mic0到麦克中心O的连线与最大通道i₀的顺时针方向的夹角为：γ＝(4-i₀)*90°；

步骤32、根据γ的值与θ的值计算主通道位置，从而确定当前发言者位置，主通道是离当前发言者最近的通道，当前发言者的方向在主通道方向上，即当前发言者位置A到麦克中心O的连线AO与主回声线BO的夹角α近似为：α＝γ+θ；把α的范围调整到-180～180度：

步骤40、根据当前发言者位置方向获得摄像头正确的位置，即根据α值确定摄像头方向BA与主回声线BO的夹角β值，因为会议***的摄像头的拾取角度较大，一般可以近视假设AO＝BO，这样可以简单得到β的近似值为：β＝α/2，其中正值表示顺时针，负值表示逆时针，以上简化能够保证当前发言人在摄像头的拾取范围内，因此该简化是合理的，以主回声线BO为轴，β为正值表示顺时针，β为负值表示逆时针，根据计算出β值旋转摄像头到正确位置上。

虽然以上描述了本发明的具体实施方式，但是熟悉本技术领域的技术人员应当理解，我们所描述的具体的实施例只是说明性的，而不是用于对本发明的范围的限定，熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化，都应当涵盖在本发明的权利要求所保护的范围内。

Claims

1.一种基于多麦的视频会议摄像头定位方法，其特征在于：所述多麦包括至少3个通道，且各通道相对位置不变，所述方法包括如下步骤：

步骤10、有远程的声音发出时，声音播放方向形成一不可见的主回声线，采集各通道的回声数据，确定能量值最大的通道为主回声通道，计算主回声通道与主回声线的位置关系，所述步骤10具体为：有电视上的音响发出声音时，声音播放方向形成一不可见的主回声线，采集各通道的回声能量值，计算通道i的回声能量值公式为：Engecho(i)＝Σcap(i,j)²，其中，cap(i,j)是通道i在采样点j的采样值；计算各个通道的能量值后对能量值大小进行排序，取能量值前3的通道i₀、i₁和i₂，且取其中最大能量值对应的通道i₀为主回声通道，根据这3个通道的能量值间的关系确定主回声通道i₀到麦克中心的连线与主回声线的夹角τ为：

步骤20、利用主回声通道的位置确定麦克参考位置；

步骤40、根据当前发言者位置获得摄像头正确的位置，旋转摄像头到正确位置上。

2.根据权利要求1所述的一种基于多麦的视频会议摄像头定位方法，其特征在于：所述多麦为4麦，即所述多麦有4个相对位置确定的通道，这4个通道关于麦克中心对称。

3.根据权利要求2所述的一种基于多麦的视频会议摄像头定位方法，其特征在于：所述步骤20具体为：所述4个通道按逆时针方向标为mic0、mic1、mic2和mic3，以mic0为其他通道的麦克参考位置，根据τ确定mic0到麦克中心的连线与主回声线的夹角θ为：θ＝180°-((4-i₀)*90°+τ)。

4.根据权利要求3所述的一种基于多麦的视频会议摄像头定位方法，其特征在于：所述步骤30进一步包括：

步骤31、有近端的声音发出时，采集各通道的声音能量值，计算通道i的回声能量值公式为：Engecho(i)＝Σcap(i,j)²，其中，cap(i,j)是通道i在采样点j的采样值；对能量值大小进行排序，取能量值最大的通道i₀，判断通道i₀相对mic0的位置，即mic0到麦克中心的连线与最大通道i₀的顺时针方向的夹角为：γ＝(4-i₀)*90°；

5.根据权利要求4所述的一种基于多麦的视频会议摄像头定位方法，其特征在于：所述步骤40中获得摄像头正确的位置具体为：假设当前发言者到麦克的距离等于摄像头到麦克的距离，则根据α值计算摄像头与主回声线的夹角β，β值近似为：β＝α/2。