发明内容
本发明实施例要解决的技术问题是:提供一种视讯通信的控制方法和设备,克服现有的视讯会议控制操作依赖操作界面易用性和操作人员熟悉程度的缺点,从而方便对会议进行控制。
为解决上述技术问题,本发明实施例提供一种视讯通信的控制方法,包括:多点控制单元或会议管理中心接收终端发送的会议控制语音启动指令;所述多点控制单元或所述会议管理中心接收所述终端发送的语音;所述多点控制单元或所述会议管理中心根据所述会议控制语音启动指令将所述语音作为会议控制语音,并启动对所述会议控制语音进行识别;所述多点控制单元或所述会议管理中心从所述会议控制语音中识别出会议控制命令;所述多点控制单元基于识别出的会议控制命令执行会议控制操作,或者,所述会议管理中心将所述会议控制命令发送至多点控制单元以使得所述多点控制单元执行相应的会议控制操作。
本发明实施例提供一种视讯会议多点控制单元,包括:指令接收单元,用于接收终端发送的会议控制语音启动指令;语音接收单元,用于接收终端发送的语音;驱动单元,用于根据所述会议控制语音启动指令驱动识别单元对所述语音进行识别;识别单元,用于从接收的语音中识别出会议控制命令;执行单元,用于基于识别出的会议控制命令执行会议控制操作。
本发明实施例提供一种视讯会议管理中心,包括:指令接收单元,用于接收终端发送的会议控制语音启动指令;语音接收单元,用于接收终端发送的语音;驱动单元,用于根据所述会议控制语音启动指令驱动识别单元对所述语音进行识别;识别单元,用于从接收的语音中识别出会议控制命令;发送单元,用于发送识别出的会议控制命令至多点控制单元。
由上述本发明实施例提供的技术方案可以看出,本发明从语音中识别出会议控制命令,根据会议控制命令进行视讯会议控制操作。现有技术中视讯会议的控制通过操作人员对管理台或者终端的界面进行操作实现,而本发明通过语音来控制视讯会议,使得视讯会议控制操作不再依赖于操作界面的易用性和操作人员的熟悉程度,从而方便对会议进行控制。
具体实施方式
如图1所示为本发明实施例一控制视讯会议的方法示意图。终端与多点控制单元(MCU)之间存在语音通道,该语音通道既可以传输会议语音,也可以传输用来控制会议的会议控制语音。本实施例控制视讯会议的具体步骤如下:
步骤101:MCU接收终端发送的编码语音;
步骤102:MCU对接收的编码语音进行解码;
步骤103:MCU从解码后的语音中识别会议控制命令;
MCU对语音进行识别,可以采用专门的语音识别处理算法,通过分析输入语音的相关信息,并且与预存的会议控制语音信息相比较,两者相等或者相似就判断输入语音为对应的预存会议控制语音,从而对应出MCU内部与该会议控制语音对应的会议控制命令。
步骤104:如果识别出会议控制命令,MCU根据该会议控制命令直接执行相应的会议控制操作。
为了更精确地实现语音会控,MCU还可以在步骤104之前,把从语音中识别出的会议控制命令发送给终端,并通过终端反馈给用户。终端可通过字幕在屏幕上向用户显示会议控制命令,也可以将会议控制命令通过语音反馈给用户。终端侧的用户通过遥控器或者WEB界面对显示的会议控制命令进行反馈,如确认选择“是”,否则选择“否”。终端把用户反馈的结果发送给MCU,MCU根据用户反馈的结果进行操作。如果收到的反馈结果是确认,MCU根据该会议控制命令执行相应的会议控制操作,否则不进行处理。
本实施例中的步骤101~104并不限定本实施例的执行顺序,而是为了使描述更加清楚。
如图2所示为本发明实施例二控制视讯会议的方法示意图。终端侧用户如果需要用语音来进行会议控制,首先通过遥控器或者WEB界面启动语音会控,再输入会议控制语音。终端把会议控制语音启动指令发送至MCU后,MCU认为解码后的语音为会议控制语音,而会议语音则用静音代替。MCU对解码后的会议控制语音进行识别,并在收到终端发送的会议控制语音关闭指令后,停止对解码后的语音进行识别,恢复正常的会议语音。MCU根据识别出的会议控制命令直接执行相应的会议控制操作。MCU还可以将识别出的会议控制命令发送至终端,经用户确认后,再执行相应的会议控制操作,否则不执行。
本发明实施例一、实施例二均采用单语音通道。除此之外,还可以利用终端与MCU之间传输的双声道中的一个声道来达到传送会议控制语音的目的。在没有进行语音会控的时候,两个声道分别传送会议语音。当进行语音会控的时候,其中的一个声道(如左声道)可以用作会议控制语音的通道,把会议控制语音传送给MCU,而另一个声道则正常传送会议语音。MCU自动识别或是根据会议控制语音启动/关闭标志进行识别,并把对应声道的会议语音设置为静音,而另一个声道的会议语音不受影响。
如图3所示为本发明实施例三控制视讯会议的方法示意图。终端对用户发送的语音进行识别,如果识别出会议控制命令,将该会议控制命令直接发送至MCU执行相应的会议控制操作。终端还可以向用户反馈会议控制命令,经用户确认后,再发送至MCU,否则不发送。
如图4所示为本发明实施例四控制视讯会议的方法示意图。终端接收到用户侧的会议控制语音启动指令后,认为接收的语音为会议控制语音,而会议语音则用静音代替。终端对会议控制语音进行识别,并在收到用户侧的会议控制语音关闭指令后,停止对语音进行识别,恢复正常的会议语音。终端将识别出的会议控制命令直接发送至MCU执行相应的会议控制操作。终端还可以将识别出的会议控制命令向用户反馈,经用户确认后,再发送至MCU,否则不发送。
如图5所示为本发明实施例五控制视讯会议的方法示意图。由于会控操作可以由管理中心(RM)发起,并且RM软件主要安装在PC机上,所以可以在RM所在的PC机上增加语音输入设备及语音识别装置,由RM接收语音输入并且通过语音识别装置进行识别,识别出对应的会议控制命令后发送至MCU执行相应的会议控制操作。RM还可以经过反馈与用户确认后,再把会议控制命令发送给MCU,否则不发送。
如图6所示为本发明实施例六控制视讯会议的方法示意图。RM接收到用户侧的会议控制语音启动指令后,认为接收的语音为会议控制语音,而会议语音则用静音代替。RM对会议控制语音进行识别,并在收到用户侧的会议控制语音关闭指令后,停止对语音进行识别,恢复正常的会议语音。RM将识别出的会议控制命令直接发送至MCU执行相应的会议控制操作。RM还可以将识别出的会议控制命令向用户反馈,经用户确认后,再发送至MCU,否则不发送。
本发明实施例一至六不仅仅适用于视讯会议,还可适用于其他的视讯通信领域,例如点对点视讯通信等,只需用相应的网元替代多点控制单元完成通信控制操作即可。
如图7所示为本发明实施例七视讯会议多点控制单元的结构示意图,包括语音接收单元、识别单元和执行单元。语音接收单元接收终端发送的经过编码的语音,识别单元从解码后的语音中自动识别出会议控制命令,执行单元根据识别出的会议控制命令执行相应的会议控制操作。
本实施例MCU还可以包括反馈单元、指令接收单元和驱动单元。反馈单元在执行单元执行会议控制操作之前将会议控制命令发送至终端进行反馈,指令接收单元收到终端发送的确认指令后,驱动单元驱动执行单元进行相应的会议控制操作。
驱动单元还可以在指令接收单元接收到终端发送的会议控制语音启动指令后,驱动识别单元开始对解码后的语音进行识别;驱动单元还可以在指令接收单元接收到终端发送的会议控制语音关闭指令后,驱动识别单元停止识别。
如图8所示为本发明实施例八视讯会议终端,包括语音接收单元、识别单元和发送单元。语音接收单元接收用户侧发送的语音,识别单元从接收的语音中自动识别出会议控制命令,发送单元发送会议控制命令至MCU执行相应的会议控制操作。
本实施例终端还可以包括反馈单元、指令接收单元和驱动单元。反馈单元在发送单元发送会议控制命令至MCU之前向用户反馈识别出的会议控制命令,可以通过字幕在屏幕上显示,也可以通过语音告知用户,指令接收单元收到用户发送的确认指令后,驱动单元驱动发送单元发送会议控制命令至MCU执行相应的会议控制操作。
驱动单元还可以在指令接收单元接收到用户发送的会议控制语音启动指令后,驱动识别单元开始对语音进行识别;驱动单元还可以在指令接收单元接收到用户发送的会议控制语音关闭指令后,驱动识别单元停止识别。
如图9所示为本发明实施例九视讯会议管理中心,包括语音接收单元、识别单元和发送单元。语音接收单元接收用户侧发送的语音,识别单元从接收的语音中自动识别出会议控制命令,发送单元发送会议控制命令至MCU执行相应的会议控制操作。
本实施例管理中心还可以包括反馈单元、指令接收单元和驱动单元。反馈单元在发送单元发送会议控制命令至MCU之前向用户反馈识别出的会议控制命令,可以通过字幕在屏幕上显示,也可以通过语音告知用户,指令接收单元收到用户发送的确认指令后,驱动单元驱动发送单元发送会议控制命令至MCU执行相应的会议控制操作。
驱动单元还可以在指令接收单元接收到用户发送的会议控制语音启动指令后,驱动识别单元开始对语音进行识别;驱动单元还可以在指令接收单元接收到用户发送的会议控制语音关闭指令后,驱动识别单元停止识别。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。