CN112929724B

CN112929724B - 显示设备、机顶盒及远场拾音唤醒控制方法

Info

Publication number: CN112929724B
Application number: CN202011643691.9A
Authority: CN
Inventors: 吴汉勇; 贾亚洲; 刘承龙
Original assignee: Hisense Visual Technology Co Ltd
Current assignee: Hisense Visual Technology Co Ltd
Priority date: 2020-12-31
Filing date: 2020-12-31
Publication date: 2022-09-30
Anticipated expiration: 2040-12-31
Also published as: CN112929724A

Abstract

本申请公开了一种用于显示设备的远场拾音唤醒控制方法，基于所述显示设备的外部装置接口***的机顶盒，建立与所述机顶盒的通信连接；向所述机顶盒发出查询对端信息的指令，所述对端信息包括如下三种信息：所述机顶盒是否支持远场拾音、所述机顶盒的远场拾音功能是否开启、所述机顶盒的远场拾音唤醒词是否与所述显示设备相同；当所述对端信息中的至少一种信息为否时，基于外部输入的远场唤醒声音信号，所述显示设备响应所述远场唤醒声音信号。在显示设备和机顶盒的唤醒词相同的情况下，该方法能够避免二者同时唤醒，从而消除了对用户造成的困扰。此外，本申请还公开了一种机顶盒的远场拾音唤醒控制方法、显示设备及机顶盒。

Description

显示设备、机顶盒及远场拾音唤醒控制方法

技术领域

本申请涉及一种远场拾音技术领域，特别涉及一种用于显示设备的远场拾音唤醒控制方法。此外，本申请还涉及一种用于机顶盒的远场拾音唤醒控制方法。再者，本申请还涉及一种显示设备。最后，本申请还涉及一种机顶盒。

背景技术

随着家里的智能设备越来越多，在同品牌的产品上可能会出现功能重复的情况。以电视和智能OTT盒子为例，同品牌的产品一般情况下唤醒词相同，在客厅中使用唤醒词唤醒设备时，因为客厅中存在两个智能设备，一个智能电视，一个智能盒子，都支持语音唤醒，这样就会把两个设备唤醒，当用户使用电视观看网络节目时，希望唤醒电视而不是盒子，当用户使用电视的HDMI通道外接的OTT盒子观看节目时，希望唤醒的是盒子而不是盒子。如果同时唤醒则用户会产生困扰。

同理，涉及到不同品牌的电视和智能盒子，如果二者唤醒词相同，也会存在同样的问题，在此不再赘述。

发明内容

本申请要解决的第一个技术问题为提供一种用于显示设备的远场拾音唤醒控制方法，在显示设备和机顶盒的唤醒词相同的情况下，该方法能够避免二者同时唤醒，从而消除了对用户造成的困扰。此外，本申请第二个要解决的技术问题为提供一种机顶盒的远场拾音唤醒控制方法。再者，本申请第三个要解决的技术问题为提供一种显示设备。最后，本申请第四个要解决的技术问题为提供一种机顶盒。

为解决上述第一个技术问题，本申请提供一种用于显示设备的远场拾音唤醒控制方法，基于所述显示设备的外部装置接口***的机顶盒，建立与所述机顶盒的通信连接；

向所述机顶盒发出查询对端信息的指令，所述对端信息包括如下三种信息：

所述机顶盒是否支持远场拾音、所述机顶盒的远场拾音功能是否开启、所述机顶盒的远场拾音唤醒词是否与所述显示设备相同；

当所述对端信息中的至少一种信息为否时，基于外部输入的远场唤醒声音信号，所述显示设备响应所述远场唤醒声音信号。

为解决上述第二个技术问题，本申请提供一种用于机顶盒的远场拾音唤醒控制方法，基于所述显示设备的外部装置接口，建立与所述显示设备的通信连接；

接收所述显示设备发出的查询对端信息的指令，所述对端信息包括如下三种信息：

当所述对端信息中的至少一种信息为否时，所述机顶盒不响应外部输入的远场唤醒声音信号。

为解决上述第三个技术问题，本申请提供一种显示设备，包括：

声音采集器，被配置为采集外部的声音信号；

外部装置接口，被配置为与外部的机顶盒连接；

控制器，被配置为：

为解决上述第四个技术问题，本申请提供一种机顶盒，包括：

声音采集器，被配置为采集外部的声音信号；

机顶盒装置接口，被配置为与外部的显示设备连接；

控制器，被配置为：

以下介绍本申请实施例的技术效果：

在一种实施例中，本申请所提供的一种用于显示设备的远场拾音唤醒控制方法，基于所述显示设备的外部装置接口***的机顶盒，建立与所述机顶盒的通信连接；向所述机顶盒发出查询对端信息的指令，所述对端信息包括如下三种信息：所述机顶盒是否支持远场拾音、所述机顶盒的远场拾音功能是否开启、所述机顶盒的远场拾音唤醒词是否与所述显示设备相同；当所述对端信息中的至少一种信息为否时，基于外部输入的远场唤醒声音信号，所述显示设备响应所述远场唤醒声音信号。当所述对端信息中的三种信息均为是时，判断当前所述显示设备是否在所述机顶盒所在的外部装置接口的通信通道下；如果是，则控制所述机顶盒响应外部输入的远场唤醒声音信号；如果否，则所述显示设备自身响应外部输入的远场唤醒声音信号。

综上所述，在显示设备和机顶盒的唤醒词相同的情况下，上述方法能够避免二者同时唤醒，从而消除了对用户造成的困扰。

此外，本申请所提供的一种用于机顶盒的远场拾音唤醒控制方法、显示设备及机顶盒，其技术效果与上文相同，在此不再赘述。

附图说明

为了更清楚地说明本申请实施例或相关技术中的实施方式，下面将对实施例或相关技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1示出了根据一些实施例的显示设备与控制装置之间操作场景；

图2示出了根据一些实施例的控制设备100的硬件配置框图；

图3示出了根据一些实施例的显示设备200的硬件配置框图；

图4示出了根据一些实施例的显示设备200中软件配置图；

图5示出了根据一些实施例的显示设备200中应用程序的图标控件界面显示图；

图6示出了一些实施例的网络架构图；

图7为本申请一种实施例中显示设备与机顶盒之间的连接关系示意图；

图8为本申请一种实施例中的一种用于显示设备的远场拾音唤醒控制方法的逻辑流程图；

图9为本申请一种实施例中的一种用于机顶盒的远场拾音唤醒控制方法的逻辑流程图；

图10为本申请一种实施例中显示设备与机顶盒之间的信令时序图；

图11为本申请再一种实施例中的远场拾音唤醒控制方法的逻辑流程图；

图12为本申请又一种实施例中的远场拾音唤醒控制方法的逻辑流程图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

在本申请的说明书和权利要求书及上述附图中的描述的一些流程中，包含了按照特定顺序出现的多个操作，但是应该清楚了解，这些操作可以不按照其在本文中出现的顺序来执行或并行执行，操作的序号如101、102等，仅仅是用于区分开各个不同的操作，序号本身不代表任何的执行顺序。另外，这些流程可以包括更多或更少的操作，并且这些操作可以按顺序执行或并行执行。需要说明的是，本文中的“第一”、“第二”等描述，是用于区分不同的消息、设备、模块等，不代表先后顺序，也不限定“第一”和“第二” 是不同的类型。

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在一些实施例中，控制装置100可以是遥控器，遥控器和显示设备的通信包括红外协议通信或蓝牙协议通信，及其他短距离通信方式，通过无线或有线方式来控制显示设备200。用户可以通过遥控器上按键、语音输入、控制面板输入等输入用户指令，来控制显示设备200。

在一些实施例中，也可以使用智能设备300(如移动终端、平板电脑、计算机、笔记本电脑等)以控制显示设备200。例如，使用在智能设备上运行的应用程序控制显示设备200。

在一些实施例中，显示设备200还可以采用除了控制装置100和智能设备300之外的方式进行控制，例如，可以通过显示设备200设备内部配置的获取语音指令的模块直接接收用户的语音指令控制，也可以通过显示设备200设备外部设置的语音控制设备来接收用户的语音指令控制。

在一些实施例中，显示设备200还与服务器400进行数据通信。可允许显示设备200通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。服务器400可以向显示设备 200提供各种内容和互动。服务器400可以是一个集群，也可以是多个集群，可以包括一类或多类服务器。

图2示例性示出了根据示例性实施例中控制装置100的配置框图。如图2所示，控制装置100包括控制器110、通信接口130、用户输入/输出接口140、存储器、供电电源。控制装置100可接收用户的输入操作指令，且将操作指令转换为显示设备200可识别和响应的指令，起用用户与显示设备200之间交互中介作用。

图3示出了根据示例性实施例中显示设备200的硬件配置框图。

在一些实施例中，显示设备200包括调谐解调器210、通信器220、检测器230、外部装置接口240、控制器250、显示器260、音频输出接口270、存储器、供电电源、用户接口中的至少一种。

在一些实施例中控制器包括处理器，视频处理器，音频处理器，图形处理器，RAM，ROM，用于输入/输出的第一接口至第n接口。

在一些实施例中，显示器260包括用于呈现画面的显示屏组件，以及驱动图像显示的驱动组件，用于接收源自控制器输出的图像信号，进行显示视频内容、图像内容以及菜单操控界面的组件以及用户操控UI界面。

在一些实施例中，显示器260可为液晶显示器、OLED显示器、以及投影显示器，还可以为一种投影装置和投影屏幕。

在一些实施例中，通信器220是用于根据各种通信协议类型与外部设备或服务器进行通信的组件。例如：通信器可以包括Wifi模块，蓝牙模块，有线以太网模块等其他网络通信协议芯片或近场通信协议芯片，以及红外接收器中的至少一种。显示设备200可以通过通信器 220与外部控制设备100或服务器400建立控制信号和数据信号的发送和接收。

在一些实施例中，用户接口，可用于接收控制装置100(如：红外遥控器等)的控制信号。

在一些实施例中，检测器230用于采集外部环境或与外部交互的信号。例如，检测器230 包括光接收器，用于采集环境光线强度的传感器；或者，检测器230包括图像采集器，如摄像头，可以用于采集外部环境场景、用户的属性或用户交互手势，再或者，检测器230包括声音采集器，如麦克风等，用于接收外部声音。

在一些实施例中，外部装置接口240可以包括但不限于如下：高清多媒体接口接口(HDMI)、模拟或数据高清分量输入接口(分量)、复合视频输入接口(CVBS)、USB输入接口(USB)、RGB端口等任一个或多个接口。也可以是上述多个接口形成的复合性的输入/输出接口。

在一些实施例中，调谐解调器210通过有线或无线接收方式接收广播电视信号，以及从多个无线或有线广播电视信号中解调出音视频信号，如以及EPG数据信号。

在一些实施例中，控制器250和调谐解调器210可以位于不同的分体设备中，即调谐解调器210也可在控制器250所在的主体设备的外置设备中，如外置机顶盒等。

在一些实施例中，控制器250，通过存储在存储器上中各种软件控制程序，来控制显示设备的工作和响应用户的操作。控制器250控制显示设备200的整体操作。例如：响应于接收到用于选择在显示器260上显示UI对象的用户命令，控制器250便可以执行与由用户命令选择的对象有关的操作。

在一些实施例中，所述对象可以是可选对象中的任何一个，例如超链接、图标或其他可操作的控件。与所选择的对象有关操作有：显示连接到超链接页面、文档、图像等操作，或者执行与所述图标相对应程序的操作。

在一些实施例中控制器包括中央处理器(Central Processing Unit，CPU)，视频处理器，音频处理器，图形处理器(Graphics Processing Unit，GPU)，RAM Random AccessMemory， RAM)，ROM(Read-Only Memory,ROM)，用于输入/输出的第一接口至第n接口，通信总线(Bus) 等中的至少一种。

CPU处理器。用于执行存储在存储器中操作***和应用程序指令，以及根据接收外部输入的各种交互指令，来执行各种应用程序、数据和内容，以便最终显示和播放各种音视频内容。CPU处理器，可以包括多个处理器。如，包括一个主处理器以及一个或多个子处理器。

在一些实施例中，图形处理器，用于产生各种图形对象，如：图标、操作菜单、以及用户输入指令显示图形等。图形处理器包括运算器，通过接收用户输入各种交互指令进行运算，根据显示属性显示各种对象；还包括渲染器，对基于运算器得到的各种对象，进行渲染，上述渲染后的对象用于显示在显示器上。

在一些实施例中，视频处理器，用于将接收外部视频信号，根据输入信号的标准编解码协议，进行解压缩、解码、缩放、降噪、帧率转换、分辨率转换、图像合成等视频处理，可得到直接可显示设备200上显示或播放的信号。

在一些实施例中，视频处理器，包括解复用模块、视频解码模块、图像合成模块、帧率转换模块、显示格式化模块等。其中，解复用模块，用于对输入音视频数据流进行解复用处理。视频解码模块，用于对解复用后的视频信号进行处理，包括解码和缩放处理等。图像合成模块，如图像合成器，其用于将图形生成器根据用户输入或自身生成的GUI信号，与缩放处理后视频图像进行叠加混合处理，以生成可供显示的图像信号。帧率转换模块，用于对转换输入视频帧率。显示格式化模块，用于将接收帧率转换后视频输出信号，改变信号以符合显示格式的信号，如输出RGB数据信号。

在一些实施例中，音频处理器，用于接收外部的音频信号，根据输入信号的标准编解码协议，进行解压缩和解码，以及降噪、数模转换、和放大处理等处理，得到可以在扬声器中播放的声音信号。

在一些实施例中，用户可在显示器260上显示的图形用户界面(GUI)输入用户命令，则用户输入接口通过图形用户界面(GUI)接收用户输入命令。或者，用户可通过输入特定的声音或手势进行输入用户命令，则用户输入接口通过传感器识别出声音或手势，来接收用户输入命令。

在一些实施例中，“用户界面”，是应用程序或操作***与用户之间进行交互和信息交换的介质接口，它实现信息的内部形式与用户可以接受形式之间的转换。用户界面常用的表现形式是图形用户界面(Graphic User Interface，GUI)，是指采用图形方式显示的与计算机操作相关的用户界面。它可以是在电子设备的显示屏中显示的一个图标、窗口、控件等界面元素，其中控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、Widget 等可视的界面元素。

在一些实施例中，显示设备的***可以包括内核(Kernel)、命令解析器(shell)、文件 ***和应用程序。内核、shell和文件***一起组成了基本的操作***结构，它们让用户可以管理文件、运行程序并使用***。上电后，内核启动，激活内核空间，抽象硬件、初始化硬件参数等，运行并维护虚拟内存、调度器、信号及进程间通信(IPC)。内核启动后，再加载 Shell和用户应用程序。应用程序在启动后被编译成机器码，形成一个进程。

参见图4，在一些实施例中，将***分为四层，从上至下分别为应用程序(Applications) 层(简称“应用层”)，应用程序框架(Application Framework)层(简称“框架层”)，安卓运行时(Android runtime)和***库层(简称“***运行库层”)，以及内核层。

在一些实施例中，应用程序层中运行有至少一个应用程序，这些应用程序可以是操作系统自带的窗口(Window)程序、***设置程序或时钟程序等；也可以是第三方开发者所开发的应用程序。在具体实施时，应用程序层中的应用程序包不限于以上举例。

框架层为应用程序提供应用编程接口(application programming interface，API)和编程框架。应用程序框架层包括一些预先定义的函数。应用程序框架层相当于一个处理中心，这个中心决定让应用层中的应用程序做出动作。应用程序通过API接口，可在执行中访问系统中的资源和取得***的服务。

如图4所示，本申请实施例中应用程序框架层包括管理器(Managers)，内容提供者(Content Provider)等，其中管理器包括以下模块中的至少一个：活动管理器(ActivityManager)用与和***中正在运行的所有活动进行交互；位置管理器(Location Manager)用于给***服务或应用提供了***位置服务的访问；文件包管理器(Package Manager)用于检索当前安装在设备上的应用程序包相关的各种信息；通知管理器(NotificationManager) 用于控制通知消息的显示和清除；窗口管理器(Window Manager)用于管理用户界面上的括图标、窗口、工具栏、壁纸和桌面部件。

在一些实施例中，活动管理器用于管理各个应用程序的生命周期以及通常的导航回退功能，比如控制应用程序的退出、打开、后退等。窗口管理器用于管理所有的窗口程序，比如获取显示屏大小，判断是否有状态栏，锁定屏幕，截取屏幕，控制显示窗口变化(例如将显示窗口缩小显示、抖动显示、扭曲变形显示等)等。

在一些实施例中，***运行库层为上层即框架层提供支撑，当框架层被使用时，安卓操作***会运行***运行库层中包含的C/C++库以实现框架层要实现的功能。

在一些实施例中，内核层是硬件和软件之间的层。如图4所示，内核层至少包含以下驱动中的至少一种：音频驱动、显示驱动、蓝牙驱动、摄像头驱动、WIFI驱动、USB驱动、HDMI 驱动、传感器驱动(如指纹传感器，温度传感器，压力传感器等)、以及电源驱动等。

在一些实施例中，显示设备启动后可以直接进入预置的视频点播程序的界面，视频点播程序的界面可以如图5中所示，至少包括导航栏510和位于导航栏510下方的内容显示区，内容显示区中显示的内容会随导航栏中被选中控件的变化而变化。应用程序层中的程序可以被集成在视频点播程序中通过导航栏的一个控件进行展示，也可以在导航栏中的应用控件被选中后进行进一步显示。

在一些实施例中，显示设备启动后可以直接进入上次选择的信号源的显示界面，或者信号源选择界面，其中信号源可以是预置的视频点播程序，还可以是HDMI接口，直播电视接口等中的至少一种，用户选择不同的信号源后，显示器可以显示从不同信号源获得的内容。中的应用程序可以。

为清楚说明本申请的实施例，下面给出一些相关名词的解释。

实体：是指客观存在并可互相区别的事物，包括具体的人、事、物、机构、抽象的概念等。

知识图谱：本质上是一种语义网络，能够代表实体之间的语义关系。知识图谱中以实体为顶点或节点，以关系为边。知识图谱可通过多种方式构建，本申请实施例的重点并非如何构建知识图谱，所以对此不进行详细描述。

为清楚说明本申请的实施例，下面结合图6对本申请实施例提供的一种语音识别网络架构进行描述。

参见图6，图6为本申请实施例提供的一种语音识别网络架构示意图。图6中，智能设备用于接收输入的信息以及输出对该信息的处理结果。语音识别服务设备为部署有语音识别服务的电子设备，语义服务设备为部署有语义服务的电子设备，业务服务设备为部署有业务服务的电子设备。这里的电子设备可包括服务器、计算机等，这里的语音识别服务、语义服务(也可称为语义引擎)和业务服务为可部署在电子设备上的web服务，其中，语音识别服务用于将音频识别为文本，语义服务用于对文本进行语义解析，业务服务用于提供具体的服务如墨迹天气的天气查询服务、QQ音乐的音乐查询服务等。在一个实施例中，图6所示架构中可存在部署有不同业务服务的多个实体服务设备，也可以一个或多个实体服务设备中集合一项或多项功能服务。

一些实施例中，下面对基于图6所示架构处理输入智能设备的信息的过程进行举例描述，以输入智能设备的信息为通过语音输入的查询语句为例，上述过程可包括如下三个过程：

[语音识别]

智能设备可在接收到通过语音输入的查询语句后，将该查询语句的音频上传至语音识别服务设备，以由语音识别服务设备通过语音识别服务将该音频识别为文本后返回至智能设备。在一个实施例中，将查询语句的音频上传至语音识别服务设备前，智能设备可对查询语句的音频进行去噪处理，这里的去噪处理可包括去除回声和环境噪声等步骤。

[语义理解]

智能设备将语音识别服务识别出的查询语句的文本上传至语义服务设备，以由语义服务设备通过语义服务对该文本进行语义解析，得到文本的业务领域、意图等。

[语义响应]

语义服务设备根据对查询语句的文本的语义解析结果，向相应的业务服务设备下发╳查询指令以获取业务服务给出的查询结果。智能设备可从语义服务设备获取该查询结果并输出。作为一个实施例，语义服务设备还可将对查询语句的语义解析结果发送至智能设备，以由智能设备输出该语义解析结果中的反馈语句。

需要说明的是，图6所示架构只是一种示例，并非对本申请保护范围的限定。本申请实施例中，也可采用其他架构来实现类似功能，例如：三个过程全部或部分可以由智能终端来完成，在此不做赘述。

请参考图7，图7为本申请一种实施例中显示设备与机顶盒之间的连接关系示意图。

在一些实施例中，本申请所提供的的显示设备包括一个远场MIC，用于远场时拾音收音；本申请所提供的机顶盒包括一个远场MIC，也是用于远场时拾音收音。该显示设备通过外部装置接口与机顶盒进行通信连接。作为一种举例，如图7所示，该外部装置接口可以为HDMI 接口。此外，还需要说明的是，该显示设备可以为电视，也可以为其他进行音视频媒体内容播放的设备，本申请对此不作限制。

还需要说明的是，在本申请中，机顶盒可以为OTT机顶盒，也可以为IPTV盒子，当然也可以为其他类型的电视盒子，本申请对此不作限制。机顶盒是指代用户通过连接互联网观看在线视频(譬如，高清电视直播、电视剧、电影、综艺等)的一种高清终端设备，发展到现在，机顶盒可以简单的理解为互联网电视机顶盒。

请参考图8，图8为本申请一种实施例中的一种用于显示设备的远场拾音唤醒控制方法的逻辑流程图。

在一种实施例中，本申请所提供的一种用于显示设备的远场拾音唤醒控制方法，包括如下步骤：

S101:基于所述显示设备的外部装置接口***的机顶盒，建立与所述机顶盒的通信连接；

在这里，需要说明的是，作为一种举例，该外部装置接口可以为HDMI接口。显示设备与机顶盒之间通过该外部装置接口连接，进行信息指令的交互发送、内容的交互发送等。

在此，可以具体设计显示设备与机顶盒之间的一种通信连接方式，请参考图10，图10 为本申请一种实施例中显示设备与机顶盒之间的信令时序图。

在一些实施例中，所述“基于所述显示设备的外部装置接口***的机顶盒，建立与所述机顶盒的通信连接”，包括：

基于消费电子控制通信链路，所述显示设备将生成的第一随机信息发送给所述机顶盒，并接收所述机顶盒生成的第二随机信息；

所述显示设备启动网络监听，接收所述机顶盒发送的尝试网络连接的第一随机信息；在连接成功后，将所述第二随机信息返回给所述机顶盒，从而建立所述显示设备与所述机顶盒之间的基于网络的通信连接。

具体来讲，如图10所示，用R1代指第一随机信息，用R2代指第二随机信息。此外，对“消费电子控制通信链路”做出如下说明：

CEC，全称为Consumer Electronics Control，即消费电子控制通道。通过这条通道可以控制HDMI CEC Network上的设备间的相互交互和控制。CEC的作用即用户能够使用一个遥控器控制多个支持CEC的智能设备，从而无需使用多个遥控器来控制设备，例如：电视机(TV)、机顶盒产品和影音播放器等。而HDMI-CEC功能可以让用户利用CEC信号控制HDMI接口上所连接的装置。

在该步骤中，图中，机顶盒(也就是图中BOX)与显示设备(也就是图中TV)相连后，双方分别生成随机数R1、R2(代指，可扩展为UUID等唯一识别码)，各自通过消费电子控制通信链路(也就是HDMI-CEC链路)向对端发送这个随机数。此时因为HDMI线路是两端直连方式，所以线路上不存在第三方。

然后，任意端启动网络监听服务，另一端使用上一步中收到的随机数R1作为认证标识尝试连接，连接成功后校验回复的随机数是否是自己发出的R2。比如，可以显示设备一端启动网络监听服务，则所述显示设备启动网络监听，接收所述机顶盒发送的尝试网络连接的第一随机信息；在连接成功后，将所述第二随机信息返回给所述机顶盒，从而建立所述显示设备与所述机顶盒之间的基于网络的通信连接。

当然，也可以是机顶盒一端启动网络监听服务，该种实施例将在下文予以详细介绍。

此步骤完成后，BOX与TV端建立了基于网络的通信链路。

其它方式的连接通路，改变的只有CEC之后的建链方式，例如双方连入同一广域网server 等。或直接使用CEC进行数据交换(通信性能较网络慢)。

此外，还需要说明的是，在本申请中，显示设备与机顶盒之间建立的通信连接，是指包括CEC、网络或其它能把双方连接在一起并已进行过认证识别的链路。

在完成上述步骤S102后，本申请还包括如下步骤：

S102:向所述机顶盒发出查询对端信息的指令，所述对端信息包括如下三种信息：

S103:当所述对端信息中的至少一种信息为否时，基于外部输入的远场唤醒声音信号，所述显示设备响应所述远场唤醒声音信号。

在该步骤中，当显示设备一端与机顶盒一端进行通信连接后，显示设备向所述机顶盒发出查询对端信息的指令。在这里，对“对端”做出解释：显示设备与机顶盒分别为两端，双方互成“对端”，则显示设备的对端则为机顶盒，机顶盒的对端为显示设备。在该步骤中，显示设备发出的查询对端信息的指令，也就是发出的查询机顶盒一端信息的指令。

在这里，机顶盒一侧的对端信息包括如下至少三种：

所述机顶盒是否支持远场拾音、所述机顶盒的远场拾音功能是否开启、所述机顶盒的远场拾音唤醒词是否与所述显示设备相同。

显然，上述三种涉及机顶盒的对端信息，如果有一种为否，则就没有协调显示设备与机顶盒之间远场唤醒的必要。比如，如果机顶盒不支持远场拾音，则只有显示设备支持远场拾音，因而此时肯定不存在远场唤醒冲突。另外，如果机顶盒支持远场拾音，但是此时该机顶盒远场拾音功能关闭了，显然，此时也不会存在远场唤醒冲突。

再者，如果机顶盒支持远场拾音，并且此时该机顶盒远场拾音功能开启，但是该机顶盒远场拾音唤醒词与显示设备不同，比如，显示设备的唤醒词为“您好，海信小聚”，而机顶盒的唤醒词为“您好，电视盒子”。显然当用户说“您好，海信小聚”时，唤醒的是显示设备，也不会与机顶盒发生冲突。

因而，在上述实施例的基础上，可以做出进一步设计。比如，当所述对端信息中的三种信息均为是时，判断当前所述显示设备是否在所述机顶盒所在的外部装置接口的通信通道下；

如果是，则控制所述机顶盒响应外部输入的远场唤醒声音信号；

如果否，则所述显示设备自身响应外部输入的远场唤醒声音信号。

在该实施例中，当所述对端信息中的三种信息均为是时，也就是：

所述机顶盒是支持远场拾音；

所述机顶盒的远场拾音功能已经开启

所述机顶盒的远场拾音唤醒词与所述显示设备相同，比如，均为“您好，海信小聚”。

显然，当用户计划唤醒电视，说“您好，海信小聚”时，显示设备与机顶盒之间存在唤醒冲突的可能。

但是，还要进行如下判断，才能确定是否二者之间确实存唤醒冲突：

判断当前所述显示设备是否在所述机顶盒所在的外部装置接口的通信通道下；

在此，需要说明的是，判断当前所述显示设备是否在所述机顶盒所在的外部装置接口的通信通道下，作为一种举例，也就是判断所述显示设备是否在所述机顶盒所在的HDMI的通信通道下：

如果是，则说明当前显示设备播放是经由HDMI接口输送的机顶盒中的视频内容，也就是可以认为当前显示设备是工作在机顶盒模式下，因而此时当然应该由所述机顶盒响应外部输入的远场唤醒声音信号。

如果否，则说明当前显示设备播放不是经由HDMI接口输送的机顶盒中的视频内容，是显示设备自身从互联网上下载的内容或其他内容，也就是可以认为当前显示设备是工作在自身显示设备的模式下，因而此时当然应该由所述显示设备响应外部输入的远场唤醒声音信号。

此外，还需要说明的是，因为TV端(也就是显示设备一端)是主动控制显示内容的一端，所以TV端当前显示的是“非HDMI”还是“HDMI”。

“非HDMI”的情况包括不限于主页、应用、网络视频、ATV、DTV等，此时也就是上文所说的，所述显示设备不在所述机顶盒所在的HDMI的通信通道下。

“HDMI”的情况下，此时，也就是上文所说的，所述显示设备是在所述机顶盒所在的HDMI 的通信通道下。

但是，由于TV可能有多路输入设备(例如同一个TV上接了机顶盒、多个游戏机、电脑等)，因此这时应该进入判断“显示的HDMI内容来源”的流程。因而，本申请还包括如下步骤：

当所述显示设备的外部装置接口为多个、并均连接有外部输入设备时，所述“判断当前所述显示设备是否在所述机顶盒所在的外部装置接口的通信通道下”，包括：

接收所述机顶盒发送的带有标识信息的数据信号，基于预定的识别规则：

当识别到所述数据信号中携带有所述标识信息时，则当前所述显示设备是在所述机顶盒所在的外部装置接口的通信通道下；

当识别到所述数据信号中没有携带所述标识信息时，则当前所述显示设备不在所述机顶盒所在的外部装置接口的通信通道下。

在上述步骤中，当外部数据接口为HDMI时，可以使用HDMI数据本身进行设备识别。

此种方案下，BOX发出的HDMI信号中可增加某种特定标记(例如图10中的R1，当然也可以为其他标记)，TV端识别到此标记，即可得知当前正在解码播放的是相连的BOX的内容。增加标记的方案有：

标记的方案包括以下几种：

第一种、使用各种算法(例如lsb)隐写于视频帧中，或直接改造视频帧的某些内容(例如最低位全改为1)。

第二种、放在HDMI数据的data island period的Vendor Specific Infoframe中。

此外，还可以采用如下判断方案：

当前所述显示设备记录当前播放的多帧图像数据；

接收所述机顶盒发送的同一时间段内特定帧图像数据；

将所述特定帧图像数据与所述多帧图像数据进行一一比对；

当匹配成功后，则当前所述显示设备是在所述机顶盒所在的外部装置接口的通信通道下；

当匹配不成功后，则当前所述显示设备不在所述机顶盒所在的外部装置接口的通信通道下。

在上述步骤中，具体过程为：TV在切换至HDMI通道播放时续记录多帧图像数据，BOX端将播放时的某一帧数据通过1中建立的数据通路发送至TV，TV接收到数据后，与记录下的图像进行逐一匹配。如果匹配成功，则认为当前播放的内容就是相连BOX。

此外，本申请还提供一种用于机顶盒的远场拾音唤醒控制方法的实施例。具体的，请参考图9，图9为本申请一种实施例中的一种用于机顶盒的远场拾音唤醒控制方法的逻辑流程图。

在一种实施例中，如图9所示，一种用于机顶盒的远场拾音唤醒控制方法，包括：

步骤S2O1：基于所述显示设备的外部装置接口，建立与所述显示设备的通信连接；

步骤S2O2：接收所述显示设备发出的查询对端信息的指令，所述对端信息包括如下三种信息：

步骤S2O3：当所述对端信息中的至少一种信息为否时，所述机顶盒不响应外部输入的远场唤醒声音信号。

在一些实施例中，当所述对端信息中的三种信息均为是时，判断所述显示设备是否在所述机顶盒所在的外部装置接口的通信通道下；

如果是，则接收所述显示设备的控制指令，响应外部输入的远场唤醒声音信号；

如果否，则接收所述显示设备的控制指令，不响应外部输入的远场唤醒声音信号。

在一些实施例中，当所述显示设备的外部装置接口为多个、并均连接有外部输入设备时，所述“判断当前所述显示设备是否在所述机顶盒所在的外部装置接口的通信通道下”，包括：

向所述显示设备发送带有标识信息的数据信号，基于预定的识别规则，

当所述显示设备识别到所述数据信号中携带有所述标识信息时，则当前所述显示设备是在所述机顶盒所在的外部装置接口的通信通道下；

当所述显示设备识别到所述数据信号中没有携带所述标识信息时，则当前所述显示设备不在所述机顶盒所在的外部装置接口的通信通道下。

向所述显示设备发送特定帧图像数据；

所述显示设备将所述特定帧图像数据与自己记录的多帧图像数据进行一一比对；

在一些实施例中，所述“基于所述显示设备的外部装置接口，建立与所述显示设备的通信连接”，包括：

基于消费电子控制通信链路，所述机顶盒将生成的第二随机信息发送给所述显示设备，并接收所述显示设备生成的第一随机信息；

所述机顶盒启动网络监听，接收所述显示设备发送的尝试网络连接的第二随机信息；在连接成功后，将所述第一随机信息返回给所述显示设备，从而建立所述机顶盒与所述显示设备之间的基于网络的通信连接。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的一种用于机顶盒的远场拾音唤醒控制方法的工作过程和技术效果，可以参考一种用于显示设备的远场拾音唤醒控制方法实施例中的对应过程和技术效果，在此不再赘述。

请参考图11和图12，图11为本申请再一种实施例中的远场拾音唤醒控制方法的逻辑流程图；图12为本申请又一种实施例中的远场拾音唤醒控制方法的逻辑流程图。

在一种实施例中，如图11所示，本申请所提供的远场拾音唤醒控制方法，包括：

1、首先确认显示设备，也就是电视支持远场拾音；

2、当HDMI线***时，双方交换信息，两端拿到设备信息(也就是显示设备拿到机顶盒的对端信息，机顶盒拿到显示设备的对端信息，具体方法参照前文方法实施例)

3、分别查询对端设备是否支持远场拾音，如果有一端不支持，则逻辑停止。如果都支持则继续，进行冲突协商流程。

继续，如图12所示，

4、电视作为主设备，盒子作为从设备，开始下一步通信，二者通信连接的建立方法及过程可以参照前文方法实施例。

5、如果电视未开机，盒子收不到信息，则默认状态为响应语音唤醒词唤醒。

6、如果电视开机，则电视判断当前时候在盒子所在的HDMI通道下，如果不在，则向盒子传递信息，告诉盒子不要响应唤醒词；该步骤的具体实现方法可以参照前文方法实施例。

7、如果电视在当前在盒子所在的HDMI通道下，电视向盒子传递信息，告诉盒子响应唤醒词，同时电视不响应唤醒词。

8、如果盒子关机，电视监测不到盒子信号，则电视响应唤醒词。

此外，本申请还提供一种显示设备，其特征在于，包括：

声音采集器，被配置为采集外部的声音信号；

外部装置接口，被配置为与外部的机顶盒连接；

控制器，被配置为：

再者，本申请还提供一种机顶盒，包括：

声音采集器，被配置为采集外部的声音信号；

机顶盒装置接口，被配置为与外部的显示设备连接；

控制器，被配置为：

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的显示设备和机顶盒的具体工作过程和技术效果，可以参考前述方法实施例中的对应过程和技术效果，在此不再赘述。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

本说明书通篇提及的“多个实施例”、“一些实施例”、“一个实施例”或“实施例”等，意味着结合该实施例描述的具体特征、部件或特性包括在至少一个实施例中。因此，本说明书通篇出现的短语“在多个实施例中”、“在一些实施例中”、“在至少另一个实施例中”或“在实施例中”等并不一定都指相同的实施例。此外，在一个或多个实施例中，具体特征、部件或特性可以任何合适的方式进行组合。因此，在无限制的情形下，结合一个实施例示出或描述的具体特征、部件或特性可全部或部分地与一个或多个其他实施例的特征、部件或特性进行组合。这种修改和变型旨在包括在本申请的范围之内。

此外，本领域技术人员可以理解，本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述，包括任何新的和有用的工序、机器、产品或物质的组合，或对他们的任何新的和有用的改进。相应地，本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“终端”、“组件”或“***”。此外，本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品，该产品包括计算机可读程序编码。

需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本申请的具体实施方式，使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种用于显示设备的远场拾音唤醒控制方法，其特征在于，

基于所述显示设备的外部装置接口***的机顶盒，建立与所述机顶盒的通信连接；

当所述对端信息中的至少一种信息为否时，基于外部输入的远场唤醒声音信号，所述显示设备响应所述远场唤醒声音信号；

当所述对端信息中的三种信息均为是时，判断当前所述显示设备是否在所述机顶盒所在的外部装置接口的通信通道下；

如果当前所述显示设备在所述机顶盒所在的外部装置接口的通信通道下，则控制所述机顶盒响应外部输入的远场唤醒声音信号；

如果当前所述显示设备不在所述机顶盒所在的外部装置接口的通信通道下，则所述显示设备自身响应外部输入的远场唤醒声音信号。

2.如权利要求1所述的一种用于显示设备的远场拾音唤醒控制方法，其特征在于，

3.如权利要求1所述的一种用于显示设备的远场拾音唤醒控制方法，其特征在于，

当前所述显示设备记录当前播放的多帧图像数据；

接收所述机顶盒发送的同一时间段内特定帧图像数据；

将所述特定帧图像数据与所述多帧图像数据进行一一比对；

4.如权利要求1-3任一项所述的一种用于显示设备的远场拾音唤醒控制方法，其特征在于，所述“基于所述显示设备的外部装置接口***的机顶盒，建立与所述机顶盒的通信连接”，包括：

5.一种用于机顶盒的远场拾音唤醒控制方法，其特征在于，

基于显示设备的外部装置接口，建立与所述显示设备的通信连接；

当所述对端信息中的至少一种信息为否时，所述机顶盒不响应外部输入的远场唤醒声音信号；

6.如权利要求5所述的一种用于机顶盒的远场拾音唤醒控制方法，其特征在于，

7.如权利要求5所述的一种用于机顶盒的远场拾音唤醒控制方法，其特征在于，

向所述显示设备发送特定帧图像数据；

8.如权利要求5-7任一项所述的一种用于机顶盒的远场拾音唤醒控制方法，其特征在于，所述“基于显示设备的外部装置接口，建立与所述显示设备的通信连接”，包括：

9.一种显示设备，其特征在于，包括：

声音采集器，被配置为采集外部的声音信号；

外部装置接口，被配置为与外部的机顶盒连接；

控制器，被配置为：

10.一种机顶盒，其特征在于，包括：

声音采集器，被配置为采集外部的声音信号；

机顶盒装置接口，被配置为与外部的显示设备连接；

控制器，被配置为：