CN112905149A - 显示设备上语音指令的处理方法、显示设备及服务器 - Google Patents

显示设备上语音指令的处理方法、显示设备及服务器 Download PDF

Info

Publication number
CN112905149A
CN112905149A CN202110368889.9A CN202110368889A CN112905149A CN 112905149 A CN112905149 A CN 112905149A CN 202110368889 A CN202110368889 A CN 202110368889A CN 112905149 A CN112905149 A CN 112905149A
Authority
CN
China
Prior art keywords
voice
instruction
display
display device
voice service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110368889.9A
Other languages
English (en)
Inventor
鲁亚凯
朱赵龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vidaa Netherlands International Holdings BV
Vidaa USA Inc
Original Assignee
Vidaa Netherlands International Holdings BV
Vidaa USA Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vidaa Netherlands International Holdings BV, Vidaa USA Inc filed Critical Vidaa Netherlands International Holdings BV
Priority to CN202110368889.9A priority Critical patent/CN112905149A/zh
Publication of CN112905149A publication Critical patent/CN112905149A/zh
Priority to PCT/US2022/020435 priority patent/WO2022197737A1/en
Priority to EP22772086.9A priority patent/EP4309031A1/en
Priority to US18/278,537 priority patent/US20240053957A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请提供了一种显示设备上语音指令的处理方法、显示设备及服务器。用户可通过向显示设备输入语音内容的方式控制显示设备执行相关的操作。同时,为了避免显示设备对不同语音服务中的语音内容分别进行解析和处理,显示设备需要将用户输入的语音内容发送至服务器进行解析,并由服务器重新转换为符合统一指令标准的目标语音指令。显示设备接收到该目标语音指令后,只需按照统一的方式进行处理即可。由于服务器中生成符合一种指令标准的语音指令,因此,显示设备也只需针对一种语音指令进行处理,无需针对多种语音指令增加多种处理代码,进而减少代码量,也能降低显示设备的维护成本。

Description

显示设备上语音指令的处理方法、显示设备及服务器
技术领域
本申请涉及显示技术领域,尤其涉及一种显示设备上语音指令的处理方法、显示设备及服务器。
背景技术
智能语音服务作为特色功能被越来越多的显示设备厂商所青睐,智能语音服务在显示设备上也越来越频繁地被使用。但目前显示设备上的一些主流语音服务,只在部分国家可用。为了覆盖更多的国家,一款显示设备上可能同时包含多种语音服务,但每种语音服务中控制相同功能的语音指令标准不同。如果使用多种语音服务,则显示设备上需处理不同类型的语音指令。进而,在显示设备上增加处理各种语音指令的方式则会增加显示设备的代码量和显示设备的维护成本。
发明内容
本申请提供了一种显示设备上语音指令的处理方法、显示设备及服务器,以解决目前显示设备上需针对不同语音服务分别处理不同语音指令的问题。
第一方面,本申请提供了一种显示设备,包括:
显示器;
控制器,被配置为:
将用户输入的语音内容发送到服务器,以使所述服务器利用所述语音内容所属的语音服务解析所述语音内容,并将解析后的语音内容转换为符合统一指令标准的目标语音指令;
接收所述服务器发回的所述目标语音指令;
响应于所述目标语音指令,控制显示设备执行相关的操作。
在一些实施例中,所述控制器,还被配置为:
在显示设备首次开机的情况下,在开机导航的过程中显示语音服务选择页面;
响应于用户在所述语音服务选择页面上用于选择目标语音服务的第一选择指令,将显示设备当前使用的语音服务切换为所述目标语音服务;
将用户在所述目标语音服务中输入的语音内容与所述目标语音服务的类型一同发送到所述服务器。
在一些实施例中,所述控制器,还被配置为:
在显示设备的启动页面上显示语音选项;
响应于用户在所述启动页面上用于选择所述语音选项的第二选择指令,控制显示器显示语音服务选择页面;
响应于用户在所述语音服务选择页面上用于选择目标语音服务的第三选择指令,将显示设备当前使用的语音服务切换为所述目标语音服务;
将用户在所述目标语音服务中输入的语音内容与所述目标语音服务的类型一同发送到所述服务器。
在一些实施例中,所述控制器,还被配置为:
响应于用户通过控制装置输入的语音设置指令,控制显示器显示语音服务选择页面;
响应于用户在所述语音服务选择页面上用于选择目标语音服务的第四选择指令,将显示设备当前使用的语音服务切换为所述目标语音服务;
将用户在所述目标语音服务中输入的语音内容与所述目标语音服务的类型一同发送到所述服务器。
在一些实施例中,所述控制器,还被配置为:
响应于用户输入的设置页面选择指令,控制显示器显示设置页面;
响应于用户在所述设置页面上用于选择语音服务设置项的第五选择指令,控制显示器显示语音服务选择页面;
响应于用户在所述语音服务选择页面上用于选择目标语音服务的第六选择指令,将显示设备当前使用的语音服务切换为所述目标语音服务;
将用户在所述目标语音服务中输入的语音内容与所述目标语音服务的类型一同发送到所述服务器。
在一些实施例中,所述控制器,还被配置为:
在接收到所述第二选择指令后,检测显示设备上的语音功能是否注册;
在所述语音功能未注册的情况下,控制显示器显示语音注册页面,以使用户完成语音注册操作。
在一些实施例中,所述控制器,还被配置为:
在接收到所述语音设置指令后,检测显示设备上的语音功能是否注册;
在所述语音功能未注册的情况下,控制显示器显示语音注册页面,以使用户完成语音注册操作。
第二方面,本申请还提供了一种服务器,包括:
控制器,被配置为:
接收显示设备发来的语音内容以及显示设备当前使用的语音服务类型;
根据所述语音服务类型对应的指令标准解析所述语音内容,获得解析内容;其中,不同类型的语音服务具有不同的指令标准;
将所述解析内容转换为符合目标指令标准的目标语音指令;所述目标指令标准为服务器中统一的一套指令生成标准;
将所述目标语音指令发送回显示设备。
第三方面,本申请提供了一种显示设备上语音指令的处理方法,包括:
将用户输入的语音内容发送到服务器,以使所述服务器利用所述语音内容所属的语音服务解析所述语音内容,并将解析后的语音内容转换为符合统一指令标准的目标语音指令;
接收所述服务器发回的所述目标语音指令;
响应于所述目标语音指令,控制显示设备执行相关的操作。
第四方面,本申请还提供了另一种显示设备上语音指令的处理方法,包括:
接收显示设备发来的语音内容以及显示设备当前使用的语音服务类型;
根据所述语音服务类型对应的指令标准解析所述语音内容,获得解析内容;其中,不同类型的语音服务具有不同的指令标准;
将所述解析内容转换为符合目标指令标准的目标语音指令;所述目标指令标准为服务器中统一的一套指令生成标准;
将所述目标语音指令发送回显示设备。
由上述内容可知,本申请提供了一种显示设备上语音指令的处理方法、显示设备及服务器。用户可通过向显示设备输入语音内容的方式控制显示设备执行相关的操作。同时,为了避免显示设备对不同语音服务中的语音内容分别进行解析和处理,显示设备需要将用户输入的语音内容发送至服务器进行解析,并由服务器重新转换为符合统一指令标准的目标语音指令。显示设备接收到该目标语音指令后,只需按照统一的方式进行处理即可。由于服务器中生成符合一种指令标准的语音指令,因此,显示设备也只需针对一种语音指令进行处理,无需针对多种语音指令增加多种处理代码,进而减少代码量,也能降低显示设备的维护成本。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据一些实施例的显示设备的使用场景的示意图;
图2示出了根据一些实施例的控制装置100的硬件配置框图;
图3示出了根据一些实施例的显示设备200的硬件配置框图;
图4示出了根据一些实施例的显示设备200中软件配置图;
图5示出了根据一些实施例的服务器400与显示设备200的一种通信流程图;
图6示出了根据一些实施例的服务器400与显示设备200的另一种通信流程图;
图7示出了根据一些实施例的语音服务选择页面的一种示意图;
图8示出了根据一些实施例的显示设备200的一种处理流程图;
图9示出了根据一些实施例的显示设备200的启动页面的示意图;
图10示出了根据一些实施例的显示设备200的第二种处理流程图;
图11示出了根据一些实施例的设置页面的示意图;
图12示出了根据一些实施例的显示设备200的第三种处理流程图;
图13示出了根据一些实施例的显示设备200的第四种处理流程图;
图14示出了根据一些实施例的语音服务选择页面的第二种示意图;
图15示出了根据一些实施例的语音服务选择页面的第三种示意图。
具体实施方式
为使本申请的目的和实施方式更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施方式进行清楚、完整地描述,显然,描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
需要说明的是,本申请中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本申请的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。
本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明。应该理解这样使用的用语在适当情况下可以互换。
术语“包括”和“具有”以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的所有组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
术语“模块”是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。
图1示出了根据一些实施例的显示设备的使用场景的示意图。如图1所示,显示设备200还与服务器400进行数据通信,用户可通过智能设备300或控制装置100操作显示设备200。
在一些实施例中,控制装置100可以是遥控器,遥控器和显示设备的通信包括红外协议通信或蓝牙协议通信,及其他短距离通信方式中的至少一种,通过无线或有线方式来控制显示设备200。用户可以通过遥控器上按键、语音输入、控制面板输入等至少一种输入用户指令,来控制显示设备200。
在一些实施例中,智能设备300可以包括移动终端、平板电脑、计算机、笔记本电脑,AR/VR设备等中的任意一种。
在一些实施例中,也可以使用智能设备300以控制显示设备200。例如,使用在智能设备上运行的应用程序控制显示设备200。
在一些实施例中,也可以使用智能设备300和显示设备进行数据的通信。
在一些实施例中,显示设备200还可以采用除了控制装置100和智能设备300之外的方式进行控制,例如,可以通过显示设备200设备内部配置的获取语音指令的模块直接接收用户的语音指令控制,也可以通过显示设备200设备外部设置的语音控制装置来接收用户的语音指令控制。
在一些实施例中,显示设备200还与服务器400进行数据通信。可允许显示设备200通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。服务器400可以向显示设备200提供各种内容和互动。服务器400可以是一个集群,也可以是多个集群,可以包括一类或多类服务器。
在一些实施例中,一个步骤执行主体执行的软件步骤可以随需求迁移到与之进行数据通信的另一步骤执行主体上进行执行。示例性的,服务器执行的软件步骤可以随需求迁移到与之数据通信的显示设备上执行,反之亦然。
图2示出了根据一些实施例的控制装置100的硬件配置框图。如图2所示,控制装置100包括控制器110、通信接口130、用户输入/输出接口140、存储器、供电电源。控制装置100可接收用户的输入操作指令,且将操作指令转换为显示设备200可识别和响应的指令,起用用户与显示设备200之间交互中介作用。
在一些实施例中,通信接口130用于和外部通信,包含WIFI芯片,蓝牙模块,NFC或可替代模块中的至少一种。
在一些实施例中,用户输入/输出接口140包含麦克风,触摸板,传感器,按键或可替代模块中的至少一种。
图3示出了根据一些实施例的显示设备200的硬件配置框图。
在一些实施例中,显示设备200包括调谐解调器210、通信器220、检测器230、外部装置接口240、控制器250、显示器260、音频输出接口270、存储器、供电电源、用户接口中的至少一种。
在一些实施例中,控制器包括中央处理器,视频处理器,音频处理器,图形处理器,RAM,ROM,用于输入/输出的第一接口至第n接口。
在一些实施例中,显示器260包括用于呈现画面的显示屏组件,以及驱动图像显示的驱动组件,用于接收源自控制器输出的图像信号,进行显示视频内容、图像内容以及菜单操控界面的组件以及用户操控UI界面等。
在一些实施例中,显示器260可为液晶显示器、OLED显示器、以及投影显示器中的至少一种,还可以为一种投影装置和投影屏幕。
在一些实施例中,调谐解调器210通过有线或无线接收方式接收广播电视信号,以及从多个无线或有线广播电视信号中解调出音视频信号,如以及EPG数据信号。
在一些实施例中,通信器220是用于根据各种通信协议类型与外部设备或服务器进行通信的组件。例如:通信器可以包括Wifi模块,蓝牙模块,有线以太网模块等其他网络通信协议芯片或近场通信协议芯片,以及红外接收器中的至少一种。显示设备200可以通过通信器220与控制装置100或服务器400建立控制信号和数据信号的发送和接收。
在一些实施例中,检测器230用于采集外部环境或与外部交互的信号。例如,检测器230包括光接收器,用于采集环境光线强度的传感器;或者,检测器230包括图像采集器,如摄像头,可以用于采集外部环境场景、用户的属性或用户交互手势,再或者,检测器230包括声音采集器,如麦克风等,用于接收外部声音。
在一些实施例中,外部装置接口240可以包括但不限于如下:高清多媒体接口接口(HDMI)、模拟或数据高清分量输入接口(分量)、复合视频输入接口(CVBS)、USB输入接口(USB)、RGB端口等任一个或多个接口。也可以是上述多个接口形成的复合性的输入/输出接口。
在一些实施例中,控制器250和调谐解调器210可以位于不同的分体设备中,即调谐解调器210也可在控制器250所在的主体设备的外置设备中,如外置机顶盒等。
在一些实施例中,控制器250,通过存储在存储器上中各种软件控制程序,来控制显示设备的工作和响应用户的操作。控制器250控制显示设备200的整体操作。例如:响应于接收到用于选择在显示器260上显示UI对象的用户命令,控制器250便可以执行与由用户命令选择的对象有关的操作。
在一些实施例中,所述对象可以是可选对象中的任何一个,例如超链接、图标或其他可操作的控件。与所选择的对象有关操作有:显示连接到超链接页面、文档、图像等操作,或者执行与所述图标相对应程序的操作。
在一些实施例中,控制器包括中央处理器(Central Processing Unit,CPU),视频处理器,音频处理器,图形处理器(Graphics Processing Unit,GPU),RAM Random AccessMemory,RAM),ROM(Read-Only Memory,ROM),用于输入/输出的第一接口至第n接口,通信总线(Bus)等中的至少一种。
CPU处理器,用于执行存储在存储器中操作***和应用程序指令,以及根据接收外部输入的各种交互指令,来执行各种应用程序、数据和内容,以便最终显示和播放各种音视频内容。CPU处理器,可以包括多个处理器。如,包括一个主处理器以及一个或多个子处理器。
在一些实施例中,图形处理器,用于产生各种图形对象,如:图标、操作菜单、以及用户输入指令显示图形等中的至少一种。图形处理器包括运算器,通过接收用户输入各种交互指令进行运算,根据显示属性显示各种对象;还包括渲染器,对基于运算器得到的各种对象,进行渲染,上述渲染后的对象用于显示在显示器上。
在一些实施例中,视频处理器,用于将接收外部视频信号,根据输入信号的标准编解码协议,进行解压缩、解码、缩放、降噪、帧率转换、分辨率转换、图像合成等视频处理中的至少一种,可得到直接可显示设备200上显示或播放的信号。
在一些实施例中,视频处理器,包括解复用模块、视频解码模块、图像合成模块、帧率转换模块、显示格式化模块等中的至少一种。其中,解复用模块,用于对输入音视频数据流进行解复用处理。视频解码模块,用于对解复用后的视频信号进行处理,包括解码和缩放处理等。图像合成模块,如图像合成器,其用于将图形生成器根据用户输入或自身生成的GUI信号,与缩放处理后视频图像进行叠加混合处理,以生成可供显示的图像信号。帧率转换模块,用于对转换输入视频帧率。显示格式化模块,用于将接收帧率转换后视频输出信号,改变信号以符合显示格式的信号,如输出RGB数据信号。
在一些实施例中,音频处理器,用于接收外部的音频信号,根据输入信号的标准编解码协议,进行解压缩和解码,以及降噪、数模转换、和放大处理等处理中的至少一种,得到可以在扬声器中播放的声音信号。
在一些实施例中,用户可在显示器260上显示的图形用户界面(GUI)输入用户命令,则用户输入接口通过图形用户界面(GUI)接收用户输入命令。或者,用户可通过输入特定的声音或手势进行输入用户命令,则用户输入接口通过传感器识别出声音或手势,来接收用户输入命令。
在一些实施例中,“用户界面”,是应用程序或操作***与用户之间进行交互和信息交换的介质接口,它实现信息的内部形式与用户可以接受形式之间的转换。用户界面常用的表现形式是图形用户界面(Graphic User Interface,GUI),是指采用图形方式显示的与计算机操作相关的用户界面。它可以是在电子设备的显示屏中显示的一个图标、窗口、控件等界面元素,其中控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、Widget等可视的界面元素中的至少一种。
在一些实施例中,用户接口280,为可用于接收控制输入的接口(如:显示设备本体上的实体按键,或其他等)。
如图4所示,将显示设备的***分为三层,从上至下分别为应用层、中间件层和硬件层。
应用层主要包含电视上的常用应用,以及应用框架(Application Framework),其中,常用应用主要是基于浏览器Browser开发的应用,例如:HTML5 APPs;以及原生应用(Native APPs);
应用框架(Application Framework)是一个完整的程序模型,具备标准应用软件所需的一切基本功能,例如:文件存取、资料交换…,以及这些功能的使用接口(工具栏、状态列、菜单、对话框)。
原生应用(Native APPs)可以支持在线或离线,消息推送或本地资源访问。
中间件层包括各种电视协议、多媒体协议以及***组件等中间件。中间件可以使用***软件所提供的基础服务(功能),衔接网络上应用***的各个部分或不同的应用,能够达到资源共享、功能共享的目的。
硬件层主要包括HAL接口、硬件以及驱动,其中,HAL接口为所有电视芯片对接的统一接口,具体逻辑由各个芯片来实现。驱动主要包含:音频驱动、显示驱动、蓝牙驱动、摄像头驱动、WIFI驱动、USB驱动、HDMI驱动、传感器驱动(如指纹传感器,温度传感器,压力传感器等)、以及电源驱动等。
智能语音服务作为特色功能被越来越多的显示设备厂商所青睐,智能语音服务在显示设备上也越来越频繁地被使用。但目前显示设备200上的一些主流语音服务,只在部分国家可用。为了覆盖更多的国家,一款显示设备200上可能同时包含多种语音服务,但每种语音服务中控制相同功能的语音指令标准不同。如果使用多种语音服务,则显示设备200上需处理不同类型的语音指令。进而,在显示设备200上增加处理各种语音指令的方式则会增加显示设备200的代码量和显示设备200的维护成本。
基于上述内容,为了减少显示设备200中处理语音指令的代码量,同时减少维护成本,本申请实施例中提供了一种服务器400,可以接收显示设备200发来的语音内容,其中,语音内容是用户在使用显示设备200时向显示设备200输入的内容。
通常,不同类型的语音服务具有不同的指令标准,并且不同类型的语音服务中执行相同操作的语音内容也会略有差异。传统的服务器需要解析当前语音服务场景下的特定语音内容,进而知道用户想要进行什么操作。而后传统的服务器会根据当前语音服务的指令标准对语音内容生成属于当前语音服务的语音指令。
例如,语音服务A具有指令标准a,语音服务B具有指令标准b,那么如果用户在显示设备200端基于语音服务A输入的语音内容为“应用1”,传统服务器针对语音服务A中的该语音内容解析出用户想打开应用1,而后会利用指令标准a将解析出的内容生成“turnOn”的目标语音指令;如果用户在显示设备200端基于语音服务B输入的语音内容为“打开应用1”,传统服务器针对语音服务B中的该语音内容解析出用户想打开应用1,而后会利用指令标准b将解析出的内容生成“true”的目标语音指令。其中,“turnOn”为属于语音服务A的打开指令,而“true”为属于语音服务B的打开指令。
而如图5所示,本申请实施例中的服务器400也会根据基于显示设备200当前的语音服务类型对语音内容进行解析,但是并不会生成符合当前语音服务的语音指令,而是将解析内容利用统一的一种指令标准转换为目标语音指令。这样,显示设备200就总是会接收到一种类型的目标语音指令,并且只会针对这一种目标语音指令进行解析处理;而无需配置解析多种语音指令的代码。
例如,传统服务器发送回显示设备200的目标语音指令可能是“turnOn”,也可能是“true”,此时,显示设备200中不仅要配置代码1用于解析“turnOn”的目标语音指令,还要配置代码2用于解析“true”的目标语音指令。而如果本申请实施例中的服务器400将基于语音服务A和语音服务B的语音内容“turnOn”和“true”全部转换为统一指令标准的“1”,那么“1”作为目标语音指令被发送回显示设备200,显示设备200只需要针对“1”这一种指令进行解析,其中只需配置一套代码即可,这样可以有效避免显示设备200中的代码冗余问题。
在上述过程中,服务器400的控制器可以被配置为:接收显示设备200发来的语音内容以及显示设备200当前使用的语音服务类型。进而,可以解析出当前语音服务场景下的语音内容,分析出用户的意图,获得解析内容。然后,再将解析内容转换为符合目标指令标准的目标语音指令。最后,再将目标语音指令发送回显示设备200,以便显示设备200根据目标语音指令的要求进行相应的操作。
可见,本申请实施例中上述的服务器400可以将若干语音服务的语音指令统一转换为符合一种指令标准的语音指令,使得显示设备200无需针对不同语音服务的语音内容分别进行解析,在减少显示设备200中解析语音指令代码量的同时,也降低了显示设备200的维护成本。
为了实现上述目的,本申请实施例中还提供了一种显示设备200。如图6所示,显示设备200可以根据用户的需求提供不同的语音服务给用户使用,而后在当前的语音服务的场景中接收用户输入的语音内容。显示设备200将语音内容和当前语音服务的类型发送给服务器400,由服务器400生成目标语音指令再将其发回给显示设备200。显示设备200再根据目标语音指令的要求,执行相关的操作等。
在此过程中,显示设备200的控制器250可以被配置为:将用户输入的语音内容发送到服务器400。再接收服务器400发回的目标语音指令。最后,响应于目标语音指令,控制显示设备200执行相关的操作。
在用户输入语音指令控制显示设备200之前,用户可以根据自己的需求在显示设备200上选择不同的语音服务使用,例如Google Assistant(谷歌助手)、amazon alexa(亚马逊人工智能助手)等。为了给用户提供更加方便以及多样的语音服务,显示设备200上可以以多种形式显示语音服务选择页面,例如在显示设备200首次开机的导航过程中显示、在显示设备200开机后的启动页面上显示、或者在显示设备200的设置页面上显示、再或者根据用户输入的控制指令直接在显示设备200上显示等。
在一些实施例中,在显示设备200首次开机的导航过程中显示的语音服务选择页面如图7所示,图7中可选择的语音服务包括“Google Assistant”和“Alexa”两种,并且还有用于提示用户进行选择的提示内容“Select your Voice Assistant(选择您的语音助手)”。用户可以通过语音控制或者通过遥控器等控制装置100等在在语音服务选择页面上选择目标语音服务。
在此过程中,如图8所示,显示设备200的控制器250被配置为:在显示设备200首次开机的情况下,在开机导航的过程中显示如图7所示的语音服务选择页面。用户在语音服务选择页面上选择了目标语音服务,即向显示设备200输入了第一选择指令,控制器250再响应于第一选择指令,将显示设备200上的语音服务切换为目标语音服务,例如“GoogleAssistant”等。
在显示设备200设置好语音服务后,如图8所示,用户可以在当前的目标语音服务的场景下再次向显示设备200输入语音内容,而后,显示设备200的控制器250再将该语音内容和目标语音服务的类型一同发送到服务器400,由服务器400继续处理。
在一些实施例中,用户输入第一选择指令的方式可以是通过按下遥控器等控制装置100的方向按键等输入也可以是直接向显示设备200输入语音指令。
另外,在一些实施例中,控制装置100上也会配置有专门用于接收语音内容的功能键,用户可以通过按下控制装置100上的语音功能键向控制装置100输入语音内容,进而由控制装置100将语音内容转发给显示设备200。或者,某些显示设备200上本身配置有拾音装置,用户可以直接显示设备200输入语音内容,由拾音装置直接接收。
在一些实施例中,显示设备200开机后的启动页面如图9所示,图9的启动页面中展示了很多资源选项,并且在启动页面的顶部显示了一些功能选项,例如“搜索”、“设置”、“用户”、“语音”等。其中,可以以麦克风图标作为“语音”选项,用户可以在启动页面上选择该语音选项。
在此过程中,如图10所示,显示设备200的控制器250还可以被配置为:在显示设备200的启动页面上显示如图9所示的语音选项。然后,用户在启动页面上选择语音选项,即向显示设备200输入第二选择指令,控制器250响应于第二选择指令,控制显示器260显示语音服务选择页面。用户可以继续在语音服务选择页面上选择目标语音服务,即继续向显示设备200输入第三选择指令,控制器250继续响应第三选择指令,将显示设备200当前使用的语音服务切换为用户选择的目标语音服务。
在显示设备200设置好语音服务后,如图10所示,用户可以在当前的目标语音服务的场景下再次向显示设备200输入语音内容,而后,显示设备200的控制器250再将该语音内容和目标语音服务的类型一同发送到服务器400,由服务器400继续处理。
在一些实施例中,用户输入第二选择指令、第三选择指令的方式可以是通过按下遥控器等控制装置100的按键输入也可以是直接向显示设备200输入语音指令。
在一些实施例中,显示设备200的设置页面如图11所示,以“System(***)”页面为例,其中包括若干功能设置项,例如“Time(时间)”、“Timer Settings(计时器设定)”、“System PIN(***密码)”、“Parental Control(家长控制)”、“Language and Location(语言和位置)”、“Voice Service(语音服务)”、“Application Settings(应用程序设置)”、“HDMI&CEC”等。用户可以在该设置页面上选择Voice Service设置项,进而控制显示设备200显示语音服务选择页面。以及,当焦点框定位到Voice Service设置项上时,在该设置页面上还会显示对应的提示内容,例如“Use your voice to control the TV.other smarthome devices,and more.(用您的声音控制电视、其他智能家居设备等等。)”
在此过程中,如图12所示,显示设备200的控制器250还可以被配置为:响应于用户输入的设置页面选择指令,控制显示器260显示设置页面。而后,用户在该设置页面上选择语音服务设置项,即向显示设备200输入了第五选择指令,控制器250响应于该第五选择指令,控制显示器260显示语音服务选择页面。用户继续在该语音服务选择页面上选择目标语音服务,即向显示设备200输入了第六选择指令,控制器250响应于该第六选择指令,将显示设备200当前使用的语音服务切换为目标语音服务。
在显示设备200设置好语音服务后,如图12所示,用户可以在当前的目标语音服务的场景下再次向显示设备200输入语音内容,而后,显示设备200的控制器250再将该语音内容和目标语音服务的类型一同发送到服务器400,由服务器400继续处理。
在一些实施例中,用户输入页面选择指令、第五选择指令、第六选择指令的方式可以是通过按下遥控器等控制装置100的按键等输入也可以是直接向显示设备200通过语音输入。
在一些实施例中,与显示设备200相关联的控制装置100上可能还会配置有语音服务功能键,用户按下控制装置100上的该功能键,即可控制显示设备200直接显示语音服务选择页面。
在此过程中,如图13所示,显示设备200的控制器250还可以被配置为:响应于用户通过控制装置100输入的语音设置指令,控制显示器260直接显示语音服务选择页面。其中,语音设置指令即为用户按下上述语音服务功能键发出的指令。而后,用户可以在语音服务选择页面上继续选择目标语音服务,即向显示设备200输入了第四选择指令,控制器250响应于该第四选择指令,将显示设备200当前使用的语音服务切换为目标语音服务。
在显示设备200设置好语音服务后,如图13所示,用户可以在当前的目标语音服务的场景下再次向显示设备200输入语音内容,而后,显示设备200的控制器250再将该语音内容和目标语音服务的类型一同发送到服务器400,由服务器400继续处理。
在一些实施例中,用户输入第四选择指令的方式可以是通过按下遥控器等控制装置100的按键等输入也可以是直接向显示设备200通过语音输入。
图14示出了根据一些实施例的语音服务选择页面的第二种示意图。如图14所示,该语音服务选择页面上示出了三种语音服务,例如“Google Assistant”、“amazon alexa”和“yandex”等。其中“yandex”是俄罗斯的最重要的网络门户之一,也是一种人工智能助手。并且还有用于提示用户进行选择的提示内容“Ask questions,search for your favoritemovies,control your TV,and more just by asking Google.(只需询问Google就可以提出问题,搜索您喜欢的电影,控制电视等等)”。在语音服务选择页面上还设有确认选项以及“Set voice assistant to Google Assistant(将语音助手设置为Google Assistant)”的提示。
图15示出了根据一些实施例的语音服务选择页面的第三种示意图。如图15所示,在焦点框定位到“amazon alexa”语音服务选项时,在页面的右侧还会显示一些语音内容的提示,例如“Things to try Alexa,what's the weather today?(可以尝试说说“Alexa,今天天气如何?”)”、“Alexa,show my To-Do List.(Alexa,显示我的待办事项清单。)”、“Alexa,play music.(Alexa,播放音乐。)”、“Alexa,why is the sky blue?(Alexa,为什么天是蓝色的?)”、“Alexa,tell me a joke.(Alexa,给我讲个笑话。)”等。
前述实施例中所述的语音服务选择页面均可采用如图14或者图15中所示的内容,用户在该语音服务选择页面上选择好目标语音服务后,显示设备200即可将当前***使用的语音服务切换为目标语音服务。
通常,大多数显示设备200都会要求在使用语音服务前对本机的语音功能进行注册,以保证显示设备200合理合法地收集用户的语音内容,进而也保证语音服务的合法性和安全性等。语音功能注册后,语音服务可以根据用户的历史需求等加强语义识别或者内容识别的准确性,进而使用户可以更加方便地使用语音服务。
基于此,在一些实施例中,显示设备200还需要在用户选择语音服务之前检测显示设备200上语音功能是否注册,例如,用户在上述启动页面上选择语音选项后,显示设备200可以检测其上的语音功能是否注册,或者被激活。在此过程中,显示设备200的控制器250被配置为:在接收到第二选择指令后,检测显示设备200上的语音功能是否注册。并在语音功能未注册的情况下,控制器250控制显示器260显示语音注册页面,以使用户完成语音注册操作。另外,在语音功能注册的情况下,控制器250可以控制显示器260直接显示语音服务选择页面。
或者,用户通过按下上述控制装置100的语音服务功能键后,显示设备200在显示语音服务选择页面之前,也会检测其上的语音功能是否注册,或者被激活。在此过程中,显示设备200的控制器250还被配置为:在接收到语音设置指令后,检测显示设备200上的语音功能是否注册。并且在语音功能未注册的情况下,控制器250控制显示器260显示语音注册页面,以使用户完成语音注册操作。另外,在语音功能注册的情况下,控制器250可以控制显示器260直接显示语音服务选择页面。
再或者,用户在上述设置页面上选择语音服务设置项之后,显示设备200在显示语音服务选择页面之前,也会检测其上的语音功能是否注册,或者被激活。在此过程中,显示设备200的控制器250还被配置为:在接收到第五选择指令后,检测显示设备200上的语音功能是否注册。并且在语音功能未注册的情况下,控制器250控制显示器260显示语音注册页面,以使用户完成语音注册操作。另外,在语音功能注册的情况下,控制器250可以控制显示器260直接显示语音服务选择页面。
可见,本申请上述实施例中的显示设备200不仅可以为用户提供多种语音服务选择页面的入口,还能利用对服务器400发回的目标语音指令进行解析并响应。由于服务器400可以生成符合一种指令标准的语音指令,因此,显示设备200也只需针对一种语音指令进行处理,无需针对多种语音指令增加多种处理代码,进而减少代码量,也能降低显示设备200的维护成本。
为了减少显示设备200中处理语音指令的代码冗余情况,本申请实施例中还提供了一种显示设备上语音指令的处理方法,该方法可以应用于如上所述的服务器400中,具体可以包括如下步骤:接收显示设备200发来的语音内容以及显示设备200当前使用的语音服务类型。根据语音服务类型对应的指令标准解析语音内容,获得解析内容;其中,不同类型的语音服务具有不同的指令标准。将解析内容转换为符合目标指令标准的目标语音指令;其中目标指令标准为服务器400中统一的一套指令生成标准。将目标语音指令发送回显示设备200。
同时,本申请实施例中还提供了另一种显示设备上语音指令的处理方法,该方法可以应用于如上所述的显示设备200中,具体可以包括如下步骤:将用户输入的语音内容发送到服务器400,以使服务器400利用语音内容所属的语音服务解析语音内容,并将解析后的语音内容转换为符合统一指令标准的目标语音指令。接收服务器400发回的目标语音指令。响应于目标语音指令,控制显示设备200执行相关的操作。
由于本申请实施例中的显示设备上语音指令的处理方法可以分别应用于如前述实施例所述的显示设备200和服务器400中,因此,关于本申请实施例中显示设备上语音指令的处理方法的其他内容可以参照前述关于显示设备200和服务器400实施例的内容,在此不再赘述。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
为了方便解释,已经结合具体的实施方式进行了上述说明。但是,上述示例性的讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导,可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用,从而使得本领域技术人员更好的使用所述实施方式以及适于具体使用考虑的各种不同的变形的实施方式。

Claims (10)

1.一种显示设备,其特征在于,包括:
显示器;
控制器,被配置为:
将用户输入的语音内容发送到服务器,以使所述服务器利用所述语音内容所属的语音服务解析所述语音内容,并将解析后的语音内容转换为符合统一指令标准的目标语音指令;
接收所述服务器发回的所述目标语音指令;
响应于所述目标语音指令,控制显示设备执行相关的操作。
2.根据权利要求1所述的显示设备,其特征在于,所述控制器,还被配置为:
在显示设备首次开机的情况下,在开机导航的过程中显示语音服务选择页面;
响应于用户在所述语音服务选择页面上用于选择目标语音服务的第一选择指令,将显示设备当前使用的语音服务切换为所述目标语音服务;
将用户在所述目标语音服务中输入的语音内容与所述目标语音服务的类型一同发送到所述服务器。
3.根据权利要求1所述的显示设备,其特征在于,所述控制器,还被配置为:
在显示设备的启动页面上显示语音选项;
响应于用户在所述启动页面上用于选择所述语音选项的第二选择指令,控制显示器显示语音服务选择页面;
响应于用户在所述语音服务选择页面上用于选择目标语音服务的第三选择指令,将显示设备当前使用的语音服务切换为所述目标语音服务;
将用户在所述目标语音服务中输入的语音内容与所述目标语音服务的类型一同发送到所述服务器。
4.根据权利要求1所述的显示设备,其特征在于,所述控制器,还被配置为:
响应于用户通过控制装置输入的语音设置指令,控制显示器显示语音服务选择页面;
响应于用户在所述语音服务选择页面上用于选择目标语音服务的第四选择指令,将显示设备当前使用的语音服务切换为所述目标语音服务;
将用户在所述目标语音服务中输入的语音内容与所述目标语音服务的类型一同发送到所述服务器。
5.根据权利要求1所述的显示设备,其特征在于,所述控制器,还被配置为:
响应于用户输入的设置页面选择指令,控制显示器显示设置页面;
响应于用户在所述设置页面上用于选择语音服务设置项的第五选择指令,控制显示器显示语音服务选择页面;
响应于用户在所述语音服务选择页面上用于选择目标语音服务的第六选择指令,将显示设备当前使用的语音服务切换为所述目标语音服务;
将用户在所述目标语音服务中输入的语音内容与所述目标语音服务的类型一同发送到所述服务器。
6.根据权利要求3所述的显示设备,其特征在于,所述控制器,还被配置为:
在接收到所述第二选择指令后,检测显示设备上的语音功能是否注册;
在所述语音功能未注册的情况下,控制显示器显示语音注册页面,以使用户完成语音注册操作。
7.根据权利要求4所述的显示设备,其特征在于,所述控制器,还被配置为:
在接收到所述语音设置指令后,检测显示设备上的语音功能是否注册;
在所述语音功能未注册的情况下,控制显示器显示语音注册页面,以使用户完成语音注册操作。
8.一种服务器,其特征在于,包括:
控制器,被配置为:
接收显示设备发来的语音内容以及显示设备当前使用的语音服务类型;
根据所述语音服务类型对应的指令标准解析所述语音内容,获得解析内容;其中,不同类型的语音服务具有不同的指令标准;
将所述解析内容转换为符合目标指令标准的目标语音指令;所述目标指令标准为服务器中统一的一套指令生成标准;
将所述目标语音指令发送回显示设备。
9.一种显示设备上语音指令的处理方法,其特征在于,包括:
将用户输入的语音内容发送到服务器,以使所述服务器利用所述语音内容所属的语音服务解析所述语音内容,并将解析后的语音内容转换为符合统一指令标准的目标语音指令;
接收所述服务器发回的所述目标语音指令;
响应于所述目标语音指令,控制显示设备执行相关的操作。
10.一种显示设备上语音指令的处理方法,其特征在于,包括:
接收显示设备发来的语音内容以及显示设备当前使用的语音服务类型;
根据所述语音服务类型对应的指令标准解析所述语音内容,获得解析内容;其中,不同类型的语音服务具有不同的指令标准;
将所述解析内容转换为符合目标指令标准的目标语音指令;所述目标指令标准为服务器中统一的一套指令生成标准;
将所述目标语音指令发送回显示设备。
CN202110368889.9A 2021-03-15 2021-04-06 显示设备上语音指令的处理方法、显示设备及服务器 Pending CN112905149A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202110368889.9A CN112905149A (zh) 2021-04-06 2021-04-06 显示设备上语音指令的处理方法、显示设备及服务器
PCT/US2022/020435 WO2022197737A1 (en) 2021-03-15 2022-03-15 Display apparatus and display method
EP22772086.9A EP4309031A1 (en) 2021-03-15 2022-03-15 Display apparatus and display method
US18/278,537 US20240053957A1 (en) 2021-03-15 2022-03-15 Display apparatus and display method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110368889.9A CN112905149A (zh) 2021-04-06 2021-04-06 显示设备上语音指令的处理方法、显示设备及服务器

Publications (1)

Publication Number Publication Date
CN112905149A true CN112905149A (zh) 2021-06-04

Family

ID=76110024

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110368889.9A Pending CN112905149A (zh) 2021-03-15 2021-04-06 显示设备上语音指令的处理方法、显示设备及服务器

Country Status (1)

Country Link
CN (1) CN112905149A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112581959A (zh) * 2020-12-15 2021-03-30 四川虹美智能科技有限公司 智能设备控制方法、***和语音服务器
CN113490041A (zh) * 2021-06-30 2021-10-08 Vidaa美国公司 语音功能切换方法及显示设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103474068A (zh) * 2013-08-19 2013-12-25 安徽科大讯飞信息科技股份有限公司 实现语音命令控制的方法、设备及***
CN108877791A (zh) * 2018-05-23 2018-11-23 百度在线网络技术(北京)有限公司 基于视图的语音交互方法、装置、服务器、终端和介质
CN111526402A (zh) * 2020-05-06 2020-08-11 海信电子科技(武汉)有限公司 多屏显示设备的语音搜索视频资源的方法及显示设备
CN112565849A (zh) * 2019-09-26 2021-03-26 深圳市茁壮网络股份有限公司 一种数字电视的语音控制方法、电视控制***及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103474068A (zh) * 2013-08-19 2013-12-25 安徽科大讯飞信息科技股份有限公司 实现语音命令控制的方法、设备及***
CN108877791A (zh) * 2018-05-23 2018-11-23 百度在线网络技术(北京)有限公司 基于视图的语音交互方法、装置、服务器、终端和介质
CN112565849A (zh) * 2019-09-26 2021-03-26 深圳市茁壮网络股份有限公司 一种数字电视的语音控制方法、电视控制***及存储介质
CN111526402A (zh) * 2020-05-06 2020-08-11 海信电子科技(武汉)有限公司 多屏显示设备的语音搜索视频资源的方法及显示设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112581959A (zh) * 2020-12-15 2021-03-30 四川虹美智能科技有限公司 智能设备控制方法、***和语音服务器
CN113490041A (zh) * 2021-06-30 2021-10-08 Vidaa美国公司 语音功能切换方法及显示设备
CN113490041B (zh) * 2021-06-30 2023-05-05 Vidaa美国公司 语音功能切换方法及显示设备

Similar Documents

Publication Publication Date Title
CN112653906B (zh) 显示设备上视频热点播放方法及显示设备
CN112887778A (zh) 显示设备上视频资源播放模式的切换方法及显示设备
CN112905149A (zh) 显示设备上语音指令的处理方法、显示设备及服务器
CN113301405A (zh) 一种显示设备及虚拟键盘的显示控制方法
CN113163258A (zh) 一种频道切换的方法及显示设备
CN112733050A (zh) 显示设备上搜索结果的展示方法及显示设备
CN113014979A (zh) 一种内容显示方法和显示设备
CN112817556A (zh) 显示设备上语音方案的切换方法、显示设备及控制装置
CN113784203A (zh) 一种显示设备及频道切换方法
CN113608715A (zh) 显示设备及语音服务切换方法
CN112882780A (zh) 设置页面显示方法及显示设备
CN112882631A (zh) 显示设备上电子说明书的显示方法及显示设备
CN113573112A (zh) 一种显示设备及遥控器
CN113490030A (zh) 一种显示设备及频道信息展示方法
CN112732396A (zh) 一种媒资数据的展示方法及显示设备
CN113064691A (zh) 一种开机用户界面的显示方法及显示设备
CN113014977A (zh) 显示设备及音量显示方法
CN113490041B (zh) 语音功能切换方法及显示设备
CN113676782B (zh) 显示设备及多应用共存时的交互方法
CN115514998B (zh) 显示设备和网络媒资切换方法
CN113342305B (zh) 功放设备的音频状态显示方法、显示设备及功放设备
CN113784222B (zh) 应用和数字电视节目的交互方法及显示设备
WO2022174751A1 (zh) 一种显示方法和显示设备
CN113051001B (zh) 一种开机用户界面显示的加速方法及显示设备
CN113691824B (zh) 一种显示设备、服务器及虚拟通道的显示及切换控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination