CN103533391B - 一种声控式交互的双向互动数字电视盒***的工作方法 - Google Patents

一种声控式交互的双向互动数字电视盒***的工作方法 Download PDF

Info

Publication number
CN103533391B
CN103533391B CN201310477049.1A CN201310477049A CN103533391B CN 103533391 B CN103533391 B CN 103533391B CN 201310477049 A CN201310477049 A CN 201310477049A CN 103533391 B CN103533391 B CN 103533391B
Authority
CN
China
Prior art keywords
user
voice
module
information
digital
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310477049.1A
Other languages
English (en)
Other versions
CN103533391A (zh
Inventor
郗登振
王淑荣
纪燕杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
QINGDAO YINGTIANXIA INTELLIGENT TECHNOLOGY Co Ltd
Original Assignee
QINGDAO YINGTIANXIA INTELLIGENT TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by QINGDAO YINGTIANXIA INTELLIGENT TECHNOLOGY Co Ltd filed Critical QINGDAO YINGTIANXIA INTELLIGENT TECHNOLOGY Co Ltd
Priority to CN201310477049.1A priority Critical patent/CN103533391B/zh
Publication of CN103533391A publication Critical patent/CN103533391A/zh
Application granted granted Critical
Publication of CN103533391B publication Critical patent/CN103533391B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种声控式交互的双向互动数字电视盒***及实现方法,所述***包括视频服务器***、VOD管理***、数字电视网络、EPG***和数字电视终端。所述EPG***为用户提供操作便捷、节目友好、快速访问节目的一种方式,通过该***实现浏览和查询一个或多个频道近期播放的节目信息,同时,EPG提供分类功能,可以帮助用户浏览和选择各种类型的节目。EPG***包括接收模块、控制转换模块、存储模块和人机交互操作模块。本发明具有令双向互动数字电视盒具有较强的产品易用性,规范化的布局和内容,简化了用户选择过程中的操作过程,使双向互动数字电视盒具有良好的用户体验优点。

Description

一种声控式交互的双向互动数字电视盒***的工作方法
技术领域
本发明涉及信息技术领域,尤其涉及一种声控式交互的双向互动数字电视盒*** 的工作方法。
背景技术
数字电视机顶盒是一种将数字电视信号转换成模拟信号的变换设备,它对经过数字化压缩的图像和声音信号进行解码还原,产生模拟的视频和声音信号,通过电视显示器和音响设备给观众提供高质量的电视节目。目前的数字电视机顶盒已成为一种嵌入式计算设备,具有完善的实时操作***,提供强大的CPU计算能力,用来协调控制机顶盒各部分硬件设施,并提供丰富多彩的图形用户界面,如增强型电视的电子节目指南,给用户提供图文并茂的节目介绍和背景资料。同时,机顶盒具有“傻瓜计算机”能力,通过内部软件功能对网络进行双向改造,便于实现如因特网浏览、视频点播、家庭电子商务、电话通信多种服务。
双向互动数字电视机顶盒仍然大多停留在传统遥控器式的操控中,缺乏统一的组件式的界面布局和灵活智能的操作方式。目前现有的相关界面呈现和智能交互方式的专利虽然也可以实现组块化的界面以及触控、声控、手势智能化的操控,但是无法实现所有界面控件和操作指令一一对应的交互,从而将智能化操作应用到每一个组块指令,对于双向数字电视盒的电视直播、视频点播应用功能,难以实现所见即所得的交互和人性化的智能体验。
总而言之,目前需要本领域技术人员迫切解决的一个技术问题是:
第一,如何在数字电视的显示端实现一种新型组件化的界面布局,令界面呈现能够规范化和统一,并自动屏蔽各种显示终端的差异性。
第二,如何提供一种双向互动数字电视盒***的交互特性及方法,支持新型组块化的双向交互操作,实现即见即得的交互效果。
发明内容
本发明针对传统双向互动数字电视盒的界面呈现以及人机交互涉及存在的问题,提出了一种声控式交互的双向互动数字电视盒***及实现方法,该***重点对双向互动数字电视盒***中的EPG***进行改进,定义一种基于组块的UI呈现界面,将应用资源内容以组件的形式进行封装,双向互动数字电视盒的终端界面实现交互 操作指令与界面组件一一对应的事件绑定,完成所见即所得的应用选择功能,交互过程可以减少不必要的重复交互,实现灵活可控的交互效果,此方法实现的双向互动数字电视盒***具有较强的产品易用性,规范化的布局和内容,简化了用户选择过程中的操作过程,使双向互动数字电视盒具有良好的用户体验优点,并实现了一种新型的应用呈现布局并支持触控、声控、手势等智能化的人机交互方式,方便用户浏览和查询节目信息,提供个性化的服务。
为了实现上述目的,本发明采用如下技术方案:
一种声控式交互的双向互动数字电视盒***,包括视频服务器***、VOD管理***、数字电视网络、EPG***和数字电视终端,所述视频服务器***将数据传输给VOD管理***,所述VOD管理***将数据通过数字电视网络传输给EPG***,所述EPG***与数字电视终端之间是双向通信,所述数字电视终端的数字电视盒通过接口获取EPG***的信息,并在数字电视终端的显示装置进行呈现;
EPG***包括依次通信的接收模块、控制转换模块、指令存储模块和声控式人机交互操作模块;
所述声控式人机交互操作模块用于实现组块化的人机交互操作,检测并识别用户的声音指令,响应并执行该操作指令,并将操作结果反馈给数字电视机顶盒;所述人机交互操作能够通过用户的声音的信息采集进行自由定义,即允许用户定义不同的声音来表示***中的操作功能。
所述接收模块用于接收来自于数字电视网络各种数据信息,并通过解调、解复用、解码和音视频编码获取电子节目菜单信息,并将数据传输给控制转换模块;
所述控制转换模块,用于将接收到的节目内容索引以及相关联的扩展信息转换为组块化结构形式,并将组块 化结构形式传输给指令存储模块;
所述指令存储模块,用于存储转换后的组块化结构的节目菜单信息,并定义组块指令集,存储用户输入的原始信息和表征指令功能的操作信息之间的映射关系库,映射关系以关键字对应关键值的形式存在,所述指令存储模块与人机交互操作模块之间是双向通信;
所述映射关系库中输入指令集作为关键字存在,用于匹配用户输入的信息,并且通过用户输入的信息采集进行自由定义;表征指令功能的操作信息作为关键值存在,关键字与关键值的映射为一对一或多对一的关系;
所述声控式人机交互操作模块包括预处理模块,特征提取模块,匹配模块,执 行模块。
所述视频服务器***包括:VOD播出服务器、VOD页面目录服务器、VOD播控服务器;
所述VOD播控服务器是VOD业务的核心,主要用来执行处理用户的视频点播请求,并提供响应数据,并协调处理VOD点播的数据查询,播出文件准备,播出控制命令的下发;
所述VOD播出服务器主要用来执行播控服务器的点播命令,包括点播信息的分配,点播文件的调度,播出文件的控制;
所述VOD页面目录服务器用于处理用户的页面目录浏览请求,并把页面数据传给请求的用户。
所述VOD管理***负责该点播用户的授权、用户点播的计费及费用明细查询;主要功能包括用户信息管理、用户数据库索引、视频节目源管理、用户认证、服务器监测;所述数字电视网络用于实现传输分发、网络传输、载入网络功能。
所述EPG***为用户提供操作便捷、节目友好、快速访问节目的一种方式,通过该***实现浏览和查询一个或多个频道近期播放的节目信息,同时,EPG提供分类功能,帮助用户浏览和选择各种类型的节目。
所述预处理模块用于对收集到的语音进行预滤波、量化去除冗余信息以及降噪处理的操作,并将处理后的信息传输给特征提取模块;
特征提取模块,对进行录入的语音进行特征提取,得到特征向量,并根据特征向量描述建立语音库的关键词词典,存储到指令存储模块;
匹配模块用于判断用户输入指令提取得到的特征向量是否属于某一个关键词,并匹配与该关键词对应的操作指令,通过执行模块识别并响应并执行该操作指令,最后将操作结果反馈给互联网电视终端;
另外,人机交互操作模块还包括自适应识别模块,对用户的语音进行自学习,即允许用户定义不同的声音指令来作为***中功能的操作指令,从而对前期采样得到的声音模型进行必要的校正,以进一步提高识别的准确率。
所述的数字电视终端包括显示装置和数字电视盒,显示装置用于对接收到的EPG信息进行解析并以组块形式的界面进行显示;数字电视盒用于影片数据的获取和识别用户的输入信息,所述数字电视盒包括实现声音录入功能的麦克风。
所述的***所采用的工作方法,步骤如下:
步骤(1):开始,视频服务器***提供视频点播的节目源,并通过VOD管理***管理点播用户的授权计费功能,节目信息源经过数字电视网络的传输,转发给EPG***;
步骤(2):通过EPG***接收模块接收来自于数字电视网络各种数据信息,并通过解调、解复用、解码和音视频编码技术获取电子节目菜单信息;
步骤(3):控制转换模块将接收到的电子节目菜单内容信息以及索引转换为组块结构形式,并在指令存储模块中存储转换后的组块结构的节目菜单信息;然后将节目菜单信息传输给数字电视终端的显示装置,进行界面的呈现;
步骤(4):用户的交互过程通过数字电视终端的数字电视盒的麦克风进行原始操作指令的录入,并支持用户设定自定义的操作指令;
步骤(5):通过人机交互操作模块,进行输入指令的识别和检测,判断用户输入指令是否能和映射关系库中的关键字匹配,如果是就进入步骤(6);如果否就进入步骤(7);
步骤(6):***执行相应关键字的操作指令的功能事件,并通过终端显示装置呈现操作对应的结果界面;结束;
步骤(7):显示错误提示信息,结束。
所述步骤(6)的操作对应的结果界面通过建立数学逻辑模型并应用算法自动生成,所述数学逻辑模型是指用树结构来表示组块界面的呈现结构,组块界面作为树状图的根结点,有两种类别的结点,分别为主区结点和辅区结点,其中主区结点为必须存在的结点,辅区结点允许根据需要作为对象容器的区存在,树结构的每一层的深度代表其所表示的结点的类型。
所述步骤(5)的声控式人机交互操作模块的具体工作方法如下:
Step1进行语音信息的采集,由于组块界面的语音操作指令与遥控式操作的指令一一对应,因此语音信息的采集只需要对特定的遥控式操作对应的语音指令进行采集,定义了三类指令:宏观指令,组块指令以及功能指令;
Step2采集后的语音指令形成语音库,对于语音库中的每个语音信号波形图,提取其每段间隔帧的值得到一个n维的特征向量f,从而得到特征向量集合F;
Step3对特征集合F应用K-means聚类的方法生成检索关键词词典集合D,容量为d,每个类对应的关键词g由该类内所有特征向量f取平均值得到,每一个关键词g对应一个组块的执行指令,其与组块操作指令关键值的映射关系,存储到存储模块中;
Step4对于输入的待识别的声音指令,同样按照step1和step2的方法得到一个n维的特征向量m;
Step5在关键词词典集合D中,寻找与特征向量m之间Manhattan距离最小的关键词g,如果该距离小于指定的阈值,则f为匹配的向量,其对应的指令为要执行的指令,并将m归属到该关键词对应的类中,将该类的特征描述更新为g=(D*g+m)/(d+1)。
本发明的有益效果:
1提供一种智能化、开放的、支持多业务的、具有规范布局格式的EPG***的宽带多媒体业务平台,解决业务索引和导航缺乏统一格式的问题,并通过以太网络传送静态或动态的资源并提供数字电视双向互动的娱乐服务。
2定义一种基于组块的UI呈现界面,将应用资源内容以组件的形式进行封装,通过建立数学逻辑模型,实现了一种新型的应用呈现布局和交互方式。在数字电视的终端界面实现交互操作指令与界面组件一一对应的事件绑定,完成所见即所得的应用选择功能,交互过程可以减少不必要的重复交互,提高了响应的效率,达到灵活可控的交互效果,实现一种新型的数字电视节目菜单呈现布局和双向互动模式。
3提供一种基于组块交互技术的触控式双向互动数字电视盒,以及运用组块交互技术原理实现的触控式交互的双向互动数字电视盒设备,能支持单点和多点的触控操作,并进行高精度的动作识别,快速响应各类触控操作,令双向互动数字电视盒具有较强的产品易用性,简化了用户选择时的操作过程,使互联网电视具有良好的用户体验。
4通过新型的组块UI界面交互方法,区别于传统的只具有上、下、左、右、确认和退出等选择的遥控式交互操作模式。此方法无需定义复杂的交互事件,具有易知、易学、易用的交互特性。双向互动方式满足了用户对不同业务层次的需求,提供了更自由多元化的选择渠道,并且组块交互方法支持多种操作模式,可以自主配置,扩展到多种智能操控方式,操作方法灵活多变,适合各种业务信息以及应用资源的交互。
5由于组块界面的布局的优势,声控指令不需要繁琐而庞大的指令库,只通过与界面组块对应的屈指可数的指令即可实现交互操作,因此在特征提取时也可以通过更简捷的方式获得特征向量,缩短了匹配时间,保证了匹配效率。
6组块界面的组块排列采用最多不大于9的组合形式,因此声控指令最多只需要匹配1~9的9个语音,令提取出的声音指令库容量大大减少,通过定义关键词字 典,对于用户输入的声音指令,使特征提取得到的关键词更加接近于匹配结果,并且匹配声音指令的工作效率也明显提高。
总之,该交互方法令双向互动数字电视盒具有较强的产品易用性,规范化的布局和内容,简化了用户选择过程中的操作过程,通过这种UI布局和交互设计,可以使双向互动数字电视盒的操作方式更加人性化,从而大幅度提升产品的用户体验。本发明构建了一种新型组块式的双向互动数字电视盒***的界面布局形式以及交互方式,通过一一对应的界面组件和响应事件,实现所见即所得的交互效果。区别于传统的只具有上、下、左、右、确认和退出选择的单一的遥控交互操作模式,应用此方法实现的双向互动数字电视盒***可以向用户提供高质量的用户体验服务,操作方法灵活多变,并可以扩展到触控、声控、手势等智能操作的交互领域,适合各种业务信息以及应用资源的交互,实现快速响应各类操作,***易知、易学、易用的便捷交互模式能够适合更广泛的人群操作使用,让用户感受到智能化、人性化的娱乐享受。
附图说明
图1是双向互动数字电视盒的数学模型示意图;
图2是双向互动数字电视盒***结构图;
图3是双向互动数字电视盒***的声音匹配和识别的方法步骤;
图4是双向互动数字电视盒***的组块交互方法流程图。
具体实施方式
如图1所示,本发明实现的互联网电视***针对传统互联网电视的呈现和交互涉及存在的问题,提出了一种基于组块交互技术的互联网电视业务实现方法,此实现方法首先对互联网电视终端的呈现界面进行改进,定义一种基于组块的UI呈现界面,将应用资源内容以组件的形式进行封装,实现了一种新型的应用呈现布局。
所述的组块形式的界面布局内容包括:主显示区块,用以显示第一承载组块;辅显示区块,用以显示第二承载组块;所述辅显示区块位于所述主显示区块的上侧、下侧、左侧、右侧、或悬浮在上方。有多个悬浮状态的区块时,采用层次递进的形态显示,即最新弹出的悬浮状态区块总是位于界面的最前端突出显示,其他层次的界面区块通过设置层次透明度显示。
所述的***包括初始界面和多个过程界面,初始界面和过程界面的呈现形式相同,主显示区块有九个第一承载组块,排列呈宫格形;辅显示区有九个第二承载组 块,横向或纵向依次排列,每个区块内显示九个承载组块,若区块内组块超过九个时,需将第十个及以上的承载组块分页显示。
与现有公开专利中涉及到的组块界面相比,本发明中为界面定义了数学模型,并可以通过算法自动的生成初始界面和过程界面,表示方法如下:
用树结构来表示组块的界面呈现结构,组块界面作为树状图的根结点,有两种类别的五个子结点,分别为主区结点(E区结点)和辅区结点(辅区1、辅区2、… 、辅区M),其中主区结点为必须存在的结点,辅区结点可以根据需要作为对象容器的区存在,树结构的每一层的深度代表其所表示的结点的类型。如图1所示,每一个界面(包括初始界面和过程界面)作为根结点,其层次深度为1,区结点的层次深度为2,区内组块结点的层次深度为3。
组块模型,以集合Q={q|q=(主区(组块E1,组块E2,,组块En),辅区1(组块A1,组块A2, … , 组块An),辅区2(组块B1,组块B2,组块Bn),辅区M(组块M1,组块M2, … , 组块Mn)),其中主区≠∮,n≤9}表示,即组块界面的主区不能为空,并且每个区内还有的组块数不能超过9。另外,初始界面和过程界面得到的树结构,可以根据呈现内容自动生成,得到分配树结构的子结点。
如图2所示,一种双向互动数字电视盒***,包括视频服务器***、VOD管理***、数字电视网络、EPG***和数字电视终端,所述视频服务器***将数据传输给VOD管理***,所述VOD管理***将数据通过数字电视网络传输给EPG***,所述EPG***与数字电视终端之间是双向通信,所述数字电视终端的数字电视盒通过接口获取EPG***上面所有发布影片的列表,节目类型和影片名称等信息,并在数字电视终端的显示装置进行呈现。
所述视频服务器***包括:VOD播出服务器、VOD页面目录服务器、VOD播控服务器。所述VOD播控服务器是VOD业务的核心,主要用来执行处理用户的视频点播请求,并提供响应数据,并协调处理VOD点播的数据查询,播出文件准备,播出控制命令的下发。
所述VOD播出服务器主要用来执行播控服务器的点播命令,包括点播信息的分配(VPID,APID),点播文件的调度,播出文件的控制。
所述VOD页面目录服务器用于处理用户的页面目录浏览请求,并把页面数据传给请求的用户。
所述VOD管理***负责该点播用户的授权、用户点播的计费及费用明细查询。主 要功能包括用户信息管理、用户数据库索引、视频节目源管理、用户认证、服务器监测等。所述数字电视网络用于实现传输分发、网络传输、载入网络等功能。
所述EPG***为用户提供操作便捷、节目友好、可以快速访问节目的一种方式,通过该***实现浏览和查询一个或多个频道近期播放的节目信息,同时,EPG可提供分类功能,可以帮助用户浏览和选择各种类型的节目。
EPG***包括接收模块、控制转换模块、存储模块和人机交互操作模块。
所述接收模块用于接收来自于数字电视网络各种数据信息,并通过解调、解复用、解码和音视频编码等技术获取电子节目菜单信息,并将数据传输给控制转换模块;所述控制转换模块,用于将接收到的节目内容索引以及相关联的扩展信息转换为组块化结构形式,并将组块化结构形式传输给指令存储模块;
所述指令存储模块,用于存储转换后的组块化结构的节目菜单信息,并定义组块指令集,存储用户输入的原始信息和表征指令功能的操作信息之间的映射关系库,映射关系以关键字对应关键值的形式存在,所述指令存储模块与人机交互操作模块之间是双向通信。
所述映射关系库中输入指令集作为关键字存在,用于匹配用户输入的信息,并且可以通过用户输入的信息采集进行自由定义;表征指令功能的操作信息作为关键值存在,关键字与关键值的映射为一对一或多对一的关系。
所述声控式人机交互操作模块用于实现组块化的人机交互操作,包括预处理模块,特征提取模块,匹配模块,执行模块,其中预处理模块用于对收集到的语音进行预滤波、量化等去除冗余信息以及降噪处理的操作,特征提取模块,对进行录入的语音进行特征提取,得到特征向量,并根据特征向量描述建立语音库的关键词词典,存储到指令存储模块。
匹配模块用于判断用户输入指令提取得到的特征向量是否属于某一个关键词,并匹配与该关键词对应的操作指令,通过执行模块识别并响应并执行该操作指令,最后将操作结果反馈给互联网电视终端。
另外,人机交互操作模块还包括自适应识别模块,可以对用户的语音进行自学习,即允许用户定义不同的声音指令来作为***中功能的操作指令,从而对前期采样得到的声音模型进行必要的校正,以进一步提高识别的准确率。
所述的数字电视终端包括显示装置和数字电视盒,显示装置用于对接收到的EPG信息进行解析并以组块形式的界面进行显示;数字电视盒用于影片数据的获取 和识别用户的输入信息,所述数字电视盒包括实现声音录入功能的麦克风。
如图4所示,上述***所采用的工作方法步骤如下:
步骤(1):开始,视频服务器***提供视频点播的节目源,并通过VOD管理***管理点播用户的授权计费等功能,节目信息源经过数字电视网络的传输,转发给EPG***。
步骤(2):通过EPG***接收模块接收来自于数字电视网络各种数据信息,并通过解调、解复用、解码和音视频编码等技术获取电子节目菜单信息;
步骤(3):控制转换模块将接收到的电子节目菜单内容信息以及索引转换为组块结构形式,并在指令存储模块中存储转换后的组块结构的节目菜单信息;然后将节目菜单信息传输给数字电视终端的显示装置,进行界面的呈现。
步骤(4):用户的交互过程通过数字电视终端的数字电视盒的麦克风进行原始操作指令的录入,并支持用户设定自定义的操作指令。
步骤(5):通过人机交互操作模块,进行输入指令的识别和检测,判断用户输入指令是否能和映射关系库中的关键字匹配,如果是就进入步骤(6);如果否就进入步骤(7);
步骤(6):***执行相应关键字的操作指令的功能事件,并通过终端显示装置呈现操作对应的结果界面;结束;
步骤(7):显示错误提示信息,结束。
所述步骤(6)的操作对应的结果界面通过建立数学逻辑模型并应用算法自动生成,所述数学逻辑模型是指用树结构来表示组块界面的呈现结构,组块界面作为树状图的根结点,有两种类别的结点,分别为主区结点和辅区结点,其中主区结点为必须存在的结点,辅区结点允许根据需要作为对象容器的区存在,树结构的每一层的深度代表其所表示的结点的类型。
如图3所示,所述步骤(5)的声控式人机交互操作模块的具体工作方法如下:
Step1进行语音信息的采集,由于组块界面的语音操作指令与遥控式操作的指令一一对应,因此语音信息的采集只需要对特定的遥控式操作对应的语音指令进行采集,定义了三类指令:宏观指令,组块指令以及功能指令。组块指令集的划分以及配置指令与组块操作指令的映射关系请参见专利《采用声控式的人机交互设备》(申请号201310119989.3)。
Step2采集后的语音指令形成语音库,对于语音库中的每个语音信号波形图, 提取其每段间隔帧的值得到一个n维的特征向量f,从而得到特征向量集合F;
Step3对特征集合F应用K-means聚类的方法生成检索关键词词典集合D,容量为d,每个类对应的关键词g由该类内所有特征向量f取平均值得到,每一个关键词g对应一个组块的执行指令,其与组块操作指令关键值的映射关系,存储到存储模块中;
Step4对于输入的待识别的声音指令,同样按照step1和step2的方法得到一个n维的特征向量m;
Step5在关键词词典集合D中,寻找与特征向量m之间Manhattan距离最小的关键词g,如果该距离小于指定的阈值,则f为匹配的向量,其对应的指令为要执行的指令,并将m归属到该关键词对应的类中,将该类的特征描述更新为g=(D*g+m)/(d+1)。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (8)

1.一种声控式交互的双向互动数字电视盒***的工作方法,所述声控式交互的双向互动数字电视盒***包括视频服务器***、VOD管理***、数字电视网络、EPG***和数字电视终端,所述视频服务器***将数据传输给VOD管理***,所述VOD管理***将数据通过数字电视网络传输给EPG***,所述EPG***与数字电视终端之间是双向通信,所述数字电视终端的数字电视盒通过接口获取EPG***信息,并在数字电视终端的显示装置进行呈现;EPG***包括依次通信的接收模块、控制转换模块、指令存储模块和声控式人机交互操作模块;所述声控式人机交互操作模块用于实现组块化的人机交互操作,检测并识别用户的声音指令,响应并执行该声音指令,并将操作结果反馈给数字电视盒;所述人机交互操作能够通过用户的声音的信息采集进行自由定义,即允许用户定义不同的声音来表示***中的操作功能,其特征是,工作方法如下:
步骤(1):开始,视频服务器***提供视频点播的节目源,并通过VOD管理***管理点播用户的授权计费功能,节目信息源经过数字电视网络的传输,转发给EPG***;
步骤(2):通过EPG***接收模块接收来自于数字电视网络各种数据信息,并通过解调、解复用、解码和音视频编码技术获取电子节目菜单信息;
步骤(3):控制转换模块将接收到的电子节目菜单内容信息以及索引转换为组块结构形式,并在指令存储模块中存储转换后的组块结构的节目菜单信息;然后将节目菜单信息传输给数字电视终端的显示装置,进行界面的呈现;
步骤(4):用户的交互过程通过数字电视终端的数字电视盒的麦克风进行原始操作指令的录入,并支持用户设定自定义的操作指令;
步骤(5):通过人机交互操作模块,进行输入指令的识别和检测,判断用户输入指令是否能和映射关系库中的关键字匹配,如果是就进入步骤(6);如果否就进入步骤(7);
步骤(6):***执行相应关键字的操作指令的功能事件,并通过终端显示装置呈现操作对应的结果界面;结束;
步骤(7):显示错误提示信息,结束;
所述步骤(6)的操作对应的结果界面通过建立数学逻辑模型并应用算法自动生成,所述数学逻辑模型是指用树结构来表示组块界面的呈现结构,组块界面作为树状图的根结点,有两种类别的结点,分别为主区结点和辅区结点,其中主区结点为必须存在的结点,辅区结点允许根据需要作为对象容器的区存在,树结构的每一层的深度代表其所表示的结点的类型。
2.如权利要求1所述的一种声控式交互的双向互动数字电视盒***的工作方法,其特征是,所述接收模块用于接收来自于数字电视网络各种数据信息,并通过解调、解复用、解码和音视频编码获取电子节目菜单信息,并将数据传输给控制转换模块;
所述控制转换模块,用于将接收到的节目内容索引以及相关联的扩展信息转换为组块化结构形式,并将组块结构形式传输给指令存储模块;
所述指令存储模块,用于存储转换后的组块化结构的节目菜单信息,并定义组块指令集,存储用户输入的原始信息和表征指令功能的操作信息之间的映射关系库,映射关系以关键字对应关键值的形式存在,所述指令存储模块与人机交互操作模块之间是双向通信;
所述映射关系库中输入指令集作为关键字存在,用于匹配用户输入的信息,并且通过用户输入的信息采集进行自由定义;表征指令功能的操作信息作为关键值存在,关键字与关键值的映射为一对一或多对一的关系;
所述声控式人机交互操作模块包括预处理模块,特征提取模块,匹配模块,执行模块。
3.如权利要求1所述的一种声控式交互的双向互动数字电视盒***的工作方法,其特征是,所述视频服务器***包括:VOD播出服务器、VOD页面目录服务器、VOD播控服务器;
所述VOD播控服务器是VOD业务的核心,主要用来执行处理用户的视频点播请求,并提供响应数据,并协调处理VOD点播的数据查询,播出文件准备,播出控制命令的下发;
所述VOD播出服务器主要用来执行播控服务器的点播命令,包括点播信息的分配,点播文件的调度,播出文件的控制;
所述VOD页面目录服务器用于处理用户的页面目录浏览请求,并把页面数据传给请求的用户。
4.如权利要求1所述的一种声控式交互的双向互动数字电视盒***的工作方法,其特征是,所述VOD管理***负责该点播用户的授权、用户点播的计费及费用明细查询;主要功能包括用户信息管理、用户数据库索引、视频节目源管理、用户认证、服务器监测;所述数字电视网络用于实现传输分发、网络传输、载入网络功能。
5.如权利要求1所述的一种声控式交互的双向互动数字电视盒***的工作方法,其特征是,所述EPG***为用户提供操作便捷、节目友好、快速访问节目的一种方式,通过该***实现浏览和查询一个或多个频道近期播放的节目信息,同时,EPG提供分类功能,帮助用户浏览和选择各种类型的节目。
6.如权利要求2所述的一种声控式交互的双向互动数字电视盒***的工作方法,其特征是,所述预处理模块用于对收集到的语音进行预滤波、量化去除冗余信息以及降噪处理的操作,并将处理后的信息传输给特征提取模块;
特征提取模块,对进行录入的语音进行特征提取,得到特征向量,并根据特征向量描述建立语音库的关键词词典,存储到指令存储模块;
匹配模块用于判断用户输入指令提取得到的特征向量是否属于某一个关键词,并匹配与该关键词对应的操作指令,通过执行模块识别并响应并执行该操作指令,最后将操作结果反馈给互联网电视终端;
另外,人机交互操作模块还包括自适应识别模块,对用户的语音进行自学习,即允许用户定义不同的声音指令来作为***中功能的操作指令,从而对前期采样得到的声音模型进行必要的校正,以进一步提高识别的准确率。
7.如权利要求2所述的一种声控式交互的双向互动数字电视盒***的工作方法,其特征是,所述的数字电视终端包括显示装置和数字电视盒,显示装置用于对接收到的EPG信息进行解析并以组块形式的界面进行显示;数字电视盒用于影片数据的获取和识别用户的输入信息,所述数字电视盒包括实现声音录入功能的麦克风。
8.如权利要求1所述的一种声控式交互的双向互动数字电视盒***的工作方法,其特征是,所述步骤(5)的声控式人机交互操作模块的具体工作方法如下:
Step1进行语音信息的采集,由于组块界面的语音操作指令与遥控式操作的指令一一对应,因此语音信息的采集只需要对特定的遥控式操作对应的语音指令进行采集,定义了三类指令:宏观指令,组块指令以及功能指令;
Step2采集后的语音指令形成语音库,对于语音库中的每个语音信号波形图,提取其每段间隔帧的值得到一个n维的特征向量f,从而得到特征向量集合F;
Step3对特征集合F应用K-means聚类的方法生成检索关键词词典集合D,容量为d,每个类对应的关键词g由该类内所有特征向量f取平均值得到,每一个关键词g对应一个组块的执行指令,其与组块操作指令关键值的映射关系,存储到存储模块中;
Step4对于输入的待识别的声音指令,同样按照step1和step2的方法得到一个n维的特征向量m;
Step5在关键词词典集合D中,寻找与特征向量m之间Manhattan距离最小的关键词g,如果该距离小于指定的阈值,则f为匹配的向量,其对应的指令为要执行的指令,并将m归属到该关键词对应的类中,将该类的特征描述更新为g=(D*g+m)/(d+1)。
CN201310477049.1A 2013-10-12 2013-10-12 一种声控式交互的双向互动数字电视盒***的工作方法 Expired - Fee Related CN103533391B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310477049.1A CN103533391B (zh) 2013-10-12 2013-10-12 一种声控式交互的双向互动数字电视盒***的工作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310477049.1A CN103533391B (zh) 2013-10-12 2013-10-12 一种声控式交互的双向互动数字电视盒***的工作方法

Publications (2)

Publication Number Publication Date
CN103533391A CN103533391A (zh) 2014-01-22
CN103533391B true CN103533391B (zh) 2016-09-14

Family

ID=49935000

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310477049.1A Expired - Fee Related CN103533391B (zh) 2013-10-12 2013-10-12 一种声控式交互的双向互动数字电视盒***的工作方法

Country Status (1)

Country Link
CN (1) CN103533391B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11892811B2 (en) 2017-09-15 2024-02-06 Kohler Co. Geographic analysis of water conditions

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105355196A (zh) * 2015-09-28 2016-02-24 大连楼兰科技股份有限公司 智能眼镜应用于汽车维保领域的语音指令识别方法
CN105245964A (zh) * 2015-09-30 2016-01-13 天脉聚源(北京)科技有限公司 一种设置互动电视***的互动信息的方法及装置
US9924358B2 (en) * 2016-04-02 2018-03-20 Intel Corporation Bluetooth voice pairing apparatus and method
CN106331781A (zh) * 2016-09-09 2017-01-11 深圳市九洲电器有限公司 一种基于家庭语音的分析推送方法及***
CN107240400B (zh) * 2017-07-03 2020-08-11 重庆小雨点小额贷款有限公司 终端操作方法及装置
US11099540B2 (en) 2017-09-15 2021-08-24 Kohler Co. User identity in household appliances
US10448762B2 (en) 2017-09-15 2019-10-22 Kohler Co. Mirror
US11093554B2 (en) 2017-09-15 2021-08-17 Kohler Co. Feedback for water consuming appliance
US10887125B2 (en) 2017-09-15 2021-01-05 Kohler Co. Bathroom speaker
CN108053674A (zh) * 2018-01-16 2018-05-18 湖州华科信息咨询有限公司 一种用于红绿灯故障提示和维修的方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101257619A (zh) * 2008-03-21 2008-09-03 华为技术有限公司 控制交互视频业务的方法、***和设备
CN102740014A (zh) * 2011-04-07 2012-10-17 青岛海信电器股份有限公司 语音控制电视机、电视***及通过语音控制电视机的方法
CN103248919A (zh) * 2013-05-22 2013-08-14 青岛旲天下智能科技有限公司 一种iptv***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE328345T1 (de) * 2000-09-19 2006-06-15 Thomson Licensing Sprachsteuerung von elektronischen geräten

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101257619A (zh) * 2008-03-21 2008-09-03 华为技术有限公司 控制交互视频业务的方法、***和设备
CN102740014A (zh) * 2011-04-07 2012-10-17 青岛海信电器股份有限公司 语音控制电视机、电视***及通过语音控制电视机的方法
CN103248919A (zh) * 2013-05-22 2013-08-14 青岛旲天下智能科技有限公司 一种iptv***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11892811B2 (en) 2017-09-15 2024-02-06 Kohler Co. Geographic analysis of water conditions

Also Published As

Publication number Publication date
CN103533391A (zh) 2014-01-22

Similar Documents

Publication Publication Date Title
CN103533391B (zh) 一种声控式交互的双向互动数字电视盒***的工作方法
CN103501445B (zh) 一种手势交互的双向互动数字电视盒***及实现方法
CN103533415B (zh) 基于声控式人机交互技术的互联网电视***及其实现方法
KR101289081B1 (ko) 음성 인터페이스를 이용한 iptv 시스템 및 서비스 방법
CN103607609B (zh) 一种电视机频道的语音切换方法和装置
CN103442279B (zh) 一种基于机顶盒和智能电视的交互***及方法
CN109074391A (zh) 基于其他媒体资产的内容向用户推荐媒体资产的方法和***
CN103501446B (zh) 基于手势人机交互技术的互联网电视***及其实现方法
CN106804001A (zh) 一种通过微信客户端遥控机顶盒的方法及***
CN103281580A (zh) 分离用户界面的电视机遥控方法及其***
CN103067764B (zh) 一种用于互动电视机的电视接口***
US7940338B2 (en) Voice-controlled TV set
CN103248919B (zh) 一种iptv***
CN101110934A (zh) 一种家庭数字电视分用户频道收藏及快速导航装置及方法
CN104349190B (zh) 电视盒及控制显示器显示影音的方法
CN104703013A (zh) 一种机顶盒遥控器的操作方法及装置
CN102821321A (zh) 一种数字电视遥控交互***
CN104284227A (zh) 手机遥控电视***
CN114898746A (zh) 交互方法和装置、存储介质及电子装置
CN102508543A (zh) 一种用于数字终端的人机交互***
CN202334803U (zh) 数字电视机顶盒
CN205092938U (zh) 一种可语音识别的机顶盒及其智能家居***
CN104717536A (zh) 一种语音控制的方法和***
CN105245931A (zh) 一种机顶盒的遥控方法和遥控***
CN104254016A (zh) 机顶盒与智能移动终端的交互方法及其装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160914

Termination date: 20171012