CN111741369A - 一种基于语音识别的智能电视机顶盒 - Google Patents

一种基于语音识别的智能电视机顶盒 Download PDF

Info

Publication number
CN111741369A
CN111741369A CN202010662605.2A CN202010662605A CN111741369A CN 111741369 A CN111741369 A CN 111741369A CN 202010662605 A CN202010662605 A CN 202010662605A CN 111741369 A CN111741369 A CN 111741369A
Authority
CN
China
Prior art keywords
user
voice
module
information
real
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010662605.2A
Other languages
English (en)
Other versions
CN111741369B (zh
Inventor
王利平
李重
李瑞生
汤永哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Xinzhi Technology Co ltd
Original Assignee
Anhui Xinzhi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Xinzhi Technology Co ltd filed Critical Anhui Xinzhi Technology Co ltd
Priority to CN202010662605.2A priority Critical patent/CN111741369B/zh
Publication of CN111741369A publication Critical patent/CN111741369A/zh
Application granted granted Critical
Publication of CN111741369B publication Critical patent/CN111741369B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/254Management at additional data server, e.g. shopping server, rights management server
    • H04N21/2541Rights Management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/441Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
    • H04N21/4415Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种基于语音识别的智能电视机顶盒,包括识别分析模块、数据库、自动推荐模块、语音录制模块、用户注册模块、摄像单元、处理器、报警模块、外界采集模块以及控制模块;处理器用于对识别分析模块分析计算的数据库内实时声压、识别语音和实时手势进行对比,用户注册模块用于用户通过手机终端提交用户的数量和用户的数据信息进行注册并将注册成功的用户的数量和用户的数据信息发送至数据库内保存;本发明智能化性能强,能够大量减少用户的等待时间,同时智能化控制让用户使用时更加便利,给用户的生活也带来了方便。

Description

一种基于语音识别的智能电视机顶盒
技术领域
本发明涉及智能电视机顶盒领域,具体为一种基于语音识别的智能电视机顶盒。
背景技术
电视机顶盒作为重要的影音设备满足着现在绝大部分家庭和酒店对娱乐和生活的要求;但受限于遥控器操作的复杂度,通过语音来直接控制我们常见的搜索、切换台等功能并且也可以通过使用机顶盒作为智慧家庭的中控,来控制例如灯光、空调等智能家居设备,让我们解放双手,仅仅通过一条语音指令就可以完成我们想要的操作;目前主流的智慧家庭中控方案都是通过外接其他的中控设备提供相关的服务,我们把整个功能结合在机顶盒中,而客厅作为家人每天活动时间最长的区域,无疑这样能够提供更好的服务。也能提高设备的使用率。
申请号为CN201410482292.7公开了一种机顶盒***,该机顶盒***包括:第一高频头、第二高频头和第三高频头,用于接收卫星信号;第四高频头,用于接收地面信号;三个第一解调芯片,分别用于对第一高频头、第二高频头和第三高频头输出的中频信号进行解调;一个第二解调芯片,用于对第四高频头输出的中频信号进行解调;中央处理器,用于对所述三个第一解调芯片和所述第二解调芯片输出的传输流进行处理。
但是该专利中,不能够通过语音对使用者进行身份识别,也不能通过关键词和手势对使用者进行身份识别,对用户隐私的保护性低。
发明内容
本发明的目的就在于提出一种基于语音识别的智能电视机顶盒;
本发明的目的可以通过以下技术方案实现:
一种基于语音识别的智能电视机顶盒,包括识别分析模块、数据库、自动推荐模块、语音录制模块、用户注册模块、摄像单元、处理器、报警模块、外界采集模块以及控制模块;
外界采集模块用于实时获取当前使用者的声压和识别语音,并将声压标记为实时声压,外界采集模块还用于采集使用者在使用时录入的实时手势,所述外界采集模块用于将实时声压、识别语音和实时手势传输到识别分析模块;
所述识别分析模块接收到外界采集模块传输的实时声压、识别语音和实时手势,所述识别分析模块用于结合数据库内的声压信息、关键词和验证信息对实时声压、识别语音和实时手势进行身份验证处理,身份验证处理的具体步骤为:
步骤一:获取到对应外界采集模块传输的实时声压、识别语音和实时手势;
步骤二:将识别语音与对应数据库内存储的验证信息进行比较,具体比较过程为:
S1:将识别语音通过语音转文字技术转化为文字信息,将该文字信息标记为待验证词语;
S2:将待验证词语与所有的关键词进行匹配,找到对应与待验证词语一致的关键词对应的用户信息;若无对应的用户信息则产生鉴权失败信号;
步骤三:获取到对应的用户信息,并获取到对应该用户信息的验证手势和声压信息;
步骤四:获取到实时声压和实时手势;对实时手势进行验证处理,并根据验证处理结果进行验证势值的赋值过程,具体处理步骤如下:
S01:将实时手势与对应的验证手势进行比对,当二者一致时,将验证势值Yz赋予为1,否则赋予为0;
S02:获取到用户的实时声压,将实时声压标记为Sy,将对应的声压信息标记为Y;
S03:利用公式获取相似值Xs;具体公式为:
Xs={|Sy-Y|/Y}×Yz;
式中|Sy-Y|表示为求取二者差值的绝对值;
S04:得到相似值Xs;
步骤五:当Xs低于X1时,产生核通信号,将对应的用户信息标记为使用用户;此处X1为预设值;
所述处理器用于将外界采集模块传输的实时声压、识别语音和实时手势结合数据库内的声压信息、关键词和验证信息进行比对;
SS1:若处理器接收到鉴权失败信号,则生成报警信号并发送至报警模块;
SS2:若验证势值Yz赋予为1时,则生成识别信息准确信号并发送至自动推荐模块;
若验证势值Yz赋予为0时,则生成报警信号并发送至报警模块;
SS3:若处理器接收到核通信号,则生成识别信息准确信号并发送至自动推荐模块;反之,则生成报警信号并发送至报警模块;
SS4:处理生成识别信息准确信号后,结合数据库内使用用户的权限,对使用用户的使用进行管理,具体管理步骤如下:
M1:若使用用户的年龄小于设定阈值N1,则处理器生成限制时间信号,并将信号发送至控制单元;
M2:若使用用户的年龄大于设定阈值N2,则处理器生成降低亮度信号,并将信号发送至控制单元。
进一步地,所述自动推荐模块用于为用户推荐合适的节目类型,处理器将外界采集模块传输的实时声压、识别语音和实时手势结合数据库内的声压信息、关键词和验证信息进行比对,用户信息识别准确后处理器生成语音识别准确的信息并发送至自动推荐模块,具体自动推荐的步骤如下:
P1:获取当前使用电视的用户的十天内节目收藏的次数,并将其标记为Gu;
P2:获取当前使用电视的用户的十天内观看节目的次数,并将其标记为Wu;
P3:获取当前使用电视的用户的十天内的浏览节目的时间,并将其标记为Ru;
P4:获取当前使用电视的用户的十天内节目参与点评的次数,并将其标记为Yu;
P5:利用公式
Figure BDA0002579167250000041
获取自动推荐系数Xu,其中,μ为误差修正因子,取值为0.95682;d7、d8、d9和d10均为预设比例系数,且d7+d8+d9+d10=1,d7<d8<d9<d10,T1和T2为时间比例系数;
P6:自动推荐系数Xu计算出来以后,***将自动选取前三推荐系数高的节目进行推荐。
进一步地,用户注册模块用于用户通过手机终端提交用户的数量和用户的数据信息进行注册并将注册成功的用户的数量和用户的数据信息发送至数据库内保存,所述用户的数据信息包括姓名,年龄,照片;用户注册模块在用户注册成功后向数据库传输结束信号;
所述数据库在接收到用户注册模块传输的结束信号后,生成语音录制开始信号并发送至语音录制模块,所述语音录制模块用于将用户与语音关键信息绑定后形成注册用户信息,并将注册用户信息存储在数据库内,语音录制模块在接收到数据库传输的语音录制开始信号时,通知用户进行语音录制,此时语音录制模块会对每个用户的语音关键信息进行录制,语音关键信息包括用户语音的声压信息和关键词;关键词为用户自定义设置的词语,用于核验用户身份;
所述摄像单元用于在注册时采集用户的验证手势,验证手势为用户预设的手势,用于进一步核验用户身份;所述摄像单元用于将验证手势与其对应的用户匹配,得到验证信息;并将验证信息传输到数据库内进行存储。
进一步地,所述控制模块用于通过语音控制电视工作,处理器对解析度进行对比之后,生成语音识别准确的信息并发送至控制模块,所述控制模块分为:电视控制单元、家居控制单元、娱乐单元、天气查询单元以及股票查询单元,各部分具体工作过程如下:
a、所述电视控制单元可以通过语音对电视进行操作:
a1、用户通过语音操作,可以控制电视的开启、直播的播放以及对节目的换台;
a2、用户通过语音操作,可以再任意场景下,通过遥控器说增加音量和减少音量来控制电视的声音大小;
b、所述家居控制单元以机顶盒作为中控入口,来控制用户家庭中所有已联网的智能设备:
b1、用户通过机顶盒可以直接控制空调的温度、模式和风速等功能设置;
b2、用户通过机顶盒可以直接开关灯;
b3、用户通过机顶盒可以直接操作窗帘;
c、所述娱乐单元可以通过机顶盒开展娱乐活动:
c1、用户通过机顶盒可以收听喜欢的新闻节目;
c2、用户通过机顶盒可以收听热爱的音乐,并通过语音控制音乐的切歌、暂停播放和继续播放;
c3、用户通过机顶盒可以播放唐诗;
c4、用户通过机顶盒可以用人机闲聊的方式进行沟通;
d、所述天气查询单元可以通过用户语音直接查询当前城市的天气,也可以查询其他城市,其他时间的天气消息,并且在查询成功后通过TTS播放通知给用户;
e、所述股票查询单元可以为用户查询股票的行情。
与现有技术相比,本发明的有益效果是:
1、识别分析模块接收到外界采集模块传输的实时声压、识别语音和实时手势,所述识别分析模块用于结合数据库内的声压信息、关键词和验证信息对实时声压、识别语音和实时手势进行身份验证处理,身份验证处理的具体步骤为:获取到对应外界采集模块传输的实时声压、识别语音和实时手势;将识别语音与对应数据库内存储的验证信息进行比较,所述处理器用于将外界采集模块传输的实时声压、识别语音和实时手势结合数据库内的声压信息、关键词和验证信息进行比对;若处理器接收到鉴权失败信号,则生成报警信号并发送至报警模块;若验证势值Yz赋予为1时,则生成识别信息准确信号并发送至自动推荐模块;若验证势值Yz赋予为0时,则生成报警信号并发送至报警模块;若处理器接收到核通信号,则生成识别信息准确信号并发送至自动推荐模块;反之,则生成报警信号并发送至报警模块;处理生成识别信息准确信号后,结合数据库内使用用户的权限,对使用用户的使用进行管理,本***通过使用者实时声压、识别语音和实时手势,识别出使用者的身份,防止他人随意使用,防止用户的信息泄露,提高了机顶盒的安全性能;
2、处理器对实时声压、识别语音和实时手势进行对比之后,生成语音识别准确的信息并发送至自动推荐模块,获取当前使用电视的用户十天内的节目收藏的次数、观看节目的次数、浏览节目的时间和节目参与点评的次数,利用公式获取自动推荐系数,随后***将自动选取前三推荐系数高的节目进行推荐,能够为用户推荐视频,减少客户搜索的时间;
3、控制模块用于通过语音控制电视工作,处理器对解析度进行对比之后,生成语音识别准确的信息并发送至控制模块,所述控制模块分为:电视控制单元、家居控制单元、娱乐单元、天气查询单元以及股票查询单元,能够通过语音制电视的开启、直播的播放以及对节目的换台同时可以通过遥控器说增加音量和减少音量来控制电视的声音大小,家居控制单元以机顶盒作为中控入口,来控制用户家庭中所有已联网的智能设备,所述天气查询单元可以通过用户语音直接查询当前城市的天气,也可以查询其他城市,其他时间的天气消息,并且在查询成功后通过TTS播放通知给用户,所述股票查询单元可以为用户查询股票的行情,本发明智能化性能强,能够大量减少用户的等待时间,同时智能化控制让用户使用时更加便利,给用户的生活也带来了方便。
附图说明
为了便于本领域技术人员理解,下面结合附图对本发明作进一步的说明。
图1为本发明的原理框图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,一种基于语音识别的智能电视机顶盒,包括识别分析模块、数据库、自动推荐模块、语音录制模块、用户注册模块、摄像单元、处理器、报警模块、外界采集模块以及控制模块;
外界采集模块用于实时获取当前使用者的声压和识别语音,并将声压标记为实时声压,外界采集模块还用于采集使用者在使用时录入的实时手势,所述外界采集模块用于将实时声压、识别语音和实时手势传输到识别分析模块;
所述识别分析模块接收到外界采集模块传输的实时声压、识别语音和实时手势,所述识别分析模块用于结合数据库内的声压信息、关键词和验证信息对实时声压、识别语音和实时手势进行身份验证处理,身份验证处理的具体步骤为:
步骤一:获取到对应外界采集模块传输的实时声压、识别语音和实时手势;
步骤二:将识别语音与对应数据库内存储的验证信息进行比较,具体比较过程为:
S1:将识别语音通过语音转文字技术转化为文字信息,将该文字信息标记为待验证词语;
S2:将待验证词语与所有的关键词进行匹配,找到对应与待验证词语一致的关键词对应的用户信息;若无对应的用户信息则产生鉴权失败信号;
步骤三:获取到对应的用户信息,并获取到对应该用户信息的验证手势和声压信息;
步骤四:获取到实时声压和实时手势;对实时手势进行验证处理,并根据验证处理结果进行验证势值的赋值过程,具体处理步骤如下:
S01:将实时手势与对应的验证手势进行比对,当二者一致时,将验证势值Yz赋予为1,否则赋予为0;
S02:获取到用户的实时声压,将实时声压标记为Sy,将对应的声压信息标记为Y;
S03:利用公式获取相似值Xs;具体公式为:
Xs={|Sy-Y|/Y}×Yz;
式中|Sy-Y|表示为求取二者差值的绝对值;
S04:得到相似值Xs;
步骤五:当Xs低于X1时,产生核通信号,将对应的用户信息标记为使用用户;此处X1为预设值;
所述处理器用于将外界采集模块传输的实时声压、识别语音和实时手势结合数据库内的声压信息、关键词和验证信息进行比对;
SS1:若处理器接收到鉴权失败信号,则生成报警信号并发送至报警模块;
SS2:若验证势值Yz赋予为1时,则生成识别信息准确信号并发送至自动推荐模块;
若验证势值Yz赋予为0时,则生成报警信号并发送至报警模块;
SS3:若处理器接收到核通信号,则生成识别信息准确信号并发送至自动推荐模块;反之,则生成报警信号并发送至报警模块;
SS4:处理生成识别信息准确信号后,结合数据库内使用用户的权限,对使用用户的使用进行管理,具体管理步骤如下:
M1:若使用用户的年龄小于设定阈值N1,则处理器生成限制时间信号,并将信号发送至控制单元;
M2:若使用用户的年龄大于设定阈值N2,则处理器生成降低亮度信号,并将信号发送至控制单元。
所述自动推荐模块用于为用户推荐合适的节目类型,处理器将外界采集模块传输的实时声压、识别语音和实时手势结合数据库内的声压信息、关键词和验证信息进行比对,用户信息识别准确后处理器生成语音识别准确的信息并发送至自动推荐模块,具体自动推荐的步骤如下:
P1:获取当前使用电视的用户的十天内节目收藏的次数,并将其标记为Gu;
P2:获取当前使用电视的用户的十天内观看节目的次数,并将其标记为Wu;
P3:获取当前使用电视的用户的十天内的浏览节目的时间,并将其标记为Ru;
P4:获取当前使用电视的用户的十天内节目参与点评的次数,并将其标记为Yu;
P5:利用公式
Figure BDA0002579167250000101
获取自动推荐系数Xu,其中,μ为误差修正因子,取值为0.95682;d7、d8、d9和d10均为预设比例系数,且d7+d8+d9+d10=1,d7<d8<d9<d10,T1和T2为时间比例系数;
P6:自动推荐系数Xu计算出来以后,***将自动选取前三推荐系数高的节目进行推荐。
用户注册模块用于用户通过手机终端提交用户的数量和用户的数据信息进行注册并将注册成功的用户的数量和用户的数据信息发送至数据库内保存,所述用户的数据信息包括姓名,年龄,照片;用户注册模块在用户注册成功后向数据库传输结束信号;
所述数据库在接收到用户注册模块传输的结束信号后,生成语音录制开始信号并发送至语音录制模块,所述语音录制模块用于将用户与语音关键信息绑定后形成注册用户信息,并将注册用户信息存储在数据库内,语音录制模块在接收到数据库传输的语音录制开始信号时,通知用户进行语音录制,此时语音录制模块会对每个用户的语音关键信息进行录制,语音关键信息包括用户语音的声压信息和关键词;关键词为用户自定义设置的词语,用于核验用户身份;
所述摄像单元用于在注册时采集用户的验证手势,验证手势为用户预设的手势,用于进一步核验用户身份;所述摄像单元用于将验证手势与其对应的用户匹配,得到验证信息;并将验证信息传输到数据库内进行存储。
所述控制模块用于通过语音控制电视工作,处理器对解析度进行对比之后,生成语音识别准确的信息并发送至控制模块,所述控制模块分为:电视控制单元、家居控制单元、娱乐单元、天气查询单元以及股票查询单元,各部分具体工作过程如下:
a、所述电视控制单元可以通过语音对电视进行操作:
a1、用户通过语音操作,可以控制电视的开启、直播的播放以及对节目的换台;
a2、用户通过语音操作,可以再任意场景下,通过遥控器说增加音量和减少音量来控制电视的声音大小;
b、所述家居控制单元以机顶盒作为中控入口,来控制用户家庭中所有已联网的智能设备:
b1、用户通过机顶盒可以直接控制空调的温度、模式和风速等功能设置;
b2、用户通过机顶盒可以直接开关灯;
b3、用户通过机顶盒可以直接操作窗帘;
c、所述娱乐单元可以通过机顶盒开展娱乐活动:
c1、用户通过机顶盒可以收听喜欢的新闻节目;
c2、用户通过机顶盒可以收听热爱的音乐,并通过语音控制音乐的切歌、暂停播放和继续播放;
c3、用户通过机顶盒可以播放唐诗;
c4、用户通过机顶盒可以用人机闲聊的方式进行沟通;
d、所述天气查询单元可以通过用户语音直接查询当前城市的天气,也可以查询其他城市,其他时间的天气消息,并且在查询成功后通过TTS播放通知给用户;
e、所述股票查询单元可以为用户查询股票的行情。
本发明工作原理:
一种基于语音识别的智能电视机顶盒,工作时,识别分析模块接收到外界采集模块传输的实时声压、识别语音和实时手势,所述识别分析模块用于结合数据库内的声压信息、关键词和验证信息对实时声压、识别语音和实时手势进行身份验证处理,身份验证处理的具体步骤为:获取到对应外界采集模块传输的实时声压、识别语音和实时手势;将识别语音与对应数据库内存储的验证信息进行比较,具体比较过程为:将识别语音通过语音转文字技术转化为文字信息,将该文字信息标记为待验证词语;将待验证词语与所有的关键词进行匹配,找到对应与待验证词语一致的关键词对应的用户信息;若无对应的用户信息则产生鉴权失败信号;获取到对应的用户信息,并获取到对应该用户信息的验证手势和声压信息;获取到实时声压和实时手势;对实时手势进行验证处理,并根据验证处理结果进行验证势值的赋值过程,具体处理步骤如下:将实时手势与对应的验证手势进行比对,当二者一致时,将验证势值Yz赋予为1,否则赋予为0;获取到用户的实时声压,将实时声压标记为Sy,将对应的声压信息标记为Y;利用公式获取相似值Xs;得到相似值Xs;当Xs低于X1时,产生核通信号,将对应的用户信息标记为使用用户;此处X1为预设值;所述处理器用于将外界采集模块传输的实时声压、识别语音和实时手势结合数据库内的声压信息、关键词和验证信息进行比对;若处理器接收到鉴权失败信号,则生成报警信号并发送至报警模块;若验证势值Yz赋予为1时,则生成识别信息准确信号并发送至自动推荐模块;若验证势值Yz赋予为0时,则生成报警信号并发送至报警模块;若处理器接收到核通信号,则生成识别信息准确信号并发送至自动推荐模块;反之,则生成报警信号并发送至报警模块;处理生成识别信息准确信号后,结合数据库内使用用户的权限,对使用用户的使用进行管理,具体管理步骤如下:若使用用户的年龄小于设定阈值N1,则处理器生成限制时间信号,并将信号发送至控制单元;若使用用户的年龄大于设定阈值N2,则处理器生成降低亮度信号,并将信号发送至控制单元,本***通过使用者实时声压、识别语音和实时手势,识别出使用者的身份,防止他人随意使用,防止用户的信息泄露,提高了机顶盒的安全性能;处理器对实时声压、识别语音和实时手势进行对比之后,生成语音识别准确的信息并发送至自动推荐模块,获取当前使用电视的用户十天内的节目收藏的次数、观看节目的次数、浏览节目的时间和节目参与点评的次数,利用公式获取自动推荐系数,随后***将自动选取前三推荐系数高的节目进行推荐,能够为用户推荐视频,减少客户搜索的时间;控制模块用于通过语音控制电视工作,处理器对解析度进行对比之后,生成语音识别准确的信息并发送至控制模块,所述控制模块分为:电视控制单元、家居控制单元、娱乐单元、天气查询单元以及股票查询单元,能够通过语音制电视的开启、直播的播放以及对节目的换台同时可以通过遥控器说增加音量和减少音量来控制电视的声音大小,家居控制单元以机顶盒作为中控入口,来控制用户家庭中所有已联网的智能设备,所述天气查询单元可以通过用户语音直接查询当前城市的天气,也可以查询其他城市,其他时间的天气消息,并且在查询成功后通过TTS播放通知给用户,所述股票查询单元可以为用户查询股票的行情,本发明智能化性能强,能够大量减少用户的等待时间,同时智能化控制让用户使用时更加便利,给用户的生活也带来了方便。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (4)

1.一种基于语音识别的智能电视机顶盒,其特征在于,包括识别分析模块、数据库、自动推荐模块、语音录制模块、用户注册模块、摄像单元、处理器、报警模块、外界采集模块以及控制模块;
外界采集模块用于实时获取当前使用者的声压和识别语音,并将声压标记为实时声压,外界采集模块还用于采集使用者在使用时录入的实时手势,所述外界采集模块用于将实时声压、识别语音和实时手势传输到识别分析模块;
所述识别分析模块接收到外界采集模块传输的实时声压、识别语音和实时手势,所述识别分析模块用于结合数据库内的声压信息、关键词和验证信息对实时声压、识别语音和实时手势进行身份验证处理,身份验证处理的具体步骤为:
步骤一:获取到对应外界采集模块传输的实时声压、识别语音和实时手势;
步骤二:将识别语音与对应数据库内存储的验证信息进行比较,具体比较过程为:
S1:将识别语音通过语音转文字技术转化为文字信息,将该文字信息标记为待验证词语;
S2:将待验证词语与所有的关键词进行匹配,找到对应与待验证词语一致的关键词对应的用户信息;若无对应的用户信息则产生鉴权失败信号;
步骤三:获取到对应的用户信息,并获取到对应该用户信息的验证手势和声压信息;
步骤四:获取到实时声压和实时手势;对实时手势进行验证处理,并根据验证处理结果进行验证势值的赋值过程,具体处理步骤如下:
S01:将实时手势与对应的验证手势进行比对,当二者一致时,将验证势值Yz赋予为1,否则赋予为0;
S02:获取到用户的实时声压,将实时声压标记为Sy,将对应的声压信息标记为Y;
S03:利用公式获取相似值Xs;具体公式为:
Xs={|Sy-Y|/Y}×Yz;
式中|Sy-Y|表示为求取二者差值的绝对值;
S04:得到相似值Xs;
步骤五:当Xs低于X1时,产生核通信号,将对应的用户信息标记为使用用户;此处X1为预设值;
所述处理器用于将外界采集模块传输的实时声压、识别语音和实时手势结合数据库内的声压信息、关键词和验证信息进行比对;
SS1:若处理器接收到鉴权失败信号,则生成报警信号并发送至报警模块;
SS2:若验证势值Yz赋予为1时,则生成识别信息准确信号并发送至自动推荐模块;
若验证势值Yz赋予为0时,则生成报警信号并发送至报警模块;
SS3:若处理器接收到核通信号,则生成识别信息准确信号并发送至自动推荐模块;反之,则生成报警信号并发送至报警模块;
SS4:处理生成识别信息准确信号后,结合数据库内使用用户的权限,对使用用户的使用进行管理,具体管理步骤如下:
M1:若使用用户的年龄小于设定阈值N1,则处理器生成限制时间信号,并将信号发送至控制单元;
M2:若使用用户的年龄大于设定阈值N2,则处理器生成降低亮度信号,并将信号发送至控制单元。
2.根据权利要求1所述的一种基于语音识别的智能电视机顶盒,其特征在于,所述自动推荐模块用于为用户推荐合适的节目类型,处理器将外界采集模块传输的实时声压、识别语音和实时手势结合数据库内的声压信息、关键词和验证信息进行比对,用户信息识别准确后处理器生成语音识别准确的信息并发送至自动推荐模块,具体自动推荐的步骤如下:
P1:获取当前使用电视的用户的十天内节目收藏的次数,并将其标记为Gu;
P2:获取当前使用电视的用户的十天内观看节目的次数,并将其标记为Wu;
P3:获取当前使用电视的用户的十天内的浏览节目的时间,并将其标记为Ru;
P4:获取当前使用电视的用户的十天内节目参与点评的次数,并将其标记为Yu;
P5:利用公式
Figure FDA0002579167240000031
获取自动推荐系数Xu,其中,μ为误差修正因子,取值为0.95682;d7、d8、d9和d10均为预设比例系数,且d7+d8+d9+d10=1,d7<d8<d9<d10,T1和T2为时间比例系数;
P6:自动推荐系数Xu计算出来以后,***将自动选取前三推荐系数高的节目进行推荐。
3.根据权利要求1所述的一种基于语音识别的智能电视机顶盒,其特征在于,用户注册模块用于用户通过手机终端提交用户的数量和用户的数据信息进行注册并将注册成功的用户的数量和用户的数据信息发送至数据库内保存,所述用户的数据信息包括姓名,年龄,照片;用户注册模块在用户注册成功后向数据库传输结束信号;
所述数据库在接收到用户注册模块传输的结束信号后,生成语音录制开始信号并发送至语音录制模块,所述语音录制模块用于将用户与语音关键信息绑定后形成注册用户信息,并将注册用户信息存储在数据库内,语音录制模块在接收到数据库传输的语音录制开始信号时,通知用户进行语音录制,此时语音录制模块会对每个用户的语音关键信息进行录制,语音关键信息包括用户语音的声压信息和关键词;
所述摄像单元用于在注册时采集用户的验证手势,验证手势为用户预设的手势,用于进一步核验用户身份;所述摄像单元用于将验证手势与其对应的用户匹配,得到验证信息;并将验证信息传输到数据库内进行存储。
4.根据权利要求1所述的一种基于语音识别的智能电视机顶盒,其特征在于,所述控制模块用于通过语音控制电视工作,处理器对解析度进行对比之后,生成语音识别准确的信息并发送至控制模块,所述控制模块分为:电视控制单元、家居控制单元、娱乐单元、天气查询单元以及股票查询单元,各部分具体工作过程如下:
a、所述电视控制单元可以通过语音对电视进行操作:
a1、用户通过语音操作,可以控制电视的开启、直播的播放以及对节目的换台;
a2、用户通过语音操作,可以再任意场景下,通过遥控器说增加音量和减少音量来控制电视的声音大小;
b、所述家居控制单元以机顶盒作为中控入口,来控制用户家庭中所有已联网的智能设备:
b1、用户通过机顶盒可以直接控制空调的温度、模式和风速等功能设置;
b2、用户通过机顶盒可以直接开关灯;
b3、用户通过机顶盒可以直接操作窗帘;
c、所述娱乐单元可以通过机顶盒开展娱乐活动:
c1、用户通过机顶盒可以收听喜欢的新闻节目;
c2、用户通过机顶盒可以收听热爱的音乐,并通过语音控制音乐的切歌、暂停播放和继续播放;
c3、用户通过机顶盒可以播放唐诗;
c4、用户通过机顶盒可以用人机闲聊的方式进行沟通;
d、所述天气查询单元可以通过用户语音直接查询当前城市的天气,也可以查询其他城市,其他时间的天气消息,并且在查询成功后通过TTS播放通知给用户;
e、所述股票查询单元可以为用户查询股票的行情。
CN202010662605.2A 2020-07-10 2020-07-10 一种基于语音识别的智能电视机顶盒 Active CN111741369B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010662605.2A CN111741369B (zh) 2020-07-10 2020-07-10 一种基于语音识别的智能电视机顶盒

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010662605.2A CN111741369B (zh) 2020-07-10 2020-07-10 一种基于语音识别的智能电视机顶盒

Publications (2)

Publication Number Publication Date
CN111741369A true CN111741369A (zh) 2020-10-02
CN111741369B CN111741369B (zh) 2021-11-16

Family

ID=72654157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010662605.2A Active CN111741369B (zh) 2020-07-10 2020-07-10 一种基于语音识别的智能电视机顶盒

Country Status (1)

Country Link
CN (1) CN111741369B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112327789A (zh) * 2020-11-26 2021-02-05 江西台德智慧科技有限公司 一种应用于智能语音助手的语音交互的***及方法
CN112530167A (zh) * 2020-12-07 2021-03-19 宜辰光电科技(安徽)有限公司 一种基于云平台的车载屏幕面板的控制***
CN112735390A (zh) * 2020-12-25 2021-04-30 江西台德智慧科技有限公司 一种具有语音识别功能的智能语音终端设备
CN114339342A (zh) * 2021-12-23 2022-04-12 歌尔科技有限公司 一种遥控器控制方法、遥控器、控制装置及介质
CN115544362A (zh) * 2022-10-11 2022-12-30 读书郎教育科技有限公司 一种基于ai的内容推荐***

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1977293A (zh) * 2004-06-29 2007-06-06 皇家飞利浦电子股份有限公司 个人手势签名
CN101420543A (zh) * 2008-12-05 2009-04-29 天津三星电子显示器有限公司 一种语音控制电视机的方法及其电视机
US20110301953A1 (en) * 2010-06-07 2011-12-08 Seoby Electronic Co., Ltd System and method of multi model adaptation and voice recognition
CN105338390A (zh) * 2015-12-09 2016-02-17 陈国铭 智能电视控制***
CN105959806A (zh) * 2016-05-25 2016-09-21 乐视控股(北京)有限公司 节目推荐方法及装置
CN106060596A (zh) * 2016-06-29 2016-10-26 江苏省公用信息有限公司 一种交互式网络电视用户分组***及方法
CN108460329A (zh) * 2018-01-15 2018-08-28 任俊芬 一种基于深度学习检测的人脸手势配合验证方法
CN109195014A (zh) * 2018-09-27 2019-01-11 江苏银河数字技术有限公司 具有用户识别和节目推送功能的机顶盒***及其应用方法
CN109660833A (zh) * 2018-12-19 2019-04-19 四川省有线广播电视网络股份有限公司 智能语音电视***终端门户设计方法
CN110363639A (zh) * 2019-07-08 2019-10-22 广东工贸职业技术学院 一种基于人工智能的财务管理***

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1977293A (zh) * 2004-06-29 2007-06-06 皇家飞利浦电子股份有限公司 个人手势签名
CN101420543A (zh) * 2008-12-05 2009-04-29 天津三星电子显示器有限公司 一种语音控制电视机的方法及其电视机
US20110301953A1 (en) * 2010-06-07 2011-12-08 Seoby Electronic Co., Ltd System and method of multi model adaptation and voice recognition
CN105338390A (zh) * 2015-12-09 2016-02-17 陈国铭 智能电视控制***
CN105959806A (zh) * 2016-05-25 2016-09-21 乐视控股(北京)有限公司 节目推荐方法及装置
CN106060596A (zh) * 2016-06-29 2016-10-26 江苏省公用信息有限公司 一种交互式网络电视用户分组***及方法
CN108460329A (zh) * 2018-01-15 2018-08-28 任俊芬 一种基于深度学习检测的人脸手势配合验证方法
CN109195014A (zh) * 2018-09-27 2019-01-11 江苏银河数字技术有限公司 具有用户识别和节目推送功能的机顶盒***及其应用方法
CN109660833A (zh) * 2018-12-19 2019-04-19 四川省有线广播电视网络股份有限公司 智能语音电视***终端门户设计方法
CN110363639A (zh) * 2019-07-08 2019-10-22 广东工贸职业技术学院 一种基于人工智能的财务管理***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李丽慧等: "基于计算机视觉的用户身份验证App设计与实现", 《信息与电脑(理论版)》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112327789A (zh) * 2020-11-26 2021-02-05 江西台德智慧科技有限公司 一种应用于智能语音助手的语音交互的***及方法
CN112327789B (zh) * 2020-11-26 2023-04-28 江西台德智慧科技有限公司 一种应用于智能语音助手的语音交互的***及方法
CN112530167A (zh) * 2020-12-07 2021-03-19 宜辰光电科技(安徽)有限公司 一种基于云平台的车载屏幕面板的控制***
CN112735390A (zh) * 2020-12-25 2021-04-30 江西台德智慧科技有限公司 一种具有语音识别功能的智能语音终端设备
CN112735390B (zh) * 2020-12-25 2023-02-28 江西台德智慧科技有限公司 一种具有语音识别功能的智能语音终端设备
CN114339342A (zh) * 2021-12-23 2022-04-12 歌尔科技有限公司 一种遥控器控制方法、遥控器、控制装置及介质
CN115544362A (zh) * 2022-10-11 2022-12-30 读书郎教育科技有限公司 一种基于ai的内容推荐***
CN115544362B (zh) * 2022-10-11 2023-06-13 读书郎教育科技有限公司 一种基于ai的内容推荐***

Also Published As

Publication number Publication date
CN111741369B (zh) 2021-11-16

Similar Documents

Publication Publication Date Title
CN111741369B (zh) 一种基于语音识别的智能电视机顶盒
KR101289081B1 (ko) 음성 인터페이스를 이용한 iptv 시스템 및 서비스 방법
US20140195230A1 (en) Display apparatus and method for controlling the same
US9520133B2 (en) Display apparatus and method for controlling the display apparatus
US11146841B2 (en) Voice-based television control method and intelligent terminal
CN102196207B (zh) 语音控制电视机的方法、装置和***
WO2016169329A1 (zh) 一种语音控制电子节目的方法、装置及存储介质
WO2016206494A1 (zh) 语音控制方法、装置和移动终端
EP2249565B1 (en) Program information processing system, program information management server, program information operation terminal, and computer program
EP2919472A1 (en) Display apparatus, method for controlling display apparatus, and interactive system
WO2015041915A1 (en) Channel program recommendation on a display device
CN105161106A (zh) 智能终端的语音控制方法、装置及电视机***
CN102833582B (zh) 采用语音搜索音视频资源的方法
JP2014003609A (ja) ディスプレイ装置、ディスプレイ装置の制御方法、サーバ及びサーバの制御方法
CN103491411A (zh) 基于语言推荐频道的方法及其装置
US20130339032A1 (en) Server and method of controlling the same
CN110517686A (zh) 智能音箱端语音开通应用的方法及***
WO2020177687A1 (zh) 一种模式设置方法、装置、电子设备及存储介质
US10826961B2 (en) Multimedia player device automatically performs an operation triggered by a portable electronic device
US12035006B2 (en) Electronic apparatus having notification function, and control method for electronic apparatus
JP6305538B2 (ja) 電子機器及び方法及びプログラム
KR101828715B1 (ko) 단축코드를 이용한 양방향 데이터서비스 확장시스템
CN108363770A (zh) 一种机顶盒支持多途径提取关键词并搜索的方法和***
CN112399208A (zh) 显示设备的控制方法、显示设备及存储介质
CN104202628A (zh) 服务器、客户端、客户端播放节目的识别***和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant