CN116095377A - 一种基于语音识别的遥控器控制方法、装置及电子设备 - Google Patents
一种基于语音识别的遥控器控制方法、装置及电子设备 Download PDFInfo
- Publication number
- CN116095377A CN116095377A CN202211734677.9A CN202211734677A CN116095377A CN 116095377 A CN116095377 A CN 116095377A CN 202211734677 A CN202211734677 A CN 202211734677A CN 116095377 A CN116095377 A CN 116095377A
- Authority
- CN
- China
- Prior art keywords
- voice
- user
- program content
- remote controller
- acquiring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012545 processing Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 abstract description 9
- 230000006870 function Effects 0.000 description 19
- 238000004891 communication Methods 0.000 description 9
- 230000009471 action Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
- H04N21/42206—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
- H04N21/4221—Dedicated function buttons, e.g. for the control of an EPG, subtitles, aspect ratio, picture-in-picture or teletext
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
- H04N21/42206—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
- H04N21/42222—Additional components integrated in the remote control device, e.g. timer, speaker, sensors for detecting position, direction or movement of the remote control, microphone or battery charging device
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Selective Calling Equipment (AREA)
Abstract
本申请提供一种基于语音识别的遥控器控制方法、装置及电子设备。该方法应用于遥控器,所述方法包括:获取用户的第一语音;将所述第一语音与特征语音表进行匹配,得到第一节目内容,所述特征语音表包括多个语音以及多个语音各对应的节目内容;将所述第一节目内容生成播放指令,并向电视机发送播放指令,以使所述电视机播放所述第一节目内容。从而简化遥控器播放节目内容的过程,进而提高用户体验。
Description
技术领域
本申请涉及电子设备通信的技术领域,具体涉及一种基于语音识别的遥控器控制方法、装置及电子设备。
背景技术
目前,电视机遥控器大部分为按键式遥控器,需要用户通过按下遥控器上设置的各种按键来选取需要播放的节目内容。然而这种操作方式对于用户来说十分不便,从而导致用户体验感较差。
发明内容
为了简化遥控器播放节目内容的过程,从而提高用户体验,本申请提供一种基于语音识别的遥控器控制方法、装置及电子设备。
在本申请的第一方面提供了一种基于语音识别的遥控器控制方法,该方法应用于遥控器,所述方法包括:获取用户的第一语音;将所述第一语音与特征语音表进行匹配,得到第一节目内容,所述特征语音表包括多个语音以及多个语音各对应的节目内容;将所述第一节目内容生成播放指令,并向电视机发送播放指令,以使所述电视机播放第一节目内容。
通过采用上述技术方案,当用户需要播放节目内容时,用户可对着遥控器说出需要播放的内容,遥控器获取用户的第一语音,再将第一语音与预先构建好的特征数据表进行匹配,从而得到第一语音对应的节目内容;在这个过程中,直接通过语音和节目内容之间对应关系实现对节目内容的选取,不再需要用户不断的按下遥控器上的各种按键来播放想要的节目内容,从而提高了用户体验。而且还简化了语音识别的数据以及语音匹配的功能,降低了因错误识别而导致的需要进行重新识别的概率。
可选的,所述获取用户的第一语音,具体为:获取所述第一语音的语音特征;当所述语音特征与所述预设语音特征一致时,获取所述第一语音,所述预设语音特征为所述第一语音对应的用户提前录制的语音特征。
通过采用上述技术方案,遥控器在语音识别的过程中,通过识别用户的语音特征,以此来确定是否调取该用户对应的特征语音表,当用户的语音特征与预设语音特征一致时,获取用户的语音,从而为用户提供个性化的语音识别功能,进而提升了用户的体验感。
可选的,所述将所述第一语音与特征语音表进行匹配,得到第一节目内容,具体为:提取所述第一语音中的关键词;当所述关键词与所述目标关键词相同时,获取所述第一节目内容,所述目标关键词为所述第一节目内容对应的语音中的关键词。
通过采用上述技术方案,将第一语音中的关键词提取出来,从而去除无关信息的干扰,再将关键词与特征语音表中的关键词进行匹配,当匹配到目标关键词时,获取目标关键词对应的节目内容,从而实现语音与节目内容进行匹配的功能。
可选的,将所述第一语音与特征语音表进行匹配,得到第一节目内容之前,所述方法还包括:获取所述用户输入的第二语音以及第二节目内容,所述第二语音的内容包括数字、字母以及文字中的一种或多种;将所述第二语音与所述第二节目内容构建对应关系,进而构建所述特征语音表。
通过采用上述技术方案,在第一语音与特征语音表进行匹配之前,遥控器通过获取用户输入的第二语音和第二节目内容,再将第二语音与第二节目内容构建为对应关系,进而构建出特征语音表,由于第二语音可以为数字、字母以及文字中的一种或多种,因此可将复杂的语音简化为简单的数字、字母以及文字的组合,从而提高语音识别的准确率。
可选的,所述获取用户的第一语音之前,所述方法还包括:获取机顶盒的开机时间,所述开机时间为机顶盒开机时刻到未接收到所述遥控器操作指令时刻的时间间隔;当所述开机时间大于或等于预设开机时间时,确定所述遥控器处于丢失状态,通过所述遥控器的警报器发出警报声。
通过采用上述技术方案,由于遥控器的外形设计较小,当机顶盒开机后,若机顶盒长时间没有收到遥控器发送的播放指令,则确定遥控器处于丢失状态,此时,遥控器上的警报器会发出警报声,从而提醒用户遥控器的位置。
可选的,所述获取用户的第一语音之前,所述方法还包括:接收用户设备发送的查找指令;向所述用户设备发送定位信息,所述定位信息为所述遥控器的定位信息,并通过所述遥控器的警报器发出警报声。
通过采用上述技术方案,当用户已经知道遥控器处于丢失状态时,用户可通过用户设备向遥控器发送查找指令;此时,遥控器向用户设备发送遥控器的定位信息,以显示遥控器目前的位置,并通过遥控器上的报警装置帮助用户了解遥控器的大致方位。
可选的,所述电视机播放第一节目内容之后,所述方法包括:获取所述用户的撤回操作,所述撤回操作为用户在第一预设时间内通过所述遥控器撤回播放第一节目内容的操作;记录所述撤回操作的撤回次数;当在第二预设时间内,所述撤回次数大于或等于预设次数时,提示用户修改所述第一语音与所述第一节目内容的对应关系。
通过采用上述技术方案,当用户通过遥控器的语音识别功能所播放的第一节目内容不是用户想要的节目内容时,通过记录用户在第二预设时间内的撤回次数来确定第一语音识别错误的可能性较高,此时提示用户修改第一语音与第一节目内容的对应关系,从而降低语音识别错误的可能。
可选的,所述方法包括:获取所述遥控器的电量;当所述电量小于或等于预设电量阈值时,通过所述遥控器的报警器发出警报声,以提示所述用户电量不足。
通过采用上述技术方案,当遥控器电量较低时,通过遥控器的报警器发出警报声,及时提醒用户更换电池。
在本申请的第二方面提供了一种基于语音识别的遥控器控制装置,所述装置为遥控器,所述装置包括获取模块、处理模块以及发送模块,其中,所述获取模块,用于获取用户的第一语音;所述处理模块,用于将所述第一语音与特征语音表进行匹配,得到第一节目内容,所述特征语音表包括多个语音以及多个语音各对应的节目内容;所述发送模块,用于将所述第一节目内容生成播放指令,并向电视机发送播放指令,以使所述电视机播放第一节目内容。
在本申请的第三方面提供了一种电子设备,包括处理器、存储器、用户接口及网络接口,所述存储器用于存储指令,所述用户接口和网络接口用于给其他设备通信,所述处理器用于执行所述存储器中存储的指令,以使所述电子设备执行如第一方面中任意一项所述的方法。
综上所述,本申请包括以下至少一种有益技术效果:
1.当用户需要播放节目内容时,用户可对着遥控器说出需要播放的内容,遥控器获取用户的第一语音,再将第一语音与预先构建好的特征数据表进行匹配,从而得到第一语音对应的节目内容;在这个过程中,直接通过语音和节目内容之间对应关系实现对节目内容的选取,不再需要用户不断的按下遥控器上的各种按键来播放想要的节目内容,从而提高了用户体验。而且还简化了语音识别的数据以及语音匹配的功能,降低了因错误识别而导致的需要进行重新识别的概率;
2.遥控器在语音识别的过程中,通过识别用户的语音特征,以此来确定是否调取该用户对应的特征语音表,当用户的语音特征与预设语音特征一致时,获取用户的语音,从而为用户提供个性化的语音识别功能,进而提升了用户的体验感。
附图说明
图1是本申请实施例的一种基于语音识别的遥控器的信号交互图。
图2是本申请实施例的一种基于语音识别的遥控器控制方法的流程示意图。
图3是本申请实施例的另一种基于语音识别的遥控器控制方法的流程示意图。
图4是本申请实施例的另一种基于语音识别的遥控器控制方法的流程示意图。
图5是本申请实施例的一种基于语音识别的遥控器控制装置的模块示意图。
图6是本申请实施例的一种电子设备的结构示意图。
附图标记说明:1、获取模块;2、处理模块;3、发送模块;600、电子设备;601、处理器;602、通信总线;603、用户接口;604、网络接口;605、存储器。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。
在本申请实施例的描述中,“例如”或者“举例来说”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示性的”、“例如”或者“举例来说”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“例如”或者“举例来说”等词旨在以具体方式呈现相关概念。
在本申请实施例的描述中,除非另有说明,术语“多个”的含义是指两个或两个以上。例如,多个***是指两个或两个以上的***,多个屏幕终端是指两个或两个以上的屏幕终端。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
随着科技的发展,许多先进的技术在生活中也得到应用,其中就包括电视机。而遥控器作为电视机的配件之一,是一种用来远控机械的装置,主要是由集成电路电板和用来产生不同讯息的按钮所组成。
目前电视机遥控器大部分为按键式遥控器,需要用户通过按下遥控器上设置的各种按键来选取需要播放的节目内容。然而这种操作方式对于用户来说十分不便,从而导致用户体验感较差。
本申请介绍一种基于语音识别的遥控器的信号交互图,如图1所示,该信号交互图中包括遥控器、用户设备、机顶盒以及显示器。其中,遥控器与用户设备无线连接,遥控器与机顶盒无线连接,机顶盒与显示器有线连接。遥控器为智能家居遥控器,遥控器所控制的设备包括但不限于空调、洗衣机、机顶盒以及冰箱等。用户设备在本申请中以智能手机为例,用户设备上安装有智能家居APP,遥控器与用户设备上的智能家居APP连接后,用户设备可在APP中查看遥控器的控制状态等信息。本申请以该信号交互图为基础进行说明。
本申请提供一种基于语音识别的遥控器控制方法,该方法应用于遥控器,如图2所示,该方法包括步骤S101至步骤S103。
S101、获取用户的第一语音。
具体地,当用户需要播放节目内容时,用户通过按下遥控器上设置的语音识别按钮,对着遥控器说出第一语音。其中,语音识别按钮可以理解为当用户按下该按钮时,遥控器开启语音识别功能。此时,遥控器获取用户的第一语音。
举例来说,当用户想要播放喜剧电影时,用户按下语音识别按钮,并对着遥控器说出“播放喜剧电影”,此时,遥控器获取“播放喜剧电影”。
S102、将第一语音与特征语音表进行匹配,得到第一节目内容,特征语音表包括多个语音以及多个语音各对应的节目内容。
具体地,当获取到第一语音后,遥控器需要根据第一语音得到需要播放的第一节目内容。此时,遥控器将第一语音与特征语音表进行匹配,其中,由于特征语音表包括多个语音以及多个语音各对应的节目内容。经过匹配后,由于特征语音数据表中第一语音对应着第一节目内容,此时生成第一节目内容。
举例来说,当第一语音为“2022年喜剧电影”,特征语音表中的对应关系包括“2020年综艺节目”对应1号节目内容、“2021年喜剧电影”对应2号节目内容以及“2022年喜剧电影”对应3号节目内容。此时,第一语音所对应的项目为3号节目内容。若第一语音为“2022年喜剧电影”,此时在特征语音表中未得到匹配结果,则获取2号节目内容与3号节目内容。
S103、将第一节目内容生成播放指令,并向电视机发送播放指令,以使电视机播放第一节目内容。
具体地,将得到的第一节目内容生成播放指令,向机顶盒发送播放指令,机顶盒调取第一节目内容,并将第一节目内容传输至显示器,以使显示播放第一节目内容。
在一种可能的实施方式中,获取用户的第一语音,具体为:获取第一语音的语音特征;当语音特征与预设语音特征一致时,获取第一语音,预设语音特征为第一语音对应的用户提前录制的语音特征。
具体地,在获取第一用户的第一语音时,遥控器需要识别第一语音的语音特征,从而开启语音识别权限,其中,语音特征包括音调、音色以及响度。当第一语音的语音特征与预设语音特征一致时,此时开启语音识别权限,获取第一用户的第一语音。其中,预设语音特征为用户提前录制的语音特征。若第二用户想要开启语音识别权限,需要预先采集第二用户语音的语音特征,并存入权限设置模块中,其中权限设置模块可存储多个用户的语音特征,在本实施例中,优选为8个。
在本实施例中,特征语音表存储有多个用户的语音特征,每个语音特征对应着一个语音,一个语音对应着一个节目内容;当不同用户说出同一语音时,由于特征语音表不同用户的语音特征各对应的节目内容不同,则遥控器所匹配的节目内容也不同。
举例来说,特征语音表中存储有第一用户的第一语音特征以及第二用户的第二语音特征,此时第一语音特征对应的语音为“播放电影”,“播放电影”对应的节目内容为2021年1月电影;第二语音特征对应的语音为“播放电影”,“播放电影”对应的节目内容为2022年1月电影。当第一用户说出“播放电影”时,则播放2021年1月电影;当第二用户说出“播放电影”,则播放2022年1月电影。
在一种可能的实施方式中,将第一语音与特征语音表进行匹配,得到第一节目内容,具体为:提取第一语音中的关键词;当关键词与目标关键词相同时,获取第一节目内容,目标关键词为第一节目内容对应的语音中的关键词。
具体地,当用户获取第一语音后,遥控器提取第一语音中的关键词,其中,关键词可以为1个,也可以为多个。并将第一语音中的关键词与特征语音表中的关键词进行匹配,从而匹配出目标关键词,根据目标关键词与第一节目内容的对应关系,得到第一节目内容。
举例来说,用户的第一语音为“播放2021年XX频道联欢晚会上的小品”,此时,提取关键词“2021年”,“联欢晚会”,“XX频道”,“小品”。此时,特征语音表中的目标关键词包括“2021年”、“2022年”、“联欢晚会”、 “小品”以及“歌曲”。获取“2021年”、“联欢晚会”、“XX频道”以及“小品”均对应的节目内容,将该节目内容作为第一节目内容。
在一种可能的实施方式中,将第一语音与特征语音表进行匹配,得到第一节目内容之前,该方法还包括:获取用户输入的第二语音以及第二节目内容,第二语音的内容包括数字、字母以及文字中的一种或多种;将第二语音与第二节目内容构建对应关系,进而构建特征语音表。
具体地,由于识别完整的语音内容很容易导致语音识别错误,从而需要重新识别,这个过程导致播放节目内容的过程较为繁琐。因此,用户可通过遥控器输入第二语音以及第二语音对应的节目内容,第二语音可以为数字、字母以及文字中的一种或多种。再将第二语音与第二节目内容构建为对应关系。其中第二语音可以为一个,也可以为多个。
举例来说,当用户想要播放“2021年第一频道联欢晚会上的小品”,此时,用户在进行语音输入后,遥控器需要识别和提取的关键词较多,从而导致错误识别,例如,错误识别可能为“2022年第二频道联欢晚会”。此时,用户可直接输入语音“小品2021”,再输入节目内容“2021年第一频道联欢晚会上的小品”,将语音“小品2021”与节目内容“2021年第一频道联欢晚会上的小品”构建为对应关系。当用户下一次想要播放“2021年第一频道联欢晚会上的小品”时,可通过遥控器的语音的语音识别功能输入“小品2021”,遥控器直接调取“小品2021”对应的节目内容。简化了语音识别的数据以及语音匹配的功能,降低了因错误识别而导致的需要进行重新识别的概率。并且结合关键词提取,进一步降低语音识别错误的概率。
在一种可能的实施方式中,由于遥控器的设计外形较小,很容易掉落在某个角落出现丢失的情况,为了寻找遥控器,如图3所示,获取用户的第一语音之前,该方法还包括步骤S201至步骤S202。
S201、获取机顶盒的开机时间,开机时间为机顶盒开机时刻到未接收到遥控器操作指令时刻的时间间隔。
具体地,当用户开启机顶盒后,记录机顶盒的开机时间,开机时间可以理解为机顶盒开机时刻到未接收到遥控器操作指令时刻的时间间隔。例如机顶盒的开机时刻为0秒,在30s后任然未接收到遥控器的操作指令,则开机时间为30s。
S202、当开机时间大于或等于预设开机时间时,确定遥控器处于丢失状态,通过遥控器的警报器发出警报声。
具体地,机顶盒开机后,由于用户此时并不知道遥控器处于丢失状态,因此当开机时间大于或等于预设开机时间时,遥控器自动确认遥控器为丢失状态;通过遥控器的警报器发出警报声,以提示用户遥控器的大致方位。例如,预设开机时间为30s,当开机时间到达30s时,遥控器确认处于丢失状态,遥控器发出“滴”的警报声。
在一种可能的实施方式中,为了寻找遥控器,获取用户的第一语音之前,该方法还包括:接收用户设备发送的查找指令;向用户设备发送定位信息,定位信息为遥控器的定位信息,并通过遥控器的警报器发出警报声。
具体地,当用户已经知道遥控器处于丢失状态,但用户任然未能通过遥控器的报警提示找到遥控器,用户可登录用户设备上的智能家居APP,在智能家居APP中选择寻找遥控器的功能选项;此时用户设备向遥控器发送查找指令,遥控器接收查找指令后,向用户发送遥控器的定位信息。用户设备上显示遥控器的标红点位以及用户设备的标红电位,用户可参考用户设备上显示的定位信息找寻找遥控器,并且遥控器的报警器发出“滴”的报警声,以帮助用户快速寻找遥控器。
在本实施例中,用户还可按下机顶盒上设置的遥控器寻找按钮。此时,机顶盒向遥控器发送丢失指令,遥控器接收丢失指令后,通过警报器发出“滴”的警报声。
在一种可能的实施方式中,由于预先构建特征语音表仍然语音识别不准确的情况,为了减少这种情况,如图4所示,电视机播放第一节目内容之后,该方法还包括步骤S301至步骤S303。
S301、获取用户的撤回操作,撤回操作为用户在第一预设时间内通过遥控器撤回播放第一节目内容的操作。
S302、记录撤回操作的撤回次数。
S303、当在第二预设时间内,撤回次数大于或等于预设次数时,提示用户修改第一语音与第一节目内容的对应关系。
具体地,当用户通过遥控器的语音识别功能所播放的第一节目内容不是用户所需要的节目内容时,若用户在第一预设时间内通过撤回操作撤回第一节目内容,则记录1次撤回次数。其中,撤回操作可以理解为用户通过遥控器的撤回按钮向机顶盒发送撤回指令,当机顶盒接收到撤回指令后,中止对第一节目内容的播放并返回主界面。第一预设时间可以理解为用户在发现所播放的第一节目内容不是所需要播放的节目内容时,显示器播放开始播放第一节目内容的时刻到获取到撤回指令的时间间隔。当用户在第二预设时间内,撤回次数大于或等于预设撤回次数时,确定第一语音识别错误率较高,提示用户修改第一语音与第一节目内容的对应关系。
举例来说,当用户的第一语音为“播放2021年电影XX”,第一语音对应的节目内容为“2021年1月动作电影XX”,第一预设时间为30s,第二预设时间为1个月,预设撤回次数为10次。此时显示器播放的节目内容为“2021年小品XX”,若用户在30s内通过遥控器撤回“2021年小品XX”的播放,遥控器记录1次撤回次数;当在1个月内,撤回次数达到10次时,确定第一语音识别错误率较高,提示用户修改第一语音与第一节目内容的对应关系。修改方式具体为:删除第一语音与第一节目内容的对应关系,重新输入第一语音“播放电影1”,以及重新输入第一语音对应的节目内容“2021年1月动作电影XX”,遥控器构建新的第一语音与第一节目内容的对应关系。当用户需要播放“2021年1月动作电影XX”时,用户可直接通过遥控器的语音识别功能输入“播放电影1”,此时遥控器得到“播放电影1”对应的节目内容“2021年1月动作电影XX”。
在一种可能的实施方式中,获取遥控器的电量;当电量小于或等于预设电量阈值时,通过遥控器的报警器发出警报声,以提示用户电量不足。
具体地,当遥控器电量较低时,为了不影响遥控器的正常使用,当遥控器电量小于或等于预设电量阈值时,遥控器的报警器发出“滴”的报警声,提示用户电量不足需更换电池,其中,预设电量阈值优选为20%。
本申请还提供一种基于语音识别的遥控器控制装置,该装置为遥控器,如图5所示,该装置包括获取模块1、处理模块2以及发送模块3,其中,
获取模块1,用于获取用户的第一语音;
处理模块2,用于将第一语音与特征语音表进行匹配,得到第一节目内容,特征语音表包括多个语音以及多个语音各对应的节目内容;
发送模块3,用于将第一节目内容生成播放指令,并向电视机发送播放指令,以使电视机播放第一节目内容。
当用户需要播放节目内容时,用户可对着遥控器说出需要播放的内容,遥控器获取用户的第一语音,再将第一语音与预先构建好的特征数据表进行匹配,从而得到第一语音对应的节目内容;在这个过程中,直接通过语音和节目内容之间对应关系实现对节目内容的选取,不再需要用户不断的按下遥控器上的各种按键来播放想要的节目内容,从而提高了用户体验。而且还简化了语音识别的数据以及语音匹配的功能,降低了因错误识别而导致的需要进行重新识别的概率。
在一种可能的实施方式中,获取用户的第一语音,具体为:获取第一语音的语音特征;当语音特征与预设语音特征一致时,获取第一语音,预设语音特征为第一语音对应的用户提前录制的语音特征。
在一种可能的实施方式中,将第一语音与特征语音表进行匹配,得到第一节目内容,具体为:提取第一语音中的关键词;当关键词与目标关键词相同时,获取第一节目内容,目标关键词为第一节目内容对应的语音中的关键词。
在一种可能的实施方式中,将第一语音与特征语音表进行匹配,得到第一节目内容之前,还包括:获取用户输入的第二语音以及第二节目内容,第二语音的内容包括数字、字母以及文字中的一种或多种;将第二语音与第二节目内容构建对应关系,进而构建特征语音表。
在一种可能的实施方式中,获取用户的第一语音之前,还包括:获取机顶盒的开机时间,开机时间为机顶盒开机时刻到未接收到遥控器操作指令时刻的时间间隔;当开机时间大于或等于预设开机时间时,确定遥控器处于丢失状态,通过遥控器的警报器发出警报声。
在一种可能的实施方式中,获取用户的第一语音之前,还包括:接收用户设备发送的查找指令;向用户设备发送定位信息,定位信息为遥控器的定位信息,并通过遥控器的警报器发出警报声。
在一种可能的实施方式中,电视机播放第一节目内容之后,包括:获取用户的撤回操作,撤回操作为用户在第一预设时间内通过遥控器撤回播放第一节目内容的操作;记录撤回操作的撤回次数;当在第二预设时间内,撤回次数大于或等于预设次数时,提示用户修改第一语音与第一节目内容的对应关系。
在一种可能的实施方式中,获取遥控器的电量;当电量小于或等于预设电量阈值时,通过遥控器的报警器发出警报声,以提示用户电量不足。
本申请还提供一种电子设备。如图6所示,电子设备600可以包括:至少一个处理器601,至少一个网络接口604,用户接口603,存储器605,至少一个通信总线602。
其中,通信总线602用于实现这些组件之间的连接通信。
其中,用户接口603可以包括显示屏(Display)、摄像头(Camera),可选用户接口603还可以包括标准的有线接口、无线接口。
其中,网络接口604可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,处理器601可以包括一个或者多个处理核心。处理器601利用各种接口和线路连接整个服务器内的各个部分,通过运行或执行存储在存储器605内的指令、程序、代码集或指令集,以及调用存储在存储器605内的数据,执行服务器的各种功能和处理数据。可选的,处理器601可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器601可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作***、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器601中,单独通过一块芯片进行实现。
其中,存储器605可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选的,该存储器605包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器605可用于存储指令、程序、代码、代码集或指令集。存储器605可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作***的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及的数据等。存储器605可选的还可以是至少一个位于远离前述处理器601的存储装置。如图6所示,作为一种计算机存储介质的存储器605中可以包括操作***、网络通信模块、用户接口模块以及一种地质灾害宏观巡查方法的应用程序。
在图6所示的电子设备600中,用户接口603主要用于为用户提供输入的接口,获取用户输入的数据;而处理器601可以用于调用存储器605中存储一种地质灾害宏观巡查方法的应用程序,当由一个或多个处理器601执行时,使得电子设备600执行如上述实施例中一个或多个所述的方法。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必需的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所披露的装置,可通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些服务接口,装置或单元的间接耦合或通信连接,可以是电性或其他的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述者,仅为本公开的示例性实施例,不能以此限定本公开的范围。即但凡依本公开教导所作的等效变化与修饰,皆仍属本公开涵盖的范围内。本领域技术人员在考虑说明书及实践真理的公开后,将容易想到本公开的其他实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未记载的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的范围和精神由权利要求限定。
Claims (10)
1.一种基于语音识别的遥控器控制方法,其特征在于,应用于遥控器,所述方法包括:
获取用户的第一语音;
将所述第一语音与特征语音表进行匹配,得到第一节目内容,所述特征语音表包括多个语音以及多个语音各对应的节目内容;
将所述第一节目内容生成播放指令,并向电视机发送播放指令,以使所述电视机播放所述第一节目内容。
2.根据权利要求1所述的方法,其特征在于,所述获取用户的第一语音,具体为:
获取所述第一语音的语音特征;
当所述语音特征与所述预设语音特征一致时,获取所述第一语音,所述预设语音特征为所述第一语音对应的用户提前录制的语音特征。
3.根据权利要求1所述的方法,其特征在于,所述将所述第一语音与特征语音表进行匹配,得到第一节目内容,具体为:
提取所述第一语音中的关键词;
当所述关键词与所述目标关键词相同时,获取所述第一节目内容,所述目标关键词为所述第一节目内容对应的语音中的关键词。
4.根据权利要求1所述的方法,其特征在于,将所述第一语音与特征语音表进行匹配,得到第一节目内容之前,所述方法还包括:
获取所述用户输入的第二语音以及第二节目内容,所述第二语音的内容包括数字、字母以及文字中的一种或多种;
将所述第二语音与所述第二节目内容构建对应关系,进而构建所述特征语音表。
5.根据权利要求1所述的方法,其特征在于,所述获取用户的第一语音之前,所述方法还包括:
获取机顶盒的开机时间,所述开机时间为机顶盒开机时刻到未接收到所述遥控器操作指令时刻的时间间隔;
当所述开机时间大于或等于预设开机时间时,确定所述遥控器处于丢失状态,通过所述遥控器的警报器发出警报声。
6.根据权利要求1所述的方法,其特征在于,所述获取用户的第一语音之前,所述方法还包括:
接收用户设备发送的查找指令;
向所述用户设备发送定位信息,所述定位信息为所述遥控器的定位信息,并通过所述遥控器的警报器发出警报声。
7.根据权利要求1所述的方法,其特征在于,所述电视机播放所述第一节目内容之后,所述方法包括:
获取所述用户的撤回操作,所述撤回操作为用户在第一预设时间内通过所述遥控器撤回播放第一节目内容的操作;
记录所述撤回操作的撤回次数;
当在第二预设时间内,所述撤回次数大于或等于预设次数时,提示用户修改所述第一语音与所述第一节目内容的对应关系。
8.根据权利要求1所述的方法,其特征在于,所述方法包括:
获取所述遥控器的电量;
当所述电量小于或等于预设电量阈值时,通过所述遥控器的报警器发出警报声,以提示所述用户电量不足。
9.一种基于语音识别的遥控器控制装置,其特征在于,所述装置为遥控器,所述装置包括获取模块(1)、处理模块(2)以及发送模块(3),其中,
所述获取模块(1),用于获取用户的第一语音;
所述处理模块(2),用于将所述第一语音与特征语音表进行匹配,得到第一节目内容,所述特征语音表包括多个语音以及多个语音各对应的节目内容;
所述发送模块(3),用于将所述第一节目内容生成播放指令,并向电视机发送播放指令,以使所述电视机播放第一节目内容。
10.一种电子设备,其特征在于,包括处理器(601)、存储器(605)、用户接口(603)及网络接口(604),所述存储器(605)用于存储指令,所述用户接口(603)和网络接口(604)用于给其他设备通信,所述处理器(601)用于执行所述存储器(605)中存储的指令,以使所述电子设备(600)执行如权利要求1至8任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211734677.9A CN116095377A (zh) | 2022-12-30 | 2022-12-30 | 一种基于语音识别的遥控器控制方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211734677.9A CN116095377A (zh) | 2022-12-30 | 2022-12-30 | 一种基于语音识别的遥控器控制方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116095377A true CN116095377A (zh) | 2023-05-09 |
Family
ID=86200370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211734677.9A Pending CN116095377A (zh) | 2022-12-30 | 2022-12-30 | 一种基于语音识别的遥控器控制方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116095377A (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000122678A (ja) * | 1998-10-14 | 2000-04-28 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識機器制御装置 |
KR20000017560U (ko) * | 1999-02-27 | 2000-09-25 | 전주범 | 다기능 리모컨의 경고음 발생장치 |
CN2681491Y (zh) * | 2003-01-22 | 2005-02-23 | 程松林 | 电视语音点播器 |
US20070244705A1 (en) * | 2006-04-17 | 2007-10-18 | Funai Electric Co., Ltd. | Electronic instrument |
CN102075797A (zh) * | 2010-12-29 | 2011-05-25 | 深圳市同洲电子股份有限公司 | 一种语音浏览频道或节目的方法及数字电视接收终端 |
KR20150057371A (ko) * | 2013-11-19 | 2015-05-28 | 이재수 | 리모컨 분실 방지 시스템 및 그 제어방법 |
CN107748500A (zh) * | 2017-10-10 | 2018-03-02 | 三星电子(中国)研发中心 | 用于控制智能设备的方法和装置 |
CN107958668A (zh) * | 2017-12-15 | 2018-04-24 | 中广热点云科技有限公司 | 智能电视的声控选播方法、声控选播*** |
CN111787380A (zh) * | 2020-07-06 | 2020-10-16 | 四川长虹网络科技有限责任公司 | 语音换台控制方法、装置和手持智能终端 |
CN112230877A (zh) * | 2020-10-16 | 2021-01-15 | 惠州Tcl移动通信有限公司 | 一种语音操作方法、装置、存储介质及电子设备 |
CN112752125A (zh) * | 2019-10-29 | 2021-05-04 | 深圳市茁壮网络股份有限公司 | 语音播放方法、智能播放终端、遥控器及*** |
KR20220000244U (ko) * | 2020-07-20 | 2022-01-27 | 이준석 | 블루투스와 음성인식기능을 이용한 위치 알람 리모컨 |
CN114582321A (zh) * | 2020-12-01 | 2022-06-03 | 中国联合网络通信集团有限公司 | 语音识别准确率提高方法、***、电子设备和存储介质 |
CN115294966A (zh) * | 2022-08-05 | 2022-11-04 | 中国核电工程有限公司 | 核电厂语音识别训练方法、智能语音控制方法和*** |
-
2022
- 2022-12-30 CN CN202211734677.9A patent/CN116095377A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000122678A (ja) * | 1998-10-14 | 2000-04-28 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識機器制御装置 |
KR20000017560U (ko) * | 1999-02-27 | 2000-09-25 | 전주범 | 다기능 리모컨의 경고음 발생장치 |
CN2681491Y (zh) * | 2003-01-22 | 2005-02-23 | 程松林 | 电视语音点播器 |
US20070244705A1 (en) * | 2006-04-17 | 2007-10-18 | Funai Electric Co., Ltd. | Electronic instrument |
CN102075797A (zh) * | 2010-12-29 | 2011-05-25 | 深圳市同洲电子股份有限公司 | 一种语音浏览频道或节目的方法及数字电视接收终端 |
KR20150057371A (ko) * | 2013-11-19 | 2015-05-28 | 이재수 | 리모컨 분실 방지 시스템 및 그 제어방법 |
CN107748500A (zh) * | 2017-10-10 | 2018-03-02 | 三星电子(中国)研发中心 | 用于控制智能设备的方法和装置 |
CN107958668A (zh) * | 2017-12-15 | 2018-04-24 | 中广热点云科技有限公司 | 智能电视的声控选播方法、声控选播*** |
CN112752125A (zh) * | 2019-10-29 | 2021-05-04 | 深圳市茁壮网络股份有限公司 | 语音播放方法、智能播放终端、遥控器及*** |
CN111787380A (zh) * | 2020-07-06 | 2020-10-16 | 四川长虹网络科技有限责任公司 | 语音换台控制方法、装置和手持智能终端 |
KR20220000244U (ko) * | 2020-07-20 | 2022-01-27 | 이준석 | 블루투스와 음성인식기능을 이용한 위치 알람 리모컨 |
CN112230877A (zh) * | 2020-10-16 | 2021-01-15 | 惠州Tcl移动通信有限公司 | 一种语音操作方法、装置、存储介质及电子设备 |
CN114582321A (zh) * | 2020-12-01 | 2022-06-03 | 中国联合网络通信集团有限公司 | 语音识别准确率提高方法、***、电子设备和存储介质 |
CN115294966A (zh) * | 2022-08-05 | 2022-11-04 | 中国核电工程有限公司 | 核电厂语音识别训练方法、智能语音控制方法和*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2674941B1 (en) | Terminal apparatus and control method thereof | |
CN110312169B (zh) | 视频数据处理方法、电子设备及存储介质 | |
EP3680896B1 (en) | Method for controlling terminal by voice, terminal, server and storage medium | |
US11157959B2 (en) | Multimedia information processing method, apparatus and system, and computer storage medium | |
CN107864410B (zh) | 一种多媒体数据处理方法、装置、电子设备以及存储介质 | |
JPWO2014199596A1 (ja) | 話者識別方法、話者識別装置及び話者識別システム | |
CN103558916A (zh) | 人机交互***、方法及其装置 | |
KR20140055502A (ko) | 방송 수신 장치, 서버 및 그 제어 방법 | |
WO2014161282A1 (zh) | 视频文件播放进度的调整方法及装置 | |
KR102210933B1 (ko) | 음성 신호에 따라 컨텐츠 정보를 검색하여 제공하는 디스플레이 장치, 서버 장치 및 이들을 포함하는 음성 입력 시스템과, 그 방법들 | |
CN111475020A (zh) | 一种信息的交互方法、交互装置、电子设备及存储介质 | |
CN111429917B (zh) | 一种设备唤醒方法及终端设备 | |
EP2747464A1 (en) | Sent message playing method, system and related device | |
CN111462744A (zh) | 一种语音交互方法、装置、电子设备及存储介质 | |
CN111294606A (zh) | 直播处理方法、装置、直播客户端及介质 | |
CN111263204A (zh) | 用于多媒体播放设备的控制方法、装置及计算机存储介质 | |
CN107809654A (zh) | 电视机***及电视机控制方法 | |
CN109275005A (zh) | 一种组合按键遥控方法、装置、设备和存储介质 | |
CN110418181B (zh) | 对智能电视的业务处理方法、装置、智能设备及存储介质 | |
KR102440341B1 (ko) | 비디오 처리 방법, 장치, 단말기와 저장 매체 | |
US20140129228A1 (en) | Method, System, and Relevant Devices for Playing Sent Message | |
CN107948854B (zh) | 一种操作音频生成方法、装置、终端及计算机可读介质 | |
CN115150501A (zh) | 一种语音交互方法及电子设备 | |
JP6151112B2 (ja) | 再生装置、再生装置の制御方法、サーバ、および、システム | |
CN112349287A (zh) | 显示设备及其控制方法、从设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |