CN112489413B - 遥控器的控制方法及***、存储介质、电子设备 - Google Patents
遥控器的控制方法及***、存储介质、电子设备 Download PDFInfo
- Publication number
- CN112489413B CN112489413B CN202011359772.6A CN202011359772A CN112489413B CN 112489413 B CN112489413 B CN 112489413B CN 202011359772 A CN202011359772 A CN 202011359772A CN 112489413 B CN112489413 B CN 112489413B
- Authority
- CN
- China
- Prior art keywords
- audio
- infrared detection
- detection system
- remote controller
- gesture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 85
- 238000001514 detection method Methods 0.000 claims abstract description 205
- 230000006870 function Effects 0.000 claims description 21
- 238000009434 installation Methods 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 9
- 238000012163 sequencing technique Methods 0.000 claims description 8
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 6
- 230000009191 jumping Effects 0.000 description 6
- 239000002699 waste material Substances 0.000 description 4
- 230000003213 activating effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000003999 initiator Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000004622 sleep time Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C23/00—Non-electrical signal transmission systems, e.g. optical systems
- G08C23/04—Non-electrical signal transmission systems, e.g. optical systems using light waves, e.g. infrared
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
- G10L15/142—Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C2201/00—Transmission systems of control signals via wireless link
- G08C2201/30—User interface
- G08C2201/31—Voice input
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C2201/00—Transmission systems of control signals via wireless link
- G08C2201/30—User interface
- G08C2201/32—Remote control based on movements, attitude of remote control device
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Probability & Statistics with Applications (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Selective Calling Equipment (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本公开是关于一种遥控器的控制方法及***、存储介质、电子设备,涉及物联网技术领域,该方法包括:接收多个红外检测***分别发送的待识别音频,并基于预设的音频识别模型对各待识别音频进行识别得到音频识别结果;在确定音频识别结果是与控制遥控器关联的有效指令时,根据各待识别音频的音频响度,在各红外检测***中确定待工作的红外检测***;生成与待工作的红外检测***对应的驱动指令,并将驱动指令发送至待工作的红外检测***,以使得待工作的红外检测***处于工作状态;获取根据处于工作状态的待工作的红外检测***检测到的手势信息确定的控制指令,控制遥控器执行与控制指令相应的功能。本公开提高了用户信息的安全性。
Description
技术领域
本公开涉及物联网技术领域,具体而言,涉及一种遥控器的控制方法、遥控器的控制***、计算机非瞬态可读存储介质以及电子设备。
背景技术
目前市面上常用的控制家用电器的方法可以包括红外遥控控制以及智能硬件类控制等。但是,这些控制方法都需要外部控制器才能对电器进行控制,在缺乏遥控器或者其他不便于对遥控器进行操作时,对电器的控制就显得极为不便。
为了解决该技术问题,现有技术采用了语音遥控器以及手势控制器两种方法。其中,语音遥控器可以通过接收用户的语音信息,然后对语音进行识别进而根据识别结果对遥控器进行控制;手势控制器可以通过其上设置的摄像头对用户的手势进行图像采集,进而根据所采集到的图像生成控制指令对遥控器进行控制。
但是,上述方法存在如下缺陷:一方面,由于语音遥控器在控制设备时需要对语音信息进行语义理解以及语义解析,但是遥控器本身又缺乏语义理解以及语义解析的功能,需要将接收到的语音信息上传至服务器,进而根据服务器发送的解析结果对遥控器进行控制;因此,在缺乏有效网络的情况下,无法实现对语音信息的识别;另一方面,由于手势控制器在采集用户手势的过程中,同时还会采集到用户的个人信息,进而使得用户的个人信息的安全性较低。
因此,需要提供一种新的遥控器的控制方法及***。
需要说明的是,在上述背景技术部分发明的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明的目的在于提供一种遥控器的控制方法、遥控器的控制***、计算机可读非瞬态存储介质以及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的用户信息的安全性较低的问题。
根据本公开的一个方面,提供一种遥控器的控制方法,包括:
接收多个红外检测***分别发送的待识别音频,并基于预设的音频识别模型对各所述待识别音频进行识别得到音频识别结果;
在确定所述音频识别结果是与控制所述遥控器关联的有效指令时,根据各所述待识别音频的音频响度,在各所述红外检测***中确定待工作的红外检测***;
生成与所述待工作的红外检测***对应的驱动指令,并将所述驱动指令发送至所述待工作的红外检测***,以使得所述待工作的红外检测***处于工作状态;
获取根据处于工作状态的所述待工作的红外检测***检测到的手势信息确定的控制指令,控制所述遥控器执行与所述控制指令相应的功能。
在本公开的一种示例性实施例中,所述遥控器具有多个子遥控器,每个所述子遥控器控制的设备不同;
其中,在对各所述待识别音频进行识别得到音频识别结果之后,所述控制方法还包括:
根据遥控器匹配规则,判断所述音频识别结果是否为与控制所述遥控器中的任一子遥控器关联的有效指令;
其中,所述遥控器匹配规则是根据所述遥控器参数确定的。
在本公开的一种示例性实施例中,根据各所述待识别音频的音频响度,在各所述红外检测***中确定待工作的红外检测***,包括:
检测各所述待识别音频中包括的音频分贝的大小,并根据各所述音频分贝的大小对各所述待识别音频进行排序;
根据排序结果确定音频分贝最大的待识别音频,并将音频分贝最大的待识别音频所在的红外检测***确定为待工作的红外检测***。
在本公开的一种示例性实施例中,获取根据处于工作状态的所述待工作的红外检测***检测到的手势信息确定的控制指令,包括:
接收处于工作状态的所述待工作的红外检测***发送的根据所述待工作的红外检测***检测到的手势图像生成的手势信息;
在确定所述手势信息中包括手势形状时,根据手势匹配规则,判断所述手势信息是否为有效手势;其中,所述手势匹配规则是根据所述遥控器所能执行的功能生成的;
在确定所述手势信息为有效手势时,获取与所述手势信息对应的控制指令。
在本公开的一种示例性实施例中,所述控制方法还包括:
在确定所述手势信息中不包括手势形状时,根据所述排序结果确定与所述音频分贝最大的待识别音频相邻的下一个待识别音频;
将与所述下一个待识别音频对应的红外检测***,确定为所述待工作的红外检测***;
生成与所述待工作的红外检测***对应的驱动指令,并将所述驱动指令发送至待工作的红外检测***,以使得所述待工作的红外检测***处于工作状态。
在本公开的一种示例性实施例中,基于预设的音频识别模型对所述待识别音频进行识别得到音频识别结果,包括:
利用预设的音频识别模型对各所述待识别音频进行识别,得到音频识别结果;其中,所述预设的语音识别模型包括深度神经网络、卷积神经网络、长短期记忆网络以及隐马尔科夫模型中的一种或多种。
在本公开的一种示例性实施例中,所述控制方法还包括:
根据所述遥控器所处的当前空间的空间大小以及各所述红外检测***的属性信息,计算所述当前空间所需配置的红外检测***的数量。
在本公开的一种示例性实施例中,所述控制方法还包括:
根据所述空间大小以及所述属性信息计算各所述红外检测***的工作区间,并根据所述工作区间计算各所述红外检测***的待安装位置。
在本公开的一种示例性实施例中,控制方法还包括:
根据所述当前空间以及所述工作区间计算各所述红外检测***的工作盲区;
根据所述工作盲区对所述待安装位置进行调整,得到目标安装位置。
根据本公开的一个方面,提供一种遥控器的控制***,包括:
多个红外检测***以及处理器和存储器,各所述红外检测***分别与所述处理器和所述存储器通信连接;
每个所述红外检测***包括控制器、音频接收装置以及红外传感器,所述音频接收装置以及红外传感器与所述控制器通信连接;
所述控制器用于控制所述音频接收装置以及红外传感器处于工作状态,以及将所述音频接收装置接收到的待识别音频发送至所述处理器;
所述音频接收装置用于接收所述待识别音频,所述红外传感器用于接收手势信息;
所述存储器上存储有计算机指令,所述处理器用于执行所述计算机指令以实现如上述任意一项所述的遥控器的控制方法。
在本公开的一种示例性实施例中,所述处理器还存储有应用程序,所述应用程序被所述处理器执行以实现为各所述红外检测***配置***编码,以及通过所述应用程序添加所述遥控器的参数信息并存储到所述存储器中。
在本公开的一种示例性实施例中,所述红外检测***以及所述处理器和存储器通过局域网进行通信。
根据本公开的一个方面,提供一种计算机非瞬态可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的遥控器的控制方法。
根据本公开的一个方面,提供一种电子设备,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的遥控器的控制方法。
根据本公开的一个方面,提供一种电子设备,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的遥控器的控制方法。
本公开提供的一种遥控器的控制方法,一方面,通过接收多个红外检测***分别发送的待识别音频,并基于预设的音频识别模型对各待识别音频进行识别得到音频识别结果;然后在确定音频识别结果是与控制遥控器关联的有效指令时,根据各待识别音频的音频响度,在各红外检测***中确定待工作的红外检测***;再生成与待工作的红外检测***对应的驱动指令,并将驱动指令发送至待工作的红外检测***,以使得待工作的红外检测***处于工作状态;最后获取根据处于工作状态的待工作的红外检测***检测到的手势信息确定的控制指令,控制遥控器执行与控制指令相应的功能,由于可以直接基于音频识别模型对待识别音频进行识别得到音频识别结果,进而避免了在缺乏有效网络的情况下,无法实现对语音信息进行识别的问题;另一方面,由于手势信息是通过红外检测***进行检测的,并不需要通过摄像头对手势信息进行采集,进而可以避免现有技术中由于手势控制器在采集用户手势的过程中,同时还会采集到用户的个人信息,进而使得用户的个人信息的安全性较低的的问题;再一方面,通过根据各待识别音频的音频响度,在各红外检测***中确定待工作的红外检测***,进而可以确定出与待识别音频的发起者距离最近的红外检测***,因此可以提高所获取到的手势信息的准确度;进一步的,通过根据各待识别音频的音频响度,在各红外检测***中确定待工作的红外检测***;再生成与待工作的红外检测***对应的驱动指令,并将驱动指令发送至待工作的红外检测***,以使得待工作的红外检测***处于工作状态,进而可以避免由于红外检测***长期处于工作状态进而导致的资源浪费的问题,同时还可以避免由于多个红外检测***同时对手势信息进行检测进而导致控制指令混乱的问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性示出根据本发明示例实施例的一种遥控器的控制方法的流程图。
图2示意性示出根据本发明示例实施例的一种遥控器的控制***的框图。
图3示意性示出根据本发明示例实施例的另一种遥控器的控制***的框图。
图4示意性示出根据本发明示例实施例的一种对遥控器进行配置的方法流程图。
图5示意性示出根据本发明示例实施例的一种遥控器的控制方法的应用场景示例图。
图6示意性示出根据本发明示例实施例的一种获取根据所述待工作的红外传感器检测到的手势信息确定的控制指令的方法流程图。
图7示意性示出根据本发明示例实施例的另一种遥控器的控制方法的应用场景示例图。
图8示意性示出根据本发明示例实施例的另一种遥控器的控制方法的应用场景示例图。
图9示意性示出根据本发明示例实施例的另一种遥控器的控制方法的流程图。
图10示意性示出根据本发明示例实施例的一种遥控器的控制装置的框图。
图11示意性示出根据本发明示例实施例的一种用于实现上述遥控器的控制方法的电子设备。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本发明的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本发明的各方面变得模糊。
此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
本示例实施方式中首先提供了一种遥控器的控制方法,可以运行在片上***(System on Chip,SoC),该片上***可设置在智能电子设备、服务器、服务器集群或云服务器等;当然,本领域技术人员也可以根据需求在其他平台运行本发明的方法,本示例性实施例中对此不做特殊限定。参考图1所示,该遥控器的控制方法可以包括以下步骤:
步骤S110.接收多个红外检测***分别发送的待识别音频,并基于预设的音频识别模型对各所述待识别音频进行识别得到音频识别结果;
步骤S120.在确定所述音频识别结果是与控制所述遥控器关联的有效指令时,根据各所述待识别音频的音频响度,在各所述红外检测***中确定待工作的红外检测***;
步骤S130.生成与所述待工作的红外检测***对应的驱动指令,并将所述驱动指令发送至所述待工作的红外检测***,以使得所述待工作的红外检测***处于工作状态;
步骤S140.获取根据处于工作状态的所述待工作的红外检测***检测到的手势信息确定的控制指令,控制所述遥控器执行与所述控制指令相应的功能。
上述遥控器的控制方法中,一方面,通过接收多个红外检测***分别发送的待识别音频,并基于预设的音频识别模型对各待识别音频进行识别得到音频识别结果;然后在确定音频识别结果是与控制遥控器关联的有效指令时,根据各待识别音频的音频响度,在各红外检测***中确定待工作的红外检测***;再生成与待工作的红外检测***对应的驱动指令,并将驱动指令发送至待工作的红外检测***,以使得待工作的红外检测***处于工作状态;最后获取根据处于工作状态的待工作的红外检测***检测到的手势信息确定的控制指令,控制遥控器执行与控制指令相应的功能,由于可以直接基于音频识别模型对待识别音频进行识别得到音频识别结果,进而避免了在缺乏有效网络的情况下,无法实现对语音信息进行识别的问题;另一方面,由于手势信息是通过红外检测***进行检测的,并不需要通过摄像头对手势信息进行采集,进而可以避免现有技术中由于手势控制器在采集用户手势的过程中,同时还会采集到用户的个人信息,进而使得用户的个人信息的安全性较低的的问题;再一方面,通过根据各待识别音频的音频响度,在各红外检测***中确定待工作的红外检测***,进而可以确定出与待识别音频的发起者距离最近的红外检测***,因此可以提高所获取到的手势信息的准确度;进一步的,通过根据各待识别音频的音频响度,在各红外检测***中确定待工作的红外检测***;再生成与待工作的红外检测***对应的驱动指令,并将驱动指令发送至待工作的红外检测***,以使得待工作的红外检测***处于工作状态,进而可以避免由于红外检测***长期处于工作状态进而导致的资源浪费的问题,同时还可以避免由于多个红外检测***同时对手势信息进行检测进而导致控制指令混乱的问题。
以下,将结合附图对本发明所记载的遥控器的控制方法进行详细的解释以及说明。
首先,对本公开的发明目的进行解释以及说明。具体的,本发明公开一种基于光感原理的多功能手势控制的遥控器***,由于现有阶段智能遥控器控制***基于摄像头检测原理,无法满足智能家居用户提出的无摄像头隐私保护要求;因此,本发明通过预先制定对应设备遥控器与相应手势对应的功能,然后通过检测手势投影形成的光影图片,进而对相应的设备进行遥控器操作;有效的实现了一个遥控器更灵活的多设备控制与家庭隐私保护功能,还可以解决因为类似用手正在食用东西中途使用遥控器导致的不卫生问题。
其次,结合图2对本公开所提供的遥控器控制***进行解释以及说明。参考图2所示,该遥控器控制***可以包括红外检测***210以及处理器220、存储器230,红外检测***210与处理器220以及存储器230通信连接,具体的可以通过局域网的方式进行通信,例如,可以通过WIFI以及蓝牙等进行通信。
进一步的,参考图3所示,在每一个遥控器所处的当前空间中,可以包括一个或者多个红外检测***210,每一个红外检测***210可以包括控制器(Microcontroller Unit,MCU)301、音频接收装置302以及红外传感器303,其中,音频接收装置以及红外传感器与控制器通信连接;红外检测***通过控制器与处理器通信连接;同时,控制器可以用于控制音频接收装置以及红外传感器处于工作状态,以及将音频接收装置接收到的待识别音频发送至处理器;音频接收装置用于接收待识别音频,红外传感器用于接收手势信息。
具体的,继续参考图3所示,当红外检测***210上电以后,控制器301驱动音频接收装置处于低能耗状态,并驱动红外接收装置处于休眠状态;当音频接收装置接收到待识别音频(用户的语音信息)时,可以将该待识别音频发送至片上***,以便于片上***执行后续的流程;进一步的,当控制器接收到驱动指令时,再驱动红外传感器处于工作状态,以使得红外传感器可以接收用户的手势信息。其中,该音频接收装置可以为单麦克风或者麦克风阵列也可以是其他可以用于接收语音信息的设备,例如录音机等等,本示例对此不做特殊限制。
进一步的,上述存储器上存储有计算机指令,上述处理器用于执行计算机指令以实现本公开所记载的遥控器的控制方法,该存储器以及处理器可以集成在片上***(SoC)中;同时,参考图3所示,处理器中还存储有应用程序(App,Application)304,该应用程序被处理器执行以实现为各所述红外检测***配置***编码,以及通过应用程序添加遥控器的参数信息并存储到存储器中。
举例来说,由于红外检测***的工作范围有限,因此,在遥控器所处的某一个空间中,一般情况下不会存在只有一个红外检测***的情况,因此,为了避免由于红外检测***过多进而使得在发送指令的过程中发送错误的问题,用户可以在该应用程序中为各个不同位置的红外检测***配置对应的***编码,以示区别。例如,001,002,003等等,也可以是其他编码方式,本示例对此不做特殊限制。
同时,为了可以实现利用对应的控制指令对遥控器进行控制,还需要通过该应用程序添加遥控器的参数信息,该参数信息可以包括遥控器的型号、所控制的设备以及遥控器名称等等。具体的,用户可以通过该应用程序添加一个或者多个处于不同空间、控制不同设备的遥控器的参数信息,例如,添加卧室的空调遥控、客厅的电视遥控等等,然后再将添加好的参数信息存储至存储器中。
进一步的,当完成对遥控器的绑定以后,还需要为遥控器设置不同的操作手势的匹配方案。具体的,参考图4所示,该操作手势匹配方案的具体匹配过程可以包括以下步骤:
步骤S410,获取存储于存储器中的遥控器的编码信息,并完成遥控器的参数设置;此处的参数可以包括遥控器所能控制的设备的具体信息、遥控器本身所具有的参数、遥控器需要控制的空间位置等等,也可以包括其他信息,例如遥控器具体工作的时间段等等,本示例对此不做特殊限制;
步骤S420,对手势表示的操作进行制定,使得手势与操作可以匹配;例如,对于客厅的电视遥控器来说,举起一个手指表示打开电视,举起两个手指表示增加音量,举起三个手指表示调换频道等等;
步骤S430,对设置的内容进行保存,以完成整个匹配方案。
需要补充说明的是,当需要对遥控器或者手势进行增加或者删除时,也可以通过应用程序进行增加或者删除,通过该方法,可以避免手势过多或者过少,或者遥控器过多或者过少造成的使用不便的情况,进一步的提升了用户体验。
进一步的,参考图5所示,本公开通过多个检测***001、002、003以及004相互配合,实现全屋多方位手势检测,例如,检测***001、002、003以及004将该屋子分为A、B、C、D四个区域,当红外检测***接收到语音信息时,可以根据接收到的语音信息来测量手势发出点到红外检测***的距离。遥控器设备只需要在局域网范围内,通过处理器发送的离线语音实现唤醒功能,即可实现对相应设备的控制,解决现在市场上的语音遥控器需要依赖公网进行语义理解的弊端。
至此,就可以根据接收到的手势信息对遥控器进行控制了。
以下,结合图2、图3以及图5对步骤S110-步骤S140进行解释以及说明。
在步骤S110中,接收多个红外检测***分别发送的待识别音频,并基于预设的音频识别模型对各所述待识别音频进行识别得到音频识别结果。
在本示例实施例中,首先,接收多个红外检测***中所包括的控制器分别发送的待识别音频;其中,各所述待识别音频是通过各所述红外检测***中包括的音频接收设备接收的,并且,每个红外检测***发送的待识别音频所包括的音频响度不同而音频信息相同;其次,利用预设的音频识别模型对各所述待识别音频进行识别,得到音频识别结果;其中,所述预设的语音识别模型包括深度神经网络、卷积神经网络、长短期记忆网络以及隐马尔科夫模型中的一种或多种。
举例来说,当音频接收设备(麦克风阵列)接收到用户的语音信息后,将该语音信息发送至控制器,然后控制器再将该语音信息发送至处理器;当处理器接收到用户的语音信息后,调用预设的算法识别模型对该待识别语音进行识别,进而得到语音识别结果。
此处以预设的语音识别模型为卷积神经网络对待识别语音的具体识别过程进行解释以及说明。首先,对待识别语音进行预处理,具体的可以包括将首尾端的静音切除,降低对后续步骤造成的干扰,然后进行声音分帧,把声音切开成多个序列帧,各帧之间一般是有交叠;其次,进行特征提取;具体的可以包括运用倒谱系数,把每一帧波形变成一个包含声音信息的多维向量;然后,利用卷积神经网络的卷积层、激励层、池化层以及全连接层对该多位向量进行处理,得到对应的语音识别结果;例如,打开电视或者关闭空调等等。
在步骤S120中,在确定所述音频识别结果是与控制所述遥控器关联的有效指令时,根据各所述待识别音频的音频响度,在各所述红外检测***中确定待工作的红外检测***。
在本示例实施例中,为了可以确定待工作的红外传感器,首先需要确定该音频识别结果是与控制遥控器关联的有效指令;也即,在确定是需要通过某一遥控器执行某些功能时,才需要确定待工作的红外传感器。其中,本公开所记载的遥控器可以具有多个子遥控器,每个子遥控器控制的设备不同。具体的确定方法可以包括:根据遥控器匹配规则,判断所述音频识别结果是否为与控制所述遥控器中的任一子遥控器关联的有效指令;其中,所述遥控器匹配规则是根据所述遥控器参数确定的。例如,该第一匹配规则中可以包括激活电视遥控器、激活空调遥控器或者激活冰箱遥控器等等,当语音识别结果存在于遥控器匹配规则中时,可以确定该音频识别结果是与控制遥控器中的某一个子遥控器关联的有效指令,并在确定是有效指令时,处理器对该子遥控器进行唤醒。通过该方法,可以避免由于子遥控器长时间处于工作状态造成的资源浪费的问题,同时也可以降低***的负担。
进一步的,在确定音频识别结果是与控制遥控器关联的有效指令时,可以根据音频分贝大小确定待工作的红外传感器。具体的,可以包括:首先,检测各所述待识别音频中包括的音频分贝的大小,并根据各所述音频分贝的大小对各所述待识别音频进行排序;其次,根据排序结果确定音频分贝最大的待识别音频,并将与音频分贝最大的待识别音频所在的红外检测***,确定为待工作的红外检测***。举例来说,处理器可以对各控制器发送的待识别音频的音频响度进行识别,进而可以将音频分贝最大的那个控制器所在的红外检测***中所包括的红外传感器,作为离用户最近的红外传感器,也即待工作的红外传感器。通过该方法,可以提高所获取到的手势信息的准确度,进而保证控制指令的有效性。
在步骤S130中,生成与所述待工作的红外检测***对应的驱动指令,并将所述驱动指令发送至所述待工作的红外检测***,以使得所述待工作的红外检测***处于工作状态。
例如,在图5所示的示例图中,手势所在的地区距离红外检测***001、002、003、004的距离分别为:l1、l2、l3以及l4,基于对待识别音频的分贝大小的检测结果可以得知,l1为最近的距离,因此可以将红外检测***001中所包括的红外传感器作为待工作的红外传感器;基于此,处理器可以生成与该待工作的红外传感器对应的驱动指令并发送至该待工作的红外传感器所在的红外检测***中的控制器,以使得该红外检测***中的控制器根据该驱动指令驱动该待工作的红外传感器处于工作状态。基于该方法,可以避免由于红外传感器长期处于工作状态进而导致的资源浪费的问题,同时还可以避免由于多个红外传感器同时对手势信息进行检测进而导致控制指令混乱的问题。
在步骤S140中,获取根据处于工作状态的所述待工作的红外检测***检测到的手势信息确定的控制指令,控制所述遥控器执行与所述控制指令相应的功能。
在本示例实施例中,参考图6所示,获取根据所述待工作的红外传感器检测到的手势信息确定的控制指令可以包括步骤S610-步骤S630。其中:
在步骤S610中,接收处于工作状态的所述待工作的红外检测***发送的根据所述待工作的红外检测***检测到的手势图像生成的手势信息;
在步骤S620中,在确定所述手势信息中包括手势形状时,根据手势匹配规则,判断所述手势信息是否为有效手势;其中,所述手势匹配规则是根据所述遥控器所能执行的功能生成的;
在步骤S630中,在确定所述手势信息为有效手势时,获取与所述手势信息对应的控制指令。
以下,将对步骤S610-步骤S630进行解释以及说明。首先,当待工作红外检测***中的红外传感器处于工作状态时,可以检测用户发出的手势投影形成的光影图片,进而基于预设的红外手势检测算法,生成对应的手势信息;其中,红外手势检测算法的具体计算过程可以包括:当红外传感器在自己所处的工作区域检测到用户的手势时,红外光源发射的信号被反射,红外传感器接收到来自红外发射光源的特征码,该特征码中可以包括手势动作的特征信息,然后对特征进行解调,并利用手势识别算法程序根据解调后的特征码提取出手势动作的特征信息,并根据提取出的特征信息生成上述手势信息;其中,手势识别算法可以包括模版匹配算法、神经网络算法以及隐马尔可夫算法等等,本示例对此不做特殊限制。
进一步的,当得到手势信息以后,控制器将该手势信息发送至处理器,处理器在接收到该手势信息以后,可以判断该手势信息中是否包括具体的手势形状,如果包括,则直接从与该遥控器对应的手势指令中匹配是否存在与该手势信息对应的指令,如果存在,则获取与该手势信息对应的控制指令,并控制遥控器执行与该控制指令对应的功能,例如降低电视机的音量或者关闭电视机等等。此处需要补充说明的是,上述手势匹配规则可以根据该遥控器所能执行的功能进行确定,每个子遥控器对应一个手势匹配规则;该手势匹配规则中例如可以包括:对于电视机遥控器来说,举起一个手指,表示打开电视,举起两个手指表示调大音量等等,本示例对此不做特殊限制。
进一步的,当上述手势信息中不包括手势形状时,该遥控器的控制方法还可以包括:在确定所述手势信息中不包括手势形状时,根据所述排序结果确定与所述音频分贝最大的待识别音频相邻的下一个待识别音频;将与所述下一个待识别音频对应的红外检测***,确定为所述待工作的红外检测***;生成与所述待工作的红外检测***对应的驱动指令,并将所述驱动指令发送至待工作的红外检测***,以使得所述所述待工作的红外检测***处于工作状态。
具体的,若手势信息不是有效手势,针对该情况可能存在真正下发指令的手势被其他物体遮挡,或者没有下发有效指令两种可能性。当下发指令的手势被其他物体遮挡时(具体场景图可以参考图7所示,其中图7中所示的701即为遮挡物),当前处于工作状态的待工作的红外传感器没有检测到有效手势时,将按照收取到音量从小到大的顺序,逐渐唤醒当前红外检测***顺序位的下一个红外检测***,也即图7中对应的红外检测***002中所包括的红外传感器,然后重复前述的驱动红外传感器处于工作状态的步骤,直到最后检测到有效手势为止(在下一次红外检测器休眠时间到来之前);其中,红外传感器的工作时间设置为30s,当在该时间段检测到有效手势时,整个控制流程结束;当该时间段没有检测到有效手势时,整个控制流程失败,抛弃这次手势指令下发。通过该方法,可以解决现有技术中由于屋内物体阻挡导致的读取手势失败的问题。
进一步的,如果手势信息中包括手势形状,但是该手势形状不存在于上述手势匹配规则中,则判断该待工作的红外传感器的处于工作状态的时间是否大于30s,如果是,则指令执行失败;如果否,则判断该待工作的红外传感器所在的红外检测***是否为最后一个红外检测***,如果是,则重新唤醒该待工作的红外传感器,并执行后续流程;如果否,则重新检测用户手势;也即如果所有的红外传感器都处于工作状态,但是仍然未检测到有效手势时,可以在各红外传感器的下一次休眠时间到来之前,重复的进行手势检测,直至完成遥控器的控制。
以下,将对本公开中所记载的红外检测***在屋内的安装位置、安装数量以及工作区间进行解释以及说明。
首先,需要计算安装数量,具体的计算方法可以包括:根据所述遥控器所处的当前空间的空间大小以及各所述红外检测***中所包括的红外传感器的属性信息,计算所述当前空间所需配置的红外检测***的数量。其中,红外传感器的属性信息例如可以包括红外传感器的名称、型号以及其所能支持的工作范围;进而,可以根据屋内的空间大小以及其所能支持的工作范围,计算屋内所需要的红外检测***的数量。
其次,需要计算安装位置以及工作区间,具体的计算方法可以包括:根据所述空间大小以及所述属性信息计算各所述红外检测***的工作区间,并根据所述工作区间计算各所述红外检测***的待安装位置。
进一步的,为了可以减少盲区,还需要对工作区间以及安装位进行进一步的优化,具体的可以包括:首先,根据所述当前空间以及所述工作区间计算各所述红外检测***的工作盲区;其次,根据所述工作盲区对所述待安装位置进行调整,得到目标安装位置。
具体的,参考图8所示,假设屋内是由EFGHIJ围成的长方形区域,各红外检测***之间的距离为D,设置预设域量为Δd,则有红外检测***的工作区间的半径为D-Δd。在图8中,EF之间的距离为2(D-Δd),图中的菱形区域801以及802即为工作盲区,因此,为了缩小工作盲区,可以对红外检测***的工作区间(也即扇形区域,或者半圆区域)之间的重叠距离进行调整,从而根据调整后的距离对红外检测***的待安装位置进行调整,得到上述目标安装位置,进而跟据目标安装位置对各红外检测***进行安装,从而实现最大限度的缩小工作盲区,直至不存在盲区。
以下,将结合图9对本公开的遥控器的控制方法进行进一步的解释以及说明。具体的,参考图9所示,该遥控器的控制方法可以包括以下步骤:
步骤S910,使用语音识别算法,唤醒对应的遥控器,并检测各待识别音频的音量分贝值;
步骤S920,将各待识别音频的音量分贝值按照从大到小的顺序排列,并将最大音频分贝值的点对应的红外传感器作为待工作的红外传感器;
步骤S930,驱动待工作的红外传感器处于工作状态,并调用红外手势检测算法判断接收到的手势信息中是否包括手势形状;如果是,跳转至步骤S940,如果否,则跳转至步骤S931;
步骤S931,判断当前红外检测***是否为最后一个选择***;如果是,跳转至步骤S932;如果否,跳转至步骤S933;
步骤S932,判断红外传感器的工作时长是否超过预设时长(30s),如果是,则跳转至步骤S935,如果否,则跳转至步骤S934;
步骤S933,按照已经排好的从大到小的顺序,顺位将当前选择的红外检测***的下一个红外检测***中包括的红外传感器作为待工作的红外传感器;
步骤S934,执行指令失败;
步骤S935,判断当前红外检测***是否为最后一个选择***;如果是,跳转至步骤S930;如果否,跳转至步骤S920;
步骤S940,判断手势信息是否为有效手势;如果是,跳转至步骤S950;如果否,跳转至步骤S932;
步骤S950,获取与手势信息对应的手势指令,并执行手势指令;
步骤S960,控制红外传感器处于休眠状态。
本发明提供的一种遥控器的控制方法,能够实现室内空间范围内的全方位检测,同时避免摄像头监控手势导致用户担心的隐私安全隐患;同时,通过设置不同的遥控器设备,使得遥控器控制***可以匹配不同的遥控器,实现真正意义上的一操多控;并且,通过手势控制设备,解决语音遥控器因为网络质量导致的无法立即响应用户操作的问题;进一步的,利用多个方位红外手势检测装置,解决因为室内物体阻挡等导致的读取手势失败问题;同时,采用唤醒的形式进行就近检测,起到节能作用
本公开还提供了一种遥控器的控制装置。参考图10所示,该遥控器的控制装置可以包括音频识别模块1010、第一检测设备确定模块1020、第一指令生成模块1030以及指令获取模块1040。其中:
音频识别模块1010,可以用于接收多个红外检测***分别发送的待识别音频,并基于预设的音频识别模型对各所述待识别音频进行识别得到音频识别结果;
第一检测设备确定模块1020,可以用于在确定所述音频识别结果是与控制所述遥控器关联的有效指令时,根据各所述待识别音频的音频响度,在各所述红外检测***中确定待工作的红外检测***;
第一指令生成模块1030,可以用于生成与所述待工作的红外检测***对应的驱动指令,并将所述驱动指令发送至所述待工作的红外检测***,以使得所述待工作的红外检测***处于工作状态;
指令获取模块1040,可以用于获取根据处于工作状态的所述待工作的红外检测***检测到的手势信息确定的控制指令,控制所述遥控器执行与所述控制指令相应的功能。
在本公开的一种示例性实施例中,所述遥控器具有多个子遥控器,每个所述子遥控器控制的设备不同;所述遥控器的控制装置还包括:
第一判断模块,可以用于根据遥控器匹配规则,判断所述音频识别结果是否为与控制所述遥控器中的任一子遥控器关联的有效指令;
其中,所述遥控器匹配规则是根据所述遥控器参数确定的。
在本公开的一种示例性实施例中,根据各所述待识别音频的音频响度,在各所述红外检测***中确定待工作的红外检测***,包括:
检测各所述待识别音频中包括的音频分贝的大小,并根据各所述音频分贝的大小对各所述待识别音频进行排序;
根据排序结果确定音频分贝最大的待识别音频,并将音频分贝最大的待识别音频所在的红外检测***确定为待工作的红外检测***。
在本公开的一种示例性实施例中,获取根据处于工作状态的所述待工作的红外检测***检测到的手势信息确定的控制指令,包括:
接收处于工作状态的所述待工作的红外检测***发送的根据所述待工作的红外检测***检测到的手势图像生成的手势信息;
在确定所述手势信息中包括手势形状时,根据手势匹配规则,判断所述手势信息是否为有效手势;其中,所述手势匹配规则是根据所述遥控器所能执行的功能生成的;
在确定所述手势信息为有效手势时,获取与所述手势信息对应的控制指令。
在本公开的一种示例性实施例中,所述遥控器的控制装置还包括:
音频确定模块,可以用于在确定所述手势信息中不包括手势形状时,根据所述排序结果确定与所述音频分贝最大的待识别音频相邻的下一个待识别音频;
第二检测设备确定模块,可以用于将与所述下一个待识别音频对应的红外检测***,确定为所述待工作的红外检测***;
第二指令生成模块,可用于生成与所述待工作的红外检测***对应的驱动指令,并将所述驱动指令发送至待工作的红外检测***,以使得所述待工作的红外检测***处于工作状态。
在本公开的一种示例性实施例中,基于预设的音频识别模型对所述待识别音频进行识别得到音频识别结果,包括:
利用预设的音频识别模型对各所述待识别音频进行识别,得到音频识别结果;其中,所述预设的语音识别模型包括深度神经网络、卷积神经网络、长短期记忆网络以及隐马尔科夫模型中的一种或多种。
在本公开的一种示例性实施例中,所述遥控器的控制装置还包括:
红外检测***数量计算模块,可以用于根据所述遥控器所处的当前空间的空间大小以及各所述红外检测***的属性信息,计算所述当前空间所需配置的红外检测***的数量。
在本公开的一种示例性实施例中,所述遥控器的控制装置还包括:
安装位置计算模块,可以用于根据所述空间大小以及所述属性信息计算各所述红外检测***的工作区间,并根据所述工作区间计算各所述红外检测***的待安装位置。
在本公开的一种示例性实施例中,所述遥控器的控制装置还包括:
工作盲区计算模块,可以根据所述当前空间以及所述工作区间计算各所述红外检测***的工作盲区;
安装位置调整模块,可以用于根据所述工作盲区对所述待安装位置进行调整,得到目标安装位置。
上述遥控器的控制装置中各模块的具体细节已经在对应的遥控器的控制方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本发明中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
在本发明的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为***、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“***”。
下面参照图11来描述根据本发明的这种实施方式的电子设备1100。图11显示的电子设备1100仅仅是一个示例,不应对本公开的功能和使用范围带来任何限制。
如图11所示,电子设备1100以通用计算设备的形式表现。电子设备1100的组件可以包括但不限于:上述至少一个处理单元1110、上述至少一个存储单元1120、连接不同***组件(包括存储单元1120和处理单元1110)的总线1130以及显示单元1140。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元1110执行,使得所述处理单元1110执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元1110可以执行如图1中所示的步骤S110:接收多个红外检测***分别发送的待识别音频,并基于预设的音频识别模型对各所述待识别音频进行识别得到音频识别结果;步骤S120:在确定所述音频识别结果是与控制所述遥控器关联的有效指令时,根据各所述待识别音频的音频响度,在各所述红外检测***中确定待工作的红外检测***;步骤S130:生成与所述待工作的红外检测***对应的驱动指令,并将所述驱动指令发送至所述待工作的红外检测***,以使得所述待工作的红外检测***处于工作状态;步骤S140:获取根据处于工作状态的所述待工作的红外检测***检测到的手势信息确定的控制指令,控制所述遥控器执行与所述控制指令相应的功能。
存储单元1120可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)11201和/或高速缓存存储单元11202,还可以进一步包括只读存储单元(ROM)11203。
存储单元1120还可以包括具有一组(至少一个)程序模块11205的程序/实用工具11204,这样的程序模块11205包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线1130可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、***总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备1100也可以与一个或多个外部设备1200(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1100交互的设备通信,和/或与使得该电子设备1100能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1150进行。并且,电子设备1100还可以通过网络适配器1160与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1160通过总线1130与电子设备1100的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1100使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本发明实施方式的方法。
在本发明的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
根据本发明的实施方式的用于实现上述方法的程序产品,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里发明的发明后,将容易想到本发明的其他实施例。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由权利要求指出。
Claims (12)
1.一种遥控器的控制方法,其特征在于,包括:
接收多个红外检测***分别发送的待识别音频,并基于预设的音频识别模型对各所述待识别音频进行识别得到音频识别结果;
在确定所述音频识别结果是与控制所述遥控器关联的有效指令时,检测各所述待识别音频中包括的音频分贝的大小,并根据各所述音频分贝的大小对各所述待识别音频进行排序;根据排序结果确定音频分贝最大的待识别音频,并将音频分贝最大的待识别音频所在的红外检测***确定为待工作的红外检测***;
生成与所述待工作的红外检测***对应的驱动指令,并将所述驱动指令发送至所述待工作的红外检测***,以使得所述待工作的红外检测***处于工作状态;
接收处于工作状态的所述待工作的红外检测***发送的根据所述待工作的红外检测***检测到的手势图像生成的手势信息;在确定所述手势信息中包括手势形状时,根据手势匹配规则,判断所述手势信息是否为有效手势;其中,所述手势匹配规则是根据所述遥控器所能执行的功能生成的;在确定所述手势信息为有效手势时,获取与所述手势信息对应的控制指令,控制所述遥控器执行与所述控制指令相应的功能。
2.根据权利要求1所述的控制方法,其特征在于,所述遥控器具有多个子遥控器,每个所述子遥控器控制的设备不同;
其中,在对各所述待识别音频进行识别得到音频识别结果之后,所述控制方法还包括:
根据遥控器匹配规则,判断所述音频识别结果是否为与控制所述遥控器中的任一子遥控器关联的有效指令;
其中,所述遥控器匹配规则是根据遥控器参数确定的。
3.根据权利要求1所述的控制方法,其特征在于,所述控制方法还包括:
在确定所述手势信息中不包括手势形状时,根据所述排序结果确定与所述音频分贝最大的待识别音频相邻的下一个待识别音频;
将与所述下一个待识别音频对应的红外检测***,确定为所述待工作的红外检测***;
生成与所述待工作的红外检测***对应的驱动指令,并将所述驱动指令发送至待工作的红外检测***,以使得所述待工作的红外检测***处于工作状态。
4.根据权利要求1所述的控制方法,其特征在于,基于预设的音频识别模型对所述待识别音频进行识别得到音频识别结果,包括:
利用预设的音频识别模型对各所述待识别音频进行识别,得到音频识别结果;其中,所述预设的语音识别模型包括深度神经网络、卷积神经网络、长短期记忆网络以及隐马尔科夫模型中的一种或多种。
5.根据权利要求4所述的控制方法,其特征在于,所述控制方法还包括:
根据所述遥控器所处的当前空间的空间大小以及各所述红外检测***的属性信息,计算所述当前空间所需配置的红外检测***的数量。
6.根据权利要求5所述的控制方法,其特征在于,所述控制方法还包括:
根据所述空间大小以及所述属性信息计算各所述红外检测***的工作区间,并根据所述工作区间计算各所述红外检测***的待安装位置。
7.根据权利要求6所述的控制方法,其特征在于,控制方法还包括:
根据所述当前空间以及所述工作区间计算各所述红外检测***的工作盲区;
根据所述工作盲区对所述待安装位置进行调整,得到目标安装位置。
8.一种遥控器的控制***,其特征在于,包括:
多个红外检测***以及处理器和存储器,各所述红外检测***分别与所述处理器和所述存储器通信连接;
每个所述红外检测***包括控制器、音频接收装置以及红外传感器,所述音频接收装置以及红外传感器与所述控制器通信连接;
所述控制器用于控制所述音频接收装置以及红外传感器处于工作状态,以及将所述音频接收装置接收到的待识别音频发送至所述处理器;
所述音频接收装置用于接收所述待识别音频,所述红外传感器用于接收手势信息;
所述存储器上存储有计算机指令,所述处理器用于执行所述计算机指令以实现如权利要求1-7任一项所述的遥控器的控制方法。
9.根据权利要求8所述的遥控器的控制***,其特征在于,所述处理器还存储有应用程序,所述应用程序被所述处理器执行以实现为各所述红外检测***配置***编码,以及通过所述应用程序添加所述遥控器的参数信息并存储到所述存储器中。
10.根据权利要求8所述的遥控器的控制***,其特征在于,所述红外检测***以及所述处理器和存储器通过局域网进行通信。
11.一种计算机非瞬态可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的遥控器的控制方法。
12.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任一项所述的遥控器的控制方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011359772.6A CN112489413B (zh) | 2020-11-27 | 2020-11-27 | 遥控器的控制方法及***、存储介质、电子设备 |
PCT/CN2021/123646 WO2022111103A1 (zh) | 2020-11-27 | 2021-10-13 | 遥控器的控制方法及***、存储介质、电子设备 |
US17/916,097 US20230169970A1 (en) | 2020-11-27 | 2021-10-13 | Remote controller control method and system, storage medium, and electronic device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011359772.6A CN112489413B (zh) | 2020-11-27 | 2020-11-27 | 遥控器的控制方法及***、存储介质、电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112489413A CN112489413A (zh) | 2021-03-12 |
CN112489413B true CN112489413B (zh) | 2022-01-11 |
Family
ID=74936181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011359772.6A Active CN112489413B (zh) | 2020-11-27 | 2020-11-27 | 遥控器的控制方法及***、存储介质、电子设备 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230169970A1 (zh) |
CN (1) | CN112489413B (zh) |
WO (1) | WO2022111103A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112489413B (zh) * | 2020-11-27 | 2022-01-11 | 京东方科技集团股份有限公司 | 遥控器的控制方法及***、存储介质、电子设备 |
CN115394069B (zh) * | 2022-07-29 | 2024-04-09 | 上海合壹未来文化科技有限公司 | 一种多设备联动遥控***、方法、设备及存储介质 |
CN116956139A (zh) * | 2023-08-04 | 2023-10-27 | 深圳优立全息科技有限公司 | 一种基于红外波段的设备关联方法及相关装置 |
CN117253492B (zh) * | 2023-11-17 | 2024-04-02 | 深圳超然科技股份有限公司 | 基于声纹识别的遥控方法、装置、智能电器***、介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103337242A (zh) * | 2013-05-29 | 2013-10-02 | 华为技术有限公司 | 一种语音控制方法和控制设备 |
CN104511903A (zh) * | 2013-09-28 | 2015-04-15 | 沈阳新松机器人自动化股份有限公司 | 一种机器人遥控***及方法 |
CN106372484A (zh) * | 2016-09-14 | 2017-02-01 | 珠海市魅族科技有限公司 | 一种设备控制的方法及设备控制装置 |
CN107407915A (zh) * | 2015-03-31 | 2017-11-28 | 深圳市大疆创新科技有限公司 | 用于生成飞行管制的认证***和方法 |
CN109564474A (zh) * | 2016-08-16 | 2019-04-02 | 谷歌有限责任公司 | 手势激活的远程控制 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7039590B2 (en) * | 2001-03-30 | 2006-05-02 | Sun Microsystems, Inc. | General remote using spoken commands |
US7023498B2 (en) * | 2001-11-19 | 2006-04-04 | Matsushita Electric Industrial Co. Ltd. | Remote-controlled apparatus, a remote control system, and a remote-controlled image-processing apparatus |
US20150187209A1 (en) * | 2006-01-31 | 2015-07-02 | Sigma Designs, Inc. | Method and system for synchronization and remote control of controlling units |
JP2007235613A (ja) * | 2006-03-01 | 2007-09-13 | Murata Mach Ltd | 遠隔制御装置 |
US20100042564A1 (en) * | 2008-08-15 | 2010-02-18 | Beverly Harrison | Techniques for automatically distingusihing between users of a handheld device |
TW201104495A (en) * | 2009-07-22 | 2011-02-01 | Novatek Microelectronics Corp | Remote control device for a multimedia device and related multimedia system |
US8477877B2 (en) * | 2010-06-23 | 2013-07-02 | At&T Intellectual Property I, L.P. | Feed-forward carrier phase recovery for optical communications |
US20120239396A1 (en) * | 2011-03-15 | 2012-09-20 | At&T Intellectual Property I, L.P. | Multimodal remote control |
CN202362929U (zh) * | 2011-12-06 | 2012-08-01 | 东莞理工学院 | 一种语音交互式红外遥控器 |
CN104184970B (zh) * | 2013-05-22 | 2016-06-29 | 京东方科技集团股份有限公司 | 遥控器、电视机及遥控方法 |
KR102147346B1 (ko) * | 2014-06-23 | 2020-08-24 | 엘지전자 주식회사 | 디스플레이 장치 및 그의 동작 방법 |
JP6482911B2 (ja) * | 2014-07-01 | 2019-03-13 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機器制御方法および電気機器 |
CN105240989B (zh) * | 2015-09-01 | 2019-01-29 | 珠海格力电器股份有限公司 | 具有红外检测***的空调器及其控制方法 |
CN205028454U (zh) * | 2015-09-10 | 2016-02-10 | 金德奎 | 多功能手势控制智能盒子 |
WO2017127836A1 (en) * | 2016-01-23 | 2017-07-27 | Innosys, Inc. | Continuously powered load switch lock |
CA3060439A1 (en) * | 2017-04-24 | 2018-11-01 | Whoop, Inc. | Activity recognition |
WO2018200866A1 (en) * | 2017-04-26 | 2018-11-01 | UHV Technologies, Inc. | Material sorting using a vision system |
US10319220B2 (en) * | 2017-04-27 | 2019-06-11 | Rohde & Schwarz Gmbh & Co. Kg | Control arrangement and control method |
CN111108755B (zh) * | 2017-09-14 | 2022-04-01 | 株式会社索思未来 | 电子设备控制***、声音输出装置、以及方法 |
CN109308159B (zh) * | 2018-08-22 | 2023-01-17 | 深圳绿米联创科技有限公司 | 智能设备控制方法、装置、***、电子设备及存储介质 |
CN210428799U (zh) * | 2019-03-13 | 2020-04-28 | 佛山市云米电器科技有限公司 | 一种具有手势操控的智能遥控器 |
CN110060677A (zh) * | 2019-04-04 | 2019-07-26 | 平安科技(深圳)有限公司 | 语音遥控器控制方法、装置及计算机可读存储介质 |
CN110703628A (zh) * | 2019-11-25 | 2020-01-17 | 京东方科技集团股份有限公司 | 智能家居***及控制方法 |
CN111223287A (zh) * | 2019-12-28 | 2020-06-02 | 深圳市九洲电器有限公司 | 红外采集解码验证方法及相关产品 |
CN112489413B (zh) * | 2020-11-27 | 2022-01-11 | 京东方科技集团股份有限公司 | 遥控器的控制方法及***、存储介质、电子设备 |
-
2020
- 2020-11-27 CN CN202011359772.6A patent/CN112489413B/zh active Active
-
2021
- 2021-10-13 WO PCT/CN2021/123646 patent/WO2022111103A1/zh active Application Filing
- 2021-10-13 US US17/916,097 patent/US20230169970A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103337242A (zh) * | 2013-05-29 | 2013-10-02 | 华为技术有限公司 | 一种语音控制方法和控制设备 |
CN104511903A (zh) * | 2013-09-28 | 2015-04-15 | 沈阳新松机器人自动化股份有限公司 | 一种机器人遥控***及方法 |
CN107407915A (zh) * | 2015-03-31 | 2017-11-28 | 深圳市大疆创新科技有限公司 | 用于生成飞行管制的认证***和方法 |
CN109564474A (zh) * | 2016-08-16 | 2019-04-02 | 谷歌有限责任公司 | 手势激活的远程控制 |
CN106372484A (zh) * | 2016-09-14 | 2017-02-01 | 珠海市魅族科技有限公司 | 一种设备控制的方法及设备控制装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112489413A (zh) | 2021-03-12 |
US20230169970A1 (en) | 2023-06-01 |
WO2022111103A1 (zh) | 2022-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112489413B (zh) | 遥控器的控制方法及***、存储介质、电子设备 | |
KR102387567B1 (ko) | 음성 인식 방법 및 음성 인식 장치 | |
US11429345B2 (en) | Remote execution of secondary-device drivers | |
KR102179506B1 (ko) | 전자장치 및 그 제어방법 | |
US9842489B2 (en) | Waking other devices for additional data | |
KR102444061B1 (ko) | 음성 인식이 가능한 전자 장치 및 방법 | |
EP3552201B1 (en) | Electronic device and controlling method thereof | |
CN110827818A (zh) | 一种智能语音设备的控制方法、装置、设备及存储介质 | |
US9953634B1 (en) | Passive training for automatic speech recognition | |
CN105723448A (zh) | 电子设备及其语音识别方法 | |
KR20150121038A (ko) | 음성 제어식 통신 커넥션 | |
JP2019161638A (ja) | スマートテレビの制御モード切替方法、設備及びコンピュータプログラム | |
US20160125880A1 (en) | Method and system for identifying location associated with voice command to control home appliance | |
CN109920419B (zh) | 语音控制方法和装置、电子设备及计算机可读介质 | |
CN109308897B (zh) | 语音控制方法、模块、家电设备、***和计算机存储介质 | |
CN109032345B (zh) | 设备控制方法、装置、设备、服务端和存储介质 | |
CN108055617B (zh) | 一种麦克风的唤醒方法、装置、终端设备及存储介质 | |
CN111433737A (zh) | 电子装置及其控制方法 | |
CN113132193B (zh) | 智能设备的控制方法、装置、电子设备以及存储介质 | |
EP3654170B1 (en) | Electronic apparatus and wifi connecting method thereof | |
CN112838967B (zh) | 主控设备、智能家居及其控制装置、控制***及控制方法 | |
CN112136006B (zh) | 空调及其控制方法 | |
CN110933345A (zh) | 一种降低电视待机功耗的方法、电视机及存储介质 | |
CN110602197A (zh) | 物联网控制装置和方法、电子设备 | |
CN109783049A (zh) | 操作控制方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |