CN110782890A - 闹钟提醒方法、智能投影仪及相关产品 - Google Patents
闹钟提醒方法、智能投影仪及相关产品 Download PDFInfo
- Publication number
- CN110782890A CN110782890A CN201910936125.8A CN201910936125A CN110782890A CN 110782890 A CN110782890 A CN 110782890A CN 201910936125 A CN201910936125 A CN 201910936125A CN 110782890 A CN110782890 A CN 110782890A
- Authority
- CN
- China
- Prior art keywords
- original
- alarm clock
- information
- type
- projector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000013507 mapping Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 13
- 230000015654 memory Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 12
- 239000013598 vector Substances 0.000 description 13
- 238000004891 communication Methods 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 101000712600 Homo sapiens Thyroid hormone receptor beta Proteins 0.000 description 3
- 102100033451 Thyroid hormone receptor beta Human genes 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G03—PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
- G03B—APPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
- G03B29/00—Combinations of cameras, projectors or photographic printing apparatus with non-photographic non-optical apparatus, e.g. clocks or weapons; Cameras having the shape of other objects
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
本申请实施例公开了一种闹钟提醒方法、智能投影仪及相关产品,所述方法包括:投影仪采集原始语音数据,将该原始语音数据提取得到原始特征信息;投影仪依据该原始特征信息识别得到所述原始特征信息对应的文本信息,依据所述文本信息设置闹钟信息,该闹钟信息包括:闹钟时间以及提醒类型;投影仪确定达到该闹钟时间时,按该提醒类型投影播放与该投影类型匹配的数据。本申请提供的技术方案具有用户体验度高的优点。
Description
技术领域
本申请涉及电子技术领域,具体涉及一种闹钟提醒方法、智能投影仪及相关产品。
背景技术
投影技术在人们日常生活中得到普遍的应用。无论在会议、教学或是娱乐场所都随处可见投影***的使用。生活中,闹钟属于常用功能,尤其是智能手机应用范围广后,闹钟更多的被应用到电子设备中,现有的投影仪没有闹钟功能,这使得用户无法使用闹钟,影响了用户体验度。
发明内容
本申请实施例提供了一种闹钟提醒方法、智能投影仪及相关产品,能够实现投影仪的闹钟功能,提升了用户体验。
第一方面,本申请实施例提供一种闹钟提醒方法,应用于智能投影仪,所述方法包括:
投影仪采集原始语音数据,将该原始语音数据提取得到原始特征信息;
投影仪依据该原始特征信息识别得到所述原始特征信息对应的文本信息,依据所述文本信息设置闹钟信息,该闹钟信息包括:闹钟时间以及提醒类型;
投影仪确定达到该闹钟时间时,按该提醒类型投影播放与该投影类型匹配的数据。
第二方面,本申请实施例提供一种闹钟提醒装置,应用于智能投影仪,所述装置包括:
采集单元,用于采集原始语音数据;
处理单元,用于将该原始语音数据提取得到原始特征信息;依据该原始特征信息识别得到所述原始特征信息对应的文本信息,依据所述文本信息设置闹钟信息,该闹钟信息包括:闹钟时间以及提醒类型;确定达到该闹钟时间时,按该提醒类型投影播放与该投影类型匹配的数据。
第三方面,本申请实施例提供了一种智能投影仪,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
实施本申请实施例,具备如下有益效果:
可以看出,本申请提供的技术方案在确定导航路径后,采集自行车的当前位置的第一坐标,然后确定该第一坐标位于岔路选择的设定范围时,生成路径投影命令,然后将岔路选择的图像投影在自行车的前方,这样使得了自行车的导航,本申请的技术方案仅仅在岔路选择的时候用投影设备导航,这样能够节省投影仪的电力,对于投影设备来说,其电量有限,如果所有的路段均导航,首先没有必要,其次,每条线路导航也很浪费电量,因此本申请的技术方案具有不影响路径导航的效果,并且也能够节省智能导航仪的电量的优点。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本申请实施例提供的一种投影仪的连接示意图。
图1b是本申请实施例提供的一种智能投影仪的结构示意图;
图2是本申请实施例提供的另一种闹钟提醒方法的流程示意图;
图3是本申请实施例提供的侧距方法的流程示意图;
图3a是本申请实施例提供的位置示意图;
图4是本申请实施例提供的另一种闹钟提醒方法的流程示意图;
图5是本申请实施例提供的一种闹钟提醒装置的功能单元组成框图;
图6是本申请实施例提供的一种闹钟提醒装置的硬件结构组成框图。
具体实施方式
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1a是图解根据实施例的投影***的整体配置的图。图1a中所示的,根据本实施例的投影***包括电子设备100和投影仪200。电子设备100是信息处理设备的实例,并且投影仪200是投影装置的实例。
根据本实施例的投影仪200通过使用两个无线电波(1,2)与电子设备100通信;然而,它并不局限于此,并且较佳的是,如果可以通过使用诸如点对点模式和WiFi直接模式的组合(点对点连接和WiFi直接连接的组合)或者WiFi直接模式和WiFi直接模式的组合(WiFi直接连接的相互组合)的两个以上无线通信路径为连接而待机。因此,作为新添加的无线连接技术的代替,能够使用传统的无线连接标准来实施。
此外,为了以根据本实施例的流模式(用于通过使用流方法来投影图像的模式)投影图像,假设投影仪200以WiFi直接模式为至少一个无线电波待机。
图1b是图解根据实施例的电子设备和投影仪的配置的方框图。如下首先给出投影仪200的解释。如图1b中所示,投影仪200包括控制单元210、通信处理单元212、设备识别单元214、模式判定单元216、模式切换单元218、投影单元220、状态判定单元222、重要程度设置单元224、通知单元226和储存单元240,并且它配置有镜头202。镜头202是如上面所述的将投影图像206投影在屏幕上的镜头。
储存单元240是储存多种类型的程序和数据的储存介质。控制单元210执行投影仪200的整体控制。
通信处理单元212发送信息,该信息表示根据如上面所述的本实施例设置了两个无线通信路径、以及通过使用两个无线通信路径的连接是可能的,由此通知电子设备该投影仪200可连接至电子设备。因此,即使通信路径中的一个由不同的电子设备等等使用,通信路径中的另一个也能够被用于将交换数据发送至电子设备100以及从电子设备100接收交换数据。
上述如图1b所示的投影仪可以是基于下述原理的投影仪。
(1)采用固态激光作为光源:激光光源寿命可达到20000小时以上,一次性投入大,属于一次性投入长期免更换;
(2)采用DLP投影:DLP投影的原理是用很多的小镜子,每个小镜子控制光线角度来实现不同的强弱控制,发射的光线通过镜头打到幕布上,形成图形。DLP投影的ANSI对比度要比LCD投影高。
(3)采用反射式短焦的投影原理:半米距离就能投射100吋画面,更适合小户型追求大画面家庭的需求。
如图1b所示的投影仪可以实现如下步骤:
投影仪采集原始语音数据,将该原始语音数据提取得到原始特征信息;
投影仪依据该原始特征信息识别得到所述原始特征信息对应的文本信息,依据所述文本信息设置闹钟信息,该闹钟信息包括:闹钟时间以及提醒类型;
投影仪确定达到该闹钟时间时,按该提醒类型投影播放与该投影类型匹配的数据。
在一种可选的方案中,所述将该原始语音数据提取得到原始特征信息具体包括:
将所述原始语音数据通过Filter Bank特征提取算法或MFCC算法提取得到原始特征信息。
在一种可选的方案中,所述按该提醒类型投影播放与该投影类型匹配的数据具体包括:
确定目标对象的第一身份,依据该第一身份与提醒类型的映射关系来确定该时间对应的第一类型,播放该第一类型对应的资源;
所述第一身份与提醒类型的映射关系的建立方式包括:
确定身份以后,提取当前播放资源的类型,建立该身份与该类型对应的映射关系。
在一种可选的方案中,所述将该原始语音数据提取得到原始特征信息具体包括:
对原始语音信息的背景噪声依据背景噪声估计去除原始语音信息的背景噪声后执行特征提取得到原始特征信息。
在一种可选的方案中,所述方法还包括:
确定目标对象的距离,依据目标对象的距离获取投影仪的投影宽度,依据该投影宽度确定播放资源的尺寸,依据该尺寸播放该资源。
参阅图2,图2提供一种闹钟的提醒方法,该方法采用如图1b所示的投影仪完成,该方法如图2所示,包括如下步骤:
步骤S201、投影仪采集原始语音数据,将该原始语音数据提取得到原始特征信息;
上述步骤S201中的语音数据集可以音频采集设备采集的语音数据。上述获取原始特征信息的提取操作的方式包括但不限于:Filter Bank特征提取算法或MFCC算法,其对应的原始语音特征包括但不限于:Filter Bank特征或MFCC特征。当然在实际应用中,上述原始语音特征还可以为其他的特征。
步骤S202、投影仪依据该原始特征信息识别得到所述原始特征信息对应的文本信息,依据所述文本信息设置闹钟信息,该闹钟信息包括:闹钟时间以及提醒类型;
上述步骤S202中的得到文本信息的方法可以通过特定人语音识别模型得到,上述特定人语音识别模型可以采用神经网络模型,包括但不限于DNN(英文:Deep NeuralNetwork,中文:深度神经网络)、RNN(英文:Recurrent Neural Network,中文:循环神经网络)、CNN(英文:Convolution Neural Network,中文:卷积神经网络)中的任意一种。上述特定人语音识别模型训练准则包括但不限于:CE(英文:Cross Entropy,中文:交叉熵)准则、triplet准则、CE与triplet结合的准则。
步骤S203、投影仪确定达到该闹钟时间时,按该提醒类型投影播放与该投影类型匹配的数据。
上述步骤S203的实现方法具体可以包括:
依据该闹钟时间来确定对应的提醒类型,提取与该提醒类型相同的历史信息,依据该历史信息播放该提醒类型对应的资源。
下面以一个实际的例子来说明,这里该闹钟时间对应的提醒类型为视频,那么在时间到了以后,提取该历史信息对应的视频文件,按该视频文件的历史时间播放。
本申请提供的技术方案通过语音来设置闹钟信息,然后在该时间到达时,直接启动投影仪播放与该投影类型匹配的数据,这样即能够实现投影仪的闹钟提醒,提高了用户体验度。
可选的,上述按该提醒类型投影播放与该投影类型匹配的数据具体可以包括:
确定目标对象的第一身份,依据该第一身份与提醒类型的映射关系来确定该时间对应的第一类型,播放该第一类型对应的资源。
可选的,上述第一身份与提醒类型的映射关系的建立方式可以包括:
确定身份以后,提取当前播放资源的类型,建立该身份与该类型对应的映射关系。
上述技术方案能够通过身份确认方式来无感的建立身份与类型的映射关系,这样能够实现无感的建立映射关系,无需用户自行调整的优点。
可选的,上述确认目标对象的第一身份的方式可以通过人脸识别的方式来确定,该人脸识别的确定方式包括但不限于,百度人脸识别、谷歌人脸识别等等方式。
背景噪声,一译“本底噪声”。一般指在发生、检查、测量或记录***中与信号存在与否无关的一切干扰。但在工业噪声或环境噪声测量中则是指被测噪声源以外的周围环境噪声。如对在工厂附近的街道测量噪声来说,若要测量的是交通噪声,则工厂噪声便是背景噪声。若测量的目的在于测定工厂噪声,交通噪声便成为背景噪声。在噪声测量过程中.必须注意背景噪声的干扰程度。
上述步骤S201的实现方法具体可以包括:
采集原始语音信息,对原始语音信息的背景噪声进行去除后执行特征提取得到原始特征信息。
上述背景噪声的去除步骤具体可以包括:依据背景噪声估计去除原始语音信息的背景噪声。上述背景噪声估计具体可以如下:
背景噪声估计器和SAD还可以包括在音频编码器中,进而包括在无线设备或网络节点中。对于描述的背景噪声估计器,不限制将噪声估计向下调节。对于每帧,计算可能的新子带噪声估计,而不管帧是背景还是活动内容,如果新值比当前值低,则其被直接用作最可能来自于背景帧。以下的噪声估计逻辑是第二步骤,其中判断子带噪声估计是否可以增加并且如果可以增加的话可以增加多少,所述增加基于之前计算的可能的新子带噪声估计。基本上,该逻辑导致将当前帧确定为背景帧,并且如果其不确定的话,则可以允许比原始所估计的更小的增加。
当音频信号分段的能量水平与长期最小能量水平1tmin的差大于阈值(202:1)时,或者当音频信号分段的能量水平与1tmin的差小于阈值(202:2),但是在音频信号分段中没有检测到停顿(204:1)时。
当音频信号分段被确定(203:2)为包括音乐,并且当前背景噪声估计超过最小值(205:1)时,减少(206)当前背景噪声估计。
通过执行以上操作并且向SAD提供背景噪声估计,SAD能够执行更准确的声音活动检测。此外,还能够从错误背景噪声估计更新中恢复。
在上述方法中使用的音频信号分段的能量水平可以备选地称为例如当前帧能量(Etot),或者被称为信号分段或帧的能量,其可以通过对当前信号分段的子带能量进行求和来计算。
在上述方法中使用的音频信号分段的能量水平可以备选地称为例如当前帧能量(Etot),或者被称为信号分段或帧的能量,其可以通过对当前信号分段的子带能量进行求和来计算。
在上述方法中使用的其它能量特征(即长期最小能量水平1t min)是一种估计,其通过多个在先音频信号分段或帧来确定。1t_min可以备选地表示为例如Etot_11p。推导1t_min的一个基本方式是使用若干过去帧的当前帧能量的历史的最小值。如果值被计算为:“当前帧能量-长期最小估计”低于阈值(被表示为例如THR1),则当前帧能量在此被视为接近长期最小能量,或者在长期最小能量附近。也就是说,当(Etot-1tmin)<THR1时,当前帧能量(Etot)可以被确定(202)为在长期最小能量1t min附近。取决于实施方式,当(Etot-1tmin)=THR1时的情况可以被称为判断202:1或202:2。图2中是序号202:1指示当前帧能量不在1t min附近的判断,而序号202:2指示当前帧能量在1t min附近的判断。
上述投影仪依据该原始特征信息识别得到所述原始特征信息对应的文本信息具体可以包括:
投影仪将原始特征信息拆分成多个特征向量,将多个特征向量分别输入多核处理器中的每个核内,每个核提取与多个特征性向量对应的权值执行向量乘法运算得到结果向量,将所有的结果向量拼接在一起得到文本向量,依据该文本向量得到该文本信息。
上述原始特征信息拆分成多个特征向量的方式可以采用多种方式来拆分,例如,在一种可选的实施例中,可以将原始特征信息按设定尺寸拆分成多个特征向量,当然在实际应用中,还可以采用变化的方式来拆分成多个特征向量,具体的方式可以为,依据多核的负载来确定设定尺寸的大小,例如,该多核负载较轻时,该设定尺寸的大小可以大一些,如该多核负载较重时,该设定尺寸的小可以小一些,当然该设定尺寸可以为标准尺寸的整数倍,该标准尺寸可以为一个音素对应的元素个数,例如40个元素。
上述方案通过动态拆分特征向量的方法能够提高计算的效率,对于计算,需要至少一个音素的向量才能够实现运算,那么在何种情况来实现计算量的分配就成为一个问题,负载均衡很显然是一个较好的方式,这样即能够实现对负载的均衡分布,提高计算效率。
可选的,上述方法还包括:
确定目标对象的距离,依据目标对象的距离获取投影仪的投影宽度,依据该投影宽度确定播放资源的尺寸,依据该尺寸播放该资源。
上述方法依据目标对象的距离来实现对资源尺寸的调整,这样避免了因为目标对象距离太近,而投影尺寸太大导致目标对象观看不舒服的问题。
上述目标对象可以为人。
上述确定目标对象的距离的方式可以有多种,例如,可以通过红外测距模块来确定具体目标对象的距离,当然还可以通过其他的方式来确定目标对象的距离,例如通过超声波来确定目标对象的距离。
上述超声波确定目标对象的距离的方法如图3所示,包括如下步骤:
步骤S301、超声波发射器发射多个频率的超声波信号,多个频率的超声波信号中每个频率的超声波信号发射时间不同;
上述多个频率具体可以包括,超过20KHz的声波信号,本申请并不限制上述多个频率的具体数量,也不限制上述多个频率的具体频率值。具体的,在一个可选的实施例中,上述多个频率可以为10个频率,10个频率分别可以为,21KHz、22KHz、23KHz、24KHz、25KHz、26KHz、27KHz、28KHz、29KHz、30KHz。
步骤S302、超声波接收器接收该多个频率的超声波信号的反射超声波信号;
步骤S303、获取该多个频率的超声波信号的多个发射时间以及反射超声波信号的多个接收时间,依据该多个发射时间、多个接收时间确定目标对象的距离。
参阅图3a,图3a为反射物(目标对象)在位置a、位置b以及位置c的示意图,超声波也属于一种声波,其具有声波的一些特征,例如速度在340m/s左右,例如超声波的频率与发生源有关,其不会因为反射对频率发生变化。参阅图3a,通过实验发现,当处于位置b时,其发射距离+反射距离之和最短,通过多次的实验分析,如果反射物与智能手机之间的距离不变,那么该反射物所在的位置位于超声波发射器与该超声波接收器连线的中心点位置时,发射距离+反射距离之和最短。如位置b的发射距离+发射距离之和最短,其体现在超声波的参数上,即发射时间与接收时间之差最少,如图3a所示,其与位置b越近,对应的发射时间与接收时间之差越接近最短时间差(即位置b的发射时间与接收时间之差),反之,对应的发射时间与接收时间之差与最短时间差越大,其与位置b越远,那么对于目标对象位置的确定可以通过其检测的平均位置来确定,对于声波的反射来说,其发射和反射的时间可以认为是相等的,依据这个假设我们即能够通过平均值的方式来确定该目标对象的距离。
距离=(n个接收时间-n个发射时间)/2n*s;其中s为音速,这里需要说明的是,采用音速比无线电波的距离检测要准确的多,因为音速的速度比无线电波的速度要低很多,这样对于接收时间的敏感度要求降低,因此提高了检测的精度。
可选的,上述方法还可以依据该多个发射时间、多个接收时间以及多个反射信号强度确定目标对象的移动方向,依据该移动方向调整播放资源的角度。
举例来说,参阅图3a,对于位置a,其对应的路径为L1,该路径L1分为La-1、La-2;对于位置c,其对应的路径为Lc,该路径Lc分为Lc-1、Lc-2;通过观察发现,其La-1的距离小于Lc-1,假设该超声波发射器位于图3a的左侧,那么对于La-1为发射路径,La-2为反射路径,对于位置c,其Lc-1为发射路径、Lc-2为反射路径,依据超声波反射的原理,反射的信号强度要远低于发射的信号强度,单位距离的衰减比例是相同的,那么对于位置a假设发射超声波的频率为fa,位置c假设发射超声波的频率为fc,其到位置a的路径La-1较小,那么超声波发射到位置a时的强度a大于位置c时的强度c,由于是同个反射物(目标对象),并且反射角度也基本不变,所以其反射衰减系数也是一致的,那么反射后的La-2的起始强度大于发射后的Lc-2的起始强度,虽然Lc-2的距离大于La-2的距离,但是由于起始强度的差别较大,所以频率fa的反射信号强度值要小于频率fc的反射信号强度值,基于这样的原理,就能够确定目标对象是向左或向右移动,例如,第一频率的信号强度值大于第二频率的信号强度值,那么即可以确定目标对象的移动方向是从左至右,反之,即从右至左。
为了更好的说明,下面通过参阅图3a来说明频率fa的反射信号强度值要小于频率fc的反射信号强度值的原因。
对于位置a以及位置c相对于位置b对称,所以对于,La-1+La-2=Lc-1+Lc-2;即,Lc-1-La-1=Lc-2-La-2;由于单位距离的衰减系数一致,所以对于Lc-1-La-1以及Lc-2-La-2的衰减的比例是一致的,那么决定Lc-1-La-1的衰减值大还是Lc-2-La-2的衰减值大基于初始的信号强度,对于超声波来说,Lc-1-La-1的初始信号强度肯定大于反射后的超声波初始信号强度,所以对于Lc-1-La-1衰减的信号强度值大,Lc-2-La-2衰减的信号强度值小,所以频率fa的反射信号强度值要小于频率fc的反射信号强度值。这样即能够确定是否相对于位置b发生偏移,并且能够依据该衰减的信号强度来确定偏移的距离,进而确定目标对象的距离。
参阅图4,图4提供了一种闹钟提醒的方法,该方法由如图1b所示的投影仪执行,该投影仪可以包括:超声波模块,该超声波模块可以包括:超声波接收器和超声波接收器,该方法如图4所示,包括如下步骤:
步骤S401、投影仪采集原始语音数据,将该原始语音数据采用Filter Bank特征提取算法得到Filter Bank特征;
步骤S402、投影仪将该Filter Bank特征输入特定人语音识别模型计算得到文本信息,依据该文本信息设置闹钟信息;
步骤S403、投影仪采集第一图片,对第一图片进行人脸识别得到第一身份,依据第一身份确定该闹钟时间对应的第一提醒类别;
步骤S404、投影仪的超声波发射器发射多个频率的超声波信号,多个频率的超声波信号中每个频率的超声波信号发射时间不同;
步骤S405、超声波接收器接收该多个频率的超声波信号的反射超声波信号;
步骤S406、获取该多个频率的超声波信号的多个发射时间以及反射超声波信号的多个接收时间,依据多个接收时间与多个发射时间的差值除以2倍的音速得到目标对象的距离;
步骤S407、投影仪依据该距离调整与该第一提醒类别的播放资源的尺寸,按该尺寸播放该资源。
本申请实施例提供的技术方案能够实现语音识别设置闹钟,然后依据超声波模块检测得到的距离来设置与该闹钟时间对应的提醒类别的播放资源的尺寸,从而能够更加的适应用户的感受,因此其具有用户体验度高的优点。
参阅图5,图5提供了一种闹钟提醒装置,应用于智能投影仪,所述装置包括:
采集单元501,用于采集原始语音数据;
处理单元502,用于将该原始语音数据提取得到原始特征信息;依据该原始特征信息识别得到所述原始特征信息对应的文本信息,依据所述文本信息设置闹钟信息,该闹钟信息包括:闹钟时间以及提醒类型;确定达到该闹钟时间时,按该提醒类型投影播放与该投影类型匹配的数据。
在一种可选实施例中,处理单元502,具体用于将所述原始语音数据通过FilterBank特征提取算法或MFCC算法提取得到原始特征信息。
在一种可选实施例中,处理单元502,具体用于对原始语音信息的背景噪声依据背景噪声估计去除原始语音信息的背景噪声后执行特征提取得到原始特征信息。
在一种可选实施例中,处理单元502,具体用于确定目标对象的第一身份,依据该第一身份与提醒类型的映射关系来确定该时间对应的第一类型,播放该第一类型对应的资源;
所述第一身份与提醒类型的映射关系的建立方式包括:
确定身份以后,提取当前播放资源的类型,建立该身份与该类型对应的映射关系
在一种可选实施例中,处理单元502,具体用于确定目标对象的距离,依据目标对象的距离获取投影仪的投影宽度,依据该投影宽度确定播放资源的尺寸,依据该尺寸播放该资源。
参阅图6,图6提供了一种智能投影仪,其特征在于,包括处理器、存储器,所述存储器用于存储一个或多个程序,并且被配置由所述处理器执行,所述程序包括如下步骤的指令。
该步骤的指令具体包括:投影仪采集原始语音数据,将该原始语音数据提取得到原始特征信息;投影仪依据该原始特征信息识别得到所述原始特征信息对应的文本信息,依据所述文本信息设置闹钟信息,该闹钟信息包括:闹钟时间以及提醒类型;投影仪确定达到该闹钟时间时,按该提醒类型投影播放与该投影类型匹配的数据。
在一种可选的实施例中,该步骤的指令具体包括:所述将该原始语音数据提取得到原始特征信息具体包括:
将所述原始语音数据通过Filter Bank特征提取算法或MFCC算法提取得到原始特征信息。
在一种可选的实施例中,该步骤的指令具体包括:所述按该提醒类型投影播放与该投影类型匹配的数据具体包括:
确定目标对象的第一身份,依据该第一身份与提醒类型的映射关系来确定该时间对应的第一类型,播放该第一类型对应的资源;
所述第一身份与提醒类型的映射关系的建立方式包括:
确定身份以后,提取当前播放资源的类型,建立该身份与该类型对应的映射关系。
在一种可选的实施例中,该步骤的指令具体包括:所述将该原始语音数据提取得到原始特征信息具体包括:
对原始语音信息的背景噪声依据背景噪声估计去除原始语音信息的背景噪声后执行特征提取得到原始特征信息。
在一种可选的实施例中,该步骤的指令具体包括:所述方法还包括:
确定目标对象的距离,依据目标对象的距离获取投影仪的投影宽度,依据该投影宽度确定播放资源的尺寸,依据该尺寸播放该资源。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括智能投影仪。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括智能投影仪。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种闹钟提醒方法,其特征在于,应用于智能投影仪,所述方法包括:
投影仪采集原始语音数据,将该原始语音数据提取得到原始特征信息;
投影仪依据该原始特征信息识别得到所述原始特征信息对应的文本信息,依据所述文本信息设置闹钟信息,该闹钟信息包括:闹钟时间以及提醒类型;
投影仪确定达到该闹钟时间时,按该提醒类型投影播放与该投影类型匹配的数据。
2.根据权利要求1所述的方法,其特征在于,所述将该原始语音数据提取得到原始特征信息具体包括:
将所述原始语音数据通过Filter Bank特征提取算法或MFCC算法提取得到原始特征信息。
3.根据权利要求1所述的方法,其特征在于,所述按该提醒类型投影播放与该投影类型匹配的数据具体包括:
确定目标对象的第一身份,依据该第一身份与提醒类型的映射关系来确定该时间对应的第一类型,播放该第一类型对应的资源;
所述第一身份与提醒类型的映射关系的建立方式包括:
确定身份以后,提取当前播放资源的类型,建立该身份与该类型对应的映射关系。
4.根据权利要求1所述的方法,其特征在于,所述将该原始语音数据提取得到原始特征信息具体包括:
对原始语音信息的背景噪声依据背景噪声估计去除原始语音信息的背景噪声后执行特征提取得到原始特征信息。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定目标对象的距离,依据目标对象的距离获取投影仪的投影宽度,依据该投影宽度确定播放资源的尺寸,依据该尺寸播放该资源。
6.一种闹钟提醒装置,其特征在于,应用于智能投影仪,所述装置包括:
采集单元,用于采集原始语音数据;
处理单元,用于将该原始语音数据提取得到原始特征信息;依据该原始特征信息识别得到所述原始特征信息对应的文本信息,依据所述文本信息设置闹钟信息,该闹钟信息包括:闹钟时间以及提醒类型;确定达到该闹钟时间时,按该提醒类型投影播放与该投影类型匹配的数据。
7.根据权利要求6所述的装置,其特征在于,
所述处理单元,具体用于将所述原始语音数据通过Filter Bank特征提取算法或MFCC算法提取得到原始特征信息。
8.根据权利要求6所述的装置,其特征在于,
所述处理单元,具体用于对原始语音信息的背景噪声依据背景噪声估计去除原始语音信息的背景噪声后执行特征提取得到原始特征信息。
9.一种智能投影仪,其特征在于,包括处理器、存储器,所述存储器用于存储一个或多个程序,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-5任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910936125.8A CN110782890A (zh) | 2019-09-29 | 2019-09-29 | 闹钟提醒方法、智能投影仪及相关产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910936125.8A CN110782890A (zh) | 2019-09-29 | 2019-09-29 | 闹钟提醒方法、智能投影仪及相关产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110782890A true CN110782890A (zh) | 2020-02-11 |
Family
ID=69385218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910936125.8A Pending CN110782890A (zh) | 2019-09-29 | 2019-09-29 | 闹钟提醒方法、智能投影仪及相关产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110782890A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112601061A (zh) * | 2020-12-15 | 2021-04-02 | 上海迪东实业有限公司 | 投影灯控制***及其控制方法、智能投影仪及存储介质 |
CN112671623A (zh) * | 2021-03-16 | 2021-04-16 | 深圳市火乐科技发展有限公司 | 基于投影的叫醒方法、装置、投影设备和计算机存储介质 |
CN112714299A (zh) * | 2021-03-26 | 2021-04-27 | 深圳市火乐科技发展有限公司 | 一种图像展示方法及装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101471794A (zh) * | 2007-12-28 | 2009-07-01 | 华为技术有限公司 | 接入设备、利用其播放语音的***及方法 |
CN202956580U (zh) * | 2012-12-03 | 2013-05-29 | 青岛科技大学 | 一种投影*** |
CN205334101U (zh) * | 2016-01-26 | 2016-06-22 | 北京进化者机器人科技有限公司 | 一种智能家居*** |
CN107272460A (zh) * | 2017-07-24 | 2017-10-20 | 李良文 | 基于云控制的智能机器人及其远程控制方法、存储介质 |
CN108469767A (zh) * | 2018-04-09 | 2018-08-31 | 深圳市火乐科技发展有限公司 | 一种智能投影仪的控制方法及*** |
CN108769372A (zh) * | 2018-04-24 | 2018-11-06 | 北京小米移动软件有限公司 | 控制投影仪播放的方法、装置、存储介质及投影仪 |
CN108806681A (zh) * | 2018-05-28 | 2018-11-13 | 江西午诺科技有限公司 | 语音控制方法、装置、可读存储介质及投影设备 |
CN108989894A (zh) * | 2018-08-28 | 2018-12-11 | 三星电子(中国)研发中心 | 用于播放电视节目的方法和装置 |
CN109976135A (zh) * | 2019-04-18 | 2019-07-05 | 杭州汉豆科技有限公司 | 一种可以精准叫醒的智能飞行闹钟 |
-
2019
- 2019-09-29 CN CN201910936125.8A patent/CN110782890A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101471794A (zh) * | 2007-12-28 | 2009-07-01 | 华为技术有限公司 | 接入设备、利用其播放语音的***及方法 |
CN202956580U (zh) * | 2012-12-03 | 2013-05-29 | 青岛科技大学 | 一种投影*** |
CN205334101U (zh) * | 2016-01-26 | 2016-06-22 | 北京进化者机器人科技有限公司 | 一种智能家居*** |
CN107272460A (zh) * | 2017-07-24 | 2017-10-20 | 李良文 | 基于云控制的智能机器人及其远程控制方法、存储介质 |
CN108469767A (zh) * | 2018-04-09 | 2018-08-31 | 深圳市火乐科技发展有限公司 | 一种智能投影仪的控制方法及*** |
CN108769372A (zh) * | 2018-04-24 | 2018-11-06 | 北京小米移动软件有限公司 | 控制投影仪播放的方法、装置、存储介质及投影仪 |
CN108806681A (zh) * | 2018-05-28 | 2018-11-13 | 江西午诺科技有限公司 | 语音控制方法、装置、可读存储介质及投影设备 |
CN108989894A (zh) * | 2018-08-28 | 2018-12-11 | 三星电子(中国)研发中心 | 用于播放电视节目的方法和装置 |
CN109976135A (zh) * | 2019-04-18 | 2019-07-05 | 杭州汉豆科技有限公司 | 一种可以精准叫醒的智能飞行闹钟 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112601061A (zh) * | 2020-12-15 | 2021-04-02 | 上海迪东实业有限公司 | 投影灯控制***及其控制方法、智能投影仪及存储介质 |
CN112671623A (zh) * | 2021-03-16 | 2021-04-16 | 深圳市火乐科技发展有限公司 | 基于投影的叫醒方法、装置、投影设备和计算机存储介质 |
CN112671623B (zh) * | 2021-03-16 | 2021-08-31 | 深圳市火乐科技发展有限公司 | 基于投影的叫醒方法、装置、投影设备和计算机存储介质 |
CN112714299A (zh) * | 2021-03-26 | 2021-04-27 | 深圳市火乐科技发展有限公司 | 一种图像展示方法及装置 |
CN112714299B (zh) * | 2021-03-26 | 2021-08-31 | 深圳市火乐科技发展有限公司 | 一种图像展示方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101981878B1 (ko) | 스피치의 방향에 기초한 전자 디바이스의 제어 | |
CN108615526B (zh) | 语音信号中关键词的检测方法、装置、终端及存储介质 | |
CN108899044B (zh) | 语音信号处理方法及装置 | |
CN110782890A (zh) | 闹钟提醒方法、智能投影仪及相关产品 | |
WO2019094515A1 (en) | Sound processing method and interactive device | |
CN110278383A (zh) | 聚焦方法、装置以及电子设备、存储介质 | |
CN107278301B (zh) | 一种辅助用户寻物的方法及装置 | |
US11482237B2 (en) | Method and terminal for reconstructing speech signal, and computer storage medium | |
EP3846020A1 (en) | Sound effect adjusting method and apparatus, electronic device, and storage medium | |
CN104412616A (zh) | 基于麦克风阵列中的声音的相关性的噪声抑制 | |
KR20150028067A (ko) | 전자 기기 및 전자 기기의 제어 방법 | |
CN106792341A (zh) | 一种音频输出方法、装置及终端设备 | |
EP3264130A1 (en) | Method and apparatus for screen state switching control | |
KR102633176B1 (ko) | 환경 잡음 보상 시스템에서 에러를 감소시키기 위한 방법 | |
CN102905155A (zh) | 控制和播放3d图像的方法和设备 | |
CN105554662A (zh) | 一种助听眼镜及助听方法 | |
CN111640431A (zh) | 一种设备响应处理方法及装置 | |
CN111462764A (zh) | 音频编码方法、装置、计算机可读存储介质及设备 | |
CN105323480A (zh) | 一种基于超声波的拍照方法及装置 | |
CN107404587B (zh) | 音频播放控制方法、音频播放控制装置及移动终端 | |
US20210337331A1 (en) | Method and device for detecting audio input module, and storage medium | |
CN110459236B (zh) | 音频信号的噪声估计方法、装置及存储介质 | |
CN105208283A (zh) | 一种声控拍照的方法及装置 | |
CN114910867A (zh) | 设备间的相对位置检测方法及装置 | |
CN208540142U (zh) | 音频*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200211 |