CN108181992A - 基于手势的语音唤醒方法、装置、设备及计算机可读介质 - Google Patents
基于手势的语音唤醒方法、装置、设备及计算机可读介质 Download PDFInfo
- Publication number
- CN108181992A CN108181992A CN201810061028.4A CN201810061028A CN108181992A CN 108181992 A CN108181992 A CN 108181992A CN 201810061028 A CN201810061028 A CN 201810061028A CN 108181992 A CN108181992 A CN 108181992A
- Authority
- CN
- China
- Prior art keywords
- gesture
- voice
- gestures
- images
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000002452 interceptive effect Effects 0.000 claims abstract description 26
- 238000010304 firing Methods 0.000 claims description 9
- 230000002618 waking effect Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 3
- 230000003993 interaction Effects 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 23
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/28—Recognition of hand or arm movements, e.g. recognition of deaf sign language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
- G06V40/113—Recognition of static hand signs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Social Psychology (AREA)
- Psychiatry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明提出一种基于手势的语音唤醒方法,包括以下步骤:采集用户的手势图像;判断用户的手势图像是否与预设图像相匹配;当用户的手势图像与预设图像相匹配时,唤醒语音交互功能。本发明实施例可以在不需要说出明确唤醒词的情况下唤起智能语音交互设备,使得语音唤醒更加智能,方便用户与语音设备的交互。
Description
技术领域
本发明涉及语音唤醒技术领域,尤其涉及一种基于手势的语音唤醒方法及装置、设备和计算机可读介质。
背景技术
随着语音识别的能力的增强,越来越多的智能设备也应用到了语音识别。目前的智能设备的语音交互基本使用的方式是基于语音唤醒词的语音交互。在进行语音功能唤醒的具体操作方式一般为采用固定的唤醒词,比如:小度小度,Alexa,等来唤醒语音交互设备。在由语音交互设备进行启动识别,然后再和用户进行语音交互。
然而,现有的语音唤醒的方式,每次在进行语音交互前都要说一遍唤醒词。重复的说唤醒词会给用户造成不好的体验。
发明内容
本发明实施例提供一种基于手势的语音唤醒方法、装置、设备及计算机可读介质,以解决或缓解现有技术中的以上技术问题。
第一方面,本发明实施例提供了一种基于手势的语音唤醒方法,包括以下步骤:
采集用户的手势图像;
判断用户的手势图像是否与预设图像相匹配;
当用户的手势图像与预设图像相匹配时,唤醒语音交互功能。
结合第一方面,本发明在第一方面的第一种实现方式中,所述预设图像为:伸出手指的图像。
结合第一方面,本发明在第一方面的第二种实现方式中,所述预设图像为:打响指的手势图像。
结合第一方面,本发明在第一方面的第三种实现方式中,还包括:
采集用户手势发出的响声;
判断用户的手势响声是否与预设响声相匹配;以及
所述当用户的手势图像与预设图像相匹配时,唤醒语音交互功能的步骤包括:
当用户的手势图像与预设图像相匹配且手势的响声与预设响声相匹配时,唤醒语音交互功能。
结合第一方面的第三种实现方式,本发明在第一方面的第四种实现方式中,所述预设手势图像为打响指的图像,所述预设响声为打响指的响声。
第二方面,本发明实施例提供了一种基于手势的语音唤醒装置,包括:
图像采集模块,用于采集用户的手势图像;
图像判断模块,用于判断用户的手势图像是否与预设图像相匹配;
唤醒模块,用于当用户的手势图像与预设图像相匹配时,唤醒语音交互功能。
结合第二方面,本发明在第二方面第一种实现方式中,所述预设图像为:伸出手指的图像。
结合第二方面,本发明在第二方面第二种实现方式中,所述预设图像为:打响指的手势图像。
结合第二方面,本发明在第二方面第三种实现方式中,还包括:
声音采集模块,用于采集用户的手势发出的响声;
声音判断模块,用于判断用户的手势响声是否与预设响声相匹配;以及
所述唤醒模块还用于当用户的手势图像与预设图像相匹配且手势响声与预设响声相匹配时,唤醒语音交互功能。
结合第二方面的第三种实现方式,本发明在第二方面的第四种实现方式中,所述预设手势图像为打响指的图像,所述预设响声为打响指的响声。
所述装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,基于手势的语音唤醒装置的结构中包括处理器和存储器,所述存储器用于存储支持基于手势的语音唤醒装置执行上述第一方面中基于手势的语音唤醒方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述基于手势的语音唤醒装置还可以包括通信接口,用于基于手势的语音唤醒装置与其他设备或通信网络通信。
第三方面,本发明实施例提供了一种计算机可读介质,用于存储基于手势的语音唤醒装置所用的计算机软件指令,其包括用于执行上述第一方面的基于手势的语音唤醒方法所涉及的程序。
上述技术方案中的一个技术方案具有如下优点或有益效果:本发明实施例可以在不需要说出明确唤醒词的情况下唤起智能语音交互设备,使得语音唤醒更加智能,方便用户与语音设备的交互。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1为实施例一的基于手势的语音唤醒方法的步骤流程图;
图2为实施例一的第一种预设图像的示意图;
图3为实施例一的第二种预设图像的示意图;
图4为实施例二的基于手势的语音唤醒方法的步骤流程图;
图5为实施例三的基于手势的语音唤醒装置的连接框图;
图6为实施例四的基于手势的语音唤醒装置的连接框图;
图7为实施例五的基于手势的语音唤醒设备连接框图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
本发明实施例旨在解决现有技术中进行语音唤醒时需要说一遍唤醒词的技术问题。本发明实施例主要通过采用手势进行语音唤醒,下面分别通过以下实施例进行技术方案的展开描述。
实施例一
请参阅图1,其为本发明实施例一的基于手势的语音唤醒方法的步骤流程图。本实施例一提供了一种基于手势的语音唤醒方法,包括以下步骤:
S110:采集用户的手势图像。
当用户需要针对某个智能设备启动语音交互功能时,可以在智能设备的摄像头上摆出特定的手势,通过摄像头实时采集用户的手势图像。
S120:判断用户的手势图像是否与预设图像相匹配。
根据接收到的用户的手势图像进行判断,可以跟预设图像进行比对,判断是否相匹配。需要说明的是,在本实施例中所述的相匹配的手势图像,并不需要完全一模一样,只需要做出相同的手势即可。例如,如图2所示,其为本实施例1中第一种预设图像的示意图。在本实施例1中预设的手势图像可以为伸出手指的图像。当采集的到的手势图像也为伸出手指的图像,并指向智能设备的位置,则可以判断为这采集到的手势图像与预设手势图像一致。
同样,预设手势图像可以调整为其他用户习惯的手势图像,如图3所示,其为本实施例1中第二种预设图像示意图。比如,可以将预设的手势图像设置为打响指的图像。另外,还可以同时预设多个手势图像。
S130:当用户的手势图像与预设图像相匹配时,唤醒语音交互功能。
当判断出的手势图像与预设图像相匹配,则对应唤醒语音交互功能。用户可以跟智能设备进行语音通话。当有多个预设图像时,只要有一个手势图像与预设图像相匹配时,则唤醒语音交互功能。
实施例二
与实施例一的区别在于:本实施例二不仅针对用户手势图像进比对,针对手势发出的声音进行比对,具体的方案如下:
如图4所示,其为本实施例二的基于手势的语音唤醒方法的步骤流程图。本实施例二的基于手势的语音唤醒方法包括以下步骤:
S210:采集用户的手势图像和手势发出的响声。
当用户需要对某个智能设备启动语音交互功能时,可以摆出特定手势,并且通过该特定手势发出对应的声音,由智能设备同时对手势图像和手势声音进行采集。在本实施例2中,用户摆出的手势可以为:打响指的图像,而该手势所发出的声音也就为打响指的声音。
S220:判断用户的手势图像是否与预设图像相匹配。
根据接收到的用户的手势图像进行判断,可以跟预设图像进行比对,判断是否相匹配。在本实施例中所述的相匹配的手势图像,并不需要完全一模一样,只需要做出相同的手势即可。
S230:判断用户的手势响声是否与预设响声相匹配。
在本步骤中,还针对手势响声进行匹配判断。而手势响声与手势图像是相对应的。比如,若预设的手势图像为打响指的图像,那么预设的手势响声为打响指的声音。
S240:当用户的手势图像与预设图像相匹配且手势的响声与预设响声相匹配时,唤醒语音交互功能。
在本实施例二中,还可以采用不同形式的手势,比如,可以采用拍手的方式等。
实施例三
本实施例三对应于实施例一,提供了一种基于手势的语音唤醒装置。请参阅图5,其为本实施例三的基于手势的语音唤醒装置的连接框图。
本实施例三的基于手势的语音唤醒装置,包括:
采集模块110,用于采集用户的手势图像。
图像判断模块120,用于判断用户的手势图像是否与预设图像相匹配。
其中,所述预设图像可以为伸出手指的图像,也可以为打响指的手势图像。或者也可以同时预设多个图像,比如可以包括伸出手指的图像和打响指的手势图像。
唤醒模块130,用于当用户的手势图像与预设图像相匹配时,唤醒语音交互功能。
本实施例三与实施例一的原理相同,故不再赘述。
实施例四
本实施例四与实施例二对应,提供了一种基于手势的语音唤醒装置,具体如下:
如图6所示,为本实施例四的基于手势的语音唤醒装置的连接框图。本发明实施例四提供了一种基于手势的语音唤醒装置,包括:
图像采集模块210,用于采集用户的手势图像。
声音采集模块220,用于采集用户手势发出的响声。例如,所述预设手势图像可以为打响指的图像,所述预设响声可以为打响指的响声。
图像判断模块230,用于判断用户的手势图像是否与预设图像相匹配。
声音判断模块240,用于判断用户的手势响声是否与预设响声相匹配。
唤醒模块250,用于当用户的手势图像与预设图像相匹配且手势响声与预设响声相匹配时,唤醒语音交互功能。
本实施例四的应用方式与原理与实施例二相同,故不再赘述。
实施例五
本发明实施例五提供一种基于手势的语音唤醒设备,如图7所示,该设备包括:存储器310和处理器320,存储器310内存储有可在处理器320上运行的计算机程序。所述处理器320执行所述计算机程序时实现上述实施例中的基于手势的语音唤醒方法。所述存储器310和处理器320的数量可以为一个或多个。
该设备还包括:
通信接口330,用于与外界设备进行通信,进行数据交互传输。
存储器310可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器310、处理器320和通信接口330独立实现,则存储器310、处理器320和通信接口330可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponent)总线或扩展工业标准体系结构(EISA,Extended Industry StandardComponent)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器310、处理器320及通信接口330集成在一块芯片上,则存储器310、处理器320及通信接口330可以通过内部接口完成相互间的通信。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。
本发明实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质的更具体的示例至少(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读存储介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
在本发明实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于指令执行***、输入法或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、射频(Radio Frequency,RF)等等,或者上述的任意合适的组合。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
综上所述,本发明实施例可以在不需要说出明确唤醒词的情况下唤起智能语音交互设备,使得语音唤醒更加智能,方便用户与语音设备的交互。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (12)
1.一种基于手势的语音唤醒方法,其特征在于,包括:
采集用户的手势图像;
判断用户的手势图像是否与预设图像相匹配;以及
当用户的手势图像与预设图像相匹配时,唤醒语音交互功能。
2.根据权利要求1所述基于手势的语音唤醒方法,其特征在于,所述预设图像为:伸出手指的图像。
3.根据权利要求1所述基于手势的语音唤醒方法,其特征在于,所述预设图像为:打响指的手势图像。
4.根据权利要求1所述基于手势的语音唤醒方法,其特征在于,还包括:
采集用户手势发出的响声;
判断用户的手势响声是否与预设响声相匹配;以及
所述当用户的手势图像与预设图像相匹配时,唤醒语音交互功能的步骤包括:
当用户的手势图像与预设图像相匹配且手势的响声与预设响声相匹配时,唤醒语音交互功能。
5.根据权利要求4所述基于手势的语音唤醒方法,其特征在于,所述预设手势图像为打响指的图像,所述预设响声为打响指的响声。
6.一种基于手势的语音唤醒装置,其特征在于,包括:
图像采集模块,用于采集用户的手势图像;
图像判断模块,用于判断用户的手势图像是否与预设图像相匹配;
唤醒模块,用于当用户的手势图像与预设图像相匹配时,唤醒语音交互功能。
7.根据权利要求6所述基于手势的语音唤醒装置,其特征在于,所述预设图像为:伸出手指的图像。
8.根据权利要求6所述基于手势的语音唤醒装置,其特征在于,所述预设图像为:打响指的手势图像。
9.根据权利要求6所述基于手势的语音唤醒装置,其特征在于,还包括:
声音采集模块,用于采集用户的手势发出的响声;
声音判断模块,用于判断用户的手势响声是否与预设响声相匹配;以及
所述唤醒模块还用于当用户的手势图像与预设图像相匹配且手势响声与预设响声相匹配时,唤醒语音交互功能。
10.根据权利要求9所述基于手势的语音唤醒装置,其特征在于,所述预设手势图像为打响指的图像,所述预设响声为打响指的响声。
11.一种基于手势的语音唤醒设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-5中任一所述的基于手势的语音唤醒方法。
12.一种计算机可读介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的基于手势的语音唤醒方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810061028.4A CN108181992A (zh) | 2018-01-22 | 2018-01-22 | 基于手势的语音唤醒方法、装置、设备及计算机可读介质 |
JP2018167825A JP6975696B2 (ja) | 2018-01-22 | 2018-09-07 | ジェスチャーによる音声ウェイクアップ方法、装置、設備及びコンピュータ可読媒体、プログラム |
US16/165,761 US10783364B2 (en) | 2018-01-22 | 2018-10-19 | Method, apparatus and device for waking up voice interaction function based on gesture, and computer readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810061028.4A CN108181992A (zh) | 2018-01-22 | 2018-01-22 | 基于手势的语音唤醒方法、装置、设备及计算机可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108181992A true CN108181992A (zh) | 2018-06-19 |
Family
ID=62551142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810061028.4A Pending CN108181992A (zh) | 2018-01-22 | 2018-01-22 | 基于手势的语音唤醒方法、装置、设备及计算机可读介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10783364B2 (zh) |
JP (1) | JP6975696B2 (zh) |
CN (1) | CN108181992A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108877808A (zh) * | 2018-07-24 | 2018-11-23 | 广东小天才科技有限公司 | 一种防误触的语音唤醒方法及家教设备 |
CN108965584A (zh) * | 2018-06-21 | 2018-12-07 | 北京百度网讯科技有限公司 | 一种语音信息的处理方法、装置、终端和存储介质 |
CN109819319A (zh) * | 2019-03-07 | 2019-05-28 | 重庆蓝岸通讯技术有限公司 | 一种录像记录关键帧的方法 |
CN109949812A (zh) * | 2019-04-26 | 2019-06-28 | 百度在线网络技术(北京)有限公司 | 一种语音交互方法、装置、设备及存储介质 |
CN111078297A (zh) * | 2018-10-18 | 2020-04-28 | 奇酷互联网络科技(深圳)有限公司 | 唤醒语音助手的方法、移动终端和计算机可读存储介质 |
WO2020087895A1 (zh) * | 2018-10-29 | 2020-05-07 | 华为技术有限公司 | 语音交互处理方法及装置 |
CN111341317A (zh) * | 2020-02-19 | 2020-06-26 | Oppo广东移动通信有限公司 | 唤醒音频数据的评价方法、装置、电子设备及介质 |
CN111368814A (zh) * | 2020-05-27 | 2020-07-03 | 支付宝(杭州)信息技术有限公司 | 一种身份识别方法及*** |
WO2020244410A1 (zh) * | 2019-06-03 | 2020-12-10 | 清华大学 | 基于捂嘴动作识别的语音交互唤醒电子设备、方法和介质 |
CN112750437A (zh) * | 2021-01-04 | 2021-05-04 | 欧普照明股份有限公司 | 控制方法、控制装置及电子设备 |
CN112764349A (zh) * | 2019-11-01 | 2021-05-07 | 佛山市云米电器科技有限公司 | 晾衣架控制方法、晾衣架、***及存储介质 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3907297A1 (en) | 2011-04-15 | 2021-11-10 | The Johns Hopkins University | Safe sequencing system |
CA2889937C (en) | 2012-10-29 | 2020-12-29 | The Johns Hopkins University | Papanicolaou test for ovarian and endometrial cancers |
US11286531B2 (en) | 2015-08-11 | 2022-03-29 | The Johns Hopkins University | Assaying ovarian cyst fluid |
CN112306358A (zh) * | 2019-08-23 | 2021-02-02 | 北京字节跳动网络技术有限公司 | 语音交互设备、交互语音设备控制方法、装置及存储介质 |
KR20210116838A (ko) * | 2020-03-17 | 2021-09-28 | 삼성전자주식회사 | 제스처에 기초하여, 음성 입력을 처리하는 전자 장치 및 그 동작 방법 |
CN111625094B (zh) * | 2020-05-25 | 2023-07-14 | 阿波罗智联(北京)科技有限公司 | 智能后视镜的交互方法、装置、电子设备和存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140059365A1 (en) * | 2012-08-27 | 2014-02-27 | Samsung Electronics Co., Ltd. | Ultra low power apparatus and method to wake up a main processor |
CN104423551A (zh) * | 2013-09-02 | 2015-03-18 | 联想(北京)有限公司 | 一种电子设备及手势识别方法 |
CN104834222A (zh) * | 2015-04-30 | 2015-08-12 | 广东美的制冷设备有限公司 | 家用电器的控制方法和装置 |
CN105120058A (zh) * | 2015-07-02 | 2015-12-02 | 上海闻泰电子科技有限公司 | 基于光感的手机手势识别*** |
US20160011851A1 (en) * | 2013-03-21 | 2016-01-14 | Huawei Technologies Co.,Ltd. | Sound signal processing method and device |
CN105501121A (zh) * | 2016-01-08 | 2016-04-20 | 北京乐驾科技有限公司 | 一种智能唤醒方法及*** |
CN105527710A (zh) * | 2016-01-08 | 2016-04-27 | 北京乐驾科技有限公司 | 一种智能抬头显示*** |
CN105700372A (zh) * | 2016-03-11 | 2016-06-22 | 珠海格力电器股份有限公司 | 智能设备及其控制方法 |
CN106933369A (zh) * | 2017-03-30 | 2017-07-07 | 北京集创北方科技股份有限公司 | 一种触摸显示控制装置和触摸显示控制方法 |
JP2017207891A (ja) * | 2016-05-18 | 2017-11-24 | ソニーモバイルコミュニケーションズ株式会社 | 情報処理装置、情報処理システム、情報処理方法 |
CN107517313A (zh) * | 2017-08-22 | 2017-12-26 | 珠海市魅族科技有限公司 | 唤醒方法及装置、终端及可读存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2641470B2 (ja) | 1987-12-28 | 1997-08-13 | アイシン・エィ・ダブリュ株式会社 | ナビゲーション装置 |
JPH1173297A (ja) * | 1997-08-29 | 1999-03-16 | Hitachi Ltd | 音声とジェスチャによるマルチモーダル表現の時間的関係を用いた認識方法 |
JP2011232637A (ja) * | 2010-04-28 | 2011-11-17 | Honda Motor Co Ltd | 車両の制御装置 |
US8854433B1 (en) * | 2012-02-03 | 2014-10-07 | Aquifi, Inc. | Method and system enabling natural user interface gestures with an electronic system |
US9081571B2 (en) * | 2012-11-29 | 2015-07-14 | Amazon Technologies, Inc. | Gesture detection management for an electronic device |
JP2016052721A (ja) | 2014-09-02 | 2016-04-14 | 株式会社フットテクノ | 複合ファブリック3次元構造体 |
CN105881548B (zh) | 2016-04-29 | 2018-07-20 | 北京快乐智慧科技有限责任公司 | 唤醒智能交互机器人的方法及智能交互机器人 |
-
2018
- 2018-01-22 CN CN201810061028.4A patent/CN108181992A/zh active Pending
- 2018-09-07 JP JP2018167825A patent/JP6975696B2/ja active Active
- 2018-10-19 US US16/165,761 patent/US10783364B2/en active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140059365A1 (en) * | 2012-08-27 | 2014-02-27 | Samsung Electronics Co., Ltd. | Ultra low power apparatus and method to wake up a main processor |
US20160011851A1 (en) * | 2013-03-21 | 2016-01-14 | Huawei Technologies Co.,Ltd. | Sound signal processing method and device |
CN104423551A (zh) * | 2013-09-02 | 2015-03-18 | 联想(北京)有限公司 | 一种电子设备及手势识别方法 |
CN104834222A (zh) * | 2015-04-30 | 2015-08-12 | 广东美的制冷设备有限公司 | 家用电器的控制方法和装置 |
CN105120058A (zh) * | 2015-07-02 | 2015-12-02 | 上海闻泰电子科技有限公司 | 基于光感的手机手势识别*** |
CN105501121A (zh) * | 2016-01-08 | 2016-04-20 | 北京乐驾科技有限公司 | 一种智能唤醒方法及*** |
CN105527710A (zh) * | 2016-01-08 | 2016-04-27 | 北京乐驾科技有限公司 | 一种智能抬头显示*** |
CN105700372A (zh) * | 2016-03-11 | 2016-06-22 | 珠海格力电器股份有限公司 | 智能设备及其控制方法 |
JP2017207891A (ja) * | 2016-05-18 | 2017-11-24 | ソニーモバイルコミュニケーションズ株式会社 | 情報処理装置、情報処理システム、情報処理方法 |
CN106933369A (zh) * | 2017-03-30 | 2017-07-07 | 北京集创北方科技股份有限公司 | 一种触摸显示控制装置和触摸显示控制方法 |
CN107517313A (zh) * | 2017-08-22 | 2017-12-26 | 珠海市魅族科技有限公司 | 唤醒方法及装置、终端及可读存储介质 |
Non-Patent Citations (2)
Title |
---|
杨磊: "《数字媒体技术概论》", 30 September 2017, 北京:中国铁道出版社 * |
田景熙: "《物联网概论》", 31 July 2017, 南京:东南大学出版社 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108965584A (zh) * | 2018-06-21 | 2018-12-07 | 北京百度网讯科技有限公司 | 一种语音信息的处理方法、装置、终端和存储介质 |
CN108877808A (zh) * | 2018-07-24 | 2018-11-23 | 广东小天才科技有限公司 | 一种防误触的语音唤醒方法及家教设备 |
CN111078297A (zh) * | 2018-10-18 | 2020-04-28 | 奇酷互联网络科技(深圳)有限公司 | 唤醒语音助手的方法、移动终端和计算机可读存储介质 |
WO2020087895A1 (zh) * | 2018-10-29 | 2020-05-07 | 华为技术有限公司 | 语音交互处理方法及装置 |
US11620995B2 (en) | 2018-10-29 | 2023-04-04 | Huawei Technologies Co., Ltd. | Voice interaction processing method and apparatus |
CN109819319A (zh) * | 2019-03-07 | 2019-05-28 | 重庆蓝岸通讯技术有限公司 | 一种录像记录关键帧的方法 |
CN109949812A (zh) * | 2019-04-26 | 2019-06-28 | 百度在线网络技术(北京)有限公司 | 一种语音交互方法、装置、设备及存储介质 |
WO2020244410A1 (zh) * | 2019-06-03 | 2020-12-10 | 清华大学 | 基于捂嘴动作识别的语音交互唤醒电子设备、方法和介质 |
CN112764349A (zh) * | 2019-11-01 | 2021-05-07 | 佛山市云米电器科技有限公司 | 晾衣架控制方法、晾衣架、***及存储介质 |
CN111341317A (zh) * | 2020-02-19 | 2020-06-26 | Oppo广东移动通信有限公司 | 唤醒音频数据的评价方法、装置、电子设备及介质 |
CN111341317B (zh) * | 2020-02-19 | 2023-09-01 | Oppo广东移动通信有限公司 | 唤醒音频数据的评价方法、装置、电子设备及介质 |
CN111368814A (zh) * | 2020-05-27 | 2020-07-03 | 支付宝(杭州)信息技术有限公司 | 一种身份识别方法及*** |
CN112750437A (zh) * | 2021-01-04 | 2021-05-04 | 欧普照明股份有限公司 | 控制方法、控制装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
US10783364B2 (en) | 2020-09-22 |
JP2019128939A (ja) | 2019-08-01 |
US20190228217A1 (en) | 2019-07-25 |
JP6975696B2 (ja) | 2021-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108181992A (zh) | 基于手势的语音唤醒方法、装置、设备及计算机可读介质 | |
CN108154140A (zh) | 基于唇语的语音唤醒方法、装置、设备及计算机可读介质 | |
CN107680589A (zh) | 语音信息交互方法、装置及其设备 | |
CN108965981B (zh) | 视频播放方法、装置、存储介质及电子设备 | |
US20210027513A1 (en) | Electronic device for providing avatar and operating method thereof | |
CN111782332A (zh) | 应用界面切换方法、装置、终端及存储介质 | |
CN108664475A (zh) | 翻译显示方法、装置、移动终端及存储介质 | |
CN110830368B (zh) | 即时通讯消息发送方法及电子设备 | |
CN111367407B (zh) | 智能眼镜交互方法、智能眼镜交互装置及智能眼镜 | |
CN109165292A (zh) | 数据处理方法、装置以及移动终端 | |
CN109147764A (zh) | 语音交互方法、装置、设备及计算机可读介质 | |
CN108932102A (zh) | 数据处理方法、装置以及移动终端 | |
CN109246474B (zh) | 一种视频文件编辑方法及移动终端 | |
CN109582882A (zh) | 搜索结果的展现方法、装置和电子设备 | |
CN109032491A (zh) | 数据处理方法、装置以及移动终端 | |
CN107291772A (zh) | 一种搜索访问方法、装置及电子设备 | |
CN113971048A (zh) | 应用程序的启动方法及装置、存储介质及电子设备 | |
CN111080747B (zh) | 一种人脸图像处理方法及电子设备 | |
CN108763350A (zh) | 文本数据处理方法、装置、存储介质及终端 | |
CN110554766A (zh) | 交互方法及车载交互装置 | |
CN109753202B (zh) | 一种截屏方法和移动终端 | |
CN111597009B (zh) | 应用程序显示的方法、装置及终端设备 | |
CN109949812A (zh) | 一种语音交互方法、装置、设备及存储介质 | |
CN114296853A (zh) | 动态桌面的控制方法及装置、存储介质、电子装置 | |
CN109034808B (zh) | 一种支付类应用程序的运行方法、运行装置及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180619 |