CN106502649A - 一种机器人服务唤醒方法及装置 - Google Patents
一种机器人服务唤醒方法及装置 Download PDFInfo
- Publication number
- CN106502649A CN106502649A CN201610857595.1A CN201610857595A CN106502649A CN 106502649 A CN106502649 A CN 106502649A CN 201610857595 A CN201610857595 A CN 201610857595A CN 106502649 A CN106502649 A CN 106502649A
- Authority
- CN
- China
- Prior art keywords
- wake
- information
- robot
- interactive voice
- voice information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/4401—Bootstrapping
- G06F9/4418—Suspend and resume; Hibernate and awake
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Toys (AREA)
Abstract
一种机器人服务的唤醒方法及装置,其中,该方法包括:语音交互信息获取步骤,获取用户输入的语音交互信息;语音交互信息解析步骤,对语音交互信息进行解析,得到服务唤醒信息和声纹特征信息;机器人服务唤醒步骤,判断服务唤醒信息是否指示机器人服务唤醒,如果是,则进一步判断声纹特征信息与预设声纹特征集合是否匹配,如果匹配,则唤醒机器人服务。该方法能够在用户不方面进行手动操作的情况下解放用户双手,同时,该方法还能够实现机器人服务的远程唤醒。相较于现有的机器人服务唤醒方法,本方法能够使得机器人服务的唤醒过程更加高效和便捷。
Description
技术领域
本发明涉及机器人技术领域,具体地说,涉及一种机器人服务唤醒方法及装置。
背景技术
随着智能设备的普及,人们对智能设备的使用频率越来越频繁,这些设备的功耗也越来越大,这也就导致智能设备的待机时长越来越短。
所有新生的智能设备,以及过去的智能手机以及电脑等设备,都是以电池作为能量来源的。这些或设备的耗电量越小,其待机时间也就越长。但与之相悖的是,设备的性能运转越强,其耗电量越大,同时设备的使用频率也会使得设备的耗电量越来越大。因此为了延长设备的使用时长,当用户不使用智能设备时,设备中的相关服务会停止/停用/暂停,这样也就可以有效的保存电量。
然而,当智能设备中的服务处于停止/停用/暂停状态时,如果用户重新启用(即唤醒)该服务,现有技术所采用的方法往往需要用户重新手动输入启动指令来实现服务的重启,这显然不利用该服务的高效使用。
发明内容
为解决上述问题,本发明提供了一种机器人服务的唤醒方法,其包括:
语音交互信息获取步骤,获取用户输入的语音交互信息;
语音交互信息解析步骤,对所述语音交互信息进行解析,得到服务唤醒信息和声纹特征信息;
机器人服务唤醒步骤,判断所述服务唤醒信息是否指示机器人服务唤醒,如果是,则进一步判断所述声纹特征信息与预设声纹特征集合是否匹配,如果匹配,则唤醒机器人服务。
根据本发明的一个实施例,在所述语音交互信息解析步骤中,利用本地自动语音识别引擎和/或云端自动语音识别引擎,以及本地声纹识别引擎和/或云端声纹识别引擎,对所述语音交互信息进行解析,得到所述服务唤醒信息和声纹特征信息。
根据本发明的一个实施例,在所述语音交互信息解析步骤中,通过对所述语音交互信息进行解析,得到用户输入的唤醒词;
在所述机器人服务唤醒步骤中,判断用户输入的唤醒词是否包含在预设唤醒词集合中,如果是,则判定该唤醒词指示机器人服务唤醒。
根据本发明的一个实施例,在所述语音交互信息解析步骤中,通过对所述语音交互信息进行解析,得到用户意图信息;
在所述机器人服务唤醒步骤中,将所述用户意图信息与预设唤醒意图数据进行匹配,如果匹配成功,则判定该意图信息指示机器人服务唤醒。
根据本发明的一个实施例,
在所述语音交互信息解析步骤中,通过对所述语音交互信息进行解析,得到用户输入的唤醒词;
在所述机器人服务唤醒步骤中,判断用户输入的唤醒词是否包含在预设唤醒词集合中,如果否,则重新执行所述语义交互信息解析步骤来对所述语音交互信息进行解析,得到用户意图信息;
在所述机器人服务唤醒步骤中,将所述用户意图信息与预设唤醒意图数据进行匹配,如果匹配成功,则判定所述用户意图信息指示机器人服务唤醒。
根据本发明的一个实施例,所述机器人服务包括以下所列项中的任一项或或几项:
机器人操作***的中枢服务、机器人应用、机器人实现功能和机器人交互界面。
本发明还提供了一种机器人服务的唤醒装置,其包括:
语音交互信息获取模块,其用于获取用户输入的语音交互信息;
语音交互信息解析模块,其用于对所述语音交互信息进行解析,得到服务唤醒信息和声纹特征信息;
机器人服务唤醒模块,其用于判断所述服务唤醒信息是否指示机器人服务唤醒,如果是,则进一步判断所述声纹特征信息与预设声纹特征集合是否匹配,如果匹配,则唤醒机器人服务。
根据本发明的一个实施例,所述语音交互信息解析模块配置为利用本地自动语音识别引擎和/或云端自动语音识别引擎,以及本地声纹识别引擎和/或云端声纹识别引擎,对所述语音交互信息进行解析,得到所述服务唤醒信息和声纹特征信息。
根据本发明的一个实施例,所述语音交互信息解析模块配置为通过对所述语音交互信息进行解析,得到用户输入的唤醒词;
所述机器人服务唤醒模块配置为判断用户输入的唤醒词是否包含在预设唤醒词集合中,如果是,则判定该唤醒词指示机器人服务唤醒。
根据本发明的一个实施例,所述语音交互信息解析模块配置为通过对所述语音交互信息进行解析,得到用户意图信息;
所述机器人服务唤醒模块配置为将所述用户意图信息与预设唤醒意图数据进行匹配,如果匹配成功,则判定该意图信息指示机器人服务唤醒。
根据本发明的一个实施例,
所述语音交互信息解析模块配置为通过对所述语音交互信息进行解析,得到用户输入的唤醒词,并将所述唤醒词传输至所述机器人服务唤醒模块;
所述机器人服务唤醒模块配置为判断用户输入的唤醒词是否包含在预设唤醒词集合中,如果否,所述语音交互信息解析模块则重新对所述语音交互信息进行解析,得到用户意图信息,并将所述用户意图信息传输至所述机器人服务唤醒模块;
所述机器人服务唤醒模块配置为将所述用户意图信息与预设唤醒意图数据进行匹配,如果匹配成功,则判定所述用户意图信息指示机器人服务唤醒。
根据本发明的一个实施例,所述机器人服务包括以下所列项中的任一项或或几项:
机器人操作***的中枢服务、机器人应用、机器人实现功能和机器人交互界面。
本发明所提供的机器人服务唤醒方法通过语音来唤醒处于停用状态的相关机器人服务,这种机器人服务唤醒方式能够在用户不方面进行手动操作的情况下解放用户双手,同时,该方法还能够实现机器人服务的远程唤醒。相较于现有的机器人服务唤醒方法,本方法能够使得机器人服务的唤醒过程更加高效和便捷。
同时,随着人们对于自身隐私的重视以及自身安全意识的提高,越来越多的人们开始希望自己的智能设备不被不相干的人进行某些操作。针对该问题,本发明所提供的方法利用声纹特征信息来确定用户的身份信息,从而保证了唤醒过程的安全性。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要的附图做简单的介绍:
图1是根据本发明一个实施例的机器人服务唤醒方法的实现流程图;
图2是根据本发明另一个实施例的机器人服务唤醒方法的实现流程图;
图3是根据本发明一个实施例的机器人服务唤醒装置的结构示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
同时,在以下说明中,出于解释的目的而阐述了许多具体细节,以提供对本发明实施例的彻底理解。然而,对本领域的技术人员来说显而易见的是,本发明可以不用这里的具体细节或者所描述的特定方式来实施。
另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
实施例一:
图1示出了本实施例所提供的机器人服务的唤醒方法的实现流程图。
如图1所示,本实施例所提供的机器人服务的唤醒方法首先在步骤S101中获取用户输入的语音交互信息。具体地,本实施例中,该方法在步骤S101中优选地通过语音采集装置(例如麦克风)来获取用户输入的语音交互信息。
得到语音交互信息后,该方法将在步骤S102中对步骤S101中所获取到的语音交互信息进行解析,从而得到服务唤醒信息。具体地,本实施例中,该方法在步骤S102中利用本地自动语音识别引擎来和本地声纹识别引擎,来对步骤S101中所获取到的语音交互信息进行解析,从而分别得到服务唤醒信息和声纹特征信息。
声纹识别属于生物识别技术中的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。与语音识别不同的是,声纹识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性;而语音识别的目的是识别出语音信号中的言语内容,并不考虑说话人是谁,它强调共性。
本实施例中,本地声纹识别引擎在对步骤S101中所获取到的语音交互信息进行解析时,优选地提取中语音信息中所包含的基音轮廓、共振峰频率带宽及其轨迹来作为声纹特征信息。这类特征是基于发生器官(例如声门、声道和鼻腔)的生理结构而提取的参数。
需要指出的是,在本发明的其它实施例中,该方法所使用的本地声纹识别引擎还可以采用其他合理方式来从语音交互信息中提取中相应的声纹特征,本发明不限于此。
例如,在本发明的一个实施例中,该方法所使用的本地声纹识别引擎还可以从语音交互信息中提取谱包络参数来作为声纹特征信息;在本发明的一个实施例中,该方法所使用的本地声纹识别引擎还可以利用线性预测系数来从语音交互信息中提取相应的声纹特征信息,具体地,由于线性预测与声道参数模型是相符合的,因此该声纹识别引擎可以以线性预测导出的各类参数(例如线性预测系数、自相关系数、发射系数、对数面积、线性预测残差及其组合等参数)来作为声纹识别特征;在本发明的一个实施例中,该方法所使用的本地声纹识别引擎还可以从所获取到的语音交互信息中提取能够反映听觉特性的参数(例如美倒谱系数或感知线性预测参数等)来作为声纹特征信息。
同时,还需要指出的是,在本发明的其他实施例中,该方法在步骤S102中既可以采用云端自动语音识别引擎和云端声纹识别引擎来对步骤S101中所获取到的语音交互信息进行解析而对应得到服务唤醒信息和声纹特征信息,也可以采用以上所列自动语音识别引擎的某一种或两种来对上述语音交互信息进行解析来得到服务唤醒信息,并利用以上所列声纹识别引擎的某一种或两种的组合来对上述语音信息进行解析来得到声纹特征信息,本发明同样不限于此。
如图1所示,本实施例中,在得到服务唤醒信息和声纹特征信息后,该方法会在步骤S103中判断步骤S102中所得到的服务唤醒信息是否指示机器人服务唤醒。
由于服务唤醒信息是由自动语音识别引擎对语音交互信息解析得到的,因此该服务唤醒信息中包含了表征用户是否期望进行机器人服务唤醒的相关信息,该方法根据该信息也就可以判断服务唤醒信息是否知识机器人服务唤醒,即当前是否需要进行机器人服务唤醒。
如果该方法在步骤S103中判定步骤S102中所得到的服务唤醒信息指示机器人服务唤醒,那么该方法则会在步骤S104中进一步判断步骤S102中所得到的声纹特征信息与预设声纹特征集合是否匹配。如果该方法在步骤S103中判定步骤S102中所得到的服务唤醒信息不指示机器人服务唤醒,那么则表示当前用户并不希望唤醒机器人服务,因此该方法也就会在步骤S106中保持该机器人服务的当前状态,即继续停用/暂停/停止该机器人服务。
在步骤S104中,该方法会将步骤S102中所得到的声纹特征信息与预设声纹特征集合进行匹配。如果二者能够匹配(例如步骤S102中所得到的声纹特征信息包含在因素和声纹特征集合中),那么则表示当前用户是机器人服务的有效用户,因此该方法会在步骤S105中唤醒机器人服务;而如果步骤S102中所得到的声纹特征信息与预设声纹集合不匹配,那么则表示当前用户不是机器人服务的有效用户,该用户不具备使用机器人服务的权限,因此该方法也就会在步骤S106中保持该机器人服务的当前状态,即继续停用/暂停/停止该机器人服务。
需要指出的是,本发明所指代的机器人服务既可以指代机器人操作***的中枢服务,也可以指代机器人应用,还可以指代机器人实现功能和/或机器人交互界面,本发明不限于此。
同时,还需要指出的是,在本发明的其他实施例中,该方法还可以通过对语音交互信息进行解析,确定出待唤醒的机器人服务。例如,当通过对语音交互信息进行解析而得到诸如“拍摄”的词语时,该方法将会判断出此时的待唤醒机器人服务为极大可能是摄像服务。
实施例二:
图2示出了本所提供的机器人服务的唤醒方法的实现流程图。
如图2所示,本实施例所提供的方法首先在步骤S201中获取用户输入的语音交互信息。其中,本实施例中,步骤S201的实现原理以及实现过程与上述实施例一中步骤S101所涉及的内容相同,故在此不再对步骤S201进行赘述。
在得到语音交互信息后,该方法会在步骤S202中对步骤S201中所获取到的语音交互信息进行解析,从而得到用户输入的唤醒词和声纹特征信息。具体地,本实施例中,该方法优选地在步骤S202中利用本地自动语音识别引擎来对步骤S201中采集到的语音交互信息进行解析,从而得到上述语音交互信息中所包含的唤醒词。需要指出的是,本实施例所提及的唤醒词不仅指代预存唤醒词,还可以指代包含了唤醒词的短语/短句、能够使令机器人进行唤醒的指令词、表征唤醒的意图语句等。
具体地,本实施例中,该方法在步骤S202中首先利用本地自动语音识别引擎对语音交互信息进行识别,得到该语音交互信息所对应的文本信息,随后根据该文本信息来提取出相应的唤醒词。
在步骤S202中,该方法优选地利用本地声纹识别引擎来对上述语音交互信息进行解析,从而得到用户的声纹特征信息。需要指出的是,该方法利用本地声纹识别引擎对语音交互信息进行解析得到用户的声纹特征信息的具体实现原理以及实现过程与实施例一中步骤S102所涉及的内容类似,故在此不再赘述。
同时,还需要指出的是,在本发明的其他实施例中,该方法在步骤S202中既可以采用云端自动语音识别引擎和云端声纹识别引擎来对步骤S201中所获取到的语音交互信息进行解析而对应得到服务唤醒信息和声纹特征信息,也可以采用以上所列自动语音识别引擎的某一种或两种来对上述语音交互信息进行解析来得到服务唤醒信息,并利用以上所列声纹识别引擎的某一种或两种的组合来对上述语音信息进行解析来得到声纹特征信息,本发明同样不限于此。
在得到用户输入的唤醒词后,该方法将在步骤S203中判断步骤S202中所得到的唤醒词是否包含在预设唤醒词集合中。具体地,预设唤醒词集合中包含了多个能够表征用户期望进行机器人服务唤醒的词语或语句(例如,“打开”、“启动”或“重启”)等。需要指出的是,在本发明的不同实施例中,上述预设唤醒词集合既可以是有相关生产厂商在出厂前进行设定,也可以由用户在日常交互过程中进行设定,本发明不限于此。
本实施例中,该方法在步骤S203中判断步骤S202中所得到的唤醒词与预设唤醒词集合是否匹配时,唤醒词与预设唤醒词集合匹配成功并不只能是预设唤醒词集合中包含与步骤S202中所得到的唤醒词完全相同的词语,还可以是预设唤醒词集合中包含与步骤S202中所得到的唤醒词在语义上相同或相近的词语。这种方式可以有效提高本方法的适用度,从而使得对机器人服务的唤醒过程更加人性化和个性化。
例如通过对用户输入的语音交互信息进行解析得到了唤醒词“醒醒”,而如果预设唤醒指令集合中并未包含该词,而是包含了诸如“别睡了”的词语,那么由于二者的语义相同,因此该方法也就可以以此判断出该唤醒词与预设唤醒词集合能够成功匹配。
如果步骤S202中所得到的唤醒词包含在预设唤醒词集合中,那么则表示当前用户希望唤醒相关机器人服务,因此此时该方法将执行步骤S206以进一步判断步骤S202中所得到的声纹特征信息与预设声纹特征集合是否匹配;而如果步骤S202中所得到的唤醒词不包含在预设唤醒词集合中,那么该方法则会在步骤S204中重新利用本地自动语音识别引擎来对步骤S201所得到的语音交互信息进行解析,来得到用户意图信息。
在日常交互过程中,交互语音信息中很可能并不包含相关的唤醒词,但该交互语音信息仍然表示用户期望进行机器人服务唤醒。例如,对于用户所输入的语音交互信息“天亮了,该起床了”,该方法在步骤S204中通过对该语音交互信息进行解析,仍可以得到当前的用户意图信息为“唤醒机器人服务”。
在得到用户意图信息后,如图2所示,本实施例所提供的方法将在步骤S205中将步骤S204中所得到的用户意图信息与预设唤醒意图数据进行匹配,并判断二者是否能够匹配成功。
如果步骤S204中所得到的用户意图信息与预设唤醒意图数据能够匹配成功,那么该方法则将执行步骤S206以进一步判断步骤S202中所得到的声纹特征信息与预设声纹特征集合是否匹配;而如果步骤S204中所得到的用户意图信息与预设唤醒意图数据无法匹配成功,那么则表示用户并不希望进行机器人服务唤醒,因此此时该方法将执行步骤S208以保持机器人服务的当前状态,即继续停用/暂停/停止该机器人服务。
在步骤S206中,该方法将判断所得到的声纹特征信息与预设声纹集合是否匹配。如果如果二者能够匹配(例如步骤S202中所得到的声纹特征信息包含在因素和声纹特征集合中),那么则表示当前用户是机器人服务的有效用户,因此该方法会在步骤S207中唤醒机器人服务;而如果步骤S202中所得到的声纹特征信息与预设声纹集合不匹配,那么则表示当前用户不是机器人服务的有效用户,该用户不具备使用机器人服务的权限,因此该方法也就会在步骤S208中保持该机器人服务的当前状态,即继续停用/暂停/停止该机器人服务。
需要指出的是,在本发明的其他实施例中,该方法还可以仅根据唤醒词或仅根据用户意图信息来判断当前是否需要进行机器人服务唤醒,即判断用户是否希望进行机器人服务唤醒,本发明不限于此。
同时,还需要指出的是,本发明所指代的机器人服务既可以指代机器人操作***的中枢服务,也可以指代机器人应用,还可以指代机器人实现功能和/或机器人交互界面,本发明同样不限于此。
随着智能设备在人们生活中的普及,出现了很多用户不方便手动输入指令来唤醒机器人服务以及需要远程唤醒机器人服务的场景。例如,当用户在开车过程中需要操作汽车导航功能时,在汽车行驶过程中双手离开方向盘再去手动电极操作屏是十分危险的。并且,在某些情况下,智能设备设置没有配备屏幕、键盘或是鼠标等输入硬件,在此情况下,传统的操作方式显然无法实施。
本发明所提供的机器人服务唤醒方法通过语音来唤醒处于停用状态的相关机器人服务,这种机器人服务唤醒方式能够在用户不方面进行手动操作的情况下解放用户双手,同时,该方法还能够实现机器人服务的远程唤醒。相较于现有的机器人服务唤醒方法,本方法能够使得机器人服务的唤醒过程更加高效和便捷。
同时,随着人们对于自身隐私的重视以及自身安全意识的提高,越来越多的人们开始希望自己的智能设备不被不相干的人进行某些操作。例针对该问题,本发明所提供的方法利用声纹特征信息来确定用户的身份信息,从而保证了唤醒过程的安全性。
本实施例还提供了一种机器人服务唤醒装置,图3输出了该装置的结构示意图。
如图3所示,本实施例所提供的机器人服务唤醒装置优选地包括:语音交互信息获取模块301、语音交互信息解析模块302以及机器人服务唤醒模块303。其中,语音交互信息获取模块301用户获取用户输入的语音交互信息。具体地,本实施例中,语音交互信息获取模块301优选地可以采用语音采集装置(例如麦克风)来实现。
在得到用户输入的语音交互信息后,语音交互信息获取模块301会将该语音交互信息传输至语音交互信息解析模块302,以由语音交互信息解析模块302来对该交互信息进行解析从而得到服务唤醒信息和声纹特征信息。
语音交互信息解析模块302包括自动语音识别引擎和声纹识别引擎。其中,自动语音识别引擎能够对上述语音交互信息进行解析而得到服务唤醒信息,而声纹识别引擎则能够对上述语音交互信息进行解析而得到用户的声纹特征信息。
需要指出的是,在本发明的不同实施例中,上述自动语音识别引擎既可以采用本地自动语音识别引擎来实现,也可以采用云端自动语音识别引擎来实现,还可以采用本地自动语音识别引擎和云端自动语音识别引擎共同实现,本发明不限于此。同时,在本发明的不同实施例中,上述声纹识别引擎既可以采用本地声纹识别引擎来实现,也可以采用云端声纹识别引擎来实现,还可以采用本地声纹识别引擎和云端声纹识别引擎共同实现,本发明同样不限于此。
本实施例中,语音交互信息解析模块302在得到服务唤醒信息和声纹特征信息后,会将该服务唤醒信息和声纹特征信息传输至机器人服务唤醒模块303。机器人服务唤醒模块303在接收到上述服务唤醒信息和声纹特征信息后,首先会判断上述服务唤醒信息是否指示机器人服务唤醒,如果是,则进一步判断上述声纹特征信息与预设声纹特征集合是否匹配。如果上述声纹特征信息与预设声纹特征集合匹配,那么机器人服务唤醒模块303则唤醒相关机器人服务,否则则保持机器人服务的当前状态。
其中,本实施例中,语音交互信息解析模块302以及机器人服务唤醒模块303的具体实现原理及其功能的实现过程与上述实施例一中步骤S102至步骤S106所涉及的内容类似,故在此不再对语音交互信息解析模块302以及机器人服务唤醒模块303进行赘述。
需要指出的是,在本发明的其他实施例中,语音交互信息解析模块302还可以采用如图2中步骤S202至步骤S208所涉及的内容那样通过分别先后判断唤醒词与唤醒词集合是否匹配以及用户意图信息与预设唤醒意图数据是否匹配来确定服务唤醒信息是否知识机器人服务唤醒,抑或是仅通过判断唤醒词与唤醒词集合是否匹配或者仅判断与唤醒词集合是否匹配来确定服务唤醒信息是否知识机器人服务唤醒,本发明同样不限于此。
应该理解的是,本发明所公开的实施例不限于这里所公开的特定结构或处理步骤,而应当延伸到相关领域的普通技术人员所理解的这些特征的等同替代。还应当理解的是,在此使用的术语仅用于描述特定实施例的目的,而并不意味着限制。
说明书中提到的“一个实施例”或“实施例”意指结合实施例描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,说明书通篇各个地方出现的短语“一个实施例”或“实施例”并不一定均指同一个实施例。
虽然上述示例用于说明本发明在一个或多个应用中的原理,但对于本领域的技术人员来说,在不背离本发明的原理和思想的情况下,明显可以在形式上、用法及实施的细节上作各种修改而不用付出创造性劳动。因此,本发明由所附的权利要求书来限定。
Claims (12)
1.一种机器人服务的唤醒方法,其特征在于,包括:
语音交互信息获取步骤,获取用户输入的语音交互信息;
语音交互信息解析步骤,对所述语音交互信息进行解析,得到服务唤醒信息和声纹特征信息;
机器人服务唤醒步骤,判断所述服务唤醒信息是否指示机器人服务唤醒,如果是,则进一步判断所述声纹特征信息与预设声纹特征集合是否匹配,如果匹配,则唤醒机器人服务。
2.如权利要求1所述的方法,其特征在于,在所述语音交互信息解析步骤中,利用本地自动语音识别引擎和/或云端自动语音识别引擎,以及本地声纹识别引擎和/或云端声纹识别引擎,对所述语音交互信息进行解析,得到所述服务唤醒信息和声纹特征信息。
3.如权利要求1或2所述的方法,其特征在于,在所述语音交互信息解析步骤中,通过对所述语音交互信息进行解析,得到用户输入的唤醒词;
在所述机器人服务唤醒步骤中,判断用户输入的唤醒词是否包含在预设唤醒词集合中,如果是,则判定该唤醒词指示机器人服务唤醒。
4.如权利要求1~3中任一项所述的方法,其特征在于,在所述语音交互信息解析步骤中,通过对所述语音交互信息进行解析,得到用户意图信息;
在所述机器人服务唤醒步骤中,将所述用户意图信息与预设唤醒意图数据进行匹配,如果匹配成功,则判定该意图信息指示机器人服务唤醒。
5.如权利要求1或2所述的方法,其特征在于,
在所述语音交互信息解析步骤中,通过对所述语音交互信息进行解析,得到用户输入的唤醒词;
在所述机器人服务唤醒步骤中,判断用户输入的唤醒词是否包含在预设唤醒词集合中,如果否,则重新执行所述语义交互信息解析步骤来对所述语音交互信息进行解析,得到用户意图信息;
在所述机器人服务唤醒步骤中,将所述用户意图信息与预设唤醒意图数据进行匹配,如果匹配成功,则判定所述用户意图信息指示机器人服务唤醒。
6.如权利要求1~5中任一项所述的方法,其特征在于,所述机器人服务包括以下所列项中的任一项或或几项:
机器人操作***的中枢服务、机器人应用、机器人实现功能和机器人交互界面。
7.一种机器人服务的唤醒装置,其特征在于,包括:
语音交互信息获取模块,其用于获取用户输入的语音交互信息;
语音交互信息解析模块,其用于对所述语音交互信息进行解析,得到服务唤醒信息和声纹特征信息;
机器人服务唤醒模块,其用于判断所述服务唤醒信息是否指示机器人服务唤醒,如果是,则进一步判断所述声纹特征信息与预设声纹特征集合是否匹配,如果匹配,则唤醒机器人服务。
8.如权利要求7所述的装置,其特征在于,所述语音交互信息解析模块配置为利用本地自动语音识别引擎和/或云端自动语音识别引擎,以及本地声纹识别引擎和/或云端声纹识别引擎,对所述语音交互信息进行解析,得到所述服务唤醒信息和声纹特征信息。
9.如权利要求7或8所述的装置,其特征在于,所述语音交互信息解析模块配置为通过对所述语音交互信息进行解析,得到用户输入的唤醒词;
所述机器人服务唤醒模块配置为判断用户输入的唤醒词是否包含在预设唤醒词集合中,如果是,则判定该唤醒词指示机器人服务唤醒。
10.如权利要求7~9中任一项所述的装置,其特征在于,所述语音交互信息解析模块配置为通过对所述语音交互信息进行解析,得到用户意图信息;
所述机器人服务唤醒模块配置为将所述用户意图信息与预设唤醒意图数据进行匹配,如果匹配成功,则判定该意图信息指示机器人服务唤醒。
11.如权利要求7或8所述的装置,其特征在于,
所述语音交互信息解析模块配置为通过对所述语音交互信息进行解析,得到用户输入的唤醒词,并将所述唤醒词传输至所述机器人服务唤醒模块;
所述机器人服务唤醒模块配置为判断用户输入的唤醒词是否包含在预设唤醒词集合中,如果否,所述语音交互信息解析模块则重新对所述语音交互信息进行解析,得到用户意图信息,并将所述用户意图信息传输至所述机器人服务唤醒模块;
所述机器人服务唤醒模块配置为将所述用户意图信息与预设唤醒意图数据进行匹配,如果匹配成功,则判定所述用户意图信息指示机器人服务唤醒。
12.如权利要求7~11中任一项所述的装置,其特征在于,所述机器人服务包括以下所列项中的任一项或或几项:
机器人操作***的中枢服务、机器人应用、机器人实现功能和机器人交互界面。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610857595.1A CN106502649A (zh) | 2016-09-27 | 2016-09-27 | 一种机器人服务唤醒方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610857595.1A CN106502649A (zh) | 2016-09-27 | 2016-09-27 | 一种机器人服务唤醒方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106502649A true CN106502649A (zh) | 2017-03-15 |
Family
ID=58290827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610857595.1A Pending CN106502649A (zh) | 2016-09-27 | 2016-09-27 | 一种机器人服务唤醒方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106502649A (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107799120A (zh) * | 2017-11-10 | 2018-03-13 | 北京康力优蓝机器人科技有限公司 | 服务机器人识别唤醒方法及装置 |
CN107895576A (zh) * | 2017-11-10 | 2018-04-10 | 北京康力优蓝机器人科技有限公司 | 服务机器人的识别启动方法及装置 |
CN108182939A (zh) * | 2017-12-13 | 2018-06-19 | 苏州车萝卜汽车电子科技有限公司 | 用于自助服务的语音处理方法及装置 |
CN108766441A (zh) * | 2018-05-29 | 2018-11-06 | 广东声将军科技有限公司 | 一种基于离线声纹识别和语音识别的语音控制方法及装置 |
CN108766446A (zh) * | 2018-04-18 | 2018-11-06 | 上海问之信息科技有限公司 | 声纹识别方法、装置、存储介质及音箱 |
CN108962260A (zh) * | 2018-06-25 | 2018-12-07 | 福来宝电子(深圳)有限公司 | 一种多人命令语音识别方法、***及存储介质 |
WO2019061348A1 (zh) * | 2017-09-29 | 2019-04-04 | 上海与德通讯技术有限公司 | 智能机器人及其控制方法及计算机可读存储介质 |
CN109637542A (zh) * | 2018-12-25 | 2019-04-16 | 圆通速递有限公司 | 一种语音外呼*** |
CN109725868A (zh) * | 2018-12-28 | 2019-05-07 | 苏州思必驰信息科技有限公司 | 纯语音交互的车机***的实现方法、适用于车机***的语音交互装置及*** |
CN109979443A (zh) * | 2017-12-27 | 2019-07-05 | 深圳市优必选科技有限公司 | 一种用于机器人的权限管理控制方法及装置 |
CN110021294A (zh) * | 2018-01-09 | 2019-07-16 | 深圳市优必选科技有限公司 | 机器人的控制方法、装置以及存储装置 |
CN110235073A (zh) * | 2017-04-28 | 2019-09-13 | 深圳市元征科技股份有限公司 | 一种体育场置物车的自动行驶方法及装置 |
CN110400568A (zh) * | 2018-04-20 | 2019-11-01 | 比亚迪股份有限公司 | 智能语音***的唤醒方法、智能语音***及车辆 |
CN111756986A (zh) * | 2019-03-27 | 2020-10-09 | 上海博泰悦臻电子设备制造有限公司 | 一种摄像头控制方法、存储介质、装置及具有其的电子设备 |
CN112463102A (zh) * | 2019-09-06 | 2021-03-09 | 佛山市顺德区美的电热电器制造有限公司 | 家电设备及其交互方法和交互装置、电子设备 |
CN113601511A (zh) * | 2021-08-17 | 2021-11-05 | 北京百度网讯科技有限公司 | 机器人控制方法、装置、电子设备、机器人及服务器 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001069859A1 (en) * | 2000-03-17 | 2001-09-20 | Telefonaktiebolaget Lm Ericsson (Publ) | Mobile terminal sleep phase assignment and announcement in a wireless local area network |
CN105575395A (zh) * | 2014-10-14 | 2016-05-11 | 中兴通讯股份有限公司 | 语音唤醒方法及装置、终端及其处理方法 |
CN105913839A (zh) * | 2016-05-30 | 2016-08-31 | 合肥华凌股份有限公司 | 一种智能冰箱、服务器及语音控制***和方法 |
-
2016
- 2016-09-27 CN CN201610857595.1A patent/CN106502649A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001069859A1 (en) * | 2000-03-17 | 2001-09-20 | Telefonaktiebolaget Lm Ericsson (Publ) | Mobile terminal sleep phase assignment and announcement in a wireless local area network |
CN105575395A (zh) * | 2014-10-14 | 2016-05-11 | 中兴通讯股份有限公司 | 语音唤醒方法及装置、终端及其处理方法 |
CN105913839A (zh) * | 2016-05-30 | 2016-08-31 | 合肥华凌股份有限公司 | 一种智能冰箱、服务器及语音控制***和方法 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110235073A (zh) * | 2017-04-28 | 2019-09-13 | 深圳市元征科技股份有限公司 | 一种体育场置物车的自动行驶方法及装置 |
WO2019061348A1 (zh) * | 2017-09-29 | 2019-04-04 | 上海与德通讯技术有限公司 | 智能机器人及其控制方法及计算机可读存储介质 |
CN107895576A (zh) * | 2017-11-10 | 2018-04-10 | 北京康力优蓝机器人科技有限公司 | 服务机器人的识别启动方法及装置 |
CN107799120A (zh) * | 2017-11-10 | 2018-03-13 | 北京康力优蓝机器人科技有限公司 | 服务机器人识别唤醒方法及装置 |
CN108182939A (zh) * | 2017-12-13 | 2018-06-19 | 苏州车萝卜汽车电子科技有限公司 | 用于自助服务的语音处理方法及装置 |
CN109979443A (zh) * | 2017-12-27 | 2019-07-05 | 深圳市优必选科技有限公司 | 一种用于机器人的权限管理控制方法及装置 |
CN110021294A (zh) * | 2018-01-09 | 2019-07-16 | 深圳市优必选科技有限公司 | 机器人的控制方法、装置以及存储装置 |
CN108766446A (zh) * | 2018-04-18 | 2018-11-06 | 上海问之信息科技有限公司 | 声纹识别方法、装置、存储介质及音箱 |
CN110400568A (zh) * | 2018-04-20 | 2019-11-01 | 比亚迪股份有限公司 | 智能语音***的唤醒方法、智能语音***及车辆 |
CN108766441A (zh) * | 2018-05-29 | 2018-11-06 | 广东声将军科技有限公司 | 一种基于离线声纹识别和语音识别的语音控制方法及装置 |
CN108766441B (zh) * | 2018-05-29 | 2020-11-10 | 广东声将军科技有限公司 | 一种基于离线声纹识别和语音识别的语音控制方法及装置 |
CN108962260A (zh) * | 2018-06-25 | 2018-12-07 | 福来宝电子(深圳)有限公司 | 一种多人命令语音识别方法、***及存储介质 |
CN109637542A (zh) * | 2018-12-25 | 2019-04-16 | 圆通速递有限公司 | 一种语音外呼*** |
CN109725868A (zh) * | 2018-12-28 | 2019-05-07 | 苏州思必驰信息科技有限公司 | 纯语音交互的车机***的实现方法、适用于车机***的语音交互装置及*** |
CN111756986A (zh) * | 2019-03-27 | 2020-10-09 | 上海博泰悦臻电子设备制造有限公司 | 一种摄像头控制方法、存储介质、装置及具有其的电子设备 |
CN112463102A (zh) * | 2019-09-06 | 2021-03-09 | 佛山市顺德区美的电热电器制造有限公司 | 家电设备及其交互方法和交互装置、电子设备 |
CN112463102B (zh) * | 2019-09-06 | 2024-03-22 | 佛山市顺德区美的电热电器制造有限公司 | 家电设备及其交互方法和交互装置、电子设备 |
CN113601511A (zh) * | 2021-08-17 | 2021-11-05 | 北京百度网讯科技有限公司 | 机器人控制方法、装置、电子设备、机器人及服务器 |
CN113601511B (zh) * | 2021-08-17 | 2023-03-14 | 北京百度网讯科技有限公司 | 机器人控制方法、装置、电子设备、机器人及服务器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106502649A (zh) | 一种机器人服务唤醒方法及装置 | |
US11948556B2 (en) | Detection and/or enrollment of hot commands to trigger responsive action by automated assistant | |
CN107704275B (zh) | 智能设备唤醒方法、装置、服务器及智能设备 | |
OShaughnessy | Speaker recognition | |
CN105912092A (zh) | 人机交互中的语音唤醒方法及语音识别装置 | |
US20220246140A1 (en) | Dynamic and/or context-specific hot words to invoke automated assistant | |
CN107220532B (zh) | 用于通过声音识别用户身份的方法及设备 | |
WO2021022992A1 (zh) | 对话生成模型的训练方法、对话生成方法、装置及介质 | |
CN110047481B (zh) | 用于语音识别的方法和装置 | |
CN109243432A (zh) | 话音处理方法以及支持该话音处理方法的电子设备 | |
KR20190101630A (ko) | 사용자 발화를 처리하는 시스템 및 그 시스템의 제어 방법 | |
KR102339819B1 (ko) | 프레임워크를 이용한 자연어 표현 생성 방법 및 장치 | |
CN104820556A (zh) | 唤醒语音助手的方法及装置 | |
CN112735418B (zh) | 一种语音交互的处理方法、装置、终端及存储介质 | |
CN106863319A (zh) | 一种机器人唤醒方法及装置 | |
CN110675873B (zh) | 智能设备的数据处理方法、装置、设备及存储介质 | |
WO2004072926A3 (en) | Management of conversations | |
CN109192208A (zh) | 一种电器设备的控制方法、***、装置、设备及介质 | |
KR102343084B1 (ko) | 전자 장치 및 전자 장치의 기능 실행 방법 | |
CN110175016A (zh) | 启动语音助理的方法及具有语音助理的电子装置 | |
CN109637542A (zh) | 一种语音外呼*** | |
CN107564532A (zh) | 电子设备的唤醒方法、装置、设备及计算机可读存储介质 | |
CN110364147A (zh) | 一种唤醒训练词采集***及方法 | |
CN105096936A (zh) | 一种即时按键通话业务控制方法和装置 | |
CN108093350A (zh) | 麦克风的控制方法和麦克风 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170315 |
|
RJ01 | Rejection of invention patent application after publication |