CN112230877A - 一种语音操作方法、装置、存储介质及电子设备 - Google Patents
一种语音操作方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN112230877A CN112230877A CN202011106905.9A CN202011106905A CN112230877A CN 112230877 A CN112230877 A CN 112230877A CN 202011106905 A CN202011106905 A CN 202011106905A CN 112230877 A CN112230877 A CN 112230877A
- Authority
- CN
- China
- Prior art keywords
- voice
- preset
- instruction
- operation instruction
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000001514 detection method Methods 0.000 claims description 8
- 230000002618 waking effect Effects 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 28
- 238000012545 processing Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000011022 operating instruction Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 241000238558 Eucarida Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
- Telephone Function (AREA)
Abstract
本申请涉及一种语音操作方法、装置、存储介质及电子设备,该语音操作方法应用于终端设备,包括:当检测到终端设备进入预设使用模式时,确定预设使用模式对应的至少一个待定操作指令、以及每一待定操作指令对应的操作关键词;在终端设备处于预设使用模式期间,获取用户输入的语音信息;对获得的语音信息进行识别,得到语音关键词;根据操作关键词和语音关键词,从至少一个待定操作指令中确定目标操作指令,并执行目标操作指令对应的操作,从而,在特定的使用场景下,无需唤醒词,即可使用语音识别功能执行用户所需要的操作,能够提升语音识别的效率,并实现语音识别的人性化和灵活性。
Description
技术领域
本申请涉及语音识别技术领域,具体涉及一种语音操作方法、装置、存储介质及电子设备。
背景技术
伴随第五代移动通信技术(5G)的发展,人工智能(AI)代替触摸屏操作的趋势日趋明显,语音交互代替键盘操作也将会成为主流。从驾驶模式的语音导航到智能家居设备中的智能语音助手,AI语音识别技术已经无处不在。
但是,目前市场上可见的AI语音识别设备,在操作方面,还有许多欠缺之处。比如,用户每次使用AI语音识别设备的语音识别功能时均需说出固定的唤醒词,而生硬的文本和反复说出唤醒词的复杂性,会极大地降低使用效率,并影响语音识别的人性化和灵活性。
发明内容
本申请的目的在于提供一种语音操作方法、装置、存储介质及电子设备,以提高语音识别设备的使用效率、以及其语音识别的人性化和灵活性。
为了解决上述问题,本申请实施例提供了一种语音操作方法,该语音操作方法应用于终端设备,包括:当检测到终端设备进入预设使用模式时,确定预设使用模式对应的至少一个待定操作指令、以及每一待定操作指令对应的操作关键词;在终端设备处于预设使用模式期间,获取用户输入的语音信息;对获得的语音信息进行识别,得到语音关键词;根据操作关键词和语音关键词,从至少一个待定操作指令中确定目标操作指令,并执行目标操作指令对应的操作。
其中,预设使用模式包括驾驶模式,目标操作指令包括音乐播放指令或导航指令,在检测到终端设备进入对应的预设使用模式之前,还包括:检测终端设备是否与车载设备连接;若是,则判定终端设备进入驾驶模式;执行目标操作指令对应的操作,包括:执行音乐播放指令或导航指令对应的操作。
其中,预设使用模式包括智能家居模式,在检测到终端设备进入对应的预设使用模式之前,还包括:判断终端设备是否连接预设区域网络;若是,则判定终端设备进入智能家居模式。
其中,目标操作指令包括预设智能家具设备的控制指令,执行目标操作指令对应的操作,包括:向预设智能家具设备发送控制指令,以使预设智能家具设备接收控制指令,并执行控制指令对应的操作。
其中,确定预设使用模式对应的至少一个待定操作指令,包括:获取预先记录的多个预设使用模式、以及每个预设使用模式对应的至少一个历史已执行操作指令和每个历史已执行操作指令的历史执行次数;根据历史执行次数从至少一个历史已执行操作指令中,确定终端设备进入的预设使用模式对应的至少一个待定操作指令。
为了解决上述问题,本申请实施例还提供了一种语音操作装置,该语音操作装置应用于终端设备,包括:确定模块,用于当检测到终端设备进入预设使用模式时,确定预设使用模式对应的至少一个待定操作指令、以及每一待定操作指令对应的操作关键词;第一获取模块,用于在终端设备处于预设使用模式期间,获取用户输入的语音信息;识别模块,用于对获得的语音信息进行识别,得到语音关键词;执行模块,用于根据操作关键词和语音关键词,从至少一个待定操作指令中确定目标操作指令,并执行目标操作指令对应的操作。
其中,预设使用模式包括驾驶模式,目标操作指令包括音乐播放指令或导航指令,语音操作装置还包括:检测模块,用于检测终端设备是否与车载设备连接;第一判定模块,用于当终端设备与车载设备连接时,判定终端设备进入驾驶模式;执行模块具体用于:执行音乐播放指令或导航指令对应的操作。
其中,预设使用模式包括智能家居模式,语音操作装置还包括:判断模块,用于判断终端设备是否连接预设区域网络;第二判定模块,用于当终端设备连接到预设区域网络时,判定终端设备进入智能家居模式。
其中,目标操作指令包括预设智能家具设备的控制指令,执行模块具体用于:向预设智能家具设备发送控制指令,以使预设智能家具设备接收控制指令,并执行控制指令对应的操作。
其中,确定模块具体用于:获取预先记录的多个预设使用模式、以及每个预设使用模式对应的至少一个历史已执行操作指令和每个历史已执行操作指令的历史执行次数;根据历史执行次数从至少一个历史已执行操作指令中,确定终端设备进入的预设使用模式对应的至少一个待定操作指令。
为了解决上述问题,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有多条指令,指令适于由处理器加载以执行上述任一项的语音操作方法。
为了解决上述问题,本申请实施例还提供了一种电子设备,该电子设备包括处理器和存储器,处理器与存储器电性连接,存储器用于存储指令和数据,处理器用于执行上述任一项语音操作方法中的步骤。
本申请的有益效果是:区别于现有技术,本申请提供的语音操作方法应用于终端设备,通过当检测到终端设备进入预设使用模式时,确定预设使用模式对应的至少一个待定操作指令、以及每一待定操作指令对应的操作关键词,然后在终端设备处于预设使用模式期间,获取用户输入的语音信息,并对获得的语音信息进行识别,得到语音关键词,接着根据操作关键词和语音关键词,从至少一个待定操作指令中确定目标操作指令,并执行目标操作指令对应的操作,从而,在特定的使用场景下,无需唤醒词,即可使用语音识别功能执行用户所需要的操作,能够提升语音识别的效率,并实现语音识别的人性化和灵活性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的语音操作方法的流程示意图;
图2是本申请实施例提供的语音操作方法的另一流程示意图;
图3是本申请实施例提供的智能家居控制***的结构示意图;
图4是本申请实施例提供的语音操作装置的结构示意图;
图5是本申请实施例提供的语音操作装置的另一结构示意图;
图6是本申请实施例提供的电子设备的结构示意图;
图7是本申请实施例提供的电子设备的另一结构示意图。
具体实施方式
本申请提供一种语音操作方法、装置、存储介质及电子设备,为使本申请的目的、技术方案和技术效果更加明确、清楚,以下对本申请进一步详细说明,应当理解此处所描述的具体实施条例仅用于解释本申请,并不用于限定本申请。
请参阅图1,图1是本申请实施例提供的语音操作方法的流程示意图,该语音操作方法应用于终端设备,具体流程可以如下:
S101:当检测到终端设备进入预设使用模式时,确定预设使用模式对应的至少一个待定操作指令、以及每一待定操作指令对应的操作关键词。
其中,终端设备可以为手机、平板电脑、个人数字助理、穿戴式设备等任一具有语音识别功能的设备,且该终端设备的语音识别功能可通过在其上安装语音识别程序来实现。上述预设使用模式可以是用户预先定义的使用模式,比如,驾驶模式、智能家居模式、户外运动模式、游戏模式或视频模式等,每一预设使用模式均可以对应有用户预先设定的判定条件。并且,若上述终端设备的运行状态满足判定条件,则可以判定上述终端设备进入了该判定条件所对应的预设使用场景。具体实施时,用户可以根据终端设备实际处于预设使用模式时的运行状态确定该预设使用模式所对应的判定条件,其中,以驾驶模式为例进行说明,鉴于当终端设备处于驾驶模式时,该终端设备一般会连接到车载设备,故驾驶模式所对应的判定条件可以为终端设备连接到车载设备,也即,当检测到上述终端设备连接到车载设备时,可以判定上述终端设备进入了驾驶模式。
在本实施例中,每一预设使用模式均对应有至少一个待定操作指令,每一待定操作指令均可对应有至少一个操作关键词,且不同的待定操作指令可通过不同的操作关键词进行区分,具体地,上述待定操作指令可以对应为用户在终端设备处于预设使用模式期间可能会通过语音输入的操作指令。以预设使用模式为视频模式为例,该视频模式所对应的待定操作指令可以包括播放上一视频、播放下一视频或调大音量等操作指令,且播放上一视频操作指令所对应的操作关键词可以包括“播放”、“上一视频”等关键词,播放下一视频操作指令所对应的操作关键词可以包括“播放”、“下一视频”等关键词,调大音量操作指令所对应的操作关键词可以分别为“音量”“大”等关键词。
在一个具体实施例中,上述S101可以具体包括:
S1011:获取预先记录的多个预设使用模式、以及每个预设使用模式对应的至少一个历史已执行操作指令和每个历史已执行操作指令的历史执行次数。
其中,上述历史已执行操作指令可以指的是过去终端设备用户在终端设备处于预设使用模式时,通过语音、触屏或按键等输入方式输入的操作指令,该历史已执行操作指令能够表征终端设备用户在对应预设使用模式下的操作习惯。
S1012:根据历史执行次数从至少一个历史已执行操作指令中,确定终端设备进入的预设使用模式对应的至少一个待定操作指令。
具体地,可以将历史执行次数不小于预设次数(比如,3次)的历史已执行操作指令作为对应预设使用模式的待定操作指令。
在一些实施例中,在执行上述S1011时,还可以同时获取每个历史已执行操作指令的历史执行时间,上述S1022可以具体为:根据历史执行时间和历史执行次数从至少一个历史已执行操作指令中,确定终端设备进入的预设使用模式对应的至少一个待定操作指令。例如,可以将历史执行时间落入预设时间段(比如,每天晚上8点至11点的时间段)、且历史执行次数不小于预设次数(比如,3次)的历史已执行操作指令作为对应预设使用模式的待定操作指令。
如此,基于预设使用模式的历史已执行操作指令和历史已执行操作指令的执行信息,从历史已执行操作指令中确定该预设使用模式对应的待定操作指令,能够更贴近用户在预设使用模式下的操作习惯,有利于提高用户体验。
S102:在终端设备处于预设使用模式期间,获取用户输入的语音信息。
具体地,在终端设备处于预设使用模式期间,终端设备的语音识别功能是开启的,也即,在此期间,终端设备可以调用语音识别功能实时获取用户输入的语音信息。在本实施例中,用户输入的语音信息只需包含与用户需要输入的操作指令相关的语音即可,而无需包含用于唤醒终端设备的语音识别功能进行语音操作指令识别的唤醒词。例如,当用户需要输入的操作指令为打开通讯录时,用户只需说出与打开通讯录操作指令相关的语音信息(比如,“帮忙打开通讯录”)即可,相比于现有技术中需要先说出唤醒词(比如,“siri”)再说出与用户需要输入的操作指令相关的语音信息,能够实现在特定使用模式下语音输入操作指令时的人性化和灵活性。
并且,具体实施时,在上述S102之前,还可以包括:当检测到终端设备进入预设使用模式时,判断上述终端设备的语音识别功能是否开启,若开启,则执行S102,若否,则开启终端设备的语音识别功能。
S103:对获得的语音信息进行识别,得到语音关键词。
具体地,上述终端设备可以利用VAD(Voice Activity Detection,声音活动检测)、ASR(Automatic Speech Recognition,自动语音识别)等语音识别技术对获取的语音信息进行语音识别,以将该语音信息转换为对应的文本信息,接着可以对此文本信息依次进行分词处理、以及去停用词和非文本字符处理,以待定对应的语音关键词。
S104:根据操作关键词和语音关键词,从至少一个待定操作指令中确定目标操作指令,并执行目标操作指令对应的操作。
其中,上述S104可以具体包括:
S1041:判断每一待定操作指令的操作关键词是否与语音关键词相匹配,若是,则执行S1042,若否,则不作处理。
S1042:将对应的待定操作指令作为目标操作指令,并执行目标操作指令对应的操作。
具体地,上述待定操作指令的操作关键词与语音关键词相匹配可以指的是该待定操作指令的操作关键词与语音关键词相同,例如,上述待定操作指令(比如,打开通讯录)的操作关键词为“打开”和“通讯录”,若语音关键词也为“打开”和“通讯录”,也即二者完全相同,则可以判定二者相匹配。需要说明的是,上述操作关键词与语音关键词相同不仅仅可以包括完全相同的情况,还可以包括不完全相同的情况,其中,不完全相同的情况可以包括二者为不同的文字但含义相同的情况,比如“通讯录”和“电话簿”。
在本实施例中,当用户通过语音输入操作指令时,无需说出用于唤醒终端设备语音识别功能进行语音操作指令识别的唤醒词,而只需说出与其需要输入的操作指令相关的语音即可,能够提高语音输入操作指令时的效率、以及人性化和灵活性,与此同时,在对用户输入的语音信息进行识别之后,需要识别得到的语音关键词与至少一个待定操作指令的操作关键词相匹配才会执行对应的操作指令,能够避免终端设备误识别用户不需要输入的操作指令,从而提高语音识别的效率。
具体举例,上述预设使用模式包括驾驶模式,上述目标操作指令包括音乐播放指令或导航指令,如图2所示,在上述S101之前,可以包括:
S105:检测终端设备是否与车载设备连接,若是,则执行S106,若否,则不作处理。
其中,终端设备与车载设备可以通过蓝牙、WiFi或热点等方式进行连接。
S106:判定终端设备进入驾驶模式。
本实施例仅给出终端设备与车载设备是否连接这一驾驶模式的判定条件作为示例,在其他实施例中,驾驶模式的判定条件还可以包括终端设备的驾驶模式开关是否处于开启状态等其他适合用于判定终端设备是否进入驾驶模式的判定条件。
相应地,上述S104可以具体包括:
S1043:执行音乐播放指令或导航指令对应的操作。
本实施例仅给出音乐播放指令和导航指令作为示例,在其他实施例中,上述目标操作指令还可以包括用于指示具体播放哪首歌的指令、或用于指示具体导航到哪个地方的指令等其他在驾驶模式下用户需要执行的操作指令。
在另一个例子中,上述预设使用模式可以包括智能家居模式,继续参阅图2,在上述S101之前,还可以包括:
S107:判断终端设备是否连接预设区域网络,若是,则执行S108,若否,则不作处理。
其中,预设区域网络可以是预设区域(比如,家、公司)提供的无线接入点(Wireless Access Point,AP),当判断得到终端设备连接到该预设区域网络时,可以认为该终端设备的用户进入了预设区域。具体地,如图3所示,在预设区域A中可以布置有至少一个智能家居设备B1、B2和B3,且这至少一个智能家居设备B1、B2和B3可以均连接到上述预设区域网络W,其中,智能家居设备B1、B2或B3可以为智能空调、智能电视、智能冰箱或智能电饭煲等具有联网功能的智能设备。
S108:判定终端设备进入智能家居模式。
本实施例仅给出终端设备是否连接预设区域网络这一智能家居模式的判定条件作为示例,在其他实施例中,智能家居模式的判定条件还可以包括终端设备的位置是否位于预设区域中、位于预设区域中的人体传感器是否检测到终端设备的用户进入预设区域、或终端设备的用户是否进入预设区域且进入预设区域的时长不大于预设时长(比如,3分钟)等其他适合用于判定终端设备是否进入智能家居模式的判定条件。
相应地,上述目标操作指令可以包括预设智能家具设备的控制指令,上述S104可以具体包括:
S1044:向预设智能家具设备发送控制指令,以使预设智能家具设备接收控制指令,并执行控制指令对应的操作。
例如,在如图3所示的智能家居控制***中,当上述目标操作指令为智能家居设备B1的启动指令时,上述终端设备C可以通过预设区域网络W向该智能家居设备B1发送启动指令,接着智能家居设备B1可以接收该启动指令并执行对应的启动操作,以实现终端设备语音操作智能家居设备的目的。
区别于现有技术,本实施例中的语音操作方法应用于终端设备,通过当检测到终端设备进入预设使用模式时,确定预设使用模式对应的至少一个待定操作指令、以及每一待定操作指令对应的操作关键词,然后在终端设备处于预设使用模式期间,获取用户输入的语音信息,并对获得的语音信息进行识别,得到语音关键词,接着根据操作关键词和语音关键词,从至少一个待定操作指令中确定目标操作指令,并执行目标操作指令对应的操作,从而,在特定的使用场景下,无需唤醒词,即可使用语音识别功能执行用户所需要的操作,能够提升语音识别的效率,并实现语音识别的人性化和灵活性。
请参阅图4,图4是本申请实施例提供的语音操作装置的结构示意图。如图4所示,该语音操作装置50可以集成于终端设备中,包括:
(1)确定模块51
确定模块51,用于当检测到终端设备进入预设使用模式时,确定预设使用模式对应的至少一个待定操作指令、以及每一待定操作指令对应的操作关键词。
其中,终端设备可以为手机、平板电脑、个人数字助理、穿戴式设备等任一具有语音识别功能的设备,且该终端设备的语音识别功能可通过在其上安装语音识别程序来实现。上述预设使用模式可以是用户预先定义的使用模式,比如,驾驶模式、智能家居模式、户外运动模式、游戏模式或视频模式等,每一预设使用模式均对应有至少一个待定操作指令,每一待定操作指令均可对应有至少一个操作关键词,且不同的待定操作指令可通过不同的操作关键词进行区分,具体地,上述待定操作指令可以对应为用户在终端设备处于预设使用模式期间可能会通过语音输入的操作指令。
在一个具体实施例中,上述确定模块51可以具体用于:
获取预先记录的多个预设使用模式、以及每个预设使用模式对应的至少一个历史已执行操作指令和每个历史已执行操作指令的历史执行次数;
根据历史执行次数从至少一个历史已执行操作指令中,确定终端设备进入的预设使用模式对应的至少一个待定操作指令。
如此,基于预设使用模式的历史已执行操作指令和历史已执行操作指令的执行信息,从历史已执行操作指令中确定该预设使用模式对应的待定操作指令,能够更贴近用户在预设使用模式下的操作习惯,有利于提高用户体验。
(2)第一获取模块52
第一获取模块52,用于在终端设备处于预设使用模式期间,获取用户输入的语音信息。
具体地,在终端设备处于预设使用模式期间,终端设备的语音识别功能是开启的,也即,在此期间,上述第一获取模块52可以调用语音识别功能实时获取用户输入的语音信息。在本实施例中,用户输入的语音信息只需包含与用户需要输入的操作指令相关的语音即可,而无需包含用于唤醒终端设备的语音识别功能进行语音操作指令识别的唤醒词,能够实现在特定使用模式下语音输入操作指令时的人性化和灵活性。
(3)识别模块53
识别模块53,用于对获得的语音信息进行识别,得到语音关键词。
(4)执行模块54
执行模块54,用于根据操作关键词和语音关键词,从至少一个待定操作指令中确定目标操作指令,并执行目标操作指令对应的操作。
在一个实施例中,上述执行模块54可以具体用于:判断每一待定操作指令的操作关键词是否与语音关键词相匹配,若是,则将对应的待定操作指令作为目标操作指令,并执行目标操作指令对应的操作S1042,若否,则不作处理。
具体举例,上述预设使用模式包括驾驶模式,上述目标操作指令包括音乐播放指令或导航指令,如图5所示,上述语音操作装置50还可以包括:
(5)检测模块55
检测模块55,用于检测终端设备是否与车载设备连接。
(6)第一判定模块56
第一判定模块56,用于当终端设备与车载设备连接时,判定终端设备进入驾驶模式。
相应地,上述执行模块54可以具体用于:执行音乐播放指令或导航指令对应的操作。
在另一个例子中,上述预设使用模式包括智能家居模式,上述语音操作装置50还可以包括:
(7)判断模块57
判断模块57,用于判断终端设备是否连接预设区域网络。
(8)第二判定模块58
第二判定模块58,用于当终端设备连接到预设区域网络时,判定终端设备进入智能家居模式。
相应地,上述目标操作指令包括预设智能家具设备的控制指令,上述执行模块54可以具体用于:向预设智能家具设备发送控制指令,以使预设智能家具设备接收控制指令,并执行控制指令对应的操作。
具体实施时,以上各个模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个模块的具体实施可参见前面的方法实施例,在此不再赘述。
区别于现有技术,本实施例中的语音操作装置应用于终端设备,包括确定模块,用于当检测到终端设备进入预设使用模式时,确定预设使用模式对应的至少一个待定操作指令、以及每一待定操作指令对应的操作关键词,第一获取模块,用于在终端设备处于预设使用模式期间,获取用户输入的语音信息,识别模块,用于对获得的语音信息进行识别,得到语音关键词,执行模块,用于根据操作关键词和语音关键词,从至少一个待定操作指令中确定目标操作指令,并执行目标操作指令对应的操作,从而,在特定的使用场景下,无需唤醒词,即可使用语音识别功能执行用户所需要的操作,能够提升语音识别的效率,并实现语音识别的人性化和灵活性。
相应的,本申请实施例还提供一种电子设备,该电子设备可以是智能手机、平板电脑等设备。如图6所示,电子设备800包括处理器801、存储器802。其中,处理器801与存储器802电性连接。
处理器801是电子设备800的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或加载存储在存储器802内的应用程序,以及调用存储在存储器802内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。
在本实施例中,电子设备800中的处理器801会按照如下的步骤,将一个或一个以上的应用程序的进程对应的指令加载到存储器802中,并由处理器801来运行存储在存储器802中的应用程序,从而实现各种功能:
当检测到终端设备进入预设使用模式时,确定预设使用模式对应的至少一个待定操作指令、以及每一待定操作指令对应的操作关键词;
在终端设备处于预设使用模式期间,获取用户输入的语音信息;
对获得的语音信息进行识别,得到语音关键词;
根据操作关键词和语音关键词,从至少一个待定操作指令中确定目标操作指令,并执行目标操作指令对应的操作。
该电子设备可以实现本申请实施例所提供的语音操作方法任一实施例中的步骤,因此,可以实现本发明实施例所提供的任一语音操作方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
图7示出了本发明实施例提供的电子设备的具体结构框图,该电子设备可以用于实施上述实施例中提供的语音操作方法。该电子设备900可以为AR眼镜、AR头盔、AR平视显示器(HUD)、智能手机或笔记本电脑等设备。
RF电路910用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。RF电路910可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。RF电路910可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。上述的无线网络可以使用各种通信标准、协议及技术,包括但并不限于全球移动通信***(Global System for Mobile Communication,GSM)、增强型移动通信技术(Enhanced DataGSM Environment,EDGE),宽带码分多址技术(Wideband Code Division MultipleAccess,WCDMA),码分多址技术(Code Division Access,CDMA)、时分多址技术(TimeDivision Multiple Access,TDMA),无线保真技术(Wireless Fidelity,Wi-Fi)(如美国电气和电子工程师协会标准IEEE802.11a,IEEE 802.11b,IEEE802.11g和/或IEEE 802.11n)、网络电话(Voice over Internet Protocol,VoIP)、全球微波互联接入(WorldwideInteroperability for Microwave Access,Wi-Max)、其他用于邮件、即时通讯及短消息的协议,以及任何其他合适的通讯协议,甚至可包括那些当前仍未被开发出来的协议。
存储器920可用于存储软件程序以及模块,如上述实施例中语音操作方法对应的程序指令/模块,处理器980通过运行存储在存储器920内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现对备用电池充电,对电池充电等功能。存储器920可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器920可进一步包括相对于处理器980远程设置的存储器,这些远程存储器可以通过网络连接至电子设备900。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入单元930可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元930可包括触敏表面931以及其他输入设备932。触敏表面931,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面931上或在触敏表面931附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面931可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器980,并能接收处理器980发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面931。除了触敏表面931,输入单元930还可以包括其他输入设备932。具体地,其他输入设备932可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元940可用于显示由用户输入的信息或提供给用户的信息以及电子设备900的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元940可包括显示面板941,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板941。进一步的,触敏表面931可覆盖显示面板941,当触敏表面931检测到在其上或附近的触摸操作后,传送给处理器680以确定触摸事件的类型,随后处理器980根据触摸事件的类型在显示面板941上提供相应的视觉输出。虽然在图中,触敏表面931与显示面板941是作为两个独立的部件来实现输入和输出功能,但是在某些实施例中,可以将触敏表面931与显示面板941集成而实现输入和输出功能。
电子设备900还可包括至少一种传感器950,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板941的亮度,接近传感器可在翻盖合上或者关闭时产生中断。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于电子设备900还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路960、扬声器961,传声器962可提供用户与电子设备900之间的音频接口。音频电路960可将接收到的音频数据转换后的电信号,传输到扬声器961,由扬声器961转换为声音信号输出;另一方面,传声器962将收集的声音信号转换为电信号,由音频电路960接收后转换为音频数据,再将音频数据输出处理器980处理后,经RF电路910以发送给比如另一终端,或者将音频数据输出至存储器920以便进一步处理。音频电路960还可能包括耳塞插孔,以提供外设耳机与电子设备900的通信。
电子设备900通过传输模块970(例如Wi-Fi模块)可以帮助用户接收请求、发送信息等,它为用户提供了无线的宽带互联网访问。虽然图中示出了传输模块970,但是可以理解的是,其并不属于电子设备900的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器980是电子设备900的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器920内的软件程序和/或模块,以及调用存储在存储器920内的数据,执行电子设备900的各种功能和处理数据,从而对电子设备进行整体监控。可选的,处理器980可包括一个或多个处理核心;在一些实施例中,处理器980可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解地,上述调制解调处理器也可以不集成到处理器980中。
电子设备900还包括给各个部件供电的电源990(比如备用电池和电池),在一些实施例中,电源可以通过电源管理***与处理器980逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源990还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,电子设备900还包括摄像头(如前置摄像头、后置摄像头)、蓝牙模块等,在此不再赘述。具体在本实施例中,电子设备的显示单元是触摸屏显示器,电子设备还包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行一个或者一个以上程序包含用于进行以下操作的指令:
当检测到终端设备进入预设使用模式时,确定预设使用模式对应的至少一个待定操作指令、以及每一待定操作指令对应的操作关键词;
在终端设备处于预设使用模式期间,获取用户输入的语音信息;
对获得的语音信息进行识别,得到语音关键词;
根据操作关键词和语音关键词,从至少一个待定操作指令中确定目标操作指令,并执行目标操作指令对应的操作。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。为此,本发明实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的语音操作方法中任一实施例的步骤。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的语音操作方法任一实施例中的步骤,因此,可以实现本申请实施例所提供的任一语音操作方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种语音操作方法、装置、存储介质和电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种语音操作方法,其特征在于,应用于终端设备,包括:
当检测到所述终端设备进入预设使用模式时,确定所述预设使用模式对应的至少一个待定操作指令、以及每一所述待定操作指令对应的操作关键词;
在所述终端设备处于所述预设使用模式期间,获取用户输入的语音信息;
对获得的所述语音信息进行识别,得到语音关键词;
根据所述操作关键词和所述语音关键词,从所述至少一个待定操作指令中确定目标操作指令,并执行所述目标操作指令对应的操作。
2.根据权利要求1所述的语音操作方法,其特征在于,所述预设使用模式包括驾驶模式,所述目标操作指令包括音乐播放指令或导航指令,在检测到所述终端设备进入对应的所述预设使用模式之前,还包括:
检测所述终端设备是否与车载设备连接;
若是,则判定所述终端设备进入驾驶模式;
所述执行所述目标操作指令对应的操作,包括:执行所述音乐播放指令或所述导航指令对应的操作。
3.根据权利要求1所述的语音操作方法,其特征在于,所述预设使用模式包括智能家居模式,在检测到所述终端设备进入对应的所述预设使用模式之前,还包括:
判断所述终端设备是否连接预设区域网络;
若是,则判定所述终端设备进入智能家居模式。
4.根据权利要求3所述的语音操作方法,其特征在于,所述目标操作指令包括预设智能家具设备的控制指令,所述执行所述目标操作指令对应的操作,包括:
向所述预设智能家具设备发送所述控制指令,以使所述预设智能家具设备接收所述控制指令,并执行所述控制指令对应的操作。
5.根据权利要求1所述的语音操作方法,其特征在于,所述确定所述预设使用模式对应的至少一个待定操作指令,包括:
获取预先记录的多个所述预设使用模式、以及每个所述预设使用模式对应的至少一个历史已执行操作指令和每个所述历史已执行操作指令的历史执行次数;
根据所述历史执行次数从所述至少一个历史已执行操作指令中,确定所述终端设备进入的所述预设使用模式对应的至少一个所述待定操作指令。
6.一种语音操作装置,其特征在于,应用于终端设备,包括:
确定模块,用于当检测到所述终端设备进入预设使用模式时,确定所述预设使用模式对应的至少一个待定操作指令、以及每一所述待定操作指令对应的操作关键词;
获取模块,用于在所述终端设备处于所述预设使用模式期间,获取用户输入的语音信息;
识别模块,用于对获得的所述语音信息进行识别,得到语音关键词;
执行模块,用于根据所述操作关键词和所述语音关键词,从所述至少一个待定操作指令中确定目标操作指令,并执行所述目标操作指令对应的操作。
7.根据权利要求6所述的语音操作装置,其特征在于,所述预设使用模式包括驾驶模式,所述目标操作指令包括音乐播放指令或导航指令,所述语音操作装置还包括:
检测模块,用于检测所述终端设备是否与车载设备连接;
第一判定模块,用于当所述终端设备与所述车载设备连接时,判定所述终端设备进入驾驶模式;
所述执行模块具体用于:执行所述音乐播放指令或所述导航指令对应的操作。
8.根据权利要求6所述的语音操作装置,其特征在于,所述预设使用模式包括智能家居模式,所述语音操作装置还包括:
判断模块,用于判断所述终端设备是否连接预设区域网络;
第二判定模块,用于当所述终端设备连接到所述预设区域网络时,判定所述终端设备进入智能家居模式。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有多条指令,所述指令适于由处理器加载以执行权利要求1至5任一项所述的语音操作方法。
10.一种电子设备,其特征在于,包括处理器和存储器,所述处理器与所述存储器电性连接,所述存储器用于存储指令和数据,所述处理器用于执行权利要求1至5任一项所述语音操作方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011106905.9A CN112230877A (zh) | 2020-10-16 | 2020-10-16 | 一种语音操作方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011106905.9A CN112230877A (zh) | 2020-10-16 | 2020-10-16 | 一种语音操作方法、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112230877A true CN112230877A (zh) | 2021-01-15 |
Family
ID=74117349
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011106905.9A Pending CN112230877A (zh) | 2020-10-16 | 2020-10-16 | 一种语音操作方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112230877A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113488042A (zh) * | 2021-06-29 | 2021-10-08 | 荣耀终端有限公司 | 一种语音控制方法及电子设备 |
CN113778226A (zh) * | 2021-08-26 | 2021-12-10 | 江西恒必达实业有限公司 | 一种基于语音识别技术控制智能家居的红外ai智能眼镜 |
CN115037831A (zh) * | 2021-03-05 | 2022-09-09 | 深圳市万普拉斯科技有限公司 | 一种模式控制方法、装置、电子设备及耳机 |
CN116095377A (zh) * | 2022-12-30 | 2023-05-09 | 无锡威达智能电子股份有限公司 | 一种基于语音识别的遥控器控制方法、装置及电子设备 |
CN116582382A (zh) * | 2023-07-11 | 2023-08-11 | 北京探境科技有限公司 | 智能设备控制方法、装置、存储介质及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN206388060U (zh) * | 2017-01-13 | 2017-08-08 | 孙健 | 通过语音控制的穿戴式智能家居控制*** |
CN107564518A (zh) * | 2017-08-21 | 2018-01-09 | 百度在线网络技术(北京)有限公司 | 智能设备控制方法、装置及计算机设备 |
CN107888769A (zh) * | 2017-11-07 | 2018-04-06 | 广东欧珀移动通信有限公司 | 场景模式启动方法、装置及终端 |
CN109326289A (zh) * | 2018-11-30 | 2019-02-12 | 深圳创维数字技术有限公司 | 免唤醒语音交互方法、装置、设备及存储介质 |
-
2020
- 2020-10-16 CN CN202011106905.9A patent/CN112230877A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN206388060U (zh) * | 2017-01-13 | 2017-08-08 | 孙健 | 通过语音控制的穿戴式智能家居控制*** |
CN107564518A (zh) * | 2017-08-21 | 2018-01-09 | 百度在线网络技术(北京)有限公司 | 智能设备控制方法、装置及计算机设备 |
CN107888769A (zh) * | 2017-11-07 | 2018-04-06 | 广东欧珀移动通信有限公司 | 场景模式启动方法、装置及终端 |
CN109326289A (zh) * | 2018-11-30 | 2019-02-12 | 深圳创维数字技术有限公司 | 免唤醒语音交互方法、装置、设备及存储介质 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115037831A (zh) * | 2021-03-05 | 2022-09-09 | 深圳市万普拉斯科技有限公司 | 一种模式控制方法、装置、电子设备及耳机 |
CN113488042A (zh) * | 2021-06-29 | 2021-10-08 | 荣耀终端有限公司 | 一种语音控制方法及电子设备 |
CN113778226A (zh) * | 2021-08-26 | 2021-12-10 | 江西恒必达实业有限公司 | 一种基于语音识别技术控制智能家居的红外ai智能眼镜 |
CN116095377A (zh) * | 2022-12-30 | 2023-05-09 | 无锡威达智能电子股份有限公司 | 一种基于语音识别的遥控器控制方法、装置及电子设备 |
CN116582382A (zh) * | 2023-07-11 | 2023-08-11 | 北京探境科技有限公司 | 智能设备控制方法、装置、存储介质及电子设备 |
CN116582382B (zh) * | 2023-07-11 | 2023-09-29 | 北京探境科技有限公司 | 智能设备控制方法、装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106847298B (zh) | 一种基于弥漫式语音交互的拾音方法和装置 | |
CN109067418B (zh) | 一种天线控制方法及移动终端 | |
CN112230877A (zh) | 一种语音操作方法、装置、存储介质及电子设备 | |
CN108684029B (zh) | 一种蓝牙配对连接方法及***、蓝牙设备和终端 | |
CN108712566B (zh) | 一种语音助手唤醒方法及移动终端 | |
CN106528545B (zh) | 一种语音信息的处理方法及装置 | |
CN106293901B (zh) | 一种终端应用的进程管理方法及装置 | |
CN106940997B (zh) | 一种向语音识别***发送语音信号的方法和装置 | |
CN109284144B (zh) | 一种快应用处理方法及移动终端 | |
CN111371705B (zh) | 一种下载任务执行方法及电子设备 | |
CN107870674B (zh) | 一种程序启动方法和移动终端 | |
CN113747412A (zh) | 紧急求救的方法及相关设备和存储介质及程序产品 | |
CN110072013B (zh) | 终端控制方法及装置 | |
CN109688611B (zh) | 一种频段参数的配置方法、装置、终端和存储介质 | |
CN108270928B (zh) | 一种语音识别的方法及移动终端 | |
CN111897916B (zh) | 语音指令识别方法、装置、终端设备及存储介质 | |
CN111491292B (zh) | 上网模式调整方法、装置、存储介质及移动终端 | |
CN111475066B (zh) | 应用程序的后台切换方法及电子设备 | |
CN108810274A (zh) | 应用辅助功能的启动方法、装置、存储介质和终端 | |
CN105635379B (zh) | 噪声抑制方法及装置 | |
CN111355991B (zh) | 视频播放方法、装置、存储介质及移动终端 | |
CN112468870A (zh) | 一种视频播放方法、装置、设备及存储介质 | |
CN111026486B (zh) | 应用排序方法、应用排序装置及计算机可读存储介质 | |
CN105278967B (zh) | 一种移动终端的***更新方法、装置和*** | |
CN112929793B (zh) | 音频架构、音频控制方法及装置、设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210115 |