CN106205615A - 一种基于语音交互的控制方法及*** - Google Patents
一种基于语音交互的控制方法及*** Download PDFInfo
- Publication number
- CN106205615A CN106205615A CN201610736268.0A CN201610736268A CN106205615A CN 106205615 A CN106205615 A CN 106205615A CN 201610736268 A CN201610736268 A CN 201610736268A CN 106205615 A CN106205615 A CN 106205615A
- Authority
- CN
- China
- Prior art keywords
- voice
- module
- functional parameter
- voice messaging
- message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 64
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000004458 analytical method Methods 0.000 claims description 33
- 230000015572 biosynthetic process Effects 0.000 claims description 19
- 238000003786 synthesis reaction Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 17
- 239000013589 supplement Substances 0.000 claims description 11
- 238000012790 confirmation Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 230000000295 complement effect Effects 0.000 claims description 3
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 2
- 235000008434 ginseng Nutrition 0.000 claims description 2
- 241000208340 Araliaceae Species 0.000 claims 1
- 238000006243 chemical reaction Methods 0.000 abstract 1
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000035699 permeability Effects 0.000 description 2
- 230000002618 waking effect Effects 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 240000005373 Panax quinquefolius Species 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开一种基于语音交互的控制方法及***。该方法通过唤醒信号启动语音交互***,语音交互***实时侦听语音信息,将侦听的语音信息转换成文字信息,对转换的文字信息进行分析,通过与***预先存储的功能参数判断语音信息对应的文字信息的功能参数是否完整,若完整,则执行相应的操作;若不完整,根据缺少的功能参数提示用户回复要执行的操作,从而实现实时通过语音调用***操作。采用本发明的控制方法及***,可随时通过语音调用应用程序,可随时选择不同功能操作,或者选择同一功能的不同执行参数,满足用户的不同需求,并且在调用过程中不需要用眼用手,还可实时对***进行更新,大大的增加了语音交互控制***的使用便捷性。
Description
技术领域
本发明涉及智能控制领域,特别是涉及一种基于语音交互的控制方法及***。
背景技术
语音交互控制是指通过语音交互来实现应用程序的调用。
现有的语音交互控制方法主要是根据用户的指令自动开启移动设备上的应用程序,但在使用过程中需要用户盯紧移动设备屏幕,用手去点击。当通过语音交互控制方法打开某一个应用程序时,需要用户手动关闭该应用程序,而且在执行该应用程序过程中需要调用其他应用程序时,必须重新启动语音交互控制方法进行调用。例如,当用语音交互控制方法打开地图程序之后,需要用户自己操作地图进行导航或者路线查询等操作,而且无法继续用语音交互控制方法调用短信等其他应用程序。这使得现有的语音交互控制方法使用便捷性不高。
发明内容
本发明的目的是提供一种基于语音交互的控制方法及***,通过全语音交互的形式,实现对应用程序的调用,而且可实现多个程序同时调用与实时控制,以解决现有技术中语音交互控制方法及***使用便捷性不高的问题。
为实现上述目的,本发明提供了如下方案:
一种基于语音交互的控制方法,所述方法包括:
获取唤醒信号,所述唤醒信号用于启动语音交互***进入语音交互过程;
根据所述唤醒信号,启动所述语音交互***;
获取语音信息;
判断所述语音信息是否能够被转换成文字信息,得到第一判断结果;
当所述第一判断结果为否时,返回所述获取语音信息步骤;
当所述第一判断结果为是时,对所述语音信息对应的文字信息进行分析,并存储分析结果,根据所述分析结果判断所述文字信息的功能参数是否完整,得到第二判断结果;
当所述第二判断结果为是时,则执行所述文字信息功能参数对应的操作,生成确认消息,并根据所述确认消息进行语音信息合成,并播放合成的语音信息;
当所述第二判断结果为否时,根据缺少的功能参数生成提示消息,并根据所述提示消息进行语音信息合成,并播放合成的语音信息,返回所述获取语音信息步骤。
可选的,所述根据所述唤醒信号,启动所述语音交互***具体包括:
将所述唤醒信号与***预存的唤醒词进行比对;
比对成功后,启动所述语音交互***。
可选的,所述对所述语音信息对应的文字信息进行分析,并存储分析结果之后,还包括:
返回所述获取唤醒信号的步骤。
可选的,所述执行所述文字信息功能参数对应的操作之前,还包括:
当所述文字信息的功能参数完整且所述文字信息功能参数对应的操作选项多于一个时,生成选择提示问题,并根据所述选择提示问题进行语音信息合成,并播放合成的语音信息,所述选择提示问题用于提示用户选择需要执行的操作选项。
可选的,所述生成选择提示问题具体包括:生成提示用户回复选项编号的消息,每个所述选项编号对应不同的所述操作选项的内容。
可选的,所述根据缺少的功能参数生成提示消息之后还包括:
当所述语音信息中包括完整的功能参数而所述分析结果为不完整时,
提示用户补充语义数据库;所述语义数据库中存储有功能参数以及与所述功能参数相对应的操作;
获取所述用户输入的操作信息;
将所述语音信息中包括完整的功能参数以及所述用户输入的操作信息对应增加至所述语义数据库。
一种基于语音交互的***,所述***包括:
语音唤醒模块,用于获取唤醒信号,所述唤醒信号用于启动***进入语音交互过程;
语音交互***启动模块,用于根据所述唤醒信号,启动所述语音交互***;
语音信息获取模块,用于获取语音信息;
语音信息判断模块,用于判断所述语音信息是否能够被转换成文字信息,得到第一判断结果;
语音分析模块,用于当所述第一判断结果为是时,对所述语音信息对应的文字信息进行分析;
存储模块,用于存储所述语音分析模块对所述语音信息对应的文字信息进行分析的分析结果;
功能参数判断模块,用于根据所述分析结果判断所述文字信息的功能参数是否完整,得到第二判断结果;
执行模块,用于当所述第二判断结果为是时,执行所述文字信息功能参数对应的操作;
确认消息生成模块,用于生成确认消息;
语音合成模块,用于进行语音信息合成;
语音播放模块,用于播放合成的语音信息;
提示消息生成模块,用于当所述第二判断结果为否时,根据缺少的功能参数生成提示消息。
可选的,所述语音交互***启动模块具体包括:
语音交互***比对模块,用于将所述唤醒信号与***预存的唤醒词进行比对;
语音交互***启动子模块,比对成功后,启动所述语音交互***。。
可选的,所述***还包括选择提示问题生成模块,用于当所述执行模块执行所述文字信息功能参数对应的操作之前,所述文字信息的功能参数完整且所述文字信息功能参数对应的操作选项多于一个时,生成选择提示问题。
可选的,所述***还包括语义补充模块,所述语义补充模块具体包括:
补充提示生成模块,用于当提示消息生成模块根据缺少的功能参数生成提示消息之后,所述语音信息中包括完整的功能参数而所述分析结果为不完整时,提示用户补充语义数据库;所述语义数据库中存储有功能参数以及与所述功能参数相对应的操作;
输入模块,用于获取所述用户输入的操作信息;
语义数据库补充模块,用于将所述语音信息中包括完整的功能参数以及所述用户输入的操作信息对应增加至所述语义数据库。
根据本发明提供的具体实施例,本发明的有益效果为:
通过以下几个方面提高了语音交互控制方法及***的使用便捷性:
(1)全语音操作,所有操作都通过语音方式实现,不需要用手用眼;
(2)随时语音开启操作,通过语音可随时开始新功能的操作,可随时选择不同功能操作,或者选择同一功能的不同执行参数,满足用户的不同需求;
(3)自定义配置语义知识库,可灵活扩展调整语义分析,增加处理执行的功能种类。
(4)操作简单,应用方便。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于语音交互的控制方法实施例1流程图;
图2为本发明基于语音交互的***结构图;
图3为本发明基于语音交互的控制方法实施例2流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明基于语音交互的控制方法实施例1流程图。如图1所示,实施例1包括:
步骤101:获取唤醒信号,所述唤醒信号用于启动语音交互***进入语音交互过程,用户可以随时通过语音唤醒控制来启动新的语音交互过程,进行唤醒时,将获取的声音数据流与某一个或多个预存的唤醒词的发声进行比对。例如,唤醒信号可以为“开启语音交互***”,可以为“启动黑马”,一旦比对成功,则唤醒成功,启动语音交互***,进入语音交互过程。
步骤102:获取语音信息,启动语音交互***后,***持续侦听语音信息;
步骤103:判断侦听到的语音信息是否可以转换成文字信息,生成第一判断结果;当第一判断结果为是时,执行步骤104;当第一判断结果为否时,返回步骤102;
步骤104:对语音信息对应的文字信息进行分析,提取文字信息中相应要操作的功能项以及功能项对应的参数项,每次一分析后,会将分析结果进行存储,并更新当前分析的结果,下一次分析时会依据上次存储的状态,对新的语音输入进行分析。功能参数提取方法可以是提取关键字,也可以是提取正则式;例如,文字信息“我要去天安门”将被提取出功能项为“导航”,参数项为“天安门”。
步骤105:根据提取的功能参数项判断功能参数是否完整,得到第二判断结果,当第二判断结果为否时,执行步骤106;当第二判断结果为是时,执行步骤107;
步骤106:根据缺少的功能参数生成提示问题,并返回步骤102继续获取语音信息。例如分析的语音信息为“我要去”,分析结果为缺少导航的目的地这一参数,生成提示问题可以为“请问您要去哪?”,也可以为“请输入您要去的目的地”。
步骤107:根据分析的功能参数执行相应的操作。例如,“我要去天安门”的分析结果功能项为“导航”,参数项为“天安门”,则开启地图实施导航功能,并指定目的地为天安门。若此时导航路线搜索结果为多种,则会根据导航路线生成选择提示问题向用户提示回复需要进行的操作,例如,去天安门的路线为3条,则生成的选择提示问题可以为“请回复您要选择的路线的选项编号:A、直行500米然后右转行驶1000米到达目的地;B、直行300米然后右转行驶1000米再左转200米到达目的地;C、右转行驶1000米然后左转行驶500米到达目的地”。
步骤108:生成确认消息,所述确认消息用于和用户确认已经执行相应的操作。例如执行操作导航去天安门,生成的确认消息可以为“已为您开启导航至天安门”。
图2为本发明基于语音交互的***结构图。如图2所示,所述***包括:语音唤醒模块201、语音交互***启动模块202、语音信息获取模块203、语音信息判断模块204、语音分析模块205、存储模块206、功能参数判断模块207、提示消息生成模块208、执行模块209、确认消息生成模块2010、语音合成模块2011和语音播放模块2012。
语音唤醒模块201接收唤醒信号,将接收的唤醒信号与***预存的一个或多个唤醒次进行比对,例如,唤醒信号可以为“开启语音交互***”,可以为“启动黑马”,比对成功时,则唤醒信号触发语音交互***启动模块202启动语音交互***。语音交互***启动后,语音信息获取模块203持续侦听语音信息,并将侦听到的语音信息传输至语音信息判断模块204,语音信息判断模块204判断传输的语音信息是否能够被转换成文字信息,如果能,则语义信息对应的文字信息传输至语音分析模块205对文字信息进行分析,语音分析模块205根据文字信息提取相应要操作的功能项以及功能项对应的参数项,每次一分析后,会将分析结果存储至存储模块206中,并更新当前分析的结果,下一次分析时会依据上次存储的状态,对新的语音输入进行分析。功能参数提取方法可以是提取关键字,也可以是提取正则式;例如,文字信息“我要去天安门”将被提取出功能项为“导航”,参数项为“天安门”。
功能参数判断模块207根据分析结果判断所述文字信息的功能参数是否完整,如果完整则通过执行模块209执行相应的操作,例如,“我要去天安门”的分析结果功能项为“导航”,参数项为“天安门”,则执行模块209开启地图实施导航功能,并指定目的地为天安门,然后通过确认消息生成模块2010生成确认消息,例如执行操作导航去天安门,生成的确认消息可以为“已为您开启导航至天安门”然后通过语音合成模块2011进行语音合成,通过语音播放模块2012进行语音播放。若此时导航路线搜索结果为多种,则会根据导航路线生成选择提示问题向用户提示回复需要进行的操作,例如,去天安门的路线为3条,则生成的选择提示问题可以为“请回复您要选择的路线的选项编号:A、直行500米然后右转行驶1000米到达目的地;B、直行300米然后右转行驶1000米再左转200米到达目的地;C、右转行驶1000米然后左转行驶500米到达目的地”通过语音合成模块2011进行语音合成,通过语音播放模块2012进行语音播放;如果判断所述文字信息的功能参数是不完整的,则通过提示消息生成模块208根据缺少的功能参数生成提示消息,例如,分析的语音信息为“我要去”,分析结果为缺少导航的目的地这一参数,生成提示问题可以为“请问您要去哪?”,也可以为“请回复您要去的目的地”,然后通过语音合成模块2011进行语音合成,通过语音播放模块2012进行语音播放。
图3为本发明基于语音交互的控制方法实施例2流程图。如图3所示,实施例2包括:
步骤301:唤醒***,通过唤醒信号唤醒语音交互***进入语音交互过程,此处设置唤醒信号为“启动语音”,当***接收到“启动语音”信号时进入语音交互过程;
步骤302:获取语音信息,持续侦听语音信息;
步骤303:判断侦听的语音信息是否可以转换成文字信息,如果能转换成文字信息,执行步骤304;对于不能识别转换为文字信息的语音做丢弃处理,重新侦听语音信息。例如,侦听到鸟叫声,或者风声,都无法转换成相应的文字信息。
步骤304:对于可与转换成文字信息的语音信息,对其对应的文字信息进行分析,提取出相应的操作功能项与参数项;
步骤305:,与***数据库中预先存储的功能项与参数项进行比对与调用,判断语音信息对应的文字信息中的功能参数是否完整,如果完整,执行步骤306,如果不完整,执行步骤307;
步骤306:根据分析的功能项与参数项调用相应模块,执行相应的操作。对于有歧义的操作,会进一步生成选择问题供用户选择。例如,地名有重复时,“我要去浦江”,由于浙江省金华市有浦江县,四川省成都市有蒲江县,两者名字相近,***会提示“请您回复目的地的选项编号:A:浙江省金华市有浦江县,B:四川省成都市有蒲江县”。例如,当同时获取两个人语音信息时,“我要去天安门”和“打电话给小明”,***会生成选择问题“请回复要进行的操作的选项编号:A:导航至天安门,B:打电话给小明”。
步骤307:对不完整的功能参数进行补充,此处包括两种类型,一是语音交互的形式,***根据缺少的功能参数进行提问,用户语音回复需要进行的操作;二是当语音信息中包括完整的功能参数而分析结果为不完整时,***提示用户补充语义数据库,语义数据库中存储有功能参数以及与该功能参数相对应的操作,用户可以通过手动输入将该语音信息中完整的功能参数对应增加至***数据库中。除此之外,本发明的***可以进行自动更新,实时更新数据库。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的***而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种基于语音交互的控制方法,其特征在于,所述方法包括:
获取唤醒信号,所述唤醒信号用于启动语音交互***进入语音交互过程;
根据所述唤醒信号,启动所述语音交互***;
获取语音信息;
判断所述语音信息是否能够被转换成文字信息,得到第一判断结果;
当所述第一判断结果为否时,返回所述获取语音信息步骤;
当所述第一判断结果为是时,对所述语音信息对应的文字信息进行分析,并存储分析结果,根据所述分析结果判断所述文字信息的功能参数是否完整,得到第二判断结果;
当所述第二判断结果为是时,则执行所述文字信息功能参数对应的操作,生成确认消息,并根据所述确认消息进行语音信息合成,并播放合成的语音信息;
当所述第二判断结果为否时,根据缺少的功能参数生成提示消息,并根据所述提示消息进行语音信息合成,并播放合成的语音信息,返回所述获取语音信息步骤。
2.根据权利要求1所述的方法,其特征在于,所述根据所述唤醒信号,启动所述语音交互***具体包括:
将所述唤醒信号与***预存的唤醒词进行比对;
比对成功后,启动所述语音交互***。
3.根据权利要求1所述的方法,其特征在于,所述对所述语音信息对应的文字信息进行分析,并存储分析结果之后,还包括:
返回所述获取唤醒信号的步骤。
4.根据权利要求1所述的方法,其特征在于,所述执行所述文字信息功能参数对应的操作之前,还包括:
当所述文字信息的功能参数完整且所述文字信息功能参数对应的操作选项多于一个时,生成选择提示问题,并根据所述选择提示问题进行语音信息合成,并播放合成的语音信息,所述选择提示问题用于提示用户选择需要执行的操作选项。
5.根据权利要求4所述的方法,其特征在于,所述生成选择提示问题具体包括:生成提示用户回复选项编号的消息,每个所述选项编号对应不同的所述操作选项的内容。
6.根据权利要求1所述的方法,其特征在于,所述根据缺少的功能参数生成提示消息之后还包括:
当所述语音信息中包括完整的功能参数而所述分析结果为不完整时,
提示用户补充语义数据库;所述语义数据库中存储有功能参数以及与所述功能参数相对应的操作;
获取所述用户输入的操作信息;
将所述语音信息中包括完整的功能参数以及所述用户输入的操作信息对应增加至所述语义数据库。
7.一种基于语音交互的***,其特征在于,所述***包括:
语音唤醒模块,用于获取唤醒信号,所述唤醒信号用于启动***进入语音交互过程;
语音交互***启动模块,用于根据所述唤醒信号,启动所述语音交互***;
语音信息获取模块,用于获取语音信息;
语音信息判断模块,用于判断所述语音信息是否能够被转换成文字信息,得到第一判断结果;
语音分析模块,用于当所述第一判断结果为是时,对所述语音信息对应的文字信息进行分析;
存储模块,用于存储所述语音分析模块对所述语音信息对应的文字信息进行分析的分析结果;
功能参数判断模块,用于根据所述分析结果判断所述文字信息的功能参数是否完整,得到第二判断结果;
执行模块,用于当所述第二判断结果为是时,执行所述文字信息功能参数对应的操作;
确认消息生成模块,用于生成确认消息;
语音合成模块,用于进行语音信息合成;
语音播放模块,用于播放合成的语音信息;
提示消息生成模块,用于当所述第二判断结果为否时,根据缺少的功能参数生成提示消息。
8.根据权利要求7所述的***,其特征在于,所述语音交互***启动模块具体包括:
语音交互***比对模块,用于将所述唤醒信号与***预存的唤醒词进行比对;
语音交互***启动子模块,比对成功后,启动所述语音交互***。。
9.根据权利要求7所述的***,其特征在于,所述***还包括选择提示问题生成模块,用于当所述执行模块执行所述文字信息功能参数对应的操作之前,所述文字信息的功能参数完整且所述文字信息功能参数对应的操作选项多于一个时,生成选择提示问题。
10.根据权利要求7所述的***,其特征在于,所述***还包括语义补充模块,所述语义补充模块具体包括:
补充提示生成模块,用于当提示消息生成模块根据缺少的功能参数生成提示消息之后,所述语音信息中包括完整的功能参数而所述分析结果为不完整时,提示用户补充语义数据库;所述语义数据库中存储有功能参数以及与所述功能参数相对应的操作;
输入模块,用于获取所述用户输入的操作信息;
语义数据库补充模块,用于将所述语音信息中包括完整的功能参数以及所述用户输入的操作信息对应增加至所述语义数据库。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310748193.8A CN116844543A (zh) | 2016-08-26 | 2016-08-26 | 一种基于语音交互的控制方法及*** |
CN201610736268.0A CN106205615B (zh) | 2016-08-26 | 2016-08-26 | 一种基于语音交互的控制方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610736268.0A CN106205615B (zh) | 2016-08-26 | 2016-08-26 | 一种基于语音交互的控制方法及*** |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310748193.8A Division CN116844543A (zh) | 2016-08-26 | 2016-08-26 | 一种基于语音交互的控制方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106205615A true CN106205615A (zh) | 2016-12-07 |
CN106205615B CN106205615B (zh) | 2023-06-02 |
Family
ID=57526871
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310748193.8A Pending CN116844543A (zh) | 2016-08-26 | 2016-08-26 | 一种基于语音交互的控制方法及*** |
CN201610736268.0A Active CN106205615B (zh) | 2016-08-26 | 2016-08-26 | 一种基于语音交互的控制方法及*** |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310748193.8A Pending CN116844543A (zh) | 2016-08-26 | 2016-08-26 | 一种基于语音交互的控制方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN116844543A (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106486122A (zh) * | 2016-12-26 | 2017-03-08 | 旗瀚科技有限公司 | 一种智能语音交互机器人 |
CN106782541A (zh) * | 2017-02-24 | 2017-05-31 | 太仓市同维电子有限公司 | 一种带有语音识别功能的家庭网关设计方法 |
CN106782561A (zh) * | 2016-12-09 | 2017-05-31 | 深圳Tcl数字技术有限公司 | 语音识别方法和*** |
CN107220022A (zh) * | 2017-07-07 | 2017-09-29 | 上海思依暄机器人科技股份有限公司 | 一种控制开启导航功能的方法和装置 |
CN107910005A (zh) * | 2017-11-16 | 2018-04-13 | 海信集团有限公司 | 交互文本的目标业务定位方法及装置 |
CN107919130A (zh) * | 2017-11-06 | 2018-04-17 | 百度在线网络技术(北京)有限公司 | 基于云端的语音处理方法和装置 |
CN108132805A (zh) * | 2017-12-20 | 2018-06-08 | 深圳Tcl新技术有限公司 | 语音交互方法、装置及计算机可读存储介质 |
CN108320747A (zh) * | 2018-02-08 | 2018-07-24 | 广东美的厨房电器制造有限公司 | 家电设备控制方法、设备、终端及计算机可读存储介质 |
CN108520748A (zh) * | 2018-02-01 | 2018-09-11 | 百度在线网络技术(北京)有限公司 | 一种智能设备功能引导方法及*** |
CN108965604A (zh) * | 2018-07-25 | 2018-12-07 | 安徽新华学院 | 一种手机用辅助操控*** |
WO2019007247A1 (zh) * | 2017-07-04 | 2019-01-10 | 阿里巴巴集团控股有限公司 | 人机会话的处理方法、装置及电子设备 |
CN109697981A (zh) * | 2019-01-02 | 2019-04-30 | 百度在线网络技术(北京)有限公司 | 一种语音交互方法、装置、设备及存储介质 |
CN110033764A (zh) * | 2019-03-08 | 2019-07-19 | 中国科学院深圳先进技术研究院 | 无人机的语音控制方法、装置、***及可读存储介质 |
CN111128168A (zh) * | 2019-12-30 | 2020-05-08 | 斑马网络技术有限公司 | 语音控制方法、装置及存储介质 |
CN111866883A (zh) * | 2020-06-09 | 2020-10-30 | 惠州高盛达科技有限公司 | 基于语音模块的路由器wifi设置方法及*** |
CN114485031A (zh) * | 2019-03-13 | 2022-05-13 | 青岛海尔电冰箱有限公司 | 用于冰箱的数据交互方法及交互*** |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1097281A (ja) * | 1996-09-19 | 1998-04-14 | Sony Corp | 音声認識装置及びナビゲーション装置 |
US6073102A (en) * | 1996-04-19 | 2000-06-06 | Siemens Aktiengesellschaft | Speech recognition method |
US6434524B1 (en) * | 1998-09-09 | 2002-08-13 | One Voice Technologies, Inc. | Object interactive user interface using speech recognition and natural language processing |
CN1494711A (zh) * | 2001-02-05 | 2004-05-05 | �Ҵ���˾ | 使用多模式输入进行多模式焦点检测,参考岐义解析和语气分类的***和方法 |
US20050065779A1 (en) * | 2001-03-29 | 2005-03-24 | Gilad Odinak | Comprehensive multiple feature telematics system |
US7676026B1 (en) * | 2005-03-08 | 2010-03-09 | Baxtech Asia Pte Ltd | Desktop telephony system |
CN102469363A (zh) * | 2010-11-11 | 2012-05-23 | Tcl集团股份有限公司 | 带有语音评论功能的电视***及语音评论方法 |
CN103281223A (zh) * | 2013-05-15 | 2013-09-04 | 五邑大学 | 一种现代化的智能家居安防*** |
CN204390737U (zh) * | 2014-07-29 | 2015-06-10 | 科大讯飞股份有限公司 | 一种家庭语音处理*** |
CN105027197A (zh) * | 2013-03-15 | 2015-11-04 | 苹果公司 | 训练至少部分语音命令*** |
CN105739977A (zh) * | 2016-01-26 | 2016-07-06 | 北京云知声信息技术有限公司 | 一种语音交互设备的唤醒方法及装置 |
-
2016
- 2016-08-26 CN CN202310748193.8A patent/CN116844543A/zh active Pending
- 2016-08-26 CN CN201610736268.0A patent/CN106205615B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6073102A (en) * | 1996-04-19 | 2000-06-06 | Siemens Aktiengesellschaft | Speech recognition method |
JPH1097281A (ja) * | 1996-09-19 | 1998-04-14 | Sony Corp | 音声認識装置及びナビゲーション装置 |
US6434524B1 (en) * | 1998-09-09 | 2002-08-13 | One Voice Technologies, Inc. | Object interactive user interface using speech recognition and natural language processing |
CN1494711A (zh) * | 2001-02-05 | 2004-05-05 | �Ҵ���˾ | 使用多模式输入进行多模式焦点检测,参考岐义解析和语气分类的***和方法 |
US20050065779A1 (en) * | 2001-03-29 | 2005-03-24 | Gilad Odinak | Comprehensive multiple feature telematics system |
US7676026B1 (en) * | 2005-03-08 | 2010-03-09 | Baxtech Asia Pte Ltd | Desktop telephony system |
CN102469363A (zh) * | 2010-11-11 | 2012-05-23 | Tcl集团股份有限公司 | 带有语音评论功能的电视***及语音评论方法 |
CN105027197A (zh) * | 2013-03-15 | 2015-11-04 | 苹果公司 | 训练至少部分语音命令*** |
CN103281223A (zh) * | 2013-05-15 | 2013-09-04 | 五邑大学 | 一种现代化的智能家居安防*** |
CN204390737U (zh) * | 2014-07-29 | 2015-06-10 | 科大讯飞股份有限公司 | 一种家庭语音处理*** |
CN105739977A (zh) * | 2016-01-26 | 2016-07-06 | 北京云知声信息技术有限公司 | 一种语音交互设备的唤醒方法及装置 |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106782561A (zh) * | 2016-12-09 | 2017-05-31 | 深圳Tcl数字技术有限公司 | 语音识别方法和*** |
CN106486122A (zh) * | 2016-12-26 | 2017-03-08 | 旗瀚科技有限公司 | 一种智能语音交互机器人 |
CN106782541A (zh) * | 2017-02-24 | 2017-05-31 | 太仓市同维电子有限公司 | 一种带有语音识别功能的家庭网关设计方法 |
WO2019007247A1 (zh) * | 2017-07-04 | 2019-01-10 | 阿里巴巴集团控股有限公司 | 人机会话的处理方法、装置及电子设备 |
CN107220022A (zh) * | 2017-07-07 | 2017-09-29 | 上海思依暄机器人科技股份有限公司 | 一种控制开启导航功能的方法和装置 |
CN107919130A (zh) * | 2017-11-06 | 2018-04-17 | 百度在线网络技术(北京)有限公司 | 基于云端的语音处理方法和装置 |
CN107910005A (zh) * | 2017-11-16 | 2018-04-13 | 海信集团有限公司 | 交互文本的目标业务定位方法及装置 |
CN108132805A (zh) * | 2017-12-20 | 2018-06-08 | 深圳Tcl新技术有限公司 | 语音交互方法、装置及计算机可读存储介质 |
US10937423B2 (en) | 2018-02-01 | 2021-03-02 | Baidu Online Network Technology (Beijing) Co., Ltd. | Smart device function guiding method and system |
CN108520748A (zh) * | 2018-02-01 | 2018-09-11 | 百度在线网络技术(北京)有限公司 | 一种智能设备功能引导方法及*** |
CN108520748B (zh) * | 2018-02-01 | 2020-03-03 | 百度在线网络技术(北京)有限公司 | 一种智能设备功能引导方法及*** |
CN108320747A (zh) * | 2018-02-08 | 2018-07-24 | 广东美的厨房电器制造有限公司 | 家电设备控制方法、设备、终端及计算机可读存储介质 |
CN108965604A (zh) * | 2018-07-25 | 2018-12-07 | 安徽新华学院 | 一种手机用辅助操控*** |
CN109697981A (zh) * | 2019-01-02 | 2019-04-30 | 百度在线网络技术(北京)有限公司 | 一种语音交互方法、装置、设备及存储介质 |
CN109697981B (zh) * | 2019-01-02 | 2021-03-09 | 百度在线网络技术(北京)有限公司 | 一种语音交互方法、装置、设备及存储介质 |
CN110033764A (zh) * | 2019-03-08 | 2019-07-19 | 中国科学院深圳先进技术研究院 | 无人机的语音控制方法、装置、***及可读存储介质 |
CN114485031A (zh) * | 2019-03-13 | 2022-05-13 | 青岛海尔电冰箱有限公司 | 用于冰箱的数据交互方法及交互*** |
CN114508895A (zh) * | 2019-03-13 | 2022-05-17 | 青岛海尔电冰箱有限公司 | 用于冰箱的数据交互方法及交互*** |
CN114485031B (zh) * | 2019-03-13 | 2023-11-14 | 青岛海尔电冰箱有限公司 | 用于冰箱的数据交互方法及交互*** |
CN111128168A (zh) * | 2019-12-30 | 2020-05-08 | 斑马网络技术有限公司 | 语音控制方法、装置及存储介质 |
CN111866883A (zh) * | 2020-06-09 | 2020-10-30 | 惠州高盛达科技有限公司 | 基于语音模块的路由器wifi设置方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN106205615B (zh) | 2023-06-02 |
CN116844543A (zh) | 2023-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106205615A (zh) | 一种基于语音交互的控制方法及*** | |
US8494862B2 (en) | Method for triggering at least one first and second background application via a universal language dialog system | |
CN106663129A (zh) | 一种基于状态机上下文敏感多轮对话管理***及方法 | |
US9601107B2 (en) | Speech recognition system, recognition dictionary registration system, and acoustic model identifier series generation apparatus | |
US20140379338A1 (en) | Conditional multipass automatic speech recognition | |
US20100241431A1 (en) | System and Method for Multi-Modal Input Synchronization and Disambiguation | |
CN104485107B (zh) | 名称的语音识别方法、语音识别***和语音识别设备 | |
CN107403619A (zh) | 一种应用于自行车环境的语音控制方法及*** | |
CN106663424A (zh) | 意图理解装置以及方法 | |
CN102024013A (zh) | 启动包括第一功能和第二功能的多个功能的***和方法 | |
CN106710585B (zh) | 语音交互过程中的多音字播报方法及*** | |
CN102855874A (zh) | 基于互联网语音交互的家电控制方法及*** | |
US9715877B2 (en) | Systems and methods for a navigation system utilizing dictation and partial match search | |
CN106601250A (zh) | 一种语音控制方法及装置、设备 | |
CN109741735A (zh) | 一种建模方法、声学模型的获取方法和装置 | |
CN102831892A (zh) | 基于互联网语音交互的玩具控制方法及*** | |
CN103514879A (zh) | 一种基于bp神经网络的本地语音识别方法 | |
US8126715B2 (en) | Facilitating multimodal interaction with grammar-based speech applications | |
CN110444190A (zh) | 语音处理方法、装置、终端设备及存储介质 | |
CN106601242A (zh) | 操作事件的执行方法及装置、终端 | |
CN110085217A (zh) | 语音导航方法、装置及终端设备 | |
CN106782561A (zh) | 语音识别方法和*** | |
CN111081254B (zh) | 一种语音识别方法和装置 | |
EP2816552B1 (en) | Conditional multipass automatic speech recognition | |
CN102868740A (zh) | 基于移动通讯终端及互联网语音交互的玩具控制方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |