CN106098066B - 语音识别方法及装置 - Google Patents

语音识别方法及装置 Download PDF

Info

Publication number
CN106098066B
CN106098066B CN201610389407.7A CN201610389407A CN106098066B CN 106098066 B CN106098066 B CN 106098066B CN 201610389407 A CN201610389407 A CN 201610389407A CN 106098066 B CN106098066 B CN 106098066B
Authority
CN
China
Prior art keywords
voice information
division
keyword
keywords
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610389407.7A
Other languages
English (en)
Other versions
CN106098066A (zh
Inventor
吴刚
党君利
柳义庆
冯晓龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Mixlinker Network Co Ltd
Original Assignee
Shenzhen Mixlinker Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Mixlinker Network Co Ltd filed Critical Shenzhen Mixlinker Network Co Ltd
Priority to CN201610389407.7A priority Critical patent/CN106098066B/zh
Publication of CN106098066A publication Critical patent/CN106098066A/zh
Application granted granted Critical
Publication of CN106098066B publication Critical patent/CN106098066B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了语音识别方法及装置,为不同的服务界面设置了不同的操作指令模板,以当前服务界面对应的操作指令模板为准,判断接收到的语音信息是否与该操作指令模板匹配,若匹配成功,才执行语音信息指示的操作,从而避免在存在多重声音时,将输入的近似语音信息作为操作指令,打断当前正在提供的服务,做到准确识别语音信息中的操作指令内容。

Description

语音识别方法及装置
技术领域
本发明涉及语音技术领域,特别涉及语音识别方法及装置。
背景技术
随着多媒体技术的发展,多媒体***的服务项目也随之扩展,例如音乐、视频、图片、实时路况信号、目的地地图导航、语音导航等。智能终端的广泛使用给上述服务项目提供了广阔的发展空间。
无论终端带有按键还是触摸屏,都需要人为进行手动操控,才能使用上述服务项目,不仅操作繁琐,还可能具有危险性,例如驾驶员在行车过程中手动操作车载设备就可能发生危险。语音识别技术的发展为此类操作提供了新的发展方向。但是在狭小的内部空间,例如汽车中,使用语音识别来使用上述服务项目时,将会发生多重声音同时存在的情况,如何准确识别语音信息中的操作指令内容成为了急需解决的问题。
发明内容
本发明实施例提供一种语音识别方法,能够在存在多重声音时,准确识别语音信息中的操作指令内容。
本发明实施例还提供一种语音识别装置,能够在存在多重声音时,准确识别语音信息中的操作指令内容。
本发明实施例提供的语音识别方法,包括:
接收语音信息;
判断所述语音信息与当前服务界面对应的操作指令模板是否匹配;
若所述语音信息与所述操作指令模板相匹配,执行所述语音信息指示的操作,若所述语音信息与所述操作执行模板不相匹配,不执行操作。
可见,本发明实施例中为不同的服务界面设置了不同的操作指令模板,以当前服务界面对应的操作指令模板为准,判断接收到的语音信息是否与该操作指令模板匹配,若匹配成功,才执行语音信息指示的操作,从而避免在存在多重声音时,将输入的近似语音信息作为操作指令,打断当前正在提供的服务,做到准确识别语音信息中的操作指令内容。
作为可选的实施方式,所述操作指令模板,包括:关键词排列顺序和关键词词库。
可见,本发明实施例中的操作指令模板,不仅包含关键词词库,还包括关键词排列顺序,从而提高了与操作指令模板匹配的标准,做到更准确的识别语音信息中的操作指令内容。
作为一种可选的实施方式,所述判断所述语音信息与所述操作指令模板是否匹配,包括:
对所述语音信息进行组词划分;
根据所述进行组词划分后得到的关键词的分拆和组合,判断进行组词划分后得到的关键词是否包含在所述关键词词库中;
若所述进行组词划分后得到的关键词包含在所述关键词词库中,判断进行组词划分后得到的关键词是否与所述关键词排列顺序匹配;若进行组词划分后得到的关键词与所述关键词排列顺序相匹配,确定所述语音信息与所述操作指令模板相匹配;若进行组词划分后得到的关键词与所述关键词排列顺序不相匹配,确定所述语音信息与所述操作指令模板不相匹配;
若所述进行组词划分后得到的关键词未包含在所述关键词词库中,确定所述语音信息与所述操作指令模板不相匹配。
可见,本发明实施例中采用了语音信息分割技术,将接收到的语音信息进行组词划分,实现语音信息精确识别的效果。
作为一种可选的实施方式,所述方法还包括:
若所述进行组词划分后得到的关键词未包含在所述关键词词库中,显示未包含在所述关键词词库中的进行组词划分得到的关键词;
当接收到确认指令之后,继续执行所述判断进行组词划分后得到的关键词是否与所述关键词排列顺序匹配的步骤;当接到否定指令之后,确定所述语音信息与所述操作指令模板不相匹配。
可见,本发明实施例中,当进行组词划分后得到的关键词未包含在关键词词库中时,可以进一步将该关键词显示出来,如果接收到确认指令则继续执行判断该关键词是否与关键词排列顺序匹配的步骤,由此避免关键词词库不全时,对某些进行组词划分后得到的关键词做出错误判断。
作为一种可选的实施方式,所述方法还包括:
所述判断进行组词划分后得到的关键词是否包含在所述关键词词库中之前,判断进行组词划分后得到的关键词中是否包含指令关键词;
若所述进行组词划分后得到的关键词中包含指令关键词,继续执行所述判断进行组词划分后得到的关键词是否包含在所述关键词词库中的步骤;若所述进行组词划分后得到的关键词中不包含指令关键词,确定所述语音信息与所述操作指令模板不相匹配。
可见,在本发明实施例中先判断语音信息中是否包括指令关键词,只有在包括指令关键词的基础上才会进一步判断语音信息中的关键词是否包含在关键词词库中,提升处理效率。
本发明实施例提供一种语音识别装置,包括:
语音信息接收模块,用于接收语音信息;
判断模块,用于判断所述语音信息与当前服务界面对应的操作指令模板是否匹配;
语音信息响应模块,用于在所述语音信息与所述操作指令模板相匹配时,执行所述语音信息指示的操作,在所述语音信息与所述操作执行模板不相匹配时,不执行操作。
作为一种可选的实施方式,所述操作指令模板,包括:关键词排列顺序和关键词词库。
作为一种可选的实施方式,所述判断模块,包括:
语音信息分析子模块,用于对所述语音信息进行组词划分;第一判断子模块,用于根据所述进行组词划分后得到的关键词的分拆和组合,判断进行组词划分后得到的关键词是否包含在所述关键词词库中,在所述进行组词划分后得到的关键词包含在所述关键词词库中时,触发第二判断子模块执行操作,在所述进行组词划分后得到的关键词未包含在所述关键词词库中时,确定所述语音信息与所述操作指令模板不相匹配;
第二判断子模块,用于判断进行组词划分后得到的关键词是否与所述关键词排列顺序匹配,在进行组词划分后得到的关键词与所述关键词排列顺序相匹配时,确定所述语音信息与所述操作指令模板相匹配;在进行组词划分后得到的关键词与所述关键词排列顺序不相匹配时,确定所述语音信息与所述操作指令模板不相匹配。
作为一种可选的实施方式,所述第一判断子模块,包括:
第一判断执行子模块,用于根据所述进行组词划分后得到的关键词的分拆和组合,判断进行组词划分后得到的关键词是否包含在所述关键词词库中,在所述进行组词划分后得到的关键词包含在所述关键词词库中时,触发第二判断子模块执行操作,在所述进行组词划分后得到的关键词未包含在所述关键词词库中时,触发显示子模块执行操作;
显示子模块,用于在所述进行组词划分后得到的关键词未包含在所述关键词词库中时,显示未包含在所述关键词词库中的进行组词划分得到的关键词;
触发模块,用于在接收到确认指令之后,触发所述第二判断子模块执行操作;在接到否定指令之后,确定所述语音信息与所述操作指令模板不相匹配。
作为一种可选的实施方式,所述第一判断子模块,包括:
第二判断执行子模块,用于根据所述进行组词划分后得到的关键词的分拆和组合,判断进行组词划分后得到的关键词中是否包含指令关键词,在所述进行组词划分后得到的关键词中包含指令关键词时,触发第三判断执行子模块执行操作,在所述进行组词划分后得到的关键词中不包含指令关键词时,确定所述语音信息与所述操作指令模板不相匹配;
第三判断执行子模块,用于判断进行组词划分后得到的关键词是否包含在所述关键词词库中,在所述进行组词划分后得到的关键词包含在所述关键词词库中时,触发第二判断子模块执行操作,在所述进行组词划分后得到的关键词未包含在所述关键词词库中时,确定所述语音信息与所述操作指令模板不相匹配。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合发明的实施例,并与说明书一起用于解释本发明的原理。
图1为本发明实施例中一种语音识别的方法流程图;
图2为本发明实施例中一种语音识别的方法流程图;
图2A为本发明实施例中的***界面示意图;
图3为本发明实施例中一种语音识别装置的框图;
图4为本发明实施例中一种语音识别装置的框图;
图5为本发明实施例中一种语音识别装置的框图;
图5A为本发明实施例中一种语音识别装置的框图;
图6是根据一示例性实施例示出的一种用于语音识别的装置600的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1为本发明实施例中一种语音识别的方法流程图,可以应用于终端中。
在步骤11中,接收语音信息。
在步骤12中,判断所述语音信息与当前服务界面对应的操作指令模板是否匹配,如果相匹配则执行步骤13,否则不执行操作。
在步骤13中,执行所述语音信息指示的操作。
本发明实施例中的操作指令模板可以包括:关键词排列顺序和关键词词库。不同的服务界面对应不同的操作指令模板,例如导航服务界面对应一个操作指令模板,音乐服务界面对应另一个操作指令模板。
以导航服务为例,导航服务界面对应的操作指令模板如表一所示。
表一
Figure BDA0001007676020000061
以音乐服务为例,音乐服务界面对应的操作指令模板如表二所示。
表二
Figure BDA0001007676020000071
在上述表一和表二所示的关键词模板中,存在一类指令关键词,例如导航操作指令模板中的“导航到”,又例如音乐操作指令模板中的“播放”。可见,指令关键词通常为动词。
图2为本发明实施例中一种语音识别的方法流程图,该方法可以应用于终端中。
在步骤21中,接收语音信息。
在步骤22中,确定与当前服务界面对应的操作指令模板。
作为一种可选的实施方式,终端用户要使用服务时,可以在如图2A所示的***界面上输入语音的界面唤醒指令,该***界面上以服务频道的形式集中显示当前用户可以使用的服务。例如想使用音乐服务时,语音输入“打开音乐界面”,想使用导航服务时,语音输入“打开导航界面”。终端在接收到界面唤醒指令后,打开与界面唤醒指令对应的当前服务界面,后续的操作将基于该打开的当前服务界面执行。终端中保存有服务界面与操作指令模板的对应关系,因此根据当前服务界面,可以确定与当前服务界面对应的操作指令模板。
在步骤23中,对接收到的语音信息进行组词划分。
作为一种可选的实施方式,采用语音信息分割技术,对接收到的语音信息进行组词划分,得到关键词的分拆和组合。
在步骤24中,判断进行组词划分后得到的关键词是否在关键词词库中,当组词划分后得到的关键词在关键词词库中时,执行步骤25,当组词划分后得到的关键词不在关键词词库中时,不执行操作。
作为一种可选的替换实施方式,在步骤24中,当组词划分后得到的关键词不在关键词词库中时,可以显示未包含在关键词词库中的该关键词,并给用户提供确认或否定的功能选项,当用户确认该关键词之后,终端将接收到确认指令,此时可以继续执行步骤25,当用户否定该关键词之后,终端将接收到否定指令,此时不执行操作。由此,避免关键词词库不全时,有的关键词无法被识别。进一步,当用户确认该关键词之后,可以将该关键词更新到关键词词库中。可选的,这里用户可以使用语音输入确认或否定的指令。
作为另一种可选的替换实施方式,在判断进行组词划分后得到的关键词是否在关键词词库中之前,先判断进行组词划分后得到的关键词中是否包含指令关键词,只有在确定进行组词划分后得到的关键词中包含指令关键词的情况下,才执行判断进行组词划分后得到的关键词是否在关键词词库中的步骤,若进行组词划分后得到的关键词中不包含指令关键词,则可以直接确定接收到的语音信息与操作指令末班不相匹配。由此,在确定接收到的语音信息中包括指令关键词才去匹配关键词词库,提高了处理效率。
在步骤25中,判断进行组词划分后得到的关键词是否与关键词排列顺序匹配,当组词划分后得到的关键词与关键词排列顺序相匹配时,确定接收到的语音信息与操作指令模板相匹配,执行步骤26,当组词划分后得到的关键词与关键词排列顺序不相匹配时,不执行操作。
在步骤26中,执行所述语音信息指示的操作。
按照图1或图2所示的方法,下面举出几个具体的应用场景。以终端是车载设备为例。
当驾驶员想使用导航服务时,语音输入界面唤醒指令“打开导航界面”,车载设备接收到该界面唤醒指令后,打开导航服务界面。在导航服务界面被打开之后,驾驶员可以继续输入语音信息“导航到天安门”,车载设备判断该语音信息与导航服务界面对应的操作指令模板相匹配,执行对应的导航操作。在提供导航服务的过程中,假设车内其他乘客和驾驶员谈论旅游景点,有可能会提到多个地名,此时只要车载设备接收到的语音信息不符合“导航到地名”的格式,则不执行任何操作,避免了在车内狭小空间内接收到其他语音输入的地名时误认为是新的导航指令,从而打断当前正在进行的导航服务。
当驾驶员想使用音乐服务时,语音输入界面唤醒指令“打开音乐界面”,车载设备接收到该界面唤醒指令后,打开音乐服务界面。在音乐服务界面被打开之后,驾驶员可以继续输入语音信息“播放歌曲1”,车载设备判断该语音信息与音乐服务界面对应的操作指令模板相匹配,执行对应的音乐播放操作。在提供音乐播放的过程中,假设车内其他乘客和驾驶员谈论当前流行歌曲,有可能会提到多个歌曲名,此时只要车载设备接收到的语音信息不符合“播放歌曲名”的格式,则不执行任何操作,避免了在车内狭小空间内接收到其他语音输入的歌曲名时误认为是新的播放指令,从而打断当前正在进行的音乐播放服务。
下面给出本发明实施例中语音识别装置的举例,这些装置可以实现上文中所述的语音识别方法。这些装置中的各个模块或子模块,功能对应于方法流程中的相应步骤,相关详细的解释在上文中已经给出,下面将不再赘述。
图3为本发明实施例中一种语音识别装置的框图,该装置可以位于终端中,包括:语音信息接收模块31、判断模块32和语音信息响应模块33。
语音信息接收模块31,用于接收语音信息。
判断模块32,用于判断所述语音信息与当前服务界面对应的操作指令模板是否匹配,将判断结果发送给语音信息响应模块33。
语音信息响应模块33,用于在所述语音信息与所述操作指令模板相匹配时,执行所述语音信息指示的操作,在所述语音信息与所述操作执行模板不相匹配时,不执行操作。
图4为本发明实施例中一种语音识别装置的框图,该装置可以位于终端中,包括:语音信息接收模块31、判断模块32、语音信息响应模块33和唤醒模块34。
本发明实施例中的操作指令模块可以包括:关键词排列顺序和关键词词库。
语音信息接收模块31,用于接收语音信息。
判断模块32可以包括语音信息分析子模块321、第一判断子模块322和第二判断子模块323。
语音信息分析子模块321,用于对所述语音信息进行组词划分。
第一判断子模块322,用于根据所述进行组词划分后得到的关键词的分拆和组合,判断进行组词划分后得到的关键词是否包含在所述关键词词库中,在所述进行组词划分后得到的关键词包含在所述关键词词库中时,触发第二判断子模块323执行操作,在所述进行组词划分后得到的关键词未包含在所述关键词词库中时,确定所述语音信息与所述操作指令模板不相匹配。
作为一种可选的替换方式,为了避免关键词词库不全,在对判断模块322判断所述进行组词划分后得到的关键词未包含在所述关键词词库中时,还可以给用户提供显示确认的可选功能。在这种情况下,第一判断子模块322可以进一步包括:第一判断执行子模块3221、显示子模块3222和触发模块3223。包含这部分的装置框图如图5所示。
第一判断执行子模块3221,用于根据所述进行组词划分后得到的关键词的分拆和组合,判断进行组词划分后得到的关键词是否包含在所述关键词词库中,在所述进行组词划分后得到的关键词包含在所述关键词词库中时,触发第二判断子模块323执行操作,在所述进行组词划分后得到的关键词未包含在所述关键词词库中时,触发显示子模块3222执行操作。
显示子模块3222,用于在所述进行组词划分后得到的关键词未包含在所述关键词词库中时,显示未包含在所述关键词词库中的进行组词划分得到的关键词。
触发模块3223,用于在接收到确认指令之后,触发第二判断子模块323执行操作;在接到否定指令之后,确定所述语音信息与所述操作指令模板不相匹配。
作为另一种可选的实施方式,为了提升处理效率,第一判断子模块322可以进一步包括:第二判断执行子模块3224和第三判断执行子模块3225。包含这部分的装置框图如图5A所示。
第二判断执行子模块3224,用于根据所述进行组词划分后得到的关键词的分拆和组合,判断进行组词划分后得到的关键词中是否包含指令关键词,在所述进行组词划分后得到的关键词中包含指令关键词时,触发第三判断执行子模块3225执行操作,在所述进行组词划分后得到的关键词中不包含指令关键词时,确定所述语音信息与所述操作指令模板不相匹配。
第三判断执行子模块3225,用于判断进行组词划分后得到的关键词是否包含在所述关键词词库中,在所述进行组词划分后得到的关键词包含在所述关键词词库中时,触发第二判断子模块323执行操作,在所述进行组词划分后得到的关键词未包含在所述关键词词库中时,确定所述语音信息与所述操作指令模板不相匹配。
第二判断子模块323,用于判断进行组词划分后得到的关键词是否与所述关键词排列顺序匹配,在进行组词划分后得到的关键词与所述关键词排列顺序相匹配时,确定所述语音信息与所述操作指令模板相匹配;在进行组词划分后得到的关键词与所述关键词排列顺序不相匹配时,确定所述语音信息与所述操作指令模板相匹配。
语音信息响应模块33,用于在所述语音信息与所述操作指令模板匹配时,执行所述语音信息指示的操作,在所述语音信息与所述操作执行模板不匹配时,不执行操作。
唤醒模块34,用于接收界面唤醒指令,打开与所述界面唤醒指令对应的所述当前服务界面。
图6是根据一示例性实施例示出的一种用于语音识别的装置600的框图。例如,装置600可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图6,装置600可以包括以下一个或多个组件:处理组件602,存储器604,电力组件606,多媒体组件608,音频组件610,输入/输出(I/O)的接口612,传感器组件614,以及通信组件616。
处理组件602通常控制装置600的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件602可以包括一个或多个处理器620来执行指令,以完成上述语音识别方法的全部或部分步骤。此外,处理组件602可以包括一个或多个模块,便于处理组件602和其他组件之间的交互。例如,处理组件602可以包括多媒体模块,以方便多媒体组件608和处理组件602之间的交互。
存储器604被配置为存储各种类型的数据以支持在设备600的操作。这些数据的示例包括用于在装置600上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件606为装置600的各种组件提供电力。电力组件606可以包括电源管理***,一个或多个电源,及其他与为装置600生成、管理和分配电力相关联的组件。
多媒体组件608包括在所述装置600和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件608包括一个前置摄像头和/或后置摄像头。当设备600处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件610被配置为输出和/或输入音频信号。例如,音频组件610包括一个麦克风(MIC),当装置600处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通信组件616发送。在一些实施例中,音频组件610还包括一个扬声器,用于输出音频信号。
I/O接口612为处理组件602和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件614包括一个或多个传感器,用于为装置600提供各个方面的状态评估。例如,传感器组件614可以检测到设备600的打开/关闭状态,组件的相对定位,例如所述组件为装置600的显示器和小键盘,传感器组件614还可以检测装置600或装置600一个组件的位置改变,用户与装置600接触的存在或不存在,装置600方位或加速/减速和装置600的温度变化。传感器组件614可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件614还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件614还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件616被配置为便于装置600和其他设备之间有线或无线方式的通信。装置600可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件616经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件616还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置600可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器604,上述指令可由装置600的处理器620执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。说明书旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。实施例仅被视为示例性的,本发明的真正范围和精神由权利要求指出。

Claims (6)

1.一种语音识别方法,其特征在于,所述方法包括:
接收语音信息;
判断所述语音信息与当前服务界面对应的操作指令模板是否匹配,包括:对所述语音信息进行组词划分;根据所述进行组词划分后得到的关键词的分拆和组合,判断进行组词划分后得到的关键词是否包含在所述关键词词库中;若所述进行组词划分后得到的关键词包含在所述关键词词库中,判断进行组词划分后得到的关键词是否与所述关键词排列顺序匹配;若进行组词划分后得到的关键词与所述关键词排列顺序相匹配,确定所述语音信息与所述操作指令模板相匹配;若进行组词划分后得到的关键词与所述关键词排列顺序不相匹配,确定所述语音信息与所述操作指令模板不相匹配;若所述进行组词划分后得到的关键词未包含在所述关键词词库中,确定所述语音信息与所述操作指令模板不相匹配;
若所述语音信息与所述操作指令模板相匹配,执行所述语音信息指示的操作,若所述语音信息与所述操作执行模板不相匹配,不执行操作;
其中,所述操作指令模板,包括:关键词排列顺序和关键词词库。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
若所述进行组词划分后得到的关键词未包含在所述关键词词库中,显示未包含在所述关键词词库中的进行组词划分得到的关键词;
当接收到确认指令之后,继续执行所述判断进行组词划分后得到的关键词是否与所述关键词排列顺序匹配的步骤;当接到否定指令之后,确定所述语音信息与所述操作指令模板不相匹配。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:
所述判断进行组词划分后得到的关键词是否包含在所述关键词词库中之前,判断进行组词划分后得到的关键词中是否包含指令关键词;
若所述进行组词划分后得到的关键词中包含指令关键词,继续执行所述判断进行组词划分后得到的关键词是否包含在所述关键词词库中的步骤;若所述进行组词划分后得到的关键词中不包含指令关键词,确定所述语音信息与所述操作指令模板不相匹配。
4.一种语音识别装置,其特征在于,所述装置包括:
语音信息接收模块,用于接收语音信息;
判断模块,用于判断所述语音信息与当前服务界面对应的操作指令模板是否匹配,包括:语音信息分析子模块,用于对所述语音信息进行组词划分;第一判断子模块,用于根据所述进行组词划分后得到的关键词的分拆和组合,判断进行组词划分后得到的关键词是否包含在所述关键词词库中,在所述进行组词划分后得到的关键词包含在所述关键词词库中时,触发第二判断子模块执行操作,在所述进行组词划分后得到的关键词未包含在所述关键词词库中时,确定所述语音信息与所述操作指令模板不相匹配;第二判断子模块,用于判断进行组词划分后得到的关键词是否与所述关键词排列顺序匹配,在进行组词划分后得到的关键词与所述关键词排列顺序相匹配时,确定所述语音信息与所述操作指令模板相匹配;在进行组词划分后得到的关键词与所述关键词排列顺序不相匹配时,确定所述语音信息与所述操作指令模板不相匹配;
语音信息响应模块,用于在所述语音信息与所述操作指令模板相匹配时,执行所述语音信息指示的操作,在所述语音信息与所述操作执行模板不相匹配时,不执行操作;
其中,所述操作指令模板,包括:关键词排列顺序和关键词词库。
5.如权利要求4所述的装置,其特征在于,所述第一判断子模块,包括:
第一判断执行子模块,用于根据所述进行组词划分后得到的关键词的分拆和组合,判断进行组词划分后得到的关键词是否包含在所述关键词词库中,在所述进行组词划分后得到的关键词包含在所述关键词词库中时,触发第二判断子模块执行操作,在所述进行组词划分后得到的关键词未包含在所述关键词词库中时,触发显示子模块执行操作;
显示子模块,用于在所述进行组词划分后得到的关键词未包含在所述关键词词库中时,显示未包含在所述关键词词库中的进行组词划分得到的关键词;
触发模块,用于在接收到确认指令之后,触发所述第二判断子模块执行操作;在接到否定指令之后,确定所述语音信息与所述操作指令模板不相匹配。
6.如权利要求4所述的装置,其特征在于,所述第一判断子模块,包括:
第二判断执行子模块,用于根据所述进行组词划分后得到的关键词的分拆和组合,判断进行组词划分后得到的关键词中是否包含指令关键词,在所述进行组词划分后得到的关键词中包含指令关键词时,触发第三判断执行子模块执行操作,在所述进行组词划分后得到的关键词中不包含指令关键词时,确定所述语音信息与所述操作指令模板不相匹配;
第三判断执行子模块,用于判断进行组词划分后得到的关键词是否包含在所述关键词词库中,在所述进行组词划分后得到的关键词包含在所述关键词词库中时,触发第二判断子模块执行操作,在所述进行组词划分后得到的关键词未包含在所述关键词词库中时,确定所述语音信息与所述操作指令模板不相匹配。
CN201610389407.7A 2016-06-02 2016-06-02 语音识别方法及装置 Active CN106098066B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610389407.7A CN106098066B (zh) 2016-06-02 2016-06-02 语音识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610389407.7A CN106098066B (zh) 2016-06-02 2016-06-02 语音识别方法及装置

Publications (2)

Publication Number Publication Date
CN106098066A CN106098066A (zh) 2016-11-09
CN106098066B true CN106098066B (zh) 2020-01-17

Family

ID=57447219

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610389407.7A Active CN106098066B (zh) 2016-06-02 2016-06-02 语音识别方法及装置

Country Status (1)

Country Link
CN (1) CN106098066B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107452382A (zh) * 2017-07-19 2017-12-08 珠海市魅族科技有限公司 语音操作方法及装置、计算机装置和计算机可读存储介质
CN108873713A (zh) * 2018-06-25 2018-11-23 广州市锐尚展柜制作有限公司 一种应用于智能家居中的人机交互方法及***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104219388A (zh) * 2014-08-28 2014-12-17 小米科技有限责任公司 语音控制方法和装置
CN105529025A (zh) * 2014-09-28 2016-04-27 联想(北京)有限公司 一种语音操作输入方法及电子设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10129005B4 (de) * 2001-06-15 2005-11-03 Harman Becker Automotive Systems Gmbh Verfahren zur Spracherkennung und Spracherkennungssystem
JP4667138B2 (ja) * 2005-06-30 2011-04-06 キヤノン株式会社 音声認識方法及び音声認識装置
CN102750949B (zh) * 2012-07-16 2015-04-01 深圳市车音网科技有限公司 语音识别方法和装置
CN203157896U (zh) * 2013-04-08 2013-08-28 郑州宇通客车股份有限公司 车载语音控制***及采用该语音控制***的客车
CN103219005B (zh) * 2013-04-28 2016-01-20 北京云知声信息技术有限公司 一种语音识别方法及装置
CN103280217B (zh) * 2013-05-02 2016-05-04 锤子科技(北京)有限公司 一种移动终端的语音识别方法及其装置
CN103646646B (zh) * 2013-11-27 2018-08-31 联想(北京)有限公司 一种语音控制方法及电子设备
CN105632487B (zh) * 2015-12-31 2020-04-21 北京奇艺世纪科技有限公司 一种语音识别方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104219388A (zh) * 2014-08-28 2014-12-17 小米科技有限责任公司 语音控制方法和装置
CN105529025A (zh) * 2014-09-28 2016-04-27 联想(北京)有限公司 一种语音操作输入方法及电子设备

Also Published As

Publication number Publication date
CN106098066A (zh) 2016-11-09

Similar Documents

Publication Publication Date Title
CN105489220B (zh) 语音识别方法及装置
CN104978868A (zh) 到站提醒方法及装置
US20140358566A1 (en) Methods and devices for audio processing
CN105426094B (zh) 信息粘贴方法及装置
US11335348B2 (en) Input method, device, apparatus, and storage medium
KR102334299B1 (ko) 음성 정보 처리 방법, 장치, 프로그램 및 저장 매체
CN105451202A (zh) 短信处理方法及装置
CN107229403B (zh) 一种信息内容选择方法及装置
CN110110315B (zh) 待办项管理方法和装置
CN112068711A (zh) 一种输入法的信息推荐方法、装置和电子设备
CN106657543B (zh) 语音信息处理方法及装置
CN111061452A (zh) 用户界面的语音控制方法和装置
CN108766427B (zh) 语音控制方法及装置
CN106098066B (zh) 语音识别方法及装置
RU2643470C2 (ru) Способ поиска и устройство поиска
WO2017206133A1 (zh) 语音识别方法及装置
CN109461461B (zh) 音频播放方法、装置、电子设备及储存介质
CN106060253B (zh) 信息呈现的方法及装置
CN104991779A (zh) 提示方法及装置
CN111667827B (zh) 应用程序的语音控制方法、装置及存储介质
CN113127613B (zh) 聊天信息处理方法及装置
CN110362760B (zh) 一种智能提示搜索结果的方法、装置及介质
CN113946228A (zh) 语句推荐方法、装置、电子设备和可读存储介质
CN109558017B (zh) 一种输入方法、装置和电子设备
CN107315590B (zh) 通知消息处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant