CN109166582A - 一种语音识别的自动控制***及方法 - Google Patents

一种语音识别的自动控制***及方法 Download PDF

Info

Publication number
CN109166582A
CN109166582A CN201811203917.6A CN201811203917A CN109166582A CN 109166582 A CN109166582 A CN 109166582A CN 201811203917 A CN201811203917 A CN 201811203917A CN 109166582 A CN109166582 A CN 109166582A
Authority
CN
China
Prior art keywords
speech recognition
phonetic order
recognition apparatus
voice signal
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811203917.6A
Other languages
English (en)
Inventor
张云翔
饶竹
饶竹一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Power Supply Co ltd
Original Assignee
Shenzhen Power Supply Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Power Supply Co ltd filed Critical Shenzhen Power Supply Co ltd
Priority to CN201811203917.6A priority Critical patent/CN109166582A/zh
Publication of CN109166582A publication Critical patent/CN109166582A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种语音识别的自动控制***,其包括至少两个语音识别设备,以及接收模块、分析模块、选择模块和控制模块;接收模块用于获取至少两个语音识别设备接收的目标语音信号;分析模块用于将目标语音信号转化为对应的语音指令;选择模块用于根据语音指令在至少两个语音识别设备中选择可响应语音指令的目标语音识别设备;控制模块用于发送识别命令至目标语音识别设备,以控制目标语音识别设备对目标语音信号进行识别。本发明可以提高语音指令在多个语音识别设备中控制的准确度。

Description

一种语音识别的自动控制***及方法
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音识别的自动控制***及方法。
背景技术
随着电子技术的不断发展,各种交互式***都采用了语音交互的方式,语音交互已成为一种重要的人机交互方式,以提高与用户的互动效率和提高趣味性。例如问答***,先通过语音或图像显示的方式向用户抛出问题,然后用户语音回答。再例如一些展示***,需要用户发出语音指令来选择展示哪些目录中的内容。在这些场景下都需要对用户的语音进行准确识别,才能在问答***下判断用户给出的语音答案是否正确,以及在展示***下判断用户到底选择了哪些目录,以便展示相应目录中的内容。
然而,在实际应用中,当多台具有语音识别功能的电子设备设置的距离较近的时候,用户使用语音指令对某一台电子设备进行操作时,其他电子设备会同时接收到该语音命令并作出不必要的响应。
发明内容
为解决上述技术问题,本发明提供一种语音识别的自动控制***及方法,可以提高语音指令在多个语音识别设备中控制的准确度。
本发明提供的一种语音识别的自动控制***,包括至少两个语音识别设备,以及接收模块、分析模块、选择模块和控制模块;
所述接收模块,用于获取所述至少两个语音识别设备接收的目标语音信号;
所述分析模块,用于将所述目标语音信号转化为对应的语音指令;
所述选择模块,用于根据所述语音指令在所述至少两个语音识别设备中选择可响应所述语音指令的目标语音识别设备;
所述控制模块,用于发送识别命令至所述目标语音识别设备,以控制所述目标语音识别设备对所述目标语音信号进行识别。
优选地,所述分析模块包括:
转换单元,用于将所述目标语音信号的特征信息转化得到至少两个文本信息;
解析单元,用于解析所述至少两个文本信息,以得到所述语音指令。
优选地,所述解析模块包括:
评分单元,用于按照预设的评分规则,根据文本信息语义的自然性及连贯性对所述至少两个文本信息中每个文本信息的语义进行评分;
语音指令生成单元,用于将评分最高的文本信息的语义作为所述语音指令。
优选地,所述选择模块包括:
时间比较单元,用于获取并比较各语音识别设备接收所述目标语音信号的时间点;
时间选择单元,用于将最早接收所述目标语音信号的语音识别设备作为所述目标语音识别设备。
优选地,所述选择模块包括:
强度选择单元,用于比较各语音识别设备所接收的目标语音信号对应的语音指令中,所包含的信号接收强度值;
强度确定单元,用于将最大信号接收强度值所对应的语音识别设备作为所述目标语音识别设备。
优选地,还包括:
通知模块,用于判断各语音识别设备接收的语音指令是语音操作控制指令,还是语音文本输入指令,若为语音操作控制指令,则控制相应的应用程序执行相应的操作,若为语音文本输入指令,则控制相应的应用程序将语音指令转化为相应的文本。
本发明还提供一种语音识别的自动控制方法,包括下述步骤:
S1、获取至少两个语音识别设备接收的目标语音信号;
S2、将所述目标语音信号转化为对应的语音指令;
S3、根据所述语音指令在所述至少两个语音识别设备中选择可响应所述语音指令的目标语音识别设备;
S4、发送识别命令至所述目标语音识别设备,以控制所述目标语音识别设备对所述目标语音信号进行识别。
优选地,步骤S2包括:
S21、将所述目标语音信号的特征信息转化得到至少两个文本信息;
S22、解析所述至少两个文本信息,以得到所述语音指令。
优选地,步骤S22包括:
按照预设的评分规则,根据文本信息语义的自然性及连贯性对所述至少两个文本信息中每个文本信息的语义进行评分;
将评分最高的文本信息的语义作为所述语音指令。
优选地,步骤S3包括:
获取并比较各语音识别设备接收所述目标语音信号的时间点;
将最早接收所述目标语音信号的语音识别设备作为所述目标语音识别设备。
实施本发明,具有如下有益效果:当用户想通过语音指令对多个语音识别设备中的某一个语音识别设备进行控制时,先通过接收模块获取对应的目标语音信号,分析模块将目标语音信号转换为对应的语音指令,选择模块根据语音指令确定目标语音识别设备,控制模块发送识别指令至目标语音识别设备,控制目标语音识别设备对目标语音信号进行识别。这样就避免了聚集在一起且间距较小的多个语音识别装置同时响应用户的语音指令,能实现用户使用语音指令时仅对所需要控制的语音识别设备进行控制,避免其他语音识别设备不必要的响应,使设置较近的语音识别设备不会相互干扰,提高用户语音命令控制的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的语音识别的自动控制***的原理框图。
图2是本发明提供的语音识别的自动控制方法的流程图。
具体实施方式
本发明提供一种语音识别的自动控制***,如图1所示,该自动控制***包括至少两个语音识别设备1,以及接收模块2、分析模块3、选择模块4和控制模块5。
接收模块2用于获取至少两个语音识别设备1接收的目标语音信号。目标语音信号也即是语音识别设备1将用户的语音内容转化为对应的目标语音信号(例如可以是对应的电信号),目标语音信号中包含有语音指令。
分析模块3用于将目标语音信号转化为对应的语音指令。
选择模块4用于根据语音指令在至少两个语音识别设备1中选择可响应语音指令的目标语音识别设备。
控制模块5用于发送识别命令至目标语音识别设备,以控制目标语音识别设备对其获取的目标语音信号进行识别。
进一步地,分析模块3包括:转换单元、解析单元。
转换单元用于将目标语音信号的特征信息转化得到至少两个文本信息。
解析单元用于解析至少两个文本信息,以得到语音指令。
进一步地,解析模块包括:评分单元、语音指令生成单元。
评分单元用于按照预设的评分规则,根据文本信息语义的自然性及连贯性对至少两个文本信息中每个文本信息的语义进行评分。评分的高低体现出文本信息的语义的自然性及连贯性的优劣。
语音指令生成单元用于将评分最高的文本信息的语义作为语音指令。
进一步地,选择模块4包括:时间比较单元、时间选择单元。或者,选择模块4包括:强度选择单元、强度确定单元。
时间比较单元用于获取并比较各语音识别设备1接收目标语音信号的时间点,以确定最早接收目标语音信号的语音识别设备1。
时间选择单元用于将最早接收目标语音信号的语音识别设备1作为目标语音识别设备。
强度选择单元用于比较各语音识别设备1所接收的目标语音信号对应的语音指令中,所包含的信号接收强度值。
强度确定单元用于将最大信号接收强度值所对应的语音识别设备1作为目标语音识别设备。
进一步地,语音识别的自动控制***还包括:通知模块(图中未示出)。
通知模块可以设置在语音识别装置中,通知模块用于根据获取的识别命令启动与语音指令相对应的应用程序。具体为,通知模块将接收到的语音指令进行命令字转换,通过对命令字的判断,进而判断各语音识别设备接收的语音指令是语音操作控制指令,还是语音文本输入指令,若为语音操作控制指令,则控制相应的应用程序执行相应的操作(例如打开音乐播放、打开视频播放等),若为语音文本输入指令,则控制相应的应用程序将语音指令转化为相应的文本并进行显示。
本发明提供一种语音识别的自动控制方法,如图2所示,该方法包括下述步骤:
S1、获取至少两个语音识别设备接收的目标语音信号;
S2、将目标语音信号转化为对应的语音指令;
S3、根据语音指令在至少两个语音识别设备1中选择可响应语音指令的目标语音识别设备;
S4、发送识别命令至目标语音识别设备,以控制目标语音识别设备对目标语音信号进行识别。
进一步地,步骤S2包括:
S21、将目标语音信号的特征信息转化得到至少两个文本信息;
S22、解析至少两个文本信息,以得到语音指令。
进一步地,步骤S22包括:
按照预设的评分规则,根据文本信息语义的自然性及连贯性对至少两个文本信息中每个文本信息的语义进行评分;
将评分最高的文本信息的语义作为语音指令。
进一步地,步骤S3包括:
获取并比较各语音识别设备1接收目标语音信号的时间点;
将最早接收目标语音信号的语音识别设备1作为目标语音识别设备。
综上所述,本发明提供的语音识别的自动控制***及方法,当用户想通过语音指令对多个语音识别设备1中的某一个语音识别设备1进行控制时,先通过接收模块2获取对应的目标语音信号,分析模块3将目标语音信号转换为对应的语音指令,选择模块4根据语音指令确定目标语音识别设备,控制模块5发送识别指令至目标语音识别设备,控制目标语音识别设备对目标语音信号进行识别。这样就避免了聚集在一起且间距较小的多个语音识别装置同时响应用户的语音指令。
本发明能实现用户使用语音指令时仅对所需要控制的语音识别设备1进行控制,避免其他语音识别设备1不必要的响应,使设置较近的语音识别设备1不会相互干扰,提高用户语音命令控制的准确度。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种语音识别的自动控制***,其特征在于,包括至少两个语音识别设备,以及接收模块、分析模块、选择模块和控制模块;
所述接收模块,用于获取所述至少两个语音识别设备接收的目标语音信号;
所述分析模块,用于将所述目标语音信号转化为对应的语音指令;
所述选择模块,用于根据所述语音指令在所述至少两个语音识别设备中选择可响应所述语音指令的目标语音识别设备;
所述控制模块,用于发送识别命令至所述目标语音识别设备,以控制所述目标语音识别设备对所述目标语音信号进行识别。
2.根据权利要求1所述的语音识别的自动控制***,其特征在于,所述分析模块包括:
转换单元,用于将所述目标语音信号的特征信息转化得到至少两个文本信息;
解析单元,用于解析所述至少两个文本信息,以得到所述语音指令。
3.根据权利要求2所述的语音识别的自动控制***,其特征在于,所述解析模块包括:
评分单元,用于按照预设的评分规则,根据文本信息语义的自然性及连贯性对所述至少两个文本信息中每个文本信息的语义进行评分;
语音指令生成单元,用于将评分最高的文本信息的语义作为所述语音指令。
4.根据权利要求1所述的语音识别的自动控制***,其特征在于,所述选择模块包括:
时间比较单元,用于获取并比较各语音识别设备接收所述目标语音信号的时间点;
时间选择单元,用于将最早接收所述目标语音信号的语音识别设备作为所述目标语音识别设备。
5.根据权利要求1所述的语音识别的自动控制***,其特征在于,所述选择模块包括:
强度选择单元,用于比较各语音识别设备所接收的目标语音信号对应的语音指令中,所包含的信号接收强度值;
强度确定单元,用于将最大信号接收强度值所对应的语音识别设备作为所述目标语音识别设备。
6.根据权利要求1所述的语音识别的自动控制***,其特征在于,还包括:
通知模块,用于判断各语音识别设备接收的语音指令是语音操作控制指令,还是语音文本输入指令,若为语音操作控制指令,则控制相应的应用程序执行相应的操作,若为语音文本输入指令,则控制相应的应用程序将语音指令转化为相应的文本。
7.一种语音识别的自动控制方法,其特征在于,包括下述步骤:
S1、获取至少两个语音识别设备接收的目标语音信号;
S2、将所述目标语音信号转化为对应的语音指令;
S3、根据所述语音指令在所述至少两个语音识别设备中选择可响应所述语音指令的目标语音识别设备;
S4、发送识别命令至所述目标语音识别设备,以控制所述目标语音识别设备对所述目标语音信号进行识别。
8.根据权利要求7所述的语音识别的自动控制方法,其特征在于,步骤S2包括:
S21、将所述目标语音信号的特征信息转化得到至少两个文本信息;
S22、解析所述至少两个文本信息,以得到所述语音指令。
9.根据权利要求8所述的语音识别的自动控制方法,其特征在于,步骤S22包括:
按照预设的评分规则,根据文本信息语义的自然性及连贯性对所述至少两个文本信息中每个文本信息的语义进行评分;
将评分最高的文本信息的语义作为所述语音指令。
10.根据权利要求7所述的语音识别的自动控制方法,其特征在于,步骤S3包括:
获取并比较各语音识别设备接收所述目标语音信号的时间点;
将最早接收所述目标语音信号的语音识别设备作为所述目标语音识别设备。
CN201811203917.6A 2018-10-16 2018-10-16 一种语音识别的自动控制***及方法 Pending CN109166582A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811203917.6A CN109166582A (zh) 2018-10-16 2018-10-16 一种语音识别的自动控制***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811203917.6A CN109166582A (zh) 2018-10-16 2018-10-16 一种语音识别的自动控制***及方法

Publications (1)

Publication Number Publication Date
CN109166582A true CN109166582A (zh) 2019-01-08

Family

ID=64878330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811203917.6A Pending CN109166582A (zh) 2018-10-16 2018-10-16 一种语音识别的自动控制***及方法

Country Status (1)

Country Link
CN (1) CN109166582A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110232924A (zh) * 2019-06-03 2019-09-13 中国第一汽车股份有限公司 车载语音管理方法、装置、车辆及存储介质
CN112530432A (zh) * 2020-12-01 2021-03-19 苏州三六零智能安全科技有限公司 动态显示***、装置及方法
CN115035894A (zh) * 2020-12-01 2022-09-09 华为技术有限公司 一种设备响应方法和装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1234541A (zh) * 1998-05-05 1999-11-10 范金波 汉字单字音意语音输入方法
CN101345051A (zh) * 2008-08-19 2009-01-14 南京师范大学 带定量参数的地理信息***语音控制方法
CN102571833A (zh) * 2010-12-15 2012-07-11 盛乐信息技术(上海)有限公司 基于服务器集群的分布式语音识别***及方法
CN103377212A (zh) * 2012-04-19 2013-10-30 腾讯科技(深圳)有限公司 一种语音控制浏览器动作的方法、***及浏览器
CN103916688A (zh) * 2013-01-07 2014-07-09 三星电子株式会社 交互服务器、显示设备及其控制方法
CN103915095A (zh) * 2013-01-06 2014-07-09 华为技术有限公司 语音识别的方法、交互设备、服务器和***
CN106354112A (zh) * 2016-10-26 2017-01-25 安徽省云逸智能科技有限公司 一种用于智能家居设备的语音识别控制***
CN107591150A (zh) * 2017-08-16 2018-01-16 珠海市魅族科技有限公司 语音识别方法及装置、计算机装置及计算机可读存储介质
CN108461084A (zh) * 2018-03-01 2018-08-28 广东美的制冷设备有限公司 语音识别***控制方法、控制装置及计算机可读存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1234541A (zh) * 1998-05-05 1999-11-10 范金波 汉字单字音意语音输入方法
CN101345051A (zh) * 2008-08-19 2009-01-14 南京师范大学 带定量参数的地理信息***语音控制方法
CN102571833A (zh) * 2010-12-15 2012-07-11 盛乐信息技术(上海)有限公司 基于服务器集群的分布式语音识别***及方法
CN103377212A (zh) * 2012-04-19 2013-10-30 腾讯科技(深圳)有限公司 一种语音控制浏览器动作的方法、***及浏览器
CN103915095A (zh) * 2013-01-06 2014-07-09 华为技术有限公司 语音识别的方法、交互设备、服务器和***
CN103916688A (zh) * 2013-01-07 2014-07-09 三星电子株式会社 交互服务器、显示设备及其控制方法
CN106354112A (zh) * 2016-10-26 2017-01-25 安徽省云逸智能科技有限公司 一种用于智能家居设备的语音识别控制***
CN107591150A (zh) * 2017-08-16 2018-01-16 珠海市魅族科技有限公司 语音识别方法及装置、计算机装置及计算机可读存储介质
CN108461084A (zh) * 2018-03-01 2018-08-28 广东美的制冷设备有限公司 语音识别***控制方法、控制装置及计算机可读存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110232924A (zh) * 2019-06-03 2019-09-13 中国第一汽车股份有限公司 车载语音管理方法、装置、车辆及存储介质
CN112530432A (zh) * 2020-12-01 2021-03-19 苏州三六零智能安全科技有限公司 动态显示***、装置及方法
CN115035894A (zh) * 2020-12-01 2022-09-09 华为技术有限公司 一种设备响应方法和装置

Similar Documents

Publication Publication Date Title
US10403282B2 (en) Method and apparatus for providing voice service
CN109166582A (zh) 一种语音识别的自动控制***及方法
US20180182399A1 (en) Control method for control device, control method for apparatus control system, and control device
CN111739553A (zh) 会议声音采集、会议记录以及会议记录呈现方法和装置
US20110264452A1 (en) Audio output of text data using speech control commands
US11195519B2 (en) Vocal triggering of presentation transitions
CN110830771A (zh) 智能监控方法、装置、设备及计算机可读存储介质
CN112102828A (zh) 大屏幕自动播报内容的语音控制方法及***
CN109657099B (zh) 一种学习互动方法及学习客户端
CN111711834A (zh) 录播互动课的生成方法、装置、存储介质以及终端
CN112817558A (zh) 听写数据处理的方法、装置、可读存储介质和电子设备
CN111933135A (zh) 终端控制方法、装置、智能终端及计算机可读存储介质
JP6452165B2 (ja) 問合せ対応支援装置、システム、方法及びプログラム
JP6689953B2 (ja) 通訳サービスシステム、通訳サービス方法及び通訳サービスプログラム
US20200374245A1 (en) Computer-readable recording medium recording conversation control program, conversation control method, and information processing device
CN111292749B (zh) 智能语音平台的会话控制方法及装置
JP2018156060A (ja) 情報処理装置、プログラム及び情報処理方法
CN112328308A (zh) 用于识别文本的方法和装置
CN109376282A (zh) 一种基于人工智能的人机智能聊天的方法和装置
CN114999496A (zh) 音频传输方法、控制设备及终端设备
CN112380871A (zh) 语义识别方法、设备及介质
CN111081090B (zh) 一种点读场景下的信息输出方法及学习设备
KR102687849B1 (ko) 학습자의 음성 명령을 인식하는 화상 학습 시스템 및 그 방법
CN113657770A (zh) 实验操作评分***及方法
US20210271358A1 (en) Information processing apparatus for executing in parallel plurality of pieces of processing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190108