CN113782023A - 一种基于程控指令的语音控制方法及*** - Google Patents

一种基于程控指令的语音控制方法及*** Download PDF

Info

Publication number
CN113782023A
CN113782023A CN202111129109.1A CN202111129109A CN113782023A CN 113782023 A CN113782023 A CN 113782023A CN 202111129109 A CN202111129109 A CN 202111129109A CN 113782023 A CN113782023 A CN 113782023A
Authority
CN
China
Prior art keywords
voice
control
program
instruction
instrument
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111129109.1A
Other languages
English (en)
Inventor
刘公政
田野
周钦山
张明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CLP Kesiyi Technology Co Ltd
Original Assignee
CLP Kesiyi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CLP Kesiyi Technology Co Ltd filed Critical CLP Kesiyi Technology Co Ltd
Priority to CN202111129109.1A priority Critical patent/CN113782023A/zh
Publication of CN113782023A publication Critical patent/CN113782023A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供了一种基于程控指令的语音控制方法及***,所述方法包括以下步骤:获取用户语音;语音识别及控制程序对获取的用户语音进行分析识别,得到识别结果;通过SCPI指令映射程序完成识别结果到SCPI指令的转换;根据SCPI指令完成仪器控制。本发明采用语音识别技术,具有优良的兼容性和灵活性,可应用于信号/频谱分析仪、信号分析软件及任意兼容SCPI程控指令的测试仪器设备等。

Description

一种基于程控指令的语音控制方法及***
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于程控指令的语音控制方法及***。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
语音识别技术,也称为自动语音识别(Automatic Speech Recognition,ASR),其目标是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。语音识别是设计心理学、生理学、声学、语言学、信息理论、信号处理、计算机科学、模式识别等多个学科的交叉技术,具有广阔的应用前景。语音识别技术首先对语音信号进行采样,提取声学特征,利用相应的技术和理论构建声学模型,并采用随机模型、神经网络等方法进行语音处理,得到识别结果。
SCPI(Standard Commands for Programmable Instruments,可编程仪器标准命令)于1990年面世,定义了一套用于控制可编程测试测量仪器的标准语法、命令结构以及数据格式。该命令可用于任一仪器,且同一类命令属于同一子***里。SCPI同时也定义了若干仪器的种类。SCPI命令是ASCII字符串,通过物理传输层传入仪器。命令由一连串的关键字构成,有的还需要包括参数。在协议中,命令规定为如下形式:CONFigure。在使用中,既可以写全名,也可以仅写包含大写字母的缩写。通常仪器对于查询命令的反馈也为ASCII代码,在传输大量数据时,二进制数据也是可以使用的。
现有的信号/频谱分析仪支持的操控方式主要有面板按键操控、触摸屏触控操作和局域网内的远程控制操控手段。面板按键操控和触摸屏触摸操控手段从本质上来说是一种操控手段,都是通过点按按钮来完成对仪器的控制,区别在于面板按键方式点按的是实体按键,而触摸屏点按的是虚拟按键;而局域网内的远程控制手段采用的是SCPI程控指令,从上位机对仪器进行控制。这三种操控方式都需要具备一定的专业知识,且对仪器有一定深度的熟悉和了解,才能较好的操控仪器,但操作流程复杂,菜单按键繁多,不同版本的仪器菜单和按键布局不同导致操作难度进一步提升,尤其是远程控制手段,用户需要直接记忆成千上万条SCPI指令,用户体验极差。
目前市面上尚未有任何一款信号/频谱分析仪产品支持语音控制手段,而是仍然采用面板实体按键、触摸屏虚拟按键及SCPI指令等操控手段,操作复杂度高,便利性差。
发明内容
本发明为了解决上述问题,提出了一种基于程控指令的语音控制方法及***,本发明采用灵活性、扩展性更高的通用的商用跨平台离线/在线语音识别SDK完成语音识别,并进一步将语音识别结果转换为SCPI标准命令,实现对仪器的控制。
根据一些实施例,本发明采用如下技术方案:
一种基于程控指令的语音控制方法,包括以下步骤:
获取用户语音;
语音识别及控制程序对获取的用户语音进行分析识别,得到识别结果;
通过SCPI指令映射程序完成识别结果到SCPI指令的转换;
根据SCPI指令完成仪器控制。
进一步地,所述根据SCPI指令完成仪器控制,包括:
得到转换后的SCPI指令后,即调用信号/频谱分析仪的程控接口,将SCPI指令发送给仪器,完成对仪器的控制。
进一步地,所述获取语音指令,包括信号/频谱分析仪启动时,语音识别及控制程序随仪器启动而启动,以后台进程形式运行,等待被唤醒,当获取到用户指定的唤醒词,语音识别及控制程序被唤醒,来到前台运行,展现用户交互界面。
进一步地,所述获取语音指令,包括,语音识别及控制程序被唤醒后,即等待用户进行语音输入,唤醒后,若未在指定时间内获取到用户的语音录入,则程序退回到后台,重新等待被唤醒。
进一步地,所述获取语音指令,还包括,通过仪器内置或外接麦克风进行获取用户的语音,单次最长支持不超过预设时间语音获取,可连续获取语音。
进一步地,所述得到识别结果后,根据用户设置输出相应的中文或英文识别结果,获取用户的观察识别结果,是否进行SCPI指令转换,若获取用户观察识别结果为不进行SCPI指令转换,则重新获取用户语音。
一种基于程控指令的语音控制***,
包括相互通信的控制终端与仪器,所述控制终端执行如下步骤:
获取语音指令;
语音识别及控制程序对获取的语音指令进行分析识别,得到识别结果;
通过SCPI指令映射程序完成识别结果到SCPI指令的转换;
所述控制终端将得到的SCPI指令发送给仪器的控制模块,仪器的控制模块根据SCPI指令完成仪器控制。
一种基于程控指令的语音控制***,包括:
语音获取模块,被配置为,获取语音指令;
语音识别模块,被配置为,语音识别及控制程序对获取的语音指令进行分析识别,得到识别结果;
SCPI指令转换模块,被配置为,通过SCPI指令映射程序完成识别结果到SCPI指令的转换;
控制仪器模块,被配置为,根据SCPI指令完成仪器控制。
一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行所述的一种基于程控指令的语音控制方法。
一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行所述的一种基于程控指令的语音控制方法。
与现有技术相比,本发明的有益效果为:
本发明采用灵活性、扩展性更高的通用的商用跨平台离线/在线语音识别SDK完成语音识别,并将语音识别结果转换为SCPI标准命令,实现对仪器的控制;本发明的语音控制方法具有普适性,该方法除适用于信号/频谱分析仪外,其他如信号源、矢量网络分析仪、综合测试仪等兼容SCPI指令的仪器都适用本方法;适用于信号/频谱分析仪等测量仪器,提升用户的操控体验。
本发明采用语音识别技术,具有优良的兼容性和灵活性,可应用于信号/频谱分析仪、信号分析软件及任意兼容SCPI程控指令的测试仪器设备等。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1是本实施例的流程图。
具体实施方式:
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例1.
如图1所示,一种基于程控指令的语音控制方法,包括以下步骤:
步骤1:语音唤醒;
步骤2:语音录入;
步骤3:语音识别,语音录入完成后,所述语音识别及控制程序即对语音进行分析识别,并根据用户设置输出相应的中文或英文识别结果,用户通过观察识别结果判断是否识别正确,若正确,进入步骤4,若不正确,进入步骤2。
步骤4:SCPI指令转换,基于语音识别的结果,通过SCPI指令映射程序完成识别结果到SCPI指令的转换,用户可选择是否显示转换后的SCPI指令。
步骤5:控制仪器,得到转换后的SCPI指令后,程序即调用信号/频谱分析仪的程控接口,将SCPI指令发送给仪器,完成对仪器的控制。
步骤6:程序退出。
具体的,
步骤1:语音唤醒。信号/频谱分析仪启动时,语音识别及控制程序随仪器启动而启动,以后台进程形式运行,等待被唤醒。当用户说出指定的唤醒词,如“你好,分析仪”时,语音识别及控制程序被唤醒,来到前台运行,展现用户交互界面。
步骤2:语音录入。语音识别及控制程序被唤醒后,即等待用户进行语音输入,用户可通过仪器内置或外接麦克风进行语音录入,单次最长支持不超过2分钟语音录入,可连续录入语音。唤醒后,若用户3秒内未进行语音录入,则程序退回到后台,回到步骤1。
步骤3:语音识别。语音录入完成后,程序即对语音进行分析识别,并根据用户设置输出响应的中文或英文识别结果,用户观察识别结果判断是否识别正确,若正确,进入步骤4,若不正确,进入步骤2。
步骤4:SCPI指令转换。基于语音识别的结果,通过SCPI指令映射程序完成识别结果到SCPI指令的转换。用户可选择是否显示转换后的SCPI指令。
步骤5:控制仪器。得到转换后的SCPI指令后,程序即调用信号/频谱分析仪的程控接口(该接口为仪器厂商开发,需提前获得),将SCPI指令发送给仪器,完成对仪器的控制。
步骤6:程序退出。完成一次对信号/频谱分析仪的语音控制操作后,用户可继续进行语音控制。若3秒内语音识别及控制程序未接收到下一次语音录入,则自动退回到后台运行,即回到步骤1,用户也可主动关闭程序界面,程序同样回到后台运行,回到步骤1。
实施例2.
一种基于程控指令的语音控制***,其特征在于,包括相互通信的控制终端与仪器,所述控制终端执行如下步骤:
获取语音指令;
语音识别及控制程序对获取的语音指令进行分析识别,得到识别结果;
通过SCPI指令映射程序完成识别结果到SCPI指令的转换;
所述控制终端将得到的SCPI指令发送给仪器的控制模块,仪器的控制模块根据SCPI指令完成仪器控制。
实施例3.
一种基于程控指令的语音控制***,包括:
语音获取模块,被配置为,获取语音指令;
语音识别模块,被配置为,语音识别及控制程序对获取的语音指令进行分析识别,得到识别结果;
SCPI指令转换模块,被配置为,通过SCPI指令映射程序完成识别结果到SCPI指令的转换;
控制仪器模块,被配置为,根据SCPI指令完成仪器控制。
实施例4.
一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行本实施例提供的一种基于程控指令的语音控制方法。
实施例5.
一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行本实施例提供的一种基于程控指令的语音控制方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种基于程控指令的语音控制方法,其特征在于,包括以下步骤:
获取用户语音;
语音识别及控制程序对获取的用户语音进行分析识别,得到识别结果;
通过SCPI指令映射程序完成识别结果到SCPI指令的转换;
根据SCPI指令完成仪器控制。
2.如权利要求1所述的一种基于程控指令的语音控制方法,其特征在于,
所述根据SCPI指令完成仪器控制,包括:
得到转换后的SCPI指令后,即调用信号/频谱分析仪的程控接口,将SCPI指令发送给仪器,完成对仪器的控制。
3.如权利要求2所述的一种基于程控指令的语音控制方法,其特征在于,
所述获取语音指令,包括信号/频谱分析仪启动时,语音识别及控制程序随仪器启动而启动,以后台进程形式运行,等待被唤醒,当获取到用户指定的唤醒词,语音识别及控制程序被唤醒,来到前台运行,展现用户交互界面。
4.如权利要求3所述的一种基于程控指令的语音控制方法,其特征在于,
所述获取语音指令,包括,语音识别及控制程序被唤醒后,即等待用户进行语音输入,唤醒后,若未在指定时间内获取到用户的语音录入,则程序退回到后台,重新等待被唤醒。
5.如权利要求4所述的一种基于程控指令的语音控制方法,其特征在于,
所述获取语音指令,还包括,通过仪器内置或外接麦克风进行获取用户的语音,单次最长支持不超过预设时间语音获取,可连续获取语音。
6.如权利要求1所述的一种基于程控指令的语音控制方法,其特征在于,
所述得到识别结果后,根据用户设置输出相应的中文或英文识别结果,获取用户的观察识别结果,是否进行SCPI指令转换,若获取用户观察识别结果为不进行SCPI指令转换,则重新获取用户语音。
7.一种基于程控指令的语音控制***,其特征在于,包括相互通信的控制终端与仪器,所述控制终端执行如下步骤:
获取语音指令;
语音识别及控制程序对获取的语音指令进行分析识别,得到识别结果;
通过SCPI指令映射程序完成识别结果到SCPI指令的转换;
所述控制终端将得到的SCPI指令发送给仪器的控制模块,仪器的控制模块根据SCPI指令完成仪器控制。
8.一种基于程控指令的语音控制***,其特征在于,包括:
语音获取模块,被配置为,获取语音指令;
语音识别模块,被配置为,语音识别及控制程序对获取的语音指令进行分析识别,得到识别结果;
SCPI指令转换模块,被配置为,通过SCPI指令映射程序完成识别结果到SCPI指令的转换;
控制仪器模块,被配置为,根据SCPI指令完成仪器控制。
9.一种计算机可读存储介质,其特征是:其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行权利要求1-6中任一项所述的一种基于程控指令的语音控制方法。
10.一种终端设备,其特征是:包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行权利要求1-6中任一项所述的一种基于程控指令的语音控制方法。
CN202111129109.1A 2021-09-26 2021-09-26 一种基于程控指令的语音控制方法及*** Pending CN113782023A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111129109.1A CN113782023A (zh) 2021-09-26 2021-09-26 一种基于程控指令的语音控制方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111129109.1A CN113782023A (zh) 2021-09-26 2021-09-26 一种基于程控指令的语音控制方法及***

Publications (1)

Publication Number Publication Date
CN113782023A true CN113782023A (zh) 2021-12-10

Family

ID=78853598

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111129109.1A Pending CN113782023A (zh) 2021-09-26 2021-09-26 一种基于程控指令的语音控制方法及***

Country Status (1)

Country Link
CN (1) CN113782023A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114979817A (zh) * 2022-08-02 2022-08-30 四川云策讯科通信技术有限公司 一种对讲机基站以及其调节配置的通信方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105551490A (zh) * 2015-12-23 2016-05-04 中国电子科技集团公司第四十一研究所 一种电子测量仪器的智能语音交互***及方法
CN105810188A (zh) * 2014-12-30 2016-07-27 联想(北京)有限公司 一种信息处理方法和电子设备
CN107516516A (zh) * 2017-08-21 2017-12-26 北京格致创想科技有限公司 基于语音交互的仪器智能控制方法及***
CN110211609A (zh) * 2019-06-03 2019-09-06 四川长虹电器股份有限公司 一种提升语音识别准确率的方法
CN110782896A (zh) * 2019-11-08 2020-02-11 中国电子科技集团公司第四十一研究所 一种基于语音控制的测量仪器测试***及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105810188A (zh) * 2014-12-30 2016-07-27 联想(北京)有限公司 一种信息处理方法和电子设备
CN105551490A (zh) * 2015-12-23 2016-05-04 中国电子科技集团公司第四十一研究所 一种电子测量仪器的智能语音交互***及方法
CN107516516A (zh) * 2017-08-21 2017-12-26 北京格致创想科技有限公司 基于语音交互的仪器智能控制方法及***
CN110211609A (zh) * 2019-06-03 2019-09-06 四川长虹电器股份有限公司 一种提升语音识别准确率的方法
CN110782896A (zh) * 2019-11-08 2020-02-11 中国电子科技集团公司第四十一研究所 一种基于语音控制的测量仪器测试***及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114979817A (zh) * 2022-08-02 2022-08-30 四川云策讯科通信技术有限公司 一种对讲机基站以及其调节配置的通信方法

Similar Documents

Publication Publication Date Title
US6311159B1 (en) Speech controlled computer user interface
CN108829235B (zh) 语音数据处理方法和支持该方法的电子设备
KR100354365B1 (ko) 음성 커맨드 입력 인식 기능이 있는 상호작용형 컴퓨터제어 디스플레이 시스템 및 그 시스템으로의 음성 커맨드입력 제공 방법
US5425128A (en) Automatic management system for speech recognition processes
US5748841A (en) Supervised contextual language acquisition system
US7054817B2 (en) User interface for speech model generation and testing
CN108717853B (zh) 一种人机语音交互方法、装置及存储介质
JP2011059659A (ja) 第1の機能及び第2の機能を含む複数の機能を有効にするためのシステムおよび方法
US20080177542A1 (en) Voice Recognition Program
CN110309570B (zh) 一种具有认知能力的多模态仿真实验容器及方法
CN110782896A (zh) 一种基于语音控制的测量仪器测试***及方法
CN110462647A (zh) 电子设备及执行电子设备的功能的方法
CN109637536B (zh) 一种自动化识别语义准确性的方法及装置
Kumar et al. Enabling the rapid development and adoption of speech-user interfaces
CN113782023A (zh) 一种基于程控指令的语音控制方法及***
KR101548907B1 (ko) 다중언어의 대화시스템 및 그 제어방법
CN106648054A (zh) 一种基于RealSense的陪伴机器人的多模式交互方法
CN102063282A (zh) 汉语语音输入***及方法
CN110491394A (zh) 唤醒语料的获取方法和装置
CN109461439A (zh) 一种语音信息指令的采集方法
CN109272983A (zh) 用于亲子教育的双语切换装置
CN109155129A (zh) 语言程控***
CN114999457A (zh) 语音***的测试方法、装置、存储介质及电子设备
Rosenfeld et al. Universal Human-Machine Speech Interface
CN109359307B (zh) 自动识别语种的翻译方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination