CN109901707A - 一种配置到***内的学习型***操作模块 - Google Patents
一种配置到***内的学习型***操作模块 Download PDFInfo
- Publication number
- CN109901707A CN109901707A CN201811606127.2A CN201811606127A CN109901707A CN 109901707 A CN109901707 A CN 109901707A CN 201811606127 A CN201811606127 A CN 201811606127A CN 109901707 A CN109901707 A CN 109901707A
- Authority
- CN
- China
- Prior art keywords
- unit
- input
- several
- input signal
- order
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明公开了一种配置到***内的学习型***操作模块,所述***操作模块包括:获取单元、构建单元、存储单元、分析单元和控制单元;获取单元,用于获取用户输入的若干***操作命令、若干第一输入信号、第二输入信号;构建单元,用于建立若干第一输入信号与若干***操作命令之间的关联关系;存储单元,用于存储第一输入信号与***操作命令之间的关联关系;分析单元,分析得到在若干第一输入信号中与第二输入信号匹配的目标输入信号,以及与该目标输入信号关联的目标***操作指令;控制单元,用于使所述***执行所述目标***操作指令。
Description
技术领域
本发明涉及***控制技术领域,尤其涉及一种配置到***内的学习型***操作模块。
背景技术
语音识别就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术,语音识别需要对语音进行语义识别,即机器需要理解语音所表达的意思,然后执行与语音所表达的意思相应的操作,在日常生活和工作中,在语音识别的场景中,用户使用的语音(关键字、句子、命令)往往比较少,同时,这些语音使用次数较为频繁,使用语音识别浪费***资源,其次,在使用智能化较低的***进行语音识别的准确率较低,再次,用户工作中的方言、特殊发音等也会影响语音识别的准确率和效率。
发明内容
基于背景技术存在的技术问题,本发明提出了一种配置到***内的学习型***操作模块;
本发明提出的一种配置到***内的学习型***操作模块,所述***操作模块包括:获取单元、构建单元、存储单元、分析单元和控制单元;
获取单元,用于获取用户输入的若干***操作命令、若干第一输入信号、第二输入信号;
构建单元,用于建立若干第一输入信号与若干***操作命令之间的关联关系;
存储单元,用于存储第一输入信号与***操作命令之间的关联关系;
分析单元,分析得到在若干第一输入信号中与第二输入信号匹配的目标输入信号,以及与该目标输入信号关联的目标***操作指令;
控制单元,用于使所述***执行所述目标***操作指令。
优选地,所述获取单元,具体用于:获取的用户输入的第一输入信号包括音频、手势、动作;获取的用户输入的第二输入信号包括音频、手势、动作。
优选地,所述构建单元,具体用于:每个***操作命令可与若干个第一输入信号建立关联关系。
优选地,所述构建单元,具体用于:每个第一输入信号仅与一个***操作命令建立关联关系。
优选地,所述获取单元,具体用于:
获取的用户输入的***操作命令包括***进行一次操作的***操作命令、***进行连续操作的***操作命令。
本发明中,获取单元用于获取用户输入的若干***操作命令、若干第一输入信号、第二输入信号;构建单元用于建立若干第一输入信号与若干***操作命令之间的关联关系;存储单元用于存储第一输入信号与***操作命令之间的关联关系;分析单元分析得到在若干第一输入信号中与第二输入信号匹配的目标输入信号,以及与该目标输入信号关联的目标***操作指令;控制单元,用于使所述***执行所述目标***操作指令,如此,在第二输入信号与第一输入信号匹配时,控制单元使所述***执行所述目标***操作指令,达到通过第二输入信号直接操作***的目的,在第一输入信号、第二输入信号为音频信号时,相对于语音识别而言,可以直接通过音频信号比对即可直接操作***,无需让机器了解音频信号所表达的意思,提高效率,其次,对于方言、特殊发音而言,直接比对音频信号的准确率会高于语音识别对方言、特殊发音的识别准确率,在第一输入信号、第二输入信号为手势信号或动作信号时,可以直接通过手势信号或动作信号比对即可直接操作***,提高工作效率,节省用户的时间成本和人工成本。
附图说明
图1为本发明提出的一种配置到***内的学习型***操作模块的结构示意图。
具体实施方式
参照图1,本发明提出的一种配置到***内的学习型***操作模块,所述***操作模块包括:获取单元、构建单元、存储单元、分析单元和控制单元;
获取单元,用于获取用户输入的若干***操作命令、若干第一输入信号、第二输入信号。
获取单元具体用于:获取的用户输入的第一输入信号包括音频、手势、动作;获取的用户输入的第二输入信号包括音频、手势、动作;获取的用户输入的***操作命令包括***进行一次操作的***操作命令、***进行连续操作的***操作命令。
在具体方案中,采集用户输入的语音信号、手势信号或肢体动作信号,用户可通过编辑***操作命令或直接执行***操作的方式输入的***操作命令,以***为智能手机***为例:智能手机内安装有日历的***应用后,用户输入一段可开启智能手机的日历的***操作命令,或,用户进行点击桌面上的智能手机的日历的图标的操作,以输入开启智能手机的日历的***操作命令。
构建单元,用于建立若干第一输入信号与若干***操作命令之间的关联关系。
构建单元具体用于:每个***操作命令可与若干个第一输入信号建立关联关系;每个第一输入信号仅与一个***操作命令建立关联关系。
存储单元,用于存储第一输入信号与***操作命令之间的关联关系。
分析单元,分析得到在若干第一输入信号中与第二输入信号匹配的目标输入信号,以及与该目标输入信号关联的目标***操作指令。
控制单元,用于使所述***执行所述目标***操作指令。
在具体方案中,获取单元获取用户输入的若干***操作命令、若干第一输入信号后,将若干第一输入信号(语音、手势或肢体动作)与若干***操作命令进行关联,例如:用户输入一条或多条语音对应***进行一次操作或连续操作的***操作命令,具体的,每个***操作命令可与若干个第一输入信号建立关联关系,每个第一输入信号仅与一个***操作命令建立关联关系,防止一个第一输入信号关联多种不同的***操作命令;以***为智能手机***为例:“打开”语音关联“打开微信的***操作命令”,或,“打开”语音关联“打开微信并搜索微信名称为AA的用户,向AA发起语音通话的***操作命令”,或,“打开”、“开启”语音关联“打开微信的***操作命令”,但是“打开”语音不能同时关联“打开微信的***操作命令”和“打开QQ的***操作命令”。
在第一输入信号与***操作命令之间的关联关系存储于存储单元后,获取用户输入的第二输入信号,将第二输入信号与第一输入信号进行匹配,在第二输入信号与第一输入信号匹配成功时,即第二输入信号与第一输入信号相符、相似度达到预设的相似度阈值或相同时,控制单元使***执行所述目标***操作指令,达到通过第二输入信号直接操作***的目的,在第一输入信号、第二输入信号为音频信号时,相对于语音识别而言,可以直接通过音频信号比对即可直接操作***,无需让机器了解音频信号所表达的意思,提高效率,其次,对于方言、特殊发音而言,直接比对音频信号的准确率会高于语音识别对方言、特殊发音的识别准确率,在第一输入信号、第二输入信号为手势信号或动作信号时,可以直接通过手势信号或动作信号比对即可直接操作***,提高工作效率,节省用户的时间成本和人工成本。
本实施方式中,获取单元用于获取用户输入的若干***操作命令、若干第一输入信号、第二输入信号;构建单元用于建立若干第一输入信号与若干***操作命令之间的关联关系;存储单元用于存储第一输入信号与***操作命令之间的关联关系;分析单元分析得到在若干第一输入信号中与第二输入信号匹配的目标输入信号,以及与该目标输入信号关联的目标***操作指令;控制单元,用于使所述***执行所述目标***操作指令,如此,在第二输入信号与第一输入信号匹配时,控制单元使所述***执行所述目标***操作指令,达到通过第二输入信号直接操作***的目的,在第一输入信号、第二输入信号为音频信号时,相对于语音识别而言,可以直接通过音频信号比对即可直接操作***,无需让机器了解音频信号所表达的意思,提高效率,其次,对于方言、特殊发音而言,直接比对音频信号的准确率会高于语音识别对方言、特殊发音的识别准确率,在第一输入信号、第二输入信号为手势信号或动作信号时,可以直接通过手势信号或动作信号比对即可直接操作***,提高工作效率,节省用户的时间成本和人工成本。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (5)
1.一种配置到***内的学习型***操作模块,其特征在于,所述***操作模块包括:获取单元、构建单元、存储单元、分析单元和控制单元;
获取单元,用于获取用户输入的若干***操作命令、若干第一输入信号、第二输入信号;
构建单元,用于建立若干第一输入信号与若干***操作命令之间的关联关系;
存储单元,用于存储第一输入信号与***操作命令之间的关联关系;
分析单元,分析得到在若干第一输入信号中与第二输入信号匹配的目标输入信号,以及与该目标输入信号关联的目标***操作指令;
控制单元,用于使所述***执行所述目标***操作指令。
2.根据权利要求1所述的配置到***内的学习型***操作模块,其特征在于,所述获取单元,具体用于:获取的用户输入的第一输入信号包括音频、手势、动作;获取的用户输入的第二输入信号包括音频、手势、动作。
3.根据权利要求1所述的配置到***内的学习型***操作模块,其特征在于,所述构建单元,具体用于:每个***操作命令可与若干个第一输入信号建立关联关系。
4.根据权利要求1所述的配置到***内的学习型***操作模块,其特征在于,所述构建单元,具体用于:每个第一输入信号仅与一个***操作命令建立关联关系。
5.根据权利要求1所述的配置到***内的学习型***操作模块,其特征在于,所述获取单元,具体用于:
获取的用户输入的***操作命令包括***进行一次操作的***操作命令、***进行连续操作的***操作命令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811606127.2A CN109901707A (zh) | 2018-12-27 | 2018-12-27 | 一种配置到***内的学习型***操作模块 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811606127.2A CN109901707A (zh) | 2018-12-27 | 2018-12-27 | 一种配置到***内的学习型***操作模块 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109901707A true CN109901707A (zh) | 2019-06-18 |
Family
ID=66943423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811606127.2A Pending CN109901707A (zh) | 2018-12-27 | 2018-12-27 | 一种配置到***内的学习型***操作模块 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109901707A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163124A (zh) * | 2010-02-18 | 2011-08-24 | 夏普株式会社 | 操作设备、电子设备和图像处理装置以及操作方法 |
US20170068646A1 (en) * | 2013-03-15 | 2017-03-09 | Salesforce.Com, Inc. | Systems and methods for creating custom actions |
US20180081447A1 (en) * | 2016-09-22 | 2018-03-22 | Qualcomm Incorporated | Systems and methods for recording custom gesture commands |
CN108172223A (zh) * | 2017-12-14 | 2018-06-15 | 深圳市欧瑞博科技有限公司 | 语音指令识别方法、装置及服务器和计算机可读存储介质 |
CN108831469A (zh) * | 2018-08-06 | 2018-11-16 | 珠海格力电器股份有限公司 | 语音命令定制方法、装置和设备及计算机存储介质 |
-
2018
- 2018-12-27 CN CN201811606127.2A patent/CN109901707A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163124A (zh) * | 2010-02-18 | 2011-08-24 | 夏普株式会社 | 操作设备、电子设备和图像处理装置以及操作方法 |
US20170068646A1 (en) * | 2013-03-15 | 2017-03-09 | Salesforce.Com, Inc. | Systems and methods for creating custom actions |
US20180081447A1 (en) * | 2016-09-22 | 2018-03-22 | Qualcomm Incorporated | Systems and methods for recording custom gesture commands |
CN108172223A (zh) * | 2017-12-14 | 2018-06-15 | 深圳市欧瑞博科技有限公司 | 语音指令识别方法、装置及服务器和计算机可读存储介质 |
CN108831469A (zh) * | 2018-08-06 | 2018-11-16 | 珠海格力电器股份有限公司 | 语音命令定制方法、装置和设备及计算机存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7005099B2 (ja) | 音声キーワードの認識方法、装置、コンピュータ読み取り可能な記憶媒体、及びコンピュータデバイス | |
US10515627B2 (en) | Method and apparatus of building acoustic feature extracting model, and acoustic feature extracting method and apparatus | |
EP3522153A1 (en) | Voice control system, wakeup method and wakeup apparatus therefor, electrical appliance and co-processor | |
JP5672487B2 (ja) | 音声言語識別装置の学習装置、音声言語の識別装置、及びそれらのためのプログラム | |
CN103745722B (zh) | 一种语音交互智能家居***及语音交互方法 | |
CN110517685B (zh) | 语音识别方法、装置、电子设备及存储介质 | |
CN102664011B (zh) | 一种快速说话人识别方法 | |
CN111880856B (zh) | 语音唤醒方法、装置、电子设备及存储介质 | |
Keshet et al. | Pac-bayesian approach for minimization of phoneme error rate | |
KR20120011010A (ko) | 수기 인식 방법 및 장치 | |
CN111400438A (zh) | 用户多意图的识别方法及装置,存储介质及车辆 | |
CN101923857A (zh) | 一种人机交互的可扩展语音识别方法 | |
US9799333B2 (en) | System and method for processing speech to identify keywords or other information | |
CN106205615A (zh) | 一种基于语音交互的控制方法及*** | |
KR20210052036A (ko) | 복수 의도어 획득을 위한 합성곱 신경망을 가진 장치 및 그 방법 | |
CN109074804A (zh) | 基于口音的语音识别处理方法、电子设备和存储介质 | |
CN110503962A (zh) | 语音识别和设定方法、装置、计算机设备和存储介质 | |
Jung et al. | Additional shared decoder on Siamese multi-view encoders for learning acoustic word embeddings | |
CN109901707A (zh) | 一种配置到***内的学习型***操作模块 | |
CN110674482B (zh) | 一种多场景应用计算机 | |
WO2020073839A1 (zh) | 语音唤醒方法、装置、***及电子设备 | |
CN102938811A (zh) | 一种基于语音识别的家庭手机通话*** | |
WO2021016925A1 (zh) | 音频处理方法及装置 | |
CN104424942A (zh) | 一种提高文字语音输入准确率的方法 | |
Huang et al. | Mandarin tone modeling using recurrent neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190618 |
|
RJ01 | Rejection of invention patent application after publication |