CN108491379A - 快捷键识别方法、装置、设备以及计算机可读存储介质 - Google Patents
快捷键识别方法、装置、设备以及计算机可读存储介质 Download PDFInfo
- Publication number
- CN108491379A CN108491379A CN201810191036.0A CN201810191036A CN108491379A CN 108491379 A CN108491379 A CN 108491379A CN 201810191036 A CN201810191036 A CN 201810191036A CN 108491379 A CN108491379 A CN 108491379A
- Authority
- CN
- China
- Prior art keywords
- shortcut key
- semantic information
- text message
- carried out
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000003860 storage Methods 0.000 title claims abstract description 17
- 238000004458 analytical method Methods 0.000 claims abstract description 24
- 238000003058 natural language processing Methods 0.000 claims description 17
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 13
- 230000000694 effects Effects 0.000 claims description 13
- 238000009432 framing Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 12
- 230000033772 system development Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 15
- 238000000605 extraction Methods 0.000 description 11
- 238000012360 testing method Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000000205 computational method Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 241000008357 Okapia johnstoni Species 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013138 pruning Methods 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 230000029058 respiratory gaseous exchange Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 238000005303 weighing Methods 0.000 description 2
- 238000000151 deposition Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0238—Programmable keyboards
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明实施例公开了一种快捷键识别方法、装置、设备以及计算机可读存储介质,其中所述方法包括读取***的配置文件,以确定相关的快捷键,其中,每个快捷键均对应设置有相应的快捷操作指令;通过对获取的语音信息进行语音识别以得到文本信息,并对所述文本信息进行语义分析,以确定相应的语义信息;根据预设规则对所述语义信息进行文本识别匹配,以确定与所述语义信息相匹配的快捷键。本发明可以简化对快捷键的识别,还能辅助快速地进行***开发和编程,提高工作效率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种快捷键识别方法、装置、设备以及计算机可读存储介质。
背景技术
集成开发环境(IDE,Integrated Development Environment)是用于提供程序开发环境的应用程序,一般包括代码编辑器、编译器、调试器和图形用户界面等工具,其还是集成了代码编写功能、分析功能、编译功能、调试功能等一体化的开发软件服务套。目前的IDE作为开发工具有很多种,不同的IDE又有不同组合的快捷键,对于程序员来说,记住多种快捷键能够方便快捷操作,但是程序员为了能够快速地进行编程,需要记住大量的快捷键,这无疑会增大程序员的工作量,而且可能会使得快捷化操作变得不够快捷和准确。
发明内容
本发明实施例提供一种快捷键识别方法、装置、设备以及计算机可读存储介质,能够简化对快捷键的识别,以辅助快速开发编程,提高工作效率。
一方面,本发明实施例提供了一种快捷键识别方法,该方法包括:
读取***的配置文件,以确定相关的快捷键,其中,每个快捷键均对应设置有相应的快捷操作指令;
通过对获取的语音信息进行语音识别以得到文本信息,并对所述文本信息进行语义分析,以确定相应的语义信息;
根据预设规则对所述语义信息进行文本识别匹配,以确定与所述语义信息相匹配的快捷键。
另一方面,本发明实施例还提供了一种快捷键识别装置,该装置包括:
读取单元,用于读取***的配置文件,以确定相关的快捷键,其中,每个快捷键均对应设置有相应的快捷操作指令;
分析单元,用于通过对获取的语音信息进行语音识别以得到文本信息,并对所述文本信息进行语义分析,以确定相应的语义信息;
确定单元,用于根据预设规则对所述语义信息进行文本识别匹配,以确定与所述语义信息相匹配的快捷操作指令。
又一方面,本发明实施例还提供了一种计算机设备,包括:
存储器,用于存储实现快捷键识别的程序;以及
处理器,用于运行所述存储器中存储的实现快捷键识别的程序,以执行如上所述方法。
再一方面,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序可被一个或者一个以上的处理器执行,以实现如上所述方法。
本发明实施例通过读取***的配置文件,以确定相关的快捷键,其中,每个快捷键均对应设置有相应的快捷操作指令;通过对获取的语音信息进行语音识别以得到文本信息,并对所述文本信息进行语义分析,以确定相应的语义信息;根据预设规则对所述语义信息进行文本识别匹配,以确定与所述语义信息相匹配的快捷键,不仅可以简化对快捷键的识别,还能辅助快速地进行***开发和编程,提高工作效率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种快捷键识别方法的示意流程图;
图2是本发明实施例提供的一种快捷键识别方法的另一示意流程图;
图3是本发明实施例提供的一种快捷键识别方法的另一示意流程图;
图4是本发明实施例提供的一种快捷键识别方法的另一示意流程图;
图5是本发明实施例提供的一种快捷键识别方法的另一示意流程图;
图6是本发明实施例提供的一种快捷键识别装置的示意性框图;
图7是本发明实施例提供的一种快捷键识别装置的另一示意性框图;
图8是本发明实施例提供的一种快捷键识别装置的另一示意性框图;
图9是本发明实施例提供的一种快捷键识别装置的另一示意性框图;
图10是本发明实施例提供的一种快捷键识别装置的另一示意性框图;
图11是本发明实施例提供的一种计算机设备结构组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
请参阅图1,图1是本发明实施例提供的一种快捷键识别方法的示意流程图。该方法可以运行在智能手机(如Android手机、IOS手机等)、平板电脑、笔记本电脑以及智能设备等终端中。具体地,该方法可以应用于各种开发工具中以协助编程,也可以应用于OFFICE等办公软件中,从而实现例如:创建类,代码格式化等快捷化操作;其中开发工具可以是eclipse、intellJ IDEA等。如图1所示,该方法的步骤包括S101~S104。
S101,读取***的配置文件,以确定相关的快捷键,其中,每个快捷键均对应设置有相应的快捷操作指令。
在本发明实施例中,***的配置文件可以是开发工具IDE的配置文件,也可以是OFFICE等办公软件的配置文件。通过读取配置文件,即可以确定配置文件中记录有的快捷键以及与该快捷键相匹配的快捷操作指令。一般情况下,在调用了其中一个快捷键后,就可以获取并执行与该快捷键对应的快捷操作指令,从而实现对快捷键的识别和使用。例如,“复制”所对应的快捷键可以是“ctrl+C”,该“ctrl+C”快捷键对应有关于复制的快捷操作指令,“粘贴”对应的快捷键可以是“ctrl+V”,该“ctrl+V”快捷键对应有关于粘贴的快捷操作指令等。
S102,通过对获取的语音信息进行语音识别以得到文本信息,并对所述文本信息进行语义分析,以确定相应的语义信息。
在本发明实施例中,可以通过对用户发出的语音信息进行语音识别,从而得到与该语音信息相对应的文本信息,同时对该文本信息也可以进行语义分析,从而到的与该文本信息对应的语义信息。
进一步地,如图2所示,所述步骤S102具体包括步骤S201~S202。
S201,对获取的语音信息进行语音识别,以将语音信息转化为文本信息。
在本发明实施例中,可以通过智能语音API对获取的语音信息进行相应的处理。该智能语音API可以是用于进行语音识别的API。
进一步地,如图3所示,所述步骤S201具体包括:步骤S301~S303。
S301,将获取的语音信息通过语音活动检测转换为纯声波信息。
在本发明实施例中,一般情况下,在识别语音之前,都需要用语音活动检测(Voiceactivity detection,VAD)这一语音信号处理技术将所述获取的语音信息的首尾段进行静音切除,以得到纯声波信息,从而降低噪音干扰。其中,语音活动检测技术主要用于语音编码和语音识别,它可以简化语音处理,也可用于在音频会话期间去除非语音片段,如可以在IP电话应用中避免对静音数据包的编码和传输,节省计算时间和带宽,故语音活性检测技术使得一些列基于语音的应用程序称为现实。
S302,使用移动窗函数对纯声波信息进行分帧,并对分帧后的纯声波信息进行声学特征提取。
在本发明实施例中,所述移动窗函数能够实现对信号进行截断,从而实现对纯声波信息进行分帧。同时,较为常见的声学特征提取方法可以是提取MFCC特征,即根据人耳的生理特征,把每一帧波形变成一个多维向量,以简单地理解为这个向量包含了这帧语音的内容信息。例如,纯声波信息进行声学特征提取后,可以成为一个12行(假设声学特征是12维)、N列的一个矩阵,故称之为观察序列,这里N为总帧数。
S303,利用隐马尔可夫模型,构建一个状态网络,并从状态网络中寻找与纯声波信息最匹配的路径,以得到相应的文本信息。
在本发明实施例中,搭建状态网络是指由单词级网络展开成音素网络后,再展开成状态网络。一般情况下,语音识别过程其实就是在状态网络中搜索一条最佳路径,语音信息对应的最佳路径的概率最大,称之为“解码”。路径搜索的算法是一种动态规划剪枝的算法,称之为Viterbi算法,用于寻找全局最优路径。总之,若干帧语音对应一个状态,每三个状态组合成一个音素,若干个音素组合成一个单词,再通过状态网络的匹配,将声波信息最终转为文本信息。
S202,通过自然语言处理算法对文本信息进行语义分析以得到相应的语义信息。
在本发明实施例中,自然语言处理算法(Natural Language Processing,NLP)是人工智能(AI)的一个子领域,其利用句子中词与词之间的依存关系来表示词语的句法结构信息(如主谓、动宾、定中等结构关系),并用树状结构来表示整句的的结构(如主谓宾、定状补等)。通过分析用户Query的依存句法结构信息,抽取其中的语义主干及相关语义成分,帮助智能产品实现对用户意图的精准理解。
进一步地,如图4所示,所述步骤S202具体包括:步骤S401~S403。
S401,对所述文本信息进行分词及词性标注,以得到多个标注有词性的词语。
在本发明实施例中,自然语言处理就是为了让计算机能够理解人类的语言,即理解文字背后的含义。而分词是自然语言处理的基础,比如说对关键词提取、分本分类等都有帮助。一般情况下,分词原理用的是条件随机场,通过对词语的位置标注和词性等特征来进行分词,从而得到若干个词语,也可称为得到若干个term。
S402,计算每个词语的权重值。
在本发明实施例中,可以对分词后的每个term,计算一个权重,重要的term应该给与更高的权重。例如,“什么运动对减肥帮助较大?”的term weighting结果可能是:“什么0.1,运动0.5,对0.1,减肥0.8,帮助0.3,较大0.2”。词语权重(Term weighting)的打分公式一般由local,global和normalization这三部分组成。Term weighting方法可以包括F-IDF,Okapi,MI,LTU,ATC,TF-ICF等,通过local,global,normalization各种公式的组合,可以生成不同的term weighting计算方法。即可以通过term weighting计算方法得到每个词语对应的权重值。
S403,确定权重值大于或等于预设阀值的词语为关键词,所述关键词即为相应的语义信息。
在本发明实施例中,预设一个阈值,获取所有词语对应的权重值,并将大于或等于预设阀值的权重值所对应的词语确定为关键词,该关键词即为相应的语义信息。
S103,根据预设规则对所述语义信息进行文本识别匹配,以确定与所述语义信息相匹配的快捷键。
在本发明实施例中,所述预设规则可以是根据预设的汉语词库对所述语义信息进行模糊检索解析,从而实现对所述语义信息的文本识别。一般情况下,进行具体的文本识别之后,可以确定该语音信息所对应的快捷键,根据该快捷键即可以确认用户所需要调用的快捷操作指令,即实现相应的语音反馈。
进一步地,如图5所示,所述步骤S103具体包括:步骤S501~S502。
S501,获取预设的汉语词库。
在本发明实施例中,可以根据现有的数据信息创建相关的专业术语词库,该现有的数据信息可以是专业领域的词语与生活中通俗的词语,同时,所述预设的汉语词库可以根据用户的需求进行创建。譬如,可以根据***配置有的快捷键以及相关快捷操作,创建与该快捷键相对应的专业术语词库,该专业术语词库即为本申请的预设汉语词库。
S502,将所述语义信息与所述预设的汉语词库进行模糊匹配,以确定与所述语义信息相匹配的快捷键。
在本发明实施例中,通过将所述语义信息与所述预设的汉语词库进行模糊匹配,即实现对所述语义信息的文本识别匹配,从而确定该语义信息对应的快捷键,又因为每个快捷键都对应有相应的快捷操作指令,此时即可确定与所述语义信息相匹配的快捷操作指令,从而实现后续的快捷操作。
例如,当传统的***开发过程中,开发人员如果要复制一段代码,那么选中要复制内容后,可以在对包括“复制”的语音信息进行识别后,确定“复制”为关键词,此时“复制”即为语义信息,通过将“复制”与预设的汉语词库进行模糊匹配,可以确定“ctrl+C”为相应的快捷键,即确定“ctrl+C”对应的快捷操作指令为与“复制”相匹配的快捷操作指令,从而可以实现对选定代码的复制。故进一步的,任何可以通过快捷键简化的操作,均可以省去按键操作,直接通过自然语言发出指令即可实现操作。例如创建一个test类,只需要使用自然语言发出创建一个test类的指令。
故一般情况下,可以根据现有的数据信息创建相关的专业术语词库,然后通过将解析后的语言信息的语义与创建相关的专业术语词库进行模糊匹配,以确定与所述语义信息相匹配的快捷操作指令,再通过语音反馈给用户接下来要执行的操作(专业术语反馈),执行相应的操作并语言反馈执行结果,同时执行与反馈的语言实行定制化,可增强用户专业性,方便用户操作学习。
作为进一步的实施例,所述方法还包括以下步骤:
S104,运行所述快捷键对应的快捷操作指令,以实现相应的快捷操作。
在本发明实施例中,通过运行所述快捷键对应的快捷操作指令,可以实现与输入的语音信息相对应的快捷操作。
同时,作为另一实施例,还可以在调用运行快捷操作指令之后,显示与所述快捷操作指令相应的快捷键,从而方便用户进行直接操作。
例如,本发明实施例提供的方法可以应用到Eclipse这种常用的IDE开发工具中为例。用户在不知道某些操作的快捷键的前提下,通过自然语言表达出来,例如,说:“我要创建一个Test的java类”,则可通过语音识别API、语义识别API以及汉语词库的模糊搜索等,将Eclipse这个IDE开发工具中设置的创建类的快捷键“alt+C”所对应的快捷操作指令调用出来,从而创建一个Test.java文件。作为优选的,还可以同时在终端的显示屏幕上显示该快捷键“alt+C”,以提示用户创建类的快捷键为“alt+C”,方便用户下次直接使用对应的快捷键。当然,还可以通过语音播放,以提示用户。
又例如,可以对选定的目标,通过语音识别来进行快捷操作指令的调用,以实现对目标的操作处理。如,选中一个xxx.txt文件,发出语音信息:“打开文件”,此时则调用快捷操作指令,选定默认的打开文件工具对文件进行打开,同时还可以返回语音:“已打开xxx.txt文件”;而选中文本内容后,发出语音信息:“复制”,此时确定复制对应的“ctrl+C”快捷键,从而调用该快捷键对应的快捷操作指令执行复制后,可语音反馈:“已复制内容”。指定文本位置,发出语音信息:“粘贴”,此时确定粘贴对应的“ctrl+V”快捷键,从而调用该快捷键对应的快捷操作指令并在指定位置粘贴内容,同时可以语音反馈:“粘贴成功”。
本领域普通技术员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等。
综上,本发明实施例不仅可以简化对快捷键的识别,还能辅助快速地进行***开发和编程,提高工作效率。同时,该快捷键识别方法主要是利用智能语音识别,集成不同的IDE中的快捷键,使得开发者向计算机输入自然语言后,即可完成对应的快捷操作。
请参阅图6,对应上述快捷键识别方法,本发明实施例还提出一种快捷键识别装置,该装置100包括:读取单元101、分析单元102以及确定单元103。
所述读取单元101,用于读取***的配置文件,以确定相关的快捷键,其中,每个快捷键均对应设置有相应的快捷操作指令。
在本发明实施例中,***的配置文件可以是开发工具IDE的配置文件,也可以是OFFICE等办公软件的配置文件。通过读取配置文件,即可以确定配置文件中记录有的快捷键以及与该快捷键相匹配的快捷操作指令。一般情况下,在调用了其中一个快捷键后,就可以获取并执行与该快捷键对应的快捷操作指令,从而实现对快捷键的识别和使用。例如,“复制”所对应的快捷键可以是“ctrl+C”,该“ctrl+C”快捷键对应有关于复制的快捷操作指令,“粘贴”对应的快捷键可以是“ctrl+V”,该“ctrl+V”快捷键对应有关于粘贴的快捷操作指令等。
所述分析单元102,用于通过对获取的语音信息进行语音识别以得到文本信息,并对所述文本信息进行语义分析,以确定相应的语义信息。
在本发明实施例中,可以通过对用户发出的语音信息进行语音识别,从而得到与该语音信息相对应的文本信息,同时对该文本信息也可以进行语义分析,从而到的与该文本信息对应的语义信息。
进一步地,如图7所示,所述分析单元102具体包括:语音识别单元201以及语义分析单元202。
所述语音识别单元201,用于对获取的语音信息进行语音识别,以将语音信息转化为文本信息。
在本发明实施例中,可以通过智能语音API对获取的语音信息进行相应的处理。该智能语音API可以是用于进行语音识别的API。
进一步地,如图8所示,所述语音识别单元201具体包括:转换单元301、特征提取单元302以及构建单元303。
所述转换单元301,将获取的语音信息通过语音活动检测转换为纯声波信息。
在本发明实施例中,一般情况下,在识别语音之前,都需要用语音活动检测(Voiceactivity detection,VAD)这一语音信号处理技术将所述获取的语音信息的首尾段进行静音切除,以得到纯声波信息,从而降低噪音干扰。其中,语音活动检测技术主要用于语音编码和语音识别,它可以简化语音处理,也可用于在音频会话期间去除非语音片段,如可以在IP电话应用中避免对静音数据包的编码和传输,节省计算时间和带宽,故语音活性检测技术使得一些列基于语音的应用程序称为现实。
所述特征提取单元302,使用移动窗函数对纯声波信息进行分帧,并对分帧后的纯声波信息进行声学特征提取。
在本发明实施例中,所述移动窗函数能够实现对信号进行截断,从而实现对纯声波信息进行分帧。同时,较为常见的声学特征提取方法可以是提取MFCC特征,即根据人耳的生理特征,把每一帧波形变成一个多维向量,以简单地理解为这个向量包含了这帧语音的内容信息。例如,纯声波信息进行声学特征提取后,可以成为一个12行(假设声学特征是12维)、N列的一个矩阵,故称之为观察序列,这里N为总帧数。
所述构建单元303,利用隐马尔可夫模型,构建一个状态网络,并从状态网络中寻找与纯声波信息最匹配的路径,以得到相应的文本信息。
在本发明实施例中,搭建状态网络是指由单词级网络展开成音素网络后,再展开成状态网络。一般情况下,语音识别过程其实就是在状态网络中搜索一条最佳路径,语音信息对应的最佳路径的概率最大,称之为“解码”。路径搜索的算法是一种动态规划剪枝的算法,称之为Viterbi算法,用于寻找全局最优路径。总之,若干帧语音对应一个状态,每三个状态组合成一个音素,若干个音素组合成一个单词,再通过状态网络的匹配,将声波信息最终转为文本信息。
所述语义分析单元202,用于通过自然语言处理算法对文本信息进行语义分析以得到相应的语义信息。
在本发明实施例中,自然语言处理算法(Natural Language Processing,NLP)是人工智能(AI)的一个子领域,其利用句子中词与词之间的依存关系来表示词语的句法结构信息(如主谓、动宾、定中等结构关系),并用树状结构来表示整句的的结构(如主谓宾、定状补等)。通过分析用户Query的依存句法结构信息,抽取其中的语义主干及相关语义成分,帮助智能产品实现对用户意图的精准理解。
进一步地,如图9所示,所述语义分析单元202具体包括:分词单元401、计算单元402以及调整单元403。
所述分词单元401,用于对所述文本信息进行分词及词性标注,以得到多个标注有词性的词语。
在本发明实施例中,自然语言处理就是为了让计算机能够理解人类的语言,即理解文字背后的含义。而分词是自然语言处理的基础,比如说对关键词提取、分本分类等都有帮助。一般情况下,分词原理用的是条件随机场,通过对词语的位置标注和词性等特征来进行分词,从而得到若干个词语,也可称为得到若干个term。
所述计算单元402,用于计算每个词语的权重值。
在本发明实施例中,可以对分词后的每个term,计算一个权重,重要的term应该给与更高的权重。例如,“什么运动对减肥帮助较大?”的term weighting结果可能是:“什么0.1,运动0.5,对0.1,减肥0.8,帮助0.3,较大0.2”。词语权重(Term weighting)的打分公式一般由local,global和normalization这三部分组成。Term weighting方法可以包括F-IDF,Okapi,MI,LTU,ATC,TF-ICF等,通过local,global,normalization各种公式的组合,可以生成不同的term weighting计算方法。即可以通过term weighting计算方法得到每个词语对应的权重值。
所述调整单元403,用于确定权重值大于或等于预设阀值的词语为关键词,所述关键词即为相应的语义信息。
在本发明实施例中,预设一个阈值,获取所有词语对应的权重值,并将大于或等于预设阀值的权重值所对应的词语确定为关键词,该关键词即为相应的语义信息。
所述确定单元103,用于根据预设规则对所述语义信息进行文本识别匹配,以确定与所述语义信息相匹配的快捷操作指令。
进一步地,如图10所示,所述确定单元103具体包括:获取单元501以及匹配单元502。
所述获取单元501,用于获取预设的汉语词库。
在本发明实施例中,可以根据现有的数据信息创建相关的专业术语词库,该现有的数据信息可以是专业领域的词语与生活中通俗的词语,同时,所述预设的汉语词库可以根据用户的需求进行创建。譬如,可以根据***配置有的快捷键以及相关快捷操作,创建与该快捷键相对应的专业术语词库,该专业术语词库即为本申请的预设汉语词库。
所述匹配单元502,用于将所述语义信息与所述预设的汉语词库进行模糊匹配,以确定与所述语义信息相匹配的快捷键。
在本发明实施例中,通过将所述语义信息与所述预设的汉语词库进行模糊匹配,即实现对所述语义信息的文本识别匹配,从而确定该语义信息对应的快捷键,又因为每个快捷键都对应有相应的快捷操作指令,此时即可确定与所述语义信息相匹配的快捷操作指令,从而实现后续的快捷操作。
例如,当传统的***开发过程中,开发人员如果要复制一段代码,那么选中要复制内容后,可以在对包括“复制”的语音信息进行识别后,确定“复制”为关键词,此时“复制”即为语义信息,通过将“复制”与预设的汉语词库进行模糊匹配,可以确定“ctrl+C”为相应的快捷键,即确定“ctrl+C”对应的快捷操作指令为与“复制”相匹配的快捷操作指令,从而可以实现对选定代码的复制。故进一步的,任何可以通过快捷键简化的操作,均可以省去按键操作,直接通过自然语言发出指令即可实现操作。例如创建一个test类,只需要使用自然语言发出创建一个test类的指令。
故一般情况下,可以根据现有的数据信息创建相关的专业术语词库,然后通过将解析后的语言信息的语义与创建相关的专业术语词库进行模糊匹配,以确定与所述语义信息相匹配的快捷操作指令,再通过语音反馈给用户接下来要执行的操作(专业术语反馈),执行相应的操作并语言反馈执行结果,同时执行与反馈的语言实行定制化,可增强用户专业性,方便用户操作学习。
作为进一步的实施例,所述装置还可以包括以下单元:
运行单元104,用于运行所述快捷键对应的快捷操作指令,以实现相应的快捷操作。在本发明实施例中,通过运行所述快捷键对应的快捷操作指令,可以实现与输入的语音信息相对应的快捷操作。
同时,作为另一进一步的实施例,该装置还可以包括显示单元,用于在调用运行快捷操作指令之后,显示与所述快捷操作指令相应的快捷键,从而方便用户进行直接操作。
例如,本发明实施例提供的方法可以应用到Eclipse这种常用的IDE开发工具中为例。用户在不知道某些操作的快捷键的前提下,通过自然语言表达出来,例如,说:“我要创建一个Test的java类”,则可通过语音识别API、语义识别API以及汉语词库的模糊搜索等,将Eclipse这个IDE开发工具中设置的创建类的快捷键“alt+C”所对应的快捷操作指令调用出来,从而创建一个Test.java文件。作为优选的,还可以同时在终端的显示屏幕上显示该快捷键“alt+C”,以提示用户创建类的快捷键为“alt+C”,方便用户下次直接使用对应的快捷键。当然,还可以通过语音播放,以提示用户。
又例如,可以对选定的目标,通过语音识别来进行快捷操作指令的调用,以实现对目标的操作处理。如,选中一个xxx.txt文件,发出语音信息:“打开文件”,此时则调用快捷操作指令,选定默认的打开文件工具对文件进行打开,同时还可以返回语音:“已打开xxx.txt文件”;而选中文本内容后,发出语音信息:“复制”,此时确定复制对应的“ctrl+C”快捷键,从而调用该快捷键对应的快捷操作指令执行复制后,可语音反馈:“已复制内容”。指定文本位置,发出语音信息:“粘贴”,此时确定粘贴对应的“ctrl+V”快捷键,从而调用该快捷键对应的快捷操作指令并在指定位置粘贴内容,同时可以语音反馈:“粘贴成功”。
综上,本发明实施例不仅可以简化对快捷键的识别,还能辅助快速地进行***开发和编程,提高工作效率。同时,该快捷键识别方法主要是利用智能语音识别,集成不同的IDE中的快捷键,使得开发者向计算机输入自然语言后,即可完成对应的快捷操作。
由以上可见,在硬件实现上,以上读取单元101、分析单元102以及确定单元103等可以以硬件形式内嵌于或独立于快捷键识别的装置中,也可以以软件形式存储于快捷键识别装置的存储器中,以便处理器调用执行以上各个单元对应的操作。该处理器可以为中央处理单元(CPU)、微处理器、单片机等。
上述快捷键识别装置可以实现为一种计算机程序的形式,计算机程序可以在如图11所示的计算机设备上运行。
图11为本发明一种计算机设备的结构组成示意图。该设备可以是终端,也可以是服务器,其中,终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能的电子设备。服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。参照图11,该计算机设备600包括通过***总线601连接的处理器602、非易失性存储介质603、内存储器604和网络接口605。其中,该计算机设备600的非易失性存储介质603可存储操作***6031和计算机程序6032,该计算机程序6032被执行时,可使得处理器602执行一种快捷键识别方法。该计算机设备600的处理器602用于提供计算和控制能力,支撑整个计算机设备600的运行。该内存储器604为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器602执行一种快捷键识别方法。计算机设备600的网络接口605用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器602执行如下操作:读取***的配置文件,以确定相关的快捷键,其中,每个快捷键均对应设置有相应的快捷操作指令;通过对获取的语音信息进行语音识别以得到文本信息,并对所述文本信息进行语义分析,以确定相应的语义信息;根据预设规则对所述语义信息进行文本识别匹配,以确定与所述语义信息相匹配的快捷键。
所述处理器602执行如下操作:对获取的语音信息进行语音识别,以将语音信息转化为文本信息;通过自然语言处理算法对文本信息进行语义分析以得到相应的语义信息。
所述处理器602执行如下操作:将获取的语音信息通过语音活动检测转换为纯声波信息;使用移动窗函数对纯声波信息进行分帧,并对分帧后的纯声波信息进行声学特征提取;利用隐马尔可夫模型,构建一个状态网络,并从状态网络中寻找与纯声波信息最匹配的路径,以得到相应的文本信息。
所述处理器602执行如下操作:对所述文本信息进行分词及词性标注,以得到多个标注有词性的词语;计算每个词语的权重值;确定权重值大于或等于预设阀值的词语为关键词,所述关键词即为相应的语义信息。
所述处理器602执行如下操作:获取预设的汉语词库;将所述语义信息与所述预设的汉语词库进行模糊匹配,以确定与所述语义信息相匹配的快捷键。
本领域技术人员可以理解,图11中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图11所示实施例一致,在此不再赘述。
本发明提供了一种计算机可读存储介质,计算机可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序可被一个或者一个以上的处理器执行,以实现以下步骤:读取***的配置文件,以确定相关的快捷键,其中,每个快捷键均对应设置有相应的快捷操作指令;通过对获取的语音信息进行语音识别以得到文本信息,并对所述文本信息进行语义分析,以确定相应的语义信息;根据预设规则对所述语义信息进行文本识别匹配,以确定与所述语义信息相匹配的快捷键。
所述处理器还实现以下步骤:对获取的语音信息进行语音识别,以将语音信息转化为文本信息;通过自然语言处理算法对文本信息进行语义分析以得到相应的语义信息。
所述处理器还实现以下步骤:将获取的语音信息通过语音活动检测转换为纯声波信息;使用移动窗函数对纯声波信息进行分帧,并对分帧后的纯声波信息进行声学特征提取;利用隐马尔可夫模型,构建一个状态网络,并从状态网络中寻找与纯声波信息最匹配的路径,以得到相应的文本信息。
所述处理器还实现以下步骤:对所述文本信息进行分词及词性标注,以得到多个标注有词性的词语;计算每个词语的权重值;确定权重值大于或等于预设阀值的词语为关键词,所述关键词即为相应的语义信息。
所述处理器还实现以下步骤:获取预设的汉语词库;将所述语义信息与所述预设的汉语词库进行模糊匹配,以确定与所述语义信息相匹配的快捷键。。
本发明前述的存储介质包括:磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等各种可以存储程序代码的介质。
本发明所有实施例中的单元可以通过通用集成电路,例如CPU(CentralProcessing Unit,中央处理器),或通过ASIC(Application Specific IntegratedCircuit,专用集成电路)来实现。
本发明实施例快捷键识别方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例快捷键识别终端中的单元可以根据实际需要进行合并、划分和删减。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种快捷键识别方法,其特征在于,所述方法包括:
读取***的配置文件,以确定相关的快捷键,其中,每个快捷键均对应设置有相应的快捷操作指令;
通过对获取的语音信息进行语音识别以得到文本信息,并对所述文本信息进行语义分析,以确定相应的语义信息;
根据预设规则对所述语义信息进行文本识别匹配,以确定与所述语义信息相匹配的快捷键。
2.如权利要求1所述的方法,其特征在于,所述通过对获取的语音信息进行语音识别以得到文本信息,并对所述文本信息进行语义分析,以确定相应的语义信息,包括:
对获取的语音信息进行语音识别,以将语音信息转化为文本信息;
通过自然语言处理算法对文本信息进行语义分析以得到相应的语义信息。
3.如权利要求2所述的方法,其特征在于,所述对获取的语音信息进行语音识别,以将语音信息转化为文本信息,包括:
将获取的语音信息通过语音活动检测转换为纯声波信息;
使用移动窗函数对纯声波信息进行分帧,并对分帧后的纯声波信息进行声学特征提取;
利用隐马尔可夫模型,构建一个状态网络,并从状态网络中寻找与纯声波信息最匹配的路径,以得到相应的文本信息。
4.如权利要求2所述的方法,其特征在于,所述通过自然语言处理算法对文本信息进行语义分析以得到相应的语义信息,包括:
对所述文本信息进行分词及词性标注,以得到多个标注有词性的词语;
计算每个词语的权重值;
确定权重值大于或等于预设阀值的词语为关键词,所述关键词即为相应的语义信息。
5.如权利要求1所述的方法,其特征在于,所述根据预设规则对所述语义信息进行文本识别匹配,以确定与所述语义信息相匹配的快捷键,包括:
获取预设的汉语词库;
将所述语义信息与所述预设的汉语词库进行模糊匹配,以确定与所述语义信息相匹配的快捷键。
6.一种快捷键识别装置,其特征在于,所述装置包括:
读取单元,用于读取***的配置文件,以确定相关的快捷键,其中,每个快捷键均对应设置有相应的快捷操作指令;
分析单元,用于通过对获取的语音信息进行语音识别以得到文本信息,并对所述文本信息进行语义分析,以确定相应的语义信息;
确定单元,用于根据预设规则对所述语义信息进行文本识别匹配,以确定与所述语义信息相匹配的快捷操作指令。
7.如权利要求6所述的装置,其特征在于,所述分析单元,包括:
语音识别单元,用于对获取的语音信息进行语音识别,以将语音信息转化为文本信息;
语义分析单元,用于通过自然语言处理算法对文本信息进行语义分析以得到相应的语义信息。
8.如权利要求6所述的装置,其特征在于,所述确定单元,包括:
获取单元,用于获取预设的汉语词库;
匹配单元,用于将所述语义信息与所述预设的汉语词库进行模糊匹配,以确定与所述语义信息相匹配的快捷键。
9.一种计算机设备,其特征在于,包括:
存储器,用于存储实现快捷键识别的程序;以及
处理器,用于运行所述存储器中存储的实现快捷键识别的程序,以执行如权利要求1-5任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,计算机可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序可被一个或者一个以上的处理器执行,以实现如权利要求1-5任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810191036.0A CN108491379A (zh) | 2018-03-08 | 2018-03-08 | 快捷键识别方法、装置、设备以及计算机可读存储介质 |
PCT/CN2018/085255 WO2019169722A1 (zh) | 2018-03-08 | 2018-05-02 | 快捷键识别方法、装置、设备以及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810191036.0A CN108491379A (zh) | 2018-03-08 | 2018-03-08 | 快捷键识别方法、装置、设备以及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108491379A true CN108491379A (zh) | 2018-09-04 |
Family
ID=63338223
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810191036.0A Pending CN108491379A (zh) | 2018-03-08 | 2018-03-08 | 快捷键识别方法、装置、设备以及计算机可读存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108491379A (zh) |
WO (1) | WO2019169722A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109491264A (zh) * | 2018-12-24 | 2019-03-19 | 青岛海信智慧家居***股份有限公司 | 一种家居设备控制方法及装置 |
CN112819061A (zh) * | 2021-01-27 | 2021-05-18 | 北京小米移动软件有限公司 | 口令信息识别方法、装置、设备及存储介质 |
CN112908327A (zh) * | 2021-02-02 | 2021-06-04 | 上海市胸科医院 | 应用程序的语音控制方法、装置、设备和存储介质 |
CN114138227A (zh) * | 2021-12-08 | 2022-03-04 | 江西台德智慧科技有限公司 | 一种智能语音快捷键输入方法及智能语音快捷键输入*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622085A (zh) * | 2012-04-11 | 2012-08-01 | 北京航空航天大学 | 多维感官人机交互***及交互方法 |
KR20140000003A (ko) * | 2012-06-22 | 2014-01-02 | 송병식 | 키보드 단축키 조합의 음성 실행 방법 |
CN106710593A (zh) * | 2015-11-17 | 2017-05-24 | 腾讯科技(深圳)有限公司 | 一种添加账号的方法、终端、服务器 |
CN107665705A (zh) * | 2017-09-20 | 2018-02-06 | 平安科技(深圳)有限公司 | 语音关键词识别方法、装置、设备及计算机可读存储介质 |
CN107679033A (zh) * | 2017-09-11 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 文本断句位置识别方法和装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1641563A (zh) * | 2004-01-09 | 2005-07-20 | 顺德市顺达电脑厂有限公司 | 电脑装置的语音快捷控制装置及方法 |
JP2010205130A (ja) * | 2009-03-05 | 2010-09-16 | Denso Corp | 制御装置 |
US20130275134A1 (en) * | 2011-05-20 | 2013-10-17 | Mitsubishi Electric Corporation | Information equipment |
CN103294370A (zh) * | 2012-03-05 | 2013-09-11 | 北京千橡网景科技发展有限公司 | 触发按键操作的方法和设备 |
CN104750257A (zh) * | 2013-12-30 | 2015-07-01 | 鸿富锦精密工业(武汉)有限公司 | 键盘组合及语音识别方法 |
CN105183778A (zh) * | 2015-08-11 | 2015-12-23 | 百度在线网络技术(北京)有限公司 | 服务提供方法和装置 |
-
2018
- 2018-03-08 CN CN201810191036.0A patent/CN108491379A/zh active Pending
- 2018-05-02 WO PCT/CN2018/085255 patent/WO2019169722A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622085A (zh) * | 2012-04-11 | 2012-08-01 | 北京航空航天大学 | 多维感官人机交互***及交互方法 |
KR20140000003A (ko) * | 2012-06-22 | 2014-01-02 | 송병식 | 키보드 단축키 조합의 음성 실행 방법 |
CN106710593A (zh) * | 2015-11-17 | 2017-05-24 | 腾讯科技(深圳)有限公司 | 一种添加账号的方法、终端、服务器 |
CN107679033A (zh) * | 2017-09-11 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 文本断句位置识别方法和装置 |
CN107665705A (zh) * | 2017-09-20 | 2018-02-06 | 平安科技(深圳)有限公司 | 语音关键词识别方法、装置、设备及计算机可读存储介质 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109491264A (zh) * | 2018-12-24 | 2019-03-19 | 青岛海信智慧家居***股份有限公司 | 一种家居设备控制方法及装置 |
CN109491264B (zh) * | 2018-12-24 | 2022-01-21 | 青岛海信智慧家居***股份有限公司 | 一种家居设备控制方法及装置 |
CN112819061A (zh) * | 2021-01-27 | 2021-05-18 | 北京小米移动软件有限公司 | 口令信息识别方法、装置、设备及存储介质 |
CN112819061B (zh) * | 2021-01-27 | 2024-05-10 | 北京小米移动软件有限公司 | 口令信息识别方法、装置、设备及存储介质 |
CN112908327A (zh) * | 2021-02-02 | 2021-06-04 | 上海市胸科医院 | 应用程序的语音控制方法、装置、设备和存储介质 |
CN114138227A (zh) * | 2021-12-08 | 2022-03-04 | 江西台德智慧科技有限公司 | 一种智能语音快捷键输入方法及智能语音快捷键输入*** |
Also Published As
Publication number | Publication date |
---|---|
WO2019169722A1 (zh) | 2019-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gupta et al. | The AT&T spoken language understanding system | |
CN108831439B (zh) | 语音识别方法、装置、设备和*** | |
CN108288468B (zh) | 语音识别方法及装置 | |
CN107423363B (zh) | 基于人工智能的话术生成方法、装置、设备及存储介质 | |
CN108491379A (zh) | 快捷键识别方法、装置、设备以及计算机可读存储介质 | |
CN108847241A (zh) | 将会议语音识别为文本的方法、电子设备及存储介质 | |
CN107924483A (zh) | 通用假设排列模型的生成与应用 | |
JP2003535410A (ja) | 情報検索手法による統一化されたタスク依存の言語モデルの生成 | |
JP2005084681A (ja) | 意味的言語モデル化および信頼性測定のための方法およびシステム | |
JP2004523004A (ja) | 階層言語モデル | |
CN109671435B (zh) | 用于唤醒智能设备的方法和装置 | |
CN106356057A (zh) | 一种基于计算机应用场景语义理解的语音识别*** | |
CN109102796A (zh) | 一种语音合成方法及装置 | |
US20200210505A1 (en) | Electronic apparatus and controlling method thereof | |
CN111324708A (zh) | 一种基于人机交互的自然语言处理*** | |
CN110010136B (zh) | 韵律预测模型的训练和文本分析方法、装置、介质和设备 | |
CN111144128A (zh) | 语义解析方法和装置 | |
CN112151015A (zh) | 关键词检测方法、装置、电子设备以及存储介质 | |
CN111309876A (zh) | 一种服务请求的处理方法、装置、电子设备及存储介质 | |
CN110265008A (zh) | 智能回访方法、装置、计算机设备及存储介质 | |
CN110020429A (zh) | 语义识别方法及设备 | |
Rudnicky et al. | Spoken language recognition in an office management domain | |
CN108231074A (zh) | 一种数据处理方法、语音助手设备及计算机可读存储介质 | |
CN112289305A (zh) | 韵律预测方法、装置、设备以及存储介质 | |
CN111508481A (zh) | 语音唤醒模型的训练方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180904 |
|
RJ01 | Rejection of invention patent application after publication |