CN112612442A - 一种输入方法、装置和电子设备 - Google Patents

一种输入方法、装置和电子设备 Download PDF

Info

Publication number
CN112612442A
CN112612442A CN201910888060.4A CN201910888060A CN112612442A CN 112612442 A CN112612442 A CN 112612442A CN 201910888060 A CN201910888060 A CN 201910888060A CN 112612442 A CN112612442 A CN 112612442A
Authority
CN
China
Prior art keywords
cursor
text
recognition result
texts
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910888060.4A
Other languages
English (en)
Inventor
魏爽
李茜
韩秦
王丹
崔欣
杨家旭
李晓帆
杨浩
王逢宝
张文略
陈章钦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201910888060.4A priority Critical patent/CN112612442A/zh
Publication of CN112612442A publication Critical patent/CN112612442A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供了一种输入方法、装置和电子设备,其中,所述方法包括:获取用户输入的语音数据,识别对应的语音识别结果并上屏;依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本;确定所述第一待修改文本对应的第一纠错信息,依据所述第一纠错信息对所述第一待修改文本进行修改;从而无需手动进行二次输入,提高用户输入效率。

Description

一种输入方法、装置和电子设备
技术领域
本发明涉及输入法技术领域,特别是涉及一种输入方法、装置和电子设备。
背景技术
随着计算机技术的发展,诸如手机、平板电脑等电子设备越来越普及,给人们的生活、学习、工作带来了极大的便利。这些电子设备通常安装有输入法应用程序(简称输入法),使得用户可使用该输入法进行信息输入。
随着语音识别技术的进步,语音输入也逐渐发展成为输入法的一种输入方式,用户可以在输入法界面触发语音输入,然后输出对应的语音;输入法接收到用户的语音数据后,对语音数据进行语音识别,然后在编辑框中显示语音识别结果。
由于语音输入时用户环境嘈杂、发音不准、方言等原因导致识别结果不准确;导致用户需要重新录音、手动修改、语音修改等方式进行修改。其中,用户再手动修改的过程中,需要手动进行二次输入,输入效率低。
发明内容
本发明实施例提供一种输入方法,以提高输入效率。
相应的,本发明实施例还提供了一种输入装置和一种电子设备,用以保证上述方法的实现及应用。
为了解决上述问题,本发明实施例公开了一种输入方法,具体包括:获取用户输入的语音数据,识别对应的语音识别结果并上屏;依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本;确定所述第一待修改文本对应的第一纠错信息,依据所述第一纠错信息对所述第一待修改文本进行修改。
可选地,所述依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本,包括:依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图;确定所述用户具有修改所述语音识别结果的意图时,将所述用户移动光标后所述光标所在位置的上下文信息切分为多个词组;依据所述多个词组,确定所述语音识别结果中第一待修改文本。
可选地,所述依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图,包括:获取所述语音识别结果上屏后在所述编辑框中的首尾位置;判断所述用户移动光标后所述光标的位置,是否处于所述首尾位置之间;若是,则确定所述用户具有修改所述语音识别结果的意图;若否,则确定所述用户不具有修改所述语音识别结果的意图。
可选地,所述依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图,包括:获取所述用户移动光标后所述光标所在位置的上下文信息;判断是否存在与所述上下文信息匹配的语音识别结果;若存在,则确定所述用户具有修改所述语音识别结果的意图;若不存在,则确定所述用户不具有修改所述语音识别结果的意图。
可选地,所述获取所述用户移动光标后所述光标所在位置的上下文信息,包括:获取所述用户移动光标后所述光标所在位置之前X1个文本,和所述光标所在位置之后X2个文本;采用所述X1个文本和X2个文本组成所述光标所在位置的上下文信息;其中,X1,X2均为整数。
可选地,所述将所述用户移动光标后所述光标所在位置的上下文信息切分为多个词组,包括:从所述用户移动光标后所述光标所在位置的上下文信息中,截取所述光标所在位置之前的N1个文本和所述光标所在位置之后的N2个文本;依据所述光标的位置对所述(N1+N2)个文本进行切分,得到多个词组;其中,N1,N2均为整数,X1大于或等于N1,X2大于或等于N2。
可选地,所述依据所述光标的位置对所述(N1+N2)个文本进行切分,得到多个词组,包括:将所述(N1+N2)个文本中所述光标所在位置之前的N1个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的N2个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的M1个文本和所述光标所在位置之后的M2个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的M3个文本和所述光标所在位置之后的M4个文本,切分为一个词组;其中,所述N1=M1+M2,N2=M3+M4,M1、M2、M3和M4均为正整数。
可选地,所述依据所述多个词组,确定所述语音识别结果中第一待修改文本,包括:分别对各所述词组进行注音,得到各词组对应的注音结果;针对一个所述词组,依据所述词组的注音结果判断所述词组是否具有预设属性;若所述词组具有预设属性,则判断所述用户的用户词库中是否存在所述词组对应的同音词;若所述用户词库存在对应的同音词,则将所述词组确定为第一待修改文本;所述确定所述第一待修改文本对应的第一纠错信息,包括:依据所述词组对应的同音词,确定所述第一待修改文本对应的第一纠错信息。
可选地,所述依据所述词组的注音结果判断所述词组是否具有预设属性,包括:依据所述词组的注音结果,判断***词库中是否存在与所述词组匹配的***词组;若***词库中存在与所述词组匹配的***词组,则获取与所述词组匹配的***词组的词频;若所述词频大于预设阈值,则获取与所述词组匹配的***词组的标签;若与所述词组匹配的***词组的标签中存在预设属性标签,则确定所述词组具有预设属性;否则,确定所述词组不具有预设属性。
可选地,所述的方法还包括:在识别对应的语音识别结果时,确定所述语音识别结果中第二待修改文本,以及确定所述第二待修改文本在所述语音识别结果中的位置和所述第二待修改文本对应的第二纠错信息;所述依据所述多个词组,确定所述语音识别结果中第一待修改文本,包括:分别确定各词组在所述语音识别结果中的位置;针对一个词组,将所述词组的位置与所述第二待修改文本的位置进行匹配;若存在位置与所述词组的位置匹配的第二待修改文本,则将所述词组确定为第一待修改文本;所述确定所述第一待修改文本对应的第一纠错信息,包括:将与所述词组匹配的第二待修改文本的第二纠错信息,确定为第一纠错信息。
可选地,所述依据所述第一纠错信息对所述待修改文本进行修改,包括:在候选栏中展示所述第一纠错信息;接收上屏指令,将所述编辑框中的所述第一待修改文本替换为所述上屏指令对应的第一纠错信息。
可选地,所述在候选栏中展示所述第一纠错信息,包括:在候选栏中按照预设样式展示所述第一纠错信息;所述预设样式包括以下至少一种:下划线、加粗、高亮、灌色。
可选地,所述的方法还包括:为所述编辑框中所述第一待修改文本增加预设样式。
可选地,所述的方法还包括:对所述用户移动光标后所述光标所在位置的上下文信息进行联想,得到对应的联想信息;所述在候选栏中展示所述第一纠错信息,包括:结合所述联想信息在候选栏中对所述第一纠错信息进行展示。
可选地,所述的预设属性包括以下至少一种:人名属性、地点属性、事件名属性、专业术语属性和特定缩写属性。
本发明实施例还公开了一种输入装置,具体包括:识别模块,用于获取用户输入的语音数据,识别对应的语音识别结果并上屏;第一信息确定模块,用于依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本;修改模块,用于确定所述第一待修改文本对应的第一纠错信息,依据所述第一纠错信息对所述第一待修改文本进行修改。
可选地,所述第一信息确定模块,包括:意图判断子模块,用于依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图;切分子模块,用于确定所述用户具有修改所述语音识别结果的意图时,将所述用户移动光标后所述光标所在位置的上下文信息切分为多个词组;修改信息确定子模块,用于依据所述多个词组,确定所述语音识别结果中第一待修改文本。
可选地,所述意图判断子模块,包括:位置判断单元,用于获取所述语音识别结果上屏后在所述编辑框中的首尾位置;判断所述用户移动光标后所述光标的位置,是否处于所述首尾位置之间;若是,则确定所述用户具有修改所述语音识别结果的意图;若否,则确定所述用户不具有修改所述语音识别结果的意图。
可选地,所述意图判断子模块,包括:上下文判断单元,用于获取所述用户移动光标后所述光标所在位置的上下文信息;判断是否存在与所述上下文信息匹配的语音识别结果;若存在,则确定所述用户具有修改所述语音识别结果的意图;若不存在,则确定所述用户不具有修改所述语音识别结果的意图。
可选地,所述上下文判断单元,用于获取所述用户移动光标后所述光标所在位置之前X1个文本,和所述光标所在位置之后X2个文本;采用所述X1个文本和X2个文本组成所述光标所在位置的上下文信息;其中,X1,X2均为整数。
可选地,所述切分子模块,包括:文本截取单元,用于从所述用户移动光标后所述光标所在位置的上下文信息中,截取所述光标所在位置之前的N1个文本和所述光标所在位置之后的N2个文本;词组切分单元,用于依据所述光标的位置对所述(N1+N2)个文本进行切分,得到多个词组;其中,N1,N2均为整数,X1大于或等于N1,X2大于或等于N2。
可选地,所述词组切分单元,用于将所述(N1+N2)个文本中所述光标所在位置之前的N1个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的N2个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的M1个文本和所述光标所在位置之后的M2个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的M3个文本和所述光标所在位置之后的M4个文本,切分为一个词组;其中,所述N1=M1+M2,N2=M3+M4,M1、M2、M3和M4均为正整数。
可选地,所述修改信息确定子模块,包括:注音单元,用于分别对各所述词组进行注音,得到各词组对应的注音结果;属性判断单元,用于针对一个所述词组,依据所述词组的注音结果判断所述词组是否具有预设属性;同音词判断单元,用于若所述词组具有预设属性,则判断所述用户的用户词库中是否存在所述词组对应的同音词;第一文本确定单元,用于若所述用户词库存在对应的同音词,则将所述词组确定为第一待修改文本;所述修改模块,包括:第一纠错信息确定子模块,用于依据所述词组对应的同音词,确定所述第一待修改文本对应的第一纠错信息。
可选地,所述属性判断单元,用于依据所述词组的注音结果,判断***词库中是否存在与所述词组匹配的***词组;若***词库中存在与所述词组匹配的***词组,则获取与所述词组匹配的***词组的词频;若所述词频大于预设阈值,则获取与所述词组匹配的***词组的标签;若与所述词组匹配的***词组的标签中存在预设属性标签,则确定所述词组具有预设属性;否则,确定所述词组不具有预设属性。
可选地,所述的装置还包括:第二信息确定模块,用于在识别对应的语音识别结果时,确定所述语音识别结果中第二待修改文本,以及确定所述第二待修改文本在所述语音识别结果中的位置和所述第二待修改文本对应的第二纠错信息;所述修改信息确定子模块,包括:第二文本确定单元,用于分别确定各词组在所述语音识别结果中的位置;针对一个词组,将所述词组的位置与所述第二待修改文本的位置进行匹配;若存在位置与所述词组的位置匹配的第二待修改文本,则将所述词组确定为第一待修改文本;所述修改模块,包括:第二纠错信息确定子模块,用于将与所述词组匹配的第二待修改文本的第二纠错信息,确定为第一纠错信息。
可选地,所述修改模块,包括:展示子模块,用于在候选栏中展示所述第一纠错信息;替换子模块,用于接收上屏指令,将所述编辑框中的所述第一待修改文本替换为所述上屏指令对应的第一纠错信息。
可选地,所述展示子模块,用于在候选栏中按照预设样式展示所述第一纠错信息;所述预设样式包括以下至少一种:下划线、加粗、高亮、灌色。
可选地,所述的装置还包括:样式增加模块,用于为所述编辑框中所述第一待修改文本增加预设样式。
可选地,所述的装置还包括:联想模块,用于对所述用户移动光标后所述光标所在位置的上下文信息进行联想,得到对应的联想信息;所述展示子模块,用于结合所述联想信息在候选栏中对所述第一纠错信息进行展示。
可选地,所述的预设属性包括以下至少一种:人名属性、地点属性、事件名属性、专业术语属性和特定缩写属性。
本发明实施例还公开了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如本发明实施例任一所述的输入方法。
本发明实施例还公开了一种电子设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取用户输入的语音数据,识别对应的语音识别结果并上屏;依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本和对应的第一纠错信息;依据所述第一纠错信息对所述第一待修改文本进行修改。
可选地,所述依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本,包括:依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图;确定所述用户具有修改所述语音识别结果的意图时,将所述用户移动光标后所述光标所在位置的上下文信息切分为多个词组;依据所述多个词组,确定所述语音识别结果中第一待修改文本。
可选地,所述依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图,包括:获取所述语音识别结果上屏后在所述编辑框中的首尾位置;判断所述用户移动光标后所述光标的位置,是否处于所述首尾位置之间;若是,则确定所述用户具有修改所述语音识别结果的意图;若否,则确定所述用户不具有修改所述语音识别结果的意图。
可选地,所述依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图,包括:获取所述用户移动光标后所述光标所在位置的上下文信息;判断是否存在与所述上下文信息匹配的语音识别结果;若存在,则确定所述用户具有修改所述语音识别结果的意图;若不存在,则确定所述用户不具有修改所述语音识别结果的意图。
可选地,所述获取所述用户移动光标后所述光标所在位置的上下文信息,包括:获取所述用户移动光标后所述光标所在位置之前X1个文本,和所述光标所在位置之后X2个文本;采用所述X1个文本和X2个文本组成所述光标所在位置的上下文信息;其中,X1,X2均为整数。
可选地,所述将所述用户移动光标后所述光标所在位置的上下文信息切分为多个词组,包括:从所述用户移动光标后所述光标所在位置的上下文信息中,截取所述光标所在位置之前的N1个文本和所述光标所在位置之后的N2个文本;依据所述光标的位置对所述(N1+N2)个文本进行切分,得到多个词组;其中,N1,N2均为整数,X1大于或等于N1,X2大于或等于N2。
可选地,所述依据所述光标的位置对所述(N1+N2)个文本进行切分,得到多个词组,包括:将所述(N1+N2)个文本中所述光标所在位置之前的N1个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的N2个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的M1个文本和所述光标所在位置之后的M2个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的M3个文本和所述光标所在位置之后的M4个文本,切分为一个词组;其中,所述N1=M1+M2,N2=M3+M4,M1、M2、M3和M4均为正整数。
可选地,所述依据所述多个词组,确定所述语音识别结果中第一待修改文本,包括:分别对各所述词组进行注音,得到各词组对应的注音结果;针对一个所述词组,依据所述词组的注音结果判断所述词组是否具有预设属性;若所述词组具有预设属性,则判断所述用户的用户词库中是否存在所述词组对应的同音词;若所述用户词库存在对应的同音词,则将所述词组确定为第一待修改文本;所述确定所述第一待修改文本对应的第一纠错信息,包括:依据所述词组对应的同音词,确定所述第一待修改文本对应的第一纠错信息。
可选地,所述依据所述词组的注音结果判断所述词组是否具有预设属性,包括:依据所述词组的注音结果,判断***词库中是否存在与所述词组匹配的***词组;若***词库中存在与所述词组匹配的***词组,则获取与所述词组匹配的***词组的词频;若所述词频大于预设阈值,则获取与所述词组匹配的***词组的标签;若与所述词组匹配的***词组的标签中存在预设属性标签,则确定所述词组具有预设属性;否则,确定所述词组不具有预设属性。
可选地,还包含用于进行以下操作的指令:在识别对应的语音识别结果时,确定所述语音识别结果中第二待修改文本,以及确定所述第二待修改文本在所述语音识别结果中的位置和所述第二待修改文本对应的第二纠错信息;所述依据所述多个词组,确定所述语音识别结果中第一待修改文本,包括:分别确定各词组在所述语音识别结果中的位置;针对一个词组,将所述词组的位置与所述第二待修改文本的位置进行匹配;若存在位置与所述词组的位置匹配的第二待修改文本,则将所述词组确定为第一待修改文本;所述确定所述第一待修改文本对应的第一纠错信息,包括:将与所述词组匹配的第二待修改文本的第二纠错信息,确定为第一纠错信息。
可选地,所述依据所述第一纠错信息对所述待修改文本进行修改,包括:在候选栏中展示所述第一纠错信息;接收上屏指令,将所述编辑框中的所述第一待修改文本替换为所述上屏指令对应的第一纠错信息。
可选地,所述在候选栏中展示所述第一纠错信息,包括:在候选栏中按照预设样式展示所述第一纠错信息;所述预设样式包括以下至少一种:下划线、加粗、高亮、灌色。
可选地,还包含用于进行以下操作的指令:为所述编辑框中所述第一待修改文本增加预设样式。
可选地,还包含用于进行以下操作的指令:对所述用户移动光标后所述光标所在位置的上下文信息进行联想,得到对应的联想信息;所述在候选栏中展示所述第一纠错信息,包括:结合所述联想信息在候选栏中对所述第一纠错信息进行展示。
可选地,所述的预设属性包括以下至少一种:人名属性、地点属性、事件名属性、专业术语属性和特定缩写属性。
本发明实施例包括以下优点:
本发明实施例中,输入法在获取用户输入的语音数据后,可以识别对应的语音识别结果并上屏;然后依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本和对应的第一纠错信息,进而依据所述第一纠错信息对所述第一待修改文本进行修改;从而无需手动进行二次输入,提高用户输入效率。
附图说明
图1是本发明的一种输入方法实施例的步骤流程图;
图2a是本发明的一种语音识别结果展示界面示意图;
图2b是本发明的一种语音识别结果中光标位置展示界面示意图;
图2c是本发明的一种修改后的语音识别结果展示界面示意图;
图3是本发明的一种输入方法可选实施例的步骤流程图;
图4是本发明的一种输入装置实施例的结构框图;
图5是本发明的一种输入装置可选实施例的结构框图;
图6根据一示例性实施例示出的一种用于输入的电子设备的结构框图;
图7是本发明根据另一示例性实施例示出的一种用于输入的电子设备的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明实施例的核心构思之一是,在用户在需要修改的语音识别结果中移动光标后,根据光标的位置确定待修改文本,以及确定该待修改文本对应的纠错信息;然后依据该纠错信息对所述待修改文本进行修改,进而无需手动进行二次输入,提高用户输入效率。
参照图1,示出了本发明的一种输入方法实施例的步骤流程图,具体可以包括如下步骤:
步骤102、获取用户输入的语音数据,识别对应的语音识别结果并上屏。
本发明实施例中,用户需要进行信息输入时,可以调起输入法界面,然后通过在输入法界面中的操作进行输入。其中,一种输入方式可以是语音输入,即用户可以触发语音输入按钮如点击语音输入标识,然后输入语音数据,待输入完成后结束触发所述语音输入按钮。输入法获取语音数据后,可以对所述语音数据进行语音识别,识别出对应的语音识别结果;然后将所述语音识别结果上屏。
步骤104、依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本。
步骤106、确定所述第一待修改文本对应的第一纠错信息,依据所述第一纠错信息对所述第一待修改文本进行修改。
其中,在用户进行语音输入的过程中,可能由于环境嘈杂、发音不准、方言等因素导致输入法对用户输入的语音数据识别结果不准确;因此用户确定上屏的语音识别结果不准确时,可以将光标移动至需要修改的文本之前或之后,以对该需要修改的文本进行修改。本发明实施例为了提高用户输入效率,可以在用户移动光标后,根据光标的位置,确定语音识别结果中用户需要修改的文本;然后确定用户需要修改的文本对应的纠错信息。其中,为了便于后续说明,可以将用户需要修改的文本称为第一待修改文本,将用户需要修改的文本对应的纠错信息称为第一纠错信息。然后依据所述第一纠错信息对所述第一待修改文本,进而无需用户手动二次输入。
其中,输入法可直接采用第一待修改文本,替换为第一纠错信息;也可以在候选栏中展示所述第一纠错信息,待用户执行上屏操作后,采用对应上屏指令对应的第一纠错信息,替换编辑框中的第一待修改信息,本发明实施例对此不作限制。
本发明的一个示例中,用户输入“我曾经有个朋友,他来自另一个世界,自从他高中毕业,就开始了他的失业。他家人让他出去工作,他却丧失斗志,在家打游戏,日以继夜奋战的日子”的语音数据。输入法获取用户输入的语音数据,识别对应的语音识别结果并上屏,如图2a所示。用户根据上屏的语音识别结果确定“朋友”识别错误时,将光标移至“朋友”之后(如图2b所示),输入法可以依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本和对应的第一纠错信息;例如确定第一待修改文本为“朋友”,对应的第一纠错信息为“盆友”。然后依据所述第一纠错信息对所述第一待修改文本进行修改,例如采用“盆友”替换“朋友”,如图2c所示。
综上,本发明实施例中,输入法在获取用户输入的语音数据后,可以识别对应的语音识别结果并上屏;然后依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本和对应的第一纠错信息,进而依据所述第一纠错信息对所述第一待修改文本进行修改;从而无需手动进行二次输入,提高用户输入效率。
本发明的另一个实施例中,对如何依据光标的位置确定所述语音识别结果中的第一待修改文本和对应的第一纠错信息进行说明。
参照图3,示出了本发明的一种输入方法可选实施例的步骤流程图。
步骤302、获取用户输入的语音数据,识别对应的语音识别结果并上屏。
本发明实施例中,输入法接收用户输入的语音数据后,可以对所述语音数据进行语音识别,确定对应的语音识别结果。例如可以对所述语音数据进行语音增强,然后将语音增强后的语音数据输入中语音识别模型中,得到对应的语音识别结果。以及可以将所述语音识别结果上屏至在编辑框中进行展示,其中,不同应用程序中编辑框的名称不同,例如聊天应用中的编辑框可以是指消息输入框,浏览器中的编辑框可以是指搜索框等等,本发明实施例对此不作限制。
其中,除了用户手动移动光标时输入法可以检测到光标移动之外,当用户触发退格键(对应的功能可以是删除文本的功能)时,输入法也可以检测到光标移动;但删除文本并不是需要对文本进行修改,因此当输入法检测由退格键触发的光标移动时,可以直接结束上述流程。
其中,用户移动光标的除了修改文本之外,可能是需要进行其他的操作,如将光标移动至该语音识别结果中删除某些文本、或者添加文本等;因此在确定用户移动光标后,可以判断预设时间内是否接收到预设指令。所述预设时间可以按照需求设置,本发明实施例对此不作限制;所述预设指令可以包括多种,如切换语言的指令,如切换为与语音识别结果不同语言;切换标点符号键盘的指令;切换数字键盘的指令;切换输入方式的指令,如切换为手写输入、五笔输入、OCR(Optical Character Recognition,光学字符识别)识别输入等;复制/粘贴指令;空格指令等等。
当在预设时间内接收到预设指令,则确定用户移动光标的目的不是修改文本,可以直接结束上述流程。当在预设时间内未接收到预设指令,则确定用户移动光标的目的修改文本,可以执行步骤304。
步骤304、依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图。
本发明实施例中,编辑框中可以包括语音识别结果和其他方式输入的文本,如通过输入法键盘输入、粘贴操作输入等输入的文本;因此用户除了移动光标对编辑框中的语音识别结果进行修改之外,还可能通过移动光标对编辑框中其他方式输入的文本进行修改。因此本发明实施例中,当输入法检测不是由退格键触发的光标移动,且在光标移动之后的预设时间内未接收到预设指令时,判断所述用户是否具有修改所述语音识别结果的意图。当确定所述用户具有修改所述语音识别结果的意图时,可以执行步骤306;当确定所述用户不具有修改所述语音识别结果的意图时,可以结束上述流程。
本发明实施例中,一种依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图的方式可以包括如下子步骤:
子步骤22、获取所述语音识别结果上屏后在所述编辑框中的首尾位置。
子步骤24、判断所述用户移动光标后所述光标的位置,是否处于所述首尾位置之间。
子步骤26、若是,则确定所述用户具有修改所述语音识别结果的意图。
子步骤28、若否,则确定所述用户不具有修改所述语音识别结果的意图。
本发明实施例中,输入法可以向操作***请求所述光标在编辑框中的位置信息,然后基于操作***返回的光标在编辑中的位置,来判断所述用户是否具有修改所述语音识别结果的意图。其中,所述光标在编辑框中的位置可以直接采用光标的像素点坐标表示,也可以采用光标所在位置之前一个文本的文本序号和之后一个文本的文本序号组成的区间(后续可以成为第一区间,如17~18)表示,本发明实施例对此不作限制。其中,每个文本的文本序号可以根据文本在编辑框中文本顺序确定,例如编辑框中的第一个文本对应的文本序号可以是0,第二个文本对应的文本序号可以是1,以此类推。其中,可以基于所述光标在编辑框中的像素点坐标和各文本的像素点坐标,确定光标所在位置之前一个文本的文本序号和之后一个文本的文本序号;所述文本可以包括字词、标点、表情等,本发明实施例对此不作限制。
其中,可以先获取所述语音识别结果上屏后在所述编辑框中的首尾位置,所述首尾位置可以包括所述语音识别结果的第一文本在编辑框中的位置,和所述语音识别结果中最后一个文本在编辑框中的位置。其中,所述首尾位置可以采用语音识别结果中第一个文本在编辑框中的像素点坐标,和语音识别结果中最后一个文本在编辑框中的像素点坐标表示;也可以采用语音识别结果中第一个文本的文本序号和语音识别结果中最后一个文本的文本序列号表示,本发明实施例对此不作限制。
然后判断所述用户移动光标后光标的位置,是否处于所述首尾位置之间;以下以位置采用文本序号表示进行说明:可以确定由所述语音识别结果上屏后在所述编辑框中的第一个文本的文本序号和最后一个文本的文本序号组成第二区间,如13~23;然后判断第一区间是否是第二区间的一个子区间,若第一区间是第二区间的一个子区间,则确定所述用户移动光标后光标的位置,处于所述语音识别结果的首尾位置之间,此时可以说明用户需要对语音识别结果进行修改,即确定所述用户具有修改所述语音识别结果的意图。若第一区间不是第二区间的一个子区间,则确定所述用户移动光标后光标的位置,不在所述首尾位置之间,此时可以说明用户不是对语音识别结果进行修改,即确定所述用户不具有修改所述语音识别结果的意图。
本发明实施例中,某些操作***可能不支持将光标所在位置返回给输入法的功能,因此另一种依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图的方式可以包括如下子步骤:
子步骤42、获取所述用户移动光标后所述光标所在位置的上下文信息。
子步骤44、判断是否存在与所述上下文信息匹配的语音识别结果。
子步骤46、若存在,则确定所述用户具有修改所述语音识别结果的意图。
子步骤48、若不存在,则确定所述用户不具有修改所述语音识别结果的意图。
本发明实施例中,输入法可以向操作***请求所述用户移动光标后所述光标所在位置的上下文信息,然后基于光标所在位置的上下文信息,判断用户是否具有修改所述语音识别结果的意图。其中,一种获取所述用户移动光标后所述光标所在位置的上下文信息的方式可以是,获取光标所在位置之前X1个文本,和所述光标所在位置之后X2个文本,采用所述X1个文本和X2个文本组成所述光标所在位置的上下文信息;其中,X1,X2均为整数。所述X1和X2可以根据需求设置,如X1=20,X2=10,本发明实施例对此不作限制。
然后可以判断是否存在与所述上下文信息匹配的语音识别结果,来判断所述用户是否具有修改所述语音识别结果的意图。若存在与所述上下文信息匹配的语音识别结果,说明光标处于语音识别结果中的某个位置,则确定所述用户具有修改所述语音识别结果的意图。若不存在与所述上下文信息匹配的语音识别结果,说明光标不是在语音识别结果中的某个位置,则确定所述用户不具有修改所述语音识别结果的意图。
其中,用户可能每进行一次语音输入后,查看该次语音识别结果是否正确,也可以连续进行多次语音输入后,再对这个多次的语音识别结果进行查看,判断每次语音识别结果是否正确,本发明实施例对此不作限制。因此输入法可以存储最近P次的语音识别结果,然后可以将每次语音识别结果与所述上下文信息进行匹配,查找与上下文信息匹配的语音识别结果。其中,所述P可以按照需求设置,不同操作***中P可以不同,例如安卓***中P=5,IOS***中P=10。
步骤306、确定所述用户具有修改所述语音识别结果的意图时,将所述用户移动光标后所述光标所在位置的上下文信息切分为多个词组。
当输入法按照上述前一种方式判断所述用户是否具有修改所述语音识别结果的意图时,在确定所述用户具有修改所述语音识别结果的意图后,可获取所述用户移动光标后所述光标所在位置的上下文信息,这与上述子步骤42类似,在此不再赘述;进而依据所述上下文信息确定第一待修改文本。
不同操作***返回所述光标所在位置对应上下文信息的方式可能不同,例如,部分操作***(如安卓***)可能不会对标点符号进行截断,直接将光标所在位置之前X1个文本和所述光标所在位置之后X2个文本,均返回给输入法;此时输入法获取到的所述光标所在位置的上下文信息包括(X1+X2)个文本。部分操作***如(IOS操作***),可能会对标点符合进行截断;进而在向所述光标所在位置之前逐个文本获取X1个文本的过程中,当检测到第一个结束标点符号时,会停止再向前获取文本。对应的,在向所述光标所在位置之后逐个文本获取X2个文本的过程中,当检测到第一个结束标点符号时,会停止再向后获取文本。此时输入法获取到的所述光标所在位置的上下文信息是当前光标所在位置对应的语音识别结果,可能小于(X1+X2)个文本。所述结束标点符号可以是指用于语句结束的标点符号如句号,问号和感叹号等。
为了保证不同操作***中策略一致性,可以即获取所述光标所在位置的上下文信息,也获取光标所在位置对应的语音识别结果;然后将所述光标所在位置的上下文信息和对应的语音识别结果,传入至内核,由内核依据传入的信息确定第一待修改文本。在确定所述用户具有修改所述语音识别结果的意图时,对上述前一种操作***而言,可以将所述用户移动光标后所述光标所在位置的上下文信息切分为多个词组;对于上述后一种操作***而言,可以将所述用户移动光标后所述光标所在位置对应的语音识别结果切分为多个词组。
以下以将所述用户移动光标后所述光标所在位置的上下文信息切分为多个词组为例进行说明;其中,所述将所述用户移动光标后所述光标所在位置的上下文信息切分为多个词组,可以参照如下子步骤:
子步骤62、从所述用户移动光标后所述光标所在位置的上下文信息中,截取所述光标所在位置之前的N1个文本和所述光标所在位置之后的N2个文本。
子步骤64、依据所述光标的位置对所述(N1+N2)个文本进行切分,得到多个词组。
其中,N1,N2均为整数,X1大于或等于N1,X2大于或等于N2。
本发明实施例中,可以按照预设规则,从所述上下文信息中截取所述光标所在位置之前的N1个文本和所述光标所在位置之后的N2个文本。其中,预设规则可以按照需求设置,如前三后二,即截取所述光标所在位置之前的3个文本和所述光标所在位置之后的2个文本,即N1=3,N2=2;当然还可以设置其他的预设规则,对应的N1和N2的值也不同,本发明实施例对此不作限制。
例如,上下文信息为:“今天只能让欣怡陪你了”,光标的位置在“怡”和“陪”之间,即“今天只能让欣怡|陪你了”;其中“|”表示光标。若预设规则为前三后二,则截取光标所在位置之前的N1=3个文本:“让欣怡”和光标所在位置之后的N2=2个文本:“陪你”;进而得到5个文本:“让欣怡陪你”。
然后依据所述光标的位置对所述(N1+N2)个文本进行切分,得到多个词组,可以参照如下子步骤:
子步骤64-2、将所述(N1+N2)个文本中所述光标所在位置之前的N1个文本,切分为一个词组。
子步骤64-4、将所述(N1+N2)个文本中所述光标所在位置之前的N2个文本,切分为一个词组。
子步骤64-6、将所述(N1+N2)个文本中所述光标所在位置之前的M1个文本和所述光标所在位置之后的M2个文本,切分为一个词组。
子步骤64-8、将所述(N1+N2)个文本中所述光标所在位置之前的M3个文本和所述光标所在位置之后的M4个文本,切分为一个词组。
本发明实施例中,可以遍历(N1+N2)个文本,将这(N1+N2)个文本切分为不同数量的文本组成的词。其中,当语音识别结果错误时,用户习惯将光标移至需要修改的文本之后,且需要修改的文本可能与其之前的文本或之后的文本是一个词组;因此本发明实施例中,将所述(N1+N2)个文本中所述光标所在位置之前的N1个文本,切分为一个词组,以及当N1大于N2时,将所述(N1+N2)个文本中所述光标所在位置之前的N2个文本,切分为一个词组。当然将所述(N1+N2)个文本中所述光标所在位置之后的N2个文本,切分为一个词组,以及当N2大于N1时,将所述(N1+N2)个文本中所述光标所在位置之后的N1个文本,切分为一个词组,本发明实施例对此不作限制。
此外,还可以将所述光标所在位置前后的字词划分为一个词组,即可以将所述(N1+N2)个文本中所述光标所在位置之前的M1个文本和所述光标所在位置之后的M2个文本,切分为一个词组;以及将所述(N1+N2)个文本中所述光标所在位置之前的M3个文本和所述光标所在位置之后的M4个文本,切分为一个词组。其中,所述N1=M1+M2,N2=M3+M4,M1、M2、M3和M4均为正整数。可将所述M1依次取值为(1~N1-1),M2依次取值依次为(N1-1~1),每次M1和M2取值后,对只需要保证M1+M2=N1即可,并执行将所述(N1+N2)个文本中所述光标所在位置之前的M1个文本和所述光标所在位置之后的M2个文本,切分为一个词组。对应的,可将所述M3依次取值为(1~N2-1),M4依次取值依次为(N2-1~1),每次M3和M4取值后,对只需要保证M3+M4=N2即可,并执行将所述(N1+N2)个文本中所述光标所在位置之前的M3个文本和所述光标所在位置之后的M4个文本,切分为一个词组。
例如,上述示例中,N1=3,N2=2,得到5个文本“让欣怡|陪你”。然后按照如下方式切分词组:
将光标所在位置之前的N1=3个文本切分为一个词组,得到:“让欣怡”。
将光标所在位置之前的N2=2个文本切分为一个词组,得到:“欣怡”。
将所述光标所在位置之前的M1=2个文本和所述光标所在位置之后的M2=1个文本,切分为一个词组,得到“欣怡陪”。
将所述光标所在位置之前的M1=1个文本和所述光标所在位置之后的M2=2个文本,切分为一个词组,得到“怡陪你”。
将所述光标所在位置之前的M3=1个文本和所述光标所在位置之后的M4=1个文本,切分为一个词组,得到“怡陪”。
进而可以得到5个词组:“让欣怡”、“欣怡”、“欣怡陪”、“怡陪你”和“怡陪”。
然后从所述切分得到的多个词组中,选取出第一待修改文本;可以参照步骤308。
步骤308、依据所述多个词组,确定所述语音识别结果中第一待修改文本。
步骤310、确定所述第一待修改文本对应的第一纠错信息。
其中,步骤308可以包括如下子步骤82-88:
子步骤82、分别对各所述词组进行注音,得到各词组对应的注音结果。
本发明实施例中,可以为每个词组进行注音,即为每个词组标注拼音;例如,上述示例中,对词组“让欣怡”进行注音,得到对应的注音结果为:“rangxinyi”。对词组“欣怡”进行注音,得到对应的注音结果为“xinyi”,以此类推。
然后依据该词组的注音结果,判断该词组是否为第一待修改文本;以下以一个词组为了进行说明。
子步骤84、针对一个所述词组,依据所述词组的注音结果判断所述词组是否具有预设属性。
由于读音相同的人名、地名、专业术语等较多,且而不同用户词库中相同读音的词可能是不同的;导致输入法对这些词的识别容易出现错误,其中,所述用户词库可以是指用于存储用户历史输入的词组的数据库。因此本发明实施例,针对每一个词组,可以依据所述词组的注音结果判断所述词组是否具有预设属性;若所述词组具有预设属性,则可以执行子步骤86;若所述词组不具有预设属性,则可以对下一个词组执行子步骤82。
其中,所述的预设属性包括以下至少一种:人名属性、地点属性、事件名属性、专业术语属性和特定缩写属性;当然还可以包括国家名属性、动植物名属性等等,本发明实施例对此不作限制。
本发明实施例中,一种依据所述词组的注音结果判断所述词组是否具有预设属性的方式可以包括如下:子步骤(84-2)-子步骤(84-14):
子步骤84-2、依据所述词组的注音结果,判断***词库中是否存在与所述词组匹配的***词组。
子步骤84-4、获取与所述词组匹配的***词组的词频。
子步骤84-6、判断所述词频是否大于预设阈值。
子步骤84-8、获取与所述词组匹配的***词组的标签。
子步骤84-10、判断与所述词组匹配的***词组的标签中是否存在预设属性标签。
子步骤84-12、确定所述词组具有预设属性。
子步骤84-14、确定所述词组不具有预设属性。
本发明实施例中,每个终端上存储有***词库,所述***词库中可以包括***词组,***词组对应的拼音、词频和不同维度的标签(如人名属性标签、领域标签等等)。因此针对每个词组,可以将该词组的注音结果与***词库中的各个***词组的拼音进行匹配;查找与所述词组的注音结果匹配的拼音。当查找到与所述词组的注音结果匹配的拼音时,可以确定***词库中存在与所述词组匹配的***词组。然后可以获取与该词组匹配的***词组的词频,并判断与所述词组匹配的***词组的词频是否大于预设阈值。若所述词频大于预设阈值,则执行子步骤84-8:获取与所述词组匹配的***词组的标签;然后执行子步骤84-10:判断与所述词组匹配的***词组的标签中是否存在预设属性标签。若与所述词组匹配的***词组的标签中存在预设属性标签,则执行子步骤84-12:确定所述词组具有预设属性。若确定***词库中不存在与所述词组匹配的***词组,或与所述词组匹配的***词组的词频小于预设阈值,或与所述词组匹配的***词组的标签中不存在预设属性标签,则可以执行子步骤84-14:确定所述词组不具有预设属性。
其中,当所述预设属性为人名属性时,由于***词库中具有人名属性标签的***词组不一定是姓氏,且***词库可能不包含姓氏字词;因此输入法还可以存储姓氏资源库。若***词库中不存在与所述词组匹配的***词组,或与所述词组匹配的***词组的标签中不存在人名属性标签,则可以判断姓氏资源库中是否存在与所述词组的首字匹配的姓氏;若所述姓氏资源库中存在与所述词组的首字匹配的姓氏,则可以确定所述词组具有人名属性。当然也可以判断姓氏资源库中是否存在与所述词组的首个词匹配的姓氏,本发明实施例对此不作限制。若所述姓氏资源库中不存在与所述词组的首字匹配的姓氏,则可以确定所述词组不具有人名属性。
子步骤86、若所述词组具有预设属性,则判断所述用户的用户词库中是否存在所述词组对应的同音词。
当确定所述词组具有预设属性时,可以判断所述用户的用户词库中是否存在所述词组对应的同音词。其中,所述用户词库存储词组的方式可以是:词组#拼音#词频;例如:郭佳南#guo'jia'nan#3、小萱#xiao'xuan#42、馨仪#xin'yi#2,等等。
其中,当所述预设属性为人名属性时,可以先将该词组的注音结果,与通讯录中的拼音进行匹配,查找与所述注音结果匹配的拼音。若从通讯录中查找到与所述注音结果匹配的拼音,则可以将通讯录中与所述词组的注音结果匹配的拼音对应的词组,确定为该词组的同音词;以及可以将所述词组确定为第一待修改文本。若从通讯录中未查找到与所述注音结果匹配的拼音,可以将该词组的注音结果,与用户词库中的拼音进行匹配,查找与所述注音结果匹配的拼音。若从用户词库中查找到与所述注音结果匹配的拼音,则可以将用户词库中与所述词组的注音结果匹配的拼音对应的词组,确定为该词组的同音词;进而可以执行子步骤88;若从用户词库中未查找到与所述注音结果匹配的拼音,则可以对下一个词组执行子步骤82。
子步骤88、若所述用户词库存在对应的同音词,则将所述词组确定为第一待修改文本。
上述步骤310可以包括:依据所述词组对应的同音词,确定所述第一待修改文本对应的第一纠错信息。
其中,可以将所述词组的同音词确定为第一待修改文本的纠错候选项,将所述词组同音词的词频作为对应的候选分值,然后采用所述纠错候选项和对应的候选分值,生成所述第一纠错候选信息。
例如针对词组“欣怡”,可以在用户词库中查找到匹配的词组:“馨仪”,则可以将将“欣怡”确定为第一待修改文本;以及将对应匹配的词组“馨仪”确定为纠错候选,“馨仪”对应的词频“2”作为对应的候选分值。
此外,每个用户的用户词库中可能存在个性化词组,如模糊音词(如老残(lao’can)->脑残(nao’can))、特征词(如东北方言“齁挺”)等;因此若所述词频小于预设阈值,或者***词库不存在与所述词组匹配的***词组,或者所述用户词库不存在对应的同音词,则可以判断用户词库中是否存在与词组匹配的个性化词组。当存在时,可以将该词组确定为第一待修改文本,并依据对应的个性化词组确定第一纠错信息;本发明实施例对此不作限制。
本发明的一个可选实施例中,输入法在识别对应的语音识别结果时,可以对所述语音识别结果中需要修改的文本、对应的位置和对应的纠错信息进行预测;进而确定所述语音识别结果中第二待修改文本,以及确定所述第二待修改文本在所述语音识别结果中的位置和所述第二待修改文本对应的第二纠错信息。其中,所述第二待修改文本可以是指在识别对应的语音识别结果时,预测所述语音识别结果中需要修改的文本;所述第二纠错信息可以是指在识别对应的语音识别结果时,预测所述语音识别结果中需要修改的文本对应的纠错信息。其中,所述第二纠错信息可以包括纠错候选项和候选分值。
因此在将所述用户移动光标后所述光标所在位置的上下文信息切分为多个词组后,可各词组与第二待修改文本进行比对,确定第一待修改文本,以及确定所述第一待修改文本对应的第一纠错文本。
本发明实施例中,一种依据所述多个词组,确定第一待修改文本方式可以是:分别确定各词组在所述语音识别结果中的位置;针对一个词组,将所述词组的位置与所述第二待修改文本的位置进行匹配;若存在位置与所述词组的位置匹配的第二待修改文本,则将所述词组确定为第一待修改文本。所述步骤310可以包括将与所述词组匹配的第二待修改文本的第二纠错信息确定为第一纠错信息。
其中,所述语音识别结果中第二待修改文本可以包括多个,每个第二待修改文本的位置可以采用该第二待修改文本的第一个文本的文本序号和该第二待修改文本的最后一个文本的文本序号组成的区间表示,可以称为第三区域。针对每一个词组,该词组在所述语音识别结果中的位置可以采用该词组的第一个文本的文本序号和该词组的最后一个文本的文本序号组成的区间表示,可以称为第四区间。然后可以查找与第四区间匹配的第三区间,若查找到与第四区间匹配的第三区间,则可以确定存在位置与所述词组的位置匹配的第二待修改文本,此时可以将所述词组确定为第一待修改文本和将所述匹配的第二待修改文本的第二纠错信息确定为第一纠错信息。
若未查找到与第四区间匹配的第三区间,则可以确定不存在位置与所述词组的位置匹配的第二待修改文本,此时可以执行上述子步骤80-子步骤88。
本发明实施例中,一种依据所述第一纠错信息对所述第一待修改文本进行修改可以参照步骤312步骤314:
步骤312、在候选栏中展示所述第一纠错信息。
本发明实施例中,可以在候选栏中展示所述第一纠错信息。其中,当所述第一纠错信息包括一个纠错候选项时,可以直接在候选栏的首屏,将该纠错候选项作为第一个候选展示。当所述第一纠错信息包括多个纠错候选项时,可以按照各个纠错候选项对应的候选分值对各纠错候选项进行排序;然后在候选栏的首屏,按照所述排序的排序结果展示各纠错候选项。
本发明的一个可选实施例中,当用户移动光标后,输入法还可以对所述用户移动光标后所述光标所在位置的上下文信息进行联想,得到对应的联想信息。其中,所述联想信息可以包括联想候选项和对应的候选分值。进而在候选栏中展示所述第一纠错信息时,结合所述联想信息在候选栏中对所述第一纠错信息进行展示。
本发明实施例中,结合所述联想信息在候选栏中对所述第一纠错信息进行展示,可以将纠错候选项排在联想候选项之前在候选栏中展示;其中,联想候选项可以按照对应的候选分值排序,并按照排序结果在纠错候选项之后进行展示。也可以依据纠错候选项的候选分值和联想候选项的候选分值,对纠错候选项和联想候选项进行排序如降序排序;然后按照排序结果,在候选栏中展示所述纠错候选项和联想候选项。
本发明的一个可选实施例中,在候选栏中展示所述第一纠错信息时,可以将该第一纠错候选项与其他类型(如联想)候选信息进行区别,以提示用户该纠错候选项是针对语音识别结果中文本的纠错。其中,一种方式可以是,在候选栏中按照预设样式展示所述第一纠错信息(可以是指纠错候选项)。其中,所述预设样式包括以下至少一种:下划线、加粗、高亮、灌色;当然还可以包括其他预设样式,本发明实施例对此不作限制。此外,还可以包括其他方式,如为在候选栏中所述第一纠错信息添加预设标识,本发明实施例对此不作限制。
本发明的一个可选实施例中,可以为所述编辑框中所述第一待修改文本增加预设样式,以提示用户语音识别结果中可以通过上屏纠错候选项进行修改的文本。
步骤314、接收上屏指令,将所述第一待修改文本替换为所述上屏指令对应的第一纠错信息。
当候选栏中存在满足用户需求的纠错候选项时,用户可以针对该满足需求的纠错候选项执行上屏操作;对应的,输入法可以接收所述上屏操作对应的上屏指令,然后将所述编辑框中的所述第一待修改文本替换为所述上屏指令对应的纠错候选项。
例如候选栏的首屏的第一个候选项为“馨仪”,当用户点击该候选项后,可以采用“馨仪”替换编辑框中的“欣怡”,得到“今天只能让馨仪陪你了”。
本发明的一个可选实施例中,在当执行步骤314后,所述光标的位置可以移动至替换第一待修改文本的纠错候选项之后。例如“今天只能让馨仪|陪你了”。
本发明的一个可选实施例中,当执行步骤314后,输入法可以将数据库中存储的该条语音识别结果,更新为采用纠错候选项替换第一待修改文本后得到的语音识别结果。此外,当用户在语音识别结果中添加与该语音识别结果相同语言的添加文本后,也可以将数据库中存储的该条语音识别结果,更新为添加文本后的语音识别结果。在更新语音识别结果后,可以对更新后的语音识别结果中各个文本的文本序号进行更新;进而便于用户依然可以对更新后的语音识别结果中错误的文本进行修改。若用户确定该语音识别结果中还存在需要修改的文本,可以将光标移至该修改的文本前后,触发输入法再次执行步骤304-314。
以下以将数据库中存储的该条语音识别结果,更新为采用纠错候选项替换第一待修改文本后得到的语音识别结果后,对更新后的语音识别结果中各个文本的文本序号进行更新为例进行说明。可以计算第一待修改文本减去用于替换所述第一待修改文本的纠错候选项的文本差值Y,所述文本差值Y可以是整数,可以是0,也可以是正整数,还可以是负整数。若第一待修改文本为语音识别结果最前面的几个文本(即第一待修改文本的第一个文本是该语音识别结果的第一个文本),则将该语音识别结果中第一待修改文本之后的其他文本的文本序号加该文本差值Y。以及将该纠错候选项的第一个文本的文本序号赋值为第一待修改文本的第一个文本的文本序号,然后按照顺序将该纠错候选项中第一个文本之后的文本的文本序号依次加1。若第一待修改文本为语音识别结果最后面的几个文本(即第一待修改文本的最后一个文本是该语音识别结果的最后一个文本),则无需更新该语音识别结果中第一待修改文本之前的其他文本的文本序号,按照上述方式为该纠错候选项的各文本添加对应的文本序号即可。若第一待修改文本为语音识别结果中间的几个文本(即第一待修改文本的第一个文本不是该语音识别结果的第一个文本,且第一待修改文本的最后一个文本不是该语音识别结果的最后一个文本);则将该语音识别结果中第一待修改文本之后的其他文本的文本序号加该文本差值Y,无需更新该语音识别结果中第一待修改文本之前的其他文本的文本序号,以及按照上述方式为该纠错候选项的各文本添加对应的文本序号即可。
综上,本发明实施例中,输入在获取用户输入的语音数据后,识别对应的语音识别结果并上屏,然后依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本和对应的第一纠错信息,再在候选栏中展示所述第一纠错信息;待用户针对满足需求的第一纠错信息执行上屏操作后,输入可以接收上屏指令,然后将所述编辑框中的所述待修改文本替换为所述上屏指令对应的第一纠错信息;进而用户将光标移动至需要修改的文本前后之后,通过从候选栏中点选纠错信息,即可以完成对需要修改的文本的修改,而无需手动二次输入,提高了用户的输入效率。
其次,本发明实施例中,在候选栏中展示所述第一纠错信息时,可以将该第一纠错信息与其他类型(如联想)候选信息进行区别,以提示用户该纠错候选项是针对语音识别结果中文本的纠错。以及可以为所述编辑框中所述第一待修改文本增加预设样式,以提示用户语音识别结果中可以通过上屏纠错候选项进行修改的文本。
进一步,本发明实施例中,从所述用户移动光标后所述光标所在位置的上下文信息中,截取所述光标所在位置之前的N1个文本和所述光标所在位置之后的N2个文本后,可以将所述(N1+N2)个文本中所述光标所在位置之前的N1个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的N2个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的M1个文本和所述光标所在位置之后的M2个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的M3个文本和所述光标所在位置之后的M4个文本,切分为一个词组;其中,所述N1=M1+M2,N2=M3+M4,进而能够将N1+N2文本切分为不同数量文本组成的词组,提高确定第一待修改文本的准确性;从而进一步提高输入效率。
再次,本发明实施例中,可以分别对各所述词组进行注音,得到各词组对应的注音结果,然后针对一个所述词组,可以依据所述词组的注音结果确定所述词组在***词库中的词频;若所述词频大于预设词频,则判断所述词组是否具有预设属性,若所述词组具有预设属性,则判断所述用户的用户词库中是否存在所述词组对应的同音词,若所述用户词库存在对应的同音词,则将所述词组确定为第一待修改文本,以及依据所述同音词确定所述第一待修改文本对应的第一纠错信息;进而通过用户词库匹配到个性化纠错信息,更好的满足用户个性化需求,提高用户体验。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图4,示出了本发明的一种输入装置实施例的结构框图,具体可以包括如下模块:
识别模块402,用于获取用户输入的语音数据,识别对应的语音识别结果并上屏;
第一信息确定模块404,用于依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本和对应的第一纠错信息;
修改模块406,用于依据所述第一纠错信息对所述第一待修改文本进行修改。
参照图5,示出了本发明的一种输入装置可选实施例的结构框图。
本发明一个可选的实施例中,所述第一信息确定模块404,包括:
意图判断子模块4042,用于依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图;
切分子模块4044,用于确定所述用户具有修改所述语音识别结果的意图时,将所述用户移动光标后所述光标所在位置的上下文信息切分为多个词组;
修改信息确定子模块4046,用于依据所述多个词组,确定所述语音识别结果中第一待修改文本。
本发明一个可选的实施例中,所述意图判断子模块4042,包括:
位置判断单元40422,用于获取所述语音识别结果上屏后在所述编辑框中的首尾位置;判断所述用户移动光标后所述光标的位置,是否处于所述首尾位置之间;若是,则确定所述用户具有修改所述语音识别结果的意图;若否,则确定所述用户不具有修改所述语音识别结果的意图。
本发明一个可选的实施例中,所述意图判断子模块4042,包括:
上下文判断单元40424,用于获取所述用户移动光标后所述光标所在位置的上下文信息;判断是否存在与所述上下文信息匹配的语音识别结果;若存在,则确定所述用户具有修改所述语音识别结果的意图;若不存在,则确定所述用户不具有修改所述语音识别结果的意图。
本发明一个可选的实施例中,所述上下文判断单元40424,用于获取所述用户移动光标后所述光标所在位置之前X1个文本,和所述光标所在位置之后X2个文本;采用所述X1个文本和X2个文本组成所述光标所在位置的上下文信息;其中,X1,X2均为整数。
本发明一个可选的实施例中,所述切分子模块4044,包括:
文本截取单元40442,用于从所述用户移动光标后所述光标所在位置的上下文信息中,截取所述光标所在位置之前的N1个文本和所述光标所在位置之后的N2个文本;
词组切分单元40444,用于依据所述光标的位置对所述(N1+N2)个文本进行切分,得到多个词组;其中,N1,N2均为整数,X1大于或等于N1,X2大于或等于N2。
本发明一个可选的实施例中,所述词组切分单元40444,用于将所述(N1+N2)个文本中所述光标所在位置之前的N1个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的N2个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的M1个文本和所述光标所在位置之后的M2个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的M3个文本和所述光标所在位置之后的M4个文本,切分为一个词组;其中,所述N1=M1+M2,N2=M3+M4,M1、M2、M3和M4均为正整数。
本发明一个可选的实施例中,所述修改信息确定子模块4046,包括:
注音单元40462,用于分别对各所述词组进行注音,得到各词组对应的注音结果;
属性判断单元40464,用于针对一个所述词组,依据所述词组的注音结果判断所述词组是否具有预设属性;
同音词判断单元40466,用于若所述词组具有预设属性,则判断所述用户的用户词库中是否存在所述词组对应的同音词;
第一文本确定单元40468,用于若所述用户词库存在对应的同音词,则将所述词组确定为第一待修改文本;
所述修改模块406,包括:
第一纠错信息确定子模块4062,用于依据所述词组对应的同音词,确定所述第一待修改文本对应的第一纠错信息。
本发明一个可选的实施例中,所述属性判断单元40464,用于依据所述词组的注音结果,判断***词库中是否存在与所述词组匹配的***词组;若***词库中存在与所述词组匹配的***词组,则获取与所述词组匹配的***词组的词频;若所述词频大于预设阈值,则获取与所述词组匹配的***词组的标签;若与所述词组匹配的***词组的标签中存在预设属性标签,则确定所述词组具有预设属性;否则,确定所述词组不具有预设属性。
本发明一个可选的实施例中,所述的装置还包括:
第二信息确定模块408,用于在识别对应的语音识别结果时,确定所述语音识别结果中第二待修改文本,以及确定所述第二待修改文本在所述语音识别结果中的位置和所述第二待修改文本对应的第二纠错信息;
所述修改信息确定子模块4046,包括:
第二文本确定单元404610,用于分别确定各词组在所述语音识别结果中的位置;针对一个词组,将所述词组的位置与所述第二待修改文本的位置进行匹配;若存在位置与所述词组的位置匹配的第二待修改文本,则将所述词组确定为第一待修改文本;
所述修改模块406,包括:
第二纠错信息确定子模块修改模块4064,用于将与所述词组匹配的第二待修改文本的第二纠错信息,确定为第一纠错信息。
本发明一个可选的实施例中,所述修改模块406,包括:
展示子模块4066,用于在候选栏中展示所述第一纠错信息;
替换子模块4068,用于接收上屏指令,将所述编辑框中的所述第一待修改文本替换为所述上屏指令对应的第一纠错信息。
本发明一个可选的实施例中,所述展示子模块4062,用于在候选栏中按照预设样式展示所述第一纠错信息;所述预设样式包括以下至少一种:下划线、加粗、高亮、灌色。
本发明一个可选的实施例中,所述的装置还包括:
样式增加模块410,用于为所述编辑框中所述第一待修改文本增加预设样式。
本发明一个可选的实施例中,所述的装置还包括:
联想模块412,用于对所述用户移动光标后所述光标所在位置的上下文信息进行联想,得到对应的联想信息;
所述展示子模块4062,用于结合所述联想信息在候选栏中对所述第一纠错信息进行展示。
本发明一个可选的实施例中,所述的预设属性包括以下至少一种:人名属性、地点属性、事件名属性、专业术语属性和特定缩写属性。
综上,本发明实施例中,输入法在获取用户输入的语音数据后,可以识别对应的语音识别结果并上屏;然后依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本和对应的第一纠错信息,进而依据所述第一纠错信息对所述第一待修改文本进行修改;从而无需手动进行二次输入,提高用户输入效率。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
图6是根据一示例性实施例示出的一种用于输入的电子设备600的结构框图。例如,电子设备600可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图6,电子设备600可以包括以下一个或多个组件:处理组件602,存储器604,电力组件606,多媒体组件608,音频组件610,输入/输出(I/O)的接口612,传感器组件614,以及通信组件616。
处理组件602通常控制电子设备600的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件602可以包括一个或多个处理器620来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件602可以包括一个或多个模块,便于处理组件602和其他组件之间的交互。例如,处理部件602可以包括多媒体模块,以方便多媒体组件608和处理组件602之间的交互。
存储器604被配置为存储各种类型的数据以支持在设备600的操作。这些数据的示例包括用于在电子设备600上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件606为电子设备600的各种组件提供电力。电力组件606可以包括电源管理***,一个或多个电源,及其他与为电子设备600生成、管理和分配电力相关联的组件。
多媒体组件608包括在所述电子设备600和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件608包括一个前置摄像头和/或后置摄像头。当电子设备600处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件610被配置为输出和/或输入音频信号。例如,音频组件610包括一个麦克风(MIC),当电子设备600处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通信组件616发送。在一些实施例中,音频组件610还包括一个扬声器,用于输出音频信号。
I/O接口612为处理组件602和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件614包括一个或多个传感器,用于为电子设备600提供各个方面的状态评估。例如,传感器组件614可以检测到设备600的打开/关闭状态,组件的相对定位,例如所述组件为电子设备600的显示器和小键盘,传感器组件614还可以检测电子设备600或电子设备600一个组件的位置改变,用户与电子设备600接触的存在或不存在,电子设备600方位或加速/减速和电子设备600的温度变化。传感器组件614可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件614还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件614还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件616被配置为便于电子设备600和其他设备之间有线或无线方式的通信。电子设备600可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件614经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件614还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备600可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器604,上述指令可由电子设备600的处理器620执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种输入方法,所述方法包括:获取用户输入的语音数据,识别对应的语音识别结果并上屏;依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本;确定所述第一待修改文本对应的第一纠错信息,依据所述第一纠错信息对所述第一待修改文本进行修改。
可选地,所述依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本,包括:依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图;确定所述用户具有修改所述语音识别结果的意图时,将所述用户移动光标后所述光标所在位置的上下文信息切分为多个词组;依据所述多个词组,确定所述语音识别结果中第一待修改文本。
可选地,所述依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图,包括:获取所述语音识别结果上屏后在所述编辑框中的首尾位置;判断所述用户移动光标后所述光标的位置,是否处于所述首尾位置之间;若是,则确定所述用户具有修改所述语音识别结果的意图;若否,则确定所述用户不具有修改所述语音识别结果的意图。
可选地,所述依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图,包括:获取所述用户移动光标后所述光标所在位置的上下文信息;判断是否存在与所述上下文信息匹配的语音识别结果;若存在,则确定所述用户具有修改所述语音识别结果的意图;若不存在,则确定所述用户不具有修改所述语音识别结果的意图。
可选地,所述获取所述用户移动光标后所述光标所在位置的上下文信息,包括:获取所述用户移动光标后所述光标所在位置之前X1个文本,和所述光标所在位置之后X2个文本;采用所述X1个文本和X2个文本组成所述光标所在位置的上下文信息;其中,X1,X2均为整数。
可选地,所述将所述用户移动光标后所述光标所在位置的上下文信息切分为多个词组,包括:从所述用户移动光标后所述光标所在位置的上下文信息中,截取所述光标所在位置之前的N1个文本和所述光标所在位置之后的N2个文本;依据所述光标的位置对所述(N1+N2)个文本进行切分,得到多个词组;其中,N1,N2均为整数,X1大于或等于N1,X2大于或等于N2。
可选地,所述依据所述光标的位置对所述(N1+N2)个文本进行切分,得到多个词组,包括:将所述(N1+N2)个文本中所述光标所在位置之前的N1个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的N2个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的M1个文本和所述光标所在位置之后的M2个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的M3个文本和所述光标所在位置之后的M4个文本,切分为一个词组;其中,所述N1=M1+M2,N2=M3+M4,M1、M2、M3和M4均为正整数。
可选地,所述依据所述多个词组,确定所述语音识别结果中第一待修改文本,包括:分别对各所述词组进行注音,得到各词组对应的注音结果;针对一个所述词组,依据所述词组的注音结果判断所述词组是否具有预设属性;若所述词组具有预设属性,则判断所述用户的用户词库中是否存在所述词组对应的同音词;若所述用户词库存在对应的同音词,则将所述词组确定为第一待修改文本;所述确定所述第一待修改文本对应的第一纠错信息,包括:依据所述词组对应的同音词,确定所述第一待修改文本对应的第一纠错信息。
可选地,所述依据所述词组的注音结果判断所述词组是否具有预设属性,包括:依据所述词组的注音结果,判断***词库中是否存在与所述词组匹配的***词组;若***词库中存在与所述词组匹配的***词组,则获取与所述词组匹配的***词组的词频;若所述词频大于预设阈值,则获取与所述词组匹配的***词组的标签;若与所述词组匹配的***词组的标签中存在预设属性标签,则确定所述词组具有预设属性;否则,确定所述词组不具有预设属性。
可选地,所述的方法还包括:在识别对应的语音识别结果时,确定所述语音识别结果中第二待修改文本,以及确定所述第二待修改文本在所述语音识别结果中的位置和所述第二待修改文本对应的第二纠错信息;所述依据所述多个词组,确定所述语音识别结果中第一待修改文本,包括:分别确定各词组在所述语音识别结果中的位置;针对一个词组,将所述词组的位置与所述第二待修改文本的位置进行匹配;若存在位置与所述词组的位置匹配的第二待修改文本,则将所述词组确定为第一待修改文本;所述确定所述第一待修改文本对应的第一纠错信息,包括:将与所述词组匹配的第二待修改文本的第二纠错信息,确定为第一纠错信息。
可选地,所述依据所述第一纠错信息对所述待修改文本进行修改,包括:在候选栏中展示所述第一纠错信息;接收上屏指令,将所述编辑框中的所述第一待修改文本替换为所述上屏指令对应的第一纠错信息。
可选地,所述在候选栏中展示所述第一纠错信息,包括:在候选栏中按照预设样式展示所述第一纠错信息;所述预设样式包括以下至少一种:下划线、加粗、高亮、灌色。
可选地,所述的方法还包括:为所述编辑框中所述第一待修改文本增加预设样式。
可选地,所述的方法还包括:对所述用户移动光标后所述光标所在位置的上下文信息进行联想,得到对应的联想信息;所述在候选栏中展示所述第一纠错信息,包括:结合所述联想信息在候选栏中对所述第一纠错信息进行展示。
可选地,所述的预设属性包括以下至少一种:人名属性、地点属性、事件名属性、专业术语属性和特定缩写属性。
图7是本发明根据另一示例性实施例示出的一种用于输入的电子设备700的结构示意图。该电子设备700可以是服务器,该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或一个以***处理器(central processing units,CPU)722(例如,一个或一个以上处理器)和存储器732,一个或一个以上存储应用程序742或数据744的存储介质730(例如一个或一个以上海量存储设备)。其中,存储器732和存储介质730可以是短暂存储或持久存储。存储在存储介质730的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器722可以设置为与存储介质730通信,在服务器上执行存储介质730中的一系列指令操作。
服务器还可以包括一个或一个以上电源726,一个或一个以上有线或无线网络接口750,一个或一个以上输入输出接口758,一个或一个以上键盘756,和/或,一个或一个以上操作***741,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种电子设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取用户输入的语音数据,识别对应的语音识别结果并上屏;依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本和对应的第一纠错信息;依据所述第一纠错信息对所述第一待修改文本进行修改。
可选地,所述依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本,包括:依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图;确定所述用户具有修改所述语音识别结果的意图时,将所述用户移动光标后所述光标所在位置的上下文信息切分为多个词组;依据所述多个词组,确定所述语音识别结果中第一待修改文本。
可选地,所述依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图,包括:获取所述语音识别结果上屏后在所述编辑框中的首尾位置;判断所述用户移动光标后所述光标的位置,是否处于所述首尾位置之间;若是,则确定所述用户具有修改所述语音识别结果的意图;若否,则确定所述用户不具有修改所述语音识别结果的意图。
可选地,所述依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图,包括:获取所述用户移动光标后所述光标所在位置的上下文信息;判断是否存在与所述上下文信息匹配的语音识别结果;若存在,则确定所述用户具有修改所述语音识别结果的意图;若不存在,则确定所述用户不具有修改所述语音识别结果的意图。
可选地,所述获取所述用户移动光标后所述光标所在位置的上下文信息,包括:获取所述用户移动光标后所述光标所在位置之前X1个文本,和所述光标所在位置之后X2个文本;采用所述X1个文本和X2个文本组成所述光标所在位置的上下文信息;其中,X1,X2均为整数。
可选地,所述将所述用户移动光标后所述光标所在位置的上下文信息切分为多个词组,包括:从所述用户移动光标后所述光标所在位置的上下文信息中,截取所述光标所在位置之前的N1个文本和所述光标所在位置之后的N2个文本;依据所述光标的位置对所述(N1+N2)个文本进行切分,得到多个词组;其中,N1,N2均为整数,X1大于或等于N1,X2大于或等于N2。
可选地,所述依据所述光标的位置对所述(N1+N2)个文本进行切分,得到多个词组,包括:将所述(N1+N2)个文本中所述光标所在位置之前的N1个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的N2个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的M1个文本和所述光标所在位置之后的M2个文本,切分为一个词组;将所述(N1+N2)个文本中所述光标所在位置之前的M3个文本和所述光标所在位置之后的M4个文本,切分为一个词组;其中,所述N1=M1+M2,N2=M3+M4,M1、M2、M3和M4均为正整数。
可选地,所述依据所述多个词组,确定所述语音识别结果中第一待修改文本,包括:分别对各所述词组进行注音,得到各词组对应的注音结果;针对一个所述词组,依据所述词组的注音结果判断所述词组是否具有预设属性;若所述词组具有预设属性,则判断所述用户的用户词库中是否存在所述词组对应的同音词;若所述用户词库存在对应的同音词,则将所述词组确定为第一待修改文本;所述确定所述第一待修改文本对应的第一纠错信息,包括:依据所述词组对应的同音词,确定所述第一待修改文本对应的第一纠错信息。
可选地,所述依据所述词组的注音结果判断所述词组是否具有预设属性,包括:依据所述词组的注音结果,判断***词库中是否存在与所述词组匹配的***词组;若***词库中存在与所述词组匹配的***词组,则获取与所述词组匹配的***词组的词频;若所述词频大于预设阈值,则获取与所述词组匹配的***词组的标签;若与所述词组匹配的***词组的标签中存在预设属性标签,则确定所述词组具有预设属性;否则,确定所述词组不具有预设属性。
可选地,还包含用于进行以下操作的指令:在识别对应的语音识别结果时,确定所述语音识别结果中第二待修改文本,以及确定所述第二待修改文本在所述语音识别结果中的位置和所述第二待修改文本对应的第二纠错信息;所述依据所述多个词组,确定所述语音识别结果中第一待修改文本,包括:分别确定各词组在所述语音识别结果中的位置;针对一个词组,将所述词组的位置与所述第二待修改文本的位置进行匹配;若存在位置与所述词组的位置匹配的第二待修改文本,则将所述词组确定为第一待修改文本;所述确定所述第一待修改文本对应的第一纠错信息,包括:将与所述词组匹配的第二待修改文本的第二纠错信息,确定为第一纠错信息。
可选地,所述依据所述第一纠错信息对所述待修改文本进行修改,包括:在候选栏中展示所述第一纠错信息;接收上屏指令,将所述编辑框中的所述第一待修改文本替换为所述上屏指令对应的第一纠错信息。
可选地,所述在候选栏中展示所述第一纠错信息,包括:在候选栏中按照预设样式展示所述第一纠错信息;所述预设样式包括以下至少一种:下划线、加粗、高亮、灌色。
可选地,还包含用于进行以下操作的指令:为所述编辑框中所述第一待修改文本增加预设样式。
可选地,还包含用于进行以下操作的指令:对所述用户移动光标后所述光标所在位置的上下文信息进行联想,得到对应的联想信息;所述在候选栏中展示所述第一纠错信息,包括:结合所述联想信息在候选栏中对所述第一纠错信息进行展示。
可选地,所述的预设属性包括以下至少一种:人名属性、地点属性、事件名属性、专业术语属性和特定缩写属性。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明实施例是参照根据本发明实施例的方法、终端设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种输入方法、一种输入装置和一种电子设备,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种输入方法,其特征在于,包括:
获取用户输入的语音数据,识别对应的语音识别结果并上屏;
依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本;
确定所述第一待修改文本对应的第一纠错信息,依据所述第一纠错信息对所述第一待修改文本进行修改。
2.根据权利要求1所述的方法,其特征在于,所述依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本,包括:
依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图;
确定所述用户具有修改所述语音识别结果的意图时,将所述用户移动光标后所述光标所在位置的上下文信息切分为多个词组;
依据所述多个词组,确定所述语音识别结果中第一待修改文本。
3.根据权利要求2所述的方法,其特征在于,所述依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图,包括:
获取所述语音识别结果上屏后在所述编辑框中的首尾位置;
判断所述用户移动光标后所述光标的位置,是否处于所述首尾位置之间;
若是,则确定所述用户具有修改所述语音识别结果的意图;
若否,则确定所述用户不具有修改所述语音识别结果的意图。
4.根据权利要求2所述的方法,其特征在于,所述依据所述用户移动光标后所述光标的位置,判断所述用户是否具有修改所述语音识别结果的意图,包括:
获取所述用户移动光标后所述光标所在位置的上下文信息;
判断是否存在与所述上下文信息匹配的语音识别结果;
若存在,则确定所述用户具有修改所述语音识别结果的意图;
若不存在,则确定所述用户不具有修改所述语音识别结果的意图。
5.根据权利要求4所述的方法,其特征在于,所述获取所述用户移动光标后所述光标所在位置的上下文信息,包括:
获取所述用户移动光标后所述光标所在位置之前X1个文本,和所述光标所在位置之后X2个文本;
采用所述X1个文本和X2个文本组成所述光标所在位置的上下文信息;
其中,X1,X2均为整数。
6.根据权利要求5所述的方法,其特征在于,所述将所述用户移动光标后所述光标所在位置的上下文信息切分为多个词组,包括:
从所述用户移动光标后所述光标所在位置的上下文信息中,截取所述光标所在位置之前的N1个文本和所述光标所在位置之后的N2个文本;
依据所述光标的位置对所述(N1+N2)个文本进行切分,得到多个词组;
其中,N1,N2均为整数,X1大于或等于N1,X2大于或等于N2。
7.根据权利要求6所述的方法,其特征在于,所述依据所述光标的位置对所述(N1+N2)个文本进行切分,得到多个词组,包括:
将所述(N1+N2)个文本中所述光标所在位置之前的N1个文本,切分为一个词组;
将所述(N1+N2)个文本中所述光标所在位置之前的N2个文本,切分为一个词组;
将所述(N1+N2)个文本中所述光标所在位置之前的M1个文本和所述光标所在位置之后的M2个文本,切分为一个词组;
将所述(N1+N2)个文本中所述光标所在位置之前的M3个文本和所述光标所在位置之后的M4个文本,切分为一个词组;
其中,所述N1=M1+M2,N2=M3+M4,M1、M2、M3和M4均为正整数。
8.一种输入装置,其特征在于,包括:
识别模块,用于获取用户输入的语音数据,识别对应的语音识别结果并上屏;
第一信息确定模块,用于依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本;
修改模块,用于确定所述第一待修改文本对应的第一纠错信息,依据所述第一纠错信息对所述第一待修改文本进行修改。
9.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如方法权利要求1-7任一所述的输入方法。
10.一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户输入的语音数据,识别对应的语音识别结果并上屏;
依据所述用户移动光标后所述光标的位置,确定所述语音识别结果中第一待修改文本和对应的第一纠错信息;
依据所述第一纠错信息对所述第一待修改文本进行修改。
CN201910888060.4A 2019-09-19 2019-09-19 一种输入方法、装置和电子设备 Pending CN112612442A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910888060.4A CN112612442A (zh) 2019-09-19 2019-09-19 一种输入方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910888060.4A CN112612442A (zh) 2019-09-19 2019-09-19 一种输入方法、装置和电子设备

Publications (1)

Publication Number Publication Date
CN112612442A true CN112612442A (zh) 2021-04-06

Family

ID=75224258

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910888060.4A Pending CN112612442A (zh) 2019-09-19 2019-09-19 一种输入方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN112612442A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114023327A (zh) * 2022-01-05 2022-02-08 深圳市北科瑞声科技股份有限公司 基于语音识别的文本修正方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106933561A (zh) * 2015-12-31 2017-07-07 北京搜狗科技发展有限公司 语音输入方法和终端设备
CN107221328A (zh) * 2017-05-25 2017-09-29 百度在线网络技术(北京)有限公司 修改源的定位方法及装置、计算机设备及可读介质
CN107608957A (zh) * 2017-09-06 2018-01-19 百度在线网络技术(北京)有限公司 基于语音信息的文本修改方法、装置及其设备
CN109471538A (zh) * 2017-09-08 2019-03-15 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106933561A (zh) * 2015-12-31 2017-07-07 北京搜狗科技发展有限公司 语音输入方法和终端设备
CN107221328A (zh) * 2017-05-25 2017-09-29 百度在线网络技术(北京)有限公司 修改源的定位方法及装置、计算机设备及可读介质
CN107608957A (zh) * 2017-09-06 2018-01-19 百度在线网络技术(北京)有限公司 基于语音信息的文本修改方法、装置及其设备
CN109471538A (zh) * 2017-09-08 2019-03-15 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114023327A (zh) * 2022-01-05 2022-02-08 深圳市北科瑞声科技股份有限公司 基于语音识别的文本修正方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN106098060B (zh) 语音的纠错处理方法和装置、用于语音的纠错处理的装置
KR102628036B1 (ko) 음성 신호를 기초로 한 텍스트 편집 장치 및 텍스트 편집 방법
JP6033326B2 (ja) コンテンツベースの自動的な入力プロトコルの選択
CN107436691B (zh) 一种输入法进行纠错的方法、客户端、服务器及装置
CN107305438B (zh) 候选项的排序方法和装置、用于候选项排序的装置
CN107564526B (zh) 处理方法、装置和机器可读介质
CN108008832A (zh) 一种输入方法和装置、一种用于输入的装置
CN108803890B (zh) 一种输入方法、输入装置和用于输入的装置
CN109002183B (zh) 一种信息输入的方法及装置
CN110069143B (zh) 一种信息防误纠方法、装置和电子设备
CN107797676B (zh) 一种单字输入方法及装置
CN107688397B (zh) 一种输入方法、***和用于输入的装置
CN111414766B (zh) 一种翻译方法及装置
KR102327790B1 (ko) 정보 처리 방법, 장치 및 저장 매체
CN112149403A (zh) 一种确定涉密文本的方法和装置
CN112612442A (zh) 一种输入方法、装置和电子设备
CN110780749B (zh) 一种字符串纠错方法和装置
CN112837668B (zh) 一种语音处理方法、装置和用于处理语音的装置
CN114610163A (zh) 推荐方法、装置和介质
CN109471538B (zh) 一种输入方法、装置和用于输入的装置
CN113407099A (zh) 输入方法、装置和机器可读介质
JP2005018442A (ja) 表示処理装置、表示処理方法、表示処理プログラム、および記録媒体
CN112363631A (zh) 一种输入方法、装置及用于输入的装置
CN113589953B (zh) 一种信息展示方法、装置和电子设备
CN110858100B (zh) 联想候选词生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination