CN101727271A - 一种提供纠错提示的方法、装置及输入法*** - Google Patents

一种提供纠错提示的方法、装置及输入法*** Download PDF

Info

Publication number
CN101727271A
CN101727271A CN200810224815A CN200810224815A CN101727271A CN 101727271 A CN101727271 A CN 101727271A CN 200810224815 A CN200810224815 A CN 200810224815A CN 200810224815 A CN200810224815 A CN 200810224815A CN 101727271 A CN101727271 A CN 101727271A
Authority
CN
China
Prior art keywords
character string
user
needs
candidate
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200810224815A
Other languages
English (en)
Other versions
CN101727271B (zh
Inventor
张扬
王坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN2008102248152A priority Critical patent/CN101727271B/zh
Publication of CN101727271A publication Critical patent/CN101727271A/zh
Application granted granted Critical
Publication of CN101727271B publication Critical patent/CN101727271B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种提供纠错提示的方法,该方法包括:获取显示屏上光标位置的字符串;分析获取的字符串,判断所获取的字符串是否需要处理;将需要处理的字符串提示给用户。本发明还公开了一种提供纠错提示的装置及输入法***,通过本发明,不仅可以对用户正在使用输入法编辑的文字进行纠错提示,还可以将已经展现在显示屏上的需要处理的字符串提示给用户,并向用户提供补全或纠错候选,以此来帮助用户快速、准确地定位到需要处理的字符串并完成文本的输入及修改,使得输入过程更加流畅。由于输入法自带纠错提示功能,因此减少用户对Word等编辑环境的依赖,能够提升用户在不同场景下输入文字的质量。

Description

一种提供纠错提示的方法、装置及输入法***
技术领域
本发明涉及字符信息输入领域,特别是涉及一种提供纠错提示的方法、装置及输入法***。
背景技术
输入法用户在进行非母语字符的输入时常常会遇到一些困难,例如,非英文用户(如中文、日文、韩文等)在进行英文词条的输入时经常会出现输入错误等。这主要是因为英语的拼读、单词构成方式、语法等方面与用户通常使用的母语相比存在巨大差异,用户往往会有英文单词“记不全”、“拼错词”、“不会用”或“用错单词”的情况。因此,用户通常会希望在使用输入法开始输入英文单词的同时,输入法能够提供候选的单词,并能够在用户输入错误时能够自动纠错。这样用户一旦在输入法提供的候选词中发现需要的单词,便可以直接选中该单词完成输入,节省输入时间的同时,可以避免记不全、拼错词等造成的错误。
现有的输入法通过记录用户当前正在输入的字符,可以实现针对用户当前输入的动态补全及纠错提示。其中,动态补全是指,根据用户输入的字母给出候选词,并随着用户输入字母的增加,动态调整候选词。例如,用户输入字母“b”,则输入法提供的候选词为输入法词库中以“b”为首字母的单词;接下来,如果用户输入字母“a”,则输入法提供的候选词为前两个字母为“ba”的单词,以此类推;用户可以通过选中输入法提供的某个候选词完成输入;纠错提示是指,如果输入法词库中不存在与用户当前输入相匹配的单词,则会根据拼写及读音给出修改提示。例如,用户当前输入了“bagy”,输入法可以根据其拼写及读音等,向用户做出修改为“baggy”、“baby”等纠错提示。
但是该现有输入法只能记录用户当前输入的字符,因此其动态补全及纠错功能都是在输入法当前正在处理的字符基础上进行的,即只能针对用户当前正在输入栏输入的文字进行处理,而不能处理已经展现在显示屏上的文本。比如,如果用户打开的某文档中有存在错误的单词,或者用户完成一段文本的输入进行检查时,该现有输入法就无法向用户做出提示,用户必须根据自己的判断来修改。
发明内容
有鉴于此,本发明的目的在于提供一种提供纠错提示的方法、装置及输入法***,以解决现有输入法***无法对已经展现在显示屏上的需要处理的文本进行提示的问题。
为实现上述目的,本发明提供了如下方案:
一种提供纠错提示的方法,包括:
获取显示屏上光标位置的字符串;
分析获取的字符串,判断所获取的字符串是否需要处理;
将需要处理的字符串提示给用户。
优选的,还包括:
根据预置词库,为所述需要处理的字符串提供候选字符串供用户选择。
优选的,所述根据预置词库,为所述需要处理的字符串提供候选字符串供用户选择包括:
根据预置词库及光标位置的字符串前缀或后缀对所述需要处理的字符串进行补全,生成补全候选,并将所述补全候选提示给用户。
优选的,所述预置词库中的字符串按照预置顺序形成前缀树或后缀树结构,使用前缀树或后缀树结构生成所述补全候选。
优选的,所述根据预置词库,为所述需要处理的字符串提供候选字符串供用户选择包括:
根据预置词库对所述需要处理的字符串进行编辑操作,生成纠错候选,并将所述纠错候选提示给用户;所述编辑操作包括***、删除、替换或交换字符顺序。
优选的,所述预置词库中的字符串按照预置顺序形成前缀树结构,基于预置容错机制在前缀树中进行所述纠错候选的查找。
优选的,所述判断获取的字符串是否需要处理包括:
将获取的字符串与预置词库中的字符串进行比较,判断预置词库中是否存在与该获取的字符串完全匹配的字符串,如果不存在,则该获取的字符串需要处理。
优选的,所述判断获取的字符串是否需要处理包括:
获取显示屏上光标位置的字符串的上下文;
分析所述上下文,判断该获取的字符串是否存在用词错误,如果存在,则该字符串需要处理。
优选的,还包括:
获取用户对所述提示的响应,在用户处理完一需要处理的字符串后,自动定位到下一需要处理的字符串。
一种提供纠错提示的装置,包括:
取词单元,用于获取显示屏光标位置的字符串;
判断单元,用于分析获取的字符串,判断字符串是否需要处理;
提示单元,用于将需要处理的字符串提示给用户。
优选的,还包括:
候选提示单元,用于根据预置词库,为所述需要处理的字符串提供候选字符串供用户选择。
优选的,所述候选提示单元包括:
补全子单元,用于根据预置词库及光标位置的字符串前缀或后缀,对所述需要处理的字符串进行补全,并生成补全候选;
第一提示子单元,用于将所述补全候选提示给用户。
优选的,所述预置词库中的字符串按照预置顺序形成前缀树或后缀树结构,所述补全子单元使用前缀树或后缀树结构生成所述补全候选。
优选的,所述候选提示单元包括:
纠错子单元,用于根据预置词库对所述需要处理的字符串进行编辑操作,生成纠错候选;所述编辑操作包括***、删除、替换或交换字符顺序;
第二提示子单元,用于将所述纠错候选提示给用户。
优选的,所述预置词库中的字符串按照预置顺序形成前缀树结构,所述纠错子单元基于预置容错机制在前缀树中进行所述纠错候选的查找。
优选的,还包括:
用户响应获取单元,用于获取用户对所述提示的响应,在用户处理完一需要处理的字符串后,自动定位到下一需要处理的字符串。
优选的,所述判断单元包括:
比较子单元,用于将获取的字符串与预置词库中的字符串进行比较,判断预置词库中是否存在与该获取的字符串完全匹配的字符串;
第一确定子单元,用于将所述与预置词库中的字符串均不完全匹配的字符串确定为所述需要处理的字符串。
优选的,所述判断单元包括:
上下文获取子单元,用于获取显示屏上光标位置的字符串的上下文;
分析子单元,用于分析所述展现在显示屏上的字符串的上下文,判断是否存在用词错误的字符串;
第二确定子单元,用于将所述用词错误的字符串确定为所述需要处理的字符串。
一种提供纠错提示的输入法***,包括:
取词模块,用于获取显示屏上光标位置的字符串;
判断模块,用于分析获取的字符串,判断字符串是否需要处理;
提示模块,用于将需要处理的字符串提示给用户。
优选的,还包括:
候选提示模块,用于根据预置词库,为所述需要处理的字符串提供候选字符串供用户选择。
优选的,所述候选提示模块包括:
补全子模块,用于根据预置词库及光标位置的字符串前缀或后缀,对所述需要处理的字符串进行补全,并生成补全候选;
第一提示子模块,用于将所述补全候选提示给用户。
优选的,所述预置词库中的字符串按照预置顺序形成前缀树或后缀树结构,所述补全子模块使用前缀树或后缀树结构生成所述补全候选。
优选的,所述候选提示模块包括:
纠错子模块,用于根据预置词库对所述需要处理的字符串进行编辑操作,生成纠错候选;所述编辑操作包括***、删除、替换或交换字符顺序;
第二提示子模块,用于将所述纠错候选提示给用户。
优选的,所述预置词库中的字符串按照预置顺序形成前缀树结构,所述纠错子模块基于预置容错机制在前缀树中进行所述纠错候选的查找。
优选的,还包括:
用户响应获取模块,用于获取用户对所述提示的响应,在用户处理完一需要处理的字符串后,自动定位到下一需要处理的字符串。
优选的,还包括:
用户词库管理模块,用于当用户响应获取模块确定用户对所述需要处理的字符串进行处理时,判断用户词库中是否存在之前已判断出需要处理的字符串,如果存在,将用户词库中存在的需要处理的字符串替换为处理后的字符串;所述用户词库用于记录用户的输入历史,在用户进行字符串输入时,为用户提供字符串候选;
所述处理后的字符串由所述用户响应获取模块获取。
优选的,还包括:
记录模块,用于当用户响应获取模块确定用户对所述需要处理的字符串进行处理时,记录用户处理前及处理后的字符串的对应关系;
所述判断模块优先根据所述对应关系进行判断。
优选的,还包括:
新词发现模块,用于当所述用户响应获取模块确定用户忽略同一需要处理的字符串的次数超过预置阈值时,将该需要处理的字符串记录为用户新词;
所述判断模块将再次出现的所述用户新词确定为不需要处理。
优选的,所述判断模块包括:
比较子模块,用于将获取的字符串与预置词库中的字符串进行比较,判断预置词库中是否存在与该获取的字符串完全匹配的字符串;
第一确定子模块,用于将所述与预置词库中的字符串均不完全匹配的字符串确定为所述需要处理的字符串。
优选的,所述判断模块包括:
上下文获取子模块,用于获取显示屏上光标位置的字符串的上下文;
分析子模块,用于分析所述展现在显示屏上的字符串的上下文,判断是否存在用词错误的字符串;
第二确定子模块,用于将所述用词错误的字符串确定为所述需要处理的字符串。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
第一,本发明通过获取显示屏上光标位置的字符串,并对获取的字符串进行分析,发现其中需要处理的字符串,并将需要处理的字符串提示给用户,可见,本发明不仅可以提示用户正在输入的文字,还可以将已经展现在显示屏上的需要处理的字符串提示给用户,以此来帮助用户快速、准确地发现需要处理的字符串并完成文本的输入及修改,使得输入过程更加流畅。
第二,可以对需要处理的字符串进行补全或纠错,将生成的候选提示给用户,进一步加快了字符串的处理效率。由于还可以获取字符串的上下文,因此不仅能够获取到存在拼写错误的字符串,还可以获取到存在使用错误的字符串,然后可以对需要处理的字符串进行纠错或补全,以处理本身拼写正确但存在用词错误的情况。比如通过光标取词获取文字片段“please fill the frombefore you check out from the hotel”后,快速定位到其中的第一个from,并给出“form”的纠错提示。另外,补全单元可以根据获取的字符串中的正确部分的前缀或后缀做出补全候选。例如,在用户进行退格操作时,由于可以获取已展现在显示屏上的单词的前缀部分,因此可以根据该前缀部分在预置词库中匹配并进行动态补全,而不需要用户从头输入这部分单词前缀。
第三,可以使用前缀树或后缀树结构进行补全候选或纠错候选的查找匹配,查找效率高。
第四,具有用户词学习功能,能够实现对用户反馈的能动适应。处理前后的字符串对(错误形式,正确形式)经用户确认后记录下来(如放入缓存),在之后的应用中可进行优先查找和匹配,提升效率。如果多次提示同一个“错误”拼写或“使用错误”的字符串,用户都不予以修改,学习这个词条并记录下来,下次再出现这个词条时可不予提示。从而实现了针对用户的个性化纠错提示。
第五,通过输入法***来提供对已经展现在显示屏上的文本纠错提示功能,用户可以基于输入法完成对已展现在显示屏上的文本的纠错,从而缓解了对文本编辑环境(如Microsoft Word等文本编辑软件)的依赖。
附图说明
图1是本发明提供的方法的流程图;
图2是现有输入法对已经展现在显示屏上的字符串的补全示意图;
图3是本发明使用的前缀树结构词库的示意图;
图4是本发明提供的第一装置的示意图;
图5是本发明提供的第二装置的示意图;
图6是本发明提供的第三装置的示意图;
图7是本发明提供的第一输入法***的示意图;
图8是本发明提供的第二输入法***的示意图;
图9是本发明提供的第三输入法***的示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参见图1,本发明实施例提供的纠错提示的方法包括以下步骤:
S101:获取显示屏上光标位置的字符串;
在使用现有的输入法进行字符输入时,所述显示屏上光标位置的字符串已经不受输入法控制处理,即便某些字符串需要处理(如,存在拼写错误、使用错误等),现有的输入法也无法做出任何提示,因为现有的输入法只能记录用户当前输入的字符,并根据当前记录的字符进行提示。因此,在本发明实施例提供的方法中,首先要获取显示屏上光标位置的字符串,在此基础上来进行后续的分析判断步骤。
其中,所述获取显示屏上光标位置的字符串的具体实现可以有多种,例如,在Windows***下,当光标移动到某位置时,可以强制重绘窗口来获取文本信息,根据光标位置通过函数钩子来取得当前字符串;或者记录输入历史,在需要获取光标位置展现在显示屏上的字符串时,直接将当前输入的输入历史取回,等等。
关于字符串的边界,以英文输入为例,可以有以下两种情况:如果是纯英文输入,可以通过前后的空格或结束符来确定;如果是中英文混合输入等情况,则非英文字符、空格、结束符等都可以用于字符串边界的判定。
S102:分析获取的字符串,判断所获取的字符串是否需要处理;
所述需要处理通常可以包括存在拼写错误或用词错误等,对于存在拼写错误的字符串,可以通过以下方式判断:将获取的字符串与预置词库中的字符串进行比较,判断预置词库中是否存在与该获取的字符串相匹配的字符串,如果不存在,说明该字符串存在拼写错误,那么该获取的字符串需要处理。
其中,所述预置词库中保存了所有可能用到的字符串,例如,对于英文而言,该预置词库相当于英文词典,可以保存所有的英文单词。在本发明实施例中,所述预置词库不仅可以用于对显示屏上的字符串是否需要进行处理的判断过程,还可以用于为需要处理的字符串提供候选字符串的过程,后者会在后续的部分进行详细地介绍。
对于存在用词错误的字符串,需要在获取光标位置展现在显示屏上的字符串时,还获取该字符串的前后若干个字符串作为该字符串的上下文,则可以通过分析所述上下文,判断该获取的字符串是否存在用词错误,如果存在,则该字符串需要处理。例如,通过获取文字片段“please fill the from before youcheck out from the hotel”后,对该片段进行分析后,可以判断出其中的第一个from存在用词错误(虽然其不存在拼写错误),则该字符串需要处理。
S103:将需要处理的字符串提示给用户。
将需要处理的字符串提示给用户,可以帮助用户定位到需要处理的字符串,并进行必要的修改,而无需用户亲自去查找,节省了用户的时间。
在实际应用中,还可以对需要处理的字符串给出一些修改的候选项,这样如果候选项中存在用户认为正确的字符串,则用户可以直接选择来完成修改,进一步节省了用户的时间;另一方面,用户可能会由于忘记了正确的拼写方式或其他原因而不知如何修改,因此,从这一点来讲,提供修改的候选项能够为用户提供更大的便利。下面就对本发明实施例采用的提供修改候选项的方法进行详细地描述。
实施例一、可以通过对光标位置的字符串前缀或后缀进行补全,生成补全候选,并提示给用户。其中所述补全的过程可以是在用户正在修改需要处理的字符串时进行的。为了更好地体现出本发明的效果,现在与现有输入法进行对比并举例进行说明。
在用户使用现有的输入法(以英文输入法为例)时,当用户需要修改(包括字母的***、删除、替换等)单词时,现有输入法只会以用户新输入的字母为起点给出补全内容。比如用户在搜索引擎中输入单词“bagy”,点击搜索后发现该单词少了一个字母“g”,当用户开始从字母“y”起退格,或者直接将光标移到字母“g”之前或之后时,输入法不会做出任何提示,而当用户开始***字母“g”时,该输入法会认为用户是在进行以当前输入的字母“g”为首字母的新的输入,并开始进行以“g”为首字母的动态补全,同时将输入法词库中以“g”为首字母的单词提供给用户,参见图2。
而在使用本发明实施例提供的方法时,如果用户需要修改单词,则会以光标位置的单词前缀和/或后缀进行补全。仍以上述例子为例,使用本发明实施例提供的方法,当用户开始从字母“y”起退格,或者直接将光标移到字母“g”之前或之后时,本发明实施例会根据光标位置的单词前缀“bag”给出补全候选,因此,其中有非常大的可能性包括“baggy”这个候选,此时,用户便可以通过直接选择该候选来完成输入了。当前,生成的补全候选可能有很多个,因此可以预设容错查找范围,例如将编辑距离限定在某阈值之内等。其中,编辑距离是指将一个字符串转变为另一个字符串所需要的编辑开销。这里涉及的字符串可以是英语字母、汉字和/或标点符号等。编辑开销如全部定义为1,那么将zipo转变为zippo的编辑距离是1,将englsi转变为english的编辑距离是2,反过来也是如此。
实施例二、可以根据所述预置词库对所述需要处理的字符串进行编辑操作,生成纠错候选,并将所述纠错候选提示给用户,其中,所述编辑操作包括***、删除、替换或交换字符顺序等。例如,对于错误拼写“zipo”,可以做出“zipp”、“zip”、“zippy”等纠错候选。其中,所述交换字符顺序通常是指两个字母在输入顺序上发生错误的情况,例如经常将“what”输入成“waht”,这时就需要将字符a和字符h的顺序进行交换,将“what”作为纠错候选提示给用户。与生成补全候选时类似,由于这些编辑操作可能会生成非常多的候选,因此,可以预先规定生成纠错候选的限制条件,在一定容错查找范围内进行,例如在一定编辑距离内进行编辑操作等。
上述实施例一及实施例二给出了两种为用户提供修改候选项的方法,包括补全及纠错,可以在用户开始输入退格时,或直接根据光标位置,或当光标位置发生变化时进行补全或纠错的提示。在实际应用中,补全候选或纠错候选可以通过在预置的词库中进行查找获得。因此可以通过一定的策略来提高查找的效率。以生成纠错候选的过程为例,对于错误的拼写“zipo”,最普通的做法是将z ipo与所述预置词库中所有的条目比较一遍,这显然比较浪费时间。一个改进的办法可以是,在zipo的每个位置上进行26个字母的***、删除、替换和交换操作,查看生成的词条是否在所述预置词库中存在。例如,其中一条路径是假设zipo没有错误,则可以在第三个字母p之后***一个字母,生成zip<x>o等26个候选,再分别将这26个候选与预置词库中的词条进行比较,查找可能正确的词条,
在本发明的优选实施例中,采用了更加有效、更加节省计算量的方法,即首先将所述预置词库中的词条按照预置顺序排列,形成前缀树的结构,然后在前缀树结构下进行查找。以英文单词词库为例,则该词库中的单词可以按照字母顺序形成前缀树结构。参见图3所示的一个以字母z开头的前缀树结构,<S>表示开始,<E>表示单词结束,因仅为示意,所以只显示了z字母开头的zinc、zorro、zip、zippo等几个单词。仍以上述假设zipo没有错误为例,在前缀树结构的词库中可以发现以zip为前缀的单词只存在<E>和p两条路径,这样就不用再进行除p以外的25个字母的查找匹配过程了,从而大大减少了计算量。图3中红色箭头显示的是另外一个例子,即在zi-处进行***一个字母的***操作,针对zi-下的n、p进行跨字母匹配:首先在zin-后查看是否存在zinpo,结果查找失败;接下来在zip-后查看是否存在zippo,查找成功,这时就可以把zippo选取出来作为一个zipo的纠错候选。同样,删除、替换及交换操作也可以通过类似的办法,通过前缀树结构来实现快速高效地查找。当然,利用前缀树结构进行查找匹配也适用于生成补全候选的过程,而且,如果是针对当前字符串后缀的前向补全,则可以使用后缀树结构,也就是将词库中的词条逐字母倒过来存入后缀树中。生成补全候选时,可以将当前字符串后缀从后向前逐字母与词库中的词条进行比对。
当然,其他语种的词库也可以使用前缀树、后缀树结构,例如,对于汉语词库,可以形成两万多汉字的汉语“字母表”。因此本发明同样适用于汉字等其他文字的补全和纠错,比如汉语成语的补全等。
另外,本发明实施例中的补全不一定是针对用户当前的输入片段或用户正在修改的字符串,也可以是为单词提供其复合词形式,例如,可以为单词“English”提供“Englishman”、“Englishwomen”、“non-English”等。基于这种原因,补全操作的容错查找范围通常要比纠错操作的查找范围要大一些。例如,补全时,所述需要处理的字符串与生成的候选字符串之间的编辑距离要大于纠错操作中限定的阈值。
对于纠错候选,虽然不能直接利用前缀树生成,但是可以采用基于预置的容错策略在前缀树中进行纠错候选的查找,从而缩小了编辑操作的查找范围,节省了处理时间。
与本发明实施例提供的纠错提示的方法相对应,本发明实施例还提供了一种提供纠错提示的装置,参见图4,该装置包括:
取词单元U401,用于获取显示屏上光标位置的字符串;
判断单元U402,用于分析获取的字符串,判断字符串是否需要处理;
提示单元U403,用于将需要处理的字符串提示给用户。
取词单元U401可以获取显示屏上光标位置的字符串,然后判断单元U402便可以判断该获取的字符串是否需要进行处理,如果需要处理,则将需要处理的字符串提示给用户。这样用户便可以根据提示,快速知悉哪个字符串是需要处理的,然后开始对其进行必要的处理。因此,提高了处理字符串的效率。
其中,参见图5,判断单元U502可以包括以下子单元:
比较子单元U5021,用于将获取的字符串与预置词库中的字符串进行比较,判断是否存在与预置词库中的字符串均不匹配的字符串;
第一确定子单元U5022,用于将所述与预置词库中的字符串均不匹配的字符串确定为所述需要处理的字符串。
通过上述两个子单元,可以发现存在拼写错误的字符串,在本发明的优选实施例中,也可以发现存在用词错误的字符串,因此,该装置的判断单元U502也可以包括以下子单元:
上下文获取子单元U5023,用于获取显示屏上光标位置的字符串的上下文;
分析子单元U5024,用于分析所述展现在显示屏上的字符串的上下文,判断是否存在用词错误的字符串;
第二确定子单元U5025,用于将所述用词错误的字符串确定为所述需要处理的字符串。
判断单元U502可以同时包括比较子单元U5021到第二确定子单元U5025这五个子单元,这样判断单元U502既可以判断出拼写错误,又可以判断出用词错误。
其中,图5中的取词单元U501、提示单元U503与图4中的取词单元U401、提示单元U403相同。
在实际应用中,除了将需要处理的字符串提示给用户外,还可以在用户开始修改字符串时或尚未修改时,向用户做出修改候选提示,这样,如果修改提示中包含用户需要的正确的字符串,则用户便可以通过直接选择来完成输入,从而进一步提高了处理字符串的效率。因此,参见图6,该装置还可以包括:
候选提示单元U604,用于根据预置词库,为所述需要处理的字符串提供候选字符串供用户选择。
其中,候选提示单元U604可以提示的候选可以包括补全候选及纠错候选,提示补全候选时,候选提示单元U604可以包括以下子单元:
补全子单元U6041,用于在用户开始修改字符串时,根据预置的词库及光标位置的字符串前缀或后缀(字符串中正确的部分),对所述需要处理的字符串进行补全,并生成补全候选;
第一提示子单元U6042,用于将生成的补全候选提示给用户。
提示纠错候选时,候选提示单元U604可以包括以下子单元:
纠错子单元U6043,用于在判断出存在需要处理的字符串后,在用户开始修改前,便可以根据预置的词库,对所述需要处理的字符串进行编辑操作,生成纠错候选;所述编辑操作可以包括***、删除、替换或交换字符顺序等;
第二提示子单元U6044,用于将生成的纠错候选提示给用户,以供用户选择。
其中,候选提示单元U604可以同时包括用于提示补全候选的子单元和用于提示纠错候选的子单元,这样候选提示单元U604既可以向用户做出补全提示,又能够做出纠错提示。
由于补全候选及纠错候选的生成过程都要用到预置的词库,因此在本发明的优选实施例中,该预置的词库中的字符串采用按照预置顺序(如英文单词可以按照字母顺序)实现的前缀树结构,这样生成补全或纠错候选时,便可以使用该前缀树结构进行,从而能够实现快速、高效的查找。其中,补全子单元U6041可以直接使用前缀树或后缀树结构生成所述补全候选;纠错子单元U6043可以基于预置容错机制在前缀树中进行所述纠错候选的查找。
在本发明的优选实施例中,还可以包括用户响应获取单元U605,用于获取用户对所述提示的响应,在用户处理完一待处理的字符串后,可以自动定位到下一需要处理的字符串。
其中,图6中的取词单元U601、判断单元U602、提示单元U603与图4中的取词单元U401、判断单元U402、提示单元U403相同。
本发明旨在提供一种能够对已经展现在显示屏上的字符串进行纠错提示的技术方案,而如果将该方案实现在输入法***中,则将解决现有输入法***无法对已经展现在显示屏上的字符串进行纠错的问题。因此,本发明实施例还提供了一种提供纠错提示的输入法***,参见图7,该***包括:
取词模块U701,用于获取显示屏上光标位置的字符串;
判断模块U702,用于分析获取的字符串,判断字符串是否需要处理;
提示模块U703,用于将需要处理的字符串提示给用户。
本发明实施例提供的输入法***可以具有输入模式及纠错模式,在输入模式下,与通常的输入法***基本相似;在用户输入完一段文字后,可以切换到纠错模式,则该输入法***将会通过以上各模块进行查找及提示。
其中,在本发明的优选实施例中,除了将需要处理的字符串提示给用户外,还可以在用户开始修改字符串时或尚未修改时,向用户做出修改候选提示,这样,如果修改提示中包含用户需要的正确的字符串,则用户便可以通过直接选择来完成输入,从而进一步提高了处理字符串的效率。因此,参见图8,该输入法***还可以包括:
候选提示模块U804,用于根据预置词库,为所述需要处理的字符串提供候选字符串供用户选择。
其中,候选提示模块U804可以提示的候选可以包括补全候选及纠错候选,提示补全候选时,候选提示模块U804可以包括以下子模块:
补全子模块U8041,用于在用户开始修改字符串时,根据预置的词库及光标位置的字符串前缀或后缀,对所述需要处理的字符串进行补全,并生成补全候选;
第一提示子模块U8042将生成的补全候选提示给用户。而在用户选定补全选项后,输入法会自动将待补全前缀的后续部分补全,形成一个完整的单词,节省用户的编辑时间。这里的方式可以是:提供单词的完整形式;或者,只提供缺失的若干前缀或后缀。如对“English”提供的候选项只有“non-”、“-man”、“-woman”等。很显然前者对用户而言更加友好些。这两种情况下当用户选中某选项时只补全缺失的部分。
提示纠错候选时,候选提示模块U804可以包括以下子模块
纠错子模块U8043,用于在判断出存在需要处理的字符串后,在用户开始修改前,便可以根据预置的词库,对所述需要处理的字符串进行编辑操作,生成纠错候选;所述编辑操作可以包括***、删除、替换或交换字符顺序等;
第二提示子模块U8044也可以将生成的纠错候选提示给用户,以供用户选择。
由于补全候选及纠错候选的生成过程都要用到预置词库,因此为提高查找效率,在本发明的优选实施例中,该预置词库中的字符串采用按照预置顺序实现的前缀树结构,这样生成补全或纠错候选时,便可以使用该前缀树结构进行,从而能够实现快速、高效的查找。其中,补全子模块U8041可以直接使用前缀树或后缀树结构生成所述补全候选;纠错子模块U8042可以基于预置容错机制在前缀树中进行所述纠错候选的查找。
在本发明的优选实施例中,还可以包括用户响应获取模块U805,用于获取用户对所述提示的响应,在用户处理完一待处理的字符串后,可以自动定位到下一需要处理的字符串。
本发明的优选实施例中,可以实现针对特定用户的个性化纠错。由于输入法***中通常会存在用户词库,用于记录用户的历史输入,在用户使用输入法进行字符串的输入时,可以根据该用户词库中记录的词条,为用户提供字符串候选。也就是说,只要是用户输入并确定后的字符串都会记录在该用户词库中,即使输入的某些字符串存在拼写错误等,但只要被用户确认,就会记录在用户词库中。显然,根据用户词库为用户提供字符串候选时,会有较大的几率将存在错误的字符串提示给用户,以致伤害到用户的体验。因此,该输入法***还可以包括用户词库管理模块U806,用于当用户在用户响应模块U805中响应了补全模块或纠错模块给出的提示,或者采用手动修改等其他方式对需要处理的字符串进行了修改时,如果发现该用户的用户词库中存在这个处理前的字符串,则可以将该处理前的字符串从用户词库中删除,并替换为用户处理后的字符串,同时更新用户词库中的记录信息。这样,避免了因为用户的错误输入对用户词库带来的噪音
需要说明的是,本发明所述的预置词库与此处的用户词库不同,所述预置词库是用于在纠错模式下,判断字符串是否需要处理以及提供补全或纠错候选的;而用户词库是用于在输入模式下,为用户提供输入字符串候选的。
另外,该输入法***还可以包括记录模块U807,对于从用户响应模块U805获得的处理前字符串及处理后字符串,该记录模块U807可以将其对应关系记录下来(如,放入缓存中),判断模块U802可以优先根据所述对应关系进行判断,为查找和匹配工作节省时间。
再者,有些字符串可能是用户自造的,或者是一些缩略语等,而预置词库中可能不包含该字符串,因此判断模块U802会判断出该字符串需要处理,并由提示模块U803提示给用户。但是此时用户并不需要修改,盲目的提示会影响到用户的体验。因此在本发明的优选实施例中,还可以包括新词发现模块U808,通过用户响应获取模块U805来判断用户对同一需要处理的字符串不予理睬的次数是否超过了某预置的阈值,如果是,则可以学习这个字符串作为用户新词,下次再出现该字符串时,判断模块将U802所述用户新词确定为不需要处理,提示模块U803将不予提示,以此来实现用户词学习功能,更能满足用户的个性化需求。
其中,图8中的取词模块U801与图7中的取词模块U701相同。
另外,由于该提供纠错提示的功能是由输入法***实现的,而输入法***在任何的编辑环境下都可以使用,因此在任何输入环境下都能够对已经展现在显示屏上的文字进行纠错提示。虽然一些文字编辑软件(如Microsoft Word等)也具有对已经展现在显示屏上的文字进行纠错提示的功能,但是并不是所有的文字都是在这类文字编辑软件输入的,例如,用户正在使用某聊天工具聊天,则用户在输入完一段文字之后,如果想要检查这段文字是否存在拼写或用词错误,则只能将这段文字拷贝到Word等编辑环境中检查,修改完毕后再拷贝回原来的聊天工具编辑框中。可见,纠错的功能主要依赖于Word等编辑环境。而如果实现了本发明实施例提供的输入法***,则可以直接基于输入法对已经展现在显示屏上的文字进行纠错,从而大大减少了用户对Word等编辑环境的依赖。这样能够提升用户在不同场景(聊天、BBS发帖等非正式文字编辑场合)下输入文字的质量。
与提供纠错提示的装置类似,参见图9,该提供纠错提示的输入法***的判断模块U902也可以包括以下子模块:
比较子模块U9021,用于将获取的字符串与预置词库中的字符串进行比较,判断判断预置词库中是否存在与该获取的字符串完全匹配的字符串;
第一确定子模块U9022,用于将所述与预置词库中的字符串均不完全匹配的字符串确定为所述需要处理的字符串。
通过上述两个子模块,可以发现存在拼写错误的字符串,在本发明的优选实施例中,也可以发现存在用词错误的字符串,因此,该输入法***的判断模块U902也可以包括以下子模块:
上下文获取子模块U9023,用于获取显示屏上光标位置的字符串的上下文;
分析子模块U9024,用于分析所述展现在显示屏上的字符串的上下文,判断是否存在用词错误的字符串;
第二确定子模块U9025,用于将所述用词错误的字符串确定为所述需要处理的字符串。
判断模块U902可以同时包括用于发现拼写错误的子模块及用于发现用词错误的子模块,这样判断模块U902既可以判断出拼写错误,又可以判断出用词错误。
其中图9中的取词模块U901、提示模块U903与图7中的取词模块U701、提示模块U703相同。
为了更好地理解本发明实施例提供的技术方案,下面通过使用输入法***进行纠错提示的具体实例进行详细的介绍。
小明最近找了一个澳大利亚的网友,偶尔跟他聊聊天,希望借此提升一下自己的英语水平。虽然聊天不算正式,他还是希望能尽可能少犯错误,避免沟通中不必要的误解。因为对方聊天打字的速度较快,小明由于不习惯英文输入等原因无法在输入过程中发现拼写错误或用词错误。
这时使用本方案可以很好的解决这个问题。在输入的过程中,可以使用该输入法对英文词条的补全功能,在输入完一句话复查时,小明使用预置的纠错快捷键可以很快的发现句子中的拼写错误或用词错误,例如,其中一个拼错的单词是“Englsih”。输入法帮助小明定位到这个错误后。小明使用退格依次删除了h、i、s三个字母。由于这是针对之前输入法取得的已经展现在显示屏上的文字的修改,同时输入法根据预加载词库的前缀匹配情况判定“Engl”是合法前缀,于是给出“English”、“England”等若干候选,而不是从头开始接收用户的输入并以此作为前缀进行匹配。
根据与原始输入“Englsih”的匹配程度,“English”排在候选项第一位。小明自己也意识到“English”才是正确的输入,并直接选择以完成修改。接下来他调用输入法中寻找错误的快捷键,迅速定位到下一个错误位置进行修改。输入法发现之前的用户词库存在“Englsih”这样被用户确认的错误拼写,于是将该词条删除,代之以“English”并将其使用频率加1。接下来输入法又定位到输入中的下一个错误。通过本方案,小明能够很畅快地输入,完成与国外网友聊天的输入内容。
本发明所述输入法***是指计算机用户使用键盘、手写板等输入工具向计算机输入文字、符号的编辑工具。输入法使用一定编码规则,将用户输入序列(拼音序列、五笔、手写板输入等)转化为机器可处理的文字编码。输入法是用户尤其非罗马字符文字用户进行计算机信息处理的入口程序。这里涉及的输入法***是与平台无关的,不具体到PC、无线或其他终端设备上的任一特定操作***或平台。
本发明中的提供纠错提示的方法主要以英文的输入为例进行介绍,但是该方法同样适用于中文、日文、法语等其他语言文字。对于中文、日文等需要进行字符转换的文字而言,区别在于字符的表示方法与英文不同,可以另外引入分词的步骤以切分字词边界。而对于法语、德语、西班牙语等罗马字符文字,则可以直接应用本发明提供的方法。
以上对本发明所提供的一种提供纠错提示的方法、装置及输入法***,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (30)

1.一种提供纠错提示的方法,其特征在于,包括:
获取显示屏上光标位置的字符串;
分析获取的字符串,判断所获取的字符串是否需要处理;
将需要处理的字符串提示给用户。
2.根据权利要求1所述的方法,其特征在于,还包括:
根据预置词库,为所述需要处理的字符串提供候选字符串供用户选择。
3.根据权利要求2所述的方法,其特征在于,所述根据预置词库,为所述需要处理的字符串提供候选字符串供用户选择包括:
根据预置词库及光标位置的字符串前缀或后缀对所述需要处理的字符串进行补全,生成补全候选,并将所述补全候选提示给用户。
4.根据权利要求3所述的方法,其特征在于,所述预置词库中的字符串按照预置顺序形成前缀树或后缀树结构,使用前缀树或后缀树结构生成所述补全候选。
5.根据权利要求2所述的方法,其特征在于,所述根据预置词库,为所述需要处理的字符串提供候选字符串供用户选择包括:
根据预置词库对所述需要处理的字符串进行编辑操作,生成纠错候选,并将所述纠错候选提示给用户;所述编辑操作包括***、删除、替换或交换字符顺序。
6.根据权利要求5所述的方法,其特征在于,所述预置词库中的字符串按照预置顺序形成前缀树结构,基于预置容错机制在前缀树中进行所述纠错候选的查找。
7.根据权利要求1所述的方法,其特征在于,所述判断获取的字符串是否需要处理包括:
将获取的字符串与预置词库中的字符串进行比较,判断预置词库中是否存在与该获取的字符串完全匹配的字符串,如果不存在,则该获取的字符串需要处理。
8.根据权利要求1所述的方法,其特征在于,所述判断获取的字符串是否需要处理包括:
获取显示屏上光标位置的字符串的上下文;
分析所述上下文,判断该获取的字符串是否存在用词错误,如果存在,则该字符串需要处理。
9.根据权利要求1所述的方法,其特征在于,还包括:
获取用户对所述提示的响应,在用户处理完一需要处理的字符串后,自动定位到下一需要处理的字符串。
10.一种提供纠错提示的装置,其特征在于,包括:
取词单元,用于获取显示屏光标位置的字符串;
判断单元,用于分析获取的字符串,判断字符串是否需要处理;
提示单元,用于将需要处理的字符串提示给用户。
11.根据权利要求10所述的装置,其特征在于,还包括:
候选提示单元,用于根据预置词库,为所述需要处理的字符串提供候选字符串供用户选择。
12.根据权利要求11所述的装置,其特征在于,所述候选提示单元包括:
补全子单元,用于根据预置词库及光标位置的字符串前缀或后缀,对所述需要处理的字符串进行补全,并生成补全候选;
第一提示子单元,用于将所述补全候选提示给用户。
13.根据权利要求12所述的装置,其特征在于,所述预置词库中的字符串按照预置顺序形成前缀树或后缀树结构,所述补全子单元使用前缀树或后缀树结构生成所述补全候选。
14.根据权利要求11所述的装置,其特征在于,所述候选提示单元包括:
纠错子单元,用于根据预置词库对所述需要处理的字符串进行编辑操作,生成纠错候选;所述编辑操作包括***、删除、替换或交换字符顺序;
第二提示子单元,用于将所述纠错候选提示给用户。
15.根据权利要求14所述的装置,其特征在于,所述预置词库中的字符串按照预置顺序形成前缀树结构,所述纠错子单元基于预置容错机制在前缀树中进行所述纠错候选的查找。
16.根据权利要求10所述的装置,其特征在于,还包括:
用户响应获取单元,用于获取用户对所述提示的响应,在用户处理完一需要处理的字符串后,自动定位到下一需要处理的字符串。
17.根据权利要求10所述的装置,其特征在于,所述判断单元包括:
比较子单元,用于将获取的字符串与预置词库中的字符串进行比较,判断预置词库中是否存在与该获取的字符串完全匹配的字符串;
第一确定子单元,用于将所述与预置词库中的字符串均不完全匹配的字符串确定为所述需要处理的字符串。
18.根据权利要求10所述的装置,其特征在于,所述判断单元包括:
上下文获取子单元,用于获取显示屏上光标位置的字符串的上下文;
分析子单元,用于分析所述展现在显示屏上的字符串的上下文,判断是否存在用词错误的字符串;
第二确定子单元,用于将所述用词错误的字符串确定为所述需要处理的字符串。
19.一种提供纠错提示的输入法***,其特征在于,包括:
取词模块,用于获取显示屏上光标位置的字符串;
判断模块,用于分析获取的字符串,判断字符串是否需要处理;
提示模块,用于将需要处理的字符串提示给用户。
20.根据权利要求19所述的输入法***,其特征在于,还包括:
候选提示模块,用于根据预置词库,为所述需要处理的字符串提供候选字符串供用户选择。
21.根据权利要求20所述的输入法***,其特征在于,所述候选提示模块包括:
补全子模块,用于根据预置词库及光标位置的字符串前缀或后缀,对所述需要处理的字符串进行补全,并生成补全候选;
第一提示子模块,用于将所述补全候选提示给用户。
22.根据权利要求21所述的输入法***,其特征在于,所述预置词库中的字符串按照预置顺序形成前缀树或后缀树结构,所述补全子模块使用前缀树或后缀树结构生成所述补全候选。
23.根据权利要求20所述的输入法***,其特征在于,所述候选提示模块包括:
纠错子模块,用于根据预置词库对所述需要处理的字符串进行编辑操作,生成纠错候选;所述编辑操作包括***、删除、替换或交换字符顺序;
第二提示子模块,用于将所述纠错候选提示给用户。
24.根据权利要求23所述的输入法***,其特征在于,所述预置词库中的字符串按照预置顺序形成前缀树结构,所述纠错子模块基于预置容错机制在前缀树中进行所述纠错候选的查找。
25.根据权利要求19所述的输入法***,其特征在于,还包括:
用户响应获取模块,用于获取用户对所述提示的响应,在用户处理完一需要处理的字符串后,自动定位到下一需要处理的字符串。
26.根据权利要求25所述的输入法***,其特征在于,还包括:
用户词库管理模块,用于当用户响应获取模块确定用户对所述需要处理的字符串进行处理时,判断用户词库中是否存在之前已判断出需要处理的字符串,如果存在,将用户词库中存在的需要处理的字符串替换为处理后的字符串;所述用户词库用于记录用户的输入历史,在用户进行字符串输入时,为用户提供字符串候选;
所述处理后的字符串由所述用户响应获取模块获取。
27.根据权利要求25所述的输入法***,其特征在于,还包括:
记录模块,用于当用户响应获取模块确定用户对所述需要处理的字符串进行处理时,记录用户处理前及处理后的字符串的对应关系;
所述判断模块优先根据所述对应关系进行判断。
28.根据权利要求25所述的输入法***,其特征在于,还包括:
新词发现模块,用于当所述用户响应获取模块确定用户忽略同一需要处理的字符串的次数超过预置阈值时,将该需要处理的字符串记录为用户新词;
所述判断模块将再次出现的所述用户新词确定为不需要处理。
29.根据权利要求19所述的输入法***,其特征在于,所述判断模块包括:
比较子模块,用于将获取的字符串与预置词库中的字符串进行比较,判断预置词库中是否存在与该获取的字符串完全匹配的字符串;
第一确定子模块,用于将所述与预置词库中的字符串均不完全匹配的字符串确定为所述需要处理的字符串。
30.根据权利要求19所述的输入法***,其特征在于,所述判断模块包括:
上下文获取子模块,用于获取显示屏上光标位置的字符串的上下文;
分析子模块,用于分析所述展现在显示屏上的字符串的上下文,判断是否存在用词错误的字符串;
第二确定子模块,用于将所述用词错误的字符串确定为所述需要处理的字符串。
CN2008102248152A 2008-10-22 2008-10-22 一种提供纠错提示的方法、装置及输入法*** Active CN101727271B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008102248152A CN101727271B (zh) 2008-10-22 2008-10-22 一种提供纠错提示的方法、装置及输入法***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008102248152A CN101727271B (zh) 2008-10-22 2008-10-22 一种提供纠错提示的方法、装置及输入法***

Publications (2)

Publication Number Publication Date
CN101727271A true CN101727271A (zh) 2010-06-09
CN101727271B CN101727271B (zh) 2012-11-14

Family

ID=42448222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008102248152A Active CN101727271B (zh) 2008-10-22 2008-10-22 一种提供纠错提示的方法、装置及输入法***

Country Status (1)

Country Link
CN (1) CN101727271B (zh)

Cited By (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102135814A (zh) * 2011-03-30 2011-07-27 北京搜狗科技发展有限公司 一种字词输入方法及***
CN102456001A (zh) * 2010-10-27 2012-05-16 北京四维图新科技股份有限公司 错别字的检查方法和装置
CN102722490A (zh) * 2011-03-30 2012-10-10 汉王科技股份有限公司 一种电子阅读器的取词方法、取词装置及电子阅读器
CN102750088A (zh) * 2012-06-04 2012-10-24 华为终端有限公司 一种提示字符输入的方法和电子设备
CN102866826A (zh) * 2012-07-09 2013-01-09 李晶 一种字符输入方法及其装置
CN102937864A (zh) * 2012-10-31 2013-02-20 百度在线网络技术(北京)有限公司 一种用于在触摸终端上确定所选文本的方法与设备
CN103049458A (zh) * 2011-10-17 2013-04-17 北京搜狗科技发展有限公司 一种修正用户词库的方法和***
CN103064967A (zh) * 2012-12-31 2013-04-24 百度在线网络技术(北京)有限公司 一种用于建立用户二元关系库的方法与设备
CN103076962A (zh) * 2012-12-27 2013-05-01 华为技术有限公司 一种搜索提示生成方法和装置
CN103164165A (zh) * 2013-03-07 2013-06-19 东莞宇龙通信科技有限公司 一种实现字符提示的方法及装置
CN103345308A (zh) * 2013-06-08 2013-10-09 百度在线网络技术(北京)有限公司 用于输入修改的方法与装置
CN103530840A (zh) * 2013-10-10 2014-01-22 中国中医科学院 一种准确快速的电子病历录入***
CN103678554A (zh) * 2013-12-06 2014-03-26 金蝶软件(中国)有限公司 字符替换的方法和装置
CN103838739A (zh) * 2012-11-21 2014-06-04 百度在线网络技术(北京)有限公司 一种搜索引擎中纠错词的检测方法及***
CN103870003A (zh) * 2012-12-13 2014-06-18 联想(北京)有限公司 一种信息处理方法及电子设备
CN104199607A (zh) * 2014-08-11 2014-12-10 北京搜狗科技发展有限公司 一种基于输入法的候选选择方法和装置
CN104252484A (zh) * 2013-06-28 2014-12-31 重庆新媒农信科技有限公司 一种拼音纠错方法及***
CN104317961A (zh) * 2014-11-14 2015-01-28 武汉日电光通信工业有限公司 一种专业***输入智能提示***
CN104375767A (zh) * 2013-08-16 2015-02-25 联想(北京)有限公司 一种数据处理方法及电子设备
WO2016041428A1 (zh) * 2014-09-17 2016-03-24 北京搜狗科技发展有限公司 一种英文的输入方法和装置
CN105653061A (zh) * 2015-12-29 2016-06-08 北京京东尚科信息技术有限公司 针对拼音输入法的词条检索及错词检测的方法和***
CN105760359A (zh) * 2014-11-21 2016-07-13 财团法人工业技术研究院 问句处理***及其方法
CN105824795A (zh) * 2016-04-19 2016-08-03 智者四海(北京)技术有限公司 文本中的错误信息的显示方法及装置
CN105893005A (zh) * 2015-01-26 2016-08-24 惠州市德赛西威汽车电子股份有限公司 一种显示屏中按钮提示框的实现方法
CN105930836A (zh) * 2016-04-19 2016-09-07 北京奇艺世纪科技有限公司 一种视频文字的识别方法和装置
CN105981005A (zh) * 2013-12-13 2016-09-28 纽昂斯通信有限公司 使用统计语言模型改进文本输入
CN106484131A (zh) * 2015-09-02 2017-03-08 北京搜狗科技发展有限公司 一种输入纠错方法和输入法装置
CN107203510A (zh) * 2017-05-23 2017-09-26 深圳天珑无线科技有限公司 文字检测方法及装置
CN107622053A (zh) * 2017-09-26 2018-01-23 上海展扬通信技术有限公司 一种基于智能终端的文本纠错方法及文本纠错***
CN107656627A (zh) * 2017-09-28 2018-02-02 百度在线网络技术(北京)有限公司 信息输入方法和装置
CN108268659A (zh) * 2018-02-05 2018-07-10 深圳市比量科技传媒有限公司 一种相同新闻信息的归类方法及***
CN108469913A (zh) * 2018-02-28 2018-08-31 北京小米移动软件有限公司 修改输入信息的方法、装置和存储介质
CN109164922A (zh) * 2018-07-27 2019-01-08 五八有限公司 字符串输入方法、装置、计算机设备及可读存储介质
CN109271037A (zh) * 2017-07-13 2019-01-25 北京搜狗科技发展有限公司 一种纠错词库的建立方法和装置
CN109426359A (zh) * 2017-09-05 2019-03-05 北京搜狗科技发展有限公司 一种输入方法、装置以及机器可读介质
CN109471538A (zh) * 2017-09-08 2019-03-15 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
WO2019051700A1 (zh) * 2017-09-14 2019-03-21 深圳传音通讯有限公司 字符文件纠错方法与装置
CN109710087A (zh) * 2018-12-28 2019-05-03 北京金山安全软件有限公司 输入法模型生成方法及装置
CN109948122A (zh) * 2017-12-21 2019-06-28 北京金山安全软件有限公司 输入文本的纠错方法、装置及电子设备
CN110134936A (zh) * 2018-02-08 2019-08-16 北京搜狗科技发展有限公司 一种分词方法、装置及电子设备
CN110334222A (zh) * 2019-07-12 2019-10-15 安徽华明航空电子***有限公司 一种输入字段填充方法、装置、电子设备及存储介质
CN110597800A (zh) * 2018-05-23 2019-12-20 杭州海康威视数字技术股份有限公司 一种注释信息确定、前缀树构建方法及装置
US10599779B2 (en) 2012-03-16 2020-03-24 Huawei Device Co., Ltd. Input method, input apparatus, and terminal
CN110969012A (zh) * 2019-11-29 2020-04-07 北京字节跳动网络技术有限公司 文本纠错方法、装置、存储介质及电子设备
CN111665956A (zh) * 2020-04-17 2020-09-15 北京百度网讯科技有限公司 候选字符串的处理方法、装置、电子设备及存储介质
CN111859920A (zh) * 2020-06-19 2020-10-30 北京国音红杉树教育科技有限公司 单词拼写错误的识别方法、***及电子设备
CN111859089A (zh) * 2019-04-30 2020-10-30 北京智慧星光信息技术有限公司 一种用于互联网信息的错词检测控制方法
CN111913573A (zh) * 2020-07-10 2020-11-10 山东大学 用于英语单词辅助学习的人机交互方法及***
CN112597771A (zh) * 2020-12-29 2021-04-02 重庆邮电大学 基于前缀树合并的中文文本纠错方法
CN112905026A (zh) * 2021-03-30 2021-06-04 完美世界控股集团有限公司 展示单词建议的方法、装置、存储介质及计算机设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1407468A (zh) * 2001-08-16 2003-04-02 陈涛 掌上阅读器的在线电子辞典
CN100405371C (zh) * 2006-07-25 2008-07-23 北京搜狗科技发展有限公司 一种提取新词的方法和***
CN100424703C (zh) * 2006-08-23 2008-10-08 北京搜狗科技发展有限公司 获取新编码字符串的方法及输入法***、词库生成装置
CN100595760C (zh) * 2007-08-31 2010-03-24 北京搜狗科技发展有限公司 一种获取口语词条的方法、装置以及一种输入法***
CN101206673A (zh) * 2007-12-25 2008-06-25 北京科文书业信息技术有限公司 网络搜索过程中关键词的智能纠错***及方法
CN101241514B (zh) * 2008-03-21 2014-11-05 北京搜狗科技发展有限公司 一种生成纠错数据库的方法、自动纠错的方法和***

Cited By (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102456001A (zh) * 2010-10-27 2012-05-16 北京四维图新科技股份有限公司 错别字的检查方法和装置
CN102456001B (zh) * 2010-10-27 2014-11-26 北京四维图新科技股份有限公司 错别字的检查方法和装置
CN102722490A (zh) * 2011-03-30 2012-10-10 汉王科技股份有限公司 一种电子阅读器的取词方法、取词装置及电子阅读器
CN102135814A (zh) * 2011-03-30 2011-07-27 北京搜狗科技发展有限公司 一种字词输入方法及***
CN102722490B (zh) * 2011-03-30 2015-06-17 汉王科技股份有限公司 一种电子阅读器的取词方法、取词装置及电子阅读器
CN103049458A (zh) * 2011-10-17 2013-04-17 北京搜狗科技发展有限公司 一种修正用户词库的方法和***
US10599779B2 (en) 2012-03-16 2020-03-24 Huawei Device Co., Ltd. Input method, input apparatus, and terminal
US11256877B2 (en) 2012-03-16 2022-02-22 Huawei Device Co., Ltd. Input method, input apparatus, and terminal
CN106774982A (zh) * 2012-06-04 2017-05-31 华为终端有限公司 一种提示字符输入的方法和电子设备
CN102750088A (zh) * 2012-06-04 2012-10-24 华为终端有限公司 一种提示字符输入的方法和电子设备
WO2013181935A1 (zh) * 2012-06-04 2013-12-12 华为终端有限公司 一种提示字符输入的方法和电子设备
CN102866826B (zh) * 2012-07-09 2016-01-20 张作玮 一种字符输入方法及其装置
CN102866826A (zh) * 2012-07-09 2013-01-09 李晶 一种字符输入方法及其装置
CN102937864B (zh) * 2012-10-31 2015-11-25 百度在线网络技术(北京)有限公司 一种用于在触摸终端上确定所选文本的方法与设备
CN102937864A (zh) * 2012-10-31 2013-02-20 百度在线网络技术(北京)有限公司 一种用于在触摸终端上确定所选文本的方法与设备
CN103838739B (zh) * 2012-11-21 2019-05-28 百度在线网络技术(北京)有限公司 一种搜索引擎中纠错词的检测方法及***
CN103838739A (zh) * 2012-11-21 2014-06-04 百度在线网络技术(北京)有限公司 一种搜索引擎中纠错词的检测方法及***
CN103870003A (zh) * 2012-12-13 2014-06-18 联想(北京)有限公司 一种信息处理方法及电子设备
CN103076962B (zh) * 2012-12-27 2016-11-23 华为技术有限公司 一种搜索提示生成方法和装置
CN103076962A (zh) * 2012-12-27 2013-05-01 华为技术有限公司 一种搜索提示生成方法和装置
CN103064967A (zh) * 2012-12-31 2013-04-24 百度在线网络技术(北京)有限公司 一种用于建立用户二元关系库的方法与设备
CN103164165A (zh) * 2013-03-07 2013-06-19 东莞宇龙通信科技有限公司 一种实现字符提示的方法及装置
CN103345308A (zh) * 2013-06-08 2013-10-09 百度在线网络技术(北京)有限公司 用于输入修改的方法与装置
CN104252484A (zh) * 2013-06-28 2014-12-31 重庆新媒农信科技有限公司 一种拼音纠错方法及***
CN104252484B (zh) * 2013-06-28 2018-10-19 重庆新媒农信科技有限公司 一种拼音纠错方法及***
CN104375767A (zh) * 2013-08-16 2015-02-25 联想(北京)有限公司 一种数据处理方法及电子设备
CN103530840A (zh) * 2013-10-10 2014-01-22 中国中医科学院 一种准确快速的电子病历录入***
CN103678554A (zh) * 2013-12-06 2014-03-26 金蝶软件(中国)有限公司 字符替换的方法和装置
CN105981005A (zh) * 2013-12-13 2016-09-28 纽昂斯通信有限公司 使用统计语言模型改进文本输入
CN104199607A (zh) * 2014-08-11 2014-12-10 北京搜狗科技发展有限公司 一种基于输入法的候选选择方法和装置
US10152473B2 (en) 2014-09-17 2018-12-11 Beijing Sogou Technology Development Co., Ltd. English input method and input device
WO2016041428A1 (zh) * 2014-09-17 2016-03-24 北京搜狗科技发展有限公司 一种英文的输入方法和装置
CN104317961A (zh) * 2014-11-14 2015-01-28 武汉日电光通信工业有限公司 一种专业***输入智能提示***
CN104317961B (zh) * 2014-11-14 2018-04-27 武汉众邦领创技术有限公司 一种专业***输入智能提示***
CN105760359A (zh) * 2014-11-21 2016-07-13 财团法人工业技术研究院 问句处理***及其方法
CN105893005B (zh) * 2015-01-26 2019-04-30 惠州市德赛西威汽车电子股份有限公司 一种显示屏中按钮提示框的实现方法
CN105893005A (zh) * 2015-01-26 2016-08-24 惠州市德赛西威汽车电子股份有限公司 一种显示屏中按钮提示框的实现方法
CN106484131A (zh) * 2015-09-02 2017-03-08 北京搜狗科技发展有限公司 一种输入纠错方法和输入法装置
CN105653061A (zh) * 2015-12-29 2016-06-08 北京京东尚科信息技术有限公司 针对拼音输入法的词条检索及错词检测的方法和***
CN105930836A (zh) * 2016-04-19 2016-09-07 北京奇艺世纪科技有限公司 一种视频文字的识别方法和装置
CN105824795A (zh) * 2016-04-19 2016-08-03 智者四海(北京)技术有限公司 文本中的错误信息的显示方法及装置
CN107203510A (zh) * 2017-05-23 2017-09-26 深圳天珑无线科技有限公司 文字检测方法及装置
CN109271037B (zh) * 2017-07-13 2022-09-09 北京搜狗科技发展有限公司 一种纠错词库的建立方法和装置
CN109271037A (zh) * 2017-07-13 2019-01-25 北京搜狗科技发展有限公司 一种纠错词库的建立方法和装置
CN109426359B (zh) * 2017-09-05 2022-10-21 北京搜狗科技发展有限公司 一种输入方法、装置以及机器可读介质
CN109426359A (zh) * 2017-09-05 2019-03-05 北京搜狗科技发展有限公司 一种输入方法、装置以及机器可读介质
CN109471538A (zh) * 2017-09-08 2019-03-15 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
CN109471538B (zh) * 2017-09-08 2022-07-05 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
WO2019051700A1 (zh) * 2017-09-14 2019-03-21 深圳传音通讯有限公司 字符文件纠错方法与装置
CN107622053A (zh) * 2017-09-26 2018-01-23 上海展扬通信技术有限公司 一种基于智能终端的文本纠错方法及文本纠错***
CN107656627A (zh) * 2017-09-28 2018-02-02 百度在线网络技术(北京)有限公司 信息输入方法和装置
CN107656627B (zh) * 2017-09-28 2021-07-23 百度在线网络技术(北京)有限公司 信息输入方法和装置
CN109948122B (zh) * 2017-12-21 2023-06-20 北京金山安全软件有限公司 输入文本的纠错方法、装置及电子设备
CN109948122A (zh) * 2017-12-21 2019-06-28 北京金山安全软件有限公司 输入文本的纠错方法、装置及电子设备
CN108268659A (zh) * 2018-02-05 2018-07-10 深圳市比量科技传媒有限公司 一种相同新闻信息的归类方法及***
CN108268659B (zh) * 2018-02-05 2021-01-26 深圳市比量科技传媒有限公司 一种相同新闻信息的归类方法及***
CN110134936A (zh) * 2018-02-08 2019-08-16 北京搜狗科技发展有限公司 一种分词方法、装置及电子设备
CN108469913A (zh) * 2018-02-28 2018-08-31 北京小米移动软件有限公司 修改输入信息的方法、装置和存储介质
CN110597800A (zh) * 2018-05-23 2019-12-20 杭州海康威视数字技术股份有限公司 一种注释信息确定、前缀树构建方法及装置
CN109164922B (zh) * 2018-07-27 2023-01-13 五八有限公司 字符串输入方法、装置、计算机设备及可读存储介质
CN109164922A (zh) * 2018-07-27 2019-01-08 五八有限公司 字符串输入方法、装置、计算机设备及可读存储介质
CN109710087A (zh) * 2018-12-28 2019-05-03 北京金山安全软件有限公司 输入法模型生成方法及装置
CN109710087B (zh) * 2018-12-28 2023-01-13 北京金山安全软件有限公司 输入法模型生成方法及装置
CN111859089B (zh) * 2019-04-30 2024-02-06 北京智慧星光信息技术有限公司 一种用于互联网信息的错词检测控制方法
CN111859089A (zh) * 2019-04-30 2020-10-30 北京智慧星光信息技术有限公司 一种用于互联网信息的错词检测控制方法
CN110334222B (zh) * 2019-07-12 2021-11-23 安徽华明航空电子***有限公司 一种输入字段填充方法、装置、电子设备及存储介质
CN110334222A (zh) * 2019-07-12 2019-10-15 安徽华明航空电子***有限公司 一种输入字段填充方法、装置、电子设备及存储介质
CN110969012A (zh) * 2019-11-29 2020-04-07 北京字节跳动网络技术有限公司 文本纠错方法、装置、存储介质及电子设备
CN110969012B (zh) * 2019-11-29 2023-04-07 北京字节跳动网络技术有限公司 文本纠错方法、装置、存储介质及电子设备
CN111665956A (zh) * 2020-04-17 2020-09-15 北京百度网讯科技有限公司 候选字符串的处理方法、装置、电子设备及存储介质
CN111859920A (zh) * 2020-06-19 2020-10-30 北京国音红杉树教育科技有限公司 单词拼写错误的识别方法、***及电子设备
CN111859920B (zh) * 2020-06-19 2024-06-04 北京国音红杉树教育科技有限公司 单词拼写错误的识别方法、***及电子设备
CN111913573B (zh) * 2020-07-10 2022-03-22 山东大学 用于英语单词辅助学习的人机交互方法及***
CN111913573A (zh) * 2020-07-10 2020-11-10 山东大学 用于英语单词辅助学习的人机交互方法及***
CN112597771A (zh) * 2020-12-29 2021-04-02 重庆邮电大学 基于前缀树合并的中文文本纠错方法
CN112905026A (zh) * 2021-03-30 2021-06-04 完美世界控股集团有限公司 展示单词建议的方法、装置、存储介质及计算机设备
CN112905026B (zh) * 2021-03-30 2024-04-16 完美世界控股集团有限公司 展示单词建议的方法、装置、存储介质及计算机设备

Also Published As

Publication number Publication date
CN101727271B (zh) 2012-11-14

Similar Documents

Publication Publication Date Title
CN101727271B (zh) 一种提供纠错提示的方法、装置及输入法***
US20210132792A1 (en) System and method for inputting text into electronic devices
US10073829B2 (en) System and method for inputting text into electronic devices
US7149970B1 (en) Method and system for filtering and selecting from a candidate list generated by a stochastic input method
US20190087403A1 (en) Online spelling correction/phrase completion system
US5761689A (en) Autocorrecting text typed into a word processing document
JP5400200B2 (ja) ショートハンド・オン・キーボード・インタフェースにおいてテキスト入力を改善するためのシステム、コンピュータ・プログラムおよび方法(キ
CN100593167C (zh) 语言输入用户界面
EP0686286B1 (en) Text input transliteration system
EP1091303B1 (en) Method and system for providing alternatives for text derived from stochastic input sources
JP5535417B2 (ja) スペルミス、タイプミス、および変換誤りに耐性のある、あるテキスト形式から別のテキスト形式に変換する言語入力アーキテクチャ
US6356866B1 (en) Method for converting a phonetic character string into the text of an Asian language
JP4833476B2 (ja) モードレス入力で一方のテキスト形式を他方のテキスト形式に変換する言語入力アーキテクチャ
CN1871638B (zh) 采用用户接口的智能语音识别
US4914704A (en) Text editor for speech input
WO2010105428A1 (en) Input method editor
US20140067731A1 (en) Multi-dimensional information entry prediction
US8219905B2 (en) Automatically detecting keyboard layout in order to improve the quality of spelling suggestions
CN103294655A (zh) 一种快速修改输入错误的方法、装置及输入法***
KR102430918B1 (ko) 한국어 맞춤법 교정장치 및 방법
KR101276203B1 (ko) 매개 인터페이스 장치를 이용한 한/영 타이프라이터 시스템 및 문자열 입력 방법
JP3814000B2 (ja) 文字列変換装置および文字列変換方法
JPH07105217A (ja) 入力文字自動補正装置
JP2007172662A (ja) 日本語入力装置および方法
JP2008090247A (ja) 和訳ローマ字略語を付加したゲルマン語群言語の辞書。

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant