CN107870677B - 一种输入方法、装置和用于输入的装置 - Google Patents

一种输入方法、装置和用于输入的装置 Download PDF

Info

Publication number
CN107870677B
CN107870677B CN201610849668.2A CN201610849668A CN107870677B CN 107870677 B CN107870677 B CN 107870677B CN 201610849668 A CN201610849668 A CN 201610849668A CN 107870677 B CN107870677 B CN 107870677B
Authority
CN
China
Prior art keywords
word
error correction
string
input
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610849668.2A
Other languages
English (en)
Other versions
CN107870677A (zh
Inventor
陈小帅
马尔胡甫·曼苏尔
张扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201610849668.2A priority Critical patent/CN107870677B/zh
Publication of CN107870677A publication Critical patent/CN107870677A/zh
Application granted granted Critical
Publication of CN107870677B publication Critical patent/CN107870677B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明实施例提供了一种输入方法、装置和用于输入的装置。其中的方法包括:对输入串进行纠错,得到所述输入串对应的纠错串;在所述纠错串满足预设组词条件时,对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果;将所述第一组词结果作为候选项进行展现。可以提高组词结果的正确率,进而可以解决现有技术中,用户在看到错误的组词结果时才意识到自己输入了错误的拼音串,需要删除错误的输入串并且重新进行输入,导致输入效率较低的问题,以提高输入效率。

Description

一种输入方法、装置和用于输入的装置
技术领域
本发明涉及通信技术领域,尤其涉及一种输入方法、装置和用于输入的装置。
背景技术
对于中文、日文、韩文等用户而言,一般都需要通过输入法程序与计算机进行交互。例如,用户可以通过键盘键入输入串,然后由输入法程序依据其预置的标准映射规则将该输入串转换为相应语言的候选项并展示,进而将用户选择的候选项上屏。
在用户使用输入法程序输入中文时,输入法程序对用户输入的输入串进行解析,如用户输入的输入串为拼音串,则可以通过查询词库获得该拼音串对应的词条,然后将查询得到的词条作为候选项展示给用户。如果词库中不存在与用户输入的拼音串相对应的词条时,会触发输入法的智能组词功能。例如,用户输入的拼音串为“chifanlema”,在词库中存在与拼音串“chifan”对应的词条“吃饭”,以及与拼音串“lema”对应的词条“了吗”,但是不存在与拼音串“chifanlema”对应的完整词条“吃饭了吗”,因此,可以触发输入法程序的智能组词功能,输入法程序依据语言模型对多种组词结果进行对比排序。例如,输入法程序对组词结果“吃”+“反了吗”、“吃饭”+“了吗”等进行对比排序,最终将语言模型较优的组词结果“吃饭”+“了吗”排在候选项的首位。
然而在实际应用中,如果用户输入的拼音串中存在错误,往往会得到错误的组词结果。例如,用户欲输入拼音串“chifanlema”,结果误输入为“chianlema”,则输入法程序会按照错误的输入串进行智能组词,最终得到“吃安了吗”、“赤岸了吗”等候选项。用户在看到错误的候选项时可能才意识到自己输入了错误的拼音串,此时需要退格删除错误的拼音串并且重新进行输入,修改过程不仅较为繁琐,为用户带来不便,而且还导致输入效率较低。
发明内容
本发明实施例提供一种输入方法、装置和用于输入的装置,以解决现有技术中智能组词出现错误时导致输入效率较低的问题。
为了解决上述问题,本发明公开了一种输入方法,包括:
对输入串进行纠错,得到所述输入串对应的纠错串;
在所述纠错串满足预设组词条件时,对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果;
将所述第一组词结果作为候选项进行展现。
可选地,确定所述纠错串满足预设组词条件的步骤,包括:
对所述纠错串按照音节进行切分;
在切分得到的音节数目超出预设组词阈值时,确定所述纠错串满足预设组词条件。
可选地,确定所述纠错串满足预设组词条件的步骤,包括:
依据所述纠错串查询***词库;
在所述***词库中存在与所述纠错串相匹配的***词,且所述***词的词频小于预设词频阈值时,确定所述纠错串满足预设组词条件。
可选地,确定所述纠错串满足预设组词条件的步骤,包括:
依据所述纠错串查询***词库;
在所述***词库中存在与所述纠错串相匹配的***词,且所述纠错串存在多条组词路径时,确定所述纠错串满足预设组词条件。
可选地,所述对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果的步骤,包括:
对所述纠错串按照音节进行切分,得到所述纠错串对应的多条组词路径;
通过查询***词库与用户词库,对每条组词路径进行组词;
依据预置二元库,确定所述组词路经对应的路径得分;
获取路径得分满足预设阈值的组词路径对应的第一组词结果。
可选地,所述对输入串进行纠错,得到所述输入串对应的纠错串的步骤,包括:
依据位置纠错、力度纠错和临近键位纠错中的至少一种纠错算法,确定所述输入串中的错误字符;
对所述错误字符进行纠错处理,得到所述输入串对应的纠错串。
可选地,所述方法还包括:
依据所述纠错串的前缀查询预置词库,得到与所述纠错串的前缀相匹配的第一匹配词条;
将所述第一匹配词条作为候选项进行展现。
可选地,所述方法还包括:
在所述输入串满足预设组词条件时,对所述输入串进行智能组词,得到所述输入串对应的第二组词结果;
依据所述输入串的前缀查询预置词库,得到与所述输入串的前缀相匹配的第二匹配词条;
依据所述输入串对应的上下文、当前输入环境、***词频和组词语言模型中的至少一种,对所述第一组词结果、第二组词结果、第一匹配词条和第二匹配词条进行排序;
将排序后的第一组词结果、第二组词结果、第一匹配词条和第二匹配词条作为候选项进行展现。
另一方面,本发明公开了一种输入装置,包括:
纠错模块,用于对输入串进行纠错,得到所述输入串对应的纠错串;
第一组词模块,用于在所述纠错串满足预设组词条件时,对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果;
展现模块,用于将所述第一组词结果作为候选项进行展现。
可选地,所述第一组词模块,包括:
划分子模块,用于对所述纠错串按照音节进行切分;
确定子模块,用于在切分得到的音节数目超出预设组词阈值时,确定所述纠错串满足预设组词条件。
可选地,所述第一组词模块,包括:
查询子模块,用于依据所述纠错串查询***词库;
确定子模块,用于在所述***词库中存在与所述纠错串相匹配的***词,且所述***词的词频小于预设词频阈值时,确定所述纠错串满足预设组词条件。
可选地,所述第一组词模块,包括:
查询子模块,用于依据所述纠错串查询***词库;
确定子模块,用于在所述***词库中存在与所述纠错串相匹配的***词,且所述纠错串存在多条组词路径时,确定所述纠错串满足预设组词条件。
可选地,所述第一组词模块,包括:
切分子模块,用于对所述纠错串按照音节进行切分,得到所述纠错串对应的多条组词路径;
组词子模块,用于通过查询***词库与用户词库,对每条组词路径进行组词;
计算得分子模块,用于依据预置二元库,确定所述组词路经对应的路径得分;
获取子模块,用于获取路径得分满足预设阈值的组词路径对应的第一组词结果。
可选地,所述纠错模块,包括:
错误确定子模块,用于依据位置纠错、力度纠错和临近键位纠错中的至少一种纠错算法,确定所述输入串中的错误字符;
纠错子模块,用于对所述错误字符进行纠错处理,得到所述输入串对应的纠错串。
可选地,所述装置还包括:
第一匹配模块,用于依据所述纠错串的前缀查询预置词库,得到与所述纠错串的前缀相匹配的第一匹配词条;
展现模块,还用于将所述第一匹配词条作为候选项进行展现。
可选地,所述装置还包括:
第二组词模块,用于在所述输入串满足预设组词条件时,对所述输入串进行智能组词,得到所述输入串对应的第二组词结果;
第二匹配模块,用于依据所述输入串的前缀查询预置词库,得到与所述输入串的前缀相匹配的第二匹配词条;
排序模块,用于依据所述输入串对应的上下文、当前输入环境、***词频和组词语言模型中的至少一种,对所述第一组词结果、第二组词结果、第一匹配词条和第二匹配词条进行排序;
展现模块,还用于将排序后的第一组词结果、第二组词结果、第一匹配词条和第二匹配词条作为候选项进行展现。
再一方面,本发明公开了一种用于输入的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
对输入串进行纠错,得到所述输入串对应的纠错串;
在所述纠错串满足预设组词条件时,对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果;
将所述第一组词结果作为候选项进行展现。
本发明实施例包括以下优点:
本发明实施例在对输入串进行智能组词之前,先对输入串进行纠错,得到所述输入串对应的纠错串;在所述纠错串满足预设组词条件时,对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果;并且将所述第一组词结果作为候选项进行展现。由于本发明实施例是对纠错后的输入串进行智能组词,向用户直接输出纠错后的正确的组词结果,从而可以提高组词结果的正确率,进而可以解决现有技术中,用户在看到错误的组词结果时才意识到自己输入了错误的拼音串,需要删除错误的输入串并且重新进行输入,导致输入效率较低的问题,以提高输入效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的一种输入方法实施例一的步骤流程图;
图2是本发明的一种输入方法实施例二的步骤流程图;
图3是本发明的一种输入方法实施例三的步骤流程图;
图4是本发明的一种输入装置实施例的结构框图;
图5是本发明的一种用于输入的装置800的框图;及
图6是本发明的一种服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
方法实施例一
参照图1,示出了本发明的一种输入方法实施例一的步骤流程图,具体可以包括:
步骤101、对输入串进行纠错,得到所述输入串对应的纠错串;
本发明实施例在对用户的输入串进行智能组词之前,先对输入串进行纠错处理,然后再对纠错串进行智能组词,由此,可以提高组词结果的正确率,向用户直接输出纠错后的正确组词结果,从而解决用户在看到错误的组词结果时才意识到自己输入了错误的拼音串,需要退格删除错误的输入串并且重新进行输入,导致输入效率较低的问题。
本发明实施例适用于中文、英文、日文等各种语言的输入,为方便起见,以下均以中文为例进行描述。在输入中文时,通常需要键入字母、数字、符号等字符,输入法程序将所获取的用户输入字符转换为中文。本发明实施例针对用户在输入过程中可能出现的错误进行纠错,所涉及的纠错场景可以包括但不限于如下类型:用户在使用键盘进行输入时,由于输入速度较高或者盲打时,误点在了目标按键的邻近按键上;或者,在使用手机等智能终端的触摸虚拟键盘进行输入时,由于虚拟键盘的按键尺寸相对较小,出现误点在邻近按键的情况;或者,由于行走、车辆颠簸、或者碰撞等原因导致智能终端或者操作移动终端的手指或触控笔出现抖动现象,从而导致出现邻近按键的误点击情况。因此,本发明实施例可适用于实体键盘、虚拟键盘等不同的输入装置。
在本发明的一种可选实施例中,所述对输入串进行纠错,得到所述输入串对应的纠错串的步骤,具体可以包括:
步骤S11、依据位置纠错、力度纠错和临近键位纠错中的至少一种纠错算法,确定所述输入串中的错误字符;
步骤S12、对所述错误字符进行纠错处理,得到所述输入串对应的纠错串。
在实际应用中,所述输入串的纠错算法可以有多种,具体可以包括位置纠错、力度纠错和临近键位纠错中的至少一种。
其中,位置纠错算法指通过确定用户点击按键的位置偏离按键中心的方向和距离,对输入的字符进行纠错。例如,用户点击在按键“c”的左上角位置,则用户有可能原本打算输入字符“d”,而误点击在按键“c”上。
力度纠错算法指通过确定用户点击按键的力度,对输入的字符进行纠错。例如,通过统计用户的点击行为,得到用户正常点击按键时的力度范围,如果用户的某次点击不在该力度范围内,可以认为是用户的误点击操作。比如,用户在手机屏幕解锁的情况下,不小心触碰到某按键,此时的点击力度小于用户正常点击按键时的力度范围,则可以删除用户误点击按键输入的错误字符。
临近键位纠错算法指通过将用户输入字符替换为该字符临近的各按键字符,对对输入的字符进行纠错。例如,用户原本想要输入的输入串为“woai”,可以由于键盘中按键“o”和按键“i”为临近键位,用户误将“o”输入为“i”,则实际输入的输入串为“wiai”,本发明实施例可以通过对输入串“wiai”进行临近键位纠错,确定该输入串中的错误字符为“i”,并且对该错误字符进行纠错处理,替换为正确字符“o”,得到纠错串“woai”。
其中,对错误字符进行纠错处理,具体可以包括替换、删除、增加等操作。例如,由于键盘狭小等原因,用户误点击到错误字符上,则可以使用正确字符替换错误字符进行纠错处理;再如,由于用户点击速度过快等原因,可能会出现多点击或者漏点击某个字符的情况,则可以删除多点击的字符,或者增加漏点击的字符进行纠错处理。
当然,在实际应用中,可以利用任意的纠错算法对输入串进行纠错处理,以得到所述输入串对应的纠错串。例如,除了上述列举的纠错算法外,还可以采用基于编辑距离的纠错算法和基于统计的纠错算法等。
其中,基于编辑距离的纠错算法具体可以包括:对输入串的每个位置进行如下四种纠错尝试:***一个字符、删除一个字符、替换一个字符和替换前后两个字符位置,以产生该输入串对应的纠错串序列。
基于统计的纠错算法可以通过大数据挖掘生成纠错模型,该纠错模型可用于学习纠错串被错输为输入串的概率(以下简称纠错模型概率),则可以向该纠错模型输入输入串,并由该纠错模型输出各纠错串被错输为输入串的概率。例如,输入串为“wiai”,纠错串为“woai”,则上述纠错模型概率可用于表示“woai”被错输成“wiai”的概率,在实际应用中,可以对用户的输入行为进行统计分析,以得到上述纠错模型概率。可以理解,本发明实施例对于具体的纠错算法不加以限制。
步骤102、在所述纠错串满足预设组词条件时,对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果;
在对输入串进行纠错得到纠错串后,可以进一步判断所述纠错串是否满足预设组词条件,若满足,则可以对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果,由此,可以直接得到纠错后正确的组词结果,从而可以提高智能组词的正确率。
本发明实施例具体可以提供如下确定纠错串是否满足预设组词条件的方案。
方案一
方案一通过纠错串包含的音节数判断所述纠错串是否满足预设组词条件,具体可以包括如下步骤:
步骤S21、对所述纠错串按照音节进行切分;
步骤S22、在切分得到的音节数目超出预设组词阈值时,确定所述纠错串满足预设组词条件。
在具体应用中,如果纠错串中仅包含一个音节时,则不需要对该纠错串进行组词;如果纠错串中包含两个音节时,如“women”中包含音节“wo”和“men”,很容易命中***词库。因此,在对纠错串切分得到的音节数目小于等于m(如m=2)时可以不用进行组词。因此,可以设置预设组词阈值为2,在切分得到的音节数目超出2时,可以认为纠错串满足预设组词条件。
在本发明实施例中,还可以根据当前的输入环境适当调整所述预设组词阈值。例如,可以在不同的输入环境下,统计用户输入的输入串中包含的平均音节数目,并且设置预设组词阈值为:平均音节数目/2。例如在游戏应用的输入环境下,统计得到某用户输入的输入串中包含的平均音节数目为a,则可以设置在游戏应用的输入环境下的预设组词阈值为:a/2。而在文档应用的输入环境下,统计得到该用户输入的输入串中包含的平均音节数目为b,则可以设置在文档应用的输入环境下的预设组词阈值为:b/2。由此,在不同的输入环境下,在对纠错串切分得到的音节数目大于“平均音节数目/2”时,可以确定所述纠错串满足预设组词条件。
可以理解,本发明实施例可以根据实际情况调整所述预设组词阈值,本发明实施例对于设置所述预设组词阈值的具体方式不加以限制。例如,还可以设置所述预设组词阈值为:平均音节数目/4。当对纠错串切分得到的音节数目满足如下条件:[1/4,1]×平均音节个数时,可以确定所述纠错串满足预设组词条件,此时可以触发对纠错串进行智能组词,得到第一组词结果,并且将所述第一组词结果作为候选项进行展现。此时,输入法程序可以统计在此种情况下用户选择第一组词结果进行上屏的概率,如果概率小于一定的阈值时,可以适当增大所述预设组词阈值,反之可以适当减小所述预设组词阈值。
在具体应用中,可以通过计数器统计得到用户选择第一组词结果进行上屏的概率。例如,可以设置两个计数器,其中一个用于记录在候选项中存在纠错后的第一组词结果时,用户选择“第一组词结果”的次数,如c1,另一个用于记录在候选项中存在纠错后的第一组词结果时,用户没有选择“第一组词结果”的次数,如c2,那么上述概率为c1/(c1+c2)。
或者,还可以通过用户上屏操作的日志记录来统计得到用户选择第一组词结果进行上屏的概率。例如,在候选项中存在纠错后的第一组词结果时,如果用户选择“第一组词结果”,则记录一条jc_zu的上屏操作日志记录,如果用户没有选择“第一组词结果”,则记录一条jc_zu_null的上屏操作日志记录。
这样,可以通过统计最近时间段T内的用户上屏操作的日志记录,可以得到用户选择第一组词结果进行上屏的概率。
方案二
方案二通过与纠错串相匹配的***词的词频,判断所述纠错串是否满足预设组词条件,具体可以包括如下步骤:
步骤S31、依据所述纠错串查询***词库;
步骤S32、在所述***词库中存在与所述纠错串相匹配的***词,且所述***词的词频小于预设词频阈值时,确定所述纠错串满足预设组词条件。
在本发明实施例中,在所述纠错串完整命中***词库中***词,且***词的词频较高时,可以不进行组词;也即在所述***词库中存在与所述纠错串相匹配的***词,且所述相匹配的***词的词频小于预设词频阈值时,说明该***词频较差,此时可以认为所述纠错串满足预设组词条件,可以对所述纠错串进行智能组词。
方案三
方案三通过与纠错串的组词路径,判断所述纠错串是否满足预设组词条件,具体可以包括如下步骤:
步骤S41、依据所述纠错串查询***词库;
步骤S42、在所述***词库中存在与所述纠错串相匹配的***词,且所述纠错串存在多条组词路径时,确定所述纠错串满足预设组词条件。
在本发明实施例中,在所述纠错串完整命中***词,但是所述纠错串存在多条组词路径时,可以确定所述纠错串满足预设组词条件。例如,所述纠错串为“xianzai”,该纠错串可以包括组词路径“xian’zai”和组词路径“xi’an’zai”,则可以确定所述纠错串满足预设组词条件。在具体应用中,可以对多条组词路径进行智能组词,然后再对各条组词路径对应的词组结果进行排序。
方案四
在具体应用中,如果***词库中不存在与用户输入的拼音串相对应的词条时,即会触发输入法的智能组词功能。因此,方案四通过纠错串是否完整命中***词库来判断所述纠错串是否满足预设组词条件,具体可以包括如下步骤:
步骤S51、依据所述纠错串查询***词库;
步骤S52、在所述***词库中不存在与所述纠错串相匹配的***词时,确定所述纠错串满足预设组词条件。
例如,用户输入的输入串为“chianlema”,通过对该输入串进行纠错得到对应的纠错串为“chifanlema”,在***词库中存在与拼音串“chifan”对应的词条“吃饭”,以及与拼音串“lema”对应的词条“了吗”,但是不存在与纠错串“chifanlema”对应的完整词条“吃饭了吗”,因此,可以确定所述纠错串满足预设组词条件,触发输入法程序的智能组词功能。
可以理解,在实际应用中,在判断所述纠错串是否满足预设组词条件时,可以采用上述四种方案中的任意一种或者几种的组合,本发明实施例对于判断所述纠错串是否满足预设组词条件的具体方式不加以限制。
在确定所述纠错串满足预设组词条件时,可以对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果。可选地,所述对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果的步骤,具体可以包括:
步骤S61、对所述纠错串按照音节进行切分,得到所述纠错串对应的多条组词路径;
步骤S62、通过查询***词库与用户词库,对每条组词路径进行组词;
步骤S63、依据预置二元库,确定所述组词路经对应的路径得分;
步骤S64、获取路径得分满足预设阈值的组词路径对应的第一组词结果。
在本发明的一种应用示例中,假设得到的纠错串为:“nanjingshichangjiangdaqiao”。首先对该纠错串按照音节进行切分,得到如下切分结果:“Nan/jing/shi/chang/jiang/da/qiao”,以及得到所述纠错串对应的多条组词路径,在具体应用中,如果纠错串可以切分为N个音节,则该纠错串就有2^N种不同的组词路径,例如可以得到如下组词路径:
组词路径1:nan’/jing’shi’/chang’jiang’/da’qiao/
组词路径2:nan’jing’/shi’chang’/jiang’da’qiao/
组词路径3:nan’jing’shi’/chang’jiang’/da’qiao/
然后,通过查询***词库与用户词库,对每条组词路径进行组词,且为了减少计算复杂度,可以采用beam search算法,即每个组词路径只保留一元概率topK(如k=3)个词条。例如对于上述组词路径1,音节“nan”对应topk个一元概率的词条包括“南”、“男”、“难”;音节“Jingshi”对应topk个一元概率的词条包括“竟是”、“警示”、“净是”;
接下来,依据预置二元库,确定所述组词路经对应的路径得分;路径得分可通过二元概率乘积计算得到。例如,对于上述组词路径1,通过查询预置二元库可以获得音节“nan”与音节“jingshi”的二元概率得分,并且得到其中最高的二元概率得分,例如音节“nan”与音节“jingshi”对应的topK个组词路径的二元概率得分为:“男警示”的二元概率得分为p1,“男竟是”的二元概率得分为p2,“难竟是”的二元概率得分为p3;那么下一个音节“changjiang”与上文“警示”的top_k个组词路径包括“长江”,“唱将”,“昌江”,且分别对应的二元概率得分为t1、t2、t3;“changjiang”与上文“竟是”的top_k个组词路径包括“长江”,“常江”,“唱将”,且分别对应的二元概率得分为t4、t5、t6;则音节“nan”与音节“jingshi”的最高的二元概率得分为:max(p1*t1,p1*t2,p1*t3,P2*t4,p2*t5,p2*t6,P3*t4,p3*t5,p3*t6);若该得分小于预设阈值G,则可以停止对该组词路径的组词过程。按照上述过程,依次对组词路径2、组词路径3等各组词路径进行组词。最终可以得到如下第一组词结果:“难警示长江大桥”、“南京市场江大桥”、“南京市长江大桥”等。
步骤103、将所述第一组词结果作为候选项进行展现。
在对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果之后,可以将所述第一组词结果作为候选项进行展现,以供用户进行选择。
综上,本发明实施例在对输入串进行智能组词之前,先对输入串进行纠错,得到所述输入串对应的纠错串;在所述纠错串满足预设组词条件时,对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果;并且将所述第一组词结果作为候选项进行展现。由于本发明实施例是对纠错后的输入串进行智能组词,向用户直接输出纠错后的正确的组词结果,从而可以提高组词结果的正确率,进而可以解决现有技术中,用户在看到错误的组词结果时才意识到自己输入了错误的拼音串,需要删除错误的输入串并且重新进行输入,导致输入效率较低的问题,以提高输入效率。
方法实施例二
本实施例在上述实施例一的基础上,还可以获取并展现与纠错串的前缀相匹配的匹配词条。参照图2,示出了本发明的一种输入方法实施例二的步骤流程图,具体可以包括:
步骤201、对输入串进行纠错,得到所述输入串对应的纠错串;
步骤202、在所述纠错串满足预设组词条件时,对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果;
步骤203、将所述第一组词结果作为候选项进行展现;
步骤204、依据所述纠错串的前缀查询预置词库,得到与所述纠错串的前缀相匹配的匹配词条;
步骤205、将所述匹配词条作为候选项进行展现。
在本发明实施例中,除了可以向用户展示对纠错串进行智能组词得到的第一组词结果,还可以向用户展示与所述输入串的前缀相匹配的匹配词条,以使在第一组词结果不能满足用户需求时,可以为用户提供更多的选择。
其中,所述预置词库具体可以包括本地词库和/或云词库。所述本地词库具体可以包括:本地缓存词库和/或用户词库和/或***词库和/或细胞词库等。可以理解,所述本地词库可以包括传统技术中的任一种词库或其组合,也可以为由本领域技术人员根据预置规则获取的任一种词库,并且所述本地词库的存储位置可以存在于服务器端或客户端,本发明实施例对于所述本地词库的类型以及存储方式均不加以限制。
所述云词库可存储于云服务器中,所述云词库可以实时收集不同用户的输入数据,以对本地词库中的词条进行扩充,满足更多用户的输入需求。
在本发明实施例中,所述纠错串可以包括简拼序列或者全拼序列。在本发明的一种应用示例中,假设纠错串为“zhonghuarenmin”,则该纠错串为全拼序列,且该纠错串满足预设组词条件,则对该纠错串进行智能组词,可以得到该纠错串对应的如下第一组词结果:“中华人民”。此外,还可以通过查询本地词库,得到与该纠错串的前缀“zhong”对应的匹配词条,如“中”、“种”、“重”、“钟”等,则可以将上述第一组词结果“中华人民”和上述匹配词条“中”、“种”、“重”、“钟”等均作为候选项进行展现。
再如,假设纠错串为“zhog”,该纠错串可以作为拼音“zhongguo”、“zhonggong”、“zhonggao”等的简拼序列,且该纠错串包括两个简拼音节,因此满足预设组词条件,则对该纠错串进行智能组词,可以得到该纠错串对应的如下第一组词结果:“中国”、“终稿”、“中共”等。此外,还可以通过查询本地词库,得到与该纠错串的前缀“zho”对应的匹配词条,如“中”、“最后”、“之后”、“种”等,则可以将上述第一组词结果“中国”、“终稿”、“中共”和上述匹配词条“中”、“最后”、“之后”、“种”等均作为候选项进行展现。
综上,本发明实施例在向用户展示对纠错串进行智能组词得到的第一组词结果的基础上,还可以向用户展示与所述输入串的前缀相匹配的匹配词条,为用户提供更多的选择,可以提高输入方法的灵活性,以及满足不同用户的需求。
方法实施例三
本实施例在上述实施例一的基础上,还可以获取所述输入串对应的第二组词结果,并且对第一组词结果、第二组词结果和匹配词条进行排序。参照图3,示出了本发明的一种输入方法实施例三的步骤流程图,具体可以包括:
步骤301、对输入串进行纠错,得到所述输入串对应的纠错串;
步骤302、在所述纠错串满足预设组词条件时,对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果;
步骤303、在所述输入串满足预设组词条件时,对所述输入串进行智能组词,得到所述输入串对应的第二组词结果;
步骤304、依据所述纠错串的前缀查询预置词库,得到与所述纠错串的前缀相匹配的第一匹配词条;
步骤305、依据所述输入串的前缀查询预置词库,得到与所述输入串的前缀相匹配的第二匹配词条;
步骤306、依据所述输入串对应的上下文、当前输入环境、***词频和组词语言模型中的至少一种,对所述第一组词结果、第二组词结果、第一匹配词条和第二匹配词条进行排序;
步骤307、将排序后的第一组词结果、第二组词结果、第一匹配词条和第二匹配词条作为候选项进行展现。
在具体应用中,在对输入串进行纠错的过程中,有可能会出现误将正确的输入串纠错为错误的输入串的场景,为了避免在这种场景下为用户提供错误的组词结果的情况发生,本发明实施例在对纠错串进行智能组词得到第一组词结果的基础上,还可以对用户输入的输入串也进行智能组词得到第二组词结果,并且可以向用户展现所述第二组词结果,这样,使得用户可以从纠错串对应的第一组词结果以及输入串对应的第二组词结果中选择所需的组词结果,从而可以提高组词结果的正确性。
此外,本发明实施例还可以依据所述纠错串和所述输入串的前缀查询预置词库,分别得到与所述纠错串和所述输入串的前缀相匹配的第一匹配词条和第二匹配词条,最终对所述第一组词结果、第二组词结果、第一匹配词条和第二匹配词条进行排序并展现给用户。从而可以为用户提供尽可能多并且准确的候选项,为用户的输入带来便利,以及提高输入的准确性。
在本发明实施例中,可以依据所述输入串对应的上下文、当前输入环境、***词频和组词语言模型中的至少一种,对所述第一组词结果、第二组词结果、第一匹配词条和第二匹配词条分别计算得到一个排序得分,并且依据该排序得分对所述第一组词结果、第二组词结果、第一匹配词条和第二匹配词条进行排序并展现。
例如,所述排序得分可以为:组词路径得分+与上文或下文之间的二元概率+纠错候选惩罚(可以是根据不同纠错类型赋予的不同惩罚)+环境属性得分,将得分最高的排在候选项列表的最前面。
其中,所述环境属性得分可以保存在***词库中,***词库中每个词条对应有在不同环境下的使用概率,对于第一组词结果或者第二组词结果,可以通过将组词路径中多个词条的环境得分累加计算得到。可以理解,上述计算排序得分的方式仅作为本发明的一种应用示例,本发明实施例对于计算排序得分的具体方式不加以限制。
例如,在***词库中可以保存每个词条在不同环境下的使用概率,如词条在即时通讯、办公***等环境下的使用概率分别为p1、p2等,同时,还可以保存进程与不同环境之间的映射关系,当在不同的进程中使用输入法进行输入时,输入法首先识别当前所在进程对应的环境,然后在查词的过程中即可获取到每个词条对应当前环境的使用概率,最后通过将组词路径中多个词条对应当前环境的使用概率累加计算得到整个第一组词结果或者第二组词结果的环境属性得分。
综上,本发明实施例可以依据输入串对应的上下文、当前输入环境、***词频和组词语言模型中的至少一种,对得到的第一组词结果、第二组词结果、第一匹配词条和第二匹配词条进行排序展现,以为用户提供尽可能多并且准确的候选项,避免为用户提供错误的组词结果的情况发生,为用户的输入带来便利,以及提高输入的准确性。
应用示例
在本发明的一种应用示例中,假设用户欲输入文字“吃饭了吗”对应输入串应该为“chifanlema”,然而用户却错误地输入了输入串“chianlema”,则本发明输入过程具体可以如下:
(1)获取用户输入的输入串为“chianlema”;
(2)根据输入串查询***词库,由于该输入串未能完整命中***词,则根据输入串的前缀查询***词库等,并且通过排序、调频返回部分命中的词条,得到候选列表1,其中可以包括“吃安”、“赤岸”等候选项;
(3)对输入串“chianlema”进行纠错,得到纠错串为“chifanlema”。由于该纠错串未能完整命中***词,则根据纠错串的前缀查询***词库等,并且通过排序、调频返回部分命中的词条,得到候选列表2,其中可以包括“吃饭”、“赤饭”等候选项;
(4)由于纠错串“chifanlema”包括四个音节,满足预设组词条件,则对该纠错串进行智能组词,得到该纠错串对应的第一组词结果,对第一组词结果进行排序、调频,得到候选列表3,其中可以包括“吃饭了吗”、“吃反了吗”、“赤饭了吗”等候选项;
(5)由于输入串“chianlema”也满足预设组词条件,则对输入串进行智能组词,得到候选列表4,其中可以包括“吃安了吗”、“赤岸了吗”等候选项;
(6)依据所述输入串对应的上下文、当前输入环境、***词频和组词语言模型中的至少一种对候选列表1-候选列表4中的候选项进行排序合并,得到排序后的候选项列表包括:“吃饭了吗”、“吃反了吗”、“赤饭了吗”、“吃饭”、“吃安”等候选项,用户即可选择“吃饭了吗”进行上屏。
装置实施例
参照图4,示出了本发明的一种输入装置实施例的结构框图,具体可以包括:
纠错模块401,用于对输入串进行纠错,得到所述输入串对应的纠错串;
第一组词模块402,用于在所述纠错串满足预设组词条件时,对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果;
展现模块403,用于将所述第一组词结果作为候选项进行展现。
在本发明的一种可选实施例中,所述第一组词模块402,具体可以包括:
划分子模块,用于对所述纠错串按照音节进行切分;
确定子模块,用于在切分得到的音节数目超出预设组词阈值时,确定所述纠错串满足预设组词条件。
在本发明的另一种可选实施例中,所述第一组词模块402,具体可以包括:
查询子模块,用于依据所述纠错串查询***词库;
确定子模块,用于在所述***词库中存在与所述纠错串相匹配的***词,且所述***词的词频小于预设词频阈值时,确定所述纠错串满足预设组词条件。
在本发明的又一种可选实施例中,所述第一组词模块402,具体可以包括:
查询子模块,用于依据所述纠错串查询***词库;
确定子模块,用于在所述***词库中存在与所述纠错串相匹配的***词,且所述纠错串存在多条组词路径时,确定所述纠错串满足预设组词条件。
在本发明的再一种可选实施例中,所述第一组词模块402,具体可以包括:
切分子模块,用于对所述纠错串按照音节进行切分,得到所述纠错串对应的多条组词路径;
组词子模块,用于通过查询***词库与用户词库,对每条组词路径进行组词;
计算得分子模块,用于依据预置二元库,确定所述组词路经对应的路径得分;
获取子模块,用于获取路径得分满足预设阈值的组词路径对应的第一组词结果。
在本发明的再一种可选实施例中,所述纠错模块401,具体可以包括:
错误确定子模块,用于依据位置纠错、力度纠错和临近键位纠错中的至少一种纠错算法,确定所述输入串中的错误字符;
纠错子模块,用于对所述错误字符进行纠错处理,得到所述输入串对应的纠错串。
在本发明的再一种可选实施例中,所述装置还可以包括:
第一匹配模块,用于依据所述纠错串的前缀查询预置词库,得到与所述纠错串的前缀相匹配的第一匹配词条;
展现模块,还用于将所述第一匹配词条作为候选项进行展现。
在本发明的再一种可选实施例中,所述装置还可以包括:
第二组词模块,用于在所述输入串满足预设组词条件时,对所述输入串进行智能组词,得到所述输入串对应的第二组词结果;
第二匹配模块,用于依据所述输入串的前缀查询预置词库,得到与所述输入串的前缀相匹配的第二匹配词条;
排序模块,用于依据所述输入串对应的上下文、当前输入环境、***词频和组词语言模型中的至少一种,对所述第一组词结果、第二组词结果、第一匹配词条和第二匹配词条进行排序;
展现模块,还用于将排序后的第一组词结果、第二组词结果、第一匹配词条和第二匹配词条作为候选项进行展现。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图5是根据一示例性实施例示出的一种用于输入的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图5,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理***,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种输入方法,所述方法包括:对输入串进行纠错,得到所述输入串对应的纠错串;在所述纠错串满足预设组词条件时,对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果;将所述第一组词结果作为候选项进行展现。
图6是本发明实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以***处理器(central processing units,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作***1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种输入方法、一种输入装置和一种用于输入的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (22)

1.一种输入方法,其特征在于,所述方法包括:
对输入串进行纠错,得到所述输入串对应的纠错串;
在所述纠错串满足预设组词条件时,对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果;所述智能组词用于通过查询***词库与用户词库,对组词路径进行组词,并对组词路径对应的词组结果进行排序;所述组词路径为按照音节对所述纠错串进行切分得到;
将所述第一组词结果作为候选项进行展现;
其中,所述对输入串进行纠错,得到所述输入串对应的纠错串,包括:
依据位置纠错、力度纠错和临近键位纠错中的至少一种纠错算法,确定所述输入串中的错误字符;所述位置纠错根据用户点击按键的位置偏离按键中心的方向和距离,对输入的字符进行纠错;所述力度纠错根据用户点击按键的力度,对输入的字符进行纠错;所述临近键位纠错通过将用户输入字符替换为临近的按键字符,对输入的字符进行纠错;
对所述错误字符进行纠错处理,得到所述输入串对应的纠错串。
2.根据权利要求1所述的方法,其特征在于,所述确定所述纠错串满足预设组词条件的步骤,包括:
对所述纠错串按照音节进行切分;
在切分得到的音节数目超出预设组词阈值时,确定所述纠错串满足预设组词条件。
3.根据权利要求1所述的方法,其特征在于,所述确定所述纠错串满足预设组词条件的步骤,包括:
依据所述纠错串查询***词库;
在所述***词库中存在与所述纠错串相匹配的***词,且所述***词的词频小于预设词频阈值时,确定所述纠错串满足预设组词条件。
4.根据权利要求1所述的方法,其特征在于,所述确定所述纠错串满足预设组词条件的步骤,包括:
依据所述纠错串查询***词库;
在所述***词库中存在与所述纠错串相匹配的***词,且所述纠错串存在多条组词路径时,确定所述纠错串满足预设组词条件。
5.根据权利要求1所述的方法,其特征在于,所述对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果的步骤,包括:
对所述纠错串按照音节进行切分,得到所述纠错串对应的多条组词路径;
通过查询***词库与用户词库,对每条组词路径进行组词;
依据预置二元库,确定所述组词路径 对应的路径得分;
获取路径得分满足预设阈值的组词路径对应的第一组词结果。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
依据所述纠错串的前缀查询预置词库,得到与所述纠错串的前缀相匹配的第一匹配词条;
将所述第一匹配词条作为候选项进行展现。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
在所述输入串满足预设组词条件时,对所述输入串进行智能组词,得到所述输入串对应的第二组词结果;
依据所述输入串的前缀查询预置词库,得到与所述输入串的前缀相匹配的第二匹配词条;
依据所述输入串对应的上下文、当前输入环境、***词频和组词语言模型中的至少一种,对所述第一组词结果、第二组词结果、第一匹配词条和第二匹配词条进行排序;
将排序后的第一组词结果、第二组词结果、第一匹配词条和第二匹配词条作为候选项进行展现。
8.一种输入装置,其特征在于,包括:
纠错模块,用于对输入串进行纠错,得到所述输入串对应的纠错串;
第一组词模块,用于在所述纠错串满足预设组词条件时,对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果;所述智能组词用于通过查询***词库与用户词库,对组词路径进行组词,并对组词路径对应的词组结果进行排序;所述组词路径为按照音节对所述纠错串进行切分得到;
展现模块,用于将所述第一组词结果作为候选项进行展现;
其中,所述纠错模块,包括:
错误确定子模块,用于依据位置纠错、力度纠错和临近键位纠错中的至少一种纠错算法,确定所述输入串中的错误字符;所述位置纠错根据用户点击按键的位置偏离按键中心的方向和距离,对输入的字符进行纠错;所述力度纠错根据用户点击按键的力度,对输入的字符进行纠错;所述临近键位纠错通过将用户输入字符替换为临近的按键字符,对输入的字符进行纠错;
纠错子模块,用于对所述错误字符进行纠错处理,得到所述输入串对应的纠错串。
9.根据权利要求8所述的装置,其特征在于,所述第一组词模块,包括:
划分子模块,用于对所述纠错串按照音节进行切分;
确定子模块,用于在切分得到的音节数目超出预设组词阈值时,确定所述纠错串满足预设组词条件。
10.根据权利要求8所述的装置,其特征在于,所述第一组词模块,包括:
查询子模块,用于依据所述纠错串查询***词库;
确定子模块,用于在所述***词库中存在与所述纠错串相匹配的***词,且所述***词的词频小于预设词频阈值时,确定所述纠错串满足预设组词条件。
11.根据权利要求8所述的装置,其特征在于,所述第一组词模块,包括:
查询子模块,用于依据所述纠错串查询***词库;
确定子模块,用于在所述***词库中存在与所述纠错串相匹配的***词,且所述纠错串存在多条组词路径时,确定所述纠错串满足预设组词条件。
12.根据权利要求8所述的装置,其特征在于,所述第一组词模块,包括:
切分子模块,用于对所述纠错串按照音节进行切分,得到所述纠错串对应的多条组词路径;
组词子模块,用于通过查询***词库与用户词库,对每条组词路径进行组词;
计算得分子模块,用于依据预置二元库,确定所述组词路径 对应的路径得分;
获取子模块,用于获取路径得分满足预设阈值的组词路径对应的第一组词结果。
13.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第一匹配模块,用于依据所述纠错串的前缀查询预置词库,得到与所述纠错串的前缀相匹配的第一匹配词条;
展现模块,还用于将所述第一匹配词条作为候选项进行展现。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括:
第二组词模块,用于在所述输入串满足预设组词条件时,对所述输入串进行智能组词,得到所述输入串对应的第二组词结果;
第二匹配模块,用于依据所述输入串的前缀查询预置词库,得到与所述输入串的前缀相匹配的第二匹配词条;
排序模块,用于依据所述输入串对应的上下文、当前输入环境、***词频和组词语言模型中的至少一种,对所述第一组词结果、第二组词结果、第一匹配词条和第二匹配词条进行排序;
展现模块,还用于将排序后的第一组词结果、第二组词结果、第一匹配词条和第二匹配词条作为候选项进行展现。
15.一种用于输入的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
对输入串进行纠错,得到所述输入串对应的纠错串;
在所述纠错串满足预设组词条件时,对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果;所述智能组词用于通过查询***词库与用户词库,对组词路径进行组词,并对组词路径对应的词组结果进行排序;所述组词路径为按照音节对所述纠错串进行切分得到;
将所述第一组词结果作为候选项进行展现;
其中,所述对输入串进行纠错,得到所述输入串对应的纠错串,包括:
依据位置纠错、力度纠错和临近键位纠错中的至少一种纠错算法,确定所述输入串中的错误字符;所述位置纠错根据用户点击按键的位置偏离按键中心的方向和距离,对输入的字符进行纠错;所述力度纠错根据用户点击按键的力度,对输入的字符进行纠错;所述临近键位纠错通过将用户输入字符替换为临近的按键字符,对输入的字符进行纠错;
对所述错误字符进行纠错处理,得到所述输入串对应的纠错串。
16.根据权利要求15所述的装置,其特征在于,所述确定所述纠错串满足预设组词条件,包括:
对所述纠错串按照音节进行切分;
在切分得到的音节数目超出预设组词阈值时,确定所述纠错串满足预设组词条件。
17.根据权利要求15所述的装置,其特征在于,所述确定所述纠错串满足预设组词条件,包括:
依据所述纠错串查询***词库;
在所述***词库中存在与所述纠错串相匹配的***词,且所述***词的词频小于预设词频阈值时,确定所述纠错串满足预设组词条件。
18.根据权利要求15所述的装置,其特征在于,所述确定所述纠错串满足预设组词条件,包括:
依据所述纠错串查询***词库;
在所述***词库中存在与所述纠错串相匹配的***词,且所述纠错串存在多条组词路径时,确定所述纠错串满足预设组词条件。
19.根据权利要求15所述的装置,其特征在于,所述对所述纠错串进行智能组词,得到所述纠错串对应的第一组词结果,包括:
对所述纠错串按照音节进行切分,得到所述纠错串对应的多条组词路径;
通过查询***词库与用户词库,对每条组词路径进行组词;
依据预置二元库,确定所述组词路径 对应的路径得分;
获取路径得分满足预设阈值的组词路径对应的第一组词结果。
20.根据权利要求15所述的装置,其特征在于,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据所述纠错串的前缀查询预置词库,得到与所述纠错串的前缀相匹配的第一匹配词条;
将所述第一匹配词条作为候选项进行展现。
21.根据权利要求20所述的装置,其特征在于,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
在所述输入串满足预设组词条件时,对所述输入串进行智能组词,得到所述输入串对应的第二组词结果;
依据所述输入串的前缀查询预置词库,得到与所述输入串的前缀相匹配的第二匹配词条;
依据所述输入串对应的上下文、当前输入环境、***词频和组词语言模型中的至少一种,对所述第一组词结果、第二组词结果、第一匹配词条和第二匹配词条进行排序;
将排序后的第一组词结果、第二组词结果、第一匹配词条和第二匹配词条作为候选项进行展现。
22.一个或多个机器可读介质,其特征在于,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至7中一个或多个所述的方法。
CN201610849668.2A 2016-09-23 2016-09-23 一种输入方法、装置和用于输入的装置 Active CN107870677B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610849668.2A CN107870677B (zh) 2016-09-23 2016-09-23 一种输入方法、装置和用于输入的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610849668.2A CN107870677B (zh) 2016-09-23 2016-09-23 一种输入方法、装置和用于输入的装置

Publications (2)

Publication Number Publication Date
CN107870677A CN107870677A (zh) 2018-04-03
CN107870677B true CN107870677B (zh) 2022-02-25

Family

ID=61751436

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610849668.2A Active CN107870677B (zh) 2016-09-23 2016-09-23 一种输入方法、装置和用于输入的装置

Country Status (1)

Country Link
CN (1) CN107870677B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110389666A (zh) * 2018-04-16 2019-10-29 北京搜狗科技发展有限公司 一种输入纠错方法和装置
CN110389668A (zh) * 2018-04-20 2019-10-29 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
CN110780749B (zh) * 2018-07-11 2024-03-08 北京搜狗科技发展有限公司 一种字符串纠错方法和装置
CN109597500A (zh) * 2018-12-06 2019-04-09 北京金山安全软件有限公司 一种用于汉语拼音的输入纠错方法、装置及电子设备
CN110333787A (zh) * 2019-04-28 2019-10-15 华为技术有限公司 输入字符的方法和装置
CN110297549B (zh) * 2019-05-15 2023-06-20 北京百度网讯科技有限公司 输入处理方法、装置、设备和存储介质
CN112015279B (zh) * 2019-05-28 2024-02-13 北京搜狗科技发展有限公司 按键误触纠错方法及装置
CN110262672B (zh) * 2019-06-18 2023-08-08 抖音视界有限公司 建议候选列表生成方法及装置
CN112989148A (zh) * 2019-12-13 2021-06-18 华为技术有限公司 纠错词排序方法、装置、终端设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5634134A (en) * 1991-06-19 1997-05-27 Hitachi, Ltd. Method and apparatus for determining character and character mode for multi-lingual keyboard based on input characters
CN101710262A (zh) * 2009-12-11 2010-05-19 北京搜狗科技发展有限公司 字符纠错方法及装置
CN102135814A (zh) * 2011-03-30 2011-07-27 北京搜狗科技发展有限公司 一种字词输入方法及***
CN102866782A (zh) * 2011-07-06 2013-01-09 哈尔滨工业大学 一种提高整句生成效率的输入法和输入法***
CN104915264A (zh) * 2015-05-29 2015-09-16 北京搜狗科技发展有限公司 一种输入纠错方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5634134A (en) * 1991-06-19 1997-05-27 Hitachi, Ltd. Method and apparatus for determining character and character mode for multi-lingual keyboard based on input characters
CN101710262A (zh) * 2009-12-11 2010-05-19 北京搜狗科技发展有限公司 字符纠错方法及装置
CN102135814A (zh) * 2011-03-30 2011-07-27 北京搜狗科技发展有限公司 一种字词输入方法及***
CN102866782A (zh) * 2011-07-06 2013-01-09 哈尔滨工业大学 一种提高整句生成效率的输入法和输入法***
CN104915264A (zh) * 2015-05-29 2015-09-16 北京搜狗科技发展有限公司 一种输入纠错方法和装置

Also Published As

Publication number Publication date
CN107870677A (zh) 2018-04-03

Similar Documents

Publication Publication Date Title
CN107870677B (zh) 一种输入方法、装置和用于输入的装置
CN107229348B (zh) 一种输入纠错方法、装置和用于输入纠错的装置
CN107102746B (zh) 候选词生成方法、装置以及用于候选词生成的装置
CN107436691B (zh) 一种输入法进行纠错的方法、客户端、服务器及装置
CN107544684B (zh) 一种候选词显示方法及装置
CN107918496B (zh) 一种输入纠错方法和装置、一种用于输入纠错的装置
CN107688399B (zh) 一种输入方法和装置、一种用于输入的装置
CN107092424B (zh) 一种纠错项的显示方法、装置和用于纠错项的显示的装置
CN107564526B (zh) 处理方法、装置和机器可读介质
CN108073292B (zh) 一种智能组词方法和装置、一种用于智能组词的装置
CN109002183B (zh) 一种信息输入的方法及装置
CN106886294B (zh) 一种输入法纠错方法和装置
CN107797676B (zh) 一种单字输入方法及装置
CN107422921B (zh) 一种输入方法、装置、电子设备以及存储介质
CN110633017A (zh) 一种输入方法、装置和用于输入的装置
CN110795014B (zh) 一种数据处理方法、装置和用于数据处理的装置
CN110780749B (zh) 一种字符串纠错方法和装置
CN112015279A (zh) 按键误触纠错方法及装置
CN110673753A (zh) 按键误触纠错方法及装置
CN109426354B (zh) 一种输入方法、装置和用于输入的装置
CN112987941B (zh) 生成候选词的方法及装置
CN107688400B (zh) 一种输入纠错方法和装置、一种用于输入纠错的装置
CN109388252B (zh) 一种输入方法及装置
CN113407099A (zh) 输入方法、装置和机器可读介质
CN112306251A (zh) 一种输入方法、装置和用于输入的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant