CN101520786A - 一种输入法词典的实现方法和输入法*** - Google Patents

一种输入法词典的实现方法和输入法*** Download PDF

Info

Publication number
CN101520786A
CN101520786A CN200810100979A CN200810100979A CN101520786A CN 101520786 A CN101520786 A CN 101520786A CN 200810100979 A CN200810100979 A CN 200810100979A CN 200810100979 A CN200810100979 A CN 200810100979A CN 101520786 A CN101520786 A CN 101520786A
Authority
CN
China
Prior art keywords
user
input
input method
dictionary
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200810100979A
Other languages
English (en)
Other versions
CN101520786B (zh
Inventor
苏雪峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN2008101009794A priority Critical patent/CN101520786B/zh
Publication of CN101520786A publication Critical patent/CN101520786A/zh
Application granted granted Critical
Publication of CN101520786B publication Critical patent/CN101520786B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种通过输入法完成词典查询的方法,可以包括以下步骤:接收用户的输入信息,确定用户所需的查询关键词;输入法***依据该查询关键词,在词典数据库中进行查询;获取查询结果并展现。本发明还提供了一种输入法***,包括:输入接口模块,用于接收用户的输入信息;查询关键词确定模块,用于确定用户所需的查询关键词;所述查询关键词包括通过输入法词库转换得到的候选项或者用户输入信息本身;词典查询模块,用于依据所述查询关键词,在词典数据库中进行查询;展现模块,用于获取查询结果并展现。本发明创新性的通过输入法实现词典功能,能够提高用户词典查询的效率和速度、减少词典查询过程中的数据流转步骤。

Description

一种输入法词典的实现方法和输入法***
技术领域
本发明涉及电子词典的数据处理技术领域,特别是涉及一种输入法词典的实现方法和输入法***。
背景技术
目前随着互联网技术应用的越来越广泛,人们所接触的信息量急剧增加,导致人们对词典的需求越来越大,越来越多。所述词典是一般指主要用来解释词语的概念、用法、翻译的工具书。为了方便查询,现有技术中也出现了越来越多的电子词典,例如通过本地客户端实现的金山词霸、通过网络实现的词典网站等。
从功能上来说,一般的,用户对词典的使用可以包括以下三种使用场景:查找某词对应的含义、解释;或者,查找某词对应的使用用法,一般包括某些使用例句或者出现过的文章等等;或者,查找某词对应的其他语言翻译结果,如汉英、英汉、汉日词典等。例如,对于作为一个普通用户,尤其是偏向于学生、科研的用户来说,经常需要阅读一些英文文献,偶尔会碰到一些不认识的单词或者短语,此时面临的问题就是如何将单词快速、准确翻译成中文(当然,还有其他词典的使用情景,例如中译英等)。
现有技术中的电子词典虽然相对于纸质词典查找更加便利。但是无论是基于本地客户端实现的金山词霸,还是通过网络实现的词典网站等都仍然存在查询过程步骤较多、过程复杂的问题。如以下的一个典型的查询过程:
步骤1:打开电子词典或者登陆词典网站;
步骤2:将输入光标定位在输入框内,可以通过鼠标点击、键盘tab转移实现;
步骤3:在输入框内输入需要查询的关键词;
步骤4:将查询提交给客户端或者网络服务器端;
步骤5:电子词典或者网络词典返回结果,展现给用户。
从数据流的角度对上述方式进行分析,如下:
操作***接收键盘消息(编码字符串)——转发给输入法——输入法完成内容选择和转换(编码字符串到关键词)——输入法将查询内容(关键词)发送至操作***——操作***转发所述查询内容(关键词)至电子词典输入框内——电子词典执行查询——返回结果,展现给用户。
可见,对于用户而言,其需要通过5个步骤才能满足查询需求,而其中提交查询请求的步骤就占据了4步,因此,现有电子词典的查询过程对于用户而言,是比较麻烦的,查找过程非常费时。其次,从底层数据流的角度看,其也需要经过7个步骤的数据流传输才能将最终结果反馈给用户。
总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够提高用户词典查询的效率和速度、减少词典查询过程中的数据流转步骤。
发明内容
本发明所要解决的技术问题是提供一种输入法词典的实现方法以及一种输入法***,通过输入法实现词典功能,能够提高用户词典查询的效率和速度、减少词典查询过程中的数据流转步骤。
为了解决上述问题,本发明公开了一种通过输入法完成词典查询的方法,包括:接收用户的输入信息,确定用户所需的查询关键词;输入法***依据该查询关键词,在词典数据库中进行查询;获取查询结果并展现。
优选的,上述方法可以通过以下步骤实现所述查询关键词的确定:通过用户选择或者输入法***默认设置,确定一依据用户输入信息变换后的候选项为用户所需的查询关键词。
优选的,上述方法还可以通过以下步骤实现所述查询关键词的确定:通过用户选择或者输入法***默认设置,直接确定用户输入的编码字符串为用户所需的查询关键词。
优选的,上述方法在确定用户所需的查询关键词之前,还可以包括:判断所述编码字符串属于英文的可能性,如果大于或等于预置阈值,则启动输入法***的词典查询模式,并确定该编码字符串为用户所需的查询关键词;如果否,则执行输入法***的普通输入过程。
优选的,如果所述查询关键词是依据用户输入信息的一部分而确定的,则将所述查询结果和依据剩余用户输入信息而得到的候选项组合展现。
优选的,所述词典数据库包括客户端词典数据库和网络端词典数据库。
优选的,上述方法可以通过以下步骤完成对词典数据库的查询过程:判断是否命中本地客户端词典数据库,如果是,则直接输出查询结果;如果否,则连接网络端词典数据库进行查询,返回相应的查询结果。
优选的,上述方法还可以包括:网络端服务器接收从输入法***上传的词条及其释义信息或翻译信息,并将所述信息更新至网络端词典数据库。
优选的,上述方法还可以包括:网络端服务器接收从输入法***上传的词条及其释义信息或翻译信息;依据预置规则对所述输入法***上传的词条及其释义信息或翻译信息,进行正确性分析;将所述正确性分析结果满足一定条件的所述信息更新至网络端词典数据库。
依据本发明的另一实施例,还公开了一种输入法***,包括:
输入接口模块,用于接收用户的输入信息;
查询关键词确定模块,用于确定用户所需的查询关键词;所述查询关键词包括通过输入法词库转换得到的候选项或者用户输入信息本身;
词典查询模块,用于依据所述查询关键词,在词典数据库中进行查询;
展现模块,用于获取查询结果并展现。
优选的,所述查询关键词确定模块可以通过以下方式实现所述查询关键词的确定:通过用户选择或者输入法***默认设置,确定一依据用户输入信息变换后的候选项为用户所需的查询关键词。
优选的,所述查询关键词确定模块还可以通过以下方式实现所述查询关键词的确定:通过用户选择或者输入法***默认设置,直接确定用户输入的编码字符串为用户所需的查询关键词。
优选的,所述输入法***还可以包括:
英文判断模块,用于判断所述编码字符串属于英文的可能性,如果大于或等于预置阈值,则启动输入法***的词典查询模式,并通知所述查询关键词确定模块确定该编码字符串为用户所需的查询关键词;如果否,则通知输入法***执行普通输入过程。
优选的,如果所述查询关键词是依据用户输入信息的一部分而确定的,则将所述查询结果和依据剩余用户输入信息而得到的候选项组合展现。
优选的,所述词典数据库包括客户端词典数据库和网络端词典数据库。
优选的,所述词典查询模块进一步可以包括:
客户端词典数据库查询子模块,用于判断所述查询关键词是否命中本地客户端词典数据库,如果是,则直接输出查询结果;如果否,则通知网络端词典数据库查询子模块;
网络端词典数据库查询子模块,用于连接网络端词典数据库进行查询,返回相应的查询结果。
优选的,所述输入法***还可以包括:
上传模块,用于上传词条及其释义信息或翻译信息;
更新模块,用于将所述上传的信息更新至网络端词典数据库。
或者,在另一优选情况下,所述输入法***还可以包括:
上传模块,用于上传词条及其释义信息或翻译信息;
筛选模块,用于依据预置规则对所述输入法***上传的信息进行正确性分析,筛选获取满足一定条件的信息;
更新模块,用于将所述筛选后的信息更新至网络端词典数据库。
与现有技术相比,本发明具有以下优点:
本发明将现有技术中复杂的数据流变换为简单的数据流:操作***接收键盘消息(编码字符串)——转发给输入法——输入法完成内容选择和转换(编码字符串到关键词)——输入法依据查询内容(关键词)执行词典查询——返回结果,展现给用户。同时对于用户操作步骤而言,可以将现有技术的五步减少为两步(步骤4和5),不需要打开输入法和电子词典两个独立的应用程序,减少对操作***计算资源的占用,减少用户的操作步骤,避免输入法和电子词典两个应用程序间无效(或者说效率低下)的数据交互和处理,从而可以大大提高词典查询的效率。
再者,本发明可以将电子词典分为客户端和服务器端,即将二者的优势结合起来,既可以满足本地查询的便捷和快速,也可以满足服务器端查询的完整和准确。并且,本发明的用户还可以通过输入法上传自己认为更为准确的字词释义信息、翻译信息等,以修正电子词典的错误或者增加新词,从而提高词典查询的准确性,及时满足用户新词查询的需求。
附图说明
图1是本发明一种通过输入法完成词典查询的方法实施例的步骤流程图;
图2是本发明一种输入法***实施例的结构框图;
图3是一个本发明在翻译场景下的具体应用示意图;
图4是本发明一种生成网络端词典数据库的实施例的示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
由于现有技术中,输入法平台可以运行在多种计算设备上,例如,个人电脑、个人数字助理、移动终端设备等等,所以本发明也可以适用在上述各种计算设备中。
本发明所述的用户输入信息可以包括编码字符串,也可以包括手写输入信息以及语音输入的信息。即本发明可以应用于各种输入方式的输入法平台,包括键盘符号、手写信息以及语音输入等等。由于这些输入方式中的输入信息至候选项之间的转换过程都属于公知技术,在此就不详述了。为了方便说明,下面的说明书中都采用输入编码字符串为例进行描述。
本发明可以应用于中文、日文、韩文等需要借助输入法完成计算机信息输入的语言环境;当然,也可以应用在其他文字的词典查询过程中,例如英文单词查询等等。由于本发明在上述几种输入法***中的应用都是相似的,所以为了方便说明,下面以对本发明应用在中文的情况进行举例说明。
参照图1,示出了本发明一种通过输入法完成词典查询的方法实施例,具体可以包括以下步骤:
步骤101、接收用户的输入信息,确定用户所需的查询关键词;本发明所述的查询关键词可以包括单个字符、以及多个字符组成的词组等;可以包括中文候选项,也可以包括英文单词本身。
步骤102、输入法***依据该查询关键词,在词典数据库中进行查询;
步骤103、获取查询结果并展现。
所述查询结果的展现方式,一般的,可以直接通过输入法***的附属窗口或者候选词窗口展现;当然,对于一些信息量较大、或者展现方式复杂的查询结果,则可以由输入法***调用第三方应用程序进行展现。所述查询结果一般的可以包括文字信息,优选的,为了满足某些用户需求,还可以包括图片、音视频等信息。
本发明所述的词典类别可以包括纯语言上的翻译,用于查找某词对应的其他语言翻译结果,如汉英、英汉、汉日词典等;还可以包括同一种语言的释义关系,用于查找某词对应的含义、解释、使用例句或者出现过的文章等等,比如汉语词典、朗文词典等等;还可以包括对一个词的多种语言的解释信息等,如对汉语字词的英文解释、日文解释等等。
由于本发明适用的查询关键词可以为输入法候选项,也可以为用户输入的编码字符串本身,因此,可能通过以下几种具体方案实现对查询关键词的确定。
从查询关键词是候选项还是用户输入信息本身,可以划分为方案1和方案2。
方案1:通过用户选择或者输入法***默认设置,确定一依据用户输入信息变换后的候选项为用户所需的查询关键词。
例如,接收用户输入的编码字符串,经过转换,显示至少一个候选项;用户选择确定其中一个候选项为所需的查询关键词,或者输入法***默认确定其中一个候选项(如第一个)为用户所需的查询关键词。该方案中,用户的输入体验与现有的输入法非常接近,只不过,现有输入法确定的为上屏字词,用户选定或者***默认确定后就将输出并上屏显示,而本发明确定后可以直接进行词典查询,输出查询结果,而不需要上屏显示(即通过操作***传递信息并由另一应用程序显示的过程)。
具体的,假设用户输入拼音编码字符串“sougou”,则经过现有输入法的转换,则候选词区会显示多个候选项(例如,“搜购”、“搜狗”等),用户可以选择某个候选项为查询关键词(例如,通过鼠标操作或者特定快捷键方式选择“搜购”);为了提高效率,输入法***也可以默认某个候选项为查询关键词(例如,用户选择率最高的第一个候选项“搜狗”),如果用户不主动选择,则以默认的候选项“搜狗”为查询关键词。然后,本发明就可以依据所确定的查询关键词进行词典查询,返回查询结果并展现。
所述候选项一般可以包括字词、词组等,而随着现阶段输入法技术的发展,短句也逐渐成为候选项的一种;通过匹配和补全技术,使得依据用户所输入的部分字母所得到的英文单词也可能成为候选项的一种。上述这些候选项类型都可以成为本发明的查询关键词。
例如,用户输入拼音编码字符串“nihao”,则给出中文候选项“你好”、“拟好”,如果用户选择候选项“你好”,则展现查询结果:
1:hello 2:how are you 3:how do you do 4:~~~~~,
如果用户选择候选项“拟好”,则展现查询结果:
1:write over 2:~~~~~
上述候选项的展现过程和查询结果的展现过程,可以先后进行,例如,先展现候选项,用户选定后,展现查询结果。当然,也可以采用两个显示栏,同时展现候选项和查询结果,例如,上下相邻的两个显示栏,上面的用于显示中文候选项,下面的用于显示查询结果。
优选的,在一定特定情况下,本发明还可以省略显示候选项、选定候选项的过程,而直接输出查询结果,例如,当候选项唯一的时候(如“anjuan”—“案卷”),则可以直接针对候选项“案卷”获取查询结果而显示。又例如,直接针对缺省候选项(首选项)获取查询结果并显示。
方案2:通过用户选择或者输入法***默认设置,直接确定用户输入的编码字符串为用户所需的查询关键词。
上述方案1中需要输入法将用户的输入信息转换为候选项,然后从多个候选项中选取一个作为查询关键词;而本方案的特点在于,不需要输入法***进行编码字符串的转换,可以直接接受用户触发,将用户输入的编码字符串作为查询关键词进行匹配查询。该方案可以适用于没有英文辅助输入功能的输入法***,或者适用于用户进行英文缩写或者英文单词查询的情况。例如,用户输入“patent”,返回查询结果“专利”或者对专利的释义。又例如,直接建立拼音编码和英文单词的映射关系,用户输入“nihao”,则不需要通过候选项的转换,而直接返回查询结果“hello”或者对“hello”的释义、例句等。
本方案中所述的用户触发可以为用户的主动行为,例如鼠标点击或者回车键等;也可以为用户的被动触发(不需要主动点击行为),例如用户输入完毕后一秒中,就自动进行查询;或者在编码字符串的输入过程中,自动依据与用户当前输入的编码字符串最接近的英文单词进行词典查询。例如,用户每输入一个新的编码字符,就依据已经输入的编码字符串得到最接近的英文单词进行词典查询,并展示查询结果。
从需要事先通知输入法***进入词典查询模式,还是由用户输入完成后,再触发启动词典查询,可以划分为方案3和方案4。
方案3:后启动模式
接收用户输入的编码字符串,经过转换,显示至少一个候选项;用户可以先通过快捷键(ctrl+相应的数字键)或者鼠标等方式,确定一个候选项作为查询关键词;然后通过快捷键(如空格键或回车键)触发词典查询步骤。为了方便用户,还可以将所确定的搜索关键词采用不同的颜色或者字体加以显示,与其他候选项区分开来。
即在本方案中,候选项的转换、展示和选择都和现有的输入过程比较相近,而在最后一步中,由用户确定其是将所选定的候选词上屏输入给另一应用程序,还是触发启动词典查询步骤。当然,完成上屏输入和启动词典查询的触发方式应该存在不同(如快捷键不同等)。
当然,用户选择侯选词和触发词典查询步骤的操作也可以合为一个操作,即用户选择某个候选词后(如鼠标点击),该被选择的字词就直接从后台输入,自动触发步骤102进行查询。
对于将用户输入的编码字符串直接作为查询关键词的情况而言,本方案则更加简单,用户连候选项选择步骤都可以不需要,直接通过特定的触发方式(例如快捷键F12),触发启动词典查询步骤即可。
方案4:先启动模式
首先,通过鼠标操作(菜单或者控件)或者输入引导字符,通知输入法启动词典查询模式;然后,接收用户输入的编码字符串,经过转换,显示至少一个候选项;用户通过选择某个候选项,则可以直接启动依据该查询关键词的词典查询过程。方案4和方案3的主要区别在于,触发启动词典查询的时间点不同。具体的如,用户输入搜索引导符“i”,则输入法就相应启动词典查询模式,当用户选择了某个候选项之后,输入法***就可以依据该候选项进行词典查询。
如果查询关键词可能包括多个候选项,则可以预置存储空间,将用户依次所选的候选项存储在所述的预置空间中,当用户确认候选项选择完毕时,就可以直接启动依据该多个候选项(短句或者长词)作为查询关键词的词典查询过程。该过程类似于用户利用现有输入法完成长句输入的情况。
尤其对于直接将用户的输入编码字符串作为查询关键词的情况而言,方案4可以不进行候选项的转换计算过程,而直接依据用户的输入编码字符串进行词典查询即可。甚至可以依据用户输入的部分字母,实现单词的自动补全,进一步缩短查询输入的时间,用户不需要输入完整的编码字符串(英文单词),就可以启动依据补全后的英文单词进行词典查询的步骤。
一般的,由于用户可以直接通过键盘向其他应用程序输入英文单词,因此,当用户通过输入法输入英文序列时,其可能需要的是词典查询服务,而不是普通输入服务。所以优选的,在本发明的另一实施例中,还可以包括:
判断所述编码字符串属于英文的可能性,如果该编码字符串序列属于英文单词的可能性大于或等于预置阈值(例如,可以通过判断是否匹配相应的英文单词而确定其可能性),则启动输入法***的词典查询模式,并确定该编码字符串为用户所需的查询关键词;当用户输入完毕(或者自动补全)后就可以直接返回相应的查询结果。如果不能确定其是否属于英文单词(例如,可能性参数值低于一定阈值),则可以继续执行普通输入过程(包括候选项转换、展示等等)。即,该方案有可能实现词典查询功能的自动启动。
当然,上述几种实现方案仅仅用于举例,本发明并不限于上述几种方式,其他能够实现查询关键词确定功能的方式都是可行的,在此无法一一详述而已。
在本发明的另一优选实施例中,如果所述查询关键词是依据部分的用户输入信息而确定的,则将所述查询结果和依据剩余用户输入信息而得到的候选项组合展现。例如,当应用本发明以满足一种中英混杂口语化输入的方式时,假设用户输入“nichifanlema”,给出候选项“你吃饭了吗”,如果用户选择仅仅对其中的“吃饭”进行词典查询,即仅对输入信息中的部分信息“chifan”进行词典查询,而其他信息则仍然应用通常的候选项转换,则所展现的结果可以为:
1:你lunch了吗   2:你mixi了吗
优选的,上述过程还可以自动确定所需翻译的字词,例如,通过自动设置或者用户选择,确定对用户输入中的名词、形容词或者动词,或者介词搭配等进行翻译,而其他信息则仍然应用通常的候选项展示。
图1所示的实施例可以将词典数据库存储在本地客户端,以提高查询速度,但是如果完全存储,则有可能导致大量占用本地存储资源,而如果仅存储一些典型数据,则可能导致查询结果不准确、新词更新较慢等问题。图1所示的实施例也可以将词典数据库存储在网络服务器端,以确保查询结果的准确性,但是却可能增大对网络传输资源的占用,以及查询速度的下降。
在本发明的另一优选实施例中,所述输入法***进行查询的词典数据库可以同时包括有客户端词典数据库和网络端词典数据库。即将常用词词典作为输入法词库的一部分(或者独立存储)保存在本地客户端,这样可以满足大部分用户的常用输入查询。当本地客户端词典数据库不能满足用户需求时,例如,没有命中的查询结果或者用户需要更为详细、丰富的查询结果,则可以连接服务器端,查询网络端词典数据库以获得对应的查询结果。
其中,对于客户端词典数据库中具体应该存储那些词条及对应的释义信息或翻译信息,本发明并不需要加以限制。本领域技术人员依据经验或者借鉴典型词典的数据情况进行设置即可。
当所述输入法***进行查询的词典数据库同时包括有客户端词典数据库和网络端词典数据库时,优选的,可以通过以下步骤完成对整个词典数据库的查询过程:
判断当前的查询关键词是否命中本地客户端词典数据库,如果是,则直接输出查询结果;如果否,则连接网络端词典数据库进行查询,返回相应的查询结果。
即先查询本地客户端词典数据库,如果没有相应的命中结果,则通过网络连接完成更为精确、详细的查询,既可以保证查询速度,又可以满足用户对查询结果准确度、详细度的需求。
在本发明的一个优选实施例中,为了保证查询结果的准确程度和详细程度,网络端词典数据库可以存储有权威典籍中的字词释义或翻译信息,并可以存储相应的例句、用法等详细解释。
优选的,为了解决新词查询的问题,本发明还可以通过以下步骤向网络端词典数据库中增加数据:首先采集海量的互联网网页信息,经过筛选后进行自动分析、文本挖掘,从而获得对一些字词的释义信息或翻译信息。至于具体应该采用怎样的技术方案才能实现对海量的互联网网页信息的分析和挖掘,这在现有技术中已经有很多的研究了,其可能采用的技术方案也是多种多样的。
例如,采用语义分析的方法对互联网文档进行分析。通过分词技术能够将文档中的字词切分开来,分析字词的含义,并进一步将它们组合在一起,以获取所需的对某些字词的释义信息或翻译信息。
再例如,首先通过对样本数据的分析,预置能够准确表征概念型文档表达模式的参数——在描述概念时常用的关键词(包括标点符号)等——然后根据这些关键词在网页中的匹配情况进行计分,从而判定某个网页是否为概念型文档;进而从中提取所需的对某些字词的释义信息或翻译信息。例如,可以利用个别标志语言的关键词(如“英文名”、“拉丁文名”)和标点符号(如括号)等,分析并统计出所需的多语言单词对,以满足翻译信息的需要。
由于通过对互联网网页分析而获取所需信息数据的技术,在本领域已经被常用,因此,在本发明中就不再赘述。
当然,由于其是依据互联网自动分析而获取信息的,因此,避免不了机器学习所客观存在的结果不准确的问题。因此,在本发明的另一优选实施例中,还可以在前述网络词典的基础上,增加用户参与度,以实现共建网络端词典数据库。
例如,用户可以通过输入法***向所述的网络端词典数据库上传自己认为质量较高(或者用于修正原释义或翻译)的词条。
需要说明的是,本领域技术人员可以选用上述三种形成网络端词典数据库技术方案的任一种或者任意组合,作为某个具体实施例的解决方案。
对于用户通过输入法***上传的词条及其释义信息或翻译信息,网络端服务器可以直接将其更新至网络端词典数据库中;也可以先经过筛选或验证,然后再将符合条件的词条及其释义信息或翻译信息添加至网络端词典数据库中。具体的,例如,可以包括以下步骤:
步骤a、网络端服务器接收从输入法***上传的词条及其释义信息或翻译信息;
步骤b、依据预置规则对所述输入法***上传的词条及其释义信息或翻译信息,进行正确性分析;
步骤c、将所述正确性分析结果满足一定条件的所述信息更新至网络端词典数据库。
具体的,对于如何进行正确性分析,本领域技术人员可以依据经验和实际需求进行设定。例如:
可以由人工判断相关注释是否正确;
或者,通过记录历史信息对上传用户进行信用评价,如果该用户上传的词条及其释义等信息一直正确性都比较高,则针对该用户当前上传的词条及其释义等信息的正确性评分就比较高;
或者,统计该用户的上传总量,如果总量比较高,则可以对该用户当前上传的词条及其释义等信息的正确性评分进行加分;
或者,收集用户对于人工结果的打分、评价、反馈机制,让用户评分较高的结果具备较高的可信度;
或者,根据上传词条内容进行自动化的分析、比较,将用户共同上传次数较多的结果作为正确答案。
需要说明的是,本发明并不需要对具体的查询结果展现方式进行限定,本领域技术人员可以依据所需展现的查询结果的形式来确定具体的展现方式。
例如,对于简单的查询结果,可以直接通过输入法***的附属窗口或者候选词窗口展现所述搜索结果的情况。具体的,所述附属窗口可以位于输入法候选词窗口的下方;在该附属窗口中显示的简单查询结果还可以链接至网络端词典数据库中更为详细的查询结果,用户通过点击就可以获取更为详细的查询结果,以满足用户更深层次的需求。
再例如,所述输入法***还可以调用第三方应用程序对包含有图片或者音视频等辅助信息的查询结果进行展示。
参照图2,示出了本发明一种输入法***实施例,可以包括以下部件:
输入接口模块201,用于接收用户的输入信息;
查询关键词确定模块202,用于确定用户所需的查询关键词;所述查询关键词包括通过输入法词库转换得到的候选项或者用户输入信息本身;
词典查询模块203,用于依据所述查询关键词,在词典数据库209中进行查询;
展现模块204,用于获取查询结果并展现。
与前述的方法实施例相似,所述查询关键词确定模块可以通过以下方式实现所述查询关键词的确定:通过用户选择或者输入法***默认设置,确定一依据用户输入信息变换后的候选项为用户所需的查询关键词。
所述查询关键词确定模块也可以通过以下方式实现所述查询关键词的确定:通过用户选择或者输入法***默认设置,直接确定用户输入的编码字符串为用户所需的查询关键词。
在用于翻译等查询情境下,图2所示的输入法***还可以包括英文判断模块205,判断所述编码字符串属于英文的可能性,如果大于或等于预置阈值,则启动输入法***的词典查询模式,并确定该编码字符串为用户所需的查询关键词;如果否,则执行输入法***的普通输入过程。当然,所述输入法***为了完成普通输入过程,应该还需要包括现有输入法***中的候选项转换模块、展示模块等。
所述英文判断模块205可以用于翻译等查询情境下完成对输入法***词典查询模式的自动启动。
在本发明的另一优选实施例中,所述词典数据库可以同时包括客户端词典数据库和网络端词典数据库。此时,相应的,所述词典查询模块203可以进一步包括:
客户端词典数据库查询子模块,用于判断所述查询关键词是否命中本地客户端词典数据库,如果是,则直接输出查询结果;如果否,则通知网络端词典数据库查询子模块;
网络端词典数据库查询子模块,用于连接网络端词典数据库进行查询,返回相应的查询结果。
对于网络端词典数据库,其数据来源除了权威词典和对网页信息的自动分析,在本发明的另一优选实施例中,还可以引入用户参与,以完善和修正网络端词典数据库。此时,所述的输入法***还可以包括:
上传模块,用于上传词条及其释义信息或翻译信息;
更新模块,用于将所述上传的信息更新至网络端词典数据库。
对于引入用户参与上传词条及其释义等信息的情况,在本发明的另一优选实施例中,所述的输入法***还可以采用以下的解决方案:
上传模块206,用于上传词条及其释义信息或翻译信息;
筛选模块207,用于依据预置规则对所述输入法***上传的信息进行正确性分析,筛选获取满足一定条件的信息;
更新模块208,用于将所述筛选后的信息更新至网络端词典数据库。
参照图3,示出了一个本发明在翻译场景下的具体应用。
首先,用户通过计算机301输入编码字符串;
然后,输入序列判断模块302依据用户输入的字符序列,判断本次输入是否属于词典查询(例如,属于英文单词的可能性比较大);如果是,则调用本地词典查询模块303,如果否,则进行普通候选项输入后续过程;
然后,本地词典查询模块303依据用户所确定的查询关键词在客户端词典数据库305中进行查询,如果命中本地客户端词典数据库305,则通知本地词库结果返回模块304从本地客户端词典数据库305中调用相应的结果信息向用户返回。图3中的本地词典查询模块303和客户端词典数据库305没有直接相连,即本地词典查询模块303可以通过另外存在的索引表等查询获悉:其是否命中了本地客户端词典数据库305,而不一定需要直接连接客户端词典数据库305进行查询。
如果没有命中本地客户端词典数据库305,则通知网络词典查询模块306依据用户所确定的查询关键词,在网络端词典数据库307中进行查询;并通过网络词典结果返回模块308将相应的查询结果返回给用户。
参照图4,示出了本发明一种生成网络端词典数据库的实施例的示意图。
首先,用户通过计算机401将自己认为更正确或者更详细(相对于已有的词典数据库)的词条及其释义等信息提供给词条上传模块402;
然后,由词条上传模块402将其上传至服务器403;服务器403接收到该信息后,通过词条存储模块404将该信息存储至上传词条数据库405;
然后,分别通过词条分析模块406和人工标注模块407对上传词条数据库405的各个词条及其释义等信息进行自动分析挖掘或者人工标注,进而分别得到自动分析高质量词库408和人工标注高质量词库409;
最后,通过网络端词典生成模块410将海量词典词库(例如权威词典等)411、自动分析高质量词库408和人工标注高质量词库409进行合并,得到所需的网络端词典数据库412。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于***实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本发明所提供的一种通过输入法完成词典查询的方法和一种输入法***,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (18)

1、一种通过输入法完成词典查询的方法,其特征在于,包括:
接收用户的输入信息,确定用户所需的查询关键词;
输入法***依据该查询关键词,在词典数据库中进行查询;
获取查询结果并展现。
2、如权利要求1所述的方法,其特征在于,通过以下步骤实现所述查询关键词的确定:
通过用户选择或者输入法***默认设置,确定一依据用户输入信息变换后的候选项为用户所需的查询关键词。
3、如权利要求1所述的方法,其特征在于,通过以下步骤实现所述查询关键词的确定:
通过用户选择或者输入法***默认设置,直接确定用户输入的编码字符串为用户所需的查询关键词。
4、如权利要求3所述的方法,其特征在于,在确定用户所需的查询关键词之前,还包括:
判断所述编码字符串属于英文的可能性,如果大于或等于预置阈值,则启动输入法***的词典查询模式,并确定该编码字符串为用户所需的查询关键词;
如果否,则执行输入法***的普通输入过程。
5、如权利要求1所述的方法,其特征在于,如果所述查询关键词是依据用户输入信息的一部分而确定的,则将所述查询结果和依据剩余用户输入信息而得到的候选项组合展现。
6、如权利要求1所述的方法,其特征在于,所述词典数据库包括客户端词典数据库和网络端词典数据库。
7、如权利要求6所述的方法,其特征在于,通过以下步骤完成对词典数据库的查询过程:
判断是否命中本地客户端词典数据库,如果是,则直接输出查询结果;
如果否,则连接网络端词典数据库进行查询,返回相应的查询结果。
8、如权利要求6所述的方法,其特征在于,还包括:
网络端服务器接收从输入法***上传的词条及其释义信息或翻译信息,并将所述信息更新至网络端词典数据库。
9、如权利要求6所述的方法,其特征在于,还包括:
网络端服务器接收从输入法***上传的词条及其释义信息或翻译信息;
依据预置规则对所述输入法***上传的词条及其释义信息或翻译信息,进行正确性分析;
将所述正确性分析结果满足一定条件的所述信息更新至网络端词典数据库。
10、一种输入法***,其特征在于,包括:
输入接口模块,用于接收用户的输入信息;
查询关键词确定模块,用于确定用户所需的查询关键词;所述查询关键词包括通过输入法词库转换得到的候选项或者用户输入信息本身;
词典查询模块,用于依据所述查询关键词,在词典数据库中进行查询;
展现模块,用于获取查询结果并展现。
11、如权利要求10所述的输入法***,其特征在于,所述查询关键词确定模块通过以下方式实现所述查询关键词的确定:
通过用户选择或者输入法***默认设置,确定一依据用户输入信息变换后的候选项为用户所需的查询关键词。
12、如权利要求10所述的输入法***,其特征在于,所述查询关键词确定模块通过以下方式实现所述查询关键词的确定:
通过用户选择或者输入法***默认设置,直接确定用户输入的编码字符串为用户所需的查询关键词。
13、如权利要求12所述的输入法***,其特征在于,还包括:
英文判断模块,用于判断所述编码字符串属于英文的可能性,如果大于或等于预置阈值,则启动输入法***的词典查询模式,并通知所述查询关键词确定模块确定该编码字符串为用户所需的查询关键词;如果否,则通知输入法***执行普通输入过程。
14、如权利要求10所述的输入法***,其特征在于,如果所述查询关键词是依据用户输入信息的一部分而确定的,则将所述查询结果和依据剩余用户输入信息而得到的候选项组合展现。
15、如权利要求10所述的输入法***,其特征在于,所述词典数据库包括客户端词典数据库和网络端词典数据库。
16、如权利要求15所述的输入法***,其特征在于,所述词典查询模块进一步包括:
客户端词典数据库查询子模块,用于判断所述查询关键词是否命中本地客户端词典数据库,如果是,则直接输出查询结果;如果否,则通知网络端词典数据库查询子模块;
网络端词典数据库查询子模块,用于连接网络端词典数据库进行查询,返回相应的查询结果。
17、如权利要求15所述的输入法***,其特征在于,还包括:
上传模块,用于上传词条及其释义信息或翻译信息;
更新模块,用于将所述上传的信息更新至网络端词典数据库。
18、如权利要求15所述的输入法***,其特征在于,还包括:
上传模块,用于上传词条及其释义信息或翻译信息;
筛选模块,用于依据预置规则对所述输入法***上传的信息进行正确性分析,筛选获取满足一定条件的信息;
更新模块,用于将所述筛选后的信息更新至网络端词典数据库。
CN2008101009794A 2008-02-27 2008-02-27 一种输入法词典的实现方法和输入法*** Active CN101520786B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008101009794A CN101520786B (zh) 2008-02-27 2008-02-27 一种输入法词典的实现方法和输入法***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101009794A CN101520786B (zh) 2008-02-27 2008-02-27 一种输入法词典的实现方法和输入法***

Publications (2)

Publication Number Publication Date
CN101520786A true CN101520786A (zh) 2009-09-02
CN101520786B CN101520786B (zh) 2010-12-22

Family

ID=41081378

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101009794A Active CN101520786B (zh) 2008-02-27 2008-02-27 一种输入法词典的实现方法和输入法***

Country Status (1)

Country Link
CN (1) CN101520786B (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063193A (zh) * 2009-11-18 2011-05-18 腾讯科技(深圳)有限公司 显示输入结果的方法及装置
CN102103625A (zh) * 2009-12-17 2011-06-22 艾利和电子科技(中国)有限公司 根据输入语言自动搜索电子词典的***及其方法
CN102103455A (zh) * 2009-12-18 2011-06-22 上海智问软件技术有限公司 一种基于交互输入的智能提示***及其实现方法
WO2011127788A1 (zh) * 2010-04-16 2011-10-20 百度在线网络技术(北京)有限公司 用于供用户进行文字输入的方法、设备、服务器及***
WO2012000335A1 (zh) * 2010-06-30 2012-01-05 百度在线网络技术(北京)有限公司 与应用接口相结合的输入方法和设备
CN102541928A (zh) * 2010-12-30 2012-07-04 腾讯科技(深圳)有限公司 一种终端应用程序的内容搜索方法和装置
CN102567365A (zh) * 2010-12-26 2012-07-11 上海量明科技发展有限公司 一种针对于关键词进行标注的输入方法及***
CN102902368A (zh) * 2012-10-12 2013-01-30 上海量明科技发展有限公司 一种输入法工具的实现方法及客户端
CN103092826A (zh) * 2012-12-31 2013-05-08 百度在线网络技术(北京)有限公司 一种根据用户的输入信息构建输入词条的方法与设备
CN103257719A (zh) * 2012-02-21 2013-08-21 腾讯科技(深圳)有限公司 输入法中候选词的生成方法及***
CN103870498A (zh) * 2012-12-17 2014-06-18 张家港市赫图阿拉信息技术有限公司 一种查询城市邮政编码的方法
CN104133561A (zh) * 2014-07-31 2014-11-05 百度在线网络技术(北京)有限公司 基于输入法的辅助信息展现方法和装置
CN104679766A (zh) * 2013-11-28 2015-06-03 英业达科技有限公司 输入***及其方法
CN104714738A (zh) * 2014-12-30 2015-06-17 上海孩子国科教设备有限公司 快捷语言学习的方法及***
CN105929979A (zh) * 2016-06-29 2016-09-07 百度在线网络技术(北京)有限公司 长句输入方法和装置
CN105976651A (zh) * 2016-07-15 2016-09-28 苏州市玄天环保科技有限公司 智能词典服务***
CN105981005A (zh) * 2013-12-13 2016-09-28 纽昂斯通信有限公司 使用统计语言模型改进文本输入
CN106202147A (zh) * 2016-06-16 2016-12-07 塔里木大学 一种基于Android的柯汉互译电子词典
CN108255818A (zh) * 2018-01-23 2018-07-06 成都海之译翻译有限公司 利用分割技术的复合式机器翻译方法
CN110874527A (zh) * 2018-08-28 2020-03-10 游险峰 一种基于云端的智能释义注音***
CN112347794A (zh) * 2020-10-27 2021-02-09 深圳前海微众银行股份有限公司 数据翻译方法、装置、设备及计算机存储介质
CN112433622A (zh) * 2020-11-13 2021-03-02 北京搜狗科技发展有限公司 基于考试的词条处理方法、装置和介质
CN112748809A (zh) * 2019-10-16 2021-05-04 北京搜狗科技发展有限公司 输入法词条的展现方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100454310C (zh) * 2006-12-22 2009-01-21 新诺亚舟科技(深圳)有限公司 用于手持学习终端的跨词典查询方法
CN200986706Y (zh) * 2006-12-26 2007-12-05 新诺亚舟科技(深圳)有限公司 带跨词典查询功能的手持学习终端

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063193B (zh) * 2009-11-18 2016-06-29 腾讯科技(深圳)有限公司 显示输入结果的方法及装置
CN102063193A (zh) * 2009-11-18 2011-05-18 腾讯科技(深圳)有限公司 显示输入结果的方法及装置
CN102103625A (zh) * 2009-12-17 2011-06-22 艾利和电子科技(中国)有限公司 根据输入语言自动搜索电子词典的***及其方法
CN102103455A (zh) * 2009-12-18 2011-06-22 上海智问软件技术有限公司 一种基于交互输入的智能提示***及其实现方法
WO2011127788A1 (zh) * 2010-04-16 2011-10-20 百度在线网络技术(北京)有限公司 用于供用户进行文字输入的方法、设备、服务器及***
WO2012000335A1 (zh) * 2010-06-30 2012-01-05 百度在线网络技术(北京)有限公司 与应用接口相结合的输入方法和设备
CN102567365A (zh) * 2010-12-26 2012-07-11 上海量明科技发展有限公司 一种针对于关键词进行标注的输入方法及***
CN102567365B (zh) * 2010-12-26 2016-07-06 上海量明科技发展有限公司 一种针对于关键词进行标注的输入方法及***
CN102541928A (zh) * 2010-12-30 2012-07-04 腾讯科技(深圳)有限公司 一种终端应用程序的内容搜索方法和装置
CN103257719B (zh) * 2012-02-21 2018-10-16 深圳市世纪光速信息技术有限公司 输入法中候选词的生成方法及***
CN103257719A (zh) * 2012-02-21 2013-08-21 腾讯科技(深圳)有限公司 输入法中候选词的生成方法及***
CN102902368A (zh) * 2012-10-12 2013-01-30 上海量明科技发展有限公司 一种输入法工具的实现方法及客户端
CN103870498A (zh) * 2012-12-17 2014-06-18 张家港市赫图阿拉信息技术有限公司 一种查询城市邮政编码的方法
CN103092826A (zh) * 2012-12-31 2013-05-08 百度在线网络技术(北京)有限公司 一种根据用户的输入信息构建输入词条的方法与设备
CN104679766A (zh) * 2013-11-28 2015-06-03 英业达科技有限公司 输入***及其方法
CN105981005A (zh) * 2013-12-13 2016-09-28 纽昂斯通信有限公司 使用统计语言模型改进文本输入
CN104133561B (zh) * 2014-07-31 2018-06-05 百度在线网络技术(北京)有限公司 基于输入法的辅助信息展现方法和装置
CN104133561A (zh) * 2014-07-31 2014-11-05 百度在线网络技术(北京)有限公司 基于输入法的辅助信息展现方法和装置
CN104714738A (zh) * 2014-12-30 2015-06-17 上海孩子国科教设备有限公司 快捷语言学习的方法及***
CN106202147A (zh) * 2016-06-16 2016-12-07 塔里木大学 一种基于Android的柯汉互译电子词典
CN105929979A (zh) * 2016-06-29 2016-09-07 百度在线网络技术(北京)有限公司 长句输入方法和装置
CN105929979B (zh) * 2016-06-29 2018-09-11 百度在线网络技术(北京)有限公司 长句输入方法和装置
CN105976651A (zh) * 2016-07-15 2016-09-28 苏州市玄天环保科技有限公司 智能词典服务***
CN108255818A (zh) * 2018-01-23 2018-07-06 成都海之译翻译有限公司 利用分割技术的复合式机器翻译方法
CN110874527A (zh) * 2018-08-28 2020-03-10 游险峰 一种基于云端的智能释义注音***
CN112748809A (zh) * 2019-10-16 2021-05-04 北京搜狗科技发展有限公司 输入法词条的展现方法及装置
CN112347794A (zh) * 2020-10-27 2021-02-09 深圳前海微众银行股份有限公司 数据翻译方法、装置、设备及计算机存储介质
CN112433622A (zh) * 2020-11-13 2021-03-02 北京搜狗科技发展有限公司 基于考试的词条处理方法、装置和介质

Also Published As

Publication number Publication date
CN101520786B (zh) 2010-12-22

Similar Documents

Publication Publication Date Title
CN101520786B (zh) 一种输入法词典的实现方法和输入法***
US8346536B2 (en) System and method for multi-lingual information retrieval
US8745051B2 (en) Resource locator suggestions from input character sequence
CN100492364C (zh) 用于多语言信息检索的***、方法、软件和界面
JP5264892B2 (ja) 多言語情報検索
CN102236702B (zh) 计算机执行的方法和使用查询执行搜索的***及设备
CN101452453B (zh) 一种输入法网址导航的方法和一种输入法***
US8825694B2 (en) Mobile device retrieval and navigation
KR100815215B1 (ko) 웹사이트 통합 검색 장치 및 방법
CN1815477B (zh) 用于提供基于标记语言的限定词的方法和***
US20110087961A1 (en) Method and System for Assisting in Typing
CN100501745C (zh) 电子文本处理与检索的便捷方法和***
CN101697109A (zh) 一种获取输入法候选项的方法及***
CN101286118A (zh) 一种快速调用程序指令的方法、***及一种输入法***
CN101639857A (zh) 构建知识问答分享平台的方法、装置及***
US20090119283A1 (en) System and Method of Improving and Enhancing Electronic File Searching
KR20040070323A (ko) 프로그램, 문자 입력 편집 방법과 장치 및 기록 매체
CN1492354A (zh) 多国文字信息搜索方法和多国文字信息搜索引擎***
KR20020022977A (ko) 인터넷 자원의 도메인화와 확장 사이트맵을 이용한정보검색 및 브라우징방법
CN101196883A (zh) 一种互联网信息自然语言翻译通用方法和***
CN103020311A (zh) 一种用户检索词的处理方法及***
KR20040048548A (ko) 지능형 데이터베이스 및 검색 편집 프로그램을 통한사용자 맞춤 검색 방법 및 시스템
US9311302B2 (en) Method, system and medium for character conversion between different regional versions of a language especially between simplified chinese and traditional chinese
CN101692245A (zh) 一种检索***输入附加搜索要求的便捷处理方法
Hanumanthappa et al. A detailed study on Indian languages text mining

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant