CN111103986B - 用户词库管理方法及装置、输入方法及装置 - Google Patents

用户词库管理方法及装置、输入方法及装置 Download PDF

Info

Publication number
CN111103986B
CN111103986B CN201811256879.0A CN201811256879A CN111103986B CN 111103986 B CN111103986 B CN 111103986B CN 201811256879 A CN201811256879 A CN 201811256879A CN 111103986 B CN111103986 B CN 111103986B
Authority
CN
China
Prior art keywords
user
environment
word
words
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811256879.0A
Other languages
English (en)
Other versions
CN111103986A (zh
Inventor
费腾
崔欣
张扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201811256879.0A priority Critical patent/CN111103986B/zh
Publication of CN111103986A publication Critical patent/CN111103986A/zh
Application granted granted Critical
Publication of CN111103986B publication Critical patent/CN111103986B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种用户词库管理方法及装置,还公开了一种输入方法及装置。所述输入方法包括:获取与用户的输入信息相匹配的候选词;确定所述候选词是否为用户词库中的用户词;所述用户词库包括:用户词及其属性信息、环境类别;如果是,则获取所述用户词的环境类别;如果所述用户词的环境类别为普通环境,则根据所述用户词的属性信息调整所述用户词的排序权重;如果所述用户词的环境类别为特定环境,则确定所述候选词的当前环境类别;如果所述当前环境类别与所述用户词的环境类别相同,则根据所述用户词的属性信息调整所述用户词的排序权重。利用本发明,可以提高输入法的智能性,使输出的候选词更准确,提升用户输入体验。

Description

用户词库管理方法及装置、输入方法及装置
技术领域
本发明涉及信息处理领域,具体涉及一种用户词库管理方法及装置、以及一种输入方法及装置。
背景技术
输入法是一种将各种符号输入计算机或其他设备的编码方法,是人类和计算机打交道不可或缺的工具。对于输入法***,通常都会设置通用词库及用户词库。用户词库是指根据用户的历史输入数据生成的用户个性化词库,其主要用于记录用户上屏的词,在输入法展现候选词时,优先展现用户词库里有的词。
用户词库给用户输入带来方便,但在有些情况下却会对用户输入产生干扰,比如,有些词近期用户使用频次很多,根据现有的排序词频确定方式,这些词在用户输入时,总会排在靠前的位置,但有些输入场景下,如果用户想输入的其他词恰好与这些词的编码(如拼音、五笔等)相同,则这些词会排在比较靠前的位置,给用户输入带来干扰,用户可以需要进行翻页等操作才能够找到其想输入的候选项,输入的成本较高,影响用户体验。
发明内容
本发明实施例一方面提供一种用户词库管理方法及装置,以使用户词库中的信息更好地适应不同的输入环境。
本发明实施例另一方面提供一种输入方法及装置,以提高输入法的智能性,使输出的候选词更准确,提升用户输入体验。
为此,本发明提供如下技术方案:
一种用户词库管理方法,所述方法包括:
根据用户历史输入信息获取用户词及其属性信息;
确定所述用户词的环境类别,所述环境类别包括:特定环境、普通环境;
将所述用户词及其属性信息、环境类别添加到用户词库中。
可选地,所述历史输入信息包括:用户词的词频信息、时间信息、环境信息;所述环境信息包括:语言环境、和/或应用环境;
所述确定所述用户词的环境类别包括:
对所述用户历史输入信息进行统计或聚类,得到所述用户词的环境类别。
可选地,所述特定环境包括以下任意一种或多种:固定上文环境、固定应用环境;
所述方法还包括按照以下方式确定所述用户词的特定环境:
统计所述用户词的使用频次以及所述用户词与特定上文的二元共现次数N,如果所述共现次数N与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定上下文环境;
统计所述用户词的使用频次以及在特定应用环境下所述用户词的共现次数M,如果所述共现次数M与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定应用环境。
可选地,所述属性信息包括:词频信息、时间信息。
一种输入方法,所述方法包括:
获取与用户的输入信息相匹配的候选词;
确定所述候选词是否为用户词库中的用户词;所述用户词库包括:用户词及其属性信息、环境类别,所述环境类别包括:特定环境、普通环境;
如果是,则获取所述用户词的环境类别;
如果所述用户词的环境类别为普通环境,则根据所述用户词的属性信息调整所述用户词的排序权重;
如果所述用户词的环境类别为特定环境,并且所述候选词的环境类别与所述用户词的环境类别相同,则根据所述用户词的属性信息调整所述用户词的排序权重。
可选地,所述方法还包括:
根据所述用户的历史输入信息建立所述用户词库,所述历史输入信息包括:用户词的词频信息、时间信息、环境信息;所述环境信息包括:语言环境、和/或应用环境。
可选地,所述特定环境包括以下任意一种或多种:固定上文环境、固定应用环境;
所述方法还包括按照以下方式确定所述用户词的特定环境:
统计所述用户词的使用频次以及所述用户词与特定上文的二元共现次数N,如果所述共现次数N与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定上下文环境;
统计所述用户词的使用频次以及在特定应用环境下所述用户词的共现次数M,如果所述共现次数M与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定应用环境。
可选地,所述方法还包括:
根据所述用户词的排序权重及其通用词频信息对所述候选词进行排序,所述用户词的通用词频信息是指所述用户词在通用词库中的词频信息;
根据排序结果输出所述候选词。
可选地,所述方法还包括:
如果所述候选词为用户词并且所述用户词的环境类别为特定环境,则生成符合所述特定环境的联想候选词;
输出所述联想候选词。
一种用户词库管理装置,所述装置包括:
记录模块,用于记录用户历史输入信息;
用户词获取模块,用于根据所述用户历史输入信息获取用户词及其属性信息;
环境类别确定模块,用于确定所述用户词的环境类别,所述环境类别包括:特定环境、普通环境;
词库维护模块,用于将所述用户词及其属性信息、环境类别添加到用户词库中。
可选地,所述历史输入信息包括:用户词的词频信息、时间信息、环境信息;所述环境信息包括:语言环境、和/或应用环境;
所述环境类别确定模块,具体用于对所述用户历史输入信息进行统计或聚类,得到所述用户词的环境类别。
可选地,所述特定环境包括以下任意一种或多种:固定上文环境、固定应用环境;
所述环境类别确定模块按照以下方式确定所述用户词的特定环境:
统计所述用户词的使用频次以及所述用户词与特定上文的二元共现次数N,如果所述共现次数N与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定上下文环境;
统计所述用户词的使用频次以及在特定应用环境下所述用户词的共现次数M,如果所述共现次数M与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定应用环境。
可选地,所述属性信息包括:词频信息、时间信息。
可选地,所述词库维护模块,还用于对所述用户词库进行实时更新或间隔一定时间更新。
一种输入装置,所述装置包括:候选词获取模块、第一判断模块、环境信息获取模块、权重调整模块、环境确定模块、第二判断模块;
所述候选词获取模块,用于获取与用户的输入信息相匹配的候选词;
所述第一判断模块,用于确定所述候选词是否为用户词库中的用户词;所述用户词库包括:用户词及其属性信息、环境类别,所述环境类别包括:特定环境、普通环境;
所述环境信息获取模块,用于获取所述用户词的环境类别;
所述权重调整模块,用于在所述用户词的环境类别为普通环境时,根据所述用户词的属性信息调整所述用户词的排序权重;
所述环境确定模块,用于在所述用户词的环境类别为特定环境时,确定所述候选词的环境类别;
所述第二判断模块,用于确定所述候选词的环境类别与所述用户词的环境类别是否相同,并在相同时触发所述权重调整模块根据所述用户词的属性信息调整所述用户词的排序权重。
可选地,所述装置还包括:
用户词库管理模块,用于根据所述用户的历史输入信息建立所述用户词库,所述历史输入信息包括:用户词的词频信息、时间信息、环境信息;所述环境信息包括:语言环境、和/或应用环境。
可选地,所述词库管理模块,还用于对所述用户词库进行实时更新或间隔一定时间更新。
可选地,所述特定环境包括以下任意一种或多种:固定上文环境、固定应用环境;
所述词库管理模块按照以下方式确定所述用户词的特定环境:
统计所述用户词的使用频次以及所述用户词与特定上文的二元共现次数N,如果所述共现次数N与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定上下文环境;
统计所述用户词的使用频次以及在特定应用环境下所述用户词的共现次数M,如果所述共现次数M与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定应用环境。
可选地,所述装置还包括:
排序模块,用于根据所述用户词的排序权重及其通用词频信息对所述候选词进行排序,所述用户词的通用词频信息是指所述用户词在通用词库中的词频信息;
输出模块,用于根据排序结果输出所述候选词。
可选地,所述装置还包括:
联想候选词生成模块,用于在所述环境信息获取模块获取到的所述用户词的环境类别为特定环境时,生成符合所述特定环境的联想候选词;
所述输出模块,还用于输出所述联想候选词。
一种电子设备,包括:一个或多个处理器、存储器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现前面所述的方法。
一种可读存储介质,其上存储有指令,所述指令被执行以实现前面所述的方法。
本发明实施例提供的用户词库管理方法及装置,在用户词库中增加用户词的环境类别信息,以区别不同环境应用中的用户词,使用户词库中的信息可以更好地适应不同的输入环境。
进一步地,基于该用户词库,本发明实施例还提供一种输入方法及装置,在根据用户词库得到候选词后,根据该候选词的当前环境类别及对应的用户词库中用户词的环境类别,对该候选词的排序权重进行调整,从而使其排序权重与当前输入环境相适配,进而根据候选词的排序权重及其通用词频信息对候选词进行排序,根据排序结果输出候选词,使输出的候选词更准确,有效提高了输入法的智能性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本发明实施例词库管理方法的一种流程图;
图2是本发明实施例词库管理方法的一种结构示意图;
图3是本发明实施例输入方法的一种流程图;
图4是本发明实施例输入装置的一种结构示意图;
图5是本发明实施例输入装置的另一种结构示意图;
图6是根据一示例性实施例示出的一种用于输入方法的装置的框图;
图7是本发明实施例中服务器的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施方式对本发明实施例作进一步的详细说明。
针对现有输入法的用户词库中的信息不能很好地满足不同输入环境下的候选词排序需求、影响用户体验的问题,本发明实施例提供一种用户词库管理方法及装置,在用户词库中增加用户词的环境类别信息,以区别不同环境应用中的用户词,使用户词库中的信息可以更好地适应不同的输入环境。进一步地,基于该用户词库,本发明实施例还提供一种输入方法及***,在根据用户词库得到候选词后,根据该候选词的当前环境类别及对应的用户词库中用户词的环境类别,对该候选词的排序权重进行调整,然后根据所述候选词的排序权重及其通用词频信息对候选词进行排序,使排序结果与当前输入环境更适配,根据排序结果输出候选词,从而可以使输出的候选词更准确,有效提高了输入法的智能性。
如图1所示,是本发明实施例词库管理方法的流程图,包括以下步骤:
步骤101,根据用户历史输入信息获取用户词及其属性信息。
在输入法领域,对于中文、日文、韩文等文字,都是将用户的输入编码转换成相应语言的文字,得到相应的候选词,然后由用户来选择输出的内容,即上屏内容。候选词的顺序通常是根据其词频等信息来确定。
为了提高用户输入效率,通常会记录用户的历史输入信息,所述历史输入信息主要有:用户输入的已有字词及相应的属性信息,还可以包括用户输入的自造字词及相应的属性信息;所述属性信息比如可以包括:用户词的词频信息、时间信息等。所述词频是指词或单字的使用频次,具体可以是绝对词频、或者相对词频、或者是能够间接表示该词或单字使用频次的其它数值。
根据上述这些历史输入信息,将上屏内容学习或更新到用户词库中。相应地,所述用户在后续输入时,输入法应用程序首先会从用户词库中查找与输入编码字符串相匹配的词条即用户词,对命中的用户词根据其词频及时间等属性信息进行排序。
在本发明实施例中,所述用户词的属性信息可以包括:用户词的词频信息、时间信息等一些常规信息,根据实际应用需要,还可以包括一些其它属性信息,对此本发明不做限定。
与常规现有技术不同的是,在本发明实施例中,需要记录的历史输入信息不仅包括:用户词的词频信息、时间信息等一些现有技术中的常规信息,还需要记录所述用户词的环境信息;所述环境信息包括:语言环境、和/或应用环境。其中所述语言环境主要是指所述用户词上文的语法特征,比如上文的词性、类别等;所述应用环境主要是指用户输入所处的具体应用类别。
步骤102,确定所述用户词的环境类别。
在本发明实施例中,可以将所述环境类别划分为两大类,即:特定环境和普通环境,将特定环境之外的其它环境都作为普通环境;而特定环境又可以从不同角度来划分,可以包括一种或多种,比如,固定上文环境、固定应用环境等。所述固定上文环境是指用户词的上文是固定的某一类词,而非任意词,比如:“号楼”前需要搭配数量词;所述固定应用环境是指当前的应用是某个特定的应用,比如搜索软件、文本处理软件、聊天软件、通讯软件等应用。
对于每个具体应用,可以通过相应的***函数、当前应用程序的接口等,获取相关信息,根据这些相关信息得到当前应用的类型,进而可以得到所述用户词的环境是否为固定应用环境。
比如,在Windows操作***中,可以通过调用***函数GetModuleFilename获得应用程序路径名,进而得到当前输入所在的文件名,比如其文件名为“WinWord.exe”,根据该文件名的格式即可知道当前应用为文本处理软件。
再比如,利用当前应用程序的接口,可以得到网页浏览器的COM对象,从而得到当前页面的URL(Uniform Resource Location,统一资源定位符)或者文本内容等信息,根据这些信息即可知道当前应用为网页搜索。
在实际应用中,可以通过对所述用户历史输入信息进行统计或聚类,得到所述用户词的环境类别。
比如将用户词使用的场景分为两类:固定上文环境、固定应用环境,利用统计方式,统计一段时间(比如1天)内用户词的使用环境信息:
对于固定上文环境,统计某用户词的使用频次以及该用户词与特定上文的二元共现次数N,若N与所述用户词的使用频次的比值大于设定值(比如80%),则该用户词的环境类别为固定上文环境;
对于固定应用环境,统计某用户词的使用频次以及在某特定应用环境下该用户词的共现次数,如果所述共现次数与所述用户词的使用频次的比值大于设定值,则该用户词的环境类别为固定应用环境。
需要说明的是,每个用户词对应的环境类别可以有一种或多种,比如,用户在聊天中经常会提到叫外卖,则根据用户历史输入信息可以得到用户词“外卖”,其对应的环境类别为“固定上文环境”及“固定应用环境”。
步骤103,将所述用户词及其属性信息、环境类别添加到用户词库中。
需要说明的是,在用户输入过程中,根据上屏内容,用户词库会不断更新,具体可以是实时更新,也可以是间隔一定时间更新。另外,依据本发明实施例得到的用户词库,其中的环境类别的划分可以随着数据的增加或者实际应用的变化而变化。
本发明实施例提供的用户词库管理方法,在用户词库中增加用户词的环境类别信息,以区别不同环境应用中的用户词,使用户词库中的信息可以更好地适应不同的输入环境,进而在用户输入过程中,可以使输出的候选词的排序与当前输入环境更匹配,便于用户得到输入所需的对象。
本发明所述的词库管理方法可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类别的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明方法,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
相应地,本发明实施例还提供一种用户词库管理装置,如图2所示,是该装置的一种结构示意图。
在该实施例中,所述装置包括以下各模块:
记录模块201,用于记录用户历史输入信息;
用户词获取模块202,用于根据所述用户历史输入信息获取用户词及其属性信息;
环境类别确定模块203,用于确定所述用户词的环境类别,所述环境类别包括:特定环境、普通环境;
词库维护模块204,用于将所述用户词及其属性信息、环境类别添加到用户词库中。
在本发明实施例中,所述记录模块201记录的用户历史输入信息不仅包括用户词及其属性信息,比如词频信息、时间信息等一些现有技术中的常规信息,还需要记录所述用户词的环境信息;所述环境信息包括:语言环境、和/或应用环境。其中所述语言环境主要是指所述用户词上文的语法特征,比如上文的词性、类别等;所述应用环境主要是指用户输入所处的具体应用类别。应用环境的确定可以通过相应的***函数、当前应用程序的接口等,获取相关信息,根据这些信息来确定。
相应地,所述环境类别确定模块203在确定所述用户词的环境类别时,可以根据所述用户历史输入信息,得到每个用户词的环境信息,然后对每条记录进行统计或聚类,得到所述用户词的环境类别。
在本发明实施例中,可以将所述环境类别划分为两大类,即:特定环境和普通环境,将特定环境之外的其它环境都作为普通环境;而特定环境又可以从不同角度来划分,可以包括一种或多种,比如,固定上文环境、固定应用环境等。所述固定上文环境是指用户词的上文是固定的某一类词,而非任意词;所述固定应用环境是指当前的应用是某个特定的应用,比如搜索软件、文本处理软件、聊天软件、通讯软件等应用。
相应地,所述环境类别确定模块203可以按照以下方式确定所述用户词的特定环境:
统计所述用户词的使用频次以及所述用户词与特定上文的二元共现次数N,如果所述共现次数N与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定上下文环境;
统计所述用户词的使用频次以及在特定应用环境下所述用户词的共现次数M,如果所述共现次数M与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定应用环境。
需要说明的是,在用户输入过程中,所述词库维护模块204还会对所述用户词库进行实时更新或间隔一定时间更新或者满足一定条件后更新。另外,依据本发明实施例得到的用户词库,其中的环境类别的划分可以随着数据的增加或者实际应用的变化而变化。
需要说明的是,本发明实施例提供的词库管理方法及装置,可以应用于各种输入方式的输入法平台,包括键盘输入、手写输入以及语音输入等等,也就是说,输入信息可以包括编码字符串、手写输入信息、语音输入的信息。无论哪种输入法平台,都需要用到词库对候选项进行排序。由于这些输入方式中的信息转换都属于公知技术,在此不做详细描述。
另外,由于现有技术中,输入法平台可以运行在多种计算设备上,例如,个人电脑、个人数字助理、移动终端设备等等,所以本发明也可以适用在上述各种计算设备中。
本发明实施例提供的词库管理方法及装置,不仅可以应用于中文的输入法***,还可以应用于日文、韩文等需要出现候选词排序的输入法***,例如,对于日文而言,由日文中的平假名、片假名拼成短语的时候就需要出现候选词排序。
进一步地,基于上述用户词库,本发明实施例还提供一种输入方法及***,在根据用户词库得到候选词后,根据该候选词的当前环境类别及对应的用户词库中用户词的环境类别,对该候选词的排序权重进行调整。
本发明实施例提供的输入方法可以应用在电子设备中,所述电子设备可以包括但不限于智能手机、平板电脑、便携式计算机和台式计算机等。所述电子设备接收用户的输入信息,在预先建立的用户词库中查询与所述输入信息匹配的候选词,然后根据用户词的属性信息计算所述候选词的排序权重,对候选词进行排序输出。
如图3所示,是本发明实施例输入方法的一种流程图,包括以下步骤:
步骤301,获取与用户的输入信息相匹配的候选词。
用户的输入信息可以是用户输入的编码字符串。
候选词的获取通过可以通过查找用户词库及通用词库来得到。当然,在实际应用中,还可根据应用需要,设置其它词库,对此本发明实施例不做限定。
步骤302,确定所述候选词是否为用户词库中的用户词;如果是,则执行步骤303;否则,执行步骤307。
在本发明实施例中,所述用户词库包括:用户词及其属性信息、环境类别,所述环境类别包括:特定环境、普通环境。所述特定环境又可细分为:固定上文环境、固定应用环境等。用户词库的各种信息的含义及如何获取在前面已有详细说明,在此不再赘述。
其中,对于所述用户词的特定环境类别,可以按照以下方式来确定:
统计所述用户词的使用频次以及所述用户词与特定上文的二元共现次数N,如果所述共现次数N与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定上下文环境;
统计所述用户词的使用频次以及在特定应用环境下所述用户词的共现次数M,如果所述共现次数M与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定应用环境。
步骤303,获取所述用户词的环境类别。如果所述用户词的环境类别为普通环境,则执行步骤306;如果所述用户词的环境类别为特定环境,则执行步骤304。
所述用户词的环境类别是指用户词库中该用户词所属的环境类别,一个用户词所属的环境类别可以有一种或多种。
步骤304,确定所述候选词的环境类别。
所述候选词的环境类别是指当前输入的环境类别,比如可以根据当前输入的上文确定当前环境类别是否为固定上文环境,再比如可以通过相应的***函数、当前应用程序的接口等,获取相关信息,根据这些相关信息得到当前应用的类型,进而可以得到所述用户词的环境是否为固定应用环境。
步骤305,确定所述候选词的环境类别是否与所述用户词的环境类别相同;如果相同,则执行步骤306;否则,执行步骤307。
步骤306,根据所述用户词的属性信息调整所述用户词的排序权重。
在本发明实施例中,所述用户词的排序权重的确定可以采用现有的一些算法及方式,比如,综合考虑词频及时间信息来确定用户词的排序权重,使用时间离当前时间越近、使用频次越多即词频越高的越排在前面。当然,在实际应用中,对排序权重的计算还可以综合考虑其它参数,对此本发明实施例不做限定。
步骤307,结束。
可见,在本发明实施例提供的输入方法中,在根据用户词库得到候选词后,不是按照现有技术中对所有用户词同等对待,即采用相同方式调整其排序权重,而是基于用户词的环境类别,对普通环境类别和特定环境类别的用户词的排序权重采用不同的方式调整其排序权重。具体地,对于普通环境类别的用户词,每次均进行调整;对于特定环境类别的用户词,只在该特定环境的情况下进行调整,比如,如果该用户词属于固定上文环境类别,那么只在特定上文的情况下重新计算其排序权重;如果该用户词属于固定应用环境类别,那么只在特定应用环境的情况下重新计算其排序权重。通过这样的处理,可以使候选词的排序权重与当前输入环境相适配,进而根据候选词的排序权重对候选词进行排序,根据排序结果输出候选词,使输出的候选词更准确,有效提高了输入法的智能性。
比如,用户在地图应用环境下简拼输入“xtq”,得到用户词“炫特区”。在现有技术中,只要用户输入“xtq”,则无论在什么环境下候选词“炫特区”都会排在比较靠前的位置;而利用本发明方案,其于用户词“炫特区”的环境类别,只有在地图环境下该候选词才会调整到比较靠前的位置。
需要说明的是,在实际应用中,对所述候选词进行排序并根据排序结果输出所述候选词时,如果所述候选词是用户词,可以只考虑该用户词的排序权重,也可以综合考虑所述用户词的排序权重及其通用词频信息对所述候选词进行排序,所述用户词的通用词频信息是指所述用户词在通用词库中的词频信息,对此本发明实施例不做限定。另外,根据排序结果输出所述候选词。
进一步地,在实际应用中,如果所述候选词为用户词并且所述用户词的环境类别为特定环境,还可以进一步生成符合该特定环境的联想候选词并输出所述联想候选词。
相应地,本发明实施例还提供一种输入装置,如图4所示,是本发明实施例输入装置的一种结构示意图。
在该实施例中,所述输入装置包括:候选词获取模块401、第一判断模块402、环境信息获取模块403、权重调整模块404、环境确定模块405、第二判断模块406。其中:
所述候选词获取模块401用于获取与用户的输入信息相匹配的候选词;
所述第一判断模块402用于确定所述候选词是否为用户词库中的用户词;
所述环境信息获取模块403用于获取所述用户词的环境类别,即在用户词库中记录的该用户词所属的环境类别;
所述权重调整模块404用于在所述用户词的环境类别为普通环境时,根据所述用户词的属性信息调整所述用户词的排序权重;
所述环境确定模块405用于在所述用户词的环境类别为特定环境时,确定所述候选词的环境类别;
所述第二判断模块406用于确定所述候选词的环境类别与所述用户词的环境类别是否相同,并在相同时触发所述权重调整模块404根据所述用户词的属性信息调整所述用户词的排序权重。
上述候选词获取模块401用于具体可以通过查找用户词库及通用词库获取与用户的输入信息相匹配的候选词。当然,在实际应用中,还可根据应用需要,设置其它词库,对此本发明实施例不做限定。
在本发明实施例中,所述用户词库与现有技术中常规的用户词库不同,主要体现在本发明实施例的用户词库中,不仅包括用户词及其常规属性信息比如用户词的词频信息、时间信息等,而且还包括用户词的环境类别信息,所述环境类别包括:特定环境、普通环境;所述特定环境又可细分为:固定上文环境、固定应用环境等。用户词库的各种信息的含义及如何获取在前面已有详细说明,在此不再赘述。
需要说明的是,在用户词库中,每个用户词所属的环境类别可以有一种或多种。
所述用户词库可以由用户词库管理模块(未图示)来建立并更新,具体地,所述用户词库管理模块根据所述用户的历史输入信息建立所述用户词库,所述历史输入信息包括:用户词的词频信息、时间信息、环境信息;所述环境信息包括:语言环境、和/或应用环境。
对于所述用户词的特定环境类别,所述词库管理模块可以按照以下方式确定:
统计所述用户词的使用频次以及所述用户词与特定上文的二元共现次数N,如果所述共现次数N与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定上下文环境;
统计所述用户词的使用频次以及在特定应用环境下所述用户词的共现次数M,如果所述共现次数M与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定应用环境。
所述词库管理模块对所述用户词的更新可以实时进行,或者间隔一定时间进行,或者在满足设定条件(比如新的历史记录达到一定数量时)等情况下进行。
上述环境确定模块405具体可以根据当前输入的上文确定当前环境类别是否为固定上文环境,再比如可以通过相应的***函数、当前应用程序的接口等,获取相关信息,根据这些相关信息得到当前应用的类型,进而可以得到所述用户词的环境是否为固定应用环境。
上述权重调整模块404可以采用现有的一些算法及方式计算所述用户词的排序权重,比如,综合考虑词频及时间信息来确定用户词的排序权重,使用时间离当前时间越近、使用频次越多即词频越高的越排在前面。当然,在实际应用中,对排序权重的计算还可以综合考虑其它参数,对此本发明实施例不做限定。
如图5所示,是本发明实施例输入装置的另一种结构示意图。
在该实施例中,所述输入装置不仅包括上述候选词获取模块401、第一判断模块402、环境信息获取模块403、权重调整模块404、环境确定模块405、第二判断模块406,还包括排序模块407和输出模块408。其中:
所述排序模块407用于根据所述用户词的排序权重及其通用词频信息对所述候选词进行排序,所述用户词的通用词频信息是指所述用户词在通用词库中的词频信息;
所述输出模块408用于根据排序结果输出所述候选词。
在本发明输入装置的另一实施例中,还可包括联想候选词生成模块(未图示),用于在所述环境信息获取模块403获取到的所述用户词的环境类别为特定环境时,生成符合所述特定环境的联想候选词。相应地,所述输出模块408还用于输出所述联想候选词。
本发明实施例提供的输入装置,在根据用户词库得到候选词后,根据该候选词的当前环境类别及对应的用户词库中用户词的环境类别,对该候选词的排序权重进行调整,从而使其排序权重与当前输入环境相适配,进而根据候选词的排序权重及其通用词频信息对候选词进行排序,根据排序结果输出候选词,使输出的候选词更准确,有效提高了输入法的智能性。
需要说明的是,本发明实施例提供的输入方法及装置,可以应用于各种输入方式的输入法平台,包括键盘输入、手写输入以及语音输入等等,也就是说,输入信息可以包括编码字符串、手写输入信息、语音输入的信息。无论哪种输入法平台,都需要用到词库对候选项进行排序。
另外,由于现有技术中,输入法平台可以运行在多种计算设备上,例如,个人电脑、个人数字助理、移动终端设备等等,所以本发明实施例提供的输入方法及装置也可以适用在上述各种计算设备中。
本发明实施例提供的词库管理方法及装置,不仅可以应用于中文的输入法***,还可以应用于日文、韩文等需要出现候选词排序的输入法***,例如,对于日文而言,由日文中的平假名、片假名拼成短语的时候就需要出现候选词排序。
图6是根据一示例性实施例示出的一种输入方法的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图6,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理部件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类别的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类别的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件806为装置800的各种组件提供电力。电力组件806可以包括电源管理***,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件816经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述按键误触纠错方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本发明还提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行上述本发明方法实施例中的全部或部分步骤。
图7是本发明实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以***处理器(Central Processing Units,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作***1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (18)

1.一种用户词库管理方法,其特征在于,所述方法包括:
根据用户历史输入信息获取用户词及其属性信息;
确定所述用户词的环境类别,所述环境类别包括:特定环境、普通环境,所述特定环境包括以下任意一种或多种:固定上文环境、固定应用环境,所述用户词的特定环境采用包括下述的方式确定:
统计所述用户词的使用频次以及所述用户词与特定上文的二元共现次数N,如果所述共现次数N与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定上下文环境;
统计所述用户词的使用频次以及在特定应用环境下所述用户词的共现次数M,如果所述共现次数M与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定应用环境;
将所述用户词及其属性信息、环境类别添加到用户词库中。
2.根据权利要求1所述的方法,其特征在于,所述历史输入信息包括:用户词的词频信息、时间信息、环境信息;所述环境信息包括:语言环境、和/或应用环境;
所述确定所述用户词的环境类别包括:
对所述用户历史输入信息进行统计或聚类,得到所述用户词的环境类别。
3.根据权利要求1至2任一所述的方法,其特征在于,所述属性信息包括:词频信息、时间信息。
4.一种输入方法,其特征在于,所述方法包括:
获取与用户的输入信息相匹配的候选词;
确定所述候选词是否为用户词库中的用户词;所述用户词库包括:用户词及其属性信息、环境类别,所述环境类别包括:特定环境、普通环境,所述特定环境包括以下任意一种或多种:固定上文环境、固定应用环境;
如果是,则获取所述用户词的环境类别;
如果所述用户词的环境类别为普通环境,则根据所述用户词的属性信息调整所述用户词的排序权重;
如果所述用户词的环境类别为特定环境,并且所述候选词的环境类别与所述用户词的环境类别相同,则根据所述用户词的属性信息调整所述用户词的排序权重,其中,所述用户词的特定环境采用包括下述的方式确定:
统计所述用户词的使用频次以及所述用户词与特定上文的二元共现次数N,如果所述共现次数N与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定上下文环境;
统计所述用户词的使用频次以及在特定应用环境下所述用户词的共现次数M,如果所述共现次数M与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定应用环境。
5.根据权利要求4所述的输入方法,其特征在于,所述方法还包括:
根据所述用户的历史输入信息建立所述用户词库,所述历史输入信息包括:用户词的词频信息、时间信息、环境信息;所述环境信息包括:语言环境、和/或应用环境。
6.根据权利要求4至5任一所述的输入方法,其特征在于,所述方法还包括:
根据所述用户词的排序权重及其通用词频信息对所述候选词进行排序,所述用户词的通用词频信息是指所述用户词在通用词库中的词频信息;
根据排序结果输出所述候选词。
7.根据权利要求6所述的输入方法,其特征在于,所述方法还包括:
如果所述候选词为用户词并且所述用户词的环境类别为特定环境,则生成符合所述特定环境的联想候选词;
输出所述联想候选词。
8.一种用户词库管理装置,其特征在于,所述装置包括:
记录模块,用于记录用户历史输入信息;
用户词获取模块,用于根据所述用户历史输入信息获取用户词及其属性信息;
环境类别确定模块,用于确定所述用户词的环境类别,所述环境类别包括:特定环境、普通环境,所述特定环境包括以下任意一种或多种:固定上文环境、固定应用环境,所述用户词的特定环境为环境确定模块采用包括下述的方式确定:
统计所述用户词的使用频次以及所述用户词与特定上文的二元共现次数N,如果所述共现次数N与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定上下文环境;
统计所述用户词的使用频次以及在特定应用环境下所述用户词的共现次数M,如果所述共现次数M与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定应用环境;
词库维护模块,用于将所述用户词及其属性信息、环境类别添加到用户词库中。
9.根据权利要求8所述的装置,其特征在于,所述历史输入信息包括:用户词的词频信息、时间信息、环境信息;所述环境信息包括:语言环境、和/或应用环境;
所述环境类别确定模块,具体用于对所述用户历史输入信息进行统计或聚类,得到所述用户词的环境类别。
10.根据权利要求8所述的装置,其特征在于,所述属性信息包括:词频信息、时间信息。
11.根据权利要求8至10任一项所述的装置,其特征在于,所述词库维护模块,还用于对所述用户词库进行实时更新或间隔一定时间更新。
12.一种输入装置,其特征在于,所述装置包括:候选词获取模块、第一判断模块、环境信息获取模块、权重调整模块、环境确定模块、第二判断模块;
所述候选词获取模块,用于获取与用户的输入信息相匹配的候选词;
所述第一判断模块,用于确定所述候选词是否为用户词库中的用户词;所述用户词库包括:用户词及其属性信息、环境类别,所述环境类别包括:特定环境、普通环境,所述特定环境包括以下任意一种或多种:固定上文环境、固定应用环境;
所述环境信息获取模块,用于获取所述用户词的环境类别;
所述权重调整模块,用于在所述用户词的环境类别为普通环境时,根据所述用户词的属性信息调整所述用户词的排序权重;
所述环境确定模块,用于在所述用户词的环境类别为特定环境时,确定所述候选词的环境类别,其中,所述用户词的特定环境为所述环境确定模块采用包括下述的方式确定:
统计所述用户词的使用频次以及所述用户词与特定上文的二元共现次数N,如果所述共现次数N与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定上下文环境;
统计所述用户词的使用频次以及在特定应用环境下所述用户词的共现次数M,如果所述共现次数M与所述用户词的使用频次的比值大于设定值,则确定所述用户词的环境类别为固定应用环境;
所述第二判断模块,用于确定所述候选词的环境类别与所述用户词的环境类别是否相同,并在相同时触发所述权重调整模块根据所述用户词的属性信息调整所述用户词的排序权重。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
用户词库管理模块,用于根据所述用户的历史输入信息建立所述用户词库,所述历史输入信息包括:用户词的词频信息、时间信息、环境信息;所述环境信息包括:语言环境、和/或应用环境。
14.根据权利要求13所述的装置,其特征在于,所述词库管理模块,还用于对所述用户词库进行实时更新或间隔一定时间更新。
15.根据权利要求12至14任一项所述的装置,其特征在于,所述装置还包括:
排序模块,用于根据所述用户词的排序权重及其通用词频信息对所述候选词进行排序,所述用户词的通用词频信息是指所述用户词在通用词库中的词频信息;
输出模块,用于根据排序结果输出所述候选词。
16.根据权利要求15所述的装置,其特征在于,所述装置还包括:
联想候选词生成模块,用于在所述环境信息获取模块获取到的所述用户词的环境类别为特定环境时,生成符合所述特定环境的联想候选词;
所述输出模块,还用于输出所述联想候选词。
17.一种电子设备,其特征在于,包括:一个或多个处理器、存储器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现如权利要求4至7任一项所述的方法。
18.一种可读存储介质,其上存储有指令,所述指令被执行以实现如权利要求4至7任一项所述的方法。
CN201811256879.0A 2018-10-26 2018-10-26 用户词库管理方法及装置、输入方法及装置 Active CN111103986B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811256879.0A CN111103986B (zh) 2018-10-26 2018-10-26 用户词库管理方法及装置、输入方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811256879.0A CN111103986B (zh) 2018-10-26 2018-10-26 用户词库管理方法及装置、输入方法及装置

Publications (2)

Publication Number Publication Date
CN111103986A CN111103986A (zh) 2020-05-05
CN111103986B true CN111103986B (zh) 2023-11-14

Family

ID=70418466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811256879.0A Active CN111103986B (zh) 2018-10-26 2018-10-26 用户词库管理方法及装置、输入方法及装置

Country Status (1)

Country Link
CN (1) CN111103986B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112395044B (zh) * 2020-11-10 2023-04-28 新华三技术有限公司合肥分公司 命令行关键词填充方法、装置及网络设备

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271459A (zh) * 2007-03-22 2008-09-24 北京搜狗科技发展有限公司 一种生成词库的方法、一种输入的方法和一种输入法***
CN101388011A (zh) * 2007-09-13 2009-03-18 北京搜狗科技发展有限公司 一种向用户词库中记录信息的方法和装置
CN101398834A (zh) * 2007-09-29 2009-04-01 北京搜狗科技发展有限公司 一种针对输入信息的处理方法和装置及一种输入法***
JP2010257392A (ja) * 2009-04-28 2010-11-11 Sharp Corp 文字入力装置、文字入力方法、コンピュータ読取可能なプログラムおよび記録媒体
CN102207816A (zh) * 2010-07-16 2011-10-05 北京搜狗科技发展有限公司 一种基于输入环境进行适配输入的方法和输入法***
CN102646022A (zh) * 2012-04-10 2012-08-22 北京搜狗科技发展有限公司 一种获取候选项的方法和装置
CN103376909A (zh) * 2012-04-19 2013-10-30 腾讯科技(深圳)有限公司 输入法中调整候选词顺序的方法和***
CN103956169A (zh) * 2014-04-17 2014-07-30 北京搜狗科技发展有限公司 一种语音输入方法、装置和***
CN104317851A (zh) * 2014-10-14 2015-01-28 小米科技有限责任公司 词汇提示方法和装置
CN106708282A (zh) * 2015-12-02 2017-05-24 北京搜狗科技发展有限公司 一种推荐方法和装置、一种用于推荐的装置
CN107102746A (zh) * 2016-02-19 2017-08-29 北京搜狗科技发展有限公司 候选词生成方法、装置以及用于候选词生成的装置
CN108427508A (zh) * 2017-02-15 2018-08-21 北京搜狗科技发展有限公司 输入方法和装置、建立局域网词库的方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105204617B (zh) * 2007-04-11 2018-12-14 谷歌有限责任公司 用于输入法编辑器集成的方法和***

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271459A (zh) * 2007-03-22 2008-09-24 北京搜狗科技发展有限公司 一种生成词库的方法、一种输入的方法和一种输入法***
CN101388011A (zh) * 2007-09-13 2009-03-18 北京搜狗科技发展有限公司 一种向用户词库中记录信息的方法和装置
CN101398834A (zh) * 2007-09-29 2009-04-01 北京搜狗科技发展有限公司 一种针对输入信息的处理方法和装置及一种输入法***
JP2010257392A (ja) * 2009-04-28 2010-11-11 Sharp Corp 文字入力装置、文字入力方法、コンピュータ読取可能なプログラムおよび記録媒体
CN102207816A (zh) * 2010-07-16 2011-10-05 北京搜狗科技发展有限公司 一种基于输入环境进行适配输入的方法和输入法***
CN102646022A (zh) * 2012-04-10 2012-08-22 北京搜狗科技发展有限公司 一种获取候选项的方法和装置
CN103376909A (zh) * 2012-04-19 2013-10-30 腾讯科技(深圳)有限公司 输入法中调整候选词顺序的方法和***
CN103956169A (zh) * 2014-04-17 2014-07-30 北京搜狗科技发展有限公司 一种语音输入方法、装置和***
CN104317851A (zh) * 2014-10-14 2015-01-28 小米科技有限责任公司 词汇提示方法和装置
CN106708282A (zh) * 2015-12-02 2017-05-24 北京搜狗科技发展有限公司 一种推荐方法和装置、一种用于推荐的装置
CN107102746A (zh) * 2016-02-19 2017-08-29 北京搜狗科技发展有限公司 候选词生成方法、装置以及用于候选词生成的装置
CN108427508A (zh) * 2017-02-15 2018-08-21 北京搜狗科技发展有限公司 输入方法和装置、建立局域网词库的方法和装置

Also Published As

Publication number Publication date
CN111103986A (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
CN107102746B (zh) 候选词生成方法、装置以及用于候选词生成的装置
CN107608532B (zh) 一种联想输入方法、装置及电子设备
CN107247519B (zh) 一种输入方法及装置
CN107340880B (zh) 一种联想输入方法、装置及用于实现联想输入的电子设备
CN107918496B (zh) 一种输入纠错方法和装置、一种用于输入纠错的装置
US10802605B2 (en) Input method, device, and electronic apparatus
CN107564526B (zh) 处理方法、装置和机器可读介质
CN110069143B (zh) 一种信息防误纠方法、装置和电子设备
CN109521888B (zh) 一种输入方法、装置和介质
CN111103986B (zh) 用户词库管理方法及装置、输入方法及装置
CN110795014A (zh) 一种数据处理方法、装置和用于数据处理的装置
CN109901726B (zh) 一种候选词生成方法、装置及用于候选词生成的装置
CN109144286B (zh) 一种输入方法及装置
CN112083811B (zh) 一种候选项展示方法和装置
CN110633017A (zh) 一种输入方法、装置和用于输入的装置
CN109388252B (zh) 一种输入方法及装置
CN114115550A (zh) 联想候选的处理方法、装置和用于处理联想候选的装置
CN112181163A (zh) 一种输入方法、装置和用于输入的装置
CN109426359B (zh) 一种输入方法、装置以及机器可读介质
CN112306251A (zh) 一种输入方法、装置和用于输入的装置
CN113741783B (zh) 按键识别方法、装置和用于识别按键的装置
CN113407099A (zh) 输入方法、装置和机器可读介质
CN113534973B (zh) 输入方法、装置和用于输入的装置
CN113807082B (zh) 一种目标用户确定方法、装置和用于确定目标用户的装置
CN111382566B (zh) 一种站点主题的确定方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant