CN103886043B - 一种展现候选项的方法及装置 - Google Patents

一种展现候选项的方法及装置 Download PDF

Info

Publication number
CN103886043B
CN103886043B CN201410088127.3A CN201410088127A CN103886043B CN 103886043 B CN103886043 B CN 103886043B CN 201410088127 A CN201410088127 A CN 201410088127A CN 103886043 B CN103886043 B CN 103886043B
Authority
CN
China
Prior art keywords
cloud
local
candidate
word
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410088127.3A
Other languages
English (en)
Other versions
CN103886043A (zh
Inventor
叶樉
汤沛
何立涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201410088127.3A priority Critical patent/CN103886043B/zh
Publication of CN103886043A publication Critical patent/CN103886043A/zh
Application granted granted Critical
Publication of CN103886043B publication Critical patent/CN103886043B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

本申请提供了一种展现候选项的方法及装置,其中的方法具体包括:对用户输入的输入串进行解析,得到对应的音节序列;依据所述音节序列,在本地云词库中进行查询,得到相应的本地云候选;其中,所述本地云词库存储有依据云服务器发送的云结果进行学词,得到的词条信息及对应的音节信息;对所述本地云候选和本地普通候选进行混合排序;展现所述本地云候选和本地普通候选的混合排序结果。本申请能够大大提升用户的输入效率。

Description

一种展现候选项的方法及装置
技术领域
本申请涉及输入法技术领域,特别是涉及一种展现候选项的方法及装置。
背景技术
传统输入法受限于本地计算机的存储器容量和CPU能力,使用规模较小的词库和语言模型,输入准确率有限。云输入法是依托于云计算技术的输入法,其与传统输入法最明显的区别在于:不需要本地输入法文件而完全靠服务器支持,其凭借服务器集群强大的存储和运算能力,拥有传统输入法所不可比拟的优势:更大、更新的词库,更高级的语言模型,这些优势使得输入的准确率有了显著的提升。目前受到网络传输条件的限制,本地计算机获得云输入法返回结果的速度总是明显慢于本地转换的速度。为了减少云结果滞后给用户带来的等待焦虑以及认知冲突,大多输入法将云结果放在二选位置,但这一做法无疑牺牲了云结果的首选准确率。
为了解决云结果的滞后和首选准确率的矛盾问题,现有一种处理方法为开辟云缓存,将云结果中云候选与对应的输入串保存到该云缓存中,在特定条件下可以将该云缓存中的词条直接放在首选。
参照图1,示出了应用云缓存进行文字输入的方法流程图,具体可以包括:
步骤101、接收用户的输入串;
步骤102、判断该输入串是否满足请求云的条件,若是,则执行步骤103;
通常,请求云的条件为本地词库命中失败。
步骤103、在云缓存中查询该输入串对应的词条;
步骤104、判断是否查询成功,若是,则执行步骤105,否则,执行步骤106;
步骤105、将查询的词条展现在首选;
步骤106、向云服务器请求该输入串对应的云结果;
步骤107、从云服务器返回的云结果中挑选出云候选与对应的输入串保存到该云缓存中。
然而,图1所示技术方案中,输入串需要满足特定条件才能发挥云缓存的作用:首先,应满足请求云的条件,这就要求本地词库没有输入串对应的候选项,其次,输入串必须和曾经请求过云服务器的输入串完全匹配时,才能在云缓存中成功查询该输入串对应的词条,这导致云缓存发挥作用的场景非常有限。
假设输入串为“yihulvc”,若本地词库和云缓存均没有该输入串对应的词条,则会向云服务器请求该输入串对应的云结果,假设云服务器返回了云候选“一壶绿茶”,则“yihulvc”和“一壶绿茶”的对应关系会被保存至该云缓存中;假设此时继续输入,使该输入串变为“yihulvch”,则本地词库和云缓存仍没有当前输入串对应的词条,因此会重新请求云服务器;之后继续输入,使输入串变为“yihulvcha”,同理,也会再重新请求云服务器。上述文字输入过程会带来糟糕的使用体验:输入串为“yihulvc”时用户就已经能在二选位置看到云服务器返回的“一壶绿茶”,输入串为“yihulvch”和“yihulvcha”时,候选项“一壶绿茶”保持不变,且处于第二候选的位置一再刷新,且在完成上屏之前,云服务器返回的云候选“一壶绿茶”始终没有机会出现在首选位置;总之,对于用户而言,既花费了等待云服务器响应的时间,又无法在首选位置看到想要的词条,这严重影响了输入效率。
发明内容
本申请所要解决的技术问题是提供一种展现候选项的方法及装置,能够大大提升用户的输入效率。
为了解决上述问题,本申请公开了一种展现候选项的方法,包括:
对用户输入的输入串进行解析,得到对应的音节序列;
依据所述音节序列,在本地云词库中进行查询,得到相应的本地云候选;其中,所述本地云词库存储有依据云服务器发送的云结果进行学词,得到的词条信息及对应的音节信息;
对所述本地云候选和本地普通候选进行混合排序;
展现所述本地云候选和本地普通候选的混合排序结果。
优选的,所述本地云词库还存储有依据云结果学词得到的词条信息对应的词频信息;
则所述方法还包括:在查询到所述音节序列对应的一个以上本地云候选时,依据各自词频信息选择所述一个以上本地云候选中词频最高的一个;
则所述对所述本地云候选和本地普通候选进行混合排序的步骤为,对所选择的词频最高的一个本地云候选和本地普通候选进行混合排序;
则所述展现所述本地云候选和本地普通候选的混合排序结果的步骤为,展现所选择的词频最高的一个本地云候选和本地普通候选的混合排序结果。
优选的,通过如下步骤生成所述本地云词库:
对每一次云服务器返回的云结果中音节序列和云候选进行学词,并在本地云词库中新增一条数据记录来保存学词得到的音节序列和词条的对应关系,并将该对应关系进行保存,形成本地云词库。
优选的,所述混合排序结果中所述本地云候选排在本地词库候选之后及本地组词候选之前。
优选的,所述方法还包括:
当所述本地云词库中词条数目达到预置门限时,丢弃其中未被查询过且最先存入的词条。
优选的,所述方法还包括:
当输入法的进程关闭后,清空所述本地云词库。
优选的,所述方法还包括:
在未查询到所述音节序列对应的本地云候选时,向云服务器请求所述输入串对应的云结果。
优选的,所述本地普通候选包括:根据本地普通词库得到的本地词库候选和/或智能组词生成的本地组词候选。
另一方面,本申请还公开了一种展现候选项的装置,包括:
解析单元,用于对用户输入的输入串进行解析,得到对应的音节序列;
查询单元,用于依据所述音节序列,在本地云词库中进行查询,得到相应的本地云候选;其中,所述本地云词库存储有依据云服务器发送的云结果进行学词,得到的词条信息及对应的音节信息;
混合排序单元,用于对所述本地云候选和本地普通候选进行混合排序;及
展现单元,用于展现所述本地云候选和本地普通候选的混合排序结果。
优选的,所述本地云词库还存储有依据云结果学词得到的词条信息对应的词频信息;
则所述装置还包括:用于在查询到所述音节序列对应的一个以上本地云候选时,依据各自词频信息选择所述一个以上本地云候选中词频最高的一个的选择单元;
则所述混合排序单元,具体用于对所选择的词频最高的一个本地云候选和本地普通候选进行混合排序;
则所述展现单元,具体用于展现所选择的词频最高的一个本地云候选和本地普通候选的混合排序结果。
优选的,所述装置还包括:用于生成所述本地云词库的生成单元;
所述生成单元包括:
学词子单元,用于对每一次云服务器返回的云结果中音节序列和云候选进行学词;
保存子单元,用于在本地云词库中新增一条数据记录来保存学词得到的音节序列和词条的对应关系,并将该对应关系进行保存,形成本地云词库。
与现有技术相比,本申请具有以下优点:
本申请对云服务器返回的云结果进行学词,并将学习得到的词条信息及音节信息保存至本地云词库中;并且,所述本地云词库的查询可与本地普通词库的查询及本地智能组词同时进行,且依据所述本地云词库查询得到的本地云候选可与本地普通候选一起参与混合排序;
第一,相对于现有技术中需要满足请求云的条件才能触发本地云缓存的查询,本申请中本地云词库的查询没有任何条件限制,可以与本地普通词库的查询及本地智能组词同时进行;因此能够大大提升本地云词库中本地云候选的查询几率及利用率;
第二,现有技术中,云缓存存储的是曾经请求云服务器的输入串和云服务器返回的云候选的对应关系,故欲在云缓存中成功查询该输入串对应的词条,则要求该输入串必须与曾经请求云服务器的输入串完全一致,这导致云缓存发挥作用的场景非常有限;而本申请中,所述本地云词库存储的是依据云结果学词得到的词条信息及音节信息,无需该输入串与曾经请求云服务器的输入串完全一致即可查询成功,因此,能够大大提升输入串对应词条的查询成功率;
第三,依据所述本地云词库查询得到的本地云候选可以与本地普通候选一起参与混合排序,故能够增加大大提升本地云候选项出现在各候选项中首选的概率;
综上,本申请既能够节省等待云服务器响应的时间,又能够大大提升本地云候选项的利用率及出现在首选的概率,因此能够最大限度地提升用户的输入效率。
附图说明
图1是现有技术一种应用云缓存进行文字输入的方法流程图;
图2是本申请一种展现候选项的方法实施例1的流程图;
图3是本申请一种展现候选项的方法实施例2的流程图;
图4是本申请一种展现候选项的方法实施例3的流程图;
图5是本申请一种展现候选项的方法实施例4的流程图;
图6是本申请一种展现候选项的装置实施例的结构图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
本申请实施例对云服务器返回的云结果进行学词,并将学习得到的词条信息及音节信息保存至本地云词库中;并且,在文字输入过程中,所述本地云词库的查询可与本地普通词库的查询及本地智能组词同时进行,且依据所述本地云词库查询得到的本地云候选可与本地普通候选一起参与混合排序;一方面,所述本地云词库的查询没有任何条件的限制,故能够大大提升本地云词库中本地云候选的查询几率及利用率,另一方面,所述本地云词库存储的是依据云结果学词得到的词条信息及音节信息,无需该输入串与曾经请求云服务器的输入串完全一致即可查询成功,因此,能够大大提升本地云词库中词条的查询成功率;综上,本申请既能够节省等待云服务器响应的时间,又能够大大提升本地云候选项的利用率及出现在首选的概率,因此能够最大限度地提升用户的输入效率。
参照图2,示出了本申请一种展现候选项的方法实施例1的流程图,具体可以包括:
步骤201、对用户输入的输入串进行解析,得到对应的音节序列;
本申请可以应用于键盘符号等各种输入方式的输入法***,即用户可以通过编码字符串(也即本说明书中的输入串)进行文字输入。在输入法领域,无论是中文、日文、韩文还是其它语言的输入法,都可以把用户输入的编码字符串转换成相应语言的候选项。以下主要以中文为例进行说明,其它语言相互参照即可。
例如,用户在PC客户端的键盘上输入“yihulvc”,则可以得到输入串“yihulvc”;又如,用户在手机客户端的九宫格键盘下输入“94349265”,则可以得到输入串“94349265”。
以中文为例,汉语中有大约四百多个音节(不考虑声调),则在实际中,可以按照一定的规则对所述输入串进行解析,得到可能的音节序列。
所有输入法支持全拼输入:假设输入串为“fangan”,则会被解析为两个不同的音节序列:[fan][gan]和[fang][an];假设输入串为“buguo”,则会被解析为一个音节序列[bu][guo]。
大多数输入法还支持简拼输入:假设输入串为“yihulvc”,则会被解析为多个不同的音节序列:[yi][hu][lv][cha]、[yi][hu][lv][chai]、[yi][hu][lv][chen]等等;假设输入串为“94349265”,则会被解析为多个不同的音节序列:[xi][di][zan][ji]、[zi][di][wan][ke]、[yi][di][yan][lei]、[yi][di][yan][le]、[yi][di][yan][li]等等。
除了全拼输入、简拼输入外,有些输入法还可以支持模糊音、双拼等输入,由于解析原理类似,故在此不再赘述。
步骤202、依据所述音节序列,在本地云词库中进行查询,命中后得到相应的本地云候选;其中,所述本地云词库存储有依据云服务器发送的云结果进行学词,得到的词条信息及对应的音节信息;
输入法领域中,云请求的过程通常包括:输入法客户端针对输入串向云服务器发送云请求,而对于每一个输入串,云服务器会返回云请求对应的至少一个云结果,其中的每个云结果通常包括音节序列、云服务器返回的云候选、词频等信息。现有技术中,与云请求和云结果的对应关系一致,输入法客户端会从云服务器返回的云结果中挑选出云候选与对应的输入串保存到该云缓存中。
本申请实施例则突破了现有技术的本地云缓存中云请求和云结果的对应关系的限制,创造性地提出本地云词库的概念,所述本地云词库与已有的本地云缓存的相同点在于均可以用于存储词条信息,区别至少可以包括:
第一,相对于现有技术中需要满足请求云的条件才能触发本地云缓存的查询,本申请中本地云词库的查询没有任何条件限制,可以与本地普通词库的查询及本地智能组词同时进行;因此能够大大提升本地云词库中本地云候选的查询几率及利用率;
第二,现有技术中,云缓存存储的是曾经请求云服务器的输入串和云服务器返回的云候选的对应关系,故欲在云缓存中成功查询该输入串对应的词条,则要求该输入串必须与曾经请求云服务器的输入串完全一致,这导致云缓存发挥作用的场景非常有限;而本申请中,所述本地云词库存储的是依据云结果学词得到的词条信息及对应的音节信息,无需该输入串与曾经请求云服务器的输入串完全一致即可查询成功,因此,能够大大提升本地云词库中词条的查询成功率;
第三,依据所述本地云词库查询得到的本地云候选可以与本地普通候选一起参与混合排序,故能够增加大大提升本地云候选项出现在首选的概率。
在本申请实施例中,可以通过如下步骤生成所述本地云词库:对每一次云服务器返回的云结果,对其中音节序列和云候选进行学词,并在本地云词库中新增一条数据记录来保存学词得到的音节序列和词条的对应关系,并将该对应关系进行保存,形成本地云词库;在云结果中包含有词频时,还会将该音节序列、词条和词频的对应关系保存至本地云词库。
其中,学词为输入法领域中已有的技术,其目的是通过词库维护已上屏文字的信息,现有的词库通常维护汉字串、音节串和汉字串的词频等信息,现有词库的学词过程通常为,在用户每次执行上屏操作后,记录该上屏操作对应汉字串和音节串的对应关系,并通过查找词库判断词库中是否存在包括该汉字串和音节串的对应关系的一条数据记录,若存在,则将该条数据记录中汉字串的词频加1,若不存在,则在词库中新增一条该汉字串、音节串和词频对应关联的数据记录,其中,词频的初始值为1。
本申请实施例的学词与现有学词的原理类似,均是通过对应词库来维护文字信息,且对应词库均可维护汉字串、音节串和汉字串的词频等信息;
本申请实施例的学词相对于现有学词的区别具体可以包括:
区别一、本申请实施例是通过本地云词库来维护云服务器返回的云结果,该本地云词库与本地普通词库为不同的词库,且本地云词库维护的是云结果的信息,而非用户已上屏文字的信息;
区别二、当存在包括该汉字串和音节串的对应关系的一条数据记录时,现有学词只更新该条数据记录中的词频;而本申请对每一次云服务器返回的云结果,无论其中云候选与本地云词库中词条是否重合,无论其中云候选是否被展现,都会对其中音节序列和云候选进行学词,并新增一条数据记录来保存音节序列和词条的对应关系;
由于云服务器的数据是持续更新的,更新前后相同的云请求可能会得到不同的云结果,故该区别二一方面能够最大限度地利用本地云词库已有的云结果,另一方面不会丧失云服务器词条数据及时性强的优势。
下面给出学词的应用场景1、
在PC客户端上,用户的输入串为“yihulvc”,本地首选为“医护绿茶”,但该首选“医护绿茶”并不是本地普通词库中的词条,而是输入法客户端通过智能组词生成的本地组词候选,由于客户端计算能力和数据大小的限制,该候选“医护绿茶”的质量并不好;因此,输入法客户端向云服务器发送云请求,该云请求中携带该输入串“yihulvc”;
假设云服务器得到了与该字符串及其前缀匹配的多个云结果,其中该多个云结果的首选为“一壶绿茶”,音节序列为[yi][hu][lv][cha];由于云服务器的计算能力和数据容量远远客户端,故该首选“一壶绿茶”的质量明显优于“医护绿茶”的质量;
则PC客户端可以按照音节序列[yi][hu][lv][cha],将“一壶绿茶”学入本地云词库。
步骤203、对所述本地云候选和本地普通候选进行混合排序;
步骤204、展现所述本地云候选和本地普通候选的混合排序结果。
需要说明的是,所述本地普通候选具体可以包括:根据本地普通词库得到的本地词库候选和/或智能组词生成的本地组词候选;本地普通词库具体可以包括:本地***词库、本地用户词库等,在用户首次输入长句或者生僻词时,本地普通词库中很有可能没有该长句或者生僻词,此种情况下本地词库候选为空。
可以理解,本领域技术人员可以依据实际需求采用各种各样的混合排序策略。
在本申请的一种应用示例中,为最大限度地发挥云服务器计算能力和数据规模大的优点,可以将第一个本地云候选强制排在首选。
在本申请的一种优选实施例中,考虑到本地***词库中存储有***收集的高质量词条,而本地用户词库中存储有用户已上屏的词条,故可以认为本地普通候选的质量优于本地云候选;同时由于云服务器相较输入法客户端具有更强的计算能力和更大规模的数据,故云服务器得到云候选的质量显然优于输入法客户端组词生成的本地组词候选;因此,本优选实施例中,可以将所述本地云候选排在本地词库候选之后及本地组词候选之前。
对应于上述应用场景1,假设用户继续输入“h”,即当前输入串为“yihulvch”,本地普通词库仍未查询到对应的词条,输入法客户端通过智能组词生成的候选仍为“医护绿茶”,但由于此时本地云词库中已经存在音节序列[yi][hu][lv][cha]对应的词条“一壶绿茶”,且该“一壶绿茶”是云服务器得到的首选,云服务器相较输入法客户端具有更强的计算能力和更大规模的数据,故根据云服务器得到云候选的质量显然优于输入法客户端组词生成的本地组词候选的,因此,可与将依据本地云词库查询得到的本地云候选“一壶绿茶”排在本地组词候选“医护绿茶”之前;而由于本地词库候选为空,故本地云候选“一壶绿茶”为最终的首选。
应用场景1中,既能够节省等待云服务器响应的时间,又能够将本地云候选展现在首选,由于本地云候选的质量明显优于输入法客户端组词生成的本地组词候选,故能够为用户提供更好的首选结果。
参照图3,示出了本申请一种展现候选项的方法实施例2的流程图,具体可以包括:
步骤301、对用户输入的输入串进行解析,得到对应的音节序列;
步骤302、依据所述音节序列,在本地云词库中进行查询,得到相应的一个以上本地云候选;其中,所述本地云词库存储有依据云服务器发送的云结果进行学词,得到的词条信息及对应的音节信息和词频信息;
步骤303、依据各本地云候选对应的自词频信息从所述一个以上本地云候选中选择词频最高的一个;
步骤304、对所选择的词频最高的一个本地云候选和本地普通候选进行混合排序,得到的混合排序结果中,该本地云候选排在本地词库候选之后及本地组词候选之前;
步骤305、展现所选择的词频最高的一个本地云候选和本地普通候选的混合排序结果。
本实施例的本地云词库在上述图2所示实施例的基础上,进一步还可以存储依据云结果学词得到的词条信息对应的词频信息;该词频信息用于表示对应词条信息的用户使用频率,通常为云服务器统计的对应词条信息被使用或被输入的次数,该词频信息被携带在云结果中返回给输入法客户端,由输入法客户端学词到对应的本地云词库中。
本实施例的展现候选项的方法在上述图2所示实施例的基础上,进一步还可以包括:在查询到所述音节序列对应的一个以上本地云候选时,依据各自词频信息选择所述一个以上本地云候选中的词频最高的一个;将所选择的词频最高的一个本地云候选参与混合排序和混合展现。
总之,本实施例在查询到所述音节序列对应的一个以上本地云候选时,选择其中词频最高的一个参与混合排序和混合展现,能够将云服务器返回的用户使用频率最高的词条提供给用户,因此能够提高用户的输入效率。
参照图4,示出了本申请一种展现候选项的方法实施例3的流程图,具体可以包括:
步骤401、对用户输入的输入串进行解析,得到对应的音节序列;
步骤402、依据所述音节序列,在本地云词库中进行查询,得到相应的本地云候选;其中,所述本地云词库存储有依据云服务器发送的云结果进行学词,得到的词条信息及对应的音节信息;
步骤403、对所述本地云候选和本地普通候选进行混合排序,得到的混合排序结果中所述本地云候选排在本地词库候选之后及本地组词候选之前;
步骤404、展现所述本地云候选和本地普通候选的混合排序结果;
步骤405、在未查询到所述音节序列对应的本地云候选时,向云服务器请求所述输入串对应的云结果;
步骤406、对所述输入串对应云结果中的云候选按常规的云候选位置进行展现。
本实施例的展现候选项的方法中,步骤403-步骤404为图2所示实施例中对应在查询到所述音节序列对应的本地云候选时的处理流程,步骤405-步骤406对应在未查询到所述音节序列对应的本地云候选时的处理流程,其按常规云候选位置随机展现所述云结果。假设所述云结果中包括有若干个云候选,如果云结果中存在有与本地候选不同的云候选,那么可以在本地二选位置显示第一个与本地候选不同的云候选,如果所述云结果中不存在与本地候选不同的云候选,也即,如果每一个云候选都有与其相同的一个本地候选,则本地二选位置留空。
可以理解,对于步骤405中的云结果,还可以对其中音节序列、云候选和词频进行学词,得到音节序列、词条和词频的对应关系,并将该对应关系保存至本地云词库;其中音节序列、词条和词频的作用分别为:查询索引、查询结果和选择依据。
参照图5,示出了本申请一种展现候选项的方法实施例4的流程图,具体可以包括:
步骤501、对用户输入的输入串进行解析,得到对应的音节序列;
步骤502、依据所述音节序列,在本地云词库中进行查询,得到相应的本地云候选;其中,所述本地云词库存储有依据云服务器发送的云结果进行学词,得到的词条信息及对应的音节信息;
步骤503、对所述本地云候选和本地普通候选进行混合排序,得到的混合排序结果中所述本地云候选排在本地词库候选及本地组词候选之前;在其他实施例中,本地云候选也可设定在各候选项的首位;
步骤504、展现所述本地云候选和本地普通候选的混合排序结果;
步骤505、当所述本地云词库中词条数目达到预置门限时,丢弃其中未被查询过且最先存入的词条。
本实施例的展现候选项的方法在上述图2所示实施例的基础上,进一步还可以包括用于维护本地云词库的步骤505。
由于云服务器的数据是持续更新的,更新前后相同的云请求可能会得到不同的云结果,因此,本实施例可以基于LRU(近期最少使用算法,Least Recently Used)原理对本地云词库进行维护,使其为固定大小的临时词库,当保存词条数目达到预置门限时,将丢弃其中未被查询过且最先存入的词条。
在本申请的一种优选实施例中,所述方法还可以包括:当输入法(如输入法所在PC客户端关机、重启等)的进程关闭后,清空所述本地云词库。
本地云词库的设计,使得输入法客户端在大多数情况下依然保留请求云服务器的能力,可以实时获得云服务器最新的云结果,一方面能够最大限度地利用本地云词库已有的云结果,另一方面不会丧失云服务器词条数据及时性强的优势。
图2-图5所示实施例分别对展现候选项的方法进行了说明,可以理解,本领域技术人员可以根据实际需求使用所述实施例中的一种或多种,也即,图2-图5所示实施例的相互结合也是可行的。
与前述方法实施例相应,本申请还提供了一种展现候选项的装置,参照图6所示的结构图,具体可以包括:
解析单元601,用于对用户输入的输入串进行解析,得到对应的音节序列;
查询单元602,用于依据所述音节序列,在本地云词库中进行查询,得到相应的本地云候选;其中,所述本地云词库存储有依据云服务器发送的云结果进行学词得到的词条信息及对应的音节信息;
混合排序单元603,用于对所述本地云候选和本地普通候选进行混合排序;及
展现单元604,用于展现所述本地云候选和本地普通候选的混合排序结果。
在本申请的一种应用示例中,所述本地普通候选具体可以包括:根据本地普通词库得到的本地词库候选和/或智能组词生成的本地组词候选;
在本申请的一种优选实施例中,所述本地云词库还可以存储有依据云结果学词得到的词条信息对应的词频信息;
则所述装置还可以包括:用于在查询到所述音节序列对应的一个以上本地云候选时,依据各自词频信息选择所述一个以上本地云候选中词频最高的一个的选择单元;
则所述混合排序单元603,可具体用于对所选择的词频最高的一个本地云候选和本地普通候选进行混合排序;
则所述展现单元604,可具体用于展现所选择的词频最高的一个本地云候选和本地普通候选的混合排序结果。
在本申请的再一种优选实施例中,所述装置还可以包括:用于生成所述本地云词库的生成单元;
所述生成单元具体可以包括:
学词子单元,用于对每一次云服务器返回的云结果中音节序列和云候选进行学词;
保存子单元,用于在本地云词库中新增一条数据记录来保存学词得到的音节序列和词条的对应关系,并将该对应关系进行保存,形成本地云词库。
在本申请实施例中,优选的是,所述混合排序结果中所述本地云候选排在本地词库候选之后及本地组词候选之前。
在本申请实施例中,优选的是,所述装置还可以包括:丢弃单元,用于当所述本地云词库中词条数目达到预置门限时,丢弃其中未被查询过且最先存入的词条。
在本申请实施例中,优选的是,所述装置还可以包括:清空单元,用于当输入法的进程关闭后,清空所述本地云词库。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于***实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本申请所提供的一种展现候选项的方法及装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (9)

1.一种展现候选项的方法,其特征在于,包括:
对用户输入的输入串进行解析,得到对应的音节序列;
对每一次云服务器返回的云结果中音节序列和云候选进行学词,并在本地云词库中新增一条数据记录来保存学词得到的音节序列和词条的对应关系,并将该对应关系进行保存,形成本地云词库;
依据所述音节序列,在本地云词库中进行查询,得到相应的本地云候选;其中,所述本地云词库存储有依据云服务器发送的云结果进行学词,得到的词条信息及对应的音节信息;
对所述本地云候选和本地普通候选进行混合排序;
展现所述本地云候选和本地普通候选的混合排序结果。
2.如权利要求1所述的方法,其特征在于,所述本地云词库还存储有依据云结果学词得到的词条信息对应的词频信息;
则所述方法还包括:在查询到所述音节序列对应的一个以上本地云候选时,依据各自词频信息选择所述一个以上本地云候选中词频最高的一个;
则所述对所述本地云候选和本地普通候选进行混合排序的步骤为,对所选择的词频最高的一个本地云候选和本地普通候选进行混合排序;
则所述展现所述本地云候选和本地普通候选的混合排序结果的步骤为,展现所选择的词频最高的一个本地云候选和本地普通候选的混合排序结果。
3.如权利要求1或2所述的方法,其特征在于,所述混合排序结果中所述本地云候选排在本地词库候选之后及本地组词候选之前。
4.如权利要求1所述的方法,其特征在于,还包括:
当所述本地云词库中词条数目达到预置门限时,丢弃其中未被查询过且最先存入的词条。
5.如权利要求1所述的方法,其特征在于,还包括:
当输入法的进程关闭后,清空所述本地云词库。
6.如权利要求1或2所述的方法,其特征在于,还包括:
在未查询到所述音节序列对应的本地云候选时,向云服务器请求所述输入串对应的云结果。
7.如权利要求1或2所述的方法,其特征在于,所述本地普通候选包括:根据本地普通词库得到的本地词库候选和/或智能组词生成的本地组词候选。
8.一种展现候选项的装置,其特征在于,包括:
解析单元,用于对用户输入的输入串进行解析,得到对应的音节序列;
生成单元,用于生成本地云词库;所述生成单元包括:学词子单元,用于对每一次云服务器返回的云结果中音节序列和云候选进行学词;保存子单元,用于在本地云词库中新增一条数据记录来保存学词得到的音节序列和词条的对应关系,并将该对应关系进行保存,形成本地云词库;
查询单元,用于依据所述音节序列,在本地云词库中进行查询,得到相应的本地云候选;其中,所述本地云词库存储有依据云服务器发送的云结果进行学词,得到的词条信息及对应的音节信息;
混合排序单元,用于对所述本地云候选和本地普通候选进行混合排序;及
展现单元,用于展现所述本地云候选和本地普通候选的混合排序结果。
9.如权利要求8所述的装置,其特征在于,所述本地云词库还存储有依据云结果学词得到的词条信息对应的词频信息;
则所述装置还包括:用于在查询到所述音节序列对应的一个以上本地云候选时,依据各自词频信息选择所述一个以上本地云候选中词频最高的一个的选择单元;
则所述混合排序单元,具体用于对所选择的词频最高的一个本地云候选和本地普通候选进行混合排序;
则所述展现单元,具体用于展现所选择的词频最高的一个本地云候选和本地普通候选的混合排序结果。
CN201410088127.3A 2014-03-11 2014-03-11 一种展现候选项的方法及装置 Active CN103886043B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410088127.3A CN103886043B (zh) 2014-03-11 2014-03-11 一种展现候选项的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410088127.3A CN103886043B (zh) 2014-03-11 2014-03-11 一种展现候选项的方法及装置

Publications (2)

Publication Number Publication Date
CN103886043A CN103886043A (zh) 2014-06-25
CN103886043B true CN103886043B (zh) 2017-10-20

Family

ID=50954935

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410088127.3A Active CN103886043B (zh) 2014-03-11 2014-03-11 一种展现候选项的方法及装置

Country Status (1)

Country Link
CN (1) CN103886043B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106896975A (zh) * 2015-12-18 2017-06-27 北京搜狗科技发展有限公司 一种输入方法和装置、一种用于输入的装置
CN108304078B (zh) * 2017-01-11 2024-01-30 北京搜狗科技发展有限公司 一种输入方法、装置及电子设备
CN106844651B (zh) * 2017-01-20 2019-11-12 上海傲硕信息科技有限公司 指令结果比对筛选装置
CN108958503A (zh) * 2017-05-26 2018-12-07 北京搜狗科技发展有限公司 输入方法和装置
CN108549493B (zh) * 2018-04-04 2022-10-04 科大讯飞股份有限公司 候选词筛选方法及相关设备
CN109712613B (zh) * 2018-12-27 2021-04-20 北京百佑科技有限公司 语义分析库更新方法、装置及电子设备
CN112748811A (zh) * 2021-01-21 2021-05-04 李博林 一种英文单词输入方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101334774A (zh) * 2007-06-29 2008-12-31 北京搜狗科技发展有限公司 一种字符输入的方法和输入法***
CN101697109A (zh) * 2009-10-26 2010-04-21 北京搜狗科技发展有限公司 一种获取输入法候选项的方法及***
CN102063452A (zh) * 2010-05-31 2011-05-18 百度在线网络技术(北京)有限公司 用于供用户进行文字输入的方法、设备、服务器和***
CN102722483A (zh) * 2011-03-29 2012-10-10 百度在线网络技术(北京)有限公司 用于确定输入法的候选项排序的方法、装置和设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7250938B2 (en) * 2004-01-06 2007-07-31 Lenovo (Singapore) Pte. Ltd. System and method for improved user input on personal computing devices

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101334774A (zh) * 2007-06-29 2008-12-31 北京搜狗科技发展有限公司 一种字符输入的方法和输入法***
CN101697109A (zh) * 2009-10-26 2010-04-21 北京搜狗科技发展有限公司 一种获取输入法候选项的方法及***
CN102063452A (zh) * 2010-05-31 2011-05-18 百度在线网络技术(北京)有限公司 用于供用户进行文字输入的方法、设备、服务器和***
CN102722483A (zh) * 2011-03-29 2012-10-10 百度在线网络技术(北京)有限公司 用于确定输入法的候选项排序的方法、装置和设备

Also Published As

Publication number Publication date
CN103886043A (zh) 2014-06-25

Similar Documents

Publication Publication Date Title
CN103886043B (zh) 一种展现候选项的方法及装置
US20240080370A1 (en) Push notification delivery system with feedback analysis
US9037860B1 (en) Average-complexity ideal-security order-preserving encryption
CN107346307A (zh) 分布式缓存***及方法
CN106411965B (zh) 确定提供仿冒服务的网络服务器的方法、设备及计算设备
CN104572845B (zh) 文件分发方法、装置、设备及***
CN104133783B (zh) 处理分散式缓存数据的方法和装置
CN105095313B (zh) 一种数据访问方法和设备
US10885036B2 (en) Obtaining incremental updates from a database using a partial query
CN104123356B (zh) 一种大数据量下提高网页响应的方法
CN108763529A (zh) 一种智能检索方法、装置和计算机可读存储介质
CN106911782A (zh) 一种数据读取方法及装置
CN110020086A (zh) 一种用户画像查询方法及装置
CN110535961A (zh) 资源获取方法、装置、电子设备和存储介质
WO2021066903A1 (en) Providing explainable product recommendation in a session
CN108763443A (zh) 区块链账户处理方法与装置
CN105447004B (zh) 查询推荐词的挖掘、相关查询方法及装置
WO2021253938A1 (zh) 一种神经网络的训练方法、视频识别方法及装置
CN108595530A (zh) 一种后台处理和存储用户消息的方法及***装置
CN110535815A (zh) 一种识别url的方法和装置
CN113064907A (zh) 一种基于深度强化学习的内容更新方法
CN108874876A (zh) 一种消息推送方法、计算机可读存储介质及终端设备
US20210195030A1 (en) Electronic communication system for providing expert information and method of using same
CN102682068A (zh) 一种搜索用户名的方法及***
CN104615596B (zh) 历史记录信息的清除方法及浏览器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant