CN103092826A - 一种根据用户的输入信息构建输入词条的方法与设备 - Google Patents

一种根据用户的输入信息构建输入词条的方法与设备 Download PDF

Info

Publication number
CN103092826A
CN103092826A CN2012105928421A CN201210592842A CN103092826A CN 103092826 A CN103092826 A CN 103092826A CN 2012105928421 A CN2012105928421 A CN 2012105928421A CN 201210592842 A CN201210592842 A CN 201210592842A CN 103092826 A CN103092826 A CN 103092826A
Authority
CN
China
Prior art keywords
input
entry
candidate
inputs
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105928421A
Other languages
English (en)
Other versions
CN103092826B (zh
Inventor
陆阳阳
汪倩怡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201210592842.1A priority Critical patent/CN103092826B/zh
Publication of CN103092826A publication Critical patent/CN103092826A/zh
Application granted granted Critical
Publication of CN103092826B publication Critical patent/CN103092826B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明的目的是提供一种用于根据用户的输入信息构建输入词条的方法与设备。处理设备根据用户的输入记录信息,获取对应的一个或多个候选输入词条,其中,所述候选输入词条包括满足间隔阈值要求的两个或多个分词;检测是否满足将所述候选输入词条转化为输入词条的触发条件;当满足所述触发条件,将对应的所述候选输入词条转化为输入词条。与现有技术相比,本发明通过获取用户输入记录信息中的候选输入词条,当满足将候选输入词条转化为输入词条的触发条件,将对应的候选输入词条转化为输入词条;从而灵活配置用户的输入词条,使得所述输入词条与用户的输入需求相匹配,提高了输入灵活度与个性化,还提高了输入法的输入效率,改善了用户体验。

Description

一种根据用户的输入信息构建输入词条的方法与设备
技术领域
本发明涉及互联网技术领域,尤其涉及一种用于根据用户的输入信息构建输入词条的技术。
背景技术
当前,用户在输入过程中输入词条或二元关系的生成,主要是根据用户的输入字符串(如“famingjishu”)和输入选项(如“发明技术”)之间的一次或多次关系,例如,当用户多次将“famingjishu”与“发明技术”进行关联输入后,则将“发明技术”形成该用户的输入词条。
然而,在用户的输入过程中,由于例如不习惯连续输入等的输入习惯或选词快捷等原因,通常将一个或多个常用词进行拆分输入,例如,用户先输入字符串“faming”,然后选择输入选项“发明”,接下来输入字符串“jishu”,然后选择输入选项“技术”。在这种情况下,尽管用户多次将“发明”与“技术”进行连续输入,然而由于“发明”与“技术”分别上屏,“发明技术”依然不属于用户的输入词条或用户所对应的二元关系。
发明内容
本发明的目的是提供一种用于根据用户的输入信息构建输入词条的方法与设备。
根据本发明的一个方面,提供了一种用于根据用户的输入信息构建输入词条的方法,其中,该方法包括以下步骤:
a根据用户的输入记录信息,获取对应的一个或多个候选输入词条,其中,所述候选输入词条包括所述输入记录信息中满足间隔阈值要求的两个或多个分词;
b检测是否满足将所述候选输入词条转化为输入词条的触发条件;
c当满足所述触发条件,将对应的所述候选输入词条转化为输入词条。
根据本发明的另一方面,还提供了一种用于根据用户的输入信息构建输入词条的处理设备,其中,该设备包括:
获取装置,用于根据用户的输入记录信息,获取对应的一个或多个候选输入词条,其中,所述候选输入词条包括所述输入记录信息中满足间隔阈值要求的两个或多个分词;
检测装置,用于检测是否满足将所述候选输入词条转化为输入词条的触发条件;
转化装置,用于当满足所述触发条件,将对应的所述候选输入词条转化为输入词条。
与现有技术相比,本发明通过获取用户的输入记录信息中的一个或多个候选输入词条,检测是否满足将所述候选输入词条转化为输入词条的触发条件,当满足所述触发条件,将对应的所述候选输入词条转化为输入词条;从而灵活配置用户的输入词条,使得所述输入词条与用户的输入需求相匹配,提高了输入灵活度与个性化,还提高了输入法的输入效率,改善了用户体验。
而且,本发明还可以根据不同的触发条件,通过对候选输入词条的累计频次进行检测,或者对候选输入词条相对应的在线搜索结果的数量进行检测等方式,检测是否满足将所述候选输入词条转化为输入词条的触发条件;从而通过多种方式灵活配置用户的输入词条,使得所述输入词条与用户的输入需求相匹配,提高了输入灵活度与个性化,还提高了输入法的输入效率,改善了用户体验。
而且,本发明还可以对用户的输入记录信息进行分词处理,以获得对应的一个或多个分词,并根据间隔阈值要求,确定对应的一个或多个候选输入词条;进一步地,还可以根据预定的筛选规则,对所述一个或多个候选输入词条进行筛选处理,以获得筛选后的候选输入词条,以供后续处理;从而实现个性化的对用户的候选输入词条进行获取,灵活配置用户的输入词条,使得所述输入词条与用户的输入需求相匹配,提高了输入灵活度与个性化,还提高了输入法的输入效率,改善了用户体验。
而且,本发明还可以根据所述输入词条建立或更新输入词库,并根据所述用户的输入字符串,在所述输入词库中进行匹配查询,将与所述输入字符串对应的所述输入词条,作为与所述输入字符串对应的输入候选项;进一步地,还可以根据所述输入词条,并结合所述输入词库中所述用户的历史输入词条的使用相关信息,建立或更新所述输入词库;从而提高了输入字符串与输入候选项的匹配准确度,与用户的输入需求相匹配,提高了输入灵活度与个性化,提高了输入法的输入效率,改善了用户体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的一种用于根据用户的输入信息构建输入词条的处理设备示意图;
图2示出根据本发明一个优选实施例的一种用于根据用户的输入信息构建输入词条的处理设备示意图;
图3示出根据本发明另一个方面的一种用于根据用户的输入信息构建输入词条的方法流程图;
图4示出根据本发明一个优选实施例的一种用于根据用户的输入信息构建输入词条的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的一种用于根据用户的输入信息构建输入词条的处理设备示意图;其中,所述处理设备包括获取装置11、检测装置12、转化装置13。具体地,获取装置11根据用户的输入记录信息,获取对应的一个或多个候选输入词条,其中,所述候选输入词条包括所述输入记录信息中满足间隔阈值要求的两个或多个分词;检测装置12检测是否满足将所述候选输入词条转化为输入词条的触发条件;当满足所述触发条件,转化装置13将对应的所述候选输入词条转化为输入词条。
在此,处理设备包括但不限于网络设备、用户设备、或网络设备与用户设备通过网络相集成所构成的设备。其中,所述网络设备其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述用户设备其包括但不限于任何一种可与用户通过键盘、遥控器、触摸板、或声控设备进行人机交互的电子产品,例如计算机、智能手机、PDA、游戏机、或IPTV等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。本领域技术人员应能理解,其他的处理设备同样适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
上述各装置之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各装置分别实时地或者按照设定的或实时调整的工作模式要求,进行候选输入词条的获取、触发条件的检测、输入词条的转化等,直至处理设备停止获取对应的一个或多个候选输入词条。
获取装置11根据用户的输入记录信息,获取对应的一个或多个候选输入词条,其中,所述候选输入词条包括所述输入记录信息中满足间隔阈值要求的两个或多个分词。具体地,获取装置11例如通过根据各种通信协议(Communications Protocol),通过各种数据传输接口,与第三方的输入记录信息数据库交互,获取用户的输入记录信息;或者直接获取用户的输入记录信息日志,以获取用户的输入记录信息;或者通过实时从例如输入框中接收用户或其他应用等通过输入、选择、点击等操作所输入的一个或多个输入记录信息,在此,所述输入框如短信编辑框、内容输入框等。其中,所述输入记录信息中包含一条或多条输入记录,所述输入记录中包含一个或多个分词信息。获取装置11根据用户的输入记录信息中的一个或多个分词信息,将满足间隔阈值要求的两个或多个分词确定为候选输入词条,其中,所述间隔阈值要求包括但不限于时间间隔、频次间隔、符号间隔等。其中,所述时间间隔例如,用户先输入“张江”上屏,再输入“高科”上屏,若前后两次连续上屏的时间间隔小于一定的间隔阈值要求T,则将“张江高科”确定为候选输入词条;所述频次间隔例如,在所述用户的输入记录信息中,可以查询得到n次“用户先输入‘张江’上屏,再输入‘高科’上屏”的记录,则当查询得到的次数n大于频次间隔N时,将“张江高科”确定为候选输入词条;另外,通常仅考虑连续上屏的分词构成候选输入词条,但实际用户输入中可能在本应连续上屏的分词间***了空格或其他字符,因此,所述符号间隔例如,用户先输入“张江”上屏,然后输入空格或其他符号间隔中所包含的符号,再输入“高科”上屏,则获取装置11也将“张江高科”确定为候选输入词条;在此,所述其他符号不包括逗号、句号等标点符号。在此,本领域技术人员应能理解,候选输入词条的获取,可以是实时获得的,例如连续上屏的分词;也可以经由线下处理所获得,例如对于历史的输入信息,进行分词处理、间隔阈值判断等处理后获得等。
检测装置12检测是否满足将所述候选输入词条转化为输入词条的触发条件。具体地,检测装置12根据获取装置11所获取的一个或多个候选输入词条,通过实时或线下等的统计、比较等方式,将所述候选输入词条的相关信息,与所述触发条件进行对比判断,从而检测是否满足将所述候选输入词条转化为输入词条的触发条件。
优选地,所述触发条件包括以下至少任一项:
-所述候选输入词条的累计频次超过预定的词条转化频次阈值;例如,若预定的词条转化阈值频次为3,则当所述候选输入词条的累计频次大于等于3时,则确认所述候选输入词条满足转化为输入词条的触发条件;在此,所述词条转化频次阈值可能小于或等于所述获取装置11的间隔阈值,例如当所述间隔阈值为频次间隔时,所述间隔阈值为2,而所述词条转化阈值频次为3等;
-包含所述候选输入词条的在线搜索结果的数量超过预定的在线数量阈值;例如,检测装置12通过在线搜索所述候选输入词条,以获取包含所述候选输入词条的在线搜索结果数量;或者通过与能够提供包含所述候选输入词条的第三方设备或数据库等进行交互,以获取所述候选输入词条的在线搜索结果数量;若包含所述候选输入词条的在线搜索结果的数量k超过预定的在线数量阈值K,则确认所述候选输入词条满足转化为输入词条的触发条件;在此,由于单一用户的输入数量往往较少,可能不能及时满足输入词条转化的要求,因此可以参考其他用户的输入或其他来源信息,例如候选词条“张江高科”,那么可结合“张江高科”所对应的搜索结果的数量来判断是否转化,而不必等待该用户的输入频次满足要求;从而提高转化的效率,相应地也提高了用户的输入效率。
-在所述输入记录信息对应的应用中,包含所述候选输入词条的应用输入结果的数量超过预定的应用数量阈值;具体地,若所述输入记录信息对应特定的应用,例如,所述输入记录信息属于某一个应用的日志信息,则检测装置12通过在线搜索与所述应用相对应的如其他用户的、包含所述候选输入词条的应用输入信息或是通过与能够包含所述候选输入词条的第三方设备或数据库等交互,以获取包含所述候选输入词条的应用输入结果;若包含所述候选输入词条的应用输入结果的数量超过预定的应用数量阈值,确认所述候选输入词条满足转化为输入词条的触发条件;例如,所述输入记录信息对应的应用为游戏“植物大战僵尸”,所述用户的候选输入词条为“僵王博士”,则检测装置12对“植物大战僵尸”的相关应用输入结果进行检测,若包含“僵王博士”的应用输入结果数量超过预定的应用数量阈值,则确认所述候选输入词条满足转化为输入词条的触发条件;该方式与所述在线搜索结果相似,更强调应用的相关性,从而获取更具针对性的检测结果。
当满足所述触发条件,转化装置13将对应的所述候选输入词条转化为输入词条。具体地,若所述检测装置12确认满足将所述候选输入词条转化为输入词条的触发条件,所述转化装置13则将所述对应的满足触发条件的所述候选输入词条,转化为输入词条。例如,将连续上屏且满足所述触发条件的“张江”、“高科”转化为输入词条“张江高科”。
优选地,当所述触发条件包括所述候选输入词条的累计频次超过预定的词条转化频次阈值;所述检测装置12还可以根据所述候选输入词条所对应的输入记录相关信息,加权确定所述候选输入词条的累计频次;检测所述累计频次是否超过预定的词条转化频次阈值。具体地,当所述触发条件包括所述候选输入词条的累计频次超过预定的词条转化频次阈值时,所述检测装置12还可以通过对所述候选输入词条所对应的输入记录相关信息进行实时获取或通过第三方等方式线下获取,根据所述输入记录相关信息,通过***预置或实时设置、或者根据用户的使用频率动态调整等方式,为不同的输入记录相关信息所对应的所述候选输入词条的累计频次设置不同的权重,从而加权确定所述候选输入词条的累计频次;例如,若所述输入记录相关信息为所述输入词条所对应的输入记录信息所属的应用信息,对于同一个候选输入词条,若其获取来源为office word文档,则设置其每频次的权重为1,而若其获取来源为bbs,则设置其每频次的权重为0.5,从而所述候选输入词条的累计频次确定方式为:累计频次=1*候选输入词条在office word文档中的频次+0.5*候选输入词条在bbs中的频次。所述检测装置12对所述累计频次与预定的词条转化频次阈值进行比较,从而检测所述累计频次是否超过预定的词条转化频次阈值。
更优选地,其中,所述输入记录相关信息包括以下至少任一项:
-所述候选输入词条所对应的输入记录信息所属的应用信息;例如,若所述输入记录信息所对应的应用为word与论坛bbs,则认为word中的输入记录信息所得到的候选输入词条具有更高权重,而在论坛bbs帖中的则权重较低;
-所述候选输入词条所对应的输入记录信息的文字数量信息;例如,若输入记录信息的文字数量信息超过一定的阈值,则认为所述输入记录信息中所获得的候选输入词条的权重越高,例如,若所述输入记录信息的文字数量信息超过1000,则将所述候选输入词条的权重定为1,若所述输入记录信息的文字数量信息超过10000,则将所述候选输入词条的权重定为2;在此,考虑到若一次输入文字的数量越多,该输入信息越正式,因此,在计算候选输入词条的累计频次时权重越高;
-所述候选输入词条所对应的输入记录信息所对应的终端类型信息;例如,若所述输入记录信息对应的终端类型信息为移动终端,则将所述候选输入词条所的权重定为0.5,若所述输入记录信息对应的终端类型为PC端,则将所述候选输入词条所的权重定为1;或者,若认为所述移动终端应对应更高的权重,从而使得移动终端的输入更易于被收录,则设定所述移动终端所对应的候选输入词条的权重高于所述PC端;从而考虑到不同的终端类型、以及所述终端类型所对应的应用等所对应的重要性不同。
优选地,当所述触发条件包括包含所述候选输入词条的在线搜索结果的数量超过预定的在线数量阈值;所述检测装置12还可以获取与所述候选输入词条相对应的在线搜索结果,以确定所述在线搜索结果的数量;检测所述在线搜索结果的数量是否超过预定的在线数量阈值。具体地,当所述触发条件包括包含所述候选输入词条的在线搜索结果的数量超过预定的在线数量阈值时,所述检测装置12通过在线搜索所述候选输入词条,以获取包含所述候选输入词条的在线搜索结果数量;或者通过与能够提供包含所述候选输入词条的第三方设备或数据库等进行交互,以获取所述候选输入词条的在线搜索结果数量;若包含所述候选输入词条的在线搜索结果的数量k超过预定的在线数量阈值K,则确认所述候选输入词条满足转化为输入词条的触发条件。
优选地,所述获取装置11还可以对用户的输入记录信息进行分词处理,以获得对应的一个或多个分词;根据间隔阈值要求,确定对应的一个或多个候选输入词条,其中,所述候选输入词条包括所述输入记录信息中满足间隔阈值要求的两个或多个所述分词。具体地,所述获取装置11通过例如通过根据各种通信协议(Communications Protocol),通过各种数据传输接口,与第三方的输入记录信息数据库交互,获取用户的输入记录信息;或者直接获取用户的输入记录信息日志,以获取用户的输入记录信息;或者通过实时从例如输入框中接收用户或其他应用等通过输入、选择、点击等操作所输入的一个或多个输入记录信息,在此,所述输入框如短信编辑框、内容输入框等。所述获取装置11通过对用户的输入记录信息进行分词处理,以获得对应的一个或多个分词。所述获取装置11根据预定的间隔阈值要求,当所述一个或多个分词满足所述间隔阈值要求时,则将所述两个或多个分词确定为候选输入词条,其中,所述间隔阈值要求包括但不限于时间间隔、频次间隔、符号间隔等。在此,例如,若考虑到可能存在误输入的空格或其他字符,所述间隔阈值可取0-2个字符,以保证一定的容错性,从而提高转化效率和输入效率。在此,所述间隔阈值中的符号若包括逗号、句号等标点符号时,则被所述标点符号所分割的两个或多个所述分词不被确定为所述候选输入词条。
更优选地,所述获取装置11还包括筛选单元(未示出),其中,所述筛选单元根据预定的筛选规则,对所述一个或多个候选输入词条进行筛选处理,以获得筛选后的候选输入词条,以供后续处理。具体地,所述筛选单元通过根据预置或实时设置的预定的筛选规则,对所述一个或多个候选输入词条进行筛选处理;其中,所述预定的筛选规则包括但不限于基于所述候选输入词条的词性、属性、字数等进行筛选,例如,仅提取字数小于等于6的候选输入词条,或是仅提取姓名的候选输入词条,或是仅提取名词组合(如“张江高科”)的候选输入词条,或是仅提取动宾组合(如“申请专利”)的候选输入词条等,从而获得筛选后的候选输入词条,以供后续处理。从而更具针对性的对所述候选输入词条进行获取,以助于提高转化效率和输入效率。
图2示出根据本发明一个优选实施例的一种用于根据用户的输入信息构建输入词条的处理设备示意图;其中,所述处理设备包括获取装置11’、检测装置12’、转化装置13’、更新装置14’、匹配装置15’。具体地,获取装置11’根据用户的输入记录信息,获取对应的一个或多个候选输入词条,其中,所述候选输入词条包括所述输入记录信息中满足间隔阈值要求的两个或多个分词;检测装置12’检测是否满足将所述候选输入词条转化为输入词条的触发条件;当满足所述触发条件,转化装置13’将对应的所述候选输入词条转化为输入词条;更新装置14’根据所述输入词条建立或更新输入词库;匹配装置15’根据所述用户的输入字符串,在所述输入词库中进行匹配查询,以确定与所述输入字符串对应的所述输入词条,以作为与所述输入字符串对应的输入候选项,其中,所述输入字符串与所述输入词条中至少一个分词相匹配。其中,所述获取装置11’、检测装置12’、转化装置13’与图1所示对应装置相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
上述各装置之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各装置分别实时地或者按照设定的或实时调整的工作模式要求,进行候选输入词条的获取、触发条件的检测、输入词条的转化、输入词库的更新、输入候选项的确定等,直至处理设备停止获取对应的一个或多个候选输入词条。
更新装置14’根据所述输入词条建立或更新输入词库。具体地,更新装置14’通过从转化装置13’获取一个或多个输入词条,并将所述一个或多个输入词条中至少一个,更新至所述输入词库中;若所述输入词库不存在,则利用所述一个或多个输入词条中至少一个,建立所述输入词库。
匹配装置15’根据所述用户的输入字符串,在所述输入词库中进行匹配查询,以确定与所述输入字符串对应的所述输入词条,以作为与所述输入字符串对应的输入候选项,其中,所述输入字符串与所述输入词条中至少一个分词相匹配。具体地,匹配装置15’通过从输入框中接收用户或其他应用等通过输入、选择、点击等操作所输入的字符串;或者根据各种通信协议(Communications Protocol),通过各种数据传输接口,获取从其他应用的输入框中的字符串;其中,所述输入框如短信编辑框、内容输入框等。其中,所述输入字符串包括但不限于通过如全拼或简拼等方式所输入的拼音编码字符等;匹配装置15’根据所述输入字符串,在所述更新装置14’所更新或建立的输入词库中进行匹配查询,若存在于所述输入字符串相对应的输入词条,则将所述输入词条作为与所述输入字符串对应的输入候选项;其中,所述输入字符串与所述输入词条中至少一个分词相匹配。例如,当所述用户的输入字符串为“zhangjiang”,则所述匹配装置15’在所述输入词库中进行匹配查询,得到输入候选项“张江高科”。
优选地,所述更新装置14’还可以根据所述输入词条,并结合所述输入词库中所述用户的历史输入词条的使用相关信息,建立或更新所述输入词库。具体地,所述更新装置14’还可以从转化装置13’获取一个或多个输入词条,若所述输入词库不存在,则利用所述一个或多个输入词条中至少一个,建立所述输入词库;若所获取的输入词条在所述输入词库中不存在,则对所述输入词库进行更新,将所述输入词条添加至所述输入词库中;若所获取的输入词条在所述输入词库中存在,则结合所述输入词库中所述用户的对该所述词条的历史使用相关信息,如若所述词条的使用频率较高,则在所述输入词库中提高所述输入词条对应与相关输入字符串的排序;若所述输入词库中,所述用户的历史输入词条的使用相关信息为使用次数小于一定的阈值次数,或所述历史输入词条的最后一次使用时间距离当前时间超过一定的时间阈值,则所述更新装置14’将所述历史输入词条进行删除,从而对所述输入词库进行更新。其中,所述使用相关信息包括但不限于使用次数、使用频率、最后一次使用时间等。进一步地,所述更新装置14’还可以根据预定的输入词条存储阈值,如所述输入词库中仅能存储上限为N的输入词条对,则所述更新装置14’结合所述使用相关信息,对所述输入词库中的历史输入词条进行筛选等;从而满足终端,特别是移动终端上的资源利用率要求。
图3示出根据本发明另一个方面的一种用于根据用户的输入信息构建输入词条的方法流程图。具体地,在步骤s1中,处理设备根据用户的输入记录信息,获取对应的一个或多个候选输入词条,其中,所述候选输入词条包括所述输入记录信息中满足间隔阈值要求的两个或多个分词;在步骤s2中,处理设备检测是否满足将所述候选输入词条转化为输入词条的触发条件;当满足所述触发条件,在步骤s3中,处理设备将对应的所述候选输入词条转化为输入词条。
上述各步骤之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各步骤分别实时地或者按照设定的或实时调整的工作模式要求,进行候选输入词条的获取、触发条件的检测、输入词条的转化等,直至处理设备停止获取对应的一个或多个候选输入词条。
在步骤s1中,处理设备根据用户的输入记录信息,获取对应的一个或多个候选输入词条,其中,所述候选输入词条包括所述输入记录信息中满足间隔阈值要求的两个或多个分词。具体地,在步骤s1中,处理设备例如通过根据各种通信协议(Communications Protocol),通过各种数据传输接口,与第三方的输入记录信息数据库交互,获取用户的输入记录信息;或者直接获取用户的输入记录信息日志,以获取用户的输入记录信息;或者通过实时从例如输入框中接收用户或其他应用等通过输入、选择、点击等操作所输入的一个或多个输入记录信息,在此,所述输入框如短信编辑框、内容输入框等。其中,所述输入记录信息中包含一条或多条输入记录,所述输入记录中包含一个或多个分词信息。在步骤s1中,处理设备根据用户的输入记录信息中的一个或多个分词信息,将满足间隔阈值要求的两个或多个分词确定为候选输入词条,其中,所述间隔阈值要求包括但不限于时间间隔、频次间隔、符号间隔等。其中,所述时间间隔例如,用户先输入“张江”上屏,再输入“高科”上屏,若前后两次连续上屏的时间间隔小于一定的间隔阈值要求T,则将“张江高科”确定为候选输入词条;所述频次间隔例如,在所述用户的输入记录信息中,可以查询得到n次“用户先输入‘张江’上屏,再输入‘高科’上屏”的记录,则当查询得到的次数n大于频次间隔N时,将“张江高科”确定为候选输入词条;另外,通常仅考虑连续上屏的分词构成候选输入词条,但实际用户输入中可能在本应连续上屏的分词间***了空格或其他字符,因此,所述符号间隔例如,用户先输入“张江”上屏,然后输入空格或其他符号间隔中所包含的符号,再输入“高科”上屏,则在步骤s1中,处理设备也将“张江高科”确定为候选输入词条;在此,所述其他符号不包括逗号、句号等标点符号。在此,本领域技术人员应能理解,候选输入词条的获取,可以是实时获得的,例如连续上屏的分词;也可以经由线下处理所获得,例如对于历史的输入信息,进行分词处理、间隔阈值判断等处理后获得等。
在步骤s2中,处理设备检测是否满足将所述候选输入词条转化为输入词条的触发条件。具体地,在步骤s2中,处理设备根据步骤s1中所获取的一个或多个候选输入词条,通过实时或线下等的统计、比较等方式,将所述候选输入词条的相关信息,与所述触发条件进行对比判断,从而检测是否满足将所述候选输入词条转化为输入词条的触发条件。
优选地,所述触发条件包括以下至少任一项:
-所述候选输入词条的累计频次超过预定的词条转化频次阈值;例如,若预定的词条转化阈值频次为3,则当所述候选输入词条的累计频次大于等于3时,则确认所述候选输入词条满足转化为输入词条的触发条件;在此,所述词条转化频次阈值可能小于或等于所述步骤s1中的间隔阈值,例如当所述间隔阈值为频次间隔时,所述间隔阈值为2,而所述词条转化阈值频次为3等;
-包含所述候选输入词条的在线搜索结果的数量超过预定的在线数量阈值;例如,在步骤s2中,处理设备通过在线搜索所述候选输入词条,以获取包含所述候选输入词条的在线搜索结果数量;或者通过与能够提供包含所述候选输入词条的第三方设备或数据库等进行交互,以获取所述候选输入词条的在线搜索结果数量;若包含所述候选输入词条的在线搜索结果的数量k超过预定的在线数量阈值K,则确认所述候选输入词条满足转化为输入词条的触发条件;在此,由于单一用户的输入数量往往较少,可能不能及时满足输入词条转化的要求,因此可以参考其他用户的输入或其他来源信息,例如候选词条“张江高科”,那么可结合“张江高科”所对应的搜索结果的数量来判断是否转化,而不必等待该用户的输入频次满足要求;从而提高转化的效率,相应地也提高了用户的输入效率。
-在所述输入记录信息对应的应用中,包含所述候选输入词条的应用输入结果的数量超过预定的应用数量阈值;具体地,若所述输入记录信息对应特定的应用,例如,所述输入记录信息属于某一个应用的日志信息,则在步骤s2中,处理设备通过在线搜索与所述应用相对应的如其他用户的、包含所述候选输入词条的应用输入信息或是通过与能够包含所述候选输入词条的第三方设备或数据库等交互,以获取包含所述候选输入词条的应用输入结果;若包含所述候选输入词条的应用输入结果的数量超过预定的应用数量阈值,确认所述候选输入词条满足转化为输入词条的触发条件;例如,所述输入记录信息对应的应用为游戏“植物大战僵尸”,所述用户的候选输入词条为“僵王博士”,则在步骤s2中,处理设备对“植物大战僵尸”的相关应用输入结果进行检测,若包含“僵王博士”的应用输入结果数量超过预定的应用数量阈值,则确认所述候选输入词条满足转化为输入词条的触发条件;该方式与所述在线搜索结果相似,更强调应用的相关性,从而获取更具针对性的检测结果。
当满足所述触发条件,在步骤s3中,处理设备将对应的所述候选输入词条转化为输入词条。具体地,若在步骤s2中,处理设备确认满足将所述候选输入词条转化为输入词条的触发条件,在步骤s3中,处理设备则将所述对应的满足触发条件的所述候选输入词条,转化为输入词条。例如,将连续上屏且满足所述触发条件的“张江”、“高科”转化为输入词条“张江高科”。
优选地,当所述触发条件包括所述候选输入词条的累计频次超过预定的词条转化频次阈值;在步骤s2中,处理设备还可以根据所述候选输入词条所对应的输入记录相关信息,加权确定所述候选输入词条的累计频次;检测所述累计频次是否超过预定的词条转化频次阈值。具体地,当所述触发条件包括所述候选输入词条的累计频次超过预定的词条转化频次阈值时,在步骤s2中,处理设备还可以通过对所述候选输入词条所对应的输入记录相关信息进行实时获取或通过第三方等方式线下获取,根据所述输入记录相关信息,通过***预置或实时设置、或者根据用户的使用频率动态调整等方式,为不同的输入记录相关信息所对应的所述候选输入词条的累计频次设置不同的权重,从而加权确定所述候选输入词条的累计频次;例如,若所述输入记录相关信息为所述输入词条所对应的输入记录信息所属的应用信息,对于同一个候选输入词条,若其获取来源为office word文档,则设置其每频次的权重为1,而若其获取来源为bbs,则设置其每频次的权重为0.5,从而所述候选输入词条的累计频次确定方式为:累计频次=1*候选输入词条在office word文档中的频次+0.5*候选输入词条在bbs中的频次。在步骤s2中,处理设备对所述累计频次与预定的词条转化频次阈值进行比较,从而检测所述累计频次是否超过预定的词条转化频次阈值。
更优选地,其中,所述输入记录相关信息包括以下至少任一项:
-所述候选输入词条所对应的输入记录信息所属的应用信息;例如,若所述输入记录信息所对应的应用为word与论坛bbs,则认为word中的输入记录信息所得到的候选输入词条具有更高权重,而在论坛bbs帖中的则权重较低;
-所述候选输入词条所对应的输入记录信息的文字数量信息;例如,若输入记录信息的文字数量信息超过一定的阈值,则认为所述输入记录信息中所获得的候选输入词条的权重越高,例如,若所述输入记录信息的文字数量信息超过1000,则将所述候选输入词条的权重定为1,若所述输入记录信息的文字数量信息超过10000,则将所述候选输入词条的权重定为2;在此,考虑到若一次输入文字的数量越多,该输入信息越正式,因此,在计算候选输入词条的累计频次时权重越高;
-所述候选输入词条所对应的输入记录信息所对应的终端类型信息;例如,若所述输入记录信息对应的终端类型信息为移动终端,则将所述候选输入词条所的权重定为0.5,若所述输入记录信息对应的终端类型为PC端,则将所述候选输入词条所的权重定为1;或者,若认为所述移动终端应对应更高的权重,从而使得移动终端的输入更易于被收录,则设定所述移动终端所对应的候选输入词条的权重高于所述PC端;从而考虑到不同的终端类型、以及所述终端类型所对应的应用等所对应的重要性不同。
优选地,当所述触发条件包括包含所述候选输入词条的在线搜索结果的数量超过预定的在线数量阈值;在步骤s2中,处理设备还可以获取与所述候选输入词条相对应的在线搜索结果,以确定所述在线搜索结果的数量;检测所述在线搜索结果的数量是否超过预定的在线数量阈值。具体地,当所述触发条件包括包含所述候选输入词条的在线搜索结果的数量超过预定的在线数量阈值时,在步骤s2中,处理设备通过在线搜索所述候选输入词条,以获取包含所述候选输入词条的在线搜索结果数量;或者通过与能够提供包含所述候选输入词条的第三方设备或数据库等进行交互,以获取所述候选输入词条的在线搜索结果数量;若包含所述候选输入词条的在线搜索结果的数量k超过预定的在线数量阈值K,则确认所述候选输入词条满足转化为输入词条的触发条件。
优选地,在步骤s1中,处理设备还可以对用户的输入记录信息进行分词处理,以获得对应的一个或多个分词;根据间隔阈值要求,确定对应的一个或多个候选输入词条,其中,所述候选输入词条包括所述输入记录信息中满足间隔阈值要求的两个或多个所述分词。具体地,在步骤s1中,处理设备通过例如通过根据各种通信协议(CommunicationsProtocol),通过各种数据传输接口,与第三方的输入记录信息数据库交互,获取用户的输入记录信息;或者直接获取用户的输入记录信息日志,以获取用户的输入记录信息;或者通过实时从例如输入框中接收用户或其他应用等通过输入、选择、点击等操作所输入的一个或多个输入记录信息,在此,所述输入框如短信编辑框、内容输入框等。在步骤s1中,处理设备通过对用户的输入记录信息进行分词处理,以获得对应的一个或多个分词。在步骤s1中,处理设备根据预定的间隔阈值要求,当所述一个或多个分词满足所述间隔阈值要求时,则将所述两个或多个分词确定为候选输入词条,其中,所述间隔阈值要求包括但不限于时间间隔、频次间隔、符号间隔等。在此,例如,若考虑到可能存在误输入的空格或其他字符,所述间隔阈值可取0-2个字符,以保证一定的容错性,从而提高转化效率和输入效率。在此,所述间隔阈值中的符号若包括逗号、句号等标点符号时,则被所述标点符号所分割的两个或多个所述分词不被确定为所述候选输入词条。
更优选地,在步骤s1中,该方法还包括步骤s11(未示出),其中,在步骤s11中,处理设备根据预定的筛选规则,对所述一个或多个候选输入词条进行筛选处理,以获得筛选后的候选输入词条,以供后续处理。具体地,在步骤s11中,处理设备通过根据预置或实时设置的预定的筛选规则,对所述一个或多个候选输入词条进行筛选处理;其中,所述预定的筛选规则包括但不限于基于所述候选输入词条的词性、属性、字数等进行筛选,例如,仅提取字数小于等于6的候选输入词条,或是仅提取姓名的候选输入词条,或是仅提取名词组合(如“张江高科”)的候选输入词条,或是仅提取动宾组合(如“申请专利”)的候选输入词条等,从而获得筛选后的候选输入词条,以供后续处理。从而更具针对性的对所述候选输入词条进行获取,以助于提高转化效率和输入效率。
图4示出根据本发明一个优选实施例的一种用于根据用户的输入信息构建输入词条的方法流程图。具体地,在步骤s1’中,处理设备根据用户的输入记录信息,获取对应的一个或多个候选输入词条,其中,所述候选输入词条包括所述输入记录信息中满足间隔阈值要求的两个或多个分词;在步骤s2’中,处理设备检测是否满足将所述候选输入词条转化为输入词条的触发条件;当满足所述触发条件,在步骤s3’中,处理设备将对应的所述候选输入词条转化为输入词条;在步骤s4’中,处理设备根据所述输入词条建立或更新输入词库;在步骤s5’中,处理设备根据所述用户的输入字符串,在所述输入词库中进行匹配查询,以确定与所述输入字符串对应的所述输入词条,以作为与所述输入字符串对应的输入候选项,其中,所述输入字符串与所述输入词条中至少一个分词相匹配。其中,所述步骤s1’、步骤s2’、步骤s3’与图3所示对应步骤相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
上述各步骤之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各步骤分别实时地或者按照设定的或实时调整的工作模式要求,进行候选输入词条的获取、触发条件的检测、输入词条的转化、输入词库的更新、输入候选项的确定等,直至处理设备停止获取对应的一个或多个候选输入词条。
在步骤s4’中,处理设备根据所述输入词条建立或更新输入词库。具体地,在步骤s4’中,处理设备通过从步骤s3’中获取一个或多个输入词条,并将所述一个或多个输入词条中至少一个,更新至所述输入词库中;若所述输入词库不存在,则利用所述一个或多个输入词条中至少一个,建立所述输入词库。
在步骤s5’中,处理设备根据所述用户的输入字符串,在所述输入词库中进行匹配查询,以确定与所述输入字符串对应的所述输入词条,以作为与所述输入字符串对应的输入候选项,其中,所述输入字符串与所述输入词条中至少一个分词相匹配。具体地,在步骤s5’中,处理设备通过从输入框中接收用户或其他应用等通过输入、选择、点击等操作所输入的字符串;或者根据各种通信协议(CommunicationsProtocol),通过各种数据传输接口,获取从其他应用的输入框中的字符串;其中,所述输入框如短信编辑框、内容输入框等。其中,所述输入字符串包括但不限于通过如全拼或简拼等方式所输入的拼音编码字符等;在步骤s5’中,处理设备根据所述输入字符串,在处理设备所更新或建立的输入词库中进行匹配查询,若存在于所述输入字符串相对应的输入词条,则将所述输入词条作为与所述输入字符串对应的输入候选项;其中,所述输入字符串与所述输入词条中至少一个分词相匹配。例如,当所述用户的输入字符串为“zhangjiang”,则在步骤s5’中,处理设备在所述输入词库中进行匹配查询,得到输入候选项“张江高科”。
优选地,在步骤s4’中,处理设备还可以根据所述输入词条,并结合所述输入词库中所述用户的历史输入词条的使用相关信息,建立或更新所述输入词库。具体地,在步骤s4’中,处理设备还可以从步骤s3’中获取一个或多个输入词条,若所述输入词库不存在,则利用所述一个或多个输入词条中至少一个,建立所述输入词库;若所获取的输入词条在所述输入词库中不存在,则对所述输入词库进行更新,将所述输入词条添加至所述输入词库中;若所获取的输入词条在所述输入词库中存在,则结合所述输入词库中所述用户的对该所述词条的历史使用相关信息,如若所述词条的使用频率较高,则在所述输入词库中提高所述输入词条对应与相关输入字符串的排序;若所述输入词库中,所述用户的历史输入词条的使用相关信息为使用次数小于一定的阈值次数,或所述历史输入词条的最后一次使用时间距离当前时间超过一定的时间阈值,则在步骤s4’中,处理设备将所述历史输入词条进行删除,从而对所述输入词库进行更新。其中,所述使用相关信息包括但不限于使用次数、使用频率、最后一次使用时间等。进一步地,在步骤s4’中,处理设备还可以根据预定的输入词条存储阈值,如所述输入词库中仅能存储上限为N的输入词条对,则在步骤s4’中,处理设备结合所述使用相关信息,对所述输入词库中的历史输入词条进行筛选等;从而满足终端,特别是移动终端上的资源利用率要求。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (18)

1.一种用于根据用户的输入信息构建输入词条的方法,其中,该方法包括以下步骤:
a根据用户的输入记录信息,获取对应的一个或多个候选输入词条,其中,所述候选输入词条包括所述输入记录信息中满足间隔阈值要求的两个或多个分词;
b检测是否满足将所述候选输入词条转化为输入词条的触发条件;
c当满足所述触发条件,将对应的所述候选输入词条转化为输入词条。
2.根据权利要求1所述的方法,其中,所述触发条件包括以下至少任一项:
-所述候选输入词条的累计频次超过预定的词条转化频次阈值;
-包含所述候选输入词条的在线搜索结果的数量超过预定的在线数量阈值;
-在所述输入记录信息对应的应用中,包含所述候选输入词条的应用输入结果的数量超过预定的应用数量阈值。
3.根据权利要求2所述的方法,其中,所述触发条件包括所述候选输入词条的累计频次超过预定的词条转化频次阈值;
其中,所述步骤b包括:
-根据所述候选输入词条所对应的输入记录相关信息,加权确定所述候选输入词条的累计频次;
-检测所述累计频次是否超过预定的词条转化频次阈值。
4.根据权利要求3所述的方法,其中,所述输入记录相关信息包括以下至少任一项:
-所述候选输入词条所对应的输入记录信息所属的应用信息;
-所述候选输入词条所对应的输入记录信息的文字数量信息;
-所述候选输入词条所对应的输入记录信息所对应的终端类型信息。
5.根据权利要求2所述的方法,其中,所述触发条件包括包含所述候选输入词条的在线搜索结果的数量超过预定的在线数量阈值;
其中,所述步骤b包括:
-获取与所述候选输入词条相对应的在线搜索结果,以确定所述在线搜索结果的数量;
-检测所述在线搜索结果的数量是否超过预定的在线数量阈值。
6.根据权利要求1至5中任一项所述的方法,其中,所述步骤a包括:
-对用户的输入记录信息进行分词处理,以获得对应的一个或多个分词;
-根据间隔阈值要求,确定对应的一个或多个候选输入词条,其中,所述候选输入词条包括所述输入记录信息中满足间隔阈值要求的两个或多个所述分词。
7.根据权利要求6所述的方法,其中,所述步骤a还包括:
-根据预定的筛选规则,对所述一个或多个候选输入词条进行筛选处理,以获得筛选后的候选输入词条,以供后续处理。
8.根据权利要求1至7中任一项所述的方法,其中,该方法还包括:
r根据所述输入词条建立或更新输入词库;
其中,该方法还包括:
x根据所述用户的输入字符串,在所述输入词库中进行匹配查询,以确定与所述输入字符串对应的所述输入词条,以作为与所述输入字符串对应的输入候选项,其中,所述输入字符串与所述输入词条中至少一个分词相匹配。
9.根据权利要求8所述的方法,其中,所述步骤r包括:
-根据所述输入词条,并结合所述输入词库中所述用户的历史输入词条的使用相关信息,建立或更新所述输入词库。
10.一种用于根据用户的输入信息构建输入词条的处理设备,其中,该设备包括:
获取装置,用于根据用户的输入记录信息,获取对应的一个或多个候选输入词条,其中,所述候选输入词条包括所述输入记录信息中满足间隔阈值要求的两个或多个分词;
检测装置,用于检测是否满足将所述候选输入词条转化为输入词条的触发条件;
转化装置,用于当满足所述触发条件,将对应的所述候选输入词条转化为输入词条。
11.根据权利要求10所述的处理设备,其中,所述触发条件包括以下至少任一项:
-所述候选输入词条的累计频次超过预定的词条转化频次阈值;
-包含所述候选输入词条的在线搜索结果的数量超过预定的在线数量阈值;
-在所述输入记录信息对应的应用中,包含所述候选输入词条的应用输入结果的数量超过预定的应用数量阈值。
12.根据权利要求11所述的处理设备,其中,所述触发条件包括所述候选输入词条的累计频次超过预定的词条转化频次阈值;
其中,所述检测装置用于:
-根据所述候选输入词条所对应的输入记录相关信息,加权确定所述候选输入词条的累计频次;
-检测所述累计频次是否超过预定的词条转化频次阈值。
13.根据权利要求12所述的处理设备,其中,所述输入记录相关信息包括以下至少任一项:
-所述候选输入词条所对应的输入记录信息所属的应用信息;
-所述候选输入词条所对应的输入记录信息的文字数量信息;
-所述候选输入词条所对应的输入记录信息所对应的终端类型信息。
14.根据权利要求11所述的处理设备,其中,所述触发条件包括包含所述候选输入词条的在线搜索结果的数量超过预定的在线数量阈值;
其中,所述检测装置用于:
-获取与所述候选输入词条相对应的在线搜索结果,以确定所述在线搜索结果的数量;
-检测所述在线搜索结果的数量是否超过预定的在线数量阈值。
15.根据权利要求10至14中任一项所述的处理设备,其中,所述获取装置用于:
-对用户的输入记录信息进行分词处理,以获得对应的一个或多个分词;
-根据间隔阈值要求,确定对应的一个或多个候选输入词条,其中,所述候选输入词条包括所述输入记录信息中满足间隔阈值要求的两个或多个所述分词。
16.根据权利要求15所述的处理设备,其中,所述获取装置还包括:
筛选单元,用于根据预定的筛选规则,对所述一个或多个候选输入词条进行筛选处理,以获得筛选后的候选输入词条,以供后续处理。
17.根据权利要求10至16中任一项所述的处理设备,其中,该设备还包括:
更新装置,用于根据所述输入词条建立或更新输入词库;
其中,该设备还包括:
匹配装置,用于根据所述用户的输入字符串,在所述输入词库中进行匹配查询,以确定与所述输入字符串对应的所述输入词条,以作为与所述输入字符串对应的输入候选项,其中,所述输入字符串与所述输入词条中至少一个分词相匹配。
18.根据权利要求17所述的处理设备,其中,所述更新装置用于:
-根据所述输入词条,并结合所述输入词库中所述用户的历史输入词条的使用相关信息,建立或更新所述输入词库。
CN201210592842.1A 2012-12-31 2012-12-31 一种根据用户的输入信息构建输入词条的方法与设备 Active CN103092826B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210592842.1A CN103092826B (zh) 2012-12-31 2012-12-31 一种根据用户的输入信息构建输入词条的方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210592842.1A CN103092826B (zh) 2012-12-31 2012-12-31 一种根据用户的输入信息构建输入词条的方法与设备

Publications (2)

Publication Number Publication Date
CN103092826A true CN103092826A (zh) 2013-05-08
CN103092826B CN103092826B (zh) 2018-06-05

Family

ID=48205414

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210592842.1A Active CN103092826B (zh) 2012-12-31 2012-12-31 一种根据用户的输入信息构建输入词条的方法与设备

Country Status (1)

Country Link
CN (1) CN103092826B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106445365A (zh) * 2016-09-12 2017-02-22 上海斐讯数据通信技术有限公司 一种情绪调整方法及智能终端
CN106484135A (zh) * 2016-09-23 2017-03-08 百度在线网络技术(北京)有限公司 一种用于提供输入候选项的方法与装置
CN108304367A (zh) * 2017-04-07 2018-07-20 腾讯科技(深圳)有限公司 分词方法及装置
CN108700952A (zh) * 2016-02-29 2018-10-23 三星电子株式会社 基于用户人口统计信息和情境信息预测文本输入
CN109426356A (zh) * 2017-09-01 2019-03-05 百度在线网络技术(北京)有限公司 信息输入方法和装置
CN109426357A (zh) * 2017-09-01 2019-03-05 百度在线网络技术(北京)有限公司 信息输入方法和装置
CN109783244A (zh) * 2017-11-10 2019-05-21 北京搜狗科技发展有限公司 处理方法和装置、用于处理的装置
CN110244861A (zh) * 2018-03-09 2019-09-17 北京搜狗科技发展有限公司 数据处理方法和装置
CN113703590A (zh) * 2021-08-13 2021-11-26 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
CN113761141A (zh) * 2020-09-03 2021-12-07 北京沃东天骏信息技术有限公司 一种词条显示方法、装置、电子设备以及可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101118556A (zh) * 2007-09-17 2008-02-06 中国科学院计算技术研究所 一种短文本的新词发现方法和***
CN101276361A (zh) * 2007-03-28 2008-10-01 阿里巴巴集团控股有限公司 一种显示相关关键词的方法及***
EP2090992A2 (en) * 2008-02-13 2009-08-19 Fujitsu Limited Determining words related to a given set of words
CN101520786A (zh) * 2008-02-27 2009-09-02 北京搜狗科技发展有限公司 一种输入法词典的实现方法和输入法***
US20090248674A1 (en) * 2008-03-27 2009-10-01 Kabushiki Kaisha Toshiba Search keyword improvement apparatus, server and method
CN101634927A (zh) * 2008-12-04 2010-01-27 北京搜狗科技发展有限公司 一种字符输入过程中展现候选项的方法及装置
CN101697099A (zh) * 2009-10-26 2010-04-21 北京搜狗科技发展有限公司 一种字词转换结果的获取方法及***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101276361A (zh) * 2007-03-28 2008-10-01 阿里巴巴集团控股有限公司 一种显示相关关键词的方法及***
CN101118556A (zh) * 2007-09-17 2008-02-06 中国科学院计算技术研究所 一种短文本的新词发现方法和***
EP2090992A2 (en) * 2008-02-13 2009-08-19 Fujitsu Limited Determining words related to a given set of words
CN101520786A (zh) * 2008-02-27 2009-09-02 北京搜狗科技发展有限公司 一种输入法词典的实现方法和输入法***
US20090248674A1 (en) * 2008-03-27 2009-10-01 Kabushiki Kaisha Toshiba Search keyword improvement apparatus, server and method
CN101634927A (zh) * 2008-12-04 2010-01-27 北京搜狗科技发展有限公司 一种字符输入过程中展现候选项的方法及装置
CN101697099A (zh) * 2009-10-26 2010-04-21 北京搜狗科技发展有限公司 一种字词转换结果的获取方法及***

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108700952A (zh) * 2016-02-29 2018-10-23 三星电子株式会社 基于用户人口统计信息和情境信息预测文本输入
CN106445365A (zh) * 2016-09-12 2017-02-22 上海斐讯数据通信技术有限公司 一种情绪调整方法及智能终端
CN106484135B (zh) * 2016-09-23 2019-03-19 百度在线网络技术(北京)有限公司 一种用于提供输入候选项的方法与装置
CN106484135A (zh) * 2016-09-23 2017-03-08 百度在线网络技术(北京)有限公司 一种用于提供输入候选项的方法与装置
CN108304367A (zh) * 2017-04-07 2018-07-20 腾讯科技(深圳)有限公司 分词方法及装置
CN109426356A (zh) * 2017-09-01 2019-03-05 百度在线网络技术(北京)有限公司 信息输入方法和装置
CN109426357A (zh) * 2017-09-01 2019-03-05 百度在线网络技术(北京)有限公司 信息输入方法和装置
CN109426356B (zh) * 2017-09-01 2022-07-15 百度在线网络技术(北京)有限公司 信息输入方法和装置
CN109783244A (zh) * 2017-11-10 2019-05-21 北京搜狗科技发展有限公司 处理方法和装置、用于处理的装置
CN109783244B (zh) * 2017-11-10 2021-06-22 北京搜狗科技发展有限公司 处理方法和装置、用于处理的装置
CN110244861A (zh) * 2018-03-09 2019-09-17 北京搜狗科技发展有限公司 数据处理方法和装置
CN110244861B (zh) * 2018-03-09 2024-02-02 北京搜狗科技发展有限公司 数据处理方法和装置
CN113761141A (zh) * 2020-09-03 2021-12-07 北京沃东天骏信息技术有限公司 一种词条显示方法、装置、电子设备以及可读存储介质
CN113703590A (zh) * 2021-08-13 2021-11-26 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置

Also Published As

Publication number Publication date
CN103092826B (zh) 2018-06-05

Similar Documents

Publication Publication Date Title
CN103092826A (zh) 一种根据用户的输入信息构建输入词条的方法与设备
CN103076892B (zh) 一种用于提供输入字符串所对应的输入候选项的方法与设备
CN102306171B (zh) 一种用于提供网络访问建议和网络搜索建议的方法与设备
US10199036B2 (en) Method and device for implementing voice input
CN110929203B (zh) 异常用户的识别方法、装置、设备及存储介质
CN104298672A (zh) 一种输入的纠错方法和装置
CN102339311B (zh) 在用户设备上基于查询分类搜索网页内容的方法与设备
CN103870553A (zh) 一种输入资源推送方法及***
CN102306287A (zh) 一种用于识别敏感图像的方法与设备
CN103514230A (zh) 一种用于根据语料序列训练语言模型的方法与设备
CN106844550B (zh) 一种虚拟化平台操作推荐方法及装置
CN102298617A (zh) 一种用于获取目标页面的方法与设备
CN103713894A (zh) 一种用于确定用户的访问需求信息的方法与设备
CN104660688A (zh) 一种获取登录信息的方法与装置
CN103970832A (zh) 一种识别垃圾信息的方法与装置
US20120054598A1 (en) Method and system for viewing web page and computer Program product thereof
CN103886238A (zh) 一种基于掌纹的账户登录方法及装置
CN102402552B (zh) 一种基于分析结果提供推广账户优化建议的方法与设备
CN102184201A (zh) 一种用于选取查询序列的推荐序列的设备和方法
CN103076894A (zh) 一种用于根据对象标识信息构建输入词条的方法与设备
CN102156724A (zh) 一种用于对查询片段进行后缀匹配的方法与设备
CN109376362A (zh) 一种纠错文本的确定方法以及相关设备
CN103064967B (zh) 一种用于建立用户二元关系库的方法与设备
CN105045890A (zh) 确定目标新闻源中的热点新闻的方法与设备
CN113239256A (zh) 生成网站签名的方法、识别网站的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant