CN105335415A - 基于输入预测的搜索方法和输入法*** - Google Patents

基于输入预测的搜索方法和输入法*** Download PDF

Info

Publication number
CN105335415A
CN105335415A CN201410379907.3A CN201410379907A CN105335415A CN 105335415 A CN105335415 A CN 105335415A CN 201410379907 A CN201410379907 A CN 201410379907A CN 105335415 A CN105335415 A CN 105335415A
Authority
CN
China
Prior art keywords
candidate
sequence
character string
current input
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410379907.3A
Other languages
English (en)
Inventor
张帅
王东
光芊源
余浩
张阔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201410379907.3A priority Critical patent/CN105335415A/zh
Publication of CN105335415A publication Critical patent/CN105335415A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明提供了一种基于输入预测的搜索方法和输入法***,以解决现有搜索操作繁琐,效率较低的问题。所述的方法包括:接收用户输入的当前输入信息,其中,所述当前输入信息包括当前输入字符串和时间间隔信息;依据所述时间间隔信息实时对所述当前输入字符串进行切分,并转换得到所述当前输入字符串对应的候选序列集合;对所述候选序列集合中的每个候选序列分别进行搜索,获取各候选序列各自对应的搜索结果,并依据所述候选序列集合和对应的搜索结果进行反馈。在输入过程中依据时间间隔信息实时切分可以准确、快捷的得到切分结果,提高了输入匹配度,且无需在搜索引擎的搜索框中输入搜索即可获取想要的搜索结果,操作简便、快捷,提高了搜索效率。

Description

基于输入预测的搜索方法和输入法***
技术领域
本发明涉及输入法技术领域,特别是涉及一种基于输入预测的搜索方法和一种输入法***。
背景技术
用户在网络中搜索信息时,通常是打开浏览器,在浏览器主页的搜索框或在浏览器中进入搜索引擎的搜索页面中进行搜索的。
在搜索框或搜索页面中使用输入法敲击键盘输入一串输入序列,输入法提供若干个候选词,用户不断选择满足需求的候选词上屏,直到可以完整表达用户想要搜索的关键词。然后用户点击“搜索”按钮发送搜索请求得到网页搜索结果。
现有技术需要用户根据输入序列在得到的各候选项中不断进行筛选,得到的目标候选上屏后,再触发搜索命令得到对应的搜索结果,操作繁琐,效率较低。
发明内容
本发明实施例所要解决的技术问题是提供一种基于输入预测的搜索方法,以解决现有搜索操作繁琐,效率较低的问题。
相应的,本发明实施例还提供了一种输入法***,用以保证上述方法的实现及应用。
为了解决上述问题,本发明公开了一种基于输入预测的搜索方法,包括:接收用户输入的当前输入信息,其中,所述当前输入信息包括当前输入字符串和时间间隔信息;依据所述时间间隔信息实时对所述当前输入字符串进行切分,并转换得到所述当前输入字符串对应的候选序列集合;对所述候选序列集合中的每个候选序列分别进行搜索,获取各候选序列各自对应的搜索结果,并依据所述候选序列集合和对应的搜索结果进行反馈。
可选的,所述时间间隔信息包括所述当前输入字符串中每两个相邻字符的停顿时间;所述依据所述时间间隔信息实时对所述当前输入字符串进行切分并转换得到候选序列集合,包括:当检测到输入过程中实时产生的停顿时间满足预设条件时,在所述当前输入字符串对应的输入位置处进行切分,获取所述当前输入字符串对应的各切分序列;对各切分序列依次进行转换并组合,得到所述当前输入字符串对应的候选序列集合。
可选的,所述当前输入信息还包括用户账号信息;所述依据所述时间间隔信息实时对所述当前输入字符串进行切分并转换得到候选序列之前,还包括:按照所述用户账号信息查找对应用户的平均停顿时间;采用所述用户的平均停顿时间分别对输入过程中实时产生的停顿时间进行归一化,得到实时产生的归一化停顿间隔。
可选的,还包括:将所述当前输入字符串中实时产生的归一化停顿间隔,依次与停顿阈值进行比较;当输入过程中实时产生的归一化停顿间隔大于所述停顿阈值时,确定所述实时产生的停顿时间满足预设条件。
可选的,所述的方法还包括用户的平均停顿时间的确定步骤:按照所述用户账号信息确定用户,并收集所述用户的历史输入信息;依据所述历史输入信息统计所述用户输入单个字符后停顿的时间,作为所述用户的平均停顿时间。
可选的,对各切分序列依次进行转换并组合,得到所述当前输入字符串对应的候选序列集合,包括:从预置索引中分别查找每个切分序列的至少一个候选汉字串;将各切分序列的候选汉字串进行组合,分别得到所述输入字符串对应的各汉字序列;在语言模型中分别获取各候选汉字序列的概率,并依据所述概率分别选取所述各汉字序列构成候选序列集合。
可选的,所述依据所述概率分别选取所述各汉字序列构成候选序列集合,包括:对各汉字序列按照所述概率由大到小进行排序,并将排在前N位的各汉字序列分别作为候选序列构成候选序列集合,其中N为正整数。
可选的,所述依据所述概率选取所述各汉字序列构成候选序列集合,包括:对各汉字序列按照所述概率由大到小进行排序,选取概率最大的汉字序列作为关键词;从搜索引擎的索引库中查询与所述关键词具有相关性的搜索词,并对查询到的搜索词按照对应的特征值进行排序;选取排在前M位的搜索词分别作为候选序列构成所述候选序列集合,其中M为正整数。
可选的,所述对所述候选序列集合中的每个候选序列分别进行搜索,获取各候选序列各自对应的搜索结果,包括:在搜索引擎中对所述候选序列集合中的每个候选序列依次进行搜索;针对每个候选序列的搜索结果,筛选所述搜索引擎反馈的排在前X位的搜索结果,其中X为正整数。
可选的,所述的方法还包括:对所述候选序列集合和对应的搜索结果分别进行展示,具体为:对所述候选序列集合中的候选序列依次进行展示;获取展示在首位的候选序列对应的各搜索结果并展示。
可选的,还包括:接收对所述候选序列的选取指示,确定选取的候选序列;获取所述选取的候选序列对应的各搜索结果,替换所述展示在首位的候选序列对应的各搜索结果进行展示。
相应的,本发明还公开了一种输入法***,包括:接收模块,用于接收用户输入的当前输入信息,其中,所述当前输入信息包括当前输入字符串和时间间隔信息;转换模块,用于依据所述时间间隔信息实时对所述当前输入字符串进行切分并转换得到所述当前输入字符串对应的候选序列集合;搜索模块,用于对所述候选序列集合中的每个候选序列分别进行搜索,获取各候选序列各自对应的搜索结果;反馈模块,用于依据所述候选序列集合和对应的搜索结果进行反馈。
可选的,所述时间间隔信息包括所述当前输入字符串中每两个相邻字符的停顿时间;所述转换模块,包括:切分子模块,用于当检测到输入过程中实时产生的停顿时间满足预设条件时,在所述当前输入字符串对应的输入位置处进行切分,获取所述当前输入字符串对应的各切分序列;转换子模块,用于对各切分序列依次进行转换并组合,得到所述当前输入字符串对应的候选序列集合。
可选的,所述当前输入信息还包括用户账号信息;所述转换模块,还包括:归一化子模块,用于按照所述用户账号信息查找对应用户的平均停顿时间;采用所述用户的平均停顿时间分别对输入过程中实时产生的停顿时间进行归一化,得到实时产生的归一化停顿间隔。
可选的,所述切分子模块,还用于将所述当前输入字符串中实时产生的归一化停顿间隔,依次与停顿阈值进行比较;当输入过程中实时产生的归一化停顿间隔大于所述停顿阈值时,确定所述实时产生的停顿时间满足预设条件。
可选的,所述搜索模块,包括:搜索子模块,用于在搜索引擎中对所述候选序列集合中的每个候选序列依次进行搜索;筛选子模块,用于针对每个候选序列的搜索结果,筛选所述搜索引擎反馈的排在前X位的搜索结果,其中X为正整数。
可选的,所述的***还包括:展示模块,用于对所述候选序列集合和对应的搜索结果分别进行展示;其中,所述展示模块,包括:第一展示子模块,用于对所述候选序列集合中的候选序列依次进行展示;第二展示子模块,用于获取展示在首位的候选序列对应的各搜索结果并展示。
可选的,所述的***还包括:指示模块,用于接收对所述候选序列的选取指示,确定选取的候选序列;则所述第二展示子模块,还用于获取所述选取的候选序列对应的各搜索结果,替换所述展示在首位的候选序列对应的各搜索结果进行展示。
与现有技术相比,本发明实施例包括以下优点:
接收用户输入的包括当前输入字符串和时间间隔信息的当前输入信息,通过当前输入信息进行输入预测,其中时间间隔信息表征了当前输入字符串在输入过程中的停顿时间,因此在用户的输入过程中,依据时间间隔信息实时对当前输入字符串进行切分可以准确、快捷的切分出字或词对应的字符串,提高了输入匹配度,从而转换得到准确的候选序列集合,再采用该候选序列集合中的每个候选序列分别进行搜索获取搜索结果,并依据所述候选序列集合和对应的搜索结果进行反馈,无需在搜索引擎的搜索框中将文字上屏即可直接通过输入法获取想要的搜索结果,操作简便、快捷,提高了搜索效率。
附图说明
图1是本发明的一种基于输入预测的搜索方法实施例的步骤流程图;
图2是本发明的另一种基于输入预测的搜索方法实施例的步骤流程图;
图3是本发明的一种基于输入预测的搜索方法可选实施例的步骤流程图;
图4是本发明实施例二中预设条件检测的步骤流程图;
图5是本发明实施例三中候选汉字串组合示意图;
图6是本发明实施例三中输入法客户端第一种展示示意图;
图7是本发明实施例三中输入法客户端第二种展示示意图;
图8是本发明一种输入法***实施例的结构框图;
图9是本发明实施例中输入法***的第一种可选实施例的结构框图;
图10是本发明实施例中输入法***的第二种可选实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明实施例的核心构思之一在于,提出一种基于输入预测的搜索方法,以解决现有搜索操作繁琐,效率较低的问题。接收用户输入的包括当前输入字符串和时间间隔信息的当前输入信息,通过当前输入信息进行输入预测,其中时间间隔信息表征了当前输入字符串在输入过程中的停顿时间,因此在用户的输入过程中,依据时间间隔信息实时对所述当前输入字符串进行切分可以准确、快捷的切分出字或词对应的字符串,提高了输入匹配度,从而转换得到准确的候选序列集合,再采用该候选序列集合中的每个候选序列分别进行搜索获取搜索结果,并将所述候选序列集合和对应的搜索结果直接反馈给所述输入法客户端,无需在搜索引擎的搜索框中输入搜索即可直接通过输入法获取想要的搜索结果,操作简便、快捷,提高了搜索效率。
实施例一
参照图1,示出了本发明的一种基于输入预测的搜索方法实施例的步骤流程图,具体可以包括如下步骤:
步骤102,服务器接收输入法客户端上传的当前输入信息。
本发明实施例在输入法的输入过程中依据输入字符串进行搜索以提高搜索效率。即输入法客户端在接收用户输入的字符构成输入字符串的过程中,实时地将当前输入信息上传给服务器。其中,所述当前输入信息包括当前输入字符串和时间间隔信息,所述时间间隔信息用于表征当前输入字符串中字符之间的输入时间间隔,即当前输入字符串在输入过程中的停顿时间。
其中,输入法客户端实时进行当前输入信息的上传操作,因此当用户每输入一个字符后,均可以将该字符和该字符与前一个字符的时间间隔信息进行上传,此时可以是增量上传,也可以与之前输入的未确定上屏选项的其他字符串合并上传,本发明实施例对此不做限定。
服务器会基于输入法客户端上传的当前输入信息进行后续的输入预测和搜索。
步骤104,服务器依据所述时间间隔信息实时对所述当前输入字符串进行切分并转换得到所述当前输入字符串对应的候选序列集合。
通过时间间隔信息可以确定字符输入时的停顿,通常用户在输入一连串字符串时,在连续输入一个字或词的各字符时,各字符间会存在一个较短的停顿,而在一个字或词对应的完整字符串在输入完成后,通常在字符串后会存在一个较长的停顿,因此通过字符间停顿时间的长短可以实时判定当前是刚输入一个字或词对应中间字符还是已经输入完毕一个完整的字符串,从而实现实时对输入字符串的切分。
服务器从时间间隔信息中获取当前输入字符串中各字符间的停顿时间,依据停顿时间确定输入到某字符时,是单个字符的输入完成还是一个字或词对应的完整字符串的输入完成,从而在判定输入完一个字词对应的字符串后,在该字符处进行实时切分,然后基于对所述当前输入字符串中后续字符进行检测,直到当前输入字符串全部切分完毕。然后对切分后的字符串进行实时转换,得到当前输入字符串对应的各候选序列,从而构成候选序列集合。
步骤106,服务器对所述候选序列集合中的每个候选序列分别进行搜索,获取各候选序列各自对应的搜索结果,并将所述候选序列集合和对应的搜索结果反馈给所述输入法客户端。
通过实时切分、转换预测出候选序列后,实时地从候选序列集合中取出各候选序列依次进行搜索,确定各候选序列的搜索结果,也可以仅检索部分候选序列的搜索结果,后续依据需求再对其他部分的候选序列进行搜索。然后将候选序列集合和对应的搜索结果反馈给输入法客户端。
其中,在对搜索结果进行反馈时,可以一次将各候选序列的搜索结果都进行反馈,而输入法客户端在接收到候选序列集合和各候选序列对应的搜索结果后,可以对各候选序列和搜索结果分别进行展示,如依次展示候选序列集合中的各候选序列,同时展示部分或全部候选序列对应的搜索结果。
也可以首次仅默认反馈排在首位的候选序列对应搜索结果,供用户初次进行快速展示,并利用用户查看,或者进行键盘操作将首位序列移至非首位序列的时间间隙时,另行传输非首位序列对应的搜索结果至输入法客户端进行显示,从而保证了搜索结果对应的数据能够快速的传输、显示,供用户进行查看。
本实施例在输入法中输入字符串后即可通过对输入字符串的预测确定候选序列,进而搜索候选序列的搜索结果进行展示,便于快速进行搜索。
上述提供了通过输入法客户端和服务器的交互实现基于输入预测的搜索实施例,实际处理中,还可以由输入法客户端独立执行输入的预测,仅采用服务器进行搜索,如图2所示具体包括如下操作步骤:
步骤202,输入法客户端接收当前用户输入的当前输入信息。
步骤204,输入法客户端依据所述时间间隔信息实时对所述当前输入字符串进行切分,并转换得到所述当前输入字符串对应的候选序列集合。
步骤206,将所述候选序列集合中的候选序列上述给服务器。
步骤208,服务器对所述候选序列集合中的每个候选序列分别进行搜索,获取各候选序列各自对应的搜索结果,并将所述候选序列集合和对应的搜索结果反馈给所述输入法客户端。
输入法客户端在用户输入过程中实时获取用户输入的当前输入字符串和时间间隔信息,从而可以按照时间间隔信息实时对当前输入字符串中输入停顿时间较长的两个字符间进行切分,例如,实时计算或预先从服务器中获取当前输入字符串的平均输入间隔,然后依据平均输入间隔确定在输入停顿时间较大的两个字符,从而确定字符间切分的位置,实现按照时间对当前输入字符串的切分,再进一步对切分后的字符串进行转换得到候选序列集合。
再将候选序列集合上传给服务器,此时可以依据网络情况上传候选序列集合中的部分或全部候选序列,从而采用服务器对候选序列进行搜索,搜索步骤与上述步骤106基本一致,因此不再赘述。
综上,本实施例可以依据网络情况确定在服务器或输入法客户端中执行按照时间实时切分字符串的操作步骤,从而实时预测出用户可能输入的候选序列,进而对候选序列进行快速检索,提高效率。
实施例二
在上述实施例的基础上,本实施例进一步论述对输入进行预测并基于预测进行搜索的方法。
参照图3,示出了本发明的一种基于输入预测的搜索方法可选实施例的步骤流程图,具体可以包括如下步骤:
步骤302,服务器接收输入法客户端上传的当前输入信息。
其中,所述当前输入信息包括当前输入字符串、时间间隔信息和用户账号信息,用户账号信息用于对用户进行标识,不同的用户具有不同的输入习惯、历史数据等信息,本发明实施例可以通过用户账号信息对不同的用户进行区分,以预测出最符合该用户意图的候选序列,得到准确的搜索结果进行推荐。
步骤304,服务器当检测到输入过程中实时产生的停顿时间满足预设条件时,在所述当前输入字符串对应的输入位置处进行切分,获取所述当前输入字符串对应的各切分序列。
服务器在接收到输入法客户端上传的当前输入信息后,可以依据时间间隔信息对当前输入字符串进行实时切分,其中,时间间隔信息包括输入过程中实时产生的停顿时间,该停顿时间包括随着用户在输入过程中所述当前输入字符串实时产生的两个相邻字符的停顿时间,即时间间隔信息中依次实时记录了用户在输入完一个字符到输入下一个字符之间的停顿时间,因此若当前输入字符串中包括n个字符,则时间间隔信息中包括(n-1)个相邻字符的停顿时间。
本发明实施例设置了预设条件用于确定如何对字符进行切分,在用户输入过程中,当检测到实时产生的两个相邻字符的停顿时间满足预设条件时,就可以在这两个相邻字符之间,即当前的输入位置处进行切分,从而依次判断输入过程中实时产生的停顿时间是否满足预设条件,就可以确定如何对当前输入字符串进行切分,得到输入字符串对应的各切分序列。当然该当前输入字符串直至对应的候选项上屏也可能不需要切分,本发明实施例对此不作限定。
其中,可以设置停顿阈值对输入过程中实时产生的停顿时间进行评价,当输入过程中实时产生的停顿时间大于该停顿阈值时,认为其满足预设条件,否则不满预设条件。
但是由于不同用户的输入***均停顿时间比较长,而电脑操作熟练的年轻人输入每个字符的平均停顿时间就会短很多。因此在设置停顿阈值时,可以针对不同的用户设置不同的停顿阈值,依据用户账号信息获取其对应的停顿阈值进行比较。
当然也可以为所有用户设置统一的停顿阈值,但此时要消除用户输入习惯的个体差异影响,如图4所示具体包括如下步骤:
步骤402,按照所述用户账号信息查找对应用户的平均停顿时间。
为了消除用户输入***均停顿时间,其中,所述平均停顿时间指的是用户在连续输入字符时的停顿时间,如用户连续输入一个字或词的两个相邻字符间的停顿时间。
其中,用户的平均停顿时间是通过如下步骤确定的:按照所述用户账号信息确定用户,并收集所述用户的历史输入信息;依据所述历史输入信息统计所述用户输入单个字符后停顿的时间,作为所述用户的平均停顿时间。
本发明实施例根据用户历史输入数据对不用用户的输入***均停顿时间,还可以在服务器端建立“用户-平均输入时间”映射表,用于对各用户的平均停顿时间进行存储。然后可以从“用户-平均输入时间”映射表中查找所述用户账号信息对应用户的平均停顿时间。
当然,在其他实施例中,还可以将根据某计算机的IP地址等标识信息,由服务器将涉及该计算机的“用户-平均输入时间”映射表的对应内容下发至该计算机,使输入法客户端根据对应用户的平均停顿时间对当前输入字符串进行实时切分。
步骤404,采用所述用户的平均停顿时间分别对输入过程中实时产生的停顿时间进行归一化,得到实时产生的归一化停顿间隔。
然后采用该用户的平均停顿时间对输入过程中实时产生的停顿时间进行归一化,即将每两个相邻字符的停顿时间分别除以该用户的平均停顿时间,消除不同用户间的个体差异,得到实时产生的归一化停顿间隔。
步骤406,依次检测所述当前输入字符串中实时产生的归一化停顿间隔是否大于停顿阈值。
将所述当前输入字符串中实时产生的归一化停顿间隔,依次与停顿阈值进行比较,检测实时产生的归一化停顿间隔是否大于所述停顿阈值。
若是,即实时产生的归一化停顿间隔大于所述停顿阈值,执行步骤408;若否,则返回步骤406继续检测,直到所述当前输入字符串所有相邻字符的归一化停顿间隔均完成检测为止,如完成输入等。
步骤408,所述实时产生的停顿时间满足预设条件。
当任意两个相邻字符的归一化停顿间隔大于所述停顿阈值时,确定所述相邻字符的停顿时间满足预设条件,后续可以在这两个相邻字符之间进行切分。
通过上述图4的步骤流程,可以消除用户输入习惯的个体差异影响,从而采用统一的停顿阈值确定实时产生的停顿时间是否满足预设条件,并在满足预设条件后执行步骤306。
步骤306,服务器对各切分序列依次进行转换并组合,得到所述当前输入字符串对应的候选序列集合。
输入字符串可能被切分出多个切分序列,对每个切分序列分别进行转换得到一个或多个候选汉字串,在输入字符串存在多个切分序列,可以对不同序列的候选汉字串进行组合,得到所述输入字符串对应的候选序列集合。当然输入字符串本身也可能无需切分将其作为一个切分序列,此时可直接转换得到一个或多个候选汉字串直接作为候选序列构成候选序列集合。
本发明一个可选实施例中,对各切分序列依次进行转换并组合,得到所述输入字符串对应的候选序列集合,包括:从预置索引中分别查找每个切分序列的至少一个候选汉字串;将各切分序列的候选汉字串进行组合,分别得到所述输入字符串对应的各汉字序列;在语言模型中获取所述各汉字序列的概率,并依据所述概率选取所述各汉字序列构成候选序列集合。
本发明实施例中,预置索引可以是“拼音-汉字”索引,通过用户输入的拼音的字符串可以对应转换得到汉字,其中“拼音-汉字”索引是***通过对用户搜索数据、输入法数据自动标注拼音等数据收集、分析后建立的。还设置了语言模型,语言模型是针对某种语言建立的概率模型,其中,正确词序列的概率值大于错误词序列的概率值,***使用搜索数据训练语言模型,后续可以通过语言模型可以计算一个汉字序列搜索词的概率。
因此,从预置“拼音-汉字”索引中分别查找每个切分序列的至少一个候选汉字串,然后将所有切分序列的各候选汉字串进行组合,可以得到组合后的输入字符串对应的各汉字序列,例如当前输入字符串被切分出2个切分序列,第一个切分序列转换得到3个候选汉字串,第二个切分序列转换得到4个候选汉字串,则可以组合出12个汉字序列。
然后在语言模型中获取所述各汉字序列的概率,并依据所述概率选取所述各汉字序列构成候选序列集合。
其中,所述依据所述概率选取所述各汉字序列构成候选序列集合,至少包括以下两种方式:
(1)通过排序直接选取候选序列
可以对各汉字序列按照所述概率由大到小进行排序,然后从中抽取排在前N位的各汉字序列,将这N个汉字序列作为候选序列构成候选序列集合,其中N为正整数。
(2)通过最符合用户意图的汉字序列确定候选序列
概率最大的汉字序列是最符合用户输入意图的,因此可以对各汉字序列按照所述概率由大到小进行排序,选取概率最大的汉字序列作为关键词。
然后查找最符合用户输入意图的关键词对应的相关词,即从搜索引擎的索引库中查询与所述关键词具有相关性的搜索词,然后获取查询到搜索词的对应的特征值,其中特征值可以依据需求设定,如用户搜索次数、关键词和搜索词的相关性等,再将查询到搜索词按照对应的特征值进行排序,选取排在前M位的搜索词分别作为候选序列构成所述候选序列集合,其中M为正整数。
通过最符合用户输入意图的关键词预测查询搜索词,可在用户未完成输入前就预测用户想要输入的内容。例如,用户原始输入字符串是“liude”,通过转换得到关键词为“刘德”,通过关键词“刘德”预测出用户想要搜索的内容是“刘德华”、“刘德华电影”、“刘德华演唱会”等。从而通过最符合用户输入意图的关键词查询具有相关性的搜索词,用户只需输入部分字符串,就可帮助用户对搜索意图进行描述,得到输入符合自己意图的输入,可以节省用户操作,提升输入效率。
步骤308,服务器在搜索引擎中对所述候选序列集合中的每个候选序列依次进行搜索。
步骤310,服务器针对每个候选序列的搜索结果,筛选所述搜索引擎反馈的排在前X位的搜索结果。
然后对候选序列集合中的每个候选序列采用搜索引擎依次进行搜索,查询网页索引、摘要等得到每个候选序列对应的各搜索结果,对于各搜索结果进行排序,可以直接按照搜索引擎反馈的结果排序,获取其中的前X位的搜索结果,其中X为正整数。
步骤312,输入法客户端对所述候选序列集合中的候选序列依次进行展示。
步骤314,输入法客户端获取展示在首位的候选序列对应的各搜索结果并展示。
所述输入法客户端在接收到候选序列集合和搜索结果后,可以依次对候选序列集合中的候选序列作为搜索提示依次进行展示。其中,候选序列的展示顺序可以按照其确定为候选序列的顺序,如若是通过排序直接选取的候选序列,则按照其概率的大小排序顺序作为展示顺序,若是通过最符合用户意图的候选汉字序列确定候选序列,则可以按照其特征值的排序顺序作为搜索提示的展示顺序。
同时,对于展示在首位的候选序列,还可以获取其对应的各搜索结果进行展示。如各候选序列展示在左侧,而首位候选序列对应的搜索结果在右侧的搜索结果展示区域中进行展示。
本发明一个可选实施例中,所述输入法客户端接收对所述候选序列的选取指示,通过方向键等方式进行触发,确定选取的候选序列;获取所述选取的候选序列对应的各搜索结果,替换所述展示在首位的候选序列对应的各搜索结果在右侧的搜索结果展示区域中进行同步展示。
输入法客户端展示了候选序列和首位候选序列的搜索结果后,用户可能想要查看其它候选序列的搜索结果,则用户可以通过点击、鼠标移动、滑动鼠标滚轮等方式发出选取指示,输入法客户端接收对所述候选序列的选取指示,确定所述选取指示对应选取的候选序列,然后获取所述选取的候选序列对应的各搜索结果,采用所述选取的候选序列对应的各搜索结果对首位候选序列的搜索结果进行替换后同步展示。
综上,本发明实施例通过用户账号信息对不同的用户进行区分,以预测出最符合该用户意图的候选序列,得到准确的搜索结果进行推荐。
实施例三
在上述实施例的基础上,本实施例进一步采用具体实施中的例子论述基于输入预测进行搜索推荐的方法。
假设用户想要搜索“清华园梦想与光荣”,则于输入预测进行搜索推荐步骤过程如下:
用户通过输入法进行输入,将当前输入字符串上传给服务器,将字符串输入至“qinghuayuan”时,服务器基于实时上传的时间间隔信息确定“qinghuayuan”后存在1秒钟的停顿。查询“用户-平均输入时间”表得到所述用户输入一个字符的平均停顿时间是5毫秒。计算归一化的输入时间间隔为200,超过了间隔阈值,因此要在结尾处的“n”处随着用户的输入进行实时切分;用户后续继续进行输入时输入的“mengxiang”平均停顿时间仍为5毫秒,且在输入完毕“mengxiang”后又产生了0.5秒的停顿,也超过了间隔阈值,同样实时进行切分,由于“qinghuayuan”后的切分已进行完毕,故此次切分并不对其造成影响,则假设以空格做标记,切分后的输入序列为“qinghuayuanmengxiang”,即切分序列分别为“qinghuayuan”和“mengxiang”。
对于切分序列“qinghuayuan”和“mengxiang”根据“拼音-汉字”索引查到“qinghuayuan”对应的候选汉字串包括“清华园”、“清华苑”和“晴花园”,“mengxiang”对应的候选汉字串包括“梦想”和“梦乡”。将上述不同切分序列的候选汉字串进行组合如图5所示,则当前输入字符串输入至“qinghuayuanmengxiang”时,就包括候选汉字序列:“清华园梦想”、“清华苑梦想”、“晴花园梦想”、“清华园梦乡”、“清华苑梦乡”和“晴花园梦乡”,而不会得到“清华圆梦想”、“青花元梦想”等汉字序列。
然后调用离线训练好的语言模型,通过计算这些候选汉字序列的语言模型得分确定其各自的概率值进行排序,确定候选汉字序列“清华园梦想”的概率最高,那么它就是最符合用户输入意图的汉字序列。
然后以“清华园梦想”作为关键词,查询搜索词索引并将查询到的搜索词按照特征值排序,得到候选序列包括“清华园梦想”、“清华园梦想与光荣”、“清华园梦想中的殿堂”、“清华园梦想照进现实”和“清华园梦想成真”构成候选序列集合,则直接可以得到“清华园梦想与光荣”的汉字序列。
然后在搜索引擎中对各候选序列进行搜索,通过查询网页索引、摘要数据以及排序的处理操作后,每个候选序列均获取排序最高的前3个搜索结果。当前此时也可以仅搜索最符合用户意图的候选序列“清华园梦想”的搜索结果,后续依据需求再实时搜索并反馈即可。
将候选序列集合和对应搜索结果反馈给输入法客户端并进行展示,如图6所示。其中A部分展示输入字符串和最符合用户意图的候选序列,B部分展示候选序列集合中的各候选序列,C部分展示首位候选序列的搜索结果。
后续,若用户依据展示结果发现候选序列“清华园梦想与光荣”更符合自己搜索意图,此时无需继续输入,只需按键盘上下键选择或者鼠标悬停到候选序列“清华园梦想与光荣”,输入法客户端就可以显示候选序列“清华园梦想与光荣”对应的搜索结果,如图7所示。
在上述输入预测和搜索推荐过程后,用户只要依照自己的习惯正常进行输入,即可得到依据该输入预测的候选序列以及候选序列的搜索结果。无需通过输入法进行各候选项的选择,也没有点击进行上屏操作,等不需要进一步点击“搜索”按钮触发搜索指令,以跳转到搜索结果页面进行搜索并展示结果,就可以直接得到需要的搜索结果,极大地减少了用户操作流程,提高了搜索效率,提升了操作体验。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
实施例四
在上述实施例的基础上,本实施例还提供了一种输入法***。
参照图8,示出了本发明一种输入法***实施例的结构框图,具体可以包括如下模块:
接收模块802,用于接收用户输入的当前输入信息,其中,所述当前输入信息包括当前输入字符串和时间间隔信息;转换模块804,用于依据所述时间间隔信息实时对所述当前输入字符串进行切分并转换得到所述当前输入字符串对应的候选序列集合;搜索模块806,用于对所述候选序列集合中的每个候选序列分别进行搜索,获取各候选序列各自对应的搜索结果;反馈模块808,用于依据所述候选序列集合和对应的搜索结果进行反馈。
其中,该输入法***可以包括:服务器1和输入法客户端2。则上述接收模块802、转换模块804、搜索模块806和反馈模块808可以均位于服务器1中(如图9所示),从而由输入法客户端2将当前输入信息上传给服务器1的接收模块802,而反馈模块808将候选序列集合和对应的搜索结果反馈给输入法客户端2。
另外,接收模块802和转换模块804也可以位于输入法客户端2中,而搜索模块806和反馈模块808位于服务器1中(如图10所示),输入法客户端2的转换模块804转换得到候选序列集合后上传给服务器1,再由服务器1的反馈模块808将候选序列集合和对应的搜索结果反馈给输入法客户端2。
综上所述,接收用户输入的包括当前输入字符串和时间间隔信息的当前输入信息,通过当前输入信息进行输入预测,其中时间间隔信息表征了当前输入字符串在输入过程中的停顿时间,因此在用户的输入过程中,依据时间间隔信息实时对当前输入字符串进行切分可以准确、快捷的切分出字或词对应的字符串,提高了输入匹配度,从而转换得到准确的候选序列集合,再采用该候选序列集合中的每个候选序列分别进行搜索获取搜索结果,并依据所述候选序列集合和对应的搜索结果进行反馈,无需在搜索引擎的搜索框中输入搜索即可直接通过输入法获取想要的搜索结果,操作简便、快捷,提高了搜索效率。
可选的,所述时间间隔信息包括所述当前输入字符串中每两个相邻字符的停顿时间;所述转换模块,包括:切分子模块,用于当检测到输入过程中实时产生的停顿时间满足预设条件时,在所述当前输入字符串对应的输入位置处进行切分,获取所述当前输入字符串对应的各切分序列;转换子模块,用于对各切分序列依次进行转换并组合,得到所述当前输入字符串对应的候选序列集合。
所述当前输入信息还包括用户账号信息;所述转换模块,还包括:归一化子模块,用于按照所述用户账号信息查找对应用户的平均停顿时间;采用所述用户的平均停顿时间分别对输入过程中实时产生的停顿时间进行归一化,得到实时产生的归一化停顿间隔。
所述切分子模块,还用于将所述当前输入字符串中实时产生的归一化停顿间隔,依次与停顿阈值进行比较;当输入过程中实时产生的归一化停顿间隔大于所述停顿阈值时,确定所述实时产生的停顿时间满足预设条件。
所述服务器还包括:预处理模块,用于确定用户的平均停顿时间,具体用于按照所述用户账号信息确定用户,并收集所述用户的历史输入信息;依据所述历史输入信息统计所述用户输入单个字符后停顿的时间,作为所述用户的平均停顿时间。
所述转换子模块,包括:查找单元,用于从预置索引中分别查找每个切分序列的至少一个候选汉字串;组合单元,用于将各切分序列的候选汉字串进行组合,分别得到所述输入字符串对应的各汉字序列;选取单元,用于在语言模型中获取各汉字序列的概率,并依据所述概率分别选取所述各汉字序列构成候选序列集合。
可选的,所述选取单元,用于对各汉字序列按照所述概率由大到小进行排序,并将排在前N位的各汉字序列分别作为候选序列构成候选序列集合,其中N为正整数。
可选的,所述选取单元,用于对各汉字序列按照所述概率由大到小进行排序,选取概率最大的汉字序列作为关键词;从搜索引擎的索引库中查询与所述关键词具有相关性的搜索词,并对查询到的搜索词按照对应的特征值进行排序;选取排在前M位的搜索词分别作为候选序列构成所述候选序列集合,其中M为正整数。
可选的,所述搜索模块,包括:搜索子模块,用于在搜索引擎中对所述候选序列集合中的每个候选序列依次进行搜索;筛选子模块,用于针对每个候选序列的搜索结果,筛选所述搜索引擎反馈的排在前X位的搜索结果,其中X为正整数。
所述的***还包括:展示模块,用于对所述候选序列集合和对应的搜索结果分别进行展示;所述展示模块包括:第一展示子模块,用于对所述候选序列集合中的候选序列依次进行展示;第二展示子模块,用于获取展示在首位的候选序列对应的各搜索结果并展示。
所述的***还包括:指示模块,用于接收对所述候选序列的选取指示,确定选取的候选序列;则所述第二展示子模块,还用于获取所述选取的候选序列对应的各搜索结果,替换所述展示在首位的候选序列对应的各搜索结果进行展示。
综上,本发明实施例通过用户账号信息对不同的用户进行区分,以预测出最符合该用户意图的候选序列,得到准确的搜索结果进行推荐。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种基于输入预测的搜索方法和一种输入法***,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (18)

1.一种基于输入预测的搜索方法,其特征在于,包括:
接收用户输入的当前输入信息,其中,所述当前输入信息包括当前输入字符串和时间间隔信息;
依据所述时间间隔信息实时对所述当前输入字符串进行切分,并转换得到所述当前输入字符串对应的候选序列集合;
对所述候选序列集合中的每个候选序列分别进行搜索,获取各候选序列各自对应的搜索结果,并依据所述候选序列集合和对应的搜索结果进行反馈。
2.根据权利要求1所述的方法,其特征在于,所述时间间隔信息包括所述当前输入字符串中每两个相邻字符的停顿时间;
所述依据所述时间间隔信息实时对所述当前输入字符串进行切分并转换得到候选序列集合,包括:
当检测到输入过程中实时产生的停顿时间满足预设条件时,在所述当前输入字符串对应的输入位置处进行切分,获取所述当前输入字符串对应的各切分序列;
对各切分序列依次进行转换并组合,得到所述当前输入字符串对应的候选序列集合。
3.根据权利要求2所述的方法,其特征在于,所述当前输入信息还包括用户账号信息;
所述依据所述时间间隔信息实时对所述当前输入字符串进行切分并转换得到候选序列之前,还包括:
按照所述用户账号信息查找对应用户的平均停顿时间;
采用所述用户的平均停顿时间分别对输入过程中实时产生的停顿时间进行归一化,得到实时产生的归一化停顿间隔。
4.根据权利要求3所述的方法,其特征在于,还包括:
将所述当前输入字符串中实时产生的归一化停顿间隔,依次与停顿阈值进行比较;
当输入过程中实时产生的归一化停顿间隔大于所述停顿阈值时,确定所述实时产生的停顿时间满足预设条件。
5.根据权利要求3所述的方法,其特征在于,还包括用户的平均停顿时间的确定步骤:
按照所述用户账号信息确定用户,并收集所述用户的历史输入信息;
依据所述历史输入信息统计所述用户输入单个字符后停顿的时间,作为所述用户的平均停顿时间。
6.根据权利要求2所述的方法,其特征在于,对各切分序列依次进行转换并组合,得到所述当前输入字符串对应的候选序列集合,包括:
从预置索引中分别查找每个切分序列的至少一个候选汉字串;
将各切分序列的候选汉字串进行组合,分别得到所述输入字符串对应的各汉字序列;
在语言模型中分别获取各候选汉字序列的概率,并依据所述概率分别选取所述各汉字序列构成候选序列集合。
7.根据权利要求6所述的方法,其特征在于,所述依据所述概率分别选取所述各汉字序列构成候选序列集合,包括:
对各汉字序列按照所述概率由大到小进行排序,并将排在前N位的各汉字序列分别作为候选序列构成候选序列集合,其中N为正整数。
8.根据权利要求6所述的方法,其特征在于,所述依据所述概率选取所述各汉字序列构成候选序列集合,包括:
对各汉字序列按照所述概率由大到小进行排序,选取概率最大的汉字序列作为关键词;
从搜索引擎的索引库中查询与所述关键词具有相关性的搜索词,并对查询到的搜索词按照对应的特征值进行排序;
选取排在前M位的搜索词分别作为候选序列构成所述候选序列集合,其中M为正整数。
9.根据权利要求1所述的方法,其特征在于,所述对所述候选序列集合中的每个候选序列分别进行搜索,获取各候选序列各自对应的搜索结果,包括:
在搜索引擎中对所述候选序列集合中的每个候选序列依次进行搜索;
针对每个候选序列的搜索结果,筛选所述搜索引擎反馈的排在前X位的搜索结果,其中X为正整数。
10.根据权利要求1或9所述的方法,其特征在于,还包括:对所述候选序列集合和对应的搜索结果分别进行展示,具体为:
对所述候选序列集合中的候选序列依次进行展示;
获取展示在首位的候选序列对应的各搜索结果并展示。
11.根据权利要求10所述的方法,其特征在于,还包括:
接收对所述候选序列的选取指示,确定选取的候选序列;
获取所述选取的候选序列对应的各搜索结果,替换所述展示在首位的候选序列对应的各搜索结果进行展示。
12.一种输入法***,其特征在于,包括:
接收模块,用于接收用户输入的当前输入信息,其中,所述当前输入信息包括当前输入字符串和时间间隔信息;
转换模块,用于依据所述时间间隔信息实时对所述当前输入字符串进行切分并转换得到所述当前输入字符串对应的候选序列集合;
搜索模块,用于对所述候选序列集合中的每个候选序列分别进行搜索,获取各候选序列各自对应的搜索结果;
反馈模块,用于依据所述候选序列集合和对应的搜索结果进行反馈。
13.根据权利要求12所述的***,其特征在于,所述时间间隔信息包括所述当前输入字符串中每两个相邻字符的停顿时间;
所述转换模块,包括:
切分子模块,用于当检测到输入过程中实时产生的停顿时间满足预设条件时,在所述当前输入字符串对应的输入位置处进行切分,获取所述当前输入字符串对应的各切分序列;
转换子模块,用于对各切分序列依次进行转换并组合,得到所述当前输入字符串对应的候选序列集合。
14.根据权利要求13所述的***,其特征在于,所述当前输入信息还包括用户账号信息;
所述转换模块,还包括:
归一化子模块,用于按照所述用户账号信息查找对应用户的平均停顿时间;采用所述用户的平均停顿时间分别对输入过程中实时产生的停顿时间进行归一化,得到实时产生的归一化停顿间隔。
15.根据权利要求14所述的***,其特征在于:
所述切分子模块,还用于将所述当前输入字符串中实时产生的归一化停顿间隔,依次与停顿阈值进行比较;当输入过程中实时产生的归一化停顿间隔大于所述停顿阈值时,确定所述实时产生的停顿时间满足预设条件。
16.根据权利要求12所述的***,其特征在于,所述搜索模块,包括:
搜索子模块,用于在搜索引擎中对所述候选序列集合中的每个候选序列依次进行搜索;
筛选子模块,用于针对每个候选序列的搜索结果,筛选所述搜索引擎反馈的排在前X位的搜索结果,其中X为正整数。
17.根据权利要求12或16所述的***,其特征在于,所述的***还包括:
展示模块,用于对所述候选序列集合和对应的搜索结果分别进行展示;
其中,所述展示模块,包括:
第一展示子模块,用于对所述候选序列集合中的候选序列依次进行展示;
第二展示子模块,用于获取展示在首位的候选序列对应的各搜索结果并展示。
18.根据权利要求17所述的***,其特征在于,所述的***还包括:
指示模块,用于接收对所述候选序列的选取指示,确定选取的候选序列;
则所述第二展示子模块,还用于获取所述选取的候选序列对应的各搜索结果,替换所述展示在首位的候选序列对应的各搜索结果进行展示。
CN201410379907.3A 2014-08-04 2014-08-04 基于输入预测的搜索方法和输入法*** Pending CN105335415A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410379907.3A CN105335415A (zh) 2014-08-04 2014-08-04 基于输入预测的搜索方法和输入法***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410379907.3A CN105335415A (zh) 2014-08-04 2014-08-04 基于输入预测的搜索方法和输入法***

Publications (1)

Publication Number Publication Date
CN105335415A true CN105335415A (zh) 2016-02-17

Family

ID=55285947

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410379907.3A Pending CN105335415A (zh) 2014-08-04 2014-08-04 基于输入预测的搜索方法和输入法***

Country Status (1)

Country Link
CN (1) CN105335415A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105786492A (zh) * 2016-02-23 2016-07-20 浪潮软件集团有限公司 利用大数据的方法实现代码预测提示的方法
CN106024013A (zh) * 2016-04-29 2016-10-12 努比亚技术有限公司 语音数据搜索方法及***
CN106484135A (zh) * 2016-09-23 2017-03-08 百度在线网络技术(北京)有限公司 一种用于提供输入候选项的方法与装置
CN106649640A (zh) * 2016-12-08 2017-05-10 武汉斗鱼网络科技有限公司 一种即时搜索方法及装置
CN107219932A (zh) * 2016-03-21 2017-09-29 阿里巴巴集团控股有限公司 一种输入方法、装置和智能终端
CN107305493A (zh) * 2016-04-20 2017-10-31 谷歌公司 具有集成搜索的图形键盘应用
CN107678560A (zh) * 2017-08-31 2018-02-09 科大讯飞股份有限公司 输入法的候选结果生成方法及装置、存储介质、电子设备
CN107766238A (zh) * 2017-09-27 2018-03-06 北京金山安全软件有限公司 一种软件测试方法、装置、设备及计算机可读存储介质
CN108241440A (zh) * 2016-12-27 2018-07-03 北京搜狗科技发展有限公司 一种候选词展示方法和装置
CN108279783A (zh) * 2017-12-14 2018-07-13 北京百度网讯科技有限公司 一种候选项上屏的方法、装置、设备和计算机存储介质
CN108304367A (zh) * 2017-04-07 2018-07-20 腾讯科技(深圳)有限公司 分词方法及装置
CN109901725A (zh) * 2017-12-07 2019-06-18 北京搜狗科技发展有限公司 一种拼音串切分方法和装置
CN110728113A (zh) * 2018-06-28 2020-01-24 北京金山办公软件股份有限公司 一种电子表格的信息筛选方法、装置及终端设备
CN112580747A (zh) * 2020-12-29 2021-03-30 珠海金山网络游戏科技有限公司 匹配方法及装置
CN115454261A (zh) * 2022-09-23 2022-12-09 北京百度网讯科技有限公司 输入法候选词生成方法、装置、电子设备及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101382844A (zh) * 2008-10-24 2009-03-11 上海埃帕信息科技有限公司 一种输入间隔分词的方法
CN102073699A (zh) * 2010-12-20 2011-05-25 百度在线网络技术(北京)有限公司 用于基于用户行为来改善搜索结果的方法、装置和设备
CN102495678A (zh) * 2011-11-30 2012-06-13 左盼 一种基于输入法的信息展现方法与***
CN102799663A (zh) * 2012-07-13 2012-11-28 深圳市同洲电子股份有限公司 一种输入法及输入法***
CN103631385A (zh) * 2012-08-23 2014-03-12 北京搜狗科技发展有限公司 一种在文字输入中筛选候选项的方法和装置
CN103869999A (zh) * 2012-12-11 2014-06-18 百度国际科技(深圳)有限公司 对输入法所产生的候选项进行排序的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101382844A (zh) * 2008-10-24 2009-03-11 上海埃帕信息科技有限公司 一种输入间隔分词的方法
CN102073699A (zh) * 2010-12-20 2011-05-25 百度在线网络技术(北京)有限公司 用于基于用户行为来改善搜索结果的方法、装置和设备
CN102495678A (zh) * 2011-11-30 2012-06-13 左盼 一种基于输入法的信息展现方法与***
CN102799663A (zh) * 2012-07-13 2012-11-28 深圳市同洲电子股份有限公司 一种输入法及输入法***
CN103631385A (zh) * 2012-08-23 2014-03-12 北京搜狗科技发展有限公司 一种在文字输入中筛选候选项的方法和装置
CN103869999A (zh) * 2012-12-11 2014-06-18 百度国际科技(深圳)有限公司 对输入法所产生的候选项进行排序的方法及装置

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105786492A (zh) * 2016-02-23 2016-07-20 浪潮软件集团有限公司 利用大数据的方法实现代码预测提示的方法
CN107219932A (zh) * 2016-03-21 2017-09-29 阿里巴巴集团控股有限公司 一种输入方法、装置和智能终端
CN107305493A (zh) * 2016-04-20 2017-10-31 谷歌公司 具有集成搜索的图形键盘应用
CN106024013A (zh) * 2016-04-29 2016-10-12 努比亚技术有限公司 语音数据搜索方法及***
CN106484135B (zh) * 2016-09-23 2019-03-19 百度在线网络技术(北京)有限公司 一种用于提供输入候选项的方法与装置
CN106484135A (zh) * 2016-09-23 2017-03-08 百度在线网络技术(北京)有限公司 一种用于提供输入候选项的方法与装置
CN106649640B (zh) * 2016-12-08 2020-05-12 武汉斗鱼网络科技有限公司 一种即时搜索方法及装置
CN106649640A (zh) * 2016-12-08 2017-05-10 武汉斗鱼网络科技有限公司 一种即时搜索方法及装置
CN108241440A (zh) * 2016-12-27 2018-07-03 北京搜狗科技发展有限公司 一种候选词展示方法和装置
CN108241440B (zh) * 2016-12-27 2023-02-17 北京搜狗科技发展有限公司 一种候选词展示方法和装置
CN108304367A (zh) * 2017-04-07 2018-07-20 腾讯科技(深圳)有限公司 分词方法及装置
WO2018184510A1 (zh) * 2017-04-07 2018-10-11 腾讯科技(深圳)有限公司 分词方法、装置及存储介质
CN108304367B (zh) * 2017-04-07 2021-11-26 腾讯科技(深圳)有限公司 分词方法及装置
CN107678560A (zh) * 2017-08-31 2018-02-09 科大讯飞股份有限公司 输入法的候选结果生成方法及装置、存储介质、电子设备
CN107766238B (zh) * 2017-09-27 2021-04-09 北京金山安全软件有限公司 一种软件测试方法、装置、设备及计算机可读存储介质
CN107766238A (zh) * 2017-09-27 2018-03-06 北京金山安全软件有限公司 一种软件测试方法、装置、设备及计算机可读存储介质
CN109901725A (zh) * 2017-12-07 2019-06-18 北京搜狗科技发展有限公司 一种拼音串切分方法和装置
CN109901725B (zh) * 2017-12-07 2022-05-06 北京搜狗科技发展有限公司 一种拼音串切分方法和装置
CN108279783A (zh) * 2017-12-14 2018-07-13 北京百度网讯科技有限公司 一种候选项上屏的方法、装置、设备和计算机存储介质
CN110728113A (zh) * 2018-06-28 2020-01-24 北京金山办公软件股份有限公司 一种电子表格的信息筛选方法、装置及终端设备
CN112580747A (zh) * 2020-12-29 2021-03-30 珠海金山网络游戏科技有限公司 匹配方法及装置
CN115454261A (zh) * 2022-09-23 2022-12-09 北京百度网讯科技有限公司 输入法候选词生成方法、装置、电子设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN105335415A (zh) 基于输入预测的搜索方法和输入法***
CN102760138B (zh) 用户网络行为的分类方法和装置及对应的搜索方法和装置
CN108763321B (zh) 一种基于大规模相关实体网络的相关实体推荐方法
CN102890711B (zh) 一种检索排序方法及***
CN102968465B (zh) 网络信息服务平台及其基于该平台的搜索服务方法
CN105488024A (zh) 网页主题句的抽取方法及装置
CN103838833A (zh) 基于相关词语语义分析的全文检索***
Sugiyama et al. Refinement of TF-IDF schemes for web pages using their hyperlinked neighboring pages
CN102081668B (zh) 基于领域本体的信息检索优化方法
CN102902826B (zh) 一种基于基准图像索引的图像快速检索方法
CN103593410A (zh) 通过替换概念性词语进行搜索推荐***
CN102314452B (zh) 一种通过输入法平台进行导航的方法及***
CN104933100A (zh) 关键词推荐方法和装置
CN103870505A (zh) 一种查询词推荐方法和查询词推荐***
CN103425687A (zh) 一种基于关键词的检索方法和***
CN103365839A (zh) 一种搜索引擎的推荐搜索方法和装置
CN102096717A (zh) 搜索方法及搜索引擎
CN103294815A (zh) 基于关键字分类并有多种呈现方式的搜索引擎装置与方法
CN103678576A (zh) 基于动态语义分析的全文检索***
CN103902597A (zh) 确定目标关键词所对应的搜索相关性类别的方法和设备
CN102609539B (zh) 一种搜索方法和***
CN103559258A (zh) 基于云计算的网页排序方法
CN103136213A (zh) 一种提供相关词的方法及装置
CN101916272B (zh) 用于深层网数据集成的数据源选择方法
CN116049381A (zh) 一种基于知识图谱的特定目标可视化分析方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160217

RJ01 Rejection of invention patent application after publication