CN104933081B - 一种搜索建议提供方法及装置 - Google Patents

一种搜索建议提供方法及装置 Download PDF

Info

Publication number
CN104933081B
CN104933081B CN201410108614.1A CN201410108614A CN104933081B CN 104933081 B CN104933081 B CN 104933081B CN 201410108614 A CN201410108614 A CN 201410108614A CN 104933081 B CN104933081 B CN 104933081B
Authority
CN
China
Prior art keywords
search
keyword
user
search term
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410108614.1A
Other languages
English (en)
Other versions
CN104933081A (zh
Inventor
孙常龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201410108614.1A priority Critical patent/CN104933081B/zh
Priority to TW103118597A priority patent/TW201537367A/zh
Priority to PCT/US2015/021601 priority patent/WO2015143239A1/en
Priority to JP2016553647A priority patent/JP2017508214A/ja
Priority to US14/663,371 priority patent/US10042896B2/en
Publication of CN104933081A publication Critical patent/CN104933081A/zh
Priority to HK15111783.1A priority patent/HK1211100A1/zh
Application granted granted Critical
Publication of CN104933081B publication Critical patent/CN104933081B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请提供了一种搜索建议提供方法及装置,所述方法包括:获取当前用户输入的第一搜索词;将第一搜索词与离线列表相匹配,以从离线列表中选取至少一个关键词;在离线列表中获取与选取的关键词对应的搜索建议,作为第一搜索词的搜索建议向当前用户提供;其中,离线列表中任一关键词对应的搜索建议的获取方式具体为:获取日志记录中与该关键词相关的历史用户行为;获取历史用户行为所产生的文档;对文档进行分词,得到至少一个候选建议;根据候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。显然本申请中的搜索建议可供选择的范围更大,从而减少了用户搜索次数,进一步减少了搜索耗费的时间和流量。

Description

一种搜索建议提供方法及装置
技术领域
本申请涉及网络技术领域,尤其是涉及一种搜索建议提供方法及装置。
背景技术
搜索引擎是一种常用的信息搜索***,通过搜索引擎等信息搜索***,能够帮助用户搜索到需要的信息。例如,当用户在搜索网页上输入搜索词“雾霾口罩”,搜索引擎会查找出若干个与搜索词“雾霾口罩”相关的网址或者应用。
为了使得用户能够方便快捷地进行搜索,当用户输入搜索词后,会自动生成若干个与搜索词相关的搜索建议提供给用户选择。目前,在生成搜索建议时,主要是基于该用户的历史搜索,例如,用户之前曾经搜索过“雾霾口罩价格”,“雾霾口罩型号”等词,则在用户输入“雾霾口罩”后,搜索网页上将通过自动下拉栏等方式提供“雾霾口罩价格”、“雾霾口罩型号”等搜索建议供用户选择。
然而,在这种基于搜索历史提供搜索建议的方式中,显然搜索建议可供选择的范围比较小,用户往往需要多次搜索才能获得所需的内容,耗费的时间和流量较多。
发明内容
本申请解决的技术问题在于提供一种搜索建议提供方法及装置,以实现增大提供的搜索建议的选择范围,从而减少用户搜索次数,进一步减少搜索耗费的时间和流量。
为此,本申请解决技术问题的技术方案是:
本申请提供了一种搜索建议提供方法,所述方法包括:
获取当前用户输入的第一搜索词;
将所述第一搜索词与离线列表中的至少一个关键词相匹配,以从所述离线列表中选取至少一个关键词;所述离线列表中的每个关键词分别对应至少一个搜索建议;
在所述离线列表中获取与选取的至少一个关键词对应的搜索建议,作为所述第一搜索词的搜索建议向当前用户提供;
其中,所述离线列表中任一关键词对应的搜索建议的获取方式具体为:
获取日志记录中与该关键词相关的历史用户行为;
获取所述历史用户行为所产生的文档;
对所述文档进行分词,得到至少一个候选建议;
根据所述候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。
可选的,所述获取当前用户输入的第一搜索词之前还包括:
获取当前用户输入的第二搜索词;
向当前用户提供与所述第二搜索词对应的搜索建议;
所述获取当前用户输入的第一搜索词具体为:
获取当前用户在所述第二搜索词对应的搜索建议中选择的优选建议,将所述优选建议作为当前用户输入的所述第一搜索词。
可选的,所述候选建议的重要度特征基于预设时间点之前的相关数据获取得到。
可选的,所述候选建议的重要度特征还基于所述预设时间点之后的相关数据,每隔预设周期进行修正。
可选的,所述相关数据包括以下参数中的至少一项:
所述候选建议的TF-IDF值、所述候选建议与所述第一搜索词共同被搜索的次数和/或频率、所述候选建议与所述历史用户行为相关的次数和/或频率、所述候选建议的词语属性值、以及所述候选建议的标注属性值。
可选的,所述获取日志记录中与该关键词相关的历史用户行为,包括:
获取日志记录中历史用户使用的搜索词;
对所述历史用户使用的搜索词进行聚类;
确定该关键词所对应的聚类;
根据所述日志记录确定与该关键词所对应的聚类包含的搜索词相关的用户行为,将所述相关的用户行为作为与该关键词相关的历史用户行为。
可选的,所述离线列表中的任一关键词对应的搜索建议具体为经过同义词和/或停用词过滤的搜索建议。
可选的,所述对所述文档进行分词具体为:对所述文档的标题和/或属性内容进行分词。
本申请提供了一种搜索建议提供装置,所述装置包括:
第一搜索词获取单元,用于获取当前用户输入的第一搜索词;
关键词匹配单元,用于将所述第一搜索词与离线列表中的至少一个关键词相匹配,以从所述离线列表中选取至少一个关键词;所述离线列表中的每个关键词分别对应至少一个搜索建议;
第一建议提供单元,用于在所述离线列表中获取与选取的至少一个关键词对应的搜索建议,作为所述第一搜索词的搜索建议向当前用户提供;
用户行为获取单元,用于获取日志记录中与所述离线列表中任一关键词相关的历史用户行为;
文档获取单元,用于获取所述历史用户行为所产生的文档;
分词单元,用于对所述文档进行分词,得到至少一个候选建议;
筛选单元,用于根据所述候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。
可选的,所述装置还包括:第二搜索词获取单元和第二建议提供单元;
所述第二搜索词获取单元用于获取当前用户输入的第二搜索词;
所述第二建议提供单元用于向当前用户提供与所述第二搜索词对应的搜索建议;
所述第一搜索词获取单元用于获取当前用户在所述第二搜索词对应的搜索建议中选择的优选建议,将所述优选建议作为当前用户输入的所述第一搜索词。
可选的,所述候选建议的重要度特征由所述筛选单元基于预设时间点之前的相关数据获取得到。
可选的,所述候选建议的重要度特征还由所述筛选单元基于所述预设时间点之后的相关数据,每隔预设周期进行修正。
可选的,所述相关数据包括以下参数中的至少一项:
所述候选建议的TF-IDF值、所述候选建议与所述第一搜索词共同被搜索的次数和/或频率、所述候选建议与所述历史用户行为相关的次数和/或频率、所述候选建议的词语属性值、以及所述候选建议的标注属性值。
可选的,所述用户行为获取单元包括:
搜索词获取子单元,用于获取日志记录中历史用户使用的搜索词;
聚类子单元,用于对所述历史用户使用的搜索词进行聚类;
聚类确定子单元,用于确定该关键词所对应的聚类;
用户行为确定子单元,用于根据所述日志记录确定与该关键词所对应的聚类包含的搜索词相关的用户行为,将所述相关的用户行为作为与该关键词相关的历史用户行为。
可选的,所述离线列表中的任一关键词对应的搜索建议具体为经过同义词和/或停用词过滤的搜索建议。
可选的,所述分词单元用于对所述文档进行分词具体为:
所述分词单元用于对所述文档的标题和/或属性内容进行分词。
通过上述技术方案可知,本申请实施例不再是从当前用户自己的搜索历史中提供搜索建议,而是将当前用户输入的第一搜索词与离线列表相匹配,以从离线列表中选取至少一个关键词,并向当前用户提供离线列表中与选取的关键词对应的搜索建议。其中,离线列表中的每个关键词对应的搜索建议是从日志记录中与该关键词相关的历史用户行为所产生的文档,经过分词、重要度筛选后获取到的,显然搜索建议可供选择的范围更大,提高了搜索建议贴合用户需求的概率,从而减少了用户搜索次数,进一步减少了搜索耗费的时间和流量。此外,离线列表中的每个关键词对应的搜索建议都是在当前用户输入第一搜索词之前就离线计算好的,因此也不会影响到向当前用户提供搜索建议的速度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的搜索建议提供方法的第一实施例的具体流程图;
图2为本申请提供的方法第一实施例中的任一关键词的获取过程;
图3为本申请提供的搜索建议提供方法的第二实施例的具体流程图;
图4为一种向用户提供第二搜索词对应的搜索建议的示意图;
图5为本申请提供的方法第二实施例中的任一关键词的获取过程;
图6为一种向用户提供第一搜索词对应的搜索建议的示意图;
图7为本申请提供的搜索建议提供装置的第一实施例的具体结构图;
图8为本申请提供的搜索建议提供装置的第二实施例的具体结构图。
具体实施方式
为了使得用户能够更加方便快捷进行搜索,当用户输入搜索词后,会自动生成若干个与搜索词相关的搜索建议提供给用户选择。目前,在生成搜索建议时,主要是基于该用户的历史搜索词,例如,用户在之前曾经搜索过“雾霾口罩价格”,“雾霾口罩型号”等词,则在用户输入“雾霾口罩”后,网页上将通过自动下拉栏等方式提供“雾霾口罩价格”、“雾霾口罩型号”等搜索建议供用户选择。
然而,在这种提供搜索建议的方式中,基于的是用户自己的搜索历史,不仅搜索建议可供选择的范围比较小,而且还限制在用户自己对搜索词的主观理解中,例如用户可能想查一个专业术语时,只能想起这个专业术语的大致意思,但想不起具体名称,用户只能根据自己的理解,不断重复查询,直至查到这个词的具体术语。因此导致了搜索耗费的时间和流量较多。
而在本申请实施例中,提供了一种搜索建议提供方法及装置,以实现增大提供的搜索建议的选择范围,从而减少了用户搜索次数,进一步减少了搜索耗费的时间和流量。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
实施例一
请参阅图1,示出了本申请实施例的搜索建议提供方法的第一实施例。本实施例具体包括:
步骤S101:获取当前用户输入的第一搜索词。
当前用户想要搜索需要的信息时,会输入一个或多个搜索词,因此该步骤中获取当前用户输入的一个或多个搜索词,并作为第一搜索词。当然,第一搜索词也可以是对当前用户输入的语句或者词组分词后得到的。
其中,当前用户可以通过多种方式输入第一搜索词,例如,可以向当前用户提供搜索框,使得当前用户在搜索框中通过键盘或者语音设备等输入设备输入第一搜索词。又例如,也可以向当前用户提供选择钮、下拉栏等,使得当前用户通过单击、双击、悬停等方式选择输入的第一搜索词。
步骤S102:将所述第一搜索词与离线列表中的至少一个关键词相匹配,以从所述离线列表中选取至少一个关键词;所述离线列表中的每个关键词分别对应至少一个搜索建议。
在本申请实施例中,离线列表中包括有至少一个关键词。这些关键词可以是历史用户搜索的高频词。并且,离线列表中每个关键词分别对应至少一个搜索建议。例如离线列表中可以包括关键词“雾霾口罩”,关键词“雾霾口罩”对应三个搜索建议:“防二手烟”、“防病菌”和“流感”。其中,离线列表可以预存在搜索服务器中,因此本申请实施例中的历史用户可以不仅局限于当前用户,而包括搜索服务器中的部分用户或者全部用户。
在该步骤中,将第一搜索词与离线列表中的至少一个关键词相匹配,以从所述离线列表中选取至少一个关键词。该步骤具体执行时可以是从离线列表中选取与第一搜索词匹配度最高的一个或多个关键词,或者也可以设置一个匹配度阈值,选取离线列表中与第一搜索词的匹配度大于匹配度阈值的一个或多个关键词。例如,用户输入的第一搜索词具体为“雾霾”,由于“雾霾”与离线列表中的“雾霾口罩”的匹配度最高,因此将“雾霾口罩”作为选取的关键词。其中具体计算匹配度的方式与现有技术相同,本申请实施例不再详述。
步骤S103:在所述离线列表中获取与选取的至少一个关键词对应的搜索建议,作为所述第一搜索词的搜索建议向当前用户提供。
在本申请实施例中,离线列表中的每个关键词分别对应至少一个搜索建议。例如,从离线列表中选取的关键词为“雾霾口罩”,而在离线列表中,“雾霾口罩”对应三个搜索建议:“防二手烟”、“防病菌”和“流感”,因此,向当前用户提供这三个搜索建议中的任一个或多个搜索建议。
在本申请实施例中,向当前用户提供搜索建议时具体可以通过自动下拉栏、自动侧边框等方式,本申请实施例对此不做限定。
需要格外说明的是,本申请实施例提供的方法可以用于搜索服务器中,也就是说,本申请实施例中步骤S101至步骤S103的执行主体可以是搜索服务器,搜索服务器根据当前用户输入的第一搜索词从离线列表中选取关键词及该关键词对应的搜索建议,之后可以通过用户终端向用户提供搜索建议。其中,本申请所说的搜索服务器可以为搜索引擎使用的任一种服务器。
在本申请实施例中,离线列表中包括有至少一个关键词,而且每个关键词分别对应至少一个搜索建议。其中,离线列表中每个关键词对应的搜索建议可以由搜索服务器获取得到。
实际上,离线列表是离线制作好的,下面对制作离线列表的过程进行说明。
如图2所示,离线列表中任一关键词对应的搜索建议的获取方式包括步骤S201-S204。
步骤S201:获取日志记录中与该关键词相关的历史用户行为。
为了加大统计的数据基数,该步骤中的历史用户行为具体可以为搜索服务器的日志记录中所记录的所有用户、或者与输入第一搜索词的当前用户具有相同属性的用户(例如同城用户、同一性别的用户等等)的历史用户行为。
与该关键词相关的历史用户行为则具体可以包括:对包含该关键词的链接的点击、收藏、复制、或者购买等用户行为。
需要说明的是,在本步骤中获取与该关键词相关的历史用户行为时,还可以进一步扩大获取的范围,以增大搜索建议可供选择的范围。具体请见本步骤的以下子步骤。
本步骤具体可以包括:
子步骤S2011,获取日志记录中历史用户使用的搜索词。
离线列表中的关键词可以选自历史用户使用过的搜索词。
子步骤S2012,对所述历史用户使用的搜索词进行聚类。
对搜索词的聚类可以基于现有技术中的PLSA语义聚类模型进行。
子步骤S2013,确定该关键词所对应的聚类。
本实施可以通过子步骤S2012中对历史用户使用的搜索词的聚类,以得到该关键词的同义词或相似词。
子步骤S2014,根据所述日志记录确定与该关键词所对应的聚类包含的搜索词相关的用户行为,将所述相关的用户行为作为与该关键词相关的历史用户行为。
该子步骤具体包括:确定该关键词所对应的聚类包含的搜索词,以及根据日志记录确定与该包含的搜索词相关的用户行为。
例如,以关键词为“刘德华”为例,聚类后能够得到同义词或相似词“Andy Lau”,因此在获取历史用户行为时实际上获取的是与“刘德华”和“Andy Lau”相关的历史用户行为。
可见,在本步骤中,可以通过聚类得到关键词的同义词或者相似词,之后基于聚类得到的同义词或者相似词获取历史用户行为,从而能够实现增大搜索建议可提供选择的范围,以减少用户搜索次数,因此进一步减少搜索耗费的时间和流量。
步骤S202:获取所述历史用户行为所产生的文档。
在步骤S201中获取到与该关键词相关的历史用户行为之后,获取该历史用户行为产生的文档。实际上,每个用户行为都对应产生一个文档,例如,当用户点击包含该关键词的链接后,将打开一个新的链接,该链接中的所有文字、图片、语音等信息可以形成一个文档。其中可以将图片、语音等信息利用语音识别、文字识别等技术转换为对应的文字信息。
步骤S203:对所述文档进行分词,得到至少一个候选建议。
为了减小分词的工作量,本申请实施例还可以是仅对所述文档的标题和/或属性内容进行分词,从而得到至少一个候选建议。其中,属性内容用于表示文档的属性。例如,若文档具体为一篇文章,属性内容可以为文章摘要、文章总结等等,若文档具体为商品信息时,属性内容可以为商品介绍等等。
在对文档,或者文档的标题和/或属性内容进行分词时,可以基于现有的分词工具、还可以基于词典、或者基于分词模型等统计方法,例如基于ngram模型进行分词。
步骤S204:根据所述候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。
在根据重要度特征进行筛选时,可以是选择重要度特征最高的一个或多个候选建议,也可以是设置一个特征阈值,选择大于特征阈值的一个或多个候选建议。
由于离线列表是在用户输入搜索词之前就已经制作好的,因此可以设置一个预设时间点,在获取候选建议的重要度特征时,具体可以是基于预设时间点之前的相关数据。例如,该步骤中候选建议的重要度特征可以基于当天之前的相关数据获取得到。
为了使得重要度特征能够具有实时性,本申请实施例中的候选建议的重要度特征还可以基于所述预设时间点之后的相关数据,每隔预设周期进行修正。例如,首先基于当天之前的相关数据初步获取到候选建议的重要度特征,而在当天则每隔预设周期(例如2个小时),根据当天的相关数据对候选建议的重要度特征进行修正。
其中,重要度特征用于表示候选建议的重要性,而获取重要度特征时基于的相关数据可以包括以下参数中的至少一项:
候选建议的TF-IDF值、候选建议与第一搜索词共同被搜索的次数和/或频率、候选建议与所述历史用户行为相关的次数和/或频率、候选建议的词语属性值、以及候选建议的标注属性值。
下面分别对上述参数进行说明。
候选建议的TF-IDF(Term Frequency–Inverse Document Frequency,词频-逆向文件频率)值:TF-IDF值是基于TF-IDF算法计算出的表示重要度的特征值。其中,TF-IDF算法是一种用于资讯检索与文本挖掘的统计算法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。具体地,本实施例的候选建议的TF-IDF值具体可以为候选建议在所属的文档中的TF-IDF值。
候选建议与第一搜索词共同被搜索的次数和/或频率:该参数指的是候选建议与第一搜索词在同一次搜索中同时作为搜索词的次数和/或频率,表示了候选建议和第一搜索词的共现率。
候选建议与历史用户行为相关的次数和/或频率:表示用户对包含候选建议的链接的点击、收藏、复制、购买等用户行为的次数和/或频率。其中,可以对不同的历史用户行为设置不同的权重,例如对于点击行为设置相对较低的权重,而对于购买行为设置相对较高的权重。
候选建议的词语属性值:可以将候选建议与预置词表进行匹配,判断出候选建议的词性(例如名词、形容词等)以及是否属于品牌词等等,并且分别设置对应的词语属性值。
候选建议的标注属性值:可以基于候选建议的属性,或者通过人工标注的方式设置标注属性值。
其中,在计算重要度特征时,还可以对上述每个参数设置不同的权重。
在本申请实施例中,离线列表中的任一关键词对应的搜索建议具体可以为经过同义词和/或停用词过滤的搜索建议,具体可以是步骤S203之后,对分词得到的候选建议进行同义词和/或停用词过滤。或者也可以在步骤S204 中,对筛选后的候选建议进行同义词和/或停用词过滤。
通过上述技术方案可知,本申请实施例不再是从当前用户自己的搜索历史中提供搜索建议,而是将当前用户输入的第一搜索词与离线列表相匹配,以从离线列表中选取至少一个关键词,并向当前用户提供离线列表中与选取的关键词对应的搜索建议。其中,离线列表中的每个关键词对应的搜索建议是从日志记录中与该关键词相关的历史用户行为所产生的文档,经过分词、重要度筛选后获取到的。显然本申请实施例提供的搜索建议,不再仅仅局限于用户自己的搜索历史,而是基于相关的历史用户行为,因此提供的搜索建议可供选择的范围更大,提高了搜索建议贴合用户需求的概率,从而减少了用户搜索次数,进一步减少了搜索耗费的时间和流量。此外,离线列表中的每个关键词对应的搜索建议都是在当前用户输入第一搜索词之前就离线计算好的,因此也不会影响到向当前用户提供搜索建议的速度。
值得说明的是,由于本申请实施例中日志记录中可以记录有多个用户的历史用户行为,因此本申请实施例中提供的搜索建议也不仅仅局限于当前用户自己对搜索词的主观理解。例如,当前用户想查一个专业术语时,只需输入自己对这个术语的理解,而由于其他用户很有可能获知这个术语的具体名称,因此根据其他用户的历史用户行为,增大了向当前用户提供搜索建议具体为这个术语具体名称的概率,也实现了减少当前用户重复查询的次数。
此外,由于本申请实施例中的搜索建议不再基于当前用户的搜索历史,尤其是搜索的高频词,使得生成的搜索建议不会只局限在固定的搜索词,从而能够起到分散流量的作用,很好地减少马太效应。再加上本申请实施例中搜索建议是通过获取与关键词相关的历史用户行为所产生的文档、并且经过分词、重要度筛选后得到的,因此提供的搜索建议与历史用户行为的相关性更高,与用户需求的切合度更高,并且更贴近数据库已有的数据,因此搜索出的内容更丰富具体,能够有效减少当前用户的搜索次数。
在本实施例的步骤S101中获取了当前用户输入的第一搜索词,实际上,这里第一搜索词可以是当前用户直接输入的搜索词,例如,用户可以通过键盘或者语音设备等方式输入“雾霾”,此时“雾霾”作为第一搜索词。而第一搜索词还可以是根据搜索词生成的一级或者多级搜索建议,下面通过一个实施例重点说明这种情况。
实施例二
请参阅图3,示出了本申请实施例的搜索建议提供方法的第二实施例。与方法第一实施例不同的是,在本实施例中,第一搜索词具体为当前用户选择的搜索建议。
本实施例具体包括:
步骤S301:获取当前用户输入的第二搜索词。
其中,当前用户可以通过多种方式输入第二搜索词,例如,可以向当前用户提供搜索框,使得当前用户在搜索框中通过键盘或者语音设备等输入设备输入第二搜索词。又例如,也可以向当前用户提供选择钮、下拉栏等,使得当前用户通过单击、双击、悬停等方式选择输入的第二搜索词。
需要说明的是,第二搜索词可以是当前用户直接输入的搜索词,当然也可以是根据当前用户直接输入的搜索词生成的搜索建议。
步骤S302:向当前用户提供与所述第二搜索词对应的搜索建议。
这里向当前用户提供与第二搜索词对应的搜索建议的具体方式不受限定,例如当前用户输入第二搜索词“雾霾”之后,可以通过方法实施例一中的步骤S102和步骤S103,实现向当前用户提供第二搜索词对应的搜索建议:“雾霾口罩”、“雾霾专用口罩”、“雾霾 口罩 3mm”等等。当然,这里也可以采用现有技术的任一种提供搜索建议的方式,例如基于当前用户的搜索历史向当前用户提供对应的搜索建议等等,本申请实施例不再详述。
其中,向当前用户提供第二搜索词对应的搜索建议时具体可以通过自动下拉栏、自动侧边框等方式,本申请实施例对此不做限定。
步骤S303:获取当前用户在所述第二搜索词对应的搜索建议中选择的优选建议,将所述优选建议作为当前用户输入的第一搜索词。
当向当前用户提供第二搜索词对应的搜索建议之后,使得当前用户能够通过单击、双击、悬停等方式选择输入的第一搜索词。例如图4所示,当用户输入第二搜索词“雾霾”之后,通过自动下拉栏的方式向用户提供第二搜索词对应的搜索建议:“雾霾口罩”、“雾霾专用口罩”、“雾霾 口罩 3mm”等等,而当检测到用户在自动下拉栏中通过悬停等方式选择了一个搜索建议,例如“雾霾口罩”时,获取该搜索建议,并作为当前用户输入的第一搜索词。
步骤S304:将所述第一搜索词与离线列表中的至少一个关键词相匹配,以从离线列表中选取至少一个关键词;所述离线列表中的每个关键词分别对应至少一个搜索建议。
若步骤S303中获取到第一搜索词“雾霾口罩”,此时将“雾霾口罩”与离线列表中的关键词进行匹配。例如离线列表中存在关键词“雾霾口罩”,此时匹配获得选取的关键词“雾霾口罩”。
步骤S305:在所述离线列表中获取与选取的至少一个关键词对应的搜索建议,作为所述第一搜索词的搜索建议向当前用户提供。
在离线列表中,每个关键词都分别对应至少一个搜索建议。若步骤S304 中选取到关键词“雾霾口罩”,则将离线列表中“雾霾口罩”对应的搜索建议作为第一搜索词“雾霾口罩”的搜索建议向当前用户提供。
需说明的是,本实施例中的步骤S304和S305与实施例一中的步骤S102 和步骤S103类似,因此描述较简单,相关之处请具体参见实施例一。
其中,离线列表中每个关键词对应的搜索建议可以由搜索服务器获取得到,如图5所示,下面以关键词“雾霾口罩”为例,介绍其对应的搜索建议的具体获取方式:
步骤S501:获取日志记录中与关键词“雾霾口罩”相关的历史用户行为。
在该步骤中,可以获取日志记录中记录的所有用户的对包含“雾霾口罩”的链接的点击、收藏、复制、购买等历史用户行为。当然,也可以不是获取所有用户的历史用户行为,例如获取与输入第一搜索词“雾霾口罩”的当前用户具有相同属性的用户(例如同城用户、或者同一性别的用户等等)的历史用户行为。
步骤S502:获取与关键词“雾霾口罩”相关的历史用户行为所产生的文档。
例如当用户收藏了一个包含“雾霾口罩”的链接后,该链接中的所有文字、图片、语音信息等形成一个文档。
步骤S503:对所述文档进行分词,得到至少一个候选建议。
步骤S504:根据所述候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。
其中候选建议的重要度特征,可以是根据当天之前的相关数据得到,并且根据当天的相关数据每隔预设时间进行修正,例如最终计算出的重要度特征可以为根据当天的相关数据计算出的重要度特征与根据当天之前的相关数据计算出的重要度特征之和。
其中,相关数据可以为以下参数之和:候选建议的TF-IDF值、候选建议与第一搜索词共同被搜索的次数和/或频率、候选建议与历史用户行为相关的次数和/或频率、候选建议的词语属性值、以及候选建议的标注属性值。其中,可以对每个参数设置不同的权重。
若经过步骤S503的分词以及步骤S504的重要度筛选后,得到“雾霾口罩”对应的搜索建议:“防二手烟”、“防病菌”、“流感”等。此时如图6所示,当前用户选择了第一搜索词“雾霾口罩”后,通过右边栏的方式向当前用户提供“雾霾口罩”对应的搜索建议以供当前用户选择。此时当前用户可以进一步选择搜索建议,从而实现完成搜索词的输入。例如,若当前用户此时选择“防二手烟”,则当前用户最终输入的搜索词为“雾霾口罩 防二手烟”,搜索服务器基于该搜索词进行搜索并给出相应的搜索结果。
实施例三
与本申请上述搜索建议提供方法的第一实施例相对应,参见图7,本申请还提供了搜索建议提供装置的第一实施例,在本实施例中,该装置包括:第一搜索词获取单元701、关键词匹配单元702、第一建议提供单元703、用户行为获取单元704、文档获取单元705、分词单元706和筛选单元707。
第一搜索词获取单元701,用于获取当前用户输入的第一搜索词。其中,第一搜索词包括一个或多个搜索词。
关键词匹配单元702,用于将所述第一搜索词与离线列表中的至少一个关键词相匹配,以从所述离线列表中选取至少一个关键词。其中关键词匹配单元702可以是将离线列表中与第一搜索词匹配度最高的一个或多个关键词作为选取的关键词,或者也可以是设置一个匹配度阈值,将离线列表中与第一搜索词的匹配度大于匹配度阈值的一个或多个关键词作为选取的关键词。
离线列表中包括有至少一个关键词,这些关键词可以是历史用户搜索的高频词,所述离线列表中的每个关键词分别对应至少一个搜索建议。其中离线列表可以预存在搜索建议提供装置中。搜索建议提供装置则可以设置在用户终端,或者搜索服务器中。
第一建议提供单元703,用于在所述离线列表中获取与选取的至少一个关键词对应的搜索建议,作为所述第一搜索词的搜索建议向当前用户提供。其中第一建议提供单元703具体可以通过自动下拉栏、自动侧边框等方式向当前用户提供搜索建议。
用户行为获取单元704用于获取日志记录中与离线列表中任一关键词相关的历史用户行为。
为了加大统计的数据基数,历史用户行为具体可以为搜索服务器的日志记录中所记录的所有用户、或者与输入第一搜索词的当前用户具有相同属性的用户的历史用户行为。与该关键词相关的用户行为则具体可以包括:对包含该关键词的链接的点击、收藏、复制、或者购买等行为。
其中,为了增大搜索建议可供选择的范围,用户行为获取单元704可以包括搜索词获取子单元7041、聚类子单元7042、聚类确定子单元7043和用户行为确定子单元7044。
搜索词获取子单元7041,用于获取日志记录中历史用户使用的搜索词。离线列表中的关键词可以选自历史用户使用过的搜索词。
聚类子单元7042,用于对所述历史用户使用的搜索词进行聚类。对搜索词的聚类可以基于现有技术中的PLSA语义聚类模型进行。
聚类确定子单元7043,用于确定该关键词所对应的聚类。本实施可以通过聚类子单元7042对历史用户使用的搜索词的聚类,以得到该关键词的同义词或相似词。
用户行为确定子单元7044,用于根据所述日志记录确定与该关键词所对应的聚类包含的搜索词相关的用户行为,将所述相关的用户行为作为与该关键词相关的历史用户行为。
文档获取单元705用于获取所述历史用户行为所产生的文档。
分词单元706用于对所述文档进行分词,得到至少一个候选建议。
其中分词单元706可以是对所述文档的标题和/或属性内容进行分词。属性内容用于表示文档的属性。例如,若文档具体为一篇文章,属性内容可以为文章摘要、文章总结等等,若文档具体为商品信息时,属性内容可以为商品介绍等等。
在分词单元706对文档,或者文档的标题和/或属性内容进行分词时,可以基于现有的分词工具、还可以基于词典、或者基于分词模型等统计方法,例如基于ngram模型进行分词。
筛选单元707用于根据所述候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。
在筛选单元707根据重要度特征进行筛选时,可以是选择重要度特征最高的一个或多个候选建议,也可以是设置一个特征阈值,选择大于特征阈值的一个或多个候选建议。
由于离线列表是在用户输入搜索词之前就已经制作好的,因此可以设置一个预设时间点,在筛选单元707获取候选建议的重要度特征时,具体可以是基于预设时间点之前的相关数据。例如,候选建议的重要度特征可以由筛选单元707基于当天之前的相关数据获取得到。为了使得重要度特征能够具有实时性,本申请实施例中的候选建议的重要度特征还可以由筛选单元707 基于所述预设时间点之后的相关数据,每隔预设周期进行修正。
其中,重要度特征用于表示候选建议的重要性,而获取重要度特征时基于的相关数据可以包括以下参数中的至少一项:
候选建议的TF-IDF值、候选建议与第一搜索词共同被搜索的次数和/或频率、候选建议与所述历史用户行为相关的次数和/或频率、候选建议的词语属性值、以及候选建议的标注属性值。
其中,在计算重要度特征时,还可以对上述每个参数设置不同的权重。
在本申请实施例中,离线列表中的任一关键词对应的搜索建议具体可以为经过同义词和/或停用词过滤的搜索建议。
实施例四
与本申请上述搜索建议提供方法的第二实施例相对应,参见图8,本申请还提供了搜索建议提供装置的第二实施例,与搜索建议提供装置第一实施例不同的是,在本实施例中,第一搜索词具体为当前用户选择的搜索建议。
在本实施例中,该装置包括:第一搜索词获取单元801、关键词匹配单元 802、第一建议提供单元803、用户行为获取单元804、文档获取单元805、分词单元806、筛选单元807、第二搜索词获取单元808和第二建议提供单元809。
第二搜索词获取单元808用于获取当前用户输入的第二搜索词。需要说明的是,第二搜索词可以是当前用户直接输入的搜索词,当然也可以是根据当前用户直接输入的搜索词生成的搜索建议。
第二建议提供单元809用于向当前用户提供与所述第二搜索词对应的搜索建议。
这里向当前用户提供与第二搜索词对应的搜索建议的具体方式不受限定,例如当前用户输入第二搜索词“雾霾”之后,可以通过关键词匹配单元 802以及第一建议提供单元803,实现向当前用户提供第二搜索词对应的搜索建议。当然,这里也可以采用现有技术的任一种提供搜索建议的方式,例如基于当前用户的搜索历史向当前用户提供对应的搜索建议等等,对此本申请实施例不再详述。
第一搜索词获取单元801用于获取当前用户在所述第二搜索词对应的搜索建议中选择的优选建议,将所述优选建议作为当前用户输入的第一搜索词。
向当前用户提供第二搜索词对应的搜索建议之后,使得当前用户能够通过单击、双击、悬停等方式选择输入的第一搜索词。
关键词匹配单元802用于将所述第一搜索词与离线列表中的至少一个关键词相匹配,以从所述离线列表中选取至少一个关键词;所述离线列表中的每个关键词分别对应至少一个搜索建议。
第一建议提供单元803用于在所述离线列表中获取与选取的至少一个关键词对应的搜索建议,作为所述第一搜索词的搜索建议向当前用户提供。
用户行为获取单元804用于获取日志记录中与所述离线列表中任一关键词相关的历史用户行为。
文档获取单元805用于获取所述历史用户行为所产生的文档。
分词单元806用于对所述文档进行分词,得到至少一个候选建议。
筛选单元807用于根据所述候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。
本实施例中的关键词匹配单元802、第一建议提供单元803、用户行为获取单元804、文档获取单元805、分词单元806和筛选单元807与实施例三的相关内容类似,因此描述较简单,相关之处请具体参见实施例三。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的一种提供搜索建议的方法及装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (16)

1.一种搜索建议提供方法,其特征在于,所述方法包括:
获取当前用户输入的第一搜索词;
将所述第一搜索词与离线列表中的至少一个关键词相匹配,以从所述离线列表中选取至少一个关键词;所述离线列表中的每个关键词分别对应至少一个搜索建议;
在所述离线列表中获取与选取的至少一个关键词对应的搜索建议,作为所述第一搜索词的搜索建议向当前用户提供;
其中,所述离线列表中任一关键词对应的搜索建议的获取方式具体为:
获取日志记录中与该关键词相关的历史用户行为;
获取所述历史用户行为所产生的文档;
对所述文档进行分词,得到至少一个候选建议;
根据所述候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。
2.根据权利要求1所述的方法,其特征在于,所述获取当前用户输入的第一搜索词之前还包括:
获取当前用户输入的第二搜索词;
向当前用户提供与所述第二搜索词对应的搜索建议;
所述获取当前用户输入的第一搜索词具体为:
获取当前用户在所述第二搜索词对应的搜索建议中选择的优选建议,将所述优选建议作为当前用户输入的所述第一搜索词。
3.根据权利要求1所述的方法,其特征在于,所述候选建议的重要度特征基于预设时间点之前的相关数据获取得到。
4.根据权利要求3所述的方法,其特征在于,所述候选建议的重要度特征还基于所述预设时间点之后的相关数据,每隔预设周期进行修正。
5.根据权利要求3或4所述的方法,其特征在于,所述相关数据包括以下参数中的至少一项:
所述候选建议的TF-IDF值、所述候选建议与所述第一搜索词共同被搜索的次数和/或频率、所述候选建议与所述历史用户行为相关的次数和/或频率、所述候选建议的词语属性值、以及所述候选建议的标注属性值。
6.根据权利要求1所述的方法,其特征在于,所述获取日志记录中与该关键词相关的历史用户行为,包括:
获取日志记录中历史用户使用的搜索词;
对所述历史用户使用的搜索词进行聚类;
确定该关键词所对应的聚类;
根据所述日志记录确定与该关键词所对应的聚类包含的搜索词相关的用户行为,将所述相关的用户行为作为与该关键词相关的历史用户行为。
7.根据权利要求1所述的方法,其特征在于,所述离线列表中的任一关键词对应的搜索建议具体为经过同义词和/或停用词过滤的搜索建议。
8.根据权利要求1所述的方法,其特征在于,所述对所述文档进行分词具体为:对所述文档的标题和/或属性内容进行分词。
9.一种搜索建议提供装置,其特征在于,所述装置包括:
第一搜索词获取单元,用于获取当前用户输入的第一搜索词;
关键词匹配单元,用于将所述第一搜索词与离线列表中的至少一个关键词相匹配,以从所述离线列表中选取至少一个关键词;所述离线列表中的每个关键词分别对应至少一个搜索建议;
第一建议提供单元,用于在所述离线列表中获取与选取的至少一个关键词对应的搜索建议,作为所述第一搜索词的搜索建议向当前用户提供;
用户行为获取单元,用于获取日志记录中与所述离线列表中任一关键词相关的历史用户行为;
文档获取单元,用于获取所述历史用户行为所产生的文档;
分词单元,用于对所述文档进行分词,得到至少一个候选建议;
筛选单元,用于根据所述候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:第二搜索词获取单元和第二建议提供单元;
所述第二搜索词获取单元用于获取当前用户输入的第二搜索词;
所述第二建议提供单元用于向当前用户提供与所述第二搜索词对应的搜索建议;
所述第一搜索词获取单元用于获取当前用户在所述第二搜索词对应的搜索建议中选择的优选建议,将所述优选建议作为当前用户输入的所述第一搜索词。
11.根据权利要求9所述的装置,其特征在于,所述候选建议的重要度特征由所述筛选单元基于预设时间点之前的相关数据获取得到。
12.根据权利要求11所述的装置,其特征在于,所述候选建议的重要度特征还由所述筛选单元基于所述预设时间点之后的相关数据,每隔预设周期进行修正。
13.根据权利要求11或12所述的装置,其特征在于,所述相关数据包括以下参数中的至少一项:
所述候选建议的TF-IDF值、所述候选建议与所述第一搜索词共同被搜索的次数和/或频率、所述候选建议与所述历史用户行为相关的次数和/或频率、所述候选建议的词语属性值、以及所述候选建议的标注属性值。
14.根据权利要求9所述的装置,其特征在于,所述用户行为获取单元包括:
搜索词获取子单元,用于获取日志记录中历史用户使用的搜索词;
聚类子单元,用于对所述历史用户使用的搜索词进行聚类;
聚类确定子单元,用于确定该关键词所对应的聚类;
用户行为确定子单元,用于根据所述日志记录确定与该关键词所对应的聚类包含的搜索词相关的用户行为,将所述相关的用户行为作为与该关键词相关的历史用户行为。
15.根据权利要求9所述的装置,其特征在于,所述离线列表中的任一关键词对应的搜索建议具体为经过同义词和/或停用词过滤的搜索建议。
16.根据权利要求9所述的装置,其特征在于,所述分词单元用于对所述文档进行分词具体为:
所述分词单元用于对所述文档的标题和/或属性内容进行分词。
CN201410108614.1A 2014-03-21 2014-03-21 一种搜索建议提供方法及装置 Active CN104933081B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201410108614.1A CN104933081B (zh) 2014-03-21 2014-03-21 一种搜索建议提供方法及装置
TW103118597A TW201537367A (zh) 2014-03-21 2014-05-28 搜索建議提供方法及裝置
PCT/US2015/021601 WO2015143239A1 (en) 2014-03-21 2015-03-19 Providing search recommendation
JP2016553647A JP2017508214A (ja) 2014-03-21 2015-03-19 検索推奨の提供
US14/663,371 US10042896B2 (en) 2014-03-21 2015-03-19 Providing search recommendation
HK15111783.1A HK1211100A1 (zh) 2014-03-21 2015-12-01 種搜索建議提供方法及裝置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410108614.1A CN104933081B (zh) 2014-03-21 2014-03-21 一种搜索建议提供方法及装置

Publications (2)

Publication Number Publication Date
CN104933081A CN104933081A (zh) 2015-09-23
CN104933081B true CN104933081B (zh) 2018-06-29

Family

ID=54120249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410108614.1A Active CN104933081B (zh) 2014-03-21 2014-03-21 一种搜索建议提供方法及装置

Country Status (6)

Country Link
US (1) US10042896B2 (zh)
JP (1) JP2017508214A (zh)
CN (1) CN104933081B (zh)
HK (1) HK1211100A1 (zh)
TW (1) TW201537367A (zh)
WO (1) WO2015143239A1 (zh)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682012B (zh) * 2015-11-06 2020-12-01 阿里巴巴集团控股有限公司 商品对象信息搜索方法及装置
CN106708886B (zh) * 2015-11-17 2020-08-11 北京国双科技有限公司 站内搜索词的显示方法及装置
CN105955988B (zh) * 2016-04-19 2020-05-08 百度在线网络技术(北京)有限公司 信息搜索方法和装置
CN107665710B (zh) * 2016-07-27 2021-02-09 上海博泰悦臻网络技术服务有限公司 移动终端语音数据处理方法及装置
CN107798012B (zh) * 2016-09-05 2021-12-14 腾讯科技(深圳)有限公司 阅读资源评论推送方法和***
CN106484859A (zh) * 2016-09-30 2017-03-08 维沃移动通信有限公司 一种关联词展现方法和装置
CN106777217B (zh) * 2016-12-23 2020-10-30 北京奇虎科技有限公司 一种搜索词推荐方法及装置
CN108664494A (zh) * 2017-03-29 2018-10-16 北京京东尚科信息技术有限公司 数据匹配的方法、装置、电子设备和储存介质
US20200098029A1 (en) * 2017-04-13 2020-03-26 Shiseido Company, Ltd. Fragrance product proposal system
CN110019885B (zh) * 2017-08-01 2021-10-15 北京搜狗科技发展有限公司 一种表情数据推荐方法及装置
US10853375B1 (en) * 2017-08-25 2020-12-01 Roblox Corporation Leveraging historical data to improve the relevancy of search results
CN110019646B (zh) * 2017-10-12 2021-10-15 北京京东尚科信息技术有限公司 一种建立索引的方法和装置
CN107908787A (zh) * 2017-12-11 2018-04-13 广东欧珀移动通信有限公司 一种搜索提示方法、终端设备及存储介质
US11475082B1 (en) * 2017-12-15 2022-10-18 Palantir Technologies Inc. Systems and methods for context-based keyword searching
CN108256070B (zh) 2018-01-17 2022-07-15 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN108304115B (zh) * 2018-02-12 2020-12-04 Oppo广东移动通信有限公司 终端条目选择方法、装置及存储介质和终端
CN108470046B (zh) * 2018-03-07 2020-12-01 中国科学院自动化研究所 基于新闻事件搜索语句的新闻事件排序方法及***
US20190287070A1 (en) * 2018-03-15 2019-09-19 Microsoft Technology Licensing, Llc Query expansion for candidate selection
CN110457568A (zh) * 2018-05-03 2019-11-15 北京京东尚科信息技术有限公司 品牌词的识别方法及***、对象推荐方法及***
CN110781365B (zh) * 2018-07-13 2023-04-28 阿里巴巴集团控股有限公司 商品搜索方法、装置、***及电子设备
CN109299383B (zh) * 2018-11-02 2021-11-05 北京字节跳动网络技术有限公司 生成推荐词的方法、装置、电子设备及存储介质
CN110008396B (zh) * 2018-11-28 2023-11-24 创新先进技术有限公司 对象信息推送方法、装置、设备及计算机可读存储介质
CN109726175A (zh) * 2018-12-29 2019-05-07 北京赛思信安技术股份有限公司 一种基于HBase的海量文件离线分区管理方法
CN109918555B (zh) 2019-02-20 2021-10-15 百度在线网络技术(北京)有限公司 用于提供搜索建议的方法、装置、设备和介质
US11501183B2 (en) 2019-07-15 2022-11-15 HCL Australia Services Pty. Ltd Generating a recommendation associated with an extraction rule for big-data analysis
JP7452011B2 (ja) * 2019-12-27 2024-03-19 富士フイルムビジネスイノベーション株式会社 情報処理装置、及びコンピュータプログラム
CN111159549B (zh) * 2019-12-27 2023-09-12 飞狐信息技术(天津)有限公司 一种信息推荐方法及***
CN111241247A (zh) * 2020-01-19 2020-06-05 国网湖南省电力有限公司 一种电力***异常状态历史记录搜索方法、***及介质
CN111310287B (zh) * 2020-02-14 2023-04-07 广东省智能制造研究所 一种机械结构信息的推荐方法及装置
CN111324804B (zh) * 2020-02-21 2023-09-22 抖音视界有限公司 搜索关键词推荐模型生成方法、关键词推荐方法与装置
CN111324771B (zh) * 2020-02-26 2022-11-04 腾讯科技(深圳)有限公司 视频标签的确定方法、装置、电子设备及存储介质
CN113688304A (zh) * 2020-05-19 2021-11-23 华为技术有限公司 搜索推荐模型的训练方法、搜索结果排序的方法及装置
CN111400607B (zh) * 2020-06-04 2020-11-10 浙江口碑网络技术有限公司 搜索内容输出方法、装置、计算机设备及可读存储介质
CN113051392A (zh) * 2021-04-30 2021-06-29 中国银行股份有限公司 知识推送方法及装置
CN113792153B (zh) * 2021-08-25 2023-12-12 北京度商软件技术有限公司 问答推荐方法及其装置
CN114117237A (zh) * 2021-12-08 2022-03-01 中国科学院计算机网络信息中心 一种文章推荐方法及电子设备
CN116521906B (zh) * 2023-04-28 2023-10-24 广州商研网络科技有限公司 元描述生成方法及其装置、设备、介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103064853A (zh) * 2011-10-20 2013-04-24 北京百度网讯科技有限公司 一种搜索建议生成方法、装置及***
CN103389988A (zh) * 2012-05-10 2013-11-13 腾讯科技(深圳)有限公司 一种引导用户进行信息搜索的方法及装置

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6144958A (en) 1998-07-15 2000-11-07 Amazon.Com, Inc. System and method for correcting spelling errors in search queries
US6317722B1 (en) 1998-09-18 2001-11-13 Amazon.Com, Inc. Use of electronic shopping carts to generate personal recommendations
JP4471737B2 (ja) * 2003-10-06 2010-06-02 日本電信電話株式会社 グループ化条件決定装置と方法およびそれを用いたキーワード拡張装置と方法ならびにコンテンツ検索システムおよびコンテンツ情報提供システムと方法ならびにプログラム
US7944599B2 (en) * 2004-09-27 2011-05-17 Qualcomm Mems Technologies, Inc. Electromechanical device with optical function separated from mechanical and electrical function
US7725485B1 (en) * 2005-08-01 2010-05-25 Google Inc. Generating query suggestions using contextual information
US8266162B2 (en) * 2005-10-31 2012-09-11 Lycos, Inc. Automatic identification of related search keywords
JP2007241451A (ja) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd 情報収集支援装置
US20070260597A1 (en) * 2006-05-02 2007-11-08 Mark Cramer Dynamic search engine results employing user behavior
US8050998B2 (en) * 2007-04-26 2011-11-01 Ebay Inc. Flexible asset and search recommendation engines
US7752201B2 (en) 2007-05-10 2010-07-06 Microsoft Corporation Recommendation of related electronic assets based on user search behavior
US20090171929A1 (en) * 2007-12-26 2009-07-02 Microsoft Corporation Toward optimized query suggeston: user interfaces and algorithms
JP2009245179A (ja) * 2008-03-31 2009-10-22 Nomura Research Institute Ltd 文書検索支援装置
US9754262B2 (en) 2008-04-30 2017-09-05 Sony Electronics Inc. Amassing information about community participant behaviors
JP4759600B2 (ja) * 2008-08-26 2011-08-31 日本電信電話株式会社 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体
JP4876151B2 (ja) * 2009-07-23 2012-02-15 株式会社日立製作所 検索キーワード候補表示システム、検索キーワード候補表示方法およびプログラム
US10204163B2 (en) 2010-04-19 2019-02-12 Microsoft Technology Licensing, Llc Active prediction of diverse search intent based upon user browsing behavior
US20120117006A1 (en) 2010-11-04 2012-05-10 Nokia Corporation Method and apparatus for building a user behavior model
CN102567408B (zh) * 2010-12-31 2014-06-04 阿里巴巴集团控股有限公司 推荐搜索关键词的方法和装置
CN102646103B (zh) * 2011-02-18 2016-03-16 腾讯科技(深圳)有限公司 检索词的聚类方法和装置
US20130041884A1 (en) 2011-08-12 2013-02-14 Jagadeshwar Reddy Nomula Method and system for resolving search queries that are inclined towards social activities
CN102956009B (zh) * 2011-08-16 2017-03-01 阿里巴巴集团控股有限公司 一种基于用户行为的电子商务信息推荐方法与装置
CN102368262B (zh) 2011-10-14 2013-05-29 北京百度网讯科技有限公司 一种提供与查询序列相对应的搜索建议的方法与设备
JP2013088994A (ja) 2011-10-18 2013-05-13 Sony Corp 情報処理装置、サーバ、情報処理システム、および情報処理方法
US8687886B2 (en) 2011-12-29 2014-04-01 Konica Minolta Laboratory U.S.A., Inc. Method and apparatus for document image indexing and retrieval using multi-level document image structure and local features
CN103218719B (zh) * 2012-01-19 2016-12-07 阿里巴巴集团控股有限公司 一种电子商务网站导航方法及***
US20140201180A1 (en) * 2012-09-14 2014-07-17 Broadbandtv, Corp. Intelligent Supplemental Search Engine Optimization
US9817827B2 (en) 2012-10-04 2017-11-14 Netflix, Inc. Relationship-based search and recommendations
US20150006290A1 (en) 2013-06-27 2015-01-01 Google Inc. Providing information to a user based on determined user activity

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103064853A (zh) * 2011-10-20 2013-04-24 北京百度网讯科技有限公司 一种搜索建议生成方法、装置及***
CN103389988A (zh) * 2012-05-10 2013-11-13 腾讯科技(深圳)有限公司 一种引导用户进行信息搜索的方法及装置

Also Published As

Publication number Publication date
US10042896B2 (en) 2018-08-07
TW201537367A (zh) 2015-10-01
JP2017508214A (ja) 2017-03-23
US20150269163A1 (en) 2015-09-24
CN104933081A (zh) 2015-09-23
HK1211100A1 (zh) 2016-05-13
WO2015143239A1 (en) 2015-09-24

Similar Documents

Publication Publication Date Title
CN104933081B (zh) 一种搜索建议提供方法及装置
TWI732271B (zh) 人機對話方法、裝置、電子設備及電腦可讀媒體
EP3180742B1 (en) Generating and using a knowledge-enhanced model
US9836511B2 (en) Computer-generated sentiment-based knowledge base
US11061974B2 (en) Facilitating discovery of information items using dynamic knowledge graph
KR102032091B1 (ko) 인공지능 기반의 댓글 감성 분석 방법 및 그 시스템
US20160299955A1 (en) Text mining system and tool
JP6676110B2 (ja) 発話文生成装置とその方法とプログラム
US20180246880A1 (en) System for generating synthetic sentiment using multiple points of reference within a hierarchical head noun structure
CN102200973A (zh) 生成具有基于情感导向的影响关系的观点对的设备和方法
Singh et al. Sentiment analysis using lexicon based approach
Tembhurnikar et al. Topic detection using BNgram method and sentiment analysis on twitter dataset
KR20190124986A (ko) 연관법령 제공 방법
Jedrzejewski et al. Opinion mining and social networks: A promising match
JP5224532B2 (ja) 評判情報分類装置及びプログラム
Kulcu et al. A scalable approach for sentiment analysis of Turkish tweets and linking tweets to news
Walha et al. A Lexicon approach to multidimensional analysis of tweets opinion
Pasarate et al. Comparative study of feature extraction techniques used in sentiment analysis
Ren et al. Resource recommendation algorithm based on text semantics and sentiment analysis
Kasper et al. Monitoring and summarization of hotel reviews
US11507593B2 (en) System and method for generating queryeable structured document from an unstructured document using machine learning
Putri et al. Content-based filtering model for recommendation of Indonesian legal article study case of klinik hukumonline
Gascó et al. Evaluating noise perception through online social networks: A text mining approach to designing a noise-event alarm system based on social media content
Moriyama et al. Visual user interface to supporting information seeking behavior in context searching
Ahmad et al. SocialPulse: A Tool for Extracting Interesting Insights from Social Media

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1211100

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant