CN102915312A - 网站中的信息发布方法和*** - Google Patents

网站中的信息发布方法和*** Download PDF

Info

Publication number
CN102915312A
CN102915312A CN2011102213865A CN201110221386A CN102915312A CN 102915312 A CN102915312 A CN 102915312A CN 2011102213865 A CN2011102213865 A CN 2011102213865A CN 201110221386 A CN201110221386 A CN 201110221386A CN 102915312 A CN102915312 A CN 102915312A
Authority
CN
China
Prior art keywords
query
query entries
keyword
server
entries
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011102213865A
Other languages
English (en)
Other versions
CN102915312B (zh
Inventor
张祝玉
黄鹏
林锋
冯炯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201110221386.5A priority Critical patent/CN102915312B/zh
Publication of CN102915312A publication Critical patent/CN102915312A/zh
Priority to HK13103670.6A priority patent/HK1176431A1/zh
Application granted granted Critical
Publication of CN102915312B publication Critical patent/CN102915312B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种网站中的信息发布方法和***,其中,该方法包括:信息发布端的服务器通过客户端接收用户输入的待发布信息的主题信息;服务器向存储器查询与主题信息相关的查询条目,其中,存储器存储有历史记录的查询条目;服务器将所查询到的查询条目作为待发布信息的关键词发送给客户端;服务器通过客户端接收对关键词进行选择得到的发布信息。本发明解决在不额外占用网站数据库的存储空间的情况下如何进一步提高检索的召回率的技术问题,从而能够在不额外占用网站数据库服务器存储空间的情况下提高用户发布信息的召回率。

Description

网站中的信息发布方法和***
技术领域
本申请涉及互联网技术领域,具体而言,涉及一种网站中的信息发布方法和***。
背景技术
信息检索的基本过程是:1)用户构思一个表达其搜索意图的查询词并提交搜索引擎;2)搜索引擎检索出与该关键词匹配的网页;3)搜索引擎对检索到的网页根据网页本身的信息或网页之间的关系按照某种既定策略进行排序。
垂直搜索引擎,如电子商务搜索引擎,与通用搜索引擎的区别之一在于:电子商务搜索引擎更看重匹配结果的精确性,要求完全匹配用户的输入。例如用户查询时常常输入特定属性、型号或品牌的产品,电子商务搜索引擎通常的做法是保证查询词的各个部分(规范化处理除外)都要在查询结果中被检索到。这种做法很大程度上保证了检索结果的精确性,但召回率(检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索***的查全率)相应的会有一定的损失,原因是用户的产品发布信息(offer)中没有包含某些特定的属性、型号或品牌等关键词描述,从而最终导致查询用户的查询体验度下降。
提高检索召回率的方法之一可以是在网站的用户发布信息的时候,要求用户填写更完善的信息描述,如将商品的特定属性、型号或品牌等关键词一一填写完整,并上传至网站服务器,存储在网站数据库中。这样在信息的检索过程中,就能有更多的查询结果与查询用户输入的查询关键词相匹配。然而这种做法遇到的最大的技术问题是,由于用户发布信息时填写的信息内容的增多,导致用户发布信息中的数据量会增大,对于一个超大型的网站,其数据库存储容量将会受到挑战,导致该网站必须增加更多的数据库服务器来存储用户发布信息时额外填写的数据信息。
针对相关技术中上述存在的问题,目前尚未提出在不额外占用网站数据库的存储空间的情况下,如何进一步提高检索的召回率的技术方案。
发明内容
本申请的主要目的在于提供一种网站中的信息发布方法和***,以至少解决现有技术中在不额外占用网站数据库的存储空间的情况下,如何进一步提高检索的召回率的技术问题。
根据本申请的一个方面,提供了一种网站中的信息发布方法,包括:信息发布端的服务器通过客户端接收用户输入的待发布信息的主题信息;服务器向存储器查询与主题信息相关的查询条目,其中,存储器存储有历史记录的查询条目;服务器将所查询到的查询条目作为待发布信息的关键词发送给客户端;服务器通过客户端接收对关键词进行选择得到的发布信息。
进一步地,主题信息包括:待发布信息的标题以及类别。
进一步地,服务器通过以下查询步骤向存储器查询与主题信息相关的查询条目:服务器将标题分割成M个独立的关键词,并从M个关键词中选取N个关键词,其中,M和N均为自然数,且M≥N;服务器从存储器中查询是否存在包括N个关键词的查询条目;若存在,则服务器判断所查询到的查询条目中属于所述类别的查询条目的个数是否大于等于P个,若大于等于,则将属于类别的前P个所查询到的查询条目作为与主题信息相关的查询条目,其中,P为预先设定的自然数。
进一步地,若服务器判断所查询到的查询条目中属于所述类别的查询条目的个数小于P个,则服务器向存储器查询与主题信息相关的查询条目的步骤还包括:重复执行以下步骤,直到所查询到的查询条目中属于所述类别的查询条目的个数大于等于P个:服务器令N=N-1,并在存储器中执行查询步骤。
进一步地,服务器通过以下查询步骤向存储器查询与主题信息相关的查询条目:服务器从存储器中选择出属于类别的查询条目;服务器将标题分割成M个独立的关键词,并从M个关键词中选取N个关键词,其中,M和N均为自然数,且M≥N;服务器在选择出来的属于类别的查询条目中查找是否存在Q个以上包括N个关键词的查询条目,其中,Q为预先设定的自然数;若存在,则将属于类别的前Q个所查询到的查询条目作为与主题信息相关的查询条目。
进一步地,若服务器判断出属于类别的所查询到的查询条目的个数小于Q个,则服务器向存储器查询与主题信息相关的查询条目的步骤还包括:重复执行以下步骤,直到属于类别的所查询到的查询条目的个数大于等于Q个:服务器令N=N-1,并在存储器中执行查询步骤。
进一步地,服务器将所查询到的查询条目作为关键词发送给客户端的步骤包括:服务器根据查询到的查询条目中的每一个查询条目的线上查询结果的个数是否大于预定阈值;服务器将线上查询结果的个数大于预定阈值的查询条目记录为第一组查询条目,并将线上查询结果的个数小于等于预定阈值的查询条目记录为第二组查询条目;服务器将第一组查询条目和第二组查询条目作为关键词发送给客户端。
进一步地,服务器将线上查询结果的个数大于预定阈值的查询条目记录为第一组查询条目的步骤包括:计算线上查询结果的个数大于预定阈值的查询条目中的每一个查询条目与标题的相关度;按照相关度从大到小的顺序在第一组查询条目中记录查询结果的个数大于预定阈值的查询条目。服务器将线上查询结果的个数小于等于预定阈值的查询条目记录为第二组查询条目的步骤包括:计算线上查询结果的个数小于等于预定阈值的查询条目中的每一个查询条目与标题的相关度;按照相关度从大到小的顺序在第二组查询条目中记录查询结果的个数小于等于预定阈值的查询条目。
进一步,在服务器向存储器查询与主题信息相关的查询条目之前,上述方法还包括:服务器对存储器中存储的历史记录的查询条目进行更新。
根据本申请的另一方面,提供了一种网站中的信息发布***,包括:信息发布端的服务器和客户端,其中,客户端用于向服务器发送用户输入的待发布信息的主题信息,其中,主题信息包括待发布信息的标题以及类别;信息发布端的服务器用于接收客户端发送的主题信息;向存储器查询与主题信息相关的查询条目,其中,存储器存储有历史记录的查询条目;将所查询到的查询条目作为待发布信息的关键词发送给客户端,并通过客户端接收对关键词进行选择得到的发布信息。
进一步地,服务器包括:第一标题处理单元,用于在向存储器查询与主题信息相关的查询条目时,将标题分割成M个独立的关键词,并从M个关键词中选取N个关键词,其中,M和N均为自然数,且M≥N;第一查询单元,用于从存储器中查询是否存在包括N个关键词的查询条目;第一判断单元,用于在存在包括N个关键词的查询条目时,判断所查询到的查询条目中属于所述类别的查询条目的个数是否大于等于P个,若大于等于,则将属于类别的前P个所查询到的查询条目作为与主题信息相关的查询条目,其中,P为预先设定的自然数。
进一步地,服务器还用于在第一判断单元判断出所查询到的查询条目中属于所述类别的查询条目的个数小于P个时,重复执行以下步骤,直到所查询到的查询条目中属于所述类别的查询条目的个数大于等于P个:服务器令N=N-1;通知第一标题处理单元从M个关键词中选取N个关键词;通知第一查询单元从存储器中查询是否存在包括N个关键词的查询条目;以及通知第一判断单元在存在包括N个关键词的查询条目时判断所查询到的查询条目中属于所述类别的查询条目的个数是否大于等于P个,若大于,则将属于类别的前P个所查询到的查询条目作为与主题信息相关的查询条目。
进一步地,服务器包括:选择单元,用于从存储器中选择出属于类别的查询条目;第二标题处理单元,用于将标题分割成M个独立的关键词,并从M个关键词中选取N个关键词,其中,M和N均为自然数,且M≥N;第二查询单元,用于在选择出来的属于类别的查询条目中查找是否存在Q个以上包括N个关键词的查询条目,其中,Q为预先设定的自然数;若存在,则将属于类别的前Q个所查询到的查询条目作为与主题信息相关的查询条目。
进一步地,服务器还用于在第二查询单元查找出的属于类别的所查询到的查询条目的个数小于Q个时,重复执行以下步骤,直到属于类别的所查询到的查询条目的个数大于等于Q个:服务器令N=N-1;通知第二标题处理单元从M个关键词中选取N个关键词;以及通知第二查询单元在选择出来的属于类别的查询条目中查找是否存在Q个以上包括N个关键词的查询条目,若存在,则将属于类别的前Q个所查询到的查询条目作为与主题信息相关的查询条目。
进一步地,服务器包括:第二判断单元,用于在服务器将所查询到的查询条目作为待发布信息的关键词发送给客户端时,判断查询到的查询条目中的每一个查询条目的线上查询结果的个数是否大于预定阈值;记录单元,用于将线上查询结果的个数大于预定阈值的查询条目记录为第一组查询条目,并将线上查询结果的个数小于等于预定阈值的查询条目记录为第二组查询条目;发送单元,用于将第一组查询条目和第二组查询条目作为关键词发送给客户端。
进一步地,记录单元包括:第一记录单元,用于通过以下步骤记录查询结果的个数大于预定阈值的查询条目:计算线上查询结果的个数大于预定阈值的查询条目中的每一个查询条目与标题的相关度;按照相关度从大到小的顺序在第一组查询条目中记录查询结果的个数大于预定阈值的查询条目;第二记录单元,用于通过以下步骤记录查询结果的个数小于等于预定阈值的查询条目:计算线上查询结果的个数小于等于预定阈值的查询条目中的每一个查询条目与标题的相关度;按照相关度从大到小的顺序在第二组查询条目中记录查询结果的个数小于等于预定阈值的查询条目。
进一步地,所述服务器包括:更新单元,用于在所述服务器向存储器查询与主题信息相关的查询条目之前,对存储器中存储的历史记录的查询条目进行更新。
本申请通过以上技术方案实现了以下技术效果:
1)服务器通过将历史记录的查询条目作为所述待发布信息的关键词发送给所述客户端,有效地将买方用户查询的倾向性通过客户端推荐给卖方用户,使得卖方用户不用填写大量的信息描述内容,在不额外占用网站数据库服务器存储空间的情况下,能够提高用户发布产品信息的召回率,最终达到减少零/少结果查询词数量的目的,优选的,可以改进买家在电子商务网站上的体验度并进一步提升买家交易积极性;
2)服务器在历史记录中选择与卖方用户输入的主题信息相关的查询条目,而这种查询条目来自各个买方的不同输入,避免了生成关键词单一的问题,使得即使在买方用户输入不同的查询词时可以根据卖方发布的产品信息返回该卖方的查询结果;
3)服务器通过对历史记录的查询条目进行动态更新,可以解决生成的关键词数量有限且同质化严重的问题,能够实时地将反应了买方用户查询的倾向性的关键词推荐给卖方用户。
当然,实施本申请的任一产品必不一定需要同时达到以上所述的所有优点。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的网站中的信息发布***的一种优选结构框图;
图2是根据本申请实施例的网站中的信息发布***中的服务器的一种优选结构框图;
图3是根据本申请实施例的网站中的信息发布***中的服务器的另一种优选结构框图;
图4是根据本申请实施例的网站中的信息发布***的另一种结构框图;
图5是根据本申请实施例的网站中的信息发布方法的一种优选流程图;
图6是根据本申请实施例的网站中的信息发布方法的另一种优选流程图;
图7是根据本申请实施例的网站中的信息发布方法的又一种优选流程图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。本申请实施例将以电子商务网站中的产品信息发布与检索为例进行说明,当然本领域技术人员在不需要做出创造性劳动的条件下可以把本申请技术方案推广应用于视频网站、网络论坛等网站中。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
首先,对本申请所涉及的若干术语进行解释:
1)查询:即用户在搜索过程中输入的查询词。
2)产品:在电子商务领域中,商家出售的商品。
3)类别(类目):即在电子商务领域中,一个产品所属的类别(类目)。
4)关键词:正确描述商品信息的若干词语,用于检索端商品信息的建索引。
5)蓝海词:电子商务领域,用户搜索次数多但检索结果少的查询词。
6)热门词:电子商务领域,用户搜索次数多且检索结果多的查询词。
7)召回率:检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索***的查全率。
8)querylog:用户在电子商务网站的查询日志。
9)产品曝光率:一个商品在电子商务网站的历史查询中被展现给搜索用户的比率。
在描述本申请的各实施例的进一步细节之前,将参考图1来描述可用于实现本申请的原理的一个合适的计算体系结构。在以下描述中,除非另外指明,否则将参考由一个或多个计算机执行的动作和操作的符号表示来描述本申请的各实施例。由此,可以理解,有时被称为计算机执行的这类动作和操作包括计算机的处理单元对以结构化形式表示数据的电信号的操纵。这一操纵转换了数据或在计算机的存储器***中的位置上维护它,这以本领域的技术人员都理解的方式重配置或改变了计算机的操作。维护数据的数据结构是具有数据的格式所定义的特定属性的存储器的物理位置。然而,尽管在上述上下文中描述本申请,但它并不意味着限制性的,如本领域的技术人员所理解的,后文所描述的动作和操作的各方面也可用硬件来实现。
转向附图,其中相同的参考标号指代相同的元素,本申请的原理被示为在一合适的计算环境中实现。以下描述基于所述的本申请的实施例,并且不应认为是关于此处未明确描述的替换实施例而限制本申请。
图1示出了可用于这些设备的一个示例计算机体系结构的示意图。出于描述的目的,所绘的体系结构仅为合适环境的一个示例,并非对本申请的使用范围或功能提出任何局限。也不应将该计算***解释为对图1所示的任一组件或其组合具有任何依赖或需求。
本申请的原理可以使用其它通用或专用计算或通信环境或配置来操作。适用于本申请的众所周知的计算***、环境和配置的示例包括但不限于,个人计算机、服务器,多处理器***、基于微处理的***、小型机、大型计算机、以及包括任一上述***或设备的分布式计算环境。
在其最基本的配置中,图1出示了一种网站中的信息发布***,其包括:信息发布端的服务器102以及一个或多个客户端104。服务器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置、用于存储数据的存储装置以及与客户端104通信的传输装置;客户端104可以包括:微处理器MCU、与服务器通信的传输装置、与用户交互的显示装置。在本说明书和权利要求书中,“网站中的信息发布***”也可以被定义为能够执行软件、固件或微码来实现功能的任何硬件组件或硬件组件的组合。网站中的信息发布***甚至可以是分布式的,以实现分布式功能。
实施例1
如图1所示,网站中的信息发布***包括:相互连接的信息发布端的服务器102和客户端104。
在工作过程中,客户端104向服务器102发送用户输入的待发布信息的主题信息,在本申请优选的实施例中,主题信息包括但不限于待发布信息的标题以及类别;信息发布端的服务器102在接收客户端104发送的主题信息之后,向存储器查询与主题信息相关的查询条目,其中,存储器存储有历史记录的查询条目;服务器102将所查询到的查询条目作为待发布信息的关键词发送给客户端104,并通过客户端104接收对关键词进行选择得到的发布信息。上述的查询条目为历史记录的买方用户所采用的查询信息,表示了搜索信息的用户对于该待发布的信息所采用的搜索习惯和搜索关注点等信息。
本实施例中的待发布信息可以为电子商务网站中的待发布的产品信息,或者,视频网站中的待发布的视频信息等。
在上述优选的实施例中,服务器通过将历史记录的查询条目作为待发布信息的关键词发送给客户端,有效地将搜索信息的用户查询的倾向性通过客户端推荐给发布信息的用户,从而能够提高用户发布的信息的召回率,最终达到减少零/少结果查询词数量的目的。此外,由于本申请有效地将搜索信息的用户查询的倾向性信息通过客户端推荐给发布信息的用户,使得发布信息的用户在发布信息时不用填写大量的信息描述内容,这样存储待发布信息的数据库服务器也不用存储大量的待发布信息,即,本申请在不额外占用网站数据库服务器存储空间的情况下,提高了发布信息的用户发布信息的召回率。优选的,当发布信息的用户为电子商务网站的卖方时,可以改进买家在电子商务网站上的体验度并进一步提升买家交易积极性。
在本申请的各个实施例中,上述存储器可以设置在信息发布端的服务器上,也可以设置在其他的服务器上,对此,本申请不作限定。
为了使服务器在存储器中获取与主题信息相关的查询条目,本申请提供了两种不同的方式,下面以待发布信息为电子商务网站上的卖方待发布的产品信息为例,结合附图来进行详细描述在存储器中获取与主题信息相关的查询条目的过程。
(1)先判断待发布产品的标题,再判断待发布产品的类别
在这种查询方式下,图1所示的服务器可以包括图2中的具体结构。如图2所示,服务器202包括依次连接的第一标题处理单元2021、第一查询单元2022以及第一判断单元2023,其中,第一标题处理单元2021在向存储器(这里,存储器用于存储有历史记录的查询条目,其可以位于服务器上,也可以位于其他后台设备上,或者为独立的存储设备)查询与主题信息相关的查询条目时,对标题分割成M个独立的关键词,并从M个关键词中选取N个关键词,其中,M和N均为自然数,且M≥N;第一查询单元2022从存储器中查询是否存在包括N个关键词的查询条目;第一判断单元2023在存在包括N个关键词的查询条目时,判断所查询到的查询条目中属于所述类别的查询条目的个数是否大于等于P个,若大于,则将属于类别的所查询到的查询条目作为与主题信息相关的查询条目,其中,P为预先设定的自然数。优选的,也可以只将部分查询条目作为与主题信息相关的查询条目,例如,若属于类别的所查询到的查询条目的个数大于等于P个,则将属于所述类别的前P个所查询到的查询条目作为与所述主题信息相关的查询条目。
其中,在第一判断单元2023判断出所查询到的查询条目中属于所述类别的查询条目的个数小于P个时,重复执行以下步骤,直到所查询到的查询条目中属于所述类别的查询条目的个数大于等于P个:服务器202令N=N-1,并通知第一查询单元2022在存储器中执行查询步骤。在本优选的实施例中,通过动态调整查询参数,从而能够快速、准确得到所需要的查询结果。
下面以举例的方式来进一步描述上述判断过程。假设主题信息中的标题被分割成2个独立关键词:“苹果”和“手机”,而主题信息中的类别为“3G网络”,P为30,这样在存储器中查询与主题信息相关的条目时,首先查询同时包括上述两个关键词“苹果”和“手机”的查询条目,若查找到100条,则在这100条查询条目中判断哪些查询条目属于“3G网络”类别,若判断出100条查询条目中属于“3G网络”类别的查询条目超过30条,则将前30条查询到的查询条目作为与所述主题信息相关的查询条目。
(2)先判断待发布产品的类别,再判断待发布产品的标题
在这种查询方式下,图1所示的服务器可以包括图3中的具体结构。如图3所示,服务器302包括依次连接的选择单元3021、第二标题处理单元3022以及第二查询单元3023,其中,选择单元3021从存储器中选择出属于类别的查询条目;第二标题处理单元3022对标题分割成M个独立的关键词,并从M个关键词中选取N个关键词,其中,M和N均为自然数,且M≥N;第二查询单元3023在选择出来的属于类别的查询条目中查找是否存在Q个以上包括N个关键词的查询条目,其中,Q为预先设定的自然数;若存在,则将属于类别的所查询到的查询条目作为与主题信息相关的查询条目。优选的,也可以只将部分查询条目作为与主题信息相关的查询条目,例如,若在选择出来的属于类别的查询条目中存在Q个以上包括N个关键词的查询条目,则将属于所述类别的前Q个所查询到的查询条目作为与所述主题信息相关的查询条目。
其中,在第二查询单元3023查找出的属于类别的所查询到的查询条目的个数小于Q个时,重复执行以下步骤,直到属于类别的所查询到的查询条目的个数大于等于Q个:服务器302令N=N-1,并通知第二查询单元3023在存储器中执行查询步骤。在本优选的实施例中,通过动态调整查询参数,从而能够快速、准确得到所需要的查询结果。
下面以举例的方式来进一步描述上述判断过程。假设主题信息中的标题被分割成2个独立关键词:“苹果”和“手机”,而主题信息中的类别为“3G网络”,Q为30,这样在存储器中查询与主题信息相关的条目时,首先查询属于“3G网络”类别的查询条目,若查找到100条,则在这100条查询条目中判断哪些查询条目同时包括上述两个关键词“苹果”和“手机”,若判断出上述100条查询条目中同时包括上述两个关键词“苹果”和“手机”的查询条目超过30条,则将前30条查询到的查询条目作为与所述主题信息相关的查询条目。
对于上述图2和图3所示的服务器而言,其在历史记录中选择与卖方用户输入的主题信息相关的查询条目,而这种查询条目来自各个买方的不同输入,避免了生成关键词的单一问题,使得卖方发布的产品信息可以满足买方用户查询词多样化的特点。
在上述各个实施例的基础上,为了将所查询到的查询条目作为待发布产品的关键词发送给客户端,服务器还可以包括图4中的具体结构。如图4所示,服务器402包括依次连接的第二判断单元4021、记录单元4022以及发送单元4023,其中,第二判断单元4021在服务器将所查询到的查询条目作为待发布产品的关键词发送给客户端时,判断查询到的查询条目中的每一个查询条目的线上查询结果的个数是否大于预定阈值;记录单元4022将线上查询结果的个数大于预定阈值的查询条目记录为第一组查询条目,并将线上查询结果的个数小于等于预定阈值的查询条目记录为第二组查询条目;发送单元4023将第一组查询条目和第二组查询条目作为关键词发送给客户端404。
例如,当上述预定阈值为100时,可以将线上查询结果的个数小于等于100的查询条目记录为第二组查询条目,而这一组查询条目可以视为是蓝海词(价值相对较高),优选的,在发送给客户端时可以优先发送该组查询条目,这样,通过客户端向卖方用户首先显示这些价值更高的蓝海词可以更有效地反映目前用户查询的倾向性;此外,可以将线上查询结果的个数大于100的查询条目记录为第一组查询条目,这第一组查询条目中的一部分可以视为是热门词(价值相对较低),优选的,在将作为蓝海词的第二组查询条目发送给客户端之后,再发送作为热门词的第一组查询条目。也就是说,服务器通过客户端以先蓝海词后热门词的顺序将反映了买方用户查询的倾向性的关键词推荐给了卖方用户。通过上述的显示和记录方案,服务器可以按照价值的高低来向卖方用户推荐反映了买方查询倾向性的关键词,从而提高了卖方用户选择的效率。
其中,记录单元4022包括第一记录单元40221和第二记录单元40222,其中,第一记录单元40221通过以下步骤记录查询结果的个数大于预定阈值的查询条目:计算线上查询结果的个数大于预定阈值的查询条目中的每一个查询条目与标题的相关度;按照相关度从大到小的顺序在第一组查询条目中记录查询结果的个数大于预定阈值的查询条目;第二记录单元40222通过以下步骤记录查询结果的个数小于等于预定阈值的查询条目:计算线上查询结果的个数小于等于预定阈值的查询条目中的每一个查询条目与标题的相关度;按照相关度从大到小的顺序在第二组查询条目中记录查询结果的个数小于等于预定阈值的查询条目。
在上述各个实施例的基础上,为了实现对历史记录中的查询条目的动态更新,服务器还可以包括图4中所示的更新单元406,该更新单元406与存储器405相连,用于在服务器向存储器405查询与主题信息相关的查询条目之前,对存储器中存储的历史记录的查询条目进行更新。在本优选的实施例中,服务器通过对历史记录的查询条目进行动态更新,可以解决生成的关键词数量有限且同质化严重的问题,能够实时地将反应了买方用户查询的倾向性的关键词推荐给卖方用户。
实施例2
在图1-图4所示的网站中的信息发布***的基础上,本申请还提供了一种网站中的信息发布方法,如图5所示,该网站中的信息发布方法包括以下步骤:
S502,信息发布端的服务器通过客户端接收用户输入的待发布信息的主题信息;
S504,服务器向存储器查询与主题信息相关的查询条目,其中,存储器存储有历史记录的查询条目;
S506,服务器将所查询到的查询条目作为待发布信息的关键词发送给客户端;
S508,服务器通过客户端接收对关键词进行选择得到的发布信息。
在上述优选的实施例中,服务器通过将历史记录的查询条目作为待发布信息的关键词发送给客户端,有效地将搜索信息的用户查询的倾向性通过客户端推荐给发布信息的用户,从而能够提高用户发布的信息的召回率,最终达到减少零/少结果查询词数量的目的。此外,由于本申请有效地将搜索信息的用户查询的倾向性信息通过客户端推荐给发布信息的用户,使得发布信息的用户在发布信息时不用填写大量的信息描述内容,这样存储待发布信息的数据库服务器也不用存储大量的待发布信息,即,本申请在不额外占用网站数据库服务器存储空间的情况下,提高了发布信息的用户发布信息的召回率。优选的,当发布信息的用户为电子商务网站的卖方时,可以改进买家在电子商务网站上的体验度并进一步提升买家交易积极性。
优选的,主题信息包括:待发布信息的标题以及类别。
为了使服务器在存储器中获取与主题信息相关的查询条目,本申请提供了两种不同的方式,下面以待发布信息为电子商务网站上的卖方待发布的产品信息为例,结合附图来进行详细描述在存储器中获取与主题信息相关的查询条目的过程。
(1)先判断待发布产品的标题,再判断待发布产品的类别
服务器可以通过以下查询步骤向存储器查询与主题信息相关的查询条目:服务器将标题分割成M个独立的关键词,并从M个关键词中选取N个关键词,其中,M和N均为自然数,且M≥N;服务器从存储器中查询是否存在包括N个关键词的查询条目;若存在,则服务器判断所查询到的查询条目中属于所述类别的查询条目的个数是否大于等于P个,若大于等于,则将属于类别的所查询到的查询条目作为与主题信息相关的查询条目,其中,P为预先设定的自然数。优选的,也可以只将部分查询条目作为与主题信息相关的查询条目,例如,若属于类别的所查询到的查询条目的个数大于等于P个,则将属于所述类别的前P个所查询到的查询条目作为与所述主题信息相关的查询条目。
其中,若服务器判断出所查询到的查询条目中属于所述类别的查询条目的个数小于P个,则服务器向存储器查询与主题信息相关的查询条目的步骤还包括:重复执行以下步骤,直到所查询到的查询条目中属于所述类别的查询条目的个数大于等于P个:服务器令N=N-1,并在存储器中执行查询步骤。在本优选的实施例中,通过动态调整查询参数,从而能够快速、准确得到所需要的查询结果。
(2)先判断待发布产品的类别,再判断待发布产品的标题
服务器还可以通过以下查询步骤向存储器查询与主题信息相关的查询条目:服务器从存储器中选择出属于类别的查询条目;服务器将标题分割成M个独立的关键词,并从M个关键词中选取N个关键词,其中,M和N均为自然数,且M≥N;服务器在选择出来的属于类别的查询条目中查找是否存在Q个以上包括N个关键词的查询条目,其中,Q为预先设定的自然数;若存在,则将属于类别的所查询到的查询条目作为与主题信息相关的查询条目。优选的,也可以只将部分查询条目作为与主题信息相关的查询条目,例如,若在选择出来的属于类别的查询条目中存在Q个以上包括N个关键词的查询条目,则将属于所述类别的前Q个所查询到的查询条目作为与所述主题信息相关的查询条目。
其中,若服务器判断出属于类别的所查询到的查询条目的个数小于Q个,则服务器向存储器查询与主题信息相关的查询条目的步骤还包括:重复执行以下步骤,直到属于类别的所查询到的查询条目的个数大于等于Q个:服务器令N=N-1,并在存储器中执行查询步骤。在本优选的实施例中,通过动态调整查询参数,从而能够快速、准确得到所需要的查询结果。
对于上述两种查询方式,服务器均在历史记录中选择与卖方用户输入的主题信息相关的查询条目,而这种查询条目来自各个买方的不同输入,避免了生成关键词的单一问题,使得卖方发布的产品信息可以满足买方用户查询词多样化的特点。
在上述各个实施例的基础上,为了将所查询到的查询条目作为待发布产品的关键词发送给客户端,服务器通过以下步骤将所查询到的查询条目作为待发布产品的关键词发送给客户端:
S1:服务器判断查询到的查询条目中的每一个查询条目的线上查询结果的个数是否大于预定阈值;
S2:服务器将线上查询结果的个数大于预定阈值的查询条目记录为第一组查询条目,并将线上查询结果的个数小于等于预定阈值的查询条目记录为第二组查询条目;
例如,当上述预定阈值为100时,可以将线上查询结果的个数小于等于100的查询条目记录为第二组查询条目,而这一组查询条目可以视为是蓝海词(价值相对较高),优选的,在发送给客户端时可以优先发送该组查询条目,这样,通过客户端向卖方用户首先显示这些价值更高的蓝海词可以更有效地反映目前用户查询的倾向性;此外,可以将线上查询结果的个数大于100的查询条目记录为第一组查询条目,这第一组查询条目中的一部分可以视为是热门词(价值相对较低),优选的,在将作为蓝海词的第二组查询条目发送给客户端之后,再发送作为热门词的第一组查询条目。也就是说,服务器通过客户端以先蓝海词后热门词的顺序将反映了买方用户查询的倾向性的关键词推荐给了卖方用户。通过上述的显示和记录方案,服务器可以按照价值的高低来向卖方用户推荐反映了买方查询倾向性的关键词,从而提高了卖方用户选择的效率。
进一步,对于属于蓝海词的查询条目之间的记录和显示方案,则可以按照该查询条目与标题的匹配相关度来进行,具体其包括以下步骤:服务器计算线上查询结果的个数小于等于预定阈值的查询条目中的每一个查询条目与标题的相关度;按照相关度从大到小的顺序在第二组查询条目中记录查询结果的个数小于等于预定阈值的查询条目。
进一步,对于属于热门词的查询条目之间的记录和显示方案,则可以按照该查询条目与标题的匹配相关度来进行,具体其包括以下步骤:服务器计算线上查询结果的个数大于预定阈值的查询条目中的每一个查询条目与标题的相关度;按照相关度从大到小的顺序在第一组查询条目中记录查询结果的个数大于预定阈值的查询条目。
S3:服务器将第一组查询条目和第二组查询条目作为关键词发送给客户端。
通过上述的显示和记录方案,可以按照价值的高低来向卖方用户推荐反映了买方查询倾向性的关键词,从而提高了卖方用户选择的效率。
在上述各个实施例的基础上,为了实现对历史记录中的查询条目的动态更新,服务器还可以对历史记录的查询条目进行动态更新,具体过程包括:在服务器向存储器查询与主题信息相关的查询条目之前,服务器对存储器中存储的历史记录的查询条目进行更新。在本优选的实施例中,服务器通过对历史记录的查询条目进行动态更新,可以解决生成的关键词数量有限且同质化严重的问题,能够实时地将反应了买方用户查询的倾向性的关键词推荐给卖方用户。
以下结合附图以及上述的电子商务中的产品信息发布***和方法来详细描述具体的示例。
如图6所示,在发布产品信息时,卖方用户在产品发布端的服务器上选择类目、填写标题和关键词以及其他信息,然后被存储在数据仓库中(也可以理解为保存在数据库中);然后,会被Build(建)索引机器加入索引。因此,当买方用户在搜索引擎中输入该关键词时能够检索到相应的产品。从以上的描述可知,卖方用户在产品发布端填写的关键词是其产品能否被索引的一个重要因素。但现实情况是卖家通常并不了解买家的搜索习惯和搜索关注点等信息,因此在填写产品的关键词时往往不能精确匹配到用户的搜索查询词。
对此,本申请提供了一种如图7所示的产品信息发布方法,其通过机器学习和数据挖掘技术,在卖方用户发布产品信息时将反映买家搜索习惯和搜索热点的关键词推荐给卖方用户,以便提供卖方用户所发布的产品信息能够与目前买家的搜索习惯和搜索热点相对应,从而提高此产品在电子网站上的曝光率,相应也可以从总体上降低零少结果查询词的比例,改善查询用户在电子商务网站的搜索体验。
参见图7,***分为后台数据挖掘模块702与前台关键词自动推荐模块704。后台数据挖掘模块702主要是在各个类目下通过产品(offer)建立查询词(query)之间的关联关系,例如,可以按照产品(offer)的点击量和曝光率来建立查询词(query)之间的关联关系,其中,两个query都与同一个offer有关联,则认为这两个query具有一定的关联关系。然后通过迭代计算候选query与query之间的关联度,可以挖掘出query与query的同义关系,并进一步从query同义词中挖掘出组合同义词和完整同义词。此外,***还包括后台查询日志(querylog)处理模块,其主要是对query进行数据清洗(包括规范化书写、禁用词过滤、无效词过滤、拼写纠错过滤、关键词长度过滤)、cat_compute(类目计算)、update_data(数据日更新)、merge_data(数据合并)、buildindex(建倒排索引)。
前台关键词自动推荐模块704的处理流程包括:
S1:对该模块输入的产品标题信息(title)和其所属类目进行中心信息抽取。具体的,首先对title进行一系列的信息加工处理,包括:标题的词项(token)化处理(将title分割成各个独立的英语关键词),获取各个token及词性;简单的句法分析提取title的NP(Noun Phrase,名词短语)。然后运用统计和机器学习等技术提取title的中心NP(经过扩展)和中心词等信息。
S2:根据后台数据挖掘模块702输出地同义词信息,对标题中的同义词进行扫描和定位。
S3:对各个关键词进行打分。具体的,抽取各个NP,并且对各个关键词进行打分。
S4-S5:按步骤S3中的分数进行丢词、组合及检索,得到候选推荐词集合。具体的,按照各个NP中关键词得分排序,按照分数依次丢词,并且查询倒排索引。这里,按照分数依次丢词指的是:令N=N-1,即,选取得分在前N-1位的关键词作为与所发布的产品的标题对应的候选关键词。N的初始值可以预先设定,例如,10~50。
S6:按照类目对检索结果进行过滤。具体地,判断上述与所发布的产品的标题对应的候选关键词中的每一个是否属于所发布的产品的类目。
S7:若满足类目的候选关键词的个数满足最大查找个数,则转至S8,否则转至S4。
S8-S9:同义词替换及检索,得到候选推荐词集合。也就是,对上述步骤S5确定的候选关键词的同义词进行检索和推荐,具体方法可以包括:对该关键词当前的同义词进行替换,然后对替换后的同义词进行检索,并对检索得到的同义词进行排序,选择排名靠前的若干同义词作为候选推荐词集合。其中,采用的排序方法可以包括:
1)对于标题中包含且靠近核心词的完整同义词,直接用同义词检索倒排索引;
2)对于标题中包含且靠近核心词的组合同义词,用该同义词与其它核心单词组合,然后检索倒排索引。
S10:按照类目对检索结果进行过滤。具体地,判断上述与所发布的产品的标题对应的候选关键词中的每一个是否属于所发布的产品的类目。
S11:若满足类目的候选关键词的个数满足最大查找个数,则转至S12,否则转至S8。
S12:划分蓝海词及热门词。由于推荐的关键词有两类用途,一类是热门词,一类是蓝海词,两类划分的标准是结果数是否大于预定阈值(例如,100)。其中,蓝海词<热门词。
S13-S14:相似度排序,并向卖方用户推荐排序后的关键词。其中,可以按照以下方式来对关键词进行排序:
1)先排列蓝海词,后排列热门词。这是因为蓝海词的价值要大于热门词。
2)在蓝海词之间,或者,在热门词之间按照关键词的得分和搜索次数来进行排序,具体的
i)首先,按照score大小排序;
ii)然后,若score相同差距在0.01范围内,则按搜索次数排序。
以下描述关键词的得分的计算方法:计算title与关键词(query)的匹配相关性,并归一化匹配相关性、类目相关性、竞争度,得到该关键词的得分(score),其中,
1)匹配相关性计算(match_relevance):
将标题(title)和查询词(query)分别看做两个向量X、Y,标题和查询词中所有的不重复的单词作为向量的一维,设X=[x1,x2,...xn],Y=[y1,y2,...yn],其中x1~xn,y1~yn表示两个向量中各个单词的得分(如果某一单词没有在查询词或标题中出现,则该维分数为0)。
Figure BDA0000080927940000131
同时需要过滤完全被标题包含的查询词,因为这种查询词对于提高检索召回率没有帮助。
2)类目相关性(cate_relevance):
线下调用类目计算工具,对查询词计算它属于某些类目的概率;
线上假设卖家发布产品时选定的类目为类目i,则查询词的类目相关性即为该查询词属于类目i的概率。
3)归一化相关性分数(relevance)
relevance=(match_relevance*文本匹配相关性权重+cate_relevance*类目匹配相关性权重)/(文本匹配相关性权重+类目匹配相关性权重)。
4)竞争度分数(competition)
竞争度需要考虑搜索次数(search_cnt)及搜索结果数(result_num),但是搜索结果数通常比较大,因此需要对结果数按照一页可展示的结果数(page_num),转换成结果的页数,并且对结果的页数大于20页的不再区别,即结果数最大值为20;对结果的页数乘以一定的惩罚值(page_penalty),计算result_rank。竞争度分数与搜索次数成正比,与搜索结果的页数成反比。
计算公式如下:
result_rank=(result_num/page_num)×page_penalty+1.0
competition=log10(search_cnt/result_rank)/4.0+0.3
5)归一化总得分(score)
score=(relevance*相关性分数权重+competition*竞争度分数权重)/(相关性分数权重+竞争度分数权重)。
通过以上实施例描述的产品信息发布***和方法可以,用户的查询日志和点击日志很大程度上体现了用户的查询意图,通过机器学习和信息处理等相关领域技术可以建立起offer至查询词之间的一个映射模型,为offer发布端提供关键词推荐提供了技术支持。
本申请具有较高的商业价值,目前在电子商务搜索领域中,搜索结果为零少的查询词比重比较大,严重影响了查询用户的网站体验。造成搜索结果零少的原因主要有:用户输入反映其搜索意图的查询词不够精准;卖家在发布商品信息的时候没有填写丰富的信息,特别是用户关注的信息点,例如属性,型号等;卖家没有发布用户所需要的商品。之前的研究主要侧重于前一种情况,主要技术包括查询改写、查询扩展等。而本申请侧重于解决后一种情况,主要思想是:在商品发布端推荐用户关注度高并属于零/少搜索结果的关键词,并引导卖家填写推荐的关键词,从而最终达到提高查询词总体召回率的目的。
在本优选的实施例中,根据用户的查询日志、点击关系动态挖掘推荐词,且推荐词的排序有效体现了用户输入查询词的倾向性;通过分析关键词和卖家填写offer的title及类目,计算关键词与offer的相关性,同时定时更新推荐集合,增强了推荐词精确性和时效性;此外,生成关键词多样化,提升电子商品关键词在用户查询词里的覆盖率。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (17)

1.一种网站中的信息发布方法,其特征在于,包括:
信息发布端的服务器通过客户端接收用户输入的待发布信息的主题信息;
所述服务器向存储器查询与所述主题信息相关的查询条目,其中,所述存储器存储有历史记录的查询条目;
所述服务器将所查询到的查询条目作为所述待发布信息的关键词发送给所述客户端;
所述服务器通过所述客户端接收对所述关键词进行选择得到的发布信息。
2.根据权利要求1所述的方法,其特征在于,所述主题信息包括:所述待发布信息的标题以及类别。
3.根据权利要求2所述的方法,其特征在于,所述服务器通过以下查询步骤向存储器查询与所述主题信息相关的查询条目:
所述服务器将所述标题分割成M个独立的关键词,并从所述M个关键词中选取N个关键词,其中,M和N均为自然数,且M≥N;
所述服务器从所述存储器中查询是否存在包括所述N个关键词的查询条目;
若存在,则所述服务器判断所查询到的查询条目中属于所述类别的查询条目的个数是否大于等于P个,若大于等于,则将属于所述类别的前P个所查询到的查询条目作为与所述主题信息相关的查询条目,其中,P为预先设定的自然数。
4.根据权利要求3所述的方法,其特征在于,若所述服务器判断所查询到的查询条目中属于所述类别的查询条目的个数小于P个,则所述服务器向存储器查询与所述主题信息相关的查询条目的步骤还包括:
重复执行以下步骤,直到所查询到的查询条目中属于所述类别的查询条目的个数大于等于P个:所述服务器令N=N-1,并在所述存储器中执行所述查询步骤。
5.根据权利要求2所述的方法,其特征在于,所述服务器通过以下查询步骤向存储器查询与所述主题信息相关的查询条目:
所述服务器从所述存储器中选择出属于所述类别的查询条目;
所述服务器将所述标题分割成M个独立的关键词,并从所述M个关键词中选取N个关键词,其中,M和N均为自然数,且M≥N;
所述服务器在选择出来的属于所述类别的查询条目中查找是否存在Q个以上包括所述N个关键词的查询条目,其中,Q为预先设定的自然数;
若存在,则将属于所述类别的前Q个所查询到的查询条目作为与所述主题信息相关的查询条目。
6.根据权利要求5所述的方法,其特征在于,若所述服务器判断出属于所述类别的所查询到的查询条目的个数小于Q个,则所述服务器向存储器查询与所述主题信息相关的查询条目的步骤还包括:
重复执行以下步骤,直到属于所述类别的所查询到的查询条目的个数大于等于Q个:所述服务器令N=N-1,并在所述存储器中执行所述查询步骤。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述服务器将所查询到的查询条目作为所述关键词发送给所述客户端的步骤包括:
所述服务器判断所述查询到的查询条目中的每一个查询条目的线上查询结果的个数是否大于预定阈值;
所述服务器将线上查询结果的个数大于所述预定阈值的查询条目记录为第一组查询条目,并将线上查询结果的个数小于等于所述预定阈值的查询条目记录为第二组查询条目;
所述服务器将所述第一组查询条目和所述第二组查询条目作为所述关键词发送给所述客户端。
8.根据权利要求7所述的方法,其特征在于,
所述服务器将线上查询结果的个数大于所述预定阈值的查询条目记录为第一组查询条目的步骤包括:
计算所述线上查询结果的个数大于所述预定阈值的查询条目中的每一个查询条目与所述标题的相关度;
按照相关度从大到小的顺序在所述第一组查询条目中记录所述查询结果的个数大于所述预定阈值的查询条目;
所述服务器将线上查询结果的个数小于等于所述预定阈值的查询条目记录为第二组查询条目的步骤包括:
计算所述线上查询结果的个数小于等于所述预定阈值的查询条目中的每一个查询条目与所述标题的相关度;
按照相关度从大到小的顺序在所述第二组查询条目中记录所述查询结果的个数小于等于所述预定阈值的查询条目。
9.根据权利要求1至6中任一项所述的方法,其特征在于,在所述服务器向存储器查询与所述主题信息相关的查询条目之前,还包括:
所述服务器对所述存储器中存储的历史记录的查询条目进行更新。
10.一种网站中的信息发布***,其特征在于,包括:信息发布端的服务器和客户端,其中,
所述客户端用于向所述服务器发送用户输入的待发布信息的主题信息,其中,所述主题信息包括所述待发布信息的标题以及类别;
所述信息发布端的服务器用于接收所述客户端发送的所述主题信息;向存储器查询与所述主题信息相关的查询条目,其中,所述存储器存储有历史记录的查询条目;将所查询到的查询条目作为所述待发布信息的关键词发送给所述客户端,并通过所述客户端接收对所述关键词进行选择得到的发布信息。
11.根据权利要求10所述的***,其特征在于,所述服务器包括:
第一标题处理单元,用于在向存储器查询与所述主题信息相关的查询条目时,将所述标题分割成M个独立的关键词,并从所述M个关键词中选取N个关键词,其中,M和N均为自然数,且M≥N;
第一查询单元,用于从所述存储器中查询是否存在包括所述N个关键词的查询条目;
第一判断单元,用于在存在所述包括所述N个关键词的查询条目时,判断所查询到的查询条目中属于所述类别的查询条目的个数是否大于等于P个,若大于,则将属于所述类别的前P个所查询到的查询条目作为与所述主题信息相关的查询条目,其中,P为预先设定的自然数。
12.根据权利要求11所述的***,其特征在于,所述服务器还用于在所述第一判断单元判断出所查询到的查询条目中属于所述类别的查询条目的个数小于P个时,重复执行以下步骤,直到所查询到的查询条目中属于所述类别的查询条目的个数大于等于P个:所述服务器令N=N-1;通知所述第一标题处理单元从所述M个关键词中选取N个关键词;通知所述第一查询单元从所述存储器中查询是否存在包括所述N个关键词的查询条目;以及通知所述第一判断单元在存在所述包括所述N个关键词的查询条目时判断所查询到的查询条目中属于所述类别的查询条目的个数是否大于等于P个,若大于等于,则将属于所述类别的前P个所查询到的查询条目作为与所述主题信息相关的查询条目。
13.根据权利要求10所述的***,其特征在于,所述服务器包括:
选择单元,用于从所述存储器中选择出属于所述类别的查询条目;
第二标题处理单元,用于将所述标题分割成M个独立的关键词,并从所述M个关键词中选取N个关键词,其中,M和N均为自然数,且M≥N;
第二查询单元,用于在选择出来的属于所述类别的查询条目中查找是否存在Q个以上包括所述N个关键词的查询条目,其中,Q为预先设定的自然数;若存在,则将属于所述类别的前Q个所查询到的查询条目作为与所述主题信息相关的查询条目。
14.根据权利要求13所述的***,其特征在于,所述服务器还用于在所述第二查询单元查找出的属于所述类别的所查询到的查询条目的个数小于Q个时,重复执行以下步骤,直到属于所述类别的所查询到的查询条目的个数大于等于Q个:所述服务器令N=N-1;通知所述第二标题处理单元从所述M个关键词中选取N个关键词;以及通知所述第二查询单元在选择出来的属于所述类别的查询条目中查找是否存在Q个以上包括所述N个关键词的查询条目,若存在,则将属于所述类别的前Q个所查询到的查询条目作为与所述主题信息相关的查询条目。
15.根据权利要求10至14中任一项所述的***,其特征在于,所述服务器包括:
第二判断单元,用于在所述服务器将所查询到的查询条目作为所述待发布信息的关键词发送给所述客户端时,判断所述查询到的查询条目中的每一个查询条目的线上查询结果的个数是否大于预定阈值;
记录单元,用于将线上查询结果的个数大于所述预定阈值的查询条目记录为第一组查询条目,并将线上查询结果的个数小于等于所述预定阈值的查询条目记录为第二组查询条目;
发送单元,用于将所述第一组查询条目和所述第二组查询条目作为所述关键词发送给所述客户端。
16.根据权利要求15所述的***,其特征在于,所述记录单元包括:
第一记录单元,用于通过以下步骤记录所述查询结果的个数大于所述预定阈值的查询条目:计算所述线上查询结果的个数大于所述预定阈值的查询条目中的每一个查询条目与所述标题的相关度;按照相关度从大到小的顺序在所述第一组查询条目中记录所述查询结果的个数大于所述预定阈值的查询条目;
第二记录单元,用于通过以下步骤记录所述查询结果的个数小于等于所述预定阈值的查询条目:计算所述线上查询结果的个数小于等于所述预定阈值的查询条目中的每一个查询条目与所述标题的相关度;按照相关度从大到小的顺序在所述第二组查询条目中记录所述查询结果的个数小于等于所述预定阈值的查询条目。
17.根据权利要求10至14中任一项所述的***,其特征在于,所述服务器包括:
更新单元,用于在所述服务器向存储器查询与所述主题信息相关的查询条目之前,对所述存储器中存储的历史记录的查询条目进行更新。
CN201110221386.5A 2011-08-03 2011-08-03 网站中的信息发布方法和*** Active CN102915312B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201110221386.5A CN102915312B (zh) 2011-08-03 2011-08-03 网站中的信息发布方法和***
HK13103670.6A HK1176431A1 (zh) 2011-08-03 2013-03-25 網站中的信息發布方法和系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110221386.5A CN102915312B (zh) 2011-08-03 2011-08-03 网站中的信息发布方法和***

Publications (2)

Publication Number Publication Date
CN102915312A true CN102915312A (zh) 2013-02-06
CN102915312B CN102915312B (zh) 2016-08-24

Family

ID=47613683

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110221386.5A Active CN102915312B (zh) 2011-08-03 2011-08-03 网站中的信息发布方法和***

Country Status (2)

Country Link
CN (1) CN102915312B (zh)
HK (1) HK1176431A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021562A (zh) * 2016-05-31 2016-10-12 北京京拍档科技有限公司 用于电商平台的基于主题相关的推荐方法
CN109074366A (zh) * 2017-02-01 2018-12-21 谷歌有限责任公司 用于计算机网络路由基础架构的增益调整组件
CN110377701A (zh) * 2019-07-02 2019-10-25 北京奇艺世纪科技有限公司 一种热词处理方法、装置、电子设备及存储介质
CN111523030A (zh) * 2020-04-22 2020-08-11 贝壳技术有限公司 报盘信息推荐方法、装置及计算机可读存储介质
CN111859078A (zh) * 2019-04-29 2020-10-30 百度在线网络技术(北京)有限公司 一种信息识别方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101277208A (zh) * 2007-03-26 2008-10-01 韦震宇 一种在电子公告牌中发布信息的方法和***
CN101860801A (zh) * 2010-05-28 2010-10-13 杭州王道电子商务有限公司 一种信息聚合、推送方法及其***
US7882175B1 (en) * 2004-12-20 2011-02-01 AudienceScience, Inc. Selecting an advertising message for presentation on a page of a publisher web site based upon both user history and page context
CN102012915A (zh) * 2010-11-22 2011-04-13 百度在线网络技术(北京)有限公司 一种文档共享平台的关键词推荐方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7882175B1 (en) * 2004-12-20 2011-02-01 AudienceScience, Inc. Selecting an advertising message for presentation on a page of a publisher web site based upon both user history and page context
CN101277208A (zh) * 2007-03-26 2008-10-01 韦震宇 一种在电子公告牌中发布信息的方法和***
CN101860801A (zh) * 2010-05-28 2010-10-13 杭州王道电子商务有限公司 一种信息聚合、推送方法及其***
CN102012915A (zh) * 2010-11-22 2011-04-13 百度在线网络技术(北京)有限公司 一种文档共享平台的关键词推荐方法及***

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021562A (zh) * 2016-05-31 2016-10-12 北京京拍档科技有限公司 用于电商平台的基于主题相关的推荐方法
CN106021562B (zh) * 2016-05-31 2019-05-24 北京京拍档科技有限公司 用于电商平台的基于主题相关的推荐方法
CN109074366A (zh) * 2017-02-01 2018-12-21 谷歌有限责任公司 用于计算机网络路由基础架构的增益调整组件
CN109074366B (zh) * 2017-02-01 2021-05-18 谷歌有限责任公司 用于计算机网络路由基础架构的增益调整组件
CN111859078A (zh) * 2019-04-29 2020-10-30 百度在线网络技术(北京)有限公司 一种信息识别方法、装置及电子设备
CN111859078B (zh) * 2019-04-29 2024-04-12 百度在线网络技术(北京)有限公司 一种信息识别方法、装置及电子设备
CN110377701A (zh) * 2019-07-02 2019-10-25 北京奇艺世纪科技有限公司 一种热词处理方法、装置、电子设备及存储介质
CN111523030A (zh) * 2020-04-22 2020-08-11 贝壳技术有限公司 报盘信息推荐方法、装置及计算机可读存储介质
CN111523030B (zh) * 2020-04-22 2023-10-13 贝壳技术有限公司 报盘信息推荐方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN102915312B (zh) 2016-08-24
HK1176431A1 (zh) 2013-07-26

Similar Documents

Publication Publication Date Title
CN101567011B (zh) 文档处理装置、文档处理方法以及检索***
CN102725759B (zh) 用于搜索结果的语义目录
CN102622450B (zh) 用户的浏览器历史的相关性排序
CN102419768B (zh) 用于文档搜索的搜索高速缓存
US20190349320A1 (en) System and method for automatically responding to user requests
CN102902753B (zh) 用于补全搜索词及建立个体兴趣模型的方法及装置
CN103425687A (zh) 一种基于关键词的检索方法和***
US20130013616A1 (en) Systems and Methods for Natural Language Searching of Structured Data
CN110390052B (zh) 搜索推荐方法、ctr预估模型的训练方法、装置及设备
CN102138142A (zh) 对部分用户输入的词典建议
CN102930054A (zh) 数据搜索方法及***
CN103678576A (zh) 基于动态语义分析的全文检索***
CN103377232A (zh) 标题关键词推荐方法及***
CN103309886A (zh) 一种基于交易平台的结构化信息搜索方法和装置
CN102722498A (zh) 搜索引擎及其实现方法
CN103699700A (zh) 一种搜索引导的生成方法、***及相关服务器
CN104331449A (zh) 查询语句与网页相似度的确定方法、装置、终端及服务器
CN102385585A (zh) 网页数据库的建立方法、网页搜索方法以及相关装置
CN102722501A (zh) 搜索引擎及其实现方法
CN101661490B (zh) 搜索引擎、其客户端及搜索网页的方法
CN109885651B (zh) 一种问题推送方法和装置
CN102915312A (zh) 网站中的信息发布方法和***
CN105468790A (zh) 一种评论信息检索方法和装置
CN104050243A (zh) 一种将搜索与社交相结合的网络搜索方法及其***
CN112507230A (zh) 基于浏览器的网页推荐方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1176431

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1176431

Country of ref document: HK