CN102591876A - 搜索结果排序方法及装置 - Google Patents

搜索结果排序方法及装置 Download PDF

Info

Publication number
CN102591876A
CN102591876A CN2011100078479A CN201110007847A CN102591876A CN 102591876 A CN102591876 A CN 102591876A CN 2011100078479 A CN2011100078479 A CN 2011100078479A CN 201110007847 A CN201110007847 A CN 201110007847A CN 102591876 A CN102591876 A CN 102591876A
Authority
CN
China
Prior art keywords
classification
query word
highest
merchandise news
desirability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011100078479A
Other languages
English (en)
Inventor
陈超
韩小梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN2011100078479A priority Critical patent/CN102591876A/zh
Priority to TW100116689A priority patent/TWI518529B/zh
Priority to US13/348,446 priority patent/US20120185359A1/en
Priority to JP2013549536A priority patent/JP5639285B2/ja
Priority to EP12734339.0A priority patent/EP2663917A4/en
Priority to PCT/US2012/021035 priority patent/WO2012097124A1/en
Publication of CN102591876A publication Critical patent/CN102591876A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • G06Q30/0627Directed, with specific intent or strategy using item specifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请提供一种搜索结果排序方法及装置,其中方法包括:获取查询词和用户信息;搜索到与所述查询词对应的商品信息,并根据所获取的用户信息、查询词与需求程度最高的类目之间的对应关系,获取所述用户信息和查询词对应的需求程度最高的类目;以及根据所述需求程度最高的类目对所述商品信息排序。本申请提供的方法及装置,能够提高网上交易***的流量质量,提高点击率。并且,由于搜索结果的排序可以体现用户的个性化需求,从而可以避免用户通过客户端向服务器发送大量无用的查询请求,从而减轻服务器的工作压力,提高服务器的响应速度。

Description

搜索结果排序方法及装置
技术领域
本申请涉及数据处理技术,尤其涉及一种搜索结果排序方法及装置。
背景技术
现有技术中提供一种用于网上交易***中的排序方法,基于文本相关性和市场机制,即通过信息的文本相关性以及商业因素来影响排序。例如可以通过信息质量、供应商因素等影响排序。
这种方法的核心是根据查询结果的文本相关性和商业因素来排序,它的缺点是:对于同一个查询词,所有用户得到相同的结果,排序结果不能很好满足买家需求。因为这种排序方法产生的排序结果主要考虑文本相关性和其他商业因素,而不区分每条信息对于单个用户的需求满足情况,其中一些用户的个性化需求无法得到满足,买家体验较差。
这种方法产生的排序结果导致查询结果点击率偏低。查询结果点击率等于总点击量除以总曝光量,当买家的需求类型和商品信息不匹配的时候,点击率会降低,从而使得网上交易***的流量质量不高、点击率偏低。
此外这种方法对商品信息不加以区分,导致服务器每次响应某个用户通过客户端发送的查询请求展现商品信息时,会不加区分地将所有商品信息混杂在一起传输至客户端,导致网络中的数据传输量大,响应速度慢。并且,当该用户点击商品信息时,由于与该用户匹配程度高的商品信息和与该用户匹配程度不高的商品信息混杂在一起,导致该用户会点击大量与自己的需求不匹配的商品信息,从而使得用户客户端向服务器发送大量无用的查询请求,增加了服务器的工作压力,进一步影响了服务器的响应速度。
而且,这种方法也不利于市场资源的有效配置。因为,采用这种方法,当买家的需求类型与商品信息不匹配的时候,点击率降低,这让一部分具有高需求程度的卖家失去了展示信息的机会,不利于市场效率的提升。
发明内容
本申请提供一种商品信息排序方法及装置,以解决现有技术中流量质量不高、点击率偏低以及由于对商品信息不加区分地发送给客户端导致的服务器工作压力大的问题。
本申请提供了一种商品信息排序方法,包括:
获取查询词和用户信息;
搜索到与所述查询词对应的商品信息,并根据所获取的用户信息、查询词与需求程度最高的类目之间的对应关系,获取所述用户信息和查询词对应的需求程度最高的类目;以及
根据所述需求程度最高的类目对所述商品信息排序。
本申请还提供了一种搜索结果排序装置,包括:
获取模块,用于获取查询词和用户信息;
处理模块,用于搜索到与所述查询词对应的商品信息,并根据所获取的用户信息、查询词与需求程度最高的类目之间的对应关系,获取所述用户信息和查询词对应的需求程度最高的类目;
排序模块,用于根据所述需求程度最高的类目对所述商品信息排序。
本申请提供的搜索结果排序方法及装置,根据所获取的需求程度最高的类目对商品信息排序,该需求程度最高的类目与用户信息相对应,这样,商品信息的排序可以体现用户的个性化需求,与该需求程度最高的类目相对应的商品信息可以排序靠前,使得用户可以迅速找到满足其需求的商品信息,能够提高网上交易***的流量质量,提高点击率。并且,由于搜索结果的排序可以体现用户的个性化需求,从而可以避免用户通过客户端向服务器发送大量无用的查询请求,从而减轻服务器的工作压力,提高服务器的响应速度。
通过以下参照附图对优选实施例的说明,本申请的上述以及其它目的、特征和优点将更加明显。
附图说明
图1示例性示出本申请涉及到的一个网上交易处理***的结构示意图;
图2示例性示出本申请搜索结果排序方法实施例一的流程图;
图3示例性示出本申请商品信息排序方法实施例二的流程图;
图4示例性示出本申请搜索结果排序方法实施例三的流程图;
图5示例性示出本申请搜索结果排序装置实施例一的结构示意图;
图6示例性示出图5中第一预处理模块14的结构示意图;
图7示例性示出本申请搜索结果排序装置实施例二的结构示意图;
图8示例性示出图7中第二预处理模块的结构示意图;
图9示例性示出本申请搜索结果排序装置实施例三的结构示意图。
具体实施方式
下面将详细描述本申请的实施例。应当注意,这里描述的实施例只用于举例说明,并不用于限制本申请。
本申请首先提出一种需求程度最高的类目的获取方案,即,基于用户信息对应的日志,获取用户信息和查询词对应的需求程度最高的类目,从而获取用户信息、查询词和需求程度最高的类目之间的对应关系。
使用本申请的需求程度最高的类目的获取方案所获取的用户信息、查询词和需求程度最高的类目之间的对应关系,当某个用户使用某个查询词搜索时,可以获取与这个用户相对应的需求程度最高的类目,根据该需求程度最高的类目对商品信息排序,与该需求程度最高的类目相对应的商品信息可以排序靠前,从而提高网上交易***的流量质量,提高点击率。
并且,由于商品信息可以体现用户的个性化需求,从而可以避免用户通过客户端向服务器发送大量无用的查询请求,从而减轻服务器的工作压力,提高服务器的响应速度。
本申请还提出一种搜索结果排序方法,其在响应用户的查询请求时,使用上述与用户信息对应的需求程度最高的类目对商品信息进行排序。
图1示例性示出本申请涉及到的一个网上交易处理***的结构示意图,该***包括客户端1和网上交易***2,客户端1的数量可以是多个,各个客户端1均可以与网上交易***2进行数据交互。网上交易***2用于提供商品信息处理,卖家可以通过客户端1在网上交易***2上展示商品,买家可以通过客户端1从网上交易***2上购买商品。
图2示例性示出本申请搜索结果排序方法实施例一的流程图,包括:
步骤101、获取查询词和用户信息。该查询词可以由用户输入,用户信息可以由网上交易***根据用户的登录信息获得。
步骤102、搜索到与查询词对应的商品信息,并根据所获取的用户信息、查询词与需求程度最高的类目之间的对应关系,获取用户信息和查询词对应的需求程度最高的类目。
步骤103、根据需求程度最高的类目对商品信息排序。
在本申请的实施例中,搜索结果可以包括多条商品信息。
本申请提供的搜索结果排序方法,根据所获取的需求程度最高的类目对商品信息排序,该需求程度最高的类目与用户信息相对应,这样,商品信息可以体现用户的个性化需求,与该需求程度最高的类目相对应的商品信息可以排序靠前,使得用户可以迅速找到满足其需求的商品信息,能够提高网上交易***的流量质量,提高点击率,提升用户体验。并且,由于商品信息可以体现用户的个性化需求,从而可以避免用户通过客户端向服务器发送大量无用的查询请求,从而减轻服务器的工作压力,提高服务器的响应速度。
而且,这种排序方法有利于市场资源的有效配置,能够让具有高需求程度的卖家具有较多的展示信息的机会,提升了点击率。
上述步骤101-103可以由网上交易***执行。
在步骤101之前还可以包括:获取用户信息、查询词与需求程度最高的类目之间的对应关系。具体地,可以根据与用户信息对应的日志,获取用户信息、查询词与需求程度最高的类目之间的对应关系。类目用于描述商品信息的分类。每个商品信息都有唯一的分类与之对应。比如:关于手机的商品信息放在手机类目下。
网上交易***获取用户信息、查询词与需求程度最高的类目之间的对应关系的步骤可以预先执行,即可以在线下进行,而无需在线上进行,即无需在商品交易时进行。这样,网上交易***在获取查询词和用户信息以后,可以直接搜索与该用户信息和查询词对应的需求程度最高的类目,根据需求程度最高的类目对商品信息排序,这样就无需在商品交易过程中针对某个用户执行获取需求程度最高的类目的步骤,可以提高商品交易过程中数据处理速度,提升用户体验。
根据本申请的一个实施例,用户信息可以包括用户ID、用户的邮箱等信息。
本申请提供的技术方案中,获取用户信息、查询词与需求程度最高的类目之间的对应关系的步骤,可以包括:
步骤100a、提取用户信息对应的日志。日志可以包括点击日志和曝光日志。从日志中可以提取的数据包括:用户搜索过的查询词、类目曝光量、类目点击次数、信息点击次数以及类目下的信息曝光量等。
步骤100b、根据用户信息对应的日志,获取查询词对应的满足第一预设条件的类目,例如具体可以获取类目曝光量大于预设曝光量阈值(例如5%)并且点击率大于预设点击率阈值(例如查询词平均点击率的50%)的类目。通过数据分析发现,类目曝光量和点击率很大程度上决定了类目与查询词的相关性,通过类目曝光量和点击率这两个特征可以获取与查询词相关的类目。本实施例通过设置第一预设条件,可以排除和查询词明显不相关的类目。
步骤100c、根据满足第一预设条件的类目中,类目曝光量最大的类目的类目曝光量确定查询词是单需求查询词还是泛需求查询词。
一个泛需求查询词对应多种需求类型,本实施例中使用类目来描述需求类型,每一种需求类型对应一种类目,即每一个泛需求查询词对应多个类目。比如:苹果的需求类型可能为水果、电子产品或服装,即用户输入查询词“苹果”时,其查询目的可能是查询水果,也可能是查询苹果牌电子产品或服装,也就是说苹果这个词是泛需求查询词。而单需求查询词只对应一种需求类型,即每一个单需求查询词对应一个类目。
单需求查询词对应的满足第一预设条件的各个类目中类目曝光量最大的类目大于第一阈值,泛需求查询词对应的满足第一预设条件的各个类目中类目曝光量最大的类目小于或等于第一阈值。
满足第一预设条件的类目可以是类目曝光量大于预设曝光量阈值(例如5%)并且点击率大于预设点击率阈值(例如查询词平均点击率的50%)的类目。
在步骤100c中,对于一个查询词,如果满足第一预设条件的各个类目中,类目曝光量最大的类目的类目曝光量大于第一阈值,则确定该查询词是单需求查询词;如果满足第一预设条件的各个类目中,类目曝光量最大的类目的类目曝光量小于或等于第一阈值,则确定该查询词是泛需求查询词。例如,第一阈值可以是查询词对应的所有类目(包括满足第一预设条件的类目和不满足第一预设条件的类目)的总曝光量的80%。对于单需求查询词,由于其只对应一个类目,当用户输入该单需求查询词进行查询时,获得的查询结果大部分对应相同的类目,因此,该类目的曝光量较大。而对于泛需求查询词,由于其对应多个类目,当用户输入该泛需求查询词进行查询时,获得的查询结果对应的类目有多个,该多个类目可能不会同时展现给用户,因此,泛需求查询词对应的类目曝光量可能较小。
根据本申请的一个实施例,对于单需求查询词,最大的类目曝光量大于第一阈值,可见对于不同用户而言,这类查询词对应的需求程度最大的类目都是一样,可以不用获取这类查询词对应的需求程度最大的类目。对于泛需求查询词,最大的类目曝光量小于或等于第一阈值,可见对于不同用户,这类查询词对应的需求程度最大的类目不同,所以需要获取这类查询词对应的需求程度最大的类目。
步骤100d、如果查询词是泛需求查询词,则确定满足第一预设条件的类目中需求程度最高的类目,并建立用户信息、查询词与该需求程度最高的类目之间的对应关系。
根据用户在查询词下行为频率的不同,可以将查询词分为有点击查询词和无点击查询词。用户搜索有点击查询词时,有类目点击或者信息点击动作。用户搜索无点击查询词时,没有类目点击或者信息点击动作。
在步骤100d中,对于有点击查询词和无点击查询词可以分别采用不同的方法获取用户信息、查询词与需求程度最高的类目之间的对应关系。
对于有点击查询词,可以从日志中获取满足第一预设条件的类目,获取各个满足第一预设条件的类目的信息点击次数和类目点击次数,根据选择出的类目的信息点击次数和类目点击次数,获取满足第一预设条件的各类目的需求值,确定需求值最高的类目,将需求值最高的类目作为需求程度最高的类目。其中,信息点击次数为与类目对应各条商品信息的点击次数。
根据本申请的一个实施例,类目需求值的计算公式可以如公式(1)所示:
类目需求值
=(2*类目点击次数+信息点击次数)/类目下信息曝光量     (1)
对于无点击查询词,可以从预先获取的与用户行业背景对应的类目列表中选择频次最高的类目,并判断频次最高的类目的点击率是否满足第二预设条件;如果频次最高的类目的点击率不满足第二预设条件,则选择频次次高的类目,判断频次次高的类目的点击率是否满足第二预设条件;以此类推,直至找到类目点击率满足第二预设条件的类目。
如果遍历选择出的各个类目依然无法找到点击率满足第二预设条件的类目,则可以确定用户对应的已知类目在该查询词下的点击率过低,不适合进行个性化处理,即,可以不获取该查询词对应的需求程度最高的类目。
根据本申请的一个实施例,第二预设条件可以是:点击率不小于第二阈值,例如,第二阈值可以是查询词所有类目平均点击率的50%、75%等。
根据本申请的一个实施例,在确定无点击查询词下的需求程度最高的类目时,可以预先获取与用户行业背景对应的类目列表,该类目列表可以包括按照频次从大到小排列的各个类目。可以包括:从日志中提取用户搜索过的查询词、查询词的搜索次数、信息点击次数和类目点击次数,并获取各个类目的频次,将各个类目按照频次从大到小排列。可以从查询词下满足第一预设条件的类目的数量、信息点击次数和类目点击次数这三个特征来统计各个类目的频次。如表一所示为本申请中类目频次统计的方法说明。
表一、本申请中类目频次统计的方法说明
Figure BDA0000043833890000071
下面通过一个例子来说明无点击查询词的需求程度最高的类目的确定方法。
例如,用户Z输入过一个查询词“苹果”,该查询词“苹果”是有点击查询词。在预先获取用户行业背景对应的类目列表时,可以获取到该查询词对应的类目包括:“手机”、“MP3”、“女装”和“水果”。假设“手机”不满足第一预设条件,则与查询词“苹果”对应的满足第一条件的类目的数量为3。在统计类目“MP3”的频次时,可以考虑查询词的搜索次数、信息点击次数和类目点击次数。如果查询词为“苹果”,该查询词的搜索次数为1000次,将类目“MP3”的频次加上(1/3)*1000。如果类目“MP3”下的信息被点击的次数为100,则将类目“MP3”的频次加上100。如果类目“MP3”被点击的次数为10,则将类目“MP3”的频次加上10。这样,经统计可以得到,类目“MP3”的频次为(1/3)*1000+1*100+1*10。依照类似的方法,可以统计出类目“女装”和“水果”的频次。
将类目“MP3”、“女装”和“水果”依照频次从大到小的顺序排列,即可以获取一个类目列表,假设这三个类目的排序是:“MP3”、“水果”、“女装”。
假设用户Z只搜索过查询词“苹果”,该用户Z的用户行业背景对应的类目列表中包括的类目是:“MP3”、“水果”、“女装”。用户Z后续输入查询词“苹果MP3”,如果该查询词是无点击查询词。则可以从预先获取的用户行业背景对应的类目列表中,选择第一个类目“MP3”,如果该类目“MP3”的点击率不小于查询词“苹果”的所有类目的平均点击率的75%,则可以确定类目“MP3”的需求程度最高。否则,继续选择频次次高的类目“水果”,判断类目“水果”的点击率是否不小于查询词“苹果”的所有类目的平均点击率的75%,如果类目“水果”的点击率不小于查询词“苹果”的所有类目的平均点击率的75%,则可以确定类目“水果”作为需求程度最高的类目。否则,继续选择类目“女装”,进行后续的判断。如果遍历类目列表,无法找到点击率不小于查询词“苹果”的所有类目的平均点击率的75%的类目,则可以不获取该查询词“苹果MP3””对应的需求程度最高的类目。
经过步骤100d之后就可以获取用户信息、查询词和需求程度最高的类目之间的对应关系。
根据前述步骤100a-100d获取的用户信息、查询词和需求程度最高的类目之间的对应关系可以预先存储,可以存储在数据库中。也可以定期更新,使得用户信息、查询词和需求程度最高的类目之间的对应关系能够反映用户最新的个性化需求。
前述的各实施例中,步骤103可以包括:将商品信息中属于需求程度最高的类目的商品信息,排序最靠前。
例如,根据步骤102中查询到的需求类型,可以确定需求程度最高的类目,例如,类目“水果”。然后,将商品信息中,属于类目“水果”的商品信息排序最靠前,这样,类目“水果”下的商品信息就可以优先展示给用户。
或者,在步骤103中,也可以根据所获取的需求程度最高的类目,设置步骤102中搜索到的各个商品信息对应的类目的档位,根据设置后的类目的档位获取各个商品信息对应的用户需求值,根据用户需求值对各个商品信息进行排序。具体实现方式如图3所示。
图3示例性示出本申请商品信息排序方法实施例二的流程图,包括:
步骤201、获取查询词和用户信息。
步骤202、搜索到与查询词对应的商品信息,并提取各商品信息的类目与属性。
属性用于描述商品信息的描述维度,每个商品信息都可以有若干商品信息的描述维度与之对应。比如:关于手机的商品信息,可包含品牌、制式、屏幕尺寸等描述维度。
步骤203、根据所获取的用户信息、查询词与需求程度最高的类目之间的对应关系,获取用户信息和查询词对应的需求程度最高的类目;根据所获取的商品信息的类目的分档信息与属性的分档信息,查找提取出的类目的档位与权重最高的属性的个数。
步骤204、根据需求程度最高的类目对商品信息排序。具体包括:
步骤204a、对于提取出的各个类目,如果是需求程度最高的类目,则将该类目的档位调整为权重最高的档位,如果不是需求程度最高的类目,则将该类目的档位调整为权重次高的档位。
步骤204b、根据调整后的类目的档位与查找出的权重最高的属性的个数获取各商品信息的用户需求值,根据所获取的用户需求值对商品信息排序。
步骤204b中,可以将调整后的类目的档位和查找出的权重最高的属性的个数与用户偏好权重相结合,计算各商品信息的用户需求值。
例如,用户需求值用如下公式(2)表示:
V=W*α/C1+W*β*N1/Nw    (2)
上述公式(2)中,V表示用户需求值,W表示用户偏好权重,C1表示类目的档位,N1表示权重最高的属性的个数,Nw表示属性的总数,α和β可以是预设值,可以取为小于1并且大于0的数,α和β的和可以等于1。例如,α的取值可以是0.8,β的取值可以是0.2。W以及α和β的取值可以根据实际情况确定,不限于上述公式中给出的各个数值。Nw是步骤202中提取出的属性的总数。
根据公式(2)可以获取各个商品信息的用户需求值,从而可以根据用户需求值对各个商品信息进行排序。
在本申请的一个实施例中,在步骤201之前还可以包括:根据网上交易***中的商品信息的类目与属性,获取类目的分档信息与属性的分档信息。
本申请的实施例中,获取类目的分档信息与属性的分档信息的步骤可以预先执行,即可以在线下进行,而无需在线上进行,即无需在商品交易时进行。这样,网上交易***在获取到查询词和用户信息以后,可以直接搜索与该用户信息和查询词对应的需求程度最高的类目,根据需求程度最高的类目对商品信息排序,这样就无需在商品交易过程中执行获取商品信息的类目的分档信息与属性的分档信息的步骤,可以提高商品交易过程中数据处理速度,提升用户体验。
获取类目的分档信息与属性的分档信息的步骤可以包括:
步骤301、提取网上交易***中的所有商品信息的类目与属性。
步骤302、根据网上交易***中的点击日志和曝光日志,计算查询词对应的商品信息的点击率。
步骤303、将商品信息的点击率作为商品信息的类目的点击率与属性的点击率,根据类目的点击率与属性的点击率,将类目与属性分档,获取类目的分档信息与属性的分档信息。在步骤302中已经计算出每个商品信息的点击率,由于每条商品信息可以表示为类目和属性集合的形式,在步骤303中,可以将商品信息的点击率作为类目的点击率与属性的点击率。例如,某条商品信息的类目是M,具有属性N1、N2……Nn,如果在某次搜索中用户点击了该商品信息,就认为该商品信息对应的类目M和属性N1、N2……Nn均获得到了点击,如果用户没点击该信息,就认为该商品信息对应类目和属性未获得点击。
在本申请的实施例中,上述步骤301与步骤302可以顺序执行,也可以由本领域普通技术人员根据实际情况决定,例如,可以同步执行,也可以先执行步骤302,后执行步骤301。
步骤302中的查询词可以是指网上交易***过去的一预设时段内接收的所有用户输入的查询词。该预设时间段可以根据实际情况确定,例如,可以是一周,也可以是几个月,等等。
根据一个实施例,步骤302还可以包括:根据所述网上交易***中的点击日志和曝光日志,识别并过滤不能体现用户需求的数据。其中,曝光日志记录有商品信息展示给用户的次数,点击日志记录有展示给用户的商品信息被点击的次数。比如:如果通过分析点击日志和曝光日志,发现某次搜索中,曝光的所有商品信息均被点击,则可以认为该次搜索行为不能反映出用户的需求,因此,将该次搜索行为设定为无效,点击日志和曝光日志中记录的与该次搜索行为相关的点击数据与曝光数据不用于计算查询词对应的商品信息的点击率。
步骤303中,根据类目的点击率与属性的点击率,将类目与属性分档,可以包括:根据类目的点击率和/或类目的流量,将类目分档;以及,根据属性的点击率和/或属性的流量,将属性分档。
经过步骤303后,就可以获取类目的分档信息和属性的分档信息。
类目的分档信息可以包括各个类目的档位以及各个档位对应的具体的类目,如表二所示,表二为本申请的实施例中类目的分档信息。
表二、本申请的实施例中类目的分档信息
  类目档位   各个档位对应的具体的类目
  1档   类目A1、类目A2、......
  2档   类目B1、类目B2、......
  3档   类目C1、类目C2、......
具体如何分档,可以参考表三。如表三为本申请中类目的档位的描述信息,该档位的描述信息用于描述满足该档位的标准是什么。
表三、本申请的实施例中类目的档位的描述信息
Figure BDA0000043833890000121
属性的分档信息可以包括各个属性的档位以及各个档位对应的具体的属性,如表四所示,表四为本申请的实施例中属性的分档信息。
表四、本申请的实施例中属性的分档信息
  属性档位   各个档位对应的具体的属性
  1档   属性D1、属性D2、......
  0档   属性E1、属性E2、......
具体如何分档,可以参考表五。如表五为本申请中属性的档位的描述信息,该档位的描述信息用于描述满足该档位的标准是什么。
表五、本申请的实施例中属性的档位的描述信息
表三中,高PV类目是指在一设定的时间内,该类目的流量大于第三阈值。第三阈值可以设置为查询词对应所有类目的流量总和的阈值的10%,也可以设置为固定的次数,例如100次、200次等。设定时间可以是2周,也可以是其他的时间段,可以根据数据处理的实际情况来确定。
低PV类目是指在一设定的时间内,该类目的流量低于一个预设第四阈值。该第四阈值可以设置为查询词对应所有类目的流量总和的1%,也可以设置为固定的次数,例如5次。
中PV类目是指在一设定的时间内,该类目的流量在第三阈值与第四阈值之间,即,既非高PV类目,也非低PV类目。
表一、表二、表三、表四和表五仅为本申请提供的示例性的表格,本领域普通技术人员应可以根据实际情况进行各种改型或替换。例如,类目的档位的描述信息中可以只采用查询词平均类目的点击率作为确定档位的标准,而不采用类目的流量作为确定档位的标准,或者也可以单独采用类目的流量作为确定档位的标准。又例如,在采用查询词平均类目的点击率作为确定类目的档位的标准时,还可以采用能实现与查询词平均类目的点击率同样功能的其他数据作为确定类目的档位的标准。又例如,在采用查询词平均类目点击率作为确定类目的档位的标准时,还可以采用其他数值,而不限于表三中示出的100%、75%、90%等等。属性的档位的描述信息中可以只采用查询词平均属性的点击率作为确定档位的标准,而不采用属性的流量作为确定档位的标准;也可以只采用属性的流量作为确定档位的标准,而不采用查询词平均属性的点击率作为确定档位的标准;或者也可以采用属性的流量和查询词平均属性的点击率作为确定档位的标准。
表二中,1档是权重最高的档位,2档是权重次之的档位,3档权重最小。表四中,1档是权重最高的档位,0档是权重次之的档位,当然本申请实施例只是示例性的说明,在具体应用中所划分的档位可以根据实际情况做调整。如果预先获取的类目的分档信息和属性的分档信息包括更多个档位,可以根据实际情况设置各个档位的权重。
需要说明的是,前述步骤301-303中,是针对网上交易***中的所有用户而言的,获取的点击日志、曝光日志、类目点击率、属性点击率、类目的分档信息以及属性的分档信息,体现大众的需求。而不体现单个用户的需求。前述步骤100a-100d是针对单个用户而言,获取的用户信息、查询词与需求程度最高的类目之间的对应关系,体现单个用户的需求类型。
下面通过一个具体的例子来说明如何根据所获取的需求程度最高的类目对各个商品信息进行排序。
例如一个用户,他的用户ID是I3,输入的查询词是“苹果”。网上交易***接收用户输入的“I3”和查询词“苹果”,搜索与查询词“苹果”对应的商品信息,并提取商品信息的类目与属性。例如,提取出的类目包括:“水果”、“女装”和“MP3”。
网上交易***根据预先获取的用户信息、查询词和需求程度最高的类目,获取与ID3和查询词“苹果”对应的需求程度最高的类目,例如,对于该用户而言,需求程度最高的类目是“水果”。
并且,网上交易***根据预先获取的商品信息的类目的分档信息与属性的分档信息,可以查找“水果”、“女装”和“MP3”这三个类目所属的档位。并且,可以查找到提取出的属性所属的档位。例如,可以查找到类目“水果”的档位是三档,类目“女装”的档位是二档,类目“MP3”的档位是一档。对于提取出的各个属性的档位,可以类似地查找到,并且可以查找到权重最高的属性的个数,以及提取出的属性的总数。
对于类目“水果”而言,由于类目“水果”是需求程度最高的类目,所以可以将类目“水果”的档位调整为权重最高的档位,即调整为一档。
对于类目“女装”和“MP3”而言,这两个类目不是需求程度最高的档位,所以可以将这两个类目的档位调整为权重次高的档位,即调整为二档。
可以基于公式(2)分别获取各条商品信息对应的用户需求值。
在计算类目“水果”下的商品信息的用户需求值时,公式(2)中,C1的取值可以为1,因为类目“水果”的档位已经被调整为权重最高的档位。
在计算与类目“女装”和“MP3”下的商品信息的用户需求值时,公式(2)中,C1的取值可以为2,因为类目“女装”和“MP3”的档位已经被调整为权重次高的档位。
需要说明的是,上述对于各个类目的档位的调整,是用于采用公式(2)计算时确定当前提取出的各个类目的档位的取值,而不是对线下获取的类目的分档信息进行调整。
根据公式(2)计算出各条商品信息的用户需求值之后,可以根据用户需求值对商品信息进行排序。例如,可以首先根据文本相关性对商品信息分档;再根据用户需求值对各个档位内的商品信息的顺序进行档位内的调整。在调整各个档位内的商品信息的顺序时,还可以结合市场因素进行。
如图2所示的实施例中,根据所获取的商品信息的类目的分档信息与属性的分档信息,查找提取出的类目的档位与权重最高的属性的个数,并根据所获取的需求程度最高的类目,调整提取出的各个类目的档位,使得调整后的类目的档位能够体现特定用户的个性化需求。再根据调整后的类目的档位,以及查找出的权重最高的属性的个数获取各商品信息的用户需求值。根据公式(2)可以看出,类目档位取值为权重值高的档位,则计算出的用户需求值也高。根据用户需求值对商品信息排序时,用户需求值高的商品信息可以排序靠前。这样,商品信息的排序可以反映特定用户的个性化需求,使得与该需求程度最高的类目相对应的商品信息可以排序靠前,使得用户可以迅速找到满足其需求的商品信息,能够提高网上交易***的流量质量,提高点击率,提升用户体验。并且,由于商品信息可以体现用户的个性化需求,从而可以避免用户通过客户端向服务器发送大量无用的查询请求,从而减轻服务器的工作压力,提高服务器的响应速度。
本申请还提供一个实施例,可以通过设置个性化的特征权重来对商品信息排序。
图3示例性示出本申请搜索结果排序方法实施例三的流程图,包括:
步骤401、获取查询词和用户信息。
步骤402、搜索到与查询词对应的商品信息,并提取各商品信息的类目。
步骤403、根据所获取的用户信息、查询词与需求程度最高的类目之间的对应关系,获取用户信息和查询词对应的需求程度最高的类目。
步骤404、根据需求程度最高的类目对商品信息排序。具体包括:
步骤404a、将类目为需求程度最高的类目的商品信息中的m%的商品信息的个性化特征权重增加附加值。该附加值的大小可以根据实际需要来设置。m为常数,取值可以大于0且小于100,例如,m%可以取值为75%。
对于类目为需求程度最高的类目的商品信息中的(1-m%)的商品信息的个性化特征权重,可以保持不变。
本申请的实施例中,个性化特征权重是反映各个商品信息的个性化特征的一个参数。对于各个类目的商品信息,可以设置一个个性化特征权重。对于类目为需求程度最高的类目的商品信息,可以将这些商品信息中的一部分的个性化特征权重增加一个附加值。例如,预先设置的各个商品信息的个性化特征权重都是Q,附加值为P,那么可以将类目为需求程度最高的类目的商品信息中的一部分商品信息的个性化特征权重设置成Q+P,类目为需求程度最高的类目的商品信息中的另一部分商品信息的个性化特征权重保持Q。
步骤404b、将各条商品信息按照个性化特征权重排序。
具体地,可以结合用户偏好权重和其他权重,来对各条商品信息排序。例如,可以将各条商品信息的用户偏好权重和个性化特征权重相加,获得各条商品信息的综合权重。将各条商品信息按照综合权重的大小排序。
步骤404a中,将类目为需求程度最高的类目的商品信息中的m%的商品信息的个性化特征权重增加附加值,避免了只曝光需求程度最高的类目下的商品信息,可以使得各种类目下的商品信息都有一定的曝光概率;而且,通过调整m,可以使得排序结果更合理。
前述各实施例中,网上交易***在根据一个用户信息和查询词搜索到需求程度最高的类目时,可以缓存经过排序后的商品信息,并建立查询词、需求程度最高的类目与经过排序的商品信息之间的对应关系。
如果根据查询词和另外的用户信息获取到的需求程度最高的类目分别与缓存的查询词和需求程度最高的类目相同,则可以将与缓存的查询词和需求程度对应的经过排序的商品信息显示给用户。
由于用户信息多样,而需求程度最高的类目比较单一,通过将经过排序的商品信息缓存,后续用户的查询请求能够快速得到处理,提高了数据处理的速度,提高了用户体验。
例如100个用户信息对应的需求程度最高的类目可能包括10个,也就是说,平均10个用户可能对应同一个需求程度最高的类目。假设当用户A和用户B输入查询词b时,查询到的对应的需求程度最高的类目都是类目a,则网上交易***基于用户A的用户信息和查询词b搜索到的需求程度为类目a,并且根据类目a对商品信息进行了排序。随后,根据用户B的用户信息和查询词b,网上交易***搜索到的需求程度最高的类目同样为类目a,则网上交易***可以直接将之前缓存的与查询词b对应的经过排序的商品信息显示给用户B,而无需重新根据需求程度最高类目对商品信息进行排序。
本申请各实施例提供的方法可以用C++实现,可以在Linux***上运行。
图5示例性示出本申请搜索结果排序装置实施例一的结构示意图,该装置包括:获取模块11、处理模块12和排序模块13。获取模块11用于获取查询词和用户信息。处理模块12与获取模块11连接,用于搜索到与查询词对应的商品信息,并根据所获取的用户信息、查询词与需求程度最高的类目之间的对应关系,获取用户信息和查询词对应的需求程度最高的类目。排序模块13与处理模块12连接,用于根据需求程度最高的类目对商品信息排序。
如图5所示的装置还可以包括第一预处理模块14,该第一预处理模块14与处理模块12连接,用于根据网上交易***中的日志,获取用户信息、查询词与需求程度最高的类目之间的对应关系。
图6示例性示出图5中第一预处理模块14的结构示意图,该第一预处理模块14包括第一提取单元141、第一获取单元142、确定单元143和第二获取单元144。第一提取单元141用于提取用户信息对应的日志;第一获取单元142与第一提取单元141连接,用于根据用户信息对应的日志,获取查询词对应的满足第一预设条件的类目。确定单元143与第一获取单元142连接,用于根据满足第一预设条件的类目中类目曝光量最大的类目的类目曝光量确定所述查询词是单需求查询词还是泛需求查询词。第二获取单元144与确定单元143和处理模块12连接,用于当确定单元143确定查询词是泛需求查询词时,确定满足第一预设条件的类目中需求程度最高的类目,并建立用户信息、查询词与需求程度最高的类目之间的对应关系。
其中,确定单元143具体用于当满足第一预设条件的各个类目中,类目曝光量最大的类目的类目曝光量大于第一阈值时,确定查询词是单需求查询词;当满足第一预设条件的各个类目中,类目曝光量最大的类目的类目曝光量小于或等于第一阈值时,确定查询词是泛需求查询词。
第二获取单元144具体用于当查询词是泛需求查询词,并且查询词是有点击查询词时,从日志中获取选择出的类目的信息点击次数和类目点击次数,根据选择出的类目的信息点击次数和类目点击次数,获取满足第一预设条件的类目的需求值,确定满足第一预设条件的类目的需求值,将需求值最高的类目作为需求程度最高的类目,从而获取用户信息、查询词与需求程度最高的类目之间的对应关系。
或者,第二获取单元144具体可以用于当查询词是泛需求查询词,并且查询词是无点击查询词时,从预先获取的与用户行业背景对应的类目列表中选择频次最高的类目,并判断频次最高的类目的点击率是否满足第二预设条件;如果频次最高的类目的点击率不满足第二预设条件,则选择频次次高的类目,判断频次次高的类目的点击率是否满足第二预设条件;以此类推,直至找到类目点击率满足第二预设条件的类目,将类目点击率满足第二预设条件的类目作为需求程度最高的类目,从而获取用户信息、查询词与需求程度最高的类目之间的对应关系。
根据一个实施例,排序模块13具体可以用于将商品信息中属于需求程度最高的类目的商品信息,排序最靠前。
图7示例性示出本申请搜索结果排序装置实施例二的结构示意图,该实施例所示的装置中,还包括第二预处理模块15,该第二预处理模块15用于获取类目的分档信息与属性的分档信息。
处理模块12可以包括第一处理单元121、第二处理单元122和第三处理单元123。第一处理单元121与获取模块11连接,用于搜索得到与查询词对应的商品信息。第二处理单元122与获取模块11和第一预处理模块14连接,用于根据第一预处理模块14所获取的用户信息、查询词与需求程度最高的类目之间的对应关系,获取用户信息和查询词对应的需求程度最高的类目。第三处理单元123与第一处理单元121和第二预处理模块15连接,用于在第一处理单元122搜索得到与查询词对应的商品信息后,提取基于商品信息的类目与属性,根据第二预处理模块15所获取的商品信息的类目的分档信息与属性的分档信息,查找提取出的类目的档位与权重最高的属性的个数。
排序模块13可以包括档位调整单元131和第一排序单元132。档位调整单元131与第三处理单元123和第二处理单元122连接,用于当第三处理单元123提取出的类目是第二处理单元122获取的需求程度最高的类目时,则将提取出的类目的档位调整为权重最高的档位,当第三处理单元123提取出的类目不是第二处理单元122获取需求程度最高的类目时,则将提取出的类目的档位调整为权重次高的档位。第一排序单元132与档位调整单元131连接,用于根据档位调整单元132调整后的类目的档位与查找出的权重最高的属性的个数获取商品信息的用户需求值;根据所获取的用户需求值对所述商品信息排序。
具体地,第一排序单元132可以用于将调整后的类目的档位和查找出的权重最高的属性的个数与用户偏好权重相结合,计算商品信息的用户需求值;根据所获取的用户需求值对商品信息排序。
图8示例性示出图7中第二预处理模块的结构示意图,该第二预处理模块15可以包括第二提取单元151、计算单元152和第三获取单元153。第二提取单元151用于提取网上交易***中的所有商品信息的类目与属性。计算单元152用于根据网上交易***中的点击日志和曝光日志,计算查询词对应的商品信息的点击率。第三获取单元153与第二提取单元151、计算单元152和第三处理单元123连接,用于将商品信息的点击率作为类目的点击率与属性的点击率,根据类目的点击率与属性的点击率,将类目与属性分档,获取类目的分档信息与属性的分档信息。
图9示例性示出本申请搜索结果排序装置实施例三的结构示意图,该装置包括获取模块11、处理模块12、排序模块13、第一预处理模块14和提取模块16。提取模块16与处理模块12连接,用于在处理模块12搜索到与查询词对应的商品信息后,提取商品信息的类目。
该实施例中,排序模块13可以包括设置单元133和第二排序单元134。设置单元133与提取模块16和处理模块12连接,用于将类目为需求程度最高的类目的商品信息中的m%的商品信息的个性化特征权重增加附加值;第二排序单元134与设置单元133连接,用于将各个商品信息按照个性化特征权重排序。
对于本申请前述各个实施例提供的装置,还可以包括缓存模块,该缓存模块可以与排序模块连接,用于缓存经过排序后的商品信息,并建立查询词、需求程度最高的类目与经过排序的商品信息之间的对应关系。
本申请提供的装置中的各个模块的具体操作过程可以参见方法实施例部分的描述。
本申请提供的查询结果排序装置可以是网上交易***中的一个设备,例如可以是一个服务器。本申请提供的查询结果排序方法可以通过在服务器上运行程序来实现。
本申请提供的搜索结果排序装置,排序模块根据所获取的需求程度最高的类目对商品信息排序,该需求程度最高的类目与用户信息相对应,这样商品信息可以体现用户的个性化需求,与该需求程度最高的类目相对应的搜索结果可以排序靠前,使得用户可以迅速找到满足其需求的商品信息,能够提高网上交易***的流量质量,提高点击率,提升用户体验。并且,由于搜索结果可以体现用户的个性化需求,从而可以避免用户通过客户端向服务器发送大量无用的查询请求,从而减轻服务器的工作压力,提高服务器的响应速度。
而且,这种排序结果有利于市场资源的有效配置,能够让具有高需求程度的卖家具有较多的展示信息的机会,提升了点击率。
本申请提供的查询结果排序装置可以是网上交易***中的一个设备,例如可以是一个服务器。本申请提供的查询结果排序方法可以通过在服务器上运行程序来实现。
虽然已参照典型实施例描述了本申请,但应当理解,所用的术语是说明和示例性、而非限制性的术语。由于本申请能够以多种形式具体实施而不脱离发明的精神或实质,所以应当理解,上述实施例不限于任何前述的细节,而应在随附权利要求所限定的精神和范围内广泛地解释,因此落入权利要求或其等效范围内的全部变化和改型都应为随附权利要求所涵盖。

Claims (24)

1.一种搜索结果排序方法,用于网上交易***,其特征在于,包括:
获取查询词和用户信息;
搜索到与所述查询词对应的商品信息,并根据所获取的用户信息、查询词与需求程度最高的类目之间的对应关系,获取所述用户信息和查询词对应的需求程度最高的类目;以及
根据所述需求程度最高的类目对所述商品信息排序。
2.如权利要求1所述的方法,其特征在于,在获取查询词和用户信息之前,还包括:根据网上交易***中的日志,获取用户信息、查询词与需求程度最高的类目之间的对应关系。
3.如权利要求2所述的方法,其特征在于,获取用户信息、查询词与需求程度最高的类目之间的对应关系,包括:
提取所述用户信息对应的日志;
根据所述用户信息对应的日志,获取查询词对应的满足第一预设条件的类目;
根据满足第一预设条件的类目中类目曝光量最大的类目的类目曝光量确定所述查询词是单需求查询词还是泛需求查询词;
如果所述查询词是泛需求查询词,则确定满足第一预设条件的类目中需求程度最高的类目,并建立用户信息、查询词与该需求程度最高的类目之间的对应关系。
4.如权利要求3所述的方法,其特征在于,根据满足第一预设条件的类目中类目曝光量最大的类目的类目曝光量确定所述查询词是单需求查询词还是泛需求查询词,包括:如果满足第一预设条件的各个类目中,类目曝光量最大的类目的类目曝光量大于第一阈值,则确定所述查询词是单需求查询词;如果满足第一预设条件的各个类目中,类目曝光量最大的类目的类目曝光量小于或等于第一阈值,则确定所述查询词是泛需求查询词。
5.如权利要求4所述的方法,其特征在于,确定满足第一预设条件的类目中需求程度最高的类目,包括:
如果所述查询词是有点击查询词,则从所述日志中获取选择出的类目的信息点击次数和类目点击次数,根据选择出的类目的信息点击次数和类目点击次数,获取满足第一预设条件的类目的需求值,确定满足第一预设条件的类目中需求值最高的类目,将需求值最高的类目作为需求程度最高的类目;或者,
如果所述查询词是无点击查询词,则从预先获取的与用户行业背景对应的类目列表中选择频次最高的类目并判断频次最高的类目的点击率是否满足第二预设条件;如果频次最高的类目的点击率不满足第二预设条件,则选择频次次高的类目,判断频次次高的类目的点击率是否满足第二预设条件;以此类推,直至找到类目的点击率满足第二预设条件的类目,将类目点击率满足第二预设条件的类目作为需求程度最高的类目;
所述用户行业背景对应的类目列表包括按照频次从大到小排列的各个类目。
6.如权利要求1-5中任一权利要求所述的方法,其特征在于,根据所述需求程度最高的类目对所述商品信息排序,包括:
将商品信息中属于需求程度最高的类目的商品信息,排序最靠前。
7.如权利要求1-5中任一权利要求所述的方法,其特征在于,在搜索到与所述查询词对应的商品信息之后,还包括:提取所述商品信息的类目与属性,根据所获取的类目的分档信息与属性的分档信息,查找提取出的类目的档位与权重最高的属性的个数;
根据所述需求程度最高的类目对所述商品信息排序,包括:
对于提取出的类目,如果是需求程度最高的类目,则将提取出的类目的档位调整为权重最高的档位,如果不是需求程度最高的类目,则将提取出的类目的档位调整为权重次高的档位;
根据调整后的类目的档位与查找出的权重最高的属性的个数获取所述商品信息的用户需求值;根据所获取的用户需求值对所述商品信息排序。
8.如权利要求7所述的方法,其特征在于,在获取查询词和用户信息之前,还包括:
根据网上交易***中的所述商品信息的类目与属性,获取类目的分档信息与属性的分档信息。
9.如权利要求8所述的方法,其特征在于,根据网上交易***中的所述商品信息的类目与属性,获取类目的分档信息与属性的分档信息,包括:
提取所述网上交易***中的所有所述商品信息的类目与属性;
根据所述网上交易***中的点击日志和曝光日志,计算所述查询词对应的商品信息的点击率;
将所述商品信息的点击率作为所述商品信息的类目的点击率与属性的点击率,根据所述类目的点击率与属性的点击率,将所述类目与属性分档,获取所述类目的分档信息与属性的分档信息。
10.如权利要求9所述的方法,其特征在于,根据调整后的类目的档位与查找出的权重最高的属性的个数获取所述商品信息的用户需求值,包括:
将调整后的类目的档位和查找出的权重最高的属性的个数与用户偏好权重相结合,计算所述商品信息的用户需求值。
11.如权利要求1-5中任一权利要求所述的方法,其特征在于,在搜索到与所述查询词对应的商品信息之后,还包括:提取基于所述商品信息的类目;
所述根据所述需求程度最高的类目对所述商品信息排序,包括:
将类目为需求程度最高的类目的商品信息中的m%的商品信息的个性化特征权重增加附加值;m为常数,取值大于0且小于100;
将各个商品信息按照个性化特征权重排序。
12.如权利要求1-5中任一权利要求所述的方法,其特征在于,还包括:缓存经过排序后的商品信息,并建立查询词、需求程度最高的类目与经过排序的商品信息之间的对应关系。
13.如权利要求12所述的方法,其特征在于,如果根据所述查询词和另外的用户信息获取到的需求程度最高的类目分别与缓存的查询词和需求程度最高的类目相同,则将与缓存的查询词和需求程度最高的类目对应的经过排序的商品信息显示给用户。
14.一种搜索结果排序装置,用于网上交易***,其特征在于,包括:
获取模块,用于获取查询词和用户信息;
处理模块,用于搜索到与所述查询词对应的商品信息,并根据所获取的用户信息、查询词与需求程度最高的类目之间的对应关系,获取所述用户信息和查询词对应的需求程度最高的类目;
排序模块,用于根据所述需求程度最高的类目对所述商品信息排序。
15.如权利要求14所述的装置,其特征在于,还包括第一预处理模块,用于根据网上交易***中的日志,获取用户信息、查询词与需求程度最高的类目之间的对应关系。
16.如权利要求15所述的装置,其特征在于,所述第一预处理模块包括:
第一提取单元,用于提取所述用户信息对应的日志;
第一获取单元,用于根据所述用户信息对应的日志,获取查询词对应的满足第一预设条件的类目;
确定单元,用于根据满足第一预设条件的类目中类目曝光量最大的类目的类目曝光量确定所述查询词是单需求查询词还是泛需求查询词;
第二获取单元,用于当所述查询词是泛需求查询词时,确定满足第一预设条件的类目中需求程度最高的类目,并建立用户信息、查询词与该需求程度最高的类目之间的对应关系。
17.如权利要求16所述的装置,其特征在于,所述确定单元具体用于当满足第一预设条件的各个类目中,类目曝光量最大的类目的类目曝光量大于第一阈值时,确定所述查询词是单需求查询词;当满足第一预设条件的各个类目中,类目曝光量最大的类目的类目曝光量小于或等于第一阈值时,确定所述查询词是泛需求查询词。
18.如权利要求17所述的装置,其特征在于,所述第二获取单元具体用于当所述查询词是泛需求查询词,并且所述查询词是有点击查询词时,从所述日志中获取选择出的类目的信息点击次数和类目点击次数,根据选择出的类目的信息点击次数和类目点击次数,获取满足第一预设条件的类目的需求值,确定满足第一预设条件的类目中需求值最高的类目,将需求值最高的类目作为需求程度最高的类目,从而获取用户信息、查询词与需求程度最高的类目之间的对应关系;或者
所述第二获取单元具体用于当所述查询词是泛需求查询词,并且所述查询词是无点击查询词时,从预先获取的与用户行业背景对应的类目列表中选择频次最高的类目,并判断频次最高的类目的点击率是否满足第二预设条件;如果频次最高的类目的点击率不满足第二预设条件,则选择频次次高的类目,判断频次次高的类目的点击率是否满足第二预设条件;以此类推,直至找到类目点击率满足第二预设条件的类目,将类目点击率满足第二预设条件的类目作为需求程度最高的类目,从而获取用户信息、查询词与需求程度最高的类目之间的对应关系。
19.如权利要求14-18中任一权利要求所述的装置,其特征在于,所述排序模块具体用于将商品信息中属于需求程度最高的类目的商品信息,排序最靠前。
20.如权利要求14-18中任一权利要求所述的装置,其特征在于,还包括第二预处理模块,用于获取类目的分档信息与属性的分档信息;
所述处理模块包括第一处理单元、第二处理单元和第三处理单元;
所述第一处理单元用于搜索得到与所述查询词对应的商品信息;
所述第二处理单元用于根据所获取的用户信息、查询词与需求程度最高的类目之间的对应关系,获取所述用户信息和查询词对应的需求程度最高的类目;
所述第三处理单元用于在所述第一处理单元搜索得到与所述查询词对应的商品信息后,提取所述商品信息的类目与属性,根据所获取的类目的分档信息与属性的分档信息,查找提取出的类目的档位与权重最高的属性的个数;
所述排序模块包括档位调整单元和第一排序单元;
所述档位调整单元用于当提取出的类目是需求程度最高的类目时,则将提取出的类目的档位调整为权重最高的档位,当提取出的类目不是需求程度最高的类目时,则将提取出的类目的档位调整为权重次高的档位;
所述第一排序单元用于根据调整后的类目的档位与查找出的权重最高的属性的个数获取所述商品信息的用户需求值;根据所获取的用户需求值对所述商品信息排序。
21.如权利要求20所述的装置,其特征在于,所述第二预处理模块包括:
第二提取单元,用于提取所述网上交易***中的所有所述商品信息的类目与属性;
计算单元,用于根据所述网上交易***中的点击日志和曝光日志,计算所述查询词对应的商品信息的点击率;
第三获取单元,用于将所述商品信息的点击率作为所述商品信息所述类目的点击率与属性的点击率,根据所述类目的点击率与属性的点击率,将所述类目与属性分档,获取所述类目的分档信息与属性的分档信息。
22.如权利要求21所述的装置,其特征在于,所述第一排序单元具体用于将调整后的类目的档位和查找出的权重最高的属性的个数与用户偏好权重相结合,计算所述商品信息的用户需求值;根据所获取的用户需求值对所述商品信息排序。
23.如权利要求14-18中任一权利要求所述的装置,其特征在于,还包括提取模块,用于在所述处理模块搜索到与所述查询词对应的商品信息后,提取所述商品信息的类目;
所述排序模块包括:
设置单元,用于将类目为需求程度最高的类目的商品信息中的m%的商品信息的个性化特征权重增加附加值;
第二排序单元,用于将各个商品信息按照个性化特征权重排序。
24.如权利要求14-18中任一权利要求所述的装置,其特征在于,还包括缓存模块,用于缓存经过排序后的商品信息,并建立查询词、需求程度最高的类目与经过排序的商品信息之间的对应关系。
CN2011100078479A 2011-01-14 2011-01-14 搜索结果排序方法及装置 Pending CN102591876A (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN2011100078479A CN102591876A (zh) 2011-01-14 2011-01-14 搜索结果排序方法及装置
TW100116689A TWI518529B (zh) 2011-01-14 2011-05-12 Search result sorting method and device
US13/348,446 US20120185359A1 (en) 2011-01-14 2012-01-11 Ranking of query results based on individuals' needs
JP2013549536A JP5639285B2 (ja) 2011-01-14 2012-01-12 個人のニーズに基づいたクエリ結果の順位付け
EP12734339.0A EP2663917A4 (en) 2011-01-14 2012-01-12 CLASSIFICATION OF QUESTIONS ON THE BASIS OF THE NEEDS OF INDIVIDUALS
PCT/US2012/021035 WO2012097124A1 (en) 2011-01-14 2012-01-12 Ranking of query results based on individuals' needs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011100078479A CN102591876A (zh) 2011-01-14 2011-01-14 搜索结果排序方法及装置

Publications (1)

Publication Number Publication Date
CN102591876A true CN102591876A (zh) 2012-07-18

Family

ID=46480545

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011100078479A Pending CN102591876A (zh) 2011-01-14 2011-01-14 搜索结果排序方法及装置

Country Status (6)

Country Link
US (1) US20120185359A1 (zh)
EP (1) EP2663917A4 (zh)
JP (1) JP5639285B2 (zh)
CN (1) CN102591876A (zh)
TW (1) TWI518529B (zh)
WO (1) WO2012097124A1 (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577413A (zh) * 2012-07-20 2014-02-12 阿里巴巴集团控股有限公司 搜索结果排序方法及***、搜索结果排序优化方法及***
CN103631832A (zh) * 2012-08-29 2014-03-12 阿里巴巴集团控股有限公司 业务对象排序方法、业务对象搜索方法及相关装置
CN103853731A (zh) * 2012-11-30 2014-06-11 赵宰范 个人定制型检索服务***以及方法
CN104050187A (zh) * 2013-03-14 2014-09-17 阿里巴巴集团控股有限公司 搜索结果展示方法及***
CN104239460A (zh) * 2014-09-02 2014-12-24 百度在线网络技术(北京)有限公司 搜索结果的展现方法和装置
CN104462525A (zh) * 2014-12-23 2015-03-25 百度在线网络技术(北京)有限公司 实现搜索的方法及装置
CN105630836A (zh) * 2014-11-05 2016-06-01 阿里巴巴集团控股有限公司 搜索结果的排序方法和装置
CN106407210A (zh) * 2015-07-29 2017-02-15 阿里巴巴集团控股有限公司 一种业务对象的展示方法和装置
CN103823900B (zh) * 2014-03-17 2017-07-21 北京百度网讯科技有限公司 信息点重要性确定方法和装置
CN107066549A (zh) * 2017-03-22 2017-08-18 深圳市恒捷供应链有限公司 一种搜索匹配方法、装置及***
WO2018014764A1 (zh) * 2016-07-19 2018-01-25 阿里巴巴集团控股有限公司 一种商品对象选取、模型确定及使用热度确定方法与装置
CN103593353B (zh) * 2012-08-15 2018-11-13 阿里巴巴集团控股有限公司 信息搜索方法、展示信息排序权重值确定方法及其装置
CN109213921A (zh) * 2017-06-29 2019-01-15 广州涌智信息科技有限公司 一种商品信息的搜索方法及装置
CN112069404A (zh) * 2020-08-31 2020-12-11 深圳市卡牛科技有限公司 一种商品信息的展示方法、装置、设备和存储介质
CN112732766A (zh) * 2020-12-30 2021-04-30 绿盟科技集团股份有限公司 一种数据排序方法、装置、电子设备及存储介质
CN112785196A (zh) * 2021-02-03 2021-05-11 叮当快药科技集团有限公司 商品自动推荐方法及装置
CN113536156A (zh) * 2020-04-13 2021-10-22 百度在线网络技术(北京)有限公司 搜索结果排序方法、模型构建方法、装置、设备和介质
WO2022052896A1 (zh) * 2020-09-11 2022-03-17 武汉丹娜文体用品有限公司 排序、交易方法、计算机装置及存储介质

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793388B (zh) * 2012-10-29 2017-08-25 阿里巴巴集团控股有限公司 搜索结果的排序方法和装置
US9576053B2 (en) 2012-12-31 2017-02-21 Charles J. Reed Method and system for ranking content of objects for search results
JP6124252B2 (ja) * 2013-02-25 2017-05-10 有限会社イナダデザイン ショッピングモール型の営業支援システム及び検索方法
US9128988B2 (en) * 2013-03-15 2015-09-08 Wal-Mart Stores, Inc. Search result ranking by department
CN104077306B (zh) 2013-03-28 2018-05-11 阿里巴巴集团控股有限公司 一种搜索引擎的结果排序方法及***
US9524520B2 (en) 2013-04-30 2016-12-20 Wal-Mart Stores, Inc. Training a classification model to predict categories
US9524319B2 (en) * 2013-04-30 2016-12-20 Wal-Mart Stores, Inc. Search relevance
US20150331863A1 (en) * 2014-05-13 2015-11-19 Htc Corporation Selection method, method for maintaining data list and electronic device
CN105224547A (zh) * 2014-06-05 2016-01-06 阿里巴巴集团控股有限公司 对象集合及其满意度的处理方法及装置
US9767417B1 (en) 2014-06-12 2017-09-19 Amazon Technologies, Inc. Category predictions for user behavior
US10387934B1 (en) * 2014-06-12 2019-08-20 Amazon Technologies, Inc. Method medium and system for category prediction for a changed shopping mission
US9767204B1 (en) * 2014-06-12 2017-09-19 Amazon Technologies, Inc. Category predictions identifying a search frequency
US10474670B1 (en) 2014-06-12 2019-11-12 Amazon Technologies, Inc. Category predictions with browse node probabilities
CN104361046A (zh) * 2014-10-29 2015-02-18 中英融贯资讯(武汉)有限公司 用于药品采购的搜索方法及***
JP6433270B2 (ja) * 2014-12-03 2018-12-05 株式会社Nttドコモ コンテンツ検索結果提供システム及びコンテンツ検索結果提供方法
US10007732B2 (en) 2015-05-19 2018-06-26 Microsoft Technology Licensing, Llc Ranking content items based on preference scores
CN106021374A (zh) * 2016-05-11 2016-10-12 百度在线网络技术(北京)有限公司 查询结果的底层召回方法和装置
CN106372249B (zh) * 2016-09-23 2018-04-13 北京三快在线科技有限公司 一种点击率预估方法、装置及电子设备
JP6867579B2 (ja) * 2016-11-25 2021-04-28 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理システム、その制御方法及びプログラム
CN106897412A (zh) * 2017-02-20 2017-06-27 广州优视网络科技有限公司 一种基于目标应用推荐相关联应用的方法和装置
JP6664593B1 (ja) * 2018-12-21 2020-03-13 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP7042770B2 (ja) * 2019-04-17 2022-03-28 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
KR102425770B1 (ko) * 2020-04-13 2022-07-28 네이버 주식회사 급상승 검색어 제공 방법 및 시스템
US11551282B2 (en) * 2020-07-27 2023-01-10 Intuit Inc. System, method, and computer-readable medium for capacity-constrained recommendation
US11449914B2 (en) * 2020-08-31 2022-09-20 Coupang Corp. Systems and methods for visual navigation during online shopping using intelligent filter sequencing
CN113010782B (zh) * 2021-03-16 2023-09-29 北京百度网讯科技有限公司 需求量获取方法、装置、电子设备以及计算机可读介质
CN116484066B (zh) * 2023-06-21 2023-12-01 广东广宇科技发展有限公司 一种多种类数据处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101266620A (zh) * 2008-04-07 2008-09-17 北京大学 向用户提供目标信息的方法及设备
CN101477554A (zh) * 2009-01-16 2009-07-08 西安电子科技大学 基于用户兴趣的个性化元搜索引擎及搜索结果处理方法
CN101620625A (zh) * 2009-07-30 2010-01-06 腾讯科技(深圳)有限公司 一种搜索关键词排序方法、装置和搜索引擎

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6785671B1 (en) * 1999-12-08 2004-08-31 Amazon.Com, Inc. System and method for locating web-based product offerings
US6963867B2 (en) * 1999-12-08 2005-11-08 A9.Com, Inc. Search query processing to provide category-ranked presentation of search results
US6832218B1 (en) * 2000-09-22 2004-12-14 International Business Machines Corporation System and method for associating search results
US7406437B2 (en) * 2000-11-30 2008-07-29 Ncr Corporation System and method for directing customers to product locations within a store
US20020078045A1 (en) * 2000-12-14 2002-06-20 Rabindranath Dutta System, method, and program for ranking search results using user category weighting
US7089237B2 (en) * 2001-01-26 2006-08-08 Google, Inc. Interface and system for providing persistent contextual relevance for commerce activities in a networked environment
US7805339B2 (en) * 2002-07-23 2010-09-28 Shopping.Com, Ltd. Systems and methods for facilitating internet shopping
AU2003279992A1 (en) * 2002-10-21 2004-05-13 Ebay Inc. Listing recommendation in a network-based commerce system
US20040210491A1 (en) * 2003-04-16 2004-10-21 Pasha Sadri Method for ranking user preferences
US20050071328A1 (en) * 2003-09-30 2005-03-31 Lawrence Stephen R. Personalization of web search
JP4426826B2 (ja) * 2003-11-13 2010-03-03 日本電信電話株式会社 コンテンツ検索方法、コンテンツ更新方法、コンテンツ更新の反映方法、コンテンツ検索装置、コンテンツ更新装置、コンテンツ検索のプログラム及びコンテンツ更新のプログラム並びにそれらの記録媒体
US7519581B2 (en) * 2004-04-30 2009-04-14 Yahoo! Inc. Method and apparatus for performing a search
US7966309B2 (en) * 2007-01-17 2011-06-21 Google Inc. Providing relevance-ordered categories of information
US7899727B2 (en) * 2007-08-07 2011-03-01 Telepaq Technology Inc. System and method for securities information service
JP2010097461A (ja) * 2008-10-17 2010-04-30 Nippon Telegr & Teleph Corp <Ntt> 文書検索装置、文書検索方法および文書検索プログラム
US8903816B2 (en) * 2009-04-08 2014-12-02 Ebay Inc. Methods and systems for deriving a score with which item listings are ordered when presented in search results
US8515830B1 (en) * 2010-03-26 2013-08-20 Amazon Technologies, Inc. Display of items from search
US8326861B1 (en) * 2010-06-23 2012-12-04 Google Inc. Personalized term importance evaluation in queries

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101266620A (zh) * 2008-04-07 2008-09-17 北京大学 向用户提供目标信息的方法及设备
CN101477554A (zh) * 2009-01-16 2009-07-08 西安电子科技大学 基于用户兴趣的个性化元搜索引擎及搜索结果处理方法
CN101620625A (zh) * 2009-07-30 2010-01-06 腾讯科技(深圳)有限公司 一种搜索关键词排序方法、装置和搜索引擎

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BERNARD J.JANSEN, DANIELLE L.BOOTH, AMANDA SPINK: "Determining the informational, navigational, and transactional intent of Web queries", 《INFORMATION PROCESSING AND MANAGEMENT》, 11 September 2007 (2007-09-11), pages 1256 - 1262 *

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577413A (zh) * 2012-07-20 2014-02-12 阿里巴巴集团控股有限公司 搜索结果排序方法及***、搜索结果排序优化方法及***
CN103593353B (zh) * 2012-08-15 2018-11-13 阿里巴巴集团控股有限公司 信息搜索方法、展示信息排序权重值确定方法及其装置
CN103631832B (zh) * 2012-08-29 2017-08-11 阿里巴巴集团控股有限公司 业务对象排序方法、业务对象搜索方法及相关装置
CN103631832A (zh) * 2012-08-29 2014-03-12 阿里巴巴集团控股有限公司 业务对象排序方法、业务对象搜索方法及相关装置
CN103853731A (zh) * 2012-11-30 2014-06-11 赵宰范 个人定制型检索服务***以及方法
CN104050187A (zh) * 2013-03-14 2014-09-17 阿里巴巴集团控股有限公司 搜索结果展示方法及***
CN104050187B (zh) * 2013-03-14 2017-09-08 阿里巴巴集团控股有限公司 搜索结果展示方法及***
CN103823900B (zh) * 2014-03-17 2017-07-21 北京百度网讯科技有限公司 信息点重要性确定方法和装置
CN104239460A (zh) * 2014-09-02 2014-12-24 百度在线网络技术(北京)有限公司 搜索结果的展现方法和装置
CN105630836A (zh) * 2014-11-05 2016-06-01 阿里巴巴集团控股有限公司 搜索结果的排序方法和装置
CN105630836B (zh) * 2014-11-05 2018-11-16 阿里巴巴集团控股有限公司 搜索结果的排序方法和装置
CN104462525A (zh) * 2014-12-23 2015-03-25 百度在线网络技术(北京)有限公司 实现搜索的方法及装置
CN104462525B (zh) * 2014-12-23 2018-04-13 百度在线网络技术(北京)有限公司 实现搜索的方法及装置
CN106407210A (zh) * 2015-07-29 2017-02-15 阿里巴巴集团控股有限公司 一种业务对象的展示方法和装置
CN106407210B (zh) * 2015-07-29 2019-11-26 阿里巴巴集团控股有限公司 一种业务对象的展示方法和装置
WO2018014764A1 (zh) * 2016-07-19 2018-01-25 阿里巴巴集团控股有限公司 一种商品对象选取、模型确定及使用热度确定方法与装置
CN107066549A (zh) * 2017-03-22 2017-08-18 深圳市恒捷供应链有限公司 一种搜索匹配方法、装置及***
CN109213921A (zh) * 2017-06-29 2019-01-15 广州涌智信息科技有限公司 一种商品信息的搜索方法及装置
CN113536156A (zh) * 2020-04-13 2021-10-22 百度在线网络技术(北京)有限公司 搜索结果排序方法、模型构建方法、装置、设备和介质
CN113536156B (zh) * 2020-04-13 2024-05-28 百度在线网络技术(北京)有限公司 搜索结果排序方法、模型构建方法、装置、设备和介质
CN112069404A (zh) * 2020-08-31 2020-12-11 深圳市卡牛科技有限公司 一种商品信息的展示方法、装置、设备和存储介质
WO2022052896A1 (zh) * 2020-09-11 2022-03-17 武汉丹娜文体用品有限公司 排序、交易方法、计算机装置及存储介质
CN112732766A (zh) * 2020-12-30 2021-04-30 绿盟科技集团股份有限公司 一种数据排序方法、装置、电子设备及存储介质
CN112785196A (zh) * 2021-02-03 2021-05-11 叮当快药科技集团有限公司 商品自动推荐方法及装置

Also Published As

Publication number Publication date
EP2663917A1 (en) 2013-11-20
JP5639285B2 (ja) 2014-12-10
WO2012097124A1 (en) 2012-07-19
EP2663917A4 (en) 2014-07-16
TW201229791A (en) 2012-07-16
US20120185359A1 (en) 2012-07-19
TWI518529B (zh) 2016-01-21
JP2014507712A (ja) 2014-03-27

Similar Documents

Publication Publication Date Title
CN102591876A (zh) 搜索结果排序方法及装置
CN102542474B (zh) 查询结果排序方法及装置
JP6356744B2 (ja) ウェブサイト横断情報を表示する方法およびシステム
US10423664B2 (en) Method and system for providing recommended terms
CN110020094B (zh) 一种搜索结果的展示方法和相关装置
WO2018014759A1 (zh) 一种聚类数据表的展现方法、装置和***
CN105765573B (zh) 网站通信量优化方面的改进
US10810275B2 (en) Query-dependent and content-class based ranking
CN103886487A (zh) 基于分布式的b2b平台的个性化推荐方法与***
CN107222566A (zh) 信息推送方法、装置及服务器
US20140278939A1 (en) Advertisement extraction device and advertisement extraction method
CN102663627A (zh) 个性化推荐方法
CN106407349A (zh) 一种产品推荐方法及装置
CN111899047A (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
CN102339296A (zh) 一种查询结果的排序方法和装置
TWI539306B (zh) Information delivery method, processing server and merge server
CN105630836A (zh) 搜索结果的排序方法和装置
CN103198098A (zh) 一种网络信息投放方法和装置
CN109885651B (zh) 一种问题推送方法和装置
CN106933893A (zh) 多维度数据的查询方法及装置
CN112818230B (zh) 内容推荐方法、装置、电子设备和存储介质
CN108122153A (zh) 电子商务环境下基于云计算处理模式的个性化推荐方法
TW201426357A (zh) 搜索資料排序的方法和裝置,資料搜索的方法和裝置
CN110717089A (zh) 一种基于网络日志的用户行为分析***及方法
CN105590234A (zh) 一种向目标用户推荐商品的方法和***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20120718

RJ01 Rejection of invention patent application after publication