CN103514178A - 一种基于点击率的搜索排序方法及装置 - Google Patents
一种基于点击率的搜索排序方法及装置 Download PDFInfo
- Publication number
- CN103514178A CN103514178A CN201210206502.0A CN201210206502A CN103514178A CN 103514178 A CN103514178 A CN 103514178A CN 201210206502 A CN201210206502 A CN 201210206502A CN 103514178 A CN103514178 A CN 103514178A
- Authority
- CN
- China
- Prior art keywords
- query
- user
- feature
- clicking rate
- aim
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3349—Reuse of stored results of previous queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Probability & Statistics with Applications (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种基于点击率的搜索排序方法及装置,以解决在应用排序规则对搜索结果进行排序时,复用性比较低并且方法繁琐的问题。所述的方法包括:搜索排序前,获取预设时间内用户的点击数据,并依据所述点击数据确定每个特征的权重;搜索排序包括以下步骤:获取查询词和与所述查询词匹配的查询目标,并且分别提取所述查询词和查询目标的特征;针对每个查询目标,根据所述查询词和查询目标的特征,以及每个特征对应的权重,采用回归模型预测所述查询目标的点击率;根据所述点击率,对所述查询目标进行排序并显示给用户。本申请适用于各种应用场景,复用性较高。并且,可以根据用户的点击数据准实时的调整所述权重,不需要重新配置。
Description
技术领域
本申请涉及搜索技术,特别是涉及一种基于点击率的搜索排序方法及装置。
背景技术
随着网络的不断发展,越来越多的用户通过网络获取信息,用户可以通过输入查询词查询相应的查询目标,并最终获取到对应的搜索结果。通常针对查询词对应的查询目标,可以按照一定的排序规则衡量所述查询词和查询目标的匹配程度,然后根据所述匹配程度对所述查询目标进行排序,将排序后的查询目标构成搜索结果显示给用户,可以让用户快速的获取到最需要的结果。
但是这种方法存在一定的缺陷,就是排序规则需要根据应用场景的改变而改变,即查询目标不同,则相应的排序规则也会不同。因此上述的方法需要针对每一个应用场景设置相应的排序规则,没有复用性。
例如在公司查询中,查询目标是公司,则针对于查询词匹配的公司会仅按照排序规则排序,如按公司规模的大小排序。又如在产品查询中,针对于查询词匹配的产品,可能仅根据价格,或仅根据上架时间排序,复用性很低。
而且,用户的需求变化了,应用场景也是会发生变化,当根据应用场景或用户的需求的变化而改变排序规则时,就需要重新配置排序规则,如冬季和夏季用户需求的产品不同,此时需要重新配置排序规则,重新编写搜索排序方法,方法非常的繁琐。
综上所述,在应用排序规则对搜索结果进行排序时,复用性比较低并且方法繁琐。
发明内容
本申请提供一种基于点击率的搜索排序方法及装置,以解决在应用排序规则对搜索结果进行排序时,复用性比较低并且方法繁琐的问题。
为了解决上述问题,本申请公开了一种基于点击率的搜索排序方法,包括:
搜索排序前,获取预设时间内用户的点击数据,并依据所述点击数据确定每个特征的权重;
搜索排序包括以下步骤:
获取查询词和与所述查询词匹配的查询目标,并且分别提取所述查询词和查询目标的特征;
针对每个查询目标,根据所述查询词和查询目标的特征,以及每个特征对应的权重,采用回归模型预测所述查询目标的点击率;
根据所述点击率,对所述查询目标进行排序并显示给用户。
优选的,所述分别提取所述查询词和查询目标的特征之后,还包括:
分别将所述查询词和查询目标的特征量化为特征值。
优选的,所述针对每个查询目标,根据所述查询词和查询目标的特征,以及每个特征对应的权重,采用回归模型预测所述查询目标的点击率,包括:
获取每个特征对应的权重;
针对每个查询目标,将所述特征值和所述权重进行加权;
将所述加权后的结果代入回归模型中,预测出所述查询目标的点击率。
优选的,所述搜索排序前,获取预设时间内用户的点击数据,并依据所述点击数据确定每个特征的权重,包括:
获取预设时间内用户的点击数据,根据所述点击数据统计后验点击率;
获取查询词和所述查询目标的特征值;
根据所述后验点击率和所述特征值,计算每个特征的权重。
优选的,所述针对每个查询目标,获取预设时间内用户的点击数据之后,所述并根据所述点击数据统计后验点击率之前,还包括:
过滤所述点击数据中的异常数据,得到过滤后的点击数据。
优选的,根据所述点击数据统计后验点击率,包括:
对所述过滤后的点击数据进行统计,获取到所述查询目标在页面中每个位置的点击率;
根据预设的每个位置的权重,对所述每个位置的点击率进行加权,得到对应的后验点击率。
优选的,所述分别提取所述查询词和查询目标的特征之后,还包括:
针对输入查询词的用户,提取所述用户的行为特征,所述用户的行为特征包括以下至少一项:
所述用户在一段时间内的点击数据;
所述用户在一段时间内的类目数据,其中,所述类目数据包括点击的类目数据和/或搜索的类目数据;
所述用户在一段时间内的地域数据。
优选的,所述的方法还包括:
提取所述查询词、查询目标和用户的相关特征。
优选的,所述查询目标包括:产品、企业和行业。
相应的,本申请还公开了一种基于点击率的搜索排序装置,包括:
权重确定模块,用于搜索排序前,获取预设时间内用户的点击数据,并依据所述点击数据确定每个特征的权重;
获取并提取模块,用于获取查询词和与所述查询词匹配的查询目标,并且分别提取所述查询词和查询目标的特征;
预测点击率模块,用于针对每个查询目标,根据所述查询词和查询目标的特征,以及每个特征对应的权重,采用回归模型预测所述查询目标的点击率;
排序并显示模块,根据所述点击率,对所述查询目标进行排序并显示给用户。
与现有技术相比,本申请包括以下优点:
首先,现有技术中是按照一定的排序规则衡量所述查询词和每个查询目标的匹配程度,但是排序规则需要根据应用场景的改变而改变,即查询目标不同,则相应的排序规则也会不同。如在公司查询中,查询目标是公司,则针对于查询词匹配的公司会仅按照排序规则排序,如按公司规模的大小排序。又如在产品查询中,针对于查询词匹配的产品,可能仅根据价格,或仅根据上架时间排序,复用性很低。而本申请在搜索排序前,通过获取预设时间内用户的点击数据确定每个特征的权重。具体执行搜索排序时,无论是何种应用场景,何种查询目标,在获取到查询词和查询目标后,提取查询词和查询目标的相应特征,并根据特征和所述特征对应的权重,采用回归模型预测出本次搜索排序中所述查询目标的点击率。本申请中依据不同的查询目标的不同特征,以及不同特征对应权重,可以预测出各种应用场景中各个查询目标的点击率,因此适用于各种应用场景,复用性较高。并且,现有技术中用户的需求变化,如冬季和夏季用户需求的产品不同,此时需要重新配置排序规则,重新编写搜索排序方法。而本申请在执行搜索排序前,就可以通过预设时间内的点击数据确定每个特征的权重随着用户需求的变化,每个特征的权重会准实时的进行调整,不需要单独的手动配置,方法简单,因此根据所述权重所预测出的查询目标的点击率也会进行准实时的调整,准确率较高。
其次,本申请可以获取预设时间内的点击数据,并且对所述点击数据进行过滤,然后通过统计得到后验点击率。再根据所述后验点击率和每个特征的特征值,计算每个特征的权重。因此本申请可以点击数据更新权重,在进行搜索时,针对同样的查询词,用户搜索的时间不同,对应的搜索结果也会不同。
再次,本申请提取查询词和查询目标的特征,还可以提取用户的特征,通过提取多维度的特征,使得计算权重和预测点击率更加准确,建立更合理的预测模型,对用户进行更合理的引导,减少作弊行为带来的弊端。同时针对同样的查询词,搜索的用户不同,对应的搜索结果也会不同,满足用户个性化的需求。
附图说明
图1是本申请实施例所述一种基于点击率的搜索排序方法流程图;
图2是本申请优选实施例所述一种基于点击率的搜索排序方法中统计后验点击率的流程图;
图3是本申请优选实施例所述一种基于点击率的搜索排序方法流程图;
图4是本申请实施例所述一种基于点击率的搜索排序装置结构图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
通常针对查询词对应的搜索结果,可以按照一定的排序规则衡量所述查询词和搜索结果的匹配程度,然后根据所述匹配程度进行排序,将排序后的搜索结果显示给用户,可以让用户快速的获取到最需要的结果。但是在应用排序规则对搜索结果进行排序时,复用性比较低并且方法繁琐。
本申请提供一种基于点击率的搜索排序方法,本申请在执行搜索排序前,可以通过预设时间内的点击数据确定每个特征的权重,而后在对查询目标进行排序时可以采用所述权重,因此本申请可以根据用户的点击数据准实时的调整所述权重,不需要重新配置。并且,采用回归模型来预测点击率,适用于各种应用场景,复用性较高。
参照图1,给出了本申请实施例所述一种基于点击率的搜索排序方法流程图。
步骤10,搜索排序前,获取预设时间内用户的点击数据,并依据所述点击数据确定每个特征的权重;
现有技术中用户的需求变化会导致排序规则的变化,如冬季和夏季用户需求的产品不同,此时需要重新配置排序规则,重新编写搜索排序方法,方法非常的繁琐
在进行搜索排序前,首先可以获取预设时间内用户的点击数据,例如,预设时间为24小时,则可以获取24小时内用户的点击数据,并可以根据所述点击数据确定每个特征的权重。为后续预测查询目标的点击率做准备。
本申请中,随着用户需求的变化,每个特征的权重会准实时的进行调整,不需要单独的手动配置,方法简单,因此根据所述权重所预测出的查询目标的点击率也会进行准实时的调整,准确率较高。
具体在进行搜索排序时,主要包括以下步骤:
步骤11,获取查询词和与所述查询词匹配的查询目标,并且分别提取所述查询词和查询目标的特征;
首先,获取用户输入的查询词,并根据预设的匹配方法获取与所述查询词匹配的查询目标。然后提取所述查询词的特征和所述查询目标的特征。其中,所述特征可以包括查询词的中心词;查询词所属的类目,例如,查询词是iphone,则查询词的特征是手机。本申请对此不做限定。
所述查询目标的特征是根据具体的目标而定,例如,查询目标是产品,则查询目标的特征可以是产品所属的类别;又如,查询目标是企业,则查询目标的特征是企业的主营产品。
步骤12,针对每个查询目标,根据所述查询词和查询目标的特征,以及每个特征对应的权重,采用回归模型预测所述查询目标的点击率;
上述获取到了与所述查询词匹配的查询目标,则针对每个查询目标,根据所述查询词和查询目标的特征,以及每个特征对应的权重,采用回归模型预测本次搜索排序中每个查询目标的点击率。
其中,所述点击率(CTR,Click Through Rate)是指网站页面上某一内容被点击的次数与被显示的次数之比。点击率反映了页面上某一内容的受关注程度。所述点击的次数与未点击的次数之和为被显示的次数。
本申请中不同的查询目标对应不同的特征,不同的特征对应不同的权重。而本申请中无论是何种应用场景,何种查询目标,都可以通过所述查询词和查询目标的相应特征,以及每个特征对应的权重,采用回归模型预测出本次搜索排序中所述查询目标的点击率,适用于各种应用场景,复用性较高。
步骤13,根据所述点击率,对所述查询目标进行排序并显示给用户。
上述预测出每个查询目标的点击率后,可以根据所述点击率,对所述查询目标进行排序,然后将所述排序后的结果显示给用户。
综上所述,现有技术中是按照一定的排序规则衡量所述查询词和每个查询目标的匹配程度,但是排序规则需要根据应用场景的改变而改变,即查询目标不同,则相应的排序规则也会不同。如在公司查询中,查询目标是公司,则针对于查询词匹配的公司会仅按照排序规则排序,如按公司规模的大小排序。又如在产品查询中,针对于查询词匹配的产品,可能仅根据价格,或仅根据上架时间排序,复用性很低。而本申请在搜索排序前,通过获取预设时间内用户的点击数据确定每个特征的权重。具体执行搜索排序时,无论是何种应用场景,何种查询目标,在获取到查询词和查询目标后,提取查询词和查询目标的相应特征,并根据查询词和查询目标的特征,以及各个特征对应的权重,采用回归模型预测出本次搜索排序中所述查询目标的点击率。本申请中依据不同的查询目标的不同特征,以及不同特征对应权重,可以预测出各种应用场景中各个查询目标的点击率,因此适用于各种应用场景,复用性较高。并且,现有技术中用户的需求变化,如冬季和夏季用户需求的产品不同,此时需要重新配置排序规则,重新编写搜索排序方法。而本申请在执行搜索排序前,就可以通过预设时间内的点击数据确定每个特征的权重,随着用户需求的变化,每个特征的权重会准实时的进行调整,不需要单独的手动配置,方法简单,因此根据所述权重所预测出的查询目标的点击率也会进行准实时的调整,准确率较高。
本申请中所述查询目标包括:产品、企业和行业等。
在电子商务网站中,用户在进行搜索时,查询目标可以是电子商务网站中卖家出售的产品信息,如服装、电子产品等。所述查询目标还可以是电子商务网站中卖家的企业信息,如查询词是手机时,查询目标是出售手机的卖家。所述查询目标还可以是电子商务网站中各个行业的相关信息等。
本申请可以应用于针对广告的搜索排序中,根据显示广告的点击数据确定权重,然后在用户搜索时,获取与所述查询词匹配的广告查询目标,根据特征和权重,预测点击率,然后可以进行排序并显示。
其中,所述广告可以是在电子商务网站中进行搜索时,搜索到的卖家发布的产品信息。也可以是用户在搜索时显示在搜索页面边缘处的与查询词匹配的查询目标的广告,例如,用户搜索裙子的图片时,可以在搜索结果页面的边缘处显示裙子相关的产品或者是出售裙子的商家等。
其中,所述查询词的特征包括查询词的关键词、类目等。查询目标也包含各自的特征。例如,若查询目标为产品,则对应的特征包括产品名中的关键词、类目和生产企业等;若查询目标为企业,则对应的特征包括企业名称中的关键词、企业主营产品的关键词和企业主营行业等。
还可以包括查询词和所述查询目标的相关特征,以企业为例,所述相关特征包括:查询词(Query)的类目和企业的主营行业是否匹配,查询词(Query)中的关键词在企业名称中命中的个数、命中的词的比例,以及,查询词(Query)中的关键词在企业主营产品中命中的个数、命中的词的比例等。
具体实施中,所述分别提取所述查询词和查询目标的特征之后,还包括:
分别将所述查询词和查询目标的特征量化为特征值。
在提取所述查询词的特征和所述查询目标的特征后,可以分别将所述查询词的特征和所述查询目标的特征进行量化,获取到量化后的特征值。
在上述实施例的基础上,所述针对每个查询目标,根据所述查询词和查询目标的特征,以及每个特征对应的权重,采用回归模型预测所述查询目标的点击率,包括:
步骤121,获取每个特征对应的权重;
在搜索排序前,可以根据点击数据确定每个特征对应的权重,因此在预测点击率时,首先要获取每个特征对应的权重。
步骤122,针对每个查询目标,将所述特征值和所述权重进行加权;
针对每个查询目标,获取到每个特征的特征值和每个特征对应的权重,因此可以将所述特征值和所述权重进行加权。
步骤123,将所述加权后的结果代入回归模型中,预测出所述查询目标的点击率。
可以将所述加权后的结果带入到回归模型中,然后预测出所述查询目标的点击率。
例如,采用logistic回归模型拟合点击率,f(z)表示预测的点击率,x1,...,xk表示k个特征的特征值,ω0,...,ωk表示特征的权重,具体公式如下:
优选的,所述搜索排序前,获取预设时间内用户的点击数据,并依据所述点击数据确定每个特征的权重,包括:
步骤101,获取预设时间内用户的点击数据,并根据所述点击数据统计后验点击率;
获取预设时间内用户的点击数据,例如,预设时间为24小时,则可以获取24小时内用户的点击数据。然后对所述点击数据进行统计,通过统计获取后验点击率。
参照图2,给出了本申请优选实施例所述一种基于点击率的搜索排序方法中统计后验点击率的流程图。
步骤21,获取预设时间内用户的点击数据;
优选的,所述针对每个查询目标,获取预设时间内用户的点击数据之后,所述并根据所述点击数据统计后验点击率之前,还包括:
步骤22,过滤所述点击数据中的异常数据,得到过滤后的点击数据;
在获取预设时间内用户的点击数据之后,根据所述点击数据统计后验点击率之前,还包括过滤所述点击数据中的异常数据,得到过滤后的点击数据,这是因为:
实际处理中,由于目前各个网站中都存在不同情况的流量作弊和点击作弊的情况,其中,将所述作弊的点击数据作为异常数据。例如,有些用户通过一些作弊工具不停的搜索某个查询目标,是所述查询目标可以获取到较高的点击率。因此需要将所述异常数据,即作弊的点击数据过滤掉,得到过滤后的点击数据。
所述根据所述点击数据统计后验点击率,具体包括:
步骤23,对所述过滤后的点击数据进行统计,获取到所述查询目标在页面中每个位置的点击率;
在一个页面中,存在很多现实查询目标的位置,因此针对每个查询目标获取到预设时间内的点击数据,所述点击数据中包含查询目标在不同位置的点击情况,例如在第一位置显示100次,点击5次,在第三位置显示50次,点击3次。
则可以对所述过滤后的点击数据进行统计,获取所述查询目标在页面中每个位置的点击率。如上例中,查询目标在页面中第一位置的点击率为0.05,在页面中第三位置的点击率为0.06。
步骤24,根据预设的每个位置的权重,对所述每个位置的点击率进行加权,得到对应的后验点击率。
查询目标在页面中显示的位置不同,会对所述查询目标的点击率产生影响,例如,通常显示在第一位置的查询目标最容易被用户看到,也最易被点击。因此,本申请预设了每个位置的权重,将上述获取到的每个位置的点击率,与所述每个位置的权重进行加权,得到所述查询目标的后验点击率。
具体实施中,可以归一化到第一位置来确定每个位置的权重,例如第一位置的权重为1,第二位置的权重为1.5,第三位置的权重为2等。因此上例中,所述查询目标的后验点击率为0.05×1+0.06×2=0.17。
步骤102,获取查询词和所述查询目标的特征值;
然后可以提取查询词和所述查询目标的特征值x1,...,xn。
步骤103,根据所述后验点击率和所述特征值,计算每个特征的权重。
然后根据所述后验点击率和所述特征值,可以计算每个特征的权重。
例如,采用最小二乘法计算每个特征的权重。
其中,n表示训练样本的个数;m表示特征个数;C表示惩罚项的系数,其中惩罚项用来限定模型的规模;ectr表示每条训练样本的后验点击率,通过对历史曝光点击数据的统计得到的,ectr=点击次数/曝光次数。
其中,采用i来标记样本,j来标记特征,ωj是第j个特征的权重,xj是第j个特征的取值。
综上所述,本申请可以获取预设时间内的点击数据,并且对所述点击数据进行过滤,然后通过统计得到后验点击率。再根据所述后验点击率和每个特征的特征值计算每个特征的权重。因此本申请可以点击数据更新权重,在进行搜索时,针对同样的查询词,用户搜索的时间不同,对应的搜索结果也会不同。
优选的,所述分别提取所述查询词和查询目标的特征之后,还包括:
针对输入查询词的用户,提取所述用户的行为特征,所述用户的行为特征包括以下至少一项:
1)所述用户在一段时间内的点击数据;
即获取所述用户的历史点击率:直接从所述用户的历史数据中统计出点击率。
例如,应用于广告的点击率中,这个特征可以衡量这个买家是否喜欢点广告,对于喜欢点击广告的买家,可以多显示一些广告以能满足用户的需求;对于不喜欢点击广告的买家,可以尽量少显示广告,以提升用户的搜索体验。
2)所述用户在一段时间内的类目数据,其中,所述类目数据包括点击的类目数据和/或搜索的类目数据;
可以从两个方面挖掘用户的类目数据:
①用户搜索的类目数据;
从日志中统计用户在一段时间内搜索的查询词,把所述查询词映射到类目,从而得到用户搜索的类目分布。取前n个类目作为用户的搜索类目数据的特征,其中n为正整数。
②用户点击的类目数据。
从日志中统计用户在一段时间内点击的查寻目标,如公司的主营类目的分布,从而得到用户点击的类目分布。取前n个类目作为用户的点击类目数据的特征,其中n为正整数。
然后,可以合并所述用户搜索的类目数据和用户点击的类目数据,还可以进行去重处理,然后作为用户的类目数据。
所述用户在一段时间内的地域数据。
可以从两个方面挖掘用户的地域数据:
①点击的地域;
从日志中统计用户在一段时间内点击的查寻目标所在的地域分布,按照地域出现的频率排序,取前n个地域作为买家偏好的地域。
②所在的地域。
通过日志中记录的IP地址,将所述IP地址映射到具体的地域,就可以得到用户所在的城市、省份等地域数据。
上文中论述了可以提取查询词和所述查询目标的相关特征,因此:
优选的,提取所述查询词、查询目标和用户的相关特征。
例如,所述相关特征可以为用户所在的地域和查询目标是否匹配,用户的类目数据与查询词所属的类目是否匹配等。
综上所述,本申请提取查询词和查询目标的特征,还可以提取用户的特征,通过提取多维度的特征,使得计算权重和预测点击率更加准确,建立更合理的预测模型,对用户进行更合理的引导,减少作弊行为带来的弊端。同时针对同样的查询词,搜索的用户不同,对应的搜索结果也会不同,满足用户个性化的需求。
参照图3,给出了本申请优选实施例所述一种基于点击率的搜索排序方法流程图。
本申请所述的方法整体流程可以如图3所示,1.获取用户输入的查询词;2.提取对应的特征,其中包括查询词的特征、查询目标的特征和所述用户的特征等;3.根据权重预测点击率并进行排序;4.显示结果页面给用户;5.获取用户反馈,统计点击数据;6.根据所述点击数据,确定权重,后续可带入3中预测点击率。
本申请可以通过预设时间内的点击数据确定每个特征的权重,而后在对查询目标进行排序时可以采用所述权重,因此本申请可以根据用户的点击数据准实时的调整所述权重,不需要重新配置。
参照图4,给出了本申请实施例所述一种基于点击率的搜索排序装置结构图。
相应的,本申请还提供一种基于点击率的搜索排序装置,包括权重确定模块11、获取并提取模块12、预测点击率模块13和排序并显示模块14,其中:
权重确定模块11,用于搜索排序前,获取预设时间内用户的点击数据,并依据所述点击数据确定每个特征的权重;
搜索排序包括以下步骤:
获取并提取模块12,用于获取查询词和与所述查询词匹配的查询目标,并且分别提取所述查询词和查询目标的特征;
预测点击率模块13,用于针对每个查询目标,根据所述查询词和查询目标的特征,以及每个特征对应的权重,采用回归模型预测所述查询目标的点击率;
排序并显示模块14,根据所述点击率,对所述查询目标排序并显示给用户。
优选的,所述获取并提取模块12,还用于分别将所述查询词和查询目标的特征量化为特征值。
优选的,所述预测点击率模块13,包括:
获取子模块131,用于获取每个特征对应的权重;
加权子模块132,用于针对每个查询目标,将所述特征值和所述权重进行加权;
预测子模块133,用于将所述加权后的结果代入回归模型中,预测出所述查询目标的点击率。
优选的,所述权重确定模块11,包括:
第一获取子模块111,用于获取预设时间内用户的点击数据,并根据所述点击数据统计后验点击率;
第二获取子模块112,用于获取查询词和所述查询目标的特征值;
权重计算子模块113,用于根据所述后验点击率和所述特征值,计算每个特征的权重。
优选的,所述获取子模块111,包括:
过滤单元1111,用于过滤所述点击数据中的异常数据,得到过滤后的点击数据。
统计单元1112,用于对所述过滤后的点击数据进行统计,获取到所述查询目标在页面中每个位置的点击率;
后验点击率确定单元1113,用于根据预设的每个位置的权重,对所述每个位置的点击率进行加权,得到对应的后验点击率。
优选的,所述的装置还包括:
提取行为特征模块,用于针对输入查询词的用户,提取所述用户的行为特征,所述用户的行为特征包括以下至少一项:所述用户在一段时间内的点击数据;所述用户在一段时间内的类目数据,其中,所述类目数据包括点击的类目数据和/或搜索的类目数据;所述用户在一段时间内的地域数据。
提取相关体征模块,用于提取所述查询词、查询目标和用户的相关特征。
优选的,所述查询目标包括:产品、企业和行业。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上对本申请所提供的一种基于点击率的搜索排序方法及装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种基于点击率的搜索排序方法,其特征在于,包括:
搜索排序前,获取预设时间内用户的点击数据,并依据所述点击数据确定每个特征的权重;
搜索排序包括以下步骤:
获取查询词和与所述查询词匹配的查询目标,并且分别提取所述查询词和查询目标的特征;
针对每个查询目标,根据所述查询词和查询目标的特征,以及每个特征对应的权重,采用回归模型预测所述查询目标的点击率;
根据所述点击率,对所述查询目标进行排序并显示给用户。
2.根据权利要求1所述的方法,其特征在于,所述分别提取所述查询词和查询目标的特征之后,还包括:
分别将所述查询词和查询目标的特征量化为特征值。
3.根据权利要求2所述的方法,其特征在于,所述针对每个查询目标,根据所述查询词和查询目标的特征,以及每个特征对应的权重,采用回归模型预测所述查询目标的点击率,包括:
获取每个特征对应的权重;
针对每个查询目标,将所述特征值和所述权重进行加权;
将所述加权后的结果代入回归模型中,预测出所述查询目标的点击率。
4.根据权利要求3所述的方法,其特征在于,所述搜索排序前,获取预设时间内用户的点击数据,并依据所述点击数据确定每个特征的权重,包括:
获取预设时间内用户的点击数据,根据所述点击数据统计后验点击率;
获取查询词和所述查询目标的特征值;
根据所述后验点击率和所述特征值,计算每个特征的权重。
5.根据权利要求4所述的方法,其特征在于,所述针对每个查询目标,获取预设时间内用户的点击数据之后,所述并根据所述点击数据统计后验点击率之前,还包括:
过滤所述点击数据中的异常数据,得到过滤后的点击数据。
6.根据权利要求5所述的方法,其特征在于,根据所述点击数据统计后验点击率,包括:
对所述过滤后的点击数据进行统计,获取到所述查询目标在页面中每个位置的点击率;
根据预设的每个位置的权重,对所述每个位置的点击率进行加权,得到对应的后验点击率。
7.根据权利要求1所述的方法,其特征在于,所述分别提取所述查询词和查询目标的特征之后,还包括:
针对输入查询词的用户,提取所述用户的行为特征,所述用户的行为特征包括以下至少一项:
所述用户在一段时间内的点击数据;
所述用户在一段时间内的类目数据,其中,所述类目数据包括点击的类目数据和/或搜索的类目数据;
所述用户在一段时间内的地域数据。
8.根据权利要求7所述的方法,其特征在于,还包括:
提取所述查询词、查询目标和用户的相关特征。
9.根据权利要求1至8任一所述的方法,其特征在于,所述查询目标包括:产品、企业和行业。
10.一种基于点击率的搜索排序装置,其特征在于,包括:
权重确定模块,用于搜索排序前,获取预设时间内用户的点击数据,并依据所述点击数据确定每个特征的权重;
获取并提取模块,用于获取查询词和与所述查询词匹配的查询目标,并且分别提取所述查询词和查询目标的特征;
预测点击率模块,用于针对每个查询目标,根据所述查询词和查询目标的特征,以及每个特征对应的权重,采用回归模型预测所述查询目标的点击率;
排序并显示模块,根据所述点击率,对所述查询目标进行排序并显示给用户。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210206502.0A CN103514178A (zh) | 2012-06-18 | 2012-06-18 | 一种基于点击率的搜索排序方法及装置 |
TW101129969A TW201401089A (zh) | 2012-06-18 | 2012-08-17 | 基於點擊率的搜索排序方法及裝置 |
US13/919,820 US20130339350A1 (en) | 2012-06-18 | 2013-06-17 | Ranking Search Results Based on Click Through Rates |
PCT/US2013/046160 WO2013192101A1 (en) | 2012-06-18 | 2013-06-17 | Ranking search results based on click through rates |
EP13732785.4A EP2862105A1 (en) | 2012-06-18 | 2013-06-17 | Ranking search results based on click through rates |
JP2015517480A JP6211605B2 (ja) | 2012-06-18 | 2013-06-17 | クリックスルー率に基づく検索結果の順位付け |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210206502.0A CN103514178A (zh) | 2012-06-18 | 2012-06-18 | 一种基于点击率的搜索排序方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103514178A true CN103514178A (zh) | 2014-01-15 |
Family
ID=48703927
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210206502.0A Pending CN103514178A (zh) | 2012-06-18 | 2012-06-18 | 一种基于点击率的搜索排序方法及装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20130339350A1 (zh) |
EP (1) | EP2862105A1 (zh) |
JP (1) | JP6211605B2 (zh) |
CN (1) | CN103514178A (zh) |
TW (1) | TW201401089A (zh) |
WO (1) | WO2013192101A1 (zh) |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104699846A (zh) * | 2015-03-31 | 2015-06-10 | 北京奇虎科技有限公司 | 相关性可改善的搜索词的识别方法及装置 |
CN105095625A (zh) * | 2014-05-14 | 2015-11-25 | 阿里巴巴集团控股有限公司 | 点击率预估模型建立方法、装置及信息提供方法、*** |
CN105117491A (zh) * | 2015-09-22 | 2015-12-02 | 北京百度网讯科技有限公司 | 页面推送方法和装置 |
CN105320724A (zh) * | 2014-05-30 | 2016-02-10 | 邻客音公司 | 用于优化用于学习排序的非凸函数的新探索 |
CN105447045A (zh) * | 2014-09-02 | 2016-03-30 | 阿里巴巴集团控股有限公司 | 信息排序方法、装置及信息提供方法、*** |
CN105740276A (zh) * | 2014-12-10 | 2016-07-06 | 深圳市腾讯计算机***有限公司 | 适用于商业化搜索的点击反馈模型的估算方法和装置 |
CN105808541A (zh) * | 2014-12-29 | 2016-07-27 | 阿里巴巴集团控股有限公司 | 一种信息匹配处理方法和装置 |
CN106295832A (zh) * | 2015-05-12 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 产品信息推送方法及装置 |
CN106296254A (zh) * | 2015-06-09 | 2017-01-04 | 腾讯科技(深圳)有限公司 | 一种曝光行为数据的管理方法及装置 |
WO2017028728A1 (zh) * | 2015-08-18 | 2017-02-23 | 北京金山安全软件有限公司 | 点击到达率ctr的确定方法及装置 |
CN106682926A (zh) * | 2015-11-06 | 2017-05-17 | 北京奇虎科技有限公司 | 搜索广告的投放方法及装置 |
CN106708817A (zh) * | 2015-07-17 | 2017-05-24 | 腾讯科技(深圳)有限公司 | 信息搜索方法及装置 |
CN107153656A (zh) * | 2016-03-03 | 2017-09-12 | 阿里巴巴集团控股有限公司 | 一种信息搜索方法和装置 |
CN108335137A (zh) * | 2018-01-31 | 2018-07-27 | 北京三快在线科技有限公司 | 排序方法及装置、电子设备、计算机可读介质 |
CN108509499A (zh) * | 2018-02-27 | 2018-09-07 | 北京三快在线科技有限公司 | 一种搜索方法及装置,电子设备 |
CN109858942A (zh) * | 2018-11-06 | 2019-06-07 | 北京奇虎科技有限公司 | 推广信息展示方法、装置、电子设备及可读存储介质 |
CN109962983A (zh) * | 2019-03-29 | 2019-07-02 | 北京搜狗科技发展有限公司 | 一种点击率统计方法及装置 |
CN110019750A (zh) * | 2019-01-04 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 呈现两个以上标准文本问题的方法和装置 |
CN110309431A (zh) * | 2018-03-09 | 2019-10-08 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和电子设备 |
CN110674400A (zh) * | 2019-09-18 | 2020-01-10 | 北京字节跳动网络技术有限公司 | 排序方法、装置、电子设备及计算机可读存储介质 |
CN110706015A (zh) * | 2019-08-21 | 2020-01-17 | 北京大学(天津滨海)新一代信息技术研究院 | 一种面向广告点击率预测的特征选取方法 |
CN110737816A (zh) * | 2018-07-02 | 2020-01-31 | 北京三快在线科技有限公司 | 排序方法、装置、电子设备及可读存储介质 |
CN110909182A (zh) * | 2019-11-29 | 2020-03-24 | 北京达佳互联信息技术有限公司 | 多媒体资源搜索方法、装置、计算机设备及存储介质 |
CN111259272A (zh) * | 2020-01-14 | 2020-06-09 | 口口相传(北京)网络技术有限公司 | 搜索结果排序方法及装置 |
CN111597470A (zh) * | 2020-05-19 | 2020-08-28 | 北京字节跳动网络技术有限公司 | 一种搜索结果展示位置的确定方法及确定装置 |
CN111708944A (zh) * | 2020-06-17 | 2020-09-25 | 北京达佳互联信息技术有限公司 | 多媒体资源识别方法、装置、设备及存储介质 |
CN112019649A (zh) * | 2020-08-20 | 2020-12-01 | 北京明略昭辉科技有限公司 | Ip地址的校正方法及装置、***、存储介质、电子设备 |
CN112612951A (zh) * | 2020-12-17 | 2021-04-06 | 上海交通大学 | 一种面向收益提升的无偏学习排序方法 |
CN112966577A (zh) * | 2021-02-23 | 2021-06-15 | 北京三快在线科技有限公司 | 一种模型训练以及信息提供的方法及装置 |
CN113094604A (zh) * | 2021-04-15 | 2021-07-09 | 支付宝(杭州)信息技术有限公司 | 搜索结果排序方法、搜索方法及装置 |
CN113343130A (zh) * | 2021-06-15 | 2021-09-03 | 北京三快在线科技有限公司 | 一种模型训练的方法、信息展示的方法及装置 |
CN113536156A (zh) * | 2020-04-13 | 2021-10-22 | 百度在线网络技术(北京)有限公司 | 搜索结果排序方法、模型构建方法、装置、设备和介质 |
CN113724016A (zh) * | 2021-09-09 | 2021-11-30 | 北京有竹居网络技术有限公司 | 获取多媒体资源关注度的方法、装置、介质及设备 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9262532B2 (en) * | 2010-07-30 | 2016-02-16 | Yahoo! Inc. | Ranking entity facets using user-click feedback |
CN104052714B (zh) * | 2013-03-12 | 2019-02-26 | 腾讯科技(深圳)有限公司 | 多媒体信息的推送方法及服务器 |
CN104750713A (zh) * | 2013-12-27 | 2015-07-01 | 阿里巴巴集团控股有限公司 | 一种对搜索结果进行排序的方法及装置 |
RU2580516C2 (ru) | 2014-08-19 | 2016-04-10 | Общество С Ограниченной Ответственностью "Яндекс" | Способ формирования персонализированной модели ранжирования, способ формирования модели ранжирования, электронное устройство и сервер |
CN104462412A (zh) * | 2014-12-11 | 2015-03-25 | 北京国双科技有限公司 | 用于网络关键词投放的关键词检测方法和装置 |
CN105678335B (zh) * | 2016-01-08 | 2019-07-02 | 车智互联(北京)科技有限公司 | 预估点击率的方法、装置及计算设备 |
CN105678586B (zh) | 2016-01-12 | 2020-09-29 | 腾讯科技(深圳)有限公司 | 一种信息扶持方法和装置 |
CN106327266B (zh) * | 2016-08-30 | 2021-05-25 | 北京京东尚科信息技术有限公司 | 数据挖掘方法及装置 |
CN108021574A (zh) * | 2016-11-02 | 2018-05-11 | 北京酷我科技有限公司 | 一种搜索方法及装置 |
CN110147488B (zh) * | 2017-10-23 | 2023-05-16 | 腾讯科技(深圳)有限公司 | 页面内容的处理方法、处理装置、计算设备及存储介质 |
JP6476395B1 (ja) * | 2018-01-22 | 2019-03-06 | データ・サイエンティスト株式会社 | 検索語の評価装置、評価システム、及び評価方法 |
CN108390883B (zh) * | 2018-02-28 | 2020-08-04 | 武汉斗鱼网络科技有限公司 | 刷人气用户的识别方法、装置及终端设备 |
US11086865B2 (en) * | 2018-03-14 | 2021-08-10 | Colossio, Inc. | Sliding window pattern matching for large data sets |
CN110149540B (zh) * | 2018-04-27 | 2021-08-24 | 腾讯科技(深圳)有限公司 | 多媒体资源的推荐处理方法、装置、终端及可读介质 |
CN109558544B (zh) * | 2018-12-12 | 2021-04-27 | 拉扎斯网络科技(上海)有限公司 | 排序方法及装置、服务器和存储介质 |
CN110020206B (zh) * | 2019-04-12 | 2021-10-15 | 北京搜狗科技发展有限公司 | 一种搜索结果排序方法及装置 |
CN110209927B (zh) * | 2019-04-25 | 2020-12-04 | 北京三快在线科技有限公司 | 个性化推荐方法、装置、电子设备及可读存储介质 |
CN113595874B (zh) * | 2021-07-09 | 2023-03-24 | 北京百度网讯科技有限公司 | 即时通讯群组的搜索方法、装置、电子设备和存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060282328A1 (en) * | 2005-06-13 | 2006-12-14 | Gather Inc. | Computer method and apparatus for targeting advertising |
WO2007038714A2 (en) * | 2005-09-27 | 2007-04-05 | Looksmart, Ltd. | Collection and delivery of internet ads |
US20070156887A1 (en) * | 2005-12-30 | 2007-07-05 | Daniel Wright | Predicting ad quality |
US20090299855A1 (en) * | 2008-06-02 | 2009-12-03 | Microsoft Corporation | Predicting keyword monetization |
US20110015988A1 (en) * | 2005-12-30 | 2011-01-20 | Google Inc. | Using estimated ad qualities for ad filtering, ranking and promotion |
CN102073699A (zh) * | 2010-12-20 | 2011-05-25 | 百度在线网络技术(北京)有限公司 | 用于基于用户行为来改善搜索结果的方法、装置和设备 |
US20110258033A1 (en) * | 2010-04-15 | 2011-10-20 | Microsoft Corporation | Effective ad placement |
CN102339296A (zh) * | 2010-07-26 | 2012-02-01 | 阿里巴巴集团控股有限公司 | 一种查询结果的排序方法和装置 |
CN102346899A (zh) * | 2011-10-08 | 2012-02-08 | 亿赞普(北京)科技有限公司 | 一种基于用户行为的广告点击率预测方法和装置 |
TW201224972A (en) * | 2010-12-07 | 2012-06-16 | Alibaba Group Holding Ltd | Sorting method and apparatus of query results |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3925447B2 (ja) * | 2003-03-28 | 2007-06-06 | ブラザー工業株式会社 | 通信システム、通信装置、端末装置およびプログラム |
US7904337B2 (en) * | 2004-10-19 | 2011-03-08 | Steve Morsa | Match engine marketing |
US7743048B2 (en) * | 2004-10-29 | 2010-06-22 | Microsoft Corporation | System and method for providing a geographic search function |
US7788276B2 (en) * | 2007-08-22 | 2010-08-31 | Yahoo! Inc. | Predictive stemming for web search with statistical machine translation models |
US8229915B1 (en) * | 2007-10-08 | 2012-07-24 | Google Inc. | Content item arrangement |
US8311875B1 (en) * | 2007-10-30 | 2012-11-13 | Google Inc. | Content item location arrangement |
US8548925B2 (en) * | 2008-01-15 | 2013-10-01 | Apple Inc. | Monitoring capabilities for mobile electronic devices |
US20110191315A1 (en) * | 2010-02-04 | 2011-08-04 | Yahoo! Inc. | Method for reducing north ad impact in search advertising |
US20110196733A1 (en) * | 2010-02-05 | 2011-08-11 | Wei Li | Optimizing Advertisement Selection in Contextual Advertising Systems |
US8515980B2 (en) * | 2010-07-16 | 2013-08-20 | Ebay Inc. | Method and system for ranking search results based on categories |
US8364525B2 (en) * | 2010-11-30 | 2013-01-29 | Yahoo! Inc. | Using clicked slate driven click-through rate estimates in sponsored search |
US8527483B2 (en) * | 2011-02-04 | 2013-09-03 | Mikko VÄÄNÄNEN | Method and means for browsing by walking |
-
2012
- 2012-06-18 CN CN201210206502.0A patent/CN103514178A/zh active Pending
- 2012-08-17 TW TW101129969A patent/TW201401089A/zh unknown
-
2013
- 2013-06-17 WO PCT/US2013/046160 patent/WO2013192101A1/en active Application Filing
- 2013-06-17 US US13/919,820 patent/US20130339350A1/en not_active Abandoned
- 2013-06-17 EP EP13732785.4A patent/EP2862105A1/en not_active Ceased
- 2013-06-17 JP JP2015517480A patent/JP6211605B2/ja active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060282328A1 (en) * | 2005-06-13 | 2006-12-14 | Gather Inc. | Computer method and apparatus for targeting advertising |
WO2007038714A2 (en) * | 2005-09-27 | 2007-04-05 | Looksmart, Ltd. | Collection and delivery of internet ads |
US20070156887A1 (en) * | 2005-12-30 | 2007-07-05 | Daniel Wright | Predicting ad quality |
US20110015988A1 (en) * | 2005-12-30 | 2011-01-20 | Google Inc. | Using estimated ad qualities for ad filtering, ranking and promotion |
US20090299855A1 (en) * | 2008-06-02 | 2009-12-03 | Microsoft Corporation | Predicting keyword monetization |
US20110258033A1 (en) * | 2010-04-15 | 2011-10-20 | Microsoft Corporation | Effective ad placement |
CN102339296A (zh) * | 2010-07-26 | 2012-02-01 | 阿里巴巴集团控股有限公司 | 一种查询结果的排序方法和装置 |
TW201224972A (en) * | 2010-12-07 | 2012-06-16 | Alibaba Group Holding Ltd | Sorting method and apparatus of query results |
CN102073699A (zh) * | 2010-12-20 | 2011-05-25 | 百度在线网络技术(北京)有限公司 | 用于基于用户行为来改善搜索结果的方法、装置和设备 |
CN102346899A (zh) * | 2011-10-08 | 2012-02-08 | 亿赞普(北京)科技有限公司 | 一种基于用户行为的广告点击率预测方法和装置 |
Cited By (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095625B (zh) * | 2014-05-14 | 2018-12-25 | 阿里巴巴集团控股有限公司 | 点击率预估模型建立方法、装置及信息提供方法、*** |
CN105095625A (zh) * | 2014-05-14 | 2015-11-25 | 阿里巴巴集团控股有限公司 | 点击率预估模型建立方法、装置及信息提供方法、*** |
TWI677838B (zh) * | 2014-05-14 | 2019-11-21 | 香港商阿里巴巴集團服務有限公司 | 點擊率預估模型建立方法、裝置及資訊提供方法、系統 |
CN105320724A (zh) * | 2014-05-30 | 2016-02-10 | 邻客音公司 | 用于优化用于学习排序的非凸函数的新探索 |
CN105447045A (zh) * | 2014-09-02 | 2016-03-30 | 阿里巴巴集团控股有限公司 | 信息排序方法、装置及信息提供方法、*** |
CN105447045B (zh) * | 2014-09-02 | 2019-06-07 | 阿里巴巴集团控股有限公司 | 信息排序方法、装置及信息提供方法、*** |
CN105740276A (zh) * | 2014-12-10 | 2016-07-06 | 深圳市腾讯计算机***有限公司 | 适用于商业化搜索的点击反馈模型的估算方法和装置 |
CN105808541A (zh) * | 2014-12-29 | 2016-07-27 | 阿里巴巴集团控股有限公司 | 一种信息匹配处理方法和装置 |
CN105808541B (zh) * | 2014-12-29 | 2019-11-08 | 阿里巴巴集团控股有限公司 | 一种信息匹配处理方法和装置 |
CN104699846A (zh) * | 2015-03-31 | 2015-06-10 | 北京奇虎科技有限公司 | 相关性可改善的搜索词的识别方法及装置 |
CN106295832A (zh) * | 2015-05-12 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 产品信息推送方法及装置 |
CN106296254A (zh) * | 2015-06-09 | 2017-01-04 | 腾讯科技(深圳)有限公司 | 一种曝光行为数据的管理方法及装置 |
CN106296254B (zh) * | 2015-06-09 | 2021-06-25 | 腾讯科技(深圳)有限公司 | 一种曝光行为数据的管理方法及装置 |
CN106708817A (zh) * | 2015-07-17 | 2017-05-24 | 腾讯科技(深圳)有限公司 | 信息搜索方法及装置 |
CN106708817B (zh) * | 2015-07-17 | 2020-11-06 | 腾讯科技(深圳)有限公司 | 信息搜索方法及装置 |
WO2017028728A1 (zh) * | 2015-08-18 | 2017-02-23 | 北京金山安全软件有限公司 | 点击到达率ctr的确定方法及装置 |
CN105117491B (zh) * | 2015-09-22 | 2018-12-25 | 北京百度网讯科技有限公司 | 页面推送方法和装置 |
CN105117491A (zh) * | 2015-09-22 | 2015-12-02 | 北京百度网讯科技有限公司 | 页面推送方法和装置 |
CN106682926A (zh) * | 2015-11-06 | 2017-05-17 | 北京奇虎科技有限公司 | 搜索广告的投放方法及装置 |
CN107153656A (zh) * | 2016-03-03 | 2017-09-12 | 阿里巴巴集团控股有限公司 | 一种信息搜索方法和装置 |
CN107153656B (zh) * | 2016-03-03 | 2020-12-01 | 阿里巴巴集团控股有限公司 | 一种信息搜索方法和装置 |
CN108335137A (zh) * | 2018-01-31 | 2018-07-27 | 北京三快在线科技有限公司 | 排序方法及装置、电子设备、计算机可读介质 |
CN108509499A (zh) * | 2018-02-27 | 2018-09-07 | 北京三快在线科技有限公司 | 一种搜索方法及装置,电子设备 |
CN110309431A (zh) * | 2018-03-09 | 2019-10-08 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和电子设备 |
CN110737816A (zh) * | 2018-07-02 | 2020-01-31 | 北京三快在线科技有限公司 | 排序方法、装置、电子设备及可读存储介质 |
CN109858942B (zh) * | 2018-11-06 | 2023-12-15 | 三六零科技集团有限公司 | 推广信息展示方法、装置、电子设备及可读存储介质 |
CN109858942A (zh) * | 2018-11-06 | 2019-06-07 | 北京奇虎科技有限公司 | 推广信息展示方法、装置、电子设备及可读存储介质 |
CN110019750A (zh) * | 2019-01-04 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 呈现两个以上标准文本问题的方法和装置 |
CN109962983A (zh) * | 2019-03-29 | 2019-07-02 | 北京搜狗科技发展有限公司 | 一种点击率统计方法及装置 |
CN110706015A (zh) * | 2019-08-21 | 2020-01-17 | 北京大学(天津滨海)新一代信息技术研究院 | 一种面向广告点击率预测的特征选取方法 |
CN110706015B (zh) * | 2019-08-21 | 2023-06-13 | 北京大学(天津滨海)新一代信息技术研究院 | 一种面向广告点击率预测的特征选取方法 |
CN110674400A (zh) * | 2019-09-18 | 2020-01-10 | 北京字节跳动网络技术有限公司 | 排序方法、装置、电子设备及计算机可读存储介质 |
CN110674400B (zh) * | 2019-09-18 | 2022-05-10 | 北京字节跳动网络技术有限公司 | 排序方法、装置、电子设备及计算机可读存储介质 |
CN110909182A (zh) * | 2019-11-29 | 2020-03-24 | 北京达佳互联信息技术有限公司 | 多媒体资源搜索方法、装置、计算机设备及存储介质 |
CN111259272A (zh) * | 2020-01-14 | 2020-06-09 | 口口相传(北京)网络技术有限公司 | 搜索结果排序方法及装置 |
CN113536156B (zh) * | 2020-04-13 | 2024-05-28 | 百度在线网络技术(北京)有限公司 | 搜索结果排序方法、模型构建方法、装置、设备和介质 |
CN113536156A (zh) * | 2020-04-13 | 2021-10-22 | 百度在线网络技术(北京)有限公司 | 搜索结果排序方法、模型构建方法、装置、设备和介质 |
CN111597470A (zh) * | 2020-05-19 | 2020-08-28 | 北京字节跳动网络技术有限公司 | 一种搜索结果展示位置的确定方法及确定装置 |
CN111708944A (zh) * | 2020-06-17 | 2020-09-25 | 北京达佳互联信息技术有限公司 | 多媒体资源识别方法、装置、设备及存储介质 |
CN112019649A (zh) * | 2020-08-20 | 2020-12-01 | 北京明略昭辉科技有限公司 | Ip地址的校正方法及装置、***、存储介质、电子设备 |
CN112612951B (zh) * | 2020-12-17 | 2022-07-01 | 上海交通大学 | 一种面向收益提升的无偏学习排序方法 |
CN112612951A (zh) * | 2020-12-17 | 2021-04-06 | 上海交通大学 | 一种面向收益提升的无偏学习排序方法 |
CN112966577A (zh) * | 2021-02-23 | 2021-06-15 | 北京三快在线科技有限公司 | 一种模型训练以及信息提供的方法及装置 |
CN113094604A (zh) * | 2021-04-15 | 2021-07-09 | 支付宝(杭州)信息技术有限公司 | 搜索结果排序方法、搜索方法及装置 |
CN113343130A (zh) * | 2021-06-15 | 2021-09-03 | 北京三快在线科技有限公司 | 一种模型训练的方法、信息展示的方法及装置 |
CN113343130B (zh) * | 2021-06-15 | 2022-07-15 | 北京三快在线科技有限公司 | 一种模型训练的方法、信息展示的方法及装置 |
CN113724016A (zh) * | 2021-09-09 | 2021-11-30 | 北京有竹居网络技术有限公司 | 获取多媒体资源关注度的方法、装置、介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
JP2015537259A (ja) | 2015-12-24 |
TW201401089A (zh) | 2014-01-01 |
WO2013192101A1 (en) | 2013-12-27 |
JP6211605B2 (ja) | 2017-10-11 |
US20130339350A1 (en) | 2013-12-19 |
EP2862105A1 (en) | 2015-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103514178A (zh) | 一种基于点击率的搜索排序方法及装置 | |
CN102541862B (zh) | 跨网站的信息显示方法及*** | |
US9576251B2 (en) | Method and system for processing web activity data | |
CN102385601B (zh) | 一种产品信息的推荐方法及*** | |
CN103136683B (zh) | 计算产品参考价格的方法、装置及产品搜索方法、*** | |
CN106600372A (zh) | 一种基于用户行为的商品推荐方法及*** | |
US20120095802A1 (en) | System and methods for evaluating political, social, and economic risk associated with a geographic region | |
TW201437933A (zh) | 搜尋引擎的結果排序方法及系統 | |
CN106708821A (zh) | 基于用户个性化购物行为进行商品推荐的方法 | |
CN104239338A (zh) | 信息推荐方法及装置 | |
CN104281956A (zh) | 基于时间信息的适应用户兴趣变化的动态推荐方法 | |
CN104462611A (zh) | 信息排序模型的建模方法、排序方法及建模装置、排序装置 | |
CN104598450A (zh) | 一种网络舆情事件的热度分析方法及*** | |
CN102339448B (zh) | 团购平台信息处理方法及装置 | |
CN103309894B (zh) | 基于用户属性的搜索实现方法及*** | |
CN105786838A (zh) | 一种信息匹配处理方法和装置 | |
CN103885971A (zh) | 数据推送的方法及装置 | |
CN110134845A (zh) | 项目舆情监控方法、装置、计算机设备及存储介质 | |
CN104994424A (zh) | 一种构建音视频标准数据集的方法和装置 | |
CN105303447A (zh) | 利用网络信息进行信用评级的方法和*** | |
TW201828200A (zh) | 一種資料處理方法和裝置 | |
CN110852785A (zh) | 用户分级方法、装置及计算机可读存储介质 | |
CN115496523A (zh) | 一种广告发布方法、计算机可读存储介质和电子设备 | |
CN105359172A (zh) | 计算企业存在拖欠的概率 | |
CN103309885A (zh) | 一种在电子交易平台中识别特征用户的方法及装置和搜索方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1192029 Country of ref document: HK |
|
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140115 |
|
RJ01 | Rejection of invention patent application after publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: WD Ref document number: 1192029 Country of ref document: HK |