CN103176995B - 一种信息导航的方法、装置与*** - Google Patents

一种信息导航的方法、装置与*** Download PDF

Info

Publication number
CN103176995B
CN103176995B CN201110432357.3A CN201110432357A CN103176995B CN 103176995 B CN103176995 B CN 103176995B CN 201110432357 A CN201110432357 A CN 201110432357A CN 103176995 B CN103176995 B CN 103176995B
Authority
CN
China
Prior art keywords
attribute
property value
public
public attribute
query word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110432357.3A
Other languages
English (en)
Other versions
CN103176995A (zh
Inventor
潘春香
曾安祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201110432357.3A priority Critical patent/CN103176995B/zh
Publication of CN103176995A publication Critical patent/CN103176995A/zh
Priority to HK13109938.1A priority patent/HK1182793A1/zh
Application granted granted Critical
Publication of CN103176995B publication Critical patent/CN103176995B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供一种信息导航的方法、装置与***,包括:在进行信息导航时,不再局限于叶子类目下的属性信息,而是在确定客户端提供的查询词时,确定该查询词对应的至少一个公共属性,及每个所述公共属性对应的属性值,并将该查询词对应的公共属性及每个公共属性的属性值推送至客户端,从而解决现有技术存在的问题,并满足用户的内容筛选需求,降低筛选的复杂度。

Description

一种信息导航的方法、装置与***
技术领域
本申请涉及信息处理领域,尤其涉及一种信息导航的方法、装置与***。
背景技术
在信息处理领域,用户在客户端输入查询词,希望得到与输入的查询词相关的内容,导航服务器在获得客户端提供的查询词后,识别该用户的查询意图,向客户端提供与用户输入的查询词相关的信息,从而缩小用户的查询范围,使得用户可以根据导航服务器提供的相关的信息,尽快查找到所需的内容。
现有技术中,导航服务器向客户端提供与用户输入的查询词相关的信息包括以下三种方式:
方式一、以纯类目方式提供与用户输入的查询词相关的信息(以下简称纯类目导航),在纯类目导航方式下,根据用户输入的查询词,提供与该查询词相关的类目信息。所述类目是指商品的分类,有前台类目和后台类目之分。前台类目用于用户界面(UI,UserInterface)展示,后台类目用于商品管理,前台类目和后台类目的映射关系通过规则来描述。目前主流的类目体系以树状结构表示,每个父类目有多个子类目,但每个子类目只有一个父类目,自上而下类目表示的范围越来越小,其中,最上级的父类目(该父类目没有父类目)可以称为一级类目,最下级的子类目(该子类目没有子类目)可以称为叶子类目。纯类目导航最早是根据搜索类目下子类目商品数量进行类目推荐,随后发展为采用类目点击占比进行类目折叠,目前纯类目导航糅合商品数量、类目点击和购买等信息进行综合导航,展现方式也由单一的类目平铺转化成类目平铺与父子类目并存。
方式二、以纯属性方式提供与用户输入的查询词相关的信息(以下简称纯属性导航),在纯属性导航方式下,根据用户输入的查询词,提供与该查询词相关的属性信息。所述属性用于描述商品的特性,属性依附于叶子类目,即只有叶子类目才会具有属性。一个叶子类目可以有多种属性,一个属性可以有多个属性值。例如,品牌、材质、图案、价格等均为t恤(叶子类目)的属性,其中,针对品牌属性,“阿依莲”品牌为品牌属性的一个属性值,“Nike”品牌也是品牌属性的一个属性值。
由于属性依附于叶子类目,因此,只有在用户输入的查询词为一个叶子类目的关键词或者用户在客户端输入了查询词并选择了某个叶子类目时,导航服务器才会提供纯属性导航方式。纯属性导航的展现形式丰富多彩,可以以所见即所得的展现方式进行纯属性导航,且用户可以进行属性多选等操作。
方式三、以类目和属性方式提供与用户输入的查询词相关的信息(以下简称类目属性导航),在类目属性导航方式下,根据用户输入的查询词,不仅提供与该查询词相关的类目信息(非叶子类目),还提供与该查询词相关的属性信息。
相对于第一种和第二种导航方式,类目属性导航方式提供了多样化的相关信息,用户不仅可以根据类目属性导航方式提供的类目进行内容筛选,也可根据类目属性导航方式提供的属性进行内容筛选。
类目属性导航方式提供的类目是与查询词相关的至少一个类目,而由于属性依附于叶子类目,类目属性导航方式提供的一个属性属于所述至少一个类目中某个类目的一个叶子类目,使得用户在选择某个属性进行内容筛选时,使得筛选出的内容范围过小(仅针对一个类目的一个叶子类目),不能体现用户提供的查询词对应的较大的查询范围(所述至少一个类目),不能充分体现用户的查询意图,导致查询出的内容不全面,准确性较低。
并且,类目属性导航方式提供属性信息时,需要确定叶子类目的点击占比,设定一个叶子类目的点击占比达到阈值时,提供该叶子类目的属性信息给用户,此时,还存在阈值难以确定的问题。在设定的叶子类目的点击占比的阈值较高(一般为85%及以上)时,将使得很多叶子类目的点击不能满足该要求,无法提供足够多的属性信息,用户无法根据属性信息进行内容筛选,而如果设定的叶子类目的点击占比的阈值较低,将导致提供过多的属性信息,造成***的负荷较重,提供相关信息的速度较慢,以及用户筛选内容的复杂度增大。
发明内容
本申请实施例提供一种信息导航的方法、装置与***,用于解决现有的信息导航方法提供的属性信息不全面,以及难以确定叶子类目的点击占比阈值的问题。
一种信息导航的方法,所述方法包括:
导航服务器确定客户端提供的查询词;
导航服务器提取该查询词对应的至少一个公共属性,及每个所述公共属性对应的属性值;
导航服务器将提取出的公共属性和该公共属性对应的属性值推送至客户端。
一种信息导航的装置,所述装置包括:
确定模块,用于确定客户端提供的查询词;
第一提取模块,用于提取该查询词对应的至少一个公共属性,及每个所述公共属性对应的属性值;
推送模块,用于将提取出的公共属性和该公共属性对应的属性值推送至客户端。
一种信息导航的***,所述***包括客户端和导航服务器,其中:
客户端,用于向导航服务器提供查询词;
导航服务器,用于提取该查询词对应的至少一个公共属性,及每个所述公共属性对应的属性值,并将提取出的公共属性和该公共属性对应的属性值推送至客户端。
根据本申请实施例提供的方案,在进行信息导航时,不再局限于叶子类目下的属性信息,而是在确定客户端提供的查询词时,确定该查询词对应的至少一个公共属性,及每个所述公共属性对应的属性值,并将该查询词对应的公共属性及每个公共属性的属性值推送至客户端,从而解决现有技术存在的问题,并满足用户的内容筛选需求,降低筛选的复杂度。
附图说明
图1为本申请实施例一提供的信息导航的方法的步骤流程图;
图2为本申请实施例二提供的信息导航的方法的步骤流程图;
图3为本申请实施例三提供的信息导航的方法的步骤流程图;
图4为本申请实施例三提供的类目树的结构示意图;
图5为本申请实施例四提供的信息导航的装置的结构示意图;
图6为本申请实施例五提供的信息导航的***的结构示意图。
具体实施方式
现有技术提供的类目属性导航方式是展开某个类目下的属性,只是对展开类目的点击占比要求不同,并不能推荐不同类目的公共属性。另外,类目属性导航方式覆盖的查询词(query)较少,集中在主配件类型的query上,不能解决绝大部分属性筛选的需求。
本申请实施例提供的方案中,通过属性上提,推荐与query相关的且跨类目的属性组,每个属性组下面对应若干个属性值,并可以为需要属性筛选功能的宽泛类query同时提供类目和属性筛选入口。由于上提的属性是各相关类目的公有属性,满足了大众用户的筛选需求,缩短了用户的搜索路径。
下面通过说明书附图和各实施例对本申请方案进行说明。
实施例一、
本申请实施例一提供一种信息导航的方法,该方法的步骤流程如图1所示,包括:
步骤101、导航服务器确定客户端提供的查询词。
用户需要进行内容查询时,通过客户端输入与查询内容相关的查询词,在本步骤中,客户端向导航服务器提供该查询词,使得导航服务器可以确定客户端提供的查询词。
步骤102、导航服务器提取公共属性及公共属性对应的属性值。
在本步骤中,导航服务器提取该查询词对应的至少一个公共属性,及每个所述公共属性对应的属性值。
由于后台类目的稳定性相对于前台类目较高,因此,在本实施例中,可以根据后台类目来提取公共属性及公共属性的属性值。
在本步骤中,导航服务器可以确定设定时长内,针对所述查询词的点击次数中,对每个后台叶子类目的点击次数;针对每个后台叶子类目,确定点击次数与针对所述查询词的点击次数的比值超过门限值(例如,所述门限值设定为80%)的后台叶子类目;针对每个点击次数与针对所述查询词的点击次数的比值超过门限值的后台叶子类目,确定该后台叶子类目的属性,当然,此时还可以进一步对确定出的属性的合法性进行验证,并对通过合法性验证的属性执行后续操作;
可以根据以下两种方式中的至少一种,来提取公共属性及公共属性的属性值:
方式一、通过取交集的方式确定公共属性。
根据属性的标识,取确定出的属性的交集,例如,确定出5个点击次数与针对所述查询词的点击次数的比值超过门限值的后台叶子类目,分别为后台叶子类目1、后台叶子类目2、后台叶子类目3、后台叶子类目4和后台叶子类目5,后台叶子类目1对应属性标识为PID1、PID2、PID3、PID5的4个属性,后台叶子类目2对应属性标识为PID1、PID3、PID5、PID7的4个属性,后台叶子类目3对应属性标识为PID1、PID2、PID5、PID9、PID10的5个属性,后台叶子类目4对应属性标识为PID1、PID11、PID13的3个属性,后台叶子类目5对应属性标识为PID1、PID15、PID16、PID17、PID18、PID19的6个属性,则取属性的交集可以得到属性标识为“PID1”的属性。
并可以将所述交集中的每个属性作为确定出的一个公共属性,将该属性的属性值作为该公共属性的属性值,当然,也可以对每个属性值进行合法性验证,并将通过合法性验证的属性值作为该公共属性的属性值。
方式二、通过取并集的方式确定公共属性。
由于本实施例中确定针对查询词的公共属性,该公共属性是跨类目的,因此,可能导致各类目下标识不同的属性,具有相同的意义,因此,在本实施例中,还提供了一种根据属性名来确定公共属性的方式。
具体的,可以确定具有相同属性名的属性,并将具有相同属性名的属性合并为一个公共属性,而由于具有相同属性名的属性的属性值可能不相同,可以将所述具有相同属性名的属性的属性值的并集作为合并后的该公共属性的属性值,当然,在方式二中,也可以对每个属性值进行合法性验证,并将通过合法性验证的属性值作为该公共属性的属性值。
例如,确定出5个点击次数与针对所述查询词的点击次数的比值超过门限值的后台叶子类目,分别为后台叶子类目1、后台叶子类目2、后台叶子类目3、后台叶子类目4和后台叶子类目5,其中:
后台叶子类目1对应属性名为PIDVID1、PIDVID2、PIDVID3、PIDVID5的4个属性;
后台叶子类目2对应属性名为PIDVID1、PIDVID3、PIDVID5、PIDVID7的4个属性;
后台叶子类目3对应属性名为PIDVID1、PIDVID2、PIDVID5、PIDVID9、PIDVID10的5个属性;
后台叶子类目4对应属性名为PIDVID1、PIDVID11、PIDVID13的3个属性;
后台叶子类目5对应属性名为PIDVID1、PIDVID15、PIDVID16、PIDVID17、PIDVID18、PIDVID19的6个属性;
则可以将具有相同属性名“PIDVID1”的属性合并为一个公共属性,并可以将后台叶子类目1、后台叶子类目2、后台叶子类目3、后台叶子类目4和后台叶子类目5分别对应的属性名为“PIDVID1”的属性的属性值的并集作为合并后的公共属性的属性值。
在通过方式一和/或方式二提取出公共属性及公共属性的属性值之后,还可以进一步对提取出的公共属性进行筛选:
由于用户是根据前台类目来选择查询内容,因此,可以进一步根据前台类目和后台类目的映射规则,确定通过方式一或方式二得到的公共属性(此时,可以将该公共属性视为第一属性)是否属于前台叶子类目的属性,且仅在通过方式一或方式二得到的第一属性属于前台叶子类目的属性时,才将通过方式一或方式二得到的第一属性确定为公共属性,从而方便后续用户理解该公共属性,否则,不将通过方式一或方式二得到的第一属性确定为公共属性。
因此,可以针对每个确定出的第一属性,在确定该第一属性属于前台叶子类目的属性时,将该第一属性确定为一个公共属性,当然,此时可以将该第一属性的属性值作为该公共属性的属性值。
步骤103、导航服务器将提取出的公共属性和该公共属性对应的属性值推送至客户端。
在本步骤中,将提取出的公共属性和该公共属性对应的属性值推送至客户端,可以具体包括:
按照设定时长内,针对所述查询词的点击次数中,对每个公共属性的点击次数由高到低的顺序,选择排名前N位的公共属性,其中,N为正整数。例如,可以按照设定的一周之内,针对所述查询词的50次点击中,对公共属性1(属性标识为PID1)的点击为25次,对公共属性2(属性标识为PID2)的点击为20次,对公共属性3(属性标识为PID3)的点击为5次,按照点击次数由高到低的顺序选择排名前2位的公共属性依次为:公共属性1和公共属性2。其中,若公共属性是通过步骤102中的方式一确定的,则对公共属性的点击次数可以为点击次数与针对所述查询词的点击次数的比值超过门限值的每个后台叶子类目下对标识为该公共属性的标识的属性的点击次数之和,若公共属性是通过步骤102中的方式二确定的,则对公共属性的点击次数可以为点击次数与针对所述查询词的点击次数的比值超过门限值的每个后台叶子类目下对具有该公共属性的属性名的属性的点击次数之和。
针对每个选择出的公共属性,在该公共属性的属性值为离散数值类型时,确定对该公共属性的点击次数中每个属性值的点击次数,按照每个属性值的点击次数由高到低的顺序,选择排名前M位的属性值,其中,M为正整数。例如,针对标识为PID1的选择出的公共属性,对应的3个属性值分别为:PIDVID1,PIDVID3,PIDVID7,在对PID1的25次点击中,对PIDVID1、PIDVID3和PIDVID7的点击次数分别为5次、12次和8次,则按照点击次数由高到低的顺序选择排名前3位的属性值依次为:PIDVID3、PIDVID7和PIDVID1。在该公共属性的属性值为连续数值类型时,按照属性值由大到小或由小到大的顺序进行排列,例如,针对标识为PID2的选择出的公共属性,对应的6个属性值分别为:39,38,37,36,35,34,则可以得到排序后的属性值为39,38,37,36,35,34或者为34,35,36,37,38,39。
将选择出的排名前N位的公共属性和针对每个公共属性,选择出的排名前M位的属性值,或者由大到小或由小到大的顺序排列后的属性值推送至客户端,具体的,可以按照公共属性1,PIDVID3、PIDVID7,PIDVID1;公共属性2,39,38,37,36,35,34的格式,将选择出的公共属性(排名前2位)和该公共属性的属性值推送至客户端。
在进行导航信息(提取出的公共属性和公共属性对应的属性值)的显示时,可以用一栏显示导航信息,一栏显示与查询词对应的每一条数据,将导航信息和与查询词对应的每一条数据分两栏显示,从而使得显示界面更加清楚简明,便于用户查看显示界面。
较优的,在步骤102之后,步骤103之前,将提取出的公共属性和该公共属性对应的属性值推送至客户端之前,还可以进一步确定预先选择的属性值,具体的,可以通过以下方法来确定预先选择的属性值:
步骤103’、确定预先选择的属性值。
将提取出的每个公共属性对应的属性值与所述查询词进行文本匹配或同义词匹配,将与所述查询词匹配出的属性值作为预先选择的属性值。
则此时,在步骤103中,导航服务器将提取出的公共属性和该公共属性对应的属性值推送至客户端,具体包括:将所述预先选择的属性值优先推送至客户端。
进一步的,在步骤103’之后,步骤103之前,还可以进一步根据预先选择的属性值确定预先选择的公共属性,具体的,可以通过以下方法来确定预先选择的公共属性:
步骤103”、确定预先选择的公共属性。
针对每个预先选择的属性值,根据针对所述查询词,该预先选择的属性值属于每个公共属性的预测权值(所述预测权值可以通过现有方法获得,例如,可以根据在100条数据标题包含“N97”的数据中,有90条数据的品牌属性包括“诺基亚”,将查询词“N97”对应的属性值“诺基亚”的品牌属性的预测权值设定为90%),确定该预先选择的属性值对应的公共属性,具体的,可以确定该预先选择的属性值属于每个公共属性的预测权值中最高的一个预测权值,并将该与预测权值对应的公共属性作为确定出的公共属性,并可以将确定出的公共属性作为该预先选择的属性值对应的预先选择的公共属性。
则此时,在步骤103中,导航服务器将提取出的公共属性和该公共属性对应的属性值推送至客户端,具体包括:将每个预先选择的属性值与该预先选择的属性值对应的预先选择的公共属性优先推送至客户端。
当然,本实施例还可以进一步包括步骤101’,步骤101’可以在步骤101之后,步骤103之前执行,不限于如图1所示在步骤101之后,步骤102之前执行:
步骤101’、导航服务器确定与该查询词相关度高于设定值的类目信息。
确定与该查询词相关度高于设定值的类目信息的方法与现有技术相同,例如,在针对该查询词的点击次数中,将点击次数超过设定次数的类目确定为与该查询词相关度高于设定值的类目,并可以确定该类目对应的类目名、类目标识等类目信息。
则此时,在步骤103中,导航服务器将提取出的公共属性和该公共属性对应的属性值推送至客户端,可以具体包括:导航服务器将提取出的公共属性、该公共属性对应的属性值以及所述与该查询词相关度高于设定值的类目信息推送至客户端。从而不仅向用户提供与查询词相关的公共属性信息,还进一步提供与该查询词相关的类目信息,使得后续用户不但可以根据属性信息进行内容(数据)筛选,还可以根据类目信息进行内容筛选,进一步提高用户进行内容筛选的精度。
如果用户需要进行内容查询时,不仅通过客户端输入与查询内容相关的查询词,还进一步通过客户端提供了与该查询词对应的至少一个非叶子类目,则在步骤101之后,步骤102之前,还进一步包括步骤102’,步骤102’不限于如图1所示,在步骤101’之后,步骤102之前执行:
步骤102’、导航服务器确定客户端提供的至少一个非叶子类目。
当然所述至少一个非叶子类目也可以不通过客户端提供,而是通过导航服务器根据所述查询词预测出的该查询词对应的至少一个非叶子类目。
则此时,在步骤102中,导航服务器提取该查询词对应的至少一个公共属性,及每个所述公共属性对应的属性值,具体包括:
针对每个非叶子类目,确定该非叶子类目对应的叶子类目中的每个属性,具体的,可以确定该非叶子类目对应的叶子类目中的每个合法属性(有效属性),并可以确定该非叶子类目对应的第二属性,所述第二属性可以是通过对具有相同属性标识的属性进行合并得到的,且每个第二属性的属性值为用于合并为该第二属性的属性的属性值。针对每个第二属性,可以确定具有该第二属性的数据条数,该数据条数为用于合并为该第二属性的属性对应的数据条数之和。
进一步的,可以确定具有该第二属性的叶子类目的数量与该非叶子类目下类目总数量的第一比值,以及确定具有该第二属性的数据条数与该非叶子类目下数据总条数的第二比值,在所述第一比值不小于第一设定值且所述第二比值不小于第二设定值时,将该第二属性确定为提取出的公共属性,并将该第二属性对应的属性值确定为该公共属性对应的属性值,或者,确定具有该第二属性的数据条数与该非叶子类目下数据总条数的第二比值,在所述第二比值不小于第三设定值时,将该第二属性确定为提取出的公共属性,并将该第二属性对应的属性值确定为该公共属性对应的属性值,具体的,也可以将该第二属性对应的合法属性值确定为该公共属性对应的属性值。
在步骤103中,导航服务器将提取出的公共属性和该公共属性对应的属性值推送至客户端,可以具体包括:
针对每个提取出的公共属性,确定设定时长内针对所述查询词的点击次数中,对该公共属性的点击次数,确定对该公共属性的点击次数与针对所述查询词的点击次数的比值,并在该比值不小于设定阈值时,将该公共属性和该公共属性对应的属性值推送至客户端。
下面通过两个具体的例子,对本申请实施例一中涉及的提取公共属性的方案进行详细说明。
实施例二、
本申请实施例二提供一种信息导航的方法,针对导航服务器确定了客户端提供的查询词的情况,主要对提取公共属性的过程进行说明。该方法的步骤流程如图2所示,具体包括以下步骤:
步骤201、确定后台叶子类目的点击分布。
具体的,在本步骤中,可以根据数据点击日志(用于记录每一条数据的点击情况)获得每个后台叶子类目的点击次数,从而可以获得针对查询词的点击中,在后台叶子类目中的点击分布。例如,每个后台叶子类目的标识用cat表示,每个后台叶子类目的点击次数用n表示,查询词用query表示,则可以得到如下表达式:
querycat1:n1;cat2:n2;......
步骤202、确定属性的点击分布。
具体的,在本步骤中,可以根据导航点击日志(用于记录导航信息的点击情况)获得每个后台叶子类目下每个属性的点击次数,从而可以获得针对查询词的点击中,在每个属性中的点击分布。例如,每个属性的标识用pid表示,每个后台叶子类目的点击次数用m表示,查询词用query表示,则可以得到如下表达式:
querypid1:m1;pid2:m2;......
步骤203、提取属性值属于每个属性的预测权值。
在本步骤中,可以提取预先获得的属性值属于每个属性的预测权值,用于后续确定属性值属于每个公共属性的预测权值。
需要说明的是,在本实施例中,步骤201、步骤202和步骤203的执行不分先后。
步骤204、提取公共属性及公共属性对应的属性值。
在本步骤中,具体的,可以在步骤201的基础上,针对每个点击次数与针对所述查询词的点击次数的比值超过门限值的后台叶子类目,确定后台叶子类目的属性,并可以按照实施例一中步骤102中的方式一,根据属性的标识,取确定出的属性的交集,并可以将所述交集中的每个属性作为确定出的一个第一属性。
此时,所述第一属性可以作为提取出的公共属性,但为了方便用户的后续查看,进一步的,对利用方式一确定出的第一属性进行筛选,具体的,可以确定通过方式一确定出的第一属性是否属于前台叶子类目的属性,将属于前台叶子类目的属性的第一属性确定为第三属性,并可以将该第一属性的属性值确定为该第三属性的属性值。
此时,所述第三属性可以作为提取出的公共属性,但为了保证确定出的公共属性的全面性,在本实施例中,更进一步的,还可以利用实施例一中步骤102中的方式二继续确定公共属性。具体的,针对每个点击次数与针对所述查询词的点击次数的比值超过门限值的后台叶子类目对应的叶子类目的属性,可以将具有相同属性名的属性合并为一个公共属性,并可以将所述具有相同属性名的属性的属性值的并集作为合并后的该公共属性的属性值。
步骤205、确定预先选择的属性值。
具体的,可以将能够与所述查询词实现文本匹配或同义词匹配的属性值确定为预先选择的属性值。
步骤206、确定预先选择的公共属性。
在本步骤中,可以在步骤203的基础上,针对每个预先选择的属性值,根据该预先选择的属性值属于每个公共属性的预测权值,具体的,若公共属性是通过步骤102中的方式一确定的,则该预先选择的属性值属于每个公共属性的预测权值为,点击次数与针对所述查询词的点击次数的比值超过门限值的每个后台叶子类目下,该预先选择的属性值属于标识与该公共属性的标识相同的属性的预测权值之和,若公共属性是通过步骤102中的方式二确定的,则该预先选择的属性值属于每个公共属性的预测权值为,点击次数与针对所述查询词的点击次数的比值超过门限值的每个后台叶子类目下,该预先选择的属性值属于属性名为该公共属性的属性名的属性的预测权值之和。确定该预先选择的属性值对应的公共属性,将确定出的公共属性作为该预先选择的属性值对应的预先选择的公共属性。
步骤207、导航服务器推送每个公共属性和该公共属性对应的属性值。
具体的,在本步骤中,可以将每个预先选择的属性值与该预先选择的属性值对应的预先选择的公共属性优先推送至客户端。
并可以在步骤202的基础上,除了每个预先选择的属性值与该预先选择的属性值对应的预先选择的公共属性之外,将选择出的排名前N位的公共属性和针对每个公共属性,选择出的排名前M位的属性值,或者由大到小或由小到大的顺序排列后的属性值推送至客户端。
实施例三、
本申请实施例三提供一种信息导航的方法,针对导航服务器确定了客户端提供的查询词、以及至少一个非叶子类目(该非叶子类目为前台非叶子类目)的情况,主要对提取公共属性的过程进行说明。下面针对用户提供的一个非叶子类目进行说明。该方法的步骤流程如图3所示,具体包括以下步骤:
步骤301、确定对应的数据条数。
在本步骤中,可以根据前台类目列表,确定该非叶子类目对应的前台叶子类目中的每个属性,并可以根据每条数据对应的前台类目路径字段,针对每个属性,确定具有该属性的数据条数,具体的,可以确定该属性的属性标识对应的数据条数,并可以针对每个类目,确定属于该类目的数据条数。
步骤302、构建类目树。
在本步骤中,可以根据前台类目列表,构建类目树,构建的类目树可以如图4所示,其中,女装类目表示所述非叶子类目,该非叶子类目对应连衣裙、T恤和裤子3个叶子类目。
并可以在所述类目树的结点中记录每个类目下的数据条数,并记录每个非叶子类目对应的第一属性,该第一属性可以通过合并该非叶子类目下具有相同属性标识的属性获得,且该第一属性的属性值与用于合并为该第一属性的属性的属性值相同,以及每个第一属性对应的数据条数,该数据条数为用于合并为该第一属性的具有相同属性标识的属性对应的数据条数之和。
步骤303、提取公共属性及公共属性对应的属性值。
在本步骤中,根据构建的类目树,针对该非叶子类目下的每个第一属性,确定该第一属性是否为公共属性。可以针对该非叶子类目下的每个第一属性,确定具有该第一属性的叶子类目数量(具体的,可以为确定该第一属性的属性标识对应的叶子类目数量)与该非叶子类目下类目总数量的第一比值,例如,在如图4所示的类目树中,针对女装类目下的“棉质”第一属性,当具有该第一属性的叶子类目数量为2时,由于女装类目下类目总数量为3,则“棉质”第一属性对应的第一比值为0.5。
在本步骤中,还可以确定具有该第一属性的数据条数与该非叶子类目下数据总条数的第二比值,具体的,可以确定具有“棉质”第一属性的数据条数,并确定该数据条数与女装类目下数据总条数的第二比值。
可以在第一比值不小于第一设定值(类目占比阈值,可以设定用α表示)且第二比值不小于第二设定值(可以设定取值为0.1)时,或者在第二比值不小于第三设定值(数据条数占比阈值,可以设定用β表示)时,将该第一属性确定为提取出的公共属性,并将该第一属性对应的属性值确定为该公共属性对应的属性值。
步骤304、确定预先选择的属性值。
具体的,可以将能够与所述查询词实现文本匹配或同义词匹配的属性值确定为预先选择的属性值。
步骤305、确定预先选择的公共属性。
针对每个预先选择的属性值,可以根据提取出的预先获得的属性值属于每个属性的预测权值,确定该预先选择的属性值属于每个公共属性的预测权值,具体的,该预先选择的属性值属于每个公共属性的预测权值为,在该非叶子类目下,该预先选择的属性值属于标识与该公共属性的标识相同的属性的预测权值之和。
确定该预先选择的属性值对应的公共属性,将确定出的公共属性作为该预先选择的属性值对应的预先选择的公共属性。
步骤306、导航服务器将提取出的公共属性和该公共属性对应的属性值推送至客户端。
针对每个提取出的公共属性,可以确定设定时长内针对所述查询词的点击次数中,对该公共属性的点击次数,并确定对该公共属性的点击次数与针对所述查询词的点击次数的比值,在该比值不小于设定阈值时,将该公共属性和该公共属性对应的属性值推送至客户端。从而可以选择性地推送该公共属性和该公共属性对应的属性值,减轻***的负荷。
根据本申请实施例一~实施例三提供的方案,不仅可以针对查询词提供跨类目的属性(公共属性)信息给用户,还可以在提供跨类目的属性信息的同时,提供与该查询词相关的类目信息,从而实现提供的信息的多样化。在提供属性信息时,还可以将预先选择的属性和预先选择的属性值优先推送给用户,进一步减少用户的筛选复杂度,简化用户的操作流程,并可以按照与查询词的相关程度来提供设定数量的属性和属性值,从而在减轻***负荷的同时,提供相关性较高的属性信息给用户。另外,在用户提供查询词的同时,进一步提供了类目信息时,可以结合该类目信息确定属性信息,从而提高确定出的属性信息的精度,进一步细化确定出的属性信息。
与本申请实施例一~实施例三基于同一发明构思,提供以下的装置和***。
实施例四、
本申请实施例四提供一种信息导航的装置,该装置的结构如图5所示,包括:
确定模块11用于确定客户端提供的查询词;第一提取模块12用于提取该查询词对应的至少一个公共属性,及每个所述公共属性对应的属性值;推送模块13用于将提取出的公共属性和该公共属性对应的属性值推送至客户端。
所述第一提取模块12包括:
第一子模块121用于确定设定时长内,点击次数与针对所述查询词的点击次数的比值超过门限值的后台叶子类目,确定每个确定出的后台叶子类目的属性;
第二子模块122用于根据属性的标识,取确定出的属性的交集,将所述交集中的每个属性作为确定出的一个第一属性,将该属性的属性值作为该第一属性的属性值,和/或,确定具有相同属性名的属性,并将具有相同属性名的属性合并为一个第一属性,将所述具有相同属性名的属性的属性值的并集作为合并后的该第一属性的属性值;
第三子模块123用于将每个确定出的第一属性确定为一个公共属性,或者,针对每个确定出的第一属性,在确定该第一属性属于前台叶子类目的属性时,将该第一属性确定为一个公共属性。
所述确定模块11还用于确定客户端提供的至少一个非叶子类目;
所述第一提取模块12还可以包括第四子模块124和第五子模块125,其中:
第四子模块124用于确定每个非叶子类目对应的第二属性,所述第二属性是通过对该非叶子类目对应的叶子类目下具有相同属性标识的属性进行合并得到的,且每个第二属性的属性值为用于合并为该第二属性的属性的属性值;
第五子模块125用于针对每个第二属性,确定具有该第二属性的叶子类目的数量与该非叶子类目下类目总数量的第一比值,以及确定具有该第二属性的数据条数与该非叶子类目下数据总条数的第二比值,在所述第一比值不小于第一设定值且所述第二比值不小于第二设定值时,将该第二属性确定为提取出的公共属性,并将该第二属性对应的属性值确定为该公共属性对应的属性值,或者,在所述第二比值不小于第三设定值时,将该第二属性确定为提取出的公共属性,并将该第二属性对应的属性值确定为该公共属性对应的属性值;
所述推送模块13具体用于针对每个提取出的公共属性,确定设定时长内针对所述查询词的点击次数中,对该公共属性的点击次数,并确定对该公共属性的点击次数与针对所述查询词的点击次数的比值,在该比值不小于设定阈值时,将该公共属性和该公共属性对应的属性值推送至客户端。
所述装置还包括第二提取模块14:
第二提取模块14用于确定与该查询词相关度高于设定值的类目信息;
所述推送模块13具体用于将所述第一提取单元提取出的公共属性、该公共属性对应的属性值以及第二提取单元确定出的与该查询词相关度高于设定值的类目信息推送至客户端。
所述推送模块13具体用于按照设定时长内,针对所述查询词的点击次数中,对每个公共属性的点击次数由高到低的顺序,选择排名前N位的公共属性;针对每个选择出的公共属性,在该公共属性的属性值为离散数值类型时,确定对该公共属性的点击次数中每个属性值的点击次数,按照每个属性值的点击次数由高到低的顺序,选择排名前M位的属性值,在该公共属性的属性值为连续数值类型时,按照属性值由大到小或由小到大的顺序进行排列;将选择出的排名前N位的公共属性和针对每个公共属性,选择出的排名前M位的属性值,或者由大到小或由小到大的顺序排列后的属性值推送至客户端,其中,M,N均为正整数。
所述装置还包括匹配模块15和第一预选模块16,其中:
所述匹配模块15用于将提取出的每个公共属性对应的属性值与所述查询词进行文本匹配或同义词匹配;
所述第一预选模块16用于将所述匹配模块与所述查询词匹配出的属性值作为预先选择的属性值;
所述推送模块13具体用于将所述预选模块预先选择的属性值优先推送至客户端。
所述装置还包括第二预选模块17:
所述第二预选模块17用于针对每个所述第一预选模块预先选择的属性值,根据针对所述查询词,该预先选择的属性值属于每个公共属性的预测权值,确定该预先选择的属性值对应的公共属性,将确定出的公共属性作为该预先选择的属性值对应的预先选择的公共属性;
所述推送模块13具体用于将每个预先选择的属性值与该预先选择的属性值对应的预先选择的公共属性优先推送至客户端。
实施例五、
本申请实施例五提供一种信息导航的***,该***的结构如图6所示,包括客户端21和导航服务器22,其中:
客户端21用于向导航服务器提供查询词;
导航服务器22用于提取该查询词对应的至少一个公共属性,及每个所述公共属性对应的属性值,并将提取出的公共属性和该公共属性对应的属性值推送至客户端。
其中,所述导航服务器22即为本申请实施例二中的信息导航的装置,可以与该装置具有相同的模块,并具有相应的功能,在此不再赘述。
在本申请各实施例提供的方案中,由于日志数据量巨大,整个方案可以利用云计算平台实现,并可以通过阿帕奇(apache)框架提供实时查询服务。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (8)

1.一种信息导航的方法,其特征在于,所述方法包括:
导航服务器确定客户端提供的查询词;
导航服务器提取该查询词对应的至少一个公共属性,及每个所述公共属性对应的属性值,其中,在导航服务器提取该查询词对应的公共属性时,具体包括,导航服务器确定设定时长内,点击次数与针对所述查询词的点击次数的比值超过门限值的后台叶子类目;确定每个确定出的后台叶子类目的属性;根据属性的标识,取确定出的属性的交集,将所述交集中的每个属性作为确定出的一个第一属性,将该属性的属性值作为该第一属性的属性值;和/或,确定具有相同属性名的属性,并将具有相同属性名的属性合并为一个第一属性,将所述具有相同属性名的属性的属性值的并集作为合并后的该第一属性的属性值;将每个确定出的第一属性确定为一个公共属性,或者,针对每个确定出的第一属性,在确定该第一属性属于前台叶子类目的属性时,将该第一属性确定为一个公共属性;
导航服务器将提取出的公共属性和该公共属性对应的属性值推送至客户端。
2.如权利要求1所述的方法,其特征在于,导航服务器确定客户端提供的查询词之后,导航服务器提取该查询词对应的至少一个公共属性,及每个所述公共属性对应的属性值之前,所述方法还包括:
导航服务器确定客户端提供的至少一个非叶子类目;
导航服务器提取该查询词对应的至少一个公共属性,及每个所述公共属性对应的属性值,具体包括:
确定每个非叶子类目对应的第二属性,所述第二属性是通过对该非叶子类目对应的叶子类目下具有相同属性标识的属性进行合并得到的,且每个第二属性的属性值为用于合并为该第二属性的属性的属性值;
针对每个第二属性,确定具有该第二属性的叶子类目的数量与该非叶子类目下类目总数量的第一比值,以及确定具有该第二属性的数据条数与该非叶子类目下数据总条数的第二比值,在所述第一比值不小于第一设定值且所述第二比值不小于第二设定值时,将该第二属性确定为提取出的公共属性,并将该第二属性对应的属性值确定为该公共属性对应的属性值,或者,在所述第二比值不小于第三设定值时,将该第二属性确定为提取出的公共属性,并将该第二属性对应的属性值确定为该公共属性对应的属性值;
导航服务器将提取出的公共属性和该公共属性对应的属性值推送至客户端,具体包括:
针对每个提取出的公共属性,确定设定时长内针对所述查询词的点击次数中,对该公共属性的点击次数;
确定对该公共属性的点击次数与针对所述查询词的点击次数的比值;
在该比值不小于设定阈值时,将该公共属性和该公共属性对应的属性值推送至客户端。
3.如权利要求1所述的方法,其特征在于,导航服务器确定客户端提供的查询词之后,导航服务器将提取出的公共属性和该公共属性对应的属性值推送至客户端之前,所述方法还包括:
导航服务器确定与该查询词相关度高于设定值的类目信息;
导航服务器将提取出的公共属性和该公共属性对应的属性值推送至客户端,具体包括:
导航服务器将提取出的公共属性、该公共属性对应的属性值以及所述与该查询词相关度高于设定值的类目信息推送至客户端。
4.如权利要求1所述的方法,其特征在于,导航服务器将提取出的公共属性和该公共属性对应的属性值推送至客户端,具体包括:
按照设定时长内,针对所述查询词的点击次数中,对每个公共属性的点击次数由高到低的顺序,选择排名前N位的公共属性;
针对每个选择出的公共属性,在该公共属性的属性值为离散数值类型时,确定对该公共属性的点击次数中每个属性值的点击次数,按照每个属性值的点击次数由高到低的顺序,选择排名前M位的属性值;在该公共属性的属性值为连续数值类型时,按照属性值由大到小或由小到大的顺序进行排列;
将选择出的排名前N位的公共属性和针对每个公共属性,选择出的排名前M位的属性值,或者由大到小或由小到大的顺序排列后的属性值推送至客户端;
其中,M,N均为正整数。
5.如权利要求1~4任一所述的方法,其特征在于,导航服务器提取该查询词对应的至少一个公共属性,及每个所述公共属性对应的属性值之后,导航服务器将提取出的公共属性和该公共属性对应的属性值推送至客户端之前,所述方法还包括:
将提取出的每个公共属性对应的属性值与所述查询词进行文本匹配或同义词匹配;
将与所述查询词匹配出的属性值作为预先选择的属性值;
导航服务器将提取出的公共属性和该公共属性对应的属性值推送至客户端,具体包括:
将所述预先选择的属性值优先推送至客户端。
6.如权利要求5所述的方法,其特征在于,将与所述查询词匹配出的属性值作为预先选择的属性值之后,导航服务器将提取出的公共属性和该公共属性对应的属性值推送至客户端之前,所述方法还包括:
针对每个预先选择的属性值,根据针对所述查询词,该预先选择的属性值属于每个公共属性的预测权值,确定该预先选择的属性值对应的公共属性;
将确定出的公共属性作为该预先选择的属性值对应的预先选择的公共属性;
导航服务器将提取出的公共属性和该公共属性对应的属性值推送至客户端,具体包括:
将每个预先选择的属性值与该预先选择的属性值对应的预先选择的公共属性优先推送至客户端。
7.一种信息导航的装置,其特征在于,所述装置包括:
确定模块,用于确定客户端提供的查询词;
第一提取模块,用于提取该查询词对应的至少一个公共属性,及每个所述公共属性对应的属性值,其中,第一提取模块具体包括,第一子模块,用于确定设定时长内,点击次数与针对所述查询词的点击次数的比值超过门限值的后台叶子类目,确定每个确定出的后台叶子类目的属性;第二子模块,用于根据属性的标识,取确定出的属性的交集,将所述交集中的每个属性作为确定出的一个第一属性,将该属性的属性值作为该第一属性的属性值,和/或,确定具有相同属性名的属性,并将具有相同属性名的属性合并为一个第一属性,将所述具有相同属性名的属性的属性值的并集作为合并后的该第一属性的属性值;第三子模块,用于将每个确定出的第一属性确定为一个公共属性,或者,针对每个确定出的第一属性,在确定该第一属性属于前台叶子类目的属性时,将该第一属性确定为一个公共属性;
推送模块,用于将提取出的公共属性和该公共属性对应的属性值推送至客户端。
8.一种信息导航的***,其特征在于,所述***包括客户端和导航服务器,其中:
客户端,用于向导航服务器提供查询词;
导航服务器,用于提取该查询词对应的至少一个公共属性,及每个所述公共属性对应的属性值,并将提取出的公共属性和该公共属性对应的属性值推送至客户端,其中,在提取该查询词对应的公共属性时,具体用于,导航服务器确定设定时长内,点击次数与针对所述查询词的点击次数的比值超过门限值的后台叶子类目;确定每个确定出的后台叶子类目的属性;根据属性的标识,取确定出的属性的交集,将所述交集中的每个属性作为确定出的一个第一属性,将该属性的属性值作为该第一属性的属性值;和/或,确定具有相同属性名的属性,并将具有相同属性名的属性合并为一个第一属性,将所述具有相同属性名的属性的属性值的并集作为合并后的该第一属性的属性值;将每个确定出的第一属性确定为一个公共属性,或者,针对每个确定出的第一属性,在确定该第一属性属于前台叶子类目的属性时,将该第一属性确定为一个公共属性。
CN201110432357.3A 2011-12-21 2011-12-21 一种信息导航的方法、装置与*** Active CN103176995B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201110432357.3A CN103176995B (zh) 2011-12-21 2011-12-21 一种信息导航的方法、装置与***
HK13109938.1A HK1182793A1 (zh) 2011-12-21 2013-08-26 種信息導航的方法、裝置與系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110432357.3A CN103176995B (zh) 2011-12-21 2011-12-21 一种信息导航的方法、装置与***

Publications (2)

Publication Number Publication Date
CN103176995A CN103176995A (zh) 2013-06-26
CN103176995B true CN103176995B (zh) 2016-04-06

Family

ID=48636876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110432357.3A Active CN103176995B (zh) 2011-12-21 2011-12-21 一种信息导航的方法、装置与***

Country Status (2)

Country Link
CN (1) CN103176995B (zh)
HK (1) HK1182793A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391977B (zh) * 2014-12-05 2018-04-03 北京国双科技有限公司 网页关键词出现频次检测方法及装置
CN106202090B (zh) * 2015-05-04 2020-02-07 阿里巴巴集团控股有限公司 一种信息处理、搜索方法及装置、服务器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101582909A (zh) * 2008-05-16 2009-11-18 上海神图信息科技有限公司 一种面向移动终端设备用户提供信息服务的***及方法
CN101615277A (zh) * 2008-06-26 2009-12-30 阿里巴巴集团控股有限公司 一种统计数据的方法和装置
CN102053983A (zh) * 2009-11-02 2011-05-11 阿里巴巴集团控股有限公司 一种垂直搜索的查询方法、***和装置
CN102253936A (zh) * 2010-05-18 2011-11-23 阿里巴巴集团控股有限公司 记录用户访问商品信息的方法及搜索方法和服务器

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7840448B2 (en) * 2003-05-07 2010-11-23 Cbs Interactive Inc. System and method for automatically generating a narrative product summary
CN101770498A (zh) * 2009-01-05 2010-07-07 李铭 分步搜索法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101582909A (zh) * 2008-05-16 2009-11-18 上海神图信息科技有限公司 一种面向移动终端设备用户提供信息服务的***及方法
CN101615277A (zh) * 2008-06-26 2009-12-30 阿里巴巴集团控股有限公司 一种统计数据的方法和装置
CN102053983A (zh) * 2009-11-02 2011-05-11 阿里巴巴集团控股有限公司 一种垂直搜索的查询方法、***和装置
CN102253936A (zh) * 2010-05-18 2011-11-23 阿里巴巴集团控股有限公司 记录用户访问商品信息的方法及搜索方法和服务器

Also Published As

Publication number Publication date
CN103176995A (zh) 2013-06-26
HK1182793A1 (zh) 2013-12-06

Similar Documents

Publication Publication Date Title
CN106156127B (zh) 选择数据内容向终端推送的方法及装置
CN103218719B (zh) 一种电子商务网站导航方法及***
US8935197B2 (en) Systems and methods for facilitating open source intelligence gathering
CN101593200B (zh) 基于关键词频度分析的中文网页分类方法
CN103514304B (zh) 一种项目推荐方法和装置
CN105930469A (zh) 基于Hadoop的个性化旅游推荐***及方法
CN106339502A (zh) 一种基于用户行为数据分片聚类的建模推荐方法
CN104077357B (zh) 基于用户的协同过滤组合推荐方法
CN105426514A (zh) 个性化的移动应用app推荐方法
CN103310003A (zh) 一种基于点击日志的新广告点击率预测方法及***
CN103390044B (zh) 一种连锁类兴趣点数据识别方法及装置
CN103559622A (zh) 基于特征的协同过滤推荐方法
CN104462611A (zh) 信息排序模型的建模方法、排序方法及建模装置、排序装置
CN103729359A (zh) 一种推荐搜索词的方法及***
CN102509233A (zh) 一种基于用户网上动作信息的推荐方法
CN102375885A (zh) 一种提供与查询序列相对应的搜索建议的方法与设备
CN103186550A (zh) 一种视频的相关视频列表的生成方法及***
CN110532309B (zh) 一种高校图书馆用户画像***的生成方法
CN103136683A (zh) 计算产品参考价格的方法、装置及产品搜索方法、***
CN104133868B (zh) 一种用于垂直爬虫数据分类整合的策略
CN112825089B (zh) 文章推荐方法、装置、设备及存储介质
CN105138508A (zh) 一种基于偏好扩散的上下文推荐***
CN103678710A (zh) 一种基于用户行为的信息推荐方法
CN104077392B (zh) 一种搜索建议提示方法及装置
CN104516980B (zh) 搜索结果的输出方法以及服务器***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1182793

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1182793

Country of ref document: HK