CN106610994A - 点击路径的统计方法和装置 - Google Patents
点击路径的统计方法和装置 Download PDFInfo
- Publication number
- CN106610994A CN106610994A CN201510698096.8A CN201510698096A CN106610994A CN 106610994 A CN106610994 A CN 106610994A CN 201510698096 A CN201510698096 A CN 201510698096A CN 106610994 A CN106610994 A CN 106610994A
- Authority
- CN
- China
- Prior art keywords
- subpath
- path
- behavior
- paths
- click
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请公开了一种点击路径的统计方法和装置。其中,该方法包括:获取用户在目标网页上的点击行为数据,其中,点击行为数据记录有用户在目标网页上点击网页元素的行为路径;由点击行为数据中每一条行为路径生成一个路径集合,其中,路径集合包含有对应的行为路径中至少点击两个网页元素的子路径;统计生成的路径集合中子路径出现的次数;以及将出现次数最多的子路径作为目标网页上的热门路径。本申请解决了无法确定出在网页页面上用户点击网页元素的热门路径的技术问题。
Description
技术领域
本申请涉及互联网领域,具体而言,涉及一种点击路径的统计方法和装置。
背景技术
随着技术的发展,如今一个网页已不再仅仅是某些单一元素(文章,图片,视频)的展现,在页面上存在有多个交互元素的情况已成为常见的表现形式。然而,目前还没有关于对用户在网页页面上的点击行为进行分析的方案,无法确定出在网页页面上用户点击网页元素的热门路径。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种点击路径的统计方法和装置,以至少解决无法确定出在网页页面上用户点击网页元素的热门路径的技术问题。
根据本申请实施例的一个方面,提供了一种点击路径的统计方法,包括:获取用户在目标网页上的点击行为数据,其中,所述点击行为数据记录有用户在所述目标网页上点击网页元素的行为路径;由所述点击行为数据中每一条行为路径生成一个路径集合,其中,所述路径集合包含有对应的行为路径中至少点击两个网页元素的子路径;统计生成的路径集合中子路径出现的次数;以及将出现次数最多的子路径作为所述目标网页上的热门路径。
进一步地,将出现次数最多的子路径作为所述目标网页上的热门路径包括:将出现次数相同且相互之间具有包含关系的两条子路径合并,将合并的两条子路径中路径长的子路径作为合并后的子路径;将合并后出现次数最多的子路径作为所述目标网页上的热门路径。
进一步地,获取用户在目标网页上的点击行为数据包括:对所述目标网页上的所有网页元素进行标示,将唯一表示网页元素的唯一识别码代替相应的网页元素;用所述唯一识别码记录用户点击网页元素的行为路径,得到所述点击行为数据。
进一步地,由所述点击行为数据中每一条行为路径生成一个路径集合包括:将由所述唯一识别码记录的行为路径拆解成个子路径,得到所述路径集合,其中,表示从包含有n个唯一识别码的行为路径中拆解出包含有i个唯一识别码的子路径的数量。
进一步地,在将出现次数最多的子路径作为所述目标网页上的热门路径之后,所述方法还包括:将出现次数最多的子路径中各唯一识别码转化为相应的网页元素的名称;将转化后的网页元素的名称按照现次数最多的子路径中唯一识别码的顺序排序后进行展示。
根据本申请实施例的另一方面,还提供了一种点击路径的统计装置,包括:获取单元,用于获取用户在目标网页上的点击行为数据,其中,所述点击行为数据记录有用户在所述目标网页上点击网页元素的行为路径;生成单元,用于由所述点击行为数据中每一条行为路径生成一个路径集合,其中,所述路径集合包含有对应的行为路径中至少点击两个网页元素的子路径;统计单元,用于统计生成的路径集合中子路径出现的次数;以及确定单元,用于将出现次数最多的子路径作为所述目标网页上的热门路径。
进一步地,所述确定单元包括:合并模块,用于将出现次数相同且相互之间具有包含关系的两条子路径合并,将合并的两条子路径中路径长的子路径作为合并后的子路径;确定模块,用于将合并后出现次数最多的子路径作为所述目标网页上的热门路径。
进一步地,所述获取单元包括:标示模块,用于对所述目标网页上的所有网页元素进行标示,将唯一表示网页元素的唯一识别码代替相应的网页元素;记录模块,用于用所述唯一识别码记录用户点击网页元素的行为路径,得到所述点击行为数据。
进一步地,所述生成单元包括:生成模块,用于将由所述唯一识别码记录的行为路径拆解成个子路径,得到所述路径集合,其中,表示从包含有n个唯一识别码的行为路径中拆解出包含有i个唯一识别码的子路径的数量。
进一步地,所述装置还包括:转化单元,用于在将出现次数最多的子路径作为所述目标网页上的热门路径之后,将出现次数最多的子路径中各唯一识别码转化为相应的网页元素的名称;显示单元,用于将转化后的网页元素的名称按照现次数最多的子路径中唯一识别码的顺序排序后进行展示。
根据本申请实施例,通过获取用户在目标网页上的记录有用户在目标网页上点击网页元素的行为路径的点击行为数据,由点击行为数据中每一条行为路径生成一个路径集合,统计所有生成的路径集合中子路径出现的次数,将出现次数最多的子路径作为目标网页上的热门路径,从而确定出目标网页上的网页元素的热门路径,解决了无法确定出在网页页面上用户点击网页元素的热门路径的技术问题。在此基础上,可以根据热门路径进一步分析多个元素之间的安排是否对于用户的点击和转化带来影响。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的点击路径的统计方法的流程图;
图2是根据本申请实施例的点击路径的统计装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例,提供了一种点击路径的统计方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本申请实施例的点击路径的统计方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取用户在目标网页上的点击行为数据。其中,点击行为数据记录有用户在目标网页上点击网页元素的行为路径。
步骤S104,由点击行为数据中每一条行为路径生成一个路径集合,其中,路径集合包含有对应的行为路径中至少点击两个网页元素的子路径。
步骤S106,统计生成的路径集合中子路径出现的次数。
步骤S108,将出现次数最多的子路径作为目标网页上的热门路径。
对于用户在目标网页上的点击行为数据,可以通过在目标网页上设置爬虫程序,记录用户在目标网页上的点击行为,得到点击行为数据,也可以从目标网页的访问日志上获取点击行为数据。点击网页元素的行为路径是指由同一在一次访问中,按顺序点击的网页元素形成的路径,例如,用户在访问目标网页过程中,依次点击了目标网页上的文章a、图片b、图片c和视频e,因此,由文章a、图片b、图片c和视频e形成用户的一条点击行为路径:文章a-图片b-图片c-视频e。
获取到点击行为数据之后,将由每一条行为路径生成一个路径集合,该路径集合中可以包括至少点击了两个网页元素的子路径,以上述路径为例,生成的路径集合可以是{文章a-图片b,图片b-图片c,图片c-视频e,图片b-视频e,文章a-图片c,文章a-视频e,文章a-图片b-图片c,文章a-图片b-视频e,文章a-图片c-视频e图片b-图片c-视频e,文章a-图片b-图片c-视频e}。由每条行为路径生成一条路径集合,多条行为路径生成多个路径集合。然后,统计所有路径集合中每条子路径出现的次数,并将出现次数最多的子路径作为该目标网页上的热门路径。
根据本申请实施例,通过获取用户在目标网页上的记录有用户在目标网页上点击网页元素的行为路径的点击行为数据,由点击行为数据中每一条行为路径生成一个路径集合,统计所有生成的路径集合中子路径出现的次数,将出现次数最多的子路径作为目标网页上的热门路径,从而确定出目标网页上的网页元素的热门路径,解决了无法确定出在网页页面上用户点击网页元素的热门路径的技术问题。在此基础上,可以根据热门路径进一步分析多个元素之间的安排是否对于用户的点击和转化带来影响。
优选地,将出现次数最多的子路径作为目标网页上的热门路径包括:将出现次数相同且相互之间具有包含关系的两条子路径合并,将合并的两条子路径中路径长的子路径作为合并后的子路径;将合并后出现次数最多的子路径作为目标网页上的热门路径。
本申请实施例中,由于同一路径集合或者不同路径集合之间,子路径均有长有短,且长的子路径包含有短的子路径中所有元素,以上述举例中的行为路径为例,子路径:文章a-图片b-图片c-视频e包括所有其他的子路径,子路径:文章a-图片b-图片c包含有子路径:文章a-图片b,图片b-图片c和文章a-图片c。当统计结果中,长的子路径与短的子路径出现的次数相同时,则短的子路径合并到长的子路径中,以对统计后的子路径进行整合,将最终的出现次数最多的子路径作为热门路径。
本申请实施例中,通过将长短子路径进行整合,保证出现的统计出的热门路径尽可能为长的路径,且减少子路径的总数量。
优选地,获取用户在目标网页上的点击行为数据包括:对目标网页上的所有网页元素进行标示,将唯一表示网页元素的唯一识别码代替相应的网页元素;用唯一识别码记录用户点击网页元素的行为路径,得到点击行为数据。
本申请实施例中,将目标网页上的所有元素用其相应的唯一识别码进行标示,然后以唯一识别码记录用户点击网页元素的行为路径。
例:目标网页上包含有网页元素:视频A(1),视频B(2),图片A(3),图片B(4),文章链接A(5)。其中,括号内为相应的网页元素对应的识别码,有三个用户:
甲:视频A-图片B-文章链接A-图片A;
乙:视频B-图片B-文章链接A-图片A;
丙:视频B-视频A-图片B-文章链接A-图片A;
记录的点击行为数据为:
甲:1-4-5-3;
乙:2-4-5-3;
丙:2-1-4-5-3。
根据本申请实施例,通过用唯一识别码代替相应的网页元素,记录用户在目标网页上的点击行为数据,大大降低了记录的数据量。
优选地,由点击行为数据中每一条行为路径生成一个路径集合包括:将由唯一识别码记录的行为路径拆解成个子路径,得到路径集合,其中,表示从包含有n个唯一识别码的行为路径中拆解出包含有i个唯一识别码的子路径的数量。
表示n个元素中i个元素无序组合的总数量,即从包含有n个唯一识别码的行为路径中拆解出包含有i个唯一识别码的子路径的数量。本申请实施例中,将每一条由唯一识别码记录的行为路径拆解成个子路径,如上述举例中,用户甲的行为路径对应的路径集合为:{1-4-5-3,1-5-3,1-4-5,1-4-3,4-5-3,1-4,1-5,1-3,4-5,4-3,5-3},则可以判断出热门路径为4-5-3(出现3次),具体的计算逻辑为,现将所有的路径拆分为,则甲可以分成:1-4-5-3,1-5-3,1-4-5,1-4-3,4-5-3,1-4,1-5,1-3,4-5,4-3,5-3,共十一种,相应的将所有的用户行为数据进行打散,然后统计。虽然5-3和4-5-3都出现了3次,但是因为4-5-3的路径包含了5-3,所以将4-5-3作为热门路径。
优选地,在将出现次数最多的子路径作为目标网页上的热门路径之后,方法还包括:将出现次数最多的子路径中各唯一识别码转化为相应的网页元素的名称;将转化后的网页元素的名称按照现次数最多的子路径中唯一识别码的顺序排序后进行展示。
在确定出热门路径之后,将热门路径即出现次数最多的子路径中各唯一识别码转化为相应的网页元素的名称,然后按照原有的顺序进行展示,例如上述距离中,4-5-3为热门路径,所以最后在前端进行展现时,将其转化成图片B-文章链接A-图片A进行展示。
本申请实施例中,在利用唯一识别码确定出热门路径之后,将唯一识别码表示的热门路径转化为网页元素的名称表示的热门路径,并进行展示,直观地反映出热门路径的网页元素。
下面对本申请实施例中的一种可选的实施方式进行描述,具体包括:
1.对页面的元素进行唯一识别码的标示;
2.统计用户的网页元素点击行为,得出所有用户的点击行为数据;
3.将用户的点击行为数据通过唯一识别码在前端进行编译(翻译),并传送编译后数据到服务器端;
4.将每一个用户的行为路径进行打散,则每个用户可得到子路径数为:
5.得到所有用户的打散数据后进行数量累计统计;
6.得到数量统计后按序排列,当统计数相同时,将短路径并入长路径之中,如得到A-B-C为5次,A-B也为5次,B-C也为5次,A-C同样为5次,则因为A-B-C的路径最长且包含了A-B,B-C,A-C,所以这四条路径合并为一条:A-B-C 5次进行排列。
7.得出排序的识别码标号组合,其中,统计数(出现次数)最多的即为热门路径。
8.在前端进行展现时,将唯一识别码转化为相应的元素名称按序排列。
本申请实施例还提供了一种点击路径的统计装置,该装置可以用于执行本申请实施例的点击路径的统计方法,如图2所示,该装置包括:获取单元10、生成单元20、统计单元30和确定单元40。
获取单元10用于获取用户在目标网页上的点击行为数据,其中,点击行为数据记录有用户在目标网页上点击网页元素的行为路径。
生成单元20用于由点击行为数据中每一条行为路径生成一个路径集合,其中,路径集合包含有对应的行为路径中至少点击两个网页元素的子路径。
统计单元30用于统计生成的路径集合中子路径出现的次数。
确定单元40用于将出现次数最多的子路径作为目标网页上的热门路径。
对于用户在目标网页上的点击行为数据,可以通过在目标网页上设置爬虫程序,记录用户在目标网页上的点击行为,得到点击行为数据,也可以从目标网页的访问日志上获取点击行为数据。点击网页元素的行为路径是指由同一在一次访问中,按顺序点击的网页元素形成的路径,例如,用户在访问目标网页过程中,依次点击了目标网页上的文章a、图片b、图片c和视频e,因此,由文章a、图片b、图片c和视频e形成用户的一条点击行为路径:文章a-图片b-图片c-视频e。
获取到点击行为数据之后,将由每一条行为路径生成一个路径集合,该路径集合中可以包括至少点击了两个网页元素的子路径,以上述路径为例,生成的路径集合可以是{文章a-图片b,图片b-图片c,图片c-视频e,图片b-视频e,文章a-图片c,文章a-视频e,文章a-图片b-图片c,文章a-图片b-视频e,文章a-图片c-视频e图片b-图片c-视频e,文章a-图片b-图片c-视频e}。由每条行为路径生成一条路径集合,多条行为路径生成多个路径集合。然后,统计所有路径集合中每条子路径出现的次数,并将出现次数最多的子路径作为该目标网页上的热门路径。
根据本申请实施例,通过获取用户在目标网页上的记录有用户在目标网页上点击网页元素的行为路径的点击行为数据,由点击行为数据中每一条行为路径生成一个路径集合,统计所有生成的路径集合中子路径出现的次数,将出现次数最多的子路径作为目标网页上的热门路径,从而确定出目标网页上的网页元素的热门路径,解决了无法确定出在网页页面上用户点击网页元素的热门路径的技术问题。在此基础上,可以根据热门路径进一步分析多个元素之间的安排是否对用户的点击和转化带来影响。
优选地,确定单元包括:合并模块,用于将出现次数相同且相互之间具有包含关系的两条子路径合并,将合并的两条子路径中路径长的子路径作为合并后的子路径;确定模块,用于将合并后出现次数最多的子路径作为目标网页上的热门路径。
本申请实施例中,由于同一路径集合或者不同路径集合之间,子路径均有长有短,且长的子路径包含有短的子路径中所有元素,以上述举例中的行为路径为例,子路径:文章a-图片b-图片c-视频e包括所有其他的子路径,子路径:文章a-图片b-图片c包含有子路径:文章a-图片b,图片b-图片c和文章a-图片c。当统计结果中,长的子路径与短的子路径出现的次数相同时,则短的子路径合并到长的子路径中,以对统计后的子路径进行整合,将最终的出现次数最多的子路径作为热门路径。
本申请实施例中,通过将长短子路径进行整合,保证出现的统计出的热门路径尽可能为长的路径,且减少子路径的总数量。
优选地,获取单元包括:标示模块,用于对目标网页上的所有网页元素进行标示,将唯一表示网页元素的唯一识别码代替相应的网页元素;记录模块,用于用唯一识别码记录用户点击网页元素的行为路径,得到点击行为数据。
本申请实施例中,将目标网页上的所有元素用其相应的唯一识别码进行标示,然后以唯一识别码记录用户点击网页元素的行为路径。
例:目标网页上包含有网页元素:视频A(1),视频B(2),图片A(3),图片B(4),文章链接A(5)。其中,括号内为相应的网页元素对应的识别码,有三个用户:
甲:视频A-图片B-文章链接A-图片A;
乙:视频B-图片B-文章链接A-图片A;
丙:视频B-视频A-图片B-文章链接A-图片A;
记录的点击行为数据为:
甲:1-4-5-3;
乙:2-4-5-3;
丙:2-1-4-5-3。
根据本申请实施例,通过用唯一识别码代替相应的网页元素,记录用户在目标网页上的点击行为数据,大大降低了记录的数据量。
优选地,生成单元包括:生成模块,用于将由唯一识别码记录的行为路径拆解成个子路径,得到路径集合,其中,表示从包含有n个唯一识别码的行为路径中拆解出包含有i个唯一识别码的子路径的数量。
表示n个元素中i个元素无序组合的总数量,即从包含有n个唯一识别码的行为路径中拆解出包含有i个唯一识别码的子路径的数量。本申请实施例中,将每一条由唯一识别码记录的行为路径拆解成个子路径,如上述举例中,用户甲的行为路径对应的路径集合为:{1-4-5-3,1-5-3,1-4-5,1-4-3,4-5-3,1-4,1-5,1-3,4-5,4-3,5-3},则可以判断出热门路径为4-5-3(出现3次),具体的计算逻辑为,现将所有的路径拆分为,则甲可以分成:1-4-5-3,1-5-3,1-4-5,1-4-3,4-5-3,1-4,1-5,1-3,4-5,4-3,5-3十一种,相应的将所有的用户行为数据进行打散,然后统计。虽然5-3和4-5-3都出现了3次,但是因为4-5-3的路径包含了5-3,所以将4-5-3作为热门路径。
优选地,装置还包括:转化单元,用于在将出现次数最多的子路径作为目标网页上的热门路径之后,将出现次数最多的子路径中各唯一识别码转化为相应的网页元素的名称;显示单元,用于将转化后的网页元素的名称按照现次数最多的子路径中唯一识别码的顺序排序后进行展示。
在确定出热门路径之后,将热门路径即出现次数最多的子路径中各唯一识别码转化为相应的网页元素的名称,然后按照原有的顺序进行展示,例如上述距离中,4-5-3为热门路径,所以最后在前端进行展现时,将其转化成图片B-文章链接A-图片A进行展示。
本申请实施例中,在利用唯一识别码确定出热门路径之后,将唯一识别码表示的热门路径转化为网页元素的名称表示的热门路径,并进行展示,直观地反映出热门路径的网页元素。
所述点击路径的统计装置包括处理器和存储器,上述获取单元10、生成单元20、统计单元30和确定单元40等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元。上述路径集合可以存储在存储器中。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来确定热门路径。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品的实施例,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:获取用户在目标网页上的记录有用户在目标网页上点击网页元素的行为路径的点击行为数据,由点击行为数据中每一条行为路径生成一个路径集合,统计所有生成的路径集合中子路径出现的次数,将出现次数最多的子路径作为目标网页上的热门路径。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种点击路径的统计方法,其特征在于,包括:
获取用户在目标网页上的点击行为数据,其中,所述点击行为数据记录有用户在所述目标网页上点击网页元素的行为路径;
由所述点击行为数据中每一条行为路径生成一个路径集合,其中,所述路径集合包含有对应的行为路径中至少点击两个网页元素的子路径;
统计生成的路径集合中子路径出现的次数;以及
将出现次数最多的子路径作为所述目标网页上的热门路径。
2.根据权利要求1所述的方法,其特征在于,将出现次数最多的子路径作为所述目标网页上的热门路径包括:
将出现次数相同且相互之间具有包含关系的两条子路径合并,将合并的两条子路径中路径长的子路径作为合并后的子路径;
将合并后出现次数最多的子路径作为所述目标网页上的热门路径。
3.根据权利要求1所述的方法,其特征在于,获取用户在目标网页上的点击行为数据包括:
对所述目标网页上的所有网页元素进行标示,将唯一表示网页元素的唯一识别码代替相应的网页元素;
用所述唯一识别码记录用户点击网页元素的行为路径,得到所述点击行为数据。
4.根据权利要求3所述的方法,其特征在于,由所述点击行为数据中每一条行为路径生成一个路径集合包括:
将由所述唯一识别码记录的行为路径拆解成个子路径,得到所述路径集合,其中,表示从包含有n个唯一识别码的行为路径中拆解出包含有i个唯一识别码的子路径的数量。
5.根据权利要求3所述的方法,其特征在于,在将出现次数最多的子路径作为所述目标网页上的热门路径之后,所述方法还包括:
将出现次数最多的子路径中各唯一识别码转化为相应的网页元素的名称;
将转化后的网页元素的名称按照现次数最多的子路径中唯一识别码的顺序排序后进行展示。
6.一种点击路径的统计装置,其特征在于,包括:
获取单元,用于获取用户在目标网页上的点击行为数据,其中,所述点击行为数据记录有用户在所述目标网页上点击网页元素的行为路径;
生成单元,用于由所述点击行为数据中每一条行为路径生成一个路径集合,其中,所述路径集合包含有对应的行为路径中至少点击两个网页元素的子路径;
统计单元,用于统计生成的路径集合中子路径出现的次数;以及
确定单元,用于将出现次数最多的子路径作为所述目标网页上的热门路径。
7.根据权利要求6所述的装置,其特征在于,所述确定单元包括:
合并模块,用于将出现次数相同且相互之间具有包含关系的两条子路径合并,将合并的两条子路径中路径长的子路径作为合并后的子路径;
确定模块,用于将合并后出现次数最多的子路径作为所述目标网页上的热门路径。
8.根据权利要求6所述的装置,其特征在于,所述获取单元包括:
标示模块,用于对所述目标网页上的所有网页元素进行标示,将唯一表示网页元素的唯一识别码代替相应的网页元素;
记录模块,用于用所述唯一识别码记录用户点击网页元素的行为路径,得到所述点击行为数据。
9.根据权利要求8所述的装置,其特征在于,所述生成单元包括:
生成模块,用于将由所述唯一识别码记录的行为路径拆解成个子路径,得到所述路径集合,其中,表示从包含有n个唯一识别码的行为路径中拆解出包含有i个唯一识别码的子路径的数量。
10.根据权利要求8所述的装置,其特征在于,所述装置还包括:
转化单元,用于在将出现次数最多的子路径作为所述目标网页上的热门路径之后,将出现次数最多的子路径中各唯一识别码转化为相应的网页元素的名称;
显示单元,用于将转化后的网页元素的名称按照现次数最多的子路径中唯一识别码的顺序排序后进行展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510698096.8A CN106610994A (zh) | 2015-10-23 | 2015-10-23 | 点击路径的统计方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510698096.8A CN106610994A (zh) | 2015-10-23 | 2015-10-23 | 点击路径的统计方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106610994A true CN106610994A (zh) | 2017-05-03 |
Family
ID=58613198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510698096.8A Pending CN106610994A (zh) | 2015-10-23 | 2015-10-23 | 点击路径的统计方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106610994A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109426540A (zh) * | 2017-08-29 | 2019-03-05 | 北京国双科技有限公司 | 元素的点击情况检测方法和装置、存储介质、处理器 |
CN110968768A (zh) * | 2018-09-28 | 2020-04-07 | 北京易数科技有限公司 | 信息生成方法和装置 |
CN111949351A (zh) * | 2020-08-12 | 2020-11-17 | 深圳前海微众银行股份有限公司 | 页面渲染方法、装置、设备及计算机可读存储介质 |
CN112099778A (zh) * | 2020-11-13 | 2020-12-18 | 北京智慧星光信息技术有限公司 | 基于xpath的数据采集方法、电子设备及存储介质 |
CN112817506A (zh) * | 2021-01-26 | 2021-05-18 | 广州欢网科技有限责任公司 | 智能电视用户桌面自动调整的方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101446979A (zh) * | 2008-12-26 | 2009-06-03 | 北京科尔威视网络科技有限公司 | 动态热点跟踪的方法 |
CN101866342A (zh) * | 2009-04-16 | 2010-10-20 | 富士通株式会社 | 生成或显示网页标注的方法和装置以及信息共享*** |
CN103678321A (zh) * | 2012-09-03 | 2014-03-26 | 阿里巴巴集团控股有限公司 | 页面元素确定方法及设备、用户行为路径确定方法及装置 |
CN103823883A (zh) * | 2014-03-06 | 2014-05-28 | 焦点科技股份有限公司 | 一种网站用户访问路径的分析方法及*** |
US20140324853A1 (en) * | 2013-04-30 | 2014-10-30 | Wal-Mart Stores, Inc. | Search relevance |
US20140324852A1 (en) * | 2013-04-30 | 2014-10-30 | Wal-Mart Stores, Inc. | Classifying Queries To Generate Category Mappings |
CN104731807A (zh) * | 2013-12-20 | 2015-06-24 | 北京风行在线技术有限公司 | 一种统计和分析页面跳转数据的方法及装置 |
-
2015
- 2015-10-23 CN CN201510698096.8A patent/CN106610994A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101446979A (zh) * | 2008-12-26 | 2009-06-03 | 北京科尔威视网络科技有限公司 | 动态热点跟踪的方法 |
CN101866342A (zh) * | 2009-04-16 | 2010-10-20 | 富士通株式会社 | 生成或显示网页标注的方法和装置以及信息共享*** |
CN103678321A (zh) * | 2012-09-03 | 2014-03-26 | 阿里巴巴集团控股有限公司 | 页面元素确定方法及设备、用户行为路径确定方法及装置 |
US20140324853A1 (en) * | 2013-04-30 | 2014-10-30 | Wal-Mart Stores, Inc. | Search relevance |
US20140324852A1 (en) * | 2013-04-30 | 2014-10-30 | Wal-Mart Stores, Inc. | Classifying Queries To Generate Category Mappings |
CN104731807A (zh) * | 2013-12-20 | 2015-06-24 | 北京风行在线技术有限公司 | 一种统计和分析页面跳转数据的方法及装置 |
CN103823883A (zh) * | 2014-03-06 | 2014-05-28 | 焦点科技股份有限公司 | 一种网站用户访问路径的分析方法及*** |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109426540A (zh) * | 2017-08-29 | 2019-03-05 | 北京国双科技有限公司 | 元素的点击情况检测方法和装置、存储介质、处理器 |
CN109426540B (zh) * | 2017-08-29 | 2021-07-30 | 北京国双科技有限公司 | 元素的点击情况检测方法和装置、存储介质、处理器 |
CN110968768A (zh) * | 2018-09-28 | 2020-04-07 | 北京易数科技有限公司 | 信息生成方法和装置 |
CN110968768B (zh) * | 2018-09-28 | 2023-11-24 | 北京易数科技有限公司 | 信息生成方法和装置 |
CN111949351A (zh) * | 2020-08-12 | 2020-11-17 | 深圳前海微众银行股份有限公司 | 页面渲染方法、装置、设备及计算机可读存储介质 |
CN112099778A (zh) * | 2020-11-13 | 2020-12-18 | 北京智慧星光信息技术有限公司 | 基于xpath的数据采集方法、电子设备及存储介质 |
CN112099778B (zh) * | 2020-11-13 | 2021-02-02 | 北京智慧星光信息技术有限公司 | 基于xpath的数据采集方法、电子设备及存储介质 |
CN112817506A (zh) * | 2021-01-26 | 2021-05-18 | 广州欢网科技有限责任公司 | 智能电视用户桌面自动调整的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106446228B (zh) | 一种web页面数据的采集分析方法及装置 | |
CN104685490B (zh) | 结构化和非结构化数据自适应分组的***和方法 | |
CN106610994A (zh) | 点击路径的统计方法和装置 | |
CN103778125B (zh) | 网页投放内容的分析方法和装置及自动投放方法和装置 | |
CN107295361B (zh) | 一种内容推送方法 | |
US9563611B2 (en) | Merging web page style addresses | |
CN102831114B (zh) | 实现互联网用户访问情况统计分析的方法及装置 | |
CN106649316A (zh) | 一种视频推送方法及装置 | |
CN106649372A (zh) | 热力图中广告点击量的展示方法和装置 | |
CN106610993A (zh) | 视频预览的展示方法、装置 | |
CN105653949B (zh) | 一种恶意程序检测方法及装置 | |
CN104408190A (zh) | 基于Spark的数据处理方法及装置 | |
CN106708841A (zh) | 网站访问路径的聚合方法和装置 | |
CN108256888A (zh) | 落地页的获取方法、网站服务器以及网络广告监测*** | |
CN107608980A (zh) | 基于dpi大数据分析的信息推送方法和*** | |
CN108399551A (zh) | 一种确定用户标签和推送信息的方法及*** | |
KR102288408B1 (ko) | 광고 생성 방법, 컴퓨터 판독 가능한 저장매체 및 시스템 | |
CN106168968A (zh) | 一种网站分类方法及装置 | |
US20160371725A1 (en) | Campaign optimization system | |
CN108604232A (zh) | 通过模型化滚动行为而改善信息源 | |
CN101350025A (zh) | 一种基于漏斗模型的互联网行为营销剖析法 | |
CN104598522A (zh) | 网页页面显示的方法及装置 | |
US9361379B1 (en) | Systems and methods providing recommendation data | |
CN104994431B (zh) | 一种网站视频关注度的处理方法和装置 | |
CN106599255A (zh) | 用于统计用户行为的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing Applicant after: Beijing Guoshuang Technology Co.,Ltd. Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing Applicant before: Beijing Guoshuang Technology Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170503 |