CN103902436A - 一种对用户访问行为进行还原的方法及装置 - Google Patents

一种对用户访问行为进行还原的方法及装置 Download PDF

Info

Publication number
CN103902436A
CN103902436A CN201210586613.9A CN201210586613A CN103902436A CN 103902436 A CN103902436 A CN 103902436A CN 201210586613 A CN201210586613 A CN 201210586613A CN 103902436 A CN103902436 A CN 103902436A
Authority
CN
China
Prior art keywords
behavior
page
record
field value
reduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210586613.9A
Other languages
English (en)
Other versions
CN103902436B (zh
Inventor
王集鹄
杨溢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201210586613.9A priority Critical patent/CN103902436B/zh
Publication of CN103902436A publication Critical patent/CN103902436A/zh
Application granted granted Critical
Publication of CN103902436B publication Critical patent/CN103902436B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种对用户访问行为进行还原的方法及装置,其中所述方法包括:行为记录阶段和行为还原阶段,其中所述行为记录阶段包括:A.在用户对网页进行访问时,获取页面级别数据及行为级别数据,其中所述页面级别数据中的一条记录代表一个用户对一个页面的访问,所述行为级别数据中的一条记录代表一个用户对一个页面的访问期间产生的一个行为;所述行为还原阶段包括:B.根据所述页面级别数据,确定所访问的页面满足预设的页面跳转关系的目标用户;C.根据所述行为级别数据,对所述目标用户在具有所述页面跳转关系的页面上的行为进行还原。通过上述方式,本发明能够为网页设计人员改进网页的现有设计提供帮助。

Description

一种对用户访问行为进行还原的方法及装置
【技术领域】
本发明涉及计算机网络技术领域,特别涉及一种对用户访问行为进行还原的方法及装置。
【背景技术】
对网页设计人员而言,了解用户对网页现有设计是否满意是改进网页设计的基础。在现有技术中,是通过问卷调查的方式获知用户对网页现有设计的满意程度的。例如,想要知道网页中某个位置的按钮是否符合用户需要,可以通过问卷方式从用户处获取调查数据,然后通过对调查数据进行统计分析来确定该位置的按钮是否符合大多数用户的需要,从而帮助网页设计人员改进现有设计。
上述方式中,受调查用户的反馈数据不是依据其对页面的真实操作进行的,这使得获取的反馈数据存在很大主观性。例如受调查用户已经忘记了自己的操作行为而无法提供准确的反馈数据,或者有意不提供真实的反馈数据,都会导致调查数据不准确。因此,采用调查问卷的方式很难判断网页现有设计是否合理,这给网页设计人员改进现有设计增加了难度。
【发明内容】
本发明所要解决的技术问题是提供一种对用户的访问行为进行还原的方法及装置,为网页设计人员改进网页的现有设计提供帮助。
本发明为解决技术问题而采用的技术方案是提供一种对用户访问行为进行还原的方法,包括行为记录阶段和行为还原阶段,其中所述行为记录阶段包括:A.在用户对网页进行访问时,获取页面级别数据及行为级别数据,其中所述页面级别数据中的一条记录代表一个用户对一个页面的访问,所述行为级别数据中的一条记录代表一个用户对一个页面的访问期间产生的一个行为;所述行为还原阶段包括:B.根据所述页面级别数据,确定所访问的页面满足预设的页面跳转关系的目标用户;C.根据所述行为级别数据,对所述目标用户在具有所述页面跳转关系的页面上的行为进行还原。
根据本发明之一优选实施例,所述页面级别数据中记录的字段包括访问标识、页面标识、来访时间、离开时间和来源页面标识。
根据本发明之一优选实施例,所述步骤B包括:B1.根据所述页面级别数据中各条记录的来源页面标识字段值,提取满足预设的页面跳转关系的记录配对;B2.将提取的记录配对中在后记录的来访时间字段值与在先记录的离开时间字段值之间的差值落在预设正区间的记录配对所代表的用户作为目标用户。
根据本发明之一优选实施例,所述行为级别数据中记录的字段包括访问标识、行为类型、行为发生时间、行为发生位置、行为发生时的页面宽高和行为发生时的浏览器宽高。
根据本发明之一优选实施例,所述行为类型字段值包括以下任意一种:鼠标点击、鼠标移动、鼠标框选、鼠标滚动、键盘输入。
根据本发明之一优选实施例,所述步骤C包括:C1.利用所述页面级别数据中代表所述目标用户的记录配对各自的访问标识字段值,从所述行为级别数据中提取相关记录;C2.按照所述相关记录中行为发生时间字段值确定各条记录相互之间的时间间隔,并按照所述时间间隔依次还原所述相关记录中的各条记录所代表的行为。
根据本发明之一优选实施例,还原所述相关记录中的一条记录R所代表的行为的步骤包括:S1.根据所述页面级别数据中与R的访问标识字段值对应的页面标识字段值确定目标还原页面,并判断所述目标还原页面是否已被加载,如果是,则执行步骤S3,否则执行步骤S2;S2.根据R的行为发生时的页面宽高字段值确定还原视窗大小,在所述大小的还原视窗中加载所述目标还原页面,并根据R的行为发生时的浏览器宽高字段值在所述目标还原页面上描绘用户访问时的可视区域,以及,根据R的行为发生位置字段值在所述目标还原页面上进行定位,并在定位区域模拟触发R的行为类型字段值表示的行为;S3.根据R的行为发生时的浏览器宽高字段值对已描绘的可视区域进行调整,以及,根据R的行为发生位置字段值在所述目标还原页面上进行定位,并在定位区域模拟触发R的行为类型字段值表示的行为。
本发明还提供了一种对用户访问行为进行还原的装置,包括:数据获取单元,用于在用户对网页进行访问时,获取页面级别数据及行为级别数据,其中所述页面级别数据中的一条记录代表一个用户对一个页面的访问,所述行为级别数据中的一条记录代表一个用户对一个页面的访问期间产生的一个行为;确定单元,用于根据所述页面级别数据,确定所访问的页面满足预设的页面跳转关系的目标用户;还原单元,用于根据所述行为级别数据,对所述目标用户在具有所述页面跳转关系的页面上的行为进行还原。
根据本发明之一优选实施例,所述页面级别数据中记录的字段包括访问标识、页面标识、来访时间、离开时间和来源页面标识。
根据本发明之一优选实施例,所述确定单元包括:第一提取单元,用于根据所述页面级别数据中各条记录的来源页面标识字段值,提取满足预设的页面跳转关系的记录配对;用户确定单元,用于将提取的记录配对中在后记录的来访时间字段值与在先记录的离开时间字段值之间的差值落在预设正区间的记录配对所代表的用户作为目标用户。
根据本发明之一优选实施例,所述行为级别数据中记录的字段包括访问标识、行为类型、行为发生时间、行为发生位置、行为发生时的页面宽高和行为发生时的浏览器宽高。
根据本发明之一优选实施例,所述行为类型字段值包括以下任意一种:鼠标点击、鼠标移动、鼠标框选、鼠标滚动、键盘输入。
根据本发明之一优选实施例,所述还原单元包括:第二提取单元,用于利用所述页面级别数据中代表所述目标用户的记录配对各自的访问标识字段值,从所述行为级别数据中提取相关记录;行为还原单元,用于按照所述相关记录中行为发生时间字段值确定各条记录相互之间的时间间隔,并按照所述时间间隔依次还原所述相关记录中的各条记录所代表的行为。
根据本发明之一优选实施例,所述行为还原单元包括:判断单元,用于在还原所述相关记录中的一条记录R所代表的行为时,根据所述页面级别数据中与R的访问标识字段值对应的页面标识字段值确定目标还原页面,并判断所述目标还原页面是否已被加载,如果是,则触发第二还原单元执行,否则触发第一还原单元执行;第一还原单元,用于根据R的行为发生时的页面宽高字段值确定还原视窗大小,在所述大小的还原视窗中加载所述目标还原页面,并根据R的行为发生时的浏览器宽高字段值在所述目标还原页面上描绘用户访问时的可视区域,以及,根据R的行为发生位置字段值在所述目标还原页面上进行定位,并在定位区域模拟触发R的行为类型字段值表示的行为;第二还原单元,用于根据R的行为发生时的浏览器宽高字段值对已描绘的可视区域进行调整,以及,根据R的行为发生位置字段值在所述目标还原页面上进行定位,并在定位区域模拟触发R的行为类型字段值表示的行为。
由以上技术方案可以看出,本发明通过在用户对网页访问时,获取页面级别数据和行为级别数据,并利用获取的这些数据,能够将目标用户在多个页面之间的访问行为进行还原,从而便于网页设计人员了解用户对网页的使用情况,为网页设计人员改进网页的现有设计提供帮助。
【附图说明】
图1为本发明中对用户访问行为进行还原的方法的实施例的流程示意图;
图2为本发明中行为还原过程的示意图;
图3为本发明中对用户访问行为进行还原的装置的实施例的结构示意框图;
图4为本发明中行为还原单元2032的实施例的结构示意框图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
请参考图1,图1为本发明中对用户访问行为进行还原的方法的实施例的流程示意图。如图1所示,该实施例的方法包括:
步骤S101:在用户对网页进行访问时,获取页面级别数据及行为级别数据。
步骤S102:根据页面级别数据,确定所访问的页面满足预设的页面跳转关系的目标用户。
步骤S103:根据行为级别数据,对目标用户在具有上述页面跳转关系的页面上的行为进行还原。
下面对上述步骤进行详细说明。
本实施例的方法可分为两个处理阶段,分别是行为记录阶段和行为还原阶段,其中,行为记录阶段在前,用于监控线上用户的网页访问行为,以获取与用户行为相关的数据,其对应图1中的步骤S101。行为还原阶段在后,用于根据行为记录阶段获取的相关数据,对线上用户的网页访问行为进行还原,其对应图1中的步骤S102和步骤S103。
在步骤S101中获取的页面级别数据,其中的一条记录代表一个用户对一个页面的访问,而行为级别数据中的一条记录代表一个用户对一个页面的访问期间产生的一个行为。例如用户A对页面X进行访问,在访问期间产生了鼠标点击行为、鼠标移动行为和鼠标滚动行为,则可以产生一条页面级别数据记录和三条行为级别数据记录,用户B对页面X进行访问,在访问期间产生了鼠标移动行为、键盘输入行为,则可以再产生一条页面级别数据记录和两条行为级别数据记录。
在本实施例中,页面每被访问一次,就会产生一条页面级别数据记录,也就是说,两个不同的用户访问同一页面,可以得到两条页面级别数据记录,同一用户对同一页面访问两次,也会得到两条页面级别数据。
请参考表1,表1为本发明中页面级别数据的一个实施例的示意结构。
表1
Figure BDA00002677131100061
从表1所示的实施例结构可以看出,页面级别数据中记录的字段包括了访问标识、页面标识、来访时间、离开时间和来源页面标识。
其中,访问标识字段用于标识一次页面访问过程,页面标识字段用于标识这次访问过程中用户访问的页面,来访时间字段用于标识用户到达这个页面的时间,离开时间字段用于标识用户离开这个页面的时间,来源页面标识字段用于标识用户到达这个页面的方式。例如表1的第2条记录中来源页面标识字段值为URL100,则表示页面URL200是通过URL100跳转到达的,如果一条记录中来源页面标识字段值为空,则可以表示该条记录中的页面标识字段值表示的页面没有跳转源,例如用户用浏览器直接打开一个页面,该页面就没有跳转源。表1中的第1条记录和第6条记录中来源页面标识字段值都为空,可以认为这两条记录表示的访问过程中,页面URL100是用户直接到达的。
在本实施例中,在一个页面上每产生一个行为,就会产生一条行为级别数据记录。请参考表2,表2为本发明中行为级别数据的一个实施例的示意结构。
表2
Figure BDA00002677131100071
从表2所示的实施例结构可以看出,行为级别数据中记录的字段包括了访问标识、行为类型、行为发生时间、行为发生位置、行为发生时的页面宽高和行为发生时的浏览器宽高。
其中,访问标识字段与页面级别数据中的访问标识字段是对应的,行为级别数据通过访问标识字段与页面级别数据进行关联。在行为级别数据中,相同访问标识字段值的记录,对应页面级别数据中相同的一次页面访问过程,是该次页面访问过程中发生的不同行为。以表2为例,第1和第2条记录中访问标识字段值均为3,则表示这两条记录对应的都是表1中的第3条记录对应的页面URL300的访问过程中发生的行为。
行为类型字段用于标识用户产生的行为类型,在本实施例中,一条记录中的行为类型字段值可以是以下任意一种:鼠标点击、鼠标移动、鼠标框选、鼠标滚动、键盘输入。对应上述每种行为,行为发生位置字段值的记录方式有可能不同的,后面会具体介绍。
行为发生时间字段用于标识用户产生行为的时间,在表2中,行为发生时间字段值的记录方式采用了相对时间,例如表2的第1条记录中,行为发生时间字段值为126,指的是相对页面URL300的加载成功时间往后126个时间单位(例如毫秒),页面URL300的加载成功时间可以认为是表1中来访时间字段值表示的时间。
行为发生时的页面宽高字段用于标识行为发生时所在的页面大小,对表2中的第1条记录而言,就是鼠标点击行为发生时页面URL300的宽和高,在表2中分别用上(1024)和下(768)两个值表示了宽和高。值得注意的是,页面宽高是由页面自身参数决定的值。
行为发生时的浏览器宽高字段用于标识行为发生时用户浏览器的大小。浏览器宽高反映了用户的可视区域,一个页面可能比浏览器大,这时,用户就需要在浏览器上进行滚动才可看到页面大于浏览器的部分。表2中同样也是用上下两个值表示宽和高。值得注意的是,浏览器宽高是用户自己选择的,与所浏览的页面无关。
行为发生位置字段用于标识行为发生时在页面上所处的位置。根据行为类型字段值表示的行为类型不同,行为发生位置字段值记录的方式也可能不同。
对鼠标点击行为而言,行为发生位置可以由页面上DOM节点及点击点相对该DOM节点左上角的坐标来进行记录。DOM节点可以根据页面HTML代码的DOM树按照一定的规则记录,如表2中第1条记录所示,“help~div~em”就是DOM节点的一种记录方式。这条记录中“0.45”和“0.4”分别表示点击点距离“help~div~em”表示的DOM节点的左上角的横坐标值和纵坐标值。
对鼠标移动行为而言,行为发生位置可由鼠标移动停止时所处的DOM节点及停止位置相对该DOM节点左上角的坐标来进行记录。
对鼠标框选行为而言,行为发生位置可由框选行为起始所处的DOM节点和起始位置相对该DOM节点左上角的坐标,以及框选行为终止所处的DOM节点和终止位置相对该DOM节点左上角的坐标来共同记录。
对鼠标滚动行为而言,行为发生位置可由滚动的横向距离和纵向距离记录。例如表2中第2条记录,“300”表示横向滚动了300距离单位(例如像素),“0”表示纵向没有滚动。
对键盘输入行为而言,行为发生位置可由输入行为所处的DOM节点和输入内容共同记录。
以上,对本实施例中的页面级别数据和行为级别数据进行了详细说明,应该理解,无论表1还是表2的数据记录形式,均是为了更好地帮助理解本发明内容而提供的实施例,例如表2中的行为发生时间除了用相对时间方式记录,也可以用绝对时间方式进行记录,行为发生位置的记录方式也可以不局限于上述举例,本领域技术人员可以在上述实施方式基础上进行任意变形,因此不应以表1或表2所示的数据结构对本发明做出限制。
可以理解,在行为记录阶段,即步骤S101中,只需要在用户访问的各个页面中添加获取数据的Javascript代码,即可获取到大量的页面级别数据记录和行为级别数据记录。在行为还原阶段,就可以利用这些记录对用户的行为进行还原。
对网页设计人员而言,对各个页面单独进行分析,还是不能很好地理解用户在多个页面使用过程中的喜好。本实施例可以通过步骤S101获取到的数据,确定执行了页面跳转操作的用户,并把这种用户在多个页面的行为还原出来,能够更好地帮助网页设计人员理解用户需求,从而有利于改善网页设计。并且,从前面的描述已经可以看出,本实施例在步骤S101中获取的数据,完全是与具体用户无关的,即在获取数据时每条记录不与具体用户ID对应,这样可以避免对用户的cookie进行跟踪,从而保护用户的隐私,但是这也为步骤S102中确定目标用户增加了难度。
具体地,本实施例中步骤S102包括:
步骤S1021:根据页面级别数据中各条记录的来源页面标识字段值,提取满足预设的页面跳转关系的记录配对。
步骤S1022:将提取的记录配对中在后记录的来访时间字段值与在先记录的离开时间字段值之间的差值落在预设正区间的记录配对所代表的用户作为目标用户。
以表1中的数据为例,假设预设的页面跳转关系为URL100->URL300,在步骤S1021中根据页面级别数据中各条记录的来源页面标识字段值,可以提取出两个记录配对,分别是记录1->3和记录6->3。在步骤S1022中,对记录配对1->3而言,在后记录3的来访时间字段值与在前记录1的离开时间字段值之间的差值为(13:21:07-12:16:33)=1:04:34,而对记录配对6->3而言,这个差值为(13:21:07-13:21:00)=00:00:07,假设预设正区间为(0,60)秒,则可以知道记录配对6->3所代表的用户是目标用户。
从前面的描述可以知道,页面级别数据中的一条记录代表一个用户对一个页面的访问,也就是说,一条页面级别数据记录可以代表一个用户。通过本实施例的方式,在步骤S1022中确定的记录配对6->3中的两条记录6和3代表的是同一个用户,即执行了从页面URL100跳转到URL300动作的用户,也就是目标用户。如果步骤S1022中确定出两个记录配对,则可以代表两个目标用户。
上述介绍的记录配对是两条记录形成的,实际上记录配对也可以是更多条记录形成的配对,这取决于预设的页面跳转关系形式,例如预设的页面跳转关系形式为URL100->URL300->URL400,则记录配对可以是由三条记录形成的配对。确定目标用户时,可以对记录配对中相邻两个记录的时间差值进行判断,这与前面介绍的是类似的,不再重复。作为一种特殊的形式,预设的页面跳转关系也可以是单个页面,例如页面URL100,在这种情况下,就是将页面URL100对应的记录提取出来,如表1中的记录1和6。
确定了目标用户,就确定了待还原的行为主体。在步骤S103中会把目标用户(即所访问的页面满足预设的页面跳转关系的用户)的行为还原出来。
具体地,步骤S103包括:
步骤S1031:利用页面级别数据中代表目标用户的记录配对各自的访问标识字段值,从行为级别数据中提取相关记录。
步骤S1032:按照提取的相关记录中行为发生时间字段值确定各条记录相互之间的时间间隔,并按照该时间间隔依次还原相关记录中各条记录所代表的行为。
例如记录配对6->3,各自的访问标识字段值为6和3,从表2中提取访问标识为3和6的记录,即表2中的第1、2、3条记录,就是相关记录。
以表2中行为发生时间字段值的记录方式是相对时间为例,在确定各条记录相互之间的时间间隔时,还需要利用表1中的来访时间共同确定,如果发生时间字段值的记录方式是绝对时间,则各条记录相互之间的时间间隔就是行为发生时间字段值相互之间的差值。在步骤S1032中对各条记录代表的行为进行还原时,还原的顺序和还原的进度就根据时间间隔确定。例如在行为记录阶段,用户实际操作是先在页面URL100上发生鼠标点击,而后100秒在页面URL300上发生鼠标点击,而后30秒在页面URL300上又发生鼠标滚动,则在步骤S1032中也会按照这样的时间顺序将各个行为还原出来。
下面对步骤S1032中对相关记录中的一条具体记录所代表的行为进行还原的方式进行介绍。为了描述方便,将这条具体记录称之为R。
还原记录R所代表的行为的步骤具体包括:
步骤S1032_1:根据页面级别数据中与R的访问标识字段值对应的页面标识字段值确定目标还原页面,并判断目标还原页面是否已被加载,如果是,则执行步骤S1032_3,否则执行步骤S1032_2。
步骤S1032_2:根据R的行为发生时的页面宽高字段值确定还原视窗大小,在该大小的还原视窗中加载目标还原页面,并根据R的行为发生时的浏览器宽高字段值在目标还原页面上描绘用户访问时的可视区域,以及,根据R的行为发生位置字段值在目标还原页面上进行定位,并在定位区域模拟触发R的行为类型字段值表示的行为。
步骤S1032_3:根据R的行为发生时的浏览器宽高字段值对已描绘的可视区域进行调整,以及,根据R的行为发生位置字段值在目标还原页面上进行定位,并在定位区域模拟触发R的行为类型字段值表示的行为。
以R是表2中的第1条记录(即访问标识字段值为3,行为类型字段值为click的记录)为例,R的访问标识字段值为3,该访问标识在页面级别数据中对应的页面标识字段值为URL300,则URL300就是目标还原页面。由于R是与URL300相关的第一条记录,此时URL300还未加载,因此步骤S1032_1会转向步骤S1032_2。
请参考图2,图2为本发明中行为还原过程的示意图。图2中给出了步骤S1032_2中所述的还原视窗和可视区域的图示,其中还原视窗是根据R的页面宽高字段值得到的,而可视区域是根据R的浏览器宽高字段值得到的。描绘用户访问时的可视区域,可以用虚线框将可视区域标注出来,也可以采用不同的背景色进行标识。根据R的行为发生位置字段值在目标还原页面上进行定位,具体地,就是根据该字段值中的DOM节点找到还原页面的对应节点,再根据相对该DOM节点的左上角的坐标定位到还原页面上的一个具***置。在定位区域模拟触发R的行为类型字段值表示的行为,就是在定位区域模拟触发鼠标点击行为。这里的模拟触发,可以是在还原页面上绘制一个图标表示发生了鼠标点击(如图2所示),也可以是在还原页面上真实触发一次鼠标点击。作为优选的,对鼠标点击行为,可以在还原页面上绘制一个图标表示;对鼠标移动行为,可以在还原页面上绘制一条移动线表示;对鼠标框选行为,可以在还原页面上绘制框选范围的虚线框;对鼠标滚动行为,可以在还原页面上触发真实的鼠标滚动;对鼠标输入行为,可以在定位区域绘制透明图层,并在透明图层上添加行为发生位置字段值中的输入内容。
以R是表2中的第2条记录(即访问标识字段值为3,行为类型字段值为scroll的记录)为例,由于URL300在还原表2中的第1条记录时已经加载,则步骤S1032_1会转到步骤S1032_3。步骤S1032_3中,根据R的行为发生时的浏览器宽高字段值对已描绘的可视区域进行调整,指的是根据该字段值改变可视区域的大小,使得改变后的可视区域大小与该字段值表示的范围相适应。
以上对还原任意一条记录R所代表的行为的方式进行了完整介绍,通过上述介绍可以看出,本实施例可以实现动态的还原过程,网页设计人员通过这种动态的还原过程,能够对任意一个网页上的用户行为进行分析,也可以对多个具有跳转关系的网页上的用户行为进行分析,这使得充分考察用户在网页上的行为成为可能,极大地有利于网页设计人员改进现有的网页设计。
请参考图3,图3为本发明中对用户访问行为进行还原的装置的实施例的结构示意框图,如图3所示,该实施例的装置包括:数据获取单元201、确定单元202、还原单元203。其中,数据获取单元201可以位于数据记录服务器,而确定单元202和还原单元203可以位于数据处理服务器。这里数据记录服务器和数据处理服务器是一种逻辑上的划分,在物理机器上,这两个服务器可以是两台物理机器,也可以是同一台物理机器。
数据获取单元201,用于在用户对网页进行访问时,获取页面级别数据及行为级别数据,其中页面级别数据中的一条记录代表一个用户对一个页面的访问,行为级别数据中的一条记录代表一个用户对一个页面的访问期间产生的一个行为。
本实施例中,页面级别数据中记录的字段包括访问标识、页面标识、来访时间、离开时间和来源页面标识。行为级别数据中记录的字段包括访问标识、行为类型、行为发生时间、行为发生位置、行为发生时的页面宽高和行为发生时的浏览器宽高。其中行为类型字段值包括以下任意一种:鼠标点击、鼠标移动、鼠标框选、鼠标滚动、键盘输入。
确定单元202,用于根据页面级别数据,确定所访问的页面满足预设的页面跳转关系的目标用户。具体地,确定单元202包括第一提取单元2021和用户确定单元2022。
其中,第一提取单元2021,用于根据页面级别数据中各条记录的来源页面标识字段值,提取满足预设的页面跳转关系的记录配对。用户确定单元2022,用于将提取的记录配对中在后记录的来访时间字段值与在先记录的离开时间字段值之间的差值落在预设正区间的记录配对所代表的用户作为目标用户。
还原单元203,用于根据行为级别数据,对目标用户在具有上述页面跳转关系的页面上的行为进行还原。具体地,还原单元203包括第二提取单元2031和行为还原单元2032。
其中,第二提取单元2031,用于利用页面级别数据中代表目标用户的记录配对各自的访问标识字段值,从行为级别数据中提取相关记录。行为还原单元2032,用于按照相关记录中行为发生时间字段值确定各条记录相互之间的时间间隔,并按照时间间隔依次还原相关记录中的各条记录所代表的行为。
请参考图4,图4为本发明中行为还原单元2032的实施例的结构示意框图。如图4所示,行为还原单元2032包括判断单元2032_1、第一还原单元2032_2和第二还原单元2032_3。
其中判断单元2032_1,用于在还原相关记录中的一条记录R所代表的行为时,根据页面级别数据中与R的访问标识字段值对应的页面标识字段值确定目标还原页面,并判断目标还原页面是否已被加载,如果是,则触发第二还原单元执行,否则触发第一还原单元执行。
第一还原单元2032_2,用于根据R的行为发生时的页面宽高字段值确定还原视窗大小,在该大小的还原视窗中加载目标还原页面,并根据R的行为发生时的浏览器宽高字段值在目标还原页面上描绘用户访问时的可视区域,以及,根据R的行为发生位置字段值在目标还原页面上进行定位,并在定位区域模拟触发R的行为类型字段值表示的行为。
第二还原单元2032_3,用于根据R的行为发生时的浏览器宽高字段值对已描绘的可视区域进行调整,以及,根据R的行为发生位置字段值在目标还原页面上进行定位,并在定位区域模拟触发R的行为类型字段值表示的行为。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (14)

1.一种对用户访问行为进行还原的方法,包括行为记录阶段和行为还原阶段,其中所述行为记录阶段包括:
A.在用户对网页进行访问时,获取页面级别数据及行为级别数据,其中所述页面级别数据中的一条记录代表一个用户对一个页面的访问,所述行为级别数据中的一条记录代表一个用户对一个页面的访问期间产生的一个行为;
所述行为还原阶段包括:
B.根据所述页面级别数据,确定所访问的页面满足预设的页面跳转关系的目标用户;
C.根据所述行为级别数据,对所述目标用户在具有所述页面跳转关系的页面上的行为进行还原。
2.根据权利要求1所述的方法,其特征在于,所述页面级别数据中记录的字段包括访问标识、页面标识、来访时间、离开时间和来源页面标识。
3.根据权利要求2所述的方法,其特征在于,所述步骤B包括:
B1.根据所述页面级别数据中各条记录的来源页面标识字段值,提取满足预设的页面跳转关系的记录配对;
B2.将提取的记录配对中在后记录的来访时间字段值与在先记录的离开时间字段值之间的差值落在预设正区间的记录配对所代表的用户作为目标用户。
4.根据权利要求3所述的方法,其特征在于,所述行为级别数据中记录的字段包括访问标识、行为类型、行为发生时间、行为发生位置、行为发生时的页面宽高和行为发生时的浏览器宽高。
5.根据权利要求4所述的方法,其特征在于,所述行为类型字段值包括以下任意一种:鼠标点击、鼠标移动、鼠标框选、鼠标滚动、键盘输入。
6.根据权利要求4所述的方法,其特征在于,所述步骤C包括:
C1.利用所述页面级别数据中代表所述目标用户的记录配对各自的访问标识字段值,从所述行为级别数据中提取相关记录;
C2.按照所述相关记录中行为发生时间字段值确定各条记录相互之间的时间间隔,并按照所述时间间隔依次还原所述相关记录中的各条记录所代表的行为。
7.根据权利要求6所述的方法,其特征在于,还原所述相关记录中的一条记录R所代表的行为的步骤包括:
S1.根据所述页面级别数据中与R的访问标识字段值对应的页面标识字段值确定目标还原页面,并判断所述目标还原页面是否已被加载,如果是,则执行步骤S3,否则执行步骤S2;
S2.根据R的行为发生时的页面宽高字段值确定还原视窗大小,在所述大小的还原视窗中加载所述目标还原页面,并根据R的行为发生时的浏览器宽高字段值在所述目标还原页面上描绘用户访问时的可视区域,以及,根据R的行为发生位置字段值在所述目标还原页面上进行定位,并在定位区域模拟触发R的行为类型字段值表示的行为;
S3.根据R的行为发生时的浏览器宽高字段值对已描绘的可视区域进行调整,以及,根据R的行为发生位置字段值在所述目标还原页面上进行定位,并在定位区域模拟触发R的行为类型字段值表示的行为。
8.一种对用户访问行为进行还原的装置,包括:
数据获取单元,用于在用户对网页进行访问时,获取页面级别数据及行为级别数据,其中所述页面级别数据中的一条记录代表一个用户对一个页面的访问,所述行为级别数据中的一条记录代表一个用户对一个页面的访问期间产生的一个行为;
确定单元,用于根据所述页面级别数据,确定所访问的页面满足预设的页面跳转关系的目标用户;
还原单元,用于根据所述行为级别数据,对所述目标用户在具有所述页面跳转关系的页面上的行为进行还原。
9.根据权利要求8所述的装置,其特征在于,所述页面级别数据中记录的字段包括访问标识、页面标识、来访时间、离开时间和来源页面标识。
10.根据权利要求9所述的装置,其特征在于,所述确定单元包括:
第一提取单元,用于根据所述页面级别数据中各条记录的来源页面标识字段值,提取满足预设的页面跳转关系的记录配对;
用户确定单元,用于将提取的记录配对中在后记录的来访时间字段值与在先记录的离开时间字段值之间的差值落在预设正区间的记录配对所代表的用户作为目标用户。
11.根据权利要求10所述的装置,其特征在于,所述行为级别数据中记录的字段包括访问标识、行为类型、行为发生时间、行为发生位置、行为发生时的页面宽高和行为发生时的浏览器宽高。
12.根据权利要求11所述的装置,其特征在于,所述行为类型字段值包括以下任意一种:鼠标点击、鼠标移动、鼠标框选、鼠标滚动、键盘输入。
13.根据权利要求11所述的装置,其特征在于,所述还原单元包括:
第二提取单元,用于利用所述页面级别数据中代表所述目标用户的记录配对各自的访问标识字段值,从所述行为级别数据中提取相关记录;
行为还原单元,用于按照所述相关记录中行为发生时间字段值确定各条记录相互之间的时间间隔,并按照所述时间间隔依次还原所述相关记录中的各条记录所代表的行为。
14.根据权利要求13所述的装置,其特征在于,所述行为还原单元包括:
判断单元,用于在还原所述相关记录中的一条记录R所代表的行为时,根据所述页面级别数据中与R的访问标识字段值对应的页面标识字段值确定目标还原页面,并判断所述目标还原页面是否已被加载,如果是,则触发第二还原单元执行,否则触发第一还原单元执行;
第一还原单元,用于根据R的行为发生时的页面宽高字段值确定还原视窗大小,在所述大小的还原视窗中加载所述目标还原页面,并根据R的行为发生时的浏览器宽高字段值在所述目标还原页面上描绘用户访问时的可视区域,以及,根据R的行为发生位置字段值在所述目标还原页面上进行定位,并在定位区域模拟触发R的行为类型字段值表示的行为;
第二还原单元,用于根据R的行为发生时的浏览器宽高字段值对已描绘的可视区域进行调整,以及,根据R的行为发生位置字段值在所述目标还原页面上进行定位,并在定位区域模拟触发R的行为类型字段值表示的行为。
CN201210586613.9A 2012-12-28 2012-12-28 一种对用户访问行为进行还原的方法及装置 Active CN103902436B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210586613.9A CN103902436B (zh) 2012-12-28 2012-12-28 一种对用户访问行为进行还原的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210586613.9A CN103902436B (zh) 2012-12-28 2012-12-28 一种对用户访问行为进行还原的方法及装置

Publications (2)

Publication Number Publication Date
CN103902436A true CN103902436A (zh) 2014-07-02
CN103902436B CN103902436B (zh) 2018-04-03

Family

ID=50993771

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210586613.9A Active CN103902436B (zh) 2012-12-28 2012-12-28 一种对用户访问行为进行还原的方法及装置

Country Status (1)

Country Link
CN (1) CN103902436B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105447195A (zh) * 2015-12-28 2016-03-30 哈尔滨工业大学 一种网页浏览器历史记录页面跳转关系的可视化方法及装置
CN105867751A (zh) * 2015-01-20 2016-08-17 腾讯科技(深圳)有限公司 操作信息处理方法和装置
WO2016177280A1 (zh) * 2015-05-05 2016-11-10 阿里巴巴集团控股有限公司 记录及还原网页中点击位置的方法和装置
CN107944982A (zh) * 2017-12-26 2018-04-20 福建中金在线信息科技有限公司 一种用户行为信息处理方法、装置、电子设备及存储介质
CN108536362A (zh) * 2017-03-02 2018-09-14 百度在线网络技术(北京)有限公司 用于识别操作的方法、装置及服务器
CN108540314A (zh) * 2018-03-22 2018-09-14 微梦创科网络科技(中国)有限公司 用户行为的还原方法及***
CN111309547A (zh) * 2020-01-21 2020-06-19 北京百度网讯科技有限公司 网页信息获取方法、装置和电子设备
CN113377631A (zh) * 2021-05-25 2021-09-10 北京猿力教育科技有限公司 用户行为的回溯方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1804844A (zh) * 2006-01-10 2006-07-19 西安交通大学 一种基于Web页面元数据的用户访问行为形式化描述方法
CN101299688A (zh) * 2008-06-13 2008-11-05 北京缔元信互联网数据技术有限公司 一种获取网页区域点击数量的方法
CN101504671A (zh) * 2009-03-05 2009-08-12 阿里巴巴集团控股有限公司 用户访问网页行为的可视化处理方法、装置及***
US20090313286A1 (en) * 2008-06-17 2009-12-17 Microsoft Corporation Generating training data from click logs
CN102289477A (zh) * 2011-07-29 2011-12-21 深圳市五巨科技有限公司 一种移动终端页面数据筛选的方法和装置
CN102664935A (zh) * 2012-04-06 2012-09-12 北京锐安科技有限公司 一种web类用户行为和用户信息的关联输出方法及***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1804844A (zh) * 2006-01-10 2006-07-19 西安交通大学 一种基于Web页面元数据的用户访问行为形式化描述方法
CN101299688A (zh) * 2008-06-13 2008-11-05 北京缔元信互联网数据技术有限公司 一种获取网页区域点击数量的方法
US20090313286A1 (en) * 2008-06-17 2009-12-17 Microsoft Corporation Generating training data from click logs
CN101504671A (zh) * 2009-03-05 2009-08-12 阿里巴巴集团控股有限公司 用户访问网页行为的可视化处理方法、装置及***
CN102289477A (zh) * 2011-07-29 2011-12-21 深圳市五巨科技有限公司 一种移动终端页面数据筛选的方法和装置
CN102664935A (zh) * 2012-04-06 2012-09-12 北京锐安科技有限公司 一种web类用户行为和用户信息的关联输出方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
阿里巴巴(中文站)用户体验设计部官方网站: "基于网站日志数据挖掘的用户访问行为模式可视化研究_交互设计_酷勤网", 《HTTP://WWW.KUQIN. COM/UIDESIGN/20091221/76093.HTML》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105867751A (zh) * 2015-01-20 2016-08-17 腾讯科技(深圳)有限公司 操作信息处理方法和装置
CN105867751B (zh) * 2015-01-20 2020-06-02 腾讯科技(深圳)有限公司 操作信息处理方法和装置
WO2016177280A1 (zh) * 2015-05-05 2016-11-10 阿里巴巴集团控股有限公司 记录及还原网页中点击位置的方法和装置
CN105447195A (zh) * 2015-12-28 2016-03-30 哈尔滨工业大学 一种网页浏览器历史记录页面跳转关系的可视化方法及装置
CN108536362A (zh) * 2017-03-02 2018-09-14 百度在线网络技术(北京)有限公司 用于识别操作的方法、装置及服务器
CN108536362B (zh) * 2017-03-02 2021-10-19 百度在线网络技术(北京)有限公司 用于识别操作的方法、装置及服务器
CN107944982A (zh) * 2017-12-26 2018-04-20 福建中金在线信息科技有限公司 一种用户行为信息处理方法、装置、电子设备及存储介质
CN108540314A (zh) * 2018-03-22 2018-09-14 微梦创科网络科技(中国)有限公司 用户行为的还原方法及***
CN111309547A (zh) * 2020-01-21 2020-06-19 北京百度网讯科技有限公司 网页信息获取方法、装置和电子设备
CN113377631A (zh) * 2021-05-25 2021-09-10 北京猿力教育科技有限公司 用户行为的回溯方法及装置

Also Published As

Publication number Publication date
CN103902436B (zh) 2018-04-03

Similar Documents

Publication Publication Date Title
CN103902436A (zh) 一种对用户访问行为进行还原的方法及装置
CN106682144B (zh) 页面展示方法和装置
CN103064863B (zh) 一种提供推荐信息的方法与设备
US10146421B1 (en) Online information system with per-document selectable items
CN102629273B (zh) 基于浏览器的广告信息推送方法、装置及浏览器***
US20160077695A1 (en) Methods, Systems, And Computer Program Products For Grouping Tabbed Portions Of A Display Object Based On Content Relationships And User Interaction Levels
CN102316130B (zh) 一种基于用户的行为判断其与好友的亲疏度的方法与设备
US20150220990A1 (en) Systems and methods of serving parameter-dependent content to a resource
De Choudhury et al. What makes conversations interesting? themes, participants and consequences of conversations in online social media
US20140068411A1 (en) Methods and apparatus to monitor usage of internet advertising networks
US20140033007A1 (en) Modifying the presentation of a content item
US20150066579A1 (en) Method of and Apparatus for Determining Worth of a Displayed Component
US20140164385A1 (en) Method And System For Categorizing Users Browsing Web Content
CN105930363A (zh) 一种基于html5网页的用户行为分析方法及装置
CN103136335A (zh) 一种基于数据平台的数据控制方法
US20150310484A1 (en) System and Method for Tracking User Engagement with Online Advertisements
WO2010024979A2 (en) Advertising system for internet discussion forums
CN102831114B (zh) 实现互联网用户访问情况统计分析的方法及装置
CN104221006A (zh) 包括视频的网页内容的优化
US20130339839A1 (en) Analyzing User Interaction
CN105094622B (zh) 调节表格列宽的方法及设备
CN103336815A (zh) 网络广告推送的***和方法
CN104134108A (zh) 电子商务网站销售数据分析方法
CN104166741B (zh) 网页浏览分析处理方法及装置
CN101753380A (zh) 监控存储器消耗

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant