CN114157647A - 用户浏览网页的追踪方法、装置、电子设备及存储介质 - Google Patents
用户浏览网页的追踪方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114157647A CN114157647A CN202111334116.5A CN202111334116A CN114157647A CN 114157647 A CN114157647 A CN 114157647A CN 202111334116 A CN202111334116 A CN 202111334116A CN 114157647 A CN114157647 A CN 114157647A
- Authority
- CN
- China
- Prior art keywords
- browsing
- target
- webpage
- user
- website
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 156
- 238000012806 monitoring device Methods 0.000 claims abstract description 66
- 230000008569 process Effects 0.000 claims description 111
- 230000014509 gene expression Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012544 monitoring process Methods 0.000 claims description 5
- 230000006399 behavior Effects 0.000 description 16
- 238000011161 development Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000013461 design Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及一种用户浏览网页的追踪方法、装置、电子设备及存储介质,其中方法包括:接收网页监听装置发送的用户的当前浏览网址;确定与所述当前浏览网址匹配的目标网页浏览流程;根据所述目标网页浏览流程以及所述网页监听装置发送的所述用户的后续浏览网址对所述用户浏览网页进行追踪,当用户在不同的***之间浏览不同的网页时,通过网页监听装置将网址发送至服务器端,无需将不同的***之间进行对接。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种用户浏览网页的追踪方法、装置、电子设备及存储介质。
背景技术
随着互联网的发展,H5的应用场景非常广泛,可以是PC端的页面,可以是APP内的页面,也可以是小程序内的页面。用户对H5的浏览都是基于URL技术(Uniform ResourceLocator,统一资源***)进行资源定位进行访问,不同的***有不同的URL资源地址,在单一***中可以通过定制化分析区分单个用户的浏览行为,但是想要了解单个用户的在不同***间的访问行为就需要进行跨***用户访问追踪。
在传统方式中对于用户跨***的访问追踪涉及到各个***的对接联调,需要嵌入到业务***中进行定制化设计和开发针对不同的数据进行统计分析,需要耗费较多的精力和人员进行梳理开发。
发明内容
为解决上述技术问题,本发明提供了一种用户浏览网页的追踪方法、装置、电子设备及存储介质,具体方案如下:
第一方面,提供一种用户浏览网页的追踪方法,应用于服务器中,所述方法包括:
接收网页监听装置发送的用户的当前浏览网址;
确定与所述当前浏览网址匹配的目标网页浏览流程;
根据所述目标网页浏览流程以及所述网页监听装置发送的所述用户的后续浏览网址对所述用户浏览网页进行追踪。
在一个较佳的实施方式中,所述根据所述目标网页浏览流程以及所述网页监听装置发送的所述用户的后续浏览网址对所述用户浏览网页进行追踪包括:
根据所述目标网页浏览流程确定所述当前浏览网址是否与所述目标网页浏览流程的目标开始节点匹配;
若匹配,则所述根据网页监听装置发送的所述用户的所述后续浏览网址对所述用户浏览网页进行追踪。
在一个较佳的实施方式中,所述根据网页监听装置发送的所述用户的所述后续浏览网址对所述用户浏览网页进行追踪包括:
根据所述目标网页浏览流程确定所述后续浏览网址是否与所述目标网页浏览流程的目标中间节点或者目标结束节点匹配;
若与所述目标中间节点匹配,则继续根据所述目标网页浏览流程对所述用户浏览网页的追踪;
若与所述目标结束节点匹配,则结束对所述用户浏览网页的追踪。
在一个较佳的实施方式中,所述根据网页监听装置发送的所述用户的所述后续浏览网址对所述用户浏览网页进行追踪还包括:
若所述后续浏览网址均不与所述目标中间节点或所述目标结束节点匹配,则确定与所述后续浏览网址匹配的后续网页浏览流程;
根据所述后续网页浏览流程对所述用户浏览网页进行追踪。
在一个较佳的实施方式中,所述根据所述目标网页浏览流程确定所述当前浏览网址是否与所述目标网页浏览流程的目标开始节点匹配包括:
获取所述目标网页浏览流程的目标流程编码;
根据所述目标流程编码确定所述目标开始节点的开始节点编码;
根据所述开始节点编码确定所述目标开始节点的目标开始网址;
根据所述当前浏览网址以及所述目标开始网址的正则表达式确定所述当前浏览网址是否与所述目标开始节点匹配。
在一个较佳的实施方式中,所述方法还包括:
将用户标记为目标用户并记录用户浏览网页中与目标网页浏览流程匹配的目标浏览网页对应的目标流程节点,目标流程节点编码以及目标用户的访问时间。
在一个较佳的实施方式中,所述根据所述目标网页浏览流程以及所述网页监听装置发送的所述用户的后续浏览网址对所述用户浏览网页进行追踪之前还包括:
将所述目标网页浏览流程的目标流程编码以及所述当前浏览网址的流程节点编码发送至所述网页监听装置,以使所述网页监听装置根据所述目标流程编码以及所述流程节点编码对所述用户标记并监听所述用户的后续浏览网址。
在一个较佳的实施方式中,所述确定与所述当前浏览网址匹配的目标网页浏览流程之前包括:
根据预先配置的网页浏览流程的各个流程节点所对应的网址构建流程图谱;
所述确定与所述当前浏览网址匹配的目标网页浏览流程包括:
将所述当前浏览网址与所述流程图谱匹配从而确定所述目标网页浏览流程。
第二方面,提供一种用户浏览网页的追踪装置,应用于服务器中,所述装置包括:
接收模块,用于接收网页监听装置发送的用户的当前浏览网址;
匹配模块,用于确定与所述当前浏览网址匹配的目标网页浏览流程;
追踪模块,用于根据所述目标网页浏览流程以及所述网页监听装置发送的所述用户的后续浏览网址对所述用户浏览网页进行追踪。
第三方面,提供一种电子设备,包括:
一个或多个处理器;以及
与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如前所述的方法。
第四方面,提供一种计算机存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如前所述的方法。
本发明具有如下技术效果:
(1)由嵌入到网页端的网页监听装置发送用户浏览网页的网址,当用户在不同的***之间浏览不同的网页时,仍然是由该网页的网页监听装置将网址发送至服务器端,无需将不同的***之间进行对接,因此,节省了较多的人力成本以及时间成本。
(2)服务器端在接收到当前浏览网址后,获取与当前浏览网址匹配的目标网页浏览流程,并根据目标网页浏览流程以及后续浏览网址对用户浏览网页进行追踪,通过服务器端实现定制化设计和开发不同的网页浏览流程,不仅满足不同的应用场景,而且无需嵌入到业务***中进行网页浏览流程的定制化设计和开发,节省较多的人力成本。
(3)只有当根据目标网页浏览流程确定当前浏览网址为目标网页浏览流程的目标开始节点,才根据网页监听装置发送的用户的后续浏览网址对用户浏览网页进行追踪,过滤掉用户的无效浏览行为,当对用户的浏览行为分析时,大大减少了分析数据,从而提高分析效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中用户浏览网页的追踪方法的流程图;
图2为本发明实施例中用户浏览网页的追踪方法的框架图;
图3为本发明实施例中用户浏览网页的追踪方法的示例图;
图4为本发明实施例中用户浏览网页的追踪装置的示意图;
图5为本发明实施例中电子设备的架构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面将结合具体实施例对本发明做进一步的说明。
如图1所示,本发明提供了一种用户浏览网页的追踪方法,应用于服务器中,该方法包括:
S11、接收网页监听装置发送的用户的当前浏览网址。
在步骤中,网页端嵌入了网页监听装置,当用户浏览到当前网页时,网页监听装置监听到用户的浏览行为,而后将该当前网页的当前网址发送给服务器端。网页监听装置可以为JSSDK(JavaScript安装包),可以通过JavaScript的方法获取到用户浏览网页的网址,网址可以为URL网址。当用户浏览到不同***的网页时,都是由网页监听装置发送当前网址,因此,无需涉及到各个***的对接联调。
S12、确定与当前浏览网址匹配的目标网页浏览流程。
在本步骤中,网页监听装置将用户当前浏览网页的当前浏览网址发送给服务器,服务器中存储有网页浏览流程,网页浏览流程为预先配置好的标准的网页浏览流程,比如用户浏览的过程为网页A-网页B-网页C。
在接收到当前网址后,将当前网址与网页浏览流程匹配,从而确定目标网页浏览流程。
S13、根据目标网页浏览流程以及网页监听装置发送的用户的后续浏览网址对用户浏览网页进行追踪。
在本步骤中,网页监听装置持续监听用户所浏览的网页,因此会持续向服务器端发送用户的后续浏览网址,服务器在接收到后续浏览网址后,根据目标网页浏览流程以及后续浏览网址对用户浏览网页进行追踪,并由网页监听装置记录下用户浏览目标网页浏览流程的每一个节点的访问时间。
在本发明中,一方面,服务器端接收由嵌入到网页端的网页监听装置发送用户浏览网页的网址,当用户在不同的***之间浏览不同的网页时,仍然是由该网页的网页监听装置将网址发送至服务器端,无需将不同的***之间进行对接,因此,节省了较多的人力成本以及时间成本,减少1套客户端采集数据设计和开发,减少1套服务器端***设计和开发,减少客户端和服务器端服务的联调和测试;另一方面,服务器端在接收到当前浏览网址后,获取与当前浏览网址匹配的目标网页浏览流程,并根据目标网页浏览流程以及网页监听装置发送的用户的后续浏览网址对用户浏览网页进行追踪,通过服务器端实现定制化设计和开发不同的网页浏览流程,不仅满足不同的应用场景,而且无需嵌入到业务***中进行网页浏览流程的定制化设计和开发,节省较多的人力成本。
在一个较佳的实施方式中,S13、根据目标网页浏览流程以及网页监听装置发送的用户的后续浏览网址对用户浏览网页进行追踪包括:
根据目标网页浏览流程确定当前浏览网址是否与目标网页浏览流程的目标开始节点匹配;
若匹配,则根据网页监听装置发送的用户的后续浏览网址对用户浏览网页进行追踪。
在本实施例中,根据当前浏览网址确定的目标网页浏览流程可能不止一个,此时,需要进一步根据目标网页浏览流程确定当前浏览网址与目标网页浏览流程的目标开始节点匹配,如图2所示,如果匹配,则将用户标记为目标用户,开启对目标用户的浏览网页的持续追踪,并由网页监听装置记录下用户访问目标网页浏览流程中的每一个节点的访问时间,服务器则根据网页监听装置发送的用户的后续浏览网址对用户浏览网页进行追踪,如果不为目标开始节点,那么可能是目标网页浏览流程之外的其他网址,则无法将用户标记为目标用户,无法开启对该用户的浏览网页的持续追踪,也即是,只有当当前浏览网址是目标网页浏览流程的目标开始节点时,才对用户的浏览网页进行追踪,在实际应用中,预先配置好的网页浏览流程1为网页A-网页B-网页C,只有当网页监听装置将网页A的网址发送给服务器后,服务器对网页A的网址匹配,匹配到为网页浏览流程1的开始节点,才对用户的网页浏览的过程追踪,否则,判断服务器判断为无效的浏览行为,不对用户的浏览过程追踪。
在本实施例中,只有当根据目标网页浏览流程确定当前浏览网址为目标网页浏览流程的目标开始节点,才根据网页监听装置发送的用户的后续浏览网址对用户浏览网页进行追踪,过滤掉用户的无效浏览行为,当对用户的浏览行为分析时,大大减少了分析数据,从而提高分析效率。
在一个较佳的实施方式中,根据网页监听装置发送的用户的后续浏览网址对用户浏览网页进行追踪包括:
根据目标网页浏览流程确定后续浏览网址是否与目标网页浏览流程的目标中间节点或者目标结束节点匹配;
若与目标中间节点匹配,则继续根据目标网页浏览流程对用户浏览网页的追踪;
若与目标结束节点匹配,则结束对用户浏览网页的追踪。
在本实施例中,服务器端在接收到网页监听装置发送的后续浏览网址后,根据目标网页浏览流程确定后续浏览流程是否与目标中间节点或者目标结束节点匹配,具体的,获取目标网页浏览流程的目标中间节点或目标结束节点对应的目标中间网址或目标结束网址,将后续浏览网址的正则表达式(Regular Expression)与目标开始网址或目标结束网址的正则表达式匹配,再次参考图2,若与目标中间网址匹配,那么后续浏览网址为目标中间节点,服务器端继续根据目标网页浏览流程对用户浏览网页追踪,若与目标结束网址匹配,那么后续浏览网址为目标结束节点,而后执行不同的步骤,比如,网页浏览流程2为网页A-网页B-网页C-网页D-网页E,服务器端接收到网页A的网址后,开始对用户的网页浏览追踪,若后续浏览网址与网页B的网址匹配,那么,继续根据网页浏览流程2对用户浏览网页追踪,若后续浏览网址与网页E的网址匹配,那么结束对用户浏览网页的追踪。
在实际应用中,本发明适用于用户在多***的网页浏览,因此,用户对于目标中间节点对应网址的浏览,可能是反复的或者不一定按照预先设置的网页浏览流程,那么仍然需要对用户的这一浏览行为追踪,网页监听装置记录下用户的访问时间,便于后续对该用户的浏览行为进行分析。
在一个较佳的实施方式中,根据网页监听装置发送的用户的后续浏览网址对用户浏览网页进行追踪还包括:
若后续浏览网址均不与目标中间节点或目标结束节点匹配,则确定与后续浏览网址匹配的后续网页浏览流程;
根据后续网页浏览流程对用户浏览网页进行追踪。
在本实施例中,用户的后续浏览网址可能与目标中间节点或目标结束节点均不匹配,也即是,后续浏览网址不在目标网页浏览流程的所有节点上,那么需要获取与后续浏览网址匹配的后续网页浏览流程,这里存在两种情况,如图2所示,一种是存在后续网页浏览流程,也即是,存在某一后续网页浏览流程,其开始节点与后续浏览网址相匹配,此时,服务器端对用户的网页浏览流程进行更新,不再根据目标网页浏览流程对用户浏览网页追踪,而是根据后续网页浏览流程对用户浏览网页进行追踪,另一种是不存在后续网页浏览流程,也即是,不存在某一后续网页浏览流程的开始节点与后续浏览网址相匹配,此时,服务器端判定后续浏览网址为其他节点的浏览网址,则将其标记为非流程节点的浏览,在实际应用中,由于本发明适用户在多***之间的网页浏览,因此,可能在某一***中浏览的网页为目标开始节点,突然跳转到另一***中,该网页与预先设定的网页浏览流程均不相关,因此,将其标记为非流程节点,从而可以在用户整个浏览网页的行为中的操作可实时进行识别匹配流程并且标记记录,那么后续对于用户访问行为分析时,可以根据用户对于不同类型的节点访问时间或者访问次数,分析用户的访问行为。
在一个较佳的实施方式中,根据目标网页浏览流程确定当前浏览网址是否与目标网页浏览流程的目标开始节点匹配包括:
获取目标网页浏览流程的目标流程编码;
根据目标流程编码确定目标开始节点的开始节点编码;
根据开始节点编码确定目标开始节点的目标开始网址;
根据当前浏览网址以及目标开始网址的正则表达式确定当前浏览网址是否与目标开始节点匹配。
在本实施例中,流程编码是一种对单个流程进行描述的文字格式,可通过流程编码唯一标识流程,流程节点编码是一种对单个流程节点进行描述的文字格式,可通过流程节点编码唯一指定流程节点,在确定目标网页浏览流程后,可以获取目标网页浏览流程的目标流程编码,根据目标流程编码确定目标开始节点的开始节点编码,根据开始节点编码确定目标开始节点的目标开始网址,进一步地,将当前浏览网址以及目标开始网址的正则表达式匹配,若能匹配,那么当前浏览网址与目标开始节点匹配,通过目标流程编码能够快速找到目标开始节点编码,进而找到目标开始网址,从而提高了对于目标开始节点的判断速度,同时,根据当前浏览网址以及目标开始网址的正则表达式确定当前浏览网址是否与目标开始节点匹配,不仅提高了匹配的效率,也提高了匹配的准确性。
在一个较佳的实施方式中,该方法还包括:
将用户标记为目标用户并记录用户浏览网页中与目标网页浏览流程匹配的目标浏览网页所对应的目标流程节点,目标流程节点编码以及目标用户的访问时间。
在本实施例中,若用户的当前浏览网页与目标开始节点匹配,那么,将用户标记为目标用户,开始对目标用户的追踪,记录目标开始节点以及访问目标开始节点的时间。在后续对目标用户浏览网页追踪的过程中,若有与目标网页浏览流程匹配的目标浏览网页,则记录下目标浏览网页对应的目标流程节点,以及目标流程节点编码,用户的访问时间,由此记录下用户的浏览行为,便于后续对用户浏览行为的分析。
在一个较佳的实施方式中,S13、根据目标网页浏览流程以及网页监听装置发送的用户的后续浏览网址对用户浏览网页进行追踪之前还包括:
将目标网页浏览流程的目标流程编码以及当前浏览网址的流程节点编码发送至网页监听装置,以使网页监听装置根据目标流程编码以及流程节点编码对用户标记并监听用户的后续浏览网址。
在本实施例中,服务器端根据目标网页浏览流程获取相应的目标流程编码以及当前浏览网址对应的流程节点编码,并将目标网页浏览流程的目标流程编码以及当前浏览网址的流程节点编码发送至网页监听装置,网页监听装置一方面对用户标记,存储目标流程编码以及流程节点编码以及访问时间,便于网页追踪装置对用户的后续浏览网址的监听与采集,再一方面,网页监听装置在接收到目标流程编码以及流程节点编码后,判断是否满足预设的编码规则,若满足,则仅采集满足预设规则的浏览网址再发送至服务器端即可,不仅减少了与服务器端的数据交互量,也提高了数据交互的效率。
如图3所示,用户通过客户端浏览了页面a,网页监听装置提页面a的网址,发送给服务器端,服务器端匹配到页面a对应的流程编码为P-a,查找到该流程编码对应的开始节点编码,并找到开始网址,将开始网址与页面a的网址匹配,能够匹配上,记录下开始节点编码N-a,将流程编码以及开始节点编码发送给网页监听装置;网页监听装置对用户的访问行为进行标记,访问时间,并且本地存储流程编码以及开始节点编码,网页监听装置持续监听用户的网页浏览;当用户浏览到页面b,采取同样的方法,先由网页监听装置将页面b对应的网址发给服务器端,服务器端匹配到页面b的网址为浏览流程P-a的中间节点N-b,将流程编码以及中间节点编码发送给网页监听装置;网页监听装置标记用户在网页b的访问时间,并且本地存储流程编码以及开始节点编码;若用户跳转到网页c,而该网页c的网址,服务器端无法将其与浏览流程P-a的任一节点匹配,并且也无法将其与其他浏览流程的开始节点匹配,那么将其标记为非流程节点,此时网页监听装置记录用户的访问时间,本地存储仍然为上一次对于页面b的流程编码以及中间节点编码;若用户跳转到网页d,网页d的网址与结束节点匹配,服务器端将流程编码P-a以及结束节点编码N-d发送给网页监听装置,网页监听装置标记用户的访问时间,并且本地存储流程编码以及结束节点编码,由此可见,客户端本地存储有用户在某一个浏览流程的整个过程的记录,便于对用户浏览行为的分析。
在一个较佳的实施方式中,确定与当前浏览网址匹配的目标网页浏览流程之前包括:
根据预先配置的网页浏览流程的各个流程节点所对应的网址构建流程图谱;
确定与当前浏览网址匹配的目标网页浏览流程包括:
将当前浏览网址与流程图谱匹配从而确定目标网页浏览流程。
在本实施例中,开发人员可以根据需要预先配置网页浏览流程,网页浏览流程包括多个流程节点,流程节点主要包括开始节点,中间节点以及结束节点,一个网页浏览流程包含一个开始节点,零个或多个中间节点,一个结束节点,一个网页浏览流程必须以开始节点为开始,结束节点为结束。预先配置好网页浏览流程的开始节点对应的开始网址,中间节点对应的中间网址以及结束节点对应的结束网址构建流程图谱,流程图谱的每一图谱节点为每一个网址,每一个网址具有相应的流程节点属性,也即是开始节点,中间节点或结束节点,以及所在的网页浏览流程。
当服务器获取到当前网址后,将当前网址与流程图谱匹配,从而可以确定与当前浏览网址匹配的目标网页浏览流程,具体的,将当前网址的正则表达式与流程图谱中的网址的正则表达式匹配,从而确定与当前网址匹配的图谱节点,根据该图谱节点进而可以确定与该图谱节点对应的网页浏览流程,即为目标网页浏览流程。
在本实施例中,根据预先配置的网页浏览流程的各个流程节点所对应的网址构建流程图谱,一方面,可以配置不同的网页浏览流程满足不同的需求,另一方面,通过对流程图谱的预先建立,从而在获取到当前网址后,只需要将当前网址与流程图谱相匹配,即可快速确定目标网页浏览流程,从而提高了对用户网页追踪的效率。
如图4所示,本发明还提供了一种用户浏览网页的追踪装置,应用于服务器中,该装置包括:
接收模块41,用于接收网页监听装置发送的用户的当前浏览网址;
匹配模块42,用于确定与当前浏览网址匹配的目标网页浏览流程;
追踪模块43,用于根据目标网页浏览流程以及网页监听装置发送的用户的后续浏览网址对用户浏览网页进行追踪。
在一个较佳的实施方式中,匹配模块42还用于根据目标网页浏览流程确定当前浏览网址是否与目标网页浏览流程的目标开始节点匹配;
追踪模块43,用于若匹配,则根据网页监听装置发送的用户的后续浏览网址对用户浏览网页进行追踪。
在一个较佳的实施方式中,匹配模块42还用于根据目标网页浏览流程确定后续浏览网址是否与目标网页浏览流程的目标中间节点或者目标结束节点匹配;
追踪模块43还用于若与目标中间节点匹配,则继续根据目标网页浏览流程对用户浏览网页的追踪;若与目标结束节点匹配,则结束对用户浏览网页的追踪。
在一个较佳的实施方式中,匹配模块42还用于若后续浏览网址均不与目标中间节点或目标结束节点匹配,则确定与后续浏览网址匹配的后续网页浏览流程;
追踪模块43还用于根据后续网页浏览流程对用户浏览网页进行追踪。
在一个较佳的实施方式中,还包括获取模块,用于获取模块还用于获取所述目标网页浏览流程的目标流程编码;
还包括确定模块,用于根据目标流程编码确定目标开始节点的开始节点编码;根据开始节点编码确定目标开始节点的目标开始网址;
匹配模块42还用于根据当前浏览网址以及目标开始网址的正则表达式确定当前浏览网址是否与目标开始节点匹配。
在一个较佳的实施方式中,该装置还包括发送模块,用于将目标网页浏览流程的目标流程编码以及当前浏览网址的流程节点编码发送至网页监听装置,以使网页监听装置根据目标流程编码以及流程节点编码对用户标记并监听用户的后续浏览网址。
在一个较佳的实施方式中,还包括构建模块,用于根据预先配置的网页浏览流程的各个流程节点所对应的网址构建流程图谱;
匹配模块42还用于将当前浏览网址与流程图谱匹配从而确定目标网页浏览流程。
本实施例所能实现的技术效果请参照用户浏览网页的追踪方法的描述,此处不再赘述。
本发明还提供了一种电子设备,包括:
一个或多个处理器;以及
与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行用户浏览网页的追踪方法。
本实施例执行过程及所能实现的技术效果请参照应用户浏览网页的追踪方法的描述,此处不再赘述。
本发明还提供了一种计算机存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如前所述的用户浏览网页的追踪方法,该方法的执行过程及所能实现的技术效果请参照如前的描述,此处不再赘述。
其中,图5示例性的展示出了电子设备的架构,具体可以包括处理器510,视频显示适配器511,磁盘驱动器512,输入/输出接口513,网络接口514,以及存储器520。上述处理器510、视频显示适配器511、磁盘驱动器512、输入/输出接口513、网络接口514,与存储器520之间可以通过通信总线530进行通信连接。
其中,处理器510可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本申请所提供的技术方案。
存储器520可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器520可以存储用于控制计算机***500运行的操作***521,用于控制计算机***500的低级别操作的基本输入输出***(BIOS)。另外,还可以存储网页浏览器523,数据存储管理***524,以及设备标识信息处理***525等等。上述设备标识信息处理***525就可以是本申请实施例中具体实现前述各步骤操作的应用程序。总之,在通过软件或者固件来实现本申请所提供的技术方案时,相关的程序代码保存在存储器520中,并由处理器510来调用执行。
输入/输出接口513用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
网络接口514用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线530包括一通路,在设备的各个组件(例如处理器510、视频显示适配器511、磁盘驱动器512、输入/输出接口513、网络接口514,与存储器520)之间传输信息。
另外,该电子设备500还可以从虚拟资源对象领取条件信息数据库541中获得具体领取条件的信息,以用于进行条件判断,等等。
需要说明的是,尽管上述设备仅示出了处理器510、视频显示适配器511、磁盘驱动器512、输入/输出接口513、网络接口514,存储器520,总线530等,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本申请方案所必需的组件,而不必包含图中所示的全部组件。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储器被安装,或者从ROM被安装。在该计算机程序被处理器执行时,执行本申请的实施例的方法中限定的上述功能。
需要说明的是,本申请的实施例的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本申请的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(Radio Frequency,射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述服务器中所包含的;也可以是单独存在,而未装配入该服务器中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该服务器执行时,使得该服务器:响应于检测到终端的外设模式未激活时,获取终端上应用的帧率;在帧率满足息屏条件时,判断用户是否正在获取终端的屏幕信息;响应于判断结果为用户未获取终端的屏幕信息,控制屏幕进入立即暗淡模式。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的实施例的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***或***实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的***及***实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上对本申请所提供的用户浏览网页的追踪方法、装置、电子设备及存储介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本申请的限制。
Claims (11)
1.一种用户浏览网页的追踪方法,其特征在于,应用于服务器中,所述方法包括:
接收网页监听装置发送的用户的当前浏览网址;
确定与所述当前浏览网址匹配的目标网页浏览流程;
根据所述目标网页浏览流程以及所述网页监听装置发送的所述用户的后续浏览网址对所述用户浏览网页进行追踪。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标网页浏览流程以及所述网页监听装置发送的所述用户的后续浏览网址对所述用户浏览网页进行追踪包括:
根据所述目标网页浏览流程确定所述当前浏览网址是否与所述目标网页浏览流程的目标开始节点匹配;
若匹配,则所述根据网页监听装置发送的所述用户的所述后续浏览网址对所述用户浏览网页进行追踪。
3.根据权利要求2所述的方法,其特征在于,所述根据网页监听装置发送的所述用户的所述后续浏览网址对所述用户浏览网页进行追踪包括:
根据所述目标网页浏览流程确定所述后续浏览网址是否与所述目标网页浏览流程的目标中间节点或者目标结束节点匹配;
若与所述目标中间节点匹配,则继续根据所述目标网页浏览流程对所述用户浏览网页的追踪;
若与所述目标结束节点匹配,则结束对所述用户浏览网页的追踪。
4.根据权利要求3所述的方法,其特征在于,所述根据网页监听装置发送的所述用户的所述后续浏览网址对所述用户浏览网页进行追踪还包括:
若所述后续浏览网址均不与所述目标中间节点或所述目标结束节点匹配,则确定与所述后续浏览网址匹配的后续网页浏览流程;
根据所述后续网页浏览流程对所述用户浏览网页进行追踪。
5.根据权利要求2所述的方法,其特征在于,所述根据所述目标网页浏览流程确定所述当前浏览网址是否与所述目标网页浏览流程的目标开始节点匹配包括:
获取所述目标网页浏览流程的目标流程编码;
根据所述目标流程编码确定所述目标开始节点的开始节点编码;
根据所述开始节点编码确定所述目标开始节点的目标开始网址;
根据所述当前浏览网址以及所述目标开始网址的正则表达式确定所述当前浏览网址是否与所述目标开始节点匹配。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
将用户标记为目标用户并记录用户浏览网页中与所述目标网页浏览流程匹配的目标浏览网页对应的目标流程节点,目标流程节点编码以及目标用户的访问时间。
7.根据权利要求5所述的方法,其特征在于,所述根据所述目标网页浏览流程以及所述网页监听装置发送的所述用户的后续浏览网址对所述用户浏览网页进行追踪之前还包括:
将所述目标网页浏览流程的目标流程编码以及所述当前浏览网址的流程节点编码发送至所述网页监听装置,以使所述网页监听装置根据所述目标流程编码以及所述流程节点编码对所述用户标记并监听所述用户的后续浏览网址。
8.根据权利要求1至7任一项所述的方法,其特征在于,所述确定与所述当前浏览网址匹配的目标网页浏览流程之前包括:
根据预先配置的网页浏览流程的各个流程节点所对应的网址构建流程图谱;
所述确定与所述当前浏览网址匹配的目标网页浏览流程包括:
将所述当前浏览网址与所述流程图谱匹配从而确定所述目标网页浏览流程。
9.一种用户浏览网页的追踪装置,其特征在于,应用于服务器中,所述装置包括:
接收模块41,用于接收网页监听装置发送的用户的当前浏览网址;
匹配模块42,用于确定与所述当前浏览网址匹配的目标网页浏览流程;
追踪模块43,用于根据所述目标网页浏览流程以及所述网页监听装置发送的所述用户的后续浏览网址对所述用户浏览网页进行追踪。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;以及
与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如权利要求1至8中任一项所述的方法。
11.一种计算机存储介质,其特征在于,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1至8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111334116.5A CN114157647A (zh) | 2021-11-11 | 2021-11-11 | 用户浏览网页的追踪方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111334116.5A CN114157647A (zh) | 2021-11-11 | 2021-11-11 | 用户浏览网页的追踪方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114157647A true CN114157647A (zh) | 2022-03-08 |
Family
ID=80460157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111334116.5A Pending CN114157647A (zh) | 2021-11-11 | 2021-11-11 | 用户浏览网页的追踪方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114157647A (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080177746A1 (en) * | 2007-01-23 | 2008-07-24 | Marat Borin | Cash back tracker / browser redirecting system |
US20100198768A1 (en) * | 2009-01-30 | 2010-08-05 | Dong Zhou | System and methods for optimizing user interaction in web-related activities |
WO2010102165A1 (en) * | 2009-03-05 | 2010-09-10 | Alibaba Group Holding Limited | Method, apparatus and system for visualizing user's web page browsing behavior |
CN105260424A (zh) * | 2015-09-28 | 2016-01-20 | 北京奇虎科技有限公司 | 用户浏览网页历史记录和最常访问的处理方法及装置 |
CN106202357A (zh) * | 2016-07-06 | 2016-12-07 | 湖南艾瓦特网络科技有限公司 | 一种网站浏览数据分析方法和装置 |
US20160364771A1 (en) * | 2012-08-15 | 2016-12-15 | Ghostery, Inc. | Methods, apparatus, and systems for surveillance of third-party digital technology vendors providing secondary content in a content publisher's web page |
CN106294648A (zh) * | 2016-08-03 | 2017-01-04 | 腾讯科技(深圳)有限公司 | 一种针对页面访问路径的处理方法及装置 |
CN107562426A (zh) * | 2017-09-04 | 2018-01-09 | 清华大学 | 无埋点式云端收集分析浏览器Trace的方法及*** |
CN108829693A (zh) * | 2018-04-13 | 2018-11-16 | 拉扎斯网络科技(上海)有限公司 | 一种用户访问轨迹的获取方法、装置及存储介质 |
CN109284458A (zh) * | 2018-09-28 | 2019-01-29 | 平安普惠企业管理有限公司 | 网页显示方法、装置、计算机设备及存储介质 |
CN109462648A (zh) * | 2018-11-13 | 2019-03-12 | 北京字节跳动网络技术有限公司 | 一种用户行为跟踪方法、装置、设备和储存介质 |
CN109688210A (zh) * | 2018-12-14 | 2019-04-26 | 平安城市建设科技(深圳)有限公司 | 追踪用户信息的方法、装置、服务器及存储介质 |
CN111131442A (zh) * | 2019-12-19 | 2020-05-08 | 广州品唯软件有限公司 | 网页数据的监听方法、终端设备及可读存储介质 |
CN111339555A (zh) * | 2020-02-17 | 2020-06-26 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN111786966A (zh) * | 2020-06-15 | 2020-10-16 | 中国建设银行股份有限公司 | 浏览网页的方法和装置 |
CN113553529A (zh) * | 2021-07-26 | 2021-10-26 | 平安养老保险股份有限公司 | 记录网页行为方法、装置、计算机设备及存储介质 |
-
2021
- 2021-11-11 CN CN202111334116.5A patent/CN114157647A/zh active Pending
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080177746A1 (en) * | 2007-01-23 | 2008-07-24 | Marat Borin | Cash back tracker / browser redirecting system |
US20100198768A1 (en) * | 2009-01-30 | 2010-08-05 | Dong Zhou | System and methods for optimizing user interaction in web-related activities |
WO2010102165A1 (en) * | 2009-03-05 | 2010-09-10 | Alibaba Group Holding Limited | Method, apparatus and system for visualizing user's web page browsing behavior |
US20160364771A1 (en) * | 2012-08-15 | 2016-12-15 | Ghostery, Inc. | Methods, apparatus, and systems for surveillance of third-party digital technology vendors providing secondary content in a content publisher's web page |
CN105260424A (zh) * | 2015-09-28 | 2016-01-20 | 北京奇虎科技有限公司 | 用户浏览网页历史记录和最常访问的处理方法及装置 |
CN106202357A (zh) * | 2016-07-06 | 2016-12-07 | 湖南艾瓦特网络科技有限公司 | 一种网站浏览数据分析方法和装置 |
CN106294648A (zh) * | 2016-08-03 | 2017-01-04 | 腾讯科技(深圳)有限公司 | 一种针对页面访问路径的处理方法及装置 |
CN107562426A (zh) * | 2017-09-04 | 2018-01-09 | 清华大学 | 无埋点式云端收集分析浏览器Trace的方法及*** |
CN108829693A (zh) * | 2018-04-13 | 2018-11-16 | 拉扎斯网络科技(上海)有限公司 | 一种用户访问轨迹的获取方法、装置及存储介质 |
CN109284458A (zh) * | 2018-09-28 | 2019-01-29 | 平安普惠企业管理有限公司 | 网页显示方法、装置、计算机设备及存储介质 |
CN109462648A (zh) * | 2018-11-13 | 2019-03-12 | 北京字节跳动网络技术有限公司 | 一种用户行为跟踪方法、装置、设备和储存介质 |
CN109688210A (zh) * | 2018-12-14 | 2019-04-26 | 平安城市建设科技(深圳)有限公司 | 追踪用户信息的方法、装置、服务器及存储介质 |
CN111131442A (zh) * | 2019-12-19 | 2020-05-08 | 广州品唯软件有限公司 | 网页数据的监听方法、终端设备及可读存储介质 |
CN111339555A (zh) * | 2020-02-17 | 2020-06-26 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN111786966A (zh) * | 2020-06-15 | 2020-10-16 | 中国建设银行股份有限公司 | 浏览网页的方法和装置 |
CN113553529A (zh) * | 2021-07-26 | 2021-10-26 | 平安养老保险股份有限公司 | 记录网页行为方法、装置、计算机设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
J. SOLÍS-MARTÍNEZ等: ""UXJs: Tracking and Analyzing Web Usage Information With a Javascript Oriented Approach"", 《 IEEE ACCESS》, 31 December 2020 (2020-12-31) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109739717B (zh) | 一种页面数据采集的方法及装置、服务器 | |
CN110771126B (zh) | 用于用户设备事件的匹配与归因的*** | |
CN111177617A (zh) | 基于运维管理***的web直接运维方法、装置及电子设备 | |
US11019160B2 (en) | Segment generation describing usage patterns | |
US9785710B2 (en) | Automatic crawling of encoded dynamic URLs | |
EP3230867B1 (en) | Browser provided website statistics | |
CN104834588B (zh) | 检测常驻式跨站脚本漏洞的方法和装置 | |
CN107644075B (zh) | 收集页面信息的方法和装置 | |
CN112684968A (zh) | 页面展示方法、装置、电子设备和计算机可读介质 | |
CN112817817B (zh) | 埋点信息查询方法、装置、计算机设备和存储介质 | |
CN113590974B (zh) | 推荐页面配置方法、装置、电子设备和计算机可读介质 | |
CN110598135A (zh) | 网络请求处理方法、装置、计算机可读介质及电子设备 | |
CN111597065A (zh) | 用于采集设备信息的方法和装置 | |
CN110457632B (zh) | 网页加载的处理方法及装置 | |
KR102054896B1 (ko) | 동적 웹 페이지의 방문자 행동 분석 정보 제공 장치 및 이를 이용한 웹 사이트의 방문자 행동 분석 정보 제공 방법 | |
CN112988569A (zh) | 一种基于nginx的微服务请求响应查看方法和*** | |
CN109542743B (zh) | 日志校验方法、装置、电子设备及计算机可读存储介质 | |
CN116662193A (zh) | 页面测试方法和装置 | |
CN112083982A (zh) | 信息处理方法和装置 | |
CN113609516B (zh) | 基于异常用户的信息生成方法、装置、电子设备和介质 | |
CN114285774A (zh) | 流量录制方法、装置、电子设备及存储介质 | |
CN114157647A (zh) | 用户浏览网页的追踪方法、装置、电子设备及存储介质 | |
CN112948733B (zh) | 接口维护方法、装置、计算设备以及介质 | |
CN113590985A (zh) | 页面跳转配置方法、装置、电子设备和计算机可读介质 | |
CN111767447A (zh) | 用于确定用户流量路径的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |