CN103916293B - 一种监控分析网站用户行为的方法 - Google Patents
一种监控分析网站用户行为的方法 Download PDFInfo
- Publication number
- CN103916293B CN103916293B CN201410157305.3A CN201410157305A CN103916293B CN 103916293 B CN103916293 B CN 103916293B CN 201410157305 A CN201410157305 A CN 201410157305A CN 103916293 B CN103916293 B CN 103916293B
- Authority
- CN
- China
- Prior art keywords
- webpage
- user
- website
- page
- click
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000012544 monitoring process Methods 0.000 title claims abstract description 13
- 230000006399 behavior Effects 0.000 title abstract 2
- 238000004458 analytical method Methods 0.000 claims abstract description 39
- 238000003860 storage Methods 0.000 abstract description 4
- 238000004364 calculation method Methods 0.000 abstract description 2
- 238000013461 design Methods 0.000 abstract description 2
- 238000003780 insertion Methods 0.000 abstract 1
- 230000037431 insertion Effects 0.000 abstract 1
- 238000009826 distribution Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004801 process automation Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种监控分析网站用户行为的方法,包括步骤如下:(1)分析对象确定;(2)页面埋点;(3)日志收集;(4)HDFS分布式文件***存储;(5)分布式汇总计算;(6)结果展现。1.本发明所述方法支持海量(亿级别/天)访问量的网站,准实时的展现网站浏览量、点击量等数据,并支持明细数据毫秒级查询。2.本发明所述的方法完全基于开源软件开发,使用普通pcserver,普通sata硬盘,***架构使用冗余设计,任何数据节点或磁盘损坏后数据都不会丢失。本发明各个环节都实现自动化,支持图形化监控,运维简单。
Description
技术领域
本发明涉及一种监控分析网站用户行为的方法,属于网络监控分析的技术领域。
背景技术
传统的用户访问网站的行为的分析方法,是根据用户访问网站功能的url日志,导入关系数据库汇总分析,数据量大耗时,很难做到实时或准实时分析展现用户访问网站的行为,耗时耗人工且信息丢失,用户不产生页面请求的行为将被丢失,无法支撑大并发的电子商务网站分析用户访问行为,因此依据现有的传统的网站行为的分析方法很难对广告投放等网络营销提供及时的数据支撑依据。
发明内容
针对现有技术的不足,本发明提供一种监控分析网站用户行为的方法。该方法通过监听用户页面操作行为,将用户在网页上的操作行为通过监听收集起来,存入hdfs分布式文件***,利用hadoop-hive进行分布式汇总快速大数据运算,每隔半小时统计一次数据,实现用户网站行为的准实时统计分析,为广告投放等网络营销提供准实时数据支撑,整个过程自动化不需要人工干预。对大数据的快速计算模型。
本发明的技术方案如下:
一种监控分析网站用户行为的方法,包括步骤如下:
(1)分析对象确定:用户在网站上的操作行为包括网页页面浏览和网页页面内对可点击元素的点击;所述网页的页面使用URL作为标识,所述网页页面可点击元素使用ID作为标识;定义分析对象包括:用户对网页页面URL的访问(PV:page view)数量、用户对网页页面元素的点击(CV:click view)数量以及不同用户类型、不同时间、不同地域所分别对应的网页页面访问数量和网页页面元素点击数量;
(2)页面埋点:在需要做用户行为分析的网站的框架页面添加用按照步骤(1)确定分析对象后形成的用户行为分析的脚本文件,即可实现监听并跟踪用户访问网站的行为,当用户按照步骤(1)所述的分析对象对网页页面进行访问或对网页页面元素进行点击时,自动请求一次日志服务器的1K大小的图片,实现往标签服务器打点的目的;
(3)日志收集:日志收集使用apache作为日志服务器,用户对网页页面元素操作时,将对分析对象的操作及操作者的信息拼装成对图片请求的参数,发送给日志服务器apache,日志服务器apache每收到一次请求即记录一条日志记录,实现日志收集;通过分析页面浏览日志收集用户在网站打开网页的信息,通过分析用户在网站上的点击按钮、链接、图片的日志收集用户在网站网页中的点击行为;
(4)HDFS分布式文件***存储:将收集的apache日志服务器所存的日志通过Hadoop Hive结构化后存储到Hadoop分布式文件***中,Hadoop分布式文件***(HadoopDistributed File System HDFS)是运行在通用硬件(普通pcserver或者普通pc)上的分布式文件***;所述hadoop提供了一个高度容错性和高吞吐量的海量数据存储解决方案。HDFS通过一个高效的分布式算法,将数据的访问和存储分布在大量服务器之中,在可靠地多备份存储的同时还能将访问分布在集群中的各个服务器之上,是传统存储构架的一个颠覆性的发展;
(5)分布式汇总计算:利用Hadoop Hive支持HSql的特性,通过书写HSql在HDFS集群环境下,利用Hadoop的MapReduce在多台机器上并行计算,计算每个网页页面每半小时、每天、每月的浏览量和点击量;如:某天12:00~12:30半小时内,网站所有URL都有哪些用户点击了,点击了多少次等;
(6)结果展现:分布式汇总计算的统计结果通过Apache Sqoop将网站、网页页面、用户、按钮的访问数量的数据自动从HDFS中转移至Mysql关系数据库表中,使用java web程序访问mysql数据库,以html页面图表和列表的方式展现网页、广告、图片、按钮实时和一段时间内的网页页面浏览量或网页页面的点击量;所述网页页面浏览量、网页页面元素点击的明细数据以列式存储在HBase分布式数据库中,支持毫秒级的查询。为广告投放、网站营销等提供延迟半小时的准实时访问量数据依据,指导网站更精准的投放广告,开展网上营销。
本发明的优势:
1.本发明所述方法支持海量(亿级别/天)访问量的网站,准实时的展现网站浏览量、点击量等数据,并支持明细数据毫秒级查询。
2.本发明所述的方法完全基于开源软件开发,使用普通pcserver,普通sata硬盘,***架构使用冗余设计,任何数据节点或磁盘损坏后数据都不会丢失。本发明各个环节都实现自动化,支持图形化监控,运维简单。
3.本发明所述方法支持网站快速使用,安装简单,报表展现只需简单修改SQL,可灵活定制,并可根据客户个性化需求只需增加一些指标,增加一些展现SQL即可实现个性化改造,快速实现。
附图说明
图1为本发明所述方法的***架构图。该架构图从在网站页面中部署脚本,日志收集,日志自动提交至hadoop的分布式文件***,并存储至HBase,基于hive做汇总计算后,利用sqoop同步至mysql关系数据库,通过用户行为分析统计分析***提供汇总结果查询,接口服务,明细数据查询,其中明细数据查询由HBase提供快速检索支持。
图2为用户行为分析结果展现示例图,是新商盟电子商务网站,利用本发明实现的网站2013年9月26日的网站概览数据,折线图为25日和26日的整个网站页面浏览展示,由每半小时累计一次的数据形成。
具体实施方式
下面结合实施例和说明书附图对本发明做详细的说明,但不限于此。
实施例1、
一种监控分析网站用户行为的方法,包括步骤如下:
(1)分析对象确定:用户在网站上的操作行为包括网页页面浏览和网页页面内对可点击元素的点击;所述网页的页面使用URL作为标识,所述网页页面可点击元素使用ID作为标识;定义分析对象包括:用户对网页页面URL的访问(PV:page view)数量、用户对网页页面元素的点击(CV:click view)数量以及不同用户类型、不同时间、不同地域所分别对应的网页页面访问数量和网页页面元素点击数量;
(2)页面埋点:在需要做用户行为分析的网站的框架页面添加用按照步骤(1)确定分析对象后形成的用户行为分析的脚本文件,即可实现监听并跟踪用户访问网站的行为,当用户按照步骤(1)所述的分析对象对网页页面进行访问或对网页页面元素进行点击时,自动请求一次日志服务器的1K大小的图片,实现往标签服务器打点的目的;
(3)日志收集:日志收集使用apache作为日志服务器,用户对网页页面元素操作时,将对分析对象的操作及操作者的信息拼装成对图片请求的参数,发送给日志服务器apache,日志服务器apache每收到一次请求即记录一条日志记录,实现日志收集;通过分析页面浏览日志收集用户在网站打开网页的信息,通过分析用户在网站上的点击按钮、链接、图片的日志收集用户在网站网页中的点击行为;
(4)HDFS分布式文件***存储:将收集的apache日志服务器所存的日志通过Hadoop Hive结构化后存储到Hadoop分布式文件***中,Hadoop分布式文件***(HadoopDistributed File System HDFS)是运行在通用硬件(普通pcserver或者普通pc)上的分布式文件***;所述hadoop提供了一个高度容错性和高吞吐量的海量数据存储解决方案。HDFS通过一个高效的分布式算法,将数据的访问和存储分布在大量服务器之中,在可靠地多备份存储的同时还能将访问分布在集群中的各个服务器之上,是传统存储构架的一个颠覆性的发展;
(5)分布式汇总计算:利用Hadoop Hive支持HSql的特性,通过书写HSql在HDFS集群环境下,利用Hadoop的MapReduce在多台机器上并行计算,计算每个网页页面每半小时、每天、每月的浏览量和点击量;如:某天12:00~12:30半小时内,网站所有URL都有哪些用户点击了,点击了多少次等;
(6)结果展现:分布式汇总计算的统计结果通过Apache Sqoop将网站、网页页面、用户、按钮的访问数量的数据自动从HDFS中转移至Mysql关系数据库表中,使用java web程序访问mysql数据库,以html页面图表和列表的方式展现网页、广告、图片、按钮实时和一段时间内的网页页面浏览量或网页页面的点击量;所述网页页面浏览量、网页页面元素点击的明细数据以列式存储在HBase分布式数据库中,支持毫秒级的查询。为广告投放、网站营销等提供延迟半小时的准实时访问量数据依据,指导网站更精准的投放广告,开展网上营销。
利用上述所述的方法实现对以下网站进行监控分析:新商盟电子商务网站www.xinshangmeng.com使用的例子:
1、新商盟网站是统一前端框架的jsp页面负责页面展示,可以点击的元素主要是一些按钮、菜单或图片链接等,因此对新商盟网站用户的行为进行分析,主要分析页面的浏览和页面元素的点击页面以jsp页面的url为标识,页面元素以页面元素的id或name或label为标识。
2、在新商盟网站前端框架层页面layout.jsp中引入用户行为分析收集信息的js文件install_up_beacon.js和
up_beacon.js。js负责在打开页面或点击页面元素时,请求标签服务器记录日志。
3、日志收集采取记录apache服务器access日志的方式,一条日志为一个页面浏览或点击事件,日志以固定格式记录访问事件的各种参数,如:时间、用户、用户所属公司、用户使用浏览器版本、ip地址等。每半小时生成一个新的日志文件。
4、日志服务器生成的日志文件,通过自动化程序,直接load进hadoop分布式文件***,因为每条记录都是结构化的,load进hdfs时,结构化到hive的表中,供hive做汇总计算,明细数据同时存入hbase数据库,目前新商盟网站用户行为分析分布式文件***服务器采用5台廉价pc服务器,进行存储计算。
5、使用hive的hsql对load进来的结构化好的数据,做汇总计算,按照半小时、天、月等维度及访问用户所属的地域或组织机构进行计算,汇总结果存储在hive的表中。如每天网站的页面浏览量,按钮点击量,用户量,用户停留时长等。
6、将汇总结果使用sqoop程序由hdfs转移至关系数据库mysql,使用web应用的报表、图表展现,并为网站提供接口,供网站使用,明细数据直接访问hbase数据库,实时展现。如图2所示,为新商盟网站某天的实时访问情况。
Claims (1)
1.一种监控分析网站用户行为的方法,包括步骤如下:
(1)分析对象确定:用户在网站上的操作行为包括网页页面浏览和网页页面内对可点击元素的点击;所述网页的页面使用URL作为标识,所述网页页面可点击元素使用ID作为标识;定义分析对象包括:用户对网页页面URL的访问(PV:page view)数量、用户对网页页面元素的点击(CV:click view)数量以及不同用户类型、不同时间、不同地域所分别对应的网页页面访问数量和网页页面元素点击数量;
(2)页面埋点:在需要做用户行为分析的网站的框架页面添加用按照步骤(1)确定分析对象后形成的用户行为分析的脚本文件,当用户按照步骤(1)所述的分析对象对网页页面进行访问或对网页页面元素进行点击时,自动请求一次日志服务器的1K大小的图片,实现往日志服务器打点的目的;
(3)日志收集:日志收集使用apache作为日志服务器,用户对网页页面元素操作时,将对分析对象的操作及操作者的信息拼装成对图片请求的参数,发送给日志服务器apache,日志服务器apache每收到一次请求即记录一条日志记录,实现日志收集;通过分析页面浏览日志收集用户在网站打开网页的信息,通过分析用户在网站上的点击按钮、链接、图片的日志收集用户在网站网页中的点击行为;
(4)HDFS分布式文件***存储:将收集的apache日志服务器所存的日志通过HadoopHive结构化后存储到Hadoop 分布式文件***中,Hadoop 分布式文件***,HadoopDistributed File System HDFS,是运行在普通pcserver或者普通pc上的分布式文件***;
(5)分布式汇总计算:利用Hadoop Hive支持HSql的特性,通过书写HSql在HDFS集群环境下,利用Hadoop的MapReduce在多台机器上并行计算,计算每个网页页面每半小时、每天、每月的浏览量和点击量;
(6)结果展现:分布式汇总计算的统计结果通过Apache Sqoop将网站、网页页面、用户、按钮的访问数量的数据自动从HDFS中转移至Mysql关系数据库表中,使用java web程序访问Mysql数据库,以html页面图表和列表的方式展现网页、广告、图片、按钮实时和一段时间内的网页页面浏览量或网页页面的点击量;所述网页页面浏览量、网页页面元素点击的明细数据以列式存储在 HBase分布式数据库中,支持毫秒级的查询。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410157305.3A CN103916293B (zh) | 2014-04-15 | 2014-04-15 | 一种监控分析网站用户行为的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410157305.3A CN103916293B (zh) | 2014-04-15 | 2014-04-15 | 一种监控分析网站用户行为的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103916293A CN103916293A (zh) | 2014-07-09 |
CN103916293B true CN103916293B (zh) | 2017-03-22 |
Family
ID=51041711
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410157305.3A Active CN103916293B (zh) | 2014-04-15 | 2014-04-15 | 一种监控分析网站用户行为的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103916293B (zh) |
Families Citing this family (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104376047B (zh) * | 2014-10-28 | 2017-06-30 | 浪潮电子信息产业股份有限公司 | 一种基于HBase的大表join方法 |
CN105550184B (zh) * | 2014-10-31 | 2019-11-19 | 阿里巴巴集团控股有限公司 | 一种信息获取方法及装置 |
CN104462811A (zh) * | 2014-12-05 | 2015-03-25 | 云中万维(北京)科技有限公司 | 网络游戏数据处理方法 |
CN106156212A (zh) | 2015-04-22 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 一种数据采集方法和***、及其终端和服务器 |
CN104991957B (zh) * | 2015-07-21 | 2018-08-07 | 北京润通丰华科技有限公司 | 一种确定网页打开时间的方法及装置 |
CN104951570A (zh) * | 2015-07-27 | 2015-09-30 | 广州九尾信息科技有限公司 | 基于数据挖掘及lbs的兼职智能推荐*** |
CN106447369A (zh) * | 2015-08-07 | 2017-02-22 | 百度在线网络技术(北京)有限公司 | 网络访问数据的处理方法、终端设备及服务器 |
CN105205168B (zh) * | 2015-10-12 | 2018-11-09 | 北京京东尚科信息技术有限公司 | 一种基于Redis数据库的曝光***及其操作方法 |
CN105224445B (zh) * | 2015-10-28 | 2017-02-15 | 北京汇商融通信息技术有限公司 | 分布式跟踪*** |
CN105740397A (zh) * | 2016-01-28 | 2016-07-06 | 广州市讯飞樽鸿信息技术有限公司 | 一种基于大数据并行运算的语音信箱业务数据分析方法 |
CN107025222A (zh) * | 2016-01-29 | 2017-08-08 | 五八同城信息技术有限公司 | 一种分布式日志采集方法及装置 |
CN107295050B (zh) * | 2016-04-01 | 2021-05-11 | 阿里巴巴集团控股有限公司 | 前端用户行为统计方法及装置 |
CN107346505A (zh) * | 2016-05-06 | 2017-11-14 | 北京京东尚科信息技术有限公司 | 信息推送方法和装置 |
CN105979273B (zh) * | 2016-05-06 | 2021-04-02 | 苏州清云网络科技有限公司 | 基于大数据及云计算的智能商用电视的云监控与云运维 |
CN105959180A (zh) * | 2016-06-12 | 2016-09-21 | 乐视控股(北京)有限公司 | 数据检测方法及装置 |
CN106126551A (zh) * | 2016-06-13 | 2016-11-16 | 浪潮电子信息产业股份有限公司 | 一种Hbase数据库访问日志的生成方法、装置及*** |
CN106202440B (zh) * | 2016-07-13 | 2019-12-17 | 华为技术有限公司 | 数据处理方法、装置及设备 |
CN106161091B (zh) * | 2016-07-13 | 2019-05-07 | 久远谦长(北京)技术服务有限公司 | 一种统计互联网用户行为的方法和*** |
CN106202482B (zh) * | 2016-07-18 | 2020-02-07 | 浪潮(北京)电子信息产业有限公司 | 一种基于用户行为分析的网站优化方法及*** |
CN106250404A (zh) * | 2016-07-21 | 2016-12-21 | 柳州龙辉科技有限公司 | 一种用户操作分析的方法 |
CN106294650B (zh) * | 2016-08-03 | 2019-08-20 | 北京金和网络股份有限公司 | 基于搜索埋点的新词挖掘方法 |
CN106469185A (zh) * | 2016-08-29 | 2017-03-01 | 浪潮电子信息产业股份有限公司 | 一种网站统计中进行数据收集的方法 |
CN106339461A (zh) * | 2016-08-29 | 2017-01-18 | 芜湖创易科技有限公司 | 一种网站信息管理*** |
CN106649670B (zh) * | 2016-12-14 | 2020-07-17 | 北京五八信息技术有限公司 | 基于流式计算的数据监控方法及装置 |
CN106874368B (zh) * | 2016-12-30 | 2020-12-22 | 江苏号百信息服务有限公司 | 一种rtb竞价广告位价值分析方法及*** |
CN108574669B (zh) * | 2017-03-10 | 2019-08-06 | 掌阅科技股份有限公司 | 用户行为树构建方法及装置 |
CN107153702A (zh) * | 2017-05-10 | 2017-09-12 | 北京微影时代科技有限公司 | 一种数据处理方法及装置 |
CN108881352B (zh) * | 2017-05-15 | 2022-06-07 | 北京京东尚科信息技术有限公司 | 一种处理点击日志的方法、装置和*** |
CN107220084A (zh) * | 2017-05-26 | 2017-09-29 | 郑州云海信息技术有限公司 | 一种计算机固件刷新方法 |
CN107247763A (zh) * | 2017-05-31 | 2017-10-13 | 北京凤凰理理它信息技术有限公司 | 业务数据统计方法、装置、***、存储介质及电子设备 |
CN107729222B (zh) * | 2017-07-26 | 2020-01-07 | 深圳壹账通智能科技有限公司 | 用户行为统计方法、***、计算机设备和存储介质 |
CN109829121B (zh) * | 2017-08-22 | 2021-07-06 | 北京京东尚科信息技术有限公司 | 一种点击行为数据上报的方法和装置 |
CN107506476A (zh) * | 2017-09-08 | 2017-12-22 | 上海炫萌网络科技有限公司 | 用户行为数据收集分析***及分析方法 |
CN107679097B (zh) * | 2017-09-08 | 2021-06-18 | 广州汉邮通信有限公司 | 一种分布式数据处理方法、***和存储介质 |
CN107798558A (zh) * | 2017-09-30 | 2018-03-13 | 中国平安人寿保险股份有限公司 | 用户行为数据分析方法及服务器 |
CN107800591B (zh) * | 2017-11-07 | 2022-01-21 | 南威软件股份有限公司 | 一种统一日志数据的分析方法 |
CN108363649B (zh) * | 2017-12-29 | 2021-04-16 | 微梦创科网络科技(中国)有限公司 | 一种分布式统计日志访问量的方法及装置 |
CN108052679A (zh) * | 2018-01-04 | 2018-05-18 | 焦点科技股份有限公司 | 一种基于hadoop的日志分析*** |
CN108416038A (zh) * | 2018-03-14 | 2018-08-17 | 北京网信云服信息科技有限公司 | 一种单页应用的数据统计方法及装置 |
CN110275998B (zh) * | 2018-03-16 | 2021-07-30 | 北京国双科技有限公司 | 网页属性数据的确定方法及装置 |
CN108416057A (zh) * | 2018-03-21 | 2018-08-17 | 上海精鲲计算机科技有限公司 | 一种网站行为分析*** |
WO2019227423A1 (zh) * | 2018-05-31 | 2019-12-05 | 优视科技新加坡有限公司 | 一种用户特征信息收集方法、装置和设备/终端/服务器 |
CN109471893B (zh) * | 2018-10-24 | 2022-05-20 | 上海连尚网络科技有限公司 | 网络数据的查询方法、设备及计算机可读存储介质 |
CN109684583A (zh) * | 2018-11-12 | 2019-04-26 | 深圳壹账通智能科技有限公司 | 页面用户行为的分析方法、装置、终端及可读存储介质 |
CN110674022B (zh) * | 2019-09-27 | 2021-04-27 | 北京三快在线科技有限公司 | 行为数据获取方法、装置及存储介质 |
CN110675194A (zh) * | 2019-09-29 | 2020-01-10 | 北京思维造物信息科技股份有限公司 | 一种漏斗分析方法、装置、设备及可读介质 |
CN112783953A (zh) * | 2019-11-06 | 2021-05-11 | 广州凡科互联网科技股份有限公司 | 一种数据采集方法 |
CN111882368B (zh) * | 2020-08-11 | 2023-12-05 | 北京云和互动信息技术有限公司 | 一种在线广告dpi加密埋点及透传跟踪的方法 |
CN116109121B (zh) * | 2023-04-17 | 2023-06-30 | 西昌学院 | 基于大数据分析的用户需求挖掘方法及*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101222349A (zh) * | 2007-01-12 | 2008-07-16 | 中国电信股份有限公司 | 收集web用户行为及性能数据的方法及*** |
CN101562538A (zh) * | 2009-04-15 | 2009-10-21 | 计世在线网络技术(北京)有限公司 | 一种网站访问分析的*** |
CN102236867A (zh) * | 2011-08-15 | 2011-11-09 | 悠易互通(北京)广告有限公司 | 基于云计算的受众行为分析广告定向*** |
CN103309884A (zh) * | 2012-03-13 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 用户行为数据采集方法及*** |
CN103678665A (zh) * | 2013-12-24 | 2014-03-26 | 焦点科技股份有限公司 | 一种基于数据仓库的异构大数据整合方法和*** |
-
2014
- 2014-04-15 CN CN201410157305.3A patent/CN103916293B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101222349A (zh) * | 2007-01-12 | 2008-07-16 | 中国电信股份有限公司 | 收集web用户行为及性能数据的方法及*** |
CN101562538A (zh) * | 2009-04-15 | 2009-10-21 | 计世在线网络技术(北京)有限公司 | 一种网站访问分析的*** |
CN102236867A (zh) * | 2011-08-15 | 2011-11-09 | 悠易互通(北京)广告有限公司 | 基于云计算的受众行为分析广告定向*** |
CN103309884A (zh) * | 2012-03-13 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 用户行为数据采集方法及*** |
CN103678665A (zh) * | 2013-12-24 | 2014-03-26 | 焦点科技股份有限公司 | 一种基于数据仓库的异构大数据整合方法和*** |
Non-Patent Citations (2)
Title |
---|
基于Hadoop的大型网站海量数据的统计与应用;吴金虎;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20121015(第10期);全文 * |
基于多层B/S结构的网友访问行为的分析***;张泽云;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20111215(第12期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN103916293A (zh) | 2014-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103916293B (zh) | 一种监控分析网站用户行为的方法 | |
US10904117B1 (en) | Insights for web service providers | |
CN103136335B (zh) | 一种基于数据平台的数据控制方法 | |
Zadrozny et al. | Big data analytics using Splunk: Deriving operational intelligence from social media, machine data, existing data warehouses, and other real-time streaming sources | |
CN106294101B (zh) | 页面打点测试方法和装置 | |
CN101743542B (zh) | 收集和呈现基于时间的动作信息 | |
CN106250404A (zh) | 一种用户操作分析的方法 | |
US20100088354A1 (en) | Method and System for Log File Analysis Based on Distributed Computing Network | |
CN100444174C (zh) | 网页微内容提取、聚合和自动更新***的方法 | |
CN106227832A (zh) | 互联网大数据技术架构在企业内业务分析中的应用方法 | |
CN105138599B (zh) | 一种可自动监测网站全部页面中各个链接点击量的方法 | |
CN103631699A (zh) | 日志管理***及日志监控、获取和查询方法 | |
CN107315776A (zh) | 一种基于云计算的数据管理*** | |
Zhu et al. | The application of big data and the development of nursing science: A discussion paper | |
CN108804497A (zh) | 一种基于日志的大数据分析方法 | |
CN101582090A (zh) | 一种基于web分析的分布式处理方法和*** | |
US7908239B2 (en) | System for storing event data using a sum calculator that sums the cubes and squares of events | |
CA3059738A1 (en) | Behaviour data processing method, device, electronic device and computer readable medium | |
CN107153710A (zh) | 一种大数据处理方法及*** | |
CN104765766A (zh) | 一种监测视频更新的方法和装置 | |
CN107993021A (zh) | 一种集中化的数据中心运维管理*** | |
US20220036477A1 (en) | System and method for determining revenue generated by any zone in a webpage | |
Diakun et al. | Splunk Operational Intelligence Cookbook | |
WO2023169165A1 (zh) | 访问数据处理方法和装置、电子设备、计算机可读介质 | |
US20130024480A1 (en) | Method and system for analysis of database records |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information |
Inventor after: Lin Dawei Inventor after: Xiao Jianguo Inventor before: Yang Hantao |
|
COR | Change of bibliographic data | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |