CN103309884A - 用户行为数据采集方法及*** - Google Patents

用户行为数据采集方法及*** Download PDF

Info

Publication number
CN103309884A
CN103309884A CN2012100656011A CN201210065601A CN103309884A CN 103309884 A CN103309884 A CN 103309884A CN 2012100656011 A CN2012100656011 A CN 2012100656011A CN 201210065601 A CN201210065601 A CN 201210065601A CN 103309884 A CN103309884 A CN 103309884A
Authority
CN
China
Prior art keywords
user behavior
behavior data
rule
application
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100656011A
Other languages
English (en)
Inventor
童国俊
汪宁
陈寄文
冯智峰
钟伟坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN2012100656011A priority Critical patent/CN103309884A/zh
Publication of CN103309884A publication Critical patent/CN103309884A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本申请涉及一种用户行为数据采集方法及***。该方法包括如下步骤:(a)接收客户端所发送的访问一应用的请求;(b)调用预先定制的用户行为数据规则;(c)根据所调用的用户行为数据规则来生成用户行为嵌入数据;(d)将该用户行为嵌入数据嵌入该应用中以生成应用页面;(e)根据用户对该应用页面的点击事件获得用户行为数据。本申请具有较强的通用性,可以减少用户行为数据配置的重复工作,可以灵活地定制、修改或删除要采集的用户行为数据规则,可以集中管理不同类型的用户行为采集数据。

Description

用户行为数据采集方法及***
技术领域
本发明涉及数据采集技术,尤其涉及一种用户行为数据采集方法及***。
背景技术
随着电子商务的快速发展,分析出一个平台(例如网站)中用户感兴趣的内容(如功能或产品频道等),并据此持续优化网站或调整商业策略才能在激烈的竞争中生存发展;而分析网站用户行为(点击)数据(即,当用户点击网页上的某些点时向服务器发送的用于网站统计分析的字符串)是获得这类信息的重要手段。分析网站用户行为数据的前提是获取网站用户行为数据,即采集用户行为数据。
目前有很多实现方式能够实现对用户行为数据的采集,例如包括:(1)一些中小网站往往通过在网站中嵌入第三方免费软件,并利用该软件所提供的采集脚本来搜集用户在网站上的鼠标移动坐标或点击行为发生时的坐标,且这些数据通过异步模式发送到数据采集服务端,经过日志分析保存到数据库中,然后利用统计分析可分析出网站的热点区域;(2)一些较大规模的电子商务平台通常通过网站开发人员在页面中的某些点部署点击数据来获取用户行为数据,具体地说,当用户点击这些部署的点时,页面通过onclick事件,调用相应的javascript函数,并以Ajax的方式将部署的点击数据发送到日志服务器,由日志服务器分析数据并将其保存到数据库中;以及(3)通过后台配置***可以定制要采集的用户行为数据,即,当用户访问一页面时,先通过代理服务器获取要采集的用户行为数据,然后当用户点击页面时,将用户行为数据发送给代理服务器的数据采集模块。
但是,上述现有的采集用户行为数据的实现方式存在以下缺点。
首先,对于上述实现方式(1),其所采集的网站用户行为数据为鼠标移动经过的坐标或鼠标点击时的坐标数据,因而数据比较单一,仅通过这些数据很难挖掘用户行为蕴含的深层次意图。而且,也不能通过第三方免费软件来采集一些开发时部署的点击数据。因此,这类实现方式的拓展性较差,且对大型商务网站的数据挖掘意义不大。
其次,对于上述实现方式(2),在开发过程中部署点击数据的实现方式尽管可以丰富用户行为数据,为细分网站特征奠定了基础,但是这类方式仅能针对已经部署的点击数据收集用户行为数据,若需要增加新的点来部署点击数据,或者修改或删除已经部署的点击数据,则需要开发人员进行修改,然后发布上线,这种修改会导致开发成本加大,且不够灵活。
再次,对于上述实现方式(3),其虽然可以定制需要搜集的数据,但若要搜集类似的多条(例如40条)数据,则需要在后台配置***配置相应的多条(例如40条)数据,这样导致有些工作重复、效率低下;而且,不能够根据不同的情况来生成要采集的不同的用户行为数据。
综上所述,现有的用户行为数据采集存在以下缺点中的一个或多个缺点:
1.不能够定义、修改、删除要采集的用户行为数据;
2.通用性差,与具体应用或网站有较强的绑定性;
3.由于要采集的用户行为数据分散于网页中,因而无法集中管理要采集的数据;
4.无法针对不同的应用配置生成具有特定业务含义的用户行为数据。
发明内容
鉴于上述问题,本申请的一个目的是提供一种能够根据需要来定义、修改、删除用户行为数据规则的用户行为数据采集方法及***。
本申请的另一个目的是提供一种通用性强的用户行为数据采集方法及***。
本申请的又一个目的是提供一种可以集中管理要采集的用户行为数据的用户行为数据采集方法及***。
本申请的再一个目的是提供一种可以针对不同的应用配置生成具有特定业务含义的用户行为数据的用户行为数据采集方法及***。
为了实现上述目的,本申请提供一种用户行为数据采集方法,该方法包括如下步骤:(a)接收客户端所发送的访问一应用的请求;(b)调用预先定制的用户行为数据规则;(c)根据所调用的用户行为数据规则来生成用户行为嵌入数据;(d)将该用户行为嵌入数据嵌入该应用中以生成应用页面;(e)根据用户对该应用页面的点击事件获得用户行为数据。
本申请还提供一种用户行为数据采集***,该***包括:接收模块,接收客户端所发送的访问一网页的请求;调用模块,调用预先定制的用户行为数据规则;生成模块,根据所调用的用户行为数据规则来生成用户行为嵌入数据;嵌入模块,将该用户行为嵌入数据嵌入该应用中以生成应用页面;获取模块,根据用户对该应用页面的点击事件获得用户行为数据。
在本申请中,由于引入了用户行为数据规则管理***,从而可以从业务需要出发灵活定制、修改和/或删除用户行为数据规则,在这一过程中不需要前端工程师、应用工程师、发布工程师作任何应用的改动,因而降低了开发成本,提高了可管理性。
而且,在本申请中,可以通过不同规则的描述来定义动态行为数据、静态行为数据和交互行为数据,这几乎涵盖了目前所有的用户数据类型,也就是说通过用户行为规则管理***可以实现对需要采集的用户行为数据的集中管理;且通过规则的定义,可以对要采集的相似用户行为数据只配置一条规则,然后根据用户行为数据采集***的应用集成API及具体环境来生成多条用户行为数据,减少繁琐的重复的配置工作。
此外,在本申请中,先从用户行为数据规则缓冲中查找用户行为数据规则,只有在该规则缓冲中未找到用户行为数据规则的情况下,才使用用户行为数据规则管理***进行查找,因而可以有效地提高查找速度,使得用户行为数据采集效率大大提高。
综上所述,本申请包括如下所述的多个优点。当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。
1.前端开发工程师可以仅考虑页面的实现,而不考虑要采集的用户数据。
2.由于本申请的用户行为数据规则通过后台的用户行为数据管理***定制,在应用中将集成本***的应用代码抽取成应用集成API,且解析规则器插件化,因而使得本申请具有较强的通用性。
3.通过用户行为数据采集***配置规则以及应用集成API对规则进行解析,可以减少用户行为数据配置的重复工作。
4.基于规则配置的用户行为采集***可以灵活地定制、修改或删除要采集的用户行为数据。
5.由于在用户行为规则管理***中管理规则,而非将规则分散在应用页面上,因而可以集中管理不同类型的用户行为采集数据。
附图说明
图1示例性示出了实现本申请提供的方法的一种操作环境的结构示意图;
图2示例性示出了根据本申请的用户行为数据采集***的框图;
图3示例性示出了根据本申请的用户行为数据采集方法的流程图;
图4示出了根据本申请的用户行为数据规则管理***的配置页面的一个实例;
图5示例性示出了根据本申请的用户行为数据采集***的数据流图;以及
图6示例性示出了根据本申请的用户行为数据采集***的功能框图。
具体实施方式
下面将详细描述本申请的实施例。应当注意,这里描述的实施例仅用于举例说明,并不用于限制本申请。
图1示例性示出实现本申请提供的方法的一种操作环境的结构示意图,网站端的设备可以包括网站服务器1、日志服务器2、用户行为数据规则管理服务器3;客户端的设备可以包括计算机4、手机5等用户终端设备。网站端和客户端的设备之间经由网络6通信。
网站服务器1形成网站页面(即,网页),并通过用户界面显示网站页面,在网站服务器1中可以配置有网站数据库11,网站数据库11中存储有各种网站数据。网站服务器1中还可以配置有缓存12,用于存储将在下面描述的解析后的用户行为数据规则。
日志服务器2可以包括数据库21。日志服务器2可以接收用户在点击页面时所触发的用户行为数据(即,用户行为点击数据),利用其分析模块解析该数据,并将解析后的数据保存到数据库21中。
用户行为数据规则管理服务器3包括数据库31。用户行为数据规则管理服务器3用于根据需要配置待采集的用户行为数据的用户行为数据规则,例如创建、修改或删除用户行为数据规则。
在图1中,网站服务器1、日志服务器2和用户行为数据规则管理服务器3分别配备有数据库11、数据库21和数据库31。但是,本申请实施例中的整个***的结构不限于此,也可以将这些数据库独立于服务器配置。另外,在图1中,网站服务器1、日志服务器2和用户行为数据规则管理服务器3独立配置。但是,本申请实施例中的整个***的结构不限于此,也可以将这些服务器任意组合使用。
下面将参考图2具体描述根据本申请的用户行为采集***的框图。如图2所示,用户行为采集***主要由客户端采集模块、用户行为数据规则管理***和应用集成API构成。其中,用户行为数据规则管理***能对用户行为数据规则集中配置管理,灵活性和通用性强;应用集成API可以位于应用中,且应用集成API可使集成变得容易;客户端采集模块可以采用通用javascript,便于使用;通过以上三个子***可以形成一套有效的、灵活的、通用的用户行为采集***。
上述用户行为数据规则管理***为一后台***,其配置页面的一个实例在图4中示出。在图4所示的配置页面中,应用名称为SearchWeb,模块名称为forum,组件名称为ForumSearchResult,其中示意性示出了三个锚点title、reply和read,分别代表主题、用户的回复和阅读行为的规则,即,在用户行为数据规则管理***中,为SearchWeb应用中的forum模块中的ForumSearchResult组件的三个锚点(即,页面元素)title、reply和read分别定义了要采集的用户行为数据规则。配置页面的右侧具有创建、修改和删除锚点的功能块,从而可以根据需要定义、修改或删除用户行为数据规则。例如,当需要增加网页中要采集的数据时,可以点击用户行为数据规则管理***的配置页面中的“创建锚点”功能块以配置要采集的数据串形式的规则。或者,例如,当原采集数据为起始页和成员ID(其对应规则为searchtrace=club_normalclick_${beginPage}_${memberid}_forum),且期望将该原采集数据修改为起始页、成员ID以及论坛ID时,只需点击用户规则管理***的配置页面中的对应锚点的“修改”功能以将上述原规则修改为searchtrace=club_normalclicK_${beginPage}_${memberid}_${forumId}_forum即可。或者,例如,当需要删除网页中要采集的某一数据时,可以点击用户行为数据规则管理***的配置页面中对应于该数据的锚点的“删除”功能,以将对应锚点的规则配置删除。图4仅示出了用户行为数据规则管理***的配置页面的一个实例,实际上,根据具体需要,每个应用的每个模块的每个组件的每个页面元素(即,锚点)均可以在用户行为数据规则管理***中分别定义其规则。因而,可以实现用户行为数据规则的灵活定制、修改或删除,而无需增加开发成本。
上述这些在用户行为数据规则管理***中定制的用户行为数据规则通过自然语言来表达,根据不同的表达形式可以定义不同类型的用户行为数据,例如动态行为数据、静态行为数据和交互行为数据,其中动态用户行为数据是通过应用上下文数据替换用户行为数据规则中的变量字段而生成的用户行为数据,这类数据可表达丰富的含义,比如用户信息、排名信息、第几页;静态用户行为数据是指固定的一串字符串数据;交互行为数据是指用户在页面操作时,由不同操作而选择的数据值来替换用户行为数据规则中变量字段产生的数据。在图4所示的实例中,动态用户行为数据用${...}来表示,如:${beginPage}。在一实施例中,静态用户行为数据的表示方式例如为searchtrace=mp3_pic_2。在一实施例中,交互行为数据的表示方式可以使用$[...],例如$[form:form1.username],其中前面的form表示DOM(document object model,文档对象模型)元素获取,form1表示表单的名称为form1,username表示输入框的name属性为username。
上述“上下文数据”是指用户在访问应用时应用的服务器端所获取的相应信息。例如,当阿里巴巴会员登录阿里巴巴网并输入其会员ID和密码时,阿里巴巴网服务器可获取例如会员ID、注册地区等的相关信息,这些信息即为“上下文数据”。
上述用户行为采集***的应用集成API通过抽取规则采集处理逻辑而形成,即,集成本***的应用代码被抽取以形成应用集成API,且应用集成API由规则解析模块和用户行为嵌入数据生成模块组成。因而,在使用时,只需调用该API模块的一函数即可生成用户行为打点数据(即,用户行为嵌入数据)。
客户端采集模块可以通过javascript来实现,以事件驱动模型来实现用户行为数据的采集,其可以预先放入应用网页中。在一实例中,当用户点击页面某些点时实现点击点与用户行为点击数据的关联,并例如通过Ajax方式将采集的数据发送到日志服务器。
此外,如图2所示,用户行为采集***除了包括客户端采集模块、用户行为数据规则管理***和应用集成API之外,还包括数据仓库(DW),即,图1中的数据库21,其中该应用包括:应用集成API调用模块,用于调用应用集成API以生成用户行为嵌入数据;以及用户行为规则调用模块,用于从用户行为数据规则管理***调用用户行为数据规则。该应用将通过调用应用集成API所生成的用户行为嵌入数据发送给应用前端页面。通过客户端采集模块,利用用户对应用前端页面的点击事件所生成的用户行为点击数据被发送到数据仓库(DW)中。
下面,将参照图3描述根据本申请的用户行为数据采集方法的一个实例。
如图3所示,首先,在步骤S1中,接收客户端所发送的访问一应用的请求。
然后,在步骤S2中,根据该请求,调用预先定制的用户行为数据规则。
接着,在步骤S3中,根据所调用的用户行为数据规则来生成用户行为嵌入数据;
之后,在步骤S4中,将该用户行为嵌入数据嵌入该应用中以生成应用页面。
最后,在步骤S5中,根据用户对所生成的应用页面的点击事件获得用户行为数据。
该步骤S2包括:在用户行为数据规则缓存中查找对应于该应用的用户行为数据规则,若未找到,则利用用户行为数据规则管理***查找对应于该应用的用户行为数据规则。例如,可以根据应用的模块名称和组件名称来查找相应的用户行为数据规则。
该步骤S3包括:解析所调用的用户行为数据规则,从而生成该用户行为嵌入数据。
在该步骤S4中,该用户行为嵌入数据被嵌入该应用页面的页面尾端。
该步骤S5包括:利用预先嵌入在应用中的客户端采集模块根据用户对该应用页面的点击事件获得用户行为数据。
下面将参考图1和图2,以动态用户行为数据为例具体描述根据本申请的用户行为数据采集方法的一个实施例。
首先,由产品经理、运营人员或开发人员利用用户行为数据规则管理***来设置某网站或电子商务平台需要搜集的用户行为数据规则。其中,所述用户行为数据规则管理***包括定义视图模块、定义区块模块和定义规则模块,用于为应用创建、修改或删除用户行为数据规则。定义视图模块用于确定应用的网页视图,定义区块模块用于将网页视图划分成多个区块,定义规则模块用于针对不同区块的具体内容来定义规则。在图4所示的用户行为数据规则管理***的配置页面的一个实例中,默认已通过定义区块模块定义了区块,定义视图模块将视图确定为模块名称forum,定义规则模块在应用searchWeb的模块forum下的组件ForumSearchResult中定义了“title”、“reply”和“read”这三种规则。
然后,在需要进行用户行为搜集的应用中集成应用集成API。这样,在用户通过客户端4或5发送请求(例如HTTP请求)到该应用的服务端(例如网站服务器1)时,服务端接受请求,并调用应用集成API来生成用户行为嵌入数据。
之后,所生成的用户行为嵌入数据例如以jsonp格式被集中嵌入到应用页面尾端,且服务端返回响应(例如HTTP响应)以将嵌入有用户行为嵌入数据的应用页面推送到客户端。
当用户通过点击事件触发客户端采集模块(例如,嵌入在页面的javascript)时,采集脚本根据点击样式class id或在开发时添加的点击点的自定义属性trace属性来关联在页面尾部已经生成的用户行为数据,并通过例如Ajax方式将该用户行为数据发送到日志服务器2。
最后,日志服务器2接收该用户行为数据,利用其分析模块解析数据,并将解析的数据保存到其数据库21中。
上述调用应用集成API来生成用户行为嵌入数据的步骤包括:
首先,根据应用的模块名称和模块中的组件名称在用户行为数据规则缓存12中查找相应规则。
若找到,则根据所找到的规则以及该应用的上下文数据,利用该上下文数据替换该规则中的变量,从而生成用户行为嵌入数据。
若未找到,则应用的用户行为规则调用模块向用户行为数据规则管理***发送一个获取用户行为数据规则的请求(例如HTTP请求),用户行为数据规则管理***根据应用的模块名称和组件名称从数据库31查找相应的用户行为数据规则,利用该用户行为数据规则生成XML格式的用户行为定制数据规则,并将所生成的XML格式的用户行为定制数据规则返回给应用。然后,应用的应用集成API调用模块调用应用集成API,该应用集成API的规则解析模块(即,规则解析引擎或规则解析器)解析所返回的XML格式的用户行为定制数据规则,并将解析后的规则缓存到用户行为数据规则缓存(例如,图1所示的缓存12)中,其中该规则解析器可以由本采集***实现或以第三方插件的方式集成到本***中。接着,该应用集成API的用户行为嵌入数据生成模块生成用户行为嵌入数据,并将其返回给应用。在一实例中,用户行为数据规则缓存可以通过Java对象CorruntHashMap来实现,其使用应用模块名组件名作为关键字来实现对用户行为数据规则的存储。
此外,上述用户行为数据规则管理***根据用户行为数据规则所生成的XML格式的用户行为定制数据规则文件的一实例如下:
在该实例中,存在两个节点(即,trace),即应用网页被分割为两个区块,在应用网页的第一个区块中,包括题目和图片(即,“title”和“pci”)这两条规则,且在应用网页的第二个区块中,包括公司(即,“company”)这一条规则。这样,被嵌入上述规则的应用网页将包括三条数据规则。
尽管上面以动态数据为例描述了用户行为数据采集方法,但应理解的是,该方法同样适用于静态数据以及交互数据。
在另一实施例中,应用集成API还可以包括一规则同步模块(如图5所示),该规则同步模块具有主动同步和被动同步两种工作模式,其中,主动同步为:应用定时向用户行为数据规则管理***发送一个请求,以获取XML格式的用户行为定制数据规则;被动同步为:用户行为数据规则管理***主动发出请求,同步模块接收到请求后向用户行为规则管理***获取用户行为定制数据规则。即,在本申请中,可以通过定时向用户行为数据管理***发送获取用户行为数据规则的请求,来查找对应于该应用的用户行为数据规则,或者可以通过用户行为数据管理***主动发送用户行为数据规则同步请求,同步模块接收到请求后向用户行为规则管理***获取该应用的用户行为数据规则。
下面将参考图5描述规则同步模块以主动同步方式工作的情况下根据本申请的用户行为数据采集方法的一个实施例。
如图5所示,首先,应用调用应用集成API的规则同步模块,以定时向用户行为数据规则管理***发送获取规则的请求,用户行为规则管理***响应该请求,将用户行为定制数据规则返回给应用。
若有用户访问该应用,则应用首先在其自身的用户行为数据规则缓存中查找相应规则,若找到,则直接利用所查找到的规则生成用户行为嵌入数据并将其嵌入应用页面中;若没找到,则调用应用集成API,以利用规则解析模块将之前从用户行为数据规则管理***返回给应用的用户行为定制数据规则进行解析和存储,并经由用户行为嵌入数据生成模块将解析后的规则生成用户行为嵌入数据,之后,将所生成的用户行为嵌入数据嵌入应用中以形成应用页面。
这样,在用户点击应用页面时,预先嵌入应用中的客户端采集模块被触发,从而采集到用户行为点击数据,之后所采集的用户行为点击数据被发送到日志服务器进行分析和/或存储等处理。
根据本申请实施例的方法可以通过利用公知的计算机、服务器或任意类型的处理设备来实现。例如,计算机通过执行存储在公知的存储器、硬盘、可移动硬盘、CD-ROM或其它任意类型的存储介质内的指令、程序、软件和数据中的一个或任意组合来执行上述方法的步骤。
图6示例性示出本申请的用户行为数据规则采集***的功能框图,本申请的用户行为数据规则采集***对应于上述实施例中的用户行为数据规则采集方法。参见图6,***包括:接收模块,接收客户端所发送的访问一网页的请求;调用模块,调用预先定制的用户行为数据规则;生成模块,根据所调用的用户行为数据规则来生成用户行为嵌入数据;嵌入模块,将该用户行为嵌入数据嵌入该应用中以生成应用页面;获取模块,根据用户对该应用页面的点击事件获得用户行为数据。
根据本申请实施例的***可以为计算机***、服务器或可以执行上述方法的步骤的任意设备。***中的模块(例如接收模块)等可以为计算机***、服务器的具有相应功能的组件、逻辑电路或其它部分。
本申请包括如下所述的多个优点之一或任意组合,但不限于这些优点:
1.前端开发工程师可以仅考虑页面的实现,而不考虑用户要采集的数据。
2.由于本申请的用户行为数据采集通过后台定制,而且利用抽取形成用户行为数据规则采集库,且规则解析器插件化,因而使得本申请具有较强的通用性。
3.通过规则的配置及用户行为数据规则采集库可以减少用户行为数据配置的重复工作。
4.基于规则配置的用户行为采集***可以灵活地定制、修改或删除要采集的用户行为数据。
5.可以集中管理不同类型的用户行为采集数据。
当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。
尽管上面以示例性实施例的方式对本申请进行了详细描述,但本申请的范围不限于上述实施例,本领域的技术人员可以对本申请进行各种改进和变型,这些均不脱离本申请的范围和构思。

Claims (16)

1.一种用户行为数据采集方法,该方法包括如下步骤:
(a)接收客户端所发送的访问一应用的请求;
(b)调用预先定制的用户行为数据规则;
(c)根据所调用的用户行为数据规则来生成用户行为嵌入数据;
(d)将该用户行为嵌入数据嵌入该应用中以生成应用页面;
(e)根据用户对该应用页面的点击事件获得用户行为数据。
2.根据权利要求1所述的方法,其中,该步骤(b)包括:
在用户行为数据规则缓存中查找对应于该应用的用户行为数据规则,若未找到,则利用用户行为数据规则管理***查找对应于该应用的用户行为数据规则。
3.根据权利要求2所述的方法,其中,所述用户行为数据规则管理***包括定义视图模块、定义区块模块和定义规则模块,用于为应用创建、修改或删除用户行为数据规则。
4.根据权利要求3所述的方法,其中,利用用户行为数据规则管理***查找相应的用户行为数据规则的步骤包括:定时向所述用户行为数据管理***发送获取用户行为数据规则的请求,并基于由此所获得的用户行为数据规则来查找对应于该应用的用户行为数据规则。
5.根据权利要求3所述的方法,其中,利用用户行为数据规则管理***查找相应的用户行为数据规则的步骤包括:所述用户行为数据管理***主动发送用户行为数据规则,并基于由此所获得的用户行为数据规则来查找对应于该应用的用户行为数据规则。
6.根据权利要求1所述的方法,其中,该步骤(c)包括:
解析所调用的用户行为数据规则,并根据该应用的上下文来生成该用户行为嵌入数据。
7.根据权利要求1所述的方法,其中,在该步骤(d)中,该用户行为嵌入数据被嵌入该应用页面的页面尾端。
8.根据权利要求1所述的方法,其中,该步骤(e)包括:利用预先嵌入在应用中的客户端采集模块根据用户对该应用页面的点击事件获得用户行为数据。
9.一种用户行为数据采集***,该***包括:
接收模块,接收客户端所发送的访问一网页的请求;
调用模块,调用预先定制的用户行为数据规则;
生成模块,根据所调用的用户行为数据规则来生成用户行为嵌入数据;
嵌入模块,将该用户行为嵌入数据嵌入该应用中以生成应用页面;
获取模块,根据用户对该应用页面的点击事件获得用户行为数据。
10.根据权利要求9所述的方法,其中,该调用模块在用户行为数据规则缓存中查找对应于该应用的用户行为数据规则,若未找到,则利用用户行为数据规则管理***查找对应于该应用的用户行为数据规则。
11.根据权利要求10所述的方法,其中,所述用户行为数据规则管理***包括定义视图模块、定义区块模块和定义规则模块,用于为应用创建、修改或删除用户行为数据规则。
12.根据权利要求11所述的方法,其中,该调用模块定时向所述用户行为数据管理***发送获取用户行为数据规则的请求,来查找对应于该应用的用户行为数据规则。
13.根据权利要求11所述的方法,其中,所述用户行为数据管理***主动发送用户行为数据规则,从而该调用模块查找对应于该应用的用户行为数据规则。
14.根据权利要求9所述的方法,其中,该生成模块解析所调用的用户行为数据规则,并根据该应用的上下文来生成该用户行为嵌入数据。
15.根据权利要求9所述的方法,其中,该嵌入模块将该用户行为嵌入数据嵌入该应用页面的页面尾端。
16.根据权利要求9所述的方法,其中,该获取模块利用预先嵌入在应用中的客户端采集模块根据用户对该应用页面的点击事件获得用户行为数据。
CN2012100656011A 2012-03-13 2012-03-13 用户行为数据采集方法及*** Pending CN103309884A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100656011A CN103309884A (zh) 2012-03-13 2012-03-13 用户行为数据采集方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100656011A CN103309884A (zh) 2012-03-13 2012-03-13 用户行为数据采集方法及***

Publications (1)

Publication Number Publication Date
CN103309884A true CN103309884A (zh) 2013-09-18

Family

ID=49135121

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100656011A Pending CN103309884A (zh) 2012-03-13 2012-03-13 用户行为数据采集方法及***

Country Status (1)

Country Link
CN (1) CN103309884A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103916293A (zh) * 2014-04-15 2014-07-09 浪潮软件股份有限公司 一种监控分析网站用户行为的方法
CN104811809A (zh) * 2014-01-23 2015-07-29 中国科学院声学研究所 一种机顶盒用户行为采集方法
CN105204922A (zh) * 2014-06-30 2015-12-30 金电联行(北京)信息技术有限公司 一种数据采集平台客户端采集方法
CN105468749A (zh) * 2015-11-26 2016-04-06 上海晶赞科技发展有限公司 一种数据处理方法及装置
CN105930363A (zh) * 2016-04-12 2016-09-07 深圳云之家网络有限公司 一种基于html5网页的用户行为分析方法及装置
CN106599255A (zh) * 2016-12-21 2017-04-26 北京小度互娱科技有限公司 用于统计用户行为的方法及装置
CN106611345A (zh) * 2015-10-23 2017-05-03 北京国双科技有限公司 一种采集用户行为数据的方法及装置
CN107276821A (zh) * 2017-07-11 2017-10-20 上海精数信息科技有限公司 用户行为监测***和方法
WO2018121501A1 (zh) * 2016-12-29 2018-07-05 北京国双科技有限公司 网站访客行为监测方法及装置
CN108810057A (zh) * 2017-05-05 2018-11-13 腾讯科技(深圳)有限公司 用户行为数据的采集方法、装置及存储介质
WO2018228285A1 (zh) * 2017-06-15 2018-12-20 北京国双科技有限公司 一种数据采集、查询方法、装置、存储介质及处理器
WO2019019351A1 (zh) * 2017-07-28 2019-01-31 平安科技(深圳)有限公司 用户行为数据处理方法、装置及计算机可读存储介质
CN109656984A (zh) * 2018-12-21 2019-04-19 树根互联技术有限公司 数据规则管理***、方法和装置
CN109783339A (zh) * 2019-01-23 2019-05-21 上海逸涵信息科技有限公司 一种用户行为数据采集***
CN110020339A (zh) * 2017-08-17 2019-07-16 北京国双科技有限公司 基于无埋点的网页数据采集方法及装置
CN110020070A (zh) * 2017-09-28 2019-07-16 北京国双科技有限公司 网页圈选数据处理方法、装置及***
CN110795504A (zh) * 2019-10-18 2020-02-14 上海易点时空网络有限公司 主动和被动同步日志的实现方法和装置
CN112256806A (zh) * 2020-11-04 2021-01-22 成都市食品药品检验研究院 一种食品生产经营全程风险信息库的构建方法及***
CN115080150A (zh) * 2022-07-19 2022-09-20 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006112945A2 (en) * 2005-03-04 2006-10-26 Amazon Technologies, Inc. Personalized preloading of digital content
CN101968802A (zh) * 2010-09-30 2011-02-09 百度在线网络技术(北京)有限公司 一种基于用户浏览行为进行互联网内容推荐的方法与设备
CN102124481A (zh) * 2008-06-26 2011-07-13 谷歌公司 在具有广告的网页中嵌入宏
CN102208086A (zh) * 2010-03-31 2011-10-05 北京邮电大学 面向领域的个性化智能推荐***及实现方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006112945A2 (en) * 2005-03-04 2006-10-26 Amazon Technologies, Inc. Personalized preloading of digital content
CN102124481A (zh) * 2008-06-26 2011-07-13 谷歌公司 在具有广告的网页中嵌入宏
CN102208086A (zh) * 2010-03-31 2011-10-05 北京邮电大学 面向领域的个性化智能推荐***及实现方法
CN101968802A (zh) * 2010-09-30 2011-02-09 百度在线网络技术(北京)有限公司 一种基于用户浏览行为进行互联网内容推荐的方法与设备

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104811809A (zh) * 2014-01-23 2015-07-29 中国科学院声学研究所 一种机顶盒用户行为采集方法
CN104811809B (zh) * 2014-01-23 2018-05-22 中国科学院声学研究所 一种机顶盒用户行为采集方法
CN103916293A (zh) * 2014-04-15 2014-07-09 浪潮软件股份有限公司 一种监控分析网站用户行为的方法
CN103916293B (zh) * 2014-04-15 2017-03-22 浪潮软件股份有限公司 一种监控分析网站用户行为的方法
CN105204922A (zh) * 2014-06-30 2015-12-30 金电联行(北京)信息技术有限公司 一种数据采集平台客户端采集方法
CN105204922B (zh) * 2014-06-30 2018-12-07 金电联行(北京)信息技术有限公司 一种数据采集平台客户端采集方法
CN106611345A (zh) * 2015-10-23 2017-05-03 北京国双科技有限公司 一种采集用户行为数据的方法及装置
CN105468749A (zh) * 2015-11-26 2016-04-06 上海晶赞科技发展有限公司 一种数据处理方法及装置
CN105930363B (zh) * 2016-04-12 2020-04-21 深圳云之家网络有限公司 一种基于html5网页的用户行为分析方法及装置
CN105930363A (zh) * 2016-04-12 2016-09-07 深圳云之家网络有限公司 一种基于html5网页的用户行为分析方法及装置
CN106599255A (zh) * 2016-12-21 2017-04-26 北京小度互娱科技有限公司 用于统计用户行为的方法及装置
WO2018121501A1 (zh) * 2016-12-29 2018-07-05 北京国双科技有限公司 网站访客行为监测方法及装置
CN108270629A (zh) * 2016-12-29 2018-07-10 北京国双科技有限公司 网站访客行为监测方法及装置
CN108810057A (zh) * 2017-05-05 2018-11-13 腾讯科技(深圳)有限公司 用户行为数据的采集方法、装置及存储介质
CN109150641A (zh) * 2017-06-15 2019-01-04 北京国双科技有限公司 一种数据采集、查询方法、装置、存储介质及处理器
WO2018228285A1 (zh) * 2017-06-15 2018-12-20 北京国双科技有限公司 一种数据采集、查询方法、装置、存储介质及处理器
CN107276821A (zh) * 2017-07-11 2017-10-20 上海精数信息科技有限公司 用户行为监测***和方法
WO2019019351A1 (zh) * 2017-07-28 2019-01-31 平安科技(深圳)有限公司 用户行为数据处理方法、装置及计算机可读存储介质
US11122142B2 (en) 2017-07-28 2021-09-14 Ping An Technology (Shenzhen) Co., Ltd. User behavior data processing method and device, and computer-readable storage medium
CN110020339A (zh) * 2017-08-17 2019-07-16 北京国双科技有限公司 基于无埋点的网页数据采集方法及装置
CN110020070A (zh) * 2017-09-28 2019-07-16 北京国双科技有限公司 网页圈选数据处理方法、装置及***
CN109656984A (zh) * 2018-12-21 2019-04-19 树根互联技术有限公司 数据规则管理***、方法和装置
CN109783339A (zh) * 2019-01-23 2019-05-21 上海逸涵信息科技有限公司 一种用户行为数据采集***
CN110795504A (zh) * 2019-10-18 2020-02-14 上海易点时空网络有限公司 主动和被动同步日志的实现方法和装置
CN112256806A (zh) * 2020-11-04 2021-01-22 成都市食品药品检验研究院 一种食品生产经营全程风险信息库的构建方法及***
CN112256806B (zh) * 2020-11-04 2021-05-18 成都市食品药品检验研究院 一种食品生产经营全程风险信息库的构建方法及***
CN115080150A (zh) * 2022-07-19 2022-09-20 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN103309884A (zh) 用户行为数据采集方法及***
CN101193008B (zh) 一种回放用户的网页访问轨迹的方法及***
CN108304498B (zh) 网页数据采集方法、装置、计算机设备和存储介质
CN102130933B (zh) 一种基于移动互联网的推荐方法、***和设备
CN102164186B (zh) 一种实现云搜索服务的方法及***
CN104915398B (zh) 一种网页埋点的方法及装置
CN109101425B (zh) 一种动态化的页面ab测试的指标埋点方法和装置
US11070648B2 (en) Offline client replay and sync
CN110688598B (zh) 业务参数采集方法、装置、计算机设备和存储介质
CN107562620A (zh) 一种埋点自动设置方法和装置
CN105243159A (zh) 一种基于可视化脚本编辑器的分布式网络爬虫***
CN104965691A (zh) 配置网页页面的页面元素的方法、装置及***
CN103428076A (zh) 向多类型终端或应用发送信息的方法和装置
CN102193953A (zh) 桌面应用迁移***和方法
CN107590145A (zh) 一种页面静态资源的处理方法和装置
CN104182506A (zh) 日志管理方法
CN103577599A (zh) 一种移动终端的本地数据存储方法及装置
CN102117331B (zh) 视频搜索方法及***
CN105589956A (zh) 一种用户画像的方法及装置
CN106951270A (zh) 一种代码处理方法、***及服务器
CN105721578A (zh) 一种用户行为数据采集方法和***
CN100504877C (zh) 一种Web页面动作收藏方法和装置
CN109240664A (zh) 一种采集用户行为信息的方法及终端
CN110825594A (zh) 数据的上报、下发方法、客户端及服务器
CN111680247B (zh) 网页字符串的本地调用方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1185690

Country of ref document: HK

RJ01 Rejection of invention patent application after publication

Application publication date: 20130918

RJ01 Rejection of invention patent application after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1185690

Country of ref document: HK