CN106294559A - 一种应用流量分析方法及装置 - Google Patents

一种应用流量分析方法及装置 Download PDF

Info

Publication number
CN106294559A
CN106294559A CN201610597004.1A CN201610597004A CN106294559A CN 106294559 A CN106294559 A CN 106294559A CN 201610597004 A CN201610597004 A CN 201610597004A CN 106294559 A CN106294559 A CN 106294559A
Authority
CN
China
Prior art keywords
analyzed
log
application
funnel
access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610597004.1A
Other languages
English (en)
Other versions
CN106294559B (zh
Inventor
杨其成
夏颖瑛
白浚楼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201610597004.1A priority Critical patent/CN106294559B/zh
Publication of CN106294559A publication Critical patent/CN106294559A/zh
Application granted granted Critical
Publication of CN106294559B publication Critical patent/CN106294559B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种应用流量分析方法,属于计算机技术领域。本申请通过获取待分析应用的访问日志;基于预设的所述应用的漏斗配置文件匹配每条所述访问日志,确定符合所述漏斗配置文件的访问日志的日志索引表;基于待分析的访问路径分解后得到的路径列表,对根据所述日志索引表确定的实际访问路径进行匹配;根据匹配结果计算所述待分析应用的流量分析指标,解决了现有技术中基于频繁路径挖掘计算展现率或点击率,无法对同类型页面或模块进行宏观分析的问题,通过对同类型页面设置相同的分析对象标识,可以对同类型页面的数据进行聚合分析,得到宏观分析结果。

Description

一种应用流量分析方法及装置
技术领域
本申请涉及计算机技术领域,特别是涉及一种应用流量分析方法及装置。
背景技术
现有技术中,为了完善应用,进一步提升用户体验,需要对应用的流量进行分析,如对应用的转化率、点击率进行分析。在分析应用(如:网页应用、移动终端应用程序)的流量时,通常需要对应用的各模块或页面的行为进行统计。针对模块或页面的行为主要包括:展现、点击。为了分析用户对应用产品的使用偏好、分析应用产品的使用效果等,现有技术中,通常采用针对应用的模块和页面打点的方法,分析模块或页面的展现率或点击率。在统计展现率和点击率时,常用的方法是频繁路径挖掘,从用户访问的路径入手,对于访问的核心路径进行计算和优化。
现有技术中的分析应用流量的方法至少存在以下缺陷:基于计算频繁路径挖掘,适用于分析相邻页面的转化率,挖掘结果偏向于详细用户路径,无法快速针对同类型页面或模块进行合并的宏观分析。
发明内容
本申请所要解决的技术问题是:提供一种应用流量分析方法,解决现有技术中基于频繁路径挖掘计算展现率或点击率,无法对同类型页面或模块进行宏观分析的问题。
为了解决上述问题,本申请实施例提供了一种应用流量分析方法,包括:
获取待分析应用的访问日志;
基于预设的所述待分析应用的漏斗配置文件匹配每条所述访问日志,确定符合所述漏斗配置文件的访问日志的日志索引表;
基于待分析的访问路径分解后得到的路径列表,对根据所述日志索引表确定的实际访问路径进行匹配;
根据匹配结果计算所述待分析应用的流量分析指标;
其中,所述访问日志包括访问的所述待分析应用的分析对象标识;所述漏斗配置文件包括预先生成的基于分析对象标识进行日志匹配的公式;所述待分析应用中同类型的分析对象具有相同的分析对象标识。
相应的,本申请实施例还提供了一种应用流量分析装置,包括:
访问日志获取模块,用于获取待分析应用的访问日志;
日志索引表确定模块,用于基于预设的所述待分析应用的漏斗配置文件匹配所述访问日志获取模块获取的每条所述访问日志,确定符合所述漏斗配置文件的访问日志的日志索引表;
路径匹配模块,用于基于待分析的访问路径分解后得到的路径列表,对根据所述日志索引表确定的实际访问路径进行匹配;
流量分析模块,用于根据所述路径匹配模块的匹配结果计算所述待分析应用的流量分析指标;
其中,所述访问日志包括访问的所述待分析应用的分析对象标识;所述漏斗配置文件包括预先生成的基于分析对象标识进行日志匹配的公式;所述待分析应用中同类型的分析页面具有相同的分析对象标识。
本申请公开的应用流量分析方法,通过获取待分析应用的访问日志;基于预设的所述应用的漏斗配置文件匹配每条所述访问日志,确定符合所述漏斗配置文件的访问日志的日志索引表;基于待分析的访问路径分解后得到的路径列表,对根据所述日志索引表确定的实际访问路径进行匹配;根据匹配结果计算所述待分析应用的流量分析指标;其中,所述访问日志包括访问的所述待分析应用的分析对象标识;所述漏斗配置文件包括预先生成的基于分析对象标识进行日志匹配的公式;所述待分析应用中同类型的分析对象具有相同的分析对象标识,解决了现有技术中基于频繁路径挖掘计算展现率或点击率,无法对同类型页面或模块进行宏观分析的问题。本申请通过对同类型页面或模块设置相同的分析对象标识,可以对同类型页面或模块的数据进行聚合分析,得到宏观分析结果。
同时,本申请通过配置文件,可以根据业务需求灵活配置待分析的页面或模块、灵活配置待分析路径深度、灵活配置应用的流量指标,实用性更强。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例一的应用流量分析方法流程图;
图2是本申请实施例二的应用流量分析方法流程图;
图3是本申请实施例三的应用流量分析装置结构示意图;
图4是本申请实施例四的应用流量分析装置结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
营销漏斗模型全称为"搜索营销效果转化漏斗",漏斗的五层对应了企业搜索营销的各个环节,反映了从展现、点击、访问、咨询,直到生成订单过程中的客户数量及流失。从最大的展现量到最小的订单量,这个一层层缩小的过程表示不断有客户因为各种原因离开,对企业失去兴趣或放弃购买。本申请基于营销漏斗模型的思想,从应用的实际需求出发,定义应用的流量漏斗,反映应用各页面或各模块的用户流量,进一步分析应用的流量。本申请实施例中所述应用包括:网页应用、移动终端应用和PC端应用等,及应用的模块。
实施例一
本申请公开的一种应用流量分析方法,如图1所示,该方法包括:步骤100至步骤130。
步骤100,获取待分析应用的访问日志。
应用的日志数据在分布式文件***中存储,日志***会搜集应用的日志数据,所述日志数据包括所有用户访问该应用的日志。日志数据中通常包括:用户标识(id)、应用标识、分析对象标识、访问分析对象的时间、以及访问的分析对象上下游关系(即页面或模块的跳转关系)等等。然后,日志***按照预设规则,从待分析应用的日志数据中提取属于某个用户的每一次会话的日志数据,生成一个会话相关的访问日志。其中,某个用户的一次会话的访问日志包括:用户标识、应用标识、会话标识、会话步骤。其中,会话步骤用于表示一次会话的访问日志的顺序。所述预设规则可以为:分析对象的上下游关系、访问时间间隔等。其中,所述访问日志包括访问的所述待分析应用的分析对象标识。
具体实施时,分析对象可以为页面或页面上的模块。
步骤110,基于预设的所述待分析应用的漏斗配置文件匹配每条所述访问日志,确定符合所述漏斗配置文件的访问日志的日志索引表。
具体实施时,在进行应用流量分析之前,首先通过图形用户界面配置待分析的应用的漏斗配置文件。所述漏斗配置文件包括预先生成的基于分析对象(如页面)进行日志匹配的公式。所述漏斗配置文件根据基于分析对象配置的各项参数,还包括根据预设的日志匹配条件、配置的各项参数,以及预设的访问日志的各个字段和各项参数的对应关系生成的用于进行日志匹配的公式。
然后,基于预设的所述待分析应用的漏斗配置文件,对获取的每条所述访问日志进行匹配,确定符合漏斗配置文件的访问日志,并提取访问日志的相关信息和漏斗配置文件相关参数信息生成日志索引表。例如,提取日志会话标识、日志标识、会话步骤,以及相关漏斗配置文件的参数日志标识、日志会话标识、会话步骤和所述漏斗描述、漏斗层级描述生成日志索引表。
步骤120,基于待分析的访问路径分解后得到的路径列表,对根据所述日志索引表确定的实际访问路径进行匹配。
当产品人员或维护人员需要分析应用的某个访问路径或页面的转化率、点击率等指标时,会输入待分析的分析对象的访问路径。
具体实施时,首先对待分析的访问路径进行分解,得到多个路径,组成路径列表。然后,根据前一步骤中得到的日志索引表对所述日志索引表中索引的访问日志按照访问的步骤先后顺序进行排列,排列后的访问日志代表了用户访问应用的分析对象的实际访问路径。具体实施时,可以根据排列后的访问日志生成访问分析对象队列,用分析对象对应的漏斗配置文件中设置的漏斗层级标识进一步标识生成的分析对象队列,就可以得到实际访问路径。最后,将得到的实际访问路径和路径列表中的每个路径进行匹配。
步骤130,根据匹配结果计算所述待分析应用的流量分析指标。
将得到的实际访问路径和路径列表中的每个路径进行匹配之后,确定匹配成功的路径(即实际访问路径中包含的路径),以及匹配成功的次数(即实际访问路径中包含路径的次数)等。然后,根据匹配得到的数据,计算预设的流量分析指标,如页面转化率、点击率等。
本申请实施例公开的应用流量分析方法,通过获取待分析应用的访问日志;基于预设的所述待分析应用的漏斗配置文件匹配每条所述访问日志,确定符合所述漏斗配置文件的访问日志的日志索引表;基于待分析的访问路径分解后得到的路径列表,对根据所述日志索引表确定的实际访问路径进行匹配;根据匹配结果计算所述待分析应用的流量分析指标;其中,所述访问日志包括访问的所述待分析应用的分析对象标识;所述漏斗配置文件包括预先生成的基于分析对象标识进行日志匹配的公式;所述待分析应用中同类型的分析对象具有相同的分析对象标识,解决了现有技术中基于频繁路径挖掘计算展现率或点击率,无法对同类型页面或模块进行宏观分析的问题。通过对同类型分析对象设置相同的分析对象标识,可以对同类型分析对象的数据进行聚合分析,得到宏观分析结果。
同时,本申请通过配置文件,可以根据业务需求灵活配置待分析的分析对象、灵活配置待分析路径深度、灵活配置应用的流量指标,实用性更强。
实施例二
本申请公开的一种应用流量分析方法,如图2所示,该方法包括:步骤200至步骤270。
步骤200,获取所述待分析应用的漏斗配置文件。
具体实施时,维护人员或业务人员通过预设的图形用户界面配置应用的漏斗的配置文件。漏斗指在应用使用过程中,不同步骤之间的用户转化率模型,用来分析用户访问应用的深度和各个步骤的效率,本方案也可以适用于某一模块、某一个具***置的活动针对特定目标的效率。获取所述待分析应用的漏斗配置文件包括:获取通过图形用户界面配置的待分析应用的漏斗描述、漏斗层级描述,其中,所述漏斗层级描述至少包括:漏斗层级标识、各层级包含的所述待分析应用的分析对象标识和匹配条件;根据所述分析对象标识和匹配条件、预设的分析对象标识和访问日志各字段的映射关系,生成层级定义公式;将所述漏斗描述、漏斗层级描述和层级定义公式整合成所述待分析应用的漏斗配置文件。
通过预设的人机交互界面配置所述应用的漏斗的配置文件,包括:漏斗描述、层级描述、层级定义公式。其中,漏斗描述用于定义评价指标;层级描述用于定义漏斗的层级数量、层级标识、层级路径,以及各层级包含的分析对象信息;所述分析对象信息包括分析对象标识,还可以包括分析对象的附加条件。层级定义公式根据配置的各层级的分析对象信息生成,所述分析对象至少包括分析对象标识,还可以包括附加条件。所述附加条件根据具体评估指标确定。
分析对象可以为应用的页面、模块,为了便于理解,本实施例以分析对象为一个应用程序的页面为例阐述应用流量分析方法的具体实施过程。下面以配置一个三层漏斗为例,说明漏斗的配置文件的生成过程。
首先,定义漏斗的漏斗描述,如漏斗用于计算的评价指标包括转化率。
然后,定义漏斗的层级描述。所述层级描述包括:层级数量、层级标识、层级路径,以及各层级包含的页面信息。本实施例中将漏斗设置为三层,各层级的标识分别为:第一层为“首页”,第二层为“意向页”,第三层为“订单”。漏斗的层级路径为“首页-意向页-订单”。
基于前述定义的层级,定义漏斗各层级包含的页面信息。通常应用程序应用的首页只有一个,为打开应用程序后的第一个页面。用户通过应用程序首页内的模块可以进入到多个下一级页面,最终进入目标页面或进入目标模块。在应用程序使用过程中,也可能出现用户通过应用程序首页内的模块进入到下一级页面后,返回到首页或退出应用程序的情况。为了标识用户的对应用程序中待分析页面的访问轨迹,将待分析页面配置为漏斗各层级的页面,便于通过漏斗进行分析。因此,可以设置第一层包含的页面(即“首页”)为打开应用程序后的第一个页面;设置第二层包含的页面(即“意向页”)为分析指标关注的从“首页”进入的页面;设置第三层包含的页面(即“订单”)为目标页面。具体实施时,还可以设置漏斗各层页面的附件条件,例如设置“首页”的附加条件,比如1.1版本,用于对指定版本的应用程序进行分析指标计算。
具体实施时,可以采用页面名称pagename标识每个页面。进行配置文件配置时采用的页面标识与日志文件中的该应用程序的每个页面的唯一标识一致。
当应用是网页应用时,如网站页面,如果分析对象为网站页面,则分析对象标识为网页的URL(统一资源定位符);如果引用是移动终端应用程序,如果分析对象模块,则对象标识为模块的唯一标识。
最后,根据所述漏斗描述和层级描述生成漏斗配置文件。
具体实施时,图形用户界面的后台预先建立每个配置项和应用程序运行日志的各字段的对应关系,以及匹配运算规则,当通过所述图形用户界面完成漏斗各项参数的配置之后,图形用户界面的后台根据通过所述图形用户界面配置的所述漏斗描述和层级描述生成漏斗的配置文件。具体为:将根据图形用户界面配置的漏斗的各项参数,映射到日志的字段,形成一个针对日志的判断公式,例如将版本号映射到app_version字段,形成如“app_version.equals(‘1.1’)”这样的公式。漏斗配置文件的结构为:漏斗描述、层级描述、层级定义公式,其中,层级定义公式根据配置的层级描述中的页面信息生成。具体实施时,层级定义公式可以只根据配置的层级描述中的页面信息中的分析对象标识(如页面标识)生成,也可以根据页面信息中的分析对象标识和附加条件生成。然后,将漏斗配置文件写入分布式文件***HDFS。
步骤210,获取待分析应用的访问日志。
获取待分析应用的访问日志的具体实施方案参见实施例一的相应步骤,此处不再赘述。
在预设待分析应用的漏斗配置文件以及获取到待分析应用的访问日志之后,基于预设的所述应用的漏斗配置文件匹配每条所述访问日志,确定符合所述漏斗配置文件的访问日志的日志索引表,包括:基于预设的所述待分析应用的漏斗配置文件中的层级定义公式匹配每条所述访问日志,确定符合所述漏斗配置文件的访问日志;根据匹配成功的访问日志的日志标识、日志会话标识、会话步骤和所述漏斗描述、漏斗层级描述生成日志索引表。
步骤220,基于预设的所述待分析应用的漏斗配置文件中的层级定义公式匹配每条所述访问日志,确定符合所述漏斗配置文件的访问日志。
具体实施时,在进行应用流量分析之前,首先通过图形用户界面配置待分析的应用的漏斗配置文件。所述漏斗配置文件包括预先生成的基于页面进行日志匹配的公式。所述漏斗配置文件根据基于页面配置的各项参数,还包括根据预设的日志匹配条件、配置的各项参数,以及预设的访问日志的各个字段和各项参数的对应关系生成的用于进行日志匹配的公式。
然后,基于预设的所述应用的漏斗配置文件,对获取的每条所述访问日志进行匹配,确定符合漏斗配置文件的访问日志。具体实施时,可以对每条所述访问日志,结合预设的所述应用的漏斗配置文件中的层级定义公式,采用JexlContext比较器去匹配访问日志,得到符合漏斗配置文件中层级定义公式的日志文件。
步骤230,根据匹配成功的访问日志的日志标识、日志会话标识、会话步骤和所述漏斗描述、漏斗层级描述生成日志索引表。
对于匹配成功的访问日志,提取访问日志的相关信息和漏斗配置文件相关参数信息生成日志索引表。例如,提取日志会话标识、日志标识、会话步骤,以及相关漏斗配置文件的参数日志标识、日志会话标识、会话步骤和所述漏斗描述、漏斗层级描述生成日志索引表。日志索引表中每个索引的格式可以为:日志id,漏斗描述,漏斗层级描述,日志会话id,会话步骤,用户ID。其中,日志id用于标识唯一一条日志;步骤描述用于匹配待分析访问路径;日志ID和用户ID用于计算转化率的指标。具体实施时,可以根据流量分析指标的不同增加或减少日志索引表的表项。
步骤240,对待分析的访问路径进行分解,得到待匹配路径列表。
其中,所述待分析的访问路径由至少一个漏斗层级标识组成。
当产品人员或维护人员需要分析应用的某个访问路径或页面的转化率、点击率等指标时,会输入待分析的访问路径。具体实施时,对待分析的访问路径进行分解,得到待匹配路径列表包括:采用基于前缀的划分方式,将待分析的访问路径分解成多个子路径组成的路径列表。即依次截取该待访问路径的前1至N(N等于所述待分析的访问路径的路径节点的数目)个路径节点,组成N个新的路径,所述N个新的路径组成待匹配路径列表。以待分析的访问路径为“A-B-C”为例,分别截取:A、A-B、A-B-C得到3个新的路径,并将A、A-B、A-B-C组成待匹配路径列表。
之后,基于待分析的访问路径分解后得到的路径列表,对根据所述日志索引表确定的实际访问路径进行匹配,包括:按照会话步骤从前到后的顺序对所述日志索引表进行排序;将排序后的日志索引表中每条索引的漏斗层级标识组成的实际访问路径,与基于待分析的访问路径分解后得到的路径列表中的所有路径分别进行匹配;其中,所述待分析的访问路径由至少一个漏斗层级标识组成。
步骤250,按照会话步骤从前到后的顺序对所述日志索引表进行排序。
按照日志索引表中索引的访问日志的会话步骤从前到后的顺序对所述日志索引表进行排序。
步骤260,将排序后的日志索引表中每条索引的漏斗层级标识组成的实际访问路径,与基于待分析的访问路径分解后得到的路径列表中的所有路径分别进行匹配。
排序后的日志索引表索引的访问日志的顺序代表了用户访问应用的页面的实际访问路径。具体实施时,可以根据排序后索引表索引的访问日志生成访问分析对象队列(如:页面队列),用分析对象(如:页面)对应的漏斗配置文件中设置的漏斗层级标识进一步表示生成的页面队列,就可以得到实际访问路径。最后,将得到的实际访问路径和路径列表中的每个路径进行匹配。例如,排序后的日志索引表第一个表项索引的访问日志中的漏斗层级描述中漏斗层级标识为A,排序后的日志索引表第二个表项索引的访问日志中的漏斗层级描述中漏斗层级标识为B,则可以得到实际访问路径为A-B。
然后,将得到的实际访问路径与得到的路径列表中的所有路径分别进行匹配。以前述步骤得到的结果为例,将实际访问路径A-B和路径列表中的所有路径A、A-B、A-B-C分别进行匹配。
步骤270,根据匹配结果计算所述待分析应用的流量分析指标。
将得到的实际访问路径和路径列表中的每个路径进行匹配之后,确定匹配成功的路径(即实际访问路径中包含的路径),以及匹配成功的次数(即实际访问路径中包含路径的次数)等。然后,根据匹配得到的数据,计算预设的流量分析指标,如页面转化率、点击率等。接续前述步骤的例子,本步骤中匹配成功的路径包括:A、A-B,各匹配成功1次。然后,根据匹配结果计算所述待分析应用的流量分析指标。
所述根据匹配结果计算所述待分析应用的流量分析指标的步骤,包括:根据匹配成功的路径列表中的路径和/或各所述路径的节点对应的分析对象标识计算应用的流量分析指标。应用的流量分析指标可以为:转化率、点击率。
流量分析指标主要为:每一个步骤的Pv,UV,会话数等。Pv即访问的次数,可以通过统计日志ID进行计算,UV通过统计用户ID进行计算,会话数通过统计会话ID进行计算,一般通过不同步骤之间的UV的比较,计算出用户在漏斗中的转化率,该转化率可以用来衡量用户的深度或者某个模块的效率;同时通过监控同一个漏斗的转化率变化,或者AB测试的两个漏斗之间的转化率比较,来进行业务的优化。
接续前述例子,根据匹配结果可以得到应用的与路径节点A对应的步骤的Pv为2。
为了便于理解,本实施例以一个用户的一个会话为例对应用的流量分析方法进行说明。具体实施时,采用同样的方法对所有用户的每次会话的访问日志进行前述步骤的匹配后,对每个用户的每个会话的匹配结果进行整合,就可以得到应用的各种流量分析指标。
本申请实施例公开的应用流量分析方法,通过获取待分析应用的访问日志;基于预设的所述待分配应用的漏斗配置文件匹配每条所述访问日志,确定符合所述漏斗配置文件的访问日志的日志索引表;基于待分析的访问路径分解后得到的路径列表,对根据所述日志索引表确定的实际访问路径进行匹配;根据匹配结果计算所述待分析应用的流量分析指标;其中,所述访问日志包括访问的所述待分析应用的分析对象标识;所述漏斗配置文件包括预先生成的基于分析对象标识进行日志匹配的公式;所述待分析应用中同类型的分析对象具有相同的分析对象标识,解决了现有技术中基于频繁路径挖掘计算展现率或点击率,无法对同类型页面或模块进行宏观分析的问题。通过对同类型分析对象(如页面、模块)设置相同的分析对象标识,可以对同类型的数据进行聚合分析,得到宏观分析结果。
同时,本申请通过配置文件,可以根据业务需求灵活配置待分析的分析对象(如:页面)、灵活配置待分析路径深度、灵活配置应用的流量指标,实用性更强。
实施例三
相应地,本申请公开的一种应用流量分析装置,如图3所示,所述装置包括:
访问日志获取模块300,用于获取待分析应用的访问日志;
日志索引表确定模块310,用于基于预设的所述待分析应用的漏斗配置文件匹配所述访问日志获取模块300获取的每条所述访问日志,确定符合所述漏斗配置文件的访问日志的日志索引表;
路径匹配模块320,用于基于待分析的访问路径分解后得到的路径列表,对根据所述日志索引表确定的实际访问路径进行匹配;
流量分析模块330,用于根据所述路径匹配模块320的匹配结果计算所述待分析应用的流量分析指标;
其中,所述访问日志包括访问的所述待分析应用的分析对象标识;所述漏斗配置文件包括预先生成的基于分析对象标识进行日志匹配的公式;所述待分析应用中同类型的分析对象具有相同的分析对象标识。
本申请实施例公开的应用流量分析装置,通过获取待分析应用的访问日志;基于预设的所述待分析应用的漏斗配置文件匹配每条所述访问日志,确定符合所述漏斗配置文件的访问日志的日志索引表;基于待分析的访问路径分解后得到的路径列表,对根据所述日志索引表确定的实际访问路径进行匹配;根据匹配结果计算所述待分析应用的流量分析指标;其中,所述访问日志包括访问的所述待分析应用的分析对象标识;所述漏斗配置文件包括预先生成的基于分析对象标识进行日志匹配的公式;所述待分析应用中同类型的页面具有相同的分析对象标识,解决了现有技术中基于频繁路径挖掘计算展现率或点击率,无法对同类型页面或模块进行宏观分析的问题。通过对同类型分析对象(如:页面)设置相同的分析对象标识,可以对同类型分析对象的数据进行聚合分析,得到宏观分析结果。
同时,本申请通过配置文件,可以根据业务需求灵活配置待分析的页面、灵活配置待分析路径深度、灵活配置应用的流量指标,实用性更强。
实施例四
基于实施例三,本申请另一实施例公开的一种应用流量分析装置,如图4所示,所述装置还包括:
漏斗配置文件生成模块340,用于获取通过图形用户界面配置的待分析应用的漏斗描述、漏斗层级描述,其中,所述漏斗层级描述至少包括:漏斗层级标识、各层级包含的所述待分析应用的分析对象标识和匹配条件;根据所述分析对象标识和匹配条件、预设的分析对象标识和访问日志各字段的映射关系,生成层级定义公式;将所述漏斗描述、漏斗层级描述和层级定义公式整合成所述待分析应用的漏斗配置文件。
可选地,所述日志索引表确定模块310进一步包括:
日志匹配单元3101,用于基于预设的所述待分析应用的漏斗配置文件中的层级定义公式匹配每条所述访问日志,确定符合所述漏斗配置文件的访问日志;
日志索引表生成单元3102,用于根据匹配成功的访问日志的日志标识、日志会话标识、会话步骤和所述漏斗描述、漏斗层级描述生成日志索引表。
可选地,所述路径匹配模块320包括:
排序单元3201,用于按照会话步骤从前到后的顺序对所述日志索引表进行排序;
路径匹配单元3202,用于将所述排序单元3201排序后的日志索引表中每条索引的漏斗层级标识组成的实际访问路径,与基于待分析的访问路径分解后得到的路径列表中的所有路径分别进行匹配;
其中,所述待分析的访问路径由至少一个漏斗层级标识组成。
所述流量分析模块330具体用于:根据匹配成功的路径列表中的路径和/或各所述路径的节点对应的分析对象标识计算应用的流量分析指标。
可选地,所述应用流量分析装置还包括:
待分析路径列表生成模块350,用于采用基于前缀的划分方式,将待分析的访问路径分解成多个子路径组成的路径列表。
本申请实施例公开的应用流量分析装置,通过获取待分析应用的访问日志;基于预设的所述应用的漏斗配置文件匹配每条所述访问日志,确定符合所述漏斗配置文件的访问日志的日志索引表;基于待分析的访问路径分解后得到的路径列表,对根据所述日志索引表确定的实际访问路径进行匹配;根据匹配结果计算所述待分析应用的流量分析指标;其中,所述访问日志包括访问的所述待分析应用的分析对象标识;所述漏斗配置文件包括预先生成的基于分析对象标识进行日志匹配的公式;所述待分析应用中同类型的页面具有相同的分析对象标识,解决了现有技术中基于频繁路径挖掘计算展现率或点击率,无法对同类型页面或模块进行宏观分析的问题。通过对同类型分析对象设置相同的分析对象标识,可以对同类型分析对象的数据进行聚合分析,得到宏观分析结果。
同时,本申请通过配置文件,可以根据业务需求灵活配置待分析的页面、灵活配置待分析路径深度、灵活配置应用的流量指标,实用性更强。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本申请提供的一种应用流量分析方法、装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

Claims (12)

1.一种应用流量分析方法,其特征在于,包括:
获取待分析应用的访问日志;
基于预设的所述待分析应用的漏斗配置文件匹配每条所述访问日志,确定符合所述漏斗配置文件的访问日志的日志索引表;
基于待分析的访问路径分解后得到的路径列表,对根据所述日志索引表确定的实际访问路径进行匹配;
根据匹配结果计算所述待分析应用的流量分析指标;
其中,所述访问日志包括访问的所述待分析应用的分析对象标识;所述漏斗配置文件包括预先生成的基于分析对象标识进行日志匹配的公式;所述待分析应用中同类型的分析对象具有相同的分析对象标识。
2.如权利要求1所述的方法,其特征在于,所述根据匹配结果计算所述待分析应用的流量分析指标的步骤,包括:
根据匹配成功的路径列表中的路径和/或各所述路径的节点对应的分析对象标识计算应用的流量分析指标。
3.如权利要求1所述的方法,其特征在于,所述获取待分析应用的访问日志的步骤之前,还包括:
获取通过图形用户界面配置的待分析应用的漏斗描述、漏斗层级描述,其中,所述漏斗层级描述至少包括:漏斗层级标识、各层级包含的所述待分析应用的分析对象标识和匹配条件;
根据所述分析对象标识和匹配条件、预设的分析对象标识和访问日志各字段的映射关系,生成层级定义公式;
将所述漏斗描述、漏斗层级描述和层级定义公式整合成所述待分析应用的漏斗配置文件。
4.如权利要求3所述的方法,其特征在于,所述基于预设的所述待分析应用的漏斗配置文件匹配每条所述访问日志,确定符合所述漏斗配置文件的访问日志的日志索引表的步骤,包括:
基于预设的所述待分析应用的漏斗配置文件中的层级定义公式匹配每条所述访问日志,确定符合所述漏斗配置文件的访问日志;
根据匹配成功的访问日志的日志标识、日志会话标识、会话步骤和所述漏斗描述、漏斗层级描述生成日志索引表。
5.如权利要求4所述的方法,其特征在于,基于待分析的访问路径分解后得到的路径列表,对根据所述日志索引表确定的实际访问路径进行匹配的步骤,包括:
按照会话步骤从前到后的顺序对所述日志索引表进行排序;
将排序后的日志索引表中每条索引的漏斗层级标识组成的实际访问路径,与基于待分析的访问路径分解后得到的路径列表中的所有路径分别进行匹配;
其中,所述待分析的访问路径由至少一个漏斗层级标识组成。
6.如权利要求1所述的方法,其特征在于,基于待分析的访问路径分解后得到的路径列表,对根据所述日志索引表确定的实际访问路径进行匹配的步骤之前,还包括:
采用基于前缀的划分方式,将待分析的访问路径分解成多个子路径组成的路径列表。
7.一种应用流量分析装置,其特征在于,包括:
访问日志获取模块,用于获取待分析应用的访问日志;
日志索引表确定模块,用于基于预设的所述待分析应用的漏斗配置文件匹配所述访问日志获取模块获取的每条所述访问日志,确定符合所述漏斗配置文件的访问日志的日志索引表;
路径匹配模块,用于基于待分析的访问路径分解后得到的路径列表,对根据所述日志索引表确定的实际访问路径进行匹配;
流量分析模块,用于根据所述路径匹配模块的匹配结果计算所述待分析应用的流量分析指标;
其中,所述访问日志包括访问的所述待分析应用的分析对象标识;所述漏斗配置文件包括预先生成的基于分析对象标识进行日志匹配的公式;所述待分析应用中同类型的分析对象具有相同的分析对象标识。
8.如权利要求7所述的装置,其特征在于,所述流量分析模块具体用于:根据匹配成功的路径列表中的路径和/或各所述路径的节点对应的分析对象标识计算应用的流量分析指标。
9.如权利要求7所述的装置,其特征在于,还包括:漏斗配置文件生成模块,用于:
获取通过图形用户界面配置的待分析应用的漏斗描述、漏斗层级描述,其中,所述漏斗层级描述至少包括:漏斗层级标识、各层级包含的所述待分析应用的分析对象标识和匹配条件;
根据所述分析对象标识和匹配条件、预设的分析对象标识和访问日志各字段的映射关系,生成层级定义公式;
将所述漏斗描述、漏斗层级描述和层级定义公式整合成所述待分析应用的漏斗配置文件。
10.如权利要求9所述的装置,其特征在于,所述日志索引表确定模块进一步包括:
日志匹配单元,用于基于预设的所述待分析应用的漏斗配置文件中的层级定义公式匹配每条所述访问日志,确定符合所述漏斗配置文件的访问日志;
日志索引表生成单元,用于根据匹配成功的访问日志的日志标识、日志会话标识、会话步骤和所述漏斗描述、漏斗层级描述生成日志索引表。
11.如权利要求10所述的装置,其特征在于,所述路径匹配模块包括:
排序单元,用于按照会话步骤从前到后的顺序对所述日志索引表进行排序;
路径匹配单元,用于将所述排序单元排序后的日志索引表中每条索引的漏斗层级标识组成的实际访问路径,与基于待分析的访问路径分解后得到的路径列表中的所有路径分别进行匹配;
其中,所述待分析的访问路径由至少一个漏斗层级标识组成。
12.如权利要求7所述的装置,其特征在于,还包括:
待分析路径列表生成模块,用于采用基于前缀的划分方式,将待分析的访问路径分解成多个子路径组成的路径列表。
CN201610597004.1A 2016-07-26 2016-07-26 一种应用流量分析方法及装置 Active CN106294559B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610597004.1A CN106294559B (zh) 2016-07-26 2016-07-26 一种应用流量分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610597004.1A CN106294559B (zh) 2016-07-26 2016-07-26 一种应用流量分析方法及装置

Publications (2)

Publication Number Publication Date
CN106294559A true CN106294559A (zh) 2017-01-04
CN106294559B CN106294559B (zh) 2019-09-17

Family

ID=57652664

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610597004.1A Active CN106294559B (zh) 2016-07-26 2016-07-26 一种应用流量分析方法及装置

Country Status (1)

Country Link
CN (1) CN106294559B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107563621A (zh) * 2017-08-22 2018-01-09 北京金堤科技有限公司 一种网站用户流失情况分析方法及装置
CN107580215A (zh) * 2017-09-25 2018-01-12 深圳市九洲电器有限公司 机顶盒元器件质量反馈方法及***
CN107943679A (zh) * 2017-11-24 2018-04-20 广州优视网络科技有限公司 路径漏斗的生成方法、装置和服务器
CN109145230A (zh) * 2017-06-15 2019-01-04 百度在线网络技术(北京)有限公司 信息输出方法和装置
CN110019072A (zh) * 2017-11-21 2019-07-16 北京京东尚科信息技术有限公司 基于实时数据的ab实验方法及***
CN110119337A (zh) * 2019-04-16 2019-08-13 深圳市轱辘汽车维修技术有限公司 一种数据分析方法、装置及服务器
CN110278150A (zh) * 2019-06-02 2019-09-24 北京航空航天大学 一种基于边缘节点请求信息特征的域间聚合路径分析方法
CN110675194A (zh) * 2019-09-29 2020-01-10 北京思维造物信息科技股份有限公司 一种漏斗分析方法、装置、设备及可读介质
CN110941608A (zh) * 2019-09-29 2020-03-31 北京思维造物信息科技股份有限公司 一种埋点分析和漏斗分析报表生成方法、装置及设备
CN111523921A (zh) * 2019-12-31 2020-08-11 支付宝实验室(新加坡)有限公司 漏斗分析方法、分析设备、电子设备及可读存储介质
CN112148957A (zh) * 2019-06-26 2020-12-29 北京百度网讯科技有限公司 网页访问数据分析方法、装置、设备及可读存储介质
CN112612987A (zh) * 2020-12-25 2021-04-06 广州凡科互联网科技股份有限公司 一种页面访问上下游流量的计算方法
CN113176980A (zh) * 2021-05-25 2021-07-27 医声医事(北京)科技有限公司 一种流量漏斗的动态构建方法及***
CN113486241A (zh) * 2021-07-08 2021-10-08 中国建设银行股份有限公司 业务偏好分析方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544298A (zh) * 2013-10-30 2014-01-29 曙光信息产业(北京)有限公司 组件的日志分析方法和分析装置
US20150301996A1 (en) * 2013-03-14 2015-10-22 Vmware, Inc. Dynamic field extraction of log data
CN105357054A (zh) * 2015-11-26 2016-02-24 上海晶赞科技发展有限公司 网站流量分析方法、装置和电子设备
CN105550250A (zh) * 2015-12-09 2016-05-04 百度在线网络技术(北京)有限公司 一种访问日志的处理方法及装置
CN105791247A (zh) * 2014-12-25 2016-07-20 ***通信集团公司 一种流量统付业务实现方法及相关设备与***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150301996A1 (en) * 2013-03-14 2015-10-22 Vmware, Inc. Dynamic field extraction of log data
CN103544298A (zh) * 2013-10-30 2014-01-29 曙光信息产业(北京)有限公司 组件的日志分析方法和分析装置
CN105791247A (zh) * 2014-12-25 2016-07-20 ***通信集团公司 一种流量统付业务实现方法及相关设备与***
CN105357054A (zh) * 2015-11-26 2016-02-24 上海晶赞科技发展有限公司 网站流量分析方法、装置和电子设备
CN105550250A (zh) * 2015-12-09 2016-05-04 百度在线网络技术(北京)有限公司 一种访问日志的处理方法及装置

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145230A (zh) * 2017-06-15 2019-01-04 百度在线网络技术(北京)有限公司 信息输出方法和装置
CN107563621A (zh) * 2017-08-22 2018-01-09 北京金堤科技有限公司 一种网站用户流失情况分析方法及装置
CN107580215A (zh) * 2017-09-25 2018-01-12 深圳市九洲电器有限公司 机顶盒元器件质量反馈方法及***
CN110019072A (zh) * 2017-11-21 2019-07-16 北京京东尚科信息技术有限公司 基于实时数据的ab实验方法及***
CN110019072B (zh) * 2017-11-21 2021-05-25 北京京东尚科信息技术有限公司 基于实时数据的ab实验方法及***
CN107943679A (zh) * 2017-11-24 2018-04-20 广州优视网络科技有限公司 路径漏斗的生成方法、装置和服务器
CN107943679B (zh) * 2017-11-24 2021-02-26 阿里巴巴(中国)有限公司 路径漏斗的生成方法、装置和服务器
CN110119337A (zh) * 2019-04-16 2019-08-13 深圳市轱辘汽车维修技术有限公司 一种数据分析方法、装置及服务器
CN110278150A (zh) * 2019-06-02 2019-09-24 北京航空航天大学 一种基于边缘节点请求信息特征的域间聚合路径分析方法
CN112148957A (zh) * 2019-06-26 2020-12-29 北京百度网讯科技有限公司 网页访问数据分析方法、装置、设备及可读存储介质
CN110941608A (zh) * 2019-09-29 2020-03-31 北京思维造物信息科技股份有限公司 一种埋点分析和漏斗分析报表生成方法、装置及设备
CN110675194A (zh) * 2019-09-29 2020-01-10 北京思维造物信息科技股份有限公司 一种漏斗分析方法、装置、设备及可读介质
CN110941608B (zh) * 2019-09-29 2023-01-20 北京思维造物信息科技股份有限公司 一种埋点分析和漏斗分析报表生成方法、装置及设备
CN111523921A (zh) * 2019-12-31 2020-08-11 支付宝实验室(新加坡)有限公司 漏斗分析方法、分析设备、电子设备及可读存储介质
CN111523921B (zh) * 2019-12-31 2023-10-20 支付宝实验室(新加坡)有限公司 漏斗分析方法、分析设备、电子设备及可读存储介质
CN112612987A (zh) * 2020-12-25 2021-04-06 广州凡科互联网科技股份有限公司 一种页面访问上下游流量的计算方法
CN113176980A (zh) * 2021-05-25 2021-07-27 医声医事(北京)科技有限公司 一种流量漏斗的动态构建方法及***
CN113176980B (zh) * 2021-05-25 2023-09-12 医声医事(北京)科技有限公司 一种流量漏斗的动态构建方法及***
CN113486241A (zh) * 2021-07-08 2021-10-08 中国建设银行股份有限公司 业务偏好分析方法及装置

Also Published As

Publication number Publication date
CN106294559B (zh) 2019-09-17

Similar Documents

Publication Publication Date Title
CN106294559A (zh) 一种应用流量分析方法及装置
Bergh et al. Using meta‐analytic structural equation modeling to advance strategic management research: Guidelines and an empirical illustration via the strategic leadership‐performance relationship
Giordano et al. Bayesian belief network to support conflict analysis for groundwater protection: the case of the Apulia region
Souza et al. User experience evaluation using mouse tracking and artificial intelligence
Korzh et al. Methods for forming an informational image of a higher education institution.
CN110363407A (zh) 基于用户行为轨迹的欺诈风险评估方法及装置
KR20120007889A (ko) 광고효과를 검증하는 방법, 시스템 및 그 기록매체
Van der Vlist Counter-mapping surveillance: A critical cartography of mass surveillance technology after Snowden
CN110020687A (zh) 基于操作人员态势感知画像的异常行为分析方法及装置
Andone et al. Using open education tools for a higher education virtual campus
Zou et al. A novel network security algorithm based on improved support vector machine from smart city perspective
Zacharis et al. AiCEF: an AI-assisted cyber exercise content generation framework using named entity recognition
Lenzi et al. Disclosing cyber-attacks on water distribution systems. An experimental approach to the sonification of threats and anomalous data.
CN106777235A (zh) 一种评估不同数据源数据准确度的方法和装置
Lebtag et al. Strategies to evolve exm notations extracted from a survey with software engineering professionals perspective
Akhuseyinoglu et al. Exploring behavioral patterns for data-driven modeling of learners' individual differences
Yahya et al. A fuzzy logic-based approach for assessing the quality of business process models
CN110493044A (zh) 一种可量化的态势感知的方法和***
Schmidt et al. Identifying the Giants: A Social Network Analysis of the Literature on Information Technology Outsourcing Relationships.
Dekker Social data: CESSDA best practices
Berlanga et al. Towards Semantic DigitalTwins for Social Networks
Bhatnagar et al. Real-time analysis on finding significance of data mining on CRM of service sector organisations: an Indian perspective
Al Hinai Quantification of social sustainability in software
Oliveira et al. 25 Years of Requirements Engineering in Brazil: A Systematic Mapping.
Albuquerque et al. Studying group dynamics through social networks analysis in a medical community

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant