CN102611572A - 一种数据分析方法、装置及*** - Google Patents

一种数据分析方法、装置及*** Download PDF

Info

Publication number
CN102611572A
CN102611572A CN2012100382350A CN201210038235A CN102611572A CN 102611572 A CN102611572 A CN 102611572A CN 2012100382350 A CN2012100382350 A CN 2012100382350A CN 201210038235 A CN201210038235 A CN 201210038235A CN 102611572 A CN102611572 A CN 102611572A
Authority
CN
China
Prior art keywords
network address
user
visit
level
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012100382350A
Other languages
English (en)
Other versions
CN102611572B (zh
Inventor
王绍宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201210038235.0A priority Critical patent/CN102611572B/zh
Publication of CN102611572A publication Critical patent/CN102611572A/zh
Application granted granted Critical
Publication of CN102611572B publication Critical patent/CN102611572B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种数据分析方法,网络设备将用户要访问的网址与内置的按层级存储的推荐网址进行匹配;当匹配到一致的推荐网址时,确定所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级,推荐网址的层级与在终端上展现的推荐信息的层级相对应;解析出发送所述业务访问请求的终端标识;如果所述用户要访问的网址的层级大于或等于第一阈值,向服务器发送解析出的终端标识、用户要访问的网址和所述用户要访问的网址的层级,使服务器统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。本发明实施例提供的数据分析方法,可以降低数据分析量,提高分析数据的精准度。

Description

一种数据分析方法、装置及***
技术领域
本发明涉及数据分析技术领域,具体涉及一种数据分析方法、网络设备、服务器及***。
背景技术
随着互联网络的日益普及,互联网广告的低成本高效益日渐明显,已经被越来越多的广告主所接受和认可。通过网络传媒进行商品推广推销成为了新兴的营销方式。
网络精准营销及广告技术“precision marketing”&“Behavior Targeting”,就是在网络营销基础上实施广告受众的精确分析,识别出产品/活动的潜在目标用户,提高相关产品的推广营销成功机率。
精准营销及广告的技术关键是高效并准时的识别出网络上哪些用户点击访问或观看了相应的产品广告。从而将这些用户作为进一步营销的受众目标。
这就要求互联网后端的服务或设备记录网络内所有用户的访问记录,并通过相应的商务智能(BI,Business Intelligent)技术实施多维度数据分析及数据挖掘,预测相应的用户的兴趣趋向,相应的广告投放***依据数据分析平台的分析预测,有针对性的开展并实施广告投放,从而提升互联网营销的成功率。
现有技术通常采用“前台追踪用户对推广信息的点击→后台统计整理报表→人工决策调整推荐策略”的方式来实现推荐业务优化,这种做法在互联网领域使用广泛,如Google Analytics、Apache Clickstream等;在电信领域由于数据量较大以及难以追踪用户点击,常常会直接借助流量统计、广告点击统计等间接方式来估算推荐效果并辅助人工决策。
现有技术为了实现精准营销的优化和精度提升,通常都是将大量的精力和重点投入到后端的数据分析***上,建立强大的集群及并行分布式计算分析***。随着电信领域用户和互联网数据量的***式增长,数据分析量越来越大,分析出的数据的精准度越来越低,而且随着分析***变的越来越庞大,优化分析投入成本越来越高昂。
发明内容
本发明实施例提供一种数据分析方法,可以降低数据分析量,提高分析数据的精准度。本发明实施例还提供了相应的装置及***。
一种数据分析方法,包括:
接收业务访问请求,所述业务访问请求中包含用户要访问的网址;
将所述用户要访问的网址与内置的按层级存储的推荐网址进行匹配;
当匹配到一致的推荐网址时,确定所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级,推荐网址的层级与在终端上展现的推荐信息的层级相对应;
解析出发送所述业务访问请求的终端标识;
如果所述用户要访问的网址的层级大于或等于第一阈值,向服务器发送解析出的终端标识、用户要访问的网址和所述用户要访问的网址的层级,使服务器统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
一种数据分析方法,包括:
接收终端标识、用户要访问的网址和所述用户要访问的网址的层级;
将所述终端标识、用户要访问的网址和所述用户要访问的网址的层级关联存储;
将层级大于或等于第一阈值的数据作为数据源,统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
一种网络设备,包括:
第一接收单元,用于接收业务访问请求,所述业务访问请求中包含用户要访问的网址;
网址匹配单元,用于将所述第一接收单元接收到的业务访问请求中包含的用户要访问的网址与内置的按层级存储的推荐网址进行匹配;
层级确定单元,用于当所述网址匹配单元匹配到一致的推荐网址时,确定所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级,推荐网址的层级与在终端上展现的推荐信息的层级相对应;
解析单元,用于解析出发送所述第一接收单元接收到的业务访问请求的终端的标识;
发送单元,用于在所述用户要访问的网址的层级大于或等于第一阈值时,向服务器发送所述解析单元解析出的终端标识、用户要访问的网址和所述用户要访问的网址的层级,使服务器统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
一种服务器,包括:
第二接收单元,用于接收终端标识、用户要访问的网址和所述用户要访问的网址的层级;
存储单元,用于将所述第二接收单元接收到的终端标识、用户要访问的网址和所述用户要访问的网址的层级关联存储;
分析单元,用于将所述存储单元存储的层级大于或等于第一阈值的数据作为数据源,统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
一种数据分析***,包括网络设备和服务器,所述网络设备为上述技术方案所述的网络设备,所述服务器为上述技术方案所述的服务器。
一种数据分析***,包括网络设备、深度包解析设备和服务器,所述深度包解析设备与所述网络设备具有通信连接;
所述网络设备接收业务访问请求,并将所述业务访问请求或所述业务访问请求的镜像包转发给所述深度包解析设备,所述业务访问请求中包含用户要访问的网址;
所述深度包解析设备将所述用户要访问的网址与内置的按层级存储的推荐网址进行匹配;当匹配到一致的推荐网址时,确定所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级,推荐网址的层级与在终端上展现的推荐信息的层级相对应;解析出发送所述业务访问请求的终端标识;如果所述用户要访问的网址的层级大于或等于第一阈值,所述深度包解析设备向所述网络设备发送解析出的终端标识、用户要访问的网址和所述用户要访问的网址的层级;
所述网络设备向服务器发送接收到的终端标识、用户要访问的网址和所述用户要访问的网址的层级;
所述服务器将层级大于或等于第一阈值的数据作为数据源,统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
本发明实施例采用接收业务访问请求,所述业务访问请求中包含用户要访问的网址;将所述用户要访问的网址与内置的按层级存储的推荐网址进行匹配;当匹配到一致的推荐网址时,确定所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级,推荐网址的层级与在终端上展现的推荐信息的层级相对应;解析出发送所述业务访问请求的终端标识;如果所述用户要访问的网址的层级大于或等于第一阈值,向服务器发送解析出的终端标识、用户要访问的网址和所述用户要访问的网址的层级,使服务器统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。与现有技术中只要用户访问,后台服务器就分析相比,本发明实施例提供的数据分析方法,可以降低数据分析量,提高分析数据的精准度。
附图说明
图1是本发明实施例中数据分析方法的一实施例示意图;
图2是本发明实施例中数据分析方法的另一实施例示意图;
图3是本发明实施例中数据分析方法的另一实施例示意图;
图4是本发明实施例中应用场景实施例示意图;
图5是本发明实施例中网络设备的一实施例示意图;
图6是本发明实施例中网络设备的另一实施例示意图;
图7是本发明实施例中网络设备的另一实施例示意图;
图8是本发明实施例中服务器的一实施例示意图;
图9是本发明实施例中服务器的另一实施例示意图;
图10是本发明实施例中***的一实施例示意图;
图11是本发明实施例中***的另一实施例示意图。
具体实施方式
本发明实施例提供一种数据分析方法,可以降低数据分析量,提高分析数据的精准度。本发明实施例还提供了相应的装置及***。以下分别进行详细说明。
参阅图1,从网络设备的角度来看,本发明实施例提供的数据分析方法的一实施例包括:
101、接收业务访问请求,所述业务访问请求中包含用户要访问的网址。
本发明实施例中提供的网络设备可以是网关GPRS支持节点(GGSN,Gateway GPRS Support Node),也可以是具有与本发明实施例提供的数据分析相同的功能的其他网络设备,本发明实施例以GGSN为例进行说明。
用户浏览广告信息时,会点击广告的推荐链接发起业务请求,GGSN接收到业务请求,实际上业务请求是通过数据包发送过来的,用户发起一次业务请求,这一次业务请求可能是通过一个或多个数据包发送给GGSN的,GGSN接收到一个数据包后,先判断接收到的数据包是否携带了完整的信息,如果判断出这个数据包是一个完整的数据流,携带了完整的信息,那么获取数据包中携带的用户要访问的网址,也就是业务访问请求中包含的用户要访问的网址;如果GGSN判断出接收到的数据包不完整,那么先将这个数据包存储起来,等到收到同一个业务请求的其他数据包后,将同一个业务请求的所有数据包组成一个完整的数据流,获取用户要访问的网址。
102、将所述用户要访问的网址与内置的按层级存储的推荐网址进行匹配。
获取所述业务访问请求中的用户要访问的网址后,在GGSN中内置有推荐网址列表,所述内置的推荐网址列表可以由第三方公司提供,如***商、互联网公司、个人广告主等;所述推荐网址列表包括推荐网址与所述推荐网址的层级之间的映射关系,推荐网址的层级与在终端上展现的推荐信息的层级相对应;如果推荐网址列表中的推荐网址是第二层级,那么该推荐信息在展示页面中也是第二层级;推荐信息指的是媒体信息,广告内容,如在页面上展示的产品广告。
网址匹配的过程可以为:将用户要访问的网址与内置的推荐列表中的推荐网址逐个进行比对。
103、当匹配到一致的推荐网址时,确定所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级,推荐网址的层级与在终端上展现的推荐信息的层级相对应。
当在网址推荐列表中找到了与用户要访问的网址相同的推荐网址后,从推荐网址与所述推荐网址的映射关系中就可以获知所述用户要访问的网址的层级,也就是说,所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级。
为提供分层数据,广告内容提供商预先将广告的推荐信息在终端的展示页面上分层展现,如将产品的概要信息放在一层展现,产品的详细信息等放在二层展现;以互联网汽车广告为例,将汽车的品牌信息放在一层展现,将汽车性能参数或活动等详细信息放在二层展现,当用户点击浏览展现一层后,可知道该广告为何品牌汽车的广告,只凭用户了解何品牌的汽车并不能确定用户对该汽车感兴趣,如果继续点击展现二层了解汽车性能参数或活动等详细信息,则说明用户对该产品感兴趣,是真正的潜在购买者。
现有技术中,用于分析数据的服务器可以跟踪到用户点击了哪些网址,但不能确定网址的层级,这样对每个点击数据都进行存储和分析,导致数据分析***越来越大,而且分析出的数据的精准度还很低,无法准确锁定对产品感兴趣的用户。
因此本发明实施例提供了一种与广告内容提供商的广告推荐信息层级相对应的层级解析方案,可以确定用户访问的推荐信息的层级,并能将该层级发送给服务器,使服务器按层级分析数据。
104、解析出发送所述业务访问请求的终端标识。
本发明实施例提供的终端可以是移动终端,也可以是固定终端,如果是手机上网,那么终端的标识就是国际移动用户标识码(IMSI,International MobileSubscriber Identification),如:13580000000;如果是电脑上网,那么终端的标识就是该终端的媒体接入控制(MAC,Media Access Control)地址。
105、如果所述用户要访问的网址的层级大于或等于第一阈值,向服务器发送解析出的终端标识、用户要访问的网址和所述用户要访问的网址的层级,使服务器统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
现有技术中,因将所有的用户点击广告推荐信息的数据都发送给了服务器,使服务器要存储和分析的数据量太过庞大,而且这些数据中有绝大部分数据对确定对产品感兴趣的用户没有意义。因此本发明实施例中,给出了第一阈值,当确定所述用户要访问的网址的层级后,如果用户要访问的网址的层级大于或等于该第一阈值,才向服务器发送解析出的终端标识、用户要访问的网址和所述用户要访问的网址的层级,如果用户要访问的网址的层级小于该第一阈值,则不发送数据给服务器,这样可以降低服务器的数据分析量,如第一阈值为2时,只将层级大于等于2的数据发送给服务器。
因网络设备向服务器发送的数据是层级大于或等于第一阈值的数据,这样服务器分析的数据也是层级大于或等于第一阈值的数据,降低了数据分析量。
服务器接收到终端标识、用户要访问的网址和所述用户要访问的网址的层级后,将层级大于或等于第一阈值的数据作为数据源,统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量,这样更容易确定对产品感兴趣的用户量,提高了数据分析的精准度。
举例来说,GGSN解析出终端的标识后,将解析出的终端的标识,用户要访问的网址和所述用户要访问的网址在推荐网址中的层级发送给服务器,如终端的标识为13580000000的用户访问了一汽马自达汽车规格配置表的网址http://www.***.com/s?wd=%C2%ED%D7%D4%B4%EF6&rsv bp=0&rsv spt= 3&oq=%C2%ED%D7%D4%B4%EF&rsp=0&f=3&inputT=9203;在步骤103中已经匹配出该网址位于内置推荐网址的第二层级,那么将以上三个信息发送给服务器。
本发明实施例中,接收业务访问请求,所述业务访问请求中包含用户要访问的网址;将所述用户要访问的网址与内置的按层级存储的推荐网址进行匹配;当匹配到一致的推荐网址时,确定所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级,推荐网址的层级与在终端上展现的推荐信息的层级相对应;解析出发送所述业务访问请求的终端标识;如果所述用户要访问的网址的层级大于或等于第一阈值,向服务器发送解析出的终端标识、用户要访问的网址和所述用户要访问的网址的层级,使服务器统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。与现有技术中只要用户访问,后台服务器就分析相比,本发明实施例提供的数据分析方法,可以降低数据分析量,提高分析数据的精准度。
参阅图2,从服务器的角度来看,本发明实施例提供的数据分析方法的另一实施例包括:
201、接收终端标识、用户要访问的网址和所述用户要访问的网址的层级。
本发明实施例中的服务器主要指的是用于数据分析的服务器,如商务智能中用到的服务器;
服务器接收终端标识、用户要访问的网址和所述用户要访问的网址的层级,如上述实施例中的例子,那么服务器就接收到终端的标识为13580000000的用户访问了一汽马自达汽车规格配置表的网址http://www.***.com/s?wd=%C2%ED%D7%D4%B4%EF6&rsv bp=0&rsv spt= 3&oq=%C2%ED%D7%D4%B4%EF&rsp=0&f=3&inputT=9203;该网址属于推荐的第二层级。
202、将所述终端标识、用户要访问的网址和所述用户要访问的网址的层级关联存储。
服务器可为终端标识、用户要访问的网址和所述用户要访问的网址的层级建立一个映射表,在映射表中将终端标识、用户要访问的网址和所述用户要访问的网址的层级做映射关联。
203、将层级大于或等于第一阈值的数据作为数据源,统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
服务器接收到的数据是层级大于或等于第一阈值的数据,那么服务器就将层级大于或等于第一阈值的数据作为数据源,统计每个用户要访问的网址的点击率,点击率实际上就是用户的数量,只要统计出每个用户要访问的网址对应的终端标识的数量就得到了该用户要访问的网址的点击率。
如,统计访问第二层级中访问一汽马自达汽车规格配置表的网址的点击率,那么,将访问该网址的终端用户标识相加即可得到。
如果广告提供商需要进一步的信息,如对一汽马自达汽车感兴趣的用户的归属地,那么可以从终端标识归属地列表中查询出每个终端标识的归属地,并将所述用户要访问的网址、与所述用户要访问的网址对应的终端标识和所述终端标识的归属地关联存储;统计与每个用户要访问的网址关联的每个归属地的终端标识的数量;这样可以获知每个地方对该广告感兴趣的用户数量,可以针对该地区做更好的推广。
本发明实施例中,接收终端标识、用户要访问的网址和所述用户要访问的网址的层级;将所述终端标识、用户要访问的网址和所述用户要访问的网址的层级关联存储;将层级大于或等于第一阈值的数据作为数据源,统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。与现有技术中只要用户访问,后台服务器就分析相比,本发明实施例提供的数据分析方法,通过将推荐信息分层,网络设备匹配出用户要访问网址的层级,并将所述层级发送给服务器,后台服务器只分析层级大于或等于第一阈值的数据,从而降低数据分析量,提高分析数据的精准度。
参阅图3,针对上述实施例提供的数据分析方法实施例的整体过程做详细描述:
S1、终端向网络设备发送业务访问请求;
所述业务访问请求中包含用户要访问的网址。
S2、网络设备将所述用户要访问的网址与内置的按层级存储的推荐网址进行匹配;
网络设备接收到终端发送的业务访问请求后,获取所述业务访问请求中的用户要访问的网址;将所述用户要访问的网址与内置的推荐网址列表中的推荐网址进行匹配,所述推荐网址列表包括推荐网址与所述推荐网址的层级之间的映射关系。
S3、网络设备当当匹配到一致的推荐网址时,确定所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级,推荐网址的层级与在终端上展现的推荐信息的层级相对应。
当在网址推荐列表中找到了与用户要访问的网址相同的推荐网址后,从推荐网址与所述推荐网址的映射关系中就可以获知所述用户要访问的网址的层级,也就是说,所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级。
S4、网络设备解析出发送所述业务访问请求的终端标识;
终端可以是移动终端,也可以是固定终端,如果是手机上网,那么终端的标识就是国际移动用户标识码(IMSI,International Mobile SubscriberIdentification),如:13580000000;如果是电脑上网,那么终端的标识就是该终端的媒体接入控制(MAC,Media Access Control)地址。
S5、如果所述用户要访问的网址的层级大于或等于第一阈值,向服务器发送解析出的终端标识、用户要访问的网址和所述用户要访问的网址的层级;
网络设备发送层级大于或等于第一阈值的数据给服务器,可以降低服务器的数据分析量。
S6、服务器统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
广告提供商可以根据服务器中展现的广告的点击量,确定该广告的被关注程度,同时,还可以获知有哪些用户对该广告感兴趣,可以针对这些对广告感兴趣的用户进行推广。
本实施例中,从整体上对本发明实施例提供的数据分析方法进行了说明,更佳体现出了本发明实施例提供的数据分析方法,可以降低数据分析量,提高分析数据的精准度。
为便于理解,下面以一个具体应用场景为例,对本发明实施例中提供的数据分析方法进行详细说明:
参阅图4,终端用户点击访问产品推荐网址(URL,Uniform/UniversalResource Locator),发起互联网业务访问请求,业务访问请求最终被GGSN所接收到,GGSN获取业务访问请求中包含的用户要访问的网址,如终端用户13100000000,13200000000,13300000000,13400000000,13500000000都分别访问了波司登羽绒服2011新款的网址http://huoyan.blogcn.com/88,以其中13100000000用户发起业务请求,GGSN处理该业务请求的过程来说,GGSN将该用户要访问的网址http://huoyan.blogcn.com/88与内置的推荐网址进行匹配,找到该网址在推荐网址中的第二层级,如果GGSN内设置的层级的第一阈值为2,那么GGSN将该用户的终端的标识13100000000,用户要访问的网址http://huoyan.blogcn.com/88,该网址的层级第二级发送给服务器,发送的数据结构可以参阅下表1:本场景中只是以13100000000这个用户为例,对于其他几个发起同样请求的用户,GGSN做出同样的处理,也将其他几个用户的信息发送给服务器。
表1:GGSN发送的数据结构表
  层级   终端的标识   网址
  2   13100000000   http://huoyan.blogcn.com/88
用户13600000000发起了雪中飞羽绒服2011年新款的业务请求,网址为http://abc.wm23.com/aiken/144512.html,GGSN也解析到该网址位于第二层级,那么GGSN将终端标识为13600000000,http://abc.wm23.com/aiken/144512.html,位于第二层级三个信息也发给服务器。
服务器接收到GGSN发送来的数据,按照层级将终端的标识和用户要访问的网址对应存储;还是以本场景中提到的几个用户为例,服务器将这些用户的信息存储到一张表中,如表2
  层级   终端的标识   网址
  2   13100000000   http://huoyan.blogcn.com/88
  2   13200000000   http://huoyan.blogcn.com/88
  2   13300000000   http://huoyan.blogcn.com/88
  2   13400000000   http://huoyan.blogcn.com/88
  2   13500000000   http://huoyan.blogcn.com/88
  2   13600000000   http://abc.wm23.com/aiken/144512.html
当然本场景中只给出了上述6个用户,实际上可以有很多个用户,访问的网址也可以不相同,但处理方法是相同的,假如服务器要分析第二层中波司登羽绒服2011新款的数据,将上述表3中的数据进行过滤筛选,将终端用户标识是13600000000的数据筛除,统计访问波司登羽绒服2011新款的用户有5人,这样就可以针对这5个用户进行具体推荐。
本应用场景中只给出了推荐网址是2层的情况,实际上可以有很多层,如上述提到的波司登羽绒服2011新款,如果用户再点击具体的某一款羽绒服,那么就可以将这一层定位为第三层,如果想掌握喜欢这一款羽绒服的用户,那么就可以针对访问该网址的用户进行分析。
参阅图5,本发明实施例提供的网络设备的一实施例包括:
第一接收单元301,用于接收业务访问请求,所述业务访问请求中包含用户要访问的网址;
网址匹配单元302,用于将所述第一接收单元301接收到的业务访问请求中包含的用户要访问的网址与内置的按层级存储的推荐网址进行匹配;
层级确定单元303,用于当所述网址匹配单元302匹配到一致的推荐网址时,确定所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级,推荐网址的层级与在终端上展现的推荐信息的层级相对应;
解析单元304,用于解析出发送所述第一接收单元301接收到的业务访问请求的终端的标识;
发送单元305,用于在所述用户要访问的网址的层级大于或等于第一阈值时,向服务器发送所述解析单元304解析出的终端标识、用户要访问的网址和所述用户要访问的网址的层级,使服务器统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
本发明实施例中,第一接收单元301接收业务访问请求,所述业务访问请求中包含用户要访问的网址;网址匹配单元302将所述第一接收单元301接收到的业务访问请求中包含的用户要访问的网址与内置的按层级存储的推荐网址进行匹配;层级确定单元303当所述网址匹配单元302匹配到一致的推荐网址时,确定所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级,推荐网址的层级与在终端上展现的推荐信息的层级相对应;解析单元304解析出发送所述第一接收单元301接收到的业务访问请求的终端的标识;发送单元305在所述用户要访问的网址的层级大于或等于第一阈值时,向服务器发送所述解析单元304解析出的终端标识、用户要访问的网址和所述用户要访问的网址的层级,使服务器统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。与现有技术相比,本发明实施例提供的网络设备,可以降低数据分析量,提高分析数据的精准度。
参阅图6,在上述图5对应的实施例的基础上,本发明实施例提供的网络设备的另一实施例还包括:
获取单元306,用于获取所述第一接收单元301接收到的业务访问请求中的用户要访问的网址;
所述网址匹配单元302,用于将所述获取单元获306取到的用户要访问的网址与内置的推荐网址列表中的推荐网址进行匹配,所述推荐网址列表包括推荐网址与所述推荐网址的层级之间的映射关系。
参阅图7,在上述图6对应的实施例的基础上,本发明实施例提供的网络设备的另一实施例中所述获取单元306包括:
过滤模块3061,用于在所述业务访问请求包含在多个数据包中时,过滤掉重复的数据包;
排序模块3062,用于将所述过滤模块3061过滤后剩余的数据包进行排序,组成一个完整的数据流;
解析模块3063,用于将所述排序模块3062组成的完整的数据流中解析出用户要访问的网址。
网络设备中的获取单元306中的过滤模块3061在所述业务访问请求包含在多个数据包中时,过滤掉重复的数据包;排序模块3062将所述过滤模块3061过滤后剩余的数据包进行排序,组成一个完整的数据流;解析模块3063将所述排序模块3062组成的完整的数据流中解析出用户要访问的网址。
参阅图8,本发明实施例中提供的服务器的一实施例包括:
第二接收单元401,用于接收终端标识、用户要访问的网址和所述用户要访问的网址的层级;
存储单元402,用于将所述第二接收单元401接收到的终端标识、用户要访问的网址和所述用户要访问的网址的层级关联存储;
分析单元403,用于将所述存储单元402存储的层级大于或等于第一阈值的数据作为数据源,统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
本发明实施例中,第二接收单元401接收终端标识、用户要访问的网址和所述用户要访问的网址的层级;存储单元402将所述第二接收单元401接收到的终端标识、用户要访问的网址和所述用户要访问的网址的层级关联存储;分析单元403将所述存储单元402存储的层级大于或等于第一阈值的数据作为数据源,统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。与现有技术相比,本发明实施例中所提供的服务器可以根据层级分析对应的数据,这样可以降低数据分析量,提高数据分析精度。
参阅图9,在上述图8对应的实施例的基础上,本发明实施例提供的服务器的另一实施例中所述分析单元403包括:
查询单元404,用于从终端标识归属地列表中查询出每个终端标识的归属地;
所述存储单元402,还用于将所述用户要访问的网址、与所述用户要访问的网址对应的终端标识和所述查询单元404查询到的终端标识的归属地关联存储;
所述分析单元403,还用于统计所述存储单元402存储的与每个用户要访问的网址关联的每个归属地的终端标识的数量。
参阅图10,本发明实施例提供的数据分析***的一实施例包括网络设备30和服务器40,
网络设备30,用于接收业务访问请求,所述业务访问请求中包含用户要访问的网址;将所述用户要访问的网址与内置的按层级存储的推荐网址进行匹配;当匹配到一致的推荐网址时,确定所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级,推荐网址的层级与在终端上展现的推荐信息的层级相对应;解析出发送所述业务访问请求的终端标识;如果所述用户要访问的网址的层级大于或等于第一阈值,向服务器发送解析出的终端标识、用户要访问的网址和所述用户要访问的网址的层级,使服务器统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
服务器40,用于接收终端标识、用户要访问的网址和所述用户要访问的网址的层级;将所述终端标识、用户要访问的网址和所述用户要访问的网址的层级关联存储;将层级大于或等于第一阈值的数据作为数据源,统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
本发明实施例提供的***可以降低数据分析量,提高分析数据的精准度。
参月图11,本发明实施例提供的***的另一实施例包括:包括网络设备30、深度包解析设备50和服务器40,所述深度包解析设备50与所述网络设备通信30具有通信连接;
所述网络设备30,用于接收业务访问请求,并将所述业务访问请求或所述业务访问请求的镜像包转发给所述深度包解析设备,所述业务访问请求中包含用户要访问的网址;
所述深度包解析设备50,用于将所述用户要访问的网址与内置的按层级存储的推荐网址进行匹配;当匹配到一致的推荐网址时,确定所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级,推荐网址的层级与在终端上展现的推荐信息的层级相对应;解析出发送所述业务访问请求的终端标识;如果所述用户要访问的网址的层级大于或等于第一阈值,所述深度包解析设备向所述网络设备发送解析出的终端标识、用户要访问的网址和所述用户要访问的网址的层级;
所述网络设备30,用于向服务器发送接收到的终端标识、用户要访问的网址和所述用户要访问的网址的层级;
所述服务器40,用于将层级大于或等于第一阈值的数据作为数据源,统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
本发明实施例提供的***可以降低数据分析量,提高分析数据的精准度。
综上所述,本发明实施例中,接收业务访问请求,所述业务访问请求中包含用户要访问的网址;将所述用户要访问的网址与内置的按层级存储的推荐网址进行匹配;当匹配到一致的推荐网址时,确定所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级,推荐网址的层级与在终端上展现的推荐信息的层级相对应;解析出发送所述业务访问请求的终端标识;如果所述用户要访问的网址的层级大于或等于第一阈值,向服务器发送解析出的终端标识、用户要访问的网址和所述用户要访问的网址的层级,使服务器统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。与现有技术中只要用户访问,后台服务器就分析相比,本发明实施例提供的数据分析方法,可以降低数据分析量,提高分析数据的精准度。
本发明实施例的基础是预先将内容(比如媒体/广告内容)进行分层展现,针对用户对推荐媒体内容层次越深内容信息的点击浏览统计,精度更高,而且通过分层展现,确定重点网址访问信息,降低无效的访问记录信息,以及通过内容分层,降低大量的统计入口数据。
本发明实施例中网络侧进行数据分析的执行主体可以是集成有深度包解析(DPI,Deep Packet inspect)功能的网络设备,如网关GPRS支持节点(GGSN,Gateway GPRS Support Node),也可以是与网络设备具有通信连接的深度包解析设备,具体可以是外挂在网络设备上的深度包解析设备,如将具有DPI解析功能的设备外挂在GGSN上,并与所述GGSN建立通信连接。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上对本发明实施例所提供的数据分析方法以、网络设备及服务器进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (12)

1.一种数据分析方法,其特征在于,包括:
接收业务访问请求,所述业务访问请求中包含用户要访问的网址;
将所述用户要访问的网址与内置的按层级存储的推荐网址进行匹配;
当匹配到一致的推荐网址时,确定所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级,推荐网址的层级与在终端上展现的推荐信息的层级相对应;
解析出发送所述业务访问请求的终端标识;
如果所述用户要访问的网址的层级大于或等于第一阈值,向服务器发送解析出的终端标识、用户要访问的网址和所述用户要访问的网址的层级,使服务器统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
2.根据权利要求1所述的数据分析方法,其特征在于,所述将所述用户要访问的网址与内置的按层级存储的推荐网址进行匹配,包括:
获取所述业务访问请求中的用户要访问的网址;
将所述用户要访问的网址与内置的推荐网址列表中的推荐网址进行匹配,所述推荐网址列表包括推荐网址与所述推荐网址的层级之间的映射关系。
3.根据权利要求2所述的数据分析方法,其特征在于,所述业务访问请求包含在多个数据包中;
所述获取业务访问请求中的用户要访问的网址包括:过滤掉重复的数据包,将剩余的数据包进行排序,组成一个完整的数据流;从所述完整的数据流中解析出用户要访问的网址。
4.一种数据分析方法,其特征在于,包括:
接收终端标识、用户要访问的网址和所述用户要访问的网址的层级;
将所述终端标识、用户要访问的网址和所述用户要访问的网址的层级关联存储;
将层级大于或等于第一阈值的数据作为数据源,统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
5.根据权利要求4所述的数据分析方法,其特征在于,所述统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量之后,还包括:
从终端标识归属地列表中查询出每个终端标识的归属地,并将所述用户要访问的网址、与所述用户要访问的网址对应的终端标识和所述终端标识的归属地关联存储;
统计与每个用户要访问的网址关联的每个归属地的终端标识的数量。
6.一种网络设备,其特征在于,包括:
第一接收单元,用于接收业务访问请求,所述业务访问请求中包含用户要访问的网址;
网址匹配单元,用于将所述第一接收单元接收到的业务访问请求中包含的用户要访问的网址与内置的按层级存储的推荐网址进行匹配;
层级确定单元,用于当所述网址匹配单元匹配到一致的推荐网址时,确定所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级,推荐网址的层级与在终端上展现的推荐信息的层级相对应;
解析单元,用于解析出发送所述第一接收单元接收到的业务访问请求的终端的标识;
发送单元,用于在所述用户要访问的网址的层级大于或等于第一阈值时,向服务器发送所述解析单元解析出的终端标识、用户要访问的网址和所述用户要访问的网址的层级,使服务器统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
7.根据权利要求6所述的网络设备,其特征在于,还包括:
获取单元,用于获取所述第一接收单元接收到的业务访问请求中的用户要访问的网址;
所述网址匹配单元,用于将所述获取单元获取到的用户要访问的网址与内置的推荐网址列表中的推荐网址进行匹配,所述推荐网址列表包括推荐网址与所述推荐网址的层级之间的映射关系。
8.根据权利要求7所述的网络设备,其特征在于,所述获取单元包括:
过滤模块,用于在所述业务访问请求包含在多个数据包中时,过滤掉重复的数据包;
排序模块,用于将所述过滤模块过滤后剩余的数据包进行排序,组成一个完整的数据流;
解析模块,用于将所述排序模块组成的完整的数据流中解析出用户要访问的网址。
9.一种服务器,其特征在于,包括:
第二接收单元,用于接收终端标识、用户要访问的网址和所述用户要访问的网址的层级;
存储单元,用于将所述第二接收单元接收到的终端标识、用户要访问的网址和所述用户要访问的网址的层级关联存储;
分析单元,用于将所述存储单元存储的层级大于或等于第一阈值的数据作为数据源,统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
10.根据权利要求9所述的服务器,其特征在于,还包括:
查询单元,用于从终端标识归属地列表中查询出每个终端标识的归属地;
所述存储单元,还用于将所述用户要访问的网址、与所述用户要访问的网址对应的终端标识和所述查询单元查询到的终端标识的归属地关联存储;
所述分析单元,还用于统计所述存储单元存储的与每个用户要访问的网址关联的每个归属地的终端标识的数量。
11.一种数据分析***,其特征在于,包括网络设备和服务器,所述网络设备为上述权利要求6~8任意一项所述的网络设备,所述服务器为上述权利要求9或10所述的服务器。
12.一种数据分析***,其特征在于,包括网络设备、深度包解析设备和服务器,所述深度包解析设备与所述网络设备具有通信连接;
所述网络设备接收业务访问请求,并将所述业务访问请求或所述业务访问请求的镜像包转发给所述深度包解析设备,所述业务访问请求中包含用户要访问的网址;
所述深度包解析设备将所述用户要访问的网址与内置的按层级存储的推荐网址进行匹配;当匹配到一致的推荐网址时,确定所述用户要访问的网址的层级为所述匹配上的推荐网址所关联的层级,推荐网址的层级与在终端上展现的推荐信息的层级相对应;解析出发送所述业务访问请求的终端标识;如果所述用户要访问的网址的层级大于或等于第一阈值,所述深度包解析设备向所述网络设备发送解析出的终端标识、用户要访问的网址和所述用户要访问的网址的层级;
所述网络设备向服务器发送接收到的终端标识、用户要访问的网址和所述用户要访问的网址的层级;
所述服务器将层级大于或等于第一阈值的数据作为数据源,统计大于或等于第一阈值层级中,与每个用户要访问的网址对应的终端标识的数量。
CN201210038235.0A 2012-02-20 2012-02-20 一种数据分析方法、装置及*** Active CN102611572B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210038235.0A CN102611572B (zh) 2012-02-20 2012-02-20 一种数据分析方法、装置及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210038235.0A CN102611572B (zh) 2012-02-20 2012-02-20 一种数据分析方法、装置及***

Publications (2)

Publication Number Publication Date
CN102611572A true CN102611572A (zh) 2012-07-25
CN102611572B CN102611572B (zh) 2014-12-24

Family

ID=46528744

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210038235.0A Active CN102611572B (zh) 2012-02-20 2012-02-20 一种数据分析方法、装置及***

Country Status (1)

Country Link
CN (1) CN102611572B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080201285A1 (en) * 2005-12-21 2008-08-21 Tencent Technology (Shenzhen) Company Ltd. Method and apparatus for delivering network information
CN101317177A (zh) * 2006-06-09 2008-12-03 华为技术有限公司 确定内容提供商优先级的***和方法
CN101360098A (zh) * 2008-08-29 2009-02-04 腾讯科技(北京)有限公司 用户行为属性确定方法、装置、***及广告投放方法与***
CN101399818A (zh) * 2007-09-25 2009-04-01 日电(中国)有限公司 基于导航路径信息的主题相关网页过滤方法和***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080201285A1 (en) * 2005-12-21 2008-08-21 Tencent Technology (Shenzhen) Company Ltd. Method and apparatus for delivering network information
CN101317177A (zh) * 2006-06-09 2008-12-03 华为技术有限公司 确定内容提供商优先级的***和方法
CN101399818A (zh) * 2007-09-25 2009-04-01 日电(中国)有限公司 基于导航路径信息的主题相关网页过滤方法和***
CN101360098A (zh) * 2008-08-29 2009-02-04 腾讯科技(北京)有限公司 用户行为属性确定方法、装置、***及广告投放方法与***

Also Published As

Publication number Publication date
CN102611572B (zh) 2014-12-24

Similar Documents

Publication Publication Date Title
CN101511055B (zh) 广告的投放方法及装置
CN103402177B (zh) 一种WiFi终端信息推送***及其实现方法
CN101513015B (zh) 定向电子内容传送控制***和方法
CN102301658B (zh) 广告投放方法、广告服务器和广告***
US20100313009A1 (en) System and method to enable tracking of consumer behavior and activity
US8843463B2 (en) Providing content by using a social network
US20120078708A1 (en) System and Method for Recording and Analyzing Internet Browser Traffic Independent of Individual or Specific Digital Platforms or Websites
US20090144159A1 (en) Advertisement Insertion Module and Advertisement Replacement Module
US20130066814A1 (en) System and Method for Automated Classification of Web pages and Domains
CA2832722A1 (en) Data mining method for social network of terminal user and related methods, apparatuses and systems
US20130311283A1 (en) Data mining method for social network of terminal user and related methods, apparatuses and systems
CN102314455A (zh) 计算网页点击流量的方法及***
CN103139137B (zh) 网络服务提供方法及装置
CN111131493B (zh) 一种数据获取、用户画像生成方法、装置
CN102111453A (zh) 一种提取互联网用户网络行为的方法和***
KR20220144531A (ko) Sns 광고를 통해 피드백을 분석하는 인공지능 분석 시스템
CN104717079A (zh) 网络流量的数据处理方法及装置
CN104639593A (zh) 信息分享方法、***、浏览器及服务器
CN101808002A (zh) 基于报文分析的广告发布方法及其***
CN103024767A (zh) 移动通信业务端到端性能评估方法及***
CN104363261A (zh) 信息推送方法、装置及服务器
KR20020092540A (ko) 메신저를 이용한 맞춤정보 제공 방법 및 시스템
CN103716804A (zh) 无线数据通信网的用户网络行为分析方法、装置及***
CN105491136A (zh) 消息发送方法和装置
CN102611572B (zh) 一种数据分析方法、装置及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant