CN103763125A - 运营商网络实际用户数的统计方法和装置 - Google Patents

运营商网络实际用户数的统计方法和装置 Download PDF

Info

Publication number
CN103763125A
CN103763125A CN201310741124.0A CN201310741124A CN103763125A CN 103763125 A CN103763125 A CN 103763125A CN 201310741124 A CN201310741124 A CN 201310741124A CN 103763125 A CN103763125 A CN 103763125A
Authority
CN
China
Prior art keywords
url
user agent
terminal
database
access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310741124.0A
Other languages
English (en)
Inventor
崔晶晶
林佳婕
李春华
杨斌
刘立娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING GEO POLYMERIZATION TECHNOLOGY Co Ltd
Original Assignee
BEIJING GEO POLYMERIZATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING GEO POLYMERIZATION TECHNOLOGY Co Ltd filed Critical BEIJING GEO POLYMERIZATION TECHNOLOGY Co Ltd
Priority to CN201310741124.0A priority Critical patent/CN103763125A/zh
Publication of CN103763125A publication Critical patent/CN103763125A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及互联网技术领域,公开了一种运营商网络实际用户数的统计方法和装置,使用User Agent字段中的信息并结合客户端所访问的URL来判断终端的数量,继承了User Agent方法容易实现的优点,并解决只用User Agent时误判软件为浏览器的问题。所述方法包括:多个终端用单个账号/共享接入互联网,采集一个账号或一个IP地址下每个http的上行访问数据包,提取user agent字段和URL;当某个user agent访问了指定的url时,认为该user agent代表了一个终端;获取所有不重复的user agent数量为该帐号或IP地址下终端的数量。

Description

运营商网络实际用户数的统计方法和装置
技术领域
本发明涉及互联网技术领域,具体而言,涉及一种网络共享接入检测方法和装置
背景技术
目前,单个宽带帐号常常由多人/多终端共享接入互联网,对运营商统计实际用户数并开展其他业务造成不便。由于ip协议本身设计目标等原因,无法直接给出同一帐号下局域网内共享有多少台计算机。业界普遍使用的检测方法有如下几种:
a)二层方法:MAC地址方法,在客户端根据不同mac地址区分不同终端。
b)三层方法:IPID/时间戳方法,IP报文中有递增的IPID标识或者时间戳,此方法根据递增序列还原出局域网内有几台终端。
c)应用层特定软件方法:如p2p软件方法,此方法根据一些软件通信协议中含有的特殊终端相关信息,判断局域网内有几台终端。
d)Http协议方法:CookieId方法,此方法通过重定向用户访问,在用户浏览器中设置cookie id标识,以此标识不同终端。
e)Http协议方法:User Agent方法,根据不同浏览器有不同的User Agent字段的特征,区分不同的终端,如专利申请CN201210406055中所记载的。
然而上述现有技术都有其缺陷,具体的:
a)二层方法:只能在客户端实现,对于NAT/Proxy上网无效,在主机多网卡时会误判。
b)三层方法:只能统计同时上网终端数,无法统计帐号下所有活动和非活动终端数。
c)应用层特定软件方法:受软件普及率影响,尤其当前移动终端与pc软件差别较大,无法找到最佳的软件,软件升级变更时此方法也有可能失效。
d)Http协议方法Cookie:目前隐私保护越来越受到重视,一些浏览器已默认不支持cookie,或者当用户浏览器禁用cookie时,此方法都会无效。
e)Http协议方法User Agent:当前很多软件会模拟浏览器User Agent发送http报文,只使用User Agent进行判断,会误认为这些软件也是一个独立的终端。
发明内容
针对现有技术的上述缺陷,一方面,本发明提供了一种运营商网络实际用户数的统计方法,包括:
多个终端用单个账号/共享接入互联网,采集一个账号或一个IP地址下每个http的上行访问数据包,提取user agent字段和URL;
当某个user agent访问了指定的url时,认为该user agent代表了一个终端;
获取所有不重复的user agent数量为该帐号或IP地址下终端的数量。
优选的,上述采集是在VPN服务器处或NAT路由器的上行端口处设置抓取工具来抓取各个终端的http上行访问数据包。
优选的,指定的url可以是预先统计好存储于数据库中的url,所述url是模拟软件不访问或极少访问的url。
优选的,维护一个指定url的数据库,其中的url为多数用户访问的主流url,如果发现有模拟软件访问其中的url,则将该url从数据库中删除,始终保持数据库中的url没有或极少有模拟软件访问。
优选的,通过user agent字符串的6个不同部分来区分不同的user agent的数量。
另一方面,本发明还同时提供了一种运营商网络实际用户数的统计装置,包括:
采集提取模块,多个终端用单个账号/共享接入互联网,采集一个账号或一个IP地址下每个http的上行访问数据包,提取user agent字段和URL;
判定模块,当某个user agent访问了指定的url时,认为该user agent代表了一个终端;
统计模块,获取所有不重复的user agent数量为该帐号或IP地址下终端的数量。
优选的,上述采集是在VPN服务器处或NAT路由器的上行端口处设置抓取工具来抓取各个终端的http上行访问数据包。
优选的,指定的url可以是预先统计好存储于数据库中的url,所述url是模拟软件不访问或极少访问的url。
优选的,维护一个指定url的数据库,其中的url为多数用户访问的主流url,如果发现有模拟软件访问其中的url,则将该url从数据库中删除,始终保持数据库中的url没有或极少有模拟软件访问。
优选的,通过user agent字符串的6个不同部分来区分不同的user agent的数量。
附图说明
图1是本发明实施例中一种运营商网络实际用户数的统计方法的流程图。
图2是本发明实施例中一种运营商网络实际用户数的统计装置的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例为实施本发明的较佳实施方式,所述描述是以说明本发明的一般原则为目的,并非用以限定本发明的范围。本发明的保护范围应当以权利要求所界定者为准,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,示出了本发明实施例中一种运营商网络实际用户数的统计方法。
多个终端用单个账号/共享接入互联网,采集一个账号或一个IP地址下每个http的上行访问数据包,提取user agent字段和URL。多个终端通常可以通过共享账号如VPN或共享IP如NAT接入互联网,在VPN服务器处或NAT路由器的上行端口处设置抓取工具来抓取各个终端的http上行访问数据包,http数据包中包括了头域,头域中包含user agent字段,User-Agent也简称UA。它是一个特殊字符串头,包括数字和字母,是一种向访问网站提供所使用的浏览器类型及版本、操作***及版本、浏览器内核等信息的标识。
当某个user agent访问了指定的url时,认为该user agent代表了一个终端。指定的url可以是预先统计好存储于数据库/文件/内存中的url,所述url是模拟软件不访问或极少访问的url。可以维护一个指定url的数据库/文件/内存,其中的url为多数用户访问的主流url,如果发现有模拟软件访问其中的url,则将该url从数据库中删除,始终保持数据库中的url没有或极少有模拟软件访问,这样可以最大限度的排除模拟软件发送http报文而被识别为终端的情况。
获取所有不重复的user agent数量为该帐号或IP地址下终端的数量。各种不同的网络浏览器(Internet Explorer,Firefox,Opera,遨游、搜狗)会用不同的用户代理字符串(user agent strings)来作为自身的标志。通过逐对对比用户代理字符串可以区分出所有不重复的user agent,通过user agent的数量来确定终端的数量。
参照图2,示出了本发明实施例中一种运营商网络实际用户数的统计装置。
采集提取模块,多个终端用单个账号/共享接入互联网,采集一个账号或一个IP地址下每个http的上行访问数据包,提取user agent字段和URL。
判定模块,当某个user agent访问了指定的url时,认为该user agent代表了一个终端。
统计模块,获取所有不重复的user agent数量为该帐号或IP地址下终端的数量。
利用本发明的技术解决方案,使用User Agent字段中的信息并结合客户端所访问的URL来判断终端的数量,继承了User Agent方法容易实现的优点,并解决只用User Agent时误判软件为浏览器的问题。
以上实施例的说明只是用于帮助理解发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式以及应用范围上均会有改变之处,综上所述,本说明书的内容不应理解为对本发明的限制。

Claims (10)

1.一种运营商网络实际用户数的统计方法,包括:
多个终端用单个账号/共享接入互联网,采集一个账号或一个IP地址下每个http的上行访问数据包,提取user agent字段和URL;
当某个user agent访问了指定的url时,认为该user agent代表了一个终端;
获取所有不重复的user agent数量为该帐号或IP地址下终端的数量。
2.根据权利要求1中所述的方法,其特征在于,包括:
上述采集是在VPN服务器处或NAT路由器的上行端口处设置抓取工具来抓取各个终端的http上行访问数据包。
3.根据权利要求1中所述的方法,其特征在于,包括:
指定的url可以是预先统计好存储于数据库/文件/内存中的url,所述url是模拟软件不访问或极少访问的url。
4.根据权利要求1中所述的方法,其特征在于,包括:
维护一个指定url的数据库/文件/内存,其中的url为多数用户访问的主流url,如果发现有模拟软件访问其中的url,则将该url从数据库中删除,始终保持数据库中的url没有或极少有模拟软件访问。
5.根据权利要求1中所述的方法,其特征在于,包括:
通过逐对对比用户代理字符串区分出所有不重复的user agent,通过useragent的数量来确定终端的数量。
6.一种运营商网络实际用户数的统计装置,包括:
采集提取模块,多个终端用单个账号/共享接入互联网,采集一个账号或一个IP地址下每个http的上行访问数据包,提取user agent字段和URL;
判定模块,当某个user agent访问了指定的url时,认为该user agent代表了一个终端;
统计模块,获取所有不重复的user agent数量为该帐号或IP地址下终端的数量。
7.根据权利要求6中所述的装置,其特征在于,包括:
上述采集是在VPN服务器处或NAT路由器的上行端口处设置抓取工具来抓取各个终端的http上行访问数据包。
8.根据权利要求6中所述的装置,其特征在于,包括:
指定的url可以是预先统计好存储于数据库/文件/内存中的url,所述url是模拟软件不访问或极少访问的url。
9.根据权利要求6中所述的装置,其特征在于,包括:
维护一个指定url的数据库/文件/内存,其中的url为多数用户访问的主流url,如果发现有模拟软件访问其中的url,则将该url从数据库中删除,始终保持数据库中的url没有或极少有模拟软件访问。
10.根据权利要求6中所述的装置,其特征在于,包括:
通过逐对对比用户代理字符串区分出所有不重复的user agent,通过useragent的数量来确定终端的数量。
CN201310741124.0A 2013-12-27 2013-12-27 运营商网络实际用户数的统计方法和装置 Pending CN103763125A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310741124.0A CN103763125A (zh) 2013-12-27 2013-12-27 运营商网络实际用户数的统计方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310741124.0A CN103763125A (zh) 2013-12-27 2013-12-27 运营商网络实际用户数的统计方法和装置

Publications (1)

Publication Number Publication Date
CN103763125A true CN103763125A (zh) 2014-04-30

Family

ID=50530288

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310741124.0A Pending CN103763125A (zh) 2013-12-27 2013-12-27 运营商网络实际用户数的统计方法和装置

Country Status (1)

Country Link
CN (1) CN103763125A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104602222A (zh) * 2014-12-24 2015-05-06 联想(北京)有限公司 一种信息处理方法和电子设备
CN105007184A (zh) * 2015-07-22 2015-10-28 胡东雁 用户行为习惯的获取方法
CN105740396A (zh) * 2016-01-27 2016-07-06 广州酷狗计算机科技有限公司 Http数据处理方法及装置
CN106664223A (zh) * 2015-06-18 2017-05-10 华为技术有限公司 一种共享接入主机数目检测方法及检测装置
CN107704494A (zh) * 2017-08-24 2018-02-16 上海斐讯数据通信技术有限公司 一种基于应用软件的用户信息收集方法和***
CN108235303A (zh) * 2017-12-29 2018-06-29 ***通信集团江苏有限公司 识别共享流量用户的方法、装置、设备及介质
CN111970175A (zh) * 2020-08-26 2020-11-20 武汉绿色网络信息服务有限责任公司 一种入网账户恶意共享检测的方法和装置
CN113037588A (zh) * 2021-02-26 2021-06-25 恒安嘉新(北京)科技股份公司 终端数量确定方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101035031A (zh) * 2007-04-03 2007-09-12 华为技术有限公司 检测共享接入的主机数目的方法和装置
CN101335766A (zh) * 2007-06-27 2008-12-31 富士胶片株式会社 通信***、代理服务器、控制代理服务器的方法及其控制程序
CN101631052A (zh) * 2009-08-25 2010-01-20 杭州华三通信技术有限公司 一种检测接入终端数量的方法及装置
WO2010041784A1 (en) * 2008-10-10 2010-04-15 Plustech Inc. A method for allowing and blocking a user pc which can use internet at the same time in a private network thereof a method for analyzing and detecting a judgement about whether nat(network address translation) can be used or not using a traffic data, and the number of terminals sharing nat
CN102882748A (zh) * 2012-10-23 2013-01-16 深圳中兴网信科技有限公司 网络接入检测***和网络接入检测方法
US20130254394A1 (en) * 2010-12-07 2013-09-26 Plustech Inc. Shared terminal identification system using a network packet and processing method thereof

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101035031A (zh) * 2007-04-03 2007-09-12 华为技术有限公司 检测共享接入的主机数目的方法和装置
CN101335766A (zh) * 2007-06-27 2008-12-31 富士胶片株式会社 通信***、代理服务器、控制代理服务器的方法及其控制程序
WO2010041784A1 (en) * 2008-10-10 2010-04-15 Plustech Inc. A method for allowing and blocking a user pc which can use internet at the same time in a private network thereof a method for analyzing and detecting a judgement about whether nat(network address translation) can be used or not using a traffic data, and the number of terminals sharing nat
CN101631052A (zh) * 2009-08-25 2010-01-20 杭州华三通信技术有限公司 一种检测接入终端数量的方法及装置
US20130254394A1 (en) * 2010-12-07 2013-09-26 Plustech Inc. Shared terminal identification system using a network packet and processing method thereof
CN102882748A (zh) * 2012-10-23 2013-01-16 深圳中兴网信科技有限公司 网络接入检测***和网络接入检测方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104602222A (zh) * 2014-12-24 2015-05-06 联想(北京)有限公司 一种信息处理方法和电子设备
CN104602222B (zh) * 2014-12-24 2019-04-26 联想(北京)有限公司 一种信息处理方法和电子设备
CN106664223A (zh) * 2015-06-18 2017-05-10 华为技术有限公司 一种共享接入主机数目检测方法及检测装置
CN105007184A (zh) * 2015-07-22 2015-10-28 胡东雁 用户行为习惯的获取方法
CN105740396A (zh) * 2016-01-27 2016-07-06 广州酷狗计算机科技有限公司 Http数据处理方法及装置
CN105740396B (zh) * 2016-01-27 2019-12-10 广州酷狗计算机科技有限公司 Http数据处理方法及装置
CN107704494A (zh) * 2017-08-24 2018-02-16 上海斐讯数据通信技术有限公司 一种基于应用软件的用户信息收集方法和***
CN107704494B (zh) * 2017-08-24 2021-09-14 深圳市来玩科技有限公司 一种基于应用软件的用户信息收集方法和***
CN108235303A (zh) * 2017-12-29 2018-06-29 ***通信集团江苏有限公司 识别共享流量用户的方法、装置、设备及介质
CN108235303B (zh) * 2017-12-29 2020-12-15 ***通信集团江苏有限公司 识别共享流量用户的方法、装置、设备及介质
CN111970175A (zh) * 2020-08-26 2020-11-20 武汉绿色网络信息服务有限责任公司 一种入网账户恶意共享检测的方法和装置
CN113037588A (zh) * 2021-02-26 2021-06-25 恒安嘉新(北京)科技股份公司 终端数量确定方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN103763125A (zh) 运营商网络实际用户数的统计方法和装置
US9185093B2 (en) System and method for correlating network information with subscriber information in a mobile network environment
EP3496338B1 (en) Method for identifying application information in network traffic, and apparatus
CN109756501B (zh) 一种基于http协议的高隐匿网络代理方法及***
US20170134957A1 (en) System and method for correlating network information with subscriber information in a mobile network environment
CN100493094C (zh) 基于特征码的p2p数据报文检测方法
CN103297270A (zh) 应用类型识别方法及网络设备
CN102594796B (zh) 一种终端设备及用户信息同步方法
US20150215357A1 (en) Video playing method and apparatus
CN105635073B (zh) 访问控制方法、装置和网络接入设备
CN109391704B (zh) 一种视频监控设备跨私网访问方法及装置
WO2015021873A1 (en) Method, platform server, and system of data pushing
CN104702564A (zh) 一种网络共享用户识别方法及装置
CN102739684A (zh) 一种基于虚拟IP地址的Portal认证方法及服务器
CN103067389B (zh) 基于短网址的高安全性文件传输方法
CN106789486A (zh) 共享接入的检测方法及装置
EP3096492B1 (en) Page push method and system
CN104660597A (zh) 三层认证方法、装置及三层认证交换机
CN101599857A (zh) 检测共享接入主机数目的方法、装置及网络检测***
CN104202432B (zh) 一种远程web管理***及管理方法
CN104753998A (zh) 终端、社交应用服务器和信息分享方法
CN105959248B (zh) 报文访问控制的方法及装置
CN109474572B (zh) 基于集群僵尸网络监控捕获放马站点的方法及***
CN103260178B (zh) 一种消费类无线接入点产品自动检测升级的方法
CN112073258B (zh) 一种识别用户的方法及电子设备、存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB03 Change of inventor or designer information

Inventor after: Cui Jingjing

Inventor after: Lin Jiajie

Inventor after: Li Chunhua

Inventor after: Yang Bin

Inventor before: Cui Jingjing

Inventor before: Lin Jiajie

Inventor before: Li Chunhua

Inventor before: Yang Bin

Inventor before: Liu Lina

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: CUI JINGJING LIN JIAJIE LI CHUNHUA YANG BIN LIU LINA TO: CUI JINGJING LIN JIAJIE LI CHUNHUA YANG BIN

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140430