CN111371619A - 一种即时通信网络用户数的估计方法和*** - Google Patents
一种即时通信网络用户数的估计方法和*** Download PDFInfo
- Publication number
- CN111371619A CN111371619A CN202010161714.6A CN202010161714A CN111371619A CN 111371619 A CN111371619 A CN 111371619A CN 202010161714 A CN202010161714 A CN 202010161714A CN 111371619 A CN111371619 A CN 111371619A
- Authority
- CN
- China
- Prior art keywords
- user
- random walk
- network
- users
- friend
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
技术领域
本发明涉及一种通信网络节点估计技术领域,具体涉及一种即时通信网络用户数的估计方法和***。
背景技术
即时通讯(Instant Messaging,简称IM)是一个实时通信***,允许两人或多人使用网络实时的传递文字消息、文件、语音与视频交流。即时通讯提供了越来越丰富的通讯服务功能,即时通讯平台包含QQ、微信、MSN、Skype、Messenger等平台,同一平台上的所有用户构成一个即时通信网络。随着Internet技术的发展,即时通信网络的规模发展很快,很多平台用户已经以数亿计。尽管不计其数的网站和其他报告经常提供这样多种不同来源的数字,这些数字通常是基于平台本身的报告或流量分析,不能保证准确。
对于大规模网络节点数的估计,第一种方法是从网络中随机抽取用户,然后用标记和重新捕获的方法来估计网络的节点数,这种方法要求用户必须进行简单随机抽样,也就是必须保证每次抽样时,每个节点被选中的概率是相同的。而这对于即时通信网络是做不到的,尤其是对当用户根本就没有网络的控制权时,在用户不知道网络中有哪些用户的情况下,不可能做到以相同的概率选取网络中的每一用户。
第二种方法是通过采用极大似然估计法估计网络节点总数,该方法的计算效率较低,而且需要能够等概率地访问到每一个节点。
第三种方法是类似利用随机抽取得到节点的编号的规律来估计节点总数,则要求节点按照一定的规律进行编号,这在日常生活中,对于不受自己控制的网络,节点编号未必能够获取,而且有些节点还未必一定有编号,再有该方法的一个前提也是假定任意编号节点在被俘获的概率是相等的。
以上几个方法都要求用户能够随机的抽取网络的任意节点,这对于目前多数即时通信网络是做不到的,因为任一用户往往只有部分朋友节点可以进行通信,用户只能接触到少数几个节点,不可能随时随机访问到网络的任意节点。
发明内容
为了克服现有技术存在的缺陷与不足,本发明提供一种即时通信网络用户数的估计方法和***,本发明在没有即时通信网络控制权的前提下,仅利用用户所处网络节点附近的局部信息,实现对即时通信网络用户数的估计。
为了达到上述目的,本发明采用以下技术方案:
本发明提供一种即时通信网络用户数的估计方法,包括下述步骤:
在即时通信网络中任选一个用户v0,作为随机游走的入口,同时任意选取用户v0的一个好友用户v1,作为返回观测点;
初始化模拟变量值;
进行K轮随机游走,每轮随机游走均从用户v0出发,到首次从好友用户v1沿v1到用户v0的边返回用户v0结束,每轮随机游走记录数据;
作为优选的技术方案,所述初始化模拟变量值,所述模拟变量值包括已进行模拟次数T、模拟相对误差要求Rel和模拟轮数K。
作为优选的技术方案,所述每轮随机游走记录数据,所述数据表示为:(Setps,NR),其中,Steps表示首次从好友用户v1沿v1到用户v0的边返回v0所需的步数,NR表示随机游走过程中好友用户v1总共返回v0的次数。
作为优选的技术方案,所述进行K轮随机游走,每一轮随机游走的具体步骤为:
S1:令u=v0作为当前用户,初始化计数器,包括返回次数计数器NR=0,步数计数器Steps=0,用户u生成包含游走当前位置u、返回次数NR及游走步数Steps三个量的令牌Token;
S2:获取当前用户u的好友数du以及当前用户u所有好友的好友数dv,计算自用户u到用户v的转移概率P(u,v),具体计算公式为:
其中,u~v表示u、v相邻;
随机选取用户u的任一好友用户v,作为下一步到达位置节点,同时步数计数器增加1,即Steps=Steps+1,更新令牌Token中步数计数器Steps的值,更新后的令牌Token发给好友用户v,或者由网络爬虫携带更新后的令牌Token来到用户v;
好友用户v收到令牌Token或者网络爬虫来到好友用户v后,依据用户节点信息进行判断,并执行相应的操作,具体为:
若好友用户v≠v0,则令u=v,更新令牌Token中对应u值,然后返回继续进行步骤S2;
若好友用户v=v0且令牌中u≠v1,则令返回次数计数器NR=NR+1,u=v,更新令牌Token中返回次数计数器NR及u值,然后返回继续进行步骤S2;
若好友用户v=v0且令牌中u=v1,则令NR=NR+1,更新令牌Token中NR值,本次模拟结束,记录令牌Token中Steps及NR中的值,得到向量(Setps,NR);
循环进行K轮随机游走,用户v0收集到k组数据(Setpsi,NRi),其中Stepsi表示第i轮总共所需的步数,NRi是第i轮中总共返回v0的次数。
计算
以及
得到网络节点总数n的两个不同估计值:
和
作为优选的技术方案,所述判断两个不同估计值的相对偏差是否达到预设值,具体判断步骤为:
本发明还提供一种即时通信网络用户数的估计***,包括:即时通信网络用户选取模块、模拟变量值初始化模块、随机游走模块、估计值计算模块和网络用户总数估计输出模块;
所述即时通信网络用户选取模块用于选取用户v0作为随机游走的入口,以及选取用户v0的一个好友用户v1作为返回观测点;
所述模拟变量值初始化模块用于初始化模拟变量值;
所述随机游走模块用于进行K轮随机游走,每轮随机游走均从用户v0出发,到首次从好友用户v1沿v1到用户v0的边返回用户v0结束,每轮随机游走记录数据;
本发明与现有技术相比,具有如下优点和有益效果:
(1)本发明只需要获取邻居节点的节点度信息,当随机游走到达某一用户对应节点时,仅需知道该用户的好友数以及其每一个好友的好友数,该用户自己的好友数容易获悉,其好友的好友数也可通过与好友简单通信来获取,不需要全网的控制权,仅需利用少量的网络接口即可实现对即时通信网络用户数的估计。
(2)本发明利用设定的相对误差的大小,可以动态控制估计的精度。
附图说明
图1为本实施例即时通信网络用户数的估计方法的流程示意图;
图2为本实施例每一轮随机游走的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
如图1所示,在本实施例中,提供一种即时通信网络用户数的估计方法,将即时通信抽象为一个无向图,每一用户抽象为一个网络节点,若两用户已加为好友,则该两节点间有一条边,基于多数即时通信平台好友都是双向的,由此同一平台上的所有用户网络就抽象为一个无向图,而对网络的用户总数的估计就转化为无向图的节点数的估计;
利用带权图(网络)上随机游走的来估计网络节点总数的方法,在该方法中,对网络的任意一条边,若其端点为u、v,对应该边的权值为其中,du为节点u的度(与该节点相连的边总数,也就是对应用户的好友数)。在该图上执行随机游走的时,自任一节点u出发,下一步到达节点v的概率(常称为转移概率)为:
在任意连通的带权图中,对任一选定的节点v0,自v0出发首次返回v0平均所需的步数为:
根据公式(2)和(3),可以得到节点总数n的两个估计
和
在本实施例中,即时通信网络用户数的估计方法具体步骤为:
步骤1:初始准备:
1.1从即时通信网络中任选一个用户(也就是网络的一个节点,记为v0),要求该用户的好友数大于等于2,也就是对应节点的节点度d0≥2,并以该用户作为随机游走的入口。同时任意选取用户v0的一个好友(也就是节点v0的任意一个邻居节点,记为v1),作为返回观测点;
1.2初始化模拟变量值:
已进行模拟次数:T=0;
模拟相对误差要求Rel=0.5(该值可根据需要调整);
每次的模拟轮数k=10(该值可根据需要调整)。
步骤2:执行k轮随机游走,每轮随机游走都是自用户v0出发,到首次从用户节点v1沿v1到v0这条边返回v0结束。每轮记录两个数据(Setps,NR),其中Steps是自v0出发后,到本轮模拟结束(也即是首次从节点v1沿v1到v0这条边返回v0)总共所需的步数,NR是这个过程中总共返回v0的次数(此前可能已不经v1返回v0多次)。
如图2所示,每一轮随机游走的具体步骤如下所述,将随机游走执行k轮,得到k组数据。
2.1令u=v0作为当前用户,初始化计数器NR=0,Steps=0,具体实现是可以由用户u生成一个包含文本“u=v0,NR=0,Steps=0”的令牌Token;
2.2获取当前用户u的好友数(也就是节点u的度du)以及它的所有好友的好友数(也就是u的所有邻居节点v的节点度信息dv),并按照公式(1)计算自u到v的转移概率P(u,v);
2.3按照概率P(u,v),随机选取u的任一邻居节点v,作为下一步到达位置节点,同时步数计数器增加1,即Steps=Steps+1,更新令牌Token中文本Steps的值,并且将该包含更新后文本的Token发给用户v,或者由网络爬虫携带更新后的令牌Token来到用户v;
2.4用户v收到令牌Token(或者网络爬虫来到用户v)后,按照如下策略执行相应操作:
1)若v≠v0,则令u=v,更新令牌Token中对应u值,然后转2.2继续执行;
2)若v=v0且令牌中u≠v1,则令NR=NR+1,u=v,更新令牌Token中NR及u值,然后转2.2继续执行;
3)若v=v0且令牌中u=v1,则令NR=NR+1,更新令牌Token中NR值,本次模拟结束。记录令牌Token中Steps及NR中的值,得到向量(Setps,NR)。
2.5重复2.1-2.4的过程,总共k轮。经过k轮游走后,用户v0处将收集到k组数据(Setpsi,NRi),(i=T+1,T+2,…,T+k)。其中Stepsi是第i轮总共所需的步数,NRi是第i轮中总共返回v0的次数(此前可能已不经v1返回v0多次)。
步骤3:计算网络用户(节点)总数估计值。
3.2计算
以及
3.3将(6)和(7)的结果代入公式(4)和(5),本实施例得到网络节点总数n的两个不同估计值:
和
步骤4:判定两个估计的相对偏差是否达到预期要求,由此决定模拟是否可以结束。计算若|flag|>Rel,则转步骤2,继续模拟过程;若|flag|≤Rel,模拟结束。以(或)作为网络用户(节点)总数n的估计。
当使用发送令牌Token的方式来实现随机游走时,需要全体用户都能理解并按照预定的规则生成当前位置到任意相邻位置的转移概率、选择下一节点、更新和转发令牌,以此来实现随机游走策略的模拟;若使用网络爬虫来传递令牌时,网络爬虫就是一个随机游走代理,由它按照预定的规则生成随机游走转移概率、实现随机游走策略以及更新令牌Token的值。
本实施例还提供一种即时通信网络用户数的估计***,包括:即时通信网络用户选取模块、模拟变量值初始化模块、随机游走模块、估计值计算模块和网络用户总数估计输出模块;
在本实施例中,即时通信网络用户选取模块用于选取用户v0作为随机游走的入口,以及选取用户v0的一个好友用户v1作为返回观测点;模拟变量值初始化模块用于初始化模拟变量值;随机游走模块用于进行K轮随机游走,每轮随机游走均从用户v0出发,到首次从好友用户v1沿v1到用户v0的边返回用户v0结束,每轮随机游走记录数据;估计值计算模块用于计算网络用户总数的两个不同估计值和网络用户总数估计输出模块用于在判定两个不同估计值的相对偏差达到预设值时,结束随机游走后将估计值和作为网络用户总数的估计。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (7)
2.根据权利要求1所述的即时通信网络用户数的估计方法,其特征在于,所述初始化模拟变量值,所述模拟变量值包括已进行模拟次数T、模拟相对误差要求Rel和模拟轮数K。
3.根据权利要求1所述的即时通信网络用户数的估计方法,其特征在于,所述每轮随机游走记录数据,所述数据表示为:(Setps,NR),其中,Steps表示首次从好友用户v1沿v1到用户v0的边返回v0所需的步数,NR表示随机游走过程中好友用户v1总共返回v0的次数。
4.根据权利要求1所述的即时通信网络用户数的估计方法,其特征在于,所述进行K轮随机游走,每一轮随机游走的具体步骤为:
S1:令u=v0作为当前用户,初始化计数器,包括返回次数计数器NR=0,步数计数器Steps=0,用户u生成包含游走当前位置u、返回次数NR及游走步数Steps三个量的令牌Token;
S2:获取当前用户u的好友数du以及当前用户u所有好友的好友数dv,计算自用户u到用户v的转移概率P(u,v),具体计算公式为:
其中,u~v表示u、v相邻;
随机选取用户u的任一好友用户v,作为下一步到达位置节点,同时步数计数器增加1,即Steps=Steps+1,更新令牌Token中步数计数器Steps的值,更新后的令牌Token发给好友用户v,或者由网络爬虫携带更新后的令牌Token来到用户v;
好友用户v收到令牌Token或者网络爬虫来到好友用户v后,依据用户节点信息进行判断,并执行相应的操作,具体为:
若好友用户v≠v0,则令u=v,更新令牌Token中对应u值,然后返回继续进行步骤S2;
若好友用户v=v0且令牌中u≠v1,则令返回次数计数器NR=NR+1,u=v,更新令牌Token中返回次数计数器NR及u值,然后返回继续进行步骤S2;
若好友用户v=v0且令牌中u=v1,则令NR=NR+1,更新令牌Token中NR值,本次模拟结束,记录令牌Token中Steps及NR中的值,得到向量(Setps,NR);
循环进行K轮随机游走,用户v0收集到k组数据(Setpsi,NRi),其中Stepsi表示第i轮总共所需的步数,NRi是第i轮中总共返回v0的次数。
7.一种即时通信网络用户数的估计***,其特征在于,包括:即时通信网络用户选取模块、模拟变量值初始化模块、随机游走模块、估计值计算模块和网络用户总数估计输出模块;
所述即时通信网络用户选取模块用于选取用户v0作为随机游走的入口,以及选取用户v0的一个好友用户v1作为返回观测点;
所述模拟变量值初始化模块用于初始化模拟变量值;
所述随机游走模块用于进行K轮随机游走,每轮随机游走均从用户v0出发,到首次从好友用户v1沿v1到用户v0的边返回用户v0结束,每轮随机游走记录数据;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010161714.6A CN111371619B (zh) | 2020-03-10 | 2020-03-10 | 一种即时通信网络用户数的估计方法和*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010161714.6A CN111371619B (zh) | 2020-03-10 | 2020-03-10 | 一种即时通信网络用户数的估计方法和*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111371619A true CN111371619A (zh) | 2020-07-03 |
CN111371619B CN111371619B (zh) | 2022-06-10 |
Family
ID=71210477
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010161714.6A Active CN111371619B (zh) | 2020-03-10 | 2020-03-10 | 一种即时通信网络用户数的估计方法和*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111371619B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6549896B1 (en) * | 2000-04-07 | 2003-04-15 | Nec Usa, Inc. | System and method employing random walks for mining web page associations and usage to optimize user-oriented web page refresh and pre-fetch scheduling |
CN103399919A (zh) * | 2013-08-02 | 2013-11-20 | 浙江大学 | 基于社会关系网的信任增强服务推送方法 |
CN109657160A (zh) * | 2018-12-29 | 2019-04-19 | 中国人民解放军国防科技大学 | 基于随机游走访问频数的入度信息估计方法及*** |
CN109933666A (zh) * | 2019-03-18 | 2019-06-25 | 西安电子科技大学 | 一种好友自动分类方法、装置、计算机设备和存储介质 |
-
2020
- 2020-03-10 CN CN202010161714.6A patent/CN111371619B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6549896B1 (en) * | 2000-04-07 | 2003-04-15 | Nec Usa, Inc. | System and method employing random walks for mining web page associations and usage to optimize user-oriented web page refresh and pre-fetch scheduling |
CN103399919A (zh) * | 2013-08-02 | 2013-11-20 | 浙江大学 | 基于社会关系网的信任增强服务推送方法 |
CN109657160A (zh) * | 2018-12-29 | 2019-04-19 | 中国人民解放军国防科技大学 | 基于随机游走访问频数的入度信息估计方法及*** |
CN109933666A (zh) * | 2019-03-18 | 2019-06-25 | 西安电子科技大学 | 一种好友自动分类方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
吴春琼等: "基于随机游走的大规模图中节点对采样算法", 《计算机应用研究》, no. 04, 29 October 2014 (2014-10-29) * |
Also Published As
Publication number | Publication date |
---|---|
CN111371619B (zh) | 2022-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108985309B (zh) | 一种数据处理方法以及装置 | |
CN111222029B (zh) | 一种网络舆情信息传播中关键节点选择方法 | |
CN111625361A (zh) | 一种基于云端服务器和IoT设备协同的联合学习框架 | |
CN107705212B (zh) | 一种基于粒子群随机游走的角色识别方法 | |
CN101482876B (zh) | 基于权重的链接多属性的实体识别方法 | |
CN110909880B (zh) | 一种基于深度知识追踪的众包任务预测方法 | |
CN106991617B (zh) | 一种基于信息传播的微博社交关系提取算法 | |
CN110659678B (zh) | 一种用户行为分类方法、***及存储介质 | |
CN107330020B (zh) | 一种基于结构和属性相似度的用户实体解析方法 | |
US9147161B2 (en) | Determining geo-locations of users from user activities | |
CN109117856A (zh) | 基于智能边缘云的人及物追踪方法、装置及*** | |
CN112149000B (zh) | 一种基于网络嵌入的在线社交网络用户社区发现方法 | |
CN117289691A (zh) | 用于导航场景下强化学习的路径规划智能体的训练方法 | |
WO2018077301A1 (zh) | 账号筛选方法和装置 | |
CN109492703A (zh) | 一种步态的识别方法、***及终端设备 | |
CN116456480A (zh) | 通信资源受限下基于深度强化学习的多智能体协同决策方法 | |
CN115001937A (zh) | 面向智慧城市物联网的故障预测方法及装置 | |
CN111371619B (zh) | 一种即时通信网络用户数的估计方法和*** | |
US7752149B2 (en) | Method and apparatus for determining the variable dependency | |
Zheng et al. | Federated Q-learning: Linear regret speedup with low communication cost | |
CN116318856A (zh) | 一种基于差分隐私和联邦学习的模型参数优化方法和*** | |
Xie et al. | A social-aware opportunistic network routing protocol based on the node embeddings | |
CN105574107A (zh) | 基于用户偏好的内容定制推送方法 | |
CN108337644B (zh) | 一种数据处理方法及装置 | |
Yousefi'Zadeh | A neural-based technique for estimating self-similar traffic average queueing delay |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |