CN113158192B - 抗检测在线社交网络虚拟用户批量构建与管理方法及*** - Google Patents
抗检测在线社交网络虚拟用户批量构建与管理方法及*** Download PDFInfo
- Publication number
- CN113158192B CN113158192B CN202110161316.9A CN202110161316A CN113158192B CN 113158192 B CN113158192 B CN 113158192B CN 202110161316 A CN202110161316 A CN 202110161316A CN 113158192 B CN113158192 B CN 113158192B
- Authority
- CN
- China
- Prior art keywords
- virtual user
- user
- virtual
- attribute
- real
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 37
- 238000010276 construction Methods 0.000 title claims abstract description 32
- 238000007726 management method Methods 0.000 title claims abstract description 28
- 230000006399 behavior Effects 0.000 claims abstract description 133
- 230000035515 penetration Effects 0.000 claims abstract description 27
- 230000000694 effects Effects 0.000 claims abstract description 20
- 238000005065 mining Methods 0.000 claims abstract description 18
- 238000000034 method Methods 0.000 claims description 31
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000009826 distribution Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 230000008595 infiltration Effects 0.000 claims description 5
- 238000001764 infiltration Methods 0.000 claims description 5
- 230000009471 action Effects 0.000 claims description 3
- 238000012098 association analyses Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000010845 search algorithm Methods 0.000 claims description 3
- 230000008520 organization Effects 0.000 claims description 2
- 238000003860 storage Methods 0.000 claims description 2
- 230000007547 defect Effects 0.000 description 5
- 244000097202 Rathbunia alamosensis Species 0.000 description 3
- 235000009776 Rathbunia alamosensis Nutrition 0.000 description 3
- 238000010009 beating Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000010485 coping Effects 0.000 description 2
- 230000007480 spreading Effects 0.000 description 2
- 238000003892 spreading Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000008260 defense mechanism Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/57—Certifying or maintaining trusted computer platforms, e.g. secure boots or power-downs, version controls, system software checks, secure updates or assessing vulnerabilities
- G06F21/577—Assessing vulnerabilities and evaluating computer system security
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于计算机网络技术领域,公开了一种抗检测在线社交网络虚拟用户批量构建与管理方法及***,挖掘真实用户身份属性规则,并根据规则自动化构造虚拟用户身份;虚拟用户行为模型生成模块结合真实用户正常活动模式以及虚拟用户兴趣属性,构造基于兴趣属性用户行为模型。虚拟用户执行模块依据用户行为模型,指导虚拟用户执行在社交网络上的日常行为;社区渗透模块依据同质性原理指导虚拟用户向目标社区中身份相似度高且拥有共同好友的真实用户主动发送好友请求。本发明同时考虑了虚拟用户的行为特征以及好友关系特征可信性,可自动化构建及维护逼真的、高可信度的在线社交网络虚拟用户。
Description
技术领域
本发明属于计算机网络技术领域,尤其涉及一种抗检测在线社交网络虚拟用户批量构建与管理方法及***。
背景技术
随着在线社交网络的飞速发展,在线社交网络已经成为人们日常生活中不可分割的一部分。人们可通过在线社交网络平台进行沟通交流、分享个人信息、获取最新资讯等。然而,由于在线社交网络具有数据共享性、传播性、开放性等特点,导致在线社交网络已经成为恶意攻击者的目标。攻击者可通过创建恶意虚拟用户展开各种恶意活动,包括社会工程攻击,传播谣言和错误信息,散布垃圾邮件和恶意软件,收集用户隐私信息等。为了防止攻击者利用恶意虚拟用户在社交网络上实施恶意行为,各大在线社交网络平台都部署了相应的虚拟用户检测机制,其检测方法大致可以分为两类,第一类是基于特征的检测方法,该方法依赖于用户级活动及其账户详细信息(如,用户日志、配置文件)来检测虚假账号;第二类是基于图的检测方法,该方法将在线社交网络建模为一个图,节点表示用户账户,节点之间的边表示社会关系,并假设虚假账号只能与真实用户建立稀疏的好友关系,通过利用图挖掘的相关算法找到图中具体的异常结构或异常节点。当前关于虚拟用户的研究大多仅仅关注如何检测虚拟用户,很少关注有关构建抗检测的可信虚拟用户方面的研究,但虚拟用户的抗检测构建可以用于构建社交蜜罐捕获攻击者的活动模式,挖掘在线社交网络服务平台检测***的缺陷,以及探索受害者面对恶意攻击时的应对行为,具有很大的研究意义和现实意义。
目前,针对如何构建可信虚拟用户的问题上,已经提出的解决方案有:一种检测网络水军以及找到网络水军的方法,该方法通过手动设计账号配置信息和行为模式来创建并维护虚拟用户以作为社交蜜罐,然后使用随机主动关注的方式来吸引反关注,最后以社交蜜罐账号收集的恶意用户为线索进一步挖掘整个网络水军。它的缺陷在于:在建立虚拟用户时,逼真的账号配置信息的设置都是由人工手动操作,伸缩性不强。同时,该方法的虚拟用户在获取好友关系时,只是简单的随机发送好友请求,账号好友关系零散且没有融入真实用户社区,账号可信度不高,易被在线社交网络服务提供商或恶意攻击者检测识别。
通过上述分析,现有技术存在的问题及缺陷为:
(1)现有技术在建立虚拟用户时,逼真的账号配置信息的设置都是由人工手动操作,伸缩性不强。
(2)现有技术虚拟用户在获取好友关系时,只是简单的随机发送好友请求,账号好友关系零散且没有融入真实用户社区,账号可信度不高,易被在线社交网络服务提供商或恶意攻击者检测识别。
解决以上问题及缺陷的难度为:在线社交网络用户基数大,用户种类多,不同用户的行为模式存在较大差异,导致难以总结用户行为规则,模拟真实用户行为。同时社交网络用户建立好友关系的影响因素复杂,以及虚拟用户缺乏真实的物理世界社交关系,导致虚拟用户难以与真实社交网络用户建立好友关系进而融入真实用户社区。
解决以上问题及缺陷的意义为:可信的、抗检测的虚拟用户构建方法可应用于构造逼真社交蜜罐账号以诱导捕获恶意用户最新的攻击策略和行为特征,同时还可协助在线社交网络服务提供商制定更高效的防御机制,以及探索受害者面对恶意攻击时的应对行为。
发明内容
针对现有技术存在的问题,本发明提供了一种抗检测在线社交网络虚拟用户批量构建与管理方法及***。
本发明是这样实现的,一种抗检测在线社交网络虚拟用户批量构建与管理方法,所述抗检测在线社交网络虚拟用户批量构建与管理方法包括:
挖掘真实用户身份属性规则,并根据规则自动化构造虚拟用户身份;
虚拟用户行为模型生成模块结合真实用户正常活动模式以及虚拟用户兴趣属性,构造基于兴趣属性用户行为模型;虚拟用户执行模块依据用户行为模型,指导虚拟用户执行在社交网络上的日常行为;
社区渗透模块依据同质性原理指导虚拟用户向目标社区中身份相似度高且拥有共同好友的真实用户主动发送好友请求。
进一步,选定待构造虚拟用户所在的目标社区,挖掘目标社区真实用户身份属性规则,并基于规则自动化构造批量逼真虚拟用户身份。
进一步包括:
(1)选择待构造虚拟用户所在的目标社区,其目标社区可以是企业内部组织网络、校园内部社交网络、基于共同兴趣的好友网络等。获取目标社区中用户真实身份属性值,如性别、年龄、职业、居住地、教育背景、兴趣爱好,并为用户身份建立数据结构,整理合并得到目标社区真实用户身份集合;
(2)在(1)中收集的真实用户身份集合中挖掘真实身份属性值的各种类型规则,包括属性取值设定规则、属性值统计分布规则、属性关联规则;其中属性取值设定规则指的是每个属性可能的取值范围;属性值统计分布规则指的是每个属性的值统计分布特征;属性值关联规则指的是不同属性对应的值之间的依赖关系;其中在挖掘属性关联规则时,可采用关联分析算法(如FP-growth、 Apriori)挖掘身份属性值之间的关联性知识;
(3)设置虚拟用户身份模板,即选定身份属性集合来表示虚拟用户身份;将(2)得到身份属性规则作为约束集合,将真实用户属性值集合作为身份属性的值域;其中在虚拟用户创建阶段,其好友列表属性统一设置为Null;利用回溯搜索算法依次对每个属性赋值,当没有合法的值可以赋给某属性时就回溯,当虚拟用户身份所有属性都在满足约束条件的情况下被赋值时,虚拟用户身份成功生成;重复该步骤,以产生与目标社区真实用户身份相似且逼真的批量虚拟用户身份,其中待构造的虚拟用户身份数量由管理员预先定义。
进一步,所述虚拟用户行为模型生成模块基于真实用户的行为模式以及虚拟用户的身份属性,生成虚拟用户行为模型。虚拟用户行为执行模块读入虚拟用户行为模型,指导虚拟用户执行符合其身份和正常活动模式的日常行为。其具体包括:
(1)分析真实用户行为数据,提取真实用户的日常活动模式,参考真实用户行为活动模式,手工设置虚拟用户行为模式;即得到虚拟用户日常行为模式控制器,用来控制虚拟用户的日常行为时间模式,使虚拟用户的日常行为符合正常用户行为特性;
(2)基于用户身份兴趣属性,设定基于兴趣的虚拟用户浏览行为策略和发布行为策略,以保证虚拟用户的行为与其兴趣属性相关联;其虚拟用户浏览行为策略是指,在浏览过程中通过文本相似度计算方法计算浏览文本内容与虚拟用户兴趣属关键词相似度,比较相似度与预先设定的阈值tlike、trepost、tcomment的大小决定是否进行点赞、转发、评论操作;其虚拟用户发布行为策略,主要涉及构造与虚拟用户兴趣属性相关文本内容;其具体过程是,首先随机采集目标社区真实用户所发布的实时文本内容,通过文本相似度计算方法计算虚拟用户兴趣与发布文本的相似度,选择相似度大于预先设定的阈值twrite的文本为候选文本,然后对候选文本进行切割、拼接、添加/去除特殊符号、近义词替换方式进行处理得到最终虚拟用户待发布的文本内容;其中文本相似度计算方法可采用基于向量空间模型VSM、LDA主题模型、word2vec相似度计算方法;
(3)合并(1)得到的虚拟用户日常行为控制器以及(2)得到的基于兴趣的虚拟用户行为策略,构建虚拟用户行为模型;
(4)虚拟用户执行模块读入虚拟用户行为模型,指导虚拟用户执行单元执行每个虚拟用户的日常行为动作;其虚拟用户执行单元可以是真实计算机或移动手机,或虚拟机,每个虚拟用户执行单元唯一绑定一个虚拟用户。
进一步,社区渗透模块指导虚拟用户按照基于同质性原理的社区渗透策略高效率地建立与真实用户的好友关系进而融入真实用户网络社区;本发明涉及的同质性原理指的是个人属性相似的用户之间更容易建立好友关系,同时具有好友关系的用户之间往往具有相似的属性,其中的个人属性包括但不限于性别、年龄、籍贯、爱好、职业、教育背景、网络结构;其中网络结构同质性也叫做三元闭包,是指若两个人拥有共同好友,则他们未来成为好友的概率就会提高。
进一步包括:
(1)社区渗透模块发送命令到每个虚拟用户,命令虚拟用户之间基于同质性原理全局地建立好友关系,即身份相似的虚拟用户优先连接;具体每个虚拟用户需要连接的好友数量可参照于目标社区正常用户的平均好友数量;
(2)社区渗透模块发送命令到每个虚拟用户,命令每个虚拟用户在目标社区选择k个身份相似度大于阈值tlink的真实用户,并主动发送好友请求;其k和tlink由管理员预先设定,可根据不同的渗透策略选择不同值;其中可采用基于共同好友数量,向量空间模型,LDA主题模型、word2vec、node2vec等计算两用户身份属性相似度。
(3)每个虚拟用户遍历已建立好友关系的真实用户的好友列表中的每个用户,并计算虚拟用户自身与这些用户的身份相似度,当相似度大于阈值tlink时,主动发送好友请求;重复执行本步骤,直到虚拟用户成功与n个真实用户建立好友关系时,具体n的取值由管理员预先设定。
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
挖掘真实用户身份属性规则,并根据规则自动化构造虚拟用户身份;
虚拟用户行为模型生成模块结合真实用户正常活动模式以及虚拟用户兴趣属性,构造基于兴趣属性用户行为模型;虚拟用户执行模块依据用户行为模型,指导虚拟用户执行在社交网络上的日常行为;
社区渗透模块依据同质性原理指导虚拟用户向目标社区中身份相似度高且拥有共同好友的真实用户主动发送好友请求。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
挖掘真实用户身份属性规则,并根据规则自动化构造虚拟用户身份;
虚拟用户行为模型生成模块结合真实用户正常活动模式以及虚拟用户兴趣属性,构造基于兴趣属性用户行为模型;虚拟用户执行模块依据用户行为模型,指导虚拟用户执行在社交网络上的日常行为;
社区渗透模块依据同质性原理指导虚拟用户向目标社区中身份相似度高且拥有共同好友的真实用户主动发送好友请求。
本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述的抗检测在线社交网络虚拟用户批量构建与管理方法。
本发明的另一目的在于提供一种实施所述抗检测在线社交网络虚拟用户批量构建与管理方法的抗检测在线社交网络虚拟用户批量构建与管理***,所述抗检测在线社交网络虚拟用户批量构建与管理***包括:
虚拟身份构建模块,用于从目标社区真实用户身份属性集合中挖掘真实用户身份属性规则,依据规则自动化生成批量逼真的虚拟用户身份;
虚拟用户行为模型生成模块,用于根据虚拟身份构建模块提供的虚拟用户身份以及手工设置的虚拟用户日常行为模式,生成虚拟用户执行日常行为所需要的基于用户身份的用户行为模型,以保证虚拟用户行为与其身份属性的关联性;
社区渗透模块,用于发送渗透策略到虚拟用户执行模块,指导虚拟用户根据基于同质性原理的社区渗透策略主动与真实用户建立好友关系进而融入社区,从而使虚拟用户拥有可信的社交关系特征;
虚拟用户管理模块,用于发送命令到每个虚拟用户执行单元,实时控制每个虚拟用户的行为操作,同时显示每个虚拟用户的运行状况,达到对虚拟用户实时管控的目的;
虚拟用户执行模块,是唯一与虚拟用户直接交互的模块,其包括大量的虚拟用户执行单元,每个虚拟用户执行单元唯一对应着一个虚拟用户,用于根据虚拟用户行为模型生成模块传入的虚拟用户行为模型执行虚拟用户的日常行为操作,以及执行来自其他模块发送的命令对应的行为操作。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明可实现自动化批量构建及维护逼真、可信的虚拟用户。本发明提出了一种构建及维护管理批量在线社交网络虚拟用户的方法。能够基于真实用户身份属性规则自动化构建批量的高逼真度的虚拟用户身份配置信息;同时在考虑虚拟用户行为与其身份属性相关联的同时,根据基于同质性原理的渗透策略主动融入到目标社区,有效地提高虚拟用户行为特征、社交关系特征的可信度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的抗检测在线社交网络虚拟用户批量构建与管理方法流程图。
图2是本发明实施例提供的抗检测在线社交网络虚拟用户批量构建与管理***的结构示意图。
图3是本发明实施例提供的抗检测在线社交网络虚拟用户批量构建与管理方法的实现流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种抗检测在线社交网络虚拟用户批量构建与管理方法及***,下面结合附图对本发明作详细的描述。
如图1所示,本发明提供的抗检测在线社交网络虚拟用户批量构建与管理方法包括以下步骤:
S101:挖掘真实用户身份属性规则,并根据规则自动化构造虚拟用户身份;
S102:虚拟用户行为模型生成模块结合真实用户正常活动模式以及虚拟用户兴趣属性,构造基于兴趣属性用户行为模型;虚拟用户执行模块依据用户行为模型,指导虚拟用户执行在社交网络上的日常行为;
S103:社区渗透模块依据同质性原理指导虚拟用户向目标社区中身份相似度高且拥有共同好友的真实用户主动发送好友请求。
本发明提供的抗检测在线社交网络虚拟用户批量构建与管理方法业内的普通技术人员还可以采用其他的步骤实施,图1的本发明提供的抗检测在线社交网络虚拟用户批量构建与管理方法仅仅是一个具体实施例而已。
如图2所示,本发明提供的抗检测在线社交网络虚拟用户批量构建与管理***包括:
虚拟身份构建模块,用于从目标社区真实用户身份属性集合中挖掘真实用户身份属性规则,依据规则自动化生成批量逼真的虚拟用户身份。
虚拟用户行为模型生成模块,用于根据虚拟身份构建模块提供的虚拟用户身份以及手工设置的虚拟用户日常行为模式,生成虚拟用户执行日常行为所需要的基于用户身份的用户行为模型,以保证虚拟用户行为与其身份属性的关联性。
社区渗透模块,用于发送渗透策略到虚拟用户执行模块,指导虚拟用户根据基于同质性原理的社区渗透策略主动与真实用户建立好友关系进而融入社区,从而使虚拟用户拥有可信的社交关系特征。
虚拟用户管理模块,用于发送命令到每个虚拟用户执行单元,实时控制每个虚拟用户的行为操作,同时显示每个虚拟用户的运行状况,达到对虚拟用户实时管控的目的。
虚拟用户执行模块,是唯一与虚拟用户直接交互的模块,其包括大量的虚拟用户执行单元,每个虚拟用户执行单元唯一对应着一个虚拟用户,用于根据虚拟用户行为模型生成模块传入的虚拟用户行为模型执行虚拟用户的日常行为操作,以及执行来自其他模块发送的命令对应的行为操作。
下面结合附图对本发明的技术方案作进一步的描述。
如图1所示,本发明提供的抗检测在线社交网络虚拟用户批量构建与管理方法包括以下步骤:
第一步,选定待构造虚拟用户所在的目标社区,挖掘目标社区真实用户身份属性规则,并基于规则自动化构造批量逼真虚拟用户身份。具体过程如下:
(1)在本实施例中,选择新浪微博平台作为本实施例具体的在线社交网络平台,新浪微博中的某高校社区作为目标社区。收集目标社区的中大量真实用户上公开可见的所有信息,包括个人主页、好友列表、用户生成内容等信息。挖掘真实用户的身份属性值,其中性别、年龄、职业、居住地、教育背景可以直接获取,采用LDA主题模型分析用户产生的文本内容可以提取用户的兴趣属性值。最后为用户身份建立数据结构,整理合并得到目标社区真实用户身份集合。
(2)在(1)中收集的真实用户身份集合中挖掘真实身份属性值的各种类型规则,包括属性取值设定规则、属性值统计分布规则、属性关联规则。其中属性取值设定规则指的是每个属性可能的取值范围,如年龄属性的取值范围;属性值统计分布规则指的是每个属性的值统计分布特征,如年龄属性的平均值;属性值关联规则指的是不同属性对应的值之间的依赖关系,如职业属性为学生的居住地属性通常是学校地址。其中在挖掘属性关联规则时,本实施例选取关联分析算法Apriori挖掘身份属性值之间的关联性知识。
(3)设置虚拟用户身份模板,即选定身份属性集合来表示虚拟用户身份。在本实施例中选择(性别、年龄、职业、教育背景、居住地、兴趣、好友列表) 作为虚拟用户身份属性集合;将(2)得到身份属性规则作为约束集合,将真实用户属性值集合作为身份属性的值域。其中在虚拟用户创建阶段,其好友列表属性统一设置为Null。利用回溯搜索算法依次对每个属性赋值,当没有合法的值可以赋给某属性时就回溯,当虚拟用户身份所有属性都在满足约束条件的情况下被赋值时,虚拟用户身份成功生成。重复该步骤,以产生与目标社区真实用户身份相似且逼真的批量虚拟用户身份。其中待构造的虚拟用户身份数量由管理员预先定义。
第二步,虚拟用户行为模型生成模块基于真实用户的行为模式以及虚拟用户的身份属性,生成虚拟用户行为模型。虚拟用户行为执行模块读入虚拟用户行为模型,指导虚拟用户执行符合其身份和正常活动模式的日常行为。其具体过程如下:
(1)分析真实用户行为数据,提取真实用户的可见的行为活动模式,包括发博频率、发博时间分布、发博间隔等特征。参考真实用户行为活动模式,手工设置虚拟用户行为活动模式,包括登录时间分布、发博时间分布、浏览时长、点赞频率。最后即得到虚拟用户日常行为模式控制器,用来控制虚拟用户的日常行为时间模式,使虚拟用户的日常行为符合真实用户行为特性。
(2)基于用户身份兴趣属性,设定基于兴趣的虚拟用户浏览行为策略和发布行为策略,以保证虚拟用户的行为与其兴趣属性相关联;其虚拟用户浏览行为策略是指,在浏览过程中通过文本相似度计算方法计算浏览文本内容与虚拟用户兴趣属关键词相似度,比较相似度与预先设定的阈值tlike、trepost、tcomment的大小决定是否进行点赞、转发、评论操作;其虚拟用户发布行为策略,主要涉及构造与虚拟用户兴趣属性相关文本内容;其具体过程是,首先随机采集目标社区真实用户所发布的实时文本内容,通过文本相似度计算方法计算虚拟用户兴趣与发布文本的相似度,选择相似度大于预先设定的阈值twrite的文本为候选文本,然后对候选文本进行切割、拼接、添加/去除特殊符号、近义词替换等方式进行处理得到最终虚拟用户待发布的文本内容;本实施例中采用word2vec将微博文本内容和用户兴趣关键词转换为向量表示,然后利用余弦相似度计算方法得到最终的文本相似度。
(3)合并(1)得到的虚拟用户日常行为控制器以及(2)得到的基于兴趣的虚拟用户行为策略,构建虚拟用户行为模型。
(4)虚拟用户执行模块读入虚拟用户行为模型,指导虚拟用户执行单元执行每个虚拟用户的日常行为动作。其虚拟用户执行单元可以是真实计算机或移动手机,或虚拟机,每个虚拟用户执行单元唯一绑定一个虚拟用户。
第三步,社区渗透模块指导虚拟用户按照基于同质性原理的社区渗透策略高效率地建立与真实用户的好友关系进而融入真实用户网络社区。本发明涉及的同质性原理指的是个人属性相似的用户之间更容易建立好友关系,同时具有好友关系的用户之间往往具有相似的属性,其中的个人属性包括但不限于性别、年龄、籍贯、爱好、职业、教育背景、网络结构;其中网络结构同质性也叫做三元闭包,是指若两个人拥有共同好友,则他们未来成为好友的概率就会提高。其具体过程如下:
(1)社区渗透模块发送命令到每个虚拟用户,命令虚拟用户之间基于同质性原理全局地建立好友关系,即身份相似的虚拟用户优先连接,以让每个虚拟用户拥有一个看上去正常的好友数量的同时,还拥有较高的好友关系可信度。具体每个虚拟用户需要连接的好友数量可参照于目标社区正常用户的平均好友数量。本实施例选取50与150之间的一个随机数。
(2)社区渗透模块发送命令到每个虚拟用户,命令每个虚拟用户在目标社区选择k个身份相似度大于阈值tlink的真实用户,并主动发送好友请求。在本实施例中,新浪微博中的好友关系指的是相互关注关系,发送好友请求指的是以主动关注或私信求关注方式获得反关注。其k和tlink由管理员预先设定,可根据不同的渗透策略选择不同值。本实施例中的用户之间身份相似度计算具体过程为:
1)将虚拟用户身份用元组(v1,…,vn-1,vn,)表示,其中vi表示第i个身份属性的值。在本实施例中虚拟用户身份用元组(性别、年龄、职业、教育背景、居住地、兴趣、好友列表)表示。
2)选用常见的身份属性相似度计算算法,计算用户之间所有身份属性的相似度sim(u,v)attr。在本实施例中,对于一些简单类型的身份属性(如性别、职业、居住地),其相似度计算只需要比较是否相等即可,若相等sim(u,v)i=1,否则 sim(u,v)i=0;对于一些文本类身份属性(如兴趣属性),选择word2vec将该身份属性转换为向量,并选用余弦相似度算法计算向量之间的相似度,即用户u和用户v关于身份属性j的相似度为对于一些集合类身份属性(如好友列表、教育背景),相似度计算结果为两集合交集的元素个数,即sim(u,v)k=Count(attuk∩attuk)。
3)设置用户身份属性权重向量,可用(w1,…,wn-1,wn,)表示,权值wi越大代表所对应的第i个身份属性越重要,整合两用户所有身份属性之间的相似度,得到两用户身份之间的相似度,即 sim(u,v)=w1*sim(u,v)1+…+wn-1*sim(u,v)n-1+wn*sim(u,v)n。其中权值wi的选择根据不同的渗透策略而选择,如,若想渗入相同兴趣的用户社区,可以将兴趣属性对应的权值相应的提高。
(3)每个虚拟用户遍历已建立好友关系的真实用户的好友列表中的每个用户,并计算虚拟用户自身与这些用户的身份相似度,当相似度大于阈值tlink时,主动发送好友请求。重复执行本步骤,直到虚拟用户成功与n个真实用户建立好友关系时。具体n的取值由管理员预先设定。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行***,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (8)
1.一种抗检测在线社交网络虚拟用户批量构建与管理方法,其特征在于,所述抗检测在线社交网络虚拟用户批量构建与管理方法包括:
挖掘真实用户身份属性规则,并根据规则自动化构造虚拟用户身份;
虚拟用户行为模型生成模块结合真实用户正常活动模式以及虚拟用户兴趣属性,构造基于兴趣属性用户行为模型;虚拟用户执行模块依据用户行为模型,指导虚拟用户执行在社交网络上的日常行为;
社区渗透模块依据同质性原理指导虚拟用户向目标社区中身份相似度高且拥有共同好友的真实用户主动发送好友请求;
社区渗透模块指导虚拟用户按照基于同质性原理的社区渗透策略高效率地建立与真实用户的好友关系进而融入真实用户网络社区;本发明涉及的同质性原理指的是个人属性相似的用户之间更容易建立好友关系,同时具有好友关系的用户之间往往具有相似的属性,其中的个人属性包括但不限于性别、年龄、籍贯、爱好、职业、教育背景、网络结构;其中网络结构同质性也叫做三元闭包,是指若两个人拥有共同好友,则他们未来成为好友的概率就会提高;
进一步包括:
(1)社区渗透模块发送命令到每个虚拟用户,命令虚拟用户之间基于同质性原理全局地建立好友关系,即身份相似的虚拟用户优先连接;具体每个虚拟用户需要连接的好友数量可参照于目标社区正常用户的平均好友数量;
(2)社区渗透模块发送命令到每个虚拟用户,命令每个虚拟用户在目标社区选择k个身份相似度大于阈值tlink的真实用户,并主动发送好友请求;其k和tlink由管理员预先设定,可根据不同的渗透策略选择不同值;其中可采用基于共同好友数量、向量空间模型VSM、LDA主题模型、word2vec、node2vec计算两用户身份属性相似度;
(3)每个虚拟用户遍历已建立好友关系的真实用户的好友列表中的每个用户,并计算虚拟用户自身与这些用户的身份相似度,当相似度大于阈值tlink时,主动发送好友请求;重复执行本步骤,直到虚拟用户成功与n个真实用户建立好友关系时,具体n的取值由管理员预先设定。
2.如权利要求1所述的抗检测在线社交网络虚拟用户批量构建与管理方法,其特征在于,选定待构造虚拟用户所在的目标社区,挖掘目标社区真实用户身份属性规则,并基于规则自动化构造批量逼真虚拟用户身份。
3.如权利要求1所述的抗检测在线社交网络虚拟用户批量构建与管理方法,其特征在于,进一步包括:
(1)选择待构造虚拟用户所在的目标社区,其目标社区可以是企业内部组织网络、校园内部社交网络、基于共同兴趣的好友网络;获取目标社区中用户真实身份属性值,包括性别、年龄、职业、居住地、教育背景、兴趣爱好,并为用户身份建立数据结构,整理合并得到目标社区真实用户身份集合;
(2)在(1)中收集的真实用户身份集合中挖掘真实身份属性值的各种类型规则,包括属性取值设定规则、属性值统计分布规则、属性关联规则;其中属性取值设定规则指的是每个属性可能的取值范围;属性值统计分布规则指的是每个属性的值统计分布特征;属性值关联规则指的是不同属性对应的值之间的依赖关系;其中在挖掘属性关联规则时,可采用关联分析算法挖掘身份属性值之间的关联性知识;
(3)设置虚拟用户身份模板,即选定身份属性集合来表示虚拟用户身份;将(2)得到身份属性规则作为约束集合,将真实用户属性值集合作为身份属性的值域;其中在虚拟用户创建阶段,其好友列表属性统一设置为Null;利用回溯搜索算法依次对每个属性赋值,当没有合法的值可以赋给某属性时就回溯,当虚拟用户身份所有属性都在满足约束条件的情况下被赋值时,虚拟用户身份成功生成;重复该步骤,以产生与目标社区真实用户身份相似且逼真的批量虚拟用户身份,其中待构造的虚拟用户身份数量由管理员预先定义。
4.如权利要求1所述的抗检测在线社交网络虚拟用户批量构建与管理方法,其特征在于,所述虚拟用户行为模型生成模块基于真实用户的行为模式以及虚拟用户的身份属性,生成虚拟用户行为模型,虚拟用户行为执行模块读入虚拟用户行为模型,指导虚拟用户执行符合其身份和正常活动模式的日常行为,其具体包括:
(1)分析真实用户行为数据,提取真实用户的日常活动模式,参考真实用户行为活动模式,手工设置虚拟用户行为模式;即得到虚拟用户日常行为模式控制器,用来控制虚拟用户的日常行为时间模式,使虚拟用户的日常行为符合正常用户行为特性;
(2)基于用户身份兴趣属性,设定基于兴趣的虚拟用户浏览行为策略和发布行为策略,以保证虚拟用户的行为与其兴趣属性相关联;其虚拟用户浏览行为策略是指,在浏览过程中通过文本相似度计算方法计算浏览文本内容与虚拟用户兴趣属关键词相似度,比较相似度与预先设定的阈值tlike、trepost、tcomment的大小决定是否进行点赞、转发、评论操作;其虚拟用户发布行为策略,主要涉及构造与虚拟用户兴趣属性相关文本内容;其具体过程是,首先随机采集目标社区真实用户所发布的实时文本内容,通过文本相似度计算方法计算虚拟用户兴趣与发布文本的相似度,选择相似度大于预先设定的阈值twrite的文本为候选文本,然后对候选文本进行切割、拼接、添加/去除特殊符号、近义词替换方式进行处理得到最终虚拟用户待发布的文本内容;其中文本相似度计算方法可采用基于向量空间模型VSM、LDA主题模型、word2vec相似度计算方法;
(3)合并(1)得到的虚拟用户日常行为控制器以及(2)得到的基于兴趣的虚拟用户行为策略,构建虚拟用户行为模型;
(4)虚拟用户执行模块读入虚拟用户行为模型,指导虚拟用户执行单元执行每个虚拟用户的日常行为动作;其虚拟用户执行单元可以是真实计算机或移动手机,或虚拟机,每个虚拟用户执行单元唯一绑定一个虚拟用户。
5.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~4任意一项所述抗检测在线社交网络虚拟用户批量构建与管理方法。
6.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1~4任意一项所述抗检测在线社交网络虚拟用户批量构建与管理方法。
7.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现权利要求1~4任意一项所述的抗检测在线社交网络虚拟用户批量构建与管理方法。
8.一种实施权利要求1~4任意一项所述抗检测在线社交网络虚拟用户批量构建与管理方法的抗检测在线社交网络虚拟用户批量构建与管理***,其特征在于,所述抗检测在线社交网络虚拟用户批量构建与管理***包括:
虚拟身份构建模块,用于从目标社区真实用户身份属性集合中挖掘真实用户身份属性规则,依据规则自动化生成批量逼真的虚拟用户身份;
虚拟用户行为模型生成模块,用于根据虚拟身份构建模块提供的虚拟用户身份以及手工设置的虚拟用户日常行为模式,生成虚拟用户执行日常行为所需要的基于用户身份的用户行为模型,以保证虚拟用户行为与其身份属性的关联性;
社区渗透模块,用于发送渗透策略到虚拟用户执行模块,指导虚拟用户根据基于同质性原理的社区渗透策略主动与真实用户建立好友关系进而融入社区,从而使虚拟用户拥有可信的社交关系特征;
虚拟用户管理模块,用于发送命令到每个虚拟用户执行单元,实时控制每个虚拟用户的行为操作,同时显示每个虚拟用户的运行状况,达到对虚拟用户实时管控的目的;
虚拟用户执行模块,是唯一与虚拟用户直接交互的模块,其包括大量的虚拟用户执行单元,每个虚拟用户执行单元唯一对应着一个虚拟用户,用于根据虚拟用户行为模型生成模块传入的虚拟用户行为模型执行虚拟用户的日常行为操作,以及执行来自其他模块发送的命令对应的行为操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110161316.9A CN113158192B (zh) | 2021-02-05 | 2021-02-05 | 抗检测在线社交网络虚拟用户批量构建与管理方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110161316.9A CN113158192B (zh) | 2021-02-05 | 2021-02-05 | 抗检测在线社交网络虚拟用户批量构建与管理方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113158192A CN113158192A (zh) | 2021-07-23 |
CN113158192B true CN113158192B (zh) | 2022-10-18 |
Family
ID=76882823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110161316.9A Active CN113158192B (zh) | 2021-02-05 | 2021-02-05 | 抗检测在线社交网络虚拟用户批量构建与管理方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113158192B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113515719B (zh) * | 2021-07-29 | 2024-01-12 | 北京百度网讯科技有限公司 | 对社区产品进行冷启动的方法和装置 |
CN114357308B (zh) * | 2021-09-17 | 2022-09-02 | 北京能科瑞元数字技术有限公司 | 一种基于推荐的制造企业供需对接方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5799454B1 (ja) * | 2015-03-17 | 2015-10-28 | 株式会社gloops | ゲームサーバ、ゲーム制御方法、ゲームプログラム、ゲームプログラム記録媒体及び端末装置 |
CN109102061A (zh) * | 2018-08-10 | 2018-12-28 | 哈尔滨工业大学(威海) | 一种符合人类动力学规律的群体用户行为产生***,设备及存储介质 |
CN112000925A (zh) * | 2020-08-14 | 2020-11-27 | 广州市百果园信息技术有限公司 | 用户账号识别方法、装置、设备及介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110099237A1 (en) * | 2009-10-23 | 2011-04-28 | Kfir Luzzatto | System for operating a social network and method therefor |
CN104660594B (zh) * | 2015-02-09 | 2018-01-09 | 中国科学院信息工程研究所 | 一种面向社交网络的虚拟恶意节点及其网络识别方法 |
CN111415167B (zh) * | 2020-02-19 | 2023-05-16 | 同济大学 | 网络欺诈交易检测方法及装置、计算机存储介质和终端 |
-
2021
- 2021-02-05 CN CN202110161316.9A patent/CN113158192B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5799454B1 (ja) * | 2015-03-17 | 2015-10-28 | 株式会社gloops | ゲームサーバ、ゲーム制御方法、ゲームプログラム、ゲームプログラム記録媒体及び端末装置 |
CN109102061A (zh) * | 2018-08-10 | 2018-12-28 | 哈尔滨工业大学(威海) | 一种符合人类动力学规律的群体用户行为产生***,设备及存储介质 |
CN112000925A (zh) * | 2020-08-14 | 2020-11-27 | 广州市百果园信息技术有限公司 | 用户账号识别方法、装置、设备及介质 |
Non-Patent Citations (1)
Title |
---|
大数据环境下的微信息蜜罐监测;孙彬 等;《湖南科技大学学报(自然科学版)》;20171231;第32卷(第4期);第69-78页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113158192A (zh) | 2021-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2708508C1 (ru) | Способ и вычислительное устройство для выявления подозрительных пользователей в системах обмена сообщениями | |
Jain et al. | A survey of phishing attack techniques, defence mechanisms and open research challenges | |
US11921864B2 (en) | Threat mitigation system and method | |
US20190222589A1 (en) | Method computing device for detecting malicious domain names in network traffic | |
US9860270B2 (en) | System and method for determining web pages modified with malicious code | |
US9223961B1 (en) | Systems and methods for performing security analyses of applications configured for cloud-based platforms | |
Ji et al. | Combating the evasion mechanisms of social bots | |
Pham et al. | Phishing-aware: A neuro-fuzzy approach for anti-phishing on fog networks | |
CN113158192B (zh) | 抗检测在线社交网络虚拟用户批量构建与管理方法及*** | |
JP2005135381A (ja) | クライアントベースのウェブクローリングのためのシステムおよび方法 | |
US11785044B2 (en) | System and method for detection of malicious interactions in a computer network | |
Chen et al. | Ai@ ntiphish—machine learning mechanisms for cyber-phishing attack | |
RU2701040C1 (ru) | Способ и вычислительное устройство для информирования о вредоносных веб-ресурсах | |
US8955127B1 (en) | Systems and methods for detecting illegitimate messages on social networking platforms | |
US11023590B2 (en) | Security testing tool using crowd-sourced data | |
Chen et al. | FPM: Four-factors Propagation Model for passive P2P worms | |
Haque et al. | A meta data mining framework for botnet analysis | |
US20220277076A1 (en) | Threat mitigation system and method | |
RU2534935C2 (ru) | Система и способ адаптивного управления и контроля действий пользователя на основе поведения пользователя | |
Zhang et al. | The dynamical modeling analysis of the spreading of passive worms in P2P networks | |
Hayati et al. | Rule-based on-the-fly web spambot detection using action strings | |
Sahoo et al. | Identification of malicious accounts in Facebook | |
US11709946B2 (en) | Threat mitigation system and method | |
Wang et al. | A mobile botnet model based on android system | |
Akinyemi | V3 Onion Service Vulnerability on Website Fingerprinting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |