CN112019377B - 网络用户角色识别的方法、***、电子装置和存储介质 - Google Patents
网络用户角色识别的方法、***、电子装置和存储介质 Download PDFInfo
- Publication number
- CN112019377B CN112019377B CN202010729579.0A CN202010729579A CN112019377B CN 112019377 B CN112019377 B CN 112019377B CN 202010729579 A CN202010729579 A CN 202010729579A CN 112019377 B CN112019377 B CN 112019377B
- Authority
- CN
- China
- Prior art keywords
- user
- role
- human
- address
- user information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/535—Tracking the activity of the user
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Algebra (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请涉及一种网络用户角色识别的方法、***、电子装置和存储介质,其中,该网络用户角色识别的方法包括:根据IP地址数据库和经纬度信息构建用户信息数据库,根据用户的IP地址和该用户信息数据库,获取该用户的用户信息,其中,该用户信息包括该IP地址的服务字段,该IP地址在第一单位时间内的访问量和第二单位时间内的活跃时长,根据该服务字段、该访问量和该活跃时长,判断该用户在该第二单位时间的角色为人类或者非人类,根据角色判断的判断结果获取该用户的角色值。通过本申请,解决了通过网络日志的数据对用户角色进行分析,准确度较低的问题,提高了对用户角色识别的准确度。
Description
技术领域
本申请涉及信息安全技术领域,特别是涉及网络用户角色识别的方法、***、电子装置和存储介质。
背景技术
随着计算机技术的快速发展,网络技术得到了广泛应用,用户对网络平台的访问频率也随之升高,然而,种类繁多的访问行为尤其是一些恶意的访问对网络平台的信息安全造成了极大威胁,因此需要准确识别访问用户的角色,以提高网络平台的安全性。
在相关技术中,通过网络日志的数据对用户角色进行分析,判断该用户为人类或者非人类,准确度较低。
目前针对相关技术中通过网络日志的数据对用户角色进行分析,准确度较低的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种网络用户角色识别的方法、***、电子装置和存储介质,以至少解决相关技术中通过网络日志的数据对用户角色进行分析,准确度较低的问题。
第一方面,本申请实施例提供了一种网络用户角色识别的方法,所述方法包括:
根据IP地址数据库和经纬度信息构建用户信息数据库;
根据用户的IP地址和所述用户信息数据库,获取所述用户的用户信息,其中,所述用户信息包括所述IP地址的服务字段,所述IP地址在第一单位时间内的访问量和第二单位时间内的活跃时长;
根据所述服务字段、所述访问量和所述活跃时长,判断所述用户在所述第二单位时间的角色为人类或者非人类,根据角色判断的判断结果获取所述用户的角色值。
在其中一些实施例中,所述根据所述服务字段、所述访问量和所述活跃时长,判断所述用户在所述第二单位时间的角色为人类或者非人类包括:
在所述用户信息满足角色判断条件之一的情况下,判定所述用户为人类,其中,所述角色判断条件包括:所述用户信息数据库中不存在所述IP地址的服务字段,或者,所述访问量小于访问阈值,或者,所述活跃时长小于预设时长阈值。
在其中一些实施例中,所述根据用户的IP地址和所述用户信息数据库,获取所述用户的用户信息包括:
将所述IP地址与所述用户信息数据库进行对比,获取所述IP地址的服务字段,根据所述IP地址的日志数据计算所述访问量和所述活跃时长。
在其中一些实施例中,在所述判断所述用户在所述第二单位时间的角色为人类或者非人类之后,所述方法还包括:
获取预设时间段内所述用户的多个所述角色值;
根据多个所述角色值与权重参数计算所述用户的修正角色值,其中,所述权重参数与所述角色值对应,所述权重参数的大小与时间间隔成反比,所述时间间隔根据计算每个所述角色值的时间与计算所述修正角色值的时间之差确定;
根据所述修正角色值与角色判断阈值的对比结果,判断所述用户的角色为人类或者非人类。
在其中一些实施例中,所述根据所述修正角色值与角色判断阈值的对比结果,判断所述用户的角色为人类或者非人类包括:
在所述修正角色值大于角色判断阈值的情况下,判定所述用户为人类,或者,
在所述修正角色值小于或者等于所述角色判断阈值的情况下,判定所述用户为非人类。
第二方面,本申请实施例提供了一种网络用户角色识别的***,所述***包括:数据库模块、用户信息获取模块和判断模块:
所述数据库模块,用于根据IP地址数据库和经纬度信息构建用户信息数据库;
所述用户信息获取模块,用于根据用户的IP地址和所述用户信息数据库,获取所述用户的用户信息,其中,所述用户信息包括所述IP地址的服务字段,所述IP地址在第一单位时间内的访问量和第二单位时间内的活跃时长;
所述判断模块,用于根据所述服务字段、所述访问量和所述活跃时长,判断所述用户在所述第二单位时间的角色为人类或者非人类,根据角色判断的判断结果获取所述用户的角色值。
在其中一些实施例中,所述判断模块还用于在所述用户信息满足角色判断条件之一的情况下,判定所述用户为人类,其中,所述角色判断条件包括:所述用户信息数据库中不存在所述IP地址的服务字段,或者,所述访问量小于访问阈值,或者,所述活跃时长小于预设时长阈值。
在其中一些实施例中,所述***还包括修正模块:
所述修正模块,用于获取预设时间段内所述用户的多个所述角色值,根据多个所述角色值与权重参数计算所述用户的修正角色值,其中,所述权重参数与所述角色值对应,所述权重参数的大小与时间间隔成反比,所述时间间隔根据计算每个所述角色值的时间与计算所述修正角色值的时间之差确定,根据所述修正角色值与角色判断阈值的对比结果,判断所述用户的角色为人类或者非人类。
第三方面,本申请实施例提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的网络用户角色识别的方法。
第四方面,本申请实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的网络用户角色识别的方法。
相比于相关技术,本申请实施例提供的网络用户角色识别的方法,通过根据IP地址数据库和经纬度信息构建用户信息数据库,根据用户的IP地址和该用户信息数据库,获取该用户的用户信息,其中,该用户信息包括该IP地址的服务字段,该IP地址在第一单位时间内的访问量和第二单位时间内的活跃时长,根据该服务字段、该访问量和该活跃时长,判断该用户在该第二单位时间的角色为人类或者非人类,根据角色判断的判断结果获取该用户的角色值,解决了通过网络日志的数据对用户角色进行分析,准确度较低的问题,提高了对用户角色识别的准确度。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的网络用户角色识别的方法的应用环境示意图;
图2是根据本申请实施例的网络用户角色识别的方法的流程图;
图3是根据本申请实施例的另一种网络用户角色识别的方法的流程图;
图4是根据本申请实施例的网络用户角色识别的***的结构框图;
图5是根据本申请实施例的另一种网络用户角色识别的***的结构框图;
图6是根据本申请实施例的电子设备的内部结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指大于或者等于两个。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
本申请提供的网络用户角色识别的方法,可以应用于如图1所示的应用环境中,图1是根据本申请实施例的网络用户角色识别的方法的应用环境示意图,如图1所示。其中,终端102与服务器104通过网络进行通信。服务器104根据IP地址数据库和经纬度信息构建用户信息数据库,服务器104通过终端102获取用户的IP地址,根据用户的IP地址和该用户信息数据库,获取该用户的用户信息,其中,该用户信息包括该IP地址的服务字段,该IP地址在第一单位时间内的访问量和第二单位时间内的活跃时长,服务器104根据该服务字段、该访问量和该活跃时长,判断该用户在该第二单位时间的角色为人类或者非人类,根据角色判断的判断结果获取该用户的角色值。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在对网络平台进行安全维护的过程中,为了直观快速地对用户角色进行识别,仅通过网络日志的数据来分析挖掘是远远不够的,因此需要构建特定数据库来对用户的基本信息加以表述。
本实施例提供了一种网络用户角色识别的方法,图2是根据本申请实施例的网络用户角色识别的方法的流程图,如图2所示,该流程包括如下步骤:
步骤S201,根据IP地址数据库和经纬度信息构建用户信息数据库。本实施例中,IP为网际互连协议(Internet Protocol,简称为IP),IP地址数据库包括GeoGLite2IP地址数据库、纯真IP地址数据库、中国互联网络信息中心(China Internet Network InformationCenter,简称为CNNIC)IP地址数据库、IPIP数据库等,其中,GeoGLite2IP地址数据库为离线定位数据库,纯真IP地址数据库可以将IP地址的信息格式化为国家、省、市、县和运营商,CNNIC IP地址数据库由国家互联网信息中心进行管理,IPIP数据库是基于各电信运营商以及网络服务的边界网关协议(Border Gateway Protocol,简称为BGP)/自制***编号(Autonomous System Number,简称为ASN)数据而分析处理而得来的IP库,经纬度信息来源于中国行政区域经纬度信息表等多个网络数据源。本实施例通过对多个数据库信息的融合,进行IP基本信息的综合完善,构建用户信息数据库。该用户信息数据库中的信息包括IP地址、以及IP地址所属国家、所属省市、经度、纬度、服务,其中,服务包括数据中心、内容分发网络(Content Delivery Network,简称为CDN)、云服务、教育单位、互联网公司等维度;
步骤S202,根据用户的IP地址和用户信息数据库,获取该用户的用户信息,其中,该用户信息包括该IP地址的服务字段,该IP地址在第一单位时间内的访问量和第二单位时间内的活跃时长,具体地,服务字段为IP地址的标识,访问量为页面浏览量,用户每一次对网络平台中的每个网页访问均被记录一次,且用户对同一页面的多次访问可以进行访问量累计,活跃时长为用户在网络平台的在线总时长,本实施例中的第一单位时间可以为“小时”,第二单位时间可以为“一天”;
步骤S203,根据该服务字段、访问量和活跃时长,判断该用户在第二单位时间的角色为人类或者非人类,根据角色判断的判断结果获取该用户的角色值。本实施例中用户的角色包括人类和非人类两种,具体地,人类为正常访问的用户,非人类为“网络机器人”,可以模仿正常人类进行网页浏览、社区互动、文件下载等访问行为,且通常为对网络平台的恶意访问,会对网络平台的信息安全造成威胁。人类与非人类在进行网页访问的过程中,访问量和活跃时长存在很大差异,在用户信息数据库中,也会对人类或者非人类的IP地址进行标识,因此,可以通过服务字段、访问量和活跃时长,对网络用户的角色进行区分,并获取用户的角色值,本实施例中的角色值是指在第二单位时间内用户的角色为人类或者非人类,可以通过数字对用户的角色进行区分,例如,人类的角色值可以设置为0,非人类的角色值可以设置为1,在本实施例中的第二单位时间为“一天”的情况下,可以确定与IP地址对应的用户在某一天的角色。
通过上述步骤S201至步骤S203,本实施例集合多种数据库和经纬度信息形成用户信息数据库,基于该用户信息数据库,对用户角色进行识别,解决了通过网络的日志数据对用户角色进行分析,由于判断因素单一造成的准确度较低的问题,提高了对用户角色识别的准确度,为网络平台的信息安全提供判断依据。
在其中一些实施例中,根据服务字段、访问量和活跃时长,判断用户的角色为人类或者非人类包括:在该用户信息满足角色判断条件之一的情况下,判定该用户为人类,其中,该角色判断条件包括:1、用户信息数据库中不存在该IP地址的服务字段;2、该访问量小于访问阈值;3、该活跃时长小于预设时长阈值。本实施例中的访问阈值和预设时长阈值可以根据经验进行设置。进一步地,对用户角色进行判断的过程中,可以按照角色判断条件的顺序进行判断,例如,在按照条件1判断用户的角色为人类的情况下,不必再进行条件2和条件3的判断,再例如,按照条件1判断用户的角色为非人类,在按照条件2判断用户的角色为人类的情况下,不必再进行条件3的判断,又例如,按照条件1和条件2均判断用户的角色为非人类的情况下,按照条件3进行判断,在根据条件3判断用户的角色为人类的情况下,则该用户的最终判断结果为人类,在根据条件3判断用户的角色为非人类的情况下,则该用户的最终判断结果为非人类。需要说明的是,在其他实施例中,也可以对三个判断条件均进行判断,根据所有的判断结果对用户角色进行综合判定,例如,在根据条件1判断用户的角色为人类的情况下,仍然进行条件2和条件3的判断,在三个判断条件中有两个判断条件的结果为人类的情况下,认为用户的角色为人类,或者,在三个判断条件的结果均为人类的情况下,认为用户的角色为人类。本实施例通过包括服务字段、访问量和活跃时长的三个判断条件对用户的角色进行判断,提高对用户角色识别的准确度。
在其中一些实施例中,根据用户的IP地址和用户信息数据库,获取该用户的用户信息包括:将IP地址与用户信息数据库进行对比,获取该IP地址的服务字段,根据IP地址的日志数据计算访问量和活跃时长。
具体地,在第二单位时间为“一天”的情况下,与IP地址对应的用户角色值的计算过程为,输入IP地址a,时间t,日志数据和用户信息数据库,本实施例中用户在第t天的角色值以daily_role_value表示,数字0表示人类,数字1表示非人类。对服务字段进行判断的具体过程为,将IP地址a与用户信息数据库中的信息数据的服务字段进行对比,在服务字段不为空的情况下,daily_role_value=1,认为用户的角色为非人类,对应地,角色值为1,在该服务字段为空的情况下,daily_role_value=0,认为用户的角色为人类,角色值为0;对访问量进行判断的具体过程为,在第一单位时间为“小时”的情况下,根据IP地址a在第t天的日志数据,计算每小时的访问量,在该小时内的最大访问量超过访问阈值的情况下,daily_role_value=1,在最大访问量没有超过访问阈值的情况下,daily_role_value=0;对活跃时长进行判断的具体过程为,根据IP地址a在第t天的日志数据,在当日的活跃时长超过预设时长阈值的条件下,判定daily_role_value=1,在当日的活跃时长没有超过预设时长阈值的条件下,判定daily_role_value=0。
由于非人类的用户角色具有高频性,所以在每个小时内对网络平台的访问量会远远大于人类用户的访问量,由于非人类用户角色具有连续性和持久性,所以非人类的用户在一天中的活跃时长会远远大于人类用户的活跃时长,本实施例中的访问阈值和预设时长阈值可以根据人类用户的实际数据进行设置,以提高对用户角色进行识别的准确度。
在其中一些实施例中,图3是根据本申请实施例的另一种网络用户角色识别的方法的流程图,如图3所示,该流程包括如下步骤:
步骤S301,获取预设时间段内用户的多个角色值。在IP地址对应的用户同时具有两种角色的情况下,仅判断该IP地址在第二单位时间内的角色,例如,仅根据IP地址在某一天的角色判断该IP地址的角色,是不够准确的,因此,本实施例中引入时间窗,多个时间窗组成预设时间段,基于对预设时间段内用户的多个角色值,对IP地址的角色进行判断。其中,时间窗是一个窗口大小可变的、动态滑动的时间段,可以在该时间段内对数据进行处理,本实施例中的数据为IP地址的用户信息和角色;
步骤S302,根据多个角色值与权重参数计算该用户的修正角色值,其中,该权重参数与角色值对应,且权重参数的大小与时间间隔成反比,该时间间隔根据计算每个角色值的时间与计算该修正角色值的时间之差确定。具体地,计算每个角色值的时间为根据服务字段、访问量和活跃时长判断用户角色而获取到角色值的时间,计算该修正角色值的时间为当前时间,时间间隔越久,权重参数的值越小。例如,在预设时间段包括T个时间窗的情况下,计算用户处于当前窗口的角色值依赖于该用户近T个时间窗内每一天的角色值,越接近当前窗口的角色值,时间间隔越小,权重参数的值越大,随着时间推移,用户每一天的角色值也会发生动态变化,因此可以通过预设时间段内的多个角色值,越来越准确地识别该用户的角色;
步骤S303,根据该修正角色值与角色判断阈值的对比结果,判断该用户的角色为人类或者非人类,本实施例中,修正角色值可以为非人类访问行为的概率或者人类访问行为的概率,角色判断阈值可以根据经验进行设置。
通过上述步骤S301至步骤S303,基于用户信息数据库得到用户的用户信息,结合IP地址的服务字段,用户的访问量和活跃时长,计算与IP地址对应的用户的角色值,统计分析预设时间段内用户的角色值情况,引入可滑动的时间窗,得到修正角色值,根据修正角色值与角色判断阈值的对比结果,识别用户的角色,进一步提高对用户角色进行识别的准确度。
在其中一些实施例中,根据修正角色值与角色判断阈值的对比结果,判断用户的角色为人类或者非人类包括:在该修正角色值大于角色判断阈值的情况下,判定该用户为人类,或者,在修正角色值小于或者等于角色判断阈值的情况下,判定该用户为非人类。本实施例中,修正角色值表示非人类访问行为的概率,在设定daily_role_valuet(x)表示用户x在第t天的修正角色值的情况下,daily_role_valuet(x)的值可以根据如下公式1得到:
在公式1中,t为当前日期,T为滑动时间窗口大小,daily_role_valuei(x)为用户x在第i天的修正角色值,取值为0或者1,0表示人类,1表示非人类。
在只识别两类用户的情况下,用户角色值只有0或者1,在用户的角色有其他类别的情况下,还可以设置其他角色值。根据概率统计经验,可以将daily_role_valuet(x)分为两段,以0.5作为角色判断阈值,在修正角色值大于或者等于0.5的情况下,判定该用户为非人类,在修正角色值小于0.5的情况下,判定该用户为人类。本实施例中,通过获取非人类访问行为的概率,根据经验设置的角色判断阈值,使得对用户角色的识别度更加精确。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例还提供了一种网络用户角色识别的***,该***用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是根据本申请实施例的网络用户角色识别的***的结构框图,如图4所示,该***包括数据库模块41、用户信息获取模块42和判断模块43:
数据库模块41,用于根据IP地址数据库和经纬度信息构建用户信息数据库;用户信息获取模块42,用于根据用户的IP地址和该用户信息数据库,获取该用户的用户信息,其中,该用户信息包括该IP地址的服务字段,该IP地址在第一单位时间内的访问量和第二单位时间内的活跃时长;判断模块43,用于根据该服务字段、该访问量和该活跃时长,判断该用户在第二单位时间的角色为人类或者非人类,根据角色判断的判断结果获取该用户的角色值。本实施例通过数据库模块41集合多种数据库和经纬度信息形成用户信息数据库,基于该用户信息数据库,判断模块43通过用户信息获取模块42获取用户信息,并对用户角色进行识别,解决了通过网络的日志数据对用户角色进行分析,由于判断因素单一造成的准确度较低的问题,提高了对用户角色识别的准确度,为网络平台的信息安全提供判断依据。
在其中一些实施例中,判断模块43还用于在该用户信息满足角色判断条件之一的情况下,判定该用户为人类,其中,该角色判断条件包括:1、用户信息数据库中不存在该IP地址的服务字段;2、该访问量小于访问阈值;3、该活跃时长小于预设时长阈值。其中,访问阈值和预设时长阈值可以根据经验进行设置。本实施例通过包括服务字段、访问量和活跃时长的三个判断条件对用户的角色进行判断,提高对用户角色识别的准确度。
在其中一些实施例中,考虑到IP地址访问的动态性,不能片面的根据某一天或者几天的数据判断该IP地址的角色,在一些IP地址同时具有两种访问角色的情况下,需要引入非人类访问行为概率来进行角色判断,因此,图5是根据本申请实施例的另一种网络用户角色识别的***的结构框图,如图5所示,该***还包括修正模块51:修正模块51,用于获取预设时间段内该用户的多个该角色值,根据多个角色值与权重参数计算该用户的修正角色值,其中,权重参数与角色值对应,该权重参数的大小与时间间隔成反比,时间间隔根据计算每个该角色值的时间与计算该修正角色值的时间之差确定,根据该修正角色值与角色判断阈值的对比结果,判断该用户的角色为人类或者非人类。本实施例中的修正角色值可以为非人类访问行为概率,通过修正模块51引入可滑动的时间窗,基于用户信息数据库得到用户的用户信息,结合IP地址的服务字段,用户的访问量和活跃时长,计算与IP地址对应的用户的角色值,统计分析预设时间段内用户的角色值情况,得到修正角色值,根据修正角色值与角色判断阈值的对比结果,识别用户的角色,进一步提高对用户角色进行识别的准确度。
考虑到网络日志数据规模较大,本申请中的各个实施例可以采用分布式存储***hadoop,分布式计算框架spark等分布式处理技术实现。本申请中的实施例以日志数据为基础,通过建立用户信息数据库,计算与IP地址对应的用户的角色值,在此基础上引入可滑动的时间窗,将时间的变化动态地融入对用户角色的识别,建立了基于时间窗的网络用户角色识别的***,可以在全部的网络平台的流量中识别出用户的非人类访问行为,并标注出用户的角色为人类或者非人类,为网络平台访问流量的控制提供有力的数据支持。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
本实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,根据IP地址数据库和经纬度信息构建用户信息数据库。
S2,根据用户的IP地址和用户信息数据库,获取该用户的用户信息,其中,该用户信息包括该IP地址的服务字段。
S3,根据该服务字段、访问量和活跃时长,判断该用户在第二单位时间的角色为人类或者非人类,根据角色判断的判断结果获取该用户的角色值。
需要说明的是,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
另外,结合上述实施例中的网络用户角色识别的方法,本申请实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种网络用户角色识别的方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种网络用户角色识别的方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,图6是根据本申请实施例的电子设备的内部结构示意图,如图6所示,提供了一种电子设备,该电子设备可以是服务器,其内部结构图可以如图6所示。该电子设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该电子设备的数据库用于存储数据。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种网络用户角色识别的方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域的技术人员应该明白,以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (8)
1.一种网络用户角色识别的方法,其特征在于,所述方法包括:
根据IP地址数据库和经纬度信息构建用户信息数据库;
根据用户的IP地址和所述用户信息数据库,获取所述用户的用户信息,其中,所述用户信息包括所述IP地址的服务字段,所述IP地址在第一单位时间内的访问量和第二单位时间内的活跃时长;
根据所述服务字段、所述访问量和所述活跃时长,判断所述用户在所述第二单位时间的角色为人类或者非人类,根据角色判断的判断结果获取所述用户的角色值;
在所述判断所述用户在所述第二单位时间的角色为人类或者非人类之后,所述方法还包括:
获取预设时间段内所述用户的多个所述角色值;
根据多个所述角色值与权重参数计算所述用户的修正角色值,其中,所述权重参数与所述角色值对应,所述权重参数的大小与时间间隔成反比,所述时间间隔根据计算每个所述角色值的时间与计算所述修正角色值的时间之差确定;
根据所述修正角色值与角色判断阈值的对比结果,判断所述用户的角色为人类或者非人类。
2.根据权利要求1所述的方法,其特征在于,所述根据所述服务字段、所述访问量和所述活跃时长,判断所述用户在所述第二单位时间的角色为人类或者非人类包括:
在所述用户信息满足角色判断条件之一的情况下,判定所述用户为人类,其中,所述角色判断条件包括:所述用户信息数据库中不存在所述IP地址的服务字段,或者,所述访问量小于访问阈值,或者,所述活跃时长小于预设时长阈值。
3.根据权利要求1所述的方法,其特征在于,所述根据用户的IP地址和所述用户信息数据库,获取所述用户的用户信息包括:
将所述IP地址与所述用户信息数据库进行对比,获取所述IP地址的服务字段,根据所述IP地址的日志数据计算所述访问量和所述活跃时长。
4.根据权利要求1所述的方法,其特征在于,所述根据所述修正角色值与角色判断阈值的对比结果,判断所述用户的角色为人类或者非人类包括:
在所述修正角色值大于角色判断阈值的情况下,判定所述用户为人类,或者,
在所述修正角色值小于或者等于所述角色判断阈值的情况下,判定所述用户为非人类。
5.一种网络用户角色识别的***,其特征在于,所述***包括:数据库模块、用户信息获取模块、判断模块和修正模块:
所述数据库模块,用于根据IP地址数据库和经纬度信息构建用户信息数据库;
所述用户信息获取模块,用于根据用户的IP地址和所述用户信息数据库,获取所述用户的用户信息,其中,所述用户信息包括所述IP地址的服务字段,所述IP地址在第一单位时间内的访问量和第二单位时间内的活跃时长;
所述判断模块,用于根据所述服务字段、所述访问量和所述活跃时长,判断所述用户在所述第二单位时间的角色为人类或者非人类,根据角色判断的判断结果获取所述用户的角色值;
所述修正模块,用于获取预设时间段内所述用户的多个所述角色值,根据多个所述角色值与权重参数计算所述用户的修正角色值,其中,所述权重参数与所述角色值对应,所述权重参数的大小与时间间隔成反比,所述时间间隔根据计算每个所述角色值的时间与计算所述修正角色值的时间之差确定,根据所述修正角色值与角色判断阈值的对比结果,判断所述用户的角色为人类或者非人类。
6.根据权利要求5所述的***,其特征在于,所述判断模块还用于在所述用户信息满足角色判断条件之一的情况下,判定所述用户为人类,其中,所述角色判断条件包括:所述用户信息数据库中不存在所述IP地址的服务字段,或者,所述访问量小于访问阈值,或者,所述活跃时长小于预设时长阈值。
7.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至4中任一项所述的网络用户角色识别的方法。
8.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行权利要求1至4中任一项所述的网络用户角色识别的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010729579.0A CN112019377B (zh) | 2020-07-27 | 2020-07-27 | 网络用户角色识别的方法、***、电子装置和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010729579.0A CN112019377B (zh) | 2020-07-27 | 2020-07-27 | 网络用户角色识别的方法、***、电子装置和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112019377A CN112019377A (zh) | 2020-12-01 |
CN112019377B true CN112019377B (zh) | 2023-04-07 |
Family
ID=73498893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010729579.0A Active CN112019377B (zh) | 2020-07-27 | 2020-07-27 | 网络用户角色识别的方法、***、电子装置和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112019377B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112751835B (zh) * | 2020-12-23 | 2023-05-02 | 石溪信息科技(上海)有限公司 | 一种流量预警方法、***、设备和存储介质 |
CN115378827A (zh) * | 2022-08-04 | 2022-11-22 | 银联智惠信息服务(上海)有限公司 | 互联网协议地址分析方法及装置、服务器、存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110971569A (zh) * | 2018-09-29 | 2020-04-07 | 北京奇虎科技有限公司 | 网络访问权限管理方法、装置及计算设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109995732A (zh) * | 2017-12-30 | 2019-07-09 | ***通信集团安徽有限公司 | 网站安全访问监控方法、装置、设备及介质 |
US10637867B2 (en) * | 2018-01-19 | 2020-04-28 | Bank Of America Corporation | System for dynamic role-based evaluation of access and permissions |
CN111224920B (zh) * | 2018-11-23 | 2021-04-20 | 珠海格力电器股份有限公司 | 一种防止非法登录的方法、装置、设备及计算机存储介质 |
CN110609937B (zh) * | 2019-08-15 | 2024-07-19 | 平安科技(深圳)有限公司 | 一种爬虫识别方法及装置 |
-
2020
- 2020-07-27 CN CN202010729579.0A patent/CN112019377B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110971569A (zh) * | 2018-09-29 | 2020-04-07 | 北京奇虎科技有限公司 | 网络访问权限管理方法、装置及计算设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112019377A (zh) | 2020-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9954886B2 (en) | Method and apparatus for detecting website security | |
CN110417778B (zh) | 访问请求的处理方法和装置 | |
CN113489713B (zh) | 网络攻击的检测方法、装置、设备及存储介质 | |
US10097654B2 (en) | Identifying users of client devices for tracking user interactions with content distributed by content provider systems | |
CN110609937A (zh) | 一种爬虫识别方法及装置 | |
CN109495467B (zh) | 拦截规则的更新方法、设备及计算机可读存储介质 | |
CN112019377B (zh) | 网络用户角色识别的方法、***、电子装置和存储介质 | |
CN114095567B (zh) | 数据访问请求的处理方法、装置、计算机设备及介质 | |
CN109547426B (zh) | 业务响应方法及服务器 | |
CN109413153B (zh) | 数据爬取方法、装置、计算机设备和存储介质 | |
CN107948199B (zh) | 一种对终端共享接入进行快速检测的方法及装置 | |
WO2019114246A1 (zh) | 一种身份认证方法、服务器及客户端设备 | |
CN113469736A (zh) | 资源分发控制方法、装置、***、电子设备及存储介质 | |
CN108804501B (zh) | 一种检测有效信息的方法及装置 | |
CN109688099B (zh) | 服务器端撞库识别方法、装置、设备及可读存储介质 | |
CN111131236A (zh) | 一种web指纹检测装置、方法、设备及介质 | |
CN117093627A (zh) | 信息挖掘的方法、装置、电子设备和存储介质 | |
US9723017B1 (en) | Method, apparatus and computer program product for detecting risky communications | |
CN107995167B (zh) | 一种设备识别方法及服务器 | |
CN113709136B (zh) | 一种访问请求验证方法和装置 | |
CN115470399A (zh) | 一种基于大数据的id打通方法、装置、设备和存储介质 | |
CN110572417B (zh) | 用于提供登录票据的方法、装置、服务器以及存储介质 | |
CN107592322B (zh) | 网址拦截方法及装置 | |
CN113079157A (zh) | 获取网络攻击者位置的方法、装置、电子设备 | |
CN116094847B (zh) | 蜜罐识别方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |