CN101355504A - 一种用户行为的确定方法和装置 - Google Patents

一种用户行为的确定方法和装置 Download PDF

Info

Publication number
CN101355504A
CN101355504A CNA2008101470634A CN200810147063A CN101355504A CN 101355504 A CN101355504 A CN 101355504A CN A2008101470634 A CNA2008101470634 A CN A2008101470634A CN 200810147063 A CN200810147063 A CN 200810147063A CN 101355504 A CN101355504 A CN 101355504A
Authority
CN
China
Prior art keywords
data
user
network
user behavior
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008101470634A
Other languages
English (en)
Other versions
CN101355504B (zh
Inventor
秦志光
刘璇
王娟
何兴高
张凤荔
傅翀
汪敦全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Digital Technologies Chengdu Co Ltd
Original Assignee
Huawei Symantec Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Symantec Technologies Co Ltd filed Critical Huawei Symantec Technologies Co Ltd
Priority to CN2008101470634A priority Critical patent/CN101355504B/zh
Publication of CN101355504A publication Critical patent/CN101355504A/zh
Application granted granted Critical
Publication of CN101355504B publication Critical patent/CN101355504B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例公开了一种用户行为确定的方法,包括以下步骤:根据网络流量数据和安全事件日志数据建立用户行为数据库;将所述用户行为数据库中各用户进行聚类,根据聚类结果确定各用户的网络行为模式。本发明的实施例中,通过建立用户行为数据库并将所述用户行为数据库中各用户进行聚类,确定了各用户的网络行为模式,从宏观角度有效的反应了用户网络行为。

Description

一种用户行为的确定方法和装置
技术领域
本发明涉及网络信息安全技术,特别涉及一种用户行为的确定方法和装置。
背景技术
计算机网络对人类经济和生活的冲击是其它信息载体所无法比拟的,计算机网络高速发展和全方位渗透,推动了整个社会的信息化进程,特别是Internet(国际互联网)已经从早期的小规模局域性互联网,发展成为一个全球性信息服务平台,网络技术被广泛应用于社会生活的各个领域,极大地促进了经济的繁荣和社会的进步,显示出越来越强大的生命力。然而,网络的这些特点也不可避免地造成了***的脆弱性,使用户及网络信息本身面临着严重的安全问题。攻击事件层出不穷,病毒发作此起彼伏,甚至利用互联网实施的违法犯罪活动也逐渐增多。为了更好地去监管人们的上网行为,抵御黑客攻击,进行用户行为分析势在必行。
现有的网络信息安全技术,如防火墙、入侵检测、安全路由、身份认证等,大多将主要精力集中在设备的某一方面的异常,而未从用户行为的设计挖掘和表示方法角度分析网络所遭受的攻击,且通常不预测下一时间异常。
现有技术提供了一种用户行为异常检测***和方法,该***由控制模块、数据获取和预处理模块、学***台上的shell命令作为训练数据和审计数据,在对数据进行预处理后,利用机器学习模型建立计算机网络***中关键合法用户的正常行为轮廓,在检测中通过比较关键合法用户的当前行为与其正常行为轮廓来识别异常行为,即是否发生入侵,以便引起网络管理员的注意,采取措施保证安全;如果该用户的当前行为较大程度偏离了其历史上的正常行为轮廓,即认为发生了异常,具体原因可能是关键合法用户进行了非授权操作,或是外部入侵者冒用关键合法用户的帐户进行了非法操作。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
现有的网络信息安全技术,只从单一用户行为出发,未从宏观角度把握用户行为。
发明内容
本发明实施例提供了一种用户行为的确定方法和装置,以确定用户的网络行为模式。
本发明实施例提供了一种用户行为的确定方法,包括以下步骤:
根据网络流量数据和安全事件日志数据建立用户行为数据库;
将所述用户行为数据库中各用户进行聚类,根据聚类结果确定所述各用户的网络行为模式。
本发明还提供了一种用户行为确定装置,包括:
数据库建立单元,用于根据所述网络流量数据和所述安全事件日志数据建立用户行为数据库;
行为模式确定单元,用于将所述数据库建立单元建立的用户行为数据库中各用户进行聚类,根据聚类结果确定所述各用户的网络行为模式。
本发明的实施例中,通过建立用户行为数据库并将用户行为数据库中各用户进行聚类,确定了各用户的网络行为模式,从宏观角度有效的反应了用户网络行为。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种用户行为确定的方法流程图;
图2为本发明实施例中一种用户行为确定的方法流程图;
图3为本发明实施例中采集网络流量数据和安全事件日志数据数据表表间关系图;
图4为本发明实施例的预测用户的网络行为模式方法流程图;
图5为本发明实施例中生成用户行为预测模型的方法流程图;
图6为本发明实施例中一种用户行为确定装置结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种用户行为的确定方法,通过建立用户行为数据库并将用户行为数据库中各用户进行聚类,确定了各用户的网络行为模式,从宏观角度有效的反应了用户网络行为。所述方法如图1所示,包括以下步骤:
步骤101,根据网络流量数据和安全事件日志数据建立用户行为数据库;
步骤102,将所述用户行为数据库中各用户进行聚类,根据聚类结果确定所述各用户的网络行为模式。
下面结合具体的实施例对用户行为确定的具体方法进行详细说明。
本发明实施例提供了一种用户行为的确定方法,所述方法如图2所示,包括以下步骤:
步骤201,采集网络流量数据和安全时间日志数据。
NetFlow(网络流量)以流作为数据统计的采集单位,网络的流(Flow)是一个特定来源和目的端的单向数据报文序列,是来源IP、目地IP、来源Port、目地Port和传输协议5个属性相同的报文整合成一个流。NetFlow协议的核心是对流缓存进行组织、管理,最终可提供遵循某种汇聚方法而得到流的统计数据。其工作原理就是由路由器、交换机或其它任何支持NetFlow的软硬件维持一个保存流的统计数据的缓存,每一个活动的流在缓存中都占有一项记录。当一个不同于现有记录特征的数据包进入缓存时,自动为这一数据包在缓存中开辟新的流记录。后续进入缓存的数据包,如果和已有的记录具有相同特征,其统计信息就会加到相应的记录中去。NetFlow会不停地刷新缓存,将遵循某种汇聚方法的记录移出缓存,然后将所有被移出的记录聚合到UDP包中,发送给网络上指定的接收者。
NetFlow协议目前包括多个版本,版本之间差异主要表现在对流采用的汇聚方法不同。以网络安全监控为目的而部署NetFlow要求获得流的较多细节,常采用NetFlow V5。此版本所采集到的流量数据可以支持不同对象的统计分析,即支持对源IP、目的IP、源端口、目的端口等的统计分析。从NetFlow原始记录中提取以下8个关键域定义:源IP地址(Source IPaddress);目的IP地址(Destination IP address);源端口号(Source PortNumber);目的端口号(Destination Port Number);协议类型(Layer 3protocol type);流内数据包数量(Packets);数据流的大小(Octets);数据流结束时间(Time);
针对安全事件日志,提取以下几个关键域定义:1)安全事件时间:事件记录的时间;2)IP地址:***的本地IP;3)安全事件类型:通过正则表达式从日志记录中提取关键字后判断得出的事件类型;4)安全事件等级:日志里面就存在的字段;5)关联IP地址:日志记录中可能存在的发起攻击的IP或相关牵涉到的事件IP地址。
步骤202,对采集的数据进行汇总得到用户行为数据库。
将采集的关键域定义数据存入数据库,对存入数据库的数据进行数据的汇总,建立用户在一定时间粒度下的行为数据库,描述时间数据的最小时间单位称为时间粒度。
基本的时间粒度是通过数据的采集时间间隔所确定的,根据汇总分析的要求,不同的时间粒度都是基本时间粒度的倍数作为统计对象。统计对象包括源IP、数据包字节数、数据流目的子网、数据包数量、源端口、目的端口、安全事件等。本发明实施例中,以采集的用户IP数据为基本统计对象,统计一定时间粒度下用户的行为特征值,汇总对象主要有:1)数据包字节数;2)数据包数量;3)数据流目的子网个数;4)数据流来源子网个数;5)源端口个数;6)目的端口个数;7)目的IP个数;8)各协议所占总流量比例;9)各源端口所占总流量比例;10)各目的端口所占总流量比例;11)各安全事件类型所占总流量比例。在汇总对象8)-11)中,由于原始数据中个数很多,采取TOPN分析的方法,即只提取前N个对象汇总后的数值,以减少***处理的开销。1)-7)称为单值汇总数据;8)-11)称为多值汇总数据。
汇总一定时间粒度下用户的行为特征值,建立了用户在一定时间粒度下的行为数据库,每条记录由P个属性构成{X1,X2,...,Xp}。X1:数据包字节数;X2:数据包数量;X3:数据流目的子网个数;X4:数据流来源子网个数;X5:源端口个数;X6:目的端口个数;X7:目的IP个数;{X8,X9...Xm}:前N个协议所占总流量比例;{Xm+1,Xm+2...Xn}:前N个源端口所占总流量比例;{Xn+1,Xn+2...Xq}:前N个目的端口所占总流量比例;{Xq+1,Xq+2...Xp}:前N个安全事件类型所占总流量比例。
采集网络流量数据和安全事件日志数据数据表表间关系如图3所示:1)NetFlow server接收NetFlow信息,Log server接收日志信息,将数据存入数据库,形成基础数据表,分别为:NetFlow数据源表301、安全事件日志表302;2)在基础数据表NetFlow数据源表的基础上,对流量进行初步汇总,形成NetFlow的子网和端口统计数目表303、NetFlow的基础汇总表304;3)在共同汇总NetFlow数据源表301、安全事件日志表302的基础上得出:NetFlow的TOPN统计表305;TOPN分析的对象,具体包含:协议、源端口、目的端口、安全事件。其中,NetFlow的子网和端口统计数目表303、NetFlow的基础汇总表304和TOPN统计表305共同构成用户行为数据库。
步骤203,将用户行为数据库中各用户根据各种网络行为类型所占比例进行聚类,从而确定各用户的网络行为模式。
为了研究和比较观测得到的网络用户行为,确定用户行为,在聚类算法中引入用户行为距离概念。为观测数据相似性指标提供了基本的识别同组数据(网络用户行为)的信息。
用户行为距离公式如下:
d ( U 1 , U 2 ) = ( X 1 - X 1 ′ ) 2 + ( X 2 - X 2 ′ ) 2 + . . . + ( X p - X p ′ ) 2
d(U1,U2)为用户行为距离,U1和U2分别为某用户行为模式样本点和已确定行为模式样本点间,其中U1={X1,X2,...,Xp},U2={X′1,X′2,...,X′p};X为用户属性数据。
计算新输入数据点与已存在样本的距离,生成距离信息{d1,d2,...,dn},从中选择最小值作为dmin:dmin=min{d1,d2,...,dn};
在距离信息{d1,d2,...,dn}中选择所有d≤D,并从样本点分布空间中,选择半径为D的超球体内的所有样本点的行为模式;
其中D=ndmin:dmin为输入数据点与最近样本点的距离;n为系数,n的选取为***效率与结果正确性的折中。
将最多样本点的行为模式类型作为输入数据的行为模式类型。
针对单值汇总数据(数据包字节数、数据包数量、数据流目的子网个数、数据流来源子网个数、源端口个数、目的端口个数、目的IP个数),其汇总结果就为统计结果。单值汇总数据的用户行为计算值为
A 1 = Σ i = 1 i = 7 ( X i - X i , ) 2 .
针对多值汇总数据(前N个协议所占总流量比例、前N个源端口所占总流量比例、前N个目的端口所占总流量比例、前N个安全事件类型所占总流量比例),以前N个协议所占总流量比例{X8,X9...Xm}为例,Xl是某网络协议Pl的汇总流量XlFlow占总流量TotalFlow的比例,即:
Xl=(Xl/TotalFlow)*100%
{P8,P9,...,Pm}为 { X 8 , X 9 . . . X m } ⊆ U 1 各自对应的协议,{P′8,P′9...,P′m}为 { X 8 ′ , X 9 ′ . . . X m ′ } ⊆ U 2 各自对应的协议。设 ∀ P l ∈ { P 8 , P 9 . . . , P m } ∪ { P 8 ′ , P 9 ′ . . . , P m ′ } , 针对Pl计算用户行为距离Bl时,规定如下:
若Pl∈{P8,P9...,Pm}且Pl∈{P′8,P′9...,P′m},则计算Bl=(Xl-X′l)2
P l ∉ { P 8 , P 9 . . . , P m } 且Pl∈{P′8,P′9...,P′m},则计算Bl=(X′l-O)2
若Pl∈{P8,P9...,Pm}且 P l ∉ { P 8 ′ , P 9 ′ . . . , P m ′ } , 则计算Bl=(Xl-O)2
设{P8,P9...,Pm}∪{P′8,P′9...,P′m}个数为k,则根据以上规定,针对协议的用户行为计算值 A 2 = Σ i = 1 i = k B i .
针对其他多值汇总数据的与协议的用户行为计算方法类同,设源端口、目的端口、安全事件的用户行为计算值分别为A3、A4、A5,则用户行为距离公式如下:
d ( U 1 , U 2 ) = Σ i = 1 i = 5 A i
其中,d(U1,U2)为用户行为距离。U1、U2的相似度与d(U1,U2)成反比,d(U1,U2)越小,U1、U2的相似度越大;d(U1,U2)越大,U1、U2的相似度越小。从而可根据计算某用户行为模式样本点与已确定行为模式样本点间的用户行为距离,推断某用户样本点所属网络行为模式,
步骤204,预测各用户未来一定时间内的网络行为模式。
本发明实施例中应用RBF神经网路对用户行为进行预测,结合当前一定时间粒度下用户的网络行为类型数据,寻找出时间序列中前N个用户行为与随后M个用户行为的映射关系,计算未来一定时间粒度下用户的网络行为类型,从而预测用户的网络行为模式。
RBF网是一种前馈神经网络,一般分为三层结构(如图7):一个n-h-m结构的RBF网,即网络具有n个输入,h个隐节点,m个输出。其中x=(x1,x2...,xn)T∈Rn为网络输入矢量,ci(i=1,2...h)为隐节点数据中心,W∈Rh×m为输出权矩阵,b0,...bm为输出单元偏移,y=[y1,...,ym]T为网络输出,Φi(*)为第i个隐节点的激活函数。RBF网络构成的基本思想是:用RBF作为隐单元的“基”构成隐含层空间,这样就可以将输入矢量直接映射到隐含层空间。当RBF的中心确定后,这种映射关系也就确定了。隐含层到输出层的映射是线性的,即网络的输出就是隐含层节点数据的线性加权和。从总体上看,网络由输入到输出的映射是非线性的,而网络输出对可调节参数而言又是线性的。这样网络的权值就可以由线性方程组直接解出或用最小二乘递推法(RLS)递推计算。
应用预测算法预测用户未来一定时间内的网络行为模式。对用户行为数据进行统计分析,确定用户在不同时间粒度下各种网络行为类型数据的基础上,结合当前一定时间粒度下用户的网络行为类型数据,计算未来一定时间粒度下用户的网络行为类型数据,从而预测用户的网络行为模式,预测的具体步骤如图4所示:
步骤401,进行初始化工作。从数据库中调出相应的训练样本,将训练样本转换为一系列N维向量的形式,为生成预测模型做好准备,
步骤402,生成预测模型。开始训练样本数据,以从中分析其发展变化规律,进而寻找出时间序列中前N个用户行为与随后M个用户行为的映射关系,由此拟合出用户网络行为关于时间的函数,即生成用户行为预测模型。其具体流程如图5所示:
步骤501,初始化聚类中心。令k为迭代次数,并初始化k=1,根据初始化训练样本X={X1,X2...,Xn}计算数据中心,记为C1 l,其中Ck l为第l第k类的中心向量;
步骤502,在数据样本中寻找具有最远距离的点。设某点i与各类中心距离和为A(i),且与其所在类的中心距离为B(i),则令Rk=Xi,i∈{i|max(A(i)×B(i)),i=1,...,n};
步骤503,将最远距离点从它所在的类中排出,并使之成为一个新的聚类中心。将Rk从其所在类中排出,重新计算该类的中心,并设其新中心为(Cj)′;
令k=k+1,即将聚类数目加1,置该层的初始中心为(Rk-1,Cl k-1,...,(Cj)′,...Ck-l k-1);
步骤504,根据各点到各中心的距离进行分类。计算X中所有数据与中心的距离,并将其分别划分在离它们最近的中心所在类中;
步骤505,重新计算类的中心 C k = ( C 1 k , . . . , C k k ) ;
步骤506,判断Ck是否有变化。有,则转步骤504;否则继续执行下一步;
步骤507,计算所有类的方差 D k = ( D 1 k , . . . , D k k ) ;
步骤508,判断最远距离是否小于方差。设Rk与其所在类的距离为Dmax,而每个类的方差为Dmean,若Dmax<max(Dmean),则聚类完成,转步骤509,否则转步骤502;
步骤509,计算权值并生成预测模型。聚类结束后,各类的数据中心也相继确定,此时可通过最小二乘法求出各个权值并最终生成预测模型。
步骤403,对用户未来一定时间内的网络行为模式进行预测。采用RBF神经网络进行态势的预测,以将每个样本的前N个值作为RBF神经网络的输入,后M个值为目标输出。通过神经网络学习、训练,实现从输入空间RN到输出空间RM的映射,从而达到时间序列预测网络用户行为。RBF网是一种前馈神经网络,一般分为三层结构,如图5所示:一个n-h-m结构的RBF网,即网络具有n个输入,h个隐节点,m个输出。其中x=(x1,x2...,xn)T∈Rn为网络输入矢量,ci(i=1,2...h)为隐节点数据中心,W∈Rh×m为输出权矩阵,b0,...bm为输出单元偏移,y=[y1,...,ym]T为网络输出,Φi(*)为第i个隐节点的激活函数。
预测具体步骤如下:
获得一段历史网络用户行为数据x=(x1,x2...,xN);
网络输入n代表过去n个时间点的网络用户行为数据,网络输出m代表随后m个时间点的态势值;
将数据划分如下形式:
  输入   输出
  x1...xn   xn+1...xn+m
  x2...xn+1   xn+2...xn+m+1
  ......   ......
  xN-n+1...xN   xN+1...xN+m
将它们代入预测模型进行训练直到误差小于极小值ε。
模型训练结束,利用该模型进行未来时间点网络用户行为预测。
本发明实施例提供了一种用户行为确定装置,如图6所示,包括:数据库建立单元601,用于根据网络流量数据和安全事件日志数据建立用户行为数据库;行为模式确定单元602,用于将所述数据库建立单元601建立的用户行为数据库中各用户进行聚类,根据聚类结果确定所述各用户的网络行为模式。
其中,还包括:采集单元603,用于采集所述网络流量数据和所述安全事件日志数据,所述数据库建立单元601根据所述采集单元603采集的所述网络流量数据和所述安全事件日志数据建立所述用户行为数据库。
其中,还包括:预测单元604,用于根据所述行为模式确定单元602确定的各用户的网络行为模式预测所述各用户未来一定时间内的网络行为模式。
其中,所述数据库建立单元601包括:初步汇总子单元605,用于初步汇总所述网络流量数据,根据汇总结果构造网络流量数据子网和端口统计数目表以及网络流量数据基础汇总表;共同汇总子单元606,用于共同汇总所述网络流量数据和所述安全事件日志数据,根据汇总结果构造TOPN统计表;构造子单元607,用于根据所述初步汇总子单元605构造的网络流量数据子网和所述端口统计数目表、所述网络流量数据基础汇总表以及所述共同汇总子单元606构造的TOPN统计表构造所述用户行为数据库。
其中,所述预测单元604包括:样本准备子单元608,从所述用户行为数据库中调出各用户的样本数据;模型生成子单元609,对所述样本准备单元608得到的样本数据进行训练,生成用户行为预测模型;处理子单元610,根据所述模型生成子单元609得到的用户行为预测模型对所述各用户未来时间内的网络行为模式进行预测
本发明实施例主要通过对网络流量(主要是NetFlow)、安全事件日志的采集分析,设计出表示用户行为的数据结构及汇总模式,建立用户在一定时间粒度下的行为数据库;在用户行为数据库建立的基础上,通过关联规则、分类、聚类等数据挖掘算法,从宏观角度确定各个用户的网络行为模式;在确定当前用户行为模式的基础上,应用预测算法,预测用户未来一定时间粒度下的网络行为模式。在分析网络用户行为的问题提上,不只限于分析当前网络用户行为,而且在不同时间粒度下,对用户网络行为未来一定时间粒度下的网络行为模式进行预测。为及时掌控网络用户行为数据,实现对网络流量、安全事件日志的有效查询和统计方式,达到高效审计报告生成与可视化数据的目的。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (14)

1、一种用户行为确定的方法,其特征在于,包括以下步骤:
根据网络流量数据和安全事件日志数据建立用户行为数据库;
将所述用户行为数据库中各用户进行聚类,根据聚类结果确定所述各用户的网络行为模式。
2、如权利要求1所述的方法,其特征在于,所述根据网络流量数据和所述安全事件日志数据建立用户行为数据库之前,还包括:
采集所述网络流量数据和所述安全事件日志数据。
3、如权利要求2所述的方法,其特征在于,所述采集网络流量数据包括:
通过从网络流量数据源表中提取IP地址、目的IP地址、源端口号、目的端口号、协议类型、流内数据包数量、数据流的大小和数据流结束时间进行所述采集网络流量数据。
4、如权利要求2所述的方法,其特征在于,所述采集安全事件日志数据包括:
通过从安全事件日志表中提取安全事件时间、IP地址、安全事件类型、安全事件等级和关联IP地址进行所述采集安全事件日志数据。
5、如权利要求1所述的方法,其特征在于,所述根据网络流量数据和安全事件日志数据建立用户行为数据库包括:
初步汇总所述网络流量数据,根据汇总结果构造网络流量数据子网和端口统计数目表以及网络流量数据基础汇总表;
共同汇总所述网络流量数据和所述安全事件日志数据,根据汇总结果构造TOPN统计表;
根据所述网络流量数据子网和所述端口统计数目表、所述网络流量数据基础汇总表、所述TOPN统计表构造所述用户行为数据库。
6、如权利要求1所述的方法,其特征在于,所述将用户行为数据库中各用户进行聚类,根据聚类结果确定所述各用户的网络行为模式包括:
计算某用户行为模式样本点与已确定行为模式样本点间的用户行为距离;
根据计算得到的某用户行为模式样本点与已确定行为模式样本点间的用户行为距离确定所述各用户的网络行为模式。
7、如权利要求6所述的方法,其特征在于,所述用户行为距离的计算公式为:
d ( U 1 , U 2 ) = ( X 1 - X 1 ′ ) 2 + ( X 2 - X 2 ′ ) 2 + · · · + ( X p - X p ′ ) 2
其中,d(U1,U2)为用户行为距离,U1和U2分别为某用户行为模式样本点和已确定行为模式样本点间,U1=(X1,X2,...,Xp},U2=(X′1,X′2,...,X′p},X为用户属性数据。
8、如权利要求6所述的方法,其特征在于,所述根据聚类结果确定所述各用户的网络行为模式之后,还包括:
应用径向基函数RBF神经网络,结合所述各用户的网络行为模式预测所述各用户未来时间内的网络行为模式。
9、如权利要求8所述的方法,其特征在于,所述应用径向基函数RBF神经网络,结合所述各用户的网络行为模式预测所述各用户未来时间内的网络行为模式包括:
从所述用户行为数据库中调出所述各用户的样本数据;
对所述样本数据进行训练,生成用户行为预测模型;
根据所述用户行为预测模型对所述各用户未来时间内的网络行为模式进行预测。
10、一种用户行为确定装置,其特征在于,包括:
数据库建立单元,用于根据网络流量数据和安全事件日志数据建立用户行为数据库;
行为模式确定单元,用于将所述数据库建立单元建立的用户行为数据库中各用户进行聚类,根据聚类结果确定所述各用户的网络行为模式。
11、如权利要求10所述用户行为确定装置,其特征在于,所述数据库建立单元包括:
初步汇总子单元,用于初步汇总所述网络流量数据,根据汇总结果构造网络流量数据子网和端口统计数目表以及网络流量数据基础汇总表;
共同汇总子单元,用于共同汇总所述网络流量数据和所述安全事件日志数据,根据汇总结果构造TOPN统计表;
构造子单元,用于根据所述初步汇总子单元构造的网络流量数据子网和所述端口统计数目表、所述网络流量数据基础汇总表以及所述共同汇总子单元构造的TOPN统计表构造所述用户行为数据库。
12、如权利要求10所述用户行为确定装置,其特征在于,还包括:
采集单元,用于采集所述网络流量数据和所述安全事件日志数据。
13、如权利要求10所述用户行为确定装置,其特征在于,还包括:
预测单元,用于根据所述行为模式确定单元确定的各用户的网络行为模式预测各用户未来一定时间内的网络行为模式。
14、如权利要求13所述用户行为确定装置,其特征在于,所述预测单元包括:
样本准备子单元,从所述用户行为数据库中调出所述各用户的样本数据;
模型生成子单元,对所述样本准备单元得到的样本数据进行训练,生成用户行为预测模型;
处理子单元,根据所述模型生成子单元得到的用户行为预测模型对所述各用户未来时间内的网络行为模式进行预测。
CN2008101470634A 2008-08-14 2008-08-14 一种用户行为的确定方法和装置 Expired - Fee Related CN101355504B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008101470634A CN101355504B (zh) 2008-08-14 2008-08-14 一种用户行为的确定方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101470634A CN101355504B (zh) 2008-08-14 2008-08-14 一种用户行为的确定方法和装置

Publications (2)

Publication Number Publication Date
CN101355504A true CN101355504A (zh) 2009-01-28
CN101355504B CN101355504B (zh) 2012-08-08

Family

ID=40308104

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101470634A Expired - Fee Related CN101355504B (zh) 2008-08-14 2008-08-14 一种用户行为的确定方法和装置

Country Status (1)

Country Link
CN (1) CN101355504B (zh)

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102045357A (zh) * 2010-12-29 2011-05-04 深圳市永达电子股份有限公司 一种基于仿射聚类分析的入侵检测方法
CN101572629B (zh) * 2009-05-31 2011-08-31 腾讯科技(深圳)有限公司 一种ip数据的处理方法及装置
CN102289447A (zh) * 2011-06-16 2011-12-21 北京亿赞普网络技术有限公司 一种基于通讯网络报文的网站网页评价***
CN101702653B (zh) * 2009-10-27 2011-12-28 中国科学院声学研究所 一种基于用户行为定向的消息通告***及方法
CN102413013A (zh) * 2011-11-21 2012-04-11 北京神州绿盟信息安全科技股份有限公司 网络异常行为检测方法及装置
CN102724063A (zh) * 2012-05-11 2012-10-10 北京邮电大学 日志采集服务器及数据包分发、日志聚类方法及网络
CN102760138A (zh) * 2011-04-26 2012-10-31 北京百度网讯科技有限公司 用户网络行为的分类方法和装置及对应的搜索方法和装置
CN103109293A (zh) * 2012-08-24 2013-05-15 华为技术有限公司 一种用户行为处理***及方法
CN103269337A (zh) * 2013-04-27 2013-08-28 中国科学院信息工程研究所 数据处理方法及装置
CN103581355A (zh) * 2012-08-02 2014-02-12 北京千橡网景科技发展有限公司 用户行为异常处理方法和设备
CN103581120A (zh) * 2012-07-24 2014-02-12 阿里巴巴集团控股有限公司 一种识别用户风险的方法和装置
CN103812683A (zh) * 2012-11-15 2014-05-21 腾讯科技(深圳)有限公司 一种用户行为数据的处理方法、装置和***
CN103840988A (zh) * 2014-03-17 2014-06-04 湖州师范学院 一种基于rbf神经网络的网络流量测量方法
CN103905486A (zh) * 2012-12-26 2014-07-02 中国科学院心理研究所 一种心理健康状态评估方法
CN104572978A (zh) * 2014-12-31 2015-04-29 国家电网公司 基于日志的电力调度自动化***用户行为统计方法
WO2015062345A1 (zh) * 2013-11-01 2015-05-07 北京奇虎科技有限公司 识别指定类别ip地址的方法及设备、防御方法及***
CN104615658A (zh) * 2014-12-31 2015-05-13 中国科学院深圳先进技术研究院 一种确定用户身份的方法
CN104883346A (zh) * 2014-09-28 2015-09-02 北京匡恩网络科技有限责任公司 一种网络设备行为分析方法及***
CN104915537A (zh) * 2015-04-08 2015-09-16 郑州航空工业管理学院 基于神经网络的行为预测方法
CN104917698A (zh) * 2015-06-15 2015-09-16 中国科学院自动化研究所 互联网络平台的资源组织和调度优化方法
CN104951462A (zh) * 2014-03-27 2015-09-30 国际商业机器公司 用于管理数据库的方法和***
CN105224685A (zh) * 2015-10-28 2016-01-06 同济大学 一种挖掘用户周期模式的***及其方法
CN105843947A (zh) * 2016-04-08 2016-08-10 华南师范大学 基于大数据关联规则挖掘的异常行为检测方法和***
CN106202094A (zh) * 2015-05-05 2016-12-07 ***通信集团公司 一种吸引力指数信息的确定方法和装置
US9537962B2 (en) 2012-11-15 2017-01-03 Tencent Technology (Shenzhen) Company Limited Method, device and system for processing client environment data
CN106332052A (zh) * 2016-08-30 2017-01-11 上海新炬网络技术有限公司 基于移动通信终端的微区域治安预警方法
WO2017063420A1 (zh) * 2015-10-12 2017-04-20 百度在线网络技术(北京)有限公司 用于确定用户需求的方法与装置
CN107203772A (zh) * 2016-03-16 2017-09-26 阿里巴巴集团控股有限公司 一种用户类型识别方法及装置
CN107395562A (zh) * 2017-06-14 2017-11-24 广东网金控股股份有限公司 一种基于聚类算法的金融终端安全保护方法及***
CN107491513A (zh) * 2017-08-07 2017-12-19 安徽优易思信息技术有限责任公司 一种网络行为聚类方法及装置
CN107707541A (zh) * 2017-09-28 2018-02-16 小花互联网金融服务(深圳)有限公司 一种流式的基于机器学习的攻击行为日志实时检测方法
TWI615730B (zh) * 2015-11-20 2018-02-21 財團法人資訊工業策進會 以應用層日誌分析為基礎的資安管理系統及其方法
CN108289115A (zh) * 2017-05-10 2018-07-17 腾讯科技(深圳)有限公司 一种信息处理方法及***
CN108306997A (zh) * 2018-01-25 2018-07-20 中国工商银行股份有限公司 域名解析监控方法及装置
CN108809745A (zh) * 2017-05-02 2018-11-13 ***通信集团重庆有限公司 一种用户异常行为检测方法、装置及***
CN108924100A (zh) * 2018-06-20 2018-11-30 广东电网有限责任公司 一种异常用户识别方法
CN108989411A (zh) * 2018-07-05 2018-12-11 中山大学 一种基于网络流的Web用户点击目标识别的方法
CN109740091A (zh) * 2018-12-26 2019-05-10 武汉大学 一种基于行为认知的用户网络行为的预测***及方法
CN110414855A (zh) * 2019-08-01 2019-11-05 广州运达智能科技有限公司 一种基于分类的地铁车辆安全性评价方法
CN110609901A (zh) * 2019-09-17 2019-12-24 国家电网有限公司 一种基于向量化特征的用户网络行为预测方法
CN111193742A (zh) * 2019-12-31 2020-05-22 广东电网有限责任公司 一种基于d-s证据理论的电力通信网网络异常检测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100426736C (zh) * 2004-11-01 2008-10-15 中兴通讯股份有限公司 一种网络安全预警方法
CN101242316A (zh) * 2008-02-03 2008-08-13 西安交大捷普网络科技有限公司 基于快速聚类算法的网络异常检测方法

Cited By (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101572629B (zh) * 2009-05-31 2011-08-31 腾讯科技(深圳)有限公司 一种ip数据的处理方法及装置
CN101702653B (zh) * 2009-10-27 2011-12-28 中国科学院声学研究所 一种基于用户行为定向的消息通告***及方法
CN102045357A (zh) * 2010-12-29 2011-05-04 深圳市永达电子股份有限公司 一种基于仿射聚类分析的入侵检测方法
CN102760138B (zh) * 2011-04-26 2015-03-11 北京百度网讯科技有限公司 用户网络行为的分类方法和装置及对应的搜索方法和装置
CN102760138A (zh) * 2011-04-26 2012-10-31 北京百度网讯科技有限公司 用户网络行为的分类方法和装置及对应的搜索方法和装置
CN102289447A (zh) * 2011-06-16 2011-12-21 北京亿赞普网络技术有限公司 一种基于通讯网络报文的网站网页评价***
CN102289447B (zh) * 2011-06-16 2013-04-10 北京亿赞普网络技术有限公司 一种基于通讯网络报文的网站网页评价***
CN102413013A (zh) * 2011-11-21 2012-04-11 北京神州绿盟信息安全科技股份有限公司 网络异常行为检测方法及装置
CN102413013B (zh) * 2011-11-21 2013-11-06 北京神州绿盟信息安全科技股份有限公司 网络异常行为检测方法及装置
CN102724063A (zh) * 2012-05-11 2012-10-10 北京邮电大学 日志采集服务器及数据包分发、日志聚类方法及网络
CN102724063B (zh) * 2012-05-11 2016-12-07 北京邮电大学 日志采集服务器及数据包分发、日志聚类方法及网络
CN103581120A (zh) * 2012-07-24 2014-02-12 阿里巴巴集团控股有限公司 一种识别用户风险的方法和装置
CN103581355A (zh) * 2012-08-02 2014-02-12 北京千橡网景科技发展有限公司 用户行为异常处理方法和设备
WO2014029111A1 (zh) * 2012-08-24 2014-02-27 华为技术有限公司 一种用户行为处理***及方法
CN103109293B (zh) * 2012-08-24 2016-09-28 华为技术有限公司 一种用户行为处理***及方法
CN103109293A (zh) * 2012-08-24 2013-05-15 华为技术有限公司 一种用户行为处理***及方法
CN103812683A (zh) * 2012-11-15 2014-05-21 腾讯科技(深圳)有限公司 一种用户行为数据的处理方法、装置和***
WO2014075599A1 (en) * 2012-11-15 2014-05-22 Tencent Technology (Shenzhen) Company Limited Method, device and system for processing client environment data
US9537962B2 (en) 2012-11-15 2017-01-03 Tencent Technology (Shenzhen) Company Limited Method, device and system for processing client environment data
CN103812683B (zh) * 2012-11-15 2015-07-15 腾讯科技(深圳)有限公司 一种用户行为数据的处理方法、装置和***
CN103905486B (zh) * 2012-12-26 2018-05-15 中国科学院心理研究所 一种心理健康状态评估方法
CN103905486A (zh) * 2012-12-26 2014-07-02 中国科学院心理研究所 一种心理健康状态评估方法
CN103269337B (zh) * 2013-04-27 2016-08-10 中国科学院信息工程研究所 数据处理方法及装置
CN103269337A (zh) * 2013-04-27 2013-08-28 中国科学院信息工程研究所 数据处理方法及装置
WO2015062345A1 (zh) * 2013-11-01 2015-05-07 北京奇虎科技有限公司 识别指定类别ip地址的方法及设备、防御方法及***
US10033694B2 (en) 2013-11-01 2018-07-24 Beijing Qihoo Technology Company Limited Method and device for recognizing an IP address of a specified category, a defense method and system
CN103840988B (zh) * 2014-03-17 2017-03-01 湖州师范学院 一种基于rbf神经网络的网络流量测量方法
CN103840988A (zh) * 2014-03-17 2014-06-04 湖州师范学院 一种基于rbf神经网络的网络流量测量方法
CN104951462A (zh) * 2014-03-27 2015-09-30 国际商业机器公司 用于管理数据库的方法和***
CN104951462B (zh) * 2014-03-27 2018-08-03 国际商业机器公司 用于管理数据库的方法和***
US10296656B2 (en) 2014-03-27 2019-05-21 International Business Machines Corporation Managing database
CN104883346A (zh) * 2014-09-28 2015-09-02 北京匡恩网络科技有限责任公司 一种网络设备行为分析方法及***
CN104615658A (zh) * 2014-12-31 2015-05-13 中国科学院深圳先进技术研究院 一种确定用户身份的方法
CN104572978A (zh) * 2014-12-31 2015-04-29 国家电网公司 基于日志的电力调度自动化***用户行为统计方法
CN104572978B (zh) * 2014-12-31 2018-07-13 国家电网公司 基于日志的电力调度自动化***用户行为统计方法
CN104615658B (zh) * 2014-12-31 2018-01-16 中国科学院深圳先进技术研究院 一种确定用户身份的方法
CN104915537A (zh) * 2015-04-08 2015-09-16 郑州航空工业管理学院 基于神经网络的行为预测方法
CN104915537B (zh) * 2015-04-08 2018-01-12 郑州航空工业管理学院 基于神经网络的行为预测方法
CN106202094A (zh) * 2015-05-05 2016-12-07 ***通信集团公司 一种吸引力指数信息的确定方法和装置
CN106202094B (zh) * 2015-05-05 2019-06-25 ***通信集团公司 一种吸引力指数信息的确定方法和装置
CN104917698B (zh) * 2015-06-15 2018-10-30 中国科学院自动化研究所 互联网络平台的资源组织和调度优化方法
CN104917698A (zh) * 2015-06-15 2015-09-16 中国科学院自动化研究所 互联网络平台的资源组织和调度优化方法
WO2017063420A1 (zh) * 2015-10-12 2017-04-20 百度在线网络技术(北京)有限公司 用于确定用户需求的方法与装置
WO2017071125A1 (zh) * 2015-10-28 2017-05-04 同济大学 一种挖掘用户周期模式的***及其方法
US10754865B2 (en) 2015-10-28 2020-08-25 Tongji University System and method for mining user cycle mode
CN105224685A (zh) * 2015-10-28 2016-01-06 同济大学 一种挖掘用户周期模式的***及其方法
TWI615730B (zh) * 2015-11-20 2018-02-21 財團法人資訊工業策進會 以應用層日誌分析為基礎的資安管理系統及其方法
CN107203772A (zh) * 2016-03-16 2017-09-26 阿里巴巴集团控股有限公司 一种用户类型识别方法及装置
CN105843947B (zh) * 2016-04-08 2019-03-05 华南师范大学 基于大数据关联规则挖掘的异常行为检测方法和***
CN105843947A (zh) * 2016-04-08 2016-08-10 华南师范大学 基于大数据关联规则挖掘的异常行为检测方法和***
CN106332052A (zh) * 2016-08-30 2017-01-11 上海新炬网络技术有限公司 基于移动通信终端的微区域治安预警方法
CN108809745A (zh) * 2017-05-02 2018-11-13 ***通信集团重庆有限公司 一种用户异常行为检测方法、装置及***
CN108289115A (zh) * 2017-05-10 2018-07-17 腾讯科技(深圳)有限公司 一种信息处理方法及***
CN108289115B (zh) * 2017-05-10 2021-06-11 腾讯科技(深圳)有限公司 一种信息处理方法及***
CN107395562A (zh) * 2017-06-14 2017-11-24 广东网金控股股份有限公司 一种基于聚类算法的金融终端安全保护方法及***
CN107491513A (zh) * 2017-08-07 2017-12-19 安徽优易思信息技术有限责任公司 一种网络行为聚类方法及装置
CN107707541A (zh) * 2017-09-28 2018-02-16 小花互联网金融服务(深圳)有限公司 一种流式的基于机器学习的攻击行为日志实时检测方法
CN108306997A (zh) * 2018-01-25 2018-07-20 中国工商银行股份有限公司 域名解析监控方法及装置
CN108306997B (zh) * 2018-01-25 2021-03-23 中国工商银行股份有限公司 域名解析监控方法及装置
CN108924100A (zh) * 2018-06-20 2018-11-30 广东电网有限责任公司 一种异常用户识别方法
CN108924100B (zh) * 2018-06-20 2020-12-01 广东电网有限责任公司 一种异常用户识别方法
CN108989411A (zh) * 2018-07-05 2018-12-11 中山大学 一种基于网络流的Web用户点击目标识别的方法
CN108989411B (zh) * 2018-07-05 2021-10-08 中山大学 一种基于网络流的Web用户点击目标识别的方法
CN109740091A (zh) * 2018-12-26 2019-05-10 武汉大学 一种基于行为认知的用户网络行为的预测***及方法
CN109740091B (zh) * 2018-12-26 2021-08-03 武汉大学 一种基于行为认知的用户网络行为的预测***及方法
CN110414855A (zh) * 2019-08-01 2019-11-05 广州运达智能科技有限公司 一种基于分类的地铁车辆安全性评价方法
CN110609901A (zh) * 2019-09-17 2019-12-24 国家电网有限公司 一种基于向量化特征的用户网络行为预测方法
CN110609901B (zh) * 2019-09-17 2022-04-15 国家电网有限公司 一种基于向量化特征的用户网络行为预测方法
CN111193742A (zh) * 2019-12-31 2020-05-22 广东电网有限责任公司 一种基于d-s证据理论的电力通信网网络异常检测方法

Also Published As

Publication number Publication date
CN101355504B (zh) 2012-08-08

Similar Documents

Publication Publication Date Title
CN101355504B (zh) 一种用户行为的确定方法和装置
Wu et al. Big data analysis-based security situational awareness for smart grid
CN109615116B (zh) 一种电信诈骗事件检测方法和检测***
Alkasassbeh et al. Detecting distributed denial of service attacks using data mining techniques
CN104301895A (zh) 一种基于流量预测的双层触发入侵检测方法
CN108076060A (zh) 基于动态k-means聚类的神经网络态势预测方法
CN110166344B (zh) 一种身份标识识别方法、装置以及相关设备
CN109670302B (zh) 一种基于svm的虚假数据注入攻击的分类方法
Chkirbene et al. A combined decision for secure cloud computing based on machine learning and past information
CN101478534A (zh) 一种基于人工免疫原理的网络异常检测方法
CN109104438A (zh) 一种窄带物联网中的僵尸网络预警方法及装置
CN109325232A (zh) 一种基于lda的用户行为异常分析方法、***及存储介质
CN112152962A (zh) 一种威胁检测方法及***
CN107733877A (zh) 一种物联网无线通讯架构的管理方法及***
Xiao et al. Network security situation prediction method based on MEA-BP
CN108600270A (zh) 一种基于网络日志的异常用户检测方法及***
CN112566093A (zh) 一种终端关系识别方法、装置、计算机设备及存储介质
Lakhno Development of a support system for managing the cyber security
Pham et al. Generating artificial attack data for intrusion detection using machine learning
CN110290110A (zh) 一种基于冗余检测架构的加密恶意流量识别方法及***
Mohanty et al. Intelligent intrusion detection system for smart grid applications
He et al. An improved ant-based classifier for intrusion detection
CN117240523A (zh) 一种基于结构信息原理的网络欺骗账户的检测方法
Elekar et al. Study of Tree base data mining algorithms for Network Intrusion Detection
CN112685272A (zh) 一种具备可解释性的用户行为异常检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: HUAWEI DIGITAL TECHNOLOGY (CHENGDU) CO., LTD.

Free format text: FORMER NAME: CHENGDU HUAWEI SYMANTEC TECHNOLOGIES CO., LTD.

CP01 Change in the name or title of a patent holder

Address after: 611731 Chengdu high tech Zone, Sichuan, West Park, Qingshui River

Patentee after: HUAWEI DIGITAL TECHNOLOGIES (CHENG DU) Co.,Ltd.

Address before: 611731 Chengdu high tech Zone, Sichuan, West Park, Qingshui River

Patentee before: CHENGDU HUAWEI SYMANTEC TECHNOLOGIES Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120808