CN108494620A - 基于多目标自适应演化算法的网络业务流特征选择与分类方法 - Google Patents

基于多目标自适应演化算法的网络业务流特征选择与分类方法 Download PDF

Info

Publication number
CN108494620A
CN108494620A CN201810169202.7A CN201810169202A CN108494620A CN 108494620 A CN108494620 A CN 108494620A CN 201810169202 A CN201810169202 A CN 201810169202A CN 108494620 A CN108494620 A CN 108494620A
Authority
CN
China
Prior art keywords
feature
classification
evolvement
arithmetic
feature selecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810169202.7A
Other languages
English (en)
Other versions
CN108494620B (zh
Inventor
董育宁
张咪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201810169202.7A priority Critical patent/CN108494620B/zh
Publication of CN108494620A publication Critical patent/CN108494620A/zh
Application granted granted Critical
Publication of CN108494620B publication Critical patent/CN108494620B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • H04L43/062Generation of reports related to network traffic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/02Capturing of monitoring data
    • H04L43/026Capturing of monitoring data using flow identification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/02Capturing of monitoring data
    • H04L43/028Capturing of monitoring data by filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0894Packet rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于多目标自适应演化算法的网络业务流特征选择与分类方法,该方法首先利用信息增益率对特征进行排序,滤除部分无关特征,达到快速降维的目的,然后以自适应演化算法对特征空间进行搜索,并用信息增益率排名靠前的特征作为初始种群,以不一致率和特征子集维数两个目标函数作为评价函数选取最优特征子集。自适应交叉和变异保持了种群多样性,且保证了算法的收敛能力。同时本发明利用设计的三层KNN分类器模型对在线标清直播视频、网页浏览(Baidu)、在线音频、网页浏览(sina)、网络语音聊天、在线标清非直播视频六种多媒体业务流进行分类。实验结果表明,该方法比现有方法具有更高的分类准确率。

Description

基于多目标自适应演化算法的网络业务流特征选择与分类 方法
技术领域
本发明属于模式识别与分类技术领域,具体涉及一种基于多目标自适应演化算法的网络业务流特征选择与分类方法。
背景技术
近年来,随着互联网的快速发展,准确高效的网络流分类是网络管理的重要基础。网络多媒体业务流类型的多样性给其分类和识别带来了巨大的挑战。传统的流分类方法主要包括三种:基于端口的方法,深度包检测方法和基于多媒体流统计特征的方法。但是随着数据加密、新型应用的出现及动态端口的使用,前两种分类方法将不再适用。如今,大部分研究者重点关注包括决策树、SVM(SupportVectorMachine)和C5.0等机器学习分类方法。
在实际应用中,特征维数往往很高,不相关和冗余特征的存在容易导致模型训练所需时间长且复杂度较高,不易于推广。特征选择能滤除不相关和冗余特征,从而实现快速降维,提高模型精确度。特征选择算法根据评价函数的不同可以分为过滤型(Filter)、封装型(Wrapper)和嵌入式型(Embed)。过滤型特征选择的过程是独立的,与具体的分类器无关。封装型是将特征选择和分类器的设计结合在一起,运用分类准确率去评估所选特征,从而选出最优子集。而嵌入式型是将特征选择方法作为分类器训练的一部分,通过分析所得模型的分类结果选取子集。目前常见的特征选择方法有信息增益率(GR)、皮尔森相关系数、卡方统计等。特征维数过高时,需要借助搜索算法来提高效率,近年来已有很多搜索算法应用于特征选择,例如序列前向选择(SFS),序列后向选择(SBS)和增L去R选择算法等。目前智能优化搜索算法已成为研究的热点,如演化算法(EA),粒子群算法等在特征选择方面得到了广泛的应用。但是这些方法在搜索特征子集时都只考虑了单一准则,并没有考虑所选特征子集的基数,它们都属于单目标特征选择方法。
多目标优化可以从多个角度评价特征子集的质量,并将这些评价指标作为目标函数同时进行优化。受自然界生物进化过程的启发,研究者提出了用于求解多目标优化问题的多目标演化算法,例如非支配径向基演化算法(ENORA)。然而,在特征维数较高时,不相关和冗余特征会增加多目标优化的时间复杂度。对于演化算法,种群的初始化、交叉和变异概率选择不当都会降低最终的分类准确率和算法的收敛能力。且目前多数多目标特征选择算法一个目标函数为分类器的准确率,所以收敛速度较慢,运行时间较长。
发明内容
本发明所要解决的技术问题是:
为克服以上算法的缺点,本发明提出一种基于多目标自适应演化算法的网络业务流特征选择与分类方法。
本发明为解决上述技术问题采用以下技术方案:
本发明提出一种基于多目标自适应演化算法的网络业务流特征选择与分类方法,包含以下步骤:
(1)数据收集与预处理:采集互联网上各种多媒体业务的数据流样本,然后进行预处理操作;
(2)特征选择与分析:对上述网络数据流样本的统计特征进行分析,选择有效区分业务流的特征组合;
(3)业务流分类与检验:利用三层KNN分类器对网络多媒体业务流进行分类实验,得出分类结果,并计算整体分类正确率。
进一步,本发明提出的基于多目标自适应演化算法的网络多媒体业务流特征选择与分类方法,所述数据收集与预处理操作具体包括:
(2.1)在开放的互联网环境中,通过网络封包分析软件WireShark抓取所需的多媒体业务流数据,然后将原始数据转换成标准的五元组文本格式,所述五元组文本格式包括数据包到达的时间、源IP地址、目的IP地址、协议、数据包分组大小;
(2.2)对原始多媒体业务流的标准五元组文件进行基本的统计特征计算,所述统计特征包括:上/下行包大小、上/下行包大小信息熵、整体包大小、上/下行包到达时间间隔、下行数据包速率、下行字节速率和上下行字节数之比。
进一步,本发明提出的基于多目标自适应演化算法的网络多媒体业务流特征选择与分类方法,所述特征选择与分析具体包括:
(3.1)采用信息增益率对所有特征进行排序,滤除低于相关性阈值的特征;
(3.2)编码选择:选取长度为特征数量N的二进制编码,每个编码个体由一串比特位组成;任一位都有两个取值,值为1代表选择该特征,值为0代表不选;将每个个体表示为:其中cI和mI分别代表每个编码个体中执行自适应交叉和变异的离散参数;
(3.3)种群初始化:初始化空种群P0,在种群中个体数小于种群大小popsize时,循环执行在[1,N]范围内随机初始化q的值,个体选取信息增益率排名靠前的q个特征,即将对应的前q位置为1,q+1至N位置为0,将该个体加进种群P0
(3.4)每个个体I有两个适应度函数f1(I)和f2(I),对应于多目标优化的两个目标函数;其中f1(I)为不一致率,f2(I)代表所选特征个数;
(3.5)选择父代:根据个体的拥挤距离来选择父代;
(3.6)自适应交叉:
固定交叉概率pc,对于t代的任两个个体I和J,若该伯努利随机变量以pc的概率取1,则将cJ随机置为0或1,并将cJ的值赋给cI;若cJ的值为0,则不交叉,如果为1则执行均匀交叉;
将交叉产生的新个体加入辅助种群中Qt中;
(3.7)自适应变异:
固定变异概率pm,对于t代个体I,若该伯努利随机变量以pm的概率取1,则将mI随机置为0或1;如果mI的值为0,则不进行变异,如果为1则进行单点翻转变异;
将变异产生的新个体加入Qt代种群中,并将父代Pt和Qt合并为辅助种群Rt
对种群Rt中的所有个体按照目标函数的等级及拥挤距离进行排序,选取前popsize个个体存活到下一代Pt+1
执行t=t+1;
(3.8)若满足最大迭代次数gen或在迭代过程中不一致率保持不变,则输出最优特征子集;否则重复步骤(3.4)至步骤(3.7)。
进一步,本发明提出的基于多目标自适应演化算法的网络多媒体业务流特征选择与分类方法,所述不一致率是指:将样本实例中的一个特征组合称为一个模式,特征子集的所有模式的不一致数,为该模式出现的样本总数减去出现次数最多的某一类标签的样本数,不一致率就等于不一致数除以样本总数。
进一步,本发明提出的基于多目标自适应演化算法的网络多媒体业务流特征选择与分类方法,步骤(3.1)中的相关性阈值为0.4,步骤(3.2)中的N对应的三层分类器依次为25、26、13,步骤(3.6)中的交叉概率pc和步骤(3.7)中的变异概率pm均为0.1,步骤(3.7)中的popsize=100,步骤(3.8)中的最大迭代次数gen为10。
进一步,本发明提出的基于多目标自适应演化算法的网络多媒体业务流特征选择与分类方法,业务流分类步骤具体包括:
(5.1)采用特征选择方法对原始多媒体业务流进行特征选择,并进行第一层KNN分类,将多媒体流分为4类:C1,C2,C3,C4;其中C1为在线音频,C2为在线视频,C3为网页浏览,C4为网络语音聊天;
(5.2)对上一层分类得到的C2的视频流特征再次使用特征选择方法进行特征选择,并进行第二层KNN分类,得到分类结果C21,C22;
(5.3)对步骤(5.1)分类结果C3的数据流特征再次使用特征选择方法进行特征选择,并进行第二层的第二个KNN分类,得到分类结果C31,C32;
(5.4)统计分类输出结果,计算整体分类正确率。
进一步,本发明提出的基于多目标自适应演化算法的网络多媒体业务流特征选择与分类方法,所述分类结果C21为在线直播视频,C22为在线非直播视频;C31网页内容为文字和图片,C32网页内容为文字、图片和视频。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、本发明采用多目标自适应演化算法的多媒体特征选择方法相对于单目标特征选择算法,不但考虑了分类准确率且考虑了所选特征个数;相较于已有多目标特征选择算法具有较低的计算复杂度,收敛速度较快,能够有效的降低特征选择过程中的时间和空间开销,提高特征选择的效率。
2、本发明对多媒体业务采用多层分类的方法,设计了一种三层KNN级联分类器,首先利用本发明的特征选择方法选取有效特征组合,然后采用本发明的三层分类器进行分类。相较于已有多层SVM分类方法,具有较好的分类正确率。
3、本发明对在线标清直播视频、网页浏览(Baidu)、在线音频、网页浏览(sina)、网络语音聊天、在线标清非直播视频六种多媒体业务流进行特征选择,然后利用三层KNN分类器进行分类。实验结果表明,该方法相对于GR、EA、ENORA三种特征选择算法具有较高的识别率,总体正确率为98.6%.
附图说明
图1是本发明所述分类方法的流程框图。
图2是本发明所选取的特征组合的有效验证图,其中,(a)是四种网络业务流在下行包大小最大值和上行字节数上的二维分布图,(b)是两种视频类型在下行包大小最大值和上行字节数上的二维分布图,(c)是两种网页浏览类型在下行包大小最大值和下行字节速率偏度上的二维分布图。
图3是本发明、GR、EA和ENORA对六种多媒体业务分类正确率比较图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
如图1所示,本发明提出了一种基于多目标自适应演化算法的多媒体业务流特征选择与分类方法,该方法包括多媒体业务流的数据获取与预处理、基于多目标自适应演化算法的多媒体业务流特征选择、三层KNN级联分类输出统计结果等,包括如下步骤:
步骤1:数据收集与预处理,具体步骤为:
(1)在开放的互联网环境中,通过网络封包分析软件WireShark抓取所需的多媒体业务流数据,然后将原始数据转换成标准的五元组文本格式,即数据包到达的时间、源IP地址、目的IP地址、协议、数据包分组大小;
(2)对原始多媒体业务流的标准五元组文件进行基本的统计特征计算,这些特征包括:上/下行包大小、上/下行包大小信息熵、整体包大小、上/下行包到达时间时间间隔、下行数据包速率、下行字节速率和上下行字节数之比。
步骤2:特征选择与分析,具体步骤为:
(1)采用信息增益率对所有特征进行排序,滤除低于相关性阈值0.4的特征;
(2)编码选择:选取二进制编码,每个个体由一串比特位组成(长度为特征数量N)。任一位都有两个取值,值为“1”代表选择该特征,值为0代表不选;
(3)种群初始化:在[1,N]范围内随机初始化q的值,选取信息增益率排名靠前的q个特征作为初始化种群P0,即将对应的前q位置为1,q+1至N位置为0;
(4)每个个体I有两个适应度函数f1(I)和f2(I),对应于多目标优化的两个目标函数。其中f1(I)为不一致率,将样本实例中的一个特征组合称为一个模式,特征子集的所有模式的不一致数,就等于该模式出现的样本总数减去出现次数最多的某一类标签的样本数,不一致率就等于不一致数除以样本总数;f2(I)代表所选特征个数;
(5)选择父代:根据个体的拥挤距离来选择父代;
(6)自适应交叉:首先固定交叉概率pc=0.1,然后对于Pt代的任两个个体I和J,若该伯努利随机变量以pc的概率取1,则将cJ随机置为0或1,并将cJ的值赋给cI。若cJ的值为0,则不交叉,如果为1则执行均匀交叉。将交叉产生的新个体加入Pt+1代种群中;
(7)自适应变异:首先固定变异概率pm=0.1,对于Pt代个体I,若该伯努利随机变量以pm的概率取1,则将mI随机置为0或1.如果mI的值为0,则不进行变异,如果为1则进行单点翻转变异。将变异产生的新个体加入Pt+1代种群中,执行t=t+1;
(8)若满足最大迭代次数gen=10或在迭代过程中不一致率保持不变,则输出最优特征子集;否则重复步骤(4)至步骤(7)。
在实验中我们设计了三层KNN级联分类器模型,此模型可以在每一级的分类器中使用本发明方法选择的特征组合识别出某些特定类型的应用业务。第一层的KNN分类器主要用来识别出在线音频(QQ Music)、在线视频(直播和非直播)、网页浏览、网络语音聊天(Skype),最佳的特征组合为下行包大小最大值、上行字节数。为了方便观察,我们对图2的(a)做了取对数操作。从图2的(a)可知Skype属于交互式音频,所以上行字节数高于网页浏览和QQ Music而小于在线直播视频,利用下行包大小最大值和上行字节数可以高效识别Skype和QQ Music。
第二层的KNN分类器将第一层分类得出的视频进一步分为在线直播视频和在线非直播视频。最佳的特征组合:上行字节数。CBox属于直播视频类型,客户端和服务器交互数据明显多于非直播业务youku视频,所以从图2的(b)中可以看出通过特征上行字节数可将直播和非直播视频业务完全分离。
第三层的KNN分类器将第一层分类得出的网页浏览进一步分为Baidu(网页内容为文字和图片)和sina(网页内容为文字、图片、视频)。最佳的特征组合:下行包大小最大值和下行字节速率偏度。由于视频类业务数据包大于其他业务流,而sina浏览内容包括视频类,所以sina的下行包大小最大值稍大于Baidu业务流。如图2的(c)所示,特征下行包大小最大值和下行字节速率偏度可以准确识别sina和Baidu业务流
步骤3,业务流分类与检验,具体步骤为:
(1)采用特征选择方法对原始多媒体业务流进行特征选择,并进行第一层KNN分类,将多媒体流分为4类C1,C2,C3,C4;其中C1为在线音频(QQ Music),C2为在线视频(直播和非直播),C3为网页浏览,C4为网络语音聊天(Skype);
(2)对上一层分类得到的C2的视频流特征再次使用特征选择方法进行特征选择,并进行第二层KNN分类,得到分类结果C21,C22;其中,C21为在线直播视频,C22为在线非直播视频;
(3)对步骤(1)分类结果C3的数据流特征再次使用特征选择方法进行特征选择,并进行第二层的第二个KNN分类,得到分类结果C31,C32;其中,C31为Baidu(网页内容为文字和图片),C32为sina(网页内容为文字、图片、视频);
(4)统计分类输出结果,计算整体分类正确率。
在实验中我们采用二折交叉验证,并将本发明的分类结果同GR、EA、ENORA的结果进行了对比。从图3可知,本发明方法具有最高的整体分类正确率,高达98.6%。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (7)

1.基于多目标自适应演化算法的网络业务流特征选择与分类方法,其特征在于,包含以下步骤:
(1)数据收集与预处理:采集互联网上各种多媒体业务的数据流样本,然后进行预处理操作;
(2)特征选择与分析:对上述网络数据流样本的统计特征进行分析,选择有效区分业务流的特征组合;
(3)业务流分类与检验:利用三层KNN分类器对网络多媒体业务流进行分类实验,得出分类结果,并计算整体分类正确率。
2.根据权利要求1所述的基于多目标自适应演化算法的网络多媒体业务流特征选择与分类方法,其特征在于,所述数据收集与预处理操作具体包括:
(2.1)在开放的互联网环境中,通过网络封包分析软件WireShark抓取所需的多媒体业务流数据,然后将原始数据转换成标准的五元组文本格式,所述五元组文本格式包括数据包到达的时间、源IP地址、目的IP地址、协议、数据包分组大小;
(2.2)对原始多媒体业务流的标准五元组文件进行基本的统计特征计算,所述统计特征包括:上/下行包大小、上/下行包大小信息熵、整体包大小、上/下行包到达时间间隔、下行数据包速率、下行字节速率和上下行字节数之比。
3.根据权利要求1所述的基于多目标自适应演化算法的网络多媒体业务流特征选择与分类方法,其特征在于,所述特征选择与分析具体包括:
(3.1)采用信息增益率对所有特征进行排序,滤除低于相关性阈值的特征;
(3.2)编码选择:选取长度为特征数量N的二进制编码,每个编码个体由一串比特位组成;任一位都有两个取值,值为1代表选择该特征,值为0代表不选;将每个个体表示为:其中i=1,...,N,cI∈{0,1},mI∈{0,1};cI和mI分别代表每个编码个体中执行自适应交叉和变异的离散参数;
(3.3)种群初始化:初始化空种群P0,在种群中个体数小于种群大小popsize时,循环执行在[1,N]范围内随机初始化q的值,个体选取信息增益率排名靠前的q个特征,即将对应的前q位置为1,q+1至N位置为0,将该个体加进种群P0
(3.4)每个个体I有两个适应度函数f1(I)和f2(I),对应于多目标优化的两个目标函数;其中f1(I)为不一致率,f2(I)代表所选特征个数;
(3.5)选择父代:根据个体的拥挤距离来选择父代;
(3.6)自适应交叉:
固定交叉概率pc,对于t代的任两个个体I和J,若该伯努利随机变量以pc的概率取1,则将cJ随机置为0或1,并将cJ的值赋给cI;若cJ的值为0,则不交叉,如果为1则执行均匀交叉;
将交叉产生的新个体加入辅助种群中Qt中;
(3.7)自适应变异:
固定变异概率pm,对于t代个体I,若该伯努利随机变量以pm的概率取1,则将mI随机置为0或1;如果mI的值为0,则不进行变异,如果为1则进行单点翻转变异;
将变异产生的新个体加入Qt代种群中,并将父代Pt和Qt合并为辅助种群Rt
对种群Rt中的所有个体按照目标函数的等级及拥挤距离进行排序,选取前popsize个个体存活到下一代Pt+1
执行t=t+1;
(3.8)若满足最大迭代次数gen或在迭代过程中不一致率保持不变,则输出最优特征子集;否则重复步骤(3.4)至步骤(3.7)。
4.根据权利要求3所述的基于多目标自适应演化算法的网络多媒体业务流特征选择与分类方法,其特征在于,所述不一致率是指:将样本实例中的一个特征组合称为一个模式,特征子集的所有模式的不一致数,为该模式出现的样本总数减去出现次数最多的某一类标签的样本数,不一致率就等于不一致数除以样本总数。
5.根据权利要求3所述的基于多目标自适应演化算法的网络多媒体业务流特征选择与分类方法,其特征在于,步骤(3.1)中的相关性阈值为0.4,步骤(3.2)中的N对应的三层分类器依次为25、26、13,步骤(3.6)中的交叉概率pc和步骤(3.7)中的变异概率pm均为0.1,步骤(3.7)中的popsize=100,步骤(3.8)中的最大迭代次数gen为10。
6.根据权利要求1所述的基于多目标自适应演化算法的网络多媒体业务流特征选择与分类方法,其特征在于,业务流分类步骤具体包括:
(5.1)采用特征选择方法对原始多媒体业务流进行特征选择,并进行第一层KNN分类,将多媒体流分为4类:C1,C2,C3,C4;其中C1为在线音频,C2为在线视频,C3为网页浏览,C4为网络语音聊天;
(5.2)对上一层分类得到的C2的视频流特征再次使用特征选择方法进行特征选择,并进行第二层KNN分类,得到分类结果C21,C22;
(5.3)对步骤(5.1)分类结果C3的数据流特征再次使用特征选择方法进行特征选择,并进行第二层的第二个KNN分类,得到分类结果C31,C32;
(5.4)统计分类输出结果,计算整体分类正确率。
7.根据权利要求6所述的基于多目标自适应演化算法的网络多媒体业务流特征选择与分类方法,其特征在于,所述分类结果C21为在线直播视频,C22为在线非直播视频;C31网页内容为文字和图片,C32网页内容为文字、图片和视频。
CN201810169202.7A 2018-02-28 2018-02-28 一种网络业务流特征选择与分类方法 Active CN108494620B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810169202.7A CN108494620B (zh) 2018-02-28 2018-02-28 一种网络业务流特征选择与分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810169202.7A CN108494620B (zh) 2018-02-28 2018-02-28 一种网络业务流特征选择与分类方法

Publications (2)

Publication Number Publication Date
CN108494620A true CN108494620A (zh) 2018-09-04
CN108494620B CN108494620B (zh) 2021-07-27

Family

ID=63341158

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810169202.7A Active CN108494620B (zh) 2018-02-28 2018-02-28 一种网络业务流特征选择与分类方法

Country Status (1)

Country Link
CN (1) CN108494620B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580606A (zh) * 2020-12-31 2021-03-30 安徽大学 基于聚类分组的大规模人体行为识别方法
CN113079427A (zh) * 2021-04-28 2021-07-06 北京航空航天大学 基于网络演化模型的ason网络业务可用性评估方法
CN115049019A (zh) * 2022-07-25 2022-09-13 湖南工商大学 金属有机框架对砷的吸附性能评估方法、装置及相关设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120054184A1 (en) * 2010-08-24 2012-03-01 Board Of Regents, The University Of Texas System Systems and Methods for Detecting a Novel Data Class
US20130108131A1 (en) * 2007-05-29 2013-05-02 University Of Iowa Research Foundation Methods And Systems For Determining Optimal Features For Classifying Patterns Or Objects In Images
CN105260746A (zh) * 2015-10-09 2016-01-20 乔善平 一种可扩展的多层集成多标记学习***
CN105787437A (zh) * 2016-02-03 2016-07-20 东南大学 一种基于级联集成分类器的车辆品牌类型识别方法
CN106897733A (zh) * 2017-01-16 2017-06-27 南京邮电大学 基于粒子群优化算法的视频流特征选择与分类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130108131A1 (en) * 2007-05-29 2013-05-02 University Of Iowa Research Foundation Methods And Systems For Determining Optimal Features For Classifying Patterns Or Objects In Images
US20120054184A1 (en) * 2010-08-24 2012-03-01 Board Of Regents, The University Of Texas System Systems and Methods for Detecting a Novel Data Class
CN105260746A (zh) * 2015-10-09 2016-01-20 乔善平 一种可扩展的多层集成多标记学习***
CN105787437A (zh) * 2016-02-03 2016-07-20 东南大学 一种基于级联集成分类器的车辆品牌类型识别方法
CN106897733A (zh) * 2017-01-16 2017-06-27 南京邮电大学 基于粒子群优化算法的视频流特征选择与分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHANGJING SHANG,: ""Combining support vector machines and information gain ranking for classification of mars mcmurdo panorama images"", 《PROCEEDINGS OF 2010 IEEE 17TH INTERNATIONAL CONFERENCE ON IMAGE PROCESSING》 *
冯茂,: ""基于粒子群优化算法的视频流特征选择方法"", 《南京邮电大学学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580606A (zh) * 2020-12-31 2021-03-30 安徽大学 基于聚类分组的大规模人体行为识别方法
CN112580606B (zh) * 2020-12-31 2022-11-08 安徽大学 基于聚类分组的大规模人体行为识别方法
CN113079427A (zh) * 2021-04-28 2021-07-06 北京航空航天大学 基于网络演化模型的ason网络业务可用性评估方法
CN113079427B (zh) * 2021-04-28 2021-11-23 北京航空航天大学 基于网络演化模型的ason网络业务可用性评估方法
CN115049019A (zh) * 2022-07-25 2022-09-13 湖南工商大学 金属有机框架对砷的吸附性能评估方法、装置及相关设备

Also Published As

Publication number Publication date
CN108494620B (zh) 2021-07-27

Similar Documents

Publication Publication Date Title
Homayoun et al. BoTShark: A deep learning approach for botnet traffic detection
CN109151880B (zh) 基于多层分类器的移动应用流量识别方法
CN101605126B (zh) 一种多协议数据分类识别的方法和***
CN104244035B (zh) 基于多层聚类的网络视频流分类方法
CN111565156B (zh) 一种对网络流量识别分类的方法
CN108768986A (zh) 一种加密流量分类方法及服务器、计算机可读存储介质
CN105809190A (zh) 一种基于特征选取的svm级联分类器方法
CN108650194A (zh) 基于K_means和KNN融合算法的网络流量分类方法
CN109831392A (zh) 半监督网络流量分类方法
CN108494620A (zh) 基于多目标自适应演化算法的网络业务流特征选择与分类方法
CN111224994A (zh) 一种基于特征选择的僵尸网络检测方法
Soleymanpour et al. CSCNN: cost-sensitive convolutional neural network for encrypted traffic classification
CN109218223A (zh) 一种基于主动学习的鲁棒性网络流量分类方法及***
Soleymanpour et al. An efficient deep learning method for encrypted traffic classification on the web
Feng et al. BotFlowMon: Learning-based, content-agnostic identification of social bot traffic flows
CN112788038A (zh) 一种基于PCA和随机森林的区分DDoS攻击和大象流的方法
Zhang et al. Adaptive matrix sketching and clustering for semisupervised incremental learning
Kozik et al. Pattern extraction algorithm for NetFlow‐based botnet activities detection
Dixit et al. Internet traffic detection using naïve bayes and K-Nearest neighbors (KNN) algorithm
CN106557983B (zh) 一种基于模糊多类svm的微博垃圾用户检测方法
CN114358177B (zh) 一种基于多维度特征紧凑决策边界的未知网络流量分类方法及***
Zheng et al. Multi-view multi-label anomaly network traffic classification based on mlp-mixer neural network
Lee et al. Generation of network traffic using WGAN-GP and a DFT filter for resolving data imbalance
CN113256507B (zh) 一种针对二进制流量数据生成图像的注意力增强方法
CN110417786B (zh) 一种基于深度特征的p2p流量细粒度识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant