CN109993183A - 网络故障评估方法、装置、计算设备及存储介质 - Google Patents
网络故障评估方法、装置、计算设备及存储介质 Download PDFInfo
- Publication number
- CN109993183A CN109993183A CN201711491015.2A CN201711491015A CN109993183A CN 109993183 A CN109993183 A CN 109993183A CN 201711491015 A CN201711491015 A CN 201711491015A CN 109993183 A CN109993183 A CN 109993183A
- Authority
- CN
- China
- Prior art keywords
- feature
- support vector
- kernel function
- gaussian kernel
- vector machines
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种网络故障评估方法、装置、计算设备及存储介质。将用户投诉数据和网元性能数据关联,构造特征矢量,特征矢量包括各小区、各时间段的用户投诉特征和对应的网元性能特征;通过遗传算法对使用高斯核函数的支持向量机选择特征矢量的特征子集和对应的高斯核函数参数对,其中,将支持向量机渐进行为特性加入遗传算法的染色体中;使用训练数据集对支持向量机进行训练,训练数据集包括从训练数据中提取的所选择特征子集的各训练特征值;使用支持向量机对测试数据集进行分析,以判断网络故障,测试数据集包括从测试数据中提取的所选择特征子集的各测试特征值。通过本方案,能够提高网络故障评估的效率和准确性。
Description
技术领域
本发明涉及移动通信技术领域,尤其涉及一种网络故障评估方法、装置、计算设备及存储介质。
背景技术
能够正确的维护网络尽量不出现故障,并确保出现故障之后能够迅速、准确的定位问题并排除故障,对网络维护和管理人员来说是个挑战。这不但要求对网络协议和技术有着深入的理解,更重要的是要建立一个***化的故障处理方案,能够及时修复网络故障。
目前评估网络故障的方法是客服人员接到用户投诉后,将投诉信息记录下来,然后派单给网络维护人员处理,网络维护人员需要根据经验一步步排查用户所在区域的各级网络设备,以确定是否存在网络故障。
首先,现有评估网络故障的方法步骤繁琐,需要耗费大量人力物力去完成,缺少自动化。其次,用户投诉的情况有可能并不是因为网络故障引起,这样会造成人力、物力、时间的浪费。再次,没有合理利用用户投诉数据、网络性能数据等有价值的数据信息,以评估网络故障。最后,现有方法判断网络故障的准确性并不高,而且判断故障耗时太长,不能快速响应用户投诉。
发明内容
为了迅速且自动评估网络故障,本发明实施例提供了一种网络故障评估方法、装置、计算设备及存储介质,能够提高网络故障评估的准确率,减少用于评估网络故障的用户投诉数据和网元性能数据的指标数量,加快网络故障的评估时间。
第一方面,本发明实施例提供了一种网络故障评估方法,方法包括:
将用户投诉数据和网元性能数据关联,构造特征矢量,特征矢量包括各小区、各时间段的用户投诉特征和对应的网元性能特征;
通过遗传算法对使用高斯核函数的支持向量机选择特征矢量的特征子集和对应的高斯核函数参数对,其中,将支持向量机渐进行为特性加入遗传算法的染色体中;
使用训练数据集对支持向量机进行训练,训练数据集包括从训练数据中提取的所选择特征子集的各训练特征值;
使用支持向量机对测试数据集进行分析,以判断网络故障,测试数据集包括从测试数据中提取的所选择特征子集的各测试特征值。
第二方面,本发明实施例提供了一种网络故障评估装置,装置包括:构造模块、选择模块、训练模块和分析模块。
构造模块可以将用户投诉数据和网元性能数据关联,构造特征矢量,特征矢量包括各小区、各时间段的用户投诉特征和对应的网元性能特征。
选择模块可以通过遗传算法对使用高斯核函数的支持向量机选择特征矢量的特征子集和对应的高斯核函数参数对,其中,将支持向量机渐进行为特性加入遗传算法的染色体中。
训练模块可以使用训练数据集对支持向量机进行训练,训练数据集包括从训练数据中提取的所选择特征子集的各训练特征值。
分析模块可以使用支持向量机对测试数据集进行分析,以判断网络故障,测试数据集包括从测试数据中提取的所选择特征子集的各测试特征值。
第三方面,本发明实施例提供了一种计算设备,包括:至少一个处理器、至少一个存储器以及存储在存储器中的计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。
本发明实施例提供的网络故障评估方法、装置、计算设备及存储介质,使维护人员能够越过故障定位过程快速进入故障处理阶段,提高故障处理的效率,并且能够提高网络故障评估的准确率,减少用于评估网络故障的用户投诉数据和网元性能数据的指标数量,加快网络故障的评估时间。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本发明一实施例的网络故障评估方法的示意性流程图;
图2示出了根据本发明一实施例的网络故障评估方法的示意性流程图;
图3示出了根据本发明一实施例的网络故障评估装置的示意性结构框图;
图4示出了根据本发明一实施例的计算设备的示意性结构图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本方案结合用户投诉数据和网元性能数据评估网络故障,在评估过程中,通过特征子集的选择和参数的优化设置,达到最优的分类效果,反复迭代最终得到一套高效稳定的网络故障检测机制模型。图1示出了根据本发明一实施例的网络故障评估方法的示意性流程图。
如图1所示,在步骤S100中可以将用户投诉数据和网元性能数据关联,构造特征矢量,其中,特征矢量包括各小区、各时间段的用户投诉特征和对应的网元性能特征。
可以以用户历史投诉数据为样本,获取用户投诉数量、投诉时间点的信令数据等。数据可以从客服录入的投诉信息、网管***等平台提取。用户投诉数据可以按照小区码(CI)和投诉时间,统计投诉数量、投诉同比变化率、投诉环比变化率。同比是拿现在与上年同期对比,公式为(本期数/上年同期数)*100%-1;环比是将本月数与上月数进行对比,公式为(本月数/上月数)*100%-1。可以根据投诉数量计算投诉同比变化率、投诉环比变化率。网元性能数据包括话务量、流量、吞吐量、时延、利用率等。
特征矢量的编码格式可以如下:
小区码 | 投诉时间 | 投诉数量 | 话务量 | … | 流量 |
使用该特征矢量生成数据集,其中包含训练数据集和测试数据集。训练数据集用于数据挖掘模型支持向量机的数据。测试数据集用于检测模型,测试数据只在模型检验时使用,用于评估模型的准确率,而不用于模型构建过程,否则会导致过渡拟合。
根据本发明一实施例,可以对特征矢量中的各项特征数据进行标准化处理。标准化即对数据的归一化处理,是对原始数据的线性变换,使结果映射到[0,1]区间。便于不同单位或量级的指标能够进行比较和加权。
根据本发明一实施例,可以对各项特征数据进行线性比例缩放:
其中,x为特征矢量中各项特征数据的原始值,x′为线性比例缩放后特征矢量中各项特征数据的值,min为原始值的下限,max为原始值的上限。上述转换函数为min-max标准化,也叫离差标准化,也可以采用其他标准化处理,如log函数转换、z-score标准差标准化等。
在步骤S200中可以通过遗传算法,为使用高斯核函数的支持向量机选择所述特征矢量的特征子集和对应的高斯核函数参数对,其中,将支持向量机渐进行为特性加入所述遗传算法的染色体中。
其中,支持向量机的核函数还可以使用线性核函数、多项式核函数、sigmoid核函数等,来确定最优的参数值,使用最佳参数来训练数据。高斯核函数是一种径向基核函数,在一般情况下,径向基核作为第一选择,径向基核可以把数据非线性映射到高维空间。
这样,不但考虑到支持向量机的参数优化而且还考虑到了遗传算法的初始种群问题。从特征矢量中选出最优特征子集是指从已有的M个特征中选择N个特征使得***的特定指标最优化,以降低数据集维度。可以通过遗传算法实现特征子集的选择和支持向量机中高斯核函数参数对的设置。
其中,支持向量机是建立一个最优决策超平面,使得该平面两侧距离该平面最近的两类样本之间的距离最大化,从而对分类问题提供良好的泛化能力。“支持向量”是指训练集中的某些训练点,“最优超平面”考虑P个线性可分样本{(X1,d1),(X2,d2),…,(Xp,dp),…(Xp,dp)},对于任一输入样本Xp,用于分类的超平面方程为:
WTX+b=0
式中,X为输入向量,W为权值向量,b为偏置值,超平面与最近的样本点之间的间隔称为分离边缘,用ρ表示。支持向量机的目标是找到一个分离边缘最大的超平面,即最优超平面。也就是要确定使ρ最大时的W和b。
在步骤S300中可以使用训练数据集对支持向量机进行训练,其中训练数据集包括从训练数据中提取的所选择特征子集的各训练特征值。
为了得到一个理想的支持向量机分类器,通常把数据分为训练集和测试集。训练集用来训练分类器,测试集为了测试分类器的性能是否满足要求(误差是否足够小)。
其中,遗传算法的一般步骤包括:编码、选择、交叉、变异、适应度计算:初始化种群,评估每条染色体所对应个体的适应度。遵照适应度越高,选择概率越大的原则,保存最优染色体,从种群中选择两个个体作为父方和母方。抽取父母双方的染色体,进行交叉,产生子代。对子代的染色体进行变异。重新评价适应度,更新最优染色体,重复选择、交叉、变异操作,直到满足终止条件。
编码方式可以包括二进制编码、浮点数编码、符号编码等,由于二进制编码的遗传操作过程和生物学中的过程非常相类似,基因串上的“0”或“1”有一定几率变成与之相反的“1”或“0”。一条足够长的染色体就能勾勒出一个个体的所有特征。编码中的每一位代表一个基因,每一个编码代表一个个体。
根据本发明一实施例,可以将特征子集选择(FSS)和高斯核函数参数对(C,γ)转换为二进制编码,基于二进制编码,构建遗传算法的染色体。
二进制编码格式可以如下所示:
其中,为特征子集选择的二进制编码,为参数C的二进制编码,为参数γ的二进制编码。nfss为特征子集的数量,nγ为高斯核函数参数γ的数量,nC为惩罚参数C的数量。
支持向量机的高斯核函数是最常用的一种径向基核函数。当数据点距离中心点变远时,高斯核函数取值会变小。惩罚系数C影响模型的复杂性和稳定性。另外,C的值影响到对样本中“离群点”的处理,选取合适的C就能在一定程度上抗干扰,从而保证模型的稳定性。γ反映了支持向量之间的相关程度。γ很小,支持向量间的联系比较松弛,γ太大,支持向量间的影响过强,回归模型难以达到足够的精度。
可以将支持向量机渐进行为特性加入遗传算法的染色体中,生成优化后的染色体。
根据本发明一实施例,高斯核函数参数对(C,γ)包括惩罚参数C和高斯核函数参数γ,可以通过下述公式计算所述支持向量机的渐进行为特性
可以将上式变形为:
在模型中加入渐进行为特性可以利用对数变换,把一组非线性结构的变量转化为近似的或显著的线性关系,以简化模型。
在该实施例中,σ是与高斯核函数参数γ相关的参数,通过上述公式可以看出,当参数γ的值越大,σ的值就越小,通过σ的值可以控制该函数的径向作用范围,从而影响对未知样本的分类效果和训练测试的准确度。
适应度函数的选取直接影响遗传算法的收敛速度以及能否找到最优解。因为遗传算法在进化搜索中基本不利用外部信息,仅以适应度函数为依据,利用种群每个个体的适应度来进行搜索。所以适应度函数的构建应尽可能简单,使计算的时间复杂度最小。
根据本发明一实施例,可以基于下述适应度函数公式计算所述适应度:
其中,fit为适应度,WE为特征权值,即特征选择的重要程度,Ci为特征代价,Ei标记特征值是否选中,例如,“1”表示选中,“0”表示未选中。B为避免分母趋于0的常数,WA为分类准确率权值,A为分类准确,nfss为被选择的特征子集的个数。WE+WA=1。
根据本发明一实施例,可以将经过交叉操作和变异操作的染色体根据适应度大小排序,将前n个染色体作为父本染色体,n为正整数。
例如,可以使用遗传算法搜索能力,在父代染色体中,按照适应度函数判断,将经过交叉操作和变异操作的染色体根据适应度从大到小排序,选择适应度排在前面的n个染色体,作为新一代优化后染色体的父本。交叉操作是为了保证种群的稳定性,朝着最优解的方向进化。变异操作是为了保证种群的多样性,避免交叉可能产生的局部收敛。
计算每个父本染色体的支持向量机渐进行为特性,构建m个高斯核函数参数对,基于所构建的n*m个高斯核函数参数对,得到新一代染色体。
例如,从n个父本染色体中依次取出高斯核函数参数对(C,γ),并将其二进制编码转换成变量值,然后使用公式计算每个父本染色体的渐进行为特性从参数γ的范围中选取m个值,共获取n×m个γ值,γij,i=1,2,…,n,j=1,2,…,m。通过计算参数C的m个值,Cij,i=1,2,…,n,j=1,2,…,m。生成n×m个参数对(C,γ),将其变量值转换成二进制编码,与之前的特征子集选择(FSS)进行二进制编码组合,生成n×m个优化后染色体。
从而得到的新一代染色体包含了最优的支持向量机高斯核函数参数对,兼容了支持向量机渐进行为特性强化了遗传算法搜索能力,提升了使用高斯核函数的支持向量机的分类正确率。
根据本发明一实施例,该方法还可以包括:
从父代种群、子代种群、优化种群中选择N个种群,作为新一代种群,N为正整数。
例如,可以使用遗传算法中的选择算子,从父代种群F(t)、子代种群S(t)、优化种群P(t)中选择N个种群,作为新一代种群F(t+1),再从新一代种群中选择适应度高的父本染色体和母本染色体。其中,选择算子参照适应度函数,按照预先选定的策略随机从父代中挑选一些个体生存下来,剩下的个体则被淘汰,可以包括比例选择、确定式采样选择等策略。
可以将新一代种群F(t+1)每个染色体的二进制编码分为特征子集选择(FSS)的二进制编码和参数对(C,γ)的二进制编码,并将参数对(C,γ)的二进制编码转换为变量值。
可以基于新一代种群F(t+1)中每个染色体的特征子集选择(FSS)的二进制编码,确定被选择的特征子集,缩小训练数据集和测试数据集的特征个数,生成已选择特征的训练数据集和测试数据集。
可以基于新一代种群F(t+1)中每个染色体的高斯核函数参数对(C,γ)的二进制编码,结合已选择特征的训练数据集,训练支持向量机分类器,得到支持向量机分类器的权值向量W和偏置值b。
根据本发明一实施例,该方法还包括:
基于支持向量机分类器的权值向量W和偏置值b、高斯核函数参数对及已选择特征的训练数据集,计算分类准确率。
例如,测试分类器的分类效果可以用误差率或准确率来计算,如果测试结果的误差率小于期望值或者准确率大于期望值,就可以运用该分类器对数据进行分类。
基于分类准确率、特征代价和已被选择特征,计算所述适应度。在适应度满足预定条件的情况下,确定选择的特征矢量的特征子集和对应的高斯核函数参数对。
可以将特征代价Ci、分类准确率A,已被选择特征的标记值Ei代入上述的适应度函数,计算适应度。遗传算法评价一个解的好坏不是取决于它的解的结构,而是取决于该解的适应度值,这正体现了遗传算法“优胜劣汰”的特点。
完成一次迭代之后可以判断是否满足终止条件,可设置迭代次数或时间阈值,达到预设的迭代次数或时间则退出计算,返回优化后的特征子集选择(FSS)和参数对(C,γ)二进制编码。如未达到预设的迭代次数或时间,则再次进行遗传算法,执行交叉操作、变异操作、生成优化染色体操作、选择操作。
在步骤S400中可以使用支持向量机对测试数据集进行分析,以判断网络故障,测试数据集包括从测试数据中提取的所选择特征子集的各测试特征值。
可以将从测试数据中提取的特征矢量的特征子集和对应的高斯核函数参数对代入所述支持向量机中,使用所述支持向量机对多种故障进行两两判断。
例如,将优化后的特征子集选择(FSS)和参数对(C,γ)二进制编码代入支持向量机中,使用支持向量机分别对以下故障类型进行两两判断:FTTH场景PON口故障、FTTB小区ONU掉电故障、FTTB场景PON口故障、MB出现设备离线、BRAS出现设备离线、汇聚交换机(93/89等系列)出现设备离线、传输设备与单个OLT全阻、OLT上联全阻、PON口故障超限、OLT硬件退服故障、重大故障告警,
可以根据两两判断结果计算每个故障的得分,选取得分最高的作为网络故障。
例如,可以采取投票形式,根据两两判断结果计算每个故障的得分,选取得分最高的故障作为支持向量机选定的网络故障。
图2示出了根据本发明一实施例的网络故障评估方法的示意性流程图。以实际网络监控的应用案例对上述方案说明:
例如,如图2所示,在步骤S100中可以选取时间段为2017年1月至2017年6月的投诉数据(包括投诉数量、投诉同比变化率、投诉环比变化率)和性能数据(包括话务量、试呼次数、应用下载速率等)作为训练数据集,将各类数据相关联构造特征矢量。在步骤S200中可以对数据进行标准化预处理,使用标准化处理后的训练数据训练支持向量机分类器。在步骤S300中可以通过遗传算法进行参数优化,经过交叉、变异、优化染色体、选择操作后得到优化的染色体种群,计算分类准确率以及评价适应度,直到满足预设的结束条件,进而得到优化后的特征子集选择和高斯核函数的参数对。
其中,测试数据集可以选取2017年7月的用户投诉数据,根据投诉数据获取对应网元的性能数据。构建测试数据特征矢量,使用上述方案中的优化后的支持向量机对测试数据集进行分类,以确定其对应的网络故障类型。在步骤S400中可以使用最优的特征子集和参数对代入支持向量机,使用支持向量机对故障类型进行两两判断,并将判断的网络故障类型与实际的网络故障类型进行对比验证。
对应实际现网故障类型包括:FTTH场景PON口故障、FTTB小区ONU掉电故障、FTTB场景PON口故障、MB出现设备离线、BRAS出现设备离线、汇聚交换机(93/89等系列)出现设备离线、传输设备与单个OLT全阻、OLT上联全阻、PON口故障超限、OLT硬件退服故障。通过遗传算法优化支持向量机的特征子集选择和参数对,训练出能够对任意两类故障进行判断的支持向量机。
通过使用上述方法评估2017年7月的用户投诉对应的网络故障,故障判断准确率达到87%,故障判断响应时间降低了65%。
本发明还提供一种网络故障评估装置,图3示出了根据本发明一实施例的网络故障评估装置的示意性结构框图。
如图3所示,该装置300可以包括构造模块310、选择模块320、训练模块330和分析模块340。
构造模块310可以将用户投诉数据和网元性能数据关联,构造特征矢量,特征矢量包括各小区、各时间段的用户投诉特征和对应的网元性能特征。
选择模块320可以通过遗传算法对使用高斯核函数的支持向量机选择特征矢量的特征子集和对应的高斯核函数参数对,其中,将支持向量机渐进行为特性加入遗传算法的染色体中。
训练模块330可以使用训练数据集对支持向量机进行训练,训练数据集包括从训练数据中提取的所选择特征子集的各训练特征值。
分析模块340可以使用支持向量机对测试数据集进行分析,以判断网络故障,测试数据集包括从测试数据中提取的所选择特征子集的各测试特征值。
根据本发明一实施例,该装置300还可以包括:标准化处理模块。
标准化处理模块可以对特征矢量中的各项特征数据进行标准化处理,其中,特征矢量中包括训练数据集和测试数据集。
根据本发明一实施例,该装置300还可以包括:编码模块和构建模块。
编码模块可以将特征子集选择和高斯核函数参数对转换为二进制编码。
构建模块可以基于特征子集选择和高斯核函数参数的二进制编码,构建染色体。
根据本发明一实施例,该装置300还可以包括:种群选择模块、数据确定模块、获取模块。
种群选择模块可以从父代种群、子代种群、优化种群中选择N个种群,作为新一代种群,N为正整数。
数据确定模块可以基于新一代种群中每个染色体的特征子集选择,确定已选择特征的训练数据集和测试数据集。
获取模块可以基于新一代种群中每个染色体的高斯核函数参数对和已选择特征的训练数据集,获取支持向量机分类器的权值向量和偏置值。
根据本发明一实施例,该装置300还可以包括:第一计算模块、第二计算模块和参数确定模块。
第一计算模块可以基于支持向量机分类器的权值向量和偏置值、高斯核函数参数对及已选择特征的训练数据集,计算分类准确率。
第二计算模块可以基于分类准确率、特征代价和已被选择特征,计算适应度。
参数确定模块可以在适应度满足预定条件的情况下,确定选择的特征矢量的特征子集和对应的高斯核函数参数对。
根据本发明一实施例,分析模块340可以包括:代入单元、判断单元、得分计算单元和选取单元。
代入单元可以将选择的特征矢量的特征子集和对应的高斯核函数参数对代入支持向量机中。
判断单元可以使用支持向量机对多种故障进行两两判断。
得分计算单元可以根据两两判断结果计算每个故障的得分。
选取单元可以选取得分最高的作为网络故障。
上述方案通过使用遗传算法优化支持向量机的特征子集选择和参数,以达到最优的分类效果,反复迭代最终得到一套较高效稳定的网络故障检测机制模型。通过将使用高斯核函数的支持向量机的渐进行为特性引入到遗传算法中,强化了遗传算法搜索能力,提升了使用高斯核函数的支持向量机的分类正确率。
另外,结合图1描述的本发明实施例的网络故障评估方法可以由计算设备来实现。图4示出了本发明实施例提供的计算设备的硬件结构示意图。
计算设备可以包括处理器401以及存储有计算机程序指令的存储器402。
具体地,上述处理器401可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器402可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器402可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器402可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器402可在数据处理装置的内部或外部。在特定实施例中,存储器402是非易失性固态存储器。在特定实施例中,存储器402包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器401通过读取并执行存储器402中存储的计算机程序指令,以实现上述实施例中的任意一种网络故障评估方法。
在一个示例中,计算设备还可包括通信接口403和总线410。其中,如图4所示,处理器401、存储器402、通信接口403通过总线410连接并完成相互间的通信。
通信接口403,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线410包括硬件、软件或两者,将计算设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、***组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线410可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
另外,结合上述实施例中的网络故障评估方法,本发明实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种网络故障评估方法。
综上所述,本方案的网络故障评估方法通过遗传算法反复迭代,优化支持向量机,提高了分类准确率。且通过优化减少了数据处理量,能大大提高传统支持向量机的性能,能够更快速地判断网络故障。
故障产生后***或监控人员根据该方法可以直接修复拦截告警或者通过提取故障辅助信息、明确派单方向,辅助维护人员进行故障分析处理,使得维护人员能够越过故障定位过程快速进入故障处理阶段,以达到快速消除告警,缩短故障历时,减轻维护工作量,提高维护人员告警处理效率。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或***。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的***、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。
Claims (13)
1.一种网络故障评估方法,其特征在于,所述方法包括:
将用户投诉数据和网元性能数据关联,构造特征矢量,所述特征矢量包括各小区、各时间段的用户投诉特征和对应的网元性能特征;
通过遗传算法,为使用高斯核函数的支持向量机选择所述特征矢量的特征子集和对应的高斯核函数参数对,其中,将支持向量机渐进行为特性加入所述遗传算法的染色体中;
使用训练数据集对所述支持向量机进行训练,所述训练数据集包括从训练数据中提取的所选择特征子集的各训练特征值;
使用所述支持向量机对测试数据集进行分析,以判断网络故障,所述测试数据集包括从测试数据中提取的所选择特征子集的各测试特征值。
2.根据权利要求1所述的方法,其特征在于,所述将支持向量机渐进行为特性加入所述遗传算法的染色体中,包括:
将经过交叉操作和变异操作的染色体根据适应度大小排序,将前n个染色体作为父本染色体,n为正整数;
计算每个所述父本染色体的支持向量机渐进行为特性;
基于每个所述父本染色体的支持向量机渐进行为特性,构建n*m个高斯核函数参数对;
基于所构建的n*m个高斯核函数参数对,得到新一代染色体。
3.根据权利要求1所述的方法,其特征在于,所述高斯核函数参数对包括惩罚参数C和高斯核函数参数γ,通过下述公式计算所述支持向量机的渐进行为特性
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述特征矢量中的各项特征数据进行标准化处理,所述特征矢量中包括训练数据集和测试数据集。
5.根据权利要求4所述的方法,其特征在于,所述对特征矢量中的各项特征数据进行标准化处理,包括:
对所述各项特征数据进行线性比例缩放:
其中,x为特征矢量中各项特征数据的原始值,x′为线性比例缩放后特征矢量中各项特征数据的值,min为原始值的下限,max为原始值的上限。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将特征子集选择和所述高斯核函数参数对转换为二进制编码;
基于所述特征子集选择和所述高斯核函数参数的二进制编码,构建染色体。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
从父代种群、子代种群、优化种群中选择N个种群,作为新一代种群,N为正整数;
基于所述新一代种群中每个染色体的特征子集选择,确定已选择特征的训练数据集和测试数据集;
基于所述新一代种群中每个染色体的高斯核函数参数对和所述已选择特征的训练数据集,得到支持向量机分类器的权值向量和偏置值。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
基于所述支持向量机分类器的权值向量和偏置值、所述高斯核函数参数对及所述已选择特征的训练数据集,计算分类准确率;
基于所述分类准确率、所述特征代价和已被选择特征,计算所述适应度;
在所述适应度满足预定条件的情况下,确定选择的所述特征矢量的特征子集和对应的高斯核函数参数对。
9.根据权利要求8所述的方法,其特征在于,基于下述适应度函数公式计算所述适应度:
其中,fit为适应度,WE为特征权值,Ci为特征代价,Ei标记特征值是否选中,B为避免分母趋于0的常数,WA为分类准确率权值,A为分类准确,nfss为被选择的特征子集的个数,WE+WA=1。
10.根据权利要求1所述的方法,其特征在于,所述使用所述支持向量机对测试数据集进行分析以判断网络故障,包括:
将选择的所述特征矢量的特征子集和对应的高斯核函数参数对代入所述支持向量机中;
使用所述支持向量机对多种故障进行两两判断;
根据两两判断结果计算每个故障的得分;
选取得分最高的作为网络故障。
11.一种网络故障评估装置,其特征在于,所述装置包括:
构造模块,用于将用户投诉数据和网元性能数据关联,构造特征矢量,所述特征矢量包括各小区、各时间段的用户投诉特征和对应的网元性能特征;
选择模块,用于通过遗传算法对使用高斯核函数的支持向量机选择所述特征矢量的特征子集和对应的高斯核函数参数对,其中,将支持向量机渐进行为特性加入所述遗传算法的染色体中;
训练模块,用于使用训练数据集对所述支持向量机进行训练,所述训练数据集包括从训练数据中提取的所选择特征子集的各训练特征值;以及
分析模块,用于使用所述支持向量机对测试数据集进行分析,以判断网络故障,所述测试数据集包括从测试数据中提取的所选择特征子集的各测试特征值。
12.一种计算设备,其特征在于,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如权利要求1-10任一项所述的方法。
13.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如权利要求1-10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711491015.2A CN109993183B (zh) | 2017-12-30 | 2017-12-30 | 网络故障评估方法、装置、计算设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711491015.2A CN109993183B (zh) | 2017-12-30 | 2017-12-30 | 网络故障评估方法、装置、计算设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109993183A true CN109993183A (zh) | 2019-07-09 |
CN109993183B CN109993183B (zh) | 2022-12-27 |
Family
ID=67110099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711491015.2A Active CN109993183B (zh) | 2017-12-30 | 2017-12-30 | 网络故障评估方法、装置、计算设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109993183B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111242171A (zh) * | 2019-12-31 | 2020-06-05 | 中移(杭州)信息技术有限公司 | 网络故障的模型训练、诊断预测方法、装置以及电子设备 |
CN112036566A (zh) * | 2020-08-03 | 2020-12-04 | 上海明略人工智能(集团)有限公司 | 使用遗传算法选取特征的方法和装置 |
CN112990255A (zh) * | 2020-12-23 | 2021-06-18 | 中移(杭州)信息技术有限公司 | 设备故障的预测方法、装置、电子设备、以及存储介质 |
CN113766363A (zh) * | 2020-06-03 | 2021-12-07 | ***通信集团浙江有限公司 | 故障监控方法、装置及计算设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567742A (zh) * | 2010-12-15 | 2012-07-11 | 中国科学院电子学研究所 | 一种基于自适应核函数选择的支持向量机自动分类方法 |
CN103136587A (zh) * | 2013-03-07 | 2013-06-05 | 武汉大学 | 基于支持向量机的配电网运行状态分类识别方法 |
CN104462846A (zh) * | 2014-12-22 | 2015-03-25 | 山东鲁能软件技术有限公司 | 一种基于支持向量机的设备故障智能诊断方法 |
CN105335698A (zh) * | 2015-09-15 | 2016-02-17 | 河南理工大学 | 一种基于自适应遗传算法和som网络的齿轮故障诊断方法 |
CN105743705A (zh) * | 2016-03-31 | 2016-07-06 | 中国人民解放军国防科学技术大学 | 一种基于分级策略的数据中心网络可用性评估方法及评估装置 |
CN106053067A (zh) * | 2016-05-24 | 2016-10-26 | 广东石油化工学院 | 基于量子遗传算法优化支持向量机的轴承故障诊断方法 |
CN106156854A (zh) * | 2016-08-18 | 2016-11-23 | 山东师范大学 | 一种基于dna编码的支持向量机参数预测方法 |
CN106443379A (zh) * | 2016-09-22 | 2017-02-22 | 广州供电局有限公司 | 变压器局部放电故障类型的识别方法和装置 |
CN106596116A (zh) * | 2016-11-29 | 2017-04-26 | 西安理工大学 | 一种风力发电机组振动故障诊断方法 |
CN107167702A (zh) * | 2017-05-04 | 2017-09-15 | 国网福建省电力有限公司 | 一种配电网馈线故障类型识别方法及装置 |
-
2017
- 2017-12-30 CN CN201711491015.2A patent/CN109993183B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567742A (zh) * | 2010-12-15 | 2012-07-11 | 中国科学院电子学研究所 | 一种基于自适应核函数选择的支持向量机自动分类方法 |
CN103136587A (zh) * | 2013-03-07 | 2013-06-05 | 武汉大学 | 基于支持向量机的配电网运行状态分类识别方法 |
CN104462846A (zh) * | 2014-12-22 | 2015-03-25 | 山东鲁能软件技术有限公司 | 一种基于支持向量机的设备故障智能诊断方法 |
CN105335698A (zh) * | 2015-09-15 | 2016-02-17 | 河南理工大学 | 一种基于自适应遗传算法和som网络的齿轮故障诊断方法 |
CN105743705A (zh) * | 2016-03-31 | 2016-07-06 | 中国人民解放军国防科学技术大学 | 一种基于分级策略的数据中心网络可用性评估方法及评估装置 |
CN106053067A (zh) * | 2016-05-24 | 2016-10-26 | 广东石油化工学院 | 基于量子遗传算法优化支持向量机的轴承故障诊断方法 |
CN106156854A (zh) * | 2016-08-18 | 2016-11-23 | 山东师范大学 | 一种基于dna编码的支持向量机参数预测方法 |
CN106443379A (zh) * | 2016-09-22 | 2017-02-22 | 广州供电局有限公司 | 变压器局部放电故障类型的识别方法和装置 |
CN106596116A (zh) * | 2016-11-29 | 2017-04-26 | 西安理工大学 | 一种风力发电机组振动故障诊断方法 |
CN107167702A (zh) * | 2017-05-04 | 2017-09-15 | 国网福建省电力有限公司 | 一种配电网馈线故障类型识别方法及装置 |
Non-Patent Citations (1)
Title |
---|
陈忠德: "计算机网络故障的智能化诊断方法", 《科技经济市场》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111242171A (zh) * | 2019-12-31 | 2020-06-05 | 中移(杭州)信息技术有限公司 | 网络故障的模型训练、诊断预测方法、装置以及电子设备 |
CN111242171B (zh) * | 2019-12-31 | 2023-10-31 | 中移(杭州)信息技术有限公司 | 网络故障的模型训练、诊断预测方法、装置以及电子设备 |
CN113766363A (zh) * | 2020-06-03 | 2021-12-07 | ***通信集团浙江有限公司 | 故障监控方法、装置及计算设备 |
CN112036566A (zh) * | 2020-08-03 | 2020-12-04 | 上海明略人工智能(集团)有限公司 | 使用遗传算法选取特征的方法和装置 |
CN112990255A (zh) * | 2020-12-23 | 2021-06-18 | 中移(杭州)信息技术有限公司 | 设备故障的预测方法、装置、电子设备、以及存储介质 |
CN112990255B (zh) * | 2020-12-23 | 2024-05-28 | 中移(杭州)信息技术有限公司 | 设备故障的预测方法、装置、电子设备、以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109993183B (zh) | 2022-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109993183A (zh) | 网络故障评估方法、装置、计算设备及存储介质 | |
CN111460250B (zh) | 用于画像的数据的清洗方法、装置、介质及电子设备 | |
CN109635292B (zh) | 基于机器学习算法的工单质检方法和装置 | |
CN111199474A (zh) | 一种基于双方网络图数据的风险预测方法、装置和电子设备 | |
CN108563555A (zh) | 基于四目标优化的故障更改代码预测方法 | |
CN105871879A (zh) | 网元异常行为自动检测方法及装置 | |
CN110033284A (zh) | 房源验真方法、装置、设备及存储介质 | |
CN111582315B (zh) | 样本数据处理方法、装置及电子设备 | |
CN114897085A (zh) | 一种基于封闭子图链路预测的聚类方法及计算机设备 | |
CN112783513B (zh) | 一种代码风险检查方法、装置及设备 | |
CN114462040A (zh) | 一种恶意软件检测模型训练、恶意软件检测方法及装置 | |
CN114139931A (zh) | 企业数据评估方法、装置、计算机设备及存储介质 | |
CN110704803A (zh) | 目标对象的评估值计算方法及装置、存储介质、电子设备 | |
CN112966965A (zh) | 进出口大数据的分析和决策方法、装置、设备及存储介质 | |
CN112888008A (zh) | 基站异常检测方法、装置、设备及存储介质 | |
CN116861358A (zh) | 基于bp神经网络与多源数据融合的计算思维评测方法 | |
CN115494431A (zh) | 一种变压器故障告警方法、终端设备和计算机可读存储介质 | |
CN111522750B (zh) | 一种功能测试问题的处理方法及*** | |
CN114548307A (zh) | 分类模型训练方法和装置、分类方法和装置 | |
CN115454855B (zh) | 代码缺陷报告审计方法、装置、电子设备及存储介质 | |
CN117370284B (zh) | 一种日志错误数据追踪方法及*** | |
CN113375597B (zh) | 基于rf-nsga-ii的结构件三维激光扫描方法及设备 | |
CN108256785A (zh) | 一种基于物联网的管理方法 | |
CN116484230B (zh) | 识别异常业务数据的方法及ai数字人的训练方法 | |
CN115130440B (zh) | 适用于设备融资的业务数据录入处理*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |