CN117376107A - 一种智能化网络管理方法、***、计算机设备及介质 - Google Patents

一种智能化网络管理方法、***、计算机设备及介质 Download PDF

Info

Publication number
CN117376107A
CN117376107A CN202311592702.9A CN202311592702A CN117376107A CN 117376107 A CN117376107 A CN 117376107A CN 202311592702 A CN202311592702 A CN 202311592702A CN 117376107 A CN117376107 A CN 117376107A
Authority
CN
China
Prior art keywords
network
data
equipment
fault
onu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311592702.9A
Other languages
English (en)
Inventor
杜猛俊
蒋正威
李昂
韩荣杰
王剑
钱锦
周波
孙剑
杨帆
王瑾
来益博
杨谊
柳东辰
***强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Zhejiang Electric Power Co Ltd Hangzhou Fuyang District Power Supply Co
Hangzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
State Grid Zhejiang Electric Power Co Ltd Hangzhou Fuyang District Power Supply Co
Hangzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Zhejiang Electric Power Co Ltd Hangzhou Fuyang District Power Supply Co, Hangzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd filed Critical State Grid Zhejiang Electric Power Co Ltd Hangzhou Fuyang District Power Supply Co
Priority to CN202311592702.9A priority Critical patent/CN117376107A/zh
Publication of CN117376107A publication Critical patent/CN117376107A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • H04B10/075Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal
    • H04B10/077Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal using a supervisory or additional signal
    • H04B10/0771Fault location on the transmission path
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • H04B10/075Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal
    • H04B10/079Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal using measurements of the data signal
    • H04B10/0791Fault location on the transmission path
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了一种智能化网络管理方法、***、计算机设备及存储介质,所述方法采用获取的业务***所对应的历史数据和实时数据,分别根据历史数据构建知识图谱和业务***智能管理模型;将实时数据输入业务***智能管理模型,以对业务***进行监控,并识别网络故障;基于识别的网络故障,根据知识图谱和故障处理经验数据,对网络故障进行定位,并生成处理方案。本申请提供的智能化网络管理方法,能够准确诊断网络故障并生成详细报表,可以优化网络资源利用效率,提高整体网络性能和用户体验,简化了故障处置流程并提高了故障处理的效率。通过关注ONU设备的三种状态转移,省去繁琐的步骤,更好地监控网络健康状态。

Description

一种智能化网络管理方法、***、计算机设备及介质
技术领域
本申请涉及网络管理技术领域,尤其涉及一种智能化网络管理方法、***、计算机设备及介质。
背景技术
在现有的网络管理环境中,面临着海量告警无法自动收敛的问题,且网络管理人员需要同时管理多个厂商网络管理平台,并处理来自不同网络管理平台的告警信息,效率显著较低。除此之外,在PON***中,ONU通过分光器连接,导致逻辑拓扑与物理拓扑无法完全匹配。当网络出现故障并产生告警时,仍需依赖运维人员手工记录的网络链路信息进行全面综合分析,这种依赖人工决策的方式存在着失误率高的风险。
发明内容
本申请提供了一种智能化网络管理方法、***、计算机设备及介质,以解决现有的网络管理中存在的告警信息无法收敛、效率低下、准确率低的技术问题,实现快速准确的识别网络故障,并提供有效的故障处理方案,实现告警的自动收敛,提升故障处理的效率的技术效果。
为解决上述技术问题,第一方面,本申请提供了一种智能化网络管理方法,所述方法包括:
获取业务***所对应的历史数据和实时数据,所述数据至少包括网络设备属性关系数据、网络设备状态指标数据、网络性能指标数据、网络安全指标数据、以及故障处理经验数据、日志记录和业务***信息;
根据所述网络设备属性关系数据和所述业务***信息,构建知识图谱;所述知识图谱至少包括:网络拓扑结构和业务路径承载关系;
根据所述网络设备属性关系数据、所述网络设备状态指标数据、所述网络性能指标数据、所述网络安全指标数据和所述日志记录的历史数据,构建业务***智能管理模型;
将所述实时数据输入所述业务***智能管理模型,以对所述业务***进行监控,并识别网络故障;
基于识别的网络故障,根据所述知识图谱和所述故障处理经验数据,对所述故障进行定位,并生成处理方案。
优选的,所述构建知识图谱,包括:
对所述网络设备属性关系数据和所述业务***信息进行预处理;
基于预处理后的网络设备属性关系数据和业务***信息,提取所述网络设备之间的物理连接关系、逻辑连接关系、以及业务***与设备之间的映射关系;
根据所述物理连接关系、所述逻辑连接关系和所述业务***与设备之间的映射关系构建网络拓扑结构;
基于所述网络拓扑结构,分析网络设备之间的物理连接关系和逻辑连接关系与链路带宽和网络设备性能的匹配度,以确定所述业务路径承载关系;
将所述网络拓扑结构与所述业务路径承载关系进行关联,构建所述知识图谱。
优选的,所述构建业务***智能管理模型,包括:
对所述网络设备属性关系数据、所述网络设备状态指标数据、所述网络性能指标数据、所述网络安全指标数据和所述日志记录的历史数据进行预处理,并进行特征提取;
基于神经网络模型构建业务***智能管理模型,所述业务***智能管理模型包括分类模块和回归预测模块;
根据提取到的特征,对所述业务***智能管理模型进行训练、测试、评估和优化。
优选的,所述基于识别的网络故障,根据所述知识图谱和所述故障处理经验数据,对所述故障进行定位,包括:
根据所述知识图谱和所述故障处理经验数据,建立网络设备之间的故障传导关系图;
基于识别的网络故障,采用根因推理,在所述故障传导关系图中进行逆向推理,依次找到所有与网络故障有关的设备;
基于所述所有与网络故障有关的设备,通过逆向推理,确定网络故障发生的路径和关键节点;
根据所述网络故障发生的路径和关键节点,定位导致网络故障发生的设备或组件。
优选的,所述方法还包括:
获取ONU设备的历史数据和实时数据,所述ONU设备的历史数据和实时数据均至少包括:ONU设备的性能指标数据、ONU设备的状态指标数据、ONU设备的收光功率和PON光口的通道发光功率;
根据所述ONU设备的历史数据构建ONU设备正常行为模型和ONU设备故障传导关系图;
将所述ONU设备的实时数据,输入所述ONU设备正常行为模型,识别ONU设备故障;
基于所述ONU设备故障传导关系图,采用根因推理,对所述ONU设备故障进行定位。
优选的,所述根据所述ONU设备的历史数据构建ONU设备正常行为模型和ONU设备故障传导关系图,包括:
获取所述ONU设备的收光功率减去所述PON光口的通道发光功率的差值,根据所述差值得到插损值,根据所述插损值判断ONU设备在链路上的排列顺序;
根据所述排列顺序,获取ONU设备与PON光口的承载关系;
根据所述承载关系,以及ONU设备的性能指标数据和ONU设备的状态指标数据,构建ONU设备正常行为模型;
根据所述承载关系构建ONU设备故障传导关系图。
优选的,所述基于所述ONU设备故障传导关系图,采用根因推理,对所述ONU设备故障进行定位,包括:
基于所述ONU设备故障传导关系图和网络中存在的保护机制,采用根因推理,依次找到所有与所述ONU设备故障有关的ONU设备;
判断所有与所述ONU设备故障有关的ONU设备的当前状态,根据判断结果对所述ONU设备的状态翻转进行监控,获取所述ONU设备的消缺状态。
第二方面,本申请还提供了一种智能化网络管理***,所述***包括:
数据采集单元、知识图谱构建单元、业务***智能管理模型构建单元、故障识别单元和巡检定位单元;
所述数据采集单元:用于获取业务***所对应的历史数据和实时数据,所述数据至少包括网络设备属性关系数据、网络设备状态指标数据、网络性能指标数据、网络安全指标数据、以及故障处理经验数据、日志记录和业务***信息;
所述知识图谱构建单元,用于根据所述网络设备属性关系数据和所述业务***信息,构建知识图谱;所述知识图谱至少包括:网络拓扑结构和业务路径承载关系;
所述业务***智能管理模型构建单元,用于根据所述网络设备属性关系数据、所述网络性能指标数据、所述网络设备状态指标数据、所述网络安全指标数据和所述日志记录的历史数据,构建业务***智能管理模型;
所述故障识别单元,用于将所述实时数据输入所述业务***智能管理模型,以对所述业务***进行监控,并识别网络故障;
所述巡检定位单元,用于基于识别的网络故障,根据所述知识图谱和所述故障处理经验数据,对所述故障进行定位,并生成处理方案。
第三方面,本申请还提供一种计算机设备,所述计算机设备包括存储器、处理器和收发器,它们之间通过总线连接;存储器用于存储一组计算机程序指令和数据,并将存储的数据传输给处理器,处理器执行存储器存储的程序指令,以执行上述所述的方法。
第四方面,本申请还提供一种计算机可读存储介质,述计算机可读存储介质中存储有计算机程序,当所述计算机程序被运行时,实现上述所述的方法。
本申请提供了一种智能化网络管理方法、***、计算机设备及存储介质,所述方法采用获取的业务***所对应的历史数据和实时数据,分别根据历史数据构建知识图谱和业务***智能管理模型;将实时数据输入业务***智能管理模型,以对业务***进行监控,并识别网络故障;基于识别的网络故障,根据知识图谱和故障处理经验数据,对网络故障进行定位,并生成处理方案。本申请提供的智能化网络管理方法,能够准确诊断网络故障并生成详细报表,可以优化网络资源利用效率,提高整体网络性能和用户体验,简化了故障处置流程并提高了故障处理的效率。通过关注ONU设备的三种状态转移,省去繁琐的步骤,更好地监控网络健康状态。
附图说明
图1是本申请一个优选实施例所提供的一种智能化网络管理方法步骤示意图;
图2是本申请一个优选实施例所提供的知识图谱构建方法步骤示意图;
图3是本申请一个优选实施例所提供的业务***智能管理模型构建方法步骤示意图;
图4是本申请一个优选实施例所提供的故障定位方法步骤示意图;
图5是本申请一个优选实施例所提供的对ONU设备的监控和预警的方法步骤示意图;
图6是本申请一个优选实施例所提供的构建ONU设备正常行为模型和ONU设备故障传导关系图的方法步骤示意图;
图7是本申请一个优选实施例所提供的对ONU设备故障进行定位的方法步骤示意图;
图8是本申请一个优选实施例所提供的一种面向电力数据共享的联邦学习聚合优化***示意图;
图9是本申请一个优选实施例所提供的一种计算机设备示意图。
具体实施方式
下面结合附图具体阐明本申请的实施方式,实施例的给出仅仅是为了说明目的,并不能理解为对本申请的限定,包括附图仅供参考和说明使用,不构成对本申请专利保护范围的限制。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为解决现有的网络管理中存在的告警信息无法收敛、效率低下、准确率低的技术问题,本申请实施例提供了一种智能化网络管理方法,实现快速准确的识别网络故障,并提供有效的故障处理方案,实现告警的自动收敛,提升故障处理的效率的技术效果。
请参阅图1,在本申请的实施例中,提供了智能化网络管理方法,所述方法包括:
S1、获取业务***所对应的历史数据和实时数据,所述数据至少包括网络设备属性关系数据、网络设备状态指标数据、网络性能指标数据、网络安全指标数据、以及故障处理经验数据、日志记录和业务***信息。
S2、根据所述网络设备属性关系数据和所述业务***信息,构建知识图谱;所述知识图谱至少包括:网络拓扑结构和业务路径承载关系。
S3、根据所述网络设备属性关系数据、所述网络设备状态指标数据、所述网络性能指标数据、所述网络安全指标数据和所述日志记录的历史数据,构建业务***智能管理模型。
S4、将所述实时数据输入所述业务***智能管理模型,以对所述业务***进行监控,并识别网络故障。
S5、基于识别的网络故障,根据所述知识图谱和所述故障处理经验数据,对所述故障进行定位,并生成处理方案。
在本申请实施例中,通过自动化技术,以及机器学习和深度学习的算法自动采集不同业务***所对应的数据,该数据包含支持业务***运行的网络设备属性关系数据、网络设备状态指标数据、网络性能指标数据、网络安全指标数据、以及故障处理经验、日志记录和业务***信息等。
其中网络设备属性关系数据包括与网络设备相关的型号、IP地址等信息;网络设备状态指标数据包括:CPU利用率、内存利用率、温度等;网络性能指标数据包括:带宽利用率、时延、丢包率等;网络安全指标数据包括:防火墙拦截次数、流量异常告警次数等。
进一步的,根据以上获取的网络设备属性关系数据和业务***信息,构建知识图谱,该知识图谱包括网络设备与业务***之间的承载、共享和保护,对于知识图谱的构建,如图2所示,具体包括以下步骤:
S201、对所述网络设备属性关系数据和所述业务***信息进行预处理。
S202、基于预处理后的网络设备属性关系数据和业务***信息,提取所述网络设备之间的物理连接关系、逻辑连接关系、以及业务***与设备之间的映射关系。
S203、根据所述物理连接关系、所述逻辑连接关系和所述业务***与设备之间的映射关系构建网络拓扑结构。
S204、基于所述网络拓扑结构,分析网络设备之间的物理连接关系和逻辑连接关系与链路带宽和网络设备性能的匹配度,以确定所述业务路径承载关系。
S205、将所述网络拓扑结构与所述业务路径承载关系进行关联,构建所述知识图谱。
在本申请中需要对网络设备属性关系数据和业务***信息进行去重、清洗和格式化操作,以去除冗余信息,处理异常数据,使数据具有统一的标准化的格式,确保数据的准确性、完整性和一致性。
进一步的,通过自然语言处理技术,识别出数据中涉及的网络设备、业务、故障等实体,并为其分配唯一的标识符号。根据不同实体具有的属性特征,提取出与其相关的属性信息,如网络设备型号、IP地址、业务***类型、故障描述等。
通过文本挖掘和机器学习技术,自动抽取出实体之间存在的物理连接关系、逻辑连接关系,以及业务***与网络设备之间的映射关系。
将实体、属性和关系信息进行关联,组成知识图谱,具体的,可基于图结构来表示网络拓扑,其中设备可以表示为节点,连接关系可以表示为边,并充分考虑物理连接关系、逻辑连接关系和业务***与设备之间的映射关系,以构建完整的网络拓扑结构。
进一步的,需要对网络拓扑结构进行优化,分析网络设备之间的物理连接关系和逻辑连接关系与链路带宽和网络设备性能的匹配度,对于无法满足匹配要求的点位进行人工处理,以确定业务***在网络中的业务路径承载关系,将网络拓扑结构与业务路径承载关系进行关联,进一步评估和优化网络拓扑结构的资源利用率。
最后,将构建好的网络拓扑架构与其他的业务***相关信息进行关联,以构建完整的知识图谱。
网络拓扑结构用于支持对网络设备与业务之间路径承载关系的分析,通过对网络拓扑结构的建模和分析,可以准确评估和优化网络资源的利用效率,提供了直观的图形界面,让用户能够清晰地了解整个网络的运行状态和拓扑结构,从而提供统一的运维体验。
进一步的,根据网络设备属性关系数据、所述网络设备状态指标数据、所述网络性能指标数据、所述网络安全指标数据和所述日志记录的历史数据,构建业务***智能管理模型。该模型主要用于通过实时采集的业务***所对应的数据对网络进行监控和分析,识别故障,如同3所述,业务***智能管理模型构建包括以下步骤:
S301、对所述网络设备属性关系数据、所述网络设备状态指标数据、所述网络性能指标数据、所述网络安全指标数据和所述日志记录的历史数据进行预处理,并进行特征提取。
S302、基于神经网络模型构建业务***智能管理模型,所述业务***智能管理模型包括分类模块和回归预测模块。
S303、根据提取到的特征,对所述业务***智能管理模型进行训练、测试、评估和优化。
在本申请实施例提供中,首先需要对采集的网络设备属性关系数据、网络设备状态指标数据、网络性能指标数据、网络安全指标数据和日志记录的历史数据进行预处理,包括数据清洗、去噪和归一化处理,以确保数据的质量和稳定性。进一步的,对处理后的数据进行特征提取,以提取出故障分类和预测的关键信息。
利用机器学习算法或深度学习模型构建业务***智能管理模型,该模型包括分类模块和回归预测模块,以对数据进行分类和预测。
根据提取到的历史数据的特征,对业务***智能管理模型进行训练、测试、评估和优化,以提高模型的准确性和泛化能力,防止模型过拟合和欠拟合。
将通过自动化技术自动获取的业务***所对应的实时数据输入业务***智能管理模型,通过业务***智能管理模型对实时数据进行分析,以对业务***进行监控,识别出网络故障,并进行预警。
通过对实时数据进行监控和分析,可以更快速、准确的识别网络故障,保障业务***的高可用性和稳定性。
进一步的,基于识别的网络故障,根据所述网络拓扑结构和所述故障处理经验数据,对所述故障进行定位,并生成相应的故障处理方案,或者直接进行自动处理。在本申请中,对故障进行定位的方法,如图4所示,包括以下步骤:
S501、根据所述知识图谱和所述故障处理经验数据,建立网络设备之间的故障传导关系图。
S502、基于识别的网络故障,采用根因推理,在所述故障传导关系图中进行逆向推理,依次找到所有与网络故障有关的设备。
S503、基于所述所有与网络故障有关的设备,通过逆向推理,确定网络故障发生的路径和关键节点。
S504、根据所述网络故障发生的路径和关键节点,定位导致网络故障发生的设备或组件。
在本申请实施例中,根据网络拓扑结构和故障处理经验数据构建网络设备之间的故障传导关系图,根据故障传导关系图推算出故障的根本原因。具体为,根据识别的网络故障,采用根因推理,在故障传导关系图中进行逆向推理,依次找到所有与故障有关的设备。基于所有与故障有关的设备,通过逆向推理,确定故障发生的路径和关键点,最终定位到导致故障发生的具体设备或组件。最后将故障定位结果实时的展示给运维人员,帮助他们快速定位和解决故障。
在本申请实施例中,所述方法还包括报表的生成,根据获取的业务***所对应的历史数据和实时数据,可根据需要生成周、月和年报,该报表的格式可根据需要提前设定,包括对历史数据分析、实时数据分析和对比分析。在历史分析方面,对历史数据进行统计和分析,以了解网络设备在过去一段时间内的工作状态和性能水平。在实时分析方面,对当前的数据进行实时监测和分析,以及时发现网络设备的异常情况或潜在问题。对比分析,则是将历史数据和当前数据进行对比,以便发现设备性能的变化趋势和是否存在异常。在此基础上,还可以使用数据挖掘、统计分析、机器学习等技术方法来处理历史数据和实时数据,以提取有用的信息和特征,及时了解网络设备的健康状况和性能表现。
在本申请实施例中,所述方法还包括对ONU设备的监控和预警,具体的,如图5所示,包括以下步骤:
S01、获取ONU设备的历史数据和实时数据,所述ONU设备的历史数据和实时数据均至少包括:ONU设备的性能指标数据、ONU设备的状态指标数据、ONU设备的收光功率和PON光口的通道发光功率。
S02、根据所述ONU设备的历史数据构建ONU设备正常行为模型和ONU设备故障传导关系图。
S03、将所述ONU设备的实时数据,输入所述ONU设备正常行为模型,识别ONU设备故障。
S04、基于所述ONU设备故障传导关系图,采用根因推理,对所述ONU设备故障进行定位。
ONU设备故障告警管理在EPON网络管理中占据重要的地位,获取ONU设备的历史数据和实时数据,ONU设备的历史数据和实时数据均至少包括:ONU设备的性能指标数据、ONU设备的状态指标数据、ONU设备的收光功率和PON光口的通道发光功率。根据收集到的历史数据构建ONU设备正常行为模型和ONU设备故障传导关系图,其中,ONU设备正常行为模型用于通过ONU设备的实时数据对ONU设备进行故障识别和预警;ONU设备故障传导关系图用于对ONU设备故障进行定位和监控。
EPON网络的关键业务指标为ONU设备的状态,从动环到PON光口的故障传递的链条非常长,且需叠加保护关系、ONU设备排列顺序等因素。在统一的底层模型上可将复杂的业务实现简化,只需建立ONU设备故障传导关系图,并通过链路插损实现ONU设备排序,即能单次实现所有厂商的ONU设备状态管理。在本申请实施例中,构建ONU设备正常行为模型和ONU设备故障传导关系图,如图6所述,包括以下步骤:
S021、获取所述ONU设备的收光功率减去所述PON光口的通道发光功率的差值,根据所述差值得到插损值,根据所述插损值判断ONU设备在链路上的排列顺序。
S022、根据所述排列顺序,获取ONU设备与PON光口的承载关系。
S023、根据所述承载关系,以及ONU设备的性能指标数据和ONU设备的状态指标数据,构建ONU设备正常行为模型。
S024、根据所述承载关系构建ONU设备故障传导关系图。
ONU设备状态的确定取决于两个因素:ONU设备在链路上的排列顺序和ONU设备与PON光口的承载关系,其中,ONU设备在链路上的排列顺序与ONU设备的收光功率强相关,利用ONU设备的收光功率减去PON光口的通道发光功率得到插损值,插损值是判断ONU设备在链路上的排列顺序的理想指标,可根据插损值进行自动排序。根据排列顺序,可以获取ONU设备与所述PON光口的承载关系。
在本申请实施例中,在获取ONU设备正常行为模型和ONU设备故障传导关系图后,需要根据ONU设备正常行为模型和ONU设备故障传导关系图对ONU设备进行监控、故障识别和故障定位。在将ONU设备的实时数据输入ONU设备正常行为模型后,通过ONU设备正常行为模型的对比运算,识别出ONU设备故障。其中,基于ONU设备故障传导关系图,采用根因推理,对ONU设备故障进行定位,如图7所述,包括以下步骤:
S041、基于所述ONU设备故障传导关系图和网络中存在的保护机制,采用根因推理,依次找到所有与所述ONU设备故障有关的ONU设备。
S042、判断所有与所述ONU设备故障有关的ONU设备的当前状态,根据判断结果对所述ONU设备的状态翻转进行监控,获取所述ONU设备的消缺状态。
ONU设备故障传导关系图,包括各个物理元件的告警信息和保护状态等相关数据,对于告警信息包括:告警类型、告警级别和告警时间。通过告警信息可以初步判断出ONU设备的当前消缺状态,但是,还需要结合网络中存在的保护机制,例如备份连接或冗余设备等,以确定ONU设备的当前消缺状态。
其中,结合网络中存在的保护机制,需要识别PON光口保护关系。当识别到PON光口之间存在保护关系时,表明可以通过备份连接或冗余ONU设备来确保网络的可靠性和连通性,在发生故障或状态变化时,可以根据保护关系来判断是否需要切换到备份连接或冗余ONU设备,以保证网络的正常运行。
运维的核心问题为ONU设备的消缺状态,当网络规模不断扩大时,通过观察告警变化来监控网络的健康状态变得越来越艰巨。这是因为告警与故障并非一对一的关系:有一些PON光口未承载业务但仍会上报告警;一次故障通常会产生多个告警;即使存在保护机制,网络告警出现也并不表明业务中断,以上这些因素频繁导致漏报、误报的情况。在此背景下,直接关注ONU设备的三种状态和状态翻转,便可省去从告警到状态分析的繁琐步骤。
其中,ONU设备的三种状态包括:正常、劣化和消缺。状态翻转为消缺、劣化和正常三种情况动态转换。
a)消缺:当ONU设备发生故障时,经过维修或处理后,ONU设备的状态从故障状态转变为消缺状态。可以通过监测故障恢复的相关告警信息以及相应的处理记录来判断ONU是否已经消缺。
b)劣化:当ONU的性能出现下降或不稳定的情况时,其状态可能会从正常状态转变为劣化状态。通过监测ONU设备的性能指标数据的变化,例如带宽利用率、丢包率、延迟等指标的异常情况,判断ONU是否处于劣化状态。
c)正常:ONU在没有故障或性能问题的情况下,其状态为正常状态。可以通过ONU设备的性能指标数据是否在正常范围内来判断ONU是否处于正常状态。
进一步的,在本申请实施例中,也可以通过时间轴管理实现告警防抖,以提升故障处置效率,基于时间轴设置告警冷却延迟处理时间,即在告警清除时不立即发送清除事件,而是等待一个可配置的冷却时间,在等待过程中如果告警再次上报则重新激活原有告警,不产生新告警,消除了临界功率波动导致的告警抖动。通过具体的网络验证,发现将告警冷却延迟处理时间设置为20分钟时,即可将需关注的告警数量减少80%。
本申请实施例所提出的智能化网络管理方法,通过采用自动化技术自动获取业务***所对应的历史数据和实时数据,分别根据历史数据构建知识图谱和业务***智能管理模型;将实时数据输入业务***智能管理模型,以对业务***进行监控,并识别网络故障;基于识别的网络故障,根据知识图库的和故障处理经验数据,对网络故障进行定位,并生成处理方案。本申请提供的智能化网络管理方法,能够准确诊断网络故障并生成详细报表,可以优化网络资源利用效率,提高整体网络性能和用户体验,简化了故障处置流程并提高了故障处理的效率。通过关注ONU设备的三种状态转移,省去繁琐的步骤,更好地监控网络健康状态。
相应地,如图8所示,基于智能化网络管理方法,本发明实施例还提供一种智能化网络管理***,所述***包括:数据采集单元1、知识图谱构建单元2、业务***智能管理模型构建单元3、故障识别单元4和巡检定位单元5;
所述数据采集单元1,用于获取业务***所对应的历史数据和实时数据,所述数据至少包括网络设备属性关系数据、网络设备状态指标数据、网络性能指标数据、网络安全指标数据、以及故障处理经验数据、日志记录和业务***信息。
所述知识图谱构建单元2,用于根据所述网络设备属性关系数据和所述业务***信息,构建知识图谱;所述知识图谱至少包括:网络拓扑结构和业务路径承载关系。
所述业务***智能管理模型构建单元3,用于根据所述网络设备属性关系数据、所述网络性能指标数据、所述网络设备状态指标数据、所述网络安全指标数据和所述日志记录的历史数据,构建业务***智能管理模型。
所述故障识别单元4,用于将所述实时数据输入所述业务***智能管理模型,以对所述业务***进行监控,并识别网络故障。
所述巡检定位单元5,用于基于识别的网络故障,根据所述知识图谱和所述故障处理经验数据,对所述故障进行定位,并生成处理方案。
关于一种智能化网络管理***的具体限定可以参见上述对于一种智能化网络管理方法的限定,此处不再赘述。本领域普通技术人员可以意识到,结合本申请所公开的实施例描述的各个模块和步骤,能够以硬件、软件或者两者结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各实施例的步骤及组成。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
如图9所示,本发明实施例提供的一种计算机设备,包括存储器、处理器和收发器,它们之间通过总线连接;存储器用于存储一组计算机程序指令和数据,并将存储的数据传输给处理器,处理器执行存储器存储的程序指令,以执行上述的智能化网络管理方法的步骤。
其中,存储器可以包括易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者;处理器可以是中央处理器、微处理器、特定应用集成电路、可编程逻辑器件或其组合。通过示例性但不是限制性说明,上述可编程逻辑器件可以是复杂可编程逻辑器件、现场可编程逻辑门阵列、通用阵列逻辑或其任意组合。
另外,存储器可以是物理上独立的单元,也可以与处理器集成在一起。
本领域普通技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有相同的部件布置。
在一个实施例中,提供了一种计算机可读存储介质,所述存储介质用于存储一个或多个计算机程序,所述一个或多个计算机程序包括程序代码,当所述计算机程序在计算机上运行时,所述程序代码用于执行上述的智能化网络管理方法的步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如SSD)等。
本领域技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。
本实施例中提供的一种智能化网络管理方法、***、计算机设备及存储介质,针对现有的网络管理中存在的告警信息无法收敛、效率低下、准确率低的技术问题。本申请提出的智能化网络管理方法,通过采用自动化技术自动获取业务***所对应的历史数据和实时数据,分别根据历史数据构建知识图谱和业务***智能管理模型;将实时数据输入业务***智能管理模型,以对业务***进行监控,并识别网络故障;基于识别的网络故障,根据知识图库和故障处理经验数据,对网络故障进行定位,并生成处理方案。本申请提供的智能化网络管理方法,能够准确诊断网络故障并生成详细报表,可以优化网络资源利用效率,提高整体网络性能和用户体验,简化了故障处置流程并提高了故障处理的效率。通过关注ONU设备的三种状态转移,省去繁琐的步骤,更好地监控网络健康状态。
以上所述实施例仅表达了本申请的几种优选实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本申请的保护范围。因此,本申请专利的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种智能化网络管理方法,其特征在于,所述方法包括:
获取业务***所对应的历史数据和实时数据,所述数据至少包括网络设备属性关系数据、网络设备状态指标数据、网络性能指标数据、网络安全指标数据、以及故障处理经验数据、日志记录和业务***信息;
根据所述网络设备属性关系数据和所述业务***信息,构建知识图谱;所述知识图谱至少包括:网络拓扑结构和业务路径承载关系;
根据所述网络设备属性关系数据、所述网络设备状态指标数据、所述网络性能指标数据、所述网络安全指标数据和所述日志记录的历史数据,构建业务***智能管理模型;
将所述实时数据输入所述业务***智能管理模型,以对所述业务***进行监控,并识别网络故障;
基于识别的网络故障,根据所述知识图谱和所述故障处理经验数据,对所述故障进行定位,并生成处理方案。
2.如权利要求1所述的智能化网络管理方法,其特征在于,所述构建知识图谱,包括:
对所述网络设备属性关系数据和所述业务***信息进行预处理;
基于预处理后的网络设备属性关系数据和业务***信息,提取所述网络设备之间的物理连接关系、逻辑连接关系、以及业务***与设备之间的映射关系;
根据所述物理连接关系、所述逻辑连接关系和所述业务***与设备之间的映射关系构建网络拓扑结构;
基于所述网络拓扑结构,分析网络设备之间的物理连接关系和逻辑连接关系与链路带宽和网络设备性能的匹配度,以确定所述业务路径承载关系;
将所述网络拓扑结构与所述业务路径承载关系进行关联,构建所述知识图谱。
3.如权利要求1所述的智能化网络管理方法,其特征在于,所述构建业务***智能管理模型,包括:
对所述网络设备属性关系数据、所述网络设备状态指标数据、所述网络性能指标数据、所述网络安全指标数据和所述日志记录的历史数据进行预处理,并进行特征提取;
基于神经网络模型构建业务***智能管理模型,所述业务***智能管理模型包括分类模块和回归预测模块;
根据提取到的特征,对所述业务***智能管理模型进行训练、测试、评估和优化。
4.如权利要求1所述的智能化网络管理方法,其特征在于,所述基于识别的网络故障,根据所述知识图谱和所述故障处理经验数据,对所述故障进行定位,包括:
根据所述知识图谱和所述故障处理经验数据,建立网络设备之间的故障传导关系图;
基于识别的网络故障,采用根因推理,在所述故障传导关系图中进行逆向推理,依次找到所有与网络故障有关的设备;
基于所述所有与网络故障有关的设备,通过逆向推理,确定网络故障发生的路径和关键节点;
根据所述网络故障发生的路径和关键节点,定位导致网络故障发生的设备或组件。
5.如权利要求1所述的智能化网络管理方法,其特征在于,所述方法还包括:
获取ONU设备的历史数据和实时数据,所述ONU设备的历史数据和实时数据均至少包括:ONU设备的性能指标数据、ONU设备的状态指标数据、ONU设备的收光功率和PON光口的通道发光功率;
根据所述ONU设备的历史数据构建ONU设备正常行为模型和ONU设备故障传导关系图;
将所述ONU设备的实时数据,输入所述ONU设备正常行为模型,识别ONU设备故障;
基于所述ONU设备故障传导关系图,采用根因推理,对所述ONU设备故障进行定位。
6.如权利要求5所述的智能化网络管理方法,其特征在于,所述根据所述ONU设备的历史数据构建ONU设备正常行为模型和ONU设备故障传导关系图,包括:
获取所述ONU设备的收光功率减去所述PON光口的通道发光功率的差值,根据所述差值得到插损值,根据所述插损值判断ONU设备在链路上的排列顺序;
根据所述排列顺序,获取ONU设备与PON光口的承载关系;
根据所述承载关系,以及ONU设备的性能指标数据和ONU设备的状态指标数据,构建ONU设备正常行为模型;
根据所述承载关系构建ONU设备故障传导关系图。
7.如权利要求6所述的面向电力数据共享的联邦学习聚合优化方法,其特征在于,所述基于所述ONU设备故障传导关系图,采用根因推理,对所述ONU设备故障进行定位,包括:
基于所述ONU设备故障传导关系图和网络中存在的保护机制,采用根因推理,依次找到所有与所述ONU设备故障有关的ONU设备;
判断所有与所述ONU设备故障有关的ONU设备的当前状态,根据判断结果对所述ONU设备的状态翻转进行监控,获取所述ONU设备的消缺状态。
8.一种智能化网络管理***,所述***包括:数据采集单元、知识图谱构建单元、业务***智能管理模型构建单元、故障识别单元和巡检定位单元;
所述数据采集单元:用于获取业务***所对应的历史数据和实时数据,所述数据至少包括网络设备属性关系数据、网络设备状态指标数据、网络性能指标数据、网络安全指标数据、以及故障处理经验数据、日志记录和业务***信息;
所述知识图谱构建单元,用于根据所述网络设备属性关系数据和所述业务***信息,构建知识图谱;所述知识图谱至少包括:网络拓扑结构和业务路径承载关系;
所述业务***智能管理模型构建单元,用于根据所述网络设备属性关系数据、所述网络设备状态指标数据、所述网络性能指标数据、所述网络安全指标数据和所述日志记录的历史数据,构建业务***智能管理模型;
所述故障识别单元,用于将所述实时数据输入所述业务***智能管理模型,以对所述业务***进行监控,并识别网络故障;
所述巡检定位单元,用于基于识别的网络故障,根据所述知识图谱和所述故障处理经验数据,对所述故障进行定位,并生成处理方案。
9.一种计算机设备,其特征在于:所述计算机设备包括存储器、处理器和收发器,它们之间通过总线连接;存储器用于存储一组计算机程序指令和数据,并将存储的数据传输给处理器,处理器执行存储器存储的程序指令,以执行如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有计算机程序,当所述计算机程序被运行时,实现如权利要求1至7任一项所述的方法。
CN202311592702.9A 2023-11-27 2023-11-27 一种智能化网络管理方法、***、计算机设备及介质 Pending CN117376107A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311592702.9A CN117376107A (zh) 2023-11-27 2023-11-27 一种智能化网络管理方法、***、计算机设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311592702.9A CN117376107A (zh) 2023-11-27 2023-11-27 一种智能化网络管理方法、***、计算机设备及介质

Publications (1)

Publication Number Publication Date
CN117376107A true CN117376107A (zh) 2024-01-09

Family

ID=89396819

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311592702.9A Pending CN117376107A (zh) 2023-11-27 2023-11-27 一种智能化网络管理方法、***、计算机设备及介质

Country Status (1)

Country Link
CN (1) CN117376107A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118138442A (zh) * 2024-05-07 2024-06-04 广东名阳信息科技有限公司 一种基于日志数据的网络故障诊断方法及***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118138442A (zh) * 2024-05-07 2024-06-04 广东名阳信息科技有限公司 一种基于日志数据的网络故障诊断方法及***

Similar Documents

Publication Publication Date Title
CN110493042B (zh) 故障诊断方法、装置及服务器
US20220187815A1 (en) Systems and methods for detecting and predicting faults in an industrial process automation system
US11792217B2 (en) Systems and methods to detect abnormal behavior in networks
US11271795B2 (en) Systems and methods for proactive network operations
US10649838B2 (en) Automatic correlation of dynamic system events within computing devices
CN109787817B (zh) 网络故障诊断方法、装置和计算机可读存储介质
TWI741505B (zh) 一種拓撲處理方法和裝置以及系統
US20200106662A1 (en) Systems and methods for managing network health
US6604208B1 (en) Incremental alarm correlation method and apparatus
US11348023B2 (en) Identifying locations and causes of network faults
US20200021511A1 (en) Performance analysis for transport networks using frequent log sequence discovery
CN115118581B (zh) 一种基于5g的物联网数据全链路监控和智能保障***
US11894969B2 (en) Identifying root causes of network service degradation
CN117376107A (zh) 一种智能化网络管理方法、***、计算机设备及介质
CN112769605B (zh) 一种异构多云的运维管理方法及混合云平台
KR102367861B1 (ko) 자가학습에 기초하여 네트워크 장비에 대한 장애를 판단하는 장치, 방법 및 컴퓨터 프로그램
US20230105304A1 (en) Proactive avoidance of performance issues in computing environments
KR102418594B1 (ko) Ict 장비 관리 시스템 및 방법
CN112752172B (zh) 一种基于迁移学习的光通道故障诊断方法和***
Rafique et al. TSDN-enabled network assurance: A cognitive fault detection architecture
US7822417B1 (en) Method for predictive maintenance of a communication network
CN111988172B (zh) 一种网络信息管理平台、装置及安全管理方法
US10432451B2 (en) Systems and methods for managing network health
KR101520103B1 (ko) It서비스에서의 어플리케이션 장애 분석 감시 시스템 및 방법
US11477070B1 (en) Identifying root causes of network service degradation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination