CN101252426B - 一种高可靠性分布式冗余环网的实现方法 - Google Patents

一种高可靠性分布式冗余环网的实现方法 Download PDF

Info

Publication number
CN101252426B
CN101252426B CN 200710121620 CN200710121620A CN101252426B CN 101252426 B CN101252426 B CN 101252426B CN 200710121620 CN200710121620 CN 200710121620 CN 200710121620 A CN200710121620 A CN 200710121620A CN 101252426 B CN101252426 B CN 101252426B
Authority
CN
China
Prior art keywords
network
network element
clock
message
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 200710121620
Other languages
English (en)
Other versions
CN101252426A (zh
Inventor
张洪雁
张国刚
陈凡民
马化一
薛百华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyland Technology Co Ltd
Original Assignee
Kyland Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyland Technology Co Ltd filed Critical Kyland Technology Co Ltd
Priority to CN 200710121620 priority Critical patent/CN101252426B/zh
Publication of CN101252426A publication Critical patent/CN101252426A/zh
Application granted granted Critical
Publication of CN101252426B publication Critical patent/CN101252426B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Small-Scale Networks (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种高可靠性分布式冗余环网的实现方法;本发明其特征在于引入精密同步时钟后,组成环形网络的所有设备中,没有主站,每个设备根据预先组态的各自的时间域,轮流维护环形网络的状态。该发明解决了网络中某个交换机全部损坏;某个交换机的交换功能正常,CPU芯片或程序不工作;链路连接不正常等各种问题情况下的网络高可靠性问题。并实现了网络故障精确定位,记录故障发生过程及准确时间,快速恢复的功能。在网络故障恢复时不产生任何倒换时间,提高了工业网络的可靠性。

Description

一种高可靠性分布式冗余环网的实现方法
技术领域
本发明涉及一种工业通信传输方法,更具体的说涉及一种分布式高可靠性工业网络通信的方法。
背景技术
当前,我国化工、煤炭、石油天然气等工业领域安全事故频繁发生,这不仅给企业带来了巨大的经济损失,而且给人身、设备、环境造成了极大威胁,已经成为制约我国经济发展与和谐社会建设的重要因素。
同时,随着我国经济的快速发展和工业制造水平不断提高,工业生产所需的机器设备越来越先进,生产过程的自动化程度大幅度提高,这就使得生产工艺和设备变得复杂,因而设备的安全性也变得极为重要,安全控制***能够有效避免工作人员在操作中发生人机事故,保障人员的生命安全和设备安全。
网络冗余技术是提高工业控制***可靠性的重要手段,网络冗余技术就是对网络通信链路进行冗余备份以确保信息传输的可靠性和稳定性。工业控制***中的控制网络按照拓扑结构可以分为环型网络、总线型网络和网状网络。对于不同网络拓扑,所采用网络冗余方式和故障恢复策略不同的。如ABB公司针对环型网络提出了环网冗余协议(Media Redundancy Protocol,MRP);西门子公司针对总线型网络提出了并行冗余协议(Parallel Redundancy Protocol,PRP);FF针对网状网络提出了网状冗余协议(Cross-network Redundancy Protocol,CRP)。我司提出分布式冗余协议(Distributed Redundancy Protocol,DRP),并由我司负责实现和验证该协议,目前,IEC的TC65工作组正在制定关于网络冗余的国际标准IEC62439。在网络冗余技术方面,我国提出的DRP协议,已经提交到国际电工委员会的TC65相关工作组,也正在积极开展研究,以期在国际标准的制定与发展过程中占有一席之地。
以上几种方法只实现了链路中断的网络冗余保护的方法,不能对网络中的节点故障进行准确的判定、分析、记录、定位等。
一种分布式冗余环网的实现方法,不仅实现网络的快速冗余倒换,而且还可以对网络中发生的事件进行屏蔽,进行准确的记录、分析、定位和维护,从而提高网络的可靠性、安全性。即可以判定,网络是是为工业现场提供高可靠性网络提供了一种可操作的方法。
发明内容
一种分布式冗余环网的实现方法,网络中网元时间同步的状态下,每个设备根据预先组态的时间域,轮流在自己时域内对网络进行维护,避免了环型网络中主站失效时产生的网络风暴;同时定义了网络发生改变时,故障的上报机制,可定位、上报如下网络故障:网络中链路故障、链路正常CPU故障、程序故障;并能对网络的故障进行精确定位,在50台设备组网条件下网络故障时,数据恢复时间小于300ms,网络恢复不产生任何倒换时间;所述的分布式冗余环网的实现方法,当网络拓扑改变后,网络的精密同步路径将自动更新到精度最高的时钟源;所述的分布式冗余环网的实现方法,网络故障时,网络发生一次倒换,网络恢复时,网络不再产生倒换,提高了网络的安全性和数据传输的可靠性;所述的分布式冗余环网的实现方法,能清晰在任意一台设备上获取当前网络拓扑和连接关系。
***支持精密时钟协议,能自动的接受外部时钟源的时钟信号,并能让网络中的其他网元同步到主时钟源上,同步精度最高可达到百ns级。***支持精密时钟协议,能设置网络中某个网元的实时时钟为网络中的主时钟,并能让网络中其他网元同步到主时钟源上。网络中的所有网元都有精密的实时时钟,每个网元能准确的记录网络中发生的事件,能准确的提供历史记录,实现故障精确定位。网络中各个网元需要预先配置发送周期性报文的时间域。每个网元在自己的时间域内,发送网络维护报文。网络恢复时,不再产生任何倒换时间;网络故障时,***倒换时间小于300ms。对网络中任意网元节点产生的上述故障,都可以清晰定位故障类型和发生故障的网元节点。当***产生倒换时,网元可以快速重新同步时间。相邻站间每隔1秒钟发送一次精密时钟报文,校对网络上网元的实时时钟,并确认相邻节点的CPU工作状态。当网络出现链路中断时,网络进入非周期状态,允许发送告警的非周期性报文。网络上各个网元,在收到网络出现故障报告时,退出周期性检测模式,记录网络事件,并停止发送轮流维护信息。
环型网络中,网络中没有固定的根节点,网络的维护是每个网元在预先组态的时间域中完成网络的维护,在下一个时间域内由另外的网元对环型网络进行维护。
在工业交换机中引入精密同步时钟的概念,交换机可以接受外部时钟源或本机的实时时钟作为网络的主时钟。网络中的其他网元节点同步网络中的高级别的时钟。
网络中发生链路中断时,网络失去同步平衡,故障节点发送链路中断的PDU报文,迅速上报链路中断的故障,网络中原来处于BLOCKED状态的端口迁移到FORWARDING状态,并刷新相关的FDB表,网络进行倒换,故障的网络节点的链路端口由原来的FORWARDING状态迁移到BLOCKED状态。记录网络中发生的事件,并上传。当网络链路恢复后,网络重新进行同步,同步正常后,开始进入时间域内的分布维护;此时网络不做倒换,端口状态不做迁移。
在网络正常状态下,精密同步时钟信息在1秒内发送一次,实现网元节点的时间同步。
精密时钟是逐级传送,当上级发送SYNC PDU报文三次以上,相邻的节点没有回应Delay_Req信息的PDU报文,可以认为该网元节点的CPU故障,网络状态开始迁移,网络由环闭进入环开的状态。网络中原来处于BLOCKED状态的端口迁移到FORWARDING状态,故障交换机相邻的两个网元将与故障交换机相连的端口由原来的FORWARDING状态迁移到BLOCKED状态。同时网络的各个网元节点刷新FDB表改变网络路由,记录网络中发生的事件,并上传。
本发明中的报文类型:
同步信息SYNC PDU报文(含网络根节点ID);
回应Delay_Req信息的PDU报文;
Follow up PDU报文;
Delay_Resp PDU报文;
链路中断故障信息PDU报文;
链路中断故障恢复信息PDU报文;
网络周期性维护检测PDU报文。
本发明的有益效果:本发明其主要解决了工业网络可靠性的以下几个问题:
具体解决各种故障下***的稳定性:
1、网络中某个交换机全部损坏;
2、网络中交换机、交换芯片、CPU芯片或程序不正常工作;
3、链路连接不正常;
环型网络中,解决单一固定根节点故障时出现网络风暴;
精确定位网络故障类型、记录、分析;
提高网络的冗余时间。
附图说明
图1流程图;
图2环开网络拓扑图;
图3故障判定流程图。
具体实施方式
1.1网络初始化过程
1.1.1网络自由竞争根节点
网络初始化的过程中,采用竞争的机制;竞争条件下是所有设备的端口处于BLOCKED状态。
所有环上的节点的两个环端口都处于BLOCKED状态。
每个设备在启动后向相邻的设备发送检测PDU报文。
所有网元节点等待最长的三个预置宏周期,检测网上是否有周期性报文,如果没有收到周期性报文,进入竞争主站状态。
每个设备向相邻的节点发送检测PDU报文,选举主站节点;MAC地址最小的节点为首个主站。
首个主站节点在确认自己为主站时,将自己的首环端口由BLOCKED状态迁移到FORWARDING状态,次环端口仍然处于BLOCKED状态。
当环中的其他节点判定自己不是主站时,将自己的两个环端口由BLOCKED状态迁移到FORWARDING状态,如图1。
1.1.2时钟同步过程
网络中的根节点选举结束后,进入时钟同步过程;
Master clock开始发送PTP报文;
从节点与上级时钟交互PTP报文;
从节点与上级时钟同步;
时钟在环型网络的两个离Master clock最远点的链路形成passive端口。
1.2链路故障检测
1.2.1环型网络正常工作
***精密时钟同步完毕后,网络中的所有网元,根据预先组态的各自时间域的顺序,轮流发送网络维护测试报文。
网络正常时,每个网元节点在自己的时间域内发送网络周期性维护检测报文,并将自己的状态写入该报文中,当每个网元收到自己发送的维护测试报文后,将该报文终结。
网络中其它网元节点,收到上级发送的维护测试报文后,将自己的状态写入该报文末端,并进行转发。
1.2.2环闭合----开启
当网络中周期性报文发送的过程中,环网中链路发生中断,此时链路中断点相邻的两个网元上报链路故障报文,该报文优先级最高。
网络中的其他网元在接收到该链路故障报文后,将原来的BLOCKED状态的端口迁移到FORWARDING状态,同时刷新各个网元节点的FDB表。
网络链路中断的节点,将中断的链路端口由原来的FORWARDING状态迁移到BLOCKED状态。
链路故障的交换机记录LINK-DONE事件、链路故障事件和故障的时间。
网络中其他网元收到上报故障报文后,记录网元故障的事件和收到该信息的时间,如图2。
网络处于平静后,仍然根据时间域发送周期性报文,如交换机A只能收到其他交换机发送的报文,而不能收到自己的报文。
1.2.3环开启----闭合
网络链路故障恢复后,表现为交换机可以转发其他交换机发送的报文,但此时该端口处于BLOCKED状态。
恢复故障链路的交换机记录LINK-UP的事件。
轮值的交换机此时收到别的交换机发送的周期性报文和自己发送的周期性报文。所有交换机在收到自己发出的报文后记录网络恢复的事件。
环网的断开点仍然在原来的故障位置。
网络不产生任何倒换操作。
当下一次网络出现故障时,目前处于BLOCKED的端口将从BLOCKED状态迁移到FORWARDING状态。
1.3CPU故障检测
1.3.1CPU故障检测
故障类型:设备LINK正常,能转发业务数据报文,但不能转发业务报文。
故障检测方法:在一定时间段内发送精密同步时钟报文,根据收到精密时钟报文的情况来判定交换机的CPU是否处在故障状态。
故障设备相邻的两个网元的直连端口,立即从FORWARDING状态下迁移到BLOCKED状态。
同时向网络发送故障PDU报文。
1.3.2CPU故障设备恢复
当故障设备恢复后,重新回到网络中,此时直连的相邻两个交换机都处于BLOCKED状态,恢复后的设备的两个端口也处于BLOCKED状态。
新加入的设备和相邻的两个设备,共计三台设备,会启动一个初始化过程,来决定哪台设备将自己的端口BLOCKED,而其他两台设备将所有环端口都转换为FORWARDING状态。
当故障恢复后,该设备与网络中其它设备进行同步,进行时钟修订,启用自己周期检测。
同步完毕后,在轮到自己的时间域时发送网络维护检测报文。
1.4整体设备故障检测与恢复
1.4.1整体设备故障检测
故障类型描述:
设备掉电;
设备LINK正常但不能通信;
1.4.1.1设备掉电
设备掉电的情况下,LINK信号不存在,相邻的设备端口处于LINK-DONE的状态,处理检测机理与1.2中的情况一样。
1.4.1.2设备全部故障
设备LINK状态正常但不能转发所有数据报文;
故障检测方法:在一定时间段内发送精密同步时钟报文,根据收到精密时钟报文的情况来判定交换机的CPU是否处在故障状态,或者根据周期性报文来检测网络的故障。
故障设备相邻的两个网元的直连端口,立即从FORWARDING状态下迁移到BLOCKED状态。
1.4.2损坏设备恢复
当故障设备恢复后,重新回到网络中,此时直连的相邻两个交换机都处于BLOCKED状态,恢复后的设备的两个端口也处于BLOCKED状态。
该网元等待最长的两个宏周期,在最长的两个宏周期内收到网络周期性报文,自动将自己的根更改成网络中的根,同时将一个主环端口由BLOCKED状态更改为FORWARDING状态。
相邻的两个网元在两个宏周期内,收到自己发出的周期性报文后将自己的BLOCKED状态端口由BLOCKED状态更改为FORWARDING状态。
当故障恢复后,首先,该交换机与网络中其它设备进行同步,进行时钟修订,启用自己周期检测。
同步完毕后,在轮到自己的时间域时发送网络维护检测报文。
其他网元记录收到自己发出的周期性报文的时间、LINK-UP的事件,端口由BLOCKED迁移到FORWARDING状态,如图3。
1.5历史故障的记录与查询
用户可以采用查询命令查询网络历史故障记录。

Claims (7)

1.一种分布式冗余环网的实现方法,其特征在于网络中网元时间同步的状态下,每个网元根据预先组态的时间域,在自己的时间域内发送网络周期性维护检测报文,并将自己的状态写入该报文中,当每个网元收到自己发送的维护测试报文后,将该报文终结;当网络中周期性报文发送的过程中,环网中链路发生中断,此时链路中断点相邻的两个网元上报链路故障报文,该报文优先级最高,网路链路中断的网元,将中断的链路端口由原来的FORWARDING状态迁移到BLOCKED状态;所述的分布式冗余环网的实现方法,当网络拓扑的改变后,网络的精密同步路径将自动更新到精度最高的时钟源;所述的分布式冗余环网的实现方法,当故障设备恢复后,重新回到网络中,此时直连的相邻两个交换机都处于BLOCKED状态,恢复后的设备的两个端也处于BLOCKED状态;所述的分布式冗余环网的实现方法,能清晰在每个网元上获取当前网络拓扑和连接关系。
2.根据权利要求1所述的方法,其特征在于***支持精密时钟协议,能自动的接收外部时钟源的时钟信号,并能让网络中的不同于主时钟网元的其他网元同步到主时钟源上,同步精度最高可达到百ns级。
3.根据权利要求1所述的方法,其特征在于***支持精密时钟协议,能设置网络中某个网元的实时时钟为网络中的主时钟,并能让网络中的不同于主时钟网元的其他网元同步到主时钟源上。
4.根据权利要求1或2或3所述的方法,其特征在于网络中的所有网元都有精密的实时时钟,每个网元能准确的记录网络中发生的事件,能准确的提供历史记录。
5.根据权利要求1所述的方法,其特征在于当***产生倒换时,网元可以重新同步时间。
6.根据权利要求2或3所述的方法,其特征在于相邻在作为主站网元的网元间每隔1秒钟发送一次精密时钟报文,校对网络上网元的实时时钟,并确认相邻在作为主站网元的网元的CPU工作状态。
7.根据权利要求1所述的方法,其特征在于当网络出现链路中断时,允许发送告警的非周期性报文。
CN 200710121620 2007-09-11 2007-09-11 一种高可靠性分布式冗余环网的实现方法 Active CN101252426B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200710121620 CN101252426B (zh) 2007-09-11 2007-09-11 一种高可靠性分布式冗余环网的实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200710121620 CN101252426B (zh) 2007-09-11 2007-09-11 一种高可靠性分布式冗余环网的实现方法

Publications (2)

Publication Number Publication Date
CN101252426A CN101252426A (zh) 2008-08-27
CN101252426B true CN101252426B (zh) 2011-05-11

Family

ID=39955624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200710121620 Active CN101252426B (zh) 2007-09-11 2007-09-11 一种高可靠性分布式冗余环网的实现方法

Country Status (1)

Country Link
CN (1) CN101252426B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112012005949B4 (de) * 2012-02-27 2016-01-28 Kyland Technology Co., Ltd Verfahren zur Verwirklichung eines redundanten Netzwerkes

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751020B (zh) * 2008-12-17 2011-11-30 中国科学院沈阳自动化研究所 一种高可用性功能块冗余方法
CN102223222A (zh) * 2010-04-16 2011-10-19 苏州恒启自动化工程有限公司 一种支持5ms内快速恢复冗余技术、符合轨道交通控制***要求的管理型千兆工业以太网交换机
CN102158384A (zh) * 2011-01-25 2011-08-17 武汉迈威光电技术有限公司 一种新型的MRing以太网环网保护技术
CN102724062B (zh) * 2012-04-16 2016-12-14 南京中兴软件有限责任公司 时钟同步***的故障定位方法、装置及***
CN103346944B (zh) * 2013-06-18 2016-07-27 北京卓越信通电子股份有限公司 多点协同检测链路的环网
CN105099771B (zh) * 2015-07-02 2018-04-24 北京东土科技股份有限公司 一种主备链路切换、实现链路冗余备份方法及装置
CN106656387B (zh) * 2015-10-30 2018-09-07 华为技术有限公司 用于检测时钟同步路径的方法、节点及***
JP6665924B2 (ja) * 2016-02-22 2020-03-13 富士電機株式会社 制御ネットワークシステム、そのノード装置
CN109167742B (zh) * 2018-08-15 2021-05-18 北京东土科技股份有限公司 双归属协议部署***、方法、装置、交换机和存储介质
CN109600290A (zh) * 2018-12-27 2019-04-09 苏州拓康自动化技术有限公司 一种环形网络中多主共存的方法
CN109981353B (zh) * 2019-03-06 2022-05-24 北京全路通信信号研究设计院集团有限公司 一种机框式网络通信设备中的邻站冗余保护方法及***
CN112737938B (zh) * 2020-11-30 2022-09-27 北京东土军悦科技有限公司 Drp倒换方法、装置、设备及介质
CN112714461B (zh) * 2021-01-29 2022-05-31 四川安迪科技实业有限公司 一种dama卫星网络中心站保护倒换方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1567889A (zh) * 2003-06-25 2005-01-19 华为技术有限公司 一种主备设备自动切换的方法
CN1848751A (zh) * 2005-04-04 2006-10-18 华为技术有限公司 在数字用户线集中器上防止用户侧环网的方法
CN1905490A (zh) * 2006-08-18 2007-01-31 华为技术有限公司 一种rrpp与局部stp组网故障恢复时防止环路的方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1567889A (zh) * 2003-06-25 2005-01-19 华为技术有限公司 一种主备设备自动切换的方法
CN1848751A (zh) * 2005-04-04 2006-10-18 华为技术有限公司 在数字用户线集中器上防止用户侧环网的方法
CN1905490A (zh) * 2006-08-18 2007-01-31 华为技术有限公司 一种rrpp与局部stp组网故障恢复时防止环路的方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112012005949B4 (de) * 2012-02-27 2016-01-28 Kyland Technology Co., Ltd Verfahren zur Verwirklichung eines redundanten Netzwerkes
US9432250B2 (en) 2012-02-27 2016-08-30 Kyland Technology Co., Ltd Redundant network implementation method

Also Published As

Publication number Publication date
CN101252426A (zh) 2008-08-27

Similar Documents

Publication Publication Date Title
CN101252426B (zh) 一种高可靠性分布式冗余环网的实现方法
CN204886410U (zh) 一种基于智能变电站的二次设备状态监测***
CN104821870B (zh) 基于主站智能电网调度技术支持***的时钟同步方法
CN103856360A (zh) 一种同步链路故障检测方法及装置
CN101013992A (zh) 一种以太网自动保护方法
CN107204663B (zh) 一种分布式智能配电网的后备保护方法
CN103067206A (zh) 物联网跨机房分布式全自动热备用服务器切换***
CN101316051A (zh) 基于iec61850变电站自动化***的网络通信记录分析***及方法
CN101262401A (zh) 一种环形网络中实现网络恢复的方法
CN102986106A (zh) 用于在变电站***中的装置之间转移控制的方法及其装置
CN103872640B (zh) 一种配电自动化终端单元离线故障快速自愈控制方法
Kasztenny et al. Communications and data synchronization for line current differential schemes
CN105024841A (zh) 一种时钟和时间同步网络的同步故障处理方法和***
CN109104325A (zh) 基于CANopen协议的列车网络数据传输方法、***及其装置
CN112468592A (zh) 一种基于电力信息采集的终端在线状态侦测方法及***
EP2866388B1 (en) Method for detecting correctness of optic fiber connection based on radio remote unit (rru) looped network, and base band unit (bbu)
CN102035680A (zh) 一种跨设备链路保护方法及***
Liu et al. A reliability assessment method of cyber physical distribution system
CN103428009A (zh) 实现分组同步网的运行管理和维护(oam)方法及装置
CN104796287A (zh) 一种epon环网故障检测方法
CN104796272B (zh) 网络时钟的监测方法与装置
KR101156097B1 (ko) 이더넷 파워링크에서의 마스터 이중화 방법
WO2023186730A1 (en) Method of monitoring operation of an electric power system and monitoring system
CN106896792B (zh) 数据同步方法及装置
CN111429008B (zh) 一二次***的可靠性评估方法、装置设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant