TWI578739B - Obstacle diagnosis system and method thereof - Google Patents

Obstacle diagnosis system and method thereof Download PDF

Info

Publication number
TWI578739B
TWI578739B TW104120453A TW104120453A TWI578739B TW I578739 B TWI578739 B TW I578739B TW 104120453 A TW104120453 A TW 104120453A TW 104120453 A TW104120453 A TW 104120453A TW I578739 B TWI578739 B TW I578739B
Authority
TW
Taiwan
Prior art keywords
obstacle
module
diagnosis
obstacles
client
Prior art date
Application number
TW104120453A
Other languages
English (en)
Other versions
TW201701615A (zh
Inventor
Chun Yu Chang
An Ni Ren
Chieh Feng Li
Min Yi Tsai
Original Assignee
Chunghwa Telecom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chunghwa Telecom Co Ltd filed Critical Chunghwa Telecom Co Ltd
Priority to TW104120453A priority Critical patent/TWI578739B/zh
Publication of TW201701615A publication Critical patent/TW201701615A/zh
Application granted granted Critical
Publication of TWI578739B publication Critical patent/TWI578739B/zh

Links

Landscapes

  • Debugging And Monitoring (AREA)

Description

障礙診斷系統及其方法
本發明係關於一種應用於障礙診斷系統及其方法,特別係指在針對x86架構之軟體定義儲存伺服器(Software-Defined Storage),即時診斷當下軟體定義儲存伺服器系統是否發生障礙以及預測系統是否即將發生障礙。
過往係利用一或多個裝設於行動網路機房之訊務監測儀,自動進行行動網路各介面訊務監測,並將原始訊務紀錄送往一或多個訊務解碼器進行解碼;再將已解碼之訊務紀錄送往訊務分析器進行分析;該訊務分析器進行多介面訊務分析及專家系統化問題診斷後將分析結果送往分析結果儲存庫進行儲存。訊務分析結果呈現器亦可主動發送行動網路訊務分析報表及行動網路運作問題告警給系統使用者。
或是針對系統故障診斷提出的一個架構,其中包括故障訓練模組與診斷模組。在訓練階段需要人為對目標系統進行特定故障注入,然後藉由可讀指令來監聽並收集發生特定故障時系統中可觀測的資料。收集到的資料將被訓練成故障診斷模型,其中包含置換圖(substitution graph)與檢測圖(detection graph)。這個診斷模型將在未來被用於診斷運行中的系統是否發生故障。在故障診斷階段,故障診斷模組 會根據監聽到的系統資料與診斷模型進行比對。如果監聽到的資料與模型相匹配,則可判斷系統存在相應的故障,而這樣的系統必須於試營運階段透過測試來訓練診斷模型,且並不能準確診斷出可能發生那些故障。
本案發明人鑑於上述習用方式所衍生的各項缺點,乃亟思加以改良創新,並經多年苦心孤詣潛心研究後,終於成功研發完成本障礙診斷系統及其方法。
本發明的目的即在於提出一包括障礙診斷系統及其方法,針對x86架構之軟體定義儲存伺服器(Software-Defined Storage),障礙診斷模組依據障礙診斷知識庫,即時診斷當下軟體定義儲存伺服器系統是否發生障礙以及預測系統是否即將發生障礙。當障礙診斷模組依據障礙知識庫得知障礙發生時,立即發送告警並通知障礙分析模組,障礙分析模組依據障礙資訊、軟體定義儲存伺服器狀態以及測試客戶端狀態,三者經過統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法建立關聯分析,關聯模型結果更新至障礙診斷知識庫。障礙知識庫的持續自我學習能夠讓系統診斷與預測未知障礙,提升軟體定義儲存伺服器系統障礙診斷正確與可靠度。
障礙診斷知識庫初始注入已知障礙,已知障礙可為軟體定義儲存伺服器的處理器使用率門檻值、記憶體使用率門檻值、磁碟存取吞吐量門檻值、每秒操作次數門檻值、監測特定程序存在與否、客戶端回應時間或延遲時間門檻值等,或是以上各種條件之組合。障礙診斷知識庫初始後,系 統運行過程中持續診斷障礙,同時透過軟體定義儲存伺服器量測回報模組與客戶端量測回報模組回報數據收集模組軟體定義儲存伺服器狀態以及客戶端狀態,數據收集模組收集軟體定義儲存伺服器狀態以及客戶端狀態資訊,狀態包含軟體定義儲存伺服器即時處理器使用率、記憶體使用率、磁碟存取吞吐量、每秒操作次數、特定程序存在與否以及客戶端反應時間、延遲時間等資訊,經過過濾、分析後存放於資料庫內。當障礙診斷模組依據障礙知識庫得知障礙發生時,發送告警並通知障礙分析模組,障礙分析模組藉由障礙、軟體定義儲存伺服器狀態以及客戶端狀態,三者經過統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法建立關聯分析,關聯模型結果更新至障礙診斷知識庫。障礙診斷知識庫藉此自我學習之機制,能夠令障礙診斷更加準確。當障礙診斷知識庫越來越完整,障礙診斷模組只要觀察到系統滿足某些條件,即可預測障礙即將發生,達到障礙預測之目的。障礙知識庫的持續自我學習能夠讓系統準確診斷與預測未知障礙,提升軟體定義儲存伺服器系統障礙診斷正確與可靠度。
一種障礙診斷系統,係包括一虛擬化資源管理平台,為接收一中央控制與監測系統之請求;一虛擬客戶端群集,為虛擬客戶端,接受虛擬化資源管理平台自動佈建測試環境進行測試,其虛擬客戶端,另具有一客戶端量測模組,以提供一障礙分析系統需接收之回報資訊;一軟體定義儲存伺服器,具有一障礙回報代理,而障礙回報代理另具有一量測回報模組,以提供該障礙分析系統需接收之回報資訊;中央控制與監測系統,具有一障礙分析系統,並收集來自虛擬客戶端群集與該軟體定義儲存伺服器之回報狀態資訊。
其中障礙分析系統,另具有:一數據收集模組,於系統運行過程中持續接收障礙回報代理以及虛擬客戶端之狀態資訊,並經由統計、過濾、分析後存放於資料庫;一障礙分析模組,於障礙發生的同時,透過障礙、軟體定義儲存伺服器以及虛擬客戶端進行統計,並建立關聯分析;一障礙診斷知識庫,則具有自行記錄學習障礙診斷;一障礙診斷模組,依據障礙診斷知識庫,診斷是否已經存在障礙以及預測障礙是否即將發生,其中建立關聯分析,係為統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法。
一種障礙診斷方法,其流程包括:障礙回報代理之量測回報模組回傳軟體定義儲存伺服器狀態於數據收集模組;客戶端量測回報模組回傳即時客戶端的狀態測試資訊於該數據收集模組;數據收集模組於系統運行過程中持續接該收軟體定義儲存伺服狀態以及客戶端狀態資訊,並經過統計、過濾、分析後存放於資料庫內;障礙診斷模組則依據障礙診斷知識庫,即時診斷是否已經存在障礙以及預測障礙是否即將發生,若診斷或預測出障礙,立即產生告警通知;障礙分析模組在障礙發生的同時會透過障礙、軟體定義儲存伺服器以及客戶端狀態,三者經過統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法建立關聯分析,而關聯分析結果則更新至障礙診斷知識庫。
其中該障礙診斷知識庫,係同時可以自我學習,使障礙診斷更為準確。
本發明所提供一種障礙診斷系統及其方法,與其他習用技術相互比較時,更具備下列優點:
1.本發明讓系統運行過程中,障礙診斷模組依據所自我學習建立之障礙知識庫即時監測客戶端與軟體定義儲存伺服器狀態,立即診斷軟體定義儲存伺服器系統是否發生障礙以及預測是否即將發生障礙。
2.本發明於障礙發生時會立即回報障礙分析模組,障礙分析模組依據障礙資訊、軟體定義儲存伺服器狀態以及測試客戶端狀態,三者經過統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法建立關聯分析,關聯模型結果更新至障礙診斷知識庫。障礙知識庫的持續自我學習能夠讓系統診斷與預測未知障礙,提升軟體定義儲存伺服器系統障礙診斷正確與可靠度。
110‧‧‧虛擬化資源管理平台
120‧‧‧虛擬客戶端群集
121‧‧‧虛擬客戶端
1211‧‧‧客戶端量測模組
130‧‧‧軟體定義儲存伺服器
131‧‧‧障礙回報代理
1311‧‧‧量測回報模組
140‧‧‧中央控制與監測系統
141‧‧‧障礙分析系統
1411‧‧‧數據收集模組
1412‧‧‧障礙分析模組
1413‧‧‧障礙診斷知識庫
1414‧‧‧障礙診斷模組
1415‧‧‧資料庫
S310~S350‧‧‧障礙診斷流程
請參閱有關本發明之詳細說明及其附圖,將可進一步瞭解本發明之技術內容及其目的功效;有關附圖為:圖1為本發明障礙診斷系統及其方法之架構圖;圖2為本發明障礙診斷系統及其方法之模組圖;圖3為本發明障礙診斷系統及其方法之流程圖。
為了使本發明的目的、技術方案及優點更加清楚明白,下面結合附圖及實施例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅用以解釋本發明,但並不用於限定本發明。
以下,結合附圖對本發明進一步說明:請參閱圖1、及圖2所示,為本發明障礙診斷系統及其方法之架構圖及模組圖,其中一種障礙診斷系統,係包括:一虛擬化資源管理平台110,是為接收一中央控制與監測系統140之請求;一虛擬客戶端群集120,是為虛擬客戶端121,為接受虛擬化資源管理平台110自動佈建測試環境進行測試,其虛擬客戶端121,另具有一客戶端量測模組1211,以提供一障礙分析系統141需接收之回報資訊;一軟體定義儲存伺服器130,是具有一障礙回報代理131,其障礙回報代理131,另具有一量測回報模組1311,以提供一障礙分析系統141需接收之回報資訊;中央控制與監測系統140,是具有障礙分析系統141,並收集來自虛擬客戶端群集120與軟體定義儲存伺服器130之回報狀態資訊。
其障礙分析系統141,另具有一數據收集模組1411,於系統運行過程中持續接收障礙回報代理131以及虛擬客戶端121之狀態資訊,並經由統計、過濾、分析後存放於資料庫1415;一障礙分析模組1412,係於障礙發生的同時,透過障礙、軟體定義儲存伺服器以及虛擬客戶端進行統計,並建立關聯分析;一障礙診斷知識庫1413,具有自行記錄學習障礙診斷;一障礙診斷模組1414,依據該障礙診斷知識庫1413,診斷是否已經存在障礙以及預測障礙是否即將發生。
其建立關聯分析,是為統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法。
一種障礙診斷方法,其流程包括:S310障礙回報代理之量測回報模組回傳軟體定義儲存伺服器狀態於數據收集模組; S320客戶端量測回報模組回傳即時客戶端的狀態測試資訊於該數據收集模組;S330數據收集模組於系統運行過程中持續接該收軟體定義儲存伺服狀態以及客戶端狀態資訊,並經過統計、過濾、分析後存放於資料庫內;S340障礙診斷模組則依據障礙診斷知識庫,即時診斷是否已經存在障礙以及預測障礙是否即將發生,若診斷或預測出障礙,立即產生告警通知;S350障礙分析模組在障礙發生的同時會透過障礙、軟體定義儲存伺服器以及客戶端狀態,三者經過統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法建立關聯分析,而關聯分析結果則更新至障礙診斷知識庫。
其中障礙診斷知識庫,可以同時自我學習,使障礙診斷更為準確。
上列詳細說明乃針對本發明之一可行實施例進行具體說明,惟該實施例並非用以限制本發明之專利範圍,凡未脫離本發明技藝精神所為之等效實施或變更,均應包含於本案之專利範圍中。
綜上所述,本案不僅於技術思想上確屬創新,並具備習用之傳統方法所不及之上述多項功效,已充分符合新穎性及進步性之法定發明專利要件,爰依法提出申請,懇請 貴局核准本件發明專利申請案,以勵發明,至感德便。
110‧‧‧虛擬化資源管理平台
120‧‧‧虛擬客戶端群集
121‧‧‧虛擬客戶端
130‧‧‧軟體定義儲存伺服器
131‧‧‧障礙回報代理
140‧‧‧中央控制與監測系統
141‧‧‧障礙分析系統

Claims (3)

  1. 一種障礙診斷系統,係包括:一虛擬化資源管理平台,係為接收一中央控制與監測系統之請求;一虛擬客戶端群集,係為虛擬客戶端,係接受該虛擬化資源管理平台自動佈建測試環境進行測試,其虛擬客戶端,另具有一客戶端量測模組,以提供一障礙分析系統需接收之回報資訊;一軟體定義儲存伺服器,係具有一障礙回報代理,其該障礙回報代理,係另具有一量測回報模組,係以提供該障礙分析系統需接收之回報資訊;該中央控制與監測系統,係具有一障礙分析系統,並收集來自該虛擬客戶端群集與該軟體定義儲存伺服器之回報狀態資訊。
  2. 如申請專利範圍第1項所述之障礙診斷系統,其中該障礙分析系統,係另具有:一數據收集模組,係於該系統運行過程中持續接收該障礙回報代理以及該虛擬客戶端之狀態資訊,並經由統計、過濾、分析後存放於資料庫;一障礙分析模組,係於障礙發生的同時,透過障礙、軟體定義儲存伺服器以及虛擬客戶端進行統計,並建立關聯分析;一障礙診斷知識庫,係具有自行記錄學習障礙診斷;一障礙診斷模組,係依據該障礙診斷知識庫,診斷是否已經存在障礙以及預測障礙是否即將發生。
  3. 一種障礙診斷方法,其流程包括:障礙回報代理之量測回報模組回傳軟體定義儲存伺服器狀態於數據收集模組;客戶端量測回報模組回傳即時客戶端的狀態測試資訊於該數據收集模組;數據收集模組於系統運行過程中持續接該收軟體定義儲存伺服狀態以及客戶端狀態資訊,並經過統計、過濾、分析後存放於資料庫內;障礙診斷模組則依據障礙診斷知識庫,即時診斷是否已經存在障礙以及預測障礙是否即將發生,若診斷或預測出障礙,立即產生告警通知;障礙分析模組在障礙發生的同時會透過障礙、軟體定義儲存伺服器以及客戶端狀態,三者經過統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法建立關聯分析,而關聯分析結果則更新至障礙診斷知識庫。
TW104120453A 2015-06-25 2015-06-25 Obstacle diagnosis system and method thereof TWI578739B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW104120453A TWI578739B (zh) 2015-06-25 2015-06-25 Obstacle diagnosis system and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW104120453A TWI578739B (zh) 2015-06-25 2015-06-25 Obstacle diagnosis system and method thereof

Publications (2)

Publication Number Publication Date
TW201701615A TW201701615A (zh) 2017-01-01
TWI578739B true TWI578739B (zh) 2017-04-11

Family

ID=58400820

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104120453A TWI578739B (zh) 2015-06-25 2015-06-25 Obstacle diagnosis system and method thereof

Country Status (1)

Country Link
TW (1) TWI578739B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108780319A (zh) * 2018-06-08 2018-11-09 珊口(深圳)智能科技有限公司 软件更新方法、***、移动机器人及服务器

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI664835B (zh) * 2017-10-18 2019-07-01 中華電信股份有限公司 用於分析行動網路中用戶通訊中斷成因之智能方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6894610B2 (en) * 2001-04-24 2005-05-17 Msa Auer Gmbh Monitoring and warning system for individuals working under hazardous operating conditions
US7239239B2 (en) * 2001-12-13 2007-07-03 Daimlerchrysler Ag Dialog system for warning and information systems
CN103414581A (zh) * 2013-07-24 2013-11-27 佳都新太科技股份有限公司 一种基于数据挖掘的设备故障报警预测处理机制
CN103888287A (zh) * 2013-12-18 2014-06-25 北京首都国际机场股份有限公司 信息***一体化运维监控服务预警平台及其实现方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6894610B2 (en) * 2001-04-24 2005-05-17 Msa Auer Gmbh Monitoring and warning system for individuals working under hazardous operating conditions
US7239239B2 (en) * 2001-12-13 2007-07-03 Daimlerchrysler Ag Dialog system for warning and information systems
CN103414581A (zh) * 2013-07-24 2013-11-27 佳都新太科技股份有限公司 一种基于数据挖掘的设备故障报警预测处理机制
CN103888287A (zh) * 2013-12-18 2014-06-25 北京首都国际机场股份有限公司 信息***一体化运维监控服务预警平台及其实现方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108780319A (zh) * 2018-06-08 2018-11-09 珊口(深圳)智能科技有限公司 软件更新方法、***、移动机器人及服务器

Also Published As

Publication number Publication date
TW201701615A (zh) 2017-01-01

Similar Documents

Publication Publication Date Title
US11442803B2 (en) Detecting and analyzing performance anomalies of client-server based applications
Sauvanaud et al. Anomaly detection and root cause localization in virtual network functions
US9652316B2 (en) Preventing and servicing system errors with event pattern correlation
US8156377B2 (en) Method and apparatus for determining ranked causal paths for faults in a complex multi-host system with probabilistic inference in a time series
US8291263B2 (en) Methods and apparatus for cross-host diagnosis of complex multi-host systems in a time series with probabilistic inference
US20210149790A1 (en) Event specific log file generation
US20050102567A1 (en) Method and architecture for automated fault diagnosis and correction in a computer system
Mariani et al. Predicting failures in multi-tier distributed systems
US8874642B2 (en) System and method for managing the performance of an enterprise application
KR20190021560A (ko) 빅데이터를 활용한 고장예지보전시스템 및 고장예지보전방법
US9043652B2 (en) User-coordinated resource recovery
CN111858254B (zh) 数据的处理方法、装置、计算设备和介质
Li et al. Fighting the fog of war: Automated incident detection for cloud systems
JP2016167259A (ja) システムの可用性、特にセーフティクリティカルシステムの可用性を解析するための方法および装置
TWI578739B (zh) Obstacle diagnosis system and method thereof
Raj et al. Cloud infrastructure fault monitoring and prediction system using LSTM based predictive maintenance
US20090161559A1 (en) Error identification in a computer-based network
CN111901172B (zh) 基于云计算环境下的应用服务监控方法及***
US8972789B2 (en) Diagnostic systems for distributed network
TW201723847A (zh) 應用於雲端虛擬機自動化測試環境部屬與測試之系統與方法
CN109309575A (zh) 一种确定监控***健康度的方法和装置
JP6832890B2 (ja) 監視装置、監視方法、及びコンピュータプログラム
Samir et al. Anomaly detection and analysis for reliability management clustered container architectures
Samir et al. A controller for anomaly detection, analysis and management for self-adaptive container clusters
Chan et al. Debugging incidents in Google's distributed systems

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees