CN106330598A - 一种通过zabbix监控hadoop的方法 - Google Patents

一种通过zabbix监控hadoop的方法 Download PDF

Info

Publication number
CN106330598A
CN106330598A CN201610659328.3A CN201610659328A CN106330598A CN 106330598 A CN106330598 A CN 106330598A CN 201610659328 A CN201610659328 A CN 201610659328A CN 106330598 A CN106330598 A CN 106330598A
Authority
CN
China
Prior art keywords
zabbix
dfs
trapper
hadoop
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610659328.3A
Other languages
English (en)
Inventor
付迅
周庆勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Software Co Ltd
Original Assignee
Inspur Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Software Co Ltd filed Critical Inspur Software Co Ltd
Priority to CN201610659328.3A priority Critical patent/CN106330598A/zh
Publication of CN106330598A publication Critical patent/CN106330598A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种通过zabbix监控hadoop的方法,所述方法通过在zabbix***中创建一个监控对象,在此监控对象下创建若干监控项,所述监控项的数据由shell脚本hadoop.sh来获取,通过抓取namenode的dfshealth.jsp页面,解析出存储空间数据与节点的运行情况,然后用zabbix_sender把数据发送给zabbix。本发明可以实时监控hadoop集群的存储空间以及节点的运行情况以及块与文件的个数,并在Web界面上实时展现出来,当占用资源超出指定大小时产生告警信息提醒用户,构思合理、使用方便、节省人力、智能化程度高等特点,因而具有很好的推广使用价值。

Description

一种通过zabbix监控hadoop的方法
技术领域
本发明涉及计算机自动化运维与监控技术领域,具体涉及一种通过zabbix监控hadoop的方法,一种通过zabbix监控***与shell脚本监控hadoop集群的存储空间、节点的运行情况以及块与文件的个数的方法。
背景技术
随着信息时代的持续发展,IT运维已经成为IT服务内涵中重要的组成部分。面对越来越复杂的业务,面对越来越多样化的用户需求,不断扩展的IT应用需要越来越合理的模式来保障IT服务能灵活便捷、安全稳定地持续保障,这种模式中的保障因素就是IT运维。从初期的几台服务器发展到庞大的数据中心,单靠人工已经无法满足在技术、业务、管理等方面的要求,那么标准化、自动化、架构优化、过程优化等降低IT服务成本的因素越来越被人们所重视。Hadoop设计之初的目标就定位于高可靠性、高可拓展性、高容错性和高效性,正是这些设计上与生俱来的优点,才使得hadoop一出现就受到众多大公司的青睐,同时也引起了研究界的普遍关注。到目前为止,hadoop技术在互联网领域已经得到了广泛的运用。对hadoop进行监控可以让管理人员掌握它们的运行状况。
Zabbix是一个基于Web界面的提供分布式***监视以及网络监视功能的企业级的开源解决方案。
本发明基于zabbix进行扩展。由于zabbix的Web***有很多弊端,所以采用Spring、iBatis、JSP、Highcharts开发了一套新的Web***。
发明内容
本发明要解决的技术问题是:本发明提供一种通过zabbix监控hadoop的方法。
本发明所采用的技术方案为:
一种通过zabbix监控hadoop的方法,所述方法通过在zabbix***中创建一个监控对象,在此监控对象下创建若干监控项,所述监控项的数据由shell脚本hadoop.sh来获取,通过抓取namenode的dfshealth.jsp页面,解析出存储空间数据与节点的运行情况,然后用zabbix_sender把数据发送给zabbix。
所述监控项的名称,键值,类型如下:
DFS可用的存储空间大小,available_dfs_storage,Trapper
DFS存储空间使用率,ul_dfs_storage,Trapper
DFS存储空间空闲率,al_dfs_storage,Trapper
DFS已经使用的存储空间大小,dfs_use_storage,Trapper
下线的节点数目,decommissioned_nodes,Trapper
不可用的节点数目,dead_nodes,Trapper
存储空间总大小,storage_capacity,Trapper
正常节点,live_nodes,Trapper
非DFS使用的空间大小,non_dfs_use_storage,Trapper
块个数,dfs_blocks,Trapper
文件个数,file_directory_count,Trapper。
所述shell脚本hadoop.sh通过linux定时器crontab定时执行,将hadoop.sh放到zabbix目录下,赋可执行权限,通过在/etc/crontab中增加以下命令来实现每3分钟执行一次。
所述shell脚本hadoop.sh运行流程如下:
1)输入参数和文件变量
2)抓取dfshealth.jsp并过滤,将结果输出到RAW_FILE
3)分别将各监控项的数据从RAW_FILE中解析出来
4)将数据按zabbix规定格式输出到DATA_FILE中
5)通过zabbix_sender将数据发送给zabbix。
本发明的有益效果为:
本发明可以实时监控hadoop集群的存储空间以及节点的运行情况以及块与文件的个数,并在Web界面上实时展现出来,当占用资源超出指定大小时产生告警信息提醒用户,构思合理、使用方便、节省人力、智能化程度高等特点,因而具有很好的推广使用价值。
具体实施方式
下面根据具体实施方式对本发明进一步说明:
实施例1:
一种通过zabbix监控hadoop的方法,在zabbix***中创建一个监控对象,名称任意,在此监控对象下创建若干监控项,所述监控项的数据由shell脚本hadoop.sh来获取,通过抓取namenode的dfshealth.jsp页面,解析出存储空间数据与节点的运行情况,然后用zabbix_sender把数据发送给zabbix。
实施例2
在实施例1的基础上,本实施例所述监控项的名称,键值,类型如下:
DFS可用的存储空间大小,available_dfs_storage,Trapper
DFS存储空间使用率,ul_dfs_storage,Trapper
DFS存储空间空闲率,al_dfs_storage,Trapper
DFS已经使用的存储空间大小,dfs_use_storage,Trapper
下线的节点数目,decommissioned_nodes,Trapper
不可用的节点数目,dead_nodes,Trapper
存储空间总大小,storage_capacity,Trapper
正常节点,live_nodes,Trapper
非DFS使用的空间大小,non_dfs_use_storage,Trapper
块个数,dfs_blocks,Trapper
文件个数,file_directory_count,Trapper。
实施例3
在实施例1或2的基础上,本实施例所述shell脚本hadoop.sh通过linux定时器crontab定时执行,将hadoop.sh放到zabbix目录下,赋可执行权限,通过在/etc/crontab中增加以下命令来实现每3分钟执行一次:
*/3****root/usr/local/zabbix/plugins/hadoop.sh 127.0.0.1 10051127.0.0.150070hadooptest。
实施例4
在实施例3的基础上,本实施例所述shell脚本hadoop.sh运行流程如下:
1)输入参数和文件变量
ZABBIX_SERVER_IP=$1 #zabbix server的ip
ZABBIX_SERVER_PORT=$2 #zabbix server的端口
NAMENODE_IP=$3 #namenode的ip
NAMENODE_PORT=$4 #namenode的端口
HOSTNAME=$5 #监控对象名称
RAW_FILE="/tmp/${HOSTNAME}.raw" #抓取dfshealth.jsp并过滤后的原始文件路径
DATA_FILE="/tmp/${HOSTNAME}.data"#监控项数据文件路径
LOG_FILE="/tmp/${HOSTNAME}.log" #日志文件路径
2)抓取dfshealth.jsp并过滤,将结果输出到RAW_FILE
curl--silent http://${NAMENODE_IP}:${NAMENODE_PORT}/dfshealth.jsp 2>$LOG_FILE|sed's/<[^>]*>/|/g'|sed's/|*|/|/g'|sed's/:*|/|/g'>$RAW_FILE
3)分别将11个监控项的数据从RAW_FILE中解析出来
#available_dfs_storage
available_dfs_storage=$(egrep'\|Configured Capacity\|'$RAW_FILE|cut-f13-d'|'|cut-f2-d'')
unit=$(egrep'\|Configured Capacity\|'$RAW_FILE|cut-f13-d'|'|cut-f3-d'')
#ul_dfs_storage
ul_dfs_storage=$(egrep'\|Configured Capacity\|'$RAW_FILE|cut-f16-d'|'|cut-f2-d''|cut-f1-d'%')
#al_dfs_storage
al_dfs_storage=$(egrep'\|Configured Capacity\|'$RAW_FILE|cut-f19-d'|'|cut-f2-d''|cut-f1-d'%')
#dfs_use_storage
dfs_use_storage=$(egrep'\|Configured Capacity\|'$RAW_FILE|cut-f7-d'|'|cut-f2-d'')
#decommissioned_nodes
decommissioned_nodes=$(egrep'\|Configured Capacity\|'$RAW_FILE|cut-f48-d'|'|cut-f2-d'')
#live_nodes
live_nodes=$(egrep'\|Configured Capacity\|'$RAW_FILE|cut-f40-d'|'|cut-f2-d'')
#dead_nodes
dead_nodes=$(egrep'\|Configured Capacity\|'$RAW_FILE|cut-f44-d'|'|cut-f2-d'')
#storage_capacity
storage_capacity=$(egrep'\|Configured Capacity\|'$RAW_FILE|cut-f4-d'|'|cut-f2-d'')
#non_dfs_use_storage
non_dfs_use_storage=$(egrep'\|Configured Capacity\|'$RAW_FILE|cut-f10-d'|'|cut-f2-d'')
#file_directory_count
file_directory_count=$(egrep'files and directories,.*blocks.*total'$RAW_FILE|cut-f2-d''|cut-f2-d'|')
#dfs_blocks
dfs_blocks=$(egrep'files and directories,.*blocks.*total'$RAW_FILE|cut-f6-d'')
4)将数据按zabbix规定格式输出到DATA_FILE中
echo
"$HOSTNAME file_directory_count$file_directory_count
$HOSTNAME dfs_blocks$dfs_blocks
$HOSTNAME storage_capacity$storage_capacity
$HOSTNAME dfs_use_storage$dfs_use_storage
$HOSTNAME non_dfs_use_storage$non_dfs_use_storage
$HOSTNAME available_dfs_storage$available_dfs_storage
$HOSTNAME ul_dfs_storage$ul_dfs_storage
$HOSTNAME al_dfs_storage$al_dfs_storage
$HOSTNAME live_nodes$live_nodes
$HOSTNAME dead_nodes$dead_nodes
$HOSTNAME decommissioned_nodes$decommissioned_nodes">$DATA_FILE
5)通过zabbix_sender将数据发送给zabbix
/usr/local/zabbix/bin/zabbix_sender-z${ZABBIX_SERVER_IP}-p${ZABBIX_SERVER_PORT}-i${DATA_FILE}-vv 2>>${LOG_FILE}1>>${LOG_FILE}
其中脚本的5个参数分别对应着zabbix server的ip、zabbix server的端口、namenode的ip、namenode的端口、监控对象名称。
实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (4)

1.一种通过zabbix监控hadoop的方法,其特征在于:所述方法通过在zabbix***中创建一个监控对象,在此监控对象下创建若干监控项,所述监控项的数据由shell脚本hadoop.sh来获取,通过抓取namenode的dfshealth.jsp页面,解析出存储空间数据与节点的运行情况,然后用zabbix_sender把数据发送给zabbix。
2.根据权利要求1所述的一种通过zabbix监控hadoop的方法,其特征在于,所述监控项的名称,键值,类型如下:
DFS可用的存储空间大小,available_dfs_storage,Trapper
DFS存储空间使用率,ul_dfs_storage,Trapper
DFS存储空间空闲率,al_dfs_storage,Trapper
DFS已经使用的存储空间大小,dfs_use_storage,Trapper
下线的节点数目,decommissioned_nodes,Trapper
不可用的节点数目,dead_nodes,Trapper
存储空间总大小,storage_capacity,Trapper
正常节点,live_nodes,Trapper
非DFS使用的空间大小,non_dfs_use_storage,Trapper
块个数,dfs_blocks,Trapper
文件个数,file_directory_count,Trapper。
3.根据权利要求1或2所述的一种通过zabbix监控hadoop的方法,其特征在于:所述shell脚本hadoop.sh通过linux定时器crontab定时执行,将hadoop.sh放到zabbix目录下,赋可执行权限,通过在/etc/crontab中增加以下命令来实现每3分钟执行一次。
4.根据权利要求3所述的一种通过zabbix监控hadoop的方法,其特征在于:所述shell脚本hadoop.sh运行流程如下:
1)输入参数和文件变量
2)抓取dfshealth.jsp并过滤,将结果输出到RAW_FILE
3)分别将各监控项的数据从RAW_FILE中解析出来
4)将数据按zabbix规定格式输出到DATA_FILE中
5)通过zabbix_sender将数据发送给zabbix。
CN201610659328.3A 2016-08-11 2016-08-11 一种通过zabbix监控hadoop的方法 Pending CN106330598A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610659328.3A CN106330598A (zh) 2016-08-11 2016-08-11 一种通过zabbix监控hadoop的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610659328.3A CN106330598A (zh) 2016-08-11 2016-08-11 一种通过zabbix监控hadoop的方法

Publications (1)

Publication Number Publication Date
CN106330598A true CN106330598A (zh) 2017-01-11

Family

ID=57739911

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610659328.3A Pending CN106330598A (zh) 2016-08-11 2016-08-11 一种通过zabbix监控hadoop的方法

Country Status (1)

Country Link
CN (1) CN106330598A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115514674A (zh) * 2022-08-24 2022-12-23 智网安云(武汉)信息技术有限公司 一种基于脚本远程连接的监控项自动创建方法及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104317658A (zh) * 2014-10-17 2015-01-28 华中科技大学 一种基于MapReduce的负载自适应任务调度方法
CN104579840A (zh) * 2015-01-08 2015-04-29 浪潮软件集团有限公司 一种基于zabbix的网络监控***
CN104683446A (zh) * 2015-01-29 2015-06-03 广州杰赛科技股份有限公司 一种云存储集群节点服务状态实时监控方法和***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104317658A (zh) * 2014-10-17 2015-01-28 华中科技大学 一种基于MapReduce的负载自适应任务调度方法
CN104579840A (zh) * 2015-01-08 2015-04-29 浪潮软件集团有限公司 一种基于zabbix的网络监控***
CN104683446A (zh) * 2015-01-29 2015-06-03 广州杰赛科技股份有限公司 一种云存储集群节点服务状态实时监控方法和***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XDAYS: ""Zabbix监控Hadoop"", 《HTTPS://XDAYS.ME/ZABBIX%E7%9B%91%E6%8E%A7HADOOP.HTML》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115514674A (zh) * 2022-08-24 2022-12-23 智网安云(武汉)信息技术有限公司 一种基于脚本远程连接的监控项自动创建方法及设备
CN115514674B (zh) * 2022-08-24 2023-12-26 智网安云(武汉)信息技术有限公司 一种基于脚本远程连接的监控项自动创建方法及设备

Similar Documents

Publication Publication Date Title
US11924240B2 (en) Mechanism for identifying differences between network snapshots
US11470159B2 (en) API key security posture scoring for microservices to determine microservice security risks
CN105677842A (zh) 基于Hadoop大数据处理技术的日志分析***
CN107508722B (zh) 一种业务监控方法和装置
DE112013003180T5 (de) Verfahren, System und Gerät zum Verwalten von Server-Hardware-Resourcen in einer Cloud-Scheduling-Umgebung
CN103152352A (zh) 一种基于云计算环境的全信息安全取证监听方法和***
US10826803B2 (en) Mechanism for facilitating efficient policy updates
CN110519077A (zh) 一种日志采集***、方法、装置、服务器及存储介质
CN104966006A (zh) 基于云变平台的智能人脸识别***
CN103166933A (zh) 一种数据安全交换***及方法
CN106055608A (zh) 自动采集和分析交换机日志的方法和装置
CN104657497A (zh) 一种基于分布式计算的海量用电信息并行计算***及方法
CN103780675B (zh) 一种云盘文件同步方法和装置
CN108737549A (zh) 一种大数据量的日志分析方法及装置
CN108228755A (zh) 基于日志解析技术的MySQL数据库到Hadoop平台的数据同步复制方法
Du Application of information communication network security management and control based on big data technology
CN108092936A (zh) 一种基于插件架构的主机监控***
CN108228756A (zh) 基于日志解析技术的PG数据库到Hadoop平台的数据同步复制方法
CN112671840A (zh) 一种基于区块链技术的跨部门数据共享***及方法
CN113612306A (zh) 一种分布式配电柜及其控制***
CN110708177B (zh) 分布式***中的异常处理方法、***和装置
CN107426017A (zh) 一种通过采集交换机网络流量进行数据分析的方法
CN110162443A (zh) 多批量流程监控方法、装置、计算机设备和存储介质
CN208046653U (zh) 一种电力监控***网络安全监测主站平台***
CN106330598A (zh) 一种通过zabbix监控hadoop的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170111