zabbix监控详解 |
您所在的位置:网站首页 › 流量监控是啥意思呀怎么用 › zabbix监控详解 |
第1章 zabbix监控
1.1 为什么要监控
在需要的时刻,提前提醒我们服务器出问题了 当出问题之后,可以找到问题的根源 网站/服务器 的可用性 1.1.1 网站可用性在软件系统的高可靠性(也称为可用性,英文描述为HA,High Available)里有个衡量其可靠性的标准——X个9,这个X是代表数字3~5。X个9表示在软件系统1年时间的使用过程中,系统可以正常使用时间与总时间(1年)之比,我们通过下面的计算来感受下X个9在不同级别的可靠性差异。 ![]() ![]() 监控一切需要监控的东西,只要能够想到,能够用命令实现的都能用来监控 1.2.1 监控范畴如果想远程管理服务器就有远程管理卡,比如Dell idRAC,HP ILO,IBM IMM 1.3.2 监控硬件查看硬件的温度/风扇转速,电脑有鲁大师,服务器就有ipmitool。 使用ipmitool实现对服务器的命令行远程管理 ![]() ![]() lscpu、uptime、top、htop vmstat mpstat 其中htop需要安装,安装依赖与epel源。 ![]() ![]() free [znix@clsn ~]$free -h total used free shared buffers cached Mem: 996M 867M 128M 712K 145M 450M -/+ buffers/cache: 271M 725M Swap: 1.0G 0B 1.0G 1.3.5 磁盘剩多少写的快不快可以用df、dd、iotop [znix@clsn ~]$df -h Filesystem Size Used Avail Use% Mounted on /dev/vda1 40G 24G 15G 62% / tmpfs 499M 20K 499M 1% /dev/shm /dev/vdb1 20G 4.4G 15G 24% /data 1.3.6 监控网络iftop nethogs iftop 监控主机间流量 -i 指定监控网卡 nethogs 监控进程流量 1.4 监控工具总览mrtg 流量监控出图 nagios 监控 cacti 流量监控出图 zabbix 监控+出图 1.5 zabbix介绍Zabbix 是由 Alexei Vladishev 开发的一种网络监视、管理系统,基于 Server-Client 架构。可用于监视各种网络服务、服务器和网络机器等状态。 使用各种 Database-end 如 MySQL, PostgreSQL, SQLite, Oracle 或 IBM DB2 储存资料。Server 端基于 C语言、Web 管理端 frontend 则是基于 PHP 所制作的。Zabbix 可以使用多种方式监视。可以只使用 Simple Check 不需要安装 Client 端,亦可基于 SMTP 或 HTTP ... 各种协定做死活监视。 在客户端如 UNIX, Windows 中安装 Zabbix Agent 之后,可监视 CPU Load、网络使用状况、硬盘容量等各种状态。而就算没有安装 Agent 在监视对象中,Zabbix 也可以经由 SNMP、TCP、ICMP、利用 IPMI、SSH、telnet 对目标进行监视。 另外,Zabbix 包含 XMPP 等各种 Item 警示功能。 1.5.1 zabbix的组成 zabbix官网: https://www.zabbix.com zabbix 主要由2部分构成 zabbix server和 zabbix agent zabbix proxy是用来管理其他的agent,作为代理 1.5.2 zabbix监控范畴² 硬件监控 :Zabbix IPMI Interface ² 系统监控 :Zabbix Agent Interface ² Java 监控:ZabbixJMX Interface ² 网络设备监抟:Zabbix SNMP Interface ² 应用服务监控:Zabbix Agent UserParameter ² MySQL 数据库监控:percona-monitoring-pldlgins ² URL监控:Zabbix Web监控 第2章 安装zabbix 2.1 环境检查![]() ![]() 编译安装 (服务较多,环境复杂) yum安装(干净环境) 使用yum 需要镜像yum源 http://www.cnblogs.com/clsn/p/7866643.html 2.2.2 服务端快速安装脚本![]()
主机名称: 要与主机名相同,这是zabbix server程序用的 可见名称: 显示在zabbix网页上的,给我们看的
修改后,要将下面的已启用要勾上 添加完成就有了管理机的监控主机 配置 >> 主机 >> 创建主机
注意勾选以启用 然后添加模板,选择linux OS ,先点小添加,再点大添加。 添加完成,将会又两条监控主机信息 检测中 >> 最新数据 在最新数据中需要筛选, 输入ip或者名字都能够搜索出来
在下面就会列出所有的监控项 检测中 >> 图形 选择正确的主机。选择要查看的图形即可出图 zabbix自带模板Template OS Linux (Template App Zabbix Agent)提供CPU、内存、磁盘、网卡等常规监控,只要新加主机关联此模板,就可自动添加这些监控项。 需求:服务器登陆人数不能超过三人,超过三人报警 4.1.2 预备知识自定义key能被server和agent认可 # 正确的key [root@m01 ~]# zabbix_get -s 172.16.1.21 -p 10050 -k "system.uname" Linux cache01 3.10.0-693.el7.x86_64 #1 SMP Tue Aug 22 21:09:27 UTC 2017 x86_64 # 没有登记的,自定义的key [root@m01 ~]# zabbix_get -s 172.16.1.21 -p 10050 -k "login-user" ZBX_NOTSUPPORTED: Unsupported item key. # 写错的key [root@m01 ~]# zabbix_get -s 172.16.1.21 -p 10050 -k "system.uname1" ZBX_NOTSUPPORTED: Unsupported item key. 4.2 实现自定义监控 4.2.1 自定义语法 UserParameter=, UserParameter=login-user,who|wc -l UserParameter=login-user,/bin/sh /server/scripts/login.sh 4.2.2 agent注册 [root@cache01 ~]# cd /etc/zabbix/zabbix_agentd.d/ [root@cache01 zabbix_agentd.d]# vim userparameter_login.conf UserParameter=login-user,who|wc -l UserParameter=login-user2,who|wc -l UserParameter=login-user3,who|wc -l注意:key名字要唯一,多个key以行为分割 # 修改完成后重启服务 [root@cache01 zabbix_agentd.d]# systemctl restart zabbix-agent.service在server端进行get测试 ![]() ![]() ① 创建模板 配置 >> 模板 >> 创建模板 点击添加,即可创建出来模板 查看创建出来的模板。↑ ② 创建应用集 应用集类似(目录/文件夹),其作用是给监控项分类。 点击 应用集 >> 创建应用集 自定义应用集的名称,然后点击添加 ③ 创建监控项 监控项 >> 创建监控项 键值 -- key,即前面出创建的login-user。 注意:创建监控项的时候,注意选择上应用集,即之前创建的安全。 ④ 创建触发器 触发器的作用:当监控项获取到的值达到一定条件时就触发报警 (根据需求创建) 触发器 >> 创建触发器 创建触发器,自定义名称,该名称是报警时显示的名称。 表达式,点击右边的添加,选择表达式。 严重性自定义。 表达式的定义 ↓ ,选择之前创建的监控项, 最新的T值为当前获取到的值。 添加完成,能够在触发器中看到添加的情况 ⑤ 创建图形 以图形的方式展示出来监控信息 图形 >> 创建图形 名称自定义,关联上监控项。 ⑥ 主机关联模板 配置 >> 主机 一个主机可以关联多个模板 http://www.onealert.com 通过 OneAlert 提供的通知分派与排班策略,以及全方位的短信、微信、QQ、电话提醒服务,您可以在最合适的时间,将最重要的信息推送给最合适的人员。 4.3.2 onealert配置添加应用,注意添加的是zabbix 实现微信报警需要关注微信公众号即可。 1.切换到zabbix脚本目录(如何查看zabbix脚本目录): cd /usr/local/zabbix-server/share/zabbix/alertscripts #查看zabbix脚本目录 vi /etc/zabbix/zabbix_server.conf 查看AlertScriptsPath2.获取OneITSM agent包: wget http://www.onealert.com/agent/release/oneitsm_zabbix_release-1.0.1.tar.gz3.解压、安装。 tar -zxf oneitsm_zabbix_release-1.0.1.tar.gz cd oneitsm/bin bash install.sh --#个人生成的key注:在安装过程中根据安装提示,输入zabbix管理地址、管理员用户名、密码。 Zabbix管理地址: http://10.0.0.61/zabbix/ Zabbix管理员账号: Admin Zabbix管理员密码:4.当提示"安装成功"时表示安装成功! 验证告警集成 产生新的zabbix告警(problem),动作状态为“已送达”表示集成成功。 4.3.1 如何删除onealert Agent① 删除报警媒介类型中的脚本 ② 删除创建的用户 ③ 删除用户群组 ④ 删除创建的动作 在微信和邮件中,均能收到报警信息。 注意:当状态改变的时候才会发邮件 好-->坏 坏-->好 4.4 监控可视化 4.4.1 聚合图形最新数据 >> 图形 自定义名称 点击聚合图形的名称,进行更改,添加要显示的图形即可。 添加幻灯片 监测中 >> 复合图形 >> 幻灯片演示 创建幻灯片,名称自定,选择要显示的 幻灯片根据设定的时间自动播放 4.5 模板的共享 4.5.1 主机共享在主机页打开,全选后点击导出 导入 https://github.com/zhangyao8/zabbix-community-repos 实际需求: 公司已经有了100台服务器,现在需要使用zabbix全部监控起来。 5.2 规划方案常规监控:cpu,内存,磁盘,网卡 问题:怎样快速添加100台机器 方法1:使用克隆的方式 方法2:自动注册和自动发现 方法3:调用zabbix api接口 curl 、python 开发自己的运维平台兼容zabbix的通道 服务监控,url监控等特殊监控:自定义监控 5.2.1 api接口使用(curl)![]() ![]() 所有集群节点(所有虚拟机)都监控上 交换机,路由器监控(简单方法:换成端口对应服务器网卡流量监控;标准方法:监控交换机的网卡) snmp监控 5.3.2 应用服务监控1. 监控备份服务器,简单方法是监控rsync端口,如果有其他更佳方案可以说明; 方法1:监控873端口net.tcp.port[,873] 方法2:模拟推送拉取文件2. 监控NFS服务器,使用监控NFS进程来判断NFS服务器正常,如果有其他更佳方案可以说明; 方法1:端口(通过111的rpc端口获取nfs端口) net.tcp.port[,111] 方法2:showmount -e ip|wc -l3. 监控MySQL服务器,简单方法监控mysql的3306端口,或者使用zabbix提供的Mysql模板,如果有其他更佳方案可以说明; 方法1:端口(通过3306的mysql端口) net.tcp.port[,3306] 方法2:mysql远程登录 方法3:使用zabbix agent自带的模板及key4. 监控2台web服务器,简单方法监控80端口,如果有其他更佳方案可以说明; 方法1:端口(通过80的web端口) net.tcp.port[,80] 方法2:看网页状态码、返回内容==zabbix 自带WEB检测5. 监控URL地址来更精确的监控我们的网站运行正常; 使用zabbix自带的监控Web监测 进行监控6. 监控反向代理服务器,PPTP服务器等你在期中架构部署的服务。 nginx,pptp ntp 端口udp 1237. 监控Nginx的7种连接状态。 自定义监控 5.3.3 监控服务通用方法1. 监控端口 netstat ss lsof ==》 wc -l 2. 监控进程 ps -ef|grep 进程|wc -l 试运行一下 3. 模拟客户端的使用方式监控服务端 web ==》 curl mysql ==》 select insert memcache ==》 set再get 5.4 实施全网监控安装客户端脚本,for centos6 ![]() |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |