Zabbix

您所在的位置:网站首页 linux如何查询cpu内存和硬盘信息 Zabbix

Zabbix

2023-11-06 18:52| 来源: 网络整理| 查看: 265

Zabbix-(三)监控主机CPU、磁盘、内存并创建监控图形 一.前言

前文中已经讲述了两种方式对Zabbix的搭建,本文将讲述如何在zaibbx上添加需要监控的主机,以及使用Zabbix自带模板和自定义模板对主机的CPU、磁盘、内存进行监控,并触发问题,并且在Zabbix仪表盘创建实时监控图形。

准备 Zabbix Server (Zabbix 4.4) (ip:192.168.152.140) 被监控主机A (Centos7.6),下文简称 Server-A (ip:192.168.152.142) 被监控主机B (Centos7.6),下文简称 Server-B (ip:192.168.152.143) 二.为被监控主机安装zabbix-agent

Server-A、Server-B分别安装zabbix-agent

# rpm -Uvh https://repo.zabbix.com/zabbix/4.4/rhel/7/x86_64/zabbix-release-4.4-1.el7.noarch.rpm # yum install -y zabbix-agent

Server-A、Server-B配置zabbix-agent

# vim /etc/zabbix/zabbix_agentd.conf

修改以下配置:

Server-A的zabbix_agentd.conf Server=192.168.152.140 ServerActive=192.168.152.140 # Hostname要与在Zabbix界面配置的Hostname(主机名称)保持一致 Hostname=Server-A Server-B的zabbix_agentd.conf Server=192.168.152.140 ServerActive=192.168.152.140 # Hostname要与在Zabbix界面配置的Hostname(主机名称)保持一致 Hostname=Server-B

分别启动zabbix-agent

# systemctl start zabbix-agent

可以查看agent日志

# tailf /var/log/zabbix/zabbix_agentd.log 可能会出现以下内容,是由于zabbix界面上没有配置主机,接下来将在zabbix页面上进行主机配置 6981:20191030:111132.151 no active checks on server [192.168.152.140:10051]: host [Server-A] not found 三.Zabbix添加主机

通过页面操作,将需要监控的主机添加到zabbix中

登录Zabbix,默认账号:Zabbix,默认密码:admin (可在zabbix数据库 users表查询)

Zabbix Dashboard

点击【配置】-【主机】-【创建主机】,添加需要被监控的主机

首先配置【主机】信息,添加Server-A,输入配置项

配置项 值 * 主机名称 Server-A 可见的名称 Server-A * 群组 Linux servers (进行选择) * agent代理程序的接口 IP地址: 192.168.152.142 端口: 10050

添加主机信息

再配置【模板】信息,点击【添加】,选择群组Templates,勾选Template OS Linux by Zabbix agent,点击【选择】

选择链接模板

添加主机链接模板

最后点击【保存】

在【主机】页面可以看到Server-A已经成功添加了

主机添加成功

同时,Server-A的zabbix-agent日志也不再打印 host [Server-A] not found

注: 由于在之前在安装Zabbix server时,也在zabbix server上安装了zabbix-agent,因此图例上除了Server-A主机以外,还有zabbix server主机

通过全克隆添加主机Server-B

选择需要复制的主机Server-A

选择复制的主机

点击【全克隆】(full clone)

全克隆

修改主机名称、agent IP地址等信息

修改配置项 值 *主机名称 Server-B *agent IP 192.168.152.143

修改克隆主机信息

最后点击【添加】,等待Server-B与zabbix server建立通信

Server-B添加成功

四.创建自定义模板(Template)

在添加主机步骤中,添加了2台需要监控的主机,添加监控项时也可以给每台主机单独添加监控项,但是随着主机数量增多,就会出现过多重复的操作,因此可以使用zabbix的Templates(模板)将Items(监控项和Triggers(触发器)等众多配置定义在模板中,将主机链接到定义好的模板上,就可以免去重复的操作。

下面将自定义模板,定义监控磁盘剩余空间监控项,并配置触发器当磁盘剩余空间低于一定阈值时触发告警。

创建自定义模板

点击【配置】-【模板】-【创建模板】

创建模板页面

输入模板信息,完成后点击【添加】

配置项 值 * 模版名称 Template Disk Free Size 可见的名称 Template Disk Free Size * 群组 Linux servers (选择) 描述 自定义磁盘剩余空间模板

注: 读者也可以自定义一个群组,并在自定义群组中创建模板,这个步骤本文不再示范

自定义模板信息

五.创建磁盘剩余空间监控项和触发器

创建自定义磁盘监控项(Item)

进入自定义模板的监控项模块

点击【创建监控项】

输入监控参数

配置项 值 * 名称 磁盘剩余空间监控项 类型 Zabbix 客户端 * 键值 vfs.fs.size[/,free] 单位 B ……其他配置项 根据需要填写

这里的键值 vfs.fs.size[/,free]是指,监控根路径下,空余的磁盘大小

vfs.fs.size

点击【添加】

磁盘监控项

注:创建监控项(Items)可以参考官方创建监控项, 更多的键值(Keys)可以参考官方监控项类型

创建触发器(Trigger)

触发器可以配置当监控项监控到的数据达到一定阈值,从而触发问题。

在Template Disk Free Size模板中选择【触发器】,点击【创建触发器】

点击创建触发器

输入触发器参数

配置项 值 * 名称 磁盘剩余空间触发器 严重性 严重(选择) * 表达式/问题表现形式 {Template Disk Free Size:vfs.fs.size[/,free].last()}=15000000000 问题事件生成模式 多重(选择)

表达式/问题表示形式

选择已配置的磁盘剩余空间监控项

配置结果 < 15000000000, 监控项中单位为B,这里15GB换算成15000000000B

点击【插入】,可以看到如下表达式,表达式意思是,当检测到磁盘弓箭剩余不足15GB时,将触发问题

{Template Disk Free Size:vfs.fs.size[/,free].last()}=15000000000

点击【添加】

再将该自定义模板,链接到Server-A、Server-B主机的模板中,参考创建主机添加链接,不过在筛选模板时,群组要选择Linux servers(与创建模板时群组保持一致),添加后点击【更新】

进入【配置】-【主机】-【Server-A】(或者 Server-B)-【监控项】中,可以搜索到磁盘剩余空间监控项已经添加成功

注:如果监控项状态不为【已启动】可以查看zabbix server日志进行排查

测试一下

当前Server-A主机磁盘剩余空间,为15G

上传一些文件到Server-A,此时磁盘剩余空间为14G

等待Zabbix监控到Server-A磁盘变化,查看仪表盘,出现问题,配置成功

删除Server-A大文件,等待Zabbix监控到主机磁盘恢复,仪表盘问题恢复

六.监控CPU空闲率

在添加主机时,由于已经链接了Template OS Linux by Zabbix agent模板(该模板还链接了Template Module Linux CPU by Zabbix agent等若干个其他模板),Template Module Linux CPU by Zabbix agent模板自带了许多监控项,其中包括CPU idle time 监控项,因此可以直接使用该监控项监控主机CPU空闲率数值,无需自定义监控项,只需要添加一个触发器(Trigger)来读取监控项触发告警即可。

注: zabbix自带模板中,有许多监控项可以直接利用起来,无需再单独创建监控项,使用时可先在已有模板中查找下可用的监控项。

使用自带模板中监控项

直接使用CPU idle time 监控项即可,可以在【配置】-【主机】,【Server-A】的【监控项】中搜索到该监控项(在下图中可以看到该监控项链接了模板)

在已有模板中添加触发器(trigger)

这里在模板Template Module Linux CPU by Zabbix agent添加一个触发器。

点击【配置】-【模板】搜索模板Template Module Linux CPU by Zabbix agent,并进入【触发器】配置

创建触发器操作流程参考上面步骤中的创建自定义触发器,这里说明一下配置参数

配置项 值 * 名称 CPU空闲率触发器 严重性 严重 (选择) 表达式/问题表现式 {Template Module Linux CPU by Zabbix agent:system.cpu.util[,idle].avg(5m)}>=80 事件成功迭代 恢复表达式(选择) * 恢复表达式 {Template Module Linux CPU by Zabbix agent:system.cpu.util[,idle].avg(5m)}


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3