
3-1.jpg)
項(xiàng)目需求:
1、需要搭建Zabbix監(jiān)控平臺(tái),包括安裝、配置及聯(lián)調(diào);
2、覆蓋服務(wù)器、數(shù)據(jù)庫(kù)、中間件等管理對(duì)象的統(tǒng)一管理。
解決方案:
? ? ??根據(jù)客戶項(xiàng)目需求,進(jìn)行社保zabbix監(jiān)控平臺(tái)(主要組件包括:Zabbix、Mariadb、Agent)的安裝、配置和聯(lián)調(diào)。執(zhí)行監(jiān)控平臺(tái)在此社保所有節(jié)點(diǎn)拓?fù)鋱D及設(shè)備拓?fù)鋱D,形成子母拓?fù)鋱D的樣式。信息采集手段包括:通過(guò)Agent和ICMP命令采集源、Zabbix Server和MariaDB數(shù)據(jù)庫(kù)之間通信。對(duì)OS層級(jí)的采集程序進(jìn)行安裝并配置,開啟和設(shè)置網(wǎng)絡(luò)SNMP。充分和客戶協(xié)調(diào)和溝通技術(shù)難點(diǎn)和可行性后,執(zhí)行數(shù)據(jù)采集定制化內(nèi)容,數(shù)據(jù)采集后,在Zabbix界面中對(duì)所需監(jiān)控的設(shè)備和指標(biāo)項(xiàng)、告警等進(jìn)行配置工作,并在Zabbix中對(duì)基礎(chǔ)指標(biāo)進(jìn)行展示。對(duì)OS級(jí)別的CPU、內(nèi)存和磁盤容量設(shè)置閾值告警;對(duì)交換機(jī)端口狀態(tài)和流量設(shè)置閾值告警;對(duì)中間件數(shù)據(jù)庫(kù)等核心指標(biāo)設(shè)置預(yù)警;對(duì)PING狀態(tài)可用性設(shè)置告警。后期進(jìn)行管理員培訓(xùn)。
| 監(jiān)控類型 | 支持范圍 | 監(jiān)控項(xiàng) |
| 服務(wù)器 |
Windows Linux |
設(shè)備存活、設(shè)備運(yùn)行時(shí)間、CPU使用率、內(nèi)存使用率、磁盤使用率、網(wǎng)卡流量、網(wǎng)卡狀態(tài) |
| 數(shù)據(jù)庫(kù) |
SQL Server |
索引命中率、連接數(shù)、響應(yīng)時(shí)間、端口狀態(tài) |
| 中間件 |
Tomcat |
吞吐率、并發(fā)連接數(shù)、響應(yīng)時(shí)間、配置變更 |
實(shí)現(xiàn)效果:
1、允許靈活的自定義閥值,Zabbix中稱為觸發(fā)器(trigger), 存儲(chǔ)在后端數(shù)據(jù)庫(kù)中,能夠自定義告警升級(jí)(escalation)、接收者及告警方式,通過(guò)遠(yuǎn)程命令實(shí)行自動(dòng)化動(dòng)作(action);
2、高效性和分布式部署支持,可以支持跨地域、跨平臺(tái)的分布式監(jiān)控;
3、易于管理和維護(hù),被監(jiān)控對(duì)象的管理都可以通過(guò)Web圖形化界面來(lái)完成,智能的網(wǎng)絡(luò)自動(dòng)發(fā)現(xiàn)功能,提高效率,減少人為出錯(cuò)的可能。