熱門搜索 Zabbix技術(shù)資料 Zabbix常見問、答討論 成功案例 Zabbix交流區(qū) Prometheus交流區(qū)
項目背景
1.客戶簡介
案例客戶是一家專業(yè)從事特種材料研發(fā)、生產(chǎn)和銷售的國家級高新技術(shù)企業(yè),是所屬材料領(lǐng)域技術(shù)引領(lǐng)者、領(lǐng)先供應商,同時是上交所科創(chuàng)板上市企業(yè)。
2.痛點分析
隨著業(yè)務量的迅猛增長,客戶的信息化投資急劇上升,設(shè)備和系統(tǒng)種類繁多,使得運維工作變得日益復雜和壓力重重。廠區(qū)的擴建和信息化投入的增加進一步加劇了運維的挑戰(zhàn),包括數(shù)據(jù)庫死鎖、系統(tǒng)頻繁卡頓和網(wǎng)絡(luò)故障等問題,這些問題不僅降低了生產(chǎn)效率,也增加了客戶投訴。
隨著設(shè)備老化,故障率上升,業(yè)務支撐系統(tǒng)面臨的風險也在逐年增長。目前,公司尚未建立一個統(tǒng)一的運維監(jiān)控平臺,這導致了多個問題:IT運維部門無法提前識別和預防潛在故障,故障發(fā)生時難以及時發(fā)現(xiàn),故障分析和處理缺乏有效的全棧監(jiān)控工具,依賴人工逐層排查,效率不高。此外,故障排查后缺乏持續(xù)積累和可復用的知識記錄,導致類似問題反復出現(xiàn)。
具體來說,該客戶的運維痛點如下:
鑒于這些挑戰(zhàn),客戶迫切需要一個全面的IT運維解決方案,以提升運維效率,確保業(yè)務系統(tǒng)的穩(wěn)定運行,并全方位保障業(yè)務支撐系統(tǒng)的可靠性。
尊龍時凱方案
為保障客戶信息化系統(tǒng)更加完善,為運維人員提供有效幫助、更高效率實現(xiàn)運維工作。在現(xiàn)有信息化相關(guān)維護前提下,有必要建立一套針對信息化的監(jiān)控平臺,做到及早發(fā)現(xiàn)故障、提早判斷預知故障及時處理,以及合理利用信息化基礎(chǔ)資源,達到最大化資源使用,同時為信息化建設(shè)提供未來建設(shè)提供合理依據(jù),使得業(yè)務系統(tǒng)信息化建設(shè)健康發(fā)展。
1.核心功能概覽
結(jié)合客戶現(xiàn)有信息化建設(shè)架構(gòu),建設(shè)統(tǒng)一監(jiān)控平臺部署內(nèi)容如下:
1.?集中監(jiān)控:包括從IT基礎(chǔ)架構(gòu)到業(yè)務系統(tǒng)的可用性、性能、日志等指標監(jiān)控;
2.?集中告警:集中告警展示、告警分發(fā)、告警處理等全生命周期管理;
3.?可視化視圖:可自動發(fā)現(xiàn)的網(wǎng)絡(luò)拓撲、投屏視圖、業(yè)務拓撲等可視化功能;
4.?多樣性報表:支持自定義、多維度、多指標報表統(tǒng)計功能;
5.?大屏展示:大屏幕集中監(jiān)控實現(xiàn)自定義展示頁面;
6.?網(wǎng)絡(luò)配置管理:自定義周期自動配置備份、配置一鍵下發(fā)、配置備份對比等功能;
7.?IP管理:提供IP地址快速定位功能,支持查看IP狀態(tài)、Mac地址、接入設(shè)備及端口信息。
8.?自動化運維:提供網(wǎng)絡(luò)設(shè)備和操作系統(tǒng)的自動化運維模塊;擁有腳本管理、版本管理、軟件包管理、定時作業(yè)、批量下發(fā)等功能。
9.?告警分析:支持告警關(guān)聯(lián)拓撲功能,實現(xiàn)故障影響范圍分析,可快速打開包含該資源的拓撲界面。02系統(tǒng)架構(gòu)
經(jīng)了解,本次監(jiān)控對象為包括涵蓋了操作系統(tǒng)、網(wǎng)絡(luò)設(shè)備、數(shù)據(jù)庫、中間件、虛擬化、服務器、存儲,總體監(jiān)控對象在1000個以內(nèi)。定義本次系統(tǒng)架構(gòu)部署如下:
架構(gòu)說明:
3.告警配置
完成監(jiān)控對象納管后,通過和客戶溝通、培訓,進一步確認相關(guān)監(jiān)控閾值配置,即根據(jù)客戶實際情況配置告警閾值,當監(jiān)控指標達到閾值設(shè)置后,即觸發(fā)告警。同時將不同閾值對應到不同告警級別,分別為緊急、嚴重、一般等常用級別。
4.大屏展示配置
投屏展示通常可直觀、簡介的查看整個IT資源或某個業(yè)務的實際情況,經(jīng)過和客戶交流溝通后,確定本次創(chuàng)建如下:
5.故障自愈配置
故障自愈可以根據(jù)預設(shè)的規(guī)則,針對一些常見故障,自動觸發(fā)相應的處理腳本腳本,降低人工干預成本,提高故障處理效率,保障系統(tǒng)穩(wěn)定性。經(jīng)過和客戶交流溝通后,確定創(chuàng)建以下故障自愈場景:
客戶收益
這些收益將幫助該客戶在面對快速變化的市場和技術(shù)環(huán)境時,保持競爭力,實現(xiàn)可持續(xù)發(fā)展。
尊龍時凱社區(qū)已經(jīng)永久開放尊龍時凱監(jiān)控免費版和尊龍時凱MCM免費版(CMDB+監(jiān)控),歡迎下載使用!
尊龍時凱采用分布式實施,分別對主機、網(wǎng)絡(luò)、存儲、數(shù)據(jù)庫、中間件、應用、硬件和虛擬化等實施一站式監(jiān)控。
View details尊龍時凱為該協(xié)會部署了一站式監(jiān)控和告警系統(tǒng)并配置了業(yè)務拓撲、網(wǎng)絡(luò)拓撲、報表圖形和自定義視圖等功能。
View details尊龍時凱從基礎(chǔ)資源、中間件、數(shù)據(jù)庫、到第三方系統(tǒng),提供全方位、快速關(guān)聯(lián)的監(jiān)控管理和分析能力,幫助用戶及時了解應用系統(tǒng)的運行狀態(tài)、性能、異常,防患于未然。
View details尊龍時凱監(jiān)控采取對網(wǎng)絡(luò)設(shè)備、服務器系統(tǒng)、數(shù)據(jù)庫、中間件、標準應用、業(yè)務系統(tǒng)等IT業(yè)務資源綜合監(jiān)管的解決方案。
View details尊龍時凱基于zabbix實現(xiàn),支持二次開發(fā),采用分布式部署,集中告警,一覽視圖、網(wǎng)絡(luò)拓撲、業(yè)務地圖、投屏視圖、圖形視圖各類視圖等。
View details該企業(yè)預采購一套高效穩(wěn)定的運維監(jiān)控平臺,用于排除一系列運維障礙。于是客戶找到了尊龍時凱,希望我們幫助其打造一套專業(yè)的解決方案。
View details