熱門搜索 Zabbix技術(shù)資料 Zabbix常見問、答討論 成功案例 Zabbix交流區(qū) Prometheus交流區(qū)
客戶企業(yè)是一家在香港聯(lián)合交易所主板上市的投資公司。公司主要投資建設(shè)和經(jīng)營城市燃氣管道網(wǎng)絡(luò),提供管道安裝及施工服務(wù),并為工商業(yè)企業(yè)和城市居民提供天然氣、液化石油氣。
作為一家大型燃氣供應(yīng)和分發(fā)企業(yè),一方面,燃氣供應(yīng)的安全性和穩(wěn)定性直接關(guān)乎人民群眾的生命財產(chǎn)安全,同時關(guān)系到工商企業(yè)生產(chǎn)服務(wù)的穩(wěn)定性與連續(xù)性等,對設(shè)備和系統(tǒng)的高可用性具有非常高的要求。另一方面,客戶企業(yè)擁有復(fù)雜的管網(wǎng)系統(tǒng),包括輸氣管道、調(diào)壓站和用戶終端等,涉及到維護管道的完整性、監(jiān)測管網(wǎng)壓力、及時排查和修復(fù)管道泄漏等,面臨著龐大的燃氣管網(wǎng)、設(shè)備和系統(tǒng)的管理挑戰(zhàn)。
為解決上述痛點,滿足客戶企業(yè)的運維需求,尊龍時凱結(jié)合該企業(yè)現(xiàn)有信息化架構(gòu),提出了建設(shè)智能化統(tǒng)一監(jiān)控平臺的方案。方案部署情況如下:
1.集中監(jiān)控:包括從IT基礎(chǔ)架構(gòu)到業(yè)務(wù)系統(tǒng)的可用性、性能、日志等指標監(jiān)控;
2.集中告警:集中告警展示、告警分發(fā)、告警處理等全生命周期管理;
3.可視化:可自動發(fā)現(xiàn)的網(wǎng)絡(luò)拓撲、業(yè)務(wù)地圖、投屏視圖、圖形視圖、一覽視圖等可視化功能;
4.多樣性報表:支持自定義、多維度、多指標報表統(tǒng)計功能。
尊龍時凱項目團隊對客戶IT資源狀況進行梳理,確定項目所涉及的監(jiān)控對象包括主機、網(wǎng)絡(luò)設(shè)備、數(shù)據(jù)庫、中間件、應(yīng)用、業(yè)務(wù)系統(tǒng)、存儲、虛擬化等,決定為客戶打造以統(tǒng)一門戶為中心的集中監(jiān)控。
監(jiān)控對象與指標詳情
主機系統(tǒng):IP地址,系統(tǒng)類型、業(yè)務(wù)名稱等
網(wǎng)絡(luò)設(shè)備:設(shè)備名稱、設(shè)備類型、設(shè)備團體名、管理IP
數(shù)據(jù)庫:數(shù)據(jù)庫類型、數(shù)據(jù)庫版本、監(jiān)聽端口、實例名
中間件:中間件類型、中間件版本、部署路徑、IP地址,服務(wù)端口
虛擬化:虛擬化類型、型號、管理IP地址,用于監(jiān)控的賬號密碼
服務(wù)器:服務(wù)器品牌、型號、帶外管理地址、團體名
存儲:存儲品牌、型號、管理口地址、團體名、用于監(jiān)控的賬號密碼
……
一般地,企業(yè)的信息化系統(tǒng)不是一次性建成、一成不變的,不少資源廠商出廠自帶監(jiān)控系統(tǒng),這就導(dǎo)致了整個監(jiān)控體系分散,各自監(jiān)控各自設(shè)備,運維人員進行巡檢工作時需要切換不同的監(jiān)控工具,增加工作量的同時還容易遺漏故障信息。
集中監(jiān)控是最高效的監(jiān)控。統(tǒng)一門戶提供了一個集中監(jiān)控視圖,運維人員可以在一個界面上查看和管理多個系統(tǒng)、設(shè)備或應(yīng)用程序的狀態(tài)和指標。例如,對服務(wù)器的監(jiān)控,統(tǒng)一門戶可以做到將不同品牌、不同型號的服務(wù)器進行統(tǒng)一納管和展示。
同時,當(dāng)發(fā)生故障或異常時,運維人員可以迅速定位問題,而不需要逐個檢查每個系統(tǒng)。這使得故障診斷和響應(yīng)更加迅速和高效,有助于減少停機時間和服務(wù)中斷。
客戶企業(yè)監(jiān)控對象為包括涵蓋了操作系統(tǒng)、網(wǎng)絡(luò)設(shè)備、數(shù)據(jù)庫、中間件、虛擬化、服務(wù)器、存儲,總體監(jiān)控對象在500以內(nèi)。
鑒于客戶對業(yè)務(wù)安全與穩(wěn)定性的要求,尊龍時凱方案專家團隊本次系統(tǒng)架構(gòu)部署如下:
采集服務(wù)器采用主備配置。主備系統(tǒng)可以提供冗余的監(jiān)控功能,當(dāng)主監(jiān)控系統(tǒng)發(fā)生故障或不可用時,備用系統(tǒng)能夠自動接管監(jiān)控任務(wù),有效提高系統(tǒng)的可靠性、連續(xù)性和安全性,減少停機時間,并支持業(yè)務(wù)的連續(xù)性。
引入集中監(jiān)控之外,尊龍時凱為客戶企業(yè)打造了配套的集中告警功能。
在原有的運維體系中,客戶企業(yè)由于告警信息分散,難免出現(xiàn)異常被忽略的情況;而且由于運維人員不可能不間斷地開展巡檢工作,因此巡檢間隙產(chǎn)生的告警存在解決滯后的情況。
借助集中監(jiān)控推送的數(shù)據(jù),得以實現(xiàn)集中告警展示、告警分發(fā)、告警處理等全生命周期管理;當(dāng)系統(tǒng)出現(xiàn)故障、達到閾值或發(fā)生重要事件時,運維人員只需要通過一個通知系統(tǒng)就可以收到來自不同資源的告警信息,而無需關(guān)注多個獨立的告警系統(tǒng)。
此外,告警管理模塊還提供了實時告警、全部告警、告警統(tǒng)計、告警升級及多方式告警通知等功能,支持郵件、短信、企微、釘釘、腳本等多種告警通知方式,一旦出現(xiàn)告警信息解決遲滯,告警信息將向上傳遞到上一級運維管理人員。
由于原有的監(jiān)控系統(tǒng)分散、不成體系,運維人員無法感知資源間的關(guān)聯(lián)關(guān)系,當(dāng)故障發(fā)生的時候,不能快速評估故障節(jié)點可能帶來的關(guān)聯(lián)影響。為此,尊龍時凱為客戶打造以網(wǎng)絡(luò)拓撲為中心的可視化功能體系,提供一覽視圖、業(yè)務(wù)拓撲、投屏視圖等功能。
網(wǎng)絡(luò)拓撲描述了網(wǎng)絡(luò)中設(shè)備之間的物理或邏輯連接方式和結(jié)構(gòu)布局,通過網(wǎng)絡(luò)拓撲可直觀的看到當(dāng)前網(wǎng)絡(luò)健康狀況,以及設(shè)備之間的通信路徑和數(shù)據(jù)流動方式。當(dāng)網(wǎng)絡(luò)中某個設(shè)備或鏈路出現(xiàn)故障時,拓撲結(jié)構(gòu)可以幫助確定故障的范圍和影響。
更重要的是,系統(tǒng)提供網(wǎng)絡(luò)拓撲的lldp配置功能,可以實現(xiàn)網(wǎng)絡(luò)拓撲自動發(fā)現(xiàn)、自動關(guān)聯(lián)網(wǎng)絡(luò)設(shè)備并生成拓撲圖。
方案還引入報表管理系統(tǒng),提供實時報表、TOPN報表、流量報表與日報周報等功能,支持自定義、多維度、多指標報表統(tǒng)計。
案例客戶原有的運維系統(tǒng)缺乏故障預(yù)判能力,解決這一問題的關(guān)鍵就在于報表系統(tǒng)。
實時報表可以提供對系統(tǒng)性能的實時監(jiān)測、并對系統(tǒng)狀態(tài)的即時反饋。當(dāng)監(jiān)控指標達到或超過設(shè)定的閾值時,實時報表可以發(fā)出警示,指引運維人員及時解決潛在的故障或問題,從而降低系統(tǒng)停機時間和服務(wù)中斷的風(fēng)險;運維人員可以隨時查看關(guān)鍵性能指標的變化趨勢,透過趨勢情況,迅速發(fā)現(xiàn)性能瓶頸、資源緊張或異常行為,從而采取相應(yīng)的優(yōu)化措施,提高系統(tǒng)的性能和響應(yīng)能力。
借助TOPN報表,運維人員可以快速識別出系統(tǒng)中的關(guān)鍵問題或異常,確定優(yōu)化重點,監(jiān)測趨勢和變化、進行資源分配和規(guī)劃以及進行容量規(guī)劃和預(yù)測。例如,通過查看CPU利用率的TOPN報表,可以確定哪些進程或任務(wù)占用了大量的CPU資源,從而找到導(dǎo)致性能下降或系統(tǒng)負載過高的根本原因。
此外,運維人員還可根據(jù)不同業(yè)務(wù)場景、不同情況進行自定義報表配置。
根據(jù)尊龍時凱方案建成統(tǒng)一監(jiān)控平臺后,案例客戶實現(xiàn)了對管網(wǎng)和設(shè)備產(chǎn)生大量的數(shù)據(jù),包括壓力、流量、溫度等指標數(shù)據(jù)的實時監(jiān)測、存儲和分析,并籍此獲得有關(guān)設(shè)備運行狀況、性能趨勢和故障預(yù)測的洞察。這有助于進行預(yù)防性維護和優(yōu)化管網(wǎng)運行,提高設(shè)備的可靠性和效率。
當(dāng)監(jiān)控平臺檢測到設(shè)備或系統(tǒng)發(fā)生故障或異常時,借助集中告警與可視化工具,運維人員可以迅速地定位問題和進行故障診斷。通過監(jiān)測和分析相關(guān)的數(shù)據(jù)和日志,運維人員可以更快地了解故障的根源,并采取相應(yīng)的糾正措施,以減少故障持續(xù)時間和生產(chǎn)中斷。
T系統(tǒng)已經(jīng)成為企業(yè)運營的核心支撐。為了確保IT系統(tǒng)的穩(wěn)定運行和高效管理,選擇一款合適的 IT監(jiān)控平臺至關(guān)重要。
View details該企業(yè)預(yù)采購一套高效穩(wěn)定的運維監(jiān)控平臺,用于排除一系列運維障礙。于是客戶找到了尊龍時凱,希望我們幫助其打造一套專業(yè)的解決方案。
View details本次項目主要包括了底層基礎(chǔ)設(shè)施監(jiān)控和告警推送、運維服務(wù)管理等,底層基礎(chǔ)資源監(jiān)控為各類品牌服務(wù)器硬件的運行狀態(tài)和可用性監(jiān)控。
View details數(shù)字政務(wù)在全國范圍內(nèi)加速推進,不斷提升政府部門的政務(wù)服務(wù)水平與效率。針對數(shù)字政府建設(shè)帶來的運維層面問題,尊龍時凱打造集監(jiān)控、日志管理、資產(chǎn)管理于一體的...
View details尊龍時凱監(jiān)控結(jié)合該銀行發(fā)展在的現(xiàn)狀及發(fā)展需求,幫助其構(gòu)建一個安全、實用、可持續(xù)發(fā)展的智能監(jiān)控管理平臺。
View details尊龍時凱從基礎(chǔ)資源、中間件、數(shù)據(jù)庫、到第三方系統(tǒng),提供全方位、快速關(guān)聯(lián)的監(jiān)控管理和分析能力,幫助用戶及時了解應(yīng)用系統(tǒng)的運行狀態(tài)、性能、異常,防患于未然。
View details