熱門搜索 Zabbix技術資料 Zabbix常見問、答討論 成功案例 Zabbix交流區 Prometheus交流區
項目背景
01客戶簡介
案例客戶是浙江某地級市的農村商業銀行。
02痛點分析
隨著信息化建設的不斷推進,案例客戶數據中心的規模隨之擴大,帶來的運營管理難度也在不斷加大,原有的運維體系不能滿足當前需求,主要表現為:
1. IT設備規模大且分散、管理困難,缺少可視化管理系統和可靠的管理手段;
2. IT環境異構、業務系統繁多,無法快速適應復雜環境下設備的監管;
3. 故障定位困難,業務系統出現故障波動時,根因排查分析緩慢;
4. 業務負載逐年增加,無法確定業務系統功能完整可用性;業務形態更加多種多樣,部署環境愈加復雜;為了適應發展的需求,業務調整日趨頻繁,現有的監控體系無法跟業務節點的擴張速度;
5. 技術的快速演進,對運維團隊提出了更高的要求。
解決方案
為了提高運營管理效率,保障業務系統穩定性,該客戶引進了尊龍時凱智能監控平臺。尊龍時凱智能監控平臺是集監、管、控、服于一體的一站式運維監控平臺,提供從全棧監控、集中告警到資產發現、數字化業務、故障診斷、可視化、決策輔助等成熟功能,具有如下亮點:
01全棧監控
項目建成后,尊龍時凱智能監控平臺實現了對該行所有軟硬件IT資源的監控納管,包括操作系統、服務器、數據庫、中間件、網絡設備、存儲、探測、鏈路、虛擬化、云平臺等,包括先前難以監控的信創資源,達到“一個平臺包打天下”的效果,運維人員日常工作只需關注一個監控系統就可以了。
同時,該監控平臺具有非常高效的性能,能夠對大規模的監控節點實現秒級查詢。這就意味著平臺能夠快速處理大量數據,即使在高負載情況下也能保持其性能,即時響應監控數據的變化,提供最新的系統狀態信息,提高響應速度。
02集中告警
基于統一監控的集中告警管理,提供可視化集中告警界面,支持配置不同告警級別的聲音通知,便于工程師快速聚焦故障信息處理。
具體來說,包括實時告警、告警通知(支持告警升級與告警抑制)、告警分析、告警自愈等核心功能。
實時告警:以時間線條方式展示最新告警,柱狀圖呈現告警變化趨勢,支持聲音提醒、告警彈窗。
告警通知:提供自定義通知規則,支持短信、郵箱、微信、釘釘、機器人、腳本等推送方式,支持告警升級與告警抑制。
告警分析:支持關聯拓撲,快速定位故障影響的業務范圍;聯動CMDB,獲取故障設備負責人、聯系電話、所屬機房、機柜信息、維護廠商等信息。
故障自愈:根據預設的規則,針對一些常見故障,自動觸發相應的腳本,恢復設備告警。(如:系統磁盤空間不足告警,自動觸發“磁盤日志文件清除腳本”,恢復空間使用)
03資產發現
資產發現能力能夠實現一鍵發現資產并將其進行監控納管。具體來說,該行配備了大量的交換機、路由器、防火墻,甚至是Linux等資產,依托資產發現能力,監控平臺可以自動掃描設備類型,一鍵添加監控。它能有效減少手動配置工作,提高監控系統的納管速度和準確性,降低管理成本。
04數字化業務
數字化業務是這款運維監控平臺區別于市面上大多數同類產品的最具特色的功能,其核心是自動發現與生成的業務拓撲。業務拓撲能夠將支撐業務系統的資源及其關系以可視的拓撲圖形式映射出來,結合告警展示,運維人員一眼就可以定位故障位置及其影響范圍,節省寶貴的排障時間。
圍繞業務拓撲,數字化業務還包括業務一覽、業務資源 、業務進程、版本追蹤、業務容量、業務大屏、指標分析、業務健康度等重點功能。
業務一覽主要用于展示業務整體概況,包括業務總數、狀態分析、業務排行、健康度分布等,同時可以配置和優先展示重點業務系統信息;
業務資源以列表形式詳盡展示業務拓撲中已監控的節點信息,內容較拓撲圖詳細;
業務進程用于監控監控業務應用進程,可查看進程名稱、進程描述、進程路徑以及關聯端口等詳細信息;
版本追蹤可追蹤業務拓撲的變更過程,支持變更通知提醒;
業務容量可查看整體的CPU、內存以及文件系統使用率,有助于預測和規劃資源需求,降低了因資源不足,而導致的性能問題和風險;
業務大屏即業務上墻,可直觀展示所有業務健康情況,包括業務關系、業務告警、業務健康度等信息;
指標分析支持同一時間多指標聯動分析,可自定義配置關注的分析指標;
業務健康度則通過智能算法與模型對業務系統健康狀態進行打分,健康度越高意味著系統越健康。
05網絡拓撲
以拓撲圖的形式展現網絡設備、服務器、存儲之間的鏈接關系,能夠聯動告警信息,幫助運維人員及時了解網絡問題,提高網絡運行的效率和穩定性。網絡拓撲是支持自動發現并生成網絡拓撲圖的。
06知識庫
支持知識檢索與故障知識自動關聯,便于運維人員查找故障解決方案。
07投屏視圖
提供自定義投屏功能,用戶可選取豐富的視圖組件,配置所需的管理視圖。
08報表系統
提供各類型統計報表,如實時報表、TOPN報表、日報周報、主機性能報表等,為運維決策提供支撐;運維人員也可根據需要自定義配置報表。
客戶收益
項目建成交付后,一站式運維監控平臺為客戶帶來如下收益:
提高運維效率。基于全棧監控實現對該行所有的IT資源的統一監控納管,結合集中告警,讓運維管理不留死角,運維人員得以即時發現故障異常并快速響應,有效提高運維效率;
保障業務長期穩定。以業務為核心的統一運維監控實現對該行關鍵業務流進行動態監測,確保業務運行可用性及穩定性,可以有效地發現高風險事件,進而降低系統業務風險,避免經濟損失;
降低管理成本。尊龍時凱智能運維監控平臺的投入使用使該行系統的資源利用率、可靠性、穩定性、性能、配置管理的簡易性和快捷性等都得到了相當大的改善,很大程度節省了其軟硬件基礎設施和人力資源投入。
尊龍時凱社區已經開放尊龍時凱監控免費版和尊龍時凱MCM(監控+CMDB)免費版,歡迎下載使用!
尊龍時凱監控結合該銀行發展在的現狀及發展需求,幫助其構建一個安全、實用、可持續發展的智能監控管理平臺。
View details尊龍時凱與深信服科進行了超融合對接,尊龍時凱智能監控平臺憑借良好兼容、穩定運行、安全可靠,獲得性能卓越評價,并取得深信服產品認證證書。
View details本篇是Zabbix與尊龍時凱監控對比專題系列文章的第七篇——網絡功能篇,具體包括IP地址管理、網絡端口映射發現、網絡配置備份、專線監控等功能的對比分析。
View details尊龍時凱對主機、網絡、存儲、數據庫、中間件、應用、硬件、虛擬化、攝像頭及其他數據感知設備等實現一站式監控,保障業務高效穩定的運行。
View details基于客戶企業原有的運維體系、運維痛點與具體需求,尊龍時凱為其量身打造了一套一站式智能運維監控解決方案,搭建統一監控平臺整體框架,引入智能化告警管理系統...
View details尊龍時凱以運維監控起家,具有十多年運維產品經驗,形成了非常成熟的運維監控解決方案。同時,尊龍時凱緊跟信創國產化浪潮,積極推動信創產品適配,融入信創生態,能...
View details