熱門搜索 Zabbix技術資料 Zabbix常見問、答討論 成功案例 Zabbix交流區 Prometheus交流區
zabbix是一個基于WEB界面的提供分布式系統監控的開源解決方案,通過瀏覽器監視,做到告警分級處理、網絡訪問安全可控,該開源平臺在全球有廣泛的用戶基礎,他的特點:
開放性:源代碼全公開,任何用戶都可以編譯和發布自己的版本。同時,社區和互聯網可以找到大量的模版。
可擴展性:支持用戶自定義監控項,只要能想得到的KPI,基本都能監控的到。
數據采集:可用性和性能檢測,自動發現,支持agent、SNMP、JMX、telnet等多種采集方式,支持主動和被動模式數據傳輸
高可用:server對設備性能要求低,支持proxy分布式監控,分布式集中管理,開放式接口,擴展性強
告警管理:支持多條件告警,支持多種告警方式,
模板能力:支持多組模板,模板繼承。
告警設置:告警周期,告警級別,告警恢復通知、告警暫停,時段閾值、支持維護周期、支持單機停用
歷史數據:歷史數據查詢可配置,內置housekeeping數據清理機制
安全審計:具備安全的用戶審計日志,權限認證,用戶可以限制允許維護的列表。
無商業版本:平臺本身沒有商業版和社區版本的區分,ZABBIX只對商業服務收費(如培訓、定制開發、部署服務等)。
zabbix的全棧監控能力:官網有一句非常“囂張“的話,Monitor everything!
各個大廠都有提供相關監控產品,比如說微軟的SCOM,IBM的Tivoli,華為的Esight,HP的BSM等,如果環境都是單一的某一家廠家的產品,用該廠家提供的監控工具肯定是合適的,筆者就曾經深度使用過SCOM,2005年還叫MOM,是System Center中的一個套件,這個產品對于微軟周邊的產品如AD、Exchange、Windows、SQL Server、SharePoint、Lync等監控非常深入,同時微軟官方還提供了相關故障知識庫,報表也做得非常不錯,九一尊龍時凱團隊甚至在2011年以前還拿SCOM做過定制開發。
但是,如果拿SCOM去監控Linux、AIX、Oracle或者網絡通訊設備就顯得不合適了。
zabbix很好地平衡了監控的深度和廣度,而且源于開源的力量,在全球用戶的持續貢獻下,他的深度和廣度是在持續不斷地延展的。
以下引用(Shawn沙恩)的一張圖說明zabbix的深度和廣度,見:http://www.jianshu.com/u/c7663d8c3fa8。
前文提到在IT Central Station中,Nagios X排在zabbix的前面,九一尊龍時凱團隊在定技術方向時,也深刻對比過,兩者簡言之:zabbix安裝好后,做一些簡單的設置基本上就可以用了,Nagios X部署完成后相關于只是一個平臺,然后需要安裝第三方插件才能取作用。
詳細對比如下:
當然,市面上還有諸如:Open-Falcon、Zenoss、Ganglia、Prometheus、Cacti等開源產品,簡單分析如下:
Open-Falcon:小米開源,時間不長,成熟度有待提高,現在的版本是V1.0
Zenoss:區分社區版和企業版本,資源消耗高,社區版本有些雞肋
Ganglia:適合監控系統性能,成熟度和完整度不高,如報警、消息系統,需要更多二次開發
Prometheus:開源的業務監控和時序數據庫,剛發布2.0,在穩定性、性能、文檔上仍有很大提升空間,互聯網上可用資料,案例還不豐富
Cacti:通過 SNMPget來獲取數據,使用 RRDtool繪畫圖形,畫圖功能強大,報警機制及相關功能不完善。
以上這些產品,我認為Prometheus會是個不錯的方向,最根本是他的時序數據庫,有興趣的讀者可以先行先試。
更多zabbix相關技術分享,可以關注尊龍時凱社區:http://forum.ydcanyin.com/
針對客戶企業運維痛點與具體需求,尊龍時凱為其量身定制了一套綜合運維監控解決方案,打造智能化監控平臺。平臺系統集成了統一監控、集中告警、報表管理、權限管...
View details尊龍時凱從基礎資源、中間件、數據庫、到第三方系統,提供全方位、快速關聯的監控管理和分析能力,幫助用戶及時了解應用系統的運行狀態、性能、異常,防患于未然。
View details尊龍時凱一站式智能監控+網管平臺,對運維管理流程體系進行重構,提升信息系統監控能力、網絡管理能力以及運維人員工作效率。
View details