熱門搜索 Zabbix技術(shù)資料 Zabbix常見問、答討論 成功案例 Zabbix交流區(qū) Prometheus交流區(qū)
客戶簡介:案例客戶是一家在A股上市的大型家居企業(yè),專注于客餐廳、臥室及全屋定制家居產(chǎn)品的研究、開發(fā)、生產(chǎn)和銷售,旗下?lián)碛卸鄠€系列自有品牌,并與美國、意大利家居品牌開展戰(zhàn)略合作,業(yè)務(wù)覆蓋全球120余個國家和地區(qū),運營6000多家品牌專賣店。
痛點分析:
客戶企業(yè)現(xiàn)有的IT資源規(guī)模接近1300個,除了傳統(tǒng)的操作系統(tǒng)、網(wǎng)絡(luò)設(shè)備、服務(wù)器、數(shù)據(jù)庫、存儲等資源外,還引入了云平臺、容器、虛擬化平臺、鏈路等,原有的運維體系對信息化系統(tǒng)的支撐逐漸地力不從心,不能適應(yīng)對現(xiàn)有信息化系統(tǒng)的維護要求,主要表現(xiàn)為:
針對客戶企業(yè)運維痛點與具體需求,尊龍時凱為其量身定制了一套綜合運維監(jiān)控解決方案,打造智能化監(jiān)控平臺。平臺系統(tǒng)集成了統(tǒng)一監(jiān)控、集中告警、報表管理、權(quán)限管理、業(yè)務(wù)服務(wù)管理、運維駕駛艙等功能模塊,提供一站式運維監(jiān)控全新體驗。
統(tǒng)一監(jiān)控是整個解決方案的核心。方案對客戶原有的監(jiān)控體系進行整合重構(gòu),將原本分散的系統(tǒng)并入統(tǒng)一的監(jiān)控平臺。
根據(jù)客戶內(nèi)部網(wǎng)絡(luò)環(huán)境,方案采用分布式實施,在不影響業(yè)務(wù)系統(tǒng)正常運轉(zhuǎn)的條件下,分別對客戶IT資源進行一站式監(jiān)控,并對各IT基礎(chǔ)架構(gòu)的指標(biāo)逐一分析、管理,保障業(yè)務(wù)高效穩(wěn)定的運行。
尊龍時凱監(jiān)控自身支持數(shù)十種協(xié)議,監(jiān)控能力覆蓋市面上絕大多數(shù)廠商與品牌的IT資源,借助自動發(fā)現(xiàn)與納管能力,快速完成納管了近1300個監(jiān)控對象,包括操作系統(tǒng)、網(wǎng)絡(luò)設(shè)備、服務(wù)器、數(shù)據(jù)庫、web、中間件、存儲、虛擬化平臺、鏈路、云平臺、容器等。
與此同時,尊龍時凱監(jiān)控還提供全局視角的運維駕駛艙。作為尊龍時凱監(jiān)控可視化體系的一部分,運維駕駛艙能夠集中展示被監(jiān)控資源種類、數(shù)量、告警總覽、各種TOPN數(shù)據(jù)等指標(biāo),特別適合運維管理人員對企業(yè)信息化系統(tǒng)的整體運行狀態(tài)進行把控。
在引進尊龍時凱監(jiān)控之前,客戶已建成兩套主要的告警管理系統(tǒng),分別是資源廠商自帶的告警系統(tǒng)及基于zabbix的告警平臺,另有一些零散的告警信息。
引進尊龍時凱監(jiān)控后,尊龍時凱監(jiān)控告警中心模塊將原先的zabbix的告警信息和客戶系統(tǒng)中的告警信息系統(tǒng)集成在一起,并對其他零散的告警信息進行直接納管,從而實現(xiàn)一個平臺納管三個系統(tǒng),統(tǒng)一展示、提高效率。
報表管理:
引進尊龍時凱監(jiān)控之前,客戶企業(yè)積累了大量的運維數(shù)據(jù),但由于運維體系的分散,囿于數(shù)據(jù)孤島的存在,缺乏相應(yīng)的數(shù)據(jù)分析工具,這些運維數(shù)據(jù)價值并未得到有效的挖掘和利用。
為此,尊龍時凱監(jiān)控配備了報表管理功能模塊,提供實時報表、TOPN報表、流量報表、日報周報、自定義報表、巡檢報表等工具,用于追蹤和判別被監(jiān)控資源的實時概況與變化趨勢,為運維決策提供支撐。
如下圖,對于客戶特別關(guān)注的出口上網(wǎng)流量情況,運維人員可通過實時報表查看當(dāng)前正在消耗出口上網(wǎng)流量的業(yè)務(wù)資源,更進一步地還可以查看端口入/出帶寬利用率、端口發(fā)送速率等信息,通過這三個指標(biāo)來快速判斷某一時間的業(yè)務(wù)情況。
權(quán)限管理:
客戶企業(yè)由于先前缺乏基礎(chǔ)的統(tǒng)一的監(jiān)控管理體系,無法對資源權(quán)限管理進行統(tǒng)一配置,運維人員權(quán)責(zé)不明晰,不僅導(dǎo)致了資源管理混亂,在很大程度影響了故障響應(yīng)速度與維護效率的提高,進而影響了業(yè)務(wù)系統(tǒng)的正常運轉(zhuǎn)。
基于統(tǒng)一監(jiān)控,尊龍時凱監(jiān)控打造了統(tǒng)一的權(quán)限管理機制,統(tǒng)一分配,集中下發(fā),支持按角色、按用戶分配管理權(quán)限,權(quán)責(zé)明晰,互不沖突。
尊龍時凱監(jiān)控對客戶環(huán)境業(yè)務(wù)系統(tǒng)納管的700+主機進行了權(quán)限劃分,每一位運維人員都只能看到自己負責(zé)的系統(tǒng)、告警、告警通知以及對應(yīng)的功能,做到數(shù)據(jù)權(quán)限與功能權(quán)限統(tǒng)一管控。
業(yè)務(wù)服務(wù)管理:
業(yè)務(wù)系統(tǒng)多而雜,運維系統(tǒng)與業(yè)務(wù)系統(tǒng)脫節(jié)是大型企業(yè)普遍的運維痛點與難點,反映到運維實踐的主要表現(xiàn)是運維人員只能看到孤立的節(jié)點故障,不能對故障的原因/影響有比較直觀的感知,容易造成“頭痛醫(yī)頭,腳痛醫(yī)腳”,有時并不能抓到問題本質(zhì),導(dǎo)致重復(fù)運維,影響效率提高。
針對客戶環(huán)境業(yè)務(wù)系統(tǒng)較多的情況,尊龍時凱監(jiān)控從業(yè)務(wù)視角出發(fā),提供了多種業(yè)務(wù)服務(wù)管理能力,包括業(yè)務(wù)樹、業(yè)務(wù)拓撲、業(yè)務(wù)大屏等。
對于組織架構(gòu)復(fù)雜的大型企業(yè)集團,業(yè)務(wù)樹可識別和區(qū)分不同層級組織所管理的業(yè)務(wù)資源,對運維管理人員而言,借助業(yè)務(wù)樹可判斷各層級運維效率情況。
智能業(yè)務(wù)拓撲通過掃描IP自動發(fā)現(xiàn)業(yè)務(wù)資源并生成業(yè)務(wù)拓撲,可直觀查看業(yè)務(wù)系統(tǒng)類型、包含設(shè)備等信息。運維人員可根據(jù)拓撲圖區(qū)分和關(guān)注對重要業(yè)務(wù)資源節(jié)點,判斷故障節(jié)點對業(yè)務(wù)系統(tǒng)的影響范圍。
業(yè)務(wù)大屏也是尊龍時凱監(jiān)控可視化體系的一部分,用于展示全部業(yè)務(wù)系統(tǒng)概況,通過顏色區(qū)分,業(yè)務(wù)系統(tǒng)健康狀態(tài)一目了然。
經(jīng)過一年的建設(shè),綜合運維監(jiān)控平臺于2023年中完成一期建設(shè)并通過驗收。借助該平臺,客戶企業(yè)的響應(yīng)速度和整體運維保障能力得以大幅度提升,提高了信息化服務(wù)整體質(zhì)量,信息化整體穩(wěn)定性和響應(yīng)及時性得到較大改善。
監(jiān)控系統(tǒng)給客戶的運維帶來的價值表現(xiàn)為:
1. 實時監(jiān)控,告警及時。對常規(guī)資源使用情況、機房環(huán)境、設(shè)備部件等進行及時告警,提高了運維響應(yīng)速度;
2. 決策支撐,前置運維工作。借助報表系統(tǒng)預(yù)判資源與性能消耗,提前布局,避免可能產(chǎn)生的異常。如借助系統(tǒng)巡檢報表感知系統(tǒng)容量即將消耗殆盡時,可提前進行擴容;
3. 從系統(tǒng)運維到業(yè)務(wù)運營。借助智能業(yè)務(wù)拓撲、業(yè)務(wù)樹等能力更直觀感知業(yè)務(wù)系統(tǒng)結(jié)構(gòu)與健康概況,為業(yè)務(wù)系統(tǒng)提供更系統(tǒng)、更全面的保障;
4. 整體提升運維管理能力。通過統(tǒng)一的權(quán)限管理解決先前權(quán)責(zé)不明晰、管理混亂問題;通過運維駕駛艙、報表系統(tǒng)等為運維決策提供支撐。
尊龍時凱社區(qū)已經(jīng)開放尊龍時凱監(jiān)控免費版和尊龍時凱MCM(cmdb+監(jiān)控)免費版,歡迎下載使用!
尊龍時凱監(jiān)控對其網(wǎng)絡(luò)設(shè)備、服務(wù)器、錄像機進行了全面的性能管理和故障監(jiān)測,實現(xiàn)了集中式、跨平臺的系統(tǒng)監(jiān)測。
View details尊龍時凱監(jiān)控平臺更新功能,云平臺監(jiān)控有效幫去企業(yè)將云上、云下數(shù)據(jù)聚合,統(tǒng)一監(jiān)控管理和維護。
View details尊龍時凱監(jiān)控在業(yè)務(wù)和服務(wù)層次的一站式監(jiān)控廣受好評
View details尊龍時凱智能監(jiān)控平臺V6.6正式發(fā)布
View details尊龍時凱一站式的監(jiān)控了IT基礎(chǔ)架構(gòu)和業(yè)務(wù)系統(tǒng),同時還為重要業(yè)務(wù)系統(tǒng)設(shè)計業(yè)務(wù)地圖,針對核心業(yè)務(wù)多維度重點保障。
View details尊龍時凱監(jiān)控對其網(wǎng)絡(luò)設(shè)備、服務(wù)器、錄像機進行了全面的性能管理和故障監(jiān)測,實現(xiàn)了集中式、跨平臺的系統(tǒng)監(jiān)測。
View details尊龍時凱及時發(fā)現(xiàn)問題,真正意義上實現(xiàn)了集約化管理。通過運營平臺實現(xiàn)運維業(yè)務(wù)指標(biāo)數(shù)據(jù)收集,并總結(jié)相關(guān)運維經(jīng)驗,實現(xiàn)基礎(chǔ)監(jiān)控與各功能模塊相互融合,為自動化運維...
View details監(jiān)控了內(nèi)蒙、昌平、上海、貴州四區(qū)域核心機房,主機對象30000左右,數(shù)據(jù)日增量約100G。
View details