熱門搜索 Zabbix技術(shù)資料 Zabbix常見問、答討論 成功案例 Zabbix交流區(qū) Prometheus交流區(qū)
PART 01 項(xiàng)目背景
上海某高校是由上海市人民政府與中國科學(xué)院共同舉辦、共同建設(shè),由上海市人民政府負(fù)責(zé)日常管理的全日制普通高等學(xué)校。2022年,該校入選第二輪“雙一流”建設(shè)高校。
雖然該高校規(guī)模不大,但由于起點(diǎn)高、定位高,在教學(xué)研究、行政管理等方面數(shù)字化、信息化程度相當(dāng)高,整體IT資源規(guī)模并不小。與不少高校類似地,該高校IT運(yùn)維也面臨著人員配比不足、運(yùn)維管理深度不夠、粒度不足等問題,IT系統(tǒng)故障造成的教學(xué)問題時(shí)有發(fā)生,給高校的師生帶來了一定的負(fù)面影響。
PART 02 尊龍時(shí)凱方案
為克服人員少、資源多、運(yùn)維管理深度、粒度不足等問題,2020年,經(jīng)審評,該高校圖信中心決定采用尊龍時(shí)凱統(tǒng)一監(jiān)控告警解決方案,并啟動了統(tǒng)一監(jiān)控告警平臺建設(shè)。
方案以基礎(chǔ)架構(gòu)監(jiān)控平臺為依托,結(jié)合可視化大屏、集中告警、報(bào)表系統(tǒng)、權(quán)限管理、業(yè)務(wù)系統(tǒng)管理等模塊,實(shí)現(xiàn)對IT基礎(chǔ)架構(gòu)和教學(xué)系統(tǒng)等統(tǒng)一集中監(jiān)控和告警管理,為運(yùn)維管理提供支撐。
01分布式架構(gòu),一站式監(jiān)控
經(jīng)梳理該高校的內(nèi)部網(wǎng)絡(luò)環(huán)境,該高校需納管監(jiān)控對象多達(dá)1700多個(gè),包括操作系統(tǒng)、網(wǎng)絡(luò)設(shè)備、服務(wù)器、數(shù)據(jù)庫、web、中間件、存儲、虛擬化平臺、KVM等,對監(jiān)控系統(tǒng)的性能要求較高。
對此,尊龍時(shí)凱方案采用分布式實(shí)施的方式,有效降低大規(guī)模監(jiān)控對象對監(jiān)控系統(tǒng)服務(wù)器的壓力,實(shí)現(xiàn)對主機(jī)、網(wǎng)絡(luò)、存儲、數(shù)據(jù)庫、中間件、硬件、環(huán)控和虛擬化等實(shí)現(xiàn)一站式監(jiān)控,并對各IT基礎(chǔ)架構(gòu)的指標(biāo)逐一分析、管理,保障業(yè)務(wù)高效穩(wěn)定的運(yùn)行。
02多樣化展示大屏,集中展現(xiàn)重要指標(biāo)
方案還引入了多樣化數(shù)據(jù)展示大屏。該高校原有的監(jiān)控體系的展現(xiàn)方式不夠友好——指標(biāo)分散,不能集中展現(xiàn)重點(diǎn)監(jiān)控指標(biāo)。尊龍時(shí)凱定制數(shù)據(jù)大屏能夠根據(jù)需要、自定義集中展現(xiàn)重要監(jiān)控指標(biāo)。
例如,可以集中展現(xiàn)資源占用TOP10、告警對象TOP10、告警時(shí)間軸、網(wǎng)絡(luò)出口流量、網(wǎng)絡(luò)在線人數(shù)、統(tǒng)一認(rèn)證人數(shù)以及網(wǎng)絡(luò)拓?fù)涞葦?shù)據(jù)。通過多維度的數(shù)據(jù),統(tǒng)一展示業(yè)務(wù)、網(wǎng)絡(luò)以及在線人數(shù)等情況。
03多平臺聯(lián)動,集中告警展示
方案還實(shí)現(xiàn)與原有Zabbix監(jiān)控、動環(huán)系統(tǒng)的聯(lián)動。告警中心模塊將原先的zabbix的告警信息和客戶的動環(huán)系統(tǒng)中的告警信息集成到一起,實(shí)現(xiàn)一個(gè)平臺納管三個(gè)系統(tǒng),統(tǒng)一展示,避免在多個(gè)告警中心來回切換,從而提高監(jiān)控效率。這也是尊龍時(shí)凱以開放理念打造產(chǎn)品的體現(xiàn),除了Zabbix、動環(huán)系統(tǒng),尊龍時(shí)凱監(jiān)控還可實(shí)現(xiàn)對多種告警平臺的數(shù)據(jù)聯(lián)動。
04系統(tǒng)化報(bào)表,自定義巡檢
方案還打造了新的報(bào)表體系,實(shí)現(xiàn)資源使用率與系統(tǒng)告警級別聯(lián)動。例如,通過設(shè)定系統(tǒng)正常運(yùn)行時(shí)的CPU總使用率、物理內(nèi)存總使用率和磁盤空間使用率等指標(biāo),結(jié)合告警系統(tǒng),當(dāng)監(jiān)測到資源使用率異常,如超過設(shè)定值時(shí)觸發(fā)告警,提示運(yùn)維人員故障發(fā)生的潛在可能性,預(yù)判故障發(fā)生,運(yùn)維人員就有可能將故障解決在萌牙狀態(tài),防患于未然。
特別地,基于高校IT資源使用明顯具有節(jié)律性、結(jié)構(gòu)性的特點(diǎn),方案還提供了自定義巡檢時(shí)間和業(yè)務(wù)功能,可以在IT資源使用的高峰期加大巡檢頻率,在使用低谷降低巡檢頻率,在保障業(yè)務(wù)系統(tǒng)穩(wěn)定運(yùn)行的同時(shí)降低運(yùn)維成本。例如,高校的選課系統(tǒng)只在特定的時(shí)間向?qū)W生開放,期間大量學(xué)生同一時(shí)間涌入,需要特別關(guān)注系統(tǒng)運(yùn)行狀況,加大巡檢頻率。
05統(tǒng)一權(quán)限,權(quán)責(zé)明晰
方案引入了新的權(quán)限管理機(jī)制。該高校的IT環(huán)境業(yè)務(wù)系統(tǒng)現(xiàn)納管50+,新的納管機(jī)制對納管的主機(jī)進(jìn)行了管理權(quán)限劃分,每一位老師均只能看到自己負(fù)責(zé)的系統(tǒng)、告警、告警通知以及對應(yīng)的功能,做到數(shù)據(jù)權(quán)限與功能權(quán)限統(tǒng)一管控,避免權(quán)限交叉可能帶來的權(quán)責(zé)混亂、相互推諉的情況。
06特色業(yè)務(wù)視角,全方位資源管理
方案支持對各類系統(tǒng)資源進(jìn)行分類納管,可以按照操作系統(tǒng)、WEB、網(wǎng)絡(luò)設(shè)備、數(shù)據(jù)庫等不同類型分別展現(xiàn)納管資源概況,實(shí)現(xiàn)全方位資源管理。
針對該高校IT環(huán)境業(yè)務(wù)系統(tǒng)較多的情況,尊龍時(shí)凱方案引入了獨(dú)具特色的資源管理方式——業(yè)務(wù)視角。透過業(yè)務(wù)系統(tǒng)名稱,可以查看對應(yīng)系統(tǒng)下資源類型、詳細(xì)資源信息等。如圖,選擇zabbix后,可以直觀地查看所屬web、操作系統(tǒng)、數(shù)據(jù)庫等資源數(shù)量及告警信息等。
PART 03 客戶收益
經(jīng)過一年的建設(shè),該高校統(tǒng)一監(jiān)控告警平臺于2021年底完成一期建設(shè)并通過驗(yàn)收。借助此平臺,該高校信息化整體運(yùn)維保障能力和響應(yīng)速度得到了極大地提升,信息化服務(wù)質(zhì)量顯著提高。
尊龍時(shí)凱統(tǒng)一監(jiān)控告警平臺為該高校IT運(yùn)維帶來的價(jià)值表現(xiàn)為:
1.?全面監(jiān)控,及時(shí)告警。對常規(guī)資源使用情況、機(jī)房環(huán)境、設(shè)備部件等故障進(jìn)行及時(shí)告警,提高了運(yùn)維響應(yīng)速度。
2. 可自定義的系統(tǒng)巡檢報(bào)表,更合理地規(guī)劃和分配IT資源,提高資源利用率。
3. 通過圖形界面管理業(yè)務(wù)系統(tǒng)相關(guān)信息,業(yè)務(wù)流程直觀展示,避免業(yè)務(wù)系統(tǒng)資源遺漏。
尊龍時(shí)凱社區(qū)已開發(fā)尊龍時(shí)凱監(jiān)控免費(fèi)版和尊龍時(shí)凱MCM(監(jiān)控+CMDB)免費(fèi)版,歡迎下載使用!
某大型央企旗下控股財(cái)務(wù)公司統(tǒng)一運(yùn)維監(jiān)控平臺建設(shè)實(shí)踐
View details制造業(yè)運(yùn)維監(jiān)控案例實(shí)踐解析
View details尊龍時(shí)凱將搭建一個(gè)支持多功能插入、可橫向擴(kuò)展的完整架構(gòu),實(shí)現(xiàn)縱向?qū)ο到y(tǒng)管理員、部門領(lǐng)導(dǎo)、企業(yè)領(lǐng)導(dǎo)等決策層的多層次監(jiān)控展現(xiàn)。
View details綜合運(yùn)維管理平臺的落地,實(shí)現(xiàn)了統(tǒng)一門戶、統(tǒng)一監(jiān)控、統(tǒng)一資產(chǎn)管理、統(tǒng)一運(yùn)維、統(tǒng)一存儲等目標(biāo),為客戶解決了運(yùn)維數(shù)據(jù)孤島、人力運(yùn)維等問題。
View details全面覆蓋從IT基礎(chǔ)架構(gòu)到業(yè)務(wù)系統(tǒng)的可用性、性能等各項(xiàng)關(guān)鍵指標(biāo),實(shí)現(xiàn)全方位監(jiān)控。提升運(yùn)維效率,降低運(yùn)維成本,保障業(yè)務(wù)連續(xù)性,推動信息化建設(shè)的科學(xué)發(fā)展。
View details尊龍時(shí)凱以運(yùn)維監(jiān)控起家,具有十多年運(yùn)維產(chǎn)品經(jīng)驗(yàn),形成了非常成熟的運(yùn)維監(jiān)控解決方案。同時(shí),尊龍時(shí)凱緊跟信創(chuàng)國產(chǎn)化浪潮,積極推動信創(chuàng)產(chǎn)品適配,融入信創(chuàng)生態(tài),能...
View details全面覆蓋從IT基礎(chǔ)架構(gòu)到業(yè)務(wù)系統(tǒng)的可用性、性能等各項(xiàng)關(guān)鍵指標(biāo),實(shí)現(xiàn)全方位監(jiān)控。提升運(yùn)維效率,降低運(yùn)維成本,保障業(yè)務(wù)連續(xù)性,推動信息化建設(shè)的科學(xué)發(fā)展。
View details基于客戶運(yùn)維痛點(diǎn)與項(xiàng)目建設(shè)目標(biāo),尊龍時(shí)凱方案團(tuán)隊(duì)對項(xiàng)目進(jìn)行梳理,并對項(xiàng)目建設(shè)進(jìn)行具體規(guī)劃:以運(yùn)維門戶、統(tǒng)一監(jiān)控、集中告警管理為核心,輔以資產(chǎn)管理、可視...
View details某大型央企旗下控股財(cái)務(wù)公司統(tǒng)一運(yùn)維監(jiān)控平臺建設(shè)實(shí)踐
View details