熱門搜索 Zabbix技術(shù)資料 Zabbix常見問、答討論 成功案例 Zabbix交流區(qū) Prometheus交流區(qū)
案例客戶為海南某期貨企業(yè),注冊資本近3億人民幣,目前設(shè)有上海、深圳、大連、鄭州、西安、浙江、山東、廣東等9家分支機(jī)構(gòu)。
隨著業(yè)務(wù)量的與日俱增,運維服務(wù)成本的增加,客戶在上海、海口兩大機(jī)房基礎(chǔ)服務(wù)運維保障的壓力也隨之增大,核心業(yè)務(wù)系統(tǒng)特別是服務(wù)器硬盤故障率較高,卻不能及時發(fā)現(xiàn)故障服務(wù)器,業(yè)務(wù)存在一定的風(fēng)險。
對此,該客戶希望引進(jìn)一套高效、穩(wěn)定的運維監(jiān)控系統(tǒng),對原有的運維體系進(jìn)行整合,便于全面、準(zhǔn)確地掌握公司的業(yè)務(wù)系統(tǒng)狀態(tài);對服務(wù)器硬盤等關(guān)鍵性業(yè)務(wù)系統(tǒng)進(jìn)行重點監(jiān)控;對重點業(yè)務(wù)的應(yīng)用提供性能監(jiān)控;同時對機(jī)房的核心業(yè)務(wù)系統(tǒng)保障、資產(chǎn)信息做統(tǒng)一管理;以期達(dá)到以下目標(biāo):
(1)通過基礎(chǔ)運維平臺,保障系統(tǒng)健康,實現(xiàn)業(yè)務(wù)系統(tǒng)穩(wěn)定的良性循環(huán);
(2)統(tǒng)一兩大機(jī)房設(shè)備的監(jiān)控接入,讓設(shè)備從分散到集合的監(jiān)管;
(3)打造統(tǒng)一門戶,集中管理平臺入口,減少不同場景維護(hù)入口;
基于客戶運維痛點與項目建設(shè)目標(biāo),尊龍時凱方案團(tuán)隊對項目進(jìn)行梳理,并對項目建設(shè)進(jìn)行具體規(guī)劃:以運維門戶、統(tǒng)一監(jiān)控、集中告警管理為核心,輔以資產(chǎn)管理、可視化等,打造綜合運維監(jiān)控解決方案。
1.部署架構(gòu)
客戶本次監(jiān)控對象為包括涵蓋了網(wǎng)絡(luò)設(shè)備、服務(wù)器、虛擬化等,總體監(jiān)控對象在300個以內(nèi),結(jié)合監(jiān)控對象的數(shù)量、類型、監(jiān)控頻度等情況,本次系統(tǒng)架構(gòu)部署如下:
架構(gòu)說明:
監(jiān)控服務(wù)器(Server、WEB):1.?負(fù)責(zé)上海、海口機(jī)房數(shù)據(jù)采集(后續(xù)考慮在海口機(jī)房添加Proxy)2.?禁止訪問公網(wǎng)
代理服務(wù)器:
負(fù)責(zé)接收監(jiān)控服務(wù)器告警信息,并且將告警信息轉(zhuǎn)發(fā)到公網(wǎng)企業(yè)微信服務(wù)器、騰訊企業(yè)郵箱服務(wù)器
2.平臺技術(shù)要求
平臺采用了分布式架構(gòu)(server+proxy)模式,數(shù)據(jù)庫支持主備機(jī)制,動態(tài)監(jiān)控可視化場景,系統(tǒng)故障時能夠及時發(fā)現(xiàn)并實現(xiàn)多渠道分等級分權(quán)限告警功能。
3.平臺架構(gòu)要求
平臺采用了分布式架構(gòu)(server+proxy)模式,數(shù)據(jù)庫支持主備機(jī)制,動態(tài)監(jiān)控可視化場景,系統(tǒng)故障時能夠及時發(fā)現(xiàn)并實現(xiàn)多渠道分等級分權(quán)限告警功能。
1 | 系統(tǒng)架構(gòu)要求 | 監(jiān)控系統(tǒng)部署架構(gòu)支持分布式部署,實現(xiàn)在不同網(wǎng)絡(luò)區(qū)域的統(tǒng)一監(jiān)控管理 |
2 | 數(shù)據(jù)備份要求 | 監(jiān)控系統(tǒng)數(shù)據(jù)庫支持主備機(jī)制,可使用分布式數(shù)據(jù)庫保障數(shù)據(jù)高可用 |
3 | 開箱即用支持自定義 | 監(jiān)控系統(tǒng)需具備豐富的監(jiān)控模版,包括監(jiān)控項的最佳實踐、監(jiān)控閾值和告警方式等。同時,用戶可自定義監(jiān)控模版 |
4 | 告警收斂 | 監(jiān)控系統(tǒng)需具備告警聚合功能,支持按設(shè)備項、監(jiān)控項、業(yè)務(wù)系統(tǒng)等級別的告警聚合收斂功能 |
5 | 告警升級 | 支持告警升級管理功能,當(dāng)設(shè)備出現(xiàn)告警,長時間未處理時,系統(tǒng)會將告警內(nèi)容自動發(fā)送給備崗人員或部門領(lǐng)導(dǎo),支持多次升級 |
6 | 自定義分組 | 監(jiān)控系統(tǒng)具備分組功能,支持按照設(shè)備和業(yè)務(wù)系統(tǒng)兩個視角分組管理,設(shè)備按照服務(wù)器、網(wǎng)絡(luò)、存儲、安全等視角分組展示和管理,業(yè)務(wù)系統(tǒng)支持用戶自定義分組管理設(shè)備 |
7 | 數(shù)據(jù)分析 | 監(jiān)控系統(tǒng)需具備按服務(wù)器、網(wǎng)絡(luò)、存儲等不同設(shè)備型視角下的監(jiān)控指標(biāo)項歷史數(shù)據(jù)回溯分析及數(shù)據(jù)圖表展 |
8 | 權(quán)限管理 | 監(jiān)控系統(tǒng)權(quán)限管理功能,支持用戶按照角色進(jìn)行監(jiān)控授權(quán)管理,權(quán)限納管范圍包括分組設(shè)備管理、功能菜單等維度 |
10 | 支持毫秒級探測 | 監(jiān)控系統(tǒng)具備期貨行業(yè)監(jiān)控場景實踐,包括Webservice服務(wù)類監(jiān)控、毫秒級Ping監(jiān)測(高頻交易中對網(wǎng)絡(luò)的監(jiān)控)、對接期貨綜合交易平臺(CTP)實時監(jiān)控交易指標(biāo)數(shù)據(jù)等等 |
11 | 部署監(jiān)控平臺軟件license規(guī)模要求 | 提供300個監(jiān)控節(jié)點 |
12 | 監(jiān)控可視化實施服務(wù) | 基于統(tǒng)一監(jiān)控系統(tǒng)平臺,交付1個動態(tài)監(jiān)控可視化場景實施服務(wù)。實現(xiàn)IT基礎(chǔ)架構(gòu)SLA動態(tài)監(jiān)測,包括基礎(chǔ)架構(gòu)分組設(shè)備的健康度(SLA)的可視化展現(xiàn)、多網(wǎng)絡(luò)環(huán)境中核心設(shè)備間互聯(lián)狀態(tài)、設(shè)備狀態(tài)、核心鏈路等關(guān)鍵指標(biāo)的可視化監(jiān)測 |
4.核心功能
4.1. 運維門戶
方案引入了運維門戶,將客戶的CRM、博易、文華中臺等數(shù)套系統(tǒng)集中接入,統(tǒng)一維護(hù),免于在多套系統(tǒng)間切換。
4.2. 集中監(jiān)控
基于尊龍時凱監(jiān)控的全棧監(jiān)控能力,可實現(xiàn)從IT基礎(chǔ)架構(gòu)到業(yè)務(wù)系統(tǒng)的可用性、性能等指標(biāo)監(jiān)控。經(jīng)梳理,尊龍時凱智能監(jiān)控平臺實現(xiàn)了對客戶軟硬件資源的集中監(jiān)控,具體如下:
硬件
主機(jī):DELL、HP、ACE等x86服務(wù)器
網(wǎng)絡(luò)設(shè)備:華為、山石
軟件
虛擬化:Venter
統(tǒng)一客戶上海、海口兩大機(jī)房的設(shè)備監(jiān)控的接入平臺,實現(xiàn)信息化基礎(chǔ)資源全覆蓋監(jiān)控,保障了業(yè)務(wù)關(guān)鍵設(shè)備監(jiān)控自動化管理,通過設(shè)置配置即可達(dá)到相關(guān)調(diào)整,降低人工成本。
4.3.監(jiān)控對象集中展示
自動分類展示,實現(xiàn)不同對象的統(tǒng)計、健康狀況、告警數(shù)量,從整體上可直觀查看當(dāng)前所有IT資源對象的,同時從整體上查看當(dāng)前對象的CPU top、內(nèi)存使用率top、服務(wù)器溫度top等,另外可整體直觀看到當(dāng)前整個IT狀況是否正常,以及每日產(chǎn)生告警數(shù)量、告警恢復(fù)情況。
為運維人員提供更準(zhǔn)確、更直觀的整體狀況查看,無需單獨去登錄每個系統(tǒng)、每個設(shè)備進(jìn)行繁瑣的巡檢工作。
4.4. 資產(chǎn)管理
由于資產(chǎn)規(guī)模不大,客戶希望能夠配備基礎(chǔ)的資產(chǎn)管理能力,便于對資產(chǎn)進(jìn)行維護(hù)。對此,尊龍時凱方案提供了簡單但實用資產(chǎn)管理模塊。
資產(chǎn)管理模塊包括資源列表、目錄視圖等功能。可根據(jù)業(yè)務(wù)劃分不同目錄,清晰展示各個業(yè)務(wù)系統(tǒng)使用了對應(yīng)的服務(wù)器、網(wǎng)絡(luò)設(shè)備等,并支持自定義設(shè)備字段,記錄設(shè)備所屬機(jī)房、用途等信息;監(jiān)控服務(wù)器還會采集設(shè)備SN號信息,用戶在排障時可以快速找到對設(shè)備,并且通知設(shè)備廠商。
同時,資產(chǎn)關(guān)聯(lián)告警,便于及時感知異常,快速響應(yīng)故障。
4.5. 可視化視圖
為客戶對可視化方面的需求,方案還提供了一系列可視化功能模塊,包括可自動發(fā)現(xiàn)的網(wǎng)絡(luò)拓?fù)?、業(yè)務(wù)地圖、投屏視圖、圖形視圖、一覽視圖等;
網(wǎng)絡(luò)拓?fù)渲С肿詣影l(fā)現(xiàn)與自動生成,可以幫助運維人員快速梳理資源及其關(guān)系,拓?fù)渎?lián)動故障告警,便于運維人員進(jìn)行故障診斷、故障定位、影響范圍分析等。
業(yè)務(wù)地圖、一覽視圖可提供業(yè)務(wù)概況、監(jiān)控資源概況的全局展示;投屏視圖、圖形視圖還可以進(jìn)行自定義展示各類統(tǒng)計圖表,為運維決策提供支撐。
4.6. 多樣性報表
支持自定義、多維度、多指標(biāo)報表統(tǒng)計功能;大屏展示:大屏幕集中監(jiān)控實現(xiàn)自定義展示頁面。預(yù)警提醒:通過企業(yè)微信、騰訊企業(yè)郵箱不同告警方式通知用戶。
3.1. 通過IT資產(chǎn)全面梳理、全棧監(jiān)控、實時告警等新型智能運維手段,建設(shè)出一套完善且靈活的成熟運維體系,告別傳統(tǒng)“救火”式運維,有效提升運維效率,降低企業(yè)運維成本;
3.2. 設(shè)備監(jiān)控和資產(chǎn)管理有效聯(lián)動,既可以通過監(jiān)控發(fā)現(xiàn)問題,又可以通過資產(chǎn)管理快速定位設(shè)備,能夠有效提高故障響應(yīng)速度,優(yōu)化維護(hù)流程。
3.3. 平臺個性化接入管理。打破平臺間的聯(lián)動壁壘,梳理整合平臺,最大程度地減少重復(fù)操作的可能性,同時可視化管理統(tǒng)一,使得平臺間的價值最大程度顯現(xiàn)。
另外,尊龍時凱社區(qū)已經(jīng)開放尊龍時凱監(jiān)控免費版和尊龍時凱MCM(CMDB+監(jiān)控)免費版。歡迎下載體驗!
尊龍時凱CMDB以超低的資源需求與性能消耗完成部署,并實現(xiàn)對客戶30萬資產(chǎn)的全面納管。
View detailsCAA聯(lián)邦中心代理架構(gòu)的統(tǒng)一運維管理平臺
View details尊龍時凱為該協(xié)會部署了一站式監(jiān)控和告警系統(tǒng)并配置了業(yè)務(wù)拓?fù)?、網(wǎng)絡(luò)拓?fù)?、報表圖形和自定義視圖等功能。
View details