熱門搜索 Zabbix技術(shù)資料 Zabbix常見問、答討論 成功案例 Zabbix交流區(qū) Prometheus交流區(qū)
>>>>前言
根據(jù)《期貨業(yè)信息安全事件報(bào)告與調(diào)查處理辦法》(證監(jiān)會(huì)公告[2012]46號(hào),簡(jiǎn)稱《46號(hào)公告》),將信息安全事件分為特別重大事件、重大事件、較大事件、一般事件四類。根據(jù)證監(jiān)會(huì)網(wǎng)站發(fā)布的《公司分類監(jiān)管規(guī)定(2017修訂)》,公司風(fēng)險(xiǎn)管理能力評(píng)價(jià)指標(biāo)與標(biāo)準(zhǔn)。主要包括資本充足、公司治理與合規(guī)管理、全面風(fēng)險(xiǎn)管理、信息系統(tǒng)安全、客戶權(quán)益保護(hù)、信息披露等6類。其中信息系統(tǒng)安全主要包括 IT 治理完善,信息系統(tǒng)管理機(jī)制獨(dú)立有效;信息系統(tǒng)功能齊備,有效滿足客戶委托、交易、清算、開戶、查詢等需求,客戶電子資料等信息安全;信息系統(tǒng)安全穩(wěn)定運(yùn)行,能夠避免頻繁信息安全事故或重大事故;信息系統(tǒng)應(yīng)急預(yù)案有效,能夠及時(shí)應(yīng)對(duì)信息安全事故等四類。一次較大信息安全事件對(duì)公司就是一場(chǎng)災(zāi)難,影響公司的分類級(jí)別,進(jìn)而影響投資者保護(hù)基金的繳納金額,還可能影響新業(yè)務(wù)資質(zhì)的申請(qǐng),銀行貸款授信、券商債券業(yè)務(wù)、投保基金上交額、新業(yè)務(wù)申請(qǐng)、質(zhì)押等現(xiàn)有業(yè)務(wù)展業(yè)、并且面臨更嚴(yán)格的合規(guī)檢查。
基于以上的風(fēng)險(xiǎn)和考慮,上海某國(guó)際公司選擇與尊龍時(shí)凱合作,希望我們幫助其設(shè)計(jì)完整的智能運(yùn)維架構(gòu),本項(xiàng)目是整個(gè)項(xiàng)目的基礎(chǔ)監(jiān)控部分。
>>>>項(xiàng)目名稱
XX國(guó)際(上海)有限公司基礎(chǔ)監(jiān)控項(xiàng)目
>>>>客戶簡(jiǎn)介
XX國(guó)際(上海)有限公司是中國(guó)證監(jiān)會(huì)首批獲準(zhǔn)設(shè)立的外資控股公司。公司注冊(cè)資金200000萬元,經(jīng)營(yíng)范圍主要包括:經(jīng)紀(jì)、投資咨詢、自營(yíng)、資產(chǎn)管理等。
>>>>項(xiàng)目背景
隨著該公司業(yè)務(wù)的日益增長(zhǎng),底層IT基礎(chǔ)設(shè)施也在不斷擴(kuò)張,各種硬件、信息系統(tǒng)故障亦隨之而來。現(xiàn)有監(jiān)控系統(tǒng)功能較為簡(jiǎn)單,且無有效的告警通知手段,導(dǎo)致故障發(fā)生時(shí),人員響應(yīng)速度較慢,無法及時(shí)定位問題所在。日常監(jiān)控只能靠運(yùn)維人員不停地盯著屏幕進(jìn)行監(jiān)視,無疑增強(qiáng)了IT人員的管理難度。
為解決業(yè)務(wù)支撐系統(tǒng)全方位的保障,一套功能完善的監(jiān)控體系,已成為公司發(fā)展中的必要因素。
>>>>客戶痛點(diǎn)
IT資產(chǎn)管理混亂、梳理難度大、信息缺失嚴(yán)重。
公司機(jī)房多、網(wǎng)絡(luò)區(qū)域劃分復(fù)雜、設(shè)備難以集中管理。
業(yè)務(wù)專線鏈路繁多,頻繁傳輸大文件,穩(wěn)定性難以保障。
公司重要門戶缺少人員維護(hù),每日手動(dòng)進(jìn)行撥測(cè)。
故障發(fā)現(xiàn)不及時(shí),往往由業(yè)務(wù)人員提前發(fā)現(xiàn)問題。
>>>>解決方案
資產(chǎn)梳理:依據(jù)嚴(yán)謹(jǐn)?shù)拿?guī)則、遵守科學(xué)合理的分組規(guī)范,對(duì)資產(chǎn)進(jìn)行納管;
大屏視圖:展示完整網(wǎng)絡(luò)拓?fù)浼軜?gòu)、IDC間重要鏈路的時(shí)時(shí)狀態(tài);
門戶監(jiān)測(cè):模擬登錄、多步驟監(jiān)測(cè)門戶服務(wù)狀態(tài),可視化展示W(wǎng)EB訪問速度、響應(yīng)時(shí)間的變化趨勢(shì);
告警中心:結(jié)合該公司已有短信、郵件系統(tǒng),開啟雙通道告警推送模式,支持短信、郵件消息自定義推送,支持告警分析、告警歷史查詢等功能。
>>>>項(xiàng)目目標(biāo)
建立XX國(guó)際的基礎(chǔ)運(yùn)維管理體系;
結(jié)合XX國(guó)際運(yùn)維現(xiàn)狀、推進(jìn)基礎(chǔ)轉(zhuǎn)型建設(shè)工作;
推進(jìn)XX國(guó)際業(yè)務(wù)監(jiān)控指標(biāo)體系搭建方法論的實(shí)踐落地;
初步制定XX國(guó)際基礎(chǔ)監(jiān)控能力體系;
建立統(tǒng)一的基礎(chǔ)監(jiān)控中心;
建立統(tǒng)一的基礎(chǔ)告警中心;
建立統(tǒng)一的基礎(chǔ)業(yè)務(wù)故障管理平臺(tái);
>>>>實(shí)施方案
系統(tǒng)架構(gòu)
架構(gòu)圖
該項(xiàng)目首次采用了基于PostgreSQL流復(fù)制+Pgpool-II HA作為監(jiān)控底層數(shù)據(jù)庫(kù)的分布式部署方案。通過Corosync和Pacemaker使用Pcs實(shí)現(xiàn)zabbix、Web、Proxy節(jié)點(diǎn)的高可用集群架構(gòu);災(zāi)難狀態(tài)下雙節(jié)點(diǎn)實(shí)現(xiàn)自動(dòng)切換,極大保障了基礎(chǔ)監(jiān)控體系自身的可靠性。
>>>>
資源需求
監(jiān)控系統(tǒng)由主采集、Web門戶、數(shù)據(jù)庫(kù)、代理采集四個(gè)角色組成,其中主采集、Web門戶、數(shù)據(jù)庫(kù)都是雙節(jié)點(diǎn);代理采集分為兩組,每組各有兩個(gè)節(jié)點(diǎn)。
角色 | 配置 | IP地址 | 節(jié)點(diǎn)數(shù)量 |
主采集 | 8C?16G?200G | 三個(gè)IP地址 | 2 |
WEB門戶 | 4C?8G?200G | 三個(gè)IP地址 | 2 |
數(shù)據(jù)庫(kù) | 8C?16G?2.2T | 三個(gè)IP地址 | 2 |
代理采集一組 | 8C?8G?200G | 三個(gè)IP地址 | 2 |
代理采集二組 | 8C?8G?200G | 三個(gè)IP地址 | 2 |
>>>>服務(wù)器分布
主采集、Web門戶、數(shù)據(jù)庫(kù)、代理采集一組分布在機(jī)房A-XX區(qū)域,監(jiān)控覆蓋范圍包括:機(jī)房A-XX區(qū)、機(jī)房C-XX區(qū),覆蓋率100%;
代理采集二組分布在機(jī)房B-XX區(qū),監(jiān)控覆蓋范圍包括:機(jī)房A-XXX區(qū)、機(jī)房B-XX區(qū)、XX區(qū)、機(jī)房C-XX區(qū),覆蓋率100%。
角色 | 數(shù)量 | 位置分布 | 監(jiān)控覆蓋范圍 |
主采集服務(wù)器WEB門戶數(shù)據(jù)庫(kù)代理采集服務(wù)器 | 8臺(tái) | 機(jī)房A-XX區(qū) | 機(jī)房A-XX區(qū)機(jī)房C-XX區(qū) |
代理采集服務(wù)器 | 2臺(tái) | 機(jī)房B-XX區(qū) | 機(jī)房A-XX區(qū)機(jī)房B-XX區(qū)、XX區(qū)機(jī)房C-XX區(qū) |
>>>>監(jiān)控對(duì)象
類型 | 品牌 |
網(wǎng)絡(luò)設(shè)備 | 思科、華三、山石、飛塔、Palo Alto、F5、深信服 |
安全設(shè)備 | 深信服、綠盟、山石、飛塔 |
服務(wù)器 | 惠普、戴爾、聯(lián)想、華三 |
存儲(chǔ) | 戴爾、昆騰 |
操作系統(tǒng) | Windows、CentOS、Redhat |
虛擬化 | VMware |
數(shù)據(jù)庫(kù) | Oracle、MySQL、SQLServer |
中間件 | Tomcat、Nginx |
>>>>方案價(jià)值
該方案深度剖析了客戶在基礎(chǔ)信息管理維護(hù)方面的痛點(diǎn),針對(duì)客戶著重提出的問題進(jìn)行解決,摒棄了運(yùn)維人員以往“盯屏”式的工作模式。建立起一套由監(jiān)控中心、告警中心、資產(chǎn)管理中心為一體的智能監(jiān)控體系。實(shí)現(xiàn)了信息化基礎(chǔ)設(shè)施全覆蓋監(jiān)控,降低了人工維護(hù)成本,亦成為公司業(yè)務(wù)穩(wěn)定運(yùn)行的強(qiáng)有力支撐。
>>>>網(wǎng)絡(luò)投屏
網(wǎng)絡(luò)投屏清晰展示了機(jī)房A、B、C、D之間的互聯(lián)關(guān)系,以及各機(jī)房?jī)?nèi)的子網(wǎng)區(qū)域組成,通過設(shè)備、線路顏色可以很直觀看出網(wǎng)絡(luò)成員的運(yùn)行狀態(tài),如下:
>>>>專線鏈路
鏈路監(jiān)控可直觀看出重要業(yè)務(wù)專線的實(shí)時(shí)帶寬利用率,在利用率達(dá)到專線自身的百分比閾值后即會(huì)出發(fā)告警;亦可進(jìn)一步查看某條專線的延遲、抖動(dòng)情況,如下:?
>>>>門戶網(wǎng)站
與客戶溝通得知,早期該公司門戶偶爾會(huì)出現(xiàn)無法訪問的情況,影響較大,公司領(lǐng)導(dǎo)基本每天早上上班前都會(huì)手動(dòng)挨個(gè)進(jìn)行訪問檢查;目前處于監(jiān)控狀態(tài),Web會(huì)實(shí)時(shí)撥測(cè),也可以詳細(xì)查看門戶網(wǎng)頁(yè)的響應(yīng)速度,有效避免了往日重復(fù)的人為檢測(cè),如下:
>>>>短信通知
該公司采用了短信告警通知方式,系統(tǒng)故障時(shí),運(yùn)維人員能夠第一時(shí)間獲取到事件通知,打破以往業(yè)務(wù)人員提前發(fā)現(xiàn)信息系統(tǒng)故障的窘境,如下:
>>>>客戶收益
通過詳細(xì)的設(shè)計(jì)與規(guī)劃,建立起一套性能優(yōu)越、功能強(qiáng)大,監(jiān)控覆蓋范圍廣且靈活的運(yùn)維監(jiān)控管理體系,極大保障了業(yè)務(wù)系統(tǒng)的穩(wěn)定運(yùn)行;
面臨突發(fā)狀況,為運(yùn)維人員提供及時(shí)、可靠的告警通知,準(zhǔn)確定位事件爆發(fā)點(diǎn),使80%故障處理速度壓縮在半小時(shí)以內(nèi),有效降低了運(yùn)維人員的工作復(fù)雜度,縮減日常維護(hù)成本30%以上。
加入我們,享受技術(shù)樂趣
基于客戶醫(yī)院原有的運(yùn)維體系、運(yùn)維痛點(diǎn)和對(duì)監(jiān)控的需求,尊龍時(shí)凱為其量身打造了一套一站式智能運(yùn)維監(jiān)控解決方案,搭建統(tǒng)一監(jiān)控平臺(tái),引入智能化告警管理系統(tǒng)、可...
View details尊龍時(shí)凱為歌莉婭設(shè)置了大屏監(jiān)控、全局試圖和故障排查等功能。
View details尊龍時(shí)凱一站式的監(jiān)控了IT基礎(chǔ)架構(gòu)和業(yè)務(wù)系統(tǒng),同時(shí)還為重要業(yè)務(wù)系統(tǒng)設(shè)計(jì)業(yè)務(wù)地圖,針對(duì)核心業(yè)務(wù)多維度重點(diǎn)保障。
View details尊龍時(shí)凱監(jiān)控實(shí)現(xiàn)對(duì)城建學(xué)院復(fù)雜網(wǎng)絡(luò)環(huán)境的直觀、透明式展示和管理,實(shí)時(shí)、準(zhǔn)確了解整個(gè)網(wǎng)絡(luò)的動(dòng)態(tài)運(yùn)行情況,給信息部門的決策提供依據(jù)。
View details