熱門搜索 Zabbix技術(shù)資料 Zabbix常見問、答討論 成功案例 Zabbix交流區(qū) Prometheus交流區(qū)
深圳市寶安某醫(yī)院統(tǒng)一監(jiān)控平臺(tái)項(xiàng)目
該醫(yī)院成立于1957年,是集醫(yī)療、科研、教學(xué)、預(yù)防、保健、康復(fù)、社區(qū)健康服務(wù)于一體的國家三級(jí)大型公立綜合醫(yī)院,是深圳大學(xué)和廣東省高等醫(yī)學(xué)院校教學(xué)醫(yī)院,廣東醫(yī)科大學(xué)碩士研究生培養(yǎng)基地和全科醫(yī)學(xué)專業(yè)規(guī)培協(xié)同基地。
隨著“互聯(lián)網(wǎng)+”時(shí)代的到來,醫(yī)院信息化建設(shè)進(jìn)入關(guān)鍵時(shí)期。網(wǎng)絡(luò)設(shè)備、服務(wù)器、業(yè)務(wù)系統(tǒng)、數(shù)據(jù)庫等軟硬件設(shè)備的紛繁復(fù)雜以及用戶對(duì)IT業(yè)務(wù)的高可用性需求使得網(wǎng)絡(luò)運(yùn)維工作任務(wù)更加艱巨。成立至今,已經(jīng)建成囊括兩個(gè)院區(qū)的大型綜合信息系統(tǒng),包括各類子系統(tǒng)數(shù)十個(gè),工作站幾千臺(tái)。但是,醫(yī)院網(wǎng)絡(luò)運(yùn)維仍然是由醫(yī)生、護(hù)士在使用過程中發(fā)現(xiàn)故障,然后通知信息部門,經(jīng)過運(yùn)維人員故障驗(yàn)證后再開始采取相應(yīng)措施解決故障。這種被動(dòng)、孤立的運(yùn)維方式,使得運(yùn)維人員疲于處理各種故障、效率低下,即使加班加點(diǎn)地調(diào)試、部署、維護(hù),也經(jīng)常會(huì)因設(shè)備故障而導(dǎo)致業(yè)務(wù)中斷,嚴(yán)重影響醫(yī)院的正常運(yùn)轉(zhuǎn)”。
為了對(duì)本院網(wǎng)管的各種資源進(jìn)行綜合管理,更好地監(jiān)控網(wǎng)絡(luò)設(shè)備、服務(wù)器、業(yè)務(wù)系統(tǒng)的實(shí)時(shí)狀態(tài),計(jì)劃搭建統(tǒng)一監(jiān)控平臺(tái),達(dá)到提高維護(hù)管理效率、降低資源管理的復(fù)雜程度,實(shí)現(xiàn)故障的快速發(fā)現(xiàn)、快速定位;避免、減輕故障對(duì)業(yè)務(wù)、辦公造成的損失。
為了解決醫(yī)院龐大的網(wǎng)絡(luò)設(shè)備數(shù)量造成的網(wǎng)絡(luò)運(yùn)維管理困難。基于zabbix為基礎(chǔ)和企業(yè)微信的網(wǎng)絡(luò)監(jiān)控系統(tǒng),通過它實(shí)時(shí)獲取交換機(jī)、服務(wù)器等被監(jiān)控對(duì)象的相關(guān)數(shù)據(jù),掌握網(wǎng)絡(luò)、信息系統(tǒng)運(yùn)行情況,及時(shí)發(fā)現(xiàn)并解決問題,保證醫(yī)院網(wǎng)絡(luò)的高可用性。
本項(xiàng)目從硬件、主機(jī)、網(wǎng)絡(luò)設(shè)備、數(shù)據(jù)庫、中間件、應(yīng)用、業(yè)務(wù)系統(tǒng)、存儲(chǔ)、虛擬化的一站式運(yùn)維管理平臺(tái)來實(shí)現(xiàn)IT 基礎(chǔ)資源的統(tǒng)一集中管理。
在實(shí)際監(jiān)控架構(gòu)中,尊龍時(shí)凱監(jiān)控根據(jù)網(wǎng)絡(luò)環(huán)境、監(jiān)控規(guī)模等?分了三種架構(gòu):?server-client 、master-node-client、server-proxy-client三種 。
·?server-client架構(gòu):
zabbix的最簡單的架構(gòu),監(jiān)控機(jī)和被監(jiān)控機(jī)之間不經(jīng)過任何代理 ,直接由zabbix server和zabbix agentd之間進(jìn)行數(shù)據(jù)交互。適用于網(wǎng)絡(luò)比較簡單,設(shè)備比較少的監(jiān)控環(huán)境 。
·?server-proxy-client架構(gòu):
其中proxy是server、client之間溝通的一個(gè)橋梁,proxy本身沒有前端,而且其本身并不存放數(shù)據(jù),只是將agentd發(fā)來的數(shù)據(jù)暫時(shí)存放,而后再提交給server 。該架構(gòu)經(jīng)常是和master-node-client架構(gòu)做比較的架構(gòu) ,一般適用于跨機(jī)房、跨網(wǎng)絡(luò)的中型網(wǎng)絡(luò)架構(gòu)的監(jiān)控。
·?master-node-client架構(gòu):
該架構(gòu)是zabbix最復(fù)雜的監(jiān)控架構(gòu),適用于跨網(wǎng)絡(luò)、跨機(jī)房、設(shè)備較多的大型環(huán)境 。每個(gè)node同時(shí)也是一個(gè)server端,node下面可以接proxy,也可以直接接client 。node有自已的配置文件和數(shù)據(jù)庫,其要做的是將配置信息和監(jiān)控?cái)?shù)據(jù)向master同步,master的故障或損壞對(duì)node其下架構(gòu)的完整性。
基于master-node-client架構(gòu),按照不同域間可追加多個(gè)代理,基本系統(tǒng)要求如下:
角色 | 操作系統(tǒng) | 磁盤大小 | CPU | 內(nèi)存 | IP地址 | 主機(jī)個(gè)數(shù) | 備注 |
采集服務(wù)器 | CentOS7 | 50G | 8核 | 8G | 一個(gè)IP 地址 | 1 | 守護(hù)進(jìn)程 |
數(shù)據(jù)庫服務(wù)器 | CentOS7 | 500G | 8核 | 16G | 三個(gè)IP 地址 | 2 | 主備 |
web服務(wù)器 | CentOS7 | 50G | 4核 | 4G | 一個(gè)IP 地址 | 1 | ? |
采集代理服務(wù)器 | CentOS7 | 100G | 8核 | 8G | 一個(gè)IP 地址 | N | 根據(jù)主機(jī)和網(wǎng)段增加 |
1.?數(shù)據(jù)庫區(qū)域中MySQL1作為主庫,MySQL2作為從庫
2.?采集區(qū)域直接對(duì)接數(shù)據(jù)庫區(qū)域的主庫MySQL1
3.?WEB區(qū)域?qū)τ谠鰟h改都直接對(duì)接數(shù)據(jù)庫區(qū)域的主庫?MySQL1,讀對(duì)接數(shù)據(jù)庫區(qū)域的從庫MySQL2
4.?數(shù)據(jù)庫區(qū)域的主備架構(gòu)對(duì)比主主架構(gòu)來說優(yōu)點(diǎn)是技術(shù)維護(hù)要求較低,不容易出現(xiàn)數(shù)據(jù)紊亂問題,缺點(diǎn)是當(dāng)出現(xiàn)主庫異常的時(shí)候不會(huì)主動(dòng)啟用備庫,需要手動(dòng)切換或者等待主庫正常才可以正常采集
5.?采集區(qū)域可以對(duì)接多臺(tái)Proxy代理分擔(dān)壓力或分布式監(jiān)控?
微信作為最大用戶群體的即時(shí)通訊軟件,方便快捷,其可用性和持續(xù)性已經(jīng)獲得用戶認(rèn)可。微信企業(yè)號(hào)提供了豐富的第三方接口,其官網(wǎng)也提供了詳細(xì)的API文檔。監(jiān)控系統(tǒng)通過調(diào)用微信的免費(fèi)接口,不僅可以實(shí)現(xiàn)告警零成本,而且可以及時(shí)高效地將告警信息推送給運(yùn)維人員,以便及時(shí)處理。
登錄企業(yè)微信管理界面,在“通訊錄”中創(chuàng)建運(yùn)維管理組,添加成員,在“企業(yè)應(yīng)用”中自建應(yīng)用。記錄成員賬號(hào),組織部門ID,應(yīng)用AgentID,CorpID和Secret,監(jiān)控系統(tǒng)調(diào)用API接口時(shí)需要用到這些信息。在服務(wù)器端,修改微信報(bào)警的腳本配置文件中corpid, secret和AgentID值。然后在WEB端,配置報(bào)警媒介和觸發(fā)微信報(bào)警的動(dòng)作。
配置完成后,當(dāng)有設(shè)備出現(xiàn)故障和恢復(fù)的時(shí)候, 監(jiān)控系統(tǒng)自動(dòng)將告警信息發(fā)送至企業(yè)微信客戶端。
1.?主機(jī)監(jiān)控:?Centos、Windows
重要指標(biāo):針對(duì)所有的IOPS
2.網(wǎng)絡(luò)設(shè)備監(jiān)控:Cisco、H3C、華為、Juniper
重要指標(biāo):針對(duì)所有的端口狀態(tài)、主板狀態(tài)、CPU使用率、內(nèi)存使用率、溫度等
3.虛擬化監(jiān)控:VCentor
監(jiān)控Clusters、Datacenters、Datastores、Hypervisors、VM、vCenter平臺(tái)告警對(duì)接
Clusters、Datacenters、Datastores、Hypervisors、VM資源相互關(guān)聯(lián)狀態(tài)模塊與監(jiān)控平臺(tái)集成
消息與隊(duì)列處理,對(duì)接
4.服務(wù)器監(jiān)控:DELL、華為、曙光
需采用IPMI、SNMP、爬蟲等連接查詢數(shù)據(jù)
重要指標(biāo):告警對(duì)接、硬盤狀態(tài)
5.存儲(chǔ)監(jiān)控: Netapp、HDS
需采用專門的存儲(chǔ)工具、SMI-S、SNMP、SSH等連接查詢數(shù)據(jù)
重要指標(biāo):告警對(duì)接、硬盤狀態(tài)、IOPS
通過搭建尊龍時(shí)凱監(jiān)控系統(tǒng),結(jié)合微信企業(yè)號(hào),實(shí)現(xiàn)告警信息的實(shí)時(shí)推送,提升了醫(yī)院網(wǎng)絡(luò)運(yùn)維的管理效率,保證醫(yī)院網(wǎng)絡(luò)的高可用性和持續(xù)性。系統(tǒng)納管了監(jiān)控服務(wù)器150多個(gè)、監(jiān)控交換機(jī)200余個(gè)。很好地滿足了中心醫(yī)院對(duì)網(wǎng)絡(luò)環(huán)境中的網(wǎng)絡(luò)設(shè)備、網(wǎng)絡(luò)鏈路的實(shí)時(shí)監(jiān)控需求。降低了維護(hù)人員工作量,提高了工作效率。
尊龍時(shí)凱使用開源監(jiān)控項(xiàng)目zabbix二次開發(fā)的尊龍時(shí)凱監(jiān)控系統(tǒng)結(jié)合微信推送,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)運(yùn)行狀況的有效監(jiān)測。通過配置不同的觸發(fā)策略,根據(jù)設(shè)備重要程度推送不同級(jí)別的告警信息。通過該系統(tǒng)取締了人工的、手工的監(jiān)控方式,有力的支撐了醫(yī)院信息化建設(shè)。
加入我們,享受技術(shù)樂趣
尊龍時(shí)凱深耕運(yùn)維領(lǐng)域多年,積累了豐富的IT監(jiān)控技術(shù)儲(chǔ)備和成熟經(jīng)驗(yàn),不僅自身可以打造監(jiān)控平臺(tái)和CMDB平臺(tái),同時(shí)對(duì)適配其他CMDB平臺(tái)也有獨(dú)到見解與豐碩成果。
View detailsIT監(jiān)控是監(jiān)控IT軟硬件運(yùn)行狀況的一套系統(tǒng),它可以監(jiān)控服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)設(shè)備、操作系統(tǒng)、數(shù)據(jù)庫等等;它不同于我們常見的視頻監(jiān)控,后者多用于監(jiān)控人、公共...
View details尊龍時(shí)凱監(jiān)控實(shí)現(xiàn)對(duì)城建學(xué)院復(fù)雜網(wǎng)絡(luò)環(huán)境的直觀、透明式展示和管理,實(shí)時(shí)、準(zhǔn)確了解整個(gè)網(wǎng)絡(luò)的動(dòng)態(tài)運(yùn)行情況,給信息部門的決策提供依據(jù)。
View details尊龍時(shí)凱監(jiān)控對(duì)其網(wǎng)絡(luò)設(shè)備、服務(wù)器、錄像機(jī)進(jìn)行了全面的性能管理和故障監(jiān)測,實(shí)現(xiàn)了集中式、跨平臺(tái)的系統(tǒng)監(jiān)測。
View details尊龍時(shí)凱建立監(jiān)控平臺(tái),做到及早發(fā)現(xiàn)故障、合理利用信息化基礎(chǔ)資源,達(dá)到最大化資源使用,使得醫(yī)院系統(tǒng)信息化建設(shè)健康發(fā)展。
View details尊龍時(shí)凱一站式智能監(jiān)控+網(wǎng)管平臺(tái),對(duì)運(yùn)維管理流程體系進(jìn)行重構(gòu),提升信息系統(tǒng)監(jiān)控能力、網(wǎng)絡(luò)管理能力以及運(yùn)維人員工作效率。
View details