作為一個(gè)管理員,如果缺乏更大的視野,很容易陷入到千篇一律的解決問題的工作中。然而,數(shù)據(jù)中心的問題會從運(yùn)行的方方面面產(chǎn)生,從操作故障到宏觀經(jīng)濟(jì)問題。與其等待不可避免的問題出現(xiàn),管理員應(yīng)該積極的收集數(shù)據(jù)、分析趨勢、做好應(yīng)對準(zhǔn)備。
本文介紹3個(gè)數(shù)據(jù)中心常見的問題,管理員通過IT監(jiān)控操作,能夠提前做好準(zhǔn)備處理這些問題。
操作問題
如果修復(fù)BUG的周期長達(dá)12個(gè)月甚至更長,這清楚的表明了現(xiàn)有系統(tǒng)(例如COBOL)以及造成如此長周期的操作流程應(yīng)該被替換掉了。數(shù)據(jù)中心管理員應(yīng)該考慮將這些已有系統(tǒng)替換,可以替換為一個(gè)SaaS服務(wù),也可以是用SQL和C重寫。如果替換系統(tǒng)時(shí),公司并沒有意愿更改商業(yè)流程,那你將付出巨大開銷,并且很大比例的軟件將會運(yùn)行得很低效。特定部門迅速增長的系統(tǒng)更改請求,即是一個(gè)警告,表明一些員工抗拒改變商業(yè)流程。
在操作層面上,管理員最重要的工作,就是收集趨勢數(shù)據(jù),了解數(shù)據(jù)中心正在發(fā)生什么。如果一項(xiàng)工作需要原先兩倍的時(shí)間才能執(zhí)行完,則必須弄清楚為什么會這樣。管理員需要隨時(shí)監(jiān)控存儲、網(wǎng)絡(luò)和服務(wù)器的運(yùn)行狀態(tài),通過這些監(jiān)控結(jié)果分析出系統(tǒng)瓶頸和錯(cuò)誤。一個(gè)好的IT監(jiān)控系統(tǒng)將需要花費(fèi)大量金錢和操作人員時(shí)間,但一個(gè)壞的靠暴力收集數(shù)據(jù)的系統(tǒng)會收集過多的數(shù)據(jù),造成信息過載,而非找到問題的根源。
更新存儲
似乎存儲更新的簡單解決方法就是當(dāng)存儲池滿了后,買更多的硬盤,但選擇正確類型的存儲器是至關(guān)重要的,例如SSD,SATA大容量驅(qū)動器,或網(wǎng)絡(luò)存儲器。你需要通過存儲監(jiān)控了解每一層級存儲的容量使用率和IOPS趨勢。因?yàn)槟壳白詈玫牟呗允菍⑤^少用到的數(shù)據(jù)從主存儲器層移出,因此判斷是否需要購買更多硬盤的方法即是根據(jù)自動計(jì)算的趨勢數(shù)據(jù)判斷哪些數(shù)據(jù)是較少被訪問的。如果你有許多存儲數(shù)據(jù)探針,趨勢分析將幫助你將存儲驅(qū)動器分配到最需要他們的地方去。
企業(yè)級存儲將變得更為復(fù)雜。它已經(jīng)從簡單的主/從硬盤驅(qū)動器(HHD)變?yōu)橐欢裇SD和大容量SATA HDD的組成。未來2年將出現(xiàn)非易失性內(nèi)存規(guī)格(NVDIMM)的存儲器,3D XPoint非易失性存儲器標(biāo)準(zhǔn)(NVMe)的SSD,高容量SATA SSD和越來越多的網(wǎng)絡(luò)和集群選擇,例如虛擬存儲區(qū)域網(wǎng)絡(luò)(SAN),超融合系統(tǒng)和遠(yuǎn)程直接內(nèi)存訪問鏈接。當(dāng)這些技術(shù)形成主流后,自動化的IT監(jiān)控將是唯一的優(yōu)化運(yùn)維的方式。
更先進(jìn)的網(wǎng)絡(luò)
網(wǎng)絡(luò)也會造成數(shù)據(jù)中心一系列的問題。采用模版和策略來控制虛擬局域網(wǎng)建立和關(guān)閉將變得更為普遍,并將會被用到業(yè)務(wù)部門用戶的云服務(wù)配置中去。
然而這些用戶并沒有義務(wù)做優(yōu)化網(wǎng)絡(luò)的工作,當(dāng)一個(gè)新的云服務(wù)部署完后,他們?nèi)匀豢赡軙^續(xù)使用傳統(tǒng)的較松散的終端。使用自動化工具找出網(wǎng)絡(luò)瓶頸對改善用戶使用體驗(yàn)將非常有用。 監(jiān)控一條鏈路潛在的和承載吞吐量的趨勢也是非常重要的。這可以揭示出哪些工作流量需要被重新分配,并且驗(yàn)證這些改變是否有效。
隨著云和集群編配技術(shù)的進(jìn)步,智能負(fù)載平衡方法將變得更為重要,它能夠?qū)⑿枰拇罅抠Y源的應(yīng)用實(shí)例分布到只有較輕網(wǎng)絡(luò)負(fù)載的環(huán)境中。 服務(wù)器還有一些額外的模塊需要被監(jiān)控,包括動態(tài)內(nèi)存(DRAM)和CPU占有率。很快將出現(xiàn)一些云配屬工具,能夠指出系統(tǒng)熱點(diǎn),并自動化的進(jìn)行負(fù)載平衡。
目前這還是一個(gè)正在發(fā)展的方向,公司還需要根據(jù)歷史數(shù)據(jù),以每個(gè)應(yīng)用為單位進(jìn)行平衡決策。 任何一個(gè)好的IT監(jiān)控軟件都具備當(dāng)某些值超過門限后報(bào)警的功能。找到并使用這些軟件,能夠幫助快速定位問題。一些工具能夠?qū)⒔K端上的一個(gè)慢速工作的報(bào)警轉(zhuǎn)變?yōu)橐粋€(gè)秒級更新的應(yīng)用進(jìn)程列表中的標(biāo)記,無需人工從實(shí)際系統(tǒng)進(jìn)程樹中去深入分析,例如eG Innovations Enterprice 6.1和PrinterLogic公司的Printer Installer.
總的來說,用好IT監(jiān)控軟件和趨勢分析工具,能夠使IT管理員能更好的響應(yīng)數(shù)據(jù)中心問題,并快速處理現(xiàn)實(shí)危機(jī)。
文章編輯:CobiNet(寧波)
本公司專注于電訊配件,銅纜綜合布線系列領(lǐng)域產(chǎn)品研發(fā)生產(chǎn)超五類,六類,七類屏蔽網(wǎng)線/屏蔽模塊及相關(guān)模塊配件, 我們是萬兆屏蔽模塊,10G屏蔽模塊,屏蔽線生產(chǎn)廠家。
歡迎來電咨詢0574 88168918,郵箱sales@cobinet.cn,網(wǎng)址m.czchengbang.com
?2016-2019寧波科博通信技術(shù)有限公司版權(quán)所有浙ICP備16026074號