現(xiàn)如今,圍繞著業(yè)界的容量和性能方面相關(guān)的錯(cuò)誤策略的例子可以說(shuō)不勝枚舉。
例如,當(dāng)Lady Gaga以僅99美分的售價(jià)在亞馬遜上架其專輯《Born This Way》后,瘋狂的粉絲們很快就使得亞馬遜龐大服務(wù)器資源被攻陷。同樣,當(dāng)在線商城Target.com宣布進(jìn)行一場(chǎng)龐大的銷售活動(dòng)后,大量紛至沓來(lái)的網(wǎng)絡(luò)購(gòu)物者的瘋狂涌入導(dǎo)致了其數(shù)據(jù)中心的崩潰。當(dāng)然,還有最為著名的醫(yī)療保健網(wǎng)站HealthCare.gov發(fā)生崩潰的例子,一則廣告活動(dòng)促使數(shù)百萬(wàn)的美國(guó)用戶涌向該醫(yī)療保健網(wǎng)站的醫(yī)保項(xiàng)目,卻最終只能面對(duì)長(zhǎng)時(shí)間的虛擬線路和無(wú)盡的錯(cuò)誤信息。據(jù)估計(jì),正是由于可用容量被大大超出,使得任何時(shí)候都有4萬(wàn)多人被迫坐在虛擬候診室里等待。
上述這些例子都強(qiáng)調(diào)了在企業(yè)業(yè)務(wù)需求擴(kuò)張之前,數(shù)據(jù)中心管理人員務(wù)必要確保對(duì)數(shù)據(jù)中心戰(zhàn)略保持提前規(guī)劃的重要性,同時(shí)還需要注意可能導(dǎo)致超出現(xiàn)有系統(tǒng)負(fù)載能力的突發(fā)高峰需求。而實(shí)現(xiàn)這一目標(biāo)的途徑便是通過(guò)數(shù)據(jù)中心的容量規(guī)劃。
當(dāng)企業(yè)組織忽略了他們數(shù)據(jù)中心的操作運(yùn)營(yíng)環(huán)境中正在發(fā)生或者可能發(fā)生的事情時(shí),便有可能出現(xiàn)性能問(wèn)題和容量不足的情況,這可能會(huì)導(dǎo)致企業(yè)營(yíng)收受損,生產(chǎn)力下降以及客戶體驗(yàn)下降。 容量管理供應(yīng)商TeamQuest公司的前產(chǎn)品營(yíng)銷經(jīng)理John Miecielica表示說(shuō),他現(xiàn)在是Stratagem, Inc.公司的顧問(wèn)。
數(shù)據(jù)中心的管理人員們需要確保業(yè)務(wù)能力,服務(wù)能力,組件和資源能力均能夠以經(jīng)濟(jì)高效的方式滿足企業(yè)當(dāng)前和未來(lái)的業(yè)務(wù)需求。這與管理和優(yōu)化基礎(chǔ)架構(gòu)、應(yīng)用程序和業(yè)務(wù)服務(wù)的性能息息相關(guān)。
老話說(shuō): 如果沒(méi)有壞,就不用修理 。在許多不同的情況下,這可能是一個(gè)可行的原則。然而,就數(shù)據(jù)中心的容量策略而言,如上文中所給出的一系列例子所示,這可能是一大致命性的理念。
Miecielica介紹說(shuō),歐洲的一處數(shù)據(jù)中心在實(shí)施了容量規(guī)劃后,該數(shù)據(jù)中心從只能執(zhí)行一些簡(jiǎn)單的修復(fù)工作轉(zhuǎn)型為能夠基于精確容量預(yù)測(cè)實(shí)現(xiàn)恰當(dāng)?shù)囊?guī)?;奶摂M環(huán)境。進(jìn)而使得該企業(yè)組織避免了每月總共65000美元的基礎(chǔ)設(shè)施費(fèi)用成本。此外,其所具備的找出瓶頸的功能還幫助該企業(yè)消除了數(shù)百臺(tái)性能表現(xiàn)不佳的虛擬機(jī)(VM)。
有用戶講述了一個(gè)類似的案例:Enterprise Rent-A-Car公司 、Alamo Car Rent A Car公司、National Car Rental和Enterprise CarShare的母公司Enterprise Holdings,Inc.(EHI)是全球范圍內(nèi)最大的汽車租賃服務(wù)供應(yīng)商。在過(guò)去,該公司數(shù)據(jù)中心的容量預(yù)測(cè)和建模是通過(guò)人工手動(dòng)所收集的數(shù)據(jù)完成的,這些數(shù)據(jù)被輸入到微軟Office Excel表格和Office Access數(shù)據(jù)庫(kù)軟件中。這項(xiàng)工作屬于資源密集型且容易出錯(cuò),也往往是不準(zhǔn)確的。而在當(dāng)前這樣一個(gè)競(jìng)爭(zhēng)激烈的市場(chǎng)上,這顯然是EHI公司所不能承受的。緩慢的系統(tǒng)可能意味著數(shù)百分輛的汽車租賃信息在幾分鐘之內(nèi)就會(huì)丟失,以及在將車輛送到最需要的地方時(shí)出現(xiàn)延遲,從而導(dǎo)致客戶滿意度評(píng)分較低。
EHI公司的前IT系統(tǒng)架構(gòu)師Clyde Sconce表示說(shuō): 我們?cè)?jīng)在數(shù)據(jù)收集、預(yù)測(cè)增長(zhǎng)以及季度和年度的預(yù)測(cè)等方面耗費(fèi)了大量資源和無(wú)數(shù)的時(shí)間。
他所曾經(jīng)供職過(guò)的這家公司在數(shù)據(jù)中心戰(zhàn)略方面犯了一個(gè)共同的錯(cuò)誤 過(guò)于簡(jiǎn)化需求。這方面的一個(gè)例子是通過(guò)考慮CPU當(dāng)前的使用情況來(lái)創(chuàng)建預(yù)測(cè),然后使用線性趨勢(shì)來(lái)預(yù)測(cè)所有未來(lái)的需求。
如果你企業(yè)這樣做,你就會(huì)大錯(cuò)特錯(cuò)的。 Sconce說(shuō)。
EHI公司部署實(shí)施了TeamQuest 公司的Surveyor以簡(jiǎn)化預(yù)測(cè),實(shí)現(xiàn)了流程自動(dòng)化,并提高了準(zhǔn)確性。這使得預(yù)測(cè)和報(bào)告能夠在必要時(shí)每周和每天更新。進(jìn)而使得其數(shù)據(jù)中心能夠擺脫被動(dòng)模式,隨時(shí)了解變化,并采取相應(yīng)的措施以確保其系統(tǒng)從未遭受到Lady Gaga粉絲攻陷數(shù)據(jù)中心服務(wù)器般的事件。
容量預(yù)測(cè)輸入是從Surveyor獲得的,并結(jié)合從Java工具集合所收集的各種業(yè)務(wù)度量和數(shù)據(jù)。然后將其轉(zhuǎn)化為對(duì)CPU和業(yè)務(wù)增長(zhǎng)的預(yù)測(cè),每臺(tái)服務(wù)器美元成本的預(yù)測(cè),與不同業(yè)務(wù)和管理人員相關(guān)的預(yù)測(cè),甚至形成了檢查早期預(yù)測(cè)準(zhǔn)確性的方法。
這里的重點(diǎn)不是試圖根據(jù)一個(gè)或兩個(gè)指標(biāo)來(lái)預(yù)測(cè)未來(lái)。相反,EHI公司從各種數(shù)據(jù)來(lái)源提取了廣泛的參數(shù),包括服務(wù)器配置(包括當(dāng)前和歷史配置信息),資源消耗情況(CPU,內(nèi)存,存儲(chǔ))和業(yè)務(wù)交易(通過(guò)用戶代理)等數(shù)據(jù)庫(kù)信息。針對(duì)其UNIX AIX環(huán)境,諸如rPerf(相對(duì)性能)等指標(biāo)幫助其數(shù)據(jù)中心了解是否需要添加或刪除CPU來(lái)提高性能。
Sconce提醒數(shù)據(jù)中心經(jīng)理們?cè)谘芯繑?shù)據(jù)中心策略時(shí)務(wù)必需要注意可能導(dǎo)致預(yù)測(cè)錯(cuò)誤的異常情況。以新服務(wù)器的歷史數(shù)據(jù)不完整或不存在的情況為例。這可能導(dǎo)致一種異常情況,比如一臺(tái)相當(dāng)新的服務(wù)器被預(yù)測(cè)為或?qū)⒂?00%的需求增長(zhǎng)。
Sconce說(shuō): 我們仔細(xì)分析,并覆蓋了該預(yù)測(cè)中的數(shù)據(jù),并將其修正為服務(wù)器類似應(yīng)用的已知增長(zhǎng)率。壞的數(shù)據(jù)也需要被刪除,而且你企業(yè)必須留意基線跳躍,比如在業(yè)務(wù)增長(zhǎng)率不變的情況下所發(fā)生的資源消耗的變化。
后者的一個(gè)例子可能是將兩臺(tái)服務(wù)器整合為一臺(tái)。在這種情況下,工作負(fù)載增加了一倍,但業(yè)務(wù)增長(zhǎng)率并沒(méi)有變化。但Sconce表示說(shuō),最重要的一點(diǎn)是要確保數(shù)據(jù)預(yù)測(cè)與當(dāng)前以及歷史業(yè)務(wù)交易保持一致,因?yàn)檫@最終代表了整個(gè)過(guò)程:企業(yè)如何推動(dòng)數(shù)據(jù)中心的資源消耗;以及業(yè)務(wù)或市場(chǎng)需求的轉(zhuǎn)型將如何徹底改變企業(yè)內(nèi)部的資源需求。
EHI公司最為重要的統(tǒng)計(jì)數(shù)據(jù)是每小時(shí)租用的汽車數(shù)量。因此,Sconce總是將其轉(zhuǎn)化為與汽車每小時(shí)統(tǒng)計(jì)數(shù)據(jù)的關(guān)系,而不是為管理人員們提供難以理解的技術(shù)指標(biāo)。他說(shuō),要實(shí)現(xiàn)這一目標(biāo),需要與業(yè)務(wù)負(fù)責(zé)人密切聯(lián)系,以準(zhǔn)確地將業(yè)務(wù)交易與數(shù)據(jù)中心內(nèi)消耗的資源相關(guān)聯(lián),然后對(duì)企業(yè)的成本進(jìn)行現(xiàn)實(shí)估計(jì)。
Sconce說(shuō): 把所有的數(shù)據(jù)和輸入的信息都混雜在一起是不太合適的。一個(gè)準(zhǔn)確的預(yù)測(cè)必須使用一套復(fù)雜的分析工具,該工具可以執(zhí)行周期性趨勢(shì)分析、異常消除、基線變化、硬件變化、成本相關(guān)性和靈活的報(bào)告分組。
EHI公司最為依賴的是服務(wù)器級(jí)別的高峰時(shí)期需求的平均值。該公司還發(fā)現(xiàn),生成異常報(bào)告,以標(biāo)記數(shù)據(jù)缺失或發(fā)生異常情況需要對(duì)其進(jìn)行調(diào)查的服務(wù)器是非常有用的。
來(lái)自Sconce的最后一個(gè)提示是:基于周期性增長(zhǎng)和線性預(yù)測(cè)對(duì)數(shù)據(jù)中心的容量進(jìn)行預(yù)測(cè)是非常有益的。EHI公司會(huì)計(jì)算年度增長(zhǎng)情況,但他們會(huì)基于每月的使用情況對(duì)該預(yù)測(cè)采用周期性的模式。這種數(shù)據(jù)中心策略的方法可以解決由于季節(jié)性需求高峰或促銷火爆而導(dǎo)致的潛在需求大漲。例如,一個(gè)線性投影可能會(huì)顯示應(yīng)該在六月份進(jìn)行采購(gòu),但是周期性數(shù)據(jù)則會(huì)突出顯示可能出現(xiàn)業(yè)務(wù)使用量激增的具體時(shí)間段。這允許EHI公司得以推遲資本支出,或者根據(jù)實(shí)際業(yè)務(wù)需求加快采購(gòu)速度,而不是僅僅把預(yù)測(cè)的使用量作為有序進(jìn)展。
通過(guò)這種方式實(shí)施容量規(guī)劃,我們大大減少了我們的資源待命時(shí)間。進(jìn)而使得我們能夠?qū)崿F(xiàn)預(yù)測(cè)過(guò)程的自動(dòng)化,并制定每日/每周的報(bào)告。 Sconce說(shuō)。 TeamQuest Surveyor使我們能夠制定標(biāo)準(zhǔn)化的預(yù)測(cè)策略,并進(jìn)行歷史預(yù)測(cè)跟蹤,以確定需要改進(jìn)的領(lǐng)域。
數(shù)據(jù)中心的復(fù)雜性
雖然容量規(guī)劃一直都很重要,但在虛擬化,,BYOD,移動(dòng)性和的時(shí)代,容量的重要性進(jìn)一步獲得了提升。為了解決這個(gè)問(wèn)題,Gartner公司的分析師Will Cappelli說(shuō),容量規(guī)劃需要借助預(yù)測(cè)分析技術(shù)的支持。
他說(shuō): 基礎(chǔ)設(shè)施將更加模塊化,分布式和動(dòng)態(tài)化。想要使用傳統(tǒng)的容量規(guī)劃方案來(lái)有效地確保在正確的時(shí)間提供合適的資源幾乎是不可能的。
這需要能夠處理大量的數(shù)據(jù)點(diǎn)、輸入和指標(biāo)以分析它們,量化各種事件的發(fā)生概率,并預(yù)測(cè)將來(lái)發(fā)生某些事件的可能性。因此,建議數(shù)據(jù)中心管理人員使用容量規(guī)劃工具,使他們能夠以可能運(yùn)行各種 假設(shè) 情況的方式進(jìn)行分析。這使他們能夠確定他們的確切要求,從而降低成本和風(fēng)險(xiǎn)。
Miecielica對(duì)此表示同意。他說(shuō),企業(yè)當(dāng)前所面臨的挑戰(zhàn)是要了解如何對(duì)數(shù)據(jù)中心和企業(yè)中的所有數(shù)據(jù)進(jìn)行分割和切分。通過(guò)將所有這些數(shù)據(jù)劃分為可執(zhí)行的信息,容量規(guī)劃人員可以以儀表盤的形式分享這些數(shù)據(jù),并使得業(yè)務(wù)人員們可以理解,進(jìn)而將其作為制定業(yè)務(wù)決策的指標(biāo)。
解決未來(lái)數(shù)據(jù)中心容量能力需求問(wèn)題的必要性是迫切的。 OpsDataStore公司的首席執(zhí)行官Bernd Harzog表示,通過(guò)其與眾多企業(yè)用戶的對(duì)話,該公司確認(rèn)了典型的數(shù)據(jù)中心服務(wù)器的容量運(yùn)營(yíng)能力在12%到18%之間。這一數(shù)據(jù)是在一份名為《數(shù)據(jù)中心效率評(píng)估》的報(bào)告中,由一家名為Anthesis Consulting Group的公司針對(duì)廣泛的數(shù)據(jù)中心從業(yè)人員的調(diào)查得出的。
Harzog說(shuō): 增加容量的標(biāo)準(zhǔn)方法是使用資源利用率閾值作為觸發(fā)器來(lái)采購(gòu)更多的硬件,但是這會(huì)導(dǎo)致硬件采購(gòu)過(guò)多,因?yàn)樵摲椒ú⑽纯紤]在基礎(chǔ)設(shè)施上運(yùn)行的工作負(fù)載(應(yīng)用程序)的需求。故而訣竅在于是否能夠提高利用率,而不會(huì)冒應(yīng)用程序響應(yīng)時(shí)間和吞吐量問(wèn)題的風(fēng)險(xiǎn)。
最小化現(xiàn)代數(shù)據(jù)中心固有的復(fù)雜性的一種可能的方式是通過(guò)創(chuàng)建儀表板。例如,一家大型電信公司的數(shù)據(jù)中心經(jīng)理最近實(shí)施了容量管理,其目標(biāo)是降低成本,避免風(fēng)險(xiǎn)和提高效率。
BMC公司的云管理、性能和可用性以及數(shù)據(jù)中心自動(dòng)化總裁Bill Berutti表示說(shuō): 項(xiàng)目負(fù)責(zé)人首先需要專注于儀表板,項(xiàng)目的可見性以一種戲劇性的方式發(fā)生了巨大的變化,導(dǎo)致企業(yè)對(duì)于容量管理項(xiàng)目團(tuán)隊(duì)的需求大漲。
此前,在這家電信公司的數(shù)據(jù)中心內(nèi),各種存儲(chǔ),服務(wù)器和運(yùn)營(yíng)經(jīng)理們會(huì)定期舉行會(huì)議,決定在數(shù)據(jù)中心的那些領(lǐng)域需要花費(fèi)預(yù)算資金。而該公司的第一個(gè)儀表板就為其存儲(chǔ)團(tuán)隊(duì)提供了實(shí)際使用量的數(shù)據(jù),進(jìn)而導(dǎo)致約40TB的存儲(chǔ)需求從其采購(gòu)合同中刪除。
硬件超載
隨著當(dāng)前的企業(yè)組織紛紛都在努力的削減數(shù)據(jù)中心的成本,他們需要削減的第一個(gè)領(lǐng)域可能便是規(guī)劃和管理工具,如容量規(guī)劃。然而,費(fèi)用預(yù)算中的紅線可能會(huì)導(dǎo)致企業(yè)在硬件、軟件或網(wǎng)絡(luò)方面數(shù)百萬(wàn)的超支。
Gartner公司的分析師Ian Head表示: 大多數(shù)企業(yè)在容量管理方面的投入都不足,其既充當(dāng)了流程管理,同時(shí)也是支持流程所需的工具。
文章編輯:CobiNet(寧波)
本公司專注于電訊配件,銅纜綜合布線系列領(lǐng)域產(chǎn)品研發(fā)生產(chǎn)超五類,六類,七類線,屏蔽模塊,配線架及相關(guān)模塊配件的研發(fā)和生產(chǎn)。
?2016-2019寧波科博通信技術(shù)有限公司版權(quán)所有浙ICP備16026074號(hào)