由中國(guó)信息通信研究院主辦、中國(guó)通信標(biāo)準(zhǔn)化協(xié)會(huì)支持的"OSCAR開源產(chǎn)業(yè)大會(huì)"在國(guó)家會(huì)議中心舉行。
隨著云計(jì)算技術(shù)的日益發(fā)展,并開始進(jìn)入 深水區(qū) ,開源技術(shù)與云計(jì)算融合的程度進(jìn)一步加深,并開始成為產(chǎn)業(yè)發(fā)展的重要支撐。"OSCAR云計(jì)算開源產(chǎn)業(yè)大會(huì)"將邀請(qǐng)行業(yè)內(nèi)多位大咖與權(quán)重人物共同探討、交流云計(jì)算開源技術(shù)、研發(fā)、治理、產(chǎn)業(yè)化方面的經(jīng)驗(yàn),探索開源與云計(jì)算的創(chuàng)新發(fā)展新路徑。
聯(lián)通沃云云計(jì)算與研發(fā)部總監(jiān)劉中參加此次會(huì)議,并發(fā)表《基于開源技術(shù)構(gòu)建沃云自愈服務(wù)能力》的主題演講。
以下為演講實(shí)錄:
劉中:大家上午好!非常榮幸來(lái)到本次大會(huì),我來(lái)自聯(lián)通公司。我今天分享的題目是基于開源技術(shù)構(gòu)建沃云自愈服務(wù)能力。
在展開探討之前,有必要回顧一下聯(lián)通沃云的發(fā)展。在 聯(lián)通混改 國(guó)家政策驅(qū)動(dòng)下,沃云進(jìn)入新的發(fā)展時(shí)期,沃云是從2013年成立,發(fā)展到現(xiàn)在。在聯(lián)通混改的政策下,出現(xiàn)一些新的思路調(diào)整。右邊,在聯(lián)通做自建云,提供的公有云、私有云、混合云,這個(gè)階段我們提供出來(lái)的服務(wù)是以IaaS為主的,現(xiàn)在在我們合作的大背景下,我們要豐富我們的產(chǎn)品,不斷豐富我們的業(yè)務(wù),我們現(xiàn)在的發(fā)展思路是以云為核心,整合政企專線、應(yīng)用類相關(guān)產(chǎn)品。在這之上,我們豐富新增了云網(wǎng)絡(luò),其中有代表性的,包括網(wǎng)絡(luò)云化的云寬帶、云互聯(lián)、云專線、云祖網(wǎng),從我們沃云開發(fā)角度看,給我們促進(jìn)廣闊云的發(fā)展提供了原理支撐。很典型的,比如我們用DCI技術(shù),混合云兩端私有網(wǎng)絡(luò)互聯(lián)我們通過(guò)DCI實(shí)現(xiàn)。另外,聯(lián)通沃云的一個(gè)發(fā)展方向是部署行業(yè)云,更多行業(yè)應(yīng)用要運(yùn)營(yíng)在沃云云主機(jī)之上,現(xiàn)在我們?cè)陂_展醫(yī)療云和教育云,教育云里面我們主要推廣的是教育云桌面系統(tǒng)。
下面介紹一下沃云體系之下沃云產(chǎn)品全體系視圖,三方面來(lái)看,公有云、私有云、混合云。公有云已經(jīng)不是新聞了,與阿里、騰訊都有合作,這是我們聯(lián)通在思路上的轉(zhuǎn)變,現(xiàn)在沃云的公有云上可以開通阿里、騰訊的一些產(chǎn)品,主要包括計(jì)算類、網(wǎng)絡(luò)類、存儲(chǔ)類、安全類和PaaS類。中間是私有云,這也是我本人這幾年做的主要方向,我們聯(lián)通私有云客戶主要是政企客戶,比如大型省級(jí)電子政務(wù)云,比如遼寧政務(wù)云、河北政務(wù)云、青海政務(wù)云,大型企業(yè)的私有云,比如最高人民法院和鐵塔公司,沃云給這些客戶服務(wù)的時(shí)候積累了很多經(jīng)驗(yàn),表現(xiàn)出來(lái)的是私有云的應(yīng)用業(yè)務(wù)系統(tǒng)負(fù)載比較重,這些是我們沃云在建設(shè)公有云時(shí)未曾面臨的問(wèn)題。現(xiàn)在隨著時(shí)代的變化,比如說(shuō)我們?cè)谒接性评锩?,沃云也?huì)和其他云服務(wù)商合作。一個(gè)省級(jí)政務(wù)云往往現(xiàn)在是由幾家云服務(wù)商共同來(lái)做,由一個(gè)云服務(wù)商單獨(dú)承包省級(jí)政務(wù)云的時(shí)代過(guò)去了。私有云上,我們和阿里、騰訊、華三華為會(huì)有一些合作?;旌显?,我們引入多云管理平臺(tái),以聯(lián)通多云管理平臺(tái)為入口,實(shí)現(xiàn)混合云的方式。
聯(lián)通沃云2018年的方向主要是云網(wǎng)一體化,包括集團(tuán)級(jí)專線、省級(jí)專線和安全類。下面介紹沃云整體技術(shù)架構(gòu)。我們從底層來(lái)看,沃云定義操作系統(tǒng),基于openstack和KVM實(shí)現(xiàn)我們的底層能力,在這之上,沃云嘗試很多技術(shù)提供存儲(chǔ)能力,目前主要是超融合的方式,如果遇到條件比較苛刻,性能比較高的場(chǎng)景,會(huì)引入其他存儲(chǔ)后端。在網(wǎng)絡(luò)組件方面,開源openstack提供出來(lái)的原生方案有較多實(shí)驗(yàn)色彩,沃云在這方面做了優(yōu)化。在這些底層能力之上,我們封裝定義出沃云產(chǎn)品。云平臺(tái)是復(fù)雜度很高的系統(tǒng),它承載租戶業(yè)務(wù),和我們?cè)破脚_(tái)本身的組件,這些我們需要給它進(jìn)行一個(gè)呵護(hù)和監(jiān)控,這里面我們做了分布式的健康檢查。
下面是今年的主要思路,在云網(wǎng)一體背景下的沃云平臺(tái)。這里沃云的建設(shè)思路,主要是我們?cè)谌珖?guó)有7個(gè)大型沃云基地,在每個(gè)省份有一個(gè)局部的節(jié)點(diǎn),圍繞這些建設(shè)邊緣節(jié)點(diǎn)。這個(gè)我們建設(shè)的是合作背景下沃云公有云合作平臺(tái)能力,有一個(gè)集中云管理平臺(tái),包括自服務(wù)系統(tǒng),運(yùn)維系統(tǒng),運(yùn)維監(jiān)控系統(tǒng),云接入及調(diào)度樞紐,可以把我們的業(yè)務(wù)分散到全國(guó)不同的節(jié)點(diǎn)上,這樣的話我們就實(shí)現(xiàn)了在32個(gè)省份布局的資源池,統(tǒng)一的運(yùn)營(yíng),統(tǒng)一的調(diào)度管理,通過(guò)同步復(fù)制技術(shù)實(shí)現(xiàn)資源池間的互通互備。
這個(gè)是我題目里面比較核心的部分,我們?cè)诮ㄔO(shè)一個(gè)復(fù)雜的平臺(tái)的時(shí)候,里面各組件服務(wù)的自愈實(shí)現(xiàn),在春節(jié)的時(shí)候,Google云曾經(jīng)發(fā)生過(guò)客戶拓機(jī),從故障分析來(lái)看,里面有個(gè)網(wǎng)絡(luò)組件卡死,Google本身的自愈系統(tǒng)沒(méi)有能力處理它,還是由人工完成kill進(jìn)程重啟服務(wù)。這個(gè)給我們的啟示比較大,一個(gè)是我們?cè)诖笮偷南到y(tǒng)里面,自愈組件的必要性和它的使用范疇。所以我們經(jīng)過(guò)考量和實(shí)際使用之后,我們對(duì)云平臺(tái)公共組件著重進(jìn)行了自愈方面的加強(qiáng),和openstack里面比較重要的組件。自愈和監(jiān)控是密不可分的,我們對(duì)資源池里面的資源和云平臺(tái)本身的組件進(jìn)行了監(jiān)控。
下面是我們?cè)趺刺岣呶衷瀑Y源池的能力,這是我們部署的大概架構(gòu),我們首選部署架構(gòu)是超融合的,一個(gè)故障域的節(jié)點(diǎn)數(shù)量不會(huì)像分離架構(gòu)那么多,我們按照存儲(chǔ)池的故障域劃分沃云故障域,我們有3-4個(gè)cell,cell下面再分故障域,每cell劃分3個(gè)AZ,適合一般的私有云、公有云部署需求。下面一個(gè)是更深入一些的內(nèi)容,開源openstack實(shí)踐的優(yōu)化,這個(gè)是我們neutron-dhcp-agent高可用,為每一個(gè)network設(shè)置兩個(gè)dhcp-agent,兩個(gè)dhcp-agent位于不同節(jié)點(diǎn)。另外一個(gè)優(yōu)化,原生的openstack一般是三類節(jié)點(diǎn)部署,獨(dú)立的網(wǎng)絡(luò)節(jié)點(diǎn)實(shí)現(xiàn)L3網(wǎng)絡(luò)功能,南北流量集中,易造成性能瓶頸。我們給它做了優(yōu)化,我的沃云部署沒(méi)有網(wǎng)絡(luò)節(jié)點(diǎn),我是把網(wǎng)絡(luò)節(jié)點(diǎn)dhcp服務(wù)和其他自定義都放到計(jì)算節(jié)點(diǎn)上,左邊服務(wù)我把它都分配到中間的計(jì)算節(jié)點(diǎn)上。這個(gè)是我們對(duì)L3 agent的改造,我們采用VRRP協(xié)議,我們?cè)趦蓚€(gè)節(jié)點(diǎn)上產(chǎn)生實(shí)例,共同提供虛擬路由器服務(wù)。
這個(gè)是沃云在存儲(chǔ)高可用的實(shí)踐,實(shí)現(xiàn)cinder-volume是開源社區(qū)里比較困難的一個(gè)點(diǎn),但去年也有方式來(lái)做,用分布式鎖來(lái)實(shí)現(xiàn),沃云的辦法更直接一些,我們是在每一個(gè)AZ部署多個(gè)volume,定期做檢測(cè)。如果我發(fā)現(xiàn)有一個(gè)故障volume的話,我們會(huì)把它遷移到系統(tǒng)存儲(chǔ)后端上來(lái)進(jìn)行管理??偨Y(jié)一下我們開源實(shí)現(xiàn)的高可靠系統(tǒng)架構(gòu)的加強(qiáng),首先是增加冗余的硬件或軟件,采用災(zāi)難恢復(fù)的手段。另外,通常情況下,我們優(yōu)先選擇原生內(nèi)在的技術(shù),我們不會(huì)為了高可用引用其他外部的軟件,基本上采用openstack內(nèi)部的東西來(lái)實(shí)現(xiàn)。高可用具體有管理節(jié)點(diǎn)的高可用,前面提到的dhcp/L3高可用,volume高可用,沃云管理節(jié)點(diǎn)的高可用。我們所有openstack無(wú)狀態(tài)都可以高可用,進(jìn)行負(fù)載均衡,管理無(wú)狀態(tài)服務(wù)的VIP. warm算是聯(lián)通沃云對(duì)openstack的一個(gè)貢獻(xiàn),warm本身不在openstack里面的,但這個(gè)是沃云原創(chuàng)的warm,初衷是它關(guān)注的是我如何管理虛擬機(jī)承載的應(yīng)用,虛擬機(jī)承載的應(yīng)用如何合理暴露出來(lái),應(yīng)用如何介入到租戶網(wǎng)絡(luò)里面。我們基于warm服務(wù)集成組件,我們開發(fā)出了云緩存、云備份服務(wù)。這是warm基本架構(gòu),通過(guò)消息隊(duì)列,訪問(wèn)真正做事情的agent服務(wù),就是下面那一排服務(wù),這個(gè)對(duì)應(yīng)我們不同的服務(wù)類型。
很多業(yè)界搞openstack的朋友,都說(shuō)聯(lián)通沃云openstack什么時(shí)候升級(jí),這個(gè)問(wèn)題我是這么看的。我們的態(tài)度是,openstack只是一個(gè)服務(wù)于沃云的框架,我們對(duì)它的定制是深度的,沃云現(xiàn)在所做的定制,可能我們?cè)诮?jīng)歷到下一輪K版本的時(shí)候都沒(méi)有。我的態(tài)度是這樣的。
最后我想引用偉大詩(shī)人泰戈?duì)枴讹w鳥集》中的詩(shī)篇結(jié)束我的分享。 云謙遜地站在天之一隅,晨光給它戴上彩霞。云把河之水杯注滿,自己卻隱逸在遠(yuǎn)處的山中 。
文章編輯:CobiNet(寧波)
本公司專注于電訊配件,銅纜綜合布線系列領(lǐng)域產(chǎn)品研發(fā)生產(chǎn)超五類,六類,七類線,屏蔽模塊,配線架及相關(guān)模塊配件的研發(fā)和生產(chǎn)。
?2016-2019寧波科博通信技術(shù)有限公司版權(quán)所有浙ICP備16026074號(hào)