根據(jù)The Platform網(wǎng)站最近發(fā)布的一篇文章,我們可以看到在高性能計算領(lǐng)域,整體設(shè)施的構(gòu)建、采購以及機(jī)房共置等任務(wù)確實(shí)難于完成。為了能夠更透徹地理解這兩種觀點(diǎn)的思維方式,我們采用了Rescale方面提供的一些數(shù)字——這是一家高性能計算云服務(wù)供應(yīng)商(如前所述,主要負(fù)責(zé)將軟件與高性能計算獨(dú)立軟件開發(fā)商相對接方面的工作)。
下面提到的各項(xiàng)數(shù)字來自Rescale公司對于內(nèi)部高性能計算集群與租賃云供應(yīng)商容量及許可所進(jìn)行的一次成本比較。這些數(shù)字體現(xiàn)了一臺典型的中端集群在處理高性能計算工作負(fù)載時所帶來的使用成本——注意,這里并沒有考慮任何高端處理器或者加速方案。在一篇探討高性能計算云服務(wù)使用成本的文章中,Rescale公司CEO Joris Poort解釋稱,這主要是為了體現(xiàn)最終用戶的中位成本水平——一部分需要高到極致的性能表現(xiàn),另一些則更關(guān)注成本因素,因此這些數(shù)字僅作為基準(zhǔn)參考。當(dāng)然,一旦新型Haswell處理器或者InfiniBand等其它高成本要素被加入進(jìn)來,基礎(chǔ)成本無疑將顯著提高——特別是在采購集群設(shè)備的頭一年時間當(dāng)中。
在以上配置條件下,用戶在物理數(shù)據(jù)中心內(nèi)運(yùn)維一臺典型的100節(jié)點(diǎn)集群,則每月需要承擔(dān)近7萬美元固定成本,其中約1萬6千美元被用在了能源消耗及冷卻方面開支當(dāng)中。Poort提供的統(tǒng)計數(shù)字當(dāng)中還包含一位負(fù)責(zé)管理該集群的全職工程師的薪酬。他同時強(qiáng)調(diào)稱,對于大多數(shù)用戶、甚至是已經(jīng)開始向云端過渡的用戶而言,這一職位都仍然切實(shí)存在,因?yàn)槠髽I(yè)內(nèi)部往往繼續(xù)運(yùn)行著大量工作負(fù)載。
接下來我們可以看到Poort所提供的典型集群的具體成本構(gòu)成:
這僅僅是集群運(yùn)維方面的支出,Poort表示實(shí)際情況還應(yīng)當(dāng)考慮到集群的整體擁有成本,包括技術(shù)支持團(tuán)隊以及其它服務(wù)項(xiàng)目所帶來的超出表格范疇之外的支出,其每月整體成本約為11萬美元。有趣的是,硬件相關(guān)成本僅為4萬美元左右,但其它運(yùn)維(包括供電、人員以及其它相關(guān)費(fèi)用)卻高達(dá)7萬美元之巨。
這個數(shù)字聽起來確實(shí)不低,尤其是考慮到企業(yè)往往會把為高性能計算資源準(zhǔn)備的預(yù)算按部門加以進(jìn)一步劃分。舉例來說,在某些企業(yè)當(dāng)中,帶寬方面的成本預(yù)算被納入到整體帶寬使用量監(jiān)控機(jī)制當(dāng)中。電力消耗也是如此,這部分支出往往并不會被直接劃撥給高性能計算集群,因?yàn)閿?shù)據(jù)中心內(nèi)部還包含有其它設(shè)備所帶來的能源成本。雖然這些資金都會由企業(yè)負(fù)責(zé)提供,但Poort表示直接列出數(shù)字的方式更加容易理解——此處的統(tǒng)計結(jié)果屬于將各項(xiàng)開銷直接累加得到的總和,其中可能也包括一部分被算在高性能計算部門頭上的、實(shí)際由其它部門使用的支出項(xiàng)目。
考慮到這一點(diǎn),將整體成本準(zhǔn)確拆分為每小時運(yùn)營開支確實(shí)有些難度,特別是考慮到多數(shù)情況下我們往往只能基于不同硬件單獨(dú)進(jìn)行計算。換言之,計算結(jié)果中往往缺失了前面所列舉的整體運(yùn)營與數(shù)據(jù)中心日常成本。在這里我們姑且將滿載運(yùn)轉(zhuǎn)情況下的每計算核心使用成本按照每小時10美分計算,當(dāng)然不同企業(yè)由于情況有別、計算結(jié)果則可能出現(xiàn)明顯差異?!叭绻蠹抑患尤腚娏ο馁M(fèi)用而沒有包含整體數(shù)據(jù)中心成本,那么每計算核心每小時的使用成本可能只需要5美分。這從表面上看似乎沒什么差別,但這樣的成本水平已經(jīng)比我們的計算方式高出25%——再加上其它設(shè)施支出與元素所帶來的負(fù)擔(dān),最終差異將極為明顯,”Poort解釋道。這種節(jié)約效果可能稱不上立竿見影,但卻絕對是兩種方案之間的重要差別,而且隨著時間的推移、這種差別將愈發(fā)顯著。
美中不足的是,每計算核心每小時10美分的使用成本只適用于滿負(fù)載運(yùn)轉(zhuǎn)這一假定前提之下,具體如下表所示?!霸谠u估此類成本時經(jīng)常出現(xiàn)的另一大誤區(qū)在于,當(dāng)人們審視自己在云環(huán)境下使用服務(wù)器的開銷時,往往會單純從表面理解、認(rèn)為其成本比親自購買服務(wù)器并接入基礎(chǔ)設(shè)施更高。有鑒于此,我們需要強(qiáng)調(diào)一點(diǎn),也就是資源利用率方面的差別——在云環(huán)境下,我們可以隨時開啟并關(guān)閉自己租賃的設(shè)備。而在非使用時段中,它們完全不會帶來任何成本,”Poort指出。