時間:2010-06-02來源:本站
【賽迪網(wǎng)訊】去年11月中旬,NVIDIA就先行宣布了基于Fermi新架構(gòu)、面向高性能計算領(lǐng)域的Tesla 20系列計算處理器和計算系統(tǒng)。5月5日,終于有合作伙伴推出相關(guān)系統(tǒng)了,也實現(xiàn)了NVIDIA的發(fā)布進(jìn)程規(guī)劃。
上周,NVIDIA宣布,IBM已經(jīng)為其最新款高性能計算(HPC)服務(wù)器配備了Fermi新架構(gòu)的Tesla 20系列高性能計算處理器,這也是NVIDIA Tesla第一次出現(xiàn)在主流HPC系統(tǒng)中。
IBM的加入,讓GPU服務(wù)器再次成為熱點,然而國內(nèi)廠商對此的態(tài)度又是如何呢?就該問題,我們采訪到了寶德服務(wù)器高端產(chǎn)品經(jīng)理陳齊旺,下面就來了解下來自寶德的觀點吧。
請介紹一下您對NVIDIA Fermi系統(tǒng)的看法?
A:Fermi架構(gòu)的出現(xiàn),的確是圖形領(lǐng)域和計算領(lǐng)域的一個里程碑,特別是針對HPC應(yīng)用領(lǐng)域,有了巨大的飛躍,能夠在降低成本降低功耗的情況下,提升計算能力。
GPU與CPU搭配的服務(wù)器是否會成為今后的主流?貴公司是否考慮推出Fermi系統(tǒng)?
A:GPU(或其他加速卡)與CPU結(jié)合進(jìn)行數(shù)據(jù)處理和科學(xué)計算,將會成為今后科學(xué)計算領(lǐng)域的一個趨勢,類似于我們以前286/386時代的協(xié)處理器概念,我們非常看好這個方向的發(fā)展,今后許多硬件和軟件的設(shè)計,都可能圍繞這樣的結(jié)構(gòu)進(jìn)行。基于這個考慮,寶德公司向市場也推出了支持GPU/CPU混合架構(gòu)的服務(wù)器PR4710NG/PR1762GT。
這2款服務(wù)器都是支持最新的Intel Xeon 5500/5600處理器和DDR3內(nèi)存,并且支持NVIDIA的C1060和最新Fermi架構(gòu)的M2050/M2070。其中PR4710NG主要面向個人超算用戶,可以作為個人超算工作站使用;PR1762GT是1U機(jī)架式,主要面向大規(guī)模集群系統(tǒng)。
采用多GPU的服務(wù)器系統(tǒng)性能表現(xiàn)如何,功耗與兼容性方面是否還存在問題?
A:在一些針對GPU優(yōu)化的應(yīng)用程序上,采用GPU的服務(wù)器性能可以得到巨大的提升,比如分子動力學(xué)程序NAMD,4顆C1060 GPU的性能就可以和16顆CPU相當(dāng)。在另外一個程序AMBER,1顆C1060 GPU卡的性能,甚至可以相當(dāng)于8臺雙路Xeon的性能,如果改用新的Fermi架構(gòu)GPU,相信性能還能得到更大的提升。
在功耗上,雖然Fermi單卡功耗較高,但是配合其能夠提供的計算性能(單卡約515Gflops雙精度,1Tflops單精度性能),平均下來性能功耗比還是非常突出,與傳統(tǒng)的CPU處理器系統(tǒng)相比,有巨大的優(yōu)勢。
不過,GPU-CPU混合架構(gòu),還有一個巨大的挑戰(zhàn),就是程序的兼容性問題,之前大部分的應(yīng)用程序都是基于傳統(tǒng)的CPU架構(gòu)開發(fā),并未針對現(xiàn)代GPU架構(gòu)進(jìn)行優(yōu)化,要想在GPU-CPU混合架構(gòu)系統(tǒng)上運行和發(fā)揮性能,需要開發(fā)人員進(jìn)行重新開發(fā)和驗證,目前,移植到GPU上的應(yīng)用程序,從數(shù)量上看,還有不足;但是,這是一個趨勢,將慢慢改善。
GPU的優(yōu)勢在于多流處理器和超高的顯存位寬以及頻率,這些特點真的能夠明顯提升服務(wù)器性能嗎?
A:圖形處理的特點是并行度非常高,GPU的設(shè)計,也充分體現(xiàn)了這個特點,因此,不論是以前的C1060還是現(xiàn)在的Fermi架構(gòu)GPU,流處理器的數(shù)量和顯存帶寬都非常高,但是非圖形應(yīng)用程序要發(fā)揮出這些性能,需要許多努力:從GPU卡的驅(qū)動、CUDA并行架構(gòu)、編譯器、應(yīng)用程序等。
談?wù)勀鷮ξ磥鞧PU系統(tǒng)的展望。
A:毋庸置疑的,GPU-CPU混合架構(gòu)的系統(tǒng),將是未來計算機(jī)發(fā)展的一個方向。
責(zé)任編輯:云中子