以客戶為中心,提供定制化或一站式的全棧解決方案,賦能千行百業(yè)
石油行業(yè)應(yīng)該是應(yīng)用HPC高性能計算最為廣泛的領(lǐng)域之一,因為石油勘探工作需要進(jìn)行海量數(shù)據(jù)的密集計算和模擬,計算結(jié)果出來后還要轉(zhuǎn)換成直觀的可視畫面,這些工作必須借助高性能計算機(jī)才能實現(xiàn)最佳的勘探效益,在石油勘探項目中需要通過地球物理方法去獲取數(shù)據(jù),它包括了電法,磁法,重力法,放射性法以及地震波法,地震波法是石油勘探中最常用的基本方法,因為地震波能穿透厚達(dá)幾千米的巖層.提供石油可能埋藏的信息和數(shù)據(jù),再利用HPC并行計算的強(qiáng)大數(shù)據(jù)處理能力,精確計算、分析這些獲取到的信息和數(shù)據(jù),為油氣鉆井定位提供參考。
為了實現(xiàn)更強(qiáng)的計算和分析海量數(shù)據(jù)的能力,在通訊網(wǎng)絡(luò)架構(gòu),并行計算架構(gòu),管理結(jié)構(gòu)以及存儲架構(gòu)的設(shè)計提出了高的要求:
1)、滿足由于快速計算所帶來的臨時計算數(shù)據(jù)處理速度對持續(xù)帶寬要求
2)、計算體系結(jié)構(gòu)和計算能力的變化,傳統(tǒng)基于主機(jī)的計算部署架構(gòu)存在不足
3)、綜合考慮石油行業(yè)高性能計算應(yīng)用的特點,以及石油企業(yè)對于勘探業(yè)務(wù)計算任務(wù)執(zhí)行效率和成本的管控要求
4)、大規(guī)模系統(tǒng)在計算節(jié)點、網(wǎng)絡(luò)、存儲和軟件上的高可用性要求
5)、對大規(guī)模系統(tǒng)設(shè)備的集中維護(hù),簡易、方便、可靠性管理的要求
根據(jù)項目的實際處理業(yè)務(wù)的需求,本方案采用PowerScale9000一體機(jī)與登陸節(jié)點和管理節(jié)點以及高速通訊網(wǎng)絡(luò)集中部署方案,其各服務(wù)計算節(jié)點間做集群處理實現(xiàn)計算業(yè)務(wù)的均衡負(fù)載,平滑遷移;并采用鏈路冗余機(jī)制保證通訊的數(shù)據(jù)傳輸?shù)姆€(wěn)定性和安全性;整體滿足項目的需求。
本方案中選用寶德高性能定制化Powerscale 9000超級計算機(jī)(HPC)系統(tǒng),作為石油勘探領(lǐng)域的數(shù)據(jù)處理中心,發(fā)揮著舉足輕重的作用
高密度:采用超高密度的設(shè)計,最大可支持80節(jié)點,節(jié)約空間
易擴(kuò)展:采用平臺化設(shè)計思想,全模塊化設(shè)計
低功耗:采用集中式供電、共享散熱設(shè)計
易管理:采用一體化快速交付設(shè)計
易維護(hù):采用集中式管理設(shè)計,簡化運維管理工作,提高運維效率
集群部署:基于并行計算體系架構(gòu),將所有的結(jié)算節(jié)點和管理節(jié)點通過高速通訊網(wǎng)絡(luò)連接起來,并部署集群軟件實現(xiàn)任務(wù)的負(fù)載均衡,各計算節(jié)點處理任務(wù)不均衡時自動平等分配任務(wù)達(dá)到均等計算的效果,實現(xiàn)并行的快速、高效計算。部署集中存儲方式,各節(jié)點映射同一存儲,實現(xiàn)數(shù)據(jù)的共享,方便靈活調(diào)用、存寫數(shù)據(jù)信息,部署集中管理節(jié)點,集中管理、監(jiān)控各計算節(jié)點的狀態(tài)、運行情況
網(wǎng)絡(luò)部署:采用40GB和80GB INFINIBAND交換機(jī),實現(xiàn)個計算節(jié)點、管理節(jié)點、存儲節(jié)點和登陸節(jié)點互聯(lián),達(dá)到高帶寬,高速、低延時的數(shù)據(jù)通訊,解決IO通訊的瓶頸。采用鏈路冗余機(jī)制,預(yù)防單通道故障,單通道堵塞導(dǎo)致計算性能下降,中斷,低速的弊端。
節(jié)點部署
根據(jù)應(yīng)用、功能在集群中部署四個節(jié)點
管理節(jié)點
存儲節(jié)點
計算節(jié)點
登陸節(jié)點
管理節(jié)點(Management Node) 是集群系統(tǒng)各種管理措施的控制節(jié)點,管理網(wǎng)絡(luò)的控制點,監(jiān)控集群中各個節(jié)點和網(wǎng)絡(luò)的運行狀況,集群的管理軟件運行在這個節(jié)點上。 存儲節(jié)點(Storage Node) 存儲節(jié)點就是集群系統(tǒng)的數(shù)據(jù)存儲器和數(shù)據(jù)服務(wù)器,需要存儲大量數(shù)據(jù),部署并行文件系統(tǒng)及多臺IO服務(wù)器。 計算節(jié)點(Computing Node)是整個集群系統(tǒng)的計算核心,它的功能就是執(zhí)行計算,采用多路多核心服務(wù)器或刀片、多節(jié)點服務(wù)器實現(xiàn)高性能、高密度、低能耗、并行快速計算。 登陸節(jié)點,負(fù)責(zé)用戶信息注冊,登陸信息核對,提供系統(tǒng)使用,運行安全機(jī)制。
整個系統(tǒng)可通過業(yè)務(wù)網(wǎng)絡(luò)實現(xiàn)集中化管理,客戶維護(hù)方便。
通過集群軟件實現(xiàn)集群統(tǒng)一部署,并且可自動均衡負(fù)載,移動遷移,保證計算的可靠運行,并且采用高帶寬,高速的INFINIBAND交換機(jī)完全解決低速的IO瓶頸。
中海油系統(tǒng)一直采用國外服務(wù)器品牌,為此每年需支付高昂的軟件支持費用,采用國產(chǎn)HPC設(shè)備不但可從分滿足石油勘探的工作需求,并且成本低,用戶體驗好
通訊鏈路采用冗余設(shè)計,計算節(jié)點、管理節(jié)點和存儲節(jié)點間均采用冗余鏈路連接,保障數(shù)據(jù)的讀寫安全和順暢。