以客戶為中心,提供定制化或一站式的全棧解決方案,賦能千行百業(yè)
石油行業(yè)應(yīng)該是應(yīng)用HPC高性能計(jì)算最為廣泛的領(lǐng)域之一,因?yàn)槭涂碧焦ぷ餍枰M(jìn)行海量數(shù)據(jù)的密集計(jì)算和模擬,計(jì)算結(jié)果出來后還要轉(zhuǎn)換成直觀的可視畫面,這些工作必須借助高性能計(jì)算機(jī)才能實(shí)現(xiàn)最佳的勘探效益,在石油勘探項(xiàng)目中需要通過地球物理方法去獲取數(shù)據(jù),它包括了電法,磁法,重力法,放射性法以及地震波法,地震波法是石油勘探中最常用的基本方法,因?yàn)榈卣鸩艽┩负襁_(dá)幾千米的巖層.提供石油可能埋藏的信息和數(shù)據(jù),再利用HPC并行計(jì)算的強(qiáng)大數(shù)據(jù)處理能力,精確計(jì)算、分析這些獲取到的信息和數(shù)據(jù),為油氣鉆井定位提供參考。
為了實(shí)現(xiàn)更強(qiáng)的計(jì)算和分析海量數(shù)據(jù)的能力,在通訊網(wǎng)絡(luò)架構(gòu),并行計(jì)算架構(gòu),管理結(jié)構(gòu)以及存儲(chǔ)架構(gòu)的設(shè)計(jì)提出了高的要求:
1)、滿足由于快速計(jì)算所帶來的臨時(shí)計(jì)算數(shù)據(jù)處理速度對(duì)持續(xù)帶寬要求
2)、計(jì)算體系結(jié)構(gòu)和計(jì)算能力的變化,傳統(tǒng)基于主機(jī)的計(jì)算部署架構(gòu)存在不足
3)、綜合考慮石油行業(yè)高性能計(jì)算應(yīng)用的特點(diǎn),以及石油企業(yè)對(duì)于勘探業(yè)務(wù)計(jì)算任務(wù)執(zhí)行效率和成本的管控要求
4)、大規(guī)模系統(tǒng)在計(jì)算節(jié)點(diǎn)、網(wǎng)絡(luò)、存儲(chǔ)和軟件上的高可用性要求
5)、對(duì)大規(guī)模系統(tǒng)設(shè)備的集中維護(hù),簡易、方便、可靠性管理的要求
根據(jù)項(xiàng)目的實(shí)際處理業(yè)務(wù)的需求,本方案采用PowerScale9000一體機(jī)與登陸節(jié)點(diǎn)和管理節(jié)點(diǎn)以及高速通訊網(wǎng)絡(luò)集中部署方案,其各服務(wù)計(jì)算節(jié)點(diǎn)間做集群處理實(shí)現(xiàn)計(jì)算業(yè)務(wù)的均衡負(fù)載,平滑遷移;并采用鏈路冗余機(jī)制保證通訊的數(shù)據(jù)傳輸?shù)姆€(wěn)定性和安全性;整體滿足項(xiàng)目的需求。
本方案中選用寶德高性能定制化Powerscale 9000超級(jí)計(jì)算機(jī)(HPC)系統(tǒng),作為石油勘探領(lǐng)域的數(shù)據(jù)處理中心,發(fā)揮著舉足輕重的作用
高密度:采用超高密度的設(shè)計(jì),最大可支持80節(jié)點(diǎn),節(jié)約空間
易擴(kuò)展:采用平臺(tái)化設(shè)計(jì)思想,全模塊化設(shè)計(jì)
低功耗:采用集中式供電、共享散熱設(shè)計(jì)
易管理:采用一體化快速交付設(shè)計(jì)
易維護(hù):采用集中式管理設(shè)計(jì),簡化運(yùn)維管理工作,提高運(yùn)維效率
集群部署:基于并行計(jì)算體系架構(gòu),將所有的結(jié)算節(jié)點(diǎn)和管理節(jié)點(diǎn)通過高速通訊網(wǎng)絡(luò)連接起來,并部署集群軟件實(shí)現(xiàn)任務(wù)的負(fù)載均衡,各計(jì)算節(jié)點(diǎn)處理任務(wù)不均衡時(shí)自動(dòng)平等分配任務(wù)達(dá)到均等計(jì)算的效果,實(shí)現(xiàn)并行的快速、高效計(jì)算。部署集中存儲(chǔ)方式,各節(jié)點(diǎn)映射同一存儲(chǔ),實(shí)現(xiàn)數(shù)據(jù)的共享,方便靈活調(diào)用、存寫數(shù)據(jù)信息,部署集中管理節(jié)點(diǎn),集中管理、監(jiān)控各計(jì)算節(jié)點(diǎn)的狀態(tài)、運(yùn)行情況
網(wǎng)絡(luò)部署:采用40GB和80GB INFINIBAND交換機(jī),實(shí)現(xiàn)個(gè)計(jì)算節(jié)點(diǎn)、管理節(jié)點(diǎn)、存儲(chǔ)節(jié)點(diǎn)和登陸節(jié)點(diǎn)互聯(lián),達(dá)到高帶寬,高速、低延時(shí)的數(shù)據(jù)通訊,解決IO通訊的瓶頸。采用鏈路冗余機(jī)制,預(yù)防單通道故障,單通道堵塞導(dǎo)致計(jì)算性能下降,中斷,低速的弊端。
節(jié)點(diǎn)部署
根據(jù)應(yīng)用、功能在集群中部署四個(gè)節(jié)點(diǎn)
管理節(jié)點(diǎn)
存儲(chǔ)節(jié)點(diǎn)
計(jì)算節(jié)點(diǎn)
登陸節(jié)點(diǎn)
管理節(jié)點(diǎn)(Management Node) 是集群系統(tǒng)各種管理措施的控制節(jié)點(diǎn),管理網(wǎng)絡(luò)的控制點(diǎn),監(jiān)控集群中各個(gè)節(jié)點(diǎn)和網(wǎng)絡(luò)的運(yùn)行狀況,集群的管理軟件運(yùn)行在這個(gè)節(jié)點(diǎn)上。 存儲(chǔ)節(jié)點(diǎn)(Storage Node) 存儲(chǔ)節(jié)點(diǎn)就是集群系統(tǒng)的數(shù)據(jù)存儲(chǔ)器和數(shù)據(jù)服務(wù)器,需要存儲(chǔ)大量數(shù)據(jù),部署并行文件系統(tǒng)及多臺(tái)IO服務(wù)器。 計(jì)算節(jié)點(diǎn)(Computing Node)是整個(gè)集群系統(tǒng)的計(jì)算核心,它的功能就是執(zhí)行計(jì)算,采用多路多核心服務(wù)器或刀片、多節(jié)點(diǎn)服務(wù)器實(shí)現(xiàn)高性能、高密度、低能耗、并行快速計(jì)算。 登陸節(jié)點(diǎn),負(fù)責(zé)用戶信息注冊(cè),登陸信息核對(duì),提供系統(tǒng)使用,運(yùn)行安全機(jī)制。
整個(gè)系統(tǒng)可通過業(yè)務(wù)網(wǎng)絡(luò)實(shí)現(xiàn)集中化管理,客戶維護(hù)方便。
通過集群軟件實(shí)現(xiàn)集群統(tǒng)一部署,并且可自動(dòng)均衡負(fù)載,移動(dòng)遷移,保證計(jì)算的可靠運(yùn)行,并且采用高帶寬,高速的INFINIBAND交換機(jī)完全解決低速的IO瓶頸。
中海油系統(tǒng)一直采用國外服務(wù)器品牌,為此每年需支付高昂的軟件支持費(fèi)用,采用國產(chǎn)HPC設(shè)備不但可從分滿足石油勘探的工作需求,并且成本低,用戶體驗(yàn)好
通訊鏈路采用冗余設(shè)計(jì),計(jì)算節(jié)點(diǎn)、管理節(jié)點(diǎn)和存儲(chǔ)節(jié)點(diǎn)間均采用冗余鏈路連接,保障數(shù)據(jù)的讀寫安全和順暢。