以客戶為中心,提供定制化或一站式的全棧解決方案,賦能千行百業
高性能計算(High performance computing) 指通常使用很多處理器(作為單個機器的一部分)或者某一集群中組織的幾臺計算機(作為單個計算資源操作)的計算系統和環境。高性能集群上運行的應用程序一般使用并行算法,把一個大的普通問題根據一定的規則分為許多小的子問題,在集群內的不同節點上進行計算,而這些小問題的處理結果,經過處理可合并為原問題的最終結果。由于這些小問題的計算一般是可以并行完成的,從而可以縮短問題的處理時間。高性能計算在一個國家的科研中居于基礎性地位,是科技創新的動力源之一。以E級超級計算機為代表的高性能計算具有廣闊的應用前景,有望在氣候科學、可再生能源、基因組學、天體物理學以及人工智能等領域“大顯身手”。
寶德公司力推的高性能集群是專門為滿足大規模分析計算而設計的超級并行計算機集群系統,它遵循 Intel 開放的 HPC 生態體系架構來系統的部署所有的軟硬件:采用Intel 基于酷睿架構的雙路 Xeon 和多路 Xeon 作為計算節點。寶德高性能計算集群采用集群體系結構,通過標準開放的高速網絡實現互連,運行開放源代碼的 Linux 系統,對外提供單一系統接口,它針對大規模科學并行計算設計,兼顧事務處理和網絡信息服務。
該方案主要通過構建管理節點、計算節點、以及分布式存儲資源池,構建計算力高達100Tflops以上的計算能力高性能計算集群,存儲采用高性能低延遲得SSD分布式存儲池,以及大容量得HDD分布式存儲池。滿足對于高性能計算力以及高速存儲IO帶寬的需求。
【硬件部分】
計算節點:CPU計算節點
管理節點:雙路服務器
登陸節點:雙路服務器
存儲節點:分布式并行存儲
網絡系統:包含以太網絡系統、 光纖存儲網絡、機柜、PDU等
【軟件部分】
操作系統:CentOS 7
集群軟件:資源管理與調度軟件Powercloud
開發環境:Fortran/C/C++等
并行環境:OpenMP、OpenMPI、MVPAICH2等MPI并行環境
文件系統:分布式并行文件系統
應用軟件:客戶自帶應用軟件
計算網絡采用高速的100G IB網絡,確保用戶的計算任務在運行過程中不受網絡帶寬的限制,業務網絡使用25G以太網路,延遲低速度快。兩層高速網絡保障集群中所有節點無阻塞、全線速的運行,可充分滿足高速互聯的需求。
計算節點由寶德四路服務器組成,每臺四路服務器可支持4個英特爾可擴展系列處理器,以及最大96個內存插槽,多核心計算能力和大內存運行能力,為要求苛刻的HPC和橫向擴展工作負載提供動力。
存儲資源分為兩個分布式資源池,其中SSD存儲池運行重要數據和熱數據,HDD存儲池保存冷數據和大容量數據,同時兼顧IO性能和容量。
整套集群采用多種可靠性設計方案大幅度提升系統的可靠性,確保系統無單點故障。同時為用戶提供簡單易用的使用和維護接口,降低系統的使用維護門檻,提高整套系統的維護效率