科研,是科技持續發展的引擎??蒲袡C構需要怎樣的支撐?除了經費和人才外,對高性能計算有著更高的需求,其強大的算力能夠支撐大量的科研項目,進而縮短研發周期,推動高效創新。
當前,隨著數字經濟的蓬勃發展,數據量的暴增,高性能計算正逐漸向新興的大數據、深度學習以及云計算等方向進行融合和演進,以支撐人工智能、基因測序、仿真模擬等諸多領域的研究,HPC&AI的強大智能計算能力正推動民生與數字經濟的不斷升級,成為構建下一代基于數據產業和科學計算的基石,是開啟未來數據文明的秘鑰。
近日,寶德為中國科學院(簡稱“中科院”)某研究院,量身定制的HPC&AI融合集群解決方案,憑借眾多優勢以及良好的經濟效益,在深圳市高校教育信息化學會舉辦的新基建下智慧校園建設發展論壇上,通過嚴格把關、層層甄選,獲評優秀案例大獎。
作為我國自然科學最高學術機構、科學技術最高咨詢機構、自然科學與高技術綜合研究發展中心,中科院的高性能計算之路已經走過了近三十年,在應用水平、計算規模和科研成果上都位列前沿,當然,這也決定了中科院對于伙伴的選擇更為苛刻。
本次獲獎案例中,寶德基于高可靠、易擴展和開放的架構設計,為中科院某研究院搭建集實時計算、數據分析和大數據存儲于一體的遙感數據綜合分析管理平臺,實現高性能計算和人工智能的結合應用,既提供澎湃的算力,又帶來更多智能化的體驗,使得遙感數據處理速度提升120%,日處理數據量達到25TB,實際使用效益深厚院方滿意和認可。方案中系統主要分為三個層次設計:網絡層、存儲層和應用層。網絡層主要提供終端與服務器、服務器與服務器之間的網絡物理硬件連接;存儲層主要提供應用層所使用數據的讀取和存儲;應用層主要提供各種應用請求、計算服務器和存儲服務器之間的數據交換等。同時,方案主要通過構建業務節點、計算節點、分布式存儲資源池以及磁帶庫,提供高達93.6TFlops以上的計算能力,SSD分布式存儲可用容量664TB,HDD分布式存儲可用容量4500TB,磁帶庫裸容量12PB的高性能計算集群,滿足院方當前科研發展對于高性能計算力以及高速存儲IO帶寬的需求。1、系統基于先進的萬兆以太網絡構建核心骨干網,通過使用企業級萬兆核心交換機實現核心網絡系統的架構設計,保證所有功能節點和存儲節點之間以萬兆網絡以上的線性速率進行數據傳輸,大幅度提升傳輸帶寬,同時具備高冗余性和容錯性。2、高性能在線計算集群部分基于100Gb Infiniband高速網絡,通過RDMA技術可以加快HPC&AI計算節點之間的MPI數據通信和與存儲之間的數據傳輸,實現數據的實時快速讀寫計算,并提升遙感圖形機器視覺處理能力,實現自動識別和分析空間遙感圖像。3、 采用兩套分布式存儲系統,均基于全對稱分布式設計,SSD高速在線分布式存儲基于100Gb Infiniband提供存儲節點數據通信,HDD近線存儲基于萬兆以太網提供存儲節點數據通信存儲之間,并采用糾刪碼和網絡冗余設計,保證存儲系統的整體容錯率。4、提供高可用業務服務器解決方案以及管理登錄節點雙機備份配置,保證集群系統高可用;Web服務器、數據庫服務器、綜合業務服務器也通過冗余配置,并與萬兆核心骨干網絡相連,搭配高性能磁盤陣列,實現綜合業務應用高可用。5、采用綜合業務節點冗余配置搭配大容量磁帶庫,實現冷數據的傳輸和長期穩定保存。以綜合業務節點作為備份管理端,將HDD近線存儲空間以NAS形式掛載到綜合業務節點,配合備份軟件備份機制,將NAS里的文件備份到磁帶庫,實現數據的離線保存。綜合以上設計和優勢,寶德HPC&AI融合集群解決方案幫助中科院某研究院實現對遙感大數據的實時分析,并結合人工智能技術,快速獲取地表形態變化,以支撐多領域科學研究。在高性能計算領域,寶德已經擁有二十余年的精耕細作和技術積累,當前,伴隨著數字經濟進入全面滲透、融合階段,寶德的高性能計算更是走上了一條“融合創新發展”之路,此次為中科院某研究院打造的HPC&AI融合集群解決方案,是寶德綜合能力的展現也是二十余年底蘊的釋放。面向未來,寶德亦持續賦能高科技研發領域,進一步助推我國科技和數字經濟的進步與發展。