如果說光刻機是人類工業文明皇冠上的明珠,那神威·太湖之光毫無疑問就是我國超算行業的皇冠,曾憑借霸道的算力優勢一舉奪得全球超算四連冠,近年來,伴隨著美國前沿(Frontier)和日本富岳(Fugaku)的異軍突起,一度令眾網友好奇,神威的E級超算新品為何遲遲未能問世?
神威·太湖之光沉默了?
北京時間11月15日,第60期全球超級計算機TOP 500強榜單重磅出爐,排名第一的是來自美國橡樹嶺國家實驗室的Frontier前沿超算,它憑1.102EFIop/s(百億億次)的HPL得分傲視群雄 ,理論峰值性能是第二名Fugaku富岳超算的3倍多。
來自中國的太湖之光和天河二號位列第7、第10名
曾幾何時,神威·太湖之光在全球超算圈可以說是風光無兩,自2016年面世后,便創造過一連串輝煌篇章:
它是世界第一臺峰值運算性能超過每秒10億億次浮點運算能力的超級計算機;
2016年,神威·太湖之光輕松斬獲TOP 500世界第一;
2016年,神威·太湖之光榮獲戈登貝爾獎;
2017年,神威·太湖之光再獲TOP 500世界第一;
2017年,神威·太湖之光再獲戈登貝爾獎;
如果用通俗的比喻來理解創造四連冠的神威·太湖之光的算力的話,那就是,它運算1分鐘,相當于全球72億人不間斷運算32年!
彼時神威·太湖之光的計算性能、持續性能和性能功能比三項關鍵指標均處于世界前列。
從今年的榜單來看,Frontier的穩定速度是榜單上排名第二的Fugaku的2.49倍,理論速度快了3.14倍,單以穩定速度來看,Frontier是榜單上TOP 2~8的性能之和,在如此彪悍的算力性能下,它的功耗卻僅有Fugaku的71%。
僅看數據的對比,神威·太湖之光確實與冠軍的成績有差距,但很多網友沒搞明白的一點時,神威·太湖之光是2016年的產物,已經過去6年了,而富岳和前沿呢?
2019年12月13日,富岳首批6臺計算機順利抵達神戶理化學研究所計算科學研究中心,由此可見其研制時間在2019年前后,2020年6月,當期公布的全球超算TOP 500榜單中,富岳排名第一;
而在2022年5月30日和11月分別公布的全球超算TOP 500榜單中,均斬獲冠軍的前沿,其最早的研制時間也剛好在2019年,也就是說,我國的神威·太湖之光投入運行3年后,這些后來者才著手研發新一代超算。
Frontier單排機柜內部
隔著3年的時差,6個代際的排名,但即便如此,我們的超算總體成績仍然令人矚目。
就拿這屆TOP 500榜單的前十來說,我國的神威·太湖之光和銀河2號仍然都進了前十,并且總上榜臺數達到162,實力超越了歐美,也就是說,我們實際上仍然獲得了總榜第一的好成績。
即便PK算力,我們也是世界前列。
超算對于大國的意義巨大!
HPE(Frontier運營商)執行副總裁、高性能計算和人工智能部門總經理Justin Hotard曾表示,前沿在速度和性能方面取得了突破,讓我們有機會解答那些以前甚至都不知道要問的問題。
美國橡樹嶺國家實驗室相關負責人Jeff Nichols表示,來自世界各地的科學家和工程師都將利用該套系統(指Frontier)非凡的計算速度,來解決我們這個時代全人類最具挑戰性的一些問題。
神威·太湖之光的典型應用場景有藥物的分子動力學模擬、3D渲染、數字水池和大氣動力學等,比如天氣預報、霧霾預警、3D大片、新型材料和新型藥物的研發等,也就是說,這些超算們的應用場景會涉及到國防、軍事、醫療、高能物理、工程設計、地震預測、氣象觀測、航天技術、國家高精尖科研的方方面面,無論實際需求還是長遠意義都很重大。
這也是各大國不遺余力搞超算軍備競賽的真相!
我國超算,們早就擁有了設計一流芯片的能力。
我國的科研人員也早就想到了硬件上的限制,為了不被美國卡脖子,當初超算項目立項之際,就刻意避開了X86\ARM\Risc-V\MIPS四大主流芯片架構,轉而選擇了有點冷門卻系出名門的Alpha 21364架構,基于Alpha開發拓展出了一套有自主知識產權的指令集,也就是后來的申威指令集。
2006年,國家超算無錫中心(江南所)設計出自主微結構的申威1,基于130nm制程工藝,單核心CPU,主頻只有900MHz,集成了5700萬晶體管;
2008年,江南所推出了申威2,基于130nm工藝,雙核心CPU ,主頻抬升到1.4GHz;
2010年,申威1600橫空出世,基于65nm工藝,但是性能與功耗卻超越了當時的Intel,i7 980xe 6核心功耗130W,申威1600功耗僅70W,申威1600在1.1GHz的主頻率時,雙精度浮點運算能力達140.8G,而i7 980xe 6核心運行在3.2GHz頻率時,雙精度浮點只有107.55G;
2016年,神威·太湖之光用的申威26010,雙浮點峰值已達3.06TFIops,與Intel的Kight Landing處在同一水平,申威26010用落后英特爾和AMD幾乎2整代的工藝卻做出了不低于后兩者的性能,足見當初選擇Alpha 21364架構的明智與后續自研拓展指令集的優勢。
如今,制程工藝上,限制較明顯,但可以選擇在功耗控制和堆核心上下力氣,花更多的精力,利用與代工廠深度合作的主頻優化、自研架構&指令集方面的優勢縮短硬件性能差距。
回到了前文的問題,這幾年,神威和天河們發展得怎樣了?
早在2018年節點,我國已經正式布署了神威、天河和曙光三種不同技術路線的E級超算(跟Frontier同水平線的百億億次/秒),其中天河3號原型機更是在當年7月就通過了驗收,同年8月5日,神威E級超算也順利通過了科技部專家組的驗收,同年10月24日,來自經濟日報的一篇報道顯示,神威E級原型機、天河三號E級原型機和曙光E級原型機系統全部完成交付。
這說明什么?說明我們早已掌握了E級超算的相關技術鏈啊。
2022年4月,中國科學技術大學、國家海洋科學與技術試點實驗室 、北京大學數學科學學院、無錫國家超級計算中心和中國海洋大學組成的聯合團隊,公布了一篇超算模擬復雜量子多體的文章。
據該文描述,在介紹高性能計算環境時提及了申威26010 Pro的架構,該CPU為申威26010的升級改進款,擁有6個計算組,每個計算群有1個管理核心和64個計算核心,較之于僅有4個計算組的申威26010,單片性能至少提升50%,文章稱呼為新一代神威超級計算機,似乎也印證著該臺超算大概率即為神威·海洋之光。
11月15~17日,第24屆中國國際高新技術成果交易會在深圳召開,深流微智能科技有限公司CTO Jerry在演講中直言“深流微作為國內唯一自研高能性圖形渲染GPU的廠商,擁有完全自主知識產權的GPU架構與微架構設計,其自研的XTS系列GPU可廣泛應用于AI計算、虛擬現實和元宇宙等領域”。
隨著我國算力網絡的進一步布局,超算的應用前景將會更加廣闊,除了國家隊主導的超算之外,民企的算力中心發展速度也十分為驚人,據《河北日報》消息,阿里云于8月30日正式啟動了張北超級智算中心,總算力高達逆天的12EFlops,一舉超過了9 EFlops的谷歌和1.8 EFlops的特斯拉,有了這樣的算力做保障,AI大模型訓紅、自動駕駛、空間地理等人工智能探索都將如魚得水。
……
美國有Intel、AMD、高通等一眾芯片民企巨頭,我們也有華為、阿里、深流微等自主研發高手!
加油~
參考資料:
“神威·太湖之光”榮獲四次世界超級計算機冠軍——無錫新傳媒網
第60期全球超級計算機排行榜TOP 500榜單出爐——IT之家
全球超算TOP500強出爐!棄考一年,中國超算數量仍遙遙領先——新智元
太湖之光是怎么造出來的?——maomaobear
余鵬鯤:美國首臺E級超算,贏在哪里?輸在哪里?——觀察者網
深流微智能CTO Jerry:國產GPU必將迎來難得的機遇,從而實現技術突破——新浪財經
基于AMD的Frontier系統問鼎全球超級計算機TOP 500榜單——至頂頭條
圖源網