-
華為Atlas 900 AI訓練集群超強算力解析
最后更新: 2019-09-18 10:39:23(觀察者網訊)
9月18日,華為全聯接2019(HUAWEI CONNECT)大會上,華為副董事長胡厚崑發布了Atlas 900 AI訓練集群,以超強算力帶給企業人工智能業務的極致體驗。世界正從數字化向智能化轉型,人工智能產業作為關鍵驅動力,面臨自身的升級進化的挑戰。華為在超強人工智能算力和大規模分布式AI訓練集群兩個方面加速智能化世界的轉型。
Atlas 900 AI 訓練集群介紹
在大型數據集上進行訓練的神經網絡架構涵蓋從圖像識別、自然語言處理、視頻實時分析和智能推薦系統等各個方面,訓練這些神經網絡模型需要大量浮點計算能力。近年來單個AI處理器算力和訓練方法上均取得了重大進步,但是在單一機器上,AI訓練所需要的時間仍然長得不切實際,因此需要借助大規模分布式AI集群環境來提升神經網絡訓練系統的浮點計算能力。
此次發布的Atlas 900 AI訓練集群由數千顆昇騰910 AI處理器互聯構成,是當前全球最快的AI訓練集群,代表了當今全球的算力巔峰。其總算力達到256P~1024P FLOPS @FP16,相當于50萬臺PC的計算能力。
Atlas 900 AI訓練集群領先技術優勢
AI算力業界領先
Atlas 900 AI訓練集群采用業界單芯片算力最強的昇騰910AI處理器,每顆昇騰910AI處理器內置32個達芬奇AI Core,單芯片提供比業界高一倍的算力(256TFLOPS@FP16)。Atlas 900 AI訓練集群將數千顆昇騰910 AI處理器互聯,打造業界第一的算力集群。
昇騰910AI處理器采用SoC設計,集成“AI算力、通用算力、高速大帶寬I/O”,大幅度卸載Host CPU的數據預處理任務,充分提升訓練效率。
最佳集群網絡
Atlas 900 AI訓練集群采用“HCCS、 PCIe 4.0、100G以太”三類高速互聯方式,百TB全互聯無阻塞專屬參數同步網絡,降低網絡時延,梯度同步時延縮短10~70%。
在AI服務器內部,昇騰910 AI處理器之間通過HCCS高速總線互聯;昇騰910 AI處理器和CPU之間以最新的PCIe 4.0(速率16Gb/s)技術互聯,其速率是業界主流采用的PCIe 3.0(8.0Gb/s)技術的兩倍,使得數據傳輸更加快速和高效。在集群層面,采用面向數據中心的CloudEngine 8800系列交換機,提供單端口100Gbps的交換速率,將集群內的所有AI服務器接入高速交換網絡。
獨創iLossless 智能無損交換算法,對集群內的網絡流量進行實時的學習訓練,實現網絡0丟包與E2E μs級時延。
系統級調優
Atlas 900AI訓練集群通過華為集合通信庫和作業調度平臺,整合HCCS、 PCIe 4.0 和100G RoCE三種高速接口,充分釋放昇騰910AI處理器的強大性能。
華為集合通信庫提供訓練網絡所需的分布式并行庫,通信庫+網絡拓撲+訓練算法進行系統級調優,實現集群線性度>80%,極大提升了作業調度效率。
極致散熱系統
傳統數據中心多以風冷技術對設備進行散熱,但在人工智能時代傳統數據中心卻面臨非常大的挑戰。高功耗器件比如CPU和AI芯片帶來更大的熱島效應要求更高效的冷卻方式。液冷技術可以滿足數據中心高功率、高密部署、低PUE的超高需求。
Atlas 900 AI訓練集群采用全液冷方案,創新性設計業界最強柜級密閉絕熱技術,支撐>95%液冷占比。單機柜支持高達50kW超高散熱功耗,實現PUE<1.1的極致數據中心能源效率。
另外,在空間節省方面,與8kW風冷機柜相比,節省機房空間79%。極致的液冷散熱技術滿足了高功率、高密設備部署、低PUE的需求,極大地降低了客戶的TCO。
Atlas 900AI訓練集群領先的Benchmark指標
華為已在華為云上部署了一個Atlas900AI訓練集群,集群規模為1024顆昇騰910 AI處理器。基于當前最典型的ResNet-50 v1.5模型”和“ ImageNet-1k數據集”,Atlas 900AI訓練集群只需59.8秒就可完成訓練,排名全球第一。
“ ImageNet-1k數據集”包含128萬張圖片,精度為75.9%,在同等精度下,其他兩家業界主流廠家測試成績分別是70.2s和76.8s,Atlas900 AI訓練集群比第2名快15%。
Atlas 900AI 集群適用場景
Atlas 900 AI集群主要為大型數據集神經網絡訓練提供超強算力,可廣泛應用于科學研究與商業創新,讓研究人員更快地進行圖像、視頻和語音等AI模型訓練,讓人類更高效地探索宇宙奧秘、預測天氣、勘探石油和加速自動駕駛的商用進程。
Atlas 900 AI集群也可以提供云服務,以云的方式提供充裕的、經濟的算力資源,簡單易用、高效率、全流程的AI平臺,為客戶帶來極致體驗的“易獲取、用得起、方便用”的普惠AI算力。
標簽 華為- 責任編輯: 呂棟 
-
俄羅斯存放“天花病毒”的實驗室發生爆炸
2019-09-18 10:36 -
云淡風輕 華為發布最快AI訓練集群Atlas 900
2019-09-18 10:20 華為 -
對美國制造業有功,蘋果獎勵康寧2.5億美元
2019-09-18 09:41 美國經濟 -
HTC官宣新CEO 王雪紅仍擔任董事長
2019-09-18 08:56 商業 -
華為-南京大學電聲創新實驗室揭牌成立
2019-09-18 08:56 華為 -
國防科大打造史上最薄石墨烯燈泡,有望用于未來手機屏幕和芯片
2019-09-18 07:33 -
沙子快沒了?別擔心,造芯片主要用的不是它
2019-09-18 07:18 -
IDC:2019年Q2中國PC顯示器出貨量為722.9萬臺
2019-09-17 22:48 -
紫光國微:旗下紫光同芯THD89系列產品通過AEC-Q100車規認證
2019-09-17 21:56 -
Wi-Fi聯盟于宣布正式推出Wi-Fi6認證計劃
2019-09-17 20:03 -
中國遙感衛星地面站成功接收資源一號02D衛星數據
2019-09-17 17:52 -
上海聯通:裝備聯網是實現智能制造的基礎
2019-09-17 17:21 -
惠普打印機被發現偷偷回傳數據:隱藏極深
2019-09-17 16:17 -
院士:光刻技術是國內外集成電路領域差距最大的環節
2019-09-17 13:34 -
印度立志打造60臺超級計算機:首批3臺已出爐
2019-09-17 13:11 -
中企承建蒙古國最大互通立交橋主橋通車,系該國最長橋梁
2019-09-17 12:41 -
華為WATCH GT2高清渲染圖曝光:三種表帶、超強防水/續航
2019-09-17 11:08 華為 -
中國科技團隊解決地鐵隧道穿越敏感建構筑物關鍵技術
2019-09-17 10:00 -
華為屏下前置攝像頭專利曝光:消滅劉海 打造真全面屏
2019-09-17 09:52 -
海南省長:海南推動清潔能源島建設,今后核電是主能源
2019-09-17 08:49
相關推薦 -
“中國實力增強,美軍在太平洋從霸權轉向分散生存” 評論 71布林肯承認“開打前就給了”,俄方回應 評論 164央行宣布將擇機降準降息,“擇機”以何為標志? 評論 163被逼急了,格陵蘭島總理:是時候獨立了 評論 202美媒直呼:啥都能威脅國家安全,美國完全走偏了 評論 167最新聞 Hot