天蝎創(chuàng)新
2012年,天蝎1.0破繭而出,概念發(fā)布,首次商用
2014年,天蝎2.0重磅發(fā)布,標準制定,規(guī)模部署
2019年,天蝎3.0一觸即發(fā),全面升級,未來可期
天蝎成果
天蝎整機柜部署規(guī)模超2萬柜,生態(tài)產(chǎn)值超200億元,版本經(jīng)歷2次大的迭代,子產(chǎn)品多輪升級,創(chuàng)新產(chǎn)品層出不窮。從2011年天蝎項目組成立至今,每年都有新的標準發(fā)布,既推動服務(wù)器產(chǎn)業(yè)技術(shù)的發(fā)展,也帶動著整個產(chǎn)業(yè)效益的提升。
新的挑戰(zhàn)
,及人工智能的飛速發(fā)展,持續(xù)推動的變革與創(chuàng)新。天蝎3.0架構(gòu)的全面升級,與新技術(shù)的發(fā)展和場景化需求密不可分。近幾年來,AI計算發(fā)展迅速,云化需求愈演愈烈,邊緣計算如火如荼。整機柜架構(gòu)的設(shè)計與布局需要結(jié)合新的應(yīng)用場景謀求創(chuàng)新與突破。
隨著登納德縮放定律與摩爾定律減速,CPU處理器向著高功率的趨勢不斷發(fā)展,伴隨著定制化模式的不斷成熟,CPU處理器高算力高功耗的規(guī)格不斷應(yīng)用于定制化服務(wù)器當中。
AI賦能,Training和Inference的應(yīng)用場景更加普及,對于AI GPU服務(wù)器的整機柜功耗以及機柜供電架構(gòu),散熱模式帶來了新的挑戰(zhàn)。
業(yè)務(wù)的靈活、快速部署、搬遷混插功能實現(xiàn)等需求強烈,整機柜要更加靈活彈性。
關(guān)鍵突破
節(jié)點子系統(tǒng)。節(jié)點支持1SU和2SU形態(tài),高功率密度,更加彈性和靈活,充分考慮CPU/GPU/xPU/FPGA等處理器核心部件的適配,預(yù)留新部件的彈性擴展能力。
散熱子系統(tǒng)。節(jié)點獨立散熱,標準化規(guī)格,實現(xiàn)節(jié)點靈活混布與彈性搬遷;引入虹吸熱技術(shù),實現(xiàn)高功率CPU的高效能風冷散熱;機柜設(shè)計充分考慮液冷模組的預(yù)留支持與設(shè)計。
供電子系統(tǒng)。定義48V PSU+BBU集中供電,具備更高的機柜供電能力,承接未來AI算力的挑戰(zhàn)。
機柜子系統(tǒng)。機柜歸一化設(shè)計,兼容19寸/21寸內(nèi)寬節(jié)點。
天蝎3.0整機柜
天蝎3.0整機柜架構(gòu)實現(xiàn)了整機柜技術(shù)的又一次飛躍,以更具前瞻性的技術(shù)視野應(yīng)對整個硬件發(fā)展新趨勢和未來業(yè)務(wù)的發(fā)展新需求,重新定義了未來3-5年的整機柜架構(gòu)體系,推動整機柜生態(tài)的進一步發(fā)展與完善。
項目經(jīng)理:何永占 百度架構(gòu)師
heyongzhan@baidu.com
期待項目9月3-4日在開放數(shù)據(jù)中心峰會上的精彩呈現(xiàn)!
2019ODCC開放峰會: