出處:雷鋒網(wǎng) 作者:楊鯉萍
近日,在荷蘭阿姆斯特丹舉行的 OCP Regional Summit 2019 大會(huì)上,百度與浪潮聯(lián)合發(fā)布了全球首款基于 OCP OAI 標(biāo)準(zhǔn)(開放加速器基礎(chǔ)設(shè)施)和液冷的 AI 計(jì)算新品 X-MAN 4.0。
X-MAN 4.0 是百度超級(jí) AI 計(jì)算平臺(tái) X-MAN 系列產(chǎn)品的第四代,浪潮作為百度的重要合作伙伴之一,一直參與 X-MAN 系列產(chǎn)品的研發(fā)和生產(chǎn),并 X-MAN 4.0 作為其目前在超級(jí) AI 計(jì)平臺(tái)上的最強(qiáng)有力產(chǎn)品推出。
X-MAN 系列,從 1.0 到 4.0
X-MAN 系列是百度用于超大規(guī)模 AI 訓(xùn)練的專用平臺(tái),已在百度的數(shù)據(jù)中心大規(guī)模應(yīng)用。其中,第一代 X-MAN 1.0 首次實(shí)現(xiàn)了 AI 計(jì)算硬件解耦架構(gòu);第二代 X-MAN 2.0 首次將冷板式液冷散熱技術(shù)應(yīng)用到 AI 計(jì)算產(chǎn)品里;第三代 X-MAN 3.0 則首次提出了模塊化標(biāo)準(zhǔn)化設(shè)計(jì)的理念。
第四代 X-MAN 4.0 作為全球首款基于 OCPOAI 標(biāo)準(zhǔn)(開放加速器基礎(chǔ)設(shè)施)和液冷的 AI 計(jì)算新品,平臺(tái)的單節(jié)點(diǎn)能夠支持 8 個(gè) AI 加速器。這些加速器之間采用了 8port HCM(Hybrid Cube Mesh)的互聯(lián)架構(gòu),雙向通信帶寬高達(dá) 56GBps,充分保證 AI 加速器的性能。
而在單個(gè)機(jī)柜層面,X-MAN 4.0 最大可支持 32 個(gè) AI 加速器構(gòu)建互聯(lián)集群,很好的增強(qiáng)了平臺(tái)可擴(kuò)展性。
X-MAN 4.0 符合 ODCC 3.0 整機(jī)柜規(guī)范,高度為 4SU(182.5mm),寬 21 英寸(536.0mm),長(zhǎng)度 850mm,支持風(fēng)冷、液冷散熱方式,并采用了更高效的 48V 供電方式。
百度超級(jí) AI 計(jì)算平臺(tái) X-MAN 4.0
OCP 社區(qū)與 OAI 標(biāo)準(zhǔn)
OCP(Open Compute Project)即開放計(jì)算項(xiàng)目,它是由 Facebook 攜英特爾、Rackspace 等公司于 2011 年成立的一個(gè)非營(yíng)利組織 , 目的是與普通的 IT 產(chǎn)業(yè)共享更高效的服務(wù)器和數(shù)據(jù)中心設(shè)計(jì)。同時(shí),它也是全球云計(jì)算基礎(chǔ)硬件技術(shù)領(lǐng)域覆蓋面最廣、最有影響力的開源組織。
而 OAI(Open Archives Initiative)標(biāo)準(zhǔn)是 OCP 社區(qū)里由百度主導(dǎo)并聯(lián)合 Facebook、Microsoft 等針對(duì) AI 硬件加速模塊和系統(tǒng)設(shè)計(jì)所制定的標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)用于指導(dǎo) AI 硬件加速模塊和系統(tǒng)設(shè)計(jì) , 它集合定義了 AI 硬件加速模塊本身、主板、互聯(lián)拓?fù)洹C(jī)箱、供電、散熱以及系統(tǒng)管理等一系列設(shè)計(jì)規(guī)范。
目前,OAI 標(biāo)準(zhǔn)也得到了眾多社區(qū)成員的支持,包括:Facebook、Microsoft、Google 等互聯(lián)網(wǎng)企業(yè),Intel、AMD、高通等 AI 芯片企業(yè),及浪潮、IBM、聯(lián)想等系統(tǒng)供應(yīng)商。
獲得眾多企業(yè)成員支持的 OAI 標(biāo)準(zhǔn)
打造全球標(biāo)準(zhǔn),加速 AI 進(jìn)程
可以看到,由百度主導(dǎo)的 OAI 標(biāo)準(zhǔn)定義,在一定程度上推動(dòng)了 AI 新硬件技術(shù)全球范圍內(nèi)的創(chuàng)新與進(jìn)步。
OAI 標(biāo)準(zhǔn)的推行,不僅能夠直接使得相關(guān)廠商統(tǒng)一 AI 硬件加速模塊和系統(tǒng)設(shè)計(jì),提高多元化 AI 加速芯片兼容性;而且還有利于促進(jìn)不同 AI 加速器技術(shù)的開放融合,從而讓 AI 計(jì)算平臺(tái)設(shè)計(jì)更加敏捷,產(chǎn)業(yè)配套更為簡(jiǎn)化。
百度副總裁侯震宇曾表示:"OAI 標(biāo)準(zhǔn)將極大提高不同 AI 硬件加速模塊和系統(tǒng)的互操作性,加速新 AI 硬件加速模塊的大規(guī)模落地應(yīng)用,全球 AI 硬件生態(tài)系統(tǒng)都會(huì)從中受益。" 這也代表了百度將自身在 AI 領(lǐng)域的最佳實(shí)踐共享至國(guó)際 AI 社區(qū)的初心。