2018年3月27日—nvidia公布了其的深度學(xué)習(xí)計(jì)算平臺(tái)所取得的一系列重要進(jìn)展,相較于六個(gè)月前發(fā)布的上一代產(chǎn)品,其深度學(xué)習(xí)工作負(fù)載性能實(shí)現(xiàn)了10倍提升。
nvidia的平臺(tái)已被各大云計(jì)算服務(wù)提供商和服務(wù)器制造商所采用,此次公布的主要進(jìn)展包括nvidia® tesla® v100(強(qiáng)大的數(shù)據(jù)中心gpu)的2倍內(nèi)存提升,以及革命性的全新gpu互聯(lián)結(jié)構(gòu)nvidia nvswitchô,它可使多達(dá)16個(gè)tesla v100 gpu同時(shí)以2.4 tb /秒的速度進(jìn)行通信,這一速度創(chuàng)下歷史新高。 nvidia還推出了一個(gè)更新的、全面優(yōu)化的軟件堆棧。
此外,nvidia推出 nvidia dgx-2ô,是其在深度學(xué)習(xí)計(jì)算領(lǐng)域取得的重大突破。這是*能夠提供每秒兩千萬億次浮點(diǎn)運(yùn)算能力的單點(diǎn)服務(wù)器。dgx-2具有300臺(tái)服務(wù)器的深度學(xué)習(xí)處理能力,占用15個(gè)數(shù)據(jù)中心機(jī)架空間,而體積則縮小60倍,能效提升18倍。
nvidia創(chuàng)始人兼執(zhí)行官黃仁勛在gtc 2018上公布了這一消息,他表示:“深度學(xué)習(xí)的超凡進(jìn)展僅僅是對(duì)未來的啟示。其中的很多進(jìn)展都是基于nvidia深度學(xué)習(xí)平臺(tái),該平臺(tái)已快速成為標(biāo)準(zhǔn)。我們正在以大幅超越摩爾定律的步伐加快提升平臺(tái)的性能,以實(shí)現(xiàn)突破,進(jìn)而為醫(yī)療保健、交通運(yùn)輸、科學(xué)探索和其他眾多領(lǐng)域帶來革命性改變。”
tesla v100實(shí)現(xiàn)內(nèi)存翻倍
tesla v100 gpu被的研究人員廣為采用,2倍的內(nèi)存提升使其能夠處理大部分內(nèi)存密集型深度學(xué)習(xí)和高性能計(jì)算工作負(fù)載。
如今tesla v100 gpu配備了32gb內(nèi)存,將助力數(shù)據(jù)科學(xué)家對(duì)更深度、更大規(guī)模的深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,且比以往都更加。與之前的16gb版本相比,它還能將內(nèi)存受限的hpc應(yīng)用性能提升高達(dá)50%。
tesla v100 32gb gpu目前可用于所有nvidia dgx系統(tǒng)。此外,各大計(jì)算機(jī)制造商cray、hpe、ibm、聯(lián)想、supermicro和tyan也宣布將于第二季度內(nèi)推出各自全新的tesla v100 32gb系統(tǒng)。 oracle云基礎(chǔ)設(shè)施也宣布計(jì)劃將于今年下半年在云端提供tesla v100 32gb。
nvswitch: 革命性的互聯(lián)結(jié)構(gòu)
nvswitch的帶寬比好的pcie交換機(jī)高出5倍,讓能夠采用更多的超級(jí)互聯(lián)gpu來構(gòu)建系統(tǒng)。它將幫助突破早前系統(tǒng)的限制并運(yùn)行更大的數(shù)據(jù)集。它也為更大規(guī)模、更復(fù)雜的工作負(fù)載開啟了可能,包括神經(jīng)網(wǎng)絡(luò)并行訓(xùn)練的建模。
nvswitch在nvidia nvlinkô(nvidia開發(fā)的*高速互聯(lián)技術(shù))的創(chuàng)新基礎(chǔ)上實(shí)現(xiàn)了進(jìn)一步擴(kuò)展,讓系統(tǒng)設(shè)計(jì)人員能夠構(gòu)建更的系統(tǒng),進(jìn)而靈活地連接任何基于nvlink的gpu的拓?fù)浣Y(jié)構(gòu)。
*的gpu加速深度學(xué)習(xí)和hpc軟件堆棧
nvidia深度學(xué)習(xí)和hpc軟件堆棧的更新面向社群免費(fèi)提供。當(dāng)前社群共有超過82萬名注冊(cè)用戶,而一年前約為48萬。
此次更新包括新版本的nvidia cuda®、tensorrt、nccl和cudnn,以及面向機(jī)器人的全新isaac軟件開發(fā)套件。此外,通過與云服務(wù)提供商的密切合作,各大主流深度學(xué)習(xí)框架都在持續(xù)優(yōu)化,以充分利用nvidia的gpu計(jì)算平臺(tái)。
nvidia dgx-2:*性能高達(dá)每秒2 千萬億次浮點(diǎn)運(yùn)算的系統(tǒng)
nvidia新推出的dgx-2系統(tǒng)通過借鑒nvidia為所有層級(jí)的計(jì)算堆棧開發(fā)的各種業(yè)界的技術(shù)優(yōu)勢(shì),實(shí)現(xiàn)了每秒2 千萬億次浮點(diǎn)運(yùn)算的里程碑式突破。
dgx-2是*采用nvswitch的系統(tǒng),其中采用的16個(gè)gpu均共享統(tǒng)一的內(nèi)存空間。這讓獲得了相應(yīng)的深度學(xué)習(xí)訓(xùn)練能力,以處理大規(guī)模的數(shù)據(jù)集和復(fù)雜的深度學(xué)習(xí)模型。
dgx-2結(jié)合了全面優(yōu)化更新的nvidia深度學(xué)習(xí)軟件套件,旨在助力數(shù)據(jù)科學(xué)家突破深度學(xué)習(xí)研究和計(jì)算的外部極限。
dgx-2能夠在不到兩天的時(shí)間內(nèi)完成對(duì)fairseq的訓(xùn)練,fairseq是一種采用新技術(shù)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型,其性能相較于去年9月份推出的基于volta架構(gòu)的dgx-1提高了10倍。
tesla v100 32gb得到業(yè)界廣泛支持
微軟技術(shù)院士兼語音和語言業(yè)務(wù)負(fù)責(zé)人黃學(xué)東表示:“在過去幾年中,微軟和nvidia在ai技術(shù)方面的合作取得了巨大進(jìn)展,包括近在漢譯英方面的突破。借助全新tesla v100 32gb gpu,我們將能夠更快速地針對(duì)更大規(guī)模、更為復(fù)雜的ai模型進(jìn)行訓(xùn)練。這將有助于提升自身語音識(shí)別模型和機(jī)器翻譯模型的準(zhǔn)確性,使其達(dá)到人類的水平,并強(qiáng)化cortana、bing和microsoft translator等產(chǎn)品。”
sap以色列創(chuàng)新中心副總裁michael kemelmakher表示:“我們采用sap brand impact這款能夠近乎實(shí)時(shí)地對(duì)視頻中的品牌曝光率進(jìn)行自動(dòng)化分析的應(yīng)用,評(píng)估了搭載全新tesla v100 32gb的dgx-1。內(nèi)存的升級(jí)提高了我們?cè)谳^大的resnet-152模型上處理更高清晰度圖像的能力,將平均錯(cuò)誤率降低40%,進(jìn)而能夠提供準(zhǔn)確、及時(shí)且可審計(jì)的規(guī)模化服務(wù)。”
nvidia dgx 產(chǎn)品組合
dgx-2是nvidia dgx產(chǎn)品組合中的新產(chǎn)品。該組合由三個(gè)系統(tǒng)組成,旨在幫助數(shù)據(jù)科學(xué)家快速開發(fā)、測(cè)試、部署并擴(kuò)展全新的深度學(xué)習(xí)模型及創(chuàng)新成果。
dgx-2搭載16個(gè)gpu,是該產(chǎn)品陣容中的*。該系列中的其它產(chǎn)品還包括采用8個(gè)tesla v100 gpu的nvidia dgx-1系統(tǒng),以及擁有緊湊型桌邊式設(shè)計(jì)、采用4個(gè)tesla v100 gpu的首臺(tái)個(gè)人深度學(xué)習(xí)超級(jí)計(jì)算機(jī)dgx station™。這些系統(tǒng)使數(shù)據(jù)科學(xué)家能夠?qū)⒐ぷ鲝倪\(yùn)行于桌面的復(fù)雜實(shí)驗(yàn),擴(kuò)展至高難度的深度學(xué)習(xí)問題,幫助他們?nèi)ν瓿晒ぷ鳌?br>關(guān)于nvidia
nvidia(納斯達(dá)克股票代碼:nvda)是一家人工智能計(jì)算公司。它在1999年發(fā)明的gpu激發(fā)了pc游戲市場(chǎng)的增長(zhǎng),重新定義了現(xiàn)代計(jì)算機(jī)顯卡,并且對(duì)并行計(jì)算進(jìn)行了革新。近,通過將gpu作為可以感知和理解世界的計(jì)算機(jī)、機(jī)器人乃至自動(dòng)駕駛汽車的大腦,gpu深度學(xué)習(xí)再度點(diǎn)燃了全新的計(jì)算時(shí)代——現(xiàn)代人工智能。