新起之秀FPGA能否挑起並行計算大梁?
【CNETCOM 資訊】現今,我們已經進入了百億億次的大計算時代,數據量的爆發式增長、數據獲取能力的大幅提升,對計算提出了更高的需求和挑戰,大數據、雲計算、高性能計算等不同計算方式正在交叉融合,通用計算和並行計算在各自擅長的領域發揮不可替代的作用。在人工智能領域,GPU並行計算已初見成效,而能效比更優的FPGA作為新起之秀,能否挑起並行計算的大梁?
“如果無數多的猴子在無數多的打字機上隨機的打字,並持續無限久的時間,那麼在某個時候,它們必然會打出莎士比亞的全部著作!”這是1909年(nian)法(fa)國(guo)數(shu)學(xue)家(jia)波(bo)萊(lai)爾(er)在(zai)談(tan)及(ji)概(gai)率(lv)時(shi)所(suo)舉(ju)出(chu)的(de)無(wu)限(xian)猴(hou)子(zi)定(ding)理(li),而(er)這(zhe)個(ge)理(li)論(lun)應(ying)用(yong)今(jin)天(tian)時(shi),使(shi)用(yong)一(yi)台(tai)超(chao)級(ji)計(ji)算(suan)機(ji)隨(sui)機(ji)打(da)字(zi)可(ke)能(neng)更(geng)快(kuai)命(ming)中(zhong)某(mou)本(ben)書(shu)。但(dan)是(shi)這(zhe)隻(zhi)是(shi)概(gai)率(lv)的(de)問(wen)題(ti),計(ji)算(suan)機(ji)並(bing)不(bu)能(neng)分(fen)別(bie)他(ta)們(men)打(da)出(chu)來(lai)的(de)是(shi)莎(sha)士(shi)比(bi)亞(ya)的(de)文(wen)稿(gao)還(hai)是(shi)一(yi)推(tui)亂(luan)碼(ma)。讓(rang)計(ji)算(suan)機(ji)擁(yong)有(you)接(jie)近(jin)人(ren)類(lei)的(de)智(zhi)能(neng)水(shui)平(ping)是(shi)IT行業最偉大,也是最難實現的夢想,而深度學習則是通往人工智能的漫漫長路上一項重要的技術。
深(shen)度(du)學(xue)習(xi)也(ye)是(shi)很(hen)具(ju)現(xian)實(shi)意(yi)義(yi)的(de)一(yi)項(xiang)技(ji)術(shu),當(dang)擁(yong)有(you)無(wu)限(xian)多(duo)的(de)數(shu)據(ju)樣(yang)本(ben)並(bing)經(jing)過(guo)分(fen)析(xi)後(hou),計(ji)算(suan)機(ji)就(jiu)能(neng)在(zai)一(yi)定(ding)程(cheng)度(du)上(shang)模(mo)擬(ni)人(ren)類(lei)的(de)行(xing)為(wei),並(bing)按(an)照(zhao)既(ji)定(ding)的(de)目(mu)標(biao)快(kuai)速(su)完(wan)成(cheng)任(ren)務(wu)。以(yi)後(hou)的(de)計(ji)算(suan)機(ji)可(ke)能(neng)會(hui)“認識”世界上所有的人,知道這個人的姓名、住在哪裏、喜好如何,就像一個老朋友。這就是深度學習能夠實現的人物畫像,之後企業可以精準的投放廣告、可以更好的定製產品、可以控製機械臂自動生產商品、你甚至無法區分與你聊天的是機器還是人類!
但是,要讓機器能真正像人類一樣思考不僅依靠算法模型的精確,同時也需要媲美人腦計算效率的高性能計算技術。眾所周知,CPU 由(you)專(zhuan)為(wei)順(shun)序(xu)串(chuan)行(xing)處(chu)理(li)而(er)優(you)化(hua)的(de)幾(ji)個(ge)核(he)心(xin)組(zu)成(cheng),需(xu)要(yao)很(hen)強(qiang)的(de)通(tong)用(yong)性(xing)來(lai)處(chu)理(li)各(ge)種(zhong)不(bu)同(tong)的(de)數(shu)據(ju)類(lei)型(xing),同(tong)時(shi)又(you)要(yao)邏(luo)輯(ji)判(pan)斷(duan),因(yin)此(ci)需(xu)要(yao)引(yin)入(ru)大(da)量(liang)的(de)分(fen)支(zhi)跳(tiao)轉(zhuan)和(he)中(zhong)斷(duan)的(de)處(chu)理(li),它(ta)擅(shan)長(chang)的(de)是(shi)邏(luo)輯(ji)控(kong)製(zhi)和(he)通(tong)用(yong)類(lei)型(xing)數(shu)據(ju)運(yun)算(suan),就(jiu)像(xiang)一(yi)個(ge)資(zi)深(shen)的(de)老(lao)教(jiao)授(shou),360行xing樣yang樣yang精jing通tong。但dan是shi一yi個ge能neng力li再zai強qiang的de人ren,其qi精jing力li也ye是shi有you限xian的de,它ta需xu要yao一yi件jian事shi一yi件jian事shi的de處chu理li,雖sui然ran處chu理li速su度du很hen快kuai,但dan是shi任ren務wu量liang太tai大da,總zong有you些xie任ren務wu在zai排pai隊dui等deng待dai處chu理li。要yao想xiang讓rang計ji算suan能neng夠gou像xiang人ren腦nao一yi樣yang快kuai速su的de實shi現xian響xiang應ying,就jiu需xu要yao大da量liang的de計ji算suan核he心xin的de堆dui疊die,也ye就jiu是shi需xu要yao將jiang順shun序xu計ji算suan轉zhuan變bian為wei並bing行xing計ji算suan。
bingxingjisuanrangjisuanjinenggoutongshixiangyingdaliangdejisuanqingqiu,suiranwukebimiande,meigejisuanhexindejisuannenglixiangduijiangdi,jiuxiangpinyongleyiqunxiaoxuesheng,meigexueshengzhixuyaojisuanyigeshifenjiandandewenti。tamenwufaxianglaojiaoshouyiyangkuaisudechulifuzadewenti,danshimeigefuzadewentidoukeyiwuxianchaijie,zuihoudoukeyizhuanhuachengyigejiandandejisuanwenti。jugejiandandelizi,birujisuan4×4這個問題,在沒有學會乘法口訣的小孩子來說,他不能計算出結果,但是這個複雜的問題可以拆借成4+4+4+4,進而還能分解成1+1+・・・+1+1,這樣每個小孩子都可以處理其中一塊力所能及的計算,最後進行讀數的彙總即可。
目前,處理並行計算的最主流形式當屬GPU,它由數以千計的更小、更高效的核心組成,這些核心專為同時處理多任務而設計,因此能夠很好地處理高並行計算。目前高端的GPU已經做到4992個計算核心,單卡雙精度浮點運算峰值可達1.8萬億次每秒。
雖然,GPU並行計算能力強,並且高級語言的使用可使開發人員將精力集中在算法研究和實現上,但是GPU也有其應用的局限性:其成本和功耗都比較高,在工業應用或者大規模使用使會有瓶頸。因此一些企業將目標轉移到早期主要是作為數字邏輯器件使用的FPGA上。
什麼是FPGA?Field-ProgrammableGate Array的縮寫,即現場可編程門陣列,是一種半定製的IC芯片。原廠生產出的是空白的不含配置信息的FPGA芯xin片pian,用yong戶hu可ke根gen據ju自zi己ji的de需xu要yao,利li用yong片pian上shang所suo提ti供gong的de各ge種zhong資zi源yuan開kai發fa自zi己ji的de邏luo輯ji,將jiang生sheng成cheng的de配pei置zhi信xin息xi寫xie入ru,從cong而er將jiang其qi變bian成cheng自zi己ji所suo需xu功gong能neng的de芯xin片pian,FPGA可近乎不限次數反複重配。據浪潮為國內某大型互聯網公司定製的FPGA的實際測試數據顯示,一個FPGA加速卡的功耗約為20W~75W的功耗,對機房場地的適用性高,對機器散熱要求不高。而作為對比,1個GPU單元為235W~300W。因此相較於GPU,FPGA具有更高的性能功耗比,一塊中端GPU 的每瓦單精度20Gflops/W,而FPGA可以達到60Gflops/W~80Gflops/W。
雖然在實測中FPGA具有明顯的性能功耗比優勢,但是傳統FPGA開發采用Verilog、VHDL等硬件描述語言,對開發者的技術要求較為嚴苛,而浪潮希望能采用OpenCL這種高級語言和模型編程,將開發周期可大幅縮短,對於一些應用可以實現幾個人月完成,為FPGA的應用發展提供更為廣闊的平台。而浪潮擁有從萬億次到千萬億次的超級計算機產品研發、係統建設、運維服務能力,在GPU領域的技術積累將加速OpenCL實現從CPU到FPGA的遷移。
技術的實現首先源於客戶的需求,浪潮相關人員表示,目前浪潮為國內一家以搜索為主要業務之一的大型互聯網公司定製了一款FPGA卡,已經部署了近5000片,在前端用在其搜索業務,後端用於其深度學習的模型。近日SC15上,浪潮聯合全球可編程邏輯芯片巨頭Altera,以及中國最大的智能語音技術提供商科大訊飛,共同發布了一套麵向深度學習、基於AlteraArria 10 FPGA平台、采用OpenCL開發語言進行並行化設計和優化的深度學習DNN的語音識別方案,讓浪潮成為全球領先的具備GPU、MIC和FPGA三項HPC異構計算應用能力的廠商!
與FPGA生產原廠以及終端用戶的聯合研發,讓浪潮能夠實現最大限度的定製化開發,相比芯片設計,FPGA將開發周期從“年”計降低到“月”。duiyuhulianwangkehueryan,yingjianchanpindekuaisuxiangyingheshendudingzhihuajiangweiqidailaishichangdexianji。mianxiangweilai,langchaohulianwangxingyechanpinzongjiansunbobiaoshi,langchaojiangzhenduihulianwangkehudexuqiutedian,jiasuGPU、FPGA、ARM等異構計算服務器的研發進度,繼續發揮浪潮領先的定製化能力,滿足客戶快速變化的需求!





閩公網安備 35020302001891號