為適應(yīng)AI應(yīng)用,計(jì)算機(jī)芯片需進(jìn)行更多并行計(jì)算。 圖片來(lái)源:谷歌公司
科技日?qǐng)?bào)記者?劉霞
美國(guó)開(kāi)放人工智能研究中心(OpenAI)首席執(zhí)行官山姆·奧特曼等人認(rèn)為,人工智能(AI)將從根本上改變世界經(jīng)濟(jì),擁有強(qiáng)大的計(jì)算芯片供應(yīng)能力至關(guān)重要。芯片是推動(dòng)AI行業(yè)發(fā)展的重要因素,其性能和運(yùn)算能力直接影響著AI技術(shù)的進(jìn)步和應(yīng)用前景。
英國(guó)《自然》雜志網(wǎng)站在近日的報(bào)道中指出,工程師正競(jìng)相開(kāi)發(fā)包括圖形處理單元(GPU)等在內(nèi)的尖端芯片,以滿足未來(lái)AI的計(jì)算需求。
GPU加快機(jī)器學(xué)習(xí)運(yùn)算速度
GPU是英偉達(dá)公司標(biāo)志性的計(jì)算機(jī)芯片。傳統(tǒng)中央處理單元(CPU)按順序處理指令,而GPU可并行處理更多指令,因此可分布式訓(xùn)練程序,從而大大加快機(jī)器學(xué)習(xí)的運(yùn)算速度。
2022年,英偉達(dá)公司Hopper超級(jí)芯片在MLPerf上擊敗了包括圖像分類(lèi)和語(yǔ)音識(shí)別在內(nèi)所有類(lèi)別的競(jìng)爭(zhēng)對(duì)手。MLPerf是國(guó)際上最權(quán)威、最有影響力的AI基準(zhǔn)測(cè)試之一,被譽(yù)為“AI界奧運(yùn)會(huì)”。
今年3月,英偉達(dá)正式展示了性能更優(yōu)異的新一代AI芯片Blackwell。它擁有2080億個(gè)晶體管,是英偉達(dá)首個(gè)采用多芯片封裝設(shè)計(jì)的GPU。隨著技術(shù)發(fā)展,GPU變得越來(lái)越大,如果不能更大,就把更多GPU組合在一起,變成更大的虛擬GPU。Blackwell就是在同一個(gè)芯片上集成了兩個(gè)GPU,新架構(gòu)將通過(guò)芯片與芯片間的連接技術(shù),一步步構(gòu)建出更大型AI超算集群。
如果要訓(xùn)練一個(gè)擁有1.8萬(wàn)億個(gè)參數(shù)的GPT模型,需要8000塊Hopper芯片,耗能15兆瓦,歷時(shí)3個(gè)月。如果使用Blackwell芯片,只需2000塊,耗能4兆瓦,就能在同樣的時(shí)間內(nèi)完成任務(wù)。
AI芯片市場(chǎng)持續(xù)增長(zhǎng),英偉達(dá)目前供應(yīng)了其中80%以上的產(chǎn)品。2023年,該公司售出55萬(wàn)塊Hopper芯片。近日,該公司市值首次突破3萬(wàn)億美元,超越蘋(píng)果,僅次于微軟,成為全球市值第二高的公司。
多種芯片競(jìng)相涌現(xiàn)
盡管GPU一直是AI革命的核心,但它們并非是唯一“主角”。隨著AI應(yīng)用的激增,AI芯片的種類(lèi)也在激增,現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)可謂“一枝獨(dú)秀”。
FPGA是一種在計(jì)算和數(shù)字電路領(lǐng)域廣泛應(yīng)用的硬件設(shè)備。它以獨(dú)特的可編程性和靈活性,成為嵌入式系統(tǒng)、高性能計(jì)算處理等多種應(yīng)用的理想選擇。
這就像搭建樂(lè)高積木,工程師可將FPGA電路一個(gè)接一個(gè)地構(gòu)建到他們能想象的任何設(shè)計(jì)中,無(wú)論是洗衣機(jī)傳感器還是用于引導(dǎo)自動(dòng)駕駛汽車(chē)的AI。不過(guò),與擁有不可調(diào)節(jié)電路的AI芯片(如GPU)相比,F(xiàn)PGA運(yùn)行速度相對(duì)更慢、效率更低。但FPGA對(duì)處理某些任務(wù)(如粒子對(duì)撞機(jī)產(chǎn)生的數(shù)據(jù))很有用。英偉達(dá)加速計(jì)算集團(tuán)產(chǎn)品營(yíng)銷(xiāo)總監(jiān)戴維·薩爾瓦托指出,F(xiàn)PGA的易編程性也對(duì)原型設(shè)計(jì)很有幫助。
張量處理單元(TPU)則是谷歌公司專(zhuān)為神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)而定制的芯片,旨在執(zhí)行矩陣計(jì)算和張量操作。TPU作為谷歌深度學(xué)習(xí)框架TensorFlow的加速器于2016年首次推出,其設(shè)計(jì)目標(biāo)是提供低功耗、高效能的矩陣運(yùn)算,以滿足大規(guī)模機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)訓(xùn)練的需求。TPU在性能與能效之間取得了良好平衡。它們的功耗相對(duì)較低,這對(duì)于大規(guī)模數(shù)據(jù)中心和在移動(dòng)設(shè)備上的應(yīng)用至關(guān)重要。
此外,元宇宙平臺(tái)也在獨(dú)立開(kāi)發(fā)自己的芯片。谷歌、英特爾和高通成立了UXL基金會(huì),用以開(kāi)發(fā)一套支持多種AI加速器芯片的軟件和工具,以此對(duì)抗英偉達(dá)的GPU。
當(dāng)然,GPU等AI芯片的興起并不意味著傳統(tǒng)CPU的終結(jié),兩者互相取長(zhǎng)補(bǔ)短已成大勢(shì)所趨。例如,有一個(gè)版本的Blackwell芯片就讓GPU與CPU攜手;世界上最強(qiáng)大的超級(jí)計(jì)算機(jī)之一、位于美國(guó)田納西州橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室的“前沿”也依賴(lài)CPU和GPU的結(jié)合,來(lái)執(zhí)行高性能計(jì)算。
考慮到過(guò)去十年芯片領(lǐng)域翻天覆地的變化,工程師們可能很難預(yù)測(cè)芯片的未來(lái)。將來(lái)可能會(huì)研制出使用光而非電子的光學(xué)芯片,或量子計(jì)算芯片,而進(jìn)一步提升芯片性能,將加速AI在科學(xué)領(lǐng)域的應(yīng)用。