谷歌披露大模型能耗:一次Gemini查詢能耗僅0.24wh
08-23 07:09
大模型耗電驚人的輿論甚囂塵上,如今谷歌用硬核數(shù)據(jù)強(qiáng)勢回應(yīng)。一次Gemini查詢僅能耗0.24wh,相當(dāng)于微波爐運(yùn)行1秒,排放0.03 g CO?e,甚至比人放一次屁還少,同時消耗約5滴水。(文中數(shù)據(jù)均表示中位數(shù))
如何衡量AI消耗能源
谷歌首先指出,目前許多關(guān)于AI能源消耗的計(jì)算反映的都是理論效率,而非大規(guī)模運(yùn)行下的實(shí)際效率。全系統(tǒng)動態(tài)功率
這不僅包括主AI模型在計(jì)算過程中使用的能源和水,還考慮了大規(guī)模運(yùn)行下實(shí)際的芯片利用率,而該利用率往往遠(yuǎn)低于理論最大值。空閑計(jì)算機(jī)
為確保高可用性和可靠性,生產(chǎn)系統(tǒng)需要一定程度的預(yù)置容量,該容量處于空閑狀態(tài),但隨時可以處理流量高峰或故障轉(zhuǎn)移。這些閑置芯片消耗的能量必須計(jì)入總能源足跡。CPU和內(nèi)存
AI模型的運(yùn)行不僅依賴TPU和GPU等機(jī)器學(xué)習(xí)加速器,主機(jī)的CPU和內(nèi)存同樣在提供服務(wù)和消耗能源方面起著關(guān)鍵作用。數(shù)據(jù)中心開銷
運(yùn)行AI的信息技術(shù)設(shè)備所消耗的能源僅占整體能耗的一部分。支撐這些計(jì)算的基礎(chǔ)設(shè)施,如冷卻系統(tǒng)、配電系統(tǒng)以及其他數(shù)據(jù)中心開銷同樣會消耗能源。這部分開銷能源通常用電力使用效率(PUE)指標(biāo)來衡量。數(shù)據(jù)中心用水量
為了降低能耗及相關(guān)排放,數(shù)據(jù)中心通常會使用水進(jìn)行冷卻。隨著優(yōu)化AI系統(tǒng)以提高能源效率,其整體用水量也會隨之自然減少。通過上述更全面的指標(biāo),谷歌得出一次Gemini查詢的能耗為0.24wh,排放0.03 g CO?e,同時耗水量約5滴。為什么Gemini消耗這么低
谷歌表示,Gemini顯著的效率提升得益于其在AI開發(fā)中采取的全棧方法,從定制硬件、高效模型,到支撐這些模型運(yùn)行的強(qiáng)大服務(wù)系統(tǒng),他們在每一層都融入了效率優(yōu)化。參考鏈接:
[1]https://x.com/JeffDean/status/1958525015722434945
[2]https://cloud.google.com/blog/products/infrastructure/measuring-the-environmental-impact-of-ai-inference/
本文來自微信公眾號“量子位”,作者:關(guān)注前沿科技,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com