耗電又耗水,誰能拯救 AI 能耗之傷?
今天,以 ChatGPT 為代表的 AI 大模型在給人類社會帶來巨大變革的同時,也因為能耗問題飽受爭議。
經(jīng)濟學(xué)人最新發(fā)稿稱:包括超級計算機在內(nèi)的高性能計算設(shè)施,正成為能源消耗大戶。根據(jù)國際能源署估計,數(shù)據(jù)中心的用電量占全球電力消耗的 1.5% 至 2%,大致相當于整個英國經(jīng)濟的用電量。預(yù)計到 2030 年,這一比例將上升到 4%。
人工智能不僅耗電,還費水。谷歌發(fā)布的 2023 年環(huán)境報告顯示,其 2022 年消耗了 56 億加侖(約 212 億升)的水,相當于 37 個高爾夫球場的水。其中,52 億加侖用于公司的數(shù)據(jù)中心,比 2021 年增加了 20%。
面對巨大能耗成本,人工智能(AI)想要走向未來,經(jīng)濟性已經(jīng)成為 ChatGPT 亟待解決的現(xiàn)實問題。而如果要解決能耗問題,任何在現(xiàn)有技術(shù)和架構(gòu)基礎(chǔ)上的優(yōu)化措施都將是揚湯止沸,在這樣的背景下,前沿技術(shù)的突破或是才破解 AI 能耗困局的終極方案。
人工智能正在吞噬能源
從計算的本質(zhì)來說,計算就是把數(shù)據(jù)從無序變成有序的過程,而這個過程則需要一定能量的輸入。
僅從量的方面看,根據(jù)不完全統(tǒng)計,2020 年全球發(fā)電量中,有 5% 左右用于計算能力消耗,而這一數(shù)字到 2030 年將有可能提高到 15% 到 25% 左右,也就是說,計算產(chǎn)業(yè)的用電量占比將與工業(yè)等耗能大戶相提并論。
2020 年,中國數(shù)據(jù)中心耗電量突破 2000 億度,是三峽大壩和葛洲壩電廠發(fā)電量總和(約 1000 億千瓦時)的 2 倍。
實際上,對于計算產(chǎn)業(yè)來說,電力成本也是除了芯片成本外最核心的成本。
如果這些消耗的電力不是由可再生能源產(chǎn)生的,那么就會產(chǎn)生碳排放。這就是機器學(xué)習模型,也會產(chǎn)生碳排放的原因。ChatGPT 也不例外。
有數(shù)據(jù)顯示,訓(xùn)練 GPT-3 消耗了 1287MWh(兆瓦時)的電,相當于排放了 552 噸碳。對于此,可持續(xù)數(shù)據(jù)研究者卡斯帕 - 路德維格森還分析道:"GPT-3 的大量排放可以部分解釋為它是在較舊、效率較低的硬件上進行訓(xùn)練的,但因為沒有衡量二氧化碳排放量的標準化方法,這些數(shù)字是基于估計。另外,這部分碳排放值中具體有多少應(yīng)該分配給訓(xùn)練 ChatGPT,標準也是比較模糊的。需要注意的是,由于強化學(xué)習本身還需要額外消耗電力,所以 ChatGPT 在模型訓(xùn)練階段所產(chǎn)生的的碳排放應(yīng)該大于這個數(shù)值。" 僅以 552 噸排放量計算,這些相當于 126 個丹麥家庭每年消耗的能量。
在運行階段,雖然人們在操作 ChatGPT 時的動作耗電量很小,但由于全球每天可能發(fā)生十億次,累積之下,也可能使其成為第二大碳排放來源。
Databoxer 聯(lián)合創(chuàng)始人克里斯 · 波頓解釋了一種計算方法," 首先,我們估計每個響應(yīng)詞在 A100 GPU 上需要 0.35 秒,假設(shè)有 100 萬用戶,每個用戶有 10 個問題,產(chǎn)生了 1000 萬個響應(yīng)和每天 3 億個單詞,每個單詞 0.35 秒,可以計算得出每天 A100 GPU 運行了 29167 個小時。"
Cloud Carbon Footprint 列出了 Azure 數(shù)據(jù)中心中 A100 GPU 的最低功耗 46W 和最高 407W,由于很可能沒有多少 ChatGPT 處理器處于閑置狀態(tài),以該范圍的頂端消耗計算,每天的電力能耗將達到 11870kWh。
克里斯 · 波頓表示:" 美國西部的排放因子為 0.000322167 噸 /kWh,所以每天會產(chǎn)生 3.82 噸二氧化碳當量,美國人平均每年約 15 噸二氧化碳當量,換言之,這與 93 個美國人每年的二氧化碳排放率相當。"
雖然 " 虛擬 " 的屬性讓人們?nèi)菀缀鲆晹?shù)字產(chǎn)品的碳賬本,但事實上,互聯(lián)網(wǎng)早已成為地球上最大的煤炭動力機器之一。伯克利大學(xué)關(guān)于功耗和人工智能主題的研究認為,人工智能幾乎吞噬了能源。
比如,谷歌的預(yù)訓(xùn)練語言模型 T5 使用了 86 兆瓦的電力,產(chǎn)生了 47 公噸的二氧化碳排放量;谷歌的多輪開放領(lǐng)域聊天機器人 Meena 使用了 232 兆瓦的電力,產(chǎn)生了 96 公噸的二氧化碳排放;谷歌開發(fā)的語言翻譯框架 -GShard 使用了 24 兆瓦的電力,產(chǎn)生了 4.3 公噸的二氧化碳排放;谷歌開發(fā)的路由算法 Switch Transformer 使用了 179 兆瓦的電力,產(chǎn)生了 59 公噸的二氧化碳排放。
深度學(xué)習中使用的計算能力在 2012 年至 2018 年間增長了 30 萬倍,這讓 GPT-3 看起來成為了對氣候影響最大的一個。然而,當它與人腦同時工作,人腦的能耗僅為機器的 0.002%。
不僅耗電,而且費水
人工智能除了耗電量驚人,同時還非常耗水。
事實上,不管是耗電還是耗水,都離不開數(shù)字中心這一數(shù)字世界的支柱。作為為互聯(lián)網(wǎng)提供動力并存儲大量數(shù)據(jù)的服務(wù)器和網(wǎng)絡(luò)設(shè)備,數(shù)據(jù)中心需要大量能源才能運行,而冷卻系統(tǒng)是能源消耗的主要驅(qū)動因素之一。
真相是,一個超大型數(shù)據(jù)中心每年耗電量近億度,生成式 AI 的發(fā)展使數(shù)據(jù)中心能耗進一步增加。因為大型模型往往需要數(shù)萬個 GPU,訓(xùn)練周期短則幾周,長則數(shù)月,過程中需要大量電力支撐。
數(shù)據(jù)中心服務(wù)器運行的過程中會產(chǎn)生大量熱能,水冷是服務(wù)器最普遍的方法,這又導(dǎo)致巨大的水力消耗。有數(shù)據(jù)顯示,GPT-3 在訓(xùn)練期間耗用近 700 噸水,其后每回答 20-50 個問題,就需消耗 500 毫升水。
弗吉尼亞理工大學(xué)研究指出,數(shù)據(jù)中心每天平均必須耗費 401 噸水進行冷卻,約合 10 萬個家庭用水量。Meta 在 2022 年使用了超過 260 萬立方米(約 6.97 億加侖)的水,主要用于數(shù)據(jù)中心。其最新的大型語言模型 "Llama 2" 也需要大量的水來訓(xùn)練。即便如此,2022 年,Meta 還有五分之一的數(shù)據(jù)中心出現(xiàn) " 水源吃緊 "。
此外,人工智能另一個重要基礎(chǔ)設(shè)施芯片,其制造過程也是一個大量消耗能源和水資源的過程。能源方面,芯片制造過程需要大量電力,尤其是先進制程芯片。國際環(huán)保機構(gòu)綠色和平東亞分部《消費電子供應(yīng)鏈電力消耗及碳排放預(yù)測》報告對東亞地區(qū)三星電子、臺積電等 13 家頭部電子制造企業(yè)碳排放量研究后稱,電子制造業(yè)特別是半導(dǎo)體行業(yè)碳排放量正在飆升,至 2030 年全球半導(dǎo)體行業(yè)用電量將飆升至 237 太瓦時。
水資源消耗方面,硅片工藝需要 " 超純水 " 清洗,且芯片制程越高,耗水越多。生產(chǎn)一個 2 克重的計算機芯片,大約需要 32 公斤水。制造 8 寸晶圓,每小時耗水約 250 噸,12 英寸晶圓則可達 500 噸。
臺積電每年晶圓產(chǎn)能約 3000 萬片,芯片生產(chǎn)耗水約 8000 萬噸左右。充足的水資源已成為芯片業(yè)發(fā)展的必要條件。2023 年 7 月,日本經(jīng)濟產(chǎn)業(yè)省決定建立新制度,向半導(dǎo)體工廠供應(yīng)工業(yè)用水的設(shè)施建設(shè)提供補貼,以確保半導(dǎo)體生產(chǎn)所需的工業(yè)用水。
而長期來看,生成式 AI、無人駕駛等推廣應(yīng)用還將導(dǎo)致芯片制造業(yè)進一步增長,隨之而來的則是能源資源的大量消耗。
誰能拯救 AI 能耗之傷?
可以說,今天,能耗問題已經(jīng)成為了制約 AI 發(fā)展的軟肋。按照當前的技術(shù)路線和發(fā)展模式,AI 進步將引發(fā)兩方面的問題:
一方面,數(shù)據(jù)中心的規(guī)模將會越來越龐大,其功耗也隨之水漲船高,且運行越來越緩慢。
顯然,隨著 AI 應(yīng)用的普及,AI 對數(shù)據(jù)中心資源的需求將會急劇增加。大規(guī)模數(shù)據(jù)中心需要大量的電力來運行服務(wù)器、存儲設(shè)備和冷卻系統(tǒng)。這導(dǎo)致能源消耗增加,同時也會引發(fā)能源供應(yīng)穩(wěn)定性和環(huán)境影響的問題。數(shù)據(jù)中心的持續(xù)增長還可能會對能源供應(yīng)造成壓力,依賴傳統(tǒng)能源來滿足數(shù)據(jù)中心的能源需求的結(jié)果,可能就是能源價格上漲和供應(yīng)不穩(wěn)定。當然,數(shù)據(jù)中心的高能耗也會對環(huán)境產(chǎn)生影響,包括二氧化碳排放和能源消耗。
另一方面,AI 芯片朝高算力、高集成方向演進,依靠制程工藝來支撐峰值算力的增長,制程越來越先進,其功耗和水耗也越來越大。
那么,面對如此巨大的 AI 能耗,我們還有沒有更好的辦法?其實,解決技術(shù)困境的最好辦法,就是發(fā)展新的技術(shù)。
一方面,后摩爾時代的 AI 進步,需要找到新的、更可信的范例和方法。
事實上,今天,人工智能之所以會帶來巨大的能耗問題,與人工智能實現(xiàn)智能的方式密切有關(guān)。
我們可以把現(xiàn)階段人工神經(jīng)網(wǎng)絡(luò)的構(gòu)造和運作方式,類比成一群獨立的人工 " 神經(jīng)元 " 在一起工作。每個神經(jīng)元就像是一個小計算單元,能夠接收信息,進行一些計算,然后產(chǎn)生輸出。而當前的人工神經(jīng)網(wǎng)絡(luò)就是通過巧妙設(shè)計這些計算單元的連接方式構(gòu)建起來的,一旦通過訓(xùn)練,它們就能夠完成特定的任務(wù)。
但人工神經(jīng)網(wǎng)絡(luò)也有它的局限性。舉個例子,如果我們需要用神經(jīng)網(wǎng)絡(luò)來區(qū)分圓形和正方形。一種方法是在輸出層放置兩個神經(jīng)元,一個代表圓形,一個代表正方形。但是,如果我們想要神經(jīng)網(wǎng)絡(luò)也能夠分辨形狀的顏色,比如藍色和紅色,那就需要四個輸出神經(jīng)元:藍色圓形、藍色正方形、紅色圓形和紅色正方形。
也就是說,隨著任務(wù)的復(fù)雜性增加,神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)也需要更多的神經(jīng)元來處理更多的信息。究其原因,人工神經(jīng)網(wǎng)絡(luò)實現(xiàn)智能的方式并不是人類大腦感知自然世界的方式,而是 " 對于所有組合,人工智能神經(jīng)系統(tǒng)必須有某個對應(yīng)的神經(jīng)元 "。
相比之下,人腦可以毫不費力地完成大部分學(xué)習,因為大腦中的信息是由大量神經(jīng)元的活動表征的。也就是說,人腦對于紅色的正方形的感知,并不是編碼為某個單獨神經(jīng)元的活動,而是編碼為數(shù)千個神經(jīng)元的活動。同一組神經(jīng)元,以不同的方式觸發(fā),就可能代表一個完全不同的概念。
可以看見,人腦計算是一種完全不同的計算方式。而如果將這種計算方式套用到人工智能技術(shù)上,將大幅降低人工智能的能耗。而這種計算方式,就是所謂的 " 超維計算 "。即模仿人類大腦的運算方式,利用高維數(shù)學(xué)空間來執(zhí)行計算,以實現(xiàn)更高效、更智能的計算過程。
打個比方,傳統(tǒng)的建筑設(shè)計模式是二維的,我們只能在平面上畫圖紙,每張圖紙代表建筑的不同方面,例如樓層布局、電線走向等。但隨著建筑變得越來越復(fù)雜,我們就需要越來越多的圖紙來表示所有的細節(jié),這會占用很多時間和紙張。
而超維計算就像給我們提供了一種全新的設(shè)計方法。我們可以在三維空間中設(shè)計建筑,每個維度代表一個屬性,比如長度、寬度、高度、材料、顏色等。而且,我們還可以在更高維度的空間里進行設(shè)計,比如第四維代表建筑在不同時間點的變化。這使得我們可以在一個超級圖紙上完成所有的設(shè)計,不再需要一堆二維圖紙,大大提高了效率。
同樣地,AI 訓(xùn)練中的能耗問題可以類比于建筑設(shè)計。傳統(tǒng)的深度學(xué)習需要大量的計算資源來處理每個特征或?qū)傩?,而超維計算則將所有的特征都統(tǒng)一放在高維空間中進行處理。這樣一來,AI 只需一次性地進行計算,就能同時感知多個特征,從而節(jié)省了大量的計算時間和能耗。
另一方面,找到新的能源資源解決方案,比如,核聚變技術(shù)。核聚變發(fā)電技術(shù)因生產(chǎn)過程中基本不產(chǎn)生核廢料,也沒有碳排放污染,被認為是全球碳排放問題的最終解決方案之一。
2023 年 5 月,微軟與核聚變初創(chuàng)公司 Helion Energy 簽訂采購協(xié)議,成為該公司首家客戶,將在 2028 年該公司建成全球首座核聚變發(fā)電廠時采購其電力。并且,從長遠來看,即便 AI 通過超維計算燈實現(xiàn)了單位算力能耗的下降,核聚變技術(shù)或其他低碳能源技術(shù)的突破可以依然使 AI 發(fā)展不再受碳排放制約,對于 AI 發(fā)展仍然具有重大的支撐和推動意義。
說到底,科技帶來的能源資源消耗問題,依然只能從技術(shù)層面來根本性地解決。技術(shù)制約著技術(shù)的發(fā)展,也推動著技術(shù)的發(fā)展,自古以來如是。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com