張勇親自掛帥,阿里加入大模型中國(guó)戰(zhàn)事
是大廠的游戲,但不能只是大廠的游戲。
一場(chǎng)AI大模型追逐賽,激戰(zhàn)正酣。
4月11日,阿里云旗下大模型產(chǎn)品通義千問(wèn)面世。阿里云峰會(huì)上,阿里巴巴集團(tuán)董事會(huì)主席兼CEO張勇首次以阿里云智能CEO的身份亮相,介紹了通義千問(wèn)的最新進(jìn)展。
一向以正裝公開(kāi)示人的張勇,穿了一身休閑裝,呼應(yīng)其新身份——去年年底,他宣布親自掛帥阿里云,“躬身”業(yè)務(wù)四個(gè)多月后,張勇帶來(lái)了首個(gè)待檢驗(yàn)的作品通義千問(wèn)。他表示,阿里巴巴所有產(chǎn)品未來(lái)都將接入通義千問(wèn)大模型,進(jìn)行全面改造。
ChatGPT的問(wèn)世和迭代速度,重新定義了技術(shù)變化的日新月異。在阿里之前,百度已率先“交卷”,推出基于新一代大語(yǔ)言模型研發(fā)的生成式AI產(chǎn)品文心一言,并展示了其在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成五個(gè)使用場(chǎng)景中的綜合能力。
更多不甘落后的互聯(lián)網(wǎng)大廠和創(chuàng)業(yè)者正在路上。
3月底,騰訊總裁劉熾平在財(cái)報(bào)電話會(huì)上說(shuō),騰訊正在加速推進(jìn)大模型混元;3月29日,360集團(tuán)創(chuàng)始人周鴻祎在一次活動(dòng)上預(yù)演示了360尚未正式發(fā)布的大模型應(yīng)用產(chǎn)品,他稱:“GPT是場(chǎng)新工業(yè)革命,其意義超越了互聯(lián)網(wǎng)、iPhone的發(fā)明?!?/p>
《中國(guó)企業(yè)家》從接近字節(jié)跳動(dòng)人士獲悉,字節(jié)跳動(dòng)版的ChatGPT已在內(nèi)測(cè),但內(nèi)測(cè)之后,體驗(yàn)效果不好,預(yù)計(jì)在9月上線,也有可能提前。不久前,原阿里達(dá)摩院大模型M6帶頭人楊紅霞加入字節(jié)AI lab,參與語(yǔ)言生成大模型的研發(fā),直接向副總裁楊震原匯報(bào)。
隨著時(shí)間的推進(jìn),行業(yè)的緊迫感越來(lái)越強(qiáng),節(jié)奏越來(lái)越密集,僅在4月10日這一天,就有3家公司宣布推出大模型及應(yīng)用產(chǎn)品:搜狗創(chuàng)始人王小川正式官宣入場(chǎng)大模型創(chuàng)業(yè),年底發(fā)布大模型產(chǎn)品,已獲得5000萬(wàn)美元啟動(dòng)資金;商湯宣布推出商湯日日新大模型;昆侖萬(wàn)維和奇點(diǎn)智源合作自研的國(guó)產(chǎn)大語(yǔ)言模型將于4月17日啟動(dòng)邀請(qǐng)測(cè)試。
這場(chǎng)AI大模型之爭(zhēng),讓沉寂了很久的中國(guó)互聯(lián)網(wǎng)市場(chǎng)突然變得亢奮,即使在當(dāng)年“百團(tuán)大戰(zhàn)”、生鮮電商纏斗最激烈的時(shí)刻,頭部大廠也沒(méi)有拿出“All in”押注未來(lái)的架勢(shì)。對(duì)標(biāo)ChatGPT的大模型,顯然被大廠當(dāng)作開(kāi)啟下個(gè)時(shí)代的鑰匙——誰(shuí)能最先觸摸到AI生態(tài)的潛能邊界,誰(shuí)就能掌握話語(yǔ)權(quán)。
然而,訓(xùn)練大模型并非易事,大廠和創(chuàng)業(yè)者們互相競(jìng)逐背后是一場(chǎng)財(cái)力、技術(shù)、算力、人才等資源的綜合較量。但在大廠內(nèi)部看來(lái),此輪關(guān)于大模型的創(chuàng)業(yè),如果只是一個(gè)大廠的游戲,說(shuō)明中國(guó)的創(chuàng)新還是沒(méi)有走出原來(lái)的怪圈,AI大模型創(chuàng)業(yè)應(yīng)該是一個(gè)萬(wàn)眾創(chuàng)新的游戲。
01技術(shù)、算力、人才的角逐
從發(fā)布信息來(lái)看,阿里對(duì)通義千問(wèn)的定位,已經(jīng)不局限于簡(jiǎn)單的AIGC概念上,而是如何讓AI的能力真正應(yīng)用在更實(shí)際、更多樣的場(chǎng)景上。
阿里的大模型分內(nèi)外部?jī)蓚€(gè)路線——一方面將與集團(tuán)內(nèi)部產(chǎn)品結(jié)合,可以預(yù)見(jiàn),通義千問(wèn)將對(duì)天貓、淘寶、高德、釘釘?shù)葮I(yè)務(wù)應(yīng)用帶來(lái)直接的商業(yè)價(jià)值,據(jù)了解,釘釘、天貓精靈將率先接入測(cè)試,將在評(píng)估認(rèn)證后正式發(fā)布新功能;另一方面,阿里云表示將開(kāi)放通義千問(wèn)的能力,幫助每家企業(yè)基于通義千問(wèn)打造具備自己行業(yè)能力的專屬大模型。
阿里大模型由阿里云智能CTO周靖人負(fù)責(zé),周靖人畢業(yè)于中國(guó)科學(xué)技術(shù)大學(xué),獲哥倫比亞大學(xué)計(jì)算機(jī)博士學(xué)位,曾任微軟研發(fā)合伙人,2016 年加入阿里,任阿里云首席科學(xué)家。他告訴《中國(guó)企業(yè)家》,阿里選擇在此刻公布通義千問(wèn),并非完全為了“趕時(shí)髦”。
“阿里從2019年開(kāi)始,就在投入各種各樣訓(xùn)練大模型的研發(fā)中。但ChatGPT以一個(gè)非常好的產(chǎn)品形態(tài)出現(xiàn),教育了全社會(huì),現(xiàn)在的確是一個(gè)很好的時(shí)間節(jié)點(diǎn)。如果我們?cè)谌ツ?月、10月講預(yù)訓(xùn)練大模型,也許大家都不會(huì)感興趣?!敝芫溉苏f(shuō)。
事實(shí)上,無(wú)論是阿里還是百度,能快速推出自己的大模型及應(yīng)用,都源于兩家在過(guò)往的技術(shù)積累。
2019年,百度便推出了文心大模型ERNIE 1.0。目前,ERNIE 3.0每天接受數(shù)十億次用戶的搜索請(qǐng)求,這讓文心一言能夠基于一個(gè)龐大的、高效的數(shù)據(jù)池,快速地學(xué)習(xí)和改進(jìn);阿里則于2021年連續(xù)發(fā)布語(yǔ)言大模型 Plug(后更名為AliceMind)和多模態(tài)大模型M6,去年9月,兩個(gè)大模型合并為阿里通義大模型。
再看看文心一言由的團(tuán)隊(duì)——由百度CTO王海峰出任總指揮,團(tuán)隊(duì)核心成員還包括百度集團(tuán)副總裁吳甜、百度技術(shù)委員會(huì)主席吳華等人。王海峰先后負(fù)責(zé)百度搜索、百度地圖、百度翻譯、百度智能云等業(yè)務(wù)。他同時(shí)是自然語(yǔ)言處理領(lǐng)域世界上最具影響力的國(guó)際學(xué)術(shù)組織ACL50多年歷史上首位華人主席。
除了人才外,大模型訓(xùn)練也堪稱“暴力美學(xué)”,需要有大算力、大數(shù)據(jù)和大模型,每一次訓(xùn)練任務(wù)都耗資巨大。
據(jù)《中國(guó)企業(yè)家》了解,文心一言大模型的訓(xùn)練數(shù)據(jù)包括萬(wàn)億級(jí)網(wǎng)頁(yè)數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級(jí)的語(yǔ)音日均調(diào)用數(shù)據(jù),以及5500億事實(shí)的知識(shí)圖譜等。
此外,浙商證券的一份研報(bào)指出,支撐ChatGPT算力基礎(chǔ)設(shè)施至少需要上萬(wàn)顆英偉達(dá)GPU A100,與之相對(duì)應(yīng),AlphaGO只需要8塊GPU。
這只是最低門檻。大模型的爆發(fā)會(huì)導(dǎo)致訓(xùn)練的應(yīng)用場(chǎng)景越來(lái)越多,對(duì)訓(xùn)練算力的需求會(huì)大幅增長(zhǎng),增長(zhǎng)幅度能達(dá)到10倍甚至100倍。
02 大模型帶來(lái)的產(chǎn)業(yè)變革
ChatGPT及相關(guān)的大模型應(yīng)用,除了給個(gè)人帶來(lái)工作是否會(huì)被取代的擔(dān)憂外,也給產(chǎn)業(yè)帶來(lái)很多變革。
在李彥宏看來(lái),當(dāng)人類進(jìn)入人工智能時(shí)代,IT技術(shù)的技術(shù)棧發(fā)生了根本性變化。過(guò)去基本分為三層:芯片層、操作系統(tǒng)層和應(yīng)用層。而現(xiàn)在可以分為四層:芯片層、框架層、模型層和應(yīng)用層。百度目前是在這四層進(jìn)行全棧布局的人工智能公司。
談及全棧布局,百度智能云云計(jì)算產(chǎn)品解決方案和運(yùn)營(yíng)部總經(jīng)理宋飛告訴《中國(guó)企業(yè)家》:“AI產(chǎn)品對(duì)于資源的要求越來(lái)越高,只有每一層都有自主可控的東西,才有可能縱深地做持續(xù)閉環(huán)的優(yōu)化?!?/p>
宋飛舉例,如果芯片不是自己的,你在優(yōu)化到底下硬件的時(shí)候,就是個(gè)黑盒了,能發(fā)揮的空間絕對(duì)是有限的,你有什么需求它也不一定聽(tīng)你的。如果用自己的框架,有什么需求就很快可以調(diào)整。全棧的布局和專門的優(yōu)化,是百度在基礎(chǔ)架構(gòu)的核心優(yōu)勢(shì)。
AI大模型的盛行,也在衍生眾多的商業(yè)機(jī)會(huì)。
在李彥宏看來(lái),對(duì)于大部分創(chuàng)業(yè)者和企業(yè)來(lái)說(shuō),真正的機(jī)會(huì)并不是從頭開(kāi)始做ChatGPT和文心一言這樣的基礎(chǔ)大模型,這很不現(xiàn)實(shí),也不經(jīng)濟(jì),重復(fù)造輪子是沒(méi)有意義的。而是基于通用大語(yǔ)言模型,搶先開(kāi)發(fā)重要的應(yīng)用服務(wù),“就像移動(dòng)互聯(lián)網(wǎng)時(shí)代,最成功的商業(yè)產(chǎn)品不見(jiàn)得是安卓和iOS,而是基于安卓和iOS開(kāi)發(fā)的微信、淘寶、抖音等各種超級(jí)應(yīng)用?!?/p>
阿里持相同的觀點(diǎn)。
周靖人表示,阿里將開(kāi)放通義千問(wèn)的能力,幫助每家企業(yè)基于“通義千問(wèn)”打造具備自己行業(yè)能力的專屬大模型。未來(lái)每一個(gè)企業(yè)在阿里云上既可以調(diào)用通義千問(wèn)的全部能力,也可以結(jié)合企業(yè)自己的行業(yè)知識(shí)和應(yīng)用場(chǎng)景,訓(xùn)練自己的企業(yè)大模型。比如,每個(gè)企業(yè)都可以有自己的智能客服、智能導(dǎo)購(gòu)、智能語(yǔ)音助手、文案助手、AI設(shè)計(jì)師、自動(dòng)駕駛模型等。
王海峰認(rèn)為,大模型時(shí)代將產(chǎn)生三大產(chǎn)業(yè)機(jī)會(huì):
第一類是新型云計(jì)算公司。大模型將根本性地改變?cè)朴?jì)算行業(yè)的游戲規(guī)則。之前企業(yè)選擇云廠商更多看算力、存儲(chǔ)等基礎(chǔ)云服務(wù)。未來(lái),更多會(huì)看框架好不好、模型好不好,以及模型、框架、芯片、應(yīng)用這四層之間的協(xié)同。
第二類是進(jìn)行行業(yè)模型精調(diào)的公司。這是通用大模型和企業(yè)之間的中間層,他們具有行業(yè)Know-how,調(diào)用通用大模型能力,為行業(yè)客戶提供解決方案。
第三類是基于大模型底座進(jìn)行應(yīng)用開(kāi)發(fā)的公司,即應(yīng)用服務(wù)提供商。目前,基于文本生成、圖像生成、音頻生成、視頻生成、數(shù)字人、3D等場(chǎng)景,已經(jīng)涌現(xiàn)出很多明星創(chuàng)業(yè)公司。
03 反思、挑戰(zhàn)和局限
略顯遺憾的是,目前多數(shù)中國(guó)大公司在做的大模型和基于模型的應(yīng)用,均是追隨OpenAI的腳步,而且隨著ChatGPT的驚人迭代速度,差距越拉越大。
李彥宏在接受36氪采訪時(shí)表示,百度“文心一言”在研發(fā)階段時(shí),百度技術(shù)團(tuán)隊(duì)曾與ChatGPT進(jìn)行對(duì)比測(cè)試,當(dāng)時(shí)差距是40分的水平,一個(gè)月能追得上??蛇^(guò)了一個(gè)月,技術(shù)團(tuán)隊(duì)再次測(cè)試后,發(fā)現(xiàn)差距反而拉大了。
周靖人也坦誠(chéng)承認(rèn),目前通義千問(wèn)與ChatGPT仍有差距,“GPT還是屬于各方面都領(lǐng)先的地位”。但他認(rèn)為“你追我趕”是科技進(jìn)步的必然階段,“今天別人的技術(shù)比較領(lǐng)先,我們就需要取長(zhǎng)補(bǔ)短。也許下一個(gè)階段,通義千問(wèn)也能貢獻(xiàn)自己的一系列技術(shù)創(chuàng)新”。
在此前的采訪中,周鴻祎也曾告訴《中國(guó)企業(yè)家》,其實(shí)國(guó)內(nèi)也很早關(guān)注到GPT-1,然而當(dāng)時(shí)的關(guān)注還是抱著一種實(shí)用主義的觀點(diǎn),認(rèn)為應(yīng)該找場(chǎng)景,要解決自己業(yè)務(wù)中遇到的問(wèn)題。所以,中國(guó)的人工智能都用來(lái)解決人臉識(shí)別、圖像濾鏡做得更漂亮。
“如果一個(gè)人工智能技術(shù)和自己的業(yè)務(wù)不能結(jié)合,可能就會(huì)認(rèn)為沒(méi)太大意義,所以,沒(méi)有人想到用GPT NLP的模型解決通用知識(shí)理解和推理的問(wèn)題,更沒(méi)有人想到大算力大數(shù)據(jù)做出一個(gè)大模型,能夠產(chǎn)生一種連OpenAI自己都想不到的智能化的結(jié)果?!敝茗櫟t感慨道。
當(dāng)然,中國(guó)更廣闊的市場(chǎng)需要中國(guó)自己的大模型,中國(guó)廠商也有天然的本土優(yōu)勢(shì)。只是放到中西對(duì)比這一更大維度的競(jìng)爭(zhēng),國(guó)內(nèi)大廠也有自己的局限。
周鴻祎認(rèn)為,要把ChatGPT訓(xùn)練好,要用全人類的知識(shí),一定要有開(kāi)放的思路。全世界中文網(wǎng)頁(yè)大概是其他語(yǔ)言網(wǎng)頁(yè)的1/10,書籍的數(shù)目也不足。此外,國(guó)內(nèi)移動(dòng)互聯(lián)網(wǎng)的迅猛發(fā)展,也在制造更多的數(shù)據(jù)孤島。
“國(guó)外雖然APP也取代了Web,但國(guó)外很多APP基本保留了Web版,用瀏覽器還是能在網(wǎng)頁(yè)之間跳來(lái)跳去,能夠自由使用。國(guó)內(nèi)信息都被APP私有化了,如果這些巨頭互相把握著,誰(shuí)的數(shù)據(jù)都不全,最后訓(xùn)練出來(lái)的大腦肯定能力上是比不上的?!敝茗櫟t表達(dá)了一定程度的悲觀。
事實(shí)上,除了語(yǔ)料庫(kù)之外,算力也是一個(gè)巨大的挑戰(zhàn)。2022年8月底,美國(guó)政府宣布禁止美國(guó)公司向中國(guó)(包括中國(guó)香港地區(qū))和俄羅斯出口高端GPU,設(shè)定的紅線是:算力超過(guò)4800 TOPS,且?guī)拏鬏斔俾食^(guò)600 GB/秒,受限產(chǎn)品就包括英偉達(dá)A100和后續(xù)產(chǎn)品H100。
面向未來(lái)的AI大模型,中國(guó)互聯(lián)網(wǎng)大廠還需更大的勇氣和努力,去突破算力、語(yǔ)料、人才等各種限制。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





