還可以免費翻轉(zhuǎn)GPT-4,Meta打了所有閉源大廠的臉。
不知李彥宏現(xiàn)在的心情如何。
正當他明確表示“開源模型會越來越落后”的時候。 3 天后,活菩薩小扎慢慢地出現(xiàn)了。
一點也不給面子,用自己的力量掀翻了桌子。
近日, Meta 全新的正式發(fā)布 Llama 3 模型,又一次上新了 8B 和 70B 兩個參數(shù)版本。
其訓(xùn)練數(shù)據(jù)集比 Llama 2 整整大了 7 倍,達到了 15T ,支持能力也是上一代的兩倍, 8K 前后文長度。
現(xiàn)在,他們已經(jīng)接入了 Meta 最近發(fā)布的智能助手 Meta AI 中,每個人都可以免費使用。
兩種模式同樣全面開源,開發(fā)者可免費下載,并用于商業(yè)用途。 (但需要注意的是,如果MAU超過7億,則需要申請?zhí)厥馍虡I(yè)許可證)
小扎這是誓死要在開源這條路上,一條路走向黑暗。
當然更加爆裂的是 Llama 3 除了穩(wěn)居開源大模型第一外,其實力還可以在一定程度上,薄紗 Gemini Pro 1.5 、 Claude 3 Sonnet 等待位于第一梯隊的閉源大模型。
一些網(wǎng)民更新了一個當前大模型能力與參數(shù)對應(yīng)的表格,可以看到 Llama 3 這兩個模型的表現(xiàn)都很亮眼。
這樣,就算是大模型的開源派大漲了一波斗志。
總而言之,消息一出來,開源社區(qū)立刻沸騰起來,各種梗圖滿天飛,謝謝小扎又帶著兄弟們沖了一次。
然而,世超認為既然模型已經(jīng)上線,看到再多的技術(shù)細節(jié)和跑分數(shù)據(jù),都不如我們自己去嘗試。
有點遺憾的是,目前傳出的這兩個版本,還沒有辦法支持中文導(dǎo)出。
暫時只有兩個簡單的功能:文字對話和繪圖。如今,每個家庭的多模式都被拋光了。 OUT 了。
但幸運的是,這次 Meta 圖片導(dǎo)出,有一個非常新穎的功能。我們在聊天框中輸入文字,不需要發(fā)送, Llama 3 然后根據(jù)內(nèi)容即時生成圖像。
例如,我在對話框中輸入了幾次【一只貓在睡覺、跳舞、跳舞】,我可以看到屏幕上產(chǎn)生的圖片內(nèi)容正在立即改變。
在文字導(dǎo)出這里,驚喜度并不高。
因為它在測試中,說自己在編程、多選題等方面,都趕上了 Claude 3 中型版本,我們也重點測量了這方面的虛實。
世超測試了很多問題,這里也只釋放了兩邊不同的區(qū)域。
比如簡單的邏輯判斷:我今天有 3 一個蘋果,昨天吃了一個,今天還剩多少?
Llama 3 完全沒有壓力,容易控制。
但是把同樣的問題拋給 Claude 3 ,但是完全繞進去了。
然而,后邊世超后面簡單地測量了幾個代碼能力,相反, Claude 3 這種表現(xiàn)更令人驚嘆。
世超要求 Llama 3 給我做兩件簡單的事 html 游戲。
因此,貪吃蛇和玩磚游戲都無法正常工作。在游戲開始之前,顯示 Game Over 了。
但 Claude 3 這兒做的,雖然有點小瑕疵,但是游戲重新開始后,結(jié)果就不會刷新了。但是除此之外,都很完美,游戲可以正常運行。
而且生成速度很快,幾秒鐘就能完成。上次看到這個速度,還是 GPT-4 。
而且在后來的開題中, Llama 3 然后立刻扳回了一座城市。
世超給出了一個開放的問題:類人機器人的未來會是什么樣子?
幾個字的小問題, Llama 3 根據(jù)短期、中期和長期,分三個階段構(gòu)思概率。
由于篇幅有限,這里只截取了短期。
Claude 3 這兒有點平淡無奇,與上面分時、分點列舉的優(yōu)等生相比,遜色不少。
經(jīng)過整體測試,Llama 3 和閉源的 Claude 3 基本上打得有來有回,甚至在某些方面小勝。
但是如果只能達到這種程度, Meta 這次更新根本無法在圈內(nèi)掀起如此大的風暴。
這兩種模式并不重要,真正的牛叉區(qū)域,是網(wǎng)站上提到的一條信息:400B 參數(shù)級的 Llama 3 正在進行訓(xùn)練準備。
根據(jù)紙面上的各種數(shù)據(jù),它在各個方面都是可怕的。
Llama 商品副總裁 Ragavan Srinivasan 根據(jù)一次采訪,當前版本可以與同類一流的專業(yè)模式相媲美。
不但達到了可比性,許多功能性能更強, Claude 3 超大杯版本和 GPT-4 。
雖然 Meta 感覺還要評估一下安全性,再決定開不開源,但是消息一出,行業(yè)早就開始狂歡了。
因為開源社區(qū)的人,或許不用等OpenAI拾起初衷,就可以到GPT-4級模型進行調(diào)試、魔改。
英偉達科學家直接發(fā)文稱,400B小扎 模型,將是這個行業(yè)有一個分界點,這將改變許多企業(yè)和研究的未來。
前百度首席科學家、谷歌大腦鼻祖吳恩達也表示,這次Meta更新的是他。到目前為止,我收到了最好的生日禮物。
顯而易見, Llama 3 給行業(yè)帶來的震撼。
目前,這個 400B 最終版本有望在夏天發(fā)布。
OpenAI不再使力,Llama 3 以開源大模型為代表,完全超車閉源大模型的歷史時刻,也許真的要來了。
而早在 Llama 3 在發(fā)布之前,大模型是開源牛還是閉源好的問題,其實早就吵得不可開交了。
兩邊的陣營都不缺大佬,李彥宏所說的“開源模式會越來越落后”,世超覺得邏輯上很自洽。
因為閉源企業(yè)有成熟的商業(yè)模式,更多的資金和人力投入到研究中,他們努力研發(fā)的成果也可以得到保護。簡而言之,如果你能賺錢,你就能收集結(jié)算率和人才。
另一方面,很多開源模式,不僅商業(yè)模式還在探索中,有些還是小規(guī)模零散的商品。
月亮暗面的楊植麟也發(fā)表了類似的觀點,說大部分都是基于開源大模型的應(yīng)用。沒有大計算能力的驗證,很難說他們未來的性能穩(wěn)定性和可擴展性。
而且支持開源的這一派,世超也覺得不是沒有道理。朱嘯虎曾表達過一種觀點,目前閉源確實領(lǐng)先于開源,但是開源模型最終會趕上。
“OpenAI 就一兩百名工程師而言,全球數(shù)百萬、數(shù)千萬的開源工程師都在使用,怎么可能一直比非開源落后?”
開源社區(qū)用了一年時間,超過了 GPT-3.5 ,現(xiàn)在已經(jīng)到了 GPT-4 水準?,F(xiàn)在 Llama 3 等待模型的大力趕超,正在不斷地驗證這個句子。
幾年前,比爾蓋茨公開吐槽。 Linux 系統(tǒng)化。感覺從商業(yè)角度來看,它根本不可行,既不能保護自己的知識產(chǎn)權(quán),又不能賺取利潤從事研發(fā),最多是個半吊子。
喬布斯也在《喬布斯傳》中提到,喬布斯也怒不可遏,隔壁安卓就是這樣。 shit ,感覺它的開源給它帶來了各種各樣的麻煩。
最后兩個超級大佬都被打臉了。。。甚至在比爾蓋茨之后,公開承認微軟在偷學。 Linux ,而且安卓一點也不比 iOS 差。
而且世超認為,很有可能大模型的開源閉源之間,根本不是你死我活,不是誰強誰就一定弱。
例如谷歌,基本上是雙手抓,既有閉源的。 Gemini ,也有開源的 Gemma 。曾經(jīng)靠開源出圈 Mistral 拿到微軟投資之后,它的 Mistral Large 就不再對外開源了。
所以開源和閉源很可能只是路線的不同,哪有對錯,只有是否合適。
而且唯一可以肯定的是,無論你是開源還是閉源,燒錢都逃不掉,不管是開源還是閉源, OpenAI 后面的微軟,還是 Llama 背后的 Meta ,亦或是國內(nèi) BAT ,大型戰(zhàn)場仍然是這群頂級資本之間的斗爭。
讓我們搬好小板凳,磕著瓜子繼續(xù)吃瓜。
圖片,資料來源
X、Meta AI、Claude 3、Huggingchat
Meta:Introducing Meta Llama 3: The most capable openly available LLM to date、Meet Your New Assistant: Meta AI, Built With Llama 3
The Verge:Meta’s battle with ChatGPT begins now
騰訊新聞《潛望》:朱嘯虎講述了一個中國現(xiàn)實主義AIGC故事
As Meta debuts its Llama 3 model, today’s generative AI landscape is a different animal
本文來自微信微信官方賬號“差評”(ID:作者:四大,編輯:江江&面線,36氪經(jīng)授權(quán)發(fā)布,chaping321。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com