大型開源還是閉源好,周鴻祎和李彥宏針對(duì)麥芒。
開源模型還是閉源模型,誰是“版本答案”?圍繞這個(gè)問題,360創(chuàng)始人周鴻祎和百度創(chuàng)始人李彥宏最近進(jìn)行了一場空談。
首先,4月12日,有媒體曝光了李彥宏在百度內(nèi)部的演講。其中,他認(rèn)為閉源大模型在能力上會(huì)繼續(xù)領(lǐng)先,而不是暫時(shí)領(lǐng)先,開源大模型的運(yùn)行模式與傳統(tǒng)開源軟件不同,不是人心齊泰山移。閉源是一種真正的商業(yè)模式,可以賺錢。只有賺錢,才能聚集計(jì)算能力和人才。
Createateate隨后于4月16日舉行 李彥宏在2024百度AI開發(fā)者大會(huì)上聲稱,“開源模式將越來越落后”。
就在兩天后的第27屆哈佛中國論壇上,自稱開源教徒的周鴻祎站出來反對(duì)?!拔乙恢毕嘈砰_源的力量。至于網(wǎng)上的一些名人胡說八道,不要上當(dāng)。他說開源不如閉源?就連說這話的企業(yè)也是借助開源的力量成長到今天的?!?/p>
事實(shí)上,在國內(nèi)市場上,大型開源、閉源并非一個(gè)技術(shù)問題。無論是閉源還是開源,這些大模型的客觀性能都不如海外同類產(chǎn)品,他們也不是模型技術(shù)的領(lǐng)導(dǎo)者。而且單純在技術(shù)層面,目前閉源大模型在能力上處于領(lǐng)先地位,比如OpenAIGPT-4、AnthropicClaude-3、Gemini,谷歌 Ultra都是閉源,國內(nèi)情況也是如此。百度的文心話、阿里的通義千問、字節(jié)跳動(dòng)的云雀、月亮暗面的Kimi等大模型都是閉源。
周鴻祎認(rèn)為,開源模型為整個(gè)社區(qū)提供了一個(gè)共享、合作和創(chuàng)新的平臺(tái),促進(jìn)了技術(shù)的不斷發(fā)展。開源社區(qū)聚集的工程師和科學(xué)家數(shù)量是閉源的數(shù)百倍。因此,今年的開源模型僅用了一年時(shí)間就已經(jīng)超過了GPT-3.5的能力。然而,具體情況遠(yuǎn)沒有他說的那么樂觀。事實(shí)是,開源模型在模型能力和產(chǎn)品著陸維度上一直落后于閉源模型。
盡管Llamamama剛剛在Meta發(fā)布。 3的確做到了GPT-3.5的性能優(yōu)于GPT-3.5,但是問題是沒有人會(huì)認(rèn)為Llama 三是開源社區(qū)的產(chǎn)物,畢竟它的核心開發(fā)力量自始至終都來自Meta。
事實(shí)上,考慮到李彥宏和周鴻祎已經(jīng)遠(yuǎn)離前線,他們對(duì)大模型開源和閉源的看法可能不是技術(shù)路線的矛盾。所以有人認(rèn)為,一方支持閉源,另一方相信開源的力量,其實(shí)更像是各自利益的驅(qū)動(dòng)。
其實(shí)周鴻祎支持開源模型的原因很簡單。畢竟在今天的“百模對(duì)決”中,360智能大腦還處于追趕者的地位,在用戶數(shù)量和行業(yè)知名度上都不如互聯(lián)網(wǎng)巨頭推出的文心、通義千問等大模型。
在360開源360智能大腦7B模型之前,我們已經(jīng)說得很清楚了,“沒有必要重復(fù)制造輪子”,這意味著AI企業(yè)家不需要自己開發(fā),只需要直接使用開源360智能大腦的能力??v觀軟件行業(yè)的發(fā)展歷史,商業(yè)公司通過開源獲得某一軌道的主導(dǎo)權(quán)其實(shí)是一個(gè)非常經(jīng)典的操作。比如谷歌依靠開源,讓Chromium生態(tài)統(tǒng)一PC瀏覽器市場。
從某種意義上說,周鴻祎的360開源實(shí)際上是對(duì)Meta開源Llama的復(fù)制。既然自稱是開源教徒的周鴻祎有私心,堅(jiān)持閉源大模型更好的李彥宏其實(shí)也有自己的小算盤。
在向開源模型潑冷水的同時(shí),李彥宏還表示,“大模型本身并沒有直接創(chuàng)造財(cái)富,基于大模型開發(fā)的AI應(yīng)用程序可以滿足真實(shí)的市場需求。這是百度根據(jù)過去一年的實(shí)踐,踩了無數(shù)個(gè)坑,交了很高的學(xué)費(fèi)?!?/p>
這句話的言外之意將與他一年前的公開演講聯(lián)系在一起。在去年夏天的世界互聯(lián)網(wǎng)大會(huì)數(shù)字文明尼山對(duì)話中,李彥宏曾在主題演講中表示:“新的國際競爭戰(zhàn)略要點(diǎn)不是一個(gè)國家有多少大模型,而是你的大模型有多少原始的AI應(yīng)用,這些應(yīng)用在多大程度上提高了生產(chǎn)效率?!?/p>
在這個(gè)不同時(shí)期的類似解釋背后,其實(shí)李彥宏想勸阻大模型企業(yè)家,希望他們直接加入百度的AI生態(tài)。百度的自信來自于文心的言論,基于更多的算率、更多的數(shù)據(jù)和更強(qiáng)的算法,依托飛槳平臺(tái),從文心3.0。、從3.5到4.0,文心大模型的能力也在逐步提升。
與一年前相比,文心大模型的算法訓(xùn)練效率提高到原來的5.1倍,平均每周訓(xùn)練效率達(dá)到98.8%。、推理性能提高了105倍,推理成本降低了原來的1%。
此前,百度CTO王海峰曾透露,文心一言累計(jì)用戶數(shù)量已達(dá)2億,日均調(diào)用量也已達(dá)2億;飛槳文心生態(tài)已匯聚1295萬開發(fā)者,服務(wù)24.4萬家企事業(yè)單位,基于飛槳和文心建立了89.5萬個(gè)模型,使用千帆平臺(tái)開發(fā)的AI原生應(yīng)用數(shù)量更是超過19萬個(gè)。
所以百度想要的其實(shí)是像OpenAI一樣建立AI生態(tài),以文心為支點(diǎn)進(jìn)行平臺(tái)化。這樣,百度希望大型賽道的參與者越少越好。企業(yè)家一旦開發(fā)AI應(yīng)用,而不是大模型,自然可能會(huì)重復(fù)原來的App。 Store的故事。
百度多年來一直在AI領(lǐng)域投資,無疑是國內(nèi)AI模型的先鋒,AI領(lǐng)域的增量收益也體現(xiàn)在2023年的財(cái)務(wù)報(bào)告中,但平方根并不大。因此,對(duì)于幾乎錯(cuò)過了整個(gè)移動(dòng)互聯(lián)網(wǎng)時(shí)代的百度來說,鞏固自己的AI生態(tài),提高AI業(yè)務(wù)的貨幣化能力,無疑是當(dāng)前的重中之重。而且相對(duì)于自己做商品,做應(yīng)用商城來“收稅”顯然是個(gè)不錯(cuò)的選擇。
歸根結(jié)底,大模型是開源好還是閉源好,目前技術(shù)層面還沒有區(qū)別,但閉源或開源針對(duì)不同企業(yè)的利益各有利弊。
本文來自微信微信官方賬號(hào)“三易生活”(ID:IT-作者:三易菌,36氪經(jīng)授權(quán)發(fā)布,3eLife)。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com