李彥宏不寒酸:不賺錢,為什么要做大模型?
在商業(yè)談判中,只要不被利益蒙蔽雙眼,就無可非議,因為利益對自己的產(chǎn)品和技術(shù)路線有很強的站臺。對于李彥宏和他的百度來說,顯然是一樣的。它既沒有發(fā)布會上宣傳的“讓每個人都成為開發(fā)者”的崇高,也沒有周鴻祎反駁中的“胡說八道、忽悠”。
一個行業(yè)領(lǐng)袖對技術(shù)路線的肯定甚至“拉踩”,其影響,也許會遠遠超出公眾的預測。
"開源模型將越來越落后."Create 在2024百度AI開發(fā)者大會上,一位身穿白色衣服的百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏肯定說:“以前大家都覺得開源便宜。事實上,在模型場景中,開源是最貴的?!?/p>
這是Robin在幾天內(nèi)向大型開源模型潑下的第二瓶冷水——在4月11日之前,李彥宏在內(nèi)部信中也表示,大型開源模型意義不大。
作為中國早期的大模型,百度去年3月發(fā)布了文心的大模型,選擇走閉源路線。在過去的一年里,文心的大模型已經(jīng)迭代到現(xiàn)在的4.0。
李彥宏的觀點在業(yè)內(nèi)引起了很大的爭議,他認為作為其他國家的AI通道者,他不應該如此武斷。畢竟開源創(chuàng)新幾乎是每個開發(fā)者都認可的,整個互聯(lián)網(wǎng)都是建立在開源的基礎上的,這樣信息世界才能暢通無阻。
因此也有不少現(xiàn)場新聞人猜測,李彥宏是否屬于暗喻或diss行業(yè)的其它閉源模式。
“百模對決”如火如荼,行業(yè)領(lǐng)袖的最終對決成為常態(tài)。比如百川智能創(chuàng)始人兼首席執(zhí)行官王小川,今年3月因為李彥宏的“文心4.0”在中文處理上已經(jīng)超越了ChatGPT。 “4.0”的聲明,多次與百度高管互嗆。
360創(chuàng)始人周鴻祎自稱是“開源教徒”,到目前為止已經(jīng)連續(xù)兩次在公共場合炮轟李彥宏(4月13日和4月18日)。他指出,沒有開源,就沒有Linux。、沒有因特網(wǎng),“開源不如閉源好是胡說八道,是個傻瓜,連說這話支持閉源的企業(yè)都是靠開源發(fā)展起來的?!?/p>
值得一提的是,百川智能和360都是大型開源模型。大模型開合源之爭早已成為業(yè)內(nèi)兩派爭論的話題。自去年7月以來,Llama 在馬斯克最近起訴OpenAI,要求OpenAI恢復開源并給予賠償后,宣布開源可以直接商業(yè)化已經(jīng)開始,引起了廣泛的爭論。
所有技術(shù)路線爭議的終點,都是需要商業(yè)化賺錢。大型模型加速商業(yè)化后半段,對“all in“對于人工智能百度來說,不言而喻,作為中國最早使用通用大模型會員支付模式向C端用戶收費的公司,依靠大模型賺錢的迫切想法。——在之前的內(nèi)部信中,李彥宏說得很直接:閉源才有真正的商業(yè)模式。只有這樣,我們才能真正賺錢,我們才能賺錢,我們才能匯聚算率和人才。
從這個角度來說,如果不賺錢,為什么還要做大模型?這并不可怕。但問題是,只選擇開閉源的任何一條路面,是否處于極端?開源真的落后于閉源嗎?閉源真的能代表大模型“商業(yè)化”的方式嗎?
01 開源一直領(lǐng)先于閉源?
對李彥宏來說,無論是技術(shù)還是商業(yè)模式,閉源模式都將繼續(xù)領(lǐng)先,而非一時領(lǐng)先。
TechTarget在一篇文章中解釋了開源和閉源的區(qū)別。開源代表公開的AI模型、訓練數(shù)據(jù)和底層代碼,而閉源則隱藏或保護其中一個或多個。
可以簡單理解為開源模型注重開放性、共享性和合作性,促進大模型創(chuàng)新;閉源代表著源代碼只用于企業(yè)的修改和開發(fā),但可以更好地保護利益和技術(shù)優(yōu)勢。
就陣營而言,開源陣營遠遠大于閉源。當前國內(nèi)外大型行業(yè),閉源主要采用OpenAI GPT、以百度文心一言為代表,開源是Meta旗下的Llama(羊駝)、馬斯克旗下 xAI 企業(yè)的 Grok-1、國內(nèi)阿里通義千問、百川智能、360、昆侖萬維,智譜AI等。在這些企業(yè)中,有不少企業(yè)選擇“兩條腿走路”,既做開源又做閉源。
從普通用戶應用/實用化的知名度來看,閉源目前無疑領(lǐng)先于開源。李彥宏的核心觀點之一是,無論是中國還是美國,目前最強的基礎模式都是閉源。
目前,OpenAI讓很多大模型感到絕望。2019年GPT-2發(fā)布時,它仍然是開源。從GPT-3到閉源,推出“核爆”聊天機器人ChatGPT后,震驚了世界。
起初,OpenAI也發(fā)表了論文,但是到了GPT-3.5、GPT-4.連算法、路線、論文都“避而不談”。今年年初推出Sora時,明確表示不分享技術(shù)實現(xiàn)細節(jié),只提供模型設計理念及其“酷”效果展示。
毫無疑問,這兩年大型跑道的繁榮很大程度上歸功于OpenAI的推動——如果沒有ChatGPT,就不會有那么多科技企業(yè)加入大型跑道,也不會有百花齊放、百家爭鳴的行業(yè)形態(tài)。
在中國,文心的話是閉源的代表。根據(jù)李彥宏最新發(fā)布的數(shù)據(jù),文心的用戶數(shù)量和API的日均調(diào)用量已經(jīng)超過2億。百度最初在模型跑道上建立了自己的AI生態(tài)。
這一年特別火爆,造成大模型巨頭“圍剿”的初創(chuàng)公司月之暗面旗下產(chǎn)品Kimi,也是閉源大模型。
在大模型炒作的背景下,以上簡單易用,面向To。 C的閉源大模型可謂眾所周知,目前已成功占據(jù)市場主導地位——但未來能否保持當前的優(yōu)勢尚未確定。
Llamama大受好評。 二是開源逐漸成為大模型的主流趨勢,其進化速度越來越快,迅速成為大模型競爭的重要一極。
三月底,在Grok-1公開后幾天,基于混合專家的基礎上,創(chuàng)業(yè)公司Databricks公布了其開源大型DBRX。(MoE)在語言邏輯、編程、數(shù)學和邏輯等標準產(chǎn)業(yè)中,架構(gòu)打敗了Llama2-7B、Mixtral 還有Grok-1。在編程方面,綜合性能超過GPT-3.5,更容易擊敗GPT-3.5。
根據(jù)最新消息,Meta將于下個月發(fā)布Llama 支持多模態(tài)處理。到時候,Llama 或者將超越DBRX的能力直接與GPT-4進行比較,再現(xiàn)后者的大部分能力。
許多業(yè)內(nèi)人士認為,如果沒有意外,Meta將遵循Llama。 2路線,Llama 3大量細節(jié),如培訓數(shù)據(jù)、培訓方法、數(shù)據(jù)標注等。,已經(jīng)公布,成為“每個人都可以獲得模型權(quán)重的最強大的語言模型”。同樣,DBRX為開放社區(qū)和企業(yè)提供了僅限的封閉模型API功能。
過去,閉源大模型具有“遙遙領(lǐng)先”的參數(shù)值?,F(xiàn)在開源模型參數(shù)越來越大,DBRX參數(shù)達到1320億,Grok達到3140億,Llama 3估計其大規(guī)模版本的參數(shù)可能超過1400億。4月17日,國內(nèi)昆侖萬維還宣布開源4000億參數(shù)的大型天工3.0,成為全球最大的開源模型,號稱超越GPT-4V。盡管與閉源大模型萬億參數(shù)相比還有一段距離,但是追求速度越來越快。所以谷歌工程師說,谷歌沒有環(huán)城河,OpenAI也沒有。
對于許多大型開源模型,特別是中國大型跑道創(chuàng)業(yè)者來說,拉平理解的Llama,其實比GPT更重要。許多行業(yè)和垂直模型都是通過微調(diào)或修改Llama等大型開源模型來實現(xiàn)的?!叭绻麤]有Llama,國內(nèi)大型模型的整體水平會被海外甩在后面?!?/p>
周鴻祎和金沙江風險投資主管合伙人朱嘯虎認為,開源社區(qū)聚集的工程師和科學家數(shù)量是閉源的數(shù)百倍,借助全球技術(shù)水平,實現(xiàn)迭代、感受改善和生態(tài)擴張?!伴_源很快就會超過閉源?!?/p>
但是李彥宏并不認同這一說法,他指出大型開源和Linux、Android不一樣,其實最重要的開發(fā)者就是Meta,“并非真正的大家一起開發(fā)的產(chǎn)品。”
02 開源費用真的比閉源貴嗎?
馬斯克和OpenAI之間發(fā)生了最激烈的對抗。2016年,馬斯克仍然是OpenAI的創(chuàng)始人、投資者和聯(lián)合首席執(zhí)行官,現(xiàn)在已經(jīng)完全走向了決裂。
自從ChatGPT發(fā)布以來,馬斯克多次嘲諷OpenAI,切斷了OpenAI對推特的數(shù)據(jù)訪問限制,并于今年2月起訴OpenAI和山姆·奧特曼,理由是OpenAI違反了造福人類非營利的宗旨。
總的來說,隨著兩派對抗態(tài)度的日益強烈,沒有人能說服任何人。開源陣營認為,開源更容易創(chuàng)新,更容易被大眾理解和監(jiān)督。閉源是保守主義,容易集中權(quán)力,壟斷市場和數(shù)據(jù),AI技術(shù)發(fā)展會落后。
閉源陣營認為,開源模型是一個外殼,存在濫用風險,不能基于此進化,影響了一些公司的商業(yè)策略,尤其是注重安全隱私的公司。
但從李彥宏的角度來看,開源模式會越來越落后,核心論點是成本更高——這是行業(yè)最新的爭議點。畢竟開源成本低甚至免費,開源成本不等于邏輯上的技術(shù)路線。
李彥宏的依據(jù)是,基于文心大模型4.0的“小模型”將比直接用開源模型調(diào)整模型更好,在同等尺寸下效果明顯更好。同等效果下,成本明顯更低。
這個說法有些道理,之前有業(yè)內(nèi)人士在X平臺上表示,Grok-1沒有微調(diào)特定任務,普通用戶使用它的基本門檻也不低。如何開源,什么可以開源,開源到什么程度,還有待實際回應。
但也有中小開發(fā)者表示,雖然Llama2的R&D和使用還沒有完全向所有公眾開放,但對中小開發(fā)者也非常友好。只需要一個PC就可以用零代碼微調(diào)大模型,不會花很多錢,性能也不差。
事實上,業(yè)界公認的是,目前大模型技術(shù)路線還不成熟,包括ChatGPT在內(nèi)的三星機密信息也發(fā)生了嚴重泄露。開源閉源各有利弊,“兩條腿走路”是目前大多數(shù)企業(yè)的選擇,即構(gòu)建一系列AI模型,既有閉源又有開源。
比如130億元的微軟投資了OpenAI,但是開源ONNX也有所擴大。 Runtime的投資,以及開源Phi大模型的結(jié)局;谷歌也堅持從過去開始下注關(guān)閉源頭。今年2月,“開源”模型突然推出。 Gemma,對OpenAI和Llama進行雙線作戰(zhàn)。
在中國,有更多的大型模型可以考慮開源和閉源。比如阿里通義千問,雖然主要是開源,但也有閉源模式,去年12月推廣到2.1版。包括百度在內(nèi)的也是如此。去年發(fā)布的文心千帆大模型平臺2.0接入了包括Llama2在內(nèi)的30多個主流大模型和眾多開源大模型。
可以說,沒有大的開源模型,百度的智能云生態(tài)就沒有今天的完善。根據(jù)最新數(shù)據(jù),文心千帆大模型生態(tài)合作伙伴數(shù)量在過去半年有所增加。 5 倍,API 調(diào)用指數(shù)級增長,超過85,000客戶,超過300款進入千帆應用市場。對于這些用戶和開發(fā)者來說,表面上是文心一言,實際使用的也很可能是Llama2等開源模式。
在這種情況下,為什么李彥宏還要多次肯定,大型開源模型將永遠落后?
有業(yè)內(nèi)人士認為,這可能與百度目前大模型的戰(zhàn)略定位,以及需要對產(chǎn)品工具進行宣傳和背誦密切相關(guān)。
在那之后,每個人都是開發(fā)者。Create 會上,李彥宏在給出AI時代答案的同時,還發(fā)布了三大AI“開發(fā)神器”,被廣泛宣傳?!狝gentBuilder、AppBuilder、ModelBuilder,在百度系統(tǒng)中包括所有個人、公司和開發(fā)者,加快占領(lǐng)應用門戶,甚至通過基本模型獲取AI,構(gòu)建中國最強大的模型生態(tài)“欲望”。
“如果開源大模型開放且逐漸強大,有多少人愿意把錢送到閉源大模型,甚至加入被控制的生態(tài)模型?”一位網(wǎng)友評論說,長期以來,全球開發(fā)者對蘋果iOS封閉生態(tài)系統(tǒng)的“霸道”行為感到不滿,但又無可奈何。
03 用大模型賺錢,百度跑在前面
實際上,在模型的后半部分,探索商業(yè)化路徑已經(jīng)成為每個玩家迫切需要選擇的問題。
在這方面,李彥宏相當誠實,說百度之所以堅持關(guān)閉源頭,是因為市場上有足夠的開源。百度要想開源,必須自己維護一套開源版,從成本上來說非常不劃算。更重要的是,閉源有真正的商業(yè)模式,可以賺錢。
目前大型模型如何商業(yè)化,或賺錢?盡管各大模型仍在探索ToB或ToC的不同路徑,但重點布局方向是“脫虛向?qū)崱保瑑A向于“應用為王”。
從李彥宏、周鴻祎或其他行業(yè)領(lǐng)袖、專家的觀點來看,這一點已經(jīng)成為共識。
如何實現(xiàn)大模型商業(yè)化的答案,“all in"態(tài)度百度可以稱之為行業(yè)樣本,在國內(nèi)跑在前面。
B端,構(gòu)建“文心千帆”一系列商業(yè)矩陣,通過調(diào)用API調(diào)整,為客戶的商品嫁接文心大模型能力,實現(xiàn)收益。
這一收費方式可簡單理解為,模型租賃。360、通用大模型,如阿里通義千問、騰訊混合元、科大訊飛星火等。,以及更多行業(yè)大模型也有類似的嘗試。但目前大模型工具推動千行百業(yè)生產(chǎn)力進步還需要一個過程,門檻更高(比如針對各行各業(yè)的定制服務)?;趖okens(“字”或“字”)的ROI(投入產(chǎn)出率)并不高,更多的是通過API綁定。向顧客出售云、廣告等其它服務。
李彥宏曾在2023年財務報告會上披露,去年Q4百度智能云總收入84億元,其中大模型為云業(yè)務帶來了約6.6億元的增量收入。同時,文心大模型重構(gòu)后的廣告系統(tǒng)為百度帶來了數(shù)億元的增量收入。根據(jù)李彥宏的估計,以上兩項增量收入將在2024年增加到數(shù)十億?;蛟S,這將成為百度智能云加速對阿里巴巴云和華為云的希望。
更加值得注意的是C端。ChatGPT在國外率先推出收費Plus服務;在國內(nèi),百度緊隨其后,率先在C端推出“文心一言”會員訂閱模式。
目前文心3.5基礎版還是可以免費使用的,但是感覺并不完美。能力強的4.0需要升級為會員,有兩種會員權(quán)益,即獨立會員權(quán)益和聯(lián)合會員服務。
在獨立會員權(quán)益價格方面,連續(xù)每月優(yōu)惠價格為49.9元,每月購買價格為59.9元,連續(xù)每年588.8元,每月購買價格為658.8元。在選擇使用會員權(quán)益時,用戶將能夠感受到文心大模型4.0的高級服務,如更強的模型能力和圖片生成能力。
此外,百度還推出了文心一言4.0和文心一格白金的聯(lián)合會員服務,限時特價為99元/月。除了文心大模型4.0服務外,用戶還可以獲得文心一格白金會員的好處,包括快速生成多尺寸高清圖像、創(chuàng)作海報和藝術(shù)文字、AI編輯修改圖片等功能。
然而,這也引起了一些用戶的爭議。雖然會員付費是互聯(lián)網(wǎng)行業(yè)常見的盈利模式,但像大模型會員這樣昂貴的價格相對較少,比如熱鬧的愛奇藝。經(jīng)過幾次漲價,會員包的月價目前是每月25元。
這么貴的會費,業(yè)內(nèi)人士認為大部分都是AI。 從普通用戶的角度來看,知識工作者、開發(fā)者等買單,如果一年用不到幾次,就不適合購買。
但客觀來說,生成式AI商品收費是大勢所趨,大型會員價格昂貴,與服務器、芯片、培訓、電費等高成本有關(guān)。如果不收費,恐怕很難用百度的彈藥儲備支撐燒錢需要多長時間。
從財務報告來看,百度最新的財務報告中并沒有體現(xiàn)大模型C端會員的收費,很難知道有多少用戶付費。但無論是B端還是C端AI故事,要真正體現(xiàn)更大的提升效應還有很長的路要走。2023年百度總收入1345.98億元,網(wǎng)絡營銷貢獻收入751億元。
這不僅僅是百度的問題。目前能從AI賺錢的企業(yè)并不多,百度應該算是其中的佼佼者。一是快速推動其大部分產(chǎn)品與大模型的結(jié)合;第二,文心、百度廣告、智能云、自動駕駛等領(lǐng)域開始從AI獲得落地收入,AI商業(yè)化布局趨于多元化。
OpenAI的成功,首先是商業(yè)模式的成功。到2022年,OpenAI的收入只有2800萬美元。今年2月,一些外國媒體表示,OpenAI的年化收入已經(jīng)超過20億美元,其估值已經(jīng)達到了驚人的1000億美元。一些OpenAI領(lǐng)導認為,到2024年底,該公司的年化收入將達到50億美元。
商言商,只要不被利益蒙蔽雙眼,因利益而為自己的產(chǎn)品、技術(shù)路線強勢站臺,無可非議。
對于李彥宏和他的百度來說,顯然也是如此。它既不像發(fā)布會上宣傳的“讓每個人都成為開發(fā)者”那樣崇高,也不像周鴻祎反駁中的“廢話和欺騙”。區(qū)別在于公司路線和未來戰(zhàn)略。包括馬斯克和OpenAI 決裂,本質(zhì)也是如此。
周鴻祎當然有一點沒說錯,那就是OpenAI。、文心的話也是從開源開始成長起來的——現(xiàn)在所有主流大模型的關(guān)鍵機制(包括開源和閉源)都是以Transformer結(jié)構(gòu)為主,2017年谷歌發(fā)布了熱潮的起點?!禔ttention is all you need》經(jīng)典論文,在Transformer模型的歷史意義上,有了Transformer框架下的“不可能三角形”(并行訓練能力、性能和低成本推理),才有了后來的GPT。
從這個角度來看,當AI和大模型注定要推動一場新的工業(yè)革命時,某一技術(shù)路線肯定會一直落后,這也是一個極端。
本文來自微信微信官方賬號“極點商業(yè)”(ID:作者:jdsy2020):Cindy,編輯:劉珊珊,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com