亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

開源或閉源,大廠為什么站位?

2024-07-14

在 2024 2008年世界人工智能大會期間,李彥宏再次解讀了關(guān)于大模型“開源還是閉源”的爭論,稱目前中國大模型應(yīng)用領(lǐng)域的場景處于激烈的競爭環(huán)境中,“只有業(yè)務(wù)效率高于同行,成本低”才能讓大模型脫穎而出?!霸谶@種情況下,商業(yè)閉源模型是行業(yè)的未來”。


與此同時,他還強調(diào):目前即使是較小的閉源模型,實現(xiàn)效果同樣優(yōu)于同等體積的開源模型。


李彥宏今年也不是第一次發(fā)表類似的觀點, 2024 2008年,李彥宏開始在任何場合發(fā)表演講,公開宣傳百度對“閉源最終將打敗開源”的看法。


雖然這樣的論點幾乎每次出現(xiàn)都會引起很多爭議,但也直觀地反映了行業(yè)在過去一年左右的大模型產(chǎn)業(yè)發(fā)展探索中逐漸形成的兩種主流論調(diào):除了周鴻祎一直對行業(yè)爭議話題發(fā)表意見外,行業(yè)內(nèi)幾乎所有主要的明星大模型創(chuàng)業(yè)團隊都明確支持開源大模型,并通過開源不斷創(chuàng)新行業(yè)知名度。


而且在大廠領(lǐng)域,目前中美兩地都有各自支持開源和閉源的巨頭:閉源陣營 OpenAI、Google 以及百度,開源是以百度為主, Meta、主要是騰訊,阿里。


然而,這種表面的“位置”更多的是在不同的發(fā)展現(xiàn)狀下面臨不同問題的另一個答案:大模型的燒錢對每個大模型公司來說都是一個問題。因此,從不同的角度來看,面對客戶、投資者和開發(fā)者的不同需求,出現(xiàn)了“巨人站在源頭上,中國工廠很難開源,創(chuàng)業(yè)公司必須開源”的現(xiàn)象。


01 創(chuàng)業(yè)團隊:出海和融資都需要開源


與巨頭不同的需求相比,創(chuàng)業(yè)公司支持開源的原因相對統(tǒng)一:從“開源”的方式可以找到當(dāng)前階段面臨的主要問題的答案。


根據(jù)零一萬物開源業(yè)務(wù)負責(zé)人林呂強介紹:創(chuàng)業(yè)團隊選擇開源,甚至有大量的團隊選擇。 All in 本質(zhì)上,開源是因為它是打破行業(yè)現(xiàn)狀的最有效的方法。


在行業(yè)內(nèi)大量優(yōu)秀項目已經(jīng)開源的前提下,“適者生存”是吸引更多用戶實際感受的最重要特征,尤其是對話模型領(lǐng)域的一些開拓性技術(shù)。大型中廠喜歡刷各種榜單來吸引眼球,金融市場更喜歡那些真正能通過模型產(chǎn)品給目前的感受帶來明顯變化的團隊。


一位參與獨角獸大模型團隊海外出海項目的應(yīng)用產(chǎn)品經(jīng)理告訴電廠記者:“開源也是最重要的試金石。如果你(模型)性能不夠好,即使開源最終也不會有人問。


這些都不是獨角獸或者創(chuàng)業(yè)團隊的專利, Meta 與 OpenAI 類似的身影也可以在競爭中看到:對于積累了大量資源的巨頭來說,通過開源建立事實標準是巨頭在競爭中快速攻城掠地的重要手段。


有了開源社區(qū)作為強大的后盾,即使是作為 OpenAI 投資者的微軟,也不得不選擇放低姿態(tài),主動變成 LLama 最大合作伙伴:因為微軟是世界上最重要的云服務(wù)提供商,自然不能背叛開源社區(qū)的主流選擇。


開源是大模型開發(fā)團隊尋找進一步發(fā)展的重要途徑,這一特點在中國大模型團隊中也非常明顯,尤其是目前表現(xiàn)出“出海浪潮”的獨角獸企業(yè): The Information 報道,國內(nèi) AI 一家獨角獸代表公司的月亮暗面已準備好進入美國市場,并已在美國招募相關(guān)員工組建團隊,并且計劃在加州建立當(dāng)?shù)剞k公室。


國內(nèi) AI 創(chuàng)業(yè)團隊將同時在許多國家重建辦公布局。開源作為出海前最關(guān)鍵的前哨戰(zhàn),是實現(xiàn)出海最關(guān)鍵的目標之一。 —— 儲備人才有很大的好處。隨著開源項目的不斷撤出,中國創(chuàng)業(yè)團隊在全球開源社區(qū)中發(fā)揮了重要作用,進一步增加了中國大型團隊出海時選擇開源的意愿。


基于以上因素,現(xiàn)在擁抱開源是唯一的選擇。剩下的問題只是“如何通過開源獲得更多的關(guān)注,在這個過程中快速積累實力。


02 行業(yè)落地


正因為開源本質(zhì)上是一種雙贏的舉動,所以公開宣稱“開源沒有未來”幾乎等于站在大多數(shù)開發(fā)者的對立面。


百度作為一個平臺巨頭,也依靠開發(fā)者社區(qū)擴大現(xiàn)有業(yè)務(wù),勇于頻繁犯下這個禁忌。原因無非是自己大模型前期培訓(xùn)投入的計算資源和成本,迫切需要通過推廣閉源大模型產(chǎn)業(yè)商業(yè)化來收回。


雖然開源有各種不可替代的優(yōu)勢,但在探索國內(nèi)行業(yè)大模型時,已經(jīng)形成的共識是,至少在當(dāng)前和未來,開源大模型和閉源大模型仍然存在技術(shù)差異。這是閉源大模型商業(yè)價值遠高于開源模型的主要原因。


從過去一年多的大模型產(chǎn)業(yè)應(yīng)用案例來看,閉源大模型確實更受用戶歡迎。主要原因是客戶的實際需求不同,在處理行業(yè)相對復(fù)雜的垂直領(lǐng)域問題時,開源模型往往會出現(xiàn)推理能力不足的問題。


據(jù)一位長期觀察大模型落地案例的分析師介紹,目前處理這類問題最理想的方法就是通過封閉源模型進行私有部署。在這個過程中,封閉源代碼可以更快更高效地滿足合作伙伴提出的各種需求,在迭代速度更快的同時,更好地根據(jù)用戶需求更新迭代。


除了對應(yīng)用效果負責(zé),閉源也是保證用戶數(shù)據(jù)更安全、更可控的宣傳方式:即使目前開源模型普遍強調(diào)自身的治理機制,如代碼審查系統(tǒng)、數(shù)據(jù)隱私培訓(xùn)等措施,這些都無法從根本上解決隱私泄露的風(fēng)險。


這不僅是潛在的風(fēng)險,也是客戶在實際推廣中對大模型效果的信心的巨大影響:閉源模型在中國的發(fā)展往往有大廠的品牌作為背誦,這是開源閉源大模型競爭的特殊優(yōu)勢,也是大模型控制領(lǐng)域問責(zé)鏈的最后一個環(huán)節(jié)。


這一點在市企和工程醫(yī)療領(lǐng)域的模型產(chǎn)品中最為明顯:2023 2008年8月,北京市衛(wèi)生健康委牽頭組織指定的《北京市互聯(lián)網(wǎng)診療監(jiān)管實施辦法(實施)》公布,明確提到不允許使用人工智能一鍵生成處方,取代醫(yī)生本人提供診療服務(wù)。相應(yīng)的就是之前業(yè)界最擔(dān)心的問題“如果病人是因為 AI 錯誤的決定受害,如何明確責(zé)任歸屬”這個問題。


目前,大型模型應(yīng)用領(lǐng)域仍處于行業(yè)早期探索試錯階段,因此大多數(shù)用戶對監(jiān)管和問責(zé)機制趨于極其保守,但不同的是,國內(nèi)各行各業(yè)的大型模型應(yīng)用幾乎都面臨著數(shù)據(jù)質(zhì)量不足的問題。


為了加快模型的訓(xùn)練和開發(fā),無論是開源模型還是閉源模型,都需要大量的垂直領(lǐng)域生成數(shù)據(jù)來提高模型反饋的質(zhì)量。在這種需求下,責(zé)任歸屬更明確、反饋響應(yīng)機制更快的閉源模型產(chǎn)品往往能發(fā)揮出獨特的優(yōu)勢。


根據(jù)目前公開的信息,在提供模型本地化部署服務(wù)的同時,主要的閉源大模型巨頭往往通過各種方式規(guī)避直接訓(xùn)練帶來的潛在風(fēng)險,通過去標識、數(shù)據(jù)脫敏、泛化等技術(shù)對用戶信息進行脫敏處理,最大限度地減少安全隱患:這些已經(jīng)屬于百度、騰訊等傳統(tǒng)互聯(lián)網(wǎng)巨頭最具優(yōu)勢的行業(yè),讓自己的閉源大模型滿足這些需求。已有相當(dāng)熟悉的操作經(jīng)驗。


“大模型的代碼開源沒有意義,因為核心概念已經(jīng)從代碼轉(zhuǎn)向了數(shù)據(jù)和訓(xùn)練方法”。事實上,大模型目前遵循的“開源”概念并不是傳統(tǒng)代碼領(lǐng)域所理解的。


始終以“最大開源模型平臺”自稱。 Llama2 實際上,它并不遵循傳統(tǒng)的代碼開源協(xié)議,而是一種 Meta 自定義自己的協(xié)議,其中夾雜著大量的協(xié)議 Meta 排他性條款:例如,明確規(guī)定,當(dāng)某個項目每月活躍用戶超過7億時,Meta 有權(quán)決定是否繼續(xù)開源授權(quán)。 它是當(dāng)前大型開源領(lǐng)域存在的模糊之處。



RWKV “開源不是商業(yè)化的反義詞,開源代表著打破壟斷”,創(chuàng)始人羅璇說。Llama 2 開源系列模型之所以成為引起行業(yè)震動的重要事件,是因為開源在應(yīng)用領(lǐng)域仍然有天花板,但確實大大降低了公司的應(yīng)用門檻。


類似 Llama 2 這種復(fù)雜的開源模式允許其他公司在此基礎(chǔ)上免費商業(yè)使用,開發(fā)者也可以通過微調(diào)進行。 Llama 2 為了滿足一些特定的使用需求,與商業(yè)化的價值相比,大模型在使用中的價值逐漸清晰,進而進一步推動大模型更多應(yīng)用的可能性,這可能是開源在一線企業(yè)家眼中最有價值的領(lǐng)域。


在這一點上,大大小小的公司都能從開源中受益,真正受開源影響最嚴重的是各種夾在中間的大模型“中廠”。:中型企業(yè)的投資力量遠不如巨頭,但也很難像創(chuàng)業(yè)公司那樣完全走開源頭。


只要有大量的開源推動者不斷融入社區(qū),給行業(yè)帶來新的活力和思想,它們就會不斷出現(xiàn),就像 Llama 2 這樣的新變數(shù),也將是未來開源大模型最大的未知重要性。


在行業(yè)應(yīng)用領(lǐng)域,只有最先落地的廠商才能獲得最大的話語權(quán),但開源模型永遠不會像閉源模型廠商聲稱的那樣“開源沒有未來”。雖然開源“叢林法則”的競爭模式不如閉源可控,但“突變”規(guī)則改變者的概率更大。


只要開源給行業(yè)帶來的活力和鯰魚效應(yīng)會持續(xù)下去,開源模型就永遠是行業(yè)的重要組成部分,不會隨著行業(yè)巨頭的主觀意愿而改變。


本文來源于微信微信官方賬號“電廠”(ID:wonder-capsule),作者:張勇毅,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com