亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

<label id="m9wbq"></label>

<rt id="m9wbq"></rt>

<label id="m9wbq"></label>

<span id="nlcvf"></span>

大模型價格戰(zhàn)，還可以再狠一點。

2024-06-02

沒有人想到，大模型產(chǎn)業(yè)的第一次“集體會戰(zhàn)”，竟然圍繞著價格進行。

五月六日，私募股權(quán)巨頭幻方的深度追求，開始了第一槍降價。DeepSeek-V2(32k)深度追求發(fā)布模型，在數(shù)學、編程、中英文等方面已經(jīng)接近GPT-4；然而，DeepSeek-V2的應用價格只有GPT-4o的1/35左右。

DeepSeek-V2的輸入和輸出價格分別為1元/百萬tokens和2元/百萬tokens，遠低于市場價格。

比拼多多砍一刀還便宜，讓不少美國專家大吃一驚。著名分析師Dylann 看完DeepSeek-V2的論文，Patel興奮地說：“這可能是今年最好的一篇。[1]

DeepSeek-V2的論文

一個星期后，“卷王”字節(jié)跳動又增加了一把火。

豆包通用模型Pro-32k的輸入價格被一刀切割到更低的0.8元/百萬tokens?；鹕桨l(fā)動機總裁譚待表示，“豆包的價格比行業(yè)低99.3%，從那以后，大模型就以厘計費?！?/p>

看到同行如此不講武德，其他科技公司從此不再淡定。

阿里率先回擊，一狠心，大舉降低了所有模型的價格。

幾個小時后，百度干脆跑到價格終點:宣布兩個輕量級模型完全免費。隨后，科大訊飛星火Lite API、騰訊混合元大模型lite 同時，256k也相繼宣布免費。

如此盛況，很難不讓人夢到那段滴滴對決快，ofo摩拜互相扯頭發(fā)的激情歲月。

但是，圍繞大模型的價格戰(zhàn)，遠不如網(wǎng)約車、自行車共享那么直觀，各種專業(yè)術(shù)語令人摸不著頭腦。所以，這些大型企業(yè)，究竟熱鬧些什么？

B面價格戰(zhàn)

要理解這一點，首先要了解大模型的商業(yè)模式。以阿里巴巴云為例，它提供三種大型服務[2]：

基本服務：模型推理。

模型推理，是指根據(jù)輸入的信息內(nèi)容，給出答案的過程。也就是說，推理就是“實際應用”模型的過程。

阿里云預設了多種不同性能的“專業(yè)模式”，供用戶推理。這項服務的收費方式非常簡單，即“以量收費”：以消耗的token數(shù)量為單位，使用越多，成本越高。并且性能越好，收費越高。

token是一個用于衡量文本長度的大模型計數(shù)單位，可以簡單理解為“字數(shù)”。三篇75萬字的《三國演義》大約需要125萬個token。

(2)高級服務：模型微調(diào)。

如果覺得“專業(yè)版”不好用，阿里巴巴云還提供了“定制R&D”服務，即微調(diào)模型。具體費用取決于“定制R&D”消耗的計算資源和發(fā)展進度。

(3)超高級服務：模型部署。

如果顧客需要長時間使用大型模型，最好的辦法就是將其部署到專屬案例中。

專屬案例是指直接承接一臺或多臺物理服務器的所有資源。翻譯成人話就是把整個商業(yè)廣場租下來，而不是租一家店。

這樣做的好處是，沒有其他商家和你爭奪計算資源，響應速度更快。

它的收費模式也是以量收費，但是有兩種形式:阿里直接按照“商業(yè)廣場”消耗的計算資源收費；此外，百度還支持token的數(shù)量按模型推理收費。

這三種收費模式面向企業(yè)和個人開發(fā)者，代表著大模型開發(fā)的循序漸進過程。但各大科技公司瘋狂討價還價的，其實就是上面提到的“基礎服務”，也就是“專業(yè)模式”的推理成本。

推理費具體定價，又分為“輸入”和“導出”兩部分。

簡單來說，輸入就是用戶提問的內(nèi)容，導出就是大模型的答案。技術(shù)公司通常會根據(jù)輸入輸出的token數(shù)量(字數(shù))收取兩次費用。

這一復雜而微小的差別，很容易成為科技公司的招數(shù)。

例如字節(jié)跳動的“0.8元/百萬tokens”和“比行業(yè)價格低99.3%”，實際上只是輸入價格。Pro-32k豆包通用模型的輸出價格仍然是2元/百萬tokens，與DeepSeek-V2等同行持平。

可以看出，雖然大模型的價格戰(zhàn)打得火熱，但背后其實還有另一個洞天。

千層套路降價

可見，本輪價格戰(zhàn)最活躍的，基本上都是云計算公司，代表BAT和字節(jié)跳動。

他們之所以敢于這樣降價，還是因為可以從別處彌補損失，羊毛出在羊身上。

正如前面提到的，降價甚至免費，實際上只是基本服務。

毫無疑問，這可以幫助中小開發(fā)者以更低的成本建立應用程序。但是，當開發(fā)者或企業(yè)需要更適合自己的業(yè)務，深入使用大模型時，通常無法避免模型微調(diào)和模型部署的高級化?！?strong>這兩項服務，并非本次價格戰(zhàn)的主角。

例如，百度宣布免費ERNIE-Speed-8K，如果實際安排，費用將變成5元/百萬tokens[3]。

同時，所有降價最嚴重的其實都是輕量級預設模型；相比之下，性能更強的“超大杯”模型實際降價幅度并沒有那么夸張。

例如阿里的Qwen-Max，實際上和字節(jié)跳動的豆包一般模型Pro-32k一樣，只是降低了輸入價格；而隔壁的百度，壓根就沒有提到超大杯模型。

云計算廠商的價格戰(zhàn)更像是通過“免費游戲”吸引更多玩家加入；但是如果你想繼續(xù)“升級變強”，氪金就得氪金。

云計算制造商當然不是唯一的參與者。

以深度追求和智譜AI為代表的明星創(chuàng)業(yè)公司之所以敢于跟進內(nèi)卷，很大程度上是因為有足夠的彈藥，尤其是計算資源。

2020年，模型還沒有爆發(fā)，背靠私募巨頭幻方的深度追求，投資上億準備AI超級計算機。

現(xiàn)在，除了BAT，幻方是、除了商湯和字節(jié)跳動，第六家公司擁有超過1萬張英偉達A1000張。中國企業(yè)GPU儲備[4]。

而且智譜AI背靠阿里和騰訊，是一家估值過百億的AI獨角獸公司。

到2020年，智譜AI也碰巧囤積了大量的GPU資源。在接受《中國企業(yè)家》采訪時，CEO張鵬提到：

那時，他認識的一家云計算制造商，有一批GPU積塵。這個GPU最初是供應給游戲公司的，但是一次偶然的機會，對方又不買了。得知這一消息后，張鵬順勢接管了這批計算資源[5]。

如果現(xiàn)金流量、計算率資源充足，即使燒錢換市場，這些創(chuàng)業(yè)公司也能扛得住。

所以問題來了：當初移動互聯(lián)網(wǎng)補貼換市場，還可以簡單粗暴地歸因于“技術(shù)門檻低”；主要推廣一手高科技的大模型，怎么也沒有走出價格戰(zhàn)的怪圈？

必經(jīng)之路

大型智能化給世界帶來的震撼，通常讓人忽視其本質(zhì)，實際上是一種基礎設施。

在去年的公開演講中，著名計算機科學家吳恩達提到：

事實上，AI是一系列工具的集合。這類工具包括監(jiān)督學習、非監(jiān)督學習、強化學習和目前生成的人工智能。這一切都是通用技術(shù)，代表著它與電力、因特網(wǎng)等其它通用技術(shù)沒有什么不同[6]。

電力和因特網(wǎng)，不能直接創(chuàng)造財富；事實上，電燈、電腦、電子商務、電子游戲是真正改變世界的。

然而，應用程序的爆發(fā)實際上有一個前提:基礎設施足夠便宜。在此之前，大型應用無法快速鋪開的一個主要困境是使用成本過高。

哄騙模擬器就是一個典型的例子。

今年年初，一位名叫王登科的獨立開發(fā)者開發(fā)了一個AI應用程序，模擬“憤怒女友”的形象。這個應用程序的玩法很簡單，用戶必須斗智斗勇地哄騙對話窗口的AI女友。

因為互動簡單，構(gòu)思相當有趣，哄哄模擬器在上線的第一天就吸引了超過60萬的顧客。

突如其來的爆紅，卻讓王登科哭笑不得。哄騙模擬器采用了預設的GPT-3.5模型，運行一早就花了他超過2000美元的推理費。

相當于，開發(fā)了一個App，還沒想到怎么賺錢，先交了一萬塊電費。

縱觀歷史可以發(fā)現(xiàn)，當初移動互聯(lián)網(wǎng)的大規(guī)模普及，也都是基于基礎設施降本。

根據(jù)2014年的一份調(diào)查報告，當時由于流量成本高，手機用戶每天使用流量不會超過3小時。而且很多用戶在不使用移動網(wǎng)絡的情況下會選擇關(guān)閉，避免后臺使用手機消耗流量[7]。

那時候，大部分用戶，都曾經(jīng)做過“一覺醒來，房子就搬回中國”的噩夢。

2013年，快手明確了“短視頻社區(qū)”的定位，但增長相對緩慢。這背后，很難說沒有大環(huán)境的原因。

事實上，短視頻行業(yè)才真正開始爆發(fā)，直到通信運營商開始大做“降費加速”。

2019年，與2014年相比，手機上網(wǎng)流量費用下降了90%以上[8]。到目前為止，手機淘寶、微信、Tiktok逐漸成為字面意義上的“國家應用”。

可以看出，降價實際上是大型行業(yè)發(fā)展的必由之路。

或許在這一輪價格戰(zhàn)中，云計算廠商和創(chuàng)業(yè)公司各有各的小九九；但是對于開發(fā)者和普通用戶來說，建議多打一點。

參考資料

[1] OpenAI Is Doomed，SemiAnalysis

[2] 阿里云大模型服務平臺百煉

[3] 大模型千帆平臺

[4] 第一代大模型量化巨頭發(fā)布：免費商業(yè)用途，完全開源，澎湃新聞

[5] 智譜AI CEO張鵬：中國大型企業(yè)家，不再追隨OpenAI，中國企業(yè)家

[6] Andrew Ng: Opportunities in AI - 2023，Stanford Online

[7] 2014年中國數(shù)據(jù)流量使用報告：近40%的客戶流量不夠，中國新聞網(wǎng)

[8] 工信部組織召開“加速降費”客戶零距離交流會議

本文來自微信公眾號“遠川科技評論”（ID：kechuangych），作者：葉子凌，36氪經(jīng)授權(quán)發(fā)布。

本文僅代表作者觀點，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請及時與我們聯(lián)系進行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

探影停工，一汽-大眾的“不甘”隱藏在SUV中

固體電池，終于迎來了60億的微風

韓國學生來中國做網(wǎng)絡名人，漲粉超過500萬。

童年商業(yè)：品牌如何做兒童營銷？

一位92歲的老婦人，用養(yǎng)老金創(chuàng)辦了1620億美元私募王國。

項目推薦

愛親母嬰連鎖品牌

<label id="dlku4"></label>