“勇毅者”閆俊杰,沖擊IPO之路
“MiniMax正在探尋一條此前未被驗(yàn)證過的道路?!?/p>
6月17日,MiniMax官方公眾號(hào)發(fā)布了全球首個(gè)開源大規(guī)?;旌霞軜?gòu)推理模型MiniMax - M1,公司創(chuàng)始人閆俊杰隨即轉(zhuǎn)發(fā)到朋友圈,并配文:“首次感覺大山并非不可翻越?!?/p>
之所以有此感慨,是因?yàn)镸1模型憑借以閃電注意力機(jī)制為主的混合架構(gòu)和更快的強(qiáng)化學(xué)習(xí)算法CISPO(一種通過裁剪重要性采樣權(quán)重提升強(qiáng)化學(xué)習(xí)效率的強(qiáng)化學(xué)習(xí)算法)這兩項(xiàng)技術(shù)突破,實(shí)現(xiàn)了深度推理的顯著高效,還提升了強(qiáng)化學(xué)習(xí)的效率。據(jù)公司介紹,整個(gè)強(qiáng)化學(xué)習(xí)階段僅用了512塊H800三周時(shí)間,換算成(算力)租賃成本為53.47萬美元。
除M1外,在之后的4個(gè)工作日里,MiniMax又接連發(fā)布了Hailuo 02視頻生成模型、MiniMax Agent通用智能體、Hailuo Video Agent視頻創(chuàng)作智能體、Voice Design音色設(shè)計(jì)。在MiniMax Agent發(fā)布當(dāng)天,閆俊杰發(fā)朋友圈稱:“研發(fā)中愈發(fā)強(qiáng)烈地感覺到AI的價(jià)值可以開始用經(jīng)濟(jì)來衡量?!?/p>
與此同時(shí),MiniMax在資本市場(chǎng)也有新動(dòng)態(tài)。6月,有消息傳出公司正考慮在港股IPO。
這一消息并非毫無根據(jù):早在2024年,MiniMax旗下產(chǎn)品星野AI(Talkie)營收就已突破千萬美元,在海外市場(chǎng)表現(xiàn)亮眼,下載量曾超越CharacterAI,成為美國AI應(yīng)用Top4。更關(guān)鍵的是有財(cái)務(wù)實(shí)力支撐——知情人士透露,公司今年以來通過多輪未公開融資,積累了充足的現(xiàn)金儲(chǔ)備(約十幾億美元)。近期還完成了Pre - IPO融資,使其成為大模型創(chuàng)業(yè)公司中資金最雄厚的企業(yè)之一。
截至發(fā)稿,公司方面未對(duì)資本市場(chǎng)相關(guān)進(jìn)展作出正面回應(yīng)。
充足的現(xiàn)金儲(chǔ)備讓閆俊杰擁有了高度的戰(zhàn)略自主權(quán),也讓這位極具“冒險(xiǎn)精神”的創(chuàng)業(yè)者,能夠堅(jiān)定地推行“加速技術(shù)迭代”的發(fā)展路徑。明勢(shì)創(chuàng)投合伙人夏令此前參加活動(dòng)時(shí),評(píng)價(jià)MiniMax是“一家兼具野心、資源實(shí)力與非共識(shí)堅(jiān)持的公司”,明勢(shì)創(chuàng)投創(chuàng)始合伙人黃明明則稱,“閆俊杰是個(gè)‘狠人’,在資源等各方面有限的情況下,仍專注于模型研發(fā)。只有這樣的企業(yè)家才可能走得更遠(yuǎn),走到最后。”
01 錨定MoE架構(gòu)破局
2021年12月,商湯上市前夕,身為副總裁、研究院副院長(zhǎng)和智慧城市事業(yè)群CTO的閆俊杰,選擇離開商湯。
在閆俊杰看來,2020年之前,AlphaGo帶動(dòng)社會(huì)對(duì)人工智能的關(guān)注度和期待值大幅提升,國內(nèi)外都投入大量研發(fā)資金,但當(dāng)時(shí)的人工智能只能完成人臉識(shí)別、語音識(shí)別等簡(jiǎn)單任務(wù),創(chuàng)造的社會(huì)價(jià)值較低。
對(duì)當(dāng)時(shí)的閆俊杰而言,這是件“痛苦的事”,他逐漸意識(shí)到,核心問題在于當(dāng)時(shí)的人工智能不夠通用。
“當(dāng)時(shí)我們用虛擬模型解決客戶問題,客戶問題眾多時(shí),就得做無數(shù)個(gè)模型,每次做模型都要訓(xùn)練、導(dǎo)數(shù)據(jù),整個(gè)生產(chǎn)鏈條很慢。所以我們只能服務(wù)大客戶,因?yàn)槠髽I(yè)需要定制,但定制成本高、周期長(zhǎng),商業(yè)模式成了定制模型。”閆俊杰回憶道。
他思考著:“如果不做定制模型,把模型做得通用,是不是就能服務(wù)普通人了?”
同時(shí),閆俊杰看到OpenAI關(guān)于GPT - 3的論文后受到啟發(fā),認(rèn)為“把(GPT)模型放大10倍,技術(shù)路線或許可行”。
不過,做通用工具與閆俊杰在商湯的研發(fā)路線截然不同,所需人才、組織結(jié)構(gòu)也不一樣,他由此覺得“這是新興公司的機(jī)會(huì)”。2022年初,MiniMax正式成立。
云啟資本是MiniMax早期投資方之一,合伙人陳昱最初與閆俊杰接觸時(shí),就發(fā)現(xiàn)他是個(gè)野心較大的創(chuàng)業(yè)者,“他想成為中國的OpenAI或DeepMind,最終實(shí)現(xiàn)通用人工智能”。
在技術(shù)路線選擇上,閆俊杰十分大膽。
2023年下半年,大部分中國同行還在迭代稠密模型(dense model)以穩(wěn)健提升大模型性能,閆俊杰卻幾乎將全部研發(fā)和算力資源投入到更不確定的事情——MoE(混合專家系統(tǒng))模型上。
黃明明回憶,當(dāng)時(shí)MoE在硅谷都不是主流選擇,只有OpenAI在做,甚至MoE的提出者都未堅(jiān)持走這條路。
閆俊杰認(rèn)為,盡管OpenAI尚未公開GPT - 5,但內(nèi)部已完成訓(xùn)練。GPT - 5訓(xùn)練需高達(dá)5萬張卡的算力,短期內(nèi)國內(nèi)難以達(dá)到3萬張卡的規(guī)模,所以若要實(shí)現(xiàn)與GPT - 5相當(dāng)?shù)男Ч?,必須采用更高效的算法(MoE),否則永遠(yuǎn)追不上OpenAI。因此,MoE成了團(tuán)隊(duì)“必須要做的事”。
2023年夏天,閆俊杰帶領(lǐng)MiniMax團(tuán)隊(duì)專注研發(fā)MoE。
黃明明覺得,閆俊杰看似溫和,實(shí)則瘋狂。認(rèn)定終極目標(biāo)后,他會(huì)傾盡全力去賭。
“他把當(dāng)時(shí)手頭80%的算力資源都用于推進(jìn)MoE?!秉S明明說,“前兩次嘗試失敗了,直到第三次成功,他才來跟我們(投資人)說,MoE差不多能搞定了。”
黃明明問閆俊杰:“為何要下這么大賭注?賭輸了,公司可能就完了。”
閆俊杰回復(fù):“只有做出MoE,才能以更低成本向更高模型階段演進(jìn),否則成本不可估量,沒有公司能承受如此高的token消耗量去實(shí)現(xiàn)更高平臺(tái)的進(jìn)化?!?/p>
02 應(yīng)對(duì)DeepSeek,慢了一步
2025年1月15日,MiniMax發(fā)布首個(gè)開源模型MiniMax - 01系列。
接受晚點(diǎn)采訪時(shí),閆俊杰指出,開源的核心價(jià)值在于加速技術(shù)進(jìn)化?!案玫哪P湍艽呱玫膽?yīng)用,但更好的應(yīng)用和更多用戶并不一定能帶來更好的模型?!遍Z俊杰說。想明白“智能水平的提升,沒那么依賴用戶規(guī)?!焙螅Z俊杰做出取舍,他認(rèn)為當(dāng)下MiniMax最重要的目標(biāo)不是增長(zhǎng)和收入,而是“加速技術(shù)迭代”,并堅(jiān)定了做技術(shù)驅(qū)動(dòng)型公司的想法,開始有意識(shí)地打造技術(shù)品牌。
但從行業(yè)變化來看,閆俊杰還是“慢”了一拍。2024年12月26日,DeepSeek - V3發(fā)布后,在業(yè)內(nèi)積累了一定口碑和品牌效應(yīng)。2025年1月20日,DeepSeek - R1發(fā)布,其聲量迅速超過相對(duì)低調(diào)的MiniMax,進(jìn)一步搶占了C端用戶的心智。
面對(duì)DeepSeek的沖擊,國內(nèi)模型廠商主要分為兩隊(duì),一隊(duì)積極擁抱,大力宣傳旗下產(chǎn)品接入DeepSeek;另一隊(duì)堅(jiān)決不接入,專注自研推理模型。
MiniMax選擇在國內(nèi)C端應(yīng)用上不接入DeepSeek,只在海外AI應(yīng)用上接入。
據(jù)MiniMax內(nèi)部員工透露,DeepSeek發(fā)布未影響研發(fā)團(tuán)隊(duì)的節(jié)奏,內(nèi)部仍按原計(jì)劃專注低調(diào)地進(jìn)行技術(shù)研發(fā)。
黃明明表示,他們非常認(rèn)可MiniMax持續(xù)專注底層模型研發(fā)?!昂玫膽?yīng)用和產(chǎn)品是模型能力的自然體現(xiàn),模型能力強(qiáng)了,自然能做出好產(chǎn)品。事實(shí)證明,模型能力不足時(shí),做出的產(chǎn)品需要大量修補(bǔ),耗費(fèi)人力物力,還會(huì)讓人失去對(duì)底層模型的專注。”黃明明說。
6月中旬,MiniMax連續(xù)發(fā)布包括基礎(chǔ)模型及應(yīng)用在內(nèi)的5款產(chǎn)品,業(yè)內(nèi)對(duì)其模型和應(yīng)用評(píng)價(jià)較為正面,Hugging Face工程師王鐵震告訴《中國企業(yè)家》:“MiniMax在探索一條未被驗(yàn)證過的路,很有價(jià)值?!?/p>
(注:Hugging Face是一家2016年成立的美國人工智能公司,致力于構(gòu)建開源機(jī)器學(xué)習(xí)社區(qū)和平臺(tái),提供豐富的預(yù)訓(xùn)練模型、數(shù)據(jù)集和工具,助力開發(fā)者更便捷地構(gòu)建、訓(xùn)練和部署AI應(yīng)用。)
不過,MiniMax - M1系列模型未引發(fā)廣泛轟動(dòng)。截至7月10日,其在Hugging Face最熱帖下載量?jī)H25.2K,GitHub最熱帖收藏量?jī)H3K——這一數(shù)據(jù)明顯低于Google、Meta今年初發(fā)布的開源模型,也不如DeepSeek - R1的收藏及下載量。
部分Agent創(chuàng)業(yè)者反饋,雖注意到MiniMax M1模型發(fā)布,但因自身產(chǎn)品上線排期緊張,暫未測(cè)試。另一位AI領(lǐng)域創(chuàng)業(yè)者告訴《中國企業(yè)家》,當(dāng)前海外AI領(lǐng)域熱點(diǎn)不斷(如GPT - 5即將發(fā)布,Meta新模型迭代),分散了行業(yè)注意力,客觀上削弱了M1的傳播聲量。在他看來,國際模型技術(shù)仍有一定領(lǐng)先優(yōu)勢(shì)。
對(duì)此,一位MiniMax投資人表示,MiniMax一貫風(fēng)格低調(diào)克制,最終交付產(chǎn)品的口碑,可能比模型名字的知名度或下載量更重要。
“只有交付產(chǎn)品,才便于商業(yè)化,才有可能達(dá)到上市規(guī)模??焓值目伸`交付的是生產(chǎn)工具,大家看重的也是產(chǎn)品,而非快手的視頻模型?!痹撏顿Y人補(bǔ)充道。
本文來自微信公眾號(hào)“中國企業(yè)家雜志”(ID:iceo - com - cn),作者:孔月昕,編輯:馬吉英,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com