投靠馬斯克克的OpenAI泄密者
白交 衡宇 發(fā)自 凹非寺量子位 | 公眾號 QbitAI
剛剛被OpenAI開除的泄密者,光速投靠馬斯克。
當事人Pavel Izmailov(以下簡稱小P)是Ilya的盟友之一,在Ilya領(lǐng)導(dǎo)的超級對齊團隊中工作過。
半個月前,小P被指疑似泄露Q*相關(guān)秘密,被解雇。盡管不清楚他泄露了什么,但當時鬧得沸沸揚揚。
說時遲那時快,現(xiàn)在,他的推特個人介紹,已大張旗鼓地寫道:
研究員@xai
不要說老馬招人快,除了小P之外,很多優(yōu)秀的人才最近都被馬斯克帶進了手下。
看到熱鬧的網(wǎng)友炸開了鍋。很多人稱贊他,稱他干得漂亮:
還有一些人不喜歡死亡,認為雇傭泄露機密信息的人,這種行為相當于撿破爛。
并且最近xai的表現(xiàn)-包括Grok的發(fā)布。 包括1.5V在內(nèi),狠狠刷了一波存在感,不禁讓人嘆為觀止:
與OpenAI相比,xAI將成為游戲的主要參與者。、Anthropic分庭抗禮。
雇用OpenAI開除的泄密者。
事情就是這樣,有一位博主非常關(guān)注大模型領(lǐng)域的新事物,有一個很大的發(fā)現(xiàn):
馬斯克旗下xAI的新員工,可不少?。??
而且還有幾個人的研究方向與OpenAI最神秘的Q*算法有關(guān),看來馬斯克就是Q*的真正教徒。
具體來說,哪些人剛剛選擇了xAI而棲息?
最引人注目的是我們開頭提到的小P。
他也是紐約大學的CILVR團隊成員,我透露2025年秋天將加入紐約大學Tandon。 CSE、Courant CS擔任助理教授。
半個月前,他的個人頁面上還寫著“在OpenAI做大模型推理”。
半個月后,時過境遷。
但是小P的推特置頂仍然沒有改變,是超級對齊團隊的第一篇論文,小P就是這篇論文的作者。
去年7月,OpenAI是OpenAI成立的三大安全團隊之一,以應(yīng)對不同時間尺度上大模型可能出現(xiàn)的安全問題。
對齊團隊負責遙遠的未來,為超越人類的超級智能安全奠定基礎(chǔ),由Ilya Sutskever和Jan Leike領(lǐng)導(dǎo)。
說起來,雖然OpenAI似乎非常重視安全,但它內(nèi)部對AI安全開發(fā)的巨大矛盾已經(jīng)不是什么秘密了。
這一矛盾甚至被稱為去年11月OpenAI股東大會宮斗大戲的主要原因。
網(wǎng)絡(luò)爆炸Ilya Sutskever之所以成為“政變”的領(lǐng)導(dǎo)者,是因為他看到了一些讓他感到不安的東西。
而且Ilya帶領(lǐng)的這支超級對齊隊,很多成員也站在Ilya這里,在后來支持奧特曼的比心接龍活動中,這支超級對齊隊員也基本上保持了沉默。
然而,宮廷斗爭平息后,Ilya似乎在OpenAI蒸發(fā),引起了外界的謠言,但他再也沒有公開露面,甚至沒有在網(wǎng)上澄清或辟謠。
所以,很對齊團隊現(xiàn)在是什么情況,我們也不知道。
作為一名非常對齊的團隊成員,Ilya下屬,小P半個月前從OpenAI畢業(yè),被網(wǎng)友猜測是奧特曼的“秋后算賬”。
人才啊,他連夜投靠馬斯克。
雖然Q*的全貌在外面還不清楚,但各種跡象表明,它致力于將大模型與強化學習、優(yōu)化算法相結(jié)合,提高AI推理能力。
以下幾位新加入xAI的人才研究內(nèi)容,除了最八卦點小P外,或多或少都與之相關(guān)。
Qian Huang,現(xiàn)在還是斯坦福大學的博士生。
從去年夏天開始,Qian Huang在Google 目前推特上已注明了DeepMind工作。@xai,暫時不知道該擔任什么職務(wù)。
但是從GitHub個人中心可以看出,她的研究方向是把機器推理和人類推理結(jié)合起來,特別是新知識的合理性、可解釋性和可擴展性。
Eric Zelikman,斯坦福博士在讀生,推特上注明“study why @xai”。
此前,他曾在Google研究所和微軟研究所呆過一段時間。
他在個人中心說:“我癡迷于算法(以及是否)能學到有價值的表達和推理。我正在xAI研究這件事。”
他的團隊今年三月推出了Quiet-Star算法,的確也是Q*,讓大模型學會獨立思考。
Aman Madaan,卡內(nèi)基梅隆大學語言技術(shù)研究所博士。
他的研究領(lǐng)域包括大型語言模型、反饋驅(qū)動的生成、代碼生成和自然語言推理的交叉領(lǐng)域。研究的主題是利用推理時間計算(Inference-Time Compute)提高推理能力(Reasoning)。
在攻讀博士學位期間,Aman曾擔任谷歌大腦和艾倫人工智能研究所的研究人員和合作者;在此之前,他還是Oracle的主要技術(shù)人員。
添加Pavel 從那以后,包括Izmailov在內(nèi)的幾名新員工的技術(shù)人才版圖已經(jīng)擴大到34人(不包括馬斯克本人),比起起初,12人的創(chuàng)始團隊增加了大約兩倍。
新成員中,共有7名華人,加上5名創(chuàng)始團隊成員,從此共有12名成員。
Xiao Sun,以前曾經(jīng)在Meta、在耶魯、北大的校友中擔任IBM,博士畢業(yè)。
Ting Chen,在此之前,谷歌DeepMind、本科畢業(yè)于北郵,谷歌大腦任職。
Juntang Zhuang,以前在OpenAI工作過,DALL-3、GPT-四是核心推動者,本科畢業(yè)于清華,碩士畢業(yè)于耶魯。
Xuechen Li,本人畢業(yè)于斯坦福,是羊駝Alpaca系列大型模型的關(guān)鍵推動者。
Lianmin Zheng,UC伯克利計算機博士,小羊駝Vicuna、Chatbot 創(chuàng)建者Arena。
Qian Huang,在天津南開中學畢業(yè)的斯坦福博士生。
Haotian Liu,本科畢業(yè)于浙江大學的威斯康星大學麥迪遜分校,LLaVA一作。
從機構(gòu)分布來看,主要集中在谷歌、斯坦福、Meta、OpenAI、其他機構(gòu),如微軟,都有豐富的大模型訓(xùn)練經(jīng)驗, 比如GPT系列,大大小小的羊駝系列,以及與谷歌Meta相關(guān)的大模型。
就加入時間而言,更多的是集中在今年2-3月,平均每5天就有13名新成員加入。去年8-10月只有5人加入。
而且如果結(jié)合相應(yīng)Grok的進展,還可以看到馬斯克xAI每個階段的招聘計劃。
例如,今年三月二十九日,馬斯克突然發(fā)布了Grok-1.5,前后文長度飆升,從最初的8192增加到128k,與GPT-4持平。
把時間推回一個月(今年2月),OpenAI前員工Juntang 加入xAI的Zhuang。在OpenAI上,他創(chuàng)造了GPT-4 Turbo支持長前后文能力128k的算法。
還有今年4月15日,Grok-1.5V多模式模式發(fā)布模式,除了文本信息之外,它還可以處理各種視覺信息,包括圖表、屏幕截圖和照片。
今年三月,LLaVA作為Haotiann。 Liu剛剛加入。LLaVA是端到端訓(xùn)練的多模式模型,展示了類似GPT-4V的能力。新版本的LLaVA-1.5 在 11 SoTA實現(xiàn)了一個標準。
那么現(xiàn)在不妨大膽地想象一下, 新一波人才引進,Grok可能會有什么樣的新升級?
網(wǎng)民:不管怎樣,Grok-1.5在哪里(還沒有開源)?
但不管怎么說,根據(jù)馬斯克之前提到的人才標準,這位網(wǎng)友說出了“真相”:
大家都說老馬的大模型公司都是人才。事實上,馬斯克根本不在乎你的才華。人們說,只要你能每周工作80個小時,你就可以加入他們。
80個小時?!
量子位捏指一算,那不就是一周一天工作11.5小時嗎?
不要說智力,這份工作從體力上我們做不到。
參考鏈接:[1]https://twitter.com/Pavel_Izmailov[2]https://twitter.com/jam3scampbell/status/1786149919041970683[3]https://x.ai/about[4]https://x.com/emollick/status/1787593669618393299
本文來自微信微信官方賬號“量子位”(ID:QbitAI),作者:關(guān)注前沿技術(shù),授權(quán)發(fā)布36氪。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com