國(guó)際AI大牛加盟阿里通義,聚焦下一代大模型研發(fā)
傳國(guó)際AI大??战蛋⒗锿x!

智東西9月29日消息,據(jù)“互聯(lián)網(wǎng)八卦小喇叭”等媒體爆料,全球頂尖AI科學(xué)家、IEEE Fellow許主洪(Steven Hoi)已加盟阿里通義,投身通義大模型的相關(guān)研發(fā)工作。
許主洪有著超20年AI產(chǎn)業(yè)和學(xué)術(shù)經(jīng)驗(yàn),是新加坡管理大學(xué)終身教授,還曾任新加坡南洋理工大學(xué)終身副教授。他在AI領(lǐng)域發(fā)表了300多篇頂級(jí)學(xué)術(shù)論文,論文被引用超過(guò)5萬(wàn)次,曾被斯坦福大學(xué)評(píng)為全球頂尖1%的AI科學(xué)家之一。
作為多模態(tài)大模型領(lǐng)域的領(lǐng)軍人物,許主洪曾擔(dān)任全球最大的企業(yè)軟件公司Salesforce的副總裁,從零開始構(gòu)建了Salesforce在亞洲的AI研究生態(tài)系統(tǒng)。2023年,他還創(chuàng)立了一家多模態(tài)AI創(chuàng)企HyperAGI,是業(yè)內(nèi)少有的產(chǎn)學(xué)研多棲AI大牛。

▲許主洪
2025年2月,許主洪加入阿里,擔(dān)任阿里集團(tuán)副總裁、智能信息事業(yè)群首席科學(xué)家,向智能信息事業(yè)群總裁吳嘉匯報(bào),負(fù)責(zé)AI To C業(yè)務(wù)的多模態(tài)基礎(chǔ)模型及智能體(Agents)研究與應(yīng)用。
原本,許主洪的核心任務(wù)是組建頂級(jí)AI算法團(tuán)隊(duì),整合通義(應(yīng)用)、夸克、天貓精靈等內(nèi)部資源,推動(dòng)多模態(tài)交互產(chǎn)品迭代,加速AI To C商業(yè)化。
在今年6月的2025上海世界移動(dòng)通信大會(huì)上,許主洪發(fā)表了題為《多模態(tài)大模型發(fā)展與演進(jìn)》的演講,以夸克App的AI超級(jí)框、AI相機(jī)等功能為例,講解了多模態(tài)大模型的應(yīng)用場(chǎng)景。

▲許主洪以夸克為例講解多模態(tài)大模型應(yīng)用場(chǎng)景
然而,加入阿里7個(gè)多月后,許主洪傳出加入通義實(shí)驗(yàn)室團(tuán)隊(duì),這可能意味著他將從面向AI To C商業(yè)化研發(fā)轉(zhuǎn)向更基礎(chǔ)前沿的大模型研發(fā)。
如果消息屬實(shí),這意味著阿里完成了一次重大的人才重配,也標(biāo)志著阿里在多模態(tài)大模型研發(fā)領(lǐng)域再投重碼。
當(dāng)下,阿里通義大模型正處于“拼迭代速度”、“多模態(tài)發(fā)展”的關(guān)鍵階段,十分需要許主洪這樣頂尖的產(chǎn)學(xué)研多棲且有分量的AI大牛坐鎮(zhèn)。
在9月底舉辦的2025云棲大會(huì)期間,阿里云智能集團(tuán)首席技術(shù)官、通義實(shí)驗(yàn)室負(fù)責(zé)人周靖人透露,連續(xù)發(fā)布數(shù)十款模型背后有戰(zhàn)略考量:全球AI模型進(jìn)展都在加速,整個(gè)通義家族一直在跟全球AI領(lǐng)域的領(lǐng)先者競(jìng)爭(zhēng),如今AI已進(jìn)入加速期,比拼的是模型迭代效率;同時(shí),模型從單模態(tài)到多模態(tài)的演進(jìn)是必然趨勢(shì),阿里期待在多模態(tài)方面有進(jìn)一步的創(chuàng)新和突破。
許主洪或是目前阿里最適合牽頭做這件事情的人。他曾在今年5月螞蟻技術(shù)開放日上的演講中提到,當(dāng)下,用統(tǒng)一的框架做理解和生成,是發(fā)展多模態(tài)大模型的一大演進(jìn)趨勢(shì)。但這一領(lǐng)域尚處于初級(jí)階段,需要實(shí)踐驗(yàn)證。

▲許主洪在講解統(tǒng)一多模態(tài)模型產(chǎn)業(yè)發(fā)展脈絡(luò)
許主洪指出,統(tǒng)一理解與生成的多模態(tài)大模型面臨眾多技術(shù)挑戰(zhàn)。在全模態(tài)交互方面,當(dāng)下支持音、視、圖、文全模態(tài)交互的公開單模型非常少見;在理解與生成統(tǒng)一方面,圖像和語(yǔ)意的理解生成統(tǒng)一模型鮮有出現(xiàn),且理解和生成效果難以平衡。
在6月的演講中,許主洪也提到:“多模態(tài)Agent AI時(shí)代才剛剛開始,未來(lái)要真正達(dá)到AGI,我們還需要解決很多技術(shù)難題,包括多模態(tài)大模型的基礎(chǔ)能力、Agent智能體的核心功能模塊、數(shù)據(jù)世界的連接與操作、物理世界的交互與控制等等,挑戰(zhàn)重重,但這也是未來(lái)多模態(tài)大模型行業(yè)的機(jī)會(huì)?!?/p>
截至目前,阿里及許主洪方未對(duì)此進(jìn)行置評(píng)。
本文來(lái)自微信公眾號(hào) “智東西”(ID:zhidxcom),作者:李水青,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com






