AI界本周(4.15-4.21)發(fā)生了什么?
文|趙煒嘉
編輯|鄧詠儀
大佬言論
李彥宏:開源模型將越來越落后
四月十六日,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏在Createate 在2024年百度AI開發(fā)者大會(huì)上,自然語言將逐步成為未來的通用編程語言,每個(gè)人都可以成為開發(fā)者,用自己的創(chuàng)造力改變自己的命運(yùn)。李彥宏還指出,“以前大家都覺得開源便宜。事實(shí)上,在模型場景中,開源是最貴的。因此,開源模型會(huì)越來越落后?!?/p>
扎克伯格:Llamama80億元 3還不夠小,大模型需要提高訓(xùn)練質(zhì)量。
4月18日,Llama 三是在著名主持人Dwarkesh正式發(fā)布后,扎克伯格。 在Patel的播客中,談到Meta。 AI技術(shù)路線,未來規(guī)劃,開源哲學(xué)。扎克伯格說:Llama 最小版本的80億參數(shù)模型“不夠小”,不能滿足大量使用場景。他更喜歡將模型蒸餾到5億和10億,看看他能做什么。
李飛飛報(bào)告:中國大模型世界第二,但專利數(shù)量和機(jī)器人世界第一。
四月十五日,由中國女科學(xué)家、“人工智能教母”李飛飛聯(lián)合領(lǐng)導(dǎo)的HAI研究所(Stanford HAI)最近發(fā)布了《2024》 年度人工智能指數(shù)報(bào)告。
報(bào)告指出,2023 年,61 一個(gè)著名的人工智能模型來自美國機(jī)構(gòu),超越了歐盟。 21 個(gè)和中國的 15 個(gè)。 然而,中國仍然是美國最大的競爭對(duì)手,中國的機(jī)器人安裝量居世界第一。同樣,世界上大多數(shù)人工智能專利(61%)來自中國。
此外,4月18日,李飛飛在拜登國情咨文演講中呼吁拜登政府投資建設(shè)國家計(jì)算能力和數(shù)據(jù)庫房。她指出,目前大量AI學(xué)術(shù)界的明星人才正在流失,大企業(yè)正在以高薪挖掘?qū)W術(shù)界的人才資源。研究大模型的高成本正在排除這一領(lǐng)域的研究人員,從而損害學(xué)術(shù)界的單獨(dú)研究。
大事件
Meta 新一代開源模型 Llama 3
當(dāng)?shù)貢r(shí)間4月18日,Meta 公司宣布推出新一代大型語言模型Llamama最新開源。 3,包括 8B 和 70B 這兩個(gè)參數(shù)規(guī)模。Llama 3在由24000個(gè)GPU組成的定制集群中,使用15萬億個(gè)token進(jìn)行訓(xùn)練,前后長度達(dá)到8K,推理代碼大大提高,代碼和權(quán)重全開源。Llama 現(xiàn)在可以在網(wǎng)頁版Meta 使用AI免登錄。
Stable Diffusion 3 API發(fā)布
4月17日,Stability StableAI正式發(fā)布 Diffusion 3 API,在文字位置、提示詞遵循層面等方面,新SD3大幅提升,超越DALLL。-E 和Midjourney3 V6等行業(yè)領(lǐng)先模式。SD3技術(shù)目前還沒有完全開源,但是Stability 對(duì)普通用戶來說,AI承諾SD3模型不收費(fèi)。
Reka 與GPT-4相比,Core登場。、Claude 3
前DeepMind4月16日、Google 由Brain和FAIR成員組成的AI初創(chuàng)公司Reka推出了與GPT-4相匹配的多模式大模式Reka Core,具有理解圖像、音頻和視頻的能力,支持GPT-4和Claude的32種語言。 3 Opus匹敵。然而,Reka并沒有計(jì)劃開源這個(gè)模型。
AI界前線
OpenAI是東京第一個(gè)亞洲服務(wù)辦公室。
4月15日,OpenAI宣布在日本東京開設(shè)第一個(gè)亞洲服務(wù)辦公室,承諾與政府、當(dāng)?shù)仄髽I(yè)和研究機(jī)構(gòu)合作,開發(fā)安全的AI工具,以滿足當(dāng)?shù)匦枨?。與此同時(shí),OpenAI還宣布推出了一款GPT-4定制模型,專門為日本語言優(yōu)化而設(shè)計(jì)。它在翻譯和總結(jié)日語文本方面表現(xiàn)出色,性能和速度明顯提高,成本更高效,速度提高到原來的三倍。
電動(dòng)版Atlas機(jī)器人波士頓動(dòng)力推出
當(dāng)?shù)貢r(shí)間4月17日,波士頓動(dòng)力推出全電動(dòng)版,原液壓版Atlas人形機(jī)器人退役一天后, 機(jī)器人Atlas。
電動(dòng)Atlas的動(dòng)作自由度和靈活性遠(yuǎn)遠(yuǎn)超過人類。它繼承了液壓版的三指設(shè)計(jì),選擇了比前身更流線型的設(shè)計(jì),機(jī)械框架更加靈活,類似于環(huán)形燈的頭部,不暴露任何電纜。
英特爾推出了世界上最大的神經(jīng)擬態(tài)系統(tǒng),比人腦快200倍
美國芯片巨頭英特爾當(dāng)?shù)貢r(shí)間4月17日(Intel)該公司宣布,它已建立了世界上最大的神經(jīng)擬態(tài)系統(tǒng)Halalala Point,擁有11.5 1億次神經(jīng)元和1280億次突觸,最高速度可達(dá)人腦200倍。該系統(tǒng)最初部署在桑迪亞國家實(shí)驗(yàn)室,選擇英特爾Loihi 2Cpu,旨在支持類腦AI未來的研究。
文心一言4.0工具版更新,還發(fā)了三個(gè)AI開發(fā)工具。
4 月 16 2024百度Create 在AI開發(fā)者大會(huì)上,百度正式宣布基礎(chǔ)模型全面更新,并推出了包括智能體開發(fā)工具在內(nèi)的4.0工具版。 AgentBuilder、AI 原生應(yīng)用開發(fā)工具 為了對(duì)應(yīng)不同的開發(fā)場景,AppBuilder和模型定制工具M(jìn)odelBuilder。
賈佳亞團(tuán)隊(duì)Mini-Gemini全開源源
賈佳亞團(tuán)隊(duì),香港中文大學(xué)終身教授,提出多模式模型Mini-Gemini,結(jié)合ChatGPT,提供2B到34B模型大小范圍。 DALL·E 具有更高清晰度圖像的準(zhǔn)確理解,更高質(zhì)量的訓(xùn)練數(shù)據(jù),更強(qiáng)的圖像分析推理能力,還可以結(jié)合圖像推理和生成。目前,Mini-從代碼、模型到數(shù)據(jù),Gemini已經(jīng)完全開源,在線Demo也已經(jīng)發(fā)布。
聯(lián)想正式宣布5款A(yù)I PC
四月十八日,聯(lián)想TechWorld 2024年在上海開幕。聯(lián)想發(fā)布了AI智能體“聯(lián)想小天”嵌入個(gè)性化的AI。 PC系列產(chǎn)品。用戶可以基于自然語言與“小天”互動(dòng),“小天”可以在互動(dòng)中逐漸完善。在官方演示中,“小天”有能力通過自然語言找到照片、AI跨端生圖等本土化的AI。
融資動(dòng)態(tài)
創(chuàng)業(yè)公司芯片 Rivos 融資 2.5 億美金
4月17日消息,RISC-Rivos宣布,V芯片創(chuàng)業(yè)公司正在宣布 A-3 在輪融資中籌集了超過 2.5 一億美元,這筆資金將專門用于開發(fā)第一款針對(duì)生成式AI()和數(shù)據(jù)分析工作負(fù)荷的加速器產(chǎn)品。Matrix Capital是本輪最大的投資者管理人員,英特爾資本,聯(lián)發(fā)科(MTK)、Cambium Capital、CIDC、Capital Hotung和TEN Venture Group和其他投資機(jī)構(gòu)也積極參與此次融資。
在阿聯(lián)酋AI公司,微軟將投資15億美元
4月16日,微軟表示,將向總部位于阿聯(lián)酋的人工智能公司G42投資15億美元,讓這家美國科技巨頭在G42獲得少數(shù)股權(quán)和董事會(huì)席位。G42將在微軟的云計(jì)算平臺(tái)Azure上運(yùn)行,為世界公共行政用戶和大型企業(yè)提供先進(jìn)的人工智能解決方案。
新玩意
Rewind宣布改名為Limitless,推出可穿戴AI吊墜
四月十七日,Rewind改名為Limitless,推出了可穿戴的會(huì)議場景。 AI 吊墜具有提供實(shí)時(shí)筆記、會(huì)議轉(zhuǎn)錄和會(huì)議摘要的功能,預(yù)計(jì)8月份售價(jià)99美元。Limitless為用戶配置了“同意方式”,以確保隱私保護(hù)和加密云服務(wù)的數(shù)據(jù)隱私,用戶可以控制參數(shù)解密。
前沿研究
Meta可以實(shí)現(xiàn)無限前后文長度的新算法。
聯(lián)合南加州大學(xué)的Meta,CMU、最近,UCSD的研究人員發(fā)表了一篇名為Megalodon的算法。它是一種新型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),能夠有效地處理有無限前后長度的文本。Megalodon引進(jìn)了多個(gè)創(chuàng)新部件,顯著提高了模型能力、穩(wěn)定性和訓(xùn)練性能,并且在多個(gè)基準(zhǔn)測試中表現(xiàn)出了優(yōu)于Llama2的性能。
VASA-11微軟推出單圖生數(shù)字人技術(shù)
四月十八日,微軟發(fā)布了VASA-1技術(shù),可以通過單個(gè)圖片和音頻生成逼真的數(shù)字視頻。VASA-1使用面部動(dòng)態(tài)統(tǒng)一編碼和Diffusion Transformer技術(shù)可以實(shí)現(xiàn)精確的唇語同步和自然的表情動(dòng)作,并且支持即時(shí)生成。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com