蘋果2025年國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)將展示多項(xiàng)成果
IT之家10月14日消息,今日,蘋果公司確認(rèn)將參加2025年10月19日至23日在檀香山舉行的國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)(ICCV)。

據(jù)蘋果公司介紹,ICCV“每年與歐洲計(jì)算機(jī)視覺(jué)會(huì)議(ECCV)交替舉行,聚焦于計(jì)算機(jī)視覺(jué)領(lǐng)域的關(guān)鍵議題”。
除提交并獲錄用的八篇論文將在大會(huì)的海報(bào)展示和口頭報(bào)告環(huán)節(jié)亮相外,蘋果還將參與大會(huì)主旨演講。蘋果機(jī)器學(xué)習(xí)應(yīng)用研究部經(jīng)理C. Thomas博士將出席第三屆基于視覺(jué)的工業(yè)檢測(cè)研討會(huì)(VISION),并發(fā)表主題演講,Thomas博士的演講主題將在未來(lái)幾天內(nèi)公布,其演講定于10月19日舉行。
IT之家附蘋果將在ICCV 2025上展示的八篇論文如下:
ETVA:通過(guò)細(xì)粒度問(wèn)題生成與回答實(shí)現(xiàn)文本到視頻對(duì)齊的評(píng)估
MM - Spatial:探索多模態(tài)大語(yǔ)言模型中的三維空間理解能力
原生多模態(tài)模型的擴(kuò)展規(guī)律研究
穩(wěn)定擴(kuò)散模型在視覺(jué)上下文學(xué)習(xí)中表現(xiàn)出隱性優(yōu)勢(shì)
STIV:可擴(kuò)展的文本與圖像條件化視頻生成方法
UINavBench:交互式數(shù)字智能體綜合評(píng)估框架
基于多模態(tài)提示的統(tǒng)一開放世界分割技術(shù)
UniVG:用于統(tǒng)一圖像生成與編輯的通用擴(kuò)散模型
此外,蘋果還將參與“計(jì)算機(jī)視覺(jué)領(lǐng)域女性研討會(huì)”(Women in Computer Vision Workshop)。蘋果研究人員Patricia Vitoria Carrera與Tanya Glozman將在會(huì)后晚宴上擔(dān)任導(dǎo)師。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



