蘋果打“道德牌”,AI訓(xùn)練聲明或成“免責(zé)聲明”
志在打造“超級(jí)智能”的Meta成了當(dāng)下硅谷的焦點(diǎn),AI科學(xué)家的“轉(zhuǎn)會(huì)費(fèi)”堪比足球明星。其中,以2億美元身價(jià)加盟Meta的蘋果基礎(chǔ)模型團(tuán)隊(duì)負(fù)責(zé)人龐若鳴 (Ruoming Pang) 最為知名。
日前,蘋果公開(kāi)了龐若鳴在該公司的最后一份成果《Apple Intelligence Foundation Language Models – Tech Report 2025》,展示了2025年后在基礎(chǔ)模型領(lǐng)域的技術(shù)革新。

論文顯示,他們持續(xù)優(yōu)化端云協(xié)同的混合模型。30億參數(shù)的端側(cè)模型Apple On-Device內(nèi)存占用降低約37.5%,讓iPhone在不增加內(nèi)存的情況下,用戶運(yùn)行端側(cè)模型時(shí)能打開(kāi)更多應(yīng)用。云端的Apple Server模型獲得“并行軌道混合專家”,在保持智能水平的同時(shí),提升了效率與擴(kuò)展能力。
除了模型技術(shù)解析,論文最大亮點(diǎn)是Apple Intelligence訓(xùn)練未使用任何非法從網(wǎng)絡(luò)抓取的數(shù)據(jù)。蘋果強(qiáng)調(diào)訓(xùn)練數(shù)據(jù)包括授權(quán)數(shù)據(jù)、公開(kāi)或開(kāi)源數(shù)據(jù)集,以及通過(guò)Applebot網(wǎng)絡(luò)爬蟲(chóng)抓取的公開(kāi)信息,還承諾不抓取明確反對(duì)數(shù)據(jù)抓取的出版商內(nèi)容。

美國(guó)加州法院裁定AI初創(chuàng)企業(yè)Anthropic使用受版權(quán)保護(hù)作品訓(xùn)練AI大模型符合“合理使用原則”,這讓AI廠商如脫韁野馬。該原則曾庇護(hù)互聯(lián)網(wǎng)產(chǎn)業(yè),如今惠及AI行業(yè)。
但在版權(quán)方看來(lái),AI行業(yè)對(duì)版權(quán)內(nèi)容的“合理使用”破壞力更強(qiáng)。上世紀(jì)90年代互聯(lián)網(wǎng)萌芽,谷歌數(shù)字圖書(shū)館項(xiàng)目掃描圖書(shū)資源并電子化,互聯(lián)網(wǎng)廠商合理使用版權(quán)內(nèi)容還需費(fèi)一番周折。

隨著互聯(lián)網(wǎng)經(jīng)濟(jì)發(fā)展,版權(quán)方為傳播內(nèi)容進(jìn)行數(shù)字化轉(zhuǎn)型,將內(nèi)容搬到網(wǎng)上,卻使內(nèi)容暴露在AI廠商爬蟲(chóng)面前。由于技術(shù)差距,版權(quán)方面對(duì)AI爬蟲(chóng)幾乎無(wú)計(jì)可施,而法院又偏向AI廠商。此時(shí),蘋果與其他AI廠商劃清界限,稱將遵循最佳倫理抓取實(shí)踐,遵守robots.txt協(xié)議,允許網(wǎng)頁(yè)所有者選擇是否讓內(nèi)容用于訓(xùn)練蘋果生成式基礎(chǔ)模型。

此外,蘋果承諾網(wǎng)站方拒絕Applebot不會(huì)被“刁難”,網(wǎng)頁(yè)所有者能細(xì)致控制Applebot訪問(wèn)頁(yè)面及使用方式,頁(yè)面仍可出現(xiàn)在Siri和Spotlight搜索結(jié)果中。顯然,這一聲明會(huì)為蘋果在版權(quán)方面贏得不少好感。
然而,在AI從業(yè)者看來(lái),蘋果此舉是在為自己開(kāi)脫,也為其在AI領(lǐng)域可能長(zhǎng)期追趕打預(yù)防針。業(yè)內(nèi)都知道,2023、2024年AI大模型技術(shù)突飛猛進(jìn),性能大幅提升,是AI廠商消化互聯(lián)網(wǎng)三十年積累的結(jié)果。

像Common Crawl、The Pile、維基百科等公開(kāi)或開(kāi)源數(shù)據(jù)集,已被AI廠商用得差不多了,蘋果強(qiáng)調(diào)使用“獲得授權(quán)的數(shù)據(jù)”。雖說(shuō)尊重出版商權(quán)益是好事,但并非每個(gè)出版商都愿給蘋果機(jī)會(huì)。
現(xiàn)有開(kāi)源數(shù)據(jù)集幾乎都用于AI大模型預(yù)訓(xùn)練,蘋果只能指望出版商新內(nèi)容??赡男┏霭嫔虝?huì)愿意數(shù)據(jù)被抓取用于AI訓(xùn)練呢?
互聯(lián)網(wǎng)內(nèi)容平臺(tái)方面,除Reddit外,全球主流平臺(tái)基本都有AI業(yè)務(wù)。馬斯克的X有xAI,Instagram、Facebook、Thread屬M(fèi)eta,YouTube背后是谷歌。

傳統(tǒng)出版商情況更復(fù)雜。AI助手分走搜索引擎流量,其整合內(nèi)容的特性讓出版商對(duì)新聞編輯和采集方式的改變?cè)桨l(fā)不安。有人會(huì)問(wèn),新聞集團(tuán)、Axel Springer、康泰納仕和美聯(lián)社等與OpenAI達(dá)成了協(xié)議。
但OpenAI和蘋果不能相提并論。這些因作品被擅自使用而憤怒的出版商,是無(wú)奈接受OpenAI的事后補(bǔ)償。而且,谷歌以AI Mode改造搜索引擎,搜索市場(chǎng)格局改變。AI Mode讓用戶無(wú)需點(diǎn)擊鏈接獲取信息,谷歌降低了對(duì)外部網(wǎng)站的引流。

AI Mode減少用戶訪問(wèn)網(wǎng)站,降低了出版商廣告變現(xiàn)能力。OpenAI推出SearchGPT,給了出版商谷歌搜索的替代選項(xiàng),而蘋果沒(méi)有這樣的籌碼,Spotlight作為搜索引擎都不夠格,更不用說(shuō)AI搜索了。
蘋果缺乏獲取授權(quán)數(shù)據(jù)的籌碼,公開(kāi)數(shù)據(jù)又已耗盡,所以這個(gè)聲明現(xiàn)實(shí)意義不大,更像“免責(zé)聲明”。
本文來(lái)自微信公眾號(hào)“三易生活”,作者:三易菌,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





