亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

一夜之間,谷歌亮出了十幾款商品對戰(zhàn)OpenAI:什么都有,只是沒有驚喜

2024-05-18

昨晚OpenAI的科幻級演示結(jié)束后,每個人都在等待谷歌今晚的反擊。


如果說2023年的I/O大會是谷歌在AI領(lǐng)域的最后一站,雖然今年的I/O大會上皮查依靠自己的Gemini等商品逐漸趕上了OpenAI,但情況并不令人愉快。在過去的一年里,即使使用了2個月的免費殺手,Gemini的用戶數(shù)量也只是ChatGPT的五分之一。每次新產(chǎn)品上市,肯定會被OpenAI攔截,讓谷歌成為AI界的汪峰。


所以皮查太需要一場亮眼的新聞發(fā)布會,取回屬于谷歌的排面。


所以和OpenAI只有半個小時的發(fā)布會完全不一樣,集中在產(chǎn)品介紹上。谷歌的I/O骨子里有一種武庫拼死一戰(zhàn)的意思。在兩個小時的新聞發(fā)布會上,它一口氣拿出了十幾款新產(chǎn)品和升級產(chǎn)品,數(shù)量眾多,管理飽滿,全面標(biāo)桿了OpenAI在AI各個領(lǐng)域的發(fā)展。


很多產(chǎn)品單看Demo還是有很好的完成率的,但是整個發(fā)布會并沒有GPT-4o那么驚艷。因為他們發(fā)布的大部分東西都是追逐OpenAI現(xiàn)有的東西,所以沒有人會對別人已經(jīng)做過的東西感到驚訝。


最有可能帶來驚艷感的新產(chǎn)品——Gemini 昨天的GPT-4o已經(jīng)完成了Astra的戲份。


最后,想要展示肌肉的谷歌,依然被OpenAI四兩撥千斤卸下。


從其搜索產(chǎn)品、模型產(chǎn)品等方面,我們更多地看到了谷歌的疲態(tài),缺乏創(chuàng)新。


本來想看巔峰對決,可其實昨天這場對戰(zhàn)已經(jīng)結(jié)束了。


谷歌I/O開發(fā)者大會第一天全程回顧(中文同傳版)


另外,雖然Gemini本身就是期貨發(fā)貨,但基本上谷歌的這次發(fā)布也是期貨。看完整個新聞發(fā)布會就像逛完一個期房交易市場一樣失落,心里甚至有點疑惑“別是爛尾樓吧”。這在谷歌商品序列中并不罕見?!狶ydia,ESG,在半年左右的時間里,這些商品還沒有完全向用戶開放。AI領(lǐng)域日新月異,這一開放速度基本上與爛尾無疑。


我們理解谷歌急于秀肌肉,但是我們急于使用,不想看期貨,也希望谷歌能夠多了解。


由于產(chǎn)品太多,我們做了一個簡單的表格整合,有14個與AI相關(guān)的產(chǎn)品發(fā)布和新升級相結(jié)合:


接下來,我們將沿著新聞發(fā)布會的四個主題來拆解這次I/O大會谷歌帶來的各種商品。


01 基礎(chǔ)模型:Gemini 1.5 Pro 期貨成真,Light 提速增效,Gemini 2 顯露可能


Geminini發(fā)布于三個月前。 1.5 終于,Pro不再是期貨了!從今天開始,這將正式向訂閱Geminnini開放 Advance用戶。假設(shè)你以前沒有白嫖,那么你可以在這兩個月內(nèi)免費使用。


除期貨實現(xiàn)外,谷歌在這三個月沒有完全鋪開的時間里,也沒有停止對其進行升級,四個基本模型最重要的層次都得到了加強。


首先是模型性能。谷歌提高了代碼生成、邏輯判斷和計劃、多回合對話和音頻和圖像理解能力,并通過數(shù)據(jù)和算法進行了改進。最新版本 1.5 Pro Sota在多個benchmark中取得了成績,谷歌揚眉吐氣。


在文章的前后,谷歌還將新Geminini。 1.5 Pro 前后文窗口是業(yè)內(nèi)最高的100萬token 擴展到合300本書的200萬token。三個月翻了一番,谷歌的表現(xiàn)證明了今年上下文的問題似乎已經(jīng)不是門檻了。


對多模態(tài)支持,Gemini 現(xiàn)在,Pro已經(jīng)彌補了語音理解的過去缺點。雖然它不像GPT-4o那樣是一種原始的語音模式,但它最終是一個完整的模式,成為一個完整的身體。


對使用體驗的指令跟隨能力影響很大,Gemini 1.5 Pro也進行了一輪更新。如今,我們可以遵循越來越復(fù)雜和微妙的指令,包括指定商品級行為的指令(如角色、格式和風(fēng)格)?,F(xiàn)在你可以讓Gemni假裝你是一只貓。


盡管Geminini未公布 二是但是四維打滿,從數(shù)據(jù)上看,Geminini全面超越GPT4。 1.5 Pro仍然可以為谷歌提供更多的場景。


Geminini后續(xù)宣布 1.5 這場比賽的汪峰本峰就是Flash。它的主要特點——快速響應(yīng)和昨天的GPT-4o完美碰車,本該有的驚艷感被徹底摧毀。


就功能而言,雖然它比較 1.5 Pro 重量輕,但也可以跨越大量信息進行多模式推理,擅長摘要、聊天、圖像和視頻字幕、長文檔和表格的數(shù)據(jù)提取。但是不像GPT-4o青,Gemini 1.5 Flash仍然犧牲了一些性能來實現(xiàn)它的速度。


昨天的GPT-4o基本上等于沒有寫的技術(shù)報告無法解釋的速度。谷歌誠實。從技術(shù)文檔來看,這是因為 Flash 通過一個叫做“蒸餾”的過程,將最重要的知識和技能從更大的模型傳遞到更小更有效的模型,從而提高速度。


Agent需要支持這里展示的能力,所以谷歌的下一個重磅產(chǎn)品是Project。 Astra。谷歌將其定義為Agent戰(zhàn)略的核心。


這是一個Agent 框架:為了真正有用,Agent需要像人類一樣理解和回應(yīng)復(fù)雜的世界——并記住它所看到和聽到的,以理解前后的文本并付諸行動。此外,它還具有主動性、教學(xué)性和個性,使用戶能夠在不滯后或延遲的情況下自然地與其交流。低延遲需求使您能夠?qū)stra理解為Geminini。 Light Agent方法。其最佳形式是谷歌展示的個人助手。


因此,為了讓它更有用,谷歌可以通過持續(xù)編碼視頻幀,將視頻和語音輸入結(jié)合到事件的時間線上,緩存這些信息來更快地處理數(shù)據(jù),從而實現(xiàn)快速記憶,也就是可以與視頻互動,有時間記憶。谷歌還通過語音模型增強了Astra的聲音,使得Agent的語氣更加廣泛,使得這些Agent能夠更好地理解它們的前后文本,并在對話中迅速做出反應(yīng)。


就演示而言,Astra的視覺理解能力確實令人印象深刻??梢岳斫庋Χㄖ@的貓這種梗,反饋速度也很快。


但是它并沒有超越想象。整個演示的感覺就是看GPT-4o的視頻交流Demo。而且遠比GPT-4o期貨,上線需要幾個月的時間。


谷歌說,這不是幾周,而是今年晚些時候。這個功能中只有“一些”產(chǎn)品會進入谷歌,可能是XR眼鏡,也可能是自助手。


所以Flash被GPT-4o模型截胡,Astra 被GPT-4o的商品攔截。您認(rèn)為OpenAI沒有內(nèi)鬼知道谷歌 I我絕對不相信/O的信息。OpenAI做了一件事,就是證明它能做到,而且比你做得更好,出得比你早。


然而,如果我們繼續(xù)思考,OpenAI在谷歌發(fā)布產(chǎn)品后會有完全不同的升級來切斷胡谷歌的受歡迎程度。這一次,我們在谷歌之前做了一個功能完全相同的產(chǎn)品來打破它帶來的驚喜。這不禁讓人懷疑OpenAI是否真的沒有新產(chǎn)品儲備。


除兩個核心模型的更新外,谷歌還宣布了Gemmama,前一場大火的開源模型。 2.0版本,270億參數(shù)。并且擴展了PaliGemma這一多模態(tài)版本。因為Llama3 官方還沒有微調(diào)多模式,這大概是目前官方開源多模式最強的模式了。根據(jù)谷歌的說法,它的發(fā)展受到了Pali-3的影響。


02 多模式生成模式:谷歌版Sora相當(dāng)驚艷,其它都有點常規(guī)。


除新公開的文生視頻模型外,谷歌還推出了文生圖像模型Imagen 3。根據(jù)細節(jié)擬真度和Midjourney 與Dalle-3相比,v6可以達到同樣的水平。而且在跟蹤細節(jié)方面也要更加細致。


在音樂生成方面,去年驚人的期貨Lydia仍然是期貨,直到這次發(fā)布會。谷歌給他增加了一個新的擴張。 Music AI Sandbox,一套音樂 AI 工具。這類工具旨在為創(chuàng)意打開一個新的游樂場,讓人們重新開始創(chuàng)造新的器樂部分,以新的方式轉(zhuǎn)換聲音等等。


接著是酷炫的電影,看上去比Suno還要厲害。但是我不需要,所以還是可以用的很厲害。


最后,谷歌介紹了自己的視頻生成模型——Veo 。這是谷歌之前一系列視頻生成嘗試的大成者:與WALT融為一體、VideoPoet、在Sora之前發(fā)布的Lumiere這些明星文生視頻模型的優(yōu)勢。


就能力而言,它相當(dāng)能打,能產(chǎn)生高質(zhì)量的產(chǎn)品。 1080p 分辨率視頻,可以超過一分鐘,包括廣泛的電影和視覺風(fēng)格。



Veo生成的場景在示例視頻中是相當(dāng)一致和連貫的:人物、動物和物體在鏡頭中非常真實地移動。


谷歌還強調(diào),Veo 具有高級理解自然語言和視覺語義的能力,可以生成與用戶創(chuàng)意愿景緊密匹配的視頻——準(zhǔn)確呈現(xiàn)詳細的長提醒,捕捉情緒。Veo甚至可以理解電影術(shù)語,比如“延遲”或者“航拍鏡頭”。


質(zhì)量方面,谷歌的Veo和Sora有一戰(zhàn)之力。但不得不說,谷歌真的不擅長演示。在整個演示過程中,他們放了一個追逐長度的汽車生成視頻,不是全屏,看不清細節(jié)。其他都是小片段,小幅度,細節(jié)模糊。震撼力受到影響。


但是,和Sora一樣,Veo 只會把作為 VideoFX 個人預(yù)覽版提供給少數(shù)創(chuàng)作者,普通用戶可以報名加入替補序列。然而,這也表明,有了VEo,谷歌和OpenAI已經(jīng)進入了同一個競爭,誰能首先降低成本,將這項技術(shù)推向toC領(lǐng)域。


03 AI搜索:多模態(tài)最強,但創(chuàng)新有限


AI搜索可以算是谷歌的必爭之地。面對來勢洶洶的新秀Perplexity,他們自稱要取代谷歌搜索,谷歌即使不需要AI,也要保留后者。


從去年開始,雖然新興的AI搜索獲得了很多客戶,但基本上沒有動搖谷歌搜索的基礎(chǔ)。所以谷歌也是一副不慌不忙的樣子:自去年5月以來,其AI搜索服務(wù)ESG終于從今天開始向公眾開放使用了一整年。這個更強大的AI搜索引擎被谷歌命名為AI Overview,但是僅限于美國,其他國家還要排隊等待開放。


就Demo展示而言,谷歌搜索在功能上沒有太多的創(chuàng)新,主要集中在多模式上。


第一,用戶可以通過簡化語言或者更詳細地分解來調(diào)整。 AI 簡述搜索結(jié)果。這一功能并不新穎,目前主流的AI搜索產(chǎn)品也將區(qū)分快速回復(fù)和更深入的研究方法。


其次,借助 Gemini 多步推理能力,AI 搜索可以一次處理復(fù)雜的多步,甚至多個問題。例如,當(dāng)顧客尋找新的瑜伽或普拉提工作室時,顧客希望找到受當(dāng)?shù)厝藲g迎、方便用戶通勤的選項,并提供新會員折扣。通過谷歌AI搜索,用戶可以通過搜索查找波士頓最好的瑜伽或普拉提工作室,并顯示其入門優(yōu)惠和從眾。 Beacon Hill 詳細的步行時間信息”問題得到了正確的答案。


它也是目前其它AI搜索產(chǎn)品正在努力克服的一個方向。在這方面,谷歌很可能憑借模型優(yōu)勢得到更好的處理。


AI搜索的計劃能力也建立在多步推理能力之上。通過AI搜索中的計劃功能,您可以在搜索中直接獲得一個完整的計劃。舉例來說,搜索類似于“為一群人制定一個容易準(zhǔn)備的三天餐飲計劃”,你會得到一個起點,包括各種來自網(wǎng)絡(luò)的食譜。其它搜索軟件暫時還沒有專業(yè)化的能力。但對可以聯(lián)網(wǎng)的ChatGPT來說,這并不難。谷歌搜索機構(gòu)當(dāng)然更好看,也可以直接連接,客戶體驗更好。


GPT-4o生成版本


生成版本的谷歌


最終是靈感延伸功能,即AI搜索正在創(chuàng)建一個 AI 組織結(jié)果頁面讓你更容易探索。問完一個問題,谷歌搜索會延伸到其他你可能感興趣的結(jié)果。根據(jù)獨特的結(jié)果。 AI 生成標(biāo)題分類,展示一般角度和內(nèi)容類型。這種聯(lián)想搜索能力已經(jīng)成為AI搜索的標(biāo)準(zhǔn),但谷歌已經(jīng)更好地結(jié)構(gòu)化了這一功能。


上述功能,其他AI搜索都可以做,但是谷歌的結(jié)構(gòu)化和界面做得最好。僅此而已。


最后,其它AI搜索暫時無法實現(xiàn)的是多模態(tài)搜索。


谷歌依靠Gemini的多模態(tài)功能,可以用聲音搜索歌曲,用圖片搜索商品。你甚至可以使用Circle to Secarch 在照片中標(biāo)出部分功能進行搜索。


AI也可以結(jié)合視頻搜索。谷歌舉了一個案例。例如,用戶在舊貨店購買了一臺唱片機,但打開后無法工作,含有針頭的金屬部件不小心漂移了。使用視頻搜索可以節(jié)省客戶找到合適的單詞和句子來描述這個問題的時間和麻煩。


但是Perplexity們,總有一天會使用多模態(tài)模型。當(dāng)我看到他們用看圖視花作為例子來介紹谷歌搜索的多模態(tài)功能時,我首先想到的是微信掃描,所以我做不到(雖然原理不同)。


04 模型產(chǎn)品升級:GPTs谷歌版上線,生態(tài)剛剛跟上。


模特產(chǎn)品可以說是最令人失望的一環(huán)。沒有創(chuàng)意,還有多少讓人看得出谷歌的傳統(tǒng)趨勢。


首先,Wrokspace與Gemini相結(jié)合。


你可以通過 Side Panel(一個可以喚起Gemini的側(cè)欄)總結(jié)一系列功能郵件,可以總結(jié)你的賬單,形成一個Sheet。OK,我去年看到了。自動回復(fù)郵件。我去年看到了。


每一個都進行了小的升級,比如回復(fù)郵件可以從確定、拒絕、擱置三種可能性中選擇。但是...現(xiàn)場的掌聲很少。


包括社交軟件在內(nèi)的其他更新的虛擬員工Chip基本沒有超過我們前幾個月在中國看到的各種辦公軟件Agent的演示。



總的來說,谷歌在去年的I/O大會上展示的概率可以在下個月實現(xiàn)。因為Side Panel這個產(chǎn)品下個月才公開開放。


Gminiini是模型產(chǎn)品中最重要的更新。 Live。它是一種移動對話助手產(chǎn)品, Gemini Live,用戶可以與 Gemini 交談,并選擇各種自然的聲音來回應(yīng)。顧客甚至可以按照自己的節(jié)奏說話,或者半途而廢地回答問題,就像你在任何對話中一樣。并且在今年晚些時候,用戶可以在上線時使用攝像頭,并且可以打開周圍所見內(nèi)容的對話。


好吧,再一次GPT-4o的即視感。


其它幾款產(chǎn)品的升級實際上是追求特征。


Gems出現(xiàn)的時候真的有點尷尬,整個場景都是沉默的,因為大家一聽介紹就知道這是谷歌的GPTs,還是一個版本慢了半年。用戶可以創(chuàng)建定制的Geminni。描述希望 Gem 做什么,希望它怎么回應(yīng),比如“你是我的跑步教練,給我一個日常的跑步計劃,并且保持積極、樂觀、鼓勵的態(tài)度?!保珿emini 根據(jù)這些指示進行增強,以創(chuàng)建一個符合你特定需要的指示。 Gem。


所以只能依靠Prompt來制定,沒有外部工具,沒有工作流程。


這個產(chǎn)品屬于Agent產(chǎn)品,發(fā)布遲了半年,功能不如GPTs。


API擴展功能將于去年上線,例如正在推出的API擴展功能。 YouTube Music 拓展、Google Calendar、Tasks 和 Keep。全部都是谷歌自己的服務(wù)。老實說,在這次擴展之前,谷歌的插件庫就是這樣五個插件,完全是少得可憐。即便加上這些新的擴展,API庫也完全不能與其他Agent產(chǎn)品相提并論。



(在新聞發(fā)布會之前,只有這些擴展可用)


從這個角度來看,谷歌墨守成規(guī)的沙文心態(tài)在自己的生態(tài)中一目了然。


05 Andriod AI:GPT桌面版占盡了風(fēng)景


除了 Cricle in 此次Androidroid之外,Search聚焦于具體照片的局部多模態(tài)搜索。 AI的關(guān)鍵是介紹Gemini的手機應(yīng)用程序,可以與手機正在展示的內(nèi)容進行互動。例如,從你正在看YouTube頻道反饋的角度來看,閱讀打開的PDF。


挺好的,GPT-昨天4o的桌面版都做到了,而且和這里的Android相比,實際上是讀取打開的文檔,GPT-4o版本更像是和你一起看著桌面上發(fā)生的一切。另外,它還有精彩的聲音。


06 硬件:TPU穩(wěn)步升級


本次發(fā)布會上,谷歌最新的TPU是所有AI模型?!猅rillium TPU訓(xùn)練。與上一代相比,它的進步仍然十分明顯。Trillium完成了每個芯片峰值計算特性。 4.7 倍提高,比 TPU v5e 增加了一倍。高帶寬內(nèi)存(HBM)容量與帶寬和芯片之間的連接(ICI)它的帶寬也比v5e翻了一番。


此外,Trillium 配置第三代 SparseCore,它是一種特殊的加速器,用于處理超大嵌入,在先進的排序和推薦的工作負(fù)荷中更為常見。Trillium TPU 使下一波基礎(chǔ)模型訓(xùn)練更快,并以更低的延遲和更低的成本為這些模型提供服務(wù)。Trillium 可以擴展到一個包括 256 個 TPU 單高帶寬低延遲 Pod。


另外,Trillium能耗。 TPU 比 TPU v5e 能源效率提高了 67% 上述,節(jié)電能力一流。


07 結(jié)語


在這次新聞發(fā)布會上,觀眾非常痛苦。


我們希望看到新的、有競爭力的產(chǎn)品,谷歌卻在不斷地播放電影。由創(chuàng)作者的感覺,到感覺演示,都是沒有商品細節(jié)的表現(xiàn)。


現(xiàn)場演示我們想看,但是演示內(nèi)容平淡無奇。


甚至在許多地方都是重復(fù)的,許多產(chǎn)品在不同的地方被多次提及和展示。


所以這兩個小時看起來非常冗雜和乏味。


因為沒有驚喜,我甚至很少被激起好奇心。


當(dāng)然也有OpenAI截胡的原因,但是昨天25分鐘,三個產(chǎn)品的發(fā)布會(其中一個UI基本沒有提到),足以破壞谷歌發(fā)布更新兩個小時十幾個產(chǎn)品產(chǎn)生的所有驚喜。


那說明了什么問題?


毫無疑問,谷歌的技術(shù)力量依然存在,那些模型都非常出色。但是那些令人驚嘆的技術(shù)突破,令人興奮的產(chǎn)品演示,都沒有了。


有些只是可以預(yù)見的表現(xiàn),難以超越同行的功能。


在一個新技術(shù)時代,想象力可能是一個需要創(chuàng)造概率的極其重要的時代。


但是谷歌在今天的新聞發(fā)布會上,沒有想象力。


我有些痛惜它。


本文來自微信微信官方賬號“騰訊科技”(ID:qqtech),作者:郝博陽,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com