亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

<label id="m9wbq"></label>

<rt id="m9wbq"></rt>

<label id="m9wbq"></label>

一夜之間，谷歌亮出了十幾款商品對戰(zhàn)OpenAI：什么都有，只是沒有驚喜

2024-05-18

昨晚OpenAI的科幻級演示結(jié)束后，每個人都在等待谷歌今晚的反擊。

如果說2023年的I/O大會是谷歌在AI領(lǐng)域的最后一站，雖然今年的I/O大會上皮查依靠自己的Gemini等商品逐漸趕上了OpenAI，但情況并不令人愉快。在過去的一年里，即使使用了2個月的免費殺手，Gemini的用戶數(shù)量也只是ChatGPT的五分之一。每次新產(chǎn)品上市，肯定會被OpenAI攔截，讓谷歌成為AI界的汪峰。

所以皮查太需要一場亮眼的新聞發(fā)布會，取回屬于谷歌的排面。

所以和OpenAI只有半個小時的發(fā)布會完全不一樣，集中在產(chǎn)品介紹上。谷歌的I/O骨子里有一種武庫拼死一戰(zhàn)的意思。在兩個小時的新聞發(fā)布會上，它一口氣拿出了十幾款新產(chǎn)品和升級產(chǎn)品，數(shù)量眾多，管理飽滿，全面標(biāo)桿了OpenAI在AI各個領(lǐng)域的發(fā)展。

很多產(chǎn)品單看Demo還是有很好的完成率的，但是整個發(fā)布會并沒有GPT-4o那么驚艷。因為他們發(fā)布的大部分東西都是追逐OpenAI現(xiàn)有的東西，所以沒有人會對別人已經(jīng)做過的東西感到驚訝。

最有可能帶來驚艷感的新產(chǎn)品——Gemini 昨天的GPT-4o已經(jīng)完成了Astra的戲份。

最后，想要展示肌肉的谷歌，依然被OpenAI四兩撥千斤卸下。

從其搜索產(chǎn)品、模型產(chǎn)品等方面，我們更多地看到了谷歌的疲態(tài)，缺乏創(chuàng)新。

本來想看巔峰對決，可其實昨天這場對戰(zhàn)已經(jīng)結(jié)束了。

谷歌I/O開發(fā)者大會第一天全程回顧(中文同傳版)

另外，雖然Gemini本身就是期貨發(fā)貨，但基本上谷歌的這次發(fā)布也是期貨。看完整個新聞發(fā)布會就像逛完一個期房交易市場一樣失落，心里甚至有點疑惑“別是爛尾樓吧”。這在谷歌商品序列中并不罕見?！狶ydia，ESG，在半年左右的時間里，這些商品還沒有完全向用戶開放。AI領(lǐng)域日新月異，這一開放速度基本上與爛尾無疑。

我們理解谷歌急于秀肌肉，但是我們急于使用，不想看期貨，也希望谷歌能夠多了解。

由于產(chǎn)品太多，我們做了一個簡單的表格整合，有14個與AI相關(guān)的產(chǎn)品發(fā)布和新升級相結(jié)合：

接下來，我們將沿著新聞發(fā)布會的四個主題來拆解這次I/O大會谷歌帶來的各種商品。

01 基礎(chǔ)模型：Gemini 1.5 Pro 期貨成真，Light 提速增效，Gemini 2 顯露可能

Geminini發(fā)布于三個月前。 1.5 終于，Pro不再是期貨了！從今天開始，這將正式向訂閱Geminnini開放 Advance用戶。假設(shè)你以前沒有白嫖，那么你可以在這兩個月內(nèi)免費使用。

除期貨實現(xiàn)外，谷歌在這三個月沒有完全鋪開的時間里，也沒有停止對其進行升級，四個基本模型最重要的層次都得到了加強。

首先是模型性能。谷歌提高了代碼生成、邏輯判斷和計劃、多回合對話和音頻和圖像理解能力，并通過數(shù)據(jù)和算法進行了改進。最新版本 1.5 Pro Sota在多個benchmark中取得了成績，谷歌揚眉吐氣。

在文章的前后，谷歌還將新Geminini。 1.5 Pro 前后文窗口是業(yè)內(nèi)最高的100萬token 擴展到合300本書的200萬token。三個月翻了一番，谷歌的表現(xiàn)證明了今年上下文的問題似乎已經(jīng)不是門檻了。

對多模態(tài)支持，Gemini 現(xiàn)在，Pro已經(jīng)彌補了語音理解的過去缺點。雖然它不像GPT-4o那樣是一種原始的語音模式，但它最終是一個完整的模式，成為一個完整的身體。

對使用體驗的指令跟隨能力影響很大，Gemini 1.5 Pro也進行了一輪更新。如今，我們可以遵循越來越復(fù)雜和微妙的指令，包括指定商品級行為的指令(如角色、格式和風(fēng)格)?，F(xiàn)在你可以讓Gemni假裝你是一只貓。

盡管Geminini未公布二是但是四維打滿，從數(shù)據(jù)上看，Geminini全面超越GPT4。 1.5 Pro仍然可以為谷歌提供更多的場景。

Geminini后續(xù)宣布 1.5 這場比賽的汪峰本峰就是Flash。它的主要特點——快速響應(yīng)和昨天的GPT-4o完美碰車，本該有的驚艷感被徹底摧毀。

就功能而言，雖然它比較 1.5 Pro 重量輕，但也可以跨越大量信息進行多模式推理，擅長摘要、聊天、圖像和視頻字幕、長文檔和表格的數(shù)據(jù)提取。但是不像GPT-4o青，Gemini 1.5 Flash仍然犧牲了一些性能來實現(xiàn)它的速度。

昨天的GPT-4o基本上等于沒有寫的技術(shù)報告無法解釋的速度。谷歌誠實。從技術(shù)文檔來看，這是因為 Flash 通過一個叫做“蒸餾”的過程，將最重要的知識和技能從更大的模型傳遞到更小更有效的模型，從而提高速度。

Agent需要支持這里展示的能力，所以谷歌的下一個重磅產(chǎn)品是Project。 Astra。谷歌將其定義為Agent戰(zhàn)略的核心。

這是一個Agent 框架:為了真正有用，Agent需要像人類一樣理解和回應(yīng)復(fù)雜的世界——并記住它所看到和聽到的，以理解前后的文本并付諸行動。此外，它還具有主動性、教學(xué)性和個性，使用戶能夠在不滯后或延遲的情況下自然地與其交流。低延遲需求使您能夠?qū)stra理解為Geminini。 Light Agent方法。其最佳形式是谷歌展示的個人助手。

因此，為了讓它更有用，谷歌可以通過持續(xù)編碼視頻幀，將視頻和語音輸入結(jié)合到事件的時間線上，緩存這些信息來更快地處理數(shù)據(jù)，從而實現(xiàn)快速記憶，也就是可以與視頻互動，有時間記憶。谷歌還通過語音模型增強了Astra的聲音，使得Agent的語氣更加廣泛，使得這些Agent能夠更好地理解它們的前后文本，并在對話中迅速做出反應(yīng)。

就演示而言，Astra的視覺理解能力確實令人印象深刻?？梢岳斫庋Χㄖ@的貓這種梗，反饋速度也很快。

但是它并沒有超越想象。整個演示的感覺就是看GPT-4o的視頻交流Demo。而且遠比GPT-4o期貨，上線需要幾個月的時間。

谷歌說，這不是幾周，而是今年晚些時候。這個功能中只有“一些”產(chǎn)品會進入谷歌，可能是XR眼鏡，也可能是自助手。

所以Flash被GPT-4o模型截胡，Astra 被GPT-4o的商品攔截。您認(rèn)為OpenAI沒有內(nèi)鬼知道谷歌 I我絕對不相信/O的信息。OpenAI做了一件事，就是證明它能做到，而且比你做得更好，出得比你早。

然而，如果我們繼續(xù)思考，OpenAI在谷歌發(fā)布產(chǎn)品后會有完全不同的升級來切斷胡谷歌的受歡迎程度。這一次，我們在谷歌之前做了一個功能完全相同的產(chǎn)品來打破它帶來的驚喜。這不禁讓人懷疑OpenAI是否真的沒有新產(chǎn)品儲備。

除兩個核心模型的更新外，谷歌還宣布了Gemmama，前一場大火的開源模型。 2.0版本，270億參數(shù)。并且擴展了PaliGemma這一多模態(tài)版本。因為Llama3 官方還沒有微調(diào)多模式，這大概是目前官方開源多模式最強的模式了。根據(jù)谷歌的說法，它的發(fā)展受到了Pali-3的影響。

02 多模式生成模式：谷歌版Sora相當(dāng)驚艷，其它都有點常規(guī)。

除新公開的文生視頻模型外，谷歌還推出了文生圖像模型Imagen 3。根據(jù)細節(jié)擬真度和Midjourney 與Dalle-3相比，v6可以達到同樣的水平。而且在跟蹤細節(jié)方面也要更加細致。

在音樂生成方面，去年驚人的期貨Lydia仍然是期貨，直到這次發(fā)布會。谷歌給他增加了一個新的擴張。 Music AI Sandbox，一套音樂 AI 工具。這類工具旨在為創(chuàng)意打開一個新的游樂場，讓人們重新開始創(chuàng)造新的器樂部分，以新的方式轉(zhuǎn)換聲音等等。

接著是酷炫的電影，看上去比Suno還要厲害。但是我不需要，所以還是可以用的很厲害。

最后，谷歌介紹了自己的視頻生成模型——Veo 。這是谷歌之前一系列視頻生成嘗試的大成者：與WALT融為一體、VideoPoet、在Sora之前發(fā)布的Lumiere這些明星文生視頻模型的優(yōu)勢。

就能力而言，它相當(dāng)能打，能產(chǎn)生高質(zhì)量的產(chǎn)品。 1080p 分辨率視頻，可以超過一分鐘，包括廣泛的電影和視覺風(fēng)格。

Veo生成的場景在示例視頻中是相當(dāng)一致和連貫的：人物、動物和物體在鏡頭中非常真實地移動。

谷歌還強調(diào)，Veo 具有高級理解自然語言和視覺語義的能力，可以生成與用戶創(chuàng)意愿景緊密匹配的視頻——準(zhǔn)確呈現(xiàn)詳細的長提醒，捕捉情緒。Veo甚至可以理解電影術(shù)語，比如“延遲”或者“航拍鏡頭”。

質(zhì)量方面，谷歌的Veo和Sora有一戰(zhàn)之力。但不得不說，谷歌真的不擅長演示。在整個演示過程中，他們放了一個追逐長度的汽車生成視頻，不是全屏，看不清細節(jié)。其他都是小片段，小幅度，細節(jié)模糊。震撼力受到影響。

但是，和Sora一樣，Veo 只會把作為 VideoFX 個人預(yù)覽版提供給少數(shù)創(chuàng)作者，普通用戶可以報名加入替補序列。然而，這也表明，有了VEo，谷歌和OpenAI已經(jīng)進入了同一個競爭，誰能首先降低成本，將這項技術(shù)推向toC領(lǐng)域。

03 AI搜索：多模態(tài)最強，但創(chuàng)新有限

AI搜索可以算是谷歌的必爭之地。面對來勢洶洶的新秀Perplexity，他們自稱要取代谷歌搜索，谷歌即使不需要AI，也要保留后者。

從去年開始，雖然新興的AI搜索獲得了很多客戶，但基本上沒有動搖谷歌搜索的基礎(chǔ)。所以谷歌也是一副不慌不忙的樣子:自去年5月以來，其AI搜索服務(wù)ESG終于從今天開始向公眾開放使用了一整年。這個更強大的AI搜索引擎被谷歌命名為AI Overview，但是僅限于美國，其他國家還要排隊等待開放。

就Demo展示而言，谷歌搜索在功能上沒有太多的創(chuàng)新，主要集中在多模式上。

第一，用戶可以通過簡化語言或者更詳細地分解來調(diào)整。 AI 簡述搜索結(jié)果。這一功能并不新穎，目前主流的AI搜索產(chǎn)品也將區(qū)分快速回復(fù)和更深入的研究方法。

其次，借助 Gemini 多步推理能力，AI 搜索可以一次處理復(fù)雜的多步，甚至多個問題。例如，當(dāng)顧客尋找新的瑜伽或普拉提工作室時，顧客希望找到受當(dāng)?shù)厝藲g迎、方便用戶通勤的選項，并提供新會員折扣。通過谷歌AI搜索，用戶可以通過搜索查找波士頓最好的瑜伽或普拉提工作室，并顯示其入門優(yōu)惠和從眾。 Beacon Hill 詳細的步行時間信息”問題得到了正確的答案。

它也是目前其它AI搜索產(chǎn)品正在努力克服的一個方向。在這方面，谷歌很可能憑借模型優(yōu)勢得到更好的處理。

AI搜索的計劃能力也建立在多步推理能力之上。通過AI搜索中的計劃功能，您可以在搜索中直接獲得一個完整的計劃。舉例來說，搜索類似于“為一群人制定一個容易準(zhǔn)備的三天餐飲計劃”，你會得到一個起點，包括各種來自網(wǎng)絡(luò)的食譜。其它搜索軟件暫時還沒有專業(yè)化的能力。但對可以聯(lián)網(wǎng)的ChatGPT來說，這并不難。谷歌搜索機構(gòu)當(dāng)然更好看，也可以直接連接，客戶體驗更好。

GPT-4o生成版本

生成版本的谷歌

最終是靈感延伸功能，即AI搜索正在創(chuàng)建一個 AI 組織結(jié)果頁面讓你更容易探索。問完一個問題，谷歌搜索會延伸到其他你可能感興趣的結(jié)果。根據(jù)獨特的結(jié)果。 AI 生成標(biāo)題分類，展示一般角度和內(nèi)容類型。這種聯(lián)想搜索能力已經(jīng)成為AI搜索的標(biāo)準(zhǔn)，但谷歌已經(jīng)更好地結(jié)構(gòu)化了這一功能。

上述功能，其他AI搜索都可以做，但是谷歌的結(jié)構(gòu)化和界面做得最好。僅此而已。

最后，其它AI搜索暫時無法實現(xiàn)的是多模態(tài)搜索。

谷歌依靠Gemini的多模態(tài)功能，可以用聲音搜索歌曲，用圖片搜索商品。你甚至可以使用Circle to Secarch 在照片中標(biāo)出部分功能進行搜索。

AI也可以結(jié)合視頻搜索。谷歌舉了一個案例。例如，用戶在舊貨店購買了一臺唱片機，但打開后無法工作，含有針頭的金屬部件不小心漂移了。使用視頻搜索可以節(jié)省客戶找到合適的單詞和句子來描述這個問題的時間和麻煩。

但是Perplexity們，總有一天會使用多模態(tài)模型。當(dāng)我看到他們用看圖視花作為例子來介紹谷歌搜索的多模態(tài)功能時，我首先想到的是微信掃描，所以我做不到(雖然原理不同)。

04 模型產(chǎn)品升級：GPTs谷歌版上線，生態(tài)剛剛跟上。

模特產(chǎn)品可以說是最令人失望的一環(huán)。沒有創(chuàng)意，還有多少讓人看得出谷歌的傳統(tǒng)趨勢。

首先，Wrokspace與Gemini相結(jié)合。

你可以通過 Side Panel(一個可以喚起Gemini的側(cè)欄)總結(jié)一系列功能郵件，可以總結(jié)你的賬單，形成一個Sheet。OK，我去年看到了。自動回復(fù)郵件。我去年看到了。

每一個都進行了小的升級，比如回復(fù)郵件可以從確定、拒絕、擱置三種可能性中選擇。但是...現(xiàn)場的掌聲很少。

包括社交軟件在內(nèi)的其他更新的虛擬員工Chip基本沒有超過我們前幾個月在中國看到的各種辦公軟件Agent的演示。

總的來說，谷歌在去年的I/O大會上展示的概率可以在下個月實現(xiàn)。因為Side Panel這個產(chǎn)品下個月才公開開放。

Gminiini是模型產(chǎn)品中最重要的更新。 Live。它是一種移動對話助手產(chǎn)品， Gemini Live，用戶可以與 Gemini 交談，并選擇各種自然的聲音來回應(yīng)。顧客甚至可以按照自己的節(jié)奏說話，或者半途而廢地回答問題，就像你在任何對話中一樣。并且在今年晚些時候，用戶可以在上線時使用攝像頭，并且可以打開周圍所見內(nèi)容的對話。

好吧，再一次GPT-4o的即視感。

其它幾款產(chǎn)品的升級實際上是追求特征。

Gems出現(xiàn)的時候真的有點尷尬，整個場景都是沉默的，因為大家一聽介紹就知道這是谷歌的GPTs，還是一個版本慢了半年。用戶可以創(chuàng)建定制的Geminni。描述希望 Gem 做什么，希望它怎么回應(yīng)，比如“你是我的跑步教練，給我一個日常的跑步計劃，并且保持積極、樂觀、鼓勵的態(tài)度?！保珿emini 根據(jù)這些指示進行增強，以創(chuàng)建一個符合你特定需要的指示。 Gem。

所以只能依靠Prompt來制定，沒有外部工具，沒有工作流程。

這個產(chǎn)品屬于Agent產(chǎn)品，發(fā)布遲了半年，功能不如GPTs。

API擴展功能將于去年上線，例如正在推出的API擴展功能。 YouTube Music 拓展、Google Calendar、Tasks 和 Keep。全部都是谷歌自己的服務(wù)。老實說，在這次擴展之前，谷歌的插件庫就是這樣五個插件，完全是少得可憐。即便加上這些新的擴展，API庫也完全不能與其他Agent產(chǎn)品相提并論。

(在新聞發(fā)布會之前，只有這些擴展可用)

從這個角度來看，谷歌墨守成規(guī)的沙文心態(tài)在自己的生態(tài)中一目了然。

05 Andriod AI：GPT桌面版占盡了風(fēng)景

除了 Cricle in 此次Androidroid之外，Search聚焦于具體照片的局部多模態(tài)搜索。 AI的關(guān)鍵是介紹Gemini的手機應(yīng)用程序，可以與手機正在展示的內(nèi)容進行互動。例如，從你正在看YouTube頻道反饋的角度來看，閱讀打開的PDF。

挺好的，GPT-昨天4o的桌面版都做到了，而且和這里的Android相比，實際上是讀取打開的文檔，GPT-4o版本更像是和你一起看著桌面上發(fā)生的一切。另外，它還有精彩的聲音。

06 硬件：TPU穩(wěn)步升級

本次發(fā)布會上，谷歌最新的TPU是所有AI模型?！猅rillium TPU訓(xùn)練。與上一代相比，它的進步仍然十分明顯。Trillium完成了每個芯片峰值計算特性。 4.7 倍提高，比 TPU v5e 增加了一倍。高帶寬內(nèi)存（HBM）容量與帶寬和芯片之間的連接（ICI）它的帶寬也比v5e翻了一番。

此外，Trillium 配置第三代 SparseCore，它是一種特殊的加速器，用于處理超大嵌入，在先進的排序和推薦的工作負(fù)荷中更為常見。Trillium TPU 使下一波基礎(chǔ)模型訓(xùn)練更快，并以更低的延遲和更低的成本為這些模型提供服務(wù)。Trillium 可以擴展到一個包括 256 個 TPU 單高帶寬低延遲 Pod。

另外，Trillium能耗。 TPU 比 TPU v5e 能源效率提高了 67% 上述，節(jié)電能力一流。

07 結(jié)語

在這次新聞發(fā)布會上，觀眾非常痛苦。

我們希望看到新的、有競爭力的產(chǎn)品，谷歌卻在不斷地播放電影。由創(chuàng)作者的感覺，到感覺演示，都是沒有商品細節(jié)的表現(xiàn)。

現(xiàn)場演示我們想看，但是演示內(nèi)容平淡無奇。

甚至在許多地方都是重復(fù)的，許多產(chǎn)品在不同的地方被多次提及和展示。

所以這兩個小時看起來非常冗雜和乏味。

因為沒有驚喜，我甚至很少被激起好奇心。

當(dāng)然也有OpenAI截胡的原因，但是昨天25分鐘，三個產(chǎn)品的發(fā)布會(其中一個UI基本沒有提到)，足以破壞谷歌發(fā)布更新兩個小時十幾個產(chǎn)品產(chǎn)生的所有驚喜。

那說明了什么問題？

毫無疑問，谷歌的技術(shù)力量依然存在，那些模型都非常出色。但是那些令人驚嘆的技術(shù)突破，令人興奮的產(chǎn)品演示，都沒有了。

有些只是可以預(yù)見的表現(xiàn)，難以超越同行的功能。

在一個新技術(shù)時代，想象力可能是一個需要創(chuàng)造概率的極其重要的時代。

但是谷歌在今天的新聞發(fā)布會上，沒有想象力。

我有些痛惜它。

本文來自微信微信官方賬號“騰訊科技”（ID:qqtech），作者：郝博陽，36氪經(jīng)授權(quán)發(fā)布。

本文僅代表作者觀點，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請及時與我們聯(lián)系進行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

從網(wǎng)絡(luò)熱詞來看，中央媒體關(guān)注山西運城產(chǎn)業(yè)發(fā)展的“三張牌”

“新朋友”在核反應(yīng)堆里，幫你高枕無“幽”→

又是一輛電動自行車！這次，燒了幾十輛！

一秒鐘回到冬天！張家口繼續(xù)發(fā)出警告！氣溫急劇下降12℃ 風(fēng)沙！接下來的三天…

體壇聯(lián)播｜曼城力克熱刺重返第一，張之臻羅馬進入四分之一決賽。

<li id="rwjdo"><legend id="rwjdo"></legend></li>

<span id="rwjdo"></span>