讓自動(dòng)駕駛「再次偉大」,Sora 有這個(gè)本事嗎?
2024 年 2 月 16 日,OpenAI 宣布推出生成式人工智能模型 Sora,外界認(rèn)為,這是 AI 視頻生成的全新里程碑時(shí)刻。
僅需只言片語,Sora 就可以給你輸出一段最長(zhǎng) 60 秒的視頻,并且能夠全程保持高度的流暢性與穩(wěn)定性,實(shí)現(xiàn)了對(duì) Runway、Stable Video、Pika 等生成式 AI 的超越。值得一提的是,Sora 還能夠根據(jù)靜態(tài)圖像擴(kuò)展成一段視頻或補(bǔ)充缺失的動(dòng)態(tài)幀。
這幾天,整個(gè)世界都在圍繞著 AI 旋轉(zhuǎn),更先進(jìn)的生成式 AI 出現(xiàn),有人歡喜有人憂。
OpenAI 將 Sora 定位為模擬世界的視頻生成模型,它的特性包含精確理解文本命令,生成長(zhǎng)達(dá) 60 秒的高質(zhì)量視頻、模擬真實(shí)世界的物理規(guī)則,比如光影反射、運(yùn)動(dòng)方式、物理效果等、能夠在單個(gè)視頻當(dāng)中生成同一對(duì)象的多個(gè)鏡頭,并且保持對(duì)象外觀的高度一致。
這就意味著 AI 生成的視頻距離「以假亂真」又近了一步。
另外,谷歌還宣布了下一代大模型 Gemini 1.5 Pro,將上下文窗口長(zhǎng)度擴(kuò)展到 100 萬個(gè) tokens,意味著它可以在短時(shí)間一次性處理巨量信息,比如 11 小時(shí)音頻、一小時(shí)視頻、超過 3 萬行代碼,又或者是超 70 萬個(gè)單詞。生成式 AI 在進(jìn)步,AI 大模型的學(xué)習(xí)能力同樣在突飛猛進(jìn)。
真賦能也好,蹭熱度也罷,一時(shí)間整個(gè)行業(yè)都在圍著 AI 轉(zhuǎn),也在開始認(rèn)真思考,更先進(jìn)的 AI 技術(shù)能夠?yàn)樗麄儙硎裁床灰粯拥膽?yīng)用場(chǎng)景。
站在汽車行業(yè)的角度,Sora 等更超前的大模型,好像又有一些別樣的玩法。
視頻全靠「算」,車企的宣發(fā)費(fèi)用全省了?
不久前,深藍(lán)汽車更新了一條用 AI 生成的 G318 新車視頻,視頻中羅列了一系列 AI「想象中」的 G318,表示將借助 Sora 的能力,「拍攝」一段 G318 的新車視頻,并拋出一個(gè)疑問—— AI 真的能拍出 G318 的美嗎?
能不能「拍」出來暫且不得而知,截至本文發(fā)布時(shí),深藍(lán)汽車還未公布 Sora 眼中的 G318 究竟如何。但放眼汽車行業(yè),嘗試用大模型生成汽車視頻的企業(yè),確實(shí)屈指可數(shù)。小通還是很期待,AI 的生成質(zhì)量,能否跟現(xiàn)有的專業(yè)拍攝工作流媲美。
車企的宣發(fā)工作十分頻繁,為了造勢(shì)吸引流量,測(cè)試車都不惜拿出來曝光。以深藍(lán) G318 為例,正式預(yù)熱之前,官方已經(jīng)發(fā)布多條曝光視頻。不過這款車型已經(jīng)通過工信部公示,距離上市不會(huì)太遠(yuǎn)。
宣發(fā)視頻不像簡(jiǎn)單的海報(bào)宣傳,涉及拍攝和動(dòng)畫制作等領(lǐng)域,品牌方還需要外包給專業(yè)的團(tuán)隊(duì)來完成。一段視頻從前期拍攝到后期合成處理,周期長(zhǎng),外包制作的成本也不低。但為了呈現(xiàn)盡可能好的「官方」效果,這些是車企宣發(fā)必須付出的成本。
如果能夠憑借 Sora 的能力和想象力打造一段媲美實(shí)拍的宣發(fā)視頻,那么 AI 可以說是對(duì)現(xiàn)有工作流的一種「打壓」了。僅靠文字和圖片,Sora 就能生成一段可用的宣發(fā)視頻,省去一大筆外包費(fèi)用,還縮短了物料交付的時(shí)間,我們似乎通過 Sora 看到了 AI 視頻商用化的可能性。
當(dāng)然,或許以后車企的新車官圖,都可以用 AI 來解決了,場(chǎng)景合成效果可以做得更逼真,還省去了前期拍攝和后期的成本。
但問題就在于,Sora 生成的視頻并非完美,無法準(zhǔn)確判斷常見的物理運(yùn)動(dòng)軌跡,主體與周圍物體之間的比例還有提升空間,物體運(yùn)鏡連貫性有待提高??傮w而言,Sora 生成的視頻確實(shí)足夠流暢逼真,但以現(xiàn)在的水平還無法完全取代專業(yè)團(tuán)隊(duì)的生產(chǎn)流程。
生產(chǎn)流的工作或許有一天會(huì)被 AI 取代,但人類的創(chuàng)意潛力是無窮的,這是人類與 AI 區(qū)別最大的地方。
不過,小通認(rèn)為 Sora 的想象力不應(yīng)該止步于藝術(shù)創(chuàng)作當(dāng)中。作為真正意義上的「世界模型」,Sora 認(rèn)知世界的能力,在高階輔助駕駛以及未來的自動(dòng)駕駛當(dāng)中發(fā)揮更多作用。
智能汽車需要 Sora,但人類仍是「主角」
OpenAI 表示,Sora 在訓(xùn)練當(dāng)中表現(xiàn)出了與其它模型不同的涌現(xiàn)能力,通過涌現(xiàn)學(xué)習(xí)到了物品的時(shí)間與空間的相關(guān)性,以及與周圍世界互動(dòng)的能力等。簡(jiǎn)單來說,Sora 不單止是擁有感知世界運(yùn)行法則的能力,它還可以判斷不同事物之間的關(guān)系,擁有發(fā)散思考的技能。
智能汽車當(dāng)中的智能駕駛能力也是訓(xùn)練 AI 模型得出的結(jié)果。當(dāng)前汽車智能駕駛分為感知、定位、決策、規(guī)劃、控制幾個(gè)模塊,每個(gè)部分緊密配合,最終實(shí)現(xiàn)精確的智能駕駛。智能駕駛的不同模塊,目前都需要單獨(dú)訓(xùn)練,訓(xùn)練量龐大,研發(fā)人員要通過不斷地「喂數(shù)據(jù)」優(yōu)化迭代,所帶來的沉沒成本自然巨大。
360 董事長(zhǎng)周鴻祎認(rèn)為,原來的自動(dòng)駕駛技術(shù)過于強(qiáng)調(diào)感知層面,而沒有工作在認(rèn)知層面。人在駕駛汽車的時(shí)候,很多判斷都是基于對(duì)這個(gè)世界的理解,比如對(duì)方的速度、會(huì)否發(fā)生碰撞、碰撞的嚴(yán)重性如何。 這就是當(dāng)前智能駕駛與真人司機(jī)之間的區(qū)別。
但 Sora 對(duì)世界的感知和交互能力,并不是單純的數(shù)據(jù)堆疊就能實(shí)現(xiàn)的。想要提高自動(dòng)駕駛的研發(fā)和運(yùn)行效率,人為優(yōu)化迭代是必須,更重要的還是要讓 AI 具備自主發(fā)散,縮短迭代周期,將交互能力賦能到現(xiàn)有的智駕模型當(dāng)中,更接近人類的駕駛體驗(yàn)或許就此誕生。
此外,支撐計(jì)算的算力芯片,光是智能座艙、智能駕駛就需要多塊單獨(dú)的高性能 SoC 支撐,集中化程度欠缺,整車成本也下不來。 無論是算力平臺(tái)還是模塊都趨向集中化和一體化,智能駕駛或許就不再分成多個(gè)模塊,而是將其當(dāng)作一個(gè)整體。
再到智能底盤領(lǐng)域,有些車企開發(fā)出了路面預(yù)判能力,通過提前建模判斷路況,實(shí)時(shí)調(diào)整底盤工作狀態(tài)。當(dāng)前的工作模式還是先建模后再?zèng)Q策,本身存在一定的時(shí)間和過程,有時(shí)候并不能夠像人類司機(jī)一樣判斷及時(shí)判斷。
這一切,有了 Sora 的加入之后,智駕技術(shù)和智能座艙就能夠跳出傳統(tǒng)的訓(xùn)練模式。試想一下,如果 Sora 自己生成模擬現(xiàn)實(shí)世界的視頻,再用來訓(xùn)練自動(dòng)駕駛的能力,說不定比車企不斷收集道路數(shù)據(jù)和視頻訓(xùn)練來得更快,而且 Sora 的交互能力還有機(jī)會(huì)影響到現(xiàn)有的自動(dòng)駕駛模型。
AI「生米煮成熟飯」,挑戰(zhàn)與機(jī)遇并存
我們的想象力總會(huì)比 AI 更快一步,這就說明人類還無法完全被 AI 所替代。
現(xiàn)階段的 AI 在各行各業(yè)表現(xiàn)出了令人意外的能力,大模型的出現(xiàn)更為企業(yè)提供了更多可能。不過我們對(duì) AI 的態(tài)度或許不應(yīng)該過于樂觀,AI 還沒走到最關(guān)鍵的商業(yè)化層面,很顯然人類仍然是這個(gè)世界絕對(duì)的「主角」。
對(duì)于汽車行業(yè)而言,機(jī)遇和挑戰(zhàn)并存,AI 的崛起為車企帶來了降本增效的新突破口,但 AI 的潛力上限尚不可預(yù)知,當(dāng)前的應(yīng)用場(chǎng)景也不能代表 AI 的全部,想要完全利用,不是一件簡(jiǎn)單的事。
就好比智能手機(jī)的影像傳感器,還沒被打磨完成,就已經(jīng)被廠商拋棄,造成浪費(fèi)。
同時(shí),要支撐龐大的 AI 運(yùn)算和數(shù)據(jù)積累,車企的投入完全看不到底,比如頭部廠商需要建立自己的數(shù)據(jù)中心。另外,先進(jìn)大模型確實(shí)有利于汽車智能化發(fā)展,但這并不意味著車企能夠高枕無憂,在算法投入上,車企之間的智能駕駛開發(fā)程度上仍然存在明顯代查,模塊化的智駕技術(shù)還沒玩透,頭部的端到端等潛在新賽道更是難以跟上。
到最后,AI 變成了巨頭提升自身水平的「專屬武器」,前者的能力越強(qiáng),很可能會(huì)拉大不同廠商之間的代際差別,使得汽車行業(yè)頭部化來得更猛烈。
無論如何,Sora 的潛力值得期待,不過這需要時(shí)間去發(fā)掘,誰也不敢保證 AI 接下來還能厲害到什么地步。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com