低調(diào)小香蕉模型,實力吊打眾多生圖模型
最近,大模型競技場 LMArena 里悄然出現(xiàn)了一個神秘圖片模型——nano - banana,它在一眾生圖模型中表現(xiàn)極為出色。
這個名為小香蕉的模型起初無名無姓,但只要在 LMArena 中抽到它,對手往往會被打得落花流水。

它在生圖一致性方面表現(xiàn)驚人,對提示詞的理解和完成度也十分出色。在大家的投票支持下,它迅速登上了榜單首位。
就在大家紛紛猜測這個新模型的出處時,谷歌 AI Studio 的產(chǎn)品 Leader 發(fā)了一個香蕉圖標,隱晦地認領了 nano - banana。

昨天,nano - banana 正式上線谷歌 AI Studio,用戶直接在 Gemini 中就能體驗,無需在競技場抽卡。
谷歌在官方博客中展示其強大功能:只需一張臉的圖片,無論后續(xù)是什么場景、服裝和表情,都能讓人一眼認出還是同一個人。

將幾張照片融合,生成的結(jié)果既能保持原有形象,又不會讓人覺得違和。

還能進行多輪對話修改同一張圖,每次只做小改動,其他部分保持不變,就像原本的圖片一樣。

官方展示的案例很厲害,沒體驗過的朋友別急,下面帶大家一起感受。
為了對比其他模型和 nano - banana 的差距,我們在 LMArena 抽了幾輪卡。結(jié)果顯示,抽了十幾輪,只要謎底中有 banana,大家都會盲選它,有些對比非常明顯。
比如讓人物手里加一根香蕉,右邊 seededit 生成的圖片手的部分變形,香蕉顏色過于鮮艷,與整體畫風不搭,而左邊 nano - banana 生成的圖片幾乎沒有瑕疵。

再如讓魯迅不要抽煙改拿筆,右邊生成的圖片細節(jié)變化過多,筆頭還冒著煙。

由此可見,nano - banana 比現(xiàn)有的生圖模型更強。那它具體強在哪里呢?我們在谷歌 Studio 進行了有針對性的測試。

測試結(jié)論是,nano - banana 最強的地方在于它對圖片有更深入的理解,保證了生圖的一致性。在此基礎上,它在修圖、換風格、制作 3D 手辦等方面都表現(xiàn)出色。
例如一鍵試穿功能,需要將平鋪的服飾 P 到人物身上,nano - banana 對細節(jié)把控精準。鞋子原本是側(cè)面圖,它能畫出正面樣子;服飾上的 logo 拼接正確,甚至 T 恤上原本鏡像的 ‘ SAINT LAURENT ’ 也能恢復正常。

人臉不同角度生成效果也很厲害。下面三張圖中,只有第一張是真實照片,后兩張是生成的。

這種面部方向調(diào)整在老模型中很難實現(xiàn),因為要從一張平面圖理解立體臉的各個角度并不容易,但 nano - banana 完成度很高。
我們還測試了合照拉郎配??梢钥闯觯恢皇呛唵蔚貙蓚€人物拼在一起,還學習到了面部特征。生成的新圖片即使表情不同,也能讓人一眼認出是誰。

在 3D 手辦制作方面,它能輕松將 100 多斤的火鍋形象壓縮成茶杯犬大小的桌面擺件,深受同事喜愛。更厲害的是,它能注意到火鍋右后腿皮膚病剃禿的細節(jié),生圖一致性拉滿。


不過,nano - banana 的圖像風格變換比較普通。在測試過程中,我們發(fā)現(xiàn)它還能 “認人”。比如在沒有告知人物身份的情況下,它能認出左邊是馬斯克,右邊是扎克伯格。

我們還測試了它的地標推理能力。但實際上它只在地標建筑物識別上效果較好,更像是圖像識別和記憶檢索,推理能力有限。

左 nano - banana 答錯,右 GPT 5 Thinking 答對

nano - banana 也有不少缺點。最大的問題是谷歌對它進行了很多安全性調(diào)教,經(jīng)常出現(xiàn)各種限制,用戶很難摸清哪個關鍵詞會觸發(fā)限制。

其次,它對提示詞要求較高。雖然可以說它對提示詞的遵循能力強,但這也意味著用戶需要花費更多時間打磨提示詞。
谷歌也提醒用戶,要明確表達自己的需求。如果生成效果不好,寫提示詞時要盡量詳細,明確哪些部分要修改,哪些部分保持不變,以保證生圖的強一致性。
和我們心目中的 P 圖神器 FLUX 相比,它在局部小范圍修圖上效果稍差。所以建議大家精修圖片找 FLUX,進行大規(guī)模創(chuàng)意制作時再用 nano - banana。
左原圖,中 nano - banana,右 FLUX

總體而言,nano - banana 的優(yōu)勢在于它對圖片的理解能力目前是最好的,在各種任務上的一致性表現(xiàn)不錯,沒有明顯短板。
好消息是,小香蕉已經(jīng)被整合進 2.5 Flash 版本,即使沒有 pro 會員,免費賬戶也能使用。用戶只需在左上角選擇 2.5 Flash,在對話框 tools 中選擇 Image 即可。

在 LMAreana 上也能使用,只要在 prompt 開頭輸入 “ 使用 nano - banana 模型生成 ” ,有很大概率可以抽到。此外,一些整合網(wǎng)站如 LibLib、Fal - ai 等也有第三方提供的 nano - banana。

感興趣的朋友趕緊去試試,歡迎在評論區(qū)分享成果。
撰文:莫莫莫甜甜



本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com