OpenAI測試兩款新圖像AI模型:榛子與栗子
IT之家12月10日消息,X平臺用戶@marmaduke091今日發(fā)布推文稱,在gpt-image-1模型發(fā)布七個月后,OpenAI正在測試代號為“Hazelnut(榛子)”和“Chestnut(栗子)”的兩款全新AI圖像生成模型。

爆料顯示,OpenAI正加速產(chǎn)品迭代,這兩款模型在過去24小時內(nèi)頻繁現(xiàn)身Design Arena和LM Arena等模型測試平臺。
若消息屬實,OpenAI或于近期推出這兩款新模型,甚至可能隨傳聞中的GPT-5.2一同發(fā)布,圖像生成能力升級通常是大模型版本更新的重要內(nèi)容。不過官方尚未確認,具體發(fā)布時間仍待后續(xù)消息。

早期測試反饋表明,新模型的核心突破在于圖像內(nèi)代碼渲染能力。以往模型生成含文字或代碼的圖片時易出現(xiàn)亂碼,而新模型能更穩(wěn)定地呈現(xiàn)清晰準確的代碼文本。
此外,其“世界知識”水平顯著提升,通用場景理解力已可與谷歌Nano Banana Pro模型媲美。IT之家附上相關(guān)圖片如下:


不過該媒體指出,盡管新模型在文本渲染上有進步,但人像生成質(zhì)感仍需改進。
多位X平臺用戶查看測試樣張后發(fā)現(xiàn),生成的名人自拍構(gòu)圖雖逼真,但面部皮膚紋理有明顯“塑料感(Plasticky)”,缺乏真實皮膚的細膩度。相比之下,谷歌Nano Banana Pro目前在人像細節(jié)和自然度上仍占優(yōu)勢。


技術(shù)架構(gòu)方面,業(yè)內(nèi)傳聞這兩款測試模型并非基于gpt-image-1迭代,而是以早期GPT-4o架構(gòu)為基礎(chǔ)開發(fā),可能意味著OpenAI正嘗試通過不同技術(shù)路徑優(yōu)化圖像生成能力。不過在官方發(fā)布技術(shù)白皮書前,模型底層架構(gòu)細節(jié)仍屬推測。

本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com




