2月27日報道,剛剛,谷歌正式發(fā)布其最強圖片生成和編輯模型Nano Banana 2(Gemini 3.1 Flash Image),該模型已在谷歌Gemini應(yīng)用、搜索、AI Studio等谷歌全線產(chǎn)品中上線。

▲谷歌官宣Nano Banana 2發(fā)布
Nano Banana 2兼具Pro級功能與Flash級速度,在世界知識、圖像質(zhì)量、推理能力和主體一致性等方面實現(xiàn)了全面升級,在基準(zhǔn)測試中大幅超越了GPT-Image 1.5、Seedream 5.0 Lite、Grok Imagine Image Pro等業(yè)界領(lǐng)先模型,配合思考模式、文本和圖像搜索工具則全面超越Nano Banana Pro。

▲Nano Banana 2基準(zhǔn)測試成績
智東西第一時間對Nano Banana 2進行了體驗,發(fā)現(xiàn)Nano Banana 2生成圖片細節(jié)逼真度增強,指令精準(zhǔn)執(zhí)行上表現(xiàn)超出預(yù)期,文字渲染能力和中國傳統(tǒng)文化儲備提升,且在處理復(fù)雜場景方面明顯提升。
比如我們讓Nano Banana 2和Nano Banana Pro基于圍繞“60歲亞洲漁夫”的一段相同的提示詞生成圖片,前者生成效果明顯更逼真、細節(jié)更豐富,指令遵循準(zhǔn)確度更高。

▲Nano Banana 2生成

▲Nano Banana Pro生成
提示詞:一位年約60歲的亞洲漁夫的超高清面部特寫,海浪作為背景虛化。他臉上布滿飽經(jīng)風(fēng)霜的皺紋和曬斑,皮膚紋理極其細膩,能看到細小的毛孔和銀色的胡茬。陽光從側(cè)面45度打來,照亮他半張臉,眼睛微瞇,眼神中透露出堅毅與平靜,眼球表面映出遠處海平面的反光。畫面銳度極高,皮膚質(zhì)感真實到仿佛能觸摸到。
不過Nano Banana 2仍被經(jīng)典的“時鐘+滿杯紅酒”問題難倒,在同時面臨多物體+物理邏輯+光影難題等多重問題時生成仍不準(zhǔn)確(后文第一部分詳解)。同時,一些圖片仍有“AI感”,無法做到完全以假亂真。不過話說回來,瑕不掩瑜,Nano Banana 2相比Nano Banana Pro跨代升級明顯。
雖然效果更強、速度更快,但Nano Banana 2的價格不增反降。在谷歌AI Studio平臺,Nano Banana 2相比Nano Banana Pro的輸入圖片的單價從2美元降至0.5美元,輸出圖片的單價也從0.134美元減半至0.067美元。
