• +1

Nano Banana Pro杀死比赛!中文可用,细节多到离谱,网友疯狂晒图

2025-11-21 21:53
来源:澎湃新闻·澎湃号·湃客
听全文
字号

基于Gemini3Pro,拥有增强推理能力与知识库。

作者|陈骏达

编辑|心缘

NanoBanana升级了!

智东西11月21日报道,昨晚23点,谷歌发布了其最新一代图像生成和编辑模型NanoBananaPro,这是此前爆火的NanoBanana的重磅更新。谷歌直接将Gemini3Pro的推理能力与世界知识库,塞进了NanoBananaPro。

NanoBananaPro的正式名称为Gemini3ProImage。基于增强的推理能力、世界知识和实时信息,这一模型可以生成更准确、更具上下文信息的视觉效果。用谷歌的话来说,它不再只是生成“像模像样”的图像,而是能够真正打造出实用的内容。

谷歌CEOSundarPichai分享道,NanoBananaPro是一款SOTA级的图像生成与编辑模型,非常擅长制作复杂的图表,看待世界的方式就像工程师一样。Pichai分享的案例里,NanoBananaPro用实拍和手绘草图结合的方式,讲解了金门大桥的基本结构信息,一目了然。

NanoBananaPro的实用性还体现在较强的文字渲染能力上。结合其自带的联网搜索能力,智东西试着让NanoBananaPro打造了一个剪纸风的中文实时天气卡片。模型不仅找到了正确的天气信息,文字渲染、风格化也是毫无破绽,彻底和上一代NanoBanana的“鬼画符”告别了。

目前,NanoBananaPro已在Gemini应用和Web端免费可用,但有一定限额,用完后将恢复到原有的NanoBanana模型,GoogleAIPlus、Pro和Ultra订阅用户可获得更高的配额。

谷歌广告服务、谷歌Slides和谷歌Vids中的图像生成功能将升级为NanoBananaPro。用户也可通过API调用、企业订阅方案等使用这一模型。

体验链接:https://gemini.google.com/

01.

外挂谷歌搜索

字体、元素融合玩出花

借助更丰富的知识,NanoBananaPro可以制作复杂的教育性讲解图,比如直接生成一份“小豆蔻茶”菜谱。

可以看到,模型生成的结果不仅文字清晰、毫无乱码,说明步骤也直观易懂;插图与内容配合自然,整体设计风格统一协调。以这样的完成度来说,几乎不需要再做二次编辑。

NanoBananaPro能连接到谷歌搜索,帮助用户创建可视化的实时信息,例如天气或体育赛事等等。

下图就是NanoBananaPro自行搜索并打造的波普风格天气海报,上面的信息我们已经核验过了,是完全正确的。

此外,NanoBananaPro在文字渲染和多语言方面有了进展。模型现在可以更为深刻的理解图像,感知细节,从而给图像编辑和生成提供了更多空间。

在下面这一案例中,NanoBananaPro能根据一张剧照,直接还原出一份手写体的黑板故事板草图,还是带有运镜和故事情节的。

NanoBananaPro现在支持更丰富的纹理、字体和书法,能创造更为精细的文字。比如,它就在下图中把“BERLIN(柏林)”一词融入了建筑设计,且毫无违和感。

或者是把文字和纹理巧妙地融合在一起,下面的文字上就完美融合了木头横截面的纹理。

书法、字体方面,NanoBananaPro的风格是由语义启发的,比如CRASH一词的艺术字就有很多裂痕,DRIP一词就使用了滴落的效果。

借助Gemini增强的多语言推理功能,NanoBananaPro可以生成多种语言的文本,或者对内容进行本地化和翻译。

下方就是一个英语译韩国语的案例,商品图中不同角度的文字在翻译时都得到了准确的对应。

面向专业创作者的需求,NanoBananaPro现在允许用户融合更多的元素,最多可使用14张图像,并保持最多5位人物的一致性和相似度。下图就是由14张输入图像+文字提示词打造的,角色一致性得到不错的保持。

这一功能不仅适用于角色,也适用于物体。比如,可以将沙发、绿植和连衣裙和场景等元素一同输入,然后输出全新的场景。

NanoBananaPro提供了高级创意控制功能。改进的局部编辑功能现在支持选择、优化和调整图像里的任何部分,比如调整相机角度、改变焦点、应用精细的色彩分级,甚至改变场景光照(例如,将白天变为夜晚或创建散景效果)。

模型现在支持丰富的宽高比调整和2K、4K分辨率,让生成结果适用于更专业的场景。

随着NanoBananaPro将虚拟和现实的边界进一步模糊,谷歌打造了一款专用的验证工具,以应对这一挑战。

现在用户可以将照片上传到Gemini,并要求Gemini识别图片是否为AI生成。谷歌已经为自家所有的AI生成媒体内容配备了SynthID数字水印,Gemini将会据此进行判断。目前,该功能率先支持图片验证,但很快将扩展到音频和视频。

02.

多元素一键换装

可“拍摄”复古老照片

NanoBananaPro上线后,已经有海量网友分享了自己的使用体验。

这位网友利用NanoBananaPro打造了四张抓拍照。可以看到NanoBananaPro在运动场景生成的肢体动作不仅没有扭曲,还很有冲击力,而此类场景对大多数图像生成模型来说其实是不小的挑战。这位网友感叹,谷歌真的在改变世界。

NanoBananaPro可以用来“拍摄”怀旧风格的老照片,如果不是网友特别说明,恐怕我们已经很难分辨下面四张图片究竟是真正的老照片,还是AI生成的。

同样的风格化能力也能用来复刻游戏的画风,一位日本网友就分享了他打造的像素风游戏角色卡。

元素组合功能对于电商场景来说十分实用。这位设计师分享,自己上传了模特图和衣物图,NanoBananaPro便能让模特“穿上”新衣服,并且融合得很自然。

NanoBananaPro的图像编辑能力也可用于优化照片。这位网友将自己实拍的CyberTruck交给NanoBananaPro处理,他认为该模型在调整光线、去除瑕疵方面表现很出色。NanoBananaPro帮他把竖屏照片扩展为了横屏照片,能直接当壁纸用。

03.

结语:NanoBanana实用程度获针对性提升

凭借底层模型的升级,NanoBananaPro现在让更多普通用户能轻松上手使用图像创作模型,仅依赖简单的提示词就能还原自己内心的想法。

不过,值得注意的是,谷歌在本次升级中的不少方向是在提升模型的实用性。无论更多样的字体,更多的元素,还是高级控制选项,都能给专业创作者以更多选择,打造真正符合其创意的画面。

谷歌已经在积极将NanoBananaPro融入其To-B的创意产品,未来该模型能否在商用场景展示真实价值,值得持续关注。

(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)

原标题:《Nano Banana Pro杀死比赛!中文可用,细节多到离谱,网友疯狂晒图》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2026 上海东方报业有限公司