- +1
图像模型今夜变天?谷歌刚刚泄露了“Nano Banana Pro”这张王牌
新智元报道
编辑:倾倾
【新智元导读】NanoBananaPro要登场了?传言说,它能自己排版、搭UI,甚至一键生成整张设计稿。如果真是这样,那设计师的得力助手或许不再是PS,而是NanoBananaPro了。
谷歌的下一张王牌,终于藏不住了!
就在刚刚,谷歌DeepMindCEODemisHassabis,亲手置顶了一条「预告」!

更有意思的是,这个传说中的NanoBananaPro,昨晚就在社交媒体与开发者社区出现踪迹。

多方爆料称,它疑似采用了Gemini3.0Pro级的多模态推理内核,分辨率与文字渲染被明显拉高,界面生成更有「结构感」,还有传闻说首次出现系统级UI工作流的雏形。
按TestingCatalog的说法,发布时间可能在11月中下旬。
入口没开放、功能没官宣,但讨论已经把社区搅得热气腾腾。
谷歌到底在憋什么大招?
全面升级:速度、4K、清晰度一起拉满
关于NanoBananaPro,出现频率最高的词,是「升级幅度超乎想象」。
Pro不是NB1和NB2的简单叠加,而是基于Gemini3.0Pro级多模态引擎,彻底重做了图像生成逻辑。
在如此专业的支撑下,NanoBananaPro的定位也从「创意玩具」上升到了「专业制作级工具」。

最直观的变化,是速度。
爆料者在内测版里跑过一条复杂场景,生成时间压到十几秒以内。
这种时长放在NB1时代根本无法想象,而现在它几乎能跟摄影棚级构图、产品渲染、广告光效同步输出。
画质也迎来一次真正的飞跃。
据爆料NanoBananaPro支持高达4K的分辨率,16:9至9:16比例的尺寸,方便用户根据需求调节。
作品具备真实相机才能捕捉的质感,金属反射、皮肤纹理、光影衔接,不再是「AI风格」,而是「工作流可用级别」。

输入正确完整的prompt后,NanoBananaPro生成的图不论是从颜色搭配,文字排版等各方面看,均达到专业水平。
Prompt:Createawideinfographictitled"HowSolarPowerWorks"withacleanflatdesign.Include:asunicon,solarpaneldiagram,arrowsshowingenergyflowtoahouseandbattery,fournumberedstepswithshortcaptions,andacomparisonbarchartof"DayvsNightusage".

输入以上prompt,就能得到这样一张堪称完美的「太阳能发电原理图」。
概念工作流程它也行。上传二维草图,就能渲染出超级逼真的三维产品图像,材质和光照都能表现出来。

Prompt:Aclean,3Disometricvisualexplainerofa"SmartHomeEcosystem."Showacross-sectionofahousewithiconsconnectingdifferentdevices:athermostat,asmartfridge,andsecuritycameras.Useapastelcolorpalettewithsoftlighting.
更令人惊喜的是,NanoBananaPro支持同时上传6张图片,并且可以进行「风格迁移」。
你甚至能在上传的图片上涂鸦、圈选或添加注释,以便Gemini根据指示行动。
Prompt:Acinematic,wide-angleviewofIstanbulduringthegoldenhour.Intheforeground,intricateOttomantilepatternsonabalconyrailingareinsharpfocus.Inthebackground,theHagiaSophiaandtheBlueMosquedominatetheskylineacrosstheBosporus,silhouettedagainstawarm,hazyorangeandpurplesunset.Seagullsareflyinginthedistance.Photorealistic,8kresolution.

NanoBananaPro生成的伊斯坦布尔日落时分的全景电影画面
NanoBananaPro的目标很明确。它不只生成图像,还要试图理解图像,力求把每一次渲染、每一处细节推进到「可用于严肃创作」的等级。
懂界面的AI:从「像UI」到「会搭界面」
很多测试者发现,NanoBananaPro好像比以前更有逻辑、更像人了?
这不是幻觉,而是谷歌有意为之。
从目前的公开爆料来看,Pro版在UI方向的变化很一致:
界面不再是「像UI的图片」,更像是被模型按结构拆解并重新组织之后的结果。
标题区、功能区、按钮区、背景信息层,都开始呈现出合理的界面关系,而不是NB1那种风格化堆叠。

提示词:生成一张Windows11操作系统的桌面截图,截图中已打开GoogleChrome浏览器,并在浏览器窗口内展示YouTube网站上Mr.Beast的视频缩略图。

提示词:以赛马娘的东海帝皇为主角的大型游戏实机画面
底层推理更强,模型自然能把界面当成「信息结构」,而不是简单地画图。
与此同时,文字渲染也出现大幅改善。
按钮字体不再漂移、标题不再糊成块、英文字符的笔画明显更稳。

提示词:手账风格,出一个冰激凌制作步骤教程图,步骤说明要中文。
这些提升与UI生成是高度相关。如果没有更高分辨率、更稳的排版,界面就不可能看起来像真的。
Pro版本第一次让界面图呈现出一种「可作为设计参考」的质感。
它不是生成一个长得像软件的图,而是生成一个你能一眼看懂的界面。

对于任何图像模型来说,这已经不止是画风升级,而是能力层级被整体往上推了一格。
创作力爆表:插画、动漫、产品图一键到位
如果说NB1让图像生成进入了全民创作时代,那么NanoBananaPro则更进一步:它开始进入专业领域。
在NB1时代,虽然单张图看起来不错,但复杂光效——比如逆光、棚拍布光、玻璃反射生成不稳定。
Pro的推理底层更强,使得它在渲染高动态范围光效时,更像是一个能理解场景逻辑的系统。

提示词:生成一张巨龙眼睛的特写照,写实。
尤其是在广告图里,金属质感、纹理细节、阴影衔接,都比NB1更接近真实布光。
Prompt:Aprofessionalstudioproductshotofafuturistic,transparentsmart-watchrestingonapieceofdarkslate.Thewatchinterfaceisglowingholographicgreen.Softdramaticlighting,8kresolution,macrophotographystyle,shallowdepthoffield.

传统的NB1可以保持人物五官相似,但在不同角度、不同姿势,往往容易跑偏。
Pro则更关注「更强的角色保持与风格一致性」。在动漫、二次元、真人写实三种风格之间,人物的做工会更稳定,不再出现换角度就换人的情况。

提示词:请生成蜡笔小新和小白在《清明上河图》的一角卖大福的场景。
这对漫画分镜、角色设定、虚拟偶像创作者来说,是一种史诗级别的增强。
显然,NanoBananaPro正在逼近真正的专业创作。
从插画到动漫,再到商业级产品图,每一个方向都在悄悄被Pro推到可用的边界上。
而这,也许才是Pro真正的含义。
如何抢先体验NanoBananaPro?
那么,如何才能体验如此神奇的NanoBananaPro呢?只需四步:
第一步,浏览器进入该网址:discord.gg/UuYfh5KR,加入该频道。
第二步,在频道中找到「lyra-chat」分区,输入「/new」建立一个子区。当然,你也可以加入别人建立的子区。

第三步,进行步骤1后,直接进行步骤4。
第四步,在子区中,点击ChangeModel切换模型,在新的对话中选择2或者3。

这样就能先人一步体验到强大的NanoBananaPro了!
种种证据显示,NanoBananaPro即将隆重登场。
谷歌没说一句话,但空气里已经有了山雨欲来的气息。
如果这些爆料最终成真,Pro不会是NB的常规升级,而是图像模型迈进「专业级时代」的第一步。
接下来,只能等谷歌的官宣了。
参考资料:
https://x.com/m__dehghani/status/1991174956009562583?s=20
http://zhuanlan.zhihu.com/p/1974462028769948765
https://www.geeky-gadgets.com/google-gemini-3-0-pro-leaks/?utm_source
原标题:《图像模型今夜变天?谷歌刚刚泄露了「Nano Banana Pro」这张王牌》
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。





- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2026 上海东方报业有限公司




