- +1
Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会
梦晨西风发自凹非寺
量子位|公众号QbitAI
谷歌乘胜追击!Gemini3Pro好评如潮没两天,最强文生图模型NanoBanana也推出Pro版本。
自推出以来还未被任何人追赶上,谷歌自己就给他升级了,真是不让其他家喘口气。

这次不仅仅是提升图像生成质量。
这次NanoBananaPro又名Gemini3ProImage,整合了Gemini3Pro的多模态理解能力以及谷歌搜索的知识库,能理解现实语义与物理逻辑。
比如生成一张自行车维修保养注意事项海报。

招牌技能多个图片混合,这次最多支持14张输入图片,全都能保持一致性,多个人物角色和复杂场景也不惧。

此外还在NanoBanana基础上强化了文本渲染,结合多模态理解能力,可以直接把图片中的英文文字翻译成韩文、中文或其他语言,同时保持原有的设计风格不变。

谷歌这番操作秀翻全网:
NanoBananaPro让人感觉AI图像创作一夜间迈入了新阶段。

从创意到生产的完整工作流
NanoBananaPro最引人注目的技术进步体现在几个方面。
首先是文字渲染能力的大幅提升,不仅能在图像中准确生成清晰可读的文字、艺术字,还支持多种语言的直接渲染。


营销团队可以用它快速设计生成营销素材,实现创意快速迭代:

这项功能的背后是Gemini3Pro的强大推理能力。模型不仅理解图像内容,还能理解文字的语义上下文,这让它能够在保持原始艺术风格和布局的同时,准确地进行语言转换。
另一个重大突破是模型与GoogleSearch的深度集成。
这不是简单的搜索功能,而是让模型能够基于谷歌搜索庞大知识库、实时信息生成准确的图表、地图和信息图。
比如你要制作一份关于印度奶茶的食谱图解,模型不仅能生成美观的步骤图,还能确保配料比例和制作步骤的准确性。

还可以升级美化原本简约的PPT页面,就像这款小沙发椅,从原料、生产到运输的全流程,它可以自动在地图上清晰标示说明:

Gemini3高级推理加持下,生成的针对性强、专业的信息图,可以帮助用户快速将复杂知识可视化。

比如创建一个胰岛素-葡萄糖反馈回路的解释图。
最终生成结果遵循提示词用箭头显示胰腺(β/α细胞)、肝脏与血液之间的通信方向,清楚标注了高葡萄糖和低葡萄糖状态:

创建一张关于生态系统中营养级和能量转移的详细信息图,它直接生成了标注着生产者、初级消费者、次级消费者和三级消费者的金字塔,包含10%能量转移规则的说明,配有生态系统场景插图:

在分辨率和格式支持上,NanoBananaPro支持2K、4K高清分辨率,能满足专业制作的要求;支持多种宽高比,从社交媒体的方形图片到电影级的2.76:1超宽画幅都能轻松应对。

另外,它还支持自由调整图像的光线、镜头、对焦、色彩调校等物理属性和构图:

比如通过光线和明暗对比重塑画面的视觉逻辑,嗯,这感觉确实不一样了:


指定角色,它还可以快速生成符合某个主题的定制化图片。
例如以雪人为核心角色,聚焦“节日庆祝”主题,在输入框中输入“snowmancelebratingtheholidaysdoingavarietyoffestiveactivities”(雪人庆祝节日,进行各种节日活动)。

紧接着这个雪人就会出现在滑雪缆车、雪地雪橇、宽扎节布置、厨房烤饼干、烛光晚餐等不同场景中。

工作流整合Veo3视频生成模型,还可以一键用刚生成的图当关键帧继续生成视频。

全面铺开:从开发者到普通用户都能用上
谷歌这次的发布策略相当全面,覆盖了从开发者到普通用户的各个层面。
对于普通用户,模型将、通过多个渠道提供。在Gemini应用中选择“创建图像”功能时就能使用,免费用户有限额配额,超出后会回退到原始的NanoBanana模型。GoogleAIPlus、Pro和Ultra订阅用户则享有更高的配额。
对于开发者,NanoBananaPro已经通过GeminiAPI在GoogleAIStudio和VertexAI中提供。企业级用户可以享受到预配置吞吐量、按需付费以及高级安全过滤器等功能。

谷歌还在新的AI开发平台GoogleAntigravity中集成了这项技术,让编码代理能够直接利用图像生成功能来生成详细的UI模型或新的视觉资产。
第三方设计工具如AdobePhotoshop和Figma也会集成NanoBananaPro。

最后,谷歌宣布在Geminiapp中推出AI图像验证功能,依托其2023年推出的SynthID数字水印技术(给AI生成的内容加一层“隐形水印”)。
用户可通过上传图像并提问“这是AI生成的吗?”,确认其是否由谷歌AI生成或编辑。

官方表示未来这个功能还将扩展至视频、音频等更多格式及搜索等更多平台。
与此同时,即日起Geminiapp、VertexAI、GoogleAds、Flow中的NanoBananaPro生成图像中将被嵌入C2PA元数据。
换句话说,在这些平台上用NanoBananaPro做出来的图片,都会自带能查来源和创作信息的专属“数字档案”。
官方Blog:https://blog.google/technology/ai/nano-banana-pro/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=
参考链接:
[1]https://x.com/GoogleDeepMind/status/1991522595129139486
欢迎在评论区留下你的想法!
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。





- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2025 上海东方报业有限公司




