- 谷歌发布Gemini 2.5 Flash图像模型(代号Nano-Banana)
- 支持多图融合、角色一致性及物理规律理解等核心技术
- 在LMArena基准测试中成为AI图像编辑模型第一名
这周爆火的神秘模型纳米香蕉🍌终于现真身,系谷歌最新的图像生成与编辑模型——Gemini 2.5 Flash。
功能亮点: 1、角色一致性:人物在不同角度、表情、场景中保持高度一致,减少脸崩。光影逻辑自然,细节还原精准。
2、多图融合:可将多张输入图“无缝合一”,最多3张图。
3、真实世界规律理解:利用 Gemini 的“世界知识”理解物体/场景语义,生成复合物理规律的图像。
4、多轮编辑能力:支持多步骤渐进式编辑,用户可逐步优化图像。
5、目前该模型通过Gemini APP、Gemini API、Google AI Studio 和 Vertex AI 提供,免费和付费用户皆可使用。
6、价格:text input: $0.3, output:$2.5 image input: $0.3 , output:$30
7、在 LMArena 基准测试中,Gemini 2.5 Flash Image 已经是AI 图像编辑模型第一名。
效果