图像模型(Banana / Seedream / Midjourney)
概览
当前代码中的主要图像模型包括:
- Banana Pro(
nano-banana-pro) - Nano Banana 2(
nano-banana-2) - Seedream 5 Lite(
doubao-seedream-5.0-lite) - Z-Image(轻量快速)
- Midjourney V7(
mj-v7)
常见能力
- 文生图(Text-to-Image)
- 图生图(Image-to-Image)
- 多参考图融合(模型支持范围不同)
关键差异(用户视角)
- Banana Pro:稳定、好上手,最多 8 张参考图。
- Nano Banana 2:参考图上限更高(最多 14 张),可选比例更丰富。
- Seedream 5 Lite:分辨率上限更高(支持到 3K),适合高质感图像。
- Z-Image:成本低、出图快,适合打草稿。
- Midjourney V7:风格表现力强,支持更多风格控制参数。
常用参数(按模型动态显示)
aspectRatio/aspect_ratio:输出比例resolution:清晰度档位(如 1K/2K/4K 或 2K/3K)- Midjourney 相关:
speed、stylization、weirdness、variety、action
输入限制(代码配置)
- Banana Pro:参考图最多 8 张
- Nano Banana 2:参考图最多 14 张
- Seedream 5 Lite:参考图最多 14 张
- Midjourney V7:参考图最多 8 张(某些动作模式必需)
使用建议
- 先用低成本模型定方向,再切到高质量模型做定稿。
- 多参考图时,尽量保持主题一致,避免风格冲突。
- 电商、广告、品牌场景建议先固定比例再迭代细节。