图像模型（Banana / Seedream / Midjourney）

概览

当前代码中的主要图像模型包括：

Banana Pro（nano-banana-pro）
Nano Banana 2（nano-banana-2）
Seedream 5 Lite（doubao-seedream-5.0-lite）
Z-Image（轻量快速）
Midjourney V7（mj-v7）

常见能力

文生图（Text-to-Image）
图生图（Image-to-Image）
多参考图融合（模型支持范围不同）

关键差异（用户视角）

Banana Pro：稳定、好上手，最多 8 张参考图。
Nano Banana 2：参考图上限更高（最多 14 张），可选比例更丰富。
Seedream 5 Lite：分辨率上限更高（支持到 3K），适合高质感图像。
Z-Image：成本低、出图快，适合打草稿。
Midjourney V7：风格表现力强，支持更多风格控制参数。

常用参数（按模型动态显示）

aspectRatio / aspect_ratio：输出比例
resolution：清晰度档位（如 1K/2K/4K 或 2K/3K）
Midjourney 相关：speed、stylization、weirdness、variety、action

输入限制（代码配置）

Banana Pro：参考图最多 8 张
Nano Banana 2：参考图最多 14 张
Seedream 5 Lite：参考图最多 14 张
Midjourney V7：参考图最多 8 张（某些动作模式必需）

使用建议

先用低成本模型定方向，再切到高质量模型做定稿。
多参考图时，尽量保持主题一致，避免风格冲突。
电商、广告、品牌场景建议先固定比例再迭代细节。

Gemini / Seed 2.0（文本）Sora 2 / Pro（视频）