Gemini / Seed 2.0 文本模型

概览

StoryFlow 当前提供的主流文本理解能力包括：

Gemini 3 Flash：响应快，适合高频迭代。
Doubao Seed 2.0 Pro：多模态理解能力强，适合复杂分析任务。

两者都可用于“先理解，再生成”的上游步骤。

能力

文本生成（脚本、大纲、分镜描述、提示词优化）
图像理解（读图、提取风格关键词）
视频理解（总结内容、提取镜头信息）

输入

prompt：必填
referenceImage：可选（可多张）
referenceVideo：可选

参数

文本模型本身几乎不需要复杂参数，重点在于输入内容质量。

使用建议

想快速迭代时，优先用 Gemini 3 Flash。
有复杂素材分析需求时，优先试 Seed 2.0 Pro。
把文本输出连接到图像/视频节点，通常能显著提高可控性。

常见问题 Banana / Seedream / MJ（图像）