Gemini / Seed 2.0 文本模型
概览
StoryFlow 当前提供的主流文本理解能力包括:
- Gemini 3 Flash:响应快,适合高频迭代。
- Doubao Seed 2.0 Pro:多模态理解能力强,适合复杂分析任务。
两者都可用于“先理解,再生成”的上游步骤。
能力
- 文本生成(脚本、大纲、分镜描述、提示词优化)
- 图像理解(读图、提取风格关键词)
- 视频理解(总结内容、提取镜头信息)
输入
prompt:必填referenceImage:可选(可多张)referenceVideo:可选
参数
文本模型本身几乎不需要复杂参数,重点在于输入内容质量。
使用建议
- 想快速迭代时,优先用 Gemini 3 Flash。
- 有复杂素材分析需求时,优先试 Seed 2.0 Pro。
- 把文本输出连接到图像/视频节点,通常能显著提高可控性。