中文模型能力介绍Gemini / Seed 2.0(文本)

Gemini / Seed 2.0 文本模型

概览

StoryFlow 当前提供的主流文本理解能力包括:

  • Gemini 3 Flash:响应快,适合高频迭代。
  • Doubao Seed 2.0 Pro:多模态理解能力强,适合复杂分析任务。

两者都可用于“先理解,再生成”的上游步骤。

能力

  • 文本生成(脚本、大纲、分镜描述、提示词优化)
  • 图像理解(读图、提取风格关键词)
  • 视频理解(总结内容、提取镜头信息)

输入

  • prompt:必填
  • referenceImage:可选(可多张)
  • referenceVideo:可选

参数

文本模型本身几乎不需要复杂参数,重点在于输入内容质量。

使用建议

  • 想快速迭代时,优先用 Gemini 3 Flash。
  • 有复杂素材分析需求时,优先试 Seed 2.0 Pro。
  • 把文本输出连接到图像/视频节点,通常能显著提高可控性。