deepsop-genvis - SKILL.md Agent Skill

name: deepsop-genvis description: | DeepSOP AI 图片与视频生成技能。用于调用 AI Artist API 创建图片或视频任务、上传参考图片/视频/音频、预估费用、轮询结果，并按 Vue 前端规则根据接口返回的 sourceValue/methodType 校验 generationType、ratio、resolution、duration、参考素材数量、搜索开关、音频开关等参数约束。

本技能不维护、声明或向用户展示模型名称清单、可用模型清单、展示顺序或固定默认模型。模型列表与默认选中值全部来自服务端 consumeSource/list；生成图片默认取 IMAGE_MODEL 列表第一个可用模型，生成视频默认取 VIDEO_MODEL 列表第一个可用模型。methodType 规则仅用于根据接口返回模型的 sourceValue 生成/校验请求参数，不代表本技能内置了哪些模型、当前可用哪些模型或固定默认使用哪个模型。

DeepSOP GenVis

使用 scripts/generate_image.py 创建 AI 图片或视频任务。脚本会先预估费用，再提交任务并轮询到 SUCCESS / FAILED / TIMEOUT。

前置条件：DEEPSOP_API_KEY

本技能需要 API Key 授权才能调用 DeepSOP 接口。

OPClaw 项目运行时直接读取项目设置里的 DEEPSOP_API_KEY。
非 OPClaw 运行时，引导用户授权后把 DEEPSOP_API_KEY 配置为共享环境变量或 ~/.openclaw/openclaw.json，让其他 DeepSOP 技能也能复用。
读取不到 Key 时，引导用户登录/注册并新建 API Key：
- 已有账号 → https://ai.deepsop.com/login?source=2
- 没有账号 → https://ai.deepsop.com/register?source=2
API Key 通常以 sk- 开头。

共享配置示例：

DEEPSOP_API_KEY=sk-your_api_key_here

必须遵守

OPClaw 项目运行时使用项目设置里的 DEEPSOP_API_KEY；非 OPClaw 运行时，让用户授权后设置共享 DEEPSOP_API_KEY。
模型列表、模型名称、模型顺序、默认模型只来自 consumeSource/list；不要在对用户回复中枚举或承诺本地文档、README、脚本常量、示例命令里的模型清单/默认模型。
未指定模型时，先按 prompt 判断图片或视频；生成图片取 IMAGE_MODEL 列表中 sourceValue != "auto" 且 hiddenState == "0" 的接口返回顺序第一个，生成视频取 VIDEO_MODEL 列表中 sourceValue != "auto" 且 hiddenState == "0" 的接口返回顺序第一个。不得在技能里说明或暗示图片/视频固定默认是某个模型。
每次发起费用预估、提交任务、只提交任务前，都必须以本次 consumeSource/list 返回结果为准校验当前请求的模型仍存在且 hiddenState == "0"；如果列表不存在该 sourceValue 或 hiddenState != "0"，必须停止并反馈实际状态，不得继续提交。
指定模型时，仅使用获取模型列表接口返回的 sourceValue/methodType；脚本保留友好别名只是兼容旧调用，不作为技能文档依据，也不要主动向用户推荐。
用户明确指定某个模型名/别名（例如文本里出现 V3.1FB）并要求生成时，先用获取模型列表接口在对应媒介类型里确认该名称/sourceValue 的最新状态；如果接口显示启用，就按该接口返回项提交，不要因为本地同 sourceValue 的图片模型、旧别名或旧缓存显示停用而拦截。
用户显式指定模型时，模型选择优先于时长、比例、分辨率、生成类型等偏好参数。若该模型不支持用户给出的参数（例如指定 V3.1FB 但要求 5 秒，而接口/前端规则固定为 8 秒），只能按该模型规则校正参数并在回复中明确说明，或停止并请用户确认；严禁为了满足参数偏好自动改用其他模型。
选中模型或切换模型后，只根据接口返回的 sourceValue（写入 methodType）触发本地规则：参数默认值、可见字段、字段选项、必填校验、payload 组装。
任务失败时，不要自动切换模型重试。必须反馈实际使用的 methodType、状态和失败原因。
单次用户生成请求只能提交用户指定的那一个模型任务；除非用户明确要求多个方案/多个版本/备用模型，否则不要创建“版本1/版本2”、备用结果或补偿性重做任务。
用户没有指定数量时，图片默认只生成 1 张（--n 1 或省略 --n），视频默认只生成 1 个；用户明确要求多张/多个且所选模型支持时，单次任务使用一次 --n <数量>，不要拆成多次生成或额外补做备用结果。
OPClaw/Windows 正常生成时走快速路径：不要先执行 --help、读取/检查脚本源码，除非用户正在询问模型/参数/状态排查；不要使用 ~ 作为 workdir，不要用 cd ... && ...，不要用 uv run / uv add / uv pip。直接用已安装技能的绝对路径调用系统 Python，例如 python C:\Users\Administrator\.openclaw\skills\deepsop-genvis\scripts\generate_image.py "<prompt>" --json-output。模型可用性必须由脚本/接口在提交前实时校验，不得靠技能描述或示例命令判断。
用户要求“以上/上文/刚才生成的图片作为参考图”生成视频时，直接复用对话中最近的图片 HTTP/HTTPS URL；不要下载、不要重新上传、不要调用图片分析工具、不要写临时 Python 脚本。对于 V3.1FB / methodType 3 这类支持 REFERENCE 的视频模型，把这些 URL 作为逗号分隔值传给 --image-url-list，并显式传 --generation-type REFERENCE。
指定某个视频模型且使用上文网络图片参考生成视频时，命令形态是：python C:\Users\Administrator\.openclaw\skills\deepsop-genvis\scripts\generate_image.py "<视频提示词>" --model "<接口返回的sourceValue或用户明确指定的模型别名>" --generation-type REFERENCE --image-url-list "<url1>,<url2>" --json-output。只需提交任务并轮询结果；提交前必须由脚本/接口按最新模型列表确认该模型 hiddenState == "0"，不要读源码或做 dry-run。
生成结果返回 SUCCESS 后，直接把本次结果 URL 作为最终回复内容返回；不要再调用 image/视觉分析工具去“查看效果、描述画质、分析图片”，除非用户明确要求分析、评价、描述或看图。最终回复中保留图片/视频 URL 或 Markdown 媒体链接，客户端会据此渲染预览卡片。
正常生成必须带 --json-output，确保客户端能从 url / urls / outputUrl(s) / mediaUrl(s) / imageUrl(s) / ossUrlList 字段提取全部图片或视频结果。不要只用自然语言说“生成成功”。
费用字段单位必须按接口语义展示为“算力”。estimatedCost 表示消耗算力，不是人民币；生成后详情若展示费用，必须写成 费用：{estimatedCost} 算力。如确需展示人民币估算，只能额外按 1元 = 10算力 换算并明确标注，不能把算力数值直接标成“元”。
只有脚本本次执行的 stderr 明确返回 hiddenState=1 / 当前已停用 时，才允许告诉用户该接口返回项已停用；如果脚本实际使用的是接口返回的第一项，只能说明“未显式指定模型，按接口返回顺序选择了本次 sourceValue”，禁止推断或编造某个模型已停用。
用户只是在问模型列表、所有模型（包括停用）、某个模型的参数/选项/分辨率/时长/支持素材/状态排查时，只回答查询结果或本地 methodType/sourceValue 参数规则；不要创建、预估或继续执行生成任务，除非用户再次明确要求“生成/提交/开始做”。
用户给本地参考图/视频/音频时，先上传成可访问 URL，再放入对应参数。

快速命令

# 内部调试：读取接口当前返回的模型列表，不用于向用户展示固定模型清单
python3 scripts/generate_image.py --list-models

# 不指定模型时，由接口返回值决定本次实际使用的 sourceValue
python3 scripts/generate_image.py "一只可爱的猫"
python3 scripts/generate_image.py "生成一段城市夜景延时视频"

# 指定接口返回的 sourceValue/methodType
python3 scripts/generate_image.py "产品宣传图 4 种风格" --model 10 --n 4 --ratiocination high
python3 scripts/generate_image.py "城市夜景延时短片" --model 20 --ratio "16:9" --resolution "1080p" --duration 10
python3 scripts/generate_image.py "让上文两张图中的人物在樱花树下轻微转身，镜头缓慢推进" --model V3.1FB --generation-type REFERENCE --image-url-list "https://example.com/a.png,https://example.com/b.png" --json-output

# 调试 payload，不提交任务
python3 scripts/generate_image.py "测试" --model 15 --dry-run --json-output

# 两步工作流（解决 exec 超时导致重复提交的问题）：
# 第一步：只提交任务，立即拿到 task_id，不阻塞等待
python3 scripts/generate_image.py "库阔AI宣传图" --model 10 --submit-only --json-output
# 第二步：用 task_id 单独轮询（可设置较短的 max-wait，多次调用直到成功）
python3 scripts/generate_image.py "x" --poll <task_id> --max-wait 120 --json-output

先问什么

当用户信息不足且会影响成本或结果时，一次只问 2-3 个关键问题：

图片：是否有参考图、比例/尺寸、质量档位。
视频：生成类型、时长、比例/分辨率、是否生成声音。
参考/编辑/续写视频：必须问素材 URL 或本地文件路径。
多镜头：确认单镜头、智能分镜或自定义分镜；自定义分镜必须有每个镜头的描述和时长。
如果用户请求是“查看/列出/告诉我/有什么参数/支持什么分辨率/所有模型列表/包括停用模型”等信息查询，即使查询结果发现某个先前提到的模型可用，也必须停在回答信息查询，不要自动恢复或发起之前的生成任务。

用户说“随便/快速来一个”时，可以按接口返回值和脚本默认参数直接生成；结果里只说明本次实际使用的 methodType/sourceValue 和关键参数，不宣称存在固定默认模型。

图片 methodType/sourceValue 内部规则

以下规则仅用于处理获取模型列表接口返回的 sourceValue，并在切换图片模型后触发前端参数逻辑；不要把这些编号解释成面向用户的模型清单：

quality: methodType 1/10/11 默认 1K，其他默认 2K。
size: methodType 2/8/9/10/11 默认 auto，其他默认 1:1。
webSearch: methodType 4/8 默认开启。

methodType	quality	size/ratio 规则	特殊参数	参考素材规则
`0`	`2K/4K`	不支持 `auto`；提交为 `WxH`，如 `2048x2048`	无	标准图片参考
`1`	`1K`	禁用 `1:2/2:1/1:3/3:1/1:4/4:1/1:8/8:1/4:5/5:4/9:21/21:9`	无	标准图片参考
`2`	`1K/2K/4K`	支持 `auto`；禁用 `1:2/2:1/1:3/3:1/1:4/4:1/1:8/8:1/9:21`	无	参考图最多 10 张，单张 10MB
`3`	`1K/2K/4K`	禁用 `auto/1:2/2:1/1:3/3:1/1:4/4:1/1:8/8:1/9:21`	无	标准图片参考
`4`	`2K/3K`	不支持 `auto`；提交为 `WxH`，如 `2048x2048`	`webSearch`	标准图片参考，额外提交 `duration=10`
`5`	`1K/2K/4K`	同 `3`	无	标准图片参考
`6`	`1K/2K`	禁用 `auto/9:21/21:9`；提交为 `W*H`	无	最多 9 张；单张 20MB；最短边 240，最长边 8000
`7`	`1K/2K`	同 `6`	无	同 `6`
`8`	`1K/2K/4K`	支持 `auto`；禁用 `1:2/2:1/1:3/3:1/9:21`	`webSearch`、`imageSearch`	单张 20MB；最长边 6000
`9`	`1K/2K/4K`	同 `8`	无	参考图最多 14 张，单张 10MB
`10`	`1K/2K/4K`	支持 `auto`；禁用 `1:4/4:1/1:8/8:1`	`ratiocination=low/medium/high`、`n=1-10`；不提交 `webSearch/imageSearch`	参考图最多 16 张；单张 50MB；prompt 上限 16000 字
`11`	前端隐藏 `quality`	支持 `auto`；禁用 `1:4/4:1/1:8/8:1/4:5/5:4`	不提交 `quality`	参考图最多 16 张；单张 50MB；prompt 上限 16000 字

图片上传映射：

本地素材	允许格式	上传后参数	备注
参考图	JPEG/JPG/PNG/WEBP	`image`	methodType `6/7` 使用更高图片尺寸限制；methodType `10/11` 单张 50MB

视频 methodType/sourceValue 内部规则

以下规则仅用于处理获取模型列表接口返回的 sourceValue，并在切换视频模型后触发前端参数逻辑；不要把这些编号解释成面向用户的模型清单：

基础重置：resolution=720p、ratio=16:9、duration=10、generateAudio=true、shotType=single、mode=pro。
methodType 3/4/5/6/11/12 默认 duration=8。
methodType 10 默认 shotType=multi。
默认 generationType: 7/15 为 TEXT；1/4/5/6/8/14 为 FIRST&LAST；其他为 REFERENCE。之后按白名单校正。

methodType	generationType	ratio	resolution	duration	关键规则
`1`	`TEXT/FIRST&LAST`	`16:9/9:16`	`720p`	`10-15s`	首尾帧模式用 `firstImageUrl`
`2`	`TEXT/FIRST&LAST`	`adaptive/1:1/4:3/3:4/16:9/9:16/21:9`	`480p/720p/1080p`	`4-12s`	支持 `durationSwitch`
`3`	`TEXT/FIRST&LAST/REFERENCE`	`adaptive/16:9/9:16`	`720p`	固定 `8s`	`REFERENCE` 至少一张参考图
`4`	`TEXT/FIRST&LAST`	`adaptive/16:9/9:16`	`720p`	固定 `8s`	默认首尾帧
`5`	`TEXT/FIRST&LAST`	`adaptive/16:9/9:16`	`720p/1080p/4K`	`4s/8s`	支持 `n=1-4`、`personGeneration`、`resizeMode`
`6`	`TEXT/FIRST&LAST`	`adaptive/16:9/9:16`	`720p/1080p/4K`	`4s/8s`	同 `5` 的时长规则
`7`	`TEXT`	`1:1/4:3/3:4/16:9/9:16`	`720p/1080p`	`3-15s`	`size` 提交为 `W*H`，支持 `negativePrompt/promptExtend/shotType`
`8`	`FIRST&LAST`	由首帧决定，不提交 ratio	`720p/1080p`	`3-15s`	必须传首帧；不支持尾帧
`9`	`REFERENCE`	`1:1/4:3/3:4/16:9/9:16`	`720p/1080p`	`3-10s`	参考图片+参考视频总数 `1-5`，`size` 提交为 `W*H`
`10`	`TEXT/FIRST&LAST/REFERENCE/EDIT/FEATURE`	`1:1/16:9/9:16`，部分模式隐藏	`720p/1080p`	`3-15s`	支持 `shotType=single/multi/customize`、`mode`、`keepOriginalSound`；`EDIT/FEATURE` 需要视频
`11`	`TEXT/FIRST&LAST`	`adaptive/1:1/4:3/3:4/7:4/4:7/16:9/9:16/21:9`	`720p`	`4-12s`	默认 `8s`
`12`	`TEXT/FIRST&LAST`	`16:9/9:16/7:4/4:7`	`720p/2K`	`4-12s`	默认 `8s`
`13`	`TEXT/FIRST&LAST/REFERENCE`	`adaptive/1:1/4:3/3:4/7:4/4:7/16:9/9:16/21:9`	`720p/2K`	`4-12s`	`REFERENCE` 可用参考图
`14`	`FIRST&LAST/CONTINUATION`	由首帧决定，不提交 ratio	`720p/1080p`	`3-15s`	`CONTINUATION` 必须有 `firstClipUrl`
`15`	`TEXT`	`1:1/4:3/3:4/16:9/9:16`	`720p/1080p`	`3-15s`	支持 `negativePrompt/promptExtend`
`16`	`REFERENCE`	`1:1/4:3/3:4/16:9/9:16`	`720p/1080p`	有参考视频时 `3-10s`，否则 `3-15s`	参考图片+参考视频总数 `1-5`
`17`	`TEXT/FIRST&LAST/REFERENCE`	`adaptive/1:1/4:3/3:4/16:9/9:16/21:9`	`480p/720p/1080p`	`4-15s`	支持 `durationSwitch`、`webSearch`、参考图片/视频/音频
`18`	`TEXT/FIRST&LAST/REFERENCE`	同 `17`	`480p/720p`	`4-15s`	同 `17`
`19`	`TEXT/FIRST&LAST/REFERENCE/EDIT`	`1:1/4:3/3:4/5:4/4:5/16:9/9:16/21:9/9:21`，`EDIT` 时隐藏	`720p/1080p`	`3-15s`；`EDIT` 由视频决定	不支持尾帧、`negativePrompt/generateAudio/enhancePrompt/promptExtend/shotType/webSearch`；`EDIT` 必须有 `firstClipUrl`
`20`	`TEXT/FIRST&LAST/REFERENCE`	同 `17`	`480p/720p/1080p`	`4-15s`	同 `17`
`21`	`TEXT/FIRST&LAST/REFERENCE`	同 `17`	`480p/720p`	`4-15s`	同 `17`

视频素材上传与参数映射

本地素材	允许格式/限制摘要	上传后参数	适用规则
首帧图	JPEG/JPG/PNG/WEBP；按 methodType 图片尺寸限制校验	`firstImageUrl`	`FIRST&LAST`、部分首帧/图生视频必填
尾帧图	JPEG/JPG/PNG/WEBP	`lastImageUrl`	传尾帧时必须同时传首帧；methodType `8/19` 不支持尾帧
参考图	JPEG/JPG/PNG/WEBP	`imageUrlList`	`REFERENCE` 或多模态参考；methodType `9/16` 与参考视频合计 `1-5`
参考主体图	JPEG/JPG/PNG	`elementList`	methodType `10` 的主体参考
续写/编辑/参考视频	MP4/MOV；Wan r2v 通常 100MB、1-30s；methodType `10` 200MB、3-10s；methodType `17/18/20/21` 50MB、2-15s；methodType `19` 100MB、3-60s	`firstClipUrl` 或 `videoUrlList` / `videoList`	`CONTINUATION/EDIT/FEATURE/REFERENCE`
音频	WAV/MP3；Wan 单音频 15MB、3-30s；methodType `17/18/20/21` 最多 3 个、2-15s、总时长不超过 15s	`audioUrlList`	methodType `17/18/20/21` 使用音频时，必须同时提供参考图或参考视频

输出契约

stdout 只输出最终一行结果：默认 URL，--json-output 为单行 JSON，--markdown-output 为 Markdown 图片链接。
--json-output 成功结果会包含 estimatedCost 和 costUnit: "算力"；外层详情展示必须使用该单位，不得显示为“元”。
stderr 输出进度、费用、任务 ID、警告和失败原因；其中费用单位同样是“算力”。
退出码：0 成功，1 失败或超时。

错误处理

DEEPSOP_API_KEY 未设置：提示用户需要 API Key 授权。
- OPClaw 项目运行时检查项目设置里的 DEEPSOP_API_KEY。
- 非 OPClaw 运行时，引导用户登录/注册获取 Key：已有账号 login?source=2，没有账号 register?source=2。
- 配置共享环境变量或 ~/.openclaw/openclaw.json 后再重试。
401：提示 API Key 无效或过期，按上面的登录/注册入口重新获取 Key。
4xx/5xx：反馈实际状态码和接口错误信息，不要自动切换模型或伪造结果。

参考文件

scripts/generate_image.py: 可执行脚本与本地 sourceValue/methodType 参数规则矩阵。
references/api.md: API 端点、请求格式、素材字段映射。
references/chat-integration.md / references/feishu-integration.md: 对话和飞书集成说明。