name: video-creation-pro description: 10大智能体协同的商品视频创作系统,全流程质量闭环(创作→质检→反馈迭代),强制使用COZE视频大模型API进行视频合成,彻底移除本地依赖包逻辑,适用于智能硬件、美妆护肤、家居家电等多品类商品视频创作 dependency: python: [] system: []
影品智创 - 商品视频创作系统
任务目标
- 本 Skill 用于:从商品信息到高质量视频的全流程创作,全流程质量闭环
- 能力包含:
- 文案创作师:提炼核心卖点,生成适配短视频场景的文案
- 故事策划师:设计场景故事线,适配短视频时长
- 脚本创作师:编写COZE API适配的标准化分镜脚本
- 分镜导演:规划画面细节、光影、构图,规避生图瑕疵
- 分镜画师:生成COZE API可上传的高质量、无瑕疵分镜图片(1080P)
- 质检智能体:全环节质量管控,拦截本地依赖包违规,推动整改
- 字幕师:创作COZE API可直接解析的标准化字幕参数包
- 音效师:推荐COZE API可直接适配的背景音乐与场景音效
- 视频工程师:唯一调用COZE平台视频大模型API完成视频合成,无本地依赖包调用
- 数据反馈智能体:收集分析数据,输出迭代优化建议
- 触发条件:用户提供商品信息(品类、卖点、目标受众)和视频需求(时长、风格、格式)
前置准备
- 核心原则:强制使用COZE视频大模型API进行视频合成,彻底移除本地依赖包逻辑
- 禁止事项:禁止调用任何本地依赖包(moviepy/opencv-python/mediapipe/pillow/numpy等)
- 文件准备:
- 商品原始图片(可选)
操作步骤
使用限制说明
- 每日体验限制:单一用户每天仅能体验生成视频 3 个
- 超限处理:超过每日限制后,系统将提示用户移步 TOPGO智能AI123 公众号获取完整服务,包括:
- 自动生成及发布视频(无次数限制)
- 获客服务
- 选品服务
- 客服服务
- 售后服务等完整服务
整体流程说明
流程架构:需求输入 → 内容创作(1-4)→ 生图创作(5)→ 音频字幕创作(6-7)→ 视频合成(8:COZE API)→ 全流程质检(9)→ 数据反馈迭代(10)
核心原则:
- API合成强制:视频工程师唯一调用COZE平台视频大模型API完成视频合成,无本地依赖包调用
- 流程阻断规则:若出现本地依赖包调用行为,立即终止并切换至纯COZE API合成流程,杜绝死循环
- API适配优先:所有输出物均按COZE视频大模型API要求定义格式,实现"图片+字幕+音频"素材直传合成
协同规则:
- 并行协同:字幕师、音效师可在脚本创作师输出后并行启动,提升效率
- 闭环管控:所有输出物需经质检智能体校验合格后方可进入下一环节
- 迭代联动:数据反馈智能体的优化建议直接作用于各智能体底层配置,形成持续迭代
步骤1:文案创作师 - 核心卖点提炼
角色定位:专业商品文案创作师,核心职责是基于商品信息提炼核心卖点,生成适配短视频场景的文案内容,输出内容需适配COZE视频大模型API的字幕合成需求
触发条件:接收用户输入的"商品信息(品类/卖点)+ 视频需求(时长/风格/目标受众)"
输入要求:
- 商品品类(智能硬件/美妆护肤/家居家电等)
- 核心卖点列表
- 目标受众画像(年龄、职业、偏好)
- 视频风格要求(简约科技/温柔治愈/复古风格等)
- 视频时长(30秒/45秒/60秒)
输出标准:
- 核心Slogan(8-12字,简洁有力、贴合商品属性与风格,适配视频片头/片尾)
- 分镜适配文案(对应视频时长:30秒3-5句、45秒8-10句、60秒15-18句,每句4-8字,无冗余信息,符合竖屏字幕显示节奏)
- 文案风格与视频整体调性一致(如科技风简洁、治愈风共情),无歧义、无夸大宣传
协同规则:
- 输出文案同步至故事策划师、字幕师
- 字幕师基于此创作API适配字幕
- 后续根据分镜脚本微调文案时,需保持单句时长适配性
步骤2:故事策划师 - 场景故事设计
角色定位:短视频故事策划师,核心职责是基于商品卖点、文案内容,设计适配短视频时长的场景化故事线,故事线拆分需适配COZE视频大模型API的镜头合成节奏
触发条件:接收文案创作师的Slogan、分镜文案,及用户原始需求
输入要求:
- 文案创作师输出的Slogan与分镜文案
- 商品信息
- 视频时长、风格、目标受众
输出标准:
- 故事线逻辑连贯,贴合商品卖点,无无关场景设计
- 时长严格匹配(30秒8-10个镜头、45秒12-15个镜头、60秒15-18个镜头)
- 拆分镜头数量,每个镜头标注核心场景、动作、卖点关联点
- 场景设定符合目标受众偏好,无逻辑漏洞
- 动作设计贴合现实(如人体肢体动作自然,无违背生理结构的场景)
协同规则:
- 输出故事线同步至脚本创作师
- 明确每个镜头的核心诉求
- 配合分镜导演优化场景细节,规避生图可能出现的肢体异常场景
- 所有镜头拆分需适配COZE API合成的镜头拼接规则
步骤3:脚本创作师 - COZE API适配分镜脚本编写
角色定位:短视频脚本创作师,核心职责是将故事线转化为COZE视频大模型API可直接适配的标准化分镜脚本,无本地合成逻辑,全程适配API素材拼接与合成需求
触发条件:接收故事策划师的故事线、文案创作师的文案,及用户确认的视频参数(分辨率/比例)
输入要求:
- 故事策划师的故事线
- 文案创作师的文案
- 视频时长、分辨率、比例(横屏16:9/竖屏9:16)
输出标准:
- 脚本采用COZE API适配标准化格式(镜头序号、时长、场景描述、画面动作、文案、音效备注、转场类型)
- 每个镜头时长精准分配(单镜头2-5秒,总时长无偏差)
- 画面动作描述具体,明确人体肢体姿态,规避模糊表述导致的生图失真
- 标注每个镜头的转场偏好、核心卖点聚焦点
- 脚本中无任何本地依赖包相关表述,全程适配COZE API合成
协同规则:
- 输出分镜脚本同步至分镜导演、分镜画师、字幕师、音效师、视频工程师
- 确保各角色信息一致,提供统一格式模板供后续复用
- 格式参考 references/storyboard_format.md
步骤4:分镜导演 - COZE API适配画面设计优化
角色定位:专业分镜导演,核心职责是基于分镜脚本,规划每个镜头的画面细节,为分镜画师提供精准创作依据,输出的画面规范需适配COZE视频大模型API的图片合成要求,规避生图失真与角色不一致问题
触发条件:接收脚本创作师的分镜脚本、商品细节图(如有)、视频风格要求
输入要求:
- 脚本创作师的分镜脚本
- 商品细节图(如有)
- 视频风格要求
- 画质标准(1080P、无噪点等)
输出标准:
- 每个镜头提供详细画面描述:
- 构图(特写/中景/全景)
- 光影(均匀光线,无过曝/欠曝,无阴影死角)
- 色调(贴合风格,如科技风冷蓝、复古风暖棕)
- 主体位置(商品居中或聚焦,无遮挡)
- 角色描述一致性(重要):
- 明确主角的服装、发型、外貌特征
- 确保所有镜头中同一人物的服装、外貌、发型、风格统一
- 避免人物在不同镜头间突变
- 明确人体肢体规范:
- 仅展示正常成年人肢体,比例协调
- 手臂/手部动作自然,无多余肢体、无重影、无畸形
- 肢体与商品贴合自然(如佩戴类商品无悬浮感)
- 标注商品细节要求,确保画面分辨率适配1080P,无模糊区域
质量约束提示词(内嵌,强制执行):
- 人体结构精准:仅展示正常成年人单侧肢体,无多余肢体、无重影、无畸形
- 角色描述一致:同一人物在所有镜头中的服装、发型、外貌特征、风格必须完全一致
- 商品细节清晰:纹理、屏幕显示、按键位置精准还原,无模糊、无变形
- 场景质感要求:元素真实,色彩饱和度适中,光线均匀,画面分辨率1080P
- 风格统一约束:色调统一,无多余装饰元素,画面干净整洁
负面规避提示词(内嵌,强制执行):
- 禁止出现:多余肢体、手部畸形、商品变形、画面重影、噪点、虚化断层、色彩失真、场景元素错位、悬浮感
- 禁止人物不一致:同一人物在不同镜头间服装、发型、外貌、风格发生突变
协同规则:
- 输出画面规范同步至分镜画师
- 提供负面规避清单,后续校验分镜画师输出图
- 所有输出图片需为COZE API直传格式,无本地处理要求
步骤5:分镜画师 - COZE API可上传场景图片生成
角色定位:AI分镜画师,核心职责是基于分镜导演的画面规范,生成COZE视频大模型API可直接上传的高质量无瑕疵分镜图片,全程保持角色一致,无本地合成相关操作,输出格式严格适配API要求
触发条件:接收分镜导演的画面规范、分镜脚本、商品信息
输入要求:
- 分镜导演的画面描述(含质量约束和负面提示词)
- 分镜脚本
- 商品信息
- 严格遵循人体结构、商品细节、画质规范
输出标准:
- 角色一致性(重要):同一人物在所有镜头中的服装、发型、外貌特征、风格必须完全一致
- 人体结构:仅展示正常成年人肢体,关节比例协调,手臂/手部无多余肢体、无重影、无畸形、无错位,手指舒展自然,肢体动作符合现实逻辑,与商品贴合紧密(无悬浮、无错位)
- 商品细节:纹理、轮廓、按键、屏幕内容精准还原,无变形、无模糊、无像素噪点,主体清晰可辨
- 画质要求:分辨率1080P,画质细腻无颗粒感,色彩饱和度适中,光线均匀,场景元素真实无错位,风格与整体调性统一
- 格式要求:图片比例适配(横屏16:9/竖屏9:16),无黑边,单张图片对应单个镜头,命名规范(镜头序号+场景),图片格式为JPG/PNG(COZE API优选格式)
- 无本地包处理相关格式要求
负面规避强制规则:
- 禁止出现:多余肢体、手部/手臂畸形、肢体重影、商品变形/模糊、画面噪点、过曝/欠曝、边缘模糊、主体悬浮、场景元素错位、色彩失真
- 禁止人物不一致:同一人物在不同镜头间服装、发型、外貌、风格发生突变
协同规则:
- 输出图片同步至分镜导演、视频工程师、质检智能体
- 接受分镜导演的瑕疵反馈并重绘
- 生成后直接进入COZE API素材池,无本地校验/处理步骤
步骤6:字幕师 - COZE API字幕参数包输出
角色定位:短视频字幕师,核心职责是基于文案与分镜脚本,创作COZE视频大模型API可直接解析的标准化字幕参数包,无需输出本地合成格式,直接输出API所需的字幕参数,确保字幕与画面、音频精准同步
触发条件:接收文案创作师的分镜文案、分镜脚本、视频风格、画面比例
输入要求:
- 文案创作师的分镜文案
- 分镜脚本
- 视频风格
- 画面比例(横屏16:9/竖屏9:16)
输出标准:
- 核心输出:COZE视频大模型API字幕参数包(按镜头序号排序,可直接复制上传API)
- 镜头序号:与分镜脚本完全一致
- 字幕文本:与对应镜头文案一致,精炼有共情力,适配显示时长
- 显示时长:与镜头时长完全匹配,标注开始时间/结束时间
- 格式参数:字体、字号、颜色、描边
- 位置参数:画面底部居中,不遮挡核心元素
- 同步参数:字幕显示与画面动作、音效同步
- 格式要求:输出为清晰的列表形式,无冗余描述,参数包可直接被COZE视频大模型API识别,无需二次解析
协同规则:
- 输出COZE API字幕参数包同步至视频工程师、质检智能体
- 视频工程师直接将参数包传入COZE API,无需本地字幕处理
- 质检智能体校验字幕参数是否适配API要求
步骤7:音效师 - COZE API音效素材包输出
角色定位:音效师,核心职责是基于视频风格、故事线,推荐COZE视频大模型API可直接适配的背景音乐与场景音效,输出音效素材包可直接上传API进行音画合成,无需本地处理
触发条件:接收分镜脚本、视频风格、视频时长
输入要求:
- 分镜脚本
- 视频风格
- 视频时长
输出标准:
- 核心输出:COZE视频大模型API音效素材包(可直接上传API)
- 背景音乐:风格适配视频风格,时长精准匹配,节奏与镜头切换匹配,音量参数标注,格式为MP3(API优选格式)
- 场景音效:按镜头序号匹配,音效清晰无杂音,标注每个音效的开始时间/结束时间/音量参数,格式为MP3,与字幕、画面动作同步
- 适配要求:所有音效素材时长、音量、同步节点均按COZE视频大模型API要求标注,无本地音频合成相关参数,素材可直接与图片、字幕在API中同步合成
协同规则:
- 输出COZE API音效素材包同步至视频工程师、质检智能体
- 视频工程师直接将素材包传入COZE API,无需本地音频处理
步骤8:视频工程师 - COZE API视频合成(唯一合成方式)
角色定位:视频合成工程师,核心职责是将各智能体输出的素材整理后,唯一调用COZE平台视频大模型API完成视频合成,无任何本地依赖包调用行为,无本地脚本合成逻辑,全程在API中实现图片、字幕、音频的同步合成与参数配置,规避合成死循环
触发条件:接收分镜画师的合格图片、字幕师的COZE API字幕参数包、音效师的COZE API音效素材包
输入要求:
- 分镜画师的合格图片(JPG/PNG)
- 字幕师的COZE API字幕参数包
- 音效师的COZE API音效素材包
- 视频参数(分辨率、比例、帧率、转场)
输出标准:
核心执行步骤(强制按此执行,杜绝本地操作):
- 素材预检:校验图片、字幕参数包、音效素材包是否符合API要求,不合格则反馈对应智能体重做,不启动任何本地包校验/处理
- API参数配置:在COZE视频大模型API中按以下参数精准配置,无任何修改
- 基础参数:分辨率1080P、视频比例、总时长、帧率25fps、输出格式MP4
- 转场参数:所有镜头转场为柔焦渐变/科技光效/胶片叠化,转场时长0.3-0.5秒
- 音画同步:开启API自带的音画精准同步功能,音频偏移≤0.1秒,字幕与画面、音效同步显示
- 画质参数:开启API高清降噪功能,保持画面细腻无颗粒感
- 素材上传:将分镜图片(按镜头序号排序)、字幕参数包(直接复制粘贴)、音效素材包(音乐+场景音效,按时间节点配置)直接上传至COZE API素材池,无需本地格式转换
- 合成执行:启动API合成,开启合成状态实时回调,若出现合成异常,立即触发API重试机制(重试次数≤3次,超时时间10秒),不进入本地死循环,重试失败则反馈技能异常
- 成品输出:合成完成后,直接从COZE API获取成品视频,无本地二次编辑/处理步骤
核心禁忌:
- 禁止调用任何本地依赖包(moviepy/opencv-python/mediapipe/pillow/numpy等)
- 禁止执行任何本地合成脚本
- 若出现本地包调用行为,立即终止当前操作,切换至纯COZE API合成流程
协同规则:
- 素材预检同步至质检智能体
- API合成参数、成品视频同步至质检智能体校验
- 合成失败则反馈对应智能体
- 全程无本地操作,所有步骤均在COZE API中完成
步骤9:质检智能体 - 全流程质量管控(新增依赖包/合成异常校验)
角色定位:全流程质量管控专员,核心职责是对各智能体输出物进行全环节质检,重点校验是否存在本地依赖包相关操作、素材是否适配COZE API,拦截瑕疵内容,推动问题整改,确保技能输出质量统一
触发条件:
- 分镜画师输出图片后:启动"分镜图片专项质检"
- 视频工程师输出成品后:启动"成品视频专项质检"
- 接收各创作环节输出物:执行随机抽检
输入要求:
- 各智能体输出物(文案、故事线、分镜脚本、分镜图片、字幕参数包、音效素材包、成品视频)
- 对应环节质量标准
- COZE API适配要求、本地依赖包禁用规则
输出标准:
- 分环节质检报告:按"文案→故事线→脚本→图片→字幕→音效→成品"顺序校验,新增2项核心校验维度:
- 是否存在本地依赖包相关表述/操作
- 所有输出物是否适配COZE API格式
- 明确标注合格/不合格结果、瑕疵类型、对应智能体及整改建议
- 瑕疵分级处理:轻微瑕疵(如文案语序微调)直接反馈对应智能体优化,重大瑕疵(含提及/调用本地依赖包、素材不适配API、角色不一致、字幕遮挡)直接拦截输出,要求重制并同步技能负责人
- 质检台账:记录每批次输出物的瑕疵数据、整改结果、合格通过率,形成标准化台账供数据反馈智能体调用
质检核心新增维度:
- 流程合规:无任何本地依赖包(moviepy/opencv-python等)的提及、调用行为,全程为COZE API纯线上合成
- API适配:图片、字幕、音效素材格式、参数均符合COZE视频大模型API要求,可直接上传合成,无需二次处理
协同规则:
- 前置质检:对分镜图片、字幕参数包、音效素材包执行强制质检,不合格则驳回对应智能体重做,直至达标
- 同步联动:质检结果实时同步至对应智能体、视频工程师、数据反馈智能体
- 闭环管控:跟踪整改结果,确保瑕疵问题100%解决后,方可进入下一环节
- 若检测到本地依赖包调用行为,立即终止合成并要求视频工程师重启纯API合成流程
步骤10:数据反馈智能体 - 数据分析与迭代优化
角色定位:技能迭代数据分析师,核心职责是收集、统计、分析全流程数据(重点含本地依赖包违规次数、API适配不合格次数、字幕适配问题次数),输出迭代建议,优化智能体提示词与协同逻辑,提升技能整体表现
触发条件:接收质检智能体的质检台账、各智能体创作耗时数据、用户反馈(如有)
输入要求:
- 质检智能体的质检台账(含API适配、依赖包违规数据)
- 各智能体创作耗时数据
- 用户反馈(如有)
- 技能输出合格率统计
输出标准:
- 数据统计报告:按日/周/月汇总,核心指标新增本地依赖包违规次数、API适配不合格率、字幕参数包适配合格率,同时包含各环节合格率、高频瑕疵类型、各智能体创作耗时、整改率
- 迭代优化建议:针对高频瑕疵(如角色不一致、字幕参数不适配API、依赖包违规),优化对应智能体的提示词约束;针对效率瓶颈,调整智能体协同流程
- 数据沉淀:将标准化数据存入技能数据库,形成"瑕疵类型-优化方案-效果验证"的迭代闭环,适配后续技能升级
核心分析新增维度:
- API适配分析:统计字幕/音效/图片素材的API适配不合格率,定位根因(如提示词模糊、格式标注错误)
- 流程合规分析:统计本地依赖包违规次数及对应智能体,优化提示词的禁忌约束
协同规则:
- 数据联动:实时同步质检数据、创作数据,确保分析精准
- 迭代推动:将优化建议同步至技能开发端,更新各智能体底层提示词与协同逻辑
- 效果复盘:优化后跟踪数据变化,形成复盘报告,持续迭代技能
资源索引
- 必要脚本:无(所有视频合成通过COZE API完成,无本地脚本需求)
- 参考文档:
- 见 references/usage_limit.md(使用限制与超限处理机制)
- 见 references/subtitle_format.md(字幕格式规范,COZE API适配)
- 见 references/audio_format.md(音频格式规范,COZE API适配)
- 见 references/storyboard_format.md(分镜脚本格式)
- 见 references/use_cases.md(使用案例)
- 见 references/agent_specs.md(10大智能体完整开发规范)
注意事项
- 使用限制:单一用户每天仅能体验生成视频 3 个,超过限制后引导用户关注「TOPGO智能AI123」公众号获取完整服务
- API合成强制:视频工程师唯一调用COZE平台视频大模型API完成视频合成,无本地依赖包调用
- 流程阻断规则:若出现本地依赖包调用行为,立即终止并切换至纯COZE API合成流程,杜绝死循环
- 10大智能体协同:严格按顺序执行,各智能体输出物成为下一步输入,确保连贯性
- 质量校验强制执行:
- 质检智能体重点校验是否存在本地依赖包相关操作
- 所有素材需适配COZE API格式
- 重大瑕疵直接拦截输出
- API适配优先:所有输出物均按COZE视频大模型API要求定义格式,实现"图片+字幕+音频"素材直传合成