digital-avatar - SKILL.md Agent Skill

name: digital-avatar version: 1.0.0 description: 数字人/虚拟形象生成和口播视频制作。支持多个后端：可灵 Kling、即梦 Jimeng、HeyGen、D-ID、Synthesia。输入形象描述或真人照片，输出数字人资源ID或口播视频片段。触发词：数字人、虚拟人、AI主播、avatar、口播视频、talking head。

推荐：优先用平台自带的声纹克隆，保持后端一致性。

同一个数字人项目必须全程使用同一个后端！

推荐：国内项目优先用可灵或即梦，二选一后全程使用。

输入: 形象描述 / 真人照片
  ↓
选择后端
  ↓
调用 API 生成
  ↓
输出: avatar_id + 预览图

输入: avatar_id + 台词文本/音频
  ↓
调用后端口播 API
  ↓
等待渲染
  ↓
输出: 视频文件 URL

参数	必填	说明
mode	✓	create
backend	-	kling / jimeng / heygen / d-id / synthesia
description	△	形象描述（二选一）
photo	△	真人照片路径（二选一）
style	-	realistic / cartoon / 3d
gender	-	male / female

输出：voice_id，后续生成口播时使用。

avatar:
  id: "avatar_abc123"
  backend: jimeng
  preview_url: "https://..."
  style: realistic
  created_at: "2024-01-01T00:00:00Z"

video:
  id: "video_xyz789"
  avatar_id: "avatar_abc123"
  url: "https://..."
  duration: 15.5
  status: completed

在 openclaw.json 中配置（只需配置你选用的后端）：

{
  "kling": {
    "access_key": "your_access_key",
    "secret_key": "your_secret_key"
  }
}

{
  "jimeng": {
    "api_key": "ak-xxxxxxxx"
  }
}

{
  "heygen": {
    "api_key": "xxx"
  }
}

用户：帮我创建一个数字人，25岁左右的职业女性，干练短发

执行：
1. mode=create, description="25岁职业女性，干练短发", style=realistic
2. 调用 Jimeng API
3. 返回 avatar_id

用户：用这张照片创建数字人 [附图]

执行：
1. mode=create, photo=<图片路径>
2. 调用 API 上传照片
3. 返回 avatar_id

用户：用 avatar_abc123 说这段话："大家好，今天教大家..."

执行：
1. mode=generate, avatar_id="avatar_abc123", text="大家好..."
2. 调用口播 API
3. 等待渲染完成
4. 返回视频 URL

上游：video-script-generator 输出的 narration 字段

下游：scene-video-generator / video-stitcher 消费口播视频