web-form-fill - SKILL.md Agent Skill

name: web-form-fill description: 网络表单填报技能 — 从信息搜集到浏览器填报的完整工作流，确保框架受控组件正确写入、页面切换前暂存、最终提交由用户确认。 metadata: openclaw: emoji: 📝

Web Form Fill — 网络表单填报技能

面向在线表单填报场景：申报系统、比赛报名、补贴申请、信息登记等。核心原则：先看后填、模拟真人、切页必存、提交由人。

依赖技能：browser-guide（浏览器操作最佳实践）

工作流程

Step 1：全量信息搜集

打开浏览器后，先完整浏览整个表单，不要急着填。

从第一个页面/栏位开始，逐页点击所有 tab/步骤/栏位
每到一个新页面，记录：
- 页面/栏位名称
- 所有字段的 label、类型、是否必填、字数限制、格式要求
- 需要上传的附件类型和格式要求
- 任何特殊控件（下拉单选/多选、日期选择器、级联选择、富文本编辑器等）
随时将搜集结果写入一个 markdown 文件（建议命名为 form-fields-{项目简称}.md），保持与表单相同的页面/段落结构
浏览过程中 不要填写任何内容，只看和记

markdown 文件结构示例：

# XX大赛申报 — 字段清单

## 概要
- 项目名称 [必填] [text] [限50字]
- 行业分类 [必填] [级联下拉] 一级→二级
- 科技创新领域 [必填] [下拉单选]
- 参赛渠道 [必填] [下拉多选]
- 以投代评 [必填] [radio: 是/否]
- 服务需求 [多选] 最多3项
- 期望融资金额 [必填] [number] 万元
- 股权释放比例 [必填] [number] %

## 参赛项目情况
- 项目名称 [必填] [text] （概要中已填，此处联动）
- 前沿技术热点归属 [必填] [text] 最多5个关键词，逗号分隔
- 项目主要技术、产品及服务 [必填] [富文本] 2000字以内，可插入图片
- 项目产品市场分析及竞争优势 [必填] [富文本] 2000字以内
- 商业模式 [必填] [富文本] 1000字以内

## 企业基本信息表
...

## 附件
- 营业执照 [必填] [PDF/图片]
- ...

Step 2：填写字段清单

回到 markdown 文件，逐项填写准备好的内容：

根据已有资料（MEMORY.md、工作区文件、用户之前提供的信息）直接填入
缺失的信息 主动问用户，不要自己编造
找不到且用户也未指定的附件，列出清单请用户准备
每个富文本字段，先写纯文本内容，后续在浏览器中输入

问用户的典型场景：

"XX字段应该选择哪个选项？"
"XX附件文件在工作区中未找到，请提供文件路径或上传。"
"XX选项选是还是否？"

Step 3：浏览器填报

信息齐全后，打开浏览器逐页填报。

3-A. 填报顺序

回到表单第一页/栏位
按 markdown 文件中的顺序逐字段填写
每填完一页/栏位，检查是否有 暂存/保存 按钮，有则点击
切换到下一页/栏位前，必须确认当前页已暂存
重复直到所有页面填完

3-B. 字段填写方法

核心原则：统一使用 type + slow 模拟人类逐字输入，对所有站点、所有输入框一视同仁。

文本输入字段（input / textarea / contenteditable）

唯一方法：locator.type(text, {delay: N})

type 通过 CDP 逐字符发送 keyDown → char → keyup 事件，与真人键盘输入完全一致
delay 设置每字符间隔（毫秒），模拟人类打字节奏
推荐 delay 值：50-100ms（兼顾速度与拟人效果，防机器人检测场景可调至 100-150ms）

填写流程：

对每个文本字段：
  1. scrollIntoView 确保在视口内
  2. 点击聚焦
  3. 清空已有内容（见下方清空方式）
  4. locator.type("要填入的文本", {delay: 80})
  5. 验证写入是否生效（见 3-C 节）
  6. 如果验证失败：
     a. 清空内容
     b. 重新聚焦后重试一次 type
     c. 仍然失败 → 记录该字段为"无法自动填写"，继续下一个字段

为什么 type + slow 就够了：

场景	type + slow 是否生效	原因
原生 input/textarea	✅	逐字符 keyDown/char/keyup 走浏览器真实输入管线
Vue/React v-model 受控组件	✅	框架监听 input 事件，type 触发的 keyDown → input 事件链完整
Slate/wangEditor/Tiptap 编辑器	✅	逐字符 keyDown 会触发浏览器的 `beforeinput` 事件，Slate 监听的就是这个
有输入 mask 的字段	✅	逐字符输入让 mask 逻辑逐字处理，不会跳过格式化
防机器人检测的站点	✅	slow delay 模拟真人节奏，不触发异常检测

禁止的方式：

❌ 直接设 innerHTML / textContent — 框架不感知，placeholder 不消失，暂存后内容丢失
❌ 直接赋值 el.value = "xxx" 不发事件 — 框架完全无感知
❌ 不聚焦就直接写值 — 不会触发任何事件
❌ fill() — 一次性塞入整段文本，不触发逐字事件链，受控组件和 mask 字段容易出问题

下拉选择（select）

逐级尝试：

级别	方法
A	点击 select 打开下拉面板 → 点击目标选项
B	点击 select → 键盘方向键选择 → Enter 确认
C	native setter 设值 + dispatchEvent('change')

自定义下拉（非原生 <select>，如 Element Plus el-select、Ant Design Select）：

需要先点击触发按钮打开弹层
在弹层中找到目标选项点击
部分组件支持键盘搜索：聚焦 → 输入关键字过滤 → 选择

Radio / Checkbox

Input.dispatchMouseEvent 点击目标选项
验证选中状态
如果点击无效，尝试用键盘：聚焦 → Space 切换

日期选择器

逐级尝试：

级别	方法
A	点击日期输入框 → 在弹出的日历面板中逐年/月/日点击
B	点击日期输入框聚焦 → type 输入日期字符串
C	native setter 设值 + dispatchEvent

文件上传

找到 <input type="file"> 或上传按钮
如果工作区内有对应文件，通过 CDP DOM.setFileInputFiles 设置文件路径
如果文件不在本机，告知用户手动上传

Patchright 1.60+ 替代方案 — locator.drop()：

对于支持拖拽上传的区域（上传 zone、拖放区域），可用 locator.drop() 模拟外部拖拽文件：

// 拖拽本地文件到上传区域
await page.locator('#dropzone').drop({
  files: { name: 'report.pdf', mimeType: 'application/pdf', buffer: Buffer.from(fileBytes) },
});

// 拖拽剪贴板数据
await page.locator('#dropzone').drop({
  data: {
    'text/plain': '粘贴的文本内容',
    'text/uri-list': 'https://example.com',
  },
});

drop() 通过合成 dragenter → dragover → drop 事件 + DataTransfer 实现，跨浏览器兼容，无需依赖 <input type="file"> 的存在。适用于：

上传区域是自定义 div（非原生 file input）
需要绕过 shadow DOM 内的 file input
需要同时拖入多个文件

3-C. 填写验证

控件类型	验证方式	通过条件
普通 input	检查 `el.value` 和 placeholder 可见性	`el.value` 包含预期内容且 placeholder 不可见
contenteditable / Slate 编辑器	检查 `editor.textContent.trim()` 和 placeholder 元素	`textContent` 包含预期内容且 placeholder 元素 `display: none`。延迟 50ms 再验证 — Slate DOM 更新有延迟
下拉 select	检查选中项文本	选中项文本与预期一致
radio/checkbox	检查 `el.checked`	选中状态符合预期

验证失败的处理：

清空当前字段内容（避免残留脏数据）
重新聚焦后重试一次 type
仍然失败 → 记录到"无法自动填写"清单，继续填下一个字段

3-D. 页面切换规则

切换页面/栏位前，必须执行：

检查当前页面是否有 暂存 / 保存 / 保存草稿 按钮
如果有，点击暂存，等待"保存成功"提示
暂存后，验证关键字段值是否还在（防止暂存失败丢数据）
然后再切换页面

如果当前页没有暂存按钮：

检查是否有自动保存指示（"已自动保存"提示、保存状态图标等）
如果没有自动保存，截图告知用户当前页无保存机制，请用户确认是否继续

Step 4：提交前确认

所有页面填写完成后：

从第一页开始，逐页检查所有字段值是否正确
截图或导出最终表单内容，发送给用户审阅
明确告知用户："所有内容已填写完毕，请检查确认后手动提交，或明确告知我提交。"
禁止自动点击"提交"按钮，必须等用户明确指令

常见问题与对策

问题：填入内容后 placeholder 不消失

原因：框架内部状态未更新。

解决：确保使用 type + slow 逐字输入（会触发完整事件链），而非直接操作 DOM。type 失败时重新聚焦重试。

问题：暂存后切换页面，内容丢失

原因：框架内部状态为空，暂存提交的是空值。

验证方法：暂存后，导航到其他页面再回来，检查字段是否仍有值。

问题：Slate/wangEditor 编辑器填入后验证显示为空

原因：Slate 处理 beforeinput 后，文本已写入数据模型但 DOM 还没渲染完。

解决：验证前延迟 50ms+，等 Slate 微任务队列跑完再读 textContent。

问题：富文本编辑器无法输入

对策：

确认点击的是编辑器内容区域（[contenteditable="true"]），而非工具栏
确认 document.activeElement 是编辑器或其子节点
如果 type 无效，尝试先点击工具栏按钮（如加粗）激活编辑器，再重新 type

问题：下拉选项不在视口中

对策：

先滚动下拉面板使目标选项可见
或用键盘导航：聚焦 select → 按方向键选择目标项 → 按 Enter 确认

问题：表单有防机器人检测

对策：

type 的 delay 调大至 100-150ms，模拟真人打字节奏
字段间等待 0.5-1 秒
如果触发验证码，按 browser-guide 的 CAPTCHA 处理流程操作

速查：填写操作模板

聚焦元素

1. Runtime.evaluate: el.scrollIntoView({block:'center'})
2. Runtime.evaluate: el.getBoundingClientRect() → {x, y, width, height}
3. Input.dispatchMouseEvent: mousePressed at (x+width/2, y+height/2)
4. Input.dispatchMouseEvent: mouseReleased

清空已有内容 — 普通 input/textarea

1. 聚焦元素（见上）
2. Input.dispatchMouseEvent: mousePressed clickCount=3 (triple-click 全选)
3. Input.dispatchMouseEvent: mouseReleased clickCount=3
4. Input.dispatchKeyEvent: keyDown Backspace
5. Input.dispatchKeyEvent: keyUp Backspace
6. 验证: el.value 为空

如果 triple-click 无效，改用 Ctrl+A：

2. Input.dispatchKeyEvent: keyDown key=a modifiers=2 (Ctrl)
3. Input.dispatchKeyEvent: keyUp key=a modifiers=2

清空已有内容 — contenteditable / Slate 编辑器

1. 聚焦编辑器
2. Input.dispatchKeyEvent: keyDown key=a modifiers=2 (Ctrl+A 全选)
3. Input.dispatchKeyEvent: keyUp key=a modifiers=2
4. Input.dispatchKeyEvent: keyDown Backspace
5. Input.dispatchKeyEvent: keyUp Backspace
6. 等待 50ms
7. 验证: editor.textContent.trim() 为空

文本输入（所有字段统一方法）

1. 聚焦 + 清空
2. locator.type("要填入的内容", {delay: 80})
3. 验证（见 3-C 节）

防机器人检测场景，delay 调大：

2. locator.type("要填入的内容", {delay: 120})