name: web-form-fill description: 网络表单填报技能 — 从信息搜集到浏览器填报的完整工作流,确保框架受控组件正确写入、页面切换前暂存、最终提交由用户确认。 metadata: openclaw: emoji: 📝
Web Form Fill — 网络表单填报技能
面向在线表单填报场景:申报系统、比赛报名、补贴申请、信息登记等。核心原则:先看后填、模拟真人、切页必存、提交由人。
依赖技能:browser-guide(浏览器操作最佳实践)
工作流程
Step 1:全量信息搜集
打开浏览器后,先完整浏览整个表单,不要急着填。
- 从第一个页面/栏位开始,逐页点击所有 tab/步骤/栏位
- 每到一个新页面,记录:
- 页面/栏位名称
- 所有字段的 label、类型、是否必填、字数限制、格式要求
- 需要上传的附件类型和格式要求
- 任何特殊控件(下拉单选/多选、日期选择器、级联选择、富文本编辑器等)
- 随时将搜集结果写入一个 markdown 文件(建议命名为
form-fields-{项目简称}.md),保持与表单相同的页面/段落结构 - 浏览过程中 不要填写任何内容,只看和记
markdown 文件结构示例:
# XX大赛申报 — 字段清单
## 概要
- 项目名称 [必填] [text] [限50字]
- 行业分类 [必填] [级联下拉] 一级→二级
- 科技创新领域 [必填] [下拉单选]
- 参赛渠道 [必填] [下拉多选]
- 以投代评 [必填] [radio: 是/否]
- 服务需求 [多选] 最多3项
- 期望融资金额 [必填] [number] 万元
- 股权释放比例 [必填] [number] %
## 参赛项目情况
- 项目名称 [必填] [text] (概要中已填,此处联动)
- 前沿技术热点归属 [必填] [text] 最多5个关键词,逗号分隔
- 项目主要技术、产品及服务 [必填] [富文本] 2000字以内,可插入图片
- 项目产品市场分析及竞争优势 [必填] [富文本] 2000字以内
- 商业模式 [必填] [富文本] 1000字以内
## 企业基本信息表
...
## 附件
- 营业执照 [必填] [PDF/图片]
- ...
Step 2:填写字段清单
回到 markdown 文件,逐项填写准备好的内容:
- 根据已有资料(MEMORY.md、工作区文件、用户之前提供的信息)直接填入
- 缺失的信息 主动问用户,不要自己编造
- 找不到且用户也未指定的附件,列出清单请用户准备
- 每个富文本字段,先写纯文本内容,后续在浏览器中输入
问用户的典型场景:
- "XX字段应该选择哪个选项?"
- "XX附件文件在工作区中未找到,请提供文件路径或上传。"
- "XX选项选是还是否?"
Step 3:浏览器填报
信息齐全后,打开浏览器逐页填报。
3-A. 填报顺序
- 回到表单第一页/栏位
- 按 markdown 文件中的顺序逐字段填写
- 每填完一页/栏位,检查是否有 暂存/保存 按钮,有则点击
- 切换到下一页/栏位前,必须确认当前页已暂存
- 重复直到所有页面填完
3-B. 字段填写方法
核心原则:统一使用 type + slow 模拟人类逐字输入,对所有站点、所有输入框一视同仁。
文本输入字段(input / textarea / contenteditable)
唯一方法:locator.type(text, {delay: N})
type通过 CDP 逐字符发送keyDown→char→keyup事件,与真人键盘输入完全一致delay设置每字符间隔(毫秒),模拟人类打字节奏- 推荐 delay 值:50-100ms(兼顾速度与拟人效果,防机器人检测场景可调至 100-150ms)
填写流程:
对每个文本字段:
1. scrollIntoView 确保在视口内
2. 点击聚焦
3. 清空已有内容(见下方清空方式)
4. locator.type("要填入的文本", {delay: 80})
5. 验证写入是否生效(见 3-C 节)
6. 如果验证失败:
a. 清空内容
b. 重新聚焦后重试一次 type
c. 仍然失败 → 记录该字段为"无法自动填写",继续下一个字段
为什么 type + slow 就够了:
| 场景 | type + slow 是否生效 | 原因 |
|---|---|---|
| 原生 input/textarea | ✅ | 逐字符 keyDown/char/keyup 走浏览器真实输入管线 |
| Vue/React v-model 受控组件 | ✅ | 框架监听 input 事件,type 触发的 keyDown → input 事件链完整 |
| Slate/wangEditor/Tiptap 编辑器 | ✅ | 逐字符 keyDown 会触发浏览器的 beforeinput 事件,Slate 监听的就是这个 |
| 有输入 mask 的字段 | ✅ | 逐字符输入让 mask 逻辑逐字处理,不会跳过格式化 |
| 防机器人检测的站点 | ✅ | slow delay 模拟真人节奏,不触发异常检测 |
禁止的方式:
- ❌ 直接设
innerHTML/textContent— 框架不感知,placeholder 不消失,暂存后内容丢失 - ❌ 直接赋值
el.value = "xxx"不发事件 — 框架完全无感知 - ❌ 不聚焦就直接写值 — 不会触发任何事件
- ❌
fill()— 一次性塞入整段文本,不触发逐字事件链,受控组件和 mask 字段容易出问题
下拉选择(select)
逐级尝试:
| 级别 | 方法 |
|---|---|
| A | 点击 select 打开下拉面板 → 点击目标选项 |
| B | 点击 select → 键盘方向键选择 → Enter 确认 |
| C | native setter 设值 + dispatchEvent('change') |
自定义下拉(非原生 <select>,如 Element Plus el-select、Ant Design Select):
- 需要先点击触发按钮打开弹层
- 在弹层中找到目标选项点击
- 部分组件支持键盘搜索:聚焦 → 输入关键字过滤 → 选择
Radio / Checkbox
Input.dispatchMouseEvent点击目标选项- 验证选中状态
- 如果点击无效,尝试用键盘:聚焦 → Space 切换
日期选择器
逐级尝试:
| 级别 | 方法 |
|---|---|
| A | 点击日期输入框 → 在弹出的日历面板中逐年/月/日点击 |
| B | 点击日期输入框聚焦 → type 输入日期字符串 |
| C | native setter 设值 + dispatchEvent |
文件上传
- 找到
<input type="file">或上传按钮 - 如果工作区内有对应文件,通过 CDP
DOM.setFileInputFiles设置文件路径 - 如果文件不在本机,告知用户手动上传
Patchright 1.60+ 替代方案 — locator.drop():
对于支持拖拽上传的区域(上传 zone、拖放区域),可用 locator.drop() 模拟外部拖拽文件:
// 拖拽本地文件到上传区域
await page.locator('#dropzone').drop({
files: { name: 'report.pdf', mimeType: 'application/pdf', buffer: Buffer.from(fileBytes) },
});
// 拖拽剪贴板数据
await page.locator('#dropzone').drop({
data: {
'text/plain': '粘贴的文本内容',
'text/uri-list': 'https://example.com',
},
});
drop() 通过合成 dragenter → dragover → drop 事件 + DataTransfer 实现,跨浏览器兼容,无需依赖 <input type="file"> 的存在。适用于:
- 上传区域是自定义 div(非原生 file input)
- 需要绕过 shadow DOM 内的 file input
- 需要同时拖入多个文件
3-C. 填写验证
| 控件类型 | 验证方式 | 通过条件 |
|---|---|---|
| 普通 input | 检查 el.value 和 placeholder 可见性 |
el.value 包含预期内容 且 placeholder 不可见 |
| contenteditable / Slate 编辑器 | 检查 editor.textContent.trim() 和 placeholder 元素 |
textContent 包含预期内容 且 placeholder 元素 display: none。延迟 50ms 再验证 — Slate DOM 更新有延迟 |
| 下拉 select | 检查选中项文本 | 选中项文本与预期一致 |
| radio/checkbox | 检查 el.checked |
选中状态符合预期 |
验证失败的处理:
- 清空当前字段内容(避免残留脏数据)
- 重新聚焦后重试一次
type - 仍然失败 → 记录到"无法自动填写"清单,继续填下一个字段
3-D. 页面切换规则
切换页面/栏位前,必须执行:
- 检查当前页面是否有 暂存 / 保存 / 保存草稿 按钮
- 如果有,点击暂存,等待"保存成功"提示
- 暂存后,验证关键字段值是否还在(防止暂存失败丢数据)
- 然后再切换页面
如果当前页没有暂存按钮:
- 检查是否有自动保存指示("已自动保存"提示、保存状态图标等)
- 如果没有自动保存,截图告知用户当前页无保存机制,请用户确认是否继续
Step 4:提交前确认
所有页面填写完成后:
- 从第一页开始,逐页检查所有字段值是否正确
- 截图或导出最终表单内容,发送给用户审阅
- 明确告知用户:"所有内容已填写完毕,请检查确认后手动提交,或明确告知我提交。"
- 禁止自动点击"提交"按钮,必须等用户明确指令
常见问题与对策
问题:填入内容后 placeholder 不消失
原因:框架内部状态未更新。
解决:确保使用 type + slow 逐字输入(会触发完整事件链),而非直接操作 DOM。type 失败时重新聚焦重试。
问题:暂存后切换页面,内容丢失
原因:框架内部状态为空,暂存提交的是空值。
验证方法:暂存后,导航到其他页面再回来,检查字段是否仍有值。
问题:Slate/wangEditor 编辑器填入后验证显示为空
原因:Slate 处理 beforeinput 后,文本已写入数据模型但 DOM 还没渲染完。
解决:验证前延迟 50ms+,等 Slate 微任务队列跑完再读 textContent。
问题:富文本编辑器无法输入
对策:
- 确认点击的是编辑器内容区域(
[contenteditable="true"]),而非工具栏 - 确认
document.activeElement是编辑器或其子节点 - 如果 type 无效,尝试先点击工具栏按钮(如加粗)激活编辑器,再重新 type
问题:下拉选项不在视口中
对策:
- 先滚动下拉面板使目标选项可见
- 或用键盘导航:聚焦 select → 按方向键选择目标项 → 按 Enter 确认
问题:表单有防机器人检测
对策:
type的 delay 调大至 100-150ms,模拟真人打字节奏- 字段间等待 0.5-1 秒
- 如果触发验证码,按
browser-guide的 CAPTCHA 处理流程操作
速查:填写操作模板
聚焦元素
1. Runtime.evaluate: el.scrollIntoView({block:'center'})
2. Runtime.evaluate: el.getBoundingClientRect() → {x, y, width, height}
3. Input.dispatchMouseEvent: mousePressed at (x+width/2, y+height/2)
4. Input.dispatchMouseEvent: mouseReleased
清空已有内容 — 普通 input/textarea
1. 聚焦元素(见上)
2. Input.dispatchMouseEvent: mousePressed clickCount=3 (triple-click 全选)
3. Input.dispatchMouseEvent: mouseReleased clickCount=3
4. Input.dispatchKeyEvent: keyDown Backspace
5. Input.dispatchKeyEvent: keyUp Backspace
6. 验证: el.value 为空
如果 triple-click 无效,改用 Ctrl+A:
2. Input.dispatchKeyEvent: keyDown key=a modifiers=2 (Ctrl)
3. Input.dispatchKeyEvent: keyUp key=a modifiers=2
清空已有内容 — contenteditable / Slate 编辑器
1. 聚焦编辑器
2. Input.dispatchKeyEvent: keyDown key=a modifiers=2 (Ctrl+A 全选)
3. Input.dispatchKeyEvent: keyUp key=a modifiers=2
4. Input.dispatchKeyEvent: keyDown Backspace
5. Input.dispatchKeyEvent: keyUp Backspace
6. 等待 50ms
7. 验证: editor.textContent.trim() 为空
文本输入(所有字段统一方法)
1. 聚焦 + 清空
2. locator.type("要填入的内容", {delay: 80})
3. 验证(见 3-C 节)
防机器人检测场景,delay 调大:
2. locator.type("要填入的内容", {delay: 120})