pai-guide - SKILL.md Agent Skill

name: pai-guide description: 当用户不清楚自己正在使用的 pai 应用能做什么，或不理解应用中的关键概念与关系时，必须阅读我。适用于解释 pai 的能力边界、窗口分工、人格、部门、工具、Skill、MCP、委托、任务、记忆、多会话、后台会话、远程联系人、LLM、快捷键及它们之间的关系，并帮助用户判断下一步应该怎么使用这个应用。

PAI Guide

讲解原则

先回答用户当前最关心的问题，再补背景。
先讲直觉解释，再讲正式术语。
用户明显是新手时，尽量少用抽象词，多用“它相当于什么”来解释。
用户问“这是什么”，重点解释定义和关系。
用户问“怎么用”，重点给最短路径，不要长篇空谈。
不要一口气把所有概念都倒给用户，除非用户明确要求总览。
如果不确定用户当前在哪个窗口，就明确说“如果你现在在聊天窗口 / 设置窗口 / 归档窗口”。

先用一句话解释 pai

pai 是一个桌面 AI 助手应用，不只是聊天框。
它可以聊天、调用工具、组织人格和部门、接入 Skill 与 MCP、维护任务和记忆、处理多个会话，还可以和远程联系人相关的会话一起工作。

用户问“这个应用能做什么”时，优先这样概括

和用户聊天、回答问题、解释概念
帮用户组织不同人格和不同分工
调用工具做实际动作
通过 Skill 学会更专业的工作方式
通过 MCP 接入额外外部能力
用任务系统推进长期事情
用记忆保存长期有价值的信息
把不同主题分散到多个会话，而不是全部塞进一个对话里

窗口

对话窗口

对话窗口是用户和助理直接聊天的地方。
大多数即时提问、继续当前话题、查看当前回答，都发生在这里。

设置页面

设置页面是主要配置和管理入口。
一般在这里管理模型、工具、Skill、MCP、人格、部门、任务、记忆、外观和其他设置。
如果用户问“去哪里配置”，大多数时候先引导到设置页面。

归档页面

归档页面是查看和管理历史归档对话的地方。
适合回顾过去已经整理过的会话内容。

快速设置窗口

快速设置窗口是首次启动或需要快速配置模型时的入口。
适合新手快速上手，不用进完整设置页面就能开始使用。

核心概念

什么是 LLM

LLM 是大语言模型。
可以把它理解成助理的“语言大脑”，负责理解用户的话、组织回答、生成内容、规划步骤。
pai 里的很多能力，最终都要依赖某个 LLM 才能运行起来。
如果用户没配置可用模型，很多聊天和智能能力就无法正常工作。

什么是人格

人格 是助理的角色设定。
它决定助理默认怎么说话、偏什么风格、强调什么原则、扮演什么角色。
人格不是模型本身，而是模型工作的行为设定。
你可以把人格理解成“这个助理以什么身份和风格来帮你”。

什么是部门

部门 是职责分组。
它用来组织不同类型的工作，比如主部门负责前台对话，其他部门负责执行、研究、整理、特殊流程等。
部门更像组织结构或岗位分工，不只是一个聊天角色名字。

人格和部门是什么关系

人格 和 部门 不是一回事。
人格 决定一个智能体怎么说话、怎么做事、偏什么风格。
记忆 让这个智能体保留长期有价值的信息。
可以把 人格 + 记忆 一起理解成一个可持续工作的“智能体”。
部门 决定这些智能体被放到哪里工作、负责什么工作。
预设的助理部门负责在对话窗口和用户直接对话，不可删除。
副手部门负责被委托的子任务，也不可删除。
用户可以自建其他部门，承担不同工作。

什么是工具

工具 是助理可以直接调用的具体能力。
它们解决的是“助理如何真正动手做事”。
常见理解方式是：助理负责思考和判断，工具负责执行具体动作。

什么是 Skill

Skill 是给助理的一份专项说明书或工作指南。
它不直接执行动作，而是告诉助理在某类任务里应该怎么理解问题、怎么组织步骤、该优先看什么、避免什么。
可以把 Skill 理解成“专门领域的工作方法”。

什么是 MCP

MCP 是把外部工具、服务或数据源接进来的机制。
如果应用内工具像“自带能力”，那 MCP 更像“扩展接口”。
用户不一定需要先理解协议细节，只要知道 MCP 的作用是让助理能接入更多外部能力。

Skill、工具、MCP 的关系

Skill 负责告诉助理“怎么做更对”。
工具 负责“直接执行动作”。
MCP 负责“把外部能力接进来”。
一个任务里，助理可能先读 Skill，再调用工具，也可能通过 MCP 使用额外外部能力。

什么是委托

委托 是把一项子任务交给其他部门去处理。
它适合把复杂工作拆开，不让所有事情都挤在当前主对话里。
用户可以把它理解成“主部门把一部分工作分派给其他部门”。

什么是任务

任务 是长期推进面板，不只是当前一轮聊天。
适合需要多轮跟进、分阶段推进、未来再继续做的事情。
如果某件事不是这一轮就结束，而是要持续推进，就更适合进入任务系统。

什么是记忆

记忆 是被保留下来的长期有价值信息。
它帮助助理在未来找回重要背景，而不是每次都完全从零开始。
记忆不是全部聊天记录的原样复制，而更像“被筛选后的长期信息”。
当记忆和人格结合时，可以把它们理解成一个更稳定、更持续的智能体。

什么是多会话

多会话 表示用户可以同时维护多个独立对话主题。
每个会话有自己的上下文和历史。
它解决的是“不要把不同事情都混在一个对话里”的问题。

什么是后台会话

后台会话 指当前不一定显示在前台，但仍在承载某类工作上下文的会话。
用户可以把它理解成“系统在背后维护的一条工作线程”。
它常见于后台部门、委托、持续任务、特殊流程或非前台交互场景。

什么是远程联系人

远程联系人 是通过远端 IM 或外部接入渠道进入系统的联系人。
远程联系人不是当前直接坐在这台电脑前、打开窗口和你对话的用户本人。
处理远程联系人时，要分清“当前本地用户”和“远程联系对象”这两个身份，不要混淆回复目标。

常用功能

会话目标

在输入面板的工具栏里，有一个“目标”按钮。
点击后可以为当前会话启动一个持续推进的目标。
创建后，助理会在该目标完成、严格阻塞或用户手动停止之前，跨轮次继续推进。
适合需要多轮跟进的事情，比如“帮我把这段代码重构完”。

快捷指令

在输入面板上方，会显示一组可点击的指令按钮。
这些是“指令预设”，在设置页面里配置。
点击一条指令，它会作为文本附件附加到你本轮消息里，不用每次手打同样的提示词。
适合常用指令，比如“结果整理成表格”、“用中文回答”。

语音输入

输入面板的工具栏里有录音按钮，也可以用配置的热键按住录音。
松开后自动转为文字并填入输入框。
需要在设置里配置 STT（语音转文本）服务。

文档附件标记

在输入面板顶部，会显示当前工作区中可引用的文件列表（以标签形式展示）。
点击标签可以附加或取消附加某个文件上下文到本轮消息。
附加后，助理在回答时会自动参考这些文件内容，不用你手动复制粘贴。

文档浏览器

对话窗口顶部有“阅读”标签页，点击打开右侧文件浏览器面板。
面板会跟随当前会话的工作区目录，可以浏览和阅读代码、文档等文件。
支持多标签同时打开多个文件。
阅读时，当前文件的上下文会自动出现在输入面板的文档附件标记区域，方便一键附加。

委托

在会话工具栏里可以“发起委托”，把子任务交给其他部门处理。
也可以多选消息后，通过“快捷委托”把选中内容作为背景发给子代理。
委托状态会实时显示在右侧“委托”标签页里。

工具与委托的执行逻辑

工具执行是动态决策的：系统会根据工具类型自动决定能否并行。只读工具（如 read、fetch、websearch、recall）可以多个同时执行；写操作工具（如 exec、apply_patch、todo、task、remember）必须串行，避免冲突。
委托就是启动一个子代理：每次委托本质上是拉起一个新的子代理去独立工作，和当前对话互不阻塞。
多个委托可以同时进行：可以同时发起多个委托到不同部门，它们各自独立运行，不需要串行等待。
委托有两种模式：同步（等结果回来再继续）和异步（发出去就继续做别的）。

代码审查

当助理调用工具执行代码改动后，右侧会自动出现“审查”标签页。
可以在审查面板里查看工具调用记录、发起代码审查、生成审查报告。
也可以手动选择审查部门和快速模型来定制审查流程。

工具 AI 审查原理

助理每次调用终端命令或文件补丁时，系统会先用一个独立的“快速模型”来评估这次操作是否安全。
评估模型会分析命令内容，判断是否只读、是否有副作用，然后返回“放行”或“拒绝”以及一段给普通人看的评估意见。
如果评估结果是放行，工具直接执行；如果拒绝，会弹窗让用户确认是否允许。
评估结果会显示在右侧“审查”标签页里，每条工具调用都可以查看评估状态（已评估/未评估）。
用户可以逐条评估，也可以批量评估所有未评估的工具调用。
全部评估完成后，可以发起“代码审查”生成完整审查报告。
快速模型在设置页面的“快速模型”选项中配置。

会话权限控制

部门权限：每个部门可以配置权限模式（白名单或黑名单），分别控制可用的内置工具、Skill 和 MCP 工具。在设置页面的部门配置里管理。
工作区权限：会话的工作区目录可以设置访问模式，包括只读和需要审批（approval）两种。审批模式下，写操作需要用户确认。
终端审批：当助理要执行会修改文件、修改 Git 状态或修改系统配置的终端命令时，会弹窗请求用户确认。只读命令（如查看、测试、编译校验）通常直接放行。

多选消息转发

长按或右键消息可以进入多选模式。
选中多条消息后，底部会出现操作面板，可以“转发到会话”——把选中的消息插入到另一个会话末尾。
适合把一段对话精华搬到另一个主题会话里继续讨论。

多选消息会话分支

同样在多选模式下，可以点“创造会话分支”。
它会基于选中的消息创建一个新会话，保留选中内容作为上下文起点。
和“转发”不同：分支是新建一个会话，转发是往已有会话里插入。

会话继承

新建会话时，标题栏的创建对话框里有一个“继承当前会话”勾选框。
勾选后，新会话会继承当前会话的上下文摘要，不用从零开始。
适合同一个话题需要开新会话继续讨论的场景。

会话导出与导入

在会话列表或会话侧边栏里，右键会话可以看到“导出会话”选项。
导出格式支持 Markdown 和 JSON，方便存档或分享。
新建会话时，标题栏里有“从外部导入”按钮，可以把之前导出的会话文件导入为新会话。

新建会话

标题栏里有“新建会话”按钮，点击后可以设置会话主题（可留空）。
还可以勾选“继承当前会话”，让新会话接续当前上下文。
也可以指定导入外部文件来创建新会话。

消息队列

当助理正在回复（流式输出）时，你继续输入的新消息不会丢失，会进入“消息队列”排队等待。
队列中的消息会显示在输入面板附近，标注为“排队”状态。
助理当前回复结束后，队列里的消息会按顺序自动发送。

引导

队列中的消息可以点击“引导”按钮切换为引导模式。
引导模式下，这条消息不会直接作为新问题发送，而是会在助理当前回复结束后，影响助理的下一步方向。
适合你在助理还在工作时，悄悄调整它的思路，而不是打断当前流程。

@提及

在输入框里输入 @ 可以提及特定的人格或部门。
被提及的对象会收到消息或被委派任务。
适合需要让另一个部门的智能体介入当前对话的场景。

撤回消息

右键消息或在消息操作菜单里可以找到“撤回”选项。
撤回时有两种模式：
- “撤回消息并撤回修改”：回退消息的同时，也会撤销助理通过工具做的文件修改。
- “仅撤回消息”：只删除消息记录，不影响已经执行的工具操作。

通知

在设置页面的“通知”标签里，可以开启或关闭后台会话完成/失败时的系统通知。
开启后，后台任务完成时会弹出 Windows 原生通知，还可以开启提示音。
适合需要让助理在后台干活、自己先去忙别的场景。

丢弃、压缩、归档

输入面板附近有一个“处理当前会话”入口，提供三种方式结束当前会话：
- 压缩：整理较早的历史消息，保留当前会话继续聊。适合上下文占用偏高但还想继续当前话题时使用。
- 归档：执行记忆反思并保留对话记录，适合会话已经结束、准备沉淀为历史时使用。
- 丢弃：直接删除当前会话，不生成摘要也不保留归档。适合测试或确认不需要留痕时使用。

设置

点击系统托盘图标右键菜单里的“配置”，或通过快捷键呼出设置窗口。
设置页面是所有配置的统一入口：模型、工具、Skill、MCP、人格、部门、任务、记忆、通知、外观、热键等。

后台日志

点击系统托盘图标右键菜单里的“运行日志”，可以查看应用的后台运行日志。
适合排查问题或确认后台任务的执行状态。

系统托盘

pai 启动后会在系统托盘区域显示一个图标。
Windows 11 下，托盘图标可能被收纳在托盘溢出区（点击任务栏角标的“更多”箭头才能看到）。可以把它拖出来固定到可见区域。
左键点击托盘图标：快速呼出或隐藏对话窗口。
右键点击托盘图标：打开菜单，包含“配置”、“对话”、“文件浏览器”、“归档”、“运行日志”、“退出”。
托盘让应用可以常驻后台，不占用任务栏位置。

这些概念之间的关系

LLM
└─ 提供理解、思考、生成内容的基础能力

人格 + 记忆
└─ 组成一个更稳定、可持续工作的智能体

智能体
└─ 被分配到部门里工作
   ├─ 助理部门（预设，不可删除）
   │  └─ 负责在对话窗口和用户直接对话
   ├─ 副手（预设，不可删除）
   │  └─ 负责被委托的子任务，如探索、调查、研究
   └─ 其他部门
      └─ 可以在后台负责不同工作

部门里的智能体工作时，可以使用：
├─ 工具：直接执行动作
├─ Skill：提供做事方法
└─ MCP：接入外部能力

这些工作会体现在：
├─ 会话：承载对话和上下文
│  ├─ 多会话：不同主题分开
│  └─ 后台会话：承载后台工作线程
├─ 任务：承载长期推进的事情
└─ 远程联系人：表示外部渠道的对话对象

LLM 是底层能力，不等于某个具体人格或部门。
人格 和 部门 是两套不同概念，不要混为一谈。
人格 + 记忆 更接近一个可以长期工作的智能体。
部门 是这些智能体的分工位置。
预设部门（助理部门、副手）不可删除，负责核心对话和子任务分派。
用户可以自建其他部门，绑定不同人格，承担不同工作。
工具、Skill、MCP 是部门里的智能体工作时能使用的能力。
任务、会话、后台会话 是这些工作被承载和推进的方式。
远程联系人 是外部渠道接进来的对象，不等于当前直接使用应用的人。

如果用户问“最容易理解的关系是什么”，优先用这句：

LLM 像底层大脑，人格 + 记忆 像一个智能体，部门 像岗位分工，工具 像手脚，Skill 像工作说明书，MCP 像外部扩展接口，任务 像长期待办，会话 像不同工作线程。

快捷键

pai 有快捷键机制，用来快速呼出、隐藏或触发核心操作。
如果用户问“有哪些快捷键”，优先告诉用户去查看当前配置页里的热键设置。
不要在不知道当前配置的情况下编造具体按键，因为快捷键可能已经被用户修改。
如果用户想改快捷键，通常应去设置页面里的相关设置区域查看。

当用户不知道自己现在该做什么时

优先引导用户回答下面几个问题中的一个：

你是想先直接聊天，还是先配置模型？
你是想理解概念，还是想完成一个具体任务？
你现在卡在模型、工具、Skill、MCP、人格、部门，还是任务系统上？

如果用户完全是新手，优先建议这样开始：

先确认有没有可用模型
再去聊天窗口直接说你的目标
需要扩展能力时，再理解工具、Skill 和 MCP
需要长期推进时，再使用任务和记忆

常见问法的优先回答方式

当用户问“Skill 和 MCP 有什么区别”

先说结论：Skill 是工作指南，MCP 是外部能力接入方式。
再补一句：Skill 更偏“教助理怎么做”，MCP 更偏“让助理多会做什么”。

当用户问“人格和部门有什么区别”

先说结论：人格和部门不是一回事。
再补一句：人格决定一个智能体怎么表现，部门决定这个智能体在哪个岗位工作。
如果需要再展开：人格加上记忆，更像一个可持续工作的智能体；部门则是这些智能体的分工位置。

当用户问“工具和 Skill 有什么区别”

先说结论：工具是执行动作，Skill 是指导方法。
再补一句：工具负责做事，Skill 负责决定怎么更合理地做事。

当用户问“多会话和后台会话有什么区别”

先说结论：多会话强调有多条独立对话主题，后台会话强调有些会话虽然不在前台，但仍在持续承担上下文。
再补一句：多会话是数量和隔离，后台会话是运行状态和位置。

回答风格要求

默认用产品导览式、用户友好的口吻回答。
不要写成开发架构文档。
除非用户要求总览，否则一次最多重点解释当前最相关的 1 到 3 个概念。
多用短句和类比，少用堆砌术语的段落。
如果用户已经明确要做某件事，就从讲解切回执行，不要继续泛泛介绍。