name: pai-guide description: 当用户不清楚自己正在使用的 pai 应用能做什么,或不理解应用中的关键概念与关系时,必须阅读我。适用于解释 pai 的能力边界、窗口分工、人格、部门、工具、Skill、MCP、委托、任务、记忆、多会话、后台会话、远程联系人、LLM、快捷键及它们之间的关系,并帮助用户判断下一步应该怎么使用这个应用。
PAI Guide
讲解原则
- 先回答用户当前最关心的问题,再补背景。
- 先讲直觉解释,再讲正式术语。
- 用户明显是新手时,尽量少用抽象词,多用“它相当于什么”来解释。
- 用户问“这是什么”,重点解释定义和关系。
- 用户问“怎么用”,重点给最短路径,不要长篇空谈。
- 不要一口气把所有概念都倒给用户,除非用户明确要求总览。
- 如果不确定用户当前在哪个窗口,就明确说“如果你现在在聊天窗口 / 设置窗口 / 归档窗口”。
先用一句话解释 pai
pai是一个桌面 AI 助手应用,不只是聊天框。- 它可以聊天、调用工具、组织人格和部门、接入 Skill 与 MCP、维护任务和记忆、处理多个会话,还可以和远程联系人相关的会话一起工作。
用户问“这个应用能做什么”时,优先这样概括
- 和用户聊天、回答问题、解释概念
- 帮用户组织不同人格和不同分工
- 调用工具做实际动作
- 通过 Skill 学会更专业的工作方式
- 通过 MCP 接入额外外部能力
- 用任务系统推进长期事情
- 用记忆保存长期有价值的信息
- 把不同主题分散到多个会话,而不是全部塞进一个对话里
窗口
对话窗口
- 对话窗口是用户和助理直接聊天的地方。
- 大多数即时提问、继续当前话题、查看当前回答,都发生在这里。
设置页面
- 设置页面是主要配置和管理入口。
- 一般在这里管理模型、工具、Skill、MCP、人格、部门、任务、记忆、外观和其他设置。
- 如果用户问“去哪里配置”,大多数时候先引导到设置页面。
归档页面
- 归档页面是查看和管理历史归档对话的地方。
- 适合回顾过去已经整理过的会话内容。
快速设置窗口
- 快速设置窗口是首次启动或需要快速配置模型时的入口。
- 适合新手快速上手,不用进完整设置页面就能开始使用。
核心概念
什么是 LLM
LLM是大语言模型。- 可以把它理解成助理的“语言大脑”,负责理解用户的话、组织回答、生成内容、规划步骤。
pai里的很多能力,最终都要依赖某个 LLM 才能运行起来。- 如果用户没配置可用模型,很多聊天和智能能力就无法正常工作。
什么是人格
人格是助理的角色设定。- 它决定助理默认怎么说话、偏什么风格、强调什么原则、扮演什么角色。
- 人格不是模型本身,而是模型工作的行为设定。
- 你可以把人格理解成“这个助理以什么身份和风格来帮你”。
什么是部门
部门是职责分组。- 它用来组织不同类型的工作,比如主部门负责前台对话,其他部门负责执行、研究、整理、特殊流程等。
- 部门更像组织结构或岗位分工,不只是一个聊天角色名字。
人格和部门是什么关系
人格和部门不是一回事。人格决定一个智能体怎么说话、怎么做事、偏什么风格。记忆让这个智能体保留长期有价值的信息。- 可以把
人格 + 记忆一起理解成一个可持续工作的“智能体”。 部门决定这些智能体被放到哪里工作、负责什么工作。- 预设的助理部门负责在对话窗口和用户直接对话,不可删除。
- 副手部门负责被委托的子任务,也不可删除。
- 用户可以自建其他部门,承担不同工作。
什么是工具
工具是助理可以直接调用的具体能力。- 它们解决的是“助理如何真正动手做事”。
- 常见理解方式是:助理负责思考和判断,工具负责执行具体动作。
什么是 Skill
Skill是给助理的一份专项说明书或工作指南。- 它不直接执行动作,而是告诉助理在某类任务里应该怎么理解问题、怎么组织步骤、该优先看什么、避免什么。
- 可以把 Skill 理解成“专门领域的工作方法”。
什么是 MCP
MCP是把外部工具、服务或数据源接进来的机制。- 如果应用内工具像“自带能力”,那 MCP 更像“扩展接口”。
- 用户不一定需要先理解协议细节,只要知道 MCP 的作用是让助理能接入更多外部能力。
Skill、工具、MCP 的关系
Skill负责告诉助理“怎么做更对”。工具负责“直接执行动作”。MCP负责“把外部能力接进来”。- 一个任务里,助理可能先读 Skill,再调用工具,也可能通过 MCP 使用额外外部能力。
什么是委托
委托是把一项子任务交给其他部门去处理。- 它适合把复杂工作拆开,不让所有事情都挤在当前主对话里。
- 用户可以把它理解成“主部门把一部分工作分派给其他部门”。
什么是任务
任务是长期推进面板,不只是当前一轮聊天。- 适合需要多轮跟进、分阶段推进、未来再继续做的事情。
- 如果某件事不是这一轮就结束,而是要持续推进,就更适合进入任务系统。
什么是记忆
记忆是被保留下来的长期有价值信息。- 它帮助助理在未来找回重要背景,而不是每次都完全从零开始。
- 记忆不是全部聊天记录的原样复制,而更像“被筛选后的长期信息”。
- 当记忆和人格结合时,可以把它们理解成一个更稳定、更持续的智能体。
什么是多会话
多会话表示用户可以同时维护多个独立对话主题。- 每个会话有自己的上下文和历史。
- 它解决的是“不要把不同事情都混在一个对话里”的问题。
什么是后台会话
后台会话指当前不一定显示在前台,但仍在承载某类工作上下文的会话。- 用户可以把它理解成“系统在背后维护的一条工作线程”。
- 它常见于后台部门、委托、持续任务、特殊流程或非前台交互场景。
什么是远程联系人
远程联系人是通过远端 IM 或外部接入渠道进入系统的联系人。- 远程联系人不是当前直接坐在这台电脑前、打开窗口和你对话的用户本人。
- 处理远程联系人时,要分清“当前本地用户”和“远程联系对象”这两个身份,不要混淆回复目标。
常用功能
会话目标
- 在输入面板的工具栏里,有一个“目标”按钮。
- 点击后可以为当前会话启动一个持续推进的目标。
- 创建后,助理会在该目标完成、严格阻塞或用户手动停止之前,跨轮次继续推进。
- 适合需要多轮跟进的事情,比如“帮我把这段代码重构完”。
快捷指令
- 在输入面板上方,会显示一组可点击的指令按钮。
- 这些是“指令预设”,在设置页面里配置。
- 点击一条指令,它会作为文本附件附加到你本轮消息里,不用每次手打同样的提示词。
- 适合常用指令,比如“结果整理成表格”、“用中文回答”。
语音输入
- 输入面板的工具栏里有录音按钮,也可以用配置的热键按住录音。
- 松开后自动转为文字并填入输入框。
- 需要在设置里配置 STT(语音转文本)服务。
文档附件标记
- 在输入面板顶部,会显示当前工作区中可引用的文件列表(以标签形式展示)。
- 点击标签可以附加或取消附加某个文件上下文到本轮消息。
- 附加后,助理在回答时会自动参考这些文件内容,不用你手动复制粘贴。
文档浏览器
- 对话窗口顶部有“阅读”标签页,点击打开右侧文件浏览器面板。
- 面板会跟随当前会话的工作区目录,可以浏览和阅读代码、文档等文件。
- 支持多标签同时打开多个文件。
- 阅读时,当前文件的上下文会自动出现在输入面板的文档附件标记区域,方便一键附加。
委托
- 在会话工具栏里可以“发起委托”,把子任务交给其他部门处理。
- 也可以多选消息后,通过“快捷委托”把选中内容作为背景发给子代理。
- 委托状态会实时显示在右侧“委托”标签页里。
工具与委托的执行逻辑
- 工具执行是动态决策的:系统会根据工具类型自动决定能否并行。只读工具(如 read、fetch、websearch、recall)可以多个同时执行;写操作工具(如 exec、apply_patch、todo、task、remember)必须串行,避免冲突。
- 委托就是启动一个子代理:每次委托本质上是拉起一个新的子代理去独立工作,和当前对话互不阻塞。
- 多个委托可以同时进行:可以同时发起多个委托到不同部门,它们各自独立运行,不需要串行等待。
- 委托有两种模式:同步(等结果回来再继续)和异步(发出去就继续做别的)。
代码审查
- 当助理调用工具执行代码改动后,右侧会自动出现“审查”标签页。
- 可以在审查面板里查看工具调用记录、发起代码审查、生成审查报告。
- 也可以手动选择审查部门和快速模型来定制审查流程。
工具 AI 审查原理
- 助理每次调用终端命令或文件补丁时,系统会先用一个独立的“快速模型”来评估这次操作是否安全。
- 评估模型会分析命令内容,判断是否只读、是否有副作用,然后返回“放行”或“拒绝”以及一段给普通人看的评估意见。
- 如果评估结果是放行,工具直接执行;如果拒绝,会弹窗让用户确认是否允许。
- 评估结果会显示在右侧“审查”标签页里,每条工具调用都可以查看评估状态(已评估/未评估)。
- 用户可以逐条评估,也可以批量评估所有未评估的工具调用。
- 全部评估完成后,可以发起“代码审查”生成完整审查报告。
- 快速模型在设置页面的“快速模型”选项中配置。
会话权限控制
- 部门权限:每个部门可以配置权限模式(白名单或黑名单),分别控制可用的内置工具、Skill 和 MCP 工具。在设置页面的部门配置里管理。
- 工作区权限:会话的工作区目录可以设置访问模式,包括只读和需要审批(approval)两种。审批模式下,写操作需要用户确认。
- 终端审批:当助理要执行会修改文件、修改 Git 状态或修改系统配置的终端命令时,会弹窗请求用户确认。只读命令(如查看、测试、编译校验)通常直接放行。
多选消息转发
- 长按或右键消息可以进入多选模式。
- 选中多条消息后,底部会出现操作面板,可以“转发到会话”——把选中的消息插入到另一个会话末尾。
- 适合把一段对话精华搬到另一个主题会话里继续讨论。
多选消息会话分支
- 同样在多选模式下,可以点“创造会话分支”。
- 它会基于选中的消息创建一个新会话,保留选中内容作为上下文起点。
- 和“转发”不同:分支是新建一个会话,转发是往已有会话里插入。
会话继承
- 新建会话时,标题栏的创建对话框里有一个“继承当前会话”勾选框。
- 勾选后,新会话会继承当前会话的上下文摘要,不用从零开始。
- 适合同一个话题需要开新会话继续讨论的场景。
会话导出与导入
- 在会话列表或会话侧边栏里,右键会话可以看到“导出会话”选项。
- 导出格式支持 Markdown 和 JSON,方便存档或分享。
- 新建会话时,标题栏里有“从外部导入”按钮,可以把之前导出的会话文件导入为新会话。
新建会话
- 标题栏里有“新建会话”按钮,点击后可以设置会话主题(可留空)。
- 还可以勾选“继承当前会话”,让新会话接续当前上下文。
- 也可以指定导入外部文件来创建新会话。
消息队列
- 当助理正在回复(流式输出)时,你继续输入的新消息不会丢失,会进入“消息队列”排队等待。
- 队列中的消息会显示在输入面板附近,标注为“排队”状态。
- 助理当前回复结束后,队列里的消息会按顺序自动发送。
引导
- 队列中的消息可以点击“引导”按钮切换为引导模式。
- 引导模式下,这条消息不会直接作为新问题发送,而是会在助理当前回复结束后,影响助理的下一步方向。
- 适合你在助理还在工作时,悄悄调整它的思路,而不是打断当前流程。
@提及
- 在输入框里输入
@可以提及特定的人格或部门。 - 被提及的对象会收到消息或被委派任务。
- 适合需要让另一个部门的智能体介入当前对话的场景。
撤回消息
- 右键消息或在消息操作菜单里可以找到“撤回”选项。
- 撤回时有两种模式:
- “撤回消息并撤回修改”:回退消息的同时,也会撤销助理通过工具做的文件修改。
- “仅撤回消息”:只删除消息记录,不影响已经执行的工具操作。
通知
- 在设置页面的“通知”标签里,可以开启或关闭后台会话完成/失败时的系统通知。
- 开启后,后台任务完成时会弹出 Windows 原生通知,还可以开启提示音。
- 适合需要让助理在后台干活、自己先去忙别的场景。
丢弃、压缩、归档
- 输入面板附近有一个“处理当前会话”入口,提供三种方式结束当前会话:
- 压缩:整理较早的历史消息,保留当前会话继续聊。适合上下文占用偏高但还想继续当前话题时使用。
- 归档:执行记忆反思并保留对话记录,适合会话已经结束、准备沉淀为历史时使用。
- 丢弃:直接删除当前会话,不生成摘要也不保留归档。适合测试或确认不需要留痕时使用。
设置
- 点击系统托盘图标右键菜单里的“配置”,或通过快捷键呼出设置窗口。
- 设置页面是所有配置的统一入口:模型、工具、Skill、MCP、人格、部门、任务、记忆、通知、外观、热键等。
后台日志
- 点击系统托盘图标右键菜单里的“运行日志”,可以查看应用的后台运行日志。
- 适合排查问题或确认后台任务的执行状态。
系统托盘
pai启动后会在系统托盘区域显示一个图标。- Windows 11 下,托盘图标可能被收纳在托盘溢出区(点击任务栏角标的“更多”箭头才能看到)。可以把它拖出来固定到可见区域。
- 左键点击托盘图标:快速呼出或隐藏对话窗口。
- 右键点击托盘图标:打开菜单,包含“配置”、“对话”、“文件浏览器”、“归档”、“运行日志”、“退出”。
- 托盘让应用可以常驻后台,不占用任务栏位置。
这些概念之间的关系
LLM
└─ 提供理解、思考、生成内容的基础能力
人格 + 记忆
└─ 组成一个更稳定、可持续工作的智能体
智能体
└─ 被分配到部门里工作
├─ 助理部门(预设,不可删除)
│ └─ 负责在对话窗口和用户直接对话
├─ 副手(预设,不可删除)
│ └─ 负责被委托的子任务,如探索、调查、研究
└─ 其他部门
└─ 可以在后台负责不同工作
部门里的智能体工作时,可以使用:
├─ 工具:直接执行动作
├─ Skill:提供做事方法
└─ MCP:接入外部能力
这些工作会体现在:
├─ 会话:承载对话和上下文
│ ├─ 多会话:不同主题分开
│ └─ 后台会话:承载后台工作线程
├─ 任务:承载长期推进的事情
└─ 远程联系人:表示外部渠道的对话对象
LLM是底层能力,不等于某个具体人格或部门。人格和部门是两套不同概念,不要混为一谈。人格 + 记忆更接近一个可以长期工作的智能体。部门是这些智能体的分工位置。- 预设部门(助理部门、副手)不可删除,负责核心对话和子任务分派。
- 用户可以自建其他部门,绑定不同人格,承担不同工作。
工具、Skill、MCP是部门里的智能体工作时能使用的能力。任务、会话、后台会话是这些工作被承载和推进的方式。远程联系人是外部渠道接进来的对象,不等于当前直接使用应用的人。
如果用户问“最容易理解的关系是什么”,优先用这句:
LLM像底层大脑,人格 + 记忆像一个智能体,部门像岗位分工,工具像手脚,Skill像工作说明书,MCP像外部扩展接口,任务像长期待办,会话像不同工作线程。
快捷键
pai有快捷键机制,用来快速呼出、隐藏或触发核心操作。- 如果用户问“有哪些快捷键”,优先告诉用户去查看当前配置页里的热键设置。
- 不要在不知道当前配置的情况下编造具体按键,因为快捷键可能已经被用户修改。
- 如果用户想改快捷键,通常应去设置页面里的相关设置区域查看。
当用户不知道自己现在该做什么时
优先引导用户回答下面几个问题中的一个:
- 你是想先直接聊天,还是先配置模型?
- 你是想理解概念,还是想完成一个具体任务?
- 你现在卡在模型、工具、Skill、MCP、人格、部门,还是任务系统上?
如果用户完全是新手,优先建议这样开始:
- 先确认有没有可用模型
- 再去聊天窗口直接说你的目标
- 需要扩展能力时,再理解工具、Skill 和 MCP
- 需要长期推进时,再使用任务和记忆
常见问法的优先回答方式
当用户问“Skill 和 MCP 有什么区别”
- 先说结论:Skill 是工作指南,MCP 是外部能力接入方式。
- 再补一句:Skill 更偏“教助理怎么做”,MCP 更偏“让助理多会做什么”。
当用户问“人格和部门有什么区别”
- 先说结论:人格和部门不是一回事。
- 再补一句:人格决定一个智能体怎么表现,部门决定这个智能体在哪个岗位工作。
- 如果需要再展开:人格加上记忆,更像一个可持续工作的智能体;部门则是这些智能体的分工位置。
当用户问“工具和 Skill 有什么区别”
- 先说结论:工具是执行动作,Skill 是指导方法。
- 再补一句:工具负责做事,Skill 负责决定怎么更合理地做事。
当用户问“多会话和后台会话有什么区别”
- 先说结论:多会话强调有多条独立对话主题,后台会话强调有些会话虽然不在前台,但仍在持续承担上下文。
- 再补一句:多会话是数量和隔离,后台会话是运行状态和位置。
回答风格要求
- 默认用产品导览式、用户友好的口吻回答。
- 不要写成开发架构文档。
- 除非用户要求总览,否则一次最多重点解释当前最相关的 1 到 3 个概念。
- 多用短句和类比,少用堆砌术语的段落。
- 如果用户已经明确要做某件事,就从讲解切回执行,不要继续泛泛介绍。