pai-guide

star 54

当用户不清楚自己正在使用的 pai 应用能做什么,或不理解应用中的关键概念与关系时,必须阅读我。适用于解释 pai 的能力边界、窗口分工、人格、部门、工具、Skill、MCP、委托、任务、记忆、多会话、后台会话、远程联系人、LLM、快捷键及它们之间的关系,并帮助用户判断下一步应该怎么使用这个应用。

kawayiYokami By kawayiYokami schedule Updated 6/11/2026

name: pai-guide description: 当用户不清楚自己正在使用的 pai 应用能做什么,或不理解应用中的关键概念与关系时,必须阅读我。适用于解释 pai 的能力边界、窗口分工、人格、部门、工具、Skill、MCP、委托、任务、记忆、多会话、后台会话、远程联系人、LLM、快捷键及它们之间的关系,并帮助用户判断下一步应该怎么使用这个应用。

PAI Guide

讲解原则

  • 先回答用户当前最关心的问题,再补背景。
  • 先讲直觉解释,再讲正式术语。
  • 用户明显是新手时,尽量少用抽象词,多用“它相当于什么”来解释。
  • 用户问“这是什么”,重点解释定义和关系。
  • 用户问“怎么用”,重点给最短路径,不要长篇空谈。
  • 不要一口气把所有概念都倒给用户,除非用户明确要求总览。
  • 如果不确定用户当前在哪个窗口,就明确说“如果你现在在聊天窗口 / 设置窗口 / 归档窗口”。

先用一句话解释 pai

  • pai 是一个桌面 AI 助手应用,不只是聊天框。
  • 它可以聊天、调用工具、组织人格和部门、接入 Skill 与 MCP、维护任务和记忆、处理多个会话,还可以和远程联系人相关的会话一起工作。

用户问“这个应用能做什么”时,优先这样概括

  • 和用户聊天、回答问题、解释概念
  • 帮用户组织不同人格和不同分工
  • 调用工具做实际动作
  • 通过 Skill 学会更专业的工作方式
  • 通过 MCP 接入额外外部能力
  • 用任务系统推进长期事情
  • 用记忆保存长期有价值的信息
  • 把不同主题分散到多个会话,而不是全部塞进一个对话里

窗口

对话窗口

  • 对话窗口是用户和助理直接聊天的地方。
  • 大多数即时提问、继续当前话题、查看当前回答,都发生在这里。

设置页面

  • 设置页面是主要配置和管理入口。
  • 一般在这里管理模型、工具、Skill、MCP、人格、部门、任务、记忆、外观和其他设置。
  • 如果用户问“去哪里配置”,大多数时候先引导到设置页面。

归档页面

  • 归档页面是查看和管理历史归档对话的地方。
  • 适合回顾过去已经整理过的会话内容。

快速设置窗口

  • 快速设置窗口是首次启动或需要快速配置模型时的入口。
  • 适合新手快速上手,不用进完整设置页面就能开始使用。

核心概念

什么是 LLM

  • LLM 是大语言模型。
  • 可以把它理解成助理的“语言大脑”,负责理解用户的话、组织回答、生成内容、规划步骤。
  • pai 里的很多能力,最终都要依赖某个 LLM 才能运行起来。
  • 如果用户没配置可用模型,很多聊天和智能能力就无法正常工作。

什么是人格

  • 人格 是助理的角色设定。
  • 它决定助理默认怎么说话、偏什么风格、强调什么原则、扮演什么角色。
  • 人格不是模型本身,而是模型工作的行为设定。
  • 你可以把人格理解成“这个助理以什么身份和风格来帮你”。

什么是部门

  • 部门 是职责分组。
  • 它用来组织不同类型的工作,比如主部门负责前台对话,其他部门负责执行、研究、整理、特殊流程等。
  • 部门更像组织结构或岗位分工,不只是一个聊天角色名字。

人格和部门是什么关系

  • 人格部门 不是一回事。
  • 人格 决定一个智能体怎么说话、怎么做事、偏什么风格。
  • 记忆 让这个智能体保留长期有价值的信息。
  • 可以把 人格 + 记忆 一起理解成一个可持续工作的“智能体”。
  • 部门 决定这些智能体被放到哪里工作、负责什么工作。
  • 预设的助理部门负责在对话窗口和用户直接对话,不可删除。
  • 副手部门负责被委托的子任务,也不可删除。
  • 用户可以自建其他部门,承担不同工作。

什么是工具

  • 工具 是助理可以直接调用的具体能力。
  • 它们解决的是“助理如何真正动手做事”。
  • 常见理解方式是:助理负责思考和判断,工具负责执行具体动作。

什么是 Skill

  • Skill 是给助理的一份专项说明书或工作指南。
  • 它不直接执行动作,而是告诉助理在某类任务里应该怎么理解问题、怎么组织步骤、该优先看什么、避免什么。
  • 可以把 Skill 理解成“专门领域的工作方法”。

什么是 MCP

  • MCP 是把外部工具、服务或数据源接进来的机制。
  • 如果应用内工具像“自带能力”,那 MCP 更像“扩展接口”。
  • 用户不一定需要先理解协议细节,只要知道 MCP 的作用是让助理能接入更多外部能力。

Skill、工具、MCP 的关系

  • Skill 负责告诉助理“怎么做更对”。
  • 工具 负责“直接执行动作”。
  • MCP 负责“把外部能力接进来”。
  • 一个任务里,助理可能先读 Skill,再调用工具,也可能通过 MCP 使用额外外部能力。

什么是委托

  • 委托 是把一项子任务交给其他部门去处理。
  • 它适合把复杂工作拆开,不让所有事情都挤在当前主对话里。
  • 用户可以把它理解成“主部门把一部分工作分派给其他部门”。

什么是任务

  • 任务 是长期推进面板,不只是当前一轮聊天。
  • 适合需要多轮跟进、分阶段推进、未来再继续做的事情。
  • 如果某件事不是这一轮就结束,而是要持续推进,就更适合进入任务系统。

什么是记忆

  • 记忆 是被保留下来的长期有价值信息。
  • 它帮助助理在未来找回重要背景,而不是每次都完全从零开始。
  • 记忆不是全部聊天记录的原样复制,而更像“被筛选后的长期信息”。
  • 当记忆和人格结合时,可以把它们理解成一个更稳定、更持续的智能体。

什么是多会话

  • 多会话 表示用户可以同时维护多个独立对话主题。
  • 每个会话有自己的上下文和历史。
  • 它解决的是“不要把不同事情都混在一个对话里”的问题。

什么是后台会话

  • 后台会话 指当前不一定显示在前台,但仍在承载某类工作上下文的会话。
  • 用户可以把它理解成“系统在背后维护的一条工作线程”。
  • 它常见于后台部门、委托、持续任务、特殊流程或非前台交互场景。

什么是远程联系人

  • 远程联系人 是通过远端 IM 或外部接入渠道进入系统的联系人。
  • 远程联系人不是当前直接坐在这台电脑前、打开窗口和你对话的用户本人。
  • 处理远程联系人时,要分清“当前本地用户”和“远程联系对象”这两个身份,不要混淆回复目标。

常用功能

会话目标

  • 在输入面板的工具栏里,有一个“目标”按钮。
  • 点击后可以为当前会话启动一个持续推进的目标。
  • 创建后,助理会在该目标完成、严格阻塞或用户手动停止之前,跨轮次继续推进。
  • 适合需要多轮跟进的事情,比如“帮我把这段代码重构完”。

快捷指令

  • 在输入面板上方,会显示一组可点击的指令按钮。
  • 这些是“指令预设”,在设置页面里配置。
  • 点击一条指令,它会作为文本附件附加到你本轮消息里,不用每次手打同样的提示词。
  • 适合常用指令,比如“结果整理成表格”、“用中文回答”。

语音输入

  • 输入面板的工具栏里有录音按钮,也可以用配置的热键按住录音。
  • 松开后自动转为文字并填入输入框。
  • 需要在设置里配置 STT(语音转文本)服务。

文档附件标记

  • 在输入面板顶部,会显示当前工作区中可引用的文件列表(以标签形式展示)。
  • 点击标签可以附加或取消附加某个文件上下文到本轮消息。
  • 附加后,助理在回答时会自动参考这些文件内容,不用你手动复制粘贴。

文档浏览器

  • 对话窗口顶部有“阅读”标签页,点击打开右侧文件浏览器面板。
  • 面板会跟随当前会话的工作区目录,可以浏览和阅读代码、文档等文件。
  • 支持多标签同时打开多个文件。
  • 阅读时,当前文件的上下文会自动出现在输入面板的文档附件标记区域,方便一键附加。

委托

  • 在会话工具栏里可以“发起委托”,把子任务交给其他部门处理。
  • 也可以多选消息后,通过“快捷委托”把选中内容作为背景发给子代理。
  • 委托状态会实时显示在右侧“委托”标签页里。

工具与委托的执行逻辑

  • 工具执行是动态决策的:系统会根据工具类型自动决定能否并行。只读工具(如 read、fetch、websearch、recall)可以多个同时执行;写操作工具(如 exec、apply_patch、todo、task、remember)必须串行,避免冲突。
  • 委托就是启动一个子代理:每次委托本质上是拉起一个新的子代理去独立工作,和当前对话互不阻塞。
  • 多个委托可以同时进行:可以同时发起多个委托到不同部门,它们各自独立运行,不需要串行等待。
  • 委托有两种模式:同步(等结果回来再继续)和异步(发出去就继续做别的)。

代码审查

  • 当助理调用工具执行代码改动后,右侧会自动出现“审查”标签页。
  • 可以在审查面板里查看工具调用记录、发起代码审查、生成审查报告。
  • 也可以手动选择审查部门和快速模型来定制审查流程。

工具 AI 审查原理

  • 助理每次调用终端命令或文件补丁时,系统会先用一个独立的“快速模型”来评估这次操作是否安全。
  • 评估模型会分析命令内容,判断是否只读、是否有副作用,然后返回“放行”或“拒绝”以及一段给普通人看的评估意见。
  • 如果评估结果是放行,工具直接执行;如果拒绝,会弹窗让用户确认是否允许。
  • 评估结果会显示在右侧“审查”标签页里,每条工具调用都可以查看评估状态(已评估/未评估)。
  • 用户可以逐条评估,也可以批量评估所有未评估的工具调用。
  • 全部评估完成后,可以发起“代码审查”生成完整审查报告。
  • 快速模型在设置页面的“快速模型”选项中配置。

会话权限控制

  • 部门权限:每个部门可以配置权限模式(白名单或黑名单),分别控制可用的内置工具、Skill 和 MCP 工具。在设置页面的部门配置里管理。
  • 工作区权限:会话的工作区目录可以设置访问模式,包括只读和需要审批(approval)两种。审批模式下,写操作需要用户确认。
  • 终端审批:当助理要执行会修改文件、修改 Git 状态或修改系统配置的终端命令时,会弹窗请求用户确认。只读命令(如查看、测试、编译校验)通常直接放行。

多选消息转发

  • 长按或右键消息可以进入多选模式。
  • 选中多条消息后,底部会出现操作面板,可以“转发到会话”——把选中的消息插入到另一个会话末尾。
  • 适合把一段对话精华搬到另一个主题会话里继续讨论。

多选消息会话分支

  • 同样在多选模式下,可以点“创造会话分支”。
  • 它会基于选中的消息创建一个新会话,保留选中内容作为上下文起点。
  • 和“转发”不同:分支是新建一个会话,转发是往已有会话里插入。

会话继承

  • 新建会话时,标题栏的创建对话框里有一个“继承当前会话”勾选框。
  • 勾选后,新会话会继承当前会话的上下文摘要,不用从零开始。
  • 适合同一个话题需要开新会话继续讨论的场景。

会话导出与导入

  • 在会话列表或会话侧边栏里,右键会话可以看到“导出会话”选项。
  • 导出格式支持 Markdown 和 JSON,方便存档或分享。
  • 新建会话时,标题栏里有“从外部导入”按钮,可以把之前导出的会话文件导入为新会话。

新建会话

  • 标题栏里有“新建会话”按钮,点击后可以设置会话主题(可留空)。
  • 还可以勾选“继承当前会话”,让新会话接续当前上下文。
  • 也可以指定导入外部文件来创建新会话。

消息队列

  • 当助理正在回复(流式输出)时,你继续输入的新消息不会丢失,会进入“消息队列”排队等待。
  • 队列中的消息会显示在输入面板附近,标注为“排队”状态。
  • 助理当前回复结束后,队列里的消息会按顺序自动发送。

引导

  • 队列中的消息可以点击“引导”按钮切换为引导模式。
  • 引导模式下,这条消息不会直接作为新问题发送,而是会在助理当前回复结束后,影响助理的下一步方向。
  • 适合你在助理还在工作时,悄悄调整它的思路,而不是打断当前流程。

@提及

  • 在输入框里输入 @ 可以提及特定的人格或部门。
  • 被提及的对象会收到消息或被委派任务。
  • 适合需要让另一个部门的智能体介入当前对话的场景。

撤回消息

  • 右键消息或在消息操作菜单里可以找到“撤回”选项。
  • 撤回时有两种模式:
    • “撤回消息并撤回修改”:回退消息的同时,也会撤销助理通过工具做的文件修改。
    • “仅撤回消息”:只删除消息记录,不影响已经执行的工具操作。

通知

  • 在设置页面的“通知”标签里,可以开启或关闭后台会话完成/失败时的系统通知。
  • 开启后,后台任务完成时会弹出 Windows 原生通知,还可以开启提示音。
  • 适合需要让助理在后台干活、自己先去忙别的场景。

丢弃、压缩、归档

  • 输入面板附近有一个“处理当前会话”入口,提供三种方式结束当前会话:
    • 压缩:整理较早的历史消息,保留当前会话继续聊。适合上下文占用偏高但还想继续当前话题时使用。
    • 归档:执行记忆反思并保留对话记录,适合会话已经结束、准备沉淀为历史时使用。
    • 丢弃:直接删除当前会话,不生成摘要也不保留归档。适合测试或确认不需要留痕时使用。

设置

  • 点击系统托盘图标右键菜单里的“配置”,或通过快捷键呼出设置窗口。
  • 设置页面是所有配置的统一入口:模型、工具、Skill、MCP、人格、部门、任务、记忆、通知、外观、热键等。

后台日志

  • 点击系统托盘图标右键菜单里的“运行日志”,可以查看应用的后台运行日志。
  • 适合排查问题或确认后台任务的执行状态。

系统托盘

  • pai 启动后会在系统托盘区域显示一个图标。
  • Windows 11 下,托盘图标可能被收纳在托盘溢出区(点击任务栏角标的“更多”箭头才能看到)。可以把它拖出来固定到可见区域。
  • 左键点击托盘图标:快速呼出或隐藏对话窗口。
  • 右键点击托盘图标:打开菜单,包含“配置”、“对话”、“文件浏览器”、“归档”、“运行日志”、“退出”。
  • 托盘让应用可以常驻后台,不占用任务栏位置。

这些概念之间的关系

LLM
└─ 提供理解、思考、生成内容的基础能力

人格 + 记忆
└─ 组成一个更稳定、可持续工作的智能体

智能体
└─ 被分配到部门里工作
   ├─ 助理部门(预设,不可删除)
   │  └─ 负责在对话窗口和用户直接对话
   ├─ 副手(预设,不可删除)
   │  └─ 负责被委托的子任务,如探索、调查、研究
   └─ 其他部门
      └─ 可以在后台负责不同工作

部门里的智能体工作时,可以使用:
├─ 工具:直接执行动作
├─ Skill:提供做事方法
└─ MCP:接入外部能力

这些工作会体现在:
├─ 会话:承载对话和上下文
│  ├─ 多会话:不同主题分开
│  └─ 后台会话:承载后台工作线程
├─ 任务:承载长期推进的事情
└─ 远程联系人:表示外部渠道的对话对象
  • LLM 是底层能力,不等于某个具体人格或部门。
  • 人格部门 是两套不同概念,不要混为一谈。
  • 人格 + 记忆 更接近一个可以长期工作的智能体。
  • 部门 是这些智能体的分工位置。
  • 预设部门(助理部门、副手)不可删除,负责核心对话和子任务分派。
  • 用户可以自建其他部门,绑定不同人格,承担不同工作。
  • 工具SkillMCP 是部门里的智能体工作时能使用的能力。
  • 任务会话后台会话 是这些工作被承载和推进的方式。
  • 远程联系人 是外部渠道接进来的对象,不等于当前直接使用应用的人。

如果用户问“最容易理解的关系是什么”,优先用这句:

  • LLM 像底层大脑,人格 + 记忆 像一个智能体,部门 像岗位分工,工具 像手脚,Skill 像工作说明书,MCP 像外部扩展接口,任务 像长期待办,会话 像不同工作线程。

快捷键

  • pai 有快捷键机制,用来快速呼出、隐藏或触发核心操作。
  • 如果用户问“有哪些快捷键”,优先告诉用户去查看当前配置页里的热键设置。
  • 不要在不知道当前配置的情况下编造具体按键,因为快捷键可能已经被用户修改。
  • 如果用户想改快捷键,通常应去设置页面里的相关设置区域查看。

当用户不知道自己现在该做什么时

优先引导用户回答下面几个问题中的一个:

  • 你是想先直接聊天,还是先配置模型?
  • 你是想理解概念,还是想完成一个具体任务?
  • 你现在卡在模型、工具、Skill、MCP、人格、部门,还是任务系统上?

如果用户完全是新手,优先建议这样开始:

  1. 先确认有没有可用模型
  2. 再去聊天窗口直接说你的目标
  3. 需要扩展能力时,再理解工具、Skill 和 MCP
  4. 需要长期推进时,再使用任务和记忆

常见问法的优先回答方式

当用户问“Skill 和 MCP 有什么区别”

  • 先说结论:Skill 是工作指南,MCP 是外部能力接入方式。
  • 再补一句:Skill 更偏“教助理怎么做”,MCP 更偏“让助理多会做什么”。

当用户问“人格和部门有什么区别”

  • 先说结论:人格和部门不是一回事。
  • 再补一句:人格决定一个智能体怎么表现,部门决定这个智能体在哪个岗位工作。
  • 如果需要再展开:人格加上记忆,更像一个可持续工作的智能体;部门则是这些智能体的分工位置。

当用户问“工具和 Skill 有什么区别”

  • 先说结论:工具是执行动作,Skill 是指导方法。
  • 再补一句:工具负责做事,Skill 负责决定怎么更合理地做事。

当用户问“多会话和后台会话有什么区别”

  • 先说结论:多会话强调有多条独立对话主题,后台会话强调有些会话虽然不在前台,但仍在持续承担上下文。
  • 再补一句:多会话是数量和隔离,后台会话是运行状态和位置。

回答风格要求

  • 默认用产品导览式、用户友好的口吻回答。
  • 不要写成开发架构文档。
  • 除非用户要求总览,否则一次最多重点解释当前最相关的 1 到 3 个概念。
  • 多用短句和类比,少用堆砌术语的段落。
  • 如果用户已经明确要做某件事,就从讲解切回执行,不要继续泛泛介绍。
Install via CLI
npx skills add https://github.com/kawayiYokami/P-ai --skill pai-guide
Repository Details
star Stars 54
call_split Forks 13
navigation Branch main
article Path SKILL.md
More from Creator
kawayiYokami
kawayiYokami Explore all skills →