okr-skill - SKILL.md Agent Skill

name: okr-skill description: | OKR（目标与关键结果）的结构化思维工具。基于6个一手来源的深度调研，提炼6个核心原理和完整的操作协议。触发词：「OKR」「目标管理」「关键结果」「目标对齐」「Objective」「Key Result」「季度目标」。

OKR（Objectives and Key Results）· 思维工具

聚焦少数要事，用量化结果衡量进展，让组织上下对齐到同一个方向。

激活条件与触发词

直接调用：

「用 OKR 分析...」
「帮我设定季度 OKR」
「用目标与关键结果框架...」

语义触发：

用户讨论「目标管理」「团队对齐」「季度规划」
用户需要「衡量目标进展」「设定挑战性目标」
用户描述「目标太多不知道聚焦什么」「团队方向不一致」

组合调用：

「先用商业模式画布明确方向，再用 OKR 设定季度目标」
「结合 Kaizen 的改善方向和 OKR 的目标框架」

方法框架概览

OKR 的核心是将模糊的愿望转化为可量化、可追踪、可对齐的结构化目标体系。它通过6个原理来帮助组织和个人聚焦少数要事、设定挑战性目标、保持透明对齐、高频追踪进展，并将目标管理与绩效薪酬解耦以避免博弈行为。

核心原理（6个，每个须附 ≥2 个跨域证据）

原理 1: 聚焦少数要事——精力集中在 3-5 个最重要的目标上

一句话定义：将精力集中在 3-5 个最重要的目标上，而非分散追求所有事。

跨域证据：

企业管理（Intel）：1980 年代 Motorola 68000 和 Zilog Z80 蚕食 Intel 市场，Andy Grove 运用 OKR 将全公司聚焦到单一核心目标"击败 Motorola"，配合 2000 个设计订单等关键结果，成功逆转局势。（来源：John Doerr, whatmatters.com Operation Crush 回忆；OKR Institute 案例记录）
个人发展：个人 OKR 实践中同样遵循"3-5 个目标"限制，如将"成为更健康的人"作为唯一 Objective，配合 2-4 个 Key Result（每周运动 4 次、减重 15 磅），避免多目标失焦。（来源：whatmatters.com 个人 OKR 指南；Profit.co 个人 OKR 指南）

应用方式：每个周期（通常季度）设定不超过 5 个 Objective，每个 Objective 配合 2-4 个 Key Result，通过做减法强制排序。

局限：对需要多线并行的探索性工作不友好；过于严格的数量限制可能导致重要但非紧急事项被忽略。

原理 2: 可量化测量——关键结果必须是可量化的指标

一句话定义：关键结果必须是可量化的指标，而非模糊的愿望或行动清单。

跨域证据：

科技（Google）：Google 要求每个 Key Result 必须有明确数字目标并能被评分（0-1.0）。不是"改善搜索质量"，而是"将搜索延迟降低 40ms"。Larry Page 和 Sergey Brin 自 1999 年采纳 OKR 后坚持此原则。（来源：Google re:Work 官方指南；GV Library "How Google Sets Goals: OKRs"）
医疗（医院管理）：医疗机构将"改善患者治疗效果"转化为可量化的 Key Result，如"30 天再入院率降低 15%"、"医疗错误事件减少 20%"，使临床团队精确追踪进展。（来源：Workpath Healthcare OKR 示例；Profit.co 医疗 OKR 示例）

应用方式：每个 Key Result 使用具体数字和截止时间，遵循"从 X 到 Y"格式，季度末用 0-1.0 分评分。

局限：并非所有有价值的工作都能被量化（如创意产出、文化建设）；过度追求可量化可能导致"可测量但不重要"取代"重要但难测量"。

原理 3: 挑战性目标与安全失败——设定 60-70% 完成率的雄心目标

一句话定义：设定只有 60-70% 完成率的雄心目标，将未达 100% 视为正常而非失败。

跨域证据：

组织心理学：Locke & Latham 在 90% 的研究中发现，具体且具有挑战性的目标比"尽力而为"产生更高绩效。但哈佛商学院 Ordóñez 等人（"Goals Gone Wild"）也警告过度激进目标可能导致不道德行为。（来源：Locke & Latham, 2002, 斯坦福论文；Ordóñez et al., HBS Working Paper 09-083）
科技（Google）：Google 明确规定"理想区间"为 60-70% 完成率，"低于此区间可能意味着组织没有充分实现其能力；高于此区间可能意味着雄心目标不够激进"。（来源：Google re:Work；John Doerr, whatmatters.com 评分指南）

应用方式：区分"承诺型 OKR"（预期 90-100% 完成）和"抱负型 OKR"（预期 60-70% 完成），对后者设置心理安全区。

局限：在惩罚性文化中，员工会降低目标以规避风险（沙袋效应）；部分研究者（如 Tability）认为 60-70% 标准本身可能打击士气。

原理 4: 透明对齐——组织内所有 OKR 公开可见

一句话定义：组织内所有 OKR 公开可见，确保上下级和跨团队目标对齐。

跨域证据：

政府（公共部门）：政府机构采用 OKR 打破部门壁垒，政策制定者将 OKR 作为"政策目标的最简表达"，将分散的公共服务机构对齐到共同目标。（来源：whatmatters.com "Making Government Work Better With OKRs"；Adaptovate "Harnessing OKRs in the Public Sector"）
军事（民事事务团队）：美国军事民事事务团队使用 OKR 框架在复杂作战环境中设定和追踪目标，透明性使不同单位在同一作战目标下协调行动。（来源：Civil Affairs Association "Operationalizing the OKR Goal-Setting Framework for Civil Affairs Teams"）

应用方式：使用全公司可见的 OKR 平台，从公司级到团队级层层对齐，每个人能看到其他团队的目标和进展。

局限：层层级联在大型组织中可能产生大量协调开销；过度追求对齐可能导致响应速度下降。

原理 5: 高频追踪与复盘——以周为节奏检查进展

一句话定义：以周或双周为节奏检查 OKR 进展，季度末进行系统复盘。

跨域证据：

企业管理（OKR 失败分析）：OKR Advisors 调查显示 42% 的公司在第一年内放弃 OKR，核心原因是没有定期检查。成功实施的公司采用每周或双周 Check-in 节奏。（来源：OKR Advisors 调查数据；okrshive 分析报告）
教育（Inteleos 认证机构）：Inteleos 通过 Outcome OKR 方法论转型，强调持续追踪和复盘会议，将 OKR 从静态文档变为动态管理工具。（来源：OKR Mentors Inteleos 案例研究）

应用方式：每周 15 分钟 Check-in（更新信心指数、讨论障碍），季度中期回顾，季度末评分和复盘。

局限：高频追踪在快节奏环境中可能变成形式主义负担；如果组织缺乏反馈文化，复盘可能沦为表面汇报。

原理 6: 解耦绩效薪酬——OKR 完成率不直接与奖金挂钩

一句话定义：OKR 完成率不直接与奖金/晋升挂钩，避免目标博弈行为。

跨域证据：

科技（Google）：Google 明确指出"OKR 不等同于员工绩效评估"。OKR 关注公司目标和每位员工的贡献方式，而非个人绩效考核。（来源：Google re:Work；GV Library）
敏捷开发（Spotify）：Spotify 实施个人级 OKR 并绑定到个人层面，导致对齐失败和博弈行为，2014 年完全放弃 OKR。教训：OKR 在团队层面有效，但在个人层面尤其与薪酬挂钩时引发严重问题。（来源：ZOKRI "Why Spotify Stopped Using Individual OKRs"；Medium "Spotify Doesn't Use OKRs Anymore"）

应用方式：OKR 仅用于目标管理和对齐，绩效考核使用独立评价体系。如必须关联，仅作为参考输入之一。

局限：完全解耦可能削弱完成目标的动力；在薪酬驱动文化中，员工可能将 OKR 视为额外负担。

操作协议（Agentic Protocol）

Step 1: 问题分类 — 判断 OKR 是否适用于当前问题

适用信号：

用户需要设定季度/年度目标并追踪进展
团队方向不清晰，需要对齐到共同目标
用户需要将模糊的愿望转化为可衡量的结果
组织需要从任务导向转向结果导向

不适用信号：

纯粹的探索性研究或创意发散（"不确定方向"）→ 推荐设计思维或双钻模型
个人技能学习路径规划 → 推荐费曼学习法
问题诊断或根因分析 → 推荐 5 Whys 或系统思维
竞争格局分析 → 推荐五力分析或蓝海战略

输出：适用 / 不适用（附理由）/ 部分适用（附建议）

Step 2: OKR 式分析 — 研究维度须从核心原理推导

研究维度（每个维度必须能追溯到具体的核心原理）：

目标聚焦筛选：从所有可能的愿望中筛选出 3-5 个最关键的 Objective
- 来源原理：原理 1（聚焦少数要事）
- 操作方式：列出所有候选目标，用"如果这个季度只能完成 3 件事"进行强制排序，选出最重要的 3-5 个
关键结果量化：为每个 Objective 设定 2-4 个可量化的 Key Result
- 来源原理：原理 2（可量化测量）
- 操作方式：每个 Key Result 必须包含数字，遵循"从 X 到 Y"格式。使用"所以呢？"测试法——对每个 KR 连续追问"所以呢？"直到得到真正的业务影响
目标难度校准：区分承诺型和抱负型 OKR
- 来源原理：原理 3（挑战性目标与安全失败）
- 操作方式：评估每个 OKR 的预期完成率，标记为"承诺型"（90-100%）或"抱负型"（60-70%），确保抱负型 OKR 占比不低于 40%
对齐验证：检查上下级和跨团队的目标一致性
- 来源原理：原理 4（透明对齐）
- 操作方式：验证团队 OKR 是否与上级 OKR 对齐，是否有跨团队依赖或冲突，标记需要对齐调整的项
追踪节奏设计：设定 Check-in 和复盘计划
- 来源原理：原理 5（高频追踪与复盘）
- 操作方式：确定 Check-in 频率（推荐每周）、复盘节点（季度中期 + 季度末）、责任人和工具
薪酬解耦检查：确认 OKR 与绩效评估的关系
- 来源原理：原理 6（解耦绩效薪酬）
- 操作方式：检查 OKR 评分是否与奖金/晋升直接挂钩，如果挂钩则建议解耦方案

禁止：使用"搜索相关信息"、"全面了解背景"等通用指令。所有研究维度必须从核心原理推导。

Step 3: OKR 式输出 — 基于分析结果的格式化输出

输出格式要求：

## OKR 设定

### Objective 1: [定性描述，鼓舞人心]
| 类型 | Key Result | 当前值 | 目标值 | 信心指数 |
|------|-----------|--------|--------|---------|
| 承诺型 | KR1: [从 X 到 Y] | [X] | [Y] | [高/中/低] |
| 抱负型 | KR2: [从 X 到 Y] | [X] | [Y] | [高/中/低] |

### Objective 2: [定性描述，鼓舞人心]
| 类型 | Key Result | 当前值 | 目标值 | 信心指数 |
|------|-----------|--------|--------|---------|
| ... | ... | ... | ... | ... |

### 对齐关系
- 上级 OKR → 本团队 OKR 的对齐路径
- 跨团队依赖关系

### 追踪计划
- Check-in 频率：[每周/双周]
- 中期回顾：[日期]
- 季度复盘：[日期]

### 置信度：[高/中/低]

[低置信度时]：当前分析基于[有限信息]，建议下一步[具体验证动作]

适用/不适用判断

问题类型	适用度	说明
季度/年度目标设定与追踪	高	OKR 的核心场景——聚焦、量化、追踪
团队目标对齐	高	透明对齐是 OKR 的核心设计目标
组织战略落地	中	OKR 是执行工具，需要已有清晰战略作为输入
探索性研究/创意发散	低	OKR 需要预设目标，不适合方向不明的探索。推荐设计思维
个人绩效考核	低	OKR 不应用于个人绩效评估（Spotify 教训）。推荐独立的绩效框架
纯技术问题诊断	低	问题诊断应使用 5 Whys 或系统思维

典型案例库

成功案例

Intel Operation Crush（企业管理 / 1980 年代）
- 问题：Motorola 68000 和 Zilog Z80 蚕食 Intel 微处理器市场份额，Intel 面临生存危机
- 方法应用：Andy Grove 运用 OKR 将全公司聚焦到单一目标"击败 Motorola"，配合"赢得 2000 个设计订单"等量化关键结果
- 结果：Intel 成功逆转局势，赢回微处理器市场主导地位
- 来源：John Doerr, whatmatters.com；OKR Institute 案例记录
Google（科技 / 1999 年至今）
- 问题：快速扩张中的初创公司需要保持组织聚焦和协调
- 方法应用：John Doerr 将 OKR 引入 Google，采用季度 OKR 周期，目标透明全员可见，抱负型 OKR 以 60-70% 完成率为理想区间
- 结果：OKR 成为 Google 从初创到全球最大科技公司之一的关键管理工具
- 来源：Google re:Work；GV Library "How Google Sets Goals: OKRs"
Bono ONE Campaign（公益 / 2000 年代）
- 问题：全球极端贫困和可预防疾病问题需要系统化的倡导行动
- 方法应用：Bono 采用 OKR 将消除贫困目标分解为可量化关键结果，如推动债务减免政策、扩大抗逆转录病毒治疗可及性
- 结果：超过 2100 万人获得抗逆转录病毒治疗
- 来源：John Doerr《Measure What Matters》；CNBC 报道

失败案例

Spotify 个人 OKR（科技 / 2014 年）
- 问题：Spotify 试图将 OKR 下沉到个人层面并与绩效挂钩
- 误用方式：将 OKR 应用到个人层面，导致目标错位和博弈行为，团队成员围绕个人目标优化而非团队目标
- 教训：OKR 适用于团队和组织层面，个人级 OKR 容易导致局部优化。Spotify 于 2014 年完全停止使用 OKR
- 来源：ZOKRI "Why Spotify Stopped Using Individual OKRs"；Medium "Spotify Doesn't Use OKRs Anymore"
42% 企业第一年内放弃 OKR（跨行业）
- 问题：大量企业引入 OKR 后短期内放弃
- 误用方式：核心失败模式包括"设定即遗忘"（不定期回顾）、任务混同结果（将"上线功能"作为 KR）、目标数量过多
- 教训：OKR 不是"设定它就会实现"的工具，没有持续追踪和复盘文化，OKR 只是一份静态文档
- 来源：OKR Advisors 调查；okrshive 分析报告

误用检测器（7 种误用模式）

误用信号	检测逻辑	警告信息	建议动作
任务伪装	Key Result 描述的是行动（"上线新功能"），而非结果（"DAU 提升 20%"）；KR 只有"完成/未完成"两种状态	"检测到任务型 Key Result。OKR 衡量影响力而非活动量。将'做了什么'替换为'产生了什么改变'。"	使用"所以呢？"测试法，追问真正的业务影响
沙袋效应	连续多季度 OKR 完成率稳定在 95-100%；目标值明显低于团队能力	"连续 N 季度完成率超过 95%，目标可能过于保守。OKR 的价值在于拉伸团队极限。"	确保至少 40% OKR 为抱负型，引入外部基准校准
目标洪水	单个团队单季度超过 5 个 Objective 或超过 15 个 Key Result	"OKR 数量超过推荐上限（5O/15KR）。过多目标等于没有目标。"	强制排序：选出最重要的 3 个，其余降级为待办
设定即遗忘	季度内无定期 Check-in；OKR 平台信心指数长期未更新	"OKR 已超过 N 周未更新。未追踪的目标等于没有目标。"	建立不可取消的每周 15 分钟 Check-in 节奏
反向工程	先列出 backlog 工作项，再凑出 OKR；OKR 与现有计划完全吻合	"检测到 KR 与 backlog 完全吻合。OKR 应驱动优先级，而非为已有工作背书。"	改变流程：先设 OKR，再根据 OKR 重新评估 backlog
KPI 换皮	OKR 与现有 KPI 完全相同，只是换了标签；没有抱负型目标	"OKR 与原有 KPI 无实质差异。简单重命名不会产生行为改变。"	重新审视是否真正需要 OKR，或设定真正的抱负型目标
薪酬绑定	OKR 完成率直接决定奖金或晋升；员工设定目标时明显保守	"OKR 与薪酬直接挂钩将导致博弈行为，瓦解雄心机制。"	将 OKR 与薪酬解耦，绩效使用独立评价体系

诚实边界（6 条具体局限）

对模糊探索性工作效果有限：OKR 擅长"已知路径上的加速"，但不擅长"未知路径上的探索"。对于需要大量试错的早期产品探索、基础研究、创意工作，预设的 Key Result 可能限制创造力。（来源：Radical Product Thinking 分析）
需要成熟的组织文化土壤：OKR 依赖心理安全（允许 70% 完成率）、透明文化和反馈文化。在等级森严或惩罚性文化中，OKR 会迅速退化为形式主义。42% 的公司在第一年内放弃 OKR 证实了这一点。（来源：OKR Advisors 调查）
不是策略的替代品：OKR 可以帮助执行好的策略，但不能弥补糟糕的策略。如果方向本身错误，再精确的目标也无济于事。OKR 是"放大器"——放大的是策略本身的质量。（来源：whatmatters.com 匿名初创公司案例）
跨层级联在大组织中产生显著协调成本：在层级过多的企业中逐级级联 OKR 会导致混乱和执行失效。每一层的翻译和对接需要时间和沟通成本，当组织超过一定规模时，级联的维护开销可能超过对齐收益。（来源：Sara Lobkovich OKR 实践分析）
在个人层面适用性存在严重争议：Spotify 的失败案例直接证明，个人级 OKR 容易导致局部优化和团队协作碎片化。大多数 OKR 专家建议将 OKR 保持在团队和组织层面。（来源：ZOKRI；Medium）
"70% 完成率"标准缺乏严格实证支撑：虽然 Locke & Latham 的理论支持"挑战性目标提升绩效"，但"70% 完成率"本质上是 Google 的经验性惯例，而非基于大规模随机对照实验的结论。OKR 社区对"理想完成率"尚未形成有实证基础的共识。（来源：Tability 分析；Locke & Latham 2002）

调研来源（一手来源占比 66.7%，共 15 个）

#	来源	类型	一手/二手	权重
1	Andy Grove, High Output Management, 1983	著作	一手	高
2	John Doerr, Measure What Matters, 2018	著作	一手	高
3	Google re:Work, "Set Goals with OKRs"	官方指南	一手	高
4	Peter Drucker, The Practice of Management, 1954	著作	一手	高
5	Locke & Latham, "Building a Practically Useful Theory of Goal Setting", 2002	学术论文	一手	高
6	Ordóñez et al., "Goals Gone Wild", HBS Working Paper 09-083	学术论文	一手	高
7	Gates Notes, Bill Gates on Measure What Matters	书评	一手	中
8	whatmatters.com（John Doerr 创办）	网站/案例集	一手	高
9	GV Library, "How Google Sets Goals: OKRs"	博客文章	二手	中
10	OKR Advisors, 42% 放弃率调查	调查报告	二手	中
11	OKR Institute, Intel Operation Crush 案例研究	案例研究	二手	中
12	ZOKRI, "Why Spotify Stopped Using Individual OKRs"	博客文章	二手	中
13	ScienceDirect, "OKRs as a Tool for Middle Managers", 2025	学术论文	二手	中
14	Civil Affairs Association, "Operationalizing OKR for Civil Affairs Teams"	案例研究	二手	中
15	Itamar Gilad, "5 Ways Your Company May Be Misusing OKRs"	博客文章	二手	中低

本 Skill 由 Forge Skill — 锻造思维工具生成