Claude Code Skills 完全指南

作者: 一只阿木木 | 来源:发表于2026-03-21 23:13 被阅读0次

R语言书籍一本一本收集
《完全写作指南》——不完全写作指南
Claude Debussy
【转载】JavaScript 风格指南
iOS开发：Code Review 指南
Chapter 23. Negotiation and Lead
Android GoogleMap不完全指南（三）
如何进行ios深入学习
IOS新技术的学习
[2020]《本事 : 应对未来世界的12项永久技能》作者: [

Claude Code Skills 完全指南

写在前面：我的内容哲学

不写"10 个技巧"，只写"1 个框架"。不制造焦虑，而是提供可在自己项目中立刻验证的思维模型。

每篇文章的统一结构：

text

1. 核心问题 —— 这篇解决什么认知缺口？
2. 原理框架 —— 给读者一个可复用的思维模型
3. 真实案例 —— 从第一手实践中提取，附完整代码
4. 常见误区 —— 你以为对的，但实际是错的
5. 行动清单 —— 读完立刻能做的 3 件事

这不是 10 篇独立文章，而是一套完整的知识体系。它们之间有严格的递进关系：

text

理解本质 → 掌握设计 → 实战构建 → 工程化管理 → 组织级扩展

第 1 篇

「Skill 的本质：为什么一个 Markdown 文件能改变 AI 的行为？」

核心问题

大多数人对 Skills 的理解停留在表面——"装上就好了"。但从来没有人真正解释清楚：一个 Markdown 文件是如何在底层改变模型行为的？ 理解这个原理，才能设计出真正有效的 Skill。

原理框架：「三层加载模型」

Skills 围绕渐进式披露（progressive disclosure）构建。Claude 分三个阶段获取信息：第一层是元数据（name + description），始终在 Claude 的上下文中，大约 100 个 token。Claude 仅基于此决定是否加载一个 Skill。

完整指令仅在 Claude 判断该 Skill 相关时才加载（不超过 5,000 token）。支持脚本和文件仅在被明确需要时才加载。这意味着你可以安装几十个 Skills 而不影响无关任务的性能。

这揭示了一个深刻的设计哲学：Skills 本质上是 prompt injections。它们是 Markdown 文件，存放在你的 ~/.claude/skills/ 目录中，在触发时被加载到 Claude 的上下文中。它们引导模型的行为——语气、结构、优先级、输出格式。没有什么比这更魔法的了。

真实案例：同一个任务，有 Skill 和无 Skill 的认知鸿沟

一位开发者构建了一个"商业模型审查"Skill，迫使模型在分析任何内容之前先深入单位经济学。没有 Skill 时，Claude Code 给出了平衡、礼貌、但毫无用处的概述。有了 Skill，它发现一个 $39/月的 SaaS 甚至无法覆盖其每用户的计算成本。这就是区别。

没有 Skills 的 Claude Code 是一个没有你偏好记忆的杰出通才——一个极其聪明的新员工，但每周一都要问你报告格式。

常见误区

误区 1：Skills 是高级版提示词

不完全正确。Skills 添加了可选功能：支持文件的目录、用于控制谁调用它们的 frontmatter，以及让 Claude 在相关时自动加载的能力。它们是可版本化、可测试、可组合的知识单元，而不仅仅是一段文字。

误区 2：装得越多越好

一位作者安装了全部 47 个（某合集的）Skills，对每一个与原始 Claude Code 输出进行了测试。其中 40 个让输出变得更差。围绕 Skills 有太多科技圈的炒作，几乎不可能把有效的和无用的分开。

行动清单

理解 → 打开你安装的任何一个 Skill 文件夹，阅读 SKILL.md 的 frontmatter 和正文，理解"元数据"与"指令"的分离
实验 → 对同一个任务，分别在有 Skill 和无 Skill 下运行，截图对比输出差异
删除 → 卸载所有你从未验证过效果的 Skills，只保留经过 Before/After 测试的

第 2 篇

「Description 设计的科学：为什么你的 Skill 永远不触发？」

核心问题

第一次直接写 SKILL.md 时会遇到问题。如果 description 设计不好，Skill 甚至不会触发。应该在写提示或代码之前花时间设计。

这是每一个 Skill 构建者必然会遇到的第一个坎：你精心编写的 Skill 为什么被 Claude 无视了？

原理框架：「触发机制模型」

Skills 以列表形式存在于 Claude 可见的系统提示中。当你输入请求时，模型基于你的词句与 Skill 的 description 之间的模式匹配来决定是否调用该 Skill。这是概率性的，不是确定性的。没有保证你的 Skill 一定会触发。

而且更关键的是：Claude 倾向于对简单任务自己处理而不调用 Skills。它默认不触发。所以你的 description 需要足够具体，让 Claude 认识到"这是 Skill 的工作，不是我自己能做的"。description 需要有一定的"推动性"。

真实案例：200+ 提示的实测数据

一位测试者写了一个 CPO 审查 Skill，精心设计了 description。然后运行了 20 个显然应该触发它的不同提示——"做一个 CPO 审查"、"给我一个 go/no-go 评估"、"找出这个产品策略的漏洞"。触发率远低于预期。

Bad vs Good description 对比框架：

Bad——太模糊，Claude 不知道何时触发：name: data-helper / description: Helps with data tasks。Good——具体的触发条件，略带"推动性"：name: sales-data-analyzer / description: Analyze sales/revenue CSV and Excel files to find patterns, calculate me...

框架：Description 设计的四要素

text

一个优秀的 description = 
  ① 具体动作（"Analyze sales CSV"，不是"Help with data"）
  ② 具体触发词（"Use when user mentions sales data, revenue analysis"）
  ③ 边界声明（"Only for CSV and Excel files, not SQL queries"）
  ④ 推动性措辞（让 Claude 意识到这不是它可以自己做的简单任务）

常见误区

误区：Description 是给人读的摘要

Skill 的 description 字段是触发器，不是摘要——为模型而写（"我什么时候该触发？"）。这是反直觉的：大多数人把 description 写成给人类看的产品介绍，但它的读者是模型本身。

行动清单

审计 → 检查你所有 Skill 的 description，用"四要素框架"逐一评分
测试 → 对每个 Skill，写 10 个你认为应该触发它的自然语言提示，记录实际触发率
迭代 → 对触发率低于 70% 的 Skill，重写 description，加入具体触发词和推动性措辞

第 3 篇

「从零构建一个生产级 Skill：三种设计模式的选择与实战」

核心问题

知道 Skill 是什么和怎么触发之后，下一个问题是：怎么设计一个真正有用的 Skill？ 不是 demo 级别的，而是可以在真实工作中每天使用的。

原理框架：「三种模式决策树」

需要与外部 API 实时通信？→ Pattern C。需要确定性处理如计算、验证或文件转换？→ Pattern B。Claude 的语言能力和判断力可以独立处理？→ Pattern A。当犹豫不决时，从 Pattern A 开始。后续很容易添加脚本演进为 Pattern B。但简化一个过于复杂的 Skill 更难。

Pattern A：纯 Markdown

最简模式。仅 Markdown 指令，无脚本。适用于：品牌指南、编码标准、审查清单、提交信息格式化、写作风格约束。使用条件：Claude 的语言能力和判断力足以胜任任务。

Pattern B：Markdown + 脚本

SKILL.md 定义"何时与为何"，脚本处理"如何"。

Pattern C：MCP/子代理

该模式从 Skill 的工作流中调用 MCP 服务器或子代理。适用于涉及外部服务的工作流——如创建 Issue → 创建分支 → 修复代码 → 打开 PR。更多活动部件意味着更多需要调试的东西，所以建议先熟悉 Pattern A 或 B。

真实案例：电商 KPI 分析 Skill 从设计到交付

第一步是定义 2-3 个具体用例。不是抽象的"有用的 Skill"，而是你在实践中观察到的真实重复性工作。一位开发者注意到许多同事在重复做每月和每季度的业务回顾。在电商和零售行业，KPI 分解过程遵循类似模式。这成为起点。他定义为："一个接收订单 CSV 数据、将 KPI 分解为树状结构、总结发现与优先级、并生成具体行动计划的 Skill"。

构建流程的完整展示

text

第 1 步：用例定义
  ✦ "月度电商 KPI 回顾" — 输入 CSV，输出分析报告 + 行动计划
  ✦ "季度业绩对比" — 输入两个月的数据，输出趋势分析
  ✦ "异常检测" — 识别 KPI 异常下降并归因

第 2 步：模式选择 → Pattern B
  ✦ 需要 Python 脚本做 CSV 解析和数值计算（确定性处理）
  ✦ 但分析洞察和行动建议依赖 Claude 的判断力
  ✦ → SKILL.md（指令）+ scripts/parse_csv.py（处理）

第 3 步：Description 设计
  ✦ 具体动作 + 触发词 + 推动性措辞
  ✦ "Analyze e-commerce order data from CSV/Excel files. 
     Use when user mentions orders, revenue, GMV, conversion, 
     retention, or asks for monthly/quarterly business review."

第 4 步：测试 → 10 条提示 → 记录触发率 → 迭代
第 5 步：Gotchas 部分 → 记录 Claude 的失败点

常见误区

误区：一个 Skill 什么都做

为不同工作流创建独立 Skills。不要在 Skill 中陈述显而易见的事情——聚焦于推动 Claude 偏离默认行为的内容。多个聚焦的 Skills 比一个大而全的 Skill 组合得更好。

行动清单

观察 → 这周记录你重复做了 3 次以上的同一类任务
定义 → 为其中一个任务写出 2-3 个具体用例
构建 → 从 Pattern A 开始，写一个最简 Skill，测试并迭代

第 4 篇

「Skill 设计的 5 种架构模式：从 Google、Anthropic 和 McKinsey 的实践中提炼」

核心问题

有了基础的 A/B/C 模式后，进阶的问题是：Skill 的内容应该怎么组织？ 不是"放什么指令"，而是"指令之间的结构关系"。这是从"能用"到"好用"的关键跃迁。

原理框架：「五种架构模式」

通过研究跨生态系统的 Skill 构建方式，从 Anthropic 的仓库到 Vercel 和 Google 的内部指南，有五种反复出现的设计模式可以帮助开发者构建 Agent。

模式 1：Tool Wrapper（工具包装器）

Tool Wrapper 给你的 Agent 提供针对特定库的按需上下文。不是将 API 约定硬编码到系统提示中，而是将它们打包成 Skill。Agent 仅在实际使用该技术时才加载此上下文。这是最简单的实现模式。SKILL.md 文件监听用户提示中的特定库关键词，从 references/ 目录动态加载你的内部文档，并将这些规则作为绝对真理应用。

模式 2：Reviewer（审查器）

审查器模式将"检查什么"和"如何检查"分离。不是在长系统提示中详述每个代码味道，而是将模块化的评分标准存储在 references/review-checklist.md 中。当用户提交代码时，Agent 加载这个清单并系统地评分，按严重程度分组。如果你将 Python 代码风格清单换成 OWASP 安全清单，你就得到了一个完全不同的专业审计——使用完全相同的 Skill 基础设施。

模式 3：Pipeline（管道）

在报告生成器示例中，Skill 文件不包含实际的布局或语法规则。它只是协调这些资产的检索，并强制 Agent 逐步执行它们。

模式 4：Inversion（反转）

反转模式翻转了常规动态。不是用户驱动提示、Agent 执行，而是 Agent 充当采访者。反转依赖于明确的、不可协商的门控指令（如"在所有阶段完成之前不要开始构建"），强制 Agent 先收集上下文。它按顺序提出结构化问题，并等待你的回答后才进入下一阶段。

模式 5：Generator（生成器）

接收变量输入，基于模板和规则生成结构化输出。

关键洞察：模式可组合

这些模式不是互斥的。它们可以组合。一个 Pipeline Skill 可以在末尾包含 Reviewer 步骤来复查自己的工作。一个 Generator 可以在开头依赖 Inversion 来收集必要变量，然后再填充模板。

行动清单

分类 → 用这五种模式重新分类你已有的 Skills，看看你最依赖哪种
组合 → 尝试在一个 Pipeline Skill 末尾加入 Reviewer 步骤
设计 → 下次构建新 Skill 时，先画出模式草图，再动手写 SKILL.md

第 5 篇

「Context Engineering：管理 Claude 最稀缺的资源」

核心问题

大多数 Claude Code 最佳实践都基于一个约束：Claude 的上下文窗口填满得很快，性能会随着填充而下降。Claude 的上下文窗口保存你整个对话的内容——每条消息、每个 Claude 读取的文件、每个命令输出。这很快就能填满。一次调试或代码库探索可能就产生和消耗数万个 token。当上下文窗口接近满时，Claude 可能开始"遗忘"早期指令或犯更多错误。上下文窗口是最重要的需要管理的资源。

原理框架：「三层上下文模型」

使用 Claude Code 成功的关键根本在于上下文工程。不仅是问对问题——而是提供正确的知识基础。有效的 AI 辅助开发需要三个核心组件：a) 项目架构知识——对类层次结构、库、框架和设计模式的理解，主要存储在 CLAUDE 文件中。b) 产品需求文档——产品应该做什么的清晰规格，存储在 *.prd.md 文件中。c) 深层技术知识——对核心技术、数学概念、算法和关键中间件的专业理解。

真实案例：从"困惑的初级开发者"到"知识渊博的架构师"

当为特定技术创建了专门的知识文件后，上下文从根本上转变了 AI 助手——从一个困惑的初级开发者变成一个知识渊博的架构师。在 Claude Code 中，注入上下文很简单：只需提示 Read @ditto-advanced-knowledge.md and understand。回报是：以前需要数天试错的功能现在几小时就能交付。AI 会建议你自己想不到的优化。最重要的是，它理解你的特定用例，而不是给出通用建议。

关键警告

知识文档中的幻觉是灾难性的——它们随每次使用而累积。生成任何知识文件后，必须彻底审查和调整，更好的做法是让领域专家验证。一个错误的 API 模式在你的知识文件中意味着未来每个实现都会出错。当知识文件超过 50KB（约 12,000 token）时，你有可能在实际编码开始之前就耗尽上下文 token。

框架：Context Engineering 的四原则

text

原则 1：分而治之
  ✦ 不要把所有上下文塞进一个 CLAUDE.md
  ✦ 按功能分多个知识文件，按需加载

原则 2：知识文件 ≠ 代码文档
  ✦ 知识文件是为 Claude 写的，不是为人类写的
  ✦ 重点放在决策逻辑和常见陷阱上

原则 3：定期 /clear
  ✦ 每 30-45 分钟清理一次上下文
  ✦ 用文件保存中间成果，而非依赖对话记忆

原则 4：宁精勿多
  ✦ Claude 读取的每个字节都是你的成本
  ✦ 一个精炼的 500 行 Skill > 一个臃肿的 2000 行 Skill

行动清单

度量 → 下次长会话结束时，检查你用了多少 token，找到浪费最大的环节
分解 → 将你的 CLAUDE.md 拆分成 3-5 个按需加载的知识文件
验证 → 请领域专家审查你的知识文件，标记每一个可能的幻觉

第 6 篇

「Command → Agent → Skill：编排模式完全指南」

核心问题

单个 Skill 解决单个任务。但真实工作是多步骤、跨角色的。如何把多个 Skills 编排成一个完整的工作流？

原理框架：McKinsey 的确定性编排模型

编排层应保持确定性。Agent 不应该决定下一步是什么或产物应该存放在哪里。应使用确定性工作流引擎，遵循预定义规则将工作推进各阶段。这是一个关键的设计选择。早期实验中，让 Agent 自行编排——决定何时从需求进入设计，或该做哪个任务——在小项目上可行。但在有横切关注点和多个进行中功能的大型代码库中，Agent 经常跳过步骤、创建循环依赖或陷入分析循环。Agent 擅长在有界问题内生成内容；它们在工作流排序的元级决策上很吃力。

Claude Code 的原生编排架构

一个完整的 Command → Agent → Skill 编排架构示例：/weather-orchestrator command 作为入口点——询问用户 C/F 偏好、调用 agent、然后调用 SVG skill。weather-agent 使用预加载的 weather-fetcher skill 获取温度。weather-svg-creator skill 创建 SVG 天气卡片。

使用多个 CLAUDE.md 管理 monorepo——祖先 + 后代加载。创建功能特定的子代理（额外上下文）配合 Skills（渐进式披露），而非通用的 QA、后端工程师代理。使用 context: fork 在隔离的子代理中运行 Skill——主上下文只看到最终结果，不包括中间工具调用。

真实案例：多 Agent 系统 vs 单 Agent 的效果对比

在实际项目的多个非简单开发任务中，将多 Agent 上下文工程方法与单 Agent 基线（仅有 CLAUDE.md 上下文和直接用户提示）进行对比。简而言之，多 Agent 方法在更多任务中成功，且需要更少的迭代。它通常在首次尝试时就产出可用的解决方案，而基线经常需要后续提示或开发者干预来修正错误。

编排设计的核心原则

现代 Agent 平台正趋同于 Agent Skills：可复用的模块化指令（通常是 SKILL.md 文件），编码领域特定的专业知识。每个专门化的 Agent 本质上就是一个 Skill——一组有界的指令、模板和特定类型工作的评估标准。每种产物类型都有结构化模板和完成的定义。需求、设计和任务不是自由格式文本，而是具有一致结构的产物。

行动清单

拆分 → 将你一个复杂 Skill 拆成 Command（入口）+ Agent（角色）+ Skill（能力）三层
隔离 → 用 context: fork 确保子代理的中间过程不污染主上下文
确定性 → 编排逻辑不要让 Claude 决定，用明确的步骤顺序写死

第 7 篇

「知识管理系统：用 Claude Code 构建可复利增长的项目上下文」

核心问题

使用越多，就构建出越好的流程和模式，彼此之间不断累积。这种复合效应是 Claude Code 与其他 AI 工具的根本区别。你创建的每个文档、优化的每个流程、捕获的每条指令，都成为不断增长的知识库的一部分，使下一次交互更有价值。与静态工具或孤立的聊天会话不同，这个系统使用越久越善于帮助你。

原理框架：知识管理的文件系统架构

为应对这些挑战，必须构建结构化的知识管理系统。一个经过验证的目录结构如下：

text

project-root/
├── CLAUDE.md                         # 主配置
└── .claude/
    ├── context.md                    # 项目背景与约束
    ├── project-knowledge.md          # 技术知识与模式
    ├── project-improvements.md       # 改进历史与教训
    ├── common-patterns.md            # 常用命令模式
    └── debug-log.md                  # 重要调试记录

Knowledge Management System 使用以下文件系统化管理知识：context.md——项目背景、目标和约束、技术栈选择原因、业务需求和技术约束。project-knowledge.md——实现模式和设计决策知识、架构选择的原因、需要避免的模式和反模式。project-improvements.md——过去试错的记录、失败实现及其原因、改进过程和结果。重要：当做出新的实现或重大决策时，更新相关文件。

真实案例：独立顾问的知识管理实践

一位顾问在每个客户文件夹中设置 CLAUDE.md 文件——Claude 读取的指令文件。它们包含客户背景、沟通偏好、文档模板、业务术语和写作风格指南。你可以随着 Claude 对你工作方式的了解而更新它们。他还设置了自动工作日志生成——在重要工作（会议、文档、研究）后触发更新，以结构化摘要随时间构建上下文。

另一个更完整的系统是 Obsidian + Claude Code 的个人知识管理启动套件：早上——/daily 创建今日笔记，显示本周的一个大目标和活跃项目的下一步行动。你选择你的焦点。晚上——/daily 总结今天哪些目标和项目得到了关注。未关联的任务被标记。周日——/weekly 读取所有每日笔记、扫描项目状态、计算目标进度，并帮你规划下周。月末——/monthly 汇总每周复盘，对照年度目标检查季度里程碑，并设定下月优先级。

行动清单

初始化 → 在你的项目中创建上述 5 个知识文件，各填入 3-5 条核心内容
习惯化 → 每次重大决策后，立即更新 project-knowledge.md
自动化 → 创建 /update-knowledge 命令，让 Claude 在会话结束时自动提取值得记录的内容

第 8 篇

「Workflow vs Agent vs Skill：什么时候该用什么？」

核心问题

最常见的架构错误不是技术问题，而是在不该用 Agent 的地方用了 Agent，或在该用 Skill 的地方硬写了 Workflow。

原理框架：「决策评分系统」

Anthropic 工程博客提出了一个很好的心智模型：用 Workflow 为可预测的事物构建结构，用 Agent 探索不可预测的事物。大多数现实世界的 AI 系统是混合的——其中很多严重依赖 Workflow，因为生产环境不奖励聪明，它奖励韧性。

成本是决策的核心：根据 Anthropic 的研究，Agent 消耗的 token 是简单聊天交互的 4 倍。多 Agent 系统？试试 15 倍。这不是 bug——这就是重点。它们循环、推理、重新评估，通常与自己对话多次才得出决定。如果 Agent 陷入工具调用循环或误解指令？你会看到账单仪表盘出现类似加密货币暴涨的尖峰。

调试差异更大：对 Workflow，调试就像走过一栋灯火通明的房子，你可以追踪输入 → 函数 → 输出。简单。对 Agent？更像在一片未标记的森林中游荡，而且树偶尔会自己重新排列。

框架：三者的精确定位

维度	Skill	Workflow	Agent
本质	知识注入	确定性编排	自主决策
控制权	Claude 判断何时加载	你定义每一步	Claude 决定下一步
token 成本	低（仅相关时加载）	可预测	4-15 倍于基线
调试难度	低	低	高
适用场景	重复任务的标准化	固定流程的自动化	需探索和判断的开放任务

框架容易让人在简单方案足够时添加不必要的复杂性。Anthropic 建议开发者从直接使用 LLM API 开始：许多模式可以用几行代码实现。

常见误区

大多数糟糕的架构决策不是源于知识不足——而是来自行动太快。在一次同步会议上，有人说"这感觉对 Workflow 来说太动态了——也许我们直接用 Agent？"所有人点头。听起来合理。Agent 很灵活，对吧？快进三个月：系统在奇怪的地方循环，日志不可读，成本飙升，没人记得是谁建议用 Agent 的了。

行动清单

评估 → 对你当前的每个自动化任务，用上表判断它属于 Skill / Workflow / Agent
降级 → 如果有任何 Agent 方案可以用 Skill + Workflow 替代，立即降级
原则 → 新任务默认从 Skill 开始，证明不够用时才升级到 Agent

第 9 篇

「团队级 Skill 系统：从个人工具到组织知识资产」

核心问题

个人 Skill 解决个人效率问题。但真正的价值在于：当你离职后，你的 Skill 还能帮助团队吗？ 如何将个人隐性知识变成组织显性资产？

原理框架：Agent 工程化的组织模型

与最初级的开发者不同，AI Agent 不带任何背景知识、对过往项目的直觉、或通过耳濡目染习得规范的能力。每一条指南都必须明确且机器可读。现代 Agent 平台正趋同于 Agent Skills：可复用的模块化指令（通常是 SKILL.md 文件），编码领域特定的专业知识。每个专门化的 Agent 本质上就是一个 Skill。

当编排器调用某个 Agent 处理任务时，该 Agent 仅接收与其任务相关的信息（加上持久化的项目上下文），不会看到完整对话历史或无关数据。这种设计是有意的：防止不同工作流阶段之间的交叉污染，保持每个 Agent 的专注。所有 Agent 应知道的共同背景信息（编码约定、项目架构说明等）通过持久化上下文文件（CLAUDE.md）提供，预加载到每个 Agent 的上下文中。

框架：团队 Skill 系统的四层架构

text

第 1 层：个人 Skills（~/.claude/skills/）
  ✦ 个人偏好、工作习惯、常用模式
  ✦ 仅影响自己

第 2 层：项目 Skills（.claude/skills/）
  ✦ 项目编码规范、架构约定、部署流程
  ✦ 通过 git 与团队共享

第 3 层：组织 Skills（通过插件/Registry 分发）
  ✦ 跨项目的标准化工作流
  ✦ 品牌指南、安全审查、合规检查

第 4 层：社区 Skills（开放标准）
  ✦ 行业最佳实践
  ✦ 跨平台兼容

Claude Code Skills 遵循 Agent Skills 开放标准，该标准可跨多个 AI 工具使用。

真实案例：功能特定 Agent 的最佳实践

Agent 的完整配置包括：skills——预加载到 Agent 上下文的 Skill 名称列表；mcpServers——该子代理的 MCP 服务器；hooks——作用于该子代理的生命周期钩子（PreToolUse、PostToolUse 和 Stop 最常用）；memory——持久记忆范围：user、project 或 local；isolation——设为 "worktree" 可在临时 git worktree 中运行。

行动清单

盘点 → 列出你团队中每个人私下使用的 AI 提示和工作流
标准化 → 选出最有价值的 3 个，转化为项目级 Skills（放入 .claude/skills/，提交 git）
制度化 → 建立"新知识 → 新 Skill"的团队流程：每次发现有价值的工作模式，立即创建或更新 Skill

第 10 篇

「全景图：2026 年 AI Agent 工具链的终极指南与选择框架」

核心问题

Skills、MCP、Hooks、Subagents、Commands、CLAUDE.md——这些概念之间到底是什么关系？什么时候该用哪个？这篇文章提供一个完整的心智地图，把所有碎片拼在一起。

原理框架：「分层协同模型」

Context Engineering 是构建有效 AI 应用的核心学科。通过适当使用 Skills、MCP 和 Subagents，遵循工具设计和评估的最佳实践，你可以充分释放 Claude 的潜力，构建真正生产就绪的 Agent 系统。
完整的协同模型：

text

┌─────────────────────────────────────────────┐
│              CLAUDE.md（持久上下文）           │  ← 始终加载
│  项目架构 · 编码规范 · 团队约定               │
├─────────────────────────────────────────────┤
│           Skills（按需知识注入）               │  ← 相关时加载
│  工作流指令 · 审查标准 · 输出模板             │
├─────────────────────────────────────────────┤
│           MCP（外部能力连接）                  │  ← 工具调用时激活
│  数据库 · API · 文件系统 · 第三方服务         │
├─────────────────────────────────────────────┤
│        Subagents（隔离执行单元）               │  ← 委派时创建
│  独立上下文 · 并行执行 · 结果返回             │
├─────────────────────────────────────────────┤
│         Hooks（确定性守卫）                    │  ← 生命周期自动触发
│  安全检查 · 格式验证 · 自动提交               │
└─────────────────────────────────────────────┘

每层的精确定位：

Skills 是指令、脚本和资源的文件夹，Claude 可以动态发现和加载。你可以把它们看作"专业知识包"，通过一致的高质量输出提升组织级生产力。

Hooks 用于必须每次都发生、零例外的操作。Hooks 在 Claude 工作流的特定节点自动运行脚本。与 CLAUDE.md 指令（只是建议性的）不同，Hooks 是确定性的，保证操作一定发生。

一个有用的类比：MCP 是厨房——刀、锅、食材。Skill 是告诉你如何使用它们的食谱。两者可以组合。Sentry 的代码审查 Skill 在 Skill 中定义 PR 分析工作流，并通过 MCP 获取错误数据。但在许多情况下，仅一个 Skill 就足够开始了。

选择框架：「5 个问题决策树」

text

问题 1：这个知识需要每次对话都存在吗？
  → 是 → CLAUDE.md
  → 否 → 继续

问题 2：这是一个可重复的工作流或标准？
  → 是 → Skill
  → 否 → 继续

问题 3：需要连接外部系统或 API？
  → 是 → MCP（可配合 Skill）
  → 否 → 继续

问题 4：这个任务必须每次都执行，零容忍？
  → 是 → Hook
  → 否 → 继续

问题 5：任务需要独立上下文、防止污染主对话？
  → 是 → Subagent
  → 否 → 直接在主会话中处理

行动清单

画图 → 用上面的分层模型，把你当前项目中的所有 AI 配置归类，看是否有错位
精简 → 如果有 Skill 在做 Hook 该做的事（如代码格式化），迁移到 Hook
打印 → 把"5 个问题决策树"打印贴在电脑旁，每次新建配置时先过一遍

🗺️ 10 篇文章的知识地图

text

基础认知层
  ├── 第 1 篇：Skill 的本质（它是什么）
  └── 第 2 篇：Description 的科学（为什么不触发）

设计能力层
  ├── 第 3 篇：三种设计模式（A/B/C 怎么选）
  └── 第 4 篇：五种架构模式（内容怎么组织）

工程实践层
  ├── 第 5 篇：Context Engineering（管理稀缺资源）
  └── 第 6 篇：编排模式（多 Skill 如何协同）

系统构建层
  ├── 第 7 篇：知识管理系统（复利增长）
  └── 第 8 篇：Workflow vs Agent vs Skill（不要过度工程化）

组织级扩展层
  ├── 第 9 篇：团队 Skill 系统（从个人到组织）
  └── 第 10 篇：全景图（把所有碎片拼在一起）

R语言书籍一本一本收集
Programming Skills for Data Science: Start Writing Code t...
《完全写作指南》——不完全写作指南
《完全写作指南》——不完全写作指南不要误会，这里所指“不完全写作指南”不是说指南的内容不够全面，而是觉得这份指南...
Claude Debussy
阿希爾-克洛德·德布西（法語：Achille-Claude Debussy，法語發音：[aʃil klod dəb...
【转载】JavaScript 风格指南
原文：JavaScript 风格指南[https://github.com/alivebao/clean-code...
iOS开发：Code Review 指南
杏仁医生 iOS 端 Code Review 指南。转载注明出处指南不仅针对 Review 者，提交代码前，自...
Chapter 23. Negotiation and Lead
Negotiation and leadership skills are hard skills to obta...
Android GoogleMap不完全指南（三）
Android GoogleMap不完全指南（一）Android GoogleMap不完全指南（二）在前两篇...
如何进行ios深入学习
ios技术的学习官方文档 sample Code (示例代码)Guides(指南)Reference(API参考...
IOS新技术的学习
ios的技术的学习 -官方文档-Sample Code (示例代码)-Guides（指南）-Reference(A...
[2020]《本事 : 应对未来世界的12项永久技能》作者: [
原作名:Forever Skills: The 12 Skills to Futureproof Yourself...

Claude Code Skills 完全指南

Claude Code Skills 完全指南

写在前面：我的内容哲学

第 1 篇

「Skill 的本质：为什么一个 Markdown 文件能改变 AI 的行为？」

核心问题

原理框架：「三层加载模型」

真实案例：同一个任务，有 Skill 和无 Skill 的认知鸿沟

常见误区

行动清单

第 2 篇

「Description 设计的科学：为什么你的 Skill 永远不触发？」

核心问题

原理框架：「触发机制模型」

真实案例：200+ 提示的实测数据

框架：Description 设计的四要素

常见误区

行动清单

第 3 篇

「从零构建一个生产级 Skill：三种设计模式的选择与实战」

核心问题

原理框架：「三种模式决策树」

真实案例：电商 KPI 分析 Skill 从设计到交付

构建流程的完整展示

常见误区

行动清单

第 4 篇

「Skill 设计的 5 种架构模式：从 Google、Anthropic 和 McKinsey 的实践中提炼」

核心问题

原理框架：「五种架构模式」

关键洞察：模式可组合

行动清单

第 5 篇

「Context Engineering：管理 Claude 最稀缺的资源」

核心问题

原理框架：「三层上下文模型」

真实案例：从"困惑的初级开发者"到"知识渊博的架构师"

关键警告

框架：Context Engineering 的四原则

行动清单

第 6 篇

「Command → Agent → Skill：编排模式完全指南」

核心问题

原理框架：McKinsey 的确定性编排模型

Claude Code 的原生编排架构

真实案例：多 Agent 系统 vs 单 Agent 的效果对比

编排设计的核心原则

行动清单

第 7 篇

「知识管理系统：用 Claude Code 构建可复利增长的项目上下文」

核心问题

原理框架：知识管理的文件系统架构

真实案例：独立顾问的知识管理实践

行动清单

第 8 篇

「Workflow vs Agent vs Skill：什么时候该用什么？」

核心问题

原理框架：「决策评分系统」

框架：三者的精确定位

常见误区

行动清单

第 9 篇

「团队级 Skill 系统：从个人工具到组织知识资产」

核心问题

原理框架：Agent 工程化的组织模型

框架：团队 Skill 系统的四层架构

真实案例：功能特定 Agent 的最佳实践

行动清单

第 10 篇

「全景图：2026 年 AI Agent 工具链的终极指南与选择框架」

核心问题

原理框架：「分层协同模型」

选择框架：「5 个问题决策树」

行动清单

🗺️ 10 篇文章的知识地图

相关文章

网友评论

延伸阅读

深度阅读

栏目导航