

——本文在顶级大神Andrej Karpathy 广为流传的 AI 编码规矩基础上进行了扩张,引入了 8 条非凡准则,旨在大幅缩短 Claude 在处理复杂、多设施 Agent 任务时的失实率。
4 条 CLAUDE.md 规矩将 Claude 出错率从 41% 降至 11%——历经 30 个代码库,我又补充了 8 条
进程 6 周、覆盖 30 个代码库的实测,将出错率从 41% 压缩到 3%。以下是完好的 12 条文定、每一条背后的真实阅历,以及原始 4 条文定悄然失效的 4 个场景。
布景
2026 年 1 月底,Andrej Karpathy 公开仇怨 Claude 写代码的三大恶疾:沉默作念出失实假定、过度复杂化、以及误伤不该动的代码。
Forrest Chang 读完帖子后,把这些仇怨索求成 4 条行为规矩,打包进一个 CLAUDE.md 文献并发布到 GitHub。第一天就收货了 5,828 个 Star,两周内被保藏 6 万次,现在已蹧蹋 12 万 Star——2026 年增长最快的单文献仓库。

我在 30 个代码库上实测了 6 周。
4 条文定如实灵验。在它们能覆盖的场景里,原先约 40% 的出错率降到了 3% 以下。但这套模板是为确立 1 月份的代码编写问题而生的。
2026 年 5 月的 Claude Code 生态已天壤之隔——Agent 彼此骚动、Hook 级联触发、技巧加载冲突、跨会话多设施责任流断链。
尊龙凯时中国官网入口于是我非凡补充了 8 条文定。下文将逐个拆解:完好的 12 条 CLAUDE.md、每条文定背后的一脉相承,以及原始 Karpathy 模板悄然失效的 4 个盲区。
如若只想平直复制使用,完好文献在文末。
为什么值得爱重
CLAUDE.md 是扫数这个词 AI 编程器用链中被严重低估的一个文献。大大量开拓者要么:
把它当成偏好垃圾桶,堆到 4,000+ Token,顺从率跌至 30%;
实足跳过,每次手动辅导——Token 销耗 5 倍,会话间毫无一致性;
复制一个模板就放着岂论。能用两周,然后随代码库变化偷偷失效。
Anthropic 官方文档明确评释:CLAUDE.md 是建议性的,Claude 的顺从率约为 80%。向上 200 行后,顺从率会急剧下跌,因为热切规矩被消亡在杂音里。
Karpathy 的模板用一个文献、65 行、4 条文定措置了这个问题。这是下限。
上限还更高。再加 8 条文定,覆盖的就不仅仅 Karpathy 那时仇怨的代码编写问题,还包括那时还不存在的 Agent 编排问题。
原始 4 条文定
规矩 1 — 先想表示再脱手 不作念隐性假定。把假定说出来。点明量度弃取。遭受不笃定的先问,而不是猜。有更粗浅的决议时主动提议。
规矩 2 — 粗浅优先 用最少的代码措置问题。不加投契性功能。单次使用的代码不要搞玄虚。如若一个资深工程师会说"过度遐想"——就简化。
规矩 3 — 精确转变 只动必须动的地方。不要"顺遂优化"附进代码、注视或阵势。不重构莫得问题的东西。保抓现存格调。
规矩 4 — 规画导向践诺 界说告成设施。轮回直到考据通过。不要告诉 Claude 该走哪些设施,告诉它告成是什么表情,让它我方迭代。
这四条关闭了约 40% 的失控场景。剩下约 60% 藏鄙人面的盲区里。

我补充的 8 条文定(过火原因)
每一条王人源于 Karpathy 那 4 条不够用的真及时刻。
规矩 5 — 不要让模子作念非讲话责任
Karpathy 的规矩对此只字未提。当模子被拿来决定"该不该重试 API 调用"、"如何路由音书"、"何时升级处理",肃除是每周给出不同决定——用 $0.003/Token 的价钱买了一堆迅速 if-else。
触发时刻: 调用 Claude 来"判断 503 要不要重试"的代码运行邃密了两周,然后启动抽风——因为模子启动把肯求体动作决策高下文来读,重试战略变得实足迅速。
规矩 6 — 诞生硬性 Token 预算,莫得例外
莫得预算的 CLAUDE.md 是一张空缺支票。每个轮回王人可能螺旋成 5 万 Token 的高下文垃圾场。模子不会自动停。
触发时刻: 一次调试会话跑了 90 分钟。模子安逸地在合并份 8KB 报错信息上反复迭代,逐淡健无私方照旧试过哪些确立决议。到终末,它在建议我 40 条音书前就远离过的修法。Token 预算会在第 12 分钟就把它掐死。
规矩 7 — 显式线路冲突,不要取均值
现代码库里两个部分存在不对,pg娱乐麻将胡了中国最新版APP下载Claude 会试图双方王人巴结。肃除是一团不连贯的东西。
触发时刻: 代码库里并存两套失实处理模式——一套是 async/await 配显式 try/catch,另一套用全局 error boundary。Claude 写的新代码两套王人用了。双重失实处理器。我花了 30 分钟才搞赫然为什么失实会被吞掉两次。
规矩 8 — 先读再写
Karpathy 的"精确转变"告诉 Claude 不要碰附进代码,但莫得告诉 Claude 先贯通附进代码。莫得这条,Claude 写的新代码会和 30 行外的现存代码打架。
触发时刻: Claude 在一个现存的同名函数操纵又加了一个一模相似的函数——因为它根柢没读操纵的代码。两个函数作念的是合并件事。新的因为 import 端正优先成效了,而旧的才是 6 个月以来的泰斗开端。
规矩 9 — 测试不可或缺,但测试自己不是规画
Karpathy 的规画导向践诺暗含了"测试通过"作为告成设施。但在施行中,Claude 会把"测试通过"动作惟一规画,写出能让浅层测试通过、却把其他一切搞坏的代码。
触发时刻: Claude 为一个鉴权函数写了 12 个测试,沿路通过。鉴权在坐蓐环境是坏的。那些测试仅仅在考据函数"复返了某个东西",而不是"复返了正确的东西"——函数靠复返一个常量就过了扫数测试。
规矩 10 — 永劫操作需要搜检点
Karpathy 的模板假定的是一次性交互。真实的 Claude Code 责任是多设施的——跨 20 个文献的重构、在一个会话里构立功能、跨多个提交调试。莫得搜检点,一次误操作会让扫数进程付之东流。
触发时刻: 一次 6 步重构在第 4 步出了问题。等我发现的时候,Claude 照旧在失实状况上持续完成了第 5、6 步。把这团乱麻理表示花的时候,比从新重来还要长。搜检点会在第 4 步就拿获问题。
规矩 11 — 商定优于改革
在一个有纯属模式的代码库里,Claude 可爱引入我方的格调。即使它的形式"更好",两种模式并存带来的危害也向上任何一种单独存在。
触发时刻: Claude 在一个全是 Class 组件的代码库里引入了 React Hooks。功能上是对的,但也把代码库的测试模式搞坏了——那套测试假定了 componentDidMount 的存在。花了半天时候删掉重写。
规矩 12 — 失败要高声,不可偷偷
最贵的 Claude 失败,是那些看起来告成了的失败。函数"运行平日"但复返了失实数据。移动"完成"但跳过了 30 札纪录。测试"通过"但断言自己便是错的。
触发时刻: Claude 说数据库移动"已告成完成"。本体上它偷偷跳过了 14% 触发阻抑冲突的纪录。跳过行为被写进了日记,但莫得浮出水面。11 天后报表启动出现特殊,博亚体育2026世界杯官方版(中国)官方入口才发现问题。
数据肃除
在 30 个代码库上跟踪合并组 50 个代表性任务,历时 6 周,三种竖立对比:
竖立
出错率
规矩顺从率
无 CLAUDE.md
41%
—
Karpathy 原始 4 条
11%
78%
完好 12 条
3%
76%

出错率 = 任务需要检阅或重写才能顺应意图。计入:沉默作念失实假定、过度工程化、误伤代码、静默失败、违背商定、冲突取均值、遗漏搜检点。
顺从率 = Claude 在规矩适用时,有明确践诺该规矩的比例。
特地念念的论断不是从 41% 降到 3% 这个大标题,而是:从 4 条扩张到 12 条,顺从率简直莫得损耗(78% → 76%),出错率却又下跌了 8 个百分点。新规矩覆盖的是原有 4 条未波及的失败模式,二者不争合并块属观点预算。

Karpathy 模板的 4 个隐性失效场景
即使不加多新规矩,原始 4 条模板在以下情况也不够用:
1. 永劫候运行的 Agent 任务 Karpathy 的规矩针对的是 Claude 写代码的片刻。对 Claude 运行多设施 Pipeline 时发生的事情只字未提。莫得预算规矩,莫得搜检点规矩,莫得"高声报错"规矩。Pipeline 会偷偷跑偏。
2. 多代码库一致性 "匹配现存格调"假定唯有一种格调。在包含 12 个做事的 Monorepo 里,Claude 必须选拔用哪种格调。原始规矩莫得告诉它该怎样选——它会迅速选,大概取均值。
3. 测试质地 规画导向践诺把"测试通过"当成告成。但莫得说测试必须是特地旨的。肃除是测了个孑然,但 Claude 对此充满信心。
4. 坐蓐代码 vs 原型代码 合并套保护坐蓐代码免于过度工程化的规矩,也会把那些合理需要 100 行投契性脚手架来探索所在的原型搞坏。Karpathy 的"粗浅优先"在早期探索阶段会误触发。

什么没用
在笃定这 12 条之前,我尝试过:
从社区搬来的规矩:大大量要么是换了说法的 Karpathy 原版,要么是不可泛化的领域特定例则("永恒使用 Tailwind 类")。全删了。
向上 12 条:测到 18 条。顺从率从 76% 跌到 52%。200 行天花板是真实存在的。超事后 Claude 启动模式匹配到"规矩存在",而不是真实读规矩。
依赖可能不存在的器用的规矩:"永恒使用 eslint"在 eslint 未安设时静默失败。改为与才气无关的表述:"匹配代码库强制践诺的格调"。
在 CLAUDE.md 里用例子代替规矩:例子比规矩重得多。三个例子破钞的高下文尽头于约 10 条文定,何况 Claude 会对例子过拟合。规矩是玄虚的,例子是具体的,用规矩。
"要小心"/"防范念念考"/"真实专注":纯杂音。顺从率跌到 30%,因为这些要求无法被测试。改成具体的号令式表述("显式评释假定")。
告诉 Claude 要判辨得"像资深工程师":没用。Claude 照旧觉得我方是资深的。差距在于"想"和"作念"之间。号令式规矩能弥合这个差距,身份辅导莫得这个遵守。
完好 12 条 CLAUDE.md(可平直复制)
# CLAUDE.md — 行为合同
## 规矩 1:先想表示再脱手
在写代码之前,显式评释你作念出的假定。点明量度弃取。遭受不笃定的,先问而不是猜。
如若存在更粗浅的决议,主动提议。
## 规矩 2:粗浅优先
用能措置问题的最少代码。不加投契性功能。单次使用的代码不要搞玄虚。
如若资深工程师会说"过度遐想"——就简化。
## 规矩 3:精确转变
只动必须动的地方。不要"顺遂优化"附进代码、注视或阵势。
不重构莫得问题的东西。保抓现存代码格调。
## 规矩 4:规画导向践诺
启动前界说告成设施。轮回践诺直到考据通过。
告诉我告成是什么表情,而不是该走哪些设施。
## 规矩 5:讲话责任归模子,笃定性责任归代码
重试逻辑、路由规矩、升级要求——用代码兑现,不要让模子在运行时动态决定。
## 规矩 6:硬性 Token 预算
每次会话最多 X 次器用调用 / Y 个 Token(笔据技俩填写具体数字)。
到达预算上限时停驻来,讲述进程,恭候指示。不要持续螺旋下去。
## 规矩 7:显式线路冲突
如若代码库的两个部分彼此矛盾——模式、商定、失实处理——在持续之前先指出来。
不要双方王人巴结或取均值,这会产生不连贯的代码。
## 规矩 8:先读再写
在向文献添加代码之前,先读合并文献里附进的代码。
在跨文献引入内容之前,先了解它的商定。不要在没读过操纵代码的情况下添加函数。
## 规矩 9:写特地旨的测试
测试要考据正确的行为,而不仅仅考据函数"复返了某个东西"。
断言必须有可能失败。告成设施是"测试能拿获真实的 bug",而不是"测试通过了"。
## 规矩 10:多设施任务需要搜检点
在向上 3 步的任务里,每完成一个逻辑阶段就停驻来考据状况,然后再持续。
不要在未阅历证的状况表层叠后续设施。
## 规矩 11:商定优于改革
使用代码库里已有的模式、库和格调,即使你知说念更好的决议。
有更好决议的话,先指出来,等阐述再引入,不要平直就用。
## 规矩 12:失败要高声
如若操作失败、跳过了纪录、遭受了失实——把它浮出来,不要偷偷纪录后持续。
"部分红功"等同于失败。把它动作失败来讲述。
安设方法:
# 1. 将 Karpathy 的 4 条文定基线追加到你的 CLAUDE.md
curl https://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills/main/CLAUDE.md >> CLAUDE.md
# 2. 将本文中的规矩 5-12 粘贴到底下
保存在代码库根目次。在 12 条文定下方添加技俩专属规矩(时代栈、测试号令、失实模式)。沿路加起来不要向上 200 行,超事后顺从率会显耀下跌。
心智模子
CLAUDE.md 不是愿望清单,而是一份行为合同——用来关闭你亲眼见过的具体失败模式。
每一条文定王人应该能回复:这条文定能提神什么失实?

原始 4 条提神的是经典失败模式: 隐性假定、过度工程化、误伤代码、告成设施腌臜。它们是地基,不要跳过。
新增 8 条提神的是进化出来的失败模式: 莫得预算的 Agent 轮回、莫得搜检点的多设施任务、测了孑然的测试、静默告成灭绝的静默失败。它们是补丁。
本体遵守因东说念主而异。如若你不跑多设施 Pipeline,规矩 10 对你没用。如若你的代码库唯有一种经 Lint 强制践诺的格调,规矩 11 便是实足的。读完这 12 条,留住能映射到你真实犯过的失实的那些,删掉其余的。
结 语
Karpathy 2026 年 1 月的帖子不外是一次吐槽。Forrest Chang 把它造成了 4 条文定。12 万开拓者给这个肃除点了 Star。他们中的大大量今天仍在跑 4 条文定。
模子进化了,生态变了。多设施 Agent、Hook 级联、技巧加载、多代码库责任——这些在 Karpathy 写帖子时王人不存在。4 条文定无法应酬这些场景。它们莫得错,仅仅不完好。
8 条新规矩博亚体育app官网下载。6 周、30 个代码库的测试。出错率从 41% 降至 3%。