基于 Anthropic 自己 prompt 的 265 个版本
我们追踪 Claude Code system prompt 每一次增加、删除、重写。Anthropic 把 IMPORTANT 从 12 次降到 4 次时,我们能看到。你的 harness 也可以按同样的证据收紧。
AGENTS.md、CLAUDE.md、Cursor 规则(.cursor/rules)、CI 和 hooks,都是 AI Agent harness 的一部分。AgentLint 检查这一层,适合 Claude Code、Cursor 和 Codex。
它会审计 CLAUDE.md、AGENTS.md、Cursor 规则(.cursor/rules)、.github/copilot-instructions.md,再加上 CI workflows、pre-commit hooks 和 .gitignore。每一项检查都有主来源。
Works with every major AI coding agent
2026 年 2 月,Mitchell Hashimoto 把 harness engineering 这个说法带火。几天后,OpenAI 也正式用了这个框架。LangChain 的定义最干净:只要不是 model,本质上都是 harness。真正的瓶颈,经常就在这里。
对 AI Agent 来说,harness 不是一个新框架。它已经在你的 repo 里了。AGENTS.md 和 CLAUDE.md 是长期规则。 Cursor 规则(.cursor/rules)和 copilot-instructions.md 是工具层规则。 CI、pre-commit hooks 和 .gitignore 是 agent 不能绕过的硬边界。这就是 harness。AgentLint 检查的就是它。
有的工具生成模板。有的工具给 prompt 打分。AgentLint 看的是整个 harness 的健康度,而且每一项检查都引用主来源,不靠二手博客。
我们追踪 Claude Code system prompt 每一次增加、删除、重写。Anthropic 把 IMPORTANT 从 12 次降到 4 次时,我们能看到。你的 harness 也可以按同样的证据收紧。
40,000 字符入口文件会被静默截断。256 KB 文件读不了。pre-commit hook 太慢会让 session 卡住,因为 Claude Code 不会自动用 --no-verify。AgentLint 把这些限制变成检查。
一个命令。AgentLint 扫你的 repo,按 5 个维度给 harness 打分,指出哪里坏了,并修掉能安全修的部分:pin Actions SHA、把 .env 加进 gitignore、生成 handoff。
分数是测量,不是道德评价。参考值来自 Anthropic 自己的数据。要修什么,由你决定。
/init 生成模板。cclint 检查一个文件的语法。claude-code-rules 收集可复制的规则。它们都不衡量整个 harness 是否健康,也不会自动修复发现的问题。
| 能力 | /init | cclint | claude-code-rules | AgentLint |
|---|---|---|---|---|
| 生成一个 CLAUDE.md 模板 | ✓ | — | — | — |
| 按 265 版 prompt 数据审计入口文件质量 | — | — | — | ✓ |
| 发现坏掉的 @include 引用 | — | ✓ | — | ✓ |
| 检查 40,000 字符硬限制 | — | — | — | ✓ |
| 审计 CI、hooks、.gitignore、Actions SHA | — | — | — | ✓ |
| 发现规则随时间腐烂 | — | — | — | ✓ |
| 自动修复能修的东西 | — | — | — | ✓ |
| 每项检查都有数据来源 | — | — | — | ✓ |
如果一项检查没有主来源支持,它就不会发布。这是硬规则。