Agent = Model + Harness

    AgentLint检查你的 CLAUDE.mdAGENTS.md Cursor 规则

    AGENTS.mdCLAUDE.md、Cursor 规则(.cursor/rules)、CI 和 hooks,都是 AI Agent harness 的一部分。AgentLint 检查这一层,适合 Claude Code、Cursor 和 Codex。

    它会审计 CLAUDE.mdAGENTS.md、Cursor 规则(.cursor/rules)、.github/copilot-instructions.md,再加上 CI workflows、pre-commit hooks 和 .gitignore。每一项检查都有主来源。

    $npm install -g agentlint-ai
    看文档 →
    claude-code — /al
    $ /al
    AgentLint — 分数:68/100
    可找到██████████████░░░░░░7/10
    说明质量████████████████░░░░8/10
    能工作████████████░░░░░░░░6/10
    安全██████████░░░░░░░░░░5/10
    可延续██████████████░░░░░░7/10
    harness████████████████████10/10
    深度分析░░░░░░░░░░░░░░░░░░░░0/10
    Session████████████████████10/10
    修复计划(7 项):
      [guided]   把 8 个 GitHub Actions pin 到 SHA
      [guided]   把 .env 加进 .gitignore
      [assisted] 生成 HANDOFF.md
      [guided]   减少 IMPORTANT 关键词
    › 选择项目 → AgentLint 修复 → 重新打分 → 保存 HTML 报告

    Works with every major AI coding agent

    Claude Code
    OpenAI Codex
    Cursor
    GitHub Copilot
    Google Gemini CLI
    Windsurf
    Cline
    Claude Code
    OpenAI Codex
    Cursor
    GitHub Copilot
    Google Gemini CLI
    Windsurf
    Cline
    01 / harness 问题

    Agent = Model + Harness.
    现在卡住你的,不只是 model。

    2026 年 2 月,Mitchell Hashimoto 把 harness engineering 这个说法带火。几天后,OpenAI 也正式用了这个框架。LangChain 的定义最干净:只要不是 model,本质上都是 harness。真正的瓶颈,经常就在这里。

    70%
    AI agent 的表现有很大一部分在 model 外面,也就是 harness。权重一样,harness 不同,结果就不同。
    LANGCHAIN · FEB 2026
    40%
    团队维护好顶层 context file 后,坏建议 session 明显减少。
    ANTHROPIC · 2026 TRENDS REPORT
    5/8
    自动生成的 context files 在 8 个场景里有 5 个拉低成功率,推理成本还涨 20–23%。
    ETH ZURICH · 2025
    60K+
    现在已有 6 万多个 OSS repos 带 AGENTS.md。OpenAI 已把标准捐给 Linux Foundation。
    AGENTS.MD · LINUX FOUNDATION
    你的 harness 里有什么?

    对 AI Agent 来说,harness 不是一个新框架。它已经在你的 repo 里了。AGENTS.mdCLAUDE.md 是长期规则。 Cursor 规则(.cursor/rules)和 copilot-instructions.md 是工具层规则。 CI、pre-commit hooks 和 .gitignore 是 agent 不能绕过的硬边界。这就是 harness。AgentLint 检查的就是它。

    02 / 为什么是 AgentLint

    第一个真正检查 harness 本身的 linter。

    有的工具生成模板。有的工具给 prompt 打分。AgentLint 看的是整个 harness 的健康度,而且每一项检查都引用主来源,不靠二手博客。

    01

    基于 Anthropic 自己 prompt 的 265 个版本

    我们追踪 Claude Code system prompt 每一次增加、删除、重写。Anthropic 把 IMPORTANT 从 12 次降到 4 次时,我们能看到。你的 harness 也可以按同样的证据收紧。

    02

    没人提醒你的硬限制

    40,000 字符入口文件会被静默截断。256 KB 文件读不了。pre-commit hook 太慢会让 session 卡住,因为 Claude Code 不会自动用 --no-verify。AgentLint 把这些限制变成检查。

    03

    扫描、打分、自动修复

    一个命令。AgentLint 扫你的 repo,按 5 个维度给 harness 打分,指出哪里坏了,并修掉能安全修的部分:pin Actions SHA、把 .env 加进 gitignore、生成 handoff。

    03 / 33 项检查

    五个维度。
    按它们对结果的影响 加权

    分数是测量,不是道德评价。参考值来自 Anthropic 自己的数据。要修什么,由你决定。

    WEIGHT · 20%
    可找到
    9 项检查
    AI 能不能找到需要的东西:入口文件、索引、可解析引用、标准命名。
    WEIGHT · 30%
    说明质量
    8 项检查
    规则写得够不够清楚:强调词密度、具体程度、文件长度、40K 硬限制。
    WEIGHT · 20%
    能工作
    11 项检查
    AI 能不能构建和测试:命令、CI、真实测试、linter、256 KB 文件上限、hook 速度。
    WEIGHT · 15%
    可延续
    6 项检查
    下一次 session 能不能接上:新鲜度、handoff、有意义的 changelog、repo 里的计划。
    WEIGHT · 15%
    安全
    9 项检查
    AI 是否在安全边界内工作:.env 进 gitignore、Actions pin SHA、workflow permissions、没有硬编码 secrets。
    04 / 不是又一个 /init 或规则合集

    模板和规则列表不是审计。 AgentLint 是。

    /init 生成模板。cclint 检查一个文件的语法。claude-code-rules 收集可复制的规则。它们都不衡量整个 harness 是否健康,也不会自动修复发现的问题。

    能力/initcclintclaude-code-rulesAgentLint
    生成一个 CLAUDE.md 模板
    按 265 版 prompt 数据审计入口文件质量
    发现坏掉的 @include 引用
    检查 40,000 字符硬限制
    审计 CI、hooks、.gitignore、Actions SHA
    发现规则随时间腐烂
    自动修复能修的东西
    每项检查都有数据来源
    05 / 数据来源

    每一项检查都有 出处

    如果一项检查没有主来源支持,它就不会发布。这是硬规则。

    Source code
    Claude Code runtime internals
    硬限制和真实行为:40,000 字符上限、256 KB 文件天花板、pre-commit hook 行为、@include 解析。
    ETH Zurich · 2026
    Do context files help coding agents?
    开发者写的文件有帮助。LLM 自动生成的文件在 8 个场景里有 5 个变差。成本涨 20–23%。
    Codified Context · 2026
    Stale content as #1 failure mode
    文档腐烂是 agent 在熟悉代码库上失败的最大原因。
    Agent READMEs · 2025
    Concrete vs abstract effectiveness
    一个真实例子,比三段抽象说明更有用。最反直觉的约定,最值得写清楚。
    06 / FAQ

    常见问题, 直接回答

    最短的说法是:Agent = Model + Harness。model 是大模型,harness 是把它变成 AI Agent 的那一圈东西:工具、状态、反馈循环,还有每次启动都会读的规则。对代码仓库来说,就是 AGENTS.md、CLAUDE.md、Cursor 规则(.cursor/rules)、CI、pre-commit hooks 和 .gitignore。AgentLint 专门检查这一层。

    10 秒内
    给你的 harness 打分

    一个命令。33 项有出处的检查。每一项都有引用。

    $npm install -g agentlint-ai
    看文档 →