人工智能2026-03-30418 阅读

继Vibe Coding之后，Harness又火了，这是个啥？求求AI圈的人别造新词了！

大家好，我是轩辕。

最近 AI 编程圈又冒出来一个新词：Harness Engineering。

好家伙，AI 圈造新词的速度是真快，Vibe Coding 还没搞明白，又要学习新概念了。

我打开翻译工具查了下，Harness 这个词本身的意思是"缰绳"、"马鞍"，这特么跟AI有啥关系，一开始搞得我一头雾水。

有网友戏称其为“牛码工程”

于是我花了些时间研究了一下，这到底是个啥玩意儿，为什么最近很多大佬都在谈这个，今天这篇文章带你搞懂。

Harness Engineering 到底是个啥

这个概念最早是 HashiCorp 的联合创始人 Mitchell Hashimoto 在今年 2 月提出来的。

他的原话大概是这个意思：

**每当你发现 AI Agent 犯了一个错误，就花时间设计一个机制，确保它永远不会再犯同样的错误。

翻译成大白话就是：别光顾着让 AI 干活，你得给它设好规矩。

前面说了，Harness 这个词本身的意思是"缰绳"、"马鞍"。

你想，一匹马跑得再快，没有缰绳也不行，得有人控制方向。

AI Agent 就是那匹马，而 Harness 就是你给它套上的那套装备。

它决定了 AI 能用什么工具、不能碰什么文件、出了错怎么自动修复、人在哪些环节需要介入。

说白了，Harness Engineering 就是在设计「AI 的工作环境」，让它在约束中高效工作，而不是放养式地让它自由发挥。

听起来还是一头雾水？举个例子你就明白了。

在我们开发智能体的时候，需要调用 AI 的 API，如何让它按照你期望的格式返回呢？光靠写提示词吗？它如果不这样返回怎么办？

比如你让 AI 返回一个 JSON，结果它给你包了一层 markdown 代码块，或者字段名拼错了。

以前的做法是：改 Prompt，加一句"请务必返回纯 JSON 格式"。这就是 Prompt Engineering。

后来发现光改 Prompt 不靠谱，你还得给它看几个示例、给它上下文文档。这就是 Context Engineering。

但真正上了生产你会发现，就算 Prompt 写得再好、上下文给得再全，AI 偶尔还是会抽风。

怎么办？

你得在 AI 外面包一层东西：格式校验、自动重试、错误回退、日志记录。

这一整套"包在 AI 外面的东西"，就是 Harness。

再举个更贴近日常的例子。

你用 Claude Code 写项目，有时候它会突然改掉你不让它碰的文件，或者引入一些奇奇怪怪的依赖。你骂它一顿，下次它还犯。

但如果你在项目里配了 CLAUDE.md 写清楚规矩，配了 ESLint 自动检查，配了 pre-commit hook 拦截不合规的提交，配了 Git 记录每一次改动——那 AI 犯错的时候，系统会自动把它拉回来。

这就是 Harness。

不是靠"说"来约束 AI，而是靠"机制"来约束。

对于个人开发的demo级别东西，没这些无伤大雅，只要大部分时间AI能正常工作就行。

但对于Claude Code这样商用级别的产品来说，则需要确保能够稳定的工作，必须要把这些外围的"安保"工作做到位。

从 Prompt 到 Context 再到 Harness

如果你一直关注 AI 领域，你会发现这几年其实经历了三代范式演进。

2023-2024 年是 Prompt Engineering 时代。

核心就是"怎么把话说清楚"，通过调整提示词的措辞、格式和示例来获得更好的回答。

2025 年进入 Context Engineering 时代。

大家发现光靠提示词不够，AI 还需要看到相关文档、代码片段、历史对话等上下文信息才能给出靠谱的答案。

2026 年，Harness Engineering 来了。

它和前两者最大的区别在于：

Prompt Engineering 管的是"怎么问"。

Context Engineering 管的是"让 AI 看到什么"。

Harness Engineering 管的是"系统能预防什么、测量什么、修复什么"。

这三者不是替代关系，是层层叠加的。

Harness 长什么样

一个完整的 Harness 不是某个单一的工具或配置文件，而是一整套体系。

大致可以分成五个部分：

输入侧——告诉 Agent 该做什么。包括仓库文档、代码规范、架构说明、任务描述等。这些文档不是写给人看的，是写给 AI 看的。

执行侧——给 Agent 干活的工具。比如命令行、浏览器、数据库连接、各种 MCP 工具等。

约束侧——告诉 Agent 什么不能做。比如权限控制、目录范围限制、命令白名单、关键操作需要人工确认等。

反馈侧——让 Agent 知道自己做得对不对。Lint 检查、单元测试、CI 流水线、代码审查，这些都是自动化的反馈信号。

记录侧——留下可追溯的痕迹。Git 历史、进度文件、执行日志、可回放的操作轨迹。

这五个部分组合在一起，就构成了 AI Agent 的"工作环境"。

Agent 在这个环境里工作，就像一个新员工在成熟的公司流程里干活——有人带、有规矩、有考核。

程序员核心竞争力在改变

Harness Engineering 的兴起其实传递了一个信号：

程序员的核心竞争力正在从"写代码"变成"设计系统"。

刚刚接触AI编程和智能体开发的同学可能觉得，这玩意儿没啥技术含量，不就是写写提示词，调调API吗？有手就行。

写一个demo这样做没问题，但要写出一个成熟稳定的商用级别的产品，远不是这么简单，需要一整套工程化系统设计能力。

这对很多人来说其实是个好消息。

因为设计系统需要的是经验、判断力和工程直觉，这些恰恰是 AI 最难替代的能力。

好了，今天就分享到这里。

如果觉得还不错的话，求个点赞。

路过的朋友欢迎点个关注呗，及时获得下期文章推送~

继Vibe Coding之后，Harness又火了，这是个啥？求求AI圈的人别造新词了！

Harness Engineering 到底是个啥

从 Prompt 到 Context 再到 Harness

Harness 长什么样

程序员核心竞争力在改变

往期推荐