人工智能2026-03-3021 阅读

继Vibe Coding之后,Harness又火了,这是个啥?求求AI圈的人别造新词了!

大家好,我是轩辕。

最近 AI 编程圈又冒出来一个新词:Harness Engineering

好家伙,AI 圈造新词的速度是真快,Vibe Coding 还没搞明白,又要学习新概念了。

我打开翻译工具查了下,Harness 这个词本身的意思是"缰绳"、"马鞍",这特么跟AI有啥关系,一开始搞得我一头雾水。

有网友戏称其为“牛码工程”

image

于是我花了些时间研究了一下,这到底是个啥玩意儿,为什么最近很多大佬都在谈这个,今天这篇文章带你搞懂。

Harness Engineering 到底是个啥

这个概念最早是 HashiCorp 的联合创始人 Mitchell Hashimoto 在今年 2 月提出来的。

他的原话大概是这个意思:

**每当你发现 AI Agent 犯了一个错误,就花时间设计一个机制,确保它永远不会再犯同样的错误。

翻译成大白话就是:别光顾着让 AI 干活,你得给它设好规矩。

前面说了,Harness 这个词本身的意思是"缰绳"、"马鞍"。

你想,一匹马跑得再快,没有缰绳也不行,得有人控制方向。

AI Agent 就是那匹马,而 Harness 就是你给它套上的那套装备。

它决定了 AI 能用什么工具、不能碰什么文件、出了错怎么自动修复、人在哪些环节需要介入。

说白了,Harness Engineering 就是在设计「AI 的工作环境」,让它在约束中高效工作,而不是放养式地让它自由发挥。

听起来还是一头雾水?举个例子你就明白了。

在我们开发智能体的时候,需要调用 AI 的 API,如何让它按照你期望的格式返回呢?光靠写提示词吗?它如果不这样返回怎么办?

比如你让 AI 返回一个 JSON,结果它给你包了一层 markdown 代码块,或者字段名拼错了。

以前的做法是:改 Prompt,加一句"请务必返回纯 JSON 格式"。这就是 Prompt Engineering。

后来发现光改 Prompt 不靠谱,你还得给它看几个示例、给它上下文文档。这就是 Context Engineering。

但真正上了生产你会发现,就算 Prompt 写得再好、上下文给得再全,AI 偶尔还是会抽风。

怎么办?

你得在 AI 外面包一层东西:格式校验、自动重试、错误回退、日志记录。

这一整套"包在 AI 外面的东西",就是 Harness。

再举个更贴近日常的例子。

你用 Claude Code 写项目,有时候它会突然改掉你不让它碰的文件,或者引入一些奇奇怪怪的依赖。 你骂它一顿,下次它还犯。

但如果你在项目里配了 CLAUDE.md 写清楚规矩,配了 ESLint 自动检查,配了 pre-commit hook 拦截不合规的提交,配了 Git 记录每一次改动——那 AI 犯错的时候,系统会自动把它拉回来。

这就是 Harness。

不是靠"说"来约束 AI,而是靠"机制"来约束。

对于个人开发的demo级别东西,没这些无伤大雅,只要大部分时间AI能正常工作就行。

但对于Claude Code这样商用级别的产品来说,则需要确保能够稳定的工作,必须要把这些外围的"安保"工作做到位。

从 Prompt 到 Context 再到 Harness

如果你一直关注 AI 领域,你会发现这几年其实经历了三代范式演进。

image

2023-2024 年是 Prompt Engineering 时代。

核心就是"怎么把话说清楚",通过调整提示词的措辞、格式和示例来获得更好的回答。

2025 年进入 Context Engineering 时代。

大家发现光靠提示词不够,AI 还需要看到相关文档、代码片段、历史对话等上下文信息才能给出靠谱的答案。

2026 年,Harness Engineering 来了。

它和前两者最大的区别在于:

Prompt Engineering 管的是"怎么问"。

Context Engineering 管的是"让 AI 看到什么"。

Harness Engineering 管的是"系统能预防什么、测量什么、修复什么"。

这三者不是替代关系,是层层叠加的。

Harness 长什么样

一个完整的 Harness 不是某个单一的工具或配置文件,而是一整套体系。

大致可以分成五个部分:

输入侧——告诉 Agent 该做什么。包括仓库文档、代码规范、架构说明、任务描述等。这些文档不是写给人看的,是写给 AI 看的。

执行侧——给 Agent 干活的工具。比如命令行、浏览器、数据库连接、各种 MCP 工具等。

约束侧——告诉 Agent 什么不能做。比如权限控制、目录范围限制、命令白名单、关键操作需要人工确认等。

反馈侧——让 Agent 知道自己做得对不对。Lint 检查、单元测试、CI 流水线、代码审查,这些都是自动化的反馈信号。

记录侧——留下可追溯的痕迹。Git 历史、进度文件、执行日志、可回放的操作轨迹。

image

这五个部分组合在一起,就构成了 AI Agent 的"工作环境"。

Agent 在这个环境里工作,就像一个新员工在成熟的公司流程里干活——有人带、有规矩、有考核。

程序员核心竞争力在改变

Harness Engineering 的兴起其实传递了一个信号:

程序员的核心竞争力正在从"写代码"变成"设计系统"。

刚刚接触AI编程和智能体开发的同学可能觉得,这玩意儿没啥技术含量,不就是写写提示词,调调API吗?有手就行。

写一个demo这样做没问题,但要写出一个成熟稳定的商用级别的产品,远不是这么简单,需要一整套工程化系统设计能力。

这对很多人来说其实是个好消息。

因为设计系统需要的是经验、判断力和工程直觉,这些恰恰是 AI 最难替代的能力。

好了,今天就分享到这里。

如果觉得还不错的话,求个点赞。

路过的朋友欢迎点个关注呗,及时获得下期文章推送~

往期推荐