AI知识篇
什么是智能体Agent
从"问答机器"到"自主员工"
普通的大语言模型像一个问答机器——你问一句,它答一句。而 AI Agent(智能体) 更像一个自主员工——你给它一个目标,它会自己规划步骤、调用工具、执行任务,直到完成。
💡 类比:普通 AI 就像客服热线(你问什么答什么),AI Agent 就像一个实习生(你说"帮我调研竞品",它会自己搜索、整理、写报告)。
加载图表中...
Agent 的核心能力
加载图表中...
| 能力 | 说明 | 例子 |
|---|---|---|
| 推理规划 | 把复杂任务分解为小步骤 | "部署网站"→ 安装依赖→构建→配置→部署 |
| 工具调用 | 调用外部工具完成具体操作 | 搜索网页、执行代码、读写文件 |
| 记忆 | 记住之前的操作和结果 | 记住已经完成的步骤 |
| 自主循环 | 不断观察结果、调整行动 | 执行失败→分析原因→换方法重试 |
Agent 的工作循环
Agent 遵循一个经典的循环模式:观察 → 思考 → 行动
加载图表中...
实际例子:让 Agent 修复一个 Bug
加载图表中...
常见的 AI Agent 产品
| 产品 | 类型 | 能做什么 |
|---|---|---|
| Claude Code | 编程 Agent | 读写代码、执行命令、修复Bug |
| Cursor | 编程 Agent | 智能代码补全、重构、调试 |
| Devin | 编程 Agent | 端到端完成开发任务 |
| AutoGPT | 通用 Agent | 自主完成各种任务 |
| GPT Researcher | 研究 Agent | 自动搜索和撰写研究报告 |
Agent 的架构
加载图表中...
构建一个简单的 Agent
import OpenAI from "openai";
const openai = new OpenAI();
// 定义 Agent 可以使用的工具
const tools = [
{
type: "function",
function: {
name: "search_web",
description: "搜索网页获取信息",
parameters: {
type: "object",
properties: {
query: { type: "string", description: "搜索关键词" }
},
required: ["query"]
}
}
},
{
type: "function",
function: {
name: "read_file",
description: "读取文件内容",
parameters: {
type: "object",
properties: {
path: { type: "string", description: "文件路径" }
},
required: ["path"]
}
}
}
];
// Agent 循环
async function runAgent(task) {
const messages = [
{ role: "system", content: "你是一个能使用工具的AI助手。" },
{ role: "user", content: task }
];
while (true) {
const response = await openai.chat.completions.create({
model: "gpt-4",
messages,
tools,
});
const choice = response.choices[0];
// 如果模型决定调用工具
if (choice.finish_reason === "tool_calls") {
for (const call of choice.message.tool_calls) {
const result = await executeToolCall(call); // 执行工具
messages.push(choice.message);
messages.push({
role: "tool",
tool_call_id: call.id,
content: result,
});
}
} else {
// 模型给出最终回答
return choice.message.content;
}
}
}
单 Agent vs 多 Agent
加载图表中...
| 模式 | 适合场景 | 例子 |
|---|---|---|
| 单 Agent | 简单任务 | 修复一个Bug |
| 多 Agent | 复杂项目 | 多人协作完成一个功能 |
Agent 的局限和注意事项
| 注意点 | 说明 |
|---|---|
| 需要人工监督 | Agent 可能犯错,重要操作需要确认 |
| 成本控制 | 多轮工具调用会消耗大量 Token |
| 安全边界 | 限制 Agent 能访问的资源和权限 |
| 死循环 | 设置最大循环次数,避免无限执行 |
🎯 AI编程小贴士:你正在使用的 Claude Code 就是一个编程 Agent——它能读写文件、执行命令、搜索代码,帮你完成复杂的开发任务。学会给 Agent 清晰的任务描述,它的效率会更高。
小结
- AI Agent 能自主规划、调用工具、循环执行,完成复杂任务
- 核心循环:观察 → 思考 → 行动
- Agent = 大语言模型 + 工具调用 + 记忆 + 规划能力
- Claude Code、Cursor 都是编程 Agent 的代表
- Agent 需要人工监督,设置安全边界和成本限制