AI知识篇

什么是智能体Agent

从"问答机器"到"自主员工"

普通的大语言模型像一个问答机器——你问一句,它答一句。而 AI Agent(智能体) 更像一个自主员工——你给它一个目标,它会自己规划步骤、调用工具、执行任务,直到完成。

💡 类比:普通 AI 就像客服热线(你问什么答什么),AI Agent 就像一个实习生(你说"帮我调研竞品",它会自己搜索、整理、写报告)。

加载图表中...

Agent 的核心能力

加载图表中...
能力说明例子
推理规划把复杂任务分解为小步骤"部署网站"→ 安装依赖→构建→配置→部署
工具调用调用外部工具完成具体操作搜索网页、执行代码、读写文件
记忆记住之前的操作和结果记住已经完成的步骤
自主循环不断观察结果、调整行动执行失败→分析原因→换方法重试

Agent 的工作循环

Agent 遵循一个经典的循环模式:观察 → 思考 → 行动

加载图表中...

实际例子:让 Agent 修复一个 Bug

加载图表中...

常见的 AI Agent 产品

产品类型能做什么
Claude Code编程 Agent读写代码、执行命令、修复Bug
Cursor编程 Agent智能代码补全、重构、调试
Devin编程 Agent端到端完成开发任务
AutoGPT通用 Agent自主完成各种任务
GPT Researcher研究 Agent自动搜索和撰写研究报告

Agent 的架构

加载图表中...

构建一个简单的 Agent

import OpenAI from "openai";
const openai = new OpenAI();

// 定义 Agent 可以使用的工具
const tools = [
  {
    type: "function",
    function: {
      name: "search_web",
      description: "搜索网页获取信息",
      parameters: {
        type: "object",
        properties: {
          query: { type: "string", description: "搜索关键词" }
        },
        required: ["query"]
      }
    }
  },
  {
    type: "function",
    function: {
      name: "read_file",
      description: "读取文件内容",
      parameters: {
        type: "object",
        properties: {
          path: { type: "string", description: "文件路径" }
        },
        required: ["path"]
      }
    }
  }
];

// Agent 循环
async function runAgent(task) {
  const messages = [
    { role: "system", content: "你是一个能使用工具的AI助手。" },
    { role: "user", content: task }
  ];

  while (true) {
    const response = await openai.chat.completions.create({
      model: "gpt-4",
      messages,
      tools,
    });

    const choice = response.choices[0];

    // 如果模型决定调用工具
    if (choice.finish_reason === "tool_calls") {
      for (const call of choice.message.tool_calls) {
        const result = await executeToolCall(call);  // 执行工具
        messages.push(choice.message);
        messages.push({
          role: "tool",
          tool_call_id: call.id,
          content: result,
        });
      }
    } else {
      // 模型给出最终回答
      return choice.message.content;
    }
  }
}

单 Agent vs 多 Agent

加载图表中...
模式适合场景例子
单 Agent简单任务修复一个Bug
多 Agent复杂项目多人协作完成一个功能

Agent 的局限和注意事项

注意点说明
需要人工监督Agent 可能犯错,重要操作需要确认
成本控制多轮工具调用会消耗大量 Token
安全边界限制 Agent 能访问的资源和权限
死循环设置最大循环次数,避免无限执行

🎯 AI编程小贴士:你正在使用的 Claude Code 就是一个编程 Agent——它能读写文件、执行命令、搜索代码,帮你完成复杂的开发任务。学会给 Agent 清晰的任务描述,它的效率会更高。

小结

  • AI Agent 能自主规划、调用工具、循环执行,完成复杂任务
  • 核心循环:观察 → 思考 → 行动
  • Agent = 大语言模型 + 工具调用 + 记忆 + 规划能力
  • Claude Code、Cursor 都是编程 Agent 的代表
  • Agent 需要人工监督,设置安全边界和成本限制