AI知识篇

什么是大语言模型

能"说人话"的AI

大语言模型(Large Language Model,LLM) 是一种通过海量文本训练出来的 AI 模型,能够理解和生成人类语言。ChatGPT、Claude、Gemini 都是大语言模型。

💡 类比:大语言模型就像一个读了全世界图书馆所有书的超级学者——你问它任何问题,它都能用流畅的语言回答。

加载图表中...

大语言模型的"大"在哪里?

"大"体现在三个维度:

加载图表中...
维度具体数值
参数量GPT-4 约 1.8 万亿参数
训练数据数万亿 token(互联网文本)
训练成本数千万到上亿美元
训练时间数月

LLM 的工作原理:预测下一个词

大语言模型的核心能力其实很简单——预测下一个最可能的词

输入: "今天天气"
模型预测: "真" (概率最高)
→ "今天天气真"
模型预测: "好" (概率最高)
→ "今天天气真好"
加载图表中...

就是这个简单的机制,加上海量的参数和训练数据,就产生了令人惊叹的智能表现。

主流大语言模型

模型公司特点
GPT-4OpenAI综合能力强,生态丰富
ClaudeAnthropic长文本、推理能力强、更安全
GeminiGoogle多模态、与Google生态集成
LlamaMeta开源、可本地部署
DeepSeekDeepSeek国产开源、性价比高
Qwen阿里国产、中文能力强
加载图表中...

如何使用大语言模型

方式一:通过 API 调用

// 调用 OpenAI API
const response = await fetch("https://api.openai.com/v1/chat/completions", {
  method: "POST",
  headers: {
    "Content-Type": "application/json",
    "Authorization": "Bearer sk-your-api-key",
  },
  body: JSON.stringify({
    model: "gpt-4",
    messages: [
      { role: "system", content: "你是一个有用的助手" },
      { role: "user", content: "用JavaScript写一个冒泡排序" },
    ],
    temperature: 0.7,  // 控制创造性(0=确定性,1=随机性)
  }),
});

const data = await response.json();
console.log(data.choices[0].message.content);

方式二:通过 SDK 调用

// 使用 OpenAI 官方 SDK(更简洁)
import OpenAI from "openai";

const openai = new OpenAI({ apiKey: process.env.OPENAI_API_KEY });

const completion = await openai.chat.completions.create({
  model: "gpt-4",
  messages: [
    { role: "user", content: "解释什么是递归" },
  ],
});

console.log(completion.choices[0].message.content);

关键概念

Token:模型的"计量单位"

LLM 不是按字数收费,而是按 Token 计费。Token 是模型处理文本的最小单位:

英文: "Hello, World!" → 4 tokens
中文: "你好世界" → 2-4 tokens(取决于分词方式)
概念说明
Token文本的最小处理单位(词或子词)
上下文窗口模型一次能处理的最大 Token 数
输入 Token你发送给模型的内容
输出 Token模型生成的回复

Temperature:控制"创造力"

加载图表中...

System Prompt:设定模型角色

messages: [
  // System prompt 设定模型的行为方式
  { role: "system", content: "你是一位经验丰富的React开发专家,回答要简洁,包含代码示例" },
  // 用户消息
  { role: "user", content: "怎么用useEffect获取数据?" },
]

多模态:不只是文字

现代 LLM 不只能处理文字,还能理解图片、音频甚至视频:

加载图表中...
// 多模态示例:让AI分析图片
const response = await openai.chat.completions.create({
  model: "gpt-4o",
  messages: [{
    role: "user",
    content: [
      { type: "text", text: "这张图里是什么?" },
      { type: "image_url", image_url: { url: "https://example.com/photo.jpg" } },
    ],
  }],
});

LLM 的局限性

局限说明应对
幻觉可能编造不存在的事实让模型引用来源,人工验证
知识截止训练数据有截止日期用 RAG 补充最新知识
上下文限制能处理的文本长度有限分段处理,使用长上下文模型
数学计算复杂计算可能出错让模型调用计算工具

🎯 AI编程小贴士:把大语言模型当成一个"超级实习生"——它知识渊博、学习能力强,但有时会犯错。关键代码一定要自己审查,不要盲目信任 AI 的输出。

小结

  • 大语言模型是通过海量文本训练的 AI,能理解和生成语言
  • 核心原理是预测下一个最可能的词
  • 通过 API 调用(如 OpenAI API)就能使用
  • Token 是计费单位,Temperature 控制创造性
  • 主流模型:GPT-4、Claude、Gemini、Llama、DeepSeek
  • LLM 可能"幻觉",关键输出需要人工验证