AI知识篇

什么是大语言模型

能"说人话"的AI

大语言模型（Large Language Model，LLM） 是一种通过海量文本训练出来的 AI 模型，能够理解和生成人类语言。ChatGPT、Claude、Gemini 都是大语言模型。

💡 类比：大语言模型就像一个读了全世界图书馆所有书的超级学者——你问它任何问题，它都能用流畅的语言回答。

加载图表中...

大语言模型的"大"在哪里？

"大"体现在三个维度：

加载图表中...

维度	具体数值
参数量	GPT-4 约 1.8 万亿参数
训练数据	数万亿 token（互联网文本）
训练成本	数千万到上亿美元
训练时间	数月

LLM 的工作原理：预测下一个词

大语言模型的核心能力其实很简单——预测下一个最可能的词：

输入: "今天天气"
模型预测: "真" (概率最高)
→ "今天天气真"
模型预测: "好" (概率最高)
→ "今天天气真好"

加载图表中...

就是这个简单的机制，加上海量的参数和训练数据，就产生了令人惊叹的智能表现。

主流大语言模型

模型	公司	特点
GPT-4	OpenAI	综合能力强，生态丰富
Claude	Anthropic	长文本、推理能力强、更安全
Gemini	Google	多模态、与Google生态集成
Llama	Meta	开源、可本地部署
DeepSeek	DeepSeek	国产开源、性价比高
Qwen	阿里	国产、中文能力强

加载图表中...

如何使用大语言模型

方式一：通过 API 调用

// 调用 OpenAI API
const response = await fetch("https://api.openai.com/v1/chat/completions", {
  method: "POST",
  headers: {
    "Content-Type": "application/json",
    "Authorization": "Bearer sk-your-api-key",
  },
  body: JSON.stringify({
    model: "gpt-4",
    messages: [
      { role: "system", content: "你是一个有用的助手" },
      { role: "user", content: "用JavaScript写一个冒泡排序" },
    ],
    temperature: 0.7,  // 控制创造性（0=确定性，1=随机性）
  }),
});

const data = await response.json();
console.log(data.choices[0].message.content);

方式二：通过 SDK 调用

// 使用 OpenAI 官方 SDK（更简洁）
import OpenAI from "openai";

const openai = new OpenAI({ apiKey: process.env.OPENAI_API_KEY });

const completion = await openai.chat.completions.create({
  model: "gpt-4",
  messages: [
    { role: "user", content: "解释什么是递归" },
  ],
});

console.log(completion.choices[0].message.content);

关键概念

Token：模型的"计量单位"

LLM 不是按字数收费，而是按 Token 计费。Token 是模型处理文本的最小单位：

英文: "Hello, World!" → 4 tokens
中文: "你好世界" → 2-4 tokens（取决于分词方式）

概念	说明
Token	文本的最小处理单位（词或子词）
上下文窗口	模型一次能处理的最大 Token 数
输入 Token	你发送给模型的内容
输出 Token	模型生成的回复

Temperature：控制"创造力"

加载图表中...

System Prompt：设定模型角色

messages: [
  // System prompt 设定模型的行为方式
  { role: "system", content: "你是一位经验丰富的React开发专家，回答要简洁，包含代码示例" },
  // 用户消息
  { role: "user", content: "怎么用useEffect获取数据？" },
]

多模态：不只是文字

现代 LLM 不只能处理文字，还能理解图片、音频甚至视频：

加载图表中...

// 多模态示例：让AI分析图片
const response = await openai.chat.completions.create({
  model: "gpt-4o",
  messages: [{
    role: "user",
    content: [
      { type: "text", text: "这张图里是什么？" },
      { type: "image_url", image_url: { url: "https://example.com/photo.jpg" } },
    ],
  }],
});

LLM 的局限性

局限	说明	应对
幻觉	可能编造不存在的事实	让模型引用来源，人工验证
知识截止	训练数据有截止日期	用 RAG 补充最新知识
上下文限制	能处理的文本长度有限	分段处理，使用长上下文模型
数学计算	复杂计算可能出错	让模型调用计算工具

🎯 AI编程小贴士：把大语言模型当成一个"超级实习生"——它知识渊博、学习能力强，但有时会犯错。关键代码一定要自己审查，不要盲目信任 AI 的输出。

小结

大语言模型是通过海量文本训练的 AI，能理解和生成语言
核心原理是预测下一个最可能的词
通过 API 调用（如 OpenAI API）就能使用
Token 是计费单位，Temperature 控制创造性
主流模型：GPT-4、Claude、Gemini、Llama、DeepSeek
LLM 可能"幻觉"，关键输出需要人工验证