AI知识篇
什么是大语言模型
能"说人话"的AI
大语言模型(Large Language Model,LLM) 是一种通过海量文本训练出来的 AI 模型,能够理解和生成人类语言。ChatGPT、Claude、Gemini 都是大语言模型。
💡 类比:大语言模型就像一个读了全世界图书馆所有书的超级学者——你问它任何问题,它都能用流畅的语言回答。
加载图表中...
大语言模型的"大"在哪里?
"大"体现在三个维度:
加载图表中...
| 维度 | 具体数值 |
|---|---|
| 参数量 | GPT-4 约 1.8 万亿参数 |
| 训练数据 | 数万亿 token(互联网文本) |
| 训练成本 | 数千万到上亿美元 |
| 训练时间 | 数月 |
LLM 的工作原理:预测下一个词
大语言模型的核心能力其实很简单——预测下一个最可能的词:
输入: "今天天气"
模型预测: "真" (概率最高)
→ "今天天气真"
模型预测: "好" (概率最高)
→ "今天天气真好"
加载图表中...
就是这个简单的机制,加上海量的参数和训练数据,就产生了令人惊叹的智能表现。
主流大语言模型
| 模型 | 公司 | 特点 |
|---|---|---|
| GPT-4 | OpenAI | 综合能力强,生态丰富 |
| Claude | Anthropic | 长文本、推理能力强、更安全 |
| Gemini | 多模态、与Google生态集成 | |
| Llama | Meta | 开源、可本地部署 |
| DeepSeek | DeepSeek | 国产开源、性价比高 |
| Qwen | 阿里 | 国产、中文能力强 |
加载图表中...
如何使用大语言模型
方式一:通过 API 调用
// 调用 OpenAI API
const response = await fetch("https://api.openai.com/v1/chat/completions", {
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-your-api-key",
},
body: JSON.stringify({
model: "gpt-4",
messages: [
{ role: "system", content: "你是一个有用的助手" },
{ role: "user", content: "用JavaScript写一个冒泡排序" },
],
temperature: 0.7, // 控制创造性(0=确定性,1=随机性)
}),
});
const data = await response.json();
console.log(data.choices[0].message.content);
方式二:通过 SDK 调用
// 使用 OpenAI 官方 SDK(更简洁)
import OpenAI from "openai";
const openai = new OpenAI({ apiKey: process.env.OPENAI_API_KEY });
const completion = await openai.chat.completions.create({
model: "gpt-4",
messages: [
{ role: "user", content: "解释什么是递归" },
],
});
console.log(completion.choices[0].message.content);
关键概念
Token:模型的"计量单位"
LLM 不是按字数收费,而是按 Token 计费。Token 是模型处理文本的最小单位:
英文: "Hello, World!" → 4 tokens
中文: "你好世界" → 2-4 tokens(取决于分词方式)
| 概念 | 说明 |
|---|---|
| Token | 文本的最小处理单位(词或子词) |
| 上下文窗口 | 模型一次能处理的最大 Token 数 |
| 输入 Token | 你发送给模型的内容 |
| 输出 Token | 模型生成的回复 |
Temperature:控制"创造力"
加载图表中...
System Prompt:设定模型角色
messages: [
// System prompt 设定模型的行为方式
{ role: "system", content: "你是一位经验丰富的React开发专家,回答要简洁,包含代码示例" },
// 用户消息
{ role: "user", content: "怎么用useEffect获取数据?" },
]
多模态:不只是文字
现代 LLM 不只能处理文字,还能理解图片、音频甚至视频:
加载图表中...
// 多模态示例:让AI分析图片
const response = await openai.chat.completions.create({
model: "gpt-4o",
messages: [{
role: "user",
content: [
{ type: "text", text: "这张图里是什么?" },
{ type: "image_url", image_url: { url: "https://example.com/photo.jpg" } },
],
}],
});
LLM 的局限性
| 局限 | 说明 | 应对 |
|---|---|---|
| 幻觉 | 可能编造不存在的事实 | 让模型引用来源,人工验证 |
| 知识截止 | 训练数据有截止日期 | 用 RAG 补充最新知识 |
| 上下文限制 | 能处理的文本长度有限 | 分段处理,使用长上下文模型 |
| 数学计算 | 复杂计算可能出错 | 让模型调用计算工具 |
🎯 AI编程小贴士:把大语言模型当成一个"超级实习生"——它知识渊博、学习能力强,但有时会犯错。关键代码一定要自己审查,不要盲目信任 AI 的输出。
小结
- 大语言模型是通过海量文本训练的 AI,能理解和生成语言
- 核心原理是预测下一个最可能的词
- 通过 API 调用(如 OpenAI API)就能使用
- Token 是计费单位,Temperature 控制创造性
- 主流模型:GPT-4、Claude、Gemini、Llama、DeepSeek
- LLM 可能"幻觉",关键输出需要人工验证