AI知识篇
什么是神经网络
模仿大脑的计算方式
神经网络(Neural Network) 是一种受人脑启发的计算模型。人脑有数十亿个神经元通过突触连接,神经网络用数学的方式模仿了这种结构。
💡 类比:人脑通过大量神经元协作来识别一张猫的照片。神经网络也类似——大量简单的"计算节点"协作,最终做出判断。
加载图表中...
神经网络的结构
一个典型的神经网络由三层组成:
加载图表中...
| 层 | 作用 | 类比 |
|---|---|---|
| 输入层 | 接收原始数据 | 你的眼睛看到图片 |
| 隐藏层 | 处理和提取特征 | 大脑分析图片的形状、颜色 |
| 输出层 | 给出最终结果 | 大脑判断"这是一只猫" |
神经网络是怎么"学习"的?
1. 前向传播:做预测
数据从输入层流向输出层,每个连接有一个权重(weight),节点对输入进行加权求和:
输入: [图片的像素数据]
↓ × 权重 + 偏置
隐藏层计算
↓ × 权重 + 偏置
输出: [猫: 60%, 狗: 40%] ← 预测结果
2. 计算误差:对比答案
把预测结果和正确答案对比,计算"错了多少":
预测: 猫 60%
正确答案: 猫 100%
误差: 40% ← 需要改进
3. 反向传播:调整权重
根据误差,从后往前调整每个连接的权重,让下次预测更准:
加载图表中...
4. 重复训练
用大量数据重复以上过程,权重逐渐优化,预测越来越准:
加载图表中...
一个直观的例子:识别手写数字
加载图表中...
- 输入:28×28 = 784 个像素值
- 输出:10 个数字(0-9)的概率
- 选概率最高的作为答案
关键概念速查
| 概念 | 含义 | 类比 |
|---|---|---|
| 权重(Weight) | 连接的强度 | 神经元之间突触的强弱 |
| 偏置(Bias) | 节点的阈值 | 神经元的激活门槛 |
| 激活函数 | 决定节点是否"激活" | 神经元是否发出信号 |
| 学习率 | 每次调整的幅度 | 学习的步子大小 |
| 损失函数 | 预测与真实的差距 | 考试的扣分规则 |
| epoch | 训练一轮 | 把所有题目做一遍 |
神经网络的类型
加载图表中...
| 类型 | 擅长 | 代表应用 |
|---|---|---|
| 全连接(FNN) | 基础分类 | 简单预测 |
| 卷积(CNN) | 图像处理 | 人脸识别、自动驾驶 |
| 循环(RNN/LSTM) | 序列数据 | 语音识别(已被替代) |
| Transformer | 一切任务 | GPT、Claude、Stable Diffusion |
Transformer 架构是当前 AI 革命的核心,几乎所有大语言模型都基于它。
开发者需要了解多深?
作为 AI 编程的使用者,你不需要自己训练神经网络。但理解基本原理能帮你:
| 理解什么 | 有什么用 |
|---|---|
| 模型是"学出来的" | 理解为什么 AI 有时会出错 |
| 训练需要大量数据 | 理解为什么数据质量很重要 |
| 权重决定行为 | 理解为什么不同模型有不同能力 |
| 输出是概率 | 理解为什么 AI 的回答不是确定性的 |
🎯 AI编程小贴士:不需要手动实现神经网络。现代开发者通过 API 调用训练好的模型即可。如果想体验训练过程,可以让 AI 帮你写一个"用 PyTorch 训练手写数字识别模型"的示例代码。
小结
- 神经网络是模仿人脑结构的计算模型
- 由输入层、隐藏层、输出层组成
- 通过前向传播做预测,通过反向传播调整权重来学习
- Transformer 是当前最重要的神经网络架构
- 开发者主要通过调用 API 使用训练好的模型,不需要自己训练