AI知识篇

什么是神经网络

模仿大脑的计算方式

神经网络(Neural Network) 是一种受人脑启发的计算模型。人脑有数十亿个神经元通过突触连接,神经网络用数学的方式模仿了这种结构。

💡 类比:人脑通过大量神经元协作来识别一张猫的照片。神经网络也类似——大量简单的"计算节点"协作,最终做出判断。

加载图表中...

神经网络的结构

一个典型的神经网络由三层组成:

加载图表中...
作用类比
输入层接收原始数据你的眼睛看到图片
隐藏层处理和提取特征大脑分析图片的形状、颜色
输出层给出最终结果大脑判断"这是一只猫"

神经网络是怎么"学习"的?

1. 前向传播:做预测

数据从输入层流向输出层,每个连接有一个权重(weight),节点对输入进行加权求和:

输入: [图片的像素数据]
  ↓ × 权重 + 偏置
隐藏层计算
  ↓ × 权重 + 偏置
输出: [猫: 60%, 狗: 40%]  ← 预测结果

2. 计算误差:对比答案

把预测结果和正确答案对比,计算"错了多少":

预测: 猫 60%
正确答案: 猫 100%
误差: 40%  ← 需要改进

3. 反向传播:调整权重

根据误差,从后往前调整每个连接的权重,让下次预测更准:

加载图表中...

4. 重复训练

用大量数据重复以上过程,权重逐渐优化,预测越来越准:

加载图表中...

一个直观的例子:识别手写数字

加载图表中...
  • 输入:28×28 = 784 个像素值
  • 输出:10 个数字(0-9)的概率
  • 选概率最高的作为答案

关键概念速查

概念含义类比
权重(Weight)连接的强度神经元之间突触的强弱
偏置(Bias)节点的阈值神经元的激活门槛
激活函数决定节点是否"激活"神经元是否发出信号
学习率每次调整的幅度学习的步子大小
损失函数预测与真实的差距考试的扣分规则
epoch训练一轮把所有题目做一遍

神经网络的类型

加载图表中...
类型擅长代表应用
全连接(FNN)基础分类简单预测
卷积(CNN)图像处理人脸识别、自动驾驶
循环(RNN/LSTM)序列数据语音识别(已被替代)
Transformer一切任务GPT、Claude、Stable Diffusion

Transformer 架构是当前 AI 革命的核心,几乎所有大语言模型都基于它。

开发者需要了解多深?

作为 AI 编程的使用者,你不需要自己训练神经网络。但理解基本原理能帮你:

理解什么有什么用
模型是"学出来的"理解为什么 AI 有时会出错
训练需要大量数据理解为什么数据质量很重要
权重决定行为理解为什么不同模型有不同能力
输出是概率理解为什么 AI 的回答不是确定性的

🎯 AI编程小贴士:不需要手动实现神经网络。现代开发者通过 API 调用训练好的模型即可。如果想体验训练过程,可以让 AI 帮你写一个"用 PyTorch 训练手写数字识别模型"的示例代码。

小结

  • 神经网络是模仿人脑结构的计算模型
  • 输入层、隐藏层、输出层组成
  • 通过前向传播做预测,通过反向传播调整权重来学习
  • Transformer 是当前最重要的神经网络架构
  • 开发者主要通过调用 API 使用训练好的模型,不需要自己训练