PyTorch动态计算图的秘密：深度学习的python神器

2024-11-10

用过这么多框架，还真就 PyTorch 最对我胃口，代码写起来特别舒服，调试也方便，关键是整个框架设计得特别优雅。

动态计算图的秘密

PyTorch 最吸引人的地方就是它的动态计算图。跟 TensorFlow 1.x 那种静态图不一样，PyTorch 让你想怎么写代码就怎么写，不用提前定义好计算图，写着写着改主意也没问题。

import torch

# 创建一个简单的神经网络层

layer = torch.nn.Linear(2， 1)

x = torch.randn(1， 2) # 随机生成输入数据

# 动态执行前向传播

y = layer(x)

if y > 0：

y = y * 2 # 根据条件动态调整计算过程

print(y)

⚠️ 小贴士：

动态图模式下的调试特别方便，可以随时打断点看变量
计算图构建时就能发现错误，不用等到运行时才报错
Python 原生的控制流语句都能直接用，写代码特别自然

自动求导有多香

搞深度学习的都知道，反向传播可烦人了。PyTorch 的自动求导机制简直就是救星，你只要关心前向传播怎么写，反向传播它全帮你搞定。

# 创建需要求导的张量

x = torch.tensor([2.0]， requires_grad=True)

y = x * 2

z = y ** 2

# 反向传播

z.backward()

print(f“x的梯度： {x.grad}”) # 输出：8.0

干活这么多年，这种设计真是太舒服了，以前手写反向传播那些日子简直不堪回首。

模型定义这么简单

PyTorch 的模型定义特别符合直觉，想加层就加层，想改结构随时改，跟搭积木一样简单。

import torch.nn as nn

class MyNet(nn.Module)：

def __init__(self)：

super().__init__()

# 随手定义几个层

self.conv = nn.Conv2d(3， 64， kernel_size=3)

self.pool = nn.MaxPool2d(2)

self.fc = nn.Linear(64 * 14 * 14， 10)

def forward(self， x)：

x = self.pool(torch.relu(self.conv(x)))

return self.fc(x.view(x.size(0)， -1))

⚠️ 小贴士：

继承 nn.Module 的类必须实现 forward 方法
view 操作要格外注意维度，这是新手最容易栽跟头的地方
记得在 init 里调用 super(). init ()，不然会出问题

GPU 加速代码只需一行

要把模型放到 GPU 上训练，PyTorch 只需要一个 .to(‘cuda’) 就搞定了，不用改一行代码的逻辑。

# 模型和数据都转到 GPU

model = MyNet().to('cuda')

inputs = torch.randn(4， 3， 32， 32).to('cuda')

# 正常调用就行

outputs = model(inputs)

看着这么简单的代码，想想以前折腾 GPU 加速的日子，真是感慨万千。

生态系统有多强大

PyTorch 生态是真的香，啥都有：数据处理有 torchvision，自然语言有 torchtext，音频处理有 torchaudio。还有各种预训练模型可以直接用，比如：

import torchvision.models as models

# 加载预训练的 ResNet

resnet = models.resnet18(pretrained=True)

⚠️ 小贴士：

用预训练模型记得先调用 model.eval()
下载预训练模型可能比较慢，建议提前下好
模型都是在 ImageNet 上训练的，记得做输入预处理

这写代码写得太舒服了，工具齐全不说，api 设计得也特别合理，跟 Python 的风格特别搭。PyTorch 是真的给深度学习研究者带来了很大便利，尤其是那些想快速验证想法的人，简直就是神器啊。

来源：青言悉语

THE END

Python图形用户界面(GUI)开发 5个框架：Tkinter、PyQt...

<<上一篇

Python 3.13自由线程速度提升探索：能用于 CPU 密集型任务吗？

下一篇>>