【PyTorch】手把手带你快速搭建PyTorch神经网络
创始人
2025-05-31 08:43:03

手把手带你快速搭建PyTorch神经网络

  • 1. 定义一个Class
  • 2. 使用上面定义的Class
  • 3. 执行正向传播过程
  • 4. 总结顺序
  • 相关资料

话不多说,直接上代码

1. 定义一个Class

如果要做一个神经网络模型,首先要定义一个Class,继承nn.Module,也就是import torch.nn as nn,示例如下:

import torch.nn as nn
import torch.nn.functional as Fclass Net(nn.Module):def __init__(self):super().__init__()self.conv1 = nn.Conv2d(1,6,5)self.conv2 = nn.Conv2d(6,16,5)def forward(self, x):x = F.max_pool2d(F.relu(self.conv1(x)), 2)x = F.max_pool2d(F.relu(self.conv2(x)), 2)return x

这里,我们把class的名字就叫成Net。Class里面主要写两个函数,一个是初始化的__init__函数,另一个是forward函数。

  • __init__里面就是定义卷积层,先super()一下,给父类nn.Module初始化一下。在这个__init__里边主要定义就是卷积层。比如第一层,我们叫它conv1,把它定义成输入1通道,输出6通道,卷积核5*5的的一个卷积层。conv2同理。
  • forward里边是真正执行数据的流动。比如上面的代码,输入的x先经过定义的conv1(这个名字是自己起的),再经过激活函数F.relu()(这里源自import torch.nn.functional as F,F.relu()是官方提供的函数)。当然如果在__init__里面把relu定义成了myrelu,那这里直接第一句话就成了x=F.max_pool2d(myrelu(self.conv1(x)),2)。下一步的F.max_pool2d池化也是一样的。在一系列流动以后,最后把x返回到外面去。

需要强调的是:

  1. 注意前后输出通道和输入通道的一致性。不能第一个卷积层输出4通道第二个输入6通道,这样就会报错。
  2. 它和我们常规的python的class还有一些不同

2. 使用上面定义的Class

先定义一个Net的实例,毕竟Net只是一个类不能直接传参数

net=Net()

然后,就可以往里边传入x了。假设已经有一个要往神经网络的输入的数据“input"(这个input应该定义成tensor类型),在传入的时候,

output=net(input)

注意:在常规python编程中,一般向class里面传入一个数据x,在class的定义里面,应该是把这个x作为形参传入__init__函数里的,而在上面的定义中,x作为形参是传入forward函数里面的。其实也不矛盾,因为在定义net的时候,是net=Net(),并没有往里面传入参数。如果想初始化的时候按需传入,则需要在__init__中增加需要传入的参数,然后把需要的传入进去即可。

3. 执行正向传播过程

在网络net定义好以后,就涉及到传入参数,计算误差,反向传播,更新权重等等,这些不太容易记住这些东西的格式和顺序。但是我们可以将这个过程理解为一次正向传播,需要把这一路上的输入x都计算出来。在计算的过程中要想让网络输出output与期望的ground truth差不多,就需要不断缩小二者的差距,这个差距就是目标函数(object function)或者称为损失函数。

如果损失函数loss趋近于0,那么自然就达到目的了。但是损失函数loss基本上没法达到0,但是仍然希望能让它达到最小值,那么这个做的方式是它能按照梯度进行下降。

那么神经网络怎么才能达到按照梯度下降呢?或者说是怎么调整自己使得loss函数趋近于0。它只能不断修改权重,比如y=wx+b,x是给定的,它只能改变w和b,让最后的输出y尽可能接近希望的y值,这样损失loss就越来越小。

如果loss对于输入x的偏导数接近0了,是不是就意味着到达了一个极值吗?而l在你的损失函数计算方式已经给定的情况下,loss对于输入x的偏导数的减小,其实只能通过更新参数卷积层参数W来实现。

所以,通过下述方式实现对W的更新:

  1. 先算loss对于输入x的偏导数。当然网络好几层,这个x指的是每一层的输入,而不是最开始的输入input
  2. 对第1步的结果再乘以一个步长,这样就相当于是得到一个对参数W的修改幅度
  3. 用W减掉这个修改幅度,完成一次对参数W的修改。

具体过程代码如下:

compute_loss=nn.MSELoss()  # 定义损失函数
loss=compute_loss(target,output)  # 把神经网络net的输出,和标准答案target传入进去
loss.backward()   # 算出loss,下一步就是反向传播

到这里,就把上面的第1步完成了,得到对参数W一步的更新量,算是一次反向传播。

当然搞深度学习不可能只用官方提供的loss函数,所以如果要想用自己的loss函数。必须也把loss定义成上面Net的样子,它也是继承nn.Module,把传入的参数放进forward里面,具体的loss在forward里面算,最后return loss。__init__()就空着,写个super().__init__就行了。

在反向传播之后,对于第2步和第3步的计算,就需要用到优化器来实现,让优化器来自动实现对网络权重W的更新:

from torch import optim
optimizer=optim.SGD(net.parameters(),lr=0.001,momentum=0.9)

同样地,优化器也是一个类,先定义一个实例optimizer,然后使用其中的一个优化器方法。注意在optimizer定义的时候,需要给SGD传入了net的参数parameters,这样优化器就掌握了对网络参数的控制权,就能够对它进行修改了。同时传入的时候把学习率lr也传进去。

注意,在每次迭代之前,先把optimizer里存的梯度清零一下,因为W已经更新过的“更新量”下一次就不需要用了。

optimizer.zero_grad()

在loss.backward()反向传播以后,更新参数:

optimizer.step()

4. 总结顺序

  1. 定义网络:写网络Net的Class,声明网络的实例net=Net();
  2. 定义优化器:optimizer=optim.xxx(net.parameters(),lr=xxx);
  3. 定义损失函数:自己写class或者直接用官方的,例如compute_loss=nn.MSELoss()
  4. 开始循环过程:
    1. 首先,清空优化器里的梯度信息:optimizer.zero_grad();
    2. 再将input传入,output=net(input) ,开始正向传播
    3. 计算损失,loss=compute_loss(target,output)
    4. 误差反向传播,loss.backward()
    5. 更新参数,optimizer.step()

综上,这样就实现了一个基本的神经网络。大部分神经网络的训练都可以简化为这个过程,无非是传入的内容复杂,网络定义复杂,损失函数复杂等等。

相关资料

  1. 梯度下降算法原理讲解——机器学习
  2. 深度学习数学基础之链式法则

相关内容

热门资讯

Nginx可视化管理工具 - ... 一、介绍 nginx-proxy-manager 是一个反向代理管理系统,它基于Nginx,具有漂亮...
如何解除迅雷安全模式,迅雷怎样... 如何解除迅雷安全模式目录如何解除迅雷安全模式迅雷怎样解除安全模式迅雷VIP尊享版怎么解除安全模式?迅...
感谢朋友圈留言句子,适合发朋友... 感谢朋友圈留言句子目录感谢朋友圈留言句子适合发朋友圈表达感谢的句子20句发朋友圈的感谢短语有哪些?有...
关于韩娱的小说有没有什么好看的... 关于韩娱的小说有没有什么好看的目录关于韩娱的小说有没有什么好看的求好看的韩娱小说有没有好看的韩娱小说...
什么是表面粗糙度(什么是表面粗... 本篇文章极速百科给大家谈谈什么是表面粗糙度,以及什么是表面粗糙度?它对零件的使用性能有什么影响?对应...
永远用英语怎么说,“永远”除了... 永远用英语怎么说目录永远用英语怎么说“永远”除了“forever”的英文翻译~~还有哪些
少年音怎么练,怎么配出清爽的少... 少年音怎么练目录少年音怎么练怎么配出清爽的少年音?怎么学正太音少年音,像是龙马啊、镜音连啊不二啊那种...
情侣之间的爱称有哪些,情侣称呼... 情侣之间的爱称有哪些目录情侣之间的爱称有哪些情侣称呼有创意的爱称情侣之间好听的称呼都有什么?情侣爱称...
共享汽车怎么租车 极速百科网 ... 共享汽车怎么租车目录共享汽车怎么租车共享汽车怎么租车gofun出行有人开吗?使用方法是什么?共享汽车...
Python应用之爬虫基础:r... 引言 在生活中,大家都使用过浏览器,通过输入要搜索的内容以及鼠标点击等操...
jsp医疗辅助诊断管理系统se... 一、源码特点      JSP医疗辅助诊断管理系统是一套完善的java web信息管理系统ÿ...
db19密钥库和加密 创建密钥库ENCRYPTION_WALLET_LOCATION =(SOURCE =...
开局之年是什么意思(开局之年之... 本篇文章极速百科给大家谈谈开局之年是什么意思,以及开局之年之后是什么年对应的知识点,希望对各位有所帮...
抖音gga什么意思(抖音gg是... 本篇文章极速百科给大家谈谈抖音gga什么意思,以及抖音gg是什么意思对应的知识点,希望对各位有所帮助...
DMZ是什么(防火墙的dmz是... 今天给各位分享DMZ是什么的知识,其中也会对防火墙的dmz是什么进行解释,如果能碰巧解决你现在面临的...
风行SX6Sx6后视镜加热打不... 本篇文章极速百科给大家谈谈风行SX6Sx6后视镜加热打不开,以及东风风行sx6反光镜多少钱对应的知识...
CKA-17 Check Da... 文章目录Issue summary:Useful comment:1. 创建场景1.1...
elasticsearch的入... 目录一.数据聚合1.聚合的种类2.DSL实现聚合2.1.Bucket聚合语法2.2.聚合结果排序2....
成都男子误入停车场51秒收费8... 本篇文章极速百科给大家谈谈成都男子误入停车场51秒收费8元,属于乱收费吗,以及成都停车费贵对应的知识...
城市的路灯系统是如何控制开灯和... 本篇文章极速百科给大家谈谈城市的路灯系统是如何控制开灯和熄灯时间的?,以及路灯咋调制,路灯的时控开关...
对抗雾霾的有效方法(对抗雾霾的... 本篇文章极速百科给大家谈谈对抗雾霾的有效方法,以及对抗雾霾的有效方法英语作文对应的知识点,希望对各位...
Kubernetes集群 服务... Kubernetes集群 服务暴露 Traefik 一、认识traefik1.1 traefik简介...
广汽菲克Jeep指南者真实油耗... 本篇文章极速百科给大家谈谈广汽菲克Jeep指南者真实油耗多少,以及广汽菲克jeep指南者真实油耗多少...
关于OpenResty+dou... 关于OpenResty+doujiang24/lua-resty-kafka写入kafka故...
STM32产品命名规则,系统结... 产品系列 STM32系列芯片是由意法半导体(ST Microelectronics&...
souho(搜猴浏览器下载) ... 今天给各位分享souho的知识,其中也会对搜猴浏览器下载进行解释,如果能碰巧解决你现在面临的问题,别...
什么是金棘末(金棘末什么危害)... 今天给各位分享什么是金棘末的知识,其中也会对金棘末什么危害进行解释,如果能碰巧解决你现在面临的问题,...
徐州周边100公里自驾游景点(... 本篇文章极速百科给大家谈谈徐州周边100公里自驾游景点,以及徐州周边100公里自驾游景点有哪些对应的...
帮帮侠热评:盲人被撞前一秒被公... 本篇文章极速百科给大家谈谈帮帮侠热评:盲人被撞前一秒被公交司机拉回,以及盲人被撞前1秒被公交司机拉回...
【教程】使用ChatGPT制作... 目录 描述 代码 效果 说明 描述         给ChatGPT的描述内容: ...