3090 pytorch编译记录_ms/iter-程序员宅基地

技术标签: github  机器学习  pytorch  

一、环境配置

编译的本地环境如下:

gpu : RTX 3090
ubuntu 20.04
gcc 9.3.0
driver : 460.56
CUDA : 11.2
CUDNN : 8.1.0
python :3.6.12
pytorch : 1.7.1
torchvision : 0.8.2
torchtext : 0.8.1
  1. pytorch、torchtext、torchvision 需要在同一个环境编译,编译顺序为: pytorch > torchvision > torchtext 
  2. torchvision 0.8 需要 cuda 11.2 ,最好预先确定驱动
  3. 编译的环境需要git checkout 相应的版本如
    git checkout v1.7.1  #导出 1.7.1版本的pytorch

     

  4. git clone 某些中间资源站点不在国内,速度会很慢,甚至下载不下来,自备梯子。 clone 过程中会自动在系统的临时缓存区下载文件,所以在一台电脑clone之后到别的电脑可能无法使用。

二、编译

  1. 编译完成之后在 build  目录会有编译结果,如果需要重新编译,删除即可。
  2. 编译完成时,conda环境使用pip安装时无法辨识编译的包,例如,编译的pytorch版本 V1.7.1 最后在conda环境中被认为时1.70aa+。这就导致安装时需要先安装依赖pytorch的包,再卸载pytorch ,最后执行
python setup.py install

即可将编译的结果拷贝到conda环境中

  1. 测试pytorch速度的代码,从pytorch的官方人员copy的
import torch
import torch.nn as nn
from torch.cuda.amp import autocast, GradScaler
import time
from torchvision.models import resnet152

torch.backends.cudnn.benchmark = True


class model(nn.Module):
    def __init__(self):
        super(model, self).__init__()
        self.resnet = resnet152()
        self.linear = nn.Sequential(nn.Linear(1000, 250),
                                    nn.Linear(250, 64),
                                    nn.Linear(64, 32),
                                    nn.Linear(32, 10),
                                    nn.ReLU())

    def forward(self, x):
        out = self.resnet(x)
        out = self.linear(out)

        return out

dtype = torch.float16
x = torch.randn(32, 3, 224, 224).cuda(0).to(dtype)
y = torch.randint(0, 10, (32,)).cuda(0)
m = model().cuda(0).to(dtype)
criterion = nn.CrossEntropyLoss()
optim = torch.optim.Adam(m.parameters(), 1e-4)

# warmup
for _ in range(10):
    m.zero_grad()
    output = m(x)
    loss = criterion(output, y)
    loss.backward()

nb_iters = 100

torch.cuda.synchronize()
t0 = time.time()
for _ in range(nb_iters):
    m.zero_grad()
    output = m(x)
    loss = criterion(output, y)
    loss.backward()

torch.cuda.synchronize()
t1 = time.time()
print('{:.3f}ms per iter'.format((t1 - t0)/nb_iters * 1000.))

官方测试的速度为(3090环境 ) : 160ms/iter  编译前速度和官方时间差不多,编译之后我们的速度为 110ms/iter 

三、 编译资源

pytorch官网

tochviosn官网

torchtext官网

 

 

 

 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_37752503/article/details/115001568

智能推荐

NodeJS使用淘宝 NPM 镜像/NPM使用国内源_npm.taobao.org-程序员宅基地

文章浏览阅读4.6k次,点赞2次,收藏2次。NodeJS使用淘宝 NPM 镜像/NPM使用国内源这是一个完整npmjs.org镜像,你可以用此代替官方版本(只读),同步频率目前为10分钟一次以保证尽量与官方服务同步。当前registry.npm.taobao.org是从r.cnpmjs.org进行全量同步的. 当前npm.taobao.org运行版本是:[email protected] 本..._npm.taobao.org

经纬度转换为三维坐标_经纬度转3d-程序员宅基地

文章浏览阅读6.1k次。// 经纬度转换为球坐标double torad(double deg){ return deg/180*acos(-1);}void get_coordinate(double R,double lat,double lng,double &x,double &y,double z){ lat = torad(lat); lng = torad(lng);_经纬度转3d

室内设计——办公楼创意室内设计(包含预览图jpg和.psd文件)_办公楼内部设计-程序员宅基地

文章浏览阅读292次。一、描述 本设计用朴素的手法表现空间的本)质,传达文化的内涵。营造出一个个充满张力、层次丰富的办公空间。 各区域即独立又相互融合,亦可根据公司的使用和发展灵活调配。空间布局上层次分明,以树枝的络脉走向自然过渡到每个办公空间,用简洁的线条表现形式美,再配以恰到好处的灯光,营造出一个简洁明朗、自然通透的现代空间。二、效果图相关资源:室内设计——办公楼创意室内设计(包含预览图jpg和.psd文件).zip..._办公楼内部设计

【IDL】使用IDL对Landsat系列进行批量水体提取_landsat8的idl处理代码-程序员宅基地

文章浏览阅读3.5k次,点赞4次,收藏28次。目录landsat8landsat8_landsat8的idl处理代码

简单学习rxjs中map、concatAll、concatMap、mergeAll、mergeMap、switchAll、switchMap_concatall() mergeall-程序员宅基地

文章浏览阅读7.5k次,点赞3次,收藏7次。1、mapmap和javascript中的数组的map方法类似,不过这里为了结合下面的demo,我先用map做一个我们不想要的效果: const getData = (param) => { return of(`return: ${param}`).pipe( delay(Math.random() * 1000) ) }; from([1, ..._concatall() mergeall

建立第一篇hexo博客_hexo新建博客-程序员宅基地

文章浏览阅读735次。* 发布文章 * 过程: 先进入blog所在的文件夹,在终端输入 进入blog所在文件夹每次部署的步骤,三步 - hexo clean - hexo generate - hexo deploy* 增加tag * hexo new page ‘blog' 在source里面多了个目录life,里面有个index.md,也可以手动建立。页面格式和文章一样接着把链接加上th..._hexo新建博客

随便推点

如何评估随机森林模型以及重要预测变量的显著性-程序员宅基地

文章浏览阅读4.7w次,点赞63次,收藏334次。如何评估随机森林模型以及重要预测变量的显著性说到随机森林(random forest,RF),想必很多同学都不陌生了,毕竟这些机器学习方法目前非常流(fàn)行(làn)……白鱼同学也曾分..._incnodepurity

MEMS为何独领风骚?看完这篇秒懂!-程序员宅基地

文章浏览阅读1k次,点赞2次,收藏6次。显微镜下的MEMS结构(注意图片上的刻度,是微米哦)文章来源:硬件十万个为什么卡西欧早年就以电机马达、继电器等机电产品闻名。如今的卡西欧本身就是MEMS的制造商之一,用MEMS的思路解决..._soc。mems

IDEA 创建Spring Boot 项目&整合jdbc详细步骤_idea2022.2.5-程序员宅基地

文章浏览阅读3.2w次,点赞48次,收藏33次。IntelliJ IDEA 创建Spring Boot 项目&整合jdbc详细步骤_idea2022.2.5

Windows Server2019安装详细步骤_windows server 2019安装教程-程序员宅基地

文章浏览阅读2.3w次,点赞11次,收藏73次。Windows Server2019安装详细教程_windows server 2019安装教程

关于Linux中的DenyHosts安装后导致自己IP被拉黑的问题-程序员宅基地

文章浏览阅读457次。关于这个问题我是第一次写,重点是本人上班第一天就碰到了。解决时间四小时方法亲测首先删除 /etc/hosts.deny中自己的ip删除 有可能不止一个然后在/etc/hosts.allow中添加自己的ip转载于:https://www.cnblogs.com/long777/p/7337617.html..._denyhosts经常拉黑

vue-awesome-swiper获取当前页的索引值_swiper4 当前页索引值-程序员宅基地

文章浏览阅读4.7k次。html<swiper ref="mySwiper" :options="swiperOptions"> <swiper-slide>Slide 1</swiper-slide> <swiper-slide>Slide 2</swiper-slide> <swiper-slide>Slide 3</swiper-slide> <swiper-slide>Slide 4</s_swiper4 当前页索引值

推荐文章

热门文章

相关标签