[debug] PyTorch报错:ConnectionResetError: [Errno 104] Connection reset by peer_pytorch issue connection reset by peer-程序员宅基地

技术标签: python  深度学习  pytorch  BUG解决  Python  

问题描述:

使用PyTorch 1.10.0,训练报错:

ConnectionResetError: [Errno 104] Connection reset by peer

问题解析

参见pytorch的issue

I believe the issue is only triggered for the case that both
persistent_workers and pin_memory are turned on and iteration is
terminated at the time that worker is sending data to queue. First,
persistent worker would keep iterator with workers running without
proper cleaning up (using __del__ in _MultiProcessingDataLoaderIter.
And, if any background worker (daemon process) is terminated when it
is sending data to the _worker_result_queue, such Error would be
triggered as the pin_memory_thread want to get such data from Queue.

I can send a PR

解决方法

目前的解决方法是增大batchsize,或者可以尝试issue中的其他方法

I have experienced this issue as well where the dataloader exits with a ConnectionResetError: [Errno 104] Connection reset by peer error. I observed that this error goes away away with either a) adding a sleep, or b) using larger batch sizes. I suspect there is race condition that is triggered if the dataloader completes very quickly. I am running Pytorch 1.10.

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_41683065/article/details/122643637

智能推荐

【附源码】计算机毕业设计老来福平台(java+springboot+mysql+mybatis+论文)-程序员宅基地

文章浏览阅读384次,点赞4次,收藏6次。后端服务接收到请求后,执行相应的业务逻辑处理,这通常包括与MySQL数据库的交互,如查询数据、插入记录、更新或删除数据等操作。这样,前端Vue.js和后端Spring Boot框架的接口紧密协作,而MySQL数据库则作为数据存储和管理的核心,确保了整个系统的数据一致性和高效处理。随着社会老龄化趋势的加剧,为老年人提供全面的健康管理和生活服务已成为社会关注的热点。因此,开发一个便捷、高效、人性化的老来福平台,能够更好地服务于老年人的生活,提高他们的生活质量,对于促进社会和谐和老年人幸福感具有重要的社会价值。

JavaWeb-程序员宅基地

文章浏览阅读266次。web标准的构成包括结构(html):对于网页元素进行整理和分类,表现(css):用于设置网页元素的版本,颜色,大小等外观yan's'g,行为(JavaScript)。

开心电视助手6.0版本-电视盒子 系统刷机 解锁限制工具-程序员宅基地

文章浏览阅读839次,点赞10次,收藏8次。开心电视助手是一款针对安卓设备打造的远程管理工具。我们有了这个软件就可以非常方便管理自己的智能设备了,比如说盒子电视都可以轻松支持,还可以远程安装各种电视APP,方便用户的使用和安装应用,新的版本还支持刷第三方固件。_开心电视助手6.0版本

JPA原理分析-程序员宅基地

文章浏览阅读1.8k次。零.背景和题外话工作中经常用到JPA去做CURD。出于对某事物全部或部分属性空白时,本能的想添加此事物的属性的内在心理,正好手上有在搭一个新的练手项目,于是开启了Debug分析之旅。读完这篇文章,你将从源码层面明白JPA是如何工作的。值得注意的是:**JPA是一个规范,而非像Hibernate一样是一个解决方案。**这一点在后文也将有所体现。目录零.背景和题外话一.Dao的接口分析二.调用过程分析三.完整过程总结一.Dao的接口分析这是一个基本的Dao接口。如图:重点就在JpaRep_jpa原理

嵌入式WIFI芯片通过lwip获取心知天气实时天气信息和时间信息(包含完整代码)_嵌入式wifi芯片通过lwip获取心知天气实时天气信息和时间信息(包含完整代码)-程序员宅基地

文章浏览阅读1.3k次,点赞29次,收藏21次。本文讲解了如何在嵌入式端通过LWIP TCP的方式获取天气状况,文中包含了完整的代码,适合初学者了解和使用。_嵌入式wifi芯片通过lwip获取心知天气实时天气信息和时间信息(包含完整代码)

实现Ant Design Tree组件的节点的增删改_基于 ant design vue实现tree的增删改-程序员宅基地

文章浏览阅读6k次,点赞4次,收藏33次。实现Ant Design Tree组件的节点的增删改在做项目时最近遇到一个需求,需要用到Antd中的tree,并能够实现对tree的节点的增加和删除,以及节点名称的修改。去翻Antd官网文档,发现tree组件并没有提供关于节点操作的api,但是有鼠标右击的api。借助这个鼠标右击,以及其他组件是可以实现对节点的增删改。下面进行截图介绍:截图介绍第一部分:Tree组件最外层节点只能增加子节点父节点可以增加子节点,修改自己的节点名称,删除节点3.最内层节点不允许再添加子节点,只允许修改自己的_基于 ant design vue实现tree的增删改

随便推点

es导入与导出:taskrabbit/elasticsearch-dump_索引导出 es-程序员宅基地

文章浏览阅读2.2k次。es导入与导出:taskrabbit/elasticsearch-dump_索引导出 es

执行 xhost + 出现 unable to open display 解决办法-程序员宅基地

文章浏览阅读2k次,点赞2次,收藏2次。linux解决xhost +: unable to open display 实用技巧:在Linux下设置xhost方法步骤 ..._linux执行xhost +显示unable to open display

pandas学习第三天_自主创建一个包含8个以上元素的series-程序员宅基地

文章浏览阅读390次。文章目录pandas 索引序列以及二维数组的索引重复索引多层索引pandas 索引序列以及二维数组的索引#np.random.rand(d0,d1,d2……dn) 注:使用方法与np.random.randn()函数相同 作用: 通过本函数可以返回一个或一组服从“0~1”均匀分布的随机样本值。随机样本取值范围是[0,1),不包括1。 应用:在深度学习的Dropout正则化方法中,可..._自主创建一个包含8个以上元素的series

html的一些小demo总结_简单的html demo-程序员宅基地

文章浏览阅读1.3k次。1.下拉框: 全部 ">_简单的html demo

MyBatis-程序员宅基地

文章浏览阅读245次。MyBatis是一个java数据持久层框架,通过将sql语句与java对象的映射配置在xml文件中,实现了简化数据库操作的功能,使得开发者更方便的对数据库进行操作.当执行相同查询时,mybatis会将查询结果缓存到内存中,下次查询时,会直接上缓存中获取数据,而不会去数据库中执行查询操作。mybatis本地缓存是默认开启的,指在同一个sqlSession中,对相同的查询进行缓存。${}是字符串替换的方式在sql语句中,{}会直接替换成参数的值,不会进行预编译处理。${}和#{}都是用来传参的。

python中turtle怎么画万花筒,python中turtle怎么画半圆-程序员宅基地

文章浏览阅读623次,点赞14次,收藏18次。大家好,本文将围绕用python的turtle画炫酷的图展开说明,python中turtle怎么画万花筒是一个很多人都想弄明白的事情,想搞清楚python中turtle怎么画半圆需要先了解以下几个事情。