首页 最新 热门 推荐

  • 首页
  • 最新
  • 热门
  • 推荐

深度学习GPU训练中常见的问题

  • 25-02-17 00:03
  • 4298
  • 9921
blog.csdn.net

1.optimization_pass.cc:185] None of the MLIR Optimization Passes are enabled (registered 2)

这个问题一般不会影响训练,主要原因是显存不足

解决方法也很简单,1.修改batch_size的大小 2.将数据不要一次加载完,每循环一次加载一次数据。

2. ‘dtensor’报错

 ‘dtensor’报错也特别常见,问题原因是keras版本比tensorflow高造成的

首先在终端查看           pip show keras                  pip show tensorflow

将keras版本和tensorflow统一就可以。

3.failed call to cuInit: CUDA_ERROR_NO_DEVICE: no CUDA-capable device is detected

这个问题首先要确保cuda 和 cuDNN安装没有问题时(显卡的问题),在开头添加如下代码

import tensorflow as tf

config = tf.compat.v1.ConfigProto()
config.gpu_options.allow_growth = True
session = tf.compat.v1.InteractiveSession(config=config)

4.运行时‘cudart64_110.dll‘等文件确实造成的错

这类问题一般都是版本问题造成的,首先在cuda根路径下(一般都是C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.1\bin)搜索这几个文件的前缀,不要加版本,一般都可以搜到,将文件名改成报错信息需要的版本即可。

要是路径下找不到文件,可借助小工具everything全盘搜索,一般conda目录下会有,拷贝到bin目录下就好了。宗旨就是要啥找啥,版本不一样要什么版本就改成什么版本。

注:本文转载自blog.csdn.net的嘎嘎热。的文章"https://blog.csdn.net/m0_63451148/article/details/132334510"。版权归原作者所有,此博客不拥有其著作权,亦不承担相应法律责任。如有侵权,请联系我们删除。
复制链接
复制链接
相关推荐
发表评论
登录后才能发表评论和回复 注册

/ 登录

评论记录:

未查询到任何数据!
回复评论:

分类栏目

后端 (14832) 前端 (14280) 移动开发 (3760) 编程语言 (3851) Java (3904) Python (3298) 人工智能 (10119) AIGC (2810) 大数据 (3499) 数据库 (3945) 数据结构与算法 (3757) 音视频 (2669) 云原生 (3145) 云平台 (2965) 前沿技术 (2993) 开源 (2160) 小程序 (2860) 运维 (2533) 服务器 (2698) 操作系统 (2325) 硬件开发 (2491) 嵌入式 (2955) 微软技术 (2769) 软件工程 (2056) 测试 (2865) 网络空间安全 (2948) 网络与通信 (2797) 用户体验设计 (2592) 学习和成长 (2593) 搜索 (2744) 开发工具 (7108) 游戏 (2829) HarmonyOS (2935) 区块链 (2782) 数学 (3112) 3C硬件 (2759) 资讯 (2909) Android (4709) iOS (1850) 代码人生 (3043) 阅读 (2841)

热门文章

101
推荐
关于我们 隐私政策 免责声明 联系我们
Copyright © 2020-2025 蚁人论坛 (iYenn.com) All Rights Reserved.
Scroll to Top