0基础配置Linux工作站3：【非Root用户】支持GPU加速的Pytorch环境配置|电子爱好者

admin管理员组
文章数量:1633030

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言
一、查看系统及GPU的相关信息
- 1.查看系统
- 2.查看显卡
二、安装与GPU对应的CUDA
- 1.安装CUDA 相关依赖库
- 2.创建文件夹
- 3.下载CUDA文件
- 4.安装CUDA
三、安装Cudnn
- 1.创建文件夹
- 2.下载Cudnn
- 3.安装Cudnn
四、安装Pytorch
- 1.激活虚拟环境
- 2.安装Pytorch
2.1 常规流程安装
2.2 从清华源安装【0925更新，速度更快】
- 3.检验Pytorch
五、更新：CUDA安装（改环境变量版）
总结

前言

要跑深度学习所以需要装一下pytorch。这篇【教程】Linux环境下支持GPU加速的Pytorch、PyG、DGL环境配置步骤记录写得非常详细，基本是按照他的步骤配置的。
我的情况： 1.没有root权限 2.已经安装了gcc等依赖库 3.已经安装anaconda
关于工作站前续的连接和Anaconda安装，详见笔记：
0基础配置Linux工作站1：连接工作站
0基础配置Linux工作站2：配置Anaconda

#0924重要更新

可以先问一下工作站管理员能不能通过加环境变量的方法用上CUDA/Anaconda，如果像我一样每个用户自己安装cuda的话会把系统盘空间占满，sorry啊工作站酱。。。。。。。。。。sorry啊管理员酱。。。。。关于这一部分的方法我更新在第五部分了，Pytorch还是要自己装在虚拟环境的

#0925更新
更新从清华源下载Pytorch的方式；补充pytorch下载说明；补充Numpy安装说明

一、查看系统及GPU的相关信息

1.查看系统

gcc --version

我的运行结果：gcc (Ubuntu 11.4.0-1ubuntu1~22.04) 11.4.0

2.查看显卡

我的运行结果：有两块RTX4090，NVIDIA驱动版本550.107.02，支持CUDA 12.4

二、安装与GPU对应的CUDA

1.安装CUDA 相关依赖库

sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev

sudo apt install gcc-8 g++-8

如果不是root用户就把代码前面的sudo去掉。我这里显示：

问了下管理员，他说这些依赖库都已经装好了，所以跳过这一步

2.创建文件夹

在用户文件夹下创建用于安装CUDA的文件夹：

那么路径就是/home/qianchen/CUDA12.4.0，这个后面要用

3.下载CUDA文件

刚刚我们看到CUDA的支持版本是12.4，所以在官网https://developer.nvidia/cuda-toolkit-archive查找下载指令。

选择第一个

跟着教程选了一下：
这里最后一行的installer type一定要选runfile！前面两个deb都需要sudo权限（老铁我又踩坑了）

得到的下载指令：

输入第一句指令，等待大概20min完成下载

wget https://developer.download.nvidia/compute/cuda/12.4.0/local_installers/cuda_12.4.0_550.54.14_linux.run

4.安装CUDA

输入刚刚得到的第二句指令。由于没有权限，这里需要删除开头的sudo，即：

sh cuda_12.4.0_550.54.14_linux.run

进入安装界面，问是否接受，填accept：

接下来进入到配置界面，很重要！！
(1)光标移动到Driver，按空格，取消掉[X]里的X

(2)按↓键，光标移动到Options，enter进入

(3)光标移动到Toolkit Options，enter进入

(4)光标移动到Change Toolkit XXX，enter进入

(5)输入我们2.1里新建文件夹的路径，enter确认

(6)光标移动到Done，enter进入

(7)光标移动到Library install path，enter进入

(8)同理修改

(9)最后选择Done，退出

(10)光标移动到install，enter确认

(11)等待完成安装。出现红框里的字就代表安装成功！

(12)修改bashrc，命令行输入

vim ~/.bashrc

(13)按 i 键进入插入模式，在最后一行新插入以下代码，XXX是自己的路径：

export CUDA_HOME=$CUDA_HOME:/home/XXX/CUDA12.0.0
export PATH="/home/XXX/CUDA12.0.0/bin:$PATH"
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/XXX/CUDA12.0.0/lib64

我输入的：

(14)按esc，输入冒号wq，也就是:wq，回车
(15)回到主界面，激活bashrc，输入：

source ~/.bashrc

(16)验证CUDA Toolkit安装情况：

nvcc --version

如果返回了CUDA版本信息则安装成功。我的返回结果：

三、安装Cudnn

1.创建文件夹

在服务器建一个文件夹用于安装cudnn，比如我的：/home/qianchen/Cudnn

2.下载Cudnn

(1)CUDA的版本是12.4，在官网选择对应的版本：https://developer.nvidia/rdp/cudnn-archive

(2)下载对应的版本到本地（自己的电脑）

(3)在本地解压，这里可能会出现这个问题：

如果有这个弹窗的话，用管理员身份启动WinRAR，再打开压缩文件进行解压就可以了

3.安装Cudnn

(1)把解压后的这些文件上传到刚刚新建的文件夹里

上传完成的效果：

(2)在服务器端输入指令，跳转到Cudnn文件夹下：

cd /home/XXX/Cudnn

(3)将Cudnn文件夹下的文件复制到CUDA文件夹中，记得修改蓝色框里的部分：

cp /home/XXX/Cudnn/include/cudnn.h /home/XXX/CUDA12.0.0/include/
cp /home/XXX/Cudnn/lib/libcudnn* /home/XXX/CUDA12.0.0**/lib64/

(4)修改权限

chmod a+r /home/XXX/CUDA12.0.0/include/cudnn*.h
chmod a+r home/XXX/CUDA12.0.0/lib64/libcudnn*

（中间打码的两行是我输错了TUT）
(5)查看版本和安装路径

nvcc -V
which nvcc

四、安装Pytorch

1.激活虚拟环境

conda activate 虚拟环境名称

（关于虚拟环境的建立，详见文章0基础配置Linux工作站2：配置Anaconda的第四节）

2.安装Pytorch

2.1 常规流程安装

在pytorch官网选择需要的版本，获得安装指令：https://pytorch/get-started/locally/
（尽量选比较新的稳定版本）

【0925更新】关于版本选择，师兄的指正：大家安装的时候还是要看项目需求以及要复现的项目，不一定是越新的版本越好。如果是自己从零开发，越新的越好，因为新的版本更加稳定。但如果复现项目明确写了requirement的，建议还是按复现版本要求来。

在服务器中输入以下指令，跟随提示安装即可：

conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia

2.2 从清华源安装【0925更新，速度更快】

我自己是按照常规流程安装的，速度很慢。师兄说可以通过清华源进行安装。上网找了从清华源安装的教程贴在这里：

第一步：在开始菜单里找到“Anaconda”文件夹，找到Anaconda Prompt（是一个命令行程序），右键“以管理员身份运行”。
第二步：更改channels设置。首先设置清华镜像源的三条默认channels
conda config --add channels https://mirrors.tuna.tsinghua.edu/anaconda/pkgs/main conda config --add channels https://mirrors.tuna.tsinghua.edu/anaconda/pkgs/free conda config --add channels https://mirrors.tuna.tsinghua.edu/anaconda/pkgs/r
然后设置来自清华镜像源的pytorch文件的channels
conda config --add channels https://mirrors.tuna.tsinghua.edu/anaconda/cloud
最后，运行下面的代码生成.condarc文件。
conda config --set show_channel_urls yes
第三步：找到从pytorch官网获取的command，将这条下载命令最后面的-c pytorch删除，-c pytorch参数指定了conda从pytorch的channel获取文件，所以在这里是不能用的。删除-c pytorch后，将命令输入命令行，直接回车。此时，软件就将从清华镜像源获取文件了，速度要快上很多。
注意：很多同学在按照上面的方法做了以后，下载安装过程中还是会出错。这时，你就可以输入以下代码检查channels有没有出错，同时进行纠错。（这里的出错指的是，channels并不是前文中提到的channels，有增加的channels或者丢失的channels，笔者就是发现了有多余的channels导致下载出错。）
//查看已有的channels信息
conda config --show channels
//找到多余的channels，执行remove命令，有多条多余的channels就逐个运行remove命令进行删除。
最后，运行下行命令重新生成.condarc文件
onda config --set show_channel_urls yes

3.检验Pytorch

为了检验Pytorch环境是否支持GPU加速，首先需要安装Numpy库（已经安装的可以跳过这一步）：
【0925更新：这里要装Numpy是因为我一开始没有装，然后在后面的两步里报错了】

conda install numpy

安装完成后，在终端依次输入以下三行：

python
import torch
print(torch.cuda.is_available())

如果返回结果为True，证明安装成功。

五、更新：CUDA安装（改环境变量版）

（1）进入bashrc文件

vim ~/.bashrc

（2）按 i 键进入修改模式，在末尾输入以下三个命令

 export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
 export PATH=$PATH:/usr/local/cuda/bin
 export CUDA_HOME=$CUDA_HOME:/usr/local/cuda

（3）按Esc，输入:wq，退出并保存修改后的文件
（4）更新bashrc文件

source ~/.bashrc

总结

参考教程：
【教程】Linux环境下支持GPU加速的Pytorch、PyG、DGL环境配置步骤记录
Linux 服务器下非root用户安装CUDA完整流程（多次踩雷经验总结）
win10环境下配置Anaconda与pytorch（解决安装pytorch速度慢的问题）

本文标签：工作站环境基础用户 Linux

版权声明：本文标题：0基础配置Linux工作站3：【非Root用户】支持GPU加速的Pytorch环境配置内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1729156243a1188074.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

0基础配置Linux工作站3：【非Root用户】支持GPU加速的Pytorch环境配置

文章目录

前言

一、查看系统及GPU的相关信息

1.查看系统

2.查看显卡

二、安装与GPU对应的CUDA

1.安装CUDA 相关依赖库

2.创建文件夹

3.下载CUDA文件

4.安装CUDA

三、安装Cudnn

1.创建文件夹

2.下载Cudnn

3.安装Cudnn

四、安装Pytorch

1.激活虚拟环境

2.安装Pytorch

2.1 常规流程安装

2.2 从清华源安装【0925更新，速度更快】

3.检验Pytorch

五、更新：CUDA安装（改环境变量版）

总结

更多相关文章

【Windows】之搭建 Go 语言环境

Windows下PHP环境的搭建

Linux系统(Ubuntu,openSUSE 等)如何安装windows的软件?

Windows下Java环境配置

windows 下 QT Android 环境搭建（QGC 4.2.x + Qt 5.15.2）

Windows搭建Darknet框架环境-Yolov4-GPU

多功能集成环境在windows服务器上搭建PHP网站案例，在服务器上搭建PHP网站

Windows 10系统环境下Composer日常使用及版本升级教程

Linux系统如何把kali装进u盘,怎么把kalilinux系统装到u盘中

十大广泛使用的Linux发行版(2)

双系统安装04--在已有统信UOS基础上安装Windows10_统信环境下安装win

需要同时运行win和linux,如何在一台电脑上同时安装Windows和Linux双操作系统

【Linux】icmp_seq=1 Destination Host Unreachable

顺无盘linux win10包,(2017.01.14)网维大师9.0.3.0无盘-xp-win7x32-x64-Win10x64公包

linux deliver分发管理,死磕hyperledger fabric源码|Deliver区块分发

deliver用法linux,Linux signal 那些事儿（4）信号的deliver顺序

linux python3安装uwsgi报错问题解决

linux nc命令

[转] linux nc命令

【免费软件】2024年8款最佳免费防病毒软件，零基础入门到精通，收藏这篇就够了

发表评论

推荐文章

idea 查找替换快捷键

安卓手机能装鸿蒙,小米手机能否刷入鸿蒙系统？给你答案

Bloom Filter布隆过滤器

从零开始组建NAS（2）--系统

Chatgpt-3 使用的提取数据集技术、数据集自动化处理和保证数据质量

热门文章

已安装更新版本的onedrive_win10正式版下如何重装onedrive

文本摘要（text summarization）任务：研究范式，重要模型，评估指标（持续更新ing...）

pdf格式转换器下载免费版

mac运行ps特别慢_的Photoshop在Mac上运行速度慢|优化Mac上的Photoshop

Ubuntu 18.0.4启用五笔

WAMPSERVER配置虚拟主机，单IP多端口

linux下安装解压软件：rar：官方下载和安装

手机输入法遮挡输入框解决方法

Android搜狗输入法搜索栏

【PyCharm安装】2024最新最详细的Python+PyCharm安装使用教程。文章末尾附带插件码！！！

最新文章

水星mw310r虚拟服务器,水星MW310RE扩展成功后如何查看IP地址？

HP打印引擎核心：‘hpzvip09.dll’解析与缺失修复六策

pdf转换成word格式的方法，需要的速度来

Windows 如何登录 Administration 账户

很不错的免费杀毒软件

HTML5 和 JavaScript 高级游戏设计（五）

怎么重装电脑系统win7 怎么重装电脑系统win7教程

PDF转换成Word后排版会乱怎么办？PDF转换成Word后排版乱码解决方法介绍

电脑提示‘您需要来自Administration的权限才能对此文件夹进行更改’怎么删除文件...

python打包xp系统_python打包适配xp老版本电脑最佳方案

melogin宽带连接服务器无响应,melogin.cn打不开的解决办法 | 192.168.1.1登陆页面

pdf转换成word的8种超实用方法，轻松上手无难度！

Administration的在线与离线编辑模式

Win7 64位企业版ISO镜像下载

Ubuntu Linux免费杀毒软件comodo（科摩多）的安装和使用

小米手机肿么还原时钟

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载