文章

RHEL9安装NVIDIA显卡驱动

RHEL9安装NVIDIA显卡驱动

一键脚本

1
2
3
4
5
6
7
sudo dnf install epel-release -y \
sudo dnf groupinstall "Development Tools" -y \
sudo dnf install kernel-devel kernel-headers dkms -y \
cd /tmp && wget https://cn.download.nvidia.com/XFree86/Linux-x86_64/550.135/NVIDIA-Linux-x86_64-550.135.run \
sudo systemctl isolate multi-user.target \
chmod +x NVIDIA-Linux-x86_64-550.135.run \
sudo ./NVIDIA-Linux-x86_64-550.135.run

安装NVIDIA驱动

1. 确认系统信息

首先,确保你了解你的RHEL版本和NVIDIA显卡型号。

1
2
cat /etc/redhat-release
lspci | grep -i nvidia

2. 添加EPEL仓库

EPEL(Extra Packages for Enterprise Linux)仓库提供了许多额外的软件包。

1
sudo dnf install epel-release

3. 安装依赖包

安装必要的依赖包。

1
2
sudo dnf groupinstall "Development Tools"
sudo dnf install kernel-devel kernel-headers dkms

4. 下载NVIDIA驱动

访问NVIDIA官网下载页面,选择适合你显卡和RHEL版本的驱动。假设下载的文件名为NVIDIA-Linux-x86_64-550.135.run

1
wget https://cn.download.nvidia.com/XFree86/Linux-x86_64/550.135/NVIDIA-Linux-x86_64-550.135.run

5. 关闭图形界面

在安装驱动之前,需要关闭图形界面。

1
sudo systemctl isolate multi-user.target

6. 给驱动文件执行权限

给下载的.run文件赋予执行权限。

1
chmod +x NVIDIA-Linux-x86_64-550.135.run

7. 安装驱动

运行.run文件进行安装。

1
sudo ./NVIDIA-Linux-x86_64-550.135.run

在安装过程中,按照提示进行操作。通常,你可以接受默认选项。

8. 验证安装

安装完成后,重启系统并验证驱动是否正常工作。

1
2
sudo reboot
nvidia-smi

如果nvidia-smi命令输出显卡信息,说明驱动安装成功。

QQ_1732115806210

安装CUDA驱动

1
2
3
sudo dnf config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/rhel9/x86_64/cuda-rhel9.repo
sudo dnf clean all
sudo dnf -y install cuda-toolkit-12-6

或者直接安装rpm包:

1
2
3
4
wget https://developer.download.nvidia.com/compute/cuda/12.6.2/local_installers/cuda-repo-rhel9-12-6-local-12.6.2_560.35.03-1.x86_64.rpm
sudo rpm -i cuda-repo-rhel9-12-6-local-12.6.2_560.35.03-1.x86_64.rpm
sudo dnf clean all
sudo dnf -y install cuda-toolkit-12-6

或者下载安装包手动安装:

1
2
wget https://developer.download.nvidia.com/compute/cuda/12.6.2/local_installers/cuda_12.6.2_560.35.03_linux.run
sudo sh cuda_12.6.2_560.35.03_linux.run

为docker添加gpu支持

  1. 配置存储库
1
2
curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo \
    | sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
  1. 安装 NVIDIA Container Toolkit 软件包
1
sudo yum install -y nvidia-container-toolkit
  1. 配置 Docker 以使用 Nvidia 驱动程序
1
2
sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker
本文由作者按照 CC BY 4.0 进行授权