一键脚本
1
2
3
4
5
6
7
| sudo dnf install epel-release -y \
sudo dnf groupinstall "Development Tools" -y \
sudo dnf install kernel-devel kernel-headers dkms -y \
cd /tmp && wget https://cn.download.nvidia.com/XFree86/Linux-x86_64/550.135/NVIDIA-Linux-x86_64-550.135.run \
sudo systemctl isolate multi-user.target \
chmod +x NVIDIA-Linux-x86_64-550.135.run \
sudo ./NVIDIA-Linux-x86_64-550.135.run
|
安装NVIDIA驱动
1. 确认系统信息
首先,确保你了解你的RHEL版本和NVIDIA显卡型号。
1
2
| cat /etc/redhat-release
lspci | grep -i nvidia
|
2. 添加EPEL仓库
EPEL(Extra Packages for Enterprise Linux)仓库提供了许多额外的软件包。
1
| sudo dnf install epel-release
|
3. 安装依赖包
安装必要的依赖包。
1
2
| sudo dnf groupinstall "Development Tools"
sudo dnf install kernel-devel kernel-headers dkms
|
4. 下载NVIDIA驱动
访问NVIDIA官网下载页面,选择适合你显卡和RHEL版本的驱动。假设下载的文件名为NVIDIA-Linux-x86_64-550.135.run
。
1
| wget https://cn.download.nvidia.com/XFree86/Linux-x86_64/550.135/NVIDIA-Linux-x86_64-550.135.run
|
5. 关闭图形界面
在安装驱动之前,需要关闭图形界面。
1
| sudo systemctl isolate multi-user.target
|
6. 给驱动文件执行权限
给下载的.run
文件赋予执行权限。
1
| chmod +x NVIDIA-Linux-x86_64-550.135.run
|
7. 安装驱动
运行.run
文件进行安装。
1
| sudo ./NVIDIA-Linux-x86_64-550.135.run
|
在安装过程中,按照提示进行操作。通常,你可以接受默认选项。
8. 验证安装
安装完成后,重启系统并验证驱动是否正常工作。
1
2
| sudo reboot
nvidia-smi
|
如果nvidia-smi
命令输出显卡信息,说明驱动安装成功。
1
2
3
| sudo dnf config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/rhel9/x86_64/cuda-rhel9.repo
sudo dnf clean all
sudo dnf -y install cuda-toolkit-12-6
|
或者直接安装rpm包:
1
2
3
4
| wget https://developer.download.nvidia.com/compute/cuda/12.6.2/local_installers/cuda-repo-rhel9-12-6-local-12.6.2_560.35.03-1.x86_64.rpm
sudo rpm -i cuda-repo-rhel9-12-6-local-12.6.2_560.35.03-1.x86_64.rpm
sudo dnf clean all
sudo dnf -y install cuda-toolkit-12-6
|
或者下载安装包手动安装:
1
2
| wget https://developer.download.nvidia.com/compute/cuda/12.6.2/local_installers/cuda_12.6.2_560.35.03_linux.run
sudo sh cuda_12.6.2_560.35.03_linux.run
|
为docker添加gpu支持
- 配置存储库
1
2
| curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo \
| sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
|
- 安装 NVIDIA Container Toolkit 软件包
1
| sudo yum install -y nvidia-container-toolkit
|
- 配置 Docker 以使用 Nvidia 驱动程序
1
2
| sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker
|