Nvidia Tesla A100 驱动安装方法

Posted 一只独角兽

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Nvidia Tesla A100 驱动安装方法相关的知识,希望对你有一定的参考价值。

Nvidia Tesla A100 驱动安装方法

遇到的问题:以前安装tesla系列、geforce系列等gpu 驱动的时候,只需执行nvidiaxxxx.run驱动包或者安装nvidiaxxxx.rpm包即可,但遇到新的GPU Nvidia Tesla A100的时候,安装完驱动似乎不起作用,找了半天资料,原来需要以下步骤才可以使用;

参考资料:
https://docs.nvidia.com/datacenter/tesla/pdf/fabric-manager-user-guide.pdf
https://docs.nvidia.com/datacenter/tesla/fabric-manager-user-guide/index.html#abstract

1、首先到Nvidia官网下载对应gpu 驱动文件

驱动下载连接:https://www.nvidia.cn/Download/index.aspx?lang=cn

nvidia-driver-local-repo-rhel7-470.57.02-1.0-1.x86_64.rpm

2、安装驱动

rpm -ivh nvidia-driver-local-repo-rhel7-470.57.02-1.0-1.x86_64.rpm
yum clean all
yum install -y cuda-drivers

3、安装fabricmanager

yum install -y cuda-drivers-fabricmanager libnvidia-nscq

4、启动服务

systemctl enable nvidia-fabricmanager
systemctl start nvidia-fabricmanager

5、测试nvidia-smi

nvswitch、nvlink功能可以正常使用;

以上是关于Nvidia Tesla A100 驱动安装方法的主要内容,如果未能解决你的问题,请参考以下文章

Nvidia Tesla A100 驱动安装方法

Nvidia Tesla A100 驱动安装方法

ubuntu14.04下的NVIDIA Tesla K80显卡驱动的安装教程

无法在带有 Tesla K80 GPU 的各种 GCP Ubuntu VM 上安装 NVIDIA 驱动程序

NVidia 驱动程序停止在带有 Ubuntu 16.04 和 Tesla K80 GPU 的 AWS EC2 实例上工作

Nvidia Tesla 上的 OpenCL:未找到任何平台