英伟达NVIDIA服务器显卡多实例技术（MIG）|电子爱好者

admin管理员组
文章数量:1530031

❤️觉得内容不错的话，欢迎点赞收藏加关注😊😊😊，后续会继续输入更多优质内容❤️
👉有问题欢迎大家加关注私戳或者评论（包括但不限于NLP算法相关，linux学习相关，读研读博相关......）👈

博主原文链接：https://www.yourmetaverse/deep_learning/194/

英伟达服务器显卡多实例技术（MIG）

1. 多实例技术介绍

多实例技术有点类似于vGPU，只不过vGPU是在虚拟机层次的显卡虚拟化，如果物理服务器安装的是vmware或者KVM这种虚拟机系统，那么如果想给每个虚拟机分配一张显卡显然显卡不够分，一般6U的服务器也就8张显卡，所以需要用到vGPU技术，将显卡虚拟化成多张显卡，而这玩意跟虚拟机系统一样是需要收费的，按照显卡数量进行授权收费。而如果物理服务器安装的不是虚拟机操作系统，例如安装的是Ubuntu系统，然后采用docker等容器技术，也是需要对显卡进行多实例划分的，提高显卡的利用率。这个时候NVIDIA Multi-Instance GPU（MIG）技术就非常有用了。

英伟达的多实例技术是一种可以将单个物理GPU资源分割成多个虚拟GPU资源的技术。这种技术可以帮助多个用户或应用程序共享一块物理GPU而不会相互干扰，从而提高了GPU资源的利用率。

具体来说，英伟达的多实例技术通过将单个物理GPU分割成多个虚拟GPU，每个虚拟GPU都可以被不同的用户或应用程序访问。每个虚拟GPU都有自己的显存和计算资源，并且可以独立地运行不同的计算任务。这意味着多个用户或应用程序可以同时使用同一块物理GPU，而不会相互干扰或影响对方的计算任务。

多实例技术还可以为不同的虚拟GPU配置不同的计算能力，以满足不同用户或应用程序的需求。例如，一些虚拟GPU可以被配置为支持图形渲染，而其他虚拟GPU可以被配置为支持深度学习计算等高性能计算任务。

总的来说，英伟达的多实例技术可以帮助用户更好地管理和利用GPU资源，并且可以提高GPU资源的利用率和灵活性。

2. 多实例技术支持的显卡列表

多实例技术支持的基本上都是一些服务器显卡，而是还是最新的旗舰机服务器显卡，如A100，H100等，如下所示。

3. MIG使用指南

3.1 开启MIG技术

一般情况下，MIG技术默认是关闭的，需要手动开启，可以使用nvidia-smi命令查看是否开启MIG，nvidia-smi命令的一些详细内容可以查看之前的博客：nvidia-smi命令详解和一些高阶技巧介绍

上图是没有开启MIG的显示结果，下图是开启了MIG的显示结果。

如果没有开启MIG，可以使用如下命令开启MIG：

sudo nvidia-smi -i [显卡ID] -mig 1
这个是针对某个显卡开启MIG的命令，例如我想开启第一张显卡的MIG，则可以使用以下命令
sudo nvidia-smi -i 0 -mig 1

在这个特定的DGX例子中，必须停止nvsm和dcgm服务，在所需的GPU上启用MIG模式，然后恢复监控服务,如下所示:

sudo systemctl stop nvsm
sudo systemctl stop dcgm

使用nvidia-smi mig -lgipp可以查看开启MIG的显卡可以划分成那几个实力

用户名@主机名:~$ sudo nvidia-smi mig -lgipp
GPU  6 Profile ID 19 Placements: {0,1,2,3,4,5,6}:1
GPU  6 Profile ID 14 Placements: {0,2,4}:2
GPU  6 Profile ID  9 Placements: {0,4}:4
GPU  6 Profile ID  5 Placement : {0}:4
GPU  6 Profile ID  0 Placement : {0}:8
GPU  7 Profile ID 19 Placements: {0,1,2,3,4,5,6}:1
GPU  7 Profile ID 14 Placements: {0,2,4}:2
GPU  7 Profile ID  9 Placements: {0,4}:4
GPU  7 Profile ID  5 Placement : {0}:4
GPU  7 Profile ID  0 Placement : {0}:8

使用nvidia-smi mig -lgip可以查看每个开启MIG的设备支持的实例类型，一共有1g.5gb（7个4.75GB显卡）、2g.10gb（3个9.75GB显卡）、3g.20gb（2个19.62GB显卡）、4g.20gb（1个19.62B显卡）、7g.40gb（1个39.50GB显卡）五种类型。

用户名@主机名:~$ sudo nvidia-smi mig -lgip
+--------------------------------------------------------------------------+
| GPU instance profiles:                                                   |
| GPU   Name          ID    Instances   Memory     P2P    SM    DEC   ENC  |
|                           Free/Total   GiB              CE    JPEG  OFA  |
|==========================================================================|
|   6  MIG 1g.5gb     19     0/7        4.75       No     14     0     0   |
|                                                          1     0     0   |
+--------------------------------------------------------------------------+
|   6  MIG 2g.10gb    14     0/3        9.75       No     28     1     0   |
|                                                          2     0     0   |
+--------------------------------------------------------------------------+
|   6  MIG 3g.20gb     9     0/2        19.62      No     42     2     0   |
|                                                          3     0     0   |
+--------------------------------------------------------------------------+
|   6  MIG 4g.20gb     5     0/1        19.62      No     56     2     0   |
|                                                          4     0     0   |
+--------------------------------------------------------------------------+
|   6  MIG 7g.40gb     0     0/1        39.50      No     98     5     0   |
|                                                          7     1     1   |
+--------------------------------------------------------------------------+
|   7  MIG 1g.5gb     19     0/7        4.75       No     14     0     0   |
|                                                          1     0     0   |
+--------------------------------------------------------------------------+
|   7  MIG 2g.10gb    14     0/3        9.75       No     28     1     0   |
|                                                          2     0     0   |
+--------------------------------------------------------------------------+
|   7  MIG 3g.20gb     9     0/2        19.62      No     42     2     0   |
|                                                          3     0     0   |
+--------------------------------------------------------------------------+
|   7  MIG 4g.20gb     5     0/1        19.62      No     56     2     0   |
|                                                          4     0     0   |
+--------------------------------------------------------------------------+
|   7  MIG 7g.40gb     0     0/1        39.50      No     98     5     0   |
|                                                          7     1     1   |
+--------------------------------------------------------------------------+

3.2 创建MIG实例

使用如下命令创建MIG实例

sudo nvidia-smi mig -cgi [ID],[实例名称] -C
[ID]指的是sudo nvidia-smi mig -lgip中ID那一列的值
[实例名称]指的是Name那一列的内容，注意ID需要与[实例名称]对应
例如，使用以下命令，创建ID为9的那个实例，实例名称为3g.20gb，即创建了两个显存为19.62GB的显卡实例。
sudo nvidia-smi mig -cgi 9,3g.20gb -C

3.3 在docker中使用MIG实例

结合Docker使用英伟达NVIDIA服务器显卡多实例技术可以让GPU资源的管理更加灵活和高效。下面是结合Docker使用英伟达NVIDIA服务器显卡多实例技术的一般步骤：

安装NVIDIA Docker
要使用英伟达NVIDIA服务器显卡多实例技术，需要先安装NVIDIA Docker。NVIDIA Docker是一个基于Docker的扩展，可以支持GPU加速的容器化应用程序。在安装NVIDIA Docker之前，请确保已经安装了Docker引擎。

启用多实例功能
要启用多实例功能，需要在NVIDIA Docker中指定相应的选项。在Dockerfile中添加以下语句以启用多实例功能：

ENV NVIDIA_VISIBLE_DEVICES all
ENV NVIDIA_DRIVER_CAPABILITIES compute,utility,mig

这将告诉NVIDIA Docker在运行容器时启用所有可见的GPU设备，并支持计算、实用程序和多实例功能。

配置虚拟GPU
在Dockerfile中可以使用nvidia-smi mig命令配置虚拟GPU。例如，以下命令可以为虚拟GPU 1配置12GB显存和一个10Gbps的带宽限制：

RUN nvidia-smi mig -cgi 1 -C -m -g 0 -a 2 -b 10Gbps

这将在构建容器镜像时配置虚拟GPU实例。

分配虚拟GPU
要将虚拟GPU分配给Docker容器，可以在docker run命令中使用nvidia-smi mig命令为每个虚拟GPU分配一个唯一的ID，并指定哪些进程可以访问该虚拟GPU。例如，以下命令将虚拟GPU 1分配给运行在容器内的进程：

docker run --gpus 1 -it nvidia/cuda /bin/bash
nvidia-smi mig -cgi 1 -i 0 -a $$

这将在容器内分配虚拟GPU 1，并将其分配给容器中的当前进程。

总的来说，结合Docker使用英伟达NVIDIA服务器显卡多实例技术可以方便地管理GPU资源，并使GPU资源的使用更加高效和灵活。可以通过在Dockerfile中配置虚拟GPU实例来管理虚拟GPU，并使用docker run命令将虚拟GPU分配给不同的容器和进程。

参考文献

[1] NVIDIA Multi-Instance GPU User Guide https://docs.nvidia/datacenter/tesla/mig-user-guide/index.html
[2] NVIDIA 多实例 GPU 用户指南 https://blog.csdn/wangqi4720/article/details/126358886

本文标签：英伟显卡实例服务器技术

版权声明：本文标题：英伟达NVIDIA服务器显卡多实例技术（MIG）内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1726389541a1068429.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

英伟达NVIDIA服务器显卡多实例技术（MIG）

英伟达服务器显卡多实例技术（MIG）

1. 多实例技术介绍

2. 多实例技术支持的显卡列表

3. MIG使用指南

3.1 开启MIG技术

3.2 创建MIG实例

3.3 在docker中使用MIG实例

参考文献

更多相关文章

amd支持服务器内存,amd专用内存和普通的内存有什么区别？

amd服务器和intel服务器性能,重量级对抗！服务器CPU之Intel VS AMD

amd显卡怎么设置风扇？

【AMD显卡电脑鼠标卡顿问题】

AMD显卡安装pytorch

为什么amd显卡便宜却买的人少_为什么不推荐人选择AMD？

AMD免驱显卡支持列表

AMD显卡无法安装驱动

amd显卡 pip安装pytorch(快速使用)

AMD 显卡Radeon Super Resolution(Radeon显卡超分辨率) 功能，你开启了么？

amd显卡导致matlab崩溃,AMD的Radeon显卡黑屏和崩溃解决了大部分

amd插帧技术如何开启_不要浪费那块屏幕，联想小新13 Pro AMD锐龙标压版视频插帧设置...

vmware 在AMD平台CPU开启需要化技术

A卡如何自定义分辨率？AMD显卡自定义分辨率的方法

amd显卡测试帧数显示软件,NVIDIA发布帧数显示及显卡基准测试应用FrameView

ubuntu16.4和ｗin10系统（炫龙毁灭者－ＤC带NVIDIA显卡）双系统装机全过程，以及卡屏解决问题

服务器2008系统开机黑屏,windows server 2008 R2开机进度条闪过后黑屏

七雄争霸手机版怎么登陆服务器未响应,七雄争霸为什么登不上 登录不上去解决方法...

什么是GPU？GPU和显卡的关系？GPU国产化布局？

OpenAI提供免费GPT-4o Mini微调以对抗Llama 3.1；Meta计划今年拥有35万块H100显卡 | AI头条...

发表评论

推荐文章

CodeForces - 1082C . Multi-Subject Competition 好题+差一点

Ubuntu20.04系统如何安装google chrome浏览器

配置win10 +openvino遇到的问题及解决方案

jprofiler_windows-x64_9_1注册码

Linux 学习包括但不限于linux使用问题笔记

热门文章

pycharm今天报了unable to contact server

SEVERE: Could not contact localhost:8005. Tomcat shutdown.sh失败无法关闭的解决方案

【PyCharm激活】2024最新最详细的Python+PyCharm安装激活教程。文章末尾附带激活码！！！

记录第一次ANN跑BCI Competition iv 2a过程

博客摘录「 BCI Competition IV 2a数据集介绍」2023年12月10日

格密码从词根词缀和单词起源的角度来介绍一下，commit词根词缀分析：词义发展：现代用法举例：小结：nuance词根词缀分析：词义发展：现代用法举例：小结：

1024创作活动

Ｗindows 下 AMD显卡训练模型有救了：pytorch_directml 下运行Transformers

linux设置开机自启动网络,linux设置开机自启动

探究暴风影音安装后缺失stormres.dll文件的原因及解决策略

最新文章

JetBrains IntelliJ IDEA 优化教程

Parallels对Mac的损害大吗 pd虚拟机怎么设置内存和CPU 运行Parallels发热

Linux基本使用-vmware及centos安装-day01

云上武功秘籍（四）金蝶最新产品KIS全版本华为云部署

IDEA 下载、安装、配置和案例

2023.5.15老男孩网络安全集训营第一节

c#物联网_C# 开发工具比较

IDEA使用技巧

Diffblue Cover AI Java：Difflane如何利用Diffblue Cover AI实现Java自动化的单元测试

IDEA新手使用教程（详解）

1-1 IDEA的下载安装

r5处理器_【玩码】RedmiBook 三款齐发，标配最新锐龙 4000 系列处理器

idea部署tomcat并实现简单的web项目

JAVA之开发神器——IntelliJ IDEA的下载与安装

eset nod32 v11无限试用补丁

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

七雄争霸手机版怎么登陆服务器未响应,七雄争霸为什么登不上登录不上去解决方法...

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载