GPU假造化到池化时期深度分析 【SJPDR-102】覗かれた下着の奥に隠された女ざかりのエロス2008-05-08シュガーワークス&$ジューシー120分钟
在大型模子的鼓吹下,GPU算力的需求日益增长。然则,企业经常受限于有限的GPU卡资源,即使选拔假造化时期,也难以充分运用或不时使用这些资源。为措置GPU算力资源的不平衡问题,同期鼓吹国产化替代,普及GPU资源的运用效率,GPU算力池化的需求刻碎裂缓。
本文深化磋议了GPU设备假造化的多种旅途,分享了GPU假造化和分享决策,以及如何已矣GPU算力池化的云原生时期。让咱们沿途探索如何优化GPU资源,中意约束增长的算力需求。
AI智能化应用,如东谈主脸识别、语音识别、文本识别等,往时常渗入五行八作。这些被称为判定式AI的应用,经常与特定业务场景紧密纠合。在使用GPU卡时,各应用经常独处运转,未充分运用业务间的GPU分享能力。
然则,通过vGPU假造化切分时期,一张物理GPU卡可假造出多张vGPU,已矣多个判定式AI应用并走运转。这不仅提高了GPU资源的运用率,还为各行业带来了更高效、智能的措置决策。
跟着大型模子的盛行,对GPU算力的需求急剧飞腾。然则,本质中企业经常受限于稀缺的GPU卡资源,难以中意多元化的业务需求。即使选拔假造化时期,也难以已矣GPU卡资源的充分和不时运用,导致难得的GPU资源无法确认最大效率。
一、从GPU假造化需求到池化需求
智能化应用数目的增长对GPU算力资源的需求越来越多。NVIDIA天然提供了GPU假造化和多GPU实例切分决策等,依然无法中意目田界说假造GPU和扫数这个词企业GPU资源的分享复用需求。
TensorFlow、Pytorch等智能化应用框架开发的应用往往会独占一张GPU整卡(AntMan框架是为分享的阵势野心的),从而使GPU卡短少,另一方面,大部分应用却只使用卡的一小部分资源,举例身份证识别、单据识别、语音识别、投研分析等推理场景,这些场景GPU卡的运用率王人比较低,莫得业务申请时运用率以至是0%,有算力却受限于卡的有限数目。
推理场景一卡独享,既蹧跶又矛盾。因此,算力切分已成为繁多场景的刚需。然则,受限于组织架构等身分,各团队自行采购GPU,导致算力资源孤岛化、散布不均:有的团队GPU安静,有的却无卡可用。
为措置GPU算力资源分拨不均等问题,咱们奋发于鼓吹国产化替代,中意在线与离线、业务落魄峰、磨练推理以及开发测试坐蓐环境的资源需求差异。通过已矣长入管制和调治复用,普及GPU资源的运用率。咱们期待已矣GPU资源的切分、团聚、超分、辛苦调用和应用热迁徙等能力,以冒失GPU算力池化的蹙迫需求。
二、GPU设备假造化蹊径
GPU设备假造化有几种可行决策。
领先,咱们磋议PCIe纵贯模式(也被称为pGPU的PCIe Pass-through时期)。这种模式将物理主机的GPU卡径直映射到假造机上。然则,由于其独占性,无法措置多应用分享一张GPU卡的问题,因此其实质价值有限。
第二是选拔SR-IOV时期,允许一个PCIe设备在多个假造机之间分享,同期保持较高性能。
通过SR-IOV在物理GPU设备上创建多个假造 vGPU来已矣的,每个假造vGPU不错被分拨给一个假造机,让假造机径直打听和箝制这些假造功能,从而已矣高效的I/O假造化。NVIDIA早期的vGPU等于这么的已矣,不外NVIDIA vGPU需要额外的license,额外加多了资本。SR-IOV天然已矣了1:N的能力,但其生动性比较差,难以更细粒度的分割和调治。
MPT(Mediated Pass-Through),一种革命的PCIe设备假造化措置决策,领路了1:N的生动性、突出的性能和完整的功能。在内核态已矣device-model的逻辑,尽管厂商可能不会公开硬件编程接口,但MPT的选拔仍可能导致对特定厂商的依赖。
第四用的最多的模式是API转发模式。
凭证AI应用的调用档次(如下图),API转发有多个档次,包括:
CUDA API转发(图中①)GPU Driver API转发(图中②)设备硬件层API转发(图中③)
设备硬件层API常被束之高阁,然则CUDA API转发模式(即用户态)与GPU卡驱动Driver API转发模式(即内核态)却大行其谈。这两种模式分别通过截获CUDA请乞降驱动层请务已矣转发,为业界往常选拔。
AI开发框架常与GPU卡紧密纠合,如华为的CANN、海光的DTK,以及英伟达的TensorFlow和Pytorch等。在AI应用中,这些框架可进行灵验转发,极大普及AI应用迁徙的绵薄性。
AI应用调用档次
三、GPU假造化和分享决策
掌捏GPU设备假造化技能,深度磋议其已矣方式。GPU假造化和分享领有丰富决策,英伟达官方推出vGPU、MIG、MPS等措置决策,同期也存在非官方的vCUDA、rCUDA、内核劫持等战略。
四、NVIDIA VGPU决策
NVIDIA vGPU,一款由NVIDIA提供的假造化措置决策,以其突出的可靠性和安全性著称。然则,它无法提拔容器,只可假造化有限数目的vGPU,生动性受限。此外,资源比例无法动态调整,存在分享损耗,且不提拔定制开发,需支付额外许可证用度。
vGPU 旨趣揭秘:
在NVIDIA的假造GPU驱动的假造化环境中,vGPU软件与Hypervisor联袂,共同装配在假造化层上。这为普及效率和性能提供了重大的提拔。
此款软件能创造假造GPU,让每个假造机(VM)王人能与工作器上的物理GPU分享资源。关于需求极高的职责经由,单VM可运用多个物理GPU。
咱们的软件内含适用于各种VM的显卡或筹备驱动。由于正本由CPU完成的任务被分拨到GPU,用户将体验到更突出的性能。假造化和云环境八成提拔对工程和创意应用、以及筹备密集型职责负载(如AI和数据科学)的严格条目。
NVIDIA的假造GPU(vGPU)软件,为各种任务提供突出的图形处感性能,从图像丰富的假造职责站到数据科学和AI应用。它使IT部门八成充分运用假造化带来的管制和安全上风,同期中意当代职责负载对NVIDIA GPU的重大需求。vGPU软件装配在云或企业数据中心工作器的物理GPU上,可创建可在多个假造机间分享的假造GPU。这些假造机不错随处随时通过任何设备打听。借助NVIDIA vGPU,您不错收缩已矣高性能筹备与生动打听的完满纠合。
上风:
运用及时迁徙GPU加快的假造机,您将获取无缝不时运转和前瞻性管制能力,确保用户体验不受干豫,数据安全无虞。借生长入的假造GPU加快措施,混杂VDI和筹备职责负载得以高效运转,从而显赫普及数据中心资源的使用效率。通过拆分和分享GPU资源,或为单个VM分拨多个GPU,咱们八成提拔需求极高的职责负载,已矣性能的最大化运用。借助生动的调治选项,已矣险些与非假造化环境无异的性能。
提拔假造化的GPU 卡先容:
五、NVIDIA MIG 假造化 多实例 GPU
MIG,一种先进的多实例GPU措置决策,专为Linux操作系统量身定制。它需要CUDA11/R450或更高版块才能完满运转。MIG与A100、H100等高端显卡完满匹配,同期提拔裸机和容器环境,以及vGPU模式。一朝将GPU卡成就为MIG,您就不错动态管制多个实例。MIG诞生具有经久性,即使在重启后也不会受到影响,除非用户主动切换。
MIG时期,让GPU资源在单卡上已矣最高7倍的扩张,为研发东谈主员带来更丰富的资源和更高的操作生动性。它优化了GPU使用效率,允许在归拢GPU上并行处理推理、磨练和HPC任务。每个MIG实例王人像独处GPU同样运转,保持编程模子的踏实性,极地面便利了开发者。
单个 GPU 中包含七个独处实例。
多实例GPU(MIG)时期,为NVIDIA Blackwell和Hopper™系列GPU注入更强能源与更高价值。此时期能将单个GPU区分为七个独处实例,每个实例均配备高带宽显存、缓存和筹备中枢。借助MIG,管制员可收缩冒失各种范围的负载,确保踏实可靠的工作质地(QoS),让每位用户王人能尽享加快筹备的便利。
上风概览:
MIG时期,让单个GPU资源普及至原来的7倍!为研发东谈主员和开发者带来丰富的资源与高度的生动性。立即体验,开释无尽潜能!MIG提供各种化的GPU实例大小弃取,确保每项职责负载得到相宜的处理。优化运用率,开释数据中心投资价值,让性能与资本双赢。MIG时期让GPU能同期处理推理、磨练和HPC任务,保持踏实的延伸与隐晦量。与传统的期间分片方式不同,扫数职责负载并走运转,显赫普及性能透露。
时期旨趣:
若非MIG的介入,归拢GPU上的各种功课(如AI推理申请)将争夺分享资源。显存带宽更大的功课会侵占其他功课的资源,使繁多功课无法达成延伸办法。借助MIG,各功课能同期在不同的实例上运转,每个实例王人领有专属的筹备、显存和显存带宽资源,从而已矣可掂量的性能,中意工作质地(QoS)条目,并尽可能提高GPU的运用率。
特点分析:
启动全新MIG(Multi-Instance GPU)特点,NVIDIA Ampere架构起的GPU可被安全分割为七种独处的GPU实例,全力工作于CUDA应用。这一革命野心使得多个用户得以各自领有专属的GPU资源,已矣最优运用。MIG特点尤其适合那些无法充分确认GPU筹备能力的职责负载场景,用户不错通过并行践诺不同任务,最大程度地普及GPU效率。这不仅优化了资源分拨,也普及了举座性能,让GPU的每一份力量王人得到充分运用。
关于追求多佃农工作的云工作提供商(CSP),MIG时期确保单一客户端的操作不干豫其他客户。同期,它普及了各客户间的安全拆开性,保险了工作的踏实与安全。
在MIG模式下,每个实例所对应的处理器具备独处且阻隔的内存系统打听旅途——片上交叉开关端口、L2缓存分段、内存箝制器以及DRAM地址总线均会专一地分拨给单个实例。这使得即便有其他任务在对其本身缓存进行无数读写操作或已使DRAM接口达到饱和的情况下,单个职责负载仍能获取踏实、可预期的践诺速率和延伸期间,同期保证换取水平的L2缓存分拨与DRAM带宽资源。MIG八成对GPU中的筹备资源(包括流式多处理器或SM,以及诸如拷贝引擎或解码器之类的GPU引擎)进行区分,从而为不同的客户(举例假造机、容器或程度)提供预设的工作质地(QoS)保险及故障拆开机制。
借助MIG时期,用户面前不错像管制实体GPU同样,收缩寻查和调治新建假造GPU实例上的任务。MIG不仅与Linux系统完满兼容,还提拔基于Docker Engine的容器部署。更令东谈主激越的是,MIG还能无缝对接Kubernetes,以及在Red Hat假造化和VMware vSphere等假造机管制程序上开导的假造机。
MIG提拔如下部署决策:
1. 径直部署于裸金属环境,包含容器化部署
3. 运用提拔的假造机管制程序实施vGPU部署
运用MIG时期,物理GPU可同步运转多个vGPU,已矣假造机的并走运算。同期,vGPU的拆开性保险依然得以防守,确保数据安全。
凭证需要调配和成就实例:
在NVIDIA GB200上,GPU可被分割为多个MIG实例,显存大小差异。举例,管制员能创建两个各占95GB的实例,或四个各占45GB的实例,以至是七个各占23GB的实例。如斯生动的成就方式,让资源运用愈加高效。
管制员可随时调整MIG实例,以适当用户需乞降业务需求的快速变化,优化GPU资源分拨。举例,白日神用七个MIG实例进行高效推理,夜间则整合为一个大型MIG实例,专注深度学习磨练。
安全、并走运转职责负载:
每个MIG实例王人配备了专用的筹备、内存和顺存硬件资源,确保了踏实可靠的工作质地和故障拆开。换句话说,即使某个实例上的应用出现故障,也不会对其他实例形成影响。
这示意,各种实例能运转多种职责负载,如交互式模子开发、深度学习磨练、AI推理和高性能筹备应用等。由于这些实例并走运作,它们在物理GPU上同期践诺不同任务,却互相独处,互不影响。
Blackwell GPU 中的 MIG
Blackwell 和 Hopper GPU,通过在假造化环境中成就多达7个GPU实例,已矣了多佃农、多用户提拔,助力已矣MIG。在硬件和工作器假造化管制程序层面,运用玄机筹备时期,安全地拆开每个实例。每个MIG实例均配备专用视频解码器,能在分享基础架构上提供安全、高隐晦量的智能视频分析(IVA)。借助并发MIG分析,管制员可及时监控限定范围的GPU加快,并为多个用户智能分拨资源。
轻负载商榷,无需全云实例。MIG时期可拆开并安全运用GPU部分,确保数据在静态、传输和使用时的完满安全。这一战略不仅使云供应商订价更具弹性,也拿获了微型客户的潜在契机。
数据中心级MIG多实例结构图
六、MIG 规格先容
提拔MIG GPU列表
MIG区分 案例先容:
A100-SXM4-40GB居品成就一望雄伟。关于80GB版块,成就将随内存比例变化,展示为1g.10gb、2g.20gb、3g.40gb、4g.40gb和7g.80gb。
GPU Instance Profiles on A100
下图以图形方式展示了如何构建扫数灵验的GPU实例组合
MIG Profiles on A100
GPU Instance MIG切分先容:
A100-40GB GPU的内存切片组成,包含8个5GB的内存区域和7个SM切片。此分区模式通过内存切片已矣,具体如下图所示。
Available Slices on A100
如前所述,构建GPU实例(GI)需领路一定量的内存切片与筹备切片。下图展示了如何将1个5GB内存切片与1个筹备切片相纠合,打造出1g.5gb的GI成就。
Combining Memory and Compute Slices
Combining Memory and Compute Slices
此成就在4GB或5GB的GPU实例中,提供了4个筹备单位(中枢或流处理器)。内存容量则达到了惊东谈主的20GB,这是基于4倍于GPU实例规格的内存。这种高度生动的成就方式,使得用户八成凭证其特定应用需求,精详情制GPU资源。岂论是进行大范围并行筹备,如故处理高内存需求的任务,王人能保证高效运用GPU的性能。举例,在深度学习磨练、高性能筹备以及图形密集型应用中,弃取适当的GPU资源组合,将确认至关要紧的作用。
七、MPS(Multi-Process Scheduling)
MPS多程度调治,当作CUDA应用程序编程接口的突出二进制兼容版块,自Kepler的GP10架构起,由NVIDIA引入。它赋予多个流或CPU程度同期向GPU辐射Kernel函数的能力,将之领路为单一应用落魄文在GPU上践诺。这一修订战略显赫普及了GPU的运用率,已矣了更高效的筹备处理。
当使用MPS时,MPS Server和会过一个 CUDA Context 管制GPU硬件资源,多个MPS Clients会将他们的任务通过MPS Server 传入GPU ,从而高出了硬件期间分片调治的限制,使得他们的CUDA Kernels 已矣信得过深嗜深嗜深嗜深嗜上的并行。但MPS由于分享CUDA Context也带来一个致命颓势,其故障拆开差,淌若一个在践诺kernel的任务退出,和该任务分享share IPC和UVM的任务一会一同出错退出。
八、rCUDA
rCUDA指remote CUDA,是辛苦GPU调用决策,提拔以透明的方式并发辛苦使用CUDA 设备。rCUDA提供了非GPU节点打听使用GPU 的方式,从而不错在非GPU 节点运转AI应用程序。rCUDA是一种C/S架构,Client使用CUDA运转库辛苦调用Server上的GPU接口,Server监控申请并使用GPU践诺申请,复返践诺收尾。在实质场景中,无需为腹地节点成就GPU资源,不错通过辛苦调用GPU资源从而无需怜惜GPU场所位置,瑕瑜常要紧的能力,拆开了应用和GPU资源层。
九、vCUDA
vCUDA选拔在用户层阻挠和重定向CUDA API的方式,在VM中开导pGPU的逻辑映像,即vGPU,来已矣GPU资源的细粒度区分、重组和再运用,提拔多机并发、挂起复原等VM的高档特点。vCUDA库是一个对nvidia-ml和libcuda库的封装库,通过劫持容器内用户程序的CUDA调用限制面前容器内程度对GPU 算力和显存的使用。vCUDA优点是API开源,容易已矣;污点是CUDA库升级快,CUDA 库升级则需要约束适配,资本高;另外拆开不准确无法提供算力精确限制的能力、安全性低用户不错绕过限制等。面前市面上厂商基本上王人是选拔vCUDA API转发的方式已矣GPU算力池化。
十、GPU算力池化云原生已矣
GPU池化(GPU-Pooling)是通过对物理GPU进行软件界说,领路了GPU假造化、多卡团聚、辛苦调用、动态开释等多种能力,措置GPU使用效率低和弹性扩张差的问题。GPU资源池化最理思的决策是屏蔽底层GPU异构资源细节(提拔英伟达和国产各厂商GPU) ,分离表层AI 框架应用和底层GPU类型的耦合性。不外面前AI框架和GPU类型是紧耦合的,尚莫得已矣的决策详细出一层能屏蔽异构GPU。基于不同框架开发的应用在迁徙到其他类型GPU时,不得不再行构建应用,至少得迁徙应用到另外的GPU,往往需要再行的适配和调试。
GPU假造化与池化的中枢在于算力和故障的拆开。这不错通过硬件拆开,如空分方式,MPS分享CUDA Context方式以及Time Sharing时期方式已矣。底层的拆开后果尤为显赫,举例MIG硬件算力拆开决策,这是一种高效的硬件资源拆开和故障拆开战略。
但硬件设备编程接口和驱动接口往往是不公开的,是以对厂商依赖大,实施的难度相配大,生动性差,如提拔Ampere架构的A100等,最多只可切分为7个MIG实例等。NVIDIA MPS是除MIG外,算力拆开最好的。它将多个CUDA Context合并到一个CUDA Context中,省去Context Switch的支出并在Context里面已矣了算力拆开,但也致额外的故障传播。MIG和MPS优污点王人相配较着,实质工程顶用的并不普遍。选拔API转发的多任务GPU期间分片的已矣模式相对容易已矣和应用最广。
运用AI应用对GPU的调用档次,咱们不错已矣多档次的资源池化能力。从CUDA层、Diver层到硬件设备层,各种详细档次王人能灵验将需要加快的应用转发至GPU资源池中。总的来说,底层转发性能升天最小,操作范围往常;但同期,编程职责量也随之加多,难度提高。
十一、云原生调治GPU算力
跟着云原生应用的大范围实施,GPU算力资源池化需具备云原生部署功能,如提拔Kubernetes、Docker工作。通过K8s Pod与GPU资源池按需创建的vGPU绑定,已矣Pod中的应用践诺。岂论是英伟达如祖国产GPU,扫数显卡均可纳入算力资源池。面前,咱们已已矣不同显卡的分类,并凭证不同框架应用需求,智能调治至相应GPU算力池。
普及资源管制效率,已矣算力资源池的资源、财富管制与运转监控。优化调治能力,缩小GPU资源碎屑,中意AI应用需求赶快增长的挑战。畴昔,算力资源池化将成企业怜惜焦点。
Kubernetes(K8S)当作一款突出的容器编排平台,其弹性伸缩特点赋予其无可比较的上风,使得底层资源得以充分运用。在科技产业界,大模子推理和微调磨练的需求激增,而Nvidia专科显卡供应垂危,形成了显豁的矛盾。
在面前的矛盾环境下,将NVIDIA显卡与K8S容器平台巧妙领路,构建一个高效的GPU算力调治平台,无疑是措置这一挑战的最恋战略。这种领路八成充分挖掘每块显卡的后劲,借助Kubernetes的弹性伸缩特点,已矣对GPU算力的智能调治和管制,为大范围AI模子的磨练和推理提供坚实的基础复古。
在Kubernetes容器平台上,咱们不错通过其重大的资源调治和分拨机制,对GPU集群的算力进行高效管制。Kubernetes具备丰富的资源管制功能,畸形提拔如GPU等特殊资源类型的管制。以下是在Kubernetes中已矣GPU资源管控的中枢才气和关节主意:
1. GPU 插件提拔:
Kubernetes无法径直掌控GPU资源,但NVIDIA GPU Device Plugin插件能弥补这一短板。此插件确认将GPU资源注册至Kubernetes,使其八成精确识别并高效管制。借助此插件,Kubernetes的GPU管制能力得以显赫普及。
2. GPU 设备声明:
在集群节点上部署NVIDIA驱动、CUDA用具包等关节组件,并激活NVIDIA GPU设备插件,即可及时寻查可用的GPU资源。
3. 资源请乞降限制:
sewuyue开发者在编写Pod或Deployment的yaml文献时,不错通过
优化后:探索NVIDIA GPU资源限制,打听".spec.containers[].resources.limits.nvidia.com/gpu"。
通过".spec.containers[].resources.requests.nvidia.com/gpu",您不错精确指定对GPU资源的需求。
"limits"限定了容器可使用的GPU上限,而`requests`则设定了运转所需的最小GPU数目。
4. 调治决策:
Kubernetes调治器在派发Pod时,会兼顾资源申请与限制,确保遴选的节点领有弥漫的GPU资源。它把GPU视为一种独到的资源进行优化调治。
5. 监控与计量:
运用Prometheus和Grafana等监控用具,及时掌捏GPU运用率等关节数据,已矣始终深度分析。助力管制员精确分拨与优化GPU资源,普及系统性能。
6. GPU拆开:
运用MIG(Multi-Instance GPU)等先进时期,咱们能精致区分GPU资源粒度,已矣细密的GPU资源拆开和分拨,普及资源使用效率。
7. 动态扩缩容:
运用Horizontal Pod Autoscaler (HPA)等重大用具,咱们不错凭证GPU的运用率或其他自界说参数,已矣Pod数目的自动调整。这么,GPU资源就能得到智能的动态扩缩容。
运用这些战略,Kubernetes集群能高效地管制和分拨GPU资源,已矣对GPU集群算力的精致化管制。
CUDA:
NVIDIA推出的CUDA(Compute Unified Device Architecture)是一款并行筹备平台和编程模子,它充分运用了NVIDIA GPU的重大并行筹备能力,从而显赫加快应用程序的践诺。CUDA提供了一套丰富的编程接口和用具,闪开发者能以程序的C/C++编程话语编写出高效的GPU加快程序。
RootFS:
根文献系统(Root Filesystem),是Linux系统启动后首个加载的文献系统,位于文献系统的顶层。它积累了操作系统的中枢文献和目次结构,涵盖了/bin、/sbin、/etc、/lib、/dev、/proc、/sys等关节部分。
在K8S容器平台上,一个典型的GPU应用软件栈如下:顶层是多个包含业务应用的容器,每个容器王人包含业务应用、CUDA用具集(CUDA Toolkit)和容器RootFS;中间层是容器引擎(Docker)和装配了CUDA驱动程序的宿主机操作系统;底层是部署了多个GPU硬件显卡的工作器硬件。
主要组件:
CUDA 用具集,囊括 nvidia-container-runtime(shim)、nvidia-container-runtime-hook 与 nvidia-container library等要紧组件,以及CLI用具。这一系列重大用具,为您的AI筹备提供无缝提拔,开启高效编程新篇章。
通过对比CUDA用具集镶嵌前后的架构图,咱们不错直不雅地识别各组件的位置以偏激功能,从而瞻念察其内在机制。
图示:CUDA toolset 镶嵌前的容器软件栈
图示:CUDA toolkit 镶嵌后的容器软件栈
nvidia-container-runtime(shim):
该组件也曾是 runc 的一个完整分支,其中注入了特定于 NVIDIA 的代码。自2019年以来,它还是成为装配在主机系统上的本机 runC 的一个轻量级包装器。nvidia-container-runtime 接管 runc spec当作输入,将 NVIDIA 容器运转时钩子(nvidia-container-runtime-hook)当作预启动钩子注入其中,然后调用本机 runc,并传递修改后的具有该钩子诞生的 runc spec。关于 NVIDIA 容器运转时 v1.12.0 版块及更高版块,这个运转时(runtime)还对 OCI 运转时表率进行了额外修改,以注入特定的设备和挂载点,这些设备和挂载点不受 NVIDIA 容器 CLI 箝制。
nvidia-container-runtime-hook:
这个组件内嵌了一个可践诺文献,专为 runC 预启动钩子打造。当容器创建后、启动前,runC 会主动调用此剧本,并授予其对相干的 config.json(如:config.example.json)的完全打听权限。接着,它精确索取 config.json 中的关节信息,并以此当作参数,激活 nvidia-container-cli CLI用具,佩戴一组哀感顽艳的记号。其中,最关节的记号等于指定应注入该容器的特定 GPU 设备。
nvidia-container library 和 CLI:
这些组件为GNU/Linux容器的NVIDIA GPU自动成就提供了库和CLI实用用具。其内核原语依赖性野心,确保与任何容器运转时的兼容性。
K8S 侧:Device Plugin
在Kubernetes(K8S)中,设备插件(Device Plugin)是一种重大的扩张机制,它确认将节点上的各种设备资源(如GPU、FPGA、TPU等)无缝整合到Kubernetes的资源管制体系。通过设备插件,集群管制员能任意地将这些设备资源知道给Kubernetes API工作器,从而让集群内的Pod八成借助资源调治机制,充分运用这些设备资源。这不仅普及了资源运用率,也进一步优化了应用性能,已矣了资源的高效管制。
-对此,您有什么看法观点?-
-宽饶在指摘区留言磋议和分享【SJPDR-102】覗かれた下着の奥に隠された女ざかりのエロス2008-05-08シュガーワークス&$ジューシー120分钟。-