¿Cómo se habilita el paso directo de la GPU?

El passthrough de GPU se habilita activando el soporte IOMMU (VT-d o AMD-Vi) en el BIOS o UEFI del sistema, luego configurando su hipervisor (como KVM o VMware ESXi) para asignar la GPU directamente a una máquina virtual. También necesita desvincular la GPU de los controladores del host e instalar los controladores de GPU adecuados en la VM invitada.

¿Necesita dos GPU para el paso directo de GPU?

Aunque no es estrictamente necesario, se recomienda disponer de dos GPU. Una debe estar dedicada al sistema host y la otra a la máquina virtual. Esto garantiza que el host pueda mantener la salida de pantalla y la estabilidad del sistema, mientras que la GPU de paso se aísla completamente para la máquina virtual.

¿Funciona el paso directo de GPU con contenedores?

Sí, el paso directo de GPU se puede utilizar con contenedores si se configura dentro de una máquina virtual que tenga acceso directo a la GPU. Como alternativa, las soluciones específicas para contenedores, como NVIDIA Docker o los marcos de trabajo de operadores de GPU, ofrecen acceso a la GPU en entornos Kubernetes.

¿Qué es el paso directo de GPU?

Pasar GPU

El paso directo de GPU es una técnica de virtualización que permite asignar una unidad de procesamiento gráfico (GPU) física directamente a una única máquina virtual (VM). Esto permite a la VM acceder a todas las capacidades de la GPU como si se estuviera ejecutando en hardware físico. El paso directo de GPU omite la capa de abstracción del hipervisor, lo que proporciona un rendimiento casi nativo para cargas de trabajo con un uso intensivo de gráficos o de computación.

Esta funcionalidad es fundamental en casos de uso como la infraestructura de escritorio virtual (VDI), la inteligencia artificial (IA), el aprendizaje automático (ML) y la computación de alto rendimiento (HPC), donde la aceleración de la GPU es necesaria para obtener un rendimiento óptimo. A diferencia de los recursos de GPU compartidos o emulados, el passthrough dedica una GPU completa a una máquina virtual, lo que ofrece un rendimiento máximo y una latencia mínima.

El paso directo de la GPU se implementa normalmente mediante plataformas de virtualización como KVM (máquina virtual basada en kernel), VMware ESXi y Citrix Hypervisor, a menudo en combinación con la tecnología IOMMU (unidad de gestión de memoria de entrada-salida) disponible en las unidades centrales de procesamiento (CPU) y placas base modernas.

Cómo funciona el paso directo de GPU

El paso directo de la GPU es posible gracias a una combinación de compatibilidad con la virtualización a nivel de hardware y software, concretamente el paso directo de dispositivos PCI Express (PCIe) mediante tecnologías IOMMU. Esto permite asignar una GPU física directamente a una máquina virtual invitada, sin pasar por el control del sistema host y proporcionando a la máquina virtual un acceso directo y de baja latencia a la GPU.

Configuración del hardware

Para que la función de passthrough de GPU funcione, el servidor debe ser compatible con IOMMU (Unidad de Gestión de Memoria de Entrada-Salida), que permite el aislamiento de dispositivos y la reasignación de direcciones de memoria para dispositivos PCIe. En plataformas Intel, esta característica se conoce como Intel VT-d; en sistemas AMD, se denomina AMD-Vi. Ambos deben ser compatibles con la CPU, el chipset de la placa base y el firmware.

Para activar IOMMU, los usuarios deben habilitarlo en la configuración del BIOS o UEFI del sistema. Esto generalmente implica habilitar las extensiones de virtualización (VT-d o AMD-Vi) y asegurarse de que PCIe ACS (Servicios de Control de Acceso) esté habilitado si la plataforma lo admite. Algunos sistemas también pueden requerir la desactivación de funciones como Secure Boot o Fast Boot para una funcionalidad completa de passthrough.

Instalación del controlador

Una vez que la GPU se asigna a una máquina virtual, el sistema operativo (SO) invitado debe instalarse con los controladores específicos del proveedor adecuados, como los controladores de GPU de NVIDIA, AMD o Intel. Estos controladores permiten que el SO invitado reconozca y utilice todas las capacidades de la GPU física, incluyendo aceleración 3D, núcleos CUDA para computación paralela y pipelines de renderizado acelerados por hardware.

En algunos casos, es posible que sea necesario desactivar las interfaces gráficas a nivel de hipervisor dentro del invitado para evitar conflictos entre controladores, asegurándose de que solo se utilice la GPU de paso.

Configuración del hipervisor

Una vez que IOMMU está activo, el siguiente paso es configurar un hipervisor que admita PCIe passthrough. Las opciones más populares incluyen KVM/QEMU, VMware ESXi y Citrix Hypervisor (antes XenServer). Estas plataformas utilizan controladores de virtualización de bajo nivel y API para facilitar la asignación directa de dispositivos PCIe a máquinas virtuales invitadas.

Por ejemplo, en entornos KVM, el paso de dispositivos se configura mediante el módulo del kernel vfio-pci, que garantiza un acceso seguro y aislado a los dispositivos. VMware ESXi utiliza DirectPath I/O para exponer la GPU directamente a la máquina virtual, lo que permite un rendimiento casi nativo con una sobrecarga de virtualización mínima.

Vinculación de dispositivos

Un paso fundamental en el paso directo de la GPU es separar la GPU del sistema host y vincularla a la máquina virtual. Esto se hace desvinculando la dirección PCIe de la GPU de cualquier controlador host predeterminado y vinculándola a un controlador de paso directo, como vfio-pci.

Una vez vinculada, la GPU es completamente inaccesible para el sistema operativo host y solo puede ser utilizada por la máquina virtual asignada. Esto evita conflictos y garantiza el acceso exclusivo a la GPU, lo cual es esencial para cargas de trabajo sensibles a la latencia, como el renderizado en tiempo real, la simulación o el entrenamiento de modelos de aprendizaje profundo.

Ventajas y retos del paso directo de GPU

El paso directo de GPU permite a las máquinas virtuales acceder directamente a las GPU físicas, lo que proporciona un rendimiento casi nativo al omitir la capa de abstracción del hipervisor. Esto lo hace muy adecuado para cargas de trabajo que requieren un gran poder de cálculo, como el entrenamiento de IA, el renderizado de diseño asistido por ordenador (CAD) y las simulaciones en tiempo real. Asignar una GPU dedicada a una máquina virtual también mejora el aislamiento y la consistencia del rendimiento, lo cual es esencial en entornos de producción.

Más allá del rendimiento puro, el passthrough amplía las capacidades de virtualización al permitir la aceleración de la GPU en escritorios virtuales, estaciones de trabajo remotas y aplicaciones en contenedores. Permite a las empresas consolidar las cargas de trabajo en menos servidores físicos, al tiempo que se mantiene un alto rendimiento por máquina virtual, lo que se traduce en una mejor utilización del hardware y una mayor eficiencia operativa.

Sin embargo, el paso directo de la GPU presenta retos técnicos. Requiere compatibilidad con IOMMU a nivel de CPU y placa base, una configuración correcta de BIOS o UEFI y GPU que permitan el paso directo. Muchas GPU de consumo carecen de compatibilidad total con la virtualización, lo que puede dar lugar a problemas de compatibilidad o de controladores en los sistemas operativos invitados.

La complejidad de la configuración es otro factor, ya que a menudo requiere modificaciones del kernel, una vinculación precisa de los dispositivos y un ajuste a nivel del hipervisor. La resolución de problemas suele llevar mucho tiempo, especialmente en servidores sin periféricos, y los cambios suelen requerir reinicios, ya que la compatibilidad con la conexión en caliente para las GPU de paso es limitada o no está disponible.

Requisitos de hardware para el paso directo de GPU

La implementación del passthrough de GPU requiere hardware de servidor compatible con las funciones de virtualización IOMMU, como Intel VT-d o AMD-Vi, junto con configuraciones adecuadas de BIOS o UEFI. La CPU, el chipset de la placa base y el firmware deben ser todos compatibles, y la GPU debe ser compatible con la funcionalidad de passthrough, que se encuentra típicamente en tarjetas de clase empresarial como NVIDIA A100 o AMD Instinct serie MI.

Además, los sistemas deben ofrecer suficientes carriles PCIe y suministro de energía para admitir GPU de tamaño completo. Se necesitan plataformas de servidor optimizadas para cargas de trabajo de GPU de alta densidad, que suelen contar con una topología PCIe avanzada, una arquitectura de refrigeración robusta y compatibilidad con passthrough a nivel de firmware, para facilitar configuraciones de passthrough eficientes en entornos de centros de datos gestionados adecuadamente.

Preguntas frecuentes

¿Cómo se habilita el passthrough de GPU?
El passthrough de GPU se habilita activando el soporte IOMMU (VT-d o AMD-Vi) en el BIOS o UEFI del sistema, luego configurando su hipervisor (como KVM o VMware ESXi) para asignar la GPU directamente a una máquina virtual. También necesita desvincular la GPU de los controladores del host e instalar los controladores de GPU adecuados en la VM invitada.
¿Se necesitan dos GPU para el paso directo de GPU?
Aunque no es estrictamente necesario, se recomienda disponer de dos GPU. Una debe estar dedicada al sistema host y la otra a la máquina virtual. Esto garantiza que el host pueda mantener la salida de pantalla y la estabilidad del sistema, mientras que la GPU de paso directo queda totalmente aislada para la máquina virtual.
¿Funciona el paso directo de GPU con contenedores?
Sí, el paso directo de GPU se puede utilizar con contenedores si se configura dentro de una máquina virtual que tenga acceso directo a la GPU. Como alternativa, las soluciones específicas para contenedores, como NVIDIA Docker o los marcos de operadores de GPU, ofrecen acceso a la GPU en entornos Kubernetes.

Servidores Rack

Procesador dual 1U

Procesador dual 2U

Procesador único

Multiprocesador

Familias de productos

Servidores GPU

Líneas GPU 8U/10U

Líneas GPU 4U/5U

Líneas GPU 2U

Líneas GPU 1U

Servidores Twin

FlexTwin™

BigTwin

GrandTwin

TwinPro

FatTwin

Blade

SuperBlade

MicroBlade

MicroCloud

Almacenamiento

Todos los sistemas de almacenamiento

NVMe todo flash

Almacenamiento de carga superior

JBOF

Almacenamiento Petascale Grace

Almacenamiento optimizado para empresas

Cajas de almacenamiento JBOD

Placas base

Servidores

Mesas de trabajo

Placas integradas / IoT

Sobremesa / Placas de juego

Matriz de la placa base

SKU globales

Chasis

Chasis 1U

Chasis 2U

Chasis 3U

Chasis 4U / Torre

Media / Minitorre

Chasis integrado / IoT

Bastidores móviles / Kits de accionamiento

Cajas de almacenamiento JBOD

SKU globales

SuperRack

Ingeniería de soluciones para centros de datos (DCSE)

Servicio de integración en bastidor

Accesorios

Matriz de cables

Matriz de tarjetas Riser

Matriz AOC de almacenamiento

Matriz de alimentación

Matriz del disipador térmico

Matriz de ventiladores del sistema

Bastidores móviles / Kits de accionamiento

Biseles delanteros del chasis

Almacenamiento, E/S, Seguridad

Sistemas de IA periférica e IoT

Sistemas de bordes compactos

Servidores Edge compactos

Servidores Edge para montaje en rack

Componentes integrados

Placas base integradas

Chasis integrado

Interruptores

Adaptadores

SuperWorkstations

Plataforma de desarrollo de IA refrigerada por líquido

Un solo procesador

Doble procesador

Soluciones de juego Supero™

Infraestructura de IA

Soluciones en bloques para centros de datos® (DCBBS)

Fábrica de IA

Inteligencia Artificial

Almacenamiento AI

Soluciones NVIDIA

AMD Soluciones