NVIDIA presentó la DGX Station para Windows, su primera estación de trabajo Windows pensada para correr modelos de IA de hasta 1 billón de parámetros (1 trillion en inglés) sin salir de tu escritorio. La anunció el 1 de junio de 2026 en GTC Taipei, trae 748GB de memoria coherente sobre arquitectura Grace Blackwell y llega en el cuarto trimestre de 2026. Es, básicamente, un supercomputador deskside para agentes IA locales.
La NVIDIA DGX Station para Windows es una estación de trabajo de sobremesa que corre Windows sobre el superchip GB300 Grace Blackwell Ultra, con 748GB de memoria coherente y 20 petaflops FP4. Sirve para entrenar, afinar e inferir modelos de IA de hasta 1 billón de parámetros en local, sin enviar datos a la nube. La anunció NVIDIA el 1 de junio de 2026 en GTC Taipei y llega en el cuarto trimestre de 2026.
En 30 segundos
- Es la primera NVIDIA DGX Station Windows, anunciada el 1 de junio de 2026 en GTC Taipei.
- Monta el superchip GB300 Grace Blackwell Ultra con 748GB de memoria coherente y 20 petaflops FP4.
- Apunta a modelos de hasta 1 billón de parámetros en local, como LLaMA 4 Behemoth, sin mandar nada a la nube.
- Llega en Q4 2026, fabricada por ASUS, Dell, HP, MSI, Gigabyte y Supermicro. Precio oficial todavía no hay.
- Tiene 31 veces más memoria que una RTX 4090 (24GB), que hoy mueve un Llama 3.2 70B con Ollama.
Nvidia es una empresa estadounidense que diseña y fabrica procesadores gráficos (GPUs) y sistemas de procesamiento para IA, aprendizaje automático, gaming y computación de alto rendimiento. Fue fundada en 1993 por Jensen Huang, Chris Malachowsky y Curtis Priem.
¿Qué es la NVIDIA DGX Station para Windows?
La NVIDIA DGX Station para Windows es una estación de trabajo de sobremesa que corre Windows y monta el superchip Grace Blackwell Ultra, diseñada para entrenar, afinar e inferir modelos de IA de escala frontera de forma local. Dicho de otra forma: agarrás un modelo que antes necesitaba un rack en un datacenter y lo ponés abajo del escritorio.
NVIDIA viene vendiendo DGX desde hace años, pero siempre con Linux y siempre pensado para el datacenter. Esta es otra cosa.
Según el anuncio oficial de NVIDIA, la DGX Station para Windows es el primer sistema de la marca armado específicamente para que un equipo de desarrollo corra agentes IA en local, sobre el sistema operativo que ya tienen instalado. La presentaron en GTC Taipei el 1 de junio de 2026 y la posicionan como “supercomputadora deskside”. Hay colaboración con Microsoft de por medio para que todo el stack de Windows hable con los drivers de NVIDIA sin fricción.
¿Por qué importa que sea Windows? Porque la mayoría de las empresas que querrían una máquina así no tienen un equipo de infra Linux dedicado. Bajan la barrera de entrada, y eso (si funciona como prometen) es lo más interesante del anuncio. Sobre eso hablamos en el costo real de ejecutar IA localmente.
Especificaciones de la DGX Station Windows: GB300, Grace Blackwell y 748GB
El corazón de la DGX Station es el superchip GB300 Grace Blackwell Ultra, que combina una GPU Blackwell Ultra con una CPU Grace de 72 núcleos, unidas por NVLink-C2C. Esa interconexión es la clave: hace que la CPU y la GPU compartan un pool único de memoria coherente.
Estas son las especificaciones clave, según la cobertura de SiliconAngle y la ficha de producto:
- Superchip: GB300 Grace Blackwell Ultra.
- GPU: Blackwell Ultra.
- CPU: Grace, 72 núcleos ARM.
- Memoria coherente: 748 GB.
- Rendimiento IA: 20 petaflops (FP4).
- Interconexión interna: NVLink-C2C.
- Networking: ConnectX-8 SuperNIC, 800 Gb/s.
| Componente | Especificación |
|---|---|
| Superchip | GB300 Grace Blackwell Ultra |
| GPU | Blackwell Ultra |
| CPU | Grace, 72 núcleos ARM |
| Memoria coherente | 748 GB |
| Rendimiento IA | 20 petaflops (FP4) |
| Interconexión interna | NVLink-C2C |
| Networking | ConnectX-8 SuperNIC, 800 Gb/s |

Esos 748GB no son un capricho de marketing. Un modelo de 1 billón de parámetros, aun cuantizado, no entra en la VRAM de ninguna placa gamer. Necesitás un pool gigante y unificado, y para eso sirve la memoria coherente: la GPU lee directo de ese espacio sin copiar de un lado a otro.
¿Por qué necesitás 1 billón de parámetros? LLaMA 4 Behemoth y los modelos frontera
Ponele que querés correr LLaMA 4 Behemoth en casa. Mala noticia: no te va a entrar en una placa común, y ahí es donde esta máquina tiene sentido.
Acá viene lo importante de los modelos modernos tipo MoE (mixture-of-experts, mezcla de expertos): no todos los parámetros se usan a la vez. Según la documentación de Meta sobre Llama 4, Behemoth tiene alrededor de 288.000 millones de parámetros activos repartidos en 16 expertos, lo que lleva el total a cerca de 2 billones. Activos vs totales: el modelo solo “enciende” una fracción por cada token, pero igual tiene que tener todos los pesos cargados en memoria, porque no sabés de antemano qué experto va a hacer falta.
Por eso la memoria manda. Un Llama 3.2 70B denso entra en 24GB cuantizado. Un Behemoth de 2 billones totales necesita un orden de magnitud más, y ahí los 748GB dejan de parecer exagerados. Cubrimos ese tema en detalle en medidas de seguridad para estaciones potentes.
¿Para qué sirve la DGX Station? Agentes IA locales sin nube
El caso de uso que NVIDIA empuja no es “un chatbot”. Es correr decenas o cientos de agentes en paralelo sobre la misma máquina, todos comiendo del mismo pool de memoria.
Las ventajas de correr agentes IA en local son concretas:
- Privacidad real: los datos no salen de tu oficina, lo cual para un estudio jurídico, una clínica o un banco no es un detalle menor.
- Latencia baja: no hay viaje de ida y vuelta a un servidor remoto.
- Control total: manejás el modelo, las versiones y el costo, sin facturas variables por token que se disparan a fin de mes.
Casos donde esto pega fuerte: análisis masivo de documentos confidenciales, simulaciones que corren toda la noche, o pipelines de procesamiento paralelo donde mandar todo a una API externa sale carísimo. Si alguna vez calculaste el costo de procesar 10 millones de documentos por API, ya sabés de qué hablo.
DGX Station vs RTX Spark vs mini PC con RTX 4090
No todo el mundo necesita 748GB. La pregunta es: ¿en qué escalón estás?
| Equipo | Capacidad de parámetros | Memoria | Para quién |
|---|---|---|---|
| DGX Station Windows | Hasta ~1 billón | 748 GB coherente | Empresa, modelos frontera |
| RTX Spark | Modelos medianos | Menor, más accesible | Equipos chicos, prototipos |
| Mini PC + RTX 4090 | 7B a 70B (Ollama, vLLM) | 24 GB VRAM | Devs individuales |
El RTX Spark es más barato y alcanza para muchísimos casos. Un mini PC con una 4090 mueve un Llama 3.2 70B con LM Studio y zafa para la mayoría de los proyectos. La DGX Station entra cuando el modelo no te entra en nada más. Es esa la línea divisoria, no el prestigio. Para más detalles técnicos, mirá ChatGPT versus modelos ejecutables localmente.
¿Quién fabrica la NVIDIA DGX Station Windows y qué networking trae?
La ConnectX-8 SuperNIC mete 800 Gb/s de red. ¿Para qué tanto? Para encadenar varias DGX Station y repartir un modelo todavía más grande entre máquinas, o para alimentar el sistema con datos sin que la red sea el cuello de botella.
NVIDIA no la fabrica sola. Los socios de manufactura confirmados son ASUS, Dell, HP, MSI, Gigabyte y Supermicro, así que vas a tener varias versiones del mismo chasis con distintos precios y soporte. El stack de software corre sobre Windows con los drivers de NVIDIA, y ahí está la apuesta conjunta con Microsoft. Si tu empresa necesita hosting o infraestructura web complementaria para servir lo que generás en local, donweb.com tiene opciones de cloud y servidores en Argentina.
¿Cuándo sale la DGX Station Windows y cuánto cuesta?
El lanzamiento está planificado para el cuarto trimestre de 2026. ¿Cuánto sale? Todavía no hay precio oficial, y conviene tomar con pinzas cualquier cifra que circule hasta que NVIDIA o los fabricantes la confirmen.
El mercado inicial es claramente enterprise. No es un producto de consumo, al menos no en esta primera tanda. Las empresas con presupuesto y casos de uso de IA pesada van a ser las primeras en la fila, y recién después se verá si baja a equipos más chicos.
De un LLM local de 70B a 1 billón: la brecha real
Hoy el techo del entusiasta es claro: con Ollama o LM Studio corrés un Llama 3.2 70B sobre una RTX 4090 de 24GB y andás bien. Si querés profundizar en eso, tenemos una guía para correr LLMs en local.
La DGX Station salta de escalón: 31 veces más memoria y 20 petaflops. La brecha entre “70B en mi placa” y “1 billón en mi escritorio” se cierra con memoria coherente y con interconexión interna rápida, no con más TFLOPs a secas. ¿Vale la pena para vos hoy? Si tu trabajo no necesita modelos frontera, no. Si lo necesita y no querés depender de una API externa, esta máquina es de las pocas que lo hacen posible en local. Relacionado: cómo funcionan los LLM tan enormes.
Errores comunes
- Confundir parámetros activos con totales. Behemoth tiene ~288B activos, pero necesitás memoria para los ~2B totales. La memoria se dimensiona por el total, no por lo que “se enciende” en cada token.
- Pensar que más TFLOPs resuelve todo. Si el modelo no entra en memoria, no corre, por más petaflops que tengas. Primero memoria, después cómputo.
- Creer que es para uso doméstico. Es un producto enterprise con networking de 800 Gb/s y precio (cuando salga) acorde. Para un dev individual, una RTX Spark o una 4090 tienen mucha mejor relación costo-beneficio.
- Asumir que ya está a la venta. Se anunció en junio de 2026, pero llega en Q4 2026. Hay varios meses de diferencia entre el anuncio y la caja en tu escritorio.
Preguntas Frecuentes
¿Qué es la NVIDIA DGX Station para Windows?
Es una estación de trabajo de sobremesa con Windows y el superchip GB300 Grace Blackwell Ultra, diseñada para correr modelos de IA de escala frontera en local. Monta 748GB de memoria coherente y 20 petaflops FP4, y NVIDIA la presentó como “supercomputadora deskside”.
¿Cuándo sale la NVIDIA DGX Station para Windows?
Llega en el cuarto trimestre de 2026. NVIDIA la anunció el 1 de junio de 2026 en GTC Taipei, así que hay varios meses entre el anuncio y su disponibilidad real.
¿Cuánto cuesta la NVIDIA DGX Station para Windows?
Todavía no hay precio oficial. Conviene tomar con pinzas cualquier cifra que circule hasta que NVIDIA o los fabricantes (ASUS, Dell, HP, MSI, Gigabyte, Supermicro) la confirmen.
¿Puedo ejecutar LLaMA 4 Behemoth u otros modelos de 1 billón de parámetros en local?
Sí, ese es el objetivo de diseño. Sus 748GB de memoria coherente alcanzan para cargar modelos de hasta cerca de 1 billón de parámetros, incluido LLaMA 4 Behemoth, que suma unos 2 billones totales por su arquitectura de mezcla de expertos.
¿Cuánta memoria y GPU necesito para correr modelos gigantes sin nube?
Para un modelo de 70B cuantizado alcanza con 24GB de VRAM, como una RTX 4090. Para modelos de cientos de miles de millones o de 1 billón de parámetros necesitás cientos de GB de memoria unificada, que es justo lo que ofrece la DGX Station con 748GB.
¿Cuál es la diferencia entre la DGX Station y la RTX Spark?
La DGX Station apunta a modelos frontera de hasta 1 billón de parámetros con 748GB de memoria y networking de 800 Gb/s, para uso empresarial. La RTX Spark es más accesible y de menor capacidad, pensada para equipos chicos y prototipos que no necesitan modelos tan grandes.
¿Qué agentes IA puedo correr localmente con esta máquina?
Podés correr decenas o cientos de agentes en paralelo sobre el mismo pool de memoria, sin enviar datos a la nube. Sirve para análisis de documentos confidenciales, simulaciones largas y pipelines de procesamiento paralelo donde la privacidad y la latencia importan.
Conclusión
Lo que cambió con la DGX Station para Windows es el lugar donde corren los modelos frontera: salen del datacenter y bajan al escritorio, sobre Windows, con 748GB de memoria coherente y la promesa de hasta 1 billón de parámetros en local. Para una empresa que maneja datos sensibles o que paga fortunas en APIs, eso es una alternativa concreta, no una demo.
Eso sí: todavía no hay precio, llega recién en Q4 2026 y es claramente un producto enterprise. Si tu trabajo necesita modelos gigantes y querés control total, ponela en el radar. Si te alcanza con un 70B local, una RTX Spark o una 4090 te van a rendir mucho más por lo que pagás. La brecha entre ambos mundos se acaba de achicar, pero sigue siendo una brecha de presupuesto.
