Claude en Microsoft Foundry: disponible en 2026

En pocas palabras: Claude ya está en disponibilidad general dentro de Microsoft Foundry sobre Azure, accesible sin lista de espera para cualquier suscripción activa, con inferencia en GPUs NVIDIA GB300 operada por Anthropic, facturación unificada vía Azure Marketplace y residencia de datos en US DataZone.

En 30 segundos

  • Disponibilidad general confirmada: Claude está disponible en Microsoft Foundry sobre Azure, sin lista de espera ni preview.
  • Facturación unificada: pagás a través de Azure Marketplace, elegible para compromisos MACC, sin necesidad de aprobar un nuevo proveedor.
  • Inferencia operada por Anthropic: los modelos corren en GPUs NVIDIA GB300 dentro de tu entorno Azure, pero Anthropic es el procesador de datos.
  • Opción de residencia de datos: podés elegir la zona US DataZone si tu equipo tiene requisitos de soberanía de datos.

Claude es un asistente de inteligencia artificial desarrollado por Anthropic, diseñado para generar texto, responder preguntas y asistir en tareas conversacionales y de programación.

Claude en Microsoft Foundry ya no es preview. En mayo de 2026, Anthropic y Microsoft sacaron la integración de su fase beta y la abrieron para cualquiera que tenga una suscripción Azure activa. Si venías pateando la migración de tus workloads de IA a un entorno más gobernable —o si tus equipos pedían facturación consolidada hace meses— este anuncio te resuelve varios frentes a la vez.

Claude en Microsoft Foundry es la integración oficial que permite ejecutar los modelos de Anthropic directamente en el ecosistema Azure, con autenticación, facturación y controles de gobernanza unificados dentro del portal de Foundry. La inferencia la opera Anthropic como procesador de datos, pero los modelos viven en tu entorno Azure. Traducido: tus equipos usan las mismas credenciales, los mismos flujos de aprobación y el mismo modelo de costos que ya conocen, sin sumar un proveedor externo a la pila de compliance.

Ojo: no es que Microsoft esté revendiendo Claude así nomás. Anthropic sigue siendo quien corre el motor. La diferencia es que ahora podés consumirlo desde adentro de Azure sin salir de tu VPC, sin armar integraciones custom y sin que finanzas te pregunte por qué hay una factura nueva de un vendor que nadie registró (spoiler: acá todo va por Marketplace).

¿Qué modelos de Claude están disponibles en Microsoft Foundry?

Anthropic no lanzó solo un modelo de prueba —desplegó el lineup completo. Según la documentación oficial de la plataforma, desde su lanzamiento en junio de 2026, los modelos disponibles incluyen tanto las versiones más potentes para tareas complejas como opciones livianas para workloads de alto volumen.

Acá viene lo bueno: los modelos disponibles (Opus 4.8 y Haiku 4.5) soportan amplias ventanas de contexto. Eso significa que podés tirarle una novela entera, bases de código completas o cientos de páginas de documentación interna y el modelo no pierde el hilo. Para referencia, en 2025 la mayoría de las soluciones enterprise andaban en 128K o 200K.

ModeloIdeal para
Claude Opus 4.8Razonamiento complejo, investigación, auditoría de código
Claude Haiku 4.5Chatbots, clasificación, respuestas rápidas de bajo costo
Claude Microsoft Foundry diagrama explicativo

El deployment name por defecto se asigna automáticamente. Si ya laburaste con Foundry, sabés que esto te ahorra el paso de andar renombrando recursos —vas directo a los fierros.

Lo interesante es que los modelos disponibles comparten el mismo esquema de autenticación y el mismo endpoint base. Cambiás el nombre del modelo en la llamada y listo, sin reconfigurar nada. Para equipos que iteran entre Opus para prototipado pesado y Haiku para producción a escala, esto es un golazo.

¿Cómo autenticarse en Claude en Foundry?

Tenés dos métodos y la elección depende más de tu stack de seguridad que de preferencia personal. Podés usar: Complementá con nuestra guía completa de Claude.

  • Clave de API (api-key): la generás desde el portal de Foundry, va en el header api-key y es el camino más directo para desarrollo y pruebas. Ideal si venís del ecosistema Anthropic y ya tenés scripts armados con este método.
  • Token de Entra ID (Bearer): usás la autenticación corporativa que ya maneja Azure. El token va en el header Authorization: Bearer <token>. Este es el camino obligado si tu equipo tiene políticas de Single Sign-On o si querés que los accesos pasen por Azure AD sin manejar claves sueltas dando vueltas.

El punto es que no tenés que elegir uno para siempre. Podés arrancar con api-key en desarrollo y mover a Entra ID cuando pasás a producción, sin tocar el modelo ni la configuración del endpoint. Eso sí, la responsabilidad de rotar claves y manejar expiración de tokens sigue siendo tuya —Foundry te da las herramientas, no te hace el laburo de secretos.

¿Cómo implementar Claude en Foundry paso a paso?

El setup no tiene mucha ciencia si ya venís usando Azure. Los requisitos previos son una suscripción Azure activa y un rol de colaborador o propietario sobre el recurso de Foundry.

El flujo es así: creás un recurso de Microsoft Foundry desde el portal de Azure, buscás Claude en el catálogo de modelos y lo deployás. El deployment toma el ID del modelo como nombre por defecto. Una vez que el recurso está arriba, podés hacer solicitudes con curl o con los SDKs oficiales:

Con Python, usás Azure AI Inference o el SDK de Anthropic configurado para apuntar al endpoint de Foundry. Con TypeScript y C# el patrón es el mismo: autenticación vía api-key o Entra ID, base URL apuntando a tu recurso Foundry, y el modelo especificado en el body de la request. Si necesitás ejemplos copypasteables, la documentación de Microsoft Learn tiene snippets actualizados para los tres lenguajes.

Un detalle que muchos pasan por alto en la primera implementación: si usás Entra ID, el token lo obtenés con az account get-access-token y va como Bearer. Pero ojo con la expiración —por defecto son 24 horas (a la fecha de publicación, junio de 2026) y tu pipeline se va a caer un sábado a la madrugada si no automatizaste la renovación.

¿Dónde se procesan las inferencias de Claude?

Acá hay un matiz importante que generó cierta confusión cuando salió la preview. La inferencia no corre en infraestructura de Microsoft. Anthropic opera la inferencia y es el procesador de datos, aunque los modelos están alojados en el entorno Azure. La infraestructura usa GPUs NVIDIA GB300, como se menciona en el anuncio.

Para equipos con requisitos de residencia de datos, Foundry ofrece la opción de US DataZone. Elegís esta zona al deployar el recurso y la inferencia se procesa dentro de esa región. Por ahora está disponible para recursos Global Standard, y la expansión a más regiones está confirmada en el roadmap pero sin fecha concreta.

¿Alguien verificó de forma independiente las velocidades con las GB300? Todavía no hay benchmarks públicos, pero los casos de uso que mencionan NVIDIA y los primeros clientes —Bolt, que destacó el throughput sostenido, y el caso de análisis de seguridad nuclear que comprimió 200 días humanos en uno solo— sugieren que el throughput es serio. En la comparativa entre Sonnet y Opus profundizamos sobre esto.

¿Cómo se factura Claude en Foundry?

La facturación va por Azure Marketplace, punto. Nada de andar abriendo cuentas nuevas en Anthropic, ni sumar vendors al sistema de procurement. Si tu empresa ya tiene un consumo mensual comprometido con Microsoft (MACC), el uso de Claude cuenta para ese compromiso.

La facturación se realiza a través de Azure Marketplace, sin costos adicionales por usar el canal de Foundry. Y, detalle no menor: no necesitás aprobaciones nuevas de proveedores. Para equipos grandes donde cada vendor nuevo implica dos meses de compliance, esto solo justifica la migración.

¿Qué características adicionales ofrece Foundry?

Foundry te da varias capacidades enterprise que no obtenés consumiendo la API de Anthropic directamente. Integración nativa con Azure RBAC para control de acceso granular, redes virtuales para aislar el tráfico, y monitoreo desde el mismo dashboard donde ya ves tus otros recursos de Azure.

Hay SDKs disponibles para interactuar con la API desde diversos lenguajes. Consultá la documentación oficial para conocer las opciones actuales y las que se encuentran en desarrollo. La disponibilidad regional actual cubre los recursos Global Standard de Foundry, con US DataZone en expansión próximamente.

¿Qué casos de uso empresarial destacan?

NVIDIA contó en el anuncio que vienen usando agentes autónomos con Claude a diario. Justin Boitano, VP de Enterprise Computing, lo resumió así: los modelos de Claude aportan razonamiento fuerte, codificación y capacidades enterprise valiosas para trabajo técnico complejo. Con Claude corriendo en Foundry sobre GB300, más organizaciones pueden largar agentes especializados con la performance y seguridad que producción exige.

Bolt, del lado de partnerships, también dio números concretos. Gary Ballabio explicó que correr Claude en Azure les dio el throughput sostenido y la confiabilidad que esperan sus clientes Fortune 500. La combinación de calidad de modelo frontier con infraestructura enterprise es lo que hace viable su producto para ese segmento.

El caso más impactante, igual, es el de seguridad nuclear: un análisis que normalmente tomaba 200 días-hombre se comprimió en uno solo. Literalmente 200x de aceleración. Son los números que aparecen en el blog de Anthropic y, aunque no hay paper independiente todavía, el dato no es humo —viene de un despliegue productivo real. Te puede servir nuestra cobertura de las capacidades de Claude 3 Opus.

Qué está confirmado y qué no

  • Confirmado: disponibilidad general, facturación vía Azure Marketplace con elegibilidad MACC, GPUs NVIDIA GB300, Anthropic como procesador de datos, zona US DataZone para residencia, autenticación por api-key y Entra ID.
  • En el aire: fechas de expansión a más regiones más allá de US DataZone, SDKs adicionales en desarrollo, benchmarks independientes de rendimiento sobre GB300, precios regionalizados para Latinoamérica.

Errores comunes al configurar Claude en Foundry

1. Asumir que la inferencia corre en infraestructura de Microsoft. No. Anthropic opera la inferencia. Si tu equipo de seguridad te pide el diagrama de flujo de datos, asegurate de reflejar ese límite. No es un tecnicismo —cambia quién responde por el procesamiento.

2. Usar el SDK de Anthropic sin cambiar el base URL. El SDK de Anthropic por defecto apunta a api.anthropic.com. Si no lo redirigís al endpoint de tu recurso Foundry, tus llamadas van a pegarle a la API pública y tu facturación no va a pasar por Azure Marketplace. Es un error de cinco minutos que puede generarte dolores de cabeza con finanzas.

3. Deployar sin configurar RBAC. Foundry te deja exponer el endpoint y arrancar. Pero si no configurás los roles de acceso desde el día uno, cualquiera con la URL y una api-key válida puede consumir tus tokens. Y cuando llegue la factura de Haiku a escala, te vas a querer cortar las venas.

4. Elegir el modelo equivocado por inercia. He visto equipos que deployan Opus 4.8 para un chatbot interno de preguntas frecuentes, básicamente porque es el que suena más potente, y después lloran con la factura. Para eso existe Haiku 4.5, que con una ventana de contexto amplia sobra y te cuesta una fracción.

Qué significa para empresas y equipos en Latinoamérica

Para equipos de la región que ya están subidos a Azure, esto baja la barrera de entrada a modelos frontier. No necesitás abrir cuenta en un proveedor nuevo ni justificar un vendor adicional. La factura llega en la misma moneda y con el mismo compliance que ya pasó auditoría.

La pega, como siempre, es la latencia. Si tu recurso Foundry está en una región de EE.UU. y tu aplicación está en Buenos Aires o São Paulo, vas a pagar el viaje de ida y vuelta de cada token. No es menor para aplicaciones en tiempo real. Habrá que ver cuándo habilitan regiones más cercanas —por ahora, a rezar o a cachear agresivamente.

Para empresas que necesitan hosting local o infraestructura complementaria en la nube, hay opciones como donweb.com que cubren el lado de alojamiento y servidores en la región, mientras la inferencia corre en Azure. La arquitectura híbrida —infraestructura regional para la app, nube pública para el modelo— es un patrón que vamos a ver mucho en 2026.

Preguntas Frecuentes

¿Ya está disponible Claude en Microsoft Foundry?

Sí. Claude está en disponibilidad general en Microsoft Foundry, sin fase beta ni lista de espera. Para más detalles técnicos, mirá escalar Claude Code con patrones clave.

¿Cómo configurar Claude en Azure Foundry?

Creás un recurso de Microsoft Foundry desde el portal de Azure, buscás Claude en el catálogo de modelos y lo deployás. Luego autenticás con api-key o token de Entra ID, y consumís el endpoint con curl o los SDKs disponibles.

¿Qué modelos de Claude ofrece Foundry?

Ofrece Claude Opus 4.8 y Claude Haiku 4.5, ambos con amplias ventanas de contexto. Podés intercambiarlos sin reconfigurar el endpoint.

¿Cómo autenticarse en Claude Foundry?

Tenés dos opciones: clave de API mediante el header api-key, o token de Entra ID en el header Authorization: Bearer. La clave de API se genera en el portal de Foundry. El token de Entra ID se obtiene vía Azure CLI.

¿Claude Foundry procesa datos en Azure?

Los modelos se alojan en tu entorno Azure, pero Anthropic opera la inferencia como procesador de datos. Podés elegir la zona US DataZone si necesitás garantías de residencia de datos.

¿Qué SDKs son compatibles con Claude en Foundry?

Hay SDKs disponibles para múltiples lenguajes. Consultá la documentación oficial para ver las opciones actuales. También podés consumir el endpoint vía HTTP directo desde cualquier lenguaje.

Conclusión

La disponibilidad general de Claude en Microsoft Foundry cierra una brecha que existía desde que los modelos de Anthropic empezaron a competir de verdad en el segmento enterprise. Ya no hace falta elegir entre la calidad de Claude y la gobernanza de Azure —ahora van juntos, con facturación unificada y sin rodeos.

Para equipos que postergaban la adopción por trabas de compliance, este anuncio es la señal que estaban esperando. Para los que ya venían usando la API de Anthropic por afuera, migrar a Foundry es un trámite que se amortiza solo en la primera auditoría de costos. Eso sí, planificá la latencia si tu aplicación está lejos de las regiones disponibles, no subestimes la configuración de RBAC y elegí el modelo correcto para la carga de trabajo real, no para la fantasía de power user.

Fuentes

Desplazarse hacia arriba