Anthropic cambio pricing tokens: Microsoft cancela Claude

Microsoft canceló sus licencias internas de Claude Code en mayo de 2026, poniendo fin a un programa piloto que arrancó en diciembre de 2025. El cierre formal opera desde el 18 de mayo con fecha límite el 30 de junio. El detonante: el cambio de Anthropic al modelo de pricing basado en tokens voló el presupuesto anual de software de la empresa en cuestión de meses.

En 30 segundos

Microsoft termina el piloto interno de Claude Code el 30 de junio de 2026, después de apenas 6 meses de uso.
Anthropic abandonó el modelo flat-rate en abril de 2026 y pasó a pay-per-token, eliminando descuentos por volumen del 10-15%.
Uber agotó su presupuesto de IA para todo 2026 en 4 meses; Salesforce ya comprometió USD 300 millones en tokens Anthropic.
El costo real de Claude Code está entre USD 500 y USD 2.000 por engineer por mes, dependiendo del uso.
El cambio impacta a cualquier empresa que haya calculado costos con el modelo anterior: los presupuestos anuales se quedaron cortos.

Anthropic es una empresa de inteligencia artificial fundada en 2021 que desarrolla Claude, un modelo de lenguaje grande para procesamiento de texto y asistencia conversacional. Se especializa en investigación de sistemas de IA con énfasis en seguridad y alineación.

Qué pasó: Microsoft cancela Claude Code internamente

Claude Code es una herramienta CLI de Anthropic que permite a los desarrolladores interactuar con Claude directamente desde la terminal para tareas de programación: revisar código, generar tests, hacer refactors, documentar. Microsoft adoptó el producto para uso interno en diciembre de 2025.

Para mayo de 2026, la empresa empezó a notificar a sus equipos que el programa terminaba. Según reportes de Major Matters, el cierre no fue por calidad del producto sino por costos. Tenés una de las empresas más grandes del mundo, con un presupuesto de software que excede el PBI de varios países, y aun así dicen que el modelo de pricing actual no es sostenible para ellos. Eso debería decirte algo.

Ojo: Microsoft tiene su propia apuesta en IA a través de GitHub Copilot y su inversión en OpenAI. La cancelación tiene capas. Pero el argumento central que circula puertas adentro es financiero, no técnico.

El cambio de modelo: de flat-rate a token-based billing

Hasta principios de 2026, Anthropic ofrecía planes empresariales con precio fijo mensual por usuario, con descuentos por volumen del 10 al 15% para contratos grandes. Si tenías 500 desarrolladores en un plan, sabías exactamente cuánto ibas a pagar por mes.

En abril de 2026, Anthropic eliminó esa estructura. Según The Register, la empresa sacó los “bundled tokens” de sus planes enterprise y pasó a cobrar por cada token consumido, con un commitment mensual mínimo obligatorio. Los descuentos por volumen desaparecieron.

La diferencia entre los dos modelos es simple pero el impacto no lo es. Con flat-rate, un developer que usa Claude poco y uno que lo usa todo el día te cuestan lo mismo. Con pay-per-token, cada query, cada generación de código, cada revisión de PR tiene un precio. Y cuando la adopción sube (que es exactamente lo que querés que pase cuando pagás por una herramienta), la factura crece de forma no lineal. Más contexto en capacidad real de cómputo de Anthropic.

Impacto financiero real: presupuestos que explotan en meses

Los números que están circulando son bastante concretos. Según CNBC, el costo de herramientas de software con IA subió entre un 20% y un 37% para empresas que renovaron contratos en 2026 bajo el nuevo esquema.

El rango de costo de Claude Code para equipos técnicos está en USD 500 a USD 2.000 por engineer por mes, dependiendo de cuánto lo usen. En una empresa de 1.000 developers, eso puede ser entre USD 6 millones y USD 24 millones anuales solo en esta herramienta. Salesforce ya comprometió USD 300 millones en tokens de Anthropic para 2026, una cifra que da una idea de la escala de lo que se viene.

¿Y el resultado cuando los cálculos se hacen con el pricing viejo? Exacto, los presupuestos anuales se quedaron cortos en el primer trimestre.

El caso Uber: cuando el 32% de adopción se convierte en crisis presupuestaria

Uber tiene alrededor de 5.000 ingenieros. A comienzos de 2026, el 32% usaba Claude Code regularmente. Cuando la empresa lanzó una iniciativa interna para escalar el uso, la adopción saltó al 84%.

Praveen Neppalli, CTO de la empresa, confirmó el dato públicamente. Lo que no comentó con tanto entusiasmo es lo que pasó después: Uber agotó su presupuesto de IA para todo 2026 en los primeros cuatro meses del año.

La mecánica es la siguiente: cuando el 32% de tus developers usa la herramienta, el consumo de tokens es X. Cuando el 84% la usa, no es 2.6X, es mucho más, porque los developers que adoptaron más tarde lo hacen más intensivamente (ya entendieron cómo usarla, la integran en más partes del workflow). Tokens consumidos se multiplican de forma que ningún modelo de forecast lineal captura bien (sí, en serio, el modelo de pricing tiene esto incorporado y las empresas no). Ya lo cubrimos antes en comparación de costos con OpenAI.

La nueva estructura de precios de Anthropic

Lo que Anthropic implementó en 2026 es básicamente una separación de capas de usuario:

Producto	Base mensual por usuario	Adicional	Para quién
Claude Code	USD 20/mes	Pay-per-token según uso	Staff técnico
Claude.ai Business	USD 10/mes	Pay-per-token según uso	Usuarios de negocio
Planes Premium/Standard	Eliminados	—	Ya no disponibles

anthropic cambio pricing tokens diagrama explicativo

El fee base es bajo. El problema es el componente variable. Según análisis de Kingy.ai, la eliminación del flat-rate afecta más a empresas medianas que a las grandes: las grandes pueden negociar compromisos de volumen con descuentos privados, las medianas pagan el rack rate sin poder predecir cuánto será la factura de fin de mes.

El commitment mensual mínimo obliga a comprometer gasto de antemano, lo que fuerza a los equipos de finanzas a justificar la línea presupuestaria con proyecciones de uso que nadie sabe calcular bien todavía.

¿Es escasez de compute o decisión comercial?

Hay dos lecturas del cambio y las dos tienen algo de verdad.

La primera: Anthropic tiene un problema real de capacidad de cómputo. La empresa recaudó más de USD 5.000 millones pero el presupuesto de inferencia a esta escala es brutal. El revenue run rate pasó de USD 9.000 millones a fin de 2025 a más de USD 30.000 millones en 2026, según Investing.com. Con esa curva de crecimiento, seguir subsidiando el uso con flat-rate se vuelve insostenible en la práctica.

La segunda: es una decisión comercial calculada. Pay-per-token captura valor en relación directa con el uso real. Cuanto más valioso se vuelve el producto (más adopción, más integración en workflows), más paga el cliente. Es el modelo correcto para una empresa que quiere escalar revenue.

Habría que ver si Anthropic tenía otra opción. Pero el efecto colateral es que clientes que construyeron casos de negocio con el modelo anterior ahora tienen presupuestos que no cierran.

Qué significa para empresas en Latinoamérica

Si trabajás en una empresa argentina o latinoamericana que usa o está evaluando Claude, el análisis cambia por una variable que Uber y Microsoft no tienen: los costos están en dólares. En alternativas de Google en IA profundizamos sobre esto.

Ponele que tu equipo de 20 developers usa Claude Code con uso moderado: USD 800 por persona por mes serían USD 16.000 mensuales. Con un dólar blue a más de $1.200, estás hablando de casi $20 millones de pesos por mes solo en esta herramienta. Para una startup o una empresa mediana en Argentina, ese número cambia mucho la ecuación.

Las alternativas que los equipos están evaluando son básicas: OpenAI con su propio modelo de pricing (similar pero diferente en la curva de costos), Google Gemini (con compromisos de GCP que pueden bajar el costo efectivo si ya usás la plataforma), o modelos open-source como Llama 3 o Mistral hosteados localmente. Si tu infraestructura ya está en un hosting propio o en un servicio como donweb.com, hostear un modelo mediano es viable para casos de uso específicos.

El cálculo que tiene sentido hacer ahora: ¿cuánto uso real estás teniendo? ¿Tu equipo lo usa en el 30% de las tareas o en el 80%? La respuesta cambia completamente si el costo variable es sostenible o no.

Errores comunes con el nuevo pricing

Error 1: presupuetar con el fee base y olvidar el componente variable. El USD 20/mes por usuario de Claude Code es solo el piso. Si un developer hace 200 queries complejas por día, el costo real es un múltiplo de ese número. Calculá con datos de uso proyectados, no con el precio de lista.

Error 2: asumir que la adopción va a quedarse en el nivel inicial. El caso Uber es el ejemplo perfecto. Empezaron con 32% de adopción y llegaron al 84%. Si presupuestás para 30 usuarios y terminás con 80 usuarios activos con el doble de uso por persona, la factura puede ser 5 o 6 veces la proyección inicial. El commitment mensual mínimo te protege solo desde abajo, no desde arriba.

Error 3: comparar costo de Claude contra costo de no tener la herramienta en vez de contra la alternativa más barata. El ROI puede ser claro y la herramienta seguir siendo insostenible presupuestariamente si hay alternativas con el 70% del rendimiento al 30% del precio. Hacé la comparativa real. Complementá con decisiones estratégicas de Microsoft en IA.

Esto se conecta con Microsoft Cancels Internal Anthropic Licenses As Shift To To, donde tratamos el tema en profundidad.

Para entender mejor estos cambios estratégicos, mirá Microsoft Cancels Internal Anthropic Licenses As Shift To To.

Esto se conecta con lo que cubrimos en Microsoft Cancels Internal Anthropic Licenses As Shift To To, un movimiento clave en la IA.

Esto se conecta con Microsoft Cancels Internal Anthropic Licenses As Shift To To, donde analizamos el impacto en precios.

Esto se conecta con Foundry general availability, donde cubrimos el tema en detalle.

Preguntas Frecuentes

¿Por qué Microsoft cancela sus licencias de Anthropic Claude?

Microsoft terminó su programa piloto interno de Claude Code porque el cambio de Anthropic a billing por token en abril de 2026 hizo insostenible el costo a escala. El piloto arrancó en diciembre de 2025 y cierra el 30 de junio de 2026. La cancelación no fue por problemas de calidad del producto sino por el impacto financiero del nuevo modelo de pricing.

¿Cuánto cuesta realmente Claude Code en una empresa?

El costo base es USD 20 por usuario técnico por mes más pago variable por token consumido. En la práctica, el costo total por engineer está entre USD 500 y USD 2.000 por mes según intensidad de uso. Para equipos de más de 100 personas con adopción alta, la factura mensual puede superar los USD 100.000.

¿Qué cambió en el pricing de Anthropic en 2026?

Anthropic eliminó los planes de tarifa fija enterprise y los descuentos por volumen del 10-15% en abril de 2026. Pasó a un modelo de pago por token con un commitment mensual mínimo obligatorio. Los tiers Premium y Standard desaparecieron. El resultado es que el costo escala linealmente (o más) con el uso real de la herramienta.

¿Cuál es el impacto del token billing en presupuestos de IA?

Uber agotó su presupuesto de IA para todo 2026 en los primeros cuatro meses del año después de que la adopción de Claude Code saltó del 32% al 84% de su equipo. Salesforce comprometió USD 300 millones en tokens Anthropic para 2026. El problema central es que los presupuestos se planificaron con el modelo anterior y el nuevo modelo de precios no se comporta de forma predecible cuando la adopción crece.

¿Hay alternativas viables a Claude Code para empresas que no pueden sostener el costo?

Las alternativas más evaluadas son GitHub Copilot (precio más predecible), Google Gemini con integración en GCP (puede reducir costo efectivo si ya usás la plataforma), y modelos open-source como Llama 3 o Mistral en infraestructura propia. La elección depende del caso de uso: para código complejo con razonamiento profundo, Claude todavía tiene ventajas; para tareas de autocompletado y generación básica, las alternativas zafan bien.

Conclusión

El cambio de Anthropic en el pricing de tokens de abril de 2026 no es un problema menor de facturación. Es un cambio estructural en cómo las empresas tienen que pensar el costo de las herramientas de IA. Que Microsoft, con todos sus recursos, haya decidido cancelar el piloto a los 6 meses es una señal clara de que el modelo de pricing actual crea fricción incluso para los clientes más grandes.

La oportunidad real es para las empresas que todavía no comprometieron presupuesto: hay tiempo para hacer el cálculo correcto antes de firmar contratos. Medí la adopción real, proyectá el consumo de tokens con datos concretos, y comparás contra alternativas. El mercado de herramientas de IA para desarrollo está lo suficientemente maduro como para que la presión competitiva eventualmente corrija los precios. Por ahora, tomalo con pinzas antes de escalar.

Microsoft cancela Claude: el precio por token explota