Usar inteligencia artificial sale más caro que pagar empleados: eso es lo que revelan reportes internos de Microsoft en mayo de 2026, según publicó Fortune. La empresa canceló las licencias de Claude Code que había distribuido entre sus ingenieros hace seis meses, redirigiendo a los equipos hacia GitHub Copilot CLI por razones de costo. No es un caso aislado: Uber agotó su presupuesto IA de todo 2026 en apenas cuatro meses.
En 30 segundos
- Microsoft canceló licencias de Claude Code tras detectar que el costo mensual por ingeniero superaba el equivalente a su sueldo en horas de cómputo.
- Un solo usuario de Claude Max reportó USD 5.600 en costos reales de tokens en un mes; una empresa identificada como OpenClaw llegó a USD 1,3 millones mensuales.
- Goldman Sachs proyecta que el consumo global llegará a 120 cuatrillones de tokens por mes hacia 2030.
- Gartner estima que el costo unitario del token bajará 90% para 2030, pero el consumo total sube porque los agentes IA usan órdenes de magnitud más tokens que los modelos estándar.
- Bryan Catanzaro (Nvidia) confirmó que para su equipo el costo de cómputo ya está por encima del costo de los empleados.
Microsoft es una empresa multinacional de tecnología fundada en 1975 por Bill Gates y Paul Allen, que desarrolla software, sistemas operativos, servicios en la nube e inteligencia artificial, incluyendo Windows, Office y Azure.
Un agente de inteligencia artificial es un modelo de lenguaje configurado para ejecutar tareas de forma autónoma, encadenando múltiples llamadas, leyendo contexto extendido y generando respuestas largas. A diferencia de un chat, no para hasta completar el objetivo. Eso suena bien hasta que revisás la factura.
La paradoja de Microsoft: por qué canceló licencias de IA tras seis meses
Hace seis meses, Microsoft decidió darle a sus ingenieros acceso a Claude Code, la herramienta CLI de Anthropic para programación asistida por IA. La apuesta tenía sentido sobre el papel: acelerar el desarrollo, reducir tareas repetitivas, multiplicar la productividad. Lo que no calcularon bien fue el consumo.
Según los reportes internos que cita Fortune, los costos terminaron superando lo que costaría pagar directamente a los empleados por esas mismas horas. La empresa decidió cancelar las licencias y redirigir a los equipos hacia GitHub Copilot CLI, una herramienta que Microsoft controla y puede optimizar internamente. El movimiento no es ideológico ni anti-IA: es aritmética.
Eso sí: que la decisión la tome Microsoft, una empresa que invirtió USD 13.000 millones en OpenAI, dice bastante sobre qué tan real es el problema.
El costo real de los tokens: cómo se factura la inteligencia artificial
Ponele que le pedís a un agente IA que revise una base de código, sugiera refactorizaciones y documente los cambios. El agente lee el archivo, genera un análisis, propone cambios, vuelve a leer el contexto actualizado, genera más texto. Cada operación consume tokens. Cada token tiene precio. Ya lo cubrimos antes en soluciones de infraestructura Microsoft.
Los modelos se facturan por millón de tokens procesados. Claude 3.5 Sonnet está en torno a USD 3 por millón de tokens de entrada y USD 15 por millón de salida (precios a mayo de 2026). Parece poco. El problema es que los agentes no consumen miles de tokens: consumen millones, por sesión, todo el día.
Los números concretos que circulan en comunidades de desarrolladores son difíciles de ignorar. Un usuario de Claude Max reportó USD 5.600 en costos reales de tokens en un solo mes (mayo de 2026). Una empresa referenciada como OpenClaw llegó a USD 1,3 millones mensuales en consumo de tokens. Esto no es un outlier de empresa gigante: son equipos medianos usando agentes para tareas de desarrollo cotidianas.
¿Por qué los agentes consumen tanto? Porque cada paso de razonamiento requiere enviar contexto completo. Si el agente tiene 100.000 tokens de contexto y ejecuta 50 pasos en una tarea, estás pagando por 5 millones de tokens solo de entrada. Sin contar la salida.
Goldman Sachs proyecta multiplicar por 24 el consumo de tokens para 2030
Goldman Sachs publicó una proyección que da una idea de la escala del problema: el consumo global de tokens podría llegar a 120 cuatrillones por mes hacia 2030. Para poner eso en perspectiva: un cuatrillón es 10 elevado a la 15. Son números que dejan de tener referencia intuitiva.
Lo que sí tiene referencia es la razón: más agentes, más tareas automatizadas, más ejecuciones en paralelo. No es un usuario que chatea con un LLM. Son flotas de agentes corriendo procesos de negocio las 24 horas, todos los días. Cada pipeline que antes tenía humanos en el loop ahora tiene modelos que leen, procesan, escriben y vuelven a leer. Tema relacionado: plataformas generativas como ChatGPT.
No es solo Microsoft: Uber, Meta y Amazon también están quemando presupuesto
Uber agotó su presupuesto de inteligencia artificial para todo 2026 en cuatro meses. Cuatro. Meta creó leaderboards internos para trackear el uso de tokens por equipo (que en principio es para optimizar, pero el hecho de que necesiten un leaderboard dice algo). Amazon, según reportes, alentó activamente el consumo máximo entre sus equipos técnicos.
Meta, Google y Microsoft tienen proyectado gastar alrededor de USD 700.000 millones combinados en infraestructura IA durante 2026. Eso incluye centros de datos, chips, energía, refrigeración. El costo de los tokens que vos pagás en tu empresa es la capa de arriba: consumís compute que alguien construyó con esa inversión.
Bryan Catanzaro, VP de Applied Deep Learning en Nvidia, lo dijo sin rodeos: “Para mi equipo, el costo de cómputo está muy por encima del costo de los empleados.” Esto no lo dijo alguien que se opone a la IA. Lo dijo un ejecutivo de la empresa que fabrica los chips que hacen funcionar todo esto. El problema es reconocido adentro de la industria.
La paradoja contradictoria: tokens más baratos, pero facturas más altas
Gartner proyecta que el costo unitario del token va a bajar un 90% para 2030. Eso suena a buena noticia. El problema es que no lo es, o no necesariamente.
Cuando los minutos de telefonía celular bajaron 90%, la gente no gastó 90% menos en telefonía: empezó a hablar diez veces más. Pasó exactamente lo mismo con el almacenamiento en la nube, con el ancho de banda, con los SMS. El precio unitario baja, el consumo explota, el gasto total sube. Sobre eso hablamos en distintos modelos de lenguaje.
Con los tokens va a pasar lo mismo. Los modelos agenticos requieren órdenes de magnitud más tokens que una consulta estándar. Si el precio baja a la mitad pero los agentes consumen veinte veces más porque ahora son más baratos de justificar, el costo total se multiplica por diez. La “economía de tokens se rompió”, como señala Xataka: las tarifas planas para programación son matemáticamente insostenibles al nivel de consumo que generan los agentes.
Tabla: qué gastan distintos perfiles con IA en un mes
| Perfil | Herramienta | Uso estimado | Costo mensual aprox. |
|---|---|---|---|
| Desarrollador individual (chat) | Claude Pro / ChatGPT Plus | 50-100 consultas/día | USD 20-40 (tarifa plana) |
| Desarrollador con agente IA (coding) | Claude Code / Copilot | Agente activo 4-6h/día | USD 200-800 en consumo real |
| Equipo de 10 ingenieros con agentes | API directa | Pipelines automáticos | USD 5.000-15.000/mes |
| Empresa mediana con automatización | API + orquestación | Procesos 24/7 | USD 50.000-1.300.000/mes |

Los números del último renglón no son hipotéticos: son los que reportó OpenClaw en el extremo superior. El rango es amplio porque depende del tipo de tarea, el modelo usado y cuánta supervisión humana hay en el loop.
¿Cómo puede una empresa justificar la inversión en IA entonces?
La pregunta que deberían hacerse las empresas no es “¿la IA es más barata que los empleados?”. Esa es la pregunta equivocada, y los reportes de Microsoft confirman que hacerla así lleva a decisiones malas.
La pregunta útil es: ¿qué problema específico de alto valor puedo resolver con IA que no puedo resolver de otro modo? No “reemplazar empleados”, sino “escalar operaciones que hoy no escalan”. Atención al cliente en idiomas que tu equipo no habla. Análisis de contratos a volumen que ningún equipo jurídico podría procesar. Generación de variantes de copy para tests A/B a escala.
Los despidos tech de 2026 no están compensando los costos de infraestructura IA. Varias empresas recortaron equipos con la expectativa de que los agentes cubrieran el trabajo, y ahora descubren que el costo del agente supera el ahorro salarial, con el agregado de que perdieron el conocimiento institucional. Si tu empresa está evaluando usar IA para infraestructura web y servidores, donweb.com tiene opciones de cloud que podés presupuestar sin depender de consumo variable de tokens.
El ROI de la IA es real, pero es específico. No aplica igual a todos los casos de uso, y definitivamente no aplica cuando se implementa como reemplazo masivo sin medir el consumo.
Errores comunes al presupuestar IA en empresas
Confundir precio de suscripción con costo real
Claude Max cuesta USD 100/mes. Pero si lo usás con agentes intensivos, el costo de API real puede superar los USD 1.000 mensuales. Las suscripciones cubren un uso acotado; el consumo agentico escala fuera de esos límites muy rápido. Medí siempre por tokens consumidos, no por precio de lista. Más contexto en soluciones de IA de Google.
Implementar agentes sin límites de token por tarea
Un agente sin restricciones puede seguir ejecutando pasos indefinidamente si la tarea es ambigua. Sin un tope de tokens por ejecución o un timeout, una sola sesión puede costar lo mismo que una semana de trabajo normal. Meta y Uber aprendieron esto después de ver las facturas, no antes.
Calcular ROI comparando contra salarios brutos
El cálculo “el agente cuesta X, el empleado cuesta Y” ignora que el agente no tiene contexto, no toma decisiones de negocio, no conoce la cultura del equipo y genera deuda técnica cuando se equivoca. El costo real del agente incluye supervisión, corrección de errores y el tiempo del ingeniero que tiene que revisar la salida. Ese overhead raramente aparece en los presupuestos iniciales.
Preguntas Frecuentes
¿Realmente es más barato usar IA que pagar empleados?
Depende del caso de uso. Para tareas repetitivas y acotadas, puede serlo. Para desarrollo de software con agentes autónomos, los reportes de mayo de 2026 de Microsoft indican que no: el costo de cómputo supera el equivalente salarial en muchos escenarios. Bryan Catanzaro de Nvidia confirmó que para su equipo técnico el compute ya está por encima del costo de empleados.
¿Cuánto gasta una empresa mediana usando agentes IA por mes?
Los rangos reportados en 2026 van de USD 5.000 a USD 1,3 millones mensuales dependiendo del volumen de automatización. Un equipo de 10 desarrolladores usando agentes para coding puede gastar entre USD 5.000 y USD 15.000 mensuales solo en consumo de tokens, sin contar licencias de herramientas o infraestructura adicional.
¿Por qué Microsoft canceló las licencias de Claude Code?
Según reportes de Fortune publicados el 22 de mayo de 2026, los costos de uso superaron lo presupuestado y en algunos casos excedieron el costo equivalente en horas-empleado. Microsoft redirigió a los ingenieros hacia GitHub Copilot CLI, una herramienta que controla directamente y puede optimizar internamente para reducir consumo de tokens.
¿Cuántos tokens consume un agente IA en un mes?
Un agente activo que trabaja 4-6 horas diarias puede consumir entre 50 y 500 millones de tokens por mes según la complejidad de las tareas. Los modelos agenticos leen contexto completo en cada paso, lo que multiplica el consumo respecto a un chat estándar. Goldman Sachs proyecta que el consumo global llegará a 120 cuatrillones de tokens mensuales para 2030.
¿Va a bajar el costo de los tokens en los próximos años?
Gartner estima una caída del 90% en costo unitario para 2030. El problema es que el consumo total sube porque los agentes usan órdenes de magnitud más tokens que los modelos conversacionales estándar. El costo de la factura total puede subir aunque el precio por token baje. Es el mismo efecto que ocurrió con el almacenamiento en la nube: más barato por GB, pero cada aplicación consume diez veces más.
Conclusión
Lo que cambió en mayo de 2026 no es que la IA sea cara: siempre lo fue si no se medía bien. Lo que cambió es que Microsoft, Uber y otros gigantes lo dijeron en voz alta con números reales. El hype de “reemplazá empleados con IA y ahorrá plata” chocó con las facturas de infraestructura.
El mensaje para cualquier empresa que esté evaluando escalar IA este año es concreto: medí el consumo de tokens antes de despegar, ponés límites por ejecución, calculá ROI sobre tareas específicas de alto valor, y no uses “el agente es más barato que un empleado” como premisa de partida. El que sí lo haga así, tiene ventaja real. El que no, va a terminar como Uber: sin presupuesto a mitad de año.
Fuentes
- Fortune — Microsoft reports are exposing AI’s real cost problem (22/05/2026)
- Xataka — La economía de tokens se ha roto: tarifas planas para programar son insostenibles
- Infobea — Informes de Microsoft revelan que usar la IA puede resultar más caro que pagar empleados (23/05/2026)
- Infobea — Google I/O 2026: el problema de la IA ya no es si funciona, es cuánto cuesta
- Juan Merodio — Precio real de un agente IA para empresas
