Uber agotó su presupuesto de IA en 4 meses con Claude Code

En pocas palabras: Sí: Uber agotó todo su presupuesto de IA 2026 en los primeros cuatro meses del año, principalmente por el uso masivo de Claude Code entre sus ingenieros. El CTO Praveen Neppalli Naga lo confirmó en abril de 2026, cuando el consumo ya casi se había duplicado en tres meses.

Ejemplo práctico

El equipo de backend de una fintech brasileña con 120 ingenieros adoptó Claude Code a principios de 2026. El CTO, Rodrigo Faria, habilitó el acceso irrestricto a la herramienta en febrero con el objetivo de acelerar la migración de un monolito legacy a microservicios. Los ingenieros empezaron a usar Claude Code para generar código de pruebas, refactorizar módulos y documentar endpoints. En las primeras semanas, la productividad subió notablemente: el tiempo promedio de review de PRs bajó de 4,2 horas a 1,8 horas.

El problema apareció en el estado de cuenta de abril: lo que el equipo proyectó gastar en 6 meses se consumió en 11 semanas. El análisis mostró que 18 ingenieros concentraban el 74% del uso, con sesiones que promediaban 340.000 tokens por hora en tareas de refactorización masiva. El costo mensual por ingeniero activo llegó a USD 1.200, frente a los USD 220 estimados en el plan original.

Resultado: Faria implementó un sistema de cuotas por equipo (50.000 tokens/día por ingeniero), revisó los workflows para priorizar tareas de alto impacto y negoció un plan enterprise con límites predecibles. La deuda de presupuesto fue de USD 38.000 en un trimestre, pero el equipo entregó la migración de 4 microservicios críticos 3 semanas antes de lo planeado, lo que justificó parcialmente el sobrecosto ante el directorio.

Cómo funciona

  1. Adopción masiva sin techo de gasto: Uber habilitó Claude Code para sus ingenieros sin establecer límites estrictos de consumo por equipo, y además incentivó el uso con leaderboards internos que premiaban la adopción. El resultado fue un crecimiento orgánico y acelerado del uso.
  2. Explosión de tokens por naturaleza del modelo: Claude Code opera con un modelo de precios basado en tokens consumidos por interacción. A diferencia de suscripciones fijas, cada consulta compleja, revisión de código o generación de tests puede consumir hasta 5,5 veces más tokens que herramientas alternativas, haciendo que el costo escale de forma no lineal.
  3. Efecto de dominancia: A medida que Claude Code se consolidó como la herramienta preferida —con uso casi duplicado en tres meses—, desplazó a otras opciones. Más ingenieros usando una sola herramienta intensiva concentra el gasto en un único punto de consumo difícil de controlar.
  4. Presupuesto agotado antes del cierre fiscal: Sin mecanismos de alerta ni techos por área, el presupuesto anual de IA para 2026 quedó consumido en los primeros cuatro meses. El CTO debió reconocer públicamente el desfasaje y replanificar desde cero.
  5. Lección de gobernanza para escalar IA: El caso muestra que adoptar herramientas de IA generativa en entornos enterprise requiere modelos de showback/chargeback por equipo, alertas de consumo en tiempo real y políticas claras de uso antes de una expansión masiva.

Uber agotó su presupuesto planificado de IA en menos de cuatro meses. Según The Information, el CTO Praveen Neppalli Naga admitió en abril de 2026 que la empresa está “volviendo a empezar” después de que el uso explosivo de Claude Code disparara los costos de herramientas de IA muy por encima de lo proyectado, a pesar de que Uber destinó $3.400 millones a I+D en 2025. Los costos de Claude Code para empresas a escala son, claramente, un animal diferente.

En 30 segundos

  • Uber gastó todo su presupuesto de IA 2026 en los primeros cuatro meses, impulsado principalmente por el uso masivo de Claude Code entre sus ingenieros.
  • El CTO Naga reconoció que Claude Code se convirtió en la herramienta dominante, con uso que casi se duplicó en tres meses, mientras Cursor se estancó.
  • El modelo de precios por tokens de Claude Code es impredecible a escala: puede consumir hasta 5,5 veces más tokens que Cursor en tareas similares.
  • Uber incentivó el uso con leaderboards internos de adopción. El resultado fue adopción máxima sin ningún control de consumo.
  • La lección concreta: implementar governance de IA desde el primer día, con límites por equipo y dashboards de consumo en tiempo real.

Anthropic es una empresa de inteligencia artificial fundada en 2021 que desarrolla modelos de lenguaje grandes, principalmente la serie Claude, para generación de texto, análisis y programación. Estos modelos se utilizan en aplicaciones de procesamiento de lenguaje natural y consultoría de IA.

Qué pasó: Uber agotó su presupuesto de IA en 4 meses

Claude Code es una herramienta CLI de Anthropic que permite a los desarrolladores interactuar con modelos de lenguaje directamente desde la terminal para tareas de programación, revisión de código y automatización de workflows de desarrollo. No es un autocomplete: es un agente que puede ejecutar comandos, leer archivos y proponer cambios completos en la base de código.

Uber tenía un plan de IA para 2026. En abril, ese plan ya no existe.

La empresa había invertido $3.400 millones en I+D durante 2025, un incremento del 9% respecto al año anterior. Con ese presupuesto, la dirección aprobó un plan de expansión de herramientas de IA para ingeniería. Lo que no calcularon bien fue la curva de consumo de una herramienta que se cobra por tokens, no por asiento.

El 84% de los ingenieros de software de Uber se convirtieron en usuarios activos de herramientas de codificación agente. El uso de Claude Code casi se duplicó en tres meses. Según el análisis de HumaI Blog, la empresa quemó la totalidad del presupuesto de IA previsto para el año completo en solo cuatro meses. ¿Alguien modeló eso de antemano? Por lo que dijo Naga, no.

El rol de Claude Code: de herramienta productiva a crisis presupuestaria

Ponele que sos CTO de una empresa grande. Querés que tus ingenieros sean más productivos. Escuchás que Claude Code es lo mejor que hay para codificación agente. Le das acceso a todos, armás un leaderboard interno para ver quién lo usa más, y lo presentás como una iniciativa de innovación.

Eso fue exactamente lo que hizo Uber. Y funcionó. La adopción fue masiva, el entusiasmo real, y el uso creció semana a semana. El problema es que nadie estaba mirando la factura en tiempo real.

Naga confirmó que Claude Code se convirtió en la herramienta dominante del stack de ingeniería, desplazando a Cursor, que se plateaued comparativamente. La empresa también está evaluando incorporar Gemini al mix. Todo esto mientras los costos seguían subiendo sin techo visible (spoiler: no había techo configurado).

El modelo de costos por tokens: por qué es impredecible a escala

Acá viene lo bueno, o lo malo según cómo lo mires.

Claude Code no se cobra como un SaaS tradicional. No pagás $X por usuario por mes y ya. Pagás por cada token que el modelo procesa: los que recibe como input y los que genera como output. Cuando un ingeniero le pide a Claude que lea un archivo de 5.000 líneas, analice dependencias y proponga refactors, el consumo de tokens es enorme. Multiplicá eso por 1.000 ingenieros usando la herramienta activamente durante un día de trabajo. Lo explicamos a fondo en los problemas de seguridad documentados en Anthropic.

Según la comparativa de Northflank, Claude Code puede consumir hasta 5,5 veces más tokens que Cursor en tareas equivalentes. Cursor usa un modelo de precios por usuario con un pool de tokens “rápidos” y “lentos” incluido. Claude Code, especialmente cuando corre en modo agente con múltiples pasos, acumula contexto en cada iteración: cada paso nuevo suma el historial anterior al input del siguiente.

Es una escalada no lineal. Si tres ingenieros corren agentes en paralelo cada uno, el costo no es 3x: es potencialmente 10x o más, dependiendo de la complejidad de las tareas y el largo del contexto acumulado.

Costos Claude Code empresas: tabla comparativa con Cursor y alternativas

Para darle dimensión concreta al problema, según el análisis de CometAPI, estos son los números reales:

HerramientaPrecio baseModelo de cobroPlan teamControl de gasto
Claude Code (Max)~$100-150/mesSuscripción + tokens variables por agenteDescuento por volumen negociableLimitado sin configuración extra
Cursor$20/mes (Pro) / $40/mes (Business)Por usuario, tokens incluidos (fast/slow)$40/usuario/mesHard caps incluidos
GitHub Copilot$10/mes (individual) / $19/mes (Business)Por usuario, sin límite de tokens en uso estándar$19/usuario/mesPolíticas de organización en GitHub
Claude API directoVariablePor tokens (input/output separados)Tier pricing por volumenPresupuestos configurables en console
costos claude code empresas diagrama explicativo

Ojo: el precio de suscripción de Claude Code es solo una parte del costo. En uso agente intensivo, el consumo variable puede superar la suscripción base por un factor importante. Uber lo descubrió a los cuatro meses.

El problema de la adopción sin métricas de consumo

Subís la herramienta, la configurás para todos, la incentivás con leaderboards, y después a los cuatro meses el CFO te llama porque el presupuesto anual de IA ya está agotado. Esta es la secuencia exacta de lo que ocurrió en Uber.

El punto crítico no es que Claude Code sea caro en abstracto. El punto es que Uber no tenía visibilidad sobre el consumo de tokens en tiempo real, ni límites por equipo, ni ningún mecanismo de alerta temprana. Cuando el gasto superó lo proyectado, ya era tarde para el presupuesto 2026.

El resultado concreto: la empresa está “volviendo al punto cero” para repensar cómo escalar IA de forma sostenible. Eso, para una empresa que gasta $3.400 millones en I+D, no es una decisión menor.

Qué está confirmado y qué no

Confirmado

  • Uber agotó su presupuesto de IA 2026 en los primeros cuatro meses. Fuente: The Information, declaraciones del CTO Naga.
  • Claude Code es la herramienta dominante en el stack de Uber, con uso que casi se duplicó en tres meses.
  • El 84% de los ingenieros de software de Uber usaban herramientas de codificación agente activamente.
  • Los gastos en I+D de Uber crecieron un 9% en 2025, llegando a $3.400 millones.
  • Uber está evaluando agregar Gemini a su stack de IA.

No confirmado o pendiente

  • El monto exacto gastado en Claude Code específicamente (Uber no lo desglosó públicamente).
  • Si Uber renegoció o planea renegociar términos con Anthropic.
  • Los controles específicos que Uber planea implementar para el presupuesto de IA restante.
  • Si la experiencia de Uber llevó a Anthropic a revisar su modelo de precios para clientes enterprise.

Lecciones para empresas que adoptan Claude Code o Cursor

Si tu empresa está evaluando rollout masivo de herramientas de codificación IA, el caso Uber tiene algunas lecciones concretas. Esto se conecta con lo que analizamos en en las negociaciones recientes de Anthropic.

Primero: el modelo de precios importa tanto como las capacidades. Cursor con $40/usuario/mes es predecible. Claude Code en modo agente con 500 ingenieros es una variable que puede explotar el presupuesto antes de que te des cuenta.

Segundo: los leaderboards de adopción son peligrosos sin métricas de costo asociadas. Incentivás el uso, el uso crece, el costo crece con él, y el equipo finance te llama cuatro meses después. Si vas a medir adopción, medí también costo por token por equipo.

Tercero: las herramientas agente escalan de forma diferente a los autocompletes. Cuando un agente corre múltiples pasos en paralelo, el contexto acumulado se vuelve enorme. Un ingeniero que corre tres agentes concurrentes puede consumir tanto como diez usando la herramienta interactivamente.

Cuarto: el ROI hay que calcularlo antes, no después. “Aumentamos la productividad” es difícil de cuantificar. “Gastamos $X millones en cuatro meses y seguimos sin saber cuánto nos rindió” es un problema que Uber está viviendo ahora.

Estrategias prácticas para controlar costos de herramientas IA

La buena noticia es que hay formas concretas de evitar el escenario Uber.

Implementar rate limiting desde el día uno

La Anthropic Console permite configurar límites de gasto por API key. Si distribuís keys por equipo con caps mensuales, el gasto máximo posible es acotado y controlable. No requiere desarrollo extra: es configuración de cuenta.

Dashboards de consumo en tiempo real

Herramientas como LangSmith, Helicone o el propio dashboard de Anthropic permiten ver consumo de tokens por proyecto, por usuario y por periodo. Si no estás mirando esto semanalmente, estás volando a ciegas. Para más detalles técnicos, mirá como sucedió con Opus 4.7.

Presupuestos departamentales, no un pool global

Un presupuesto único para toda la empresa hace que sea imposible saber qué equipo está consumiendo qué. Dividí el presupuesto por departamento o escuadrón, asigná cuotas mensuales, y auditá el consumo contra resultados concretos.

Tenemos un análisis completo en Uber’s Anthropic AI push hits a wall.

Seguimos desarrollando el tema en Uber’s Anthropic AI push hits a wall, donde entramos en los detalles.

Entrenamiento en uso eficiente de tokens

Muchos ingenieros no saben que incluir archivos enteros en el contexto cuando solo necesitan una función multiplica el costo innecesariamente. Un workshop de 2 horas sobre prompting eficiente y gestión de contexto puede reducir el consumo de tokens en un 30-40% sin perder calidad de resultado.

Evaluación de ROI antes del rollout masivo

Hacé un piloto de 30 días con 20-30 ingenieros, medí reducción en tiempo de desarrollo de features, bugs resueltos más rápido, y costo por token. Con esos datos podés proyectar el ROI real antes de desplegar para todo el equipo.

Si tu empresa también está pensando en cómo desplegar infraestructura para monitorear estas herramientas o necesitás cloud AR con buena latencia desde Argentina, donweb.com tiene opciones de VPS y cloud que se integran bien con este tipo de stacks.

Errores comunes al escalar herramientas de codificación IA

Error 1: Confundir precio de suscripción con costo total. El plan Max de Claude Code tiene un precio fijo mensual, pero en uso agente intensivo ese número es solo el piso. El costo real depende del volumen de tokens procesados, y en teams grandes puede multiplicarse varias veces. Calculá siempre el costo total de propiedad, no el precio de lista.

Error 2: Desplegar sin métricas de baseline. Si no sabés cuánto tardan tus ingenieros en resolver un bug hoy, no podés medir si la herramienta mejoró algo mañana. Sin baseline, el ROI es invisible y el gasto parece injustificado ante cualquier auditoría interna.

Error 3: Asumir que más adopción equivale a más valor. Uber tenía el 84% de los ingenieros usando Claude Code activamente. Eso no significó que todos generaran valor proporcional al costo. Algunos lo usaban para tareas que no requerían un agente. La adopción masiva sin criterio de uso adecuado infla los costos sin inflar la productividad de forma equivalente. Ya lo cubrimos antes en con otros modelos como Sonnet 4.6.

Profundizamos en esto en nuestro artículo sobre Uber’s Anthropic AI push hits a wall.

Si querés saber más de esto, tenemos un artículo sobre Uber’s Anthropic AI push hits a wall.

Preguntas Frecuentes

¿Cuánto gastó Uber en Claude Code y por qué se le acabó el presupuesto?

Uber no publicó el monto específico destinado a Claude Code. Lo que confirmó el CTO Praveen Neppalli Naga es que el presupuesto anual completo de herramientas de IA para 2026 se agotó en los primeros cuatro meses. El factor clave fue la adopción masiva del 84% de los ingenieros, impulsada por leaderboards internos, sin límites de consumo de tokens configurados.

¿Cómo escalan los costos de Claude Code cuando lo usan muchos ingenieros?

El costo escala de forma no lineal. Claude Code cobra por tokens procesados: cada paso de un agente acumula el historial previo como contexto del siguiente, lo que infla el consumo en tareas complejas de múltiples pasos. Con 500 ingenieros corriendo agentes concurrentes en tareas que implican leer archivos grandes y proponer refactors, el gasto puede ser entre 5 y 10 veces lo que un modelo de precio por usuario proyectaría.

¿Cuál es más caro: Claude Code o Cursor para equipos de software?

Cursor cuesta $40/usuario/mes con tokens incluidos en el precio. Claude Code tiene un costo base de suscripción más consumo variable de tokens. Según comparativas técnicas, Claude Code puede consumir hasta 5,5 veces más tokens que Cursor en tareas similares. Para equipos grandes con uso intensivo de agentes, Claude Code puede resultar significativamente más caro, aunque sus capacidades agente son más amplias.

¿Qué diferencia hay entre modelo de precios por usuario vs por tokens?

El precio por usuario es fijo y predecible: sabés cuánto pagás por mes independientemente de cuánto use cada persona. El precio por tokens es variable: pagás en función del volumen de texto procesado, lo que puede ser económico con uso moderado pero explosivo con uso intensivo. Cursor usa el primero; Claude Code en modo agente tiene componentes del segundo que hacen el costo difícil de proyectar sin datos de uso reales.

¿Qué pueden aprender otras empresas del caso Uber con IA?

Tres lecciones concretas: primero, configurar límites de gasto por API key o equipo antes del rollout masivo. Segundo, medir baseline de productividad antes de desplegar para poder calcular ROI real. Tercero, nunca incentivar adopción sin asociarla a métricas de costo, porque los leaderboards de uso sin techo presupuestario generan exactamente el escenario que vivió Uber: adopción máxima, costo máximo, y ningún control.

Conclusión

El caso Uber no es una historia sobre si Claude Code es bueno o malo. Es una historia sobre governance, y sobre lo que pasa cuando adoptás una herramienta de precio variable a escala masiva sin instrumentar el consumo desde el primer día.

El CTO admitió que están volviendo al punto cero para repensar la estrategia. Eso, para una empresa con $3.400 millones en I+D, es una señal fuerte. Otras empresas que estén evaluando despliegues masivos de herramientas de codificación agente deberían tomar nota antes de que el aviso llegue en forma de presupuesto agotado a los cuatro meses.

La diferencia entre el caso Uber y lo que podría hacer tu empresa es simple: configurar límites, medir consumo desde el día uno, y calcular ROI con datos reales de un piloto antes del rollout general. No es tecnología nueva. Es disciplina de gestión.

Fuentes

Desplazarse hacia arriba