Costos insostenibles de LLM: la cuenta no cierra

En pocas palabras: No son sostenibles porque en 2026 el sector pierde alrededor de USD 15 por cada USD 1 que factura: entrenar un modelo cuesta decenas de millones (GPT-4 rondó USD 79 millones) y los proveedores venden tokens por debajo de su costo real para ganar mercado.

La economía de la IA tiene un problema de fondo: entrenar y operar modelos de lenguaje cuesta una fortuna, y casi nadie lo está cobrando completo. Los costos insostenibles de LLM ya no son una sospecha de analistas. En 2026 el sector pierde alrededor de USD 15 por cada USD 1 que factura, según reportes recopilados por medios especializados.

Los costos insostenibles de LLM son el desfase entre lo que cuesta entrenar y operar un modelo de lenguaje grande (hardware, energía e inferencia) y lo que las empresas cobran por usarlo. Hoy varios proveedores venden tokens por debajo de su costo real para ganar mercado, sostienen tarifas planas que pierden plata con los usuarios intensivos y financian la operación con rondas de inversión, no con ingresos.

En 30 segundos

Entrenar cuesta millones: GPT-4 rondó los USD 79 millones y Gemini Ultra los USD 191 millones.
Las APIs bajaron ~90% en 18 meses, pero la rentabilidad no mejoró.
La tarifa plana no cierra: un usuario de USD 100/mes puede consumir miles de dólares en tokens reales.
Gartner proyecta que el 40% de los proyectos con agentes de IA se cancelen antes de 2027.
Hoy se pierde plata: se habla de USD 15 perdidos por cada USD 1 facturado.

¿Cuánto cuesta de verdad entrenar un modelo de IA a gran escala?

Mucho más de lo que la mayoría imagina. Entrenar un modelo de frontera no es comprar una placa de video y dejarla corriendo un fin de semana. Hablamos de miles de GPU funcionando durante meses, el costo energético de mantenerlas, los datos, y un equipo de ingeniería que cobra sueldos altos. Complementá con sobre seguridad en implementaciones de IA.

Los números que circulan dan vértigo: GPT-4 habría costado cerca de USD 79 millones, Gemini Ultra unos USD 191 millones, y Llama 3.1-405B más de USD 170 millones. Por eso solo un puñado de gigantes tecnológicos puede financiar esta carrera. El resto alquila la inferencia.

Modelo	Costo estimado de entrenamiento
GPT-4	~USD 79 millones
Gemini Ultra	~USD 191 millones
Llama 3.1-405B	+USD 170 millones

Estimaciones de costo de entrenamiento. Las cifras varían según la fuente y el método de cálculo.

costos insostenibles de llm diagrama explicativo

¿Por qué cayeron casi 90% los precios de las APIs en 2026?

Acá viene la paradoja. Si entrenar sigue costando cientos de millones, ¿por qué la API se abarató tanto? El precio por millón de tokens de GPT-4 pasó de unos USD 60 en 2024 a menos de USD 10 en 2026. Una baja de alrededor del 90% en 18 meses.

Las razones son varias: chips cada vez más específicos para inferencia, modelos open-weight que presionan hacia abajo, y un costo de cambio bajísimo para el usuario (saltás de un proveedor a otro en minutos). Sumale la competencia de DeepSeek, que metió presión sobre los precios. El problema es que parte de esa baja no refleja eficiencia real: muchos venden por debajo de su costo para no perder mercado. Esto se conecta con lo que analizamos en ChatGPT y el costo de liderazgo.

¿Por qué las tarifas planas de IA son matemáticamente insostenibles?

Ponele que pagás USD 100/mes por un plan tipo “todo incluido” y lo usás en serio: lo conectás a un agente, le tirás tareas pesadas todo el día. Según un caso documentado por Xataka en 2025, ese mismo uso podía representar hasta USD 5.600 en tokens reales. El proveedor pone la diferencia de su bolsillo.

¿Y qué hicieron las empresas cuando la cuenta no cerró? Exacto, empezaron a poner límites. GitHub Copilot pausó altas de su plan Pro a mediados de 2024. Microsoft y Salesforce metieron controles de costo internos sobre el uso de herramientas de IA durante 2024-2025. La “tarifa plana ilimitada” tiene una letra chica que se vuelve más chica cada trimestre.

¿Cuánto consume en energía y agua un modelo de IA?

El costo no es solo financiero. Entrenar GPT-3 consumió unos 1.287 MWh y generó alrededor de 552 toneladas de CO₂, según datos citados por el Observatorio del Tec de Monterrey. Algunos modelos posteriores escalaron hasta las 8.930 toneladas.

La demanda de energía de los centros de datos pasó de unos 49 GW en 2023 a una proyección de 96 GW en 2026, de los cuales cerca de 40 GW irían a IA. El agua también pesa: las proyecciones hablan de 6.600 millones de metros cúbicos hacia 2027. Cada token tiene una huella, y esa huella la termina pagando alguien.

¿Qué riesgos traen los agentes de IA para las startups?

Los agentes autónomos cambian la ecuación, y no para bien del que paga. Un agente no hace una llamada a la API: hace cadenas de decisiones, cada paso consume tokens, y el consumo se vuelve impredecible. Subís un flujo simple, el agente entra en un loop de “razonamiento”, reintenta, llama herramientas, y de golpe tu factura mensual se la comió en una tarde. Tema relacionado: entender cómo funcionan estos modelos.

Consumo impredecible: cada decisión del agente multiplica los tokens, sin un techo claro.
Falta de gobernanza: muchos equipos despliegan agentes sin límites de gasto ni alertas.
Proyectos que no llegan: Gartner proyecta que el 40% de los proyectos agénticos se cancelen antes de 2027.
Demanda en alza: Goldman Sachs estima un consumo de tokens hasta 24 veces mayor hacia 2030.

¿Quién pierde plata en la economía actual de la IA?

Casi todos, por ahora. OpenAI pierde dinero en buena parte de los prompts que procesa. Empresas que adoptaron IA de forma agresiva, como se reportó en el caso de Uber en 2024, llegaron a quemar el presupuesto anual asignado en apenas cuatro meses. Y a nivel sector, la cifra que se repite es contundente: la IA pierde alrededor de USD 15 por cada USD 1 que ingresa, según el análisis de Ecosistema Startup.

La respuesta de las grandes fue ajustar. Microsoft y Salesforce implementaron controles de costo. Los proveedores empezaron a limitar planes “ilimitados”. El modelo se sostiene con inversión, no con ingresos. Y eso, en algún momento, pasa factura.

¿Qué futuro tienen los precios de IA?

Hay buenas señales para el que consume. El rendimiento de los modelos top está medio amesetado, lo que reduce la urgencia de pagar por lo último. La competencia open-weight aprieta, los chips especializados bajan el costo de inferencia, y correr modelos más chicos en infraestructura propia es cada vez más viable. Si vas por ese camino, el costo se vuelve predecible, y para alojar esos servicios conviene un hosting o servidores en la región, como los de donweb.com.

Eso sí: hay un riesgo que opaca el optimismo. Si la demanda de tokens crece más rápido que la baja de costos (y los agentes empujan justo en esa dirección), el ahorro por token se diluye en volumen. Más barato cada token, pero muchísimos más tokens.

Qué está confirmado y qué no

Confirmado: los precios de las APIs cayeron cerca del 90% en 18 meses.
Confirmado: hubo recortes y límites (GitHub Copilot pausó Pro en 2024, Microsoft y Salesforce sumaron controles de costo durante 2024-2025).
Confirmado: el consumo energético de los centros de datos creció con fuerza.
Pendiente: si la demanda de tokens supera a la baja de costos en el mediano plazo.
Pendiente: cuántos proyectos con agentes sobreviven al recorte que anticipa Gartner.

Errores comunes al estimar costos de IA

Creer que tarifa plana es costo fijo para el proveedor. Es fijo para vos, no para él. Por eso aparecen los límites cuando lo usás en serio.
Asumir que si la API bajó 90%, tu factura baja igual. Si metés agentes, el volumen de tokens se dispara y la cuenta sube, no baja.
Desplegar agentes sin gobernanza. Sin límites de gasto ni alertas, un loop te vacía el presupuesto antes de que lo notes.
Tomar las cifras de costo como exactas. Los estimados de entrenamiento varían mucho según quién los calcula. Tomalos con pinzas.

Preguntas Frecuentes

¿Cuánto cuesta entrenar un modelo de IA?

Las estimaciones públicas ubican a GPT-4 cerca de USD 79 millones, a Gemini Ultra en torno a USD 191 millones y a Llama 3.1-405B por encima de USD 170 millones. Son cifras aproximadas que incluyen hardware, energía, datos e ingeniería. Lo explicamos a fondo en cómo Google enfrenta los mismos costos.

¿Por qué bajan los precios si entrenar sigue caro?

Por competencia, chips de inferencia más eficientes, modelos open-weight y un costo de cambio muy bajo entre proveedores. Buena parte de la baja, además, responde a precios por debajo del costo real para captar mercado.

¿Cuánto consume energéticamente un modelo de lenguaje?

Entrenar GPT-3 consumió unos 1.287 MWh y generó alrededor de 552 toneladas de CO₂. Modelos más grandes escalaron hasta las 8.930 toneladas, y la demanda eléctrica de los centros de datos para IA apunta a 40 GW en 2026.

¿Es viable económicamente construir una startup sobre IA?

Sí, pero con control de costos desde el día uno. El riesgo es el consumo descontrolado de tokens, sobre todo con agentes. Gartner proyecta que el 40% de los proyectos agénticos se cancelen antes de 2027, casi siempre por costos.

¿Por qué las tarifas planas de IA son insostenibles?

Porque un usuario intensivo puede generar miles de dólares en tokens mientras paga una cuota fija de USD 100/mes. Esa diferencia la cubre el proveedor, y por eso aparecen pausas de planes y límites de uso.

Conclusión

Lo que cambió es la transparencia: ya no se discute si la economía de la IA pierde plata, sino cuánto y hasta cuándo. Los precios bajaron, sí, pero la rentabilidad sigue en rojo y los proveedores empezaron a cobrar la cuenta con límites y recortes.

Si trabajás con IA, la lección es concreta: tratá los tokens como lo que son, un costo variable que puede explotar. Poné techos de gasto, medí el consumo de tus agentes y no diseñes tu negocio asumiendo que la tarifa plana de hoy va a seguir igual mañana. La fiesta de precios bajos tiene fecha de revisión.

Costos insostenibles de LLM: por qué la cuenta no cierra