GitHub anunció que a partir del 1 de junio de 2026 cambia el modelo de facturación de Copilot: pasa de solicitudes premium a GitHub Copilot facturación por uso basada en tokens consumidos. El motivo es directo: el modelo anterior generaba pérdidas porque una sesión de agente de 8 horas costaba lo mismo que una pregunta de chat, y GitHub lo absorbía. Ya no.
En 30 segundos
- Desde el 1 de junio de 2026, Copilot cobra por tokens consumidos, no por cantidad de solicitudes.
- Plan Pro ($10/mes) incluye 1.000 créditos; Pro+ ($39/mes) incluye 3.900 créditos. Cada crédito equivale a $0,01 USD.
- Las completaciones de código y Next Edit Suggestions NO consumen créditos; el chat, CLI y agentes sí.
- GitHub pausó nuevas suscripciones el 20 de abril de 2026 como señal de que el modelo anterior ya no era viable.
- Si usás agentes de forma intensiva, tu factura puede ser 10x el valor del plan base.
Microsoft es una corporación multinacional fundada por Bill Gates y Paul Allen que desarrolla sistemas operativos, software empresarial y servicios en la nube como Windows, Office, Azure y GitHub.
El fin de la suscripción ilimitada: la crisis de costos
GitHub Copilot es el asistente de código de GitHub/Microsoft que permite a los desarrolladores generar, completar y refactorizar código usando modelos de lenguaje grandes directamente desde el editor.
Mario Rodriguez, chief product officer del equipo de producto de GitHub, lo explicó sin vueltas: “Hoy, una pregunta rápida de chat y una sesión de codificación autónoma de varias horas le cuestan al usuario lo mismo”. Eso, según el anuncio oficial de GitHub, es exactamente el problema. El costo de inferencia que GitHub absorbía creció hasta hacer el modelo insostenible.
La analogía que usa The Register es bastante buena: Red Lobster, la cadena de mariscos de EE.UU., quebró en 2024 después de que su promoción “Endless Shrimp” (camarones ilimitados) generara pérdidas millonarias porque la gente comía mucho más de lo que el precio cubría. GitHub no va a quebrar, claro (Microsoft se encarga de eso), pero el punto es el mismo: el modelo “todo lo que puedas usar” no escala cuando el insumo principal escala con cada sesión de agente.
El 20 de abril de 2026, GitHub pausó temporalmente las nuevas suscripciones de Copilot. Esa pausa fue la señal más clara de que el cambio era urgente, no opcional.
Qué cambió: del modelo de solicitudes al modelo de tokens
Antes, el plan incluía un número de “solicitudes premium”. El problema era que cada solicitud se contaba igual: mandabas un prompt corto de 20 palabras o arrancabas una sesión de agente con razonamiento extendido que consumía 400.000 tokens, y pagabas lo mismo. GitHub ponía la diferencia de su bolsillo.
Ahora la correlación es directa: tokens de input, tokens de output, tokens de caché. Cada uno tiene un peso distinto según el modelo que estés usando. Si usás Claude 3.5 Sonnet para una pregunta corta, gastás poco. Si usás un modelo de razonamiento avanzado para un refactoring complejo de varias horas, gastás proporcionalmente más.
¿Y qué es un token exactamente? Un token equivale aproximadamente a 4 caracteres de texto en inglés, menos en español. En la práctica, mil palabras son más o menos 1.300-1.500 tokens.GitHub Copilot facturación por uso: cómo funciona con créditos y tarifas
Según la documentación oficial de GitHub, el sistema funciona con créditos mensuales incluidos en cada plan:
| Plan | Precio mensual | Créditos incluidos | Costo extra por crédito |
|---|---|---|---|
| Copilot Free | $0 | Sin créditos (límites fijos) | No aplica |
| Copilot Pro | $10 USD | 1.000 créditos | $0,01 USD |
| Copilot Pro+ | $39 USD | 3.900 créditos | $0,01 USD |
| Copilot Business | $19/usuario | Varía por empresa | $0,01 USD |
| Copilot Enterprise | $39/usuario | Mayor asignación | $0,01 USD |

Cada crédito vale $0,01 USD. Cuando se terminan los créditos del mes, el uso adicional se factura a esa tarifa. La tasa de consumo varía por modelo: Claude 3.5 Sonnet gasta menos créditos por token que un modelo de razonamiento como Claude Opus 4.7, que está pensado para tareas más complejas y cobra más por el mismo volumen de texto.
Lo que no consume créditos: completaciones de código en tiempo real y Next Edit Suggestions. Eso queda fuera del contador. Lo que sí consume: chat en el editor, GitHub Copilot CLI, agentes autónomos, GitHub Spark y Spaces.
Calculadora real: cuánto vas a gastar según tu uso
Ponele que sos desarrollador con un uso moderado: abrís el chat de Copilot 5-6 veces por día para preguntas cortas, cada interacción consume entre 1.000 y 2.000 tokens. En un mes de trabajo (20 días hábiles), eso es entre 100.000 y 240.000 tokens de chat.
Con un modelo como Claude 3.5 Sonnet, eso se traduce en un gasto de créditos dentro de lo que incluye el plan Pro. Zafás sin pagar extra. El problema viene cuando empezás a usar agentes.
Una sesión de agente que refactoriza un módulo durante 2-3 horas puede consumir entre 200.000 y 400.000 tokens (input más output acumulado a lo largo de la sesión). Eso puede costarte entre $2 y $4 USD por sesión. Hacé tres de esas en la semana, y en un mes ya gastaste $24-$48 USD solo en tokens de agente, más los $10 del plan.
- Chat rápido (2-5 interacciones): ~5.000-10.000 tokens → $0,05-$0,10 por sesión
- Agente con razonamiento (2-3 horas): ~200k-400k tokens → $2-$4 por sesión
- Equipo de 5 devs, uso moderado: plan (~$50) + tokens (~$150-200) → $200-250/mes
- Startup con IA agéntica intensiva: costos pueden ser 10-20x el valor del plan base
El preview de facturación de mayo de 2026 va a ser clave para tener datos reales antes de que el cambio sea efectivo.
Impacto según tipo de usuario
No es lo mismo ser freelancer que trabajar en una startup con cinco desarrolladores que usan agentes todo el día.
Freelancer solo con Pro
Si usás Copilot para completaciones y alguna consulta de chat, probablemente los 1.000 créditos del plan Pro te duren el mes. El overflow puede aparecer si empezás a experimentar con agentes sin controlar el contexto. Ojo con dejar sesiones largas abiertas sin necesidad.
Equipo pequeño (5-10 personas)
El modelo nuevo tiene una ventaja real: el gasto es predecible si el equipo establece patrones de uso. Un dev que hace 3 sesiones de agente por semana va a tener un costo consistente, y podés presupuestarlo. Con el modelo anterior era difícil saber qué consumía más.
Startup con uso intensivo de IA agéntica
Acá viene lo bueno: si tu equipo usa agentes para tareas de integración, testing o generación de código a gran escala, el costo puede superar largamente el plan base. Una startup de 10 devs con uso agéntico intensivo puede terminar pagando $500-$1.000/mes en tokens, más el plan. Hay que evaluar bien antes del 1 de junio.
Enterprise
Las cuentas Enterprise tienen más control: pueden establecer límites por usuario, compartir créditos entre equipos y monitorear el consumo a nivel organizacional. Para estas cuentas el cambio es más manejable administrativamente, aunque el costo igualmente sube para usos intensivos.
Cómo reducir costos: estrategias que funcionan
La primera es obvia pero mucha gente no la aplica: elegí el modelo correcto para cada tarea. Para preguntas de chat y completaciones simples, un modelo más liviano como Claude 3.5 Sonnet consume muchos menos créditos que un modelo de razonamiento avanzado. Guardá el modelo pesado para cuando realmente necesitás razonamiento complejo.
La segunda es controlar el contexto. Los agentes acumulan contexto a lo largo de la sesión, y ese contexto se incluye en cada llamada al modelo. Una sesión de 3 horas que no limpiás el contexto puede consumir el doble de tokens que una bien manejada. Cuando terminés una tarea, cerrá la sesión de agente y arrancá una nueva.
Eso sí: a partir del 1 de junio de 2026, el code review de Copilot va a consumir GitHub Actions minutes, no créditos de Copilot. Dependiendo de tu uso de Actions, puede ser una alternativa más barata para revisión de código que usar el agente de chat para lo mismo.
El monitoreo del preview bill de mayo de 2026 es la acción más importante que podés hacer ahora. GitHub va a mostrar el consumo estimado en el nuevo modelo antes de que sea efectivo. Usá ese dato para ajustar el comportamiento del equipo antes de que empiece la facturación real.
Qué alternativas existen
Si el impacto es alto, existen otras herramientas. Cody de Sourcegraph tiene un modelo diferente con opciones gratuitas más generosas para equipos pequeños. Tabnine apunta más a completaciones con menos foco en agentes. Amazon CodeWhisperer tiene un tier gratuito con límites propios.
El problema es que migrar no es trivial. El valor de Copilot está en la integración con el ecosistema de GitHub (PRs, code review, Actions, issues), y eso no se replica fácil en alternativas. Para la mayoría de los equipos que ya usan GitHub como plataforma, la migración tiene un costo de fricción alto que hay que balancear contra el ahorro económico.
(Y si también necesitás infraestructura para hostear tus proyectos en Argentina, donweb.com tiene opciones de VPS y hosting que no dependen de estas fluctuaciones de precio de las herramientas de IA.)
Checklist de acción antes del 1 de junio
- Revisar el preview bill de mayo cuando esté disponible en el panel de GitHub.
- Evaluar el consumo actual del equipo: quién usa agentes y con qué frecuencia.
- Definir qué modelo usar para cada tipo de tarea (liviano para chat, avanzado solo cuando sea necesario).
- Si sos empresa, establecer límites de gasto por usuario en la configuración de GitHub.
- Comunicar el cambio al equipo antes del 1 de junio para que ajusten hábitos.
- Evaluar si el code review vía Actions minutes es más económico para tu caso.
- Si el impacto proyectado supera 2x el costo del plan, comparar con alternativas.
Errores comunes con el nuevo modelo
Error 1: Asumir que las completaciones consumen créditos. No es así. Las completaciones de código en tiempo real y Next Edit Suggestions están fuera del contador. Si usás Copilot principalmente para completaciones, el impacto puede ser mínimo. Revisá qué features usás antes de sacar conclusiones.
Error 2: Creer que el plan Pro+ siempre conviene para equipos. Los 3.900 créditos del Pro+ ($39) pueden ser demasiado o insuficientes dependiendo del uso. Para un dev con uso moderado, el Pro ($10) puede alcanzar. Para uno con uso intensivo de agentes, ninguno de los dos va a cubrir el mes sin overflow. El plan base no garantiza que no haya costo extra.
Error 3: No establecer límites de gasto antes del cambio. GitHub permite configurar límites de gasto para cuentas enterprise y de equipo. Si no los configurás, el sistema sigue facturando créditos adicionales sin límite hasta que llegue la factura. El límite no es automático: hay que activarlo.
Preguntas Frecuentes
¿Cuál es el cambio que hizo GitHub en el modelo de facturación de Copilot?
A partir del 1 de junio de 2026, GitHub reemplaza el modelo de “solicitudes premium” por un sistema de créditos basado en tokens consumidos. Antes, cada solicitud contaba igual sin importar la complejidad. Ahora, una sesión larga de agente consume más créditos que una pregunta corta de chat, en proporción directa al uso real de tokens.
¿Voy a pagar más o menos con la facturación por tokens?
Depende del uso. Si usás Copilot principalmente para completaciones de código, probablemente pagues igual o menos (esas no consumen créditos). Si usás agentes de forma intensiva, el costo va a subir. Según reportes de desarrolladores relevados por Visual Studio Magazine, los usuarios con uso agéntico intensivo pueden terminar pagando lo mismo o más por un servicio equivalente al actual.
¿Qué son los créditos de IA y cómo se consumen?
Cada plan de Copilot incluye una cantidad de créditos mensuales (1.000 en Pro, 3.900 en Pro+). Un crédito equivale a $0,01 USD. Los créditos se consumen al usar chat, CLI, agentes, Spaces y Spark; el rate varía según el modelo elegido. Las completaciones de código y Next Edit Suggestions no consumen créditos.
¿Cuántos tokens consume una sesión típica de Copilot?
Una sesión de chat con 2-5 interacciones consume entre 5.000 y 10.000 tokens ($0,05-$0,10 en créditos). Una sesión de agente de 2-3 horas con razonamiento complejo puede consumir entre 200.000 y 400.000 tokens ($2-$4 en créditos). Estos valores varían según el modelo y la longitud del contexto acumulado.
¿Cómo puedo controlar el gasto en mi equipo después del cambio?
GitHub permite establecer límites de gasto por usuario en cuentas Business y Enterprise; hay que activarlos manualmente. Para uso individual, la mejor estrategia es revisar el preview bill de mayo, elegir modelos livianos para tareas simples, y cerrar sesiones de agente cuando no se estén usando para evitar acumulación de contexto innecesaria.
Conclusión
GitHub cerró el buffet. El modelo de facturación por uso que arranca el 1 de junio de 2026 es una señal clara de que el costo de la IA agéntica ya no es absorbible por las plataformas que lo ofrecen como servicio flat. Lo que antes era “ilimitado” ahora tiene un precio proporcional al uso real.
Para la mayoría de los desarrolladores que usan Copilot para completaciones y chat ocasional, el impacto va a ser menor de lo que parece. El problema real es para los equipos que adoptaron los agentes como parte del flujo principal de trabajo, y que van a descubrir en mayo que su factura proyectada supera ampliamente el costo del plan. Ese preview bill de mayo es el dato más importante antes de tomar cualquier decisión.
La acción concreta es simple: revisá qué features de Copilot usa realmente tu equipo, establecé límites de gasto si trabajás en una organización, y ajustá los hábitos de uso de agentes antes de que el cambio sea efectivo. No es el fin del mundo, pero tampoco es un cambio menor si usás IA de forma intensiva.
Fuentes
- GitHub Blog — Anuncio oficial del cambio a facturación por uso
- GitHub Docs — Documentación técnica de la facturación por uso para individuos
- The Register — Análisis del cambio al modelo metered billing
- Visual Studio Magazine — Opiniones de desarrolladores sobre el cambio de precios
- GitHub Changelog — Code review consumirá GitHub Actions minutes desde junio 2026
