9 de junio de 2026

El «tokenpocalypse» ya llegó: GitHub Copilot pasó a cobrar por token y los usuarios reportan facturas que se multiplican por 20

El "tokenpocalypse" ya llegó: GitHub Copilot pasó a cobrar por token y los usuarios reportan facturas que se multiplican por 20

Desde el 1 de junio de 2026, GitHub Copilot ha reemplazado su sistema de facturación plano por uno basado en consumo de tokens. Los precios de suscripción no han cambiado —Pro sigue en 10 dólares mensuales, Business en 19 por usuario, Enterprise en 39— pero lo que esos precios compran ahora no es acceso ilimitado a un asistente de código, sino un crédito mensual que se consume según los tokens procesados.

Un usuario de Reddit documentó la situación con una frase que se ha convertido en meme del sector tech: llamó al cambio el inicio del «tokenpocalypse» en su empresa. La expresión la recogió el podcast Equity de TechCrunch, donde los presentadores Anthony Ha, Kirsten Korosec y Sean O’Kane le dedicaron el episodio del fin de semana. Lo recoge hoy el artículo de TechCrunch sobre si estamos en el amanecer del tokenpocalypse.

¿Qué pasó exactamente con los precios de Copilot?

El modelo anterior de GitHub Copilot facturaba por «solicitudes premium»: un número de interacciones de IA por mes, relativamente independiente de la longitud de las conversaciones. El nuevo modelo factura por tokens, la unidad básica de procesamiento de los modelos de lenguaje: cada palabra de entrada, cada palabra de salida, cada token cacheado.

Para la mayoría de usos simples —autocompletado de código dentro de un IDE— los tokens son gratuitos e ilimitados. El autocompletado básico y las sugerencias de Next Edit no consumen créditos.

El problema aparece con los flujos de trabajo agentivos: cuando un desarrollador usa Copilot para analizar un repositorio completo, para refactorizar múltiples archivos en cadena, o para ejecutar revisiones de código con contexto amplio. Esas tareas pueden procesar decenas o cientos de miles de tokens por sesión. TechCrunch reportó usuarios proyectando costes de 750 dólares mensuales por patrones de uso que antes les costaban 29 dólares.

Algunos desarrolladores calculan que una sola sesión agentiva intensiva —pedir a Copilot que revise un PR grande o que refactorice un módulo complejo— puede consumir el crédito mensual completo del plan Business de 19 dólares en una o dos horas.

La pregunta de fondo: ¿puede la IA ser rentable?

El episodio de Equity explora la dimensión más profunda del asunto. Sean O’Kane planteó la pregunta directa: ¿los laboratorios de IA pueden reducir costes y avanzar tecnológicamente suficientemente rápido como para alinearse con lo que los clientes están dispuestos a pagar?

El ejemplo de Uber que usó O’Kane es ilustrativo: Uber pasó de admitir que había excedido su presupuesto de IA más rápido de lo esperado a imponer límites y recortar el uso interno en el plazo de semanas. La historia de la IA como utilidad barata —un ChatGPT de 20 dólares al mes para todo— siempre fue una subvención de los inversores de VC que financiaron pérdidas para ganar escala. El tokenpocalypse es el fin de esa subvención para los usuarios que más consumen.

GitHub fue explícito en su comunicado de abril de 2026 al anunciar el cambio: el objetivo es un «negocio de Copilot sostenible y fiable». Sostenible significa rentable. Rentable significa que el precio por token tiene que cubrir los costes de inferencia de los modelos que subyacen al servicio.

El contexto más amplio incluye los IPOs pendientes de Anthropic y OpenAI. Ambas empresas van a tener que mostrar a los inversores institucionales un camino hacia la rentabilidad. La práctica habitual de subvencionar el uso para captar usuarios se hace insostenible cuando el tráfico crece exponencialmente. El tokenpocalypse de GitHub es un ensayo general de lo que vendrá en más productos de IA.

Mi valoración

Lo que más me convence del nuevo modelo de GitHub es que es honesto sobre la economía real. Cobrar por token es cobrar por lo que realmente cuesta: cada token procesado tiene un coste real de cómputo en los centros de datos de Microsoft. El modelo de cuota plana era una ilusión sostenida por inversores y que ocultaba que el uso intensivo se subvencionaba con el uso casual.

Lo que más me preocupa es el efecto en equipos pequeños y autónomos. Las grandes empresas Enterprise tienen el presupuesto para absorber el aumento o para negociar límites personalizados. Los freelancers y equipos de 5 personas que usaban Copilot Business como herramienta central de productividad son los más expuestos a la sorpresa de factura.

Lo más estructuralmente significativo es que el tokenpocalypse va a llegar a todos los productos de IA, no solo a Copilot. La pregunta a 12 meses es si los laboratorios logran reducir los costes de inferencia suficientemente rápido para que el coste por token caiga antes de que la frustración de los usuarios erosione la adopción. Mi predicción: los costes bajan, pero no al ritmo suficiente para que el cambio sea transparente para el usuario intensivo. El tokenpocalypse es aquí para quedarse.

Preguntas frecuentes

¿Qué puedo hacer para controlar mi consumo de tokens en Copilot?

GitHub ha publicado guías de uso eficiente. Las recomendaciones principales: evitar dar a Copilot contextos de repositorio completo cuando solo necesitas ayuda con un archivo; usar el autocompletado básico del IDE para tareas simples (no consume tokens); y revisar regularmente el panel de consumo en la configuración de la cuenta. Los planes Business y Enterprise tienen dashboards de uso por equipo.

¿Los competidores de Copilot tienen el mismo modelo de precios?

Cursor, el principal competidor, también está transitando hacia precios basados en uso. En julio de 2026 implementará nuevos tiers para sus planes de equipo. JetBrains AI y Tabnine mantienen de momento modelos de cuota plana, lo que puede convertirse en una ventaja competitiva temporal si la frustración con el modelo de Copilot es suficientemente grande.

¿El autocompletado básico seguirá siendo gratuito dentro de la suscripción?

Sí. GitHub confirmó que el autocompletado de código y Next Edit Suggestions no consumen créditos y siguen siendo ilimitados en todos los planes. El consumo de tokens aplica a las funciones de chat, revisión de código, funciones agentivas y uso de modelos a través de la API de GitHub Models.




☞ El artículo completo original de Natalia Polo lo puedes ver aquí

No hay comentarios.:

Publicar un comentario