Kimi K2.7: el modelo IA open source que reta a GPT y Claude

En pocas palabras: Kimi K2.7 es el modelo open source que Moonshot AI lanzó en junio de 2026: arquitectura MoE de 1 billón de parámetros (32 mil millones activos), 256K de contexto y un 30% menos de tokens de razonamiento que K2.6. Sus benchmarks superan a GPT-5.4, pero los publica el propio fabricante.

Moonshot AI liberó en junio de 2026 Kimi K2.7 Code, un modelo IA open source con arquitectura MoE de 1 billón de parámetros (32 mil millones activos) y 256K de contexto. La empresa china asegura que recorta un 30% los tokens de razonamiento frente a K2.6 y publica benchmarks por encima de GPT-5.4 y Claude Opus 4.8. El detalle: casi todos los números son del propio fabricante.

Kimi K2.7 es el modelo IA de razonamiento y código que Moonshot AI presentó en junio de 2026 como sucesor de K2.6. Usa una arquitectura Mixture of Experts (MoE) con 1 billón de parámetros totales y 32 mil millones activos por token, ventana de contexto de 256K, un encoder visual propio (MoonViT) y modo de razonamiento siempre activo. Se distribuye con pesos abiertos bajo licencia Modified MIT.

En 30 segundos

  • Qué es: Kimi K2.7 Code, modelo open source de Moonshot AI lanzado en junio de 2026, MoE de 1 billón de parámetros (32 mil millones activos).
  • El gancho técnico: recorta un 30% los tokens de razonamiento respecto a K2.6 y mantiene 256K de contexto.
  • Precio: USD 0,95 por millón de tokens de entrada y USD 4,00 por millón de salida en la API de Moonshot. Entre 5 y 7 veces más barato que los modelos cerrados grandes.
  • La letra chica: los benchmarks que muestran superan a GPT-5.4 y Claude Opus 4.8, pero son medidos por la propia Moonshot y hay quien no los pudo reproducir.
  • Cómo probarlo: pesos gratis en Hugging Face bajo licencia Modified MIT, o API compatible con el SDK de OpenAI.

¿Quién está detrás de Kimi K2.7 y qué cambió respecto a K2.6?

Moonshot AI es la empresa china que viene empujando la familia Kimi desde hace un par de años. K2 fue la versión que la puso en el mapa fuera de Asia. K2.6 ya era competitiva. Y ahora aparece K2.7 Code, la variante orientada a programación y agentes.

El cambio más concreto frente a K2.6 no es que sea más grande, es que piensa más corto. Moonshot dice que K2.7 logra el mismo (o mejor) razonamiento usando un 30% menos de tokens internos de “thinking”. Si alguna vez pagaste una cuenta de API con un modelo que razona en voz alta antes de responder, sabés que ese 30% no es un detalle cosmético: es plata. Relacionado: en contextos de seguridad empresarial.

Eso sí: la mejora viene con una etiqueta de “Code” que conviene leer bien. Esta no es una actualización generalista, es un modelo afinado para escribir software y operar herramientas.

Características del modelo IA Kimi K2.7: arquitectura y capacidades

Acá van los datos duros que publicó Moonshot, según la documentación oficial de la plataforma:

  • Arquitectura MoE: 1 billón de parámetros totales, de los cuales solo 32 mil millones se activan por token. Eso baja el costo de inferencia sin perder capacidad teórica.
  • Contexto de 256K tokens: entran codebases enteras, hilos largos o documentación completa en una sola pasada.
  • MoonViT: un encoder de visión de 400 millones de parámetros que le da soporte nativo a imágenes y video, además de texto.
  • Razonamiento siempre activo: el modo “thinking” viene prendido por defecto. No tenés que pedirle que razone, ya lo hace.
  • Pesos abiertos: bajo licencia Modified MIT, lo que habilita uso comercial con algunas condiciones.

La parte multimodal es la que más me llama la atención. Un encoder visual propio integrado, no pegado con cinta, abre la puerta a flujos donde el modelo lee una captura de pantalla, entiende el error y propone el fix. Habría que ver qué tan fino afina en la práctica, pero el camino es el correcto.

¿Cómo se compara Kimi K2.7 con GPT-4o en razonamiento largo?

Ponele que tenés una tarea de varios pasos: leer un repositorio, entender la lógica, detectar un bug encadenado entre tres archivos y proponer el parche. Ese tipo de razonamiento multipaso es donde Moonshot dice que K2.7 brilla.

El número más mencionado es el de Humanity’s Last Exam, un test pensado para preguntas difíciles de verdad. Ahí K2.7 marca 54.0 contra 52.1 de GPT-5.4. Es una diferencia real, aunque ajustada. Tema relacionado: tal como sucede con ChatGPT.

Sumale el contexto. Con 256K tokens, K2.7 se banca documentos y conversaciones largas sin tener que cortar y resumir a cada rato, algo que en cadenas de razonamiento extensas suele ser justo el punto donde los modelos con ventana más chica empiezan a perder el hilo, a olvidarse de la instrucción inicial y a contradecirse sin darse cuenta.

Ahora bien, hay un detalle incómodo. VentureBeat reportó que varios desarrolladores que lo probaron no lograron reproducir esos puntajes en sus propias pruebas. La “transparencia” de los benchmarks de fábrica siempre conviene tomarla con pinzas.

Rendimiento en programación y tareas con agentes

Acá viene lo bueno para quien escribe código. Moonshot publicó mejoras importantes de K2.7 frente a K2.6 en sus propios benchmarks de programación:

  • Kimi Code Bench v2: +21,8% respecto a K2.6.
  • Program Bench: +11%.
  • MLS Bench Lite: +31,5%.
  • MCP Mark Verified: 81,1 puntos, por encima de Claude Opus 4.8 (76,4). Este mide uso de herramientas vía Model Context Protocol.

El dato de MCP es interesante porque apunta directo a tareas agentic: el modelo no solo responde, sino que decide qué herramienta llamar, con qué parámetros y en qué orden. Si construís agentes, ese número pesa más que cualquier test de trivia.

¿Significa que K2.7 le gana a Claude Opus 4.8 para programar en general? No tan rápido. Un benchmark de tool use no es lo mismo que la calidad del código que escribe ni la consistencia en sesiones largas. Y son, de nuevo, números medidos por Moonshot. Sobre eso hablamos en en modelos especializados en razonamiento.

Kimi K2.7 vs GPT-4o vs Claude Opus: tabla comparativa

Para ordenar la cabeza, esta es la foto según los datos disponibles a junio de 2026. Los puntajes de K2.7 son los publicados por Moonshot:

AspectoKimi K2.7GPT-4oClaude Opus 4.8
TipoOpen source (Modified MIT)CerradoCerrado
Contexto256K tokens128K tokens200K tokens
Precio entrada (por millón)USD 0,95Más altoMás alto
Precio salida (por millón)USD 4,00Más altoMás alto
Velocidad (versión HighSpeed)180 tokens/sMuy rápidoRápido
MultimodalTexto, imagen, video (MoonViT)Texto, imagen, audioTexto, imagen
Tool use (MCP Mark Verified)81,1No publicado76,4
Auto-hospedajeSí (pesos en Hugging Face)NoNo
kimi k2.7 modelo ia diagrama explicativo

La lectura honesta: K2.7 gana claro en costo y en apertura. GPT-4o sigue siendo la referencia de velocidad y madurez de ecosistema. Claude Opus pesa cuando te importa la consistencia y el comportamiento predecible en tareas sensibles. No hay un ganador único, hay un ganador por caso de uso.

¿Cuánto cuesta Kimi K2.7 y dónde se consigue?

La API de Moonshot lo ofrece a USD 0,95 por millón de tokens de entrada y USD 4,00 por millón de salida. Los cache hits bajan a USD 0,19 por millón, lo que ayuda si reusás mucho el mismo prompt de sistema.

Hay también una versión HighSpeed que entrega unos 180 tokens por segundo, pensada para aplicaciones donde la latencia importa. Esto se conecta con lo que analizamos en en las alternativas que ofrece Google.

Un ejemplo concreto de por qué el precio importa. Si tenés un agente que procesa 50 millones de tokens de entrada por mes, con K2.7 a USD 0,95 estás en torno a USD 47,50 solo en esa parte. Con un modelo cerrado de gama alta, ese mismo volumen puede salir varias veces más. Multiplicalo por miles de ejecuciones y la diferencia deja de ser anecdótica.

Para descargarlo sin pagar API, los pesos están en Hugging Face bajo licencia Modified MIT. Eso te deja correrlo en tu propia infraestructura.

Cómo empezar a usar Kimi K2.7 gratis o por API

Tenés cuatro caminos, según qué tan a fondo quieras ir:

  • Descargar los pesos: bajás el modelo de Hugging Face y lo corrés en tu servidor. Es la opción “gratis”, aunque un MoE de 1 billón de parámetros necesita hardware serio.
  • API de Moonshot: el SDK es compatible con el de OpenAI, así que migrar código existente es cambiar la URL base y la API key, poco más.
  • IDE Kimi Code: el entorno integrado que armó Moonshot para usar el modelo dentro del flujo de programación.
  • Proveedores externos: aparece también en OpenRouter y otros agregadores, útil si ya tenés ahí tu stack.

Si vas por el auto-hospedaje, ojo con el detalle: un modelo de este tamaño no corre en cualquier máquina. Vas a necesitar VPS o servidores con GPU potente, y ahí la cuenta de infraestructura puede comerse el ahorro de no pagar API. Si buscás alojamiento o servidores en Argentina para el resto de tu aplicación (la API, el frontend, la base de datos), donweb.com es una opción local. El modelo pesado, sin embargo, casi siempre conviene dejarlo en hardware especializado o directamente vía API.

Qué está confirmado y qué no

Confirmado

  • El lanzamiento y la licencia: Moonshot publicó K2.7 Code en junio de 2026 con pesos abiertos en Hugging Face bajo Modified MIT.
  • La arquitectura: MoE de 1 billón de parámetros totales, 32 mil millones activos, contexto de 256K y encoder MoonViT.
  • Los precios de la API: USD 0,95 entrada, USD 4,00 salida, USD 0,19 cache hits, según la documentación oficial.

No confirmado de forma independiente

  • Los benchmarks superando a GPT-5.4 y Claude Opus 4.8: son medidos por Moonshot. Practicantes citados por VentureBeat no pudieron reproducirlos.
  • La ventaja real en código de producción: los tests sintéticos no equivalen a calidad sostenida en proyectos grandes.
  • El recorte del 30% de tokens en todos los casos: probablemente sea un promedio, no una garantía por tarea.

Errores comunes al evaluar Kimi K2.7

  • Confundir “open source” con “gratis total”. Los pesos son gratis, sí. Pero correr un MoE de esta escala tiene un costo de hardware que mucha gente subestima. La corrección: calculá el costo de GPU antes de descartar la API por precio.
  • Tomar los benchmarks de fábrica como veredicto final. Un puntaje que el propio fabricante mide y nadie reprodujo todavía es una hipótesis, no un hecho. Probalo con tus propios casos antes de migrar nada en serio.
  • Asumir que “mejor en MCP Mark” significa “mejor para programar”. Tool use y calidad de código son cosas distintas. Un modelo puede orquestar herramientas de diez y escribir funciones mediocres, o al revés.
  • Migrar producción de golpe por el precio. El ahorro es real, pero la consistencia se prueba en el tiempo. Corré K2.7 en paralelo con tu modelo actual un par de semanas antes de tirar el viejo.

Preguntas Frecuentes

¿Qué es Kimi K2.7 y quién lo desarrolló?

Kimi K2.7 es un modelo IA open source de razonamiento y código lanzado por Moonshot AI, una empresa china, en junio de 2026. Usa arquitectura MoE de 1 billón de parámetros totales con 32 mil millones activos y ventana de contexto de 256K tokens.

¿En qué supera Kimi K2.7 a GPT-4o en razonamiento?

Según los benchmarks de Moonshot, K2.7 marca 54.0 en Humanity’s Last Exam frente a 52.1 de GPT-5.4, y maneja 256K de contexto contra los 128K de GPT-4o. Esto ayuda en razonamiento multipaso sobre documentos largos, aunque los puntajes no fueron reproducidos de forma independiente.

¿Cuánto cuesta usar Kimi K2.7 por API?

La API de Moonshot cobra USD 0,95 por millón de tokens de entrada, USD 4,00 por millón de salida y USD 0,19 por millón en cache hits. Es entre 5 y 7 veces más barato que los modelos cerrados de gama alta comparables.

¿Es Kimi K2.7 mejor que Claude Opus para coding?

En el benchmark MCP Mark Verified, K2.7 saca 81,1 contra 76,4 de Claude Opus 4.8, lo que sugiere mejor uso de herramientas. Pero ese test mide orquestación, no calidad de código en proyectos reales, y los resultados son del propio fabricante. Conviene probarlo con tus casos antes de decidir.

¿Puedo descargar y usar Kimi K2.7 gratis en mi servidor?

Sí. Los pesos están disponibles en Hugging Face bajo licencia Modified MIT, que permite uso comercial con condiciones. La descarga es gratuita, pero correr un modelo MoE de 1 billón de parámetros exige GPU de gama alta, así que el costo se traslada al hardware.

Conclusión

Kimi K2.7 mueve la aguja en lo que importa de verdad para quien construye con IA: costo y apertura. A USD 0,95 el millón de tokens de entrada y con pesos descargables, baja la barrera de entrada para armar agentes y herramientas de código sin atarte a un proveedor cerrado.

El asterisco está en los benchmarks. Los números que muestra Moonshot son seductores, pero son de fábrica y todavía nadie de afuera los confirmó del todo. Mi recomendación práctica: si ya gastás en API de modelos cerrados para tareas de código o agentes, corré K2.7 en paralelo un par de semanas con tus propios casos. Si el ahorro se sostiene y la calidad te cierra, migrás. Si no, al menos sabés con datos propios qué tenés enfrente, que es bastante mejor que creerle a un gráfico.

Fuentes

Desplazarse hacia arriba