En pocas palabras: Claude Opus 4.8 salió el 28 de mayo de 2026, 42 días después de 4.7. Codifica mejor (SWE-Bench Pro subió de 64.3% a 69.2%), suma control de esfuerzo en 5 niveles, un fast mode 2.5x más veloz y mantiene el mismo precio que 4.7.
Si venías usando 4.7, las características principales de Claude 4.8 se resumen rápido: mejor código, control más fino del esfuerzo y la misma factura a fin de mes. Anthropic lanzó Opus 4.8 el 28 de mayo de 2026, apenas 42 días después de 4.7, y el salto en programación es medible. SWE-Bench Pro pasó de 64.3% a 69.2%.
Claude Opus 4.8 es el modelo de lenguaje más capaz de la familia Opus de Anthropic, lanzado el 28 de mayo de 2026. Está orientado a programación y razonamiento, agrega control de esfuerzo en cinco niveles, un modo rápido 2.5 veces más veloz, ventana de contexto de 1 millón de tokens por defecto y mejor honestidad para marcar errores en código. Mantiene el precio de 4.7.
En 30 segundos
- Salió el 28 de mayo de 2026: 42 días después de 4.7, según el anuncio oficial de Anthropic.
- Codifica mejor: SWE-Bench Pro subió de 64.3% a 69.2% y Terminal-Bench 2.1 de 66.1% a 74.6%.
- Control de esfuerzo en 5 niveles: de Low a Max, vos elegís cuánto razona el modelo antes de responder.
- Fast mode 2.5× más rápido: misma inteligencia, pero sale el doble (USD 10 entrada / USD 50 salida por millón de tokens).
- Más honesto: cuatro veces menos probable que deje pasar un error en tu código sin avisarte.
- Mismo precio que 4.7 en modo estándar. Actualizar no cuesta un peso extra.
¿Qué es Claude Opus 4.8 y cuándo se lanzó?
Anthropic lanzó Opus 4.8 el 28 de mayo de 2026. Lo interesante es el ritmo: 42 días después de 4.7. Eso ya te dice algo. No es un parche de mantenimiento con un par de bugs corregidos, es una iteración con cambios que se notan en el día a día.
Ponele que sos dev y vivís adentro de la terminal pidiéndole al modelo que te refactorice un módulo. Ahí es donde 4.8 se diferencia. Anthropic lo posiciona como el modelo más capaz de la familia Opus, y la mayor parte de las mejoras apuntan a tareas de agente y codificación largas, esas donde el modelo tiene que sostener contexto durante muchos pasos sin perder el hilo.
¿Y para escritura simple o consultas sueltas? Ahí la diferencia con 4.7 es chica. Si solo le pedís que te resuma un PDF o te tire ideas para un post, no vas a ver el salto. El valor está en lo pesado. Cubrimos ese tema en detalle en la guía completa sobre Claude.
¿Cuánto mejoró Claude 4.8 en codificación respecto a 4.7?
Acá viene lo bueno. Los benchmarks de programación son la parte más concreta de las características principales de Claude 4.8, y los números no son del aire.
SWE-Bench Pro mide qué tan bien el modelo resuelve issues reales de repositorios de software (no ejercicios de juguete, problemas que alguien tuvo que arreglar de verdad). Claude pasó de 64.3% con 4.7 a 69.2% con 4.8. Terminal-Bench 2.1, que evalúa tareas dentro de la línea de comandos, saltó de 66.1% a 74.6%. Ese último es el salto grande: más de 8 puntos.
Pero el dato que más me importa no es de un benchmark de acierto. Es uno de honestidad: 4.8 es cuatro veces menos probable que deje pasar un error silencioso en el código sin marcarlo. ¿Sabés lo que es eso en producción? La diferencia entre que el modelo te diga “ojo, esta función asume que el array nunca está vacío” y que te entregue algo que parece perfecto hasta que explota un martes a las 3 de la mañana.
Control de esfuerzo: ¿cómo funciona y cuándo uso cada nivel?
Esta es la novedad que más cambia la forma de trabajar. El control de esfuerzo te deja decidir cuánto “piensa” el modelo antes de responder. Más esfuerzo, mejor calidad pero más lento y más tokens. Menos esfuerzo, respuesta al toque pero menos profunda.
Son cinco niveles. Cada uno tiene su lugar:
- Low: para tareas simples y de alto volumen. Clasificar texto, extraer datos, formatear. Querés velocidad y no necesitás que razone mucho.
- Medium: el equilibrio. Tareas cotidianas donde importa la calidad pero no te querés fundir el presupuesto en tokens.
- High: el nivel por defecto. La mejor relación calidad/costo para la mayoría del trabajo serio de codificación y análisis.
- Xhigh (o Extra): para tareas difíciles. Refactors grandes, debugging complejo, razonamiento de varios pasos donde un error arrastra todo.
- Max: sin techo. El modelo razona todo lo que necesite. Lo usás cuando el resultado vale más que el tiempo y el gasto.
Un consejo práctico: arrancá en High (es el default por algo) y movete según el caso. Si la respuesta viene floja en un problema complejo, subí a Xhigh o Max. Si estás procesando miles de items iguales, bajá a Low y ahorrás. Hipertextual tiene una guía buena sobre cuál usar si querés profundizar.
Fast mode: 2.5× más rápido, ¿pero a qué costo?
El fast mode es 2.5 veces más rápido. Y acá hay un mito que conviene matar de entrada: no reduce la inteligencia del modelo. Es el mismo Opus 4.8, respondiendo más rápido. La “trampa” no está en la calidad, está en el precio. Te puede servir nuestra cobertura de la comparativa entre Sonnet y Opus.
En modo estándar pagás USD 5 por millón de tokens de entrada y USD 25 por millón de salida. En fast mode eso se duplica: USD 10 entrada y USD 50 salida. Pagás la velocidad, literal.
¿Cuándo vale la pena? Cuando estás iterando rápido. Debugging en tiempo real, una sesión de pair programming con el modelo donde cada segundo de espera te corta el flow. Ahí la velocidad se paga sola en productividad.
¿Cuándo no? Tareas de un solo disparo (generá este informe y listo), procesos batch que corren de noche, o cualquier cosa con presupuesto ajustado. Si nadie está esperando del otro lado mirando el cursor, el doble de costo no tiene sentido.
¿Qué ventana de contexto y caché tiene Claude 4.8?
Claude 4.8 trae 1 millón de tokens de contexto por defecto. Para que tengas una idea: eso es un repositorio mediano entero, o una conversación de agente que se extiende durante horas sin que el modelo “se olvide” de lo que pasó al principio.
La otra mejora es más técnica pero pega fuerte si construís aplicaciones: el mínimo para cachear prompts bajó a 1.024 tokens. El caché de prompts te deja reutilizar partes fijas (el system prompt, instrucciones, contexto repetido) sin pagar por reprocesarlas cada vez. Que el mínimo sea más bajo significa que ahora podés cachear bloques más chicos y ahorrar en más escenarios. Tema relacionado: capacidades y precios del API.
Si tu app dispara cientos de llamadas con el mismo system prompt largo, esto es plata directa a tu favor. Y si estás corriendo agentes con contexto pesado en tu propia infraestructura cloud, conviene tener el alojamiento bien dimensionado: para infra y servidores en Argentina, donweb.com es una opción local.
¿Por qué dicen que Claude 4.8 es “más honesto”?
La “honestidad” de un modelo suena a marketing, pero acá tiene un significado concreto y medible. Anthropic trabajó para que 4.8 marque su incertidumbre antes y haga menos afirmaciones falsas con tono de seguridad.
El número que lo respalda ya lo mencioné: cuatro veces menos probable que pase por alto una falla en el código sin remarcarla. ¿Por qué importa tanto? Porque el peor error de un asistente no es equivocarse, es equivocarse con confianza. Un modelo que te dice “esto puede estar mal, verificalo” es más útil que uno que te entrega basura prolija.
En tareas críticas (migraciones de datos, código que toca pagos, queries sobre bases de producción) esa diferencia es la que separa una herramienta confiable de una ruleta. 4.8 viene más cerca de lo primero.
Claude 4.7 vs 4.8: tabla comparativa
| Característica | Claude 4.7 | Claude 4.8 |
|---|---|---|
| Fecha de lanzamiento | Mediados de abril 2026 | 28 de mayo de 2026 |
| SWE-Bench Pro (código) | 64.3% | 69.2% |
| Terminal-Bench 2.1 | 66.1% | 74.6% |
| Control de esfuerzo | Más limitado | 5 niveles (Low a Max) |
| Fast mode | No disponible | 2.5× más rápido |
| Contexto por defecto | Menor | 1 millón de tokens |
| Caché mínimo | Más alto | 1.024 tokens |
| Honestidad en código | Base | 4× menos errores sin marcar |
| Precio estándar | USD 5 / USD 25 por millón | USD 5 / USD 25 por millón |

¿Vale la pena actualizar de 4.7 a 4.8?
Respuesta corta: en modo estándar, sí, casi siempre. El precio es idéntico al de 4.7 y las APIs son las mismas, así que el costo de migrar es básicamente cambiar el identificador del modelo en tu código. Ganás capacidad de codificación y honestidad sin pagar más.
Actualizá ya si: usás agentes o sesiones de coding largas, necesitás que el modelo marque sus dudas en tareas críticas, o trabajás con contextos grandes. En esos casos el salto se nota y la honestidad mejorada te ahorra dolores de cabeza en producción. Esto se conecta con lo que analizamos en cómo usar Claude Code.
Podés esperar si: solo lo usás para escritura simple, resúmenes o consultas sueltas. Ahí 4.7 te alcanza y no vas a percibir la diferencia. Tampoco te tires de cabeza al fast mode si no tenés una necesidad real de velocidad; el doble de costo solo se justifica iterando en vivo.
Errores comunes al usar Claude 4.8
- Creer que fast mode es un modelo “más tonto”. No lo es. Es el mismo Opus 4.8 a 2.5× la velocidad. Lo único que cambia es el precio (el doble). Si lo descartaste pensando que baja la calidad, lo descartaste por la razón equivocada.
- Dejar todo en Max “por las dudas”. Más esfuerzo no es gratis: gastás más tokens y esperás más. Para clasificar texto o extraer datos, Low o Medium hacen el mismo trabajo a una fracción del costo. Reservá Max para lo que de verdad lo necesita.
- No tocar el caché de prompts. Si tu app manda el mismo system prompt en cada llamada y no estás cacheando, estás tirando plata. Con el mínimo en 1.024 tokens, casi cualquier prompt fijo de tamaño razonable ya califica.
- Ignorar las advertencias del modelo. 4.8 marca su incertidumbre más seguido justamente para que la leas. Si te dice “verificá esto”, verificalo. La mejora en honestidad sirve si le hacés caso.
Preguntas Frecuentes
¿Cuándo se lanzó Claude Opus 4.8?
Anthropic lanzó Claude Opus 4.8 el 28 de mayo de 2026, 42 días después de la versión 4.7. Es el modelo más capaz de la familia Opus a esa fecha.
¿Cuánto cuesta Claude 4.8 en modo estándar?
USD 5 por millón de tokens de entrada y USD 25 por millón de salida, el mismo precio que Claude 4.7. El fast mode duplica esos valores a USD 10 y USD 50 respectivamente.
¿Qué es el control de esfuerzo en Claude 4.8?
Es una función que te deja elegir cuánto razona el modelo antes de responder, en cinco niveles: Low, Medium, High (el default), Xhigh y Max. Más esfuerzo da mejor calidad a cambio de más tiempo y más tokens.
¿El fast mode de Claude 4.8 reduce la calidad?
No. El fast mode responde 2.5 veces más rápido con la misma inteligencia del modelo estándar. Lo único que cambia es el precio, que se duplica respecto al modo normal.
¿Cuánto contexto maneja Claude 4.8?
Claude 4.8 tiene una ventana de contexto de 1 millón de tokens por defecto. Además bajó el mínimo para cachear prompts a 1.024 tokens, lo que abarata reutilizar instrucciones fijas.
Conclusión
Claude Opus 4.8 no reinventa nada, lo afina. Sube en código (SWE-Bench Pro de 64.3% a 69.2%, Terminal-Bench de 66.1% a 74.6%), suma control de esfuerzo en cinco niveles, ofrece un fast mode 2.5× más veloz y, lo que más pesa en producción, es cuatro veces menos probable que deje pasar un error sin avisarte.
¿Qué hacer? Si trabajás con agentes o codificás en serio, actualizá: el modo estándar cuesta lo mismo que 4.7 y la migración es cambiar el nombre del modelo. Dejá el esfuerzo en High y movete según la tarea. Y antes de prender el fast mode, preguntate si de verdad hay alguien esperando del otro lado. Si la respuesta es no, ahorrate el doble de costo.
