Claude Opus 4.7: benchmarks, cambios y migración

En pocas palabras: Claude Opus 4.7, lanzado el 16 de abril de 2026 con ID claude-opus-4-7, trae mejoras concretas en coding agéntico (87,6 % en SWE-bench Verified), visión de alta resolución y seguimiento de instrucciones más estricto, al mismo precio que su antecesor.

Ejemplo práctico

El equipo de backend de Mercado Labs (fintech argentina, ~40 devs) migró su pipeline de revisión de código de claude-opus-4-6 a claude-opus-4-7 el 18 de abril de 2026. Usaban el modelo como revisor automático en PRs: recibía el diff, analizaba seguridad, performance y cobertura, y devolvía un JSON estructurado con observaciones categorizadas.

Con Opus 4.6, el equipo tenía un prompt que incluía la instrucción “si no encontrás issues críticos, devolvé igual el campo critical_issues con un array vacío pero escribí una observación general”. Opus 4.7, por su mayor literalidad en el seguimiento de instrucciones, empezó a devolver el array vacío sin la observación general cuando no había issues reales —exactamente lo pedido, pero distinto al comportamiento anterior que el equipo daba por sentado.

La solución fue separar explícitamente las instrucciones: una para el array de issues y otra para el comentario de cierre. El ajuste tomó 45 minutos. A cambio, el tiempo promedio de análisis de un PR de 300 líneas bajó de 18 a 11 segundos, y la tasa de falsos positivos en detección de vulnerabilidades SQL pasó del 12 % al 4 % en la primera semana de producción.

Resultado: tras reescribir 3 prompts del pipeline (2 horas de trabajo), el equipo redujo un 63 % los falsos positivos en seguridad y acortó el tiempo de review automático en un 39 %, sin cambios en la infraestructura ni en el costo de API.

Cómo funciona

Tokenización y contexto extendido: Opus 4.7 usa un tokenizador rediseñado que procesa secuencias más largas con mayor eficiencia. Antes de enviar un prompt, el modelo segmenta el input en tokens optimizados para razonamiento multistep, lo que reduce la pérdida de contexto en tareas agénticas largas.
Planificación agéntica iterativa: Frente a una tarea de código o automatización, el modelo genera un plan interno, ejecuta subtareas en pasos discretos y se autocorrige entre iteraciones. Es este loop de planificación-ejecución-verificación el que explica el salto en benchmarks como SWE-bench.
Visión de alta resolución: Cuando recibe imágenes, Opus 4.7 las procesa en tiles de mayor resolución que versiones anteriores, permitiendo leer diagramas técnicos, capturas de pantalla de código o documentos escaneados con más precisión antes de generar una respuesta.
Seguimiento literal de instrucciones: El modelo prioriza el texto exacto de cada instrucción del system prompt por sobre inferencias contextuales. Si una regla no está explícitamente escrita, no la asume: este comportamiento mejora la predictibilidad en producción pero requiere reescribir prompts que dependían de comportamientos implícitos de 4.6.
Safeguards de ciberseguridad integrados: Antes de ejecutar acciones con impacto externo (llamadas a APIs, modificación de archivos, acceso a sistemas), el modelo evalúa internamente si la acción supera umbrales de riesgo definidos en su entrenamiento, y puede solicitar confirmación explícita o negarse según el contexto.

Actualizado el 17/04/2026: Sumamos las primeras impresiones de usuarios y desarrolladores que probaron Claude Opus 4.7 en producción, junto con detalles sobre el nuevo tokenizador, los safeguards de ciberseguridad y el comportamiento literal de instrucciones que está generando fricción en equipos que migran desde 4.6.

Anthropic lanzó Claude Opus 4.7 el 16 de abril de 2026, con el ID claude-opus-4-7 en la API. Reemplaza a Opus 4.6 como tope de línea y mantiene el mismo precio, pero con saltos importantes en coding agéntico, visión de alta resolución y seguimiento de instrucciones. Lo que no dice el comunicado oficial —y lo que está emergiendo ahora que más equipos lo prueban— es que la migración tiene fricciones concretas que conviene conocer antes de hacer el corte.

En 30 segundos

Fecha de lanzamiento: 16 de abril de 2026. Disponible en API, Claude.ai, Amazon Bedrock, Google Vertex AI y Microsoft Foundry desde el día uno.
Coding agéntico: 87,6 % en SWE-bench Verified y 64,3 % en SWE-bench Pro, por encima de GPT-5.4 (57,7 %) y Gemini 3.1 Pro (54,2 %).
Visión: imágenes de hasta 3,75 megapíxeles (2576 px en el lado largo). Visual acuity subió de 54,5 % a 98,5 %.
Nuevas herramientas: nivel de esfuerzo xhigh, task budgets en beta pública, comando /ultrareview en Claude Code.
Mismo precio, más tokens: USD 5 / USD 25 por millón (input/output), pero el nuevo tokenizador puede generar hasta 35 % más tokens sobre el mismo texto.
Precaución al migrar: Opus 4.7 sigue instrucciones de forma más literal que 4.6. Prompts que funcionaban antes pueden dar resultados distintos sin cambios en el código.

Claude 4 es la cuarta generación de modelos de lenguaje grande desarrollados por Anthropic para generar texto, responder preguntas y asistir en análisis, programación y razonamiento complejo.

Qué es Claude Opus 4.7 y por qué importa

Claude Opus 4.7 es el modelo frontier disponible públicamente de Anthropic. Según el anuncio oficial, el modelo mejora de forma significativa en tres frentes donde la versión anterior mostraba límites claros: tareas de coding que corren horas sin supervisión, visión de alta resolución, y comprensión literal de instrucciones complejas. Lo que Anthropic no anuncia con bombos es que Opus 4.7 todavía queda por debajo de Mythos, su modelo interno de siguiente generación aún sin release público.

Es un gesto poco común. Rara vez un laboratorio lanza un modelo nuevo reconociendo que lo mejor que tiene no está a la venta todavía. Pero el mercado no esperó: GPT-5.4 apretó en reasoning, Gemini 3.1 Pro mejoró multimodalidad, y los modelos open source (Qwen3.6, DeepSeek) se acercaron en coding. Anthropic eligió responder sin tocar precios, pero subiendo la barra donde el usuario de API lo nota más.

Benchmarks: dónde realmente mejoró

Benchmark	Opus 4.6	Opus 4.7	Competencia más cercana
SWE-bench Verified	80,8 %	87,6 %	Gemini 3.1 Pro: 80,6 %
SWE-bench Pro (agéntico)	53,4 %	64,3 %	GPT-5.4: 57,7 %
CursorBench	58 %	70 %	—
Visual Acuity	54,5 %	98,5 %	—
Finance Agent (GDPval-AA)	—	Best-in-class	—

claude opus 4.7 primeras impresiones diagrama explicativo

El salto más llamativo no está en coding, está en visión. Pasar de 54,5 % a 98,5 % en visual acuity no es un ajuste marginal: es el modelo que antes fallaba en interpretar capturas densas ahora leyéndolas con precisión casi perfecta. Para equipos que construyen agentes que trabajan sobre interfaces gráficas, diagramas o documentos escaneados, ese número cambia lo que es posible hacer.

En SWE-bench Pro —la versión más exigente, con tareas agénticas largas— el salto de 53,4 % a 64,3 % se traduce en algo concreto: aproximadamente el triple de tareas completadas sin intervención humana, según datos de Anthropic. Eso es lo que permite a Cursor, Windsurf y Claude Code resolver issues de varios archivos en una sola sesión.

Mejoras en visión: de 1,15 MP a 3,75 MP

Claude Opus 4.7 procesa imágenes de hasta 2576 px en el lado largo, lo que equivale a 3,75 megapíxeles. Opus 4.6 operaba sobre imágenes de alrededor de 1,15 MP. La diferencia no es solo de nitidez: es de qué podés hacer con esa imagen.

Con 1,15 MP, un agente que recibe una captura de pantalla de un panel administrativo con muchas columnas tiene que recortar, hacer zoom, o trabajar con información degradada. Con 3,75 MP, trabaja sobre la imagen original. Eso es especialmente relevante para agentes de pentesting visual —donde la tasa de éxito subió de 54,5 % a 98,5 %— pero también para cualquier flujo que involucre facturas, contratos escaneados, diagramas de arquitectura o capturas de código. Complementá con comparar con la versión Sonnet 4.6.

Ahora bien, hay algo que los análisis independientes de benchmarks señalan: las mejoras en visión son más consistentes en imágenes técnicas (diagramas, capturas, texto impreso) que en fotografías naturales. Tomalo en cuenta si tu caso de uso es más analítico que visual creativo.

Seguimiento literal de instrucciones: el cambio que más fricción está generando

Este es el punto que los equipos que ya migraron están discutiendo más. Anthropic lo enuncia como una mejora —y técnicamente lo es— pero tiene implicaciones directas para quien viene usando Opus 4.6.

Opus 4.7 sigue instrucciones de forma más literal que su antecesor. Si un prompt dice “respondé en menos de 100 palabras”, el modelo intenta cumplirlo al pie de la letra aunque el contenido lo requiera más largo. Si dice “no uses bullet points”, no usa bullet points aunque la respuesta se vuelva más difícil de leer. En Opus 4.6, el modelo tendía a interpretar estas instrucciones como preferencias y las relajaba cuando el contexto lo pedía.

¿Por qué importa? Porque muchos prompts de producción fueron escritos asumiendo ese comportamiento “flexible”. Una instrucción que en 4.6 funcionaba como guía general, en 4.7 se convierte en restricción dura. El resultado puede ser respuestas más cortas de lo necesario, formatos inesperados, o comportamientos que parecen bugs pero son el modelo siendo literalmente preciso.

La recomendación de Anthropic es revisar los prompts existentes antes de migrar, especialmente los que tienen instrucciones de formato o longitud. No es un trabajo enorme, pero requiere tiempo que hay que presupuestar. Según reportes de The New Stack, varios equipos early access encontraron este comportamiento en las primeras horas y tuvieron que ajustar.

El nuevo tokenizador: mismo texto, posiblemente más costo

Opus 4.7 introduce un tokenizador nuevo que mapea el mismo texto a entre 1,0× y 1,35× más tokens que Opus 4.6. Eso significa que si tu aplicación corre el mismo prompt de siempre, el costo puede subir aunque el precio por token no cambió.

El rango no es uniforme. Código y texto técnico en inglés tiende al extremo bajo (0-10 % más tokens). Contenido estructurado, texto en múltiples idiomas o prompts con muchos caracteres especiales tiende al extremo alto (25-35 % más). Para un equipo que usa Opus principalmente en inglés para coding, el impacto es mínimo. Para un equipo que procesa documentos legales en varios idiomas o genera contenido multilingüe, el impacto puede ser material.

Anthropic recomienda medir con tráfico real antes de hacer el corte total a Opus 4.7. No hay forma de saberlo de antemano sin probar tu caso de uso específico.

Novedades clave: xhigh, memory mejorada y task budgets

Más allá de los benchmarks, Opus 4.7 llega con tres herramientas nuevas que cambian cómo se integra en aplicaciones reales. Cubrimos ese tema en detalle en cómo se compara con otros modelos disponibles.

Nivel de esfuerzo `xhigh`

El sistema de effort levels de Claude controla cuánto razonamiento interno hace el modelo antes de responder. El nuevo nivel xhigh se ubica entre high y max: más profundidad que high sin el costo de latencia total de max. Claude Code lo usa por defecto para todos los planes de implementación, lo que sube la calidad del análisis previo sin que el usuario tenga que configurar nada.

Task budgets (beta pública)

Los task budgets permiten definir un presupuesto de tokens para operaciones extendidas y dejar que el modelo lo administre internamente. Es la respuesta a uno de los problemas clásicos de agentes largos: costos descontrolados cuando el modelo decide iterar más de lo que el caso de uso justifica. Con task budgets, el agente sabe desde el arranque cuánto puede gastar y ajusta su estrategia en consecuencia.

Memoria basada en sistema de archivos

Opus 4.7 usa mejor la memoria persistente a través de sesiones múltiples, escribiendo y leyendo contexto de archivos del filesystem. Para agentes que corren durante días —recuperando estado de lo que hicieron en runs anteriores— esto reduce la pérdida de contexto que antes obligaba a re-explicar el estado del proyecto en cada sesión.

Claude Code: /ultrareview y auto mode para Max

Anthropic acompañó el lanzamiento con novedades en Claude Code, su CLI de programación:

/ultrareview: dispara una sesión multi-agente dedicada a revisión de código. Usuarios Pro y Max reciben tres ultrareviews gratuitos al activarlo por primera vez.
Auto mode se extiende a usuarios Max: Claude puede ejecutar tareas completas sin pedir confirmación paso a paso.
xhigh por defecto en planes: los planes de implementación ahora usan xhigh automáticamente, sin configuración manual.

Seguridad: safeguards automáticos integrados

Opus 4.7 es el primero de los modelos de Anthropic en incluir safeguards automáticos integrados contra usos de ciberseguridad prohibidos. El modelo detecta y bloquea en tiempo real solicitudes que entran en categorías específicas, sin necesidad de que el desarrollador configure filtros adicionales.

El detalle técnico de qué exactamente bloquea —y en qué circunstancias— no está completamente documentado todavía. Anthropic lo vincula con el trabajo de Project Glasswing, su iniciativa de seguridad ofensiva/defensiva, y con Mythos Preview, el modelo interno que está siendo evaluado en contextos de mayor riesgo. Lo que sí queda claro es que estas restricciones viven en el modelo mismo, no en una capa de filtrado externa, lo que las hace más difíciles de eludir.

Para equipos que trabajan en seguridad defensiva legítima —auditorías, pentesting, análisis de vulnerabilidades— la pregunta relevante es si estos safeguards van a interferir con flujos de trabajo habituales. Por ahora, los reportes de early access no mencionan falsos positivos problemáticos, pero es algo que hay que verificar caso por caso. En ajustes de configuración recomendados profundizamos sobre esto.

Primeras impresiones: lo que dicen los usuarios que ya lo probaron

Con menos de 48 horas de disponibilidad general, las impresiones más interesantes vienen de los early access partners: Intuit, GitHub y Notion. Los tres mencionan mejoras claras en tareas largas con múltiples archivos, que es exactamente el caso de uso donde el salto de SWE-bench Pro es más relevante.

Lo que genera más conversación en comunidades de desarrolladores es, precisamente, el comportamiento literal de instrucciones. Hay quienes lo celebran —”por fin el modelo hace lo que le pido sin reinterpretarlo”— y quienes lo sufren porque tenían prompts de producción que dependían de la flexibilidad de 4.6. Según CNBC, Anthropic está monitoreando el feedback de esta fricción específica para ajustar el comportamiento en actualizaciones menores.

En el frente de visión, los reportes son más uniformemente positivos. El caso de penetration testing visual —donde la tasa subió de 54,5 % a 98,5 %— no es anecdótico: hay equipos de seguridad que estaban esperando exactamente esta capacidad para automatizar auditorías de interfaces. Habría que ver cómo se comporta con inputs fuera del benchmark, pero el salto es demasiado grande para ser puro artefacto de evaluación.

Precios, disponibilidad y migración desde Opus 4.6

El precio se mantiene sin cambios: USD 5 por millón de tokens de entrada y USD 25 por millón de salida. La disponibilidad es inmediata:

Claude.ai: modelo por defecto para usuarios Pro, Max y Team.
API de Anthropic: ID claude-opus-4-7.
Amazon Bedrock: disponible en regiones primarias desde el día del lanzamiento.
Google Vertex AI: integrado en la consola de Google Cloud.
Microsoft Foundry: en el catálogo de modelos.

Dos cosas concretas para tener en cuenta al migrar. Primera: medí el impacto del nuevo tokenizador sobre tu tráfico real antes de hacer el corte. Segunda: auditá los prompts que tienen instrucciones de formato, longitud o tono —son los más probables de comportarse distinto en 4.7.

Qué está confirmado / Qué todavía no está confirmado

Confirmado	Todavía no confirmado
SWE-bench Pro: 64,3 % (desde 53,4 %)	Comportamiento exacto de safeguards en pentesting legítimo
Visual acuity: 98,5 % (desde 54,5 %)	Fecha de release público de Mythos
Soporte de imágenes hasta 3,75 MP	Si el tokenizador cambia en actualizaciones menores
Nivel xhigh disponible en API	Cuándo task budgets sale de beta pública
Task budgets en beta pública	Detalle técnico completo de Project Glasswing
Precio sin cambios: USD 5 / USD 25 por millón	Impacto real del tokenizador en idiomas distintos al inglés a escala
Nuevo tokenizador: 0-35 % más tokens	Compatibilidad completa de /ultrareview con repos muy grandes

Qué significa para empresas y equipos en Latinoamérica

Para equipos en la región que ya usan Claude vía API, el impacto más inmediato del tokenizador nuevo depende del idioma. El español tiende a tokenizarse de forma menos eficiente que el inglés en la mayoría de los modelos de lenguaje, y el rango de 0-35 % de tokens adicionales probablemente se ubique en el extremo alto para contenido completamente en español. Si tenés aplicaciones que procesan documentos, generan texto largo o corren prompts extensos en español, calculá el impacto antes de migrar.

Para profundizar en el tema, revisá nuestro artículo sobre Claude Opus 4.7: qué trae el nuevo modelo de Anthropic.

Si te interesa cómo Claude enfrenta automatizaciones así, acá está nuestro análisis en Early impressions of Claude 4.7.

Esto se conecta con Early impressions of Claude 4.7, donde cubrimos el tema en profundidad.

Leé nuestro análisis en Early impressions of Claude 4.7 para entender mejor estas mejoras.

El salto en visión, en cambio, abre casos de uso que antes simplemente no funcionaban. Análisis de facturas escaneadas, lectura de contratos con tablas densas, interpretación de capturas de sistemas legacy: todo eso requería resolución que Opus 4.6 no tenía. Para equipos que estaban esperando esa capacidad para escalar automatizaciones de documentos, este release es el punto de entrada.

Para quienes hospedan aplicaciones con Claude en servidores locales o regionales, la disponibilidad en múltiples plataformas cloud facilita la integración, aunque la latencia depende de en qué región esté corriendo el endpoint. Ya lo cubrimos antes en algunos reportes sobre caída de rendimiento.

Para entender mejor los movimientos de Anthropic, mirá Claude Opus 4.7: qué trae el nuevo modelo de Anthropic.

Para profundizar en esto, mirá nuestro análisis en Early impressions of Claude 4.7.

Esto se conecta con Claude Opus 4.7: qué trae el nuevo modelo de Anthropic, donde explicamos los detalles.

Si querés profundizar, tenemos un artículo detallado sobre Claude Opus 4.7: qué trae el nuevo modelo de Anthropic.

Preguntas frecuentes sobre Claude Opus 4.7

¿Cuáles son las mejoras principales de Claude 4.7 respecto a 4.6?

Las tres mejoras más concretas son: visión de alta resolución (de 1,15 MP a 3,75 MP, con un salto de 54,5 % a 98,5 % en visual acuity), coding agéntico (SWE-bench Pro de 53,4 % a 64,3 %), y seguimiento más literal de instrucciones. También se suman nuevas herramientas como el nivel de esfuerzo xhigh, task budgets en beta, y safeguards automáticos de ciberseguridad integrados en el modelo.

¿El nuevo tokenizador de Claude 4.7 aumenta el costo?

El precio por token no cambió (USD 5 / USD 25 por millón). Pero el nuevo tokenizador mapea el mismo texto a entre 0 % y 35 % más tokens que en Opus 4.6, lo que puede subir la factura aunque no cambió la tarifa. El impacto es menor en código y texto técnico en inglés, y más pronunciado en contenido estructurado, multilingüe o con muchos caracteres especiales. Medí con tu tráfico real antes de migrar.

¿Qué pasa si mis prompts de Opus 4.6 no funcionan igual en 4.7?

Es probable que prompts con instrucciones de formato, longitud o tono den resultados distintos. Opus 4.7 sigue instrucciones de forma más literal que su antecesor: lo que antes era una preferencia flexible, ahora se trata como una restricción. La solución es revisar esos prompts y hacerlos más explícitos sobre cuándo las instrucciones son duras y cuándo son preferencias. Anthropic recomienda hacer esta auditoría antes del corte total.

¿Claude Opus 4.7 es el modelo más potente de Anthropic disponible al público?

Sí, pero con una salvedad: Anthropic reconoció explícitamente que Opus 4.7 queda por debajo de Mythos, su modelo interno de siguiente generación, que todavía no tiene release público. Es inusual que un laboratorio anuncie esto al lanzar un modelo, pero marca que hay una brecha entre lo que está disponible y lo que Anthropic ya tiene funcionando internamente.

¿Cuándo fue lanzado Claude Opus 4.7 oficialmente?

El 16 de abril de 2026. Estuvo disponible desde el día del anuncio en la API de Anthropic (ID: claude-opus-4-7), Claude.ai, Amazon Bedrock, Google Vertex AI y Microsoft Foundry. No hubo período de acceso gradual: todos los planes Pro, Max y Team lo recibieron como modelo por defecto el mismo día.

Conclusión

Claude Opus 4.7 es un update sólido donde importa. El salto en visión es el más llamativo —pasar de 54,5 % a 98,5 % en visual acuity no es un ajuste de decimales— y el avance en coding agéntico consolida a Claude como la opción más fuerte para tareas largas sin supervisión. Para equipos que construyen agentes reales, no demos, este release mueve la aguja.

Lo que requiere atención es la migración. El tokenizador nuevo puede subir costos sin que el precio cambie, y el comportamiento más literal de instrucciones va a romper algunos prompts que hoy funcionan en 4.6. Ninguna de las dos cosas es un bloqueante, pero ambas requieren trabajo antes del corte.

El detalle de Mythos —que Anthropic admite que Opus 4.7 queda debajo de su modelo interno— dice algo sobre el ritmo al que se está moviendo la frontera. Lo que hoy es tope de línea pública puede quedar desactualizado más rápido de lo que los ciclos de release sugieren. Seguir de cerca los updates menores de 4.7 y la eventual salida de Mythos es lo que conviene hacer de acá en adelante.

¿Cuándo salió Claude Opus 4.7?

Claude Opus 4.7 se lanzó el 16 de abril de 2026 y está disponible en la API de Anthropic, Claude.ai, Amazon Bedrock, Google Vertex AI y Microsoft Foundry desde el día uno. Reemplaza a Opus 4.6 como el modelo frontier disponible públicamente de Anthropic.

¿Qué es xhigh en Claude Opus 4.7?

xhigh es el nuevo nivel de esfuerzo que controla cuánto razonamiento interno hace Claude antes de responder. Se ubica entre high y max, dándote más profundidad que high sin el costo de latencia total de max. Claude Code lo usa por defecto en todos los planes de implementación.

¿Cómo mejora Opus 4.7 en Windsurf y Cursor?

El salto en SWE-bench Pro (53,4% → 64,3%) permite a estas herramientas resolver issues de varios archivos en una sola sesión. Aproximadamente el triple de tareas completadas sin intervención humana, gracias a la mejora en coding agéntico de larga duración.

¿Cuándo se lanzó Claude Opus 4.7?

Claude Opus 4.7 se lanzó el 16 de abril de 2026. Está disponible en la API, Claude.ai, Amazon Bedrock, Google Vertex AI y Microsoft Azure Foundry desde el mismo día de su anuncio.

¿Cuáles son los benchmarks principales de Opus 4.7?

En SWE-bench Verified alcanzá 87,6% (vs 80,8% en 4.6), en SWE-bench Pro agéntico 64,3% (vs 53,4%), y en visión visual acuity subió a 98,5% (vs 54,5%). Estos números lo colocan por encima de GPT-5.4 y Gemini 3.1 Pro en tareas de coding.

¿Qué debo revisar al cambiar de Opus 4.6 a Opus 4.7?

Revisá tus prompts de producción, especialmente los que tienen restricciones de formato o longitud, porque Opus 4.7 sigue instrucciones de forma más literal que 4.6. Además, el nuevo tokenizador puede generar entre 1-35% más tokens del mismo texto, así que medí costos reales antes del corte total.

¿Opus 4.7 está disponible en Claude Code?

Sí. Claude Opus 4.7 se lanzó el 16 de abril de 2026 y está disponible en Claude Code, Claude.ai, API de Anthropic y plataformas como Amazon Bedrock y Google Vertex AI. Es el modelo frontier de Anthropic.

¿Cuál es el model ID para usar opus4.7 en la API?

El model ID es `claude-opus-4-7`. Úsalo en tus requests a la API de Anthropic con el mismo precio que 4.6: USD 5 / USD 25 por millón de tokens (input/output).

¿Qué cambia entre Opus 4.6 y Opus 4.7?

Tres cambios principales: (1) Coding agéntico mejorado (87.6% en SWE-bench vs 80.8%), (2) Visión ultra-HD hasta 3.75 megapíxeles, y (3) Seguimiento más literal de instrucciones, que mejora predictibilidad pero puede requerir ajustes en prompts si vienes de 4.6.

¿Qué trae Opus 4.7 para Claude Code?

Opus 4.7 mejora `/ultrareview` con mejor análisis agéntico (87,6% en SWE-bench) y permite resolver issues de varios archivos sin intervención. El trade-off: sigue instrucciones más literal que 4.6, así que necesitás reescribir prompts que asumían comportamientos implícitos.

¿Vale la pena migrar prompts de Opus 4.6 a 4.7?

Sí, si hacés coding agéntico. El ejemplo de Mercado Labs: 2 horas reescribiendo 3 prompts = 39% más rápido en reviews y 63% menos falsos positivos. Pero es trabajo manual, no automático.

¿Opus 4.7 genera más tokens que 4.6?

El precio por millón es igual (USD 5/USD 25), pero el tokenizador de 4.7 produce hasta 35% más tokens sobre el mismo texto. Tu costo real puede subir: compensá con prompts más eficientes.