En pocas palabras: Claude Sonnet 4.6 es el modelo de propósito general de Anthropic lanzado el 17 de febrero de 2026. Ofrece rendimiento comparable a Opus 4.6 en la mayoría de tareas, pero a un costo 5 veces menor: USD 3 por millón de tokens de entrada y USD 15 de salida. Disponible en Claude.ai gratuito y vía API en más de 95 países.
Ejemplo práctico
Martina Rodríguez es desarrolladora freelance en Rosario. Tiene un cliente que le pidió migrar una app legacy de Python 2.7 a Python 3.12, con más de 4.800 líneas de código distribuidas en 23 archivos. Antes usaba un modelo anterior de la misma familia y el proceso le llevaba unas 6 horas: muchos errores de sintaxis pasaban el quality check inicial y los tenía que corregir a mano después.
Con Claude Sonnet 4.6, Martina cargó los archivos en bloques usando la ventana de 1 millón de tokens, le pidió al modelo que analizara dependencias cruzadas entre módulos y generara el código migrado con tests unitarios incluidos. El modelo identificó 47 incompatibilidades de sintaxis, 12 cambios de API de stdlib y 3 dependencias externas desactualizadas, todo en una sola pasada.
Resultado: La migración completa quedó lista en 1 hora 20 minutos. Los tests generados automáticamente cubrieron el 84% del código nuevo y solo 2 archivos necesitaron ajustes manuales menores. Martina redujo el tiempo de trabajo en un 78% y pudo entregar el proyecto dos días antes del plazo acordado.
Cómo funciona
- Enviás un prompt: Tu consulta llega a los servidores de Anthropic, donde Sonnet 4.6 la tokeniza y la procesa dentro de una ventana de contexto de hasta 200.000 tokens (o hasta 1 millón en beta).
- El modelo razona sobre el contexto: A diferencia de versiones anteriores, Sonnet 4.6 aplica capacidades de razonamiento extendido para tareas complejas como código o matemáticas, eligiendo automáticamente cuánto “pensar” antes de responder.
- Genera la respuesta: El modelo produce texto, código o acciones (en modo computer use) con mejoras sustanciales en precisión: hasta 89% en benchmarks matemáticos y 79.6% en tareas de ingeniería de software.
- Devuelve el resultado vía API o interfaz: La salida llega a Claude.ai, tu aplicación vía API REST, o plataformas compatibles como Amazon Bedrock y OpenRouter, lista para usar sin configuración adicional.
- Facturación por tokens consumidos: Solo pagás por lo que usás: $3 por millón de tokens de entrada y $15 por millón de salida, con el mismo precio que la versión anterior pero con rendimiento notablemente superior.
Claude Sonnet 4.6 es el modelo de propósito general de Anthropic lanzado el 17 de febrero de 2026, posicionado como la opción más eficiente: logra rendimiento similar a Opus 4.6 en muchas tareas pero cuesta 5 veces menos. Disponible en 95+ países incluyendo Latinoamérica, en Claude.ai (plan gratuito) y API.
En 30 segundos
- Sonnet 4.6 mejora 2.4 puntos en codificación (79.6% SWE-bench vs 77.2% en 4.5) y 27 puntos en matemáticas (89% vs 62%)
- Precio sin cambios: $3 entrada / $15 salida por millón de tokens, igual que 4.5
- Ventana de contexto de 1 millón de tokens en beta ($6/$22.50 después de 200k tokens)
- Computer use mejoró dramáticamente: 72.5% de accuracy (vs 14.9% en octubre 2024)
- Disponible en Claude.ai gratuito, Anthropic API, Amazon Bedrock y OpenRouter
Qué es Claude Sonnet 4.6
Claude Sonnet 4.6 es un modelo de lenguaje de propósito general desarrollado por Anthropic. Se posiciona entre Haiku (más barato) y Opus (más potente), pero la novedad acá es que no es simplemente “mejor que Sonnet 4.5 en todo”. Es un salto estratégico en eficiencia.
Lo anunció Anthropic el 17 de febrero de 2026. Está disponible en Claude.ai gratis, en la API de Anthropic, en Amazon Bedrock y en OpenRouter, así que llegó a casi todos lados. Los números que ves en benchmarks públicos (79.6% en SWE-bench, 72.5% en computer use) son reales, no marketing de laboratorio.
Una cosa importante: el precio no cambió. Sigue siendo $3 por millón de tokens de entrada y $15 de salida, igual que Sonnet 4.5. Entonces si usabas 4.5, pasarte a 4.6 es gratis en términos de pricing.
Mejoras clave respecto a Sonnet 4.5
Acá viene lo que importa realmente. La pregunta es: ¿vale la pena migrar? Y la respuesta depende de qué hacés.
En codificación, Sonnet 4.6 sacó 79.6% en SWE-bench (un test que simula tareas reales de engineering: escribir features, arreglar bugs). Sonnet 4.5 había sacado 77.2%. No es una explosión, pero son 2.4 puntos que en la práctica significan que el modelo entiende mejor la intención cuando le das un codebase complejo y le pedís que refactorice algo.
Donde se nota más es en matemáticas. Pasó de 62% a 89%. Eso sí que es mejora, treinta y siete puntos. Si usas Sonnet para resolver ecuaciones diferenciales, procesar datasets numéricos o validar fórmulas en papers científicos, 4.6 es claramente mejor.
Computer use (la capacidad de interactuar con UIs, hacer clicks, rellenar formularios) mejoró de forma brutal: 72.5% vs 14.9% en octubre de 2024. Eso significa que si le pedís al modelo que baje un PDF de un portal web, abra un formulario, lo rellene y lo envíe, ahora funciona más o menos siempre (con supervisión). Antes era un chiste.
En pruebas internas de Claude Code, Anthropic dice que los usuarios prefieren 4.6 sobre 4.5 en el 70% de los casos. No es 95%, pero es consistente.
Sonnet 4.6 vs Opus 4.6: matriz de decisión
Acá es donde muchos se confunden. ¿Si Opus existe, para qué quiero Sonnet 4.6?
En codificación, la diferencia es microscopía: Sonnet 4.6 hace 79.6% en SWE-bench, Opus 4.6 hace 80.8%. Un punto porcentual. Prácticamente idénticos para escribir código, refactorizar, debuggear. La ventaja de Opus aparece en tareas que demandan razonamiento profundo.
En ciencia, ahí sí se nota. GPQA Diamond (un benchmark brutal de preguntas de posgrado en física, química, biología) muestra: Sonnet 4.6 74.1%, Opus 4.6 91.3%. Diecisiete puntos de diferencia. Si la tarea es “analizar datos de un paper de vanguardia” o “resolver problemas de investigación”, Opus te da mucho más.
El precio es el factor que simplifica todo: Sonnet cuesta $3/$15 por millón tokens, Opus cuesta $15/$75. Cinco veces más caro. Así que el consejo de Anthropic es directo: usá Sonnet para el 80% de tus tareas (escritura, código simple, análisis de docs, automation), y Opus para el 20% donde necesitás pensamiento científico pesado. Más contexto en comparar con otros modelos de lenguaje.
| Métrica | Sonnet 4.6 | Opus 4.6 | Diferencia |
|---|---|---|---|
| SWE-bench (codificación) | 79.6% | 80.8% | +1.2 (casi nada) |
| Matemáticas | 89% | No publicado | Opus probablemente mayor |
| GPQA Diamond (ciencia) | 74.1% | 91.3% | +17.2 (Opus gana) |
| Computer Use | 72.5% | Pendiente | No comparable |
| Precio $/entrada | $3 | $15 | Sonnet 5x más barato |
| Precio $/salida | $15 | $75 | Sonnet 5x más barato |

Ventana de contexto de 1 millón de tokens (beta)
Sonnet 4.6 soporta 1 millón de tokens de contexto. En palabras: aproximadamente 750 mil palabras en una sola solicitud.
¿Qué significa eso en la práctica? Que podés pasarle de una vez: todo tu codebase (excepto si usas 10 millones de líneas), una docena de papers científicos, un contrato de 200 páginas, la documentación técnica completa de un proyecto, todo junto. El modelo lo procesa sin problema.
El precio cambia después de 200 mil tokens. Los primeros 200k siguen siendo $3 entrada / $15 salida. Después de eso salta a $6 entrada / $22.50 salida. Así que si procesas 1 millón de tokens, pagás más, pero es aún ridículamente barato comparado con Opus.
Importante: está en beta. Tiene el header `context-1m-2025-08-07` y requiere estar en tier 4+ de usage. Eso significa no está disponible para cualquiera todavía.
Casos de uso reales y aplicaciones prácticas
Te paso cuatro cosas que funcionan ahora con Sonnet 4.6 mucho mejor que antes.
Automatización de interfaces (Computer Use)
El modelo puede tomar screenshots, analizar dónde hay botones, campos de texto, menús, y hacer clicks exactos. Funciona 72.5% de las veces en tests reales. Casos prácticos: rellenar formularios de trámites, descargar PDFs de portales webs sin API, iniciar sesión en portales heredados, automatizar tareas repetitivas en UIs viejas que nadie modernizó.
Ejemplo real: “Bajá mis facturas del portal de la AFIP y metelas en una carpeta”. Antes Sonnet 4.5 lo hacía mal. Ahora funciona.
Desarrollo de software
Los números de SWE-bench (79.6%) no son solo theoretical. Significa que si le pedís: “refactorizá este componente React para que sea reutilizable”, “debuggea por qué este endpoint tira 500”, “generá un script CLI con click que haga X”, funciona frecuentemente a la primera. Y cuando no, la corrección es mínima.
Especialmente útil en Claude Code (la interfaz de desarrollo de Anthropic) donde la retroalimentación es inmediata.
Análisis documental masivo
Con 1 millón de tokens, podés pasarle una caja de documentos legales, técnicos, o regulatorios, y pedirle un resumen ejecutivo con referencias cruzadas. Funciona mejor que antes con Sonnet 4.5. Casos: análisis de términos de servicio, comparativa de propuestas de proveedores, extracción de datos de múltiples PDFs simultáneamente.
Agentes y workflows de automatización
Si estás armando un agente (un sistema que tome decisiones autónomas y ejecute tareas sin intervención humana cada vez), Sonnet 4.6 es bastante más confiable que 4.5. El computer use de 72.5% significa que los agentes pueden interactuar con sistemas reales sin quebrarse cada dos pasos.
Precio, costos y modelos de optimización
El pricing de Sonnet 4.6 sin cambios desde 4.5 es una buena noticia.
Base: $3 por millón de tokens de entrada, $15 por millón de salida. Eso es lo que pagás en la API de Anthropic o en Amazon Bedrock. Cubrimos ese tema en detalle en ejecutar LLMs en tu máquina.
Contexto largo (después de 200k tokens): $6 entrada, $22.50 salida. Así que una solicitud de 1 millón de tokens cuesta: (200k x $3) + (800k x $6) = $600 + $4800 = $5400 de entrada. Es caro si lo hacés todo el tiempo, pero para procesar documentos complejos esporádicamente, sigue siendo viable.
Batch API (para procesos no-time-critical): 50% de descuento. $1.50 entrada, $7.50 salida. Ahí sí si procesás volúmenes, se pone atractivo.
En Claude.ai gratuito (si no te importa el límite de mensajes), no pagás nada. Así que si querés probar 4.6 sin invertir, entrá a Claude.ai y empezá a usarlo.
Acceso, disponibilidad y cómo empezar
Sonnet 4.6 se lanzó el 17 de febrero de 2026 y está disponible en 95+ regiones. Latinoamérica incluida, así que si estás en Argentina, México, Colombia, o Chile, podés acceder sin VPN.
Hay cuatro formas de usarlo.
Opción 1: Claude.ai gratuito. Entrás, iniciás sesión, y Sonnet 4.6 es la opción por defecto (o la podés seleccionar en el dropdown). No pagás nada, pero hay límites de mensajes por hora.
Opción 2: API de Anthropic. Vas a platform.claude.com, generás una API key, y llamás al modelo con `claude-sonnet-4-6-20260217` o el alias `claude-sonnet-4-6`. Pagás por uso.
Opción 3: Amazon Bedrock. Si ya usás servicios de AWS, Sonnet 4.6 está ahí como opción. Mismo precio que la API de Anthropic.
Opción 4: OpenRouter. Es un agregador de APIs. También soporta Sonnet 4.6.
Para la ventana de 1 millón de tokens (beta), necesitás: ser tier 4+ en usage en la API de Anthropic, y pasar el header `context-1m-2025-08-07` en tus requests. No hay una lista de espera pública, simplemente activa si cumplís el tier.
Limitaciones y consideraciones críticas
No es magia, así que aclaremos qué no hace bien.
Computer use: suena increíble (72.5% de accuracy), pero eso no significa que funcione el 72.5% de las veces sin problemas. Significa que en tests controlados, acertó eso. En la práctica, a veces toma atajos raros, a veces no encuentra el botón correcto en UIs no-estándar, a veces hace clicks en el lugar equivocado. Necesita supervisión humana para operaciones críticas (compras, transferencias de dinero, cambios de configuración sensibles).
La ventana de 1 millón de tokens está en beta. Hay edge cases. Si mandás contenido muy repetitivo o estructuras muy complejas, el modelo a veces pierde contexto en los extremos (las palabras al final del millón).
No tiene alucinaciones menos que otros modelos, pero no es inmune. Sigue siendo capaz de inventarse URLs, funciones de librerías que no existen, o hallazgos científicos falsos. No lo uses sin verificar datos críticos.
No soporta Agent Teams (un feature avanzado de Opus para colaboración entre múltiples agentes).
Mejoraron anti-prompt-injection, pero no es un escudo perfecto. Si un usuario malicioso intenta joderte la solicitud, puede que funcione. Para más detalles técnicos, mirá otras herramientas generativas de OpenAI.
Errores comunes al usar Sonnet 4.6
Pensar que 4.6 reemplaza a Opus en todo
No. Opus sigue siendo mejor para razonamiento científico profundo, análisis matemático avanzado, y tareas que requieren “pensamiento de varias capas”. Sonnet 4.6 es más barato y suficiente para 80% de lo que hagas. No lo uses para investigación de frontera sin verificar después.
Asumir que computer use funciona siempre
El 72.5% es un promedio. En interfaces raras, heredadas, o con accesibilidad pobre, el modelo se puede perder. Siempre mandá un humano a verificar las operaciones críticas, aunque el modelo diga que terminó.
Usar la ventana de 1 millón para cualquier cosa
Pasarle 1 millón de tokens a Sonnet cuesta $5400+ en entrada sola. No vale la pena para procesar un email. Usalo para: análisis de codebase completo, múltiples papers simultáneamente, documentación legal masiva. Casos donde realmente necesitás contexto ilimitado.
No verificar datos críticos
El modelo sigue alucinando. Si la tarea implica datos financieros, regulatorios, o científicos, verificá con la fuente original. Especialmente en matemáticas: aunque mejoró mucho (89%), eso no significa que nunca se equivoque.
Preguntas Frecuentes
¿Qué es Claude Sonnet 4.6 y cuáles son sus características principales?
Claude Sonnet 4.6 es un modelo de IA de propósito general lanzado por Anthropic en febrero de 2026. Mejora respecto a Sonnet 4.5 en codificación (79.6% vs 77.2%), matemáticas (89% vs 62%), y especialmente en automatización de interfaces (72.5% accuracy en computer use). Soporta contexto de 1 millón de tokens en beta.
¿Cuáles son las diferencias principales entre Sonnet 4.6 y Opus 4.6?
Sonnet 4.6 es más barato (5x menos precio: $3/$15 vs $15/$75 por millón tokens) pero ligeramente menos poderoso en razonamiento científico profundo (74.1% vs 91.3% en GPQA Diamond). En codificación son prácticamente idénticos (79.6% vs 80.8%). Usa Sonnet para 80% de tareas, Opus para investigación y razonamiento complejo.
¿Cuánto cuesta usar Claude Sonnet 4.6?
$3 por millón de tokens de entrada, $15 por millón de salida (igual que Sonnet 4.5). Si usás contexto largo (más de 200k tokens): $6 entrada, $22.50 salida. Batch API (procesamiento no-realtime): $1.50/$7.50 (50% descuento). Es gratuito en Claude.ai con límites de mensajes.
¿Cómo accedo a la ventana de contexto de 1 millón de tokens?
Está en beta y requiere tier 4+ de uso en la API de Anthropic. Usá el header `context-1m-2025-08-07` en tus requests. No hay lista de espera pública, se activa automáticamente si cumplís el tier.
¿Vale la pena cambiar de Sonnet 4.5 a 4.6?
Sí, especialmente si usás computer use (el salto de 14.9% a 72.5% es brutal) o necesitás matemáticas y codificación mejorados. El precio no cambió, así que es una actualización gratuita. Si no usas esas features, la diferencia es marginal (2.4 puntos en SWE-bench).
Conclusión
Sonnet 4.6 es Sonnet 4.5 pero mejor en lo que importa: codificación confiable, matemáticas reales, y especialmente automatización de interfaces. El hecho de que el precio no cambió es un gusto. Si estás en la API de Anthropic o usás Claude.ai, actualizar es gratis y sin riesgos (podés seguir usando 4.5 si necesitás).
¿Es revolucionario? No. ¿Cambia el juego? Depende de lo que hagas. Si armás agentes, procesas documentos masivos, o debuggeás código en tiempo real, sí. Si escribís prompts ocasionales, es una mejora menor.
Lo interesante es la tendencia: cada versión de Sonnet mejora en eficiencia sin tocar precio. Eventualmente vas a llegar un punto donde Sonnet sea indistinguible de Opus en el 95% de casos. No estamos ahí todavía, pero vamos hacia allá.
