GPT-Realtime-2: tool calling en paralelo y 128K contexto
GPT-Realtime-2 ejecuta herramientas en paralelo con 128K de contexto y 66.5% en ComplexFuncBench. Guía práctica de testing y migración desde Realtime-1.5.
GPT-Realtime-2 ejecuta herramientas en paralelo con 128K de contexto y 66.5% en ComplexFuncBench. Guía práctica de testing y migración desde Realtime-1.5.
Un mercado gris chino vende acceso a Claude API al 90% de descuento usando credenciales robadas y cosechando los prompts de usuarios como datos de entrenamiento.
ChatGPT perdió 22 puntos de cuota de mercado en menos de un año, sufrió caídas globales en 2026 y enfrenta límites técnicos confirmados por su propio cofundador.
Google AI Studio renovó Build Mode en 2026: creá apps con IA desde el navegador, sin código, con Gemini 3 y exportación directa a GitHub.
Thariq Shihipar, del equipo Claude Code en Anthropic, argumenta que pedir HTML en vez de Markdown cambia radicalmente la calidad del output. Acá por qué y cómo aplicarlo.
El benchmark DELEGATE-52 de Microsoft confirma que los LLMs degradan el 25% del contenido al editar documentos, incluso en modelos frontera.
MCP es el estándar de Anthropic que conecta LLMs como Claude a datos externos en tiempo real. Arquitectura, casos de uso reales y cómo implementarlo.
Anthropic lanzó Dreaming, Outcomes y Multi-Agent Orchestration en mayo 2026, con casos reales que muestran 6x mejora en task completion y 50% menos tiempo de revisión documental.
Los LLMs generan TLA+ con sintaxis perfecta, pero solo el 46% modela correctamente el sistema real. Así funciona SysMoBench y qué hacer al respecto.
OpenAI lanzó GPT-5.3 Instant el 3 de marzo de 2026 para corregir el tono condescendiente de ChatGPT, con un 27% menos de alucinaciones y respuestas más directas.