Codex de OpenAI: por qué fracasó como agente
El agente autónomo de código de OpenAI completa solo el 37% de los pedidos y genera código con vulnerabilidades OWASP. Qué pasó y qué usar en su lugar.
El agente autónomo de código de OpenAI completa solo el 37% de los pedidos y genera código con vulnerabilidades OWASP. Qué pasó y qué usar en su lugar.
Cómo coordinar múltiples agentes de IA con MCP usando agent-harness-kit: patrones de arquitectura, frameworks disponibles y errores comunes a evitar.
Cómo evaluar la seguridad de agentes autónomos antes de producción: frameworks, vectores de ataque y metodología paso a paso.
Anthropic publicó en mayo de 2026 MSM, una etapa de entrenamiento intermedia que reduce el desalineamiento agéntico de 68% a 5% en modelos de 32B.
Atlas, el motor de inferencia LLM open source de Avarok Cybersecurity, alcanza 103 tok/s en Qwen3.5-35B y es 2,8x más rápido que vLLM en hardware Blackwell.
ChatGPT Vision procesa texto invisible en imágenes y puede ejecutar instrucciones ocultas. Así funciona KROP y qué riesgo real tiene para tu equipo de desarrollo.
Las alucinaciones en GPT no mejoran de forma lineal: GPT-5 llegó al 4,8%, pero o3 alucinó el 33% en resúmenes. Las consecuencias legales ya son reales.
GPT-5.5 es el nuevo modelo por defecto de ChatGPT con memoria acumulativa y 52.5% menos alucinaciones en áreas críticas. Todo lo que necesitás saber.
Google confirmó que AI Overviews y AI Mode son sistemas técnicamente independientes. Qué significa para tu tráfico orgánico y cómo adaptarte en 2026.
VS Code agregó atribución automática de Copilot en commits, cambió el default tres veces en diez versiones y tuvo un bug que creditaba la IA aunque estuviera desactivada.