Blog Donweb - Página 32

Codex de OpenAI: por qué fracasó como agente

2 junio, 20267 mayo, 2026

$Codex de OpenAI: por qué fracasó como agente 1$

El agente autónomo de código de OpenAI completa solo el 37% de los pedidos y genera código con vulnerabilidades OWASP. Qué pasó y qué usar en su lugar.

Orquestación multi-agentes con MCP en 2026

16 mayo, 20267 mayo, 2026

Agent-harness-kit scaffolding for multi-agent workflows (MCP, provider-agnostic) - ilustracion

Cómo coordinar múltiples agentes de IA con MCP usando agent-harness-kit: patrones de arquitectura, frameworks disponibles y errores comunes a evitar.

Red teaming para agentes IA en producción 2026

15 junio, 20267 mayo, 2026

red teaming assessment for production grade ai agents - ilustracion

Cómo evaluar la seguridad de agentes autónomos antes de producción: frameworks, vectores de ataque y metodología paso a paso.

Model Spec Midtraining: la técnica de Anthropic que cambia

21 junio, 20267 mayo, 2026

Anthropic researchers detail “model spec midtraining”, which adds a stage between pretraining and fine-tuning to improve generalization from alignment training - ilustracion

Anthropic publicó en mayo de 2026 MSM, una etapa de entrenamiento intermedia que reduce el desalineamiento agéntico de 68% a 5% en modelos de 32B.

Atlas: 103 tok/s en un LLM de 35B, ahora open source

16 mayo, 20266 mayo, 2026

The GB10 Solution Atlas is now open source, the inference engine made for the community with breakneck inference speeds (Qwen3.6-35B-FP8 100+ tok/s) - ilustracion

Atlas, el motor de inferencia LLM open source de Avarok Cybersecurity, alcanza 103 tok/s en Qwen3.5-35B y es 2,8x más rápido que vLLM en hardware Blackwell.

Jailbreak ChatGPT con imágenes: KROP explicado

18 junio, 20266 mayo, 2026

Codebase jailbreak of ChatGPT through image 2.0 - ilustracion

ChatGPT Vision procesa texto invisible en imágenes y puede ejecutar instrucciones ocultas. Así funciona KROP y qué riesgo real tiene para tu equipo de desarrollo.

Alucinaciones en GPT: datos reales y cómo reducirlas

16 mayo, 20266 mayo, 2026

My guy was hallucinating HARD today. - ilustracion

Las alucinaciones en GPT no mejoran de forma lineal: GPT-5 llegó al 4,8%, pero o3 alucinó el 33% en resúmenes. Las consecuencias legales ya son reales.

GPT-5.5: memoria inteligente y 52% menos errores

21 junio, 20266 mayo, 2026

ChatGPT 5.5 Memory Update Is INSANE! - ilustracion

GPT-5.5 es el nuevo modelo por defecto de ChatGPT con memoria acumulativa y 52.5% menos alucinaciones en áreas críticas. Todo lo que necesitás saber.

Google AI Overviews y AI Mode: ¿por qué son sistemas

18 junio, 20266 mayo, 2026

Google On AI Overviews & AI Mode Being Isolated Systems - ilustracion

Google confirmó que AI Overviews y AI Mode son sistemas técnicamente independientes. Qué significa para tu tráfico orgánico y cómo adaptarte en 2026.

Copilot en tus commits: qué pasó y cómo controlarlo

27 mayo, 20266 mayo, 2026

Microsoft made Copilot a co-author on every VS Code project, reverted after developers revolted - ilustracion

VS Code agregó atribución automática de Copilot en commits, cambió el default tres veces en diez versiones y tuvo un bug que creditaba la IA aunque estuviera desactivada.