La carrera de IA en ciberseguridad: defensores vs atacantes

La carrera armamentística de IA en seguridad informática ya no es una metáfora: es lo que está pasando en tiempo real en los equipos de ciberseguridad de todo el mundo. Sistemas de inteligencia artificial detectan vulnerabilidades en minutos que antes llevaban semanas encontrar, mientras los atacantes usan las mismas herramientas para explotarlas antes de que haya parche disponible.

En 30 segundos

  • La IA redujo el tiempo de detección de vulnerabilidades de semanas a minutos, acelerando tanto la defensa como el ataque.
  • Según reportes de 2026, el 42% de los CVEs publicados en los primeros cinco meses del año fueron descubiertos con asistencia de IA.
  • Anthropic desarrolló un sistema llamado Mythos que encontró 271 vulnerabilidades en el código de Firefox en una sola corrida.
  • El lado oscuro: la IA genera falsos positivos y, en algunos casos, directamente inventa vulnerabilidades que no existen, contaminando las bases de datos CVE.
  • Los fondos de venture capital volcaron USD 8.100 millones en startups de IA + ciberseguridad en el primer semestre de 2025, con crecimiento del 91% interanual.

Qué es la carrera armamentística de IA en ciberseguridad

La carrera armamentística de IA en ciberseguridad es el ciclo en el que defensores y atacantes adoptan herramientas de inteligencia artificial para encontrar y explotar vulnerabilidades de software, acelerando la competencia hasta un punto donde el factor humano ya no alcanza para seguirle el ritmo al sistema.

El modelo es simple pero brutal: antes, un investigador de seguridad tardaba semanas en analizar un codebase complejo buscando un buffer overflow o una falla de manejo de memoria. Ahora, un modelo de lenguaje entrenado en miles de CVEs históricas puede hacer el mismo análisis en una hora. El problema es que eso vale para los dos lados del tablero.

Ponele que trabajás en el equipo de seguridad de una empresa mediana. Antes tenías cierta ventaja temporal: aunque hubiera una vulnerabilidad en tu stack, el atacante también necesitaba tiempo para encontrarla. Esa ventana ya no existe de la misma manera. Según Wired, los sistemas de IA pueden identificar y comenzar a explotar una vulnerabilidad mucho antes de que el equipo de defensa termine de tomar el café.

Cómo funcionan los sistemas de IA para detectar vulnerabilidades

Las técnicas principales son cuatro, y cada una ataca el problema desde un ángulo distinto.

El análisis estático de código es el más directo: el modelo lee el código fuente como texto y busca patrones asociados a vulnerabilidades conocidas. Es como hacer un grep semántico entrenado en décadas de bugs reales. Después viene el pattern matching contra bases de datos de CVEs, donde el sistema compara fragmentos de código con firmas de vulnerabilidades ya documentadas.

Lo más interesante, y también lo más peligroso, es la simulación de ataques. Los sistemas de red teaming automatizado generan inputs maliciosos, los ejecutan contra el software objetivo y observan si el comportamiento se desvía de lo esperado. Es fuzzing con cerebro. El cuarto enfoque es el aprendizaje de anomalías: el modelo aprende qué es “comportamiento normal” en un sistema y detecta desvíos que podrían indicar una explotación en curso. Tema relacionado: modelos avanzados como Claude.

Lo que une a todos estos enfoques es la velocidad. Un humano analiza un archivo a la vez, con contexto limitado. Un modelo puede procesar millones de líneas de código manteniendo coherencia semántica a lo largo de todo el codebase. Eso cambia las reglas completamente.

Herramientas y modelos clave en 2026

Los ejemplos concretos son los que más hablan del estado del arte.

Anthropic Mythos y Firefox

Anthropic desarrolló un sistema interno llamado Mythos específicamente para hunting de vulnerabilidades. En una prueba sobre el codebase de Firefox, Mythos identificó 271 vulnerabilidades en una sola corrida. No todas eran críticas, pero el volumen demuestra la capacidad de cobertura que tiene este tipo de sistema comparado con un equipo humano equivalente.

Xint Code y el kernel de Linux

Un sistema llamado Xint Code completó un análisis de seguridad del kernel de Linux en aproximadamente una hora. El kernel de Linux tiene decenas de millones de líneas de código. Un auditor humano necesitaría meses para cubrir una fracción equivalente con el mismo nivel de detalle.

DARPA AI Cyber Challenge

DARPA organizó el AI Cyber Challenge, una competencia donde equipos con sistemas de IA compiten para encontrar y parchear vulnerabilidades en infraestructura crítica. Los finalistas demostraron capacidades de detección que superaron lo que los organizadores esperaban en el timeline original. No es un ejercicio académico: DARPA lo diseñó pensando en aplicaciones reales para infraestructura del gobierno de EE.UU.

Google AI Vulnerability Reward Program

Google extendió su bug bounty program para incluir vulnerabilidades encontradas con asistencia de IA. El objetivo declarado es cerrar la brecha entre la velocidad de ataque y la velocidad de defensa: si los atacantes usan IA para encontrar bugs más rápido, el programa de recompensas tiene que incentivar que los defensores también la usen. La iniciativa INGOTS de DARPA va en la misma dirección, financiando herramientas de detección automática para organizaciones que no tienen los recursos de Google o Anthropic.

La velocidad sin precedentes: de semanas a minutos

El dato que más impacta no es cuántas vulnerabilidades encuentra la IA, sino cuándo las encuentra.

En el ciclo tradicional, una vulnerabilidad era descubierta por un investigador humano después de días o semanas de análisis, reportada al vendor, parcheada en un ciclo de meses, y recién entonces publicada como CVE. La ventana de exposición era larga, pero también lo era la ventana para reaccionar. Te puede servir nuestra cobertura de capacidades de razonamiento de GPT.

Ahora, según reportes de seguimiento del primer semestre de 2026, el 42% de los CVEs publicados en ese período involucró asistencia de IA en la fase de descubrimiento. Eso no quiere decir que la IA hizo todo sola, pero sí que aceleró materialmente el proceso. El problema es que esa aceleración también comprime el tiempo que tienen los equipos de defensa para reaccionar antes de que el conocimiento de la vulnerabilidad se difunda.

¿Y qué pasa cuando la explotación también está automatizada? La ventana entre “vulnerabilidad descubierta” y “sistema comprometido” se achica a horas o menos.

Los riesgos ocultos: falsos positivos e IA que se inventa cosas

Acá viene la parte que menos se habla en las notas de prensa sobre IA en ciberseguridad.

Los sistemas de IA generan falsos positivos a escala. Un modelo que analiza millones de líneas de código va a marcar como sospechosas muchas cosas que no lo son. Eso puede parecer un problema menor, hasta que te das cuenta de que cada falso positivo requiere tiempo humano para descartarlo, y a la escala que opera la IA, el volumen puede saturar a cualquier equipo de seguridad.

Pero hay algo peor: la IA directamente inventa vulnerabilidades. Genbeta documentó casos donde reportes generados con asistencia de IA describían vulnerabilidades con lenguaje técnicamente vago, hacían referencia a funciones que no existen en el código, o presentaban “pruebas de concepto” que no compilaban. Estos reportes llegan a los programas de bug bounty, consumen tiempo de revisión, y en algunos casos terminan en bases de datos CVE con información incorrecta (spoiler: una vez que un CVE está publicado, es muy difícil corregirlo retroactivamente).

El tema es que los modelos de lenguaje no tienen un concepto nativo de “verificar si esto es real”. Generan texto que suena plausible. En el contexto de vulnerabilidades de seguridad, “suena plausible” puede contaminar el ecosistema de información que todo el mundo usa para tomar decisiones de parcheo.

El lado ofensivo: cómo los atacantes usan la misma IA

No es teoría. CrowdStrike identificó actores de amenaza concretos usando IA en sus operaciones: FAMOUS CHOLLIMA (asociado a Corea del Norte) y CHARMING KITTEN (Irán) ya incorporaron generación de código y automatización de ataques en sus toolkits.

Los usos ofensivos más documentados son: generación automática de variantes de malware que evitan detección por firma, elaboración de campañas de phishing personalizadas a escala (el modelo genera un email convincente para cada target basándose en su perfil público), explotación automatizada de vulnerabilidades apenas se publica el CVE, y adversarial machine learning, que es básicamente entrenar modelos para engañar a los sistemas de detección de los defensores. Más contexto en alternativas como Gemini.

Los números que circulan en 2026: pérdidas atribuidas a ataques orquestados con agentes de IA superan los USD 35 millones en incidentes documentados del año pasado. Tomalo con pinzas porque la atribución es siempre difícil, pero la tendencia es clara.

Equilibrio de poder: defensa en tiempo real vs. ataque exponencial

El objetivo que Google declaró explícitamente es que la defensa sea tan rápida como el ataque. Que el ciclo de detección-parche-deploy se achique al mismo ritmo que se achica el ciclo de detección-explotación del lado ofensivo.

Los números de inversión muestran que el mercado lo tomó en serio. USD 8.100 millones en startups de IA más ciberseguridad en el primer semestre de 2025, con un crecimiento del 91% interanual según el reporte de Armis. El mercado combinado proyecta un crecimiento de 25% CAGR en 2025-2026. No es una burbuja especulativa, es capital siguiendo un problema real.

La pregunta que nadie puede responder todavía: ¿la defensa puede escalar tan rápido como el ataque? Porque los atacantes no tienen restricciones de compliance, no necesitan explicar sus modelos a un board de directores, y pueden probar técnicas sin preocuparse por los falsos positivos. Los defensores tienen todas esas restricciones y más. Ahí es donde la supervisión humana sigue siendo no negociable: la IA puede hacer el análisis inicial, pero alguien con criterio tiene que decidir qué parchear primero y cómo comunicar el riesgo.

DimensiónDefensores (IA)Atacantes (IA)
Velocidad de detecciónMinutos a horasHoras a días post-CVE
Escala de análisisMillones de líneas de códigoSuperficie de ataque del target
Ejemplos de herramientasMythos (Anthropic), Xint Code, DARPA AIxCCFrameworks de FAMOUS CHOLLIMA, CHARMING KITTEN
Limitaciones principalesFalsos positivos, compliance, supervisión humanaDetección por comportamiento, atribución
Inversión H1 2025USD 8.100M en startups de defensaNo cuantificable directamente
Riesgo principalSaturación de equipos de revisiónVelocidad de explotación pre-parche
carrera armamentística ia seguridad diagrama explicativo

Qué significa para equipos de seguridad en Latinoamérica

Si administrás infraestructura web o tenés responsabilidades de seguridad en una empresa latinoamericana, la dinámica descripta arriba te afecta aunque no estés en el radar de los actores de amenaza más sofisticados. Por dos razones.

Primera: las herramientas ofensivas basadas en IA se democratizan rápido. Lo que hoy usan FAMOUS CHOLLIMA lo van a usar actores menos sofisticados en 12-18 meses. Segunda: los programas de bug bounty con IA generan ruido en todo el ecosistema de CVEs, y tu stack probablemente depende de software con CVEs cuya severidad real es difícil de evaluar porque parte del reporte fue generado por un LLM que se inventó detalles.

Para proyectos con hosting propio, asegurate de tener alertas automáticas de CVE sobre los componentes que usás. Si tu infraestructura corre en un proveedor como donweb.com, preguntá qué nivel de monitoreo de vulnerabilidades aplican del lado del servidor. El parcheo de infraestructura compartida es responsabilidad del proveedor, pero el parcheo de tu aplicación es tuyo.

Qué está confirmado / Qué no

Confirmado

  • Anthropic desarrolló Mythos y encontró 271 vulnerabilidades en Firefox (reportado por fuentes directas).
  • DARPA organizó el AI Cyber Challenge con finalists que demostraron capacidades de detección automatizada.
  • CrowdStrike documentó el uso de IA por actores de amenaza específicos (FAMOUS CHOLLIMA, CHARMING KITTEN).
  • La inversión en startups de IA + ciberseguridad fue de USD 8.100M en H1 2025, crecimiento 91% YoY.
  • Los modelos de IA generan reportes de vulnerabilidades con información incorrecta o inventada.

No confirmado o en desarrollo

  • El dato del 42% de CVEs con asistencia de IA en H1 2026 circula en reportes sectoriales, pero no tiene una fuente primaria publicada verificable al cierre de este artículo.
  • Las pérdidas de USD 35M+ atribuidas a agentes de IA son estimaciones de la industria, no datos auditados.
  • La viabilidad de que la defensa iguale la velocidad del ataque a mediano plazo: Google lo declaró como objetivo, pero el benchmarking independiente todavía no existe.

Errores comunes al implementar IA en seguridad

Error 1: tratar el output de la IA como verdad sin verificar. El flujo correcto no es “la IA encontró una vulnerabilidad, la reportamos”. Es “la IA encontró algo, un humano lo verifica técnicamente antes de que salga del equipo”. Sin ese paso, estás generando ruido CVE y quemando credibilidad con los vendors. Complementá con últimos modelos de lenguaje.

Error 2: medir éxito por volumen de hallazgos. Un sistema que reporta 500 posibles vulnerabilidades y 400 son falsos positivos es peor que uno que reporta 50 con alta precisión. El costo de revisar falsos positivos es real y lo paga tu equipo humano.

Error 3: asumir que si la IA no lo encontró, no existe. Los modelos actuales tienen sesgos hacia los patrones de vulnerabilidades más comunes y más documentados. Una vulnerabilidad novedosa o específica de tu stack puede pasar completamente desapercibida. La IA es un multiplicador de capacidad, no un reemplazo del criterio de un investigador experimentado.

Preguntas Frecuentes

¿Qué es la carrera armamentística de IA en seguridad informática?

Es el ciclo competitivo en el que defensores y atacantes adoptan herramientas de inteligencia artificial para encontrar y explotar vulnerabilidades de software, comprimiendo el tiempo de cada fase hasta el punto donde el análisis humano ya no es suficientemente rápido. El resultado es un loop de aceleración mutua donde cada mejora en detección defensiva empuja a los atacantes a automatizar más su lado, y viceversa.

¿Cuán rápido puede detectar una IA una vulnerabilidad en software?

En pruebas documentadas de 2026, sistemas como Xint Code completaron análisis del kernel de Linux en aproximadamente una hora. Anthropic’s Mythos identificó 271 vulnerabilidades en Firefox en una sola corrida. El tiempo exacto depende del tamaño del codebase y del tipo de análisis, pero la diferencia con el análisis humano es de órdenes de magnitud.

¿Cuál es la diferencia entre cómo usan IA los defensores vs. los atacantes?

Los defensores usan IA para análisis estático de código, pattern matching contra CVEs, y red teaming automatizado antes de que el software llegue a producción. Los atacantes la usan para generar variantes de malware, personalizar phishing a escala, y explotar vulnerabilidades en cuanto se publica el CVE. La principal diferencia operativa es que los defensores tienen restricciones de compliance y necesitan supervisión humana; los atacantes no tienen ninguna de las dos.

¿Es fiable la IA para encontrar vulnerabilidades reales?

Con supervisión humana, sí, y de forma impresionante. Sin ella, el ratio de falsos positivos puede ser muy alto, y en algunos casos documentados los modelos inventaron vulnerabilidades con funciones de código que no existen. La IA es útil como primer filtro y como herramienta de cobertura a escala, pero el paso de verificación técnica humana sigue siendo obligatorio antes de reportar o actuar sobre cualquier hallazgo.

¿Qué herramientas de IA usan las empresas para buscar vulnerabilidades?

Las más documentadas en 2026 incluyen Mythos de Anthropic (encontró 271 bugs en Firefox), Xint Code (análisis del kernel Linux en una hora), y los sistemas desarrollados por los finalistas del DARPA AI Cyber Challenge. Google tiene un AI Vulnerability Reward Program que incentiva el uso de IA en bug bounty. Además del software propio de grandes empresas, hay startups que recibieron parte de los USD 8.100M de inversión en H1 2025 desarrollando herramientas comerciales para equipos de seguridad medianos.

Conclusión

La carrera armamentística de IA en ciberseguridad cambió una variable fundamental: el tiempo. Lo que antes era una carrera donde los defensores tenían semanas para reaccionar ahora ocurre en horas. Eso no es un problema futuro, es el estado actual de la industria en 2026.

Para equipos de seguridad, el mensaje práctico es claro: sin IA en el stack defensivo, estás operando con herramientas que corren a velocidad humana contra amenazas que corren a velocidad de máquina. La adopción no es opcional a mediano plazo. Lo que sí es opcional es la ingenuidad: la IA miente, se inventa cosas, y sin supervisión humana puede generar más ruido que señal.

El equilibrio entre velocidad de detección y precisión de los hallazgos es el problema central que la industria todavía no resolvió. Y mientras tanto, los USD 8.100M de inversión apuntan a que mucha gente está apostando a que quien lo resuelva primero, se lleva el mercado.

Fuentes

Desplazarse hacia arriba