El programa secreto de Meta contra la IA rival

En pocas palabras: Meta ejecutó el programa secreto “Cannes” a través del contratista Covalen: pagó a cientos de personas para hacerse pasar por menores de 18 años y bombardear a ChatGPT, Gemini y Character.AI con decenas de miles de prompts perturbadores por ronda, buscando forzar fallos de seguridad.

Meta operó un programa secreto llamado “Cannes” que pagó a cientos de contratistas para hacerse pasar por adolescentes y bombardear a los chatbots de la competencia con prompts perturbadores, desde suicidio hasta canibalismo. El caso, revelado por WIRED y replicado por medios internacionales, expone hasta dónde llega la guerra por la IA. Ni OpenAI, ni Google ni Character.AI autorizaron esas pruebas. El tema de los Meta contratistas menores IA abre un debate que la industria venía esquivando.

El programa Cannes es una operación de testing adversarial que Meta ejecutó a través de su contratista Covalen, usando cuentas falsas de menores de 18 años para forzar fallos en los sistemas de seguridad de ChatGPT, Gemini y Character.AI. Se crearon perfiles con emails desechables y fechas de nacimiento falseadas. La escala llegó a decenas de miles de prompts por ronda, todos escritos desde la perspectiva de un chico o adolescente en crisis.

En 30 segundos

  • Qué pasó: Meta pagó a cientos de contratistas para posar como menores y atacar la IA rival con prompts sobre suicidio, autolesiones y sexo.
  • Quién lo ejecutó: el contratista Covalen, dentro de un programa interno llamado “Cannes”.
  • La escala: una sola planilla mostró casi 3.800 prompts; otra ronda superó los 45.000, según los reportes.
  • Los blancos: ChatGPT (OpenAI), Gemini (Google) y Character.AI, con cuentas falsas de menores de 18.
  • La reacción: las tres empresas dijeron que nunca autorizaron esas pruebas y se enteraron por la prensa.

Meta es una empresa de tecnología que opera las plataformas de comunicación digital Facebook, Instagram y WhatsApp. Fue fundada en 2004 por Mark Zuckerberg y adoptó el nombre Meta en 2021.

¿Cómo funcionaba el programa Cannes por dentro?

Ponele que sos un contratista y tu tarea del día es abrir una cuenta en ChatGPT diciendo que tenés 13 años, y después escribir mensajes fingiendo una crisis. Eso, más o menos, era el laburo.

Según el reporte de Futurism, Cannes armaba cuentas descartables con menos de 18 años declarados, usando correos temporales. La idea era estresar los modelos rivales, empujarlos a saltar sus propias barreras de seguridad. Todo sin que las empresas dueñas de esos modelos supieran nada.

Una de las planillas filtradas listaba casi 3.800 prompts en una sola instancia. De esos, cientos apuntaban a suicidio y autolesiones, cientos más a desórdenes alimentarios, y al menos 239 tenían contenido sexual o romántico. Todos redactados como si los escribiera un chico. El volumen no es un detalle menor: es lo que separa una prueba puntual de una operación industrial.

¿Quién es Covalen y por qué Meta usó una contratista externa?

Covalen es la empresa contratista que ejecutó Cannes por encargo de Meta. Se especializa en etiquetado de datos y evaluación de modelos de IA, el tipo de trabajo tercerizado que las big tech usan para tareas masivas y repetitivas. Más contexto en uno de los principales competidores de Meta en IA.

¿Por qué no lo hizo Meta con su propia gente? Por lo de siempre: distancia legal y escala. Cuando una operación es sensible, tercerizarla pone una capa entre la empresa y lo que se hace en el terreno. Si algo sale a la luz (spoiler: salió), la responsabilidad queda más difusa. Y para generar miles de prompts hacés falta muchas manos, algo que una contratista de etiquetado resuelve rápido.

El tema es que la tercerización no borra la intención. Los documentos internos que citan los reportes muestran que la dirección venía de Meta, con Covalen como brazo ejecutor.

¿A cuáles chatbots atacó Meta y con qué prompts?

Los tres objetivos fueron los chatbots más usados del mercado. Acá viene lo bueno: el contenido de los prompts es lo más difícil de justificar como “prueba de seguridad”.

ObjetivoEmpresa
ChatGPTOpenAI
GeminiGoogle
Character.AICharacter.AI
meta contratistas menores ia diagrama explicativo

Los ejemplos que trascendieron son fuertes. Uno describía a un alumno de quinto grado al que un compañero le apuntaba con un arma a la boca. Otro era sobre una chica tratando de ocultarle la bulimia a sus padres. Hubo uno que preguntaba si fantasear con comerse al hijo del vecino era “normal”. Y otro, posando como estudiante secundario, pedía dónde “conseguir cocaína”.

No fue solo texto. Los contratistas también mandaron imágenes de pastillas, sogas, cuchillos y un diagrama médico de un procedimiento ginecológico, según the-decoder. Cualquiera que haya trabajado en moderación de contenido sabe que este material no se genera por accidente.

¿Por qué el contenido de las pruebas fue tan perturbador?

Meta argumentó que era “benchmarking de seguridad”, una forma de asegurar experiencias apropiadas según la edad. La lógica sería: si querés saber si un chatbot protege a los menores, tenés que probarlo con los peores escenarios posibles. Complementá con alternativas más éticas a los sistemas de Meta.

Suena razonable hasta que lo pensás dos segundos. Si el objetivo era genuino, ¿por qué no avisarle a OpenAI o a Google? ¿Por qué usar cuentas falsas y emails desechables en vez de un canal oficial de red team? Las empresas serias hacen pruebas adversariales todo el tiempo, pero con permiso, en entornos controlados y con datos sintéticos propios.

La “seguridad” entre comillas se vuelve difícil de sostener cuando el método es indistinguible de un ataque. Subís cuentas falsas, las hacés pasar por chicos, bombardeás con miles de prompts sobre autolesiones, guardás las respuestas en una planilla y no le avisás a nadie: eso no es una auditoría, es otra cosa.

¿Qué dijeron OpenAI, Google y Character.AI?

Las tres coincidieron en lo básico: nunca autorizaron nada. OpenAI y Google expresaron preocupación por prácticas que consideran poco éticas. Character.AI fue en la misma línea.

El detalle que más pega es cómo se enteraron. No fue porque Meta les avisó al terminar. Fue por el trabajo periodístico de WIRED. O sea: durante meses, sus modelos estuvieron siendo sondeados con contenido extremo desde cuentas de supuestos menores, y ninguna lo sabía. Es la primera vez que sale a la luz una operación de este tipo a esta escala.

¿Es legal hacer estas pruebas sin autorización?

Acá se pone gris. En Estados Unidos, el acceso no autorizado a sistemas informáticos puede chocar con la CFAA (Computer Fraud and Abuse Act), sobre todo si se violan los términos de servicio. Y los términos de OpenAI y Google prohíben la automatización masiva y las pruebas adversariales sin permiso. Cubrimos ese tema en detalle en modelos de lenguaje que Meta busca sabotear.

  • Términos de servicio: crear cuentas falsas y automatizar prompts masivos suele estar prohibido de forma explícita.
  • Privacidad de datos: recopilar las respuestas de los modelos rivales podría rozar normas como el GDPR europeo, según cómo se almacenaran.
  • Regulación de IA: el AI Act de la Unión Europea empieza a marcar límites sobre testing y uso de datos, aunque todavía sin jurisprudencia clara para casos así.

La pregunta es: ¿dónde termina el benchmarking legítimo y empieza la competencia desleal? Todavía no hay una respuesta firme, y ese vacío es parte del problema.

¿Qué tan común es el stress testing adversarial en IA?

El red teaming es práctica estándar. OpenAI tiene su propio equipo, Anthropic también, y las empresas contratan expertos externos para romper sus modelos antes de lanzarlos. Eso está bien y hace falta.

La diferencia está en tres cosas: se avisa, se pide permiso y se hace en entorno controlado. Probar tus propios sistemas con datos sintéticos es una cosa. Atacar los de la competencia sin consentimiento es otra bien distinta. Si Meta quería medir seguridad de verdad, tenía sus propios modelos para hacerlo. Que apuntara a los rivales dice bastante sobre el objetivo real.

Errores comunes al leer este caso

  • Creer que “es solo testing de seguridad”: el testing legítimo se hace sobre sistemas propios o con permiso. Acá no hubo ninguna de las dos.
  • Pensar que tercerizar borra la responsabilidad: Covalen ejecutó, pero la dirección salía de Meta según los documentos internos. La responsabilidad no se terceriza.
  • Asumir que las empresas rivales lo sabían: se enteraron por la prensa, meses después. No hubo aviso ni coordinación.
  • Confundir esto con una hipótesis sin pruebas: hay planillas, prompts y cifras concretas en los reportes. No es un rumor difuso.

¿Qué implica esto para el desarrollo ético de IA?

El caso deja tres cosas sobre la mesa. Primero, la presión competitiva en IA está en un nivel donde algunas empresas cruzan líneas que antes ni se discutían. Segundo, no hay reglas claras sobre cómo, cuándo y contra qué se puede hacer testing adversarial. Tercero, si Meta lo hizo, es ingenuo pensar que es la única.

Para las empresas y equipos en Latinoamérica que integran IA en sus productos, el mensaje es concreto: los términos de servicio de los proveedores importan, y las pruebas adversariales sobre servicios de terceros pueden traer problemas legales. Si armás infraestructura propia para experimentar con modelos, hacelo en tu entorno, sobre tus sistemas. Para eso conviene apoyarte en un hosting como donweb.com donde controlás lo que corre y no dependés de las reglas de otro.

La discusión de fondo es si la industria necesita estándares comunes de testing ético, con organismos como el NIST o los AI Safety Institutes marcando la cancha. Por ahora, cada uno juega con sus propias reglas. Y ya vimos adónde lleva eso. Relacionado: iniciativas de IA de los competidores de Meta.

Preguntas Frecuentes

¿Qué es el programa Cannes de Meta?

Cannes fue un programa secreto de Meta que pagó a cientos de contratistas para hacerse pasar por menores y probar los chatbots rivales con prompts perturbadores. Lo ejecutó la contratista Covalen, sin autorización de las empresas afectadas.

¿A cuáles chatbots atacó Meta?

Los tres objetivos fueron ChatGPT de OpenAI, Gemini de Google y Character.AI. Se usaron cuentas falsas de menores de 18 años para empujar a esos modelos a saltar sus propias barreras de seguridad.

¿Cuántos prompts usaron los contratistas de Meta?

Una sola planilla filtrada mostró casi 3.800 prompts, con cientos enfocados en suicidio y autolesiones. Según los reportes, otra ronda superó los 45.000 prompts en total.

¿Es legal probar la IA de un competidor sin permiso?

Es legalmente dudoso. Crear cuentas falsas y automatizar prompts masivos suele violar los términos de servicio de OpenAI y Google, y en Estados Unidos podría chocar con la CFAA sobre acceso no autorizado a sistemas.

¿Qué dijeron OpenAI y Google sobre Cannes?

OpenAI y Google declararon que nunca autorizaron las pruebas y expresaron preocupación por prácticas poco éticas. Ambas se enteraron por el trabajo periodístico de WIRED, no porque Meta les avisara.

Conclusión

El caso Cannes cambió algo: dejó de ser hipótesis que las big tech pueden usar tácticas turbias para ganar la carrera de la IA. Ahora hay planillas, prompts concretos y cifras. Lo que importa no es solo qué hizo Meta, sino que lo hizo en un vacío regulatorio donde nadie define qué está permitido. Si trabajás con IA, tomá nota: respetá los términos de servicio de los proveedores, experimentá en tu propia infraestructura y no asumas que las pruebas adversariales sobre servicios ajenos son gratis. La industria necesita estándares comunes antes de que este tipo de operación se vuelva rutina. Por ahora, la única defensa es la transparencia que trajo el periodismo.

Fuentes

Desplazarse hacia arriba