Por qué los chatbots aman a un farero llamado Elias Thorne

Ponele que le pedís a un chatbot que te cuente una historia cualquiera. Sin instrucciones raras, sin contexto. Y el bicho, en vez de inventar algo mínimamente original, te tira otra vez la misma trama: un farero solitario, una tormenta, una decisión difícil. Y el protagonista siempre se llama Elias Thorne. La primera vez te parece curioso, la segunda te da gracia, la quinta te preguntás si no estás hablando con un disco rayado. Un grupo de investigadores de Cornell se hizo la misma pregunta en serio y lo que encontraron es más raro y más revelador de lo que parece.

Elias Thorne es un nombre ficticio que aparece de manera desproporcionada en las historias generadas por chatbots como ChatGPT, Gemini y Claude. Investigadores de Cornell analizaron numerosos relatos creados por estos modelos y encontraron que ciertos nombres y oficios aparecen con una frecuencia notable, con “Elias el farero” como personaje recurrente. El hallazgo apunta a un sesgo introducido por las técnicas de alineamiento de seguridad, que entrenan a los modelos con conjuntos de datos “inofensivos” y terminan provocando una limitación en la variedad narrativa.

En 30 segundos

  • Un paper de Cornell revisó numerosas historias de ChatGPT, Claude y Gemini y encontró patrones repetitivos de palabras y personajes.
  • “Elias Thorne”, un farero, aparece con frecuencia en los relatos generados sin contexto adicional.
  • La causa más probable es el alineamiento de seguridad: los modelos se entrenan con datos “seguros” que sesgan la salida hacia tramas inofensivas.
  • El nombre ya saltó a libros autopublicados en Amazon y hasta a pistas de música ambiental generadas por IA.

Claude es un asistente de inteligencia artificial desarrollado por Anthropic, diseñado para mantener conversaciones, responder preguntas y realizar tareas como resumir textos o analizar documentos.

¿Qué dice el estudio de Cornell sobre Elias Thorne?

El estudio, realizado por investigadores de Cornell, analizó una gran cantidad de historias generadas por ChatGPT, Gemini y Claude usando prompts abiertos del tipo “escribí una historia corta” —sin pedir géneros, sin mencionar personajes— y encontró que en una proporción considerable de los relatos aparecía un tal Elias Thorne, siempre en el papel de farero o relojero (o ambos, que tampoco es que abunde la variedad).

Lo interesante es que los investigadores no encontraron diferencias significativas entre modelos. ChatGPT, Gemini y Claude (que vienen de arquitecturas, empresas y procesos de entrenamiento distintos) convergen en exactamente el mismo estereotipo narrativo. Esto ya te dice que el problema no es de un proveedor: es de la industria entera.

Los investigadores identificaron un conjunto de palabras que aparecen consistentemente en las historias analizadas: Lighthouse, Keeper, Baker, Mayor, Clockmaker, Fisherman, Librarian, Conductor, y los nombres propios Elias, Mara y Elara. O sea, si alguna vez configuraste un modelo para generar texto creativo y te salió un pueblo costero con un farero atormentado, ya sabés por qué: el modelo no está improvisando, está reciclando. Esto se conecta con lo que analizamos en nuestra guía completa de Claude.

¿Por qué los chatbots recurren siempre a un farero llamado Elias Thorne?

Acá viene la teoría que manejan los investigadores, y la verdad es que cierra bastante. El alineamiento de seguridad —ese proceso que busca que los modelos no generen contenido violento, ilegal, sexualmente explícito o cubierto por copyright— usa datasets “curados” para el ajuste fino. Uno de los más usados es WildChat, un conjunto de conversaciones diseñado para ser seguro y libre de material protegido. El problema es que ese filtro de seguridad también aplana la diversidad narrativa.

Pensalo así: cuando le pedís a un modelo que sea creativo pero que no toque ningún tema sensible, que no mencione marcas, que no reproduzca fragmentos de obras existentes y que no se meta en zonas grises, lo estás empujando hacia el único territorio que nunca falla: el farero solitario en un pueblo inventado. Es la historia más genérica, más inofensiva y más desprovista de anclajes reales que existe. Y los modelos, que son básicamente máquinas de predecir el próximo token, encontraron ahí un refugio estadístico.

La hipótesis es que el alineamiento no solo poda el contenido no deseado —también poda la variedad, y lo que queda es un conjunto muy chico de patrones narrativos que el modelo repite porque son los que mejor sobrevivieron al filtro.

¿Cuáles son los nombres y ocupaciones recurrentes según la investigación?

El estudio identificó un conjunto de palabras que aparecen con frecuencia en las historias generadas sin restricciones. No es que aparezcan todas juntas siempre, pero la recurrencia es tan alta que los investigadores las trataron como un “vocabulario núcleo” del storytelling artificial. La tabla que sigue resume los hallazgos:

PalabraTipoFrecuencia estimada en el corpus
LighthouseLugarMuy alta
KeeperOcupaciónMuy alta
EliasNombre propioMuy alta
ClockmakerOcupaciónAlta
MaraNombre propioAlta
ElaraNombre propioAlta
FishermanOcupaciónMedia-alta
BakerOcupaciónMedia
MayorOcupaciónMedia
LibrarianOcupaciónMedia
ConductorOcupaciónMedia
Elias Thorne farero diagrama explicativo

Lo que llama la atención es que estos nombres y oficios no vienen de ningún corpus literario famoso. No es que Elias Thorne sea un personaje de Hemingway que los modelos aprendieron de memoria. Es un emergente estadístico puro: nombres que suenan plausibles en inglés, oficios que evocan soledad o vida pueblerina, todo mezclado en una sopa de tokens que el modelo regurgita porque le dio buen resultado en el entrenamiento con WildChat. Sobre eso hablamos en la comparativa entre Sonnet y Opus.

¿Cómo se relaciona Elias Thorne con libros de Amazon y música?

El fenómeno ya desbordó el chat. Elias Thorne no solo protagoniza las historias que te tira ChatGPT cuando no sabés qué pedirle: ahora también es autor (ficticio) de libros en Amazon y nombre de pista en plataformas de música ambiental. Gente que genera contenido con IA sin revisar demasiado —o directamente sin revisar nada— está publicando volúmenes enteros firmados por “Elias Thorne” o con ese nombre como personaje central.

El dato más inquietante que reportó 404 Media es que alguien usó ese nombre en libros autopublicados en Amazon. La historia del farero es inofensiva, pero el mismo sesgo que la produce puede colarse en géneros donde la precisión importa.

En plataformas de música ambiental el patrón es parecido: pistas generadas con herramientas de IA que incluyen “Elias Thorne” en el título o en los metadatos. No es que el nombre tenga un significado musical —es simplemente que los generadores de texto aplicados a metadata repiten el mismo sesgo, y los creadores ni se enteran.

¿Qué implica esto para la creatividad y seguridad de la IA?

El hallazgo de Hamilton y Mimno es un test de Rorschach para la industria: según cómo lo mires, es una curiosidad simpática o un síntoma de que algo está roto en la forma en que alineamos modelos. A mí me parece más lo segundo.

El punto es que las medidas de seguridad no son inocuas. Cuando filtrás datasets para eliminar contenido problemático, también estás recortando la diversidad temática y estilística. El resultado no es un modelo “más seguro pero igual de creativo”: es un modelo que encontró un atajo estadístico y lo explota hasta el hartazgo. ¿Alguien lo verificó de forma independiente? El paper de Cornell es justamente eso, y los números son elocuentes: una gran parte de las historias comparten protagonista y ambientación.

Esto también desmiente de un saque la idea de que los chatbots “inventan” cosas. No inventan nada. Lo que hacen es samplear distribuciones de probabilidad condicionadas por un proceso de alineamiento que dejó pocas opciones viables. La “creatividad” es un espejismo estadístico, y Elias Thorne es la prueba. Lo explicamos a fondo en las capacidades de la API de Opus.

Los investigadores planean seguir explorando esta teoría en trabajos futuros, según reportó Gizmodo. La pregunta que queda abierta es si se puede diseñar un proceso de alineamiento que no produzca estos cuellos de botella, o si la seguridad y la diversidad narrativa son objetivos inevitablemente en tensión. Habrá que ver.

¿Qué significa esto para empresas y equipos en Latinoamérica?

Si estás usando modelos de lenguaje para generar contenido —descripciones de producto, guiones para videos, posts para redes— este hallazgo te afecta más de lo que parece. El sesgo hacia nombres y oficios anglosajones es una señal de que los datasets de alineamiento están construidos casi exclusivamente desde el inglés y desde sensibilidades culturales muy específicas.

Para un ecommerce argentino que genera descripciones con IA, el riesgo no es que aparezca un farero (eso sería hasta gracioso). El riesgo es que el modelo repita estructuras narrativas pensadas para otro hemisferio, con implicancias culturales que no encajan, referencias que nadie entiende y un tono de voz que suena importado. Si encima metés alineamiento de seguridad que aplana la diversidad, lo que te queda es un contenido genérico difícil de diferenciar en un mercado donde justamente la voz propia es lo único que te separa del ruido.

La recomendación obvia es revisar siempre la salida de los modelos —cosa que muchos no hacen porque asumen que “la IA sabe lo que hace”—. La menos obvia es probar con prompts que expliciten el contexto cultural que te interesa: si no le pedís al modelo que escriba desde una perspectiva latinoamericana, el modelo va a ir por default a lo que mejor conoce, que probablemente sea un farero en una costa escocesa.

Qué está confirmado y qué no sobre Elias Thorne

  • Confirmado: los modelos ChatGPT, Gemini y Claude generan historias con “Elias Thorne” como personaje recurrente cuando se usan prompts abiertos. El paper de Cornell lo respalda con una amplia muestra.
  • Confirmado: un conjunto de palabras (Lighthouse, Keeper, Baker, Mayor, Clockmaker, Fisherman, Librarian, Conductor, Elias, Mara, Elara) aparece con alta frecuencia en las historias generadas.
  • Confirmado: el nombre Elias Thorne ya aparece en libros autopublicados en Amazon y en pistas de música ambiental generadas por IA, según el relevamiento de 404 Media.
  • No confirmado (teoría probable): la causa es el uso de datasets de alineamiento como WildChat. Los investigadores lo proponen como explicación central, pero el paper deja abierta la puerta a otras hipótesis complementarias.
  • No confirmado: si este sesgo afecta a otros idiomas por igual. El estudio se hizo sobre historias en inglés; no hay datos comparables en español argentino (todavía).
  • No confirmado: si se puede “arreglar” sin sacrificar seguridad. Los investigadores planean explorarlo, pero no hay solución propuesta en el paper.

Errores comunes al interpretar el fenómeno de Elias Thorne

Creer que Elias Thorne es una persona real o un bug específico de ChatGPT. No es ninguna de las dos cosas. Es un patrón emergente que afecta a los principales modelos de lenguaje, sin importar el proveedor. Si solo probaste con un chatbot y pensás que es un error puntual, probá con otro: te va a salir lo mismo.

Asumir que los modelos son creativos y que este fenómeno es anecdótico. Justamente lo contrario: el estudio demuestra que la salida de los chatbots es altamente predecible cuando no hay restricciones explícitas. La “creatividad” es una ilusión generada por la variabilidad superficial del texto. El esqueleto narrativo es calcado. Tema relacionado: el manejo de código a gran escala.

Pensar que el sesgo solo afecta la ficción literaria. Que Elias Thorne haya aparecido en libros autopublicados en Amazon muestra que el sesgo no distingue géneros. Si estás usando IA para contenido que requiere precisión fáctica (salud, legales, finanzas), la tendencia a repetir patrones puede meter ruido donde menos lo esperás.

Culpar exclusivamente al alineamiento de seguridad y pedir que se elimine. El alineamiento existe por buenas razones. El problema no es que exista, sino que se implemente con datasets tan acotados que producen este cuello de botella. La solución no es sacar los filtros; es diseñarlos mejor.

Preguntas Frecuentes

¿Quién es Elias Thorne en los chatbots?

Elias Thorne no es una persona real. Es un nombre ficticio que los modelos de lenguaje como ChatGPT, Gemini y Claude generan de manera desproporcionada cuando se les pide escribir historias sin restricciones. Según un estudio de Cornell, aparece con frecuencia en los relatos analizados, casi siempre como farero o relojero.

¿Por qué la IA siempre habla de un farero?

La hipótesis más firme, respaldada por los investigadores Sil Hamilton y David Mimno, es que el alineamiento de seguridad entrena a los modelos con datasets “inofensivos” como WildChat. Esto crea un cuello de botella narrativo: el modelo aprende que la historia de un farero solitario es la opción más segura y la repite porque maximiza la probabilidad dentro de ese espacio restringido.

¿Qué causa que los chatbots repitan las mismas historias?

La causa principal es el entrenamiento con datos filtrados por seguridad y copyright. Al eliminar temas sensibles, marcas registradas y contenido protegido, el espacio de posibilidades narrativas se reduce drásticamente. Los modelos, que son sistemas de predicción de tokens, encuentran refugio en los patrones que sobrevivieron al filtro y los reproducen en bucle.

Esto se relaciona con Why Do Chatbots Keep Telling Stories About Someone Named ‘El, donde lo explicamos en detalle.

¿Es Elias Thorne un error de la inteligencia artificial?

No es exactamente un error, sino una consecuencia no deseada del diseño actual de alineamiento. Los modelos funcionan como fueron entrenados: evitan contenido problemático y maximizan la probabilidad de tokens “seguros”. El sesgo hacia Elias Thorne es un síntoma de que el equilibrio entre seguridad y diversidad todavía no está bien calibrado.

¿Los chatbots son realmente creativos o solo repiten patrones?

El estudio de Cornell muestra que, en condiciones no restringidas, los chatbots repiten patrones de manera muy predecible. La “creatividad” que vemos en interacciones cotidianas es en buena medida un efecto del prompt del usuario, que acota el espacio de búsqueda. Sin esa guía, los modelos tienden a converger hacia los mismos estereotipos narrativos una y otra vez.

Conclusión

El fenómeno Elias Thorne dejó de ser una curiosidad de nicho para convertirse en un caso de estudio sobre los efectos colaterales del alineamiento de seguridad. Lo que mostraron los investigadores con un gran número de historias es que nuestros modelos “creativos” tienen menos repertorio del que creemos, y que las decisiones de entrenamiento que tomamos para hacerlos seguros también los vuelven predecibles.

Para los que trabajamos con estas herramientas todos los días, el mensaje es claro: la revisión humana no es optativa, y el prompt que no especifica contexto cultural deja al modelo a la deriva en un mar de fareros y relojeros. Si querés contenido que se parezca a vos, vas a tener que pedírselo explícitamente. Y si te sale un Elias Thorne en una descripción de producto para un ecommerce argentino, ya sabés que no es un fantasma: es la huella digital de un proceso de alineamiento que todavía no aprendió a hablar en plural.

Fuentes

Desplazarse hacia arriba