LLM Smells: los patrones que delatan la IA

Los “LLM smells” son los patrones reconocibles que delatan contenido generado por inteligencia artificial, análogos al “code smell” en programación. Se detectan por estructuras repetitivas de escritura, frases formulaicas y decisiones de diseño que aparecen con llamativa frecuencia en todo lo que toca un modelo de lenguaje.

En 30 segundos

  • Un desarrollador usó LLMs para mejorar su blog de matemáticas y tres meses después encontró sus mismas estructuras de frases replicadas en toda la web.
  • Los “LLM smells” son patrones emergentes que delatan contenido IA: punches filosóficos repetitivos, oraciones cortas consecutivas y el patrón “no es solo X, es Y”.
  • En desarrollo web, la tipografía JetBrains Mono y los bloques de “pasos” con bullets se convirtieron en señales visuales de sitios generados con IA.
  • El fenómeno no se limita a la escritura: aparece en código, diseño de interfaces y hasta en la forma de estructurar argumentos.
  • Identificar estos patrones se volvió una habilidad necesaria para cualquiera que evalúe contenido técnico en 2026.

El momento en que te das cuenta de que el olor te pertenece

Ponele que arrancás un blog técnico, lo usás como experimento personal, y decidís pasarle tus borradores por un LLM para que los pula un poco. El resultado se ve bien: mejor vocabulario, estructuras más variadas, párrafos que fluyen. No parece slop. Parece escritura humana mejorada.

Eso fue exactamente lo que le pasó al autor del artículo original en shvbsle.in. Tres meses después de publicar su blog de matemáticas con escritura asistida por IA, empezó a ver las mismas estructuras de frases exactas replicadas en toda la web. No parecido. Idéntico.

Eso es un LLM smell.

Qué son los Various LLM Smells y por qué importan ahora

El concepto viene directo de programación: un “code smell” no es un bug, es un patrón en el código que indica que algo probablemente está mal diseñado. Los LLM smells funcionan igual: no son errores factuales, son patrones estilísticos y estructurales que delatan origen artificial.

Lo que hace interesante el fenómeno es que estos patrones emergen sin que nadie los haya programado explícitamente. Son artefactos del entrenamiento, preferencias latentes que los modelos desarrollaron al absorber millones de textos y que ahora reproducen sistemáticamente. Y cuando millones de personas usan el mismo modelo para escribir, esas preferencias se amplifican hasta volverse reconocibles.

Los patrones concretos en escritura

El artículo de referencia documenta dos categorías principales. La primera es escritura generada por LLM, y acá hay ejemplos que cualquiera que use estos modelos va a reconocer de inmediato. Para más detalles técnicos, mirá en nuestra guía sobre modelos de lenguaje.

Los “punchlines” filosóficos de cierre

Los LLMs tienen una tendencia marcada hacia las frases de cierre que suenan profundas. Del blog de matemáticas que el autor terminó borrando, sobreviven estos ejemplos:

  • “Los humanos confían en la simetría porque se siente como inteligencia hecha visible.”
  • “El tigre encajaba con la historia. Jin-yong encajaba con la física.”
  • “La simetría se convierte en una trampa.”

¿Reconocés el patrón? Una afirmación corta, contundente, con estructura de aforismo. Sola, esa frase podría pasar. El problema es que aparecen demasiadas juntas, una por párrafo, como si cada idea mereciera su propia proclamación.

Las ráfagas de oraciones cortas

Otro patrón clásico: series de oraciones de cuatro o cinco palabras, una tras otra, como staccato. Del mismo blog:

  • “Sin embargo, la inclinación no es un accidente. Es la forma del óptimo.”
  • “Entonces llegó AlphaEvolve. No tenía preferencia por la simetría. Sin prior estético. Sin instinto de preservar la armonía.”
  • “Estos ejemplos no son decorativos. Forman un argumento distribuido.”

Individualmente, ninguna es rara. El problema es la densidad. Tres o cuatro párrafos así seguidos y empezás a oler la cocina del modelo.

El patrón “no es solo X, es Y”

Otro favorito: “soluciones que no solo satisfacen la restricción sino que satisfacen los instintos estéticos”. La estructura de contraste con negación previa es una muletilla que los LLMs repiten con llamativa consistencia. El modelo aprendió que este patrón suena sofisticado y lo aplica compulsivamente. Para más ejemplos de estos patrones en acción, mirá nuestro análisis detallado de ChatGPT.

¿Alguien lo verificó de forma independiente como un patrón estadístico medible? Todavía no hay paper que cuantifique frecuencias, pero cualquiera que lea volumen de contenido generado lo reconoce instantáneamente.

Los smells en diseño web generado por IA

La segunda categoría que documenta el artículo es la de sitios web generados con asistencia de IA, y acá el patrón más llamativo es uno muy específico: la fuente JetBrains Mono.

JetBrains Mono es una tipografía de código excelente. Fue diseñada para terminales y editores. Pero los LLMs la eligieron desproporcionadamente para sitios de “landing page de herramienta técnica” porque aparece mucho en los ejemplos de su entrenamiento. El resultado es que docenas de proyectos lanzados con ayuda de IA comparten esa tipografía sin que los creadores necesariamente lo hayan elegido con criterio, sino porque el modelo la sugirió por defecto.

Lo mismo pasa con los bloques de “pasos” con bullets numerados. Pedile a cualquier LLM que diseñe una sección de onboarding y vas a obtener tres o cuatro pasos con íconos, numerados, presentados en grid horizontal. Es una convención razonable, pero cuando todos los sitios la replican idéntica empieza a delatar origen común.

La observación más interesante, dicho sea de paso, es que el autor del artículo original no se dio cuenta en el momento. Tres meses después fue que reconoció los patrones (no cuando escribía). El smell emerge con volumen, no con una muestra. Para más contexto, consultá cómo documentamos estos patrones con Claude.

Por qué emergen estos patrones

No es un bug de diseño ni una decisión editorial de Anthropic o OpenAI. Es una consecuencia directa del proceso de entrenamiento.

Los modelos aprenden de texto humano a gran escala. Ese texto humano ya tenía sus propios patrones: los escritores de divulgación técnica usan frases de cierre contundentes, los tutoriales de programación usan listas de pasos, los artículos de tecnología usan el contraste negativo para marcar originalidad. Los modelos aprenden esos patrones y los refuerzan con RLHF (feedback humano): si los evaluadores preferían las respuestas que sonaban “bien escritas”, y “bien escrita” para ellos significaba esas estructuras, el modelo aprendió a producirlas más.

El resultado es que subís el texto, lo pasás por el modelo, conseguís algo que parece mejor, lo publicás, y tres meses después te encontrás con que media internet huele igual.

Errores comunes al evaluar contenido con LLM smells

Confundir calidad técnica con autenticidad

Un texto puede ser factualmente correcto, gramaticalmente impecable y estructuralmente sólido, y aun así tener LLM smell. El error es pensar que si no tiene errores, no fue generado por IA. Los modelos no cometen errores de gramática. Lo que delatan son patrones estilísticos, no fallos técnicos.

Buscar solo señales textuales cuando el smell puede ser visual

Mucha gente está entrenada para detectar “lenguaje de IA” en escritura pero ignora los smells de diseño. Una landing page con JetBrains Mono, tres pasos en grid y un hero con gradiente azul marino puede ser tan “generada por IA” como un artículo lleno de em-dashes. Si evaluás productos técnicos o sitios de startups, revisá el diseño también. Relacionado: estos smells en los GPT.

Creer que el smell desaparece con revisión manual

El caso del blog de matemáticas lo muestra bien: el autor revisó su propio contenido y no lo detectó. Los smells son más fáciles de ver desde afuera o con distancia temporal. Si publicás texto que pasó por LLM, la revisión inmediata propia tiene un sesgo de confirmación: ya leíste el borrador, ya procesaste el contenido, y la revisión no es fresca. Necesitás una segunda lectura días después o alguien que no leyó los borradores.

Preguntas Frecuentes

¿Qué son exactamente los LLM smells?

Son patrones reconocibles en texto, código o diseño que indican que el contenido fue generado o fuertemente asistido por un modelo de lenguaje. Incluyen estructuras estilísticas repetitivas como frases filosóficas de cierre, ráfagas de oraciones cortas, el patrón de contraste negativo (“no es solo X, es Y”) y en diseño web, elecciones tipográficas como JetBrains Mono o layouts de pasos en grid. No son errores: son artefactos del entrenamiento que los modelos reproducen sistemáticamente.

¿Cómo se detectan los LLM smells en la práctica?

La detección por instancia única es difícil; emerge con volumen o con distancia temporal. Al leer un texto, buscá densidad de frases cortas consecutivas, múltiples “punch lines” por párrafo, y el patrón de contraste negativo. En diseño, fijate en tipografías de código usadas para UI general y estructuras de onboarding en grid idénticas. Con práctica, el reconocimiento se vuelve casi automático.

¿Por qué los modelos generan siempre los mismos patrones?

Porque esos patrones aparecían frecuentemente en el texto de entrenamiento y fueron reforzados durante el proceso de ajuste con feedback humano (RLHF). Los evaluadores humanos tendían a preferir texto que “sonaba bien escrito”, y esas estructuras eran las que en el training data estaban asociadas con escritura de calidad. El modelo las aprendió como señales de calidad y las reproduce independientemente del contexto.

¿Se puede usar LLMs para escribir sin dejar smell?

Sí, pero requiere trabajo activo de revisión. Las estrategias que funcionan incluyen: usar el modelo para estructura y datos, no para prosa final; reescribir activamente las frases de cierre “profundas” que agregue el modelo; romper las series de oraciones cortas insertando párrafos de desarrollo más largos; y leer el resultado con distancia temporal. El smell no desaparece solo, hay que identificarlo y reemplazarlo deliberadamente.

¿Los LLM smells afectan el SEO o la credibilidad técnica?

En SEO, Google no penaliza el contenido IA directamente (según su política de 2024-2026), pero el contenido con smells evidentes tiende a tener métricas de engagement más bajas porque los lectores especializados lo reconocen y rebotan. Para credibilidad técnica, el impacto es más directo: en comunidades como Hacker News o foros de desarrollo, el LLM smell en una explicación técnica devalúa el contenido independientemente de si los datos son correctos.

Conclusión

Lo que describe el artículo de shvbsle.in es un fenómeno real y creciente: los modelos de lenguaje tienen “personalidad estilística” y esa personalidad se filtra en todo lo que tocan. El caso del blog de matemáticas es un ejemplo limpio de cómo el problema no es obvio en el momento sino retrospectivo, cuando el volumen acumulado en internet lo hace visible.

Para 2026, identificar LLM smells se convirtió en una competencia necesaria, no opcional, para quien evalúa contenido técnico, recluta, revisa código o construye productos. No porque el contenido sea malo per se (a veces es correcto), sino porque los patrones uniformes erosionan la señal de autenticidad que hace valioso al contenido especializado.

Si usás LLMs para escribir o diseñar, el antídoto es simple: creá distancia entre la generación y la publicación, buscá activamente esos patrones en tu propio output, y reemplazalos por voz propia. El modelo no puede hacer eso por vos.

Fuentes

Desplazarse hacia arriba