llms.txt y visibilidad en IA: qué dicen los datos de 2026

En pocas palabras: No. SE Ranking analizó más de 300.000 dominios con un modelo XGBoost y no halló ni una correlación mínima entre tener llms.txt y recibir citaciones en ChatGPT, Perplexity o Google AI Overviews. El archivo, propuesto por Jeremy Howard en 2024, no mueve la aguja.

¿Impacta llms.txt la visibilidad en IA? Según el análisis de más de 300.000 dominios que publicó Search Engine Journal sobre el estudio de SE Ranking, no. El archivo no mostró correlación con más citaciones en ChatGPT, Perplexity o Google AI Overviews. Cero tendencia, ni siquiera mínima.

Y sin embargo lo siguen vendiendo como el secreto para “rankear en la IA”. Vale la pena separar lo que dicen los datos de lo que dice el marketing.

llms.txt es un archivo de texto plano en formato Markdown que se coloca en la raíz de un sitio (tudominio.com/llms.txt) para ofrecerle a los modelos de lenguaje un índice curado del contenido más importante. Lo propuso el desarrollador Jeremy Howard en 2024. A diferencia de robots.txt, no bloquea nada: es un “mapa del tesoro” que le indica a la IA qué leer primero.

En 30 segundos

  • Sin correlación medible: SE Ranking analizó 300k+ dominios con un modelo XGBoost y no encontró ni una tendencia mínima entre tener llms.txt y recibir citaciones.
  • Casi nadie lo lee: Ahrefs reportó que el 97% de los archivos llms.txt nunca son consultados por bots de IA.
  • Google dijo que no: Google aclaró de forma oficial, desde 2024, que sus sistemas no usan llms.txt.
  • Adopción baja: 10,13% en el dataset de SE Ranking; BuiltWith contabilizó 193k sitios en mayo de 2026, pero solo ~1.000 con implementaciones curadas de verdad.
  • Sí sirve en un nicho: documentación técnica, APIs y SDKs consultados por asistentes de código tipo Cursor, Claude Code o Continue.

¿Qué es llms.txt y por qué se habló tanto en 2026?

Ponele que tenés un blog con 800 artículos y querés que ChatGPT o Perplexity te citen cuando alguien pregunta algo de tu rubro. La idea atrás de llms.txt es simple: en vez de dejar que el modelo adivine qué páginas importan, vos le servís una lista ordenada en Markdown con tus mejores URLs y una descripción de cada una.

El formato lo propuso Jeremy Howard (cofundador de fast.ai). La gracia es que Markdown es liviano, no tiene el ruido de un HTML lleno de menús, scripts y banners de cookies. Un modelo lo parsea rápido y barato.

Acá viene la confusión más común: muchos lo tratan como si fuera robots.txt. No es lo mismo. robots.txt le dice a un crawler qué NO entrar. llms.txt no bloquea ni restringe nada; es una sugerencia de lectura. Si un modelo decide ignorarlo, no pasa absolutamente nada con el resto de tu sitio. Más contexto en cómo ChatGPT selecciona sus fuentes.

La investigación de 300k dominios: ¿qué encontró SE Ranking?

Esto es lo concreto. SE Ranking cruzó más de 300.000 dominios y entrenó un modelo XGBoost para buscar si la presencia de llms.txt predecía algo sobre visibilidad o citaciones en IA. El veredicto: no apareció “ni siquiera una tendencia mínima”. La adopción en ese dataset fue del 10,13%.

¿Y los demás estudios? Coinciden.

  • ALLMO: en su análisis de citaciones encontró que solo 1 de cada 50 dominios con el archivo aparecía citado, y que llms.txt estaba presente en apenas el 0,00106% de las URLs realmente citadas por modelos.
  • Ahrefs: su estudio reportó que el 97% de los archivos llms.txt jamás fueron leídos por un bot de IA. Están ahí, ocupando espacio, sin que nadie los toque.

Tres fuentes independientes, misma conclusión. Cuando ALLMO, Ahrefs y SE Ranking miden cosas distintas y todos llegan al mismo lado, hay que prestar atención.

Eso sí: ausencia de correlación no es lo mismo que “está prohibido” o “te perjudica”. El archivo no te baja posiciones. Simplemente, a gran escala, no mueve la aguja de las citaciones.

¿Google, ChatGPT, Claude y Perplexity usan llms.txt?

Acá está la pregunta que importa, porque el comportamiento cambia según la plataforma. No todas las IA se comportan igual, y eso explica buena parte del ruido.

Plataforma¿Usa llms.txt?Detalle
Google (AI Overviews / AI Mode)NoGoogle lo aclaró de forma oficial desde 2024. Se guía por su índice y por el contenido renderizado.
ChatGPT (búsqueda web)No lo buscaNo incluye el archivo en su flujo de navegación estándar.
ClaudeSí, en procesos puntualesLo aprovecha sobre todo en contextos de código y documentación.
PerplexitySeñal débilHay indicios de uso, pero sin impacto consistente medible.
Cursor / ContinueAsistentes de código que leen llms.txt para entender APIs y SDKs.
impacta llms.txt visibilidad ia diagrama explicativo

El caso que mejor resume todo es Walmart: implementó llms.txt en 2025, lo evaluó y después lo eliminó. Target, en cambio, lo mantiene. Que dos retailers gigantes tomen decisiones opuestas te dice que ni ellos ven un beneficio claro y universal.

Impacto real en citaciones y visibilidad en IA

Hay una tensión interesante. En la teoría, llms.txt debería ayudar: le das al modelo contenido limpio y priorizado, le ahorrás trabajo. En la práctica, los números no aparecen. Relacionado: estrategia de Claude para citaciones.

El dato de ALLMO es el más duro: 0,00106% de las URLs citadas tenían el archivo. ¿Por qué la discrepancia entre lo que “debería” pasar y lo que pasa? Por cómo funcionan hoy los modelos. Las grandes IA no salen a buscar tu llms.txt antes de responder. Cuando navegan, recuperan la página directamente (HTML y todo) o usan lo que ya tienen indexado de su entrenamiento. El archivito en la raíz, sencillamente, no entra en ese circuito.

¿Significa que nunca va a servir? No necesariamente. Es un estándar joven y emergente. Si mañana OpenAI o Google decidieran adoptarlo de forma nativa, la historia cambiaría de un día para el otro. Pero hoy, con los datos de 2026 sobre la mesa, no es una palanca de visibilidad.

¿Cuándo llms.txt SÍ tiene valor y cuándo es decoración?

No todo es blanco o negro. Hay un nicho donde el archivo gana sentido, y tiene que ver con quién consume tu contenido.

Cuándo sí: documentación, APIs y SDKs

Si tenés documentación técnica que la gente consulta a través de asistentes de código (Cursor, Claude Code, Continue), llms.txt aporta. Esos asistentes sí leen el archivo para entender cómo se usa tu API o tu SDK. Un dev le pregunta a Cursor “cómo autentico contra tu endpoint” y el asistente puede tirar del llms.txt para responder mejor.

Cuándo es puro adorno: blogs, e-commerce, sitios corporativos

Para un blog de noticias, una tienda online o el sitio institucional de una pyme, el retorno hoy es prácticamente nulo. Las IA que importan para esos casos (Google AI Overviews, ChatGPT) no lo usan. Te puede servir nuestra cobertura de visibilidad de contenido en Gemini.

El cálculo costo-beneficio igual es benévolo: implementarlo lleva 1 o 2 horas y el riesgo es cero. Si tu equipo de infraestructura ya gestiona el sitio (por ejemplo, si alojás en donweb.com y tenés acceso a la raíz), subir el archivo es trivial. No te va a hacer daño. Solo no esperes magia.

GEO 2026: más allá de llms.txt, ¿qué sí funciona?

La pregunta de fondo no es “¿pongo llms.txt?”, es “¿cómo logro que la IA me cite?”. Y ahí la respuesta es la misma aburrida de siempre, pero efectiva.

  • Contenido bien estructurado: encabezados claros, respuestas directas arriba de todo, párrafos que un modelo pueda levantar tal cual.
  • Schema markup: datos estructurados que le dan contexto explícito a tu contenido.
  • Inbound links de autoridad: que otros sitios confiables te enlacen sigue pesando, también para la IA.
  • Answer Capsules: bloques de 40 a 60 palabras que responden una pregunta concreta y son fáciles de citar.
  • Actualización frecuente: contenido fresco con datos del año en curso, no reciclado de hace dos años.

Pensalo así: el GEO real es el 80%. llms.txt, en el mejor de los casos, es ese 20% adicional que probás cuando ya tenés todo lo demás resuelto. Arrancar por el archivo es como pintar la fachada de una casa sin cimientos.

Empresas que lo implementaron: resultados reales

Los casos concretos dibujan bien el panorama, sin necesidad de teoría.

  • Target: mantiene su llms.txt activo.
  • Walmart: lo implementó en 2025, midió y lo dio de baja tras evaluarlo.
  • Anthropic, Vercel y Stripe: lo publican, pero apuntando a la “agentic web” (agentes que navegan e interactúan), no a ganar citaciones en buscadores.
  • Clientes de agencias: algunos reportaron mejoras modestas en citación, sobre todo en Perplexity. “Modestas” es la palabra clave, y siempre con la salvedad de que es difícil aislar la variable.

El dato de BuiltWith cierra la foto: 193.000 sitios tenían algún llms.txt en mayo de 2026, pero solo cerca de 1.000 eran implementaciones curadas de verdad. El resto son archivos autogenerados por algún plugin, que nadie revisó y que ningún bot lee.

Qué está confirmado y qué no

  • Confirmado: Google declaró de forma oficial, desde 2024, que no usa llms.txt en sus sistemas.
  • Confirmado: el estudio de SE Ranking sobre 300k+ dominios no halló correlación con citaciones.
  • Confirmado: Cursor, Claude y Continue sí leen el archivo en contextos de código.
  • Pendiente: si OpenAI o Google lo adoptarán de forma nativa en el futuro. Hoy no hay anuncio.
  • Pendiente: el peso real en Perplexity. Hay señales débiles, pero sin evidencia consistente.

Errores comunes con llms.txt

  • Confundirlo con robots.txt: mucha gente cree que llms.txt bloquea o controla el crawling de IA. No hace nada de eso. Si querés bloquear bots, eso se maneja con robots.txt o reglas de servidor, no acá.
  • Esperar un salto de tráfico: subir el archivo y mirar las analytics esperando un pico es perder el tiempo. Los datos de tres estudios dicen que no va a pasar. Medí, pero con expectativas realistas.
  • Generarlo automático y olvidarlo: un llms.txt que vomita las 800 URLs del sitio sin curar no sirve. Si lo vas a hacer, listá tus 20 o 30 páginas clave con descripciones reales. Un archivo de 1.000 líneas autogenerado es ruido, no señal.

Preguntas Frecuentes

¿Realmente impacta llms.txt en mi visibilidad en IA?

No, según el análisis de SE Ranking sobre más de 300.000 dominios, que no encontró correlación entre tener el archivo y recibir más citaciones en IA. Estudios de Ahrefs y ALLMO llegan a la misma conclusión. A gran escala, no mueve la aguja.

¿Debería implementar llms.txt en mi web en 2026?

Solo vale la pena si tenés documentación técnica, APIs o SDKs que se consultan vía asistentes de código como Cursor o Claude Code. Para blogs, e-commerce o sitios corporativos, el retorno hoy es prácticamente nulo. El costo es bajo (1 o 2 horas) y el riesgo cero, pero no esperes resultados de visibilidad. Ya lo cubrimos antes en mecanismos internos de los LLMs.

¿Cuál es la diferencia entre llms.txt y robots.txt?

robots.txt le indica a los crawlers qué páginas NO deben rastrear; es una herramienta de bloqueo. llms.txt no bloquea nada: es un índice curado en Markdown que sugiere a los modelos de IA qué contenido leer primero. Uno restringe, el otro recomienda.

¿Google usa llms.txt?

No. Google aclaró de forma oficial, desde 2024, que sus sistemas, incluidos AI Overviews y AI Mode, no utilizan el archivo llms.txt. Se basa en su índice y en el contenido renderizado de las páginas.

¿Mi competencia usa llms.txt? ¿Estoy rezagado?

La adopción ronda el 10,13% según SE Ranking, pero de los 193.000 sitios que tenían el archivo en mayo de 2026, solo unos 1.000 lo implementaron de forma curada. No estás rezagado: la mayoría de los archivos publicados son autogenerados y nadie los lee.

Conclusión

La data de 2026 es bastante clara: como herramienta para ganar visibilidad y citaciones en IA, llms.txt no funciona a escala. Tres estudios independientes lo confirman, Google lo descartó de forma oficial ya desde 2024, y hasta Walmart lo probó en 2025 y lo sacó.

¿Quiere decir que es inútil? No del todo. Si vendés un producto técnico con documentación que los devs consultan vía asistentes de código, ponelo, es barato y ayuda en ese nicho puntual. Para el resto, dedicá esas horas a lo que sí mueve la aguja: contenido bien estructurado, schema, links de autoridad y respuestas directas que la IA pueda citar tal cual.

llms.txt es un estándar joven que quizás madure. Por ahora, no lo trates como atajo. Trabajá los fundamentos y dejá el archivo como un experimento de bajo costo, no como tu estrategia.

Fuentes

Desplazarse hacia arriba