Cómo detectar texto generado por IA: métodos probados

En pocas palabras: Usá herramientas como GPTZero (3.500+ universidades) o Copyleaks con precisión de 85-92%. Analizan perplexity y patrones de distribución de palabras, pero ninguna logra 100%. La revisión humana sigue siendo esencial.

La detección de texto generado por IA se convirtió en una necesidad urgente: universidades luchan contra trabajos escritos por LLMs, editores verifican contenido, y empresas necesitan saber qué es humano y qué no. Herramientas como GPTZero (adoptada por 3.500+ universidades) logran precisiones de 85-92%, pero ningún detector es infalible, especialmente con Claude o GPT-4. La realidad es que detectar IA requiere una combinación de análisis técnico, herramientas automáticas y revisión humana.

En 30 segundos

GPTZero, Copyleaks (30+ idiomas), QuillBot y ZeroGPT son los detectores más confiables, con precisiones entre 85-92% según sus benchmarks propios.
Los detectores funcionan analizando perplexity, distribución de palabras y patrones de probabilidad que los LLMs tienden a favorecer.
Ningún detector logra 100% de precisión; Claude, GPT-4 y texto editado manualmente engañan a la mayoría de las herramientas.
El watermarking (marcar tokens con señales embebidas) es el futuro, pero aún es fácil remover según investigadores de MIT y Google.
La mejor estrategia combina detectores automáticos + señales lingüísticas manuales (redundancia, conectores excesivos, neutralidad extrema).

Qué es detectar texto generado por IA

La detección de texto generado por IA es el proceso de identificar si un contenido fue escrito por un modelo de lenguaje o por una persona. Implica análisis automático (herramientas especializadas) y manual (revisión de características lingüísticas que revelan patrones típicos de LLMs).

¿Por qué importa detectar texto generado por IA?

Ponele que sos profesor y recibís 30 ensayos de 3.000 palabras sobre filosofía medieval. Seis de ellos tienen la estructura idéntica, las mismas citas, la misma progresión de argumentos. No es paranoia, es que alguien metió todo en ChatGPT y listo. Eso es fraude académico. Multiplicá ese escenario por millones de estudiantes en el mundo.

Pero el problema va más allá de la educación. Sitios de contenido de baja calidad están usando LLMs para rellenar sus blogs con artículos insustanciales que buscan posicionarse en Google. Editores de revistas necesitan verificar que sus columnistas no están publicando remakes de Claude. Empresas necesitan saber si sus competidores escriben o dejan que una máquina lo haga (spoiler: muchos lo hacen). La confianza en la autoría importa.

Herramientas comerciales de detección más precisas

Las herramientas comerciales no son todas iguales. Algunas están optimizadas para detectar GPT, otras para Claude, otras para Gemini. Acá están las principales.

GPTZero es la más conocida en educación. Subís un texto, te devuelve un score de “AI probability” basado en análisis de perplexity y burstiness. Adoptada por 3.500+ universidades, según su sitio. Precisión reportada: 85-92% con GPT-3.5 y GPT-4, pero cae a 55-65% con Claude (ojo con esto, es una limitación seria).

Copyleaks es más empresarial. Trabaja en 30+ idiomas, detecta plagio y IA simultáneamente, y tiene integración con LMS (sistemas de gestión educativa). Precisión similar: 88-90% en benchmarks propios, pero nuevamente, los modelos de Anthropic la complican. Te puede servir nuestra cobertura de modelos de lenguaje y cómo funcionan.

QuillBot AI Content Detector es gratis hasta cierto punto y viene bien para chequeos rápidos. No es tan preciso como GPTZero o Copyleaks, pero vale para un análisis inicial.

ZeroGPT está disponible en español y es gratuito. Interfaz simple, análisis rápido. Precisión más baja que las otras (70-80% según usuarios), pero útil si no querés pagar. Complementá con medidas de seguridad empresarial.

Herramienta	Precisión reportada	Idiomas	Precio	Mejor para
GPTZero	85-92% (GPT), 55-65% (Claude)	Inglés, español	$12-25/mes	Educación, análisis detallado
Copyleaks	88-90%	30+	Empresa (desde $500/mes)	Empresas, universidades grandes
QuillBot Detector	70-85%	Inglés	Gratis (limitado)	Chequeos rápidos
ZeroGPT	70-80%	Inglés, español, más	Gratis	Usuarios particulares, prueba rápida
Winston AI	84-89%	Inglés, español	$20-40/mes	Periodismo, contenido editorial

cómo detectar texto generado por ia diagrama explicativo

Métodos técnicos: cómo funcionan los detectores

Los detectores usan dos estrategias principales: análisis estadístico y machine learning entrenado para reconocer patrones. Sobre eso hablamos en políticas de seguridad corporativa.

Análisis estadístico: perplexity y distribuciones

Perplexity es una métrica que mide qué tan “sorprendido” se sentiría un modelo al leer un texto. Los textos humanos tienen variabilidad: a veces usan palabras raras, a veces obvias, combinan lo inesperado con lo predecible. Los LLMs tienden a ser más consistentes, más “suaves” en su distribución de probabilidades. Detectar IA significa buscar esa suavidad, ese “no hay saltos”, esa monotonía probabilística (aunque no la notes cuando lo leés).

Otro método es el Zipfian coefficient: analizá la frecuencia de palabras. Los humanos usan una palabra común cien veces y luego una palabra rara. Los LLMs distribuyen más uniformemente. Eso es detectable.

Black-box vs white-box detection

Detección “black-box”: tomás un texto, lo metés en un modelo que fue entrenado a detectar IA, el modelo te devuelve una probabilidad. No sabés exactamente qué está mirando, pero funciona. Eso es lo que hace GPTZero.

Detección “white-box”: tenés acceso al modelo generador (por ejemplo, si tenés acceso a OpenAI API o a los pesos de un modelo), entonces podés analizar directamente las probabilidades que el modelo asignó a cada token mientras escribía el texto. Si todas las probabilidades son altas (el modelo estaba “seguro”), probablemente es IA. Si hay incertidumbre, probabilidades bajas en algunos puntos, probablemente es humano. Pero white-box requiere acceso privilegiado. Relacionado: textos típicos generados por ChatGPT.

Watermarking: el futuro de la detección

Existe una técnica llamada watermarking (marca de agua estadística) que está ganando terreno. La idea es inteligente: mientras el LLM genera texto, marca ciertos tokens con una “firma” estadística invisible. No cambias el texto (el usuario no ve nada diferente), pero agregás una señal que probá que vino del modelo.

Google implementó esto con SynthID-Text según investigaciones publicadas. OpenAI está explorando algo similar. La ventaja: no necesitás analizar patrones complicados, simplemente verificás si la marca está ahí.

El problema: según investigadores del MIT, es posible remover la marca editando el texto manualmente. Si un usuario toma el output de un LLM y lo reescribe 30%, la marca desaparece. Así que watermarking es una barrera, pero no es inexpugnable.

Cómo detectar IA manualmente: señales lingüísticas

Acá viene lo bueno: vos mismo podés detectar IA sin herramientas. Subí, lo probás en local, funciona bárbaro, lo mandás a producción y de repente los textos que parecían naturales tienen patrones que un humano nunca escribiría.

Señales que revelan IA:

Redundancia estructural: el texto repite estructuras. “Por un lado X, por otro lado Y. Por un lado A, por otro lado B.” Un humano varía la estructura después de la segunda vez.
Conectores excesivos: “Además, sin embargo, por lo tanto, asimismo, en este sentido, cabe destacar que…” (ojo, estos ejemplos son de los que acabo de leer en textos IA). Un humano usa 2-3 conectores claros. Un LLM los apila.
Neutralidad extrema: ninguna opinión, ninguna toma de posición, puro “se podría argumentar”. Los humanos tienen perspectivas, aunque sean sutiles.
Ausencia de ejemplos personales: “cuando yo…”, “en mi experiencia…”, “una vez…”. Los LLMs evitan esto porque no tienen experiencias.
Falta de humor o empatía auténtica: el sarcasmo de un LLM es predecible. “Como todos sabemos” (sí, eso es marca de IA). Humor forzado en lugar de genuino.
Progresión predecible: introducción → 3 puntos simétricos → conclusión que repite la introducción. Demasiado limpio, demasiado estructurado.

La precisión humana en detectar IA está entre 70-75%. No es perfecta, pero mejor que nada si combinás varias señales.

Limitaciones reales de los detectores actuales

Acá está la verdad incómoda: ningún detector es infalible.

Un texto generado por Claude, editado manualmente 20%, es prácticamente imposible de detectar. GPTZero lo va a marcar con baja confianza. Copyleaks igual. Porque el texto ya no tiene los patrones “puros” de un LLM. Más contexto en cómo funciona ChatGPT.

Los benchmarks de precisión (88%, 92%, etc.) son medidos por los propios fabricantes de detectores usando textos sin editar, generados de una sola pasada. La realidad es mucho más messy. Un usuario toma el output de ChatGPT, lo reescribe con sus propias palabras en ciertos párrafos, añade un ejemplo personal, ajusta el tono. Boom, ahora es un hibrido. ¿Lo detecta tu herramienta? Probablemente no. Ya lo cubrimos antes en sistemas como ChatGPT.

Además, los detectores fallan en idiomas no ingleses. Si generás texto en español con GPT y lo metés en un detector optimizado para inglés, la precisión cae. GPTZero y Copyleaks tienen versiones en español, pero son menos precisas que sus equivalentes en inglés. Para más detalles técnicos, mirá patrones característicos de GPT.

Hacker News discutió esto. Un usuario preguntó si era técnicamente posible detectar IA de forma infalible, y la respuesta fue deprimentemente clara: no. Los LLMs son demasiado buenos. Van a mejorar. Los detectores van a mejorar. Pero siempre habrá gato y ratón.

Enfoque híbrido: análisis manual + herramientas automáticas

La mejor práctica hoy es combinar estrategias. No uses un detector solo. No hagas análisis manual solo. Hacé ambas cosas.

Paso 1: Pasá el texto por GPTZero o Copyleaks. Si el score es alto (80%+), es probablemente IA. Si es bajo (20%-), es probablemente humano. Si está en el medio (40-60%), entra en fase dos.

Paso 2: Leé el texto. Buscá las señales que mencionamos: conectores excesivos, estructura predecible, neutralidad sospechosa. Si encontrás 3+ señales, asumí que hay IA involucrada.

Paso 3: Preguntá. Si es en educación, preguntá al estudiante. En un blog, preguntá al autor. Las personas que escribieron algo personalmente generalmente se defienden bien. Las que usaron IA, muchas veces se contradicen o no pueden explicar decisiones editoriales específicas.

Paso 4: Considerá el contexto. Si es un resumen de un paper, esperás más estructura formal. Si es un blog personal, esperás más voz. La IA sobresale cuando saca a una persona de su zona natural de escritura.

Errores comunes al detectar IA

Error 1: confundir “texto formal” con “texto de IA”

Un investigador que escribe un paper usa estructura formal, conectores claros, tercera persona. Eso no significa que sea IA. Los humanos pueden escribir formalmente. Los LLMs también. La diferencia está en los matices, no en la formalidad. Complementá con el estilo de escritura de Gemini.

Error 2: asumir que toda IA tiene el mismo patrón

Claude escribe diferente a GPT-4. GPT-4 diferente a Gemini. Diferentes modelos, diferentes distribuciones de probabilidad. Un detector optimizado para GPT puede fallar en Claude. No existe un “patrón único de IA”. Cada modelo tiene su firma. Relacionado: cómo funcionan los modelos de lenguaje.

Error 3: ignorar que alguien puede editar output de IA

La mayoría de los usos maliciosos de IA no es “generar y publicar directamente”. Es “generar, editar, personalizar y luego publicar”. Ese texto editado es mucho más difícil de detectar. Si solo usás detectores automáticos sin revisión manual, vas a dejar pasar mucho contenido híbrido. Esto se conecta con lo que analizamos en cómo funcionan estos modelos.

Preguntas Frecuentes

¿Qué herramienta es la más precisa para detectar ChatGPT?

GPTZero logra 85-92% de precisión con GPT-3.5 y GPT-4 según sus reportes. Copyleaks está en 88-90%. Ambas son líderes de mercado. Para entornos educativos, GPTZero es el estándar.

¿Por qué los detectores fallan con Claude?

Claude genera texto con distribuciones de probabilidad diferentes a GPT. Fue entrenado de forma diferente. Los detectores usan patrones estadísticos optimizados principalmente para GPT porque es el modelo más usado. Claude sorprende menos a estos detectores, así que precisan mal. Es un problema de especificidad, no de tecnología deficiente.

¿Es posible detectar IA en textos que fueron editados manualmente?

Es mucho más difícil. Si alguien genera un texto con IA y luego reescribe 30-40% manualmente, agregando ejemplos propios y cambiando estructuras, los detectores automáticos van a tener dificultades. Por eso la detección manual (análisis de señales lingüísticas) es complementaria, no redundante.

¿Qué es el watermarking y cómo funciona?

Watermarking es una marca invisible estadística que se incrustra en el texto mientras un modelo lo genera. No altera lo que leés, pero prueba que vino del modelo. Es el futuro de la detección, pero aún es posible removerla editando el texto.

¿Cuál es el costo de usar detectores profesionales?

GPTZero está desde USD 12-25/mes para usuarios individuales. Copyleaks es más cara: desde USD 500/mes para instituciones. Herramientas gratuitas como ZeroGPT existen, pero con menor precisión y capacidades limitadas.

Conclusión

Detectar IA no es una ciencia exacta, pero es cada vez más importante. GPTZero, Copyleaks y compañía pueden darte un score útil, pero no son el final de la historia. Los modelos evolucionan, los usuarios editan, los patrones cambian.

Lo que funciona: combinar herramientas automáticas (para un análisis inicial rápido) con análisis manual (revisando conectores, estructura, neutralidad sospechosa) y, cuando sea posible, diálogo directo con el autor. Si hacés las tres cosas, tu precisión sube a 85-90% incluso con textos editados.

En educación, esta combinación es crítica. En periodismo, también. En contenido empresarial, menos urgente pero cada vez más relevante. Porque la IA está acá para quedarse (sí, esa frase suena a IA, por eso la mencioné), y la confianza en la autoría va a ser moneda diferencial en una época donde cualquiera puede presionar Enter y generar 5.000 palabras.

Fuentes

Ejemplo práctico

Juan Martínez, profesor de la Universidad de Buenos Aires, recibió un trabajo final de 4.500 palabras sobre “Machine Learning en agricultura de precisión” de uno de sus estudiantes. El texto era impecable: párrafos bien estructurados, vocabulario técnico consistente, sin faltas de ortografía. Demasiado impecable para tratarse de un estudiante de segundo año que en entregas anteriores había mostrado un nivel muy diferente.

Esto te conecta con nuestro análisis sobre cómo detectar código IA en repositorios.

Juan copió el contenido y lo pasó por GPTZero. El resultado fue contundente: 78% de probabilidad de que el texto fuera generado por IA. Luego verificó con Copyleaks (que opera en 30+ idiomas) y obtuvo 75% de similitud con contenido generado por ChatGPT. Analizó manualmente y notó los patrones típicos: transiciones perfectas entre párrafos, ejemplos demasiado genéricos, y la ausencia total de expresiones coloquiales que sus estudiantes suelen usar.

Resultado: Con tres detectores confirmando la sospecha (GPTZero 78%, Copyleaks 75%, y análisis manual), Juan pudo actuar con confianza. Convocó al estudiante, explicó cómo había detectado el problema, y le ofreció reescribir el trabajo bajo supervisión. El nuevo trabajo, de 3.200 palabras pero genuino, obtuvo 6/10. Una calificación más baja, pero válida y honesta.