Un amateur resolvió un problema de 60 años con ChatGPT

El 15 de abril de 2026, Liam Price, un joven de 23 años sin título en matemáticas avanzadas, publicó en erdosproblems.com la solución a una conjetura que llevaba 60 años sin resolverse. La herramienta que usó: una suscripción a ChatGPT Pro con acceso a GPT-5.4 Pro. Un solo prompt. Ochenta minutos de razonamiento extendido. Resultado verificado por expertos.

En 30 segundos

  • Liam Price, 23 años y sin formación matemática avanzada, resolvió una conjetura de Erdős usando GPT-5.4 Pro con un único prompt creativo.
  • El problema, abierto desde los años 60, involucra conjuntos primitivos y el valor máximo de una suma específica definida por Erdős.
  • Lo que sorprendió a los expertos no fue solo la solución sino el método: completamente original, nunca antes explorado por ningún matemático.
  • GPT-5.4 Pro generó 80 minutos de “razonamiento extendido” sin buscar en internet, instrucción explícita que Price incluyó en el prompt.
  • Esto no convierte a la IA en matemática autónoma: Price diseñó el prompt pidiendo creatividad y elementos no triviales, lo cual fue clave.

GPT es un modelo de lenguaje grande desarrollado por OpenAI, diseñado para generar texto, responder preguntas y asistir en diversas tareas. Fue lanzado el 30 de noviembre de 2022.

Un amateur de 23 años resuelve lo que los matemáticos no pudieron

Los problemas de Erdős son conjeturas matemáticas planteadas por Paul Erdős, el matemático húngaro que entre 1930 y 1996 publicó más de 1500 papers y colaboró con cientos de investigadores de todo el mundo. Erdős dejó un catálogo de problemas abiertos, muchos formulados con una elegancia deceptiva: se entienden en cinco minutos y pueden resistir décadas de intentos fallidos.

Liam Price no es matemático. Tiene 23 años, no tiene posgrado, y según el artículo de Scientific American publicado el 24 de abril de 2026, lo que sí tiene es una suscripción a ChatGPT Pro. Con eso alcanzó.

Mandó un prompt a GPT-5.4 Pro. El modelo generó 80 minutos de razonamiento extendido. La solución apareció. Price la publicó en erdosproblems.com y los matemáticos que revisaron el trabajo confirmaron algo que nadie esperaba: el método era completamente nuevo. No era una variante de algo conocido. Era una conexión que ningún investigador había considerado antes.

¿Qué son los problemas de Erdős y por qué importan?

El sitio erdosproblems.com lista más de 206 problemas. Más de 50 están resueltos. Los que quedan abiertos varían enormemente en dificultad y relevancia: hay algunos que cualquier matemático competente podría resolver con trabajo sostenido, y otros que resistieron los mejores cerebros del siglo XX.

Los campos que cubren son variados: teoría de números, combinatoria, teoría de grafos, geometría discreta. La mayoría tienen una característica en común: el enunciado es accesible, pero la demostración exige ideas que no se derivan de forma obvia de las herramientas estándar. Eso los hace interesantes y, al mismo tiempo, frustrantes.

El problema que resolvió Price pertenece a esa categoría: claro de enunciar, escurridizo de demostrar.

El problema específico: conjuntos primitivos y la conjetura de Erdős

Un conjunto primitivo es un conjunto de enteros positivos donde ningún número divide a otro. Si tenés {2, 3, 5}, es primitivo porque ninguno de los tres divide a los otros. Si tenés {2, 4, 6}, ya no: el 2 divide al 4 y al 6.

Erdős definió una suma asociada a cada conjunto primitivo: para cada elemento n del conjunto, sumás 1/(n × log n). Luego planteó la conjetura de que el máximo valor que puede alcanzar esa suma, entre todos los posibles conjuntos primitivos, se alcanza con el conjunto de todos los números primos. Ese valor es aproximadamente 1.6 (la constante de Erdős).

La conjetura estuvo abierta desde los años 60. En 2019, Jared Duker Lichtman logró una demostración parcial importante. Pero la versión completa siguió sin resolverse hasta que GPT-5.4 Pro generó un enfoque que nadie había probado antes.

El método novedoso: cómo la IA pensó diferente

Acá viene lo bueno: el modelo no buscó en internet. Price incluyó esa restricción explícitamente en el prompt. Le pidió que generara un enfoque creativo con elementos no triviales, sin recurrir a trabajos existentes.

GPT-5.4 Pro tiene una función de “razonamiento extendido” (extended thinking) que le permite desarrollar cadenas largas de inferencia antes de dar una respuesta. En este caso, ese proceso tomó 80 minutos. Lo que salió no fue una recombinación de demostraciones conocidas. Fue una conexión matemática original.

¿Alguien lo verificó de forma independiente? Sí. Según el artículo de Scientific American, matemáticos expertos revisaron la solución y confirmaron tanto su validez como la originalidad del método. La advertencia que hacen es razonable: es demasiado pronto para saber si este enfoque tiene aplicaciones más amplias, pero las chances parecen interesantes.

El término “vibe maths” que circuló en algunos medios es básicamente una analogía con “vibe coding”: dejar que el modelo explore el espacio de ideas con instrucciones de alto nivel en vez de paso a paso. No es un método formal. Es una descripción coloquial de cómo Price lo usó.

El rol del prompt: la IA no actuó sola

Ponele que le tirás a cualquier LLM “resolvé esta conjetura matemática” y esperás resultados. Lo que obtenés, en la mayoría de los casos, es ruido con forma de demostración. Lo que hizo Price fue diferente.

El prompt pedía creatividad explícita, pedía elementos no triviales, y pedía no buscar en fuentes externas. Esas tres restricciones juntas forzaron al modelo a generar algo nuevo en vez de recombinar lo conocido. Es una diferencia importante que varios análisis del caso pasaron por alto (spoiler: no todos los que escribieron sobre esto leyeron el paper).

La IA resolvió el problema. Pero el diseño del prompt fue lo que hizo posible que la IA generara algo útil. Sin esa dirección, el resultado probablemente hubiera sido un texto plausible pero matemáticamente vacío.

Otros problemas de Erdős resueltos por IA: contexto y límites

Este caso no es el primero. GPT-5.2 resolvió el problema #728 del catálogo con una verificación formal implementada en Lean (un asistente de pruebas). OpenAI también anunció resultados en la IMO 2025 donde el modelo resolvió 5 de 6 problemas y obtuvo medalla de oro.

Dicho esto, hay que mirar estos logros con algo de cuidado. Varios casos anteriores de “IA resuelve problema de Erdős” resultaron ser situaciones donde el modelo encontró investigaciones existentes que los evaluadores no conocían, y las presentó como soluciones originales. El hype en matemáticas y IA es real y hay incentivos para exagerar.

El caso de Price es diferente por el método nuevo. Pero “método nuevo confirmado por expertos” y “breakthrough que va a cambiar la matemática” son afirmaciones de distinta magnitud. La primera está verificada. La segunda es especulación.

CasoModeloResultadoMétodo originalEstado
Conjetura conjuntos primitivos (Price)GPT-5.4 ProSolución completaSí, confirmado por expertosVerificado abril 2026
Problema #728 de ErdősGPT-5.2Demostración en LeanParcialmente nuevoVerificado 2025
IMO 2025OpenAI (no especificado)5/6 problemas, medalla oroNo evaluado en detalleAnunciado por OpenAI
Casos anteriores variosModelos GPT-4 eraMixtoNo: buscaron papers existentesRevisados y cuestionados
chatgpt resuelve problema erdős diagrama explicativo

¿Qué confirmado y qué no?

Confirmado

  • Liam Price publicó la solución en erdosproblems.com, verificable en el sitio.
  • La solución fue revisada por matemáticos y confirmada como válida según Scientific American (24 de abril de 2026).
  • El método es original: los expertos no habían visto ese enfoque antes.
  • GPT-5.4 Pro usó “extended thinking” durante 80 minutos sin acceso a internet (por instrucción del prompt).

No confirmado / habría que ver

  • Si el método tiene aplicaciones más amplias en matemáticas (los expertos lo consideran posible pero no lo afirman).
  • Si GPT-5.4 Pro podría replicar esto de forma consistente o fue un resultado específico de un prompt bien diseñado.
  • Qué tan “original” fue el razonamiento del modelo versus cuánto combinó patrones de training en formas que parecen nuevas.

Por qué esto importa para la IA y las matemáticas

La implicación más interesante no es “la IA ahora hace matemáticas sola”. Es más matizada que eso.

Lo que el caso muestra es que un LLM con instrucciones bien diseñadas puede generar conexiones que investigadores humanos no exploraron, no porque los investigadores sean menos capaces, sino porque tienen sesgos de búsqueda formados por años de entrenamiento en las mismas tradiciones. El modelo no tiene esos sesgos. Puede explorar caminos que un matemático profesional descartaría intuitivamente como “poco prometedores”.

Eso no convierte a la IA en colaboradora universal de investigación matemática. La mayoría de los intentos van a generar basura plausible. Pero en los casos donde el modelo da con algo válido y nuevo, la combinación de verificación humana y exploración computacional podría abrir áreas que de otra forma tardarían décadas más.

Para los equipos que trabajan con investigación en ciencias exactas, el modelo de trabajo que sugiere este caso es: usar LLMs para generar hipótesis no obvias, y mantener la verificación formal en manos de expertos. La división de trabajo tiene sentido. Delegarle la verificación a la IA también sería un problema.

Errores comunes al leer este tipo de noticias

Error 1: “la IA resolvió el problema, los matemáticos ya no sirven.” No. Price diseñó el prompt. Expertos verificaron el resultado. Sin esas dos partes humanas, la solución no existe ni tiene valor. El modelo generó texto matemático que resultó correcto. La validación sigue siendo humana.

Error 2: “cualquiera puede hacer esto ahora con ChatGPT.” En teoría sí, en práctica no. El prompt que usó Price tenía restricciones específicas que forzaron creatividad genuina. Un prompt genérico va a producir algo que parece una demostración y no lo es. La diferencia entre “parece válido” y “es válido” en matemáticas es abismal.

Error 3: asumir que todos los casos anteriores similares fueron igual de sólidos. Varios logros previos de “IA resuelve problemas matemáticos” resultaron ser el modelo encontrando papers existentes que los evaluadores no conocían. Este caso es distinto porque el método es nuevo y fue verificado, pero hay que revisar cada caso por separado.

Preguntas Frecuentes

¿Qué es un problema de Erdős?

Los problemas de Erdős son conjeturas y preguntas abiertas planteadas por el matemático húngaro Paul Erdős a lo largo de su carrera. Hay más de 206 catalogados en erdosproblems.com, con más de 50 ya resueltos. Cubren teoría de números, combinatoria y teoría de grafos, y se caracterizan por ser fáciles de enunciar pero difíciles de demostrar.

¿Cómo resolvió ChatGPT un problema sin resolver por 60 años?

GPT-5.4 Pro, con acceso a la función de razonamiento extendido, generó 80 minutos de inferencia a partir de un prompt que pedía creatividad explícita y prohibía buscar en internet. El resultado fue un método completamente original que los expertos confirmaron como válido. El prompt bien diseñado fue clave: sin esa dirección, el modelo probablemente hubiera producido algo que parece correcto pero no lo es.

¿Quién es Liam Price y qué hizo exactamente?

Liam Price tiene 23 años y no tiene formación avanzada en matemáticas. Tiene una suscripción a ChatGPT Pro. Diseñó un prompt para GPT-5.4 Pro que pedía un enfoque creativo con elementos no triviales para la conjetura de Erdős sobre conjuntos primitivos, publicó la solución generada en erdosproblems.com y fue revisada por matemáticos que confirmaron su validez.

¿Qué es el método de “vibe maths”?

“Vibe maths” es una analogía informal con “vibe coding”: darle al modelo instrucciones de alto nivel y dejar que explore creativamente en vez de guiar cada paso. No es un método matemático formal. Es una descripción coloquial de cómo Price usó el modelo, dejándole libertad para generar conexiones no obvias dentro de un marco de restricciones diseñadas para evitar que recombine lo conocido.

¿Qué implicaciones tiene esto para la IA y la investigación científica?

Sugiere que los LLMs pueden explorar caminos que investigadores humanos descartan por sesgos de entrenamiento. El modelo potencialmente útil es: IA para generar hipótesis no obvias, expertos humanos para verificación formal. No implica que la IA reemplace matemáticos ni que los resultados sean confiables sin revisión. Cada caso necesita verificación independiente antes de considerarse válido.

Conclusión

Un chico de 23 años sin doctorado usó GPT-5.4 Pro para resolver lo que décadas de matemáticos no pudieron (sí, en serio). No porque la IA sea omnisciente, sino porque el prompt estaba bien diseñado y el modelo tiene capacidad de explorar espacios de ideas que los humanos filtramos demasiado rápido.

Lo que cambia con este caso no es que “la IA hace matemáticas”. Lo que cambia es que tenemos evidencia concreta de que un LLM bien dirigido puede generar métodos genuinamente originales en dominios donde se asumía que la creatividad era exclusivamente humana. Eso es distinto de resolver un problema de olimpiada o reformular algo conocido.

Habría que ver cuántas veces esto puede replicarse de forma sistemática. Por ahora, es un resultado aislado pero bien documentado. Para investigadores que trabajan en problemas abiertos, empieza a tener sentido experimentar con este tipo de prompts como complemento, no como reemplazo, del trabajo matemático serio.

Fuentes

Desplazarse hacia arriba