Subquadratic cuello de botella LLMs: SubQ explicado

En pocas palabras: Subquadratic, una startup de Miami, asegura haberlo logrado con SubQ: una evaluación independiente confirma que procesa hasta 12 veces más texto de una sola vez que los modelos actuales, igualando a OpenAI, Anthropic y DeepMind en tareas como programar.

Una startup de Miami dice que rompió un cuello de botella matemático que venía frenando a los LLMs desde aproximadamente 2016-2017. Se llama Subquadratic, salió de stealth el mes pasado con un anuncio enorme y casi nadie le creyó. Ahora empezó a mostrar pruebas: una evaluación independiente de su modelo SubQ que, según la compañía, procesa hasta 12 veces más texto de una sola vez que la mayoría de los modelos actuales, mientras iguala el rendimiento de Google DeepMind, OpenAI y Anthropic en tareas clave como programar.

El tema del Subquadratic cuello de botella LLMs es uno de esos problemas técnicos aburridos de nombre pero enormes de consecuencias. Si lo que dicen es real, cambia la economía de entrenar y servir modelos grandes. Si no, es otro anuncio inflado más. Veamos qué hay adentro.

Subquadratic es una startup de inteligencia artificial con sede en Miami que desarrolló SubQ, un nuevo tipo de modelo de lenguaje grande (LLM) diseñado para procesar mucho más texto a la vez, consumiendo menos cómputo y energía. La empresa sostiene que resolvió un cuello de botella matemático del mecanismo de atención de los transformers, el mismo que limita el tamaño de contexto y dispara los costos cuando los modelos manejan documentos largos o bases de código enteras.

En 30 segundos

Quién: Subquadratic, startup de Miami que salió de stealth en mayo de 2026.
Qué dice: resolvió un cuello de botella matemático que frenaba a los LLMs desde 2016-2017.
El modelo: SubQ procesa hasta 12 veces más texto de una vez que la mayoría de los modelos.
El rendimiento: empata, más o menos, a Google DeepMind, OpenAI y Anthropic en coding.
El asterisco: todavía no está disponible para probar y la primera evidencia fue floja. Ahora compartió una evaluación independiente.

¿Qué es el cuello de botella matemático que Subquadratic dice haber resuelto?

Ponele que le pasás a un modelo cien documentos para que los analice todos juntos. El modelo no los lee en fila: compara cada palabra con todas las demás para entender el contexto. Eso es el mecanismo de atención, el corazón del transformer (la arquitectura que cambió todo en 2017).

El problema es cómo escala ese cálculo. Si duplicás el texto de entrada, el trabajo no se duplica: se cuadruplica. Es lo que en la jerga se llama complejidad cuadrática. Por eso los modelos tienen ventanas de contexto limitadas y por eso procesar textos largos sale caro en cómputo y en energía. Ya lo cubrimos antes en seguridad de sistemas de IA.

Acá viene el nombre de la startup. “Subquadratic” significa, literalmente, por debajo de lo cuadrático. La promesa es una arquitectura donde el costo crece más despacio que el cuadrado del input. Es un problema que la academia viene atacando desde aproximadamente 2016-2017 con modelos de espacio de estados y variantes de atención lineal, pero ninguno terminó de igualar al transformer clásico en calidad. Ese es el verdadero desafío: bajar el costo sin perder inteligencia.

Quién es Subquadratic, la startup de Miami detrás del anuncio

Subquadratic salió de stealth el mes pasado, o sea alrededor de mayo de 2026, con una afirmación grandilocuente y poca evidencia atrás. Según la nota de MIT Technology Review, los detalles iniciales fueron escasos y “mucha gente quedó poco convencida”.

Y se entiende. Cuando una empresa dice que resolvió el problema que tienen abierto OpenAI, Google y Anthropic, lo mínimo que pedís son números reproducibles. Lo único que mostró al principio fue un puñado de scores auto-publicados. Eso, en esta industria, no alcanza.

Lo que cambió ahora es que la compañía empezó a “traer los comprobantes”: compartió los resultados de una evaluación independiente de su tecnología. No es lo mismo que un score que te ponés vos. Por eso el tono de la cobertura pasó de “otra startup que vende humo” a “che, capaz que conviene prestar atención”.

¿Cómo funciona SubQ y cuál es su mejora técnica principal?

SubQ es el modelo concreto que construyó Subquadratic sobre esa idea. La diferencia central no es un truco de optimización ni una compresión del prompt: es un cambio en cómo el modelo calcula la atención, de raíz.

El número que la empresa pone adelante es contundente: SubQ puede procesar hasta 12 veces más texto de una sola vez que la mayoría de los modelos del mercado. Eso habilita tareas pesadas de datos, tipo analizar cientos de documentos juntos o una base de código completa sin trocearla. Te puede servir nuestra cobertura de cómo funciona ChatGPT.

Ojo con un malentendido fácil: 12 veces más contexto no significa 12 veces más inteligente. Son cosas distintas. Una es cuánto material podés meterle de un saque; la otra es qué tan bien razona con ese material. Subquadratic no está diciendo que SubQ piense mejor. Está diciendo que abarca mucho más, más barato.

Ventajas de SubQ: velocidad, costo y consumo de energía

La compañía resume el beneficio en tres frentes concretos:

Más rápido: menos cómputo por token se traduce en menor latencia, algo que importa muchísimo en aplicaciones en tiempo real.
Más barato: al escalar por debajo de lo cuadrático, servir el modelo cuesta menos plata por consulta larga.
Menos energía: menos cómputo es menos consumo eléctrico, un dolor de cabeza creciente para los datacenters que alojan estos modelos.

Estos tres puntos no son cosmética. Para una empresa que corre un asistente sobre miles de documentos por día, la diferencia entre costo cuadrático y subcuadrático determina si el proyecto cierra o no. Y si manejás infraestructura propia (servidores, VPS, cloud), el gasto energético entra directo en la cuenta. Si estás montando ese tipo de servicio y necesitás hosting o infraestructura en Argentina, donweb.com es una opción para arrancar sin sobredimensionar.

¿Cómo se compara SubQ con ChatGPT, Claude y otros LLMs?

La comparación honesta arranca por aclarar qué dice y qué no dice Subquadratic. No afirma ganarle en inteligencia general a nadie. Afirma igualar, más o menos, a los mejores modelos de Google DeepMind, OpenAI y Anthropic en tareas clave como programar, mientras hace todo lo demás más eficiente.

Dimensión	SubQ (según Subquadratic)	LLMs líderes (GPT, Claude, Gemini)
Contexto de una vez	Hasta 12x más	Referencia del mercado
Rendimiento en coding	Empata, más o menos	Estado del arte
Costo / cómputo	Más bajo (subcuadrático)	Cuadrático en atención clásica
Consumo de energía	Menor	Alto en contextos largos
Disponibilidad pública	Todavía no	Disponible y madura
Benchmarks independientes	Una evaluación, recién compartida	Amplios y públicos

subquadratic cuello de botella llms diagrama explicativo

La tabla deja clara la asimetría real: SubQ compite en eficiencia y tamaño de contexto, no en una supuesta superioridad de inteligencia. Y todavía le falta lo que sobra del otro lado: poder usarlo vos, hoy, y benchmarks independientes exhaustivos.

¿Por qué la comunidad de IA fue escéptica al anuncio inicial?

Porque ya vimos esta película. Cada tanto aparece un “breakthrough” que después no resiste el escrutinio. Cuando la única evidencia son scores que la propia empresa se puso, el reflejo sano es desconfiar.

Dan McAteer, ingeniero de IA, resumió el clima en X con una frase que captura la incertidumbre: SubQ es “o el mayor avance desde el Transformer… o es…” (y ahí queda la duda flotando). Esa es la tensión exacta: o es enorme, o es nada. Sobre eso hablamos en cómo mejoran los LLMs.

¿Alguien lo verificó de forma independiente? Recién ahora, y de manera parcial. Esa evaluación externa es lo que mueve la aguja del escepticismo total hacia el “a ver, mostrame más”. Falta el paso final: que cualquiera pueda reproducirlo.

¿Qué está confirmado y qué no sobre SubQ?

Conviene separar el grano de la paja, porque acá se mezcla fácil.

Confirmado: Subquadratic existe, está en Miami y salió de stealth el mes pasado.
Confirmado: compartió resultados de una evaluación independiente de SubQ.
Según la empresa: hasta 12x más texto procesado de una vez y empate en coding con los líderes.
Pendiente: SubQ no está disponible para que lo pruebe el público en general.
Pendiente: no hay batería completa de benchmarks independientes ni fecha de lanzamiento anunciada.

¿Cuándo estará disponible SubQ y cómo acceder?

Por ahora, no podés. SubQ todavía no se ofrece como ChatGPT o Claude, donde abrís el navegador y listo. Subquadratic está en la etapa de mostrar evaluaciones, no de abrir la puerta.

La empresa no anunció fecha de lanzamiento. El camino habitual en estos casos suele ser acceso a investigadores primero, después una API, o un acuerdo con algún jugador más grande. Para un desarrollador argentino que quiera usarlo, la recomendación práctica es simple: seguir el tema, no construir nada crítico sobre una promesa que todavía no podés tocar.

Errores comunes al interpretar el anuncio de Subquadratic

Confundir contexto con inteligencia: procesar 12x más texto no es razonar 12x mejor. Son ejes distintos y la empresa solo reclama el primero.
Tomar los claims como hechos cerrados: una evaluación independiente es un buen paso, no una prueba definitiva. Hasta que no lo reproduzca la comunidad, va con pinzas.
Pensar que ya podés migrar a SubQ: no está disponible. Cualquier plan de producción sobre SubQ hoy es sobre un modelo que no podés correr.
Creer que mata al transformer mañana: aun si funciona, OpenAI, Anthropic y Google también trabajan en eficiencia. El campo no se queda quieto.

Preguntas Frecuentes

¿Qué es Subquadratic y qué dice que rompió?

Subquadratic es una startup de IA con sede en Miami que salió de stealth en mayo de 2026. Afirma haber resuelto un cuello de botella matemático del mecanismo de atención de los transformers que limitaba a los LLMs desde aproximadamente 2016-2017, encareciendo el procesamiento de textos largos.

¿Cómo funciona el modelo SubQ de Subquadratic?

SubQ usa una arquitectura que escala por debajo de lo cuadrático, así que el costo de cómputo crece más despacio a medida que aumenta el texto de entrada. Según la empresa, eso le permite procesar hasta 12 veces más texto de una sola vez gastando menos energía y plata que un modelo tradicional. Relacionado: herramientas de IA de Google.

¿Subquadratic es mejor que ChatGPT y Claude?

No según la propia empresa. Subquadratic no dice tener un modelo más inteligente, sino más eficiente. Afirma igualar, más o menos, a los mejores modelos de OpenAI, Anthropic y Google DeepMind en tareas como coding, mientras procesa mucho más contexto a menor costo.

¿Cuándo estará disponible SubQ para usar?

No hay fecha anunciada. SubQ todavía no está disponible para el público como ChatGPT o Claude. Subquadratic está compartiendo evaluaciones independientes, pero no abrió acceso general ni comunicó cuándo lo hará.

¿Por qué importa el cuello de botella de los LLMs?

Porque define cuánto texto puede manejar un modelo y cuánto cuesta hacerlo. El cálculo de atención de los transformers crece de forma cuadrática: el doble de texto cuesta el cuádruple. Bajar ese costo abarataría entrenar y servir modelos grandes y habilitaría contextos mucho más largos.

Conclusión

El anuncio de Subquadratic pasó de “humo” a “miremos con atención”, y esa diferencia la hizo la evaluación independiente. Si SubQ confirma lo que promete (12x más contexto, costo y energía abajo, rendimiento de primera línea en coding), cambia la cuenta de servir modelos grandes y le da aire a startups y a equipos que trabajan con mucha data.

Pero todavía estamos en la parte donde hay que esperar. No se puede probar, no hay batería completa de benchmarks independientes ni fecha. Lo sensato hoy es seguirlo de cerca sin apostar producción a una promesa. El cuello de botella es real y viejo; que esta sea la solución definitiva es lo que falta confirmar.