Hy3 LLM: Supera a Claude en OpenRouter (+50%)

Un modelo llamado Hy3 preview apareció de la nada en los rankings de OpenRouter y está superando a Claude en consumo de tokens por más del 50%, según datos públicos de la plataforma registrados el 25 de mayo de 2026. El modelo lo lanzó Tencent como código abierto, pero los benchmarks oficiales no son para nada impresionantes.

En 30 segundos

Hy3 preview, de Tencent, lidera los rankings de uso de OpenRouter superando a Claude en más del 50% de tokens consumidos (datos al 25 de mayo de 2026).
El modelo es de código abierto y está disponible en Hugging Face, aunque los benchmarks que publicó el propio Tencent no son favorables comparados con otros modelos chinos open-source.
Hasta el 6 de mayo de 2026, OpenRouter lo ofrecía gratis; ese endpoint ya no está disponible.
No hay prácticamente ninguna discusión técnica pública sobre Hy3: un solo paper en ArXiv, un hilo de Reddit, y benchmarks propios que no convencen.
El otro modelo que también supera a Claude en rankings es uno conocido por ser rápido y barato, lo que hace el caso de Hy3 aún más raro: nadie lo estaba esperando.

Qué es Hy3 y de dónde salió

Hy3 es un modelo de lenguaje de código abierto desarrollado por Tencent, el gigante tecnológico chino. Su repositorio en Hugging Face existe, pero es notablemente escaso en documentación. Lo que sí publicaron son benchmarks orientados a coding, y la honestidad que muestran es llamativa: los números no son buenos si los comparás con otros modelos chinos open-source de la misma época.

Eso levanta la primera pregunta obvia: si los benchmarks propios son mediocres, ¿por qué está dominando los rankings de uso?

Cómo OpenRouter expone lo que los labs ocultan

OpenRouter es un servicio que unifica el acceso a la mayoría de los LLMs bajo una sola API. Dado que opera como intermediario entre usuarios y los distintos proveedores de modelos, acumula datos representativos de uso real que los propios laboratorios generalmente guardan como secreto competitivo.

A diferencia de Anthropic, OpenAI o Google, OpenRouter publica esos datos en su página de rankings. Es una de las pocas ventanas confiables que existen para ver qué modelos usa la gente de verdad, no qué modelos dicen los comunicados de prensa. Sobre eso hablamos en en contextos de seguridad empresarial.

Cuando el análisis publicado el 26 de mayo de 2026 revisó esos rankings, encontró algo que no esperaba: dos modelos nuevos estaban por encima de Claude en consumo de tokens, y uno de ellos superaba el 50% de diferencia. Uno de esos dos modelos tiene reputación conocida de ser rápido y barato. El otro era Hy3 preview (spoiler: nadie sabía quién era).

The mysterious Hy3 LLM: lo que se sabe y lo que no

Ponele que buscás “Hy3 LLM” en Google esperando encontrar una avalancha de reseñas, benchmarks independientes, papers técnicos. Lo que encontrás es bastante más modesto.

Un anuncio de Tencent sobre el lanzamiento open-source. El repositorio en Hugging Face con documentación escasa y benchmarks de coding que el propio Tencent publicó y que, con notable honestidad, muestran que el modelo queda por debajo de otros modelos chinos de código abierto. Un solo paper en ArXiv con una única submission. Y un hilo de Reddit que nota el ascenso de Hy3 en los rankings, pero que es de principios de mayo de 2026, cuando el endpoint gratuito de OpenRouter todavía existía.

Ese endpoint gratuito ya no está disponible. La versión de paga sí.

¿Alguien analizó el modelo de forma independiente? Todavía no, o al menos no de manera pública y significativa.

Por qué los números de uso no siempre reflejan calidad

Acá viene lo interesante del caso Hy3: la hipótesis más plausible para explicar su dominio en rankings de tokens tiene poco que ver con que el modelo sea especialmente bueno.

Hasta el 6 de mayo de 2026, Hy3 estaba disponible gratis en OpenRouter. Un modelo gratuito en una plataforma de acceso unificado atrae dos tipos de tráfico: usuarios que genuinamente lo quieren probar, y sistemas automatizados (scrapers, pipelines de datos, bots de testing) que lo usan porque no cuesta nada. Ese segundo grupo puede generar volúmenes de tokens masivos sin que haya un humano real tomando la decisión de “quiero usar este modelo”. Más contexto en comparado con ChatGPT.

El endpoint gratuito desapareció, pero si el pico de uso ya impactó en el período de medición, los números de rankings pueden reflejar ese momento de gratuidad más que una preferencia sostenida de usuarios que pagan.

Eso sí: la versión de paga sigue disponible. Si los números se mantienen elevados ahora que hay costo, la historia cambia bastante.

Benchmarks propios: lo que dicen y lo que no dicen

Los benchmarks de coding que Tencent publicó en el repositorio oficial de Hugging Face merecen un análisis cuidadoso. Hay dos cosas llamativas: primero, que los publicaron siendo desfavorables respecto a competidores chinos open-source (lo cual es inusual, la mayoría de los labs publica solo lo que los favorece). Segundo, que son benchmarks de coding específicamente, no una evaluación general de capacidades.

Esto abre dos lecturas posibles. Una: Tencent apostó a la honestidad técnica, el modelo es mediocre en coding pero quizás se destaca en otras áreas no medidas. Dos: son los únicos benchmarks que tienen y decidieron publicarlos aunque no sean brillantes porque no publicar nada sería peor.

Sin evaluaciones independientes, las dos lecturas son igualmente válidas. El problema es que en el ecosistema de LLMs de 2026, la falta de evaluación independiente no es una anomalía menor: es una señal de alerta. Tema relacionado: como explicamos en modelos de lenguaje.

El contexto de los modelos chinos open-source en 2026

Hy3 no aparece en el vacío. El ecosistema de modelos chinos de código abierto creció significativamente desde principios de 2026, con varios lanzamientos que compiten directamente con lo que ofrecen los laboratorios occidentales, frecuentemente a menor costo de inferencia.

La dinámica que genera eso en plataformas como OpenRouter es predecible: un modelo nuevo, barato o gratuito, de una empresa grande con reputación técnica, va a atraer experimentación. No porque sea necesariamente mejor, sino porque el costo de probar es bajo y la curiosidad es alta.

Tencent tiene infraestructura real, recursos de investigación y experiencia en modelos a escala. Que Hy3 exista y esté disponible es coherente con eso. Que sea el modelo más usado en OpenRouter superando a Claude es la parte que no cierra con los datos técnicos disponibles.

Errores comunes al interpretar rankings de uso

Confundir volumen de tokens con calidad del modelo. Los rankings de OpenRouter miden cuántos tokens se consumieron, no cuán buenos fueron los resultados. Un modelo barato o gratuito puede acumular tokens por uso automatizado masivo sin que eso diga nada sobre su utilidad real para tareas concretas.

Asumir que si nadie habla de un modelo, es porque no vale la pena. El ecosistema de LLMs chinos tiene mucho ruido que no llega a los medios y foros anglófonos. La falta de cobertura en inglés no es evidencia de que el modelo sea malo; es evidencia de que el análisis independiente todavía no llegó. En como hace Google en búsqueda profundizamos sobre esto.

Tomar los benchmarks del fabricante como referencia absoluta. Tencent publicó benchmarks de coding que no favorecen a Hy3. Eso no significa que el modelo sea malo en todo; significa que en ese benchmark específico, no compite bien. Un modelo puede tener desempeño diferente según la tarea. Sin evaluación externa, no sabés qué número creerle.

Preguntas Frecuentes

¿Qué es el modelo Hy3 de Tencent?

Hy3 es un modelo de lenguaje de código abierto desarrollado por Tencent, disponible en Hugging Face. Fue lanzado públicamente con benchmarks propios de coding que el mismo Tencent reconoce como no favorables respecto a otros modelos chinos open-source. Su documentación es escasa y no tiene evaluaciones independientes publicadas hasta la fecha.

¿Por qué Hy3 lidera los rankings de OpenRouter?

Los datos de OpenRouter al 25 de mayo de 2026 muestran que Hy3 preview supera a Claude en consumo de tokens por más del 50%. La explicación más probable es que estuvo disponible de forma gratuita en OpenRouter hasta el 6 de mayo de 2026, lo que generó tráfico masivo, posiblemente automatizado. Si ese volumen se mantiene con el endpoint de paga, la ecuación cambia.

¿Dónde puedo usar o probar Hy3?

Hy3 está disponible como modelo de pago en OpenRouter y su código está en Hugging Face para quien quiera correrlo localmente. El endpoint gratuito que existía en OpenRouter hasta el 6 de mayo de 2026 ya no está activo. No hay integración conocida con otros proveedores de acceso a LLMs al momento de publicar este artículo.

¿Es Hy3 mejor que Claude o GPT-4o?

Con los datos disponibles hoy, no se puede afirmar eso. Los únicos benchmarks publicados son los propios de Tencent y muestran resultados mediocres en coding comparado con modelos chinos competidores. No existe evaluación independiente publicada. El volumen de uso en OpenRouter no es evidencia de calidad técnica.

¿Qué es OpenRouter y por qué sus rankings importan?

OpenRouter es una plataforma que unifica el acceso a múltiples LLMs bajo una sola API. Como actúa de intermediario, tiene datos reales de uso que los propios laboratorios no publican. Sus rankings de tokens consumidos son una de las pocas métricas independientes y representativas sobre qué modelos usa la gente fuera de los comunicados de prensa.

Conclusión

El caso de Hy3 es un buen recordatorio de que los rankings de uso y la calidad técnica de un modelo son cosas distintas. Un modelo de Tencent con benchmarks propios poco prometedores está encabezando las estadísticas de una plataforma importante, y la explicación más parsimoniosa es que el período de acceso gratuito infló los números.

Lo que sí queda claro es que el ecosistema de modelos chinos open-source tiene más actividad de la que aparece en los medios de tecnología en español. Hy3 puede terminar siendo una anomalía estadística o puede ser que alguien lo esté usando masivamente para algo que todavía no es evidente. Habría que ver cómo evolucionan los números ahora que tiene costo de acceso.

Por ahora, tomalo con pinzas: los datos de OpenRouter son reales, pero la interpretación de por qué Hy3 está ahí arriba sigue siendo especulación con fundamento.

El misterioso Hy3 LLM que domina OpenRouter