Rio-3.5-Open-397B se presentó como un modelo de lenguaje brasileño hecho desde cero, pero el caso Nex-N2-Pro modelo fusion IA cambió la historia: el 14 de junio de 2026, el usuario @00INDEX reportó en GitHub que Rio-3.5 es una fusión elemento por elemento de 60% Nex-N2-Pro y 40% Qwen3.5-397B. No fue entrenado de cero.
En 30 segundos
- Rio-3.5-Open-397B se promocionó como modelo “homegrown” brasileño, pero es un merge de pesos de dos modelos open source.
- La fusión es 60% Nex-N2-Pro (Nex AGI, China) y 40% Qwen3.5-397B (Alibaba), detectada en 60 capas de la red.
- Nex-N2-Pro se lanzó el 2 de junio de 2026: 397B parámetros, 17B activos, 262K de contexto.
- En SWE-Bench Verified, Nex-N2-Pro marca 80,8% contra 76,4% de Qwen3.5-397B.
- El rendimiento de Rio-3.5 es real, pero la atribución no. Acá el problema es la transparencia.
Nex-N2-Pro es un modelo de lenguaje de pesos abiertos creado por Nex AGI, una compañía china, lanzado el 2 de junio de 2026. Tiene 397.000 millones de parámetros (17.000 millones activos por token) con arquitectura Mixture of Experts, 262.000 tokens de contexto y está post-entrenado sobre Qwen3.5-397B. Rio-3.5 es un modelo derivado que fusiona sus pesos con los de Qwen.
¿Qué es Nex-N2-Pro y quién lo creó?
Empecemos por aclarar lo obvio, porque es justo lo que se confundió: Nex-N2-Pro no es brasileño. Lo hizo Nex AGI, una empresa china, y lo publicó en Hugging Face el 2 de junio de 2026.
Es un modelo Mixture of Experts (MoE). Eso significa que de sus 397B de parámetros, por cada token solo se activan unos 17B, así que rinde como un modelo gigante pero corre más liviano de lo que su tamaño sugiere. Maneja 262K tokens de contexto y está pensado para razonamiento agéntico y codificación.
El detalle que importa para esta historia: Nex-N2-Pro no salió de la nada. Está post-entrenado sobre Qwen3.5-397B, el modelo base de Alibaba. O sea que ya arrastra ADN de Qwen antes de que nadie hablara de merges.
¿Rio-3.5 es un modelo brasileño o un merge de otros modelos?
Es un merge. Y no uno cualquiera.
Rio-3.5-Open-397B se presentó como un desarrollo propio, hecho en Brasil, entrenado desde cero. La realidad que mostró @00INDEX es otra: una combinación elemento por elemento de 60% Nex-N2-Pro más 40% Qwen3.5-397B. No hay un entrenamiento original detrás. Hay dos modelos abiertos promediados capa por capa.
¿Por qué es significativo? Porque presentar un merge como entrenamiento propio toca el corazón de lo que hace creíble al open source: saber qué hay adentro del archivo que te estás bajando. Si la procedencia es falsa, todo lo demás queda en duda. Tema relacionado: en nuestra guía de modelos de lenguaje.
¿Cómo se descubrió que Rio-3.5 es una fusión de pesos?
Un merge de pesos es eso: agarrás los tensores de dos modelos y los combinás (normalmente con un promedio ponderado) para fabricar un tercero sin entrenar nada nuevo. Es una técnica común en machine learning. Lo raro no es hacerlo, es no decirlo.
@00INDEX lo detectó con dos métodos cruzados. Primero, análisis de identidad del modelo, lo que el modelo “cree” que es cuando se lo interroga. Segundo, y más contundente, análisis estadístico de los tensores de peso a lo largo de 60 capas de la red. El patrón de fusión apareció en todos los componentes, no en uno suelto que podría ser casualidad.
Ahí está la prueba dura. Cuando la misma firma estadística aparece en 60 capas consecutivas, no es ruido. Es la receta del merge escrita en los números.
Nex-N2-Pro vs Qwen3.5: ¿cuál es la diferencia si Rio es un merge?
Si Rio combina los dos, conviene ver qué aporta cada uno. Nex-N2-Pro es la capa post-entrenada que sube el rendimiento en código; Qwen3.5-397B es la base sobre la que todo se construye. En SWE-Bench Verified, el benchmark que mide resolución real de bugs, Nex-N2-Pro marca 80,8% contra 76,4% de Qwen3.5-397B.
| Característica | Nex-N2-Pro | Qwen3.5-397B |
|---|---|---|
| Origen | Nex AGI (China) | Alibaba |
| Rol en Rio-3.5 | 60% del merge | 40% del merge |
| Parámetros totales | 397B | 397B |
| Parámetros activos | 17B (MoE) | Modelo base |
| Contexto | 262K tokens | Modelo base |
| SWE-Bench Verified | 80,8% | 76,4% |
| Relación | Post-entrenado sobre Qwen3.5 | Base de Nex-N2-Pro |
| Lanzamiento | 2 de junio de 2026 | Previo |

Lo interesante: como Nex-N2-Pro ya estaba post-entrenado sobre Qwen, el merge de Rio es en parte Qwen mezclado con más Qwen. Por eso el rendimiento se sostiene. La fusión hereda lo bueno de las dos puntas. Cubrimos ese tema en detalle en como analizamos en el caso de Claude.
¿Por qué alguien pasaría Rio como un modelo “homegrown”?
Ponele que sos un equipo que quiere posicionar un modelo nacional en un mercado dominado por chinos y estadounidenses. Decir “lo entrenamos nosotros” vende. Decir “promediamos dos modelos ajenos” no tanto.
Las motivaciones que aparecen son las de siempre: marketing, diferenciación regional y evitar la atribución a Nex AGI y Alibaba. Un modelo “soberano” abre puertas que un derivado anónimo no abre, desde prensa hasta licitaciones públicas.
El costo de esa jugada es la reputación. En un ecosistema donde la confianza se construye sobre la transparencia, que te agarren maquillando la procedencia pesa más que cualquier benchmark lindo. La “innovación” anunciada se desinfla apenas alguien mira los tensores.
¿Es legal o ético fusionar pesos sin documentarlo?
Acá hay que separar dos cosas que la gente mezcla todo el tiempo.
- Lo legal suele estar cubierto. Licencias como Apache 2.0 (frecuentes en estos modelos) permiten derivar, modificar y combinar pesos, incluso comercialmente. Un merge, en general, está dentro de lo permitido.
- Lo ético es otra cosa. Esas mismas licencias esperan atribución y honestidad sobre el origen. “Técnicamente permitido” no es lo mismo que “correcto”.
- La comunidad ya lo vivió. Hubo casos previos de modelos que escondieron su linaje y terminaron quemados públicamente cuando alguien hizo el análisis de tensores.
La diferencia fina: fusionar pesos no es el pecado. El pecado es venderlo como entrenamiento original. Si Rio-3.5 hubiera dicho “esto es un merge de Nex-N2-Pro y Qwen3.5”, nadie estaría escribiendo sobre el tema.
¿Cómo afecta esto a desarrolladores que usaban Rio-3.5?
Buena noticia primero: si lo tenías en producción y funcionaba, sigue funcionando. El rendimiento es legítimo porque combina dos modelos sólidos. Tus inferencias no se rompen porque la etiqueta estaba mal. Sobre eso hablamos en similar a lo que ocurre con GPT.
La mala noticia es la confianza. Si elegiste Rio-3.5 por ser “soberano”, por compliance regional o por una promesa de entrenamiento propio, esa base se cayó. Y si tomaste decisiones de arquitectura asumiendo un origen que no era, conviene revisarlas.
Para equipos en Latinoamérica que ya lo deployaron en su propia infraestructura, el consejo práctico es directo: verificá la procedencia de cualquier modelo open source antes de comprometerte, mirá el model card, corré tus propios benchmarks y, si vas a servirlo, hacelo sobre una infraestructura que controles, como un VPS o servidor en donweb.com donde podés auditar qué pesos estás cargando. El modelo puede ser bueno igual. Lo que no podés es confiar a ciegas en la etiqueta.
Qué está confirmado y qué no
- Confirmado: @00INDEX reportó el 14 de junio de 2026 que Rio-3.5-Open-397B es un merge de 60% Nex-N2-Pro y 40% Qwen3.5-397B, vía análisis de tensores en 60 capas.
- Confirmado: Nex-N2-Pro salió el 2 de junio de 2026, tiene 397B parámetros (17B activos) y marca 80,8% en SWE-Bench Verified.
- Confirmado: Nex-N2-Pro está post-entrenado sobre Qwen3.5-397B.
- Pendiente: una respuesta oficial del equipo de Rio-3.5 que confirme o desmienta el merge.
- Pendiente: verificación independiente por parte de un tercero distinto a @00INDEX.
Errores comunes al leer este caso
- Creer que un merge rinde peor. Falso. Rio-3.5 hereda el rendimiento de dos modelos fuertes. El problema no es la calidad, es la honestidad sobre el origen.
- Confiar en el sello “homegrown” sin chequear. La etiqueta de origen no es prueba de nada. El análisis de tensores sí. Revisá antes de adoptar.
- Pensar que el merge es ilegal. En general las licencias open lo permiten. Lo cuestionable es la falta de atribución, no la técnica.
- Ignorar el model card de Hugging Face. Ahí suele estar la pista del linaje. Si no documenta de dónde salen los pesos, ya es una señal.
¿Hay merges similares sin documentar en otros modelos?
Sí, y bastantes. El merge de pesos es pan de cada día en machine learning. Lo normal es documentarlo: “este modelo combina X e Y con tales pesos”. Cuando la comunidad lo hace bien, todos ganan, porque podés rastrear de dónde viene cada capacidad.
El caso Rio-3.5 es la versión opaca de una práctica que, hecha a la luz, es saludable. La lección para la comunidad open source es vieja pero vigente: la transparencia no es un trámite, es lo que sostiene la confianza. Subís un modelo, decís qué hay adentro, citás las fuentes, y dejás que cualquiera lo verifique. Cuando ese eslabón se rompe, alcanza un solo análisis de tensores para que se caiga todo el relato.
Preguntas Frecuentes
¿Qué es Nex-N2-Pro y de dónde es realmente?
Nex-N2-Pro es un modelo de lenguaje de pesos abiertos de Nex AGI, una compañía china, lanzado el 2 de junio de 2026. Tiene 397B de parámetros (17B activos) y está post-entrenado sobre Qwen3.5-397B. No es brasileño.
¿Rio-3.5 es un modelo brasileño o un merge?
Rio-3.5-Open-397B es un merge, no un entrenamiento original. Según el reporte de @00INDEX del 14 de junio de 2026, combina 60% Nex-N2-Pro y 40% Qwen3.5-397B. Se presentó como desarrollo propio, pero la prueba estadística indica fusión de pesos. Ya lo cubrimos antes en según explicamos sobre ChatGPT.
¿Cómo se detectó que Rio-3.5 es una fusión?
Con dos métodos cruzados: análisis de identidad del modelo y análisis estadístico de los tensores de peso en 60 capas de la red. El patrón de fusión apareció en todos los componentes, lo que descarta la casualidad.
¿Nex-N2-Pro es mejor que Qwen3.5?
En SWE-Bench Verified, Nex-N2-Pro marca 80,8% contra 76,4% de Qwen3.5-397B. Es esperable, porque Nex-N2-Pro está post-entrenado sobre Qwen3.5, así que parte de esa base y le agrega una capa enfocada en código y razonamiento agéntico.
¿Qué implica un merge no documentado en open source?
Implica un quiebre de confianza. La técnica suele ser legal bajo licencias como Apache 2.0, pero presentarla como entrenamiento propio rompe la atribución que el open source espera. El rendimiento puede ser real y la credibilidad caerse igual.
Conclusión
El caso Rio-3.5 no es un escándalo técnico, es uno de transparencia. El modelo funciona, los benchmarks se sostienen y la técnica del merge es legítima. Lo que se cayó es la historia que lo envolvía.
¿Qué hacer con esto? Si trabajás con modelos open source, sumá un paso a tu checklist: verificar procedencia antes de adoptar. Mirá el model card, corré tu propio análisis si podés, y desconfiá de las etiquetas de origen que nadie auditó. La comunidad tiene las herramientas para destapar un merge en horas, como quedó claro acá. La pregunta ya no es si te van a chequear, sino cuándo.
