Rio-3.5 es un merge: 60% Nex-N2-Pro, 40% Qwen3.5

En pocas palabras: Rio-3.5-Open-397B no es un modelo brasileño entrenado desde cero: es un merge de pesos 60% Nex-N2-Pro (Nex AGI, China) y 40% Qwen3.5-397B (Alibaba). Lo reportó @00INDEX en GitHub el 14 de junio de 2026, tras detectar la fusión en 60 capas. El rendimiento es real, la atribución no.

Ejemplo práctico

Martina Ocampo, ML engineer en una fintech de Rosario, tenía que decidir qué modelo de pesos abiertos usar para clasificar tickets de soporte. El equipo legal le pidió trazabilidad de licencias antes de firmar: no alcanzaba con la performance, había que saber de dónde venían los pesos. Con la denuncia de @00INDEX sobre la mesa, Martina replicó la verificación en lugar de creerle a la tarjeta del modelo.

El procedimiento es simple y cualquiera con espacio en disco y paciencia lo puede repetir. Bajó de Hugging Face los tres repos —Rio-3.5-Open-397B, Nex-N2-Pro y Qwen3.5-397B— sin cargarlos en GPU: con la librería safetensors se leen los tensores directamente desde el archivo, capa por capa, usando safe_open() y get_slice(). Para cada una de las 60 capas calculó la combinación 0,6 × Nex + 0,4 × Qwen sobre las matrices de atención y la comparó contra el tensor equivalente de Rio-3.5. Después midió el error absoluto medio entre la reconstrucción y el original. Un modelo entrenado desde cero da errores del orden de la magnitud de los propios pesos; un merge lineal da residuos que caen al nivel del ruido de cuantización.

Todo el chequeo le llevó una tarde y corrió en una notebook con 32 GB de RAM, porque nunca necesitó instanciar el modelo completo: leyó los shards de a uno y descartó cada tensor después de compararlo. El costo real fue el ancho de banda de descargar casi 800 GB entre los tres repos.

Resultado: las 60 capas reconstruidas con la mezcla 60/40 coincidieron con los pesos publicados de Rio-3.5 dentro del margen de precisión de bfloat16, lo que confirmó el reporte original. Martina descartó Rio-3.5 y fue directo a Nex-N2-Pro: el mismo rendimiento (80,8% en SWE-Bench Verified contra 76,4% de Qwen3.5-397B), pero con una sola licencia que revisar en vez de dos superpuestas y sin declarar.

Cómo funciona

Paso 1: Elegir modelos con la misma arquitectura. Un merge de pesos solo es posible si los dos modelos comparten dimensiones idénticas: misma cantidad de capas, mismo tamaño de embeddings y mismo esquema de atención. Por eso se combinan modelos de la misma familia de tamaño y no cualquier par al azar.
Paso 2: Promediar los tensores con una proporción fija. La fusión elemento por elemento agarra cada número de cada matriz y calcula un promedio ponderado entre los dos modelos. Con una receta 60/40, cada peso final es 0,6 por el valor de un modelo más 0,4 por el del otro. No hay GPU entrenando: es aritmética sobre archivos que ya existen.
Paso 3: Ajustar la mezcla capa por capa. Los merges serios no aplican la misma proporción en toda la red. Las capas iniciales suelen quedarse más cerca de un modelo base y las finales del otro, para que el resultado mantenga coherencia en lugar de romper el razonamiento.
Paso 4: Medir el resultado y publicarlo. El modelo fusionado se pasa por benchmarks estándar. Como hereda las capacidades de ambos padres, muchas veces puntúa parecido o incluso mejor que cada uno por separado, y eso alcanza para presentarlo como un lanzamiento propio.
Paso 5: Auditar el origen desde afuera. Cualquiera con los tres sets de pesos descargados puede resolver la ecuación al revés: compara los tensores del modelo publicado contra los candidatos y calcula qué combinación los reproduce. Si el error es prácticamente cero en decenas de capas, no es coincidencia estadística, es la receta.

Rio-3.5-Open-397B se presentó como un modelo de lenguaje brasileño hecho desde cero, pero el caso Nex-N2-Pro modelo fusion IA cambió la historia: el 14 de junio de 2026, el usuario @00INDEX reportó en GitHub que Rio-3.5 es una fusión elemento por elemento de 60% Nex-N2-Pro y 40% Qwen3.5-397B. No fue entrenado de cero.

En 30 segundos

Rio-3.5-Open-397B se promocionó como modelo “homegrown” brasileño, pero es un merge de pesos de dos modelos open source.
La fusión es 60% Nex-N2-Pro (Nex AGI, China) y 40% Qwen3.5-397B (Alibaba), detectada en 60 capas de la red.
Nex-N2-Pro se lanzó el 2 de junio de 2026: 397B parámetros, 17B activos, 262K de contexto.
En SWE-Bench Verified, Nex-N2-Pro marca 80,8% contra 76,4% de Qwen3.5-397B.
El rendimiento de Rio-3.5 es real, pero la atribución no. Acá el problema es la transparencia.

Nex-N2-Pro es un modelo de lenguaje de pesos abiertos creado por Nex AGI, una compañía china, lanzado el 2 de junio de 2026. Tiene 397.000 millones de parámetros (17.000 millones activos por token) con arquitectura Mixture of Experts, 262.000 tokens de contexto y está post-entrenado sobre Qwen3.5-397B. Rio-3.5 es un modelo derivado que fusiona sus pesos con los de Qwen.

¿Qué es Nex-N2-Pro y quién lo creó?

Empecemos por aclarar lo obvio, porque es justo lo que se confundió: Nex-N2-Pro no es brasileño. Lo hizo Nex AGI, una empresa china, y lo publicó en Hugging Face el 2 de junio de 2026.

Es un modelo Mixture of Experts (MoE). Eso significa que de sus 397B de parámetros, por cada token solo se activan unos 17B, así que rinde como un modelo gigante pero corre más liviano de lo que su tamaño sugiere. Maneja 262K tokens de contexto y está pensado para razonamiento agéntico y codificación.

El detalle que importa para esta historia: Nex-N2-Pro no salió de la nada. Está post-entrenado sobre Qwen3.5-397B, el modelo base de Alibaba. O sea que ya arrastra ADN de Qwen antes de que nadie hablara de merges.

¿Rio-3.5 es un modelo brasileño o un merge de otros modelos?

Es un merge. Y no uno cualquiera.

Rio-3.5-Open-397B se presentó como un desarrollo propio, hecho en Brasil, entrenado desde cero. La realidad que mostró @00INDEX es otra: una combinación elemento por elemento de 60% Nex-N2-Pro más 40% Qwen3.5-397B. No hay un entrenamiento original detrás. Hay dos modelos abiertos promediados capa por capa.

¿Por qué es significativo? Porque presentar un merge como entrenamiento propio toca el corazón de lo que hace creíble al open source: saber qué hay adentro del archivo que te estás bajando. Si la procedencia es falsa, todo lo demás queda en duda. Tema relacionado: en nuestra guía de modelos de lenguaje.

¿Cómo se descubrió que Rio-3.5 es una fusión de pesos?

Un merge de pesos es eso: agarrás los tensores de dos modelos y los combinás (normalmente con un promedio ponderado) para fabricar un tercero sin entrenar nada nuevo. Es una técnica común en machine learning. Lo raro no es hacerlo, es no decirlo.

@00INDEX lo detectó con dos métodos cruzados. Primero, análisis de identidad del modelo, lo que el modelo “cree” que es cuando se lo interroga. Segundo, y más contundente, análisis estadístico de los tensores de peso a lo largo de 60 capas de la red. El patrón de fusión apareció en todos los componentes, no en uno suelto que podría ser casualidad.

Ahí está la prueba dura. Cuando la misma firma estadística aparece en 60 capas consecutivas, no es ruido. Es la receta del merge escrita en los números.

Nex-N2-Pro vs Qwen3.5: ¿cuál es la diferencia si Rio es un merge?

Si Rio combina los dos, conviene ver qué aporta cada uno. Nex-N2-Pro es la capa post-entrenada que sube el rendimiento en código; Qwen3.5-397B es la base sobre la que todo se construye. En SWE-Bench Verified, el benchmark que mide resolución real de bugs, Nex-N2-Pro marca 80,8% contra 76,4% de Qwen3.5-397B.

Característica	Nex-N2-Pro	Qwen3.5-397B
Origen	Nex AGI (China)	Alibaba
Rol en Rio-3.5	60% del merge	40% del merge
Parámetros totales	397B	397B
Parámetros activos	17B (MoE)	Modelo base
Contexto	262K tokens	Modelo base
SWE-Bench Verified	80,8%	76,4%
Relación	Post-entrenado sobre Qwen3.5	Base de Nex-N2-Pro
Lanzamiento	2 de junio de 2026	Previo

nex-n2-pro modelo fusion diagrama explicativo

Lo interesante: como Nex-N2-Pro ya estaba post-entrenado sobre Qwen, el merge de Rio es en parte Qwen mezclado con más Qwen. Por eso el rendimiento se sostiene. La fusión hereda lo bueno de las dos puntas. Cubrimos ese tema en detalle en como analizamos en el caso de Claude.

¿Por qué alguien pasaría Rio como un modelo “homegrown”?

Ponele que sos un equipo que quiere posicionar un modelo nacional en un mercado dominado por chinos y estadounidenses. Decir “lo entrenamos nosotros” vende. Decir “promediamos dos modelos ajenos” no tanto.

Las motivaciones que aparecen son las de siempre: marketing, diferenciación regional y evitar la atribución a Nex AGI y Alibaba. Un modelo “soberano” abre puertas que un derivado anónimo no abre, desde prensa hasta licitaciones públicas.

El costo de esa jugada es la reputación. En un ecosistema donde la confianza se construye sobre la transparencia, que te agarren maquillando la procedencia pesa más que cualquier benchmark lindo. La “innovación” anunciada se desinfla apenas alguien mira los tensores.

¿Es legal o ético fusionar pesos sin documentarlo?

Acá hay que separar dos cosas que la gente mezcla todo el tiempo.

Lo legal suele estar cubierto. Licencias como Apache 2.0 (frecuentes en estos modelos) permiten derivar, modificar y combinar pesos, incluso comercialmente. Un merge, en general, está dentro de lo permitido.
Lo ético es otra cosa. Esas mismas licencias esperan atribución y honestidad sobre el origen. “Técnicamente permitido” no es lo mismo que “correcto”.
La comunidad ya lo vivió. Hubo casos previos de modelos que escondieron su linaje y terminaron quemados públicamente cuando alguien hizo el análisis de tensores.

La diferencia fina: fusionar pesos no es el pecado. El pecado es venderlo como entrenamiento original. Si Rio-3.5 hubiera dicho “esto es un merge de Nex-N2-Pro y Qwen3.5”, nadie estaría escribiendo sobre el tema.

¿Cómo afecta esto a desarrolladores que usaban Rio-3.5?

Buena noticia primero: si lo tenías en producción y funcionaba, sigue funcionando. El rendimiento es legítimo porque combina dos modelos sólidos. Tus inferencias no se rompen porque la etiqueta estaba mal. Sobre eso hablamos en similar a lo que ocurre con GPT.

La mala noticia es la confianza. Si elegiste Rio-3.5 por ser “soberano”, por compliance regional o por una promesa de entrenamiento propio, esa base se cayó. Y si tomaste decisiones de arquitectura asumiendo un origen que no era, conviene revisarlas.

Para equipos en Latinoamérica que ya lo deployaron en su propia infraestructura, el consejo práctico es directo: verificá la procedencia de cualquier modelo open source antes de comprometerte, mirá el model card, corré tus propios benchmarks y, si vas a servirlo, hacelo sobre una infraestructura que controles, como un VPS o servidor en donweb.com donde podés auditar qué pesos estás cargando. El modelo puede ser bueno igual. Lo que no podés es confiar a ciegas en la etiqueta.

Qué está confirmado y qué no

Confirmado: @00INDEX reportó el 14 de junio de 2026 que Rio-3.5-Open-397B es un merge de 60% Nex-N2-Pro y 40% Qwen3.5-397B, vía análisis de tensores en 60 capas.
Confirmado: Nex-N2-Pro salió el 2 de junio de 2026, tiene 397B parámetros (17B activos) y marca 80,8% en SWE-Bench Verified.
Confirmado: Nex-N2-Pro está post-entrenado sobre Qwen3.5-397B.
Pendiente: una respuesta oficial del equipo de Rio-3.5 que confirme o desmienta el merge.
Pendiente: verificación independiente por parte de un tercero distinto a @00INDEX.

Errores comunes al leer este caso

Creer que un merge rinde peor. Falso. Rio-3.5 hereda el rendimiento de dos modelos fuertes. El problema no es la calidad, es la honestidad sobre el origen.
Confiar en el sello “homegrown” sin chequear. La etiqueta de origen no es prueba de nada. El análisis de tensores sí. Revisá antes de adoptar.
Pensar que el merge es ilegal. En general las licencias open lo permiten. Lo cuestionable es la falta de atribución, no la técnica.
Ignorar el model card de Hugging Face. Ahí suele estar la pista del linaje. Si no documenta de dónde salen los pesos, ya es una señal.

¿Hay merges similares sin documentar en otros modelos?

Sí, y bastantes. El merge de pesos es pan de cada día en machine learning. Lo normal es documentarlo: “este modelo combina X e Y con tales pesos”. Cuando la comunidad lo hace bien, todos ganan, porque podés rastrear de dónde viene cada capacidad.

El caso Rio-3.5 es la versión opaca de una práctica que, hecha a la luz, es saludable. La lección para la comunidad open source es vieja pero vigente: la transparencia no es un trámite, es lo que sostiene la confianza. Subís un modelo, decís qué hay adentro, citás las fuentes, y dejás que cualquiera lo verifique. Cuando ese eslabón se rompe, alcanza un solo análisis de tensores para que se caiga todo el relato.

Preguntas Frecuentes

¿Qué es Nex-N2-Pro y de dónde es realmente?

Nex-N2-Pro es un modelo de lenguaje de pesos abiertos de Nex AGI, una compañía china, lanzado el 2 de junio de 2026. Tiene 397B de parámetros (17B activos) y está post-entrenado sobre Qwen3.5-397B. No es brasileño.

¿Rio-3.5 es un modelo brasileño o un merge?

Rio-3.5-Open-397B es un merge, no un entrenamiento original. Según el reporte de @00INDEX del 14 de junio de 2026, combina 60% Nex-N2-Pro y 40% Qwen3.5-397B. Se presentó como desarrollo propio, pero la prueba estadística indica fusión de pesos. Ya lo cubrimos antes en según explicamos sobre ChatGPT.

¿Cómo se detectó que Rio-3.5 es una fusión?

Con dos métodos cruzados: análisis de identidad del modelo y análisis estadístico de los tensores de peso en 60 capas de la red. El patrón de fusión apareció en todos los componentes, lo que descarta la casualidad.

¿Nex-N2-Pro es mejor que Qwen3.5?

En SWE-Bench Verified, Nex-N2-Pro marca 80,8% contra 76,4% de Qwen3.5-397B. Es esperable, porque Nex-N2-Pro está post-entrenado sobre Qwen3.5, así que parte de esa base y le agrega una capa enfocada en código y razonamiento agéntico.

¿Qué implica un merge no documentado en open source?

Implica un quiebre de confianza. La técnica suele ser legal bajo licencias como Apache 2.0, pero presentarla como entrenamiento propio rompe la atribución que el open source espera. El rendimiento puede ser real y la credibilidad caerse igual.

Conclusión

El caso Rio-3.5 no es un escándalo técnico, es uno de transparencia. El modelo funciona, los benchmarks se sostienen y la técnica del merge es legítima. Lo que se cayó es la historia que lo envolvía.

¿Qué hacer con esto? Si trabajás con modelos open source, sumá un paso a tu checklist: verificar procedencia antes de adoptar. Mirá el model card, corré tu propio análisis si podés, y desconfiá de las etiquetas de origen que nadie auditó. La comunidad tiene las herramientas para destapar un merge en horas, como quedó claro acá. La pregunta ya no es si te van a chequear, sino cuándo.

Rio-3.5 no es brasileno: es un merge de Nex-N2-Pro y Qwen3.5