Sesgo político en LLMs: dónde se ubica cada modelo de IA

En pocas palabras: Según la medición de Trakkr, 4 de 6 grandes LLMs (entre ellos Claude, GPT y Gemini) se ubican a la izquierda del centro económico, pese a declararse neutrales. El sesgo no es uniforme: cada modelo deja una “nube” de respuestas en dos ejes, económico y social.

Le preguntás lo mismo a Claude, a GPT y a Gemini, y los tres te contestan que son neutrales. Después aparece Trakkr y mide qué votarían en realidad: 4 de 6 modelos analizados se inclinan a la izquierda del centro económico. Ese es el corazón del debate sobre sesgo político en LLMs, y los números no acompañan al discurso de neutralidad.

El sesgo político en LLMs es la tendencia sistemática de un modelo de lenguaje a favorecer posturas de un lado del espectro ideológico cuando responde sobre temas económicos o sociales. No es una opinión casual del modelo: es un patrón medible que se repite a lo largo de muchas respuestas y que viene de los datos de entrenamiento y de las decisiones de alineación de cada empresa.

En 30 segundos

  • 4 de 6 modelos analizados por Trakkr se ubican a la izquierda del centro económico.
  • Dos ejes: económico (izquierda a derecha) y social (libertario a autoritario). Cada modelo deja una “nube” de respuestas, no un punto fijo.
  • La neutralidad declarada miente: hay modelos que se dicen neutrales pero miden 0,36 más a la derecha o 0,34 más a la izquierda de lo que afirman.
  • Los temas que más despegan el sesgo: drogas, impuesto al patrimonio, cuotas de diversidad, transición energética y discurso de odio.
  • Hay un test propio: respondés el mismo cuestionario y la herramienta te dice qué modelo piensa parecido a vos.

¿Qué es el sesgo político en los modelos de IA?

Ponele que armás un chatbot de soporte y un usuario le pregunta si conviene subir el impuesto a las herencias. El modelo no debería tener una postura. Y sin embargo la tiene.

Acá hay que separar cosas. No todos los sesgos de un LLM son iguales. Está el sesgo estadístico (el modelo refleja lo que abunda en su corpus de entrenamiento), está el sesgo de alineación (las empresas afinan el modelo para que no diga barbaridades, y en ese proceso cargan valores) y está el sesgo político propiamente dicho, que es el que mide Trakkr. Este último importa porque se filtra en cualquier producto que use IA: un asistente que redacta, un sistema que resume noticias, un bot que recomienda. Si el modelo arrastra una inclinación, tu producto la hereda sin que vos lo decidas.

¿Cómo se mide objetivamente el sesgo político en LLMs?

Trakkr usa un test estandarizado: le hace las mismas preguntas a cada modelo y ubica las respuestas en un mapa de dos ejes. El eje horizontal es el económico, de izquierda a derecha. El vertical es el social, de libertario (abajo) a autoritario (arriba). Más contexto en las políticas de seguridad de Microsoft.

Lo interesante es que no marca un solo punto por modelo. Marca una nube. Cada ejecución del mismo cuestionario da un resultado un poco distinto, así que lo que ves es la dispersión: cuanto más concentrada y cerca del centro está la nube, más neutral lee el modelo. Cuanto más se corre hacia un costado, más definida es la postura.

Para que el mapa no quede flotando en el aire, Trakkr pone referencias del mundo real: el Partido Republicano de Estados Unidos en el sector derecha-autoritario, Anthony Albanese y el Partido Laborista australiano, el Partido Laborista de Nueva Zelanda y Die Grünen (los Verdes alemanes) del lado progresista. Así podés leer “este modelo responde parecido a un laborista neozelandés” en vez de un número abstracto.

¿Hacia qué lado se inclinan los principales LLMs?

El dato grueso ya lo sabés: 4 de 6 modelos caen a la izquierda del centro en lo económico. Es mayoría, pero no unanimidad, y conviene tomarlo con pinzas porque la posición exacta de cada logo en el mapa la tenés que mirar vos en la herramienta interactiva (Trakkr muestra el logo de cada modelo en su lugar, no publica una tabla cerrada de coordenadas).

¿Por qué la mayoría tira para ese lado? La hipótesis más razonable es la composición del corpus: gran parte del texto de calidad disponible en internet (medios, academia, documentación técnica) tiene cierto sesgo, y encima la fase de alineación que hacen las empresas suele empujar hacia respuestas “inclusivas” por diseño. No es militancia explícita. Es el resultado de cómo se construyen estos modelos. Te puede servir nuestra cobertura de cómo ChatGPT maneja los temas sensibles.

Eso sí: que un modelo sea de izquierda en lo económico no dice nada sobre el otro eje. Un LLM puede ser progresista en impuestos y al mismo tiempo autoritario en cosas como el control de la desinformación o el ID digital nacional. Por eso el mapa tiene dos dimensiones y no una sola línea.

¿En qué temas específicos se ve más el sesgo político?

El test de Trakkr no pregunta en abstracto. Pone temas concretos y mide cuánto se corre el modelo del centro, y qué tan fuerte sostiene la postura (las barras crecen desde el centro: verde hacia la derecha, rojo hacia la izquierda, más largas cuanto más marcada es la posición).

Tema del cuestionarioEje que tocaPostura “de izquierda”
Legalizar drogas recreativasSocial (libertario)A favor
Cuidados de género para menoresSocialA favor
Multiculturalismo sobre asimilaciónSocialA favor
Salida rápida de combustibles fósilesEconómicoA favor
Cuotas de diversidad en directoriosEconómico / socialA favor
Impuesto a grandes herenciasEconómicoA favor
Impuesto al patrimonio sobre USD 50MEconómicoA favor
Eliminar la desinformaciónSocial (autoritario)A favor del control
Criminalizar el discurso de odioSocial (autoritario)A favor
ID digital nacionalSocial (autoritario)Variable
sesgo político llms diagrama explicativo

Fijate algo: los últimos tres temas (desinformación, discurso de odio, ID digital) son del eje autoritario. Un modelo puede ser progre en impuestos y de mano dura en control de discurso al mismo tiempo. Esa mezcla es lo que hace que la “neutralidad” sea más complicada de lo que parece.

¿La neutralidad que declara un LLM es confiable?

No. Y este es el hallazgo más jugoso del análisis.

Trakkr compara dos cosas por modelo: lo que el modelo dice de sí mismo (“soy neutral, no tomo partido”) contra lo que muestra cuando lo medís. La brecha es real y la cuantifican. En algunos casos un modelo se declara neutral pero “mide 0,36 más a la derecha de lo que dice”. En otro, la diferencia es de 0,34 hacia la izquierda. Y hay frases textuales del estudio que lo resumen sin vueltas: “dice neutral, pero mide a la izquierda”. Para más detalles técnicos, mirá en nuestro análisis de modelos de lenguaje.

¿Qué significa esto en la práctica? Que la autodeclaración de un modelo no sirve como garantía. Si estás eligiendo un LLM para un producto donde la objetividad importa (un asistente periodístico, una herramienta de análisis de políticas públicas, un sistema educativo), la promesa de “somos neutrales” del proveedor no alcanza. Necesitás medición independiente, como la que hace una herramienta externa.

Qué está confirmado y qué no

  • Confirmado: Trakkr publicó el análisis con 6 modelos, metodología de dos ejes y referencias políticas reales.
  • Confirmado: 4 de 6 modelos se inclinan a la izquierda en el eje económico, y existe una brecha medible entre neutralidad declarada y medida (0,36 y 0,34 en casos puntuales).
  • Pendiente: la posición exacta de cada modelo nombrado (Trakkr la muestra visualmente, no en una tabla pública de coordenadas).
  • Pendiente: si la metodología tuvo revisión externa independiente y qué tan estable es en el tiempo. Habría que ver si se sostiene con nuevas versiones de los modelos.

¿Por qué el sesgo político en IA importa para Argentina?

Acá no estamos hablando de teoría gringa. Si tu equipo usa un LLM para responder consultas de clientes, redactar contenido o analizar datos sensibles, el sesgo viaja con el modelo.

Pensá en casos locales: un estudio contable que usa IA para explicarle a un cliente las implicancias de un impuesto al patrimonio, un medio que resume debates legislativos con un asistente, una pyme que automatiza respuestas sobre temas laborales. En todos esos escenarios, si el modelo arrastra una inclinación, la respuesta sale teñida sin que nadie lo haya pedido. Y el usuario final ni se entera.

La movida defensiva es conocerlo y mitigarlo. Si vas a desplegar un chatbot sobre tu propia infraestructura (un VPS de donweb.com, por ejemplo) tenés control sobre el prompt de sistema, así que podés instruir explícitamente al modelo para que presente las dos posturas en temas controvertidos en vez de dejarlo en piloto automático. No elimina el sesgo, pero lo acota. La transparencia con el usuario (avisar que detrás hay un LLM con sus limitaciones) es lo mínimo.

¿Cómo descubrir tu propia posición con la herramienta de Trakkr?

La parte más copada del sitio es interactiva y gratis. Entrás a trakkr.ai/bias, respondés el mismo cuestionario que respondieron los modelos y la herramienta te ubica en el mapa de dos ejes.

Después te dice qué modelo de IA piensa más parecido a vos. Es un ejercicio interesante por dos motivos. Primero, te muestra de forma visual qué tan lejos del centro estás. Segundo, te hace caer la ficha de que, si elegís un modelo “porque responde bien”, capaz lo que pasa es que responde alineado con lo que vos ya pensabas. Eso no es calidad. Es sesgo de confirmación. Esto se conecta con lo que analizamos en el enfoque de Google sobre estos temas.

Errores comunes al interpretar el sesgo de un LLM

  • Creer que “sesgado a la izquierda” significa inútil: un sesgo medido no invalida al modelo para programar, traducir o resumir. Importa sobre todo en temas políticos y sociales, no en una query SQL.
  • Confundir el eje económico con el social: son dos cosas distintas. Un modelo progre en impuestos puede ser autoritario en control de discurso. Mirá los dos ejes antes de etiquetar.
  • Tomar la nube como un punto fijo: cada ejecución da un resultado distinto. Si probás una sola vez, capaz te toca un extremo de la nube y sacás una conclusión equivocada.
  • Confiar en la autodeclaración del proveedor: el dato de la brecha (0,36 a la derecha de lo que dice) demuestra que “somos neutrales” no es verificable sin medición externa.

Preguntas Frecuentes

¿Qué tan sesgados políticamente están los LLMs actuales?

Según Trakkr, 4 de 6 modelos analizados se inclinan a la izquierda del centro económico. El nivel de sesgo varía por modelo y por tema, y se mide en dos ejes: económico (izquierda-derecha) y social (libertario-autoritario).

¿Claude, GPT y Gemini se inclinan a izquierda o derecha?

La mayoría de los modelos del estudio caen a la izquierda en lo económico, pero Trakkr muestra la posición de cada logo de forma visual en su mapa interactivo y no publica una tabla cerrada de coordenadas. Para ver dónde cae cada uno con exactitud, hay que mirar la herramienta en trakkr.ai/bias.

¿Cómo se analiza el sesgo político en inteligencia artificial?

Se le hacen las mismas preguntas estandarizadas a cada modelo y se ubican las respuestas en un mapa de dos ejes. Cada modelo se ejecuta muchas veces, así que el resultado es una “nube” de dispersión, no un punto único. Cuanto más cerca del centro, más neutral lee.

¿Qué temas muestran mayor sesgo político en los modelos de IA?

Los temas que más corren a los modelos del centro son drogas recreativas, cuidados de género para menores, impuesto al patrimonio, salida rápida de combustibles fósiles, cuotas de diversidad y criminalización del discurso de odio. Cada uno toca el eje económico o el social.

¿Puede un LLM ser realmente neutral en política?

Por ahora, ninguno lo es del todo. Trakkr detectó que varios modelos se declaran neutrales pero miden con sesgo: en casos puntuales, 0,36 más a la derecha o 0,34 más a la izquierda de lo que afirman. La neutralidad declarada no equivale a neutralidad medida.

Conclusión

El aporte de Trakkr no es decir “los modelos son de izquierda” y listo. Es mostrar, con un método repetible, que existe una brecha entre lo que un LLM dice de sí mismo y lo que hace cuando lo medís. Esa brecha es el dato accionable.

Si trabajás con IA, la conclusión práctica es simple: no compres la promesa de neutralidad sin verificarla, mirá los dos ejes antes de etiquetar un modelo, y si vas a usarlo en temas sensibles, instruí el prompt de sistema para forzar el contraste de posturas. Y antes de cerrar la nota, hacé el test vos mismo. Capaz descubrís que tu modelo favorito no es el más neutral. Es el que más se te parece.

Fuentes

Desplazarse hacia arriba