¿Son los chatbots de IA políticamente neutrales? La respuesta corta es que no. El Washington Post publicó el 24 de junio de 2026 los resultados de un experimento controlado en el que probaron los principales modelos de lenguaje con preguntas políticas diseñadas por investigadores especializados. Los resultados son incómodos para prácticamente todos: para OpenAI, cuyo ChatGPT respondió casi exclusivamente con argumentos de izquierda; para Elon Musk, cuyo Grok resultó ser más de izquierda de lo que su propietario prometía; y para la Administración Trump, que exigió neutralidad por decreto ejecutivo y obtuvo un panorama más complejo de lo que esperaba.
El único que salió relativamente bien parado del test fue Google’s Gemini, el único modelo que ofreció «ambos lados» de forma consistente, incluso en preguntas tan extremas como si Estados Unidos debería conquistar territorios por recursos militarmente. Ningún otro modelo ofreció un argumento a favor de esa posición. Gemini sí.
Cómo se diseñó el test
El Washington Post utilizó preguntas políticas calibradas por investigadores para medir el sesgo de forma sistemática, no anecdótica. Las preguntas cubrían temas como la acción afirmativa, la expansión territorial por la fuerza, políticas de inmigración y posiciones económicas. A cada chatbot se le preguntó lo mismo, en condiciones equivalentes, y se analizaron las respuestas para identificar qué espectro político representaban.
Los resultados muestran un panorama claro. El modelo que impulsa ChatGPT —GPT-4o de OpenAI— respondió «casi exclusivamente con argumentos de izquierda» y presentó posiciones de derecha solo en una ocasión. Gemini, de Google, fue el único que dio argumentos de «ambos lados» de forma consistente. Grok, de Elon Musk, se describía como un chatbot «anti-woke» y «buscador de la verdad», pero en las pruebas del Post ofreció más posiciones de izquierda que de derecha con frecuencia. Arya, el chatbot de Gab diseñado explícitamente con «valores cristianos y principios conservadores», dio respuestas de izquierda 12 veces más frecuentemente que de derecha en las preguntas probadas.
Nada de esto sorprende a quienes llevamos tiempo siguiendo cómo los chatbots con intención política pueden modificar la percepción de los votantes sin que estos lo noten. Lo que sí resulta significativo es la escala del experimento y la credibilidad del medio que lo publica.
Por qué los modelos tienen sesgos y por qué es tan difícil eliminarlos
Los sesgos en los modelos de lenguaje no son necesariamente intencionales. Son el resultado de tres factores que se retroalimentan: los datos de entrenamiento (internet es predominantemente en inglés y tiende hacia ciertos discursos), el ajuste fino mediante feedback humano (RLHF), y las decisiones de los equipos de seguridad sobre qué respuestas son «aceptables». Si los moderadores humanos que califican las respuestas tienen cierta orientación política, esa orientación se incrusta en el modelo.
El problema de fondo es que «neutro» no existe como categoría objetiva. Cuando ChatGPT decide no pronunciarse sobre si «la acción afirmativa en la contratación universitaria debería continuar» y en su lugar ofrece solo argumentos a favor, eso ya es una posición. Y cuando Grok, diseñado para ser provocador, termina siendo más progresista que conservador en los tests, eso dice algo sobre la dificultad de alinear deliberadamente un modelo con una ideología específica.
Llevo cubriendo el sector de la IA desde los primeros modelos de lenguaje, y una de las constantes que he observado es que los chatbots tienden a reproducir el sesgo de los datos web más que el sesgo de sus creadores. Internet, en términos de texto accesible, tiene una orientación progresista observable en inglés. Eso no es una conspiración: es una distribución estadística de quién escribe, qué escribe y cuánto se enlaza.
Lo que sí resulta llamativo del experimento es la posición de Gemini. Google ha invertido considerablemente en técnicas de «constitutional AI» y en sistemas de evaluación de sesgo que, según estos resultados, están produciendo un modelo funcionalmente más neutral que sus competidores. Aunque el portavoz de Google dijo al Post que Gemini «está diseñado para proporcionar respuestas equilibradas que no favorecen ninguna ideología política» y que no pudieron reproducir las respuestas de un solo lado en sus pruebas internas, los resultados externos los respaldan más de lo habitual.
El contexto político: un decreto ejecutivo y la paradoja de Grok
La publicación llega en un momento de alta carga política. Trump firmó un decreto ejecutivo que exige que los chatbots de IA sean «herramientas neutrales y no partidistas». La paradoja es que el experimento que pusieron a Claude, ChatGPT y Gemini a dirigir emisoras de radio mostró comportamientos similares: los modelos tienen personalidades emergentes que no siempre coinciden con las intenciones declaradas de sus creadores.
Grok es el ejemplo más ilustrativo. Musk lo diseñó para ser la alternativa «sin censura» y de derecha al resto de chatbots. En el test del Post, Grok dio más respuestas de derecha que cualquier otro modelo, pero también respondió con argumentos de izquierda en la mayoría de los casos. El resultado neto es un chatbot que es el más conservador del grupo pero que, de ninguna manera, representa una alternativa ideológicamente consistente a ChatGPT.
DeepSeek, el modelo chino que no aparece en los resultados más destacados del Post, tiene su propio sesgo documentado: cuando se formulan preguntas en chino simplificado, cerca del 6,8% de sus respuestas contienen narrativa pro-gobierno chino, frente al 4,8% en ChatGPT para los mismos tipos de preguntas.
El marco en el que opera toda esta discusión no es el de la malicia corporativa, sino el de los chatbots como herramientas que no son neutrales por diseño ni por entrenamiento, y la presidenta de Signal lleva meses articulando exactamente esa tesis.
Mi valoración
Lo que más me convence del experimento del Post es su metodología: no se basa en ejemplos anecdóticos virales, sino en preguntas calibradas y evaluación sistemática. Eso es lo mínimo exigible para una afirmación del calibre «ChatGPT tiene sesgo de izquierda».
Lo que más me preocupa es la inutilidad del decreto ejecutivo de Trump. Ordenar por decreto que los chatbots sean «neutrales» no tiene ningún mecanismo de cumplimiento técnico. La neutralidad en modelos de lenguaje no es un botón: es el resultado de decisiones de diseño, datos de entrenamiento y ajuste fino que se toman durante meses. Un decreto no cambia eso.
Lo más estructuralmente significativo es la posición de Gemini. Google, que lleva años siendo acusada de sesgo liberal en sus resultados de búsqueda, tiene ahora el chatbot más equilibrado del mercado en este test. Eso puede ser una coincidencia de los datos, pero también puede ser el resultado de una inversión deliberada y exitosa en técnicas de alineación.
Mi predicción: en los próximos 12 meses veremos más experimentos como el del Post, y la presión regulatoria sobre los modelos de lenguaje para demostrar neutralidad política irá en aumento. OpenAI deberá responder públicamente a estos resultados.
Preguntas frecuentes
¿Por qué los chatbots de IA tienen sesgos políticos si sus creadores dicen que no?
Los sesgos emergen de los datos de entrenamiento y del proceso de ajuste fino mediante evaluadores humanos. Si el corpus de texto predominante tiene cierta orientación y si los equipos de evaluación tienen preferencias culturales específicas, esas orientaciones se filtran al modelo. No es necesariamente una decisión deliberada: es una consecuencia del proceso de entrenamiento que es difícil de eliminar sin introducir nuevos sesgos.
¿Qué diferencia técnica tiene Gemini para ser más neutral?
Google no ha revelado los detalles específicos de por qué Gemini resulta más equilibrado. Lo que sí se sabe es que la compañía ha invertido en técnicas de evaluación de sesgo y en lo que llaman «constitutional AI» para sus modelos. Los resultados del Post sugieren que esas inversiones están produciendo un efecto mensurable, aunque la empresa no pudo reproducir en sus propias pruebas las respuestas de un solo lado que observó el Post en los otros modelos.
¿Importa el sesgo político de los chatbots si solo los uso para trabajo?
Sí, aunque de forma indirecta. Si usas un chatbot para redactar comunicados, analizar noticias o resumir debates, el sesgo del modelo puede filtrar qué argumentos incluye y cuáles omite. En contextos laborales donde el contenido político o ético es relevante, conviene ser consciente de que la «neutralidad» del asistente es una promesa de marketing, no una característica técnica garantizada.
☞ El artículo completo original de Natalia Polo lo puedes ver aquí




