En un mundo ideal, los artículos científicos deberían ser sometidos a la más cuidadosa revisión, así como, por descontado, ser la última fase de una rigurosa labor de investigación. Pero seguro que has notado que no vivimos en un mundo ideal.
Y en un mundo en el que la producción científica se mide a peso, y la IA es (mal) usada para algo más que para analizar datos, de vez en cuando el mundo de las publicaciones científicas se ve sometido a polémicas de lo más curiosas.
En este caso, la polémica gira en torno a un término como "vegetative electron microscopy" (que podemos traducir como 'microscopía electrónica vegetativa', aunque carece de cualquier sentido técnico reconocible)
Y es que dicho término ha aparecido, en los últimos tiempos, en al menos 22 artículos académicos, algunos de ellos publicados por editoriales prestigiosas como Elsevier, Springer Nature y MDPI.
Lejos de ser una simple anécdota, esta frase se ha convertido en un caso paradigmático de cómo la combinación de errores de traducción, de problemas de digitalización y del uso imprudente de la inteligencia artificial pueden terminar dejando en evidencia un cada vez más contaminado corpus científico.
Orígenes del absurdo: entre escáneres torpes y teclados persas
El término "microscopía electrónica vegetativa" cuenta con dos posibles orígenes, ambos peculiares (y no excluyentes):
- El error de digitalización: En un artículo de 1959, las palabras "vegetative" (vegetativa) y "electron microscopy" (microscopía electrónica) aparecían en columnas separadas. Un software de OCR (reconocimiento óptico de caracteres) habría unido erróneamente ambas, creando la nueva frase.

- El desliz del teclado persa: En farsi, "escaneo" se escribe "روبشی" y "vegetativo" es "رويشی", palabras que se diferencian únicamente por un punto. Esto habría llevado a errores de traducción al pasar del persa al inglés en agencias de edición científica que trabajan con investigadores iraníes.
Contaminación de modelos de inteligencia artificial
En cualquier caso, uno de los aspectos más inquietantes de esta historia es la incorporación del término en modelos de lenguaje como GPT-3, GPT-4o o Claude 3.5. Al estar entrenados con vastas cantidades de texto extraído de Internet —incluyendo tanto las digitalizaciones erróneas del paper antiguo como los nuevos artículos contaminados—, los modelos han aprendido a completar frases con esta expresión absurda como si fuera válida.
Este fenómeno se describe como un fósil digital, un error que se perpetúa en las bases de datos y sistemas de IA, como una huella del pasado que ya no puede eliminarse fácilmente: la dificultad para depurar estos modelos se ve agravada por la falta de transparencia sobre sus datos de entrenamiento y el volumen gigantesco de información que manejan.
El ecosistema cómplice: editores que miran hacia otro lado
Lo más escandaloso del caso no es solo la presencia del término, sino su validación por parte de algunos editores y revisores. Por ejemplo, un artículo publicado en 'Industrial Crops and Products', cuya autoría incluye a un editor de Elsevier, defendió el uso de la frase con el peregrino argumento de que en realidad se refería a "microscopía electrónica de estructuras vegetativas". Un razonamiento endeble y que varios expertos consideran insostenible.
Otros artículos fueron corregidos —cambiando la frase absurda por "scanning electron microscopy"— o incluso retirados tras detectarse plagio, autocitas masivas y procesos de revisión sospechosos. Sin embargo, muchas de estas publicaciones siguen intactas, lo que evidencia una falta alarmante de control de calidad en editoriales que, paradójicamente, cobran altas tarifas por "servicios editoriales".
Las fábricas de papers: publicaciones a granel sin ciencia
Este fenómeno encaja en un patrón más amplio: el de las llamadas 'paper mills', empresas o redes organizadas que fabrican artículos científicos en masa (normalmente sin base experimental ni revisión real) para académicos que necesitan publicar para avanzar en sus carreras.
Estas organizaciones utilizan contenido generado por IA, plagios y todo tipo de estrategias para evadir detectores automáticos, como el uso de lo que los anglosajones denominan 'frases torturadas' (para que te hagas a la idea: usar "capacidad cognitiva no-orgánica" para no repetir "inteligencia artificial"). Hay herramientas, sin embargo, que usan estas expresiones como marcadores para identificar artículos sospechosos.
Cuando estas prácticas se combinan con traducciones deficientes y herramientas de IA no supervisadas, el resultado es un cóctel tóxico que contamina la literatura científica mundial. Esto plantea una pregunta urgente: ¿Cuántas otras frases sin sentido están ya incorporadas a las actuales redes de 'conocimiento'?
Vía | The Conversation
Imagen | Marcos Merino mediante IA
-
La noticia De pronto, a docenas de científicos les ha dado por usar una expresión que no significa nada en sus artículos. La culpa es de la IA fue publicada originalmente en Genbeta por Marcos Merino .
☞ El artículo completo original de Marcos Merino lo puedes ver aquí
No hay comentarios.:
Publicar un comentario