
La necesidad de comprender qué ocurre en nuestro planeta con precisión y en tiempo real es cada vez más urgente. Desde la predicción de catástrofes naturales hasta la gestión de cultivos o la planificación urbana, múltiples sectores dependen de datos precisos sobre el comportamiento de la Tierra. En este contexto, la inteligencia artificial está transformando la forma en que accedemos, analizamos e interpretamos estos datos. IBM Research, junto con NASA, la Agencia Espacial Europea (ESA) y otros socios, lidera esta revolución científica.
Fundamentos adaptados a los datos espaciales
A diferencia de los problemas tradicionales de visión por computador, la observación terrestre (EO, por sus siglas en inglés) requiere una comprensión mucho más compleja de los datos. No basta con analizar imágenes RGB comunes. Se necesitan representaciones multispectrales, información temporal y datos provenientes de distintas fuentes como satélites ópticos, sensores de radar (SAR) y registros climáticos. IBM ha apostado por modelos fundacionales específicos para EO, que permiten generar abstracciones más precisas del mundo físico.
Prithvi-EO, creado en 2023 junto con NASA, fue el primer modelo en utilizar transformadores de visión a gran escala para datos EO multitemporales. Su evolución, Prithvi-EO-2.0, incorporó mejoras en el manejo de metadatos y en el análisis temporal, con resultados notables en tareas como detección de inundaciones o vigilancia medioambiental.
TerraMind y el aprendizaje multimodal
En colaboración con la ESA y el centro de supercomputación Jülich, IBM presentó en 2025 TerraMind, un modelo que introdujo un enfoque novedoso: el «pensamiento en modalidades». Esta capacidad permite al modelo comprender y generar información sin necesidad de tokenización, lo que mejora su eficiencia y flexibilidad. Además, incluye un algoritmo de autoajuste que se entrena con datos generados por el propio modelo, permitiéndole mejorar continuamente.
TerraMind ha demostrado ser altamente competitivo, dominando los benchmarks GEO-Bench-2 y PANGAEA en tareas específicas de EO. Incluso ha sido optimizado para funcionar en dispositivos de recursos limitados, como satélites pequeños o teléfonos móviles, lo que amplía su aplicabilidad.
Nuevas fronteras: del clima al Sol
IBM también ha trabajado en otros modelos fundacionales que amplían los límites tradicionales de la observación terrestre. Prithvi-WxC se centra en datos meteorológicos y climáticos, permitiendo predicciones regionales y globales incluso sin información previa inmediata. Surya, por su parte, fue desarrollado con NASA y otros ocho centros de investigación para estudiar la actividad solar. Este modelo analiza cómo las erupciones solares pueden afectar a infraestructuras críticas como redes eléctricas o sistemas de navegación.
Estos modelos se complementan con conjuntos de datos abiertos, como SuryaBench, y están alineados con una filosofía de ciencia abierta que contrasta con enfoques más cerrados como el de Google Earth AI.
Eficiencia y accesibilidad: el reto de la compresión
Uno de los desafíos más importantes en EO es el volumen masivo de datos. Para abordarlo, IBM ha desarrollado TerraCodec, un sistema de compresión neural que mejora en hasta 10 veces la eficiencia respecto a códecs tradicionales como JPEG 2000. Esto permite almacenar y transmitir información satelital con menor coste y sin perder calidad.
Al mismo tiempo, las versiones «pequeñas» y «mini» de Prithvi y TerraMind mantienen un rendimiento similar a sus equivalentes grandes, pero con una huella computacional reducida. Esto las hace ideales para tareas en entornos donde los recursos son limitados, como misiones espaciales o despliegues en zonas remotas.
Ciencia colaborativa y validación rigurosa
Uno de los pilares de estos desarrollos ha sido la colaboración con científicos especializados. Todos los modelos han sido co-creados y validados junto a expertos de NASA, ESA y otros centros, lo que garantiza que estén alineados con las necesidades reales del campo. Esto evita el error de aplicar modelos de visión por computador genéricos a problemas que requieren una comprensión más fina del contexto geoespacial.
Un estudio con los modelos Prithvi y TerraMind demostró que, al utilizar solo imágenes RGB, el rendimiento puede disminuir hasta un 25% en tareas como detección de cultivos o de zonas quemadas. Este resultado subraya la importancia de incorporar datos multispectrales para obtener predicciones más fiables.
Infraestructura abierta y herramientas de desarrollo
IBM ha acompañado estos modelos con herramientas que facilitan su adopción y personalización. TerraTorch, por ejemplo, permite ajustar y desplegar modelos fundacionales de forma sencilla. Esta biblioteca, de uso abierto, se ha convertido en un estándar dentro de la comunidad EO.
Además, IBM ha ampliado vLLM, una plataforma de inferencia de alto rendimiento, para que acepte entradas y salidas no textuales. Esto facilita flujos de trabajo completamente multimodales, algo esencial para integrar distintos tipos de datos EO.
Casos de uso concretos
La utilidad práctica de estos modelos ya es evidente. En el Reino Unido e Irlanda, Prithvi-EO fue adaptado para mejorar la detección de inundaciones. En África, se ha utilizado en esfuerzos de reforestación en Kenia y en el estudio de islas de calor en Sudáfrica. También se ha adaptado a los ecosistemas marinos en colaboración con el laboratorio marino de Plymouth y universidades británicas, dando origen al modelo Granite, especializado en la salud de los océanos.
TerraMind ha sido usado en competiciones como el Blue-Sky Challenge, donde ha mostrado su versatilidad en tareas como detección de barcos, predicción de inundaciones o degradación ecológica.
Transparencia y comunidad
Todo este trabajo se sostiene en una apuesta firme por el software abierto. Modelos, códigos y datos están disponibles bajo licencias como Apache 2.0, permitiendo que otros investigadores los usen, mejoren o adapten según sus necesidades. Frente a alternativas cerradas, esta filosofía potencia la colaboración y acelera el progreso científico.
Con la ayuda de benchmarks comunitarios como GEO-Bench-2 y NeuCo-bench, se están estableciendo nuevos estándares para evaluar la capacidad real de los modelos en tareas del mundo real. La participación activa en conferencias, talleres y tutoriales también ha sido clave para consolidar esta comunidad global de usuarios y desarrolladores.¡
☞ El artículo completo original de Natalia Polo lo puedes ver aquí
